MN10
Szybka transformacja Fouriera (FFT)
<<< Powrót do strony głównej przedmiotu Metody numeryczne
Algorytm FFT (Fast Fourier Transform) dla dyskretnej transformacji Fouriera (DFT, Discrete Fourier Transform) i jego krewniacy dla wyznaczania dyskretnej transformacji cosinusów (DCT, Discrete Cosine Transform i MDCT, Modified Discrete Cosine Transform), choć dotyczą pozornie dość abstrakcyjnych zadań, zrewolucjonizowały wiele dziedzin życia. Między innymi wykorzystuje się je w
- kompresji obrazów w formacie JPEG (DCT)
- kompresji dźwięku w formacie MP3 i pokrewnych (MDCT)
- rozwiązywaniu ważnych równań różniczkowych cząstkowych (DFT)
a także do
- filtrowania szumów (DFT)
- szybkiego mnożenia wielomianów (DFT)
W niniejszym wykładzie ograniczymy się do przedstawienia szybkiego algorytmu rozwiązywania zadania DFT. Algorytmy rozwiązywania zadań pokrewnych (DCT, MDCT, itp.) opierają się na podobnych zasadach.
Zacznijmy od postawienia zadania obliczeniowego DFT. Jest ono (pozornie!) banalne i jednocześnie wydumane:
Dla danego zestawu liczb , , wyznaczyć wartości
dla , przy czym . Jak pamiętamy, jednostka urojona spełnia . Taką operację nazywamy dyskretną transformacją Fouriera, DFT.
Ponieważ dane są wektorem , wynik też jest wektorem, a zadanie jest liniowe, możemy wszystko zapisać macierzowo:
gdzie
Tak więc, gdyby naiwnie podejść do zadania, moglibyśmy je rozwiązać brutalnie, tworząc na początek macierz , a następnie wyznaczając iloczyn macierzy przez wektor, co łatwo zrobić kosztem operacji. Dlatego istotne jest, że algorytm FFT, który za chwilę omówimy, będzie działać kosztem , czyli praktycznie liniowym (w obu przypadkach stałe proporcjonalności są niewielkie) w dodatku będzie miał znacznie mniejsze wymagania pamięciowe.
Algorytm FFT
Aby móc taniej mnożyć przez , musimy odkryć kilka bardzo szczególnych własności tej macierzy.
Fakt
Macierz jest symetryczna oraz .
Dowód
Dowód pozostawiamy jako ćwiczenie.

Zauważmy, że nasza macierz ma jeszcze więcej specjalnej struktury, powtarza się w niej bardzo wiele takich samych współczynników (sprawdź dla , w ogólności ma tylko różnych wyrazów), gdyż (dla , to nic innego jak kolejne zespolone pierwiastki z jedynki).
W wyprowadzeniu algorytmu szybkiej transformacji Fouriera (Fast Fourier Transform, FFT) oprzemy się po raz kolejny na regule "dziel i rządź". Dla uproszczenia analizy przyjmiemy, że jest naturalną potęgą dwójki, w szczególności dla pewnego naturalnego .
Rzeczywiście, rozbijając naszą sumę na sumę po indeksach parzystych i sumę po indeksach nieparzystych, mamy
Suma po indeksach parzystych da się zapisać w postaci
i analogicznie suma po indeksach nieparzystych da się zapisać
gdyż , a więc wygląda na to, że nasze zadanie wyznaczenia dyskretnej transformacji Fouriera wymiaru da się sprowadzić do analogicznych zadań mniejszego rozmiaru.
Rzeczywiście, korzystając z tego, że , gdzie , oraz lub , mamy .
Oznaczając
(jak widać są to DFT dla dwa razy krótszych wektorów, złożonych z tylko parzystych lub tylko nieparzystych współrzędnych Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle f} ), dostajemy ostatecznie
Tym samym, wyznaczenie DFT wymiaru Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle N} udało się rzeczywiście sprowadzić do wyznaczenia dwóch DFT wymiaru Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle m = N/2} oraz drobnej manipulacji na ich wynikach zgodnie z powyższym wzorem. Oczywiście, te mniejsze transformacje można wyznaczyć takim samym sposobem, co prowadzi do zależności rekurencyjnej, która kończy się na wektorach długości 1, na których DFT to po prostu identyczność.
Proste sprawdzenie pokazuje, że koszt takiego algorytmu jest rzędu Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle O(N\log\,N)} , a nie Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle O(N^2)} , jak dla naiwnego algorytmu mnożenia wektora przez gęstą macierz. Zysk jest więc, nawet dla niewielkich Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle N} , istotny.
Algorytm Prosta wersja algorytmu FFT
function y = fft(x)
N = length(f);
if N == 1
y = f;
else
<math>\displaystyle \omega</math> = <math>\displaystyle \exp(-\frac{2\Pi}{N}i)</math>;
<math>\displaystyle \omega_k</math> = <math>\displaystyle \omega^{N/2-1}</math>;
u = fft( f[0:2:N-2] );
v = fft( f[1:2:N-1] );
v = v * <math>\displaystyle \omega_k</math>;
y = [ u+v ; u-v ];
end
end
Jak już zdążyliśmy się przyzwyczaić, gdy tylko to możliwe, w algorytmach numerycznych unikamy stosowania jawnej rekurencji. W przypadku FFT można jej również uniknąć, wyznaczając zawczasu --- korzystając z tzw. odwrócenia bitów --- porządek, w którym należy składać 1-wymiarowe DFT w coraz dłuższe wektory zgodnie ze wzorem powyżej tak, by na końcu dostać pożądany wektor Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle c = F_Nf} .
Ponadto, istnieją warianty algorytmu FFT, które np. działają na danych rzeczywistych. Na analogicznych zasadach co FFT oparte są również algorytmy wykonujące tzw. dyskretną transformację cosinusów (DCT) i jej wariant MDCT stosowany w kodekach audio takich jak MP3, AAC, czy OggVorbis.
Interpolacja trygonometryczna
Jednym z wielu zadań, w których daje się zastosować algorytm FFT, jest zadanie interpolacji trygonometrycznej:
Dla danych węzłów Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle x_k = \frac{2\pi k }{N}} , Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \displaystyle k = 0,\ldots,N-1} , znaleźć wielomian (zmiennej rzeczywistej, o wartościach zespolonych) stopnia postaci
gdzie (stąd nazwa: trygonometryczny) taki, że
dla zadanych wartości .
W języku macierzy DFT możemy zapisać zadanie interpolacji trygonometrycznej jako zadanie wyznaczania wektora takiego, że
dla zadanego wektora .
Twierdzenie O współczynnikach wielomianu interpolacji trygonometrycznej
Współczynniki poszukiwanego wielomianu trygonometrycznego wyrażają się wzorem
Dowód
Można pokazać, że gdy dane są rzeczywiste, zadanie interpolacji trygonometrycznej możemy wyrazić korzystając wyłącznie z liczb rzeczywistych. Jeśli , , to wtedy (rzeczywisty) wielomian trygonometryczny
gdzie , , interpoluje w węzłach . Oczywiście, powyższa formuła w rzeczywistości ma o połowę mniej wyrazów, ze względu na własności funkcji trygonometrycznych.
Splot
W niektórych zastosowaniach potrzebne jest wyznaczenie splotu dwóch wektorów, to znaczy wyznaczenie wyrażeń postaci
(przyjmujemy tu konwencję, że wektory rozszerzamy -periodyczne tak, że z definicji dla dowolnych całkowitych ).
Zapisując to macierzowo, szukamy iloczynu wektora z cykliczną macierzą Toeplitza (macierz Toeplitza ma stałe wyrazy wzdłuż diagonali) wyznaczoną przez ,
Mogłoby się zdawać, że zadanie wyznaczenia splotu powinno kosztować tyle, co mnożenie macierzy przez wektor, a więc operacji. Tymczasem prosty rachunek pozwala sprawdzić, że odpowiednie transformacje Fouriera, , , spełniają równanie z macierzą diagonalną!
a to mnożenie daje się wykonać kosztem liniowym, tym samym całe zadanie daje się policzyć kosztem .
Biblioteki
Najpopularniejszą obecnie biblioteką implementującą algorytm FFT dla DFT, DCT i
innych pokrewnych (bez ograniczenia, że wymiar jest naturalną potęgą dwójki), jest biblioteka o niezbyt skromnie brzmiącej nazwie FFTW (The Fastest Fourier Transform in the West). Z tej biblioteki korzystają m.in. funkcje MATLABa i Octave'a fft
oraz ifft
dla transformacji DFT (to znaczy mnożenia przez ) i, odpowiednio, transformacji odwrotnej, .
FFTW jest napisana w C i w dużym stopniu wykorzystuje możliwości współczesnych procesorów, takie jak potokowanie i instrukcje wektorowe SSE2 i SSE3. Poniżej pokazujemy przykładowy prościutki kod w C realizujący DFT na pojedynczym wektorze zespolonym.
/* Kompilacja:
gcc -o dft dft.c -lfftw3 -lm */
#include <complex.h> /* rozszerzenie GCC dające operacje na typach zespolonych */
#include <fftw3.h>
#include <math.h>
#define N 8
int main(void)
{
fftw_complex *F, *C;
fftw_plan Plan;
double normfactor = 1.0/N;
int i;
F = fftw_malloc( N * sizeof(fftw_complex) );
C = fftw_malloc( N * sizeof(fftw_complex) );
for( i = 0; i < N; i++ ) /* inicjalizacja wartości tablicy F */
{
F[i] = i*M_PI*(1-0.5*I);
}
Plan = fftw_plan_dft_1d( N, F, C, FFTW_FORWARD, FFTW_ESTIMATE );
fftw_execute( Plan );
for( i = 0; i < N; i++ ) /* normalizacja wyznaczonego C */
C[i] *= normfactor;
for( i = 0; i < N; i++ )
{
printf("F[%d] = %8.3lf + %8.3lfi | C[%d] = %8.3lf + %8.3lfi\n",
i, creal(F[i]), cimag(F[i]), i, creal(C[i]), cimag(C[i]));
}
/* .... teraz moglibyśmy zmienić wartości F i ponownie wyznaczyć C,
korzystając z tego samego Planu! */
/* sprzątamy */
fftw_destroy_plan( Plan );
fftw_free( F );
fftw_free( C );
return(0);
}
Zwrócmy uwagę na linię Plan=fftw_plan_dft_1d(...)
. To tutaj dokonywane są
ustalenia, w jakiej kolejności mają być prowadzone obliczenia. Jest to operacja
dość kosztowna, dlatego jeśli mamy wyznaczyć wiele takich samych DFT, ale na
różnych danych , należy przed pierwszą DFT taki plan zachować, a potem, aplikując DFT dla następnych danych, wykorzystać gotowy.
Literatura
W celu dogłębnego zapoznania się z omawianym na wykładzie materiałem, przeczytaj rozdział 6.12--6.13 w
- D. Kincaid, W. Cheney Analiza numeryczna, Wydawnictwa Naukowo-Techniczne, Warszawa 2006, ISBN 83-204-3078-X.