Zaawansowane algorytmy i struktury danych/Wykład 4: Różnice pomiędzy wersjami

Wersja z 12:49, 19 lip 2006

Abstrakt

Naturalna metoda dodawania dwóch wielomianów wymaga czasu $Θ (n)$ , natomiast prosty algorytm mnożenia dwóch wielomianów stopnia $n$ wymaga czasu $Θ (n^{2})$ . W wykładzie tym pokażemy, jak z wykorzystaniem szybkiej transformaty Fouriera (STF), wykonać wszystkie podstawowe operacje na wielomianach w czasie większym niż $Θ (n)$ o czynnik polilogarytmiczny. Pokażemy jak dla wielomianów stopnia $n$ :

mnożyć je w czasie $O (n \log n)$ ,
obliczać wielomian interpolacyjny w czasie $O (n \log^{2} n)$ ,
obliczać wartość wielomianu w $n$ punktach w czasie $O (n \log^{2} n)$ ,
dzielić wielomiany w czasie $O (n \log^{3} n)$ .

Mnożenie wielomianów w punktach

Niech $A (x) = \sum_{i = 0}^{n - 1} a_{i} x^{i}$ i $B (x) = \sum_{i = 0}^{n - 1} b_{i} x^{i}$ będzą wielomianami stopnia $n$ nad ciałem $F$ . Wielomiany te możemy jednoznaczne reprezentować poprzez ich wartości w $n$ punktach. Następujące twierdzenie zostało sformułowane w ramach wykładu z Metod Numerycznych.

Twierdzenie [Twierdzenie o interpolacji wielomianów]

Dla dowolnego zbioru

n

par

X = {(x_{0}, y_{0}), (x_{1}, y_{1}), \dots, (x_{n - 1}, y_{n - 1})}

takiego, że wszystkie wartości

x_{i}

są parami różne, istnieje jedyny wielomian

C (x)

stopnia

n

taki, że

C (x_{i}) = y_{i}

dla

i = 0, 1, \dots, n - 1 .

Niech $X$ będzie ustalonym zbiorem parami różnych punktów $x_{0}, \dots, x_{2 n - 1} \in F$ . Dla tego zbioru punktów możemy wyznaczyć zbiory wartości wielomianów:

$X_{A} = {(x_{0}, A (x_{0})), (x_{1}, A (x_{1}), \dots, (x_{2 n - 1}, A (x_{2 n - 1}))}$

$X_{B} = {(x_{0}, B (x_{0})), (x_{1}, B (x_{1}), \dots, (x_{2 n - 1}, B (x_{2 n - 1}))}$

Niech $C$ będzie wynikiem mnożenia wielomianów $A$ i $B$ , mamy wtedy

$C (x_{i}) = A (x_{i}) \cdot B (x_{i})$ .

Ponieważ stopień wielomianu $C$ jest nie większy niż $2 n$ to z Twierdzenia o interpolacji zbiór wartości

$X_{A \times B} = {(x_{0}, A (x_{0}) B (x_{0})), (x_{1}, A (x_{1}) B (x_{1}), \dots, (2 x_{n - 1}, A (x_{2 n - 1}) B (x_{2 n - 1}))}$ ,

jednoznacznie wyznacza wielomian $A \times B$ . Mając zbiory $X_{A}$ i $X_{B}$ możemy wyznaczyć zbiór $X_{C}$ w czasie $O (n)$ . Procedura ta jest przedstawiona na następującym rysunku:

<flash>file=Zasd_fft1.swf|width=460|height=350</flash>

Jednak aby ostatecznie otrzymać szybszy algorytm niż algorytm naiwny musimy pokazać jak rozwiązać problem obliczania wartości wielomianu w $n$ punktach w czasie szybszym niż $Θ (n^{2})$ . Podobnie musimy umieć obliczać wielomian interpolacyjny dla danego zbioru punktów.

Szybka transformata Fouriera (STF)

Problem obliczania wartości wielomianu w $n$ punktach i problem jego interpolacji rozwiążemy wykorzystując szybką transformatę Fouriera. W poprzednim rozdziale nie zakładaliśmy nic na temat zbioru punktów $X$ . Głównym pomysłem w konstrukcji algorytmu STF będzie właśnie wybór odpowiedniego zbioru punktów X tak, aby jak największa ilość wykonywanych obliczeń powtarzała się.

Założymy chcemy obliczyć wartości wielomianu $A (x) = \sum_{i = 0}^{n - 1} a_{i} x^{i}$ oraz $n$ jest parzyste. Jeżeli $n$ jest nieparzyste to dodajemy na początek $A (x)$ jednomian $0 x^{n + 1}$ co nie zmienia nam wyniku działania algorytmu. Punkty $X_{n} = {x_{0}, x_{1}, \dots, x_{n - 1}}$ zdefiniujemy w następujący sposób:

$x_{i} = e^{\frac{2 π i}{n}}$ .

Dla wielomianu $A (x)$ definiujemy dwa nowe wielomiany $A^{[0]} (x)$ i $A^{[1]} (x)$ poprzez wybranie do nich współczynników $A (x)$ o numerach odpowiednio parzystych i nieparzystych:

$A^{[0]} (x) = a_{0} + a_{2} x + a_{4} x^{2} + \dots + a_{n - 2} x^{\frac{n}{2} - 1}$ ,

$A^{[1]} (x) = a_{1} + a_{3} x + a_{5} x^{2} + \dots + a_{n - 1} x^{\frac{n}{2} - 1}$ .

Wielomiany $A^{[0]} (x)$ oraz $A^{[1]} (x)$ są stopnia co najwyżej $\frac{n}{2}$ . Co więcej zachodzi:

$A (x) = A^{[0]} (x^{2}) + x A^{[1]} (x^{2})$ (1)

Widzimy teraz, że problem ewaluacji wielomianu $A (x)$ w punktach $ω_{n}^{0}, ω_{n}^{1}, \dots, ω_{n}^{n - 1}$ sprowadza się do:

ewaluacji wielomianów $A^{[0]} (x)$ i $A^{[1]} (x)$

w punktach

$X^{'} = {x_{0}^{2}, x_{1}^{2}, \dots, x_{n - 1}^{2}}$ .

a następnie obliczenie wartości $A (x)$ wyniku zgodnie ze wzorem (1).

Zauważmy, że z definicji punktów $x_i$ mamy:

$x_{i}^{2} = {(e^{\frac{2 π i}{n}})}^{2} = e^{\frac{2 π i}{n / 2}}$ .

Możemy teraz zauważyć, że zachodzi $x_{i}^{2} = x_{i + \frac{n}{2}}^{2}$ , a więc $X^{'} = X_{\frac{n}{2}}$ . Udało nam się więc zredukować problem rozmiaru $n$ - obliczenia wartości wielomianu $A (x)$ stopnia $n$ w $n$ do punktach, do dwóch problemów rozmiaru $\frac{n}{2}$ - obliczenia wartości wielomianów $A^{[0]} (x)$ i $A^{[1]} (x)$ stopnia $\frac{n}{2}$ w $\frac{n}{2}$ punktach. Możemy teraz zastosować tą technikę rekurencyjne otrzymując następujący algorytm.

Równanie rekurencyjne na czas działania procedury STF wygląda następująco:

$T (n) = 2 T (\frac{n}{2}) + Θ (n) = Θ (n \log n)$ .

Odwrotna transformata Fouriera

Aby zakończyć konstrukcję algorytmu dla szybkiego mnożenia wielomianów pozostaje nam pokazanie jak wykonać obliczyć wielomian interpolujący dla zbioru punktów $X_{n}$ . Obliczenie wykonane w czasie szybkiej transformaty Fouriera możemy przedstawić w postaci macierzowej jako mnożenie macierzy przez wektor $(A (x_{0}), A (x_{1}), \dots, A (x_{n - 1}))^{T} = V_{n} (a_{0}, a_{1}, \dots, a_{n - 1})^{T}$ , gdzie $V_{n} = V (x_{0}, \dots, x_{n - 1})$ jest macierzą Vandermonde'a zawierającą potęgi $x_{j}$

$(\begin{matrix} A (x_{0}) \\ A (x_{1}) \\ A (x_{2}) \\ ⋮ \\ A (x_{n - 1}) \end{matrix}) = [\begin{matrix} x_{0}^{0} & x_{0}^{1} & x_{0}^{2} & x_{0}^{3} & \dots & x_{0}^{n - 1} \\ x_{1}^{0} & x_{1}^{1} & x_{1}^{2} & x_{1}^{3} & \dots & x_{1}^{n - 1} \\ x_{2}^{0} & x_{2}^{1} & x_{2}^{2} & x_{2}^{3} & \dots & x_{2}^{n - 1} \\ ⋮ & ⋮ & ⋮ & ⋮ & ⋱ & ⋮ \\ x_{n - 1}^{0} & x_{n - 1}^{1} & x_{n - 1}^{2} & x_{n - 1}^{3} & \dots & x_{n - 1}^{n - 1} \end{matrix}] (\begin{matrix} a_{0} \\ a_{1} \\ a_{2} \\ ⋮ \\ a_{n - 1} \end{matrix})$

Element macierzy $V (x_{0}, \dots, x_{n - 1})$ dany jest jako

$(V_{n})_{j, k} = V (x_{0}, \dots, x_{n - 1})_{j, k} = x_{j}^{k}$ .

Korzystając z definicji zbioru $X_{n}$ otrzymujemy

$V (x_{0}, \dots, x_{n - 1})_{j, k} = {(e^{\frac{2 π i j}{n}})}^{k} = e^{\frac{2 π i j k}{n}} .$

W celu wykonania operacji odwrotnej do SFT, czyli obliczenia wielomianu interpolacyjnego, musimy wykonać mnożenie $V_{n}^{- 1} (A (x_{0}), A (x_{1}), \dots, A (x_{n - 1}))^{T}$ .

{{lemat||| Niech macierz $W_{n}$ będzie zdefiniowana jako

{(W_{n})}_{j, k} = \frac{1}{n} e^{\frac{- 2 π i j k}{n}},

jest macierzą odwrotną do macierzy $V_{n}$ . } Dowód

Pokażemy, że $V_{n} W_{n} = I$ . Rozważmy pozycję $(j, k)$ macierzy $V_{n} W_{n}$ :

{(V_{n} W_{n})}_{j, k} = \sum_{l = 0}^{n - 1} {(V_{n})}_{j, l} {(W_{n})}_{l, k} = \sum_{l = 0}^{n - 1} e^{\frac{2 π i j l}{n}} \frac{1}{n} e^{\frac{- 2 π i l k}{n}} = \sum_{l = 0}^{n - 1} \frac{1}{n} e^{\frac{2 π l (j - k)}{n}} =

Jeżeli $j = k$ to $e^{\frac{2 π k (j - k)}{n}} = 1$ i suma ta jest równa $1$ . W przeciwnym przypadku możemy skorzystać ze wzoru na sumę szeregu geometrycznego:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle = \frac{1}{n} \frac{1 - e^{\frac{2\pi (n)(j-k)}{n}}} {1 - e^{\frac{2\pi (j-k)}{n}} = \frac{1}{n} \frac{1 - 1^{(j-k)}} {1 - e^{\frac{2\pi (j-k)}{n}} = 0. }

Czyli rzeczywiście Parser nie mógł rozpoznać (błąd składni): {\displaystyle V_n W_n\right = I} . \qed

Porównując postać macierzy $V_{n}$ oraz macierzy $W_{n}$ widzimy, że w celu obliczenia transformaty odwrotnej możemy użyć Algorytmu Szybkiej Transformaty Fouriera, musimy tylko zamienić linijkę $ω_{m} = e^{\frac{2 π i}{n}}$ na $ω_{m} = e^{- \frac{2 π i}{n}}$ i podzielić otrzymany wynik przez $n$ .

@@ Linia 134: / Linia 134: @@
 === Odwrotna transformata Fouriera ===
 Aby zakończyć konstrukcję algorytmu dla szybkiego mnożenia
 wielomianów pozostaje nam pokazanie jak wykonać obliczyć wielomian
@@ Linia 141: / Linia 140: @@
 w postaci macierzowej jako mnożenie macierzy przez wektor
 <math>(A(x_0), A(x_1), \ldots, A(x_{n-1}))^T = V_n (a_0, a_1,
-\ldots, a_{n-1})^T</math>, gdzie <math>V(x_0,\ldots,x_{n-1})</math> jest macierzą
+\ldots, a_{n-1})^T</math>, gdzie <math>V_n = V(x_0,\ldots,x_{n-1})</math> jest macierzą
-Vandermonde'a zawierającą potęgi <math>x_i</math>
+Vandermonde'a zawierającą potęgi <math>x_j</math>
@@ Linia 183: / Linia 182: @@
 <center>
-<math>V(x_0,\ldots,x_{n-1})_{i,j} = x_i^j</math>.
+<math>(V_n)_{j,k} = V(x_0,\ldots,x_{n-1})_{j,k} = x_j^k</math>.
 </center>
-W celu wykonania operacji odwrotnej do SFT, czyli obliczenia wielomianu interpolacyjnego, musimy wykonać mnożenie
-<math>V(x_0,\ldots,x_{n-1})^{-1} (A(x_0), A(x_1), \ldots, A(x_{n-1}))^T</math>.
 Korzystając z definicji zbioru <math>X_n</math> otrzymujemy
@@ Linia 194: / Linia 190: @@
 <center>
-<math>V(x_0,\ldots,x_{n-1})_{i,j} = \left(e^{\frac{2\pi i}{n}}\right)^j
+<math>V(x_0,\ldots,x_{n-1})_{j,k} = \left(e^{\frac{2\pi i j}{n}}\right)^k
-= e^{\frac{2\pi ij}{n}}.</math>
+= e^{\frac{2\pi ijk}{n}}.</math>
 </center>
+W celu wykonania operacji odwrotnej do SFT, czyli obliczenia wielomianu
+interpolacyjnego, musimy wykonać mnożenie
+<math>V_n^{-1} (A(x_0), A(x_1), \ldots, A(x_{n-1}))^T</math>.
+{{lemat|||
+Niech macierz <math>W_n</math> będzie zdefiniowana jako
+<center><math>
+\left(W_n\right)_{j,k} = \frac{1}{n} e^{\frac{-2\pi ijk}{n}},
+</math></center>
+jest macierzą odwrotną do macierzy <math>V_n</math>.
+}
+{{dowod|||
+Pokażemy, że <math>V_n W_n = I</math>. Rozważmy pozycję <math>(j,k)</math>
+macierzy <math>V_n W_n</math>:
+<center><math>
+\left(V_n W_n\right)_{j,k} = \sum_{l=0}^{n-1} \left(V_n\right)_{j,l} \left(W_n\right)_{l,k}
+=\sum_{l=0}^{n-1} e^{\frac{2\pi i j l}{n}} \frac{1}{n} e^{\frac{-2\pi i l k}{n}} =
+\sum_{l=0}^{n-1} \frac{1}{n} e^{\frac{2\pi l(j-k)}{n}} =
+</math></center>
+Jeżeli <math>j=k</math> to <math>e^{\frac{2\pi k(j-k)}{n}} =
+</math> i suma ta jest równa <math>1</math>. W przeciwnym przypadku
+możemy skorzystać ze wzoru na sumę szeregu geometrycznego:
+<center><math>
+= \frac{1}{n} \frac{1 - e^{\frac{2\pi (n)(j-k)}{n}}}
+{1 - e^{\frac{2\pi (j-k)}{n}} =
+\frac{1}{n} \frac{1 - 1^{(j-k)}}
+{1 - e^{\frac{2\pi (j-k)}{n}} = 0.
+</math></center>
+Czyli rzeczywiście <math>V_n W_n\right = I</math>. \qed
+}}
-{{lemat|||cos tam costam}}
+Porównując postać macierzy <math>V_n</math> oraz macierzy <math>W_n</math>
-{{dowod|||aaaa}}
+widzimy, że w celu obliczenia transformaty odwrotnej możemy użyć
+[[ZASD Moduł 4#algorytm_fft|Algorytmu Szybkiej Transformaty Fouriera]], musimy
+tylko zamienić linijkę <math>\omega_m = e^{\frac{2\pi i}{n}}</math> na
+<math>\omega_m = e^{-\frac{2\pi i}{n}}</math> i podzielić otrzymany wynik
+przez <math>n</math>.

Zaawansowane algorytmy i struktury danych/Wykład 4: Różnice pomiędzy wersjami

Wersja z 12:49, 19 lip 2006

Spis treści

Abstrakt

Mnożenie wielomianów w punktach

Szybka transformata Fouriera (STF)

Odwrotna transformata Fouriera

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia