Zaawansowane algorytmy i struktury danych/Wykład 4: Różnice pomiędzy wersjami

Wersja z 14:22, 19 lip 2006

Abstrakt

Naturalna metoda dodawania dwóch wielomianów wymaga czasu $Θ (n)$ , natomiast prosty algorytm mnożenia dwóch wielomianów stopnia $n$ wymaga czasu $Θ (n^{2})$ . W wykładzie tym pokażemy, jak z wykorzystaniem szybkiej transformaty Fouriera (STF), wykonać wszystkie podstawowe operacje na wielomianach w czasie większym niż $Θ (n)$ o czynnik polilogarytmiczny. Pokażemy jak dla wielomianów stopnia $n$ :

mnożyć je w czasie $O (n \log n)$ ,
obliczać wielomian interpolacyjny w czasie $O (n \log^{2} n)$ ,
obliczać wartość wielomianu w $n$ punktach w czasie $O (n \log^{2} n)$ ,
dzielić wielomiany w czasie $O (n \log^{3} n)$ .

Mnożenie wielomianów w punktach

Niech $A (x) = \sum_{i = 0}^{n - 1} a_{i} x^{i}$ i $B (x) = \sum_{i = 0}^{n - 1} b_{i} x^{i}$ będzą wielomianami stopnia $n$ nad ciałem $F$ . Wielomiany te możemy jednoznaczne reprezentować poprzez ich wartości w $n$ punktach. Następujące twierdzenie zostało sformułowane w ramach wykładu z Metod Numerycznych.

Twierdzenie [Twierdzenie o interpolacji wielomianów]

Dla dowolnego zbioru

n

par

X = {(x_{0}, y_{0}), (x_{1}, y_{1}), \dots, (x_{n - 1}, y_{n - 1})}

takiego, że wszystkie wartości

x_{i}

są parami różne, istnieje jedyny wielomian

C (x)

stopnia

n

taki, że

C (x_{i}) = y_{i}

dla

i = 0, 1, \dots, n - 1 .

Niech $X$ będzie ustalonym zbiorem parami różnych punktów $x_{0}, \dots, x_{2 n - 1} \in F$ . Dla tego zbioru punktów możemy wyznaczyć zbiory wartości wielomianów:

$X_{A} = {(x_{0}, A (x_{0})), (x_{1}, A (x_{1}), \dots, (x_{2 n - 1}, A (x_{2 n - 1}))}$

$X_{B} = {(x_{0}, B (x_{0})), (x_{1}, B (x_{1}), \dots, (x_{2 n - 1}, B (x_{2 n - 1}))}$

Niech $C$ będzie wynikiem mnożenia wielomianów $A$ i $B$ , mamy wtedy

$C (x_{i}) = A (x_{i}) \cdot B (x_{i})$ .

Ponieważ stopień wielomianu $C$ jest nie większy niż $2 n$ to z Twierdzenia o interpolacji zbiór wartości

$X_{A \times B} = {(x_{0}, A (x_{0}) B (x_{0})), (x_{1}, A (x_{1}) B (x_{1}), \dots, (2 x_{n - 1}, A (x_{2 n - 1}) B (x_{2 n - 1}))}$ ,

jednoznacznie wyznacza wielomian $A \times B$ . Mając zbiory $X_{A}$ i $X_{B}$ możemy wyznaczyć zbiór $X_{C}$ w czasie $O (n)$ . Procedura ta jest przedstawiona na następującym rysunku:

<flash>file=Zasd_fft1.swf|width=460|height=350</flash>

Jednak aby ostatecznie otrzymać szybszy algorytm niż algorytm naiwny musimy pokazać jak rozwiązać problem obliczania wartości wielomianu w $n$ punktach w czasie szybszym niż $Θ (n^{2})$ . Podobnie musimy umieć obliczać wielomian interpolacyjny dla danego zbioru punktów.

Szybka transformata Fouriera (STF)

Problem obliczania wartości wielomianu w $n$ punktach i problem jego interpolacji rozwiążemy wykorzystując szybką transformatę Fouriera. W poprzednim rozdziale nie zakładaliśmy nic na temat zbioru punktów $X$ . Głównym pomysłem w konstrukcji algorytmu STF będzie właśnie wybór odpowiedniego zbioru punktów X tak, aby jak największa ilość wykonywanych obliczeń powtarzała się.

Założymy chcemy obliczyć wartości wielomianu $A (x) = \sum_{i = 0}^{n - 1} a_{i} x^{i}$ oraz $n$ jest parzyste. Jeżeli $n$ jest nieparzyste to dodajemy na początek $A (x)$ jednomian $0 x^{n + 1}$ co nie zmienia nam wyniku działania algorytmu. Punkty $X_{n} = {x_{0}, x_{1}, \dots, x_{n - 1}}$ zdefiniujemy w następujący sposób:

$x_{i} = e^{\frac{2 π i}{n}}$ .

Dla wielomianu $A (x)$ definiujemy dwa nowe wielomiany $A^{[0]} (x)$ i $A^{[1]} (x)$ poprzez wybranie do nich współczynników $A (x)$ o numerach odpowiednio parzystych i nieparzystych:

$A^{[0]} (x) = a_{0} + a_{2} x + a_{4} x^{2} + \dots + a_{n - 2} x^{\frac{n}{2} - 1}$ ,

$A^{[1]} (x) = a_{1} + a_{3} x + a_{5} x^{2} + \dots + a_{n - 1} x^{\frac{n}{2} - 1}$ .

Wielomiany $A^{[0]} (x)$ oraz $A^{[1]} (x)$ są stopnia co najwyżej $\frac{n}{2}$ . Co więcej zachodzi:

$A (x) = A^{[0]} (x^{2}) + x A^{[1]} (x^{2})$ (1)

Widzimy teraz, że problem ewaluacji wielomianu $A (x)$ w punktach $ω_{n}^{0}, ω_{n}^{1}, \dots, ω_{n}^{n - 1}$ sprowadza się do:

ewaluacji wielomianów $A^{[0]} (x)$ i $A^{[1]} (x)$

w punktach

$X^{'} = {x_{0}^{2}, x_{1}^{2}, \dots, x_{n - 1}^{2}}$ .

a następnie obliczenie wartości $A (x)$ wyniku zgodnie ze wzorem (1).

Zauważmy, że z definicji punktów $x_i$ mamy:

$x_{i}^{2} = {(e^{\frac{2 π i}{n}})}^{2} = e^{\frac{2 π i}{n / 2}}$ .

Możemy teraz zauważyć, że zachodzi $x_{i}^{2} = x_{i + \frac{n}{2}}^{2}$ , a więc $X^{'} = X_{\frac{n}{2}}$ . Udało nam się więc zredukować problem rozmiaru $n$ - obliczenia wartości wielomianu $A (x)$ stopnia $n$ w $n$ do punktach, do dwóch problemów rozmiaru $\frac{n}{2}$ - obliczenia wartości wielomianów $A^{[0]} (x)$ i $A^{[1]} (x)$ stopnia $\frac{n}{2}$ w $\frac{n}{2}$ punktach. Możemy teraz zastosować tą technikę rekurencyjne otrzymując następujący algorytm.

Algorytm Algorytm Szybkiej Transformaty Fouriera

 STF( $a = (a_{0}, \dots, a_{n - 1})$ )
 if  $n$  nieparzyste then
   dodaj wyraz  $a_{n}$  do  $a$ 
   zwiększ  $n$ 
 if  $n = 1$  then return a
  $ω_{n} = e^{\frac{2 π i}{n}}$ 
  $ω = 1$ 
  $a^{[0]} = (a_{0}, a_{2}, \dots, a_{n - 2})$ 
  $a^{[1]} = (a_{1}, a_{3}, \dots, a_{n - 1})$ 
  $y^{[0]} = S F T (a^{[0]})$ 
  $y^{[1]} = S F T (a^{[1]})$ 
 for k=0 to  $\frac{n}{2} - 1$  do
    $y_{k} = y_{k}^{[0]} + ω y_{k}^{[1]}$ 
    $y_{k + \frac{n}{2}} = y_{k}^{[0]} - ω y_{k}^{[1]}$ 
   \omega = \omega \omega_n
 return y

Algorytm ten najpierw oblicza SFT wielomianów $A^{[0]} (x)$ i $A^{[1]} (x)$ a następnie łączy te wyniki w celu wyliczenia SFT dla wielomianu $A (x)$ . Przeanalizujmy teraz wykonanie pętli. Zauważmy najpierw, że w $k$ 'tym kroku pętli mamy $ω = ω_{n}^{k} = = e^{\frac{2 π i k}{n}} = x_{k} .$ . Czyli:

y_{k} = y_{k}^{[0]} + x_{k} y_{k}^{[1]} = A^{[0]} (e^{\frac{2 π i k}{n / 2}}) + x_{k} A^{[1]} (e^{\frac{2 π i k}{n / 2}}) = A^{[0]} (e^{\frac{2 π i k}{n}}^{2}) + x_{k} A^{[1]} (e^{\frac{2 π i k}{n}}^{2}) = A^{[0]} (x_{k}^{2}) + x_{k} A^{[1]} (x_{k}^{2}) = A (x_{k}),

oraz

Parser nie mógł rozpoznać (błąd składni): {\displaystyle y_{k+\frac{n}{2}} = y_k^{[0]} - x_k y_k^{[1]} = = A^{[0]}(e^{\frac{2\pi i k}{n/2}}) - e^{\frac{2\pi i k}{n}} A^{[1]}(e^{\frac{2\pi i k}{n/2}}) = A^{[0]}(e^{\frac{2\pi i (k + n/2)}{n/2}}) + e^{\frac{2\pi i k + n/2}{n}} A^{[1]}(e^{\frac{2\pi i (k + n/2)}{n/2}}) = A^{[0]}(x_{k + n/2}^2) + x_{k + n/2}^2 A^{[1]}(x_{k + n/2}^2) = A(x_{k+\frac{n}{2}). }

Gdzie w ostatniej równości skorzystaliśmy ze wzoru wzor_1|(1). Widzimy zatem, że algorytm poprawnie oblicza wartość STF dla wielomianu $A (x)$ . Równanie rekurencyjne na czas działania procedury STF wygląda następująco:

$T (n) = 2 T (\frac{n}{2}) + Θ (n) = Θ (n \log n)$ .

Odwrotna transformata Fouriera

Aby zakończyć konstrukcję algorytmu dla szybkiego mnożenia wielomianów pozostaje nam pokazanie jak wykonać obliczyć wielomian interpolujący dla zbioru punktów $X_{n}$ . Obliczenie wykonane w czasie szybkiej transformaty Fouriera możemy przedstawić w postaci macierzowej jako mnożenie macierzy przez wektor $(A (x_{0}), A (x_{1}), \dots, A (x_{n - 1}))^{T} = V_{n} (a_{0}, a_{1}, \dots, a_{n - 1})^{T}$ , gdzie $V_{n} = V (x_{0}, \dots, x_{n - 1})$ jest macierzą Vandermonde'a zawierającą potęgi $x_{j}$

$(\begin{matrix} A (x_{0}) \\ A (x_{1}) \\ A (x_{2}) \\ ⋮ \\ A (x_{n - 1}) \end{matrix}) = [\begin{matrix} x_{0}^{0} & x_{0}^{1} & x_{0}^{2} & x_{0}^{3} & \dots & x_{0}^{n - 1} \\ x_{1}^{0} & x_{1}^{1} & x_{1}^{2} & x_{1}^{3} & \dots & x_{1}^{n - 1} \\ x_{2}^{0} & x_{2}^{1} & x_{2}^{2} & x_{2}^{3} & \dots & x_{2}^{n - 1} \\ ⋮ & ⋮ & ⋮ & ⋮ & ⋱ & ⋮ \\ x_{n - 1}^{0} & x_{n - 1}^{1} & x_{n - 1}^{2} & x_{n - 1}^{3} & \dots & x_{n - 1}^{n - 1} \end{matrix}] (\begin{matrix} a_{0} \\ a_{1} \\ a_{2} \\ ⋮ \\ a_{n - 1} \end{matrix})$

Element macierzy $V (x_{0}, \dots, x_{n - 1})$ dany jest jako

$(V_{n})_{j, k} = V (x_{0}, \dots, x_{n - 1})_{j, k} = x_{j}^{k}$ .

Korzystając z definicji zbioru $X_{n}$ otrzymujemy

$V (x_{0}, \dots, x_{n - 1})_{j, k} = {(e^{\frac{2 π i j}{n}})}^{k} = e^{\frac{2 π i j k}{n}} .$

W celu wykonania operacji odwrotnej do SFT, czyli obliczenia wielomianu interpolacyjnego, musimy wykonać mnożenie $V_{n}^{- 1} (A (x_{0}), A (x_{1}), \dots, A (x_{n - 1}))^{T}$ .

{{lemat||| Niech macierz $W_{n}$ będzie zdefiniowana jako

{(W_{n})}_{j, k} = \frac{1}{n} e^{\frac{- 2 π i j k}{n}},

jest macierzą odwrotną do macierzy $V_{n}$ . } Dowód

Pokażemy, że $V_{n} W_{n} = I$ . Rozważmy pozycję $(j, k)$ macierzy $V_{n} W_{n}$ :

{(V_{n} W_{n})}_{j, k} = \sum_{l = 0}^{n - 1} {(V_{n})}_{j, l} {(W_{n})}_{l, k} = \sum_{l = 0}^{n - 1} e^{\frac{2 π i j l}{n}} \frac{1}{n} e^{\frac{- 2 π i l k}{n}} = \sum_{l = 0}^{n - 1} \frac{1}{n} e^{\frac{2 π l (j - k)}{n}} =

Jeżeli $j = k$ to $e^{\frac{2 π k (j - k)}{n}} = 1$ i suma ta jest równa $1$ . W przeciwnym przypadku możemy skorzystać ze wzoru na sumę szeregu geometrycznego:

= \frac{1}{n} \frac{1 - e^{\frac{2 π n (j - k)}{n}}}{1 - e^{\frac{2 π (j - k)}{n}}} = \frac{1}{n} \frac{1 - 1^{(j - k)}}{1 - e^{\frac{2 π (j - k)}{n}}} = 0 .

Czyli rzeczywiście $V_{n} W_{n} = I$ . \qed

Porównując postać macierzy $V_{n}$ oraz macierzy $W_{n}$ widzimy, że w celu obliczenia transformaty odwrotnej możemy użyć Algorytmu Szybkiej Transformaty Fouriera, musimy tylko zamienić linijkę $ω_{m} = e^{\frac{2 π i}{n}}$ na $ω_{m} = e^{- \frac{2 π i}{n}}$ i podzielić otrzymany wynik przez $n$ .

@@ Linia 126: / Linia 126: @@
 {{algorytm|Algorytm Szybkiej Transformaty Fouriera|algorytm_fft|
-aaa
+=
-}}
+  STF(<math>a = (a_0,\ldots,a_{n-1})</math>)
-  RECURSIVE-STF(a = (a_0,\ldots,a_{n-1}))
    '''if''' <math>n</math> nieparzyste '''then'''
      dodaj wyraz <math>a_n</math> do <math>a</math>
      zwiększ <math>n</math>
    '''if''' <math>n=1</math> '''then''' '''return''' a
-     <math>\omega_n = e^{\frac{2\pi i}{n}}</math>
+  <math>\omega_n = e^{\frac{2\pi i}{n}}</math>
+  <math>\omega = 1</math>
+  <math>a^{[0]} = (a_0, a_2, \ldots, a_{n-2})</math>
+  <math>a^{[1]} = (a_1, a_3, \ldots, a_{n-1})</math>
+  <math>y^{[0]} = SFT(a^{[0]})</math>
+  <math>y^{[1]} = SFT(a^{[1]})</math>
+  '''for''' k=0 '''to''' <math>\frac{n}{2}-1</math> '''do'''
+    <math>y_k = y_k^{[0]} + \omega y_k^{[1]}</math>
+     <math>y_{k+\frac{n}{2}} = y_k^{[0]} - \omega y_k^{[1]}</math>
+    \omega = \omega \omega_n
+  '''return''' y
+}}
+Algorytm ten najpierw oblicza SFT wielomianów
+<math>A^{[0]}(x)</math> i <math>A^{[1]}(x)</math> a następnie łączy
+te wyniki w celu wyliczenia SFT dla wielomianu <math>A(x)</math>.
+Przeanalizujmy teraz wykonanie pętli. Zauważmy najpierw, że w
+<math>k</math>'tym  kroku pętli mamy <math>\omega = \omega_n^k =
+= e^{\frac{2\pi i k}{n}} = x_k.</math>. Czyli:
+<center><math>
+y_k = y_k^{[0]} + x_k y_k^{[1]} = A^{[0]}(e^{\frac{2\pi i k}{n/2}}) +
+x_k A^{[1]}(e^{\frac{2\pi i k}{n/2}})
+= A^{[0]}(e^{\frac{2\pi i k}{n}}^2) +
+x_k A^{[1]}(e^{\frac{2\pi i k}{n}}^2)
+= A^{[0]}(x_k^2) +
+x_k A^{[1]}(x_k^2) = A(x_k),
+</math></center>
+oraz
+<center><math>
+y_{k+\frac{n}{2}} = y_k^{[0]} - x_k y_k^{[1]} =
+= A^{[0]}(e^{\frac{2\pi i k}{n/2}}) -
+e^{\frac{2\pi i k}{n}} A^{[1]}(e^{\frac{2\pi i k}{n/2}})
+= A^{[0]}(e^{\frac{2\pi i (k + n/2)}{n/2}}) +
+e^{\frac{2\pi i k + n/2}{n}} A^{[1]}(e^{\frac{2\pi i (k + n/2)}{n/2}})
+= A^{[0]}(x_{k + n/2}^2) +
+x_{k + n/2}^2 A^{[1]}(x_{k + n/2}^2)
+= A(x_{k+\frac{n}{2}).
+</math></center>
-Równanie rekurencyjne na czas działania procedury STF wygląda następująco:
+Gdzie w ostatniej równości skorzystaliśmy ze wzoru
+[[wzor|wzor_1|(1)]]. Widzimy zatem, że algorytm poprawnie oblicza
+wartość STF dla wielomianu <math>A(x)</math>. Równanie rekurencyjne
+na czas działania procedury STF wygląda następująco:

Zaawansowane algorytmy i struktury danych/Wykład 4: Różnice pomiędzy wersjami

Wersja z 14:22, 19 lip 2006

Spis treści

Abstrakt

Mnożenie wielomianów w punktach

Szybka transformata Fouriera (STF)

Odwrotna transformata Fouriera

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia