Zaawansowane algorytmy i struktury danych/Wykład 4: Różnice pomiędzy wersjami

Wersja z 16:03, 1 sie 2006

Abstrakt

Naturalna metoda dodawania dwóch wielomianów wymaga czasu $Θ (n)$ , natomiast prosty algorytm mnożenia dwóch wielomianów stopnia $n$ wymaga czasu $Θ (n^{2})$ . W wykładzie tym pokażemy, jak z wykorzystaniem szybkiej transformaty Fouriera (STF), wykonać wszystkie podstawowe operacje na wielomianach w czasie większym niż $Θ (n)$ o czynnik polilogarytmiczny. Na wykładzie pokażemy jak dla wielomianów stopnia $n$ :

mnożyć je w czasie $O (n \log n)$ ,
dzielić wielomiany w czasie $O (n \log n)$ .

Natomiast jako ćwiczenie zostanie nam pokazanie jak wykorzystać te algorytmy do

obliczania wielomianu interpolacyjnegi w czasie $O (n \log^{2} n)$ ,
obliczania wartości wielomianu w $n$ punktach w czasie $O (n \log^{2} n)$ .

Mnożenie wielomianów w punktach

Niech $A (x) = \sum_{i = 0}^{n - 1} a_{i} x^{i}$ i $B (x) = \sum_{i = 0}^{n - 1} b_{i} x^{i}$ będą wielomianami stopnia $n$ nad ciałem $F$ . Wielomiany te możemy jednoznaczne reprezentować poprzez ich wartości w $n$ punktach. Następujące twierdzenie zostało sformułowane w ramach wykładu z Metod Numerycznych.

Twierdzenie [Twierdzenie o interpolacji wielomianów]

Dla dowolnego zbioru

n

par

X = {(x_{0}, y_{0}), (x_{1}, y_{1}), \dots, (x_{n - 1}, y_{n - 1})}

takiego, że wszystkie wartości

x_{i}

są parami różne, istnieje jedyny wielomian

C (x)

stopnia

n

taki, że

C (x_{i}) = y_{i}

dla

i = 0, 1, \dots, n - 1 .

Niech $X$ będzie ustalonym zbiorem parami różnych punktów $x_{0}, \dots, x_{2 n - 1} \in F$ . Dla tego zbioru punktów możemy wyznaczyć zbiory wartości wielomianów:

$X_{A} = {(x_{0}, A (x_{0})), (x_{1}, A (x_{1}), \dots, (x_{2 n - 1}, A (x_{2 n - 1}))}$

$X_{B} = {(x_{0}, B (x_{0})), (x_{1}, B (x_{1}), \dots, (x_{2 n - 1}, B (x_{2 n - 1}))}$

Niech $C$ będzie wynikiem mnożenia wielomianów $A$ i $B$ , mamy wtedy

$C (x_{i}) = A (x_{i}) \cdot B (x_{i})$ .

Ponieważ stopień wielomianu $C$ jest nie większy niż $2 n$ to z Twierdzenia o interpolacji zbiór wartości

$X_{A \times B} = {(x_{0}, A (x_{0}) B (x_{0})), (x_{1}, A (x_{1}) B (x_{1}), \dots, (2 x_{n - 1}, A (x_{2 n - 1}) B (x_{2 n - 1}))}$ ,

jednoznacznie wyznacza wielomian $A \times B$ . Mając zbiory $X_{A}$ i $X_{B}$ możemy wyznaczyć zbiór $X_{C}$ w czasie $O (n)$ . Procedura ta jest przedstawiona na następującym rysunku:

<flash>file=Zasd_fft1.swf|width=460|height=350</flash>

Jednak aby ostatecznie otrzymać szybszy algorytm niż algorytm naiwny musimy pokazać jak rozwiązać problem obliczania wartości wielomianu w $n$ punktach w czasie szybszym niż $Θ (n^{2})$ . Podobnie musimy umieć obliczać wielomian interpolacyjny dla danego zbioru punktów.

Szybka transformata Fouriera (STF)

Problem obliczania wartości wielomianu w $n$ punktach i problem jego interpolacji rozwiążemy wykorzystując szybką transformatę Fouriera. W poprzednim rozdziale nie zakładaliśmy nic na temat zbioru punktów $X$ . Głównym pomysłem w konstrukcji algorytmu STF będzie właśnie wybór odpowiedniego zbioru punktów X tak, aby jak największa ilość wykonywanych obliczeń powtarzała się.

Założymy, że chcemy obliczyć wartości wielomianu $A (x) = \sum_{i = 0}^{n - 1} a_{i} x^{i}$ oraz $n$ jest parzyste. Jeżeli $n$ jest nieparzyste to dodajemy na początek $A (x)$ jednomian $0 x^{n + 1}$ co nie zmienia nam wyniku działania algorytmu. Punkty $X_{n} = {x_{0}, x_{1}, \dots, x_{n - 1}}$ zdefiniujemy w następujący sposób:

$x_{i} = e^{\frac{2 π i}{n}}$ .

Dla wielomianu $A (x)$ definiujemy dwa nowe wielomiany $A^{[0]} (x)$ i $A^{[1]} (x)$ poprzez wybranie do nich współczynników $A (x)$ o numerach odpowiednio parzystych i nieparzystych:

$A^{[0]} (x) = a_{0} + a_{2} x + a_{4} x^{2} + \dots + a_{n - 2} x^{\frac{n}{2} - 1}$ ,

$A^{[1]} (x) = a_{1} + a_{3} x + a_{5} x^{2} + \dots + a_{n - 1} x^{\frac{n}{2} - 1}$ .

Wielomiany $A^{[0]} (x)$ oraz $A^{[1]} (x)$ są stopnia co najwyżej $\frac{n}{2}$ . Co więcej zachodzi:

$A (x) = A^{[0]} (x^{2}) + x A^{[1]} (x^{2})$ (1)

Widzimy teraz, że problem ewaluacji wielomianu $A (x)$ w punktach $ω_{n}^{0}, ω_{n}^{1}, \dots, ω_{n}^{n - 1}$ sprowadza się do:

ewaluacji wielomianów $A^{[0]} (x)$ i $A^{[1]} (x)$ w punktach

$X^{'} = {x_{0}^{2}, x_{1}^{2}, \dots, x_{n - 1}^{2}}$ .

a następnie obliczenie wartości $A (x)$ wyniku zgodnie ze wzorem (1).

Zauważmy, że z definicji punktów $x_i$ mamy:

$x_{i}^{2} = {(e^{\frac{2 π i}{n}})}^{2} = e^{\frac{2 π i}{n / 2}}$ .

Możemy teraz zauważyć, że zachodzi $x_{i}^{2} = x_{i + \frac{n}{2}}^{2}$ , a więc $X^{'} = X_{\frac{n}{2}}$ . Udało nam się więc zredukować problem rozmiaru $n$ - obliczenia wartości wielomianu $A (x)$ stopnia $n$ w $n$ punktach, do dwóch problemów rozmiaru $\frac{n}{2}$ - obliczenia wartości wielomianów $A^{[0]} (x)$ i $A^{[1]} (x)$ stopnia $\frac{n}{2}$ w $\frac{n}{2}$ punktach. Możemy teraz zastosować tą technikę rekurencyjne otrzymując następujący algorytm.

Algorytm Algorytm Szybkiej Transformaty Fouriera

 STF( $a = (a_{0}, \dots, a_{n - 1})$ )
 if  $n$  nieparzyste then
   dodaj wyraz  $a_{n}$  do  $a$ 
   zwiększ  $n$ 
 if  $n = 1$  then return a
  $ω_{n} = e^{\frac{2 π i}{n}}$ 
  $ω = 1$ 
  $a^{[0]} = (a_{0}, a_{2}, \dots, a_{n - 2})$ 
  $a^{[1]} = (a_{1}, a_{3}, \dots, a_{n - 1})$ 
  $y^{[0]} = S F T (a^{[0]})$ 
  $y^{[1]} = S F T (a^{[1]})$ 
 for k=0 to  $\frac{n}{2} - 1$  do
    $y_{k} = y_{k}^{[0]} + ω y_{k}^{[1]}$ 
    $y_{k + \frac{n}{2}} = y_{k}^{[0]} - ω y_{k}^{[1]}$ 
   \omega = \omega \omega_n
 return y

Algorytm ten najpierw oblicza SFT wielomianów $A^{[0]} (x)$ i $A^{[1]} (x)$ a następnie łączy te wyniki w celu wyliczenia SFT dla wielomianu $A (x)$ . Przeanalizujmy teraz wykonanie pętli. Zauważmy najpierw, że w $k$ 'tym kroku pętli mamy $ω = ω_{n}^{k} = e^{\frac{2 π i k}{n}} = x_{k} .$ . Czyli:

y_{k} = y_{k}^{[0]} + x_{k} y_{k}^{[1]} = A^{[0]} (e^{\frac{2 π i k}{n / 2}}) + x_{k} A^{[1]} (e^{\frac{2 π i k}{n / 2}}) =

= A^{[0]} ({(e^{\frac{2 π i k}{n}})}^{2}) + x_{k} A^{[1]} ({(e^{\frac{2 π i k}{n}})}^{2}) = A^{[0]} (x_{k}^{2}) + x_{k} A^{[1]} (x_{k}^{2}) = A (x_{k}),

oraz

y_{k + \frac{n}{2}} = y_{k}^{[0]} - x_{k} y_{k}^{[1]} = A^{[0]} (e^{\frac{2 π i k}{n / 2}}) - e^{\frac{2 π i k}{n}} A^{[1]} (e^{\frac{2 π i k}{n / 2}}) =

= A^{[0]} (e^{\frac{2 π i (k + n / 2)}{n / 2}}) + e^{\frac{2 π i k + n / 2}{n}} A^{[1]} (e^{\frac{2 π i (k + n / 2)}{n / 2}}) = A^{[0]} (x_{k + n / 2}^{2}) + x_{k + n / 2}^{2} A^{[1]} (x_{k + n / 2}^{2}) = A (x_{k + \frac{n}{2}}) .

Gdzie w ostatniej równości skorzystaliśmy ze wzoru (1). Widzimy zatem, że algorytm poprawnie oblicza wartość STF dla wielomianu $A (x)$ . Równanie rekurencyjne na czas działania procedury STF wygląda następująco:

$T (n) = 2 T (\frac{n}{2}) + Θ (n) = Θ (n \log n)$ .

Odwrotna transformata Fouriera

Aby zakończyć konstrukcję algorytmu dla szybkiego mnożenia wielomianów pozostaje nam pokazanie jak obliczyć wielomian interpolujący dla zbioru punktów $X_{n}$ . Obliczenie wykonane w czasie szybkiej transformaty Fouriera możemy przedstawić w postaci macierzowej jako mnożenie macierzy przez wektor $(A (x_{0}), A (x_{1}), \dots, A (x_{n - 1}))^{T} = V_{n} (a_{0}, a_{1}, \dots, a_{n - 1})^{T}$ , gdzie $V_{n} = V (x_{0}, \dots, x_{n - 1})$ jest macierzą Vandermonde'a zawierającą potęgi $x_{j}$

$(\begin{matrix} A (x_{0}) \\ A (x_{1}) \\ A (x_{2}) \\ ⋮ \\ A (x_{n - 1}) \end{matrix}) = [\begin{matrix} x_{0}^{0} & x_{0}^{1} & x_{0}^{2} & x_{0}^{3} & \dots & x_{0}^{n - 1} \\ x_{1}^{0} & x_{1}^{1} & x_{1}^{2} & x_{1}^{3} & \dots & x_{1}^{n - 1} \\ x_{2}^{0} & x_{2}^{1} & x_{2}^{2} & x_{2}^{3} & \dots & x_{2}^{n - 1} \\ ⋮ & ⋮ & ⋮ & ⋮ & ⋱ & ⋮ \\ x_{n - 1}^{0} & x_{n - 1}^{1} & x_{n - 1}^{2} & x_{n - 1}^{3} & \dots & x_{n - 1}^{n - 1} \end{matrix}] (\begin{matrix} a_{0} \\ a_{1} \\ a_{2} \\ ⋮ \\ a_{n - 1} \end{matrix})$

Element macierzy $V (x_{0}, \dots, x_{n - 1})$ dany jest jako

$(V_{n})_{j, k} = V (x_{0}, \dots, x_{n - 1})_{j, k} = x_{j}^{k}$ .

Korzystając z definicji zbioru $X_{n}$ otrzymujemy

$V (x_{0}, \dots, x_{n - 1})_{j, k} = {(e^{\frac{2 π i j}{n}})}^{k} = e^{\frac{2 π i j k}{n}} .$

W celu wykonania operacji odwrotnej do SFT, czyli obliczenia wielomianu interpolacyjnego, musimy wykonać mnożenie $V_{n}^{- 1} (A (x_{0}), A (x_{1}), \dots, A (x_{n - 1}))^{T}$ .

{{lemat|||Niech macierz $W_{n}$ będzie zdefiniowana jako

{(W_{n})}_{j, k} = \frac{1}{n} e^{\frac{- 2 π i j k}{n}},

jest macierzą odwrotną do macierzy $V_{n}$ . } Dowód

Pokażemy, że

V_{n} W_{n} = I

. Rozważmy pozycję

(j, k)

macierzy

V_{n} W_{n}

:

{(V_{n} W_{n})}_{j, k} = \sum_{l = 0}^{n - 1} {(V_{n})}_{j, l} {(W_{n})}_{l, k} = \sum_{l = 0}^{n - 1} e^{\frac{2 π i j l}{n}} \frac{1}{n} e^{\frac{- 2 π i l k}{n}} = \sum_{l = 0}^{n - 1} \frac{1}{n} e^{\frac{2 π l (j - k)}{n}} =

Jeżeli $j = k$ to $e^{\frac{2 π k (j - k)}{n}} = 1$ i suma ta jest równa $1$ . W przeciwnym przypadku możemy skorzystać ze wzoru na sumę szeregu geometrycznego:

= \frac{1}{n} \frac{1 - e^{\frac{2 π n (j - k)}{n}}}{1 - e^{\frac{2 π (j - k)}{n}}} = \frac{1}{n} \frac{1 - 1^{(j - k)}}{1 - e^{\frac{2 π (j - k)}{n}}} = 0 .

Czyli rzeczywiście $V_{n} W_{n} = I$ . \qed

Porównując postać macierzy $V_{n}$ oraz macierzy $W_{n}$ widzimy, że w celu obliczenia transformaty odwrotnej możemy użyć Algorytmu Szybkiej Transformaty Fouriera, musimy tylko zamienić linijkę $ω_{m} = e^{\frac{2 π i}{n}}$ na $ω_{m} = e^{- \frac{2 π i}{n}}$ i podzielić otrzymany wynik przez $n$ .

Dzielenie wielomianów

W tej części wykładu skupimy się na problemie dzielenia dwóch wielomianów. Niech $A (x)$ będzie wielomianem stopnia $m$ a $B (x)$ wielomianem stopnie $n$ . Zakładamy bez straty ogólności, że $b_{n - 1} \neq 0$ . W problemie dzielenia wielomianów, chcemy obliczyć dwa wielomiany $D (x)$ i $R (x)$ takie, że

$A (x) = D (x) B (x) + R (x),$ (2)

oraz stopień wielomianu $R (x)$ jest ostro mniejszy niż $n$ . Wielomian $D (x)$ nazywamy {{def|wynikiem dzielenia|}, a wielomian $R (x)$ to {{def|reszta z dzielenia|}. Pierwszy pomysł jaki się od razu nasuwa, to spróbować policzyć odwrotność wielomianu $B (x)$ i przemnożenie przez tą odwrotność stronami tego równania. Niestety wielomiany nie mają niestety odwrotności będących wielomianami. Jednak nie pozostajemy tutaj zupełnie bezradni. Możemy rozszerzyć naszą dziedzinę obliczeń tak aby zagwarantować istnienie pewnych odwrotności.

Obliczenia będziemy wykonywać nad zbiorem szeregów formalnych $F [[x]]$ nad ciałem $F$ , patrz Wykład z matematyki dyskretnej. Dla części elementów $F [[x]]$ istnieją odwrotności. Elementy te są postaci $a + x A (x)$ gdzie $a \neq 0$ i $A (x) \in F [[x]]$ .

Ćwiczenie odwrotność_formalna

{{{3}}}

Ćwiczenie odwrotność_formalna

{{{3}}}

Do wzoru (2) wstawmy $x = \frac{1}{z}$ otrzymamy wtedy:

A^{R} (z) = D^{R} (z) B^{R} (z) + z^{m - n - 1} R^{R} (z) = B^{R} (z) D^{R} (z) mod z^{m - n - 1},

gdzie $A^{R} (z) = z^{m} A (\frac{1}{z})$ , $D^{R} (z) = z^{m - n} D (\frac{1}{z})$ , $B^{R} (z) = z^{n} B (\frac{1}{z})$ i $R^{R} (z) = z^{n - 1} R (\frac{1}{z})$ , oznaczają wielomiany otrzymane poprzez odwrócenie kolejności współczynników. Z założenia, że $b_{n - 1} \neq 0$ wiemy, że wielomian $B^{R}$ ma odwrotność nad zbiorem szeregów formalnych. Możemy zapisać więc:

D^{R} (z) = A^{R} (x) {(B^{R} (z))}^{- 1} mod z^{m - n - 1} .

Zauważmy, że w celu wyznaczenia $D^{R} (z)$ potrzebujemy tylko $m - n - 1$ wyrazów szeregu ${(B^{R} (z))}^{- 1}$ . Wyższe wyrazy i tak znikną w wyniku wykonania mnożenia modulo $z^{m - n - 1}$ . Pozostało nam teraz tylko pokazać jak wyznaczyć odwrotność dla szeregu formalnego. Algorytm ten przedstawiony jest poniżej

Algorytm Obliczanie pierwszych $m$ wyrazów odwrotnośći szeregu formalnego

 ODWROTNOŚĆ(A(x) = \sum_{i=0}^{n-1} a_i x^i, m)
 if  $m = 1$  then return  $1 / a_{0}$ 
  $A^{[0]} (x) =$ ODWROTNOŚĆ $(A (x), ⌊ \frac{m}{2} ⌋)$ 
 return  $(A^{[0]} (x) - (A (x) A^{[0]} (x) - 1) A^{[0]} (x)) mod x^{m}$

Obliczenie to jest poprawne ponieważ:

\frac{1}{A (x)} - (A^{[0]} (x) - (A (x) A^{[0]} (x) - 1) A^{[0]} (x)) = A (x) {(\frac{1}{A (x)} - A^{[0]} (x))}^{2},

a to jest równe wielokrotności $x^{2 m}$ , a więc jest także wielokrotnością $x^{n}$ . Jeżeli wykorzystamy szybkie mnożenie wielomianów do obliczenia $(A^{[0]} (x) - (A (x) A^{[0]} (x) - 1) A^{[0]} (x))$ to złożoność tego algorytmu wynosić będzie $O (n \log n)$ . Możemy teraz skonstruować algorytm wykonujący dzielenie wielomianu $A (x)$ przez wielomian $B (x)$ w czasie $O (m \log m)$ , gdzie $m$ to stopień wielomianu $A (x)$ .

Algorytm Algorytm dzielenia wielomianów

 PODZIEL(A(x), B(x))
   $A^{R} (z) = z^{m} A (\frac{1}{z})$ 
   $B^{R} (z) = z^{n} B (\frac{1}{z})$ 
   $(B^{R} (z)^{- 1}) (z) =$ ODWROTNOŚĆ $(B^{R} (z), m - n - 1)$ 
   $D^{R} (z) = A^{R} (x) {(B^{R} (z))}^{- 1} mod z^{m - n - 1}$ 
   $D (x) = z^{m - n - 1} D^{R} (\frac{1}{x})$ 
   $R (x) = A (x) - D (x) B (x)$ 
  return  $(D (x), R (x))$

Zaawansowane algorytmy i struktury danych/Wykład 4: Różnice pomiędzy wersjami

Wersja z 16:03, 1 sie 2006

Spis treści

Abstrakt

Mnożenie wielomianów w punktach

Szybka transformata Fouriera (STF)

Odwrotna transformata Fouriera

Dzielenie wielomianów

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia

@@ Linia 1: / Linia 1: @@
 == Abstrakt ==
-Naturalna metoda dodawania dwóch wielomianów wymaga czasu
+Naturalna metoda dodawania dwóch wielomianów wymaga czasu <math>\Theta(n)</math>, natomiast prosty algorytm mnożenia dwóch wielomianów stopnia <math>n</math> wymaga czasu <math>\Theta(n^2)</math>. W wykładzie tym pokażemy, jak z wykorzystaniem szybkiej transformaty Fouriera (STF), wykonać wszystkie podstawowe operacje na wielomianach w czasie większym niż <math>\Theta(n)</math> o czynnik polilogarytmiczny. Na wykładzie pokażemy jak dla wielomianów stopnia <math>n</math>:
-<math>\Theta(n)</math>, natomiast prosty algorytm mnożenia dwóch
-wielomianów stopnia <math>n</math> wymaga czasu
-<math>\Theta(n^2)</math>. W wykładzie tym pokażemy, jak z
-wykorzystaniem szybkiej transformaty Fouriera (STF), wykonać wszystkie
-podstawowe operacje na wielomianach w czasie większym niż
-<math>\Theta(n)</math> o czynnik polilogarytmiczny. Na wykładzie pokażemy jak dla
-wielomianów stopnia <math>n</math>:
 * mnożyć je w czasie <math>O(n \log n)</math>,
 * dzielić wielomiany w czasie <math>O(n \log n)</math>.
 Natomiast jako ćwiczenie zostanie nam pokazanie jak wykorzystać te algorytmy do
 * obliczania wielomianu interpolacyjnegi w czasie <math>O(n \log^2 n)</math>,
 * obliczania wartości wielomianu w <math>n</math> punktach w czasie <math>O(n \log^2 n)</math>.
@@ Linia 18: / Linia 11: @@
 == Mnożenie wielomianów w punktach ==
-Niech <math>A(x) = \sum_{i=0}^{n-1} a_i x^i</math> i
+Niech <math>A(x) = \sum_{i=0}^{n-1} a_i x^i</math> i <math>B(x) = \sum_{i=0}^{n-1} b_i x^i</math> będą wielomianami stopnia <math>n</math> nad ciałem <math>F</math>. Wielomiany te możemy jednoznaczne reprezentować poprzez ich wartości w <math>n</math> punktach. Następujące twierdzenie zostało sformułowane w ramach wykładu z Metod Numerycznych.
-<math>B(x) = \sum_{i=0}^{n-1} b_i x^i</math> będą
-wielomianami stopnia <math>n</math> nad ciałem <math>F</math>.
-Wielomiany te możemy jednoznaczne reprezentować poprzez ich
-wartości w <math>n</math> punktach. Następujące twierdzenie zostało
-sformułowane w ramach wykładu z Metod Numerycznych.
-{{twierdzenie|[Twierdzenie o interpolacji
+{{twierdzenie|[Twierdzenie o interpolacji wielomianów]|interpolacja|Dla dowolnego zbioru <math>n</math> par <math>X = \{(x_0, y_0), (x_1, y_1), \ldots, (x_{n-1},y_{n-1})\}</math> takiego, że wszystkie wartości <math>x_i</math> są parami różne, istnieje jedyny wielomian <math>C(x)</math> stopnia <math>n</math> taki, że <math>C(x_i) = y_i</math> dla <math>i = 0,1,\ldots, n-1.</math>
-wielomianów]|interpolacja|Dla dowolnego zbioru <math>n</math> par <math>X = \{(x_0, y_0), (x_1, y_1), \ldots, (x_{n-1},y_{n-1})\}</math> takiego, że wszystkie wartości <math>x_i</math> są parami różne, istnieje jedyny wielomian <math>C(x)</math> stopnia <math>n</math> taki, że <math>C(x_i) = y_i</math> dla <math>i = 0,1,\ldots, n-1.</math>
 }}
-Niech <math>X</math> będzie ustalonym zbiorem parami różnych punktów
+Niech <math>X</math> będzie ustalonym zbiorem parami różnych punktów <math>x_0, \ldots, x_{2n-1} \in F</math>. Dla tego zbioru punktów możemy wyznaczyć zbiory wartości wielomianów:
-<math>x_0, \ldots, x_{2n-1} \in F</math>. Dla tego zbioru punktów
-możemy wyznaczyć zbiory wartości wielomianów:
@@ Linia 42: / Linia 27: @@
-Niech <math>C</math> będzie wynikiem mnożenia
+Niech <math>C</math> będzie wynikiem mnożenia wielomianów <math>A</math> i <math>B</math>, mamy wtedy
-wielomianów <math>A</math> i <math>B</math>, mamy wtedy
@@ Linia 51: / Linia 35: @@
-Ponieważ stopień wielomianu <math>C</math> jest nie większy niż
+Ponieważ stopień wielomianu <math>C</math> jest nie większy niż <math>2n</math> to z [[ZASD Moduł 4#interpolacja| Twierdzenia o interpolacji]] zbiór wartości
-<math>2n</math> to z [[ZASD Moduł 4#interpolacja| Twierdzenia o interpolacji]] zbiór wartości
 <center>
-<math>X_{A\times B} = \{(x_0, A(x_0)B(x_0)), (x_1, A(x_1)B(x_1),
+<math>X_{A\times B} = \{(x_0, A(x_0)B(x_0)), (x_1, A(x_1)B(x_1), \ldots, (2x_{n-1}, A(x_{2n-1})B(x_{2n-1})) \}</math>,
-\ldots, (2x_{n-1}, A(x_{2n-1})B(x_{2n-1})) \}</math>,
 </center>
-jednoznacznie wyznacza wielomian <math>A \times B</math>. Mając
+jednoznacznie wyznacza wielomian <math>A \times B</math>. Mając zbiory <math>X_A</math> i <math>X_B</math> możemy wyznaczyć zbiór <math>X_C</math> w czasie <math>O(n)</math>. Procedura ta jest przedstawiona na następującym rysunku:
-zbiory <math>X_A</math> i <math>X_B</math> możemy wyznaczyć zbiór
-<math>X_C</math> w czasie <math>O(n)</math>. Procedura ta jest
-przedstawiona na następującym rysunku:
@@ Linia 72: / Linia 51: @@
+Jednak aby ostatecznie otrzymać szybszy algorytm niż algorytm naiwny musimy pokazać jak rozwiązać problem obliczania wartości wielomianu w <math>n</math> punktach w czasie szybszym niż <math>\Theta(n^2)</math>. Podobnie musimy umieć obliczać wielomian interpolacyjny dla danego zbioru punktów.
-Jednak aby ostatecznie otrzymać szybszy algorytm niż algorytm naiwny
-musimy pokazać jak rozwiązać problem obliczania wartości wielomianu
-w <math>n</math> punktach w czasie szybszym niż
-<math>\Theta(n^2)</math>. Podobnie musimy umieć obliczać wielomian
-interpolacyjny dla danego zbioru punktów.
 == Szybka transformata Fouriera (STF) ==
@@ Linia 112: / Linia 80: @@
 Widzimy teraz, że problem ewaluacji wielomianu <math>A(x)</math> w punktach <math>\omega_n^0, \omega_n^1,\ldots, \omega_n^{n-1}</math> sprowadza się do:
-* ewaluacji wielomianów <math>A^{[0]}(x)</math> i <math>A^{[1]}(x)</math>
+* ewaluacji wielomianów <math>A^{[0]}(x)</math> i <math>A^{[1]}(x)</math> w punktach
-w punktach
@@ Linia 131: / Linia 98: @@
-Możemy teraz zauważyć, że zachodzi <math>x_i^2 = x_{i+\frac{n}{2}}^2</math>, a więc <math>X' =
+Możemy teraz zauważyć, że zachodzi <math>x_i^2 = x_{i+\frac{n}{2}}^2</math>, a więc <math>X' = X_{\frac{n}{2}}</math>. Udało nam się więc zredukować problem rozmiaru <math>n</math> - obliczenia wartości wielomianu <math>A(x)</math> stopnia <math>n</math> w <math>n</math> punktach, do dwóch problemów rozmiaru <math>\frac{n}{2}</math> - obliczenia wartości wielomianów <math>A^{[0]}(x)</math> i <math>A^{[1]}(x)</math> stopnia <math>\frac{n}{2}</math> w <math>\frac{n}{2}</math> punktach. Możemy teraz zastosować tą technikę rekurencyjne otrzymując następujący algorytm.
-X_{\frac{n}{2}}</math>. Udało nam się więc zredukować problem rozmiaru <math>n</math> - obliczenia wartości wielomianu <math>A(x)</math> stopnia <math>n</math> w <math>n</math> punktach, do dwóch problemów rozmiaru <math>\frac{n}{2}</math> - obliczenia wartości wielomianów <math>A^{[0]}(x)</math> i <math>A^{[1]}(x)</math> stopnia <math>\frac{n}{2}</math> w <math>\frac{n}{2}</math> punktach. Możemy teraz zastosować tą technikę rekurencyjne otrzymując następujący algorytm.
 {{algorytm|Algorytm Szybkiej Transformaty Fouriera|algorytm_fft|
@@ Linia 154: / Linia 120: @@
 }}
-Algorytm ten najpierw oblicza SFT wielomianów
+Algorytm ten najpierw oblicza SFT wielomianów <math>A^{[0]}(x)</math> i <math>A^{[1]}(x)</math> a następnie łączy te wyniki w celu wyliczenia SFT dla wielomianu <math>A(x)</math>. Przeanalizujmy teraz wykonanie pętli. Zauważmy najpierw, że w <math>k</math>'tym  kroku pętli mamy <math>\omega = \omega_n^k = e^{\frac{2\pi i k}{n}} = x_k.</math>. Czyli:
-<math>A^{[0]}(x)</math> i <math>A^{[1]}(x)</math> a następnie łączy
-te wyniki w celu wyliczenia SFT dla wielomianu <math>A(x)</math>.
-Przeanalizujmy teraz wykonanie pętli. Zauważmy najpierw, że w
-<math>k</math>'tym  kroku pętli mamy <math>\omega = \omega_n^k
-= e^{\frac{2\pi i k}{n}} = x_k.</math>. Czyli:
 <center><math>
-y_k = y_k^{[0]} + x_k y_k^{[1]} = A^{[0]}(e^{\frac{2\pi i k}{n/2}}) +
+y_k = y_k^{[0]} + x_k y_k^{[1]} = A^{[0]}(e^{\frac{2\pi i k}{n/2}}) + x_k A^{[1]}(e^{\frac{2\pi i k}{n/2}}) =
-x_k A^{[1]}(e^{\frac{2\pi i k}{n/2}}) =
 </math></center>
 <center><math>
-= A^{[0]} \left(\left(e^{\frac{2\pi i k}{n}}\right)^2\right) +
+= A^{[0]} \left(\left(e^{\frac{2\pi i k}{n}}\right)^2\right) + x_k A^{[1]}\left(\left(e^{\frac{2\pi i k}{n}}\right)^2\right) = A^{[0]}(x_k^2) + x_k A^{[1]}(x_k^2) = A(x_k),
-x_k A^{[1]}\left(\left(e^{\frac{2\pi i k}{n}}\right)^2\right)
-= A^{[0]}(x_k^2) +
-x_k A^{[1]}(x_k^2) = A(x_k),
 </math></center>
@@ Linia 178: / Linia 135: @@
 <center><math>
-y_{k+\frac{n}{2}} = y_k^{[0]} - x_k y_k^{[1]}
+y_{k+\frac{n}{2}} = y_k^{[0]} - x_k y_k^{[1]} = A^{[0]}(e^{\frac{2\pi i k}{n/2}}) - e^{\frac{2\pi i k}{n}} A^{[1]}(e^{\frac{2\pi i k}{n/2}}) =
-= A^{[0]}(e^{\frac{2\pi i k}{n/2}}) -
-e^{\frac{2\pi i k}{n}} A^{[1]}(e^{\frac{2\pi i k}{n/2}}) =
 </math></center>
 <center><math>
-= A^{[0]}(e^{\frac{2\pi i (k + n/2)}{n/2}}) +
+= A^{[0]}(e^{\frac{2\pi i (k + n/2)}{n/2}}) + e^{\frac{2\pi i k + n/2}{n}} A^{[1]}(e^{\frac{2\pi i (k + n/2)}{n/2}}) = A^{[0]}(x_{k + n/2}^2) + x_{k + n/2}^2 A^{[1]}(x_{k + n/2}^2) = A(x_{k+\frac{n}{2}}).
-e^{\frac{2\pi i k + n/2}{n}} A^{[1]}(e^{\frac{2\pi i (k + n/2)}{n/2}})
-= A^{[0]}(x_{k + n/2}^2) +
-x_{k + n/2}^2 A^{[1]}(x_{k + n/2}^2)
-= A(x_{k+\frac{n}{2}}).
 </math></center>
-Gdzie w ostatniej równości skorzystaliśmy ze wzoru
+Gdzie w ostatniej równości skorzystaliśmy ze wzoru [[ZASD Moduł 4#wzor_1|(1)]]. Widzimy zatem, że algorytm poprawnie oblicza wartość STF dla wielomianu <math>A(x)</math>. Równanie rekurencyjne na czas działania procedury STF wygląda następująco:
-[[ZASD Moduł 4#wzor_1|(1)]]. Widzimy zatem, że algorytm poprawnie oblicza
-wartość STF dla wielomianu <math>A(x)</math>. Równanie rekurencyjne
-na czas działania procedury STF wygląda następująco:
@@ Linia 203: / Linia 151: @@
 === Odwrotna transformata Fouriera ===
-Aby zakończyć konstrukcję algorytmu dla szybkiego mnożenia
-wielomianów pozostaje nam pokazanie jak obliczyć wielomian
+Aby zakończyć konstrukcję algorytmu dla szybkiego mnożenia wielomianów pozostaje nam pokazanie jak obliczyć wielomian interpolujący dla zbioru punktów <math>X_n</math>. Obliczenie wykonane w czasie szybkiej transformaty Fouriera możemy przedstawić w postaci macierzowej jako mnożenie macierzy przez wektor <math>(A(x_0), A(x_1), \ldots, A(x_{n-1}))^T = V_n (a_0, a_1, \ldots, a_{n-1})^T</math>, gdzie <math>V_n = V(x_0,\ldots,x_{n-1})</math> jest macierzą Vandermonde'a zawierającą potęgi <math>x_j</math>
-interpolujący dla zbioru punktów <math>X_n</math>. Obliczenie
-wykonane w czasie szybkiej transformaty Fouriera możemy przedstawić
-w postaci macierzowej jako mnożenie macierzy przez wektor
-<math>(A(x_0), A(x_1), \ldots, A(x_{n-1}))^T = V_n (a_0, a_1,
-\ldots, a_{n-1})^T</math>, gdzie <math>V_n = V(x_0,\ldots,x_{n-1})</math> jest macierzą
-Vandermonde'a zawierającą potęgi <math>x_j</math>
@@ Linia 263: / Linia 205: @@
 </center>
-W celu wykonania operacji odwrotnej do SFT, czyli obliczenia wielomianu
+W celu wykonania operacji odwrotnej do SFT, czyli obliczenia wielomianu interpolacyjnego, musimy wykonać mnożenie <math>V_n^{-1} (A(x_0), A(x_1), \ldots, A(x_{n-1}))^T</math>.
-interpolacyjnego, musimy wykonać mnożenie
-<math>V_n^{-1} (A(x_0), A(x_1), \ldots, A(x_{n-1}))^T</math>.
-{{lemat|||
+{{lemat|||Niech macierz <math>W_n</math> będzie zdefiniowana jako
-Niech macierz <math>W_n</math> będzie zdefiniowana jako
@@ Linia 278: / Linia 217: @@
 jest macierzą odwrotną do macierzy <math>V_n</math>.
 }
-{{dowod|||
+{{dowod|||Pokażemy, że <math>V_n W_n = I</math>. Rozważmy pozycję <math>(j,k)</math> macierzy <math>V_n W_n</math>:
-Pokażemy, że <math>V_n W_n = I</math>. Rozważmy pozycję <math>(j,k)</math>
-macierzy <math>V_n W_n</math>:
@@ Linia 290: / Linia 227: @@
-Jeżeli <math>j=k</math> to <math>e^{\frac{2\pi k(j-k)}{n}} =
+Jeżeli <math>j=k</math> to <math>e^{\frac{2\pi k(j-k)}{n}} = 1</math> i suma ta jest równa <math>1</math>. W przeciwnym przypadku możemy skorzystać ze wzoru na sumę szeregu geometrycznego:
-</math> i suma ta jest równa <math>1</math>. W przeciwnym przypadku
-możemy skorzystać ze wzoru na sumę szeregu geometrycznego:
@@ Linia 306: / Linia 241: @@
 }}
-Porównując postać macierzy <math>V_n</math> oraz macierzy <math>W_n</math>
+Porównując postać macierzy <math>V_n</math> oraz macierzy <math>W_n</math> widzimy, że w celu obliczenia transformaty odwrotnej możemy użyć [[ZASD Moduł 4#algorytm_fft|Algorytmu Szybkiej Transformaty Fouriera]], musimy tylko zamienić linijkę <math>\omega_m = e^{\frac{2\pi i}{n}}</math> na <math>\omega_m = e^{-\frac{2\pi i}{n}}</math> i podzielić otrzymany wynik przez <math>n</math>.
-widzimy, że w celu obliczenia transformaty odwrotnej możemy użyć
-[[ZASD Moduł 4#algorytm_fft|Algorytmu Szybkiej Transformaty Fouriera]], musimy
-tylko zamienić linijkę <math>\omega_m = e^{\frac{2\pi i}{n}}</math> na
-<math>\omega_m = e^{-\frac{2\pi i}{n}}</math> i podzielić otrzymany wynik
-przez <math>n</math>.
 == Dzielenie wielomianów ==
-W tej części wykładu skupimy się na problemie dzielenia dwóch
+W tej części wykładu skupimy się na problemie dzielenia dwóch wielomianów. Niech <math>A(x)</math> będzie wielomianem stopnia <math>m</math> a <math>B(x)</math> wielomianem stopnie <math>n</math>. Zakładamy bez straty ogólności, że <math>b_{n-1}\neq 0</math>. W problemie dzielenia wielomianów, chcemy obliczyć dwa wielomiany <math>D(x)</math> i <math>R(x)</math> takie, że
-wielomianów. Niech <math>A(x)</math> będzie wielomianem stopnia
-<math>m</math> a <math>B(x)</math> wielomianem stopnie
-<math>n</math>. Zakładamy bez straty ogólności, że <math>b_{n-1}\neq
-</math>. W problemie dzielenia wielomianów, chcemy obliczyć dwa
-wielomiany <math>D(x)</math> i <math>R(x)</math> takie, że
 {{wzor|wzor_2|2|<math>A(x) = D(x) B(x)  + R(x),</math>}}
-oraz stopień wielomianu <math>R(x)</math> jest ostro mniejszy niż
+oraz stopień wielomianu <math>R(x)</math> jest ostro mniejszy niż <math>n</math>. Wielomian <math>D(x)</math> nazywamy {{def|wynikiem dzielenia|}, a wielomian <math>R(x)</math> to {{def|reszta z dzielenia|}. Pierwszy pomysł jaki się od razu nasuwa, to spróbować policzyć odwrotność wielomianu <math>B(x)</math> i przemnożenie przez tą odwrotność stronami tego równania. Niestety wielomiany nie mają niestety odwrotności będących wielomianami. Jednak nie pozostajemy tutaj zupełnie bezradni. Możemy rozszerzyć naszą dziedzinę obliczeń tak aby zagwarantować istnienie pewnych odwrotności.
-<math>n</math>. Wielomian <math>D(x)</math> nazywamy {{def|wynikiem
-dzielenia|}, a wielomian <math>R(x)</math> to {{def|reszta z
-dzielenia|}. Pierwszy pomysł jaki się od razu nasuwa, to spróbować
-policzyć odwrotność wielomianu <math>B(x)</math> i przemnożenie
-przez tą odwrotność stronami tego równania. Niestety wielomiany nie
-mają niestety odwrotności będących wielomianami. Jednak nie pozostajemy
-tutaj zupełnie bezradni. Możemy rozszerzyć naszą dziedzinę obliczeń
-tak aby zagwarantować istnienie pewnych odwrotności.
-Obliczenia będziemy wykonywać nad zbiorem szeregów formalnych
+Obliczenia będziemy wykonywać nad zbiorem szeregów formalnych <math>F[[x]]</math> nad ciałem <math>F</math>, patrz [[Matematyka_dyskretna#szeregi formalne| Wykład z matematyki dyskretnej]]. Dla części elementów <math>F[[x]]</math> istnieją odwrotności. Elementy te są postaci <math>a + x A(x)</math> gdzie <math>a\neq 0</math> i <math>A(x) \in F[[x]]</math>.
-<math>F[[x]]</math> nad ciałem <math>F</math>, patrz
-[[Matematyka_dyskretna#szeregi formalne| Wykład z matematyki
-dyskretnej]]. Dla części elementów <math>F[[x]]</math> istnieją
-odwrotności. Elementy te są postaci <math>a + x A(x)</math> gdzie
-<math>a\neq 0</math> i <math>A(x) \in F[[x]]</math>.
@@ Linia 366: / Linia 278: @@
-gdzie <math>A^R(z) = z^m A(\frac{1}{z})</math>, <math>D^R(z) =
+gdzie <math>A^R(z) = z^m A(\frac{1}{z})</math>, <math>D^R(z) = z^{m-n} D(\frac{1}{z})</math>, <math>B^R(z) = z^{n} B(\frac{1}{z})</math> i <math>R^R(z) = z^{n-1} R(\frac{1}{z})</math>, oznaczają wielomiany otrzymane poprzez odwrócenie kolejności współczynników. Z założenia, że <math>b_{n-1}\neq 0 </math> wiemy, że wielomian <math>B^R</math> ma odwrotność nad zbiorem szeregów formalnych. Możemy zapisać więc:
-z^{m-n} D(\frac{1}{z})</math>, <math>B^R(z) = z^{n}
-B(\frac{1}{z})</math> i <math>R^R(z) = z^{n-1}
-R(\frac{1}{z})</math>, oznaczają wielomiany otrzymane poprzez
-odwrócenie kolejności współczynników. Z założenia, że
-<math>b_{n-1}\neq 0 </math> wiemy, że wielomian <math>B^R</math> ma
-odwrotność nad zbiorem szeregów formalnych. Możemy zapisać więc:
@@ Linia 379: / Linia 285: @@
 </math></center>
-Zauważmy, że w celu wyznaczenia <math>D^R(z)</math> potrzebujemy
+Zauważmy, że w celu wyznaczenia <math>D^R(z)</math> potrzebujemy tylko <math>m-n-1</math> wyrazów szeregu <math>\left(B^R(z)\right)^{-1}</math>. Wyższe wyrazy i tak znikną w wyniku wykonania mnożenia modulo <math>z^{m-n-1}</math>. Pozostało nam teraz tylko pokazać jak wyznaczyć odwrotność dla szeregu formalnego. Algorytm ten przedstawiony jest poniżej
-tylko <math>m-n-1</math> wyrazów szeregu
-<math>\left(B^R(z)\right)^{-1}</math>. Wyższe wyrazy i tak znikną w
-wyniku wykonania mnożenia modulo <math>z^{m-n-1}</math>. Pozostało
-nam teraz tylko pokazać jak wyznaczyć odwrotność dla szeregu
-formalnego. Algorytm ten przedstawiony jest poniżej
@@ Linia 404: / Linia 305: @@
-a to jest równe wielokrotności <math>x^{2m}</math>, a więc jest
+a to jest równe wielokrotności <math>x^{2m}</math>, a więc jest także wielokrotnością <math>x^{n}</math>. Jeżeli wykorzystamy szybkie mnożenie wielomianów do obliczenia <math>(A^{[0]}(x) -(A(x) A^{[0]}(x) -1)A^{[0]}(x))</math> to złożoność tego algorytmu wynosić będzie <math>O(n\log n)</math>. Możemy teraz skonstruować algorytm wykonujący dzielenie wielomianu <math>A(x)</math> przez wielomian <math>B(x)</math> w czasie <math>O(m \log m)</math>, gdzie <math>m</math> to stopień wielomianu <math>A(x)</math>.
-także wielokrotnością <math>x^{n}</math>. Jeżeli wykorzystamy
-szybkie mnożenie wielomianów do obliczenia <math>(A^{[0]}(x) -(A(x)
-A^{[0]}(x) -1)A^{[0]}(x))</math> to złożoność tego algorytmu wynosić
-będzie <math>O(n\log n)</math>. Możemy teraz skonstruować algorytm
-wykonujący dzielenie wielomianu <math>A(x)</math> przez wielomian
-<math>B(x)</math> w czasie <math>O(m \log m)</math>, gdzie
-<math>m</math> to stopień wielomianu <math>A(x)</math>.