MN09: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Przykry (dyskusja | edycje)
m MN Wykład 9 moved to MN09
Dorota (dyskusja | edycje)
Nie podano opisu zmian
Linia 5: Linia 5:
nagminnie w najróżniejszych dziedzinach życia, np.
nagminnie w najróżniejszych dziedzinach życia, np.
* Na podstawie próbki sygnału dźwiękowego (to znaczy: ciągu wartości
* Na podstawie próbki sygnału dźwiękowego (to znaczy: ciągu wartości
amplitud sygnału zmierzonych w kolejnych odstępach czasu), odtworzyć jego przebieg.
amplitud sygnału zmierzonych w kolejnych odstępach czasu) odtwarzanie jego przebiegu.
* Przybliżyć wykres skomplikowanej (lub wręcz nieznanej) funkcji na
* Przybliżanie wykresu skomplikowanej (lub wręcz nieznanej) funkcji na
podstawie jej wartości uprzednio stablicowanych w wybranych punktach
podstawie jej wartości uprzednio stablicowanych w wybranych punktach
* Interpolację stosuje się szczególnie chętnie w samej numeryce. Na przykład, idea
* Interpolację stosuje się szczególnie chętnie w samej numeryce. Na przykład idea
metody siecznych polega na tym, by funkcję, której miejsca zerowego szukamy,
metody siecznych polega na tym, by funkcję, której miejsca zerowego szukamy,
przybliżyć prostą interpolującą tę funkcję w dwóch punktach. Metody numerycznego
przybliżyć prostą interpolującą tę funkcję w dwóch punktach. Metody numerycznego
Linia 16: Linia 16:
Niech <math>\displaystyle D\subsetR</math> i niech <math>\displaystyle F</math> będzie pewnym zbiorem funkcji  
Niech <math>\displaystyle D\subsetR</math> i niech <math>\displaystyle F</math> będzie pewnym zbiorem funkcji  
<math>\displaystyle f:D\toR</math>. Niech <math>\displaystyle x_0,x_1,\ldots,x_n</math> będzie ustalonym zbiorem  
<math>\displaystyle f:D\toR</math>. Niech <math>\displaystyle x_0,x_1,\ldots,x_n</math> będzie ustalonym zbiorem  
parami różnych punktów z <math>\displaystyle D</math>, zwanych później <strong>węzłami</strong>.  
parami różnych punktów z <math>\displaystyle D</math> zwanych później <strong>węzłami</strong>.  


Powiemy, że wielomian <math>\displaystyle w</math> <strong>interpoluje</strong> funkcję <math>\displaystyle f\in F</math>  
Powiemy, że wielomian <math>\displaystyle w</math> <strong>interpoluje</strong> funkcję <math>\displaystyle f\in F</math>  
Linia 31: Linia 31:
</math></center>
</math></center>


Zadanie znalezienia wielomianu interpolującego zadane wartości, nazywamy
Zadanie znalezienia wielomianu interpolującego zadane wartości nazywamy
zadaniem interpolacji Lagrange'a.
zadaniem interpolacji Lagrange'a.


Linia 86: Linia 86:
istnieje i jest wyznaczone jednoznacznie. Zauważmy, że wielomian  
istnieje i jest wyznaczone jednoznacznie. Zauważmy, że wielomian  
interpolacyjny <math>\displaystyle w_f</math> jako taki nie może być wynikiem obliczeń w naszym  
interpolacyjny <math>\displaystyle w_f</math> jako taki nie może być wynikiem obliczeń w naszym  
modelu obliczeniowym, możemy natomiast wyznaczyć jego współczynniki  
modelu obliczeniowym. Możemy natomiast wyznaczyć jego współczynniki  
<math>\displaystyle c_j</math> w wybranej bazie.  
<math>\displaystyle c_j</math> w wybranej bazie.  


Linia 106: Linia 106:
Danymi w zadaniu interpolacji są zarówno wartości interpolowanej funkcji, jak i
Danymi w zadaniu interpolacji są zarówno wartości interpolowanej funkcji, jak i
węzły interpolacji.  Traktując węzły jako sztywno zadane parametry
węzły interpolacji.  Traktując węzły jako sztywno zadane parametry
zadania i dopuszczając jedynie zaburzenia wartości funkcji, można pokazać, że
zadania i dopuszczając jedynie zaburzenia wartości funkcji, możemy pokazać, że
jeśli zamiast <math>\displaystyle f</math> rozpatrzyć jej zaburzenie <math>\displaystyle f+\Delta f</math>, gdzie <math>\displaystyle |\Delta f| \leq
jeśli zamiast <math>\displaystyle f</math> rozpatrzyć jej zaburzenie <math>\displaystyle f+\Delta f</math>, gdzie <math>\displaystyle |\Delta f| \leq
\epsilon</math>, to  
\epsilon</math>, to  
Linia 123: Linia 123:
układu równań liniowych. Okazuje się, że w zależności od <strong>wyboru sposobu
układu równań liniowych. Okazuje się, że w zależności od <strong>wyboru sposobu
reprezentacji</strong> naszego wielomianu (czyli od wyboru bazy wielomianowej  <math>\displaystyle (\varphi_j)_{j=0}^n</math>), układ
reprezentacji</strong> naszego wielomianu (czyli od wyboru bazy wielomianowej  <math>\displaystyle (\varphi_j)_{j=0}^n</math>), układ
ten może być albo bardzo łatwy do rozwiązania, albo --- bardzo trudny. Co
ten może być albo bardzo łatwy do rozwiązania, albo bardzo trudny. Co
więcej, jego rozwiązanie w arytmetyce <math>\displaystyle fl_\nu</math> może napotykać na większe bądź
więcej, jego rozwiązanie w arytmetyce <math>\displaystyle fl_\nu</math> może napotykać na większe bądź
mniejsze trudności (w zależności np. od uwarunkowania macierzy układu, który
mniejsze trudności (w zależności np. od uwarunkowania macierzy układu, który
Linia 147: Linia 147:
</math></center>
</math></center>


Stąd łatwo widać, że wielomiany te stanowią bazę w <math>\displaystyle \Pi_n</math>,  
Teraz widać, że wielomiany te stanowią bazę w <math>\displaystyle \Pi_n</math>,  
którą nazywamy bazą Lagrange'a. Macierz układu zadania interpolacji  
którą nazywamy bazą Lagrange'a. Macierz układu zadania interpolacji  
jest w takim wypadku identycznością i w konsekwencji <math>\displaystyle c_j=f(x_j)</math>, <math>\displaystyle \forall j</math>.  
jest w takim wypadku identycznością i w konsekwencji <math>\displaystyle c_j=f(x_j)</math>, <math>\displaystyle \forall j</math>.  
Linia 179: Linia 179:


gdzie <math>\displaystyle q_j(x)=w_j/(x-x_j)</math>. W ostatniej równości wykorzystaliśmy fakt,  
gdzie <math>\displaystyle q_j(x)=w_j/(x-x_j)</math>. W ostatniej równości wykorzystaliśmy fakt,  
że <math>\displaystyle p_n(x)\equiv (\sum_{j=0}^n q_j(x))^{-1}</math>, co łatwo widzieć, rozpatrując
że <math>\displaystyle p_n(x)\equiv (\sum_{j=0}^n q_j(x))^{-1}</math>, co można łatwo zobaczyć rozpatrując
zadanie interpolacji funkcji <math>\displaystyle f\equiv 1</math>. Drugi wzór barycentryczny jest korzystniejszy w implementacji.
zadanie interpolacji funkcji <math>\displaystyle f\equiv 1</math>. Drugi wzór barycentryczny jest korzystniejszy w implementacji.


Linia 200: Linia 200:
gdzie <math>\displaystyle |\epsilon_j| \leq 5(n+1)</math>, a więc jest to algorytm numerycznie poprawny.
gdzie <math>\displaystyle |\epsilon_j| \leq 5(n+1)</math>, a więc jest to algorytm numerycznie poprawny.
Zachowanie drugiej postaci wzoru barycentrycznego w arytmetyce <math>\displaystyle fl_\nu</math> jest nieco
Zachowanie drugiej postaci wzoru barycentrycznego w arytmetyce <math>\displaystyle fl_\nu</math> jest nieco
bardziej skomplikowane, ale w typowych zadaniach .
bardziej skomplikowane w typowych zadaniach.


====Baza potęgowa (naturalna)====
====Baza potęgowa (naturalna)====
Linia 231: Linia 231:
bo jego produktem ubocznym mogą być także wartości pochodnych naszego wielomianu w <math>\displaystyle x</math>.
bo jego produktem ubocznym mogą być także wartości pochodnych naszego wielomianu w <math>\displaystyle x</math>.
Algorytm Hornera okazuje się optymalny. Każdy  
Algorytm Hornera okazuje się optymalny. Każdy  
inny algorytm obliczający dokładną wartość wielomianu znając
inny algorytm znając współczynniki wielomianu obliczający jego dokładną wartość wymaga wykonania co najmniej <math>\displaystyle n</math> mnożeń i <math>\displaystyle n</math>  
jego współczynniki wymaga wykonania co najmniej <math>\displaystyle n</math> mnożeń i <math>\displaystyle n</math>  
dodawań. Algorytm Hornera jest też numerycznie poprawny.
dodawań. Algorytm Hornera jest też numerycznie poprawny.


Linia 238: Linia 237:
<math>\displaystyle (x_i^j)_{i,j=0}^n</math> układu zadania interpolacji jest pełna. Jest to tzw.  
<math>\displaystyle (x_i^j)_{i,j=0}^n</math> układu zadania interpolacji jest pełna. Jest to tzw.  
<strong>macierz Vandermonde'a</strong>. Obliczenie współczynników wielomianu  
<strong>macierz Vandermonde'a</strong>. Obliczenie współczynników wielomianu  
interpolacyjnego w bazie potęgowej bezpośrednio z tego układu, stosując  
interpolacyjnego w bazie potęgowej bezpośrednio z tego układu stosując  
jedną ze znanych nam już metod, kosztowałoby rzędu <math>\displaystyle n^3</math> operacji  
jedną ze znanych nam już metod kosztowałoby rzędu <math>\displaystyle n^3</math> operacji  
arytmetycznych. Co gorsza, w często spotykanym przypadku, gdy węzły interpolacji
arytmetycznych. Co gorsza, w często spotykanym przypadku, gdy węzły interpolacji
są równoodległe, ta macierz jest bardzo źle uwarunkowana!
są równoodległe, ta macierz jest bardzo źle uwarunkowana!
Linia 247: Linia 246:
Rozwiązaniem pośrednim, które łączy prostotę obliczenia  
Rozwiązaniem pośrednim, które łączy prostotę obliczenia  
współczynników z prostotą obliczenia wartości <math>\displaystyle w_f(x)</math> i ewentualnie jego
współczynników z prostotą obliczenia wartości <math>\displaystyle w_f(x)</math> i ewentualnie jego
pochodnych
pochodnych,
jest wybór bazy Newtona,  
jest wybór bazy Newtona,  


Linia 268: Linia 267:
</math></center>
</math></center>


Wartość <math>\displaystyle w_f(x)</math> można obliczyć stosując prostą modyfikację  
Wartość <math>\displaystyle w_f(x)</math> możemy obliczyć, stosując prostą modyfikację  
algorytmu Hornera:
algorytmu Hornera:


Linia 316: Linia 315:
</math></center>
</math></center>


Aby ją pokazać wystarczy, że prawa strona tej równości, którą   
Aby ją pokazać, wystarczy że prawa strona tej równości, którą   
oznaczymy przez <math>\displaystyle v(x)</math>, przyjmuje wartości <math>\displaystyle f(x_s)</math> dla <math>\displaystyle x=x_s</math>,  
oznaczymy przez <math>\displaystyle v(x)</math>, przyjmuje wartości <math>\displaystyle f(x_s)</math> dla <math>\displaystyle x=x_s</math>,  
<math>\displaystyle i\le s\le j</math>. Rzeczywiście, jeśli <math>\displaystyle i+1\le s\le j-1</math> to
<math>\displaystyle i\le s\le j</math>. Rzeczywiście, jeśli <math>\displaystyle i+1\le s\le j-1</math> to
Linia 360: Linia 359:
}}
}}


Różnicę dzieloną <math>\displaystyle f(x_0,x_1,\ldots,x_n)</math> można łatwo  
Różnicę dzieloną <math>\displaystyle f(x_0,x_1,\ldots,x_n)</math> możemy łatwo  
obliczyć na podstawie wartości <math>\displaystyle f(x_j)</math>, <math>\displaystyle 0\le j\le n</math>,  
obliczyć na podstawie wartości <math>\displaystyle f(x_j)</math>, <math>\displaystyle 0\le j\le n</math>,  
budując następującą tabelkę:  
budując następującą tabelkę:  
Linia 373: Linia 372:
</math></center>
</math></center>


<div class="thumb tright"><div><flash>file=Interpolacja.swf</flash><div.thumbcaption>Wyznaczenie wielomianu <math>\displaystyle w</math>, interpolującego zestaw punktów <math>\displaystyle (0,2)\displaystyle (1,5)\displaystyle (-1,7)</math> algorytmem różnic dzielonych</div></div></div>
<div class="thumb tright"><div><flash>file=Interpolacja.swf</flash><div.thumbcaption>Wyznaczenie wielomianu <math>\displaystyle w</math> interpolującego zestaw punktów <math>\displaystyle (0,2)\displaystyle (1,5)\displaystyle (-1,7)</math> algorytmem różnic dzielonych</div></div></div>


Zauważmy przy tym, że "po drodze" obliczamy  
Zauważmy przy tym, że "po drodze" obliczamy  
<math>\displaystyle f(x_i,x_{i+1},\ldots,x_j)</math> dla wszystkich <math>\displaystyle 0\le i < j\le n</math>, a więc  
<math>\displaystyle f(x_i,x_{i+1},\ldots,x_j)</math> dla wszystkich <math>\displaystyle 0\le i < j\le n</math>, a więc  
w szczególności również interesujące nas różnice dzielone  
w szczególności również interesujące nas różnice dzielone  
<math>\displaystyle f(x_0,x_1,\ldots,x_j)</math>. Stąd i z Twierdzenia o różnicach dzielonych  
<math>\displaystyle f(x_0,x_1,\ldots,x_j)</math>. Stąd i z twierdzenia o różnicach dzielonych  
natychmiast wynika algorytm obliczania współczynników  
wynika algorytm obliczania współczynników  
<math>\displaystyle b_j</math> wielomianu interpolacyjnego w bazie Newtona.  
<math>\displaystyle b_j</math> wielomianu interpolacyjnego w bazie Newtona.  
Po wykonaniu następującego algorytmu,
Po wykonaniu następującego algorytmu,
Linia 395: Linia 394:
współczynniki <math>\displaystyle b_j</math> na końcu algorytmu zawierają wspólczynniki wielomianu
współczynniki <math>\displaystyle b_j</math> na końcu algorytmu zawierają wspólczynniki wielomianu
interpolacyjnego w bazie Newtona. Czy gdybyś zobaczył ten algorytm na samym
interpolacyjnego w bazie Newtona. Czy gdybyś zobaczył ten algorytm na samym
początku tego wykładu, to zgadłbyś, do czego może służyć?!
początku tego wykładu, zgadłbyś, do czego może służyć?!


<div class="thumb tright"><div><flash>file=Interpolacjainsitu.swf</flash><div.thumbcaption>Wyznaczenie tego samego wielomianu <math>\displaystyle w</math>, interpolującego zestaw punktów <math>\displaystyle (0,2)\displaystyle (1,5)\displaystyle (-1,7)</math> algorytmem różnic dzielonych --- wykonanym ''in situ''.</div></div></div>
<div class="thumb tright"><div><flash>file=Interpolacjainsitu.swf</flash><div.thumbcaption>Wyznaczenie tego samego wielomianu <math>\displaystyle w</math>, interpolującego zestaw punktów <math>\displaystyle (0,2)\displaystyle (1,5)\displaystyle (-1,7)</math> algorytmem różnic dzielonych --- wykonanym ''in situ''.</div></div></div>
Linia 454: Linia 453:


Uogólnimy również pojęcie różnicy dzielonej na węzły  
Uogólnimy również pojęcie różnicy dzielonej na węzły  
powtarzające się kładąc  
powtarzające się, kładąc  


<center><math>\displaystyle f(\bar x_i,\bar x_{i+1},\ldots,\bar x_j)\,=\,
<center><math>\displaystyle f(\bar x_i,\bar x_{i+1},\ldots,\bar x_j)\,=\,
Linia 528: Linia 527:
rozpatrzymy dwa przypadki.  
rozpatrzymy dwa przypadki.  


Jeśli <math>\displaystyle \bar x_0=\bar x_n</math> to mamy jeden węzeł <math>\displaystyle x_0</math>  
Jeśli <math>\displaystyle \bar x_0=\bar x_n</math>, to mamy jeden węzeł <math>\displaystyle x_0</math>  
o krotności <math>\displaystyle n+1</math>. Wielomian interpolacyjny jest wtedy postaci
o krotności <math>\displaystyle n+1</math>. Wielomian interpolacyjny jest wtedy postaci


Linia 535: Linia 534:


a stąd <math>\displaystyle b_n=f^{(n)}(x_0)//(n!)=f(\underbrace{x_0,\ldots,x_0}_{n+1})</math>.  
a stąd <math>\displaystyle b_n=f^{(n)}(x_0)//(n!)=f(\underbrace{x_0,\ldots,x_0}_{n+1})</math>.  
Jeśli zaś <math>\displaystyle \bar x_0\ne\bar x_j</math> to równość  
Jeśli zaś <math>\displaystyle \bar x_0\ne\bar x_j</math>, to równość  
<math>\displaystyle b_n\,=\,f(\bar x_0,\bar x_1,\ldots,\bar x_n)</math> wynika z wcześniej  
<math>\displaystyle b_n\,=\,f(\bar x_0,\bar x_1,\ldots,\bar x_n)</math> wynika z wcześniej  
wyprowadzonych wzorów oraz z założenia indukcyjnego.  
wyprowadzonych wzorów oraz z założenia indukcyjnego.  
Linia 558: Linia 557:


Gdy mamy do czynienia z funkcją, która jest  
Gdy mamy do czynienia z funkcją, która jest  
"skomplikowana" to często dobrze jest zastąpić ją  
"skomplikowana", często dobrze jest zastąpić ją  
funkcją "prostszą". Mówimy wtedy o <strong>aproksymacji   
funkcją "prostszą". Mówimy wtedy o <strong>aproksymacji   
(przybliżaniu) funkcji</strong>. Funkcję musimy również  
(przybliżaniu) funkcji</strong>. Funkcję musimy również  
aproksymać wtedy, gdy nie jesteśmy w stanie uzyskać  
aproksymać wtedy, gdy nie jesteśmy w stanie uzyskać  
pełnej o niej informacji. Na przykład, gdy funkcja  
pełnej o niej informacji. Na przykład, gdy funkcja  
reprezentuje pewien proces fizyczny to często zdarza się,  
reprezentuje pewien proces fizyczny, często zdarza się,  
że dysponujemy jedynie ciągiem próbek, czyli wartościami  
że dysponujemy jedynie ciągiem próbek, czyli wartościami  
tej funkcji w pewnych punktach. Jasne jest, że chcielibyśmy  
tej funkcji w pewnych punktach. Jasne jest, że chcielibyśmy  
Linia 691: Linia 690:
{{dowod|||
{{dowod|||
Oszacowanie górne wynika bezpośrednio  
Oszacowanie górne wynika bezpośrednio  
z Lematu o postaci błędu interpolacji, bowiem dla <math>\displaystyle f\in F^r_M([a,b])</math> mamy  
z lematu o postaci błędu interpolacji, bowiem dla <math>\displaystyle f\in F^r_M([a,b])</math> mamy  


<center><math>\displaystyle \aligned \|f-w_f\|_{ C([a,b])}&=\max_{a\le x\le b}|f(x)-w_f(x)| \\
<center><math>\displaystyle \aligned \|f-w_f\|_{ C([a,b])}&=\max_{a\le x\le b}|f(x)-w_f(x)| \\
Linia 734: Linia 733:
<math>\displaystyle e(F^r_M([a,b]);x_0,\ldots,x_r)</math> w istotny sposób  
<math>\displaystyle e(F^r_M([a,b]);x_0,\ldots,x_r)</math> w istotny sposób  
zależy od wyboru węzłów <math>\displaystyle x_j</math>. Naturalne jest więc  
zależy od wyboru węzłów <math>\displaystyle x_j</math>. Naturalne jest więc  
teraz następujące pytanie. W których punktach <math>\displaystyle x_j</math>  
teraz następujące pytanie: w których punktach <math>\displaystyle x_j</math>  
przedziału <math>\displaystyle [a,b]</math> należy obliczać wartości funkcji,  
przedziału <math>\displaystyle [a,b]</math> należy obliczać wartości funkcji,  
aby błąd był minimalny? Problem ten sprowadza się  
aby błąd był minimalny? Problem ten sprowadza się  
Linia 913: Linia 912:
i węzły <math>\displaystyle x^*_j</math> są optymalne.}}
i węzły <math>\displaystyle x^*_j</math> są optymalne.}}


Wielomiany Czebyszewa znajdują bardzo wiele, czasem zaskakujących, zastosowań w różnych działach numeryki, m.in. w konstrukcji metod iteracyjnych rozwiązywania równań liniowych.
Wielomiany Czebyszewa znajdują bardzo wiele czasem zaskakujących zastosowań w różnych działach numeryki, m.in. w konstrukcji metod iteracyjnych rozwiązywania równań liniowych.


Równie interesujący jest fakt, że wielomian interpolacyjny oparty na węzłach Czebyszewa jest prawie optymalnym przybliżeniem wielomianowym zadanej funkcji:
Równie interesujący jest fakt, że wielomian interpolacyjny oparty na węzłach Czebyszewa jest prawie optymalnym przybliżeniem wielomianowym zadanej funkcji:
Linia 924: Linia 923:
</math></center>
</math></center>


gdzie <math>\displaystyle w_f^*</math> jest wielomianem stopnia co najwyżej <math>\displaystyle n</math>, najlepiej aproksymującym <math>\displaystyle f</math> w sensie normy jednostajnej.  
gdzie <math>\displaystyle w_f^*</math> jest wielomianem stopnia co najwyżej <math>\displaystyle n</math> najlepiej aproksymującym <math>\displaystyle f</math> w sensie normy jednostajnej.  
}}
}}


Linia 941: Linia 940:
</math></center>
</math></center>


Tymczasem, <math>\displaystyle ||\sum_j |l_j|||</math> (tak zwana stała Lebesque'a) dla węzłów Czebyszewa ma oszacowanie
Tymczasem <math>\displaystyle ||\sum_j |l_j|||</math> (tak zwana stała Lebesque'a) dla węzłów Czebyszewa ma oszacowanie


,  
,  
Linia 959: Linia 958:
-->
-->
   
   
A więc, jeśli <math>\displaystyle n \leq 5</math> to wielomian oparty na węzłach Czebyszewa jest co najwyżej 3.02 razy, a gdy <math>\displaystyle n \leq 20</math> --- maksymalnie 4 razy gorszy od optymalnego. Można więc powiedzieć, że jest ''prawie optymalny''.
Jeśli więc <math>\displaystyle n \leq 5</math>, to wielomian oparty na węzłach Czebyszewa jest co najwyżej 3.02 razy, a gdy <math>\displaystyle n \leq 20</math>, maksymalnie 4 razy gorszy od optymalnego. Można więc powiedzieć, że jest ''prawie optymalny''.

Wersja z 15:42, 25 wrz 2006

Interpolacja wielomianowa

Zadanie interpolacji, czyli poprowadzenia krzywej zadanego rodzaju przez zestaw danych punktów, jest jednym z podstawowych zadań obliczeniowych. Stosuje się je nagminnie w najróżniejszych dziedzinach życia, np.

  • Na podstawie próbki sygnału dźwiękowego (to znaczy: ciągu wartości

amplitud sygnału zmierzonych w kolejnych odstępach czasu) odtwarzanie jego przebiegu.

  • Przybliżanie wykresu skomplikowanej (lub wręcz nieznanej) funkcji na

podstawie jej wartości uprzednio stablicowanych w wybranych punktach

  • Interpolację stosuje się szczególnie chętnie w samej numeryce. Na przykład idea

metody siecznych polega na tym, by funkcję, której miejsca zerowego szukamy, przybliżyć prostą interpolującą tę funkcję w dwóch punktach. Metody numerycznego całkowania oraz rozwiązywania równań różniczkowych także korzystają z interpolacji.

Niech Parser nie mógł rozpoznać (nieznana funkcja „\subsetR”): {\displaystyle \displaystyle D\subsetR} i niech F będzie pewnym zbiorem funkcji Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle f:D\toR} . Niech x0,x1,,xn będzie ustalonym zbiorem parami różnych punktów z D zwanych później węzłami.

Powiemy, że wielomian w interpoluje funkcję fF w węzłach xj, gdy

w(xj)=f(xj),0jn.

Oznaczmy przez Πn przestrzeń liniową wielomianów stopnia co najwyżej n o współczynnikach rzeczywistych,

Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle \Pi_n\,=\,\{\,w(x)=a_nx^n+a_{n-1}x^{n-1}+\cdots+a_1x+a_0:\; a_j\inR, 0\le j\le n\,\}. }

Zadanie znalezienia wielomianu interpolującego zadane wartości nazywamy zadaniem interpolacji Lagrange'a.

Plik:Lagrange.jpg
Lagrange
Zobacz biografię

Twierdzenie Istnienie i jednoznaczność zadania interpolacji Lagrange'a

Dla dowolnej funkcji Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle f:D\toR} istnieje dokładnie jeden wielomian wfΠn interpolujący f w węzłach xj, 0jn.

Dowód

Wybierzmy w Πn dowolną bazę wielomianów φj, 0jn,

Πn=span{φ0,φ1,,φn}.

Wtedy każdy wielomian z Πn można jednoznacznie przedstawić w postaci rozwinięcia względem wybranej bazy. Warunkiem koniecznym i dostatecznym na to, aby wielomian wf()=j=0ncjφj() interpolował f jest spełnienie układu n+1 równań liniowych

j=0ncjφj(xi)=f(xi),0in,

z n+1 niewiadomymi cj, który w postaci macierzowej wygląda następująco:

(φ0(x0)φ1(x0)φn(x0)φ0(x1)φ1(x1)φn(x1)φ0(xn)φ1(xn)φn(xn))(c0c1cn)=(f(x0)f(x1)f(xn)).

Aby wykazać, że układ ten ma jednoznaczne rozwiązanie wystarczy, aby wektor zerowy był jedynym rozwiązaniem układu jednorodnego. Rzeczywiście, układ jednorodny odpowiada interpolacji danych zerowych, f(xi)=0, i. Istnienie niezerowego rozwiązania byłoby więc równoważne istnieniu niezerowego wielomianu stopnia nie większego od n, który miałby n+1 różnych zer xi, co jest niemożliwe.

Zadanie znalezienia dla danej funkcji f jej wielomianu interpolacyjnego stopnia co najwyżej n jest więc dobrze zdefiniowane, tzn. rozwiązanie istnieje i jest wyznaczone jednoznacznie. Zauważmy, że wielomian interpolacyjny wf jako taki nie może być wynikiem obliczeń w naszym modelu obliczeniowym. Możemy natomiast wyznaczyć jego współczynniki cj w wybranej bazie.

Definicja

Niech (φj)j=0n będzie bazą w przestrzeni Πn wielomianów stopnia co najwyżej n. Zadanie interpolacji wielomianowej polega na obliczeniu dla danej funkcji f współ\-czyn\-ni\-ków cj takich, że wielomian

wf()=j=0ncjφj()

interpoluje f w punktach xj, 0jn.

Uwarunkowanie

Danymi w zadaniu interpolacji są zarówno wartości interpolowanej funkcji, jak i węzły interpolacji. Traktując węzły jako sztywno zadane parametry zadania i dopuszczając jedynie zaburzenia wartości funkcji, możemy pokazać, że jeśli zamiast f rozpatrzyć jej zaburzenie f+Δf, gdzie |Δf|ϵ, to

|wf(x)wf+Δf(x)|cond(x,f)|wf(x)|ϵ,

gdzie

cond(x,f)=j=0n|lj(x)f(xj)||pn(x)|1.

Wybór bazy wielomianowej

Jak już wiemy, zadanie interpolacji Lagrange'a sprowadza się do rozwiązania układu równań liniowych. Okazuje się, że w zależności od wyboru sposobu reprezentacji naszego wielomianu (czyli od wyboru bazy wielomianowej (φj)j=0n), układ ten może być albo bardzo łatwy do rozwiązania, albo bardzo trudny. Co więcej, jego rozwiązanie w arytmetyce flν może napotykać na większe bądź mniejsze trudności (w zależności np. od uwarunkowania macierzy układu, który musimy rozwiązać).

W naturalny sposób powstaje więc problem wyboru "wygodnej" bazy w Πn. Rozpatrzymy trzy bazy: Lagrange'a, potęgową i Newtona.

Baza Lagrange'a (kanoniczna)

Zdefiniujmy dla 0jn wielomiany

lj(x)=(xx0)(xx1)(xxj1)(xxj+1)(xxn)(xjx0)(xjx1)(xjxj1)(xjxj+1)(xjxn).

Zauważmy, że każdy z lj jest stopnia dokładnie n oraz

lj(xi)={0ij,1i=j.

Teraz widać, że wielomiany te stanowią bazę w Πn, którą nazywamy bazą Lagrange'a. Macierz układu zadania interpolacji jest w takim wypadku identycznością i w konsekwencji cj=f(xj), j. Wielomian interpolacyjny dla funkcji f można więc zapisać jako

wf()=j=0nf(xj)lj().

Koszt kombinatoryczny rozwiązania zadania interpolacji jest przy tym zerowy.

Przypuśćmy, że chcielibyśmy obliczyć wartość wielomianu interpolacyjnego wf w punkcie x różnym od xj, 0jn. Podstawiając

wj=1(xjx0)(xjx1)(xjxj1)(xjxj+1)(xjxn)

oraz pn(x)=(xx0)(xxn) mamy pierwszy wzór barycentryczny

wf(x)=pn(x)j=0nwjf(xj)xxj,

i ostatecznie dostajemy tzw. drugi wzór barycentryczny na wielomian interpolacyjny,

wf(x)=j=0nqj(x)f(xj)j=0nqj(x),

gdzie qj(x)=wj/(xxj). W ostatniej równości wykorzystaliśmy fakt, że pn(x)(j=0nqj(x))1, co można łatwo zobaczyć rozpatrując zadanie interpolacji funkcji f1. Drugi wzór barycentryczny jest korzystniejszy w implementacji.

Dla wielu układów węzłów wagi wj są zadane jawnymi wzorami, np. dla węzłów równoodległych (niezależnie od tego, na jakim odcinku!) wagi w drugim wzorze barycentrycznym wynoszą po prostu

wj=(1)j(nj).

Również dla Dodaj link: węzłów Czebyszewa istnieją eleganckie wzory na takie współczynnki.

Można pokazać, że wartość wf(x)~ wielomianu iterpolacyjnego obliczona w arytmetyce flν według pierwszego algorytmu barycentrycznego spełnia

wf(x)~=pn(x)j=0nwjxxjf(xj)(1+ϵj),

gdzie |ϵj|5(n+1), a więc jest to algorytm numerycznie poprawny. Zachowanie drugiej postaci wzoru barycentrycznego w arytmetyce flν jest nieco bardziej skomplikowane w typowych zadaniach.

Baza potęgowa (naturalna)

Znacznie prościej można obliczyć wartość wielomianu interpolacyjnego, (a także jego pochodnych), gdy jest on dany w najczęściej używanej bazie potęgowej, φj(x)=xj, j. Jeśli bowiem

wf(x)=a0+a1x++anxn,

to również

wf(x)=((anx+an1)x+an2)x++a1)x+a0,

co sugeruje zastosowanie następującego schematu Hornera do obliczenia wf(x):

Algorytm Algorytm Hornera



<math>\displaystyle v_n = a_n;</math>
for (j=n-1; j >= 0 ; j--)
	<math>\displaystyle v_j\, = \,v_{j+1}\cdot x\,+\,a_j</math>;

Po wykonaniu tego algorytmu wf(x)=v0. Schemat Hornera wymaga wykonania tylko n mnożeń i n dodawań. Ma on również głębszy sens, bo jego produktem ubocznym mogą być także wartości pochodnych naszego wielomianu w x. Algorytm Hornera okazuje się optymalny. Każdy inny algorytm znając współczynniki wielomianu obliczający jego dokładną wartość wymaga wykonania co najmniej n mnożeń i n dodawań. Algorytm Hornera jest też numerycznie poprawny.

Zauważmy jednak, że w przypadku bazy potęgowej macierz (xij)i,j=0n układu zadania interpolacji jest pełna. Jest to tzw. macierz Vandermonde'a. Obliczenie współczynników wielomianu interpolacyjnego w bazie potęgowej bezpośrednio z tego układu stosując jedną ze znanych nam już metod kosztowałoby rzędu n3 operacji arytmetycznych. Co gorsza, w często spotykanym przypadku, gdy węzły interpolacji są równoodległe, ta macierz jest bardzo źle uwarunkowana!

Baza Newtona

Rozwiązaniem pośrednim, które łączy prostotę obliczenia współczynników z prostotą obliczenia wartości wf(x) i ewentualnie jego pochodnych, jest wybór bazy Newtona,

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned p_0(x) &= 1, \\ p_j(x) &= (x-x_0)(x-x_1)\cdots(x-x_{j-1}),\qquad 1\le j\le n. \endaligned}

W tym przypadku współczynniki rozwinięcia wielomianu interpolacyjnego będziemy oznaczać przez bj,

wf=j=0nbjpj.

Zwróćmy od razu uwagę na ważną własność bazy Newtona. Jeśli wf,jΠj jest wielomianem interpolacyjnym dla funkcji f opartym na węzłach x0,x1,,xj, 0jn, to wf,0=b0 oraz

wf,j=wf,j1+bjpj,1jn.

Wartość wf(x) możemy obliczyć, stosując prostą modyfikację algorytmu Hornera:

Algorytm Algorytm Hornera dla bazy Newtona



<math>\displaystyle v_n = b_n;</math>
for (j=n-1; j >= 0 ; j--)
	<math>\displaystyle v_j\, = \,v_{j+1}\cdot (x-x_j)\,+\,b_j</math>;

Ponadto układ równań zadania interpolacji jest trójkątny dolny, o specyficznej strukturze, dzięki czemu można stworzyć elegancki algorytm, który teraz przedstawimy.

Algorytm różnic dzielonych

Różnicę dzieloną funkcji f opartą na różnych węzłach t0,t1,,ts, gdzie s1, definiuje się indukcyjnie jako

f(t0,t1,,ts)=f(t1,t2,,ts)f(t0,t1,,ts1)tst0.

Zachodzi następujące ważne twierdzenie.

Twierdzenie O różnicach dzielonych

Współczynniki bj wielomianu interpolacyjnego Newtona dla danej funkcji f dane są przez różnice dzielone f w węzłach x0,x1,,xj, tzn.

bj=f(x0,x1,,xj),0jn.

Dowód

Dla 0ijn, oznaczmy przez wi,j wielomian z Πji interpolujący f w węzłach xi,xi+1,,xj. Wtedy ma miejsce następująca równość (i<j):

wi,j(x)=(xxi)wi+1,j(x)(xxj)wi,j1(x)xjxi,x.

Aby ją pokazać, wystarczy że prawa strona tej równości, którą oznaczymy przez v(x), przyjmuje wartości f(xs) dla x=xs, isj. Rzeczywiście, jeśli i+1sj1 to

v(xs)=(xsxi)f(xs)(xsxj)f(xs)xjxi=f(xs).

Ponadto

v(xi)=(xixj)xjxif(xi)=f(xi),

oraz podobnie v(xj)=f(xj). Stąd v jest wielominem z Πji interpolującym f w węzłach xs, isj, czyli wi,j=v.

Dalej postępujemy indukcyjnie ze względu na stopień n wielomianu interpolacyjnego. Dla n=0 mamy oczywiście b0=f(x0). Niech n1. Ponieważ, jak łatwo zauważyć,

w0,n(x)=w0,n1(x)+bnpn(x),

z założenia indukcyjnego mamy bj=f(x0,,xj) dla 0jn1. Aby pokazać podobną równość dla bn, zauważmy, że

w0,n(x)=(xx0)w1,n(x)(xxn)w0,n1(x)xnx0.

Zauważmy teraz, że bn jest współczynnikiem przy xn w wielomianie w0,n. Z założenia indukcyjnego wynika, że współczynniki przy xn1 w wielomianach w1,n i w0,n1 są ilorazami różnicowymi opartymi odpowiednio na węzłach x1,,xn i x0,,xn1. Stąd

bn=f(x1,,xn)f(x0,,xn1)xnx0=f(x0,x1,,xn),

co kończy dowód.

Różnicę dzieloną f(x0,x1,,xn) możemy łatwo obliczyć na podstawie wartości f(xj), 0jn, budując następującą tabelkę:

x0f(x0)x1f(x1)f(x0,x1)x2f(x2)f(x1,x2)f(x0,x1,x2)xnf(xn)f(xn1,xn)f(xn2,xn1,xn)f(x0,x1,,xn).
<flash>file=Interpolacja.swf</flash><div.thumbcaption>Wyznaczenie wielomianu w interpolującego zestaw punktów (0,2)(1,5)(1,7) algorytmem różnic dzielonych

Zauważmy przy tym, że "po drodze" obliczamy f(xi,xi+1,,xj) dla wszystkich 0i<jn, a więc w szczególności również interesujące nas różnice dzielone f(x0,x1,,xj). Stąd i z twierdzenia o różnicach dzielonych wynika algorytm obliczania współczynników bj wielomianu interpolacyjnego w bazie Newtona. Po wykonaniu następującego algorytmu,

Algorytm Metoda różnic dzielonych



for (j = 0; j <= n; j++)
	<math>\displaystyle b_j</math> = <math>\displaystyle f(x_j)</math>; 
for (j = 0; j <= n; j++)
	for (k = n; k >= j; k--)
		<math>\displaystyle b_j</math> = <math>\displaystyle (b_k-b_{k-1})/(x_k - x_{k-j})</math>;

współczynniki bj na końcu algorytmu zawierają wspólczynniki wielomianu interpolacyjnego w bazie Newtona. Czy gdybyś zobaczył ten algorytm na samym początku tego wykładu, zgadłbyś, do czego może służyć?!

<flash>file=Interpolacjainsitu.swf</flash><div.thumbcaption>Wyznaczenie tego samego wielomianu w, interpolującego zestaw punktów (0,2)(1,5)(1,7) algorytmem różnic dzielonych --- wykonanym in situ.

Okazuje się, że przy realizacji w flν algorytmu różnic dzielonych istotną rolę odgrywa porządek węzłów. Można pokazać, że algorytm liczenia f(t0,,tn) jest numerycznie poprawny ze względu na dane interpolacyjne f(i)(tj), o ile węzły są uporządkowane nierosnąco lub niemalejąco.

Przypadek węzłów wielokrotnych

Uogólnieniem rozpatrzonego zadania interpolacji jest zadanie interpolacji Hermite'a. Zakładamy, że oprócz (różnych) węzłów xj dane są również ich krotności nj, 0jk, przy czym j=0knj=n+1. Należy skonstruować wielomian wfΠn taki, że

wf(i)(xj)=f(i)(xj) dla 0inj1,0jk.

Oczywiście zakładamy przy tym, że odpowiednie pochodne funkcji f istnieją.

Lemat

Zadanie interpolacji Hermite'a ma jednoznaczne rozwiązanie.

Plik:Hermite.jpg
Hermite
Zobacz biografię

Dowód

Istnienie i jednoznaczność rozwiązania można uzasadnić tak samo jak w przypadku węzłów jednokrotnych. Przedstawiając wielomian w dowolnej bazie otrzymujemy układ n+1 równań z n+1 niewiadomymi, który dla zerowej prawej strony ma jedynie rozwiązanie zerowe. Inaczej bowiem istniałby wielomian niezerowy stopnia nie większego niż n, który miałby zera o łącznej krotności większej niż n.

Nas oczywiście interesuje konstrukcja wielomianu wf. W tym celu ustawimy węzły xj w ciąg

(x¯0,x¯1,,x¯n)=(x0,,x0n0,x1,,x1n1,,xk,,xknk)

i zdefiniujemy uogólnioną bazę Newtona w Πn jako

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned p_0(x) &= 1, \\ p_j(x) &= (x-\bar x_0)(x-\bar x_1)\cdots (x-\bar x_{j-1}), \qquad 1\le j\le n. \endaligned}

Uogólnimy również pojęcie różnicy dzielonej na węzły powtarzające się, kładąc

f(x¯i,x¯i+1,,x¯j)=f(ji)(x¯i)(ji)!

dla x¯i=x¯i+1==x¯j, oraz

f(x¯i,x¯i+1,,x¯j)=f(x¯i+1,,x¯j)f(x¯i,,xj1)x¯jx¯i

dla x¯ix¯j. Zauważmy, że przy tej definicji różnice f(x¯i,,x¯j) możemy łatwo obliczyć stosując schemat podobny do tego z przypadku węzłów jednokrotnych.

Twierdzenie

Współczynniki bj wielomianu interpolacyjnego Hermite'a w bazie Newtona,

wf()=j=0nbjpj(),

dane są przez odpowiednie różnice dzielone, tzn.

bj=f(x¯0,x¯1,,x¯j),0jn.

Dowód

Dowód przeprowadzimy podobnie jak dla węzłów jednokrotnych. Niech wi,jΠji oznacza wielomian interpolacyjny Hermite'a oparty na (być może powtarzających się) węzłach x¯i,x¯i+1,,x¯j. To znaczy, wi,j interpoluje f w węzłach xs takich, że xs występuje w ciągu x¯i,x¯j, a jego krotność jest liczbą powtórzeń xs w tym ciągu.

Zauważmy najpierw, że dla x¯ix¯j zachodzi znany nam już wzór,

wi,j(x)=(xx¯i)wi+1,j(x)(xx¯j)wi,j1(x)x¯jx¯i.

Rzeczywiście, oznaczmy przez v(x) prawą stronę powyższej równości. Dla k mniejszego od krotności danego węzła xs w ciągu x¯i,x¯j, mamy wi+1,j(k1)(xs)=wi,j1(k1)(xs), a ponieważ

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned v^{(k)}(x)&=\frac{k\,(w_{i+1,j}^{(k-1)}(x)-w_{i,j-1}^{(k-1)}(x))} {\bar x_j-\bar x_i} \\ && \qquad +\, \frac{(x-\bar x_i)w_{i+1,j}^{(k)}(x)-(x-\bar x_j)w_{i,j-1}^{(k)}(x)} {\bar x_j-\bar x_i}, \endaligned}

to

v(k)(xs)=(xsx¯i)wi+1,j(k)(xs)(xsx¯j)wi,j1(k)(xs)x¯jx¯i.

Korzystając z tego wzoru sprawdzamy, że v spełnia odpowiednie warunki interpolacyjne, a stąd wi,j=v.

Dalej postępujemy indukcyjnie ze względu na n. Dla n=0 mamy b0=f(x0). Dla n1 wystarczy pokazać, że bn=f(x¯0,x¯1,,x¯n). W tym celu rozpatrzymy dwa przypadki.

Jeśli x¯0=x¯n, to mamy jeden węzeł x0 o krotności n+1. Wielomian interpolacyjny jest wtedy postaci

wf(x)=j=0nf(j)(x0)j!(xx0)j,

a stąd bn=f(n)(x0)//(n!)=f(x0,,x0n+1). Jeśli zaś x¯0x¯j, to równość bn=f(x¯0,x¯1,,x¯n) wynika z wcześniej wyprowadzonych wzorów oraz z założenia indukcyjnego.

Uwaga

Zauważmy, ze pojęcie różnicy dzielonej formalnie zdefiniowaliśmy jedynie dla ciągu węzłów postaci x0,,x0,x1,,x1,,xk,,xk, gdzie xj są parami różne. Tą definicję można rozszerzyć do dowolnego ciągu węzłów. Można bowiem powiedzieć, że f(t0,t1,,tn) jest współczynnikiem przy xn wielomianu wt0,,tnΠn interpolującego f w węzłach tj (uwzględniając krotności). Równoważnie,

f(t0,t1,,tn)=wt0,,tn(n)n!.

Błąd interpolacji

Gdy mamy do czynienia z funkcją, która jest "skomplikowana", często dobrze jest zastąpić ją funkcją "prostszą". Mówimy wtedy o aproksymacji (przybliżaniu) funkcji. Funkcję musimy również aproksymać wtedy, gdy nie jesteśmy w stanie uzyskać pełnej o niej informacji. Na przykład, gdy funkcja reprezentuje pewien proces fizyczny, często zdarza się, że dysponujemy jedynie ciągiem próbek, czyli wartościami tej funkcji w pewnych punktach. Jasne jest, że chcielibyśmy przy tym, aby błąd aproksymacji był możliwie mały.

Z tego punktu widzenia, intepolacja wielomianowa może być traktowana jako jeden ze sposobów aproksymacji funkcji, opartym na próbkowaniu. Naturalnym staje się więc pytanie o błąd takiej aproksymacji.

Niech x0,x1,,xn będą (niekoniecznie różnymi) węzłami należącymi do pewnego (być może nieskończonego) przedziału Parser nie mógł rozpoznać (nieznana funkcja „\subsetR”): {\displaystyle \displaystyle D\subsetR} . Dla danej funkcji Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle f:D\toR} , przez wf rozważamy, tak jak w całym wykładzie, wielomian interpolacyjny stopnia co najwyżej n interpolujący f w zadanych węzłach. W przypadku węzłów wielokrotnych jest to oczywiście wielomian interpolacyjny Hermite'a; gdy węzły są jednokrotne, mamy do czynienia z interpolacją Lagrange'a.

Lemat Postać błędu interpolacji

Dla dowolnego punktu x¯D błąd interpolacji w x¯ wyraża się wzorem

f(x¯)wf(x¯)=(x¯x0)(x¯x1)(x¯xn)f(x0,x1,,xn,x¯).

Jeśli ponadto fC(n+1)(D), czyli pochodna f(n+1) w D istnieje i jest ciągła, to

f(x¯)wf(x¯)=(x¯x0)(x¯x1)(x¯xn)f(n+1)(ξ)(n+1)!,

gdzie ξ=ξ(x¯) jest pewnym punktem należącym do najmniejszego przedziału zawierającego punkty x0,x1,,xn,x¯.

Dowód

Możemy założyć, że x¯ nie jest żadnym z węzłów xj, 0jn. Niech w¯fΠn+1 będzie wielomianem interpolacyjnym funkcji f opartym na węzłach x0,,xn i dodatkowo na węźle x¯. Mamy wtedy

w¯f(x)=wf(x)+(xx0)(xx1)(xxn)f(x0,x1,,xn,x¯),

a ponieważ z warunku interpolacyjnego f(x¯)=w¯f(x¯), to mamy też pierwszą równość w lemacie.

Aby pokazać drugą część lematu, rozpatrzmy funkcję Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle \psi:D\toR} ,

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \lefteqn{\psi(x) \;=\; f(x)-\bar w_f(x)} \\ &= \, f(x)-w_f(x)-(x-x_0)(x-x_1)\cdots(x-x_n) f(x_0,\ldots,x_n,\bar x). \endaligned}

Z warunków interpolacyjnych na w¯fΠn+1 wynika, że funkcja ψ ma punkty zerowe o łącznej krotności co najmniej n+2. Wykorzystując twierdzenie Rolle'a wnioskujemy stąd, że ψ ma zera o łącznej krotności co najmniej n+1, ψ ma zera o łącznej krotności co najmniej n, itd. W końcu funkcja ψ(n+1) zeruje się w co najmniej jednym punkcie ξ=ξ(x¯) należącym do najmniejszego przedziału zawierającego x0,x1,,xn,x¯. Wobec tego, że wf(n+1)0, a (n+1)-sza pochodna wielomianu (xx0)(xxn) wynosi (n+1)!, mamy

0=ψ(n+1)(ξ)=f(n+1)(ξ)(n+1)!f(x0,,xn,x¯).

Stąd

f(x0,x1,,xn,x¯)=f(n+1)(ξ)(n+1)!,
co kończy dowód.

Zwykle interesuje nas nie tyle błąd w ustalonym punkcie x¯D, ale na całym przedziale D. Zakładając teraz, że przedział D jest domknięty, czyli

D=[a,b]

dla pewnych <a<b<+, błąd ten będziemy mierzyć w normie jednostajnej (Czebyszewa). Dla funkcji ciągłej Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle g:[a,b]\toR} , norma ta jest zdefiniowana jako

gC([a,b])=maxxD|g(x)|.

Niech FMr([a,b]), gdzie r0, będzie klasą funkcji

FMr([a,b])={fC(r+1)([a,b]):f(r+1)C([a,b])M},

gdzie 0<M<. Mamy następujące twiedzenie.

Twierdzenie

Załóżmy, że każdą funkcję fFMr([a,b]) aproksymujemy jej wielomianem interpolacyjnym wfΠr opartym na r+1 węzłach x0,,xr[a,b]. Wtedy maksymalny błąd takiej aproksymacji wynosi

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned e(F^r_M([a,b]);x_0,x_1,\ldots,x_r) &= \max_{f\in F^r_M([a,b])} \|f-w_f\|_{ C([a,b])} \\ &= \frac M{(r+1)!}\cdot \max_{a\le x\le b}|(x-x_0)\cdots(x-x_r)|. \endaligned}

Dowód

Oszacowanie górne wynika bezpośrednio z lematu o postaci błędu interpolacji, bowiem dla fFMr([a,b]) mamy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \|f-w_f\|_{ C([a,b])}&=\max_{a\le x\le b}|f(x)-w_f(x)| \\ &= \max_{a\le x\le b}|(x-x_0)\cdots(x-x_r)| \frac{|f^{(r+1)}(\xi(x))|}{(r+1)!} \\ &\le & \frac{M}{(r+1)!}\max_{x\in D}|(x-x_0)\cdots(x-x_r)|. \endaligned}

Z drugiej strony zauważmy, że dla wielomianu v(x)=Mxr+1//(r+1)! mamy vFMr([a,b]) oraz

vwvC([a,b])=M(r+1)!maxaxb|(xx0)(xxr)|,
co kończy dowód.

Przykład: Zjawisko Rungego

Rozważmy zadanie interpolacji funkcji

f(x)=11+x2

w N równoodległych węzłach na przedziale [5,5]. Okazuje się, że dla dużych wartości N, wielomian interpolacyjny ma poważne kłopoty z aproksymacją tej funkcji przy krańcach przedziału:

Zjawisko Rungego: interpolacja w N=17 węzłach równoodległych dla f(x)=11+x2

Z kolei wielomian oparty na węzłach Czebyszewa znacznie lepiej przybliża tę funkcję.

Zjawisko Rungego: interpolacja w węzłach równoodległych, kontra interpolacja w węzłach Czebyszewa

Rzeczywiście, węzły Czebyszewa zagęszczają się w pobliżu krańców odcinka.

Zjawisko Rungego: interpolacja w węzłach Czebyszewa

Zauważmy, że błąd aproksymacji e(FMr([a,b]);x0,,xr) w istotny sposób zależy od wyboru węzłów xj. Naturalne jest więc teraz następujące pytanie: w których punktach xj przedziału [a,b] należy obliczać wartości funkcji, aby błąd był minimalny? Problem ten sprowadza się oczywiście do minimalizacji wielkości maxaxb|(xx0)(xxr)| względem węzłów xj.

Twierdzenie O "optymalnym" doborze węzłów

Błąd aproksymacji w klasie funkcji FMr([a,b])(x0,,xr) jest minimalny gdy węzły interpolacji są zadane jako węzły Czebyszewa na (a,b), tzn.

xj*=ba2cos(2j+12r+2π)+a+b2,0jr.

Ponadto, dla optymalnych węzłów xj* mamy

e(FMr([a,b]);x0*,,xr*)=2M(r+1)!(ba4)r+1.

Dowód tego twierdzenia opiera się na własnościach pewnego ważnego ciągu wielomianów, który teraz przedstawimy.

Wielomiany Czebyszewa

Ciąg {Tk}k0 wielomianów Czebyszewa (pierwszego rodzaju) zdefiniowany jest indukcyjnie jako

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned T_0(x) &= 1, \\ T_1(x) &= x, \\ T_{k+1}(x) &= 2xT_k(x)-T_{k-1}(x),\qquad \mbox{ dla } \quad k\ge 1. \endaligned}
Czebyszew
Zobacz biografię

Zauważmy, że Tk jest wielomianem stopnia dokładnie k o współczynniku przy xk równym 2k1 (k1). Ponadto wielomian Tk można dla |x|1 przedstawić w postaci

Tk(x)=cos(karccosx).

Rzeczywiście, łatwo sprawdzić, że jest to prawdą dla k=0,1. Stosując podstawienie cost=x, 0tπ, oraz wzór na sumę cosinusów otrzymujemy dla k1

cos((k+1)t)=2costcos(kt)cos((k1)t),

co jest równoważne formule rekurencyjnej dla Tk+1.

Kilka pierwszych wielomianów Czebyszewa na odcinku [1,1]

Ze wzoru Tk(x)=cos(karccosx) wynikają również inne ważne własności wielomianów Czebyszewa. Norma wielomianu Czebyszewa na [1,1] wynosi

TkC([1,1])=max1x1|Tk(x)|=1

i jest osiągana w k+1 punktach tego przedziału równych

yj=cos(jkπ),0jk,

przy czym Tk(yj)=(1)j.

W końcu, k-ty wielomian Czebyszewa Tk ma dokładnie k pojedynczych zer w [1,1] równych

zj=cos(2j+12rπ),0jk1.

Konsekwencją wymienionych własności jest następująca własność ekstremalna wielomianów Czebyszewa.

Przez Πk oznaczymy klasę wielomianów stopnia k o współczynniku wiodącym równym 1, tzn.

Πk={wΠk:w(x)=xk+}.

Twierdzenie o minimaksie

Niech k1. W klasie Πk minimalną normę jednostajną na przedziale [1,1] ma wielomian w*=21kTk, tzn.

minwΠkwC([1,1])=w*C([1,1])=12k1.
Wielomian stopnia 9 oparty na węzłach Czebyszewa kontra oparty na węzłach równoodległych. Zwróć uwagę na wielkie oscylacje tego drugiego pry końcach odcinka.


Miejsca zerowe wielomianu Czebyszewa będziemy nazywać węzłami Czebyszewa.

Dowód Twierdzenia o optymalnym doborze węzłów

Dowód wynika teraz bezpośrednio z twierdzenia o minimaksie. Zauważmy bowiem, że wielomian (xx0)(xx1)(xxr) jest w klasie Πr+1. Stąd dla [a,b]=[1,1] optymalnymi węzłami są zera zj wielomianu Czebyszewa, przy których

(xz0)(xz1)(xzr)=Tr+1(x)2r.

Jeśli przedział [a,b] jest inny niż [1,1], należy dokonać liniowej zamiany zmiennych tak, aby przeszedł on na [1,1]. Bezpośrednie sprawdzenie pokazuje, że w klasie Πr+1 minimalną normę Czebyszewa na przedziale [a,b] ma wielomian

wa,b*(x)=(ba2)r+1w*(2x(a+b)ba).

Stąd

wa,b*C([a,b])=(ba2)r+112r=2(ba4)r+1
i węzły xj* są optymalne.

Wielomiany Czebyszewa znajdują bardzo wiele czasem zaskakujących zastosowań w różnych działach numeryki, m.in. w konstrukcji metod iteracyjnych rozwiązywania równań liniowych.

Równie interesujący jest fakt, że wielomian interpolacyjny oparty na węzłach Czebyszewa jest prawie optymalnym przybliżeniem wielomianowym zadanej funkcji:

Twierdzenie Jacksona

Dla fC[1,1] dostatecznie gładkiej, wielomian interpolacyjny wf stopnia co najwyżej n, oparty na węzłach Czebyszewa, spełnia

||fwf||C[1,1](2+2πlog(n+1))||fwf*||C[1,1]

gdzie wf* jest wielomianem stopnia co najwyżej n najlepiej aproksymującym f w sensie normy jednostajnej.


Jeśli więc n5, to wielomian oparty na węzłach Czebyszewa jest co najwyżej 3.02 razy, a gdy n20, maksymalnie 4 razy gorszy od optymalnego. Można więc powiedzieć, że jest prawie optymalny.