MN11: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Dorota (dyskusja | edycje)
Nie podano opisu zmian
Przykry (dyskusja | edycje)
Nie podano opisu zmian
Linia 1: Linia 1:
<!--
Konwertowane  z pliku LaTeX przez latex2mediawiki, zob. http://www.ii.uj.edu.pl/&nbsp;pawlik1/latex2mediawiki.php.
Niezb�dne rozszerzenia i modyfikacje oryginalnego latex2mediawiki
wprowadzi� przykry@mimuw.edu.pl
-->
=Funkcje sklejane (splajny)=
=Funkcje sklejane (splajny)=
{{powrot |Metody numeryczne | do strony głównej
przedmiotu <strong>Metody numeryczne</strong>}}
\mylabel{sec:splajny}


Interpolacja  wielomianami interpolacyjnymi, chociaż korzysta z funkcji gładkich
Interpolacja  wielomianami interpolacyjnymi, chociaż korzysta z funkcji gładkich
i łatwo reprezentowalnych w komputerze, ma jednak również pewne wady.  
i łatwo reprezentowalnych w komputerze, ma jednak również pewne wady.  
Zauważmy, że błąd interpolacji może być bardzo duży (zjawisko Rungego), a poza
Zauważmy, że błąd interpolacji może być bardzo duży ([[MN09#Zjawisko Rungego|zjawisko Rungego]]), a poza tym interpolacja jest nielokalna: nawet mała zmiana warości funkcji w pojedynczym węźle może powodować dużą zmianę zachowania całego wielomianu interpolacyjnego. Czasem więc lepiej jest zastosować innego rodzaju  
tym interpolacja jest nielokalna: nawet mała zmiana warości funkcji w pojedynczym węźle
interpolację, np. posługując się funkcjami sklejanymi, które tylko ''lokalnie są wielomianami'', sklejonymi w taki sposób, by ''globalnie'' zachować pewien stopień gładkości, tzn. ''różniczkowalność zadaną liczbę razy''.   
może powodować dużą zmianę zachowania całego wielomianu interpolacyjnego.  
 
Czasem więc lepiej jest zastosować innego rodzaju  
Tego typu podejście okazało się bardzo owocne m.in. w grafice komputerowej (np. dla wizualizacji scenerii w grach komputerowych), a także np. posłużyło jako narzędzie konstrukcji skalowalnych czcionek komputerowych w Postscripcie (precyzyjniej, korzysta się tam z tzw. <strong>krzywych Beziera</strong> --- pewnych krzywych sklejanych zadanych na płaszczyźnie). Z krzywych Beziera powszechnie korzysta się również w systemach CAD (''Computer Aided Design'').
interpolację, np. posługując się funkcjami sklejanymi.   
 
Zamiast terminu ''funkcje sklejane'' używa się też często terminów <strong>splajny</strong> (''spline''), albo <strong>funkcje gięte</strong>. Nazwy te biorą się stąd, że zadanie interpolacji naturalnym splajnem kubicznym można interpretować jako model matematyczny aparatu służącego do wytwarzania mebli giętych.


==Funkcje sklejane==
==Funkcje sklejane==
\mylabel{warfs}


W ogólności przez funkcję sklejaną rozumie się każdą  
W ogólności przez funkcję sklejaną rozumie się każdą  
Linia 26: Linia 41:


{{definicja|||
{{definicja|||
Funkcję <math>\displaystyle s:R\toR</math> nazywamy funkcją  
\mylabel{splinedef}
sklejaną rzędu <math>\displaystyle r</math> (<math>\displaystyle r\ge 1</math>) odpowiadającą węzłom  
Funkcję <math>\displaystyle s:R\toR</math> nazywamy <strong>funkcją sklejaną rzędu <math>\displaystyle r</math></strong> (<math>\displaystyle r\ge 1</math>) odpowiadającą węzłom <math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>, jeśli spełnione są następujące  
<math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>, jeśli spełnione są następujące  
dwa warunki:
dwa warunki:
   
   
Linia 66: Linia 80:
wielomianami stopnia co najwyżej trzeciego. W tym przypadku  
wielomianami stopnia co najwyżej trzeciego. W tym przypadku  
mówimy o <strong>kubicznych funkcjach sklejanych</strong>. Funkcja  
mówimy o <strong>kubicznych funkcjach sklejanych</strong>. Funkcja  
sklejana kubiczna jest naturalna, gdy poza <math>\displaystyle (a,b)</math> jest  
sklejana kubiczna <math>\displaystyle s</math> jest naturalna, gdy poza <math>\displaystyle (a,b)</math> jest  
wielomianem liniowym.  
wielomianem liniowym, a więc <math>\displaystyle s''(a) = s''(b) = 0</math>.  


==Interpolacja i gładkość==
==Interpolacja i gładkość==
Linia 89: Linia 103:


{{lemat|||
{{lemat|||
\mylabel{bwazny}
Niech <math>\displaystyle f\in W^r(a,b)</math> będzie funkcją  
Niech <math>\displaystyle f\in W^r(a,b)</math> będzie funkcją  
zerującą się w węzłach, tzn.  
zerującą się w węzłach, tzn.  
Linia 133: Linia 147:
</math></center>
</math></center>


Postępując podobnie, tzn. całkując przez części <math>\displaystyle r-1</math> razy  
Postępując podobnie, tzn. całkując przez części <math>\displaystyle r-1</math> razy,
otrzymujemy w końcu  
otrzymujemy w końcu  


Linia 148: Linia 162:
jednoznaczne rozwiązanie.  
jednoznaczne rozwiązanie.  


{{twierdzenie|||
{{twierdzenie|O istnieniu i jednoznaczności naturalnego splajnu interpolacyjnego|O istnieniu i jednoznaczności naturalnego splajnu interpolacyjnego|
 
Jeśli <math>\displaystyle n+1\ge r</math>, to dla dowolnej funkcji  
Jeśli <math>\displaystyle n+1\ge r</math>, to dla dowolnej funkcji  
<math>\displaystyle f:[a,b]\toR</math> istnieje dokładnie jedna naturalna funkcja sklejana  
<math>\displaystyle f:[a,b]\toR</math> istnieje dokładnie jedna naturalna funkcja sklejana  
Linia 174: Linia 189:


Zauważmy teraz, że problem znalezienia naturalnej funkcji sklejanej  
Zauważmy teraz, że problem znalezienia naturalnej funkcji sklejanej  
<math>\displaystyle s</math> interpolującej <math>\displaystyle f</math> można sprowadzić do rozwiązania kwadratowego
<math>\displaystyle s</math> interpolującej <math>\displaystyle f</math> można sprowadzić do rozwiązania układu równań liniowych z macierzą kwadratową. Na każdym przedziale <math>\displaystyle [x_{i-1},x_i]</math>,  
układu równań liniowych. Na każdym przedziale <math>\displaystyle [x_{i-1},x_i]</math>,  
<math>\displaystyle 1\le i\le n</math>, jest ona postaci  
<math>\displaystyle 1\le i\le n</math>, jest ona postaci  


Linia 223: Linia 237:
funkcjami sklejanymi.  
funkcjami sklejanymi.  


{{twierdzenie|||
{{twierdzenie|O ekstremalnej własności splajnów naturalnych|O ekstremalnej własności splajnów naturalnych|
 
Niech <math>\displaystyle f\in W^r(a,b)</math> i niech <math>\displaystyle s_f\in {\cal S}_r</math>
Niech <math>\displaystyle f\in W^r(a,b)</math> i niech <math>\displaystyle s_f\in {\cal S}_r</math>
będzie naturalną funkcją sklejaną rzędu <math>\displaystyle r</math> interpolującą  
będzie naturalną funkcją sklejaną rzędu <math>\displaystyle r</math> interpolującą  
<math>\displaystyle f</math> w węzłach <math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>. Wtedy  
<math>\displaystyle f</math> w węzłach <math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>. Wtedy  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{nst}
   \int_a^b \Big(  f^{(r)}(x)\Big)^2\,dx\,\ge\,
   \int_a^b \Big(  f^{(r)}(x)\Big)^2\,dx\,\ge\,
   \int_a^b \Big(s_f^{(r)}(x)\Big)^2\,dx.  
   \int_a^b \Big(s_f^{(r)}(x)\Big)^2\,dx.  
Linia 250: Linia 265:


Wartość całki <math>\displaystyle \int_a^b(f^{(r)}(x))^2 dx</math> może być w  
Wartość całki <math>\displaystyle \int_a^b(f^{(r)}(x))^2 dx</math> może być w  
ogólności uważana za miarę gładkości funkcji.  
ogólności uważana za miarę gładkości funkcji.   Dowiedzioną nierówność możemy więc zinterpretować w następujący sposób. Naturalna funkcja sklejana jest w  
Dowiedzioną nierówność możemy więc zinterpretować w  
następujący sposób. Naturalna funkcja sklejana jest w  
klasie <math>\displaystyle W^r(a,b)</math> najgładszą funkcją spełniającą dane  
klasie <math>\displaystyle W^r(a,b)</math> najgładszą funkcją spełniającą dane  
warunki interpolacyjne w wybranych węzłach <math>\displaystyle x_j</math>.  
warunki interpolacyjne w wybranych węzłach <math>\displaystyle x_j</math>.  
Linia 287: Linia 300:
<math>\displaystyle c_n=0</math>, otrzymujemy  
<math>\displaystyle c_n=0</math>, otrzymujemy  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{dei}
   d_i\,=\,\frac{c_{i+1}-c_i}{h_i},\qquad 1\le i\le n-1.
   d_i\,=\,\frac{c_{i+1}-c_i}{h_i},\qquad 1\le i\le n-1.
</math></center>
</math></center>
Linia 293: Linia 306:
Z warunków ciągłości dla <math>\displaystyle s_f'</math> dostajemy z kolei  
Z warunków ciągłości dla <math>\displaystyle s_f'</math> dostajemy z kolei  


<center><math>\displaystyle b_i+c_ih_i+d_ih_i^2/2\,=\,b_{i+1},  
<center><math>\displaystyle b_i+c_ih_i+d_i\frac{h_i^2}{2}\,=\,b_{i+1},  
     \qquad 0\le i\le n-2,
     \qquad 0\le i\le n-2,
</math></center>
</math></center>
Linia 299: Linia 312:
oraz  
oraz  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{bei}
   b_{i+1}\,=\,b_i+h_i(c_{i+1}+c_i)/2,  
   b_{i+1}\,=\,b_i+h_i\frac{c_{i+1}+c_i}{2},  
     \qquad 0\le i\le n-2.  
     \qquad 0\le i\le n-2.  
</math></center>
</math></center>
Linia 306: Linia 319:
Warunki ciągłości <math>\displaystyle s_f</math> dają w końcu  
Warunki ciągłości <math>\displaystyle s_f</math> dają w końcu  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{aai}
   a_i+b_ih_i+c_ih_i^2/2+d_ih_i^3/6\,=\,a_{i+1},  
   a_i+b_ih_i+c_i\frac{h_i^2}{2}+d_i\frac{h_i^3}{6}\,=\,a_{i+1},  
     \qquad 0\le i\le n-2.  
     \qquad 0\le i\le n-2.  
</math></center>
</math></center>


Powyższe równania definiują  
Powyższe równania definiują nam na odcinku <math>\displaystyle [a,b]</math> naturalną kubiczną funkcję  
nam na odcinku <math>\displaystyle [a,b]</math> naturalną kubiczną funkcję  
sklejaną. Ponieważ poszukiwana funkcja sklejana <math>\displaystyle s_f</math> ma interpolować <math>\displaystyle f</math>, mamy dodatkowych <math>\displaystyle n+1</math> warunków interpolacyjnych <math>\displaystyle w_i(x_i)=f(x_i)</math>, <math>\displaystyle 0\le i\le n-1</math>,  
sklejaną. Ponieważ poszukiwana funkcja sklejana <math>\displaystyle s_f</math> ma  
interpolować <math>\displaystyle f</math>, mamy dodatkowych <math>\displaystyle n+1</math> warunków  
interpolacyjnych <math>\displaystyle w_i(x_i)=f(x_i)</math>, <math>\displaystyle 0\le i\le n-1</math>,  
oraz <math>\displaystyle w_{n-1}(x_n)=f(x_n)</math>, z których  
oraz <math>\displaystyle w_{n-1}(x_n)=f(x_n)</math>, z których  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{wza}
   a_i\,=\,f(x_i), \qquad 0\le i\le n-1.
   a_i\,=\,f(x_i), \qquad 0\le i\le n-1.
</math></center>
</math></center>
Linia 324: Linia 334:
Teraz możemy warunki ciągłości przepisać jako  
Teraz możemy warunki ciągłości przepisać jako  


<center><math>\displaystyle f(x_{i+1})\,=\,f(x_i)+b_ih_i+c_ih_i^2+d_ih_i^3/6,
<center><math>\displaystyle f(x_{i+1})\,=\,f(x_i)+b_ih_i+c_ih_i^2+d_i\frac{h_i^3}{6},
</math></center>
</math></center>


Linia 331: Linia 341:
mamy  
mamy  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{wzb}
   b_i\,=\,f(x_i,x_{i+1})+h_i(c_{i+1}+2c_i)/6,  
   b_i\,=\,f(x_i,x_{i+1})+h_i\frac{c_{i+1}+2c_i}{6},  
   \qquad 0\le i\le n-1,  
   \qquad 0\le i\le n-1,  
</math></center>
</math></center>
Linia 340: Linia 350:
podstawić, aby otrzymać  
podstawić, aby otrzymać  


<center><math>\displaystyle c_ih_i/6+c_{i+1}(h_i+h_{i+1})/3+c_{i+1}h_{i+1}/6
<center><math>\displaystyle c_i\frac{h_i}{6}+c_{i+1}\frac{h_i+h_{i+1}}{3}+c_{i+1}\frac{h_{i+1}}{6}
   \,=\,f(x_{i+1},x_{i+2})-f(x_i,x_{i+1}).  
   \,=\,f(x_{i+1},x_{i+2})-f(x_i,x_{i+1}).  
</math></center>
</math></center>
Linia 346: Linia 356:
Wprowadzając oznaczenie  
Wprowadzając oznaczenie  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{wzc}
   c_i^*\,=\,c_i/6,  
   c_i^*\,=\,\frac{c_i}{6},  
</math></center>
</math></center>


Linia 359: Linia 369:
<math>\displaystyle 0\le i\le n-2</math>, albo w postaci macierzowej  
<math>\displaystyle 0\le i\le n-2</math>, albo w postaci macierzowej  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{ukltrd}
   \left(\begin{array} {cccccc}
   \left(\begin{array} {cccccc}
     2  & w_1 \\
     2  & w_1 \\
Linia 387: Linia 397:
a potem zastosować wzory definiujące pozostałe współczynniki.  
a potem zastosować wzory definiujące pozostałe współczynniki.  


Zauważmy, że macierz układu równań liniowych jest  
Zauważmy, że macierz układu równań liniowych jest trójdiagonalna i ma dominującą przekątną. Układ można więc rozwiązać kosztem proporcjonalnym do wymiaru <math>\displaystyle n</math> używając [[MN08#Macierze trójdiagonalne|algorytmu przeganiania]]. Koszt znalezienia wszystkich współczynników kubicznej funkcji sklejanej interpolującej <math>\displaystyle f</math> jest więc też proporcjonalny do <math>\displaystyle n</math>.  
trójdiagonalna i ma dominującą przekątną. Układ  
można więc rozwiązać kosztem proporcjonalnym do  
wymiaru <math>\displaystyle n</math> używając algorytmu przeganiania. Koszt znalezienia wszystkich  
współczynników kubicznej funkcji sklejanej  
interpolującej <math>\displaystyle f</math> jest więc też proporcjonalny do <math>\displaystyle n</math>.  


MATLAB i Octave mają wbudowaną funkcję wyznaczającą naturalny kubiczny splajn interpolujący zadane wartości:
<div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>s = spline(x,y);
</pre></div>
Aby wyznaczyć wartości takiego splajnu w zadanych punktach <math>\displaystyle X</math>, także musimy użyć specjalnej funkcji,
<div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>Y = ppval(s,X);
</pre></div>
Na końcu oszacujemy jeszcze błąd interpolacji naturalnymi  
Na końcu oszacujemy jeszcze błąd interpolacji naturalnymi  
kubicznymi funkcjami sklejanymi na przedziale <math>\displaystyle [a,b]</math>.  
kubicznymi funkcjami sklejanymi na przedziale <math>\displaystyle [a,b]</math>.  
Linia 399: Linia 414:
różniczkowalna w sposób ciągły.
różniczkowalna w sposób ciągły.


{{twierdzenie|||
{{twierdzenie|O błędzie interpolacji splajnem kubicznym|O błędzie interpolacji splajnem kubicznym|
J
 
eśli <math>\displaystyle f\in F^1_M([a,b])</math> to  
Jeśli <math>\displaystyle f\in F^1_M([a,b])</math> to  


<center><math>\displaystyle \|f-s_f\|_{C([a,b])}\,\le\,5\,M\,
<center><math>\displaystyle \|f-s_f\|_{C([a,b])}\,\le\,5\,M\,
Linia 408: Linia 423:


W szczególności, dla podziału równomiernego  
W szczególności, dla podziału równomiernego  
<math>\displaystyle x_i=a+(b-a)i/ń</math>, <math>\displaystyle 0\le i\le n</math> mamy  
<math>\displaystyle x_i=a+i\frac{b-a}{n}</math>, <math>\displaystyle 0\le i\le n</math>, mamy  


<center><math>\displaystyle \|f-s_f\|_{ C([a,b])}\,\le\,
<center><math>\displaystyle \|f-s_f\|_{ C([a,b])}\,\le\,
Linia 439: Linia 454:
oraz  
oraz  


<center><math>\displaystyle \aligned  
<center><math>\displaystyle \aligned \mylabel{psik}
   |f(x)-s_f(x)| &\le &(M+2|c_{i+1}^*|+6|c_i^*|)h_i^2 \\
   |f(x)-s_f(x)| &\le &(M+2|c_{i+1}^*|+6|c_i^*|)h_i^2 \\
     &= (M+8\max_{1\le i\le n-1}|c_i^*|)h_i^2.  
     &= (M+8\max_{1\le i\le n-1}|c_i^*|)h_i^2.  
Linia 445: Linia 460:


Niech teraz <math>\displaystyle \max_{1\le i\le n-1}|c_i^*|=|c_s^*|</math>.  
Niech teraz <math>\displaystyle \max_{1\le i\le n-1}|c_i^*|=|c_s^*|</math>.  
Z postaci układu ([[##ukltrd|Uzupelnic: ukltrd ]]) otrzymujemy  
Z postaci układu otrzymujemy  


<center><math>\displaystyle \aligned |c_s^*| &= 2|c_s^*|-|c_s^*|(u_s+w_s) \,\le\,
<center><math>\displaystyle \aligned |c_s^*| &= 2|c_s^*|-|c_s^*|(u_s+w_s) \,\le\,
Linia 463: Linia 478:
<div style="margin-top:1em; padding-top,padding-bottom:1em;">
<div style="margin-top:1em; padding-top,padding-bottom:1em;">
<span  style="font-variant:small-caps;">Przykład</span>  
<span  style="font-variant:small-caps;">Przykład</span>  
<div class="solution" style="margin-left:1em;">
<div class="solution" style="margin-left,margin-right:3em;">


Porównanie interpolacji splajnowej i Lagrange'a.
Porównanie interpolacji splajnowej i Lagrange'a.


[[Image:MN|thumb|450px|center|]]
[[Image:MNrunge17czebyspline.png|thumb|550px|center|Interpolacja splajnowa wydaje się lepiej spełniać zadanie odtworzenia kształtu funkcji]]
 
Jak widać, w przeciwieństwie do wielomianu interpolacyjnego, splajn interpolacyjny praktycznie pokrywa się z wykresem funkcji, tutaj: <math>\displaystyle f(x) = \frac{1}{1+x^2}</math>.


</div></div>
</div></div>


{{uwaga|||
<div style="margin-top:1em; padding-top,padding-bottom:1em;">
Zamiast terminu ''funkcje sklejane'' używa
<span  style="font-variant:small-caps;">Uwaga</span>  
się też często terminów <strong>''splajny''</strong> (ang.
<div class="solution" style="margin-left,margin-right:3em;">
<strong>spline</strong>-sklejać), albo <strong>''funkcje gięte''</strong>.
}}
 
{{uwaga|||


\mylabel{optspln}
Niech  
Niech  


Linia 485: Linia 499:
</math></center>
</math></center>


Ustalmy węzły <math>\displaystyle a=x_0<\cdots<x_n=b</math>. Dla <math>\displaystyle f\in W^r_M(a,b)</math>,  
Ustalmy węzły <math>\displaystyle a=x_0<\cdots<x_n=b</math>. Dla <math>\displaystyle f\in W^r_M(a,b)</math>, niech <math>\displaystyle s_f</math> będzie naturalną funkcją sklejaną interpolującą <math>\displaystyle f</math> w <math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>, a <math>\displaystyle a_f</math> dowolną inną aproksymacją korzystającą jedynie z informacji o wartościach <math>\displaystyle f</math> w tych węzłach, tzn.
niech <math>\displaystyle s_f</math> będzie naturalną funkcją sklejaną  
interpolującą <math>\displaystyle f</math> w <math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>, a <math>\displaystyle a_f</math>
dowolną inną aproksymacją korzystającą jedynie  
z informacji o wartościach <math>\displaystyle f</math> w tych węzłach , tzn.


<center><math>\displaystyle a_f\,=\,\phi(f(x_0),\ldots,f(x_n)).
<center><math>\displaystyle a_f\,=\,\phi(f(x_0),\ldots,f(x_n)).
</math></center>
</math></center>


Załóżmy, że błąd aproksymacji mierzymy nie w normie  
Załóżmy, że błąd aproksymacji mierzymy nie w normie Czebyszewa, ale w normie średniokwadratowej zdefiniowanej jako  
Czebyszewa, ale w normie średniokwadratowej, zdefiniowanej  
jako  


<center><math>\displaystyle \|g\|_{{\cal L}_2(a,b)}\,=\,\sqrt{\int_a^b (g(x))^2\,dx}.  
<center><math>\displaystyle \|g\|_{{\cal L}_2(a,b)}\,=\,\sqrt{\int_a^b (g(x))^2\,dx}.  
Linia 507: Linia 515:
</math></center>
</math></center>


Aproksymacja naturalnymi funkcjami sklejanymi jest więc  
Aproksymacja naturalnymi funkcjami sklejanymi jest więc optymalna w klasie <math>\displaystyle W^r_M(a,b)</math>.  
optymalna w klasie <math>\displaystyle W^r_M(a,b)</math>.  


Można również pokazać, że interpolacja <math>\displaystyle s_f^*</math>  
Można również pokazać, że interpolacja <math>\displaystyle s_f^*</math> naturalnymi funkcjami sklejanymi na węzłach równoodległych <math>\displaystyle x_j=a+(b-a)j/ń</math>, <math>\displaystyle 0\le j\le n</math>, jest optymalna co do  
naturalnymi funkcjami sklejanymi na węzłach równoodległych  
rzędu w klasie <math>\displaystyle W^r_M(a,b)</math>, wśród wszystkich aproksymacji korzystających jedynie z informacji o wartościach funkcji w <math>\displaystyle n+1</math> dowolnych punktach, oraz  
<math>\displaystyle x_j=a+(b-a)j/ń</math>, <math>\displaystyle 0\le j\le n</math>, jest optymalna co do  
rzędu w klasie <math>\displaystyle W^r_M(a,b)</math>, wśród wszystkich aproksymacji  
korzystających jedynie z informacji o wartościach funkcji  
w <math>\displaystyle n+1</math> dowolnych punktach, oraz  


<center><math>\displaystyle \max_{f\in W^r_M(a,b)}\|f-s^*_f\|_{{\cal L}_2(a,b)}
<center><math>\displaystyle \max_{f\in W^r_M(a,b)}\|f-s^*_f\|_{{\cal L}_2(a,b)}
Linia 521: Linia 524:
</math></center>
</math></center>


}}
</div></div>


{{uwaga|||
<div style="margin-top:1em; padding-top,padding-bottom:1em;">
<span  style="font-variant:small-caps;">Uwaga</span>
<div class="solution" style="margin-left,margin-right:3em;">


Tak jak wielomiany, naturalne  
\mylabel{B-spl}
funkcje sklejane interpolujące dane funkcje można  
Tak jak wielomiany, naturalne funkcje sklejane interpolujące dane funkcje można  
reprezentować przez ich współczynniki w różnych bazach.  
reprezentować przez ich współczynniki w różnych bazach. Do tego celu można na przykład użyć bazy kanonicznej <math>\displaystyle K_j</math>, <math>\displaystyle 0\le j\le n</math> zdefiniowanej równościami  
Do tego celu można na przykład użyć bazy kanonicznej  
<math>\displaystyle K_j</math>, <math>\displaystyle 0\le j\le n</math> zdefiniowanej równościami  


<center><math>\displaystyle K_j(x_i)\,=\,\left\{\begin{array} {ll}
<center><math>\displaystyle K_j(x_i)\,=\,\left\{\begin{array} {ll}
Linia 536: Linia 539:
</math></center>
</math></center>


przy której <math>\displaystyle s_f(x)=\sum_{j=0}^n f(x_j)K_j(x)</math>. Baza  
przy której <math>\displaystyle s_f(x)=\sum_{j=0}^n f(x_j)K_j(x)</math>. Baza kanoniczna jest jednak niewygodna w użyciu, bo funkcje <math>\displaystyle K_j</math> w ogólności nie zerują się na żadnym podprzedziale, a tym samym manipulowanie nimi jest utrudnione.  
kanoniczna jest jednak niewygodna w użyciu, bo funkcje <math>\displaystyle K_j</math>  
w ogólności nie zerują się na żadnym podprzedziale,  
a tym samym manipulowanie nimi jest utrudnione.  


Częściej używa się bazy B-sklejanej <math>\displaystyle B_j</math>, <math>\displaystyle 0\le j\le n</math>.
Częściej używa się bazy B-sklejanej. Można ją zdefiniować dla splajnów dowolnego rzędu za pomocą wzoru rekurencyjnego (przyjmując, że dla dowolnego <math>\displaystyle i</math>, <math>\displaystyle x_i < x_{i+1}</math>):
W przypadku funkcji kubicznych, <math>\displaystyle r=2</math>, jest ona zdefiniowana  
 
przez następujące warunki:  
<center><math>\displaystyle \aligned B_i^0(x) &= \left\{ 1,  \mbox{ jeśli }  x_i \leq x < x_{i+1},\\
0,  \mbox{ w przeciwnym przypadku} ;
\right.\\
B_i^r(x) &= \frac{x-x_i}{x_{i+r}-x_i} B_i^{r-1}(x) +
\frac{x_{i+r+1}-x}{x_{i+r+1}-x_{i+1}} B_{i+1}^{r-1}(x).
\endaligned</math></center>
 
W przypadku naturalnych splajnów kubicznych, <math>\displaystyle r=2</math>, baza B-sklejana jest jawnie zdefiniowana przez następujące warunki:  


<center><math>\displaystyle \aligned B_j(x_j) &= 1, \qquad \mbox{ dla  }  0\le j\le n, \\
<center><math>\displaystyle \aligned B_j(x_j) &= 1, \qquad \mbox{ dla  }  0\le j\le n, \\
Linia 568: Linia 575:
więc koszt obliczenia tych współczynników jest  
więc koszt obliczenia tych współczynników jest  
proporcjonalny do <math>\displaystyle n</math>.  
proporcjonalny do <math>\displaystyle n</math>.  
}}
</div></div>
 
<div style="margin-top:1em; padding-top,padding-bottom:1em;">
<span  style="font-variant:small-caps;">Uwaga</span>
<div class="solution" style="margin-left,margin-right:3em;">


{{uwaga|||
\mylabel{okresowe}
Oprócz naturalnych funkcji sklejanych często rozpatruje się też <strong>okresowe funkcje sklejane</strong>. Są to funkcje <math>\displaystyle \tilde s:R\toR</math> spełniające warunki '''(i)''', '''(ii)''' \link{splinedef}{definicji funkcji sklejanej}, oraz warunek:  
Oprócz naturalnych funkcji  
sklejanych często rozpatruje się też <strong>okresowe funkcje  
sklejane</strong>. Są to funkcje <math>\displaystyle \tilde s:R\toR</math> spełniające  
warunki '''(i)''', '''(ii)''' z rozdziału [[##warfs|Uzupelnic: warfs ]], oraz  
warunek:  
    
    
; (iii)'
; (iii)'
Linia 583: Linia 589:
<math>\displaystyle \tilde s^{(i)}(x)=\tilde s^{(i)}(x+(b-a))</math>, <math>\displaystyle \forall x</math>.  
<math>\displaystyle \tilde s^{(i)}(x)=\tilde s^{(i)}(x+(b-a))</math>, <math>\displaystyle \forall x</math>.  
   
   
Klasę okresowych funkcji sklejanych rzędu <math>\displaystyle r</math> oznaczymy  
Klasę okresowych funkcji sklejanych rzędu <math>\displaystyle r</math> oznaczymy przez <math>\displaystyle \widetilde{\cal S}_r</math>. Funkcje te mają podobne własności jak naturalne funkcje sklejane. Dokładniej, niech  
przez <math>\displaystyle \widetilde{\cal S}_r</math>. Funkcje te mają podobne  
własności jak naturalne funkcje sklejane. Dokładniej,  
niech  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{minio}
   \tilde W^r(a,b)\,=\,\{\,f\in W^r(a,b):\,  
   \tilde W^r(a,b)\,=\,\{\,f\in W^r(a,b):\,  
     f^{(i)}(a)=f^{(i)}(b),\; 0\le i\le r-1\,\},
     f^{(i)}(a)=f^{(i)}(b),\; 0\le i\le r-1\,\},
</math></center>
</math></center>


tzn. <math>\displaystyle \tilde W^r(a,b)</math> jest klasą funkcji z <math>\displaystyle W^r(a,b)</math>,  
tzn. <math>\displaystyle \tilde W^r(a,b)</math> jest klasą funkcji z <math>\displaystyle W^r(a,b)</math>, które można przedłużyć do funkcji, krórych wszystkie pochodne do rzędu <math>\displaystyle r-1</math> włącznie są <math>\displaystyle (b-a)</math>-okresowe na <math>\displaystyle R</math>. Wtedy dla dowolnej funkcji <math>\displaystyle f\in\tilde W^r(a,b)</math>  
które można przedłużyć do funkcji, krórych wszystkie  
zerującej się w węzłach <math>\displaystyle x_j</math>, oraz dla dowolnej <math>\displaystyle \tilde s\in\widetilde{\cal S}_r</math> mamy  
pochodne do rzędu <math>\displaystyle r-1</math> włącznie są <math>\displaystyle (b-a)</math>-okresowe  
na <math>\displaystyle R</math>. Wtedy dla dowolnej funkcji <math>\displaystyle f\in\tilde W^r(a,b)</math>  
zerującej się w węzłach <math>\displaystyle x_j</math>, oraz dla dowolnej  
<math>\displaystyle \tilde s\in\widetilde{\cal S}_r</math> mamy  


<center><math>\displaystyle  
<center><math>\displaystyle \mylabel{odpl}
   \int_a^b f^{(r)}(x)\tilde s^{(r)}(x)\,dx\,=\,0.  
   \int_a^b f^{(r)}(x)\tilde s^{(r)}(x)\,dx\,=\,0.  
</math></center>
</math></center>


Jest to odpowiednik lematu [[##bwazny|Uzupelnic: bwazny ]] w przypadku okresowym.
Wynika z niego jednoznaczność rozwiązania zadania interpolacyjnego dla okresowych funkcji <math>\displaystyle f</math> (tzn. takich, że <math>\displaystyle f(a)=f(b)</math>), jak również odpowiednia własność minimalizacyjna okresowych funkcji sklejanych. Dokładniej, jeśli <math>\displaystyle f\in\tilde W^r(a,b)</math> oraz <math>\displaystyle \tilde s_f\in\widetilde{\cal S}_r</math> interpoluje <math>\displaystyle f</math> w węzłach <math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>, to  
W szczególności wynika z niego jednoznaczność  
rozwiązania zadania interpolacyjnego dla okresowych  
funkcji <math>\displaystyle f</math> (tzn. takich, że <math>\displaystyle f(a)=f(b)</math>), jak również  
odpowiednia własność minimalizacyjna okresowych funkcji  
sklejanych. Dokładniej, jeśli <math>\displaystyle f\in\tilde W^r(a,b)</math> oraz  
<math>\displaystyle \tilde s_f\in\widetilde{\cal S}_r</math> interpoluje <math>\displaystyle f</math> w węzłach  
<math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>, to  


<center><math>\displaystyle \int_a^b \Big(  f^{(r)}(x)\Big)^2\,dx\,\ge\,
<center><math>\displaystyle \int_a^b \Big(  f^{(r)}(x)\Big)^2\,dx\,\ge\,
Linia 617: Linia 609:
</math></center>
</math></center>


}}
</div></div>


{{uwaga|||
==Dygresja o najlepszej aproksymacji==


Klasyczne zadanie  
Klasyczne zadanie aproksymacyjne w przestrzeniach funkcji definiuje się  
aproksymacyjne w przestrzeniach funkcji definiuje się  
w następujący sposób.  
w następujący sposób.  


Niech <math>\displaystyle F</math> będzie pewną przestrzenią liniową funkcji  
Niech <math>\displaystyle F</math> będzie pewną przestrzenią liniową funkcji <math>\displaystyle f:[a,b]\toR</math>, w której określona została norma <math>\displaystyle \|\cdot\|</math>. Niech <math>\displaystyle V_n\subset F</math> będzie podprzestrzenią
<math>\displaystyle f:[a,b]\toR</math>, w której określona została norma  
w <math>\displaystyle F</math> wymiaru <math>\displaystyle n</math>. Dla danej <math>\displaystyle f\in F</math>, należy znaleźć funkcję <math>\displaystyle v_f\in F</math> taką, że  
<math>\displaystyle \|\cdot\|</math>. Niech <math>\displaystyle V_n\subset F</math> będzie podprzestrzenią  
w <math>\displaystyle F</math> wymiaru <math>\displaystyle n</math>. Dla danej <math>\displaystyle f\in F</math>, należy znaleźć  
funkcję <math>\displaystyle v_f\in F</math> taką, że  


<center><math>\displaystyle \|f-v_f\|\,=\,\min_{v\in V_n}\|f-v\|.  
<center><math>\displaystyle \|f-v_f\|\,=\,\min_{v\in V_n}\|f-v\|.  
</math></center>
</math></center>


Okazuje się, że tak postawione zadanie ma rozwiązanie  
Okazuje się, że tak postawione zadanie ma rozwiązanie <math>\displaystyle v_f</math>, choć nie zawsze jest ono wyznaczone jednoznacznie.  
<math>\displaystyle v_f</math>, choć nie zawsze jest ono wyznaczone jednoznacznie,
zob. ćw. [[##rkl|Uzupelnic: rkl ]].  


Jako przykład, rozpatrzmy <math>\displaystyle F=W^r(a,b)</math>. Utożsamiając  
Jako przykład, rozpatrzmy <math>\displaystyle F=W^r(a,b)</math>. Utożsamiając funkcje <math>\displaystyle f_1,f_2\in W^r(a,b)</math> takie, że <math>\displaystyle f_1(x)-f_2(x) \in\Pi_{r-1}</math>, zdefiniujemy w <math>\displaystyle W^r(a,b)</math> normę  
funkcje <math>\displaystyle f_1,f_2\in W^r(a,b)</math> takie, że  
<math>\displaystyle f_1(x)-f_2(x) \in\Pi_{r-1}</math>, zdefiniujemy w <math>\displaystyle W^r(a,b)</math> normę  


<center><math>\displaystyle \|f\|\,=\,\sqrt{\int_a^b\left(f^{(r)}(x)\right)^2\,dx}.   
<center><math>\displaystyle \|f\|\,=\,\sqrt{\int_a^b\left(f^{(r)}(x)\right)^2\,dx}.   
Linia 650: Linia 634:
</math></center>
</math></center>


będzie podprzestrzenią w <math>\displaystyle W^r(a,b)</math> naturalnych funkcji  
będzie podprzestrzenią w <math>\displaystyle W^r(a,b)</math> naturalnych funkcji sklejanych rzędu <math>\displaystyle r</math> opartych węzłach <math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>. Oczywiście <math>\displaystyle  \mbox{dim} {\cal S}_r=n+1</math>, co wynika z jednoznaczności rozwiązania w <math>\displaystyle {\cal S}_r</math> zadania interpolacji. Okazuje się, że wtedy optymalną dla <math>\displaystyle f\in W^r(a,b)</math> jest naturalna funkcja sklejana <math>\displaystyle s_f</math> interpolująca <math>\displaystyle f</math> w węzłach <math>\displaystyle x_j</math>, tzn.  
sklejanych rzędu <math>\displaystyle r</math> opartych węzłach <math>\displaystyle x_j</math>, <math>\displaystyle 0\le j\le n</math>.  
Oczywiście <math>\displaystyle  \mbox{dim} {\cal S}_r=n+1</math>, co wynika z  
jednoznaczności rozwiązania w <math>\displaystyle {\cal S}_r</math> zadania  
interpolacji. Okazuje się, że wtedy optymalną dla  
<math>\displaystyle f\in W^r(a,b)</math> jest naturalna funkcja sklejana <math>\displaystyle s_f</math>  
interpolująca <math>\displaystyle f</math> w węzłach <math>\displaystyle x_j</math>, tzn.  


<center><math>\displaystyle \|f-s_f\|\,=\,\min_{s\in {\cal S}_r}\|f-s\|.  
<center><math>\displaystyle \|f-s_f\|\,=\,\min_{s\in {\cal S}_r}\|f-s\|.  
</math></center>
</math></center>


Rzeczywiście, ponieważ norma w przestrzeni <math>\displaystyle W^r(a,b)</math>  
Rzeczywiście, ponieważ norma w przestrzeni <math>\displaystyle W^r(a,b)</math> generowana jest przez iloczyn skalarny  
generowana jest przez iloczyn skalarny  


<center><math>\displaystyle (f_1,f_2)\,=\,
<center><math>\displaystyle (f_1,f_2)\,=\,
Linia 668: Linia 645:
</math></center>
</math></center>


jest to przestrzeń unitarna. Znane twierdzenie mówi, że  
jest to przestrzeń unitarna. Znane twierdzenie mówi, że w przestrzeni unitarnej najbliższą danej <math>\displaystyle f</math> funkcją w dowolnej domkniętej podprzestrzeni <math>\displaystyle V</math> jest rzut  
w przestrzeni unitarnej najbliższą danej <math>\displaystyle f</math> funkcją  
prostopadły <math>\displaystyle f</math> na <math>\displaystyle V</math>, albo równoważnie, taka funkcja <math>\displaystyle v_f\in V_{n+1}</math>, że iloczyn skalarny  
w dowolnej domkniętej podprzestrzeni <math>\displaystyle V</math> jest rzut  
prostopadły <math>\displaystyle f</math> na <math>\displaystyle V</math>, albo równoważnie, taka funkcja  
<math>\displaystyle v_f\in V_{n+1}</math>, że iloczyn skalarny  


<center><math>\displaystyle (f-v_f, v)\,=\,0, \qquad\forall v\in V.  
<center><math>\displaystyle (f-v_f, v)\,=\,0, \qquad\forall v\in V.  
Linia 683: Linia 657:
</math></center>
</math></center>


To zaś jest na mocy lematu [[##bwazny|Uzupelnic: bwazny ]] prawdą gdy <math>\displaystyle v_f</math>  
To zaś jest prawdą, gdy <math>\displaystyle v_f</math> interpoluje <math>\displaystyle f</math> w punktach <math>\displaystyle x_j</math>, czyli <math>\displaystyle v_f=s_f</math>.
interpoluje <math>\displaystyle f</math> w punktach <math>\displaystyle x_j</math>, czyli <math>\displaystyle v_f=s_f</math>.  


Dodajmy jeszcze, że nie zawsze interpolacja daje najlepszą  
Dodajmy jeszcze, że nie zawsze interpolacja daje najlepszą  
aproksymację w sensie klasycznym, zob. ćw. [[##intkla|Uzupelnic: intkla ]].  
aproksymację w sensie klasycznym.
}}
 
==Literatura==
 
W celu dogłębnego zapoznania się z omawianym na wykładzie materiałem, przeczytaj <b>rozdział 6.4</b> w
* D. Kincaid, W. Cheney <cite>Analiza numeryczna</cite>, Wydawnictwa Naukowo-Techniczne, Warszawa 2006, ISBN 83-204-3078-X.
Warto także zapoznać się (nieobowiązkowo) z rozdziałami&nbsp;6.5 i&nbsp;6.6 tamże.

Wersja z 20:07, 29 wrz 2006


Funkcje sklejane (splajny)

<<< Powrót do strony głównej przedmiotu Metody numeryczne

\mylabel{sec:splajny}

Interpolacja wielomianami interpolacyjnymi, chociaż korzysta z funkcji gładkich i łatwo reprezentowalnych w komputerze, ma jednak również pewne wady. Zauważmy, że błąd interpolacji może być bardzo duży (zjawisko Rungego), a poza tym interpolacja jest nielokalna: nawet mała zmiana warości funkcji w pojedynczym węźle może powodować dużą zmianę zachowania całego wielomianu interpolacyjnego. Czasem więc lepiej jest zastosować innego rodzaju interpolację, np. posługując się funkcjami sklejanymi, które tylko lokalnie są wielomianami, sklejonymi w taki sposób, by globalnie zachować pewien stopień gładkości, tzn. różniczkowalność zadaną liczbę razy.

Tego typu podejście okazało się bardzo owocne m.in. w grafice komputerowej (np. dla wizualizacji scenerii w grach komputerowych), a także np. posłużyło jako narzędzie konstrukcji skalowalnych czcionek komputerowych w Postscripcie (precyzyjniej, korzysta się tam z tzw. krzywych Beziera --- pewnych krzywych sklejanych zadanych na płaszczyźnie). Z krzywych Beziera powszechnie korzysta się również w systemach CAD (Computer Aided Design).

Zamiast terminu funkcje sklejane używa się też często terminów splajny (spline), albo funkcje gięte. Nazwy te biorą się stąd, że zadanie interpolacji naturalnym splajnem kubicznym można interpretować jako model matematyczny aparatu służącego do wytwarzania mebli giętych.

Funkcje sklejane

\mylabel{warfs}

W ogólności przez funkcję sklejaną rozumie się każdą funkcję przedziałami wielomianową. Nas będą jednak interesować szczególne funkcje tego typu i dlatego termin funkcje sklejane zarezerwujemy dla funkcji przedziałami wielomianowych i posiadających dodatkowe własności, które teraz określimy.

Niech dany będzie przedział skończony [a,b] i węzły

a=x0<x1<<xn=b,

przy czym n1.

Definicja

\mylabel{splinedef} Funkcję Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle s:R\toR} nazywamy funkcją sklejaną rzędu r (r1) odpowiadającą węzłom xj, 0jn, jeśli spełnione są następujące dwa warunki:

(i)
s jest wielomianem stopnia co najwyżej 2r1 na każdym

z przedziałów [xj1,xj], tzn. s|[xj1,xj]Π2r1, 1jn,

(ii)
s jest (2r2)-krotnie różniczkowalna w sposób

ciągły na całej prostej, tzn. sC(2r2)(R).

Jeśli ponadto

(iii)
s jest wielomianem stopnia co najwyżej r1 poza

(a,b), tzn. s|(,a],s|[b,+)Πr1,

to s jest naturalną funkcją sklejaną.

Klasę naturalnych funkcji sklejanych rzędu r opartych na węzłach xj będziemy oznaczać przez 𝒮r(x0,,xn), albo po prostu 𝒮r, jeśli węzły są ustalone.

Na przykład funkcją sklejaną rzędu pierwszego (r=1) jest funkcja ciągła i liniowa na poszczególnych przedziałach [xj1,xj]. Jest ona naturalna, gdy poza (a,b) jest funkcją stała. Tego typu funkcje nazywamy liniowymi funkcjami sklejanymi.

Najważniejszymi z praktycznego punktu widzenia są jednak funkcje sklejane rzędu drugiego odpowiadające r=2. Są to funkcje, które są na R dwa razy różniczkowalne w sposób ciągły, a na każdym z podprzedziałów są wielomianami stopnia co najwyżej trzeciego. W tym przypadku mówimy o kubicznych funkcjach sklejanych. Funkcja sklejana kubiczna s jest naturalna, gdy poza (a,b) jest wielomianem liniowym, a więc s(a)=s(b)=0.

Interpolacja i gładkość

Pokażemy najpierw ważny lemat, który okaże się kluczem do dowodu dalszych twierdzeń.

Niech Wr(a,b) będzie klasą funkcji Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle f:[a,b]\toR} takich, że f jest (r1) razy różniczkowalna na [a,b] w sposób ciągły oraz f(r)(x) istnieje prawie wszędzie na [a,b] i jest całkowalna z kwadratem, tzn.

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned W^r(a,b) &= \{\,f\in C^{(r-1)}([a,b]):\, f^{(r)}(x) \mbox{ istnieje p.w. na } [a,b] \\ && \qquad\qquad\qquad\qquad \mbox{ oraz } f^{(r)}\in{\cal L}_2(a,b)\,\}. \endaligned}

Oczywiście każda funkcja sklejana rzędu r (niekoniecznie naturalna) należy do Wr(a,b).

Lemat

\mylabel{bwazny} Niech fWr(a,b) będzie funkcją zerującą się w węzłach, tzn.

f(xj)=0,0jn.

Wtedy dla dowolnej naturalnej funkcji sklejanej s𝒮r mamy

abf(r)(x)s(r)(x)dx=0.

Dowód

Dla r=1 funkcja s jest przedziałami stała. Oznaczając przez aj jej wartość na [xj1,xj] dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \int_a^b f'(x)s'(x)\,dx &= \sum_{j=1}^n\int_{t_{j-1}}^{t_j} f'(x)a_j\,dx \\ &= \sum_{j=1}^n a_j(f(x_j)-f(x_{j-1}))\,=\,0, \endaligned}

ponieważ f zeruje się w tj.

Rozpatrzmy teraz przypadek r2. Ponieważ

(f(r1)s(r))=f(r)s(r)+f(r1)s(r+1),

to

abf(r)(x)s(r)(x)dx=f(r1)(x)s(r)(x)|ababf(r1)(x)s(r+1)(x)dx.

Wobec tego, że s jest poza przedziałem (a,b) wielomianem stopnia co najwyżej r1 oraz s(r) jest ciągła na R, mamy s(r)(a)=0=s(r)(b), a stąd

f(r1)(x)s(r)(x)|ab=0.

Postępując podobnie, tzn. całkując przez części r1 razy, otrzymujemy w końcu

abf(r)(x)s(r)(x)dx=(1)r1abf(x)s(2r1)(x)dx.

Funkcja s(2r1) jest przedziałami stała, a więc możemy teraz zastosować ten sam argument jak dla r=1, aby pokazać,

że ostatnia całka jest równa zeru.

Funkcje sklejane chcielibyśmy zastosować do interpolacji funkcji. Ważne jest więc, aby odpowiednie zadanie interpolacyjne miało jednoznaczne rozwiązanie.

Twierdzenie O istnieniu i jednoznaczności naturalnego splajnu interpolacyjnego

Jeśli n+1r, to dla dowolnej funkcji Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle f:[a,b]\toR} istnieje dokładnie jedna naturalna funkcja sklejana sf𝒮r interpolująca f w węzłach xj, tzn. taka, że

sf(xj)=f(xj),0jn.

Dowód

Pokażemy najpierw, że jedyną naturalną funkcją sklejaną interpolującą dane zerowe jest funkcja zerowa. Rzeczywiście, jeśli s(xj)=0 dla 0jn, to podstawiając w poprzednim lemacie f=s, otrzymujemy

ab(s(r)(x))2dx=0.

Stąd s(r) jest funkcją zerową, a więc s jest wielomianem stopnia co najwyżej r1 zerującym się w co najmniej n+1 punktach xj. Wobec tego, że n+1>r1, otrzymujemy s0.

Zauważmy teraz, że problem znalezienia naturalnej funkcji sklejanej s interpolującej f można sprowadzić do rozwiązania układu równań liniowych z macierzą kwadratową. Na każdym przedziale [xi1,xi], 1in, jest ona postaci

s(x)=wi(x)=j=02r1ai,jxj,

dla pewnych współczynników Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle a_{i,j}\inR} , a na (,a] i [b,) mamy odpowiednio

s(x)=w0(x)=j=0r1a0,jxj

i

s(x)=wn+1(x)=j=0r1an+1,jxj.

Aby wyznaczyć s, musimy więc znaleźć ogółem 2r(n+1) współczynników ai,j, przy czym są one związane (2r1)(n+1) warunkami jednorodnymi wynikającymi z gładkości,

wi(k)(xi)=wi+1(k)(xi)

dla 0in i 0k2r2, oraz n+1 niejednorodnymi warunkami interpolacyjnymi,

wi(xi)=f(xi)

dla 0in. Otrzymujemy więc układ 2r(n+1) równań liniowych ze względu na 2r(n+1) niewiadomych ai,j.

Naturalna funkcja sklejana interpolująca f jest wyznaczona jednoznacznie wtedy i tylko wtedy, gdy układ ten ma jednoznaczne rozwiązanie. To zaś zachodzi, gdy zero jest jedynym rozwiązaniem układu jednorodnego. Rzeczywiście, układ jednorodny odpowiada zerowym warunkom interpolacyjnym, przy których, jak pokazaliśmy wcześniej, zerowa funkcja sklejana (której odpowiada ai,j=0, i,j)

jest jedynym rozwiązaniem zadania interpolacyjnego.

Naturalnych funkcji sklejanych możemy więc używać do interpolacji funkcji. Pokażemy teraz inną ich własność, która jest powodem dużego praktycznego zainteresowania funkcjami sklejanymi.

Twierdzenie O ekstremalnej własności splajnów naturalnych

Niech fWr(a,b) i niech sf𝒮r będzie naturalną funkcją sklejaną rzędu r interpolującą f w węzłach xj, 0jn. Wtedy

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{nst} \int_a^b \Big( f^{(r)}(x)\Big)^2\,dx\,\ge\, \int_a^b \Big(s_f^{(r)}(x)\Big)^2\,dx. }

Dowód

Jeśli przedstawimy f w postaci f=sf+(fsf), to

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \int_a^b\Big(f^{(r)}(x)\Big)^2\,dx &= \int_a^b\Big(s_f^{(r)}(x)\Big)^2\,dx\,+\, \int_a^b\Big((f-s_f)^{(r)}(x)\Big)^2\,dx \\ & & \qquad\qquad 2\,\int_a^b s_f^{(r)}(x)(f-s_f)^{(r)}(x)\,dx. \endaligned}

Funkcja fsf jest w klasie Wr(a,b) i zeruje się w węzłach xj, 0jn. Z lematu wynika więc, że

absf(r)(x)(fsf)(r)(x)dx=0, a stąd wynika teza.

Wartość całki ab(f(r)(x))2dx może być w ogólności uważana za miarę gładkości funkcji. Dowiedzioną nierówność możemy więc zinterpretować w następujący sposób. Naturalna funkcja sklejana jest w klasie Wr(a,b) najgładszą funkcją spełniającą dane warunki interpolacyjne w wybranych węzłach xj.

Jak już wspomnieliśmy, najczęściej używanymi są kubiczne funkcje sklejane. Dlatego rozpatrzymy je oddzielnie.

Kubiczne funkcje sklejane

Jeśli zdecydowaliśmy się na użycie kubicznych funkcji sklejanych, powstaje problem wyznaczenia sf𝒮2 interpolującej daną funkcję f, tzn. takiej, że sf(xi)=f(xi) dla 0in. W tym celu, na każdym przedziale [xi,xi+1] przedstawimy sf w postaci jej rozwinięcia w szereg Taylora w punkcie xi,

sf(x)=wi(x)=ai+bi(xxi)+ci(xxi)22+di(xxi)36,

i podamy algorytm obliczania ai,bi,ci,di dla 0in1.

Warunki brzegowe i warunki ciągłości dla sf dają nam w0(x0)=0=wn1(xn) oraz wi(xi+1)=wi+1(xi+1), czyli

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned c_0 &= 0, \\ c_i+d_ih_i &= c_{i+1}, \qquad 0\le i\le n-2, \\ c_{n-1}+d_{n-1}h_{n-1} &= 0, \endaligned}

gdzie hi=xi+1xi. Stąd, przyjmując dodatkowo cn=0, otrzymujemy

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{dei} d_i\,=\,\frac{c_{i+1}-c_i}{h_i},\qquad 1\le i\le n-1. }

Z warunków ciągłości dla sf dostajemy z kolei

bi+cihi+dihi22=bi+1,0in2,

oraz

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{bei} b_{i+1}\,=\,b_i+h_i\frac{c_{i+1}+c_i}{2}, \qquad 0\le i\le n-2. }

Warunki ciągłości sf dają w końcu

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{aai} a_i+b_ih_i+c_i\frac{h_i^2}{2}+d_i\frac{h_i^3}{6}\,=\,a_{i+1}, \qquad 0\le i\le n-2. }

Powyższe równania definiują nam na odcinku [a,b] naturalną kubiczną funkcję sklejaną. Ponieważ poszukiwana funkcja sklejana sf ma interpolować f, mamy dodatkowych n+1 warunków interpolacyjnych wi(xi)=f(xi), 0in1, oraz wn1(xn)=f(xn), z których

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{wza} a_i\,=\,f(x_i), \qquad 0\le i\le n-1. }

Teraz możemy warunki ciągłości przepisać jako

f(xi+1)=f(xi)+bihi+cihi2+dihi36,

przy czym wzór ten zachodzi również dla i=n1. Po wyrugowaniu bi i podstawieniu di z (Uzupelnic: dei ), mamy

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{wzb} b_i\,=\,f(x_i,x_{i+1})+h_i\frac{c_{i+1}+2c_i}{6}, \qquad 0\le i\le n-1, }

gdzie f(xi,xi+1) jest odpowiednią różnicą dzieloną. Możemy teraz powyższe wyrażenie na bi podstawić, aby otrzymać

cihi6+ci+1hi+hi+13+ci+1hi+16=f(xi+1,xi+2)f(xi,xi+1).

Wprowadzając oznaczenie

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{wzc} c_i^*\,=\,\frac{c_i}{6}, }

możemy to równanie przepisać jako

hihi+hi+1ci*+2ci+1*+hi+1hi+hi+1ci+2*=f(xi,xi+1,xi+2),

0in2, albo w postaci macierzowej

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{ukltrd} \left(\begin{array} {cccccc} 2 & w_1 \\ u_2 & 2 & w_2 \\ & u_3 & 2 & w_3 \\ & &\ddots &\ddots &\ddots \\ & & & u_{n-2} & 2 & w_{n-2} \\ & & & & u_{n-1} & 2 \end{array} \right) \left(\begin{array} {c} c_1^*\\ c_2^*\\ c_3^*\\ \vdots\\ c_{n-2}^*\\ c_{n-1}^* \end{array} \right) \,=\, \left(\begin{array} {c} v_1\\ v_2\\ v_3\\ \vdots\\ v_{n-2}\\ v_{n-1} \end{array} \right), }

gdzie

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned && u_i\,=\,\frac{h_{i-1}}{h_{i-1}+h_i},\qquad w_i\,=\,\frac{h_i}{h_{i-1}+h_i}, \\ && v_i\,=\,f(x_{i-1},x_i,x_{i+1}). \endaligned}

Ostatecznie, aby znaleźć współczynniki ai,bi,ci,di należy najpierw rozwiązać układ równań liniowych, a potem zastosować wzory definiujące pozostałe współczynniki.

Zauważmy, że macierz układu równań liniowych jest trójdiagonalna i ma dominującą przekątną. Układ można więc rozwiązać kosztem proporcjonalnym do wymiaru n używając algorytmu przeganiania. Koszt znalezienia wszystkich współczynników kubicznej funkcji sklejanej interpolującej f jest więc też proporcjonalny do n.

MATLAB i Octave mają wbudowaną funkcję wyznaczającą naturalny kubiczny splajn interpolujący zadane wartości:

s = spline(x,y);

Aby wyznaczyć wartości takiego splajnu w zadanych punktach X, także musimy użyć specjalnej funkcji,

Y = ppval(s,X);

Na końcu oszacujemy jeszcze błąd interpolacji naturalnymi kubicznymi funkcjami sklejanymi na przedziale [a,b]. Będziemy zakładać, że f jest dwa razy różniczkowalna w sposób ciągły.

Twierdzenie O błędzie interpolacji splajnem kubicznym

Jeśli fFM1([a,b]) to

fsfC([a,b])5Mmax1in(xixi1)2.

W szczególności, dla podziału równomiernego xi=a+iban, 0in, mamy

fsfC([a,b])5M(ban)2.

Dowód

Wykorzystamy obliczoną wcześniej postać interpolującej funkcji sklejanej sf. Dla x[xi,xi+1] mamy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned w_i(x) &= f(x_i)\,+\,\left(\frac{f(x_{i+1})-f(x_i)}{h_i} -h_i(c_{i+1}^*+2c_i^*)\right)(x-x_i) \\ &&\qquad\qquad \,+\, 3c_i^*(x-x_i)^2\,+\,\frac{c_{i+1}^*-c_i^*}{h_i}(x-x_i)^3. \endaligned}

Z rozwinięcia f w szereg Taylora w punkcie xi dostajemy f(x)=f(xi)+f(xi)(xxi)+f(ξ1)(xxi)2/2 oraz (f(xi+1)f(xi))/hi=f(xi)+hif(ξ2)/2. Stąd

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \lefteqn{f(x)-s_f(x) \,=\, f(x)-w_i(x)} \\ &= \frac{f''(\xi_1)}2(x-x_i)^2-\left(\frac{f''(\xi_2)}2 -(c_{i+1}^*+2c_i^*)\right)h_i(x-x_i) \\ & & \qquad\qquad\qquad -3c_i^*(x-x_i)^2 -\frac{c_{i+1}^*-c_i^*}{h_i}(x-x_i)^3, \endaligned}

oraz

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \mylabel{psik} |f(x)-s_f(x)| &\le &(M+2|c_{i+1}^*|+6|c_i^*|)h_i^2 \\ &= (M+8\max_{1\le i\le n-1}|c_i^*|)h_i^2. \endaligned}

Niech teraz max1in1|ci*|=|cs*|. Z postaci układu otrzymujemy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned |c_s^*| &= 2|c_s^*|-|c_s^*|(u_s+w_s) \,\le\, |u_sc_{s-1}^*+2c_s^*+w_sc_{s+1}| \\ &= |f(x_{s-1},x_s,x_{s+1})|\,\le\, \Big|\frac{f''(\xi_3)}2\Big|\,\le\,\frac 12 M, \endaligned}

a stąd i z (Uzupelnic: psik )

|f(x)sf(x)|5Mhi2,

co kończy dowód.

Przykład

Porównanie interpolacji splajnowej i Lagrange'a.

Interpolacja splajnowa wydaje się lepiej spełniać zadanie odtworzenia kształtu funkcji

Jak widać, w przeciwieństwie do wielomianu interpolacyjnego, splajn interpolacyjny praktycznie pokrywa się z wykresem funkcji, tutaj: f(x)=11+x2.

Uwaga

\mylabel{optspln} Niech

WMr(a,b)={fWr(a,b):ab(f(r)(x))2dxM}.

Ustalmy węzły a=x0<<xn=b. Dla fWMr(a,b), niech sf będzie naturalną funkcją sklejaną interpolującą f w xj, 0jn, a af dowolną inną aproksymacją korzystającą jedynie z informacji o wartościach f w tych węzłach, tzn.

af=ϕ(f(x0),,f(xn)).

Załóżmy, że błąd aproksymacji mierzymy nie w normie Czebyszewa, ale w normie średniokwadratowej zdefiniowanej jako

g2(a,b)=ab(g(x))2dx.

Wtedy

supfWMr(a,b)fsf2(a,b)supfWMr(a,b)faf2(a,b).

Aproksymacja naturalnymi funkcjami sklejanymi jest więc optymalna w klasie WMr(a,b).

Można również pokazać, że interpolacja sf* naturalnymi funkcjami sklejanymi na węzłach równoodległych Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle x_j=a+(b-a)j/ń} , 0jn, jest optymalna co do rzędu w klasie WMr(a,b), wśród wszystkich aproksymacji korzystających jedynie z informacji o wartościach funkcji w n+1 dowolnych punktach, oraz

maxfWMr(a,b)fsf*2(a,b)nr.

Uwaga

\mylabel{B-spl} Tak jak wielomiany, naturalne funkcje sklejane interpolujące dane funkcje można reprezentować przez ich współczynniki w różnych bazach. Do tego celu można na przykład użyć bazy kanonicznej Kj, 0jn zdefiniowanej równościami

Kj(xi)={0ij,1i=j,

przy której sf(x)=j=0nf(xj)Kj(x). Baza kanoniczna jest jednak niewygodna w użyciu, bo funkcje Kj w ogólności nie zerują się na żadnym podprzedziale, a tym samym manipulowanie nimi jest utrudnione.

Częściej używa się bazy B-sklejanej. Można ją zdefiniować dla splajnów dowolnego rzędu za pomocą wzoru rekurencyjnego (przyjmując, że dla dowolnego i, xi<xi+1):

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned B_i^0(x) &= \left\{ 1, \mbox{ jeśli } x_i \leq x < x_{i+1},\\ 0, \mbox{ w przeciwnym przypadku} ; \right.\\ B_i^r(x) &= \frac{x-x_i}{x_{i+r}-x_i} B_i^{r-1}(x) + \frac{x_{i+r+1}-x}{x_{i+r+1}-x_{i+1}} B_{i+1}^{r-1}(x). \endaligned}

W przypadku naturalnych splajnów kubicznych, r=2, baza B-sklejana jest jawnie zdefiniowana przez następujące warunki:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned B_j(x_j) &= 1, \qquad \mbox{ dla } 0\le j\le n, \\ B_j(x) &= 0,\qquad \mbox{ dla } x\le x_{j-2}, j\ge 2, \mbox{ oraz dla } x\ge x_{j+2}, j\le n-2. \endaligned}

Dla B0 i B1 dodatkowo żądamy, aby

B0(x0)=0=B1(x0),B1(x0)=0,

a dla Bn1 i Bn podobnie

Bn1(xn)=0=Bn(xn),Bn1(xn1)=0.

Wtedy Bj nie zeruje się tylko na przedziale (xj2,xj+2). Wyznaczenie współczynników rozwinięcia w bazie {Bi}i=0n funkcji sklejanej interpolującej f wymaga rozwiązania układu liniowego z macierzą trójdiagonalną {Bj(xi)}i,j=0n, a więc koszt obliczenia tych współczynników jest proporcjonalny do n.

Uwaga

\mylabel{okresowe} Oprócz naturalnych funkcji sklejanych często rozpatruje się też okresowe funkcje sklejane. Są to funkcje Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle \tilde s:R\toR} spełniające warunki (i), (ii) \link{splinedef}{definicji funkcji sklejanej}, oraz warunek:

(iii)'
s~(i) jest dla 0ir1

funkcją okresową o okresie (ba), tzn. s~(i)(x)=s~(i)(x+(ba)), x.

Klasę okresowych funkcji sklejanych rzędu r oznaczymy przez 𝒮~r. Funkcje te mają podobne własności jak naturalne funkcje sklejane. Dokładniej, niech

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{minio} \tilde W^r(a,b)\,=\,\{\,f\in W^r(a,b):\, f^{(i)}(a)=f^{(i)}(b),\; 0\le i\le r-1\,\}, }

tzn. W~r(a,b) jest klasą funkcji z Wr(a,b), które można przedłużyć do funkcji, krórych wszystkie pochodne do rzędu r1 włącznie są (ba)-okresowe na R. Wtedy dla dowolnej funkcji fW~r(a,b) zerującej się w węzłach xj, oraz dla dowolnej s~𝒮~r mamy

Parser nie mógł rozpoznać (nieznana funkcja „\mylabel”): {\displaystyle \displaystyle \mylabel{odpl} \int_a^b f^{(r)}(x)\tilde s^{(r)}(x)\,dx\,=\,0. }

Wynika z niego jednoznaczność rozwiązania zadania interpolacyjnego dla okresowych funkcji f (tzn. takich, że f(a)=f(b)), jak również odpowiednia własność minimalizacyjna okresowych funkcji sklejanych. Dokładniej, jeśli fW~r(a,b) oraz s~f𝒮~r interpoluje f w węzłach xj, 0jn, to

ab(f(r)(x))2dxab(s~f(r)(x))2dx.

Dygresja o najlepszej aproksymacji

Klasyczne zadanie aproksymacyjne w przestrzeniach funkcji definiuje się w następujący sposób.

Niech F będzie pewną przestrzenią liniową funkcji Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle f:[a,b]\toR} , w której określona została norma . Niech VnF będzie podprzestrzenią w F wymiaru n. Dla danej fF, należy znaleźć funkcję vfF taką, że

fvf=minvVnfv.

Okazuje się, że tak postawione zadanie ma rozwiązanie vf, choć nie zawsze jest ono wyznaczone jednoznacznie.

Jako przykład, rozpatrzmy F=Wr(a,b). Utożsamiając funkcje f1,f2Wr(a,b) takie, że f1(x)f2(x)Πr1, zdefiniujemy w Wr(a,b) normę

f=ab(f(r)(x))2dx.

Dla ustalonych węzłów a=x0<<xn=b, niech

Vn+1=𝒮r

będzie podprzestrzenią w Wr(a,b) naturalnych funkcji sklejanych rzędu r opartych węzłach xj, 0jn. Oczywiście dim𝒮r=n+1, co wynika z jednoznaczności rozwiązania w 𝒮r zadania interpolacji. Okazuje się, że wtedy optymalną dla fWr(a,b) jest naturalna funkcja sklejana sf interpolująca f w węzłach xj, tzn.

fsf=mins𝒮rfs.

Rzeczywiście, ponieważ norma w przestrzeni Wr(a,b) generowana jest przez iloczyn skalarny

(f1,f2)=abf1(r)(x)f2(r)(x)dx,

jest to przestrzeń unitarna. Znane twierdzenie mówi, że w przestrzeni unitarnej najbliższą danej f funkcją w dowolnej domkniętej podprzestrzeni V jest rzut prostopadły f na V, albo równoważnie, taka funkcja vfVn+1, że iloczyn skalarny

(fvf,v)=0,vV.

W naszym przypadku, ostatnia równość jest równoważna

ab(fvf)(r)(x)s(r)(x)dx=0,s𝒮r.

To zaś jest prawdą, gdy vf interpoluje f w punktach xj, czyli vf=sf.

Dodajmy jeszcze, że nie zawsze interpolacja daje najlepszą aproksymację w sensie klasycznym.

Literatura

W celu dogłębnego zapoznania się z omawianym na wykładzie materiałem, przeczytaj rozdział 6.4 w

  • D. Kincaid, W. Cheney Analiza numeryczna, Wydawnictwa Naukowo-Techniczne, Warszawa 2006, ISBN 83-204-3078-X.
Warto także zapoznać się (nieobowiązkowo) z rozdziałami 6.5 i 6.6 tamże.