MN14: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Przykry (dyskusja | edycje)
mNie podano opisu zmian
 
m Zastępowanie tekstu – „,↵</math>” na „</math>,”
 
(Nie pokazano 28 wersji utworzonych przez 3 użytkowników)
Linia 1: Linia 1:
=Przykładowy wykład=


{{definicja|Trójkąt prostokątny|dfn:kat_prosty|'''Trójkątem prostokątnym''' nazywamy taki trójkąt, który ma przynajmniej jeden kątprosty.
<!--
Konwertowane  z pliku LaTeX przez latex2mediawiki, zob. http://www.ii.uj.edu.pl/&nbsp;pawlik1/latex2mediawiki.php.
Niezb�dne rozszerzenia i modyfikacje oryginalnego latex2mediawiki
wprowadzi� przykry@mimuw.edu.pl
-->
=Całkowanie=
 
{{powrot |Metody numeryczne | do strony głównej
przedmiotu <strong>Metody numeryczne</strong>}}
 
Zajmiemy się teraz zadaniem całkowania numerycznego.
Polega ono na obliczeniu (a raczej przybliżeniu)
całki oznaczonej 
 
<center><math>S(f)\,=\,\int_a^b f(x)\,dx,
</math></center>
 
gdzie <math>-\infty<a<b<+\infty</math>, a <math>f</math> należy do pewnej klasy
<math>F</math> funkcji rzeczywistych określonych i całkowalnych w
sensie Riemanna na całym przedziale <math>[a,b]</math>.
 
Każdy, kto przeszedł przez [[Analiza_matematyczna_1/Wykład_14:_Całka_Riemanna_funkcji_jednej_zmiennej|kurs całkowania]] wie, że obliczanie całek rozumiane jako znalezienie elementarnego wzoru na funkcję pierwotną może być trudne, bardzo trudne, a nawet niewykonalne. Tymczasem zadanie <strong>przybliżonego</strong> wyznaczenia wartości całki daje się w dużej mierze zautomatyzować z całkiem dobrym skutkiem.
 
Obliczanie całek jest wymagane w bardzo wielu zadaniach inżynierskich i naukowych. Całki z funkcji (bardzo) wielu zmiennych (które na swój sposób są szczególnie trudne do obliczenia) znajdują ważne zastosowania w bankowości i finansach.
 
Będziemy zakładać, że mamy możliwość obliczania
wartości funkcji <math>f</math>, a w niektórych przypadkach
również jej pochodnych, o ile istnieją. Dokładna
całka <math>S(f)</math> będzie więc w ogólności przybliżana
wartością <math>A(f)</math>, która zależy tylko od wartości <math>f</math>
i ewentualnie jej pochodnych w skończonej liczbie punktów.
 
==Kwadratury==
 
<strong>Kwadraturami</strong> nazywamy funkcjonały liniowe <math>Q:F\to R</math>
postaci
 
<center><math>Q(f)\,=\,\sum_{i=0}^n a_i f(x_i)</math>,</center>
 
albo ogólniej
 
<center><math>
  Q(f)\,=\,\sum_{i=0}^k\sum_{j=0}^{n_i-1}
                  a_{i,j}f^{(j)}(x_i),
</math></center>
 
gdzie <math>x_i</math> są punktami z <math>[a,b]</math>, a <math>a_i</math> (albo <math>a_{i,j}</math>)
są pewnymi współczynnikami rzeczywistymi. Zauważmy,
że obliczenia kwadratur są dopuszczalne w naszym modelu
obliczeniowym, mogą więc służyć jako sposób
przybliżania całki.
 
Jeden z możliwych sposobów konstrukcji kwadratur jest
następujący. Najpierw wybieramy węzły <math>x_j</math> (pojedyncze
lub wielokrotne), budujemy wielomian interpolacyjny
odpowiadający tym węzłom, a następnie całkujemy go.
Ponieważ postać wielomianu interpolacyjnego zależy tylko
od danej informacji o <math>f</math>, otrzymana w ten sposób wartość
też będzie zależeć tylko od tej informacji, a w
konsekwencji funkcjonał wynikowy będzie takiej postaci,
jak wyżej. Są to tzw. kwadratury interpolacyjne.
 
{{definicja|||
Kwadraturę <math>Q^I</math> opartą na węzłach
o łącznej krotności <math>n+1</math> nazywamy interpolacyjną,
jeśli
 
<center><math>Q^{I}(f)\,=\,\int_a^b w_f(x)\,dx,
</math></center>
 
gdzie <math>w_f</math> jest wielomianem interpolacyjnym funkcji <math>f</math>
stopnia co najwyżej <math>n</math>, opartym na tych węzłach.
}}
 
Współczynniki kwadratur interpolacyjnych można łatwo
wyliczyć. Rozpatrzmy dla uproszczenia przypadek, gdy
węzły są jednokrotne. Zapisując wielomian interpolacyjny
w postaci jego rozwinięcia w [[MN09#Baza Lagrange'a (kanoniczna)|bazie kanonicznej Lagrange'a]]
<math>l_i</math>, otrzymujemy
 
<center><math>Q^{I}(f) \,=\, \int_a^b \sum_{i=0}^n f(x_i)l_i(x)\,dx
          \,=\, \sum_{i=0}^n f(x_i)\int_a^b l_i(x)\,dx,
</math></center>
 
a stąd i z postaci <math>l_i</math>,
 
<center><math>a_i\,=\,\int_a^b \frac
  {(x-x_0)\cdots(x-x_{i-1})(x-x_{i+1})\cdots(x-x_n)}
  {(x_i-x_0)\cdots(x_i-x_{i-1})(x_i-x_{i+1})\cdots(x_i-x_n)}
    \,dx</math>,</center>
 
<math>0\le i\le n</math>.
 
Podamy teraz kilka przykładów.
 
<strong>Kwadratura prostokątów</strong> jest oparta na jednym węźle
<math>x_0=(a+b)/2</math>,
 
<center><math>Q^{I}_0(f)\,=\,(b-a)f\Big(\frac{a+b}2\Big)</math></center>
 
[[Image:MNprostokaty.png|thumb|550px|center|Kwadratura prostokątów]]
 
<strong>Kwadratura trapezów</strong> jest oparta na jednokrotnych
węzłach <math>x_0=a</math>, <math>x_1=b</math> i jest równa polu odpowiedniego
trapezu,
 
<center><math>Q^{I}_1(f)\,=\,T(f)\,=\,\frac{b-a}2 \Big(f(a)+f(b)\Big)
</math></center>
 
[[Image:MNtrapezy.png|thumb|550px|center|Kwadratura trapezów]]
 
<strong>Kwadratura parabol (Simpsona)</strong> jest oparta na
jednokrotnych węzłach <math>x_0=a</math>, <math>x_1=b</math>, <math>x_2=(a+b)/2</math>,
i jest równa polu pod parabolą interpolującą <math>f</math>
w tych węzłach,
 
<center><math>Q^I_2(f)\,=\,P(f)\,=\,\frac{b-a}6
    \Big( f(a)+4f\Big(\frac{a+b}2\Big)+f(b) \Big)
</math></center>
 
Zauważmy, że kwadratury trapezów i parabol są oparte
na węzłach jednokrotnych i równoodległych, przy czym
<math>x_0=a</math> i <math>x_n=b</math>. Ogólnie, kwadratury interpolacyjne
oparte na węzłach równoodległych <math>x_i=a+(b-a)i/n</math>,
<math>0\le i\le n</math>, nazywamy <strong>kwadraturami Newtona--Cotesa</strong>.
 
==Błąd kwadratur interpolacyjnych==
 
Zajmiemy się teraz błędem kwadratur interpolacyjnych.
Przypomnijmy, że <math>F^r_M([a,b])</math> oznacza klasę funkcji
<math>(r+1)</math> razy różniczkowalnych w sposób ciągły
i takich, że <math>|f^{(r+1)}(x)|\le M</math>, <math>\forall x</math>.
 
{{twierdzenie|O błędzie kwadratur interpolacyjnych|O błędzie kwadratur interpolacyjnych|
 
Niech <math>Q^I</math> będzie kwadraturą
interpolacyjną opartą na (jednokrotnych lub wielokrotnych)
węzłach <math>x_i</math>, <math>0\le i\le n</math>. Jeśli <math>f\in F^n_M([a,b])</math>, to
 
<center><math>
  |S(f)\,-\,Q^I(f)|\,\le\,\frac M{(n+1)!}(b-a)^{n+2}.
</math></center>
 
W klasie <math>F^n_M([a,b])</math> maksymalny błąd kwadratury <math>Q^I</math> 
wynosi
 
<center><math>\sup_{f\in F_M^n([a,b])} |S(f)-Q^I(f)|\,=\,\frac M{(n+1)!}
    \int_a^b |(x-x_0)(x-x_1)\cdots(x-x_n)|\,dx</math></center>
 
}}
 
{{dowod|||
Korzystając ze znanego nam już wzoru na
[[MN09#Postać błędu interpolacji|błąd interpolacji wielomianowej]], mamy
 
<center><math>S(f)\,-\,Q^{I}(f)\,=\,\int_a^b
(x-x_0)(x-x_1)\cdots(x-x_n)f(x_0,x_1,\ldots,x_n,x)\,dx</math></center>
 
Stąd, jeśli <math>f\in F^n_M([a,b])</math>, to
 
<center><math>|S(f)\,-\,Q^I(f)|\,\le\,\int_a^b (b-a)^{n+1}\frac M{(n+1)!}\,dx
    \,=\,(b-a)^{n+2}\frac M{(n+1)!}</math></center>
 
Ograniczenie górne w dokładnej formule na błąd w klasie
<math>F^n_M([a,b])</math> wynika bezpośrednio.
Aby pokazać ograniczenie dolne zauważmy, że dla funkcji <math>g</math>
takiej, że <math>g^{(n+1)}</math> przyjmuje na przedziałach <math>(a,x_0)</math>,
<math>(x_0,x_1)</math>, <math>\ldots</math>, <math>(x_n,b)</math> naprzemiennie wartości
<math>M</math> i <math>-M</math> mamy
 
<center><math>|S(g)-Q^I(g)|\,=\,\frac M{(n+1)!}
    \int_a^b |(x-x_0)(x-x_1)\cdots(x-x_n)|\,dx</math></center>
 
Co prawda, <math>g</math> nie jest w <math>F^n_M([a,b])</math>, ale może być
dla dowolnego <math>\epsilon>0</math> przybliżana funkcjami
<math>f_\epsilon\in F^n_M([a,b])</math> w ten sposób, że całka
 
<center><math>\int_a^b |(x-x_0)\cdots(x-x_n)(f-g)^{(n+1)}(x)|\,dx
    \,\le\,\epsilon\,(n+1)!</math></center>
 
Zapisując <math>f_\epsilon=g+(f_\epsilon-g)</math> mamy
 
<center><math>\begin{align} |S(f_\epsilon)\,-\,Q^I(f_\epsilon)| &\le & |S(g)\,-\,Q^I(g)|\,+\,
      |S(f_\epsilon-g)-Q^I(f_\epsilon-g)| \\
  &\le & \frac M{(n+1)!}\int_a^b |(x-x_0)\cdots(x-x_n)|
    \,dx\,+\,\epsilon,
\end{align}</math></center>
 
co wobec dowolności <math>\epsilon</math> daje dowód twierdzenia.
}}
 
W szczególnych przypadkach kwadratur trapezów <math>T</math>
i parabol <math>P</math> możemy otrzymać innego rodzaju formuły
na błąd.
 
{{twierdzenie|O postaci błędu kwadratury trapezów i Simpsona|O postaci błędu kwadratury trapezów i Simpsona|
 
Jeśli <math>f\in C^{(2)}([a,b])</math>,
to dla kwadratury trapezów mamy
 
<center><math>S(f)\,-\,T(f)\,=\,-\frac{(b-a)^3}{12}f^{(2)}(\xi_1)</math></center>
 
Jeśli <math>f\in C^{(4)}([a,b])</math>, to dla kwadratury
parabol mamy
 
<center><math>S(f)\,-\,P(f)\,=\,-\frac{(b-a)^5}{2280}f^{(4)}(\xi_2)</math></center>
 
(<math>\xi_1,\xi_2\in [a,b]</math>).  
}}
}}
{{twierdzenie|Pitagoras|thm:pitagoras|
W trójkącie prostokątnym o przyprostokątnych <math>a</math>, <math>b</math> i przeciwprostokątnej <math>c</math>
{\em zawsze} zachodzi
{<math>a2+b2 = c2,
</math>}
[[#eq:wujek]]}}
<span id="eq:wujek"/> <math>a2 + b2 = 10
</math>
\rysunek{WIKItrojkat.png}{Ilustracja twierdzenia Pitagorasa.}


\begin{proof}
{{dowod|||
Prosty dowód twierdzenia Pitagorasa może być {\em czysto geometryczny}, dlatego
Najpierw udowodnimy część dotyczącą kwadratury trapezów.
pomijamy go, w zamian przedstawiając działający aplet:
Ze wzoru na błąd kwadratury,
 
<center><math>S(f)\,-\,T(f)\,=\,\int_a^b (x-a)(x-b)f(a,b,x)\,dx</math></center>
 
Ponieważ funkcja <math>x\mapsto f(a,b,x)</math> jest ciągła, a
wielomian <math>(x-a)(x-b)</math> przyjmuje jedynie wartości
nieujemne, można zastosować twierdzenie o wartości
średniej dla całki, aby otrzymać
 
<center><math>\begin{align} S(f)\,-\,T(f) &= f(a,b,c)\int_a^b (x-a)(x-b)\,dx \\
    &= -\frac{f^{(2)}(\xi_1)}{2!}\frac{(b-a)^3}6,
\end{align}</math></center>
 
dla pewnych <math>c,\xi_1\in [a,b]</math>.
 
Teraz zajmiemy się kwadraturą parabol.
Niech <math>w_{f,2}\in\Pi_2</math> i <math>w_{f,3}\in\Pi_3</math> będą
wielomianami interpolacyjnymi funkcji <math>f</math> odpowiednio dla
węzłów <math>a,b,(a+b)//2</math> oraz <math>a,b,(a+b)//2,(a+b)//2</math>. Wtedy
 
<center><math>w_{f,3}(x)\,=\,w_{f,2}(x)\,+\,
    f\Big(a,b,\frac{a+b}2,\frac{a+b}2\Big)
      (x-a)\Big(x-\frac{a+b}2\Big)(x-b).
</math></center>
 
Wobec
 
<center><math>\int_a^b (x-a)\Big(\frac{a+b}2\Big)(x-b)\,dx\,=\,0
</math></center>
 
mamy
 
<center><math>P(f) \,=\, \int_a^b w_{f,2}(x)\,dx\,=\,
          \int_a^b w_{f,3}(x)\,dx</math></center>
 
Stąd i ze wzoru na błąd interpolacji Hermite'a otrzymujemy


\applet{WIKIpitagoras.jar}{Dowód twierdzenia Pitagorasa.}
<center><math>\begin{align}  S(f)\,-\,P(f)\;=\;\int_a^b (f-w_{f,3})(x)\,dx  \\
    && =\; \int_a^b (x-a)\Big(x-\frac{a+b}2\Big)^2(x-b)
        f\Big(a,b,\frac{a+b}2,\frac{a+b}2,x\Big)\,dx.  
\end{align}</math></center>


Dodatkowo, skądinąd wiadomo, że twierdzenie jest prawdziwe, co kończy dowód.
Ponieważ wielomian <math>(x-a)(x-(a+b)/2)^2(x-b)</math> jest
\end{proof}
niedodatni na <math>[a,b]</math>, możemy znów zastosować twierdzenie  
o wartości średniej. Mamy


[[#thm:pitagoras|twierdzeniu Pitagorasa]] [[#dfn:kat_prosty]] [http://www.microsoft.com[PowerPoincie]]
<center><math>\begin{align} S(f)\,-\,P(f) &= f\Big(a,b,\frac{a+b}2,\frac{a+b}2,c\Big) \\
  && \qquad\qquad\qquad
  \int_a^b (x-a)\Big(x-\frac{a+b}2\Big)^2(x-b)\,dx \\
  &= -\frac{f^{(4)}(\xi_2)}{4!}\frac{(b-a)^5}{120},
\end{align}</math></center>


{{stwierdzenie|||Nie każdy trójkąt jest prosty.
co kończy dowód.
}}
}}
\flash{WIKIvideo.swf}{Przegląd możliwych trójkątów}


{{wniosek|||Są trójkąty o bokach długości <math>a</math>, <math>b</math>, <math>c</math>, dla których <math>a2 + b2 \neq c2</math>.
==Kwadratury złożone==
 
Chcielibyśmy, aby błąd kwadratur malał do zera, gdy liczba
węzłów rośnie do nieskończoności. Można to osiągnąć stosując
np. <strong>kwadratury złożone</strong>. Są to kwadratury, które
powstają przez scałkowanie funkcji kawałkami
wielomianowej interpolującej <math>f</math>.
 
[[grafika:Riemann.jpg|thumb|right||Georg Riemann<br>  [[Biografia Riemann|Zobacz biografię]]]]
 
Prostym przykładem kwadratury złożonej jest ''suma Riemanna'',
 
<center><math>\bar Q(f)\,=\,\sum_{i=0}^n (t_{i+1}-t_i)f(x_i),
</math></center>
 
gdzie <math>a=t_0<t_1<\cdots<t_{n+1}=b</math> oraz
<math>x_i\in [t_i,t_{i+1}]</math>. Jeśli średnica podziału,  
<math>\max_{0\le i\le n}(t_i-t_{i-1})</math>, maleje do zera, to
<math>\lim_{n\to\infty}\bar Q(f)=S(f)</math>.
 
Będziemy rozpatrywać kwadratury złożone postaci
 
<center><math>\bar Q(f)\,=\,\int_a^b \bar w_f(x)\,dx,
</math></center>
 
gdzie <math>\bar w_f</math> jest kawałkami wielomianem. Dokładniej,
dla danego <math>n</math> kładziemy <math>t_i=a+(b-a)i/k</math>, <math>0\le i\le k</math>,  
a następnie dla każdego <math>i</math> wybieramy dowolne węzły
<math>x_{i,j}\in [t_{i-1},t_i]</math>, <math>0\le j\le r</math>. Wtedy <math>\bar w_f</math>
jest na każdym przedziale wielomianem interpolacyjnym
funkcji <math>f</math> stopnia co najwyżej <math>r</math> opartym na węzłach
<math>x_{i,j}</math>. Kwadratura <math>\bar Q</math> korzysta z węzłów
o łącznej krotności <math>n\le k(r+1)</math>.
 
{{twierdzenie|O błędzie kwadratur złożonych|O błędzie kwadratur złożonych|
 
Błąd kwadratury złożonej
<math>\bar Q(f)</math> w klasie <math>F^r_M([a,b])</math> jest ograniczony przez
 
<center><math>\sup_{f\in F^r_M([a,b])} |S(f)-\bar Q(f)|\,\le\,
    \frac{(b-a)^{r+2}}{k^{r+1}}
    \frac{M}{(r+1)!}\,\le\,C\,\Big(\frac 1n\Big)^{r+1},
</math></center>
 
gdzie
 
<center><math>C\,=\,\frac{M(r+1)^{r+1}(b-a)^{r+2}}{(r+1)!}</math></center>
 
}}
}}
{{uwaga|||To nie jest cała prawda o trójkątach! Dodatkowo, wiemy, że:
*w każdym trójkącie o bokach <math>a</math>, <math>b</math>, <math>c</math> zachodzi:
*;{<math>a+b \geq c
</math>}
*;
*suma kątów w trójkącie jest większa od 90 stopni
*;
*itd.
*;


{{dowod|||
Twierdzenie to jest bezpośrednim  wnioskiem z [[#O błędzie kwadratur interpolacyjnych|twierdzenia o błędzie kwadratur interpolacyjnych]]. Mamy bowiem
<center><math>\begin{align} |S(f)-\bar Q(f)| &\le & \sum_{i=1}^k
    \int_{t_{i-1}}^{t_i} |f(x)-\bar w_f(x)|\,dx \\
    &\le & \sum_{i=1}^k \Big(\frac{b-a}{k}\Big)^{r+2}
              \frac M{(r+1)!} \,=\,
    \frac{(b-a)^{r+2}}{k^{r+1}}\frac M{(r+1)!},
\end{align}</math></center>
co kończy dowód.
}}
}}
Ciekawa może być w tym kontekście następująca nierówność:


{{fakt|||Dla <math>a,b>0</math>,
W klasie <math>F^r_M([a,b])</math>, błąd kwadratur złożonych
jest rzędu <math>n^{-(r+1)}</math>. Można pokazać, że błąd każdej
innej metody całkowania korzystającej jedynie
z wartości funkcji w <math>n</math> punktach nie może w klasie
<math>F^r_M([a,b])</math> maleć szybciej niż <math>n^{-(r+1)}</math>.
Podane kwadratury złożone mają więc optymalny rząd
zbieżności.
 
Zajmiemy się teraz błędem szczególnych kwadratur
złożonych, mianowicie złożonych kwadratur trapezów
<math>\bar T_k</math> i parabol <math>\bar P_k</math>. Powstają one przez
zastosowanie na każdym przedziale <math>[t_{i-1},t_i]</math>
odpowiednio kwadratur trapezów <math>T</math> i parabol <math>P</math>.
 
[[Image:MNzlozonetrapezy.png|thumb|550px|center|Złożona kwadratura trapezów]]
 
Jak łatwo się przekonać,
 
<center><math>\bar T_k(f)\,=\,\frac{b-a}{k}\left(\frac{f(a)+f(b)}2
    \,+\,\sum_{j=1}^{k-1} f\Big(\frac jk\Big)\right),  
</math></center>
 
oraz
 
<center><math>\bar P_k(f)\,=\,\frac{b-a}{3k}\left(\frac{f(a)+f(b)}2
    \,+\,\sum_{j=1}^{k-1} f\Big(\frac jk\Big)\,+\,
        2\,\sum_{j=1}^k f\Big(\frac{2j-1}{2k}\Big)\right).
</math></center>
 
{{twierdzenie|O postaci błędu złożonych kwadratur trapezów i Simpsona|O postaci błędu złożonych kwadratur trapezów i Simpsona|
 
Jeśli <math>f\in C^{(2)}([a,b])</math>, to 
 
<center><math>S(f)\,-\,\bar T_k(f)\,=\,-\frac{(b-a)^3}{12\,k^2}
      f^{(2)}(\xi_1)</math></center>
 
Jeśli <math>f\in C^{(4)}([a,b])</math>, to
 
<center><math>S(f)\,-\,\bar P_k(f)\,=\,-\frac{(b-a)^5}{2280\,k^4}
      f^{(4)}(\xi_2)</math></center>
 
}}
}}


Wynika to wprost z poniższego lematu:
{{dowod|||
Dla kwadratury trapezów mamy


\begin{lem}
<center><math>\begin{align} S(f)\,-\,\bar T_k(f) \;=\; -\sum_{i=1}^k
Dla <math>a,b>0</math>,  
      \frac{(b-a)^3}{12 k^3}f^{(2)}(\alpha_i)  \\
{<math></math>}
    && =\;-\frac{(b-a)^3}{12 k^2}\frac 1k
\end{lem}
      \sum_{i=1}^k f^{(2)}(\alpha_i) \,=\,
    -\frac{(b-a)^3}{12 k^2} f^{(2)}(\xi_1),
\end{align}</math></center>


A teraz pora na przykład.
a dla kwadratury parabol podobnie


\begin{example}[Jak to działa]
<center><math>\begin{align} S(f)\,-\,\bar P_k(f) \;=\; -\sum_{i=1}^k
Można pliczyć na kalkulatorze, że rzeczywiście
      \frac{(b-a)^5}{2280 k^5}f^{(4)}(\beta_i) \\
\[
    && =\; -\frac{(b-a)^5}{2280 k^4}\frac 1k
32 + 42 = 52.
      \sum_{i=1}^k  f^{(4)}(\beta_i) \,=\,
\]
    -\frac{(b-a)^5}{2280 k^4} f^{(4)}(\xi_2).
\end{example}
\end{align}</math></center>


}}


==Równania==
Kwadratura parabol ma więc optymalny rząd zbieżności
nie tylko w klasie <math>F^2_M([a,b])</math>, ale też w <math>F^3_M([a,b])</math>.


<span id="eq:wujek"/> <math>a + b = c
==Przyspieszanie zbieżności kwadratur==
</math>
<span id=""/> <math>a + b &= c\\
c + d + e &= f
</math>
<span id=""/> <math>a + b = c
</math>
<span id=""/> <math>a + b &= c\\
c + d + e &= f
</math>


==Hiperłącza==
W praktyce często stosuje się obliczanie kwadratur
<span id="sec:hiper" \>
poprzez zagęszczanie podziału przedziału <math>[a,b]</math>.
Na zewnątrz:
Na przykład, dla złożonej kwadratury trapezów zachodzi
następujący wygodny wzór rekurencyjny:  


http://www.mimuw.edu.pl
<center><math>
[http://www.mimuw.edu.pl[Wydział Matematyki]]
  \bar T_{2k}\,=\,\frac 12\left(\bar T_k(f)\,+\,
Wewnątrz dokumentu:
      \frac{b-a}k\,\sum_{i=1}^k
*do definicji, twierdzeń, itp.:
      f\Big(\frac{2i-1}{2k}\Big)\right)</math></center>
*;
*; [[#thm:pitagoras|twierdzeniu Pitagorasa]] *; [[#dfn:kat_prosty|definicję kąta prostego]] *;stosowania slajdów.
*;
*; [[#code:hello|Hello World w C]] *;


Do innych wykładów na Osiłku:  
Pozwala on obliczyć <math>\bar T_{2k}(f)</math> na podstawie
<math>\bar T_k(f)</math> poprzez "doliczenie" wartości funkcji
w punktach "gęstszej" siatki. W ten sposób możemy
obserwować zachowanie się kolejnych przybliżeń
<math>\bar T_{2^s}(f)</math> (<math>s\ge 0</math>) całki <math>S(f)</math>. Jest to
szczególnie istotne wtedy, gdy nie mamy żadnej informacji
a priori o <math>\|f''\|_{ C([a,b])}</math>, a przez to nie potrafimy
oszacować liczby <math>n</math> węzłów, dla której osiągniemy
pożądaną dokładność.
 
Jeśli funkcja jest więcej niż dwa razy różniczkowalna,
to użycie złożonych kwadratur trapezów zdaje się tracić
sens. Wtedy istnieją przecież kwadratury, których błąd
maleje do zera szybciej niż <math>n^{-2}</math>. Okazuje się jednak,
że kwadratury <math>\bar T_k</math> mogą być podstawą dla prostej
rekurencyjnej konstrukcji innych kwadratur posiadających już
optymalną zbieżność. Konstrukcja ta bazuje na
następującym ważnym lemacie.
 
[[grafika:Euler.jpg|thumb|right||Leonhard Euler<br>  [[Biografia Euler|Zobacz biografię]]]]
 
[[grafika:Maclaurin.jpg|thumb|right||Colin Maclaurin<br>  [[Biografia Maclaurin|Zobacz biografię]]]]
 
{{lemat|Formuła Eulera-Maclaurina|Formuła Eulera-Maclaurina|
 
Dla funkcji <math>f\in C^{(2m+2)}([a,b])</math>, błąd złożonej
kwadratury trapezów <math>\bar T_k</math> wyraża się wzorem
 
<center><math>\begin{align} S(f)\,-\,\bar T_k(f) &= \sum_{i=1}^{m} c_ih^{2i}
  \Big(f^{(2i-1)}(b)-f^{(2i-1)}(a)\Big) \\
  &&\qquad\qquad\qquad \,+\,c_{m+1}h^{2m+2}(b-a)f^{(2m+2)}(\xi_{m,k}),
\end{align}</math></center>
 
gdzie <math>h=(b-a)/k</math>, <math>\xi_{m,k}\in[a,b]</math>, a <math>c_i</math> są pewnymi stałymi
liczbowymi. Mamy <math>c_1=-1/12</math>, <math>c_2=-1/720</math> i, ogólnie, 
<math>c_i=B_i/(2i)!</math>, gdzie <math>B_i</math> są tzw. liczbami Bernoulliego.
}}
 
Dowód tego lematu pominiemy.
 
Formułę Eulera-Maclaurina można przepisać w postaci
 
<center><math>S(f)\,-\,\bar T_k(f)\,=\,\sum_{i=1}^{m} c^{(0)}_i(f)\,k^{-2i}
    \,+\,c^{(0)}_{m+1,k}(f)\,k^{-(2m+2)}</math>,</center>
 
gdzie <math>c^{(0)}_i(f)=c_i(b-a)^{2i}(f^{(2i-1)}(b)-f^{(2i-1)}(a))</math>,
<math>1\le i\le m</math>, oraz
<math>c^{(0)}_{m+1,k}(f)=c_{m+1}(b-a)^{2m+2}f^{(2m+2)}(\xi_{m+1,k})</math>.
Zauważmy przy tym, że jeśli <math>f\in F^{2m+1}_M([a,b])</math>, to współczynniki
<math>c^{(0)}_{m+1,k}(f)</math> są wspólnie ograniczone przez <math>c_{m+1}(b-a)^{2m+2}M</math>.
 
Definiując teraz kwadraturę
 
<center><math>\bar T^1_k(f)\,=\,\frac{4\,\bar T_{2k}(f)\,-\,\bar T_k(f)}{3}</math>,</center>
 
dla <math>f\in C^{(4)}([a,b])</math> mamy
 
<center><math>\begin{align} S(f)\,-\,\bar T^1_k(f) &= \frac{4\,(S(f)-\bar T_{2k}(f)-
  (S(f)-\bar T_k(f))}{3} \\
  &= \frac 43\left(\frac{c^{(0)}_1(f)}{4k^2}+
      \frac{c^{(0)}_{2,2k}(f)}{4^2k^4}\right)\,-\,
      \frac 13\left(\frac{c^{(0)}_1(f)}{k^2}+
      \frac{c^{(0)}_{2,k}(f)}{k^4}\right) \\
  &= \frac{c^{(1)}_{2,k}(f)}{k^4},
\end{align}</math></center>
 
gdzie <math>c^{(1)}_{2,k}(f)=(1/12)c^{(0)}_{2,2k}(f)-(1/3)c^{(0)}_{2,k}(f)</math>
i jest wspólnie ograniczone dla <math>f\in F^3_M([a,b])</math>. Kwadratura <math>T^1_k</math>
ma więc optymalny w <math>F^3_M([a,b])</math> rząd zbieżności <math>k^{-4}</math>.
Proces ten można kontynuować dalej tworząc kolejne kwadratury
o coraz to wyższym rzędzie zbieżności. Dokładniej, połóżmy
<math>\bar T^0_k(f)=\bar T_k(f)</math> oraz, dla <math>s\ge 1</math>,
 
<center><math>
  \bar T^s_k(f)\,=\,\frac
  {4^s\,\bar T^{s-1}_{2k}(f)\,-\,\bar T^{s-1}_k(f)}{4^s-1}</math></center>
 
Wtedy, dla <math>f\in F^{2m+1}_M([a,b])</math>, rząd zbieżności
kwadratury <math>\bar T^m_k</math> wynosi <math>k^{-(2m+2)}</math>. Rzeczywiście,
sprawdziliśmy, że jest to prawdą dla <math>m=0,1</math>. Niech <math>m\ge 2</math>.
Postępując indukcyjnie dla <math>s=1,2,\ldots,m</math> mamy
 
<center><math>\begin{align}  S(f)\,-\,\bar T^s_k(f) \;=\;
  \frac{ 4^s(S(f)-\bar T^{s-1}_{2k}(f))-
  (S(f)-\bar T^{s-1}_k(f)) }{ 4^s\,-\,1 }  \\
  &&=\; \left( 4^s\,\left(\sum_{i=s}^{m}c_i^{(s-1)}(f)(2k)^{-2i}+
      c_{m+1,2k}^{(s-1)}(f)(2k)^{-(2m+2)}\right)\right. \\
  && \left.\quad \,-\,\left( \sum_{i=s}^mc_i^{(s-1)}(f)k^{-2i}+
      c_{m+1,k}^{(s-1)}(f)k^{-(2m+2)}
      \right) \right)\,\frac{1}{4^s\,-\,1}\\
  &&=\; \sum_{i=s+1}^m c_i^{(s)}(f)k^{-2i}\,+\,
        c_{m+1,k}^{(s)}(f)k^{-(2m+2)},
\end{align}</math></center>
 
ponieważ współczynniki przy <math>k^{-2s}</math> redukują się.
<math>c_i^{(s)}(f)</math> są tutaj pewnymi nowymi stałymi, a
<math>c_{m+1,k}^{(s)}(f)</math> może być w klasie <math>F^{2m+1}_M([a,b])</math>
ograniczona przez stałą niezależną od <math>f</math>. Ostatecznie, dla
<math>s=m</math> mamy więc
 
<center><math>S(f)\,-\,\bar T^m_k(f)\,=\,c_{m+1,k}^{(m)}(f)k^{-(2m+2)}
</math></center>
 
i w klasie <math>F^{2m+1}_M([a,b])</math>
 
<center><math>|S(f)\,-\,\bar T^m_k(f)|\,\le\,c_m\, k^{-(2m+2)}
</math></center>
 
dla pewnej stałej <math>c_m</math> niezależnej od <math>f</math>.
 
Zauważmy jeszcze, że <math>\bar T^m_k</math> wykorzystuje
<math>n=k2^m+1</math> wartości <math>f</math> w punktach równoodległych
na <math>[a,b]</math>, co oznacza, że w terminach <math>n</math> rząd
zbieżności wynosi też <math>n^{-(2m+2)}</math>, a więc jest
optymalny w klasie <math>F^{2m+1}_M([a,b])</math>.
 
Kwadratury <math>\bar T^s_k</math> nazywane są <strong>kwadraturami
Romberga</strong>. Dla danej funkcji <math>f</math> można je łatwo
konstruować, budując następującą tablicę trójkątną:
 
<center><math>
  \begin{array} {cccccc}
  \bar T^0_1(f) \\
  \bar T^0_2(f) &\bar T^1_1(f) \\
  \bar T^0_4(f) &\bar T^1_2(f) &\bar T^2_1(f) \\
  \bar T^0_8(f) &\bar T^1_4(f) &\bar T^2_2(f)
                                &\bar T^3_1(f) \\
  \vdots &\vdots &\vdots &\vdots &\ddots \\
  \bar T^0_{2^s}(f) &\bar T^1_{2^{s-1}}(f)
        &\bar T^2_{2^{s-2}}(f) &\bar T^3_{2^{s-3}}(f)
        &\cdots &\bar T^s_1(f),
  \end{array}
</math></center>
 
której kolumny tworzone są
zgodnie z powyższymi wzorami.
 
==Kwadratury adaptacyjne==
 
jak wcześniej zauważyliśmy, błąd kwadratury prostej zależy m.in. od wielkości pochodnej <math>f^{(r+1)}</math> funkcji podcałkowej. Odpowiednia kwadratura złożona wydaje się tego nie zauważać i zagęszcza podział przedziału całkowania jednostajnie, podczas gdy naturalnym i prostym wydaje się pomysł gęstszego podziału tam gdzie <math>|f^{(r+1)}(x)|</math> jest "duża" i rzadszego tam, gdzie <math>f^{(r+1)}(x)|</math> jest "mała". Nasz entuzjazm do tego pomysłu może jednak skutecznie ostudzić uwaga, że  algorytm na wejściu zwykle nie dostaje żadnej informacji o <math>f^{(r+1)}</math>. Okazuje się, że mimo wszystko nie stoimy na straconej pozycji. Algorytm obliczający całkę dysponuje na każdym pewną dodatkową informacją o <math>f</math> w postaci jej wartości w pewnych punktach; następny punkt (podział przedziału całkowania) może więc być wybrany na podstawie tych wartości.
 
Metody uzależniające swoje działanie od konkretnego zadania, które
rozwiązują (w naszym przypadku od funkcji podcałkowej) nazywamy ogólnie
<strong>metodami adaptacyjnymi</strong>.
 
Zauważmy, że poznana wcześniej metoda bisekcji przybliżonego znajdowania
zera funkcji jest typową metodą adaptacyjną. Zobaczymy teraz, na przykładzie
adaptacyjnej kwadratury Simpsona, jak można wykorzystać adaptację
w problemie numerycznego całkowania.
 
Niech, tak jak poprzednio, <math>\bar P_k</math> będzie złożoną kwadraturą Simpsona
z równym podziałem przedziału całkowania na <math>k</math> podprzedziałów, zastosowaną
na odcinku <math>[a,b]</math>.  W szczególności, <math>\bar P_1=P</math> jest prostą kwadraturą
Simpsona. Wtedy
 
<center><math>
  S(f)-\bar P_2(f)\,=\,-\frac{(b-a)^5}{2280\cdot 2^4}f^{(4)}(\xi_2)</math>,</center>
 
oraz
 
<center><math>\begin{align} \bar P_1(f) - \bar P_2(f) &= (S(f)-\bar P_2(f))\,-\,(S(f)-\bar P_1(f)) \\
      &= \frac{(b-a)^5}{2280}\left(f^{(4)}(\xi_1)-\frac 1{16}f^{(4)}(\xi_2)\right),
\end{align}</math></center>
 
<math>\xi_1,\xi_2\in [a,b]</math>. Załóżmy teraz, że <math>f^{(4)}</math> ma stały znak na <math>[a,b]</math> oraz
przedział ten jest na tyle mały, że <math>f^{(4)}</math> jest "prawie stała". Wtedy
<math>f^{(4)}(\xi_1)-f^{(4)}(\xi_2)/16\approx 15\cdot f^{(4)}(\xi_2)/16</math>, a stąd
otrzymujemy <strong>estymator błędu</strong>
 
<center><math>
S(f) - \bar P_2(f) \approx  -\frac{1}{15}\cdot (\bar P_1(f) -\bar P_2(f))</math></center>
 
Ta przybliżona równość jest podstawą adaptacyjnej kwadratury Simpsona, może
bowiem posłużyć do oszacowania błędu na podprzedziałach.
 
Załóżmy teraz, że chcemy obliczyć wartość całki z dokładnością <math>\varepsilon>0</math>.
Obliczamy <math>\bar P_1(f)</math>, <math>\bar P_2(f)</math> i sprawdzamy, czy
<math>|\bar P_1(f)-\bar P_2(f)|/15\le\varepsilon</math>. Jeśli tak, to <math>\bar P_2(f)</math> jest ostateczną aproksymacją całki na <math>[a,b]</math>, a jeśli nie, to dzielimy przedział na dwa podprzedziały <math>[a,(a+b)/2]</math> i <math>[(a+b)/2,b]</math> i powtarzamy procedurę dla obu podprzedziałów z tolerancją błędu <math>\varepsilon/2</math>.
Cały proces można zgrabnie zapisać za pomocą funkcji rekurencyjnej.
 
{{algorytm|Adaptacyjna kwadratura Simpsona|Adaptacyjna kwadratura Simpsona|
<pre>adaptiveSimpson(a,b,f,e)
{
P1 = Simpson(a,b,f);
P2 = Simpson(a,(a+b)/2,f) + Simpson((a+b)/2,b,f);
if ( abs(P1-P2) < 15*e)
return( P2 );
else
return( adaptiveSimpson(a,(a+b)/2,f,e/2) + adaptiveSimpson((a+b)/2,b,f,e/2) );
}
</pre>}}
 
Zauważmy, że funkcja ta zakończy działanie. Rzeczywiście, na podprzedziale
długości <math>h</math> chcemy obliczać całkę z dokładnością <math>\varepsilon h/(b-a)</math>, a ponieważ różnica <math>|P1-P2|</math> jest rzędu <math>h^5</math>, kryterium kończenia procedury będzie spełnione dla każdego <math>h</math> dostatecznie małego. Podziały nie mogą więc następować w nieskończoność.
 
Trochę gorzej sprawa przedstawia się z błędem. Algorytm bazuje bowiem na
jego estymatorze. Jeśli po zakończeniu algorytmu mamy podział na podprzedziały <math>a=x_0<x_1<\cdots <x_n=b</math> oraz estymator działa poprawnie na każdym podprzedziale, to błąd można w przybliżeniu oszacować przez
 
<center><math>\sum_{j=1}^n\varepsilon\cdot\frac{x_j-x_{j-1}}{b-a}\,=\,\varepsilon</math></center>
 
Z drugiej strony, możemy czasem trafić wyjątkowo "złośliwą" funkcję. Np. jeśli <math>f(a+j(b-a)/4)=0</math> dla <math>0\le j\le 4</math>, to już na początku estymator (fałszywie!) twierdzi, że błąd jest zerowy i kwadratura  zwróci zero mimo, że rzeczywista wartość całki może ''znacznie'' różnić się od zera. Istnieją pewne techniki, które przynajmniej częściowo zapobiegają tego typu zjawiskom, ale nie będziemy ich tutaj omawiać.
 
==Uwarunkowanie całkowania==
 
Zadanie całkowania zadanej funkcji jest, podobnie jak zadanie sumy dwóch liczb (w końcu całkowanie ma wiele wspólnego z sumowaniem!), bardzo dobrze bezwględnie uwarunkowane, natomiast uwarunkowanie względne może być nawet patologicznie duże. Dokładniej,
 
{{twierdzenie|O uwarunkowaniu zadania całkowania|O uwarunkowaniu zadania całkowania|
 
Niech <math>f</math> będzie funkcją całkowalną. Wtedy
 
<center><math>\mbox{cond} _{abs}(S,f) = 1
</math></center>
 
oraz
 
<center><math>\mbox{cond} _{rel}(S,f) = \frac{S(|f|)}{|S(f)|}</math>,</center>
 
gdzie błąd argumentu liczymy w normie <math>||f|| = \int_a^b|f(x)|\, dx</math>.
}}
 
{{dowod|||
Biorąc zaburzoną funkcję <math>\tilde{f}</math> taką, że <math>||\tilde{f} - f||\leq \epsilon</math> mamy
 
<center><math>|S(\tilde{f}) - S(f)| = |\int_a^b (\tilde{f} - f)(x) \, dx| \leq \epsilon</math>,</center>
 
skąd wynika teza.
}}
 
W szczególności zadanie całkowania będzie źle uwarunkowane względnie, gdy wartość całki jest bliska zeru, ale sama funkcja przyjmuje duże co do modułu wartości.
==Biblioteki==
 
W Octave dostępne są jedynie procedury całkujące funkcje skalarne jednej
zmiennej na odcinku:
<center><math>
I = \int_a^b f(x)\, dx</math></center>
Robi
to funkcja DQAGP ze znakomitego pakietu [http://www.netlib.org/quadpack  QUADPACK]. Najlepiej od razu posłużmy się przykładem.
 
<div style="margin-top:1em; padding-top,padding-bottom:1em;">
<span  style="font-variant:small-caps;">Przykład: Prosta całka funkcji jednej zmiennej</span>
<div class="solution" style="margin-left,margin-right:3em;">
 
Przypuśćmy, że chcemy obliczyć całkę <math>I = \int_0^1 F(x)\, dx</math>,
gdzie np. <math>F(x) = \sin(23x) + (1-x^2)^{-1/2}</math>. W tym celu najpierw
implementujemy <math>F</math> w Octave:
 
<div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>function y = F(x)
y = sin(23*x)+1/sqrt(1-x^2);
endfunction
</pre></div>
Aby teraz obliczyć całkę <math>I = \int_0^1 F(x)\, dx</math>, wystarczy wywołać
 
<div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>I = quad("F", 0, 1);
</pre></div>
</div></div>
 
W rzeczywistości, podobnie jak w przypadku funkcji <code style="color: #006">fsolve</code>, funkcja
<code style="color: #006">quad</code> zwraca więcej informacji, można jej także przekazać dodatkowe
parametry. I tak, jeśli chcemy ustawić poziom tolerancji błędu obliczenia
całki:
 
<center><math>
|I - {quad(...)}| \leq max \{\text{ATOL}, \text{RTOL}\cdot I\}
</math></center>
 
z wartościami <math>\text{ATOL = 1e-3}</math> i  <math>\text{RTOL = 1e-6}</math>, to wywołamy funkcję
przekazując jej te parametry następująco:
 
<div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>quad("F", 0, 1, [1e-3, 1e-6]);
</pre></div>
Musimy jednak pamiętać, by pojęcia tolerancji "błędu" nie traktować zbyt
dosłownie: tym, co naprawdę kontroluje <code style="color: #006">quad</code> podczas wyznaczania
wartości całki, jest jedynie pewien <strong>estymator</strong> błędu,  dlatego wartość
tolerancji należy zawsze wybierać w sposób konserwatywny, czyli z pewnym zapasem
bezpieczeństwa, np.
 
<blockquote  style="background-color: #fefeee; padding:1em;  margin-left,margin-right:2em;  margin-top,margin-bottom: 1em;">  Jeśli chcemy wyznaczyć wartość całki z błędem bezwzględnym na
poziomie <math>10^{-6}</math>, ustawimy -- na wszelki wypadek --
<code style="color: #006">ATOL = 1e-7</code>, a nie, prostodusznie,
<code style="color: #006">ATOL = 1e-6</code>... Musimy także pamiętać, że  choć są bardzo mało
prawdopodobne do spotkania w praktyce, to jednak istnieją <strong>wyuzdane</strong>
funkcje, dla których estymator błędu może dać całkowicie fałszywe wartości,
przez co i obliczona całka może być obarczona dowolnie wielkim błędem.</blockquote>
 
 
 
===QUADPACK===
 
Właściwie jedynym klasycznym pakietem, jaki mamy do dyspozycji jest
ponaddwudziestoletni [http://www.netlib.org/quadpack  QUADPACK].
Jest to zestaw kilkunastu procedur fortranowskich, służących obliczaniu typowych całek jednowymiarowych:
 
{| border=1
|+ <span style="font-variant:small-caps"> </span>
|-
| Typ całki  ||  Procedura QUADPACKa
|-
|  <math>\int_a^b f(x)</math>  ||  <code style="color: #903">DQNG</code>, <code style="color: #903">DQAG</code>, <code style="color: #903">DQAGS</code>, <code style="color: #903">DQAGP</code>
|-
| <math>\int_{-\infty}^{\infty} f(x)</math>  ||  <code style="color: #903">DQAGI</code>
|-
| <math>\int_a^b f(x)\cos(\omega x)</math>  ||  <code style="color: #903">DQAWO</code>
|-
| <math>\int_a^b \dfrac{f(x)}{x-c}</math>  ||  <code style="color: #903">DQAWC</code>
|-
|
 
|}
 
oraz spora liczba podstawowych kwadratur, na których oparto te ogólne. Nazwy
procedur rozszyfrowuje się podobnie jak nazwy procedur LAPACKa, zatem
* przedrostek <code style="color: #903">D</code> w nazwie każdej  procedury wymienionej w tabeli (np. <code style="color: #903">DQAGI</code>) oznacza, że będzie działać na liczbach typu <code>double</code> (całkując funkcję <math>f</math> zwracającą wartości tego samego typu). Gdybyśmy chcieli użyć pojedynczej precyzji, użylibyśmy nazwy procedury ''bez przedrostka''.
* Kolejna litera, <code style="color: #903">Q</code>, oczywiście oznacza kwadraturę (''Quadrature'').
* Trzecia litera ---  <code style="color: #903">A</code> lub  <code style="color: #903">N</code> --- oznacza, odpowiednio, kwadraturę adaptacyjną lub nieadaptacyjną. Jak wiadomo, w praktyce lepiej sprawdzają się kwadratury adaptacyjne, potrafiące w jakiejś mierze dostosować się do przebiegu funkcji podcałkowej. Kwadratury nieadaptacyjne nie mają tej własności. Mogą natomiast, dla pewnych funkcji podcałkowych, okazać się tańsze, warto więc je stosować, gdy wiemy ''a priori'', że adaptacja niewiele pomoże: np. do wolnozmiennych funkcji.
* Pozostałe litery precyzują typ liczonej całki i zakres ingerencji użytkownika; <code style="color: #903">G</code> --- "zwykła" całka, bez wagi, <code style="color: #903">W</code> --- całka z wagą, <code style="color: #903">O</code> --- dla funkcji silnie oscylujących, <code style="color: #903">C</code> --- wartość główna całki (tzw. całka Cauchy'ego), <code style="color: #903">I</code> --- przedział nieskończony, <code style="color: #903">S</code> --- możliwe osobliwości, <code style="color: #903">P</code> --- użytkownik poda listę punktów, gdzie są osobliwości.
===GSL===
 
Biblioteka GSL reimplementuje podstawowe procedury QUADPACKa w języku C. Procedury GSL mają nazwy analogiczne, jak procedury
QUADPACKa, ale z przedrostkiem <code>gsl_integration</code>, jak w poniższym
przykładzie, gdzie  wywołamy odpowiednik procedury <code style="color: #903">DQAG</code>: funkcję
<code>gsl_integration_qag</code>.
 
<Source>#include <stdio.h>
#include <math.h>
#include <gsl/gsl_integration.h>
 
double F(double X, void * param) /* wrapper dla funkcji sin(x)/x */
{
return(sin(X)/X);
}
 
int main(void)
{
gsl_function f; /* argument z funkcją podcałkową */
 
double A,ABSERR,B, EPSABS,EPSREL,RESULT;
int IER,NEVAL;
 
gsl_integration_workspace *workspace;
 
int KEY, LIMIT;
 
/* przygotowujemy argument z funkcją podcałkową */
f.function = &F;
A = 0.0E0; B = 10*M_PI; /* przedział całkowania */
EPSABS = 0.0E0; EPSREL = 1.0E-3; /* tolerancja błędu */
 
/* parametry specyficzne dla QAG */
KEY = 1; /* tzn. użyj minimalnej liczby punktów kwadratury bazowej */
LIMIT = 100; /* maksymalny podział przedziału całkowania */
workspace  = gsl_integration_workspace_alloc(LIMIT);
/* całkujemy: QAG! */
 
IER = gsl_integration_qag(&f, A, B, EPSABS, EPSREL,
LIMIT, KEY, workspace, &RESULT, &ABSERR);
 
if (IER != 0)
fprintf(stderr,"GSL_QAG: Kłopoty z całkowaniem\n");
fprintf(stderr,"Całka: %g Est. błąd: %g IER: %d\n", RESULT, ABSERR,  IER);
 
gsl_integration_workspace_free(workspace);
return(0);
}
 
</Source>
W powyższym przykładzie specjalnie pozostawiliśmy oznaczenia wykorzystywane w
poprzednim programie. Jak widać, funkcje całkujące GSL mają bardzo podobną
składnię do odpowiadających im funkcji QUADPACKa.
 
Miłym rozszerzeniem funkcjonalności jest możliwość
przekazywania parametrów do wnętrza funkcji podcałkowej.
 
=Różniczkowanie=
 
{{powrot |Metody numeryczne | do strony głównej
przedmiotu <strong>Metody numeryczne</strong>}}
 
Z zadaniem numerycznego różniczkowania zadanej funkcji spotykamy się często w numeryce. Rzeczywiście, jeśli przypomnimy sobie [[MN02#Metoda siecznych|metodę siecznych]], była to po prostu metoda Newtona, w której pochodną przybliżono pewnym ilorazem różnicowym:
 
<center><math>x_{k+1} = x_k - \frac{f(x_k)}{g_k}</math>,</center>
 
gdzie <center><math>g_k = \frac{f(x_k)-f(x_{k-1})}{x_k - x_{k-1}} \approx f'(x_k)</math>.</center>
Zauważmy, że nie jest to jedyny możliwy wzór na przybliżoną metodę Newtona, równie dobrze(? --- to się dopiero okaże!) moglibyśmy wziąć
<center><math>
g_k = \frac{f(x_k+h)-f(x_k)}{h}
</math></center>
dla dostatecznie małego <math>h</math>.
 
Podobne formuły są także konieczne do konstrukcji metod numerycznego rozwiązywania [[Analiza matematyczna_2/Wykład 14:_Przegląd_metod_całkowania_równań_różniczkowych_zwyczajnych|równań różniczkowych]], gdzie w naturalny sposób pojawia się konieczność operowania pochodną nieznanej funkcji.
 
==Metody różnicowe==
 
Rozważmy najprostszy sposób aproksymacji pochodnej <math>f'(x)</math>, oparty na <strong>różnicy dzielonej w przód</strong>, gdyż ze wzoru Taylora
 
<center><math>f(x+h) = f(x) + f'(x)h  + O(h^2)</math>,</center>
 
pomijając człony rzędu <math>h^2</math>, dostajemy przybliżenie
 
<center><math>f'(x) \approx \frac{f(x+h)-f(x)}{h}</math>,</center>
 
a dokładniej,
 
<center><math>f'(x) =  \frac{f(x+h)-f(x)}{h} + O(h)</math></center>
 
Podobną jakość aproksymacji dostaniemy, biorąc <strong>różnicę dzieloną w tył</strong>,
 
<center><math>f'(x) = \frac{f(x)-f(x-h)}{h} + O(h)</math></center>
 
Nietrudno przekonać się, że wzięcie średniej arytmetycznej tych dwóch aproksymacji daje tzw. <strong>różnicę centralną</strong>, która ma wyższy rząd aproksymacji, gdyż
 
<center><math>f'(x) =  \frac{f(x+h)-f(x-h)}{2h} + O(h^2)</math>,</center>
 
co znaczy, że dwukrotnie zmniejszając <math>h</math>, powinniśmy się spodziewać aż czterokrotnego zmniejszenia błędu aproksymacji pochodnej!
 
Jeśli chcemy uzyskać jeszcze wyższy rząd aproksymacji pochodnej, często jako wyrażenie aproksymujące przyjmuje się pochodną wielomianu interpolacyjnego. Rzeczywiście, niech <math>w_n</math> będzie wielomianem interpolującym funkcję <math>f</math> w parami różnych węzłach <math>x_0< \cdots < x_n</math>, tzn.
 
<center><math>
w_n(x) = \sum_{i=0}^{n}f(x_i) l_i(x)</math>,</center>
 
gdzie <math>l_i(x)</math> są [[MN09#Baza Lagrange'a (kanoniczna)|wielomianami bazowymi Lagrange'a]]. Wtedy
 
<center><math>
f'(x) \approx w_n'(x) = \sum_{i=0}^{n}f(x_i) l_i'(x)</math>,</center>
 
przy czym można wykazać, że zachodzi
 
{{twierdzenie|O błędzie aproksymacji pochodnej za pomocą pochodnej wielomianu interpolacyjnego|O błędzie aproksymacji pochodnej za pomocą pochodnej wielomianu interpolacyjnego|
 
Niech <math>w_n</math> będzie wielomianem interpolującym funkcję <math>f\in C^{n+2}[a,b]</math> w równoodległych węzłach <math>a, a+h, a+2h, \ldots, b</math>, gdzie <math>h = (b-a)/n</math>. Wtedy zachodzi
<center><math>
f'(x) - w_n'(x) = O(h^n) \quad \forall x\in [a,b]
</math></center>
 
}}


Wszystkie wprowadzone powyżej metody interpolacji oparte na wielomianie Taylora w rzeczywistości dadzą się sprowadzić do pochodnej wielomianu interpolacyjnego. Rzeczywiście,
* różnica w przód to aproksymacja <math>f'(x)</math> pochodną wielomianu opartego na węzłach <math>x</math> i <math>x+h</math>,
* różnica w tył to aproksymacja <math>f'(x)</math> pochodną wielomianu opartego na węzłach <math>x</math> i <math>x-h</math>,
* różnica centralna to aproksymacja <math>f'(x)</math> pochodną wielomianu opartego na węzłach <math>x-h</math> i <math>x+h</math>; w tym ostatnim przypadku widzimy także, że powyższe twierdzenie nie zawsze jest ostre, bo dla różnicy centralnej byliśmy w stanie uzyskać wyższy niż minimalny gwarantowany przez twierdzenie rząd aproksymacji.
Łatwo także --- korzystając z powyższego --- wyprowadzić nowe wzory na aproksymację pochodnej, przykładowo,


==Podstawowy \LaTeX==
<center><math>f'(x) = \frac{1}{2h} ( 3f(x) - 4f(x-h) + f(x-2h)) + O(h^2)
</math></center>


Wyliczenia:
korzysta tylko z wartości <math>f</math> na lewo od <math>x</math> (jest to więc ''różniczkowanie wstecz'') i też daje kwadratową aproksymację.
#pierwszy
#drugi
#trzeci


Wypunktowania:
Analogicznie możemy aproksymować pochodne wyższych rzędów, np.


*pierwszy
<center><math>f''(x) = \frac{f(x-h) - 2f(x) + f(x+h)}{h^2} + O(h^2)</math></center>
*drugi
*trzeci


Listy:
Tę formułę możemy znów uzyskać na wiele sposobów:
* wprost ze wzoru Taylora, raz dla <math>f(x+h)</math>, a raz dla <math>f(x-h)</math>,
* jako drugą pochodną wielomianu interpolacyjnego,
* jako złożenie różnicy dzielonej w przód z różnicą dzieloną w tył (co ma naśladować matematyczną zależność, że <math>f''(x) = (f'(x))'</math>.
Namawiamy czytelnika do sprawdzenia, że faktycznie powyższy wzór można tak wyprowadzić.


\begin{description}
<!--
\item[raz] pierwszy  pierwszy  pierwszy  pierwszy  pierwszy  pierwszy  pierwszy  pierwszy  pierwszy  pierwszy  pierwszy
===Różniczkowanie wielomianu algorytmem Hornera===
\item[dwa] drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi drugi
\item[dwa i pół] trzeci  trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzeci trzecitrzeci
\end{description}


Proste tabele:
Jak widać z powyższego, warto jest umieć rozwiązać następujące ogólne zagadnienie: mając zadany wielomian interpolacyjny, znaleźć jego pochodną w punkcie <math>x</math>. Okazuje się, że do tego znakomicie nadaje się [[|algorytm Hornera]].
-->
==Uwarunkowanie różniczkowania==


\begin{tabular}{c|cc}
W przeciwieństwie do [[#Uwarunkowanie całkowania|całkowania]], zadanie różniczkowania jest <strong>źle postawione</strong> ze względu na zaburzenie funkcji, gdy jako dopuszczalne zaburzenia przyjmiemy dowolne funkcje różniczkowalne bliskie danej funkcji w sensie normy jednostajnej. Rzeczywiście, jeśli <math>\tilde{f}</math> jest różniczkowalna, to mimo, że <math>||\tilde{f} -f||_{C(a,b)} \leq \epsilon</math>, wyrażenie
\hline\\
<math>||\tilde{f}' -f'||_{C(a,b)}</math> nie jest ograniczone. Ten fakt jest źródłem praktycznych kłopotów z numerycznym przybliżaniem pochodnej, gdy np. próbujemy numerycznie różniczkować dane empiryczne: ich błąd często jest funkcją szybkozmienną.
Procesor & MFLOPs & Cena\\
\hline\\
Pentium 4 & 2000 & 200\\
Z80 & 0.0002  & 200\\
\hline
\end{tabular}


==Obsługa cudzysłowów==
==Kłopoty numeryczne z różniczkowaniem==


,,Hello!'', ``cytat'', ''dziwny cytat''.
Rozważmy przykładowo różnicę w przód dla <math>h>0</math>. Gdyby arytmetyka której używamy miała nieskończoną precyzję, to oczywiście zachodzi


==Wstawki w gołym Wikitekście==
<center><math>\frac{f(x+h)-f(x)}{h} - f'(x) = O(h)</math>,</center>


W tekście źródłowym poniżej znajduje się wstawka w wikitekście:
i przybliżenie byłoby tym lepsze, im mniejsze byłoby <math>h</math>. Jednak w praktyce tak nie będzie, ze względu na fakt, że działamy w arytmetyce skończonej precyzji:
* dla małych <math>h</math>, mamy <math>f(x+h) -f(x) \approx 0</math>, a więc zachodzi duże ryzyko utraty cyfr przy odejmowaniu
* dla małych <math>h</math>, może zdarzyć się, że numerycznie <math>fl_\nu(x+h) = fl_\nu(x)</math> i w konsekwencji <math>fl_\nu(\frac{f(x+h)-f(x)}{h}) = 0</math>.
Można więc postawić sobie pytanie, jak dobrać <math>h</math> na tyle małe, by mieć możliwie dobrą aproksymację <math>f'(x)</math>, a jeszcze nie odczuć zgubnych skutków wpływu arytmetyki zmiennoprzecinkowej. Formalnie, możemy pytanie postawić w sposób następujący:


\begin{rawiki}
Przypuśćmy, że zamiast <math>f(x)</math> wyznaczane jest <math>\tilde{f}(x) = f(x)+\epsilon_x</math>, przy czym <math>|\epsilon_x| \leq \epsilon</math>. Jak dobrać do <math>\epsilon</math> parametr <math>h</math> w taki sposób, by aproksymacja <center><math>\frac{\tilde{f}(x+h)-\tilde{f}(x)}{h} \approx f'(x)</math></center>
== Możemy pisać wstawki w gołymi Wikitekście ==
była jak najlepsza?
Mamy:


[[image.png]]
<center><math>\begin{align} \left| \frac{\tilde{f}(x+h)-\tilde{f}(x)}{h} - f'(x) \right| &= \left| \frac{1}{h}( (f(x+h)+\epsilon_{x+h}) - (f(x) + \epsilon_x)) - f'(x) \right| \\
&\leq
\left| \frac{ f(x+h) - f(x)}{h} - f'(x)\right| + \frac{2\epsilon}{h}
\end{align}</math></center>


<nowiki>
Ponieważ pierwszy człon wyrażenia daje się oszacować (dla dostatecznie regularnej funkcji <math>f</math>) przez <math>C\cdot h</math>, to ostatecznie dostajemy
...stosując dowolne znaczniki Wikitekstu.
</nowiki>
\end{rawiki}


Nie widzimy jej na wydruku, ale powinniśmy widzieć w Wikitekście wyprodukowanym
<center><math>\left| \frac{\tilde{f}(x+h)-\tilde{f}(x)}{h} - f'(x) \right| \leq C_1(h + \frac{1}{h})</math></center>
przez konwerter!


Podobnie możemy zamieszczać krótkie fragmenty gołego wikitekstu: \wiki{<cite>Pan Tadeusz</cite>}.
Wyrażenie po prawej stronie jest minimalizowane dla <math>h = \sqrt{\epsilon}</math> i stąd inżynierska reguła:
Znów widoczne to jest tylko na Wiki.


==Teksty do pominięcia w Wikitekście==
<blockquote  style="background-color: #fefeee; padding:1em;  margin-left,margin-right:2em;  margin-top,margin-bottom: 1em;"> 
Jeśli chcesz używać różnicy w przód, powinieneś wziąć <math>h</math> równe co najmniej <math>\sqrt{\epsilon_{ \mbox{mach} }}</math>.
</blockquote>


\begin{artonly}
==Literatura==
Ten tekst nie ukaże się na Wiki. Ani poniższe równanie:
{<math>x + y = 5.
</math>}
\end{artonly}


To zdanie będzie na Wiki. \textonly{To zdanie nie ukaże się na Wiki}. To będzie na Wiki.
W celu dogłębnego zapoznania się z omawianym na wykładzie materiałem, przeczytaj <b>rozdział 7.1 -- 7.6</b> w
* D. Kincaid, W. Cheney <cite>Analiza numeryczna</cite>, Wydawnictwa Naukowo-Techniczne, Warszawa 2006, ISBN 83-204-3078-X.

Aktualna wersja na dzień 21:44, 11 wrz 2023


Całkowanie

<<< Powrót do strony głównej przedmiotu Metody numeryczne

Zajmiemy się teraz zadaniem całkowania numerycznego. Polega ono na obliczeniu (a raczej przybliżeniu) całki oznaczonej

S(f)=abf(x)dx,

gdzie <a<b<+, a f należy do pewnej klasy F funkcji rzeczywistych określonych i całkowalnych w sensie Riemanna na całym przedziale [a,b].

Każdy, kto przeszedł przez kurs całkowania wie, że obliczanie całek rozumiane jako znalezienie elementarnego wzoru na funkcję pierwotną może być trudne, bardzo trudne, a nawet niewykonalne. Tymczasem zadanie przybliżonego wyznaczenia wartości całki daje się w dużej mierze zautomatyzować z całkiem dobrym skutkiem.

Obliczanie całek jest wymagane w bardzo wielu zadaniach inżynierskich i naukowych. Całki z funkcji (bardzo) wielu zmiennych (które na swój sposób są szczególnie trudne do obliczenia) znajdują ważne zastosowania w bankowości i finansach.

Będziemy zakładać, że mamy możliwość obliczania wartości funkcji f, a w niektórych przypadkach również jej pochodnych, o ile istnieją. Dokładna całka S(f) będzie więc w ogólności przybliżana wartością A(f), która zależy tylko od wartości f i ewentualnie jej pochodnych w skończonej liczbie punktów.

Kwadratury

Kwadraturami nazywamy funkcjonały liniowe Q:FR postaci

Q(f)=i=0naif(xi),

albo ogólniej

Q(f)=i=0kj=0ni1ai,jf(j)(xi),

gdzie xi są punktami z [a,b], a ai (albo ai,j) są pewnymi współczynnikami rzeczywistymi. Zauważmy, że obliczenia kwadratur są dopuszczalne w naszym modelu obliczeniowym, mogą więc służyć jako sposób przybliżania całki.

Jeden z możliwych sposobów konstrukcji kwadratur jest następujący. Najpierw wybieramy węzły xj (pojedyncze lub wielokrotne), budujemy wielomian interpolacyjny odpowiadający tym węzłom, a następnie całkujemy go. Ponieważ postać wielomianu interpolacyjnego zależy tylko od danej informacji o f, otrzymana w ten sposób wartość też będzie zależeć tylko od tej informacji, a w konsekwencji funkcjonał wynikowy będzie takiej postaci, jak wyżej. Są to tzw. kwadratury interpolacyjne.

Definicja

Kwadraturę QI opartą na węzłach o łącznej krotności n+1 nazywamy interpolacyjną, jeśli

QI(f)=abwf(x)dx,

gdzie wf jest wielomianem interpolacyjnym funkcji f stopnia co najwyżej n, opartym na tych węzłach.

Współczynniki kwadratur interpolacyjnych można łatwo wyliczyć. Rozpatrzmy dla uproszczenia przypadek, gdy węzły są jednokrotne. Zapisując wielomian interpolacyjny w postaci jego rozwinięcia w bazie kanonicznej Lagrange'a li, otrzymujemy

QI(f)=abi=0nf(xi)li(x)dx=i=0nf(xi)abli(x)dx,

a stąd i z postaci li,

ai=ab(xx0)(xxi1)(xxi+1)(xxn)(xix0)(xixi1)(xixi+1)(xixn)dx,

0in.

Podamy teraz kilka przykładów.

Kwadratura prostokątów jest oparta na jednym węźle x0=(a+b)/2,

Q0I(f)=(ba)f(a+b2)
Kwadratura prostokątów

Kwadratura trapezów jest oparta na jednokrotnych węzłach x0=a, x1=b i jest równa polu odpowiedniego trapezu,

Q1I(f)=T(f)=ba2(f(a)+f(b))
Kwadratura trapezów

Kwadratura parabol (Simpsona) jest oparta na jednokrotnych węzłach x0=a, x1=b, x2=(a+b)/2, i jest równa polu pod parabolą interpolującą f w tych węzłach,

Q2I(f)=P(f)=ba6(f(a)+4f(a+b2)+f(b))

Zauważmy, że kwadratury trapezów i parabol są oparte na węzłach jednokrotnych i równoodległych, przy czym x0=a i xn=b. Ogólnie, kwadratury interpolacyjne oparte na węzłach równoodległych xi=a+(ba)i/n, 0in, nazywamy kwadraturami Newtona--Cotesa.

Błąd kwadratur interpolacyjnych

Zajmiemy się teraz błędem kwadratur interpolacyjnych. Przypomnijmy, że FMr([a,b]) oznacza klasę funkcji (r+1) razy różniczkowalnych w sposób ciągły i takich, że |f(r+1)(x)|M, x.

Twierdzenie O błędzie kwadratur interpolacyjnych

Niech QI będzie kwadraturą interpolacyjną opartą na (jednokrotnych lub wielokrotnych) węzłach xi, 0in. Jeśli fFMn([a,b]), to

|S(f)QI(f)|M(n+1)!(ba)n+2.

W klasie FMn([a,b]) maksymalny błąd kwadratury QI wynosi

supfFMn([a,b])|S(f)QI(f)|=M(n+1)!ab|(xx0)(xx1)(xxn)|dx

Dowód

Korzystając ze znanego nam już wzoru na błąd interpolacji wielomianowej, mamy

S(f)QI(f)=ab(xx0)(xx1)(xxn)f(x0,x1,,xn,x)dx

Stąd, jeśli fFMn([a,b]), to

|S(f)QI(f)|ab(ba)n+1M(n+1)!dx=(ba)n+2M(n+1)!

Ograniczenie górne w dokładnej formule na błąd w klasie FMn([a,b]) wynika bezpośrednio. Aby pokazać ograniczenie dolne zauważmy, że dla funkcji g takiej, że g(n+1) przyjmuje na przedziałach (a,x0), (x0,x1), , (xn,b) naprzemiennie wartości M i M mamy

|S(g)QI(g)|=M(n+1)!ab|(xx0)(xx1)(xxn)|dx

Co prawda, g nie jest w FMn([a,b]), ale może być dla dowolnego ϵ>0 przybliżana funkcjami fϵFMn([a,b]) w ten sposób, że całka

ab|(xx0)(xxn)(fg)(n+1)(x)|dxϵ(n+1)!

Zapisując fϵ=g+(fϵg) mamy

|S(fϵ)QI(fϵ)||S(g)QI(g)|+|S(fϵg)QI(fϵg)|M(n+1)!ab|(xx0)(xxn)|dx+ϵ,

co wobec dowolności ϵ daje dowód twierdzenia.

W szczególnych przypadkach kwadratur trapezów T i parabol P możemy otrzymać innego rodzaju formuły na błąd.

Twierdzenie O postaci błędu kwadratury trapezów i Simpsona

Jeśli fC(2)([a,b]), to dla kwadratury trapezów mamy

S(f)T(f)=(ba)312f(2)(ξ1)

Jeśli fC(4)([a,b]), to dla kwadratury parabol mamy

S(f)P(f)=(ba)52280f(4)(ξ2)

(ξ1,ξ2[a,b]).

Dowód

Najpierw udowodnimy część dotyczącą kwadratury trapezów. Ze wzoru na błąd kwadratury,

S(f)T(f)=ab(xa)(xb)f(a,b,x)dx

Ponieważ funkcja xf(a,b,x) jest ciągła, a wielomian (xa)(xb) przyjmuje jedynie wartości nieujemne, można zastosować twierdzenie o wartości średniej dla całki, aby otrzymać

S(f)T(f)=f(a,b,c)ab(xa)(xb)dx=f(2)(ξ1)2!(ba)36,

dla pewnych c,ξ1[a,b].

Teraz zajmiemy się kwadraturą parabol. Niech wf,2Π2 i wf,3Π3 będą wielomianami interpolacyjnymi funkcji f odpowiednio dla węzłów a,b,(a+b)//2 oraz a,b,(a+b)//2,(a+b)//2. Wtedy

wf,3(x)=wf,2(x)+f(a,b,a+b2,a+b2)(xa)(xa+b2)(xb).

Wobec

ab(xa)(a+b2)(xb)dx=0

mamy

P(f)=abwf,2(x)dx=abwf,3(x)dx

Stąd i ze wzoru na błąd interpolacji Hermite'a otrzymujemy

S(f)P(f)=ab(fwf,3)(x)dx=ab(xa)(xa+b2)2(xb)f(a,b,a+b2,a+b2,x)dx.

Ponieważ wielomian (xa)(x(a+b)/2)2(xb) jest niedodatni na [a,b], możemy znów zastosować twierdzenie o wartości średniej. Mamy

S(f)P(f)=f(a,b,a+b2,a+b2,c)ab(xa)(xa+b2)2(xb)dx=f(4)(ξ2)4!(ba)5120,

co kończy dowód.

Kwadratury złożone

Chcielibyśmy, aby błąd kwadratur malał do zera, gdy liczba węzłów rośnie do nieskończoności. Można to osiągnąć stosując np. kwadratury złożone. Są to kwadratury, które powstają przez scałkowanie funkcji kawałkami wielomianowej interpolującej f.

Georg Riemann
Zobacz biografię

Prostym przykładem kwadratury złożonej jest suma Riemanna,

Q¯(f)=i=0n(ti+1ti)f(xi),

gdzie a=t0<t1<<tn+1=b oraz xi[ti,ti+1]. Jeśli średnica podziału, max0in(titi1), maleje do zera, to limnQ¯(f)=S(f).

Będziemy rozpatrywać kwadratury złożone postaci

Q¯(f)=abw¯f(x)dx,

gdzie w¯f jest kawałkami wielomianem. Dokładniej, dla danego n kładziemy ti=a+(ba)i/k, 0ik, a następnie dla każdego i wybieramy dowolne węzły xi,j[ti1,ti], 0jr. Wtedy w¯f jest na każdym przedziale wielomianem interpolacyjnym funkcji f stopnia co najwyżej r opartym na węzłach xi,j. Kwadratura Q¯ korzysta z węzłów o łącznej krotności nk(r+1).

Twierdzenie O błędzie kwadratur złożonych

Błąd kwadratury złożonej Q¯(f) w klasie FMr([a,b]) jest ograniczony przez

supfFMr([a,b])|S(f)Q¯(f)|(ba)r+2kr+1M(r+1)!C(1n)r+1,

gdzie

C=M(r+1)r+1(ba)r+2(r+1)!

Dowód

Twierdzenie to jest bezpośrednim wnioskiem z twierdzenia o błędzie kwadratur interpolacyjnych. Mamy bowiem

|S(f)Q¯(f)|i=1kti1ti|f(x)w¯f(x)|dxi=1k(bak)r+2M(r+1)!=(ba)r+2kr+1M(r+1)!,

co kończy dowód.

W klasie FMr([a,b]), błąd kwadratur złożonych jest rzędu n(r+1). Można pokazać, że błąd każdej innej metody całkowania korzystającej jedynie z wartości funkcji w n punktach nie może w klasie FMr([a,b]) maleć szybciej niż n(r+1). Podane kwadratury złożone mają więc optymalny rząd zbieżności.

Zajmiemy się teraz błędem szczególnych kwadratur złożonych, mianowicie złożonych kwadratur trapezów T¯k i parabol P¯k. Powstają one przez zastosowanie na każdym przedziale [ti1,ti] odpowiednio kwadratur trapezów T i parabol P.

Złożona kwadratura trapezów

Jak łatwo się przekonać,

T¯k(f)=bak(f(a)+f(b)2+j=1k1f(jk)),

oraz

P¯k(f)=ba3k(f(a)+f(b)2+j=1k1f(jk)+2j=1kf(2j12k)).

Twierdzenie O postaci błędu złożonych kwadratur trapezów i Simpsona

Jeśli fC(2)([a,b]), to

S(f)T¯k(f)=(ba)312k2f(2)(ξ1)

Jeśli fC(4)([a,b]), to

S(f)P¯k(f)=(ba)52280k4f(4)(ξ2)

Dowód

Dla kwadratury trapezów mamy

S(f)T¯k(f)=i=1k(ba)312k3f(2)(αi)=(ba)312k21ki=1kf(2)(αi)=(ba)312k2f(2)(ξ1),

a dla kwadratury parabol podobnie

S(f)P¯k(f)=i=1k(ba)52280k5f(4)(βi)=(ba)52280k41ki=1kf(4)(βi)=(ba)52280k4f(4)(ξ2).

Kwadratura parabol ma więc optymalny rząd zbieżności nie tylko w klasie FM2([a,b]), ale też w FM3([a,b]).

Przyspieszanie zbieżności kwadratur

W praktyce często stosuje się obliczanie kwadratur poprzez zagęszczanie podziału przedziału [a,b]. Na przykład, dla złożonej kwadratury trapezów zachodzi następujący wygodny wzór rekurencyjny:

T¯2k=12(T¯k(f)+baki=1kf(2i12k))

Pozwala on obliczyć T¯2k(f) na podstawie T¯k(f) poprzez "doliczenie" wartości funkcji w punktach "gęstszej" siatki. W ten sposób możemy obserwować zachowanie się kolejnych przybliżeń T¯2s(f) (s0) całki S(f). Jest to szczególnie istotne wtedy, gdy nie mamy żadnej informacji a priori o fC([a,b]), a przez to nie potrafimy oszacować liczby n węzłów, dla której osiągniemy pożądaną dokładność.

Jeśli funkcja jest więcej niż dwa razy różniczkowalna, to użycie złożonych kwadratur trapezów zdaje się tracić sens. Wtedy istnieją przecież kwadratury, których błąd maleje do zera szybciej niż n2. Okazuje się jednak, że kwadratury T¯k mogą być podstawą dla prostej rekurencyjnej konstrukcji innych kwadratur posiadających już optymalną zbieżność. Konstrukcja ta bazuje na następującym ważnym lemacie.

Leonhard Euler
Zobacz biografię
Colin Maclaurin
Zobacz biografię

Lemat Formuła Eulera-Maclaurina

Dla funkcji fC(2m+2)([a,b]), błąd złożonej kwadratury trapezów T¯k wyraża się wzorem

S(f)T¯k(f)=i=1mcih2i(f(2i1)(b)f(2i1)(a))+cm+1h2m+2(ba)f(2m+2)(ξm,k),

gdzie h=(ba)/k, ξm,k[a,b], a ci są pewnymi stałymi liczbowymi. Mamy c1=1/12, c2=1/720 i, ogólnie, ci=Bi/(2i)!, gdzie Bi są tzw. liczbami Bernoulliego.

Dowód tego lematu pominiemy.

Formułę Eulera-Maclaurina można przepisać w postaci

S(f)T¯k(f)=i=1mci(0)(f)k2i+cm+1,k(0)(f)k(2m+2),

gdzie ci(0)(f)=ci(ba)2i(f(2i1)(b)f(2i1)(a)), 1im, oraz cm+1,k(0)(f)=cm+1(ba)2m+2f(2m+2)(ξm+1,k). Zauważmy przy tym, że jeśli fFM2m+1([a,b]), to współczynniki cm+1,k(0)(f) są wspólnie ograniczone przez cm+1(ba)2m+2M.

Definiując teraz kwadraturę

T¯k1(f)=4T¯2k(f)T¯k(f)3,

dla fC(4)([a,b]) mamy

S(f)T¯k1(f)=4(S(f)T¯2k(f)(S(f)T¯k(f))3=43(c1(0)(f)4k2+c2,2k(0)(f)42k4)13(c1(0)(f)k2+c2,k(0)(f)k4)=c2,k(1)(f)k4,

gdzie c2,k(1)(f)=(1/12)c2,2k(0)(f)(1/3)c2,k(0)(f) i jest wspólnie ograniczone dla fFM3([a,b]). Kwadratura Tk1 ma więc optymalny w FM3([a,b]) rząd zbieżności k4. Proces ten można kontynuować dalej tworząc kolejne kwadratury o coraz to wyższym rzędzie zbieżności. Dokładniej, połóżmy T¯k0(f)=T¯k(f) oraz, dla s1,

T¯ks(f)=4sT¯2ks1(f)T¯ks1(f)4s1

Wtedy, dla fFM2m+1([a,b]), rząd zbieżności kwadratury T¯km wynosi k(2m+2). Rzeczywiście, sprawdziliśmy, że jest to prawdą dla m=0,1. Niech m2. Postępując indukcyjnie dla s=1,2,,m mamy

S(f)T¯ks(f)=4s(S(f)T¯2ks1(f))(S(f)T¯ks1(f))4s1=(4s(i=smci(s1)(f)(2k)2i+cm+1,2k(s1)(f)(2k)(2m+2))(i=smci(s1)(f)k2i+cm+1,k(s1)(f)k(2m+2)))14s1=i=s+1mci(s)(f)k2i+cm+1,k(s)(f)k(2m+2),

ponieważ współczynniki przy k2s redukują się. ci(s)(f) są tutaj pewnymi nowymi stałymi, a cm+1,k(s)(f) może być w klasie FM2m+1([a,b]) ograniczona przez stałą niezależną od f. Ostatecznie, dla s=m mamy więc

S(f)T¯km(f)=cm+1,k(m)(f)k(2m+2)

i w klasie FM2m+1([a,b])

|S(f)T¯km(f)|cmk(2m+2)

dla pewnej stałej cm niezależnej od f.

Zauważmy jeszcze, że T¯km wykorzystuje n=k2m+1 wartości f w punktach równoodległych na [a,b], co oznacza, że w terminach n rząd zbieżności wynosi też n(2m+2), a więc jest optymalny w klasie FM2m+1([a,b]).

Kwadratury T¯ks nazywane są kwadraturami Romberga. Dla danej funkcji f można je łatwo konstruować, budując następującą tablicę trójkątną:

T¯10(f)T¯20(f)T¯11(f)T¯40(f)T¯21(f)T¯12(f)T¯80(f)T¯41(f)T¯22(f)T¯13(f)T¯2s0(f)T¯2s11(f)T¯2s22(f)T¯2s33(f)T¯1s(f),

której kolumny tworzone są zgodnie z powyższymi wzorami.

Kwadratury adaptacyjne

jak wcześniej zauważyliśmy, błąd kwadratury prostej zależy m.in. od wielkości pochodnej f(r+1) funkcji podcałkowej. Odpowiednia kwadratura złożona wydaje się tego nie zauważać i zagęszcza podział przedziału całkowania jednostajnie, podczas gdy naturalnym i prostym wydaje się pomysł gęstszego podziału tam gdzie |f(r+1)(x)| jest "duża" i rzadszego tam, gdzie f(r+1)(x)| jest "mała". Nasz entuzjazm do tego pomysłu może jednak skutecznie ostudzić uwaga, że algorytm na wejściu zwykle nie dostaje żadnej informacji o f(r+1). Okazuje się, że mimo wszystko nie stoimy na straconej pozycji. Algorytm obliczający całkę dysponuje na każdym pewną dodatkową informacją o f w postaci jej wartości w pewnych punktach; następny punkt (podział przedziału całkowania) może więc być wybrany na podstawie tych wartości.

Metody uzależniające swoje działanie od konkretnego zadania, które rozwiązują (w naszym przypadku od funkcji podcałkowej) nazywamy ogólnie metodami adaptacyjnymi.

Zauważmy, że poznana wcześniej metoda bisekcji przybliżonego znajdowania zera funkcji jest typową metodą adaptacyjną. Zobaczymy teraz, na przykładzie adaptacyjnej kwadratury Simpsona, jak można wykorzystać adaptację w problemie numerycznego całkowania.

Niech, tak jak poprzednio, P¯k będzie złożoną kwadraturą Simpsona z równym podziałem przedziału całkowania na k podprzedziałów, zastosowaną na odcinku [a,b]. W szczególności, P¯1=P jest prostą kwadraturą Simpsona. Wtedy

S(f)P¯2(f)=(ba)5228024f(4)(ξ2),

oraz

P¯1(f)P¯2(f)=(S(f)P¯2(f))(S(f)P¯1(f))=(ba)52280(f(4)(ξ1)116f(4)(ξ2)),

ξ1,ξ2[a,b]. Załóżmy teraz, że f(4) ma stały znak na [a,b] oraz przedział ten jest na tyle mały, że f(4) jest "prawie stała". Wtedy f(4)(ξ1)f(4)(ξ2)/1615f(4)(ξ2)/16, a stąd otrzymujemy estymator błędu

S(f)P¯2(f)115(P¯1(f)P¯2(f))

Ta przybliżona równość jest podstawą adaptacyjnej kwadratury Simpsona, może bowiem posłużyć do oszacowania błędu na podprzedziałach.

Załóżmy teraz, że chcemy obliczyć wartość całki z dokładnością ε>0. Obliczamy P¯1(f), P¯2(f) i sprawdzamy, czy |P¯1(f)P¯2(f)|/15ε. Jeśli tak, to P¯2(f) jest ostateczną aproksymacją całki na [a,b], a jeśli nie, to dzielimy przedział na dwa podprzedziały [a,(a+b)/2] i [(a+b)/2,b] i powtarzamy procedurę dla obu podprzedziałów z tolerancją błędu ε/2. Cały proces można zgrabnie zapisać za pomocą funkcji rekurencyjnej.

Algorytm Adaptacyjna kwadratura Simpsona


adaptiveSimpson(a,b,f,e) 
{ 
	P1 = Simpson(a,b,f); 
	P2 = Simpson(a,(a+b)/2,f) + Simpson((a+b)/2,b,f);
	if ( abs(P1-P2) < 15*e) 
		return( P2 );
	else 
		return( adaptiveSimpson(a,(a+b)/2,f,e/2) + adaptiveSimpson((a+b)/2,b,f,e/2) );
}

Zauważmy, że funkcja ta zakończy działanie. Rzeczywiście, na podprzedziale długości h chcemy obliczać całkę z dokładnością εh/(ba), a ponieważ różnica |P1P2| jest rzędu h5, kryterium kończenia procedury będzie spełnione dla każdego h dostatecznie małego. Podziały nie mogą więc następować w nieskończoność.

Trochę gorzej sprawa przedstawia się z błędem. Algorytm bazuje bowiem na jego estymatorze. Jeśli po zakończeniu algorytmu mamy podział na podprzedziały a=x0<x1<<xn=b oraz estymator działa poprawnie na każdym podprzedziale, to błąd można w przybliżeniu oszacować przez

j=1nεxjxj1ba=ε

Z drugiej strony, możemy czasem trafić wyjątkowo "złośliwą" funkcję. Np. jeśli f(a+j(ba)/4)=0 dla 0j4, to już na początku estymator (fałszywie!) twierdzi, że błąd jest zerowy i kwadratura zwróci zero mimo, że rzeczywista wartość całki może znacznie różnić się od zera. Istnieją pewne techniki, które przynajmniej częściowo zapobiegają tego typu zjawiskom, ale nie będziemy ich tutaj omawiać.

Uwarunkowanie całkowania

Zadanie całkowania zadanej funkcji jest, podobnie jak zadanie sumy dwóch liczb (w końcu całkowanie ma wiele wspólnego z sumowaniem!), bardzo dobrze bezwględnie uwarunkowane, natomiast uwarunkowanie względne może być nawet patologicznie duże. Dokładniej,

Twierdzenie O uwarunkowaniu zadania całkowania

Niech f będzie funkcją całkowalną. Wtedy

condabs(S,f)=1

oraz

condrel(S,f)=S(|f|)|S(f)|,

gdzie błąd argumentu liczymy w normie ||f||=ab|f(x)|dx.

Dowód

Biorąc zaburzoną funkcję f~ taką, że ||f~f||ϵ mamy

|S(f~)S(f)|=|ab(f~f)(x)dx|ϵ,

skąd wynika teza.

W szczególności zadanie całkowania będzie źle uwarunkowane względnie, gdy wartość całki jest bliska zeru, ale sama funkcja przyjmuje duże co do modułu wartości.

Biblioteki

W Octave dostępne są jedynie procedury całkujące funkcje skalarne jednej zmiennej na odcinku:

I=abf(x)dx

Robi to funkcja DQAGP ze znakomitego pakietu QUADPACK. Najlepiej od razu posłużmy się przykładem.

Przykład: Prosta całka funkcji jednej zmiennej

Przypuśćmy, że chcemy obliczyć całkę I=01F(x)dx, gdzie np. F(x)=sin(23x)+(1x2)1/2. W tym celu najpierw implementujemy F w Octave:

function y = F(x)
	y = sin(23*x)+1/sqrt(1-x^2);
endfunction

Aby teraz obliczyć całkę I=01F(x)dx, wystarczy wywołać

I = quad("F", 0, 1);

W rzeczywistości, podobnie jak w przypadku funkcji fsolve, funkcja quad zwraca więcej informacji, można jej także przekazać dodatkowe parametry. I tak, jeśli chcemy ustawić poziom tolerancji błędu obliczenia całki:

|Iquad(...)|max{ATOL,RTOLI}

z wartościami ATOL = 1e-3 i RTOL = 1e-6, to wywołamy funkcję przekazując jej te parametry następująco:

quad("F", 0, 1, [1e-3, 1e-6]);

Musimy jednak pamiętać, by pojęcia tolerancji "błędu" nie traktować zbyt dosłownie: tym, co naprawdę kontroluje quad podczas wyznaczania wartości całki, jest jedynie pewien estymator błędu, dlatego wartość tolerancji należy zawsze wybierać w sposób konserwatywny, czyli z pewnym zapasem bezpieczeństwa, np.

Jeśli chcemy wyznaczyć wartość całki z błędem bezwzględnym na

poziomie 106, ustawimy -- na wszelki wypadek -- ATOL = 1e-7, a nie, prostodusznie, ATOL = 1e-6... Musimy także pamiętać, że choć są bardzo mało prawdopodobne do spotkania w praktyce, to jednak istnieją wyuzdane funkcje, dla których estymator błędu może dać całkowicie fałszywe wartości,

przez co i obliczona całka może być obarczona dowolnie wielkim błędem.


QUADPACK

Właściwie jedynym klasycznym pakietem, jaki mamy do dyspozycji jest ponaddwudziestoletni QUADPACK. Jest to zestaw kilkunastu procedur fortranowskich, służących obliczaniu typowych całek jednowymiarowych:

Typ całki Procedura QUADPACKa
abf(x) DQNG, DQAG, DQAGS, DQAGP
f(x) DQAGI
abf(x)cos(ωx) DQAWO
abf(x)xc DQAWC

oraz spora liczba podstawowych kwadratur, na których oparto te ogólne. Nazwy procedur rozszyfrowuje się podobnie jak nazwy procedur LAPACKa, zatem

  • przedrostek D w nazwie każdej procedury wymienionej w tabeli (np. DQAGI) oznacza, że będzie działać na liczbach typu double (całkując funkcję f zwracającą wartości tego samego typu). Gdybyśmy chcieli użyć pojedynczej precyzji, użylibyśmy nazwy procedury bez przedrostka.
  • Kolejna litera, Q, oczywiście oznacza kwadraturę (Quadrature).
  • Trzecia litera --- A lub N --- oznacza, odpowiednio, kwadraturę adaptacyjną lub nieadaptacyjną. Jak wiadomo, w praktyce lepiej sprawdzają się kwadratury adaptacyjne, potrafiące w jakiejś mierze dostosować się do przebiegu funkcji podcałkowej. Kwadratury nieadaptacyjne nie mają tej własności. Mogą natomiast, dla pewnych funkcji podcałkowych, okazać się tańsze, warto więc je stosować, gdy wiemy a priori, że adaptacja niewiele pomoże: np. do wolnozmiennych funkcji.
  • Pozostałe litery precyzują typ liczonej całki i zakres ingerencji użytkownika; G --- "zwykła" całka, bez wagi, W --- całka z wagą, O --- dla funkcji silnie oscylujących, C --- wartość główna całki (tzw. całka Cauchy'ego), I --- przedział nieskończony, S --- możliwe osobliwości, P --- użytkownik poda listę punktów, gdzie są osobliwości.

GSL

Biblioteka GSL reimplementuje podstawowe procedury QUADPACKa w języku C. Procedury GSL mają nazwy analogiczne, jak procedury QUADPACKa, ale z przedrostkiem gsl_integration, jak w poniższym przykładzie, gdzie wywołamy odpowiednik procedury DQAG: funkcję gsl_integration_qag.

#include <stdio.h>
#include <math.h>
#include <gsl/gsl_integration.h>

double F(double X, void * param) /* wrapper dla funkcji sin(x)/x */
{
	return(sin(X)/X);
}

int main(void)
{
	gsl_function f; /* argument z funkcją podcałkową */

	double A,ABSERR,B, EPSABS,EPSREL,RESULT;
	int IER,NEVAL;

	gsl_integration_workspace *workspace;

	int KEY, LIMIT; 

	/* przygotowujemy argument z funkcją podcałkową */
	f.function = &F;
	
	A = 0.0E0; B = 10*M_PI; /* przedział całkowania */
	EPSABS = 0.0E0; EPSREL = 1.0E-3; /* tolerancja błędu */

	/* parametry specyficzne dla QAG */
	KEY = 1; /* tzn. użyj minimalnej liczby punktów kwadratury bazowej */
	LIMIT = 100; /* maksymalny podział przedziału całkowania */
	workspace  = gsl_integration_workspace_alloc(LIMIT);
	
	/* całkujemy: QAG! */

	IER = gsl_integration_qag(&f, A, B, EPSABS, EPSREL, 
					LIMIT, KEY, workspace, &RESULT, &ABSERR);

	if (IER != 0)
		fprintf(stderr,"GSL_QAG: Kłopoty z całkowaniem\n");
	fprintf(stderr,"Całka: %g Est. błąd: %g IER: %d\n", RESULT, ABSERR,  IER);

	gsl_integration_workspace_free(workspace);
	
	return(0);
}

W powyższym przykładzie specjalnie pozostawiliśmy oznaczenia wykorzystywane w poprzednim programie. Jak widać, funkcje całkujące GSL mają bardzo podobną składnię do odpowiadających im funkcji QUADPACKa.

Miłym rozszerzeniem funkcjonalności jest możliwość przekazywania parametrów do wnętrza funkcji podcałkowej.

Różniczkowanie

<<< Powrót do strony głównej przedmiotu Metody numeryczne

Z zadaniem numerycznego różniczkowania zadanej funkcji spotykamy się często w numeryce. Rzeczywiście, jeśli przypomnimy sobie metodę siecznych, była to po prostu metoda Newtona, w której pochodną przybliżono pewnym ilorazem różnicowym:

xk+1=xkf(xk)gk,

gdzie

gk=f(xk)f(xk1)xkxk1f(xk).

Zauważmy, że nie jest to jedyny możliwy wzór na przybliżoną metodę Newtona, równie dobrze(? --- to się dopiero okaże!) moglibyśmy wziąć

gk=f(xk+h)f(xk)h

dla dostatecznie małego h.

Podobne formuły są także konieczne do konstrukcji metod numerycznego rozwiązywania równań różniczkowych, gdzie w naturalny sposób pojawia się konieczność operowania pochodną nieznanej funkcji.

Metody różnicowe

Rozważmy najprostszy sposób aproksymacji pochodnej f(x), oparty na różnicy dzielonej w przód, gdyż ze wzoru Taylora

f(x+h)=f(x)+f(x)h+O(h2),

pomijając człony rzędu h2, dostajemy przybliżenie

f(x)f(x+h)f(x)h,

a dokładniej,

f(x)=f(x+h)f(x)h+O(h)

Podobną jakość aproksymacji dostaniemy, biorąc różnicę dzieloną w tył,

f(x)=f(x)f(xh)h+O(h)

Nietrudno przekonać się, że wzięcie średniej arytmetycznej tych dwóch aproksymacji daje tzw. różnicę centralną, która ma wyższy rząd aproksymacji, gdyż

f(x)=f(x+h)f(xh)2h+O(h2),

co znaczy, że dwukrotnie zmniejszając h, powinniśmy się spodziewać aż czterokrotnego zmniejszenia błędu aproksymacji pochodnej!

Jeśli chcemy uzyskać jeszcze wyższy rząd aproksymacji pochodnej, często jako wyrażenie aproksymujące przyjmuje się pochodną wielomianu interpolacyjnego. Rzeczywiście, niech wn będzie wielomianem interpolującym funkcję f w parami różnych węzłach x0<<xn, tzn.

wn(x)=i=0nf(xi)li(x),

gdzie li(x)wielomianami bazowymi Lagrange'a. Wtedy

f(x)wn(x)=i=0nf(xi)li(x),

przy czym można wykazać, że zachodzi

Twierdzenie O błędzie aproksymacji pochodnej za pomocą pochodnej wielomianu interpolacyjnego

Niech wn będzie wielomianem interpolującym funkcję fCn+2[a,b] w równoodległych węzłach a,a+h,a+2h,,b, gdzie h=(ba)/n. Wtedy zachodzi

f(x)wn(x)=O(hn)x[a,b]

Wszystkie wprowadzone powyżej metody interpolacji oparte na wielomianie Taylora w rzeczywistości dadzą się sprowadzić do pochodnej wielomianu interpolacyjnego. Rzeczywiście,

  • różnica w przód to aproksymacja f(x) pochodną wielomianu opartego na węzłach x i x+h,
  • różnica w tył to aproksymacja f(x) pochodną wielomianu opartego na węzłach x i xh,
  • różnica centralna to aproksymacja f(x) pochodną wielomianu opartego na węzłach xh i x+h; w tym ostatnim przypadku widzimy także, że powyższe twierdzenie nie zawsze jest ostre, bo dla różnicy centralnej byliśmy w stanie uzyskać wyższy niż minimalny gwarantowany przez twierdzenie rząd aproksymacji.

Łatwo także --- korzystając z powyższego --- wyprowadzić nowe wzory na aproksymację pochodnej, przykładowo,

f(x)=12h(3f(x)4f(xh)+f(x2h))+O(h2)

korzysta tylko z wartości f na lewo od x (jest to więc różniczkowanie wstecz) i też daje kwadratową aproksymację.

Analogicznie możemy aproksymować pochodne wyższych rzędów, np.

f(x)=f(xh)2f(x)+f(x+h)h2+O(h2)

Tę formułę możemy znów uzyskać na wiele sposobów:

  • wprost ze wzoru Taylora, raz dla f(x+h), a raz dla f(xh),
  • jako drugą pochodną wielomianu interpolacyjnego,
  • jako złożenie różnicy dzielonej w przód z różnicą dzieloną w tył (co ma naśladować matematyczną zależność, że f(x)=(f(x)).

Namawiamy czytelnika do sprawdzenia, że faktycznie powyższy wzór można tak wyprowadzić.


Uwarunkowanie różniczkowania

W przeciwieństwie do całkowania, zadanie różniczkowania jest źle postawione ze względu na zaburzenie funkcji, gdy jako dopuszczalne zaburzenia przyjmiemy dowolne funkcje różniczkowalne bliskie danej funkcji w sensie normy jednostajnej. Rzeczywiście, jeśli f~ jest różniczkowalna, to mimo, że ||f~f||C(a,b)ϵ, wyrażenie ||f~f||C(a,b) nie jest ograniczone. Ten fakt jest źródłem praktycznych kłopotów z numerycznym przybliżaniem pochodnej, gdy np. próbujemy numerycznie różniczkować dane empiryczne: ich błąd często jest funkcją szybkozmienną.

Kłopoty numeryczne z różniczkowaniem

Rozważmy przykładowo różnicę w przód dla h>0. Gdyby arytmetyka której używamy miała nieskończoną precyzję, to oczywiście zachodzi

f(x+h)f(x)hf(x)=O(h),

i przybliżenie byłoby tym lepsze, im mniejsze byłoby h. Jednak w praktyce tak nie będzie, ze względu na fakt, że działamy w arytmetyce skończonej precyzji:

  • dla małych h, mamy f(x+h)f(x)0, a więc zachodzi duże ryzyko utraty cyfr przy odejmowaniu
  • dla małych h, może zdarzyć się, że numerycznie flν(x+h)=flν(x) i w konsekwencji flν(f(x+h)f(x)h)=0.

Można więc postawić sobie pytanie, jak dobrać h na tyle małe, by mieć możliwie dobrą aproksymację f(x), a jeszcze nie odczuć zgubnych skutków wpływu arytmetyki zmiennoprzecinkowej. Formalnie, możemy pytanie postawić w sposób następujący:

Przypuśćmy, że zamiast

f(x)

wyznaczane jest

f~(x)=f(x)+ϵx

, przy czym

|ϵx|ϵ

. Jak dobrać do

ϵ

parametr

h

w taki sposób, by aproksymacja

f~(x+h)f~(x)hf(x)

była jak najlepsza? Mamy:

|f~(x+h)f~(x)hf(x)|=|1h((f(x+h)+ϵx+h)(f(x)+ϵx))f(x)||f(x+h)f(x)hf(x)|+2ϵh

Ponieważ pierwszy człon wyrażenia daje się oszacować (dla dostatecznie regularnej funkcji f) przez Ch, to ostatecznie dostajemy

|f~(x+h)f~(x)hf(x)|C1(h+1h)

Wyrażenie po prawej stronie jest minimalizowane dla h=ϵ i stąd inżynierska reguła:

Jeśli chcesz używać różnicy w przód, powinieneś wziąć h równe co najmniej ϵmach.

Literatura

W celu dogłębnego zapoznania się z omawianym na wykładzie materiałem, przeczytaj rozdział 7.1 -- 7.6 w

  • D. Kincaid, W. Cheney Analiza numeryczna, Wydawnictwa Naukowo-Techniczne, Warszawa 2006, ISBN 83-204-3078-X.