MN14
Całkowanie
<<< Powrót do strony głównej przedmiotu Metody numeryczne
Zajmiemy się teraz zadaniem całkowania numerycznego. Polega ono na obliczeniu (a raczej przybliżeniu) całki oznaczonej
gdzie , a należy do pewnej klasy funkcji rzeczywistych określonych i całkowalnych w sensie Riemanna na całym przedziale .
Każdy, kto przeszedł przez kurs całkowania wie, że obliczanie całek rozumiane jako znalezienie elementarnego wzoru na funkcję pierwotną może być trudne, bardzo trudne, a nawet niewykonalne. Tymczasem zadanie przybliżonego wyznaczenia wartości całki daje się w dużej mierze zautomatyzować z całkiem dobrym skutkiem.
Obliczanie całek jest wymagane w bardzo wielu zadaniach inżynierskich i naukowych. Całki z funkcji (bardzo) wielu zmiennych (które na swój sposób są szczególnie trudne do obliczenia) znajdują ważne zastosowania w bankowości i finansach.
Będziemy zakładać, że mamy możliwość obliczania wartości funkcji , a w niektórych przypadkach również jej pochodnych, o ile istnieją. Dokładna całka będzie więc w ogólności przybliżana wartością , która zależy tylko od wartości i ew. jej pochodnych w skończonej liczbie punktów.
Kwadratury
Kwadraturami nazywamy funkcjonały liniowe Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle Q:F\toR} postaci
albo ogólniej
gdzie są punktami z , a (albo ) są pewnymi współczynnikami rzeczywistymi. Zauważmy, że obliczenia kwadratur są dopuszczalne w naszym modelu obliczeniowym, mogą więc służyć jako sposób przybliżania całki.
Jeden z możliwych sposobów konstrukcji kwadratur jest następujący. Najpierw wybieramy węzły (pojedyncze lub wielokrotne), budujemy wielomian interpolacyjny odpowiadający tym węzłom, a następnie całkujemy go. Ponieważ postać wielomianu interpolacyjnego zależy tylko od danej informacji o , otrzymana w ten sposób wartość też będzie zależeć tylko od tej informacji, a w konsekwencji funkcjonał wynikowy będzie postaci ja wyżej. Są to tzw. kwadratury interpolacyjne.
Definicja
Kwadraturę opartą na węzłach o łącznej krotności nazywamy interpolacyjną, jeśli
gdzie jest wielomianem interpolacyjnym funkcji stopnia co najwyżej , opartym na tych węzłach.
Współczynniki kwadratur interpolacyjnych można łatwo wyliczyć. Rozpatrzmy dla uproszczenia przypadek, gdy węzły są jednokrotne. Zapisując wielomian interpolacyjny w postaci jego rozwinięcia w bazie kanonicznej Lagrange'a (zob. (Uzupelnic: Lagrbaza )), otrzymujemy
a stąd i z postaci ,
.
Podamy teraz kilka przykładów.
Kwadratura prostokątów jest oparta na jednym węźle ,
Kwadratura trapezów jest oparta na jednokrotnych węzłach , i jest równa polu odpowiedniego trapezu,
Kwadratura parabol (Simpsona) jest oparta na jednokrotnych węzłach , , , i jest równa polu pod parabolą interpolującą w tych węzłach,
Zauważmy, że kwadratury trapezów i parabol są oparte na węzłach jednokrotnych i równoodległych, przy czym i . Ogólnie, kwadratury interpolacyjne oparte na węzłach równoodległych Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle x_i=a+(b-a)i/ń} , , nazywamy kwadraturami Newtona--Cotesa.
Błąd kwadratur interpolacyjnych
Zajmiemy się teraz błędem kwadratur interpolacyjnych. Przypomnijmy, że oznacza klasę funkcji razy różniczkowalnych w sposób ciągły i takich, że , .
Twierdzenie
Niech będzie kwadraturą interpolacyjną opartą na (jednokrotnych lub wielokrotnych) węzłach , . Jeśli to
W klasie , maksymalny błąd kwadratury wynosi
Dowód\quad Korzystając ze znanego nam już wzoru na błąd interpolacji wielomianowej z Lematu Uzupelnic: leblint , mamy
Stąd, jeśli to
Ograniczenie górne w dokładnej formule na błąd w klasie wynika bezpośrednio z oszacowania (Uzupelnic: blkwad ). Aby pokazać ograniczenie dolne zauważmy, że dla funkcji takiej, że przyjmuje na przedziałach , , , naprzemiennie wartości i mamy
Co prawda, nie jest w , ale może być dla dowolnego przybliżana funkcjami w ten sposób, że całka
Zapisując mamy
co wobec dowolności daje dowód twierdzenia.
W szczególnych przypadkach kwadratur trapezów i parabol możemy otrzymać innego rodzaju formuły na błąd.
Twierdzenie
Jeśli to dla kwadratury trapezów mamy
Jeśli to dla kwadratury parabol mamy
().
Dowód\quad (i) Ze wzoru (Uzupelnic: blkwad )
Ponieważ funkcja jest ciągła, a wielomian przyjmuje jedynie wartości nieujemne, można zastosować twierdzenie o wartości średniej dla całki, aby otrzymać
dla pewnych .
(ii) Niech i będą wielomianami interpolacyjnymi funkcji odpowiednio dla węzłów oraz . Wtedy
Wobec
mamy
Stąd i ze wzoru na błąd interpolacji Hermite'a otrzymujemy
Ponieważ wielomian jest niedodatni na , możemy znów zastosować twierdzenie o wartości średniej. Mamy
co kończy dowód.
Kwadratury złożone
Podobnie jak w przypadku zadania interpolacji chcielibyśmy, aby błąd kwadratur malał do zera, gdy liczba węzłów rośnie do nieskończoności. Można to osiągnąć stosując np. kwadratury złożone. Są to kwadratury, które powstają przez scałkowanie funkcji kawałkami wielomianowej interpolującej .
Prostym przykładem kwadratury złożonej jest suma Riemanna,
gdzie oraz . Jeśli średnica podziału, , maleje do zera to .
Będziemy rozpatrywać kwadratury złożone postaci
gdzie jest kawałkami wielomianem z Rozdziału Uzupelnic: kawwiel . To znaczy, dla danego kładziemy , , a następnie dla każdego wybieramy dowolne węzły , . Wtedy jest na każdym przedziale wielomianem interpolacyjnym funkcji stopnia co najwyżej opartym na węzłach . Kwadratura korzysta z węzłów o łącznej krotności .
Twierdzenie
Błąd kwadratury złożonej w klasie jest ograniczony przez
gdzie
Dowód\quad Twierdzenie to jest bezpośrednim wnioskiem z Twierdzenia Uzupelnic: twblkw . Mamy bowiem
co kończy dowód.
W klasie , błąd kwadratur złożonych jest rzędu , czyli jest taki sam jak błąd interpolacji kawałkami wielomianowej. I tak jak przy interpolacji można pokazać, że błąd każdej innej metody całkowania korzystającej jedynie z wartości funkcji w punktach nie może w klasie maleć szybciej niż , zob. U. Uzupelnic: optzlo . Podane kwadratury złożone mają więc optymalny rząd zbieżności.
Zajmiemy się teraz błędem szczególnych kwadratur złożonych, mianowicie złożonych kwadratur trapezów i parabol . Powstają one przez zastosowanie na każdym przedziale odpowiednio kwadratur trapezów i parabol . Jak łatwo się przekonać,
oraz
Twierdzenie
Jeśli to
Jeśli to
Dowód
Dla kwadratury trapezów mamy
a dla kwadratury parabol podobnie

Kwadratura parabol ma więc optymalny rząd zbieżności nie tylko w klasie , ale też w .
Przyspieszanie zbieżności kwadratur
W praktyce często stosuje się obliczanie kwadratur poprzez zagęszczanie podziału przedziału . Na przykład, dla złożonej kwadratury trapezów zachodzi następujący wygodny wzór rekurencyjny:
Pozwala on obliczyć na podstawie poprzez "doliczenie" wartości funkcji w punktach "gęstszej" siatki. W ten sposób możemy obserwować zachowanie się kolejnych przybliżeń () całki . Jest to szczególnie istotne wtedy, gdy nie mamy żadnej informacji a priori o , a przez to nie potrafimy oszacować liczby węzłów, dla której osiągniemy pożądaną dokładność, zob. U. Uzupelnic: kwas .
Jeśli funkcja jest więcej niż dwa razy różniczkowalna to użycie złożonych kwadratur trapezów zdaje się tracić sens. Wtedy istnieją przecież kwadratury, których błąd maleje do zera szybciej niż . Okazuje się jednak, że kwadratury mogą być podstawą dla prostej rekurencyjnej konstrukcji innych kwadratur posiadających już optymalną zbieżność. Konstrukcja ta bazuje na następującym ważnym lemacie.

Zobacz biografię

Zobacz biografię
Lemat Formuła Eulera-Maclaurina
Dla funkcji , błąd złożonej kwadratury trapezów wyraża się wzorem
gdzie , , a są pewnymi stałymi liczbowymi. Mamy , i, ogólnie, , gdzie są tzw. liczbami Bernoulliego.
Dowód tego lematu pominiemy.
Formułę Eulera-Maclaurina można przepisać w postaci
gdzie , , oraz . Zauważmy przy tym, że jeśli to współczynniki są wspólnie ograniczone przez .
Definiując teraz kwadraturę
dla mamy
gdzie i jest wspólnie ograniczone dla . Kwadratura ma więc optymalny w rząd zbieżności . Proces ten można kontynuować dalej tworząc kolejne kwadratury o coraz to wyższym rzędzie zbieżności. Dokładniej, połóżmy oraz, dla ,
Wtedy, dla , rząd zbieżności kwadratury wynosi . Rzeczywiście, sprawdziliśmy, że jest to prawdą dla . Niech . Postępując indukcyjnie ze względu na mamy
ponieważ współczynniki przy redukują się. są tutaj pewnymi nowymi stałymi, a może być w klasie ograniczona przez stałą niezależną od . Ostatecznie, dla mamy więc
i w klasie
dla pewnej stałej niezależnej od .
Zauważmy jeszcze, że wykorzystuje wartości w punktach równoodległych na co oznacza, że w terminach rząd zbieżności wynosi też , a więc jest optymalny w klasie .
Kwadratury nazywane są kwadraturami Romberga. Dla danej funkcji , można je łatwo konstruować budując następującą tablicę trójkątną:
w której pierwsza kolumna jest tworzona indukcyjnie zgodnie ze wzorem (Uzupelnic: indtrap ), a kolejne zgodnie z (Uzupelnic: indRom ).
Biblioteki
W Octave dostępne są jedynie procedury całkujące funkcje skalarne jednej zmiennej na odcinku:
Robi to funkcja DQAGP ze znakomitego pakietu QUADPACK. Najlepiej od razu posłużmy się przykładem.
Przykład: Prosta całka funkcji jednej zmiennej
Przypuśćmy, że chcemy obliczyć całkę , gdzie np. . W tym celu najpierw implementujemy w Octave:
function y = F(x) y = sin(23*x)+1/sqrt(1-x^2); endfunction
Aby teraz obliczyć całkę , wystarczy wywołać
I = quad("F", 0, 1);
W rzeczywistości, podobnie jak w przypadku funkcji fsolve
, funkcja
quad
zwraca więcej informacji, można jej także przekazać dodatkowe
parametry. I tak, jeśli chcemy ustawić poziom tolerancji błędu obliczenia
całki:
z wartościami i , to wywołamy funkcję przekazując jej te parametry następująco:
quad("F", 0, 1, [1e-3, 1e-6]);
Musimy jednak pamiętać, by pojęcia tolerancji "błędu" nie traktować zbyt
dosłownie: tym, co naprawdę kontroluje quad
podczas wyznaczania
wartości całki, jest jedynie pewien estymator błędu, dlatego wartość
tolerancji należy zawsze wybierać w sposób konserwatywny, czyli z pewnym zapasem
bezpieczeństwa, np.
Jeśli chcemy wyznaczyć wartość całki z błędem bezwzględnym na
poziomie , ustawimy -- na wszelki wypadek --
ATOL = 1e-7
, a nie, prostodusznie,ATOL = 1e-6
... Musimy także pamiętać, że choć są bardzo mało prawdopodobne do spotkania w praktyce, to jednak istnieją wyuzdane funkcje, dla których estymator błędu może dać całkowicie fałszywe wartości,przez co i obliczona całka może być obarczona dowolnie wielkim błędem.
Dodajmy, że quad
doskonale radzi sobie także z funkcjami z osobliwościami (o
ile tylko ją o nich uprzedzimy). Przykładowo, scałkujmy funkcję ze złośliwą nieciągłością w
zerze:
Oczywiście, , tymczasem definiując
function y = osobliwa(x) if (x != 0.0) y = 1/x; else y = 1e6; endif endfunction quad("osobliwa", -1, 1)
daje w rezultacie
-- błędny wynik i (na szczęście!) także komunikat o jakichś problemach procedury
całkującej. Jeśli jednak wspomożemy quad
informacją o tym, że w czai
się osobliwość, wszystko przebiegnie już gładko:
(1e-8
jest żądaną tolerancją błędu, równą wartości domyślnej).
QUADPACK
Właściwie jedynym klasycznym pakietem, jaki mamy do dyspozycji jest ponaddwudziestoletni QUADPACK . Jest to zestaw kilkunastu procedur fortranowskich, służących obliczaniu typowych całek jednowymiarowych, w tym kilka ogólnego stosowania:
Typ całki | Procedura QUADPACKa |
DQNG, DQAG, DQAGS, DQAGP | |
DQAGI | |
DQAWO | |
DQAWC | |
oraz spora liczba podstawowych kwadratur, na których oparto te ogólne. Nazwy procedur rozszyfrowuje się podobnie jak nazwy procedur LAPACKa, zatem
- przedrostek
D
w nazwie każdej procedury wymienionej w tabeli (np.DQAGI
) oznacza, że będzie działać na liczbach typudouble
(całkując funkcję zwracającą wartości tego samego typu). Gdybyśmy chcieli użyć pojedynczej precyzji, użylibyśmy nazwy procedury bez przedrostka. - Kolejna litera,
Q
, oczywiście oznacza kwadraturę (Quadrature). - Trzecia litera ---
A
lubN
oznacza, odpowiednio, kwadraturę adaptacyjną lub nieadaptacyjną. Jak wiadomo, w praktyce lepiej sprawdzają się kwadratury adaptacyjne, potrafiące w jakiejś mierze dostosować się do przebiegu funkcji podcałkowej. Kwadratury nieadaptacyjne nie mają tej własności, natomiast są tańsze, warto więc je stosować w szczególnych przypadkach, gdy wiemy a priori, że adaptacja niewiele pomoże: np. do wolno zmiennych funkcji. - Pozostałe litery precyzują typ liczonej całki i zakres ingerencji użytkownika;
G
--- "zwykła" całka, bez wagi,W
--- całka z wagą,O
--- oscylacyjną,C
--- wartość główna całki (tzw. całka Cauchy'ego),I
--- przedział nieskończony,S
--- możliwe osobliwości,P
--- użytkownik poda listę punktów, gdzie są osobliwości.
GSL
Biblioteka GSL reimplementuje podstawowe procedury QUADPACKa w języku C, zob.
{GSL-reference}, gdzie zostały one bardzo przystępnie i
szczegółowo opisane. Procedury GSL mają nazwy analogiczne, jak procedury
QUADPACKa, ale z przedrostkiem gsl_integration
, jak w poniższym
przykładzie, gdzie wywołamy odpowiednik procedury DQAG
: funkcję
gsl_integration_qag
.
#include <stdio.h> #include <math.h> #include <gsl/gsl_integration.h> double F(double X, void * param) /* wrapper dla funkcji sin(x)/x */ { return(sin(X)/X); } int main(void) { gsl_function f; /* argument z funkcją podcałkową */ double A,ABSERR,B, EPSABS,EPSREL,RESULT; int IER,NEVAL; gsl_integration_workspace *workspace; int KEY, LIMIT; /* przygotowujemy argument z funkcją podcałkową */ f.function = &F; A = 0.0E0; B = 10*M_PI; /* przedział całkowania */ EPSABS = 0.0E0; EPSREL = 1.0E-3; /* tolerancja błędu */ /* parametry specyficzne dla QAG */ KEY = 1; /* tzn. użyj minimalnej liczby punktów kwadratury bazowej */ LIMIT = 100; /* maksymalny podział przedziału całkowania */ workspace = gsl_integration_workspace_alloc(LIMIT); /* całkujemy: QAG! */ IER = gsl_integration_qag(&f, A, B, EPSABS, EPSREL, LIMIT, KEY, workspace, &RESULT, &ABSERR); if (IER != 0) fprintf(stderr,"GSL_QAG: Kłopoty z całkowaniem\n"); fprintf(stderr,"Całka: %g Est. błąd: %g IER: %d\n", RESULT, ABSERR, IER); gsl_integration_workspace_free(workspace); return(0); }
W powyższym przykładzie specjalnie pozostawiliśmy oznaczenia wykorzystywane w poprzednim programie. Jak widać, funkcje całkujące GSL mają bardzo podobną składnię do odpowiadających im funkcji QUADPACKa.
Miłym rozszerzeniem funkcjonalności jest możliwość przekazywania parametrów do wnętrza funkcji podcałkowej.
Różniczkowanie
<<< Powrót do strony głównej przedmiotu Metody numeryczne
Z zadaniem numerycznego różniczkowania zadanej funkcji spotykamy się często w numeryce. Rzeczywiście, jeśli przypomnimy sobie metodę siecznych, to była to po prostu metoda Newtona, w której pochodną przybliżono pewnym ilorazem różnicowym:
gdzie
Zauważmy, że nie jest to jedyny możliwy wzór na przybliżoną metodę Newtona, równie dobrze(? --- to się dopiero okaże!) moglibyśmy wziąć
dla dostatecznie małego .
Podobne formuły są także konieczne do konstrukcji metod numerycznego rozwiązywania równań różniczkowych, gdzie w naturalny sposób pojawia się konieczność operowania pochodną nieznanej funkcji.
Metody różnicowe
Rozważmy najprostszy sposób aproksymacji pochodnej , oparty na różnicy dzielonej w przód, gdyż ze wzoru Taylora
pomijając człony rzędu , dostajemy przybliżenie
a dokładniej,
Podobną dokładność aproksymacji dostaniemy, biorąc różnicę dzieloną w tył,
Nietrudno przekonać się, że wzięcie średniej arytmetycznej tych dwóch aproksymacji daje tzw. różnicę centralną, która ma wyższy rząd aproksymacji, gdyż
co znaczy, że dwukrotnie zmniejszając , powinniśmy się spodziewać czterokrotnego zmniejszenia błędu aproksymacji pochodnej!
Metody interpolacyjne
Jeśli chcemy uzyskać jeszcze wyższy rząd aproksymacji pochodnej, często jako wyrażenie aproksymujące przyjmuje się pochodną wielomianu interpolacyjnego.
Rzeczywiście, niech będzie wielomianem interpolującym funkcję w parami różnych węzłach , tzn.
gdzie są \link{sec:interpol}{wielomianami bazowymi Lagrange'a}. Wtedy
przy czym można wykazać, że
Twierdzenie O błędzie aproksymacji pochodnej za pomocą pochodnej wielomianu interpolacyjnego
Niech będzie wielomianem interpolującym funkcję w równoodległych węzłach , gdzie . Wtedy zachodzi
Wszystkie wprowadzone powyżej metody interpolacji oparte na wielomianie Taylora w rzeczywistości dadzą się sprowadzić do pochodnej wielomianu interpolacyjnego. Rzeczywiście,
- różnica w przód to aproksymacja pochodną wielomianu opartego na węzłach i ,
- różnica w tył to aproksymacja pochodną wielomianu opartego na węzłach i ,
- różnica centralna to aproksymacja pochodną wielomianu opartego na węzłach i ; w tym ostatnim przypadku widzimy także, że powyższe twierdzenie nie zawsze jest ostre, bo dla różnicy centralnej byliśmy w stanie uzyskać wyższy niż minimalny gwarantowany przez twierdzenie rząd aproksymacji.
Łatwo także --- korzystając z powyższego --- wyprowadzić nowe wzory na aproksymację, przykładowo,
korzysta tylko z wartości na lewo od (jest to więc różniczkowanie wstecz) i też daje kwadratową aproksymację.
Analogicznie możemy aproksymować pochodne wyższych rzędów, np.
Tę formułę możemy znów uzyskać na wiele sposobów:
- wprost ze wzoru Taylora, raz dla , a raz dla ,
- jako drugą pochodną wielomianu interpolacyjnego,
- jako złożenie różnicy dzielonej w przód z różnicą dzieloną w tył (co ma naśladować matematyczną zależność, że .
Namawiamy czytelnika do sprawdzenia, że faktycznie powyższy wzór można tak wyprowadzić.
Uwarunkowanie
Kłopoty numeryczne
Rozważmy przykładowo różnicę w przód dla . Gdyby arytmetyka której używamy miała nieskończoną precyzję, to oczywiście zachodzi
i przybliżenie byłoby tym lepsze, im mniejsze byłoby . Jednak w praktyce tak nie będzie, ze względu na fakt, że działamy w arytmetyce skończonej precyzji:
- dla małych , mamy , a więc zachodzi duże ryzyko utraty cyfr przy odejmowaniu
- dla małych , może zdarzyć się, że numerycznie i w konsekwencji .
Można więc postawić sobie pytanie, jak dobrać na tyle małe, by mieć możliwie dobrą aproksymację , a jeszcze nie odczuć zgubnych skutków wpływu arytmetyki zmiennoprzecinkowej. Formalnie, możemy pytanie postawić w sposób następujący:
Przypuśćmy, że zamiast
wyznaczane jest
, przy czym
. Jak dobrać do
parametr
w taki sposób, by aproksymacja
była jak najlepsza?
Mamy:
Ponieważ pierwszy człon wyrażenia daje się oszacować (dla dostatecznie regularnej funkcji ) przez , to ostatecznie dostajemy
Wyrażenie po prawej stronie jest minimalizowane dla i stąd inżynierska reguła:
Jeśli chcesz używać różnicy w przód, powinieneś wziąć równe co najmniej .