MN02: Różnice pomiędzy wersjami

Wersja z 17:17, 28 sie 2006

Uwaga: przekonwertowane latex2mediawiki; prawdopodobnie trzeba wprowadzi? poprawki

Rozwiązywanie równań nieliniowych

Możesz zastanawiać się, jak w procesorach implementuje się działania arytmetyczne, na przykład dzielenie. Okazuje się, że dzielenie $b / a$ można zaimplementować korzystając z uprzednio zaimplementowanych operacji dodawania i mnożenia...

W wielu zadaniach, m.in. matematyki stosowanej, spotykamy się z problemem rozwiązania skalarnego równania nieliniowego postaci $f (x) = 0$ :

rozwiązywanie równania Keplera

f (x) \equiv x - ϵ \sin (x) = 0

To równanie jest bardzo ważne w astronomii.

znajdowanie miejsc zerowych wielomianu:

f (x) \equiv a_{n} x^{n} + \dots + a_{1} x + a_{0} = 0

Bardzo wiele modeli matematycznych wymaga rozwiązania równania z wielomianową nieliniowością. Piękne kwadratury (Gaussa) opierają się na węzłach będących zerami pewnego wielomianu. Wielomiany są bardzo szczególnymi funkcjami i dla nich istnieje szereg specjalizowanych metod znajdowania ich pierwiastków, m.in. metoda Laguerre'a, metoda Bairstow'a (o nich tu nie będziemy mówić), a także zaskakujące metody sprowadzające zadanie poszukiwania miejsc zerowych wielomianu do zupełnie innego zadania matematycznego --- o nich jednak będzie mowa dopiero w wykładzie dotyczącym Uzupełnij: znajdowania wartości własnych macierzy.

znajdowanie miejsc zerowych trójmianu kwadratowego:

f (x) \equiv a_{2} x^{2} + a_{1} x + a_{0} = 0 .

Jest to szczególny, ale oczywiście bardzo ważny (takie równania m.in. trzeba było kiedyś rozwiązywać w artylerii) przypadek poprzedniego zadania. Chociaż wydawać by się mogło, że to umiemy już robić (wszyscy znamy wzory "z deltą") ale --- jak wkrótce się przekonamy --- i tutaj mogą spotkać nas niespodzianki!

obliczanie pierwiastka kwadratowego z zadanej liczby $a$ :

f (x) \equiv x^{2} - a = 0

Jeden ze sposobów na implementację funkcji "sqrt()". Szybkie algorytmy wyznaczania pierwiastka kwadratowego były znane już starożytnym. W wykładzie zrozumiemy, dlaczego metoda Herona,

x_{k + 1} = \frac{1}{2} (x_{k} + \frac{a}{x_{k}})

daje bardzo dobre przybliżenie $\sqrt{a}$ już po kilku iteracjach.

implementacja wyznaczania odwrotności liczby $a$ (bez dzielenia!):

f (x) \equiv \frac{1}{x} - a = 0

Wciąż spotykane zadanie, np. tak można w praktyce poprawić precyzję funkcji wektorowych stosowanych w niektórych procesorach AMD, zob. \cite{AMD-optimization-guide}. Instrukcja procesora służąca do obliczania odwrotności sekwencji liczb umieszczonych w 128-bitowym rejestrze wektorowym daje wynik z małą precyzją (oczywiście po to, by wykonywała się szybciej!). Jeśli taka dokładność wyniku nie odpowiada nam, możemy ją --- zgodnie z manualem procesora --- poprawić, rozwiązując właśnie takie równanie jak powyżej metodą korzystającą wyłącznie z (wektorowych) operacji mnożenia i dodawania.

Metoda bisekcji

Najprostsza metoda rozwiązywania równania $f (x) = 0$ .

Metoda bisekcji, czyli połowienia, często stosowana w innych działach informatyki, jest dość naturalną metodą obliczania zer skalarnych funkcji ciągłych określonych na danym przedziale $[a, b]$ i zmieniających znak. Dokładniej, rozpatrzmy klasę funkcji

F = {f \in C ([a, b]) : f (a) \cdot f (b) < 0} .

Oczywiście, każda funkcja $f \in F$ ma co najmniej jedno zero w $[a, b]$ . Startując z przedziału $[a, b]$ , w kolejnych krokach metody bisekcji obliczamy informację o wartości $f$ w środku przedziału, co pozwala nam, w zależności od znaku obliczonej wartości, zmniejszyć o połowę przedział, w którym na pewno znajduje się zero funkcji.

<flash>file=</flash><div.thumbcaption>Pierwsze trzy kroki metody bisekcji

Bisekcję realizuje następujący ciąg poleceń, po wykonaniu którego $x$ jest przybliżeniem zera funkcji $f$ z zadaną dokładnością $ϵ$ .

Algorytm {Metoda bisekcji}


xl = a; xr = b;
x = (a+b)/2;  e = (b-a)/2;
while (e > <math>\displaystyle \epsilon</math>) 
{
	if (f(x)*f(xl) < 0)	
		xr = x;
	else
		xl = x;
	x = (xl+xr)/2; e = e/2;
}

Z konstrukcji metody łatwo wynika, że po wykonaniu $k$ iteracji (czyli po obliczeniu $k$ wartości funkcji) otrzymujemy $x$ , które odległe jest od pewnego rozwiązania $x^{*}$ o co najwyżej

| x - x^{*} | \leq (\frac{1}{2})^{k} (\frac{b - a}{2}) .

Metoda bisekcji jest więc zbieżna liniowo z ilorazem $1 / 2$ . Choć ta zbieżność nie jest imponująca, bisekcja ma kilka istotnych zalet. Oprócz jej prostoty, należy podkreślić fakt, że bisekcja jest w pewnym sensie uniwersalna. Jeśli tylko dysponujemy dwoma punktami $a$ i $b$ takimi, że $f$ przyjmuje w nich wartości przeciwnych znaków, to metoda bisekcji z pewnością znajdzie miejsce zerowe funkcji, choćby początkowa długość przedziału $| b - a |$ była bardzo duża: zbieżność metody bisekcji jest globalna. Co ważniejsze, dla zbieżności metody bisekcji wystarcza jedynie ciągłość funkcji. Poza tym możemy łatwo kontrolować błąd bezwzględny aproksymacji miejsca zerowego. Konsekwencją (Uzupelnic: blbis ) jest bowiem następujący wniosek.

Wniosek

Dla znalezienia zera $x^{*}$ z dokładnością $ϵ > 0$ , wystarczy obliczyć w metodzie bisekcji

k = k (ϵ) = ⌈ \log_{2} \frac{(b - a)}{ϵ} ⌉ - 1

wartości funkcji.

Zbieżność metody bisekcji dla ....

Dodajmy jeszcze, że bisekcja minimalizuje błąd najgorszy w klasie $F$ zdefiniowanej Uzupełnij: na początku tej sekcji, wśród wszystkich algorytmów korzystających z określonej liczby obliczeń wartości funkcji, zob. Uzupełnij: uwaga na końcu wykładu.

Uwaga

Metoda bisekcji jest optymalna w następującym sensie. Niech $A : F \to R$ będzie dowolną metodą (algorytmem) aproksymującą zero $x^{*} (f)$ funkcji $f$ z klasy $F$ zdefiniowanej w (Uzupelnic: dfkl ), korzystającą jedynie z obliczeń (informacji o) $f$ w $k$ punktach. Wtedy dla dowolnego $γ > 0$ istnieje funkcja $f_{γ} \in F$ mająca tylko jedno zero $x^{*} (f_{γ})$ w $[a, b]$ i taka, że

| A (f_{γ}) - x^{*} (f_{γ}) | \geq (\frac{1}{2})^{k} (\frac{b - a}{2}) + γ .

Co więcej, można pokazać, że fakt ten zachodzi też w węższej klasie $F_{1}$ funkcji $f \in F$ , które są dowolnie wiele razy różniczkowalne. Oczywiście, nie wyklucza to istnienia metod iteracyjnych (takich jak metoda Newtona), które dla $f \in F_{1}$ są zbieżne szybciej niż liniowo.

Metoda iteracji prostej Banacha

Zupełnie inne, i jak się okaże --- przy odrobinie sprytu bardzo skuteczne --- podejście do wyznaczania miejsca zerowego jest oparte na metodzie Banacha.

Najpierw nasze równanie nieliniowe

f (x) = 0

przekształcamy (dobierając odpowiednią funkcję $ϕ$ ) do równania równoważnego (tzn. mającego te same rozwiązania)

x = ϕ (x) .

Następnie, startując z pewnego przybliżenia początkowego $x_{0}$ , konstruujemy ciąg kolejnych przybliżeń $x_{k}$ według wzoru

x_{k} = ϕ (x_{k - 1}), k \geq 1 .

Twierdzenie Banacha, o zbieżności iteracji prostej

Niech  $D_{0}$  będzie domkniętym

podzbiorem dziedziny $D$ ,

{\overline{D}}_{0} = D_{0} \subset D,

w którym $ϕ$ jest odwzorowaniem zwężającym. To znaczy, $ϕ (D_{0}) \subset D_{0}$ , oraz istnieje stała $0 \leq L < 1$ taka, że

‖ ϕ (x) - ϕ (y) ‖ \leq L ‖ x - y ‖, \forall x, y \in D_{0} .

Wtedy równanie (Uzupelnic: rrw ) ma dokładnie jedno rozwiązanie $x^{*}$ , oraz

x^{*} = \lim_{k \to \infty} x_{k},

dla dowolnego przybliżenia początkowego $x_{0} \in D_{0}$ .

Dowód

Wobec

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \| x_k- x_{k-1}\| &= \|\phi( x_{k-1})-\phi( x_{k-2})\| \,\le\,L\,\| x_{k-1}- x_{k-2}\| \\ &\le &\cdots\;\le\;L^{k-1}\| x_1- x_0\|, \endaligned}

dla $k \geq s$ mamy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \| x_k- x_s\| &\le & \sum_{j=s+1}^k\| x_j- x_{j-1}\| \,\le\,\sum_{j=s+1}^k L^{j-1}\| x_1- x_0\| \\ &= L^s(1+L+\cdots+L^{k-s-1})\| x_1- x_0\| \,\le\,\frac{L^s}{1-L}\| x_1- x_0\|. \endaligned}

Ciąg ${x_{k}}_{k}$ jest więc ciągiem Cauchy'ego. Stąd istnieje granica $\vec{α} = \lim_{k \to \infty} x_{k}$ , która należy do $D_{0}$ , wobec domkniętości tego zbioru. Ponieważ lipschitzowskość $ϕ$ implikuje jej ciągłość, mamy też

ϕ (\vec{α}) = ϕ (\lim_{k \to \infty} x_{k}) = \lim_{k \to \infty} ϕ (x_{k}) = \lim_{k \to \infty} x_{k} = \vec{α},

tzn. $\vec{α}$ jest punktem stałym odwzorowania $ϕ$ . Dla jednoznaczności zauważmy, że jeśliby istniał drugi, różny od $\vec{α}$ , punkt stały $\vec{β}$ , to mielibyśmy

‖ \vec{α} - \vec{β} ‖ = ‖ ϕ (\vec{α}) - ϕ (\vec{β}) ‖ \leq L ‖ \vec{α} - \vec{β} ‖ .

Stąd $1 < L$ , co jest sprzeczne z założeniem, że

ϕ

jest zwężająca.

Z powyższych rozważań otrzymujemy natychmiastowy wniosek dotyczący zbieżności iteracji prostych.

Wniosek

Przy założeniach Uzupełnij: twierdzenia Banacha, metoda iteracji prostych jest zbieżna co najmniej liniowo z ilorazem $L$ , tzn.

‖ x_{k} - x^{*} ‖ \leq L^{k} ‖ x_{0} - x^{*} ‖ .

Przykład

Dla ilustracji, rozpatrzmy natępujące proste równanie skalarne:

x = \cos (x), dla x \in D = R .

W tym przypadku $ϕ (x) = \cos (x)$ . Zauważamy, że w przedziale $[0, 1]$ funkcja $ϕ$ jest zwężająca ze stałą

L = \max_{0 \leq x \leq 1} | \cos^{'} (x) | = \sin (1) < 1 .

Stąd istnieje dokładnie jedno rozwiązanie naszego równania w przedziale $[0, 1]$ . Rozwiązanie to może być aproksymowane z dowolnie małym błędem przy pomocy iteracji prostych, startując z dowolnego przybliżenia początkowego $x_{0} \in [0, 1]$ .

Zaletą iteracji prostych jest fakt, że zbieżność nie zależy od wymiaru $n$ zadania, ale tylko od stałej Lipschitza $L$ (jednak w praktyce czasem sama stała Lipschitza może zależeć od wymiaru zadania...). Metoda Banacha ma szczególne zastosowanie w przypadku, gdy funkcja $ϕ$ jest zwężająca na całym zbiorze $D$ , tzn. $D_{0} = D$ . Jeśli ponadto $D$ ma skończoną średnicę $diam (D)$ , to dla osiągnięcia $ϵ$ -aproksymacji zera funkcji $f$ wystarczy wykonać

k = k (ϵ) = ⌈ \frac{\log (‖ x_{0} - x^{*} ‖ / ϵ)}{\log (1 / L)} ⌉ = ⌈ \frac{\log (diam (D) / ϵ)}{\log (1 / L)} ⌉

iteracji, niezależnie od $x_{0}$ . Metody zbieżne dla dowolnego przybliżenia początkowego, nazywamy zbieżnymi globalnie. Obie przedstawione dotychczas metody: bisekcji i Banacha, przy rozsądnych założeniach, są zbieżne globalnie.

Okazuje się, że metoda iteracji prostej może być --- w bardzo szczególnych przypadkach --- zbieżna szybciej niż liniowo. Z taką sytuacją będziemy mieli, gdy korzystać będziemy z metody Newtona.

Metoda Newtona

Zarówno metoda Banacha jak i bisekcja są zbieżnie liniowo, co w praktyce może okazać się zbieżnością dość powolną (np. dla metody zbieżnej liniowo z ilorazem $\frac{1}{2}$ , dopiero co 5 iteracji, dostajemy kolejną dokładną cyfrę wyniku). Wykorzystując więcej informacji o funkcji $f$ , której miejsca zerowego poszukujemy, możemy istotnie przyspieszyć zbieżność metody. Ceną, jaką przyjdzie nam zapłacić, będzie utrata globalnej zbieżności.

Metoda Newtona i jej podobne należą do grupy metod zbieżnych lokalnie. Znaczy to, że zbieżność ciągu ${x_{k}}_{k}$ do zera danej funkcji $f$ jest zapewniona jedynie wtedy, gdy przybliżenia początkowe zostały wybrane dostatecznie blisko $x^{*}$ .

W dalszych rozważaniach będziemy zakładać dla uproszczenia, że dziedzina $D = R$ .

Idea metody Newtona opiera się na popularnym wśród inżynierów pomyśle linearyzacji: zamiast szukać miejsca zerowego skomplikowanej $f$ , przybliżmy ją linią prostą, a dla niej już umiemy znaleźć miejsce zerowe!

Startując z pewnego przybliżenia początkowego $x_{0}$ , w kolejnych krokach metody, $k$ -te przybliżenie $x_{k}$ jest punktem przecięcia stycznej do wykresu $f$ w punkcie $x_{k - 1}$ . Ponieważ równanie stycznej wynosi $y (x) = f (x_{k - 1}) + f^{'} (x_{k - 1}) (x - x_{k - 1})$ , otrzymujemy wzór

x_{k} = x_{k - 1} - \frac{f (x_{k - 1})}{f^{'} (x_{k - 1})} .

Oczywiście, aby metoda Newtona była dobrze zdefiniowana, musimy założyć, że $f^{'} (x_{k - 1})$ istnieje i nie jest zerem.

Zauważmy, że metodę Newtona można traktować jako szczególny przypadek iteracji prostych, gdzie

ϕ (x) = x - \frac{f (x)}{f^{'} (x)} .

Widać też, że nie jest ona zbieżna globalnie.

Nawet jeśli pochodna w $x_{k - 1}$ się nie zeruje, ciąg ${x_{k}}_{k}$ może nie zbiegać do zera funkcji $f$ . Okazuje się jednak, że jeśli wystartujemy dostatecznie blisko rozwiązania $x^{*}$ , to metoda Newtona jest zbieżna. Dokładniej, załóżmy najpierw, że $f (x^{*}) = 0$ oraz

f^{'} (x^{*}) \neq 0 .

Ponadto załóżmy, że $f$ jest dwukrotnie różniczkowalna w sposób ciągły, $f \in C^{2} (D)$ . Rozwijając $ϕ$ w szereg Taylora w punkcie $x^{*}$ otrzymujemy

x_{k} - x^{*} = ϕ (x_{k - 1}) - ϕ (x^{*}) = (x_{k - 1} - x^{*}) ϕ^{'} (x^{*}) + (x_{k - 1} - x^{*})^{2} ϕ^{″} (ξ_{k}) / 2,

gdzie $\min (x^{*}, x_{k - 1}) \leq ξ_{k} \leq \max (x^{*}, x_{k - 1})$ . Wobec tego, że $ϕ^{'} (x^{*}) = f (x) f^{″} (x) / (f^{'} (x))^{2} = 0$ i $ϕ^{″} (ξ_{k}) = f^{″} (ξ_{k}) / f^{'} (ξ_{k})$ , mamy

x_{k} - x^{*} = (x_{k - 1} - x^{*})^{2} \frac{f^{″} (ξ_{k})}{2 f^{'} (ξ_{k})} .

Zdefiniujmy liczbę

R_{f} = \sup_{r \geq 0} \sup_{{x : | x - x^{*} | \leq r}} | \frac{2 (x - x^{*}) f^{″} (x)}{f^{'} (x)} | < 1 .

Oczywiście $R_{f} > 0$ . Dla $x_{k - 1}$ spełniającego $| x_{k - 1} - x^{*} | \leq R < R_{f}$ , mamy z poprzedniej równości (Uzupelnic: nrpdst )

| x_{k} - x^{*} | \leq q | x_{k - 1} - x^{*} |,

gdzie $q < 1$ i $q$ zależy tylko od $R$ .

Niech teraz $x^{*}$ będzie zerem $m$ -krotnym,

f (x^{*}) = f^{'} (x^{*}) = \dots = f^{(m - 1)} (x^{*}) = 0 \neq f^{(m)} (x^{*}),

gdzie $m \geq 2$ , oraz niech $f$ będzie $m$ -krotnie różniczkowalna w sposób ciągły. Wtedy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned x_k-x^* &= (x_{k-1}-x^*)\,-\,\frac{(x_{k-1}-x^*)^m \frac{f^{(m)} (\eta_k^{(1)})}{m!}}{(x_{k-1}-x^*)^{m-1} \frac{f^{(m-1)}(\eta_k^{(2)})}{(m-1)!}} \nonumber \\ &= (x_{k-1}-x^*)\left(1-\frac 1m\frac {f^{(m)}(\eta_k^{(1)})}{f^{(m)}(\eta_k^{(2)})} \right) \nonumber \\ &\approx & (x_{k-1}-x^*)\Big( 1-\frac 1m\Big), \endaligned}

o ile $x_{k - 1}$ jest "blisko" $x^{*}$ .

Metoda Newtona jest więc zbieżna lokalnie. Z (Uzupelnic: nrpdst ) i (Uzupelnic: nrtp ) można też wywnioskować, jaki jest charakter zbieżności metody Newtona. Dla zera jednokrotnego $x^{*}$ oraz $f^{″} (x^{*}) \neq 0$ mamy bowiem

(x_{k} - x^{*}) \approx (x - x_{k - 1})^{2} \frac{f^{″} (x^{*})}{2 f^{'} (x^{*})} .

Mówimy, że zbieżność jest kwadratowa. Jeśli zaś $f^{″} (x^{*}) = 0$ to zbieżnośc jest nawet szybsza. Z kolei dla zera $m$ -krotnego zbieżność jest liniowa z ilorazem $(1 - \frac{1}{m})$ .

Metoda Newtona jest pierwszą poznaną tutaj metodą iteracyjną, która jest (dla zer jednokrotnych) zbieżna szybciej niż liniowo. Dla takich metod wprowadza się pojęcie wykładnika zbieżności, który jest zdefiniowany następująco.

Powiemy, że metoda iteracyjna $ϕ$ jest w klasie funkcji $F$ rzędu co najmniej $p \geq 1$ , gdy spełniony jest następujący warunek. Niech $f \in F$ i $f (x^{*}) = 0$ . Wtedy istnieje stała $C < \infty$ taka, że dla dowolnych przybliżeń początkowych $x_{0}, \dots, x_{s - 1}$ dostatecznie bliskich $x^{*}$ , kolejne przybliżenia $x_{k} = ϕ (x_{k - 1}, \dots, x_{k - s})$ generowane tą metodą spełniają

| x_{k} - x^{*} | \leq C | x_{k - 1} - x^{*} |^{p} .

Ponadto, jeśli $p = 1$ to dodatkowo żąda się, aby $C < 1$ .

Definicja

Wykładnikiem zbieżności metody iteracyjnej $ϕ$ w klasie $F$ nazywamy liczbę $p^{*}$ zdefiniowaną równością

p^{*} = \sup {p \geq 1 : ϕ jest rzędu co najmniej p} .

Możemy teraz sformułować następujące twierdzenie, które natychmiast wynika z poprzednich rozważań.

Twierdzenie

Wykładnik zbieżności metody Newtona (stycznych) wynosi $p^{*} = 2$ w klasie funkcji o zerach jednokrotnych, oraz $p^{*} = 1$ w klasie funkcji o zerach wielokrotnych.

Zbieżność metody Newtona na tle metody bisekcji

Zbieżność metody Newtona dla zer wielokrotnych

Metoda siecznych

Inną znaną i często używaną metodą iteracyjną, opartą na podobnym pomyśle linearyzacyjnych co metoda Newtona jest metoda siecznych, w której zamiast przybliżenia wykresu $f$ przez styczną, stosuje się

przybliżenie sieczną.

Metoda ta wykorzystuje więc do konstrukcji $x_{k}$ przybliżenia $x_{k - 1}$ i $x_{k - 2}$ . Musimy również wybrać dwa różne punkty startowe $x_{0}$ i $x_{1}$ . Ponieważ prosta interpolująca $f$ w $x_{k - 1}$ i $x_{k - 2}$ ma wzór

y (x) = \frac{x - x_{k - 2}}{x_{k - 1} - x_{k - 2}} f (x_{k - 1}) + \frac{x - x_{k - 1}}{x_{k - 2} - x_{k - 1}} f (x_{k - 2}),

otrzymujemy

x_{k} = x_{k - 1} - \frac{x_{k - 1} - x_{k - 2}}{f (x_{k - 1}) - f (x_{k - 2})} f (x_{k - 1}) .

Zauważmy, że jeśli $x_{k - 1}$ i $x_{k - 2}$ są blisko siebie, to $x_{k}$ jest podobny do tego z metody Newtona, bowiem wtedy iloraz różnicowy

\frac{f (x_{k - 1}) - f (x_{k - 2})}{x_{k - 1} - x_{k - 2}} \approx f^{'} (x_{k - 1}) .

Nie wystarcza to jednak, aby osiągnąć zbieżność z wykładnikiem $2$ . Dokładniej, można pokazać, że wykładnik zbieżności metody siecznych dla zer jednokrotnych dostatecznie gładkich funkcji wynosi $p^{*} = \frac{1 + \sqrt{5}}{2} = 1.618 \dots$ . Jako wariant metody Newtona, metoda siecznych jest również zbieżna lokalnie.

Niewątpliwą zaletą metody siecznych jest jednak to, że nie wymaga ona obliczania pochodnej funkcji (co w praktyce jest często bardzo trudne, a niekiedy nawet niemożliwe), a tylko jej wartości. Jest to również istotne w pakietach numerycznych, gdzie czasem nie chcemy wymagać od użytkownika czegokolwiek ponad podanie funkcji i przybliżonej lokalizacji miejsca zerowego.

Ponadto, często zdarza się, że wyznaczenie wartości pochodnej, $f^{'} (x_{k})$ , jest tak samo, albo i bardziej kosztowne od wyznaczenia wartości $f (x_{k})$ . W takim wypadku okazuje się, że metoda stycznych --- choć wolniej zbieżna niż metoda stycznych --- dzięki temu, że jej iteracja wymaga jedynie wyznaczenia jednej wartości $f$ , jest bardziej efektywna od metody Newtona: koszt osiągnięcia zadanej dokładności jest w takim przypadku mniejszy od analogicznego kosztu dla metody Newtona.

Jednak, gdy żądane przez użytkownika dokładności są bardzo wielkie, a sama funkcja "złośliwa", metoda siecznych może cierpieć z powodu redukcji cyfr przy odejmowaniu.

Zbieżność metody siecznych na tle metody Newtona

Metoda Brenta

Naturalnie, uważny student zaczyna zadawać sobie pytanie, czy nie można w jakiś sposób połączyć globalnej zbieżności metody bisekcji z szybką zbieżnością metody siecznych tak, by uzyskać metodę zbieżną globalnie, a jednocześnie istotnie szybciej niż liniowo. (Wariant odwrotny: opracowanie metody łączącej wolną zbieżność bisekcji z lokalną zbieżnością siecznych, pozostawiamy studentom gorszych uczelni).

Okazuje się, że można to zrobić, wprowadzając metodę opartą na trzech punktach lokalizujących miejsce zerowe: dwóch odcinających zero tak jak w metodzie bisekcji i trzecim, konstruowanym jak np. w metodzie stycznych. W kolejnej iteracji konstruujemy wymieniamy jeden z punktów albo wedle metody siecznych (i wtedy zapewne szybciej zbliżamy się do zera), albo robiąc bisekcję (aby zagwarantować sobie, że w wiadomym przedziale miejsce zerowe rzeczywiście sie znajduje).

Ten prosty pomysł metody hybrydowej wymaga jednak subtelnego dopracowania, co zostało zrobione w 1973 roku przez Richarda Brenta, który twórczo rozwinął wcześniejsze idee Dekkera, van Wijngaardena i Dijkstry.

Funkcja MATLABa (i Octave'a) fzero implementuje metodę Brenta. Ciekawostką jest, że autorem implementacji w Octave jest ówczesny student matematyki na Uniwersytecie Warszawskim, Łukasz Bodzon.

Porównanie zbieżności różnych metod dla równań nieliniowych: zero jednokrotne

Porównanie zbieżności różnych metod dla równań nieliniowych: zero wielokrotne

Ciekawostki

O ile metoda Brenta jest oczywiście jego autorstwa, o tyle przypisywanie metody stycznych Newtonowi jest pewną przesadą. Metodę Newtona taką jaką znamy (z pochodną w mianowniku) zaproponował w 1740 roku Simpson (ten od kwadratury), a więc kilknaście lat po śmierci Newtona. Żeby było jeszcze zabawniej, odkrywcą metody siecznych zdaje się być... Newton! Więcej na ten temat przeczytasz w artykule T.Ypma w SIAM Review 37, 1995.

MN02: Różnice pomiędzy wersjami

Wersja z 17:17, 28 sie 2006

Spis treści

Rozwiązywanie równań nieliniowych

Metoda bisekcji

Metoda iteracji prostej Banacha

Metoda Newtona

Metoda siecznych

Metoda Brenta

Ciekawostki

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia

@@ Linia 1: / Linia 1: @@
+''Uwaga: przekonwertowane latex2mediawiki; prawdopodobnie trzeba wprowadzi? poprawki''
+==Rozwiązywanie równań nieliniowych==
+Możesz zastanawiać się, jak w procesorach implementuje się działania
+arytmetyczne, na przykład dzielenie. Okazuje się, że dzielenie <math>\displaystyle b/a</math> można
+zaimplementować korzystając z uprzednio zaimplementowanych operacji
+dodawania i mnożenia...
+W wielu zadaniach, m.in. matematyki stosowanej, spotykamy się z problemem
+rozwiązania skalarnego równania nieliniowego postaci <math>\displaystyle f(x) = 0</math>:
+* rozwiązywanie równania Keplera
+<center><math>\displaystyle f(x) \equiv x - \epsilon \sin(x) = 0</math></center>
+To równanie jest bardzo ważne w astronomii.
+* znajdowanie miejsc zerowych wielomianu:
+<center><math>\displaystyle f(x) \equiv a_nx^n + \ldots +
+a_1x + a_0 = 0</math></center>
+Bardzo wiele modeli matematycznych wymaga rozwiązania równania z wielomianową
+nieliniowością. Piękne kwadratury (Gaussa) opierają się na węzłach będących
+zerami pewnego wielomianu. Wielomiany są bardzo szczególnymi funkcjami i dla
+nich istnieje szereg specjalizowanych metod znajdowania ich pierwiastków, m.in.
+metoda Laguerre'a, metoda Bairstow'a (o nich tu nie będziemy mówić), a także
+zaskakujące metody sprowadzające zadanie poszukiwania miejsc zerowych wielomianu
+do zupełnie innego zadania matematycznego  --- o nich jednak
+będzie mowa dopiero w wykładzie dotyczącym [[sec:eigenvalue|Uzupełnij: znajdowania wartości własnych
+macierzy]].
+* znajdowanie miejsc zerowych trójmianu kwadratowego:
+<center><math>\displaystyle f(x) \equiv a_2x^2 +
+a_1x + a_0 = 0.
+</math></center>
+Jest to szczególny, ale oczywiście bardzo ważny (takie równania m.in. trzeba
+było kiedyś rozwiązywać w artylerii) przypadek poprzedniego zadania. Chociaż
+wydawać by  się mogło, że to umiemy już robić (wszyscy znamy wzory "z deltą")
+ale --- jak wkrótce się przekonamy --- i tutaj mogą spotkać nas niespodzianki!
+* obliczanie pierwiastka kwadratowego z zadanej liczby <math>\displaystyle a</math>:
+<center><math>\displaystyle f(x) \equiv
+x^2 - a = 0</math></center>
+Jeden ze sposobów na implementację funkcji "<code>sqrt()</code>". Szybkie algorytmy
+wyznaczania pierwiastka kwadratowego były znane już starożytnym. W wykładzie
+zrozumiemy, dlaczego metoda Herona,
+<center><math>\displaystyle
+x_{k+1} = \frac{1}{2}\left(x_k + \frac{a}{x_k}\right)
+</math></center>
+daje bardzo dobre przybliżenie <math>\displaystyle \sqrt{a}</math> już po kilku iteracjach.
+* implementacja wyznaczania odwrotności liczby <math>\displaystyle a</math> (''bez'' dzielenia!):
+<center><math>\displaystyle f(x) \equiv
+\frac{1}{x} - a = 0</math></center>
+Wciąż spotykane zadanie, np. tak można w praktyce poprawić precyzję funkcji
+wektorowych stosowanych w niektórych procesorach AMD, zob.
+\cite{AMD-optimization-guide}. Instrukcja procesora służąca do obliczania
+odwrotności sekwencji liczb umieszczonych w 128-bitowym rejestrze wektorowym
+daje wynik z małą precyzją (oczywiście po to, by wykonywała się szybciej!).
+Jeśli taka dokładność wyniku nie odpowiada nam, możemy ją --- zgodnie z manualem
+procesora --- poprawić, rozwiązując właśnie takie równanie jak powyżej metodą
+korzystającą wyłącznie z (wektorowych) operacji mnożenia i dodawania.
+===Metoda bisekcji===
+Najprostsza metoda rozwiązywania równania <math>\displaystyle f(x) = 0</math>.
+''Metoda bisekcji'', czyli ''połowienia'', często stosowana w innych
+działach informatyki, jest dość
+naturalną metodą obliczania zer skalarnych funkcji
+ciągłych określonych na danym przedziale <math>\displaystyle [a,b]</math>
+i zmieniających znak. Dokładniej, rozpatrzmy klasę
+funkcji
+<center><math>\displaystyle
+  F\,=\,\{\,f\in C([a,b])\,:\;f(a)\cdot f(b) < 0\,\}.
+</math></center>
+Oczywiście, każda funkcja <math>\displaystyle f\in F</math> ma co najmniej jedno
+zero w <math>\displaystyle [a,b]</math>. Startując z przedziału <math>\displaystyle [a,b]</math>, w
+kolejnych krokach metody bisekcji obliczamy informację
+o wartości <math>\displaystyle f</math> w środku przedziału, co pozwala nam,
+w zależności od znaku obliczonej wartości, zmniejszyć
+o połowę przedział, w którym na pewno znajduje się
+zero funkcji.
+<div class="thumb tright"><div><flash>file=</flash><div.thumbcaption>Pierwsze trzy kroki metody bisekcji</div></div></div>
+Bisekcję realizuje następujący ciąg
+poleceń, po wykonaniu którego <math>\displaystyle x</math> jest przybliżeniem
+zera funkcji <math>\displaystyle f</math> z zadaną dokładnością <math>\displaystyle \epsilon</math>.
 {{algorytm|{Metoda bisekcji}||
@@ Linia 171: / Linia 267: @@
 Stąd <math>\displaystyle 1<L</math>, co jest sprzeczne z założeniem, że
 <math>\displaystyle \phi</math> jest zwężająca. }}
+Z powyższych rozważań otrzymujemy natychmiastowy
+wniosek dotyczący zbieżności iteracji prostych.
+{{wniosek|||
+Przy założeniach [[twit|Uzupełnij: twierdzenia Banacha]],
+metoda iteracji prostych jest zbieżna co
+najmniej liniowo z ilorazem <math>\displaystyle L</math>, tzn.
+<center><math>\displaystyle \| x_k- x^*\|\,\le\,L^k\,\| x_0- x^*\|.
+</math></center>
+}}
+{{przyklad|||
+Dla ilustracji, rozpatrzmy natępujące proste
+równanie skalarne:
+<center><math>\displaystyle
+  x\,=\,\cos(x), \qquad \mbox{dla} \qquad x\in D= R.
+</math></center>
+W tym przypadku <math>\displaystyle \phi(x)=\cos(x)</math>. Zauważamy, że w
+przedziale <math>\displaystyle [0,1]</math> funkcja <math>\displaystyle \phi</math> jest zwężająca ze
+stałą
+<center><math>\displaystyle L\,=\,\max_{0\le x\le 1}|\cos'(x)|\,=\,\sin(1)\,<\,1.
+</math></center>
+Stąd istnieje dokładnie jedno rozwiązanie naszego równania
+w przedziale <math>\displaystyle [0,1]</math>. Rozwiązanie to może
+być aproksymowane z dowolnie małym błędem przy pomocy
+iteracji prostych, startując z dowolnego przybliżenia
+początkowego <math>\displaystyle  x_0\in [0,1]</math>.
+}}
+Zaletą iteracji prostych jest fakt, że zbieżność
+nie zależy od wymiaru <math>\displaystyle n</math> zadania, ale tylko od stałej
+Lipschitza <math>\displaystyle L</math> (jednak w praktyce czasem sama stała Lipschitza może zależeć od
+wymiaru zadania...). Metoda Banacha ma szczególne zastosowanie w
+przypadku, gdy funkcja <math>\displaystyle \phi</math> jest zwężająca na całym
+zbiorze <math>\displaystyle D</math>, tzn. <math>\displaystyle D_0=D</math>. Jeśli ponadto <math>\displaystyle D</math> ma
+skończoną średnicę <math>\displaystyle  \mbox{diam} (D)</math>, to dla
+osiągnięcia <math>\displaystyle \epsilon</math>-aproksymacji zera funkcji <math>\displaystyle f</math>
+wystarczy wykonać
+<center><math>\displaystyle k\,=\,k(\epsilon)\,=\,\Big\lceil\frac
+  {\log(\| x_0- x^*\|/\epsilon)}{\log(1/L)}\Big\rceil
+   \,=\,\Big\lceil\frac
+   {\log( \mbox{diam} (D)/\epsilon)}{\log(1/L)}\Big\rceil
+</math></center>
+iteracji, niezależnie od <math>\displaystyle x_0</math>. Metody zbieżne dla
+dowolnego przybliżenia początkowego, nazywamy
+''zbieżnymi globalnie''. Obie przedstawione dotychczas metody: bisekcji i
+Banacha, przy rozsądnych
+założeniach, są zbieżne globalnie.
+Okazuje się, że metoda iteracji prostej może być --- w bardzo szczególnych
+przypadkach --- zbieżna szybciej niż liniowo. Z taką sytuacją będziemy mieli,
+gdy korzystać będziemy z metody Newtona.
+===Metoda Newtona===
+Zarówno metoda Banacha jak i bisekcja są zbieżnie liniowo, co w praktyce może
+okazać się zbieżnością dość powolną (np. dla metody zbieżnej liniowo z ilorazem
+<math>\displaystyle \frac{1}{2}</math>, dopiero co 5 iteracji, dostajemy kolejną
+dokładną cyfrę wyniku). Wykorzystując więcej informacji o funkcji <math>\displaystyle f</math>, której
+miejsca zerowego poszukujemy, możemy istotnie przyspieszyć zbieżność metody.
+Ceną, jaką przyjdzie nam zapłacić, będzie utrata globalnej zbieżności.
+Metoda Newtona i jej podobne należą do
+grupy metod ''zbieżnych lokalnie''. Znaczy to, że
+zbieżność ciągu <math>\displaystyle \{x_k\}_k</math> do zera danej funkcji <math>\displaystyle f</math>
+jest zapewniona jedynie wtedy, gdy przybliżenia początkowe
+zostały wybrane dostatecznie blisko <math>\displaystyle x^*</math>.
+W dalszych rozważaniach będziemy zakładać dla
+uproszczenia, że dziedzina <math>\displaystyle D=R</math>.
+Idea metody Newtona opiera się na popularnym wśród inżynierów pomyśle ''linearyzacji'': zamiast szukać miejsca zerowego skomplikowanej <math>\displaystyle f</math>, przybliżmy ją
+linią prostą, a dla niej już umiemy znaleźć miejsce zerowe!
+Startując z pewnego przybliżenia
+początkowego <math>\displaystyle x_0</math>, w kolejnych krokach metody, <math>\displaystyle k</math>-te
+przybliżenie <math>\displaystyle x_k</math> jest punktem przecięcia stycznej do
+wykresu <math>\displaystyle f</math> w punkcie <math>\displaystyle x_{k-1}</math>. Ponieważ równanie
+stycznej wynosi <math>\displaystyle y(x)=f(x_{k-1})+f'(x_{k-1})(x-x_{k-1})</math>,
+otrzymujemy wzór
+<center><math>\displaystyle x_k\,=\,x_{k-1}\,-\,\frac{f(x_{k-1})}{f'(x_{k-1})}.
+</math></center>
+Oczywiście, aby metoda Newtona była dobrze zdefiniowana,
+musimy założyć, że <math>\displaystyle f'(x_{k-1})</math> istnieje i nie
+jest zerem.
+Zauważmy, że metodę Newtona można traktować jako
+szczególny przypadek iteracji prostych, gdzie
+<center><math>\displaystyle \phi(x)\,=\,x-\frac{f(x)}{f'(x)}.
+</math></center>
+Widać też, że nie jest ona zbieżna globalnie.
+Nawet jeśli pochodna w <math>\displaystyle x_{k-1}</math> się nie zeruje,
+ciąg <math>\displaystyle \{x_k\}_k</math> może nie zbiegać do zera funkcji <math>\displaystyle f</math>.
+Okazuje się jednak, że jeśli
+wystartujemy dostatecznie blisko rozwiązania <math>\displaystyle x^*</math>, to
+metoda Newtona jest zbieżna. Dokładniej, załóżmy
+najpierw, że <math>\displaystyle f(x^*)=0</math> oraz
+<center><math>\displaystyle f'(x^*)\,\ne\,0.
+</math></center>
+Ponadto załóżmy, że <math>\displaystyle f</math> jest dwukrotnie
+różniczkowalna w sposób ciągły, <math>\displaystyle f\in C^2(D)</math>.
+Rozwijając <math>\displaystyle \phi</math> w szereg Taylora w punkcie <math>\displaystyle x^*</math>
+otrzymujemy
+<center><math>\displaystyle x_k-x^*\,=\,\phi(x_{k-1})-\phi(x^*)\,=\,
+  (x_{k-1}-x^*)\phi'(x^*)+(x_{k-1}-x^*)^2\phi''(\xi_k)/2,
+</math></center>
+gdzie <math>\displaystyle \min(x^*,x_{k-1})\le\xi_k\le\max(x^*,x_{k-1})</math>.
+Wobec tego, że <math>\displaystyle \phi'(x^*)=f(x)f''(x)/(f'(x))^2=0</math> i
+<math>\displaystyle \phi''(\xi_k)=f''(\xi_k)/f'(\xi_k)</math>, mamy
+<center><math>\displaystyle
+  x_k-x^*\,=\,(x_{k-1}-x^*)^2\frac{f''(\xi_k)}{2f'(\xi_k)}.
+</math></center>
+Zdefiniujmy liczbę
+<center><math>\displaystyle R_f\,=\,\sup_{r\ge 0}\sup_{\{x:|x-x^*|\le r\}}
+   \Big|\frac{2(x-x^*)f''(x)}{f'(x)}\Big|\,<\,1.
+</math></center>
+Oczywiście <math>\displaystyle R_f>0</math>. Dla <math>\displaystyle x_{k-1}</math> spełniającego
+<math>\displaystyle |x_{k-1}-x^*|\le R<R_f</math>, mamy z poprzedniej równości ([[##nrpdst|Uzupelnic: nrpdst ]])
+<center><math>\displaystyle |x_k-x^*|\,\le\,q\,|x_{k-1}-x^*|,
+</math></center>
+gdzie <math>\displaystyle q<1</math> i <math>\displaystyle q</math> zależy tylko od <math>\displaystyle R</math>.
+Niech teraz <math>\displaystyle x^*</math> będzie zerem <math>\displaystyle m</math>-krotnym,
+<center><math>\displaystyle f(x^*)=f'(x^*)=\cdots =f^{(m-1)}(x^*)=0\ne f^{(m)}(x^*),
+</math></center>
+gdzie <math>\displaystyle m\ge 2</math>, oraz niech <math>\displaystyle f</math> będzie <math>\displaystyle m</math>-krotnie
+różniczkowalna w sposób ciągły. Wtedy
+<center><math>\displaystyle \aligned x_k-x^* &= (x_{k-1}-x^*)\,-\,\frac{(x_{k-1}-x^*)^m
+   \frac{f^{(m)}  (\eta_k^{(1)})}{m!}}{(x_{k-1}-x^*)^{m-1}
+   \frac{f^{(m-1)}(\eta_k^{(2)})}{(m-1)!}} \nonumber \\
+   &= (x_{k-1}-x^*)\left(1-\frac 1m\frac
+       {f^{(m)}(\eta_k^{(1)})}{f^{(m)}(\eta_k^{(2)})}
+       \right) \nonumber \\
+   &\approx & (x_{k-1}-x^*)\Big( 1-\frac 1m\Big),
+\endaligned</math></center>
+o ile <math>\displaystyle x_{k-1}</math> jest "blisko" <math>\displaystyle x^*</math>.
+Metoda Newtona jest więc zbieżna lokalnie.
+Z ([[##nrpdst|Uzupelnic: nrpdst ]]) i ([[##nrtp|Uzupelnic: nrtp ]]) można też wywnioskować,
+jaki jest charakter zbieżności metody Newtona. Dla zera
+jednokrotnego <math>\displaystyle x^*</math> oraz <math>\displaystyle f''(x^*)\ne 0</math> mamy bowiem
+<center><math>\displaystyle (x_k-x^*)\,\approx\,(x-x_{k-1})^2\frac{f''(x^*)}{2f'(x^*)}.
+</math></center>
+Mówimy, że zbieżność jest ''kwadratowa''. Jeśli zaś
+<math>\displaystyle f''(x^*)=0</math> to zbieżnośc jest nawet szybsza. Z kolei dla
+zera <math>\displaystyle m</math>-krotnego zbieżność jest liniowa z ilorazem
+<math>\displaystyle (1-\frac{1}{m})</math>.
+Metoda Newtona jest pierwszą poznaną tutaj metodą
+iteracyjną, która jest (dla zer jednokrotnych) zbieżna
+szybciej niż liniowo. Dla takich metod wprowadza się
+pojęcie ''wykładnika zbieżności'', który jest
+zdefiniowany następująco.
+Powiemy, że metoda iteracyjna <math>\displaystyle \phi</math> jest w klasie funkcji <math>\displaystyle F</math>
+rzędu co najmniej <math>\displaystyle p\ge 1</math>, gdy spełniony jest następujący
+warunek. Niech <math>\displaystyle f\in F</math> i <math>\displaystyle f(x^*)=0</math>. Wtedy istnieje stała
+<math>\displaystyle C<\infty</math> taka, że dla dowolnych przybliżeń początkowych
+<math>\displaystyle x_0,\ldots,x_{s-1}</math> dostatecznie bliskich <math>\displaystyle x^*</math>, kolejne
+przybliżenia <math>\displaystyle x_k=\phi(x_{k-1},\ldots,x_{k-s})</math> generowane
+tą metodą spełniają
+<center><math>\displaystyle |x_k-x^*|\,\le\,C\,|x_{k-1}-x^*|^p.
+</math></center>
+Ponadto, jeśli <math>\displaystyle p=1</math> to dodatkowo żąda się, aby <math>\displaystyle C<1</math>.
+{{definicja|||
+Wykładnikiem zbieżności metody
+iteracyjnej <math>\displaystyle \phi</math> w klasie <math>\displaystyle F</math> nazywamy liczbę <math>\displaystyle p^*</math>
+zdefiniowaną równością
+<center><math>\displaystyle p^*\,=\,\sup\,\{\,p\ge 1:\,\phi
+     \mbox{ jest rzędu co najmniej  }  p\,\}.
+</math></center>
+}}
+Możemy teraz sformułować następujące twierdzenie,
+które natychmiast wynika z poprzednich rozważań.
+{{twierdzenie|||
+Wykładnik zbieżności metody Newtona
+(stycznych) wynosi <math>\displaystyle p^*=2</math> w klasie funkcji o zerach
+jednokrotnych, oraz <math>\displaystyle p^*=1</math> w klasie funkcji o zerach
+wielokrotnych.
+}}
+[[Image:MN|400px|Zbieżność metody Newtona na tle metody bisekcji]]
+[[Image:MN|400px|Zbieżność metody Newtona dla zer wielokrotnych]]
+===Metoda siecznych===
+Inną znaną i często używaną metodą iteracyjną, opartą na podobnym pomyśle
+linearyzacyjnych co metoda Newtona
+jest ''metoda siecznych'', w której zamiast przybliżenia wykresu <math>\displaystyle f</math> przez
+styczną,  stosuje się
+ przybliżenie sieczną.
+Metoda ta
+wykorzystuje więc do konstrukcji <math>\displaystyle x_k</math> przybliżenia
+<math>\displaystyle x_{k-1}</math> i <math>\displaystyle x_{k-2}</math>. Musimy również wybrać dwa różne
+punkty startowe <math>\displaystyle x_0</math> i <math>\displaystyle x_1</math>. Ponieważ prosta interpolująca
+<math>\displaystyle f</math> w <math>\displaystyle x_{k-1}</math> i <math>\displaystyle x_{k-2}</math> ma wzór
+<center><math>\displaystyle y(x)\,=\,\frac{x-x_{k-2}}{x_{k-1}-x_{k-2}}f(x_{k-1})+
+           \frac{x-x_{k-1}}{x_{k-2}-x_{k-1}}f(x_{k-2}),
+</math></center>
+otrzymujemy
+<center><math>\displaystyle x_k\,=\,x_{k-1}\,-\,\frac{x_{k-1}-x_{k-2}}
+      {f(x_{k-1})-f(x_{k-2})}\,f(x_{k-1}).
+</math></center>
+Zauważmy, że jeśli <math>\displaystyle x_{k-1}</math> i <math>\displaystyle x_{k-2}</math> są blisko
+siebie, to <math>\displaystyle x_k</math> jest podobny do tego z metody Newtona,
+bowiem wtedy iloraz różnicowy
+<center><math>\displaystyle
+\frac{f(x_{k-1})-f(x_{k-2})}{x_{k-1}-x_{k-2}} \approx f'(x_{k-1}).
+</math></center>
+Nie wystarcza to
+jednak, aby osiągnąć zbieżność z wykładnikiem
+<math>\displaystyle 2</math>. Dokładniej, można pokazać, że wykładnik
+zbieżności metody siecznych dla zer jednokrotnych dostatecznie gładkich funkcji
+wynosi <math>\displaystyle p^*=\frac{1+\sqrt{5}}{2}=1.618\ldots</math>. Jako wariant metody Newtona, metoda
+siecznych jest również zbieżna lokalnie.
+Niewątpliwą zaletą metody siecznych jest jednak to,
+że nie wymaga ona obliczania pochodnej funkcji (co
+w praktyce jest często bardzo trudne, a niekiedy
+nawet niemożliwe), a tylko jej wartości. Jest to również istotne w pakietach
+numerycznych, gdzie czasem nie chcemy wymagać od użytkownika czegokolwiek ponad
+podanie funkcji i przybliżonej lokalizacji miejsca zerowego.
+Ponadto, często zdarza się, że wyznaczenie wartości pochodnej, <math>\displaystyle f'(x_k)</math>, jest
+tak samo, albo i bardziej kosztowne od wyznaczenia wartości <math>\displaystyle f(x_k)</math>. W takim
+wypadku okazuje się, że metoda stycznych --- choć wolniej zbieżna niż metoda
+stycznych --- dzięki temu, że
+jej iteracja wymaga jedynie wyznaczenia jednej wartości <math>\displaystyle f</math>, jest ''bardziej
+efektywna'' od metody Newtona: koszt osiągnięcia zadanej dokładności jest w
+takim przypadku mniejszy od analogicznego kosztu dla metody Newtona.
+Jednak, gdy żądane przez użytkownika dokładności są bardzo wielkie, a sama
+funkcja "złośliwa", metoda siecznych może cierpieć z powodu redukcji cyfr
+przy odejmowaniu.
+[[Image:MN|400px|Zbieżność metody siecznych na tle metody Newtona]]
+===Metoda Brenta===
+Naturalnie, uważny student zaczyna zadawać sobie pytanie, czy nie można w jakiś
+sposób połączyć globalnej zbieżności metody bisekcji z szybką zbieżnością
+metody siecznych tak, by uzyskać metodę zbieżną globalnie, a jednocześnie
+istotnie szybciej niż liniowo. (Wariant odwrotny: opracowanie metody łączącej
+wolną zbieżność bisekcji z lokalną zbieżnością siecznych, pozostawiamy
+studentom gorszych uczelni).
+Okazuje się, że można to zrobić, wprowadzając metodę opartą na ''trzech'' punktach lokalizujących miejsce zerowe: dwóch odcinających zero tak jak
+w metodzie bisekcji i trzecim, konstruowanym jak np. w metodzie stycznych. W
+kolejnej iteracji konstruujemy wymieniamy jeden z punktów albo wedle metody
+siecznych (i wtedy zapewne szybciej zbliżamy się do zera), albo robiąc bisekcję
+(aby zagwarantować sobie, że w wiadomym przedziale miejsce zerowe rzeczywiście
+sie znajduje).
+Ten prosty pomysł metody hybrydowej wymaga jednak subtelnego dopracowania, co
+zostało zrobione w 1973 roku przez Richarda Brenta, który twórczo rozwinął wcześniejsze idee
+Dekkera, van Wijngaardena i Dijkstry.
+Funkcja MATLABa (i Octave'a) <code>fzero</code> implementuje metodę Brenta.
+Ciekawostką jest, że autorem implementacji w Octave jest ówczesny student
+matematyki na Uniwersytecie Warszawskim, Łukasz Bodzon.
+[[Image:MN|400px|Porównanie zbieżności różnych metod dla równań nieliniowych: zero
+jednokrotne]]
+[[Image:MN|400px|Porównanie zbieżności różnych metod dla równań nieliniowych: zero
+wielokrotne]]
+===Ciekawostki===
+O ile metoda Brenta jest oczywiście jego autorstwa, o tyle przypisywanie metody
+stycznych Newtonowi jest pewną przesadą. Metodę Newtona taką jaką znamy (z
+pochodną w mianowniku) zaproponował w 1740 roku Simpson (ten od kwadratury), a
+więc kilknaście lat po śmierci Newtona. Żeby było jeszcze zabawniej, odkrywcą
+metody siecznych zdaje się być... Newton! Więcej na ten temat przeczytasz w
+artykule T.Ypma w SIAM Review 37, 1995.