Analiza matematyczna 1/Wykład 10: Wzór Taylora. Ekstrema

From Studia Informatyczne

Spis treści

Wzór Taylora. Ekstrema

Definiujemy pochodne wyższych rzędów oraz funkcje klasy \displaystyle C^k. Twierdzenie Taylora pozwala nam na sformułowanie warunku wystarczającego istnienia ekstremum funkcji klasy \displaystyle C^2. Pokazujemy, jak można za pomocą wielomianów Taylora przybliżać funkcje klasy \displaystyle C^{n+1}, \displaystyle n\geq 1. Formułujemy twierdzenie Weierstrassa o przybliżaniu wielomianami funkcji ciągłych na przedziale domkniętym.

Pochodne wyższych rzędów

Niech \displaystyle f będzie funkcją różniczkowalną w przedziale otwartym \displaystyle (a,b). Rozważmy funkcję pochodną

\displaystyle f': (a,b)\ni x\mapstof'(x)\in \mathbb{R}.

Definicja 10.1.

Jeśli funkcja \displaystyle f' jest różniczkowalna w punkcie \displaystyle x_0\in (a,b), to znaczy, jeśli istnieje granica ilorazu różnicowego:

\displaystyle \lim_{h\to 0}\frac{f'(x_0 +h)-f'(x_0)}{h},
to mówimy, że funkcja \displaystyle f jest dwukrotnie różniczkowalna w punkcie \displaystyle x_0, a granicę tę nazywamy pochodną rzędu drugiego (lub krótko: drugą pochodną) funkcji \displaystyle f w punkcie \displaystyle x_0 i oznaczamy symbolem \displaystyle f''(x_0) lub \displaystyle \frac{d^2 f}{dx^2}(x_0) albo \displaystyle \frac{d^2}{dx^2}f(x_0), bądź też \displaystyle f^{(2)}(x_0).

Przykład 10.2.

Znanym ze szkoły przykładem pochodnej rzędu drugiego jest przyśpieszenie, równe pochodnej prędkości \displaystyle v:

\displaystyle \frac{d^2}{dt^2}x(t)=\frac{d}{dt}\big(\frac{d}{dt}x(t)\big)=\frac{d}{dt}v(t),

gdzie \displaystyle t\mapsto x(t) oznacza położenie punktu materialnego w chwili \displaystyle t.

Definicję pochodnej rzędu \displaystyle n możemy podać dla kolejnych liczb naturalnych \displaystyle n=1,2,3,\dots. Często - aby uprościć wypowiedzi twierdzeń - terminem pochodna rzędu zerowego (albo krócej: zerowa pochodna) funkcji \displaystyle f będziemy nazywać samą funkcję \displaystyle f. Symbol pochodnej rzędu zerowego \displaystyle f^{(0)} będzie oznaczać funkcję \displaystyle f.

Niech \displaystyle f: (a,b)\mapsto \mathbb{R} będzie funkcją \displaystyle n-1 krotnie różniczkowalną, \displaystyle n>0.

Definicja 10.3.

Jeśli pochodna \displaystyle f^{(n-1)} rzędu \displaystyle n-1 funkcji \displaystyle f jest różniczkowalna w punkcie \displaystyle x_0\in (a,b), to znaczy, jeśli istnieje granica ilorazu różnicowego:
\displaystyle \lim_{h\to 0}\frac{f^{(n-1)}(x_0 +h)-f^{(n-1)}(x_0)}{h},

to mówimy, że funkcja jest \displaystyle n krotnie różniczkowalna w punkcie \displaystyle x_0, a granicę tę nazywamy pochodną rzędu \displaystyle n (lub krótko: \displaystyle n-tą pochodną) funkcji \displaystyle f w punkcie \displaystyle x_0 i oznaczamy symbolem \displaystyle f^{(n)}(x_0) lub \displaystyle \dfrac{d^n f}{dx^n}(x_0), bądź \displaystyle \dfrac{d^n}{dx^n}f(x_0).

Jeśli \displaystyle n=3,4,\dots, na oznaczenie pochodnej rzędu \displaystyle n funkcji \displaystyle f w punkcie \displaystyle x_0 używamy raczej symboli:

\displaystyle f^{(3)}(x_0), \ f^{(4)}(x_0), \dots ,
albo
\displaystyle \dfrac{d^3}{dx^3}f(x_0), \ \dfrac{d^4}{dx^4}f(x_0), \dots,
niż \displaystyle f'''(x_0), \ f''''(x_0), \dots.

Kolejne twierdzenie stanowi uogólnienie twierdzenia o pochodnej iloczynu dwóch funkcji na przypadek pochodnej rzędu \displaystyle n.

Gottfried Wilhelm Leibniz (1646-1716)Zobacz biografię
Enlarge
Gottfried Wilhelm Leibniz (1646-1716)
Zobacz biografię

Twierdzenie 10.4. [wzór Leibniza]

Niech \displaystyle f, g:\mathbb{R}\mapsto\mathbb{R} będą funkcjami \displaystyle n krotnie różniczkowalnymi, \displaystyle n\geq 1. Zachodzi równość

\displaystyle (f\cdot g)^{(n)}=\sum_{k=0}^{n} \binom{n}{k}f^{(n-k)}g^{(k)}.

Dowód 10.4.

Zwróćmy przede wszystkim uwagę na podobieństwo wzoru Leibniza do wzoru dwumianowego Newtona. Dowody obu twierdzeń są analogiczne. Zauważmy wpierw, że twierdzenie zachodzi dla \displaystyle n=1 mamy bowiem \displaystyle (fg)'=\binom{1}{0}f'g+\binom{1}{1}fg'=f'g+fg'. Następnie, korzystając z równości \displaystyle \binom{n}{k}+\binom{n}{k+1}=\binom{n+1}{k+1}, pokazujemy, że dla dowolnej liczby \displaystyle m\in{1,2,\dots, n-1} zachodzi implikacja

\displaystyle \bigg[(f\cdot g)^{(m)}=\sum_{k=0}^{m} \binom{m}{k}f^{(m-k)}g^{(k)}\bigg] \implies \bigg[(f\cdot g)^{(m+1)}=\sum_{k=0}^{m+1} \binom{m+1}{k}f^{(m-k+1)}g^{(k)}\bigg].

image:End_of_proof.gif

Niech \displaystyle k=0,1,2,\dots będzie liczbą całkowitą nieujemną.

Definicja 10.5.

Mówimy, że funkcja \displaystyle f:(a,b)\mapsto\mathbb{R} jest klasy \displaystyle C^k w przedziale \displaystyle (a,b), jeśli jest \displaystyle k krotnie różniczkowalna w przedziale \displaystyle (a,b) i pochodna \displaystyle (a,b)\nix\mapsto f^{(k)}(x) rzędu \displaystyle k funkcji \displaystyle f jest ciągła. Jeśli dla dowolnej liczby \displaystyle k\in\{0,1,2,3,\dots\} funkcja \displaystyle f jest klasy \displaystyle C^k w przedziale \displaystyle (a,b), to mówimy, że jest klasy \displaystyle C^{\infty} w tym przedziale.

Przykład 10.6.

Dowolna funkcja wielomianowa, funkcje sinus, cosinus i wykładnicza \displaystyle \exp są przykładami funkcji klasy \displaystyle C^\infty w całym zbiorze liczb rzeczywistych. Ogólnie: dowolna funkcja dana za pomocą szeregu potęgowego \displaystyle f(x)=\sum_{k=0}^{\infty}a_k(x-x_0)^k jest klasy \displaystyle C^\infty w

przedziale otwartym \displaystyle (x_0 -R, x_0+R), gdzie \displaystyle R jest promieniem zbieżności szeregu potęgowego.

Przykład 10.7.

Funkcja \displaystyle f_0(x)=|x| jest ciągła, ale nie ma ciągłej pochodnej w dowolnym przedziale \displaystyle (a,b), do którego należy zero, tj. gdy \displaystyle a<0<b. Jest więc klasy \displaystyle C^0 i nie jest klasy \displaystyle C^1 w takim przedziale. Jeśli zero nie należy do przedziału \displaystyle (a,b), czyli gdy \displaystyle a<b<0 lub \displaystyle 0<a<b, to restrykcja \displaystyle f(x)=|x| do przedziału \displaystyle (a,b) jest wielomianem, czyli funkcją klasy \displaystyle C^\infty.


Rysunek do przykładu 10.8.


Rysunek do przykładu 10.8.


Rysunek do przykładu 10.8.

Przykład 10.8.

Funkcja

\displaystyle f_1(x)=\left\{\aligned -\frac{1}{2}x^2, \text{ dla }x<0\\\frac{1}{2}x^2, \text{ dla }x\geq 0 \endaligned\right.

jest różniczkowalna i jej pochodna \displaystyle f'(x)=|x|. Stąd jeśli \displaystyle a<0<b, to \displaystyle f_1 jest klasy \displaystyle C^1 w przedziale \displaystyle (a,b), ale nie jest klasy \displaystyle C^2.

Przykład ten możemy łatwo dalej modyfikować. Na przykład funkcja

\displaystyle f_2(x)=\left\{\aligned -\frac{1}{6}x^3, \text{ dla }x<0\\\frac{1}{6}x^3, \text{ dla }x\geq 0 \endaligned\right.

ma pierwszą pochodną równą \displaystyle f_2 '(x)=f_1 (x), a jej drugą pochodną jest \displaystyle f_2 ''(x)=f_0 (x)=|x|. Funkcja \displaystyle f_2 jest więc klasy \displaystyle C^2, ale nie jest klasy \displaystyle C^3 w dowolnym przedziale otwartym zawierającym zero. Ogólnie

\displaystyle f_n(x)=c_n |x|^{n+1}\mathrm{sgn}\, x =\left\{\aligned -c_n x^{n+1}, \text{ dla }x<0\\ c_n x^{n+1}, \text{ dla }x\geq 0 \endaligned\right.
(gdzie \displaystyle c_n=\frac{1}{(n+1)!}, bądź też jest dowolną inną stałą różną od zera) jest funkcją klasy \displaystyle C^n i nie jest klasy \displaystyle C^{n+1} w dowolnym przedziale otwartym zawierającym zero.

Wzór Taylora

Niech \displaystyle w(x)=a_0 +a_1 x+a_2 x^2 +a_3 x^3\dots +a_{n-1}x^{n-1}+a_n x^n będzie wielomianem. Zauważmy, że wartości pochodnych rzędu \displaystyle k=0,1,2,3,\dots , n, n+1,\dots w punkcie \displaystyle x=0 wyrażają się prosto za pomocą współczynników tego wielomianu:

\displaystyle \aligned w(0)&=a_0\\ w'(0)&=a_1, \\\text{ gdyż }w'(x)&=0+a_1 +2 a_2 x+3a_3 x^2 +\dots +(n-1)a_{n-1}x^{n-2}+n a_n x^{n-1}\\ w''(0)&=2 a_2,\\ \text{ gdyż }w''(x)&=0+0 +2 a_2 +3\cdot 2 a_3 x +\dots +(n-1)(n-2)a_{n-1}x^{n-3}+n(n-1) a_n x^{n-2}\\ w^{(3)}(0)&=3\cdot 2 a_3,\\ \text{ gdyż }w^{(3)}(x)&=0+0 +0 +3\cdot 2 a_3  +\dots +(n-1)(n-2)(n-3)a_{n-1}x^{n-4}+n(n-1)(n-2) a_n x^{n-3}\\ &\vdots \\ w^{(n-1)}(0)&=(n-1)! a_{n-1},\\ \text{ gdyż }w^{(n-1)}(x)&=0+0 +0 +0 +\dots +(n-1)!a_{n-1}+n! a_n x\\ w^{(n)}(0)&=n! a_{n},\\ \text{ gdyż }w^{(n)}(x)&=0+0 +0 +0 +\dots +0+n! a_n \\w^{(n+1)}(0)&=0,\\ \text{ gdyż }w^{(n+1)}(x)&=0+0 +0 +0 +\dots +0+0 \text{ dla dowolnej liczby } x.\endaligned
Każda następna pochodna rzędu wyższego niż stopień wielomianu \displaystyle w jest równa zeru, i to nie tylko w punkcie zero, ale w każdym punkcie \displaystyle x\in \mathbb{R}.

Uogólnieniem tej obserwacji jest następujące twierdzenie Taylora:

Twierdzenie 10.9.

Niech \displaystyle f:(\alpha, \beta)\mapsto \mathbb{R} będzie funkcją \displaystyle n+1 krotnie różniczkowalną w przedziale \displaystyle (\alpha, \beta). Wówczas dla dowolnych punktów \displaystyle a, \displaystyle b takich, że \displaystyle \alpha<a<b<\beta istnieje punkt \displaystyle \xi_{n+1}\in (a,b) taki, że

\displaystyle f(b)=T^{n}_a f(b)+\frac{1}{(n+1)!}f^{(n+1)}(\xi_{n+1})(b-a)^{n+1},

gdzie

\begin{array}{lll} \displaystyle T^{n}_a f (b)&=&\displaystyle f(a)+f'(a)(b-a)+\frac{f''(a)}{2!}(b-a)^2+\dots\\ &+&\displaystyle \frac{f^{(n-1)}(a)}{(n-1)!}(b-a)^{n-1}+\frac{f^{(n)}(a)}{n!}(b-a)^{n}.\end{array}

Definicja 10.10.

Wielomian
\displaystyle \aligned T^{n}_a f : \mathbb{R}\ni x\mapsto T^{n}_a f(x)&=\sum_{k=0}^n\frac{f^{(k)}(a)}{k!}(x-a)^k\\&=f(a)+f'(a)(x-a)+\frac{f''(a)}{2!}(x-a)^2+\dots+\frac{f^{(n-1)}(a)}{(n-1)!}(x-a)^{n-1}+\frac{f^{(n)}(a)}{n!}(x-a)^{n}\endaligned

nazywamy wielomianem Taylora rzędu \displaystyle n funkcji \displaystyle f o środku w punkcie \displaystyle a.

Nim wykażemy twierdzenie Taylora, zauważmy, że z założenia o istnieniu pochodnej rzędu \displaystyle n+1 funkcji \displaystyle f w przedziale \displaystyle (\alpha, \beta) wynika, że funkcja \displaystyle f i wszystkie jej pochodne \displaystyle f', \ f'', \ f^{(3)}, \dots, f^{(n-1)}, f^{(n)} aż do rzędu \displaystyle n włącznie, istnieją i są ciągłe w tym przedziale.

Zauważmy też, że w przypadku \displaystyle n=1 twierdzenie Taylora sprowadza się do twierdzenia Lagrange'a:

\displaystyle f(b)=f(a)+f'(\xi_1)(b-a).

Dowód 10.9.

(twierdzenia Taylora) Niech \displaystyle M będzie stałą określoną tak, że zachodzi równość

\displaystyle f(b)=T^{n}_a f(b)+M(b-a)^{n+1}.

Aby dowieść twierdzenia, wystarczy pokazać, że istnieje punkt \displaystyle \xi_{n+1}\in (a,b) taki, że \displaystyle (n+1)!M=f^{(n+1)}(\xi_{n+1}). Rozważmy dla \displaystyle t\in[a,b] funkcję

\displaystyle  g(t):=f(t)-T^{n}_a f(t)-M(t-a)^{n+1}.

Zauważmy, że \displaystyle g(a)=0 i z określenia stałej \displaystyle M mamy również: \displaystyle g(b)=0. Z twierdzenia Rolle'a wynika więc, że istnieje \displaystyle \xi_1\in (a,b) taki, że \displaystyle g'(\xi_1)=0. Zauważmy następnie, że nie tylko funkcja \displaystyle g, ale również kolejne jej pochodne \displaystyle g^{(k)} dla \displaystyle k=1,2,\dots, n zerują się w punkcie \displaystyle a. Wobec tego, że \displaystyle g'(a)=0 i \displaystyle g'(\xi_1)=0, z twierdzenia Rolle'a, wnioskujemy o istnieniu kolejnego punktu \displaystyle \xi_2\in (a, \xi_1), w którym zeruje się druga pochodna funkcji \displaystyle g, tj. \displaystyle g''(\xi_2)=0. Powtarzając rozumowanie dla kolejnych pochodnych \displaystyle g^{(k)}, \displaystyle k=1,2,\dots, n na podstawie twierdzenia Rolle'a wnioskujemy o istnieniu punktów \displaystyle \xi_{k+1}\in (a, \xi_k ) takich, że \displaystyle g^{(k+1)}(\xi_{k+1})=0. Zwróćmy uwagę, iż ostatni ze znalezionych punktów \displaystyle \xi_{n+1} jest tym punktem, którego istnienie postulujemy w tezie twierdzenia. Zauważmy, że pochodna rzędu \displaystyle n+1 funkcji \displaystyle g wynosi

\displaystyle \aligned \frac{d^{n+1}}{dt^{n+1}}g(t)&=\frac{d^{n+1}}{dt^{n+1}}\big(f(t)-T^{n}_a f(t)-M(t-a)^{n+1}\big)\\&=f^{(n+1)}(t)-0-(n+1)!M. \endaligned

(Pochodna rzędu \displaystyle n+1 wielomianu \displaystyle t\mapsto T_a^n f(t) jest w każdym punkcie równa zeru, gdyż wielomian ten jest stopnia co najwyżej \displaystyle n.) Stąd \displaystyle 0=g^{(n+1)}(\xi_{n+1})=f^{(n+1)}(\xi_{n+1})-(n+1)! M.

image:End_of_proof.gif

Jednym z ważniejszych wniosków z wykazanego twierdzenia jest warunek wystarczający istnienia ekstremum funkcji dwukrotnie różniczkowalnej.



Rysunek do przykładu 10.12.

Twierdzenie 10.11.

Niech \displaystyle f:(a,b) \mapsto \mathbb{R} będzie funkcją klasy \displaystyle C^2 w przedziale \displaystyle (a,b) (czyli funkcją dwukrotnie różniczkowalną o ciągłej drugiej pochodnej \displaystyle f'' w przedziale \displaystyle (a,b)). Załóżmy, że w punkcie \displaystyle x_0\in (a,b) pochodna \displaystyle f'(x_0) zeruje się.

a) Jeśli \displaystyle f''(x_0)>0, to \displaystyle f osiąga minimum lokalne w punkcie \displaystyle x_0.

b) Jeśli \displaystyle f''(x_0)<0, to \displaystyle f osiąga maksimum lokalne w punkcie \displaystyle x_0.

Dowód 10.11.

a) Załóżmy, że \displaystyle f''(x_0)>0. Ze wzoru Taylora i z założenia o zerowaniu się pierwszej pochodnej \displaystyle f' danej funkcji mamy


\displaystyle  \begin{array}{lll} f(x_0+h)&=&f(x_0)+f'(x_0)+\frac{1}{2}f''(x_0+\theta h)\\ &=&f(x_0)+0+\frac{1}{2}f''(x_0+\theta h),\end{array}
gdzie \displaystyle \theta jest pewną liczbą z przedziału \displaystyle (0,1). Stąd znak różnicy \displaystyle f(x+h)-f(x)=\frac{1}{2}f''(x_0+\theta h) jest taki sam jak znak drugiej pochodnej \displaystyle f''(x_0+\theta h) w pewnym punkcie pośrednim między punktem \displaystyle x_0 a \displaystyle x_0+h. Z założenia o ciągłości drugiej pochodnej \displaystyle f'' na mocy własności Darboux wnioskujemy, że nie tylko w samym punkcie \displaystyle x_0 druga pochodna \displaystyle f'' jest dodatnia, ale również w pewnym otoczeniu tego punktu. Biorąc więc na tyle mały przyrost \displaystyle h, aby zarówno \displaystyle x_0 jak i \displaystyle x_0+h należały do przedziału, w którym \displaystyle f'' jest dodatnia i nie zeruje się, otrzymamy nierówność \displaystyle f''(x+\theta h)>0 również w punkcie pośrednim. Stąd \displaystyle f osiąga minimum lokalne w punkcie \displaystyle x_0, gdyż \displaystyle f(x+h)-f(x)\leq 0 w pewnym otoczeniu punktu \displaystyle x_0. Dowód implikacji b) przebiega podobnie.

image:End_of_proof.gif

Zauważmy, że podane twierdzenie nie rozstrzyga o istnieniu ani o typie ekstremum w przypadku, gdy \displaystyle f'(x_0)=0 oraz \displaystyle f''(x_0)=0.




Rysunek do przykładu 10.12.


Rysunek do przykładu 10.12.


Przykład 10.12.

Rozważmy funkcje \displaystyle f_1(x)=-x^4, \displaystyle f_2(x)=x^4, \displaystyle f_3(x)=x^3. Łatwo zauważyć, że zarówno pierwsza jak i druga pochodna każdej z tych trzech funkcji w punkcie \displaystyle x_0=0 zerują się, podczas gdy \displaystyle f_1 osiąga maksimum w tym punkcie, a \displaystyle f_2 minimum. Natomiast funkcja \displaystyle f_3 w ogóle nie osiąga ekstremum w punkcie \displaystyle x_0=0.
Uwaga 10.13.

Wzór, który występuje w tezie twierdzenia Taylora:

\displaystyle \aligned f(b)&=T^n_a f(b)+\frac{f^{(n+1)}(\xi_{n+1})}{(n+1)!}(b-a)^{n+1} \\ &=\sum_{k=0}^n\frac{f^{(k)}(a)}{k!}(b-a)^k+\frac{f^{(n+1)}(\xi_{n+1})}{(n+1)!}(b-a)^{n+1}\endaligned
nazywamy wzorem Taylora z resztą Lagrange'a
\displaystyle R_{n+1}=\frac{f^{(n+1)}(\xi_{n+1})}{(n+1)!}(b-a)^{n+1}.
Jeśli oznaczymy przyrost argument funkcji przez \displaystyle h:=b-a, to wzór ten przyjmie postać
\displaystyle \aligned f(a+h)&=T^n_a f(a+h)+\frac{f^{(n+1)}(a+\theta h)}{(n+1)!}h^{n+1} \\ &=\sum_{k=0}^n\frac{f^{(k)}(a)}{k!}h^k+\frac{f^{(n+1)}(a+\theta h)}{(n+1)!}h^{n+1}\endaligned

dla pewnej liczby \displaystyle \theta \in (0,1) dobranej tak, aby \displaystyle a+\theta h=\xi_{n+1}. Tę postać nazywamy wzorem Taylora z resztą Cauchy'ego

Augustin Louis Cauchy (1789-1857)Zobacz biografię
Enlarge
Augustin Louis Cauchy (1789-1857)
Zobacz biografię
Colin Maclaurin (1698-1746)Zobacz biografię
Enlarge
Colin Maclaurin (1698-1746)
Zobacz biografię

\displaystyle R_{n+1}=\frac{f^{(n+1)}(a+\theta h)}{(n+1)!}h^{n+1}.
W szczególnym przypadku, gdy \displaystyle a=0 otrzymamy wzór
\displaystyle \aligned f(h)&=T^n_0 f(h)+\frac{f^{(n+1)}(\theta h)}{(n+1)!}h^{n+1} \\ &=\sum_{k=0}^n\frac{f^{(k)}(0)}{k!}h^k+\frac{f^{(n+1)}(\theta h)}{(n+1)!}h^{n+1},\endaligned
który nazywamy wzorem Maclaurina z resztą
\displaystyle R_{n+1}=\frac{f^{(n+1)}(\theta h)}{(n+1)!}h^{n+1}.

Uwaga 10.14.

Jeśli \displaystyle w jest wielomianem stopnia \displaystyle k, to dla dowolnej liczby \displaystyle n\geq k wielomian Taylora rzędu \displaystyle n o środku w punkcie \displaystyle a=0 jest dokładnie równy wielomianowi \displaystyle w, to znaczy

\displaystyle w(h)=w(0)+w'(0)h+\frac{w''(0)}{2!}h^2 +\dots +\frac{w^{(n)}(0)}{n!}h^n +R_{n+1}   przy czym   R_{n+1}=0.

Powstaje naturalne pytanie, czy dla innych funkcji (niekoniecznie wielomianów) wzór Taylora pozwala na przedstawienie funkcji \displaystyle f za pomocą wielomianu Taylora \displaystyle T^n_a f tak, aby reszta \displaystyle R_{n+1} była jak najmniejsza i zmierzała do zera, gdy rośnie \displaystyle n, czyli gdy rośnie stopień wielomianu Taylora funkcji \displaystyle f.

Odpowiedź na pytanie uzyskamy, stosując np. wzór Taylora z resztą Cauchy'ego.

Twierdzenie 10.15.

Niech \displaystyle f:(\alpha, \beta)\mapsto \mathbb{R} będzie funkcją \displaystyle n+1 krotnie różniczkowalną i niech \displaystyle \alpha<a<b<\beta. Jeśli


\displaystyle M:=\sup\{|f^{(n+1)}(t)|, t\in [a,b]\}<\infty


(czyli wartość bezwzględna pochodnej rzędu \displaystyle (n+1) funkcji \displaystyle f jest ograniczona przez stałą \displaystyle M, która nie zależy od wyboru punktu \displaystyle t z przedziału \displaystyle [a, b]), to dla dowolnej liczby \displaystyle h takiej, że \displaystyle 0\leq h\leq b-a, zachodzi oszacowanie:

\displaystyle \bigg|f(a+h)-\sum_{k=0}^n\frac{f^{(k)} (a)}{k!}h^k\bigg|\leq \frac{M}{(n+1)!}h^{n+1}.

Dowód 10.15.

Szacując resztę we wzorze Taylora (z resztą Cauchy'ego), otrzymamy:

\displaystyle \aligned \bigg|f(a+h)-\sum_{k=0}^n\frac{f^{(k)} (a)}{k!}h^k\bigg| &=\bigg|\frac{f^{(n+1)}(a+\theta h)}{(n+1)!}h^{n+1}\bigg|\\ &\leq \frac{h^{n+1}}{(n+1)!}\sup\{|f^{(n+1)}(a+\theta h)|, 0<\theta h<b-a \}\\&\leq M \frac{h^{n+1}}{(n+1)!}.\endaligned
image:End_of_proof.gif

Wniosek 10.16.

Jeśli pochodna rzędu \displaystyle n+1 funkcji \displaystyle f jest ograniczona w przedziale \displaystyle (\alpha, \beta), to dla dowolnych punktów \displaystyle a oraz \displaystyle a+h z tego przedziału mamy oszacowanie


\displaystyle \bigg|f(a+h)-\sum_{k=0}^n\frac{f^{(k)} (a)}{k!}h^k\bigg|\leq \frac{M}{(n+1)!}|h|^{n+1},


gdzie \displaystyle M:=\sup\{|f^{(n+1)}(t)|, \alpha<t<\beta\}.

Dowód 10.16.

Jeśli \displaystyle h>0, wniosek sprowadza się do poprzedniego twierdzenia. Jeśli \displaystyle h<0, należy powtórzyć poprzednie rozumowanie

w przedziale \displaystyle [a+h,a]. image:End_of_proof.gif


Rysunek do przykładu 10.18.


Rysunek do przykładu 10.17.

Przykład 10.17.

Oszacowanie reszty we wzorze Maclaurina funkcji sinus jest wyjątkowo proste

\displaystyle \sin h=h-\frac{h^3}{3!}+\frac{h^5}{5!}+\dots+(-1)^n\frac{h^{2n+1}}{(2n+1)!}+R_{2n+2},
gdzie
\displaystyle |R_{2n+2}|=\bigg|\sin^{(2n+2)}(\theta h)\cdot \frac{h^{(2n+2)}}{(2n+2)!}\bigg| \leq \frac{|h|^{(2n+2)}}{(2n+2)!},
gdyż wartość bezwzględna pochodnych dowolnie wysokiego rzędu funkcji sinus jest ograniczona z góry przez 1. Wzór ten pozwala wyznaczyć wartość \displaystyle \sin h z zadaną z góry dokładnością. Na przykład, chcąc wyznaczyć \displaystyle \sin \frac{1}{2} z dokładnością do \displaystyle 10^{-6}, wystarczy wskazać taką liczbę \displaystyle n, aby zachodziła nierówność \displaystyle |R_{2n+2}|<10^{-6}, czyli \displaystyle \dfrac{1}{2^{2n+2}(2n+2)!}<10^{-6}. Na mocy wykazanego powyżej wniosku mamy oszacowania:
\displaystyle \bigg|\sin \frac{1}{2}-\big(\frac{1}{2}-\frac{1}{2^3\cdot 3!}\big)\bigg|\leq \frac{1}{46080},
natomiast
\displaystyle \bigg|\sin \frac{1}{2}-\big(\frac{1}{2}-\frac{1}{2^3\cdot 3!}+\frac{1}{2^5\cdot 5!}\big)\bigg|\leq \frac{1}{10321920},
a więc suma \displaystyle \frac{1}{2}-\frac{1}{48}+\frac{1}{3840} różni się (a dokładniej: jest większa) o nie więcej niż jedną dziesięciomilionową od \displaystyle \sin\frac{1}{2}.


Przykład 10.18.

Równie łatwo można oszacować resztę we wzorze Maclaurina funkcji cosinus

\displaystyle \cos h=1-\frac{h^2}{2}+\frac{h^4}{4!}+\dots+(-1)^n \frac{h^{2n}}{(2n)!}+R_{2n+1},

gdyż wartość bezwzględna pochodnych dowolnie wysokiego rzędu funkcji cosinus jest ograniczona z góry przez 1, więc

\displaystyle |R_{2n+1}|=\bigg|\cos^{(2n+1)}(\theta h)\cdot \frac{h^{(2n+1)}}{(2n+1)!}\bigg| \leq \frac{|h|^{(2n+1)}}{(2n+1)!}.

Przybliżanie funkcji ciągłych wielomianami



Rysunek do przykładu 10.19.

Powstaje naturalne pytanie, czy reszta \displaystyle R_{n+1} we wzorze Maclaurina stanowi ciąg zbieżny do zera, jeśli funkcja \displaystyle f jest klasy \displaystyle C^\infty w przedziale zawierającym punkt \displaystyle 0? Negatywna odpowiedź na to pytanie zawarta jest w kolejnym przykładzie.


Przykład 10.19.

Funkcja

\displaystyle f(x)=\bigg\{\begin{array}{ll} 0 & \text{ dla }x\leq 0\\ \exp(-\frac{1}{x}) & \text{ dla } x>0 \end{array} \right.
jest różniczkowalna w każdym punkcie \displaystyle x\in \mathbb{R}. W szczególności zerują się wszystkie pochodne w punkcie zero, tj.
\displaystyle \forall k=0,1,2,3,\dots \ : f^{(k)}(0)=0,

(fakt ten wykażemy w kolejnym module), czyli wszystkie współczynniki wielomianu Taylora o środku w zerze są zerowe. Z twierdzenia Taylora mamy równość: \displaystyle f(h)=T_{0}^n(h)+R_{n+1}=0+R_{n+1}. Zwróćmy uwagę, że dla dowolnej liczby \displaystyle h>0 funkcja \displaystyle f przyjmuje wartość dodatnią, więc reszta \displaystyle R_{n+1} nie stanowi ciągu zbieżnego do zera.

Twierdzenie Taylora nie jest optymalnym narzędziem do przybliżania dowolnych funkcji różniczkowalnych za pomocą wielomianów, gdyż - jak pokazaliśmy w powyższym przykładzie - istnieją funkcje klasy \displaystyle C^\infty (czyli takie, które mają ciągłe pochodne dowolnie wysokiego rzędu), których nie da się w rozsądny sposób przybliżyć za pomocą wielomianów Taylora \displaystyle T_a ^n f.

Prawdziwe jest jednak twierdzenie, które gwarantuje możliwość przybliżania funkcji ciągłych na przedziale domkniętym wielomianami.

Karl Weierstrass (1815-1897)Zobacz biografię
Enlarge
Karl Weierstrass (1815-1897)
Zobacz biografię

Twierdzenie 10.20. [twierdzenie Weierstrassa]

Funkcję ciągłą na przedziale domkniętym można przybliżać jednostajnie za pomocą wielomianów, tzn. jeśli \displaystyle f:[a,b] \mapsto\mathbb{R} jest funkcją ciągłą, to istnieje ciąg wielomianów \displaystyle w_n taki, że

\displaystyle  \lim_{n\to\infty}\sup\{|f(t)-w_n(t)|, a\leq t\leq b\}=0.

Dowód tego ważnego twierdzenia wykracza poza ramy tego kursu. Można natomiast łatwo podać efektywną konstrukcję ciągu wielomianów, które przybliżają jednostajnie daną funkcję ciągłą na przedziale \displaystyle [0,1].



Wielomian Bersteina

Definicja 10.21.

Niech \displaystyle f:[0,1]\mapsto \mathbb{R} będzie funkcją ciągłą. Dla dowolnej liczby całkowitej nieujemnej \displaystyle n=0,1,2,\dots definiujemy wielomian Bernsteina rzędu \displaystyle n funkcji \displaystyle f wzorem

\displaystyle B_n f(t)=\sum_{k=0}^n f\big(\frac{k}{n}\big)\binom{n}{k}t^{k}(1-t)^{n-k}.

Uwaga 10.22.

Podobieństwo wzoru definiującego wielomian Bernsteina do wzoru dwumianowego Newtona nie jest przypadkowe. Weźmy np. funkcję \displaystyle f(x)=1, stałą w przedziale \displaystyle [0,1]. Wówczas na mocy wzoru Newtona

\displaystyle B_n f(t)=\sum_{k=0}^n 1 \cdot \binom{n}{k}t^{k}(1-t)^{n-k}=(t+1-t)^n=1.
Zauważmy, że wielomian Bernsteina rzędu \displaystyle n jest wielomianem stopnia nie wyższego niż \displaystyle n. Można wykazać, że jeśli \displaystyle w jest wielomianem stopnia nie wyższego niż \displaystyle n, to \displaystyle B_n w(t)=w(t) dla dowolnej liczby \displaystyle t. Przypomnijmy, że analogiczną własność mają również wielomiany Taylora (zob. uwaga 10.14.).

Najciekawszą własność ciągu wielomianów Bernsteina podaje

Twierdzenie 10.23. [twierdzenie Bernsteina]

Jeśli \displaystyle f:[0,1]\mapsto\mathbb{R} jest dowolną funkcją ciągłą, to ciąg wielomianów Bernsteina zmierza do \displaystyle f jednostajnie na przedziale \displaystyle [0,1], to znaczy

\displaystyle \lim_{n\to \infty}\sup\{|f(t)-B_n(t)|, 0\leq t\leq 1\}=0.

Krótki, szczegółowy dowód tego faktu przeprowadzony w oparciu o nierówność Czebyszewa (zob. wykład z rachunku prawdopodobieństwa i statystyki) można znaleźć na przykład w podręczniku P.Billingsleya, Prawdopodobieństwo i miara, Państwowe Wydawnictwo Naukowe, Warszawa 1987, str. 91-92. Zwróćmy uwagę, że twierdzenie Weierstrassa zachodzi nawet dla funkcji klasy \displaystyle C^0, tj. takich, od których nie wymagamy, aby były różniczkowalne w którymkolwiek punkcie. Przykład takiej funkcji, która jest tylko ciągła i nie jest różniczkowalna w żadnym punkcie, podaliśmy w poprzednim module.