Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych: Różnice pomiędzy wersjami
(Nie pokazano 5 wersji utworzonych przez 2 użytkowników) | |||
Linia 15: | Linia 15: | ||
{{twierdzenie|8.1. [twierdzenie Taylora]|| | {{twierdzenie|8.1. [twierdzenie Taylora]|| | ||
− | Dla dowolnych punktów <math>\displaystyle a</math> oraz <math>\displaystyle a+h</math> zbioru <math>\displaystyle U</math> takich, że odcinek <center><math>\displaystyle \{a+th, | + | Dla dowolnych punktów <math>\displaystyle a</math> oraz <math>\displaystyle a+h</math> zbioru <math>\displaystyle U</math> takich, że odcinek <center><math>\displaystyle \{a+th, |
t\in [0,1]\}\subset U,</math></center> | t\in [0,1]\}\subset U,</math></center> | ||
zachodzi równość | zachodzi równość | ||
Linia 28: | Linia 28: | ||
{{definicja|8.2.|| | {{definicja|8.2.|| | ||
− | Funkcję <center><math>\displaystyle \ | + | Funkcję <center><math>\displaystyle \begin{align} X\in h\mapsto T_a^m |
f(h) &= f(a)+d_a f(h)+\frac{1}{2!}d^2 _a | f(h) &= f(a)+d_a f(h)+\frac{1}{2!}d^2 _a | ||
f(h,h)+\dots+\frac{1}{m!}d^m _a f\underbrace{(h, h, \dots, h)}_{m | f(h,h)+\dots+\frac{1}{m!}d^m _a f\underbrace{(h, h, \dots, h)}_{m | ||
\text{ razy }}\\&= \sum_{k=0}^m \frac{1}{k!}d^k_a\underbrace{(h, | \text{ razy }}\\&= \sum_{k=0}^m \frac{1}{k!}d^k_a\underbrace{(h, | ||
− | h, \dots, h)}_{k \text{ razy }}\in Y\ | + | h, \dots, h)}_{k \text{ razy }}\in Y\end{align} </math></center> |
− | nazywamy | + | nazywamy '''''wielomianem Taylora rzędu <math>\displaystyle m</math> funkcji <math>\displaystyle f</math> o środku w punkcie <math>\displaystyle a</math>'''''. }} |
− | '''''wielomianem Taylora rzędu <math>\displaystyle m</math> funkcji <math>\displaystyle f</math> o środku w punkcie | ||
− | <math>\displaystyle a</math>'''''. }} | ||
{{uwaga|8.3.|| | {{uwaga|8.3.|| | ||
Linia 42: | Linia 40: | ||
środku w punkcie <math>\displaystyle a</math> można wyrazić za pomocą pochodnych | środku w punkcie <math>\displaystyle a</math> można wyrazić za pomocą pochodnych | ||
cząstkowych funkcji <math>\displaystyle f</math> w następujący sposób: | cząstkowych funkcji <math>\displaystyle f</math> w następujący sposób: | ||
− | <center><math>\displaystyle \ | + | <center><math>\displaystyle \begin{align} T_a^m f(h)&=\sum_{k=0}^m |
\frac{1}{k!}\sum_{|\alpha|=k}\binom{k}{\alpha}\frac{\partial^k}{\partial | \frac{1}{k!}\sum_{|\alpha|=k}\binom{k}{\alpha}\frac{\partial^k}{\partial | ||
x^\alpha}f(a)h^\alpha \\&=\sum_{k=0}^m | x^\alpha}f(a)h^\alpha \\&=\sum_{k=0}^m | ||
Linia 50: | Linia 48: | ||
\sum_{|\alpha|\leq | \sum_{|\alpha|\leq | ||
m}\frac{1}{\alpha!}\frac{\partial^{|\alpha|}}{\partial | m}\frac{1}{\alpha!}\frac{\partial^{|\alpha|}}{\partial | ||
− | x^\alpha}f(a)h^\alpha ,\ | + | x^\alpha}f(a)h^\alpha ,\end{align} </math></center> |
gdzie <math>\displaystyle \alpha=(\alpha_1, | gdzie <math>\displaystyle \alpha=(\alpha_1, | ||
\alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n</math> jest <math>\displaystyle n</math>-wskaźnikiem o | \alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n</math> jest <math>\displaystyle n</math>-wskaźnikiem o | ||
Linia 60: | Linia 58: | ||
<math>\displaystyle x_1, x_2</math> wielomian Taylora o środku w punkcie <math>\displaystyle a=(a_1, a_2)\in | <math>\displaystyle x_1, x_2</math> wielomian Taylora o środku w punkcie <math>\displaystyle a=(a_1, a_2)\in | ||
\mathbb{R}^2</math> przyjmuje postać | \mathbb{R}^2</math> przyjmuje postać | ||
− | <center><math>\displaystyle \ | + | <center><math>\displaystyle \begin{align} T_a ^m f(h)&=\sum_{k=0}^m \sum_{\alpha_1+\alpha_2=k} |
\frac{1}{\alpha_1 !\alpha_2 !}\frac{\partial^k f(a)}{\partial | \frac{1}{\alpha_1 !\alpha_2 !}\frac{\partial^k f(a)}{\partial | ||
x_1^{\alpha_1}\partial | x_1^{\alpha_1}\partial | ||
Linia 67: | Linia 65: | ||
!}\frac{\partial^{\alpha_1+\alpha_2} f(a)}{\partial | !}\frac{\partial^{\alpha_1+\alpha_2} f(a)}{\partial | ||
x_1^{\alpha_1}\partial | x_1^{\alpha_1}\partial | ||
− | x_2^{\alpha_2}}h_1^{\alpha_1}h_2^{\alpha_2},\ | + | x_2^{\alpha_2}}h_1^{\alpha_1}h_2^{\alpha_2},\end{align} </math></center> |
gdzie | gdzie | ||
<math>\displaystyle h=(h_1, h_2)\in \mathbb{R}^2</math>. | <math>\displaystyle h=(h_1, h_2)\in \mathbb{R}^2</math>. | ||
Linia 87: | Linia 85: | ||
funkcji mamy dla dowolnej liczby <math>\displaystyle 0\leq t\leq 1</math> równość | funkcji mamy dla dowolnej liczby <math>\displaystyle 0\leq t\leq 1</math> równość | ||
<center><math>\displaystyle \frac{d^k}{dt^k}g(0)=d^k_a f\circ | <center><math>\displaystyle \frac{d^k}{dt^k}g(0)=d^k_a f\circ | ||
− | \underbrace{(d_0 (a+th), d_0 (a+th), \dots, d_0 (a+th))}_{k \text{ | + | \underbrace{(d_0 (a+th), d_0 (a+th), \dots, d_0 (a+th))}_{k \text{ razy}} =d^k_a f\underbrace{(h, h, \dots, h)}_{k \text{ razy}}.</math></center> |
− | razy}} =d^k_a f\underbrace{(h, h, \dots, h)}_{k \text{ razy}}.</math></center> | ||
Ze twierdzenia Taylora dla funkcji jednej zmiennej <math>\displaystyle g</math> oraz z | Ze twierdzenia Taylora dla funkcji jednej zmiennej <math>\displaystyle g</math> oraz z | ||
powyższej równości mamy | powyższej równości mamy | ||
− | <center><math>\displaystyle \ | + | <center><math>\displaystyle \begin{align} |
f(a+h)=&g(0+1)\\&=g(0)+g'(0)1+\frac{1}{2!}g''(0)1^2+\dots+\frac{1}{m!}g^{(m)}(0)1^m+\frac{1}{(m+1)!}g^{(m+1)}(0+\theta | f(a+h)=&g(0+1)\\&=g(0)+g'(0)1+\frac{1}{2!}g''(0)1^2+\dots+\frac{1}{m!}g^{(m)}(0)1^m+\frac{1}{(m+1)!}g^{(m+1)}(0+\theta | ||
\cdot 1)1^{m+1}\\&=f(a)+d_a f(h)+\frac{1}{2!}d^2_a | \cdot 1)1^{m+1}\\&=f(a)+d_a f(h)+\frac{1}{2!}d^2_a | ||
f(h,h)+\dots+\frac{1}{m!}d^m_a f(h,h,\dots, | f(h,h)+\dots+\frac{1}{m!}d^m_a f(h,h,\dots, | ||
h)+\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h, | h)+\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h, | ||
− | h),\ | + | h),\end{align} |
</math></center> | </math></center> | ||
gdzie <math>\displaystyle \theta\in (0,1)</math> jest pewnym punktem pośrednim. Stąd | gdzie <math>\displaystyle \theta\in (0,1)</math> jest pewnym punktem pośrednim. Stąd | ||
Linia 270: | Linia 267: | ||
tyle małym, aby odcinek <math>\displaystyle \{a+th, 0\leq t\leq 1\}</math> był w nim | tyle małym, aby odcinek <math>\displaystyle \{a+th, 0\leq t\leq 1\}</math> był w nim | ||
zawarty. | zawarty. | ||
− | <center><math>\displaystyle \ | + | <center><math>\displaystyle \begin{align} f(a+h)&=f(a)+d_a f (h)+\frac{1}{2}d^2_{a+\theta h} f(h,h) |
− | \\&=f(a)+0+\frac{1}{2}d^2_{a+\theta h} f(h,h),\ | + | \\&=f(a)+0+\frac{1}{2}d^2_{a+\theta h} f(h,h),\end{align} </math></center> |
czyli <center><math>\displaystyle f(a+h)-f(a)=\frac{1}{2}d^2_{a+\theta h} f(h,h),</math></center> | czyli <center><math>\displaystyle f(a+h)-f(a)=\frac{1}{2}d^2_{a+\theta h} f(h,h),</math></center> | ||
Linia 313: | Linia 310: | ||
{{uwaga|8.11.|| | {{uwaga|8.11.|| | ||
− | Twierdzenie nie rozstrzyga o istnieniu | + | Twierdzenie nie rozstrzyga o istnieniu ekstremum ani o jego typie, gdy druga różniczka <math>\displaystyle d^2 _a f</math> jest niedodatnio lub nieujemnie określona. Rozważmy trzy proste przykłady.}} |
− | ekstremum ani o jego typie, gdy druga różniczka <math>\displaystyle d^2 _a f</math> jest | ||
− | niedodatnio lub nieujemnie określona. Rozważmy trzy proste | ||
− | przykłady.}} | ||
{{przyklad|8.12.|| | {{przyklad|8.12.|| | ||
Linia 352: | Linia 346: | ||
{{przyklad|8.14.|| | {{przyklad|8.14.|| | ||
− | Funkcja <math>\displaystyle f(x,y)=x^4-y^4</math> nie osiąga w punkcie <math>\displaystyle (0,0)</math> żadnego | + | Funkcja <math>\displaystyle f(x,y)=x^4-y^4</math> nie osiąga w punkcie <math>\displaystyle (0,0)</math> żadnego ekstremum, gdyż dla dowolnego punktu <math>\displaystyle (x,0)\neq (0,0)</math> mamy <math>\displaystyle f(x,0)>0</math>, natomiast w punktach <math>\displaystyle (0,y)\neq (0,0)</math> mamy z kolei <math>\displaystyle f(0,y)<0.</math> |
− | ekstremum, gdyż dla dowolnego punktu <math>\displaystyle (x,0)\neq (0,0)</math> mamy | ||
− | <math>\displaystyle f(x,0)>0</math>, natomiast w punktach <math>\displaystyle (0,y)\neq (0,0)</math> mamy z kolei | ||
− | <math>\displaystyle f(0,y)<0.</math> | ||
− | Zwróćmy uwagę, że podobnie jak w obu poprzednich | + | Zwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji <math>\displaystyle f</math> zerują się w punkcie <math>\displaystyle (0,0)</math>. W punktach <math>\displaystyle h=(h_1,h_2)\neq (0,0)</math>, tj. poza początkiem układu współrzędnych, druga różniczka |
− | przykładach zarówno pierwsza jak i druga różniczka funkcji <math>\displaystyle f</math> | ||
− | zerują się w punkcie <math>\displaystyle (0,0)</math>. W punktach <math>\displaystyle h=(h_1,h_2)\neq (0,0)</math>, | ||
− | tj. poza początkiem układu współrzędnych, druga różniczka | ||
<center><math>\displaystyle d^2_{(x,y)}(h,h)=12(x^2 h_1^2-y^2 h_2^2)</math></center> | <center><math>\displaystyle d^2_{(x,y)}(h,h)=12(x^2 h_1^2-y^2 h_2^2)</math></center> | ||
− | jest nieokreślona, bo w punktach <math>\displaystyle (x,0)\neq (0,0)</math> forma | + | jest nieokreślona, bo w punktach <math>\displaystyle (x,0)\neq (0,0)</math> forma kwadratowa <math>\displaystyle h\mapsto d^2_{(x,y)}f</math> jest dodatnia, a w punktach |
− | kwadratowa <math>\displaystyle h\mapsto d^2_{(x,y)}f</math> jest dodatnia, a w punktach | + | <math>\displaystyle (0,y)\neq (0,0)</math> jest ujemna. W samym zaś punkcie <math>\displaystyle (0,0)</math> forma kwadratowa <center><math>\displaystyle d^2_{(0,0)}(h,h)=12(0^2 h_1^2-0^2 h_2^2)=0</math></center> |
− | <math>\displaystyle (0,y)\neq (0,0)</math> jest ujemna. W samym zaś punkcie <math>\displaystyle (0,0)</math> forma | + | jest zerowa. Analiza formy kwadratowej w otoczeniu punktu <math>\displaystyle (0,0)</math> |
− | kwadratowa <center><math>\displaystyle d^2_{(0,0)}(h,h)=12(0^2 h_1^2-0^2 h_2^2)=0</math></center> | ||
− | jest | ||
− | zerowa. Analiza formy kwadratowej w otoczeniu punktu <math>\displaystyle (0,0)</math> | ||
pozwala nam jednak dostrzec, że zacieśnienie funkcji <math>\displaystyle f</math> do | pozwala nam jednak dostrzec, że zacieśnienie funkcji <math>\displaystyle f</math> do | ||
− | prostej <math>\displaystyle y=0</math> (tj. w punktach postaci <math>\displaystyle (x,0)</math>) jest funkcją | + | prostej <math>\displaystyle y=0</math> (tj. w punktach postaci <math>\displaystyle (x,0)</math>) jest funkcją <math>\displaystyle f(x,0)=x^4</math>, która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej <math>\displaystyle x=0</math> (czyli w punktach postaci <math>\displaystyle (0,y)</math>) funkcja <math>\displaystyle f(0,y)=-y^4</math> osiąga maksimum w punkcie <math>\displaystyle y=0</math>. Stąd funkcja <math>\displaystyle (x,y)\mapsto f(x,y)</math> nie osiąga żadnego ekstremum w punkcie <math>\displaystyle (0,0)</math>. |
− | <math>\displaystyle f(x,0)=x^4</math>, która na tej prostej osiąga minimum lokalne. Z kolei | ||
− | zacieśnienie do prostej <math>\displaystyle x=0</math> (czyli w punktach postaci <math>\displaystyle (0,y)</math>) | ||
− | funkcja <math>\displaystyle f(0,y)=-y^4</math> osiąga maksimum w punkcie <math>\displaystyle y=0</math>. Stąd | ||
− | funkcja <math>\displaystyle (x,y)\mapsto f(x,y)</math> nie osiąga żadnego ekstremum w | ||
− | punkcie <math>\displaystyle (0,0)</math>. | ||
}} | }} | ||
<br> | <br> | ||
Linia 455: | Linia 435: | ||
<br> | <br> | ||
− | Różniczka tej funkcji zeruje się w punktach, których współrzędne | + | Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań |
− | spełniają układ równań <center><math>\displaystyle \left\{\ | + | <center><math>\displaystyle \left\{\begin{align} \frac{\partial |
f}{\partial x}&=0\\\frac{\partial f}{\partial | f}{\partial x}&=0\\\frac{\partial f}{\partial | ||
− | y}&=0\\\frac{\partial f}{\partial z}&=0,\ | + | y}&=0\\\frac{\partial f}{\partial z}&=0,\end{align}\right. \text{ czyli } \left\{\begin{align} 4(x^2+y^2+z^2)x&=3yz \\ |
− | czyli } \left\{\ | ||
4(x^2+y^2+z^2)y&=3xz | 4(x^2+y^2+z^2)y&=3xz | ||
− | \\ 4(x^2+y^2+z^2)z&=3xy. \ | + | \\ 4(x^2+y^2+z^2)z&=3xy. \end{align}\right.</math></center> |
Układ ten spełniają współrzędne pięciu punktów | Układ ten spełniają współrzędne pięciu punktów | ||
− | <center><math>\displaystyle \ | + | <center><math>\displaystyle \begin{align} P_0&=(0,0,0), |
\\ P_1&=\big(\frac{1}{4},\frac{1}{4},\frac{1}{4}\big), | \\ P_1&=\big(\frac{1}{4},\frac{1}{4},\frac{1}{4}\big), | ||
\\ P_2&=\big(\frac{1}{4},-\frac{1}{4},-\frac{1}{4}\big), | \\ P_2&=\big(\frac{1}{4},-\frac{1}{4},-\frac{1}{4}\big), | ||
\\ P_3&=\big(-\frac{1}{4},\frac{1}{4},-\frac{1}{4}\big), | \\ P_3&=\big(-\frac{1}{4},\frac{1}{4},-\frac{1}{4}\big), | ||
\\ P_4&=\big(-\frac{1}{4},-\frac{1}{4},\frac{1}{4}\big). | \\ P_4&=\big(-\frac{1}{4},-\frac{1}{4},\frac{1}{4}\big). | ||
− | \ | + | \end{align}</math></center> |
Łatwo zauważyć, że w punkcie <math>\displaystyle P_0</math> funkcja nie osiąga ekstremum, | Łatwo zauważyć, że w punkcie <math>\displaystyle P_0</math> funkcja nie osiąga ekstremum, | ||
Linia 499: | Linia 478: | ||
ma | ma | ||
wszystkie minory główne dodatnie: | wszystkie minory główne dodatnie: | ||
− | <center><math>\displaystyle \ | + | <center><math>\displaystyle \begin{align} A_1&=\det\left[\frac{5}{4}\right]=\frac{5}{4}>0 |
\\A_2&=\det\left[\begin{array}{rr} \frac{5}{4} &-\frac{1}{4} \\ | \\A_2&=\det\left[\begin{array}{rr} \frac{5}{4} &-\frac{1}{4} \\ | ||
-\frac{1}{4} &\frac{5}{4}\end{array} \right] | -\frac{1}{4} &\frac{5}{4}\end{array} \right] | ||
Linia 507: | Linia 486: | ||
-\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]= | -\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]= | ||
\frac{1}{4^3}\det\left[\begin{array}{rrr} 5 &-1&-1\\-1 &5 &-1\\-1 &-1& | \frac{1}{4^3}\det\left[\begin{array}{rrr} 5 &-1&-1\\-1 &5 &-1\\-1 &-1& | ||
− | 5\end{array} \right]=\frac{108}{64}>0.\ | + | 5\end{array} \right]=\frac{108}{64}>0.\end{align}</math></center> |
Stąd w punkcie | Stąd w punkcie | ||
<math>\displaystyle P_1</math> funkcja osiąga minimum lokalne równe | <math>\displaystyle P_1</math> funkcja osiąga minimum lokalne równe |
Aktualna wersja na dzień 22:44, 9 cze 2020
Ekstrema funkcji wielu zmiennych.
Dowodzimy wzoru Taylora dla funkcji wielu zmiennych. Jego konsekwencją jest warunek wystarczający istnienia ekstremum. Pokazujemy szereg przykładów prowadzących do zastosowania wykazanego warunku wystarczającego oraz takich, w których nie jest to niezbędne.
Wzór Taylora dla funkcji wielu zmiennych
Niech
będzie funkcją klasy określoną na otwartym podzbiorze przestrzeni Banacha o wartościach w przestrzeni Banacha . Podobnie jak w przypadku funkcji jednej zmiennej rzeczywistej zachodzi następująceTwierdzenie 8.1. [twierdzenie Taylora]
zachodzi równość
Definicja 8.2.
Zauważmy, że jeśli
i , to wielomian Taylora funkcji rzędu o środku w punkcie można wyrazić za pomocą pochodnych cząstkowych funkcji w następujący sposób:gdzie
jest -wskaźnikiem o długości . (Oznaczenia: , , wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W szczególnym (ale bardzo często spotykanym) przypadku funkcji dwóch zmiennych wielomian Taylora o środku w punkcie przyjmuje postaćgdzie
.Dowód 8.3.
Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy
punktami zbioru jest funkcją o wartościach rzeczywistych, określoną na otwartym podzbiorze przestrzeni Banacha . Niech, zgodnie z założeniem, oraz będą takimi , że odcinek . Rozważmy funkcjęokreśloną w pewnym otoczeniu otwartym odcinka
. Funkcja jest w tym zbiorze klasy , gdyż jest tej klasy w otoczeniu odcinka . Ponadto z twierdzenia o różniczkowaniu złożenia funkcji mamy dla dowolnej liczby równośćZe twierdzenia Taylora dla funkcji jednej zmiennej
oraz z powyższej równości mamygdzie
jest pewnym punktem pośrednim. Stąd mamy też oszacowanie reszty we wzorze Taylora:
Ekstrema funkcji wielu zmiennych
Pamiętamy, że dowolna przestrzeń unormowana
jest przestrzenią metryczną z metryką zadaną przez normę przestrzeni . Stąd też definicja ekstremum funkcji o wartościach rzeczywistych określonej na przestrzeni unormowanej jest taka sama jak w przypadku przestrzeni metrycznej, czyli funkcja przyjmuje w punkcie minimum lokalne (odpowiednio: maksimum lokalne, ścisłe minimum lokalne, ścisłe maksimum lokalne), jeśli istnieje liczba taka, że zachodzą odpowiednio implikacje:Minimum funkcji w punkcie
nazywamy globalnym, jeśli osiąga w punkcie kres dolny wartości. Jeśli zaś w punkcie funkcja osiąga kres górny, to mówimy, że osiąga w punkcie maksimum globalne.Sformułujmy wpierw warunek konieczny istnienia ekstremum funkcji
.Twierdzenie 8.4.
Jeśli funkcja różniczkowalna
przestrzeni osiąga ekstremum w punkcie zbioru otwartego , to w punkcie tym zeruje się różniczka funkcji , tzn. , gdzie jest dowolnym wektorem .Dowód 8.4.
Załóżmy, że funkcja
zacieśnienie funkcji osiąga maksimum lokalne w punkcie . Ustalmy pewien wektor , i rozważmy do prostejo kierunku
przechodzącej przez punkt . Zacieśnienie tojest funkcją jednej zmiennej, osiągającą maksimum w
. Stąd pochodna w zerze funkcji jest równa zeru. Ale pochodna ta jest tożsama z pochodną kierunkową funkcji w kierunku wektora . Wobec dowolności różniczka .
<applet code="JavaviewModApplet.class" height="400" width="450" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar"> <param name="colors" value="-1:#7e0b9f -0.82:#7e0b9f -0.81:#ce3bf8 -0.64:#ce3bf8 -0.63:#2c4ae5 -0.46:#2c4ae5 -0.45:#2c85e5 -0.28:#2c85e5 -0.27:#2ecca9 -0.10:#2ecca9 -0.09:#2ecc5b 0.09:#2ecc5b 0.10:#97cc2e 0.27:#97cc2e 0.28:#edff27 0.45:#edff27 0.46:#ffba27 0.63:#ffba27 0.64:#ff6e27 0.81:#ff6e27 0.82:#d42555 1:#d42525"> <param name="coloring" value="mathematica"> <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip"> <param name="scale" value="1.0 1.0 0.5">
<param name="shading" value="0.2"> <param name="animation" value="stop">
</applet><div.thumbcaption>Wykres funkcji
Przyjmijmy wobec tego następującą definicję.
Definicja 8.6.
Mówimy, że
jest punktem krytycznym funkcji , jeśli należy do dziedziny różniczki funkcji i różniczka zeruje się w tym punkcie, bądź też punkt należy do dziedziny funkcji i nie istnieje różniczka .Wniosek 8.7.
Jeśli funkcja
osiąga ekstremum w punkcie , to punkt ten jest krytyczny.Implikacja te stanowi warunek konieczny istnienia ekstremum także w przypadku funkcji, od których nie żądamy różniczkowalności w otoczeniu wszystkich punktów dziedziny.
Wzór Taylora umożliwia, podobnie jak w przypadku jednowymiarowym, sformułowanie warunku wystarczającego istnienia ekstremum.
Definicja 8.8.
Niech
kwadratowa będzie odwzorowaniem dwuliniowym symetrycznym określonym na , gdzie jest pewną przestrzenią Banacha. Mówimy, że formajest
- dodatnio określona, jeśli istnieje stała taka, że
- ujemnie określona, jeśli istnieje stała taka, że
- nieujemnie określona, jeśli
- niedodatnio określona, jeśli
- nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie,
ani nieujemnie, ani niedodatnio określona.
Często mówimy też, że odwzorowanie dwuliniowe symetryczne
jest dodatnio określone (odpowiednio: ujemnie określone, nieujemnie określone, niedodatnio określone, nieokreślone), jeśli forma kwadratowa jest określona dodatnio (odpowiednio: określona ujemnie, określona nieujemnie, określona niedodatnio, bądź jest nieokreślona).a) Forma kwadratowa
jest dodatnio określona wtedy i tylko wtedy, gdy forma jest ujemnie określona.b) Forma kwadratowa
jest nieujemnie określona wtedy i tylko wtedy, gdy forma jest niedodatnio określona.c) Forma kwadratowa
jest nieokreślona wtedy i tylko wtedy, gdy nieokreślona jest forma .Korzystając ze wzoru Taylora, wykażemy warunek wystarczający istnienia ekstremum funkcji wielu zmiennych.
Twierdzenie 8.10.
Niech
będzie funkcją klasy w otwartym otoczeniu punktu . Załóżmy, że różniczka funkcji w punkcie jest równa zeru.a) Jeśli druga różniczka
jest dodatnio określona, funkcja osiąga ścisłe minimum lokalne w punkcie .b) Jeśli druga różniczka
jest ujemnie określona, funkcja osiąga ścisłe maksimum lokalne w punkcie .c) Jeśli druga różniczka
nie osiąga ekstremum w punkcie jest nieokreślona, funkcja .Dowód 8.10.
a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce:
) dostajemy równość prawdziwą w otoczeniu punktu na tyle małym, aby odcinek był w nim zawarty.gdzie
jest pewną liczbą. Jeśli forma jest dodatnio określona, to wobec ciągłości drugiej różniczki, również w pewnym małym otoczeniu punktu w punkcie forma jest dodatnio określona. Wobec tegoczyli
dla dowolnego niezerowego wektora z pewnego małego otoczenia punktu . Oznacza to, że funkcja osiąga w tym punkcie ścisłe minimum lokalne.b) Podobnie jak w punkcie a) wykazujemy, że funkcja
osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie określona w punkcie, w którym zeruje się jej pierwsza różniczka.c) Jeśli druga różniczka
kierunku jest nieokreślona, to istnieją dwa wektory takie, że natomiast . Jeśli więc zacieśnimy funkcję do prostej o :to na prostej tej w pewnym małym otoczeniu punktu
(dla bliskich zeru) otrzymamy nierówność:natomiast na prostej o kierunku
:dostaniemy, podobnie w małym otoczeniu punktu
, nierówność przeciwną:Stąd funkcja
nie osiąga w punkcie żadnego ekstremum, gdyż w dowolnie małym otoczeniu punktu przyjmuje zarówno wartości mniejsze, jak i większe od .
Przykład 8.12.
Funkcja
Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka funkcji
w punkcie zerują się. W szczególności druga różniczka jest nieujemnie określona w każdym punkcie płaszczyzny , gdyż dla dowolnego wektora mamyW szczególności
Przykład 8.13.
Funkcja
osiąga w punkcie ścisłe maksimum lokalne równe zeru, gdyż dla dowolnego punktu mamy .Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie zarówno pierwsza jak i druga różniczka funkcji
w punkcie zerują się. W szczególności druga różniczka jest niedodatnio określona w każdym punkcie płaszczyzny , gdyż dla dowolnego wektora mamyW szczególności
Przykład 8.14.
Funkcja
nie osiąga w punkcie żadnego ekstremum, gdyż dla dowolnego punktu mamy , natomiast w punktach mamy z koleiZwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji
zerują się w punkcie . W punktach , tj. poza początkiem układu współrzędnych, druga różniczkajest nieokreślona, bo w punktach
forma kwadratowa jest dodatnia, a w punktach jest ujemna. W samym zaś punkcie forma kwadratowajest zerowa. Analiza formy kwadratowej w otoczeniu punktu
pozwala nam jednak dostrzec, że zacieśnienie funkcji do prostej (tj. w punktach postaci ) jest funkcją , która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej (czyli w punktach postaci ) funkcja osiąga maksimum w punkcie . Stąd funkcja nie osiąga żadnego ekstremum w punkcie .
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/4/47/Am2w08.0120.mgs.zip"> <param name="scale" value="1.0 1.0 0.05">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>
<div.thumbcaption>Wykres funkcji
Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności drugiej różniczki w przpadku funkcji wielu zmiennych.
Niech
, , będzie macierzą kwadratową symetryczną (tzn. dla dowolnych ). Niechbędzie minorem głównym rzędu
macierzy , .Twierdzenie 8.15. [twierdzenie Sylvestera]
Forma kwadratowa
dla dowolnego zadana przez symetryczną macierz kwadratową , , jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie minory główne macierzy są dodatnie, tzn. .Dowód 8.15.
Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz
Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.) będzie złożona z jednej liczby . Należy zauważyć, że forma jest dodatnio określona wtedy i tylko wtedy, gdy . Następnie dowodzi się implikacji, że z dodatniej określoności formy zadanej przez macierz , wobec założenia o dodatniości minora , , wynika dodatnia określoność formy kwadratowej zadanej przez macierz . Szczegóły (które pomijamy) można znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,
Ponieważ forma kwadratowa
jest ujemnie określona wtedy i tylko wtedy, gdy jest dodatnio określona, twierdzenie Sylvestera pozwala nam również stwierdzić, kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy mianowicieWniosek 8.16.
Jeśli
, jest symetryczną macierzą kwadratową, to forma kwadratowajest ujemnie określona wtedy i tylko wtedy, gdy wszystkie minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego są dodatnie, tzn. gdy
Przykład 8.17.
Wyznaczmy ekstrema funkcji
Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań
Układ ten spełniają współrzędne pięciu punktów
Łatwo zauważyć, że w punkcie
funkcja nie osiąga ekstremum, gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno wartości mniejsze jak i większe od . Na przykład na prostej o kierunku (1,1,1) przechodzącej przez punkt , tj. na zbiorzefunkcja
przyjmuje w otoczeniu zera zarówno dodatnie wartości (np. gdy
) jak i ujemne (np. gdy ). W pozostałych czterech punktach macierz drugich pochodnych cząstkowych, która zadaje drugą różniczkęjest dodatnio określona. Na przykład w punkcie
macierz drugich pochodnych cząstkowych funkcjima wszystkie minory główne dodatnie:
Stąd w punkcie
funkcja osiąga minimum lokalne równe . Podobne uzasadnienie prowadzi do wniosku, że także w pozostałych punktach , oraz funkcja osiąga minima lokalne.Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie zrezygnować z analizy określoności drugiej różniczki. Punkty
leżą we wnętrzu zbioru ograniczonego poziomicą zerową funkcji , precyzyjniej: leżą w obszarze, gdzie funkcja jest ujemna. Ponieważ zbiórjest zwarty (gdyż jest domknięty i ograniczony), funkcja
, na mocy twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech punktach osiągać minima lokalne.Uwagi o wyznaczaniu ekstremów funkcji wielu zmiennych
Badanie funkcji wielu zmiennych (w szczególności znajdywanie punktów ekstremalnych) w wielu przypadkach nie wymaga wyznaczania ani pierwszej, ani drugiej różniczki funkcji. Można bowiem sprowadzić ich badanie do badania funkcji jednej zmiennej.
Rozważmy kilka przykładów, w których funkcja dwóch zmiennych jest w istocie funkcją jednej zmiennej, a mianowicie: jest funkcją odległości od początku układu współrzędnych.
Przykład 8.18.
Funkcja
wykres
Przykład 8.19.
Funkcja
także jest funkcją promienia . Zauważmy bowiem, żeosiąga ekstrema w tych samych punktach, co funkcja
, a więc osiąga maksima w punktach i minima w punktach , gdzie . Innymi słowy funkcja osiąga maksima w punktach należących do okręgów o równaniachoraz w punkcie
(wtedy ), a minima w punktach należących do okręgówgdzie
jest dowolną liczbą całkowitą nieujemną.
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/c/c6/Am2w08.0010.mgs.zip"> <param name="scale" value="1.0 1.0 1.0">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>
<div.thumbcaption>Wykres funkcji
Przykład 8.20.
Podobnie jak w poprzednim przykładzie funkcja
, , osiąga maksima na okręgach o promieniach takich, ze , czyli na okręgachnatomiast minima na okręgach, których promień
spełnia równanie , tj. na okręgachgdzie
wykres
Przykład 8.21.
Także funkcja
wykres
Również w wielu innych przykładach, gdy funkcja
nie jest funkcją promienia, można uniknąć stosowania rachunku różniczkowego do wyznaczenia ekstremów.Przykład 8.22.
Funkcja
osiąga maksima w punktach hiperbola minima w punktach drugiej rodziny hiperbol
gdzie
wykres
Przykład 8.23.
Z kolei funkcja
osiąga maksima w punktach hiperbola minima w punktach drugiej rodziny hiperbol
gdzie
wykres
Przypomnijmy także, że prosta obserwacja przebiegu poziomic pozwala stwierdzić, że
(a) funkcja
wykres
(b) w tym samym punkcie funkcja osiąga maksimum
wykres
(c) a funkcja nie osiąga w punkcie
żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w
dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak
i większe od zera.
wykres
Przykład 8.25.
Zauważmy, że każda z trzech funkcji a, b, c ma w punkcie
zerową zarówno pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu punktu zarówno wartości mniejsze jak i większe od zera.(a)
wykres
(b)
wykres
(c)
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/1/10/Am2w08.0130.mgs.zip"> <param name="scale" value="1.0 1.0 0.1">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet> <div.thumbcaption>Wykres funkcji
Należy pamiętać o analizowaniu otoczenia punktów krytycznych funkcji, w których o istnieniu ekstremów nie rozstrzyga warunek wystarczający.
Przykład 8.26.
Funkcja
jest ciągła na całej płaszczyźnie, nie jest jednak różniczkowalna w punktach należących do dwóch prostych: oraz . Różniczka tej funkcji nie zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema prostymi , . Stąd zbiorem punktów krytycznych jest suma obu prostych:Łatwo zauważyć, że jedynie w punkcie
wykres