Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych: Różnice pomiędzy wersjami
Nie podano opisu zmian |
m Zastępowanie tekstu – „.↵</math>” na „</math>” |
||
(Nie pokazano 81 wersji utworzonych przez 5 użytkowników) | |||
Linia 9: | Linia 9: | ||
==Wzór Taylora dla funkcji wielu zmiennych== | ==Wzór Taylora dla funkcji wielu zmiennych== | ||
Niech <math> | Niech <math>f:X\mapsto Y</math> będzie funkcją klasy <math>C^{m+1}</math> określoną na | ||
otwartym podzbiorze <math> | otwartym podzbiorze <math>U</math> przestrzeni Banacha <math>X</math> o wartościach w | ||
przestrzeni Banacha <math> | przestrzeni Banacha <math>Y</math>. Podobnie jak w przypadku funkcji jednej | ||
zmiennej rzeczywistej zachodzi następujące | zmiennej rzeczywistej zachodzi następujące | ||
{{twierdzenie|8.1. [twierdzenie Taylora]|| | {{twierdzenie|8.1. [twierdzenie Taylora]|| | ||
Dla dowolnych punktów <math> | Dla dowolnych punktów <math>a</math> oraz <math>a+h</math> zbioru <math>U</math> takich, że odcinek <center><math>\{a+th, | ||
t\in [0,1]\}\subset U | t\in [0,1]\}\subset U</math>,</center> | ||
zachodzi równość | zachodzi równość | ||
<center><math> | <center><math>f(a+h)=f(a)+d_a f(h)+\frac{1}{2!}d^2_a f(h,h)+\frac{1}{3!}d^3_a | ||
f(h,h,h)+\dots+\frac{1}{m!}d^m_a f\underbrace{(h,h,\dots, h)}_{m | f(h,h,h)+\dots+\frac{1}{m!}d^m_a f\underbrace{(h,h,\dots, h)}_{m | ||
\text{ wektorów } h} +R_m f(a, h) | \text{ wektorów } h} +R_m f(a, h)</math></center> | ||
gdzie <center><math> | gdzie <center><math>\|R_m | ||
f(a,b)\|_{y}\leq \frac{1}{(m+1)!}\sup\{|d^{m+1} _{a+th}(h,h, | f(a,b)\|_{y}\leq \frac{1}{(m+1)!}\sup\{|d^{m+1} _{a+th}(h,h, | ||
\dots, h)|, \ t\in[0,1]\} | \dots, h)|, \ t\in[0,1]\}</math>.</center> | ||
}} | }} | ||
{{definicja|8.2.|| | {{definicja|8.2.|| | ||
Funkcję <center><math>\ | Funkcję <center><math>\begin{align} X\in h\mapsto T_a^m | ||
f(h) &= f(a)+d_a f(h)+\frac{1}{2!}d^2 _a | f(h) &= f(a)+d_a f(h)+\frac{1}{2!}d^2 _a | ||
f(h,h)+\dots+\frac{1}{m!}d^m _a f\underbrace{(h, h, \dots, h)}_{m | f(h,h)+\dots+\frac{1}{m!}d^m _a f\underbrace{(h, h, \dots, h)}_{m | ||
\text{ razy }}\\&= \sum_{k=0}^m \frac{1}{k!}d^k_a\underbrace{(h, | \text{ razy }}\\&= \sum_{k=0}^m \frac{1}{k!}d^k_a\underbrace{(h, | ||
h, \dots, h)}_{k \text{ razy }}\in Y\ | h, \dots, h)}_{k \text{ razy }}\in Y\end{align}</math></center> | ||
nazywamy | nazywamy '''''wielomianem Taylora rzędu <math>m</math> funkcji <math>f</math> o środku w punkcie <math>a</math>'''''. }} | ||
'''''wielomianem Taylora rzędu <math> | |||
<math> | |||
{{uwaga|8.3.|| | {{uwaga|8.3.|| | ||
Zauważmy, że jeśli <math> | Zauważmy, że jeśli <math>X=\mathbb{R}^n</math> i <math>Y=\mathbb{R}</math>, | ||
to wielomian Taylora funkcji <math> | to wielomian Taylora funkcji <math>f: \mathbb{R}^n\mapsto \mathbb{R}</math> rzędu <math>m</math> o | ||
środku w punkcie <math> | środku w punkcie <math>a</math> można wyrazić za pomocą pochodnych | ||
cząstkowych funkcji <math> | cząstkowych funkcji <math>f</math> w następujący sposób: | ||
<center><math>\ | <center><math>\begin{align} T_a^m f(h)&=\sum_{k=0}^m | ||
\frac{1}{k!}\sum_{|\alpha|=k}\binom{k}{\alpha}\frac{\partial^k}{\partial | \frac{1}{k!}\sum_{|\alpha|=k}\binom{k}{\alpha}\frac{\partial^k}{\partial | ||
x^\alpha}f(a)h^\alpha \\&=\sum_{k=0}^m | x^\alpha}f(a)h^\alpha \\&=\sum_{k=0}^m | ||
Linia 50: | Linia 48: | ||
\sum_{|\alpha|\leq | \sum_{|\alpha|\leq | ||
m}\frac{1}{\alpha!}\frac{\partial^{|\alpha|}}{\partial | m}\frac{1}{\alpha!}\frac{\partial^{|\alpha|}}{\partial | ||
x^\alpha}f(a)h^\alpha ,\ | x^\alpha}f(a)h^\alpha ,\end{align}</math></center> | ||
gdzie <math> | gdzie <math>\alpha=(\alpha_1, | ||
\alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n</math> jest <math> | \alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n</math> jest <math>n</math>-wskaźnikiem o | ||
długości <math> | długości <math>|\alpha|=\alpha_1+\alpha_2+\dots+\alpha_n</math>. (Oznaczenia: | ||
<math> | <math>\alpha!</math>, <math>h^\alpha</math>, <math>\frac{\partial^k }{\partial x^\alpha}</math> | ||
wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W | wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W | ||
szczególnym (ale bardzo często spotykanym) przypadku funkcji <math> | szczególnym (ale bardzo często spotykanym) przypadku funkcji <math>f: | ||
\mathbb{R}^2\ni (x_1, x_2)\mapsto f(x_1, x_2)\in \mathbb{R}</math> dwóch zmiennych | \mathbb{R}^2\ni (x_1, x_2)\mapsto f(x_1, x_2)\in \mathbb{R}</math> dwóch zmiennych | ||
<math> | <math>x_1, x_2</math> wielomian Taylora o środku w punkcie <math>a=(a_1, a_2)\in | ||
\mathbb{R}^2</math> przyjmuje postać | \mathbb{R}^2</math> przyjmuje postać | ||
<center><math>\ | <center><math>\begin{align} T_a ^m f(h)&=\sum_{k=0}^m \sum_{\alpha_1+\alpha_2=k} | ||
\frac{1}{\alpha_1 !\alpha_2 !}\frac{\partial^k f(a)}{\partial | \frac{1}{\alpha_1 !\alpha_2 !}\frac{\partial^k f(a)}{\partial | ||
x_1^{\alpha_1}\partial | x_1^{\alpha_1}\partial | ||
Linia 67: | Linia 65: | ||
!}\frac{\partial^{\alpha_1+\alpha_2} f(a)}{\partial | !}\frac{\partial^{\alpha_1+\alpha_2} f(a)}{\partial | ||
x_1^{\alpha_1}\partial | x_1^{\alpha_1}\partial | ||
x_2^{\alpha_2}}h_1^{\alpha_1}h_2^{\alpha_2},\ | x_2^{\alpha_2}}h_1^{\alpha_1}h_2^{\alpha_2},\end{align}</math></center> | ||
gdzie | gdzie | ||
<math> | <math>h=(h_1, h_2)\in \mathbb{R}^2</math>. | ||
}} | }} | ||
{{dowod|8.3.|| | {{dowod|8.3.|| | ||
Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy <math> | Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy <math>f: | ||
X\supset U\mapsto \mathbb{R}</math> jest funkcją o wartościach rzeczywistych, | X\supset U\mapsto \mathbb{R}</math> jest funkcją o wartościach rzeczywistych, | ||
określoną na otwartym podzbiorze <math> | określoną na otwartym podzbiorze <math>U</math> przestrzeni Banacha <math>X</math>. | ||
Niech, zgodnie z założeniem, <math> | Niech, zgodnie z założeniem, <math>a</math> oraz <math>a+h</math> będą takimi | ||
punktami zbioru <math> | punktami zbioru <math>U</math>, że odcinek <math>\{a+th, 0\leq t\leq 1\}\subset | ||
U</math>. Rozważmy funkcję <center><math> | U</math>. Rozważmy funkcję <center><math>g:(0-\epsilon, 1+\epsilon)\ni t\mapsto | ||
f(a+th)\in\mathbb{R}</math></center> | f(a+th)\in\mathbb{R}</math></center> | ||
określoną w pewnym otoczeniu otwartym odcinka | określoną w pewnym otoczeniu otwartym odcinka | ||
<math> | <math>[0,1]</math>. Funkcja <math>g</math> jest w tym zbiorze klasy <math>C^{m+1}</math>, gdyż <math>f</math> | ||
jest tej klasy w otoczeniu odcinka <math> | jest tej klasy w otoczeniu odcinka <math>\{a+th, \ 0\leq t\leq | ||
1\}\subset U</math>. Ponadto z twierdzenia o różniczkowaniu złożenia | 1\}\subset U</math>. Ponadto z twierdzenia o różniczkowaniu złożenia | ||
funkcji mamy dla dowolnej liczby <math> | funkcji mamy dla dowolnej liczby <math>0\leq t\leq 1</math> równość | ||
<center><math> | <center><math>\frac{d^k}{dt^k}g(0)=d^k_a f\circ | ||
\underbrace{(d_0 (a+th), d_0 (a+th), \dots, d_0 (a+th))}_{k \text{ | \underbrace{(d_0 (a+th), d_0 (a+th), \dots, d_0 (a+th))}_{k \text{ razy}} =d^k_a f\underbrace{(h, h, \dots, h)}_{k \text{ razy}}</math>.</center> | ||
razy}} =d^k_a f\underbrace{(h, h, \dots, h)}_{k \text{ razy}} | |||
Ze twierdzenia Taylora dla funkcji jednej zmiennej <math> | Ze twierdzenia Taylora dla funkcji jednej zmiennej <math>g</math> oraz z | ||
powyższej równości mamy | powyższej równości mamy | ||
<center><math>\ | <center><math>\begin{align} | ||
f(a+h)=&g(0+1)\\&=g(0)+g'(0)1+\frac{1}{2!}g''(0)1^2+\dots+\frac{1}{m!}g^{(m)}(0)1^m+\frac{1}{(m+1)!}g^{(m+1)}(0+\theta | f(a+h)=&g(0+1)\\&=g(0)+g'(0)1+\frac{1}{2!}g''(0)1^2+\dots+\frac{1}{m!}g^{(m)}(0)1^m+\frac{1}{(m+1)!}g^{(m+1)}(0+\theta | ||
\cdot 1)1^{m+1}\\&=f(a)+d_a f(h)+\frac{1}{2!}d^2_a | \cdot 1)1^{m+1}\\&=f(a)+d_a f(h)+\frac{1}{2!}d^2_a | ||
f(h,h)+\dots+\frac{1}{m!}d^m_a f(h,h,\dots, | f(h,h)+\dots+\frac{1}{m!}d^m_a f(h,h,\dots, | ||
h)+\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h, | h)+\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h, | ||
h),\ | h),\end{align} | ||
</math></center> | </math></center> | ||
gdzie <math> | gdzie <math>\theta\in (0,1)</math> jest pewnym punktem pośrednim. Stąd | ||
mamy też oszacowanie reszty we wzorze Taylora: | mamy też oszacowanie reszty we wzorze Taylora: | ||
<center><math> | <center><math>|R_m f (a,h)|=\bigg|\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h, | ||
h\bigg|\leq \frac{1}{(m+1)!}\sup\{|d^{m+1}_{a+\theta h} | h\bigg|\leq \frac{1}{(m+1)!}\sup\{|d^{m+1}_{a+\theta h} | ||
f(h,h,\dots, h, h)|, 0\leq \theta\leq 1\} | f(h,h,\dots, h, h)|, 0\leq \theta\leq 1\}</math></center> | ||
</math></center> | |||
}} | }} | ||
Linia 111: | Linia 107: | ||
Pamiętamy, że | Pamiętamy, że | ||
dowolna przestrzeń unormowana <math> | dowolna przestrzeń unormowana <math>X</math> jest przestrzenią metryczną z | ||
metryką <math> | metryką <math>d(x,y)=\|x-y\|</math> zadaną przez normę <math>\|\cdot \|</math> | ||
przestrzeni <math> | przestrzeni <math>X</math>. Stąd też definicja ekstremum funkcji <math>f: X\mapsto | ||
\mathbb{R}</math> o wartościach rzeczywistych określonej na przestrzeni | \mathbb{R}</math> o wartościach rzeczywistych określonej na przestrzeni | ||
unormowanej jest taka sama jak w przypadku przestrzeni metrycznej, | unormowanej jest taka sama jak w przypadku przestrzeni metrycznej, | ||
czyli funkcja <math> | czyli funkcja <math>f</math> przyjmuje w punkcie <math>a\in \mathrm{dom}\, f</math> '''''minimum | ||
lokalne''''' (odpowiednio: '''''maksimum lokalne''''', '''''ścisłe minimum | lokalne''''' (odpowiednio: '''''maksimum lokalne''''', '''''ścisłe minimum | ||
lokalne''''', '''''ścisłe maksimum lokalne'''''), jeśli istnieje liczba | lokalne''''', '''''ścisłe maksimum lokalne'''''), jeśli istnieje liczba | ||
<math> | <math>\delta | ||
>0</math> taka, że zachodzą odpowiednio implikacje: | >0</math> taka, że zachodzą odpowiednio implikacje: | ||
<center><math> | <center><math>d(x, a)<\delta\implies f(x)\geq f(a)</math></center> | ||
<center><math> | <center><math>d(x, a)<\delta \implies f(x)\leq f(a)</math></center> | ||
<center><math> | <center><math>0<d(x,a)<\delta \implies f(x)>f(a)</math></center> | ||
<center><math> | <center><math>0<d(x,a)<\delta \implies f(x)<f(a)</math>.</center> | ||
Minimum funkcji w punkcie <math> | Minimum funkcji w punkcie <math>a</math> nazywamy globalnym, jeśli <math>f</math> osiąga | ||
w punkcie <math> | w punkcie <math>a</math> kres dolny wartości. Jeśli zaś w punkcie <math>a</math> funkcja | ||
osiąga kres górny, to mówimy, że osiąga w punkcie <math> | osiąga kres górny, to mówimy, że osiąga w punkcie <math>a</math> maksimum | ||
globalne. | globalne. | ||
Sformułujmy wpierw '''''warunek konieczny''''' istnienia ekstremum | Sformułujmy wpierw '''''warunek konieczny''''' istnienia ekstremum | ||
funkcji <math> | funkcji <math>f</math>. | ||
{{twierdzenie|8.4.|| | {{twierdzenie|8.4.|| | ||
Jeśli funkcja różniczkowalna <math> | Jeśli funkcja różniczkowalna <math>f: | ||
X\subset U\mapsto \mathbb{R}</math> osiąga ekstremum w punkcie <math> | X\subset U\mapsto \mathbb{R}</math> osiąga ekstremum w punkcie <math>a</math> zbioru | ||
otwartego <math> | otwartego <math>U</math>, to w punkcie tym zeruje się różniczka funkcji <math>f</math>, | ||
tzn. <math> | tzn. <math>d_a f(h)=0</math>, gdzie <math>h\in X</math> jest dowolnym wektorem | ||
przestrzeni <math> | przestrzeni <math>X</math>. }} | ||
{{dowod|8.4.|| | {{dowod|8.4.|| | ||
Załóżmy, że funkcja <math> | Załóżmy, że funkcja <math>f</math> osiąga maksimum lokalne w punkcie | ||
<math> | <math>a\in U</math>. Ustalmy pewien wektor <math>h\in X</math>, <math>\|h\|=1</math> i rozważmy | ||
zacieśnienie funkcji <math> | zacieśnienie funkcji <math>f</math> do prostej <center><math>\{a+th, t\in\mathbb{R}\}</math></center> | ||
o | o | ||
kierunku <math> | kierunku <math>h</math> przechodzącej przez punkt <math>a</math>. Zacieśnienie to | ||
<center><math> | <center><math>\mathbb{R}\ni t\to f(a+th)\in \mathbb{R}</math></center> | ||
jest funkcją jednej zmiennej, | jest funkcją jednej zmiennej, | ||
osiągającą maksimum w <math> | osiągającą maksimum w <math>t=0</math>. Stąd pochodna w zerze funkcji | ||
<math> | <math>t\mapsto f(a+th)</math> jest równa zeru. Ale pochodna ta jest tożsama z | ||
pochodną kierunkową funkcji <math> | pochodną kierunkową funkcji <math>f</math> w kierunku wektora <math>h</math>. Wobec | ||
dowolności <math> | dowolności <math>h</math> różniczka <math>d_a f=0</math>. | ||
}} | }} | ||
{{uwaga|8.5.|| | {{uwaga|8.5.|| | ||
Zwróćmy uwagę, że funkcja może osiągać | Zwróćmy uwagę, że funkcja może osiągać ekstremum w punkcie, w którym nie jest różniczkowalna. Na przykład <math>f(x,y)=|x|+|y|</math> osiąga wartość minimalną w punkcie <math>(0,0)</math>, w którym nie jest różniczkowalna.}} | ||
ekstremum w punkcie, w którym nie jest różniczkowalna. Na przykład | |||
<math> | <br> | ||
którym nie jest różniczkowalna.}} | <center> | ||
<div | <div class="thumb"><div style="width:450px;"> | ||
<applet code=" | <applet code="JavaviewModApplet.class" height="400" width="450" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar"> | ||
<param name="colors" value="-1:#7e0b9f -0. | <param name="colors" value="-1:#7e0b9f -0.82:#7e0b9f -0.81:#ce3bf8 -0.64:#ce3bf8 -0.63:#2c4ae5 -0.46:#2c4ae5 -0.45:#2c85e5 -0.28:#2c85e5 -0.27:#2ecca9 -0.10:#2ecca9 -0.09:#2ecc5b 0.09:#2ecc5b 0.10:#97cc2e 0.27:#97cc2e 0.28:#edff27 0.45:#edff27 0.46:#ffba27 0.63:#ffba27 0.64:#ff6e27 0.81:#ff6e27 0.82:#d42555 1:#d42525"> | ||
<param name="coloring" value=" | <param name="coloring" value="mathematica"> | ||
<param name="model" value="images/e/e7/Am2m05.0110.mgs.zip"> | <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip"> | ||
<param name="scale" value="1.0 1.0 0. | <param name="scale" value="1.0 1.0 0.5"> | ||
<param name="shading" value="0.2"> | |||
</applet> | <param name="animation" value="stop"> | ||
</div> | </applet> | ||
<div.thumbcaption>Wykres funkcji <math>f(x,y)=|x|+|y|</math></div> | |||
</div></div> | |||
</center> | |||
<br> | |||
Przyjmijmy wobec tego następującą definicję.<br> | Przyjmijmy wobec tego następującą definicję.<br> | ||
{{definicja|8.6.|| | {{definicja|8.6.|| | ||
Mówimy, że <math> | Mówimy, że <math>a\in \mathrm{dom}\, f</math> jest | ||
'''''punktem krytycznym funkcji <math> | '''''punktem krytycznym funkcji <math>f</math>''''', jeśli <math>a</math> należy do | ||
dziedziny różniczki funkcji <math> | dziedziny różniczki funkcji <math>f</math> i różniczka zeruje się w tym | ||
punkcie, bądź też punkt <math> | punkcie, bądź też punkt <math>a</math> należy do dziedziny funkcji i nie | ||
istnieje różniczka <math> | istnieje różniczka <math>d_a f</math>. | ||
}} | }} | ||
{{wniosek|8.7.|| | {{wniosek|8.7.|| | ||
Jeśli funkcja <math> | Jeśli funkcja <math>f</math> osiąga ekstremum w | ||
punkcie <math> | punkcie <math>a\in \mathrm{dom}\, f</math>, to punkt ten jest krytyczny. | ||
}} | }} | ||
Linia 199: | Linia 199: | ||
{{definicja|8.8.|| | {{definicja|8.8.|| | ||
Niech <math> | Niech <math>A\in L^2(X, \mathbb{R})</math> będzie | ||
odwzorowaniem dwuliniowym symetrycznym określonym na <math> | odwzorowaniem dwuliniowym symetrycznym określonym na <math>X\times X</math>, | ||
gdzie <math> | gdzie <math>X</math> jest pewną przestrzenią Banacha. Mówimy, że forma | ||
kwadratowa <center><math> | kwadratowa <center><math>X\ni h\mapsto A(h,h)</math></center> | ||
jest | jest | ||
*'''''dodatnio określona''''', jeśli istnieje stała <math> | *'''''dodatnio określona''''', jeśli istnieje stała <math>C>0</math> taka, że | ||
<center><math> | <center><math>A(h,h)\geq C\|h\|^2, \text{ dla dowolnego wektora } h \in X</math>,</center> | ||
* '''''ujemnie określona''''', jeśli istnieje stała <math> | * '''''ujemnie określona''''', jeśli istnieje stała <math>C>0</math> taka, że | ||
<center><math> | <center><math>A(h,h)\leq - C\|h\|^2, \text{ dla dowolnego wektora } h \in X</math>,</center> | ||
* '''''nieujemnie określona''''', jeśli | * '''''nieujemnie określona''''', jeśli | ||
<center><math> | <center><math>A(h,h)\geq 0, \text{ dla dowolnego wektora } h \in X</math>,</center> | ||
* '''''niedodatnio określona''''', jeśli | * '''''niedodatnio określona''''', jeśli | ||
<center><math> | <center><math>A(h,h)\leq 0, \text{ dla dowolnego wektora } h \in X</math>,</center> | ||
* '''''nieokreślona''''', jeśli nie jest ani dodatnio, ani ujemnie, | * '''''nieokreślona''''', jeśli nie jest ani dodatnio, ani ujemnie, | ||
ani nieujemnie, ani niedodatnio określona. | ani nieujemnie, ani niedodatnio określona. | ||
Często mówimy też, że odwzorowanie dwuliniowe symetryczne <math> | Często mówimy też, że odwzorowanie dwuliniowe symetryczne <math>A\in | ||
L^2 (X, \mathbb{R})</math> jest '''''dodatnio określone''''' (odpowiednio: | L^2 (X, \mathbb{R})</math> jest '''''dodatnio określone''''' (odpowiednio: | ||
'''''ujemnie określone''''', '''''nieujemnie określone''''', | '''''ujemnie określone''''', '''''nieujemnie określone''''', | ||
'''''niedodatnio określone''''', '''''nieokreślone'''''), jeśli forma | '''''niedodatnio określone''''', '''''nieokreślone'''''), jeśli forma | ||
kwadratowa <math> | kwadratowa <math>h\mapsto A(h,h)</math> jest określona dodatnio (odpowiednio: | ||
określona ujemnie, określona nieujemnie, określona niedodatnio, | określona ujemnie, określona nieujemnie, określona niedodatnio, | ||
bądź jest nieokreślona). | bądź jest nieokreślona). | ||
Linia 231: | Linia 231: | ||
{{uwaga|8.9.|| | {{uwaga|8.9.|| | ||
a) Forma kwadratowa <math> | a) Forma kwadratowa <math>h\mapsto A(h,h)</math> | ||
jest dodatnio określona wtedy i tylko wtedy, gdy forma <math> | jest dodatnio określona wtedy i tylko wtedy, gdy forma <math>h\mapsto | ||
-A(h,h)</math> jest ujemnie określona. | -A(h,h)</math> jest ujemnie określona. | ||
b) Forma kwadratowa <math> | b) Forma kwadratowa <math>h\mapsto A(h,h)</math> jest nieujemnie określona | ||
wtedy i tylko wtedy, gdy forma <math> | wtedy i tylko wtedy, gdy forma <math>h\mapsto -A(h,h)</math> jest niedodatnio | ||
określona. | określona. | ||
c) Forma kwadratowa <math> | c) Forma kwadratowa <math>h\mapsto A(h,h)</math> jest nieokreślona wtedy i | ||
tylko wtedy, gdy nieokreślona jest forma <math> | tylko wtedy, gdy nieokreślona jest forma <math>h\mapsto -A(h,h)</math>. | ||
}} | }} | ||
Linia 248: | Linia 248: | ||
{{twierdzenie|8.10.|| | {{twierdzenie|8.10.|| | ||
Niech <math> | Niech <math>f</math> będzie funkcją klasy <math>C^2</math> w | ||
otwartym otoczeniu <math> | otwartym otoczeniu <math>U</math> punktu <math>a</math>. Załóżmy, że różniczka funkcji | ||
<math> | <math>f</math> w punkcie <math>a</math> jest równa zeru. | ||
a) Jeśli druga różniczka <math> | a) Jeśli druga różniczka <math>d^2 _af</math> jest dodatnio określona, | ||
funkcja <math> | funkcja <math>f</math> osiąga ścisłe minimum lokalne w punkcie <math>a</math>. | ||
b) Jeśli druga różniczka <math> | b) Jeśli druga różniczka <math>d^2 _af</math> jest ujemnie określona, funkcja | ||
<math> | <math>f</math> osiąga ścisłe maksimum lokalne w punkcie <math>a</math>. | ||
c) Jeśli druga różniczka <math> | c) Jeśli druga różniczka <math>d^2 _af</math> jest nieokreślona, funkcja <math>f</math> | ||
nie osiąga ekstremum w punkcie <math> | nie osiąga ekstremum w punkcie <math>a</math>. }} | ||
{{dowod|8.10.|| | {{dowod|8.10.|| | ||
a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce: | a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce: | ||
<math> | <math>d_a f=0</math>) dostajemy równość prawdziwą w otoczeniu punktu <math>a</math> na | ||
tyle małym, aby odcinek <math> | tyle małym, aby odcinek <math>\{a+th, 0\leq t\leq 1\}</math> był w nim | ||
zawarty. | zawarty. | ||
<center><math>\ | <center><math>\begin{align} f(a+h)&=f(a)+d_a f (h)+\frac{1}{2}d^2_{a+\theta h} f(h,h) | ||
\\&=f(a)+0+\frac{1}{2}d^2_{a+\theta h} f(h,h),\ | \\&=f(a)+0+\frac{1}{2}d^2_{a+\theta h} f(h,h),\end{align}</math></center> | ||
czyli <center><math> | czyli <center><math>f(a+h)-f(a)=\frac{1}{2}d^2_{a+\theta h} f(h,h)</math>,</center> | ||
gdzie | gdzie | ||
<math> | <math>0<\theta <1</math> jest pewną liczbą. Jeśli forma <math>h\mapsto d^2_{a} | ||
f(h,h)</math> jest dodatnio określona, to wobec ciągłości drugiej | f(h,h)</math> jest dodatnio określona, to wobec ciągłości drugiej | ||
różniczki, również w pewnym małym otoczeniu punktu <math> | różniczki, również w pewnym małym otoczeniu punktu <math>a</math> w punkcie | ||
<math> | <math>a+\theta h</math> forma <math>h\mapsto d^2_{a+\theta h} f(h,h)</math> jest | ||
dodatnio określona. Wobec tego | dodatnio określona. Wobec tego | ||
<center><math> | <center><math>f(a+h)-f(a)=\frac{1}{2}d^2_{a+\theta h} f(h,h)>0</math>,</center> | ||
czyli <math> | czyli <math>f(a+h)>f(a)</math> dla dowolnego niezerowego wektora <math>h</math> z | ||
pewnego małego otoczenia punktu <math> | pewnego małego otoczenia punktu <math>0</math>. Oznacza to, że funkcja <math>f</math> | ||
osiąga w tym punkcie ścisłe minimum lokalne. | osiąga w tym punkcie ścisłe minimum lokalne. | ||
b) Podobnie jak w punkcie a) wykazujemy, że funkcja <math> | b) Podobnie jak w punkcie a) wykazujemy, że funkcja <math>f</math> | ||
osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie | osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie | ||
określona w punkcie, w którym zeruje się jej pierwsza różniczka. | określona w punkcie, w którym zeruje się jej pierwsza różniczka. | ||
c) Jeśli druga różniczka <math> | c) Jeśli druga różniczka <math>d^2_a f</math> jest nieokreślona, to istnieją | ||
dwa wektory <math> | dwa wektory <math>h, k\in X</math> takie, że <math>d^2_a f(h,h)>0</math> natomiast | ||
<math> | <math>d^2_a f(k,k)<0</math>. Jeśli więc zacieśnimy funkcję <math>f</math> do prostej o | ||
kierunku <math> | kierunku <math>h</math>: <center><math>a+\mathbb{R} h=\{a+th, t\in\mathbb{R}\}\subset X</math>,</center> | ||
to na | to na | ||
prostej tej w pewnym małym otoczeniu punktu <math> | prostej tej w pewnym małym otoczeniu punktu <math>a</math> (dla <math>t</math> bliskich | ||
zeru) otrzymamy nierówność: | zeru) otrzymamy nierówność: | ||
<center><math> | <center><math>f(a+th)-f(a)=\frac{1}{2}d^2_{a+\theta th} f(th,th)>0</math></center> | ||
natomiast na prostej o kierunku <math> | natomiast na prostej o kierunku <math>k</math>: | ||
<center><math> | <center><math>a+\mathbb{R} k=\{a+tk, t\in\mathbb{R}\}\subset X</math>,</center> | ||
dostaniemy, podobnie w małym otoczeniu punktu <math> | dostaniemy, podobnie w małym otoczeniu punktu <math>a</math>, nierówność | ||
przeciwną: | przeciwną: | ||
<center><math> | <center><math>f(a+tk)-f(a)=\frac{1}{2}d^2_{a+\theta tk} | ||
f(tk,tk)<0 | f(tk,tk)<0</math></center> | ||
Stąd funkcja <math> | Stąd funkcja <math>f</math> nie osiąga w punkcie <math>a</math> żadnego | ||
ekstremum, gdyż w dowolnie małym otoczeniu punktu <math> | ekstremum, gdyż w dowolnie małym otoczeniu punktu <math>a</math> przyjmuje | ||
zarówno wartości mniejsze, jak i większe od <math> | zarówno wartości mniejsze, jak i większe od <math>f(a)</math>. | ||
}} | }} | ||
{{uwaga|8.11.|| | {{uwaga|8.11.|| | ||
Twierdzenie nie rozstrzyga o istnieniu | Twierdzenie nie rozstrzyga o istnieniu ekstremum ani o jego typie, gdy druga różniczka <math>d^2 _a f</math> jest niedodatnio lub nieujemnie określona. Rozważmy trzy proste przykłady.}} | ||
ekstremum ani o jego typie, gdy druga różniczka <math> | |||
niedodatnio lub nieujemnie określona. Rozważmy trzy proste | |||
przykłady.}} | |||
{{przyklad|8.12.|| | {{przyklad|8.12.|| | ||
Funkcja <math> | Funkcja <math>f(x,y)=x^4+y^4</math> osiąga w | ||
punkcie <math> | punkcie <math>(0,0)</math> ścisłe minimum lokalne równe zeru, gdyż dla | ||
dowolnego punktu <math> | dowolnego punktu <math>(x,y)\neq (0,0)</math> mamy <math>f(x,y)>0</math>. | ||
<br> | |||
< | |||
Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka | Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka | ||
funkcji <math> | funkcji <math>f</math> w punkcie <math>(0,0)</math> zerują się. W szczególności druga | ||
różniczka jest nieujemnie określona w każdym punkcie płaszczyzny | różniczka jest nieujemnie określona w każdym punkcie płaszczyzny | ||
<math> | <math>\mathbb{R}^2</math>, gdyż dla dowolnego wektora <math>h=(h_1, h_2)\in \mathbb{R}^2</math> mamy | ||
<center><math> | <center><math>d^2_{(x,y)}(h,h)=12(x^2 h_1^2+y^2 h_2^2)\geq 0</math>.</center> | ||
W szczególności | W szczególności | ||
<center><math> | <center><math>d^2_{(0,0)}(h,h)=12(0^2 h_1^2+0^2 h_2^2)=0\geq 0</math>.</center> | ||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.12.|wykres]] | |||
}} | }} | ||
{{przyklad|8.13.|| | {{przyklad|8.13.|| | ||
Funkcja <math> | Funkcja <math>f(x,y)=-x^4-y^4</math> osiąga w | ||
punkcie <math> | punkcie <math>(0,0)</math> ścisłe maksimum lokalne równe zeru, gdyż dla | ||
dowolnego punktu <math> | dowolnego punktu <math>(x,y)\neq (0,0)</math> mamy <math>f(x,y)<0</math>. | ||
Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie | Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie | ||
zarówno pierwsza jak i druga różniczka funkcji <math> | zarówno pierwsza jak i druga różniczka funkcji <math>f</math> w punkcie | ||
<math> | <math>(0,0)</math> zerują się. W szczególności druga różniczka jest | ||
niedodatnio określona w każdym punkcie płaszczyzny <math> | niedodatnio określona w każdym punkcie płaszczyzny <math>\mathbb{R}^2</math>, gdyż | ||
dla dowolnego wektora <math> | dla dowolnego wektora <math>h=(h_1, h_2)\in \mathbb{R}^2</math> mamy | ||
<center><math> | <center><math>d^2_{(x,y)}(h,h)=-12(x^2 h_1^2+y^2 h_2^2)\leq 0</math>.</center> | ||
W szczególności | W szczególności | ||
<center><math> | <center><math>d^2_{(0,0)}(h,h)=-12(0^2 h_1^2+0^2 h_2^2)=0\leq 0</math>.</center> | ||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.13.|wykres]] | |||
}} | }} | ||
{{przyklad|8.14.|| | {{przyklad|8.14.|| | ||
Funkcja <math> | Funkcja <math>f(x,y)=x^4-y^4</math> nie osiąga w punkcie <math>(0,0)</math> żadnego ekstremum, gdyż dla dowolnego punktu <math>(x,0)\neq (0,0)</math> mamy <math>f(x,0)>0</math>, natomiast w punktach <math>(0,y)\neq (0,0)</math> mamy z kolei <math>f(0,y)<0</math>. | ||
ekstremum, gdyż dla dowolnego punktu <math> | |||
<math> | |||
<math> | |||
Zwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji <math>f</math> zerują się w punkcie <math>(0,0)</math>. W punktach <math>h=(h_1,h_2)\neq (0,0)</math>, tj. poza początkiem układu współrzędnych, druga różniczka | |||
<math> | <center><math>d^2_{(x,y)}(h,h)=12(x^2 h_1^2-y^2 h_2^2)</math></center> | ||
jest nieokreślona, bo w punktach <math>(x,0)\neq (0,0)</math> forma kwadratowa <math>h\mapsto d^2_{(x,y)}f</math> jest dodatnia, a w punktach | |||
<math>(0,y)\neq (0,0)</math> jest ujemna. W samym zaś punkcie <math>(0,0)</math> forma kwadratowa <center><math>d^2_{(0,0)}(h,h)=12(0^2 h_1^2-0^2 h_2^2)=0</math></center> | |||
jest zerowa. Analiza formy kwadratowej w otoczeniu punktu <math>(0,0)</math> | |||
pozwala nam jednak dostrzec, że zacieśnienie funkcji <math>f</math> do | |||
prostej <math>y=0</math> (tj. w punktach postaci <math>(x,0)</math>) jest funkcją <math>f(x,0)=x^4</math>, która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej <math>x=0</math> (czyli w punktach postaci <math>(0,y)</math>) funkcja <math>f(0,y)=-y^4</math> osiąga maksimum w punkcie <math>y=0</math>. Stąd funkcja <math>(x,y)\mapsto f(x,y)</math> nie osiąga żadnego ekstremum w punkcie <math>(0,0)</math>. | |||
}} | |||
jest nieokreślona, bo w punktach <math> | <br> | ||
kwadratowa <math> | <center> | ||
<math> | <div class="thumb"><div style="width:450px;"> | ||
kwadratowa <center><math> | <applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400"> | ||
jest | <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> | ||
zerowa. Analiza formy kwadratowej w otoczeniu punktu <math> | <param name="coloring" value="maple"> | ||
pozwala nam jednak dostrzec, że zacieśnienie funkcji <math> | <param name="model" value="images/4/47/Am2w08.0120.mgs.zip"> | ||
prostej <math> | <param name="scale" value="1.0 1.0 0.05"> | ||
<math> | <param name="shading" value="0.2"> | ||
zacieśnienie do prostej <math> | <param name="animation" value="stop"> | ||
funkcja <math> | </applet> | ||
funkcja <math> | <div.thumbcaption>Wykres funkcji <math>f(x,y)=x^4-y^4</math></div> | ||
punkcie <math> | </div></div> | ||
</center> | |||
<br> | |||
Kolejne twierdzenie, które nazywamy '''''kryterium Sylvestera''''', | Kolejne twierdzenie, które nazywamy '''''kryterium Sylvestera''''', | ||
Linia 385: | Linia 376: | ||
funkcji wielu zmiennych. | funkcji wielu zmiennych. | ||
Niech <math> | Niech <math>A=[a_{ij}]</math>, <math>i,j=1,2,\dots, n</math>, będzie macierzą kwadratową | ||
symetryczną (tzn. <math> | symetryczną (tzn. <math>a_{ij}=a_{ji}</math> dla dowolnych <math>i,j</math>). Niech | ||
<center><math> | <center><math> | ||
A_k :=\det | |||
\left[\begin{array}{rrr} | \left[\begin{array}{rrr} | ||
a_{11}&\dots & a_{1k}\\ | a_{11}&\dots & a_{1k}\\ | ||
Linia 394: | Linia 385: | ||
a_{k1}&\dots & a_{kk}\end{array} \right]</math></center> | a_{k1}&\dots & a_{kk}\end{array} \right]</math></center> | ||
będzie '''''minorem | będzie '''''minorem | ||
głównym rzędu <math> | głównym rzędu <math>k</math>''''' macierzy <math>A</math>, <math>k\in\{1,2,\dots, n\}</math>. | ||
{{twierdzenie|8.15. [twierdzenie Sylvestera]|| | {{twierdzenie|8.15. [twierdzenie Sylvestera]|| | ||
Forma | Forma | ||
kwadratowa <math> | kwadratowa <math>\mathbb{R}^n\in h\mapsto \sum_{i=1}^n\sum_{j=1}^n a_{ij}h_i | ||
h_j</math> zadana przez symetryczną macierz kwadratową <math> | h_j</math> zadana przez symetryczną macierz kwadratową <math>A=[a_{ij}]</math>, | ||
<math> | <math>i,j=1,2,\dots, n</math>, jest dodatnio określona wtedy i tylko wtedy, | ||
gdy wszystkie minory główne macierzy <math> | gdy wszystkie minory główne macierzy <math>A</math> są dodatnie, tzn. <math>A_k>0</math> | ||
dla dowolnego <math> | dla dowolnego <math>k\in\{1,2,\dots, n\}</math>. }} | ||
{{dowod|8.15.|| | {{dowod|8.15.|| | ||
Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz <math> | Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz <math>A</math> | ||
będzie złożona z jednej liczby <math> | będzie złożona z jednej liczby <math>[a_{11}]</math>. Należy zauważyć, że | ||
forma <math> | forma <math>h\mapsto a_{11} h^2</math> jest dodatnio określona wtedy i tylko | ||
wtedy, gdy <math> | wtedy, gdy <math>a_{11}>0</math>. Następnie dowodzi się implikacji, że z | ||
dodatniej określoności formy zadanej przez macierz | dodatniej określoności formy zadanej przez macierz | ||
<math> | <math>\tilde{A}=[a_{ij}]</math>, <math>i,j=1,2,\dots, n-1</math> wobec założenia o | ||
dodatniości minora <math> | dodatniości minora <math>A_n =\det[a_{ij}]</math>, <math>i,j=1,2,\dots, n</math>, wynika | ||
dodatnia określoność formy kwadratowej zadanej przez macierz | dodatnia określoność formy kwadratowej zadanej przez macierz | ||
<math> | <math>A=[a_{ij}],i,j=1,2,\dots, n</math>. Szczegóły (które pomijamy) można | ||
znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, | znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, | ||
Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk, | Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk, | ||
Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.) }} | Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.) }} | ||
Ponieważ forma kwadratowa <math> | Ponieważ forma kwadratowa <math>h\mapsto A(h,h)</math> jest ujemnie określona | ||
wtedy i tylko wtedy, gdy <math> | wtedy i tylko wtedy, gdy <math>h\mapsto -A(h,h)</math> jest dodatnio | ||
określona, twierdzenie Sylvestera pozwala nam również stwierdzić, | określona, twierdzenie Sylvestera pozwala nam również stwierdzić, | ||
kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy | kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy | ||
Linia 425: | Linia 416: | ||
{{wniosek|8.16.|| | {{wniosek|8.16.|| | ||
Jeśli <math> | Jeśli <math>A=[a_{ij}],i,j=1,2,\dots, n</math>, | ||
jest symetryczną macierzą kwadratową, to forma kwadratowa | jest symetryczną macierzą kwadratową, to forma kwadratowa | ||
<center><math> | <center><math>\mathbb{R}^n\ni h\mapsto \sum_{i=1}^n\sum_{j=1}^n a_{ij}h_i h_j\in | ||
\mathbb{R}</math></center> | \mathbb{R}</math></center> | ||
jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie | jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie | ||
minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego | minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego | ||
są dodatnie, tzn. gdy | są dodatnie, tzn. gdy | ||
<center><math> | <center><math>(-1)^k A_k>0, \ \ \ k\in\{1,2,\dots, n\}</math>.</center> | ||
}} | }} | ||
Linia 438: | Linia 429: | ||
{{przyklad|8.17.|| | {{przyklad|8.17.|| | ||
Wyznaczmy ekstrema funkcji | Wyznaczmy ekstrema funkcji | ||
<center><math> | <center><math>\mathbb{R}^3\ni (x,y,z)\mapsto f(x,y,z)=(x^2+y^2+z^2)^2-3xyz\in \mathbb{R}</math>.</center> | ||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.17.|wykres]] | |||
<br> | |||
Różniczka tej funkcji zeruje się w punktach, których współrzędne | Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań | ||
spełniają układ równań <center><math> | <center><math>\left\{\begin{align} \frac{\partial | ||
f}{\partial x}&=0\\\frac{\partial f}{\partial | f}{\partial x}&=0\\\frac{\partial f}{\partial | ||
y}&=0\\\frac{\partial f}{\partial z}&=0,\ | y}&=0\\\frac{\partial f}{\partial z}&=0,\end{align}\right. \text{ czyli } \left\{\begin{align} 4(x^2+y^2+z^2)x&=3yz \\ | ||
czyli } \left\{\ | |||
4(x^2+y^2+z^2)y&=3xz | 4(x^2+y^2+z^2)y&=3xz | ||
\\ 4(x^2+y^2+z^2)z&=3xy. \ | \\ 4(x^2+y^2+z^2)z&=3xy. \end{align}\right.</math>.</center> | ||
Układ ten spełniają współrzędne pięciu punktów | Układ ten spełniają współrzędne pięciu punktów | ||
<center><math>\ | <center><math>\begin{align} P_0&=(0,0,0), | ||
\\ P_1&=\big(\frac{1}{4},\frac{1}{4},\frac{1}{4}\big), | \\ P_1&=\big(\frac{1}{4},\frac{1}{4},\frac{1}{4}\big), | ||
\\ P_2&=\big(\frac{1}{4},-\frac{1}{4},-\frac{1}{4}\big), | \\ P_2&=\big(\frac{1}{4},-\frac{1}{4},-\frac{1}{4}\big), | ||
\\ P_3&=\big(-\frac{1}{4},\frac{1}{4},-\frac{1}{4}\big), | \\ P_3&=\big(-\frac{1}{4},\frac{1}{4},-\frac{1}{4}\big), | ||
\\ P_4&=\big(-\frac{1}{4},-\frac{1}{4},\frac{1}{4}\big). | \\ P_4&=\big(-\frac{1}{4},-\frac{1}{4},\frac{1}{4}\big). | ||
\ | \end{align}</math></center> | ||
Łatwo zauważyć, że w punkcie <math> | Łatwo zauważyć, że w punkcie <math>P_0</math> funkcja nie osiąga ekstremum, | ||
gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno | gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno | ||
wartości mniejsze jak i większe od <math> | wartości mniejsze jak i większe od <math>f(P_0)=0</math>. Na przykład na | ||
prostej o kierunku (1,1,1) przechodzącej przez punkt | prostej o kierunku (1,1,1) przechodzącej przez punkt | ||
<math> | <math>P_0=(0,0,0)</math>, tj. na zbiorze <center><math>P_0 +\mathbb{R}(1,1,1)=\{(t,t,t), | ||
t\in\mathbb{R}\} | t\in\mathbb{R}\}</math>,</center> | ||
funkcja | funkcja | ||
<center><math> | <center><math>f(t,t,t)=(t^2+t^2+t^2)^2-3t^3=3t^3(3t-1)</math></center> | ||
przyjmuje w otoczeniu | przyjmuje w otoczeniu | ||
zera zarówno dodatnie wartości (np. gdy <math> | zera zarówno dodatnie wartości (np. gdy <math>t<0</math>) jak i ujemne (np. | ||
gdy <math> | gdy <math>0<t<\frac{1}{3}</math>). W pozostałych czterech punktach macierz | ||
drugich pochodnych cząstkowych, która zadaje drugą różniczkę | drugich pochodnych cząstkowych, która zadaje drugą różniczkę | ||
<center><math> | <center><math>\left[ | ||
\begin{array}{lll} | \begin{array}{lll} | ||
4(3x^2+y^2+z^2)& 8xy-3z &8xz-3y\\ | 4(3x^2+y^2+z^2)& 8xy-3z &8xz-3y\\ | ||
Linia 477: | Linia 470: | ||
</math></center> | </math></center> | ||
jest dodatnio określona. Na przykład w punkcie | jest dodatnio określona. Na przykład w punkcie | ||
<math> | <math>P_1=\big(\frac{1}{4}, \frac{1}{4}, \frac{1}{4}\big)</math> macierz | ||
drugich pochodnych cząstkowych funkcji <math> | drugich pochodnych cząstkowych funkcji <math>f</math> | ||
<center><math> | <center><math>\left[\begin{array}{rrr} \frac{5}{4} &-\frac{1}{4} &-\frac{1}{4}\\ | ||
-\frac{1}{4} &\frac{5}{4} &-\frac{1}{4}\\ | -\frac{1}{4} &\frac{5}{4} &-\frac{1}{4}\\ | ||
-\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]</math></center> | -\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]</math></center> | ||
ma | ma | ||
wszystkie minory główne dodatnie: | wszystkie minory główne dodatnie: | ||
<center><math>\ | <center><math>\begin{align} A_1&=\det\left[\frac{5}{4}\right]=\frac{5}{4}>0 | ||
\\A_2&=\det\left[\begin{array}{rr} \frac{5}{4} &-\frac{1}{4} \\ | \\A_2&=\det\left[\begin{array}{rr} \frac{5}{4} &-\frac{1}{4} \\ | ||
-\frac{1}{4} &\frac{5}{4}\end{array} \right] | -\frac{1}{4} &\frac{5}{4}\end{array} \right] | ||
Linia 492: | Linia 485: | ||
-\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]= | -\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]= | ||
\frac{1}{4^3}\det\left[\begin{array}{rrr} 5 &-1&-1\\-1 &5 &-1\\-1 &-1& | \frac{1}{4^3}\det\left[\begin{array}{rrr} 5 &-1&-1\\-1 &5 &-1\\-1 &-1& | ||
5\end{array} \right]=\frac{108}{64}>0.\ | 5\end{array} \right]=\frac{108}{64}>0.\end{align}</math></center> | ||
Stąd w punkcie | Stąd w punkcie | ||
<math> | <math>P_1</math> funkcja osiąga minimum lokalne równe | ||
<math> | <math>f(P_1)=-\frac{3}{256}</math>. Podobne uzasadnienie prowadzi do wniosku, | ||
że także w pozostałych punktach <math> | że także w pozostałych punktach <math>P_2</math>, <math>P_3</math> oraz <math>P_4</math> funkcja | ||
osiąga minima lokalne. | osiąga minima lokalne. | ||
Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie | Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie | ||
zrezygnować z analizy określoności drugiej różniczki. Punkty <math> | zrezygnować z analizy określoności drugiej różniczki. Punkty <math>A_1, | ||
A_2, A_3, A_4</math> leżą we wnętrzu zbioru ograniczonego poziomicą | A_2, A_3, A_4</math> leżą we wnętrzu zbioru ograniczonego poziomicą | ||
zerową funkcji <math> | zerową funkcji <math>f</math>, precyzyjniej: leżą w obszarze, gdzie funkcja | ||
<math> | <math>f</math> jest ujemna. Ponieważ zbiór <center><math>\{(x,y,z)\in \mathbb{R}^3 : | ||
f(x,y,z)\leq 0\}</math></center> | f(x,y,z)\leq 0\}</math></center> | ||
jest zwarty (gdyż jest domknięty i ograniczony), | jest zwarty (gdyż jest domknięty i ograniczony), | ||
funkcja <math> | funkcja <math>f</math>, na mocy twierdzenia Weierstrassa o osiąganiu kresów | ||
przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech | przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech | ||
punktach osiągać minima lokalne. | punktach osiągać minima lokalne. | ||
Linia 527: | Linia 517: | ||
{{przyklad|8.18.|| | {{przyklad|8.18.|| | ||
Funkcja <math> | Funkcja <math>f(x,y)=\exp(-x^2-y^2)</math> jest | ||
funkcją promienia <math> | funkcją promienia <math>r=\sqrt{x^2+y^2}</math>, gdyż <math>f(x,y)=e^{-r^2}</math>, | ||
gdzie <math> | gdzie <math>r=\sqrt{x^2+y^2}</math>. Ponieważ funkcja <math>r\mapsto e^{-r^2}</math> | ||
osiąga wartość największą w punkcie <math> | osiąga wartość największą w punkcie <math>r=0</math> i nie osiąga żadnych | ||
więcej ekstremów na półprostej <math> | więcej ekstremów na półprostej <math>0\leq r<\infty</math>, więc jedynym | ||
ekstremum funkcji <math> | ekstremum funkcji <math>f(x,y)=\exp(-x^2-y^2)</math> jest maksimum lokalne | ||
osiągane w punkcie <math> | osiągane w punkcie <math>(0,0)</math> (tj. <math>r=0</math>). Wówczas <math>f(0,0)=1</math>. | ||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.18.|wykres]] | |||
< | <br> | ||
}} | }} | ||
{{przyklad|8.19.|| | {{przyklad|8.19.|| | ||
Funkcja <math> | Funkcja <math>f(x,y)=\sin(x^2+y^2)</math> także | ||
jest funkcją promienia <math> | jest funkcją promienia <math>r=\sqrt{x^2+y^2}</math>. Zauważmy bowiem, że | ||
<center><math> | <center><math>f(x,y)=\sin(x^2+y^2)=\sin(r^2\cos^2\varphi+r^2\sin^2\varphi)=\sin(r^2)</math></center> | ||
osiąga ekstrema w tych samych punktach, co | osiąga ekstrema w tych samych punktach, co | ||
funkcja <math> | funkcja <math>r\mapsto \sin (r^2)</math>, a więc osiąga maksima w punktach | ||
<math> | <math>r^2=\frac{\pi}{2}+2k\pi</math> i minima w punktach | ||
<math> | <math>r^2=\frac{3\pi}{2}+2k\pi</math>, gdzie <math>k=0, 1,2,\dots</math>. Innymi słowy | ||
funkcja <math> | funkcja <math>(x,y)\mapsto f(x,y)</math> osiąga maksima w punktach należących | ||
do okręgów o równaniach | do okręgów o równaniach | ||
<center><math> | <center><math>\{(x,y)\in \mathbb{R}^2 : x^2+y^2=\frac{\pi}{2}+2k\pi\}</math></center> | ||
oraz w punkcie <math> | oraz w punkcie <math>(0,0)</math> (wtedy <math>r=0</math>), a minima w punktach | ||
należących do okręgów | należących do okręgów | ||
<center><math> | <center><math>\{(x,y)\in \mathbb{R}^2 : x^2+y^2=\frac{3\pi}{2}+2k\pi\}</math>,</center> | ||
gdzie <math>k</math> jest dowolną liczbą całkowitą nieujemną. | |||
}} | }} | ||
<br> | |||
<center> | |||
<div class="thumb"><div style="width:450px;"> | |||
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400"> | |||
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> | |||
<param name="coloring" value="maple"> | |||
<param name="model" value="images/c/c6/Am2w08.0010.mgs.zip"> | |||
<param name="scale" value="1.0 1.0 1.0"> | |||
<param name="shading" value="0.2"> | |||
<param name="animation" value="stop"> | |||
</applet> | |||
<div.thumbcaption>Wykres funkcji <math>f(x,y)=\sin(x^2+y^2)</math></div> | |||
</div></div> | |||
</center> | |||
<br> | |||
{{przyklad|8.20.|| | {{przyklad|8.20.|| | ||
Podobnie jak w poprzednim przykładzie | Podobnie jak w poprzednim przykładzie | ||
funkcja <math> | funkcja <math>f(x,y)=\cos(x^2+y^2)=\cos (r^2)</math>, <math>r=\sqrt{x^2+y^2}</math>, | ||
osiąga maksima na okręgach o promieniach <math> | osiąga maksima na okręgach o promieniach <math>r</math> takich, ze | ||
<math> | <math>r^2=0+2k\pi</math>, czyli na okręgach | ||
<center><math> | <center><math>\{(x,y)\in \mathbb{R}^2 : x^2+y^2=2k\pi\}</math>,</center> | ||
natomiast minima na okręgach, których promień <math> | natomiast minima na okręgach, których promień <math>r</math> spełnia równanie | ||
<math> | <math>r^2=\pi+2k\pi</math>, tj. na okręgach | ||
<center><math> | <center><math>\{(x,y)\in \mathbb{R}^2 : x^2+y^2=(2k+1)\pi\}</math>,</center> | ||
gdzie <math>k=0,1,2,\dots</math> jest nieujemną liczbą całkowitą. | |||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.20.|wykres]] | |||
<br> | |||
}} | }} | ||
{{przyklad|8.21.|| | {{przyklad|8.21.|| | ||
Także funkcja <math> | Także funkcja <math>f(x,y)=\ln | ||
(x^2+y^2+1)=\ln(r^2 +1)</math> jest funkcją promienia | (x^2+y^2+1)=\ln(r^2 +1)</math> jest funkcją promienia | ||
<math> | <math>r=\sqrt{x^2+y^2}</math>. Ponieważ funkcja <math>[0, \infty)\ni r\mapsto | ||
r^2+1\in \mathbb{R}</math> jest ściśle rosnąca, osiąga minimum w punkcie <math> | r^2+1\in \mathbb{R}</math> jest ściśle rosnąca, osiąga minimum w punkcie <math>r=0</math>. | ||
Stąd także funkcja <math> | Stąd także funkcja <math>f(x,y)=\ln (x^2+y^2+1)</math> osiąga minimum w | ||
punkcie <math> | punkcie <math>(x,y)=(0,0)</math> (wówczas <math>r=0</math>). | ||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.21.|wykres]] | |||
< | <br> | ||
}} | }} | ||
Również w wielu innych przykładach, gdy funkcja <math> | Również w wielu innych przykładach, gdy funkcja <math>f</math> nie jest | ||
funkcją promienia, można uniknąć stosowania rachunku | funkcją promienia, można uniknąć stosowania rachunku | ||
różniczkowego do wyznaczenia ekstremów. | różniczkowego do wyznaczenia ekstremów. | ||
Linia 600: | Linia 597: | ||
{{przyklad|8.22.|| | {{przyklad|8.22.|| | ||
Funkcja <math> | Funkcja <math>f(x,y)=\sin(x^2-y^2)</math> osiąga maksima w punktach hiperbol | ||
<center><math> | <center><math>\{(x,y)\in \mathbb{R}^2 : x^2-y^2=\frac{\pi}{2}+2k\pi\}</math>,</center> | ||
a minima w punktach drugiej rodziny hiperbol | a minima w punktach drugiej rodziny hiperbol | ||
<center><math> | <center><math>\{(x,y)\in \mathbb{R}^2 : x^2-y^2=\frac{3\pi}{2}+2k\pi\}</math>,</center> | ||
gdzie <math>k</math> jest liczbą całkowitą. | |||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.22.|wykres]] | |||
<br> | |||
}} | }} | ||
{{przyklad|8.23.|| | {{przyklad|8.23.|| | ||
Z kolei funkcja <math> | Z kolei funkcja <math>f(x,y)=\cos(x^2-y^2)</math> | ||
osiąga maksima w punktach hiperbol | osiąga maksima w punktach hiperbol | ||
<center><math> | <center><math>\{(x,y)\in \mathbb{R}^2 : x^2-y^2=2k\pi\}</math>,</center> | ||
a minima w punktach drugiej rodziny hiperbol | a minima w punktach drugiej rodziny hiperbol | ||
<center><math> | <center><math>\{(x,y)\in \mathbb{R}^2 : x^2-y^2=(2k+1)\pi\}</math>,</center> | ||
gdzie <math>k</math> jest liczbą całkowitą. | |||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.23.|wykres]] | |||
<br> | |||
}} | }} | ||
Linia 632: | Linia 627: | ||
obserwacja przebiegu poziomic pozwala stwierdzić, że | obserwacja przebiegu poziomic pozwala stwierdzić, że | ||
'''(a)''' funkcja <math>f_1(x,y)=x^2+y^2</math> osiąga w punkcie <math>(0,0)</math> minimum | |||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Uwaga 8.24.(a)|wykres]] | |||
<br> | |||
'''(b)''' w tym samym punkcie funkcja <math>f_2(x,y)=-x^2-y^2</math> osiąga maksimum | |||
<br> | |||
< | [[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Uwaga 8.24.(b)|wykres]] | ||
<br> | |||
'''(c)''' a funkcja <math>f_3(x,y)=x^2-y^2</math> nie osiąga w punkcie <math>(0,0)</math> | |||
< | |||
żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w | żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w | ||
dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak | dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak | ||
i większe od zera. | i większe od zera. | ||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Uwaga 8.24.(c)|wykres]] | |||
<br> | |||
}} | }} | ||
{{przyklad|8.25.|| | {{przyklad|8.25.|| | ||
Zauważmy, że każda z trzech funkcji | Zauważmy, że każda z trzech funkcji '''a, b, c''' ma w punkcie <math>(0,0)</math> zerową zarówno | ||
pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym | pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym | ||
punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu | punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu | ||
punktu <math> | punktu <math>(0,0)</math> zarówno wartości mniejsze jak i większe od zera. | ||
'''(a)''' <math>f_2(x,y)=-x^3-y^3</math> | |||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.25.(a)|wykres]] | |||
<br> | |||
'''(b)''' <math>f_3(x,y)=x^3-y^3</math> | |||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.25.(b)|wykres]] | |||
<br> | |||
'''(c)''' <math>f_1(x,y)=x^3+y^3</math> | |||
}} | }} | ||
<br> | |||
<center> | |||
<div class="thumb"><div style="width:450px;"> | |||
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400"> | |||
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> | |||
<param name="coloring" value="maple"> | |||
<param name="model" value="images/1/10/Am2w08.0130.mgs.zip"> | |||
<param name="scale" value="1.0 1.0 0.1"> | |||
<param name="shading" value="0.2"> | |||
<param name="animation" value="stop"> | |||
</applet> | |||
<div.thumbcaption>Wykres funkcji | |||
<math>f_1(x,y)=x^3+y^3</math></div> | |||
</div></div> | |||
</center> | |||
<br> | |||
Należy pamiętać o analizowaniu otoczenia punktów krytycznych | Należy pamiętać o analizowaniu otoczenia punktów krytycznych | ||
Linia 681: | Linia 684: | ||
{{przyklad|8.26.|| | {{przyklad|8.26.|| | ||
Funkcja | Funkcja | ||
<math> | <math>f(x,y)=|x|^\frac{2}{3}+|y|^\frac{2}{3}</math> jest ciągła na całej | ||
płaszczyźnie, nie jest jednak różniczkowalna w punktach należących | płaszczyźnie, nie jest jednak różniczkowalna w punktach należących | ||
do dwóch prostych: <math> | do dwóch prostych: <math>x=0</math> oraz <math>y=0</math>. Różniczka tej funkcji nie | ||
zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema | zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema | ||
prostymi <math> | prostymi <math>x=0</math>, <math>y=0</math>. Stąd zbiorem punktów krytycznych jest suma | ||
obu prostych: | obu prostych: | ||
<center><math> | <center><math>\{(x,y)\in\mathbb{R}^2 : x=0 \text{ lub } y=0 \}</math>.</center> | ||
Łatwo zauważyć, że jedynie w punkcie <math>(0,0)</math> tego zbioru funkcja | |||
<math>f</math> osiąga ekstremum, a mianowicie minimum <math>f(0,0)=0</math>. | |||
<br> | |||
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.26.|wykres]] | |||
<br> | |||
}} | }} |
Aktualna wersja na dzień 21:33, 11 wrz 2023
Ekstrema funkcji wielu zmiennych.
Dowodzimy wzoru Taylora dla funkcji wielu zmiennych. Jego konsekwencją jest warunek wystarczający istnienia ekstremum. Pokazujemy szereg przykładów prowadzących do zastosowania wykazanego warunku wystarczającego oraz takich, w których nie jest to niezbędne.
Wzór Taylora dla funkcji wielu zmiennych
Niech będzie funkcją klasy określoną na otwartym podzbiorze przestrzeni Banacha o wartościach w przestrzeni Banacha . Podobnie jak w przypadku funkcji jednej zmiennej rzeczywistej zachodzi następujące
Twierdzenie 8.1. [twierdzenie Taylora]
zachodzi równość
Definicja 8.2.
Zauważmy, że jeśli i , to wielomian Taylora funkcji rzędu o środku w punkcie można wyrazić za pomocą pochodnych cząstkowych funkcji w następujący sposób:
gdzie jest -wskaźnikiem o długości . (Oznaczenia: , , wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W szczególnym (ale bardzo często spotykanym) przypadku funkcji dwóch zmiennych wielomian Taylora o środku w punkcie przyjmuje postać
gdzie .
Dowód 8.3.
Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy jest funkcją o wartościach rzeczywistych, określoną na otwartym podzbiorze przestrzeni Banacha . Niech, zgodnie z założeniem, oraz będą takimi
punktami zbioru , że odcinek . Rozważmy funkcjęokreśloną w pewnym otoczeniu otwartym odcinka . Funkcja jest w tym zbiorze klasy , gdyż jest tej klasy w otoczeniu odcinka . Ponadto z twierdzenia o różniczkowaniu złożenia funkcji mamy dla dowolnej liczby równość
Ze twierdzenia Taylora dla funkcji jednej zmiennej oraz z powyższej równości mamy
gdzie jest pewnym punktem pośrednim. Stąd mamy też oszacowanie reszty we wzorze Taylora:

Ekstrema funkcji wielu zmiennych
Pamiętamy, że dowolna przestrzeń unormowana jest przestrzenią metryczną z metryką zadaną przez normę przestrzeni . Stąd też definicja ekstremum funkcji o wartościach rzeczywistych określonej na przestrzeni unormowanej jest taka sama jak w przypadku przestrzeni metrycznej, czyli funkcja przyjmuje w punkcie minimum lokalne (odpowiednio: maksimum lokalne, ścisłe minimum lokalne, ścisłe maksimum lokalne), jeśli istnieje liczba taka, że zachodzą odpowiednio implikacje:
Minimum funkcji w punkcie nazywamy globalnym, jeśli osiąga w punkcie kres dolny wartości. Jeśli zaś w punkcie funkcja osiąga kres górny, to mówimy, że osiąga w punkcie maksimum globalne.
Sformułujmy wpierw warunek konieczny istnienia ekstremum funkcji .
Twierdzenie 8.4.
Jeśli funkcja różniczkowalna osiąga ekstremum w punkcie zbioru otwartego , to w punkcie tym zeruje się różniczka funkcji , tzn. , gdzie jest dowolnym wektorem
przestrzeni .Dowód 8.4.
Załóżmy, że funkcja osiąga maksimum lokalne w punkcie . Ustalmy pewien wektor , i rozważmy
zacieśnienie funkcji do prostejo kierunku przechodzącej przez punkt . Zacieśnienie to
jest funkcją jednej zmiennej, osiągającą maksimum w . Stąd pochodna w zerze funkcji jest równa zeru. Ale pochodna ta jest tożsama z pochodną kierunkową funkcji w kierunku wektora . Wobec dowolności różniczka .

<applet code="JavaviewModApplet.class" height="400" width="450" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar"> <param name="colors" value="-1:#7e0b9f -0.82:#7e0b9f -0.81:#ce3bf8 -0.64:#ce3bf8 -0.63:#2c4ae5 -0.46:#2c4ae5 -0.45:#2c85e5 -0.28:#2c85e5 -0.27:#2ecca9 -0.10:#2ecca9 -0.09:#2ecc5b 0.09:#2ecc5b 0.10:#97cc2e 0.27:#97cc2e 0.28:#edff27 0.45:#edff27 0.46:#ffba27 0.63:#ffba27 0.64:#ff6e27 0.81:#ff6e27 0.82:#d42555 1:#d42525"> <param name="coloring" value="mathematica"> <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip"> <param name="scale" value="1.0 1.0 0.5">
<param name="shading" value="0.2"> <param name="animation" value="stop">
</applet><div.thumbcaption>Wykres funkcji
Przyjmijmy wobec tego następującą definicję.
Definicja 8.6.
Mówimy, że jest punktem krytycznym funkcji , jeśli należy do dziedziny różniczki funkcji i różniczka zeruje się w tym punkcie, bądź też punkt należy do dziedziny funkcji i nie istnieje różniczka .
Wniosek 8.7.
Jeśli funkcja osiąga ekstremum w punkcie , to punkt ten jest krytyczny.
Implikacja te stanowi warunek konieczny istnienia ekstremum także w przypadku funkcji, od których nie żądamy różniczkowalności w otoczeniu wszystkich punktów dziedziny.
Wzór Taylora umożliwia, podobnie jak w przypadku jednowymiarowym, sformułowanie warunku wystarczającego istnienia ekstremum.
Definicja 8.8.
Niech będzie odwzorowaniem dwuliniowym symetrycznym określonym na , gdzie jest pewną przestrzenią Banacha. Mówimy, że forma
kwadratowajest
- dodatnio określona, jeśli istnieje stała taka, że
- ujemnie określona, jeśli istnieje stała taka, że
- nieujemnie określona, jeśli
- niedodatnio określona, jeśli
- nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie,
ani nieujemnie, ani niedodatnio określona.
Często mówimy też, że odwzorowanie dwuliniowe symetryczne jest dodatnio określone (odpowiednio: ujemnie określone, nieujemnie określone, niedodatnio określone, nieokreślone), jeśli forma kwadratowa jest określona dodatnio (odpowiednio: określona ujemnie, określona nieujemnie, określona niedodatnio, bądź jest nieokreślona).
a) Forma kwadratowa jest dodatnio określona wtedy i tylko wtedy, gdy forma jest ujemnie określona.
b) Forma kwadratowa jest nieujemnie określona wtedy i tylko wtedy, gdy forma jest niedodatnio określona.
c) Forma kwadratowa jest nieokreślona wtedy i tylko wtedy, gdy nieokreślona jest forma .
Korzystając ze wzoru Taylora, wykażemy warunek wystarczający istnienia ekstremum funkcji wielu zmiennych.
Twierdzenie 8.10.
Niech będzie funkcją klasy w otwartym otoczeniu punktu . Załóżmy, że różniczka funkcji w punkcie jest równa zeru.
a) Jeśli druga różniczka jest dodatnio określona, funkcja osiąga ścisłe minimum lokalne w punkcie .
b) Jeśli druga różniczka jest ujemnie określona, funkcja osiąga ścisłe maksimum lokalne w punkcie .
c) Jeśli druga różniczka jest nieokreślona, funkcja
nie osiąga ekstremum w punkcie .Dowód 8.10.
a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce: ) dostajemy równość prawdziwą w otoczeniu punktu na tyle małym, aby odcinek był w nim zawarty.
gdzie jest pewną liczbą. Jeśli forma jest dodatnio określona, to wobec ciągłości drugiej różniczki, również w pewnym małym otoczeniu punktu w punkcie forma jest dodatnio określona. Wobec tego
czyli dla dowolnego niezerowego wektora z pewnego małego otoczenia punktu . Oznacza to, że funkcja osiąga w tym punkcie ścisłe minimum lokalne.
b) Podobnie jak w punkcie a) wykazujemy, że funkcja osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie określona w punkcie, w którym zeruje się jej pierwsza różniczka.
c) Jeśli druga różniczka jest nieokreślona, to istnieją dwa wektory takie, że natomiast . Jeśli więc zacieśnimy funkcję do prostej o
kierunku :to na prostej tej w pewnym małym otoczeniu punktu (dla bliskich zeru) otrzymamy nierówność:
natomiast na prostej o kierunku :
dostaniemy, podobnie w małym otoczeniu punktu , nierówność przeciwną:
Stąd funkcja nie osiąga w punkcie żadnego ekstremum, gdyż w dowolnie małym otoczeniu punktu przyjmuje zarówno wartości mniejsze, jak i większe od .

Przykład 8.12.
Funkcja osiąga w
punkcie ścisłe minimum lokalne równe zeru, gdyż dla
dowolnego punktu mamy .
Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka funkcji w punkcie zerują się. W szczególności druga różniczka jest nieujemnie określona w każdym punkcie płaszczyzny , gdyż dla dowolnego wektora mamy
W szczególności
Przykład 8.13.
Funkcja osiąga w punkcie ścisłe maksimum lokalne równe zeru, gdyż dla dowolnego punktu mamy .
Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie zarówno pierwsza jak i druga różniczka funkcji w punkcie zerują się. W szczególności druga różniczka jest niedodatnio określona w każdym punkcie płaszczyzny , gdyż dla dowolnego wektora mamy
W szczególności
Przykład 8.14.
Funkcja nie osiąga w punkcie żadnego ekstremum, gdyż dla dowolnego punktu mamy , natomiast w punktach mamy z kolei .
Zwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji zerują się w punkcie . W punktach , tj. poza początkiem układu współrzędnych, druga różniczka
jest nieokreślona, bo w punktach forma kwadratowa jest dodatnia, a w punktach
jest ujemna. W samym zaś punkcie forma kwadratowajest zerowa. Analiza formy kwadratowej w otoczeniu punktu pozwala nam jednak dostrzec, że zacieśnienie funkcji do prostej (tj. w punktach postaci ) jest funkcją , która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej (czyli w punktach postaci ) funkcja osiąga maksimum w punkcie . Stąd funkcja nie osiąga żadnego ekstremum w punkcie .
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/4/47/Am2w08.0120.mgs.zip"> <param name="scale" value="1.0 1.0 0.05">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>
<div.thumbcaption>Wykres funkcji
Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności drugiej różniczki w przpadku funkcji wielu zmiennych.
Niech , , będzie macierzą kwadratową symetryczną (tzn. dla dowolnych ). Niech
będzie minorem głównym rzędu macierzy , .
Twierdzenie 8.15. [twierdzenie Sylvestera]
Forma kwadratowa zadana przez symetryczną macierz kwadratową , , jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie minory główne macierzy są dodatnie, tzn.
dla dowolnego .Dowód 8.15.
Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz będzie złożona z jednej liczby . Należy zauważyć, że forma jest dodatnio określona wtedy i tylko wtedy, gdy . Następnie dowodzi się implikacji, że z dodatniej określoności formy zadanej przez macierz , wobec założenia o dodatniości minora , , wynika dodatnia określoność formy kwadratowej zadanej przez macierz . Szczegóły (które pomijamy) można znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,
Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.)
Ponieważ forma kwadratowa jest ujemnie określona wtedy i tylko wtedy, gdy jest dodatnio określona, twierdzenie Sylvestera pozwala nam również stwierdzić, kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy mianowicie
Wniosek 8.16.
Jeśli , jest symetryczną macierzą kwadratową, to forma kwadratowa
jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego są dodatnie, tzn. gdy
Przykład 8.17.
Wyznaczmy ekstrema funkcji
Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań
Układ ten spełniają współrzędne pięciu punktów
Łatwo zauważyć, że w punkcie funkcja nie osiąga ekstremum, gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno wartości mniejsze jak i większe od . Na przykład na prostej o kierunku (1,1,1) przechodzącej przez punkt
, tj. na zbiorzefunkcja
przyjmuje w otoczeniu zera zarówno dodatnie wartości (np. gdy ) jak i ujemne (np. gdy ). W pozostałych czterech punktach macierz drugich pochodnych cząstkowych, która zadaje drugą różniczkę
jest dodatnio określona. Na przykład w punkcie macierz drugich pochodnych cząstkowych funkcji
ma wszystkie minory główne dodatnie:
Stąd w punkcie funkcja osiąga minimum lokalne równe . Podobne uzasadnienie prowadzi do wniosku, że także w pozostałych punktach , oraz funkcja osiąga minima lokalne.
Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie zrezygnować z analizy określoności drugiej różniczki. Punkty leżą we wnętrzu zbioru ograniczonego poziomicą zerową funkcji , precyzyjniej: leżą w obszarze, gdzie funkcja
jest ujemna. Ponieważ zbiórjest zwarty (gdyż jest domknięty i ograniczony), funkcja , na mocy twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech punktach osiągać minima lokalne.
Uwagi o wyznaczaniu ekstremów funkcji wielu zmiennych
Badanie funkcji wielu zmiennych (w szczególności znajdywanie punktów ekstremalnych) w wielu przypadkach nie wymaga wyznaczania ani pierwszej, ani drugiej różniczki funkcji. Można bowiem sprowadzić ich badanie do badania funkcji jednej zmiennej.
Rozważmy kilka przykładów, w których funkcja dwóch zmiennych jest w istocie funkcją jednej zmiennej, a mianowicie: jest funkcją odległości od początku układu współrzędnych.
Przykład 8.18.
Funkcja jest
funkcją promienia , gdyż ,
gdzie . Ponieważ funkcja
osiąga wartość największą w punkcie i nie osiąga żadnych
więcej ekstremów na półprostej , więc jedynym
ekstremum funkcji jest maksimum lokalne
osiągane w punkcie (tj. ). Wówczas .
wykres
Przykład 8.19.
Funkcja także jest funkcją promienia . Zauważmy bowiem, że
osiąga ekstrema w tych samych punktach, co funkcja , a więc osiąga maksima w punktach i minima w punktach , gdzie . Innymi słowy funkcja osiąga maksima w punktach należących do okręgów o równaniach
oraz w punkcie (wtedy ), a minima w punktach należących do okręgów
gdzie jest dowolną liczbą całkowitą nieujemną.
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/c/c6/Am2w08.0010.mgs.zip"> <param name="scale" value="1.0 1.0 1.0">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>
<div.thumbcaption>Wykres funkcji
Przykład 8.20.
Podobnie jak w poprzednim przykładzie funkcja , , osiąga maksima na okręgach o promieniach takich, ze , czyli na okręgach
natomiast minima na okręgach, których promień spełnia równanie , tj. na okręgach
gdzie jest nieujemną liczbą całkowitą.
wykres
Przykład 8.21.
Także funkcja jest funkcją promienia
. Ponieważ funkcja jest ściśle rosnąca, osiąga minimum w punkcie .
Stąd także funkcja osiąga minimum w
punkcie (wówczas ).
wykres
Również w wielu innych przykładach, gdy funkcja nie jest funkcją promienia, można uniknąć stosowania rachunku różniczkowego do wyznaczenia ekstremów.
Przykład 8.22.
Funkcja osiąga maksima w punktach hiperbol
a minima w punktach drugiej rodziny hiperbol
gdzie jest liczbą całkowitą.
wykres
Przykład 8.23.
Z kolei funkcja osiąga maksima w punktach hiperbol
a minima w punktach drugiej rodziny hiperbol
gdzie jest liczbą całkowitą.
wykres
Przypomnijmy także, że prosta obserwacja przebiegu poziomic pozwala stwierdzić, że
(a) funkcja osiąga w punkcie minimum
wykres
(b) w tym samym punkcie funkcja osiąga maksimum
wykres
(c) a funkcja nie osiąga w punkcie
żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w
dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak
i większe od zera.
wykres
Przykład 8.25.
Zauważmy, że każda z trzech funkcji a, b, c ma w punkcie zerową zarówno pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu punktu zarówno wartości mniejsze jak i większe od zera.
(a)
wykres
(b)
wykres
(c)
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/1/10/Am2w08.0130.mgs.zip"> <param name="scale" value="1.0 1.0 0.1">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet> <div.thumbcaption>Wykres funkcji
Należy pamiętać o analizowaniu otoczenia punktów krytycznych funkcji, w których o istnieniu ekstremów nie rozstrzyga warunek wystarczający.
Przykład 8.26.
Funkcja jest ciągła na całej płaszczyźnie, nie jest jednak różniczkowalna w punktach należących do dwóch prostych: oraz . Różniczka tej funkcji nie zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema prostymi , . Stąd zbiorem punktów krytycznych jest suma obu prostych:
Łatwo zauważyć, że jedynie w punkcie tego zbioru funkcja
osiąga ekstremum, a mianowicie minimum .
wykres