Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Chojna (dyskusja | edycje)
Nie podano opisu zmian
m Zastępowanie tekstu – „.↵</math>” na „</math>”
 
(Nie pokazano 83 wersji utworzonych przez 5 użytkowników)
Linia 9: Linia 9:
==Wzór Taylora dla funkcji wielu zmiennych==
==Wzór Taylora dla funkcji wielu zmiennych==


Niech <math>\displaystyle f:X\mapsto Y</math> będzie funkcją klasy <math>\displaystyle C^{m+1}</math> określoną na
Niech <math>f:X\mapsto Y</math> będzie funkcją klasy <math>C^{m+1}</math> określoną na
otwartym podzbiorze <math>\displaystyle U</math> przestrzeni Banacha <math>\displaystyle X</math> o wartościach w
otwartym podzbiorze <math>U</math> przestrzeni Banacha <math>X</math> o wartościach w
przestrzeni Banacha <math>\displaystyle Y</math>. Podobnie jak w przypadku funkcji jednej
przestrzeni Banacha <math>Y</math>. Podobnie jak w przypadku funkcji jednej
zmiennej rzeczywistej zachodzi następujące
zmiennej rzeczywistej zachodzi następujące


{{twierdzenie|8.1. [twierdzenie Taylora]||
{{twierdzenie|8.1. [twierdzenie Taylora]||
Dla dowolnych punktów <math>\displaystyle a</math> oraz <math>\displaystyle a+h</math> zbioru <math>\displaystyle U</math> takich, że odcinek <center><math>\displaystyle \{a+th, \
Dla dowolnych punktów <math>a</math> oraz <math>a+h</math> zbioru <math>U</math> takich, że odcinek <center><math>\{a+th,  
t\in [0,1]\}\subset U,</math></center>
t\in [0,1]\}\subset U</math>,</center>
zachodzi równość
zachodzi równość
<center><math>\displaystyle f(a+h)=f(a)+d_a f(h)+\frac{1}{2!}d^2_a f(h,h)+\frac{1}{3!}d^3_a
<center><math>f(a+h)=f(a)+d_a f(h)+\frac{1}{2!}d^2_a f(h,h)+\frac{1}{3!}d^3_a
f(h,h,h)+\dots+\frac{1}{m!}d^m_a f\underbrace{(h,h,\dots, h)}_{m
f(h,h,h)+\dots+\frac{1}{m!}d^m_a f\underbrace{(h,h,\dots, h)}_{m
\text{ wektorów } h} +R_m f(a, h), </math></center>
\text{ wektorów } h} +R_m f(a, h)</math></center>
gdzie <center><math>\displaystyle \|R_m
gdzie <center><math>\|R_m
f(a,b)\|_{y}\leq \frac{1}{(m+1)!}\sup\{|d^{m+1} _{a+th}(h,h,
f(a,b)\|_{y}\leq \frac{1}{(m+1)!}\sup\{|d^{m+1} _{a+th}(h,h,
\dots, h)|, \ t\in[0,1]\}.</math></center>
\dots, h)|, \ t\in[0,1]\}</math>.</center>


}}
}}


{{definicja|8.2.||
{{definicja|8.2.||
Funkcję <center><math>\displaystyle \aligned X\in h\mapsto T_a^m
Funkcję <center><math>\begin{align} X\in h\mapsto T_a^m
f(h) &= f(a)+d_a f(h)+\frac{1}{2!}d^2 _a
f(h) &= f(a)+d_a f(h)+\frac{1}{2!}d^2 _a
f(h,h)+\dots+\frac{1}{m!}d^m _a f\underbrace{(h, h, \dots, h)}_{m
f(h,h)+\dots+\frac{1}{m!}d^m _a f\underbrace{(h, h, \dots, h)}_{m
\text{ razy }}\\&= \sum_{k=0}^m \frac{1}{k!}d^k_a\underbrace{(h,
\text{ razy }}\\&= \sum_{k=0}^m \frac{1}{k!}d^k_a\underbrace{(h,
h, \dots, h)}_{k \text{ razy }}\in Y\endaligned </math></center>
h, \dots, h)}_{k \text{ razy }}\in Y\end{align}</math></center>
nazywamy
nazywamy '''''wielomianem Taylora rzędu <math>m</math> funkcji <math>f</math> o środku w punkcie <math>a</math>'''''. }}
'''''wielomianem Taylora rzędu <math>\displaystyle m</math> funkcji <math>\displaystyle f</math> o środku w punkcie
<math>\displaystyle a</math>'''''. }}


{{uwaga|8.3.||
{{uwaga|8.3.||
Zauważmy, że jeśli <math>\displaystyle X=\mathbb{R}^n</math> i <math>\displaystyle Y=\mathbb{R}</math>,
Zauważmy, że jeśli <math>X=\mathbb{R}^n</math> i <math>Y=\mathbb{R}</math>,
to wielomian Taylora funkcji <math>\displaystyle f: \mathbb{R}^n\mapsto \mathbb{R}</math> rzędu <math>\displaystyle m</math> o
to wielomian Taylora funkcji <math>f: \mathbb{R}^n\mapsto \mathbb{R}</math> rzędu <math>m</math> o
środku w punkcie <math>\displaystyle a</math> można wyrazić za pomocą pochodnych
środku w punkcie <math>a</math> można wyrazić za pomocą pochodnych
cząstkowych funkcji <math>\displaystyle f</math> w następujący sposób:
cząstkowych funkcji <math>f</math> w następujący sposób:
<center><math>\displaystyle  \aligned T_a^m f(h)&=\sum_{k=0}^m
<center><math>\begin{align} T_a^m f(h)&=\sum_{k=0}^m
\frac{1}{k!}\sum_{|\alpha|=k}\binom{k}{\alpha}\frac{\partial^k}{\partial
\frac{1}{k!}\sum_{|\alpha|=k}\binom{k}{\alpha}\frac{\partial^k}{\partial
x^\alpha}f(a)h^\alpha \\&=\sum_{k=0}^m
x^\alpha}f(a)h^\alpha \\&=\sum_{k=0}^m
Linia 50: Linia 48:
\sum_{|\alpha|\leq
\sum_{|\alpha|\leq
m}\frac{1}{\alpha!}\frac{\partial^{|\alpha|}}{\partial
m}\frac{1}{\alpha!}\frac{\partial^{|\alpha|}}{\partial
x^\alpha}f(a)h^\alpha  ,\endaligned </math></center>
x^\alpha}f(a)h^\alpha  ,\end{align}</math></center>
gdzie <math>\displaystyle \alpha=(\alpha_1,
gdzie <math>\alpha=(\alpha_1,
\alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n</math> jest <math>\displaystyle n</math>-wskaźnikiem o
\alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n</math> jest <math>n</math>-wskaźnikiem o
długości <math>\displaystyle |\alpha|=\alpha_1+\alpha_2+\dots+\alpha_n</math>. (Oznaczenia:
długości <math>|\alpha|=\alpha_1+\alpha_2+\dots+\alpha_n</math>. (Oznaczenia:
<math>\displaystyle \alpha!</math>, <math>\displaystyle h^\alpha</math>, <math>\displaystyle \frac{\partial^k }{\partial x^\alpha}</math>
<math>\alpha!</math>, <math>h^\alpha</math>, <math>\frac{\partial^k }{\partial x^\alpha}</math>
wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W
wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W
szczególnym (ale bardzo często spotykanym) przypadku funkcji <math>\displaystyle f:
szczególnym (ale bardzo często spotykanym) przypadku funkcji <math>f:
\mathbb{R}^2\ni (x_1, x_2)\mapsto f(x_1, x_2)\in \mathbb{R}</math> dwóch zmiennych
\mathbb{R}^2\ni (x_1, x_2)\mapsto f(x_1, x_2)\in \mathbb{R}</math> dwóch zmiennych
<math>\displaystyle x_1, x_2</math>  wielomian Taylora o środku w punkcie <math>\displaystyle a=(a_1, a_2)\in
<math>x_1, x_2</math>  wielomian Taylora o środku w punkcie <math>a=(a_1, a_2)\in
\mathbb{R}^2</math> przyjmuje postać
\mathbb{R}^2</math> przyjmuje postać
<center><math>\displaystyle \aligned T_a ^m f(h)&=\sum_{k=0}^m \sum_{\alpha_1+\alpha_2=k}
<center><math>\begin{align} T_a ^m f(h)&=\sum_{k=0}^m \sum_{\alpha_1+\alpha_2=k}
\frac{1}{\alpha_1 !\alpha_2 !}\frac{\partial^k f(a)}{\partial
\frac{1}{\alpha_1 !\alpha_2 !}\frac{\partial^k f(a)}{\partial
x_1^{\alpha_1}\partial
x_1^{\alpha_1}\partial
Linia 67: Linia 65:
!}\frac{\partial^{\alpha_1+\alpha_2} f(a)}{\partial
!}\frac{\partial^{\alpha_1+\alpha_2} f(a)}{\partial
x_1^{\alpha_1}\partial
x_1^{\alpha_1}\partial
x_2^{\alpha_2}}h_1^{\alpha_1}h_2^{\alpha_2},\endaligned </math></center>
x_2^{\alpha_2}}h_1^{\alpha_1}h_2^{\alpha_2},\end{align}</math></center>
gdzie
gdzie
<math>\displaystyle h=(h_1, h_2)\in \mathbb{R}^2</math>.
<math>h=(h_1, h_2)\in \mathbb{R}^2</math>.


}}
}}


{{dowod|8.3.||
{{dowod|8.3.||
Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy <math>\displaystyle f:
Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy <math>f:
X\supset U\mapsto \mathbb{R}</math> jest funkcją o wartościach rzeczywistych,
X\supset U\mapsto \mathbb{R}</math> jest funkcją o wartościach rzeczywistych,
określoną na otwartym podzbiorze <math>\displaystyle U</math> przestrzeni Banacha <math>\displaystyle X</math>.
określoną na otwartym podzbiorze <math>U</math> przestrzeni Banacha <math>X</math>.
Niech, zgodnie z założeniem, <math>\displaystyle a</math> oraz <math>\displaystyle a+h</math> będą takimi
Niech, zgodnie z założeniem, <math>a</math> oraz <math>a+h</math> będą takimi
punktami zbioru <math>\displaystyle U</math>, że odcinek <math>\displaystyle \{a+th, 0\leq t\leq 1\}\subset
punktami zbioru <math>U</math>, że odcinek <math>\{a+th, 0\leq t\leq 1\}\subset
U</math>. Rozważmy funkcję <center><math>\displaystyle g:(0-\epsilon, 1+\epsilon)\ni t\mapsto
U</math>. Rozważmy funkcję <center><math>g:(0-\epsilon, 1+\epsilon)\ni t\mapsto
f(a+th)\in\mathbb{R}</math></center>
f(a+th)\in\mathbb{R}</math></center>
określoną w pewnym otoczeniu otwartym odcinka
określoną w pewnym otoczeniu otwartym odcinka
<math>\displaystyle [0,1]</math>. Funkcja <math>\displaystyle g</math> jest w tym zbiorze klasy <math>\displaystyle C^{m+1}</math>, gdyż <math>\displaystyle f</math>
<math>[0,1]</math>. Funkcja <math>g</math> jest w tym zbiorze klasy <math>C^{m+1}</math>, gdyż <math>f</math>
jest tej klasy w otoczeniu odcinka <math>\displaystyle \{a+th, \ 0\leq t\leq
jest tej klasy w otoczeniu odcinka <math>\{a+th, \ 0\leq t\leq
1\}\subset U</math>. Ponadto z twierdzenia o różniczkowaniu złożenia
1\}\subset U</math>. Ponadto z twierdzenia o różniczkowaniu złożenia
funkcji  mamy dla dowolnej liczby <math>\displaystyle 0\leq t\leq 1</math> równość
funkcji  mamy dla dowolnej liczby <math>0\leq t\leq 1</math> równość
<center><math>\displaystyle \frac{d^k}{dt^k}g(0)=d^k_a f\circ
<center><math>\frac{d^k}{dt^k}g(0)=d^k_a f\circ
\underbrace{(d_0 (a+th), d_0 (a+th), \dots, d_0 (a+th))}_{k \text{
\underbrace{(d_0 (a+th), d_0 (a+th), \dots, d_0 (a+th))}_{k \text{ razy}} =d^k_a f\underbrace{(h, h, \dots, h)}_{k \text{ razy}}</math>.</center>
razy}} =d^k_a f\underbrace{(h, h, \dots, h)}_{k \text{ razy}}.</math></center>


Ze twierdzenia Taylora dla funkcji jednej zmiennej <math>\displaystyle g</math> oraz z
Ze twierdzenia Taylora dla funkcji jednej zmiennej <math>g</math> oraz z
powyższej równości mamy
powyższej równości mamy
<center><math>\displaystyle \aligned
<center><math>\begin{align}
f(a+h)=&g(0+1)\\&=g(0)+g'(0)1+\frac{1}{2!}g''(0)1^2+\dots+\frac{1}{m!}g^{(m)}(0)1^m+\frac{1}{(m+1)!}g^{(m+1)}(0+\theta
f(a+h)=&g(0+1)\\&=g(0)+g'(0)1+\frac{1}{2!}g''(0)1^2+\dots+\frac{1}{m!}g^{(m)}(0)1^m+\frac{1}{(m+1)!}g^{(m+1)}(0+\theta
\cdot 1)1^{m+1}\\&=f(a)+d_a f(h)+\frac{1}{2!}d^2_a
\cdot 1)1^{m+1}\\&=f(a)+d_a f(h)+\frac{1}{2!}d^2_a
f(h,h)+\dots+\frac{1}{m!}d^m_a f(h,h,\dots,
f(h,h)+\dots+\frac{1}{m!}d^m_a f(h,h,\dots,
h)+\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h,
h)+\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h,
h),\endaligned
h),\end{align}
</math></center>
</math></center>
gdzie <math>\displaystyle \theta\in (0,1)</math> jest pewnym punktem pośrednim. Stąd
gdzie <math>\theta\in (0,1)</math> jest pewnym punktem pośrednim. Stąd
mamy też oszacowanie reszty we wzorze Taylora:
mamy też oszacowanie reszty we wzorze Taylora:
<center><math>\displaystyle |R_m f (a,h)|=\bigg|\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h,
<center><math>|R_m f (a,h)|=\bigg|\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h,
h\bigg|\leq \frac{1}{(m+1)!}\sup\{|d^{m+1}_{a+\theta h}
h\bigg|\leq \frac{1}{(m+1)!}\sup\{|d^{m+1}_{a+\theta h}
f(h,h,\dots, h, h)|, 0\leq \theta\leq 1\}.
f(h,h,\dots, h, h)|, 0\leq \theta\leq 1\}</math></center>
</math></center>


}}
}}
Linia 111: Linia 107:


Pamiętamy, że
Pamiętamy, że
dowolna przestrzeń unormowana <math>\displaystyle X</math> jest przestrzenią metryczną z
dowolna przestrzeń unormowana <math>X</math> jest przestrzenią metryczną z
metryką <math>\displaystyle d(x,y)=\|x-y\|</math> zadaną przez normę <math>\displaystyle \|\cdot \|</math>
metryką <math>d(x,y)=\|x-y\|</math> zadaną przez normę <math>\|\cdot \|</math>
przestrzeni <math>\displaystyle X</math>. Stąd też definicja ekstremum funkcji <math>\displaystyle f: X\mapsto
przestrzeni <math>X</math>. Stąd też definicja ekstremum funkcji <math>f: X\mapsto
\mathbb{R}</math> o wartościach rzeczywistych określonej na przestrzeni
\mathbb{R}</math> o wartościach rzeczywistych określonej na przestrzeni
unormowanej jest taka sama jak w przypadku przestrzeni metrycznej,
unormowanej jest taka sama jak w przypadku przestrzeni metrycznej,
czyli funkcja <math>\displaystyle f</math> przyjmuje w punkcie <math>\displaystyle a\in \mathrm{dom}\, f</math> '''''minimum
czyli funkcja <math>f</math> przyjmuje w punkcie <math>a\in \mathrm{dom}\, f</math> '''''minimum
lokalne''''' (odpowiednio: '''''maksimum lokalne''''', '''''ścisłe minimum
lokalne''''' (odpowiednio: '''''maksimum lokalne''''', '''''ścisłe minimum
lokalne''''', '''''ścisłe maksimum lokalne'''''), jeśli istnieje liczba
lokalne''''', '''''ścisłe maksimum lokalne'''''), jeśli istnieje liczba
<math>\displaystyle \delta
<math>\delta
>0</math> taka, że zachodzą odpowiednio  implikacje:
>0</math> taka, że zachodzą odpowiednio  implikacje:


<center><math>\displaystyle d(x, a)<\delta\implies f(x)\geq f(a)</math></center>
<center><math>d(x, a)<\delta\implies f(x)\geq f(a)</math></center>


<center><math>\displaystyle d(x, a)<\delta \implies f(x)\leq f(a)</math></center>
<center><math>d(x, a)<\delta \implies f(x)\leq f(a)</math></center>


<center><math>\displaystyle 0<d(x,a)<\delta \implies f(x)>f(a)</math></center>
<center><math>0<d(x,a)<\delta \implies f(x)>f(a)</math></center>


<center><math>\displaystyle 0<d(x,a)<\delta \implies f(x)<f(a).</math></center>
<center><math>0<d(x,a)<\delta \implies f(x)<f(a)</math>.</center>


Minimum funkcji w punkcie <math>\displaystyle a</math> nazywamy globalnym, jeśli <math>\displaystyle f</math> osiąga
Minimum funkcji w punkcie <math>a</math> nazywamy globalnym, jeśli <math>f</math> osiąga
w punkcie <math>\displaystyle a</math> kres dolny wartości. Jeśli zaś w punkcie <math>\displaystyle a</math> funkcja
w punkcie <math>a</math> kres dolny wartości. Jeśli zaś w punkcie <math>a</math> funkcja
osiąga kres górny, to mówimy, że osiąga w punkcie <math>\displaystyle a</math> maksimum
osiąga kres górny, to mówimy, że osiąga w punkcie <math>a</math> maksimum
globalne.
globalne.


Sformułujmy wpierw '''''warunek konieczny''''' istnienia ekstremum
Sformułujmy wpierw '''''warunek konieczny''''' istnienia ekstremum
funkcji <math>\displaystyle f</math>.
funkcji <math>f</math>.


{{twierdzenie|8.4.||
{{twierdzenie|8.4.||
Jeśli funkcja różniczkowalna <math>\displaystyle f:
Jeśli funkcja różniczkowalna <math>f:
X\subset U\mapsto \mathbb{R}</math> osiąga ekstremum w punkcie <math>\displaystyle a</math> zbioru
X\subset U\mapsto \mathbb{R}</math> osiąga ekstremum w punkcie <math>a</math> zbioru
otwartego <math>\displaystyle U</math>, to w punkcie tym zeruje się różniczka funkcji <math>\displaystyle f</math>,
otwartego <math>U</math>, to w punkcie tym zeruje się różniczka funkcji <math>f</math>,
tzn. <math>\displaystyle d_a f(h)=0</math>, gdzie <math>\displaystyle h\in X</math> jest dowolnym wektorem
tzn. <math>d_a f(h)=0</math>, gdzie <math>h\in X</math> jest dowolnym wektorem
przestrzeni <math>\displaystyle X</math>. }}
przestrzeni <math>X</math>. }}


{{dowod|8.4.||
{{dowod|8.4.||
Załóżmy, że funkcja <math>\displaystyle f</math> osiąga maksimum lokalne w punkcie
Załóżmy, że funkcja <math>f</math> osiąga maksimum lokalne w punkcie
<math>\displaystyle a\in U</math>. Ustalmy pewien wektor <math>\displaystyle h\in X</math>, <math>\displaystyle \|h\|=1</math> i rozważmy
<math>a\in U</math>. Ustalmy pewien wektor <math>h\in X</math>, <math>\|h\|=1</math> i rozważmy
zacieśnienie funkcji <math>\displaystyle f</math> do prostej <center><math>\displaystyle \{a+th, t\in\mathbb{R}\}</math></center>
zacieśnienie funkcji <math>f</math> do prostej <center><math>\{a+th, t\in\mathbb{R}\}</math></center>
o
o
kierunku <math>\displaystyle h</math> przechodzącej przez punkt <math>\displaystyle a</math>. Zacieśnienie to
kierunku <math>h</math> przechodzącej przez punkt <math>a</math>. Zacieśnienie to
<center><math>\displaystyle \mathbb{R}\ni t\to f(a+th)\in \mathbb{R}</math></center>
<center><math>\mathbb{R}\ni t\to f(a+th)\in \mathbb{R}</math></center>
jest funkcją jednej zmiennej,
jest funkcją jednej zmiennej,
osiągającą maksimum w <math>\displaystyle t=0</math>. Stąd pochodna w zerze funkcji
osiągającą maksimum w <math>t=0</math>. Stąd pochodna w zerze funkcji
<math>\displaystyle t\mapsto f(a+th)</math> jest równa zeru. Ale pochodna ta jest tożsama z
<math>t\mapsto f(a+th)</math> jest równa zeru. Ale pochodna ta jest tożsama z
pochodną kierunkową funkcji <math>\displaystyle f</math> w kierunku wektora <math>\displaystyle h</math>. Wobec
pochodną kierunkową funkcji <math>f</math> w kierunku wektora <math>h</math>. Wobec
dowolności <math>\displaystyle h</math> różniczka <math>\displaystyle d_a f=0</math>.
dowolności <math>h</math> różniczka <math>d_a f=0</math>.


}}
}}


{{uwaga|8.5.||
{{uwaga|8.5.||
Zwróćmy uwagę, że funkcja może osiągać
Zwróćmy uwagę, że funkcja może osiągać ekstremum w punkcie, w którym nie jest różniczkowalna. Na przykład <math>f(x,y)=|x|+|y|</math> osiąga wartość minimalną w punkcie <math>(0,0)</math>, w którym nie jest różniczkowalna.}}
ekstremum w punkcie, w którym nie jest różniczkowalna. Na przykład
 
<math>\displaystyle f(x,y)=|x|+|y|</math> osiąga wartość minimalną w punkcie <math>\displaystyle (0,0)</math>, w
<br>
którym nie jest różniczkowalna.}}
<center>
<center>
<applet code="applet.class" archive="images/a/a0/Javaview.jar,images/e/e1/Applet.jar" width="456" height="406">
<div class="thumb"><div style="width:450px;">
     <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
  <applet code="JavaviewModApplet.class" height="400" width="450" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar">
     <param name="coloring" value="maple">
     <param name="colors" value="-1:#7e0b9f -0.82:#7e0b9f -0.81:#ce3bf8 -0.64:#ce3bf8 -0.63:#2c4ae5 -0.46:#2c4ae5 -0.45:#2c85e5 -0.28:#2c85e5 -0.27:#2ecca9 -0.10:#2ecca9 -0.09:#2ecc5b 0.09:#2ecc5b 0.10:#97cc2e 0.27:#97cc2e 0.28:#edff27 0.45:#edff27 0.46:#ffba27 0.63:#ffba27 0.64:#ff6e27 0.81:#ff6e27 0.82:#d42555 1:#d42525">
     <param name="coloring" value="mathematica">
     <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip">
     <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip">
     <param name="scale" value="1.0 1.0 0.1">
     <param name="scale" value="1.0 1.0 0.5">
    <param name="shading" value="0.2">
<param name="shading" value="0.2">
</applet>
<param name="animation" value="stop">
  </applet>
<div.thumbcaption>Wykres funkcji <math>f(x,y)=|x|+|y|</math></div>
</div></div>
</center>
</center>
<br>


Przyjmijmy wobec tego następującą definicję.
Przyjmijmy wobec tego następującą definicję.<br>


{{definicja|8.6.||
{{definicja|8.6.||
Mówimy, że <math>\displaystyle a\in \mathrm{dom}\, f</math> jest
Mówimy, że <math>a\in \mathrm{dom}\, f</math> jest
'''''punktem krytycznym funkcji <math>\displaystyle f</math>''''', jeśli <math>\displaystyle a</math> należy do
'''''punktem krytycznym funkcji <math>f</math>''''', jeśli <math>a</math> należy do
dziedziny różniczki funkcji <math>\displaystyle f</math> i różniczka zeruje się w tym
dziedziny różniczki funkcji <math>f</math> i różniczka zeruje się w tym
punkcie, bądź też punkt <math>\displaystyle a</math> należy do dziedziny funkcji i nie
punkcie, bądź też punkt <math>a</math> należy do dziedziny funkcji i nie
istnieje różniczka <math>\displaystyle d_a f</math>.
istnieje różniczka <math>d_a f</math>.
 
}}
}}


{{wniosek|8.7.||
{{wniosek|8.7.||
Jeśli funkcja <math>\displaystyle f</math> osiąga ekstremum w
Jeśli funkcja <math>f</math> osiąga ekstremum w
punkcie <math>\displaystyle a\in \mathrm{dom}\, f</math>, to punkt ten jest krytyczny.
punkcie <math>a\in \mathrm{dom}\, f</math>, to punkt ten jest krytyczny.


}}
}}
Linia 200: Linia 199:


{{definicja|8.8.||
{{definicja|8.8.||
Niech <math>\displaystyle A\in L^2(X, \mathbb{R})</math> będzie
Niech <math>A\in L^2(X, \mathbb{R})</math> będzie
odwzorowaniem dwuliniowym symetrycznym  określonym na <math>\displaystyle X\times X</math>,
odwzorowaniem dwuliniowym symetrycznym  określonym na <math>X\times X</math>,
gdzie <math>\displaystyle X</math> jest pewną przestrzenią Banacha. Mówimy, że forma
gdzie <math>X</math> jest pewną przestrzenią Banacha. Mówimy, że forma
kwadratowa <center><math>\displaystyle X\ni h\mapsto A(h,h) </math></center>
kwadratowa <center><math>X\ni h\mapsto A(h,h)</math></center>
jest   
jest   


*'''''dodatnio określona''''', jeśli istnieje stała <math>\displaystyle C>0</math> taka, że
*'''''dodatnio określona''''', jeśli istnieje stała <math>C>0</math> taka, że
<center><math>\displaystyle A(h,h)\geq C\|h\|^2, \text{ dla dowolnego wektora } h \in X,</math></center>
<center><math>A(h,h)\geq C\|h\|^2, \text{ dla dowolnego wektora } h \in X</math>,</center>


* '''''ujemnie określona''''', jeśli istnieje stała <math>\displaystyle C>0</math> taka, że
* '''''ujemnie określona''''', jeśli istnieje stała <math>C>0</math> taka, że
<center><math>\displaystyle A(h,h)\leq - C\|h\|^2, \text{ dla dowolnego wektora } h \in X,</math></center>
<center><math>A(h,h)\leq - C\|h\|^2, \text{ dla dowolnego wektora } h \in X</math>,</center>


* '''''nieujemnie  określona''''', jeśli
* '''''nieujemnie  określona''''', jeśli
<center><math>\displaystyle A(h,h)\geq 0, \text{ dla dowolnego wektora } h \in X,</math></center>
<center><math>A(h,h)\geq 0, \text{ dla dowolnego wektora } h \in X</math>,</center>


* '''''niedodatnio określona''''', jeśli
* '''''niedodatnio określona''''', jeśli
<center><math>\displaystyle A(h,h)\leq 0, \text{ dla dowolnego wektora } h \in X,</math></center>
<center><math>A(h,h)\leq 0, \text{ dla dowolnego wektora } h \in X</math>,</center>


* '''''nieokreślona''''', jeśli nie jest ani dodatnio, ani ujemnie,
* '''''nieokreślona''''', jeśli nie jest ani dodatnio, ani ujemnie,
ani nieujemnie, ani niedodatnio określona.
ani nieujemnie, ani niedodatnio określona.


Często mówimy też, że odwzorowanie dwuliniowe symetryczne <math>\displaystyle A\in
Często mówimy też, że odwzorowanie dwuliniowe symetryczne <math>A\in
L^2 (X, \mathbb{R})</math> jest '''''dodatnio określone''''' (odpowiednio:
L^2 (X, \mathbb{R})</math> jest '''''dodatnio określone''''' (odpowiednio:
'''''ujemnie określone''''', '''''nieujemnie określone''''',
'''''ujemnie określone''''', '''''nieujemnie określone''''',
'''''niedodatnio określone''''', '''''nieokreślone'''''), jeśli forma
'''''niedodatnio określone''''', '''''nieokreślone'''''), jeśli forma
kwadratowa <math>\displaystyle h\mapsto A(h,h)</math> jest określona dodatnio (odpowiednio:
kwadratowa <math>h\mapsto A(h,h)</math> jest określona dodatnio (odpowiednio:
określona ujemnie, określona nieujemnie, określona niedodatnio,
określona ujemnie, określona nieujemnie, określona niedodatnio,
bądź jest nieokreślona).
bądź jest nieokreślona).
Linia 232: Linia 231:


{{uwaga|8.9.||
{{uwaga|8.9.||
a) Forma kwadratowa <math>\displaystyle h\mapsto A(h,h)</math>
a) Forma kwadratowa <math>h\mapsto A(h,h)</math>
jest dodatnio określona wtedy i tylko wtedy, gdy forma <math>\displaystyle h\mapsto
jest dodatnio określona wtedy i tylko wtedy, gdy forma <math>h\mapsto
-A(h,h)</math> jest ujemnie określona.
-A(h,h)</math> jest ujemnie określona.


b) Forma kwadratowa <math>\displaystyle h\mapsto A(h,h)</math> jest nieujemnie określona
b) Forma kwadratowa <math>h\mapsto A(h,h)</math> jest nieujemnie określona
wtedy i tylko wtedy, gdy forma <math>\displaystyle h\mapsto -A(h,h)</math> jest niedodatnio
wtedy i tylko wtedy, gdy forma <math>h\mapsto -A(h,h)</math> jest niedodatnio
określona.
określona.


c) Forma kwadratowa <math>\displaystyle h\mapsto A(h,h)</math> jest nieokreślona wtedy i
c) Forma kwadratowa <math>h\mapsto A(h,h)</math> jest nieokreślona wtedy i
tylko wtedy, gdy nieokreślona jest forma <math>\displaystyle h\mapsto -A(h,h)</math>.
tylko wtedy, gdy nieokreślona jest forma <math>h\mapsto -A(h,h)</math>.


}}
}}
Linia 249: Linia 248:


{{twierdzenie|8.10.||
{{twierdzenie|8.10.||
Niech <math>\displaystyle f</math> będzie funkcją klasy <math>\displaystyle C^2</math> w
Niech <math>f</math> będzie funkcją klasy <math>C^2</math> w
otwartym otoczeniu <math>\displaystyle U</math> punktu <math>\displaystyle a</math>. Załóżmy, że różniczka funkcji
otwartym otoczeniu <math>U</math> punktu <math>a</math>. Załóżmy, że różniczka funkcji
<math>\displaystyle f</math> w punkcie <math>\displaystyle a</math> jest równa zeru.
<math>f</math> w punkcie <math>a</math> jest równa zeru.


a) Jeśli druga różniczka <math>\displaystyle d^2 _af</math> jest dodatnio określona,
a) Jeśli druga różniczka <math>d^2 _af</math> jest dodatnio określona,
funkcja <math>\displaystyle f</math> osiąga ścisłe minimum lokalne w punkcie <math>\displaystyle a</math>.
funkcja <math>f</math> osiąga ścisłe minimum lokalne w punkcie <math>a</math>.


b) Jeśli druga różniczka <math>\displaystyle d^2 _af</math> jest ujemnie określona, funkcja
b) Jeśli druga różniczka <math>d^2 _af</math> jest ujemnie określona, funkcja
<math>\displaystyle f</math> osiąga ścisłe maksimum lokalne w punkcie <math>\displaystyle a</math>.
<math>f</math> osiąga ścisłe maksimum lokalne w punkcie <math>a</math>.


c) Jeśli druga różniczka <math>\displaystyle d^2 _af</math> jest nieokreślona, funkcja <math>\displaystyle f</math>
c) Jeśli druga różniczka <math>d^2 _af</math> jest nieokreślona, funkcja <math>f</math>
nie osiąga ekstremum w punkcie <math>\displaystyle a</math>. }}
nie osiąga ekstremum w punkcie <math>a</math>. }}


{{dowod|8.10.||
{{dowod|8.10.||
a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce:
a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce:
<math>\displaystyle d_a f=0</math>) dostajemy równość prawdziwą w otoczeniu punktu <math>\displaystyle a</math> na
<math>d_a f=0</math>) dostajemy równość prawdziwą w otoczeniu punktu <math>a</math> na
tyle małym, aby odcinek <math>\displaystyle \{a+th, 0\leq t\leq 1\}</math> był w nim
tyle małym, aby odcinek <math>\{a+th, 0\leq t\leq 1\}</math> był w nim
zawarty.
zawarty.
<center><math>\displaystyle \aligned f(a+h)&=f(a)+d_a f (h)+\frac{1}{2}d^2_{a+\theta h} f(h,h)
<center><math>\begin{align} f(a+h)&=f(a)+d_a f (h)+\frac{1}{2}d^2_{a+\theta h} f(h,h)
\\&=f(a)+0+\frac{1}{2}d^2_{a+\theta h} f(h,h),\endaligned </math></center>
\\&=f(a)+0+\frac{1}{2}d^2_{a+\theta h} f(h,h),\end{align}</math></center>


czyli <center><math>\displaystyle f(a+h)-f(a)=\frac{1}{2}d^2_{a+\theta h} f(h,h),</math></center>
czyli <center><math>f(a+h)-f(a)=\frac{1}{2}d^2_{a+\theta h} f(h,h)</math>,</center>
gdzie
gdzie
<math>\displaystyle 0<\theta <1</math> jest pewną liczbą. Jeśli forma <math>\displaystyle h\mapsto d^2_{a}
<math>0<\theta <1</math> jest pewną liczbą. Jeśli forma <math>h\mapsto d^2_{a}
f(h,h)</math> jest dodatnio określona, to wobec ciągłości drugiej
f(h,h)</math> jest dodatnio określona, to wobec ciągłości drugiej
różniczki, również w pewnym małym otoczeniu punktu <math>\displaystyle a</math> w punkcie
różniczki, również w pewnym małym otoczeniu punktu <math>a</math> w punkcie
<math>\displaystyle a+\theta h</math> forma <math>\displaystyle h\mapsto d^2_{a+\theta h} f(h,h)</math> jest
<math>a+\theta h</math> forma <math>h\mapsto d^2_{a+\theta h} f(h,h)</math> jest
dodatnio określona. Wobec tego
dodatnio określona. Wobec tego
<center><math>\displaystyle f(a+h)-f(a)=\frac{1}{2}d^2_{a+\theta h} f(h,h)>0,</math></center>
<center><math>f(a+h)-f(a)=\frac{1}{2}d^2_{a+\theta h} f(h,h)>0</math>,</center>


czyli <math>\displaystyle f(a+h)>f(a)</math> dla dowolnego niezerowego wektora <math>\displaystyle h</math> z
czyli <math>f(a+h)>f(a)</math> dla dowolnego niezerowego wektora <math>h</math> z
pewnego małego otoczenia punktu <math>\displaystyle 0</math>. Oznacza to, że funkcja <math>\displaystyle f</math>
pewnego małego otoczenia punktu <math>0</math>. Oznacza to, że funkcja <math>f</math>
osiąga w tym punkcie ścisłe minimum lokalne.
osiąga w tym punkcie ścisłe minimum lokalne.


b) Podobnie jak w punkcie a) wykazujemy, że funkcja <math>\displaystyle f</math>
b) Podobnie jak w punkcie a) wykazujemy, że funkcja <math>f</math>
osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie
osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie
określona w punkcie, w którym zeruje się jej pierwsza różniczka.
określona w punkcie, w którym zeruje się jej pierwsza różniczka.


c) Jeśli druga różniczka <math>\displaystyle d^2_a f</math> jest nieokreślona, to istnieją
c) Jeśli druga różniczka <math>d^2_a f</math> jest nieokreślona, to istnieją
dwa wektory <math>\displaystyle h, k\in X</math> takie, że <math>\displaystyle d^2_a f(h,h)>0</math> natomiast
dwa wektory <math>h, k\in X</math> takie, że <math>d^2_a f(h,h)>0</math> natomiast
<math>\displaystyle d^2_a f(k,k)<0</math>. Jeśli więc zacieśnimy funkcję <math>\displaystyle f</math> do prostej o
<math>d^2_a f(k,k)<0</math>. Jeśli więc zacieśnimy funkcję <math>f</math> do prostej o
kierunku <math>\displaystyle h</math>: <center><math>\displaystyle a+\mathbb{R} h=\{a+th, t\in\mathbb{R}\}\subset X,</math></center>
kierunku <math>h</math>: <center><math>a+\mathbb{R} h=\{a+th, t\in\mathbb{R}\}\subset X</math>,</center>
to na
to na
prostej tej w pewnym małym otoczeniu punktu <math>\displaystyle a</math> (dla <math>\displaystyle t</math> bliskich
prostej tej w pewnym małym otoczeniu punktu <math>a</math> (dla <math>t</math> bliskich
zeru) otrzymamy nierówność:
zeru) otrzymamy nierówność:
<center><math>\displaystyle f(a+th)-f(a)=\frac{1}{2}d^2_{a+\theta th} f(th,th)>0, </math></center>
<center><math>f(a+th)-f(a)=\frac{1}{2}d^2_{a+\theta th} f(th,th)>0</math></center>


natomiast na prostej o kierunku <math>\displaystyle k</math>:
natomiast na prostej o kierunku <math>k</math>:
<center><math>\displaystyle a+\mathbb{R} k=\{a+tk, t\in\mathbb{R}\}\subset X,</math></center>
<center><math>a+\mathbb{R} k=\{a+tk, t\in\mathbb{R}\}\subset X</math>,</center>


dostaniemy, podobnie w małym otoczeniu punktu <math>\displaystyle a</math>, nierówność
dostaniemy, podobnie w małym otoczeniu punktu <math>a</math>, nierówność
przeciwną:
przeciwną:
<center><math>\displaystyle f(a+tk)-f(a)=\frac{1}{2}d^2_{a+\theta tk}
<center><math>f(a+tk)-f(a)=\frac{1}{2}d^2_{a+\theta tk}
f(tk,tk)<0. </math></center>
f(tk,tk)<0</math></center>
Stąd funkcja <math>\displaystyle f</math> nie osiąga w punkcie <math>\displaystyle a</math> żadnego
Stąd funkcja <math>f</math> nie osiąga w punkcie <math>a</math> żadnego
ekstremum, gdyż w dowolnie małym otoczeniu punktu <math>\displaystyle a</math> przyjmuje
ekstremum, gdyż w dowolnie małym otoczeniu punktu <math>a</math> przyjmuje
zarówno wartości mniejsze, jak i większe od <math>\displaystyle f(a)</math>.
zarówno wartości mniejsze, jak i większe od <math>f(a)</math>.


}}
}}


{{uwaga|8.11.||
{{uwaga|8.11.||
Twierdzenie nie rozstrzyga o istnieniu
Twierdzenie nie rozstrzyga o istnieniu ekstremum ani o jego typie, gdy druga różniczka <math>d^2 _a f</math> jest niedodatnio lub nieujemnie określona. Rozważmy trzy proste przykłady.}}
ekstremum ani o jego typie, gdy druga różniczka <math>\displaystyle d^2 _a f</math> jest
niedodatnio lub nieujemnie określona. Rozważmy trzy proste
przykłady.}}


{{przyklad|8.12.||
{{przyklad|8.12.||
Funkcja <math>\displaystyle f(x,y)=x^4+y^4</math> osiąga w
Funkcja <math>f(x,y)=x^4+y^4</math> osiąga w
punkcie <math>\displaystyle (0,0)</math> ścisłe minimum lokalne równe zeru, gdyż dla
punkcie <math>(0,0)</math> ścisłe minimum lokalne równe zeru, gdyż dla
dowolnego punktu <math>\displaystyle (x,y)\neq (0,0)</math> mamy <math>\displaystyle f(x,y)>0</math>.
dowolnego punktu <math>(x,y)\neq (0,0)</math> mamy <math>f(x,y)>0</math>.
 
<br>
{ [Rysunek am2w08.0100] Wykres funkcji
<math>\displaystyle f(x,y)=x^4+y^4</math>}


Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka
Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka
funkcji <math>\displaystyle f</math> w punkcie <math>\displaystyle (0,0)</math> zerują się. W szczególności druga
funkcji <math>f</math> w punkcie <math>(0,0)</math> zerują się. W szczególności druga
różniczka jest nieujemnie określona w każdym punkcie płaszczyzny
różniczka jest nieujemnie określona w każdym punkcie płaszczyzny
<math>\displaystyle \mathbb{R}^2</math>, gdyż dla dowolnego wektora <math>\displaystyle h=(h_1, h_2)\in \mathbb{R}^2</math> mamy
<math>\mathbb{R}^2</math>, gdyż dla dowolnego wektora <math>h=(h_1, h_2)\in \mathbb{R}^2</math> mamy
<center><math>\displaystyle d^2_{(x,y)}(h,h)=12(x^2 h_1^2+y^2 h_2^2)\geq 0.</math></center>
<center><math>d^2_{(x,y)}(h,h)=12(x^2 h_1^2+y^2 h_2^2)\geq 0</math>.</center>
W szczególności
W szczególności
<center><math>\displaystyle d^2_{(0,0)}(h,h)=12(0^2 h_1^2+0^2 h_2^2)=0\geq 0.</math></center>
<center><math>d^2_{(0,0)}(h,h)=12(0^2 h_1^2+0^2 h_2^2)=0\geq 0</math>.</center>
 
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.12.|wykres]]
}}
}}


{{przyklad|8.13.||
{{przyklad|8.13.||
Funkcja <math>\displaystyle f(x,y)=-x^4-y^4</math> osiąga w
Funkcja <math>f(x,y)=-x^4-y^4</math> osiąga w
punkcie <math>\displaystyle (0,0)</math> ścisłe maksimum lokalne równe zeru, gdyż dla
punkcie <math>(0,0)</math> ścisłe maksimum lokalne równe zeru, gdyż dla
dowolnego punktu <math>\displaystyle (x,y)\neq (0,0)</math> mamy <math>\displaystyle f(x,y)<0</math>.
dowolnego punktu <math>(x,y)\neq (0,0)</math> mamy <math>f(x,y)<0</math>.
 
{ [Rysunek am2w08.0110] Wykres funkcji
<math>\displaystyle f(x,y)=-x^4-y^4</math>}


Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie
Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie
zarówno pierwsza jak i druga różniczka funkcji <math>\displaystyle f</math> w punkcie
zarówno pierwsza jak i druga różniczka funkcji <math>f</math> w punkcie
<math>\displaystyle (0,0)</math> zerują się. W szczególności druga różniczka jest
<math>(0,0)</math> zerują się. W szczególności druga różniczka jest
niedodatnio określona w każdym punkcie płaszczyzny <math>\displaystyle \mathbb{R}^2</math>, gdyż
niedodatnio określona w każdym punkcie płaszczyzny <math>\mathbb{R}^2</math>, gdyż
dla dowolnego wektora <math>\displaystyle h=(h_1, h_2)\in \mathbb{R}^2</math> mamy
dla dowolnego wektora <math>h=(h_1, h_2)\in \mathbb{R}^2</math> mamy
<center><math>\displaystyle d^2_{(x,y)}(h,h)=-12(x^2 h_1^2+y^2 h_2^2)\leq 0.</math></center>
<center><math>d^2_{(x,y)}(h,h)=-12(x^2 h_1^2+y^2 h_2^2)\leq 0</math>.</center>
W szczególności
W szczególności
<center><math>\displaystyle d^2_{(0,0)}(h,h)=-12(0^2 h_1^2+0^2 h_2^2)=0\leq 0.</math></center>
<center><math>d^2_{(0,0)}(h,h)=-12(0^2 h_1^2+0^2 h_2^2)=0\leq 0</math>.</center>
 
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.13.|wykres]]
}}
}}


{{przyklad|8.14.||
{{przyklad|8.14.||


Funkcja <math>\displaystyle f(x,y)=x^4-y^4</math> nie osiąga w punkcie <math>\displaystyle (0,0)</math> żadnego
Funkcja <math>f(x,y)=x^4-y^4</math> nie osiąga w punkcie <math>(0,0)</math> żadnego ekstremum, gdyż dla dowolnego punktu <math>(x,0)\neq (0,0)</math> mamy <math>f(x,0)>0</math>, natomiast w punktach <math>(0,y)\neq (0,0)</math> mamy z kolei <math>f(0,y)<0</math>.
ekstremum, gdyż dla dowolnego punktu <math>\displaystyle (x,0)\neq (0,0)</math> mamy
<math>\displaystyle f(x,0)>0</math>, natomiast w punktach <math>\displaystyle (0,y)\neq (0,0)</math> mamy z kolei
<math>\displaystyle f(0,y)<0.</math>


{ [Rysunek am2w08.0120] Wykres funkcji
Zwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji <math>f</math> zerują się w punkcie <math>(0,0)</math>. W punktach <math>h=(h_1,h_2)\neq (0,0)</math>, tj. poza początkiem układu współrzędnych, druga różniczka
<math>\displaystyle f(x,y)=x^4-y^4</math>}
<center><math>d^2_{(x,y)}(h,h)=12(x^2 h_1^2-y^2 h_2^2)</math></center>


Zwróćmy uwagę, że podobnie jak w obu poprzednich
jest nieokreślona, bo w punktach <math>(x,0)\neq (0,0)</math> forma kwadratowa <math>h\mapsto d^2_{(x,y)}f</math> jest dodatnia, a w punktach
przykładach zarówno pierwsza jak i druga różniczka funkcji <math>\displaystyle f</math>
<math>(0,y)\neq (0,0)</math> jest ujemna. W samym zaś punkcie <math>(0,0)</math> forma kwadratowa  <center><math>d^2_{(0,0)}(h,h)=12(0^2 h_1^2-0^2 h_2^2)=0</math></center>
zerują się w punkcie <math>\displaystyle (0,0)</math>. W punktach <math>\displaystyle h=(h_1,h_2)\neq (0,0)</math>,
jest zerowa. Analiza formy kwadratowej w otoczeniu punktu <math>(0,0)</math>
tj. poza początkiem układu współrzędnych, druga różniczka
pozwala nam jednak dostrzec, że zacieśnienie funkcji <math>f</math> do
<center><math>\displaystyle d^2_{(x,y)}(h,h)=12(x^2 h_1^2-y^2 h_2^2)</math></center>
prostej <math>y=0</math> (tj. w punktach postaci <math>(x,0)</math>) jest funkcją <math>f(x,0)=x^4</math>, która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej <math>x=0</math> (czyli w punktach postaci <math>(0,y)</math>) funkcja <math>f(0,y)=-y^4</math> osiąga maksimum w punkcie <math>y=0</math>. Stąd funkcja <math>(x,y)\mapsto f(x,y)</math> nie osiąga żadnego ekstremum w punkcie <math>(0,0)</math>.
 
}}
jest nieokreślona, bo w punktach <math>\displaystyle (x,0)\neq (0,0)</math> forma
<br>
kwadratowa <math>\displaystyle h\mapsto d^2_{(x,y)}f</math> jest dodatnia, a w punktach
<center>
<math>\displaystyle (0,y)\neq (0,0)</math> jest ujemna. W samym zaś punkcie <math>\displaystyle (0,0)</math> forma
<div class="thumb"><div style="width:450px;">
kwadratowa  <center><math>\displaystyle d^2_{(0,0)}(h,h)=12(0^2 h_1^2-0^2 h_2^2)=0</math></center>
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
jest
    <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
zerowa. Analiza formy kwadratowej w otoczeniu punktu <math>\displaystyle (0,0)</math>
    <param name="coloring" value="maple">
pozwala nam jednak dostrzec, że zacieśnienie funkcji <math>\displaystyle f</math> do
    <param name="model" value="images/4/47/Am2w08.0120.mgs.zip">
prostej <math>\displaystyle y=0</math> (tj. w punktach postaci <math>\displaystyle (x,0)</math>) jest funkcją
    <param name="scale" value="1.0 1.0 0.05">
<math>\displaystyle f(x,0)=x^4</math>, która na tej prostej osiąga minimum lokalne. Z kolei
<param name="shading" value="0.2">
zacieśnienie do prostej <math>\displaystyle x=0</math> (czyli w punktach postaci <math>\displaystyle (0,y)</math>)
<param name="animation" value="stop">
funkcja <math>\displaystyle f(0,y)=-y^4</math> osiąga maksimum w punkcie <math>\displaystyle y=0</math>. Stąd
</applet>
funkcja <math>\displaystyle (x,y)\mapsto f(x,y)</math> nie osiąga żadnego ekstremum w
<div.thumbcaption>Wykres funkcji <math>f(x,y)=x^4-y^4</math></div>
punkcie <math>\displaystyle (0,0)</math> }}
</div></div>
</center>
<br>


Kolejne twierdzenie, które nazywamy '''''kryterium Sylvestera''''',
Kolejne twierdzenie, które nazywamy '''''kryterium Sylvestera''''',
Linia 386: Linia 376:
funkcji wielu zmiennych.
funkcji wielu zmiennych.


Niech <math>\displaystyle A=[a_{ij}]</math>, <math>\displaystyle i,j=1,2,\dots, n</math>, będzie macierzą kwadratową
Niech <math>A=[a_{ij}]</math>, <math>i,j=1,2,\dots, n</math>, będzie macierzą kwadratową
symetryczną (tzn. <math>\displaystyle a_{ij}=a_{ji}</math> dla dowolnych <math>\displaystyle i,j</math>). Niech
symetryczną (tzn. <math>a_{ij}=a_{ji}</math> dla dowolnych <math>i,j</math>). Niech
<center><math>
<center><math>
\displaystyle A_k :=\det
A_k :=\det
\left[\begin{array}{rrr}
\left[\begin{array}{rrr}
a_{11}&\dots & a_{1k}\\
a_{11}&\dots & a_{1k}\\
Linia 395: Linia 385:
a_{k1}&\dots & a_{kk}\end{array} \right]</math></center>
a_{k1}&\dots & a_{kk}\end{array} \right]</math></center>
będzie '''''minorem
będzie '''''minorem
głównym rzędu <math>\displaystyle k</math>''''' macierzy <math>\displaystyle A</math>, <math>\displaystyle k\in\{1,2,\dots, n\}</math>.
głównym rzędu <math>k</math>''''' macierzy <math>A</math>, <math>k\in\{1,2,\dots, n\}</math>.


{{twierdzenie|8.15. [twierdzenie Sylvestera]||
{{twierdzenie|8.15. [twierdzenie Sylvestera]||
Forma
Forma
kwadratowa <math>\displaystyle \mathbb{R}^n\in h\mapsto \sum_{i=1}^n\sum_{j=1}^n a_{ij}h_i
kwadratowa <math>\mathbb{R}^n\in h\mapsto \sum_{i=1}^n\sum_{j=1}^n a_{ij}h_i
h_j</math> zadana przez symetryczną macierz kwadratową <math>\displaystyle A=[a_{ij}]</math>,
h_j</math> zadana przez symetryczną macierz kwadratową <math>A=[a_{ij}]</math>,
<math>\displaystyle i,j=1,2,\dots, n</math>, jest dodatnio określona wtedy i tylko wtedy,
<math>i,j=1,2,\dots, n</math>, jest dodatnio określona wtedy i tylko wtedy,
gdy wszystkie minory główne macierzy <math>\displaystyle A</math> są dodatnie, tzn. <math>\displaystyle A_k>0</math>
gdy wszystkie minory główne macierzy <math>A</math> są dodatnie, tzn. <math>A_k>0</math>
dla dowolnego <math>\displaystyle k\in\{1,2,\dots, n\}</math>. }}
dla dowolnego <math>k\in\{1,2,\dots, n\}</math>. }}


{{dowod|8.15.||
{{dowod|8.15.||
Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz <math>\displaystyle A</math>
Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz <math>A</math>
będzie złożona z jednej liczby <math>\displaystyle [a_{11}]</math>. Należy zauważyć, że
będzie złożona z jednej liczby <math>[a_{11}]</math>. Należy zauważyć, że
forma <math>\displaystyle h\mapsto a_{11} h^2</math> jest dodatnio określona wtedy i tylko
forma <math>h\mapsto a_{11} h^2</math> jest dodatnio określona wtedy i tylko
wtedy, gdy <math>\displaystyle a_{11}>0</math>. Następnie dowodzi się implikacji, że z
wtedy, gdy <math>a_{11}>0</math>. Następnie dowodzi się implikacji, że z
dodatniej określoności formy zadanej przez macierz
dodatniej określoności formy zadanej przez macierz
<math>\displaystyle \tilde{A}=[a_{ij}]</math>, <math>\displaystyle i,j=1,2,\dots, n-1</math> wobec założenia o
<math>\tilde{A}=[a_{ij}]</math>, <math>i,j=1,2,\dots, n-1</math> wobec założenia o
dodatniości minora <math>\displaystyle A_n =\det[a_{ij}]</math>, <math>\displaystyle i,j=1,2,\dots, n</math>, wynika
dodatniości minora <math>A_n =\det[a_{ij}]</math>, <math>i,j=1,2,\dots, n</math>, wynika
dodatnia określoność formy kwadratowej zadanej przez macierz
dodatnia określoność formy kwadratowej zadanej przez macierz
<math>\displaystyle A=[a_{ij}],\displaystyle i,j=1,2,\dots, n</math>. Szczegóły (które pomijamy) można
<math>A=[a_{ij}],i,j=1,2,\dots, n</math>. Szczegóły (które pomijamy) można
znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski,
znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski,
Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,
Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,
Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.) }}
Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.) }}


Ponieważ forma kwadratowa <math>\displaystyle h\mapsto A(h,h)</math> jest ujemnie określona
Ponieważ forma kwadratowa <math>h\mapsto A(h,h)</math> jest ujemnie określona
wtedy i tylko wtedy, gdy <math>\displaystyle h\mapsto -A(h,h)</math>  jest dodatnio
wtedy i tylko wtedy, gdy <math>h\mapsto -A(h,h)</math>  jest dodatnio
określona, twierdzenie Sylvestera pozwala nam również stwierdzić,
określona, twierdzenie Sylvestera pozwala nam również stwierdzić,
kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy
kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy
Linia 426: Linia 416:


{{wniosek|8.16.||
{{wniosek|8.16.||
Jeśli <math>\displaystyle A=[a_{ij}],\displaystyle i,j=1,2,\dots, n</math>,
Jeśli <math>A=[a_{ij}],i,j=1,2,\dots, n</math>,
jest symetryczną macierzą kwadratową, to forma kwadratowa
jest symetryczną macierzą kwadratową, to forma kwadratowa
<center><math>\displaystyle \mathbb{R}^n\ni h\mapsto \sum_{i=1}^n\sum_{j=1}^n a_{ij}h_i h_j\in
<center><math>\mathbb{R}^n\ni h\mapsto \sum_{i=1}^n\sum_{j=1}^n a_{ij}h_i h_j\in
\mathbb{R}</math></center>
\mathbb{R}</math></center>
jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie
jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie
minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego
minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego
są dodatnie, tzn. gdy
są dodatnie, tzn. gdy
<center><math>\displaystyle (-1)^k A_k>0, \ \ \ k\in\{1,2,\dots, n\}.</math></center>
<center><math>(-1)^k A_k>0, \ \ \ k\in\{1,2,\dots, n\}</math>.</center>


}}
}}
Linia 439: Linia 429:
{{przyklad|8.17.||
{{przyklad|8.17.||
Wyznaczmy ekstrema funkcji
Wyznaczmy ekstrema funkcji
<center><math>\displaystyle \mathbb{R}^3\ni (x,y,z)\mapsto f(x,y,z)=(x^2+y^2+z^2)^2-3xyz\in \mathbb{R}.</math></center>
<center><math>\mathbb{R}^3\ni (x,y,z)\mapsto f(x,y,z)=(x^2+y^2+z^2)^2-3xyz\in \mathbb{R}</math>.</center>
<br>
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.17.|wykres]]
<br>


Różniczka tej funkcji zeruje się w punktach, których współrzędne
Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań
spełniają układ równań <center><math>\displaystyle \left\{\aligned \frac{\partial
<center><math>\left\{\begin{align} \frac{\partial
f}{\partial x}&=0\\\frac{\partial f}{\partial
f}{\partial x}&=0\\\frac{\partial f}{\partial
y}&=0\\\frac{\partial f}{\partial z}&=0,\endaligned\right. \text{
y}&=0\\\frac{\partial f}{\partial z}&=0,\end{align}\right. \text{ czyli } \left\{\begin{align} 4(x^2+y^2+z^2)x&=3yz \\
czyli } \left\{\aligned 4(x^2+y^2+z^2)x&=3yz \\
4(x^2+y^2+z^2)y&=3xz
4(x^2+y^2+z^2)y&=3xz
\\ 4(x^2+y^2+z^2)z&=3xy. \endaligned\right.</math></center>
\\ 4(x^2+y^2+z^2)z&=3xy. \end{align}\right.</math>.</center>


Układ ten spełniają współrzędne pięciu punktów
Układ ten spełniają współrzędne pięciu punktów
<center><math>\displaystyle \aligned P_0&=(0,0,0),
<center><math>\begin{align} P_0&=(0,0,0),
\\ P_1&=\big(\frac{1}{4},\frac{1}{4},\frac{1}{4}\big),
\\ P_1&=\big(\frac{1}{4},\frac{1}{4},\frac{1}{4}\big),
\\ P_2&=\big(\frac{1}{4},-\frac{1}{4},-\frac{1}{4}\big),
\\ P_2&=\big(\frac{1}{4},-\frac{1}{4},-\frac{1}{4}\big),
\\ P_3&=\big(-\frac{1}{4},\frac{1}{4},-\frac{1}{4}\big),
\\ P_3&=\big(-\frac{1}{4},\frac{1}{4},-\frac{1}{4}\big),
\\ P_4&=\big(-\frac{1}{4},-\frac{1}{4},\frac{1}{4}\big).
\\ P_4&=\big(-\frac{1}{4},-\frac{1}{4},\frac{1}{4}\big).
\endaligned</math></center>
\end{align}</math></center>


Łatwo zauważyć, że w punkcie <math>\displaystyle P_0</math> funkcja nie osiąga ekstremum,
Łatwo zauważyć, że w punkcie <math>P_0</math> funkcja nie osiąga ekstremum,
gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno
gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno
wartości mniejsze jak i większe od <math>\displaystyle f(P_0)=0</math>. Na przykład na
wartości mniejsze jak i większe od <math>f(P_0)=0</math>. Na przykład na
prostej o kierunku (1,1,1) przechodzącej przez punkt
prostej o kierunku (1,1,1) przechodzącej przez punkt
<math>\displaystyle P_0=(0,0,0)</math>, tj. na zbiorze <center><math>\displaystyle P_0 +\mathbb{R}(1,1,1)=\{(t,t,t),
<math>P_0=(0,0,0)</math>, tj. na zbiorze <center><math>P_0 +\mathbb{R}(1,1,1)=\{(t,t,t),
t\in\mathbb{R}\},</math></center>
t\in\mathbb{R}\}</math>,</center>
funkcja
funkcja
<center><math>\displaystyle f(t,t,t)=(t^2+t^2+t^2)^2-3t^3=3t^3(3t-1)</math></center>
<center><math>f(t,t,t)=(t^2+t^2+t^2)^2-3t^3=3t^3(3t-1)</math></center>
przyjmuje w otoczeniu
przyjmuje w otoczeniu
zera zarówno dodatnie wartości (np. gdy <math>\displaystyle t<0</math>) jak i ujemne (np.
zera zarówno dodatnie wartości (np. gdy <math>t<0</math>) jak i ujemne (np.
gdy <math>\displaystyle 0<t<\frac{1}{3}</math>). W pozostałych czterech punktach macierz
gdy <math>0<t<\frac{1}{3}</math>). W pozostałych czterech punktach macierz
drugich pochodnych cząstkowych, która zadaje drugą różniczkę
drugich pochodnych cząstkowych, która zadaje drugą różniczkę


<center><math>\displaystyle \left[
<center><math>\left[
\begin{array}{lll}
\begin{array}{lll}
4(3x^2+y^2+z^2)& 8xy-3z &8xz-3y\\
4(3x^2+y^2+z^2)& 8xy-3z &8xz-3y\\
Linia 478: Linia 470:
</math></center>
</math></center>
jest dodatnio określona. Na przykład w punkcie
jest dodatnio określona. Na przykład w punkcie
<math>\displaystyle P_1=\big(\frac{1}{4},  \frac{1}{4}, \frac{1}{4}\big)</math> macierz
<math>P_1=\big(\frac{1}{4},  \frac{1}{4}, \frac{1}{4}\big)</math> macierz
drugich pochodnych cząstkowych funkcji <math>\displaystyle f</math>
drugich pochodnych cząstkowych funkcji <math>f</math>
<center><math>\displaystyle \left[\begin{array}{rrr} \frac{5}{4} &-\frac{1}{4} &-\frac{1}{4}\\
<center><math>\left[\begin{array}{rrr} \frac{5}{4} &-\frac{1}{4} &-\frac{1}{4}\\
-\frac{1}{4} &\frac{5}{4} &-\frac{1}{4}\\
-\frac{1}{4} &\frac{5}{4} &-\frac{1}{4}\\
-\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]</math></center>
-\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]</math></center>
ma
ma
wszystkie minory główne dodatnie:
wszystkie minory główne dodatnie:
<center><math>\displaystyle \aligned A_1&=\det\left[\frac{5}{4}\right]=\frac{5}{4}>0
<center><math>\begin{align} A_1&=\det\left[\frac{5}{4}\right]=\frac{5}{4}>0
\\A_2&=\det\left[\begin{array}{rr} \frac{5}{4} &-\frac{1}{4} \\
\\A_2&=\det\left[\begin{array}{rr} \frac{5}{4} &-\frac{1}{4} \\
-\frac{1}{4} &\frac{5}{4}\end{array} \right]
-\frac{1}{4} &\frac{5}{4}\end{array} \right]
Linia 493: Linia 485:
-\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]=
-\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]=
\frac{1}{4^3}\det\left[\begin{array}{rrr} 5 &-1&-1\\-1 &5 &-1\\-1 &-1&
\frac{1}{4^3}\det\left[\begin{array}{rrr} 5 &-1&-1\\-1 &5 &-1\\-1 &-1&
5\end{array} \right]=\frac{108}{64}>0.\endaligned</math></center>
5\end{array} \right]=\frac{108}{64}>0.\end{align}</math></center>
Stąd w punkcie
Stąd w punkcie
<math>\displaystyle P_1</math> funkcja osiąga minimum lokalne równe
<math>P_1</math> funkcja osiąga minimum lokalne równe
<math>\displaystyle f(P_1)=-\frac{3}{256}</math>. Podobne uzasadnienie prowadzi do wniosku,
<math>f(P_1)=-\frac{3}{256}</math>. Podobne uzasadnienie prowadzi do wniosku,
że także w pozostałych punktach <math>\displaystyle P_2</math>, <math>\displaystyle P_3</math> oraz <math>\displaystyle P_4</math> funkcja
że także w pozostałych punktach <math>P_2</math>, <math>P_3</math> oraz <math>P_4</math> funkcja
osiąga minima lokalne.
osiąga minima lokalne.
{ [[Powtórzyć rysunek i animację
am2w09.0010]]}


Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie
Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie
zrezygnować z analizy określoności drugiej różniczki. Punkty <math>\displaystyle A_1,
zrezygnować z analizy określoności drugiej różniczki. Punkty <math>A_1,
A_2, A_3, A_4</math> leżą we wnętrzu zbioru ograniczonego poziomicą
A_2, A_3, A_4</math> leżą we wnętrzu zbioru ograniczonego poziomicą
zerową funkcji <math>\displaystyle f</math>, precyzyjniej: leżą w obszarze, gdzie funkcja
zerową funkcji <math>f</math>, precyzyjniej: leżą w obszarze, gdzie funkcja
<math>\displaystyle f</math> jest ujemna. Ponieważ zbiór <center><math>\displaystyle \{(x,y,z)\in \mathbb{R}^3 :
<math>f</math> jest ujemna. Ponieważ zbiór <center><math>\{(x,y,z)\in \mathbb{R}^3 :
f(x,y,z)\leq 0\}</math></center>
f(x,y,z)\leq 0\}</math></center>
jest zwarty (gdyż jest domknięty i ograniczony),
jest zwarty (gdyż jest domknięty i ograniczony),
funkcja <math>\displaystyle f</math>, na mocy twierdzenia Weierstrassa o osiąganiu kresów
funkcja <math>f</math>, na mocy twierdzenia Weierstrassa o osiąganiu kresów
przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech
przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech
punktach osiągać minima lokalne.
punktach osiągać minima lokalne.
Linia 528: Linia 517:


{{przyklad|8.18.||
{{przyklad|8.18.||
Funkcja <math>\displaystyle f(x,y)=\exp(-x^2-y^2)</math> jest
Funkcja <math>f(x,y)=\exp(-x^2-y^2)</math> jest
funkcją promienia <math>\displaystyle r=\sqrt{x^2+y^2}</math>, gdyż <math>\displaystyle f(x,y)=e^{-r^2}</math>,
funkcją promienia <math>r=\sqrt{x^2+y^2}</math>, gdyż <math>f(x,y)=e^{-r^2}</math>,
gdzie <math>\displaystyle r=\sqrt{x^2+y^2}</math>. Ponieważ funkcja <math>\displaystyle r\mapsto e^{-r^2}</math>
gdzie <math>r=\sqrt{x^2+y^2}</math>. Ponieważ funkcja <math>r\mapsto e^{-r^2}</math>
osiąga wartość największą w punkcie <math>\displaystyle r=0</math> i nie osiąga żadnych
osiąga wartość największą w punkcie <math>r=0</math> i nie osiąga żadnych
więcej ekstremów na półprostej <math>\displaystyle 0\leq r<\infty</math>, więc jedynym
więcej ekstremów na półprostej <math>0\leq r<\infty</math>, więc jedynym
ekstremum funkcji <math>\displaystyle f(x,y)=\exp(-x^2-y^2)</math> jest maksimum lokalne
ekstremum funkcji <math>f(x,y)=\exp(-x^2-y^2)</math> jest maksimum lokalne
osiągane w punkcie <math>\displaystyle (0,0)</math>  (tj. <math>\displaystyle r=0</math>). Wówczas <math>\displaystyle f(0,0)=1</math>.
osiągane w punkcie <math>(0,0)</math>  (tj. <math>r=0</math>). Wówczas <math>f(0,0)=1</math>.
 
<br>
{ [Rysunek am2w08.0060] Wykres funkcji
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.18.|wykres]]
<math>\displaystyle f(x,y)=\exp(-x^2-y^2)</math>}
<br>
 
}}
}}


{{przyklad|8.19.||
{{przyklad|8.19.||
Funkcja <math>\displaystyle f(x,y)=\sin(x^2+y^2)</math> także
Funkcja <math>f(x,y)=\sin(x^2+y^2)</math> także
jest funkcją promienia <math>\displaystyle r=\sqrt{x^2+y^2}</math>. Zauważmy bowiem, że
jest funkcją promienia <math>r=\sqrt{x^2+y^2}</math>. Zauważmy bowiem, że
<center><math>\displaystyle f(x,y)=\sin(x^2+y^2)=\sin(r^2\cos^2\varphi+r^2\sin^2\varphi)=\sin(r^2)</math></center>
<center><math>f(x,y)=\sin(x^2+y^2)=\sin(r^2\cos^2\varphi+r^2\sin^2\varphi)=\sin(r^2)</math></center>
osiąga ekstrema w tych samych punktach, co
osiąga ekstrema w tych samych punktach, co
funkcja <math>\displaystyle r\mapsto \sin (r^2)</math>, a więc osiąga maksima w punktach
funkcja <math>r\mapsto \sin (r^2)</math>, a więc osiąga maksima w punktach
<math>\displaystyle r^2=\frac{\pi}{2}+2k\pi</math> i minima w punktach
<math>r^2=\frac{\pi}{2}+2k\pi</math> i minima w punktach
<math>\displaystyle r^2=\frac{3\pi}{2}+2k\pi</math>, gdzie <math>\displaystyle k=0, 1,2,\dots</math>. Innymi słowy
<math>r^2=\frac{3\pi}{2}+2k\pi</math>, gdzie <math>k=0, 1,2,\dots</math>. Innymi słowy
funkcja <math>\displaystyle (x,y)\mapsto f(x,y)</math> osiąga maksima w punktach należących
funkcja <math>(x,y)\mapsto f(x,y)</math> osiąga maksima w punktach należących
do okręgów o równaniach
do okręgów o równaniach
<center><math>\displaystyle \{(x,y)\in \mathbb{R}^2 : x^2+y^2=\frac{\pi}{2}+2k\pi\}</math></center>
<center><math>\{(x,y)\in \mathbb{R}^2 : x^2+y^2=\frac{\pi}{2}+2k\pi\}</math></center>


oraz w punkcie <math>\displaystyle (0,0)</math> (wtedy <math>\displaystyle r=0</math>), a minima w punktach
oraz w punkcie <math>(0,0)</math> (wtedy <math>r=0</math>), a minima w punktach
należących do okręgów
należących do okręgów
<center><math>\displaystyle \{(x,y)\in \mathbb{R}^2 : x^2+y^2=\frac{3\pi}{2}+2k\pi\},</math></center>
<center><math>\{(x,y)\in \mathbb{R}^2 : x^2+y^2=\frac{3\pi}{2}+2k\pi\}</math>,</center>
 
gdzie <math>\displaystyle k</math> jest dowolną liczbą całkowitą nieujemną.
 
{ [Rysunek am2w08.0010]
Wykres funkcji <math>\displaystyle f(x,y)=\sin(x^2+y^2)</math>}


gdzie <math>k</math> jest dowolną liczbą całkowitą nieujemną.
}}
}}
 
<br>
<center>
<div class="thumb"><div style="width:450px;">
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
    <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
    <param name="coloring" value="maple">
    <param name="model" value="images/c/c6/Am2w08.0010.mgs.zip">
    <param name="scale" value="1.0 1.0 1.0">
<param name="shading" value="0.2">
<param name="animation" value="stop">
</applet>
<div.thumbcaption>Wykres funkcji <math>f(x,y)=\sin(x^2+y^2)</math></div>
</div></div>
</center>
<br>
{{przyklad|8.20.||
{{przyklad|8.20.||
Podobnie jak w poprzednim przykładzie
Podobnie jak w poprzednim przykładzie
funkcja <math>\displaystyle f(x,y)=\cos(x^2+y^2)=\cos (r^2)</math>, <math>\displaystyle r=\sqrt{x^2+y^2}</math>,
funkcja <math>f(x,y)=\cos(x^2+y^2)=\cos (r^2)</math>, <math>r=\sqrt{x^2+y^2}</math>,
osiąga maksima na okręgach o promieniach <math>\displaystyle r</math> takich, ze
osiąga maksima na okręgach o promieniach <math>r</math> takich, ze
<math>\displaystyle r^2=0+2k\pi</math>, czyli na okręgach
<math>r^2=0+2k\pi</math>, czyli na okręgach
<center><math>\displaystyle \{(x,y)\in \mathbb{R}^2 : x^2+y^2=2k\pi\},</math></center>
<center><math>\{(x,y)\in \mathbb{R}^2 : x^2+y^2=2k\pi\}</math>,</center>
 
natomiast minima na okręgach, których promień <math>\displaystyle r</math> spełnia równanie
<math>\displaystyle r^2=\pi+2k\pi</math>, tj. na okręgach
<center><math>\displaystyle \{(x,y)\in \mathbb{R}^2 : x^2+y^2=(2k+1)\pi\},</math></center>
 
gdzie <math>\displaystyle k=0,1,2,\dots</math> jest nieujemną liczbą całkowitą.


{ [Rysunek
natomiast minima na okręgach, których promień <math>r</math> spełnia równanie
am2w08.0020] Wykres funkcji <math>\displaystyle f(x,y)=\cos(x^2+y^2)</math>}
<math>r^2=\pi+2k\pi</math>, tj. na okręgach
<center><math>\{(x,y)\in \mathbb{R}^2 : x^2+y^2=(2k+1)\pi\}</math>,</center>


gdzie <math>k=0,1,2,\dots</math> jest nieujemną liczbą całkowitą.
<br>
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.20.|wykres]]
<br>
}}
}}


{{przyklad|8.21.||
{{przyklad|8.21.||
Także funkcja <math>\displaystyle f(x,y)=\ln
Także funkcja <math>f(x,y)=\ln
(x^2+y^2+1)=\ln(r^2 +1)</math> jest funkcją promienia
(x^2+y^2+1)=\ln(r^2 +1)</math> jest funkcją promienia
<math>\displaystyle r=\sqrt{x^2+y^2}</math>. Ponieważ funkcja <math>\displaystyle [0, \infty)\ni r\mapsto
<math>r=\sqrt{x^2+y^2}</math>. Ponieważ funkcja <math>[0, \infty)\ni r\mapsto
r^2+1\in \mathbb{R}</math> jest ściśle rosnąca, osiąga minimum w punkcie <math>\displaystyle r=0</math>.
r^2+1\in \mathbb{R}</math> jest ściśle rosnąca, osiąga minimum w punkcie <math>r=0</math>.
Stąd także funkcja <math>\displaystyle f(x,y)=\ln (x^2+y^2+1)</math> osiąga minimum w
Stąd także funkcja <math>f(x,y)=\ln (x^2+y^2+1)</math> osiąga minimum w
punkcie <math>\displaystyle (x,y)=(0,0)</math> (wówczas <math>\displaystyle r=0</math>).
punkcie <math>(x,y)=(0,0)</math> (wówczas <math>r=0</math>).
 
<br>
{ [Rysunek am2w08.0050] Wykres funkcji
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.21.|wykres]]
<math>\displaystyle f(x,y)=\ln(x^2+y^2+1)</math>}
<br>
 
}}
}}


Również w wielu innych przykładach, gdy funkcja <math>\displaystyle f</math> nie jest
Również w wielu innych przykładach, gdy funkcja <math>f</math> nie jest
funkcją promienia, można uniknąć stosowania  rachunku
funkcją promienia, można uniknąć stosowania  rachunku
różniczkowego do wyznaczenia ekstremów.
różniczkowego do wyznaczenia ekstremów.
Linia 601: Linia 597:
{{przyklad|8.22.||
{{przyklad|8.22.||


Funkcja <math>\displaystyle f(x,y)=\sin(x^2-y^2)</math> osiąga maksima w punktach hiperbol
Funkcja <math>f(x,y)=\sin(x^2-y^2)</math> osiąga maksima w punktach hiperbol
<center><math>\displaystyle \{(x,y)\in \mathbb{R}^2 : x^2-y^2=\frac{\pi}{2}+2k\pi\},</math></center>
<center><math>\{(x,y)\in \mathbb{R}^2 : x^2-y^2=\frac{\pi}{2}+2k\pi\}</math>,</center>


a minima w punktach drugiej rodziny hiperbol
a minima w punktach drugiej rodziny hiperbol
<center><math>\displaystyle \{(x,y)\in \mathbb{R}^2 : x^2-y^2=\frac{3\pi}{2}+2k\pi\},</math></center>
<center><math>\{(x,y)\in \mathbb{R}^2 : x^2-y^2=\frac{3\pi}{2}+2k\pi\}</math>,</center>
 
gdzie <math>\displaystyle k</math> jest liczbą całkowitą.
 
{ [Rysunek am2w08.0030] Wykres funkcji
<math>\displaystyle f(x,y)=\sin(x^2-y^2)</math>}


gdzie <math>k</math> jest liczbą całkowitą.
<br>
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.22.|wykres]]
<br>
}}
}}


{{przyklad|8.23.||
{{przyklad|8.23.||
Z kolei funkcja <math>\displaystyle f(x,y)=\cos(x^2-y^2)</math>
Z kolei funkcja <math>f(x,y)=\cos(x^2-y^2)</math>
osiąga maksima w punktach hiperbol
osiąga maksima w punktach hiperbol
<center><math>\displaystyle \{(x,y)\in \mathbb{R}^2 : x^2-y^2=2k\pi\},</math></center>
<center><math>\{(x,y)\in \mathbb{R}^2 : x^2-y^2=2k\pi\}</math>,</center>


a minima w punktach drugiej rodziny hiperbol
a minima w punktach drugiej rodziny hiperbol
<center><math>\displaystyle \{(x,y)\in \mathbb{R}^2 : x^2-y^2=(2k+1)\pi\},</math></center>
<center><math>\{(x,y)\in \mathbb{R}^2 : x^2-y^2=(2k+1)\pi\}</math>,</center>
 
gdzie <math>\displaystyle k</math> jest liczbą całkowitą.
 
{ [Rysunek am2w08.0040] Wykres funkcji
<math>\displaystyle f(x,y)=\cos(x^2-y^2)</math>}


gdzie <math>k</math> jest liczbą całkowitą.
<br>
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.23.|wykres]]
<br>
}}
}}


Linia 633: Linia 627:
obserwacja przebiegu poziomic pozwala stwierdzić, że
obserwacja przebiegu poziomic pozwala stwierdzić, że


{ [Rysunek am2w08.0070] Wykres funkcji
'''(a)''' funkcja <math>f_1(x,y)=x^2+y^2</math> osiąga w punkcie <math>(0,0)</math> minimum
<math>\displaystyle f_1(x,y)=x^2+y^2</math>}
<br>
 
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Uwaga 8.24.(a)|wykres]]
* funkcja <math>\displaystyle f_1(x,y)=x^2+y^2</math> osiąga w punkcie <math>\displaystyle (0,0)</math> minimum,
<br>
 
'''(b)''' w tym samym punkcie funkcja <math>f_2(x,y)=-x^2-y^2</math> osiąga maksimum
{ [Rysunek am2w08.0080] Wykres funkcji
<br>
<math>\displaystyle f_2(x,y)=-x^2-y^2</math>}
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Uwaga 8.24.(b)|wykres]]
 
<br>
* w tym samym punkcie funkcja <math>\displaystyle f_2(x,y)=-x^2-y^2</math> osiąga maksimum
'''(c)''' a funkcja <math>f_3(x,y)=x^2-y^2</math> nie osiąga w punkcie <math>(0,0)</math>
 
{ [Rysunek am2w08.0090] Wykres funkcji
<math>\displaystyle f_3(x,y)=x^2-y^2</math>}
 
* a funkcja <math>\displaystyle f_3(x,y)=x^2-y^2</math> nie osiąga w punkcie <math>\displaystyle (0,0)</math>
żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w
żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w
dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak
dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak
i większe od zera.
i większe od zera.
 
<br>
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Uwaga 8.24.(c)|wykres]]
<br>
}}
}}


{{przyklad|8.25.||
{{przyklad|8.25.||
Zauważmy, że każda z trzech funkcji
Zauważmy, że każda z trzech funkcji '''a, b, c''' ma w punkcie <math>(0,0)</math> zerową zarówno
 
{ [Rysunek am2w08.0130] Wykres funkcji
<math>\displaystyle f_1(x,y)=x^3+y^3</math> }
 
<math>\displaystyle f_1(x,y)=x^3+y^3</math>
 
{ [Rysunek am2w08.0140] Wykres funkcji
<math>\displaystyle f_2(x,y)=-x^3-y^3</math>}
 
<math>\displaystyle f_2(x,y)=-x^3-y^3</math>
 
{ [Rysunek am2w08.0150] Wykres funkcji
<math>\displaystyle f_3(x,y)=x^3-y^3</math>}
 
oraz <math>\displaystyle f_3(x,y)=x^3-y^3</math> ma w punkcie <math>\displaystyle (0,0)</math> zerową zarówno
pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym
pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym
punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu
punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu
punktu <math>\displaystyle (0,0)</math> zarówno wartości mniejsze jak i większe od zera.
punktu <math>(0,0)</math> zarówno wartości mniejsze jak i większe od zera.


'''(a)''' <math>f_2(x,y)=-x^3-y^3</math>
<br>
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.25.(a)|wykres]]
<br>
'''(b)''' <math>f_3(x,y)=x^3-y^3</math>
<br>
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.25.(b)|wykres]]
<br>
'''(c)''' <math>f_1(x,y)=x^3+y^3</math>
}}
}}
<br>
<center>
<div class="thumb"><div style="width:450px;">
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
    <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
    <param name="coloring" value="maple">
    <param name="model" value="images/1/10/Am2w08.0130.mgs.zip">
    <param name="scale" value="1.0 1.0 0.1">
<param name="shading" value="0.2">
<param name="animation" value="stop">
</applet>
<div.thumbcaption>Wykres funkcji
<math>f_1(x,y)=x^3+y^3</math></div>
</div></div>
</center>
<br>


Należy pamiętać o analizowaniu otoczenia  punktów krytycznych
Należy pamiętać o analizowaniu otoczenia  punktów krytycznych
Linia 682: Linia 684:
{{przyklad|8.26.||
{{przyklad|8.26.||
Funkcja
Funkcja
<math>\displaystyle f(x,y)=|x|^\frac{2}{3}+|y|^\frac{2}{3}</math> jest ciągła na całej
<math>f(x,y)=|x|^\frac{2}{3}+|y|^\frac{2}{3}</math> jest ciągła na całej
płaszczyźnie, nie jest jednak różniczkowalna w punktach należących
płaszczyźnie, nie jest jednak różniczkowalna w punktach należących
do dwóch prostych: <math>\displaystyle x=0</math> oraz <math>\displaystyle y=0</math>. Różniczka tej funkcji nie
do dwóch prostych: <math>x=0</math> oraz <math>y=0</math>. Różniczka tej funkcji nie
zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema
zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema
prostymi <math>\displaystyle x=0</math>, <math>\displaystyle y=0</math>. Stąd zbiorem punktów krytycznych jest suma
prostymi <math>x=0</math>, <math>y=0</math>. Stąd zbiorem punktów krytycznych jest suma
obu prostych:
obu prostych:
<center><math>\displaystyle \{(x,y)\in\mathbb{R}^2 :  x=0 \text{ lub } y=0 \}.</math></center>
<center><math>\{(x,y)\in\mathbb{R}^2 :  x=0 \text{ lub } y=0 \}</math>.</center>
 
Łatwo zauważyć, że jedynie w punkcie <math>\displaystyle (0,0)</math> tego zbioru funkcja
<math>\displaystyle f</math> osiąga ekstremum, a mianowicie minimum <math>\displaystyle f(0,0)=0</math>.
 
{ [[Powtórzyć rysunek i animację
am2w05.0120]]}


Łatwo zauważyć, że jedynie w punkcie <math>(0,0)</math> tego zbioru funkcja
<math>f</math> osiąga ekstremum, a mianowicie minimum <math>f(0,0)=0</math>.
<br>
[[Grafika:Wykres.gif]] [[Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych/Przykład 8.26.|wykres]]
<br>
}}
}}

Aktualna wersja na dzień 21:33, 11 wrz 2023

Ekstrema funkcji wielu zmiennych.

Dowodzimy wzoru Taylora dla funkcji wielu zmiennych. Jego konsekwencją jest warunek wystarczający istnienia ekstremum. Pokazujemy szereg przykładów prowadzących do zastosowania wykazanego warunku wystarczającego oraz takich, w których nie jest to niezbędne.

Wzór Taylora dla funkcji wielu zmiennych

Niech f:XY będzie funkcją klasy Cm+1 określoną na otwartym podzbiorze U przestrzeni Banacha X o wartościach w przestrzeni Banacha Y. Podobnie jak w przypadku funkcji jednej zmiennej rzeczywistej zachodzi następujące

Twierdzenie 8.1. [twierdzenie Taylora]

Dla dowolnych punktów a oraz a+h zbioru U takich, że odcinek
{a+th,t[0,1]}U,

zachodzi równość

f(a+h)=f(a)+daf(h)+12!da2f(h,h)+13!da3f(h,h,h)++1m!damf(h,h,,h)m wektorów h+Rmf(a,h)
gdzie
Rmf(a,b)y1(m+1)!sup{|da+thm+1(h,h,,h)|, t[0,1]}.

Definicja 8.2.

Funkcję
XhTamf(h)=f(a)+daf(h)+12!da2f(h,h)++1m!damf(h,h,,h)m razy =k=0m1k!dak(h,h,,h)k razy Y
nazywamy wielomianem Taylora rzędu m funkcji f o środku w punkcie a.
Uwaga 8.3.

Zauważmy, że jeśli X=n i Y=, to wielomian Taylora funkcji f:n rzędu m o środku w punkcie a można wyrazić za pomocą pochodnych cząstkowych funkcji f w następujący sposób:

Tamf(h)=k=0m1k!|α|=k(kα)kxαf(a)hα=k=0m|α|=k1α!kxαf(a)hα=|α|m1α!|α|xαf(a)hα,

gdzie α=(α1,α2,,αn)0n jest n-wskaźnikiem o długości |α|=α1+α2++αn. (Oznaczenia: α!, hα, kxα wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W szczególnym (ale bardzo często spotykanym) przypadku funkcji f:2(x1,x2)f(x1,x2) dwóch zmiennych x1,x2 wielomian Taylora o środku w punkcie a=(a1,a2)2 przyjmuje postać

Tamf(h)=k=0mα1+α2=k1α1!α2!kf(a)x1α1x2α2h1α1h2α2=α1+α2m1α1!α2!α1+α2f(a)x1α1x2α2h1α1h2α2,

gdzie h=(h1,h2)2.

Dowód 8.3.

Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy f:XU jest funkcją o wartościach rzeczywistych, określoną na otwartym podzbiorze U przestrzeni Banacha X. Niech, zgodnie z założeniem, a oraz a+h będą takimi

punktami zbioru U, że odcinek {a+th,0t1}U. Rozważmy funkcję
g:(0ϵ,1+ϵ)tf(a+th)

określoną w pewnym otoczeniu otwartym odcinka [0,1]. Funkcja g jest w tym zbiorze klasy Cm+1, gdyż f jest tej klasy w otoczeniu odcinka {a+th, 0t1}U. Ponadto z twierdzenia o różniczkowaniu złożenia funkcji mamy dla dowolnej liczby 0t1 równość

dkdtkg(0)=dakf(d0(a+th),d0(a+th),,d0(a+th))k razy=dakf(h,h,,h)k razy.

Ze twierdzenia Taylora dla funkcji jednej zmiennej g oraz z powyższej równości mamy

f(a+h)=g(0+1)=g(0)+g(0)1+12!g(0)12++1m!g(m)(0)1m+1(m+1)!g(m+1)(0+θ1)1m+1=f(a)+daf(h)+12!da2f(h,h)++1m!damf(h,h,,h)+1(m+1)!da+θhm+1f(h,h,,h,h),

gdzie θ(0,1) jest pewnym punktem pośrednim. Stąd mamy też oszacowanie reszty we wzorze Taylora:

|Rmf(a,h)|=|1(m+1)!da+θhm+1f(h,h,,h,h|1(m+1)!sup{|da+θhm+1f(h,h,,h,h)|,0θ1}

Ekstrema funkcji wielu zmiennych

Pamiętamy, że dowolna przestrzeń unormowana X jest przestrzenią metryczną z metryką d(x,y)=xy zadaną przez normę przestrzeni X. Stąd też definicja ekstremum funkcji f:X o wartościach rzeczywistych określonej na przestrzeni unormowanej jest taka sama jak w przypadku przestrzeni metrycznej, czyli funkcja f przyjmuje w punkcie adomf minimum lokalne (odpowiednio: maksimum lokalne, ścisłe minimum lokalne, ścisłe maksimum lokalne), jeśli istnieje liczba δ>0 taka, że zachodzą odpowiednio implikacje:

d(x,a)<δf(x)f(a)
d(x,a)<δf(x)f(a)
0<d(x,a)<δf(x)>f(a)
0<d(x,a)<δf(x)<f(a).

Minimum funkcji w punkcie a nazywamy globalnym, jeśli f osiąga w punkcie a kres dolny wartości. Jeśli zaś w punkcie a funkcja osiąga kres górny, to mówimy, że osiąga w punkcie a maksimum globalne.

Sformułujmy wpierw warunek konieczny istnienia ekstremum funkcji f.

Twierdzenie 8.4.

Jeśli funkcja różniczkowalna f:XU osiąga ekstremum w punkcie a zbioru otwartego U, to w punkcie tym zeruje się różniczka funkcji f, tzn. daf(h)=0, gdzie hX jest dowolnym wektorem

przestrzeni X.

Dowód 8.4.

Załóżmy, że funkcja f osiąga maksimum lokalne w punkcie aU. Ustalmy pewien wektor hX, h=1 i rozważmy

zacieśnienie funkcji f do prostej
{a+th,t}

o kierunku h przechodzącej przez punkt a. Zacieśnienie to

tf(a+th)

jest funkcją jednej zmiennej, osiągającą maksimum w t=0. Stąd pochodna w zerze funkcji tf(a+th) jest równa zeru. Ale pochodna ta jest tożsama z pochodną kierunkową funkcji f w kierunku wektora h. Wobec dowolności h różniczka daf=0.

Uwaga 8.5.
Zwróćmy uwagę, że funkcja może osiągać ekstremum w punkcie, w którym nie jest różniczkowalna. Na przykład f(x,y)=|x|+|y| osiąga wartość minimalną w punkcie (0,0), w którym nie jest różniczkowalna.


 <applet code="JavaviewModApplet.class" height="400" width="450" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar">
   <param name="colors" value="-1:#7e0b9f -0.82:#7e0b9f -0.81:#ce3bf8 -0.64:#ce3bf8 -0.63:#2c4ae5 -0.46:#2c4ae5 -0.45:#2c85e5 -0.28:#2c85e5 -0.27:#2ecca9 -0.10:#2ecca9 -0.09:#2ecc5b 0.09:#2ecc5b 0.10:#97cc2e 0.27:#97cc2e 0.28:#edff27 0.45:#edff27 0.46:#ffba27 0.63:#ffba27 0.64:#ff6e27 0.81:#ff6e27 0.82:#d42555 1:#d42525">
   <param name="coloring" value="mathematica">
   <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip">
   <param name="scale" value="1.0 1.0 0.5">

<param name="shading" value="0.2"> <param name="animation" value="stop">

 </applet>
<div.thumbcaption>Wykres funkcji f(x,y)=|x|+|y|


Przyjmijmy wobec tego następującą definicję.

Definicja 8.6.

Mówimy, że adomf jest punktem krytycznym funkcji f, jeśli a należy do dziedziny różniczki funkcji f i różniczka zeruje się w tym punkcie, bądź też punkt a należy do dziedziny funkcji i nie istnieje różniczka daf.

Wniosek 8.7.

Jeśli funkcja f osiąga ekstremum w punkcie adomf, to punkt ten jest krytyczny.

Implikacja te stanowi warunek konieczny istnienia ekstremum także w przypadku funkcji, od których nie żądamy różniczkowalności w otoczeniu wszystkich punktów dziedziny.

Wzór Taylora umożliwia, podobnie jak w przypadku jednowymiarowym, sformułowanie warunku wystarczającego istnienia ekstremum.

Definicja 8.8.

Niech AL2(X,) będzie odwzorowaniem dwuliniowym symetrycznym określonym na X×X, gdzie X jest pewną przestrzenią Banacha. Mówimy, że forma

kwadratowa
XhA(h,h)

jest

  • dodatnio określona, jeśli istnieje stała C>0 taka, że
A(h,h)Ch2, dla dowolnego wektora hX,
  • ujemnie określona, jeśli istnieje stała C>0 taka, że
A(h,h)Ch2, dla dowolnego wektora hX,
  • nieujemnie określona, jeśli
A(h,h)0, dla dowolnego wektora hX,
  • niedodatnio określona, jeśli
A(h,h)0, dla dowolnego wektora hX,
  • nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie,

ani nieujemnie, ani niedodatnio określona.

Często mówimy też, że odwzorowanie dwuliniowe symetryczne AL2(X,) jest dodatnio określone (odpowiednio: ujemnie określone, nieujemnie określone, niedodatnio określone, nieokreślone), jeśli forma kwadratowa hA(h,h) jest określona dodatnio (odpowiednio: określona ujemnie, określona nieujemnie, określona niedodatnio, bądź jest nieokreślona).

Uwaga 8.9.

a) Forma kwadratowa hA(h,h) jest dodatnio określona wtedy i tylko wtedy, gdy forma hA(h,h) jest ujemnie określona.

b) Forma kwadratowa hA(h,h) jest nieujemnie określona wtedy i tylko wtedy, gdy forma hA(h,h) jest niedodatnio określona.

c) Forma kwadratowa hA(h,h) jest nieokreślona wtedy i tylko wtedy, gdy nieokreślona jest forma hA(h,h).

Korzystając ze wzoru Taylora, wykażemy warunek wystarczający istnienia ekstremum funkcji wielu zmiennych.

Twierdzenie 8.10.

Niech f będzie funkcją klasy C2 w otwartym otoczeniu U punktu a. Załóżmy, że różniczka funkcji f w punkcie a jest równa zeru.

a) Jeśli druga różniczka da2f jest dodatnio określona, funkcja f osiąga ścisłe minimum lokalne w punkcie a.

b) Jeśli druga różniczka da2f jest ujemnie określona, funkcja f osiąga ścisłe maksimum lokalne w punkcie a.

c) Jeśli druga różniczka da2f jest nieokreślona, funkcja f

nie osiąga ekstremum w punkcie a.

Dowód 8.10.

a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce: daf=0) dostajemy równość prawdziwą w otoczeniu punktu a na tyle małym, aby odcinek {a+th,0t1} był w nim zawarty.

f(a+h)=f(a)+daf(h)+12da+θh2f(h,h)=f(a)+0+12da+θh2f(h,h),
czyli
f(a+h)f(a)=12da+θh2f(h,h),

gdzie 0<θ<1 jest pewną liczbą. Jeśli forma hda2f(h,h) jest dodatnio określona, to wobec ciągłości drugiej różniczki, również w pewnym małym otoczeniu punktu a w punkcie a+θh forma hda+θh2f(h,h) jest dodatnio określona. Wobec tego

f(a+h)f(a)=12da+θh2f(h,h)>0,

czyli f(a+h)>f(a) dla dowolnego niezerowego wektora h z pewnego małego otoczenia punktu 0. Oznacza to, że funkcja f osiąga w tym punkcie ścisłe minimum lokalne.

b) Podobnie jak w punkcie a) wykazujemy, że funkcja f osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie określona w punkcie, w którym zeruje się jej pierwsza różniczka.

c) Jeśli druga różniczka da2f jest nieokreślona, to istnieją dwa wektory h,kX takie, że da2f(h,h)>0 natomiast da2f(k,k)<0. Jeśli więc zacieśnimy funkcję f do prostej o

kierunku h:
a+h={a+th,t}X,

to na prostej tej w pewnym małym otoczeniu punktu a (dla t bliskich zeru) otrzymamy nierówność:

f(a+th)f(a)=12da+θth2f(th,th)>0

natomiast na prostej o kierunku k:

a+k={a+tk,t}X,

dostaniemy, podobnie w małym otoczeniu punktu a, nierówność przeciwną:

f(a+tk)f(a)=12da+θtk2f(tk,tk)<0

Stąd funkcja f nie osiąga w punkcie a żadnego ekstremum, gdyż w dowolnie małym otoczeniu punktu a przyjmuje zarówno wartości mniejsze, jak i większe od f(a).

Uwaga 8.11.
Twierdzenie nie rozstrzyga o istnieniu ekstremum ani o jego typie, gdy druga różniczka da2f jest niedodatnio lub nieujemnie określona. Rozważmy trzy proste przykłady.

Przykład 8.12.

Funkcja f(x,y)=x4+y4 osiąga w punkcie (0,0) ścisłe minimum lokalne równe zeru, gdyż dla dowolnego punktu (x,y)(0,0) mamy f(x,y)>0.

Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka funkcji f w punkcie (0,0) zerują się. W szczególności druga różniczka jest nieujemnie określona w każdym punkcie płaszczyzny 2, gdyż dla dowolnego wektora h=(h1,h2)2 mamy

d(x,y)2(h,h)=12(x2h12+y2h22)0.

W szczególności

d(0,0)2(h,h)=12(02h12+02h22)=00.

wykres

Przykład 8.13.

Funkcja f(x,y)=x4y4 osiąga w punkcie (0,0) ścisłe maksimum lokalne równe zeru, gdyż dla dowolnego punktu (x,y)(0,0) mamy f(x,y)<0.

Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie zarówno pierwsza jak i druga różniczka funkcji f w punkcie (0,0) zerują się. W szczególności druga różniczka jest niedodatnio określona w każdym punkcie płaszczyzny 2, gdyż dla dowolnego wektora h=(h1,h2)2 mamy

d(x,y)2(h,h)=12(x2h12+y2h22)0.

W szczególności

d(0,0)2(h,h)=12(02h12+02h22)=00.

wykres

Przykład 8.14.

Funkcja f(x,y)=x4y4 nie osiąga w punkcie (0,0) żadnego ekstremum, gdyż dla dowolnego punktu (x,0)(0,0) mamy f(x,0)>0, natomiast w punktach (0,y)(0,0) mamy z kolei f(0,y)<0.

Zwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji f zerują się w punkcie (0,0). W punktach h=(h1,h2)(0,0), tj. poza początkiem układu współrzędnych, druga różniczka

d(x,y)2(h,h)=12(x2h12y2h22)

jest nieokreślona, bo w punktach (x,0)(0,0) forma kwadratowa hd(x,y)2f jest dodatnia, a w punktach

(0,y)(0,0) jest ujemna. W samym zaś punkcie (0,0) forma kwadratowa
d(0,0)2(h,h)=12(02h1202h22)=0

jest zerowa. Analiza formy kwadratowej w otoczeniu punktu (0,0) pozwala nam jednak dostrzec, że zacieśnienie funkcji f do prostej y=0 (tj. w punktach postaci (x,0)) jest funkcją f(x,0)=x4, która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej x=0 (czyli w punktach postaci (0,y)) funkcja f(0,y)=y4 osiąga maksimum w punkcie y=0. Stąd funkcja (x,y)f(x,y) nie osiąga żadnego ekstremum w punkcie (0,0).


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/4/47/Am2w08.0120.mgs.zip">
   <param name="scale" value="1.0 1.0 0.05">

<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>

<div.thumbcaption>Wykres funkcji f(x,y)=x4y4


Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności drugiej różniczki w przpadku funkcji wielu zmiennych.

Niech A=[aij], i,j=1,2,,n, będzie macierzą kwadratową symetryczną (tzn. aij=aji dla dowolnych i,j). Niech

Ak:=det[a11a1kak1akk]

będzie minorem głównym rzędu k macierzy A, k{1,2,,n}.

Twierdzenie 8.15. [twierdzenie Sylvestera]

Forma kwadratowa nhi=1nj=1naijhihj zadana przez symetryczną macierz kwadratową A=[aij], i,j=1,2,,n, jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie minory główne macierzy A są dodatnie, tzn. Ak>0

dla dowolnego k{1,2,,n}.

Dowód 8.15.

Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz A będzie złożona z jednej liczby [a11]. Należy zauważyć, że forma ha11h2 jest dodatnio określona wtedy i tylko wtedy, gdy a11>0. Następnie dowodzi się implikacji, że z dodatniej określoności formy zadanej przez macierz A~=[aij], i,j=1,2,,n1 wobec założenia o dodatniości minora An=det[aij], i,j=1,2,,n, wynika dodatnia określoność formy kwadratowej zadanej przez macierz A=[aij],i,j=1,2,,n. Szczegóły (które pomijamy) można znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,

Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.)

Ponieważ forma kwadratowa hA(h,h) jest ujemnie określona wtedy i tylko wtedy, gdy hA(h,h) jest dodatnio określona, twierdzenie Sylvestera pozwala nam również stwierdzić, kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy mianowicie

Wniosek 8.16.

Jeśli A=[aij],i,j=1,2,,n, jest symetryczną macierzą kwadratową, to forma kwadratowa

nhi=1nj=1naijhihj

jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego są dodatnie, tzn. gdy

(1)kAk>0,   k{1,2,,n}.

Przykład 8.17.

Wyznaczmy ekstrema funkcji

3(x,y,z)f(x,y,z)=(x2+y2+z2)23xyz.


wykres

Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań

{fx=0fy=0fz=0, czyli {4(x2+y2+z2)x=3yz4(x2+y2+z2)y=3xz4(x2+y2+z2)z=3xy..

Układ ten spełniają współrzędne pięciu punktów

P0=(0,0,0),P1=(14,14,14),P2=(14,14,14),P3=(14,14,14),P4=(14,14,14).

Łatwo zauważyć, że w punkcie P0 funkcja nie osiąga ekstremum, gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno wartości mniejsze jak i większe od f(P0)=0. Na przykład na prostej o kierunku (1,1,1) przechodzącej przez punkt

P0=(0,0,0), tj. na zbiorze
P0+(1,1,1)={(t,t,t),t},

funkcja

f(t,t,t)=(t2+t2+t2)23t3=3t3(3t1)

przyjmuje w otoczeniu zera zarówno dodatnie wartości (np. gdy t<0) jak i ujemne (np. gdy 0<t<13). W pozostałych czterech punktach macierz drugich pochodnych cząstkowych, która zadaje drugą różniczkę

[4(3x2+y2+z2)8xy3z8xz3y8xy3z4(x2+3y2+z2)8yz3x8xz3y8yz3x4(x2+y2+3z2)]

jest dodatnio określona. Na przykład w punkcie P1=(14,14,14) macierz drugich pochodnych cząstkowych funkcji f

[541414145414141454]

ma wszystkie minory główne dodatnie:

A1=det[54]=54>0A2=det[54141454]=142det[5115]=2416>0A3=det[541414145414141454]=143det[511151115]=10864>0.

Stąd w punkcie P1 funkcja osiąga minimum lokalne równe f(P1)=3256. Podobne uzasadnienie prowadzi do wniosku, że także w pozostałych punktach P2, P3 oraz P4 funkcja osiąga minima lokalne.

Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie zrezygnować z analizy określoności drugiej różniczki. Punkty A1,A2,A3,A4 leżą we wnętrzu zbioru ograniczonego poziomicą zerową funkcji f, precyzyjniej: leżą w obszarze, gdzie funkcja

f jest ujemna. Ponieważ zbiór
{(x,y,z)3:f(x,y,z)0}

jest zwarty (gdyż jest domknięty i ograniczony), funkcja f, na mocy twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech punktach osiągać minima lokalne.

Uwagi o wyznaczaniu ekstremów funkcji wielu zmiennych

Badanie funkcji wielu zmiennych (w szczególności znajdywanie punktów ekstremalnych) w wielu przypadkach nie wymaga wyznaczania ani pierwszej, ani drugiej różniczki funkcji. Można bowiem sprowadzić ich badanie do badania funkcji jednej zmiennej.

Rozważmy kilka przykładów, w których funkcja dwóch zmiennych jest w istocie funkcją jednej zmiennej, a mianowicie: jest funkcją odległości od początku układu współrzędnych.

Przykład 8.18.

Funkcja f(x,y)=exp(x2y2) jest funkcją promienia r=x2+y2, gdyż f(x,y)=er2, gdzie r=x2+y2. Ponieważ funkcja rer2 osiąga wartość największą w punkcie r=0 i nie osiąga żadnych więcej ekstremów na półprostej 0r<, więc jedynym ekstremum funkcji f(x,y)=exp(x2y2) jest maksimum lokalne osiągane w punkcie (0,0) (tj. r=0). Wówczas f(0,0)=1.
wykres

Przykład 8.19.

Funkcja f(x,y)=sin(x2+y2) także jest funkcją promienia r=x2+y2. Zauważmy bowiem, że

f(x,y)=sin(x2+y2)=sin(r2cos2φ+r2sin2φ)=sin(r2)

osiąga ekstrema w tych samych punktach, co funkcja rsin(r2), a więc osiąga maksima w punktach r2=π2+2kπ i minima w punktach r2=3π2+2kπ, gdzie k=0,1,2,. Innymi słowy funkcja (x,y)f(x,y) osiąga maksima w punktach należących do okręgów o równaniach

{(x,y)2:x2+y2=π2+2kπ}

oraz w punkcie (0,0) (wtedy r=0), a minima w punktach należących do okręgów

{(x,y)2:x2+y2=3π2+2kπ},

gdzie k jest dowolną liczbą całkowitą nieujemną.


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/c/c6/Am2w08.0010.mgs.zip">
   <param name="scale" value="1.0 1.0 1.0">

<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>

<div.thumbcaption>Wykres funkcji f(x,y)=sin(x2+y2)


Przykład 8.20.

Podobnie jak w poprzednim przykładzie funkcja f(x,y)=cos(x2+y2)=cos(r2), r=x2+y2, osiąga maksima na okręgach o promieniach r takich, ze r2=0+2kπ, czyli na okręgach

{(x,y)2:x2+y2=2kπ},

natomiast minima na okręgach, których promień r spełnia równanie r2=π+2kπ, tj. na okręgach

{(x,y)2:x2+y2=(2k+1)π},

gdzie k=0,1,2, jest nieujemną liczbą całkowitą.
wykres

Przykład 8.21.

Także funkcja f(x,y)=ln(x2+y2+1)=ln(r2+1) jest funkcją promienia r=x2+y2. Ponieważ funkcja [0,)rr2+1 jest ściśle rosnąca, osiąga minimum w punkcie r=0. Stąd także funkcja f(x,y)=ln(x2+y2+1) osiąga minimum w punkcie (x,y)=(0,0) (wówczas r=0).
wykres

Również w wielu innych przykładach, gdy funkcja f nie jest funkcją promienia, można uniknąć stosowania rachunku różniczkowego do wyznaczenia ekstremów.

Przykład 8.22.

Funkcja f(x,y)=sin(x2y2) osiąga maksima w punktach hiperbol

{(x,y)2:x2y2=π2+2kπ},

a minima w punktach drugiej rodziny hiperbol

{(x,y)2:x2y2=3π2+2kπ},

gdzie k jest liczbą całkowitą.
wykres

Przykład 8.23.

Z kolei funkcja f(x,y)=cos(x2y2) osiąga maksima w punktach hiperbol

{(x,y)2:x2y2=2kπ},

a minima w punktach drugiej rodziny hiperbol

{(x,y)2:x2y2=(2k+1)π},

gdzie k jest liczbą całkowitą.
wykres

Uwaga 8.24.

Przypomnijmy także, że prosta obserwacja przebiegu poziomic pozwala stwierdzić, że

(a) funkcja f1(x,y)=x2+y2 osiąga w punkcie (0,0) minimum
wykres
(b) w tym samym punkcie funkcja f2(x,y)=x2y2 osiąga maksimum
wykres
(c) a funkcja f3(x,y)=x2y2 nie osiąga w punkcie (0,0) żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak i większe od zera.
wykres

Przykład 8.25.

Zauważmy, że każda z trzech funkcji a, b, c ma w punkcie (0,0) zerową zarówno pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu punktu (0,0) zarówno wartości mniejsze jak i większe od zera.

(a) f2(x,y)=x3y3
wykres


(b) f3(x,y)=x3y3
wykres
(c) f1(x,y)=x3+y3


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/1/10/Am2w08.0130.mgs.zip">
   <param name="scale" value="1.0 1.0 0.1">

<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet> <div.thumbcaption>Wykres funkcji

f1(x,y)=x3+y3


Należy pamiętać o analizowaniu otoczenia punktów krytycznych funkcji, w których o istnieniu ekstremów nie rozstrzyga warunek wystarczający.

Przykład 8.26.

Funkcja f(x,y)=|x|23+|y|23 jest ciągła na całej płaszczyźnie, nie jest jednak różniczkowalna w punktach należących do dwóch prostych: x=0 oraz y=0. Różniczka tej funkcji nie zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema prostymi x=0, y=0. Stąd zbiorem punktów krytycznych jest suma obu prostych:

{(x,y)2:x=0 lub y=0}.

Łatwo zauważyć, że jedynie w punkcie (0,0) tego zbioru funkcja f osiąga ekstremum, a mianowicie minimum f(0,0)=0.
wykres