Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Ekstrema funkcji wielu zmiennych.

Dowodzimy wzoru Taylora dla funkcji wielu zmiennych. Jego konsekwencją jest warunek wystarczający istnienia ekstremum. Pokazujemy szereg przykładów prowadzących do zastosowania wykazanego warunku wystarczającego oraz takich, w których nie jest to niezbędne.

Wzór Taylora dla funkcji wielu zmiennych

Niech f:XY będzie funkcją klasy Cm+1 określoną na otwartym podzbiorze U przestrzeni Banacha X o wartościach w przestrzeni Banacha Y. Podobnie jak w przypadku funkcji jednej zmiennej rzeczywistej zachodzi następujące

Twierdzenie 8.1. [twierdzenie Taylora]

Dla dowolnych punktów a oraz a+h zbioru U takich, że odcinek
Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \{a+th, \ t\in [0,1]\}\subset U,}

zachodzi równość

f(a+h)=f(a)+daf(h)+12!da2f(h,h)+13!da3f(h,h,h)++1m!damf(h,h,,h)m wektorów h+Rmf(a,h),
gdzie
Rmf(a,b)y1(m+1)!sup{|da+thm+1(h,h,,h)|, t[0,1]}.

Definicja 8.2.

Funkcję
Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned X\in h\mapsto T_a^m f(h) &= f(a)+d_a f(h)+\frac{1}{2!}d^2 _a f(h,h)+\dots+\frac{1}{m!}d^m _a f\underbrace{(h, h, \dots, h)}_{m \text{ razy }}\\&= \sum_{k=0}^m \frac{1}{k!}d^k_a\underbrace{(h, h, \dots, h)}_{k \text{ razy }}\in Y\endaligned }

nazywamy wielomianem Taylora rzędu m funkcji f o środku w punkcie

a.
Uwaga 8.3.

Zauważmy, że jeśli X=n i Y=, to wielomian Taylora funkcji f:n rzędu m o środku w punkcie a można wyrazić za pomocą pochodnych cząstkowych funkcji f w następujący sposób:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned T_a^m f(h)&=\sum_{k=0}^m \frac{1}{k!}\sum_{|\alpha|=k}\binom{k}{\alpha}\frac{\partial^k}{\partial x^\alpha}f(a)h^\alpha \\&=\sum_{k=0}^m \sum_{|\alpha|=k}\frac{1}{\alpha!}\frac{\partial^k}{\partial x^\alpha}f(a)h^\alpha \\&= \sum_{|\alpha|\leq m}\frac{1}{\alpha!}\frac{\partial^{|\alpha|}}{\partial x^\alpha}f(a)h^\alpha ,\endaligned }

gdzie α=(α1,α2,,αn)0n jest n-wskaźnikiem o długości |α|=α1+α2++αn. (Oznaczenia: α!, hα, kxα wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W szczególnym (ale bardzo często spotykanym) przypadku funkcji f:2(x1,x2)f(x1,x2) dwóch zmiennych x1,x2 wielomian Taylora o środku w punkcie a=(a1,a2)2 przyjmuje postać

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned T_a ^m f(h)&=\sum_{k=0}^m \sum_{\alpha_1+\alpha_2=k} \frac{1}{\alpha_1 !\alpha_2 !}\frac{\partial^k f(a)}{\partial x_1^{\alpha_1}\partial x_2^{\alpha_2}}h_1^{\alpha_1}h_2^{\alpha_2}\\&=\sum_{\alpha_1+\alpha_2\leq m} \frac{1}{\alpha_1 !\alpha_2 !}\frac{\partial^{\alpha_1+\alpha_2} f(a)}{\partial x_1^{\alpha_1}\partial x_2^{\alpha_2}}h_1^{\alpha_1}h_2^{\alpha_2},\endaligned }

gdzie h=(h1,h2)2.

Dowód 8.3.

Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy f:XU jest funkcją o wartościach rzeczywistych, określoną na otwartym podzbiorze U przestrzeni Banacha X. Niech, zgodnie z założeniem, a oraz a+h będą takimi

punktami zbioru U, że odcinek {a+th,0t1}U. Rozważmy funkcję
g:(0ϵ,1+ϵ)tf(a+th)

określoną w pewnym otoczeniu otwartym odcinka [0,1]. Funkcja g jest w tym zbiorze klasy Cm+1, gdyż f jest tej klasy w otoczeniu odcinka {a+th, 0t1}U. Ponadto z twierdzenia o różniczkowaniu złożenia funkcji mamy dla dowolnej liczby 0t1 równość

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \frac{d^k}{dt^k}g(0)=d^k_a f\circ \underbrace{(d_0 (a+th), d_0 (a+th), \dots, d_0 (a+th))}_{k \text{ razy}} =d^k_a f\underbrace{(h, h, \dots, h)}_{k \text{ razy}}.}

Ze twierdzenia Taylora dla funkcji jednej zmiennej g oraz z powyższej równości mamy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned f(a+h)=&g(0+1)\\&=g(0)+g'(0)1+\frac{1}{2!}g''(0)1^2+\dots+\frac{1}{m!}g^{(m)}(0)1^m+\frac{1}{(m+1)!}g^{(m+1)}(0+\theta \cdot 1)1^{m+1}\\&=f(a)+d_a f(h)+\frac{1}{2!}d^2_a f(h,h)+\dots+\frac{1}{m!}d^m_a f(h,h,\dots, h)+\frac{1}{(m+1)!}d^{m+1}_{a+\theta h} f(h,h,\dots, h, h),\endaligned }

gdzie θ(0,1) jest pewnym punktem pośrednim. Stąd mamy też oszacowanie reszty we wzorze Taylora:

|Rmf(a,h)|=|1(m+1)!da+θhm+1f(h,h,,h,h|1(m+1)!sup{|da+θhm+1f(h,h,,h,h)|,0θ1}.

Ekstrema funkcji wielu zmiennych

Pamiętamy, że dowolna przestrzeń unormowana X jest przestrzenią metryczną z metryką d(x,y)=xy zadaną przez normę przestrzeni X. Stąd też definicja ekstremum funkcji f:X o wartościach rzeczywistych określonej na przestrzeni unormowanej jest taka sama jak w przypadku przestrzeni metrycznej, czyli funkcja f przyjmuje w punkcie adomf minimum lokalne (odpowiednio: maksimum lokalne, ścisłe minimum lokalne, ścisłe maksimum lokalne), jeśli istnieje liczba δ>0 taka, że zachodzą odpowiednio implikacje:

d(x,a)<δf(x)f(a)
d(x,a)<δf(x)f(a)
0<d(x,a)<δf(x)>f(a)
0<d(x,a)<δf(x)<f(a).

Minimum funkcji w punkcie a nazywamy globalnym, jeśli f osiąga w punkcie a kres dolny wartości. Jeśli zaś w punkcie a funkcja osiąga kres górny, to mówimy, że osiąga w punkcie a maksimum globalne.

Sformułujmy wpierw warunek konieczny istnienia ekstremum funkcji f.

Twierdzenie 8.4.

Jeśli funkcja różniczkowalna f:XU osiąga ekstremum w punkcie a zbioru otwartego U, to w punkcie tym zeruje się różniczka funkcji f, tzn. daf(h)=0, gdzie hX jest dowolnym wektorem

przestrzeni X.

Dowód 8.4.

Załóżmy, że funkcja f osiąga maksimum lokalne w punkcie aU. Ustalmy pewien wektor hX, h=1 i rozważmy

zacieśnienie funkcji f do prostej
{a+th,t}

o kierunku h przechodzącej przez punkt a. Zacieśnienie to

tf(a+th)

jest funkcją jednej zmiennej, osiągającą maksimum w t=0. Stąd pochodna w zerze funkcji tf(a+th) jest równa zeru. Ale pochodna ta jest tożsama z pochodną kierunkową funkcji f w kierunku wektora h. Wobec dowolności h różniczka daf=0.

Uwaga 8.5.
Zwróćmy uwagę, że funkcja może osiągać ekstremum w punkcie, w którym nie jest różniczkowalna. Na przykład f(x,y)=|x|+|y| osiąga wartość minimalną w punkcie (0,0), w którym nie jest różniczkowalna.


<applet code="applet.class" archive="images/a/a0/Javaview.jar,images/e/e1/Applet.jar" width="456" height="406">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip">
   <param name="scale" value="1.0 1.0 0.1">
   <param name="shading" value="0.2">

</applet>


Wykres funkcji f(x,y)=|x|+|y|


Przyjmijmy wobec tego następującą definicję.

Definicja 8.6.

Mówimy, że adomf jest punktem krytycznym funkcji f, jeśli a należy do dziedziny różniczki funkcji f i różniczka zeruje się w tym punkcie, bądź też punkt a należy do dziedziny funkcji i nie istnieje różniczka daf.

Wniosek 8.7.

Jeśli funkcja f osiąga ekstremum w punkcie adomf, to punkt ten jest krytyczny.

Implikacja te stanowi warunek konieczny istnienia ekstremum także w przypadku funkcji, od których nie żądamy różniczkowalności w otoczeniu wszystkich punktów dziedziny.

Wzór Taylora umożliwia, podobnie jak w przypadku jednowymiarowym, sformułowanie warunku wystarczającego istnienia ekstremum.

Definicja 8.8.

Niech AL2(X,) będzie odwzorowaniem dwuliniowym symetrycznym określonym na X×X, gdzie X jest pewną przestrzenią Banacha. Mówimy, że forma

kwadratowa
XhA(h,h)

jest

  • dodatnio określona, jeśli istnieje stała C>0 taka, że
A(h,h)Ch2, dla dowolnego wektora hX,
  • ujemnie określona, jeśli istnieje stała C>0 taka, że
A(h,h)Ch2, dla dowolnego wektora hX,
  • nieujemnie określona, jeśli
A(h,h)0, dla dowolnego wektora hX,
  • niedodatnio określona, jeśli
A(h,h)0, dla dowolnego wektora hX,
  • nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie,

ani nieujemnie, ani niedodatnio określona.

Często mówimy też, że odwzorowanie dwuliniowe symetryczne AL2(X,) jest dodatnio określone (odpowiednio: ujemnie określone, nieujemnie określone, niedodatnio określone, nieokreślone), jeśli forma kwadratowa hA(h,h) jest określona dodatnio (odpowiednio: określona ujemnie, określona nieujemnie, określona niedodatnio, bądź jest nieokreślona).

Uwaga 8.9.

a) Forma kwadratowa hA(h,h) jest dodatnio określona wtedy i tylko wtedy, gdy forma hA(h,h) jest ujemnie określona.

b) Forma kwadratowa hA(h,h) jest nieujemnie określona wtedy i tylko wtedy, gdy forma hA(h,h) jest niedodatnio określona.

c) Forma kwadratowa hA(h,h) jest nieokreślona wtedy i tylko wtedy, gdy nieokreślona jest forma hA(h,h).

Korzystając ze wzoru Taylora, wykażemy warunek wystarczający istnienia ekstremum funkcji wielu zmiennych.

Twierdzenie 8.10.

Niech f będzie funkcją klasy C2 w otwartym otoczeniu U punktu a. Załóżmy, że różniczka funkcji f w punkcie a jest równa zeru.

a) Jeśli druga różniczka da2f jest dodatnio określona, funkcja f osiąga ścisłe minimum lokalne w punkcie a.

b) Jeśli druga różniczka da2f jest ujemnie określona, funkcja f osiąga ścisłe maksimum lokalne w punkcie a.

c) Jeśli druga różniczka da2f jest nieokreślona, funkcja f

nie osiąga ekstremum w punkcie a.

Dowód 8.10.

a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce: daf=0) dostajemy równość prawdziwą w otoczeniu punktu a na tyle małym, aby odcinek {a+th,0t1} był w nim zawarty.

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned f(a+h)&=f(a)+d_a f (h)+\frac{1}{2}d^2_{a+\theta h} f(h,h) \\&=f(a)+0+\frac{1}{2}d^2_{a+\theta h} f(h,h),\endaligned }
czyli
f(a+h)f(a)=12da+θh2f(h,h),

gdzie 0<θ<1 jest pewną liczbą. Jeśli forma hda2f(h,h) jest dodatnio określona, to wobec ciągłości drugiej różniczki, również w pewnym małym otoczeniu punktu a w punkcie a+θh forma hda+θh2f(h,h) jest dodatnio określona. Wobec tego

f(a+h)f(a)=12da+θh2f(h,h)>0,

czyli f(a+h)>f(a) dla dowolnego niezerowego wektora h z pewnego małego otoczenia punktu 0. Oznacza to, że funkcja f osiąga w tym punkcie ścisłe minimum lokalne.

b) Podobnie jak w punkcie a) wykazujemy, że funkcja f osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie określona w punkcie, w którym zeruje się jej pierwsza różniczka.

c) Jeśli druga różniczka da2f jest nieokreślona, to istnieją dwa wektory h,kX takie, że da2f(h,h)>0 natomiast da2f(k,k)<0. Jeśli więc zacieśnimy funkcję f do prostej o

kierunku h:
a+h={a+th,t}X,

to na prostej tej w pewnym małym otoczeniu punktu a (dla t bliskich zeru) otrzymamy nierówność:

f(a+th)f(a)=12da+θth2f(th,th)>0,

natomiast na prostej o kierunku k:

a+k={a+tk,t}X,

dostaniemy, podobnie w małym otoczeniu punktu a, nierówność przeciwną:

f(a+tk)f(a)=12da+θtk2f(tk,tk)<0.

Stąd funkcja f nie osiąga w punkcie a żadnego ekstremum, gdyż w dowolnie małym otoczeniu punktu a przyjmuje zarówno wartości mniejsze, jak i większe od f(a).

Uwaga 8.11.

Twierdzenie nie rozstrzyga o istnieniu ekstremum ani o jego typie, gdy druga różniczka da2f jest niedodatnio lub nieujemnie określona. Rozważmy trzy proste

przykłady.

Przykład 8.12.

Funkcja f(x,y)=x4+y4 osiąga w punkcie (0,0) ścisłe minimum lokalne równe zeru, gdyż dla dowolnego punktu (x,y)(0,0) mamy f(x,y)>0.
zobacz wykres Wykres.jpg)

Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka funkcji f w punkcie (0,0) zerują się. W szczególności druga różniczka jest nieujemnie określona w każdym punkcie płaszczyzny 2, gdyż dla dowolnego wektora h=(h1,h2)2 mamy

d(x,y)2(h,h)=12(x2h12+y2h22)0.

W szczególności

d(0,0)2(h,h)=12(02h12+02h22)=00.

Przykład 8.13.

Funkcja f(x,y)=x4y4 osiąga w punkcie (0,0) ścisłe maksimum lokalne równe zeru, gdyż dla dowolnego punktu (x,y)(0,0) mamy f(x,y)<0.

{ [Rysunek am2w08.0110] Wykres funkcji f(x,y)=x4y4}

Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie zarówno pierwsza jak i druga różniczka funkcji f w punkcie (0,0) zerują się. W szczególności druga różniczka jest niedodatnio określona w każdym punkcie płaszczyzny 2, gdyż dla dowolnego wektora h=(h1,h2)2 mamy

d(x,y)2(h,h)=12(x2h12+y2h22)0.

W szczególności

d(0,0)2(h,h)=12(02h12+02h22)=00.

Przykład 8.14.

Funkcja f(x,y)=x4y4 nie osiąga w punkcie (0,0) żadnego ekstremum, gdyż dla dowolnego punktu (x,0)(0,0) mamy f(x,0)>0, natomiast w punktach (0,y)(0,0) mamy z kolei f(0,y)<0.

{ [Rysunek am2w08.0120] Wykres funkcji f(x,y)=x4y4}

Zwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji f zerują się w punkcie (0,0). W punktach h=(h1,h2)(0,0), tj. poza początkiem układu współrzędnych, druga różniczka

d(x,y)2(h,h)=12(x2h12y2h22)

jest nieokreślona, bo w punktach (x,0)(0,0) forma kwadratowa hd(x,y)2f jest dodatnia, a w punktach (0,y)(0,0) jest ujemna. W samym zaś punkcie (0,0) forma

kwadratowa
d(0,0)2(h,h)=12(02h1202h22)=0

jest zerowa. Analiza formy kwadratowej w otoczeniu punktu (0,0) pozwala nam jednak dostrzec, że zacieśnienie funkcji f do prostej y=0 (tj. w punktach postaci (x,0)) jest funkcją f(x,0)=x4, która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej x=0 (czyli w punktach postaci (0,y)) funkcja f(0,y)=y4 osiąga maksimum w punkcie y=0. Stąd funkcja (x,y)f(x,y) nie osiąga żadnego ekstremum w

punkcie (0,0)

Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności drugiej różniczki w przpadku funkcji wielu zmiennych.

Niech A=[aij], i,j=1,2,,n, będzie macierzą kwadratową symetryczną (tzn. aij=aji dla dowolnych i,j). Niech

Ak:=det[a11a1kak1akk]

będzie minorem głównym rzędu k macierzy A, k{1,2,,n}.

Twierdzenie 8.15. [twierdzenie Sylvestera]

Forma kwadratowa nhi=1nj=1naijhihj zadana przez symetryczną macierz kwadratową A=[aij], i,j=1,2,,n, jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie minory główne macierzy A są dodatnie, tzn. Ak>0

dla dowolnego k{1,2,,n}.

Dowód 8.15.

Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz A będzie złożona z jednej liczby [a11]. Należy zauważyć, że forma ha11h2 jest dodatnio określona wtedy i tylko wtedy, gdy a11>0. Następnie dowodzi się implikacji, że z dodatniej określoności formy zadanej przez macierz A~=[aij], i,j=1,2,,n1 wobec założenia o dodatniości minora An=det[aij], i,j=1,2,,n, wynika dodatnia określoność formy kwadratowej zadanej przez macierz A=[aij],i,j=1,2,,n. Szczegóły (które pomijamy) można znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,

Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.)

Ponieważ forma kwadratowa hA(h,h) jest ujemnie określona wtedy i tylko wtedy, gdy hA(h,h) jest dodatnio określona, twierdzenie Sylvestera pozwala nam również stwierdzić, kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy mianowicie

Wniosek 8.16.

Jeśli A=[aij],i,j=1,2,,n, jest symetryczną macierzą kwadratową, to forma kwadratowa

nhi=1nj=1naijhihj

jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego są dodatnie, tzn. gdy

(1)kAk>0,   k{1,2,,n}.

Przykład 8.17.

Wyznaczmy ekstrema funkcji

3(x,y,z)f(x,y,z)=(x2+y2+z2)23xyz.

Różniczka tej funkcji zeruje się w punktach, których współrzędne

spełniają układ równań
Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \left\{\aligned \frac{\partial f}{\partial x}&=0\\\frac{\partial f}{\partial y}&=0\\\frac{\partial f}{\partial z}&=0,\endaligned\right. \text{ czyli } \left\{\aligned 4(x^2+y^2+z^2)x&=3yz \\ 4(x^2+y^2+z^2)y&=3xz \\ 4(x^2+y^2+z^2)z&=3xy. \endaligned\right.}

Układ ten spełniają współrzędne pięciu punktów

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned P_0&=(0,0,0), \\ P_1&=\big(\frac{1}{4},\frac{1}{4},\frac{1}{4}\big), \\ P_2&=\big(\frac{1}{4},-\frac{1}{4},-\frac{1}{4}\big), \\ P_3&=\big(-\frac{1}{4},\frac{1}{4},-\frac{1}{4}\big), \\ P_4&=\big(-\frac{1}{4},-\frac{1}{4},\frac{1}{4}\big). \endaligned}

Łatwo zauważyć, że w punkcie P0 funkcja nie osiąga ekstremum, gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno wartości mniejsze jak i większe od f(P0)=0. Na przykład na prostej o kierunku (1,1,1) przechodzącej przez punkt

P0=(0,0,0), tj. na zbiorze
P0+(1,1,1)={(t,t,t),t},

funkcja

f(t,t,t)=(t2+t2+t2)23t3=3t3(3t1)

przyjmuje w otoczeniu zera zarówno dodatnie wartości (np. gdy t<0) jak i ujemne (np. gdy 0<t<13). W pozostałych czterech punktach macierz drugich pochodnych cząstkowych, która zadaje drugą różniczkę

[4(3x2+y2+z2)8xy3z8xz3y8xy3z4(x2+3y2+z2)8yz3x8xz3y8yz3x4(x2+y2+3z2)]

jest dodatnio określona. Na przykład w punkcie P1=(14,14,14) macierz drugich pochodnych cząstkowych funkcji f

[541414145414141454]

ma wszystkie minory główne dodatnie:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned A_1&=\det\left[\frac{5}{4}\right]=\frac{5}{4}>0 \\A_2&=\det\left[\begin{array}{rr} \frac{5}{4} &-\frac{1}{4} \\ -\frac{1}{4} &\frac{5}{4}\end{array} \right] =\frac{1}{4^2}\det\left[\begin{array}{rr} 5 &-1\\-1 &5\end{array} \right]=\frac{24}{16}>0\\ \\A_3&=\det \left[\begin{array}{rrr} \frac{5}{4} &-\frac{1}{4} &-\frac{1}{4}\\ -\frac{1}{4} &\frac{5}{4} &-\frac{1}{4}\\ -\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]= \frac{1}{4^3}\det\left[\begin{array}{rrr} 5 &-1&-1\\-1 &5 &-1\\-1 &-1& 5\end{array} \right]=\frac{108}{64}>0.\endaligned}

Stąd w punkcie P1 funkcja osiąga minimum lokalne równe f(P1)=3256. Podobne uzasadnienie prowadzi do wniosku, że także w pozostałych punktach P2, P3 oraz P4 funkcja osiąga minima lokalne.

{ [[Powtórzyć rysunek i animację am2w09.0010]]}

Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie zrezygnować z analizy określoności drugiej różniczki. Punkty A1,A2,A3,A4 leżą we wnętrzu zbioru ograniczonego poziomicą zerową funkcji f, precyzyjniej: leżą w obszarze, gdzie funkcja

f jest ujemna. Ponieważ zbiór
{(x,y,z)3:f(x,y,z)0}

jest zwarty (gdyż jest domknięty i ograniczony), funkcja f, na mocy twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech punktach osiągać minima lokalne.

Uwagi o wyznaczaniu ekstremów funkcji wielu zmiennych

Badanie funkcji wielu zmiennych (w szczególności znajdywanie punktów ekstremalnych) w wielu przypadkach nie wymaga wyznaczania ani pierwszej, ani drugiej różniczki funkcji. Można bowiem sprowadzić ich badanie do badania funkcji jednej zmiennej.

Rozważmy kilka przykładów, w których funkcja dwóch zmiennych jest w istocie funkcją jednej zmiennej, a mianowicie: jest funkcją odległości od początku układu współrzędnych.

Przykład 8.18.

Funkcja f(x,y)=exp(x2y2) jest funkcją promienia r=x2+y2, gdyż f(x,y)=er2, gdzie r=x2+y2. Ponieważ funkcja rer2 osiąga wartość największą w punkcie r=0 i nie osiąga żadnych więcej ekstremów na półprostej 0r<, więc jedynym ekstremum funkcji f(x,y)=exp(x2y2) jest maksimum lokalne osiągane w punkcie (0,0) (tj. r=0). Wówczas f(0,0)=1.

{ [Rysunek am2w08.0060] Wykres funkcji f(x,y)=exp(x2y2)}

Przykład 8.19.

Funkcja f(x,y)=sin(x2+y2) także jest funkcją promienia r=x2+y2. Zauważmy bowiem, że

f(x,y)=sin(x2+y2)=sin(r2cos2φ+r2sin2φ)=sin(r2)

osiąga ekstrema w tych samych punktach, co funkcja rsin(r2), a więc osiąga maksima w punktach r2=π2+2kπ i minima w punktach r2=3π2+2kπ, gdzie k=0,1,2,. Innymi słowy funkcja (x,y)f(x,y) osiąga maksima w punktach należących do okręgów o równaniach

{(x,y)2:x2+y2=π2+2kπ}

oraz w punkcie (0,0) (wtedy r=0), a minima w punktach należących do okręgów

{(x,y)2:x2+y2=3π2+2kπ},

gdzie k jest dowolną liczbą całkowitą nieujemną.

{ [Rysunek am2w08.0010] Wykres funkcji f(x,y)=sin(x2+y2)}

Przykład 8.20.

Podobnie jak w poprzednim przykładzie funkcja f(x,y)=cos(x2+y2)=cos(r2), r=x2+y2, osiąga maksima na okręgach o promieniach r takich, ze r2=0+2kπ, czyli na okręgach

{(x,y)2:x2+y2=2kπ},

natomiast minima na okręgach, których promień r spełnia równanie r2=π+2kπ, tj. na okręgach

{(x,y)2:x2+y2=(2k+1)π},

gdzie k=0,1,2, jest nieujemną liczbą całkowitą.

{ [Rysunek am2w08.0020] Wykres funkcji f(x,y)=cos(x2+y2)}

Przykład 8.21.

Także funkcja f(x,y)=ln(x2+y2+1)=ln(r2+1) jest funkcją promienia r=x2+y2. Ponieważ funkcja [0,)rr2+1 jest ściśle rosnąca, osiąga minimum w punkcie r=0. Stąd także funkcja f(x,y)=ln(x2+y2+1) osiąga minimum w punkcie (x,y)=(0,0) (wówczas r=0).

{ [Rysunek am2w08.0050] Wykres funkcji f(x,y)=ln(x2+y2+1)}

Również w wielu innych przykładach, gdy funkcja f nie jest funkcją promienia, można uniknąć stosowania rachunku różniczkowego do wyznaczenia ekstremów.

Przykład 8.22.

Funkcja f(x,y)=sin(x2y2) osiąga maksima w punktach hiperbol

{(x,y)2:x2y2=π2+2kπ},

a minima w punktach drugiej rodziny hiperbol

{(x,y)2:x2y2=3π2+2kπ},

gdzie k jest liczbą całkowitą.

{ [Rysunek am2w08.0030] Wykres funkcji f(x,y)=sin(x2y2)}

Przykład 8.23.

Z kolei funkcja f(x,y)=cos(x2y2) osiąga maksima w punktach hiperbol

{(x,y)2:x2y2=2kπ},

a minima w punktach drugiej rodziny hiperbol

{(x,y)2:x2y2=(2k+1)π},

gdzie k jest liczbą całkowitą.

{ [Rysunek am2w08.0040] Wykres funkcji f(x,y)=cos(x2y2)}

Uwaga 8.24.

Przypomnijmy także, że prosta obserwacja przebiegu poziomic pozwala stwierdzić, że

{ [Rysunek am2w08.0070] Wykres funkcji f1(x,y)=x2+y2}

  • funkcja f1(x,y)=x2+y2 osiąga w punkcie (0,0) minimum,

{ [Rysunek am2w08.0080] Wykres funkcji f2(x,y)=x2y2}

  • w tym samym punkcie funkcja f2(x,y)=x2y2 osiąga maksimum

{ [Rysunek am2w08.0090] Wykres funkcji f3(x,y)=x2y2}

  • a funkcja f3(x,y)=x2y2 nie osiąga w punkcie (0,0)

żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak i większe od zera.

Przykład 8.25.

Zauważmy, że każda z trzech funkcji

{ [Rysunek am2w08.0130] Wykres funkcji f1(x,y)=x3+y3 }

f1(x,y)=x3+y3

{ [Rysunek am2w08.0140] Wykres funkcji f2(x,y)=x3y3}

f2(x,y)=x3y3

{ [Rysunek am2w08.0150] Wykres funkcji f3(x,y)=x3y3}

oraz f3(x,y)=x3y3 ma w punkcie (0,0) zerową zarówno pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu punktu (0,0) zarówno wartości mniejsze jak i większe od zera.

Należy pamiętać o analizowaniu otoczenia punktów krytycznych funkcji, w których o istnieniu ekstremów nie rozstrzyga warunek wystarczający.

Przykład 8.26.

Funkcja f(x,y)=|x|23+|y|23 jest ciągła na całej płaszczyźnie, nie jest jednak różniczkowalna w punktach należących do dwóch prostych: x=0 oraz y=0. Różniczka tej funkcji nie zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema prostymi x=0, y=0. Stąd zbiorem punktów krytycznych jest suma obu prostych:

{(x,y)2:x=0 lub y=0}.

Łatwo zauważyć, że jedynie w punkcie (0,0) tego zbioru funkcja f osiąga ekstremum, a mianowicie minimum f(0,0)=0.

{ [[Powtórzyć rysunek i animację am2w05.0120]]}