Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Ekstrema funkcji wielu zmiennych.

Dowodzimy wzoru Taylora dla funkcji wielu zmiennych. Jego konsekwencją jest warunek wystarczający istnienia ekstremum. Pokazujemy szereg przykładów prowadzących do zastosowania wykazanego warunku wystarczającego oraz takich, w których nie jest to niezbędne.

Wzór Taylora dla funkcji wielu zmiennych

Niech będzie funkcją klasy określoną na otwartym podzbiorze przestrzeni Banacha o wartościach w przestrzeni Banacha . Podobnie jak w przypadku funkcji jednej zmiennej rzeczywistej zachodzi następujące

Twierdzenie 8.1. [twierdzenie Taylora]

Dla dowolnych punktów oraz zbioru takich, że odcinek

zachodzi równość

gdzie

Definicja 8.2.

Funkcję
nazywamy wielomianem Taylora rzędu funkcji o środku w punkcie .
Uwaga 8.3.

Zauważmy, że jeśli i , to wielomian Taylora funkcji rzędu o środku w punkcie można wyrazić za pomocą pochodnych cząstkowych funkcji w następujący sposób:

gdzie jest -wskaźnikiem o długości . (Oznaczenia: , , wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W szczególnym (ale bardzo często spotykanym) przypadku funkcji dwóch zmiennych wielomian Taylora o środku w punkcie przyjmuje postać

gdzie .

Dowód 8.3.

Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy jest funkcją o wartościach rzeczywistych, określoną na otwartym podzbiorze przestrzeni Banacha . Niech, zgodnie z założeniem, oraz będą takimi

punktami zbioru , że odcinek . Rozważmy funkcję

określoną w pewnym otoczeniu otwartym odcinka . Funkcja jest w tym zbiorze klasy , gdyż jest tej klasy w otoczeniu odcinka . Ponadto z twierdzenia o różniczkowaniu złożenia funkcji mamy dla dowolnej liczby równość

Ze twierdzenia Taylora dla funkcji jednej zmiennej oraz z powyższej równości mamy

gdzie jest pewnym punktem pośrednim. Stąd mamy też oszacowanie reszty we wzorze Taylora:

End of proof.gif

Ekstrema funkcji wielu zmiennych

Pamiętamy, że dowolna przestrzeń unormowana jest przestrzenią metryczną z metryką zadaną przez normę przestrzeni . Stąd też definicja ekstremum funkcji o wartościach rzeczywistych określonej na przestrzeni unormowanej jest taka sama jak w przypadku przestrzeni metrycznej, czyli funkcja przyjmuje w punkcie minimum lokalne (odpowiednio: maksimum lokalne, ścisłe minimum lokalne, ścisłe maksimum lokalne), jeśli istnieje liczba taka, że zachodzą odpowiednio implikacje:

Minimum funkcji w punkcie nazywamy globalnym, jeśli osiąga w punkcie kres dolny wartości. Jeśli zaś w punkcie funkcja osiąga kres górny, to mówimy, że osiąga w punkcie maksimum globalne.

Sformułujmy wpierw warunek konieczny istnienia ekstremum funkcji .

Twierdzenie 8.4.

Jeśli funkcja różniczkowalna osiąga ekstremum w punkcie zbioru otwartego , to w punkcie tym zeruje się różniczka funkcji , tzn. , gdzie jest dowolnym wektorem

przestrzeni .

Dowód 8.4.

Załóżmy, że funkcja osiąga maksimum lokalne w punkcie . Ustalmy pewien wektor , i rozważmy

zacieśnienie funkcji do prostej

o kierunku przechodzącej przez punkt . Zacieśnienie to

jest funkcją jednej zmiennej, osiągającą maksimum w . Stąd pochodna w zerze funkcji jest równa zeru. Ale pochodna ta jest tożsama z pochodną kierunkową funkcji w kierunku wektora . Wobec dowolności różniczka .

End of proof.gif
Uwaga 8.5.
Zwróćmy uwagę, że funkcja może osiągać ekstremum w punkcie, w którym nie jest różniczkowalna. Na przykład osiąga wartość minimalną w punkcie , w którym nie jest różniczkowalna.


 <applet code="JavaviewModApplet.class" height="400" width="450" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar">
   <param name="colors" value="-1:#7e0b9f -0.82:#7e0b9f -0.81:#ce3bf8 -0.64:#ce3bf8 -0.63:#2c4ae5 -0.46:#2c4ae5 -0.45:#2c85e5 -0.28:#2c85e5 -0.27:#2ecca9 -0.10:#2ecca9 -0.09:#2ecc5b 0.09:#2ecc5b 0.10:#97cc2e 0.27:#97cc2e 0.28:#edff27 0.45:#edff27 0.46:#ffba27 0.63:#ffba27 0.64:#ff6e27 0.81:#ff6e27 0.82:#d42555 1:#d42525">
   <param name="coloring" value="mathematica">
   <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip">
   <param name="scale" value="1.0 1.0 0.5">

<param name="shading" value="0.2"> <param name="animation" value="stop">

 </applet>
<div.thumbcaption>Wykres funkcji


Przyjmijmy wobec tego następującą definicję.

Definicja 8.6.

Mówimy, że jest punktem krytycznym funkcji , jeśli należy do dziedziny różniczki funkcji i różniczka zeruje się w tym punkcie, bądź też punkt należy do dziedziny funkcji i nie istnieje różniczka .

Wniosek 8.7.

Jeśli funkcja osiąga ekstremum w punkcie , to punkt ten jest krytyczny.

Implikacja te stanowi warunek konieczny istnienia ekstremum także w przypadku funkcji, od których nie żądamy różniczkowalności w otoczeniu wszystkich punktów dziedziny.

Wzór Taylora umożliwia, podobnie jak w przypadku jednowymiarowym, sformułowanie warunku wystarczającego istnienia ekstremum.

Definicja 8.8.

Niech będzie odwzorowaniem dwuliniowym symetrycznym określonym na , gdzie jest pewną przestrzenią Banacha. Mówimy, że forma

kwadratowa

jest

  • dodatnio określona, jeśli istnieje stała taka, że
  • ujemnie określona, jeśli istnieje stała taka, że
  • nieujemnie określona, jeśli
  • niedodatnio określona, jeśli
  • nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie,

ani nieujemnie, ani niedodatnio określona.

Często mówimy też, że odwzorowanie dwuliniowe symetryczne jest dodatnio określone (odpowiednio: ujemnie określone, nieujemnie określone, niedodatnio określone, nieokreślone), jeśli forma kwadratowa jest określona dodatnio (odpowiednio: określona ujemnie, określona nieujemnie, określona niedodatnio, bądź jest nieokreślona).

Uwaga 8.9.

a) Forma kwadratowa jest dodatnio określona wtedy i tylko wtedy, gdy forma jest ujemnie określona.

b) Forma kwadratowa jest nieujemnie określona wtedy i tylko wtedy, gdy forma jest niedodatnio określona.

c) Forma kwadratowa jest nieokreślona wtedy i tylko wtedy, gdy nieokreślona jest forma .

Korzystając ze wzoru Taylora, wykażemy warunek wystarczający istnienia ekstremum funkcji wielu zmiennych.

Twierdzenie 8.10.

Niech będzie funkcją klasy w otwartym otoczeniu punktu . Załóżmy, że różniczka funkcji w punkcie jest równa zeru.

a) Jeśli druga różniczka jest dodatnio określona, funkcja osiąga ścisłe minimum lokalne w punkcie .

b) Jeśli druga różniczka jest ujemnie określona, funkcja osiąga ścisłe maksimum lokalne w punkcie .

c) Jeśli druga różniczka jest nieokreślona, funkcja

nie osiąga ekstremum w punkcie .

Dowód 8.10.

a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce: ) dostajemy równość prawdziwą w otoczeniu punktu na tyle małym, aby odcinek był w nim zawarty.

czyli

gdzie jest pewną liczbą. Jeśli forma jest dodatnio określona, to wobec ciągłości drugiej różniczki, również w pewnym małym otoczeniu punktu w punkcie forma jest dodatnio określona. Wobec tego

czyli dla dowolnego niezerowego wektora z pewnego małego otoczenia punktu . Oznacza to, że funkcja osiąga w tym punkcie ścisłe minimum lokalne.

b) Podobnie jak w punkcie a) wykazujemy, że funkcja osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie określona w punkcie, w którym zeruje się jej pierwsza różniczka.

c) Jeśli druga różniczka jest nieokreślona, to istnieją dwa wektory takie, że natomiast . Jeśli więc zacieśnimy funkcję do prostej o

kierunku :

to na prostej tej w pewnym małym otoczeniu punktu (dla bliskich zeru) otrzymamy nierówność:

natomiast na prostej o kierunku :

dostaniemy, podobnie w małym otoczeniu punktu , nierówność przeciwną:

Stąd funkcja nie osiąga w punkcie żadnego ekstremum, gdyż w dowolnie małym otoczeniu punktu przyjmuje zarówno wartości mniejsze, jak i większe od .

End of proof.gif
Uwaga 8.11.
Twierdzenie nie rozstrzyga o istnieniu ekstremum ani o jego typie, gdy druga różniczka jest niedodatnio lub nieujemnie określona. Rozważmy trzy proste przykłady.

Przykład 8.12.

Funkcja osiąga w punkcie ścisłe minimum lokalne równe zeru, gdyż dla dowolnego punktu mamy .

Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka funkcji w punkcie zerują się. W szczególności druga różniczka jest nieujemnie określona w każdym punkcie płaszczyzny , gdyż dla dowolnego wektora mamy

W szczególności

Wykres.gif wykres

Przykład 8.13.

Funkcja osiąga w punkcie ścisłe maksimum lokalne równe zeru, gdyż dla dowolnego punktu mamy .

Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie zarówno pierwsza jak i druga różniczka funkcji w punkcie zerują się. W szczególności druga różniczka jest niedodatnio określona w każdym punkcie płaszczyzny , gdyż dla dowolnego wektora mamy

W szczególności

Wykres.gif wykres

Przykład 8.14.

Funkcja nie osiąga w punkcie żadnego ekstremum, gdyż dla dowolnego punktu mamy , natomiast w punktach mamy z kolei

Zwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji zerują się w punkcie . W punktach , tj. poza początkiem układu współrzędnych, druga różniczka

jest nieokreślona, bo w punktach forma kwadratowa jest dodatnia, a w punktach

jest ujemna. W samym zaś punkcie forma kwadratowa

jest zerowa. Analiza formy kwadratowej w otoczeniu punktu pozwala nam jednak dostrzec, że zacieśnienie funkcji do prostej (tj. w punktach postaci ) jest funkcją , która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej (czyli w punktach postaci ) funkcja osiąga maksimum w punkcie . Stąd funkcja nie osiąga żadnego ekstremum w punkcie .


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/4/47/Am2w08.0120.mgs.zip">
   <param name="scale" value="1.0 1.0 0.05">

<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>

<div.thumbcaption>Wykres funkcji


Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności drugiej różniczki w przpadku funkcji wielu zmiennych.

Niech , , będzie macierzą kwadratową symetryczną (tzn. dla dowolnych ). Niech

będzie minorem głównym rzędu macierzy , .

Twierdzenie 8.15. [twierdzenie Sylvestera]

Forma kwadratowa zadana przez symetryczną macierz kwadratową , , jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie minory główne macierzy są dodatnie, tzn.

dla dowolnego .

Dowód 8.15.

Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz będzie złożona z jednej liczby . Należy zauważyć, że forma jest dodatnio określona wtedy i tylko wtedy, gdy . Następnie dowodzi się implikacji, że z dodatniej określoności formy zadanej przez macierz , wobec założenia o dodatniości minora , , wynika dodatnia określoność formy kwadratowej zadanej przez macierz . Szczegóły (które pomijamy) można znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,

Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.) End of proof.gif

Ponieważ forma kwadratowa jest ujemnie określona wtedy i tylko wtedy, gdy jest dodatnio określona, twierdzenie Sylvestera pozwala nam również stwierdzić, kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy mianowicie

Wniosek 8.16.

Jeśli , jest symetryczną macierzą kwadratową, to forma kwadratowa

jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego są dodatnie, tzn. gdy

Przykład 8.17.

Wyznaczmy ekstrema funkcji


Wykres.gif wykres

Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań

Układ ten spełniają współrzędne pięciu punktów

Łatwo zauważyć, że w punkcie funkcja nie osiąga ekstremum, gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno wartości mniejsze jak i większe od . Na przykład na prostej o kierunku (1,1,1) przechodzącej przez punkt

, tj. na zbiorze

funkcja

przyjmuje w otoczeniu zera zarówno dodatnie wartości (np. gdy ) jak i ujemne (np. gdy ). W pozostałych czterech punktach macierz drugich pochodnych cząstkowych, która zadaje drugą różniczkę

jest dodatnio określona. Na przykład w punkcie macierz drugich pochodnych cząstkowych funkcji

ma wszystkie minory główne dodatnie:

Stąd w punkcie funkcja osiąga minimum lokalne równe . Podobne uzasadnienie prowadzi do wniosku, że także w pozostałych punktach , oraz funkcja osiąga minima lokalne.

Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie zrezygnować z analizy określoności drugiej różniczki. Punkty leżą we wnętrzu zbioru ograniczonego poziomicą zerową funkcji , precyzyjniej: leżą w obszarze, gdzie funkcja

jest ujemna. Ponieważ zbiór

jest zwarty (gdyż jest domknięty i ograniczony), funkcja , na mocy twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech punktach osiągać minima lokalne.

Uwagi o wyznaczaniu ekstremów funkcji wielu zmiennych

Badanie funkcji wielu zmiennych (w szczególności znajdywanie punktów ekstremalnych) w wielu przypadkach nie wymaga wyznaczania ani pierwszej, ani drugiej różniczki funkcji. Można bowiem sprowadzić ich badanie do badania funkcji jednej zmiennej.

Rozważmy kilka przykładów, w których funkcja dwóch zmiennych jest w istocie funkcją jednej zmiennej, a mianowicie: jest funkcją odległości od początku układu współrzędnych.

Przykład 8.18.

Funkcja jest funkcją promienia , gdyż , gdzie . Ponieważ funkcja osiąga wartość największą w punkcie i nie osiąga żadnych więcej ekstremów na półprostej , więc jedynym ekstremum funkcji jest maksimum lokalne osiągane w punkcie (tj. ). Wówczas .
Wykres.gif wykres

Przykład 8.19.

Funkcja także jest funkcją promienia . Zauważmy bowiem, że

osiąga ekstrema w tych samych punktach, co funkcja , a więc osiąga maksima w punktach i minima w punktach , gdzie . Innymi słowy funkcja osiąga maksima w punktach należących do okręgów o równaniach

oraz w punkcie (wtedy ), a minima w punktach należących do okręgów

gdzie jest dowolną liczbą całkowitą nieujemną.


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/c/c6/Am2w08.0010.mgs.zip">
   <param name="scale" value="1.0 1.0 1.0">

<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>

<div.thumbcaption>Wykres funkcji


Przykład 8.20.

Podobnie jak w poprzednim przykładzie funkcja , , osiąga maksima na okręgach o promieniach takich, ze , czyli na okręgach

natomiast minima na okręgach, których promień spełnia równanie , tj. na okręgach

gdzie jest nieujemną liczbą całkowitą.
Wykres.gif wykres

Przykład 8.21.

Także funkcja jest funkcją promienia . Ponieważ funkcja jest ściśle rosnąca, osiąga minimum w punkcie . Stąd także funkcja osiąga minimum w punkcie (wówczas ).
Wykres.gif wykres

Również w wielu innych przykładach, gdy funkcja nie jest funkcją promienia, można uniknąć stosowania rachunku różniczkowego do wyznaczenia ekstremów.

Przykład 8.22.

Funkcja osiąga maksima w punktach hiperbol

a minima w punktach drugiej rodziny hiperbol

gdzie jest liczbą całkowitą.
Wykres.gif wykres

Przykład 8.23.

Z kolei funkcja osiąga maksima w punktach hiperbol

a minima w punktach drugiej rodziny hiperbol

gdzie jest liczbą całkowitą.
Wykres.gif wykres

Uwaga 8.24.

Przypomnijmy także, że prosta obserwacja przebiegu poziomic pozwala stwierdzić, że

(a) funkcja osiąga w punkcie minimum
Wykres.gif wykres
(b) w tym samym punkcie funkcja osiąga maksimum
Wykres.gif wykres
(c) a funkcja nie osiąga w punkcie żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak i większe od zera.
Wykres.gif wykres

Przykład 8.25.

Zauważmy, że każda z trzech funkcji a, b, c ma w punkcie zerową zarówno pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu punktu zarówno wartości mniejsze jak i większe od zera.

(a)
Wykres.gif wykres


(b)
Wykres.gif wykres
(c)


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/1/10/Am2w08.0130.mgs.zip">
   <param name="scale" value="1.0 1.0 0.1">

<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet> <div.thumbcaption>Wykres funkcji


Należy pamiętać o analizowaniu otoczenia punktów krytycznych funkcji, w których o istnieniu ekstremów nie rozstrzyga warunek wystarczający.

Przykład 8.26.

Funkcja jest ciągła na całej płaszczyźnie, nie jest jednak różniczkowalna w punktach należących do dwóch prostych: oraz . Różniczka tej funkcji nie zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema prostymi , . Stąd zbiorem punktów krytycznych jest suma obu prostych:

Łatwo zauważyć, że jedynie w punkcie tego zbioru funkcja osiąga ekstremum, a mianowicie minimum .
Wykres.gif wykres