Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych
Ekstrema funkcji wielu zmiennych.
Dowodzimy wzoru Taylora dla funkcji wielu zmiennych. Jego konsekwencją jest warunek wystarczający istnienia ekstremum. Pokazujemy szereg przykładów prowadzących do zastosowania wykazanego warunku wystarczającego oraz takich, w których nie jest to niezbędne.
Wzór Taylora dla funkcji wielu zmiennych
Niech
będzie funkcją klasy określoną na otwartym podzbiorze przestrzeni Banacha o wartościach w przestrzeni Banacha . Podobnie jak w przypadku funkcji jednej zmiennej rzeczywistej zachodzi następująceTwierdzenie 8.1. [twierdzenie Taylora]
zachodzi równość
Definicja 8.2.
Zauważmy, że jeśli
i , to wielomian Taylora funkcji rzędu o środku w punkcie można wyrazić za pomocą pochodnych cząstkowych funkcji w następujący sposób:gdzie
jest -wskaźnikiem o długości . (Oznaczenia: , , wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W szczególnym (ale bardzo często spotykanym) przypadku funkcji dwóch zmiennych wielomian Taylora o środku w punkcie przyjmuje postaćgdzie
.Dowód 8.3.
Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy
punktami zbioru jest funkcją o wartościach rzeczywistych, określoną na otwartym podzbiorze przestrzeni Banacha . Niech, zgodnie z założeniem, oraz będą takimi , że odcinek . Rozważmy funkcjęokreśloną w pewnym otoczeniu otwartym odcinka
. Funkcja jest w tym zbiorze klasy , gdyż jest tej klasy w otoczeniu odcinka . Ponadto z twierdzenia o różniczkowaniu złożenia funkcji mamy dla dowolnej liczby równośćZe twierdzenia Taylora dla funkcji jednej zmiennej
oraz z powyższej równości mamygdzie
jest pewnym punktem pośrednim. Stąd mamy też oszacowanie reszty we wzorze Taylora:
Ekstrema funkcji wielu zmiennych
Pamiętamy, że dowolna przestrzeń unormowana
jest przestrzenią metryczną z metryką zadaną przez normę przestrzeni . Stąd też definicja ekstremum funkcji o wartościach rzeczywistych określonej na przestrzeni unormowanej jest taka sama jak w przypadku przestrzeni metrycznej, czyli funkcja przyjmuje w punkcie minimum lokalne (odpowiednio: maksimum lokalne, ścisłe minimum lokalne, ścisłe maksimum lokalne), jeśli istnieje liczba taka, że zachodzą odpowiednio implikacje:Minimum funkcji w punkcie
nazywamy globalnym, jeśli osiąga w punkcie kres dolny wartości. Jeśli zaś w punkcie funkcja osiąga kres górny, to mówimy, że osiąga w punkcie maksimum globalne.Sformułujmy wpierw warunek konieczny istnienia ekstremum funkcji
.Twierdzenie 8.4.
Jeśli funkcja różniczkowalna
przestrzeni osiąga ekstremum w punkcie zbioru otwartego , to w punkcie tym zeruje się różniczka funkcji , tzn. , gdzie jest dowolnym wektorem .Dowód 8.4.
Załóżmy, że funkcja
zacieśnienie funkcji osiąga maksimum lokalne w punkcie . Ustalmy pewien wektor , i rozważmy do prostejo kierunku
przechodzącej przez punkt . Zacieśnienie tojest funkcją jednej zmiennej, osiągającą maksimum w
. Stąd pochodna w zerze funkcji jest równa zeru. Ale pochodna ta jest tożsama z pochodną kierunkową funkcji w kierunku wektora . Wobec dowolności różniczka .
<applet code="JavaviewModApplet.class" height="400" width="450" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar"> <param name="colors" value="-1:#7e0b9f -0.82:#7e0b9f -0.81:#ce3bf8 -0.64:#ce3bf8 -0.63:#2c4ae5 -0.46:#2c4ae5 -0.45:#2c85e5 -0.28:#2c85e5 -0.27:#2ecca9 -0.10:#2ecca9 -0.09:#2ecc5b 0.09:#2ecc5b 0.10:#97cc2e 0.27:#97cc2e 0.28:#edff27 0.45:#edff27 0.46:#ffba27 0.63:#ffba27 0.64:#ff6e27 0.81:#ff6e27 0.82:#d42555 1:#d42525"> <param name="coloring" value="mathematica"> <param name="model" value="images/e/e7/Am2m05.0110.mgs.zip"> <param name="scale" value="1.0 1.0 0.5">
<param name="shading" value="0.2"> <param name="animation" value="stop">
</applet><div.thumbcaption>Wykres funkcji
Przyjmijmy wobec tego następującą definicję.
Definicja 8.6.
Mówimy, że
jest punktem krytycznym funkcji , jeśli należy do dziedziny różniczki funkcji i różniczka zeruje się w tym punkcie, bądź też punkt należy do dziedziny funkcji i nie istnieje różniczka .Wniosek 8.7.
Jeśli funkcja
osiąga ekstremum w punkcie , to punkt ten jest krytyczny.Implikacja te stanowi warunek konieczny istnienia ekstremum także w przypadku funkcji, od których nie żądamy różniczkowalności w otoczeniu wszystkich punktów dziedziny.
Wzór Taylora umożliwia, podobnie jak w przypadku jednowymiarowym, sformułowanie warunku wystarczającego istnienia ekstremum.
Definicja 8.8.
Niech
kwadratowa będzie odwzorowaniem dwuliniowym symetrycznym określonym na , gdzie jest pewną przestrzenią Banacha. Mówimy, że formajest
- dodatnio określona, jeśli istnieje stała taka, że
- ujemnie określona, jeśli istnieje stała taka, że
- nieujemnie określona, jeśli
- niedodatnio określona, jeśli
- nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie,
ani nieujemnie, ani niedodatnio określona.
Często mówimy też, że odwzorowanie dwuliniowe symetryczne
jest dodatnio określone (odpowiednio: ujemnie określone, nieujemnie określone, niedodatnio określone, nieokreślone), jeśli forma kwadratowa jest określona dodatnio (odpowiednio: określona ujemnie, określona nieujemnie, określona niedodatnio, bądź jest nieokreślona).a) Forma kwadratowa
jest dodatnio określona wtedy i tylko wtedy, gdy forma jest ujemnie określona.b) Forma kwadratowa
jest nieujemnie określona wtedy i tylko wtedy, gdy forma jest niedodatnio określona.c) Forma kwadratowa
jest nieokreślona wtedy i tylko wtedy, gdy nieokreślona jest forma .Korzystając ze wzoru Taylora, wykażemy warunek wystarczający istnienia ekstremum funkcji wielu zmiennych.
Twierdzenie 8.10.
Niech
będzie funkcją klasy w otwartym otoczeniu punktu . Załóżmy, że różniczka funkcji w punkcie jest równa zeru.a) Jeśli druga różniczka
jest dodatnio określona, funkcja osiąga ścisłe minimum lokalne w punkcie .b) Jeśli druga różniczka
jest ujemnie określona, funkcja osiąga ścisłe maksimum lokalne w punkcie .c) Jeśli druga różniczka
nie osiąga ekstremum w punkcie jest nieokreślona, funkcja .Dowód 8.10.
a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce:
) dostajemy równość prawdziwą w otoczeniu punktu na tyle małym, aby odcinek był w nim zawarty.gdzie
jest pewną liczbą. Jeśli forma jest dodatnio określona, to wobec ciągłości drugiej różniczki, również w pewnym małym otoczeniu punktu w punkcie forma jest dodatnio określona. Wobec tegoczyli
dla dowolnego niezerowego wektora z pewnego małego otoczenia punktu . Oznacza to, że funkcja osiąga w tym punkcie ścisłe minimum lokalne.b) Podobnie jak w punkcie a) wykazujemy, że funkcja
osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie określona w punkcie, w którym zeruje się jej pierwsza różniczka.c) Jeśli druga różniczka
kierunku jest nieokreślona, to istnieją dwa wektory takie, że natomiast . Jeśli więc zacieśnimy funkcję do prostej o :to na prostej tej w pewnym małym otoczeniu punktu
(dla bliskich zeru) otrzymamy nierówność:natomiast na prostej o kierunku
:dostaniemy, podobnie w małym otoczeniu punktu
, nierówność przeciwną:Stąd funkcja
nie osiąga w punkcie żadnego ekstremum, gdyż w dowolnie małym otoczeniu punktu przyjmuje zarówno wartości mniejsze, jak i większe od .
Przykład 8.12.
Funkcja
Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka funkcji
w punkcie zerują się. W szczególności druga różniczka jest nieujemnie określona w każdym punkcie płaszczyzny , gdyż dla dowolnego wektora mamyW szczególności
Przykład 8.13.
Funkcja
osiąga w punkcie ścisłe maksimum lokalne równe zeru, gdyż dla dowolnego punktu mamy .Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie zarówno pierwsza jak i druga różniczka funkcji
w punkcie zerują się. W szczególności druga różniczka jest niedodatnio określona w każdym punkcie płaszczyzny , gdyż dla dowolnego wektora mamyW szczególności
Przykład 8.14.
Funkcja
nie osiąga w punkcie żadnego ekstremum, gdyż dla dowolnego punktu mamy , natomiast w punktach mamy z koleiZwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji
zerują się w punkcie . W punktach , tj. poza początkiem układu współrzędnych, druga różniczkajest nieokreślona, bo w punktach
forma kwadratowa jest dodatnia, a w punktach jest ujemna. W samym zaś punkcie forma kwadratowajest zerowa. Analiza formy kwadratowej w otoczeniu punktu
pozwala nam jednak dostrzec, że zacieśnienie funkcji do prostej (tj. w punktach postaci ) jest funkcją , która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej (czyli w punktach postaci ) funkcja osiąga maksimum w punkcie . Stąd funkcja nie osiąga żadnego ekstremum w punkcie .
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/4/47/Am2w08.0120.mgs.zip"> <param name="scale" value="1.0 1.0 0.05">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>
<div.thumbcaption>Wykres funkcji
Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności drugiej różniczki w przpadku funkcji wielu zmiennych.
Niech
, , będzie macierzą kwadratową symetryczną (tzn. dla dowolnych ). Niechbędzie minorem głównym rzędu
macierzy , .Twierdzenie 8.15. [twierdzenie Sylvestera]
Forma kwadratowa
dla dowolnego zadana przez symetryczną macierz kwadratową , , jest dodatnio określona wtedy i tylko wtedy, gdy wszystkie minory główne macierzy są dodatnie, tzn. .Dowód 8.15.
Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz
Państwowe Wydawnictwo Naukowe, Warszawa 1978 r.) będzie złożona z jednej liczby . Należy zauważyć, że forma jest dodatnio określona wtedy i tylko wtedy, gdy . Następnie dowodzi się implikacji, że z dodatniej określoności formy zadanej przez macierz , wobec założenia o dodatniości minora , , wynika dodatnia określoność formy kwadratowej zadanej przez macierz . Szczegóły (które pomijamy) można znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski, Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,
Ponieważ forma kwadratowa
jest ujemnie określona wtedy i tylko wtedy, gdy jest dodatnio określona, twierdzenie Sylvestera pozwala nam również stwierdzić, kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy mianowicieWniosek 8.16.
Jeśli
, jest symetryczną macierzą kwadratową, to forma kwadratowajest ujemnie określona wtedy i tylko wtedy, gdy wszystkie minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego są dodatnie, tzn. gdy
Przykład 8.17.
Wyznaczmy ekstrema funkcji
Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań
Układ ten spełniają współrzędne pięciu punktów
Łatwo zauważyć, że w punkcie
funkcja nie osiąga ekstremum, gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno wartości mniejsze jak i większe od . Na przykład na prostej o kierunku (1,1,1) przechodzącej przez punkt , tj. na zbiorzefunkcja
przyjmuje w otoczeniu zera zarówno dodatnie wartości (np. gdy
) jak i ujemne (np. gdy ). W pozostałych czterech punktach macierz drugich pochodnych cząstkowych, która zadaje drugą różniczkęjest dodatnio określona. Na przykład w punkcie
macierz drugich pochodnych cząstkowych funkcjima wszystkie minory główne dodatnie:
Stąd w punkcie
funkcja osiąga minimum lokalne równe . Podobne uzasadnienie prowadzi do wniosku, że także w pozostałych punktach , oraz funkcja osiąga minima lokalne.Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie zrezygnować z analizy określoności drugiej różniczki. Punkty
leżą we wnętrzu zbioru ograniczonego poziomicą zerową funkcji , precyzyjniej: leżą w obszarze, gdzie funkcja jest ujemna. Ponieważ zbiórjest zwarty (gdyż jest domknięty i ograniczony), funkcja
, na mocy twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech punktach osiągać minima lokalne.Uwagi o wyznaczaniu ekstremów funkcji wielu zmiennych
Badanie funkcji wielu zmiennych (w szczególności znajdywanie punktów ekstremalnych) w wielu przypadkach nie wymaga wyznaczania ani pierwszej, ani drugiej różniczki funkcji. Można bowiem sprowadzić ich badanie do badania funkcji jednej zmiennej.
Rozważmy kilka przykładów, w których funkcja dwóch zmiennych jest w istocie funkcją jednej zmiennej, a mianowicie: jest funkcją odległości od początku układu współrzędnych.
Przykład 8.18.
Funkcja
wykres
Przykład 8.19.
Funkcja
także jest funkcją promienia . Zauważmy bowiem, żeosiąga ekstrema w tych samych punktach, co funkcja
, a więc osiąga maksima w punktach i minima w punktach , gdzie . Innymi słowy funkcja osiąga maksima w punktach należących do okręgów o równaniachoraz w punkcie
(wtedy ), a minima w punktach należących do okręgówgdzie
jest dowolną liczbą całkowitą nieujemną.
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/c/c6/Am2w08.0010.mgs.zip"> <param name="scale" value="1.0 1.0 1.0">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet>
<div.thumbcaption>Wykres funkcji
Przykład 8.20.
Podobnie jak w poprzednim przykładzie funkcja
, , osiąga maksima na okręgach o promieniach takich, ze , czyli na okręgachnatomiast minima na okręgach, których promień
spełnia równanie , tj. na okręgachgdzie
wykres
Przykład 8.21.
Także funkcja
wykres
Również w wielu innych przykładach, gdy funkcja
nie jest funkcją promienia, można uniknąć stosowania rachunku różniczkowego do wyznaczenia ekstremów.Przykład 8.22.
Funkcja
osiąga maksima w punktach hiperbola minima w punktach drugiej rodziny hiperbol
gdzie
wykres
Przykład 8.23.
Z kolei funkcja
osiąga maksima w punktach hiperbola minima w punktach drugiej rodziny hiperbol
gdzie
wykres
Przypomnijmy także, że prosta obserwacja przebiegu poziomic pozwala stwierdzić, że
(a) funkcja
wykres
(b) w tym samym punkcie funkcja osiąga maksimum
wykres
(c) a funkcja nie osiąga w punkcie
żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w
dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak
i większe od zera.
wykres
Przykład 8.25.
Zauważmy, że każda z trzech funkcji a, b, c ma w punkcie
zerową zarówno pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu punktu zarówno wartości mniejsze jak i większe od zera.(a)
wykres
(b)
wykres
(c)
<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">
<param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525"> <param name="coloring" value="maple"> <param name="model" value="images/1/10/Am2w08.0130.mgs.zip"> <param name="scale" value="1.0 1.0 0.1">
<param name="shading" value="0.2"> <param name="animation" value="stop"> </applet> <div.thumbcaption>Wykres funkcji
Należy pamiętać o analizowaniu otoczenia punktów krytycznych funkcji, w których o istnieniu ekstremów nie rozstrzyga warunek wystarczający.
Przykład 8.26.
Funkcja
jest ciągła na całej płaszczyźnie, nie jest jednak różniczkowalna w punktach należących do dwóch prostych: oraz . Różniczka tej funkcji nie zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema prostymi , . Stąd zbiorem punktów krytycznych jest suma obu prostych:Łatwo zauważyć, że jedynie w punkcie
wykres