Analiza matematyczna 2/Wykład 8: Ekstrema funkcji wielu zmiennych
From Studia Informatyczne
Spis treści |
Ekstrema funkcji wielu zmiennych.
Dowodzimy wzoru Taylora dla funkcji wielu zmiennych. Jego konsekwencją jest warunek wystarczający istnienia ekstremum. Pokazujemy szereg przykładów prowadzących do zastosowania wykazanego warunku wystarczającego oraz takich, w których nie jest to niezbędne.
Wzór Taylora dla funkcji wielu zmiennych
Niech
będzie funkcją klasy
określoną na
otwartym podzbiorze
przestrzeni Banacha
o wartościach w
przestrzeni Banacha
. Podobnie jak w przypadku funkcji jednej
zmiennej rzeczywistej zachodzi następujące
Twierdzenie 8.1. [twierdzenie Taylora]
oraz
zbioru
takich, że odcinek ![\displaystyle \{a+th, \ t\in [0,1]\}\subset U,](/images/math/8/4/0/840d89953c4a2007e732ba4fb89f073c.png)
zachodzi równość

![\displaystyle \|R_m f(a,b)\|_{y}\leq \frac{1}{(m+1)!}\sup\{|d^{m+1} _{a+th}(h,h, \dots, h)|, \ t\in[0,1]\}.](/images/math/b/f/0/bf0cc44f2d6496161f831d14d5c9863a.png)
Definicja 8.2.

funkcji
o środku w punkcie
. Zauważmy, że jeśli
i
,
to wielomian Taylora funkcji
rzędu
o
środku w punkcie
można wyrazić za pomocą pochodnych
cząstkowych funkcji
w następujący sposób:

gdzie
jest
-wskaźnikiem o
długości
. (Oznaczenia:
,
,
wprowadziliśmy przy omawianiu różniczek wyższego rzędu). W
szczególnym (ale bardzo często spotykanym) przypadku funkcji
dwóch zmiennych
wielomian Taylora o środku w punkcie
przyjmuje postać

gdzie
.
Dowód 8.3.
Twierdzenie Taylora wykażemy w szczególnym przypadku, gdy
jest funkcją o wartościach rzeczywistych,
określoną na otwartym podzbiorze
przestrzeni Banacha
.
Niech, zgodnie z założeniem,
oraz
będą takimi
, że odcinek
. Rozważmy funkcję 
określoną w pewnym otoczeniu otwartym odcinka
. Funkcja
jest w tym zbiorze klasy
, gdyż
jest tej klasy w otoczeniu odcinka
. Ponadto z twierdzenia o różniczkowaniu złożenia
funkcji mamy dla dowolnej liczby
równość

Ze twierdzenia Taylora dla funkcji jednej zmiennej
oraz z
powyższej równości mamy

gdzie
jest pewnym punktem pośrednim. Stąd
mamy też oszacowanie reszty we wzorze Taylora:

Ekstrema funkcji wielu zmiennych
Pamiętamy, że
dowolna przestrzeń unormowana
jest przestrzenią metryczną z
metryką
zadaną przez normę
przestrzeni
. Stąd też definicja ekstremum funkcji
o wartościach rzeczywistych określonej na przestrzeni
unormowanej jest taka sama jak w przypadku przestrzeni metrycznej,
czyli funkcja
przyjmuje w punkcie
minimum
lokalne (odpowiednio: maksimum lokalne, ścisłe minimum
lokalne, ścisłe maksimum lokalne), jeśli istnieje liczba
taka, że zachodzą odpowiednio implikacje:




Minimum funkcji w punkcie
nazywamy globalnym, jeśli
osiąga
w punkcie
kres dolny wartości. Jeśli zaś w punkcie
funkcja
osiąga kres górny, to mówimy, że osiąga w punkcie
maksimum
globalne.
Sformułujmy wpierw warunek konieczny istnienia ekstremum
funkcji
.
Twierdzenie 8.4.
Jeśli funkcja różniczkowalna
osiąga ekstremum w punkcie
zbioru
otwartego
, to w punkcie tym zeruje się różniczka funkcji
,
tzn.
, gdzie
jest dowolnym wektorem
. Dowód 8.4.
Załóżmy, że funkcja
osiąga maksimum lokalne w punkcie
. Ustalmy pewien wektor
,
i rozważmy
do prostej 
o
kierunku
przechodzącej przez punkt
. Zacieśnienie to

jest funkcją jednej zmiennej,
osiągającą maksimum w
. Stąd pochodna w zerze funkcji
jest równa zeru. Ale pochodna ta jest tożsama z
pochodną kierunkową funkcji
w kierunku wektora
. Wobec
dowolności
różniczka
.
osiąga wartość minimalną w punkcie
, w którym nie jest różniczkowalna.

Przyjmijmy wobec tego następującą definicję.
Definicja 8.6.
Mówimy, że
jest
punktem krytycznym funkcji
, jeśli
należy do
dziedziny różniczki funkcji
i różniczka zeruje się w tym
punkcie, bądź też punkt
należy do dziedziny funkcji i nie
istnieje różniczka
.
Wniosek 8.7.
Jeśli funkcja
osiąga ekstremum w
punkcie
, to punkt ten jest krytyczny.
Implikacja te stanowi warunek konieczny istnienia ekstremum także w przypadku funkcji, od których nie żądamy różniczkowalności w otoczeniu wszystkich punktów dziedziny.
Wzór Taylora umożliwia, podobnie jak w przypadku jednowymiarowym, sformułowanie warunku wystarczającego istnienia ekstremum.
Definicja 8.8.
Niech
będzie
odwzorowaniem dwuliniowym symetrycznym określonym na
,
gdzie
jest pewną przestrzenią Banacha. Mówimy, że forma

jest
- dodatnio określona, jeśli istnieje stała
taka, że

- ujemnie określona, jeśli istnieje stała
taka, że

- nieujemnie określona, jeśli

- niedodatnio określona, jeśli

- nieokreślona, jeśli nie jest ani dodatnio, ani ujemnie,
ani nieujemnie, ani niedodatnio określona.
Często mówimy też, że odwzorowanie dwuliniowe symetryczne
jest dodatnio określone (odpowiednio:
ujemnie określone, nieujemnie określone,
niedodatnio określone, nieokreślone), jeśli forma
kwadratowa
jest określona dodatnio (odpowiednio:
określona ujemnie, określona nieujemnie, określona niedodatnio,
bądź jest nieokreślona).
a) Forma kwadratowa
jest dodatnio określona wtedy i tylko wtedy, gdy forma
jest ujemnie określona.
b) Forma kwadratowa
jest nieujemnie określona
wtedy i tylko wtedy, gdy forma
jest niedodatnio
określona.
c) Forma kwadratowa
jest nieokreślona wtedy i
tylko wtedy, gdy nieokreślona jest forma
.
Korzystając ze wzoru Taylora, wykażemy warunek wystarczający istnienia ekstremum funkcji wielu zmiennych.
Twierdzenie 8.10.
Niech
będzie funkcją klasy
w
otwartym otoczeniu
punktu
. Załóżmy, że różniczka funkcji
w punkcie
jest równa zeru.
a) Jeśli druga różniczka
jest dodatnio określona,
funkcja
osiąga ścisłe minimum lokalne w punkcie
.
b) Jeśli druga różniczka
jest ujemnie określona, funkcja
osiąga ścisłe maksimum lokalne w punkcie
.
c) Jeśli druga różniczka
jest nieokreślona, funkcja
. Dowód 8.10.
a) Ze wzoru Taylora (wobec założenia o pierwszej różniczce:
) dostajemy równość prawdziwą w otoczeniu punktu
na
tyle małym, aby odcinek
był w nim
zawarty.


gdzie
jest pewną liczbą. Jeśli forma
jest dodatnio określona, to wobec ciągłości drugiej
różniczki, również w pewnym małym otoczeniu punktu
w punkcie
forma
jest
dodatnio określona. Wobec tego

czyli
dla dowolnego niezerowego wektora
z
pewnego małego otoczenia punktu
. Oznacza to, że funkcja
osiąga w tym punkcie ścisłe minimum lokalne.
b) Podobnie jak w punkcie a) wykazujemy, że funkcja
osiąga ścisłe maksimum lokalne, gdy druga różniczka jest ujemnie
określona w punkcie, w którym zeruje się jej pierwsza różniczka.
c) Jeśli druga różniczka
jest nieokreślona, to istnieją
dwa wektory
takie, że
natomiast
. Jeśli więc zacieśnimy funkcję
do prostej o
: 
to na
prostej tej w pewnym małym otoczeniu punktu
(dla
bliskich
zeru) otrzymamy nierówność:

natomiast na prostej o kierunku
:

dostaniemy, podobnie w małym otoczeniu punktu
, nierówność
przeciwną:

Stąd funkcja
nie osiąga w punkcie
żadnego
ekstremum, gdyż w dowolnie małym otoczeniu punktu
przyjmuje
zarówno wartości mniejsze, jak i większe od
.
jest niedodatnio lub nieujemnie określona. Rozważmy trzy proste przykłady.Przykład 8.12.
Funkcja
osiąga w
punkcie
ścisłe minimum lokalne równe zeru, gdyż dla
dowolnego punktu
mamy
.
Zwróćmy uwagę, że zarówno pierwsza jak i druga różniczka
funkcji
w punkcie
zerują się. W szczególności druga
różniczka jest nieujemnie określona w każdym punkcie płaszczyzny
, gdyż dla dowolnego wektora
mamy

W szczególności

Przykład 8.13.
Funkcja
osiąga w
punkcie
ścisłe maksimum lokalne równe zeru, gdyż dla
dowolnego punktu
mamy
.
Zwróćmy uwagę, że podobnie jak w poprzednim przykładzie
zarówno pierwsza jak i druga różniczka funkcji
w punkcie
zerują się. W szczególności druga różniczka jest
niedodatnio określona w każdym punkcie płaszczyzny
, gdyż
dla dowolnego wektora
mamy

W szczególności

Przykład 8.14.
Funkcja
nie osiąga w punkcie
żadnego ekstremum, gdyż dla dowolnego punktu
mamy
, natomiast w punktach
mamy z kolei
Zwróćmy uwagę, że podobnie jak w obu poprzednich przykładach zarówno pierwsza jak i druga różniczka funkcji
zerują się w punkcie
. W punktach
, tj. poza początkiem układu współrzędnych, druga różniczka

jest nieokreślona, bo w punktach
forma kwadratowa
jest dodatnia, a w punktach
jest ujemna. W samym zaś punkcie
forma kwadratowa 
jest zerowa. Analiza formy kwadratowej w otoczeniu punktu
pozwala nam jednak dostrzec, że zacieśnienie funkcji
do
prostej
(tj. w punktach postaci
) jest funkcją
, która na tej prostej osiąga minimum lokalne. Z kolei zacieśnienie do prostej
(czyli w punktach postaci
) funkcja
osiąga maksimum w punkcie
. Stąd funkcja
nie osiąga żadnego ekstremum w punkcie
.

Kolejne twierdzenie, które nazywamy kryterium Sylvestera, bardzo usprawnia badanie określoności drugiej różniczki w przpadku funkcji wielu zmiennych.
Niech
,
, będzie macierzą kwadratową
symetryczną (tzn.
dla dowolnych
). Niech
![\displaystyle A_k :=\det \left[\begin{array}{rrr} a_{11}&\dots & a_{1k}\\ \dots & \dots & \dots\\ a_{k1}&\dots & a_{kk}\end{array} \right]](/images/math/f/9/c/f9c7bc4f5e6f71d15559cd973243597a.png)
będzie minorem
głównym rzędu
macierzy
,
.
Twierdzenie 8.15. [twierdzenie Sylvestera]
Forma
kwadratowa
zadana przez symetryczną macierz kwadratową
,
, jest dodatnio określona wtedy i tylko wtedy,
gdy wszystkie minory główne macierzy
są dodatnie, tzn.
. Dowód 8.15.
Twierdzenia dowodzi się indukcyjnie. Niech wpierw macierz
będzie złożona z jednej liczby
. Należy zauważyć, że
forma
jest dodatnio określona wtedy i tylko
wtedy, gdy
. Następnie dowodzi się implikacji, że z
dodatniej określoności formy zadanej przez macierz
,
wobec założenia o
dodatniości minora
,
, wynika
dodatnia określoność formy kwadratowej zadanej przez macierz
. Szczegóły (które pomijamy) można
znaleźć w podręcznikach algebry liniowej (np. Jacek Komorowski,
Od liczb zespolonych do tensorów, spinorów, algebr Liego i kwadryk,
Ponieważ forma kwadratowa
jest ujemnie określona
wtedy i tylko wtedy, gdy
jest dodatnio
określona, twierdzenie Sylvestera pozwala nam również stwierdzić,
kiedy macierz kwadratowa zadaje formę ujemnie określoną. Mamy
mianowicie
Wniosek 8.16.
Jeśli
,
jest symetryczną macierzą kwadratową, to forma kwadratowa

jest ujemnie określona wtedy i tylko wtedy, gdy wszystkie minory rzędu nieparzystego są ujemne, a wszystkie rzędu parzystego są dodatnie, tzn. gdy

Przykład 8.17.
Wyznaczmy ekstrema funkcji

Różniczka tej funkcji zeruje się w punktach, których współrzędne spełniają układ równań

Układ ten spełniają współrzędne pięciu punktów

Łatwo zauważyć, że w punkcie
funkcja nie osiąga ekstremum,
gdyż w dowolnie małym otoczeniu tego punktu przyjmuje zarówno
wartości mniejsze jak i większe od
. Na przykład na
prostej o kierunku (1,1,1) przechodzącej przez punkt
, tj. na zbiorze 
funkcja

przyjmuje w otoczeniu
zera zarówno dodatnie wartości (np. gdy
) jak i ujemne (np.
gdy
). W pozostałych czterech punktach macierz
drugich pochodnych cząstkowych, która zadaje drugą różniczkę
![\displaystyle \left[ \begin{array}{lll} 4(3x^2+y^2+z^2)& 8xy-3z &8xz-3y\\ 8xy-3z &4(x^2+3y^2+z^2) &8yz-3x\\ 8xz-3y &8yz-3x & 4(x^2+y^2+3z^2) \end{array} \right]](/images/math/3/0/4/30431d8f3c1e7218273c1837596887bb.png)
jest dodatnio określona. Na przykład w punkcie
macierz
drugich pochodnych cząstkowych funkcji
![\displaystyle \left[\begin{array}{rrr} \frac{5}{4} &-\frac{1}{4} &-\frac{1}{4}\\ -\frac{1}{4} &\frac{5}{4} &-\frac{1}{4}\\ -\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]](/images/math/f/6/1/f61a0f0fb43b7d1e8830767f398b081e.png)
ma wszystkie minory główne dodatnie:
![\displaystyle \aligned A_1&=\det\left[\frac{5}{4}\right]=\frac{5}{4}>0 \\A_2&=\det\left[\begin{array}{rr} \frac{5}{4} &-\frac{1}{4} \\ -\frac{1}{4} &\frac{5}{4}\end{array} \right] =\frac{1}{4^2}\det\left[\begin{array}{rr} 5 &-1\\-1 &5\end{array} \right]=\frac{24}{16}>0\\ \\A_3&=\det \left[\begin{array}{rrr} \frac{5}{4} &-\frac{1}{4} &-\frac{1}{4}\\ -\frac{1}{4} &\frac{5}{4} &-\frac{1}{4}\\ -\frac{1}{4} &-\frac{1}{4} &\frac{5}{4}\end{array} \right]= \frac{1}{4^3}\det\left[\begin{array}{rrr} 5 &-1&-1\\-1 &5 &-1\\-1 &-1& 5\end{array} \right]=\frac{108}{64}>0.\endaligned](/images/math/a/6/e/a6e44eaf10c4d134818a744ebfd6f9f7.png)
Stąd w punkcie
funkcja osiąga minimum lokalne równe
. Podobne uzasadnienie prowadzi do wniosku,
że także w pozostałych punktach
,
oraz
funkcja
osiąga minima lokalne.
Należy jednak wyraźnie zaznaczyć, że można w tym przykładzie
zrezygnować z analizy określoności drugiej różniczki. Punkty
leżą we wnętrzu zbioru ograniczonego poziomicą
zerową funkcji
, precyzyjniej: leżą w obszarze, gdzie funkcja
jest ujemna. Ponieważ zbiór 
jest zwarty (gdyż jest domknięty i ograniczony),
funkcja
, na mocy twierdzenia Weierstrassa o osiąganiu kresów
przez funkcję ciągłą na zbiorze zwartym, musi w tych czterech
punktach osiągać minima lokalne.
Uwagi o wyznaczaniu ekstremów funkcji wielu zmiennych
Badanie funkcji wielu zmiennych (w szczególności znajdywanie punktów ekstremalnych) w wielu przypadkach nie wymaga wyznaczania ani pierwszej, ani drugiej różniczki funkcji. Można bowiem sprowadzić ich badanie do badania funkcji jednej zmiennej.
Rozważmy kilka przykładów, w których funkcja dwóch zmiennych jest w istocie funkcją jednej zmiennej, a mianowicie: jest funkcją odległości od początku układu współrzędnych.
Przykład 8.18.
Funkcja
jest
funkcją promienia
, gdyż
,
gdzie
. Ponieważ funkcja
osiąga wartość największą w punkcie
i nie osiąga żadnych
więcej ekstremów na półprostej
, więc jedynym
ekstremum funkcji
jest maksimum lokalne
osiągane w punkcie
(tj.
). Wówczas
.
wykres
Przykład 8.19.
Funkcja
także
jest funkcją promienia
. Zauważmy bowiem, że

osiąga ekstrema w tych samych punktach, co
funkcja
, a więc osiąga maksima w punktach
i minima w punktach
, gdzie
. Innymi słowy
funkcja
osiąga maksima w punktach należących
do okręgów o równaniach

oraz w punkcie
(wtedy
), a minima w punktach
należących do okręgów

gdzie
jest dowolną liczbą całkowitą nieujemną.

Przykład 8.20.
Podobnie jak w poprzednim przykładzie
funkcja
,
,
osiąga maksima na okręgach o promieniach
takich, ze
, czyli na okręgach

natomiast minima na okręgach, których promień
spełnia równanie
, tj. na okręgach

gdzie
jest nieujemną liczbą całkowitą.
wykres
Przykład 8.21.
Także funkcja
jest funkcją promienia
. Ponieważ funkcja
jest ściśle rosnąca, osiąga minimum w punkcie
.
Stąd także funkcja
osiąga minimum w
punkcie
(wówczas
).
wykres
Również w wielu innych przykładach, gdy funkcja
nie jest
funkcją promienia, można uniknąć stosowania rachunku
różniczkowego do wyznaczenia ekstremów.
Przykład 8.22.
Funkcja
osiąga maksima w punktach hiperbol

a minima w punktach drugiej rodziny hiperbol

gdzie
jest liczbą całkowitą.
wykres
Przykład 8.23.
Z kolei funkcja
osiąga maksima w punktach hiperbol

a minima w punktach drugiej rodziny hiperbol

gdzie
jest liczbą całkowitą.
wykres
Przypomnijmy także, że prosta obserwacja przebiegu poziomic pozwala stwierdzić, że
(a) funkcja
osiąga w punkcie
minimum
wykres
(b) w tym samym punkcie funkcja
osiąga maksimum
wykres
(c) a funkcja
nie osiąga w punkcie
żadnego ekstremum, gdyż ma w tym punkcie wartość zero, a w
dowolnie małym otoczeniu tego punktu osiąga wartości mniejsze jak
i większe od zera.
wykres
Przykład 8.25.
Zauważmy, że każda z trzech funkcji a, b, c ma w punkcie
zerową zarówno
pierwszą jak i drugą różniczkę. Żadna z nich nie ma jednak w tym
punkcie ekstremum, gdyż przyjmują w dowolnie małym otoczeniu
punktu
zarówno wartości mniejsze jak i większe od zera.
(a)
wykres
(b)
wykres
(c)

Należy pamiętać o analizowaniu otoczenia punktów krytycznych funkcji, w których o istnieniu ekstremów nie rozstrzyga warunek wystarczający.
Przykład 8.26.
Funkcja
jest ciągła na całej
płaszczyźnie, nie jest jednak różniczkowalna w punktach należących
do dwóch prostych:
oraz
. Różniczka tej funkcji nie
zeruje się w żadnym punkcie swojej dziedziny, tj. poza obiema
prostymi
,
. Stąd zbiorem punktów krytycznych jest suma
obu prostych:

Łatwo zauważyć, że jedynie w punkcie
tego zbioru funkcja
osiąga ekstremum, a mianowicie minimum
.
wykres
