Test HB3: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Linia 868: Linia 868:
analizujemy w ramach ćwiczeń.
analizujemy w ramach ćwiczeń.


===Ekstrema warunkowe. Metoda mnożników Lagrange'a===
===9.4 Ekstrema warunkowe. Metoda mnożników Lagrange'a===


Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym
Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym
Linia 878: Linia 878:
otwarty w <math>X</math>.
otwarty w <math>X</math>.


{{przyklad|[Uzupelnij]||
{{przyklad|9.16.||
Wyznaczmy najmniejszą i największą
Wyznaczmy najmniejszą i największą wartość funkcji
wartość funkcji
 
<center><math>F(x,y,z)=x -2y +2z </math></center> na sferze <center><math>x^2+y^2+z^2=1.</math></center> Sfera ta jest
<center><math>
zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na
F(x,y,z)=x -2y +2z  
</math></center>  
 
na sferze  
<center><math>
x^2+y^2+z^2=1.
</math></center>  
 
Sfera ta jest zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na
na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję
na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję
ciągłą wnioskujemy, że wielomian <math>F(x,y,z)=x -2y +2z </math> osiąga na
ciągłą wnioskujemy, że wielomian <math>F(x,y,z)=x -2y +2z </math> osiąga na
tej sferze zarówno wartość najmniejszą jak i największą. Nasze
tej sferze zarówno wartość najmniejszą jak i największą. Nasze
dotychczasowe doświadczenie podpowiada nam, że zadanie można by
dotychczasowe doświadczenie podpowiada nam, że zadanie można by
sprowadzić do badania funkcji dwóch zmiennych np. poprzez
sprowadzić do badania funkcji dwóch zmiennych np. poprzez odwikłanie zmiennej
odwikłanie zmiennej
 
<center><math>z(x,y)=\sqrt{1-x^2-y^2}
<center><math>
\text{ lub } z(x,y)=-\sqrt{1-x^2-y^2}</math></center>
z(x,y)=\sqrt{1-x^2-y^2}
\text{ lub } z(x,y)=-\sqrt{1-x^2-y^2}
</math></center>
 
z równania sfery i zbadania funkcji
z równania sfery i zbadania funkcji
dwóch zmiennych <math>(x,y)</math> danych w kole <math>x^2+y^2<1</math> wzorami:
dwóch zmiennych <math>(x,y)</math> danych w kole <math>x^2+y^2<1</math> wzorami:
<center><math>f_1: (x,y)\mapsto F\big(x,y,\sqrt{1-x^2-y^2}\big)=x-2y+2\sqrt{1-x^2-y^2},</math></center>
 
<center><math>f_2: (x,y)\mapsto F\big(x,y,-\sqrt{1-x^2-y^2}\big)=x-2y-2\sqrt{1-x^2-y^2}.</math></center>
<center><math>
f_1: (x,y)\mapsto F\big(x,y,\sqrt{1-x^2-y^2}\big)=x-2y+2\sqrt{1-x^2-y^2},
</math></center>
 
<center><math>
f_2: (x,y)\mapsto F\big(x,y,-\sqrt{1-x^2-y^2}\big)=x-2y-2\sqrt{1-x^2-y^2}.
</math></center>
 
Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do
Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do
wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości
wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości
Linia 911: Linia 929:
<math>F:X\mapsto \mathbb{R}</math> będą funkcjami.
<math>F:X\mapsto \mathbb{R}</math> będą funkcjami.


{{definicja|[Uzupelnij]||
{{definicja|9.17.||
 
Mówimy, że funkcja <math>F</math> osiąga '''''ekstremum warunkowe''''' w punkcie
Mówimy, że funkcja <math>F</math> osiąga '''''ekstremum warunkowe''''' w punkcie
<math>a</math> przy warunku <math>a\in \{G=0\}</math>, jeśli zacieśnienie funkcji <math>F</math> do
<math>a</math> przy warunku <math>a\in \{G=0\}</math>, jeśli zacieśnienie funkcji <math>F</math> do
Linia 918: Linia 935:
}}
}}


Prawdziwe jest następujące twierdzenie, które stanowi podstawę
Prawdziwe jest następujące twierdzenie, które stanowi podstawę '''''metody mnożników Lagrange'a'''''.
'''''metody mnożników Lagrange'a'''''.


Niech <math>X, Y</math> będą przestrzeniami Banacha.
Niech <math>X, Y</math> będą przestrzeniami Banacha.


{{twierdzenie|[Uzupelnij]||
{{twierdzenie|9.18.||
Niech <math>F: X\mapsto \mathbb{R}</math>, <math>G: X\mapsto
Niech <math>F: X\mapsto \mathbb{R}</math>, <math>G: X\mapsto
Y </math> będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego
Y </math> będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego
<math>a</math> poziomicy <math>\{G=0\}</math> (co -- przypomnijmy -- oznacza, że
<math>a</math> poziomicy <math>\{G=0\}</math> (co - przypomnijmy - oznacza, że
różniczka <math>d_a G </math> jest suriekcją przestrzeni <math>X</math> na <math>Y</math>). Jeśli
różniczka <math>d_a G </math> jest suriekcją przestrzeni <math>X</math> na <math>Y</math>). Jeśli
funkcja <math>F</math> osiąga ekstremum warunkowe w punkcie regularnym <math>a</math>
funkcja <math>F</math> osiąga ekstremum warunkowe w punkcie regularnym <math>a</math>
Linia 932: Linia 948:
ciągły <math>\Lambda: Y\mapsto\mathbb{R}</math> taki, że zachodzi równość <math>d_a
ciągły <math>\Lambda: Y\mapsto\mathbb{R}</math> taki, że zachodzi równość <math>d_a
F=\Lambda \circ d_a G</math>.
F=\Lambda \circ d_a G</math>.
}}
}}


Linia 939: Linia 954:
osiąga minimum, czy maksimum warunkowe w punkcie <math>a\in\{G=0\}</math>.
osiąga minimum, czy maksimum warunkowe w punkcie <math>a\in\{G=0\}</math>.


{{twierdzenie|[Uzupelnij]||
{{twierdzenie|9.19.||
Niech <math>F: X\mapsto \mathbb{R}</math>, <math>G: X\mapsto
Niech <math>F: X\mapsto \mathbb{R}</math>, <math>G: X\mapsto
Y</math> będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu
Y</math> będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu
regularnego <math>a</math> poziomicy <math>\{G=0\}</math>. Jeśli istnieje funkcjonał
regularnego <math>a</math> poziomicy <math>\{G=0\}</math>. Jeśli istnieje funkcjonał
liniowy i ciągły <math>\Lambda: Y\mapsto\mathbb{R}</math> taki, że zachodzi równość
liniowy i ciągły <math>\Lambda: Y\mapsto\mathbb{R}</math> taki, że zachodzi równość
<math>d_a F=\Lambda \circ d_a G</math> oraz forma kwadratowa <center><math>X\ni h\mapsto
<math>d_a F=\Lambda \circ d_a G</math> oraz forma kwadratowa  
\big(d^2_a F-\Lambda \circ d_a^2 G \big)(h,h)\in\mathbb{R}</math></center> jest
 
dodatnio określona (odpowiednio: ujemnie określona) na
<center><math>
X\ni h\mapsto\big(d^2_a F-\Lambda \circ d_a^2 G \big)(h,h)\in\mathbb{R}
</math></center>  
 
jest dodatnio określona (odpowiednio: ujemnie określona) na
podprzestrzeni <math>X_1:=\{h\in X, d_aG(h)=0\}</math> przestrzeni <math>X</math>, to
podprzestrzeni <math>X_1:=\{h\in X, d_aG(h)=0\}</math> przestrzeni <math>X</math>, to
funkcja <math>F</math> osiąga w punkcie <math>a</math> minimum (odpowiednio: maksimum)
funkcja <math>F</math> osiąga w punkcie <math>a</math> minimum (odpowiednio: maksimum)
warunkowe. }}
warunkowe.  
}}


{{definicja|[Uzupelnij]||
{{definicja|9.20.||
Funkcjonał <math>\Lambda</math>, który występuje w
Funkcjonał <math>\Lambda</math>, który występuje w wypowiedzi obu powyższych twierdzeń, nazywamy '''''funkcjonałem Lagrange'a'''''. }}
wypowiedzi obu powyższych twierdzeń, nazywamy '''''funkcjonałem
Lagrange'a'''''. }}


Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku
Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku
Linia 961: Linia 979:
tego twierdzenia w kilku najczęściej spotykanych sytuacjach.
tego twierdzenia w kilku najczęściej spotykanych sytuacjach.


{{uwaga|[Uzupelnij]||
{{uwaga|9.21.||
Jeśli <math>f, g : \mathbb{R}^2\mapsto \mathbb{R}</math> są
Jeśli <math>f, g : \mathbb{R}^2\mapsto \mathbb{R}</math> są
funkcjami różniczkowalymi, problem znalezienia ekstremum
funkcjami różniczkowalymi, problem znalezienia ekstremum
Linia 967: Linia 985:
znalezienia punktu <math>a</math> na poziomicy <math>\{g=0\}</math> oraz stałej
znalezienia punktu <math>a</math> na poziomicy <math>\{g=0\}</math> oraz stałej
<math>\lambda</math>, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem
<math>\lambda</math>, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem
ekstremum to jest realizowane to -- zgodnie z podanym twierdzeniem
ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem
-- istnieje funkcjonał liniowy <math>\Lambda : \mathbb{R}\mapsto \mathbb{R}</math> dany
- istnieje funkcjonał liniowy <math>\Lambda : \mathbb{R}\mapsto \mathbb{R}</math> dany
wzorem <math>\Lambda (x)=\lambda x</math>
wzorem <math>\Lambda (x)=\lambda x</math>
taki, że różniczka
taki, że różniczka
Linia 974: Linia 992:
poziomicy <math>\{g=0\}</math>. Przypomnijmy, że w przypadku, gdy <math>g:
poziomicy <math>\{g=0\}</math>. Przypomnijmy, że w przypadku, gdy <math>g:
\mathbb{R}^2\mapsto \mathbb{R}</math>, punkt <math>a</math> jest regularny, jeśli rząd różniczki
\mathbb{R}^2\mapsto \mathbb{R}</math>, punkt <math>a</math> jest regularny, jeśli rząd różniczki
<center><math>d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial
 
g(a)}{\partial y}dy</math></center> wynosi 1. Wystarczy więc sprawdzić, czy w
<center><math>
d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial
g(a)}{\partial y}dy
</math></center>  
 
wynosi 1. Wystarczy więc sprawdzić, czy w
punkcie <math>a</math> różniczka <math>d_a g\neq 0</math>, czyli czy którakolwiek
punkcie <math>a</math> różniczka <math>d_a g\neq 0</math>, czyli czy którakolwiek
pochodna cząstkowa  <math>\frac{\partial g(a)}{\partial x}</math> lub
pochodna cząstkowa  <math>\frac{\partial g(a)}{\partial x}</math> lub
Linia 981: Linia 1004:
sprowadza się do znalezienia punktów, w których zeruje się
sprowadza się do znalezienia punktów, w których zeruje się
różniczka funkcji pomocniczej
różniczka funkcji pomocniczej
<center><math>\Phi(x,y): =f(x,y)-\lambda g(x,y), </math></center>
 
<center><math>
\Phi(x,y): =f(x,y)-\lambda g(x,y),  
</math></center>
 
gdzie stałą <math>\lambda</math> (nazywaną tradycyjnie '''''mnożnikiem
gdzie stałą <math>\lambda</math> (nazywaną tradycyjnie '''''mnożnikiem
Lagrange'a''''') wyznaczamy z układu równań
Lagrange'a''''') wyznaczamy z układu równań
<center><math>\left\{\aligned d_{(x,y)}\Phi=0\\g(x,y)=0\endaligned \right.
 
<center><math>
\left\{\aligned d_{(x,y)}\Phi=0\\g(x,y)=0\endaligned \right.
\text{ czyli }
\text{ czyli }
\left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x}
\left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x}
\\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y}
\\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y}
\\g(x,y)=0.\endaligned \right.</math></center>
\\g(x,y)=0.\endaligned \right.
</math></center>
}}
}}


{{uwaga|[Uzupelnij]||
{{uwaga|9.22.||
Jeśli <math>f, g : \mathbb{R}^3\mapsto \mathbb{R}</math> są
Jeśli <math>f, g : \mathbb{R}^3\mapsto \mathbb{R}</math> są
funkcjami różniczkowalnymi, problem znalezienia ekstremum
funkcjami różniczkowalnymi, problem znalezienia ekstremum
warunkowego funkcji <math>f</math> przy warunku <math>\{g=0\}</math> sprowadza się do
warunkowego funkcji <math>f</math> przy warunku <math>\{g=0\}</math> sprowadza się do
znalezienia -- podobnie jak w poprzednim przypadku -- punktu <math>a</math>
znalezienia - podobnie jak w poprzednim przypadku - punktu <math>a</math>
na poziomicy <math>\{g=0\}</math> oraz stałej <math>\lambda</math>, która reprezentuje
na poziomicy <math>\{g=0\}</math> oraz stałej <math>\lambda</math>, która reprezentuje
funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane
funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane
to -- zgodnie z podanym twierdzeniem -- istnieje funkcjonał
to - zgodnie z podanym twierdzeniem - istnieje funkcjonał
liniowy <math>\Lambda : \mathbb{R}\mapsto \mathbb{R}</math> dany wzorem <math>\Lambda
liniowy <math>\Lambda : \mathbb{R}\mapsto \mathbb{R}</math> dany wzorem <math>\Lambda
(x)=\lambda x</math>,
(x)=\lambda x</math>, taki, że różniczka
taki, że różniczka
<math>d_a f=\lambda d_a g</math>, o ile punkt <math>a</math> jest punktem regularnym
<math>d_a f=\lambda d_a g</math>, o ile punkt <math>a</math> jest punktem regularnym
poziomicy <math>\{g=0\}</math>. Przypomnijmy, że w przypadku, gdy <math>g:
poziomicy <math>\{g=0\}</math>. Przypomnijmy, że w przypadku, gdy <math>g:
Linia 1007: Linia 1036:
(odwzorowania liniowego z <math>\mathbb{R}^3</math> do <math>\mathbb{R}</math>) jest maksymalny, czyli
(odwzorowania liniowego z <math>\mathbb{R}^3</math> do <math>\mathbb{R}</math>) jest maksymalny, czyli
wynosi <math>1</math>. Wystarczy więc sprawdzić, czy w punkcie <math>a</math> różniczka
wynosi <math>1</math>. Wystarczy więc sprawdzić, czy w punkcie <math>a</math> różniczka
<center><math>d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial g(a)}{\partial
 
y}dy+\frac{\partial g(a)}{\partial z}dz</math></center> nie zeruje się, czyli
<center><math>
czy któraś z pochodnych cząstkowych <math>\frac{\partial g(a)}{\partial
d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial g(a)}{\partial
y}dy+\frac{\partial g(a)}{\partial z}dz
</math></center>  
 
nie zeruje się, czyli czy któraś z pochodnych cząstkowych <math>\frac{\partial g(a)}{\partial
x}</math>, <math>\frac{\partial g(a)}{\partial y}</math>, <math>\frac{\partial
x}</math>, <math>\frac{\partial g(a)}{\partial y}</math>, <math>\frac{\partial
g(a)}{\partial z}</math> jest różna od zera. Zagadnienie można
g(a)}{\partial z}</math> jest różna od zera. Zagadnienie można
sprowadzić do znalezienia punktów, w których zeruje się różniczka
sprowadzić do znalezienia punktów, w których zeruje się różniczka
funkcji pomocniczej
funkcji pomocniczej
<center><math>\Phi(x,y,z): =f(x,y,z)-\lambda g(x,y,z), </math></center>
 
<center><math>
\Phi(x,y,z): =f(x,y,z)-\lambda g(x,y,z),  
</math></center>
 
gdzie stałą <math>\lambda</math>  wyznaczamy z układu równań
gdzie stałą <math>\lambda</math>  wyznaczamy z układu równań
<center><math>\left\{\aligned d_{(x,y,z)}\Phi=0\\g(x,y,z)=0\endaligned \right.
 
<center><math>
\left\{\aligned d_{(x,y,z)}\Phi=0\\g(x,y,z)=0\endaligned \right.
\text{ czyli }
\text{ czyli }
\left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x}
\left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x}
\\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y}
\\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y}
\\ \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z}
\\ \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z}
\\g(x,y,z)=0.\endaligned \right.</math></center>
\\g(x,y,z)=0.\endaligned \right.
</math></center>
}}
}}


{{przyklad|[Uzupelnij]||
{{przyklad|9.23.||
Powróćmy do zadania polegającego na
Powróćmy do zadania polegającego na wyznaczeniu najmniejszej i największej wartości funkcji
wyznaczeniu najmniejszej i największej wartości funkcji
<math>f(x,y,z)=x -2y +2z </math> na sferze <math>x^2+y^2+z^2=1</math>. Rozwiążemy je
<math>f(x,y,z)=x -2y +2z </math> na sferze <math>x^2+y^2+z^2=1</math>. Rozwiążemy je
'''''metodą mnożników Lagrange'a''''' opisaną w poprzednich uwagach.
'''''metodą mnożników Lagrange'a''''' opisaną w poprzednich uwagach.
Linia 1032: Linia 1071:
Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech
Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech
<math>\Phi(x,y,z)=f(x,y,z)-\lambda g(x,y,z)</math>. Rozwiązujemy układ równań
<math>\Phi(x,y,z)=f(x,y,z)-\lambda g(x,y,z)</math>. Rozwiązujemy układ równań
<center><math>\left\{\aligned \frac{\partial f}{\partial x}=\lambda
 
<center><math>
\left\{\aligned \frac{\partial f}{\partial x}=\lambda
\frac{\partial g}{\partial x}\\ \frac{\partial f}{\partial
\frac{\partial g}{\partial x}\\ \frac{\partial f}{\partial
y}=\lambda \frac{\partial g}{\partial y}\\ \frac{\partial
y}=\lambda \frac{\partial g}{\partial y}\\ \frac{\partial
Linia 1038: Linia 1079:
\\g(x,y,z)=0\endaligned \right. \text{ czyli } \left\{\aligned
\\g(x,y,z)=0\endaligned \right. \text{ czyli } \left\{\aligned
1=2\lambda x \\-2=2\lambda y\\2=2\lambda z\\x^2+y^2+z^2=1.
1=2\lambda x \\-2=2\lambda y\\2=2\lambda z\\x^2+y^2+z^2=1.
\endaligned \right.</math></center> Układ ten spełniają liczby <center><math>x=-\frac{1}{3},
\endaligned \right.
y=\frac{2}{3}, z=-\frac{2}{3}, \lambda=-\frac{3}{2}</math></center> oraz
</math></center>  
<center><math>x=\frac{1}{3}, y=-\frac{2}{3}, z=\frac{2}{3},
 
\lambda=\frac{3}{2}.</math></center> Ponieważ sfera jest zbiorem zwartym,
Układ ten spełniają liczby  
 
<center><math>
x=-\frac{1}{3},y=\frac{2}{3}, z=-\frac{2}{3}, \lambda=-\frac{3}{2}
</math></center>  
 
oraz
 
<center><math>
x=\frac{1}{3}, y=-\frac{2}{3}, z=\frac{2}{3},
\lambda=\frac{3}{2}.
</math></center>  
 
Ponieważ sfera jest zbiorem zwartym,
wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je,
wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je,
gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez
gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez
Linia 1047: Linia 1101:
funkcja <math>f</math> musi osiągać kres dolny, a w drugim kres górny
funkcja <math>f</math> musi osiągać kres dolny, a w drugim kres górny
wartości na sferze <math>\{g=0\}</math>. Mamy
wartości na sferze <math>\{g=0\}</math>. Mamy
<center><math>f\big(-\frac{1}{3}, \frac{2}{3}, -\frac{2}{3} \big)=-3, \ \ f\big(\frac{1}{3}, -\frac{2}{3}, \frac{2}{3}
 
\big)=3,</math></center> czyli <math>f</math> osiąga w pierwszym z tych punktów  wartość
<center><math>
najmniejszą równą <math>-3</math>, a w drugim punkcie -- wartość największą
f\big(-\frac{1}{3}, \frac{2}{3}, -\frac{2}{3} \big)=-3, \ \ f\big(\frac{1}{3}, -\frac{2}{3}, \frac{2}{3}
\big)=3,
</math></center>  
 
czyli <math>f</math> osiąga w pierwszym z tych punktów  wartość
najmniejszą równą <math>-3</math>, a w drugim punkcie - wartość największą
na sferze równą <math>3</math>.
na sferze równą <math>3</math>.
}}
}}


{{uwaga|[Uzupelnij]||
{{uwaga|9.24.||
Jeśli funkcja <math>F: \mathbb{R}^3\mapsto \mathbb{R}</math>,
Jeśli funkcja <math>F: \mathbb{R}^3\mapsto \mathbb{R}</math>,
zaś <math>G:\mathbb{R}^3\mapsto \mathbb{R}^2</math>, zagadnienie znalezienia ekstremów
zaś <math>G:\mathbb{R}^3\mapsto \mathbb{R}^2</math>, zagadnienie znalezienia ekstremów
Linia 1064: Linia 1123:
<math>\lambda_2</math>. Funkcja <math>G=(g_1, g_2)</math> jest zestawieniem dwóch
<math>\lambda_2</math>. Funkcja <math>G=(g_1, g_2)</math> jest zestawieniem dwóch
funkcji <math>g_1, g_2</math> o wartościach rzeczywistych, stąd
funkcji <math>g_1, g_2</math> o wartościach rzeczywistych, stąd
<center><math>\Phi(x,y,z)=F(x,y,z)-\Lambda G(x,y,z)=F(x,y,z)-\lambda_1 g_1
(x,y,z)-\lambda_2 g_2 (x,y,z).</math></center> Metoda mnożników Lagrange'a
sprowadza się więc do znalezienia rozwiązań układu równań


<center><math>\left\{\aligned d_{(x,y,z)}\Phi=0\\G(x,y,z)=0\endaligned \right.
<center><math>
\Phi(x,y,z)=F(x,y,z)-\Lambda G(x,y,z)=F(x,y,z)-\lambda_1 g_1
(x,y,z)-\lambda_2 g_2 (x,y,z).
</math></center>
 
Metoda mnożników Lagrange'a sprowadza się więc do znalezienia rozwiązań układu równań
 
<center><math>
\left\{\aligned d_{(x,y,z)}\Phi=0\\G(x,y,z)=0\endaligned \right.
\text{ czyli }
\text{ czyli }
\left\{\aligned \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x}
\left\{\aligned \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x}
Linia 1074: Linia 1138:
\\ \frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z}
\\ \frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z}
\\ g_1(x,y,z)=0
\\ g_1(x,y,z)=0
\\ g_2(x,y,z)=0\endaligned \right.</math></center>
\\ g_2(x,y,z)=0\endaligned \right.
</math></center>
 
w punktach regularnych poziomicy <math>\{G=0\}</math>, czyli tych, w których
w punktach regularnych poziomicy <math>\{G=0\}</math>, czyli tych, w których
rząd różniczki <math>d_{(x,y,z)}G</math> jest maksymalny (tj. równy <math>2</math>, gdyż
rząd różniczki <math>d_{(x,y,z)}G</math> jest maksymalny (tj. równy <math>2</math>, gdyż
różniczka <math>d_{(x,y,z)}G</math> jest odwzorowaniem liniowym z <math>\mathbb{R}^3</math> do
różniczka <math>d_{(x,y,z)}G</math> jest odwzorowaniem liniowym z <math>\mathbb{R}^3</math> do
<math>\mathbb{R}^2</math>).
<math>\mathbb{R}^2</math>).
Zwróćmy uwagę, że funkcja <math>F</math> może osiągać ekstremum w punktach,
Zwróćmy uwagę, że funkcja <math>F</math> może osiągać ekstremum w punktach,
które należą do poziomicy <math>\{G=0\}</math> a nie są regularne. Metoda
które należą do poziomicy <math>\{G=0\}</math> a nie są regularne. Metoda
mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu
mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu ekstremum.  
ekstremum. }}
}}
 
{{przyklad|9.25.||
Wyznaczmy najmniejszą i największą wartość funkcji
 
<center><math>
F(x,y,z)=x-y-2z
</math></center>
 
na przecięciu się dwóch walców
 
<center><math>
x^2+z^2=1, \ \ y^2+z^2=1.
</math></center>


{{przyklad|[Uzupelnij]||
Wyznaczmy najmniejszą i największą
wartość funkcji
<center><math>F(x,y,z)=x-y-2z</math></center> na przecięciu się dwóch walców
<center><math>x^2+z^2=1, \ \ y^2+z^2=1.</math></center>
Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym,
Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym,
gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem
gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem
Linia 1099: Linia 1173:
mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań
mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań
układu równań:
układu równań:
<center><math>\left\{\aligned
 
<center><math>
\left\{\aligned
\frac{\partial F}{\partial x}=\lambda_1 \frac{\partial
\frac{\partial F}{\partial x}=\lambda_1 \frac{\partial
g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x}
g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x}
Linia 1109: Linia 1185:
\left\{\aligned 1=2\lambda_1 x\\-1=2\lambda_2 y\\ -2
\left\{\aligned 1=2\lambda_1 x\\-1=2\lambda_2 y\\ -2
=2(\lambda_1+\lambda_2)z\\ x^2+z^2-1=0\\y^2+z^2-1=0.
=2(\lambda_1+\lambda_2)z\\ x^2+z^2-1=0\\y^2+z^2-1=0.
\endaligned\right.</math></center>
\endaligned\right.
</math></center>
 
Układ ten ma dwa rozwiązania
Układ ten ma dwa rozwiązania
<center><math>-x=y=z=\frac{\sqrt{2}}{2}, \text{ przy czym }
 
\lambda_1=\lambda_2=-\frac{\sqrt{2}}{2}</math></center> oraz
<center><math>
<center><math>x=-y=-z=\frac{\sqrt{2}}{2}, \text{ przy czym }
-x=y=z=\frac{\sqrt{2}}{2}, \text{ przy czym }
\lambda_1=\lambda_2=\frac{\sqrt{2}}{2}.</math></center> Wartość funkcji <math>F</math> w
\lambda_1=\lambda_2=-\frac{\sqrt{2}}{2}
tych punktach wynosi <center><math>F\big(-\frac{\sqrt{2}}{2},
</math></center>  
 
oraz
 
<center><math>
x=-y=-z=\frac{\sqrt{2}}{2}, \text{ przy czym }
\lambda_1=\lambda_2=\frac{\sqrt{2}}{2}.
</math></center>  
 
Wartość funkcji <math>F</math> w tych punktach wynosi  
 
<center><math>
F\big(-\frac{\sqrt{2}}{2},
\frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}\big)=-2\sqrt{2} \text{ oraz
\frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}\big)=-2\sqrt{2} \text{ oraz
} F\big(\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2},
} F\big(\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2},
-\frac{\sqrt{2}}{2}\big)=2\sqrt{2}.</math></center>  W obu punktach
-\frac{\sqrt{2}}{2}\big)=2\sqrt{2}.
nieregularnych poziomicy <math>\{G=0\}</math> mamy
</math></center>   
<center><math>F(0,0,-1)=2 \text{ oraz } F(0,0,1)=-2.</math></center> Po porównaniu tych wartości:
 
<math>-2\sqrt{2}<-2<2<2\sqrt{2}</math> stwierdzamy, że największą wartość na
W obu punktach nieregularnych poziomicy <math>\{G=0\}</math> mamy
 
<center><math>
F(0,0,-1)=2 \text{ oraz } F(0,0,1)=-2.
</math></center>  
 
Po porównaniu tych wartości: <math>-2\sqrt{2}<-2<2<2\sqrt{2}</math> stwierdzamy, że największą wartość na
na poziomicy <math>\{G=0\}</math> równą <math>2\sqrt{2}</math> funkcja <math>F</math> osiąga w
na poziomicy <math>\{G=0\}</math> równą <math>2\sqrt{2}</math> funkcja <math>F</math> osiąga w
punkcie <math> (\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2},
punkcie <math> (\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2},

Wersja z 20:43, 21 sie 2006

AM2 - moduł 9

9. Twierdzenie o funkcjach uwikłanych.

Rozważamy funkcje zadane niejawnie. Formułujemy twierdzenie o funkcji uwikłanej i przedstawiamy metody badania takiej funkcji. Podajemy metodę mnożników Lagrange'a badania ekstremów warunkowych funkcji wielu zmiennych.

9.1 Punkty regularne poziomicy

Niech X,Y,Z będą przestrzeniami Banacha i niech UX×Y będzie zbiorem otwartym. Rozważmy funkcję

F:X×YU(x,y)F(x,y)Z

oraz jej poziomicę zerową tj. zbiór

{F=0}={(x,y)U:F(x,y)=0}.

Ustalmy pewien punkt P=(a,b){F=0}, aX, bY, na tej poziomicy.

Definicja 9.1.

Mówimy, że punkt P{F=0} jest punktem regularnym zbioru {F=0}, jeśli różniczka dPF jest suriekcją przestrzeni X×Y na przestrzeń Z. Punkt poziomicy {F=0}, który nie jest regularny, będziemy nazywać punktem nieregularnym tej poziomicy.

Przypomnijmy fakt z algebry liniowej:

Uwaga 9.2.

W przypadku przestrzeni o skończonym wymiarze X=n, Y=m odwzorowanie liniowe L:X×YY jest suriekcją wtedy i tylko wtedy, gdy rząd (macierzy) odwzorowania L jest maksymalny, tj. równy m.

Przykład 9.3.

Niech X=Y=. Rozważmy F(x,y)=x2+y21 i poziomicę zerową tej funkcji

{F=0}={x2+y2=1},

czyli okrąg o środku w punkcie (0,0) i promieniu jednostkowym. Różniczka

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned d_{(x_0, y_0)}F&=\frac{\partial F}{\partial x}(x_0, y)dx+\frac{\partial F}{\partial y}(x_0, y)dy\\&=2x_0 dx+2y_0 dy\endaligned }

w dowolnym punkcie (x0,y0){F=0} ma rząd maksymalny. Rząd różniczki d(x0,y0)F nie jest maksymalny tylko w punkcie, w którym obie pochodne cząstkowe Fx, Fy zerują się, czyli gdy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned 2x_0=0\\2y_0=0,\endaligned\right. }

ale punkt (0,0) nie leży na okręgu {F=0}.

Przykład 9.4.

Niech X=Y= i niech F(x,y)=x3+y33xy. Pamiętamy, że poziomicą zerową tej funkcji

{F=0}={x3+y3=3xy}

jest krzywa, którą nazywamy liściem Kartezjusza. Zauważmy, że różniczka

d(x0,y0)F=3(x02y0)dx+3(y02x0)dy
nie ma maksymalnego rzędu, gdy
Parser nie mógł rozpoznać (nieznana funkcja „\alignedx”): {\displaystyle \left\{\alignedx_0^2-y_0=0\\y_0^2-x_0=0,\endaligned\right. }

czyli w punktach (0,0) i (1,1). Stąd punkt (0,0) jest punktem nieregularnym

liścia Kartezjusza. Drugi punkt (1,1) nie leży na poziomicy {F=0}.

Przykład 9.5.

Niech X=Y= i niech F(x,y)=(x2+y2)22(x2y2). Poziomicę zerową tej funkcji już także poznaliśmy. Krzywą

{F=0}={(x2+y2)2=2(x2y2)}

nazywamy lemniskatą Bernoullego. Różniczka

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned d_{(x_0,y_0)}F&=\left(2(x_0^2+y_0^2)2x_0-4x_0\right)dx+\left(2(x_0^2+y_0^2)2y_0+4y_0\right)dy \\&=4x_0(x_0^2+y_0^2-1)dx+4y_0(x_0^2+y_0^2+1)dy\endaligned }

nie ma maksymalnego rzędu tylko wtedy, gdy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned x_0(x_0^2+y_0^2-1)=0\\ y_0(x_0^2+y_0^2+1)=0,\endaligned\right. }

czyli w trzech punktach (0,0), (1,0) i (1,0), spośród których tylko pierwszy (0,0) leży na lemniskacie Bernoullego. Nie jest więc jej punktem regularnym.

Przykład 9.6.

Poziomicą zerową funkcji

F:3(x,y,z)F(x,y,z)=x2+y2+z21

jest sfera o środku w początku układu współrzędnych (0,0,0) i promieniu jednostkowym:

{F=0}={(x,y,z):x2+y2+z2=1}.

Różniczka odwzorowania F dana wzorem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned d_{(x,y,z)}F&=\frac{\partial F}{\partial x}(x,y,z)dx+\frac{\partial F}{\partial y}(x,y,z)dy+\frac{\partial F}{\partial z}(x,y,z)dz\\&= 2xdx+2ydy+2zdz\endaligned }

jest odwzorowaniem liniowym i ciągłym z 3 do i ma rząd maksymalny (równy 1) we wszystkich punktach 3 poza początkiem układu współrzędnych (0,0,0), w którym rząd ten wynosi zero. Punkt (0,0,0) nie należy jednak do sfery {F=0}, stąd każdy jej punkt jest regularny.

Rysunek am2w09.0040 a, b, c - przecięcie dwóch walców

Przykład 9.7.

Niech F:3(x,y,z)F(x,y,z)=(x2+z21,y2+z21)2. Wówczas poziomicą zerową funkcji F jest zbiór

{F=0}={(x,y,z)3,x2+z2=1,y2+z2=1},

który powstaje z przecięcia walca x2+z2=1 o osi obrotu OY z walcem y2+z2=1 o osi obrotu OX. Zauważmy, że różniczka

d(x,y,z)F=(2xdx+0dy+2zdz,0dx+2ydy+2zdz)

jest odwzorowaniem liniowym i ciągłym z 3 do 2. Jest więc maksymalnego rzędu, gdy rząd macierzy jej współczynników

Parser nie mógł rozpoznać (nieznana funkcja „\beginmatrix”): {\displaystyle A=\left[\beginmatrix &2x &0 &2z\\ &0 &2y &2z \endmatrix \right] }

wynosi 2. Zauważmy, że rząd macierzy A wynosi zero, gdy x=y=z=0 (punkt (0,0,0) nie należy do poziomicy zerowej {F=0}). Z kolei, rząd tej macierzy wynosi jeden, gdy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned &&x=y=0, z\neq0,\\ &\text{lub}&\\ &&x=z=0, y\neq0, \\ &\text{lub}& \\ &&y=z=0,x\neq0,\endaligned }

co ma miejsce w dwóch punktach poziomicy {F=0}, a mianowicie w punktach (0,0,1) oraz (0,0,1). Są to jedyne punkty poziomicy, które nie są regularne, gdyż rząd różniczki d(x,y,z)F w pozostałych punktach poziomicy jest

maksymalny (tj. wynosi 2).

Rysunek am2w09.0010

Przykład 9.8.

Niech F:3(x,y,z)F(x,y,z)=(x2+y2+z2)23xyz. Poziomicą zerową tej funkcji jest powierzchnia o równaniu

{(x,y,z)={(x,y,z)3:(x2+y2+z2)2=3xyz}.

Różniczka d(x,y,z)F=Fxdx+Fydy+Fzdz jest odwzorowaniem liniowym i ciągłym z 3 do , nie ma więc rzędu maksymalnego w punktach (x,y,z), w których rząd różniczki jest niższy niż jeden, czyli w punktach, w których zerują się wszystkie trzy pochodne cząstkowe Fx=0,Fy=0,Fz=0, tzn. gdy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned 4x(x^2+y^2+z^2)=3yz\\ 4y(x^2+y^2+z^2)=3xz\\ 4z(x^2+y^2+z^2)=3xy\endaligned \right. }

Układ ten spełnia punkt o współrzędnych (0,0,0) a także punkty o współrzędnych (x,y,z), które spełniają układ

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned x^2&=y^2\\y^2&=z^2\\z^2&=x^2,\endaligned\right. }

czyli |x|=|y|=|z|. Spośród punktów poziomicy {F=0} warunek ten spełniają poza punktem (0,0,0) także punkty (a,a,a), (a,a,a), (a,a,a), (a,a,a), gdzie a=13. Poza wskazanymi pięcioma punktami poziomicy {F=0} pozostałe punkty są regularne, gdyż różniczka odwzorowania F ma w nich rząd maksymalny (równy 1).

9.2 Twierdzenie o funkcji uwikłanej

Niech X, Y będą przestrzeniami Banacha i niech F:UY będzie funkcją różniczkowalną w zbiorze otwartym UX×Y. Niech (a,b){F=0} będzie punktem poziomicy zerowej funkcji F, gdzie aX,bY. Powstaje naturalne pytanie o warunki, przy których poziomicę {F=0} w otoczeniu punktu (a,b) można przedstawić jako wykres pewnej funkcji f:XY takiej, że F(x,f(x))=0 w pewnym otoczeniu otwartym punktu aX.

Rozważmy dwa proste przykłady.

Przykład 9.9.

Niech (a,b) będzie punktem okręgu x2+y2=1, który stanowi poziomicę zerową funkcji

×(x,y)F(x,y)=x2+y21.

Jeśli b>0, to w otoczeniu punktu a(1,1) można określić funkcję

f1:xf1(x)=1x2

taką, że

F(x,f1(x))=x2+(1x2)21=0  oraz  f1(a)=b.

Z kolei, jeśli b<0, to w otoczeniu punktu a(1,1) znajdziemy funkcję

f2:xf2(x)=1x2

taką, że

Parser nie mógł rozpoznać (nieznana funkcja „\f”): {\displaystyle F(x, f_2(x))=x^2+(-\sqrt{1-x^2})^2-1=0 \ \text{ oraz } \f_2(a)=b. }

Jedynymi punktami (a,b) okręgu x2+y2=1, w otoczeniu których nie znajdziemy funkcji f:xf(x) takiej, że f(a)=b i F(x,f(x))=0, są punkty (1,0) oraz

(1,0). Zauważmy, że w punktach tych zeruje się pochodna cząstkowa Fy.

Przykład 9.10.

Niech a=(a1,a2)2, b. Niech (a,b)3 będzie punktem sfery x12+x22+z2=1, która stanowi poziomicę zerową funkcji F(x1,x2,z)=x12+x22+z21. Jeśli b>0, to w otoczeniu punktu a=(a1,a2) wewnątrz okręgu x12+x22<1 można określić funkcję

f1:(x1,x2)f1(x1,x2)=1x12x22

taką, że

Parser nie mógł rozpoznać (błąd składni): {\displaystyle F(x_1, x_2, f_1(x_1,x_2))=x_1^2+x_2^2 +\big(\sqrt{1-x_1^2-x_2^2}\big)^2-1=0 \ \text{ oraz } \ f_1(a)=b. }

Z kolei, jeśli b<0 znajdziemy funkcję

f2:(x1,x2)f1(x1,x2)=1x12x22

taką, że

Parser nie mógł rozpoznać (nieznana funkcja „\f”): {\displaystyle F(x_1, x_2, f_2(x_1, x_2))=x_1^2+x_2^2+\big(-\sqrt{1-x_1^2-x_2^2}\big)^2-1=0\ \text{ oraz } \f_2(a)=b. }

Jedynymi punktami (a,b) sfery x12+x22+z2=1, w otoczeniu których nie znajdziemy funkcji f:(x1,x2)f(x1,x2) takiej, że f(a)=b i F(x1,x2,f(x1,x2))=0, są punkty okręgu x12+x22=1 zawartego w płaszczyźnie z=0. Zauważmy, że w punktach tych zeruje się pochodna cząstkowa Fz=2z.

Uogólnijmy to spostrzeżenie formułując

Twierdzenie 9.11.[twierdzenie o funkcji uwikłanej]

Niech F:UY będzie funkcją różniczkowalną o ciągłej różniczce na zbiorze otwartym UX×Y. Niech (a,b){F=0} (gdzie aX,bY) będzie punktem poziomicy zerowej funkcji F takim, że zacieśnienie różniczki d(a,b)F|Y do podprzestrzeni YX×Y jest izomorfizmem. Wówczas

1) istnieje pewne otoczenie otwarte VX punktu a oraz istnieje dokładnie jedna funkcja określona w tym otoczeniu f:VY taka, że f(a)=b oraz F(x,f(x))=0 dla dowolnego xV. Ponadto

2) funkcja f jest różniczkowalna i ma ciągłą różniczkę w zbiorze

V daną wzorem
dxf=(d(x,y)F|Y)1(d(x,y)F|X),
gdzie y=f(x), natomiast

d(x,y)F|X oznacza zacieśnienie różniczki d(x,y)F do podprzestrzeni XX×Y a (d(x,y)F|Y)1 jest izomorfizmem odwrotnym do zacieśnienia różniczki d(x,y)F|Y.

Dowód [szkic]

(szkic) Pominiemy dowód istnienia funkcji f. Wyprowadzimy jednak wzór, który określa jej różniczkę, w trzech przypadkach najczęściej spotykanych w konkretnych zastosowaniach. Przypomnijmy wpierw jednak, że

Uwaga 9.12.

Jeśli Y=n, to odwzorowanie liniowe L:YY jest izomorfizmem wtedy i tylko wtedy, gdy wyznacznik tego odwzorowania jest różny od zera, tj. detL0.

Przypadek I. Niech X=Y= i niech F:2(x,y)F(x,y). Jeśli funkcja f: spełnia równanie F(x,f(x))=0, to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość

0=ddxF(x,f(x))=Fx(x,y)+Fy(x,y)dfdx(x), gdzie y=f(x).

Stąd

Fx(x,y)=,Fy(x,y)dfdx(x).

Z założenia zacieśnienie różniczki d(x,y)F|Y jest izomorfizmem przestrzeni do , co oznacza w tym przypadku, że pochodna cząstkowa Fy0. Stąd pochodna funkcji uwikłanej wyraża się wzorem

dfdx(x)=(Fy(x,y))1Fx(x,y),gdziey=f(x).

Przypadek II. Niech F:3(x1,x2,y)F(x1,x2,y). Jeśli funkcja f:2 spełnia równanie F(x1,x2,f(x1,x2))=0, to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość prawdziwą w punktach (x1,x2,y) poziomicy {F=0}

0=x1F(x1,x2,f(x1,x2))=Fx1x1x1+Fx2x2x1+Fyfx1=Fx1+0+Fyfx1

oraz

0=x2F(x1,x2,f(x1,x2))=Fx1x1x2+Fx2x2x2+Fyfx2=0+Fx2+Fyfx2

Izomorficzność zawężenia różniczki d(x1,x2,y)F|Y również w tym przypadku oznacza po prostu, że pochodna cząstkowa Fy(x1,x2,y)0. Wówczas z powyższych równości dostajemy

fx1(x1,x2)=(Fy(x1,x2,y))1Fx1(x1,x2,y)

oraz

fx2(x1,x2)=(Fy(x1,x2,y))1Fx2(x1,x2,y),

gdzie y=f(x1,x2). Pomijając argument w zapisie pochodnych cząstkowych można te wzory podać w skróconej formie (łatwiejszej do zapamiętania):

fx1=(Fy)1Fx1
oraz
fx2=(Fy)1Fx2.

Przypadek III. Niech X=, Y=2 i niech

F:×2(x,y1,y2)F(x,y1,y2)=(F1(x,y1,y2),F2(x,y1,y2))2.

Załóżmy, że istnieje funkcja różniczkowalna

f:x(f1(x),f2(x))2
taka, że 
0=F(x,f(x))=(F1(x,f1(x),f2(x)), F2(x,f1(x),f2(x))),

to znaczy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned 0&=F_1(x, f_1(x), f_2 (x))\\ 0&=F_1(x, f_1(x), f_2 (x)).\endaligned \right. }

Stąd - korzystając z twierdzenia o różniczkowaniu złożenia funkcji - dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned 0=\frac{d}{dx}F_1(x, f_1(x), f_2 (x))&=\frac{\partial F_1}{\partial x}\frac{dx}{dx}+\frac{\partial F_1}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_1}{\partial y_2}\frac{df_2}{dx}\\&= \frac{\partial F_1}{\partial x}+\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2'\endaligned }

oraz

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned 0=\frac{d}{dx}F_2(x, f_1(x), f_2 (x))&=\frac{\partial F_2}{\partial x}\frac{dx}{dx}+\frac{\partial F_2}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_2}{\partial y_2}\frac{df_2}{dx}\\&= \frac{\partial F_2}{\partial x}+\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2'.\endaligned }

Otrzymujemy układ dwóch równań z niewiadomymi f1, f2, które są pochodnymi składowych funkcji uwikłanej f=(f1,f2):

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned -\frac{\partial F_1}{\partial x}=\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2'\\ -\frac{\partial F_2}{\partial x}=\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2' . \endaligned\right. }

Zapiszmy ten układ w formie macierzowej

Parser nie mógł rozpoznać (nieznana funkcja „\beginmatrix”): {\displaystyle \displaystyle-\left[\beginmatrix \frac{\partial F_1}{\partial x}\\ \\ \frac{\partial F_2}{\partial x}\endmatrix \right] =\left[ \beginmatrix \frac{\partial F_1}{\partial y_1} &\frac{\partial F_1}{\partial y_2}\\&\\ \frac{\partial F_2}{\partial y_1} &\frac{\partial F_2}{\partial y_2}\endmatrix \right] \, \left[\beginmatrix f_1' \\ \\f_2 '\endmatrix \right]. }

W rozważanym przypadku założenie o izomorficzności zacieśnienia różniczki d(x,y)F do podprzestrzeni YX×Y oznacza po prostu fakt, że macierz pochodnych cząstkowych, która reprezentuje d(x,y)F|Y:

Parser nie mógł rozpoznać (nieznana funkcja „\beginmatrix”): {\displaystyle \left[\beginmatrix \frac{\partial F_1}{\partial y_1} &\frac{\partial F_1}{\partial y_2}\\&\\ \frac{\partial F_2}{\partial y_1} &\frac{\partial F_2}{\partial y_2}\endmatrix \right] }

jest nieosobliwa, tj. jej wyznacznik jest różny od zera. Z kolei macierz kolumnowa

Parser nie mógł rozpoznać (nieznana funkcja „\beginmatrix”): {\displaystyle \left[\beginmatrix \frac{\partial F_1}{\partial x}\\ \\ \frac{\partial F_2}{\partial x}\endmatrix \right] }

reprezentuje zacieśnienie różniczki d(x,y)F do podprzestrzeni XX×Y. Macierz niewiadomych f1, f2:

Parser nie mógł rozpoznać (nieznana funkcja „\beginmatrix”): {\displaystyle \left[\beginmatrix f_1' \\ \\f_2'\endmatrix \right] }

reprezentuje różniczkę dxf funkcji uwikłanej f=(f1,f2). Stąd układ równań z niewiadomymi f1, f2 przedstawia równanie

d(x,y)F|X=d(x,y)F|Ydxf,      gdzie y=f(x),

w którym niewiadomą jest różniczka dxf. Izomorficzność zacieśnienia d(x,y)F|Y gwarantuje istnienie odwzorowania odwrotnego (d(x,y)F|Y)1, dzięki czemu otrzymujemy

dxf=(d(x,y)F|Y)1d(x,y)F|X.

W języku algebry nieosobliwość macierzy

Parser nie mógł rozpoznać (nieznana funkcja „\beginmatrix”): {\displaystyle \left[\beginmatrix \frac{\partial F_1}{\partial y_1} &\frac{\partial F_1}{\partial y_2}\\&\\ \frac{\partial F_2}{\partial y_1} &\frac{\partial F_2}{\partial y_2}\endmatrix \right] }

gwarantuje istnienie macierzy do niej odwrotnej. Stąd rozwiązaniem równania

Parser nie mógł rozpoznać (nieznana funkcja „\beginmatrix”): {\displaystyle \displaystyle-\left[\beginmatrix \frac{\partial F_1}{\partial x}\\ \\ \frac{\partial F_2}{\partial x}\endmatrix \right] =\left[ \beginmatrix \frac{\partial F_1}{\partial y_1} &\frac{\partial F_1}{\partial y_2}\\&\\ \frac{\partial F_2}{\partial y_1} &\frac{\partial F_2}{\partial y_2}\endmatrix \right] \, \left[\beginmatrix &f_1' \\ &\\&f_2 '\endmatrix \right] }

jest

Parser nie mógł rozpoznać (nieznana funkcja „\beginmatrix”): {\displaystyle \displaystyle\left[\beginmatrix f_1' \\ \\f_2 '\endmatrix \right] =-\left(\left[ \beginmatrix &\frac{\partial F_1}{\partial y_1} &\frac{\partial F_1}{\partial y_2}\\&&\\ &\frac{\partial F_2}{\partial y_1} &\frac{\partial F_2}{\partial y_2}\endmatrix \right]\right)^{-1} \left[\beginmatrix \frac{\partial F_1}{\partial x}\\ \\ \frac{\partial F_2}{\partial x}\endmatrix \right] }

lub równoważnie:

dxf=(d(x,y)F|Y)1d(x,y)F|X.

9.3 Ekstrema funkcji uwikłanej

Niech X=n,Y= i niech

F:X×(x1,x2,,xn,y)F(x1,x2,,xn,y)

będzie funkcją określoną w pewnym zbiorze otwartym UX×.

Zauważmy, że do wyznaczenia różniczki funkcji f uwikłanej równaniem F(x,f(x))=0 nie potrzebujemy znać jawnej postaci funkcji f. Co więcej, potrafimy wyznaczyć punkty, w których funkcja f może osiągać ekstrema, korzystając ze znanego warunku koniecznego istnienia ekstremum.

Twierdzenie 9.13.[warunek konieczny istnienia ekstremum funkcji uwikłanej]

Jeśli funkcja f uwikłana równaniem F(x,f(x))=0 osiąga ekstremum w pewnym punkcie aX takim, że pochodna cząstkowa Fy(a,f(a))0, to w punkcie (a,f(a)) zerują się pochodne cząstkowe funkcji F po zmiennych x1,x2,,xn, tzn.

Parser nie mógł rozpoznać (nieznana funkcja „\foralli”): {\displaystyle \foralli\in\{1,2,\dots, n\} \ \ \frac{\partial F}{\partial x_i}(a,f(a))=0. }

Dowód

Warunek ten jest konsekwencją wzoru na różniczkę funkcji f, który stanowi tezę twierdzenia o funkcji uwikłanej. Ponieważ zachodzi równość

Parser nie mógł rozpoznać (nieznana funkcja „\circd”): {\displaystyle d_x f=-\left(d_{(x,y)}F_{|Y}\right)^{-1}\circd_{(x,y)}F_{|X}, }

to wobec izomorficzności d(x,y)F|Y która w tym przypadku jest równoważna stwierdzeniu, że Fy(x,y)0) różniczka daf zeruje się wtedy i tylko wtedy, gdy d(a,f(a))F|X=0. Warunek ten jest z kolei równoważny zerowaniu się w punkcie (a,f(a)) pochodnych cząstkowych funkcji F po zmiennych x1,x2,,xn, czyli

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned &\frac{\partial F}{\partial x_1}(a, f(a))=0 \\ &\frac{\partial F}{\partial x_2}(a, f(a))=0\\ &\vdots \\ &\frac{\partial F}{\partial x_n}(a, f(a))=0.\endaligned \right. }

Wyznaczymy również drugą różniczkę funkcji uwikłanej f, aby z jej określoności wywnioskować, czy funkcja f osiąga maksimum, minimum, czy też w ogólne nie osiąga ekstremum w punktach, które spełniają warunek konieczny istnienia ekstremum.

Rozważmy dwa najczęściej spotykane przypadki:

Przypadek I. Niech F:2 będzie funkcją dwukrotnie różniczkowalną. Rozważmy funkcję f uwikłaną równaniem F(x,f(x))=0. Różniczkując tę równość po zmiennej x otrzymamy (na podstawie twierdzenia o różniczkowaniu złożenia) równość

0=Fx+Fyf

Różniczkując względem zmiennej x powtórnie obie strony powyższej nierówności, otrzymamy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned 0=\frac{d}{dx}\bigg(\frac{\partial F}{\partial x}+\frac{\partial F}{\partial y}f'\bigg)&=\frac{d}{dx}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{d}{dx}\bigg(\frac{\partial F}{\partial y}f'\bigg)\\&= \frac{d}{dx}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{d}{dx}\bigg(\frac{\partial F}{\partial y}\bigg)f'+\frac{\partial F}{\partial y}f''\\&=\frac{\partial^2 F}{\partial x^2}+\frac{\partial^2 F}{\partial y\partial x}f'+\bigg(\frac{\partial^2 F}{\partial x\partial y}+\frac{\partial^2 F}{\partial y^2}f'\bigg)f'+\frac{\partial F}{\partial y}f''.\endaligned }

Otrzymane wyrażenie znacznie upraszcza się w punkcie x0, w którym f(x0)=0. Otrzymamy wówczas równość

0=2Fx2(x0,y0)+Fy(x0,y0)f(x0),

z której - wobec założenia, że Fy(x0,y0)0 - otrzymamy

f(x0)=(Fy(x0,y0))12Fx2(x0,y0),

gdzie y0=f(x0).

Przypadek II. Niech f:2 będzie funkcją uwikłaną równaniem F(x,y,f(x,y))=0, gdzie F:3 jest funkcją dwukrotnie różniczkowalną. Wówczas w punktach poziomicy {F=0} otrzymamy równości zawierające pochodne cząstkowe fx oraz fy:

0=Fx+Fzfx
0=Fy+Fzfy.

Policzymy pochodną cząstkową x po zmiennej x obu stron pierwszej z tych równości. Ze wzorów na pochodną złożenia funkcji wyznaczymy wpierw:

x(Fx)=2Fx2+2Fzxfx

oraz

x(Fz)=2Fxz+2Fz2fx.

Wobec tego

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned 0=\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial f}{\partial x} \bigg)&=\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial z}\frac{\partial f}{\partial x}\bigg)\\ &=\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial z}\bigg)\frac{\partial f}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial^2 f}{\partial x^2}\\&=\frac{\partial^2 F}{\partial x^2}+\frac{\partial^2 F}{\partial z\partial x}\frac{\partial f}{\partial x}+\bigg(\frac{\partial^2 F}{\partial x\partial z}+\frac{\partial^2 F}{\partial z^2}\frac{\partial f}{\partial x} \bigg)\frac{\partial f}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial^2 f}{\partial x^2}.\endaligned }

W punkcie (x0,y0), w którym zeruje się różniczka funkcji uwikłanej, mamy fx(x0,y0)=0, fy(x0,y0)=0, a powyższy wzór upraszcza się i przyjmuje postać:

0=2Fx2(x0,y0,z0)+Fz(x0,y0,z0)2fx2(x0,y0),

gdzie z0=f(x0,y0). W podobny sposób dostajemy równości zawierające pozostałe pochodne cząstkowe rzędu drugiego funkcji uwikłanej f, które przy założeniu zerowania się różniczki funkcji uwikłanej w punkcie (x0,y0) przyjmują postać:

0=2Fxy(x0,y0,z0)+Fz(x0,y0,z0)2fxy(x0,y0),
0=2Fyx(x0,y0,z0)+Fz(x0,y0,z0)2fyx(x0,y0),
0=2Fy2(x0,y0,z0)+Fz(x0,y0,z0)2fy2(x0,y0).

Stąd - wobec założenia, że Fz(x0,y0,z0)0 - otrzymujemy:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left[\aligned &\frac{\partial^2 f}{\partial x^2}(x_0, y_0) & \ &\frac{\partial^2 f}{\partial x\partial y}(x_0, y_0)\\ &\frac{\partial^2 f}{\partial y\partial x}(x_0, y_0) \ & \ &\frac{\partial^2 f}{\partial y^2}(x_0, y_0)\endaligned\right]=-\bigg(\frac{\partial F}{\partial z}(x_0, y_0, z_0)\bigg)^{-1} \left[\aligned &\frac{\partial^2 F}{\partial x^2}(x_0, y_0, z_0) & \ &\frac{\partial^2 F}{\partial x\partial y}(x_0, y_0, z_0)\\ &\frac{\partial^2 F}{\partial y\partial x}(x_0, y_0, z_0) \ & \ &\frac{\partial^2 F}{\partial y^2}(x_0, y_0, z_0)\endaligned\right] }

W podobny sposób (szczegółowe rachunki pomijamy) można wykazać ogólny wzór wyrażający drugą różniczkę funkcji uwikłanej.

Wniosek 9.14.

Niech f:xf(x), x=(x1,x2,,xn) będzie funkcją uwikłaną równaniem F(x,f(x))=0, gdzie F:n×(x,y)F(x,y) jest funkcją dwukrotnie różniczkowalną w pewnym otoczeniu punktu (a,b), gdzie b=f(a). Niech Fy(a,b)0 i niech różniczka daf=0. Wówczas druga

różniczka funkcji uwikłanej f w punkcie a wynosi
da2f=(Fy(a,b))1d(a,b)F|X,
czyli
2fxixj(a)=(Fy(a,b))12Fxixj(a,b),
dla dowolnych i,j{1,2,,n}.

Przykład 9.15.

Wyznaczmy ekstrema funkcji f danej w postaci uwikłanej F(x,y,f(x,y))=0, gdzie

F(x,y,z)=(x2+y2+z2)23xyz.

Obserwacja poziomicy zerowej {F=0} każe przypuszczać, że w otoczeniu czterech punktów tej poziomicy da się wskazać otoczenia ich rzutów na płaszczyznę zmiennych (x,y) oraz jednoznacznie określone funkcje w tych otoczeniach takie, że dwie z nich będą osiągać maksima a pozostałe dwie - minima.

Zgodnie z wykazanymi uwagami, aby wyznaczyć punkty ekstremalne funkcji uwikłanej f szukamy punktów (x,y), których współrzędne spełniają układ równań:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned \frac{\partial F}{\partial x}(x,y,z)=0 \\ \frac{\partial F}{\partial y}(x,y,z)=0\\(x,y,z)\in\{F=0\} \endaligned \right. \text{ czyli } \left\{\aligned 4x(x^2+y^2+z^2)-3yz=0 \\ 4y(x^2+y^2+z^2)-3xz=0\\ (x^2+y^2+z^2)^2 -3 xyz=0. \endaligned \right. }

Możliwość skorzystania z twierdzenia o funkcji uwikłanej (aby mieć gwarancję istnienia funkcji uwikłanej f) wymaga sprawdzenia założenia:

Fz(x,y,z)=4z(x2+y2+z2)3xy0.

Nietrudno zauważyć, że początek układu współrzędnych (0,0,0) spełnia układ równań, ale nie spełnia założenia twierdzenia o funkcji uwikłanej, gdyż Fz(0,0,0)=0. Obserwacja poziomicy {F=0} wyraźnie pokazuje, że nie ma możliwości jednoznacznego odwikłania funkcji (x,y)f(x,y) z równania F(x,y,f(x,y))=0 w żadnym otoczeniu punktu (0,0,0). Ponadto układ spełniają cztery punkty o współrzędnych

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned &x=y=\frac{3\sqrt{2}}{16}, \ &&z=\frac{3}{8},\\ &x=y=-\frac{3\sqrt{2}}{16}, \ &&z=\frac{3}{8},\\ &x=-y=\frac{3\sqrt{2}}{16}, \ &&z=-\frac{3}{8},\\ &x=-y=-\frac{3\sqrt{2}}{16}, \ &&z=-\frac{3}{8},\endaligned }

w których spełniony jest warunek Fz(x,y,z)0. Na mocy twierdzenia o funkcji uwikłanej w pewnych otoczeniach U1,U2,U3,U42 odpowiednio punktów

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned &A_1=\big(\frac{3\sqrt{2}}{16}, \frac{3\sqrt{2}}{16}\big), \\ &A_2=\big(-\frac{3\sqrt{2}}{16}, -\frac{3\sqrt{2}}{16}\big), \\ &A_3=\big(-\frac{3\sqrt{2}}{16}, \frac{3\sqrt{2}}{16}\big), \\ &A_4=\big(\frac{3\sqrt{2}}{16}, -\frac{3\sqrt{2}}{16}\big), \endaligned }

istnieją jedyne funkcje f1:U1, f2:U2, f3:U3, f4:U4, które spełniają warunek

F(x,y,fi(x,y))=0, gdy (x,y)Ui, i{1,2,3,4}

oraz odpowiednio f1(A1)=f2(A2)=38, f3(A3)=f4(A4)=38. Analiza poziomicy {F=0} (lub określoności drugiej różniczki dAi2f, i{1,2,3,4}) pozwala stwierdzić, że funkcje f1 i f2 osiągają w punktach A1, A2 maksimum, zaś f3 i f4 osiągają w punktach A3, A4 minimum.

Dalsze przykłady wyznaczania ekstremów funkcji uwikłanej analizujemy w ramach ćwiczeń.

9.4 Ekstrema warunkowe. Metoda mnożników Lagrange'a

Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym otwartym podzbiorze U przestrzeni unormowanej X (przy czym w praktycznych przykładach zajmowaliśmy się przykładami, gdy X=n, n=1,2,3,). Równie ważne z praktycznego punktu widzenia są także rozważania polegające na wyznaczaniu ekstremów funkcji F:X zacieśnionej do zbioru, który nie jest otwarty w X.

Przykład 9.16.

Wyznaczmy najmniejszą i największą wartość funkcji

F(x,y,z)=x2y+2z

na sferze

x2+y2+z2=1.

Sfera ta jest zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję ciągłą wnioskujemy, że wielomian F(x,y,z)=x2y+2z osiąga na tej sferze zarówno wartość najmniejszą jak i największą. Nasze dotychczasowe doświadczenie podpowiada nam, że zadanie można by sprowadzić do badania funkcji dwóch zmiennych np. poprzez odwikłanie zmiennej

z(x,y)=1x2y2 lub z(x,y)=1x2y2

z równania sfery i zbadania funkcji dwóch zmiennych (x,y) danych w kole x2+y2<1 wzorami:

f1:(x,y)F(x,y,1x2y2)=x2y+21x2y2,
f2:(x,y)F(x,y,1x2y2)=x2y21x2y2.

Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości ekstremalnych funkcji F na danej sferze.

Podamy jednak pewną metodę, która pozwala wyznaczać ekstremum funkcji F:X zacieśnionej do poziomicy zerowej {G=0} pewnej funkcji G:XY również w przypadku, gdy odwikłanie zmiennej z równania G=0 nie jest tak proste jak w podanym przykładzie.

Sprecyzujmy jednak wpierw problem.

Niech X,Y będą przestrzeniami Banacha i niech G:XY, F:X będą funkcjami.

Definicja 9.17.

Mówimy, że funkcja F osiąga ekstremum warunkowe w punkcie a przy warunku a{G=0}, jeśli zacieśnienie funkcji F do poziomicy {G=0} osiąga ekstremum w tym punkcie.

Prawdziwe jest następujące twierdzenie, które stanowi podstawę metody mnożników Lagrange'a.

Niech X,Y będą przestrzeniami Banacha.

Twierdzenie 9.18.

Niech F:X, G:XY będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego a poziomicy {G=0} (co - przypomnijmy - oznacza, że różniczka daG jest suriekcją przestrzeni X na Y). Jeśli funkcja F osiąga ekstremum warunkowe w punkcie regularnym a poziomicy zerowej funkcji G, to istnieje funkcjonał liniowy i ciągły Λ:Y taki, że zachodzi równość daF=ΛdaG.

Prawdziwe jest również twierdzenie, które na podstawie określoności drugiej różniczki pozwala stwierdzić czy funkcja F osiąga minimum, czy maksimum warunkowe w punkcie a{G=0}.

Twierdzenie 9.19.

Niech F:X, G:XY będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu regularnego a poziomicy {G=0}. Jeśli istnieje funkcjonał liniowy i ciągły Λ:Y taki, że zachodzi równość daF=ΛdaG oraz forma kwadratowa

Xh(da2FΛda2G)(h,h)

jest dodatnio określona (odpowiednio: ujemnie określona) na podprzestrzeni X1:={hX,daG(h)=0} przestrzeni X, to funkcja F osiąga w punkcie a minimum (odpowiednio: maksimum) warunkowe.

Definicja 9.20.

Funkcjonał Λ, który występuje w wypowiedzi obu powyższych twierdzeń, nazywamy funkcjonałem Lagrange'a.

Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku Krzysztofa Maurina, Analiza. Część I. Elementy, Państwowe Wydawnictwo Naukowe, Warszawa 1977). Podamy jednak interpretację tego twierdzenia w kilku najczęściej spotykanych sytuacjach.

Uwaga 9.21.

Jeśli f,g:2 są funkcjami różniczkowalymi, problem znalezienia ekstremum warunkowego funkcji f przy warunku {g=0} sprowadza się do znalezienia punktu a na poziomicy {g=0} oraz stałej λ, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy Λ: dany wzorem Λ(x)=λx taki, że różniczka daf=λdag, o ile punkt a jest punktem regularnym poziomicy {g=0}. Przypomnijmy, że w przypadku, gdy g:2, punkt a jest regularny, jeśli rząd różniczki

dag=g(a)xdx+g(a)ydy

wynosi 1. Wystarczy więc sprawdzić, czy w punkcie a różniczka dag0, czyli czy którakolwiek pochodna cząstkowa g(a)x lub g(a)y jest różna od zera. Zagadnienie sprowadza się do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej

Φ(x,y):=f(x,y)λg(x,y),

gdzie stałą λ (nazywaną tradycyjnie mnożnikiem Lagrange'a) wyznaczamy z układu równań

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned d_{(x,y)}\Phi=0\\g(x,y)=0\endaligned \right. \text{ czyli } \left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\g(x,y)=0.\endaligned \right. }
Uwaga 9.22.

Jeśli f,g:3 są funkcjami różniczkowalnymi, problem znalezienia ekstremum warunkowego funkcji f przy warunku {g=0} sprowadza się do znalezienia - podobnie jak w poprzednim przypadku - punktu a na poziomicy {g=0} oraz stałej λ, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy Λ: dany wzorem Λ(x)=λx, taki, że różniczka daf=λdag, o ile punkt a jest punktem regularnym poziomicy {g=0}. Przypomnijmy, że w przypadku, gdy g:3 punkt a jest regularny, jeśli rząd dag (odwzorowania liniowego z 3 do ) jest maksymalny, czyli wynosi 1. Wystarczy więc sprawdzić, czy w punkcie a różniczka

dag=g(a)xdx+g(a)ydy+g(a)zdz

nie zeruje się, czyli czy któraś z pochodnych cząstkowych g(a)x, g(a)y, g(a)z jest różna od zera. Zagadnienie można sprowadzić do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej

Φ(x,y,z):=f(x,y,z)λg(x,y,z),

gdzie stałą λ wyznaczamy z układu równań

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned d_{(x,y,z)}\Phi=0\\g(x,y,z)=0\endaligned \right. \text{ czyli } \left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} \\g(x,y,z)=0.\endaligned \right. }

Przykład 9.23.

Powróćmy do zadania polegającego na wyznaczeniu najmniejszej i największej wartości funkcji f(x,y,z)=x2y+2z na sferze x2+y2+z2=1. Rozwiążemy je metodą mnożników Lagrange'a opisaną w poprzednich uwagach. Dana sfera jest poziomicą zerową funkcji g(x,y,z)=x2+y2+z21. Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech Φ(x,y,z)=f(x,y,z)λg(x,y,z). Rozwiązujemy układ równań

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x}\\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y}\\ \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} \\g(x,y,z)=0\endaligned \right. \text{ czyli } \left\{\aligned 1=2\lambda x \\-2=2\lambda y\\2=2\lambda z\\x^2+y^2+z^2=1. \endaligned \right. }

Układ ten spełniają liczby

x=13,y=23,z=23,λ=32

oraz

x=13,y=23,z=23,λ=32.

Ponieważ sfera jest zbiorem zwartym, wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je, gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, w jednym z tych dwóch punktów funkcja f musi osiągać kres dolny, a w drugim kres górny wartości na sferze {g=0}. Mamy

f(13,23,23)=3,  f(13,23,23)=3,

czyli f osiąga w pierwszym z tych punktów wartość najmniejszą równą 3, a w drugim punkcie - wartość największą na sferze równą 3.

Uwaga 9.24.

Jeśli funkcja F:3, zaś G:32, zagadnienie znalezienia ekstremów warunkowych funkcji F przy warunku {G=0} sprowadza się do znalezienia punktów zbioru {G=0}, w których zeruje się różniczka funkcji Φ(x,y,z):=F(x,y,z)ΛG(x,y,z). Funkcjonał Lagrange'a Λ w tym przypadku jest odwzorowaniem liniowym z 2, jest więc reprezentowany przez macierz złożoną z dwóch liczb: λ1, λ2. Funkcja G=(g1,g2) jest zestawieniem dwóch funkcji g1,g2 o wartościach rzeczywistych, stąd

Φ(x,y,z)=F(x,y,z)ΛG(x,y,z)=F(x,y,z)λ1g1(x,y,z)λ2g2(x,y,z).

Metoda mnożników Lagrange'a sprowadza się więc do znalezienia rozwiązań układu równań

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned d_{(x,y,z)}\Phi=0\\G(x,y,z)=0\endaligned \right. \text{ czyli } \left\{\aligned \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} \\ \frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y} \\ \frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} \\ g_1(x,y,z)=0 \\ g_2(x,y,z)=0\endaligned \right. }

w punktach regularnych poziomicy {G=0}, czyli tych, w których rząd różniczki d(x,y,z)G jest maksymalny (tj. równy 2, gdyż różniczka d(x,y,z)G jest odwzorowaniem liniowym z 3 do 2). Zwróćmy uwagę, że funkcja F może osiągać ekstremum w punktach, które należą do poziomicy {G=0} a nie są regularne. Metoda mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu ekstremum.

Przykład 9.25.

Wyznaczmy najmniejszą i największą wartość funkcji

F(x,y,z)=xy2z

na przecięciu się dwóch walców

x2+z2=1,  y2+z2=1.

Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym, gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem zwartym (gdyż jest zbiorem domkniętym i ograniczonym, zawartym między innymi w sześcianie [1,1]×[1,1]×[1,1]). Podany warunek można opisać za pomocą poziomicy zerowej funkcji G(x,y,z)=(x2+z21,y2+z21). Zbadaliśmy już, że spośród punktów poziomicy {G=0} tylko dwa nie są regularne: (0,0,1) oraz (0,0,1). Poza tymi dwoma punktami możemy zastosować metodę mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań układu równań:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} \\ \frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y} \\ \frac{\partial f}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} \\ g_1(x,y,z)=0 \\ g_2(x,y,z)=0\endaligned \right. \text{ czyli } \left\{\aligned 1=2\lambda_1 x\\-1=2\lambda_2 y\\ -2 =2(\lambda_1+\lambda_2)z\\ x^2+z^2-1=0\\y^2+z^2-1=0. \endaligned\right. }

Układ ten ma dwa rozwiązania

x=y=z=22, przy czym λ1=λ2=22

oraz

x=y=z=22, przy czym λ1=λ2=22.

Wartość funkcji F w tych punktach wynosi

Parser nie mógł rozpoznać (błąd składni): {\displaystyle F\big(-\frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}\big)=-2\sqrt{2} \text{ oraz } F\big(\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}\big)=2\sqrt{2}. }

W obu punktach nieregularnych poziomicy {G=0} mamy

F(0,0,1)=2 oraz F(0,0,1)=2.

Po porównaniu tych wartości: 22<2<2<22 stwierdzamy, że największą wartość na na poziomicy {G=0} równą 22 funkcja F osiąga w punkcie (22,22,22), a najmniejszą, równą 22, w punkcie (22,22,22).