Test HB3: Różnice pomiędzy wersjami
Linia 868: | Linia 868: | ||
analizujemy w ramach ćwiczeń. | analizujemy w ramach ćwiczeń. | ||
===Ekstrema warunkowe. Metoda mnożników Lagrange'a=== | ===9.4 Ekstrema warunkowe. Metoda mnożników Lagrange'a=== | ||
Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym | Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym | ||
Linia 878: | Linia 878: | ||
otwarty w <math>X</math>. | otwarty w <math>X</math>. | ||
{{przyklad| | {{przyklad|9.16.|| | ||
Wyznaczmy najmniejszą i największą | Wyznaczmy najmniejszą i największą wartość funkcji | ||
wartość funkcji | |||
<center><math>F(x,y,z)=x -2y +2z </math></center> na sferze <center><math>x^2+y^2+z^2=1.</math></center> Sfera ta jest | <center><math> | ||
zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na | F(x,y,z)=x -2y +2z | ||
</math></center> | |||
na sferze | |||
<center><math> | |||
x^2+y^2+z^2=1. | |||
</math></center> | |||
Sfera ta jest zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na | |||
na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję | na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję | ||
ciągłą wnioskujemy, że wielomian <math>F(x,y,z)=x -2y +2z </math> osiąga na | ciągłą wnioskujemy, że wielomian <math>F(x,y,z)=x -2y +2z </math> osiąga na | ||
tej sferze zarówno wartość najmniejszą jak i największą. Nasze | tej sferze zarówno wartość najmniejszą jak i największą. Nasze | ||
dotychczasowe doświadczenie podpowiada nam, że zadanie można by | dotychczasowe doświadczenie podpowiada nam, że zadanie można by | ||
sprowadzić do badania funkcji dwóch zmiennych np. poprzez | sprowadzić do badania funkcji dwóch zmiennych np. poprzez odwikłanie zmiennej | ||
odwikłanie zmiennej | |||
<center><math>z(x,y)=\sqrt{1-x^2-y^2} | <center><math> | ||
\text{ lub } z(x,y)=-\sqrt{1-x^2-y^2}</math></center> | z(x,y)=\sqrt{1-x^2-y^2} | ||
\text{ lub } z(x,y)=-\sqrt{1-x^2-y^2} | |||
</math></center> | |||
z równania sfery i zbadania funkcji | z równania sfery i zbadania funkcji | ||
dwóch zmiennych <math>(x,y)</math> danych w kole <math>x^2+y^2<1</math> wzorami: | dwóch zmiennych <math>(x,y)</math> danych w kole <math>x^2+y^2<1</math> wzorami: | ||
<center><math>f_1: (x,y)\mapsto F\big(x,y,\sqrt{1-x^2-y^2}\big)=x-2y+2\sqrt{1-x^2-y^2},</math></center> | |||
<center><math>f_2: (x,y)\mapsto F\big(x,y,-\sqrt{1-x^2-y^2}\big)=x-2y-2\sqrt{1-x^2-y^2}.</math></center> | <center><math> | ||
f_1: (x,y)\mapsto F\big(x,y,\sqrt{1-x^2-y^2}\big)=x-2y+2\sqrt{1-x^2-y^2}, | |||
</math></center> | |||
<center><math> | |||
f_2: (x,y)\mapsto F\big(x,y,-\sqrt{1-x^2-y^2}\big)=x-2y-2\sqrt{1-x^2-y^2}. | |||
</math></center> | |||
Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do | Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do | ||
wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości | wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości | ||
Linia 911: | Linia 929: | ||
<math>F:X\mapsto \mathbb{R}</math> będą funkcjami. | <math>F:X\mapsto \mathbb{R}</math> będą funkcjami. | ||
{{definicja| | {{definicja|9.17.|| | ||
Mówimy, że funkcja <math>F</math> osiąga '''''ekstremum warunkowe''''' w punkcie | Mówimy, że funkcja <math>F</math> osiąga '''''ekstremum warunkowe''''' w punkcie | ||
<math>a</math> przy warunku <math>a\in \{G=0\}</math>, jeśli zacieśnienie funkcji <math>F</math> do | <math>a</math> przy warunku <math>a\in \{G=0\}</math>, jeśli zacieśnienie funkcji <math>F</math> do | ||
Linia 918: | Linia 935: | ||
}} | }} | ||
Prawdziwe jest następujące twierdzenie, które stanowi podstawę | Prawdziwe jest następujące twierdzenie, które stanowi podstawę '''''metody mnożników Lagrange'a'''''. | ||
'''''metody mnożników Lagrange'a'''''. | |||
Niech <math>X, Y</math> będą przestrzeniami Banacha. | Niech <math>X, Y</math> będą przestrzeniami Banacha. | ||
{{twierdzenie| | {{twierdzenie|9.18.|| | ||
Niech <math>F: X\mapsto \mathbb{R}</math>, <math>G: X\mapsto | Niech <math>F: X\mapsto \mathbb{R}</math>, <math>G: X\mapsto | ||
Y </math> będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego | Y </math> będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego | ||
<math>a</math> poziomicy <math>\{G=0\}</math> (co | <math>a</math> poziomicy <math>\{G=0\}</math> (co - przypomnijmy - oznacza, że | ||
różniczka <math>d_a G </math> jest suriekcją przestrzeni <math>X</math> na <math>Y</math>). Jeśli | różniczka <math>d_a G </math> jest suriekcją przestrzeni <math>X</math> na <math>Y</math>). Jeśli | ||
funkcja <math>F</math> osiąga ekstremum warunkowe w punkcie regularnym <math>a</math> | funkcja <math>F</math> osiąga ekstremum warunkowe w punkcie regularnym <math>a</math> | ||
Linia 932: | Linia 948: | ||
ciągły <math>\Lambda: Y\mapsto\mathbb{R}</math> taki, że zachodzi równość <math>d_a | ciągły <math>\Lambda: Y\mapsto\mathbb{R}</math> taki, że zachodzi równość <math>d_a | ||
F=\Lambda \circ d_a G</math>. | F=\Lambda \circ d_a G</math>. | ||
}} | }} | ||
Linia 939: | Linia 954: | ||
osiąga minimum, czy maksimum warunkowe w punkcie <math>a\in\{G=0\}</math>. | osiąga minimum, czy maksimum warunkowe w punkcie <math>a\in\{G=0\}</math>. | ||
{{twierdzenie| | {{twierdzenie|9.19.|| | ||
Niech <math>F: X\mapsto \mathbb{R}</math>, <math>G: X\mapsto | Niech <math>F: X\mapsto \mathbb{R}</math>, <math>G: X\mapsto | ||
Y</math> będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu | Y</math> będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu | ||
regularnego <math>a</math> poziomicy <math>\{G=0\}</math>. Jeśli istnieje funkcjonał | regularnego <math>a</math> poziomicy <math>\{G=0\}</math>. Jeśli istnieje funkcjonał | ||
liniowy i ciągły <math>\Lambda: Y\mapsto\mathbb{R}</math> taki, że zachodzi równość | liniowy i ciągły <math>\Lambda: Y\mapsto\mathbb{R}</math> taki, że zachodzi równość | ||
<math>d_a F=\Lambda \circ d_a G</math> oraz forma kwadratowa <center><math>X\ni h\mapsto | <math>d_a F=\Lambda \circ d_a G</math> oraz forma kwadratowa | ||
\big(d^2_a F-\Lambda \circ d_a^2 G \big)(h,h)\in\mathbb{R}</math></center> jest | |||
dodatnio określona (odpowiednio: ujemnie określona) na | <center><math> | ||
X\ni h\mapsto\big(d^2_a F-\Lambda \circ d_a^2 G \big)(h,h)\in\mathbb{R} | |||
</math></center> | |||
jest dodatnio określona (odpowiednio: ujemnie określona) na | |||
podprzestrzeni <math>X_1:=\{h\in X, d_aG(h)=0\}</math> przestrzeni <math>X</math>, to | podprzestrzeni <math>X_1:=\{h\in X, d_aG(h)=0\}</math> przestrzeni <math>X</math>, to | ||
funkcja <math>F</math> osiąga w punkcie <math>a</math> minimum (odpowiednio: maksimum) | funkcja <math>F</math> osiąga w punkcie <math>a</math> minimum (odpowiednio: maksimum) | ||
warunkowe. }} | warunkowe. | ||
}} | |||
{{definicja| | {{definicja|9.20.|| | ||
Funkcjonał <math>\Lambda</math>, który występuje w | Funkcjonał <math>\Lambda</math>, który występuje w wypowiedzi obu powyższych twierdzeń, nazywamy '''''funkcjonałem Lagrange'a'''''. }} | ||
wypowiedzi obu powyższych twierdzeń, nazywamy '''''funkcjonałem | |||
Lagrange'a'''''. }} | |||
Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku | Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku | ||
Linia 961: | Linia 979: | ||
tego twierdzenia w kilku najczęściej spotykanych sytuacjach. | tego twierdzenia w kilku najczęściej spotykanych sytuacjach. | ||
{{uwaga| | {{uwaga|9.21.|| | ||
Jeśli <math>f, g : \mathbb{R}^2\mapsto \mathbb{R}</math> są | Jeśli <math>f, g : \mathbb{R}^2\mapsto \mathbb{R}</math> są | ||
funkcjami różniczkowalymi, problem znalezienia ekstremum | funkcjami różniczkowalymi, problem znalezienia ekstremum | ||
Linia 967: | Linia 985: | ||
znalezienia punktu <math>a</math> na poziomicy <math>\{g=0\}</math> oraz stałej | znalezienia punktu <math>a</math> na poziomicy <math>\{g=0\}</math> oraz stałej | ||
<math>\lambda</math>, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem | <math>\lambda</math>, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem | ||
ekstremum to jest realizowane to | ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem | ||
- istnieje funkcjonał liniowy <math>\Lambda : \mathbb{R}\mapsto \mathbb{R}</math> dany | |||
wzorem <math>\Lambda (x)=\lambda x</math> | wzorem <math>\Lambda (x)=\lambda x</math> | ||
taki, że różniczka | taki, że różniczka | ||
Linia 974: | Linia 992: | ||
poziomicy <math>\{g=0\}</math>. Przypomnijmy, że w przypadku, gdy <math>g: | poziomicy <math>\{g=0\}</math>. Przypomnijmy, że w przypadku, gdy <math>g: | ||
\mathbb{R}^2\mapsto \mathbb{R}</math>, punkt <math>a</math> jest regularny, jeśli rząd różniczki | \mathbb{R}^2\mapsto \mathbb{R}</math>, punkt <math>a</math> jest regularny, jeśli rząd różniczki | ||
<center><math>d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial | |||
g(a)}{\partial y}dy</math></center> wynosi 1. Wystarczy więc sprawdzić, czy w | <center><math> | ||
d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial | |||
g(a)}{\partial y}dy | |||
</math></center> | |||
wynosi 1. Wystarczy więc sprawdzić, czy w | |||
punkcie <math>a</math> różniczka <math>d_a g\neq 0</math>, czyli czy którakolwiek | punkcie <math>a</math> różniczka <math>d_a g\neq 0</math>, czyli czy którakolwiek | ||
pochodna cząstkowa <math>\frac{\partial g(a)}{\partial x}</math> lub | pochodna cząstkowa <math>\frac{\partial g(a)}{\partial x}</math> lub | ||
Linia 981: | Linia 1004: | ||
sprowadza się do znalezienia punktów, w których zeruje się | sprowadza się do znalezienia punktów, w których zeruje się | ||
różniczka funkcji pomocniczej | różniczka funkcji pomocniczej | ||
<center><math>\Phi(x,y): =f(x,y)-\lambda g(x,y), </math></center> | |||
<center><math> | |||
\Phi(x,y): =f(x,y)-\lambda g(x,y), | |||
</math></center> | |||
gdzie stałą <math>\lambda</math> (nazywaną tradycyjnie '''''mnożnikiem | gdzie stałą <math>\lambda</math> (nazywaną tradycyjnie '''''mnożnikiem | ||
Lagrange'a''''') wyznaczamy z układu równań | Lagrange'a''''') wyznaczamy z układu równań | ||
<center><math>\left\{\aligned d_{(x,y)}\Phi=0\\g(x,y)=0\endaligned \right. | |||
<center><math> | |||
\left\{\aligned d_{(x,y)}\Phi=0\\g(x,y)=0\endaligned \right. | |||
\text{ czyli } | \text{ czyli } | ||
\left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} | \left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} | ||
\\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} | \\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} | ||
\\g(x,y)=0.\endaligned \right.</math></center> | \\g(x,y)=0.\endaligned \right. | ||
</math></center> | |||
}} | }} | ||
{{uwaga| | {{uwaga|9.22.|| | ||
Jeśli <math>f, g : \mathbb{R}^3\mapsto \mathbb{R}</math> są | Jeśli <math>f, g : \mathbb{R}^3\mapsto \mathbb{R}</math> są | ||
funkcjami różniczkowalnymi, problem znalezienia ekstremum | funkcjami różniczkowalnymi, problem znalezienia ekstremum | ||
warunkowego funkcji <math>f</math> przy warunku <math>\{g=0\}</math> sprowadza się do | warunkowego funkcji <math>f</math> przy warunku <math>\{g=0\}</math> sprowadza się do | ||
znalezienia | znalezienia - podobnie jak w poprzednim przypadku - punktu <math>a</math> | ||
na poziomicy <math>\{g=0\}</math> oraz stałej <math>\lambda</math>, która reprezentuje | na poziomicy <math>\{g=0\}</math> oraz stałej <math>\lambda</math>, która reprezentuje | ||
funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane | funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane | ||
to | to - zgodnie z podanym twierdzeniem - istnieje funkcjonał | ||
liniowy <math>\Lambda : \mathbb{R}\mapsto \mathbb{R}</math> dany wzorem <math>\Lambda | liniowy <math>\Lambda : \mathbb{R}\mapsto \mathbb{R}</math> dany wzorem <math>\Lambda | ||
(x)=\lambda x</math>, | (x)=\lambda x</math>, taki, że różniczka | ||
taki, że różniczka | |||
<math>d_a f=\lambda d_a g</math>, o ile punkt <math>a</math> jest punktem regularnym | <math>d_a f=\lambda d_a g</math>, o ile punkt <math>a</math> jest punktem regularnym | ||
poziomicy <math>\{g=0\}</math>. Przypomnijmy, że w przypadku, gdy <math>g: | poziomicy <math>\{g=0\}</math>. Przypomnijmy, że w przypadku, gdy <math>g: | ||
Linia 1007: | Linia 1036: | ||
(odwzorowania liniowego z <math>\mathbb{R}^3</math> do <math>\mathbb{R}</math>) jest maksymalny, czyli | (odwzorowania liniowego z <math>\mathbb{R}^3</math> do <math>\mathbb{R}</math>) jest maksymalny, czyli | ||
wynosi <math>1</math>. Wystarczy więc sprawdzić, czy w punkcie <math>a</math> różniczka | wynosi <math>1</math>. Wystarczy więc sprawdzić, czy w punkcie <math>a</math> różniczka | ||
<center><math>d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial g(a)}{\partial | |||
y}dy+\frac{\partial g(a)}{\partial z}dz</math></center> nie zeruje się, czyli | <center><math> | ||
czy któraś z pochodnych cząstkowych <math>\frac{\partial g(a)}{\partial | d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial g(a)}{\partial | ||
y}dy+\frac{\partial g(a)}{\partial z}dz | |||
</math></center> | |||
nie zeruje się, czyli czy któraś z pochodnych cząstkowych <math>\frac{\partial g(a)}{\partial | |||
x}</math>, <math>\frac{\partial g(a)}{\partial y}</math>, <math>\frac{\partial | x}</math>, <math>\frac{\partial g(a)}{\partial y}</math>, <math>\frac{\partial | ||
g(a)}{\partial z}</math> jest różna od zera. Zagadnienie można | g(a)}{\partial z}</math> jest różna od zera. Zagadnienie można | ||
sprowadzić do znalezienia punktów, w których zeruje się różniczka | sprowadzić do znalezienia punktów, w których zeruje się różniczka | ||
funkcji pomocniczej | funkcji pomocniczej | ||
<center><math>\Phi(x,y,z): =f(x,y,z)-\lambda g(x,y,z), </math></center> | |||
<center><math> | |||
\Phi(x,y,z): =f(x,y,z)-\lambda g(x,y,z), | |||
</math></center> | |||
gdzie stałą <math>\lambda</math> wyznaczamy z układu równań | gdzie stałą <math>\lambda</math> wyznaczamy z układu równań | ||
<center><math>\left\{\aligned d_{(x,y,z)}\Phi=0\\g(x,y,z)=0\endaligned \right. | |||
<center><math> | |||
\left\{\aligned d_{(x,y,z)}\Phi=0\\g(x,y,z)=0\endaligned \right. | |||
\text{ czyli } | \text{ czyli } | ||
\left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} | \left\{\aligned \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} | ||
\\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} | \\ \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} | ||
\\ \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} | \\ \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} | ||
\\g(x,y,z)=0.\endaligned \right.</math></center> | \\g(x,y,z)=0.\endaligned \right. | ||
</math></center> | |||
}} | }} | ||
{{przyklad| | {{przyklad|9.23.|| | ||
Powróćmy do zadania polegającego na | Powróćmy do zadania polegającego na wyznaczeniu najmniejszej i największej wartości funkcji | ||
wyznaczeniu najmniejszej i największej wartości funkcji | |||
<math>f(x,y,z)=x -2y +2z </math> na sferze <math>x^2+y^2+z^2=1</math>. Rozwiążemy je | <math>f(x,y,z)=x -2y +2z </math> na sferze <math>x^2+y^2+z^2=1</math>. Rozwiążemy je | ||
'''''metodą mnożników Lagrange'a''''' opisaną w poprzednich uwagach. | '''''metodą mnożników Lagrange'a''''' opisaną w poprzednich uwagach. | ||
Linia 1032: | Linia 1071: | ||
Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech | Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech | ||
<math>\Phi(x,y,z)=f(x,y,z)-\lambda g(x,y,z)</math>. Rozwiązujemy układ równań | <math>\Phi(x,y,z)=f(x,y,z)-\lambda g(x,y,z)</math>. Rozwiązujemy układ równań | ||
<center><math>\left\{\aligned \frac{\partial f}{\partial x}=\lambda | |||
<center><math> | |||
\left\{\aligned \frac{\partial f}{\partial x}=\lambda | |||
\frac{\partial g}{\partial x}\\ \frac{\partial f}{\partial | \frac{\partial g}{\partial x}\\ \frac{\partial f}{\partial | ||
y}=\lambda \frac{\partial g}{\partial y}\\ \frac{\partial | y}=\lambda \frac{\partial g}{\partial y}\\ \frac{\partial | ||
Linia 1038: | Linia 1079: | ||
\\g(x,y,z)=0\endaligned \right. \text{ czyli } \left\{\aligned | \\g(x,y,z)=0\endaligned \right. \text{ czyli } \left\{\aligned | ||
1=2\lambda x \\-2=2\lambda y\\2=2\lambda z\\x^2+y^2+z^2=1. | 1=2\lambda x \\-2=2\lambda y\\2=2\lambda z\\x^2+y^2+z^2=1. | ||
\endaligned \right.</math></center> Układ ten spełniają liczby <center><math>x=-\frac{1}{3}, | \endaligned \right. | ||
y=\frac{2}{3}, z=-\frac{2}{3}, \lambda=-\frac{3}{2}</math></center> oraz | </math></center> | ||
<center><math>x=\frac{1}{3}, y=-\frac{2}{3}, z=\frac{2}{3}, | |||
\lambda=\frac{3}{2}.</math></center> Ponieważ sfera jest zbiorem zwartym, | Układ ten spełniają liczby | ||
<center><math> | |||
x=-\frac{1}{3},y=\frac{2}{3}, z=-\frac{2}{3}, \lambda=-\frac{3}{2} | |||
</math></center> | |||
oraz | |||
<center><math> | |||
x=\frac{1}{3}, y=-\frac{2}{3}, z=\frac{2}{3}, | |||
\lambda=\frac{3}{2}. | |||
</math></center> | |||
Ponieważ sfera jest zbiorem zwartym, | |||
wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je, | wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je, | ||
gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez | gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez | ||
Linia 1047: | Linia 1101: | ||
funkcja <math>f</math> musi osiągać kres dolny, a w drugim kres górny | funkcja <math>f</math> musi osiągać kres dolny, a w drugim kres górny | ||
wartości na sferze <math>\{g=0\}</math>. Mamy | wartości na sferze <math>\{g=0\}</math>. Mamy | ||
<center><math>f\big(-\frac{1}{3}, \frac{2}{3}, -\frac{2}{3} \big)=-3, \ \ f\big(\frac{1}{3}, -\frac{2}{3}, \frac{2}{3} | |||
\big)=3,</math></center> czyli <math>f</math> osiąga w pierwszym z tych punktów wartość | <center><math> | ||
najmniejszą równą <math>-3</math>, a w drugim punkcie | f\big(-\frac{1}{3}, \frac{2}{3}, -\frac{2}{3} \big)=-3, \ \ f\big(\frac{1}{3}, -\frac{2}{3}, \frac{2}{3} | ||
\big)=3, | |||
</math></center> | |||
czyli <math>f</math> osiąga w pierwszym z tych punktów wartość | |||
najmniejszą równą <math>-3</math>, a w drugim punkcie - wartość największą | |||
na sferze równą <math>3</math>. | na sferze równą <math>3</math>. | ||
}} | }} | ||
{{uwaga| | {{uwaga|9.24.|| | ||
Jeśli funkcja <math>F: \mathbb{R}^3\mapsto \mathbb{R}</math>, | Jeśli funkcja <math>F: \mathbb{R}^3\mapsto \mathbb{R}</math>, | ||
zaś <math>G:\mathbb{R}^3\mapsto \mathbb{R}^2</math>, zagadnienie znalezienia ekstremów | zaś <math>G:\mathbb{R}^3\mapsto \mathbb{R}^2</math>, zagadnienie znalezienia ekstremów | ||
Linia 1064: | Linia 1123: | ||
<math>\lambda_2</math>. Funkcja <math>G=(g_1, g_2)</math> jest zestawieniem dwóch | <math>\lambda_2</math>. Funkcja <math>G=(g_1, g_2)</math> jest zestawieniem dwóch | ||
funkcji <math>g_1, g_2</math> o wartościach rzeczywistych, stąd | funkcji <math>g_1, g_2</math> o wartościach rzeczywistych, stąd | ||
<center><math>\left\{\aligned d_{(x,y,z)}\Phi=0\\G(x,y,z)=0\endaligned \right. | <center><math> | ||
\Phi(x,y,z)=F(x,y,z)-\Lambda G(x,y,z)=F(x,y,z)-\lambda_1 g_1 | |||
(x,y,z)-\lambda_2 g_2 (x,y,z). | |||
</math></center> | |||
Metoda mnożników Lagrange'a sprowadza się więc do znalezienia rozwiązań układu równań | |||
<center><math> | |||
\left\{\aligned d_{(x,y,z)}\Phi=0\\G(x,y,z)=0\endaligned \right. | |||
\text{ czyli } | \text{ czyli } | ||
\left\{\aligned \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} | \left\{\aligned \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} | ||
Linia 1074: | Linia 1138: | ||
\\ \frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} | \\ \frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} | ||
\\ g_1(x,y,z)=0 | \\ g_1(x,y,z)=0 | ||
\\ g_2(x,y,z)=0\endaligned \right.</math></center> | \\ g_2(x,y,z)=0\endaligned \right. | ||
</math></center> | |||
w punktach regularnych poziomicy <math>\{G=0\}</math>, czyli tych, w których | w punktach regularnych poziomicy <math>\{G=0\}</math>, czyli tych, w których | ||
rząd różniczki <math>d_{(x,y,z)}G</math> jest maksymalny (tj. | rząd różniczki <math>d_{(x,y,z)}G</math> jest maksymalny (tj. równy <math>2</math>, gdyż | ||
różniczka <math>d_{(x,y,z)}G</math> jest odwzorowaniem liniowym z <math>\mathbb{R}^3</math> do | różniczka <math>d_{(x,y,z)}G</math> jest odwzorowaniem liniowym z <math>\mathbb{R}^3</math> do | ||
<math>\mathbb{R}^2</math>). | <math>\mathbb{R}^2</math>). | ||
Zwróćmy uwagę, że funkcja <math>F</math> może osiągać ekstremum w punktach, | Zwróćmy uwagę, że funkcja <math>F</math> może osiągać ekstremum w punktach, | ||
które należą do poziomicy <math>\{G=0\}</math> a nie są regularne. Metoda | które należą do poziomicy <math>\{G=0\}</math> a nie są regularne. Metoda | ||
mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu | mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu ekstremum. | ||
ekstremum. }} | }} | ||
{{przyklad|9.25.|| | |||
Wyznaczmy najmniejszą i największą wartość funkcji | |||
<center><math> | |||
F(x,y,z)=x-y-2z | |||
</math></center> | |||
na przecięciu się dwóch walców | |||
<center><math> | |||
x^2+z^2=1, \ \ y^2+z^2=1. | |||
</math></center> | |||
Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym, | Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym, | ||
gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem | gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem | ||
Linia 1099: | Linia 1173: | ||
mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań | mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań | ||
układu równań: | układu równań: | ||
<center><math>\left\{\aligned | |||
<center><math> | |||
\left\{\aligned | |||
\frac{\partial F}{\partial x}=\lambda_1 \frac{\partial | \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial | ||
g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} | g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} | ||
Linia 1109: | Linia 1185: | ||
\left\{\aligned 1=2\lambda_1 x\\-1=2\lambda_2 y\\ -2 | \left\{\aligned 1=2\lambda_1 x\\-1=2\lambda_2 y\\ -2 | ||
=2(\lambda_1+\lambda_2)z\\ x^2+z^2-1=0\\y^2+z^2-1=0. | =2(\lambda_1+\lambda_2)z\\ x^2+z^2-1=0\\y^2+z^2-1=0. | ||
\endaligned\right.</math></center> | \endaligned\right. | ||
</math></center> | |||
Układ ten ma dwa rozwiązania | Układ ten ma dwa rozwiązania | ||
<center><math>-x=y=z=\frac{\sqrt{2}}{2}, \text{ przy czym } | |||
\lambda_1=\lambda_2=-\frac{\sqrt{2}}{2}</math></center> oraz | <center><math> | ||
<center><math>x=-y=-z=\frac{\sqrt{2}}{2}, \text{ przy czym } | -x=y=z=\frac{\sqrt{2}}{2}, \text{ przy czym } | ||
\lambda_1=\lambda_2=\frac{\sqrt{2}}{2}.</math></center> Wartość funkcji <math>F</math> w | \lambda_1=\lambda_2=-\frac{\sqrt{2}}{2} | ||
tych punktach wynosi <center><math>F\big(-\frac{\sqrt{2}}{2}, | </math></center> | ||
oraz | |||
<center><math> | |||
x=-y=-z=\frac{\sqrt{2}}{2}, \text{ przy czym } | |||
\lambda_1=\lambda_2=\frac{\sqrt{2}}{2}. | |||
</math></center> | |||
Wartość funkcji <math>F</math> w tych punktach wynosi | |||
<center><math> | |||
F\big(-\frac{\sqrt{2}}{2}, | |||
\frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}\big)=-2\sqrt{2} \text{ oraz | \frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}\big)=-2\sqrt{2} \text{ oraz | ||
} F\big(\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, | } F\big(\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, | ||
-\frac{\sqrt{2}}{2}\big)=2\sqrt{2}.</math></center> W obu punktach | -\frac{\sqrt{2}}{2}\big)=2\sqrt{2}. | ||
nieregularnych poziomicy <math>\{G=0\}</math> mamy | </math></center> | ||
<center><math>F(0,0,-1)=2 \text{ oraz } F(0,0,1)=-2.</math></center> Po porównaniu tych wartości: | |||
<math>-2\sqrt{2}<-2<2<2\sqrt{2}</math> stwierdzamy, że największą wartość na | W obu punktach nieregularnych poziomicy <math>\{G=0\}</math> mamy | ||
<center><math> | |||
F(0,0,-1)=2 \text{ oraz } F(0,0,1)=-2. | |||
</math></center> | |||
Po porównaniu tych wartości: <math>-2\sqrt{2}<-2<2<2\sqrt{2}</math> stwierdzamy, że największą wartość na | |||
na poziomicy <math>\{G=0\}</math> równą <math>2\sqrt{2}</math> funkcja <math>F</math> osiąga w | na poziomicy <math>\{G=0\}</math> równą <math>2\sqrt{2}</math> funkcja <math>F</math> osiąga w | ||
punkcie <math> (\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, | punkcie <math> (\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, |
Wersja z 20:43, 21 sie 2006
AM2 - moduł 9
9. Twierdzenie o funkcjach uwikłanych.
Rozważamy funkcje zadane niejawnie. Formułujemy twierdzenie o funkcji uwikłanej i przedstawiamy metody badania takiej funkcji. Podajemy metodę mnożników Lagrange'a badania ekstremów warunkowych funkcji wielu zmiennych.
9.1 Punkty regularne poziomicy
Niech będą przestrzeniami Banacha i niech będzie zbiorem otwartym. Rozważmy funkcję
oraz jej poziomicę zerową tj. zbiór
Ustalmy pewien punkt , , , na tej poziomicy.
Definicja 9.1.
Mówimy, że punkt jest punktem regularnym zbioru , jeśli różniczka jest suriekcją przestrzeni na przestrzeń . Punkt poziomicy , który nie jest regularny, będziemy nazywać punktem nieregularnym tej poziomicy.
Przypomnijmy fakt z algebry liniowej:
W przypadku przestrzeni o skończonym wymiarze , odwzorowanie liniowe jest suriekcją wtedy i tylko wtedy, gdy rząd (macierzy) odwzorowania jest maksymalny, tj. równy .
Przykład 9.3.
Niech . Rozważmy i poziomicę zerową tej funkcji
czyli okrąg o środku w punkcie i promieniu jednostkowym. Różniczka
w dowolnym punkcie ma rząd maksymalny. Rząd różniczki nie jest maksymalny tylko w punkcie, w którym obie pochodne cząstkowe , zerują się, czyli gdy
ale punkt nie leży na okręgu .
Przykład 9.4.
Niech i niech . Pamiętamy, że poziomicą zerową tej funkcji
jest krzywa, którą nazywamy liściem Kartezjusza. Zauważmy, że różniczka
czyli w punktach i . Stąd punkt jest punktem nieregularnym
liścia Kartezjusza. Drugi punkt nie leży na poziomicy .Przykład 9.5.
Niech i niech . Poziomicę zerową tej funkcji już także poznaliśmy. Krzywą
nazywamy lemniskatą Bernoullego. Różniczka
nie ma maksymalnego rzędu tylko wtedy, gdy
czyli w trzech punktach , i , spośród których tylko pierwszy leży na lemniskacie Bernoullego. Nie jest więc jej punktem regularnym.
Przykład 9.6.
Poziomicą zerową funkcji
jest sfera o środku w początku układu współrzędnych i promieniu jednostkowym:
Różniczka odwzorowania dana wzorem
jest odwzorowaniem liniowym i ciągłym z do i ma rząd maksymalny (równy 1) we wszystkich punktach poza początkiem układu współrzędnych , w którym rząd ten wynosi zero. Punkt nie należy jednak do sfery , stąd każdy jej punkt jest regularny.
Rysunek am2w09.0040 a, b, c - przecięcie dwóch walców
Przykład 9.7.
Niech . Wówczas poziomicą zerową funkcji jest zbiór
który powstaje z przecięcia walca o osi obrotu z walcem o osi obrotu . Zauważmy, że różniczka
jest odwzorowaniem liniowym i ciągłym z do . Jest więc maksymalnego rzędu, gdy rząd macierzy jej współczynników
wynosi 2. Zauważmy, że rząd macierzy wynosi zero, gdy (punkt nie należy do poziomicy zerowej ). Z kolei, rząd tej macierzy wynosi jeden, gdy
co ma miejsce w dwóch punktach poziomicy , a mianowicie w punktach oraz . Są to jedyne punkty poziomicy, które nie są regularne, gdyż rząd różniczki w pozostałych punktach poziomicy jest
maksymalny (tj. wynosi ).Przykład 9.8.
Niech Poziomicą zerową tej funkcji jest powierzchnia o równaniu
Różniczka jest odwzorowaniem liniowym i ciągłym z do , nie ma więc rzędu maksymalnego w punktach , w których rząd różniczki jest niższy niż jeden, czyli w punktach, w których zerują się wszystkie trzy pochodne cząstkowe , tzn. gdy
Układ ten spełnia punkt o współrzędnych a także punkty o współrzędnych , które spełniają układ
czyli . Spośród punktów poziomicy warunek ten spełniają poza punktem także punkty , , , , gdzie . Poza wskazanymi pięcioma punktami poziomicy pozostałe punkty są regularne, gdyż różniczka odwzorowania ma w nich rząd maksymalny (równy ).
9.2 Twierdzenie o funkcji uwikłanej
Niech , będą przestrzeniami Banacha i niech będzie funkcją różniczkowalną w zbiorze otwartym . Niech będzie punktem poziomicy zerowej funkcji , gdzie . Powstaje naturalne pytanie o warunki, przy których poziomicę w otoczeniu punktu można przedstawić jako wykres pewnej funkcji takiej, że w pewnym otoczeniu otwartym punktu .
Rozważmy dwa proste przykłady.
Przykład 9.9.
Niech będzie punktem okręgu , który stanowi poziomicę zerową funkcji
Jeśli , to w otoczeniu punktu można określić funkcję
taką, że
Z kolei, jeśli , to w otoczeniu punktu znajdziemy funkcję
taką, że
Jedynymi punktami okręgu , w otoczeniu których nie znajdziemy funkcji takiej, że i , są punkty oraz
. Zauważmy, że w punktach tych zeruje się pochodna cząstkowa .Przykład 9.10.
Niech , . Niech będzie punktem sfery , która stanowi poziomicę zerową funkcji . Jeśli , to w otoczeniu punktu wewnątrz okręgu można określić funkcję
taką, że
Z kolei, jeśli znajdziemy funkcję
taką, że
Jedynymi punktami sfery , w otoczeniu których nie znajdziemy funkcji takiej, że i , są punkty okręgu zawartego w płaszczyźnie . Zauważmy, że w punktach tych zeruje się pochodna cząstkowa .
Uogólnijmy to spostrzeżenie formułując
Twierdzenie 9.11.[twierdzenie o funkcji uwikłanej]
Niech będzie funkcją różniczkowalną o ciągłej różniczce na zbiorze otwartym . Niech (gdzie ) będzie punktem poziomicy zerowej funkcji takim, że zacieśnienie różniczki do podprzestrzeni jest izomorfizmem. Wówczas
1) istnieje pewne otoczenie otwarte punktu oraz istnieje dokładnie jedna funkcja określona w tym otoczeniu taka, że oraz dla dowolnego . Ponadto
2) funkcja jest różniczkowalna i ma ciągłą różniczkę w zbiorze
daną wzoremoznacza zacieśnienie różniczki do podprzestrzeni a jest izomorfizmem odwrotnym do zacieśnienia różniczki .
Dowód [szkic]
(szkic) Pominiemy dowód istnienia funkcji . Wyprowadzimy jednak wzór, który określa jej różniczkę, w trzech przypadkach najczęściej spotykanych w konkretnych zastosowaniach. Przypomnijmy wpierw jednak, że
Jeśli , to odwzorowanie liniowe jest izomorfizmem wtedy i tylko wtedy, gdy wyznacznik tego odwzorowania jest różny od zera, tj. .
Przypadek I. Niech i niech Jeśli funkcja spełnia równanie , to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość
Stąd
Z założenia zacieśnienie różniczki jest izomorfizmem przestrzeni do , co oznacza w tym przypadku, że pochodna cząstkowa . Stąd pochodna funkcji uwikłanej wyraża się wzorem
Przypadek II. Niech Jeśli funkcja spełnia równanie , to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość prawdziwą w punktach poziomicy
oraz
Izomorficzność zawężenia różniczki również w tym przypadku oznacza po prostu, że pochodna cząstkowa . Wówczas z powyższych równości dostajemy
oraz
gdzie . Pomijając argument w zapisie pochodnych cząstkowych można te wzory podać w skróconej formie (łatwiejszej do zapamiętania):
Przypadek III. Niech , i niech
Załóżmy, że istnieje funkcja różniczkowalna
taka, że
to znaczy
Stąd - korzystając z twierdzenia o różniczkowaniu złożenia funkcji - dostajemy
oraz
Otrzymujemy układ dwóch równań z niewiadomymi , , które są pochodnymi składowych funkcji uwikłanej :
Zapiszmy ten układ w formie macierzowej
W rozważanym przypadku założenie o izomorficzności zacieśnienia różniczki do podprzestrzeni oznacza po prostu fakt, że macierz pochodnych cząstkowych, która reprezentuje :
jest nieosobliwa, tj. jej wyznacznik jest różny od zera. Z kolei macierz kolumnowa
reprezentuje zacieśnienie różniczki do podprzestrzeni . Macierz niewiadomych , :
reprezentuje różniczkę funkcji uwikłanej . Stąd układ równań z niewiadomymi , przedstawia równanie
w którym niewiadomą jest różniczka . Izomorficzność zacieśnienia gwarantuje istnienie odwzorowania odwrotnego , dzięki czemu otrzymujemy
W języku algebry nieosobliwość macierzy
gwarantuje istnienie macierzy do niej odwrotnej. Stąd rozwiązaniem równania
jest
lub równoważnie:

9.3 Ekstrema funkcji uwikłanej
Niech i niech
będzie funkcją określoną w pewnym zbiorze otwartym .
Zauważmy, że do wyznaczenia różniczki funkcji uwikłanej równaniem nie potrzebujemy znać jawnej postaci funkcji . Co więcej, potrafimy wyznaczyć punkty, w których funkcja może osiągać ekstrema, korzystając ze znanego warunku koniecznego istnienia ekstremum.
Twierdzenie 9.13.[warunek konieczny istnienia ekstremum funkcji uwikłanej]
Jeśli funkcja uwikłana równaniem osiąga ekstremum w pewnym punkcie takim, że pochodna cząstkowa , to w punkcie zerują się pochodne cząstkowe funkcji po zmiennych , tzn.
Dowód
Warunek ten jest konsekwencją wzoru na różniczkę funkcji , który stanowi tezę twierdzenia o funkcji uwikłanej. Ponieważ zachodzi równość
to wobec izomorficzności która w tym przypadku jest równoważna stwierdzeniu, że ) różniczka zeruje się wtedy i tylko wtedy, gdy . Warunek ten jest z kolei równoważny zerowaniu się w punkcie pochodnych cząstkowych funkcji po zmiennych , czyli

Wyznaczymy również drugą różniczkę funkcji uwikłanej , aby z jej określoności wywnioskować, czy funkcja osiąga maksimum, minimum, czy też w ogólne nie osiąga ekstremum w punktach, które spełniają warunek konieczny istnienia ekstremum.
Rozważmy dwa najczęściej spotykane przypadki:
Przypadek I. Niech będzie funkcją dwukrotnie różniczkowalną. Rozważmy funkcję uwikłaną równaniem . Różniczkując tę równość po zmiennej otrzymamy (na podstawie twierdzenia o różniczkowaniu złożenia) równość
Różniczkując względem zmiennej powtórnie obie strony powyższej nierówności, otrzymamy
Otrzymane wyrażenie znacznie upraszcza się w punkcie , w którym . Otrzymamy wówczas równość
z której - wobec założenia, że - otrzymamy
gdzie .
Przypadek II. Niech będzie funkcją uwikłaną równaniem , gdzie jest funkcją dwukrotnie różniczkowalną. Wówczas w punktach poziomicy otrzymamy równości zawierające pochodne cząstkowe oraz :
Policzymy pochodną cząstkową po zmiennej obu stron pierwszej z tych równości. Ze wzorów na pochodną złożenia funkcji wyznaczymy wpierw:
oraz
Wobec tego
W punkcie , w którym zeruje się różniczka funkcji uwikłanej, mamy , , a powyższy wzór upraszcza się i przyjmuje postać:
gdzie . W podobny sposób dostajemy równości zawierające pozostałe pochodne cząstkowe rzędu drugiego funkcji uwikłanej , które przy założeniu zerowania się różniczki funkcji uwikłanej w punkcie przyjmują postać:
Stąd - wobec założenia, że - otrzymujemy:
W podobny sposób (szczegółowe rachunki pomijamy) można wykazać ogólny wzór wyrażający drugą różniczkę funkcji uwikłanej.
Wniosek 9.14.
Niech , będzie funkcją uwikłaną równaniem , gdzie jest funkcją dwukrotnie różniczkowalną w pewnym otoczeniu punktu , gdzie . Niech i niech różniczka . Wówczas druga
różniczka funkcji uwikłanej w punkcie wynosiPrzykład 9.15.
Wyznaczmy ekstrema funkcji danej w postaci uwikłanej , gdzie
Obserwacja poziomicy zerowej każe przypuszczać, że w otoczeniu czterech punktów tej poziomicy da się wskazać otoczenia ich rzutów na płaszczyznę zmiennych oraz jednoznacznie określone funkcje w tych otoczeniach takie, że dwie z nich będą osiągać maksima a pozostałe dwie - minima.
Zgodnie z wykazanymi uwagami, aby wyznaczyć punkty ekstremalne funkcji uwikłanej szukamy punktów , których współrzędne spełniają układ równań:
Możliwość skorzystania z twierdzenia o funkcji uwikłanej (aby mieć gwarancję istnienia funkcji uwikłanej ) wymaga sprawdzenia założenia:
Nietrudno zauważyć, że początek układu współrzędnych spełnia układ równań, ale nie spełnia założenia twierdzenia o funkcji uwikłanej, gdyż . Obserwacja poziomicy wyraźnie pokazuje, że nie ma możliwości jednoznacznego odwikłania funkcji z równania w żadnym otoczeniu punktu . Ponadto układ spełniają cztery punkty o współrzędnych
w których spełniony jest warunek . Na mocy twierdzenia o funkcji uwikłanej w pewnych otoczeniach odpowiednio punktów
istnieją jedyne funkcje , , , , które spełniają warunek
oraz odpowiednio , . Analiza poziomicy (lub określoności drugiej różniczki ) pozwala stwierdzić, że funkcje i osiągają w punktach , maksimum, zaś i osiągają w punktach , minimum.
Dalsze przykłady wyznaczania ekstremów funkcji uwikłanej analizujemy w ramach ćwiczeń.
9.4 Ekstrema warunkowe. Metoda mnożników Lagrange'a
Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym otwartym podzbiorze przestrzeni unormowanej (przy czym w praktycznych przykładach zajmowaliśmy się przykładami, gdy , ). Równie ważne z praktycznego punktu widzenia są także rozważania polegające na wyznaczaniu ekstremów funkcji zacieśnionej do zbioru, który nie jest otwarty w .
Przykład 9.16.
Wyznaczmy najmniejszą i największą wartość funkcji
na sferze
Sfera ta jest zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję ciągłą wnioskujemy, że wielomian osiąga na tej sferze zarówno wartość najmniejszą jak i największą. Nasze dotychczasowe doświadczenie podpowiada nam, że zadanie można by sprowadzić do badania funkcji dwóch zmiennych np. poprzez odwikłanie zmiennej
z równania sfery i zbadania funkcji dwóch zmiennych danych w kole wzorami:
Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości ekstremalnych funkcji na danej sferze.
Podamy jednak pewną metodę, która pozwala wyznaczać ekstremum funkcji zacieśnionej do poziomicy zerowej pewnej funkcji również w przypadku, gdy odwikłanie zmiennej z równania nie jest tak proste jak w podanym przykładzie.
Sprecyzujmy jednak wpierw problem.
Niech będą przestrzeniami Banacha i niech , będą funkcjami.
Definicja 9.17.
Mówimy, że funkcja osiąga ekstremum warunkowe w punkcie przy warunku , jeśli zacieśnienie funkcji do poziomicy osiąga ekstremum w tym punkcie.
Prawdziwe jest następujące twierdzenie, które stanowi podstawę metody mnożników Lagrange'a.
Niech będą przestrzeniami Banacha.
Twierdzenie 9.18.
Niech , będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego poziomicy (co - przypomnijmy - oznacza, że różniczka jest suriekcją przestrzeni na ). Jeśli funkcja osiąga ekstremum warunkowe w punkcie regularnym poziomicy zerowej funkcji , to istnieje funkcjonał liniowy i ciągły taki, że zachodzi równość .
Prawdziwe jest również twierdzenie, które na podstawie określoności drugiej różniczki pozwala stwierdzić czy funkcja osiąga minimum, czy maksimum warunkowe w punkcie .
Twierdzenie 9.19.
Niech , będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu regularnego poziomicy . Jeśli istnieje funkcjonał liniowy i ciągły taki, że zachodzi równość oraz forma kwadratowa
jest dodatnio określona (odpowiednio: ujemnie określona) na podprzestrzeni przestrzeni , to funkcja osiąga w punkcie minimum (odpowiednio: maksimum) warunkowe.
Definicja 9.20.
Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku Krzysztofa Maurina, Analiza. Część I. Elementy, Państwowe Wydawnictwo Naukowe, Warszawa 1977). Podamy jednak interpretację tego twierdzenia w kilku najczęściej spotykanych sytuacjach.
Jeśli są funkcjami różniczkowalymi, problem znalezienia ekstremum warunkowego funkcji przy warunku sprowadza się do znalezienia punktu na poziomicy oraz stałej , która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy dany wzorem taki, że różniczka , o ile punkt jest punktem regularnym poziomicy . Przypomnijmy, że w przypadku, gdy , punkt jest regularny, jeśli rząd różniczki
wynosi 1. Wystarczy więc sprawdzić, czy w punkcie różniczka , czyli czy którakolwiek pochodna cząstkowa lub jest różna od zera. Zagadnienie sprowadza się do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej
gdzie stałą (nazywaną tradycyjnie mnożnikiem Lagrange'a) wyznaczamy z układu równań
Jeśli są funkcjami różniczkowalnymi, problem znalezienia ekstremum warunkowego funkcji przy warunku sprowadza się do znalezienia - podobnie jak w poprzednim przypadku - punktu na poziomicy oraz stałej , która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy dany wzorem , taki, że różniczka , o ile punkt jest punktem regularnym poziomicy . Przypomnijmy, że w przypadku, gdy punkt jest regularny, jeśli rząd (odwzorowania liniowego z do ) jest maksymalny, czyli wynosi . Wystarczy więc sprawdzić, czy w punkcie różniczka
nie zeruje się, czyli czy któraś z pochodnych cząstkowych , , jest różna od zera. Zagadnienie można sprowadzić do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej
gdzie stałą wyznaczamy z układu równań
Przykład 9.23.
Powróćmy do zadania polegającego na wyznaczeniu najmniejszej i największej wartości funkcji na sferze . Rozwiążemy je metodą mnożników Lagrange'a opisaną w poprzednich uwagach. Dana sfera jest poziomicą zerową funkcji . Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech . Rozwiązujemy układ równań
Układ ten spełniają liczby
oraz
Ponieważ sfera jest zbiorem zwartym, wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je, gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, w jednym z tych dwóch punktów funkcja musi osiągać kres dolny, a w drugim kres górny wartości na sferze . Mamy
czyli osiąga w pierwszym z tych punktów wartość najmniejszą równą , a w drugim punkcie - wartość największą na sferze równą .
Jeśli funkcja , zaś , zagadnienie znalezienia ekstremów warunkowych funkcji przy warunku sprowadza się do znalezienia punktów zbioru , w których zeruje się różniczka funkcji . Funkcjonał Lagrange'a w tym przypadku jest odwzorowaniem liniowym z , jest więc reprezentowany przez macierz złożoną z dwóch liczb: , . Funkcja jest zestawieniem dwóch funkcji o wartościach rzeczywistych, stąd
Metoda mnożników Lagrange'a sprowadza się więc do znalezienia rozwiązań układu równań
w punktach regularnych poziomicy , czyli tych, w których rząd różniczki jest maksymalny (tj. równy , gdyż różniczka jest odwzorowaniem liniowym z do ). Zwróćmy uwagę, że funkcja może osiągać ekstremum w punktach, które należą do poziomicy a nie są regularne. Metoda mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu ekstremum.
Przykład 9.25.
Wyznaczmy najmniejszą i największą wartość funkcji
na przecięciu się dwóch walców
Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym, gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem zwartym (gdyż jest zbiorem domkniętym i ograniczonym, zawartym między innymi w sześcianie ). Podany warunek można opisać za pomocą poziomicy zerowej funkcji . Zbadaliśmy już, że spośród punktów poziomicy tylko dwa nie są regularne: oraz . Poza tymi dwoma punktami możemy zastosować metodę mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań układu równań:
Układ ten ma dwa rozwiązania
oraz
Wartość funkcji w tych punktach wynosi
W obu punktach nieregularnych poziomicy mamy
Po porównaniu tych wartości: stwierdzamy, że największą wartość na na poziomicy równą funkcja osiąga w punkcie , a najmniejszą, równą , w punkcie