Analiza matematyczna 2/Wykład 15: Zastosowania równań różniczkowych. Elementy rachunku wariacyjnego

Z Studia Informatyczne
Wersja z dnia 21:00, 21 sie 2006 autorstwa Ak (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Elementy rachunku wariacyjnego.

Rozważamy zagadnienie wariacyjne polegające na wyznaczeniu ekstremów funkcjonału danych za pomocą całki J[f]=abL(f,f,t)dt w klasie funkcji f różniczkowalnych o ciągłej i ograniczonej pochodnej na przedziale [a,b]. Wyprowadzamy równanie Lagrange'a-Eulera (równanie ekstremali funkcjonału J). Analizujemy trzy klasyczne zagadnienia wariacyjne (o najmniejszej powierzchni obrotowej, zagadnienie brachistochrony i zagadnienie izoperymetryczne).

Przypomnijmy fakt znany z teorii całki oznaczonej funkcji jednej zmiennej.

Uwaga [Uzupelnij]

Jeśli γ:[α,β]t(x(t),y(t))2 jest parametryzacją klasy C1 pewnej krzywej γ na płaszczyźnie, to długość tej krzywej wyraża całka oznaczona:

l=l(γ)=αβ(x(t))2+(y(t))2dt,

która w szczególnym przypadku, gdy krzywa γ:[a,b]x(x,f(x)) jest wykresem funkcji zmiennej x, przyjmuje

postać
l=ab(1+(f(x))2dx.

Na pytanie o kształt najkrótszej krzywej łączącej dwa wyróżnione punkty na płaszczyźnie, np. A=(xA,yA), B=(xB,yB) każdy natychmiast odpowiada: to odcinek prostej o podanych końcach:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \{(1-t)A+Bt, t\in[0,1]\}:=\{(x,y)\in \mathbb{R}^2 : x(t)=(1-t)x_A+tx_B, \ y(t)=(1-t)y_A+ty_B\}.}

Nasza intuicja podpowiada nam też, że

wskazany odcinek prostej jest jedynym rozwiązaniem postawionego problemu, każda inna krzywa łącząca punkty A i B jest dłuższa. Nikt też nie ma wątpliwości, że całka wyrażająca długość krzywej γ łączącej wskazane punkty, może być dowolnie duża, gdyż od punktu A do B możemy wędrować po dowolnie długiej krzywej.

Rozważmy kolejny przykład. Pamiętamy, że

Uwaga [Uzupelnij]

Pole powierzchni powstałej z obrotu krzywej γ:[α,β]t(x(t),y(t))2 dookoła osi rzędnych wyraża całka oznaczona

S=S(γ)=2παβ|y(t)|(x(t))2+(y(t))2dt,

która w szczególnym przypadku, gdy krzywa γ:[a,b]x(x,f(x)) jest wykresem funkcji zmiennej x, przyjmuje

postać
S=2πab|f(x)|(1+(f(x))2dx.

{{przyklad|[Uzupelnij]|| Bryłą powstałą z obrotu dookoła osi Ox okręgu x(t)=rcost, y(t)=R+rsint, gdzie R>r, jest torus o polu

S=2π02π(R+rsint)r2(sin2t+cos2t)dt=4π2rR.

{{red}POWTÓRZYĆ animację am2w09.0020} }}

Zapytani o kształt krzywej, która w wyniku obrotu daje najmniejsze pole wśród wszystkich krzywych zaczepionych na końcach przedziału w tych samych punktach, przeważnie odpowiadamy (czerpiąc intuicję z przykładów płaskich), że to powierzchnia powstała z obrotu odcinka prostej, czyli pobocznica stożka. Jednak chwila refleksji i wspomnienie zabaw z bańkami mydlanymi każe nam zrewidować to przypuszczenie. Bańka mydlana, dzięki siłom napięcia powierzchniowego przyjmuje kształt taki, aby jej pole było możliwie najmniejsze. Rozpięta na dwóch obręczach nigdy nie przyjmie kształtu pobocznicy stożka. Czy kształt bańki rozpiętej na dwóch obręczach można opisać za pomocą wzoru?

Rozważmy bardziej ogólne zadanie. Niech

J[f]:=abL(f,f,t)dt

będzie całką zależną od

pewnej funkcji f klasy C1 na odcinku o ograniczonej pierwszej pochodnej, gdzie L:3 jest pewną funkcją o ciągłych pochodnych cząstkowych. Stawiamy problem polegający na znalezieniu takiej funkcji f, aby wartość całki J[f] była ekstremalna (tj. najmniejsza, albo największa) w zbiorze tych funkcji, których wartości na końcach przedziału [a,b] są takie same.

Niech C1[a,b] będzie zbiorem funkcji ciągłych na przedziale [a,b] o ciągłej i ograniczonej pochodnej na przedziale [a,b] (na końcach przedziału zakładamy istnienie skończonych granic jednostronnych pochodnej).

Konsekwencją faktu, że granica jednostajnie zbieżnego ciągu funkcji ciągłych jest funkcją ciągłą, jest następująca

Uwaga [Uzupelnij]

Zbiór C1[a,b] z normą f:=sup{|f(t)|:t[a,b]}+sup{|f(t)|:t[a,b]} stanowi przestrzeń Banacha (tj. przestrzeń unormowaną zupełną)

Odwzorowanie

J:C1[a,b]fJ[f]

(które zgodnie z tradycyjną terminologią nazywa się funkcjonałem działającym na przestrzeni funkcji dopuszczalnych C1[a,b]) jest więc określone na przestrzeni Banacha i przyjmuje wartości w zbiorze liczb rzeczywistych (który -- przypomnijmy -- również jest przestrzenią Banacha z normą równą wartości bezwzględnej liczby). Pamiętamy, że warunkiem koniecznym istnienia ekstremum funkcji różniczkowalnej jest zerowanie się jej różniczki zupełnej (różniczki w sensie Frecheta). Okazuje się, że przy naturalnych założeniach o funkcji L odwzorowanie fJ[f] jest różniczkowalne. Jesteśmy w stanie wyznaczyć tę różniczkę.

Twierdzenie [Uzupelnij]

Jeśli L:3U jest funkcją określoną na zbiorze otwartym U o ciągłych pochodnych cząstkowych, to odwzorowanie C1[a,b]fJ[f] jest różniczkowalne w sensie Frecheta w każdym punkcie fC1[a,b]. Wartość różniczki dfJ na wektorze

hC1[a,b] wynosi
Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned d_f J(h)=\int_{a}^b\left(\frac{\partial L}{\partial x}(f, f', t)h+\frac{\partial L}{\partial y}(f, f', t)h'\right)dt\\ =\int_{a}^b\left(\frac{\partial L}{\partial x}(f, f', t)h-\frac{d}{dt}\frac{\partial L}{\partial y}(f, f', t)h\right)dt+\left[\frac{\partial L}{\partial y}(f, f', t)h\right]_a^b \endaligned }

Definicja [Uzupelnij]

Funkcję (x,y,t)L(x,y,t), która określa funkcjonał J[f]=abL(f,f,t)dt, nazywamy

funkcją Lagrange'a.

Dowód [Uzupelnij]

Niech hC1[a,b] będzie przyrostem argumentu funkcjonału J. W dowolnym punkcie fC1[a,b], wobec ciągłości pochodnych cząstkowych funkcji Lagrange'a, mamy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned J[f+h]-J[f]&=\int_{a}^{b}\bigg(L(f+h, f'+h', t)-L(f,f', t)\bigg)dt\\ &=\int_a^b\bigg(\frac{\partial L}{\partial x}(f,f', t)h+\frac{\partial L}{\partial y}(f,f', t)h'\bigg)dt+o(\|h\|),\endaligned }
gdzie

h=max|h|+max|h|. Wynika stąd, że funkcjonał J jest różniczkowalny w sensie Frecheta w każdym punkcie f i jego różniczka dfJ na wektorze h przyjmuje wartość

dfJ(h)=ab(Lx(f,f,t)h+Ly(f,f,t)h)dt.
Całkując

przez części drugi składnik tego wyrażenia dostajemy

abLy(f,f,t)hdt=[Ly(f,f,t)h]ababddt(Ly(f,f,t))hdt.
Stąd
dfJ(h)=ab(Lx(f,f,t)ddtLy(f,f,t))hdt+[Ly(f,f,t)h]ab.

Rozważmy

A:={fC1[a,b]:f(a)=ya, f(b)=yb}

rodzinę funkcji z przestrzeni C1[a,b], które na końcach przedziału [a,b] przyjmują ustalone wartości ya, yb. Zauważmy, że jeśli f1,f2A, to również (1t)f1+tf2A dla dowolnej liczby rzeczywistej t. Zauważmy, że AC1[a,b] jest podprzestrzenią afiniczną oraz

A=f*+A0={f*+f,fA0},

gdzie A0={fC1[a,b]:f(a)=f(b)=0} jest podprzestrzenią wektorową przestrzeni C1[a,b], natomiast wektor f*(t)=ya+taba(ybya).

Warto zauważyć, że

Uwaga [Uzupelnij]

Zacieśnieniem różniczki dfJ do A0 jest

A0hab(Lx(f,f,t)hddtLy(f,f,t)h)dt.

Wynika stąd

Wniosek [Uzupelnij]

Różniczka dfJ zeruje się na podprzestrzeni afinicznej A wtedy i tylko wtedy, gdy funkcja fA spełnia równanie

ddtLy(f,f,t)=Lx(f,f,t).

Równanie, które występuje w tezie powyższego wniosku, nazywamy równaniem Lagrange'a-Eulera.

Uwaga [Uzupelnij]

Gdy funkcjonał dany jest wzorem J[y]=abL(y,y,t)dt, równanie Lagrange'a-Eulera zapisuje

się w uproszczonej notacji
ddtLy=Ly.
Zapis ten jednak

należy rozumieć tak, jak w wyprowadzonym wzorze, tzn. gdy (x1,x2,x3)L(x1,x2,x3) jest funkcją Lagrange'a, to lewa strona ddtLy oznacza wyrażenie, które powstaje z wyznaczenia pochodnej po zmiennej t z podstawienia do pochodnej cząstkowej Lx2 odpowiednio f,f,t za x1,x2,x3. W podobny sposób należy rozumieć też prawą stronę równania: Ly, która oznacza podstawienie do pochodnej Lx1 odpowiednio f,f,t za x1,x2,x3.

Uwaga [Uzupelnij]

a) Równanie Lagrange'a-Eulera jest równaniem różniczkowym zwyczajnym rzędu (co najwyżej) drugiego.

b) Jeśli funkcja L nie zależy jawnie od zmiennej t, to równanie Lagrange'a -Eulera jest równoważne równaniu różniczkowemu

rzędu (co najwyżej) pierwszego:
L(f,f,t)fLy(f,f,t)=Const,
gdzie Const jest dowolną stałą.

Dowód [Uzupelnij]

Obie uwagi wykażemy w ramach ćwiczeń.

Definicja [Uzupelnij]

Każde rozwiązanie równania Lagrange'a-Eulera nazywamy ekstremalą funkcjonału J na zbiorze A. Równanie Lagrange'a-Eulera nazywa się też często równaniem ekstremali funkcjonału J. Zagadnienie polegające na wyznaczeniu ekstremów funkcjonału J nazywamy zagadnieniem wariacyjnym. Tradycyjnie wariacją funkcjonału J nazywamy różniczkę dfJ (w sensie Frecheta) funkcjonału J. Funkcjonał J[f]=abL(f,f,t)dt nazywa się często (zwłaszcza w mechanice) funkcjonałem działania

lub całką działania.

Zwróćmy uwagę, że termin ekstremala oznacza punkt fA, w którym spełniony jest warunek konieczny istnienia ekstremum funkcjonału J.

Większość praktycznych zagadnień wariacyjnych ma jasną interpretację fizyczną, czy geometryczną, z której w oczywisty sposób wynika, czy ekstremala (tj. rozwiązanie równania Lagrange'a-Eulera) jest punktem zbioru AC1[a,b], w którym funkcjonał J osiąga minimum, czy maksimum.

Przykład [Uzupelnij]

(zadanie o najmniejszej powierzchni obrotowej) Wyznaczymy krzywą klasy C1 o końcach (a,ya), (b,yb), która obracana dokoła osi poziomej tworzy najmniejszą powierzchnię obrotową. Wiemy już, że pole powierzchni obrotowej wyraża całka

S(y)=2πab|f(t)|1+(f(t))2dt.
Wyznaczmy więc

ekstremalę tego funkcjonału na A0={fC1[a,b]:f(a)=ya,f(b)=yb}. Funkcja L(x,y,t)=x1+y2 nie zależy od zmiennej t, stąd równanie równanie Lagrange'a-Eulera jest równoważne równaniu L(f,f,t)Ly(f,f,t)=C1, gdzie C1 jest pewną stałą. Równanie to ma więc postać

f1+(f)2fff1+(f)2=C1,

gdzie C1 jest pewną stałą. Po sprowadzeniu do wspólnego mianownika otrzymamy

f1+(f)2=C1,
czyli
(f)2+1=f2C12.
Równanie to spełnia rodzina

funkcji f(x)=C1coshtC2C1, gdzie C2 jest stałą. Stałe C1 i C2 wyznaczamy z warunków zadania, tj.

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned f(a)=y_a \\ f(b)=y_b\endaligned\right. \text{ czyli } \left\{\aligned C_1 \cosh \frac{a-C_2}{C_1}=y_a \\ C_1 \cosh \frac{b-C_2}{C_1}=y_b\endaligned.\right.}
Łatwo wyobrazić

sobie, że układ ten może nie mieć rozwiązania. Gdy odległość |ba| rośnie, powierzchnia powstała z obrotu krzywej f przy ustalonych promieniach ya, yb może mieć pole większe niż suma pól kół o tych promieniach tj. większe niż π(ya2+yb2). Jeśli natomiast różnica ba nie jest zbyt duża, znajdziemy stałe C1, C2 spełniające warunki zadania. Powierzchnię powstałą z obrotu wykresu funkcji f(t)=C1coshtC2C1, atb, nazywamy katenoidą.

Przykład [Uzupelnij]

(zadanie o brachistochronie) W polu grawitacyjnym znajdują się dwa punkty A oraz B. Po jakiej krzywej powinien ześlizgiwać się bez tarcia punkt materialny, aby drogę od A do B przebyć w najkrótszym czasie?

Chwila refleksji nad zadaniem przywołuje doświadczenia narciarskie i skłania do przypuszczenia, że wśród różnych tras na ośnieżonym stoku (tarcie nart zaniedbujemy), chcąc dostać się na podnóże góry jak najszybciej (co nie oznacza, że najbezpieczniej!) powinniśmy wybrać raczej taką, która jest stroma na początku, aby dobrze się rozpędzić.

Bez straty ogólności możemy przyjąć, że początek trasy znajduje się w punkcie A=(0,0), tj. w początku układu współrzędnych, którego oś pionową zwracamy na dół (czyli przeciwnie, niż zwykle). Niech B=(a,b). Jeśli punkt materialny znajdzie się w położeniu (x,y), to zgodzie z prawem zachowania energii jego energia kinetyczna będzie równa zmianie energii potencjalnej mgy pomiędzy punktem początkowym, który znajduje się na poziomie zerowym a danym punktem na poziomie y, czyli 12mv2=mgy, gdzie m jest masą punktu materialnego, a v(t)=(dxdt)2+(dydt)2 jest jego prędkością. Stąd po zmianie zmiennych v(t)=1+(dydx)2dxdt i zapisaniu równania w postaci różniczkowej vdt=1+(dydx)2dx oraz po uwzględnieniu prawa zachowania energii (v=2gy) otrzymujemy

2gydt=1+(dydx)2dx,

czyli

dtdx=1+(dydx)22gy.

Stąd całkowity czas, jaki jest niezbędny, aby pokonać drogę z położenia x=0 do x=a (licząc wzdłuż osi zmiennej x), wyraża całka oznaczona

0adtdxdx=12g0a1+(dydx)2ydx.

Zadanie sprowadza się więc do wyznaczenia ekstremali funkcjonału

J[y]=0a1+(dydx)2ydx,

(czynnik 12g jest stały) w zbiorze tych funkcji xy(x), które na końcach przedziału [0,a] przyjmują odpowiednio wartości y(0)=0 i y(a)=b. Zauważmy, że funkcja

Lagrange'a
(x1,x2,x3)L(x1,x2,x3)=1+x22x1
nie zależy od zmiennej x3,

stąd rozwiązanie równanie Lagrange'a-Eulera jest równoważne

równaniu
L(y,y,x)yLx2(y,y,x)=Const,
gdzie Const jest dowolną stałą. Po przekształceniu

równanie to przyjmie postać:

1+(y)2y1y(y)21+(y)2=C

a po sprowadzeniu do wspólnego mianownika składników po lewej stronie równości i podniesieniu do kwadratu:

1y(1+(y)2)=C2.

Rozwiązanie xy(x) równania y(1+(y)2)=C2 można przedstawić w postaci parametrycznej:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned x(\theta)&=r(\theta-\sin\theta)+C_1\\ y(\theta)&=r(1-\cos \theta), \endaligned\right.}
gdzie

r=12C2, a C1 jest kolejną stałą. Z twierdzenia o różniczkowaniu złożenia mamy

dydx=dydt(dxdt)1=rsinθr(1cosθ)=sinθ(1cosθ),

stąd -- po przekształceniach

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned y\bigg(1+\big(\frac{dy}{dx}\big)^2\bigg) &=r(1-\cos \theta)\left(1+\frac{\sin^2\theta}{(1-\cos\theta)^2}\right) \\&=2r=C^{-2},\endaligned }

czyli krzywa θ(x(θ),y(θ)) spełnia równanie Lagrange'a-Eulera. Uwzględniając współrzędne początku A=(0,0) otrzymujemy C1=0. Następnie uwzględniając również koniec trasy B=(a,b) wyznaczamy wartość stałej r, a co za tym idzie również stałej C. Szczegółowe obliczenia pomijamy. Zwróćmy jednak uwagę na krzywą

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \left\{\aligned x(\theta)&=r(\theta-\sin\theta)\\ y(\theta)&=r(1-\cos \theta), \endaligned\right.}
która jest

rozwiązaniem zadania brachistochrony (czyli krzywej najszybszego spadku). Krzywą tą jest łuk cykloidy łączący punkty A i B.

Przykład [Uzupelnij]

(zagadnienie izoperymetryczne)

Rozważmy rodzinę krzywych klasy C1 o ustalonych końcach A=(1,0) i B=(1,0). Czy istnieje krzywa o ustalonej długości, która wraz z odcinkiem o końcach A, B ogranicza obszar o możliwie największym polu?

Zadanie sprowadza się do maksymalizowania wartości całki wyrażającej pole pod wykresem funkcji f

F(f)=11f(t)dt

przy warunku

G(f)=111+(f(t))2dt=Const,

który oznacza, że długość łuku krzywej t(t,f(t)), przy atb jest stała. Mamy więc zagadnienie polegające na znalezieniu ekstremum warunkowego: ekstremum funkcjonału fF(f) na poziomicy funkcjonału G(f)=Const. Korzystając z twierdzenia o funkcjonale Lagrange'a (stanowiącego ugólnienie klasycznego twierdzenia o mnożnikach Lagrange'a) można wykazać, że

Uwaga [Uzupelnij]

Jeśli funkcjonał F osiąga wartość ekstremalną przy warunku G(f)=Const, to istnieje stała λ taka, że f jest

ekstremalą funkcjonału Φ=F+λG.

W rozważanym przez nas przykładzie funkcjonał Φ ma postać:

Φ(f)=11(f+λ1+(f)2)dx.

Zwróćmy uwagę, że funkcja Lagrange'a

L(x,y,t)=x+λ1+y2

określająca funkcjonał Φ nie zależy od zmiennej t, wobec tego funkcja f spełnia równanie równoważne równaniu Lagrange'a-Eulera

L(f,f,t)fLy(f,f,t)=C1,

gdzie

C1 jest stałą. Dostajemy więc

f+λ1+(f)2λff1+(f)2=C1,

które po uproszczeniu (po

sprowadzeniu składników do wspólnego mianownika) przyjmie postać

fC1=λ1+(f)2

lub równoważną

1+(f)2=λ2(C1f)2.

Równanie to spełnia rodzina funkcji f(t)=λ2(tC2)2+C1, gdzie C2 jest kolejną stałą (przypomnijmy, że C1 jest stałą, która pojawiła się z całkowania równania Lagrange'a -Eulera). Stałe C1, C2 wyznaczymy z warunków zadania f(1)=0 oraz f(1)=0, czyli λ2(1C2)2=λ2(1C2)2, skąd C2=0, a także C1=λ21. Widzimy więc, że rozwiązaniem zagadnienia jest funkcja

f(t)=λ2t2λ21.

Współrzędne punktu

(t,f(t))

wykresu funkcji f spełniają równanie

t2+(f(t)+λ21)2=λ2,

czyli równanie okręgu o środku w punkcie (0,λ21) i promieniu |λ|. Rozwiązaniem problemu jest więc łuk okręgu, którego cięciwą jest dany odcinek AB. Stałą λ wyznaczymy z warunku G(f)=Const. Mamy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned G(f)&=\int_{-1}^{1}\sqrt{1+(f')^2}dx\\ &=\int_{-1}^{1}\sqrt{\frac{x^2+\lambda^2-x^2}{\lambda^2-x^2}}dx\\ &=2|\lambda|\arcsin\frac{x}{\lambda}\bigg|_{-1}^{1}=2|\lambda|\arcsin\frac{1}{\lambda}.\endaligned}

Stąd λ jest rozwiązaniem równania

1λ=sinConst2|λ|.

Szkicując wykresy funkcji tt oraz tsin(C2t) możemy łatwo przekonać się, że dla 0C<2 jedynym rozwiązaniem równania t=sin(C2t) jest t=0. Wówczas nie znajdziemy takiej stałej λ, aby 1λ=0. Wynika to zresztą w oczywisty sposób z interpretacji geometrycznej rozważanego zagadnienia: punktów A=(1,0) oraz B=(1,0) nie da się połączyć krzywą o długości C<2. Gdy C=2, rozwiązaniem zagadnienia jest po prostu odcinek AB, który w tym przypadku ogranicza zerowe pole C=0, Gdy zaś C>2, znajdziemy rozwiązanie t0 równania t=sin(C2t) i weźmiemy λ=1t0. Na przykład dla C=π mamy t0=1, więc λ=1.

W ten sposób pokazaliśmy intuicyjnie oczywisty fakt, iż

Wniosek [Uzupelnij]

Wśród krzywych o ustalonych końcach A,B i tej samej długości l>AB największe pole wraz z odcinkiem AB ogranicza łuk okręgu.