Analiza matematyczna 2/Wykład 15: Zastosowania równań różniczkowych. Elementy rachunku wariacyjnego

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Zastosowania równań różniczkowych. Elementy rachunku wariacyjnego

Rozważamy zagadnienie wariacyjne polegające na wyznaczeniu ekstremów funkcjonału danych za pomocą całki J[f]=abL(f,f,t)dt w klasie funkcji f różniczkowalnych o ciągłej i ograniczonej pochodnej na przedziale [a,b]. Wyprowadzamy równanie Lagrange'a-Eulera (równanie ekstremali funkcjonału J). Analizujemy trzy klasyczne zagadnienia wariacyjne (o najmniejszej powierzchni obrotowej, zagadnienie brachistochrony i zagadnienie izoperymetryczne).

Przypomnijmy fakt znany z teorii całki oznaczonej funkcji jednej zmiennej.

Uwaga 15.1.

Jeśli γ:[α,β]t(x(t),y(t))2 jest parametryzacją klasy C1 pewnej krzywej γ na płaszczyźnie, to długość tej krzywej wyraża całka oznaczona:

l=l(γ)=αβ(x(t))2+(y(t))2dt,

która w szczególnym przypadku, gdy krzywa γ:[a,b]x(x,f(x)) jest wykresem funkcji zmiennej x, przyjmuje postać

l=ab(1+(f(x))2dx

Na pytanie o kształt najkrótszej krzywej łączącej dwa wyróżnione punkty na płaszczyźnie, np. A=(xA,yA), B=(xB,yB), każdy natychmiast odpowiada: to odcinek prostej o podanych końcach:

{(1t)A+Bt,t[0,1]}:={(x,y)2:x(t)=(1t)xA+txB,{y(t)=(1t)yA+tyB}

Intuicja podpowiada nam też, że wskazany odcinek prostej jest jedynym rozwiązaniem postawionego problemu; każda inna krzywa łącząca punkty A i B jest dłuższa. Nikt też nie ma wątpliwości, że całka wyrażająca długość krzywej γ łączącej wskazane punkty, może być dowolnie duża, gdyż od punktu A do B możemy wędrować po dowolnie długiej krzywej.

Rozważmy kolejny przykład. Pamiętamy, że

Uwaga 15.2.

Pole powierzchni powstałej z obrotu krzywej γ:[α,β]t(x(t),y(t))2 dookoła osi rzędnych wyraża całka oznaczona

S=S(γ)=2παβ|y(t)|(x(t))2+(y(t))2dt,

która w szczególnym przypadku, gdy krzywa γ:[a,b]x(x,f(x)) jest wykresem funkcji zmiennej x, przyjmuje postać

S=2πab|f(x)|(1+(f(x))2dx

Przykład 15.3.

Bryłą powstałą z obrotu dookoła osi Ox okręgu x(t)=rcost, y(t)=R+rsint, gdzie R>r, jest torus o polu

S=2π02π(R+rsint)r2(sin2t+cos2t)dt=4π2rR


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/a/ad/Am2w09.0020.mgs.zip">
   <param name="scale" value="1.0 1.0 1.0">

<param name="shading" value="0.2"> <param name="mode" value="noortho"> </applet>

<div.thumbcaption>Torus


Zapytani o kształt krzywej, która w wyniku obrotu daje najmniejsze pole wśród wszystkich krzywych zaczepionych na końcach przedziału w tych samych punktach, przeważnie odpowiadamy (czerpiąc intuicję z przykładów płaskich), że to powierzchnia powstała z obrotu odcinka prostej, czyli pobocznica stożka. Jednak chwila refleksji i wspomnienie zabaw z bańkami mydlanymi każe nam zrewidować to przypuszczenie. Bańka mydlana, dzięki siłom napięcia powierzchniowego przyjmuje kształt taki, aby jej pole było możliwie najmniejsze. Rozpięta na dwóch obręczach nigdy nie przyjmie kształtu pobocznicy stożka. Czy kształt bańki rozpiętej na dwóch obręczach można opisać za pomocą wzoru?

Rozważmy bardziej ogólne zadanie. Niech

J[f]:=abL(f,f,t)dt

będzie całką zależną od pewnej funkcji f klasy C1 na odcinku o ograniczonej pierwszej pochodnej, gdzie L:3 jest pewną funkcją o ciągłych pochodnych cząstkowych. Stawiamy problem polegający na znalezieniu takiej funkcji f, aby wartość całki J[f] była ekstremalna (tj. najmniejsza albo największa) w zbiorze tych funkcji, których wartości na końcach przedziału [a,b] są takie same.

Niech C1[a,b] będzie zbiorem funkcji ciągłych na przedziale [a,b] o ciągłej i ograniczonej pochodnej na przedziale [a,b] (na końcach przedziału zakładamy istnienie skończonych granic jednostronnych pochodnej).

Konsekwencją faktu, że granica jednostajnie zbieżnego ciągu funkcji ciągłych jest funkcją ciągłą, jest następująca:

Stefan Banach (1892-1945)
Zobacz biografię
Uwaga 15.4.

Zbiór C1[a,b] z normą f:=sup{|f(t)|:t[a,b]}+sup{|f(t)|:t[a,b]} stanowi przestrzeń Banacha (tj. przestrzeń unormowaną zupełną)

Odwzorowanie

J:C1[a,b]fJ[f]

(które zgodnie z tradycyjną terminologią nazywa się funkcjonałem działającym na przestrzeni funkcji dopuszczalnych C1[a,b]) jest więc określone na przestrzeni Banacha i przyjmuje wartości w zbiorze liczb rzeczywistych (który - przypomnijmy - również jest przestrzenią Banacha z normą równą wartości bezwzględnej liczby). Pamiętamy, że warunkiem koniecznym istnienia ekstremum funkcji różniczkowalnej jest zerowanie się jej różniczki zupełnej (różniczki w sensie Frecheta). Okazuje się, że przy naturalnych założeniach o funkcji L odwzorowanie fJ[f] jest różniczkowalne. Jesteśmy w stanie wyznaczyć tę różniczkę.

Twierdzenie 15.5.

Jeśli L:3U jest funkcją określoną na zbiorze otwartym U o ciągłych pochodnych cząstkowych, to odwzorowanie C1[a,b]fJ[f] jest różniczkowalne w sensie Frecheta w każdym punkcie fC1[a,b]. Wartość różniczki dfJ na wektorze hC1[a,b] wynosi

dfJ(h)=ab(Lx(f,f,t)h+Ly(f,f,t)h)dt=ab(Lx(f,f,t)hddtLy(f,f,t)h)dt+[Ly(f,f,t)h]ab.

Definicja 15.6.

Funkcję (x,y,t)L(x,y,t), która określa funkcjonał J[f]=abL(f,f,t)dt, nazywamy funkcją Lagrange'a.

Dowód

Niech hC1[a,b] będzie przyrostem argumentu funkcjonału J. W dowolnym punkcie fC1[a,b], wobec ciągłości pochodnych cząstkowych funkcji Lagrange'a, mamy

J[f+h]J[f]=ab(L(f+h,f+h,t)L(f,f,t))dt=ab(Lx(f,f,t)h+Ly(f,f,t)h)dt+o(h),

gdzie h=max|h|+max|h|. Wynika stąd, że funkcjonał J jest różniczkowalny w sensie Frecheta w każdym punkcie f i jego różniczka dfJ na wektorze h przyjmuje wartość

dfJ(h)=ab(Lx(f,f,t)h+Ly(f,f,t)h)dt

Całkując przez części drugi składnik tego wyrażenia, dostajemy

abLy(f,f,t)hdt=[Ly(f,f,t)h]ababddt(Ly(f,f,t))hdt

Stąd

dfJ(h)=ab(Lx(f,f,t)ddtLy(f,f,t))hdt+[Ly(f,f,t)h]ab

Rozważmy

A:={fC1[a,b]:f(a)=ya, f(b)=yb}

rodzinę funkcji z przestrzeni C1[a,b], które na końcach przedziału [a,b] przyjmują ustalone wartości ya, yb. Zauważmy, że jeśli f1,f2A, to również (1t)f1+tf2A dla dowolnej liczby rzeczywistej t. Zauważmy, że AC1[a,b] jest podprzestrzenią afiniczną oraz

A=f*+A0={f*+f,fA0},

gdzie A0={fC1[a,b]:f(a)=f(b)=0} jest podprzestrzenią wektorową przestrzeni C1[a,b], natomiast wektor f*(t)=ya+taba(ybya).

Warto zauważyć, że

Uwaga 15.7.

Zacieśnieniem różniczki dfJ do A0 jest

A0hab(Lx(f,f,t)hddtLy(f,f,t)h)dt

Wynika stąd

Leonhard Euler (1707-1783)
Zobacz biografię

Wniosek 15.8.

Różniczka dfJ zeruje się na podprzestrzeni afinicznej A wtedy i tylko wtedy, gdy funkcja fA spełnia równanie

ddtLy(f,f,t)=Lx(f,f,t)

Równanie, które występuje w tezie powyższego wniosku, nazywamy równaniem Lagrange'a-Eulera.

Uwaga 15.9.

Gdy funkcjonał dany jest wzorem J[y]=abL(y,y,t)dt, równanie Lagrange'a-Eulera zapisuje się w uproszczonej notacji

ddtLy=Ly

Zapis ten jednak należy rozumieć tak, jak we wyprowadzonym wzorze, tzn. gdy (x1,x2,x3)L(x1,x2,x3) jest funkcją Lagrange'a, to lewa strona ddtLy oznacza wyrażenie, które powstaje z wyznaczenia pochodnej po zmiennej t z podstawienia do pochodnej cząstkowej Lx2 odpowiednio f,f,t za x1,x2,x3. W podobny sposób należy rozumieć też prawą stronę równania: Ly, która oznacza podstawienie do pochodnej Lx1 odpowiednio f,f,t za x1,x2,x3.

Uwaga 15.10.

a) Równanie Lagrange'a-Eulera jest równaniem różniczkowym zwyczajnym rzędu (co najwyżej) drugiego.

b) Jeśli funkcja L nie zależy jawnie od zmiennej t, to równanie Lagrange'a -Eulera jest równoważne równaniu różniczkowemu rzędu (co najwyżej) pierwszego:

L(f,f,t)fLy(f,f,t)=Const,

gdzie Const jest dowolną stałą.

Dowód

Obie uwagi wykażemy w ramach ćwiczeń.

Definicja 15.11.

Każde rozwiązanie równania Lagrange'a-Eulera nazywamy ekstremalą funkcjonału J na zbiorze A. Równanie Lagrange'a-Eulera nazywa się też często równaniem ekstremali funkcjonału J. Zagadnienie polegające na wyznaczeniu ekstremów funkcjonału J nazywamy zagadnieniem wariacyjnym. Tradycyjnie wariacją funkcjonału J nazywamy różniczkę dfJ (w sensie Frecheta) funkcjonału J. Funkcjonał J[f]=abL(f,f,t)dt nazywa się często (zwłaszcza w mechanice) funkcjonałem działania lub całką działania.

Zwróćmy uwagę, że termin ekstremala oznacza punkt fA, w którym spełniony jest warunek konieczny istnienia ekstremum funkcjonału J.

Większość praktycznych zagadnień wariacyjnych ma jasną interpretację fizyczną czy geometryczną, z której w oczywisty sposób wynika, że ekstremala (tj. rozwiązanie równania Lagrange'a-Eulera) jest punktem zbioru AC1[a,b], w którym funkcjonał J osiąga minimum czy maksimum.

Przykład 15.12.

Wyznaczymy krzywą klasy C1 o końcach (a,ya), (b,yb), która obracana dokoła osi poziomej tworzy najmniejszą powierzchnię obrotową. Wiemy już, że pole powierzchni obrotowej wyraża całka

S(y)=2πab|f(t)|1+(f(t))2dt

Wyznaczmy więc ekstremalę tego funkcjonału na A0={fC1[a,b]:f(a)=ya,f(b)=yb}. Funkcja L(x,y,t)=x1+y2 nie zależy od zmiennej t, stąd równanie równanie Lagrange'a-Eulera jest równoważne równaniu L(f,f,t)Ly(f,f,t)=C1, gdzie C1 jest pewną stałą. Równanie to ma więc postać

f1+(f)2fff1+(f)2=C1,

gdzie C1 jest pewną stałą. Po sprowadzeniu do wspólnego mianownika otrzymamy

f1+(f)2=C1,

czyli

(f)2+1=f2C12

Równanie to spełnia rodzina funkcji f(x)=C1coshtC2C1, gdzie C2 jest stałą. Stałe C1 i C2 wyznaczamy z warunków zadania, tj.

{f(a)=yaf(b)=yb czyli {C1coshaC2C1=yaC1coshbC2C1=yb

Łatwo sobie wyobrazić, że układ ten może nie mieć rozwiązania. Gdy odległość |ba| rośnie, powierzchnia powstała z obrotu krzywej f przy ustalonych promieniach ya, yb może mieć pole większe niż suma pól kół o tych promieniach, tj. większe niż π(ya2+yb2). Jeśli natomiast różnica ba nie jest zbyt duża, znajdziemy stałe C1, C2 spełniające warunki zadania. Powierzchnię powstałą z obrotu wykresu funkcji f(t)=C1coshtC2C1, atb, nazywamy katenoidą.

Przykład 15.13.

W polu grawitacyjnym znajdują się dwa punkty A oraz B. Po jakiej krzywej powinien ześlizgiwać się bez tarcia punkt materialny, aby drogę od A do B przebyć w najkrótszym czasie?

Chwila refleksji nad zadaniem przywołuje doświadczenia narciarskie i skłania do przypuszczenia, że wśród różnych tras na ośnieżonym stoku (tarcie nart zaniedbujemy), chcąc zjechać z góry jak najszybciej (co nie oznacza, że najbezpieczniej!), powinniśmy wybrać raczej taką, która jest stroma na początku, aby dobrze się rozpędzić.

Bez straty ogólności możemy przyjąć, że początek trasy znajduje się w punkcie A=(0,0), tj. w początku układu współrzędnych, którego oś pionową zwracamy na dół (czyli przeciwnie, niż zwykle). Niech B=(a,b). Jeśli punkt materialny znajdzie się w położeniu (x,y), to zgodzie z prawem zachowania energii jego energia kinetyczna będzie równa zmianie energii potencjalnej mgy pomiędzy punktem początkowym, który znajduje się na poziomie zerowym a danym punktem na poziomie y, czyli 12mv2=mgy, gdzie m jest masą punktu materialnego, a v(t)=(dxdt)2+(dydt)2 jest jego prędkością. Stąd po zmianie zmiennych v(t)=1+(dydx)2dxdt i zapisaniu równania w postaci różniczkowej vdt=1+(dydx)2dx oraz po uwzględnieniu prawa zachowania energii (v=2gy) otrzymujemy

2gydt=1+(dydx)2dx,

czyli

dtdx=1+(dydx)22gy

Stąd całkowity czas, jaki jest niezbędny, aby pokonać drogę z położenia x=0 do x=a (licząc wzdłuż osi zmiennej x), wyraża całka oznaczona

0adtdxdx=12g0a1+(dydx)2ydx

Zadanie sprowadza się więc do wyznaczenia ekstremali funkcjonału

J[y]=0a1+(dydx)2ydx,

(czynnik 12g jest stały) w zbiorze tych funkcji xy(x), które na końcach przedziału [0,a] przyjmują odpowiednio wartości y(0)=0 i y(a)=b. Zauważmy, że funkcja

Lagrange'a
(x1,x2,x3)L(x1,x2,x3)=1+x22x1
nie zależy od zmiennej x3,

stąd rozwiązanie równanie Lagrange'a-Eulera jest równoważne równaniu

L(y,y,x)yLx2(y,y,x)=Const,

gdzie Const jest dowolną stałą. Po przekształceniu równanie to przyjmie postać:

1+(y)2y1y(y)21+(y)2=C

a po sprowadzeniu do wspólnego mianownika składników po lewej stronie równości i podniesieniu do kwadratu:

1y(1+(y)2)=C2

Rozwiązanie xy(x) równania y(1+(y)2)=C2 można przedstawić w postaci parametrycznej:

{x(θ)=r(θsinθ)+C1y(θ)=r(1cosθ),

gdzie r=12C2, a C1 jest kolejną stałą. Z twierdzenia o różniczkowaniu złożenia mamy

dydx=dydt(dxdt)1=rsinθr(1cosθ)=sinθ(1cosθ),

stąd - po przekształceniach

y(1+(dydx)2)=r(1cosθ)(1+sin2θ(1cosθ)2)=2r=C2,

czyli krzywa θ(x(θ),y(θ)) spełnia równanie Lagrange'a-Eulera. Uwzględniając współrzędne początku A=(0,0), otrzymujemy C1=0. Następnie uwzględniając również koniec trasy B=(a,b), wyznaczamy wartość stałej r, a co za tym idzie również stałej C. Szczegółowe obliczenia pomijamy. Zwróćmy jednak uwagę na krzywą

{x(θ)=r(θsinθ)y(θ)=r(1cosθ),

która jest rozwiązaniem zadania brachistochrony (czyli krzywej najszybszego spadku). Krzywą tą jest łuk cykloidy łączący punkty A i B.

Przykład 15.14.[zagadnienie izoperymetryczne]

Rozważmy rodzinę krzywych klasy C1 o ustalonych końcach A=(1,0) i B=(1,0). Czy istnieje krzywa o ustalonej długości, która wraz z odcinkiem o końcach A, B ogranicza obszar o możliwie największym polu?

Zadanie sprowadza się do maksymalizowania wartości całki wyrażającej pole pod wykresem funkcji f

F(f)=11f(t)dt

przy warunku

G(f)=111+(f(t))2dt=Const,

który oznacza, że długość łuku krzywej t(t,f(t)), przy atb jest stała. Mamy więc zagadnienie polegające na

znalezieniu ekstremum warunkowego: ekstremum funkcjonału fF(f) na poziomicy funkcjonału G(f)=Const.

Korzystając z twierdzenia o funkcjonale Lagrange'a (stanowiącego ugólnienie klasycznego twierdzenia o mnożnikach Lagrange'a), można wykazać, że

Uwaga 15.15.

Jeśli funkcjonał F osiąga wartość ekstremalną przy warunku G(f)=Const, to istnieje stała λ taka, że f jest

ekstremalą funkcjonału Φ=F+λG.

W rozważanym przez nas przykładzie funkcjonał Φ ma postać:

Φ(f)=11(f+λ1+(f)2)dx

Zwróćmy uwagę,że funkcja Lagrange'a

L(x,y,t)=x+λ1+y2

określająca funkcjonał Φ nie zależy od zmiennej t, wobec tego funkcja f spełnia równanie równoważne równaniu Lagrange'a-Eulera

L(f,f,t)fLy(f,f,t)=C1,

gdzie C1 jest stałą. Dostajemy więc

f+λ1+(f)2λff1+(f)2=C1,

które po uproszczeniu (po sprowadzeniu składników do wspólnego mianownika) przyjmie postać

fC1=λ1+(f)2

lub równoważną

1+(f)2=λ2(C1f)2

Równanie to spełnia rodzina funkcji f(t)=λ2(tC2)2+C1, gdzie C2 jest kolejną stałą (przypomnijmy, że C1 jest stałą, która pojawiła się z całkowania równania Lagrange'a -Eulera). Stałe C1, C2 wyznaczymy z warunków zadania f(1)=0 oraz f(1)=0, czyli λ2(1C2)2=λ2(1C2)2, skąd C2=0, a także C1=λ21. Widzimy więc, że rozwiązaniem zagadnienia jest funkcja

f(t)=λ2t2λ21

Współrzędne punktu (t,f(t)) wykresu funkcji f spełniają równanie

t2+(f(t)+λ21)2=λ2,

czyli równanie okręgu o środku w punkcie (0,λ21) i promieniu |λ|. Rozwiązaniem problemu jest więc łuk okręgu, którego cięciwą jest dany odcinek AB. Stałą λ wyznaczymy z warunku G(f)=Const. Mamy

G(f)=111+(f)2dx=11x2+λ2x2λ2x2dx=2|λ|arcsinxλ|11=2|λ|arcsin1λ.

Stąd λ jest rozwiązaniem równania

1λ=sinConst2|λ|

Szkicując wykresy funkcji tt oraz tsin(C2t), możemy łatwo przekonać się, że dla 0C<2 jedynym rozwiązaniem równania t=sin(C2t) jest t=0. Wówczas nie znajdziemy takiej stałej λ, aby 1λ=0. Wynika to zresztą w oczywisty sposób z interpretacji geometrycznej rozważanego zagadnienia: punktów A=(1,0) oraz B=(1,0) nie da się połączyć krzywą o długości C<2. Gdy C=2, rozwiązaniem zagadnienia jest po prostu odcinek AB, który w tym przypadku ogranicza zerowe pole C=0, Gdy zaś C>2, znajdziemy rozwiązanie t0 równania t=sin(C2t) i weźmiemy λ=1t0. Na przykład dla C=π mamy t0=1, więc λ=1. }}

W ten sposób pokazaliśmy intuicyjnie oczywisty fakt, iż

Wniosek 15.16.

Wśród krzywych o ustalonych końcach A,B i tej samej długości l>AB największe pole wraz z odcinkiem AB ogranicza łuk okręgu.