Analiza matematyczna 2/Wykład 6: Ciągłość funkcji wielu zmiennych. Pochodne cząstkowe. Gradient

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Funkcje wielu zmiennych. Ciągłość. Pochodne cząstkowe

Przypominamy przykłady funkcji wielu zmiennych, które znamy z życia codziennego. Do badania przebiegu zmienności funkcji, badania ciągłości, wyznaczania ekstremów stosujemy analizę przebiegu poziomic, a następnie wprowadzamy pochodne kierunkowe i cząstkowe.

Przykłady funkcji wielu zmiennych

Prognoza pogody
Prognoza pogody

Z funkcjami dwóch zmiennych rzeczywistych spotykamy się na co dzień. Śledząc prognozę pogody po wieczornym wydaniu wiadomości w telewizji (w prasie, w internecie) sprawdzamy, jaka temperatura jest przewidywana na najbliższą noc, na kolejny poranek, popołudnie, w dniach następnych. Temperatura podawana jest przeważnie liczbowo dla kilku regionów naszego kraju albo też - w dokładniejszej formie - na mapie z zaznaczonymi izotermami, tj. liniami, które łączą punkty o takiej samej temperaturze.

Osoby podatne na zmiany ciśnienia atmosferycznego z niepokojem śledzą informacje o spodziewanym załamaniu pogody i wahaniach ciśnienia. Przypomnijmy, że linie łączące punkty o takim samym ciśnieniu atmosferycznym nazywamy izobarami.

Zagęszczenie izobar nad danym obszarem oznacza dużą prędkość wiatru w terenie: im izobary są gęstsze, tym prędkość wiatru większa. Pamiętamy, że wiatr wieje od obszaru o wyższym ciśnieniu do obszaru o niższym ciśnieniu.

Kierunek wiatru także nie jest przypadkowy: odpowiada temu kierunkowi, w którym ciśnienie spada najszybciej, co na mapie odpowiada kierunkowi, w którym izobary najbardziej zagęszczają się.

Ze względu na czytelność map z prognozą pogody, obszary zawarte między kolejnymi poziomicami koloruje się zgodnie z umową tak, że obszary, nad którymi panuje niskie ciśnienie, bądź niska temparatura, oznacza się kolorem fioletowym, ciemno niebieskim, niebieskim. Kolory jasno zielony, zielony, jasno żółty, rezerwuje się do oznaczania obszarów o przeciętnym ciśnieniu czy temperaturze, natomiast obszary o najwyższych wartościach koloruje się na żółto, pomarańczowo, czerwono. Do umowy tej przywykliśmy. Tak bowiem pokolorowana jest mapa fizyczna (mapa hipsometryczna), np. ta przedstawiająca nasz kraj.

Prognoza pogody
Prognoza pogody
Mapa hipsometryczna

Gdybyśmy powędrowali palcem po mapie z południa na północ Polski, zaczynając od Tatr, które po polskiej stronie sięgają prawie 2500 metrów nad poziom morza, wystartowalibyśmy z obszaru pokolorowanego na brązowo, intensywnie czerwono, pomarańczowo. Kierując się do Krakowa i dalej Wyżyną Krakowsko-Częstochowską, przemierzalibyśmy obszar pokolorowany na żółto. Obszar nizinny w centralnej i północnej części naszego kraju zaznaczono na zielono, z wyjątkiem pasm wzgórz na północy, np. na Kaszubach, które zaznaczono na żółto. Jeśli spojrzymy trochę na prawo od ujścia Wisły, między Tczewem a Elblągiem, zauważymy obszar ciemnozielony, którym pokolorowano obszar depresji, tj. obszar położony poniżej poziomu morza. W końcu docieramy do brzegu Bałtyku, którego poziom stanowi umowny punkt odniesienia wysokości obszaru nad poziom morza. Pamiętamy, że głębokość dna morza na mapie również została zaznaczona różnymi kolorami: od białego (którym zaznaczono płytkie obszary tuż przy brzegu i mielizny), przez niebieski, aż po ciemnoniebieski, którym zaznaczono głębsze obszary.

Wycinek mapy Tatr
Wycinek mapy Tatr

Linie na mapie, łączące punkty o samej wysokości nad poziom morza, nazywamy poziomicami.

Wędrując po górach, w zależności od upodobania, wybieramy szlak, który krótszą, ale bardziej stromą drogą doprowadzi nas do celu, bądź też szlak mniej stromy, łagodny. Każdy, kto wędrował choć raz po górach z mapą w ręku wie, że im gęściej szlak poprzecinany jest kolejnymi poziomicami, tym jest bardziej stromy i wymaga większego wysiłku fizycznego. Szlak, który przebiega między dwiema poziomicami, prawie żadnej nie przecina, jest zdecydowanie łagodniejszy, bez stromych podejść, nie wymaga wysiłku.

Na ogół szlaki turystyczne w górach omijają obszary, gdzie poziomice przebiegają bardzo gęsto, bądź wręcz urywają się. Nic dziwnego: tak na mapie zaznaczono strome zbocza i urwiska.

Zauważmy, że poziomice odpowiadające różnym wysokościom są krzywymi rozłącznymi. Na mapie, która przeważnie przedstawia pewien prostokątny (w przybliżeniu) obszar terenu, krzywe te są zamknięte lub nie. Nasze doświadczenie podpowiada nam, że wewnątrz obszaru ograniczonego poziomicą, która jest linią zamkniętą, zawsze da się wskazać punkt położony najwyżej (np. szczyt wzniesienia) lub najniżej (np. dno doliny).

W ramach Analizy matematycznej I poznaliśmy twierdzenie, które opisuje taką sytuację: funkcja ciągła na zbiorze zwartym osiąga swoje kresy. Jest to twierdzenie Weierstrassa, które pozostaje prawdziwe nie tylko w przypadku funkcji jednej zmiennej.

Mapa fizyczna danego obszaru, mapa rozkładu ciśnienia, mapa rozkładu temperatury to przykłady graficznej reprezentacji (wykresu) funkcji dwóch zmiennych rzeczywistych (długości i szerokości geograficznej) o wartościach w zbiorze liczb rzeczywistych, bowiem wysokość punktu nad poziom morza, wartość ciśnienia atmosferycznego, temperatura to wielkości liczbowe.

Granica i ciągłość funkcji wielu zmiennych

Większość pojęć i twierdzeń, którymi będziemy posługiwać się w tym module, poznaliśmy już przy okazji omawiania własności funkcji ciągłych w przestrzeniach metrycznych. Przypomnijmy parę z nich.

Niech (X,d), (Y,ρ) będą przestrzeniami metrycznymi.

Będziemy zajmowali się badaniem funkcji

f:XY.

Większość praktycznych przykładów zastosowania teorii będzie dotyczyć funkcji określonych na zbiorze n, n=2,3,, z metryką d(x,y)=xy zadaną przez pewną ustaloną normę w n, np.

xp=(|x1|p+|x2|p++|xn|p)1p, dla 1p< w szczególności x1=|x1|+|x2|++|xn|x2=|x1|2+|x2|2++|xn|2 bądź też x=max{|x1|, |x2|, , |xn|}.

Zbiorem wartości funkcji f najczęściej będzie zbiór liczb rzeczywistych z metryką zadaną przez wartość bezwzględną, tj. ρ(a,b)=|ab|.

Definicja 6.1.

Mówimy, że gY jest granicą funkcji f:XY w punkcie x będącym punktem skupienia dziedziny funkcji f, jeśli

ϵ>0δ>0:y:0<d(x,y)<δρ(g,f(y))<ϵ.

Definicja 6.2.

Mówimy, że funkcja f:XY jest ciągła w punkcie x, jeśli

ϵ>0δ>0:y:d(x,y)<δρ(f(x),f(y))<ϵ.

Pamiętamy również, że zachodzi następujące

Twierdzenie 6.3.

Niech X, Y będą przestrzeniami metrycznymi i niech f:XY będzie funkcją. Wówczas następujące warunki są równoważne:

1) funkcja f jest ciągła w punkcie aX,

2) istnieje granica limxaf(x) i jest równa wartości funkcji f(a).

Niech X, Y, Z będą przestrzeniami metrycznymi.

Twierdzenie 6.4.

Złożenie gf:XZ funkcji ciągłych f:XY i g:YZ jest funkcją ciągłą.

Twierdzenie 6.5.

Jeśli f:X oraz g:X są funkcjami ciągłymi, to suma f+g oraz iloczyn fg są funkcjami ciągłymi. Ponadto odwrotność 1g:Zx1g(x) oraz iloraz fg:Zxf(x)g(x)

są funkcjami ciągłymi na zbiorze Z:=X{xX:g(x)=0}.

Przypomnijmy jeszcze następujące twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym.

Twierdzenie 6.6.

Jeśli f:X jest funkcją ciągłą określoną na przestrzeni zwartej X, to istnieją punkty a,bX, w których funkcja f osiąga kresy: kres dolny inf{f(x),xX}=f(a) i kres górny sup{f(x),xX}=f(b).

Rozważmy przykład, który pokazuje, że zachowanie funkcji wielu zmiennych może wykraczać poza naszą intuicję ukształtowaną podczas badania funkcji jednej zmiennej.

Przykład 6.7.

Funkcja f(x,y)=xyx2+y2 określona jest we wszystkich punktach płaszczyzny 2 z wyjątkiem punktu (0,0). Wyraźmy ją we współrzędnych biegunowych

Φ:(r,φ){x(r,φ)=rcosφy(r,φ)=rsinφ

W punktach leżących poza początkiem układu współrzędnych, tj. gdy r>0, otrzymamy:

(fΦ)(r,φ)=r2cosφsinφr2(cos2φ+sin2φ)=12sin2φ.

Zauważmy, że zbiorem wartości tej funkcji jest przedział [12,12]. Ponadto funkcja (r,φ)12sin2φ nie zależy od zmiennej r. Oznacza to, że zacieśnienie funkcji f do którejkolwiek półprostej danej równaniem φ=φ0 (tj. półprostej, która tworzy z dodatnią półosią osi rzędnych ustalony kąt φ0) jest funkcją o stałej wartości 12sin2φ0, niezależnej od odległości r punktu od początku układu współrzędnych. Każde z tych zacieśnień do prostej {φ=φ0}{φ=φ0+π} ma granicę przy r0 równą 12sin2φ0. Jednak wartość ta zależy od wyboru kąta φ0, stąd nie istnieje granica funkcji (x,y)f(x,y), gdy (x,y)(0,0). Zauważmy, że gdy rozważymy osobno funkcje jednej zmiennej, ustalając drugą zmienną, tzn. y lub odpowiednio x:

fy=f(,y):xxyx2+y2fx=(x,):yxyx2+y2,

to zarówno limx0fy(x)=0, jak też limy0fx(y)=0, a więc w szczególności istnieją granice iterowane

limx0(limy0f(x,y))=0,limy0(limx0f(x,y))=0
i są równe.


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

   <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/7/74/Am2m05.0080.mgs.zip">
  <param name="scale" value="1.0 1.0 1.0">

<param name="shading" value="0.2"> </applet>

<div.thumbcaption>Wykres funkcji f(x,y)=xyx2+y2


Przykład pokazuje więc, że

Wniosek 6.8.

Z istnienia granic iterowanych

limxa(limybf(x,y))limyb(limxaf(x,y))

i równości tych granic nie wynika istnienie granicy funkcji f w punkcie (a,b).

Prawdziwa natomiast jest implikacja:

Uwaga 6.9.

Jeśli funkcja f:× ma granicę w punkcie (a,b), to istnieją obie granice iterowane

limxa(limybf(x,y))limyb(limxaf(x,y))

i są równe granicy funkcji f w punkcie (a,b).

Uwaga ta stanowi warunek konieczny istnienia granicy lim(x,y)(a,b)f(x,y). Jeśli bowiem nie istnieje któraś z granic iterowanych, bądź nie są one równe, to funkcja f nie ma granicy w punkcie (a,b). Podkreślmy jeszcze raz fakt, że istnienie i równość obu granic iterowanych nie gwarantuje istnienia granicy funkcji.

Poziomice

Niech f:X będzie funkcją określoną na przestrzeni metrycznej X o wartościach rzeczywistych.

Definicja 6.10.

Poziomicą funkcji f

odpowiadającą wartości a nazywamy zbiór
{f=a}={xX:f(x)=a},
czyli przeciwobraz zbioru jednopunktowego {a} przez funkcję f.

Często pobieżna nawet analiza przebiegu poziomic pozwala ustalić, czy dana funkcja osiąga ekstrema (zob. definicja ekstremum w module 9 Analizy matematycznej 1), czy też nie.

Przykład 6.11.

Niech f(x,y)=x2+y24.
wykres
Poziomica {f=a}={(x,y):x2+y24=a} jest okręgiem o środku w punkcie (0,0) i promieniu 4+a, gdy a>4. Poziomica {f=4} składa się tylko z jednego punktu (0,0), natomiast jeśli a<4, to poziomica {f=a} jest zbiorem pustym. Funkcja f osiąga minimum globalne w punkcie (0,0) równe f(0,0)=4.

Przykład 6.12.

Niech f(x,y)=x2y2.
wykres

Poziomica zerowa {f=0}={(x,y):x2y2=0}={x=y}{x=y} jest sumą dwóch prostych: x=y i x=y. Jeśli a0 poziomica {f=a}={x2y2=a} jest hiperbolą o asymptotach x=y i x=y. Przebieg poziomic pozwala ustalić, że funkcja f w żadnym punkcie płaszczyzny nie osiąga ekstremum, bowiem w dowolnie małym otoczeniu każdego punktu (x,y) potrafimy z łatwością wskazać punkty, w których funkcja przyjmuje zarówno wartości mniejsze jak i większe od wartości funkcji f w punkcie (x,y).

Przykład 6.13.

Niech f(x,y)=|x|+|y|.
wykres
Funkcja f jest normą w 2, przyjmuje więc wyłącznie wartości nieujemne, stąd {f=a}=, gdy a<0. Poziomica zerowa {f=0}={(0,0)} składa się tylko z jednego punktu. Gdy a>0, poziomica {f=a}={|x|+|y|=a} jest kwadratem o wierzchołkach (a,0), (0,a), (a,0), (0,a). Funkcja f osiąga minimum globalne w punkcie (0,0), gdyż f(x,y)>0 w dowolnym punkcie (x,y)(0,0). Podobnie jak w poprzednim przykładzie przebieg poziomic pozwala ustalić, że funkcja f w żadnym punkcie płaszczyzny poza punktem (0,0) nie osiąga ekstremum, bowiem w dowolnie małym otoczeniu każdego punktu (x,y)(0,0) potrafimy z łatwością wskazać punkty, w których funkcja przyjmuje zarówno wartości mniejsze jak i większe od wartości funkcji f w punkcie (x,y).

Przykład 6.14.

Niech f(x,y)=|x|23+|y|23.
wykres
Funkcja f przyjmuje wyłącznie wartości nieujemne, stąd {f=a}=, gdy a<0. Poziomica zerowa {f=0}={(0,0)} składa się tylko z jednego punktu. Gdy a>0, poziomica {f=a}={|x|23+|y|23=a} jest krzywą zawartą w kwadracie o wierzchołkach (a3,0), (0,a3), (a3,0), (0,a3). Krzywą tę nazywamy asteroidą. Zauważmy, że funkcja osiąga minimum globalne w punkcie (0,0), gdyż f(x,y)>0, w dowolnym punkcie (x,y)(0,0). Podobnie jak w poprzednich przykładach przebieg poziomic pozwala stwierdzić, że jest to jedyne ekstremum tej funkcji na płaszczyźnie 2.

Przykład 6.15.

Niech f(x,y)=xy(1xy).
Poziomicą zerową {f=0} tej funkcji jest suma trzech prostych: x=0, y=0 oraz x+y=1. Zauważmy, że w dowolnie małym otoczeniu któregokolwiek punktu leżącego na tej poziomicy znajdziemy punkty, w których funkcja osiąga zarówno wartości mniejsze jak i większe od zera. Stąd w żadnym punkcie zbioru {f=0} funkcja f nie osiąga ekstremum. Zwróćmy jednak uwagę, że wnętrze trójkąta o wierzchołkach (0,0), (1,0), (0,1) zawarte jest w zbiorze {f<0} tych punktów, w których funkcja przyjmuje wartości ujemne. W sumie mnogościowej z brzegiem trójkąta o podanych wierzchołkach zbiór ten jest zwarty. Z twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym wynika, że we wnętrzu tego trójkąta funkcja f osiąga minimum. Dalsza analiza przebiegu poziomic we wnętrzu trójkąta nie jest efektywnym narzędziem prowadzącym do precyzyjne określenia, w którym punkcie minimum to jest osiągane, ponieważ kreślenie poziomic {f=a}, gdy a0, nie jest prostym zadaniem. Warto jednak zauważyć, że żaden punkt leżący na poziomicy zerowej funkcji f nie może być jej punktem ekstremalnym, gdyż w otoczeniu któregokolwiek punktu z tej poziomicy funkcja przyjmuje zarówno wartości dodatnie jak i ujemne.


<applet code="JavaviewModApplet.class" archive="images/a/a0/Javaview.jar,images/b/be/JavaviewModApplet.jar" width="450" height="400">

  <param name="colors" value="-1:#7e0b9f -0.80:#ce3bf8 -0.60:#2c4ae5 -0.40:#2c85e5 -0.20:#2ecca9 -0.05:#2ecc5b 0.05:#2ecc5b 0.20:#97cc2e 0.40:#edff27 0.60:#ffba27 0.80:#ff6e27 1:#d42525">
   <param name="coloring" value="maple">
   <param name="model" value="images/6/65/Am2m05.0130.mgs.zip">
   <param name="scale" value="1.0 1.0 0.1">

<param name="shading" value="0.2"> </applet>

<div.thumbcaption>Wykres funkcji f(x,y)=xy(1xy)


Kartezjusz (1596-1650)
Zobacz biografię

Przykład 6.16.

Niech f(x,y)=x3+y33xy.
wykres

Poziomicą zerową {f=0} tej funkcji jest nieograniczona krzywa, którą nazywamy liściem Kartezjusza. Krzywa ta ma asymptotę o równaniu x+y+1=0. W pierwszej ćwiartce {(x,y)2:x0,y0} tworzy petlę ograniczającą obszar, we wnętrzu którego funkcja f przyjmuje wartości ujemne. Podobnie jak w poprzednim przykładzie, z twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym wynika, że we wnętrzu pętli liścia Kartezjusza funkcja f osiąga minimum. Dalsza analiza przebiegu poziomic nie prowadzi efektywnie do precyzyjne określenia, w którym punkcie minimum to jest osiągane. Warto jednak zauważyć, że w żadnym z punktów liścia Kartezjusza funkcja f nie może osiągać ekstremum, gdyż w dowolnie małym otoczeniu któregokolwiek punktu tej krzywej funkcja f osiąga wartości dodatnie jak i ujemne.

Przykład 6.17.

Niech f(x,y)=(x2+y2)22(x2y2).
wykres

Jakob Bernoulli (1654-1705)
Zobacz biografię

Poziomicą zerową {f=0} tej funkcji jest krzywa, zwana lemniskatą Bernoullego. Przebieg lemniskaty {f=0} najwygodniej zbadać we współrzędnych biegunowych:

(x2+y2)2=2(x2y2)(r2cos2φ+r2sin2φ)2=2(r2cos2φr2sin2φ)r4=2r2cos2φr=0 lub r=2cos2φ,

przy czym wyrażenie pod znakiem pierwiastka jest nieujemne dla φ[π4,π4][3π4,5π4]. Lemniskata Bernoullego jest więc zawarta w części wspólnej koła o promieniu 2 i dwóch obszarów wyciętych z płaszczyzny półprostymi tworzącymi z osią rzędnych kąty π4, π4, 3π4,3π4. Zauważmy, że we wnętrzu obszaru ograniczonego lemniskatą Bernoullego funkcja f osiąga wartości ujemne. Na zewnątrz zaś - dodatnie. Podobnie jak w obu poprzednich przykładach twierdzenie Weierstrassa gwarantuje istnienie minimum lokalnego w obszarze {(x,y):f(x,y)0} ograniczonym lemniskatą Bernoullego. Z kolei w dowolnie małym otoczeniu każdego punktu poziomicy zerowej {f=0} funkcja przyjmuje zarówno wartości dodatnie jak i ujemne. Funkcja f nie osiąga więc ekstremum w żadnym punkcie należącym do swojej poziomicy zerowej.

Trzy ostatnie przykłady każą nam szukać doskonalszego narzędzia do precyzyjnego lokalizownia punktów ekstremalnych funkcji wielu zmiennych, gdy analiza przebiegu poziomic jest niewystarczająca. Tym narzędziem są

Pochodna kierunkowa i pochodne cząstkowe

Niech AX będzie otwartym podzbiorem przestrzeni unormowanej X. Niech v0,vX będzie ustalonym niezerowym wektorem tej przestrzeni.

Definicja 6.18.

Mówimy, że funkcja f:A ma w punkcie a pochodną kierunkową w kierunku wektora v, jeśli

istnieje granica ilorazu różnicowego:
limh0f(a+hv)f(a)h.

Granicę tę oznaczamy symbolem vf(a) i nazywamy pochodną kierunkową funkcji f w kierunku wektora v w punkcie a.

Zwróćmy uwagę, że zbiór {a+tv,t} jest prostą przechodzącą przez punkt a równoległą do wektora v. Stąd pochodna vf(a) jest w istocie pochodną w punkcie t=0 funkcji jednej zmiennej rzeczywistej tf(a+tv), czyli restrykcji funkcji f do podzbioru otwartego A{a+tv,t} rozważanej prostej {a+tv,t}. Wobec tego możemy powtórzyć jednowymiarowy warunek konieczny istnienia ekstremum w punkcie, w którym istnieje pochodna kierunkowa funkcji (zob. moduł 9, Analiza matematyczna I).

Twierdzenie 6.19.

Niech AX będzie otwartym podzbiorem przestrzeni unormowanej X i niech vX, v0. Jeśli funkcja f:A osiąga ekstremum w punkcie aA i istnieje pochodna kierunkowa vf(a), to

pochodna ta zeruje się.

Dowód 6.19.

Jeśli funkcja Axf(x) osiąga maksimum (odpowiednio: minimum) w punkcie a, to funkcja jednej zmiennej tf(a+tv) osiąga maksimum (odpowiednio: minimum) w punkcie t=0. Z warunku koniecznego istnienia ekstremum funkcji jednej zmiennej wynika, że pochodna (o ile istnieje) funkcji

tf(a+tv) zeruje się w punkcie t=0. Stąd vf(a)=0

O ile w przypadku funkcji określonej na otwartym przedziale prostej sytuacja jest oczywista (na prostej mamy tylko jeden kierunek), o tyle już w przypadku funkcji dwóch zmiennych (na płaszczyźnie można wskazać nieskończenie wiele kierunków!) powstaje pytanie o liczbę kierunków, które należy ustalić, aby rozwiązać praktyczny problem lokalizacji punktów ekstremalnych danej funkcji. Warto zauważyć, że w przypadku funkcji określonej na n wymiarowej przestrzeni unormowanej X nie ma potrzeby rozważać pochodnych kierunkowych w kierunku wektorów liniowo zależnych, a więc większej niż wynosi wymiar przestrzeni. Wyróżnijmy wobec tego pochodne kierunkowe w kierunku wektorów bazowych.

Niech X=n i niech e1=(1,0,0,,0), e2=(0,1,0,,0), ..., en=(0,0,0,,1) będzie bazą kanoniczną tej przestrzeni. Niech A będzie otwartym podzbiorem przestrzeni n.

Definicja 6.20.

Pochodne kierunkowe (o ile istnieją) e1f(a), e2f(a), ..., enf(a) funkcji f:A w kierunku wektorów bazy {e1,e2,,en} nazywamy pochodnymi cząstkowymi funkcji f w punkcie a. Pochodną cząstkową funkcji (x1,x2,,xn)f(x1,x2,,xn) w kierunku wektora

ei oznaczamy tradycyjnie symbolem:
fxi(a), xif(a), fxi(a) lub  f'xi(a).

W przypadku, gdy nie numerujemy współrzędnych argumentu funkcji (x,y,z)f(x,y,z) pochodne cząstkowe oznaczamy symbolami

fx(a),fy(a),fz(a).

Przeformułujmy warunek konieczny istnienia ekstremum funkcji określonej na zbiorze otwartym An.

Twierdzenie 6.21.

Jeśli funkcja f:A osiąga ekstremum w punkcie aA, w którym istnieją pochodne cząstkowe xkf(a), k{1,2,,n}, to pochodne te zerują się w tym punkcie, tj.

k{1,2,,n}:xkf(a)=0.

Zwróćmy uwagę, że twierdzenie podaje jedynie warunek konieczny istnienia ekstremum. Punkt a, który spełnia układ równań:

{fx1(a)=0fx2(a)=0fxn(a)=0

nie musi być punktem ekstremalnym funkcji f.

Wróćmy do przykładów, w których stwierdziliśmy potrzebę znalezienia dokładniejszego narzędzia do lokalizacji ekstremów.

Przykład 6.22.

Z przebiegu poziomicy zerowej funkcji f(x,y)=xy(1xy) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz trójkąta o wierzchołkach (0,0), (1,0), (0,1). Rozwiązując układ dwóch równań

{fx=0fy=0   {y2xyy2=0xx22xy=0.

otrzymujemy układ

{y=0 lub 12xy=0x=0 lub 1x2y=0,

który spełniają współrzędne czterech punktów P1=(0,0), P2=(1,0), P3=(0,1), P4=(13,13). Jedynym punktem z wnętrza wskazanego trójkąta jest punkt P4, w którym funkcja f osiąga minimum równe f(P4)=127. Pozostałe punkty P1, P2, P3 leżą na poziomicy zerowej funkcji f, która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji f (zob. przykład 6.15.).

Przykład 6.23.

Z przebiegu poziomicy zerowej funkcji f(x,y)=x3+y33xy wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz pętli liścia Kartezjusza. Rozwiązując układ dwóch równań

{fx=0fy=0   {3x23y=03y23x=0.

otrzymujemy układ

{y=0 lub y=1x=y2,

który spełniają współrzędne dwóch punktów P1=(0,0), P2=(1,1). Jedynym punktem z wnętrza obszaru ograniczonego przez pętlę liścia Kartezjusza jest punkt P2, w którym funkcja f osiąga minimum równe f(P2)=1. Punkt P1 leży na poziomicy zerowej funkcji f, która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji f (zob. przykład 6.16.).

Przykład 6.24.

Podobnie jak w obu poprzednich przykładach z przebiegu poziomicy zerowej funkcji f(x,y)=(x2+y2)22(x2y2) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz obszaru ograniczonego lemniskatą Bernoullego. Rozwiązując układ dwóch równań

{fx=0fy=0   {2(x2+y2)2x4x=02(x2+y2)2y+4y=0.

otrzymujemy układ

{x=0 lub x2+y21=0y=0 lub x2+y2+1=0,

który spełniają współrzędne trzech punktów P1=(0,0), P2=(1,0), P3=(1,0). We wnętrzu obszaru ograniczonego lemniskatą Bernoullego leżą punkty P2 i P3, w których funkcja f osiąga minima równe f(P2)=f(P3)=1. Punkt P1 leży na poziomicy zerowej funkcji f, która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji f (zobacz przykład 6.17.).

Pochodne cząstkowe wyższych rzędów

Rozważmy funkcję fxi, która punktowi xU przyporządkowuje pochodną cząstkową funkcji f po zmiennej xi w punkcie a, czyli funkcję

fxi:Uafxi(a).

Definicja 6.25.

Jeśli w punkcie aU istnieje pochodna cząstkowa funkcji fxi po zmiennej xj, to mówimy, że funkcja f ma pochodną cząstkową rzędu drugiego po zmiennych xi oraz xj. Pochodną tę oznaczamy symbolem xjxif(a), bądź krótko 2xjxif(a) lub 2f(a)xjxi. Gdy i=j

piszemy 2f(a)xi2 zamiast 2f(a)xixi.
Uwaga 6.26.

Jeśli f:n(x,y,z,,t)f(x,y,z,,t) jest funkcją n zmiennych, to często zamiast pisać

2f(a)x2, 2f(a)xy, 2f(a)xz,

piszemy

fxx(a), fxy(a), fxz(a),,

bądź

f'xx(a), f'xy(a), f'xz(a),

Powstaje naturalne pytanie, czy zachodzi równość między pochodnymi xjxif(a) oraz xixjf(a), jeśli obie istnieją.

Zanim sformułujemy twierdzenie, które stanowi pozytywną odpowiedź na pytanie, rozważmy następujący

Przykład 6.27.

Funkcja
f(x,y)={xy(x2y2)x2+y2, gdy (x,y)(0,0)0, gdy (x,y)=(0,0).
ma w punkcie (0,0) obie pochodne cząstkowe mieszane xyf(0,0) oraz yxf(0,0), lecz są one różne. A mianowice xyf(0,0)=1, podczas gdy yxf(0,0)=1.

Okazuje się jednak, że wystarczy przyjąć naturalne założenie o ciągłości pochodnych cząstkowych mieszanych xyf oraz yxf w otoczeniu punktu a, aby mieć gwarancję ich równości w danym punkcie.

Uwaga 6.28.

Jeśli f:nUxf(x) jest funkcją, która w punkcie aU ma ciągłe

pochodne cząstkowe xjxif oraz xixjf, to w punkcie a są one równe, tj.
xjxif(a)=xixjf(a)

Dowód uwagi pomijamy (można go znaleźć np. w podręczniku Ryszarda Rudnickiego Wykłady z analizy matematycznej, Wydawnictwo Naukowe PWN, Warszawa 2001).

W podobny sposób definiujemy pochodne cząstkowe wyższych rzędów. Wprowadźmy wygodne oznaczenie pochodnych cząstkowych za pomocą wielowskaźników α=(α1,α2,,αn)0n. Niech f:nU będzie funkcją określoną na zbiorze otwartym U.

Oznaczmy symbolem αixiαi operację, która funkcji f przypisuje pochodną cząstkową rzędu αi po zmiennej xi, o ile ta pochodna istnieje.

Definicja 6.29.

Załóżmy, że istnieją kolejno pochodne cząstkowe

αnxnαn(α2x2α2(α1x1α1f))(a)

i nie zależą od kolejności różniczkowania. Mówimy wówczas, że funkcja f ma pochodną

cząstkową
|α|f(a)xα:=αnxnαn(α2x2α2(α1xiα1f))(a)

rzędu |α|=α1+α2++αn w punkcie a. Pochodną tę notujemy też często symbolem Dαf(a).

Pochodne cząstkowe w fizyce. Elementy teorii pola

Niech f:D będzie funkcją określoną na pewnym zbiorze otwartym Dn. Załóżmy, że w pewnym punkcie aD istnieją pochodne cząstkowe fx1(a),fx2(a),,fxn(a).

Definicja 6.30.

Wektor gradf(a)=(fx1(a),fx2(a),,fxn(a))n nazywamy gradientem funkcji f w punkcie a. Wektor ten oznaczamy też często symbolem nabla: f(a). Punkt a, w którym wyznaczamy gradient funkcji f, zapisujemy czasem w formie indeksu dolnego: gradaf, af.

Uwaga 6.31.

Jeśli funkcje f,g:nD mają w punkcie aD pochodne cząstkowe fxi(a), gxi(a), i=1,2,,n, to

a) grad(f+g)(a)=gradf(a)+gradg(a),

b) grad(fg)(a)=g(a)gradf(a)+f(a)gradg(a).

Dowód 6.31.

Korzystając z twierdzenia o pochodnej sumy i iloczynu funkcji f,g, wyznaczamy kolejne współrzędne wektorów grad(f+g)(a) oraz grad(fg)(a):

xi(f+g)(a)=xif(a)+xig(a)

oraz

xi(fg)(a)=g(a)xif(a)+f(a)xig(a),

gdy i=1,2,,n. Stąd otrzymujemy równości a) oraz b).

W ramach następnego modułu wykażemy, że

Uwaga 6.32.
Pochodna kierunkowa w kierunku gradientu jest największa.

W fizyce funkcję f:3 o wartościach liczbowych nazywa się funkcją skalarną, natomiast funkcję F:33 nazywa się polem (wektorowym). Przykładem funkcji skalarnych są np. temperatura, potencjał pola grawitacyjnego. Przykładem pola, które znamy ze szkoły, jest pole grawitacyjne. Jeśli w początku układu współrzędnych w przestrzeni 3 znajduje się punkt materialny o masie M, to - zgodnie z prawem powszechnego ciążenia Newtona - na dowolny inny punkt materialny położony w punkcie r=(x,y,z) o masie m działa siła F=(Fx,Fy,Fz), której składowe wynoszą:

Fx(r)=kxr3,Fy(r)=kyr3,Fz(r)=kzr3,

gdzie k=GmM jest iloczynem mas obu punktów materialnych i stałej grawitacji

G=6,67259...1011Nm2kg2,

natomiast r=r2=(x,y,z)2=x2+y2+z2 jest odległością obu punktów. Zwróćmy uwagę, że

F(r)=kr3r,

stąd

F(r)2=kr3r2=kr3r=kr2

siła ta jest odwrotnie proporcjonalna do kwadratu odległości obu punktów materialnych.

Definicja 6.33.

Pole wektorowe F:3D3 nazywamy polem potencjalnym, jeśli istnieje funkcja skalarna U:D taka, że gradU(a)=F(a) w dowolnym punkcie a zbioru otwartego D3.

Funkcję U nazywamy wówczas potencjałem pola wektorowego F.
Uwaga 6.34.

Pole grawitacyjne F(r)=kr3r jest polem potencjalnym. Potencjałem tego pola jest funkcja skalarna U(r)=kr, gdzie (jak powyżej) r=(x,y,z)

oraz r=r2=x2+y2+z2.

Dowód 6.34.

Policzmy pochodne cząstkowe funkcji U(x,y,z)=kx2+y2+z2=kr określonej w zbiorze otwartym D=3{0}, czyli wszędzie w przestrzeni 3 poza początkiem układu współrzędnych. Mamy

xU(r)=xkr=kr2rx=kr22x2r=kr3xyU(r)=ykr=kr2ry=kr22y2r=kr3yzU(r)=zkr=kr2rz=kr22z2r=kr3z,

czyli

gradU(r)=gradU(x,y,z)=(kr3x,kr3y,kr3z)=kr3(x,y,z)=kr3r=F(r).

Definicja 6.35.

Dywergencją pola wektorowego F=(Fx,Fy,Fz):3D3 w punkcie aD nazywamy liczbę

divF(a)=Fxx(a)+Fyy(a)+Fzz(a),

o ile istnieją pochodne cząstkowe Fxx(a),Fyy(a), Fzz(a). Jeśli w dowolnym punkcie aD dywergencja divF(a)=0, to pole wektorowe F nazywamy polem bezźródłowym.

Uwaga 6.36.
Pole grawitacyjne F(r)=kr3r jest polem bezźródłowym w 3{0}.

Dowód 6.36.

W dowolnym punkcie r=(x,y,z)0 mamy

Fxx(r)=x(kr3x)=k(xx1r3+xx1r3)=k(1r3+x(3)r4rx)=k(1r33x2r5)
i podobnie
Fyy(r)=k(1r33y2r5) oraz Fzz(r)=k(1r33z2r5).

Stąd

divF(r)=Fxx(r)+Fyy(r)+Fzz(r)=k(1r33x2r5)k(1r33y2r5)k(1r33z2r5)=k(3r33(x2+y2+z2)r5)=k(3r33r2r5)=0.

Definicja 6.37.

Rotacją pola wektorowego F=(Fx,Fy,Fz):3D3 w punkcie aD

nazywamy wektor
rotF(a)=(Fzy(a)Fyz(a), Fxz(a)Fzx(a),Fyx(a)Fxy(a)).

Wektor ten oznaczamy też czasem symbolem ×F(a). Jeśli w każdym punkcie aD rotacja rotF(a)=0, to pole wektorowe F nazywamy bezwirowym.

Uwaga 6.38.
Pole grawitacyjne F(r)=kr3r jest polem bezwirowym w 3{0}.

Dowód 6.38.

W dowolnym punkcie r=(x,y,z)0 mamy

yFz(r)=y(k1r3z)=kzy(1r3)=kz(3)r4ry=3kzyr5=zy3kr5

oraz podobnie

zFy(r)=yz3kr5

Pierwsza współrzędna wektora rotacji jest więc równa zeru, gdyż

Fzy(r)Fyz(r)=zy3kr5yz3kr5=0.

W ten sam sposób sprawdzamy, że również druga i trzecia współrzędna wektora rotacji zerują się:

Fxz(r)Fzx(r)=xz3kr5zx3kr5=0Fyx(r)Fxy(r)=yx3kr5xy3kr5=0.

Stąd rotF(r)=0, dla r0.