Analiza matematyczna 1/Wykład 9: Pochodna funkcji jednej zmiennej

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Pochodna funkcji jednej zmiennej

Definiujemy pochodną funkcji i podajemy jej interpretację fizyczną i geometryczną. Wyznaczamy pochodne funkcji elementarnych. Wykazujemy podstawowe własności funkcji różniczkowalnych, w tym twierdzenie Rolle'a, Cauchy'ego i twierdzenie Lagrange'a o wartości średniej. Związek znaku pochodnej z monotonicznością funkcji pozwala na sformułowanie warunku koniecznego i wystarczającego istnienia ekstremum.

Pochodna: interpretacja fizyczna i geometryczna

Z pojęciem pochodnej zetknęliśmy się po raz pierwszy w szkole na lekcjach fizyki. Wyznaczając prędkość średnią pewnego obiektu poruszającego się po prostej, dzielimy drogę, jaką przebył w określonym czasie, przez długość tego odcinka czasu:

vśrednia=ΔxΔt

gdzie Δx=x(t2)x(t1) oznacza drogę, jaką obserwowany obiekt przebył w czasie Δt:=t2t1. Następnie spostrzegliśmy, że pomiar prędkości jest tym lepszy i bardziej adekwatny do stanu obiektu w określonej chwili, im odcinek czasu Δt pomiędzy kolejnymi chwilami t1 a t2 jest krótszy. Granicę ilorazu

limΔt0x(t1+Δt)x(t1)Δt przy Δt0


nazywamy prędkością chwilową lub - krótko - prędkością obiektu w chwili t1 i tradycyjnie oznaczamy symbolem v(t1) lub

dxdt(t1),  ddtx(t1),  x(t1),  x˙(t1).

to ostatnie oznaczenie pochodnej jest często stosowane w równaniach różniczkowych.

Niech f:(a,b) będzie dowolną funkcją o wartościach rzeczywistych określoną w przedziale otwartym (a,b).

Plik:Am1w09.0005animacja.mp4
Styczna (na czerwono) jest granicznym polozeniem siecznej (na zielono)

Definicja 9.1.

Mówimy, że funkcja f jest różniczkowalna w punkcie x0(a,b), jeśli istnieje granica ilorazu różnicowego

limh0f(x0+h)f(x0)h.

Granicę tę - jeśli istnieje - nazywamy pochodną funkcji f w punkcie x0 i oznaczamy symbolem: f(x0) lub dfdx(x0). Funkcję xf(x), która argumentowi x przyporządkowuje wartość pochodnej f(x) funkcji f w punkcie x nazywamy funkcją pochodną funkcji f lub - krótko - pochodną funkcji f.

Zwróćmy uwagę, że dziedzina pochodnej xf(x) jest zawsze podzbiorem dziedziny funkcji xf(x).

Uwaga 9.2.

Jeśli funkcja f jest różniczkowalna w punkcie x0(a,b), to jest w tym punkcie ciągła. Skoro iloraz różnicowy f(x0+h)f(x0)h ma granicę przy h0, to licznik f(x0+h)f(x0) musi zmierzać do zera, stąd f jest

ciągła w punkcie x0.

Implikacja odwrotna nie jest prawdziwa.

Przykład 9.3.

Rozważmy funkcję f(x)=|x| określoną na . Funkcja ta jest ciągła w każdym punkcie x. Natomiast nie jest różniczkowalna w jednym punkcie - w punkcie x=0, gdyż



Parser nie mógł rozpoznać (błąd składni): {\displaystyle \lim_{h\to 0}\frac{|x+h|-|x|}{h}=\left\{\begin{align} 1, \text{ dla }x>0 \\-1, \text{ dla }x<0 \end{align} \right} .



Funkcja f(x)=|x| jest więc różniczkowalna w każdym punkcie zbioru liczb rzeczywistych z wyjątkiem punktu x=0, gdyż nie istnieje granica ilorazu |0+h||0|h przy h0. W pozostałych punktach x0 mamy f(x)=sgnx, gdzie

sgnx=x|x|={1, dla x>01, dla x<0.


oznacza funkcję signum (znak liczby). Dziedzina pochodnej f jest podzbiorem właściwym dziedziny funkcji f(x)=|x|,tj. domfdomf (to znaczy: domfdomf i domfdomf).


Plik:Am1w09.0010.svg
Wykres sumy czesciowej szeregu definiujacego funkcje g
w przykładzie 9.4

Zwróćmy uwagę, że iloraz różnicowy

f(x0+h)f(x0)h

jest równy współczynnikowi kierunkowemu siecznej wykresu funkcji f przechodzącej przez punkty (x0,f(x0)) oraz (x0+h,f(x0+h)), jest równy tangensowi kąta, jaki sieczna ta tworzy z osią rzędnych. Gdy h zmierza do zera, punkt (x0+h,f(x0+h)) zbliża się do punktu (x0,f(x0)). Jeśli istnieje pochodna f(x0), to prostą o równaniu

yf(x0)=f(x0)(xx0),

będącą granicznym położeniem siecznych przechodzących przez punkty (x0,f(x0)) oraz (x0+h,f(x0+h)), nazywamy styczną do wykresu funkcji f w punkcie (x0,f(x0)). Pochodna f(x0) jest więc współczynnikiem kierunkowym stycznej do wykresu funkcji f w punkcie (x0,f(x0)).

Nietrudno podać przykład funkcji ciągłej, która nie jest różniczkowalna w skończonej liczbie punktów, np. w punktach x1,x2,,xn. Wystarczy bowiem rozważyć np. sumę

f(x)=c1|xx1|+c2|xx2|++cn|xxn|,

gdzie c1,c2,,cn są stałymi różnymi od zera. Pochodna

f(x)=c1sgn(xx1)+c2sgn(xx2)++cnsgn(xxn)

istnieje w każdym punkcie zbioru {x1,x2,,xn}, czyli wszędzie poza zbiorem {x1,x2,,xn}.

Skonstruujmy funkcję, która jest ciągła i nie jest różniczkowalna w żadnym punkcie zbioru liczb rzeczywistych.

Przykład 9.4.

Rozważmy wpierw funkcję xf(x)=arcsin(cosx). Pamiętamy (zob. ćwiczenia do modułu drugiego), że funkcja ta jest określona na , parzysta, okresowa o okresie 2π, przy czym dla πxπ zachodzi równość arcsin(cosx)=π2|x|. Można wykazać, że funkcja określona za pomocą nieskończonego szeregu



g(x)=k=0f(4kx)3k=f(x)+f(4x)3+f(16x)9+f(64x)27+f(256x)81+



jest określona na , parzysta i okresowa o okresie 2π, ciągła w każdym punkcie swojej dziedziny i nie jest różniczkowalna w żadnym punkcie zbioru .

Twierdzenia o pochodnych. Pochodne funkcji elementarnych

W praktyce większość funkcji elementarnych, którymi posługujemy się, jest różniczkowalna. Wyznaczmy pochodne kilku z nich, posługując się definicją i znanymi wzorami.

Przykład 9.5.

a) Funkcja stała xc określona w przedziale (a,b) jest różniczkowalna w każdym punkcie tego przedziału i ma pochodną równą zeru, gdyż iloraz różnicowy cch, będąc stale równy zeru, zmierza do zera.

b) Jeśli c jest stałą i istnieje f(x), to istnieje pochodna iloczynu (cf)(x)=cf(x) (innymi słowy: stałą można wyłączyć przed znak pochodnej). Mamy bowiem

cf(x+h)cf(x)h=cf(x+h)f(x)hcf(x), przy h0.

c) Jednomian f(x)=xn jest różniczkowalny w każdym punkcie x i f(x)=nxn1. Na mocy wzoru dwumianowego Newtona mamy bowiem

(x+h)nxnh=(n1)xn1+(n2)xn2h+(n3)x3h2++(nn1)xhn2+(nn)hn1nxn1+0+0++0+0, gdy h0.

d) Funkcja xsinx jest różniczkowalna w każdym punkcie x, ponieważ iloraz różnicowy

sin(x+h)sinxh=2sinx+hx2cosx+h+x2h=cos(x+h2)sinh2h2
zmierza do cosx, gdyż sinh2h21 oraz cos(x+h2)cosx przy h0.

e) Funkcja xcosx jest różniczkowalna w każdym punkciex, ponieważ iloraz różnicowy

cos(x+h)cosxh=2sinx+hx2sinx+h+x2h=sin(x+h2)sinh2h2
zmierza do sinx, gdyż sinh2h21 oraz sin(x+h2)sinx przy h0.

Zwróćmy uwagę, że dotychczas nie podaliśmy precyzyjnych definicji funkcji sinus oraz cosinus, bazując na własnościach tych funkcji, poznanych w szkole w oparciu o własności liczb sinφ, cosφ, gdy φ jest kątem trójkąta. W szczególności skorzystaliśmy ze znanego faktu, że istnieje granica limφ0sinφφ=1. Formalnie istnienie tej granicy należy wykazać po podaniu definicji funkcji sinus.

Wykażemy teraz szereg prostych uwag, pozwalających efektywnie wyznaczać pochodną.

Twierdzenie 9.6.

Niech f,g będą funkcjami określonymi na przedziale otwartym (a,b). Niech x(a,b). Jeśli istnieją pochodne f(x) oraz g(x), to

a)(f+g)(x)=f(x)+g(x),b)(fg)(x)=f(x)g(x)+f(x)g(x),c)(1g)(x)=g(x)g2(x), o ile g(x)0,d)(fg)(x)=f(x)g(x)f(x)g(x)g2(x), o ile g(x)0.

Dowód 9.6.

a) Wobec założenia o istnieniu f(x) oraz g(x) iloraz różnicowy

(f+g)(x+h)(f+g)(x)h=(f)(x+h)(f)(x)h+(g)(x+h)(g)(x)h

- na mocy twierdzenia o granicy sumy - ma granicę i jest ona równa f(x)+g(x).

b) Funkcja g jest ciągła w punkcie x, gdyż jest w tym punkcie różniczkowalna, więc limh0g(x+h)=g(x). Wobec istnienia pochodnych f(x0) oraz g(x0) iloraz różnicowy

(fg)(x+h)(fg)(x)h=f(x+h)f(x)hg(x+h)+f(x)g(x+h)g(x)h

zmierza przy t0 do granicy f(x)g(x)+f(x)g(x).

c) Jeśli tylko g(x)0, to - wobec ciągłości funkcji g w punkcie x i istnienia g(x) - iloraz różnicowy

1g(x+h)1g(x)h=g(x+h)g(x)h1g(x+h)g(x)
zmierza do granicy g(x)g2(x) przy h0.

d) Zauważmy, że fg=f1g. Na podstawie wykazanego już twierdzenia o pochodnej iloczynu i pochodnej odwrotności istnieje pochodna

(f1g)(x)=f(x)1g(x)+f(x)(1g)(x)=f(x)g(x)f(x)g(x)g2(x)=f(x)g(x)f(x)g(x)g2(x).


Zastosujmy powyższe twierdzenie do wyznaczenia pochodnych kolejnych funkcji elementarnych.

Przykład 9.7.

a) Pamiętając, że tangens jest ilorazem sinusa i cosinusa, możemy łatwo wyznaczyć pochodną funkcji tangens:

(tgx)=(sinxcosx)=cosxcosxsinx(sinx)cos2x=1cos2x=1+tg2x.

b) W podobny sposób wyznaczamy pochodną funkcji cotangens:

(ctgx)=(cosxsinx)=sinxsinxcosxcosxsin2x=1sin2x=1ctg2x.

c) Niech w(x)=a0+a1x+a2x2++anxn będzie funkcją wielomianową. Na mocy uwagi o pochodnej jednomianu i twierdzenia o pochodnej sumy w każdym punkcie zbioru istnieje pochodna

w(x)=a1+2a2x+3a3x2++nanxn1.

Niech f:(a,b) i g:Y będą funkcjami takimi, że zbiór Y zawiera obraz przedziału (a,b) przez funkcję f.

Twierdzenie 9.8.

Jeśli istnieje pochodna f(x0) i istnieje pochodna g(y0), gdzie y0=f(x0), to istnieje pochodna złożenia (gf)(x0) i jest równa iloczynowi pochodnych, tzn. (gf)(x0)=g(y0)f(x0).

Dowód 9.8.

Niech y1=f(x1), gdzie x1(a,b). Wobec ciągłości funkcji f w punkcie x0 mamy zbieżność y1y0, gdy x1x0. Iloraz różnicowy

g(f(x1))g(f(x0))x1x0=g(y1)g(y0)y1y0f(x1)f(x0)x1x0
zmierza więc do

g(y0)f(x0) przy x1x0, gdyż f(x1)f(x0)x1x0f(x0), gdy x1x0, zaś g(y1)g(y0)y1y0g(y0), gdy y1y0.


Twierdzenie 9.9.

Niech g będzie funkcją odwrotną do funkcji f:(a,b). Niech x0(a,b). Jeśli istnieje pochodna f(x0)0, to funkcja g jest różniczkowalna w punkcie y0=f(x0) i zachodzi równość:

g(y0)=1f(x0).

Dowód 9.9.

Niech x0,x(a,b) i niech y0=f(x0), y=f(x). Funkcja f jest ciągła w punkcie x0, gdyż jest w tym punkcie różniczkowalna, więc yy0, gdy xx0. Stąd istnieje granica ilorazu różnicowego

g(y0)g(y)y0y=x0xf(x0)f(x)=1f(x0)f(x)x0x1f(x0), gdy xx0.


Przykład 9.10.

Funkcja xarctgx jest odwrotna do funkcji xtgx, stąd - na mocy twierdzenia o pochodnej funkcji odwrotnej - mamy

ddxarctgx=1ddytgy=11+tg2y=11+tg2(arctgx)=11+x2.

Pochodne funkcji określonych za pomocą szeregów potęgowych

Augustin Louis Cauchy (1789-1857)
Zobacz biografię

Naturalnym uogólnieniem wielomianu (sumy skończonej ilości jednomianów) jest szereg potęgowy


n=0an(xx0)n=a0+a1(xx0)+a2(xx0)2+a3(xx0)3++an(xxn)n+



o środku w punkcie x0 i współczynnikach an. Własności szeregów potęgowych omówimy szerzej w ramach analizy matematycznej 2, pomijamy więc w tej chwili szczegółowe dowody. Aby uprościć wypowiedzi potrzebnych twierdzeń, zakładamy, że istnieje granica limn|an|n[0,] (tj. skończona lub równa ).

Korzystając z kryterium Cauchy'ego zbieżności szeregów, można wykazać

Twierdzenie 9.11. [twierdzenie Cauchy'ego-Hadamarda]

Szereg potęgowy n=0an(xx0)n jest zbieżny w przedziale otwartym (x0R,x0+R), gdzie 1R=limn|an|n.

Jeśli limn|an|n=0, przyjmujemy R=;
jeśli zaś limn|an|n=, przyjmujemy R=0.

Liczbę R nazywamy promieniem zbieżności szeregu potęgowego.

Można wykazać następujące

Twierdzenie 9.12.

Funkcja f(x)=n=0an(xx0)n jest różniczkowalna w każdym punkcie przedziału otwartego (x0R,x0+R), gdzie R jest promieniem zbieżności szeregu potęgowego. Pochodną tej funkcji wyraża szereg potęgowy

f(x)=n=1nan(xx0)n1,|xx0|<R.

Innymi słowy: szereg potęgowy można różniczkować wewnątrz przedziału, w którym jest zbieżny, a jego pochodną jest szereg pochodnych jego składników.

Zastosujmy twierdzenie o różniczkowaniu szeregu potęgowego do wyznaczenia pochodnej funkcji wykładniczej expx oraz funkcji sinus i cosinus, które definiuje się za pomocą szeregów potęgowych.

Wniosek 9.13.

Funkcje

xexpx=n=0xnn!=1+x+x22!+x33!+x44!+x55!+xsinx=k=0(1)kx2k+1(2k+1)!=0+x+0x33!+0+x55!+xcosx=k=0(1)kx2k(2k)!=1+0x22!+0+x44!+0

są różniczkowalne w każdym punkcie x, przy czym

(expx)=expx,(sinx)=cosx,(cosx)=sinx.

Dowód 9.13.

Promień zbieżności każdego z powyższych szeregów definiujących odpowiednio funkcje exp sinus i cosinus równy jest nieskończoności, ponieważ limnn!n=. Aby przekonać się o tym, możemy na przykład zastosować oszacowanie

(n3)nn!(n2)n, dla n6,
z którego mamy
n3n!nn2.

Na mocy twierdzenia o trzech ciągach istnieje więc granica limnn!n=.

Stąd w całym przedziale (,) możemy stosować twierdzenie o różniczkowaniu szeregu potęgowego i mamy

(expx)=n=1nxn1n!=n=1xn1(n1)!  (podstawiamyk:=n1)=k=0xkk!=expx.
W podobny sposób dowodzimy dwóch pozostałych równości: (sinx)=cosx oraz (cosx)=sinx.


Oszacowanie

(n3)nn!(n2)n, dla n6,

można wykazać indukcyjnie (szczegóły dowodu znajdują się np. w podręczniku Leona Jeśmianowicza i Jerzego Łosia Zbiór zadań z algebry, Państwowe Wydawnictwo Naukowe, wyd.VII, Warszawa 1976). Uogólnieniem tego oszacowania jest

Twierdzenie 9.14. [twierdzenie Stirlinga]

Dla dowolnej liczby naturalnej n istnieje liczba θn[0,1) (zależna od wyboru liczby n) taka, że zachodzi równość

n!=(ne)n2πnexpθn12n.

Równość tę nazywamy wzorem Stirlinga. Zwróćmy uwagę, że dla dużych n czynnik expθn12n1, stąd

n!(ne)n2πn.

W wielu praktycznych obliczeniach wystarczy posługiwać się nawet przybliżeniem

n!(ne)n

lub (pamiętając, że

2<e<3

) oszacowaniem

(n3)nn!(n2)n, dla n6,

które wykorzystaliśmy do wyznaczenia promienia zbieżności szeregu definiującego funkcję

exp

.

Pochodna logarytmu

Funkcja xlnx jest odwrotna do funkcji xexpx. Stąd - na mocy twierdzenia o pochodnej funkcji odwrotnej - mamy

Uwaga 9.15. [wzór na pochodną logarytmu naturalnego]
ddxlnx=1ddyexpy=1expy=1exp(lnx)=1x.

Zauważmy też, że pochodna ddxln|x|=1x, dla x0. Oznaczmy symbolem abs(x)=|x| wartość bezwzględną liczby x. Na mocy twierdzenia o pochodnej złożenia funkcji mamy równość

ddx(ln|x|)=(lnabs)(x)=(ln)(abs(x))(abs)(x)=1|x|sgnx=x|x|2=1x.

Ogólnie:

Uwaga 9.16.

Jeśli f jest funkcją różniczkowalną w punkcie x0 i f(x0)0, to istnieje pochodna złożenia ln|f|=lnabsf w punkcie x0 i jest równa (ln|f|)(x0)=f(x0)f(x0).

Przykład 9.17.

Mamy

ddxln|sinx|=cosxsinx=ctgx,
a także
ddxln|cosx|=sinxcosx=tgx.

Wniosek 9.18.

Pochodną funkcji xg(x)f(x)=exp(f(x)lng(x)) wyznaczymy, różniczkując złożenie iloczynu funkcji xf(x)lng(x) z funkcją wykładniczą exp.

Przykład 9.19.

a) Wyznaczmy pochodną funkcji wykładniczej o podstawie a>0. Mamy ax=exp(xlna), więc

ddxax=ddx(exp(xlna))=exp(xlna)ddx(xlna)=axlna,
czyli (ax)=axlna.

b) Wiemy już, że ddxxn=nxn1, gdy n jest liczbą naturalną. Korzystając z równości xa=exp(alnx),x>0 jesteśmy także w stanie wykazać, że (xa)=axa1, gdy a jest dowolną liczbą rzeczywistą. Mamy bowiem

ddxxa=ddx(exp(alnx))=exp(alnx)ddx(alnx)=xaax=axa1

Porównanie pochodnych funkcji trygonometrycznych i hiperbolicznych

Wprost z definicji funkcji hiperbolicznych, które poznaliśmy w drugim module, korzystając z faktu, że pochodna (expx)=expx, wyprowadzamy

Wniosek 9.20.

Wzory na pochodne funkcji hiperbolicznych

(sinhx)=12(expxexp(x))=12(expx+exp(x))=coshx,(coshx)=12(expx+exp(x))=12(expxexp(x))=sinhx,(tgh x)=(sinhxcoshx)=coshxcoshxsinhxsinhxcosh2x=1tanh2x=1cosh2x,(ctgh x)=(coshxsinhx)=sinhxsinhxcoshxcoshxsinh2x=1coth2x=1sinh2x.

Dowodząc dwóch ostatnich wzorów, skorzystaliśmy z twierdzenia o pochodnej iloczynu oraz z tożsamości cosh2xsinh2x=1, zwanej jedynką hiperboliczną.

Korzystając z twierdzenia o pochodnej funkcji odwrotnej i powyższych wzorów, możemy łatwo wykazać, że

(arsinhx)=11+x2    oraz    (artghx)=11x2.
Szczegółowe obliczenia przeprowadzimy w ramach ćwiczeń.
Uwaga 9.21.

Otrzymane wzory warto zestawić i porównać ze wzorami określającymi pochodne funkcji trygonometrycznych i cyklometrycznych.

(sinhx)=coshx,    (sinx)=cosx,(coshx)=sinhx,    (cosx)=sinx,(tgh x)=1tgh 2x,    (tgx)=1+tg2x,(ctgh x)=1ctgh 2x,    (ctgx)=1ctg2x,(arsinhx)=11+x2,    (arcsinx)=11x2,(artghx)=11x2,    (arctgx)=11+x2.

Twierdzenie Rolle'a. Punkty krytyczne

Niech X będzie niepustym podzbiorem zbioru liczb rzeczywistych i niech f:X. Oznaczmy przez d(x,y):=|xy| odległość punktów x,yX.

Definicja 9.22.

Mówimy, że funkcja f:X osiąga maksimum lokalne (odpowiednio: minimum lokalne) w punkcie x0X, jeśli istnieje pewne otoczenie punktu x0, w którym wartości funkcji f są nie większe (odpowiednio: nie mniejsze) od wartości funkcji f w punkcie x0, to znaczy

δ>0:xX:d(x,x0)<δf(x)f(x0),
odpowiednio:
δ>0:xX:d(x,x0)<δf(x)f(x0).
Jeśli ponadto w pewnym sąsiedztwie punktu x0 funkcja przyjmuje wartości mniejsze (odpowiednio: większe) od wartości funkcji f(x0) w punkcie x0, co zapisujemy:
δ>0:xX:0<d(x,x0)<δf(x)<f(x0),
odpowiednio:
δ>0:xX:0<d(x,x0)<δf(x)>f(x0),

to mówimy, że funkcja f osiąga silne (ścisłe) maksimum lokalne (odpowiednio: silne (ścisłe) minimum lokalne) w punkcie x0. Jeśli f(x0)=supf(X) (odpowiednio: f(x0)=inff(X)) - to znaczy: jeśli w punkcie x0 funkcja f osiąga kres górny wartości (odpowiednio: kres dolny wartości) w zbiorze X, to mówimy, że funkcja f osiąga w punkcie x0 maksimum globalne (odpowiednio: minimum globalne). Minima i maksima lokalne (odpowiednio: minima i maksima globalne) nazywamy też krótko ekstremami lokalnymi (odpowiednio: ekstremami globalnymi) funkcji.

Przykład 9.23.

Funkcja f(x)=x2 zawężona do przedziału 1x2 osiąga minimum lokalne w punkcie x=0 równe f(0)=0. Funkcja ta osiąga dwa maksima lokalne w punktach x=1 oraz x=2 równe odpowiednio: f(1)=1 oraz f(2)=4. Kresem górnym wartości funkcji f w przedziale [1,2] jest liczba 4, stąd w punkcie x=2 funkcja f osiąga maksimum globalne. Kresem dolnym wartości funkcji f jest liczba zero, stąd w x=0 funkcja osiąga minimum globalne.

Z kolei f(x)=x2 zawężona do przedziału lewostronnie otwartego 1<x2 osiąga minimum globalne w punkcie x=0, a w punkcie x=2 osiąga maksimum globalne. Nie osiąga ekstremum w punkcie x=1, gdyż nie jest określona w tym punkcie.

Zawężenie funkcji f(x)=x2 do przedziału obustronnie otwartego 1<x<2 osiąga minimum globalne w punkcie x=0 i jest to jedyne ekstremum tej funkcji. W przedziale (1,2) nie osiąga bowiem maksimum. Kres górny zbioru wartości funkcji f w przedziale (1,2) wynosi 4, kres ten nie jest realizowany przez żadną wartość funkcji, to znaczy nie istnieje argument x(1,2) taki, że f(x)=sup{f(t),1<t<2}.

Wykażemy teraz twierdzenie stanowiące warunek konieczny istnienia ekstremum funkcji w punkcie, w którym jest ona różniczkowalna.

Niech f: będzie funkcją określoną w pewnym otoczeniu punktu x0.

Twierdzenie 9.24.

Jeśli funkcja f:(a,b) osiąga ekstremum w punkcie x0(a,b) i jest różniczkowalna w punkcie x0, to pochodna f(x0)=0.

Dowód 9.24.

Załóżmy, że w punkcie x0 funkcja osiąga maksimum lokalne. Wobec tego istnieje liczba δ>0 taka, że dla x(x0δ,x0) mamy



f(x0)f(x)x0x0,



natomiast dla x(x0,x0+δ) mamy



f(x0)f(x)x0x0.



Wobec istnienia pochodnej f(x0), istnieją granice powyższych ilorazów różnicowych



limxx0f(x0)f(x)x0x0 oraz limxx0+f(x0)f(x)x0x0



i muszą być równe. Stąd f(x0)=0. W przypadku, gdy w punkcie x0 funkcja osiąga minimum, rozumowanie przebiega podobnie.

Zwróćmy uwagę, że w twierdzeniu nie zakładaliśmy ciągłości funkcji f w otoczeniu punktu x0. Pamiętamy, że z faktu istnienia pochodnej f(x0) wynika ciągłość funkcji f w punkcie x0.

Plik:Am1w09.0020.svg
Rysunek do twierdzenia 9.25.

Twierdzenie 9.25. [twierdzenie Rolle'a]

Niech f:[a,b] będzie funkcją ciągłą w przedziale domkniętym [a,b] i różniczkowalną wewnątrz tego przedziału. Jeśli na końcach przedziału funkcja f przyjmuje równe wartości f(a)=f(b), to istnieje punkt ξ(a,b), w którym zeruje się pochodna funkcji f(ξ)=0.

Dowód 9.25.

Jeśli funkcja f jest stała, to w każdym punkcie ξ(a,b) mamy f(ξ)=0. Jeśli natomiast f nie jest stała, to z twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym wynika, że w pewnym punkcie ξ(a,b) funkcja f osiąga kres górny lub kres dolny. Na podstawie poprzedniego twierdzenia pochodna w tym punkcie zeruje się, tj. f(ξ)=0.

Twierdzenie Rolle'a (zgodnie z interpretacją geometryczną pochodnej) orzeka, że jeśli funkcja różniczkowalna w przedziale (a,b) przyjmuje na końcach przedziału [a,b] (w którym jest ciągła) tę samą wartość, to między punktami a i b da się znaleźć punkt ξ taki, że styczna do wykresu funkcji f w punkcie (ξ,f(ξ)) jest pozioma, tj. równoległa do osi rzędnych.

Twierdzenie Rolle'a wymaga założenia o ciągłości funkcji w przedziale domkniętym [a,b] i różniczkowalności we wszystkich punktach przedziału (a,b).

Plik:Am1w09.0030.svg
Rysunek do przykładu 9.26.

Przykład 9.26.

Funkcja


f(x)={0, dla x=0ctg(x), dla 0<x<π2,

jest określona na przedziale domkniętym [0,π2] i jest różniczkowalna wewnątrz tego przedziału, gdyż


x(0,π) f(x)=1ctg2x1<0.


Stąd w żadnym punkcie przedziału (0,π2) pochodna f nie zeruje się, mimo że na końcach tego przedziału funkcja przyjmuje takie same wartości: f(0)=f(π2)=0. Twierdzenie Rolle'a nie zachodzi w tym przypadku, funkcja f nie jest bowiem ciągła w punkcie x=0.

Przykład 9.27.

Funkcja f(x)=|x| jest ciągła w przedziale [1,1] i na jego końcach osiąga równe wartości. Jest także różniczkowalna we wnętrzu tego przedziału z wyjątkiem tylko jednego punktu x=0, w którym nie istnieje pochodna f. Twierdzenia Rolle'a również w tym przypadku nie stosuje się, gdyż - jak pamiętamy - dla x0 mamy

f(x)=sgn(x)={1, dla x>01, dlax<0

a więc nie ma w zbiorze (1,0)(0,1) takiego punktu, w którym zerowałaby się pochodna f.

W szczególności nie istnieje styczna do wykresu funkcji x|x| w punkcie (0,0).

Dziedzina domf pochodnej f jest zawsze podzbiorem dziedziny domf funkcji f. Z twierdzenia 9.24. wynika, że jeśli funkcja osiąga ekstremum w punkcie adomf, to f(a)=0. Jednak funkcja f może osiągać również ekstrema w tych punktach, w których nie istnieje pochodna, tzn. w punktach zbioru domfdomf.

Definicja 9.28.

Niech f:. Mówimy, że punkt adomf jest punktem krytycznym funkcji f, jeśli funkcja f nie jest różniczkowalna w punkcie a albo jest w tym punkcie różniczkowalna i pochodna f(a)=0. Zbiór punktów

{adomf:adomf}{adomf:f(a)=0}
nazywamy zbiorem punktów krytycznych funkcji f.

Wiemy (zob. przykład 9.4.), że funkcja f może nie być różniczkowalna w kilku punktach, a nawet w żadnym punkcie swojej dziedziny, mimo że jest ciągła. Badając przebieg zmienności funkcji, nie możemy więc zawężać poszukiwania punktów ekstremalnych wyłącznie do tych punktów, w których funkcja jest różniczkowalna.

Uwaga 9.29.

Jeśli funkcja f osiąga ekstremum w pewnym punkcie, to punkt ten jest jej punktem krytycznym.

Dowód 9.29.

Funkcja f może osiągać ekstremum w punkcie, który należy do dziedziny pochodnej domf albo do różnicy dziedziny funkcji i dziedziny jej pochodnej domfdomf. W przypadku, gdy adomf, na mocy twierdzenia 9.24. mamy

f(a)=0, punkt a jest więc krytyczny. Z kolei, jeśli adomfdomf, to punkt a jest krytyczny, z definicji 9.28..


Zauważmy, że powyższa uwaga doprecyzowywuje warunek konieczny istnienia ekstremum zawarty w twierdzeniu 9.24. w przypadku, gdy funkcja f nie jest różniczkowalna w punkcie, w którym osiąga ekstremum. Co więcej, funkcja f może osiągać ekstremum w punkcie, w którym nie jest nawet ciągła (zob. przykład poniżej). Punkt taki - na mocy uwagi uwagi 9.2. - należy do zbioru domfdomf, jest więc krytyczny.

Plik:Am1w09.0040.svg
Rysunek do przykładu 9.30.
Plik:Am1w09.0050.svg
Rysunek do przykładu 9.32.

Przykład 9.30.

a) Funkcja f(x)=|x| określona jest w zbiorze domf=, a różniczkowalna w domf={0}. Jedynym punktem krytycznym f jest punkt 0domfdomf, w którym f osiąga minimum.

b) Funkcja

f~(x)={1, dla x=0,|x|, dla x0.


różni się od poprzedniej funkcji jedynie wartością w zerze, nie jest w tym punkcie ciągła. Pochodna f~(x)=sgnx nie zeruje się w żadnym punkcie swojej dziedziny domf~=(,0)(0,). Jedynym punktem krytycznym funkcji f~ jest więc zero, w którym funkcja ta osiąga silne maksimum lokalne, gdyż dla 0<|x|<1 mamy f~(x)<1=f~(0).

Przykład 9.31.

Funkcja f(x)=x zacieśniona do przedziału domkniętego [1, 2] jest różniczkowalna w przedziale otwartym (1, 2). W każdym punkcie 1<x<2 mamy f(x)=10. Stąd jedynymi punktami krytycznym są punkty domfdomf={1, 2}, czyli końce przedziału domkniętego. W punkcie x=1 funkcja f osiąga minimum f(1)=1, a w x=2 maksimum f(2)=2.

Przykład 9.32.

Funkcja f(x)=1x2 określona jest na przedziale domkniętym domf=[1, 1], a jej pochodna f(x)=x1x2 istnieje w punktach przedziału otwartego domf=(1,1). Pochodna zeruje się w punkcie x=0. Stąd zbiór punktów krytycznych funkcji f składa się z trzech punktów: {1, 0, 1}. Funkcja f osiąga w punkcie 0 maksimum f(0)=1, a w dwóch pozostałych punktach krytycznych osiąga minima f(1)=f(1)=0. Zwróćmy uwagę, że w obu tych punktach pochodna nie istnieje. Co więcej, granice jednostronne pochodnej f:

limx1+f(x)=   oraz   limx1f(x)=

są nieskończone.

Przykład 9.33.

Funkcja f(x)=x21 określona jest dla |x|1. Stąd domf=(,1][1,). Jej pochodna f(x)=xx21 określona jest w sumie przedziałów otwartych domf=(,1)(1,). Zwróćmy uwagę, że pochodna nie zeruje się w żadnym punkcie swojej dziedziny. Jednak zbiór punktów krytycznych funkcji f zawiera dwa punkty: 1 oraz 1, w których funkcja f osiąga minima

f(1)=f(1)=0.

W punktach zbioru domfdomf funkcja nie musi osiągać ekstremum, co ilustrują kolejne przykłady.

Przykład 9.34.

Każdy punkt przedziału [0,1] jest punktem krytycznym funkcji Dirichleta


f(x)={1, dla x[0,1]0, dla x[0,1]()


gdyż nie jest ona różniczkowalna (ani

nawet ciągła) w żadnym punkcie tego przedziału. Jednak w żadnym punkcie przedziału [0,1] (ani w punkcie wymiernym, ani w niewymiernym) funkcja Dirichleta nie osiąga ekstremum, gdyż w dowolnie małym otoczeniu któregokolwiek punktu znajdziemy punkty wymierne i niewymierne, w których funkcja przyjmuje skrajnie różne wartości: albo jeden, albo zero.

<flash>file=am1w09.0060.swf|width=375|height=375</flash>

<div.thumbcaption>Rysunek do przykładu 9.33.

<flash>file=am1w09.0070.swf|width=375|height=375</flash>

<div.thumbcaption>Rysunek do przykładu 9.35.

Przykład 9.35.

Funkcja
f(x)={x,dla x0x, dla x<0,

określona jest dla wszystkich liczb rzeczywistych, stąd domf=(,). Jej pochodna

f(x)={12x, dla x>012x, dla x<0}=12|x|, dla x0

nie zeruje się w żadnym punkcie swojej dziedziny domf=(,0)(0,). Funkcja f jest nieparzysta, ściśle rosnąca, nie osiąga więc ekstremum w żadnym punkcie swojej dziedziny, również w x=0, mimo że jest to punkt krytyczny tej funkcji.

Twierdzenie o wartości średniej

Wnioskiem z twierdzenia Rolle'a jest następujące

Twierdzenie 9.36. [twierdzenie Cauchy'ego]

Niech f,g:[a,b] będą funkcjami ciągłymi w przedziale domkniętym [a,b] i różniczkowalnymi w przedziale otwartym (a,b). Wówczas istnieje punkt ξ(a,b) taki, że

(f(b)f(a))g(ξ)=(g(b)g(a))f(ξ).

Zwróćmy uwagę, że powyższą równość można zapisać w bardziej przejrzystej postaci (i łatwiejszej do zapamiętania):

f(b)f(a)g(b)g(a)=f(ξ)g(ξ),

o ile g(a)g(b) oraz g(ξ)0. Twierdzenie Cauchy'ego głosi w tym przypadku, że istnieje wewnątrz przedziału (a,b) punkt ξ taki, że stosunek przyrostów wartości funkcji f i g między punktami a i b jest równy stosunkowi pochodnych tych funkcji w punkcie ξ.

Dowód 9.36.

Rozważmy pomocniczo funkcję h(t):=(f(b)f(a))g(t)(g(b)g(a))f(t) określoną dla t[a,b]. Funkcja h jest ciągła w przedziale domkniętym [a,b], różniczkowalna w przedziale otwartym (a,b) o pochodnej równej

ddth(t)=(f(b)f(a))ddtg(t)(g(b)g(a))ddtf(t).

Ponadto h(a)=h(b). Na mocy twierdzenia Rolle'a istnieje więc taki punkt ξ(a,b), w którym zeruje się pochodna h(ξ)=0, skąd wynika teza twierdzenia.


Jako wniosek z twierdzenia Cauchy'ego otrzymujemy

Twierdzenie 9.37. [twierdzenie Lagrange'a]

Jeśli funkcja f:[a,b] jest ciągła w przedziale domkniętym [a,b] i różniczkowalna w każdy punkcie przedziału otwartego (a,b), to istnieje punkt ξ(a,b) taki, że

f(b)f(a)ba=f(ξ).

Dowód 9.37.

Wystarczy w twierdzeniu Cauchy'ego podstawić g(t)=t. Wówczas g(b)=b, g(a)=a oraz g(t)=1.

<flash>file=am1w09.0080.swf|width=375|height=364</flash> <div.thumbcaption>Styczna do wykresu w punkcie ξ (na czerwono)

jest równolegla do siecznej (na zielono)

Twierdzenie Lagrange'a nazywane jest też twierdzeniem o przyrostach (skończonych) lub twierdzeniem o wartości średniej, gdyż tezę twierdzenia można zapisać też następująco:



f(b)f(a)=f(ξ)(ba), dla pewnego ξ(a,b).



Innymi słowy: przyrost wartości funkcji f(b)f(a) odpowiadający przyrostowi argumentu funkcji od a do b równy jest iloczynowi przyrostu argumentu ba i wartości pochodnej funkcji f w pewnym punkcie pośrednim ξ leżącym między punktami a i b.

Pamiętamy, że interpretacją geometryczną ilorazu różnicowego f(b)f(a)ba jest współczynnik kierunkowy siecznej wykresu funkcji f przechodzącej przez punkty (a,f(a)) i (b,f(b)). Twierdzenie Lagrange'a orzeka więc, że między punktami a i b da się znaleźć taki punkt ξ, że styczna do wykresu funkcji f w punkcie (ξ,f(ξ)) jest równoległa do siecznej przechodzącej przez punkty (a,f(a)) i (b,f(b)).

Wnioskiem z twierdzenia Lagrange'a o wartości średniej jest twierdzenie, które wiąże monotoniczność funkcji ze znakiem pierwszej pochodnej.

Twierdzenie 9.38.

Niech f będzie funkcją różniczkowalną w przedziale (a,b).

a) Jeśli f(x)0 dla wszystkich x(a,b), to f jest rosnąca w przedziale (a,b).

a') Jeśli f(x)>0 dla wszystkich x(a,b), to f jest ściśle rosnąca w przedziale (a,b).

b) Jeśli f(x)=0 dla wszystkich x(a,b), to f jest stała w przedziale (a,b).

c) Jeśli f(x)0 dla wszystkich x(a,b), to f jest malejąca w przedziale (a,b).

c') Jeśli f(x)<0 dla wszystkich x(a,b), to f jest ściśle malejąca w przedziale (a,b).

Dowód 9.38.

Dla dowolnych punktów x1<x2 z przedziału (a,b) zgodnie z twierdzeniem Lagrange'a potrafimy wskazać punkt ξ(x1,x2) taki, że f(x2)f(x1)=f(ξ)(x2x1). Z równości tej wynikają powyższe implikacje.


Wnioskiem z tego twierdzenia jest warunek wystarczający istnienia ekstremum w przypadku, gdy funkcja jest różniczkowalna.

Wniosek 9.39.

Niech f będzie funkcją różniczkowalną w przedziale (a,b). Jeśli w punkcie x0(a,b) pochodna funkcji f zeruje się (tj. f(x0)=0) oraz zmienia znak, to znaczy

a) jest dodatnia w przedziale (a,x0) i ujemna w (x0,b),

b) jest ujemna w przedziale (a,x0) i dodatnia w (x0,b),

to funkcja f osiąga w punkcie x0 ekstremum, odpowiednio:

a) minimum lokalne,

b) maksimum lokalne.

Dowód 9.39.

a) Na mocy poprzedniego twierdzenia funkcja f jest ściśle rosnąca w przedziale (a,x0) i ściśle malejąca w przedziale (x0,b), osiąga więc maksimum lokalne w punkcie x0. Dowód w przypadku b) jest podobny.


Zwróćmy uwagę, że nie potrzeba zakładać zerowania się pierwszej pochodnej funkcji w punkcie x0. Prawdziwy jest więc także

Wniosek 9.40.

Jeśli funkcja f ciągła w przedziale (a,b) jest różniczkowalna w przedziałach (a,x0) oraz (x0,b), przy czym pochodna f jest

a) dodatnia w przedziale (a,x0) i ujemna w (x0,b),

b) ujemna w przedziale (a,x0) i dodania w (x0,b),

to funkcja f osiąga w punkcie x0 ekstremum, odpowiednio:

a) minimum lokalne,

b) maksimum lokalne.

Przykład funkcji f(x)=|x|, która osiąga minimum w punkcie x0=0, a ma pochodną ujemną dla x<0, a dodatnią dla x>0 i wcale nie ma pochodnej w punkcie x0=0, stanowi ilustrację ostatniego wniosku.

Przykład 9.41.

Pochodna funkcji f(x)=2x3+3x212x+7 wynosi



f(x)=6x2+6x12=6(x2+x2)=6(x+2)(x1).



Stąd f(x)<0 w przedziale (2,1), a w obu przedziałach (,2) oraz (1,+) pochodna jest dodatnia. Na mocy wykazanego twierdzenia, funkcja f jest ściśle rosnąca w przedziale (,2), następnie maleje w przedziale (2,1) i znowu rośnie w przedziale (1,). Wobec tego w punkcie x=2 osiąga maksimum lokalne równe f(2)=27, a w punkcie x=1 minimum lokalne równe f(1)=0.

<flash>file=am1w09.0081.swf|width=375|height=375</flash>

<div.thumbcaption>Rysunek do przykładu 9.41.

<flash>file=am1w09.0082.swf|width=375|height=375</flash>

<div.thumbcaption>Rysunek do przykładu 9.42.(a)
Plik:Am1w09.0084.svg
Rysunek do przykładu 9.42.(b)
Uwaga 9.42.

Założenie, że pochodna f(x)0 (odpowiednio f(x)>0, f(x)=0 itd) w każdym punkcie przedziału (a,b) jest istotne.

a) Rozważmy funkcję: f(x)=[x], gdzie [x] oznacza część całkowitą liczby rzeczywistej x, czyli największą liczbę całkowitą nie większą od x. Wówczas f jest różniczkowalna w zbiorze (czyli wszędzie poza zbiorem liczb całkowitych) i w zbiorze tym pochodna f(x)=0, mimo że funkcja f jest rosnąca.

b) Funkcja g(x)=x[x] jest różniczkowalna w zbiorze i w każdym punkcie tego zbioru jej pochodna g(x)=1. Jednak funkcja ta nie jest ściśle rosnąca w zbiorze . Jest natomiast ściśle rosnąca w każdym z przedziałów postaci (n,n+1), gdzie n.

Podane funkcje są ciągłe poza zbiorem liczb całkowitych. Można jednak skonstruować przykład funkcji ciągłej, rosnącej o zerowej pochodnej w prawie każdym punkcie, to znaczy w każdym punkcie przedziału (0,1) poza punktami trójkowego zbioru Cantora

C:={k=1ak3k,ak{0,2}}.


Przypomnijmy, że zbiór ten rozważaliśmy w ramach pierwszego modułu.

Georg Ferdinand Ludwig Philipp Cantor (1845-1918)Zobacz biografię
Plik:Am1w09.0086a.svg
Rysunek do przykładu 9.43.

Przykład 9.43.

Niech x=(0,a1a2a3a4)(3)=n=1an3n będzie dowolną liczbą z przedziału [0,1] zapisaną w systemie trójkowym za pomocą ciągu cyfr an=an(x){0,1,2}. Niech N=N(x) będzie najmniejszą liczbą naturalną, dla której an=1. Innymi słowy: niech N=N(x) będzie pozycją pierwszej jedynki w zapisie trójkowym liczby x, licząc od przecinka pozycyjnego w prawo. Jeśli nie ma takiej liczby, przyjmujemy N(x)=. Określmy ciąg

bn={12an, dla n<N(x)1, dla n=N(x)0, dla n>N(x)


za pomocą którego definiujemy funkcję Cantora (zwaną także diabelskimi schodami) wzorem


f(x)=k=1N(x)bk2k.

Łatwo sprawdzić, że f(0)=0, f(1)=1, a na odcinkach, które usuwamy kolejno z przedziału [0,1] podczas kolejnych etapów konstrukcji trójkowego zbioru Cantora, funkcja ta jest stała:


f(x)=12 dla x(13,23),

f(x)=14 dla x(19,29) oraz f(x)=34 dla x(79,89)

f(x)=18 dla x(127,227), f(x)=38 dla x(727,827)


f(x)=58 dla x(1927,2027),f(x)=78 dla x(2527,2627)

i tak dalej. Można wykazać, że funkcja ta jest ciągła w każdym punkcie przedziału [0,1]. Zauważmy, że funkcja Cantora jest różniczkowalna w każdym punkcie zbioru [0,1]C (tj. w każdym punkcie przedziału (0,1) poza punktami trójkowego zbioru Cantora C). Pochodna funkcji Cantora jest w tych punktach równa zeru, a mimo to (co nietrudno zauważyć) funkcja

Cantora jest rosnąca (niemalejąca) w przedziale [0,1].