Analiza matematyczna 1/Wykład 12: Wypukłość. Badanie funkcji jednej zmiennej

From Studia Informatyczne

Spis treści

Wypukłość. Badanie funkcji jednej zmiennej

Definiujemy funkcje wypukłe i dowodzimy ich elementarnych własności. Podajemy związek wypukłości funkcji z monotonicznością jej pochodnej. Przedstawiamy nierówność Jensena, Minkowskiego, Höldera oraz klasyczną nierówność między średnią arytmetyczną, geometryczną i harmoniczną. Schemat badania przebiegu zmienności funkcji jednej zmiennej stanowi podsumowanie poprzednich czterech modułów.

Funkcje wypukłe



Zbiór wypukły


Nadwykres funkcji wypuklej f

Pojęcie wypukłości jest nam znane z geometrii. Mówimy, że podzbiór \displaystyle A przestrzeni wektorowej \displaystyle X jest wypukły, jeśli dowolny odcinek o końcach należących do zbioru \displaystyle A jest zawarty w tym zbiorze. Innymi słowy:

\displaystyle \forall x, y\in A \ \forall t\in [0,1] \ : \ (1-t)x+ty\in A.
Zbiór
\displaystyle \{(1-t)x+ty, \ 0\leq t\leq 1\}
jest odcinkiem o końcach \displaystyle x, \displaystyle y. Punkty \displaystyle x, \displaystyle y uzyskamy, gdy w kombinacji liniowej \displaystyle (1-y)x+ty parametr \displaystyle t przyjmie odpowiednio wartość \displaystyle 0 lub \displaystyle 1. Gdy \displaystyle t=\frac{1}{2}, otrzymujemy punkt \displaystyle \frac{1}{2}(x+y), który jest środkiem odcinka łączącego punkty \displaystyle x oraz \displaystyle y. Zauważmy też, że zbiory
\displaystyle \{(1-t)x+ty,  \ t\leq 1\}
oraz
\displaystyle\{(1-t)x+ty, \ 0\leq  t\}
to - odpowiednio - półprosta o początku \displaystyle x przechodząca przez punkt \displaystyle y oraz półprosta o początku \displaystyle y przechodząca przez punkt \displaystyle x.

Definicję funkcji wypukłej opieramy na intuicji geometrycznej.

Definicja 12.1.

Mówimy, że funkcja \displaystyle f:(a,b)\mapsto \mathbb{R} jest wypukła w przedziale \displaystyle (a,b), jeśli jej nadwykres

\displaystyle \{(x, y) : a<x<b, \ y\geq f(x)\}
jest zbiorem wypukłym, to znaczy


\displaystyle \forall x, y\in (a,b) : x<y \ \forall t\in [0,1] \ f((1-t)x+ty)\leq (1-t)f(x)+tf(y).

Jeśli powyższa nierówność jest ostra (wewnątrz odcinka \displaystyle 0<t<1), tzn.

\displaystyle \forall x, y\in (a,b) : x<y \ \forall t\in (0,1) \ f((1-t)x+ty) < (1-t)f(x)+tf(y),
to mówimy, że funkcja \displaystyle f jest ściśle wypukła w przedziale \displaystyle (a,b).

Z kolei, jeśli zachodzą nierówności przeciwne, tj.

\displaystyle \forall x, y\in (a,b) : x<y \ \forall t\in [0,1] \ : \ f((1-t)x+ty)\geq (1-t)f(x)+tf(y)
oraz odpowiednio

\displaystyle \forall x, y\in (a,b) : x<y \ \forall t\in (0,1) \ : \ f((1-t)x+ty)> (1-t)f(x)+tf(y),
to mówimy, że funkcja \displaystyle f jest wklęsła w przedziale \displaystyle (a,b) oraz - odpowiednio - ściśle wklęsła.

Zwróćmy uwagę, że jeśli funkcja nie jest wypukła w przedziale \displaystyle (a,b), to nie oznacza to, że jest wklęsła w tym przedziale. Na przykład funkcja Dirichleta

\displaystyle D(x)=\left\{\aligned &0, &\text{ dla } &x\in [0,1]\cap\mathbb{Q}\\ &1, &\text{ dla } &x\in [0,1]\cap (\mathbb{R}\setminus \mathbb{Q})\endaligned \right .
nie jest wypukła w żadnym przedziale \displaystyle (a,b)\subset [0,1], ale nie jest też wklęsła.

Zauważmy, że jeśli \displaystyle x=(1-t)a+tb, to nierówność

\displaystyle f\big((1-t)a+tb\big)\leq (1-t)f(a)+tf(b),

za pomocą której określiliśmy wypukłość funkcji w przedziale \displaystyle (a,b), jest równoważna nierówności

\displaystyle f(x)\leq\frac{b-x}{b-a}f(a)+\frac{x-a}{b-a}f(b)

lub

\displaystyle 0\leq (b-x)f(a)+(a-b)f(x)+(x-a)f(b),

którą możemy również zapisać w postaci łatwej do zapamiętania za pomocą wyznacznika

\displaystyle w_f(x):=\det \left[\beginmatrix  1 & a & f(a)\\ 1 & x & f(x)\\ 1 & b & f(b) \endmatrix \right]  \geq 0.
Uwaga 12.2.
Funkcja \displaystyle f jest wypukła (odpowiednio: ściśle wypukła, wklęsła, ściśle wklęsła) w przedziale \displaystyle (a,b) wtedy i tylko wtedy, gdy dla dowolnej liczby \displaystyle x\in(a,b) wyznacznik \displaystyle w_f(x)\geq 0 (odpowiednio: \displaystyle w_f(x)> 0, \displaystyle w_f(x)\leq 0, \displaystyle w_f(x)< 0).

Elementarne własności funkcji wypukłych

Sformułujmy parę uwag, które wynikają bezpośrednio z definicji wypukłości funkcji.

Uwaga 12.3.

a) Jeśli \displaystyle f jest wypukła w przedziale \displaystyle (a,b), to jest również wypukła w dowolnym mniejszym przedziale \displaystyle (a_1, b_1) zawartym w \displaystyle (a,b).

b) Funkcja \displaystyle x\mapsto f(x) jest wypukła (odpowiednio: ściśle wypukła) w przedziale \displaystyle (a,b) wtedy i tylko wtedy, gdy funkcja \displaystyle x\mapsto -f(x) jest wklęsła (odpowiednio: ściśle wklęsła) w tym przedziale.

c) Jeśli \displaystyle C>0 jest stałą dodatnią, to funkcja \displaystyle x\mapsto C f(x) jest wypukła wtedy i tylko wtedy, gdy \displaystyle f jest wypukła.

d) Jeśli \displaystyle C jest dowolną stałą, to funkcja \displaystyle x\mapsto C+ f(x) jest wypukła wtedy i tylko wtedy, gdy \displaystyle f jest wypukła.

e) Suma funkcji wypukłych jest funkcją wypukłą.

Kolejne elementarne własności funkcji wypukłych podaje

Twierdzenie 12.4.

a) Złożenie \displaystyle g\circ f funkcji wypukłych \displaystyle f i \displaystyle g jest funkcją wypukłą, jeśli \displaystyle g jest funkcją rosnącą.

b) Funkcja \displaystyle g odwrotna do funkcji \displaystyle f wypukłej rosnącej jest wklęsła rosnąca.

c) Funkcja ściśle wypukła w przedziale \displaystyle (a,b) nie osiąga maksimum w żadnym punkcie tego przedziału.

d) Funkcja ściśle wklęsła w przedziale \displaystyle (a,b) nie osiąga minimum w żadnym punkcie tego przedziału.

Dowód 12.4.

a) Funkcja \displaystyle f jest wypukła w \displaystyle (a,b), więc

\displaystyle f\big((1-t)x+ty\big)\leq (1-t)f(x)+tf(y)
dla dowolnych \displaystyle x,y\in (a,b), \displaystyle t\in [0,1]. Mamy następnie nierówność
\displaystyle g\bigg(f\big((1-t)x+ty\big)\bigg)\leq g\big((1-t)f(x)+tf(y)\big),
ponieważ funkcja \displaystyle g jest rosnąca. Zuwagi na wypukłość \displaystyle g mamy
\displaystyle g\big((1-t)f(x)+tf(y)\big)\leq (1-t)g(f(x))+tg(f(y)),

czyli

\displaystyle (g\circ f)\big((1-t)x+ty\big)\leq (1-t)(g\circ f )(x)+t(g\circ f )(y)

dla dowolnych \displaystyle x,y\in (a,b) i \displaystyle 0\leq t\leq 1. Stąd złożenie \displaystyle g\circ f jest funkcją wypukłą.

b) Niech \displaystyle a<x_1<x_2<b i niech \displaystyle y_1=f(x_1), \displaystyle y_2=f(x_2). Wówczas \displaystyle g(y_1)=x_1 oraz \displaystyle g(y_2)=x_2. Funkcja odwrotna do rosnącej jest rosnąca, gdyż

\displaystyle \aligned x_1&<x_2 &&\Leftrightarrow \ \ f(x_1)<f(x_2)\\ && \Updownarrow & \\ g(y_1)&<g(y_2) &&\Leftrightarrow \ \ y_1<y_2.\endaligned
Z wypukłości funkcji \displaystyle f mamy
\displaystyle f\big((1-t)x_1 +t x_2\big) \leq (1-t)f(x_1)+tf(x_2) \ \ \text{ dla  } t\in [0,1],
co jest równoważne nierównościom
\displaystyle \aligned &g\bigg(f\big((1-t)x_1 +t x_2\big)\bigg) &\leq &g\big((1-t)y_1+ty_2\big)& \\ &(1-t)x_1 +t x_2 &\leq &g\big((1-t)y_1+ty_2\big)& \\ &(1-t)g(y_1) +t g(y_2) &\leq &g\big((1-t)y_1+ty_2\big)& \text{ dla } t\in [0,1], \endaligned

czyli \displaystyle g jest wklęsła.

c) Przypuśćmy wbrew tezie, że funkcja \displaystyle f osiąga maksimum w pewnym punkcie \displaystyle x_0\in(a,b). Funkcja \displaystyle f nie jest stała, istnieje więc liczba \displaystyle h>0 taka, że \displaystyle f(x_0-h)<f(x_0) oraz \displaystyle f(x_0+h)<f(x_0). Wobec tego

\displaystyle \frac{1}{2}f(x_0-h)+\frac{1}{2}f(x_0+h)<f(x_0)=f\big(\frac{1}{2}(x_0-h)+\frac{1}{2}(x_0+h)\big)

co oznacza, że funkcja \displaystyle f nie jest wypukła w przedziale \displaystyle (x_0-h, x_0+h). Sprzeczność.

d) Dowód przebiega podobnie do dowodu własności c).

image:End_of_proof.gif





Punkt 0 jest punktem przegiecia funkcji f(x)=\textrm{arctg} x


Punkt 0 jest takze punktem przegiecia funkcji f(x)=-\textrm{arctg} x


Definicja 12.5.

Jeśli dla pewnej liczby \displaystyle h>0 funkcja \displaystyle f, określona w przedziale \displaystyle (a-h, a+h), jest

  • ściśle wypukła w przedziale \displaystyle (a-h,a) i ściśle wklęsła w przedziale \displaystyle (a, a+h)

albo na odwrót:

  • ściśle wklęsła w przedziale \displaystyle (a-h,a) i ściśle wypukła w przedziale \displaystyle (a, a+h),

to mówimy, że punkt \displaystyle a jest punktem przegięcia (wykresu) funkcji \displaystyle f.

Przykład 12.6.

a) Funkcja stała \displaystyle f(x)=C jest wypukła w przedziale \displaystyle (-\infty, \infty); nie jest ściśle wypukła.

b) Funkcja \displaystyle f(x)=|x| jest wypukła w każdym przedziale \displaystyle (-\infty, \infty); nie jest ściśle wypukła.

c) Funkcja \displaystyle f(x)=x^{2n} jest ściśle wypukła w całym zbiorze liczb rzeczywistych, gdy wykładnik \displaystyle 2n jest dowolną parzystą liczbą dodatnią. Gdy \displaystyle 2n jest parzystą liczbą ujemną, to \displaystyle f jest ściśle wypukła w obu przedziałach \displaystyle (-\infty, 0) oraz \displaystyle (0, \infty).

d) Gdy wykładnik \displaystyle 2n+1 jest nieparzystą liczbą dodatnią lub ujemną, funkcja \displaystyle f(x)=x^{2n+1} jest ściśle wypukła w przedziale \displaystyle (0,\infty) i jest ściśle wklęsła w przedziale \displaystyle (-\infty, 0). Punkt \displaystyle 0 jest więc punktem przegięcia funkcji \displaystyle f(x)=x^{2n+1}, gdy wykładnik jest dowolną liczbą nieparzystą dodatnią. Gdy wykładnik \displaystyle 2n+1 jest liczbą ujemną, liczba \displaystyle 0 nie należy do dziedziny funkcji \displaystyle f, nie jest więc punktem przegięcia funkcji \displaystyle f.

e) Funkcja \displaystyle f(x)=\sin x jest ściśle wypukła w każdym z przedziałów \displaystyle (-\pi+2k\pi, 0+2k\pi) i jest ściśle wklęsła w każdym z przedziałów \displaystyle (0+2k\pi, \pi+2k\pi), \displaystyle k\in\mathbb{Z}. Stąd każdy punkt \displaystyle k \pi, \displaystyle k\in\mathbb{Z}, jest punktem przegięcia tej funkcji.

Wypukłość funkcji a monotoniczność jej pochodnej

Badanie wypukłości funkcji różniczkowalnej można sprowadzić do badania monotoniczności jej pochodnej.

Twierdzenie 12.7

Niech \displaystyle f będzie funkcją różniczkowalną w przedziale \displaystyle (a,b). Funkcja \displaystyle f jest wypukła w przedziale \displaystyle (a,b) wtedy i tylko wtedy, gdy jej pochodna \displaystyle f' jest rosnąca.

Dowód 12.7.

Jeśli funkcja \displaystyle f jest wypukła w przedziale \displaystyle (\alpha, \beta), to dla dowolnych liczb \displaystyle a,b\in (\alpha, \beta), \displaystyle a<b oraz dla dowolnego punktu \displaystyle x\in (a,b) zachodzi nierówność:

\displaystyle 0\leq (b-x)f(a)+(a-b)f(x)+(x-a)f(b),

którą możemy zapisać w równoważnej postaci:

\displaystyle \frac{f(x)-f(a)}{x-a}\leq \frac{f(b)-f(x)}{b-x}.

Gdy \displaystyle x\to a lub \displaystyle x\to b, wobec różniczkowalności \displaystyle f, otrzymamy

\displaystyle f'(a)\leq \frac{f(b)-f(a)}{b-a}
oraz
\displaystyle \frac{f(b)-f(a)}{b-a} \leq f'(b).

Stąd \displaystyle f'(a)\leq f'(b), a więc pochodna \displaystyle f' jest rosnąca w przedziale \displaystyle (\alpha, \beta).

Załóżmy teraz z kolei, że pochodna \displaystyle f' jest funkcją rosnącą. Z twierdzenia Lagrange'a o wartości średniej istnieją punkty \displaystyle \xi\in (a,x) oraz \displaystyle \eta\in (x,b) takie, że

\displaystyle \frac{f(x)-f(a)}{x-a}=f'(\xi)
oraz
\displaystyle \frac{f(b)-f(x)}{b-x}=f'(\eta).

Pamiętamy, że \displaystyle a<\xi <x<\eta<b. Skoro \displaystyle f' jest rosnąca w przedziale \displaystyle (\alpha, \beta), więc \displaystyle f'(\xi)\leq f'(\eta), czyli

\displaystyle \frac{f(x)-f(a)}{x-a}\leq \frac{f(b)-f(x)}{b-x},
co wobec dowolności wyboru punktów \displaystyle a<x<b z przedziału \displaystyle (\alpha, \beta) oznacza, że funkcja \displaystyle f jest wypukła. image:End_of_proof.gif


Pamiętamy, że monotoniczność funkcji różniczkowalnej jest ściśle związana ze znakiem jej pochodnej. Stąd monotoniczność pochodnej jest związana ze znakiem drugiej pochodnej funkcji.

Wniosek 12.8.

Niech \displaystyle f będzie funkcją dwukrotnie

różniczkowalną w przedziale \displaystyle (a,b). Jeśli w dowolnym punkcie \displaystyle x\in (a,b) druga pochodna \displaystyle f''(x)\geq 0 (odpowiednio: \displaystyle f''(x)\leq 0), to funkcja \displaystyle f jest wypukła (odpowiednio: wklęsła) w tym przedziale.


Funkcja wykladnicza f(x)=a^x jest scisle wypukla w przedziale (-\infty, \infty), gdy a\neq 1,a>0.


Punkt 0 jest punktem przegiecia funkcji f

Przykład 12.9.

a) Funkcja wykładnicza \displaystyle x\mapsto a^x jest ściśle wypukła w przedziale \displaystyle (-\infty, \infty), gdy \displaystyle a\in (0,1)\cup (1, \infty), ponieważ jej druga pochodna \displaystyle \frac{d^2}{dx^2}a^x=(\ln a)^2 a^x jest dodatnia w każdym punkcie \displaystyle x\in \mathbb{R}. W przypadku, gdy \displaystyle a=1, funkcja stała \displaystyle f(x)=1^x=1 jest także wypukła, ale nie jest ściśle wypukła.

b) Funkcja logarytmiczna \displaystyle x\mapsto -\ln |x| jest ściśle wypukła w przedziałach \displaystyle (-\infty, 0) oraz \displaystyle (0, \infty), gdyż jej druga pochodna

\displaystyle \frac{d^2}{dx^2}(-\ln |x|)=\frac{1}{x^2}
jest dodatnia dla \displaystyle x\neq 0.

c) Jeśli \displaystyle f jest funkcją wypukłą, to również \displaystyle \exp f: x\mapsto e^{f(x)} jest funkcją wypukłą, gdyż jest złożeniem funkcji

wypukłej \displaystyle f: x\mapsto f(x) i rosnącej funkcji wypukłej \displaystyle \exp: u\mapsto \exp u.

Z twierdzenia o monotoniczności pochodnej funkcji wypukłej wynika również warunek konieczny istnienia punktu przegięcia funkcji dwukrotnie różniczkowalnej w przedziale \displaystyle (a,b).

Wniosek 12.10.

Niech \displaystyle f będzie funkcją dwukrotnie różniczkowalną w przedziale \displaystyle (a,b). Jeśli \displaystyle x_0\in (a,b) jest punktem przegięcia funkcji \displaystyle f, to \displaystyle f''(x_0)=0.

Zwróćmy uwagę, że zerowanie drugiej pochodnej nie jest warunkiem wystarczającym istnienia punktu przegięcia.

Przykład 12.11.

Każda z funkcji \displaystyle f(x)=x^{2n}, gdy \displaystyle n\geq 2, ma zerową drugą pochodną w punkcie \displaystyle x=0, jednak punkt ten nie jest dla żadnej z nich punktem przegięcia, gdyż każda z tych funkcji jest ściśle wypukła w przedziale \displaystyle (-\infty, +\infty).

Badając przebieg zmienności funkcji musimy również pamiętać, aby skontrolować, czy funkcja nie ma punktów przegięcia, w których nie istnieje druga pochodna.


Przykład 12.12.

Funkcja

\displaystyle f(x)=\left\{ \aligned \sqrt{x}, \text{ dla } x\geq 0 \\ -\sqrt{-x}, \text{ dla } x< 0 \endaligned \right .
jest ściśle wypukła w przedziale \displaystyle (-\infty, 0) i ściśle wklęsła w przedziale \displaystyle (0, \infty). Jest określona w punkcie \displaystyle x=0, ma więc punkt przegięcia \displaystyle x=0, który nie jest miejscem zerowym drugiej pochodnej


\displaystyle f''(x)=-\frac{1}{4}\mathrm{sgn}\, x |x|^{-\frac{3}{2}},
która jest różna od zera w dowolnym punkcie swojej dziedziny, tj. gdy \displaystyle x\neq 0.

Nierówność Jensena

Szereg ważnych nierówności, m.in. klasyczna nierówność między średnią arymetyczną, geometryczną a harmoniczną liczb
nieujemnych \displaystyle a, \displaystyle b:

\displaystyle \frac{2}{\frac{1}{a}+\frac{1}{b}}\leq\sqrt{ab}\leq \frac{1}{2}(a+b)
jest konsekwencją wypukłości pewnych funkcji. Można je wyprowadzić z nierówności Jensena.

Twierdzenie 12.13. [nierówność Jensena]

Jeśli funkcja \displaystyle f jest wypukła w przedziale \displaystyle (a,b), to zachodzi nierówność:

\displaystyle f(t_1 x_1 +t_2 x_2 +\dots +t_n x_n)\leq t_1 f(x_1) +t_2 f(x_2)+\dots +t_n f(x_n),
dla dowolnych liczb nieujemnych \displaystyle t_1, t_2, \dots, t_n takich, że

\displaystyle t_1+t_2+\dots +t_n =1

oraz dla dowolnych \displaystyle x_1, x_2, \dots , x_n z przedziału \displaystyle (a,b).

Dowód 12.13.

Gdy \displaystyle n=2 nierówność z tezy twierdzenia

\displaystyle f(t_1 x_1 +t_2 x_2)\leq t_1 f(x_1)+t_2 f(x_2),

gdy \displaystyle t_1 +t_2=1, \ t_1, t_2\geq 0, wynika z definicji wypukłości. Następnie dowodzimy dla \displaystyle k\geq 2 implikacji

\displaystyle \aligned \forall  t_1, t_2, \dots, t_k\geq 0, \ t_1+t_2+\dots +t_k=1 \ \forall x_1, x_2, \dots, x_k \in (a,b): \\  \ f(t_1 x_1 +t_2 x_2 +\dots +t_k x_k)\leq t_1 f(x_1) +t_2 f(x_2)+\dots +t_k f(x_k)\endaligned


\displaystyle \Downarrow


\displaystyle \aligned \forall s_1, s_2, \dots, s_{k+1}\geq 0, \ s_1+s_2+\dots +s_{k+1}=1 \ \forall y_1, y_2, \dots, y_{k+1} \in (a,b):\\  \ f(s_1 y_1 +s_2 y_2 +\dots +s_{k+1} y_{k+1})\leq s_1 f(y_1) +s_2 f(y_2)+\dots +s_{k+1} f(y_{k+1})\endaligned


(szczegóły zawarte są w ćwiczeniach do tego modułu). Stąd na mocy zasady indukcji matematycznej wynika prawdziwość twierdzenia.

image:End_of_proof.gif


Warunek \displaystyle t_1+t_2+\dots+t_n=1 spełniają liczby postaci \displaystyle t_i=\dfrac{p_i}{p_1+p_2+\dots+p_n}, gdzie \displaystyle p_1, p_2, \dots, p_n są dowolnymi liczbami rzeczywistymi dodatnimi. Oznaczmy przez \displaystyle \sum p_i=p_1+p_2+\dots+p_n sumę liczb \displaystyle p_i i analogicznie przez \displaystyle \sum p_ix_i=p_1x_1+p_2x_2+\dots+p_nx_n sumę iloczynów \displaystyle p_i x_i. Nierówność Jensena możemy również sformułować następująco:

Wniosek 12.14.

Jeśli \displaystyle f jest wypukła w przedziale \displaystyle (a,b), to zachodzi nierówność

\displaystyle  f\bigg(\frac{\sum x_i p_i}{\sum p_i}\bigg)\leq \frac{\sum p_i f(x_i)}{\sum p_i},

czyli

\displaystyle f\bigg(\frac{ x_1 p_1+x_2p_2+\dots +x_np_n}{p_1+p_2+\dots +p_n}\bigg)\leq \frac{ p_1 f(x_1)+p_2 f(x_2)+\dots+p_nf(x_n)}{p_1+p_2+\dots+p_n}

dla dowolnych liczb \displaystyle x_1, x_2, \dots, x_n z przedziału \displaystyle (a,b) i dla dowolnych liczb dodatnich \displaystyle p_1, p_2, \dots, p_n.

Przykład 12.15.

Funkcja \displaystyle x\mapsto \exp x jest wypukła, więc podstawiając w nierówności Jensena \displaystyle t_i=\ln x_i, gdzie \displaystyle x_i są dowolnymi dodatnimi liczbami rzeczywistymi oraz \displaystyle p_i=1 otrzymujemy

\displaystyle \exp\big(\frac{1}{n}(\ln x_1+\ln x_2 +\dots +\ln x_n)\big)\leq \frac{1}{n}\big(\exp \ln x_1+\exp \ln x_2+\dots+\exp \ln x_n\big)
\displaystyle \big(\exp(\ln x_1)\exp(\ln x_2)\dots \exp(\ln x_n)\big)^\frac{1}{n}\leq \frac{1}{n}\big(\exp \ln x_1+\exp \ln x_2+\dots+\exp \ln x_n\big)
\displaystyle (x_1 x_2 \dots x_n)^\frac{1}{n}\leq \frac{1}{n}(x_1+x_2+\dots+x_n),
nierówność pomiędzy średnią geometryczną \displaystyle (x_1 x_2 \dots x_n)^\frac{1}{n} a średnią arytmetyczną \displaystyle \frac{1}{n}(x_1+x_2+\dots+x_n) liczb dodatnich \displaystyle x_1, x_2, \dots, x_n.

Podstawiając z kolei w otrzymanej nierówności \displaystyle x_i=\frac{1}{y_i}, otrzymamy

\displaystyle \bigg(\frac{1}{y_1} \frac{1}{y_2} \dots \frac{1}{y_n}\bigg)^\frac{1}{n}\leq \frac{1}{n}(\frac{1}{y_1}+\frac{1}{y_2}+\dots+\frac{1}{y_n})

czyli

\displaystyle (y_1 y_2 \dots y_n)^\frac{1}{n}\geq \frac{n}{y_1^{-1}+y_2^{-1}+\dots+y_n^{-1}}

nierówność między średnią geometryczną \displaystyle (y_1 y_2 \dots y_n)^\frac{1}{n} a średnią harmoniczną \displaystyle \displaystyle \frac{n}{y_1^{-1}+y_2^{-1}+\dots+y_n^{-1}} liczb dodatnich \displaystyle y_1, y_2, \dots, y_n.

Wykazaliśmy w ten sposób nierówność pomiędzy średnią harmoniczną, geometryczną i arytmetyczną.



Rysunek do uwagi 12.17.

Wniosek 12.16.

Dla dowolnych liczb rzeczywistych dodatnich \displaystyle x_1, x_2, \dots, x_n zachodzi nierówność

\displaystyle  H(x_1, x_2, \dots, x_n)\leq G(x_1, x_2, \dots, x_n)\leq A(x_1, x_2, \dots, x_n),

gdzie

\displaystyle \aligned H(x_1, x_2, \dots, x_n)&:=\frac{n}{x_1^{-1}+x_2^{-1}+\dots+x_n^{-1}} \\ G(x_1, x_2, \dots, x_n)&:=(x_1 x_2 \dots x_n)^\frac{1}{n}\\ A(x_1, x_2, \dots, x_n)&:=\frac{1}{n}(x_1+x_2+\dots+x_n) \endaligned

są odpowiednio średnimi: harmoniczną, geometryczną i arytmetyczną liczb dodatnich \displaystyle x_1, x_2, \dots, x_n.


Uwaga 12.17.

W przypadku dwóch liczb dodatnich \displaystyle 0<a<b otrzymana nierówność ma klarowną interpretację geometryczną. Mając dane dwie proste prostopadłe \displaystyle k, \displaystyle l, przecinające się w punkcie \displaystyle O, odkładamy na jednej z nich, np. na prostej \displaystyle l odcinki długości \displaystyle a oraz \displaystyle b tak, aby \displaystyle OA=a, \displaystyle OB=b i \displaystyle A\in \overline{OB}. Niech \displaystyle S będzie środkiem odcinka \displaystyle \overline{AB}. Kreślimy okrąg o środku \displaystyle S i promieniu \displaystyle r=SA. Niech \displaystyle P będzie punktem styczności stycznej poprowadzonej do okręgu z punktu \displaystyle O. Łatwo spostrzec, że \displaystyle OS=\frac{1}{2}(a+b) jest średnią arytmetyczną odcinków \displaystyle OA=a i \displaystyle OB=b. Nietrudno też dowieść (stosując twierdzenie Pitagorasa do boków trójkąta prostokątnego \displaystyle \triangle OSP), że odcinek stycznej \displaystyle OP=\sqrt{ab} jest średnią geometryczną danych odcinków. Warto też dostrzec podobieństwo trójkątów prostokątnych \displaystyle \triangle OSP i \displaystyle \triangle OPQ, gdzie \displaystyle Q jest rzutem prostopadłym punktu \displaystyle P na prostą \displaystyle k. Odcinek \displaystyle PQ=\frac{2}{a^{-1}+b^{-1}} jest średnią harmoniczną danych odcinków \displaystyle a, \displaystyle b. Z interpretacji tej jasno wynika, że w przypadku, gdy \displaystyle 0<a<b w nierówności między średnimi mamy zawsze nierówność ostrą:

\displaystyle \frac{2}{\frac{1}{a}+\frac{1}{b}}<\sqrt{ab}<\frac{1}{2}(a+b).

Gdy punkt \displaystyle A zmierza do \displaystyle B (czyli, gdy \displaystyle a zmierza do \displaystyle b), promień \displaystyle r\to 0 i punkt \displaystyle P zmierza do \displaystyle S. W granicznym przypadku, gdy \displaystyle a=b, mamy \displaystyle r=0 oraz \displaystyle P=S=A=B i rezultacie trzy średnie: harmoniczna, geometryczna i arytmetyczna są równe.

Jeśli ustalimy \displaystyle b, natomiast punkt \displaystyle A zmierza do \displaystyle O, to \displaystyle r\to\frac{b}{2}, punkt \displaystyle P zmierza do \displaystyle O i w ten sposób średnia geometryczna i średnia harmoniczna liczb \displaystyle a, \displaystyle b zmierzają do zera, a średnia arytmetyczna do \displaystyle \frac{b}{2}.

Jeśli ustalimy punkt \displaystyle A, a punkt \displaystyle B będzie oddalał się w prawo po prostej \displaystyle k do nieskończoności, to \displaystyle r\to\infty, punkt \displaystyle P będzie również oddalał się nieograniczenie od punktu \displaystyle O i w rezultacie trzy średnie będą zmierzały do nieskończoności.

Jako wniosek z nierówności Jensena w ramach ćwiczeń dowodzimy nierówności Höldera i nierówności Minkowskiego.

Twierdzenie 12.18. [nierówność Höldera]

Jeśli \displaystyle p, \displaystyle q są liczbami dodatnimi spełniającymi równość \displaystyle \frac{1}{p}+\frac{1}{q}=1, to dla dowolnych liczb rzeczywistych \displaystyle x_1,...,x_n,y_1,...,y_n zachodzi nierówność

\displaystyle  \sum_{k=1}^n|x_ky_k|\leq \left(\sum_{k=1}^n|x_k|^p\right)^\frac1p\left(\sum_{k=1}^n|y_k|^q\right)^\frac1q,
gdzie \displaystyle n jest liczbą naturalną.

Twierdzenie 12.19. [nierówność Minkowskiego]

Jeśli \displaystyle p\geq 1 jest dowolną liczbą rzeczywistą, to dowolnych liczb rzeczywistych \displaystyle x_1,...,x_n,y_1,...,y_n zachodzi nierówność

\displaystyle \left( \sum_{k=1}^n |x_k+y_k|^p \right)^{\frac{1}{p}}\leq \left( \sum_{k=1}^n |x_k|^p\right)^{\frac{1}{p}}+\left( \sum_{k=1}^n |y_k|^p \right)^{\frac{1}{p}},
gdzie \displaystyle n jest liczbą naturalną.

Badanie przebiegu zmienności funkcji

Uwaga 12.20.

Klasyczny schemat badania przebiegu zmienności funkcji jednej zmiennej obejmuje:

(1) Wyznaczenie dziedziny funkcji.

(2) Sprawdzenie, czy funkcja jest okresowa, parzysta, nieparzysta.

(3) Wyznaczenie granic funkcji na końcach przedziałów, z których w sumie składa się dziedzina funkcji, z wyszczególnieniem końców przedziałów, w których funkcja jest ciągła.

(4) Wyznaczenie asymptot pionowych, poziomych, ukośnych.

(5) Wyznaczenie punktów charakterystycznych wykresu funkcji, np. miejsc zerowych, wartości w zerze; wyznaczenie zbioru, w którym funkcja przyjmuje wartości dodatnie, ujemne.

(6) Badanie pierwszej pochodnej:

  • określenie dziedziny pochodnej;
  • wyznaczenie miejsc zerowych pochodnej oraz zbioru, w którym pochodna jest dodatnia, ujemna.

(7) Wyznaczenie przedziałów monotoniczności funkcji.

(8) Wyznaczenie punktów krytycznych funkcji oraz ekstremów.

(9) Badanie drugiej pochodnej funkcji:

  • określenie dziedziny drugiej pochodnej;
  • wyznaczenie miejsc zerowych drugiej pochodnej oraz zbioru, w którym druga pochodna jest dodatnia, ujemna.

(10) Wyznaczenie przedziałów wypukłości i wklęsłości funkcji oraz punktów przegięcia funkcji.

(11) Zebranie uzyskanych danych o funkcji w tabeli.

(12) Sporządzenie wykresu w oparciu o uzyskane dane.

Powstaje oczywiste pytanie, na ile ten klasyczny schemat jest aktualny i potrzebny dziś, gdy dysponujemy komputerami z zainstalowanymi programami do obliczeń symbolicznych (np. MATHEMATICA, MAPLE) i zamiast wykonywać żmudne rachunki wymienione w punktach od (1) do (11) możemy od ręki obejrzeć wykres interesującej nas funkcji, czyli zacząć i skończyć badanie funkcji na punkcie (12).

Wszystkich, którzy podzielają pogląd, że klasyczny schemat badania funkcji jest przeżytkiem, prosimy o skonstruowanie wykresu funkcji

\displaystyle f(x)=\left\{\aligned (x+3)\exp\frac{x+1}{x-1}, \text{ dla } x\neq 1\\ 0, \text{ dla } x=1\endaligned \right .
np. za pomocą programu MATHEMATICA przez wypisanie w tym programie poleceń
f = (x+3)Exp[(x+1)/(x-1)] 

oraz

Plot[f, x, -5.0, 5.0]

a następnie prosimy o odczytanie z otrzymanego rysunku jakichkolwiek punktów charakterystycznych funkcji \displaystyle f.



Rysunek do przykładu 12.21.


Rysunek do przykładu 12.21.


Rysunek do przykładu 12.21.


Rysunek do przykładu 12.21.


Rysunek do przykładu 12.21.


Rysunek do przykładu 12.21.


Rysunek do przykładu 12.21.

Wobec oczywistej porażki (z wykresu, który przedstawia fragment niemal pionowej linii w pobliżu punktu \displaystyle x=1 można jedynie odczytać, że w zaproponowanym przedziale \displaystyle [-5, \ 5] funkcja przyjmuje duże wartości) powstaje potrzeba co najmniej powierzchownej analizy, która pozwoliłaby oszacować przedział, w którym funkcja może osiągać ekstrema. Próba poszukiwania po omacku metodą wybierania przedziału argumentów na chybił trafił być może po wielu próbach przyniosłaby zadawalający wynik w postaci przybliżonej, jednak prosta analiza znaku pochodnej danej funkcji znacznie szybciej prowadzi do znalezienia wszystkich ekstremów i innych punktów charakterystycznych danej funkcji i to w postaci dokładnej. Prześledźmy więc następujący przykład:


Przykład 12.21.

Klasyczny schemat badania funkcji

\displaystyle f(x)=\left\{ \begin{array}{ll} (x+3)\exp\frac{x+1}{x-1}, &\text{ dla } x\neq 1\\ 0, & \text{ dla } x=1\endaligned \right .
Obliczenia możemy wykonać samodzielnie, bądź wykorzystać procedury, które oferuje program do obliczeń symbolicznych (MATHEMATICA, MAPLE lub inny).

(1) Dziedziną \displaystyle f jest zbiór liczb rzeczywistych, na który składa się suma przedziałów \displaystyle (-\infty, 1)\cup(1, +\infty), w których funkcja \displaystyle f jest ciągła (będąc złożeniem funkcji ciągłych w obu przedziałach) oraz punkt \displaystyle \{1\}, w którym funkcja \displaystyle f może nie mieć granicy.

(2) Funkcja \displaystyle f nie jest ani parzysta, ani nieparzysta, ani okresowa.

(3) Wyznaczmy granice funkcji \displaystyle f na końcach przedziałów ciągłości

\begin{array}{l} \displaystyle \lim_{x\to-\infty} f(x)=-\infty,\\ \displaystyle \lim_{x\to 1-} f(x)=0,\\ \displaystyle \lim_{x\to 1+} f(x)=\infty,\\ \displaystyle \lim_{x\to\infty} f(x)=+\infty. \end{array}

Funkcja nie ma granicy w punkcie \displaystyle x=1, nie jest więc ciągła w tym punkcie.

(4) Z punktu 3. wynika, że funkcja ma asymptotę pionową prawostronną w punkcie \displaystyle x=1 i nie ma asymptot poziomych, co nie wyklucza istnienia asymptot ukośnych.


Sprawdzamy, czy istnieje granica ilorazu \displaystyle \frac{f(x)}{x} przy \displaystyle x\to \infty i przy \displaystyle x\to-\infty:

\displaystyle a=\lim_{x\to\infty}\frac{f(x)}{x}=e, \alpha=\lim_{x\to-\infty}\frac{f(x)}{x}=e.

Wobec istnienia tych granic wyznaczamy granice różnic (zob. przykład zastosowania reguły de l'Hospitala w poprzednim module): \displaystyle b=\lim_{x\to \infty}(f(x)-ex)=5e,\beta=\lim_{x\to -\infty}(f(x)-ex)=5e. Wynika stąd, że prosta \displaystyle y=ex+5e jest asymptotą ukośną wykresu funkcji \displaystyle f zarówno przy \displaystyle x\to\infty jak i przy \displaystyle x\to-\infty. Funkcja \displaystyle x\mapsto ex+5e w przedziale \displaystyle [-5, 5] osiąga wartości w przedziale \displaystyle [0, 10e].

Stąd ograniczenie zbioru wartości na wykresie generowanym przez program MATHEMATICA do tego przedziału, nieco poprawia wygląd wykresu funkcji \displaystyle f.

Plot[{f, Exp[1]x+5Exp[1]}, {x, -5, 5}, PlotRange -> {0,10 Exp[1]}]

(5) Funkcja \displaystyle f ma dwa miejsca zerowe. Są to punkty \displaystyle x=-3 oraz \displaystyle x=1. Ponieważ funkcja wykładnicza przyjmuje wyłącznie wartości dodatnie, więc czynnik \displaystyle \exp\frac{x+1}{x-1} jest dodatni. Na znak funkcji \displaystyle f ma wpływ jedynie czynnik \displaystyle x-3. Wobec tego funkcja \displaystyle f

  • jest ujemna w przedziale \displaystyle (-\infty, -3),
  • jest dodatnia w przedziałach \displaystyle (-3, 1) oraz \displaystyle (1, +\infty),
  • przyjmuje wartość zero w punktach \displaystyle x=-3 oraz \displaystyle x=1.

Ponadto \displaystyle f(0)=\frac{3}{e}.

Z twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym wynika, że funkcja \displaystyle f osiąga maksimum wewnątrz przedziału \displaystyle [-3,1]. Ponieważ \displaystyle f jest ciągła w przedziale \displaystyle (0, \infty) i zmierza do nieskończoności, gdy \displaystyle x\to 0+ oraz \displaystyle x\to\infty, więc \displaystyle f osiąga minimum lokalne w co najmniej jednym punkcie \displaystyle x_1>0.

(6) Badanie pierwszej pochodnej

\displaystyle f'(x)=\frac{x^2 -4x-5}{(x-1)^2}\exp\frac{x+1}{x-1}=\frac{(x+1)(x-5)}{(x-1)^2}\exp\frac{x+1}{x-1}.

  • Dziedziną pierwszej pochodnej jest suma przedziałów \displaystyle (-\infty, 1)\cup (1, \infty).
  • Miejscami zerowymi pierwszej pochodnej są \displaystyle x=-1 oraz \displaystyle x=5.

Pochodna jest dodatnia w zbiorze

\displaystyle \{f'>0\}=(-\infty, -1)\cup (5, \infty)
i jest ujemna w zbiorze
\displaystyle \{f'<0\}=(-1, 1)\cup (1,5).

(7) W oparciu o dane z punktu (6) wnioskujemy, że funkcja \displaystyle f rośnie w przedziałach

\displaystyle (-\infty, -1), \ \ (5,\infty)
i maleje w przedziałach
\displaystyle (-1, 1), \ \ (1,5).

(8) Zbiór punktów krytycznych funkcji \displaystyle f składa się z trzech elementów:

\displaystyle \{-1, \ 1, \ 5\},
to jest miejsc zerowych pochodnej \displaystyle -1, \displaystyle 5 oraz punktu \displaystyle 1, który należy do dziedziny funkcji i nie należy do dziedziny pochodnej. Z punktu 7. wynika, że

  • w punkcie \displaystyle x=-1 funkcja \displaystyle f osiąga maksimum lokalne \displaystyle f(-1)=2,
  • w punkcie \displaystyle x=1 funkcja \displaystyle f osiąga minimum lokalne \displaystyle f(1)=0,
  • w punkcie \displaystyle x=5 funkcja \displaystyle f osiąga minimum lokalne \displaystyle f(5)=8 \exp\frac{3}{2}=35,85\dots

Widzimy więc, że rysując wykres funkcji, musimy zadbać o to, aby zbiór wartości funkcji na wykresie zawierał co najmniej wartości \displaystyle f(1) oraz \displaystyle f(5).

Można np. przyjąć \displaystyle -6<x<8 oraz \displaystyle -10<y<50 i skorzystać z polecenia programu MATHEMATICA:

Plot[{f, Exp[1]x+5Exp[1]}, {x, -6, 8}, PlotRange ->{-10, 50}]

które wygeneruje wykres funkcji \displaystyle f i jej asymptoty ukośnej w zadanym obszarze płaszczyzny.

Dodatkowe polecenie

PlotPoints -> 1024

zwiększa rozdzielczość rysunku

PlotStyle -> {{Hue[0.95], Thickness[0.007]}, {Hue[0.3], Dashing[{0.02,0.03}]}}

rysuje wykres funkcji \displaystyle f w kolorze zadanym przez Hue[0.95] o grubości Thickness[0.007] oraz asymptotę ukośną tej funkcji kolorem Hue[0.95] linią przerywaną zefiniowaną za pomocą Dashing[0.02,0.03] natomiast

AspectRatio -> 5/2 

(stosunek wysokości do szerokości \displaystyle 5:2) zmienia format rysunku. Ostatecznie:

Plot[{f, Exp[1]x+5Exp[1]}, {x, -6, 8},
PlotRange -> {-10,50},
PlotPoints -> 1024,
PlotStyle -> {{Hue[0.95], Thickness[0.007]}, {Hue[0.3], Dashing[{0.02,0.03}]}},
AspectRatio -> 5/2]

(9) Druga pochodna funkcji

\displaystyle f''(x)=\frac{4(5x-1)}{(x-1)^4}\exp\frac{x+1}{x-1}
jest określona w zbiorze
\displaystyle (-\infty, 1)\cup (1, \infty).
Przyjmuje wartości dodatnie w zbiorze
\displaystyle \{f''>0\}=\big(\frac{1}{5}, 1\big)\cup (1, \infty),
a ujemne w zbiorze
\displaystyle \{f''<0\}=\big(-\infty, \frac{1}{5}\big).
Jedynym punktem, w którym zeruje się druga pochodna, jest \displaystyle x=\frac{1}{5}.

(10) W oparciu o dane (z punktu (9)) o znaku drugiej pochodnej wnioskujemy, że funkcja \displaystyle f jest (ściśle) wypukła w przedziałach

\displaystyle \big(\frac{1}{5}, 1\big), \ \ (1, \infty)
i jest (ściśle) wklęsła w przedziale
\displaystyle \big(-\infty, \frac{1}{5}\big).
Stąd punkt \displaystyle x=\frac{1}{5}, w którym funkcja przyjmuje wartość
\displaystyle f\big(\frac{1}{5}\big)=\frac{16}{5}\exp\big(-\frac{3}{2}\big)=0,71\dots ,
jest jedynym punktem przegięcia funkcji.

Program MATHEMATICA po wpisaniu polecenia

Plot[{f, y}, {x, -1, 1.5},
PlotRange -> {-1,3},
PlotPoints -> 1024,
PlotStyle -> {{Hue[0.95], Thickness[0.007]}, {Hue[0.5]}},
AspectRatio -> 1]

kreśli w przedziale \displaystyle [-1, \frac{3}{2}] wykres funkcji \displaystyle f i stycznej do wykresu o równaniu \displaystyle y=f'(x_p)(x-x_p)+f(x_p) w punkcie przegięcia \displaystyle x_p=\frac{1}{5}.

(11) Zebranie wszystkich punktów charakterystycznych funkcji \displaystyle f (miejsca punkty nieciągłości, miejsca zerowe funkcji, jej pierwszej i drugiej pochodnej, ekstrema, punkty przegięcia) w jednej tabeli usprawnia przygotowanie starannego wykresu.

(12) Na wykresie staramy się przedstawić wszystkie punkty

charakterystyczne funkcji \displaystyle f jak też jej asymptoty.