Wypukłość. Badanie funkcji jednej zmiennej

Wypukłość. Badanie funkcji jednej zmiennej



Definiujemy funkcje wypukłe i dowodzimy ich elementarnych własności. Podajemy związek wypukłości funkcji z monotonicznością jej pochodnej. Przedstawiamy nierówność Jensena, Minkowskiego, Höldera oraz klasyczną nierówność między średnią arytmetyczną, geometryczną i harmoniczną. Schemat badania przebiegu zmienności funkcji jednej zmiennej stanowi podsumowanie poprzednich czterech modułów.

Funkcje wypukłe

Funkcje wypukłe


wykres

Pojęcie wypukłości jest nam znane z geometrii. Mówimy, że podzbiór \( \displaystyle A \) przestrzeni wektorowej \( \displaystyle X \) jest wypukły, jeśli dowolny odcinek o końcach należących do zbioru \( \displaystyle A \) jest zawarty w tym zbiorze. Innymi słowy:

\( \displaystyle \forall x, y\in A \ \forall t\in [0,1] \ : \ (1-t)x+ty\in A. \)

Zbiór

\( \displaystyle \{(1-t)x+ty, \ 0\leq t\leq 1\} \)

jest odcinkiem o końcach \( \displaystyle x \), \( \displaystyle y \). Punkty \( \displaystyle x \), \( \displaystyle y \) uzyskamy, gdy w kombinacji liniowej \( \displaystyle (1-y)x+ty \) parametr \( \displaystyle t \) przyjmie odpowiednio wartość \( \displaystyle 0 \) lub \( \displaystyle 1 \). Gdy \( \displaystyle t=\frac{1}{2} \), otrzymujemy punkt \( \displaystyle \frac{1}{2}(x+y) \), który jest środkiem odcinka łączącego punkty \( \displaystyle x \) oraz \( \displaystyle y \). Zauważmy też, że zbiory

\( \displaystyle \{(1-t)x+ty, \ t\leq 1\} \)

oraz

\( \displaystyle\{(1-t)x+ty, \ 0\leq t\} \)

to - odpowiednio - półprosta o początku \( \displaystyle x \) przechodząca przez punkt \( \displaystyle y \) oraz półprosta o początku \( \displaystyle y \) przechodząca przez punkt \( \displaystyle x. \)

Definicję funkcji wypukłej opieramy na intuicji geometrycznej.

Definicja 12.1.

Mówimy, że funkcja \( \displaystyle f:(a,b)\mapsto \mathbb{R} \) jest wypukła w przedziale \( \displaystyle (a,b) \), jeśli jej nadwykres

\( \displaystyle \{(x, y) : a < x < b, \ y\geq f(x)\} \)

jest zbiorem wypukłym, to znaczy

\( \displaystyle \forall x, y\in (a,b) : x < y \ \forall t\in [0,1] \ f((1-t)x+ty)\leq (1-t)f(x)+tf(y). \)

Jeśli powyższa nierówność jest ostra (wewnątrz odcinka \( \displaystyle 0 < t < 1 \)), tzn.

\( \displaystyle \forall x, y\in (a,b) : x < y \ \forall t\in (0,1) \ f((1-t)x+ty) < (1-t)f(x)+tf(y), \)

to mówimy, że funkcja \( \displaystyle f \) jest ściśle wypukła w przedziale \( \displaystyle (a,b) \).

Z kolei, jeśli zachodzą nierówności przeciwne, tj.

\( \displaystyle \forall x, y\in (a,b) : x < y \ \forall t\in [0,1] : \ f((1-t)x+ty)\geq (1-t)f(x)+tf(y) \)

oraz odpowiednio

\( \displaystyle \forall x, y\in (a,b) : x < y \ \forall t\in (0,1) : \ f((1-t)x+ty)> (1-t)f(x)+tf(y), \)

to mówimy, że funkcja \( \displaystyle f \) jest wklęsła w przedziale \( \displaystyle (a,b) \) oraz - odpowiednio - ściśle wklęsła.

Zwróćmy uwagę, że jeśli funkcja nie jest wypukła w przedziale \( \displaystyle (a,b) \), to nie oznacza to, że jest wklęsła w tym przedziale. Na przykład funkcja Dirichleta

\( \displaystyle D(x)=\left\{\begin{align*} & 0, & \text{ dla } & x\in [0,1]\cap\mathbb{Q} \\ & 1, & \text{ dla } & x\in [0,1]\cap (\mathbb{R}\setminus \mathbb{Q})\end{align*} \right. \)

nie jest wypukła w żadnym przedziale \( \displaystyle (a,b)\subset [0,1] \), ale nie jest też wklęsła.

Zauważmy, że jeśli \( \displaystyle x=(1-t)a+tb \), to nierówność

\( \displaystyle f\big((1-t)a+tb\big)\leq (1-t)f(a)+tf(b), \)

za pomocą której określiliśmy wypukłość funkcji w przedziale \( \displaystyle (a,b) \), jest równoważna nierówności

\( \displaystyle f(x)\leq\frac{b-x}{b-a}f(a)+\frac{x-a}{b-a}f(b) \)

lub

\( \displaystyle 0\leq (b-x)f(a)+(a-b)f(x)+(x-a)f(b), \)

którą możemy również zapisać w postaci łatwej do zapamiętania za pomocą wyznacznika

\( \displaystyle w_f(x):=\det [1 & a & f(a) \\ 1 & x & f(x) \\ 1 & b & f(b)] \geq 0. \)

Uwaga 12.2.

Funkcja \( \displaystyle f \) jest wypukła (odpowiednio: ściśle wypukła, wklęsła, ściśle wklęsła) w przedziale \( \displaystyle (a,b) \) wtedy i tylko wtedy, gdy dla dowolnej liczby \( \displaystyle x\in(a,b) \) wyznacznik \( \displaystyle w_f(x)\geq 0 \) (odpowiednio: \( \displaystyle w_f(x)> 0 \), \( \displaystyle w_f(x)\leq 0 \), \( \displaystyle w_f(x) < 0 \)).

Elementarne własności funkcji wypukłych

Elementarne własności funkcji wypukłych


Sformułujmy parę uwag, które wynikają bezpośrednio z definicji wypukłości funkcji.

Uwaga 12.3.

a) Jeśli \( \displaystyle f \) jest wypukła w przedziale \( \displaystyle (a,b) \), to jest również wypukła w dowolnym mniejszym przedziale \( \displaystyle (a_1, b_1) \) zawartym w \( \displaystyle (a,b). \)

b) Funkcja \( \displaystyle x\mapsto f(x) \) jest wypukła (odpowiednio: ściśle wypukła) w przedziale \( \displaystyle (a,b) \) wtedy i tylko wtedy, gdy funkcja \( \displaystyle x\mapsto -f(x) \) jest wklęsła (odpowiednio: ściśle wklęsła) w tym przedziale.

c) Jeśli \( \displaystyle C>0 \) jest stałą dodatnią, to funkcja \( \displaystyle x\mapsto C f(x) \) jest wypukła wtedy i tylko wtedy, gdy \( \displaystyle f \) jest wypukła.

d) Jeśli \( \displaystyle C \) jest dowolną stałą, to funkcja \( \displaystyle x\mapsto C+ f(x) \) jest wypukła wtedy i tylko wtedy, gdy \( \displaystyle f \) jest wypukła.

e) Suma funkcji wypukłych jest funkcją wypukłą.

Kolejne elementarne własności funkcji wypukłych podaje

Twierdzenie 12.4.

a) Złożenie \( \displaystyle g\circ f \) funkcji wypukłych \( \displaystyle f \) i \( \displaystyle g \) jest funkcją wypukłą, jeśli \( \displaystyle g \) jest funkcją rosnącą.

b) Funkcja \( \displaystyle g \) odwrotna do funkcji \( \displaystyle f \) wypukłej rosnącej jest wklęsła rosnąca.

c) Funkcja ściśle wypukła w przedziale \( \displaystyle (a,b) \) nie osiąga maksimum w żadnym punkcie tego przedziału.

d) Funkcja ściśle wklęsła w przedziale \( \displaystyle (a,b) \) nie osiąga minimum w żadnym punkcie tego przedziału.

Dowód 12.4.

a) Funkcja \( \displaystyle f \) jest wypukła w \( \displaystyle (a,b) \), więc

\( \displaystyle f\big((1-t)x+ty\big)\leq (1-t)f(x)+tf(y) \)

dla dowolnych \( \displaystyle x,y\in (a,b) \), \( \displaystyle t\in [0,1] \). Mamy następnie nierówność

\( \displaystyle g\bigg(f\big((1-t)x+ty\big)\bigg)\leq g\big((1-t)f(x)+tf(y)\big), \)

ponieważ funkcja \( \displaystyle g \) jest rosnąca. Zuwagi na wypukłość \( \displaystyle g \) mamy

\( \displaystyle g\big((1-t)f(x)+tf(y)\big)\leq (1-t)g(f(x))+tg(f(y)), \)

czyli

\( \displaystyle (g\circ f)\big((1-t)x+ty\big)\leq (1-t)(g\circ f )(x)+t(g\circ f )(y) \)

dla dowolnych \( \displaystyle x,y\in (a,b) \) i \( \displaystyle 0\leq t\leq 1 \). Stąd złożenie \( \displaystyle g\circ f \) jest funkcją wypukłą.

b) Niech \( \displaystyle a < x_1 < x_2 < b \) i niech \( \displaystyle y_1=f(x_1) \), \( \displaystyle y_2=f(x_2) \). Wówczas \( \displaystyle g(y_1)=x_1 \) oraz \( \displaystyle g(y_2)=x_2 \). Funkcja odwrotna do rosnącej jest rosnąca, gdyż

\( \displaystyle \begin{align*} x_1 & < x_2 & & \Leftrightarrow \ \ f(x_1) < f(x_2) \\ & & \Updownarrow & \\ g(y_1) & < g(y_2) & & \Leftrightarrow \ \ y_1 < y_2.\end{align*} \)

Z wypukłości funkcji \( \displaystyle f \) mamy

\( \displaystyle f\big((1-t)x_1 +t x_2\big) \leq (1-t)f(x_1)+tf(x_2) \ \ \text{ dla } t\in [0,1], \)

co jest równoważne nierównościom

\( \displaystyle \begin{align*} & g\bigg(f\big((1-t)x_1 +t x_2\big)\bigg) & \leq & g\big((1-t)y_1+ty_2\big) & \\ & (1-t)x_1 +t x_2 & \leq & g\big((1-t)y_1+ty_2\big) & \\ & (1-t)g(y_1) +t g(y_2) & \leq & g\big((1-t)y_1+ty_2\big) & \text{ dla } t\in [0,1], \end{align*} \)

czyli \( \displaystyle g \) jest wklęsła.

c) Przypuśćmy wbrew tezie, że funkcja \( \displaystyle f \) osiąga maksimum w pewnym punkcie \( \displaystyle x_0\in(a,b) \). Funkcja \( \displaystyle f \) nie jest stała, istnieje więc liczba \( \displaystyle h>0 \) taka, że \( \displaystyle f(x_0-h) < f(x_0) \) oraz \( \displaystyle f(x_0+h) < f(x_0) \). Wobec tego

\( \displaystyle \frac{1}{2}f(x_0-h)+\frac{1}{2}f(x_0+h) < f(x_0)=f\big(\frac{1}{2}(x_0-h)+\frac{1}{2}(x_0+h)\big) \)

co oznacza, że funkcja \( \displaystyle f \) nie jest wypukła w przedziale \( \displaystyle (x_0-h, x_0+h) \). Sprzeczność.

d) Dowód przebiega podobnie do dowodu własności c).

wykres

Definicja 12.5.

Jeśli dla pewnej liczby \( \displaystyle h>0 \) funkcja \( \displaystyle f \), określona w przedziale \( \displaystyle (a-h, a+h) \), jest

  • ściśle wypukła w przedziale \( \displaystyle (a-h,a) \) i ściśle wklęsła w przedziale \( \displaystyle (a, a+h) \)

albo na odwrót:

  • ściśle wklęsła w przedziale \( \displaystyle (a-h,a) \) i ściśle wypukła w przedziale \( \displaystyle (a, a+h) \),

to mówimy, że punkt \( \displaystyle a \) jest punktem przegięcia (wykresu) funkcji \( \displaystyle f \).

Przykład 12.6.

a) Funkcja stała \( \displaystyle f(x)=C \) jest wypukła w przedziale \( \displaystyle (-\infty, \infty) \); nie jest ściśle wypukła.

b) Funkcja \( \displaystyle f(x)=|x| \) jest wypukła w każdym przedziale \( \displaystyle (-\infty, \infty) \); nie jest ściśle wypukła.

c) Funkcja \( \displaystyle f(x)=x^{2n} \) jest ściśle wypukła w całym zbiorze liczb rzeczywistych, gdy wykładnik \( \displaystyle 2n \) jest dowolną parzystą liczbą dodatnią. Gdy \( \displaystyle 2n \) jest parzystą liczbą ujemną, to \( \displaystyle f \) jest ściśle wypukła w obu przedziałach \( \displaystyle (-\infty, 0) \) oraz \( \displaystyle (0, \infty) \).

d) Gdy wykładnik \( \displaystyle 2n+1 \) jest nieparzystą liczbą dodatnią lub ujemną, funkcja \( \displaystyle f(x)=x^{2n+1} \) jest ściśle wypukła w przedziale \( \displaystyle (0,\infty) \) i jest ściśle wklęsła w przedziale \( \displaystyle (-\infty, 0) \). Punkt \( \displaystyle 0 \) jest więc punktem przegięcia funkcji \( \displaystyle f(x)=x^{2n+1} \), gdy wykładnik jest dowolną liczbą nieparzystą dodatnią. Gdy wykładnik \( \displaystyle 2n+1 \) jest liczbą ujemną, liczba \( \displaystyle 0 \) nie należy do dziedziny funkcji \( \displaystyle f \), nie jest więc punktem przegięcia funkcji \( \displaystyle f \).

e) Funkcja \( \displaystyle f(x)=\sin x \) jest ściśle wypukła w każdym z przedziałów \( \displaystyle (-\pi+2k\pi, 0+2k\pi) \) i jest ściśle wklęsła w każdym z przedziałów \( \displaystyle (0+2k\pi, \pi+2k\pi) \), \( \displaystyle k\in\mathbb{Z} \). Stąd każdy punkt \( \displaystyle k \pi \), \( \displaystyle k\in\mathbb{Z} \), jest punktem przegięcia tej funkcji.

Wypukłość funkcji a monotoniczność jej pochodnej

Wypukłość funkcji a monotoniczność jej pochodnej


Badanie wypukłości funkcji różniczkowalnej można sprowadzić do badania monotoniczności jej pochodnej.

Twierdzenie 12.7

Niech \( \displaystyle f \) będzie funkcją różniczkowalną w przedziale \( \displaystyle (a,b) \). Funkcja \( \displaystyle f \) jest wypukła w przedziale \( \displaystyle (a,b) \) wtedy i tylko wtedy, gdy jej pochodna \( \displaystyle f' \) jest rosnąca.

Dowód 12.7.

Jeśli funkcja \( \displaystyle f \) jest wypukła w przedziale \( \displaystyle (\alpha, \beta) \), to dla dowolnych liczb \( \displaystyle a,b\in (\alpha, \beta) \), \( \displaystyle a < b \) oraz dla dowolnego punktu \( \displaystyle x\in (a,b) \) zachodzi nierówność:

\( \displaystyle 0\leq (b-x)f(a)+(a-b)f(x)+(x-a)f(b), \)

którą możemy zapisać w równoważnej postaci:

\( \displaystyle \frac{f(x)-f(a)}{x-a}\leq \frac{f(b)-f(x)}{b-x}. \)

Gdy \( \displaystyle x\to a \) lub \( \displaystyle x\to b \), wobec różniczkowalności \( \displaystyle f \), otrzymamy

\( \displaystyle f'(a)\leq \frac{f(b)-f(a)}{b-a} \)

oraz

\( \displaystyle \frac{f(b)-f(a)}{b-a} \leq f'(b). \)

Stąd \( \displaystyle f'(a)\leq f'(b) \), a więc pochodna \( \displaystyle f' \) jest rosnąca w przedziale \( \displaystyle (\alpha, \beta) \).

Załóżmy teraz z kolei, że pochodna \( \displaystyle f' \) jest funkcją rosnącą. Z twierdzenia Lagrange'a o wartości średniej istnieją punkty \( \displaystyle \xi\in (a,x) \) oraz \( \displaystyle \eta\in (x,b) \) takie, że

\( \displaystyle \frac{f(x)-f(a)}{x-a}=f'(\xi) \)

oraz

\( \displaystyle \frac{f(b)-f(x)}{b-x}=f'(\eta). \)

Pamiętamy, że \( \displaystyle a < \xi < x < \eta < b \). Skoro \( \displaystyle f' \) jest rosnąca w przedziale \( \displaystyle (\alpha, \beta) \), więc \( \displaystyle f'(\xi)\leq f'(\eta) \), czyli

\( \displaystyle \frac{f(x)-f(a)}{x-a}\leq \frac{f(b)-f(x)}{b-x}, \)

co wobec dowolności wyboru punktów \( \displaystyle a < x < b \) z przedziału \( \displaystyle (\alpha, \beta) \) oznacza, że funkcja \( \displaystyle f \) jest wypukła.

Pamiętamy, że monotoniczność funkcji różniczkowalnej jest ściśle związana ze znakiem jej pochodnej. Stąd monotoniczność pochodnej jest związana ze znakiem drugiej pochodnej funkcji.

Wniosek 12.8.

Niech \( \displaystyle f \) będzie funkcją dwukrotnie

różniczkowalną w przedziale \( \displaystyle (a,b) \). Jeśli w dowolnym punkcie \( \displaystyle x\in (a,b) \) druga pochodna \( \displaystyle f''(x)\geq 0 \) (odpowiednio: \( \displaystyle f''(x)\leq 0 \)), to funkcja \( \displaystyle f \) jest wypukła (odpowiednio: wklęsła) w tym przedziale.

wykres

Przykład 12.9.

a) Funkcja wykładnicza \( \displaystyle x\mapsto a^x \) jest ściśle wypukła w przedziale \( \displaystyle (-\infty, \infty) \), gdy \( \displaystyle a\in (0,1)\cup (1, \infty) \), ponieważ jej druga pochodna \( \displaystyle \frac{d^2}{dx^2}a^x=(\ln a)^2 a^x \) jest dodatnia w każdym punkcie \( \displaystyle x\in \mathbb{R} \). W przypadku, gdy \( \displaystyle a=1 \), funkcja stała \( \displaystyle f(x)=1^x=1 \) jest także wypukła, ale nie jest ściśle wypukła.

b) Funkcja logarytmiczna \( \displaystyle x\mapsto -\ln |x| \) jest ściśle wypukła w przedziałach \( \displaystyle (-\infty, 0) \) oraz \( \displaystyle (0, \infty) \), gdyż jej druga pochodna

\( \displaystyle \frac{d^2}{dx^2}(-\ln |x|)=\frac{1}{x^2} \)

jest dodatnia dla \( \displaystyle x\neq 0 \).

c) Jeśli \( \displaystyle f \) jest funkcją wypukłą, to również \( \displaystyle \exp f: x\mapsto e^{f(x)} \) jest funkcją wypukłą, gdyż jest złożeniem funkcji wypukłej \( \displaystyle f: x\mapsto f(x) \) i rosnącej funkcji wypukłej \( \displaystyle \exp: u\mapsto \exp u \).

Z twierdzenia o monotoniczności pochodnej funkcji wypukłej wynika również warunek konieczny istnienia punktu przegięcia funkcji dwukrotnie różniczkowalnej w przedziale \( \displaystyle (a,b) \).

Wniosek 12.10.

Niech \( \displaystyle f \) będzie funkcją dwukrotnie różniczkowalną w przedziale \( \displaystyle (a,b) \). Jeśli \( \displaystyle x_0\in (a,b) \) jest punktem przegięcia funkcji \( \displaystyle f \), to \( \displaystyle f''(x_0)=0 \).

Zwróćmy uwagę, że zerowanie drugiej pochodnej nie jest warunkiem wystarczającym istnienia punktu przegięcia.

Każda z funkcji \( \displaystyle f(x)=x^{2n} \), gdy \( \displaystyle n\geq 2 \), ma zerową drugą pochodną w punkcie \( \displaystyle x=0 \), jednak punkt ten nie jest dla żadnej z nich punktem przegięcia, gdyż każda z tych funkcji jest ściśle wypukła w przedziale \( \displaystyle (-\infty, +\infty) \).

Badając przebieg zmienności funkcji musimy również pamiętać, aby skontrolować, czy funkcja nie ma punktów przegięcia, w których nie istnieje druga pochodna.

Przykład 12.12.

Funkcja

\( \displaystyle f(x)=\left\{ \begin{array}{lll} \sqrt{x}, \text{ dla } x\geq 0 \\ -\sqrt{-x}, \text{ dla } x < 0 \end{array} \right. \)

jest ściśle wypukła w przedziale \( \displaystyle (-\infty, 0) \) i ściśle wklęsła w przedziale \( \displaystyle (0, \infty) \). Jest określona w punkcie \( \displaystyle x=0 \), ma więc punkt przegięcia \( \displaystyle x=0 \), który nie jest miejscem zerowym drugiej pochodnej

\( \displaystyle f''(x)=-\frac{1}{4}\mathrm{sgn}\, x |x|^{-\frac{3}{2}}, \)

która jest różna od zera w dowolnym punkcie swojej dziedziny, tj. gdy \( \displaystyle x\neq 0 \).

Nierówność Jensena

Nierówność Jensena


Szereg ważnych nierówności, m.in. klasyczna nierówność między średnią arymetyczną, geometryczną a harmoniczną liczb

nieujemnych \( \displaystyle a \), \( \displaystyle b \):

\( \displaystyle \frac{2}{\frac{1}{a}+\frac{1}{b}}\leq\sqrt{ab}\leq \frac{1}{2}(a+b) \)

jest konsekwencją wypukłości pewnych funkcji. Można je wyprowadzić z nierówności Jensena.

Twierdzenie 12.13. [nierówność Jensena]

Jeśli funkcja \( \displaystyle f \) jest wypukła w przedziale \( \displaystyle (a,b) \), to zachodzi nierówność:

\( \displaystyle f(t_1 x_1 +t_2 x_2 +\dots +t_n x_n)\leq t_1 f(x_1) +t_2 f(x_2)+\dots +t_n f(x_n), \)

dla dowolnych liczb nieujemnych \( \displaystyle t_1, t_2, \dots, t_n \) takich, że

\( \displaystyle t_1+t_2+\dots +t_n =1 \)

oraz dla dowolnych \( \displaystyle x_1, x_2, \dots , x_n \) z przedziału \( \displaystyle (a,b) \).

Dowód 12.13.

Gdy \( \displaystyle n=2 \) nierówność z tezy twierdzenia

\( \displaystyle f(t_1 x_1 +t_2 x_2)\leq t_1 f(x_1)+t_2 f(x_2), \)

gdy \( \displaystyle t_1 +t_2=1, \ t_1, t_2\geq 0 \), wynika z definicji wypukłości. Następnie dowodzimy dla \( \displaystyle k\geq 2 \) implikacji

\( \displaystyle \begin{align*} \forall t_1, t_2, \dots, t_k\geq 0, \ t_1+t_2+\dots +t_k=1 \ \forall x_1, x_2, \dots, x_k \in (a,b): \\ \ f(t_1 x_1 +t_2 x_2 +\dots +t_k x_k)\leq t_1 f(x_1) +t_2 f(x_2)+\dots +t_k f(x_k)\end{align*} \)

\( \displaystyle \Downarrow \)

\( \displaystyle \begin{align*} \forall s_1, s_2, \dots, s_{k+1}\geq 0, \ s_1+s_2+\dots +s_{k+1}=1 \ \forall y_1, y_2, \dots, y_{k+1} \in (a,b): \\ \ f(s_1 y_1 +s_2 y_2 +\dots +s_{k+1} y_{k+1})\leq s_1 f(y_1) +s_2 f(y_2)+\dots +s_{k+1} f(y_{k+1})\end{align*} \)

(szczegóły zawarte są w ćwiczeniach do tego modułu). Stąd na mocy zasady indukcji matematycznej wynika prawdziwość twierdzenia.

Warunek \( \displaystyle t_1+t_2+\dots+t_n=1 \) spełniają liczby postaci \( \displaystyle t_i=\frac{p_i}{p_1+p_2+\dots+p_n} \), gdzie \( \displaystyle p_1, p_2, \dots, p_n \) są dowolnymi liczbami rzeczywistymi dodatnimi. Oznaczmy przez \( \displaystyle \sum p_i=p_1+p_2+\dots+p_n \) sumę liczb \( \displaystyle p_i \) i analogicznie przez \( \displaystyle \sum p_ix_i=p_1x_1+p_2x_2+\dots+p_nx_n \) sumę iloczynów \( \displaystyle p_i x_i \). Nierówność Jensena możemy również sformułować następująco:

Wniosek 12.14.

Jeśli \( \displaystyle f \) jest wypukła w przedziale \( \displaystyle (a,b) \), to zachodzi nierówność

\( \displaystyle f\bigg(\frac{\sum x_i p_i}{\sum p_i}\bigg)\leq \frac{\sum p_i f(x_i)}{\sum p_i}, \)

czyli

\( \displaystyle f\bigg(\frac{ x_1 p_1+x_2p_2+\dots +x_np_n}{p_1+p_2+\dots +p_n}\bigg)\leq \frac{ p_1 f(x_1)+p_2 f(x_2)+\dots+p_nf(x_n)}{p_1+p_2+\dots+p_n} \)

dla dowolnych liczb \( \displaystyle x_1, x_2, \dots, x_n \) z przedziału \( \displaystyle (a,b) \) i dla dowolnych liczb dodatnich \( \displaystyle p_1, p_2, \dots, p_n \).

Przykład 12.15.

Funkcja \( \displaystyle x\mapsto \exp x \) jest wypukła, więc podstawiając w nierówności Jensena \( \displaystyle t_i=\ln x_i \), gdzie \( \displaystyle x_i \) są dowolnymi dodatnimi liczbami rzeczywistymi oraz \( \displaystyle p_i=1 \) otrzymujemy

\( \displaystyle \exp\big(\frac{1}{n}(\ln x_1+\ln x_2 +\dots +\ln x_n)\big)\leq \frac{1}{n}\big(\exp \ln x_1+\exp \ln x_2+\dots+\exp \ln x_n\big) \)

\( \displaystyle \big(\exp(\ln x_1)\exp(\ln x_2)\dots \exp(\ln x_n)\big)^\frac{1}{n}\leq \frac{1}{n}\big(\exp \ln x_1+\exp \ln x_2+\dots+\exp \ln x_n\big) \)

\( \displaystyle (x_1 x_2 \dots x_n)^\frac{1}{n}\leq \frac{1}{n}(x_1+x_2+\dots+x_n), \)

nierówność pomiędzy średnią geometryczną \( \displaystyle (x_1 x_2 \dots x_n)^\frac{1}{n} \) a średnią arytmetyczną \( \displaystyle \frac{1}{n}(x_1+x_2+\dots+x_n) \) liczb dodatnich \( \displaystyle x_1, x_2, \dots, x_n \).

Podstawiając z kolei w otrzymanej nierówności \( \displaystyle x_i=\frac{1}{y_i} \), otrzymamy

\( \displaystyle \bigg(\frac{1}{y_1} \frac{1}{y_2} \dots \frac{1}{y_n}\bigg)^\frac{1}{n}\leq \frac{1}{n}(\frac{1}{y_1}+\frac{1}{y_2}+\dots+\frac{1}{y_n}) \)

czyli

\( \displaystyle (y_1 y_2 \dots y_n)^\frac{1}{n}\geq \frac{n}{y_1^{-1}+y_2^{-1}+\dots+y_n^{-1}} \)

nierówność między średnią geometryczną \( \displaystyle (y_1 y_2 \dots y_n)^\frac{1}{n} \) a średnią harmoniczną \( \displaystyle \displaystyle \frac{n}{y_1^{-1}+y_2^{-1}+\dots+y_n^{-1}} \) liczb dodatnich \( \displaystyle y_1, y_2, \dots, y_n \).

Wykazaliśmy w ten sposób nierówność pomiędzy średnią harmoniczną, geometryczną i arytmetyczną.

wykres

Rysunek do uwagi 12.17.

Wniosek 12.16.

Dla dowolnych liczb rzeczywistych dodatnich \( \displaystyle x_1, x_2, \dots, x_n \) zachodzi nierówność

\( \displaystyle H(x_1, x_2, \dots, x_n)\leq G(x_1, x_2, \dots, x_n)\leq A(x_1, x_2, \dots, x_n), \)

gdzie

\( \displaystyle \begin{align*} H(x_1, x_2, \dots, x_n) & :=\frac{n}{x_1^{-1}+x_2^{-1}+\dots+x_n^{-1}} \\ G(x_1, x_2, \dots, x_n) & :=(x_1 x_2 \dots x_n)^\frac{1}{n} \\ A(x_1, x_2, \dots, x_n) & :=\frac{1}{n}(x_1+x_2+\dots+x_n) \end{align*} \)

są odpowiednio średnimi: harmoniczną, geometryczną i arytmetyczną liczb dodatnich \( \displaystyle x_1, x_2, \dots, x_n \).

Uwaga 12.17.

W przypadku dwóch liczb dodatnich \( \displaystyle 0 < a < b \) otrzymana nierówność ma klarowną interpretację geometryczną. Mając dane dwie proste prostopadłe \( \displaystyle k \), \( \displaystyle l \), przecinające się w punkcie \( \displaystyle O \), odkładamy na jednej z nich, np. na prostej \( \displaystyle l \) odcinki długości \( \displaystyle a \) oraz \( \displaystyle b \) tak, aby \( \displaystyle OA=a \), \( \displaystyle OB=b \) i \( \displaystyle A\in \overline{OB} \). Niech \( \displaystyle S \) będzie środkiem odcinka \( \displaystyle \overline{AB} \). Kreślimy okrąg o środku \( \displaystyle S \) i promieniu \( \displaystyle r=SA \). Niech \( \displaystyle P \) będzie punktem styczności stycznej poprowadzonej do okręgu z punktu \( \displaystyle O \). Łatwo spostrzec, że \( \displaystyle OS=\frac{1}{2}(a+b) \) jest średnią arytmetyczną odcinków \( \displaystyle OA=a \) i \( \displaystyle OB=b \). Nietrudno też dowieść (stosując twierdzenie Pitagorasa do boków trójkąta prostokątnego \( \displaystyle \triangle OSP \)), że odcinek stycznej \( \displaystyle OP=\sqrt{ab} \) jest średnią geometryczną danych odcinków. Warto też dostrzec podobieństwo trójkątów prostokątnych \( \displaystyle \triangle OSP \) i \( \displaystyle \triangle OPQ \), gdzie \( \displaystyle Q \) jest rzutem prostopadłym punktu \( \displaystyle P \) na prostą \( \displaystyle k \). Odcinek \( \displaystyle PQ=\frac{2}{a^{-1}+b^{-1}} \) jest średnią harmoniczną danych odcinków \( \displaystyle a \), \( \displaystyle b \). Z interpretacji tej jasno wynika, że w przypadku, gdy \( \displaystyle 0 < a < b \) w nierówności między średnimi mamy zawsze nierówność ostrą:

\( \displaystyle \frac{2}{\frac{1}{a}+\frac{1}{b}} < \sqrt{ab} < \frac{1}{2}(a+b). \)

Gdy punkt \( \displaystyle A \) zmierza do \( \displaystyle B \) (czyli, gdy \( \displaystyle a \) zmierza do \( \displaystyle b \)), promień \( \displaystyle r\to 0 \) i punkt \( \displaystyle P \) zmierza do \( \displaystyle S \). W granicznym przypadku, gdy \( \displaystyle a=b \), mamy \( \displaystyle r=0 \) oraz \( \displaystyle P=S=A=B \) i rezultacie trzy średnie: harmoniczna, geometryczna i arytmetyczna są równe.
Jeśli ustalimy \( \displaystyle b \), natomiast punkt \( \displaystyle A \) zmierza do \( \displaystyle O \), to \( \displaystyle r\to\frac{b}{2} \), punkt \( \displaystyle P \) zmierza do \( \displaystyle O \) i w ten sposób średnia geometryczna i średnia harmoniczna liczb \( \displaystyle a \), \( \displaystyle b \) zmierzają do zera, a średnia arytmetyczna do \( \displaystyle \frac{b}{2} \).

Jeśli ustalimy punkt \( \displaystyle A \), a punkt \( \displaystyle B \) będzie oddalał się w prawo po prostej \( \displaystyle k \) do nieskończoności, to \( \displaystyle r\to\infty \), punkt \( \displaystyle P \) będzie również oddalał się nieograniczenie od punktu \( \displaystyle O \) i w rezultacie trzy średnie będą zmierzały do nieskończoności.

Jako wniosek z nierówności Jensena w ramach ćwiczeń dowodzimy nierówności Höldera i nierówności Minkowskiego.

Twierdzenie 12.18. [nierówność Höldera]

Jeśli \( \displaystyle p \), \( \displaystyle q \) są liczbami dodatnimi spełniającymi równość \( \displaystyle \frac{1}{p}+\frac{1}{q}=1 \), to dla dowolnych liczb rzeczywistych \( \displaystyle x_1,...,x_n,y_1,...,y_n \) zachodzi nierówność

\( \displaystyle \sum_{k=1}^n|x_ky_k|\leq \left(\sum_{k=1}^n|x_k|^p \right)^\frac1p \left(\sum_{k=1}^n|y_k|^q \right)^\frac1q, \)

gdzie \( \displaystyle n \) jest liczbą naturalną.

Twierdzenie 12.19. [nierówność Minkowskiego]

Jeśli \( \displaystyle p\geq 1 \) jest dowolną liczbą rzeczywistą, to dowolnych liczb rzeczywistych \( \displaystyle x_1,...,x_n,y_1,...,y_n \) zachodzi nierówność

\( \displaystyle \left( \sum_{k=1}^n |x_k+y_k|^p \right)^{\frac{1}{p}}\leq \left( \sum_{k=1}^n |x_k|^p \right )^{\frac{1}{p}}+ \left( \sum_{k=1}^n |y_k|^p \right )^{\frac{1}{p}}, \)

gdzie \( \displaystyle n \) jest liczbą naturalną.

Badanie przebiegu zmienności funkcji

Badanie przebiegu zmienności funkcji


Uwaga 12.20.

Klasyczny schemat badania przebiegu zmienności funkcji jednej zmiennej obejmuje:

(1) Wyznaczenie dziedziny funkcji.

(2) Sprawdzenie, czy funkcja jest okresowa, parzysta, nieparzysta.

(3) Wyznaczenie granic funkcji na końcach przedziałów, z których w sumie składa się dziedzina funkcji, z wyszczególnieniem końców przedziałów, w których funkcja jest ciągła.

(4) Wyznaczenie asymptot pionowych, poziomych, ukośnych.

(5) Wyznaczenie punktów charakterystycznych wykresu funkcji, np. miejsc zerowych, wartości w zerze; wyznaczenie zbioru, w którym funkcja przyjmuje wartości dodatnie, ujemne.

(6) Badanie pierwszej pochodnej:

  • określenie dziedziny pochodnej;
  • wyznaczenie miejsc zerowych pochodnej oraz zbioru, w którym pochodna jest dodatnia, ujemna.

(7) Wyznaczenie przedziałów monotoniczności funkcji.

(8) Wyznaczenie punktów krytycznych funkcji oraz ekstremów.

(9) Badanie drugiej pochodnej funkcji:

  • określenie dziedziny drugiej pochodnej;
  • wyznaczenie miejsc zerowych drugiej pochodnej oraz zbioru, w którym druga pochodna jest dodatnia, ujemna.

(10) Wyznaczenie przedziałów wypukłości i wklęsłości funkcji oraz punktów przegięcia funkcji.

(11) Zebranie uzyskanych danych o funkcji w tabeli.

(12) Sporządzenie wykresu w oparciu o uzyskane dane.

Powstaje oczywiste pytanie, na ile ten klasyczny schemat jest aktualny i potrzebny dziś, gdy dysponujemy komputerami z zainstalowanymi programami do obliczeń symbolicznych (np. MATHEMATICA, MAPLE) i zamiast wykonywać żmudne rachunki wymienione w punktach od (1) do (11) możemy od ręki obejrzeć wykres interesującej nas funkcji, czyli zacząć i skończyć badanie funkcji na punkcie (12).

Wszystkich, którzy podzielają pogląd, że klasyczny schemat badania funkcji jest przeżytkiem, prosimy o skonstruowanie wykresu funkcji

\( \displaystyle f(x)=\left\{\begin{align*} (x+3)\exp\frac{x+1}{x-1}, \text{ dla } x\neq 1 \\ 0, \text{ dla } x=1\end{align*} \right. \)

np. za pomocą programu MATHEMATICA przez wypisanie w tym programie poleceń

f = (x+3)Exp[(x+1)/(x-1)]
 
oraz 
 
Plot[f, x, -5.0, 5.0]

a następnie prosimy o odczytanie z otrzymanego rysunku jakichkolwiek punktów charakterystycznych funkcji \( \displaystyle f \).

wykresy

Wobec oczywistej porażki (z wykresu, który przedstawia fragment niemal pionowej linii w pobliżu punktu \( \displaystyle x=1 \) można jedynie odczytać, że w zaproponowanym przedziale \( \displaystyle [-5, \ 5] \) funkcja przyjmuje duże wartości) powstaje potrzeba co najmniej powierzchownej analizy, która pozwoliłaby oszacować przedział, w którym funkcja może osiągać ekstrema. Próba poszukiwania po omacku metodą wybierania przedziału argumentów na chybił trafił być może po wielu próbach przyniosłaby zadawalający wynik w postaci przybliżonej, jednak prosta analiza znaku pochodnej danej funkcji znacznie szybciej prowadzi do znalezienia wszystkich ekstremów i innych punktów charakterystycznych danej funkcji i to w postaci dokładnej. Prześledźmy więc następujący przykład:

Przykład 12.21.

Klasyczny schemat badania funkcji

\( \displaystyle f(x)=\left\{\begin{align*} (x+3)\exp\frac{x+1}{x-1}, \text{ dla } x\neq 1 \\ 0, \text{ dla } x=1\end{align*} \right. \)

Obliczenia możemy wykonać samodzielnie, bądź wykorzystać procedury, które oferuje program do obliczeń symbolicznych (MATHEMATICA, MAPLE lub inny).

(1) Dziedziną \( \displaystyle f \) jest zbiór liczb rzeczywistych, na który składa się suma przedziałów \( \displaystyle (-\infty, 1)\cup(1, +\infty) \), w których funkcja \( \displaystyle f \) jest ciągła (będąc złożeniem funkcji ciągłych w obu przedziałach) oraz punkt \( \displaystyle \{1\} \), w którym funkcja \( \displaystyle f \) może nie mieć granicy.

(2) Funkcja \( \displaystyle f \) nie jest ani parzysta, ani nieparzysta, ani okresowa.

(3) Wyznaczmy granice funkcji \( \displaystyle f \) na końcach przedziałów ciągłości

\( \begin{array}{l} \displaystyle \lim_{x\to-\infty} f(x)=-\infty, \\ \displaystyle \lim_{x\to 1-} f(x)=0, \\ \displaystyle \lim_{x\to 1+} f(x)=\infty, \\ \displaystyle \lim_{x\to\infty} f(x)=+\infty. \end{array} \)

Funkcja nie ma granicy w punkcie \( \displaystyle x=1 \), nie jest więc ciągła w tym punkcie.

(4) Z punktu 3. wynika, że funkcja ma asymptotę pionową prawostronną w punkcie \( \displaystyle x=1 \) i nie ma asymptot poziomych, co nie wyklucza istnienia asymptot ukośnych.

Sprawdzamy, czy istnieje granica ilorazu \( \displaystyle \frac{f(x)}{x} \) przy \( \displaystyle x\to \infty \) i przy \( \displaystyle x\to-\infty \):

\( \displaystyle a=\lim_{x\to\infty}\frac{f(x)}{x}=e, \alpha=\lim_{x\to-\infty}\frac{f(x)}{x}=e. \)

Wobec istnienia tych granic wyznaczamy granice różnic (zob. przykład zastosowania reguły de l'Hospitala w poprzednim module): \( \displaystyle b=\lim_{x\to \infty}(f(x)-ex)=5e,\beta=\lim_{x\to -\infty}(f(x)-ex)=5e. \) Wynika stąd, że prosta \( \displaystyle y=ex+5e \) jest asymptotą ukośną wykresu funkcji \( \displaystyle f \) zarówno przy \( \displaystyle x\to\infty \) jak i przy \( \displaystyle x\to-\infty \). Funkcja \( \displaystyle x\mapsto ex+5e \) w przedziale \( \displaystyle [-5, 5] \) osiąga wartości w przedziale \( \displaystyle [0, 10e] \).

Stąd ograniczenie zbioru wartości na wykresie generowanym przez program MATHEMATICA do tego przedziału, nieco poprawia wygląd wykresu funkcji \( \displaystyle f \).

Plot[{f, Exp[1]x+5Exp[1]}, {x, -5, 5}, PlotRange -&gt; {0,10 Exp[1]}]

(5) Funkcja \( \displaystyle f \) ma dwa miejsca zerowe. Są to punkty \( \displaystyle x=-3 \) oraz \( \displaystyle x=1 \). Ponieważ funkcja wykładnicza przyjmuje wyłącznie wartości dodatnie, więc czynnik \( \displaystyle \exp\frac{x+1}{x-1} \) jest dodatni. Na znak funkcji \( \displaystyle f \) ma wpływ jedynie czynnik \( \displaystyle x-3 \). Wobec tego funkcja \( \displaystyle f \)

  • jest ujemna w przedziale \( \displaystyle (-\infty, -3) \),
  • jest dodatnia w przedziałach \( \displaystyle (-3, 1) \) oraz \( \displaystyle (1, +\infty) \),
  • przyjmuje wartość zero w punktach \( \displaystyle x=-3 \) oraz \( \displaystyle x=1 \).

Ponadto \( \displaystyle f(0)=\frac{3}{e} \).

Z twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym wynika, że funkcja \( \displaystyle f \) osiąga maksimum wewnątrz przedziału \( \displaystyle [-3,1] \). Ponieważ \( \displaystyle f \) jest ciągła w przedziale \( \displaystyle (0, \infty) \) i zmierza do nieskończoności, gdy \( \displaystyle x\to 0+ \) oraz \( \displaystyle x\to\infty \), więc \( \displaystyle f \) osiąga minimum lokalne w co najmniej jednym punkcie \( \displaystyle x_1>0 \).

(6) Badanie pierwszej pochodnej

\( \displaystyle f'(x)=\frac{x^2 -4x-5}{(x-1)^2}\exp\frac{x+1}{x-1}=\frac{(x+1)(x-5)}{(x-1)^2}\exp\frac{x+1}{x-1}. \) >

  • Dziedziną pierwszej pochodnej jest suma przedziałów \( \displaystyle (-\infty, 1)\cup (1, \infty). \)
  • Miejscami zerowymi pierwszej pochodnej są \( \displaystyle x=-1 \) oraz \( \displaystyle x=5 \).

Pochodna jest dodatnia w zbiorze

\( \displaystyle \{f'>0\}=(-\infty, -1)\cup (5, \infty) \)

i jest ujemna w zbiorze

\( \displaystyle \{f' < 0\}=(-1, 1)\cup (1,5). \)

(7) W oparciu o dane z punktu (6) wnioskujemy, że funkcja \( \displaystyle f \) rośnie w przedziałach

\( \displaystyle (-\infty, -1), \ \ (5,\infty) \)

i maleje w przedziałach

\( \displaystyle (-1, 1), \ \ (1,5). \)

(8) Zbiór punktów krytycznych funkcji \( \displaystyle f \) składa się z trzech elementów:

\( \displaystyle \{-1, \ 1, \ 5\}, \)

to jest miejsc zerowych pochodnej \( \displaystyle -1 \), \( \displaystyle 5 \) oraz punktu \( \displaystyle 1 \), który należy do dziedziny funkcji i nie należy do dziedziny pochodnej. Z punktu 7. wynika, że

  • w punkcie \( \displaystyle x=-1 \) funkcja \( \displaystyle f \) osiąga maksimum lokalne \( \displaystyle f(-1)=2 \),
  • w punkcie \( \displaystyle x=1 \) funkcja \( \displaystyle f \) osiąga minimum lokalne \( \displaystyle f(1)=0 \),
  • w punkcie \( \displaystyle x=5 \) funkcja \( \displaystyle f \) osiąga minimum lokalne \( \displaystyle f(5)=8 \exp\frac{3}{2}=35,85\dots \)

Widzimy więc, że rysując wykres funkcji, musimy zadbać o to, aby zbiór wartości funkcji na wykresie zawierał co najmniej wartości \( \displaystyle f(1) \) oraz \( \displaystyle f(5) \).

Można np. przyjąć \( \displaystyle -6 < x < 8 \) oraz \( \displaystyle -10 < y < 50 \) i skorzystać z polecenia programu MATHEMATICA:

Plot[{f, Exp[1]x+5Exp[1]}, {x, -6, 8}, PlotRange -&gt;{-10, 50}]

które wygeneruje wykres funkcji \( \displaystyle f \) i jej asymptoty ukośnej w zadanym obszarze płaszczyzny.

Dodatkowe polecenie

PlotPoints -&gt; 1024

zwiększa rozdzielczość rysunku

PlotStyle -&gt; {{Hue[0.95], Thickness[0.007]}, {Hue[0.3], Dashing[{0.02,0.03}]}}

rysuje wykres funkcji \( \displaystyle f \) w kolorze zadanym przez Hue[0.95] o grubości Thickness[0.007] oraz asymptotę ukośną tej funkcji kolorem Hue[0.95] linią przerywaną zefiniowaną za pomocą Dashing[0.02,0.03] natomiast

AspectRatio -&gt; 5/2

(stosunek wysokości do szerokości \( \displaystyle 5:2 \)) zmienia format rysunku. Ostatecznie:

Plot[{f, Exp[1]x+5Exp[1]}, {x, -6, 8}, 
PlotRange -&gt; {-10,50},
PlotPoints -&gt; 1024, 
PlotStyle -&gt; {{Hue[0.95], Thickness[0.007]}, {Hue[0.3], Dashing[{0.02,0.03}]}}, 
AspectRatio -&gt; 5/2]

(9) Druga pochodna funkcji

\( \displaystyle f''(x)=\frac{4(5x-1)}{(x-1)^4}\exp\frac{x+1}{x-1} \)

jest określona w zbiorze

\( \displaystyle (-\infty, 1)\cup (1, \infty). \)

Przyjmuje wartości dodatnie w zbiorze

\( \displaystyle \{f''>0\}=\big(\frac{1}{5}, 1\big)\cup (1, \infty), \)

a ujemne w zbiorze

\( \displaystyle \{f'' < 0\}=\big(-\infty, \frac{1}{5}\big). \)

Jedynym punktem, w którym zeruje się druga pochodna, jest \( \displaystyle x=\frac{1}{5} \).

(10) W oparciu o dane (z punktu (9)) o znaku drugiej pochodnej wnioskujemy, że funkcja \( \displaystyle f \) jest (ściśle) wypukła w przedziałach

\( \displaystyle \big(\frac{1}{5}, 1\big), \ \ (1, \infty) \)

i jest (ściśle) wklęsła w przedziale

\( \displaystyle \big(-\infty, \frac{1}{5}\big). \)

Stąd punkt \( \displaystyle x=\frac{1}{5} \), w którym funkcja przyjmuje wartość

\( \displaystyle f\big(\frac{1}{5}\big)=\frac{16}{5}\exp\big(-\frac{3}{2}\big)=0,71\dots , \)

jest jedynym punktem przegięcia funkcji.

Program MATHEMATICA po wpisaniu polecenia

Plot[{f, y}, {x, -1, 1.5}, 
PlotRange -&gt; {-1,3}, 
PlotPoints -&gt; 1024, 
PlotStyle -&gt; {{Hue[0.95], 
Thickness[0.007]}, {Hue[0.5]}}, 
AspectRatio -&gt; 1]

kreśli w przedziale \( \displaystyle [-1, \frac{3}{2}] \) wykres funkcji \( \displaystyle f \) i stycznej do wykresu o równaniu \( \displaystyle y=f'(x_p)(x-x_p)+f(x_p) \) w punkcie przegięcia \( \displaystyle x_p=\frac{1}{5} \).

(11) Zebranie wszystkich punktów charakterystycznych funkcji \( \displaystyle f \) (miejsca punkty nieciągłości, miejsca zerowe funkcji, jej pierwszej i drugiej pochodnej, ekstrema, punkty przegięcia) w jednej tabeli usprawnia przygotowanie starannego wykresu.

(12) Na wykresie staramy się przedstawić wszystkie punkty

charakterystyczne funkcji \( \displaystyle f \) jak też jej asymptoty.