Nierówność Jensena

Nierówność Jensena


Szereg ważnych nierówności, m.in. klasyczna nierówność między średnią arymetyczną, geometryczną a harmoniczną liczb

nieujemnych \( \displaystyle a \), \( \displaystyle b \):

\( \displaystyle \frac{2}{\frac{1}{a}+\frac{1}{b}}\leq\sqrt{ab}\leq \frac{1}{2}(a+b) \)

jest konsekwencją wypukłości pewnych funkcji. Można je wyprowadzić z nierówności Jensena.

Twierdzenie 12.13. [nierówność Jensena]

Jeśli funkcja \( \displaystyle f \) jest wypukła w przedziale \( \displaystyle (a,b) \), to zachodzi nierówność:

\( \displaystyle f(t_1 x_1 +t_2 x_2 +\dots +t_n x_n)\leq t_1 f(x_1) +t_2 f(x_2)+\dots +t_n f(x_n), \)

dla dowolnych liczb nieujemnych \( \displaystyle t_1, t_2, \dots, t_n \) takich, że

\( \displaystyle t_1+t_2+\dots +t_n =1 \)

oraz dla dowolnych \( \displaystyle x_1, x_2, \dots , x_n \) z przedziału \( \displaystyle (a,b) \).

Dowód 12.13.

Gdy \( \displaystyle n=2 \) nierówność z tezy twierdzenia

\( \displaystyle f(t_1 x_1 +t_2 x_2)\leq t_1 f(x_1)+t_2 f(x_2), \)

gdy \( \displaystyle t_1 +t_2=1, \ t_1, t_2\geq 0 \), wynika z definicji wypukłości. Następnie dowodzimy dla \( \displaystyle k\geq 2 \) implikacji

\( \displaystyle \begin{align*} \forall t_1, t_2, \dots, t_k\geq 0, \ t_1+t_2+\dots +t_k=1 \ \forall x_1, x_2, \dots, x_k \in (a,b): \\ \ f(t_1 x_1 +t_2 x_2 +\dots +t_k x_k)\leq t_1 f(x_1) +t_2 f(x_2)+\dots +t_k f(x_k)\end{align*} \)

\( \displaystyle \Downarrow \)

\( \displaystyle \begin{align*} \forall s_1, s_2, \dots, s_{k+1}\geq 0, \ s_1+s_2+\dots +s_{k+1}=1 \ \forall y_1, y_2, \dots, y_{k+1} \in (a,b): \\ \ f(s_1 y_1 +s_2 y_2 +\dots +s_{k+1} y_{k+1})\leq s_1 f(y_1) +s_2 f(y_2)+\dots +s_{k+1} f(y_{k+1})\end{align*} \)

(szczegóły zawarte są w ćwiczeniach do tego modułu). Stąd na mocy zasady indukcji matematycznej wynika prawdziwość twierdzenia.

Warunek \( \displaystyle t_1+t_2+\dots+t_n=1 \) spełniają liczby postaci \( \displaystyle t_i=\frac{p_i}{p_1+p_2+\dots+p_n} \), gdzie \( \displaystyle p_1, p_2, \dots, p_n \) są dowolnymi liczbami rzeczywistymi dodatnimi. Oznaczmy przez \( \displaystyle \sum p_i=p_1+p_2+\dots+p_n \) sumę liczb \( \displaystyle p_i \) i analogicznie przez \( \displaystyle \sum p_ix_i=p_1x_1+p_2x_2+\dots+p_nx_n \) sumę iloczynów \( \displaystyle p_i x_i \). Nierówność Jensena możemy również sformułować następująco:

Wniosek 12.14.

Jeśli \( \displaystyle f \) jest wypukła w przedziale \( \displaystyle (a,b) \), to zachodzi nierówność

\( \displaystyle f\bigg(\frac{\sum x_i p_i}{\sum p_i}\bigg)\leq \frac{\sum p_i f(x_i)}{\sum p_i}, \)

czyli

\( \displaystyle f\bigg(\frac{ x_1 p_1+x_2p_2+\dots +x_np_n}{p_1+p_2+\dots +p_n}\bigg)\leq \frac{ p_1 f(x_1)+p_2 f(x_2)+\dots+p_nf(x_n)}{p_1+p_2+\dots+p_n} \)

dla dowolnych liczb \( \displaystyle x_1, x_2, \dots, x_n \) z przedziału \( \displaystyle (a,b) \) i dla dowolnych liczb dodatnich \( \displaystyle p_1, p_2, \dots, p_n \).

Przykład 12.15.

Funkcja \( \displaystyle x\mapsto \exp x \) jest wypukła, więc podstawiając w nierówności Jensena \( \displaystyle t_i=\ln x_i \), gdzie \( \displaystyle x_i \) są dowolnymi dodatnimi liczbami rzeczywistymi oraz \( \displaystyle p_i=1 \) otrzymujemy

\( \displaystyle \exp\big(\frac{1}{n}(\ln x_1+\ln x_2 +\dots +\ln x_n)\big)\leq \frac{1}{n}\big(\exp \ln x_1+\exp \ln x_2+\dots+\exp \ln x_n\big) \)

\( \displaystyle \big(\exp(\ln x_1)\exp(\ln x_2)\dots \exp(\ln x_n)\big)^\frac{1}{n}\leq \frac{1}{n}\big(\exp \ln x_1+\exp \ln x_2+\dots+\exp \ln x_n\big) \)

\( \displaystyle (x_1 x_2 \dots x_n)^\frac{1}{n}\leq \frac{1}{n}(x_1+x_2+\dots+x_n), \)

nierówność pomiędzy średnią geometryczną \( \displaystyle (x_1 x_2 \dots x_n)^\frac{1}{n} \) a średnią arytmetyczną \( \displaystyle \frac{1}{n}(x_1+x_2+\dots+x_n) \) liczb dodatnich \( \displaystyle x_1, x_2, \dots, x_n \).

Podstawiając z kolei w otrzymanej nierówności \( \displaystyle x_i=\frac{1}{y_i} \), otrzymamy

\( \displaystyle \bigg(\frac{1}{y_1} \frac{1}{y_2} \dots \frac{1}{y_n}\bigg)^\frac{1}{n}\leq \frac{1}{n}(\frac{1}{y_1}+\frac{1}{y_2}+\dots+\frac{1}{y_n}) \)

czyli

\( \displaystyle (y_1 y_2 \dots y_n)^\frac{1}{n}\geq \frac{n}{y_1^{-1}+y_2^{-1}+\dots+y_n^{-1}} \)

nierówność między średnią geometryczną \( \displaystyle (y_1 y_2 \dots y_n)^\frac{1}{n} \) a średnią harmoniczną \( \displaystyle \displaystyle \frac{n}{y_1^{-1}+y_2^{-1}+\dots+y_n^{-1}} \) liczb dodatnich \( \displaystyle y_1, y_2, \dots, y_n \).

Wykazaliśmy w ten sposób nierówność pomiędzy średnią harmoniczną, geometryczną i arytmetyczną.

wykres

Rysunek do uwagi 12.17.

Wniosek 12.16.

Dla dowolnych liczb rzeczywistych dodatnich \( \displaystyle x_1, x_2, \dots, x_n \) zachodzi nierówność

\( \displaystyle H(x_1, x_2, \dots, x_n)\leq G(x_1, x_2, \dots, x_n)\leq A(x_1, x_2, \dots, x_n), \)

gdzie

\( \displaystyle \begin{align*} H(x_1, x_2, \dots, x_n) & :=\frac{n}{x_1^{-1}+x_2^{-1}+\dots+x_n^{-1}} \\ G(x_1, x_2, \dots, x_n) & :=(x_1 x_2 \dots x_n)^\frac{1}{n} \\ A(x_1, x_2, \dots, x_n) & :=\frac{1}{n}(x_1+x_2+\dots+x_n) \end{align*} \)

są odpowiednio średnimi: harmoniczną, geometryczną i arytmetyczną liczb dodatnich \( \displaystyle x_1, x_2, \dots, x_n \).

Uwaga 12.17.

W przypadku dwóch liczb dodatnich \( \displaystyle 0 < a < b \) otrzymana nierówność ma klarowną interpretację geometryczną. Mając dane dwie proste prostopadłe \( \displaystyle k \), \( \displaystyle l \), przecinające się w punkcie \( \displaystyle O \), odkładamy na jednej z nich, np. na prostej \( \displaystyle l \) odcinki długości \( \displaystyle a \) oraz \( \displaystyle b \) tak, aby \( \displaystyle OA=a \), \( \displaystyle OB=b \) i \( \displaystyle A\in \overline{OB} \). Niech \( \displaystyle S \) będzie środkiem odcinka \( \displaystyle \overline{AB} \). Kreślimy okrąg o środku \( \displaystyle S \) i promieniu \( \displaystyle r=SA \). Niech \( \displaystyle P \) będzie punktem styczności stycznej poprowadzonej do okręgu z punktu \( \displaystyle O \). Łatwo spostrzec, że \( \displaystyle OS=\frac{1}{2}(a+b) \) jest średnią arytmetyczną odcinków \( \displaystyle OA=a \) i \( \displaystyle OB=b \). Nietrudno też dowieść (stosując twierdzenie Pitagorasa do boków trójkąta prostokątnego \( \displaystyle \triangle OSP \)), że odcinek stycznej \( \displaystyle OP=\sqrt{ab} \) jest średnią geometryczną danych odcinków. Warto też dostrzec podobieństwo trójkątów prostokątnych \( \displaystyle \triangle OSP \) i \( \displaystyle \triangle OPQ \), gdzie \( \displaystyle Q \) jest rzutem prostopadłym punktu \( \displaystyle P \) na prostą \( \displaystyle k \). Odcinek \( \displaystyle PQ=\frac{2}{a^{-1}+b^{-1}} \) jest średnią harmoniczną danych odcinków \( \displaystyle a \), \( \displaystyle b \). Z interpretacji tej jasno wynika, że w przypadku, gdy \( \displaystyle 0 < a < b \) w nierówności między średnimi mamy zawsze nierówność ostrą:

\( \displaystyle \frac{2}{\frac{1}{a}+\frac{1}{b}} < \sqrt{ab} < \frac{1}{2}(a+b). \)

Gdy punkt \( \displaystyle A \) zmierza do \( \displaystyle B \) (czyli, gdy \( \displaystyle a \) zmierza do \( \displaystyle b \)), promień \( \displaystyle r\to 0 \) i punkt \( \displaystyle P \) zmierza do \( \displaystyle S \). W granicznym przypadku, gdy \( \displaystyle a=b \), mamy \( \displaystyle r=0 \) oraz \( \displaystyle P=S=A=B \) i rezultacie trzy średnie: harmoniczna, geometryczna i arytmetyczna są równe.
Jeśli ustalimy \( \displaystyle b \), natomiast punkt \( \displaystyle A \) zmierza do \( \displaystyle O \), to \( \displaystyle r\to\frac{b}{2} \), punkt \( \displaystyle P \) zmierza do \( \displaystyle O \) i w ten sposób średnia geometryczna i średnia harmoniczna liczb \( \displaystyle a \), \( \displaystyle b \) zmierzają do zera, a średnia arytmetyczna do \( \displaystyle \frac{b}{2} \).

Jeśli ustalimy punkt \( \displaystyle A \), a punkt \( \displaystyle B \) będzie oddalał się w prawo po prostej \( \displaystyle k \) do nieskończoności, to \( \displaystyle r\to\infty \), punkt \( \displaystyle P \) będzie również oddalał się nieograniczenie od punktu \( \displaystyle O \) i w rezultacie trzy średnie będą zmierzały do nieskończoności.

Jako wniosek z nierówności Jensena w ramach ćwiczeń dowodzimy nierówności Höldera i nierówności Minkowskiego.

Twierdzenie 12.18. [nierówność Höldera]

Jeśli \( \displaystyle p \), \( \displaystyle q \) są liczbami dodatnimi spełniającymi równość \( \displaystyle \frac{1}{p}+\frac{1}{q}=1 \), to dla dowolnych liczb rzeczywistych \( \displaystyle x_1,...,x_n,y_1,...,y_n \) zachodzi nierówność

\( \displaystyle \sum_{k=1}^n|x_ky_k|\leq \left(\sum_{k=1}^n|x_k|^p \right)^\frac1p \left(\sum_{k=1}^n|y_k|^q \right)^\frac1q, \)

gdzie \( \displaystyle n \) jest liczbą naturalną.

Twierdzenie 12.19. [nierówność Minkowskiego]

Jeśli \( \displaystyle p\geq 1 \) jest dowolną liczbą rzeczywistą, to dowolnych liczb rzeczywistych \( \displaystyle x_1,...,x_n,y_1,...,y_n \) zachodzi nierówność

\( \displaystyle \left( \sum_{k=1}^n |x_k+y_k|^p \right)^{\frac{1}{p}}\leq \left( \sum_{k=1}^n |x_k|^p \right )^{\frac{1}{p}}+ \left( \sum_{k=1}^n |y_k|^p \right )^{\frac{1}{p}}, \)

gdzie \( \displaystyle n \) jest liczbą naturalną.