Pojęcie wypukłości jest nam znane z geometrii. Mówimy, że podzbiór \( \displaystyle A \) przestrzeni wektorowej \( \displaystyle X \) jest wypukły, jeśli dowolny odcinek o końcach należących do zbioru \( \displaystyle A \) jest zawarty w tym zbiorze. Innymi słowy:
\( \displaystyle \forall x, y\in A \ \forall t\in [0,1] \ : \ (1-t)x+ty\in A. \)
Zbiór
\( \displaystyle \{(1-t)x+ty, \ 0\leq t\leq 1\} \)
jest odcinkiem o końcach \( \displaystyle x \), \( \displaystyle y \). Punkty \( \displaystyle x \), \( \displaystyle y \) uzyskamy, gdy w kombinacji liniowej \( \displaystyle (1-y)x+ty \) parametr \( \displaystyle t \) przyjmie odpowiednio wartość \( \displaystyle 0 \) lub \( \displaystyle 1 \). Gdy \( \displaystyle t=\frac{1}{2} \), otrzymujemy punkt \( \displaystyle \frac{1}{2}(x+y) \), który jest środkiem odcinka łączącego punkty \( \displaystyle x \) oraz \( \displaystyle y \). Zauważmy też, że zbiory
\( \displaystyle \{(1-t)x+ty, \ t\leq 1\} \)
oraz
\( \displaystyle\{(1-t)x+ty, \ 0\leq t\} \)
to - odpowiednio - półprosta o początku \( \displaystyle x \) przechodząca przez punkt \( \displaystyle y \) oraz półprosta o początku \( \displaystyle y \) przechodząca przez punkt \( \displaystyle x. \)
Definicję funkcji wypukłej opieramy na intuicji geometrycznej.
Definicja 12.1.
Mówimy, że funkcja \( \displaystyle f:(a,b)\mapsto \mathbb{R} \) jest wypukła w przedziale \( \displaystyle (a,b) \), jeśli jej nadwykres
\( \displaystyle \{(x, y) : a < x < b, \ y\geq f(x)\} \)
jest zbiorem wypukłym, to znaczy
\( \displaystyle \forall x, y\in (a,b) : x < y \ \forall t\in [0,1] \ f((1-t)x+ty)\leq (1-t)f(x)+tf(y). \)
Jeśli powyższa nierówność jest ostra (wewnątrz odcinka \( \displaystyle 0 < t < 1 \)), tzn.
\( \displaystyle \forall x, y\in (a,b) : x < y \ \forall t\in (0,1) \ f((1-t)x+ty) < (1-t)f(x)+tf(y), \)
to mówimy, że funkcja \( \displaystyle f \) jest ściśle wypukła w przedziale \( \displaystyle (a,b) \).
Z kolei, jeśli zachodzą nierówności przeciwne, tj.
\( \displaystyle \forall x, y\in (a,b) : x < y \ \forall t\in [0,1] : \ f((1-t)x+ty)\geq (1-t)f(x)+tf(y) \)
oraz odpowiednio
\( \displaystyle \forall x, y\in (a,b) : x < y \ \forall t\in (0,1) : \ f((1-t)x+ty)> (1-t)f(x)+tf(y), \)
to mówimy, że funkcja \( \displaystyle f \) jest wklęsła w przedziale \( \displaystyle (a,b) \) oraz - odpowiednio - ściśle wklęsła.
Zwróćmy uwagę, że jeśli funkcja nie jest wypukła w przedziale \( \displaystyle (a,b) \), to nie oznacza to, że jest wklęsła w tym przedziale. Na przykład funkcja Dirichleta
\( \displaystyle D(x)=\left\{\begin{align*} & 0, & \text{ dla } & x\in [0,1]\cap\mathbb{Q} \\ & 1, & \text{ dla } & x\in [0,1]\cap (\mathbb{R}\setminus \mathbb{Q})\end{align*} \right. \)
nie jest wypukła w żadnym przedziale \( \displaystyle (a,b)\subset [0,1] \), ale nie jest też wklęsła.
Zauważmy, że jeśli \( \displaystyle x=(1-t)a+tb \), to nierówność
\( \displaystyle f\big((1-t)a+tb\big)\leq (1-t)f(a)+tf(b), \)
za pomocą której określiliśmy wypukłość funkcji w przedziale \( \displaystyle (a,b) \), jest równoważna nierówności
\( \displaystyle f(x)\leq\frac{b-x}{b-a}f(a)+\frac{x-a}{b-a}f(b) \)
lub
\( \displaystyle 0\leq (b-x)f(a)+(a-b)f(x)+(x-a)f(b), \)
którą możemy również zapisać w postaci łatwej do zapamiętania za pomocą wyznacznika
\( \displaystyle w_f(x):=\det [1 & a & f(a) \\ 1 & x & f(x) \\ 1 & b & f(b)] \geq 0. \)
Uwaga 12.2.
Funkcja \( \displaystyle f \) jest wypukła (odpowiednio: ściśle wypukła, wklęsła, ściśle wklęsła) w przedziale \( \displaystyle (a,b) \) wtedy i tylko wtedy, gdy dla dowolnej liczby \( \displaystyle x\in(a,b) \) wyznacznik \( \displaystyle w_f(x)\geq 0 \) (odpowiednio: \( \displaystyle w_f(x)> 0 \), \( \displaystyle w_f(x)\leq 0 \), \( \displaystyle w_f(x) < 0 \)).