Pojęcie wypukłości jest nam znane z geometrii. Mówimy, że podzbiór A przestrzeni wektorowej X jest wypukły, jeśli dowolny odcinek o końcach należących do zbioru A jest zawarty w tym zbiorze. Innymi słowy:
∀x,y∈A ∀t∈[0,1] : (1−t)x+ty∈A.
Zbiór
{(1−t)x+ty, 0≤t≤1}
jest odcinkiem o końcach x, y. Punkty x, y uzyskamy, gdy w kombinacji liniowej (1−y)x+ty parametr t przyjmie odpowiednio wartość 0 lub 1. Gdy t=12, otrzymujemy punkt 12(x+y), który jest środkiem odcinka łączącego punkty x oraz y. Zauważmy też, że zbiory
{(1−t)x+ty, t≤1}
oraz
{(1−t)x+ty, 0≤t}
to - odpowiednio - półprosta o początku x przechodząca przez punkt y oraz półprosta o początku y przechodząca przez punkt x.
Definicję funkcji wypukłej opieramy na intuicji geometrycznej.
Definicja 12.1.
Mówimy, że funkcja f:(a,b)↦R jest wypukła w przedziale (a,b), jeśli jej nadwykres
{(x,y):a<x<b, y≥f(x)}
jest zbiorem wypukłym, to znaczy
∀x,y∈(a,b):x<y ∀t∈[0,1] f((1−t)x+ty)≤(1−t)f(x)+tf(y).
Jeśli powyższa nierówność jest ostra (wewnątrz odcinka 0<t<1), tzn.
∀x,y∈(a,b):x<y ∀t∈(0,1) f((1−t)x+ty)<(1−t)f(x)+tf(y),
to mówimy, że funkcja f jest ściśle wypukła w przedziale (a,b).
Z kolei, jeśli zachodzą nierówności przeciwne, tj.
∀x,y∈(a,b):x<y ∀t∈[0,1]: f((1−t)x+ty)≥(1−t)f(x)+tf(y)
oraz odpowiednio
∀x,y∈(a,b):x<y ∀t∈(0,1): f((1−t)x+ty)>(1−t)f(x)+tf(y),
to mówimy, że funkcja f jest wklęsła w przedziale (a,b) oraz - odpowiednio - ściśle wklęsła.
Zwróćmy uwagę, że jeśli funkcja nie jest wypukła w przedziale (a,b), to nie oznacza to, że jest wklęsła w tym przedziale. Na przykład funkcja Dirichleta
D(x)={0, dla x∈[0,1]∩Q1, dla x∈[0,1]∩(R∖Q)
nie jest wypukła w żadnym przedziale (a,b)⊂[0,1], ale nie jest też wklęsła.
Zauważmy, że jeśli x=(1−t)a+tb, to nierówność
f((1−t)a+tb)≤(1−t)f(a)+tf(b),
za pomocą której określiliśmy wypukłość funkcji w przedziale (a,b), jest równoważna nierówności
f(x)≤b−xb−af(a)+x−ab−af(b)
lub
0≤(b−x)f(a)+(a−b)f(x)+(x−a)f(b),
którą możemy również zapisać w postaci łatwej do zapamiętania za pomocą wyznacznika
\displaystyle w_f(x):=\det [1 & a & f(a) \\ 1 & x & f(x) \\ 1 & b & f(b)] \geq 0.
Uwaga 12.2.
Funkcja f jest wypukła (odpowiednio: ściśle wypukła, wklęsła, ściśle wklęsła) w przedziale (a,b) wtedy i tylko wtedy, gdy dla dowolnej liczby x∈(a,b) wyznacznik wf(x)≥0 (odpowiednio: wf(x)>0, wf(x)≤0, wf(x)<0).