Niech \( \displaystyle A\subset X \) będzie otwartym podzbiorem przestrzeni unormowanej \( \displaystyle X \). Niech \( \displaystyle v\neq 0, v\in X \) będzie ustalonym niezerowym wektorem tej przestrzeni.
Definicja 6.18.
Mówimy, że funkcja \( \displaystyle f:A\mapsto \mathbb{R} \) ma w punkcie \( \displaystyle a \) pochodną kierunkową w kierunku wektora \( \displaystyle v \), jeśli
istnieje granica ilorazu różnicowego:
\( \displaystyle \lim_{h\to 0}\frac{f(a+hv)-f(a)}{h}. \)
Granicę tę oznaczamy symbolem \( \displaystyle \partial_v f(a) \) i nazywamy pochodną kierunkową funkcji \( \displaystyle f \) w kierunku wektora \( \displaystyle v \) w punkcie \( \displaystyle a \).
Zwróćmy uwagę, że zbiór \( \displaystyle \{a+t v, t\in \mathbb{R}\} \) jest prostą przechodzącą przez punkt \( \displaystyle a \) równoległą do wektora \( \displaystyle v \). Stąd pochodna \( \displaystyle \partial_v f(a) \) jest w istocie pochodną w punkcie \( \displaystyle t=0 \) funkcji jednej zmiennej rzeczywistej \( \displaystyle t\mapsto f(a+tv) \), czyli restrykcji funkcji \( \displaystyle f \) do podzbioru otwartego \( \displaystyle A\cap \{a+t v, t\in \mathbb{R}\} \) rozważanej prostej \( \displaystyle \{a+t v, t\in \mathbb{R}\} \). Wobec tego możemy powtórzyć jednowymiarowy warunek konieczny istnienia ekstremum w punkcie, w którym istnieje pochodna kierunkowa funkcji (zob. moduł 9, Analiza matematyczna I).
Twierdzenie 6.19.
Niech \( \displaystyle A\subset X \) będzie otwartym podzbiorem przestrzeni unormowanej \( \displaystyle X \) i niech \( \displaystyle v\in X \), \( \displaystyle v\neq 0 \). Jeśli funkcja \( \displaystyle f:A\mapsto \mathbb{R} \) osiąga ekstremum w punkcie \( \displaystyle a\in A \) i istnieje pochodna kierunkowa \( \displaystyle \partial_v f(a) \), to
pochodna ta zeruje się.
Dowód 6.19.
Jeśli funkcja \( \displaystyle A\ni x\mapsto f(x)\in \mathbb{R} \) osiąga maksimum (odpowiednio: minimum) w punkcie \( \displaystyle a \), to funkcja jednej zmiennej \( \displaystyle t\mapsto f(a+tv) \) osiąga maksimum (odpowiednio: minimum) w punkcie \( \displaystyle t=0 \). Z warunku koniecznego istnienia ekstremum funkcji jednej zmiennej wynika, że pochodna (o ile istnieje) funkcji \( \displaystyle t\mapsto f(a+tv) \) zeruje się w punkcie \( \displaystyle t=0 \). Stąd \( \displaystyle \partial_v f(a)=0 \)
O ile w przypadku funkcji określonej na otwartym przedziale prostej \( \displaystyle \mathbb{R} \) sytuacja jest oczywista (na prostej mamy tylko jeden kierunek), o tyle już w przypadku funkcji dwóch zmiennych (na płaszczyźnie można wskazać nieskończenie wiele kierunków!) powstaje pytanie o liczbę kierunków, które należy ustalić, aby rozwiązać praktyczny problem lokalizacji punktów ekstremalnych danej funkcji. Warto zauważyć, że w przypadku funkcji określonej na \( \displaystyle n \) wymiarowej przestrzeni unormowanej \( \displaystyle X \) nie ma potrzeby rozważać pochodnych kierunkowych w kierunku wektorów liniowo zależnych, a więc większej niż wynosi wymiar przestrzeni. Wyróżnijmy wobec tego pochodne kierunkowe w kierunku wektorów bazowych.
Niech \( \displaystyle X=\mathbb{R}^n \) i niech \( \displaystyle e_1=(1,0,0,\dots, 0) \), \( \displaystyle e_2=(0,1,0,\dots, 0) \), ..., \( \displaystyle e_n=(0,0,0,\dots, 1) \) będzie bazą kanoniczną tej przestrzeni. Niech \( \displaystyle A \) będzie otwartym podzbiorem przestrzeni \( \displaystyle \mathbb{R}^n \).
Definicja 6.20.
Pochodne kierunkowe (o ile istnieją) \( \displaystyle \partial_{e_1} f(a) \), \( \displaystyle \partial_{e_2} f(a) \), ..., \( \displaystyle \partial_{e_n} f(a) \) funkcji \( \displaystyle f:A\mapsto \mathbb{R} \) w kierunku wektorów bazy \( \displaystyle \{e_1, e_2, \dots, e_n\} \) nazywamy pochodnymi cząstkowymi funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \). Pochodną cząstkową funkcji \( \displaystyle (x_1, x_2, \dots, x_n) \mapsto f(x_1, x_2, \dots, x_n)\in \mathbb{R} \) w kierunku wektora
\( \displaystyle e_i \) oznaczamy tradycyjnie symbolem:
\( \displaystyle \frac{\partial f}{\partial x_i}(a), \ \frac{\partial}{\partial x_i}f(a), \ f_{x_i}(a) \ \text{ lub } \ f'_{x_i}(a). \)
W przypadku, gdy nie numerujemy współrzędnych argumentu funkcji \( \displaystyle (x,y,z)\mapsto f(x,y,z) \) pochodne cząstkowe oznaczamy symbolami
\( \displaystyle \frac{\partial f}{\partial x}(a), \quad \frac{\partial f}{\partial y}(a), \quad\frac{\partial f}{\partial z}(a) \).
Przeformułujmy warunek konieczny istnienia ekstremum funkcji określonej na zbiorze otwartym \( \displaystyle A\subset \mathbb{R}^n \).
Twierdzenie 6.21.
Jeśli funkcja \( \displaystyle f:A\mapsto \mathbb{R} \) osiąga ekstremum w punkcie \( \displaystyle a\in A \), w którym istnieją pochodne cząstkowe \( \displaystyle \frac{\partial}{\partial x_k}f(a) \), \( \displaystyle k\in\{1,2,\dots, n\} \), to pochodne te zerują się w tym punkcie, tj.
\( \displaystyle \forall k\in\{1,2,\dots, n\} : \frac{\partial}{\partial x_k}f(a)=0. \)
Zwróćmy uwagę, że twierdzenie podaje jedynie warunek konieczny istnienia ekstremum. Punkt \( \displaystyle a \), który spełnia układ równań:
\( \displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x_1}(a) & =0 \\ \frac{\partial f}{\partial x_2}(a) & =0 \\ & \vdots \\ \frac{\partial f}{\partial x_n}(a) & =0\end{align*} \right. \)
nie musi być punktem ekstremalnym funkcji \( \displaystyle f \).
Wróćmy do przykładów, w których stwierdziliśmy potrzebę znalezienia dokładniejszego narzędzia do lokalizacji ekstremów.
Przykład 6.22.
Z przebiegu poziomicy zerowej funkcji \( \displaystyle f(x,y)=xy (1-x-y) \) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz trójkąta o wierzchołkach \( \displaystyle (0,0) \), \( \displaystyle (1, 0) \), \( \displaystyle (0,1) \). Rozwiązując układ dwóch równań
\( \displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} \right .\ \ \Longleftrightarrow \ \left\{\begin{align*} y-2xy-y^2=0 \\ x-x^2 -2xy=0 \end{align*} \right . \)
otrzymujemy układ
\( \displaystyle \left\{\begin{align*} y=0 \text{ lub } 1-2x-y=0 \\ x=0 \text{ lub } 1-x -2y=0 \end{align*} \right.\ , \)
który spełniają współrzędne czterech punktów \( \displaystyle P_1=(0,0) \), \( \displaystyle P_2=(1,0) \), \( \displaystyle P_3=(0,1) \), \( \displaystyle P_4=(\frac{1}{3}, \frac{1}{3}) \). Jedynym punktem z wnętrza wskazanego trójkąta jest punkt \( \displaystyle P_4 \), w którym funkcja \( \displaystyle f \) osiąga minimum równe \( \displaystyle f(P_4)=\frac{1}{27} \). Pozostałe punkty \( \displaystyle P_1 \), \( \displaystyle P_2 \), \( \displaystyle P_3 \) leżą na poziomicy zerowej funkcji \( \displaystyle f \), która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \( \displaystyle f \) (zob. przykład 6.15.).
Przykład 6.23.
Z przebiegu poziomicy zerowej funkcji \( \displaystyle f(x,y)=x^3+y^3-3xy \) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz pętli liścia Kartezjusza. Rozwiązując układ dwóch równań
\( \displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} \right .\ \ \Longleftrightarrow \ \left\{\begin{align*} 3x^2-3y=0 \\ 3y^2-3x=0 \end{align*} \right . \)
otrzymujemy układ
\( \displaystyle \left\{\begin{align*} y=0 & \text{ lub } y=1 \\ x & =y^2 \end{align*} \right .\ , \)
który spełniają współrzędne dwóch punktów \( \displaystyle P_1=(0,0) \), \( \displaystyle P_2=(1,1) \). Jedynym punktem z wnętrza obszaru ograniczonego przez pętlę liścia Kartezjusza jest punkt \( \displaystyle P_2 \), w którym funkcja \( \displaystyle f \) osiąga minimum równe \( \displaystyle f(P_2)=-1 \). Punkt \( \displaystyle P_1 \) leży na poziomicy zerowej funkcji \( \displaystyle f \), która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \( \displaystyle f \) (zob. przykład 6.16.).
Przykład 6.24.
Podobnie jak w obu poprzednich przykładach z przebiegu poziomicy zerowej funkcji \( \displaystyle f(x,y)=(x^2+y^2)^2-2(x^2-y^2) \) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz obszaru ograniczonego lemniskatą Bernoullego. Rozwiązując układ dwóch równań
\( \displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} .\ \ \Longleftrightarrow \ \{\begin{align*} 2(x^2+y^2)2x-4x=0 \\ 2(x^2+y^2)2y+4y=0 \end{align*} \right. \)
otrzymujemy układ
\( \displaystyle \left\{\begin{align*} x=0 \text{ lub } x^2+y^2-1=0 \\ y=0 \text{ lub } x^2+y^2+1=0 \end{align*} \right.\ , \)
który spełniają współrzędne trzech punktów \( \displaystyle P_1=(0,0) \), \( \displaystyle P_2=(-1,0) \), \( \displaystyle P_3=(1,0) \). We wnętrzu obszaru ograniczonego lemniskatą Bernoullego leżą punkty \( \displaystyle P_2 \) i \( \displaystyle P_3 \), w których funkcja \( \displaystyle f \) osiąga minima równe \( \displaystyle f(P_2)=f(P_3)=-1 \). Punkt \( \displaystyle P_1 \) leży na poziomicy zerowej funkcji \( \displaystyle f \), która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \( \displaystyle f \) (zobacz przykład 6.17.).