Processing math: 5%

Pochodna kierunkowa i pochodne cząstkowe

Niech AX będzie otwartym podzbiorem przestrzeni unormowanej X. Niech v0,vX będzie ustalonym niezerowym wektorem tej przestrzeni.

Definicja 6.18.

Mówimy, że funkcja f:AR ma w punkcie a pochodną kierunkową w kierunku wektora v, jeśli

istnieje granica ilorazu różnicowego:

lim

Granicę tę oznaczamy symbolem \displaystyle \partial_v f(a) i nazywamy pochodną kierunkową funkcji \displaystyle f w kierunku wektora \displaystyle v w punkcie \displaystyle a .

Zwróćmy uwagę, że zbiór \displaystyle \{a+t v, t\in \mathbb{R}\} jest prostą przechodzącą przez punkt \displaystyle a równoległą do wektora \displaystyle v . Stąd pochodna \displaystyle \partial_v f(a) jest w istocie pochodną w punkcie \displaystyle t=0 funkcji jednej zmiennej rzeczywistej \displaystyle t\mapsto f(a+tv) , czyli restrykcji funkcji \displaystyle f do podzbioru otwartego \displaystyle A\cap \{a+t v, t\in \mathbb{R}\} rozważanej prostej \displaystyle \{a+t v, t\in \mathbb{R}\} . Wobec tego możemy powtórzyć jednowymiarowy warunek konieczny istnienia ekstremum w punkcie, w którym istnieje pochodna kierunkowa funkcji (zob. moduł 9, Analiza matematyczna I).

Twierdzenie 6.19.
Niech \displaystyle A\subset X będzie otwartym podzbiorem przestrzeni unormowanej \displaystyle X i niech \displaystyle v\in X , \displaystyle v\neq 0 . Jeśli funkcja \displaystyle f:A\mapsto \mathbb{R} osiąga ekstremum w punkcie \displaystyle a\in A i istnieje pochodna kierunkowa \displaystyle \partial_v f(a) , to

pochodna ta zeruje się.

Dowód 6.19.

Jeśli funkcja \displaystyle A\ni x\mapsto f(x)\in \mathbb{R} osiąga maksimum (odpowiednio: minimum) w punkcie \displaystyle a , to funkcja jednej zmiennej \displaystyle t\mapsto f(a+tv) osiąga maksimum (odpowiednio: minimum) w punkcie \displaystyle t=0 . Z warunku koniecznego istnienia ekstremum funkcji jednej zmiennej wynika, że pochodna (o ile istnieje) funkcji \displaystyle t\mapsto f(a+tv) zeruje się w punkcie \displaystyle t=0 . Stąd \displaystyle \partial_v f(a)=0

O ile w przypadku funkcji określonej na otwartym przedziale prostej \displaystyle \mathbb{R} sytuacja jest oczywista (na prostej mamy tylko jeden kierunek), o tyle już w przypadku funkcji dwóch zmiennych (na płaszczyźnie można wskazać nieskończenie wiele kierunków!) powstaje pytanie o liczbę kierunków, które należy ustalić, aby rozwiązać praktyczny problem lokalizacji punktów ekstremalnych danej funkcji. Warto zauważyć, że w przypadku funkcji określonej na \displaystyle n wymiarowej przestrzeni unormowanej \displaystyle X nie ma potrzeby rozważać pochodnych kierunkowych w kierunku wektorów liniowo zależnych, a więc większej niż wynosi wymiar przestrzeni. Wyróżnijmy wobec tego pochodne kierunkowe w kierunku wektorów bazowych.

Niech \displaystyle X=\mathbb{R}^n i niech \displaystyle e_1=(1,0,0,\dots, 0) , \displaystyle e_2=(0,1,0,\dots, 0) , ..., \displaystyle e_n=(0,0,0,\dots, 1) będzie bazą kanoniczną tej przestrzeni. Niech \displaystyle A będzie otwartym podzbiorem przestrzeni \displaystyle \mathbb{R}^n .

Definicja 6.20.

Pochodne kierunkowe (o ile istnieją) \displaystyle \partial_{e_1} f(a) , \displaystyle \partial_{e_2} f(a) , ..., \displaystyle \partial_{e_n} f(a) funkcji \displaystyle f:A\mapsto \mathbb{R} w kierunku wektorów bazy \displaystyle \{e_1, e_2, \dots, e_n\} nazywamy pochodnymi cząstkowymi funkcji \displaystyle f w punkcie \displaystyle a . Pochodną cząstkową funkcji \displaystyle (x_1, x_2, \dots, x_n) \mapsto f(x_1, x_2, \dots, x_n)\in \mathbb{R} w kierunku wektora

\displaystyle e_i oznaczamy tradycyjnie symbolem:

\displaystyle \frac{\partial f}{\partial x_i}(a), \ \frac{\partial}{\partial x_i}f(a), \ f_{x_i}(a) \ \text{ lub } \ f'_{x_i}(a).

W przypadku, gdy nie numerujemy współrzędnych argumentu funkcji \displaystyle (x,y,z)\mapsto f(x,y,z) pochodne cząstkowe oznaczamy symbolami

\displaystyle \frac{\partial f}{\partial x}(a), \quad \frac{\partial f}{\partial y}(a), \quad\frac{\partial f}{\partial z}(a) .

Przeformułujmy warunek konieczny istnienia ekstremum funkcji określonej na zbiorze otwartym \displaystyle A\subset \mathbb{R}^n .

Twierdzenie 6.21.

Jeśli funkcja \displaystyle f:A\mapsto \mathbb{R} osiąga ekstremum w punkcie \displaystyle a\in A , w którym istnieją pochodne cząstkowe \displaystyle \frac{\partial}{\partial x_k}f(a) , \displaystyle k\in\{1,2,\dots, n\} , to pochodne te zerują się w tym punkcie, tj.

\displaystyle \forall k\in\{1,2,\dots, n\} : \frac{\partial}{\partial x_k}f(a)=0.

Zwróćmy uwagę, że twierdzenie podaje jedynie warunek konieczny istnienia ekstremum. Punkt \displaystyle a , który spełnia układ równań:

\displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x_1}(a) & =0 \\ \frac{\partial f}{\partial x_2}(a) & =0 \\ & \vdots \\ \frac{\partial f}{\partial x_n}(a) & =0\end{align*} \right.

nie musi być punktem ekstremalnym funkcji \displaystyle f .

Wróćmy do przykładów, w których stwierdziliśmy potrzebę znalezienia dokładniejszego narzędzia do lokalizacji ekstremów.

Przykład 6.22.

Z przebiegu poziomicy zerowej funkcji \displaystyle f(x,y)=xy (1-x-y) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz trójkąta o wierzchołkach \displaystyle (0,0) , \displaystyle (1, 0) , \displaystyle (0,1) . Rozwiązując układ dwóch równań

\displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} \right .\ \ \Longleftrightarrow \ \left\{\begin{align*} y-2xy-y^2=0 \\ x-x^2 -2xy=0 \end{align*} \right .

otrzymujemy układ

\displaystyle \left\{\begin{align*} y=0 \text{ lub } 1-2x-y=0 \\ x=0 \text{ lub } 1-x -2y=0 \end{align*} \right.\ ,

który spełniają współrzędne czterech punktów \displaystyle P_1=(0,0) , \displaystyle P_2=(1,0) , \displaystyle P_3=(0,1) , \displaystyle P_4=(\frac{1}{3}, \frac{1}{3}) . Jedynym punktem z wnętrza wskazanego trójkąta jest punkt \displaystyle P_4 , w którym funkcja \displaystyle f osiąga minimum równe \displaystyle f(P_4)=\frac{1}{27} . Pozostałe punkty \displaystyle P_1 , \displaystyle P_2 , \displaystyle P_3 leżą na poziomicy zerowej funkcji \displaystyle f , która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \displaystyle f (zob. przykład 6.15.).

Przykład 6.23.

Z przebiegu poziomicy zerowej funkcji \displaystyle f(x,y)=x^3+y^3-3xy wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz pętli liścia Kartezjusza. Rozwiązując układ dwóch równań

\displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} \right .\ \ \Longleftrightarrow \ \left\{\begin{align*} 3x^2-3y=0 \\ 3y^2-3x=0 \end{align*} \right .

otrzymujemy układ

\displaystyle \left\{\begin{align*} y=0 & \text{ lub } y=1 \\ x & =y^2 \end{align*} \right .\ ,

który spełniają współrzędne dwóch punktów \displaystyle P_1=(0,0) , \displaystyle P_2=(1,1) . Jedynym punktem z wnętrza obszaru ograniczonego przez pętlę liścia Kartezjusza jest punkt \displaystyle P_2 , w którym funkcja \displaystyle f osiąga minimum równe \displaystyle f(P_2)=-1 . Punkt \displaystyle P_1 leży na poziomicy zerowej funkcji \displaystyle f , która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \displaystyle f (zob. przykład 6.16.).

Przykład 6.24.

Podobnie jak w obu poprzednich przykładach z przebiegu poziomicy zerowej funkcji \displaystyle f(x,y)=(x^2+y^2)^2-2(x^2-y^2) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz obszaru ograniczonego lemniskatą Bernoullego. Rozwiązując układ dwóch równań

\displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} .\ \ \Longleftrightarrow \ \{\begin{align*} 2(x^2+y^2)2x-4x=0 \\ 2(x^2+y^2)2y+4y=0 \end{align*} \right.

otrzymujemy układ

\displaystyle \left\{\begin{align*} x=0 \text{ lub } x^2+y^2-1=0 \\ y=0 \text{ lub } x^2+y^2+1=0 \end{align*} \right.\ ,

który spełniają współrzędne trzech punktów \displaystyle P_1=(0,0) , \displaystyle P_2=(-1,0) , \displaystyle P_3=(1,0) . We wnętrzu obszaru ograniczonego lemniskatą Bernoullego leżą punkty \displaystyle P_2 i \displaystyle P_3 , w których funkcja \displaystyle f osiąga minima równe \displaystyle f(P_2)=f(P_3)=-1 . Punkt \displaystyle P_1 leży na poziomicy zerowej funkcji \displaystyle f , która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \displaystyle f (zobacz przykład 6.17.).