Processing math: 3%

Wyrażenie różniczki Frecheta za pomocą pochodnych cząstkowych

W poprzednim module zdefiniowaliśmy pochodną kierunkową funkcji f:XR w punkcie a w kierunku v0. Możemy tę samą definicję powtórzyć również w przypadku funkcji f:XY, w przypadku, gdy zbiorem wartości funkcji f:XY, jest dowolna przestrzeń unormowana Y:

vf(a)=lim

gdzie \displaystyle t\in \mathbb{R} , a zbieżność ilorazów różnicowych do granicy \displaystyle \partial_v f(a)\in Y przy \displaystyle t\to 0 rozumiemy w sensie zbieżności w normie przestrzeni \displaystyle Y .

Uwaga 7.13.

Niech \displaystyle v\in X będzie dowolnym wektorem jednostkowym z przestrzeni \displaystyle X , tzn. \displaystyle \|v\|=1 . Jeśli funkcja \displaystyle f: X\mapsto Y jest różniczkowalna w sensie Frecheta w punkcie \displaystyle a , to istnieje pochodna kierunkowa \displaystyle \partial_v f(a) w dowolnym kierunku \displaystyle v ,

przy czym zachodzi równość

\displaystyle \partial_v f(a)=d_a f(v) \text{ dla } \|v\|=1.

Ponadto funkcja \displaystyle v\mapsto \partial_v f(a) jest liniowa i ciągła.

Dowód 7.13.

Skoro

\displaystyle \displaystyle \frac{\|f(a+h)-f(a)-d_a f (h)\|}{\|h\|}\to 0, \text{ przy }\|h\|\to 0,

więc w szczególności dla \displaystyle h=tv mamy

\displaystyle \frac{\|f(a+tv)-f(a)-d_a f (tv)\|}{\|tv\|}\to 0.

Wobec liniowości różniczki \displaystyle d_a f(tv)=t d_a f(v) oraz faktu, że \displaystyle \|tv \|=|t| , mamy

\displaystyle \bigg\|\frac{f(a+tv)-f(a)}{t}-d_a f (v)\bigg\|\to 0,

czyli iloraz różnicowy \displaystyle \frac{f(a+tv)-f(a)}{t} zmierza przy \displaystyle t\to 0 do granicy \displaystyle d_a f(v) , więc istnieje pochodna kierunkowa \displaystyle \partial_v f(a) i jest równa wartości różniczki zupełnej funkcji \displaystyle f w punkcie \displaystyle a na wektorze \displaystyle v . Stąd funkcja \displaystyle v\mapsto \partial_v f(a)=d_a f (v) jest liniowa i ciągła.

Uwaga 7.14.

Niech \displaystyle f:X\mapsto Y będzie funkcją różniczkowalną w punkcie \displaystyle a\in X . Wówczas \displaystyle d_a f=0 wtedy i tylko wtedy, gdy zeruje się

pochodna kierunkowa \displaystyle \partial_v f(a)=0 w dowolnym kierunku.

Powstaje pytanie o istnienie różniczki Frecheta funkcji \displaystyle f: X\mapsto Y w punkcie, w którym istnieją pochodne kierunkowe w dowolnym kierunku. Negatywną odpowiedź na to pytanie podaje

Przykład 7.15.

Funkcja \displaystyle f(x,y)=\root{3}\of{x^3+y^3} ma w punkcie \displaystyle 0\in \mathbb{R}^2 pochodne kierunkowe \displaystyle \partial_v f(0) w dowolnym kierunku \displaystyle \|v\|=1 , nie jest jednak różniczkowalna w sensie Frecheta w tym punkcie. Zauważmy, że dowolny wektor \displaystyle \|v\|=1 można na płaszczyźnie \displaystyle \mathbb{R}^2 jednoznacznie przedstawić w postaci \displaystyle v=(\cos\varphi, \sin\varphi) , gdzie \displaystyle 0\leq \varphi < 2\pi . Stąd \displaystyle \lim_{t\to 0}\frac{f(0+tv)-f(0)}{t}=\sqrt{\cos^3\varphi+\sin^3\varphi} .

Jednak funkcja \displaystyle v\mapsto \partial_v f(0) nie jest liniowa.

Przykład 7.16.

Funkcja

\displaystyle f(x,y)=\left\{\begin{align*} \frac{x^2 y}{x^2+y^2}, \text{ dla } (x,y)\neq 0 \\ 0, \text{ dla } (x,y)=0\end{align*} \right.

ma w punkcie \displaystyle 0 pochodną kierunkową w każdym kierunku, nie ma jednak różniczki Frecheta w tym punkcie.

Z praktycznego punktu widzenia w zastosowaniach najważniejsza jest możliwość wyrażenia różniczki w sensie Frecheta za pomocą pochodnych cząstkowych.

Twierdzenie 7.17.

Niech \displaystyle f=(f_1, f_2, \dots, f_m):\mathbb{R}^n \supset U\mapsto \mathbb{R}^m będzie funkcją różniczkowalną w sensie Frecheta w punkcie \displaystyle a\in U . Istnieją wówczas pochodne cząstkowe

\displaystyle \begin{align*} & \frac{\partial f_1}{\partial x_1}(a), & \frac{\partial f_1}{\partial x_2}(a), & \dots, & \frac{\partial f_1}{\partial x_n}(a) \\ & \frac{\partial f_2}{\partial x_1}(a), & \frac{\partial f_2}{\partial x_2}(a), & \dots, & \frac{\partial f_2}{\partial x_n}(a) \\ & \vdots & \vdots \quad & \dots & \vdots \\ & \frac{\partial f_m}{\partial x_1}(a), & \frac{\partial f_m}{\partial x_2}(a), & \dots, & \frac{\partial f_m}{\partial x_n}(a)\end{align*}

i są one wyrazami macierzy odwzorowania liniowego \displaystyle d_a f\in L(\mathbb{R}^n, \mathbb{R}^m) w bazie kanonicznej, to znaczy, dla dowolnego wektora \displaystyle h\in \mathbb{R}^n wartość \displaystyle d_a f(h) odwzorowania \displaystyle d_a f na wektorze \displaystyle h jest wektorem z \displaystyle \mathbb{R}^m o współrzędnych

\displaystyle \bigg(\sum_{j=1}^n \frac{\partial f_1}{\partial x_j}(a) h_j, \sum_{j=1}^n \frac{\partial f_2}{\partial x_j}(a) h_j,\dots, \sum_{j=1}^n \frac{\partial f_m}{\partial x_j}(a) h_j\bigg).

Dowód 7.17.

Wykazaliśmy, że zachodzi równość \displaystyle \partial_v f(a)=d_a f (v) . Ponieważ \displaystyle d_a f =(d_a f_1, d_a f_2, \dots, d_a f_m) , więc wystarczy wykazać twierdzenie dla składowych odwzorowania \displaystyle f , tj. dla funkcji \displaystyle f_i: \mathbb{R}^n\mapsto \mathbb{R} . W dalszym ciągu dowodu będziemy pomijać indeks dolny \displaystyle i , zakładając, że \displaystyle f_i=f jest funkcją o wartościach w zbiorze liczb rzeczywistych. Dla dowolnego wektora \displaystyle e_i , \displaystyle i=1,2,\dots, n bazy kanonicznej przestrzeni \displaystyle \mathbb{R}^n mamy (z definicji pochodnej cząstkowej) równość \displaystyle \partial_{e_i} f(a)=\frac{\partial f}{\partial x_i}(a) , więc dla dowolnego wektora \displaystyle h=h_1e_1+h_2e_2+\dots+h_ne_n mamy

\displaystyle \begin{align*} d_a f(h) & =d_a f(h_1e_1+h_2e_2+\dots+h_ne_n) \\ & =h_1 d_a f(e_1)+h_2 d_a f(e_2)+\dots+h_n d_a f(e_n) \\ & =h_1\frac{\partial f}{\partial x_1}(a)+h_2\frac{\partial f}{\partial x_2}(a)+\dots+h_n\frac{\partial f}{\partial x_n}(a).\end{align*}

Uwaga 7.18.

W ramach kursu algebry liniowej zwykliśmy zapisywać wektory \displaystyle h=(h_1, h_2, \dots, h_n)\in \mathbb{R}^n w postaci macierzy kolumnowej:

\displaystyle \left[\begin{array}{r} h_1 \\ h_2 \\ \vdots \\ h_n\end{array} \right].

Jeśli w taki sam sposób zapiszemy również zestawienie różniczek funkcji \displaystyle f=(f_1, f_2, \dots, f_m) :

\displaystyle \left[\begin{array}{r} d_a f_1 \\ d_a f_2 \\ \vdots \\ d_a f_m\end{array} \right],

to macierz pochodnych cząstkowych \displaystyle \frac{\partial f_i}{\partial x_j}(a) , \displaystyle i=1,2,\dots, m , \displaystyle j=1,2,\dots, n , powinniśmy zapisać następująco:

\displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right],

aby móc stosować algorytm mnożenia (składania) macierzy:

\displaystyle \left[\begin{array}{r} d_a f_1 \\ d_a f_2 \\ \vdots \\ d_a f_m\end{array} \right]= \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right]\, \left[\begin{array}{r} h_1 \\ h_2 \\ \vdots \\ h_n\end{array} \right],

który w tym przypadku prowadzi do uzyskanego przez nas wzoru:

\displaystyle \begin{align*} d_a f_i(h) & =\frac{\partial f_i}{\partial x_1}(a)h_1+\frac{\partial f_i}{\partial x_2}(a)h_2+\dots+\frac{\partial f_i}{\partial x_n}(a)h_n \\ & =\sum_{k=1}^n \frac{\partial f_i}{\partial x_k}(a)h_k, \end{align*}

gdzie \displaystyle i=1,2,\dots, m .

Definicja 7.19.

Macierz \displaystyle \left[\frac{\partial f_i }{\partial x_j}(a)\right] , \displaystyle i=1,2,\dots, m , \displaystyle j=1,2,\dots, n , tj. macierz

\displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right],

nazywamy macierzą Jacobiego funkcji (odwzorowania) \displaystyle f:\mathbb{R}^n\mapsto \mathbb{R}^m w punkcie \displaystyle a\in\mathbb{R}^n . Zwróćmy uwagę, że macierz Jacobiego jest macierzą prostokątną o \displaystyle n kolumnach i \displaystyle m wierszach. W szczególnym przypadku, gdy \displaystyle n=m (tj: \displaystyle f: \mathbb{R}^n\mapsto \mathbb{R}^n ) możemy policzyć wyznacznik macierzy Jacobiego

\displaystyle \text{jac}_a f: =\det \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right],

który nazywamy jakobianem funkcji \displaystyle f w punkcie \displaystyle a i oznaczamy symbolami \displaystyle \text{jac}_a f , \displaystyle \text{jac} f(a) , \displaystyle J_a f , \displaystyle |f'(a)| , \displaystyle |d_a f| lub \displaystyle \det d_a f .

Uwaga 7.20.

Autorzy podręczników używają wielu różnych (często niejednolitych) oznaczeń na oznaczenie macierzy Jacobiego i jakobianu. Pamiętajmy jednak, że jakobian jest liczbą równą wyznacznikowi macierzy Jacobiego, tj. macierzy

pochodnych cząstkowych funkcji \displaystyle f:\mathbb{R}^n\mapsto \mathbb{R}^n .

Kolejny wniosek dotyczy wyrażenia różniczki złożenia dwóch funkcji. Jest bardzo często wykorzystywany w praktycznych obliczeniach

Wniosek 7.21.

Niech \displaystyle f=(f_1, f_2, \dots, f_m): \mathbb{R}^n\mapsto \mathbb{R}^m będzie funkcją różniczkowalną w punkcie \displaystyle a\in \mathbb{R}^n i niech \displaystyle g=(g_1, g_2, \dots, g_k) : \mathbb{R}^m\mapsto \mathbb{R}^k będzie funkcją różniczkowalną w punkcie \displaystyle f(a) . Wiemy już, że istnieje różniczka złożenia \displaystyle g\circ f: \mathbb{R}^n\mapsto \mathbb{R}^k w punkcie \displaystyle a i jest złożeniem różniczek \displaystyle d_{f(a)}g oraz \displaystyle d_a f . Różniczkę \displaystyle d_a f reprezentuje macierz pochodnych cząstkowych:

\displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array}\right],

a różniczkę \displaystyle d_{f(a)}g macierz

\displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial g_1}{\partial x_1}(b) & \displaystyle\frac{\partial g_1}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_1}{\partial x_n}(b) \\ \displaystyle \frac{\partial g_2}{\partial x_1}(b) & \displaystyle\frac{\partial g_2}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_2}{\partial x_n}(b) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial g_m}{\partial x_1}(b) & \displaystyle\frac{\partial g_m}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_m}{\partial x_n}(b) \end{array} \right],

gdzie \displaystyle b=f(a) . Złożenie odwzorowań liniowych \displaystyle d_{f(a)}g\circ d_a f reprezentuje iloczyn podanych macierzy:

\displaystyle \left [ \begin{array}{rrrr} \displaystyle \frac{\partial g_1}{\partial x_1}(b) & \displaystyle\frac{\partial g_1}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_1}{\partial x_n}(b) \\ \displaystyle \frac{\partial g_2}{\partial x_1}(b) & \displaystyle\frac{\partial g_2}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_2}{\partial x_n}(b) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial g_m}{\partial x_1}(b) & \displaystyle\frac{\partial g_m}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_m}{\partial x_n}(b) \end{array} \right],

\displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right],

Stąd pochodną cząstkową \displaystyle i -tej składowej złożenia \displaystyle g\circ f wyraża suma

\displaystyle \frac{\partial (g\circ f)_i}{\partial x_j}(a)=\sum_{r=1}^m \frac{\partial g_i}{\partial y_r} (f(a))\cdot \frac{\partial f_r}{\partial x_j}(a).

Uwaga 7.22.

Otrzymany wzór na pochodne cząstkowe złożenia często zapisuje się bez wyszczególniania argumentów w postaci

\displaystyle \frac{\partial (g\circ f)_i}{\partial x_j}=\sum_{r=1}^m \bigg(\frac{\partial g_i}{\partial y_r}\circ f\bigg)\cdot \frac{\partial f_r}{\partial x_j}.

Czasem też wzór ten upraszcza się (gdy nie ma obawy nieporozumienia)

\displaystyle \frac{\partial g_i}{\partial x_j}=\sum_{r=1}^m \frac{\partial g_i}{\partial y_r} \cdot \frac{\partial f_r}{\partial x_j}.

lub jeszcze prościej

\displaystyle \frac{\partial g_i}{\partial x_j}=\sum_{r=1}^m \frac{\partial g_i}{\partial y_r} \cdot \frac{\partial y_r}{\partial x_j},

gdzie przez \displaystyle y=(y_1, \dots, y_r, \dots, y_m) rozumie się zmienną niezależną (po której różniczkuje się funkcję \displaystyle g_i w pierwszym czynniku), a równocześnie \displaystyle (y_1, \dots, y_r, \dots, y_m)=f oznacza składowe funkcji \displaystyle f .

Uwaga 7.23.

W wielu klasycznych podręcznikach symbolem \displaystyle dx_i : \mathbb{R}^n \ni (x_1, x_2, \dots, x_i, \dots, x_n)\mapsto x_i\in \mathbb{R} oznacza się rzutowanie na \displaystyle i -tą współrzędną. Zwróćmy uwagę, że każde z rzutowań \displaystyle dx_1, dx_2, \dots, dx_n jest odwzorowaniem liniowym i ciągłym z \displaystyle \mathbb{R}^n do \displaystyle \mathbb{R} . Wobec tego zamiast przedstawiać

wartość różniczki na wektorze \displaystyle h=(h_1, h_2, \dots, h_n) za pomocą sumy

\displaystyle d_a f(h)=h_1\frac{\partial f(a)}{\partial x_1}+h_2\frac{\partial f(a)}{\partial x_2}+\dots+h_n\frac{\partial f(a)}{\partial x_n}

możemy zapisać bezargumentowo jako kombinację liniową rzutowań \displaystyle dx_i o współczynnikach liczbowych \displaystyle \frac{\partial f(a)}{\partial x_i} , czyli

\displaystyle d_a f=\frac{\partial f(a)}{\partial x_1}dx_1+\frac{\partial f(a)}{\partial x_2}dx_2 +\dots+\frac{\partial f(a)}{\partial x_n}dx_n.

Wówczas wartość różniczki \displaystyle d_a f na wektorze \displaystyle h=(h_1, h_2, \dots, h_n) wyraża się tym samym wzorem, co poprzednio:

\displaystyle \begin{align*} d_a f(h) & =\bigg(\frac{\partial f(a)}{\partial x_1}dx_1+\frac{\partial f(a)}{\partial x_2}dx_2 +\dots+\frac{\partial f(a)}{\partial x_n}dx\bigg)(h) \\ & =\frac{\partial f(a)}{\partial x_1}dx_1(h)+\frac{\partial f(a)}{\partial x_2}dx_2(h) +\dots+\frac{\partial f(a)}{\partial x_n}dx_n(h) \\ & =\frac{\partial f(a)}{\partial x_1 } h_1+\frac{\partial f(a)}{\partial x_2 } h_2 + \dots + \frac{\partial f(a)}{\partial x_n} h_n .\end{align*}

Wniosek 7.24.

Jeśli \displaystyle f : \mathbb{R}^n \supset U\mapsto \mathbb{R} jest funkcją różniczkowalną w punkcie \displaystyle a\in U , to dla dowolnego wektora \displaystyle h\in \mathbb{R}^n wartość różniczki \displaystyle d_a f na wektorze \displaystyle h jest iloczynem skalarnym gradientu \displaystyle \mathrm{grad}\, f(a) funkcji \displaystyle f w punkcie \displaystyle a i wektora \displaystyle h , tj.

\displaystyle d_a f(h)=(\mathrm{grad}\, f(a) | h)=\frac{\partial f(a)}{\partial x_1 } h_1+\frac{\partial f(a)}{\partial x_2 } h_2 + \dots + \frac{\partial f(a)}{\partial x_n} h_n,

gdzie \displaystyle (x | y)=x_1 y_1+x_2y_2+\dots+x_n y_n oznacza iloczyn skalarny wektorów \displaystyle x=(x_1, x_2, \dots, x_n) i \displaystyle y=(y_1, y_2, \dots, y_n) w przestrzeni \displaystyle \mathbb{R}^n .

Ponieważ iloczyn skalarny wektorów \displaystyle x oraz \displaystyle y oznacza się także często za pomocą kropki: \displaystyle x.y albo \displaystyle x\cdot y , stąd wartość różniczki \displaystyle d_a f funkcji \displaystyle f w punkcie \displaystyle a na wektorze \displaystyle h oznacza się też czasem symbolem: \displaystyle d_a f.h zamiast \displaystyle d_a f(h) .

Pamiętamy, że dla dowolnych wektorów \displaystyle x=(x_1, x_2, \dots, x_n) oraz \displaystyle y=(y_1, y_2, \dots, y_n) zachodzi nierówność Schwarza:

\displaystyle |(x|y)|\leq \|x\| \ \|y\|,

czyli

\displaystyle |x_1 y_1+x_2y_2+\dots+x_n y_n|\leq \sqrt{|x_1|^2+|x_2|^2+\dots+|x_n|^2} \ \sqrt{|y_1|^2+|y_2|^2+\dots+|y_n|^2},

przy czym równość w tej nierówności zachodzi wówczas, gdy wektory \displaystyle x oraz \displaystyle y są liniowo zależne. Wnioskiem z nierówności Schwarza jest więc

Uwaga 7.25.

Niech \displaystyle \|v\|=1 będzie wektorem o jednostkowej długości w \displaystyle \mathbb{R}^n . Pochodna kierunkowa \displaystyle \partial_v f(a) osiąga największą wartość (co do wartości bezwzględnej) w kierunku wektora gradientu.

Dowód 7.25.

Skoro \displaystyle d_a f (v)=\partial_v f(a) oraz \displaystyle d_a f(v)=\sum_{k=1}^n \frac{\partial f(a)}{\partial x_k}v_k=(\mathrm{grad}\, f(a) | v) , więc \displaystyle \partial_v f(a)=(\mathrm{grad}\, f(a) | v) . Stąd na mocy nierówności Schwarza:

\displaystyle |\partial_v f(a)|=|(\mathrm{grad}\, f (a) |v )|\leq \|\mathrm{grad}\, f (a)\| \ \|v\|,

przy czym funkcja \displaystyle S^{n-1}\supset v\mapsto |\partial_v f (a)| osiąga wartość największą na sferze jednostkowej \displaystyle S^{n-1}=\{v\in \mathbb{R}^n: (v|v)=1\} , gdy wektor \displaystyle v jest równoległy do wektora gradientu \displaystyle \mathrm{grad}\, f(a) .

Powstaje naturalne pytanie o warunki, jakie powinny spełniać pochodne cząstkowe, aby istniała różniczka. Warunek taki podaje

Twierdzenie 7.26.

(twierdzenie o istnieniu różniczki) Niech \displaystyle f=(f_1, f_2, \dots, f_m ):\mathbb{R}^n\mapsto \mathbb{R}^m będzie funkcją określoną w pewnym

otwartym otoczeniu \displaystyle U\subset \mathbb{R}^n punktu \displaystyle \alpha . Jeśli pochodne cząstkowe \displaystyle \frac{\partial f_i}{\partial x_j}(\alpha) istnieją i są ciągłe w otoczeniu punktu \displaystyle \alpha , to istnieje różniczka \displaystyle d_\alpha f .

Dowód twierdzenia pomijamy (można go znaleźć np. na stronie 175. podręcznika Ryszarda Rudnickiego, Wykłady z analizy matematycznej, Wydawnictwo Naukowe PWN, Warszawa 2001).