Wyrażenie różniczki Frecheta za pomocą pochodnych cząstkowych

W poprzednim module zdefiniowaliśmy pochodną kierunkową funkcji \( \displaystyle f:X\mapsto \mathbb{R} \) w punkcie \( \displaystyle a \) w kierunku \( \displaystyle v\neq 0 \). Możemy tę samą definicję powtórzyć również w przypadku funkcji \( \displaystyle f:X\mapsto Y \), w przypadku, gdy zbiorem wartości funkcji \( \displaystyle f:X\mapsto Y \), jest dowolna przestrzeń unormowana \( \displaystyle Y \):

\( \displaystyle \partial_v f(a)=\lim_{t\to 0}\frac{f(a+tv)-f(a)}{t}, \)

gdzie \( \displaystyle t\in \mathbb{R} \), a zbieżność ilorazów różnicowych do granicy \( \displaystyle \partial_v f(a)\in Y \) przy \( \displaystyle t\to 0 \) rozumiemy w sensie zbieżności w normie przestrzeni \( \displaystyle Y \).

Uwaga 7.13.

Niech \( \displaystyle v\in X \) będzie dowolnym wektorem jednostkowym z przestrzeni \( \displaystyle X \), tzn. \( \displaystyle \|v\|=1 \). Jeśli funkcja \( \displaystyle f: X\mapsto Y \) jest różniczkowalna w sensie Frecheta w punkcie \( \displaystyle a \), to istnieje pochodna kierunkowa \( \displaystyle \partial_v f(a) \) w dowolnym kierunku \( \displaystyle v \),

przy czym zachodzi równość

\( \displaystyle \partial_v f(a)=d_a f(v) \text{ dla } \|v\|=1. \)

Ponadto funkcja \( \displaystyle v\mapsto \partial_v f(a) \) jest liniowa i ciągła.

Dowód 7.13.

Skoro

\( \displaystyle \displaystyle \frac{\|f(a+h)-f(a)-d_a f (h)\|}{\|h\|}\to 0, \text{ przy }\|h\|\to 0, \)

więc w szczególności dla \( \displaystyle h=tv \) mamy

\( \displaystyle \frac{\|f(a+tv)-f(a)-d_a f (tv)\|}{\|tv\|}\to 0. \)

Wobec liniowości różniczki \( \displaystyle d_a f(tv)=t d_a f(v) \) oraz faktu, że \( \displaystyle \|tv \|=|t| \), mamy

\( \displaystyle \bigg\|\frac{f(a+tv)-f(a)}{t}-d_a f (v)\bigg\|\to 0, \)

czyli iloraz różnicowy \( \displaystyle \frac{f(a+tv)-f(a)}{t} \) zmierza przy \( \displaystyle t\to 0 \) do granicy \( \displaystyle d_a f(v) \), więc istnieje pochodna kierunkowa \( \displaystyle \partial_v f(a) \) i jest równa wartości różniczki zupełnej funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \) na wektorze \( \displaystyle v \). Stąd funkcja \( \displaystyle v\mapsto \partial_v f(a)=d_a f (v) \) jest liniowa i ciągła.

Uwaga 7.14.

Niech \( \displaystyle f:X\mapsto Y \) będzie funkcją różniczkowalną w punkcie \( \displaystyle a\in X \). Wówczas \( \displaystyle d_a f=0 \) wtedy i tylko wtedy, gdy zeruje się

pochodna kierunkowa \( \displaystyle \partial_v f(a)=0 \) w dowolnym kierunku.

Powstaje pytanie o istnienie różniczki Frecheta funkcji \( \displaystyle f: X\mapsto Y \) w punkcie, w którym istnieją pochodne kierunkowe w dowolnym kierunku. Negatywną odpowiedź na to pytanie podaje

Przykład 7.15.

Funkcja \( \displaystyle f(x,y)=\root{3}\of{x^3+y^3} \) ma w punkcie \( \displaystyle 0\in \mathbb{R}^2 \) pochodne kierunkowe \( \displaystyle \partial_v f(0) \) w dowolnym kierunku \( \displaystyle \|v\|=1 \), nie jest jednak różniczkowalna w sensie Frecheta w tym punkcie. Zauważmy, że dowolny wektor \( \displaystyle \|v\|=1 \) można na płaszczyźnie \( \displaystyle \mathbb{R}^2 \) jednoznacznie przedstawić w postaci \( \displaystyle v=(\cos\varphi, \sin\varphi) \), gdzie \( \displaystyle 0\leq \varphi < 2\pi \). Stąd \( \displaystyle \lim_{t\to 0}\frac{f(0+tv)-f(0)}{t}=\sqrt{\cos^3\varphi+\sin^3\varphi} \).

Jednak funkcja \( \displaystyle v\mapsto \partial_v f(0) \) nie jest liniowa.

Przykład 7.16.

Funkcja

\( \displaystyle f(x,y)=\left\{\begin{align*} \frac{x^2 y}{x^2+y^2}, \text{ dla } (x,y)\neq 0 \\ 0, \text{ dla } (x,y)=0\end{align*} \right. \)

ma w punkcie \( \displaystyle 0 \) pochodną kierunkową w każdym kierunku, nie ma jednak różniczki Frecheta w tym punkcie.

Z praktycznego punktu widzenia w zastosowaniach najważniejsza jest możliwość wyrażenia różniczki w sensie Frecheta za pomocą pochodnych cząstkowych.

Twierdzenie 7.17.

Niech \( \displaystyle f=(f_1, f_2, \dots, f_m):\mathbb{R}^n \supset U\mapsto \mathbb{R}^m \) będzie funkcją różniczkowalną w sensie Frecheta w punkcie \( \displaystyle a\in U \). Istnieją wówczas pochodne cząstkowe

\( \displaystyle \begin{align*} & \frac{\partial f_1}{\partial x_1}(a), & \frac{\partial f_1}{\partial x_2}(a), & \dots, & \frac{\partial f_1}{\partial x_n}(a) \\ & \frac{\partial f_2}{\partial x_1}(a), & \frac{\partial f_2}{\partial x_2}(a), & \dots, & \frac{\partial f_2}{\partial x_n}(a) \\ & \vdots & \vdots \quad & \dots & \vdots \\ & \frac{\partial f_m}{\partial x_1}(a), & \frac{\partial f_m}{\partial x_2}(a), & \dots, & \frac{\partial f_m}{\partial x_n}(a)\end{align*} \)

i są one wyrazami macierzy odwzorowania liniowego \( \displaystyle d_a f\in L(\mathbb{R}^n, \mathbb{R}^m) \) w bazie kanonicznej, to znaczy, dla dowolnego wektora \( \displaystyle h\in \mathbb{R}^n \) wartość \( \displaystyle d_a f(h) \) odwzorowania \( \displaystyle d_a f \) na wektorze \( \displaystyle h \) jest wektorem z \( \displaystyle \mathbb{R}^m \) o współrzędnych

\( \displaystyle \bigg(\sum_{j=1}^n \frac{\partial f_1}{\partial x_j}(a) h_j, \sum_{j=1}^n \frac{\partial f_2}{\partial x_j}(a) h_j,\dots, \sum_{j=1}^n \frac{\partial f_m}{\partial x_j}(a) h_j\bigg). \)

Dowód 7.17.

Wykazaliśmy, że zachodzi równość \( \displaystyle \partial_v f(a)=d_a f (v) \). Ponieważ \( \displaystyle d_a f =(d_a f_1, d_a f_2, \dots, d_a f_m) \), więc wystarczy wykazać twierdzenie dla składowych odwzorowania \( \displaystyle f \), tj. dla funkcji \( \displaystyle f_i: \mathbb{R}^n\mapsto \mathbb{R} \). W dalszym ciągu dowodu będziemy pomijać indeks dolny \( \displaystyle i \), zakładając, że \( \displaystyle f_i=f \) jest funkcją o wartościach w zbiorze liczb rzeczywistych. Dla dowolnego wektora \( \displaystyle e_i \), \( \displaystyle i=1,2,\dots, n \) bazy kanonicznej przestrzeni \( \displaystyle \mathbb{R}^n \) mamy (z definicji pochodnej cząstkowej) równość \( \displaystyle \partial_{e_i} f(a)=\frac{\partial f}{\partial x_i}(a) \), więc dla dowolnego wektora \( \displaystyle h=h_1e_1+h_2e_2+\dots+h_ne_n \) mamy

\( \displaystyle \begin{align*} d_a f(h) & =d_a f(h_1e_1+h_2e_2+\dots+h_ne_n) \\ & =h_1 d_a f(e_1)+h_2 d_a f(e_2)+\dots+h_n d_a f(e_n) \\ & =h_1\frac{\partial f}{\partial x_1}(a)+h_2\frac{\partial f}{\partial x_2}(a)+\dots+h_n\frac{\partial f}{\partial x_n}(a).\end{align*} \)

Uwaga 7.18.

W ramach kursu algebry liniowej zwykliśmy zapisywać wektory \( \displaystyle h=(h_1, h_2, \dots, h_n)\in \mathbb{R}^n \) w postaci macierzy kolumnowej:

\( \displaystyle \left[\begin{array}{r} h_1 \\ h_2 \\ \vdots \\ h_n\end{array} \right]. \)

Jeśli w taki sam sposób zapiszemy również zestawienie różniczek funkcji \( \displaystyle f=(f_1, f_2, \dots, f_m) \):

\( \displaystyle \left[\begin{array}{r} d_a f_1 \\ d_a f_2 \\ \vdots \\ d_a f_m\end{array} \right], \)

to macierz pochodnych cząstkowych \( \displaystyle \frac{\partial f_i}{\partial x_j}(a) \), \( \displaystyle i=1,2,\dots, m \), \( \displaystyle j=1,2,\dots, n \), powinniśmy zapisać następująco:

\( \displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right], \)

aby móc stosować algorytm mnożenia (składania) macierzy:

\( \displaystyle \left[\begin{array}{r} d_a f_1 \\ d_a f_2 \\ \vdots \\ d_a f_m\end{array} \right]= \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right]\, \left[\begin{array}{r} h_1 \\ h_2 \\ \vdots \\ h_n\end{array} \right], \)

który w tym przypadku prowadzi do uzyskanego przez nas wzoru:

\( \displaystyle \begin{align*} d_a f_i(h) & =\frac{\partial f_i}{\partial x_1}(a)h_1+\frac{\partial f_i}{\partial x_2}(a)h_2+\dots+\frac{\partial f_i}{\partial x_n}(a)h_n \\ & =\sum_{k=1}^n \frac{\partial f_i}{\partial x_k}(a)h_k, \end{align*} \)

gdzie \( \displaystyle i=1,2,\dots, m \).

Definicja 7.19.

Macierz \( \displaystyle \left[\frac{\partial f_i }{\partial x_j}(a)\right] \), \( \displaystyle i=1,2,\dots, m \), \( \displaystyle j=1,2,\dots, n \), tj. macierz

\( \displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right], \)

nazywamy macierzą Jacobiego funkcji (odwzorowania) \( \displaystyle f:\mathbb{R}^n\mapsto \mathbb{R}^m \) w punkcie \( \displaystyle a\in\mathbb{R}^n \). Zwróćmy uwagę, że macierz Jacobiego jest macierzą prostokątną o \( \displaystyle n \) kolumnach i \( \displaystyle m \) wierszach. W szczególnym przypadku, gdy \( \displaystyle n=m \) (tj: \( \displaystyle f: \mathbb{R}^n\mapsto \mathbb{R}^n \)) możemy policzyć wyznacznik macierzy Jacobiego

\( \displaystyle \text{jac}_a f: =\det \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right], \)

który nazywamy jakobianem funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \) i oznaczamy symbolami \( \displaystyle \text{jac}_a f \), \( \displaystyle \text{jac} f(a) \), \( \displaystyle J_a f \), \( \displaystyle |f'(a)| \), \( \displaystyle |d_a f| \) lub \( \displaystyle \det d_a f \).

Uwaga 7.20.

Autorzy podręczników używają wielu różnych (często niejednolitych) oznaczeń na oznaczenie macierzy Jacobiego i jakobianu. Pamiętajmy jednak, że jakobian jest liczbą równą wyznacznikowi macierzy Jacobiego, tj. macierzy

pochodnych cząstkowych funkcji \( \displaystyle f:\mathbb{R}^n\mapsto \mathbb{R}^n \).

Kolejny wniosek dotyczy wyrażenia różniczki złożenia dwóch funkcji. Jest bardzo często wykorzystywany w praktycznych obliczeniach

Wniosek 7.21.

Niech \( \displaystyle f=(f_1, f_2, \dots, f_m): \mathbb{R}^n\mapsto \mathbb{R}^m \) będzie funkcją różniczkowalną w punkcie \( \displaystyle a\in \mathbb{R}^n \) i niech \( \displaystyle g=(g_1, g_2, \dots, g_k) : \mathbb{R}^m\mapsto \mathbb{R}^k \) będzie funkcją różniczkowalną w punkcie \( \displaystyle f(a) \). Wiemy już, że istnieje różniczka złożenia \( \displaystyle g\circ f: \mathbb{R}^n\mapsto \mathbb{R}^k \) w punkcie \( \displaystyle a \) i jest złożeniem różniczek \( \displaystyle d_{f(a)}g \) oraz \( \displaystyle d_a f \). Różniczkę \( \displaystyle d_a f \) reprezentuje macierz pochodnych cząstkowych:

\( \displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array}\right], \)

a różniczkę \( \displaystyle d_{f(a)}g \) macierz

\( \displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial g_1}{\partial x_1}(b) & \displaystyle\frac{\partial g_1}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_1}{\partial x_n}(b) \\ \displaystyle \frac{\partial g_2}{\partial x_1}(b) & \displaystyle\frac{\partial g_2}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_2}{\partial x_n}(b) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial g_m}{\partial x_1}(b) & \displaystyle\frac{\partial g_m}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_m}{\partial x_n}(b) \end{array} \right], \)

gdzie \( \displaystyle b=f(a) \). Złożenie odwzorowań liniowych \( \displaystyle d_{f(a)}g\circ d_a f \) reprezentuje iloczyn podanych macierzy:

\( \displaystyle \left [ \begin{array}{rrrr} \displaystyle \frac{\partial g_1}{\partial x_1}(b) & \displaystyle\frac{\partial g_1}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_1}{\partial x_n}(b) \\ \displaystyle \frac{\partial g_2}{\partial x_1}(b) & \displaystyle\frac{\partial g_2}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_2}{\partial x_n}(b) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial g_m}{\partial x_1}(b) & \displaystyle\frac{\partial g_m}{\partial x_2}(b) & \dots & \displaystyle\frac{\partial g_m}{\partial x_n}(b) \end{array} \right], \)

\( \displaystyle \left[ \begin{array}{rrrr} \displaystyle \frac{\partial f_1}{\partial x_1}(a) & \displaystyle\frac{\partial f_1}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_1}{\partial x_n}(a) \\ \displaystyle \frac{\partial f_2}{\partial x_1}(a) & \displaystyle\frac{\partial f_2}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_2}{\partial x_n}(a) \\ \displaystyle \dots & \dots & \dots & \dots \\ \displaystyle \frac{\partial f_m}{\partial x_1}(a) & \displaystyle\frac{\partial f_m}{\partial x_2}(a) & \dots & \displaystyle\frac{\partial f_m}{\partial x_n}(a) \end{array} \right], \)

Stąd pochodną cząstkową \( \displaystyle i \)-tej składowej złożenia \( \displaystyle g\circ f \) wyraża suma

\( \displaystyle \frac{\partial (g\circ f)_i}{\partial x_j}(a)=\sum_{r=1}^m \frac{\partial g_i}{\partial y_r} (f(a))\cdot \frac{\partial f_r}{\partial x_j}(a). \)

Uwaga 7.22.

Otrzymany wzór na pochodne cząstkowe złożenia często zapisuje się bez wyszczególniania argumentów w postaci

\( \displaystyle \frac{\partial (g\circ f)_i}{\partial x_j}=\sum_{r=1}^m \bigg(\frac{\partial g_i}{\partial y_r}\circ f\bigg)\cdot \frac{\partial f_r}{\partial x_j}. \)

Czasem też wzór ten upraszcza się (gdy nie ma obawy nieporozumienia)

\( \displaystyle \frac{\partial g_i}{\partial x_j}=\sum_{r=1}^m \frac{\partial g_i}{\partial y_r} \cdot \frac{\partial f_r}{\partial x_j}. \)

lub jeszcze prościej

\( \displaystyle \frac{\partial g_i}{\partial x_j}=\sum_{r=1}^m \frac{\partial g_i}{\partial y_r} \cdot \frac{\partial y_r}{\partial x_j}, \)

gdzie przez \( \displaystyle y=(y_1, \dots, y_r, \dots, y_m) \) rozumie się zmienną niezależną (po której różniczkuje się funkcję \( \displaystyle g_i \) w pierwszym czynniku), a równocześnie \( \displaystyle (y_1, \dots, y_r, \dots, y_m)=f \) oznacza składowe funkcji \( \displaystyle f \).

Uwaga 7.23.

W wielu klasycznych podręcznikach symbolem \( \displaystyle dx_i : \mathbb{R}^n \ni (x_1, x_2, \dots, x_i, \dots, x_n)\mapsto x_i\in \mathbb{R} \) oznacza się rzutowanie na \( \displaystyle i \)-tą współrzędną. Zwróćmy uwagę, że każde z rzutowań \( \displaystyle dx_1, dx_2, \dots, dx_n \) jest odwzorowaniem liniowym i ciągłym z \( \displaystyle \mathbb{R}^n \) do \( \displaystyle \mathbb{R} \). Wobec tego zamiast przedstawiać

wartość różniczki na wektorze \( \displaystyle h=(h_1, h_2, \dots, h_n) \) za pomocą sumy

\( \displaystyle d_a f(h)=h_1\frac{\partial f(a)}{\partial x_1}+h_2\frac{\partial f(a)}{\partial x_2}+\dots+h_n\frac{\partial f(a)}{\partial x_n} \)

możemy zapisać bezargumentowo jako kombinację liniową rzutowań \( \displaystyle dx_i \) o współczynnikach liczbowych \( \displaystyle \frac{\partial f(a)}{\partial x_i} \), czyli

\( \displaystyle d_a f=\frac{\partial f(a)}{\partial x_1}dx_1+\frac{\partial f(a)}{\partial x_2}dx_2 +\dots+\frac{\partial f(a)}{\partial x_n}dx_n. \)

Wówczas wartość różniczki \( \displaystyle d_a f \) na wektorze \( \displaystyle h=(h_1, h_2, \dots, h_n) \) wyraża się tym samym wzorem, co poprzednio:

\( \displaystyle \begin{align*} d_a f(h) & =\bigg(\frac{\partial f(a)}{\partial x_1}dx_1+\frac{\partial f(a)}{\partial x_2}dx_2 +\dots+\frac{\partial f(a)}{\partial x_n}dx\bigg)(h) \\ & =\frac{\partial f(a)}{\partial x_1}dx_1(h)+\frac{\partial f(a)}{\partial x_2}dx_2(h) +\dots+\frac{\partial f(a)}{\partial x_n}dx_n(h) \\ & =\frac{\partial f(a)}{\partial x_1 } h_1+\frac{\partial f(a)}{\partial x_2 } h_2 + \dots + \frac{\partial f(a)}{\partial x_n} h_n .\end{align*} \)

Wniosek 7.24.

Jeśli \( \displaystyle f : \mathbb{R}^n \supset U\mapsto \mathbb{R} \) jest funkcją różniczkowalną w punkcie \( \displaystyle a\in U \), to dla dowolnego wektora \( \displaystyle h\in \mathbb{R}^n \) wartość różniczki \( \displaystyle d_a f \) na wektorze \( \displaystyle h \) jest iloczynem skalarnym gradientu \( \displaystyle \mathrm{grad}\, f(a) \) funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \) i wektora \( \displaystyle h \), tj.

\( \displaystyle d_a f(h)=(\mathrm{grad}\, f(a) | h)=\frac{\partial f(a)}{\partial x_1 } h_1+\frac{\partial f(a)}{\partial x_2 } h_2 + \dots + \frac{\partial f(a)}{\partial x_n} h_n, \)

gdzie \( \displaystyle (x | y)=x_1 y_1+x_2y_2+\dots+x_n y_n \) oznacza iloczyn skalarny wektorów \( \displaystyle x=(x_1, x_2, \dots, x_n) \) i \( \displaystyle y=(y_1, y_2, \dots, y_n) \) w przestrzeni \( \displaystyle \mathbb{R}^n \).

Ponieważ iloczyn skalarny wektorów \( \displaystyle x \) oraz \( \displaystyle y \) oznacza się także często za pomocą kropki: \( \displaystyle x.y \) albo \( \displaystyle x\cdot y \), stąd wartość różniczki \( \displaystyle d_a f \) funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \) na wektorze \( \displaystyle h \) oznacza się też czasem symbolem: \( \displaystyle d_a f.h \) zamiast \( \displaystyle d_a f(h) \).

Pamiętamy, że dla dowolnych wektorów \( \displaystyle x=(x_1, x_2, \dots, x_n) \) oraz \( \displaystyle y=(y_1, y_2, \dots, y_n) \) zachodzi nierówność Schwarza:

\( \displaystyle |(x|y)|\leq \|x\| \ \|y\|, \)

czyli

\( \displaystyle |x_1 y_1+x_2y_2+\dots+x_n y_n|\leq \sqrt{|x_1|^2+|x_2|^2+\dots+|x_n|^2} \ \sqrt{|y_1|^2+|y_2|^2+\dots+|y_n|^2}, \)

przy czym równość w tej nierówności zachodzi wówczas, gdy wektory \( \displaystyle x \) oraz \( \displaystyle y \) są liniowo zależne. Wnioskiem z nierówności Schwarza jest więc

Uwaga 7.25.

Niech \( \displaystyle \|v\|=1 \) będzie wektorem o jednostkowej długości w \( \displaystyle \mathbb{R}^n \). Pochodna kierunkowa \( \displaystyle \partial_v f(a) \) osiąga największą wartość (co do wartości bezwzględnej) w kierunku wektora gradientu.

Dowód 7.25.

Skoro \( \displaystyle d_a f (v)=\partial_v f(a) \) oraz \( \displaystyle d_a f(v)=\sum_{k=1}^n \frac{\partial f(a)}{\partial x_k}v_k=(\mathrm{grad}\, f(a) | v) \), więc \( \displaystyle \partial_v f(a)=(\mathrm{grad}\, f(a) | v) \). Stąd na mocy nierówności Schwarza:

\( \displaystyle |\partial_v f(a)|=|(\mathrm{grad}\, f (a) |v )|\leq \|\mathrm{grad}\, f (a)\| \ \|v\|, \)

przy czym funkcja \( \displaystyle S^{n-1}\supset v\mapsto |\partial_v f (a)| \) osiąga wartość największą na sferze jednostkowej \( \displaystyle S^{n-1}=\{v\in \mathbb{R}^n: (v|v)=1\} \), gdy wektor \( \displaystyle v \) jest równoległy do wektora gradientu \( \displaystyle \mathrm{grad}\, f(a) \).

Powstaje naturalne pytanie o warunki, jakie powinny spełniać pochodne cząstkowe, aby istniała różniczka. Warunek taki podaje

Twierdzenie 7.26.

(twierdzenie o istnieniu różniczki) Niech \( \displaystyle f=(f_1, f_2, \dots, f_m ):\mathbb{R}^n\mapsto \mathbb{R}^m \) będzie funkcją określoną w pewnym

otwartym otoczeniu \( \displaystyle U\subset \mathbb{R}^n \) punktu \( \displaystyle \alpha \). Jeśli pochodne cząstkowe \( \displaystyle \frac{\partial f_i}{\partial x_j}(\alpha) \) istnieją i są ciągłe w otoczeniu punktu \( \displaystyle \alpha \), to istnieje różniczka \( \displaystyle d_\alpha f \).

Dowód twierdzenia pomijamy (można go znaleźć np. na stronie 175. podręcznika Ryszarda Rudnickiego, Wykłady z analizy matematycznej, Wydawnictwo Naukowe PWN, Warszawa 2001).