Różniczki wyższych rzędów

rycina

Niech \( \displaystyle X, Y \) będą przestrzeniami Banacha i niech \( \displaystyle f: U\mapsto Y \) będzie funkcją określoną na zbiorze otwartym \( \displaystyle U\subset X \). Załóżmy, że w każdym punkcie \( \displaystyle a\in U \) istnieje różniczka \( \displaystyle d_a f\in L(X,Y) \), która -- przypomnijmy -- jest odwzorowaniem liniowym i ciągłym z \( \displaystyle X \) do \( \displaystyle Y \).

Definicja 7.29.

Mówimy, że funkcja \( \displaystyle f: U\mapsto Y \) jest dwukrotnie różniczkowalna w punkcie \( \displaystyle a \), jeśli różniczkowalna jest w punkcie \( \displaystyle a \) funkcja \( \displaystyle d. f: U\ni x\mapsto d_x f\in L(X, Y) \). Różniczkę funkcji \( \displaystyle d. f \) w punkcie \( \displaystyle a \), która jest elementem przestrzeni \( \displaystyle L(X, L(X, Y)) \), nazywamy drugą różniczką funkcji \( \displaystyle f \) (lub różniczką rzędu drugiego funkcji \( \displaystyle f \)) w punkcie \( \displaystyle a \) i oznaczamy symbolem \( \displaystyle d_a ^2 f \).

Uwaga 7.30.

W ramach algebry liniowej dowodzi się, że przestrzenie \( \displaystyle L(X, L(X,Y)) \) oraz \( \displaystyle L^2 (X,Y) \) (czyli przestrzeń odwzorowań dwuliniowych ciągłych na \( \displaystyle X \) o wartościach w \( \displaystyle Y \)) są izomorficzne. Stąd też często mówimy, że różniczka rzędu drugiego jest odwzorowaniem dwuliniowym ciągłym na \( \displaystyle X \) o wartościach w \( \displaystyle Y \).

Podobnie jak w przypadku funkcji jednej zmiennej, nazwijmy różniczką rzędu zerowego funkcji \( \displaystyle f \) samą funkcję \( \displaystyle f \), tzn. \( \displaystyle d^0 f=f \). Ponadto, aby uprościć zapis i wypowiedzi twierdzeń, przyjmijmy, że \( \displaystyle L^0 (X,Y):=Y \).
Załóżmy, że w każdym punkcie \( \displaystyle a\in U \) istnieje \( \displaystyle d^k _a f \) różniczka rzędu \( \displaystyle k \) funkcji \( \displaystyle f: U\mapsto Y \), \( \displaystyle k\geq 0 \), która jest elementem przestrzeni \( \displaystyle L^k (X, Y) \) odwzorowań \( \displaystyle k \) liniowych ciągłych na \( \displaystyle X \) o wartościach w przestrzeni \( \displaystyle Y \).

>Definicja 7.31.

Mówimy, że funkcja \( \displaystyle f \) jest \( \displaystyle k+1 \) krotnie różniczkowalna w punkcie \( \displaystyle a\in U \), jeśli w punkcie tym różniczkowalna jest funkcja \( \displaystyle d.^{k}f : U\ni x\mapsto d^{k}_x f\in L^k (X, Y) \). Różniczkę funkcji \( \displaystyle d.^k f \) w punkcie \( \displaystyle a \), która jest elementem przestrzeni (izomorficznej w przestrzenią) \( \displaystyle L(X, L^k (X, Y)) \), będziemy oznaczać symbolem \( \displaystyle d^{k+1} _a f \) i będziemy nazywać różniczką rzędu \( \displaystyle k+1 \) funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \) (lub krócej:

\( \displaystyle k+1 \) różniczką funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \)).

Uwaga 7.32.

Dowodzi się, że także przestrzenie \( \displaystyle L(X, L^k (X, Y)) \) oraz \( \displaystyle L^{k+1} (X, Y) \) (czyli przestrzeń odwzorowań \( \displaystyle k+1 \) liniowych i ciągłych na \( \displaystyle X \) o wartościach w przestrzeni \( \displaystyle Y \)) są izomorficzne, więc często różniczkę rzędu \( \displaystyle k+1 \) funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \) będziemy nazywać odwzorowaniem \( \displaystyle k+1 \) liniowym i ciągłym na \( \displaystyle X \) o wartościach w \( \displaystyle Y \).

Pamiętamy, że jeśli \( \displaystyle X=\mathbb{R}^n \) i \( \displaystyle Y=\mathbb{R} \), to wartość różniczki \( \displaystyle d_a f\in L(\mathbb{R}^n, \mathbb{R}) \) na wektorze \( \displaystyle h=(h_1, h_2, \dots, h_n)\in\mathbb{R}^n \) wyraża suma

\( \displaystyle d_a f(h)=\frac{\partial f(a)}{\partial x_1} h_1 + \frac{\partial f(a)}{\partial x_2} h_2+ \dots +\frac{\partial f(a)} {\partial x_n} h_n. \)

Sumę tę można także wyrazić bez argumentu \( \displaystyle h \)

\( \displaystyle d_a f=\frac{\partial f(a)}{\partial x_1} dx_1 + \frac{\partial f(a)}{\partial x_2} dx_2+ \dots +\frac{\partial f(a)} {\partial x_n} dx_n, \)

gdzie

\( \displaystyle dx_i :\mathbb{R}^n \ni h=(h_1, h_2, \dots, h_n)\mapsto dx_i (h)=h_i\in\mathbb{R} \)

jest rzutowaniem na \( \displaystyle i \)-tą współrzędną.

Podobnie jak w przypadku funkcji jednej zmiennej definiujemy funkcje klasy \( \displaystyle C^k \).

Definicja 7.33.

Mówimy, że \( \displaystyle f: X\supset U\mapsto Y \) jest klasy \( \displaystyle C^k \) w zbiorze \( \displaystyle U \) (\( \displaystyle k=0,1,2,\dots \)), jeśli w każdym punkcie \( \displaystyle a\in U \) istnieje różniczka rzędu \( \displaystyle k \) funkcji \( \displaystyle f \) i odwzorowanie \( \displaystyle U\ni a\mapsto d^k _a f\in L^k (X,Y) \) jest ciągłe.

Wniosek 7.34.

Jeśli \( \displaystyle f \) jest klasy \( \displaystyle C^2 (U) \), to w każdym punkcie tego zbioru pochodne cząstkowe mieszane są równe, tzn. zachodzi równość

\( \displaystyle \frac{\partial }{\partial x_j }\frac{\partial }{\partial x_i }f (a)= \frac{\partial }{\partial x_i }\frac{\partial }{\partial x_j }f(a) \)

dla dowolnych \( \displaystyle i, j\in\{1,2,\dots, n\} \) w dowolnym punkcie \( \displaystyle a\in U \).

Innymi słowy: druga różniczka \( \displaystyle d^2 _a f \) jest odwzorowaniem dwuliniowym symetrycznym.

Załóżmy, że \( \displaystyle f\in C^m (U) \), gdzie \( \displaystyle U\subset \mathbb{R}^n \) jest podzbiorem otwartym przestrzeni skończenie wymiarowej \( \displaystyle \mathbb{R}^n \). Wówczas różniczkę rzędu \( \displaystyle m \) można wyrazić efektywnie za pomocą pochodnych cząstkowych rzędu \( \displaystyle m \).

Twierdzenie 7.35.

Jeśli \( \displaystyle f\in C^m (U) \), to w dowolnym punkcie \( \displaystyle a\in U \) wartość różniczki rzędu \( \displaystyle m \) na \( \displaystyle m \)-ce jednakowych wektorów \( \displaystyle h=(h_1, h_2, \dots, h_n)\in \mathbb{R}^n \) wyraża suma

\( \displaystyle d^m _a f\underbrace{(h,h, \dots, h)}_{m \text{ wektorów }h} =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m}{\partial x^\alpha} f(a)h^\alpha, \)

gdzie sumowanie przebiega po wszystkich

możliwych wielowskaźnikach (\( \displaystyle n \)-wskaźnikach)

\( \displaystyle \alpha=(\alpha_1, \alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n \)

o długości

\( \displaystyle |\alpha|=\alpha_1+\alpha_2+\dots+\alpha_n= m, \)

natomiast

\( \displaystyle {m \choose \alpha}:=\frac{m!}{(m-|\alpha|)!\,\alpha!}, \)

jest uogólnieniem symbolu Newtona, w którym silnię wielowskaźnika \( \displaystyle \alpha=(\alpha_1, \alpha_2, \dots, \alpha_n) \) definiujemy za pomocą iloczynu silni jego współrzędnych, tj.

\( \displaystyle \alpha !=\alpha_1 !\, \alpha_2 ! \dots \alpha_n ! \)

oraz

\( \displaystyle h^\alpha =h_1 ^{\alpha_1} \, h_2 ^{\alpha_2} \dots h_n ^{\alpha_n}. \)

Uwaga 7.36.

Wzór \( \displaystyle d^m _a f(h, h, \dots, h) =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m}{\partial x^\alpha} f(a)h^\alpha, \)

który podaliśmy w tezie twierdzenia czasem zapisuje się bez wyszczególniania argumentów w następującej postaci

\( \displaystyle d^m _a f =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m f(a)}{\partial x^\alpha} dx^\alpha \)

lub

\( \displaystyle d^m_. f =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m f}{\partial x^\alpha} dx^\alpha, \)

gdzie \( \displaystyle dx^\alpha : \mathbb{R}^n\mapsto \mathbb{R} \)

definiujemy na wektorze \( \displaystyle h\in \mathbb{R}^n \) wzorem

\( \displaystyle dx^\alpha (h):=h^\alpha=h_1^{\alpha_1} h_2^{\alpha_2} \dots h_n^{\alpha_n} \in \mathbb{R}. \)

Dowód 7.36.

Wykażemy podany wzór w przypadku funkcji dwóch zmiennych, aby uprościć notację. W ogólnym przypadku uzasadnienie jest podobne. Jeśli \( \displaystyle f:\mathbb{R}^2 \supset U\ni (x_1, x_2)\mapsto f(x_1, x_2) \) jest różniczkowalna, to wartość jej różniczki w punkcie \( \displaystyle a\in U \) na wektorze \( \displaystyle h=(h_1, h_2) \) wyraża suma

\( \displaystyle d_a f (h)=\frac{\partial }{\partial x_1} f(a) h_1+\frac{\partial }{\partial x_2} f(a)h_2. \)

Jeśli \( \displaystyle f \) jest dwukrotnie różniczkowalna, to

\( \displaystyle \begin{align*} d^2 f & =d\bigg(\frac{\partial f}{\partial x_1}dx_1+ \frac{\partial f}{\partial x_2}dx_2\bigg) \\ & =\frac{\partial }{\partial x_1} \bigg(\frac{\partial f}{\partial x_1}dx_1 +\frac{\partial f}{\partial x_2}dx_2\bigg)dx_1 +\frac{\partial }{\partial x_2}\big(\frac{\partial f}{\partial x_1}dx_1 +\frac{\partial f}{\partial x_2}dx_2\big)dx_2 \\ & = \frac{\partial ^2 f}{\partial x_1\partial x_1}dx_1dx_1+\frac{\partial ^2 f}{\partial x_2\partial x_1}dx_2dx_1+\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\frac{\partial ^2 f}{\partial x_2\partial x_2}dx_2dx_2 \\ & = \frac{\partial ^2 f}{\partial x_1^2}dx_1^2+2\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\frac{\partial ^2 f}{\partial x_2^2}dx_2^2 \\ & = \binom{2}{0}\frac{\partial ^2 f}{\partial x_1^2}dx_1^2+\binom{2}{1}\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\binom{2}{2}\frac{\partial ^2 f}{\partial x_2^2}dx_2^2 \\ & =\sum_{|\alpha|=2}\binom{2}{\alpha}\frac{\partial^\alpha f}{\partial x^\alpha}dx^\alpha,\end{align*} \)

gdyż pochodne cząstkowe mieszane \( \displaystyle \frac{\partial ^2 f}{\partial x_1\partial x_2} \) oraz \( \displaystyle \frac{\partial ^2 f}{\partial x_2\partial x_1} \) są równe wobec założenia o klasie funkcji \( \displaystyle f \). Następnie zakładając,

że wzór zachodzi dla różniczki rzędu \( \displaystyle 2\leq k < m \), dowodzimy go dla różniczki rzędu \( \displaystyle k+1 \). Szczegółowe przekształcenia pomijamy.