Niech X,Y będą przestrzeniami Banacha i niech f:U↦Y będzie funkcją określoną na zbiorze otwartym U⊂X. Załóżmy, że w każdym punkcie a∈U istnieje różniczka daf∈L(X,Y), która -- przypomnijmy -- jest odwzorowaniem liniowym i ciągłym z X do Y.
Definicja 7.29.
Mówimy, że funkcja f:U↦Y jest dwukrotnie różniczkowalna w punkcie a, jeśli różniczkowalna jest w punkcie a funkcja d.f:U∋x↦dxf∈L(X,Y). Różniczkę funkcji d.f w punkcie a, która jest elementem przestrzeni L(X,L(X,Y)), nazywamy drugą różniczką funkcji f (lub różniczką rzędu drugiego funkcji f) w punkcie a i oznaczamy symbolem d2af.
Uwaga 7.30.
W ramach algebry liniowej dowodzi się, że przestrzenie L(X,L(X,Y)) oraz L2(X,Y) (czyli przestrzeń odwzorowań dwuliniowych ciągłych na X o wartościach w Y) są izomorficzne. Stąd też często mówimy, że różniczka rzędu drugiego jest odwzorowaniem dwuliniowym ciągłym na X o wartościach w Y.
Podobnie jak w przypadku funkcji jednej zmiennej, nazwijmy różniczką rzędu zerowego funkcji f samą funkcję f, tzn. d0f=f. Ponadto, aby uprościć zapis i wypowiedzi twierdzeń, przyjmijmy, że L0(X,Y):=Y.
Załóżmy, że w każdym punkcie a∈U istnieje dkaf różniczka rzędu k funkcji f:U↦Y, k≥0, która jest elementem przestrzeni Lk(X,Y) odwzorowań k liniowych ciągłych na X o wartościach w przestrzeni Y.
>Definicja 7.31.
Mówimy, że funkcja f jest k+1 krotnie różniczkowalna w punkcie a∈U, jeśli w punkcie tym różniczkowalna jest funkcja d.kf:U∋x↦dkxf∈Lk(X,Y). Różniczkę funkcji d.kf w punkcie a, która jest elementem przestrzeni (izomorficznej w przestrzenią) L(X,Lk(X,Y)), będziemy oznaczać symbolem dk+1af i będziemy nazywać różniczką rzędu k+1 funkcji f w punkcie a (lub krócej:
k+1 różniczką funkcji f w punkcie a).
Uwaga 7.32.
Dowodzi się, że także przestrzenie L(X,Lk(X,Y)) oraz Lk+1(X,Y) (czyli przestrzeń odwzorowań k+1 liniowych i ciągłych na X o wartościach w przestrzeni Y) są izomorficzne, więc często różniczkę rzędu k+1 funkcji f w punkcie a będziemy nazywać odwzorowaniem k+1 liniowym i ciągłym na X o wartościach w Y.
Pamiętamy, że jeśli X=Rn i Y=R, to wartość różniczki daf∈L(Rn,R) na wektorze h=(h1,h2,…,hn)∈Rn wyraża suma
daf(h)=∂f(a)∂x1h1+∂f(a)∂x2h2+⋯+∂f(a)∂xnhn.
Sumę tę można także wyrazić bez argumentu h
daf=∂f(a)∂x1dx1+∂f(a)∂x2dx2+⋯+∂f(a)∂xndxn,
gdzie
dxi:Rn∋h=(h1,h2,…,hn)↦dxi(h)=hi∈R
jest rzutowaniem na i-tą współrzędną.
Podobnie jak w przypadku funkcji jednej zmiennej definiujemy funkcje klasy Ck.
Definicja 7.33.
Mówimy, że f:X⊃U↦Y jest klasy Ck w zbiorze U (k=0,1,2,…), jeśli w każdym punkcie a∈U istnieje różniczka rzędu k funkcji f i odwzorowanie U∋a↦dkaf∈Lk(X,Y) jest ciągłe.
Wniosek 7.34.
Jeśli f jest klasy C2(U), to w każdym punkcie tego zbioru pochodne cząstkowe mieszane są równe, tzn. zachodzi równość
∂∂xj∂∂xif(a)=∂∂xi∂∂xjf(a)
dla dowolnych i,j∈{1,2,…,n} w dowolnym punkcie a∈U.
Innymi słowy: druga różniczka d2af jest odwzorowaniem dwuliniowym symetrycznym.
Załóżmy, że f∈Cm(U), gdzie U⊂Rn jest podzbiorem otwartym przestrzeni skończenie wymiarowej Rn. Wówczas różniczkę rzędu m można wyrazić efektywnie za pomocą pochodnych cząstkowych rzędu m.
Twierdzenie 7.35.
Jeśli f∈Cm(U), to w dowolnym punkcie a∈U wartość różniczki rzędu m na m-ce jednakowych wektorów h=(h1,h2,…,hn)∈Rn wyraża suma
\displaystyle d^m _a f\underbrace{(h,h, \dots, h)}_{m \text{ wektorów }h} =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m}{\partial x^\alpha} f(a)h^\alpha,
gdzie sumowanie przebiega po wszystkich
możliwych wielowskaźnikach ( \displaystyle n -wskaźnikach)
\displaystyle \alpha=(\alpha_1, \alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n
o długości
\displaystyle |\alpha|=\alpha_1+\alpha_2+\dots+\alpha_n= m,
natomiast
\displaystyle {m \choose \alpha}:=\frac{m!}{(m-|\alpha|)!\,\alpha!},
jest uogólnieniem symbolu Newtona, w którym silnię wielowskaźnika \displaystyle \alpha=(\alpha_1, \alpha_2, \dots, \alpha_n) definiujemy za pomocą iloczynu silni jego współrzędnych, tj.
\displaystyle \alpha !=\alpha_1 !\, \alpha_2 ! \dots \alpha_n !
oraz
\displaystyle h^\alpha =h_1 ^{\alpha_1} \, h_2 ^{\alpha_2} \dots h_n ^{\alpha_n}.
Uwaga 7.36.
Wzór \displaystyle d^m _a f(h, h, \dots, h) =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m}{\partial x^\alpha} f(a)h^\alpha,
który podaliśmy w tezie twierdzenia czasem zapisuje się bez wyszczególniania argumentów w następującej postaci
\displaystyle d^m _a f =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m f(a)}{\partial x^\alpha} dx^\alpha
lub
\displaystyle d^m_. f =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m f}{\partial x^\alpha} dx^\alpha,
gdzie \displaystyle dx^\alpha : \mathbb{R}^n\mapsto \mathbb{R}
definiujemy na wektorze \displaystyle h\in \mathbb{R}^n wzorem
\displaystyle dx^\alpha (h):=h^\alpha=h_1^{\alpha_1} h_2^{\alpha_2} \dots h_n^{\alpha_n} \in \mathbb{R}.
Dowód 7.36.
Wykażemy podany wzór w przypadku funkcji dwóch zmiennych, aby uprościć notację. W ogólnym przypadku uzasadnienie jest podobne. Jeśli \displaystyle f:\mathbb{R}^2 \supset U\ni (x_1, x_2)\mapsto f(x_1, x_2) jest różniczkowalna, to wartość jej różniczki w punkcie \displaystyle a\in U na wektorze \displaystyle h=(h_1, h_2) wyraża suma
\displaystyle d_a f (h)=\frac{\partial }{\partial x_1} f(a) h_1+\frac{\partial }{\partial x_2} f(a)h_2.
Jeśli \displaystyle f jest dwukrotnie różniczkowalna, to
\displaystyle \begin{align*} d^2 f & =d\bigg(\frac{\partial f}{\partial x_1}dx_1+ \frac{\partial f}{\partial x_2}dx_2\bigg) \\ & =\frac{\partial }{\partial x_1} \bigg(\frac{\partial f}{\partial x_1}dx_1 +\frac{\partial f}{\partial x_2}dx_2\bigg)dx_1 +\frac{\partial }{\partial x_2}\big(\frac{\partial f}{\partial x_1}dx_1 +\frac{\partial f}{\partial x_2}dx_2\big)dx_2 \\ & = \frac{\partial ^2 f}{\partial x_1\partial x_1}dx_1dx_1+\frac{\partial ^2 f}{\partial x_2\partial x_1}dx_2dx_1+\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\frac{\partial ^2 f}{\partial x_2\partial x_2}dx_2dx_2 \\ & = \frac{\partial ^2 f}{\partial x_1^2}dx_1^2+2\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\frac{\partial ^2 f}{\partial x_2^2}dx_2^2 \\ & = \binom{2}{0}\frac{\partial ^2 f}{\partial x_1^2}dx_1^2+\binom{2}{1}\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\binom{2}{2}\frac{\partial ^2 f}{\partial x_2^2}dx_2^2 \\ & =\sum_{|\alpha|=2}\binom{2}{\alpha}\frac{\partial^\alpha f}{\partial x^\alpha}dx^\alpha,\end{align*}
gdyż pochodne cząstkowe mieszane \displaystyle \frac{\partial ^2 f}{\partial x_1\partial x_2} oraz \displaystyle \frac{\partial ^2 f}{\partial x_2\partial x_1} są równe wobec założenia o klasie funkcji \displaystyle f . Następnie zakładając,
że wzór zachodzi dla różniczki rzędu \displaystyle 2\leq k < m , dowodzimy go dla różniczki rzędu \displaystyle k+1 . Szczegółowe przekształcenia pomijamy.