Processing math: 79%

Różniczki wyższych rzędów

rycina

Niech X,Y będą przestrzeniami Banacha i niech f:UY będzie funkcją określoną na zbiorze otwartym UX. Załóżmy, że w każdym punkcie aU istnieje różniczka dafL(X,Y), która -- przypomnijmy -- jest odwzorowaniem liniowym i ciągłym z X do Y.

Definicja 7.29.

Mówimy, że funkcja f:UY jest dwukrotnie różniczkowalna w punkcie a, jeśli różniczkowalna jest w punkcie a funkcja d.f:UxdxfL(X,Y). Różniczkę funkcji d.f w punkcie a, która jest elementem przestrzeni L(X,L(X,Y)), nazywamy drugą różniczką funkcji f (lub różniczką rzędu drugiego funkcji f) w punkcie a i oznaczamy symbolem d2af.

Uwaga 7.30.

W ramach algebry liniowej dowodzi się, że przestrzenie L(X,L(X,Y)) oraz L2(X,Y) (czyli przestrzeń odwzorowań dwuliniowych ciągłych na X o wartościach w Y) są izomorficzne. Stąd też często mówimy, że różniczka rzędu drugiego jest odwzorowaniem dwuliniowym ciągłym na X o wartościach w Y.

Podobnie jak w przypadku funkcji jednej zmiennej, nazwijmy różniczką rzędu zerowego funkcji f samą funkcję f, tzn. d0f=f. Ponadto, aby uprościć zapis i wypowiedzi twierdzeń, przyjmijmy, że L0(X,Y):=Y.
Załóżmy, że w każdym punkcie aU istnieje dkaf różniczka rzędu k funkcji f:UY, k0, która jest elementem przestrzeni Lk(X,Y) odwzorowań k liniowych ciągłych na X o wartościach w przestrzeni Y.

>Definicja 7.31.

Mówimy, że funkcja f jest k+1 krotnie różniczkowalna w punkcie aU, jeśli w punkcie tym różniczkowalna jest funkcja d.kf:UxdkxfLk(X,Y). Różniczkę funkcji d.kf w punkcie a, która jest elementem przestrzeni (izomorficznej w przestrzenią) L(X,Lk(X,Y)), będziemy oznaczać symbolem dk+1af i będziemy nazywać różniczką rzędu k+1 funkcji f w punkcie a (lub krócej:

k+1 różniczką funkcji f w punkcie a).

Uwaga 7.32.

Dowodzi się, że także przestrzenie L(X,Lk(X,Y)) oraz Lk+1(X,Y) (czyli przestrzeń odwzorowań k+1 liniowych i ciągłych na X o wartościach w przestrzeni Y) są izomorficzne, więc często różniczkę rzędu k+1 funkcji f w punkcie a będziemy nazywać odwzorowaniem k+1 liniowym i ciągłym na X o wartościach w Y.

Pamiętamy, że jeśli X=Rn i Y=R, to wartość różniczki dafL(Rn,R) na wektorze h=(h1,h2,,hn)Rn wyraża suma

daf(h)=f(a)x1h1+f(a)x2h2++f(a)xnhn.

Sumę tę można także wyrazić bez argumentu h

daf=f(a)x1dx1+f(a)x2dx2++f(a)xndxn,

gdzie

dxi:Rnh=(h1,h2,,hn)dxi(h)=hiR

jest rzutowaniem na i-tą współrzędną.

Podobnie jak w przypadku funkcji jednej zmiennej definiujemy funkcje klasy Ck.

Definicja 7.33.

Mówimy, że f:XUY jest klasy Ck w zbiorze U (k=0,1,2,), jeśli w każdym punkcie aU istnieje różniczka rzędu k funkcji f i odwzorowanie UadkafLk(X,Y) jest ciągłe.

Wniosek 7.34.

Jeśli f jest klasy C2(U), to w każdym punkcie tego zbioru pochodne cząstkowe mieszane są równe, tzn. zachodzi równość

xjxif(a)=xixjf(a)

dla dowolnych i,j{1,2,,n} w dowolnym punkcie aU.

Innymi słowy: druga różniczka d2af jest odwzorowaniem dwuliniowym symetrycznym.

Załóżmy, że fCm(U), gdzie URn jest podzbiorem otwartym przestrzeni skończenie wymiarowej Rn. Wówczas różniczkę rzędu m można wyrazić efektywnie za pomocą pochodnych cząstkowych rzędu m.

Twierdzenie 7.35.

Jeśli fCm(U), to w dowolnym punkcie aU wartość różniczki rzędu m na m-ce jednakowych wektorów h=(h1,h2,,hn)Rn wyraża suma

\displaystyle d^m _a f\underbrace{(h,h, \dots, h)}_{m \text{ wektorów }h} =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m}{\partial x^\alpha} f(a)h^\alpha,

gdzie sumowanie przebiega po wszystkich

możliwych wielowskaźnikach ( \displaystyle n -wskaźnikach)

\displaystyle \alpha=(\alpha_1, \alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n

o długości

\displaystyle |\alpha|=\alpha_1+\alpha_2+\dots+\alpha_n= m,

natomiast

\displaystyle {m \choose \alpha}:=\frac{m!}{(m-|\alpha|)!\,\alpha!},

jest uogólnieniem symbolu Newtona, w którym silnię wielowskaźnika \displaystyle \alpha=(\alpha_1, \alpha_2, \dots, \alpha_n) definiujemy za pomocą iloczynu silni jego współrzędnych, tj.

\displaystyle \alpha !=\alpha_1 !\, \alpha_2 ! \dots \alpha_n !

oraz

\displaystyle h^\alpha =h_1 ^{\alpha_1} \, h_2 ^{\alpha_2} \dots h_n ^{\alpha_n}.

Uwaga 7.36.

Wzór \displaystyle d^m _a f(h, h, \dots, h) =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m}{\partial x^\alpha} f(a)h^\alpha,

który podaliśmy w tezie twierdzenia czasem zapisuje się bez wyszczególniania argumentów w następującej postaci

\displaystyle d^m _a f =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m f(a)}{\partial x^\alpha} dx^\alpha

lub

\displaystyle d^m_. f =\sum_{|\alpha|=m} {m \choose \alpha} \frac{\partial ^m f}{\partial x^\alpha} dx^\alpha,

gdzie \displaystyle dx^\alpha : \mathbb{R}^n\mapsto \mathbb{R}

definiujemy na wektorze \displaystyle h\in \mathbb{R}^n wzorem

\displaystyle dx^\alpha (h):=h^\alpha=h_1^{\alpha_1} h_2^{\alpha_2} \dots h_n^{\alpha_n} \in \mathbb{R}.

Dowód 7.36.

Wykażemy podany wzór w przypadku funkcji dwóch zmiennych, aby uprościć notację. W ogólnym przypadku uzasadnienie jest podobne. Jeśli \displaystyle f:\mathbb{R}^2 \supset U\ni (x_1, x_2)\mapsto f(x_1, x_2) jest różniczkowalna, to wartość jej różniczki w punkcie \displaystyle a\in U na wektorze \displaystyle h=(h_1, h_2) wyraża suma

\displaystyle d_a f (h)=\frac{\partial }{\partial x_1} f(a) h_1+\frac{\partial }{\partial x_2} f(a)h_2.

Jeśli \displaystyle f jest dwukrotnie różniczkowalna, to

\displaystyle \begin{align*} d^2 f & =d\bigg(\frac{\partial f}{\partial x_1}dx_1+ \frac{\partial f}{\partial x_2}dx_2\bigg) \\ & =\frac{\partial }{\partial x_1} \bigg(\frac{\partial f}{\partial x_1}dx_1 +\frac{\partial f}{\partial x_2}dx_2\bigg)dx_1 +\frac{\partial }{\partial x_2}\big(\frac{\partial f}{\partial x_1}dx_1 +\frac{\partial f}{\partial x_2}dx_2\big)dx_2 \\ & = \frac{\partial ^2 f}{\partial x_1\partial x_1}dx_1dx_1+\frac{\partial ^2 f}{\partial x_2\partial x_1}dx_2dx_1+\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\frac{\partial ^2 f}{\partial x_2\partial x_2}dx_2dx_2 \\ & = \frac{\partial ^2 f}{\partial x_1^2}dx_1^2+2\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\frac{\partial ^2 f}{\partial x_2^2}dx_2^2 \\ & = \binom{2}{0}\frac{\partial ^2 f}{\partial x_1^2}dx_1^2+\binom{2}{1}\frac{\partial ^2 f}{\partial x_1\partial x_2}dx_1dx_2+\binom{2}{2}\frac{\partial ^2 f}{\partial x_2^2}dx_2^2 \\ & =\sum_{|\alpha|=2}\binom{2}{\alpha}\frac{\partial^\alpha f}{\partial x^\alpha}dx^\alpha,\end{align*}

gdyż pochodne cząstkowe mieszane \displaystyle \frac{\partial ^2 f}{\partial x_1\partial x_2} oraz \displaystyle \frac{\partial ^2 f}{\partial x_2\partial x_1} są równe wobec założenia o klasie funkcji \displaystyle f . Następnie zakładając,

że wzór zachodzi dla różniczki rzędu \displaystyle 2\leq k < m , dowodzimy go dla różniczki rzędu \displaystyle k+1 . Szczegółowe przekształcenia pomijamy.