Niech X, Y będą przestrzeniami Banacha i niech F:U↦Y będzie funkcją różniczkowalną w zbiorze otwartym U⊂X×Y. Niech (a,b)∈{F=0} będzie punktem poziomicy zerowej funkcji F, gdzie a∈X,b∈Y. Powstaje naturalne pytanie o warunki, przy których poziomicę {F=0} w otoczeniu punktu (a,b) można przedstawić jako wykres pewnej funkcji f:X↦Y takiej, że F(x,f(x))=0 w pewnym otoczeniu otwartym punktu a∈X.
Rozważmy dwa proste przykłady.
Przykład 9.9.
Niech (a,b) będzie punktem okręgu x2+y2=1, który stanowi poziomicę zerową funkcji
R×R∋(x,y)↦F(x,y)=x2+y2−1∈R.
Jeśli b>0, to w otoczeniu punktu a∈(−1,1) można określić funkcję
f1:x↦f1(x)=√1−x2
taką, że
F(x,f1(x))=x2+(√1−x2)2−1=0 oraz f1(a)=b.
Z kolei, jeśli b<0, to w otoczeniu punktu a∈(−1,1) znajdziemy funkcję
f2:x↦f2(x)=−√1−x2
taką, że
F(x,f2(x))=x2+(−√1−x2)2−1=0 oraz f2(a)=b.
Jedynymi punktami (a,b) okręgu x2+y2=1, w otoczeniu których nie znajdziemy funkcji f:x↦f(x) takiej, że f(a)=b i F(x,f(x))=0, są punkty (−1,0) oraz
(1,0). Zauważmy, że w punktach tych zeruje się pochodna cząstkowa ∂F∂y.
Przykład 9.10.
Niech a=(a1,a2)∈R2, b∈R. Niech (a,b)∈R3 będzie punktem sfery x21+x22+z2=1, która stanowi poziomicę zerową funkcji F(x1,x2,z)=x21+x22+z2−1. Jeśli b>0, to w otoczeniu punktu a=(a1,a2) wewnątrz okręgu x21+x22<1 można określić funkcję
f1:(x1,x2)↦f1(x1,x2)=√1−x21−x22
taką, że
F(x1,x2,f1(x1,x2))=x21+x22+(√1−x21−x22)2−1=0 oraz f1(a)=b.
Z kolei, jeśli b<0 znajdziemy funkcję
f2:(x1,x2)↦f1(x1,x2)=−√1−x21−x22
taką, że
F(x1,x2,f2(x1,x2))=x21+x22+(−√1−x21−x22)2−1=0 oraz f2(a)=b.
Jedynymi punktami (a,b) sfery x21+x22+z2=1, w otoczeniu których nie znajdziemy funkcji f:(x1,x2)↦f(x1,x2) takiej, że f(a)=b i F(x1,x2,f(x1,x2))=0, są punkty okręgu x21+x22=1 zawartego w płaszczyźnie z=0. Zauważmy, że w punktach tych zeruje się pochodna cząstkowa ∂F∂z=2z.
Uogólnijmy to spostrzeżenie, formułując
Twierdzenie 9.11.[twierdzenie o funkcji uwikłanej]
Niech F:U↦Y będzie funkcją różniczkowalną o ciągłej różniczce na zbiorze otwartym U⊂X×Y. Niech (a,b)∈{F=0} (gdzie a∈X,b∈Y) będzie punktem poziomicy zerowej funkcji F takim, że zacieśnienie różniczki d(a,b)F|Y do podprzestrzeni Y⊂X×Y jest izomorfizmem. Wówczas
1) istnieje pewne otoczenie otwarte V⊂X punktu a oraz istnieje dokładnie jedna funkcja określona w tym otoczeniu f:V↦Y taka, że f(a)=b oraz F(x,f(x))=0 dla dowolnego x∈V. Ponadto
2) funkcja f jest różniczkowalna i ma ciągłą różniczkę w zbiorze V daną wzorem
dxf=−(d(x,y)F|Y)−1∘(d(x,y)F|X),
gdzie y=f(x), natomiast
d(x,y)F|X oznacza zacieśnienie różniczki d(x,y)F do podprzestrzeni X⊂X×Y a (d(x,y)F|Y)−1 jest izomorfizmem odwrotnym do zacieśnienia różniczki d(x,y)F|Y.
Dowód 9.11.
[Szkic] Pominiemy dowód istnienia funkcji f. Wyprowadzimy jednak wzór, który określa jej różniczkę, w trzech przypadkach najczęściej spotykanych w konkretnych zastosowaniach. Przypomnijmy wpierw jednak, że
Uwaga 9.12.
Jeśli Y=Rn, to odwzorowanie liniowe L:Y↦Y jest izomorfizmem wtedy i tylko wtedy, gdy wyznacznik tego odwzorowania jest różny od zera, tj. det.
Przypadek I. Niech \displaystyle X=Y=\mathbb{R} i niech \displaystyle F: \mathbb{R}^2\ni(x,y)\mapsto F(x,y)\in \mathbb{R}. Jeśli funkcja \displaystyle f:\mathbb{R}\mapsto \mathbb{R} spełnia równanie \displaystyle F(x, f(x))=0 , to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość
\displaystyle 0=\frac{d}{dx}F(x, f(x))=\frac{\partial F}{\partial x}(x,y)+\frac{\partial F}{\partial y}(x,y)\frac{df}{dx}(x), \text{ gdzie } y=f(x).
Stąd
\displaystyle -\frac{\partial F}{\partial x}(x,y)=\frac{\partial,F}{\partial y}(x,y)\frac{df}{dx}(x).
Z założenia zacieśnienie różniczki \displaystyle d_{(x,y)}F_{|Y} jest izomorfizmem przestrzeni \displaystyle \mathbb{R} do \displaystyle \mathbb{R} , co oznacza w tym przypadku, że pochodna cząstkowa \displaystyle \frac{\partial F}{\partial y}\neq 0 . Stąd pochodna funkcji uwikłanej wyraża się wzorem
\displaystyle \frac{df}{dx}(x)=-\left(\frac{\partial F}{\partial y}(x,y)\right)^{-1}\frac{\partial F}{\partial x}(x,y), \text{ gdzie } y=f(x).
Przypadek II. Niech \displaystyle F: \mathbb{R}^3\ni(x_1, x_2, y)\mapsto F(x_1, x_2, y)\in \mathbb{R}. Jeśli funkcja \displaystyle f:\mathbb{R}^2 \mapsto \mathbb{R} spełnia równanie \displaystyle F(x_1, x_2, f(x_1,x_2))=0 , to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość prawdziwą w punktach \displaystyle (x_1, x_2, y) poziomicy \displaystyle \{F=0\}
\begin{array}{lll}\displaystyle 0=\frac{\partial }{\partial x_1}F\big(x_1, x_2, f(x_1, x_2)\big) & = & \displaystyle \frac{\partial F}{\partial x_1}\frac{\partial x_1}{\partial x_1}+\frac{\partial F}{\partial x_2}\frac{\partial x_2}{\partial x_1}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_1} \\ & = & \displaystyle \frac{\partial F}{\partial x_1}+0+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_1} \end{array}
oraz
\begin{array}{lll}\displaystyle 0=\frac{\partial }{\partial x_2}F\big(x_1, x_2, f(x_1, x_2)\big) & = & \displaystyle \frac{\partial F}{\partial x_1}\frac{\partial x_1}{\partial x_2}+\frac{\partial F}{\partial x_2}\frac{\partial x_2}{\partial x_2}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_2} \\ & = & \displaystyle 0+\frac{\partial F}{\partial x_2}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_2} \end{array}
Izomorficzność zawężenia różniczki \displaystyle d_{(x_1, x_2, y)}F_{|Y} również w tym przypadku oznacza po prostu, że pochodna cząstkowa \displaystyle \frac{\partial F}{\partial y}(x_1, x_2, y)\neq 0 . Wówczas z powyższych równości dostajemy
\displaystyle \frac{\partial f}{\partial x_1}(x_1, x_2)=-\left(\frac{\partial F}{\partial y}(x_1, x_2, y)\right)^{-1}\frac{\partial F}{\partial x_1}(x_1, x_2, y)
oraz
\displaystyle \frac{\partial f}{\partial x_2}(x_1, x_2)=-\left(\frac{\partial F}{\partial y}(x_1, x_2, y)\right)^{-1}\frac{\partial F}{\partial x_2}(x_1, x_2, y),
gdzie \displaystyle y=f(x_1, x_2) . Pomijając argument w zapisie pochodnych cząstkowych, można te wzory podać w skróconej formie (łatwiejszej do zapamiętania):
\displaystyle \frac{\partial f}{\partial x_1}=-\left(\frac{\partial F}{\partial y}\right)^{-1}\frac{\partial F}{\partial x_1}
oraz
\displaystyle \frac{\partial f}{\partial x_2}=-\left(\frac{\partial F}{\partial y}\right)^{-1}\frac{\partial F}{\partial x_2}.
Przypadek III. Niech \displaystyle X=\mathbb{R} , \displaystyle Y=\mathbb{R}^2 i niech
\displaystyle F: \mathbb{R}\times \mathbb{R}^2 \ni (x, y_1, y_2)\mapsto F(x, y_1, y_2)=(F_1(x, y_1, y_2), F_2(x, y_1, y_2))\in \mathbb{R}^2.
Załóżmy, że istnieje funkcja różniczkowalna
\displaystyle f: \mathbb{R}\ni x\mapsto (f_1(x), f_2(x))\in\mathbb{R}^2
taka, że
\displaystyle 0=F(x,f(x))=\left(F_1\big(x, f_1(x), f_2(x)\big), \ F_2\big(x, f_1(x), f_2(x)\big)\right),
to znaczy
\displaystyle \left\{\begin{align*} 0 & =F_1(x, f_1(x), f_2 (x)) \\ 0 & =F_1(x, f_1(x), f_2 (x)).\end{align*} \right.
Stąd - korzystając z twierdzenia o różniczkowaniu złożenia funkcji - dostajemy
\displaystyle \begin{align*} 0=\frac{d}{dx}F_1(x, f_1(x), f_2 (x)) & =\frac{\partial F_1}{\partial x}\frac{dx}{dx}+\frac{\partial F_1}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_1}{\partial y_2}\frac{df_2}{dx} \\ & = \frac{\partial F_1}{\partial x}+\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2'\end{align*}
oraz
\displaystyle \begin{align*} 0=\frac{d}{dx}F_2(x, f_1(x), f_2 (x)) & =\frac{\partial F_2}{\partial x}\frac{dx}{dx}+\frac{\partial F_2}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_2}{\partial y_2}\frac{df_2}{dx} \\ & = \frac{\partial F_2}{\partial x}+\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2'.\end{align*}
Otrzymujemy układ dwóch równań z niewiadomymi \displaystyle f_1' , \displaystyle f_2' , które są pochodnymi składowych funkcji uwikłanej \displaystyle f=(f_1, f_2) :
\displaystyle \left\{\begin{align*} -\frac{\partial F_1}{\partial x}=\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2' \\ -\frac{\partial F_2}{\partial x}=\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2' \end{align*}\right.
Zapiszmy ten układ w formie macierzowej
\displaystyle \displaystyle -\left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ] =\left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle\frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right] \left[\begin{array}{r} f_1' \\ f_2 '\end{array}\right ].
W rozważanym przypadku założenie o izomorficzności zacieśnienia różniczki \displaystyle d_{(x,y)}F do podprzestrzeni \displaystyle Y\subset X\times Y oznacza po prostu fakt, że macierz pochodnych cząstkowych, która reprezentuje \displaystyle d_{(x,y)F_{|Y}} :
\displaystyle \left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle\frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right]
jest nieosobliwa, tj. jej wyznacznik jest różny od zera. Z kolei macierz kolumnowa
\displaystyle \left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ]
reprezentuje zacieśnienie różniczki \displaystyle d_{(x,y)}F do podprzestrzeni \displaystyle X\subset X\times Y . Macierz niewiadomych \displaystyle f_1' , \displaystyle f_2' :
\displaystyle \left[\begin{array}{r} f_1' \\ f_2'\end{array} \right]
reprezentuje różniczkę \displaystyle d_x f funkcji uwikłanej \displaystyle f=(f_1, f_2) . Stąd układ równań z niewiadomymi \displaystyle f_1' , \displaystyle f_2' przedstawia równanie
\displaystyle -d_{(x,y)}F_{|X}=d_{(x,y)}F_{|Y}\circ d_x f, \ \ \ \ \ \text{ gdzie }y=f(x),
w którym niewiadomą jest różniczka \displaystyle d_x f . Izomorficzność zacieśnienia \displaystyle d_{(x,y)}F_{|Y} gwarantuje istnienie odwzorowania odwrotnego \displaystyle (d_{(x,y)}F_{|Y})^{-1} , dzięki czemu otrzymujemy
\displaystyle d_xf=-(d_{(x,y)}F_{|Y})^{-1}\circ d_{(x,y)}F_{|X}.
W języku algebry nieosobliwość macierzy
\displaystyle \left[\begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle\frac{\partial F_2}{\partial y_2}\end{array} \right]
gwarantuje istnienie macierzy do niej odwrotnej. Stąd rozwiązaniem równania
\displaystyle \displaystyle-\left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array} \right] =\left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array}\right ] \left [\begin{array}{r} f_1' \\ f_2 '\end{array} \right]
jest
\displaystyle \displaystyle\left[\begin{array}{r} f_1' \\ f_2 '\end{array} \right] =-\left(\left[ \begin{array} {rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right]\right)^{-1} \left[\begin{array}{r} \displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ]
lub równoważnie:
\displaystyle d_x f=-(d_{(x,y)}F_{|Y})^{-1}\circ d_{(x,y)}F_{|X}.