Niech \( \displaystyle X \), \( \displaystyle Y \) będą przestrzeniami Banacha i niech \( \displaystyle F: U\mapsto Y \) będzie funkcją różniczkowalną w zbiorze otwartym \( \displaystyle U\subset X\times Y \). Niech \( \displaystyle (a,b)\in\{F=0\} \) będzie punktem poziomicy zerowej funkcji \( \displaystyle F \), gdzie \( \displaystyle a\in X, b\in Y \). Powstaje naturalne pytanie o warunki, przy których poziomicę \( \displaystyle \{F=0\} \) w otoczeniu punktu \( \displaystyle (a,b) \) można przedstawić jako wykres pewnej funkcji \( \displaystyle f: X\mapsto Y \) takiej, że \( \displaystyle F(x, f(x))=0 \) w pewnym otoczeniu otwartym punktu \( \displaystyle a\in X \).
Rozważmy dwa proste przykłady.
Przykład 9.9.
Niech \( \displaystyle (a,b) \) będzie punktem okręgu \( \displaystyle x^2+y^2=1 \), który stanowi poziomicę zerową funkcji
\( \displaystyle \mathbb{R}\times\mathbb{R} \ni (x,y)\mapsto F(x,y)=x^2+y^2-1\in\mathbb{R}. \)
Jeśli \( \displaystyle b>0 \), to w otoczeniu punktu \( \displaystyle a\in (-1,1) \) można określić funkcję
\( \displaystyle f_1: x\mapsto f_1(x)=\sqrt{1-x^2} \)
taką, że
\( \displaystyle F(x,f_1(x))=x^2+(\sqrt{1-x^2})^2-1=0 \ \text{ oraz } \ f_1(a)=b. \)
Z kolei, jeśli \( \displaystyle b < 0 \), to w otoczeniu punktu \( \displaystyle a\in (-1,1) \) znajdziemy funkcję
\( \displaystyle f_2: x\mapsto f_2(x)=-\sqrt{1-x^2} \)
taką, że
\( \displaystyle F(x, f_2(x))=x^2+(-\sqrt{1-x^2})^2-1=0 \ \text{ oraz } \ f_2(a)=b. \)
Jedynymi punktami \( \displaystyle (a,b) \) okręgu \( \displaystyle x^2+y^2=1 \), w otoczeniu których nie znajdziemy funkcji \( \displaystyle f: x\mapsto f(x) \) takiej, że \( \displaystyle f(a)=b \) i \( \displaystyle F(x, f(x))=0 \), są punkty \( \displaystyle (-1,0) \) oraz
\( \displaystyle (1,0) \). Zauważmy, że w punktach tych zeruje się pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial y} \).
Przykład 9.10.
Niech \( \displaystyle a=(a_1,a_2)\in \mathbb{R}^2 \), \( \displaystyle b\in \mathbb{R} \). Niech \( \displaystyle (a,b)\in \mathbb{R}^3 \) będzie punktem sfery \( \displaystyle x_1^2+x_2^2+z^2=1 \), która stanowi poziomicę zerową funkcji \( \displaystyle F(x_1, x_2 , z)=x_1^2+x_2^2+z^2-1 \). Jeśli \( \displaystyle b>0 \), to w otoczeniu punktu \( \displaystyle a=(a_1, a_2) \) wewnątrz okręgu \( \displaystyle x_1^2+x_2^2 < 1 \) można określić funkcję
\( \displaystyle f_1: (x_1, x_2)\mapsto f_1(x_1,x_2)=\sqrt{1-x_1^2-x_2^2} \)
taką, że
\( \displaystyle F(x_1, x_2, f_1(x_1,x_2))=x_1^2+x_2^2 +\big(\sqrt{1-x_1^2-x_2^2}\big)^2-1=0 \ \text{ oraz } \ f_1(a)=b. \)
Z kolei, jeśli \( \displaystyle b < 0 \) znajdziemy funkcję
\( \displaystyle f_2: (x_1, x_2)\mapsto f_1(x_1, x_2)=-\sqrt{1-x_1^2-x_2^2} \)
taką, że
\( \displaystyle F(x_1, x_2, f_2(x_1, x_2))=x_1^2+x_2^2+\big(-\sqrt{1-x_1^2-x_2^2}\big)^2-1=0\ \text{ oraz } \ f_2(a)=b. \)
Jedynymi punktami \( \displaystyle (a,b) \) sfery \( \displaystyle x_1^2+x_2^2+z^2=1 \), w otoczeniu których nie znajdziemy funkcji \( \displaystyle f: (x_1, x_2)\mapsto f(x_1, x_2) \) takiej, że \( \displaystyle f(a)=b \) i \( \displaystyle F(x_1, x_2, f(x_1,x_2))=0 \), są punkty okręgu \( \displaystyle x_1^2+x_2^2=1 \) zawartego w płaszczyźnie \( \displaystyle z=0 \). Zauważmy, że w punktach tych zeruje się pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial z}=2z \).
Uogólnijmy to spostrzeżenie, formułując
Twierdzenie 9.11.[twierdzenie o funkcji uwikłanej]
Niech \( \displaystyle F:U\mapsto Y \) będzie funkcją różniczkowalną o ciągłej różniczce na zbiorze otwartym \( \displaystyle U\subset X\times Y \). Niech \( \displaystyle (a,b)\in \{F=0\} \) (gdzie \( \displaystyle a\in X, b\in Y \)) będzie punktem poziomicy zerowej funkcji \( \displaystyle F \) takim, że zacieśnienie różniczki \( \displaystyle d_{(a,b)}F_{|Y} \) do podprzestrzeni \( \displaystyle Y\subset X\times Y \) jest izomorfizmem. Wówczas
1) istnieje pewne otoczenie otwarte \( \displaystyle V\subset X \) punktu \( \displaystyle a \) oraz istnieje dokładnie jedna funkcja określona w tym otoczeniu \( \displaystyle f:V\mapsto Y \) taka, że \( \displaystyle f(a)=b \) oraz \( \displaystyle F(x, f(x))=0 \) dla dowolnego \( \displaystyle x\in V \). Ponadto
2) funkcja \( \displaystyle f \) jest różniczkowalna i ma ciągłą różniczkę w zbiorze \( \displaystyle V \) daną wzorem
\( \displaystyle d_x f=-\big(d_{(x,y)}F_{|Y} \big)^{-1}\circ \big(d_{(x,y)}F_{|X}\big), \)
gdzie \( \displaystyle y=f(x) \), natomiast
\( \displaystyle d_{(x,y)}F_{|X} \) oznacza zacieśnienie różniczki \( \displaystyle d_{(x,y)}F \) do podprzestrzeni \( \displaystyle X\subset X\times Y \) a \( \displaystyle (d_{(x,y)}F_{|Y})^{-1} \) jest izomorfizmem odwrotnym do zacieśnienia różniczki \( \displaystyle d_{(x,y)}F_{|Y} \).
Dowód 9.11.
[Szkic] Pominiemy dowód istnienia funkcji \( \displaystyle f \). Wyprowadzimy jednak wzór, który określa jej różniczkę, w trzech przypadkach najczęściej spotykanych w konkretnych zastosowaniach. Przypomnijmy wpierw jednak, że
Uwaga 9.12.
Jeśli \( \displaystyle Y=\mathbb{R}^n \), to odwzorowanie liniowe \( \displaystyle L:Y\mapsto Y \) jest izomorfizmem wtedy i tylko wtedy, gdy wyznacznik tego odwzorowania jest różny od zera, tj. \( \displaystyle \det L\neq 0 \).
Przypadek I. Niech \( \displaystyle X=Y=\mathbb{R} \) i niech \( \displaystyle F: \mathbb{R}^2\ni(x,y)\mapsto F(x,y)\in \mathbb{R}. \) Jeśli funkcja \( \displaystyle f:\mathbb{R}\mapsto \mathbb{R} \) spełnia równanie \( \displaystyle F(x, f(x))=0 \), to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość
\( \displaystyle 0=\frac{d}{dx}F(x, f(x))=\frac{\partial F}{\partial x}(x,y)+\frac{\partial F}{\partial y}(x,y)\frac{df}{dx}(x), \text{ gdzie } y=f(x). \)
Stąd
\( \displaystyle -\frac{\partial F}{\partial x}(x,y)=\frac{\partial,F}{\partial y}(x,y)\frac{df}{dx}(x). \)
Z założenia zacieśnienie różniczki \( \displaystyle d_{(x,y)}F_{|Y} \) jest izomorfizmem przestrzeni \( \displaystyle \mathbb{R} \) do \( \displaystyle \mathbb{R} \), co oznacza w tym przypadku, że pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial y}\neq 0 \). Stąd pochodna funkcji uwikłanej wyraża się wzorem
\( \displaystyle \frac{df}{dx}(x)=-\left(\frac{\partial F}{\partial y}(x,y)\right)^{-1}\frac{\partial F}{\partial x}(x,y), \text{ gdzie } y=f(x). \)
Przypadek II. Niech \( \displaystyle F: \mathbb{R}^3\ni(x_1, x_2, y)\mapsto F(x_1, x_2, y)\in \mathbb{R}. \) Jeśli funkcja \( \displaystyle f:\mathbb{R}^2 \mapsto \mathbb{R} \) spełnia równanie \( \displaystyle F(x_1, x_2, f(x_1,x_2))=0 \), to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość prawdziwą w punktach \( \displaystyle (x_1, x_2, y) \) poziomicy \( \displaystyle \{F=0\} \)
\( \begin{array}{lll}\displaystyle 0=\frac{\partial }{\partial x_1}F\big(x_1, x_2, f(x_1, x_2)\big) & = & \displaystyle \frac{\partial F}{\partial x_1}\frac{\partial x_1}{\partial x_1}+\frac{\partial F}{\partial x_2}\frac{\partial x_2}{\partial x_1}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_1} \\ & = & \displaystyle \frac{\partial F}{\partial x_1}+0+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_1} \end{array} \)
oraz
\( \begin{array}{lll}\displaystyle 0=\frac{\partial }{\partial x_2}F\big(x_1, x_2, f(x_1, x_2)\big) & = & \displaystyle \frac{\partial F}{\partial x_1}\frac{\partial x_1}{\partial x_2}+\frac{\partial F}{\partial x_2}\frac{\partial x_2}{\partial x_2}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_2} \\ & = & \displaystyle 0+\frac{\partial F}{\partial x_2}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_2} \end{array} \)
Izomorficzność zawężenia różniczki \( \displaystyle d_{(x_1, x_2, y)}F_{|Y} \) również w tym przypadku oznacza po prostu, że pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial y}(x_1, x_2, y)\neq 0 \). Wówczas z powyższych równości dostajemy
\( \displaystyle \frac{\partial f}{\partial x_1}(x_1, x_2)=-\left(\frac{\partial F}{\partial y}(x_1, x_2, y)\right)^{-1}\frac{\partial F}{\partial x_1}(x_1, x_2, y) \)
oraz
\( \displaystyle \frac{\partial f}{\partial x_2}(x_1, x_2)=-\left(\frac{\partial F}{\partial y}(x_1, x_2, y)\right)^{-1}\frac{\partial F}{\partial x_2}(x_1, x_2, y), \)
gdzie \( \displaystyle y=f(x_1, x_2) \). Pomijając argument w zapisie pochodnych cząstkowych, można te wzory podać w skróconej formie (łatwiejszej do zapamiętania):
\( \displaystyle \frac{\partial f}{\partial x_1}=-\left(\frac{\partial F}{\partial y}\right)^{-1}\frac{\partial F}{\partial x_1} \)
oraz
\( \displaystyle \frac{\partial f}{\partial x_2}=-\left(\frac{\partial F}{\partial y}\right)^{-1}\frac{\partial F}{\partial x_2}. \)
Przypadek III. Niech \( \displaystyle X=\mathbb{R} \), \( \displaystyle Y=\mathbb{R}^2 \) i niech
\( \displaystyle F: \mathbb{R}\times \mathbb{R}^2 \ni (x, y_1, y_2)\mapsto F(x, y_1, y_2)=(F_1(x, y_1, y_2), F_2(x, y_1, y_2))\in \mathbb{R}^2. \)
Załóżmy, że istnieje funkcja różniczkowalna
\( \displaystyle f: \mathbb{R}\ni x\mapsto (f_1(x), f_2(x))\in\mathbb{R}^2 \)
taka, że
\( \displaystyle 0=F(x,f(x))=\left(F_1\big(x, f_1(x), f_2(x)\big), \ F_2\big(x, f_1(x), f_2(x)\big)\right), \)
to znaczy
\( \displaystyle \left\{\begin{align*} 0 & =F_1(x, f_1(x), f_2 (x)) \\ 0 & =F_1(x, f_1(x), f_2 (x)).\end{align*} \right. \)
Stąd - korzystając z twierdzenia o różniczkowaniu złożenia funkcji - dostajemy
\( \displaystyle \begin{align*} 0=\frac{d}{dx}F_1(x, f_1(x), f_2 (x)) & =\frac{\partial F_1}{\partial x}\frac{dx}{dx}+\frac{\partial F_1}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_1}{\partial y_2}\frac{df_2}{dx} \\ & = \frac{\partial F_1}{\partial x}+\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2'\end{align*} \)
oraz
\( \displaystyle \begin{align*} 0=\frac{d}{dx}F_2(x, f_1(x), f_2 (x)) & =\frac{\partial F_2}{\partial x}\frac{dx}{dx}+\frac{\partial F_2}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_2}{\partial y_2}\frac{df_2}{dx} \\ & = \frac{\partial F_2}{\partial x}+\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2'.\end{align*} \)
Otrzymujemy układ dwóch równań z niewiadomymi \( \displaystyle f_1' \), \( \displaystyle f_2' \), które są pochodnymi składowych funkcji uwikłanej \( \displaystyle f=(f_1, f_2) \):
\( \displaystyle \left\{\begin{align*} -\frac{\partial F_1}{\partial x}=\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2' \\ -\frac{\partial F_2}{\partial x}=\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2' \end{align*}\right. \)
Zapiszmy ten układ w formie macierzowej
\( \displaystyle \displaystyle -\left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ] =\left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle\frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right] \left[\begin{array}{r} f_1' \\ f_2 '\end{array}\right ]. \)
W rozważanym przypadku założenie o izomorficzności zacieśnienia różniczki \( \displaystyle d_{(x,y)}F \) do podprzestrzeni \( \displaystyle Y\subset X\times Y \) oznacza po prostu fakt, że macierz pochodnych cząstkowych, która reprezentuje \( \displaystyle d_{(x,y)F_{|Y}} \):
\( \displaystyle \left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle\frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right] \)
jest nieosobliwa, tj. jej wyznacznik jest różny od zera. Z kolei macierz kolumnowa
\( \displaystyle \left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ] \)
reprezentuje zacieśnienie różniczki \( \displaystyle d_{(x,y)}F \) do podprzestrzeni \( \displaystyle X\subset X\times Y \). Macierz niewiadomych \( \displaystyle f_1' \), \( \displaystyle f_2' \):
\( \displaystyle \left[\begin{array}{r} f_1' \\ f_2'\end{array} \right] \)
reprezentuje różniczkę \( \displaystyle d_x f \) funkcji uwikłanej \( \displaystyle f=(f_1, f_2) \). Stąd układ równań z niewiadomymi \( \displaystyle f_1' \), \( \displaystyle f_2' \) przedstawia równanie
\( \displaystyle -d_{(x,y)}F_{|X}=d_{(x,y)}F_{|Y}\circ d_x f, \ \ \ \ \ \text{ gdzie }y=f(x), \)
w którym niewiadomą jest różniczka \( \displaystyle d_x f \). Izomorficzność zacieśnienia \( \displaystyle d_{(x,y)}F_{|Y} \) gwarantuje istnienie odwzorowania odwrotnego \( \displaystyle (d_{(x,y)}F_{|Y})^{-1} \), dzięki czemu otrzymujemy
\( \displaystyle d_xf=-(d_{(x,y)}F_{|Y})^{-1}\circ d_{(x,y)}F_{|X}. \)
W języku algebry nieosobliwość macierzy
\( \displaystyle \left[\begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle\frac{\partial F_2}{\partial y_2}\end{array} \right] \)
gwarantuje istnienie macierzy do niej odwrotnej. Stąd rozwiązaniem równania
\( \displaystyle \displaystyle-\left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array} \right] =\left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array}\right ] \left [\begin{array}{r} f_1' \\ f_2 '\end{array} \right] \)
jest
\( \displaystyle \displaystyle\left[\begin{array}{r} f_1' \\ f_2 '\end{array} \right] =-\left(\left[ \begin{array} {rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right]\right)^{-1} \left[\begin{array}{r} \displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ] \)
lub równoważnie:
\( \displaystyle d_x f=-(d_{(x,y)}F_{|Y})^{-1}\circ d_{(x,y)}F_{|X}. \)