Twierdzenie o funkcji uwikłanej

Niech \( \displaystyle X \), \( \displaystyle Y \) będą przestrzeniami Banacha i niech \( \displaystyle F: U\mapsto Y \) będzie funkcją różniczkowalną w zbiorze otwartym \( \displaystyle U\subset X\times Y \). Niech \( \displaystyle (a,b)\in\{F=0\} \) będzie punktem poziomicy zerowej funkcji \( \displaystyle F \), gdzie \( \displaystyle a\in X, b\in Y \). Powstaje naturalne pytanie o warunki, przy których poziomicę \( \displaystyle \{F=0\} \) w otoczeniu punktu \( \displaystyle (a,b) \) można przedstawić jako wykres pewnej funkcji \( \displaystyle f: X\mapsto Y \) takiej, że \( \displaystyle F(x, f(x))=0 \) w pewnym otoczeniu otwartym punktu \( \displaystyle a\in X \).

Rozważmy dwa proste przykłady.

Przykład 9.9.

Niech \( \displaystyle (a,b) \) będzie punktem okręgu \( \displaystyle x^2+y^2=1 \), który stanowi poziomicę zerową funkcji

\( \displaystyle \mathbb{R}\times\mathbb{R} \ni (x,y)\mapsto F(x,y)=x^2+y^2-1\in\mathbb{R}. \)

Jeśli \( \displaystyle b>0 \), to w otoczeniu punktu \( \displaystyle a\in (-1,1) \) można określić funkcję

\( \displaystyle f_1: x\mapsto f_1(x)=\sqrt{1-x^2} \)

taką, że

\( \displaystyle F(x,f_1(x))=x^2+(\sqrt{1-x^2})^2-1=0 \ \text{ oraz } \ f_1(a)=b. \)

Z kolei, jeśli \( \displaystyle b < 0 \), to w otoczeniu punktu \( \displaystyle a\in (-1,1) \) znajdziemy funkcję

\( \displaystyle f_2: x\mapsto f_2(x)=-\sqrt{1-x^2} \)

taką, że

\( \displaystyle F(x, f_2(x))=x^2+(-\sqrt{1-x^2})^2-1=0 \ \text{ oraz } \ f_2(a)=b. \)

Jedynymi punktami \( \displaystyle (a,b) \) okręgu \( \displaystyle x^2+y^2=1 \), w otoczeniu których nie znajdziemy funkcji \( \displaystyle f: x\mapsto f(x) \) takiej, że \( \displaystyle f(a)=b \) i \( \displaystyle F(x, f(x))=0 \), są punkty \( \displaystyle (-1,0) \) oraz

\( \displaystyle (1,0) \). Zauważmy, że w punktach tych zeruje się pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial y} \).

Przykład 9.10.

Niech \( \displaystyle a=(a_1,a_2)\in \mathbb{R}^2 \), \( \displaystyle b\in \mathbb{R} \). Niech \( \displaystyle (a,b)\in \mathbb{R}^3 \) będzie punktem sfery \( \displaystyle x_1^2+x_2^2+z^2=1 \), która stanowi poziomicę zerową funkcji \( \displaystyle F(x_1, x_2 , z)=x_1^2+x_2^2+z^2-1 \). Jeśli \( \displaystyle b>0 \), to w otoczeniu punktu \( \displaystyle a=(a_1, a_2) \) wewnątrz okręgu \( \displaystyle x_1^2+x_2^2 < 1 \) można określić funkcję

\( \displaystyle f_1: (x_1, x_2)\mapsto f_1(x_1,x_2)=\sqrt{1-x_1^2-x_2^2} \)

taką, że

\( \displaystyle F(x_1, x_2, f_1(x_1,x_2))=x_1^2+x_2^2 +\big(\sqrt{1-x_1^2-x_2^2}\big)^2-1=0 \ \text{ oraz } \ f_1(a)=b. \)

Z kolei, jeśli \( \displaystyle b < 0 \) znajdziemy funkcję

\( \displaystyle f_2: (x_1, x_2)\mapsto f_1(x_1, x_2)=-\sqrt{1-x_1^2-x_2^2} \)

taką, że

\( \displaystyle F(x_1, x_2, f_2(x_1, x_2))=x_1^2+x_2^2+\big(-\sqrt{1-x_1^2-x_2^2}\big)^2-1=0\ \text{ oraz } \ f_2(a)=b. \)

Jedynymi punktami \( \displaystyle (a,b) \) sfery \( \displaystyle x_1^2+x_2^2+z^2=1 \), w otoczeniu których nie znajdziemy funkcji \( \displaystyle f: (x_1, x_2)\mapsto f(x_1, x_2) \) takiej, że \( \displaystyle f(a)=b \) i \( \displaystyle F(x_1, x_2, f(x_1,x_2))=0 \), są punkty okręgu \( \displaystyle x_1^2+x_2^2=1 \) zawartego w płaszczyźnie \( \displaystyle z=0 \). Zauważmy, że w punktach tych zeruje się pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial z}=2z \).

Uogólnijmy to spostrzeżenie, formułując

Twierdzenie 9.11.[twierdzenie o funkcji uwikłanej]

Niech \( \displaystyle F:U\mapsto Y \) będzie funkcją różniczkowalną o ciągłej różniczce na zbiorze otwartym \( \displaystyle U\subset X\times Y \). Niech \( \displaystyle (a,b)\in \{F=0\} \) (gdzie \( \displaystyle a\in X, b\in Y \)) będzie punktem poziomicy zerowej funkcji \( \displaystyle F \) takim, że zacieśnienie różniczki \( \displaystyle d_{(a,b)}F_{|Y} \) do podprzestrzeni \( \displaystyle Y\subset X\times Y \) jest izomorfizmem. Wówczas

1) istnieje pewne otoczenie otwarte \( \displaystyle V\subset X \) punktu \( \displaystyle a \) oraz istnieje dokładnie jedna funkcja określona w tym otoczeniu \( \displaystyle f:V\mapsto Y \) taka, że \( \displaystyle f(a)=b \) oraz \( \displaystyle F(x, f(x))=0 \) dla dowolnego \( \displaystyle x\in V \). Ponadto

2) funkcja \( \displaystyle f \) jest różniczkowalna i ma ciągłą różniczkę w zbiorze \( \displaystyle V \) daną wzorem

\( \displaystyle d_x f=-\big(d_{(x,y)}F_{|Y} \big)^{-1}\circ \big(d_{(x,y)}F_{|X}\big), \)

gdzie \( \displaystyle y=f(x) \), natomiast

\( \displaystyle d_{(x,y)}F_{|X} \) oznacza zacieśnienie różniczki \( \displaystyle d_{(x,y)}F \) do podprzestrzeni \( \displaystyle X\subset X\times Y \) a \( \displaystyle (d_{(x,y)}F_{|Y})^{-1} \) jest izomorfizmem odwrotnym do zacieśnienia różniczki \( \displaystyle d_{(x,y)}F_{|Y} \).
Dowód 9.11.

[Szkic] Pominiemy dowód istnienia funkcji \( \displaystyle f \). Wyprowadzimy jednak wzór, który określa jej różniczkę, w trzech przypadkach najczęściej spotykanych w konkretnych zastosowaniach. Przypomnijmy wpierw jednak, że

Uwaga 9.12.

Jeśli \( \displaystyle Y=\mathbb{R}^n \), to odwzorowanie liniowe \( \displaystyle L:Y\mapsto Y \) jest izomorfizmem wtedy i tylko wtedy, gdy wyznacznik tego odwzorowania jest różny od zera, tj. \( \displaystyle \det L\neq 0 \).

Przypadek I. Niech \( \displaystyle X=Y=\mathbb{R} \) i niech \( \displaystyle F: \mathbb{R}^2\ni(x,y)\mapsto F(x,y)\in \mathbb{R}. \) Jeśli funkcja \( \displaystyle f:\mathbb{R}\mapsto \mathbb{R} \) spełnia równanie \( \displaystyle F(x, f(x))=0 \), to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość

\( \displaystyle 0=\frac{d}{dx}F(x, f(x))=\frac{\partial F}{\partial x}(x,y)+\frac{\partial F}{\partial y}(x,y)\frac{df}{dx}(x), \text{ gdzie } y=f(x). \)

Stąd

\( \displaystyle -\frac{\partial F}{\partial x}(x,y)=\frac{\partial,F}{\partial y}(x,y)\frac{df}{dx}(x). \)

Z założenia zacieśnienie różniczki \( \displaystyle d_{(x,y)}F_{|Y} \) jest izomorfizmem przestrzeni \( \displaystyle \mathbb{R} \) do \( \displaystyle \mathbb{R} \), co oznacza w tym przypadku, że pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial y}\neq 0 \). Stąd pochodna funkcji uwikłanej wyraża się wzorem

\( \displaystyle \frac{df}{dx}(x)=-\left(\frac{\partial F}{\partial y}(x,y)\right)^{-1}\frac{\partial F}{\partial x}(x,y), \text{ gdzie } y=f(x). \)

Przypadek II. Niech \( \displaystyle F: \mathbb{R}^3\ni(x_1, x_2, y)\mapsto F(x_1, x_2, y)\in \mathbb{R}. \) Jeśli funkcja \( \displaystyle f:\mathbb{R}^2 \mapsto \mathbb{R} \) spełnia równanie \( \displaystyle F(x_1, x_2, f(x_1,x_2))=0 \), to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość prawdziwą w punktach \( \displaystyle (x_1, x_2, y) \) poziomicy \( \displaystyle \{F=0\} \)

\( \begin{array}{lll}\displaystyle 0=\frac{\partial }{\partial x_1}F\big(x_1, x_2, f(x_1, x_2)\big) & = & \displaystyle \frac{\partial F}{\partial x_1}\frac{\partial x_1}{\partial x_1}+\frac{\partial F}{\partial x_2}\frac{\partial x_2}{\partial x_1}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_1} \\ & = & \displaystyle \frac{\partial F}{\partial x_1}+0+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_1} \end{array} \)

oraz

\( \begin{array}{lll}\displaystyle 0=\frac{\partial }{\partial x_2}F\big(x_1, x_2, f(x_1, x_2)\big) & = & \displaystyle \frac{\partial F}{\partial x_1}\frac{\partial x_1}{\partial x_2}+\frac{\partial F}{\partial x_2}\frac{\partial x_2}{\partial x_2}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_2} \\ & = & \displaystyle 0+\frac{\partial F}{\partial x_2}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_2} \end{array} \)

Izomorficzność zawężenia różniczki \( \displaystyle d_{(x_1, x_2, y)}F_{|Y} \) również w tym przypadku oznacza po prostu, że pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial y}(x_1, x_2, y)\neq 0 \). Wówczas z powyższych równości dostajemy

\( \displaystyle \frac{\partial f}{\partial x_1}(x_1, x_2)=-\left(\frac{\partial F}{\partial y}(x_1, x_2, y)\right)^{-1}\frac{\partial F}{\partial x_1}(x_1, x_2, y) \)

oraz

\( \displaystyle \frac{\partial f}{\partial x_2}(x_1, x_2)=-\left(\frac{\partial F}{\partial y}(x_1, x_2, y)\right)^{-1}\frac{\partial F}{\partial x_2}(x_1, x_2, y), \)

gdzie \( \displaystyle y=f(x_1, x_2) \). Pomijając argument w zapisie pochodnych cząstkowych, można te wzory podać w skróconej formie (łatwiejszej do zapamiętania):

\( \displaystyle \frac{\partial f}{\partial x_1}=-\left(\frac{\partial F}{\partial y}\right)^{-1}\frac{\partial F}{\partial x_1} \)

oraz

\( \displaystyle \frac{\partial f}{\partial x_2}=-\left(\frac{\partial F}{\partial y}\right)^{-1}\frac{\partial F}{\partial x_2}. \)

Przypadek III. Niech \( \displaystyle X=\mathbb{R} \), \( \displaystyle Y=\mathbb{R}^2 \) i niech

\( \displaystyle F: \mathbb{R}\times \mathbb{R}^2 \ni (x, y_1, y_2)\mapsto F(x, y_1, y_2)=(F_1(x, y_1, y_2), F_2(x, y_1, y_2))\in \mathbb{R}^2. \)

Załóżmy, że istnieje funkcja różniczkowalna

\( \displaystyle f: \mathbb{R}\ni x\mapsto (f_1(x), f_2(x))\in\mathbb{R}^2 \)

taka, że

\( \displaystyle 0=F(x,f(x))=\left(F_1\big(x, f_1(x), f_2(x)\big), \ F_2\big(x, f_1(x), f_2(x)\big)\right), \)

to znaczy

\( \displaystyle \left\{\begin{align*} 0 & =F_1(x, f_1(x), f_2 (x)) \\ 0 & =F_1(x, f_1(x), f_2 (x)).\end{align*} \right. \)

Stąd - korzystając z twierdzenia o różniczkowaniu złożenia funkcji - dostajemy

\( \displaystyle \begin{align*} 0=\frac{d}{dx}F_1(x, f_1(x), f_2 (x)) & =\frac{\partial F_1}{\partial x}\frac{dx}{dx}+\frac{\partial F_1}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_1}{\partial y_2}\frac{df_2}{dx} \\ & = \frac{\partial F_1}{\partial x}+\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2'\end{align*} \)

oraz

\( \displaystyle \begin{align*} 0=\frac{d}{dx}F_2(x, f_1(x), f_2 (x)) & =\frac{\partial F_2}{\partial x}\frac{dx}{dx}+\frac{\partial F_2}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_2}{\partial y_2}\frac{df_2}{dx} \\ & = \frac{\partial F_2}{\partial x}+\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2'.\end{align*} \)

Otrzymujemy układ dwóch równań z niewiadomymi \( \displaystyle f_1' \), \( \displaystyle f_2' \), które są pochodnymi składowych funkcji uwikłanej \( \displaystyle f=(f_1, f_2) \):

\( \displaystyle \left\{\begin{align*} -\frac{\partial F_1}{\partial x}=\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2' \\ -\frac{\partial F_2}{\partial x}=\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2' \end{align*}\right. \)

Zapiszmy ten układ w formie macierzowej

\( \displaystyle \displaystyle -\left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ] =\left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle\frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right] \left[\begin{array}{r} f_1' \\ f_2 '\end{array}\right ]. \)

W rozważanym przypadku założenie o izomorficzności zacieśnienia różniczki \( \displaystyle d_{(x,y)}F \) do podprzestrzeni \( \displaystyle Y\subset X\times Y \) oznacza po prostu fakt, że macierz pochodnych cząstkowych, która reprezentuje \( \displaystyle d_{(x,y)F_{|Y}} \):

\( \displaystyle \left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle\frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right] \)

jest nieosobliwa, tj. jej wyznacznik jest różny od zera. Z kolei macierz kolumnowa

\( \displaystyle \left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ] \)

reprezentuje zacieśnienie różniczki \( \displaystyle d_{(x,y)}F \) do podprzestrzeni \( \displaystyle X\subset X\times Y \). Macierz niewiadomych \( \displaystyle f_1' \), \( \displaystyle f_2' \):

\( \displaystyle \left[\begin{array}{r} f_1' \\ f_2'\end{array} \right] \)

reprezentuje różniczkę \( \displaystyle d_x f \) funkcji uwikłanej \( \displaystyle f=(f_1, f_2) \). Stąd układ równań z niewiadomymi \( \displaystyle f_1' \), \( \displaystyle f_2' \) przedstawia równanie

\( \displaystyle -d_{(x,y)}F_{|X}=d_{(x,y)}F_{|Y}\circ d_x f, \ \ \ \ \ \text{ gdzie }y=f(x), \)

w którym niewiadomą jest różniczka \( \displaystyle d_x f \). Izomorficzność zacieśnienia \( \displaystyle d_{(x,y)}F_{|Y} \) gwarantuje istnienie odwzorowania odwrotnego \( \displaystyle (d_{(x,y)}F_{|Y})^{-1} \), dzięki czemu otrzymujemy

\( \displaystyle d_xf=-(d_{(x,y)}F_{|Y})^{-1}\circ d_{(x,y)}F_{|X}. \)

W języku algebry nieosobliwość macierzy

\( \displaystyle \left[\begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle\frac{\partial F_2}{\partial y_2}\end{array} \right] \)

gwarantuje istnienie macierzy do niej odwrotnej. Stąd rozwiązaniem równania

\( \displaystyle \displaystyle-\left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array} \right] =\left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array}\right ] \left [\begin{array}{r} f_1' \\ f_2 '\end{array} \right] \)

jest

\( \displaystyle \displaystyle\left[\begin{array}{r} f_1' \\ f_2 '\end{array} \right] =-\left(\left[ \begin{array} {rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right]\right)^{-1} \left[\begin{array}{r} \displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ] \)

lub równoważnie:

\( \displaystyle d_x f=-(d_{(x,y)}F_{|Y})^{-1}\circ d_{(x,y)}F_{|X}. \)