Processing math: 55%

Twierdzenie o funkcji uwikłanej

Niech X, Y będą przestrzeniami Banacha i niech F:UY będzie funkcją różniczkowalną w zbiorze otwartym UX×Y. Niech (a,b){F=0} będzie punktem poziomicy zerowej funkcji F, gdzie aX,bY. Powstaje naturalne pytanie o warunki, przy których poziomicę {F=0} w otoczeniu punktu (a,b) można przedstawić jako wykres pewnej funkcji f:XY takiej, że F(x,f(x))=0 w pewnym otoczeniu otwartym punktu aX.

Rozważmy dwa proste przykłady.

Przykład 9.9.

Niech (a,b) będzie punktem okręgu x2+y2=1, który stanowi poziomicę zerową funkcji

R×R(x,y)F(x,y)=x2+y21R.

Jeśli b>0, to w otoczeniu punktu a(1,1) można określić funkcję

f1:xf1(x)=1x2

taką, że

F(x,f1(x))=x2+(1x2)21=0  oraz  f1(a)=b.

Z kolei, jeśli b<0, to w otoczeniu punktu a(1,1) znajdziemy funkcję

f2:xf2(x)=1x2

taką, że

F(x,f2(x))=x2+(1x2)21=0  oraz  f2(a)=b.

Jedynymi punktami (a,b) okręgu x2+y2=1, w otoczeniu których nie znajdziemy funkcji f:xf(x) takiej, że f(a)=b i F(x,f(x))=0, są punkty (1,0) oraz

(1,0). Zauważmy, że w punktach tych zeruje się pochodna cząstkowa Fy.

Przykład 9.10.

Niech a=(a1,a2)R2, bR. Niech (a,b)R3 będzie punktem sfery x21+x22+z2=1, która stanowi poziomicę zerową funkcji F(x1,x2,z)=x21+x22+z21. Jeśli b>0, to w otoczeniu punktu a=(a1,a2) wewnątrz okręgu x21+x22<1 można określić funkcję

f1:(x1,x2)f1(x1,x2)=1x21x22

taką, że

F(x1,x2,f1(x1,x2))=x21+x22+(1x21x22)21=0  oraz  f1(a)=b.

Z kolei, jeśli b<0 znajdziemy funkcję

f2:(x1,x2)f1(x1,x2)=1x21x22

taką, że

F(x1,x2,f2(x1,x2))=x21+x22+(1x21x22)21=0  oraz  f2(a)=b.

Jedynymi punktami (a,b) sfery x21+x22+z2=1, w otoczeniu których nie znajdziemy funkcji f:(x1,x2)f(x1,x2) takiej, że f(a)=b i F(x1,x2,f(x1,x2))=0, są punkty okręgu x21+x22=1 zawartego w płaszczyźnie z=0. Zauważmy, że w punktach tych zeruje się pochodna cząstkowa Fz=2z.

Uogólnijmy to spostrzeżenie, formułując

Twierdzenie 9.11.[twierdzenie o funkcji uwikłanej]

Niech F:UY będzie funkcją różniczkowalną o ciągłej różniczce na zbiorze otwartym UX×Y. Niech (a,b){F=0} (gdzie aX,bY) będzie punktem poziomicy zerowej funkcji F takim, że zacieśnienie różniczki d(a,b)F|Y do podprzestrzeni YX×Y jest izomorfizmem. Wówczas

1) istnieje pewne otoczenie otwarte VX punktu a oraz istnieje dokładnie jedna funkcja określona w tym otoczeniu f:VY taka, że f(a)=b oraz F(x,f(x))=0 dla dowolnego xV. Ponadto

2) funkcja f jest różniczkowalna i ma ciągłą różniczkę w zbiorze V daną wzorem

dxf=(d(x,y)F|Y)1(d(x,y)F|X),

gdzie y=f(x), natomiast

d(x,y)F|X oznacza zacieśnienie różniczki d(x,y)F do podprzestrzeni XX×Y a (d(x,y)F|Y)1 jest izomorfizmem odwrotnym do zacieśnienia różniczki d(x,y)F|Y.
Dowód 9.11.

[Szkic] Pominiemy dowód istnienia funkcji f. Wyprowadzimy jednak wzór, który określa jej różniczkę, w trzech przypadkach najczęściej spotykanych w konkretnych zastosowaniach. Przypomnijmy wpierw jednak, że

Uwaga 9.12.

Jeśli Y=Rn, to odwzorowanie liniowe L:YY jest izomorfizmem wtedy i tylko wtedy, gdy wyznacznik tego odwzorowania jest różny od zera, tj. det.

Przypadek I. Niech \displaystyle X=Y=\mathbb{R} i niech \displaystyle F: \mathbb{R}^2\ni(x,y)\mapsto F(x,y)\in \mathbb{R}. Jeśli funkcja \displaystyle f:\mathbb{R}\mapsto \mathbb{R} spełnia równanie \displaystyle F(x, f(x))=0 , to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość

\displaystyle 0=\frac{d}{dx}F(x, f(x))=\frac{\partial F}{\partial x}(x,y)+\frac{\partial F}{\partial y}(x,y)\frac{df}{dx}(x), \text{ gdzie } y=f(x).

Stąd

\displaystyle -\frac{\partial F}{\partial x}(x,y)=\frac{\partial,F}{\partial y}(x,y)\frac{df}{dx}(x).

Z założenia zacieśnienie różniczki \displaystyle d_{(x,y)}F_{|Y} jest izomorfizmem przestrzeni \displaystyle \mathbb{R} do \displaystyle \mathbb{R} , co oznacza w tym przypadku, że pochodna cząstkowa \displaystyle \frac{\partial F}{\partial y}\neq 0 . Stąd pochodna funkcji uwikłanej wyraża się wzorem

\displaystyle \frac{df}{dx}(x)=-\left(\frac{\partial F}{\partial y}(x,y)\right)^{-1}\frac{\partial F}{\partial x}(x,y), \text{ gdzie } y=f(x).

Przypadek II. Niech \displaystyle F: \mathbb{R}^3\ni(x_1, x_2, y)\mapsto F(x_1, x_2, y)\in \mathbb{R}. Jeśli funkcja \displaystyle f:\mathbb{R}^2 \mapsto \mathbb{R} spełnia równanie \displaystyle F(x_1, x_2, f(x_1,x_2))=0 , to przy założeniu, że jest różniczkowalna, na mocy twierdzenia o różniczce złożenia funkcji otrzymamy równość prawdziwą w punktach \displaystyle (x_1, x_2, y) poziomicy \displaystyle \{F=0\}

\begin{array}{lll}\displaystyle 0=\frac{\partial }{\partial x_1}F\big(x_1, x_2, f(x_1, x_2)\big) & = & \displaystyle \frac{\partial F}{\partial x_1}\frac{\partial x_1}{\partial x_1}+\frac{\partial F}{\partial x_2}\frac{\partial x_2}{\partial x_1}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_1} \\ & = & \displaystyle \frac{\partial F}{\partial x_1}+0+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_1} \end{array}

oraz

\begin{array}{lll}\displaystyle 0=\frac{\partial }{\partial x_2}F\big(x_1, x_2, f(x_1, x_2)\big) & = & \displaystyle \frac{\partial F}{\partial x_1}\frac{\partial x_1}{\partial x_2}+\frac{\partial F}{\partial x_2}\frac{\partial x_2}{\partial x_2}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_2} \\ & = & \displaystyle 0+\frac{\partial F}{\partial x_2}+\frac{\partial F}{\partial y}\frac{\partial f}{\partial x_2} \end{array}

Izomorficzność zawężenia różniczki \displaystyle d_{(x_1, x_2, y)}F_{|Y} również w tym przypadku oznacza po prostu, że pochodna cząstkowa \displaystyle \frac{\partial F}{\partial y}(x_1, x_2, y)\neq 0 . Wówczas z powyższych równości dostajemy

\displaystyle \frac{\partial f}{\partial x_1}(x_1, x_2)=-\left(\frac{\partial F}{\partial y}(x_1, x_2, y)\right)^{-1}\frac{\partial F}{\partial x_1}(x_1, x_2, y)

oraz

\displaystyle \frac{\partial f}{\partial x_2}(x_1, x_2)=-\left(\frac{\partial F}{\partial y}(x_1, x_2, y)\right)^{-1}\frac{\partial F}{\partial x_2}(x_1, x_2, y),

gdzie \displaystyle y=f(x_1, x_2) . Pomijając argument w zapisie pochodnych cząstkowych, można te wzory podać w skróconej formie (łatwiejszej do zapamiętania):

\displaystyle \frac{\partial f}{\partial x_1}=-\left(\frac{\partial F}{\partial y}\right)^{-1}\frac{\partial F}{\partial x_1}

oraz

\displaystyle \frac{\partial f}{\partial x_2}=-\left(\frac{\partial F}{\partial y}\right)^{-1}\frac{\partial F}{\partial x_2}.

Przypadek III. Niech \displaystyle X=\mathbb{R} , \displaystyle Y=\mathbb{R}^2 i niech

\displaystyle F: \mathbb{R}\times \mathbb{R}^2 \ni (x, y_1, y_2)\mapsto F(x, y_1, y_2)=(F_1(x, y_1, y_2), F_2(x, y_1, y_2))\in \mathbb{R}^2.

Załóżmy, że istnieje funkcja różniczkowalna

\displaystyle f: \mathbb{R}\ni x\mapsto (f_1(x), f_2(x))\in\mathbb{R}^2

taka, że

\displaystyle 0=F(x,f(x))=\left(F_1\big(x, f_1(x), f_2(x)\big), \ F_2\big(x, f_1(x), f_2(x)\big)\right),

to znaczy

\displaystyle \left\{\begin{align*} 0 & =F_1(x, f_1(x), f_2 (x)) \\ 0 & =F_1(x, f_1(x), f_2 (x)).\end{align*} \right.

Stąd - korzystając z twierdzenia o różniczkowaniu złożenia funkcji - dostajemy

\displaystyle \begin{align*} 0=\frac{d}{dx}F_1(x, f_1(x), f_2 (x)) & =\frac{\partial F_1}{\partial x}\frac{dx}{dx}+\frac{\partial F_1}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_1}{\partial y_2}\frac{df_2}{dx} \\ & = \frac{\partial F_1}{\partial x}+\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2'\end{align*}

oraz

\displaystyle \begin{align*} 0=\frac{d}{dx}F_2(x, f_1(x), f_2 (x)) & =\frac{\partial F_2}{\partial x}\frac{dx}{dx}+\frac{\partial F_2}{\partial y_1}\frac{df_1}{dx}+\frac{\partial F_2}{\partial y_2}\frac{df_2}{dx} \\ & = \frac{\partial F_2}{\partial x}+\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2'.\end{align*}

Otrzymujemy układ dwóch równań z niewiadomymi \displaystyle f_1' , \displaystyle f_2' , które są pochodnymi składowych funkcji uwikłanej \displaystyle f=(f_1, f_2) :

\displaystyle \left\{\begin{align*} -\frac{\partial F_1}{\partial x}=\frac{\partial F_1}{\partial y_1}f_1'+\frac{\partial F_1}{\partial y_2}f_2' \\ -\frac{\partial F_2}{\partial x}=\frac{\partial F_2}{\partial y_1}f_1'+\frac{\partial F_2}{\partial y_2}f_2' \end{align*}\right.

Zapiszmy ten układ w formie macierzowej

\displaystyle \displaystyle -\left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ] =\left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle\frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right] \left[\begin{array}{r} f_1' \\ f_2 '\end{array}\right ].

W rozważanym przypadku założenie o izomorficzności zacieśnienia różniczki \displaystyle d_{(x,y)}F do podprzestrzeni \displaystyle Y\subset X\times Y oznacza po prostu fakt, że macierz pochodnych cząstkowych, która reprezentuje \displaystyle d_{(x,y)F_{|Y}} :

\displaystyle \left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle\frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right]

jest nieosobliwa, tj. jej wyznacznik jest różny od zera. Z kolei macierz kolumnowa

\displaystyle \left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ]

reprezentuje zacieśnienie różniczki \displaystyle d_{(x,y)}F do podprzestrzeni \displaystyle X\subset X\times Y . Macierz niewiadomych \displaystyle f_1' , \displaystyle f_2' :

\displaystyle \left[\begin{array}{r} f_1' \\ f_2'\end{array} \right]

reprezentuje różniczkę \displaystyle d_x f funkcji uwikłanej \displaystyle f=(f_1, f_2) . Stąd układ równań z niewiadomymi \displaystyle f_1' , \displaystyle f_2' przedstawia równanie

\displaystyle -d_{(x,y)}F_{|X}=d_{(x,y)}F_{|Y}\circ d_x f, \ \ \ \ \ \text{ gdzie }y=f(x),

w którym niewiadomą jest różniczka \displaystyle d_x f . Izomorficzność zacieśnienia \displaystyle d_{(x,y)}F_{|Y} gwarantuje istnienie odwzorowania odwrotnego \displaystyle (d_{(x,y)}F_{|Y})^{-1} , dzięki czemu otrzymujemy

\displaystyle d_xf=-(d_{(x,y)}F_{|Y})^{-1}\circ d_{(x,y)}F_{|X}.

W języku algebry nieosobliwość macierzy

\displaystyle \left[\begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle\frac{\partial F_2}{\partial y_2}\end{array} \right]

gwarantuje istnienie macierzy do niej odwrotnej. Stąd rozwiązaniem równania

\displaystyle \displaystyle-\left[\begin{array}{r}\displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array} \right] =\left[ \begin{array}{rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array}\right ] \left [\begin{array}{r} f_1' \\ f_2 '\end{array} \right]

jest

\displaystyle \displaystyle\left[\begin{array}{r} f_1' \\ f_2 '\end{array} \right] =-\left(\left[ \begin{array} {rr}\displaystyle \frac{\partial F_1}{\partial y_1} & \displaystyle \frac{\partial F_1}{\partial y_2} \\ & \\ \displaystyle \frac{\partial F_2}{\partial y_1} & \displaystyle \frac{\partial F_2}{\partial y_2}\end{array} \right]\right)^{-1} \left[\begin{array}{r} \displaystyle \frac{\partial F_1}{\partial x} \\ \\ \displaystyle \frac{\partial F_2}{\partial x}\end{array}\right ]

lub równoważnie:

\displaystyle d_x f=-(d_{(x,y)}F_{|Y})^{-1}\circ d_{(x,y)}F_{|X}.