Niech \( \displaystyle X=\mathbb{R}^n, Y=\mathbb{R} \) i niech
\( \displaystyle F: X\times \mathbb{R}\ni (x_1, x_2,\dots, x_n, y)\mapsto F(x_1, x_2, \dots, x_n, y)\in \mathbb{R} \)
będzie funkcją określoną w pewnym zbiorze otwartym \( \displaystyle U\subset X\times \mathbb{R} \).
Zauważmy, że do wyznaczenia różniczki funkcji \( \displaystyle f \) uwikłanej równaniem \( \displaystyle F(x, f(x))=0 \) nie potrzebujemy znać jawnej postaci funkcji \( \displaystyle f \). Co więcej, potrafimy wyznaczyć punkty, w których funkcja \( \displaystyle f \) może osiągać ekstrema, korzystając ze znanego warunku koniecznego istnienia ekstremum.
Twierdzenie 9.13.[warunek konieczny istnienia ekstremum funkcji uwikłanej]
Jeśli funkcja \( \displaystyle f \) uwikłana równaniem \( \displaystyle F(x,f(x))=0 \) osiąga ekstremum w pewnym punkcie \( \displaystyle a\in X \) takim, że pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial y}(a, f(a))\neq 0 \), to w punkcie \( \displaystyle (a, f(a)) \) zerują się pochodne cząstkowe funkcji \( \displaystyle F \) po zmiennych \( \displaystyle x_1, x_2, \dots, x_n \), tzn.
\( \displaystyle \displaystyle \in\{1,2,\dots, n\} \ \ \frac{\partial F}{\partial x_i}(a,f(a))=0. \)
Dowód
Warunek ten jest konsekwencją wzoru na różniczkę funkcji \( \displaystyle f \), który stanowi tezę twierdzenia o funkcji uwikłanej. Ponieważ zachodzi równość
\( \displaystyle \displaystyle d_x f=-(d_{(x,y)}F_{|Y})^{-1}_{(x,y)}F_{|X}, \)
to wobec izomorficzności \( \displaystyle d_{(x,y)}F_{|Y} \) która w tym przypadku jest równoważna stwierdzeniu, że \( \displaystyle \frac{\partial F}{\partial y}(x, y)\neq 0 \)) różniczka \( \displaystyle d_a f \) zeruje się wtedy i tylko wtedy, gdy \( \displaystyle d_{(a,f(a))}F_{|X}=0 \). Warunek ten jest z kolei równoważny zerowaniu się w punkcie \( \displaystyle (a, f(a)) \) pochodnych cząstkowych funkcji \( \displaystyle F \) po zmiennych \( \displaystyle x_1, x_2, \dots, x_n \), czyli
\( \displaystyle \left\{\begin{align*} & \frac{\partial F}{\partial x_1}(a, f(a))=0 \\ & \frac{\partial F}{\partial x_2}(a, f(a))=0 \\ & \vdots \\ & \frac{\partial F}{\partial x_n}(a, f(a))=0.\end{align*} \right. \)
Wyznaczymy również drugą różniczkę funkcji uwikłanej \( \displaystyle f \), aby z jej określoności wywnioskować, czy funkcja \( \displaystyle f \) osiąga maksimum, minimum, czy też w ogóle nie osiąga ekstremum w punktach, które spełniają warunek konieczny istnienia ekstremum.
Rozważmy dwa najczęściej spotykane przypadki:
Przypadek I. Niech \( \displaystyle F:\mathbb{R}^2\mapsto \mathbb{R} \) będzie funkcją dwukrotnie różniczkowalną. Rozważmy funkcję \( \displaystyle f \) uwikłaną równaniem \( \displaystyle F(x, f(x))=0 \). Różniczkując tę równość po zmiennej \( \displaystyle x \), otrzymamy (na podstawie twierdzenia o różniczkowaniu złożenia) równość
\( \displaystyle 0=\frac{\partial F}{\partial x}+\frac{\partial F}{\partial y}f'. \)
Różniczkując względem zmiennej \( \displaystyle x \) powtórnie obie strony powyższej nierówności, otrzymamy
\( \displaystyle \begin{align*} 0=\frac{d}{dx}\bigg(\frac{\partial F}{\partial x}+\frac{\partial F}{\partial y}f'\bigg) & =\frac{d}{dx}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{d}{dx}\bigg(\frac{\partial F}{\partial y}f'\bigg) \\ & = \frac{d}{dx}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{d}{dx}\bigg(\frac{\partial F}{\partial y}\bigg)f'+\frac{\partial F}{\partial y}f'' \\ & =\frac{\partial^2 F}{\partial x^2}+\frac{\partial^2 F}{\partial y\partial x}f'+\bigg(\frac{\partial^2 F}{\partial x\partial y}+\frac{\partial^2 F}{\partial y^2}f'\bigg)f'+\frac{\partial F}{\partial y}f''.\end{align*} \)
Otrzymane wyrażenie znacznie upraszcza się w punkcie \( \displaystyle x_0 \), w którym \( \displaystyle f'(x_0)=0 \). Otrzymamy wówczas równość
\( \displaystyle 0=\frac{\partial^2 F}{\partial x^2}(x_0, y_0)+\frac{\partial F}{\partial y}(x_0, y_0)f''(x_0), \)
z której - wobec założenia, że \( \displaystyle \frac{\partial F}{\partial y}(x_0, y_0)\neq 0 \) - otrzymamy
\( \displaystyle f''(x_0)=-\left(\frac{\partial F}{\partial y}(x_0, y_0)\right)^{-1}\frac{\partial^2 F}{\partial x^2}(x_0, y_0), \)
gdzie \( \displaystyle y_0=f(x_0) \).
Przypadek II. Niech \( \displaystyle f:\mathbb{R}^2\mapsto \mathbb{R} \) będzie funkcją uwikłaną równaniem \( \displaystyle F(x,y, f(x,y))=0 \), gdzie \( \displaystyle F:\mathbb{R}^3\mapsto \mathbb{R} \) jest funkcją dwukrotnie różniczkowalną. Wówczas w punktach poziomicy \( \displaystyle \{F=0\} \) otrzymamy równości zawierające pochodne cząstkowe \( \displaystyle \frac{\partial f}{\partial x} \) oraz \( \displaystyle \frac{\partial f}{\partial y} \):
\( \displaystyle 0=\frac{\partial F}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial f}{\partial x} \)
\( \displaystyle 0=\frac{\partial F}{\partial y}+\frac{\partial F}{\partial z}\frac{\partial f}{\partial y}. \)
Policzymy pochodną cząstkową \( \displaystyle \frac{\partial }{\partial x} \) po zmiennej \( \displaystyle x \) obu stron pierwszej z tych równości. Ze wzorów na pochodną złożenia funkcji wyznaczymy wpierw:
\( \displaystyle \frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}\bigg)=\frac{\partial^2 F}{\partial x^2}+\frac{\partial^2 F}{\partial z\partial x}\frac{\partial f }{\partial x} \)
oraz
\( \displaystyle \frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial z}\bigg)=\frac{\partial^2 F}{\partial x\partial z}+\frac{\partial^2 F}{\partial z^2}\frac{\partial f}{\partial x}. \)
Wobec tego
\( \displaystyle \begin{align*} 0=\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial f}{\partial x} \bigg) & =\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial z}\frac{\partial f}{\partial x}\bigg) \\ & =\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial z}\bigg)\frac{\partial f}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial^2 f}{\partial x^2} \\ & =\frac{\partial^2 F}{\partial x^2}+\frac{\partial^2 F}{\partial z\partial x}\frac{\partial f}{\partial x}+\bigg(\frac{\partial^2 F}{\partial x\partial z}+\frac{\partial^2 F}{\partial z^2}\frac{\partial f}{\partial x} \bigg)\frac{\partial f}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial^2 f}{\partial x^2}.\end{align*} \)
W punkcie \( \displaystyle (x_0, y_0) \), w którym zeruje się różniczka funkcji uwikłanej, mamy \( \displaystyle \frac{\partial f}{\partial x}(x_0, y_0)=0 \), \( \displaystyle \frac{\partial f}{\partial y}(x_0, y_0)=0 \), a powyższy wzór upraszcza się i przyjmuje postać:
\( \displaystyle 0=\frac{\partial ^2 F}{\partial x^2}(x_0, y_0, z_0)+\frac{\partial F}{\partial z}(x_0, y_0, z_0)\frac{\partial^2 f}{\partial x^2}(x_0, y_0), \)
gdzie \( \displaystyle z_0=f(x_0, y_0) \). W podobny sposób dostajemy równości zawierające pozostałe pochodne cząstkowe rzędu drugiego funkcji uwikłanej \( \displaystyle f \), które przy założeniu zerowania się różniczki funkcji uwikłanej w punkcie \( \displaystyle (x_0, y_0) \) przyjmują postać:
\( \displaystyle 0=\frac{\partial ^2 F}{\partial x\partial y}(x_0, y_0, z_0)+\frac{\partial F}{\partial z}(x_0, y_0, z_0)\frac{\partial^2 f}{\partial x\partial y}(x_0, y_0), \)
\( \displaystyle 0=\frac{\partial ^2 F}{\partial y\partial x}(x_0, y_0, z_0)+\frac{\partial F}{\partial z}(x_0, y_0, z_0)\frac{\partial^2 f}{\partial y\partial x}(x_0, y_0), \)
\( \displaystyle 0=\frac{\partial ^2 F}{\partial y^2}(x_0, y_0, z_0)+\frac{\partial F}{\partial z}(x_0, y_0, z_0)\frac{\partial^2 f}{\partial y^2}(x_0, y_0). \)
Stąd - wobec założenia, że \( \displaystyle \frac{\partial F}{\partial z}(x_0, y_0, z_0)\neq 0 \) - otrzymujemy:
\( \displaystyle \left [\begin{align*} & \frac{\partial^2 f}{\partial x^2}(x_0, y_0) & \ & \frac{\partial^2 f}{\partial x\partial y}(x_0, y_0) \\ & \frac{\partial^2 f}{\partial y\partial x}(x_0, y_0) \ & \ & \frac{\partial^2 f}{\partial y^2}(x_0, y_0)\end{align*}\right]=-\left(\frac{\partial F}{\partial z}(x_0, y_0, z_0)\right)^{-1} \left[\begin{align*} & \frac{\partial^2 F}{\partial x^2}(x_0, y_0, z_0) & \ & \frac{\partial^2 F}{\partial x\partial y}(x_0, y_0, z_0) \\ & \frac{\partial^2 F}{\partial y\partial x}(x_0, y_0, z_0) \ & \ & \frac{\partial^2 F}{\partial y^2}(x_0, y_0, z_0)\end{align*}\right] \)
W podobny sposób (szczegółowe rachunki pomijamy) można wykazać ogólny wzór wyrażający drugą różniczkę funkcji uwikłanej.
Wniosek 9.14.
Niech \( \displaystyle f: x\mapsto f(x) \), \( \displaystyle x=(x_1, x_2, \dots,x_n) \) będzie funkcją uwikłaną równaniem \( \displaystyle F(x, f(x))=0 \), gdzie \( \displaystyle F: \mathbb{R}^n\times \mathbb{R}\ni (x,y)\mapsto F(x,y)\in \mathbb{R} \) jest funkcją dwukrotnie różniczkowalną w pewnym otoczeniu punktu \( \displaystyle (a,b) \), gdzie \( \displaystyle b=f(a) \). Niech \( \displaystyle \frac{\partial F}{\partial y}(a,b)\neq 0 \) i niech różniczka \( \displaystyle d_a f=0 \). Wówczas druga różniczka funkcji uwikłanej \( \displaystyle f \) w punkcie \( \displaystyle a \) wynosi
\( \displaystyle d_a^2 f=-\bigg(\frac{\partial F}{\partial y}(a,b)\bigg)^{-1}d_{(a, b)}F_{|X}, \)
czyli
\( \displaystyle \frac{\partial^2 f}{\partial x_i \partial x_j}(a)=-\bigg(\frac{\partial F}{\partial y}(a,b)\bigg)^{-1}\frac{\partial^2 F}{\partial x_i \partial x_j}(a,b), \) dla dowolnych \( \displaystyle i, j\in\{1,2,\dots, n\} \).
Przykład 9.15.
Wyznaczmy ekstrema funkcji \( \displaystyle f \) danej w postaci uwikłanej \( \displaystyle F(x,y, f(x,y))=0 \), gdzie
\( \displaystyle F(x,y,z)=(x^2+y^2+z^2)^2 -3 xyz. \)
Obserwacja poziomicy zerowej \( \displaystyle \{F=0\} \) każe przypuszczać, że w otoczeniu czterech punktów tej poziomicy da się wskazać otoczenia ich rzutów na płaszczyznę zmiennych \( \displaystyle (x,y) \) oraz jednoznacznie określone funkcje w tych otoczeniach takie, że dwie z nich będą osiągać maksima, a pozostałe dwie - minima.
Zgodnie z wykazanymi uwagami, aby wyznaczyć punkty ekstremalne funkcji uwikłanej \( \displaystyle f \) szukamy punktów \( \displaystyle (x,y) \), których współrzędne spełniają układ równań:
\( \displaystyle \left\{\begin{align*} & \frac{\partial F}{\partial x}(x,y,z)=0 \\ & \frac{\partial F}{\partial y}(x,y,z)=0 \\ & (x,y,z)\in\{F=0\} \end{align*} \right. \text{ czyli } \left\{\begin{align*} & 4x(x^2+y^2+z^2)-3yz=0 \\ & 4y(x^2+y^2+z^2)-3xz=0 \\ & (x^2+y^2+z^2)^2 -3 xyz=0. \end{align*}\right . \)
Możliwość skorzystania z twierdzenia o funkcji uwikłanej (aby mieć gwarancję istnienia funkcji uwikłanej \( \displaystyle f \)) wymaga sprawdzenia założenia:
\( \displaystyle \frac{\partial F}{\partial z}(x,y,z)=4z(x^2+y^2+z^2)-3xy\neq 0. \)
Nietrudno zauważyć, że początek układu współrzędnych \( \displaystyle (0,0,0) \) spełnia układ równań, ale nie spełnia założenia twierdzenia o funkcji uwikłanej, gdyż \( \displaystyle \frac{\partial F}{\partial z}(0,0,0)=0 \). Obserwacja poziomicy \( \displaystyle \{F=0\} \) wyraźnie pokazuje, że nie ma możliwości jednoznacznego odwikłania funkcji \( \displaystyle (x,y)\mapsto f(x,y) \) z równania \( \displaystyle F(x,y, f(x,y))=0 \) w żadnym otoczeniu punktu \( \displaystyle (0,0,0) \). Ponadto układ spełniają cztery punkty o współrzędnych
\( \displaystyle \begin{align*} & x=y=\frac{3\sqrt{2}}{16}, \ & & z=\frac{3}{8}, \\ & x=y=-\frac{3\sqrt{2}}{16}, \ & & z=\frac{3}{8}, \\ & x=-y=\frac{3\sqrt{2}}{16}, \ & & z=-\frac{3}{8}, \\ & x=-y=-\frac{3\sqrt{2}}{16}, \ & & z=-\frac{3}{8},\end{align*} \) w których spełniony jest warunek \( \displaystyle \frac{\partial F}{\partial z}(x,y,z)\neq 0 \). Na mocy twierdzenia o funkcji uwikłanej w pewnych otoczeniach \( \displaystyle U_1, U_2, U_3, U_4\subset\mathbb{R}^2 \) odpowiednio punktów
\( \displaystyle \begin{align*} & A_1=\big(\frac{3\sqrt{2}}{16}, \frac{3\sqrt{2}}{16}\big), \\ & A_2=\big(-\frac{3\sqrt{2}}{16}, -\frac{3\sqrt{2}}{16}\big), \\ & A_3=\big(-\frac{3\sqrt{2}}{16}, \frac{3\sqrt{2}}{16}\big), \\ & A_4=\big(\frac{3\sqrt{2}}{16}, -\frac{3\sqrt{2}}{16}\big), \end{align*} \)
istnieją jedyne funkcje \( \displaystyle f_1: U_1\mapsto\mathbb{R} \), \( \displaystyle f_2: U_2\mapsto\mathbb{R} \), \( \displaystyle f_3: U_3\mapsto\mathbb{R} \), \( \displaystyle f_4: U_4\mapsto\mathbb{R} \), które spełniają warunek
\( \displaystyle F\big(x, y, f_i(x,y)\big)=0, \text{ gdy } (x,y)\in U_i, \ i\in\{1,2,3,4\} \)
oraz odpowiednio \( \displaystyle f_1(A_1)=f_2(A_2)=\frac{3}{8} \), \( \displaystyle f_3(A_3)=f_4(A_4)=-\frac{3}{8} \). Analiza poziomicy \( \displaystyle \{F=0\} \) (lub określoności drugiej różniczki \( \displaystyle d_{A_i}^2 f, \ i\in\{1,2,3,4\} \)) pozwala stwierdzić, że funkcje \( \displaystyle f_1 \) i \( \displaystyle f_2 \) osiągają w punktach \( \displaystyle A_1 \), \( \displaystyle A_2 \) maksimum, zaś \( \displaystyle f_3 \) i \( \displaystyle f_4 \) osiągają w punktach \( \displaystyle A_3 \), \( \displaystyle A_4 \) minimum.
Dalsze przykłady wyznaczania ekstremów funkcji uwikłanej analizujemy w ramach ćwiczeń.