Ekstrema funkcji uwikłanej | Informatyka MIMUW

Niech \( \displaystyle X=\mathbb{R}^n, Y=\mathbb{R} \) i niech

\( \displaystyle F: X\times \mathbb{R}\ni (x_1, x_2,\dots, x_n, y)\mapsto F(x_1, x_2, \dots, x_n, y)\in \mathbb{R} \)

będzie funkcją określoną w pewnym zbiorze otwartym \( \displaystyle U\subset X\times \mathbb{R} \).

Zauważmy, że do wyznaczenia różniczki funkcji \( \displaystyle f \) uwikłanej równaniem \( \displaystyle F(x, f(x))=0 \) nie potrzebujemy znać jawnej postaci funkcji \( \displaystyle f \). Co więcej, potrafimy wyznaczyć punkty, w których funkcja \( \displaystyle f \) może osiągać ekstrema, korzystając ze znanego warunku koniecznego istnienia ekstremum.

Twierdzenie 9.13.[warunek konieczny istnienia ekstremum funkcji uwikłanej]

Jeśli funkcja \( \displaystyle f \) uwikłana równaniem \( \displaystyle F(x,f(x))=0 \) osiąga ekstremum w pewnym punkcie \( \displaystyle a\in X \) takim, że pochodna cząstkowa \( \displaystyle \frac{\partial F}{\partial y}(a, f(a))\neq 0 \), to w punkcie \( \displaystyle (a, f(a)) \) zerują się pochodne cząstkowe funkcji \( \displaystyle F \) po zmiennych \( \displaystyle x_1, x_2, \dots, x_n \), tzn.

\( \displaystyle \displaystyle \in\{1,2,\dots, n\} \ \ \frac{\partial F}{\partial x_i}(a,f(a))=0. \)

Dowód

Warunek ten jest konsekwencją wzoru na różniczkę funkcji \( \displaystyle f \), który stanowi tezę twierdzenia o funkcji uwikłanej. Ponieważ zachodzi równość

\( \displaystyle \displaystyle d_x f=-(d_{(x,y)}F_{|Y})^{-1}_{(x,y)}F_{|X}, \)

to wobec izomorficzności \( \displaystyle d_{(x,y)}F_{|Y} \) która w tym przypadku jest równoważna stwierdzeniu, że \( \displaystyle \frac{\partial F}{\partial y}(x, y)\neq 0 \)) różniczka \( \displaystyle d_a f \) zeruje się wtedy i tylko wtedy, gdy \( \displaystyle d_{(a,f(a))}F_{|X}=0 \). Warunek ten jest z kolei równoważny zerowaniu się w punkcie \( \displaystyle (a, f(a)) \) pochodnych cząstkowych funkcji \( \displaystyle F \) po zmiennych \( \displaystyle x_1, x_2, \dots, x_n \), czyli

\( \displaystyle \left\{\begin{align*} & \frac{\partial F}{\partial x_1}(a, f(a))=0 \\ & \frac{\partial F}{\partial x_2}(a, f(a))=0 \\ & \vdots \\ & \frac{\partial F}{\partial x_n}(a, f(a))=0.\end{align*} \right. \)

Wyznaczymy również drugą różniczkę funkcji uwikłanej \( \displaystyle f \), aby z jej określoności wywnioskować, czy funkcja \( \displaystyle f \) osiąga maksimum, minimum, czy też w ogóle nie osiąga ekstremum w punktach, które spełniają warunek konieczny istnienia ekstremum.

Rozważmy dwa najczęściej spotykane przypadki:

Przypadek I. Niech \( \displaystyle F:\mathbb{R}^2\mapsto \mathbb{R} \) będzie funkcją dwukrotnie różniczkowalną. Rozważmy funkcję \( \displaystyle f \) uwikłaną równaniem \( \displaystyle F(x, f(x))=0 \). Różniczkując tę równość po zmiennej \( \displaystyle x \), otrzymamy (na podstawie twierdzenia o różniczkowaniu złożenia) równość

\( \displaystyle 0=\frac{\partial F}{\partial x}+\frac{\partial F}{\partial y}f'. \)

Różniczkując względem zmiennej \( \displaystyle x \) powtórnie obie strony powyższej nierówności, otrzymamy

\( \displaystyle \begin{align*} 0=\frac{d}{dx}\bigg(\frac{\partial F}{\partial x}+\frac{\partial F}{\partial y}f'\bigg) & =\frac{d}{dx}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{d}{dx}\bigg(\frac{\partial F}{\partial y}f'\bigg) \\ & = \frac{d}{dx}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{d}{dx}\bigg(\frac{\partial F}{\partial y}\bigg)f'+\frac{\partial F}{\partial y}f'' \\ & =\frac{\partial^2 F}{\partial x^2}+\frac{\partial^2 F}{\partial y\partial x}f'+\bigg(\frac{\partial^2 F}{\partial x\partial y}+\frac{\partial^2 F}{\partial y^2}f'\bigg)f'+\frac{\partial F}{\partial y}f''.\end{align*} \)

Otrzymane wyrażenie znacznie upraszcza się w punkcie \( \displaystyle x_0 \), w którym \( \displaystyle f'(x_0)=0 \). Otrzymamy wówczas równość

\( \displaystyle 0=\frac{\partial^2 F}{\partial x^2}(x_0, y_0)+\frac{\partial F}{\partial y}(x_0, y_0)f''(x_0), \)

z której - wobec założenia, że \( \displaystyle \frac{\partial F}{\partial y}(x_0, y_0)\neq 0 \) - otrzymamy

\( \displaystyle f''(x_0)=-\left(\frac{\partial F}{\partial y}(x_0, y_0)\right)^{-1}\frac{\partial^2 F}{\partial x^2}(x_0, y_0), \)

gdzie \( \displaystyle y_0=f(x_0) \).

Przypadek II. Niech \( \displaystyle f:\mathbb{R}^2\mapsto \mathbb{R} \) będzie funkcją uwikłaną równaniem \( \displaystyle F(x,y, f(x,y))=0 \), gdzie \( \displaystyle F:\mathbb{R}^3\mapsto \mathbb{R} \) jest funkcją dwukrotnie różniczkowalną. Wówczas w punktach poziomicy \( \displaystyle \{F=0\} \) otrzymamy równości zawierające pochodne cząstkowe \( \displaystyle \frac{\partial f}{\partial x} \) oraz \( \displaystyle \frac{\partial f}{\partial y} \):

\( \displaystyle 0=\frac{\partial F}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial f}{\partial x} \)

\( \displaystyle 0=\frac{\partial F}{\partial y}+\frac{\partial F}{\partial z}\frac{\partial f}{\partial y}. \)

Policzymy pochodną cząstkową \( \displaystyle \frac{\partial }{\partial x} \) po zmiennej \( \displaystyle x \) obu stron pierwszej z tych równości. Ze wzorów na pochodną złożenia funkcji wyznaczymy wpierw:

\( \displaystyle \frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}\bigg)=\frac{\partial^2 F}{\partial x^2}+\frac{\partial^2 F}{\partial z\partial x}\frac{\partial f }{\partial x} \)

oraz

\( \displaystyle \frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial z}\bigg)=\frac{\partial^2 F}{\partial x\partial z}+\frac{\partial^2 F}{\partial z^2}\frac{\partial f}{\partial x}. \)

Wobec tego

\( \displaystyle \begin{align*} 0=\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial f}{\partial x} \bigg) & =\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial z}\frac{\partial f}{\partial x}\bigg) \\ & =\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial x}\bigg)+\frac{\partial }{\partial x}\bigg(\frac{\partial F}{\partial z}\bigg)\frac{\partial f}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial^2 f}{\partial x^2} \\ & =\frac{\partial^2 F}{\partial x^2}+\frac{\partial^2 F}{\partial z\partial x}\frac{\partial f}{\partial x}+\bigg(\frac{\partial^2 F}{\partial x\partial z}+\frac{\partial^2 F}{\partial z^2}\frac{\partial f}{\partial x} \bigg)\frac{\partial f}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial^2 f}{\partial x^2}.\end{align*} \)

W punkcie \( \displaystyle (x_0, y_0) \), w którym zeruje się różniczka funkcji uwikłanej, mamy \( \displaystyle \frac{\partial f}{\partial x}(x_0, y_0)=0 \), \( \displaystyle \frac{\partial f}{\partial y}(x_0, y_0)=0 \), a powyższy wzór upraszcza się i przyjmuje postać:

\( \displaystyle 0=\frac{\partial ^2 F}{\partial x^2}(x_0, y_0, z_0)+\frac{\partial F}{\partial z}(x_0, y_0, z_0)\frac{\partial^2 f}{\partial x^2}(x_0, y_0), \)

gdzie \( \displaystyle z_0=f(x_0, y_0) \). W podobny sposób dostajemy równości zawierające pozostałe pochodne cząstkowe rzędu drugiego funkcji uwikłanej \( \displaystyle f \), które przy założeniu zerowania się różniczki funkcji uwikłanej w punkcie \( \displaystyle (x_0, y_0) \) przyjmują postać:

\( \displaystyle 0=\frac{\partial ^2 F}{\partial x\partial y}(x_0, y_0, z_0)+\frac{\partial F}{\partial z}(x_0, y_0, z_0)\frac{\partial^2 f}{\partial x\partial y}(x_0, y_0), \)

\( \displaystyle 0=\frac{\partial ^2 F}{\partial y\partial x}(x_0, y_0, z_0)+\frac{\partial F}{\partial z}(x_0, y_0, z_0)\frac{\partial^2 f}{\partial y\partial x}(x_0, y_0), \)

\( \displaystyle 0=\frac{\partial ^2 F}{\partial y^2}(x_0, y_0, z_0)+\frac{\partial F}{\partial z}(x_0, y_0, z_0)\frac{\partial^2 f}{\partial y^2}(x_0, y_0). \)

Stąd - wobec założenia, że \( \displaystyle \frac{\partial F}{\partial z}(x_0, y_0, z_0)\neq 0 \) - otrzymujemy:

\( \displaystyle \left [\begin{align*} & \frac{\partial^2 f}{\partial x^2}(x_0, y_0) & \ & \frac{\partial^2 f}{\partial x\partial y}(x_0, y_0) \\ & \frac{\partial^2 f}{\partial y\partial x}(x_0, y_0) \ & \ & \frac{\partial^2 f}{\partial y^2}(x_0, y_0)\end{align*}\right]=-\left(\frac{\partial F}{\partial z}(x_0, y_0, z_0)\right)^{-1} \left[\begin{align*} & \frac{\partial^2 F}{\partial x^2}(x_0, y_0, z_0) & \ & \frac{\partial^2 F}{\partial x\partial y}(x_0, y_0, z_0) \\ & \frac{\partial^2 F}{\partial y\partial x}(x_0, y_0, z_0) \ & \ & \frac{\partial^2 F}{\partial y^2}(x_0, y_0, z_0)\end{align*}\right] \)

W podobny sposób (szczegółowe rachunki pomijamy) można wykazać ogólny wzór wyrażający drugą różniczkę funkcji uwikłanej.

Wniosek 9.14.

Niech \( \displaystyle f: x\mapsto f(x) \), \( \displaystyle x=(x_1, x_2, \dots,x_n) \) będzie funkcją uwikłaną równaniem \( \displaystyle F(x, f(x))=0 \), gdzie \( \displaystyle F: \mathbb{R}^n\times \mathbb{R}\ni (x,y)\mapsto F(x,y)\in \mathbb{R} \) jest funkcją dwukrotnie różniczkowalną w pewnym otoczeniu punktu \( \displaystyle (a,b) \), gdzie \( \displaystyle b=f(a) \). Niech \( \displaystyle \frac{\partial F}{\partial y}(a,b)\neq 0 \) i niech różniczka \( \displaystyle d_a f=0 \). Wówczas druga różniczka funkcji uwikłanej \( \displaystyle f \) w punkcie \( \displaystyle a \) wynosi

\( \displaystyle d_a^2 f=-\bigg(\frac{\partial F}{\partial y}(a,b)\bigg)^{-1}d_{(a, b)}F_{|X}, \)

czyli

\( \displaystyle \frac{\partial^2 f}{\partial x_i \partial x_j}(a)=-\bigg(\frac{\partial F}{\partial y}(a,b)\bigg)^{-1}\frac{\partial^2 F}{\partial x_i \partial x_j}(a,b), \) dla dowolnych \( \displaystyle i, j\in\{1,2,\dots, n\} \).

Przykład 9.15.

Wyznaczmy ekstrema funkcji \( \displaystyle f \) danej w postaci uwikłanej \( \displaystyle F(x,y, f(x,y))=0 \), gdzie

\( \displaystyle F(x,y,z)=(x^2+y^2+z^2)^2 -3 xyz. \)

Obserwacja poziomicy zerowej \( \displaystyle \{F=0\} \) każe przypuszczać, że w otoczeniu czterech punktów tej poziomicy da się wskazać otoczenia ich rzutów na płaszczyznę zmiennych \( \displaystyle (x,y) \) oraz jednoznacznie określone funkcje w tych otoczeniach takie, że dwie z nich będą osiągać maksima, a pozostałe dwie - minima.

Zgodnie z wykazanymi uwagami, aby wyznaczyć punkty ekstremalne funkcji uwikłanej \( \displaystyle f \) szukamy punktów \( \displaystyle (x,y) \), których współrzędne spełniają układ równań:

\( \displaystyle \left\{\begin{align*} & \frac{\partial F}{\partial x}(x,y,z)=0 \\ & \frac{\partial F}{\partial y}(x,y,z)=0 \\ & (x,y,z)\in\{F=0\} \end{align*} \right. \text{ czyli } \left\{\begin{align*} & 4x(x^2+y^2+z^2)-3yz=0 \\ & 4y(x^2+y^2+z^2)-3xz=0 \\ & (x^2+y^2+z^2)^2 -3 xyz=0. \end{align*}\right . \)

Możliwość skorzystania z twierdzenia o funkcji uwikłanej (aby mieć gwarancję istnienia funkcji uwikłanej \( \displaystyle f \)) wymaga sprawdzenia założenia:

\( \displaystyle \frac{\partial F}{\partial z}(x,y,z)=4z(x^2+y^2+z^2)-3xy\neq 0. \)

Nietrudno zauważyć, że początek układu współrzędnych \( \displaystyle (0,0,0) \) spełnia układ równań, ale nie spełnia założenia twierdzenia o funkcji uwikłanej, gdyż \( \displaystyle \frac{\partial F}{\partial z}(0,0,0)=0 \). Obserwacja poziomicy \( \displaystyle \{F=0\} \) wyraźnie pokazuje, że nie ma możliwości jednoznacznego odwikłania funkcji \( \displaystyle (x,y)\mapsto f(x,y) \) z równania \( \displaystyle F(x,y, f(x,y))=0 \) w żadnym otoczeniu punktu \( \displaystyle (0,0,0) \). Ponadto układ spełniają cztery punkty o współrzędnych

\( \displaystyle \begin{align*} & x=y=\frac{3\sqrt{2}}{16}, \ & & z=\frac{3}{8}, \\ & x=y=-\frac{3\sqrt{2}}{16}, \ & & z=\frac{3}{8}, \\ & x=-y=\frac{3\sqrt{2}}{16}, \ & & z=-\frac{3}{8}, \\ & x=-y=-\frac{3\sqrt{2}}{16}, \ & & z=-\frac{3}{8},\end{align*} \) w których spełniony jest warunek \( \displaystyle \frac{\partial F}{\partial z}(x,y,z)\neq 0 \). Na mocy twierdzenia o funkcji uwikłanej w pewnych otoczeniach \( \displaystyle U_1, U_2, U_3, U_4\subset\mathbb{R}^2 \) odpowiednio punktów

\( \displaystyle \begin{align*} & A_1=\big(\frac{3\sqrt{2}}{16}, \frac{3\sqrt{2}}{16}\big), \\ & A_2=\big(-\frac{3\sqrt{2}}{16}, -\frac{3\sqrt{2}}{16}\big), \\ & A_3=\big(-\frac{3\sqrt{2}}{16}, \frac{3\sqrt{2}}{16}\big), \\ & A_4=\big(\frac{3\sqrt{2}}{16}, -\frac{3\sqrt{2}}{16}\big), \end{align*} \)

istnieją jedyne funkcje \( \displaystyle f_1: U_1\mapsto\mathbb{R} \), \( \displaystyle f_2: U_2\mapsto\mathbb{R} \), \( \displaystyle f_3: U_3\mapsto\mathbb{R} \), \( \displaystyle f_4: U_4\mapsto\mathbb{R} \), które spełniają warunek

\( \displaystyle F\big(x, y, f_i(x,y)\big)=0, \text{ gdy } (x,y)\in U_i, \ i\in\{1,2,3,4\} \)

oraz odpowiednio \( \displaystyle f_1(A_1)=f_2(A_2)=\frac{3}{8} \), \( \displaystyle f_3(A_3)=f_4(A_4)=-\frac{3}{8} \). Analiza poziomicy \( \displaystyle \{F=0\} \) (lub określoności drugiej różniczki \( \displaystyle d_{A_i}^2 f, \ i\in\{1,2,3,4\} \)) pozwala stwierdzić, że funkcje \( \displaystyle f_1 \) i \( \displaystyle f_2 \) osiągają w punktach \( \displaystyle A_1 \), \( \displaystyle A_2 \) maksimum, zaś \( \displaystyle f_3 \) i \( \displaystyle f_4 \) osiągają w punktach \( \displaystyle A_3 \), \( \displaystyle A_4 \) minimum.

Dalsze przykłady wyznaczania ekstremów funkcji uwikłanej analizujemy w ramach ćwiczeń.