Ekstrema warunkowe. Metoda mnożników Lagrange'a

Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym otwartym podzbiorze \( \displaystyle U \) przestrzeni unormowanej \( \displaystyle X \) (przy czym w praktycznych przykładach zajmowaliśmy się przykładami, gdy \( \displaystyle X=\mathbb{R}^n \), \( \displaystyle n=1,2,3,\dots \)). Równie ważne z praktycznego punktu widzenia są także rozważania polegające na wyznaczaniu ekstremów funkcji \( \displaystyle F:X\mapsto\mathbb{R} \) zacieśnionej do zbioru, który nie jest otwarty w \( \displaystyle X \).

Przykład 9.16.

Wyznaczmy najmniejszą i największą wartość funkcji

\( \displaystyle F(x,y,z)=x -2y +2z \)
na sferze

\( \displaystyle x^2+y^2+z^2=1. \)

Sfera ta jest zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję ciągłą wnioskujemy, że wielomian \( \displaystyle F(x,y,z)=x -2y +2z \) osiąga na tej sferze zarówno wartość najmniejszą, jak i największą. Nasze dotychczasowe doświadczenie podpowiada nam, że zadanie można by sprowadzić do badania funkcji dwóch zmiennych np. poprzez odwikłanie zmiennej

\( \displaystyle z(x,y)=\sqrt{1-x^2-y^2} \text{ lub } z(x,y)=-\sqrt{1-x^2-y^2} \)

z równania sfery i zbadania funkcji dwóch zmiennych \( \displaystyle (x,y) \) danych w kole \( \displaystyle x^2+y^2 < 1 \) wzorami:

\( \displaystyle f_1: (x,y)\mapsto F\big(x,y,\sqrt{1-x^2-y^2}\big)=x-2y+2\sqrt{1-x^2-y^2}, \)

\( \displaystyle f_2: (x,y)\mapsto F\big(x,y,-\sqrt{1-x^2-y^2}\big)=x-2y-2\sqrt{1-x^2-y^2}. \)

Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości ekstremalnych funkcji \( \displaystyle F \) na danej sferze.

Podamy jednak pewną metodę, która pozwala wyznaczać ekstremum funkcji \( \displaystyle F: X\mapsto \mathbb{R} \) zacieśnionej do poziomicy zerowej \( \displaystyle \{G=0\} \) pewnej funkcji \( \displaystyle G: X\mapsto Y \) również w przypadku, gdy odwikłanie zmiennej z równania \( \displaystyle G=0 \) nie jest tak proste jak w podanym przykładzie.

Sprecyzujmy jednak wpierw problem.

Niech \( \displaystyle X, Y \) będą przestrzeniami Banacha i niech \( \displaystyle G: X\mapsto Y \), \( \displaystyle F:X\mapsto \mathbb{R} \) będą funkcjami.

Definicja 9.17.

Mówimy, że funkcja \( \displaystyle F \) osiąga ekstremum warunkowe w punkcie \( \displaystyle a \) przy warunku \( \displaystyle a\in \{G=0\} \), jeśli zacieśnienie funkcji \( \displaystyle F \) do poziomicy \( \displaystyle \{G=0\} \) osiąga ekstremum w tym punkcie. Prawdziwe jest następujące twierdzenie, które stanowi podstawę metody mnożników Lagrange'a.

Niech \( \displaystyle X, Y \) będą przestrzeniami Banacha.

Twierdzenie 9.18.

Niech \( \displaystyle F: X\mapsto \mathbb{R} \), \( \displaystyle G: X\mapsto Y \) będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego \( \displaystyle a \) poziomicy \( \displaystyle \{G=0\} \) (co - przypomnijmy - oznacza, że różniczka \( \displaystyle d_a G \) jest suriekcją przestrzeni \( \displaystyle X \) na \( \displaystyle Y \)). Jeśli funkcja \( \displaystyle F \) osiąga ekstremum warunkowe w punkcie regularnym \( \displaystyle a \) poziomicy zerowej funkcji \( \displaystyle G \), to istnieje funkcjonał liniowy i ciągły \( \displaystyle \Lambda: Y\mapsto\mathbb{R} \) taki, że zachodzi równość \( \displaystyle d_a F=\Lambda \circ d_a G \).

Prawdziwe jest również twierdzenie, które na podstawie określoności drugiej różniczki pozwala stwierdzić, czy funkcja \( \displaystyle F \) osiąga minimum, czy maksimum warunkowe w punkcie \( \displaystyle a\in\{G=0\} \).

Twierdzenie 9.19.

Niech \( \displaystyle F: X\mapsto \mathbb{R} \), \( \displaystyle G: X\mapsto Y \) będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu regularnego \( \displaystyle a \) poziomicy \( \displaystyle \{G=0\} \). Jeśli istnieje funkcjonał liniowy i ciągły \( \displaystyle \Lambda: Y\mapsto\mathbb{R} \) taki, że zachodzi równość \( \displaystyle d_a F=\Lambda \circ d_a G \) oraz forma kwadratowa

\( \displaystyle X\ni h\mapsto\big(d^2_a F-\Lambda \circ d_a^2 G \big)(h,h)\in\mathbb{R} \)

jest dodatnio określona (odpowiednio: ujemnie określona) na podprzestrzeni \( \displaystyle X_1:=\{h\in X, d_aG(h)=0\} \) przestrzeni \( \displaystyle X \), to funkcja \( \displaystyle F \) osiąga w punkcie \( \displaystyle a \) minimum (odpowiednio: maksimum) warunkowe.

Definicja 9.20.

Funkcjonał \( \displaystyle \Lambda \), który występuje w wypowiedzi obu powyższych twierdzeń, nazywamy funkcjonałem Lagrange'a.

Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku Krzysztofa Maurina, Analiza. Część I. Elementy, Państwowe Wydawnictwo Naukowe, Warszawa 1977). Podamy jednak interpretację tego twierdzenia w kilku najczęściej spotykanych sytuacjach.

Uwaga 9.21.

Jeśli \( \displaystyle f, g : \mathbb{R}^2\mapsto \mathbb{R} \) są funkcjami różniczkowalymi, problem znalezienia ekstremum warunkowego funkcji \( \displaystyle f \) przy warunku \( \displaystyle \{g=0\} \) sprowadza się do znalezienia punktu \( \displaystyle a \) na poziomicy \( \displaystyle \{g=0\} \) oraz stałej \( \displaystyle \lambda \), która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane, to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy \( \displaystyle \Lambda : \mathbb{R}\mapsto \mathbb{R} \) dany wzorem \( \displaystyle \Lambda (x)=\lambda x \) taki, że różniczka \( \displaystyle d_a f=\lambda d_a g \), o ile punkt \( \displaystyle a \) jest punktem regularnym poziomicy \( \displaystyle \{g=0\} \). Przypomnijmy, że w przypadku, gdy \( \displaystyle g: \mathbb{R}^2\mapsto \mathbb{R} \), punkt \( \displaystyle a \) jest regularny, jeśli rząd różniczki

\( \displaystyle d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial g(a)}{\partial y}dy \)

wynosi 1. Wystarczy więc sprawdzić, czy w punkcie \( \displaystyle a \) różniczka \( \displaystyle d_a g\neq 0 \), czyli czy którakolwiek pochodna cząstkowa \( \displaystyle \frac{\partial g(a)}{\partial x} \) lub \( \displaystyle \frac{\partial g(a)}{\partial y} \) jest różna od zera. Zagadnienie sprowadza się do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej

\( \displaystyle \Phi(x,y): =f(x,y)-\lambda g(x,y), \)

gdzie stałą \( \displaystyle \lambda \) (nazywaną tradycyjnie mnożnikiem Lagrange'a) wyznaczamy z układu równań

\( \displaystyle \left\{\begin{align*} d_{(x,y)}\Phi=0 \\ g(x,y)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle (x,y)=0.\end{align*} \right. \)

Uwaga 9.22.

Jeśli \( \displaystyle f, g : \mathbb{R}^3\mapsto \mathbb{R} \) są funkcjami różniczkowalnymi, problem znalezienia ekstremum warunkowego funkcji \( \displaystyle f \) przy warunku \( \displaystyle \{g=0\} \) sprowadza się do znalezienia - podobnie jak w poprzednim przypadku - punktu \( \displaystyle a \) na poziomicy \( \displaystyle \{g=0\} \) oraz stałej \( \displaystyle \lambda \), która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy \( \displaystyle \Lambda : \mathbb{R}\mapsto \mathbb{R} \) dany wzorem \( \displaystyle \Lambda (x)=\lambda x \), taki, że różniczka \( \displaystyle d_a f=\lambda d_a g \), o ile punkt \( \displaystyle a \) jest punktem regularnym poziomicy \( \displaystyle \{g=0\} \). Przypomnijmy, że w przypadku, gdy \( \displaystyle g: \mathbb{R}^3\mapsto \mathbb{R} \) punkt \( \displaystyle a \) jest regularny, jeśli rząd \( \displaystyle d_a g \) (odwzorowania liniowego z \( \displaystyle \mathbb{R}^3 \) do \( \displaystyle \mathbb{R} \)) jest maksymalny, czyli wynosi \( \displaystyle 1 \). Wystarczy więc sprawdzić, czy w punkcie \( \displaystyle a \) różniczka

\( \displaystyle d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial g(a)}{\partial y}dy+\frac{\partial g(a)}{\partial z}dz \)
nie zeruje się, czyli czy któraś z pochodnych cząstkowych \( \displaystyle \frac{\partial g(a)}{\partial x} \), \( \displaystyle \frac{\partial g(a)}{\partial y} \), \( \displaystyle \frac{\partial g(a)}{\partial z} \) jest różna od zera. Zagadnienie można sprowadzić do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej

\( \displaystyle \Phi(x,y,z): =f(x,y,z)-\lambda g(x,y,z), \)

gdzie stałą \( \displaystyle \lambda \) wyznaczamy z układu równań

\( \displaystyle \left\{\begin{align*} d_{(x,y,z)}\Phi=0 \\ g(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle\frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle\frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle\frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} \\ & \displaystyle (x,y,z)=0.\end{align*} \right. \)

Przykład 9.23.

Powróćmy do zadania polegającego na wyznaczeniu najmniejszej i największej wartości funkcji \( \displaystyle f(x,y,z)=x -2y +2z \) na sferze \( \displaystyle x^2+y^2+z^2=1 \). Rozwiążemy je metodą mnożników Lagrange'a opisaną w poprzednich uwagach. Dana sfera jest poziomicą zerową funkcji \( \displaystyle g(x,y,z)=x^2+y^2+z^2-1 \). Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech \( \displaystyle \Phi(x,y,z)=f(x,y,z)-\lambda g(x,y,z) \). Rozwiązujemy układ równań

\( \displaystyle \left\{\begin{align*} & \displaystyle \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} \\ & \displaystyle g(x,y,z)=0\end{align*}\right . \text{ czyli } \left\{\begin{align*} & \displaystyle 1=2\lambda x \\ & \displaystyle-2=2\lambda y \\ & \displaystyle 2=2\lambda z \\ & \displaystyle x^2+y^2+z^2=1. \end{align*} \right. \)

Układ ten spełniają liczby

\( \displaystyle x=-\frac{1}{3},y=\frac{2}{3}, z=-\frac{2}{3}, \lambda=-\frac{3}{2} \)

oraz

\( \displaystyle x=\frac{1}{3}, y=-\frac{2}{3}, z=\frac{2}{3}, \lambda=\frac{3}{2}. \)

Ponieważ sfera jest zbiorem zwartym, wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je, gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, w jednym z tych dwóch punktów funkcja \( \displaystyle f \) musi osiągać kres dolny, a w drugim kres górny wartości na sferze \( \displaystyle \{g=0\} \). Mamy

\( \displaystyle f\big(-\frac{1}{3}, \frac{2}{3}, -\frac{2}{3} \big)=-3, \ \ f\big(\frac{1}{3}, -\frac{2}{3}, \frac{2}{3} \big)=3, \)

czyli \( \displaystyle f \) osiąga w pierwszym z tych punktów wartość najmniejszą równą \( \displaystyle -3 \), a w drugim punkcie - wartość największą na sferze równą \( \displaystyle 3 \).

Uwaga 9.24.

Jeśli funkcja \( \displaystyle F: \mathbb{R}^3\mapsto \mathbb{R} \), zaś \( \displaystyle G:\mathbb{R}^3\mapsto \mathbb{R}^2 \), zagadnienie znalezienia ekstremów warunkowych funkcji \( \displaystyle F \) przy warunku \( \displaystyle \{G=0\} \) sprowadza się do znalezienia punktów zbioru \( \displaystyle \{G=0\} \), w których zeruje się różniczka funkcji \( \displaystyle \Phi(x,y,z):=F(x,y,z)-\Lambda \circ G(x,y,z) \). Funkcjonał Lagrange'a \( \displaystyle \Lambda \) w tym przypadku jest odwzorowaniem liniowym z \( \displaystyle \mathbb{R}^2\mapsto \mathbb{R} \), jest więc reprezentowany przez macierz złożoną z dwóch liczb: \( \displaystyle \lambda_1 \), \( \displaystyle \lambda_2 \). Funkcja \( \displaystyle G=(g_1, g_2) \) jest zestawieniem dwóch funkcji \( \displaystyle g_1, g_2 \) o wartościach rzeczywistych, stąd

\( \displaystyle \Phi(x,y,z)=F(x,y,z)-\Lambda G(x,y,z)=F(x,y,z)-\lambda_1 g_1 (x,y,z)-\lambda_2 g_2 (x,y,z). \)

Metoda mnożników Lagrange'a sprowadza się więc do znalezienia rozwiązań układu równań

\( \displaystyle \left\{\begin{align*} d_{(x,y,z)}\Phi=0 \\ G(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle\frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} \\ & \displaystyle\frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y} \\ & \displaystyle\frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} \\ & \displaystyle g_1(x,y,z)=0 \\ & \displaystyle g_2(x,y,z)=0\end{align*} \right. \)

w punktach regularnych poziomicy \( \displaystyle \{G=0\} \), czyli tych, w których rząd różniczki \( \displaystyle d_{(x,y,z)}G \) jest maksymalny (tj. równy \( \displaystyle 2 \), gdyż różniczka \( \displaystyle d_{(x,y,z)}G \) jest odwzorowaniem liniowym z \( \displaystyle \mathbb{R}^3 \) do \( \displaystyle \mathbb{R}^2 \)). Zwróćmy uwagę, że funkcja \( \displaystyle F \) może osiągać ekstremum w punktach, które należą do poziomicy \( \displaystyle \{G=0\} \) a nie są regularne. Metoda mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu ekstremum.

Przykład 9.25.

Wyznaczmy najmniejszą i największą wartość funkcji

\( \displaystyle F(x,y,z)=x-y-2z \)

na przecięciu się dwóch walców

\( \displaystyle x^2+z^2=1, \ \ y^2+z^2=1. \)

Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym, gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem zwartym (gdyż jest zbiorem domkniętym i ograniczonym, zawartym między innymi w sześcianie \( \displaystyle [-1,1]\times [-1,1]\times [-1,1] \)). Podany warunek można opisać za pomocą poziomicy zerowej funkcji \( \displaystyle G(x,y,z)=(x^2+z^2-1, y^2+z^2-1) \). Zbadaliśmy już, że spośród punktów poziomicy \( \displaystyle \{G=0\} \) tylko dwa nie są regularne: \( \displaystyle (0,0, 1) \) oraz \( \displaystyle (0,0,-1) \). Poza tymi dwoma punktami możemy zastosować metodę mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań układu równań:

\( \displaystyle \left\{\begin{align*} & \displaystyle \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} \\ & \displaystyle \frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y} \\ & \displaystyle \frac{\partial f}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} \\ & \displaystyle g_1(x,y,z)=0 \\ & \displaystyle g_2(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle 1=2\lambda_1 x \\ & \displaystyle -1=2\lambda_2 y \\ & \displaystyle-2=2(\lambda_1+\lambda_2)z \\ & \displaystyle x^2+z^2-1=0 \\ & \displaystyle y^2+z^2-1=0. \end{align*}\right. \)

Układ ten ma dwa rozwiązania

\( \displaystyle -x=y=z=\frac{\sqrt{2}}{2}, \text{ przy czym } \lambda_1=\lambda_2=-\frac{\sqrt{2}}{2} \)

oraz

\( \displaystyle x=-y=-z=\frac{\sqrt{2}}{2}, \text{ przy czym } \lambda_1=\lambda_2=\frac{\sqrt{2}}{2}. \)

Wartość funkcji \( \displaystyle F \) w tych punktach wynosi

\( \displaystyle F\big(-\frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}\big)=-2\sqrt{2} \text{ oraz } F\big(\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}\big)=2\sqrt{2}. \)

W obu punktach nieregularnych poziomicy \( \displaystyle \{G=0\} \) mamy

\( \displaystyle F(0,0,-1)=2 \text{ oraz } F(0,0,1)=-2. \)

Po porównaniu tych wartości: \( \displaystyle -2\sqrt{2} < -2 < 2 < 2\sqrt{2} \) stwierdzamy, że największą wartość na na poziomicy \( \displaystyle \{G=0\} \) równą \( \displaystyle 2\sqrt{2} \) funkcja \( \displaystyle F \) osiąga w punkcie \( \displaystyle (\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}) \), a najmniejszą, równą \( \displaystyle -2\sqrt{2} \), w punkcie \( \displaystyle (-\frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}). \)