Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym otwartym podzbiorze \( \displaystyle U \) przestrzeni unormowanej \( \displaystyle X \) (przy czym w praktycznych przykładach zajmowaliśmy się przykładami, gdy \( \displaystyle X=\mathbb{R}^n \), \( \displaystyle n=1,2,3,\dots \)). Równie ważne z praktycznego punktu widzenia są także rozważania polegające na wyznaczaniu ekstremów funkcji \( \displaystyle F:X\mapsto\mathbb{R} \) zacieśnionej do zbioru, który nie jest otwarty w \( \displaystyle X \).
Przykład 9.16.
Wyznaczmy najmniejszą i największą wartość funkcji
\( \displaystyle F(x,y,z)=x -2y +2z \)
na sferze
\( \displaystyle x^2+y^2+z^2=1. \)
Sfera ta jest zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję ciągłą wnioskujemy, że wielomian \( \displaystyle F(x,y,z)=x -2y +2z \) osiąga na tej sferze zarówno wartość najmniejszą, jak i największą. Nasze dotychczasowe doświadczenie podpowiada nam, że zadanie można by sprowadzić do badania funkcji dwóch zmiennych np. poprzez odwikłanie zmiennej
\( \displaystyle z(x,y)=\sqrt{1-x^2-y^2} \text{ lub } z(x,y)=-\sqrt{1-x^2-y^2} \)
z równania sfery i zbadania funkcji dwóch zmiennych \( \displaystyle (x,y) \) danych w kole \( \displaystyle x^2+y^2 < 1 \) wzorami:
\( \displaystyle f_1: (x,y)\mapsto F\big(x,y,\sqrt{1-x^2-y^2}\big)=x-2y+2\sqrt{1-x^2-y^2}, \)
\( \displaystyle f_2: (x,y)\mapsto F\big(x,y,-\sqrt{1-x^2-y^2}\big)=x-2y-2\sqrt{1-x^2-y^2}. \)
Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości ekstremalnych funkcji \( \displaystyle F \) na danej sferze.
Podamy jednak pewną metodę, która pozwala wyznaczać ekstremum funkcji \( \displaystyle F: X\mapsto \mathbb{R} \) zacieśnionej do poziomicy zerowej \( \displaystyle \{G=0\} \) pewnej funkcji \( \displaystyle G: X\mapsto Y \) również w przypadku, gdy odwikłanie zmiennej z równania \( \displaystyle G=0 \) nie jest tak proste jak w podanym przykładzie.
Sprecyzujmy jednak wpierw problem.
Niech \( \displaystyle X, Y \) będą przestrzeniami Banacha i niech \( \displaystyle G: X\mapsto Y \), \( \displaystyle F:X\mapsto \mathbb{R} \) będą funkcjami.
Definicja 9.17.
Mówimy, że funkcja \( \displaystyle F \) osiąga ekstremum warunkowe w punkcie \( \displaystyle a \) przy warunku \( \displaystyle a\in \{G=0\} \), jeśli zacieśnienie funkcji \( \displaystyle F \) do poziomicy \( \displaystyle \{G=0\} \) osiąga ekstremum w tym punkcie. Prawdziwe jest następujące twierdzenie, które stanowi podstawę metody mnożników Lagrange'a.
Niech \( \displaystyle X, Y \) będą przestrzeniami Banacha.
Twierdzenie 9.18.
Niech \( \displaystyle F: X\mapsto \mathbb{R} \), \( \displaystyle G: X\mapsto Y \) będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego \( \displaystyle a \) poziomicy \( \displaystyle \{G=0\} \) (co - przypomnijmy - oznacza, że różniczka \( \displaystyle d_a G \) jest suriekcją przestrzeni \( \displaystyle X \) na \( \displaystyle Y \)). Jeśli funkcja \( \displaystyle F \) osiąga ekstremum warunkowe w punkcie regularnym \( \displaystyle a \) poziomicy zerowej funkcji \( \displaystyle G \), to istnieje funkcjonał liniowy i ciągły \( \displaystyle \Lambda: Y\mapsto\mathbb{R} \) taki, że zachodzi równość \( \displaystyle d_a F=\Lambda \circ d_a G \).
Prawdziwe jest również twierdzenie, które na podstawie określoności drugiej różniczki pozwala stwierdzić, czy funkcja \( \displaystyle F \) osiąga minimum, czy maksimum warunkowe w punkcie \( \displaystyle a\in\{G=0\} \).
Twierdzenie 9.19.
Niech \( \displaystyle F: X\mapsto \mathbb{R} \), \( \displaystyle G: X\mapsto Y \) będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu regularnego \( \displaystyle a \) poziomicy \( \displaystyle \{G=0\} \). Jeśli istnieje funkcjonał liniowy i ciągły \( \displaystyle \Lambda: Y\mapsto\mathbb{R} \) taki, że zachodzi równość \( \displaystyle d_a F=\Lambda \circ d_a G \) oraz forma kwadratowa
\( \displaystyle X\ni h\mapsto\big(d^2_a F-\Lambda \circ d_a^2 G \big)(h,h)\in\mathbb{R} \)
jest dodatnio określona (odpowiednio: ujemnie określona) na podprzestrzeni \( \displaystyle X_1:=\{h\in X, d_aG(h)=0\} \) przestrzeni \( \displaystyle X \), to funkcja \( \displaystyle F \) osiąga w punkcie \( \displaystyle a \) minimum (odpowiednio: maksimum) warunkowe.
Definicja 9.20.
Funkcjonał \( \displaystyle \Lambda \), który występuje w wypowiedzi obu powyższych twierdzeń, nazywamy funkcjonałem Lagrange'a.
Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku Krzysztofa Maurina, Analiza. Część I. Elementy, Państwowe Wydawnictwo Naukowe, Warszawa 1977). Podamy jednak interpretację tego twierdzenia w kilku najczęściej spotykanych sytuacjach.
Uwaga 9.21.
Jeśli \( \displaystyle f, g : \mathbb{R}^2\mapsto \mathbb{R} \) są funkcjami różniczkowalymi, problem znalezienia ekstremum warunkowego funkcji \( \displaystyle f \) przy warunku \( \displaystyle \{g=0\} \) sprowadza się do znalezienia punktu \( \displaystyle a \) na poziomicy \( \displaystyle \{g=0\} \) oraz stałej \( \displaystyle \lambda \), która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane, to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy \( \displaystyle \Lambda : \mathbb{R}\mapsto \mathbb{R} \) dany wzorem \( \displaystyle \Lambda (x)=\lambda x \) taki, że różniczka \( \displaystyle d_a f=\lambda d_a g \), o ile punkt \( \displaystyle a \) jest punktem regularnym poziomicy \( \displaystyle \{g=0\} \). Przypomnijmy, że w przypadku, gdy \( \displaystyle g: \mathbb{R}^2\mapsto \mathbb{R} \), punkt \( \displaystyle a \) jest regularny, jeśli rząd różniczki
\( \displaystyle d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial g(a)}{\partial y}dy \)
wynosi 1. Wystarczy więc sprawdzić, czy w punkcie \( \displaystyle a \) różniczka \( \displaystyle d_a g\neq 0 \), czyli czy którakolwiek pochodna cząstkowa \( \displaystyle \frac{\partial g(a)}{\partial x} \) lub \( \displaystyle \frac{\partial g(a)}{\partial y} \) jest różna od zera. Zagadnienie sprowadza się do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej
\( \displaystyle \Phi(x,y): =f(x,y)-\lambda g(x,y), \)
gdzie stałą \( \displaystyle \lambda \) (nazywaną tradycyjnie mnożnikiem Lagrange'a) wyznaczamy z układu równań
\( \displaystyle \left\{\begin{align*} d_{(x,y)}\Phi=0 \\ g(x,y)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle (x,y)=0.\end{align*} \right. \)
Uwaga 9.22.
Jeśli \( \displaystyle f, g : \mathbb{R}^3\mapsto \mathbb{R} \) są funkcjami różniczkowalnymi, problem znalezienia ekstremum warunkowego funkcji \( \displaystyle f \) przy warunku \( \displaystyle \{g=0\} \) sprowadza się do znalezienia - podobnie jak w poprzednim przypadku - punktu \( \displaystyle a \) na poziomicy \( \displaystyle \{g=0\} \) oraz stałej \( \displaystyle \lambda \), która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy \( \displaystyle \Lambda : \mathbb{R}\mapsto \mathbb{R} \) dany wzorem \( \displaystyle \Lambda (x)=\lambda x \), taki, że różniczka \( \displaystyle d_a f=\lambda d_a g \), o ile punkt \( \displaystyle a \) jest punktem regularnym poziomicy \( \displaystyle \{g=0\} \). Przypomnijmy, że w przypadku, gdy \( \displaystyle g: \mathbb{R}^3\mapsto \mathbb{R} \) punkt \( \displaystyle a \) jest regularny, jeśli rząd \( \displaystyle d_a g \) (odwzorowania liniowego z \( \displaystyle \mathbb{R}^3 \) do \( \displaystyle \mathbb{R} \)) jest maksymalny, czyli wynosi \( \displaystyle 1 \). Wystarczy więc sprawdzić, czy w punkcie \( \displaystyle a \) różniczka
\( \displaystyle d_a g=\frac{\partial g(a)}{\partial x}dx+\frac{\partial g(a)}{\partial y}dy+\frac{\partial g(a)}{\partial z}dz \)
nie zeruje się, czyli czy któraś z pochodnych cząstkowych \( \displaystyle \frac{\partial g(a)}{\partial x} \), \( \displaystyle \frac{\partial g(a)}{\partial y} \), \( \displaystyle \frac{\partial g(a)}{\partial z} \) jest różna od zera. Zagadnienie można sprowadzić do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej
\( \displaystyle \Phi(x,y,z): =f(x,y,z)-\lambda g(x,y,z), \)
gdzie stałą \( \displaystyle \lambda \) wyznaczamy z układu równań
\( \displaystyle \left\{\begin{align*} d_{(x,y,z)}\Phi=0 \\ g(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle\frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle\frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle\frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} \\ & \displaystyle (x,y,z)=0.\end{align*} \right. \)
Przykład 9.23.
Powróćmy do zadania polegającego na wyznaczeniu najmniejszej i największej wartości funkcji \( \displaystyle f(x,y,z)=x -2y +2z \) na sferze \( \displaystyle x^2+y^2+z^2=1 \). Rozwiążemy je metodą mnożników Lagrange'a opisaną w poprzednich uwagach. Dana sfera jest poziomicą zerową funkcji \( \displaystyle g(x,y,z)=x^2+y^2+z^2-1 \). Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech \( \displaystyle \Phi(x,y,z)=f(x,y,z)-\lambda g(x,y,z) \). Rozwiązujemy układ równań
\( \displaystyle \left\{\begin{align*} & \displaystyle \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} \\ & \displaystyle g(x,y,z)=0\end{align*}\right . \text{ czyli } \left\{\begin{align*} & \displaystyle 1=2\lambda x \\ & \displaystyle-2=2\lambda y \\ & \displaystyle 2=2\lambda z \\ & \displaystyle x^2+y^2+z^2=1. \end{align*} \right. \)
Układ ten spełniają liczby
\( \displaystyle x=-\frac{1}{3},y=\frac{2}{3}, z=-\frac{2}{3}, \lambda=-\frac{3}{2} \)
oraz
\( \displaystyle x=\frac{1}{3}, y=-\frac{2}{3}, z=\frac{2}{3}, \lambda=\frac{3}{2}. \)
Ponieważ sfera jest zbiorem zwartym, wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je, gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, w jednym z tych dwóch punktów funkcja \( \displaystyle f \) musi osiągać kres dolny, a w drugim kres górny wartości na sferze \( \displaystyle \{g=0\} \). Mamy
\( \displaystyle f\big(-\frac{1}{3}, \frac{2}{3}, -\frac{2}{3} \big)=-3, \ \ f\big(\frac{1}{3}, -\frac{2}{3}, \frac{2}{3} \big)=3, \)
czyli \( \displaystyle f \) osiąga w pierwszym z tych punktów wartość najmniejszą równą \( \displaystyle -3 \), a w drugim punkcie - wartość największą na sferze równą \( \displaystyle 3 \).
Uwaga 9.24.
Jeśli funkcja \( \displaystyle F: \mathbb{R}^3\mapsto \mathbb{R} \), zaś \( \displaystyle G:\mathbb{R}^3\mapsto \mathbb{R}^2 \), zagadnienie znalezienia ekstremów warunkowych funkcji \( \displaystyle F \) przy warunku \( \displaystyle \{G=0\} \) sprowadza się do znalezienia punktów zbioru \( \displaystyle \{G=0\} \), w których zeruje się różniczka funkcji \( \displaystyle \Phi(x,y,z):=F(x,y,z)-\Lambda \circ G(x,y,z) \). Funkcjonał Lagrange'a \( \displaystyle \Lambda \) w tym przypadku jest odwzorowaniem liniowym z \( \displaystyle \mathbb{R}^2\mapsto \mathbb{R} \), jest więc reprezentowany przez macierz złożoną z dwóch liczb: \( \displaystyle \lambda_1 \), \( \displaystyle \lambda_2 \). Funkcja \( \displaystyle G=(g_1, g_2) \) jest zestawieniem dwóch funkcji \( \displaystyle g_1, g_2 \) o wartościach rzeczywistych, stąd
\( \displaystyle \Phi(x,y,z)=F(x,y,z)-\Lambda G(x,y,z)=F(x,y,z)-\lambda_1 g_1 (x,y,z)-\lambda_2 g_2 (x,y,z). \)
Metoda mnożników Lagrange'a sprowadza się więc do znalezienia rozwiązań układu równań
\( \displaystyle \left\{\begin{align*} d_{(x,y,z)}\Phi=0 \\ G(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle\frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} \\ & \displaystyle\frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y} \\ & \displaystyle\frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} \\ & \displaystyle g_1(x,y,z)=0 \\ & \displaystyle g_2(x,y,z)=0\end{align*} \right. \)
w punktach regularnych poziomicy \( \displaystyle \{G=0\} \), czyli tych, w których rząd różniczki \( \displaystyle d_{(x,y,z)}G \) jest maksymalny (tj. równy \( \displaystyle 2 \), gdyż różniczka \( \displaystyle d_{(x,y,z)}G \) jest odwzorowaniem liniowym z \( \displaystyle \mathbb{R}^3 \) do \( \displaystyle \mathbb{R}^2 \)). Zwróćmy uwagę, że funkcja \( \displaystyle F \) może osiągać ekstremum w punktach, które należą do poziomicy \( \displaystyle \{G=0\} \) a nie są regularne. Metoda mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu ekstremum.
Przykład 9.25.
Wyznaczmy najmniejszą i największą wartość funkcji
\( \displaystyle F(x,y,z)=x-y-2z \)
na przecięciu się dwóch walców
\( \displaystyle x^2+z^2=1, \ \ y^2+z^2=1. \)
Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym, gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem zwartym (gdyż jest zbiorem domkniętym i ograniczonym, zawartym między innymi w sześcianie \( \displaystyle [-1,1]\times [-1,1]\times [-1,1] \)). Podany warunek można opisać za pomocą poziomicy zerowej funkcji \( \displaystyle G(x,y,z)=(x^2+z^2-1, y^2+z^2-1) \). Zbadaliśmy już, że spośród punktów poziomicy \( \displaystyle \{G=0\} \) tylko dwa nie są regularne: \( \displaystyle (0,0, 1) \) oraz \( \displaystyle (0,0,-1) \). Poza tymi dwoma punktami możemy zastosować metodę mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań układu równań:
\( \displaystyle \left\{\begin{align*} & \displaystyle \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} \\ & \displaystyle \frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y} \\ & \displaystyle \frac{\partial f}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} \\ & \displaystyle g_1(x,y,z)=0 \\ & \displaystyle g_2(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle 1=2\lambda_1 x \\ & \displaystyle -1=2\lambda_2 y \\ & \displaystyle-2=2(\lambda_1+\lambda_2)z \\ & \displaystyle x^2+z^2-1=0 \\ & \displaystyle y^2+z^2-1=0. \end{align*}\right. \)
Układ ten ma dwa rozwiązania
\( \displaystyle -x=y=z=\frac{\sqrt{2}}{2}, \text{ przy czym } \lambda_1=\lambda_2=-\frac{\sqrt{2}}{2} \)
oraz
\( \displaystyle x=-y=-z=\frac{\sqrt{2}}{2}, \text{ przy czym } \lambda_1=\lambda_2=\frac{\sqrt{2}}{2}. \)
Wartość funkcji \( \displaystyle F \) w tych punktach wynosi
\( \displaystyle F\big(-\frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}\big)=-2\sqrt{2} \text{ oraz } F\big(\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}\big)=2\sqrt{2}. \)
W obu punktach nieregularnych poziomicy \( \displaystyle \{G=0\} \) mamy
\( \displaystyle F(0,0,-1)=2 \text{ oraz } F(0,0,1)=-2. \)
Po porównaniu tych wartości: \( \displaystyle -2\sqrt{2} < -2 < 2 < 2\sqrt{2} \) stwierdzamy, że największą wartość na na poziomicy \( \displaystyle \{G=0\} \) równą \( \displaystyle 2\sqrt{2} \) funkcja \( \displaystyle F \) osiąga w punkcie \( \displaystyle (\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}, -\frac{\sqrt{2}}{2}) \), a najmniejszą, równą \( \displaystyle -2\sqrt{2} \), w punkcie \( \displaystyle (-\frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}, \frac{\sqrt{2}}{2}). \)