Loading [MathJax]/jax/output/HTML-CSS/jax.js

Ekstrema warunkowe. Metoda mnożników Lagrange'a

Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym otwartym podzbiorze U przestrzeni unormowanej X (przy czym w praktycznych przykładach zajmowaliśmy się przykładami, gdy X=Rn, n=1,2,3,). Równie ważne z praktycznego punktu widzenia są także rozważania polegające na wyznaczaniu ekstremów funkcji F:XR zacieśnionej do zbioru, który nie jest otwarty w X.

Przykład 9.16.

Wyznaczmy najmniejszą i największą wartość funkcji

F(x,y,z)=x2y+2z
na sferze

x2+y2+z2=1.

Sfera ta jest zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję ciągłą wnioskujemy, że wielomian F(x,y,z)=x2y+2z osiąga na tej sferze zarówno wartość najmniejszą, jak i największą. Nasze dotychczasowe doświadczenie podpowiada nam, że zadanie można by sprowadzić do badania funkcji dwóch zmiennych np. poprzez odwikłanie zmiennej

z(x,y)=1x2y2 lub z(x,y)=1x2y2

z równania sfery i zbadania funkcji dwóch zmiennych (x,y) danych w kole x2+y2<1 wzorami:

f1:(x,y)F(x,y,1x2y2)=x2y+21x2y2,

f2:(x,y)F(x,y,1x2y2)=x2y21x2y2.

Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości ekstremalnych funkcji F na danej sferze.

Podamy jednak pewną metodę, która pozwala wyznaczać ekstremum funkcji F:XR zacieśnionej do poziomicy zerowej {G=0} pewnej funkcji G:XY również w przypadku, gdy odwikłanie zmiennej z równania G=0 nie jest tak proste jak w podanym przykładzie.

Sprecyzujmy jednak wpierw problem.

Niech X,Y będą przestrzeniami Banacha i niech G:XY, F:XR będą funkcjami.

Definicja 9.17.

Mówimy, że funkcja F osiąga ekstremum warunkowe w punkcie a przy warunku a{G=0}, jeśli zacieśnienie funkcji F do poziomicy {G=0} osiąga ekstremum w tym punkcie. Prawdziwe jest następujące twierdzenie, które stanowi podstawę metody mnożników Lagrange'a.

Niech X,Y będą przestrzeniami Banacha.

Twierdzenie 9.18.

Niech F:XR, G:XY będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego a poziomicy {G=0} (co - przypomnijmy - oznacza, że różniczka daG jest suriekcją przestrzeni X na Y). Jeśli funkcja F osiąga ekstremum warunkowe w punkcie regularnym a poziomicy zerowej funkcji G, to istnieje funkcjonał liniowy i ciągły Λ:YR taki, że zachodzi równość daF=ΛdaG.

Prawdziwe jest również twierdzenie, które na podstawie określoności drugiej różniczki pozwala stwierdzić, czy funkcja F osiąga minimum, czy maksimum warunkowe w punkcie a{G=0}.

Twierdzenie 9.19.

Niech F:XR, G:XY będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu regularnego a poziomicy {G=0}. Jeśli istnieje funkcjonał liniowy i ciągły Λ:YR taki, że zachodzi równość daF=ΛdaG oraz forma kwadratowa

Xh(d2aFΛd2aG)(h,h)R

jest dodatnio określona (odpowiednio: ujemnie określona) na podprzestrzeni X1:={hX,daG(h)=0} przestrzeni X, to funkcja F osiąga w punkcie a minimum (odpowiednio: maksimum) warunkowe.

Definicja 9.20.

Funkcjonał Λ, który występuje w wypowiedzi obu powyższych twierdzeń, nazywamy funkcjonałem Lagrange'a.

Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku Krzysztofa Maurina, Analiza. Część I. Elementy, Państwowe Wydawnictwo Naukowe, Warszawa 1977). Podamy jednak interpretację tego twierdzenia w kilku najczęściej spotykanych sytuacjach.

Uwaga 9.21.

Jeśli f,g:R2R są funkcjami różniczkowalymi, problem znalezienia ekstremum warunkowego funkcji f przy warunku {g=0} sprowadza się do znalezienia punktu a na poziomicy {g=0} oraz stałej λ, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane, to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy Λ:RR dany wzorem Λ(x)=λx taki, że różniczka daf=λdag, o ile punkt a jest punktem regularnym poziomicy {g=0}. Przypomnijmy, że w przypadku, gdy g:R2R, punkt a jest regularny, jeśli rząd różniczki

dag=g(a)xdx+g(a)ydy

wynosi 1. Wystarczy więc sprawdzić, czy w punkcie a różniczka dag0, czyli czy którakolwiek pochodna cząstkowa g(a)x lub g(a)y jest różna od zera. Zagadnienie sprowadza się do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej

Φ(x,y):=f(x,y)λg(x,y),

gdzie stałą λ (nazywaną tradycyjnie mnożnikiem Lagrange'a) wyznaczamy z układu równań

\displaystyle  \left\{\begin{align*} d_{(x,y)}\Phi=0 \\ g(x,y)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*}   &  \displaystyle \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x}  \\  &  \displaystyle \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y}  \\  &  \displaystyle (x,y)=0.\end{align*} \right.

Uwaga 9.22.

Jeśli f,g:R3R są funkcjami różniczkowalnymi, problem znalezienia ekstremum warunkowego funkcji f przy warunku {g=0} sprowadza się do znalezienia - podobnie jak w poprzednim przypadku - punktu a na poziomicy {g=0} oraz stałej λ, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy Λ:RR dany wzorem Λ(x)=λx, taki, że różniczka daf=λdag, o ile punkt a jest punktem regularnym poziomicy {g=0}. Przypomnijmy, że w przypadku, gdy g:R3R punkt a jest regularny, jeśli rząd dag (odwzorowania liniowego z R3 do R) jest maksymalny, czyli wynosi 1. Wystarczy więc sprawdzić, czy w punkcie a różniczka

dag=g(a)xdx+g(a)ydy+g(a)zdz
nie zeruje się, czyli czy któraś z pochodnych cząstkowych g(a)x, g(a)y, g(a)z jest różna od zera. Zagadnienie można sprowadzić do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej

Φ(x,y,z):=f(x,y,z)λg(x,y,z),

gdzie stałą λ wyznaczamy z układu równań

\displaystyle  \left\{\begin{align*} d_{(x,y,z)}\Phi=0 \\ g(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*}   &  \displaystyle\frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x}  \\   &  \displaystyle\frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y}  \\   &  \displaystyle\frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z}  \\   &  \displaystyle (x,y,z)=0.\end{align*} \right.

Przykład 9.23.

Powróćmy do zadania polegającego na wyznaczeniu najmniejszej i największej wartości funkcji f(x,y,z)=x2y+2z na sferze x2+y2+z2=1. Rozwiążemy je metodą mnożników Lagrange'a opisaną w poprzednich uwagach. Dana sfera jest poziomicą zerową funkcji g(x,y,z)=x2+y2+z21. Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech Φ(x,y,z)=f(x,y,z)λg(x,y,z). Rozwiązujemy układ równań

\displaystyle  \left\{\begin{align*}  &  \displaystyle \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\   &  \displaystyle \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\   &  \displaystyle \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z}  \\  &  \displaystyle g(x,y,z)=0\end{align*}\right . \text{ czyli }  \left\{\begin{align*}   &  \displaystyle 1=2\lambda x  \\   &  \displaystyle-2=2\lambda y \\   &  \displaystyle 2=2\lambda z \\   &  \displaystyle x^2+y^2+z^2=1. \end{align*} \right.

Układ ten spełniają liczby

x=13,y=23,z=23,λ=32

oraz

x=13,y=23,z=23,λ=32.

Ponieważ sfera jest zbiorem zwartym, wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je, gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, w jednym z tych dwóch punktów funkcja f musi osiągać kres dolny, a w drugim kres górny wartości na sferze {g=0}. Mamy

f(13,23,23)=3,  f(13,23,23)=3,

czyli f osiąga w pierwszym z tych punktów wartość najmniejszą równą 3, a w drugim punkcie - wartość największą na sferze równą 3.

Uwaga 9.24.

Jeśli funkcja F:R3R, zaś G:R3R2, zagadnienie znalezienia ekstremów warunkowych funkcji F przy warunku {G=0} sprowadza się do znalezienia punktów zbioru {G=0}, w których zeruje się różniczka funkcji Φ(x,y,z):=F(x,y,z)ΛG(x,y,z). Funkcjonał Lagrange'a Λ w tym przypadku jest odwzorowaniem liniowym z R2R, jest więc reprezentowany przez macierz złożoną z dwóch liczb: λ1, λ2. Funkcja G=(g1,g2) jest zestawieniem dwóch funkcji g1,g2 o wartościach rzeczywistych, stąd

Φ(x,y,z)=F(x,y,z)ΛG(x,y,z)=F(x,y,z)λ1g1(x,y,z)λ2g2(x,y,z).

Metoda mnożników Lagrange'a sprowadza się więc do znalezienia rozwiązań układu równań

\displaystyle  \left\{\begin{align*} d_{(x,y,z)}\Phi=0 \\ G(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*}   &  \displaystyle\frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x}  \\   &  \displaystyle\frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y}  \\   &  \displaystyle\frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z}  \\   &  \displaystyle g_1(x,y,z)=0  \\   &  \displaystyle g_2(x,y,z)=0\end{align*} \right.

w punktach regularnych poziomicy {G=0}, czyli tych, w których rząd różniczki d(x,y,z)G jest maksymalny (tj. równy 2, gdyż różniczka d(x,y,z)G jest odwzorowaniem liniowym z R3 do R2). Zwróćmy uwagę, że funkcja F może osiągać ekstremum w punktach, które należą do poziomicy {G=0} a nie są regularne. Metoda mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu ekstremum.

Przykład 9.25.

Wyznaczmy najmniejszą i największą wartość funkcji

F(x,y,z)=xy2z

na przecięciu się dwóch walców

x2+z2=1,  y2+z2=1.

Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym, gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem zwartym (gdyż jest zbiorem domkniętym i ograniczonym, zawartym między innymi w sześcianie [1,1]×[1,1]×[1,1]). Podany warunek można opisać za pomocą poziomicy zerowej funkcji G(x,y,z)=(x2+z21,y2+z21). Zbadaliśmy już, że spośród punktów poziomicy {G=0} tylko dwa nie są regularne: (0,0,1) oraz (0,0,1). Poza tymi dwoma punktami możemy zastosować metodę mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań układu równań:

\displaystyle  \left\{\begin{align*}  &  \displaystyle \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x}  \\   &  \displaystyle \frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y}  \\   &  \displaystyle \frac{\partial f}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z}  \\   &  \displaystyle g_1(x,y,z)=0  \\   &  \displaystyle g_2(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*}   &  \displaystyle 1=2\lambda_1 x \\   &  \displaystyle -1=2\lambda_2 y \\    &  \displaystyle-2=2(\lambda_1+\lambda_2)z \\    &  \displaystyle x^2+z^2-1=0 \\   &  \displaystyle y^2+z^2-1=0. \end{align*}\right.

Układ ten ma dwa rozwiązania

x=y=z=22, przy czym λ1=λ2=22

oraz

x=y=z=22, przy czym λ1=λ2=22.

Wartość funkcji F w tych punktach wynosi

F(22,22,22)=22 oraz F(22,22,22)=22.

W obu punktach nieregularnych poziomicy {G=0} mamy

F(0,0,1)=2 oraz F(0,0,1)=2.

Po porównaniu tych wartości: 22<2<2<22 stwierdzamy, że największą wartość na na poziomicy {G=0} równą 22 funkcja F osiąga w punkcie (22,22,22), a najmniejszą, równą 22, w punkcie (22,22,22).