Dotychczas wyznaczaliśmy ekstrema funkcji określonej w pewnym otwartym podzbiorze U przestrzeni unormowanej X (przy czym w praktycznych przykładach zajmowaliśmy się przykładami, gdy X=Rn, n=1,2,3,…). Równie ważne z praktycznego punktu widzenia są także rozważania polegające na wyznaczaniu ekstremów funkcji F:X↦R zacieśnionej do zbioru, który nie jest otwarty w X.
Przykład 9.16.
Wyznaczmy najmniejszą i największą wartość funkcji
F(x,y,z)=x−2y+2z
na sferze
x2+y2+z2=1.
Sfera ta jest zbiorem domkniętym i ograniczonym, jest więc zwarta. Stąd na na mocy twierdzenia Weierstassa o osiąganiu kresów przez funkcję ciągłą wnioskujemy, że wielomian F(x,y,z)=x−2y+2z osiąga na tej sferze zarówno wartość najmniejszą, jak i największą. Nasze dotychczasowe doświadczenie podpowiada nam, że zadanie można by sprowadzić do badania funkcji dwóch zmiennych np. poprzez odwikłanie zmiennej
z(x,y)=√1−x2−y2 lub z(x,y)=−√1−x2−y2
z równania sfery i zbadania funkcji dwóch zmiennych (x,y) danych w kole x2+y2<1 wzorami:
f1:(x,y)↦F(x,y,√1−x2−y2)=x−2y+2√1−x2−y2,
f2:(x,y)↦F(x,y,−√1−x2−y2)=x−2y−2√1−x2−y2.
Niezbyt skomplikowane (choć nieco żmudne rachunki) prowadzą do wyznaczenia ekstremów tych funkcji, a co za tym idzie: wartości ekstremalnych funkcji F na danej sferze.
Podamy jednak pewną metodę, która pozwala wyznaczać ekstremum funkcji F:X↦R zacieśnionej do poziomicy zerowej {G=0} pewnej funkcji G:X↦Y również w przypadku, gdy odwikłanie zmiennej z równania G=0 nie jest tak proste jak w podanym przykładzie.
Sprecyzujmy jednak wpierw problem.
Niech X,Y będą przestrzeniami Banacha i niech G:X↦Y, F:X↦R będą funkcjami.
Definicja 9.17.
Mówimy, że funkcja F osiąga ekstremum warunkowe w punkcie a przy warunku a∈{G=0}, jeśli zacieśnienie funkcji F do poziomicy {G=0} osiąga ekstremum w tym punkcie. Prawdziwe jest następujące twierdzenie, które stanowi podstawę metody mnożników Lagrange'a.
Niech X,Y będą przestrzeniami Banacha.
Twierdzenie 9.18.
Niech F:X↦R, G:X↦Y będą funkcjami różniczkowalnymi w otoczeniu punktu regularnego a poziomicy {G=0} (co - przypomnijmy - oznacza, że różniczka daG jest suriekcją przestrzeni X na Y). Jeśli funkcja F osiąga ekstremum warunkowe w punkcie regularnym a poziomicy zerowej funkcji G, to istnieje funkcjonał liniowy i ciągły Λ:Y↦R taki, że zachodzi równość daF=Λ∘daG.
Prawdziwe jest również twierdzenie, które na podstawie określoności drugiej różniczki pozwala stwierdzić, czy funkcja F osiąga minimum, czy maksimum warunkowe w punkcie a∈{G=0}.
Twierdzenie 9.19.
Niech F:X↦R, G:X↦Y będą funkcjami dwukrotnie różniczkowalnymi w otoczeniu punktu regularnego a poziomicy {G=0}. Jeśli istnieje funkcjonał liniowy i ciągły Λ:Y↦R taki, że zachodzi równość daF=Λ∘daG oraz forma kwadratowa
X∋h↦(d2aF−Λ∘d2aG)(h,h)∈R
jest dodatnio określona (odpowiednio: ujemnie określona) na podprzestrzeni X1:={h∈X,daG(h)=0} przestrzeni X, to funkcja F osiąga w punkcie a minimum (odpowiednio: maksimum) warunkowe.
Definicja 9.20.
Funkcjonał Λ, który występuje w wypowiedzi obu powyższych twierdzeń, nazywamy funkcjonałem Lagrange'a.
Dowody obu twierdzeń pomijamy (można je znaleźć np. w podręczniku Krzysztofa Maurina, Analiza. Część I. Elementy, Państwowe Wydawnictwo Naukowe, Warszawa 1977). Podamy jednak interpretację tego twierdzenia w kilku najczęściej spotykanych sytuacjach.
Uwaga 9.21.
Jeśli f,g:R2↦R są funkcjami różniczkowalymi, problem znalezienia ekstremum warunkowego funkcji f przy warunku {g=0} sprowadza się do znalezienia punktu a na poziomicy {g=0} oraz stałej λ, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane, to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy Λ:R↦R dany wzorem Λ(x)=λx taki, że różniczka daf=λdag, o ile punkt a jest punktem regularnym poziomicy {g=0}. Przypomnijmy, że w przypadku, gdy g:R2↦R, punkt a jest regularny, jeśli rząd różniczki
dag=∂g(a)∂xdx+∂g(a)∂ydy
wynosi 1. Wystarczy więc sprawdzić, czy w punkcie a różniczka dag≠0, czyli czy którakolwiek pochodna cząstkowa ∂g(a)∂x lub ∂g(a)∂y jest różna od zera. Zagadnienie sprowadza się do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej
Φ(x,y):=f(x,y)−λg(x,y),
gdzie stałą λ (nazywaną tradycyjnie mnożnikiem Lagrange'a) wyznaczamy z układu równań
\displaystyle \left\{\begin{align*} d_{(x,y)}\Phi=0 \\ g(x,y)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle (x,y)=0.\end{align*} \right.
Uwaga 9.22.
Jeśli f,g:R3↦R są funkcjami różniczkowalnymi, problem znalezienia ekstremum warunkowego funkcji f przy warunku {g=0} sprowadza się do znalezienia - podobnie jak w poprzednim przypadku - punktu a na poziomicy {g=0} oraz stałej λ, która reprezentuje funkcjonał Lagrange'a. Jeśli bowiem ekstremum to jest realizowane to - zgodnie z podanym twierdzeniem - istnieje funkcjonał liniowy Λ:R↦R dany wzorem Λ(x)=λx, taki, że różniczka daf=λdag, o ile punkt a jest punktem regularnym poziomicy {g=0}. Przypomnijmy, że w przypadku, gdy g:R3↦R punkt a jest regularny, jeśli rząd dag (odwzorowania liniowego z R3 do R) jest maksymalny, czyli wynosi 1. Wystarczy więc sprawdzić, czy w punkcie a różniczka
dag=∂g(a)∂xdx+∂g(a)∂ydy+∂g(a)∂zdz
nie zeruje się, czyli czy któraś z pochodnych cząstkowych ∂g(a)∂x, ∂g(a)∂y, ∂g(a)∂z jest różna od zera. Zagadnienie można sprowadzić do znalezienia punktów, w których zeruje się różniczka funkcji pomocniczej
Φ(x,y,z):=f(x,y,z)−λg(x,y,z),
gdzie stałą λ wyznaczamy z układu równań
\displaystyle \left\{\begin{align*} d_{(x,y,z)}\Phi=0 \\ g(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle\frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle\frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle\frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} \\ & \displaystyle (x,y,z)=0.\end{align*} \right.
Przykład 9.23.
Powróćmy do zadania polegającego na wyznaczeniu najmniejszej i największej wartości funkcji f(x,y,z)=x−2y+2z na sferze x2+y2+z2=1. Rozwiążemy je metodą mnożników Lagrange'a opisaną w poprzednich uwagach. Dana sfera jest poziomicą zerową funkcji g(x,y,z)=x2+y2+z2−1. Wykazaliśmy już, że każdy punkt sfery jest regularny. Niech Φ(x,y,z)=f(x,y,z)−λg(x,y,z). Rozwiązujemy układ równań
\displaystyle \left\{\begin{align*} & \displaystyle \frac{\partial f}{\partial x}=\lambda \frac{\partial g}{\partial x} \\ & \displaystyle \frac{\partial f}{\partial y}=\lambda \frac{\partial g}{\partial y} \\ & \displaystyle \frac{\partial f}{\partial z}=\lambda \frac{\partial g}{\partial z} \\ & \displaystyle g(x,y,z)=0\end{align*}\right . \text{ czyli } \left\{\begin{align*} & \displaystyle 1=2\lambda x \\ & \displaystyle-2=2\lambda y \\ & \displaystyle 2=2\lambda z \\ & \displaystyle x^2+y^2+z^2=1. \end{align*} \right.
Układ ten spełniają liczby
x=−13,y=23,z=−23,λ=−32
oraz
x=13,y=−23,z=23,λ=32.
Ponieważ sfera jest zbiorem zwartym, wystarczy wyznaczyć wartości funkcji w obu punktach i porównać je, gdyż zgodnie z twierdzeniem Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym, w jednym z tych dwóch punktów funkcja f musi osiągać kres dolny, a w drugim kres górny wartości na sferze {g=0}. Mamy
f(−13,23,−23)=−3, f(13,−23,23)=3,
czyli f osiąga w pierwszym z tych punktów wartość najmniejszą równą −3, a w drugim punkcie - wartość największą na sferze równą 3.
Uwaga 9.24.
Jeśli funkcja F:R3↦R, zaś G:R3↦R2, zagadnienie znalezienia ekstremów warunkowych funkcji F przy warunku {G=0} sprowadza się do znalezienia punktów zbioru {G=0}, w których zeruje się różniczka funkcji Φ(x,y,z):=F(x,y,z)−Λ∘G(x,y,z). Funkcjonał Lagrange'a Λ w tym przypadku jest odwzorowaniem liniowym z R2↦R, jest więc reprezentowany przez macierz złożoną z dwóch liczb: λ1, λ2. Funkcja G=(g1,g2) jest zestawieniem dwóch funkcji g1,g2 o wartościach rzeczywistych, stąd
Φ(x,y,z)=F(x,y,z)−ΛG(x,y,z)=F(x,y,z)−λ1g1(x,y,z)−λ2g2(x,y,z).
Metoda mnożników Lagrange'a sprowadza się więc do znalezienia rozwiązań układu równań
\displaystyle \left\{\begin{align*} d_{(x,y,z)}\Phi=0 \\ G(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle\frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} \\ & \displaystyle\frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y} \\ & \displaystyle\frac{\partial F}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} \\ & \displaystyle g_1(x,y,z)=0 \\ & \displaystyle g_2(x,y,z)=0\end{align*} \right.
w punktach regularnych poziomicy {G=0}, czyli tych, w których rząd różniczki d(x,y,z)G jest maksymalny (tj. równy 2, gdyż różniczka d(x,y,z)G jest odwzorowaniem liniowym z R3 do R2). Zwróćmy uwagę, że funkcja F może osiągać ekstremum w punktach, które należą do poziomicy {G=0} a nie są regularne. Metoda mnożników Lagrange'a nie rozstrzyga w tym przypadku o istnieniu ekstremum.
Przykład 9.25.
Wyznaczmy najmniejszą i największą wartość funkcji
F(x,y,z)=x−y−2z
na przecięciu się dwóch walców
x2+z2=1, y2+z2=1.
Zauważmy, że każdy z walców z osobna nie jest zbiorem zwartym, gdyż nie jest ograniczony, lecz ich przecięcie jest zbiorem zwartym (gdyż jest zbiorem domkniętym i ograniczonym, zawartym między innymi w sześcianie [−1,1]×[−1,1]×[−1,1]). Podany warunek można opisać za pomocą poziomicy zerowej funkcji G(x,y,z)=(x2+z2−1,y2+z2−1). Zbadaliśmy już, że spośród punktów poziomicy {G=0} tylko dwa nie są regularne: (0,0,1) oraz (0,0,−1). Poza tymi dwoma punktami możemy zastosować metodę mnożników Lagrange'a, która sprowadza się do wyznaczenia rozwiązań układu równań:
\displaystyle \left\{\begin{align*} & \displaystyle \frac{\partial F}{\partial x}=\lambda_1 \frac{\partial g_1}{\partial x}+\lambda_2 \frac{\partial g_2}{\partial x} \\ & \displaystyle \frac{\partial F}{\partial y}=\lambda_1 \frac{\partial g_1}{\partial y}+\lambda_2 \frac{\partial g_2}{\partial y} \\ & \displaystyle \frac{\partial f}{\partial z}=\lambda_1 \frac{\partial g_1}{\partial z} +\lambda_2 \frac{\partial g_2}{\partial z} \\ & \displaystyle g_1(x,y,z)=0 \\ & \displaystyle g_2(x,y,z)=0\end{align*} \right. \text{ czyli } \left\{\begin{align*} & \displaystyle 1=2\lambda_1 x \\ & \displaystyle -1=2\lambda_2 y \\ & \displaystyle-2=2(\lambda_1+\lambda_2)z \\ & \displaystyle x^2+z^2-1=0 \\ & \displaystyle y^2+z^2-1=0. \end{align*}\right.
Układ ten ma dwa rozwiązania
−x=y=z=√22, przy czym λ1=λ2=−√22
oraz
x=−y=−z=√22, przy czym λ1=λ2=√22.
Wartość funkcji F w tych punktach wynosi
F(−√22,√22,√22)=−2√2 oraz F(√22,−√22,−√22)=2√2.
W obu punktach nieregularnych poziomicy {G=0} mamy
F(0,0,−1)=2 oraz F(0,0,1)=−2.
Po porównaniu tych wartości: −2√2<−2<2<2√2 stwierdzamy, że największą wartość na na poziomicy {G=0} równą 2√2 funkcja F osiąga w punkcie (√22,−√22,−√22), a najmniejszą, równą −2√2, w punkcie (−√22,√22,√22).