Rozważamy zagadnienie wariacyjne polegające na wyznaczeniu ekstremów funkcjonału danych za pomocą całki $\displaystyle J[f]=\int_a^b L(f,f', t)dt$ w klasie funkcji $\displaystyle f$ różniczkowalnych o ciągłej i ograniczonej pochodnej na przedziale $\displaystyle [a,b]$ . Wyprowadzamy równanie Lagrange'a-Eulera (równanie ekstremali funkcjonału $\displaystyle J$ ). Analizujemy trzy klasyczne zagadnienia wariacyjne (o najmniejszej powierzchni obrotowej, zagadnienie brachistochrony i zagadnienie izoperymetryczne).

Przypomnijmy fakt znany z teorii całki oznaczonej funkcji jednej zmiennej.

Uwaga 15.1.

Jeśli $\displaystyle \gamma: [\alpha,\beta]\ni t\mapsto (x(t), y(t))\in \mathbb{R}^2$ jest parametryzacją klasy $\displaystyle C^1$ pewnej krzywej $\displaystyle \gamma$ na płaszczyźnie, to długość tej krzywej wyraża całka oznaczona:

$\displaystyle l=l(\gamma)=\int_\alpha^\beta\sqrt{(x'(t))^2+(y'(t))^2}dt,$ która w szczególnym przypadku, gdy krzywa $\displaystyle \gamma : [a,b]\ni x\mapsto(x, f(x))$ jest wykresem funkcji zmiennej $\displaystyle x$ , przyjmuje postać

$\displaystyle l= \int_a^b \sqrt{(1+(f'(x))^2}dx.$

Na pytanie o kształt najkrótszej krzywej łączącej dwa wyróżnione punkty na płaszczyźnie, np. $\displaystyle A=(x_A, y_A)$ , $\displaystyle B=(x_B, y_B)$ , każdy natychmiast odpowiada: to odcinek prostej o podanych końcach:

$\displaystyle \{(1-t)A+Bt, t\in[0,1]\}:=\{(x,y)\in \mathbb{R}^2 : x(t)=(1-t)x_A+tx_B, (t)=(1-t)y_A+ty_B\}.$

Intuicja podpowiada nam też, że wskazany odcinek prostej jest jedynym rozwiązaniem postawionego problemu; każda inna krzywa łącząca punkty $\displaystyle A$ i $\displaystyle B$ jest dłuższa. Nikt też nie ma wątpliwości, że całka wyrażająca długość krzywej $\displaystyle \gamma$ łączącej wskazane punkty, może być dowolnie duża, gdyż od punktu $\displaystyle A$ do $\displaystyle B$ możemy wędrować po dowolnie długiej krzywej.

Rozważmy kolejny przykład. Pamiętamy, że

Uwaga 15.2.

Pole powierzchni powstałej z obrotu krzywej $\displaystyle \gamma: [\alpha,\beta]\ni t\mapsto (x(t), y(t))\in \mathbb{R}^2$ dookoła osi rzędnych wyraża całka oznaczona

$\displaystyle S=S(\gamma)=2\pi \int_\alpha^\beta |y(t)|\sqrt{(x'(t))^2+(y'(t))^2}dt,$

która w szczególnym przypadku, gdy krzywa $\displaystyle \gamma : [a,b]\ni x\mapsto(x, f(x))$ jest wykresem funkcji zmiennej $\displaystyle x$ , przyjmuje postać

$\displaystyle S=2\pi \int_a^b |f(x)|\sqrt{(1+(f'(x))^2}dx.$

Przykład 15.3.

Bryłą powstałą z obrotu dookoła osi $\displaystyle Ox$ okręgu $\displaystyle x(t)=r \cos t$ , $\displaystyle y(t)=R+r \sin t$ , gdzie $\displaystyle R>r$ , jest torus o polu

$\displaystyle S=2\pi\int_{0}^{2\pi}(R+r\sin t)\sqrt{r^2(\sin^2 t+\cos^2 t)}dt=4\pi^2 rR.$

wykres

Zapytani o kształt krzywej, która w wyniku obrotu daje najmniejsze pole wśród wszystkich krzywych zaczepionych na końcach przedziału w tych samych punktach, przeważnie odpowiadamy (czerpiąc intuicję z przykładów płaskich), że to powierzchnia powstała z obrotu odcinka prostej, czyli pobocznica stożka. Jednak chwila refleksji i wspomnienie zabaw z bańkami mydlanymi każe nam zrewidować to przypuszczenie. Bańka mydlana, dzięki siłom napięcia powierzchniowego przyjmuje kształt taki, aby jej pole było możliwie najmniejsze. Rozpięta na dwóch obręczach nigdy nie przyjmie kształtu pobocznicy stożka. Czy kształt bańki rozpiętej na dwóch obręczach można opisać za pomocą wzoru?

Rozważmy bardziej ogólne zadanie. Niech

$\displaystyle J[f]:=\int_{a}^{b} L(f, f', t)dt$

będzie całką zależną od pewnej funkcji $\displaystyle f$ klasy $\displaystyle C^1$ na odcinku o ograniczonej pierwszej pochodnej, gdzie $\displaystyle L:\mathbb{R}^3\mapsto \mathbb{R}$ jest pewną funkcją o ciągłych pochodnych cząstkowych. Stawiamy problem polegający na znalezieniu takiej funkcji $\displaystyle f$ , aby wartość całki $\displaystyle J[f]$ była ekstremalna (tj. najmniejsza albo największa) w zbiorze tych funkcji, których wartości na końcach przedziału $\displaystyle [a,b]$ są takie same.

Niech $\displaystyle C^1 [a,b]$ będzie zbiorem funkcji ciągłych na przedziale $\displaystyle [a,b]$ o ciągłej i ograniczonej pochodnej na przedziale $\displaystyle [a,b]$ (na końcach przedziału zakładamy istnienie skończonych granic jednostronnych pochodnej).

Konsekwencją faktu, że granica jednostajnie zbieżnego ciągu funkcji ciągłych jest funkcją ciągłą, jest następująca:

rycina

Uwaga 15.4.

Zbiór $\displaystyle C^1 [a,b]$ z normą $\displaystyle \|f\|:=\sup\{|f(t)| : t\in [a,b]\}+ \sup\{|f'(t)| : t\in [a,b]\}$ stanowi przestrzeń Banacha (tj. przestrzeń unormowaną zupełną)

Odwzorowanie

$\displaystyle J : C^1 [a,b] \ni f \mapsto J[f]\in \mathbb{R}$

(które zgodnie z tradycyjną terminologią nazywa się funkcjonałem działającym na przestrzeni funkcji dopuszczalnych $\displaystyle C^1 [a,b]$ ) jest więc określone na przestrzeni Banacha i przyjmuje wartości w zbiorze liczb rzeczywistych (który - przypomnijmy - również jest przestrzenią Banacha z normą równą wartości bezwzględnej liczby). Pamiętamy, że warunkiem koniecznym istnienia ekstremum funkcji różniczkowalnej jest zerowanie się jej różniczki zupełnej (różniczki w sensie Frecheta). Okazuje się, że przy naturalnych założeniach o funkcji $\displaystyle L$ odwzorowanie $\displaystyle f\mapsto J[f]$ jest różniczkowalne. Jesteśmy w stanie wyznaczyć tę różniczkę.

Twierdzenie 15.5.

Jeśli $\displaystyle L:\mathbb{R}^3\supset U\mapsto \mathbb{R}$ jest funkcją określoną na zbiorze otwartym $\displaystyle U$ o ciągłych pochodnych cząstkowych, to odwzorowanie $\displaystyle C^1 [a,b]\ni f\mapsto J[f]\in \mathbb{R}$ jest różniczkowalne w sensie Frecheta w każdym punkcie $\displaystyle f\in C^1 [a,b]$ . Wartość różniczki $\displaystyle d_f J$ na wektorze $\displaystyle h\in C^1 [a,b]$ wynosi

$\displaystyle \begin{align*} d_f J(h)=\int_{a}^b(\frac{\partial L}{\partial x}(f, f', t)h+\frac{\partial L}{\partial y}(f, f', t)h')dt \\ =\int_{a}^b(\frac{\partial L}{\partial x}(f, f', t)h-\frac{d}{dt}\frac{\partial L}{\partial y}(f, f', t)h)dt+[\frac{\partial L}{\partial y}(f, f', t)h]_a^b. \end{align*}$

Definicja 15.6.

Funkcję $\displaystyle (x,y,t)\mapsto L(x,y,t)$ , która określa funkcjonał $\displaystyle J[f]=\int_{a}^b L(f,f',t)dt$ , nazywamy funkcją Lagrange'a.

Dowód

Niech $\displaystyle h\in C^1[a,b]$ będzie przyrostem argumentu funkcjonału $\displaystyle J$ . W dowolnym punkcie $\displaystyle f\in C^1[a,b]$ , wobec ciągłości pochodnych cząstkowych funkcji Lagrange'a, mamy

$\displaystyle \begin{align*} J[f+h]-J[f] & =\int_{a}^{b}\bigg(L(f+h, f'+h', t)-L(f,f', t)\bigg)dt \\ & =\int_a^b\bigg(\frac{\partial L}{\partial x}(f,f', t)h+\frac{\partial L}{\partial y}(f,f', t)h'\bigg)dt+o(\|h\|),\end{align*}$

gdzie $\displaystyle \|h\|=\max|h|+\max|h'|$ . Wynika stąd, że funkcjonał $\displaystyle J$ jest różniczkowalny w sensie Frecheta w każdym punkcie $\displaystyle f$ i jego różniczka $\displaystyle d_f J$ na wektorze $\displaystyle h$ przyjmuje wartość

$\displaystyle d_f J(h)=\int_a^b\bigg(\frac{\partial L}{\partial x}(f,f', t)h+\frac{\partial L}{\partial y}(f,f', t)h'\bigg)dt.$

Całkując przez części drugi składnik tego wyrażenia, dostajemy

$\displaystyle \int_a^b \frac{\partial L}{\partial y}(f,f', t)h'dt=\bigg[\frac{\partial L}{\partial y}(f,f', t)h\bigg]_a^b-\int_a^b \frac{d}{dt}\bigg(\frac{\partial L}{\partial y}(f,f', t)\bigg)hdt.$

Stąd

$\displaystyle d_f J(h)=\int_a^b\bigg(\frac{\partial L}{\partial x}(f,f', t)-\frac{d}{dt}\frac{\partial L}{\partial y}(f,f', t)\bigg)h \,dt+\bigg[\frac{\partial L}{\partial y}(f,f', t)h\bigg]_a^b.$

Rozważmy

$\displaystyle A:=\{f\in C^1 [a,b] : f(a)=y_a, \ f(b)=y_b\}$

rodzinę funkcji z przestrzeni $\displaystyle C^1 [a,b]$ , które na końcach przedziału $\displaystyle [a,b]$ przyjmują ustalone wartości $\displaystyle y_a$ , $\displaystyle y_b$ . Zauważmy, że jeśli $\displaystyle f_1, f_2\in A$ , to również $\displaystyle (1-t)f_1+tf_2\in A$ dla dowolnej liczby rzeczywistej $\displaystyle t$ . Zauważmy, że $\displaystyle A\subset C^1[a,b]$ jest podprzestrzenią afiniczną oraz

$\displaystyle A=f^* +A_0 =\{f^* + f, f\in A_0\},$

gdzie $\displaystyle A_0 =\{f\in C^1 [a,b] : f(a)=f(b)=0\}$ jest podprzestrzenią wektorową przestrzeni $\displaystyle C^1 [a,b]$ , natomiast wektor $\displaystyle f^* (t)=y_a +\frac{t-a}{b-a}(y_b - y_a)$ .

Warto zauważyć, że

Uwaga 15.7.

Zacieśnieniem różniczki $\displaystyle d_f J$ do $\displaystyle A_0$ jest

$\displaystyle A_0\ni h\mapsto \int_{a}^b\big(\frac{\partial L}{\partial x}(f, f', t)h-\frac{d}{dt}\frac{\partial L}{\partial y}(f, f', t)h\big)dt.$

Wynika stąd

rycina

Leonhard Euler (1707-1783)

Wniosek 15.8.

Różniczka $\displaystyle d_f J$ zeruje się na podprzestrzeni afinicznej $\displaystyle A$ wtedy i tylko wtedy, gdy funkcja $\displaystyle f\in A$ spełnia równanie

$\displaystyle \frac{d}{dt}\frac{\partial L}{\partial y}(f, f', t)=\frac{\partial L}{\partial x}(f, f', t).$

Równanie, które występuje w tezie powyższego wniosku, nazywamy równaniem Lagrange'a-Eulera.

Uwaga 15.9.

Gdy funkcjonał dany jest wzorem $\displaystyle J[y]=\int_{a}^b L(y,y',t)dt$ , równanie Lagrange'a-Eulera zapisuje się w uproszczonej notacji

$\displaystyle \frac{d}{dt}\frac{\partial L}{\partial y'}=\frac{\partial L}{\partial y}.$

Zapis ten jednak należy rozumieć tak, jak we wyprowadzonym wzorze, tzn. gdy $\displaystyle (x_1,x_2,x_3)\mapsto L(x_1,x_2,x_3)$ jest funkcją Lagrange'a, to lewa strona $\displaystyle \frac{d}{dt}\frac{\partial L}{\partial y'}$ oznacza wyrażenie, które powstaje z wyznaczenia pochodnej po zmiennej $\displaystyle t$ z podstawienia do pochodnej cząstkowej $\displaystyle \frac{\partial L}{\partial x_2}$ odpowiednio $\displaystyle f,f', t$ za $\displaystyle x_1, x_2, x_3$ . W podobny sposób należy rozumieć też prawą stronę równania: $\displaystyle \frac{\partial L}{\partial y}$ , która oznacza podstawienie do pochodnej $\displaystyle \frac{\partial L}{\partial x_1}$ odpowiednio $\displaystyle f,f', t$ za $\displaystyle x_1, x_2, x_3$ .

Uwaga 15.10.

a) Równanie Lagrange'a-Eulera jest równaniem różniczkowym zwyczajnym rzędu (co najwyżej) drugiego.

b) Jeśli funkcja $\displaystyle L$ nie zależy jawnie od zmiennej $\displaystyle t$ , to równanie Lagrange'a -Eulera jest równoważne równaniu różniczkowemu rzędu (co najwyżej) pierwszego:

$\displaystyle L(f, f', t)-f'\frac{\partial L}{\partial y}(f, f', t)=Const,$

gdzie $\displaystyle Const$ jest dowolną stałą.

Dowód

Obie uwagi wykażemy w ramach ćwiczeń.

Definicja 15.11.

Każde rozwiązanie równania Lagrange'a-Eulera nazywamy ekstremalą funkcjonału $\displaystyle J$ na zbiorze $\displaystyle A$ . Równanie Lagrange'a-Eulera nazywa się też często równaniem ekstremali funkcjonału $\displaystyle J$ . Zagadnienie polegające na wyznaczeniu ekstremów funkcjonału $\displaystyle J$ nazywamy zagadnieniem wariacyjnym. Tradycyjnie wariacją funkcjonału $\displaystyle J$ nazywamy różniczkę $\displaystyle d_f J$ (w sensie Frecheta) funkcjonału $\displaystyle J$ . Funkcjonał $\displaystyle J[f]=\int_a^b L(f, f', t)dt$ nazywa się często (zwłaszcza w mechanice) funkcjonałem działania lub całką działania. Zwróćmy uwagę, że termin ekstremala oznacza punkt $\displaystyle f\in A$ , w którym spełniony jest warunek konieczny istnienia ekstremum funkcjonału $\displaystyle J$ .

Większość praktycznych zagadnień wariacyjnych ma jasną interpretację fizyczną czy geometryczną, z której w oczywisty sposób wynika, że ekstremala (tj. rozwiązanie równania Lagrange'a-Eulera) jest punktem zbioru $\displaystyle A\subset C^1[a,b]$ , w którym funkcjonał $\displaystyle J$ osiąga minimum czy maksimum.

Przykład 15.12.

Wyznaczymy krzywą klasy $\displaystyle C^1$ o końcach $\displaystyle (a, y_a)$ , $\displaystyle (b, y_b)$ , która obracana dokoła osi poziomej tworzy najmniejszą powierzchnię obrotową. Wiemy już, że pole powierzchni obrotowej wyraża całka

$\displaystyle S(y)=2\pi\int_a^b|f(t)|\sqrt{1+(f'(t))^2}dt.$

Wyznaczmy więc ekstremalę tego funkcjonału na $\displaystyle A_0=\{f\in C^1[a,b] : f(a)=y_a, f(b)=y_b\}$ . Funkcja $\displaystyle L(x,y,t)=x\sqrt{1+y^2}$ nie zależy od zmiennej $\displaystyle t$ , stąd równanie równanie Lagrange'a-Eulera jest równoważne równaniu $\displaystyle L(f, f', t)-\frac{\partial L}{\partial y}(f, f', t)=C_1$ , gdzie $\displaystyle C_1$ jest pewną stałą. Równanie to ma więc postać

$\displaystyle f\sqrt{1+(f')^2}-ff'\frac{f'}{\sqrt{1+(f')^2}}=C_1,$

gdzie $\displaystyle C_1$ jest pewną stałą. Po sprowadzeniu do wspólnego mianownika otrzymamy

$\displaystyle \frac{f}{\sqrt{1+(f')^2}}=C_1,$

czyli

$\displaystyle (f')^2+1=\frac{f^2}{C_1^2}.$

Równanie to spełnia rodzina funkcji $\displaystyle f(x)=C_1 \cosh \frac{t-C_2}{C_1}$ , gdzie $\displaystyle C_2$ jest stałą. Stałe $\displaystyle C_1$ i $\displaystyle C_2$ wyznaczamy z warunków zadania, tj.

$\displaystyle \left\{\begin{align*} f(a)=y_a \\ f(b)=y_b\end{align*}\right. \text{ czyli } \left\{\begin{align*} C_1 \cosh \frac{a-C_2}{C_1}=y_a \\ C_1 \cosh \frac{b-C_2}{C_1}=y_b\end{align*}.\right.$

Łatwo sobie wyobrazić, że układ ten może nie mieć rozwiązania. Gdy odległość $\displaystyle |b-a|$ rośnie, powierzchnia powstała z obrotu krzywej $\displaystyle f$ przy ustalonych promieniach $\displaystyle y_a$ , $\displaystyle y_b$ może mieć pole większe niż suma pól kół o tych promieniach, tj. większe niż $\displaystyle \pi (y_a^2 +y_b^2)$ . Jeśli natomiast różnica $\displaystyle b-a$ nie jest zbyt duża, znajdziemy stałe $\displaystyle C_1$ , $\displaystyle C_2$ spełniające warunki zadania. Powierzchnię powstałą z obrotu wykresu funkcji $\displaystyle f(t)=C_1 \cosh \frac{t-C_2}{C_1}$ , $\displaystyle a\leq t\leq b$ , nazywamy katenoidą.

Przykład 15.13.

W polu grawitacyjnym znajdują się dwa punkty $\displaystyle A$ oraz $\displaystyle B$ . Po jakiej krzywej powinien ześlizgiwać się bez tarcia punkt materialny, aby drogę od $\displaystyle A$ do $\displaystyle B$ przebyć w najkrótszym czasie?

Chwila refleksji nad zadaniem przywołuje doświadczenia narciarskie i skłania do przypuszczenia, że wśród różnych tras na ośnieżonym stoku (tarcie nart zaniedbujemy), chcąc zjechać z góry jak najszybciej (co nie oznacza, że najbezpieczniej!), powinniśmy wybrać raczej taką, która jest stroma na początku, aby dobrze się rozpędzić.

Bez straty ogólności możemy przyjąć, że początek trasy znajduje się w punkcie $\displaystyle A=(0,0)$ , tj. w początku układu współrzędnych, którego oś pionową zwracamy na dół (czyli przeciwnie, niż zwykle). Niech $\displaystyle B=(a,b)$ . Jeśli punkt materialny znajdzie się w położeniu $\displaystyle (x,y)$ , to zgodzie z prawem zachowania energii jego energia kinetyczna będzie równa zmianie energii potencjalnej $\displaystyle mgy$ pomiędzy punktem początkowym, który znajduje się na poziomie zerowym a danym punktem na poziomie $\displaystyle y$ , czyli $\displaystyle \frac{1}{2}mv^2= mgy$ , gdzie $\displaystyle m$ jest masą punktu materialnego, a $\displaystyle v(t)=\sqrt{\big(\frac{dx}{dt}\big)^2+\big(\frac{dy}{dt}\big)^2}$ jest jego prędkością. Stąd po zmianie zmiennych $\displaystyle v(t)=\sqrt{1+\big(\frac{dy}{dx}\big)^2}\frac{dx}{dt}$ i zapisaniu równania w postaci różniczkowej $\displaystyle vdt=\sqrt{1+\big(\frac{dy}{dx}\big)^2}dx$ oraz po uwzględnieniu prawa zachowania energii ( $\displaystyle v=\sqrt{2gy}$ ) otrzymujemy

$\displaystyle \sqrt{2gy}dt=\sqrt{1+\big(\frac{dy}{dx}\big)^2}dx,$

czyli

$\displaystyle \frac{dt}{dx}=\frac{\sqrt{1+\big(\frac{dy}{dx}\big)^2}}{\sqrt{2gy}}.$

Stąd całkowity czas, jaki jest niezbędny, aby pokonać drogę z położenia $\displaystyle x=0$ do $\displaystyle x=a$ (licząc wzdłuż osi zmiennej $\displaystyle x$ ), wyraża całka oznaczona

$\displaystyle \int_{0}^{a}\frac{dt}{dx}dx=\frac{1}{\sqrt{2g}}\int_0^a\sqrt{\frac{1+\big(\frac{dy}{dx}\big)^2}{y}}dx.$

Zadanie sprowadza się więc do wyznaczenia ekstremali funkcjonału

$\displaystyle J[y]=\int_0^a\sqrt{\frac{1+\big(\frac{dy}{dx}\big)^2}{y}}dx,$

(czynnik $\displaystyle \frac{1}{\sqrt{2g}}$ jest stały) w zbiorze tych funkcji $\displaystyle x\mapsto y(x)$ , które na końcach przedziału $\displaystyle [0, a]$ przyjmują odpowiednio wartości $\displaystyle y(0)=0$ i $\displaystyle y(a)=b$ . Zauważmy, że funkcja

Lagrange'a

$\displaystyle (x_1, x_2, x_3)\mapsto L(x_1, x_2, x_3)=\sqrt{\frac{1+x_2 ^2}{x_1}}$

nie zależy od zmiennej $\displaystyle x_3$ ,

stąd rozwiązanie równanie Lagrange'a-Eulera jest równoważne równaniu

$\displaystyle L(y, y', x)-y'\frac{\partial L}{\partial x_2}(y, y', x)=Const,$

gdzie $\displaystyle Const$ jest dowolną stałą. Po przekształceniu równanie to przyjmie postać:

$\displaystyle \frac{\sqrt{1+(y')^2}}{\sqrt{y}}-\frac{1}{\sqrt{y}}\frac{(y')^2}{\sqrt{1+(y')^2}}=C$

a po sprowadzeniu do wspólnego mianownika składników po lewej stronie równości i podniesieniu do kwadratu:

$\displaystyle \frac{1}{y(1+(y')^2)}=C^2.$

Rozwiązanie $\displaystyle x\mapsto y(x)$ równania $\displaystyle y(1+(y')^2)=C^{-2}$ można przedstawić w postaci parametrycznej:

$\displaystyle \{\begin{align*} x(\theta) & =r(\theta-\sin\theta)+C_1 \\ y(\theta) & =r(1-\cos \theta), \end{align*}.$

gdzie $\displaystyle r=\frac{1}{2}C^{-2}$ , a $\displaystyle C_1$ jest kolejną stałą. Z twierdzenia o różniczkowaniu złożenia mamy

$\displaystyle \frac{dy}{dx}=\frac{dy}{dt} \big(\frac{dx}{dt}\big)^{-1} =\frac{r\sin\theta}{r(1-\cos\theta)}=\frac{\sin\theta}{(1-\cos\theta)},$

stąd - po przekształceniach

$\displaystyle \begin{align*} y\bigg(1+\big(\frac{dy}{dx}\big)^2\bigg) & =r(1-\cos \theta)(1+\frac{\sin^2\theta}{(1-\cos\theta)^2}) \\ & =2r=C^{-2},\end{align*}$

czyli krzywa $\displaystyle \theta \mapsto (x(\theta), y(\theta))$ spełnia równanie Lagrange'a-Eulera. Uwzględniając współrzędne początku $\displaystyle A=(0,0)$ , otrzymujemy $\displaystyle C_1=0$ . Następnie uwzględniając również koniec trasy $\displaystyle B=(a,b)$ , wyznaczamy wartość stałej $\displaystyle r$ , a co za tym idzie również stałej $\displaystyle C$ . Szczegółowe obliczenia pomijamy. Zwróćmy jednak uwagę na krzywą

$\displaystyle \left\{\begin{align*} x(\theta) & =r(\theta-\sin\theta) \\ y(\theta) & =r(1-\cos \theta), \end{align*}\right.$

która jest rozwiązaniem zadania brachistochrony (czyli krzywej najszybszego spadku). Krzywą tą jest łuk cykloidy łączący punkty $\displaystyle A$ i $\displaystyle B$ .

Przykład 15.14.[zagadnienie izoperymetryczne]

Rozważmy rodzinę krzywych klasy $\displaystyle C^1$ o ustalonych końcach $\displaystyle A=(-1,0)$ i $\displaystyle B=(1,0)$ . Czy istnieje krzywa o ustalonej długości, która wraz z odcinkiem o końcach $\displaystyle A$ , $\displaystyle B$ ogranicza obszar o możliwie największym polu?
Zadanie sprowadza się do maksymalizowania wartości całki wyrażającej pole pod wykresem funkcji $\displaystyle f$

$\displaystyle F(f)=\int_{-1}^{1}f(t)dt$

przy warunku

$\displaystyle G(f)=\int_{-1}^{1}\sqrt{1+(f'(t))^2}dt=Const,$

który oznacza, że długość łuku krzywej $\displaystyle t\mapsto (t, f(t))$ , przy $\displaystyle a\leq t\leq b$ jest stała. Mamy więc zagadnienie polegające na

znalezieniu ekstremum warunkowego: ekstremum funkcjonału $\displaystyle f\mapsto F(f)$ na poziomicy funkcjonału $\displaystyle G(f)=Const$ .

Korzystając z twierdzenia o funkcjonale Lagrange'a (stanowiącego ugólnienie klasycznego twierdzenia o mnożnikach Lagrange'a), można wykazać, że

Uwaga 15.15.

Jeśli funkcjonał $\displaystyle F$ osiąga wartość ekstremalną przy warunku $\displaystyle G(f)=Const$ , to istnieje stała $\displaystyle \lambda$ taka, że $\displaystyle f$ jest
ekstremalą funkcjonału $\displaystyle \Phi=F+\lambda G$ .

W rozważanym przez nas przykładzie funkcjonał $\displaystyle \Phi$ ma postać:

$\displaystyle \Phi(f)=\int_{-1}^{1}\bigg(f+\lambda \sqrt{1+(f')^2}\bigg)dx.$

Zwróćmy uwagę,że funkcja Lagrange'a

$\displaystyle L(x,y, t)=x+\lambda\sqrt{1+y^2}$

określająca funkcjonał $\displaystyle \Phi$ nie zależy od zmiennej $\displaystyle t$ , wobec tego funkcja $\displaystyle f$ spełnia równanie równoważne równaniu Lagrange'a-Eulera

$\displaystyle L(f,f', t)-f'\frac{\partial L}{\partial y}(f, f', t)=C_1,$

gdzie $\displaystyle C_1$ jest stałą. Dostajemy więc

$\displaystyle f+\lambda \sqrt{1+(f')^2}-\lambda f'\frac{f'}{\sqrt{1+(f')^2}}=C_1,$

które po uproszczeniu (po sprowadzeniu składników do wspólnego mianownika) przyjmie postać

$\displaystyle f-C_1=\frac{-\lambda}{\sqrt{1+(f')^2}}$

lub równoważną

$\displaystyle 1+(f')^2 =\frac{\lambda ^2}{(C_1-f)^2}.$

Równanie to spełnia rodzina funkcji $\displaystyle f(t)=\sqrt{\lambda^2 -(t-C_2)^2}+C_1$ , gdzie $\displaystyle C_2$ jest kolejną stałą (przypomnijmy, że $\displaystyle C_1$ jest stałą, która pojawiła się z całkowania równania Lagrange'a -Eulera). Stałe $\displaystyle C_1$ , $\displaystyle C_2$ wyznaczymy z warunków zadania $\displaystyle f(-1)=0$ oraz $\displaystyle f(1)=0$ , czyli $\displaystyle \sqrt{\lambda^2 -(-1-C_2)^2}=\sqrt{\lambda^2 -(1-C_2)^2}$ , skąd $\displaystyle C_2=0$ , a także $\displaystyle C_1=-\sqrt{\lambda^2-1}$ . Widzimy więc, że rozwiązaniem zagadnienia jest funkcja

$\displaystyle f(t)=\sqrt{\lambda^2-t^2}-\sqrt{\lambda^2-1}.$

Współrzędne punktu $\displaystyle (t, f(t))$ wykresu funkcji $\displaystyle f$ spełniają równanie

$\displaystyle t^2 + \big(f(t)+\sqrt{\lambda^2-1}\big)^2=\lambda^2,$

czyli równanie okręgu o środku w punkcie $\displaystyle (0, \sqrt{\lambda^2-1})$ i promieniu $\displaystyle |\lambda|$ . Rozwiązaniem problemu jest więc łuk okręgu, którego cięciwą jest dany odcinek $\displaystyle \overline{AB}$ . Stałą $\displaystyle \lambda$ wyznaczymy z warunku $\displaystyle G(f)=Const$ . Mamy

$\displaystyle \begin{align*} G(f) & =\int_{-1}^{1}\sqrt{1+(f')^2}dx \\ & =\int_{-1}^{1}\sqrt{\frac{x^2+\lambda^2-x^2}{\lambda^2-x^2}}dx \\ & =2|\lambda|\arcsin\frac{x}{\lambda}\bigg|_{-1}^{1}=2|\lambda|\arcsin\frac{1}{\lambda}.\end{align*}$

Stąd $\displaystyle \lambda$ jest rozwiązaniem równania

$\displaystyle \frac{1}{\lambda}=\sin\frac{Const}{2|\lambda|}.$

Szkicując wykresy funkcji $\displaystyle t\mapsto t$ oraz $\displaystyle t\mapsto \sin\big(\frac{C}{2}t\big)$ , możemy łatwo przekonać się, że dla $\displaystyle 0\leq C < 2$ jedynym rozwiązaniem równania $\displaystyle t=\sin\big(\frac{C}{2}t\big)$ jest $\displaystyle t=0$ . Wówczas nie znajdziemy takiej stałej $\displaystyle \lambda$ , aby $\displaystyle \frac{1}{\lambda}=0$ . Wynika to zresztą w oczywisty sposób z interpretacji geometrycznej rozważanego zagadnienia: punktów $\displaystyle A=(-1,0)$ oraz $\displaystyle B=(1,0)$ nie da się połączyć krzywą o długości $\displaystyle C < 2$ . Gdy $\displaystyle C=2$ , rozwiązaniem zagadnienia jest po prostu odcinek $\displaystyle \overline{AB}$ , który w tym przypadku ogranicza zerowe pole $\displaystyle C=0$ , Gdy zaś $\displaystyle C>2$ , znajdziemy rozwiązanie $\displaystyle t_0$ równania $\displaystyle t=\sin\big(\frac{C}{2}t\big)$ i weźmiemy $\displaystyle \lambda =\frac{1}{t_0}$ . Na przykład dla $\displaystyle C=\pi$ mamy $\displaystyle t_0=1$ , więc $\displaystyle \lambda=1$ . }}

W ten sposób pokazaliśmy intuicyjnie oczywisty fakt, iż

Wniosek 15.16.

Wśród krzywych o ustalonych końcach $\displaystyle A, B$ i tej samej długości $\displaystyle l>AB$ największe pole wraz z odcinkiem $\displaystyle \overline{AB}$ ogranicza łuk okręgu.

Informatyka MIMUW

Zastosowania równań różniczkowych. Elementy rachunku wariacyjnego

wykres

rycina

rycina