Ciągłość funkcji wielu zmiennych. Pochodne cząstkowe. Gradient

Przypominamy przykłady funkcji wielu zmiennych, które znamy z życia codziennego. Do badania przebiegu zmienności funkcji, badania ciągłości, wyznaczania ekstremów stosujemy analizę przebiegu poziomic, a następnie wprowadzamy pochodne kierunkowe i cząstkowe.

Przykłady funkcji wielu zmiennych

ryciny

Z funkcjami dwóch zmiennych rzeczywistych spotykamy się na co dzień. Śledząc prognozę pogody po wieczornym wydaniu wiadomości w telewizji (w prasie, w internecie) sprawdzamy, jaka temperatura jest przewidywana na najbliższą noc, na kolejny poranek, popołudnie, w dniach następnych. Temperatura podawana jest przeważnie liczbowo dla kilku regionów naszego kraju albo też - w dokładniejszej formie - na mapie z zaznaczonymi izotermami, tj. liniami, które łączą punkty o takiej samej temperaturze.

Osoby podatne na zmiany ciśnienia atmosferycznego z niepokojem śledzą informacje o spodziewanym załamaniu pogody i wahaniach ciśnienia. Przypomnijmy, że linie łączące punkty o takim samym ciśnieniu atmosferycznym nazywamy izobarami.

Zagęszczenie izobar nad danym obszarem oznacza dużą prędkość wiatru w terenie: im izobary są gęstsze, tym prędkość wiatru większa. Pamiętamy, że wiatr wieje od obszaru o wyższym ciśnieniu do obszaru o niższym ciśnieniu.

Kierunek wiatru także nie jest przypadkowy: odpowiada temu kierunkowi, w którym ciśnienie spada najszybciej, co na mapie odpowiada kierunkowi, w którym izobary najbardziej zagęszczają się.

Ze względu na czytelność map z prognozą pogody, obszary zawarte między kolejnymi poziomicami koloruje się zgodnie z umową tak, że obszary, nad którymi panuje niskie ciśnienie, bądź niska temparatura, oznacza się kolorem fioletowym, ciemno niebieskim, niebieskim. Kolory jasno zielony, zielony, jasno żółty, rezerwuje się do oznaczania obszarów o przeciętnym ciśnieniu czy temperaturze, natomiast obszary o najwyższych wartościach koloruje się na żółto, pomarańczowo, czerwono. Do umowy tej przywykliśmy. Tak bowiem pokolorowana jest mapa fizyczna (mapa hipsometryczna), np. ta przedstawiająca nasz kraj.

ryciny prognoza pogody

Gdybyśmy powędrowali palcem po mapie z południa na północ Polski, zaczynając od Tatr, które po polskiej stronie sięgają prawie 2500 metrów nad poziom morza, wystartowalibyśmy z obszaru pokolorowanego na brązowo, intensywnie czerwono, pomarańczowo. Kierując się do Krakowa i dalej Wyżyną Krakowsko-Częstochowską, przemierzalibyśmy obszar pokolorowany na żółto. Obszar nizinny w centralnej i północnej części naszego kraju zaznaczono na zielono, z wyjątkiem pasm wzgórz na północy, np. na Kaszubach, które zaznaczono na żółto. Jeśli spojrzymy trochę na prawo od ujścia Wisły, między Tczewem a Elblągiem, zauważymy obszar ciemnozielony, którym pokolorowano obszar depresji, tj. obszar położony poniżej poziomu morza. W końcu docieramy do brzegu Bałtyku, którego poziom stanowi umowny punkt odniesienia wysokości obszaru nad poziom morza. Pamiętamy, że głębokość dna morza na mapie również została zaznaczona różnymi kolorami: od białego (którym zaznaczono płytkie obszary tuż przy brzegu i mielizny), przez niebieski, aż po ciemnoniebieski, którym zaznaczono głębsze obszary.

ryciny mapa tatr

Linie na mapie, łączące punkty o samej wysokości nad poziom morza, nazywamy poziomicami.

Wędrując po górach, w zależności od upodobania, wybieramy szlak, który krótszą, ale bardziej stromą drogą doprowadzi nas do celu, bądź też szlak mniej stromy, łagodny. Każdy, kto wędrował choć raz po górach z mapą w ręku wie, że im gęściej szlak poprzecinany jest kolejnymi poziomicami, tym jest bardziej stromy i wymaga większego wysiłku fizycznego. Szlak, który przebiega między dwiema poziomicami, prawie żadnej nie przecina, jest zdecydowanie łagodniejszy, bez stromych podejść, nie wymaga wysiłku.

Na ogół szlaki turystyczne w górach omijają obszary, gdzie poziomice przebiegają bardzo gęsto, bądź wręcz urywają się. Nic dziwnego: tak na mapie zaznaczono strome zbocza i urwiska.

Zauważmy, że poziomice odpowiadające różnym wysokościom są krzywymi rozłącznymi. Na mapie, która przeważnie przedstawia pewien prostokątny (w przybliżeniu) obszar terenu, krzywe te są zamknięte lub nie. Nasze doświadczenie podpowiada nam, że wewnątrz obszaru ograniczonego poziomicą, która jest linią zamkniętą, zawsze da się wskazać punkt położony najwyżej (np. szczyt wzniesienia) lub najniżej (np. dno doliny).

W ramach Analizy matematycznej I poznaliśmy twierdzenie, które opisuje taką sytuację: funkcja ciągła na zbiorze zwartym osiąga swoje kresy. Jest to twierdzenie Weierstrassa, które pozostaje prawdziwe nie tylko w przypadku funkcji jednej zmiennej.

Mapa fizyczna danego obszaru, mapa rozkładu ciśnienia, mapa rozkładu temperatury to przykłady graficznej reprezentacji (wykresu) funkcji dwóch zmiennych rzeczywistych (długości i szerokości geograficznej) o wartościach w zbiorze liczb rzeczywistych, bowiem wysokość punktu nad poziom morza, wartość ciśnienia atmosferycznego, temperatura to wielkości liczbowe.

Granica i ciągłość funkcji wielu zmiennych

Większość pojęć i twierdzeń, którymi będziemy posługiwać się w tym module, poznaliśmy już przy okazji omawiania własności funkcji ciągłych w przestrzeniach metrycznych. Przypomnijmy parę z nich.

Niech \( \displaystyle (X,d) \), \( \displaystyle (Y,\rho) \) będą przestrzeniami metrycznymi. Będziemy zajmowali się badaniem funkcji

\( \displaystyle f:X\mapsto Y. \)

Większość praktycznych przykładów zastosowania teorii będzie dotyczyć funkcji określonych na zbiorze \( \displaystyle \mathbb{R}^n \), \( \displaystyle n=2,3,\dots \), z metryką \( \displaystyle d(x,y)=\|x-y\| \) zadaną przez pewną ustaloną normę \( \displaystyle \|\cdot\| \) w \( \displaystyle \mathbb{R}^n \), np.

\( \displaystyle \begin{align*} \|x\|_p & =\big(|x_1|^p+|x_2|^p+\dots+|x_n|^p\big)^{\frac{1}{p}}, \text{ dla } 1\leq p < \infty \\ & \text{ w szczególności } \\ \|x\|_1 & =|x_1|+|x_2|+\dots+|x_n| \\ \|x\|_2 & =\sqrt{|x_1|^2 +|x_2|^2 +\dots+|x_n|^2} \\ & \text{ bądź też } \\ \|x\|_{\infty} & =\max\{|x_1|, \ |x_2|, \ \dots, \ |x_n| \}. \end{align*} \)

Zbiorem wartości funkcji \( \displaystyle f \) najczęściej będzie zbiór liczb rzeczywistych \( \displaystyle \mathbb{R} \) z metryką zadaną przez wartość bezwzględną, tj. \( \displaystyle \rho(a,b)=|a-b| \).

Definicja 6.1.

Mówimy, że \( \displaystyle g\in Y \) jest granicą funkcji \( \displaystyle f:X\mapsto Y \) w punkcie \( \displaystyle x \) będącym punktem skupienia dziedziny funkcji \( \displaystyle f \), jeśli

\( \displaystyle \forall \epsilon>0 \exists \delta>0 : \forall y: 0 < d(x,y) < \delta\Longrightarrow \rho(g,f(y)) < \epsilon. \)

Definicja 6.2.

Mówimy, że funkcja \( \displaystyle f:X\mapsto Y \) jest ciągła w punkcie x, jeśli

\( \displaystyle \forall \epsilon>0 \exists \delta>0 : \forall y: d(x,y) < \delta \Longrightarrow \rho(f(x),f(y)) < \epsilon. \)

Pamiętamy również, że zachodzi następujące

Twierdzenie 6.3.

Niech \( \displaystyle X, \ Y \) będą przestrzeniami metrycznymi i niech \( \displaystyle f:X\mapsto Y \) będzie funkcją. Wówczas następujące warunki są równoważne:

1) funkcja \( \displaystyle f \) jest ciągła w punkcie \( \displaystyle a\in X \),

2) istnieje granica \( \displaystyle \lim_{x\to a}f(x) \) i jest równa wartości funkcji \( \displaystyle f(a) \).

Niech \( \displaystyle X \), \( \displaystyle Y \), \( \displaystyle Z \) będą przestrzeniami metrycznymi.

Twierdzenie 6.4.

Złożenie \( \displaystyle g\circ f: X\mapsto Z \) funkcji ciągłych \( \displaystyle f:X\mapsto Y \) i \( \displaystyle g: Y\mapsto Z \) jest funkcją ciągłą.

Twierdzenie 6.5.

Jeśli \( \displaystyle f:X\mapsto \mathbb{R} \) oraz \( \displaystyle g:X\mapsto \mathbb{R} \) są funkcjami ciągłymi, to suma \( \displaystyle f+g \) oraz iloczyn \( \displaystyle f\cdot g \) są funkcjami ciągłymi. Ponadto odwrotność \( \displaystyle \displaystyle \frac{1}{g} :Z\ni x\mapsto \frac{1}{g(x)}\in\mathbb{R} \) oraz iloraz \( \displaystyle \displaystyle \frac{f}{g}: Z\ni x\mapsto \frac{f(x)}{g(x)}\in\mathbb{R} \)

są funkcjami ciągłymi na zbiorze \( \displaystyle Z:=X\setminus\{x\in X: g(x)=0\} \). Przypomnijmy jeszcze następujące twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym.

Twierdzenie 6.6.

Jeśli \( \displaystyle f:X\mapsto \mathbb{R} \) jest funkcją ciągłą określoną na przestrzeni zwartej \( \displaystyle X \), to istnieją punkty \( \displaystyle a, b\in X \), w których funkcja \( \displaystyle f \) osiąga kresy: kres dolny \( \displaystyle \inf\{f(x), x\in X\}=f(a) \) i kres górny \( \displaystyle \sup\{f(x), x\in X\}=f(b) \).

Rozważmy przykład, który pokazuje, że zachowanie funkcji wielu zmiennych może wykraczać poza naszą intuicję ukształtowaną podczas badania funkcji jednej zmiennej.

Przykład 6.7.

Funkcja \( \displaystyle \displaystyle f(x,y)=\frac{x y}{x^2 +y^2} \) określona jest we wszystkich punktach płaszczyzny \( \displaystyle \mathbb{R}^2 \) z wyjątkiem punktu \( \displaystyle (0,0) \). Wyraźmy ją we współrzędnych biegunowych

\( \displaystyle \Phi: (r,\varphi)\mapsto \left\{ \begin{align*} x(r,\varphi)=r\cos\varphi \\ y(r,\varphi)=r\sin\varphi \end{align*} \right. \)

W punktach leżących poza początkiem układu współrzędnych, tj. gdy \( \displaystyle r>0 \), otrzymamy:

\( \displaystyle (f\circ\Phi)(r, \varphi)=\frac{r^2\cos\varphi \sin\varphi }{r^2 (\cos^2 \varphi+\sin^2 \varphi)}=\frac{1}{2}\sin 2\varphi. \)

Zauważmy, że zbiorem wartości tej funkcji jest przedział \( \displaystyle [-\frac{1}{2},\frac{1}{2} ] \). Ponadto funkcja \( \displaystyle (r, \varphi)\mapsto \frac{1}{2}\sin 2\varphi \) nie zależy od zmiennej \( \displaystyle r \). Oznacza to, że zacieśnienie funkcji \( \displaystyle f \) do którejkolwiek półprostej danej równaniem \( \displaystyle \varphi=\varphi_0 \) (tj. półprostej, która tworzy z dodatnią półosią osi rzędnych ustalony kąt \( \displaystyle \varphi_0 \)) jest funkcją o stałej wartości \( \displaystyle \frac{1}{2}\sin 2\varphi_0 \), niezależnej od odległości \( \displaystyle r \) punktu od początku układu współrzędnych. Każde z tych zacieśnień do prostej \( \displaystyle \{\varphi=\varphi_0\}\cup \{\varphi=\varphi_0+\pi\} \) ma granicę przy \( \displaystyle r\to 0 \) równą \( \displaystyle \frac{1}{2}\sin 2\varphi_0 \). Jednak wartość ta zależy od wyboru kąta \( \displaystyle \varphi_0 \), stąd nie istnieje granica funkcji \( \displaystyle (x,y)\mapsto f(x,y) \), gdy \( \displaystyle (x,y)\to (0,0) \). Zauważmy, że gdy rozważymy osobno funkcje jednej zmiennej, ustalając drugą zmienną, tzn. \( \displaystyle y \) lub odpowiednio \( \displaystyle x \):

\( \displaystyle \begin{align*} f_y & =f(\cdot , y): \mathbb{R} \ni x\mapsto \frac{xy}{x^2+y^2} \\ f_x & = (x , \cdot ): \mathbb{R} \ni y\mapsto \frac{xy}{x^2+y^2},\end{align*} \)

to zarówno \( \displaystyle \displaystyle \lim_{x\to 0}f_y(x)=0 \), jak też \( \displaystyle \displaystyle \lim_{y\to 0}f_x(y) =0 \), a więc w szczególności istnieją granice iterowane

\( \displaystyle \begin{align*} \lim_{x\to 0}\big( \lim_{y\to 0} f(x,y) \big) =0, \\ \lim_{y\to 0} \big( \lim_{x\to 0} f(x,y)\big)=0 \end{align*} \)

i są równe.

wykres a

Wykres funkcji \( \displaystyle \displaystyle f(x,y)=\frac{xy}{x^2 +y^2} \)

Przykład pokazuje więc, że

Wniosek 6.8.

Z istnienia granic iterowanych

\( \displaystyle \begin{align*} \lim_{x\to a}\big( \lim_{y\to b} f(x,y) \big) \\ \lim_{y\to b} \big( \lim_{x\to a} f(x,y)\big)\end{align*} \)

i równości tych granic nie wynika istnienie granicy funkcji \( \displaystyle f \) w punkcie \( \displaystyle (a,b) \).

Prawdziwa natomiast jest implikacja:

Uwaga 6.9.

Jeśli funkcja \( \displaystyle f: \mathbb{R}\times \mathbb{R}\mapsto \mathbb{R} \) ma granicę w punkcie \( \displaystyle (a,b) \), to istnieją obie granice iterowane

\( \displaystyle \begin{align*} \lim_{x\to a}\big( \lim_{y\to b} f(x,y) \big) \\ \lim_{y\to b} \big( \lim_{x\to a} f(x,y)\big)\end{align*} \)

i są równe granicy funkcji \( \displaystyle f \) w punkcie \( \displaystyle (a,b) \).

Uwaga ta stanowi warunek konieczny istnienia granicy \( \displaystyle \displaystyle\lim_{(x,y)\to (a, b)}f(x,y) \). Jeśli bowiem nie istnieje któraś z granic iterowanych, bądź nie są one równe, to funkcja \( \displaystyle f \) nie ma granicy w punkcie \( \displaystyle (a,b) \). Podkreślmy jeszcze raz fakt, że istnienie i równość obu granic iterowanych nie gwarantuje istnienia granicy funkcji.

Poziomice

Niech \( \displaystyle f:X\mapsto \mathbb{R} \) będzie funkcją określoną na przestrzeni metrycznej \( \displaystyle X \) o wartościach rzeczywistych.

Definicja 6.10.

Poziomicą funkcji \( \displaystyle f \)

odpowiadającą wartości \( \displaystyle a\in \mathbb{R} \) nazywamy zbiór

\( \displaystyle \{f=a\}=\{x\in X: f(x)=a\}, \)

czyli przeciwobraz zbioru jednopunktowego \( \displaystyle \{a\} \) przez funkcję \( \displaystyle f \).

Często pobieżna nawet analiza przebiegu poziomic pozwala ustalić, czy dana funkcja osiąga ekstrema (zob. definicja ekstremum w module 9 Analizy matematycznej 1), czy też nie.

Przykład 6.11.

Niech \( \displaystyle f(x,y)=x^2+y^2-4 \).

wykres

Poziomica \( \displaystyle \{f=a\}=\{(x,y): x^2+y^2-4=a\} \) jest okręgiem o środku w punkcie \( \displaystyle (0,0) \) i promieniu \( \displaystyle \sqrt{4+a} \), gdy \( \displaystyle a>-4 \). Poziomica \( \displaystyle \{f=-4\} \) składa się tylko z jednego punktu \( \displaystyle (0,0) \), natomiast jeśli \( \displaystyle a < -4 \), to poziomica \( \displaystyle \{f=a\} \) jest zbiorem pustym. Funkcja \( \displaystyle f \) osiąga minimum globalne w punkcie \( \displaystyle (0,0) \) równe \( \displaystyle f(0,0)=-4 \).

Przykład 6.12.

Niech \( \displaystyle f(x,y)=x^2-y^2 \).

wykres

Poziomica zerowa \( \displaystyle \{f=0\}=\{(x,y): x^2-y^2=0\}=\{x=y\}\cup \{x=-y\} \) jest sumą dwóch prostych: \( \displaystyle x=y \) i \( \displaystyle x=-y \). Jeśli \( \displaystyle a\neq 0 \) poziomica \( \displaystyle \{f=a\}=\{x^2-y^2=a\} \) jest hiperbolą o asymptotach \( \displaystyle x=y \) i \( \displaystyle x=-y \). Przebieg poziomic pozwala ustalić, że funkcja \( \displaystyle f \) w żadnym punkcie płaszczyzny nie osiąga ekstremum, bowiem w dowolnie małym otoczeniu każdego punktu \( \displaystyle (x,y) \) potrafimy z łatwością wskazać punkty, w których funkcja przyjmuje zarówno wartości mniejsze jak i większe od wartości funkcji \( \displaystyle f \) w punkcie \( \displaystyle (x,y) \).

Przykład 6.13.

wykres

Niech \( \displaystyle f(x,y)=|x|+|y| \).

Funkcja \( \displaystyle f \) jest normą w \( \displaystyle \mathbb{R}^2 \), przyjmuje więc wyłącznie wartości nieujemne, stąd \( \displaystyle \{f=a\}=\emptyset \), gdy \( \displaystyle a < 0 \). Poziomica zerowa \( \displaystyle \{f=0\}=\{(0,0)\} \) składa się tylko z jednego punktu. Gdy \( \displaystyle a>0 \), poziomica \( \displaystyle \{f=a\}=\{|x|+|y|=a\} \) jest kwadratem o wierzchołkach \( \displaystyle (a,0) \), \( \displaystyle (0,a) \), \( \displaystyle (-a, 0) \), \( \displaystyle (0, -a) \). Funkcja \( \displaystyle f \) osiąga minimum globalne w punkcie \( \displaystyle (0,0) \), gdyż \( \displaystyle f(x,y)>0 \) w dowolnym punkcie \( \displaystyle (x,y)\neq (0,0) \). Podobnie jak w poprzednim przykładzie przebieg poziomic pozwala ustalić, że funkcja \( \displaystyle f \) w żadnym punkcie płaszczyzny poza punktem \( \displaystyle (0,0) \) nie osiąga ekstremum, bowiem w dowolnie małym otoczeniu każdego punktu \( \displaystyle (x,y)\neq (0,0) \) potrafimy z łatwością wskazać punkty, w których funkcja przyjmuje zarówno wartości mniejsze jak i większe od wartości funkcji \( \displaystyle f \) w punkcie \( \displaystyle (x,y) \).

Przykład 6.14.

wykres

Niech \( \displaystyle f(x,y)=|x|^{\frac{2}{3}}+|y|^{\frac{2}{3}} \).

Funkcja \( \displaystyle f \) przyjmuje wyłącznie wartości nieujemne, stąd \( \displaystyle \{f=a\}=\emptyset \), gdy \( \displaystyle a < 0 \). Poziomica zerowa \( \displaystyle \{f=0\}=\{(0,0)\} \) składa się tylko z jednego punktu. Gdy \( \displaystyle a>0 \), poziomica \( \displaystyle \{f=a\}=\{|x|^{\frac{2}{3}}+|y|^{\frac{2}{3}}=a\} \) jest krzywą zawartą w kwadracie o wierzchołkach \( \displaystyle (\sqrt{a^3},0) \), \( \displaystyle (0,\sqrt{a^3}) \), \( \displaystyle (-\sqrt{a^3}, 0) \), \( \displaystyle (0, -\sqrt{a^3}) \). Krzywą tę nazywamy asteroidą. Zauważmy, że funkcja osiąga minimum globalne w punkcie \( \displaystyle (0,0) \), gdyż \( \displaystyle f(x,y)>0 \), w dowolnym punkcie \( \displaystyle (x,y)\neq (0,0) \). Podobnie jak w poprzednich przykładach przebieg poziomic pozwala stwierdzić, że jest to jedyne ekstremum tej funkcji na płaszczyźnie \( \displaystyle \mathbb{R}^2 \).

Przykład 6.15.

Niech \( \displaystyle f(x,y)=x y (1-x-y) \).

Poziomicą zerową \( \displaystyle \{f=0\} \) tej funkcji jest suma trzech prostych: \( \displaystyle x=0 \), \( \displaystyle y=0 \) oraz \( \displaystyle x+y=1 \). Zauważmy, że w dowolnie małym otoczeniu któregokolwiek punktu leżącego na tej poziomicy znajdziemy punkty, w których funkcja osiąga zarówno wartości mniejsze jak i większe od zera. Stąd w żadnym punkcie zbioru \( \displaystyle \{f=0\} \) funkcja \( \displaystyle f \) nie osiąga ekstremum. Zwróćmy jednak uwagę, że wnętrze trójkąta o wierzchołkach \( \displaystyle (0,0) \), \( \displaystyle (1,0) \), \( \displaystyle (0,1) \) zawarte jest w zbiorze \( \displaystyle \{f < 0\} \) tych punktów, w których funkcja przyjmuje wartości ujemne. W sumie mnogościowej z brzegiem trójkąta o podanych wierzchołkach zbiór ten jest zwarty. Z twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym wynika, że we wnętrzu tego trójkąta funkcja \( \displaystyle f \) osiąga minimum. Dalsza analiza przebiegu poziomic we wnętrzu trójkąta nie jest efektywnym narzędziem prowadzącym do precyzyjne określenia, w którym punkcie minimum to jest osiągane, ponieważ kreślenie poziomic \( \displaystyle \{f=a\} \), gdy \( \displaystyle a\neq 0 \), nie jest prostym zadaniem. Warto jednak zauważyć, że żaden punkt leżący na poziomicy zerowej funkcji \( \displaystyle f \) nie może być jej punktem ekstremalnym, gdyż w otoczeniu któregokolwiek punktu z tej poziomicy funkcja przyjmuje zarówno wartości dodatnie jak i ujemne.

wykres

Wykres funkcji \( \displaystyle f(x,y)=x y (1-x-y) \)

rycina

Kartezjusz (1596-1650)

Przykład 6.16.

wykres

Niech \( \displaystyle f(x,y)=x^3+y^3-3xy \).

Poziomicą zerową \( \displaystyle \{f=0\} \) tej funkcji jest nieograniczona krzywa, którą nazywamy liściem Kartezjusza. Krzywa ta ma asymptotę o równaniu \( \displaystyle x+y+1=0 \). W pierwszej ćwiartce \( \displaystyle \{(x,y)\in \mathbb{R}^2: x\geq 0, y\geq 0\} \) tworzy petlę ograniczającą obszar, we wnętrzu którego funkcja \( \displaystyle f \) przyjmuje wartości ujemne. Podobnie jak w poprzednim przykładzie, z twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym wynika, że we wnętrzu pętli liścia Kartezjusza funkcja \( \displaystyle f \) osiąga minimum. Dalsza analiza przebiegu poziomic nie prowadzi efektywnie do precyzyjne określenia, w którym punkcie minimum to jest osiągane. Warto jednak zauważyć, że w żadnym z punktów liścia Kartezjusza funkcja \( \displaystyle f \) nie może osiągać ekstremum, gdyż w dowolnie małym otoczeniu któregokolwiek punktu tej krzywej funkcja \( \displaystyle f \) osiąga wartości dodatnie jak i ujemne.

Przykład 6.17.

wykres

Jakob Bernoulli (1654-1705)

Niech \( \displaystyle f(x,y)=(x^2+y^2)^2-2 (x^2- y^2) \).

Poziomicą zerową \( \displaystyle \{f=0\} \) tej funkcji jest krzywa, zwana lemniskatą Bernoullego. Przebieg lemniskaty \( \displaystyle \{f=0\} \) najwygodniej zbadać we współrzędnych biegunowych:

\( \displaystyle \begin{align*} (x^2+y^2)^2 & =2 (x^2- y^2) \\ (r^2 \cos^2 \varphi+r^2 \sin^2 \varphi)^2 & =2 (r^2 \cos^2 \varphi-r^2 \sin^2 \varphi) \\ r^4 & =2 r^2 \cos 2 \varphi \\ r=0 & \text{ lub } r=\sqrt{2 \cos 2 \varphi}, \end{align*} \)

przy czym wyrażenie pod znakiem pierwiastka jest nieujemne dla \( \displaystyle \varphi\in [-\frac{\pi}{4}, \frac{\pi}{4}]\cup [\frac{3\pi}{4}, \frac{5\pi}{4}] \). Lemniskata Bernoullego jest więc zawarta w części wspólnej koła o promieniu \( \displaystyle \sqrt{2} \) i dwóch obszarów wyciętych z płaszczyzny półprostymi tworzącymi z osią rzędnych kąty \( \displaystyle -\frac{\pi}{4}, \ \frac{\pi}{4}, \ \frac{3\pi}{4},\ -\frac{3\pi}{4} \). Zauważmy, że we wnętrzu obszaru ograniczonego lemniskatą Bernoullego funkcja \( \displaystyle f \) osiąga wartości ujemne. Na zewnątrz zaś - dodatnie. Podobnie jak w obu poprzednich przykładach twierdzenie Weierstrassa gwarantuje istnienie minimum lokalnego w obszarze \( \displaystyle \{(x,y): f(x,y)\leq 0\} \) ograniczonym lemniskatą Bernoullego. Z kolei w dowolnie małym otoczeniu każdego punktu poziomicy zerowej \( \displaystyle \{f=0\} \) funkcja przyjmuje zarówno wartości dodatnie jak i ujemne. Funkcja \( \displaystyle f \) nie osiąga więc ekstremum w żadnym punkcie należącym do swojej poziomicy zerowej.

Trzy ostatnie przykłady każą nam szukać doskonalszego narzędzia do precyzyjnego lokalizownia punktów ekstremalnych funkcji wielu zmiennych, gdy analiza przebiegu poziomic jest niewystarczająca. Tym narzędziem są

Pochodna kierunkowa i pochodne cząstkowe

Niech \( \displaystyle A\subset X \) będzie otwartym podzbiorem przestrzeni unormowanej \( \displaystyle X \). Niech \( \displaystyle v\neq 0, v\in X \) będzie ustalonym niezerowym wektorem tej przestrzeni.

Definicja 6.18.

Mówimy, że funkcja \( \displaystyle f:A\mapsto \mathbb{R} \) ma w punkcie \( \displaystyle a \) pochodną kierunkową w kierunku wektora \( \displaystyle v \), jeśli

istnieje granica ilorazu różnicowego:

\( \displaystyle \lim_{h\to 0}\frac{f(a+hv)-f(a)}{h}. \)

Granicę tę oznaczamy symbolem \( \displaystyle \partial_v f(a) \) i nazywamy pochodną kierunkową funkcji \( \displaystyle f \) w kierunku wektora \( \displaystyle v \) w punkcie \( \displaystyle a \).

Zwróćmy uwagę, że zbiór \( \displaystyle \{a+t v, t\in \mathbb{R}\} \) jest prostą przechodzącą przez punkt \( \displaystyle a \) równoległą do wektora \( \displaystyle v \). Stąd pochodna \( \displaystyle \partial_v f(a) \) jest w istocie pochodną w punkcie \( \displaystyle t=0 \) funkcji jednej zmiennej rzeczywistej \( \displaystyle t\mapsto f(a+tv) \), czyli restrykcji funkcji \( \displaystyle f \) do podzbioru otwartego \( \displaystyle A\cap \{a+t v, t\in \mathbb{R}\} \) rozważanej prostej \( \displaystyle \{a+t v, t\in \mathbb{R}\} \). Wobec tego możemy powtórzyć jednowymiarowy warunek konieczny istnienia ekstremum w punkcie, w którym istnieje pochodna kierunkowa funkcji (zob. moduł 9, Analiza matematyczna I).

Twierdzenie 6.19.
Niech \( \displaystyle A\subset X \) będzie otwartym podzbiorem przestrzeni unormowanej \( \displaystyle X \) i niech \( \displaystyle v\in X \), \( \displaystyle v\neq 0 \). Jeśli funkcja \( \displaystyle f:A\mapsto \mathbb{R} \) osiąga ekstremum w punkcie \( \displaystyle a\in A \) i istnieje pochodna kierunkowa \( \displaystyle \partial_v f(a) \), to

pochodna ta zeruje się.

Dowód 6.19.

Jeśli funkcja \( \displaystyle A\ni x\mapsto f(x)\in \mathbb{R} \) osiąga maksimum (odpowiednio: minimum) w punkcie \( \displaystyle a \), to funkcja jednej zmiennej \( \displaystyle t\mapsto f(a+tv) \) osiąga maksimum (odpowiednio: minimum) w punkcie \( \displaystyle t=0 \). Z warunku koniecznego istnienia ekstremum funkcji jednej zmiennej wynika, że pochodna (o ile istnieje) funkcji \( \displaystyle t\mapsto f(a+tv) \) zeruje się w punkcie \( \displaystyle t=0 \). Stąd \( \displaystyle \partial_v f(a)=0 \)

O ile w przypadku funkcji określonej na otwartym przedziale prostej \( \displaystyle \mathbb{R} \) sytuacja jest oczywista (na prostej mamy tylko jeden kierunek), o tyle już w przypadku funkcji dwóch zmiennych (na płaszczyźnie można wskazać nieskończenie wiele kierunków!) powstaje pytanie o liczbę kierunków, które należy ustalić, aby rozwiązać praktyczny problem lokalizacji punktów ekstremalnych danej funkcji. Warto zauważyć, że w przypadku funkcji określonej na \( \displaystyle n \) wymiarowej przestrzeni unormowanej \( \displaystyle X \) nie ma potrzeby rozważać pochodnych kierunkowych w kierunku wektorów liniowo zależnych, a więc większej niż wynosi wymiar przestrzeni. Wyróżnijmy wobec tego pochodne kierunkowe w kierunku wektorów bazowych.

Niech \( \displaystyle X=\mathbb{R}^n \) i niech \( \displaystyle e_1=(1,0,0,\dots, 0) \), \( \displaystyle e_2=(0,1,0,\dots, 0) \), ..., \( \displaystyle e_n=(0,0,0,\dots, 1) \) będzie bazą kanoniczną tej przestrzeni. Niech \( \displaystyle A \) będzie otwartym podzbiorem przestrzeni \( \displaystyle \mathbb{R}^n \).

Definicja 6.20.

Pochodne kierunkowe (o ile istnieją) \( \displaystyle \partial_{e_1} f(a) \), \( \displaystyle \partial_{e_2} f(a) \), ..., \( \displaystyle \partial_{e_n} f(a) \) funkcji \( \displaystyle f:A\mapsto \mathbb{R} \) w kierunku wektorów bazy \( \displaystyle \{e_1, e_2, \dots, e_n\} \) nazywamy pochodnymi cząstkowymi funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \). Pochodną cząstkową funkcji \( \displaystyle (x_1, x_2, \dots, x_n) \mapsto f(x_1, x_2, \dots, x_n)\in \mathbb{R} \) w kierunku wektora

\( \displaystyle e_i \) oznaczamy tradycyjnie symbolem:

\( \displaystyle \frac{\partial f}{\partial x_i}(a), \ \frac{\partial}{\partial x_i}f(a), \ f_{x_i}(a) \ \text{ lub } \ f'_{x_i}(a). \)

W przypadku, gdy nie numerujemy współrzędnych argumentu funkcji \( \displaystyle (x,y,z)\mapsto f(x,y,z) \) pochodne cząstkowe oznaczamy symbolami

\( \displaystyle \frac{\partial f}{\partial x}(a), \quad \frac{\partial f}{\partial y}(a), \quad\frac{\partial f}{\partial z}(a) \).

Przeformułujmy warunek konieczny istnienia ekstremum funkcji określonej na zbiorze otwartym \( \displaystyle A\subset \mathbb{R}^n \).

Twierdzenie 6.21.

Jeśli funkcja \( \displaystyle f:A\mapsto \mathbb{R} \) osiąga ekstremum w punkcie \( \displaystyle a\in A \), w którym istnieją pochodne cząstkowe \( \displaystyle \frac{\partial}{\partial x_k}f(a) \), \( \displaystyle k\in\{1,2,\dots, n\} \), to pochodne te zerują się w tym punkcie, tj.

\( \displaystyle \forall k\in\{1,2,\dots, n\} : \frac{\partial}{\partial x_k}f(a)=0. \)

Zwróćmy uwagę, że twierdzenie podaje jedynie warunek konieczny istnienia ekstremum. Punkt \( \displaystyle a \), który spełnia układ równań:

\( \displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x_1}(a) & =0 \\ \frac{\partial f}{\partial x_2}(a) & =0 \\ & \vdots \\ \frac{\partial f}{\partial x_n}(a) & =0\end{align*} \right. \)

nie musi być punktem ekstremalnym funkcji \( \displaystyle f \).

Wróćmy do przykładów, w których stwierdziliśmy potrzebę znalezienia dokładniejszego narzędzia do lokalizacji ekstremów.

Przykład 6.22.

Z przebiegu poziomicy zerowej funkcji \( \displaystyle f(x,y)=xy (1-x-y) \) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz trójkąta o wierzchołkach \( \displaystyle (0,0) \), \( \displaystyle (1, 0) \), \( \displaystyle (0,1) \). Rozwiązując układ dwóch równań

\( \displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} \right .\ \ \Longleftrightarrow \ \left\{\begin{align*} y-2xy-y^2=0 \\ x-x^2 -2xy=0 \end{align*} \right . \)

otrzymujemy układ

\( \displaystyle \left\{\begin{align*} y=0 \text{ lub } 1-2x-y=0 \\ x=0 \text{ lub } 1-x -2y=0 \end{align*} \right.\ , \)

który spełniają współrzędne czterech punktów \( \displaystyle P_1=(0,0) \), \( \displaystyle P_2=(1,0) \), \( \displaystyle P_3=(0,1) \), \( \displaystyle P_4=(\frac{1}{3}, \frac{1}{3}) \). Jedynym punktem z wnętrza wskazanego trójkąta jest punkt \( \displaystyle P_4 \), w którym funkcja \( \displaystyle f \) osiąga minimum równe \( \displaystyle f(P_4)=\frac{1}{27} \). Pozostałe punkty \( \displaystyle P_1 \), \( \displaystyle P_2 \), \( \displaystyle P_3 \) leżą na poziomicy zerowej funkcji \( \displaystyle f \), która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \( \displaystyle f \) (zob. przykład 6.15.).

Przykład 6.23.

Z przebiegu poziomicy zerowej funkcji \( \displaystyle f(x,y)=x^3+y^3-3xy \) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz pętli liścia Kartezjusza. Rozwiązując układ dwóch równań

\( \displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} \right .\ \ \Longleftrightarrow \ \left\{\begin{align*} 3x^2-3y=0 \\ 3y^2-3x=0 \end{align*} \right . \)

otrzymujemy układ

\( \displaystyle \left\{\begin{align*} y=0 & \text{ lub } y=1 \\ x & =y^2 \end{align*} \right .\ , \)

który spełniają współrzędne dwóch punktów \( \displaystyle P_1=(0,0) \), \( \displaystyle P_2=(1,1) \). Jedynym punktem z wnętrza obszaru ograniczonego przez pętlę liścia Kartezjusza jest punkt \( \displaystyle P_2 \), w którym funkcja \( \displaystyle f \) osiąga minimum równe \( \displaystyle f(P_2)=-1 \). Punkt \( \displaystyle P_1 \) leży na poziomicy zerowej funkcji \( \displaystyle f \), która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \( \displaystyle f \) (zob. przykład 6.16.).

Przykład 6.24.

Podobnie jak w obu poprzednich przykładach z przebiegu poziomicy zerowej funkcji \( \displaystyle f(x,y)=(x^2+y^2)^2-2(x^2-y^2) \) wywnioskowaliśmy - w oparciu o twierdzenie Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym - że funkcja ta osiąga minimum w pewnym punkcie wewnątrz obszaru ograniczonego lemniskatą Bernoullego. Rozwiązując układ dwóch równań

\( \displaystyle \left\{\begin{align*} \frac{\partial f}{\partial x}=0 \\ \frac{\partial f}{\partial y}=0 \end{align*} .\ \ \Longleftrightarrow \ \{\begin{align*} 2(x^2+y^2)2x-4x=0 \\ 2(x^2+y^2)2y+4y=0 \end{align*} \right. \)

otrzymujemy układ

\( \displaystyle \left\{\begin{align*} x=0 \text{ lub } x^2+y^2-1=0 \\ y=0 \text{ lub } x^2+y^2+1=0 \end{align*} \right.\ , \)

który spełniają współrzędne trzech punktów \( \displaystyle P_1=(0,0) \), \( \displaystyle P_2=(-1,0) \), \( \displaystyle P_3=(1,0) \). We wnętrzu obszaru ograniczonego lemniskatą Bernoullego leżą punkty \( \displaystyle P_2 \) i \( \displaystyle P_3 \), w których funkcja \( \displaystyle f \) osiąga minima równe \( \displaystyle f(P_2)=f(P_3)=-1 \). Punkt \( \displaystyle P_1 \) leży na poziomicy zerowej funkcji \( \displaystyle f \), która - jak już sprawdziliśmy - nie może zawierać żadnego punktu ekstremalnego funkcji \( \displaystyle f \) (zobacz przykład 6.17.).

Pochodne cząstkowe wyższych rzędów

Rozważmy funkcję \( \displaystyle \frac{\partial f}{\partial x_i} \), która punktowi \( \displaystyle x\in U \) przyporządkowuje pochodną cząstkową funkcji \( \displaystyle f \) po zmiennej \( \displaystyle x_i \) w punkcie \( \displaystyle a \), czyli funkcję

\( \displaystyle \frac{\partial f}{\partial x_i}: U\ni a\mapsto \frac{\partial f}{\partial x_i}(a)\in \mathbb{R}. \)

Definicja 6.25.

Jeśli w punkcie \( \displaystyle a\in U \) istnieje pochodna cząstkowa funkcji \( \displaystyle \frac{\partial f}{\partial x_i} \) po zmiennej \( \displaystyle x_j \), to mówimy, że funkcja \( \displaystyle f \) ma pochodną cząstkową rzędu drugiego po zmiennych \( \displaystyle x_i \) oraz \( \displaystyle x_j \). Pochodną tę oznaczamy symbolem \( \displaystyle \frac{\partial }{\partial x_j }\frac{\partial }{\partial x_i }f (a) \), bądź krótko \( \displaystyle \frac{\partial ^2}{\partial x_j\partial x_i}f(a) \) lub \( \displaystyle \frac{\partial ^2f (a)}{\partial x_j\partial x_i} \). Gdy \( \displaystyle i=j \)

piszemy \( \displaystyle \frac{\partial ^2f (a)}{\partial x_i^2} \) zamiast \( \displaystyle \frac{\partial ^2f (a)}{\partial x_i\partial x_i} \).

Uwaga 6.26.

Jeśli \( \displaystyle f: \mathbb{R}^n \ni (x,y, z, \dots, t)\mapsto f(x,y, z, \dots, t)\in \mathbb{R} \) jest funkcją \( \displaystyle n \) zmiennych, to często zamiast pisać

\( \displaystyle \frac{\partial^2 f(a)}{\partial x^2}, \ \frac{\partial^2 f(a)}{\partial x\partial y}, \ \frac{\partial^2 f(a)}{\partial x\partial z}, \dots, \)

piszemy

\( \displaystyle f_{xx}(a), \ f_{xy}(a), \ f_{xz}(a), \dots, \)

bądź

\( \displaystyle f'_{xx}(a), \ f'_{xy}(a), \ f'_{xz}(a), \dots \)

Powstaje naturalne pytanie, czy zachodzi równość między pochodnymi \( \displaystyle \frac{\partial }{\partial x_j }\frac{\partial }{\partial x_i }f (a) \) oraz \( \displaystyle \frac{\partial }{\partial x_i }\frac{\partial }{\partial x_j }f (a) \), jeśli obie istnieją.

Zanim sformułujemy twierdzenie, które stanowi pozytywną odpowiedź na pytanie, rozważmy następujący

Przykład 6.27.

Funkcja

\( \displaystyle f(x,y)=\left\{\begin{align*} & \frac{xy (x^2-y^2)}{x^2+y^2}, & \text{ gdy } (x,y)\neq (0,0) \\ & 0, & \text{ gdy } (x,y)=(0,0)\end{align*} \right. \)

ma w punkcie \( \displaystyle (0,0) \) obie pochodne cząstkowe mieszane \( \displaystyle \frac{\partial}{\partial x }\frac{\partial }{\partial y}f (0,0) \) oraz \( \displaystyle \frac{\partial }{\partial y }\frac{\partial }{\partial x }f (0,0) \), lecz są one różne. A mianowice \( \displaystyle \frac{\partial }{\partial x }\frac{\partial }{\partial y}f (0,0)=1 \), podczas gdy \( \displaystyle \frac{\partial }{\partial y }\frac{\partial }{\partial x}f (0,0)=-1. \)

Okazuje się jednak, że wystarczy przyjąć naturalne założenie o ciągłości pochodnych cząstkowych mieszanych \( \displaystyle \frac{\partial }{\partial x }\frac{\partial }{\partial y}f \) oraz \( \displaystyle \frac{\partial }{\partial y }\frac{\partial }{\partial x }f \) w otoczeniu punktu \( \displaystyle a \), aby mieć gwarancję ich równości w danym punkcie.

Uwaga 6.28.

Jeśli \( \displaystyle f:\mathbb{R}^n \supset U\ni x\mapsto f(x) \in \mathbb{R} \) jest funkcją, która w punkcie \( \displaystyle a\in U \) ma ciągłe

pochodne cząstkowe \( \displaystyle \frac{\partial }{\partial x_j }\frac{\partial }{\partial x_i }f \) oraz \( \displaystyle \frac{\partial }{\partial x_i }\frac{\partial }{\partial x_j }f \), to w punkcie \( \displaystyle a \) są one równe, tj.

\( \displaystyle \frac{\partial }{\partial x_j }\frac{\partial }{\partial x_i }f (a)= \frac{\partial }{\partial x_i }\frac{\partial }{\partial x_j }f(a). \)

Dowód uwagi pomijamy (można go znaleźć np. w podręczniku Ryszarda Rudnickiego Wykłady z analizy matematycznej, Wydawnictwo Naukowe PWN, Warszawa 2001).

W podobny sposób definiujemy pochodne cząstkowe wyższych rzędów. Wprowadźmy wygodne oznaczenie pochodnych cząstkowych za pomocą wielowskaźników \( \displaystyle \alpha =(\alpha_1, \alpha_2, \dots, \alpha_n)\in \mathbb{N}_0^n \). Niech \( \displaystyle f:\mathbb{R}^n\supset U\mapsto \mathbb{R} \) będzie funkcją określoną na zbiorze otwartym \( \displaystyle U \).

Oznaczmy symbolem \( \displaystyle \frac{\partial^{\alpha_i}}{\partial x_i^{\alpha_i}} \) operację, która funkcji \( \displaystyle f \) przypisuje pochodną cząstkową rzędu \( \displaystyle \alpha_i \) po zmiennej \( \displaystyle x_i \), o ile ta pochodna istnieje.

Definicja 6.29.

Załóżmy, że istnieją kolejno pochodne cząstkowe

\( \displaystyle \frac{\partial^{\alpha_n}}{\partial x_n^{\alpha_n}} \bigg(\dots \frac{\partial^{\alpha_2}}{\partial x_2^{\alpha_2}} \big(\frac{\partial^{\alpha_1}}{\partial x_1^{\alpha_1}}f\big)\dots\bigg) (a) \)

i nie zależą od kolejności różniczkowania. Mówimy wówczas, że funkcja \( \displaystyle f \) ma pochodną

cząstkową

\( \displaystyle \frac{\partial ^{|\alpha|}f(a)}{\partial x^\alpha}:=\frac{\partial^{\alpha_n}}{\partial x_n^{\alpha_n}} \bigg(\dots\frac{\partial^{\alpha_2}}{\partial x_2^{\alpha_2}} \big(\frac{\partial^{\alpha_1}}{\partial x_i^{\alpha_1}}f\big)\dots\bigg) (a) \)

rzędu \( \displaystyle |\alpha|=\alpha_1+\alpha_2+\dots+\alpha_n \) w punkcie \( \displaystyle a \). Pochodną tę notujemy też często symbolem \( \displaystyle D^\alpha f (a) \).

Pochodne cząstkowe w fizyce. Elementy teorii pola

Niech \( \displaystyle f:D\mapsto \mathbb{R} \) będzie funkcją określoną na pewnym zbiorze otwartym \( \displaystyle D\subset \mathbb{R}^n \). Załóżmy, że w pewnym punkcie \( \displaystyle a\in D \) istnieją pochodne cząstkowe \( \displaystyle \displaystyle \frac{\partial f}{\partial x_1}(a), \frac{\partial f}{\partial x_2}(a), \dots, \frac{\partial f}{\partial x_n}(a) \).

Definicja 6.30.

Wektor \( \displaystyle \displaystyle \mathrm{grad}\, f(a)=\bigg(\frac{\partial f}{\partial x_1}(a), \frac{\partial f}{\partial x_2}(a), \dots, \frac{\partial f}{\partial x_n}(a)\bigg)\in \mathbb{R}^n \) nazywamy gradientem funkcji \( \displaystyle f \) w punkcie \( \displaystyle a \). Wektor ten oznaczamy też często symbolem nabla: \( \displaystyle \nabla f(a) \). Punkt \( \displaystyle a \), w którym wyznaczamy gradient funkcji \( \displaystyle f \), zapisujemy czasem w formie indeksu dolnego: \( \displaystyle \mathrm{grad}\,_a f \), \( \displaystyle \nabla_a f \).

Uwaga 6.31.

Jeśli funkcje \( \displaystyle f,g: \mathbb{R}^n\supset D\mapsto \mathbb{R} \) mają w punkcie \( \displaystyle a\in D \) pochodne cząstkowe \( \displaystyle \frac{\partial f}{\partial x_i}(a) \), \( \displaystyle \frac{\partial g}{\partial x_i}(a) \), \( \displaystyle i=1,2,\dots, n \), to

a) \( \displaystyle \mathrm{grad}\, (f+g)(a)=\mathrm{grad}\, f(a) +\mathrm{grad}\, g(a), \)

b) \( \displaystyle \mathrm{grad}\, (f g)(a)=g(a) \mathrm{grad}\, f(a) +f(a) \mathrm{grad}\, g(a). \)

Dowód 6.31.

Korzystając z twierdzenia o pochodnej sumy i iloczynu funkcji \( \displaystyle f,g \), wyznaczamy kolejne współrzędne wektorów \( \displaystyle \mathrm{grad}\,(f+g)(a) \) oraz \( \displaystyle \mathrm{grad}\,(fg)(a) \):

\( \displaystyle \frac{\partial}{\partial x_i}(f+g)(a)=\frac{\partial}{\partial x_i}f(a)+\frac{\partial}{\partial x_i}g(a) \)

oraz

\( \displaystyle \frac{\partial}{\partial x_i}(fg)(a)=g(a)\frac{\partial}{\partial x_i}f(a)+ f(a)\frac{\partial}{\partial x_i}g(a), \)

gdy \( \displaystyle i=1,2,\dots, n \). Stąd otrzymujemy równości a) oraz b).

W ramach następnego modułu wykażemy, że

Uwaga 6.32.

Pochodna kierunkowa w kierunku gradientu jest największa. W fizyce funkcję \( \displaystyle f:\mathbb{R}^3\mapsto \mathbb{R} \) o wartościach liczbowych nazywa się funkcją skalarną, natomiast funkcję \( \displaystyle F: \mathbb{R}^3\mapsto \mathbb{R}^3 \) nazywa się polem (wektorowym). Przykładem funkcji skalarnych są np. temperatura, potencjał pola grawitacyjnego. Przykładem pola, które znamy ze szkoły, jest pole grawitacyjne. Jeśli w początku układu współrzędnych w przestrzeni \( \displaystyle \mathbb{R}^3 \) znajduje się punkt materialny o masie \( \displaystyle M \), to - zgodnie z prawem powszechnego ciążenia Newtona - na dowolny inny punkt materialny położony w punkcie \( \displaystyle \vec{r}=(x,y,z) \) o masie \( \displaystyle m \) działa siła \( \displaystyle F=(F_x, F_y, F_z) \), której składowe wynoszą:

\( \displaystyle \begin{align*} F_x (\vec{r}) & =-k\frac{x}{r^3}, \\ F_y (\vec{r}) & =-k\frac{y}{r^3}, \\ F_z (\vec{r}) & =-k\frac{z}{r^3},\end{align*} \)

gdzie \( \displaystyle k=G m M \) jest iloczynem mas obu punktów materialnych i stałej grawitacji

\( \displaystyle G=6,67259... \cdot 10^{-11} N\cdot m^2\cdot kg^{-2}, \)

natomiast \( \displaystyle r=\|\vec{r}\|_2=\|(x,y,z)\|_2=\sqrt{x^2 +y^2+z^2} \) jest odległością obu punktów. Zwróćmy uwagę, że

\( \displaystyle F(\vec{r})=-\frac{k}{r^3}\vec{r}, \)

stąd

\( \displaystyle \|F(\vec{r})\|_2=\frac{k}{r^3}\|\vec{r}\|_2=\frac{k}{r^3}r=\frac{k}{r^2} \)

siła ta jest odwrotnie proporcjonalna do kwadratu odległości obu punktów materialnych.

Definicja 6.33.

Pole wektorowe \( \displaystyle F:\mathbb{R}^3\supset D \mapsto \mathbb{R}^3 \) nazywamy polem potencjalnym, jeśli istnieje funkcja skalarna \( \displaystyle U:D\mapsto \mathbb{R} \) taka, że \( \displaystyle \mathrm{grad}\, U(a)=F(a) \) w dowolnym punkcie \( \displaystyle a \) zbioru otwartego \( \displaystyle D\subset \mathbb{R}^3 \).
Funkcję \( \displaystyle U \) nazywamy wówczas potencjałem pola wektorowego \( \displaystyle F \).

Uwaga 6.34.

Pole grawitacyjne \( \displaystyle \displaystyle F(\vec{r})=-\frac{k}{r^3}\vec{r} \) jest polem potencjalnym. Potencjałem tego pola jest funkcja skalarna \( \displaystyle U(\vec{r})=\frac{k}{r} \), gdzie (jak powyżej) \( \displaystyle \vec{r}=(x,y,z) \)

oraz \( \displaystyle r=\|\vec{r}\|_2=\sqrt{x^2+y^2+z^2} \).

Dowód 6.34.

Policzmy pochodne cząstkowe funkcji \( \displaystyle U(x,y,z)=\frac{k}{\sqrt{x^2+y^2+z^2}}=\frac{k}{r} \) określonej w zbiorze otwartym \( \displaystyle D=\mathbb{R}^3 \setminus \{0\} \), czyli wszędzie w przestrzeni \( \displaystyle \mathbb{R}^3 \) poza początkiem układu współrzędnych. Mamy

\( \displaystyle \begin{align*} \frac{\partial}{\partial x}U(\vec{r}) & =\frac{\partial}{\partial x}\frac{k}{r}=-\frac{k}{r^2}\cdot \frac{\partial r}{\partial x}=-\frac{k}{r^2}\cdot \frac{2 x}{2 r}=-\frac{k}{r^3}x \\ \frac{\partial}{\partial y}U(\vec{r}) & =\frac{\partial}{\partial y}\frac{k}{r}=-\frac{k}{r^2}\cdot \frac{\partial r}{\partial y}=-\frac{k}{r^2}\cdot \frac{2 y}{2 r}=-\frac{k}{r^3}y \\ \frac{\partial}{\partial z}U(\vec{r}) & =\frac{\partial}{\partial z}\frac{k}{r}=-\frac{k}{r^2}\cdot \frac{\partial r}{\partial z}=-\frac{k}{r^2}\cdot \frac{2 z}{2 r}=-\frac{k}{r^3}z,\end{align*} \)

czyli

\( \displaystyle \begin{align*} \mathrm{grad}\, U(\vec{r}) & = \mathrm{grad}\, U(x,y,z)=(-\frac{k}{r^3} x, -\frac{k}{r^3} y, -\frac{k}{r^3} z) \\ & =-\frac{k}{r^3} (x,y,z)=-\frac{k}{r^3} \vec{r} \\ & = F(\vec{r}).\end{align*} \)

Definicja 6.35.

Dywergencją pola wektorowego \( \displaystyle F=(F_x, F_y, F_z):\mathbb{R}^3\supset D\mapsto \mathbb{R}^3 \) w punkcie \( \displaystyle a\in D \) nazywamy liczbę

\( \displaystyle \mathrm{div}\, F(a)=\frac{\partial F_x}{\partial x}(a)+\frac{\partial F_y}{\partial y}(a)+\frac{\partial F_z}{\partial z}(a), \)

o ile istnieją pochodne cząstkowe \( \displaystyle \frac{\partial F_x}{\partial x}(a), \ \frac{\partial F_y}{\partial y}(a), \ \frac{\partial F_z}{\partial z}(a) \). Jeśli w dowolnym punkcie \( \displaystyle a\in D \) dywergencja \( \displaystyle \mathrm{div}\, F(a)=0 \), to pole wektorowe \( \displaystyle F \) nazywamy polem bezźródłowym.

Uwaga 6.36.

Pole grawitacyjne \( \displaystyle \displaystyle F(\vec{r})=-\frac{k}{r^3}\vec{r} \) jest polem bezźródłowym w \( \displaystyle \mathbb{R}^3\setminus\{0\} \).

Dowód 6.36.

W dowolnym punkcie \( \displaystyle \vec{r}=(x,y,z)\neq 0 \) mamy

\( \begin{array}{lll} \displaystyle \frac{\partial F_x}{\partial x}(\vec{r}) & = & \displaystyle \frac{\partial }{\partial x}\bigg(-\frac{k}{r^3} x\bigg)=-k\bigg(\frac{\partial x}{\partial x}\frac{1}{r^3}+x\frac{\partial }{\partial x}\frac{1}{r^3}\bigg) \\ & = & \displaystyle -k\bigg(\frac{1}{r^3}+x\cdot \frac{(-3)}{r^4}\frac{\partial r}{\partial x}\bigg)=-k\bigg(\frac{1}{r^3}- \frac{3x^2}{r^5}\bigg) \end{array} \)

i podobnie

\( \displaystyle \displaystyle \frac{\partial F_y}{\partial y}(\vec{r})=-k\bigg(\frac{1}{r^3}- \frac{3y^2}{r^5}\bigg) \text{ oraz } \frac{\partial F_z}{\partial z}(\vec{r})=-k\bigg(\frac{1}{r^3}- \frac{3z^2}{r^5}\bigg). \)

Stąd

\( \displaystyle \begin{align*} \mathrm{div}\, F(\vec{r}) & =\frac{\partial F_x}{\partial x}(\vec{r})+\frac{\partial F_y}{\partial y}(\vec{r})+\frac{\partial F_z}{\partial z}(\vec{r}) \\ & =-k\bigg(\frac{1}{r^3}- \frac{3x^2}{r^5}\bigg)-k\bigg(\frac{1}{r^3}- \frac{3y^2}{r^5}\bigg)-k\bigg(\frac{1}{r^3}- \frac{3z^2}{r^5}\bigg) \\ & =-k\bigg(\frac{3}{r^3}- \frac{3(x^2+y^2+z^2)}{r^5}\bigg)=-k\bigg(\frac{3}{r^3}- \frac{3r^2}{r^5}\bigg)=0.\end{align*} \)

Definicja 6.37.

Rotacją pola wektorowego \( \displaystyle F=(F_x, F_y, F_z):\mathbb{R}^3\supset D\mapsto \mathbb{R}^3 \) w punkcie \( \displaystyle a\in D \)

nazywamy wektor

\( \displaystyle \mathrm{rot}\, F(a)=\bigg(\frac{\partial F_z}{\partial y}(a)-\frac{\partial F_y}{\partial z}(a), \ \frac{\partial F_x}{\partial z}(a)-\frac{\partial F_z}{\partial x}(a), \ \frac{\partial F_y}{\partial x}(a)-\frac{\partial F_x}{\partial y}(a) \bigg). \)

Wektor ten oznaczamy też czasem symbolem \( \displaystyle \nabla\times F(a) \). Jeśli w każdym punkcie \( \displaystyle a\in D \) rotacja \( \displaystyle \mathrm{rot}\, F(a)=0 \), to pole wektorowe \( \displaystyle F \) nazywamy bezwirowym.

Uwaga 6.38.

Pole grawitacyjne \( \displaystyle \displaystyle F(\vec{r})=-\frac{k}{r^3}\vec{r} \) jest polem bezwirowym w \( \displaystyle \mathbb{R}^3\setminus\{0\} \).

Dowód 6.38.

W dowolnym punkcie \( \displaystyle \vec{r}=(x,y,z)\neq 0 \) mamy

\( \displaystyle \frac{\partial }{\partial y}F_z(\vec{r})=\frac{\partial }{\partial y}\bigg(-k\frac{1}{r^3}z\bigg)=-kz\frac{\partial }{\partial y}\bigg(\frac{1}{r^3}\bigg)=-kz\frac{(-3)}{r^4}\frac{\partial r }{\partial y}=3kz \frac{y}{r^5}=zy\frac{3k}{r^5} \)

oraz podobnie

\( \displaystyle \frac{\partial }{\partial z}F_y(\vec{r})=yz\frac{3k}{r^5}. \)

Pierwsza współrzędna wektora rotacji jest więc równa zeru, gdyż

\( \displaystyle \frac{\partial F_z}{\partial y}(\vec{r})-\frac{\partial F_y}{\partial z}(\vec{r})=zy\frac{3k}{r^5}-yz\frac{3k}{r^5}=0. \)

W ten sam sposób sprawdzamy, że również druga i trzecia współrzędna wektora rotacji zerują się:

\( \displaystyle \begin{align*} \frac{\partial F_x}{\partial z}(\vec{r})-\frac{\partial F_z}{\partial x}(\vec{r}) & =xz\frac{3k}{r^5}-zx\frac{3k}{r^5}=0 \\ \frac{\partial F_y}{\partial x}(\vec{r})-\frac{\partial F_x}{\partial y}(\vec{r}) & =yx\frac{3k}{r^5}-xy\frac{3k}{r^5}=0.\end{align*} \)

Stąd \( \displaystyle \mathrm{rot}\, F(\vec{r})=0 \), dla \( \displaystyle \vec{r}\neq 0 \).