Z pojęciem pochodnej zetknęliśmy się po raz pierwszy w szkole na lekcjach fizyki. Wyznaczając prędkość średnią pewnego obiektu poruszającego się po prostej, dzielimy drogę, jaką przebył w określonym czasie, przez długość tego odcinka czasu:
\( \displaystyle v_{\text{średnia}}=\frac{\Delta x}{\Delta t}, \)
gdzie \( \displaystyle \Delta x=x(t_2)-x(t_1) \) oznacza drogę, jaką obserwowany obiekt przebył w czasie \( \displaystyle \Delta t:=t_2 - t_1 \). Następnie spostrzegliśmy, że pomiar prędkości jest tym lepszy i bardziej adekwatny do stanu obiektu w określonej chwili, im odcinek czasu \( \displaystyle \Delta t \) pomiędzy kolejnymi chwilami \( \displaystyle t_1 \) a \( \displaystyle t_2 \) jest krótszy. Granicę ilorazu
\( \displaystyle \lim_{\Delta t\to 0} \frac{x(t_1+\Delta t)-x(t_1 )}{\Delta t} \text{ przy }\Delta t \to 0 \)
nazywamy prędkością chwilową lub - krótko - prędkością obiektu w chwili \( \displaystyle t_1 \) i tradycyjnie oznaczamy symbolem \( \displaystyle v(t_1) \) lub
\( \displaystyle \frac{dx}{dt}(t_1 ), \ \ \frac{d}{dt}x(t_1 ), \ \ x'(t_1), \ \ \dot{x}(t_1). \) to ostatnie oznaczenie pochodnej jest często stosowane w równaniach różniczkowych. Niech \( \displaystyle f:(a,b)\mapsto \mathbb{R} \) będzie dowolną funkcją o wartościach rzeczywistych określoną w przedziale otwartym \( \displaystyle (a, b) \).
Definicja 9.1.
Mówimy, że funkcja \( \displaystyle f \) jest różniczkowalna w punkcie \( \displaystyle x_0 \in (a,b) \), jeśli istnieje granica ilorazu różnicowego
\( \displaystyle \lim_{h\to 0}\frac{f(x_0+h)-f(x_0)}{h}. \)
Granicę tę - jeśli istnieje - nazywamy pochodną funkcji \( \displaystyle f \) w punkcie \( \displaystyle x_0 \) i oznaczamy symbolem: \( \displaystyle f'(x_0 ) \) lub \( \displaystyle \frac{df}{dx}(x_0) \). Funkcję \( \displaystyle x\mapsto f'(x) \), która argumentowi \( \displaystyle x \) przyporządkowuje wartość pochodnej \( \displaystyle f'(x) \) funkcji \( \displaystyle f \) w punkcie \( \displaystyle x \) nazywamy funkcją pochodną funkcji \( \displaystyle f \) lub - krótko - pochodną funkcji \( \displaystyle f \). Zwróćmy uwagę, że dziedzina pochodnej \( \displaystyle x\mapsto f'(x) \) jest zawsze podzbiorem dziedziny funkcji \( \displaystyle x\mapsto f(x) \).
Uwaga 9.2.
Jeśli funkcja \( \displaystyle f \) jest różniczkowalna w punkcie \( \displaystyle x_0\in (a,b) \), to jest w tym punkcie ciągła. Skoro iloraz różnicowy \( \displaystyle \frac{f(x_0+h)-f(x_0)}{h} \) ma granicę przy \( \displaystyle h\to 0 \), to licznik \( \displaystyle f(x_0+h)-f(x_0) \) musi zmierzać do zera, stąd \( \displaystyle f \) jest ciągła w punkcie \( \displaystyle x_0 \).
Implikacja odwrotna nie jest prawdziwa.
Przykład 9.3.
Rozważmy funkcję \( \displaystyle f(x)=|x| \) określoną na \( \displaystyle \mathbb{R} \). Funkcja ta jest ciągła w każdym punkcie \( \displaystyle x\in\mathbb{R} \). Natomiast nie jest różniczkowalna w jednym punkcie - w punkcie \( \displaystyle x=0 \), gdyż
\( \displaystyle \lim_{h\to 0}\frac{|x+h|-|x|}{h}=\left\{\begin{align*} 1, \text{ dla }x>0 \\ -1, \text{ dla }x < 0\end{align*} .\right. \)
Funkcja \( \displaystyle f(x)=|x| \) jest więc różniczkowalna w każdym punkcie zbioru liczb rzeczywistych z wyjątkiem punktu \( \displaystyle x=0 \), gdyż nie istnieje granica ilorazu \( \displaystyle \frac{|0+h|-|0|}{h} \) przy \( \displaystyle h\to 0 \). W pozostałych punktach \( \displaystyle x\neq 0 \) mamy \( \displaystyle f'(x)=\mathrm{sgn}\, x \), gdzie
\( \displaystyle \mathrm{sgn}\, x=\frac{x}{|x|}=\left \{\begin{align*} 1, \text{ dla }x>0 \\ -1, \text{ dla }x < 0\end{align*} .\right. \)
oznacza funkcję signum (znak liczby). Dziedzina pochodnej \( \displaystyle f' \) jest podzbiorem właściwym dziedziny funkcji \( \displaystyle f(x)=|x| \),tj. \( \displaystyle \mathrm{dom}\, f' ⊊ \mathrm{dom}\, f \) (to znaczy: \( \displaystyle \mathrm{dom}\, f'\subset \mathrm{dom}\, f \) i \( \displaystyle \mathrm{dom}\, f'\neq \mathrm{dom}\, f \)).
Zwróćmy uwagę, że iloraz różnicowy
\( \displaystyle \frac{f( x_0 +h )-f(x_0 )}{h} \)
jest równy współczynnikowi kierunkowemu siecznej wykresu funkcji \( \displaystyle f \) przechodzącej przez punkty \( \displaystyle (x_0, f(x_0)) \) oraz \( \displaystyle (x_0+h, f(x_0+h)) \), jest równy tangensowi kąta, jaki sieczna ta tworzy z osią rzędnych. Gdy \( \displaystyle h \) zmierza do zera, punkt \( \displaystyle (x_0+h, f(x_0+h)) \) zbliża się do punktu \( \displaystyle (x_0, f(x_0)) \). Jeśli istnieje pochodna \( \displaystyle f'(x_0) \), to prostą o równaniu
\( \displaystyle y-f(x_0)=f'(x_0)(x-x_0), \)
będącą granicznym położeniem siecznych przechodzących przez punkty \( \displaystyle (x_0, f(x_0)) \) oraz \( \displaystyle (x_0+h, f(x_0+h)) \), nazywamy styczną do wykresu funkcji \( \displaystyle f \) w punkcie \( \displaystyle (x_0, f(x_0)) \). Pochodna \( \displaystyle f'(x_0) \) jest więc współczynnikiem kierunkowym stycznej do wykresu funkcji \( \displaystyle f \) w punkcie \( \displaystyle (x_0, f(x_0)) \).
Nietrudno podać przykład funkcji ciągłej, która nie jest różniczkowalna w skończonej liczbie punktów, np. w punktach \( \displaystyle x_1, x_2,\dots, x_n \). Wystarczy bowiem rozważyć np. sumę
\( \displaystyle f(x)= c_1 |x-x_1|+c_2 |x-x_2|+\dots+c_n |x-x_n|, \)
gdzie \( \displaystyle c_1, c_2, \dots, c_n \) są stałymi różnymi od zera. Pochodna
\( \displaystyle f'(x)=c_1 \mathrm{sgn}\,(x-x_1 )+c_2 \mathrm{sgn}\,(x-x_2 )+\dots+c_n\mathrm{sgn}\,(x-x_n ) \)
istnieje w każdym punkcie zbioru \( \displaystyle \mathbb{R}\setminus \{x_1, x_2,\dots, x_n\} \), czyli wszędzie poza zbiorem \( \displaystyle \{x_1, x_2,\dots, x_n\} \).
Skonstruujmy funkcję, która jest ciągła i nie jest różniczkowalna w żadnym punkcie zbioru liczb rzeczywistych.
Przykład 9.4.
Rozważmy wpierw funkcję \( \displaystyle x\mapsto f(x)=\arcsin(\cos x) \). Pamiętamy (zob. ćwiczenia do modułu drugiego), że funkcja ta jest określona na \( \displaystyle \mathbb{R} \), parzysta, okresowa o okresie \( \displaystyle 2\pi \), przy czym dla \( \displaystyle -\pi\leq x\leq \pi \) zachodzi równość \( \displaystyle \arcsin(\cos x)=\frac{\pi}{2}-|x| \). Można wykazać, że funkcja określona za pomocą nieskończonego szeregu
\( \displaystyle \begin{align*} g(x) & =\sum_{k=0}^{\infty} \frac{f(4^k x)}{3^k } \\ & =f(x)+\frac{f(4 x)}{3}+\frac{f(16 x)}{9}+\frac{f(64 x)}{27}+\frac{f(256 x)}{81}+\dots\end{align*} \)
jest określona na \( \displaystyle \mathbb{R} \), parzysta i okresowa o okresie \( \displaystyle 2\pi \), ciągła w każdym punkcie swojej dziedziny i nie jest różniczkowalna w żadnym punkcie zbioru \( \displaystyle \mathbb{R} \).
W praktyce większość funkcji elementarnych, którymi posługujemy się, jest różniczkowalna. Wyznaczmy pochodne kilku z nich, posługując się definicją i znanymi wzorami.
Przykład 9.5.
a) Funkcja stała \( \displaystyle x\mapsto c \) określona w przedziale \( \displaystyle (a,b) \) jest różniczkowalna w każdym punkcie tego przedziału i ma pochodną równą zeru, gdyż iloraz różnicowy \( \displaystyle \frac{c-c}{h}, \) będąc stale równy zeru, zmierza do zera.
b) Jeśli \( \displaystyle c \) jest stałą i istnieje \( \displaystyle f'(x) \), to istnieje pochodna iloczynu \( \displaystyle (c\cdot f)'(x)=c\cdot f'(x) \) (innymi słowy: stałą można wyłączyć przed znak pochodnej). Mamy bowiem
\( \displaystyle \frac{cf(x+h)-cf(x)}{h}=c\frac{f(x+h)-f(x)}{h}\to c \cdot f'(x), \) przy \( \displaystyle h\to 0 \).
c) Jednomian \( \displaystyle f(x)= x^n \) jest różniczkowalny w każdym punkcie \( \displaystyle x\in \mathbb{R} \) i \( \displaystyle f'(x)=n x^{n-1} \). Na mocy wzoru dwumianowego Newtona mamy bowiem
\( \displaystyle \begin{align*}\frac{(x+h)^n-x^n}{h} & =\binom{n}{1}x^{n-1}+\binom{n}{2}x^{n-2}h+ \binom{n}{3}x^{3}h^2+\dots+\binom{n}{n-1}x h^{n-2}+\binom{n}{n}h^{n-1} \\ & \to nx^{n-1}+0+0+\dots+0+0, \text{ gdy }h\to 0.\end{align*} \)
d) Funkcja \( \displaystyle x\mapsto \sin x \) jest różniczkowalna w każdym punkcie \( \displaystyle x\in \mathbb{R} \), ponieważ iloraz różnicowy
\( \displaystyle \begin{align*} \frac{\sin(x+h)-\sin x}{h} & =\frac{2\sin\frac{x+h-x}{2}\cos\frac{x+h+x}{2}}{h} \\ & =\cos(x+\frac{h}{2})\cdot \frac{\sin{\frac{h}{2}}}{{\frac{h}{2}}}\end{align*} \)
zmierza do \( \displaystyle \cos x \), gdyż \( \displaystyle \frac{\sin{\frac{h}{2}}}{{\frac{h}{2}}}\to 1 \) oraz \( \displaystyle \cos (x+\frac{h}{2})\to \cos x \) przy \( \displaystyle h\to 0 \).
e) Funkcja \( \displaystyle x\mapsto \cos x \) jest różniczkowalna w każdym punkcie\( \displaystyle x\in \mathbb{R} \), ponieważ iloraz różnicowy
\( \displaystyle \begin{align*} \frac{\cos(x+h)-\cos x}{h} & =\frac{-2\sin\frac{x+h-x}{2}\sin\frac{x+h+x}{2}}{h} \\ & =-\sin(x+\frac{h}{2})\cdot \frac{\sin{\frac{h}{2}}}{{\frac{h}{2}}}\end{align*} \)
zmierza do \( \displaystyle -\sin x \), gdyż \( \displaystyle \frac{\sin{\frac{h}{2}}}{{\frac{h}{2}}}\to 1 \) oraz \( \displaystyle \sin (x+\frac{h}{2})\to \sin x \) przy \( \displaystyle h\to 0 \).
Zwróćmy uwagę, że dotychczas nie podaliśmy precyzyjnych definicji funkcji sinus oraz cosinus, bazując na własnościach tych funkcji, poznanych w szkole w oparciu o własności liczb \( \displaystyle \sin \varphi \), \( \displaystyle \cos\varphi \), gdy \( \displaystyle \varphi \) jest kątem trójkąta. W szczególności skorzystaliśmy ze znanego faktu, że istnieje granica \( \displaystyle \lim_{\varphi\to 0}\frac{\sin \varphi}{\varphi}=1 \). Formalnie istnienie tej granicy należy wykazać po podaniu definicji funkcji sinus.
Wykażemy teraz szereg prostych uwag, pozwalających efektywnie wyznaczać pochodną.
Twierdzenie 9.6.
Niech \( \displaystyle f, g \) będą funkcjami określonymi na przedziale otwartym \( \displaystyle (a,b) \). Niech \( \displaystyle x \in (a,b) \). Jeśli istnieją pochodne \( \displaystyle f'(x) \) oraz \( \displaystyle g'(x) \), to
\( \displaystyle \begin{align*} & a) & \exists & (f+g)'(x) & = & f'(x )+g'(x), & \\ & b) & \exists & (f\cdot g)'(x) & = & f'(x)g(x)+f(x )g'(x ), & \\ & c) & \exists & \bigg( \frac{1}{g} \bigg)'(x) & = & \frac{-g'(x)}{g^2 (x )}, & \text{ o ile } g(x)\neq 0, \\ & d) & \exists & \bigg( \frac{f}{g} \bigg)'(x) & = & \frac{f'(x )g(x)-f(x )g'(x)}{g^2 (x)}, & \text{ o ile } g(x)\neq 0.\end{align*} \)
Dowód 9.6.
a) Wobec założenia o istnieniu \( \displaystyle f'(x) \) oraz \( \displaystyle g'(x) \) iloraz różnicowy
\( \displaystyle \frac{(f+g)(x+h)-(f+g)(x)}{h}=\frac{(f)(x+h)-(f)(x)}{h}+\frac{(g)(x+h)-(g)(x)}{h} \)
- na mocy twierdzenia o granicy sumy - ma granicę i jest ona równa \( \displaystyle f'(x)+g'(x ). \)
b) Funkcja \( \displaystyle g \) jest ciągła w punkcie \( \displaystyle x \), gdyż jest w tym punkcie różniczkowalna, więc \( \displaystyle \displaystyle \exists \lim_{h\to 0}g(x+h)=g(x) \). Wobec istnienia pochodnych \( \displaystyle f'(x_0) \) oraz \( \displaystyle g'(x_0) \) iloraz różnicowy
\( \displaystyle \frac{(f\cdot g)(x+h)-(f\cdot g)(x)}{h}=\frac{f(x+h)-f(x)}{h}g(x+h)+f(x)\frac{g(x+h)-g(x)}{h} \)
zmierza przy \( \displaystyle t\to 0 \) do granicy \( \displaystyle f'(x)g(x)+f(x )g'(x ) \).
c) Jeśli tylko \( \displaystyle g(x)\neq 0 \), to - wobec ciągłości funkcji \( \displaystyle g \) w punkcie \( \displaystyle x \) i istnienia \( \displaystyle g'(x) \) - iloraz różnicowy
\( \displaystyle \frac{\frac{1}{g(x+h)}-\frac{1}{g(x)}}{h}=-\frac{g(x+h)-g(x)}{h}\cdot \frac{1}{g(x+h)g(x)} \)
zmierza do granicy \( \displaystyle \displaystyle\frac{-g'(x)}{g^2 (x)} \) przy \( \displaystyle h\to 0 \).
d) Zauważmy, że \( \displaystyle \displaystyle \frac{f}{g}=f\cdot \frac{1}{g} \). Na podstawie wykazanego już twierdzenia o pochodnej iloczynu i pochodnej odwrotności istnieje pochodna
\( \displaystyle \bigg(f\cdot \frac{1}{g}\bigg)'(x)=f'(x)\frac{1}{g(x)}+f(x) \bigg(\frac{1}{g}\bigg)'(x)= \frac{f'(x)}{g(x)}-f(x) \frac{g'(x)}{g^2 (x)}=\frac{f'(x )g(x)-f(x )g'(x)}{g^2 (x)}. \)
Zastosujmy powyższe twierdzenie do wyznaczenia pochodnych kolejnych funkcji elementarnych.
Przykład 9.7.
a) Pamiętając, że tangens jest ilorazem sinusa i cosinusa, możemy łatwo wyznaczyć pochodną funkcji tangens:
\( \displaystyle \begin{align*} (\mathrm{tg}\, x)' & =\bigg(\frac{\sin x}{\cos x}\bigg)'=\frac{\cos x\cos x-\sin x(-\sin x)}{\cos^2 x} \\ & =\frac{1}{\cos^2 x}=1+\mathrm{tg}\,^2 x .\end{align*} \)
b) W podobny sposób wyznaczamy pochodną funkcji cotangens:
\( \displaystyle \begin{align*} (\mathrm{ctg}\, x)' & =\bigg(\frac{\cos x}{\sin x}\bigg)'=\frac{-\sin x\sin x-\cos x \cos x}{\sin^2 x} \\ & =\frac{-1}{\sin^2 x}=-1-\mathrm{ctg}\,^2 x .\end{align*} \)
c) Niech \( \displaystyle w(x)=a_0+a_1 x+ a_2 x^2 +\dots +a_n x^n \) będzie funkcją wielomianową. Na mocy uwagi o pochodnej jednomianu i twierdzenia o pochodnej sumy w każdym punkcie zbioru \( \displaystyle \mathbb{R} \) istnieje pochodna
\( \displaystyle w'(x)=a_1 + 2 a_2 x +3 a_3 x^2 +\dots+na_nx^{n-1}. \)
Niech \( \displaystyle f:(a,b)\mapsto \mathbb{R} \) i \( \displaystyle g: Y\mapsto\mathbb{R} \) będą funkcjami takimi, że zbiór \( \displaystyle Y \) zawiera obraz przedziału \( \displaystyle (a,b) \) przez funkcję \( \displaystyle f \).
Twierdzenie 9.8.
Jeśli istnieje pochodna \( \displaystyle f'(x_0) \) i istnieje pochodna \( \displaystyle g'(y_0) \), gdzie \( \displaystyle y_0=f(x_0 ) \), to istnieje pochodna złożenia \( \displaystyle (g\circ f)'(x_0) \) i jest równa iloczynowi pochodnych, tzn. \( \displaystyle (g\circ f)'(x_0)=g'(y_0)\cdot f'(x_0). \)
Dowód 9.8.
Niech \( \displaystyle y_1=f(x_1) \), gdzie \( \displaystyle x_1\in (a,b) \). Wobec ciągłości funkcji \( \displaystyle f \) w punkcie \( \displaystyle x_0 \) mamy zbieżność \( \displaystyle y_1\to y_0 \), gdy \( \displaystyle x_1\to x_0 \). Iloraz różnicowy
\( \displaystyle \frac{g(f(x_1))-g(f(x_0))}{x_1 - x_0}=\frac{g(y_1)-g(y_0)}{y_1 - y_0}\cdot \frac{f(x_1)-f(x_0)}{x_1 - x_0} \)
zmierza więc do
\( \displaystyle g'(y_0)\cdot f'(x_0 ) \) przy \( \displaystyle x_1\to x_0 \), gdyż \( \displaystyle \frac{f(x_1)-f(x_0)}{x_1 - x_0}\to f'(x_0) \), gdy \( \displaystyle x_1\to x_0 \), zaś \( \displaystyle \frac{g(y_1)-g(y_0)}{y_1 - y_0}\to g'(y_0) \), gdy \( \displaystyle y_1\to y_0 \).
Twierdzenie 9.9.
Niech \( \displaystyle g \) będzie funkcją odwrotną do funkcji \( \displaystyle f:(a,b)\mapsto \mathbb{R} \). Niech \( \displaystyle x_0 \in (a,b) \). Jeśli istnieje pochodna \( \displaystyle f'(x_0)\neq 0 \), to funkcja \( \displaystyle g \) jest różniczkowalna w punkcie \( \displaystyle y_0 =f(x_0) \) i zachodzi równość:
\( \displaystyle g'(y_0)=\frac{1}{f'(x_0)}. \)
Dowód 9.9.
Niech \( \displaystyle x_0, x \in (a,b) \) i niech \( \displaystyle y_0=f(x_0) \), \( \displaystyle y=f(x) \). Funkcja \( \displaystyle f \) jest ciągła w punkcie \( \displaystyle x_0 \), gdyż jest w tym punkcie różniczkowalna, więc \( \displaystyle y\to y_0 \), gdy \( \displaystyle x\to x_0 \). Stąd istnieje granica ilorazu różnicowego
\( \displaystyle \frac{g(y_0)-g(y)}{y_0 -y}=\frac{x_0-x}{f(x_0)-f(x)} =\frac{1}{\frac{f(x_0)-f(x)}{x_0-x}} \to\frac{1}{f'(x_0)}, \text{ gdy }x\to x_0. \)
Przykład 9.10.
Funkcja \( \displaystyle x\mapsto \mathrm{arctg}\, x \) jest odwrotna do funkcji \( \displaystyle x\mapsto \mathrm{tg}\, x \), stąd - na mocy twierdzenia o pochodnej funkcji odwrotnej - mamy
\( \displaystyle \frac{d}{dx}\mathrm{arctg}\, x=\frac{1}{\frac{d}{dy}\mathrm{tg}\, y}=\frac{1}{1+\mathrm{tg}\,^2 y}=\frac{1}{1+\mathrm{tg}\,^2(\mathrm{arctg}\, x)}=\frac{1}{1+x^2}. \)
Naturalnym uogólnieniem wielomianu (sumy skończonej ilości jednomianów) jest szereg potęgowy
\( \begin{array}{lll} \displaystyle \sum_{n=0}^{\infty}a_n (x-x_0)^n & = & a_0 +a_1 (x-x_0)+a_2 (x-x_0)^2 \\ & + & a_3 (x-x_0)^3+\dots +a_n(x-x_n)^n + \dots \end{array} \)
o środku w punkcie \( \displaystyle x_0 \) i współczynnikach \( \displaystyle a_n \). Własności szeregów potęgowych omówimy szerzej w ramach analizy matematycznej 2, pomijamy więc w tej chwili szczegółowe dowody. Aby uprościć wypowiedzi potrzebnych twierdzeń, zakładamy, że istnieje granica \( \displaystyle \lim_{n\to \infty}\root{n}\of{|a_n|}\in[0,\infty ] \) (tj. skończona lub równa \( \displaystyle \infty \)).
Korzystając z kryterium Cauchy'ego zbieżności szeregów, można wykazać
Twierdzenie 9.11. [twierdzenie Cauchy'ego-Hadamarda]
Szereg potęgowy \( \displaystyle \displaystyle \sum_{n=0}^{\infty}a_n (x-x_0)^n \) jest zbieżny w przedziale otwartym \( \displaystyle (x_0 -R, x_0 +R) \), gdzie \( \displaystyle \frac{1}{R}=\lim_{n\to \infty}\root{n}\of{|a_n|}. \)
Jeśli \( \displaystyle \lim_{n\to \infty}\root{n}\of{|a_n|}=0 \), przyjmujemy \( \displaystyle R=\infty \);
jeśli zaś \( \displaystyle \lim_{n\to \infty}\root{n}\of{|a_n|}=\infty \), przyjmujemy \( \displaystyle R=0 \).
Liczbę \( \displaystyle R \) nazywamy promieniem zbieżności szeregu potęgowego.
Można wykazać następujące
Twierdzenie 9.12.
Funkcja \( \displaystyle \displaystyle f(x)=\sum_{n=0}^{\infty}a_n (x-x_0)^n \) jest różniczkowalna w każdym punkcie przedziału otwartego \( \displaystyle (x_0-R, x_0+R) \), gdzie \( \displaystyle R \) jest promieniem zbieżności szeregu potęgowego. Pochodną tej funkcji wyraża szereg potęgowy
\( \displaystyle \displaystyle f'(x)=\sum_{n=1}^{\infty}na_n (x-x_0)^{n-1}, \ \ |x-x_0 | < R. \)
Innymi słowy: szereg potęgowy można różniczkować wewnątrz przedziału, w którym jest zbieżny, a jego pochodną jest szereg pochodnych jego składników.
Zastosujmy twierdzenie o różniczkowaniu szeregu potęgowego do wyznaczenia pochodnej funkcji wykładniczej \( \displaystyle \exp x \) oraz funkcji sinus i cosinus, które definiuje się za pomocą szeregów potęgowych.
Wniosek 9.13.
Funkcje
\( \begin{array}{lllll} \begin{displaystyle} \displaystyle \displaystyle x\mapsto \exp x & = & \displaystyle \sum_{n=0}^{\infty}\frac{x^n}{n!} & = & 1+x+\frac{x^2}{2!}+\frac{x^3}{3!}+\frac{x^4}{4!}\displaystyle +\frac{x^5}{5!}+\dots \\ \displaystyle x\mapsto \sin x & = & \displaystyle \sum_{k=0}^{\infty}\frac{(-1)^kx^{2k+1}}{(2k+1)!} & = & 0+x+0-\frac{x^3}{3!}+0+\frac{x^5}{5!}+\dots \\ \displaystyle x\mapsto \cos x & = & \displaystyle \sum_{k=0}^{\infty}\frac{(-1)^kx^{2k}}{(2k)!} & = & 1+0-\frac{x^2}{2!}+0+\frac{x^4}{4!}+0-\dots \end{displaystyle}\end{array} \)
są różniczkowalne w każdym punkcie \( \displaystyle x\in \mathbb{R} \), przy czym
\( \begin{array}{lll}\displaystyle (\exp x)' & = & \exp x, \\ (\sin x)' & = & \cos x, \\ (\cos x)' & = & - \sin x. \end{array} \)
Dowód 9.13.
Promień zbieżności każdego z powyższych szeregów definiujących odpowiednio funkcje \( \displaystyle \exp \) sinus i cosinus równy jest nieskończoności, ponieważ \( \displaystyle \lim_{n\to\infty}\root{n}\of{n!}=\infty \). Aby przekonać się o tym, możemy na przykład zastosować oszacowanie
\( \displaystyle \big(\frac{n}{3}\big)^n\leq n! \leq \big(\frac{n}{2}\big)^n, \text{ dla } n\geq 6, \)
z którego mamy
\( \displaystyle \frac{n}{3}\leq \root{n}\of{n!}\leq \frac{n}{2}. \)
Na mocy twierdzenia o trzech ciągach istnieje więc granica \( \displaystyle \lim_{n\to\infty}\root{n}\of{n!}=\infty \).
Stąd w całym przedziale \( \displaystyle (-\infty, \infty) \) możemy stosować twierdzenie o różniczkowaniu szeregu potęgowego i mamy
\( \displaystyle \begin{align*}(\exp x)' & =\sum_{n=1}^{\infty}\frac{nx^{n-1}}{n!}=\sum_{n=1}^{\infty}\frac{x^{n-1}}{(n-1)!} \text{\ \ (podstawiamy }k:=n-1 \text{)} \\ & =\sum_{k=0}^{\infty}\frac{x^k}{k!}=\exp x.\end{align*} \)
W podobny sposób dowodzimy dwóch pozostałych równości: \( \displaystyle (\sin x)'=\cos x \) oraz \( \displaystyle (\cos x)'=-\sin x \).
Oszacowanie
\( \displaystyle \big(\frac{n}{3}\big)^n\leq n! \leq \big(\frac{n}{2}\big)^n, \text{ dla } n\geq 6, \)
można wykazać indukcyjnie (szczegóły dowodu znajdują się np. w podręczniku Leona Jeśmianowicza i Jerzego Łosia Zbiór zadań z algebry, Państwowe Wydawnictwo Naukowe, wyd.VII, Warszawa 1976). Uogólnieniem tego oszacowania jest
Twierdzenie 9.14. [twierdzenie Stirlinga]
Dla dowolnej liczby naturalnej \( \displaystyle n \) istnieje liczba \( \displaystyle \theta_n \in [0,1) \) (zależna od wyboru liczby \( \displaystyle n \)) taka, że zachodzi równość
\( \displaystyle n!=\big(\frac{n}{e}\big)^n\sqrt{2\pi n}\exp\frac{\theta_n}{12 n}. \)
Równość tę nazywamy wzorem Stirlinga. Zwróćmy uwagę, że dla dużych \( \displaystyle n \) czynnik \( \displaystyle \exp\frac{\theta_n}{12 n}\approx 1 \), stąd
\( \displaystyle n!\approx \big(\frac{n}{e}\big)^n\sqrt{2\pi n}. \)
W wielu praktycznych obliczeniach wystarczy posługiwać się nawet przybliżeniem
\( \displaystyle n!\approx \big(\frac{n}{e}\big)^n \)
lub (pamiętając, że \( \displaystyle 2 < e < 3 \)) oszacowaniem
\( \displaystyle \big(\frac{n}{3}\big)^n\leq n! \leq \big(\frac{n}{2}\big)^n \), dla \( \displaystyle n\geq 6, \)
które wykorzystaliśmy do wyznaczenia promienia zbieżności szeregu definiującego funkcję \( \displaystyle \exp \).
Funkcja \( \displaystyle x\mapsto \ln x \) jest odwrotna do funkcji \( \displaystyle x\mapsto\exp x \). Stąd - na mocy twierdzenia o pochodnej funkcji odwrotnej - mamy
Uwaga 9.15. [wzór na pochodną logarytmu naturalnego]
\( \displaystyle \frac{d}{dx}\ln x=\frac{1}{\frac{d}{dy}\exp y}=\frac{1}{\exp y}=\frac{1}{\exp(\ln x)}=\frac{1}{x}. \)
Zauważmy też, że pochodna \( \displaystyle \frac{d}{dx}\ln|x|=\frac{1}{x} \), dla \( \displaystyle x\neq 0 \). Oznaczmy symbolem \( \displaystyle \mathrm{\,abs}\, (x)=|x| \) wartość bezwzględną liczby \( \displaystyle x \). Na mocy twierdzenia o pochodnej złożenia funkcji mamy równość
\( \begin{array}{lll} \displaystyle \frac{d}{dx}(\ln|x|) & = & (\ln\circ\mathrm{\,abs}\,)'(x)=(\ln)'(\mathrm{\,abs}\,(x))\cdot (\mathrm{\,abs}\,)'(x) \\ \displaystyle & = & \displaystyle \frac{1}{|x|}\cdot\mathrm{sgn}\, x=\frac{x}{|x|^2}=\frac{1}{x}.\end{array} \)
Ogólnie:
Uwaga 9.16.
Jeśli \( \displaystyle f \) jest funkcją różniczkowalną w punkcie \( \displaystyle x_0 \) i \( \displaystyle f(x_0)\neq 0 \), to istnieje pochodna złożenia \( \displaystyle \ln |f|=\ln\circ\mathrm{\,abs}\,\circ f \) w punkcie \( \displaystyle x_0 \) i jest równa \( \displaystyle \displaystyle (\ln|f|)'(x_0)=\frac{f'(x_0)}{f(x_0)} \).
Przykład 9.17.
Mamy
\( \displaystyle \frac{d}{dx}\ln|\sin x|=\frac{\cos x}{\sin x}=\mathrm{ctg}\, x, \)
a także
\( \displaystyle \frac{d}{dx}\ln|\cos x|=\frac{-\sin x}{\cos x}=-\mathrm{tg}\, x. \)
Wniosek 9.18.
Pochodną funkcji \( \displaystyle x\mapsto g(x)^{f(x)}=\exp\big(f(x)\ln g(x)\big) \) wyznaczymy, różniczkując złożenie iloczynu funkcji \( \displaystyle x\mapsto f(x)\ln g(x) \) z funkcją wykładniczą \( \displaystyle \exp \).
Przykład 9.19.
a) Wyznaczmy pochodną funkcji wykładniczej o podstawie \( \displaystyle a>0 \). Mamy \( \displaystyle a^x=\exp (x \ln a) \), więc
\( \displaystyle \frac{d}{dx}a^x=\frac{d}{dx}\big(\exp (x \ln a)\big)= \exp (x \ln a)\cdot \frac{d}{dx} \big(x \ln a\big)=a^x \ln a, \) czyli \( \displaystyle (a^x)'=a^x \ln a \).
b) Wiemy już, że \( \displaystyle \frac{d}{dx}x^n=nx^{n-1} \), gdy \( \displaystyle n \) jest liczbą naturalną. Korzystając z równości \( \displaystyle x^a=\exp(a \ln x),x>0 \) jesteśmy także w stanie wykazać, że \( \displaystyle (x^a)'=ax^{a-1} \), gdy \( \displaystyle a \) jest dowolną liczbą rzeczywistą. Mamy bowiem
\( \displaystyle \frac{d}{dx}x^a=\frac{d}{dx}\big(\exp(a \ln x)\big)=\exp(a \ln x)\cdot \frac{d}{dx}(a \ln x)=x^a \cdot \frac{a}{x}=ax^{a-1}. \)
Wprost z definicji funkcji hiperbolicznych, które poznaliśmy w drugim module, korzystając z faktu, że pochodna \( \displaystyle (\exp x)'=\exp x \), wyprowadzamy
Wniosek 9.20.
Wzory na pochodne funkcji hiperbolicznych
\( \begin{array}{lll} \begin{displaystyle} \displaystyle (\sinh x)' & = & \displaystyle \frac{1}{2}(\exp x-\exp(-x))'=\frac{1}{2}(\exp x+\exp(-x))=\cosh x, \\ \displaystyle (\cosh x)' & = & \displaystyle \frac{1}{2}(\exp x+\exp(-x))'=\frac{1}{2}(\exp x-\exp(-x))=\sinh x, & \\ \displaystyle (\textrm{tgh } x)' & = & \displaystyle \bigg(\frac{\sinh x}{\cosh x}\bigg)'=\frac{\cosh x\cosh x-\sinh x\sinh x}{\cosh^2x}=1-\tgh^2 x=\frac{1}{\cosh^2 x}, \\ \displaystyle (\textrm{ctgh } x)' & = & \displaystyle \bigg(\frac{\cosh x}{\sinh x}\bigg)'=\frac{\sinh x\sinh x-\cosh x\cosh x}{\sinh^2x}=1-\ctgh^2 x=\frac{-1}{\sinh^2x}. \end{displaystyle}\end{array} \)
Dowodząc dwóch ostatnich wzorów, skorzystaliśmy z twierdzenia o pochodnej iloczynu oraz z tożsamości \( \displaystyle \cosh^2 x-\sinh^2 x=1 \), zwanej jedynką hiperboliczną.
Korzystając z twierdzenia o pochodnej funkcji odwrotnej i powyższych wzorów, możemy łatwo wykazać, że
\( \displaystyle ({\rm arsinh\, } x)'=\frac{1}{\sqrt{1+x^2}} \) oraz \( \displaystyle ({\rm artgh\, } x)'=\frac{1}{1-x^2}. \) Szczegółowe obliczenia przeprowadzimy w ramach ćwiczeń.
Uwaga 9.21.
Otrzymane wzory warto zestawić i porównać ze wzorami określającymi pochodne funkcji trygonometrycznych i cyklometrycznych.
\( \displaystyle \begin{align*} & (\sinh x)'=\cosh x, \ \ \ \ & & (\sin x)'=\cos x, \\ & (\cosh x)'=\sinh x, \ \ \ \ & & (\cos x)'=-\sin x, \\ & (\textrm{tgh } x)'=1-\textrm{tgh }^2 x, \ \ \ \ & & (\mathrm{tg}\, x)'=1+\mathrm{tg}\,^2 x, \\ & (\textrm{ctgh } x)'=1-\textrm{ctgh }^2 x, \ \ \ \ & & (\mathrm{ctg}\, x)'=-1-\mathrm{ctg}\,^2 x, \\ & ({\rm arsinh\, } x)'=\frac{1}{\sqrt{1+x^2 }}, \ \ \ \ & & (\arcsin x)'=\frac{1}{\sqrt{1-x^2 }}, \\ & ({\rm artgh\, } x)'=\frac{1}{1-x^2 }, \ \ \ \ & & (\mathrm{arctg}\, x)'=\frac{1}{1+x^2}. \end{align*} \)
Niech \( \displaystyle X\subset \mathbb{R} \) będzie niepustym podzbiorem zbioru liczb rzeczywistych i niech \( \displaystyle f:X\mapsto \mathbb{R} \). Oznaczmy przez \( \displaystyle d(x,y):=|x-y| \) odległość punktów \( \displaystyle x, y\in X \).
Definicja 9.22.
Mówimy, że funkcja \( \displaystyle f: X\mapsto \mathbb{R} \) osiąga maksimum lokalne (odpowiednio: minimum lokalne) w punkcie \( \displaystyle x_0\in X \), jeśli istnieje pewne otoczenie punktu \( \displaystyle x_0 \), w którym wartości funkcji \( \displaystyle f \) są nie większe (odpowiednio: nie mniejsze) od wartości funkcji \( \displaystyle f \) w punkcie \( \displaystyle x_0 \), to znaczy
\( \displaystyle \exists \delta>0 : \forall x\in X : d(x, x_0) < \delta \Longrightarrow f(x)\leq f(x_0), \)
odpowiednio:
\( \displaystyle \exists \delta>0 : \forall x\in X : d(x, x_0) < \delta \Longrightarrow f(x)\geq f(x_0). \)
Jeśli ponadto w pewnym sąsiedztwie punktu \( \displaystyle x_0 \) funkcja przyjmuje wartości mniejsze (odpowiednio: większe) od wartości funkcji \( \displaystyle f(x_0) \) w punkcie \( \displaystyle x_0 \), co zapisujemy:
\( \displaystyle \exists \delta>0 : \forall x\in X : 0 < d(x, x_0) < \delta \Longrightarrow f(x) < f(x_0), \)
odpowiednio:
\( \displaystyle \exists \delta>0 : \forall x\in X :0 < d(x, x_0) < \delta \Longrightarrow f(x)> f(x_0), \)
to mówimy, że funkcja \( \displaystyle f \) osiąga silne (ścisłe) maksimum lokalne (odpowiednio: silne (ścisłe) minimum lokalne) w punkcie \( \displaystyle x_0 \). Jeśli \( \displaystyle f(x_0)=\sup f(X) \) (odpowiednio: \( \displaystyle f(x_0)=\inf f(X) \)) - to znaczy: jeśli w punkcie \( \displaystyle x_0 \) funkcja \( \displaystyle f \) osiąga kres górny wartości (odpowiednio: kres dolny wartości) w zbiorze \( \displaystyle X \), to mówimy, że funkcja \( \displaystyle f \) osiąga w punkcie \( \displaystyle x_0 \) maksimum globalne (odpowiednio: minimum globalne). Minima i maksima lokalne (odpowiednio: minima i maksima globalne) nazywamy też krótko ekstremami lokalnymi (odpowiednio: ekstremami globalnymi) funkcji.
Przykład 9.23.
Funkcja \( \displaystyle f(x)=x^2 \) zawężona do przedziału \( \displaystyle -1\leq x\leq 2 \) osiąga minimum lokalne w punkcie \( \displaystyle x=0 \) równe \( \displaystyle f(0)=0 \). Funkcja ta osiąga dwa maksima lokalne w punktach \( \displaystyle x=-1 \) oraz \( \displaystyle x=2 \) równe odpowiednio: \( \displaystyle f(-1)=1 \) oraz \( \displaystyle f(2)=4 \). Kresem górnym wartości funkcji \( \displaystyle f \) w przedziale \( \displaystyle [-1,2] \) jest liczba 4, stąd w punkcie \( \displaystyle x=2 \) funkcja \( \displaystyle f \) osiąga maksimum globalne. Kresem dolnym wartości funkcji \( \displaystyle f \) jest liczba zero, stąd w \( \displaystyle x=0 \) funkcja osiąga minimum globalne.
Z kolei \( \displaystyle f(x)=x^2 \) zawężona do przedziału lewostronnie otwartego \( \displaystyle -1 < x\leq 2 \) osiąga minimum globalne w punkcie \( \displaystyle x=0 \), a w punkcie \( \displaystyle x=2 \) osiąga maksimum globalne. Nie osiąga ekstremum w punkcie \( \displaystyle x=-1 \), gdyż nie jest określona w tym punkcie.
Zawężenie funkcji \( \displaystyle f(x)=x^2 \) do przedziału obustronnie otwartego \( \displaystyle -1 < x < 2 \) osiąga minimum globalne w punkcie \( \displaystyle x=0 \) i jest to jedyne ekstremum tej funkcji. W przedziale \( \displaystyle (-1,2) \) nie osiąga bowiem maksimum. Kres górny zbioru wartości funkcji \( \displaystyle f \) w przedziale \( \displaystyle (-1,2) \) wynosi \( \displaystyle 4 \), kres ten nie jest realizowany przez żadną wartość funkcji, to znaczy nie istnieje argument \( \displaystyle x\in (-1,2) \) taki, że \( \displaystyle f(x)=\sup\{f(t), -1 < t < 2\} \).
Wykażemy teraz twierdzenie stanowiące warunek konieczny istnienia ekstremum funkcji w punkcie, w którym jest ona różniczkowalna.
Niech \( \displaystyle f:\mathbb{R}\mapsto\mathbb{R} \) będzie funkcją określoną w pewnym otoczeniu punktu \( \displaystyle x_0\in \mathbb{R} \).
Twierdzenie 9.24.
Jeśli funkcja \( \displaystyle f:(a,b)\mapsto\mathbb{R} \) osiąga ekstremum w punkcie \( \displaystyle x_0\in (a,b) \) i jest różniczkowalna w punkcie \( \displaystyle x_0 \), to pochodna \( \displaystyle f'(x_0)=0 \).
Dowód 9.24.
Załóżmy, że w punkcie \( \displaystyle x_0 \) funkcja osiąga maksimum lokalne. Wobec tego istnieje liczba \( \displaystyle \delta >0 \) taka, że dla \( \displaystyle x\in (x_0-\delta, x_0) \) mamy
\( \displaystyle \frac{f(x_0)-f(x)}{x_0-x}\geq 0, \)
natomiast dla \( \displaystyle x\in (x_0, x_0+\delta) \) mamy
\( \displaystyle \frac{f(x_0)-f(x)}{x_0-x}\leq 0. \)
Wobec istnienia pochodnej \( \displaystyle f'(x_0) \), istnieją granice powyższych ilorazów różnicowych
\( \displaystyle \lim_{x\to x_0 -}\frac{f(x_0)-f(x)}{x_0-x}\geq 0 \) oraz \( \displaystyle \lim_{x\to x_0 +}\frac{f(x_0)-f(x)}{x_0-x}\leq 0 \)
i muszą być równe. Stąd \( \displaystyle f'(x_0)=0 \). W przypadku, gdy w punkcie \( \displaystyle x_0 \) funkcja osiąga minimum, rozumowanie przebiega podobnie.
Zwróćmy uwagę, że w twierdzeniu nie zakładaliśmy ciągłości funkcji \( \displaystyle f \) w otoczeniu punktu \( \displaystyle x_0 \). Pamiętamy, że z faktu istnienia pochodnej \( \displaystyle f'(x_0) \) wynika ciągłość funkcji \( \displaystyle f \) w punkcie \( \displaystyle x_0 \).
Twierdzenie 9.25. [twierdzenie Rolle'a]
Niech \( \displaystyle f:[a,b]\mapsto \mathbb{R} \) będzie funkcją ciągłą w przedziale domkniętym \( \displaystyle [a,b] \) i różniczkowalną wewnątrz tego przedziału. Jeśli na końcach przedziału funkcja \( \displaystyle f \) przyjmuje równe wartości \( \displaystyle f(a)=f(b) \), to istnieje punkt \( \displaystyle \xi\in(a,b) \), w którym zeruje się pochodna funkcji \( \displaystyle f'(\xi)=0 \).
Dowód 9.25.
Jeśli funkcja \( \displaystyle f \) jest stała, to w każdym punkcie \( \displaystyle \xi\in (a,b) \) mamy \( \displaystyle f'(\xi)=0 \). Jeśli natomiast \( \displaystyle f \) nie jest stała, to z twierdzenia Weierstrassa o osiąganiu kresów przez funkcję ciągłą na zbiorze zwartym wynika, że w pewnym punkcie \( \displaystyle \xi\in (a,b) \) funkcja \( \displaystyle f \) osiąga kres górny lub kres dolny. Na podstawie poprzedniego twierdzenia pochodna w tym punkcie zeruje się, tj. \( \displaystyle f'(\xi)=0 \).
Twierdzenie Rolle'a (zgodnie z interpretacją geometryczną pochodnej) orzeka, że jeśli funkcja różniczkowalna w przedziale \( \displaystyle (a,b) \) przyjmuje na końcach przedziału \( \displaystyle [a,b] \) (w którym jest ciągła) tę samą wartość, to między punktami \( \displaystyle a \) i \( \displaystyle b \) da się znaleźć punkt \( \displaystyle \xi \) taki, że styczna do wykresu funkcji \( \displaystyle f \) w punkcie \( \displaystyle (\xi, f(\xi)) \) jest pozioma, tj. równoległa do osi rzędnych.
Twierdzenie Rolle'a wymaga założenia o ciągłości funkcji w przedziale domkniętym \( \displaystyle [a,b] \) i różniczkowalności we wszystkich punktach przedziału \( \displaystyle (a,b) \).
Przykład 9.26.
Funkcja
\( \displaystyle f(x)=\left \{\begin{align*} & 0, & \text{ dla } & x=0 \\ & \mathrm{ctg}\,(x), & \text{ dla } & 0 < x < \frac{\pi}{2}, \end{align*}. \right. \)
jest określona na przedziale domkniętym \( \displaystyle [0, \frac{\pi}{2}] \) i jest różniczkowalna wewnątrz tego przedziału, gdyż
\( \displaystyle \forall x\in(0, \pi)\ \exists f'(x)=-1-\mathrm{ctg}\,^2 x \leq -1 < 0. \)
Stąd w żadnym punkcie przedziału \( \displaystyle (0, \frac{\pi}{2}) \) pochodna \( \displaystyle f' \) nie zeruje się, mimo że na końcach tego przedziału funkcja przyjmuje takie same wartości: \( \displaystyle f(0)=f(\frac{\pi}{2})=0 \). Twierdzenie Rolle'a nie zachodzi w tym przypadku, funkcja \( \displaystyle f \) nie jest bowiem ciągła w punkcie \( \displaystyle x=0 \).
Przykład 9.27.
Funkcja \( \displaystyle f(x)=|x| \) jest ciągła w przedziale \( \displaystyle [-1,1] \) i na jego końcach osiąga równe wartości. Jest także różniczkowalna we wnętrzu tego przedziału z wyjątkiem tylko jednego punktu \( \displaystyle x=0 \), w którym nie istnieje pochodna \( \displaystyle f' \). Twierdzenia Rolle'a również w tym przypadku nie stosuje się, gdyż - jak pamiętamy - dla \( \displaystyle x\neq 0 \) mamy
\( \displaystyle f'(x)=\mathrm{sgn}\,(x)=\left \{\begin{align*} 1 & , & \text{ dla } & x>0 \\ -1 & , & \text{ dla } & x < 0. \end{align*}, \right. \)
a więc nie ma w zbiorze \( \displaystyle (-1, 0)\cup (0, 1) \) takiego punktu, w którym zerowałaby się pochodna \( \displaystyle f' \).
W szczególności nie istnieje styczna do wykresu funkcji \( \displaystyle x\mapsto |x| \) w punkcie \( \displaystyle (0,0) \).
Dziedzina \( \displaystyle \mathrm{dom}\, f' \) pochodnej \( \displaystyle f' \) jest zawsze podzbiorem dziedziny \( \displaystyle \mathrm{dom}\, f \) funkcji \( \displaystyle f \). Z twierdzenia 9.24. wynika, że jeśli funkcja osiąga ekstremum w punkcie \( \displaystyle a\in \mathrm{dom}\, f' \), to \( \displaystyle f'(a)=0 \). Jednak funkcja \( \displaystyle f \) może osiągać również ekstrema w tych punktach, w których nie istnieje pochodna, tzn. w punktach zbioru \( \displaystyle \mathrm{dom}\, f\setminus \mathrm{dom}\, f' \).
Definicja 9.28.
Niech \( \displaystyle f:\mathbb{R} \mapsto \mathbb{R} \). Mówimy, że punkt \( \displaystyle a\in \mathrm{dom}\, f \) jest punktem krytycznym funkcji \( \displaystyle f \), jeśli funkcja \( \displaystyle f \) nie jest różniczkowalna w punkcie \( \displaystyle a \) albo jest w tym punkcie różniczkowalna i pochodna \( \displaystyle f'(a)=0 \). Zbiór punktów
\( \displaystyle \{a\in \mathrm{dom}\, f: a\notin \mathrm{dom}\, f'\}\cup \{a\in \mathrm{dom}\, f': f'(a)=0\} \)
nazywamy zbiorem punktów krytycznych funkcji \( \displaystyle f \).
Wiemy (zob. przykład 9.4.), że funkcja \( \displaystyle f \) może nie być różniczkowalna w kilku punktach, a nawet w żadnym punkcie swojej dziedziny, mimo że jest ciągła. Badając przebieg zmienności funkcji, nie możemy więc zawężać poszukiwania punktów ekstremalnych wyłącznie do tych punktów, w których funkcja jest różniczkowalna.
Uwaga 9.29.
Jeśli funkcja \( \displaystyle f \) osiąga ekstremum w pewnym punkcie, to punkt ten jest jej punktem krytycznym.
Dowód 9.29.
Funkcja \( \displaystyle f \) może osiągać ekstremum w punkcie, który należy do dziedziny pochodnej \( \displaystyle \mathrm{dom}\, f' \) albo do różnicy dziedziny funkcji i dziedziny jej pochodnej \( \displaystyle \mathrm{dom}\, f\setminus \mathrm{dom}\, f' \). W przypadku, gdy \( \displaystyle a\in\mathrm{dom}\, f' \), na mocy twierdzenia 9.24.> mamy
\( \displaystyle f'(a)=0 \), punkt \( \displaystyle a \) jest więc krytyczny. Z kolei, jeśli \( \displaystyle a\in\mathrm{dom}\, f\setminus \mathrm{dom}\, f' \), to punkt \( \displaystyle a \) jest krytyczny, z definicji 9.28.
Zauważmy, że powyższa uwaga doprecyzowywuje warunek konieczny istnienia ekstremum zawarty w twierdzeniu 9.24. w przypadku, gdy funkcja \( \displaystyle f \) nie jest różniczkowalna w punkcie, w którym osiąga ekstremum. Co więcej, funkcja \( \displaystyle f \) może osiągać ekstremum w punkcie, w którym nie jest nawet ciągła (zob. przykład poniżej). Punkt taki - na mocy uwagi uwagi 9.2.- należy do zbioru \( \displaystyle \mathrm{dom}\, f\setminus \mathrm{dom}\, f' \), jest więc krytyczny.
Przykład 9.30.
a) Funkcja \( \displaystyle f(x)=|x| \) określona jest w zbiorze \( \displaystyle \mathrm{dom}\, f= \mathbb{R} \), a różniczkowalna w \( \displaystyle \mathrm{dom}\, f'=\mathbb{R}\setminus \{0\} \). Jedynym punktem krytycznym \( \displaystyle f \) jest punkt \( \displaystyle 0\in \mathrm{dom}\, f\setminus \mathrm{dom}\, f' \), w którym \( \displaystyle f \) osiąga minimum.
b) Funkcja
\( \displaystyle \tilde{f}(x)=\{\begin{align*} 1, \text{ dla } x=0, \\ |x|, \text{ dla } x\neq 0\end{align*} . \)
różni się od poprzedniej funkcji jedynie wartością w zerze, nie jest w tym punkcie ciągła. Pochodna \( \displaystyle \tilde{f}'(x)=\mathrm{sgn}\, x \) nie zeruje się w żadnym punkcie swojej dziedziny \( \displaystyle \mathrm{dom}\, \tilde{f}'=(-\infty, 0)\cup (0, \infty) \). Jedynym punktem krytycznym funkcji \( \displaystyle \tilde{f} \) jest więc zero, w którym funkcja ta osiąga silne maksimum lokalne, gdyż dla \( \displaystyle 0 < |x| < 1 \) mamy \( \displaystyle \tilde{f}(x) < 1=\tilde{f}(0) \).
Przykład 9.31.
Funkcja \( \displaystyle f(x)=x \) zacieśniona do przedziału domkniętego \( \displaystyle [-1, \ 2] \) jest różniczkowalna w przedziale otwartym \( \displaystyle (-1,\ 2) \). W każdym punkcie \( \displaystyle -1 < x < 2 \) mamy \( \displaystyle f'(x)=1\neq 0 \). Stąd jedynymi punktami krytycznym są punkty \( \displaystyle \mathrm{dom}\, f\setminus \mathrm{dom}\, f'=\{-1, \ 2\} \), czyli końce przedziału domkniętego. W punkcie \( \displaystyle x=-1 \) funkcja \( \displaystyle f \) osiąga minimum \( \displaystyle f(-1)=-1 \), a w \( \displaystyle x=2 \) maksimum \( \displaystyle f(2)=2 \).
Przykład 9.32.
Funkcja \( \displaystyle f(x)=\sqrt{1-x^2} \) określona jest na przedziale domkniętym \( \displaystyle \mathrm{dom}\, f=[-1, \ 1] \), a jej pochodna \( \displaystyle f'(x) = \frac{-x}{\sqrt{1-x^2}} \) istnieje w punktach przedziału otwartego \( \displaystyle \mathrm{dom}\, f'=(-1,1) \). Pochodna zeruje się w punkcie \( \displaystyle x=0 \). Stąd zbiór punktów krytycznych funkcji \( \displaystyle f \) składa się z trzech punktów: \( \displaystyle \{-1, \ 0, \ 1\} \). Funkcja \( \displaystyle f \) osiąga w punkcie \( \displaystyle 0 \) maksimum \( \displaystyle f(0)=1 \), a w dwóch pozostałych punktach krytycznych osiąga minima \( \displaystyle f(-1)=f(1)=0 \). Zwróćmy uwagę, że w obu tych punktach pochodna nie istnieje. Co więcej, granice jednostronne pochodnej \( \displaystyle f' \):
\( \displaystyle \lim_{x\to -1+}f'(x)=\infty \ \ \text{ oraz } \ \ \lim_{x\to 1-}f'(x)=-\infty \)
są nieskończone.
Przykład 9.33.
Funkcja \( \displaystyle f(x)=\sqrt{x^2 -1} \) określona jest dla \( \displaystyle |x|\geq 1 \). Stąd \( \displaystyle \mathrm{dom}\, f=(-\infty, -1]\cup[1, \infty). \) Jej pochodna \( \displaystyle f'(x)=\frac{x}{\sqrt{x^2-1}} \) określona jest w sumie przedziałów otwartych \( \displaystyle \mathrm{dom}\, f'=(-\infty, -1)\cup (1, \infty) \). Zwróćmy uwagę, że pochodna nie zeruje się w żadnym punkcie swojej dziedziny. Jednak zbiór punktów krytycznych funkcji \( \displaystyle f \) zawiera dwa punkty: \( \displaystyle -1 \) oraz \( \displaystyle 1 \), w których funkcja \( \displaystyle f \) osiąga minima
\( \displaystyle f(-1)=f(1)=0 \).
W punktach zbioru \( \displaystyle \mathrm{dom}\, f\setminus \mathrm{dom}\, f' \) funkcja nie musi osiągać ekstremum, co ilustrują kolejne przykłady.
Przykład 9.34.
Każdy punkt przedziału \( \displaystyle [0,1] \) jest punktem krytycznym funkcji Dirichleta
\( \displaystyle f(x)=\left \{\begin{align*} & 1, & \text{ dla } & x\in[0,1]\cap \mathbb{Q} \\ & 0, & \text{ dla } & x\in[0,1]\cap (\mathbb{R}\setminus \mathbb{Q})\end{align*} . \right. \)
gdyż nie jest ona różniczkowalna (ani nawet ciągła) w żadnym punkcie tego przedziału. Jednak w żadnym punkcie przedziału \( \displaystyle [0,1] \) (ani w punkcie wymiernym, ani w niewymiernym) funkcja Dirichleta nie osiąga ekstremum, gdyż w dowolnie małym otoczeniu któregokolwiek punktu znajdziemy punkty wymierne i niewymierne, w których funkcja przyjmuje skrajnie różne wartości: albo jeden, albo zero.
Przykład 9.35.
Funkcja
\( \displaystyle f(x)= \left \{\begin{align*} & \sqrt{x}, & \text{dla } & x\geq 0 \\ - & \sqrt{-x}, & \text{ dla } & x < 0\end{align*}., \right. \)
określona jest dla wszystkich liczb rzeczywistych, stąd \( \displaystyle \mathrm{dom}\, f=(-\infty, \infty) \). Jej pochodna
\( \displaystyle f'(x)=\left\{\begin{align*} & \frac{1}{2\sqrt{x}}, & \text{ dla } & x> 0 \\ & \frac{1}{2\sqrt{-x}}, & \text{ dla } & x < 0\end{align*}\right\} =\frac{1}{2\sqrt{|x|}}, \text{ dla } x\neq 0 \)
nie zeruje się w żadnym punkcie swojej dziedziny \( \displaystyle \mathrm{dom}\, f'=(-\infty, 0)\cup (0, \infty) \). Funkcja \( \displaystyle f \) jest nieparzysta, ściśle rosnąca, nie osiąga więc ekstremum w żadnym punkcie swojej dziedziny, również w \( \displaystyle x=0 \), mimo że jest to punkt krytyczny tej funkcji.
Wnioskiem z twierdzenia Rolle'a jest następujące
Twierdzenie 9.36. [twierdzenie Cauchy'ego]
Niech \( \displaystyle f,g: [a,b]\mapsto \mathbb{R} \) będą funkcjami ciągłymi w przedziale domkniętym \( \displaystyle [a,b] \) i różniczkowalnymi w przedziale otwartym \( \displaystyle (a,b) \). Wówczas istnieje punkt \( \displaystyle \xi\in (a,b) \) taki, że
\( \displaystyle \big(f(b)-f(a)\big)g'(\xi)=\big(g(b)-g(a)\big)f'(\xi). \)
Zwróćmy uwagę, że powyższą równość można zapisać w bardziej przejrzystej postaci (i łatwiejszej do zapamiętania):
\( \displaystyle \frac{f(b)-f(a)}{g(b)-g(a)}=\frac{f'(\xi)}{g'(\xi)}, \)
o ile \( \displaystyle g(a)\neq g(b) \) oraz \( \displaystyle g'(\xi)\neq 0 \). Twierdzenie Cauchy'ego głosi w tym przypadku, że istnieje wewnątrz przedziału \( \displaystyle (a,b) \) punkt \( \displaystyle \xi \) taki, że stosunek przyrostów wartości funkcji \( \displaystyle f \) i \( \displaystyle g \) między punktami \( \displaystyle a \) i \( \displaystyle b \) jest równy stosunkowi pochodnych tych funkcji w punkcie \( \displaystyle \xi \).
Dowód 9.36.
Rozważmy pomocniczo funkcję \( \displaystyle h(t):=\big(f(b)-f(a)\big)g(t)-\big(g(b)-g(a)\big)f(t) \) określoną dla \( \displaystyle t\in [a,b] \). Funkcja \( \displaystyle h \) jest ciągła w przedziale domkniętym \( \displaystyle [a,b] \), różniczkowalna w przedziale otwartym \( \displaystyle (a,b) \) o pochodnej równej
\( \displaystyle \frac{d}{dt}h(t)=\big(f(b)-f(a)\big)\frac{d}{dt}g(t)-\big(g(b)-g(a)\big)\frac{d}{dt}f(t). \)
Ponadto \( \displaystyle h(a)=h(b) \). Na mocy twierdzenia Rolle'a istnieje więc taki punkt \( \displaystyle \xi\in (a,b) \), w którym zeruje się pochodna \( \displaystyle h'(\xi)=0 \), skąd wynika teza twierdzenia.
Jako wniosek z twierdzenia Cauchy'ego otrzymujemy
Twierdzenie 9.37. [twierdzenie Lagrange'a]
Jeśli funkcja \( \displaystyle f:[a,b]\mapsto \mathbb{R} \) jest ciągła w przedziale domkniętym \( \displaystyle [a,b] \) i różniczkowalna w każdy punkcie przedziału otwartego \( \displaystyle (a,b) \), to istnieje punkt \( \displaystyle \xi\in (a,b) \) taki, że
\( \displaystyle \frac{f(b)-f(a)}{b-a}=f'(\xi). \)
Dowód 9.37.
Wystarczy w twierdzeniu Cauchy'ego podstawić \( \displaystyle g(t)=t. \) Wówczas \( \displaystyle g(b)=b \), \( \displaystyle g(a)=a \) oraz \( \displaystyle g'(t)=1 \).
Twierdzenie Lagrange'a nazywane jest też twierdzeniem o przyrostach (skończonych) lub twierdzeniem o wartości średniej, gdyż tezę twierdzenia można zapisać też następująco:
\( \displaystyle f(b)-f(a)=f'(\xi)(b-a), \text{ dla pewnego } \xi\in (a,b). \)
Innymi słowy: przyrost wartości funkcji \( \displaystyle f(b)-f(a) \) odpowiadający przyrostowi argumentu funkcji od \( \displaystyle a \) do \( \displaystyle b \) równy jest iloczynowi przyrostu argumentu \( \displaystyle b-a \) i wartości pochodnej funkcji \( \displaystyle f \) w pewnym punkcie pośrednim \( \displaystyle \xi \) leżącym między punktami \( \displaystyle a \) i \( \displaystyle b \).
Pamiętamy, że interpretacją geometryczną ilorazu różnicowego \( \displaystyle \displaystyle \frac{f(b)-f(a)}{b-a} \) jest współczynnik kierunkowy siecznej wykresu funkcji \( \displaystyle f \) przechodzącej przez punkty \( \displaystyle (a, f(a)) \) i \( \displaystyle (b, f(b)) \). Twierdzenie Lagrange'a orzeka więc, że między punktami \( \displaystyle a \) i \( \displaystyle b \) da się znaleźć taki punkt \( \displaystyle \xi \), że styczna do wykresu funkcji \( \displaystyle f \) w punkcie \( \displaystyle (\xi, f(\xi)) \) jest równoległa do siecznej przechodzącej przez punkty \( \displaystyle (a, f(a)) \) i \( \displaystyle (b, f(b)) \).
Wnioskiem z twierdzenia Lagrange'a o wartości średniej jest twierdzenie, które wiąże monotoniczność funkcji ze znakiem pierwszej pochodnej.
Twierdzenie 9.38.
Niech \( \displaystyle f \) będzie funkcją różniczkowalną w przedziale \( \displaystyle (a,b) \).
a) Jeśli \( \displaystyle f'(x)\geq 0 \) dla wszystkich \( \displaystyle x\in (a,b) \), to \( \displaystyle f \) jest rosnąca w przedziale \( \displaystyle (a,b) \).
a') Jeśli \( \displaystyle f'(x)> 0 \) dla wszystkich \( \displaystyle x\in (a,b) \), to \( \displaystyle f \) jest ściśle rosnąca w przedziale \( \displaystyle (a,b) \).
b) Jeśli \( \displaystyle f'(x)=0 \) dla wszystkich \( \displaystyle x\in (a,b) \), to \( \displaystyle f \) jest stała w przedziale \( \displaystyle (a,b) \).
c) Jeśli \( \displaystyle f'(x)\leq 0 \) dla wszystkich \( \displaystyle x\in (a,b) \), to \( \displaystyle f \) jest malejąca w przedziale \( \displaystyle (a,b) \).
c') Jeśli \( \displaystyle f'(x) < 0 \) dla wszystkich \( \displaystyle x\in (a,b) \), to \( \displaystyle f \) jest ściśle malejąca w przedziale \( \displaystyle (a,b) \).
Dowód 9.38.
Dla dowolnych punktów \( \displaystyle x_1 < x_2 \) z przedziału \( \displaystyle (a,b) \) zgodnie z twierdzeniem Lagrange'a potrafimy wskazać punkt \( \displaystyle \xi\in (x_1, x_2) \) taki, że \( \displaystyle f(x_2)-f(x_1)=f'(\xi)(x_2-x_1) \). Z równości tej wynikają powyższe implikacje.
Wnioskiem z tego twierdzenia jest warunek wystarczający istnienia ekstremum w przypadku, gdy funkcja jest różniczkowalna.
Wniosek 9.39.
Niech \( \displaystyle f \) będzie funkcją różniczkowalną w przedziale \( \displaystyle (a,b) \). Jeśli w punkcie \( \displaystyle x_0\in(a,b) \) pochodna funkcji \( \displaystyle f \) zeruje się (tj. \( \displaystyle f'(x_0)=0 \)) oraz zmienia znak, to znaczy
a) jest dodatnia w przedziale \( \displaystyle (a,x_0) \) i ujemna w \( \displaystyle (x_0,b) \),
b) jest ujemna w przedziale \( \displaystyle (a,x_0) \) i dodatnia w \( \displaystyle (x_0,b) \),
to funkcja \( \displaystyle f \) osiąga w punkcie \( \displaystyle x_0 \) ekstremum, odpowiednio:
a) minimum lokalne, b) maksimum lokalne.
Dowód 9.39.
a) Na mocy poprzedniego twierdzenia funkcja \( \displaystyle f \) jest ściśle rosnąca w przedziale \( \displaystyle (a, x_0) \) i ściśle malejąca w przedziale \( \displaystyle (x_0, b) \), osiąga więc maksimum lokalne w punkcie \( \displaystyle x_0 \). Dowód w przypadku b) jest podobny.
Zwróćmy uwagę, że nie potrzeba zakładać zerowania się pierwszej pochodnej funkcji w punkcie \( \displaystyle x_0 \). Prawdziwy jest więc także
Wniosek 9.40.
Jeśli funkcja \( \displaystyle f \) ciągła w przedziale \( \displaystyle (a,b) \) jest różniczkowalna w przedziałach \( \displaystyle (a, x_0) \) oraz \( \displaystyle (x_0, b) \), przy czym pochodna \( \displaystyle f' \) jest
a) dodatnia w przedziale \( \displaystyle (a, x_0) \) i ujemna w \( \displaystyle (x_0, b) \),
b) ujemna w przedziale \( \displaystyle (a, x_0) \) i dodania w \( \displaystyle (x_0, b) \),
to funkcja \( \displaystyle f \) osiąga w punkcie \( \displaystyle x_0 \) ekstremum, odpowiednio:
a) minimum lokalne,
b) maksimum lokalne.
Przykład funkcji \( \displaystyle f(x)=|x| \), która osiąga minimum w punkcie \( \displaystyle x_0=0 \), a ma pochodną ujemną dla \( \displaystyle x < 0 \), a dodatnią dla \( \displaystyle x>0 \) i wcale nie ma pochodnej w punkcie \( \displaystyle x_0=0 \), stanowi ilustrację ostatniego wniosku.
Przykład 9.41.
Pochodna funkcji \( \displaystyle f(x)=2x^3+3x^2 -12 x+7 \) wynosi
\( \displaystyle f'(x)=6x^2+6x-12=6(x^2+x-2)=6(x+2)(x-1). \)
Stąd \( \displaystyle f'(x) < 0 \) w przedziale \( \displaystyle (-2,1) \), a w obu przedziałach \( \displaystyle (-\infty, -2) \) oraz \( \displaystyle (1, +\infty) \) pochodna jest dodatnia. Na mocy wykazanego twierdzenia, funkcja \( \displaystyle f \) jest ściśle rosnąca w przedziale \( \displaystyle (-\infty, -2) \), następnie maleje w przedziale \( \displaystyle (-2, 1) \) i znowu rośnie w przedziale \( \displaystyle (1, \infty) \). Wobec tego w punkcie \( \displaystyle x=-2 \) osiąga maksimum lokalne równe \( \displaystyle f(-2)=27 \), a w punkcie \( \displaystyle x=1 \) minimum lokalne równe \( \displaystyle f(1)=0 \).
Uwaga 9.42.
Założenie, że pochodna \( \displaystyle f'(x)\geq 0 \) (odpowiednio \( \displaystyle f'(x)>0 \), \( \displaystyle f'(x)=0 \) itd) w każdym punkcie przedziału \( \displaystyle (a,b) \) jest istotne.
a) Rozważmy funkcję: \( \displaystyle f(x)=[x], \) gdzie \( \displaystyle [x] \) oznacza część całkowitą liczby rzeczywistej \( \displaystyle x \), czyli największą liczbę całkowitą nie większą od \( \displaystyle x \). Wówczas \( \displaystyle f \) jest różniczkowalna w zbiorze \( \displaystyle \mathbb{R}\setminus\mathbb{Z} \) (czyli wszędzie poza zbiorem liczb całkowitych) i w zbiorze tym pochodna \( \displaystyle f'(x)=0 \), mimo że funkcja \( \displaystyle f \) jest rosnąca.
b) Funkcja \( \displaystyle g(x)=x-[x] \) jest różniczkowalna w zbiorze \( \displaystyle \mathbb{R}\setminus\mathbb{Z} \) i w każdym punkcie tego zbioru jej pochodna \( \displaystyle g'(x)=1 \). Jednak funkcja ta nie jest ściśle rosnąca w zbiorze \( \displaystyle \mathbb{R}\setminus \mathbb{Z} \). Jest natomiast ściśle rosnąca w każdym z przedziałów postaci \( \displaystyle (n, n+1) \), gdzie \( \displaystyle n\in\mathbb{Z} \).
Podane funkcje są ciągłe poza zbiorem liczb całkowitych. Można jednak skonstruować przykład funkcji ciągłej, rosnącej o zerowej pochodnej w prawie każdym punkcie, to znaczy w każdym punkcie przedziału \( \displaystyle (0,1) \) poza punktami trójkowego zbioru Cantora
\( \displaystyle C:=\left\{\sum_{k=1}^\infty \frac{a_k}{3^k}, \ \ a_k\in\{0,2\}\right\}. \)
Przypomnijmy, że zbiór ten rozważaliśmy w ramach pierwszego modułu.
Przykład 9.43.
Niech \( \displaystyle \displaystyle x=(0,a_1 a_2 a_3 a_4 \dots)_{(3)}=\sum_{n=1}^{\infty}\frac{a_n}{3^n} \) będzie dowolną liczbą z przedziału \( \displaystyle [0,1] \) zapisaną w systemie trójkowym za pomocą ciągu cyfr \( \displaystyle a_n=a_n(x)\in\{0,1,2\} \). Niech \( \displaystyle N=N(x) \) będzie najmniejszą liczbą naturalną, dla której \( \displaystyle a_n=1 \). Innymi słowy: niech \( \displaystyle N=N(x) \) będzie pozycją pierwszej jedynki w zapisie trójkowym liczby \( \displaystyle x \), licząc od przecinka pozycyjnego w prawo. Jeśli nie ma takiej liczby, przyjmujemy \( \displaystyle N(x)=\infty \). Określmy ciąg
\( \displaystyle b_n=\left\{\begin{align*} \frac{1}{2}a_n, \text{ dla } n < N(x) \\ 1, \text{ dla } n=N(x) \\ 0, \text{ dla } n>N(x)\end{align*} \right. \)
za pomocą którego definiujemy funkcję Cantora (zwaną także diabelskimi schodami) wzorem
\( \displaystyle \displaystyle f(x)=\sum_{k=1}^{N(x)} \frac{b_k}{2^k}. \)
Łatwo sprawdzić, że \( \displaystyle f(0)=0 \), \( \displaystyle f(1)=1 \), a na odcinkach, które usuwamy kolejno z przedziału \( \displaystyle [0,1] \) podczas kolejnych etapów konstrukcji trójkowego zbioru Cantora, funkcja ta jest stała:
\( \displaystyle f(x)=\frac{1}{2} \text{ dla } x\in\big(\frac{1}{3},\displaystyle\frac{2}{3}\big), \)
\( \displaystyle f(x)=\frac{1}{4} \text{ dla } x\in\big(\frac{1}{9},\frac{2}{9}\big) \text{ oraz } f(x)=\frac{3}{4}\text{ dla } x\in\big(\frac{7}{9}, \frac{8}{9}\big), \)
\( \displaystyle f(x)=\frac{1}{8} \text{ dla } x\in \big(\frac{1}{27},\frac{2}{27}\big), \ f(x)=\frac{3}{8} \text{ dla } x\in\big(\frac{7}{27}, \frac{8}{27}\big), \)
\( \displaystyle f(x)=\frac{5}{8} \text{ dla } x\in \big(\frac{19}{27},\frac{20}{27}\big), f(x)=\frac{7}{8} \text{ dla } x\in\big(\frac{25}{27},\frac{26}{27}\big), \)
i tak dalej. Można wykazać, że funkcja ta jest ciągła w każdym punkcie przedziału \( \displaystyle [0,1] \). Zauważmy, że funkcja Cantora jest różniczkowalna w każdym punkcie zbioru \( \displaystyle [0,1]\setminus C \) (tj. w każdym punkcie przedziału \( \displaystyle (0,1) \) poza punktami trójkowego zbioru Cantora \( \displaystyle C \)). Pochodna funkcji Cantora jest w tych punktach równa zeru, a mimo to (co nietrudno zauważyć) funkcja
Cantora jest rosnąca (niemalejąca) w przedziale \( \displaystyle [0,1] \).