Wprowadzenie pojęcia pochodnej funkcji poprzedziliśmy przypomnieniem dwóch wielkości fizycznych: prędkości średniej i prędkości chwilowej w ruchu prostoliniowym. Zwróćmy uwagę na to, że w otaczającym nas świecie ruch po prostej jest rzadkością, gdyż większość obiektów, które obserwujemy, porusza się po drodze na płaszczyźnie dwuwymiarowej, bądź w przestrzeni trójwymiarowej. Wprowadźmy więc pojęcie pochodnej, które odpowiada m.in. potrzebie opisu ruchu w realnym świecie.
Niech \( \displaystyle f: (a,b)\ni t\mapsto f(t)\in Y \) będzie funkcją określoną na przedziale otwartym o wartościach w przestrzeni unormowanej \( \displaystyle Y \). Możemy mieć na myśli na przykład przestrzeń unormowaną \( \displaystyle Y=\mathbb{R}^n \), w której długość wektora \( \displaystyle y=(y_1, y_2, \dots, y_n) \) wyraża norma \( \displaystyle \|y\|=\sqrt{|y_1|^2+|y_2|^2+\dots+|y_n|^2} \).
Definicja 7.1.
Mówimy, że funkcja \( \displaystyle f: (a,b)\mapsto Y \) jest różniczkowalna w punkcie \( \displaystyle t_0\in (a,b) \), jeśli istnieje wektor \( \displaystyle y_0\in Y \) taki, że iloraz różnicowy \( \displaystyle \frac{1}{h}\big(f(t_0+h)-f(t_0)\big) \) zmierza do \( \displaystyle y_0 \) w normie przestrzeni \( \displaystyle Y \), to znaczy
\( \displaystyle \bigg\|\frac{1}{h}\big(f(t_0+h)-f(t_0)\big)-y_0\bigg\|\to 0, \text{ gdy }h\to 0 . \) Wektor \( \displaystyle y_0\in Y \) nazywamy pochodną funkcji \( \displaystyle f \) w punkcie \( \displaystyle t_0 \) i oznaczamy symbolem \( \displaystyle \frac{d}{dt}f(t_0) \) lub \( \displaystyle f'(t_0) \).
Uwaga 7.2.
W szczególnym przypadku, gdy \( \displaystyle Y=\mathbb{R}^n \), funkcja
\( \displaystyle f:(a,b)\ni t \mapsto f(t)=\big(f_1 (t), f_2(t), \dots, f_n(t)\big)\in \mathbb{R}^n \)
jest zestawieniem \( \displaystyle n \) funkcji \( \displaystyle f_k : (a,b) \ni t\mapsto f_k(t)\in \mathbb{R} \) o wartościach liczbowych. Stąd istnienie pochodnej \( \displaystyle \frac{d}{dt}f(t_0) \) jest równoważne istnieniu pochodnych wszystkich składowych funkcji \( \displaystyle f \) w punkcie \( \displaystyle t_0 \). Wówczas też pochodna \( \displaystyle f \) jest zestawieniem pochodnych swoich składowych, tzn.
\( \displaystyle \frac{d}{dt}f(t_0)=\big(\frac{d}{dt}f_1(t_0), \frac{d}{dt}f_2(t_0), \dots, \frac{d}{dt}f_n(t_0)\big). \)
Przykład 7.3.
Rozważmy ruch punktu materialnego opisany równaniami:
\( \displaystyle \left\{\begin{align*} x(t)=a\cos t \\ y(t)=b \sin t\end{align*} \right. \ \ \ \ \text{ gdzie }a\geq b>0. \)
Jak łatwo zauważyć punkt porusza się po elipsie o równaniu
\( \displaystyle \frac{x^2}{a^2}+ \frac{y^2}{b^2}=1, \)
gdyż (na podstawie jedynki trygonometrycznej) mamy równość
\( \displaystyle \displaystyle \frac{x(t)^2}{a^2}+ \frac{y(t)^2}{b^2}=\cos^2 t+\sin^2 t=1. \)
Ruch ten jest okresowy, wystarczy więc ograniczyć zbiór wartości parametru \( \displaystyle t \) do przedziału \( \displaystyle [0, 2\pi] \). Prędkość w tym ruchu jest wektorem o dwóch składowych
\( \displaystyle v(t)=\big(\frac{d}{dt} x(t) , \frac{d}{dt}y(t)\big) =(-a \sin t, b\cos t). \)
Długość wektora prędkości \( \displaystyle v(t) \) jest pierwiastkiem z sumy kwadratów składowych tego wektora:
\( \displaystyle |v(t)|=\sqrt{a^2 \sin^2 t+b^2\cos^2 t}=\sqrt{(a^2-b^2) \sin^2 t+b^2} \)
i jest największa wówczas, gdy funkcja \( \displaystyle t\mapsto \sin^2 t \) przyjmuje wartość największą (równą jedności), a więc w przedziale \( \displaystyle 0\leq t\leq 2\pi \) w chwili \( \displaystyle t=\frac{\pi}{2} \) oraz \( \displaystyle t=\frac{3\pi}{2} \), tj. w punktach \( \displaystyle (0,b) \) oraz \( \displaystyle (0, -b) \) elipsy. Z kolei prędkość \( \displaystyle |v(t)| \) jest najmniejsza wówczas, gdy funkcja \( \displaystyle t\mapsto \sin^2 t \) osiąga wartość najmniejszą (równą zeru). W przedziale \( \displaystyle 0\leq t\leq 2\pi \) zachodzi to w chwili \( \displaystyle t=0 \) oraz \( \displaystyle t=\pi \), co odpowiada położeniu w punktach \( \displaystyle (a,0) \) oraz \( \displaystyle (-a,0) \). Rozwiązanie zadania jest intuicyjnie oczywiste: chcąc bezpiecznie pokonać ostrzejszy zakręt, musimy zwolnić. Na łagodnym łuku (na łuku o małej krzywiźnie) można przyśpieszyć.
Przykład 7.4.
Rozważmy ruch punktu materialnego opisany równaniami:
\( \displaystyle \left\{\begin{align*} x(t)=\cos^3 t \\ y(t)= \sin^3 t\end{align*} \right.\ . \)
Punkt ten porusza się po krzywej zwanej asteroidą o równaniu
\( \displaystyle |x|^\frac{2}{3}+|y|^\frac{2}{3}=1, \)
gdyż (na mocy jedynki trygonometrycznej) mamy równość \( \displaystyle \displaystyle |x(t)|^\frac{2}{3}+|y(t)|^\frac{2}{3}=\cos^2 t+\sin^2 t=1 \). Prędkość w tym ruchu jest wektorem o dwóch składowych
\( \displaystyle v(t)=\big(\frac{d}{dt} x(t) , \frac{d}{dt}y(t)\big) =(-3\cos^2 t \sin t, 3\sin^2 t\cos t). \)
Długość wektora prędkości \( \displaystyle v(t) \) jest pierwiastkiem z sumy kwadratów jego składowych:
\( \displaystyle \begin{align*} |v(t)| & =\sqrt{9\cos^4 t\sin^2 t+9\sin^4 \cos^2t} \\ & =\sqrt{9\cos^2 t\sin^2 t(\cos^2 t+\sin^2 t)}=3|\cos t\sin t|=\frac{3}{2}|\sin 2t|.\end{align*} \)
Podobnie jak w poprzednim przykładzie ruch ten jest okresowy o okresie \( \displaystyle 2\pi \), wystarczy więc zbadać go w przedziale \( \displaystyle 0\leq t\leq 2\pi \). Zauważmy, że w opisanym ruchu prędkość jest największa wówczas, gdy \( \displaystyle t\mapsto |\sin 2t| \) przyjmuje największą wartość (równą jedności), co w przedziale \( \displaystyle 0\leq t\leq 2\pi \) ma miejsce w czterech chwilach: gdy \( \displaystyle t=\frac{\pi}{4} \), \( \displaystyle t=\frac{3\pi}{4} \), \( \displaystyle t=\frac{5\pi}{4} \), \( \displaystyle t=\frac{7\pi}{4} \). Punkt materialny znajduje się wówczas w jednym z punktów \( \displaystyle (a,a) \), \( \displaystyle (-a,a) \), \( \displaystyle (-a,-a) \), \( \displaystyle (a, -a) \), gdzie \( \displaystyle a=\frac{1}{2\sqrt{2}} \), które -- jak nietrudno zauważyć -- leżą w środku łagodnego łuku asteroidy. Z kolei w chwili \( \displaystyle t=0 \), \( \displaystyle t=\frac{\pi}{2} \), \( \displaystyle t={\pi} \), \( \displaystyle t=\frac{3\pi}{2} \) funkcja \( \displaystyle t\mapsto |\sin 2t| \) osiąga wartość najmniejszą równą zeru. Punkt materialny znajduje się wówczas w jednym z ostrzy asteroidy: w punkcie \( \displaystyle (1,0) \), \( \displaystyle (0,1) \), \( \displaystyle (-1,0) \) lub \( \displaystyle (0, -1) \). Zerowa prędkość punktu w tych położeniach jest również intuicyjnie oczywista: chcąc gładko pokonać tak ostry zakręt, na którym wręcz trzeba zawrócić, należy się na chwilę zatrzymać.
W ramach kursu Analizy matematycznej I określiliśmy pojęcie pochodnej w punkcie \( \displaystyle a \) funkcji \( \displaystyle f \) jednej zmiennej o wartościach rzeczywistych, a na początku tego wykładu rozszerzyliśmy pojęcie pochodnej na przypadek funkcji jednej zmiennej o wartościach w dowolnej przestrzeni wektorowej \( \displaystyle Y \) za pomocą granicy ilorazu różnicowego
\( \displaystyle \lim_{h\to 0} \frac{f(x_0+h)-f(x_0)}{h}, \)
którą (o ile istnieje) oznaczamy symbolem \( \displaystyle f'(x_0) \) lub \( \displaystyle \frac{d}{dt}f(x_0) \). Zwróćmy uwagę, że w przypadku, gdy funkcja \( \displaystyle f:\mathbb{R}\supset (a,b)\mapsto Y \) osiąga wartości w przestrzeni wektorowej \( \displaystyle Y \), pochodna \( \displaystyle f'(x_0)\in Y \) jest wektorem.