Wzór Taylora. Ekstrema

Wzór Taylora. Ekstrema



Definiujemy pochodne wyższych rzędów oraz funkcje klasy \( \displaystyle C^k \). Twierdzenie Taylora pozwala nam na sformułowanie warunku wystarczającego istnienia ekstremum funkcji klasy \( \displaystyle C^2 \). Pokazujemy, jak można za pomocą wielomianów Taylora przybliżać funkcje klasy \( \displaystyle C^{n+1} \), \( \displaystyle n\geq 1 \). Formułujemy twierdzenie Weierstrassa o przybliżaniu wielomianami funkcji ciągłych na przedziale domkniętym.

Pochodne wyższych rzędów

Pochodne wyższych rzędów


Niech \( \displaystyle f \) będzie funkcją różniczkowalną w przedziale otwartym \( \displaystyle (a,b) \). Rozważmy funkcję pochodną

\( \displaystyle f': (a,b)\ni x\mapsto f'(x)\in \mathbb{R}. \)

Definicja 10.1.

Jeśli funkcja \( \displaystyle f' \) jest różniczkowalna w punkcie \( \displaystyle x_0\in (a,b) \), to znaczy, jeśli istnieje granica ilorazu różnicowego:

\( \displaystyle \lim_{h\to 0}\frac{f'(x_0 +h)-f'(x_0)}{h}, \)

to mówimy, że funkcja \( \displaystyle f \) jest dwukrotnie różniczkowalna w punkcie \( \displaystyle x_0 \), a granicę tę nazywamy pochodną rzędu drugiego (lub krótko: drugą pochodną) funkcji \( \displaystyle f \) w punkcie \( \displaystyle x_0 \) i oznaczamy symbolem \( \displaystyle f''(x_0) \) lub \( \displaystyle \frac{d^2 f}{dx^2}(x_0) \) albo \( \displaystyle \frac{d^2}{dx^2}f(x_0) \), bądź też \( \displaystyle f^{(2)}(x_0) \).

Przykład 10.2.

Znanym ze szkoły przykładem pochodnej rzędu drugiego jest przyśpieszenie, równe pochodnej prędkości \( \displaystyle v \):

\( \displaystyle \frac{d^2}{dt^2}x(t)=\frac{d}{dt}\big(\frac{d}{dt}x(t)\big)=\frac{d}{dt}v(t), \)

gdzie \( \displaystyle t\mapsto x(t) \) oznacza położenie punktu materialnego w chwili \( \displaystyle t \).

Definicję pochodnej rzędu \( \displaystyle n \) możemy podać dla kolejnych liczb naturalnych \( \displaystyle n=1,2,3,\dots \). Często - aby uprościć wypowiedzi twierdzeń - terminem pochodna rzędu zerowego (albo krócej: zerowa pochodna) funkcji \( \displaystyle f \) będziemy nazywać samą funkcję \( \displaystyle f \). Symbol pochodnej rzędu zerowego \( \displaystyle f^{(0)} \) będzie oznaczać funkcję \( \displaystyle f \).

Niech \( \displaystyle f: (a,b)\mapsto \mathbb{R} \) będzie funkcją \( \displaystyle n-1 \) krotnie różniczkowalną, \( \displaystyle n>0 \).

Definicja 10.3.

Jeśli pochodna \( \displaystyle f^{(n-1)} \) rzędu \( \displaystyle n-1 \) funkcji \( \displaystyle f \) jest różniczkowalna w punkcie \( \displaystyle x_0\in (a,b) \), to znaczy, jeśli istnieje granica ilorazu różnicowego:

\( \displaystyle \lim_{h\to 0}\frac{f^{(n-1)}(x_0 +h)-f^{(n-1)}(x_0)}{h}, \)

to mówimy, że funkcja jest \( \displaystyle n \) krotnie różniczkowalna w punkcie \( \displaystyle x_0 \), a granicę tę nazywamy pochodną rzędu \( \displaystyle n \) (lub krótko: \( \displaystyle n \)-tą pochodną) funkcji \( \displaystyle f \) w punkcie \( \displaystyle x_0 \) i oznaczamy symbolem \( \displaystyle f^{(n)}(x_0) \) lub \( \displaystyle \frac{d^n f}{dx^n}(x_0) \), bądź \( \displaystyle \frac{d^n}{dx^n}f(x_0) \).

Jeśli \( \displaystyle n=3,4,\dots \), na oznaczenie pochodnej rzędu \( \displaystyle n \) funkcji \( \displaystyle f \) w punkcie \( \displaystyle x_0 \) używamy raczej symboli:

\( \displaystyle f^{(3)}(x_0), \ f^{(4)}(x_0), \dots , \)

albo

\( \displaystyle \frac{d^3}{dx^3}f(x_0), \ \frac{d^4}{dx^4}f(x_0), \dots, \)

niż \( \displaystyle f'''(x_0), \ f''''(x_0), \dots. \) Kolejne twierdzenie stanowi uogólnienie twierdzenia o pochodnej iloczynu dwóch funkcji na przypadek pochodnej rzędu \( \displaystyle n \).

rycina

Twierdzenie 10.4. [wzór Leibniza]

Niech \( \displaystyle f, g:\mathbb{R}\mapsto\mathbb{R} \) będą funkcjami \( \displaystyle n \) krotnie różniczkowalnymi, \( \displaystyle n\geq 1 \). Zachodzi równość

\( \displaystyle (f\cdot g)^{(n)}=\sum_{k=0}^{n} {n \choose k}f^{(n-k)}g^{(k)}. \)

Dowód 10.4.

Zwróćmy przede wszystkim uwagę na podobieństwo wzoru Leibniza do wzoru dwumianowego Newtona. Dowody obu twierdzeń są analogiczne. Zauważmy wpierw, że twierdzenie zachodzi dla \( \displaystyle n=1 \) mamy bowiem \( \displaystyle (fg)'= {1 \choose 0} f'g+{1 \choose 1}fg'=f'g+fg' \). Następnie, korzystając z równości \( \displaystyle {n \choose k}+ {n \choose k+1}= {n+1 \choose k+1} \), pokazujemy, że dla dowolnej liczby \( \displaystyle m\in{1,2,\dots, n-1} \) zachodzi implikacja

\( \displaystyle \bigg[(f\cdot g)^{(m)}=\sum_{k=0}^{m} {m \choose k}f^{(m-k)}g^{(k)}\bigg] \Longrightarrow \bigg[(f\cdot g)^{(m+1)}=\sum_{k=0}^{m+1} {m+1\choose k}f^{(m-k+1)}g^{(k)}\bigg]. \)

Niech \( \displaystyle k=0,1,2,\dots \) będzie liczbą całkowitą nieujemną.

Definicja 10.5.

Mówimy, że funkcja \( \displaystyle f:(a,b)\mapsto\mathbb{R} \) jest klasy \( \displaystyle C^k \) w przedziale \( \displaystyle (a,b) \), jeśli jest \( \displaystyle k \) krotnie różniczkowalna w przedziale \( \displaystyle (a,b) \) i pochodna \( \displaystyle (a,b) \mapsto f^{(k)}(x) \) rzędu \( \displaystyle k \) funkcji \( \displaystyle f \) jest ciągła. Jeśli dla dowolnej liczby \( \displaystyle k\in\{0,1,2,3,\dots\} \) funkcja \( \displaystyle f \) jest klasy \( \displaystyle C^k \) w przedziale \( \displaystyle (a,b) \), to mówimy, że jest klasy \( \displaystyle C^{\infty} \) w tym przedziale.

Przykład 10.6.

Dowolna funkcja wielomianowa, funkcje sinus, cosinus i wykładnicza \( \displaystyle \exp \) są przykładami funkcji klasy \( \displaystyle C^\infty \) w całym zbiorze liczb rzeczywistych. Ogólnie: dowolna funkcja dana za pomocą szeregu potęgowego \( \displaystyle f(x)=\sum_{k=0}^{\infty}a_k(x-x_0)^k \) jest klasy \( \displaystyle C^\infty \) w przedziale otwartym \( \displaystyle (x_0 -R, x_0+R) \), gdzie \( \displaystyle R \) jest promieniem zbieżności szeregu potęgowego.

Przykład 10.7.

Funkcja \( \displaystyle f_0(x)=|x| \) jest ciągła, ale nie ma ciągłej pochodnej w dowolnym przedziale \( \displaystyle (a,b) \), do którego należy zero, tj. gdy \( \displaystyle a < 0 < b \). Jest więc klasy \( \displaystyle C^0 \) i nie jest klasy \( \displaystyle C^1 \) w takim przedziale. Jeśli zero nie należy do przedziału \( \displaystyle (a,b) \), czyli gdy \( \displaystyle a < b < 0 \) lub \( \displaystyle 0 < a < b \), to restrykcja \( \displaystyle f(x)=|x| \) do przedziału \( \displaystyle (a,b) \) jest wielomianem, czyli funkcją klasy \( \displaystyle C^\infty \).

wykresy

Przykład 10.8.

Funkcja

\( \displaystyle f_1(x)= \left\{\begin{array}{lll} -\frac{1}{2}x^2, \text{ dla }x < 0 \\ \frac{1}{2}x^2, \text{ dla }x\geq 0 \end{array} \right. \)

jest różniczkowalna i jej pochodna \( \displaystyle f'(x)=|x| \). Stąd jeśli \( \displaystyle a < 0 < b \), to \( \displaystyle f_1 \) jest klasy \( \displaystyle C^1 \) w przedziale \( \displaystyle (a,b) \), ale nie jest klasy \( \displaystyle C^2 \).

Przykład ten możemy łatwo dalej modyfikować. Na przykład funkcja

\( \displaystyle f_2(x)= \left\{\begin{array}{lll} -\frac{1}{6}x^3, \text{ dla }x < 0 \\ \frac{1}{6}x^3, \text{ dla }x\geq 0 \end{array} \right. \)

ma pierwszą pochodną równą \( \displaystyle f_2 '(x)=f_1 (x) \), a jej drugą pochodną jest \( \displaystyle f_2 ''(x)=f_0 (x)=|x| \). Funkcja \( \displaystyle f_2 \) jest więc klasy \( \displaystyle C^2 \), ale nie jest klasy \( \displaystyle C^3 \) w dowolnym przedziale otwartym zawierającym zero. Ogólnie

\( \displaystyle f_n(x)=c_n |x|^{n+1}\mathrm{sgn}\, x = \left\{\begin{array}{lll} -c_n x^{n+1}, \text{ dla }x < 0 \\ c_n x^{n+1}, \text{ dla }x\geq 0 \end{array} \right. \)

(gdzie \( \displaystyle c_n=\frac{1}{(n+1)!} \), bądź też jest dowolną inną stałą różną od zera) jest funkcją klasy \( \displaystyle C^n \) i nie jest klasy \( \displaystyle C^{n+1} \) w dowolnym przedziale otwartym zawierającym zero.

Wzór Taylora

Wzór Taylora


Niech \( \displaystyle w(x)=a_0 +a_1 x+a_2 x^2 +a_3 x^3\dots +a_{n-1}x^{n-1}+a_n x^n \) będzie wielomianem. Zauważmy, że wartości pochodnych rzędu \( \displaystyle k=0,1,2,3,\dots , n, n+1,\dots \) w punkcie \( \displaystyle x=0 \) wyrażają się prosto za pomocą współczynników tego wielomianu:

\( \displaystyle \begin{align*} w(0) & =a_0 \\ w'(0) & =a_1, \\ \text{ gdyż }w'(x) & =0+a_1 +2 a_2 x+3a_3 x^2 +\dots +(n-1)a_{n-1}x^{n-2}+n a_n x^{n-1} \\ w''(0) & =2 a_2, \\ \text{ gdyż }w''(x) & =0+0 +2 a_2 +3\cdot 2 a_3 x +\dots +(n-1)(n-2)a_{n-1}x^{n-3}+n(n-1) a_n x^{n-2} \\ w^{(3)}(0) & =3\cdot 2 a_3, \\ \text{ gdyż }w^{(3)}(x) & =0+0 +0 +3\cdot 2 a_3 +\dots +(n-1)(n-2)(n-3)a_{n-1}x^{n-4}+n(n-1)(n-2) a_n x^{n-3} \\ & \vdots \\ w^{(n-1)}(0) & =(n-1)! a_{n-1}, \\ \text{ gdyż }w^{(n-1)}(x) & =0+0 +0 +0 +\dots +(n-1)!a_{n-1}+n! a_n x \\ w^{(n)}(0) & =n! a_{n}, \\ \text{ gdyż }w^{(n)}(x) & =0+0 +0 +0 +\dots +0+n! a_n \\ w^{(n+1)}(0) & =0, \\ \text{ gdyż }w^{(n+1)}(x) & =0+0 +0 +0 +\dots +0+0 \text{ dla dowolnej liczby } x.\end{align*} \)

Każda następna pochodna rzędu wyższego niż stopień wielomianu \( \displaystyle w \) jest równa zeru, i to nie tylko w punkcie zero, ale w każdym punkcie \( \displaystyle x\in \mathbb{R} \).

Uogólnieniem tej obserwacji jest następujące twierdzenie Taylora:

Twierdzenie 10.9.

Niech \( \displaystyle f:(\alpha, \beta)\mapsto \mathbb{R} \) będzie funkcją \( \displaystyle n+1 \) krotnie różniczkowalną w przedziale \( \displaystyle (\alpha, \beta) \). Wówczas dla dowolnych punktów \( \displaystyle a \), \( \displaystyle b \) takich, że \( \displaystyle \alpha < a < b < \beta \) istnieje punkt \( \displaystyle \xi_{n+1}\in (a,b) \) taki, że

\( \displaystyle f(b)=T^{n}_a f(b)+\frac{1}{(n+1)!}f^{(n+1)}(\xi_{n+1})(b-a)^{n+1}, \)

gdzie

\( \begin{array}{lll} \displaystyle T^{n}_a f (b) & = & \displaystyle f(a)+f'(a)(b-a)+\frac{f''(a)}{2!}(b-a)^2+\dots \\ & + & \displaystyle \frac{f^{(n-1)}(a)}{(n-1)!}(b-a)^{n-1}+\frac{f^{(n)}(a)}{n!}(b-a)^{n}.\end{array} \)

Definicja 10.10.

Wielomian

\( \displaystyle \begin{align*} T^{n}_a f : \mathbb{R}\ni x\mapsto T^{n}_a f(x) & =\sum_{k=0}^n\frac{f^{(k)}(a)}{k!}(x-a)^k \\ & =f(a)+f'(a)(x-a)+\frac{f''(a)}{2!}(x-a)^2+\dots+\frac{f^{(n-1)}(a)}{(n-1)!}(x-a)^{n-1}+\frac{f^{(n)}(a)}{n!}(x-a)^{n}\end{align*} \)

nazywamy wielomianem Taylora rzędu \( \displaystyle n \) funkcji \( \displaystyle f \) o środku w punkcie \( \displaystyle a \).

Nim wykażemy twierdzenie Taylora, zauważmy, że z założenia o istnieniu pochodnej rzędu \( \displaystyle n+1 \) funkcji \( \displaystyle f \) w przedziale \( \displaystyle (\alpha, \beta) \) wynika, że funkcja \( \displaystyle f \) i wszystkie jej pochodne \( \displaystyle f', \ f'', \ f^{(3)}, \dots, f^{(n-1)}, f^{(n)} \) aż do rzędu \( \displaystyle n \) włącznie, istnieją i są ciągłe w tym przedziale.

Zauważmy też, że w przypadku \( \displaystyle n=1 \) twierdzenie Taylora sprowadza się do twierdzenia Lagrange'a:

\( \displaystyle f(b)=f(a)+f'(\xi_1)(b-a). \)

Dowód 10.9.

(twierdzenia Taylora) Niech \( \displaystyle M \) będzie stałą określoną tak, że zachodzi równość

\( \displaystyle f(b)=T^{n}_a f(b)+M(b-a)^{n+1}. \)

Aby dowieść twierdzenia, wystarczy pokazać, że istnieje punkt \( \displaystyle \xi_{n+1}\in (a,b) \) taki, że \( \displaystyle (n+1)!M=f^{(n+1)}(\xi_{n+1}) \). Rozważmy dla \( \displaystyle t\in[a,b] \) funkcję

\( \displaystyle g(t):=f(t)-T^{n}_a f(t)-M(t-a)^{n+1}. \)

Zauważmy, że \( \displaystyle g(a)=0 \) i z określenia stałej \( \displaystyle M \) mamy również: \( \displaystyle g(b)=0 \). Z twierdzenia Rolle'a wynika więc, że istnieje \( \displaystyle \xi_1\in (a,b) \) taki, że \( \displaystyle g'(\xi_1)=0 \). Zauważmy następnie, że nie tylko funkcja \( \displaystyle g \), ale również kolejne jej pochodne \( \displaystyle g^{(k)} \) dla \( \displaystyle k=1,2,\dots, n \) zerują się w punkcie \( \displaystyle a \). Wobec tego, że \( \displaystyle g'(a)=0 \) i \( \displaystyle g'(\xi_1)=0 \), z twierdzenia Rolle'a, wnioskujemy o istnieniu kolejnego punktu \( \displaystyle \xi_2\in (a, \xi_1) \), w którym zeruje się druga pochodna funkcji \( \displaystyle g \), tj. \( \displaystyle g''(\xi_2)=0 \). Powtarzając rozumowanie dla kolejnych pochodnych \( \displaystyle g^{(k)} \), \( \displaystyle k=1,2,\dots, n \) na podstawie twierdzenia Rolle'a wnioskujemy o istnieniu punktów \( \displaystyle \xi_{k+1}\in (a, \xi_k ) \) takich, że \( \displaystyle g^{(k+1)}(\xi_{k+1})=0 \). Zwróćmy uwagę, iż ostatni ze znalezionych punktów \( \displaystyle \xi_{n+1} \) jest tym punktem, którego istnienie postulujemy w tezie twierdzenia. Zauważmy, że pochodna rzędu \( \displaystyle n+1 \) funkcji \( \displaystyle g \) wynosi

\( \displaystyle \begin{align*} \frac{d^{n+1}}{dt^{n+1}}g(t) & =\frac{d^{n+1}}{dt^{n+1}}\big(f(t)-T^{n}_a f(t)-M(t-a)^{n+1}\big) \\ & =f^{(n+1)}(t)-0-(n+1)!M. \end{align*} \)

(Pochodna rzędu \( \displaystyle n+1 \) wielomianu \( \displaystyle t\mapsto T_a^n f(t) \) jest w każdym punkcie równa zeru, gdyż wielomian ten jest stopnia co najwyżej \( \displaystyle n \).) Stąd \( \displaystyle 0=g^{(n+1)}(\xi_{n+1})=f^{(n+1)}(\xi_{n+1})-(n+1)! M \).

Jednym z ważniejszych wniosków z wykazanego twierdzenia jest warunek wystarczający istnienia ekstremum funkcji dwukrotnie różniczkowalnej.

wykres

Twierdzenie 10.11.

Niech \( \displaystyle f:(a,b) \mapsto \mathbb{R} \) będzie funkcją klasy \( \displaystyle C^2 \) w przedziale \( \displaystyle (a,b) \) (czyli funkcją dwukrotnie różniczkowalną o ciągłej drugiej pochodnej \( \displaystyle f'' \) w przedziale \( \displaystyle (a,b) \)). Załóżmy, że w punkcie \( \displaystyle x_0\in (a,b) \) pochodna \( \displaystyle f'(x_0) \) zeruje się.

a) Jeśli \( \displaystyle f''(x_0)>0 \), to \( \displaystyle f \) osiąga minimum lokalne w punkcie \( \displaystyle x_0 \).

b) Jeśli \( \displaystyle f''(x_0) < 0 \), to \( \displaystyle f \) osiąga maksimum lokalne w punkcie \( \displaystyle x_0 \).

Dowód 10.11.

a) Załóżmy, że \( \displaystyle f''(x_0)>0 \). Ze wzoru Taylora i z założenia o zerowaniu się pierwszej pochodnej \( \displaystyle f' \) danej funkcji mamy

\( \displaystyle \begin{array}{lll} f(x_0+h) & = & f(x_0)+f'(x_0)+\frac{1}{2}f''(x_0+\theta h) \\ & = & f(x_0)+0+\frac{1}{2}f''(x_0+\theta h),\end{array} \)

gdzie \( \displaystyle \theta \) jest pewną liczbą z przedziału \( \displaystyle (0,1) \). Stąd znak różnicy \( \displaystyle f(x+h)-f(x)=\frac{1}{2}f''(x_0+\theta h) \) jest taki sam jak znak drugiej pochodnej \( \displaystyle f''(x_0+\theta h) \) w pewnym punkcie pośrednim między punktem \( \displaystyle x_0 \) a \( \displaystyle x_0+h \). Z założenia o ciągłości drugiej pochodnej \( \displaystyle f'' \) na mocy własności Darboux wnioskujemy, że nie tylko w samym punkcie \( \displaystyle x_0 \) druga pochodna \( \displaystyle f'' \) jest dodatnia, ale również w pewnym otoczeniu tego punktu. Biorąc więc na tyle mały przyrost \( \displaystyle h \), aby zarówno \( \displaystyle x_0 \) jak i \( \displaystyle x_0+h \) należały do przedziału, w którym \( \displaystyle f'' \) jest dodatnia i nie zeruje się, otrzymamy nierówność \( \displaystyle f''(x+\theta h)>0 \) również w punkcie pośrednim. Stąd \( \displaystyle f \) osiąga minimum lokalne w punkcie \( \displaystyle x_0 \), gdyż \( \displaystyle f(x+h)-f(x)\leq 0 \) w pewnym otoczeniu punktu \( \displaystyle x_0 \). Dowód implikacji b) przebiega podobnie.

Zauważmy, że podane twierdzenie nie rozstrzyga o istnieniu ani o typie ekstremum w przypadku, gdy \( \displaystyle f'(x_0)=0 \) oraz \( \displaystyle f''(x_0)=0 \).

wykresy x 2

Przykład 10.12.

Rozważmy funkcje \( \displaystyle f_1(x)=-x^4 \), \( \displaystyle f_2(x)=x^4 \), \( \displaystyle f_3(x)=x^3 \). Łatwo zauważyć, że zarówno pierwsza jak i druga pochodna każdej z tych trzech funkcji w punkcie \( \displaystyle x_0=0 \) zerują się, podczas gdy \( \displaystyle f_1 \) osiąga maksimum w tym punkcie, a \( \displaystyle f_2 \) minimum. Natomiast funkcja \( \displaystyle f_3 \) w ogóle nie osiąga ekstremum w punkcie \( \displaystyle x_0=0 \).

Uwaga 10.13.

Wzór, który występuje w tezie twierdzenia Taylora:

\( \displaystyle \begin{align*} f(b) & =T^n_a f(b)+\frac{f^{(n+1)}(\xi_{n+1})}{(n+1)!}(b-a)^{n+1} \\ & =\sum_{k=0}^n\frac{f^{(k)}(a)}{k!}(b-a)^k+\frac{f^{(n+1)}(\xi_{n+1})}{(n+1)!}(b-a)^{n+1}\end{align*} \)

nazywamy wzorem Taylora z resztą Lagrange'a

\( \displaystyle R_{n+1}=\frac{f^{(n+1)}(\xi_{n+1})}{(n+1)!}(b-a)^{n+1}. \)

Jeśli oznaczymy przyrost argument funkcji przez \( \displaystyle h:=b-a \), to wzór ten przyjmie postać

\( \displaystyle \begin{align*} f(a+h) & =T^n_a f(a+h)+\frac{f^{(n+1)}(a+\theta h)}{(n+1)!}h^{n+1} \\ & =\sum_{k=0}^n\frac{f^{(k)}(a)}{k!}h^k+\frac{f^{(n+1)}(a+\theta h)}{(n+1)!}h^{n+1}\end{align*} \)

dla pewnej liczby \( \displaystyle \theta \in (0,1) \) dobranej tak, aby \( \displaystyle a+\theta h=\xi_{n+1} \). Tę postać nazywamy wzorem Taylora z resztą Cauchy'ego

rycina

Augustin Louis Cauchy (1789-1857)

Colin Maclaurin (1698-1746)

\( \displaystyle R_{n+1}=\frac{f^{(n+1)}(a+\theta h)}{(n+1)!}h^{n+1}. \)

W szczególnym przypadku, gdy \( \displaystyle a=0 \) otrzymamy wzór

\( \displaystyle \begin{align*} f(h) & =T^n_0 f(h)+\frac{f^{(n+1)}(\theta h)}{(n+1)!}h^{n+1} \\ & =\sum_{k=0}^n\frac{f^{(k)}(0)}{k!}h^k+\frac{f^{(n+1)}(\theta h)}{(n+1)!}h^{n+1},\end{align*} \)

który nazywamy wzorem Maclaurina z resztą

\( \displaystyle R_{n+1}=\frac{f^{(n+1)}(\theta h)}{(n+1)!}h^{n+1}. \)

Uwaga 10.14.

Jeśli \( \displaystyle w \) jest wielomianem stopnia \( \displaystyle k \), to dla dowolnej liczby \( \displaystyle n\geq k \) wielomian Taylora rzędu \( \displaystyle n \) o środku w punkcie \( \displaystyle a=0 \) jest dokładnie równy wielomianowi \( \displaystyle w \), to znaczy

\( \displaystyle w(h)=w(0)+w'(0)h+\frac{w''(0)}{2!}h^2 +\dots +\frac{w^{(n)}(0)}{n!}h^n +R_{n+1} \)   przy czym   \( R_{n+1}=0. \)

Powstaje naturalne pytanie, czy dla innych funkcji (niekoniecznie wielomianów) wzór Taylora pozwala na przedstawienie funkcji \( \displaystyle f \) za pomocą wielomianu Taylora \( \displaystyle T^n_a f \) tak, aby reszta \( \displaystyle R_{n+1} \) była jak najmniejsza i zmierzała do zera, gdy rośnie \( \displaystyle n \), czyli gdy rośnie stopień wielomianu Taylora funkcji \( \displaystyle f \).

Odpowiedź na pytanie uzyskamy, stosując np. wzór Taylora z resztą Cauchy'ego.

Twierdzenie 10.15.

Niech \( \displaystyle f:(\alpha, \beta)\mapsto \mathbb{R} \) będzie funkcją \( \displaystyle n+1 \) krotnie różniczkowalną i niech \( \displaystyle \alpha < a < b < \beta \). Jeśli

\( \displaystyle M:=\sup\{|f^{(n+1)}(t)|, t\in [a,b]\} < \infty \)

(czyli wartość bezwzględna pochodnej rzędu \( \displaystyle (n+1) \) funkcji \( \displaystyle f \) jest ograniczona przez stałą \( \displaystyle M \), która nie zależy od wyboru punktu \( \displaystyle t \) z przedziału \( \displaystyle [a, b] \)), to dla dowolnej liczby \( \displaystyle h \) takiej, że \( \displaystyle 0\leq h\leq b-a \), zachodzi oszacowanie:

\( \displaystyle \bigg|f(a+h)-\sum_{k=0}^n\frac{f^{(k)} (a)}{k!}h^k\bigg|\leq \frac{M}{(n+1)!}h^{n+1}. \)

Dowód 10.15.

Szacując resztę we wzorze Taylora (z resztą Cauchy'ego), otrzymamy:

\( \displaystyle \begin{align*} \bigg|f(a+h)-\sum_{k=0}^n\frac{f^{(k)} (a)}{k!}h^k\bigg| & =\bigg|\frac{f^{(n+1)}(a+\theta h)}{(n+1)!}h^{n+1}\bigg| \\ & \leq \frac{h^{n+1}}{(n+1)!}\sup\{|f^{(n+1)}(a+\theta h)|, 0 < \theta h < b-a \} \\ & \leq M \frac{h^{n+1}}{(n+1)!}.\end{align*} \)

Wniosek 10.16.

Jeśli pochodna rzędu \( \displaystyle n+1 \) funkcji \( \displaystyle f \) jest ograniczona w przedziale \( \displaystyle (\alpha, \beta) \), to dla dowolnych punktów \( \displaystyle a \) oraz \( \displaystyle a+h \) z tego przedziału mamy oszacowanie

\( \displaystyle \bigg|f(a+h)-\sum_{k=0}^n\frac{f^{(k)} (a)}{k!}h^k\bigg|\leq \frac{M}{(n+1)!}|h|^{n+1}, \)

gdzie \( \displaystyle M:=\sup\{|f^{(n+1)}(t)|, \alpha < t < \beta\} \).

Dowód 10.16.

Jeśli \( \displaystyle h>0 \), wniosek sprowadza się do poprzedniego twierdzenia. Jeśli \( \displaystyle h < 0 \), należy powtórzyć poprzednie rozumowanie

w przedziale \( \displaystyle [a+h,a] \).

wykres

Przykład 10.17.

Oszacowanie reszty we wzorze Maclaurina funkcji sinus jest wyjątkowo proste

\( \displaystyle \sin h=h-\frac{h^3}{3!}+\frac{h^5}{5!}+\dots+(-1)^n\frac{h^{2n+1}}{(2n+1)!}+R_{2n+2}, \)

gdzie

\( \displaystyle |R_{2n+2}|=\bigg|\sin^{(2n+2)}(\theta h)\cdot \frac{h^{(2n+2)}}{(2n+2)!}\bigg| \leq \frac{|h|^{(2n+2)}}{(2n+2)!}, \)

gdyż wartość bezwzględna pochodnych dowolnie wysokiego rzędu funkcji sinus jest ograniczona z góry przez 1. Wzór ten pozwala wyznaczyć wartość \( \displaystyle \sin h \) z zadaną z góry dokładnością. Na przykład, chcąc wyznaczyć \( \displaystyle \sin \frac{1}{2} \) z dokładnością do \( \displaystyle 10^{-6} \), wystarczy wskazać taką liczbę \( \displaystyle n \), aby zachodziła nierówność \( \displaystyle |R_{2n+2}| < 10^{-6} \), czyli \( \displaystyle \frac{1}{2^{2n+2}(2n+2)!} < 10^{-6} \). Na mocy wykazanego powyżej wniosku mamy oszacowania:

\( \displaystyle \bigg|\sin \frac{1}{2}-\big(\frac{1}{2}-\frac{1}{2^3\cdot 3!}\big)\bigg|\leq \frac{1}{46080}, \)

natomiast

\( \displaystyle \bigg|\sin \frac{1}{2}-\big(\frac{1}{2}-\frac{1}{2^3\cdot 3!}+\frac{1}{2^5\cdot 5!}\big)\bigg|\leq \frac{1}{10321920}, \)

a więc suma \( \displaystyle \frac{1}{2}-\frac{1}{48}+\frac{1}{3840} \) różni się (a dokładniej: jest większa) o nie więcej niż jedną dziesięciomilionową od \( \displaystyle \sin\frac{1}{2} \).

Przykład 10.18.

Równie łatwo można oszacować resztę we wzorze Maclaurina funkcji cosinus

\( \displaystyle \cos h=1-\frac{h^2}{2}+\frac{h^4}{4!}+\dots+(-1)^n \frac{h^{2n}}{(2n)!}+R_{2n+1}, \)

gdyż wartość bezwzględna pochodnych dowolnie wysokiego rzędu funkcji cosinus jest ograniczona z góry przez 1, więc

\( \displaystyle |R_{2n+1}|=\bigg|\cos^{(2n+1)}(\theta h)\cdot \frac{h^{(2n+1)}}{(2n+1)!}\bigg| \leq \frac{|h|^{(2n+1)}}{(2n+1)!}. \)

Przybliżanie funkcji ciągłych wielomianami

Przybliżanie funkcji ciągłych wielomianami


wykres

Powstaje naturalne pytanie, czy reszta \( \displaystyle R_{n+1} \) we wzorze Maclaurina stanowi ciąg zbieżny do zera, jeśli funkcja \( \displaystyle f \) jest klasy \( \displaystyle C^\infty \) w przedziale zawierającym punkt \( \displaystyle 0 \)? Negatywna odpowiedź na to pytanie zawarta jest w kolejnym przykładzie.

Przykład 10.19.

Funkcja

\( \displaystyle f(x)=\Bigg\{\begin{array}{ll} 0 & \text{ dla }x\leq 0 \\ \exp(-\frac{1}{x}) & \text{ dla } x>0 \end{array} \)

jest różniczkowalna w każdym punkcie \( \displaystyle x\in \mathbb{R} \). W szczególności zerują się wszystkie pochodne w punkcie zero, tj.

\( \displaystyle \forall k=0,1,2,3,\dots \ : f^{(k)}(0)=0, \)

(fakt ten wykażemy w kolejnym module), czyli wszystkie współczynniki wielomianu Taylora o środku w zerze są zerowe. Z twierdzenia Taylora mamy równość: \( \displaystyle f(h)=T_{0}^n(h)+R_{n+1}=0+R_{n+1} \). Zwróćmy uwagę, że dla dowolnej liczby \( \displaystyle h>0 \) funkcja \( \displaystyle f \) przyjmuje wartość dodatnią, więc reszta \( \displaystyle R_{n+1} \) nie stanowi ciągu zbieżnego do zera.

Twierdzenie Taylora nie jest optymalnym narzędziem do przybliżania dowolnych funkcji różniczkowalnych za pomocą wielomianów, gdyż - jak pokazaliśmy w powyższym przykładzie - istnieją funkcje klasy \( \displaystyle C^\infty \) (czyli takie, które mają ciągłe pochodne dowolnie wysokiego rzędu), których nie da się w rozsądny sposób przybliżyć za pomocą wielomianów Taylora \( \displaystyle T_a ^n f \).

Prawdziwe jest jednak twierdzenie, które gwarantuje możliwość przybliżania funkcji ciągłych na przedziale domkniętym wielomianami.

rycina

Karl Weierstrass (1815-1897)

Twierdzenie 10.20. [twierdzenie Weierstrassa]

Funkcję ciągłą na przedziale domkniętym można przybliżać jednostajnie za pomocą wielomianów, tzn. jeśli \( \displaystyle f:[a,b] \mapsto\mathbb{R} \) jest funkcją ciągłą, to istnieje ciąg wielomianów \( \displaystyle w_n \) taki, że

\( \displaystyle \lim_{n\to\infty}\sup\{|f(t)-w_n(t)|, a\leq t\leq b\}=0. \)

Dowód tego ważnego twierdzenia wykracza poza ramy tego kursu. Można natomiast łatwo podać efektywną konstrukcję ciągu wielomianów, które przybliżają jednostajnie daną funkcję ciągłą na przedziale \( \displaystyle [0,1] \).

wykres

Definicja 10.21.

Niech \( \displaystyle f:[0,1]\mapsto \mathbb{R} \) będzie funkcją ciągłą. Dla dowolnej liczby całkowitej nieujemnej \( \displaystyle n=0,1,2,\dots \) definiujemy wielomian Bernsteina rzędu \( \displaystyle n \) funkcji \( \displaystyle f \) wzorem

\( \displaystyle B_n f(t)=\sum_{k=0}^n f \left ( \frac {k} {n} \right) \ {n \choose k}t^{k}(1-t)^{n-k}. \)

Uwaga 10.22.

Podobieństwo wzoru definiującego wielomian Bernsteina do wzoru dwumianowego Newtona nie jest przypadkowe. Weźmy np. funkcję \( \displaystyle f(x)=1 \), stałą w przedziale \( \displaystyle [0,1] \). Wówczas na mocy wzoru Newtona

\( \displaystyle B_n f(t)=\sum_{k=0}^n 1 \cdot {n \choose k}t^{k}(1-t)^{n-k}=(t+1-t)^n=1. \)

Zauważmy, że wielomian Bernsteina rzędu \( \displaystyle n \) jest wielomianem stopnia nie wyższego niż \( \displaystyle n \). Można wykazać, że jeśli \( \displaystyle w \) jest wielomianem stopnia nie wyższego niż \( \displaystyle n \), to \( \displaystyle B_n w(t)=w(t) \) dla dowolnej liczby \( \displaystyle t \). Przypomnijmy, że analogiczną własność mają również wielomiany Taylora (zob. uwaga 10.14.).

Najciekawszą własność ciągu wielomianów Bernsteina podaje

Twierdzenie 10.23. [twierdzenie Bernsteina]

Jeśli \( \displaystyle f:[0,1]\mapsto\mathbb{R} \) jest dowolną funkcją ciągłą, to ciąg wielomianów Bernsteina zmierza do \( \displaystyle f \) jednostajnie na przedziale \( \displaystyle [0,1] \), to znaczy

\( \displaystyle \lim_{n\to \infty}\sup\{|f(t)-B_n(t)|, 0\leq t\leq 1\}=0. \)

Krótki, szczegółowy dowód tego faktu przeprowadzony w oparciu o nierówność Czebyszewa (zob. wykład z rachunku prawdopodobieństwa i statystyki) można znaleźć na przykład w podręczniku P.Billingsleya, Prawdopodobieństwo i miara, Państwowe Wydawnictwo Naukowe, Warszawa 1987, str. 91-92. Zwróćmy uwagę, że twierdzenie Weierstrassa zachodzi nawet dla funkcji klasy \( \displaystyle C^0 \), tj. takich, od których nie wymagamy, aby były różniczkowalne w którymkolwiek punkcie. Przykład takiej funkcji, która jest tylko ciągła i nie jest różniczkowalna w żadnym punkcie, podaliśmy w poprzednim module.