Funkcje tworzące

Przykład

Słynny matematyk Georg Pólya rozważał problem polegający na policzeniu wszystkich możliwych sposobów, na które można rozmienić 50 centów używając jednocentówek \( (1) \), pięciocentówek \( (5) \), dziesięciocentówek \( (10) \), ćwierćdolarówek \( (25) \), oraz półdolarówki \( (50) \). Rozważania te doprowadziły go do użycia analitycznych metod funkcji tworzących w zaproponowanym przez niego rozwiązaniu. W tym i następnym wykładzie poznamy te metody i zobaczymy jak mogą być pomocne w zliczaniu rożnych obiektów kombinatorycznych.

Wracając do problemu rozmieniania monet, wygodnie nam będzie posiadać jeszcze monetę \( [0] \), którą możemy interpretować jako brak monet. Wypiszmy teraz (nadużywając trochę notacji) nieskończoną sumę wszystkich możliwości rozmiany dowolnej kwoty za pomocą jednocentówek

\( A_1=[0] + (1) + (1) (1) + (1) (1)(1) + (1)(1)(1)(1)+\ldots \)

i analogicznie przeanalizujmy sumę dla pieciocentówek

\( A_5=[0] + (5) + (5)(5) + (5)(5)(5) + (5)(5)(5)(5) + \ldots \)

Wtedy zbiór par \( A_1 \times A_5 \) jest zbiorem wszystkich możliwości rozmiany kwoty mając do dyspozycji dowolnie wiele jednocentówek oraz pięciocentówek.

\( \begin{align*} B= A_1 \times A_5 & =([0]+ (1)+ (1)(1)+ (1)(1)(1)+ (1)(1)(1)(1)+\ldots) \\ & \times([0]+(5) + (5)(5) + (5)(5)(5) + (5)(5)(5)(5)+\ldots) \\ & =[0] + (1) + (5) + (1)(1) + (1)(5) + (5)(5) + (1)(1)(1) + \ldots \end{align*} \)

Sumy wszystkich możliwości rozmiany za pomocą dziesięciocentówek \( (10) \), ćwierćdolarówek \((25) \), oraz półdolarówek \((50) \) wyglądają następująco:

\( \begin{align*} A_{10} & = [0]+(10)+(10)(10)+(10)(10)(10)+(10)(10)(10)(10)+\ldots \\ A_{25} & = [0]+(25)+(25)(25)+(25)(25)(25)+(25)(25)(25)(25)+\ldots \\ A_{50} & = [0]+(50)+(50)(50)+(50)(50)(50)+(50)(50)(50)(50)+\ldots. \end{align*} \)

Dodając kolejno monety \((10) \), \((25) \), i na końcu \( (50) \) do możliwych rozmian uzyskujemy odpowiednio:

\( \begin{align*} C & =B\times([0]+(10)+(10)(10)+(10)(10)(10)+(10)(10)(10)(10)+\ldots) \\ D & =C\times([0]+(25)+(25)(25)+(25)(25)(25)+(25)(25)(25)(25)+\ldots) \\ E & =D\times([0]+(50)+(50)(50) + (50)(50)(50) + (50)(50)(50)(50) + \ldots) \\ & =[0]+(1)+(5)+(10)+(25)+(50)+(1)(1)+(1)(5)+(1)(10) + \ldots \end{align*} \)

Grupując teraz składniki sumy \( E \) w podsumy o tych samych wartościach dostajemy wyrażenie:

\( \begin{array} {rcl} E & = & \big((1)\big)+\big((1)(1)\big)+\big((1)(1)(1)\big)+\big((1)(1)(1)(1)\big) \\ & & +\big((1)(1)(1)(1)(1)+(5)\big) \\ & & +\big((1)(1)(1)(1)(1)(1)+(5)(1)\big)+\ldots \end{array} \) (1)

Zliczając zaś tylko składniki w podsumie odpowiadającej wartości \( n \) centów, otrzymujemy liczbę sposobów, na które można rozmienić \( n \) centów przy użyciu monet \( (1) \), \( (5) \), \( (10) \), \( (25) \), oraz \( (50) \). Pomysłem pochodzącym od Pólya, było zastąpienie monety \( (1) \) przez zmienną \( x \), monety \((5) \) przez \( x\cdot x\cdot x\cdot x\cdot x=x^5 \) i analogicznie \( (10) \) przez \( x^{10} \), \((25) \) przez \( x^{25} \), oraz \( (50) \) przez \( x^{50} \). Uzyskujemy w ten sposób nieskończony szereg zmiennej \( x \):

\( \begin{align*} {E}(x) & =(1+x+x^2+x^3\ldots)\cdot(1+x^5+x^{10}+x^{15}\ldots)\cdot(1+x^{10}+x^{20}+x^{30}\ldots) \\ & \cdot(1+x^{25}+x^{50}+x^{75}\ldots)\cdot(1+x^{50}+x^{100}+x^{150}\ldots) \\ & =1+x+x^2+x^3+x^4+2x^5+2x^6+2x^7+2x^8+2x^9+4x^{10}+\ldots \end{align*} \)

Godne zauważenia jest, że liczba różnych możliwych sposobów rozmiany \( n \) centów (równa liczbie grup monet w odpowiednim nawiasie we wzorze (1)) jest równa współczynnikowi stojącemu przy jednomianie \( x^n \).

Funkcja tworząca \({G}(x) \) dla ciągu liczb rzeczywistych (lub zespolonych) \( (g_0,g_1,g_2,g_3,\ldots) \) to szereg funkcyjny zmiennej rzeczywistej (lub zespolonej) \( x \) postaci

\( \displaystyle {G}(x)=\sum_{n=0}^{\infty}{g_nx^n}=g_0+g_1x+g_2x^2+g_3x^3+g_4x^4+\ldots. \)

Na oznaczenie współczynnika \( n \)-tego wyrazu szeregu \({G}(x) \) używać będziemy oznaczenia \( {x^n} {G}(x)=g_n \).

Uwaga Jak traktowac funkcje tworzące

Na funkcje tworzące można spojrzeć dwoiście. Pierwszym sposobem jest potraktowanie \( {G}(x) \) jako szeregu liczb rzeczywistych (lub ogólniej zespolonych). Oczywistym pytaniem jest tu kwestia zbieżności szeregu \( \displaystyle{G}(x)=\sum_{n=0}^{\infty}{g_nx^n} \). Z wykładu Analiza Matematyczna wiemy, że szereg \( {G}(x) \) jest zbieżny, jeśli istnieje stała \( M\geq0 \) ograniczająca wszystkie skończone początkowe sumy, tzn.

\( \vert g_0\vert+\vert g_1x\vert+\vert g_2x^2\vert+\ldots+\vert g_nx^n\vert\leq M \)

zachodzi dla dowolnego \( n\geq0 \). Ponadto jeśli dla pewnej liczby \( x_0\in\mathbb{R} \) szereg \( {G}(x_0)=g_0+g_1x_0+g_2x_0^2+\ldots \) jest zbieżny, to i także szereg \( {G}(x_1)=g_0+g_1x_1+g_2x_1^2+\ldots \) jest zbieżny dla dowolnego \( x_1\in\mathbb{R} \) spełniającego \( \vert x_1\vert\leq\vert x_0\vert \). Możemy więc określić promień zbieżności szeregu jako taką liczbę \( r\in\mathbb{R}_*\cup{\{ {\infty} \}\ }= {0,+\infty} \), że jeśli \( \vert x\vert < r \), to \( {G}(x) \) jest zbieżny.

Szereg \({G}(x)=g_0+g_1x+g_2x^2+\ldots \) można więc potraktować jako funkcję

\( G:(-r,r)\longrightarrow\mathbb{R}, \)

o wartościach \( \displaystyle {G}(x)=\lim_{n\to\infty}{(g_0+g_1x+g_2x^2+\ldots+g_nx^n)}. \) Oczywiście \( {G}(0)=g_0 \), więc dla \( x=0 \) szereg \( {G}(x) \) jest zbieżny.

Drugim podejściem, bardziej użytecznym w praktycznych obliczeniach i przekształceniach jest spojrzenie na szereg \( {G}(x)=g_0+g_1x+g_2x^2+\ldots \) jako formę zapisu ciągu \( (g_0,g_1,g_2,\ldots) \), czyli jedynie jako ciąg symboli. Równości pomiędzy odpowiednimi wzorami służą rozwiązaniu problemów kombinatorycznych, tak więc traktujemy je jako równości dwu wyrażeń, a nie jako równość dwu funkcji rzeczywistych, pomimo że mają one uzasadnienia w języku analizy matematycznej.

Jak zobaczymy na wielu przykładach, funkcje tworzące są bardzo użytecznym narzędziem przy wyznaczaniu wartości elementów ciągu. Jeśli bowiem \( {G}(x)=g_0+g_1x+g_2x^2+\ldots \) jest funkcją tworzącą ciągu \( (g_0,g_1,g_2,g_3,\ldots) \), oraz w jakiś sposób będziemy w stanie poznać postać zwartą funkcji \( G(x) \), to rozwijając tę postać zwartą w szereg Taylora, poznamy kolejne współczynniki tego rozwinięcia. A współczynniki te, to właśnie kolejne wyrazy naszego ciągu.

Będziemy się zajmowali jedynie tymi funkcjami, dla których promień zbieżności \( r>0 \). Ponadto będziemy pomijać problem zbieżności oraz wartość \( r \) promienia zbieżności, skupiając się jedynie na przekształceniach wzorów. Poniżej zebrane zostały te własności, które często wykorzystywane są w takich przekształceniach.

Obserwacja 7.1

Dla dwu funkcji tworzących \( {F}(x)=f_0+f_1x+f_2x^2+\ldots \) oraz \( {G}(x)=g_0+g_1x+g_2x^2+\ldots \) mamy:

\( \begin{align*} {F}(x)= {G}{x} & \Leftrightarrow f_0=g_0,\ f_1=g_1,\ f_2=g_2,\ \ldots \\ & & \\ \alpha\cdot {F}(x)+\beta\cdot {G}{x} & = \sum_{n=0}^{\infty}{(\alpha\cdot f_n+\beta\cdot g_n)x^n} \\ & =(\alpha\cdot f_0+\beta\cdot g_0) + (\alpha\cdot f_1+\beta\cdot g_1)x + (\alpha\cdot f_2+\beta\cdot g_2)x^2 + \ldots \\ & & \\ {F}(x)\cdot {G}(x) & =\sum_{n=0}^{\infty}(\sum_{k=0}^n f_k g_{n-k}) x^n \\ & = f_0g_0 + (f_0g_1+f_1g_0)x \\ & + (f_0g_2+f_1g_1+f_2g_0)x^2 \\ & + (f_0g_3+f_1g_2+f_2g_1+f_3g_0)x^3+\ldots \\ \end{align*} \)

Wyrażenie \( {F}(x)\cdot {G}(x) \) nazywać będziemy splotem szeregów \( {F}(x) \) oraz \({G}(x) \).

Twierdzenie 7.2

Funkcja tworząca postaci

\( {G}(x)=g_0+g_1x+g_2x^2+g_3x^3+\ldots \)

ma odwrotną względem mnożenia (splotu), tzn. istnieje funkcja tworząca \( {U}(x) \) taka, że \( {U}(x) {G}(x)=1 \), wtedy i tylko wtedy, gdy \( g_0\neq0 \).

Następne własności są bardzo pomocne w dokonywanych przekształceniach funkcji tworzących.

Obserwacja 7.3

Dla dwu funkcji tworzących \({F}(x)=f_0+f_1x+f_2x^2+\ldots \) oraz \( {G}(x)=g_0+g_1x+g_2x^2+\ldots \) mamy:

\( \displaystyle x^m {G}(x) = 0+\ldots+0x^{m-1}+g_0x^m+g_1x^{m+1}+g_2x^{m+2}+\ldots \) (2)

\( \displaystyle \frac{{G}(x)-\sum_{i=0}^{m-1}{g_ix^i}}{x^{m}} = g_m+g_{m+1}x+g_{m+2}x^{2}+g_{m+3}x^{3}+g_{m+4}x^{4}+\ldots \) (3)

\( \displaystyle {G}(\alpha x) = g_0+g_1\alpha x+g_2\alpha^2x^2+g_3\alpha^3x^3+g_4\alpha^4x^4+\ldots \) (4)

\( \displaystyle {G'}(x) = g_1+2g_2x+3g_3x^2+4g_4x^3+5g_5x^4+\ldots \) (5)

\( \displaystyle \int {G}(x)dx = 0+g_0x+\frac{1}{2}g_1x^2+\frac{1}{3}g_2x^3+\frac{1}{4}g_3x^4+\ldots \) (6)

\( \displaystyle \frac{ {G}(x)}{1-x} = g_0+(g_0+g_1)x+(g_0+g_1+g_2)x^2+\ldots \) (7)

Funkcje tworzące w zliczaniu

Widzieliśmy już, że dla \( n\in \mathbb{N} \)

\( \displaystyle (1+x)^m ={m \choose 0}x^0 + {m \choose 1}x + {m \choose 2}x^2+\ldots+{m \choose m-1}x^{m-1}+{m \choose m}x^m =\sum_{n=0}^m {m \choose n}x^n. \)

Przyjrzyjmy się teraz rozwinięciu w szereg funkcji \( (1+x)^y \), gdzie \( y\in\mathbb{R} \) jest parametrem. Rozwinięcie takie okaże się bardzo przydatne w rozwiązywaniu wielu przykładów. Aby poznać ciąg odpowiadający tej funkcji wprowadźmy definicję.

Uogólniony symbol dwumianowy \( { y \choose n } \), gdzie \( y\in\mathbb{R} \) oraz \( n\in\mathbb{N} \) jest oznaczeniem na

\( { y \choose n }\ =\ \frac{y^{\underline{n}}}{n!}\ =\ \frac{y\cdot(y-1)\cdot\ldots\cdot(y-(n-1))}{1\cdot2\cdot\ldots\cdot(n-1)\cdot n}. \)

Uwaga

Oczywiście dla \( y\in\mathbb{N} \) spełniającego dodatkowo \( y\geq n \), uogólniony symbol dwumianowy \( { y \choose n } \) jest liczbą \( n \)-elementowych podzbiorów zbioru \( y \)-elementowego.

Twierdzenie 7.4

Dla liczby rzeczywistej \( y \) oraz liczby naturalnej \( n \) zachodzi

\( \displaystyle (1+x)^y=\sum_{n=0}^{\infty}{ y \choose n }x^n. \)

Wniosek 7.5

Dla liczby naturalnej \( m \) zachodzi

\( \displaystyle \frac{1}{(1-x)^{m+1}}=\sum_{n=0}^{\infty}{ m+n \choose n }x^n. \)

Dowód

Dowód zostawiony jest jako ćwiczenie

Przykład

Policzmy sumę

\( \displaystyle \sum_{k=0}^nk^2=1+4+9+\ldots+n^2. \)

Zacznijmy od znalezienia zwartej postaci funkcji tworzącej \({G}(x)=\sum_{n=0}^{\infty}n^2x^n \). Korzystając z Wniosku 7.5 otrzymujemy:

\( \displaystyle \frac{1}{1-x} = \sum_{n=0}^{\infty}{n \choose n}x^n=\sum_{n=0}^{\infty}x^n, \) (8)

\( \displaystyle \frac{1}{(1-x)^2} = \sum_{n=0}^{\infty}{n+1 \choose n }x^n\ =\ \sum_{n=0}^{\infty}nx^n+\sum_{n=0}^{\infty}x^n. \) (9)

Po przekształceniu równości (9) uzyskuje się

\( \displaystyle \sum_{n=0}^{\infty}nx^n= \frac{1}{(1-x)^2} -\frac{1}{1-x}. \) (10)

Powołując się ponownie na Wniosek 7.5 otrzymujemy

\( \displaystyle \frac{1}{(1-x)^3} =\sum_{n=0}^{\infty}{ n+2 \choose n}x^n =\frac{1}{2}\sum_{n=0}^{\infty}n^2x^n+\frac{3}{2}\sum_{n=0}^{\infty}nx^n+\sum_{n=0}^{\infty}x^n, \)

co w połączeniu z równościami (9) oraz (10) daje zwartą postać funkcji tworzącej \( {G}(x) \) dla ciągu \( 1,4,9,\ldots,n^2,\ldots \):

\( \displaystyle {G}(x)=\sum_{n=0}^{\infty}n^2x^n =\frac{2}{(1-x)^3}-\frac{3}{(1-x)^2}+\frac{1}{1-x}. \)

Naszym zadaniem było jednakże policzenie funkcji tworzącej \( H(x) \) dla ciągu \( 1,1+4,1+4+9,\ldots,1+4+9+\ldots+n^2,\ldots \), tzn. ciągu sum początkowych wyrazów ciągu \( 1,4,9,\ldots,n^2,\ldots \). Aby uzyskać \( {H}(x) \) wystarczy więc skorzystać ze wzoru (7) i podzielić \({G}(x) \) przez \( 1-x \). Tak więc poszukiwanym rozwiązaniem są współczynniki funkcji tworzącej

\( {H}(x)=\frac{{G}(x)}{1-x} =\frac{2}{(1-x)^4}-\frac{3}{(1-x)^3}+\frac{1}{(1-x)^2}. \)

Korzystając po raz kolejny z Wniosku 7.5 otrzymujemy

\( \begin{align*}{H}(x) & =2\sum_{n=0}^{\infty}{n+3 \choose n}x^n-3\sum_{n=0}^{\infty}{n+2 \choose n}x^n+\sum_{n=0}^{\infty}{n+1 \choose n}x^n \\ & =\sum_{n=0}^{\infty}(\frac{1}{3}n^3+\frac{1}{2}n^2+\frac{1}{6}n)x^n. \end{align*} \)

W konsekwencji zachodzi równość

\( \displaystyle \sum_{k=1}^nk^2={x^n}{H}(x)=\frac{2n^3+3n+n}{6}. \)

Przykład

Wracamy do przykładu z monetami. Występowały tam funkcje tworzące postaci

\({A_k}(x) = 1+x^k+x^{2k}+x^{3k}+\ldots, \)

dla \( k=1,5,10,25 \) i \( 50 \). Z równości (7) wiemy, że

\( 1+x^k+x^{2k}+x^{3k}+\ldots, =\frac{1}{1-x^k} \)

tak więc:

\( \begin{align*}{A}(x)= {A_1}(x) & = \frac{1}{1-x}, \\ {B}(x)= {A}(x)\cdot {A_5}(x) & =\frac{{A}(x)}{1-x^5}, \\ {C}(x)={B}(x)\cdot {A_{10}}(x) & =\frac{{B}(x)}{1-x^{10}}, \\ {D}(x)={C}(x)\cdot {A_{25}}(x) & =\frac{{C}(x)}{1-x^{25}}, \\ {E}(x)= {D}(x)\cdot {A_{50}}(x) & =\frac{{D}(x)}{1-x^{50}}, \end{align*} \)

skąd natychmiast:

\( \begin{align*}{A}(x) & =1+x{A}(x), \\ {B}(x) & ={A}(x)+x^5{B}(x), \\ {C}(x) & ={B}(x)+x^{10}{C}(x), \\ {C}(x) & ={D}(x)+x^{25}{C}(x), \\ {D}(x) & ={E}(x)+x^{50}{D}(x). \end{align*} \)

Równości te dają zależności między współczynnikami:

\( a_n=1,\quad b_n=a_n+b_{n-5},\quad c_n=b_n+c_{n-10},\quad d_n=c_n+d_{n-25},\quad \)\( \quad e_n=d_n+e_{n-50}. \)

Wykorzystując te zależności rekurencyjne możemy wypełnić następującą tabelę:

\( \begin{array}{|c||c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline n & 0 & 5 & 10 & 15 & 2 & 25 & 30 & 35 & 40 & 45 & 50 & 55 & 60 & 65 & 70 & 75 & 80 & 85 & 90 & 95 & 100 \\ \hline\hline a_n & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ \hline b_n & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 & 10 & 11 & 12 & 13 & 14 & 15 & 16 & 17 & 18 & 19 & 20 & 21 \\ \hline c_n & 1 & 2 & 4 & 6 & 9 & 12 & 16 & 10 & 25 & 30 & 36 & 42 & 49 & 56 & 64 & 72 & 81 & & 100 & & 121 \\ \hline d_n & 1 & & & & & 13 & & & & & 49 & & & & & 121 & & & & & 242 \\ \hline e_n & 1 & & & & & & & & & & 50 & & & & & & & & & & 292 \\ \hline \end{array} \)

Pół dolara można rozmienić na \( 50 \) sposobów. Z kolei rozmieniać jednego dolara można na aż \( 292 \) sposoby. Do problemu tego wrócimy jeszcze w następnym wykładzie.

Funkcje tworzące w rozwiązywaniu zależności rekurencyjnych

Przykład

Rozważmy ciąg Fibonacci'ego, tzn. ciąg \( (f_0,f_1,f_2,f_3,\ldots) \) zdefiniowany w następujący sposób:

\( \begin{align*} f_0 & =0, \\ f_1 & =1, \\ f_n & =f_{n-1}+f_{n-2}\quad\textrm{dla}\ n\geq 2. \end{align*} \)

Znamy już postać zwartą jego wyrazów. Tym razem zobaczymy jak można ją otrzymać używając funkcji tworzących. Zależności rekurencyjne dla \( f_n \) przekładają się natychmiast na następujące równanie, jakie musi spełniać funkcja tworząca \({F}(x) \) dla ciągu Fibonacci'ego

\( \displaystyle {F}(x) =\sum_{n=0}^{\infty}f_nx^n =x+\sum_{n=2}^{\infty}(f_{n-1}+f_{n-2})x^n=x+x{F}(x)+x^2{F}(x). \)

Przekształcając powyższe równanie otrzymujemy:

\( {F}(x)=\frac{x}{1-x-x^2}. \) (11)

Celem, który chcemy osiągnąć to wykorzystanie funkcji \( \frac{x}{1-x-x^2} \) do przedstawienia współczynników \( f_n \) w postaci zwartej. Pierwszym krokiem będzie rozłożenie ułamka w równaniu (11) na sumę ułamków o mianownikach będących funkcjami liniowymi

\({F}(x)=\frac{x}{1-x-x^2} =\frac{x}{(1-z_0 x)(1-z_1 x)} =\frac{1}{\sqrt{5}}(\frac{1}{(1-z_0 x)}-\frac{1}{(1-z_1 x)}), \)

gdzie \( z_0=\frac{1+\sqrt{5}}{2} \) jest złotą liczbą oraz \( z_1=\frac{1-\sqrt{5}}{2} \) liczbą do niej sprzężoną. Korzystając z równania (7) otrzymujemy teraz

\( \displaystyle {F}(x) =\frac{1}{\sqrt{5}}(\sum_{n=0}^{\infty}{{z_0}^nx^n}-\sum_{n=0}^{\infty}{{z_1}^nx^n}) =\frac{1}{\sqrt{5}}\sum_{n=0}^{\infty}{({z_0}^n-{z_1}^n)x^n}. \)

Tak więc dostajemy szybko znaną nam już postać zwartą \( f_n=\frac{1}{\sqrt{5}}({z_0}^n-{z_1}^n) \).

Podczas rozwiązywania przykładu związanego z liczbami Fibonacci'ego natrafiliśmy na problem polegający na przedstawieniu w postaci szeregu wyrażenia \( \frac{x}{1-x-x^2} \). Przyjrzymy się dokładniej tego typu wyrażeniom.

Stopień wielomianu \( deg{{P}(x)}=n \), jeśli \( {P}(x)=p_0+p_1x+\ldots+p_nx^n \).

Funkcja wymierna \({R}(x) \) to funkcja postaci \( \frac{{P}(x)}{{Q}(x)} \), gdzie \( {P}(x) \) oraz \( {Q}(x)\neq0 \) są wielomianami skończonego stopnia.

Obserwacja 7.6

Niech \( A(x) \) oraz \( {B}(x) \) będą wielomianami \( deg{{A}(x)}\geq deg{{B}(x)} \). Wtedy istnieją wielomiany \( {Q}(x) \) oraz \({R}(x) \) takie, że

\( {A}(x)={Q}(x){B}(x)+{R}(x), \)

gdzie \( deg{{R}(x)} < deg{{A}(x)}=deg{{Q}(x)}+deg{{B}(x)} \).

Przykład

Niech

\( {A}(x)=3x^5+5x^4+2x^3+x^2+2\quad\textrm{oraz}\quad{B}(x)=x^3+2x^2-1. \)

Wtedy wielomiany

\( {Q}(x)=3x^2-x+3\quad\textrm{oraz}\quad{R}(x)=x+2 \)

spełniają

\( \begin{align*}{A}(x) & =3x^5+5x^4+2x^3+x^2+2 \\ & =(3x^2-x+3)\cdot(x^3+2x^2-1)+x+2 \\ & ={Q}(x){B}(x)+{R}(x). \end{align*} \)

Ponadto \( deg{{A}(x)}=5=2+3=deg{{Q}(x)}+deg{{B}(x)} \).

Wniosek 7.7

Niech \( {P}(x) \) oraz \( {Q}(x) \) będą wielomianami takimi, że \( deg{{P}(x)}\geq deg{{Q}(x)} \). Wtedy funkcję wymierną \( {R}(x)={P}(x)/ {Q}(x), \) można przedstawić w postaci

\( {R}(x)=\frac{{P}(x)}{{Q}(x)}={A}(x)+\frac{{B}(x)}{{Q}(x)}, \)

dla pewnych wielomianów \({A}(x) \) oraz \( {B}(x) \)

spełniających \( deg{{B}(x)} < deg{{Q}(x)} \).

Będziemy więc skupiali się jedynie nad takimi funkcjami wymiernymi \({R}(x)={P}(x)/{Q}(x), \) dla których \( deg{{P}(x)} < deg{{Q}(x)} \).

Twierdzenie 7.8

Niech \( {P}(x) \) oraz \({Q}(x) \) będą wielomianami takimi, że

\( deg{{P}(x)} < deg{{Q}(x)} \),

\({Q}(x)={S}(x){T}(x) \), gdzie oba wielomiany \( {S}(x),{T}(x) \) są stopnia co najmniej \( 2 \),

\( q_0\neq0 \).

Wtedy istnieją wielomiany \( {A}(x) \) oraz \( {B}(x) \) takie, że \( deg{{A}(x)} < deg{{S}(x)} \) i \( deg{{B}(x)} < deg{{T}(x)} \) oraz

\( \frac{{P}(x)}{{Q}(x)} =\frac{{A}(x)}{{S}(x)}+\frac{{B}(x)}{{T}(x)}. \)

Uwaga

Twierdzenie 7.8 pozwala na rozbijanie skomplikowanych funkcji wymiernych na sumę prostszych.

Wniosek [Metoda rozwijania funkcji wymiernej w szereg] Rozważmy funkcję wymierną w postaci

\( {R}(x)=\frac{{P}(x)}{{Q}(x)}, \)

gdzie \( deg{{P}(x)} < deg{{Q}(x)} \), oraz \( q_0\neq0 \). Załóżmy ponadto, że wielomian \( {Q}(x) \) rozkłada się na następujący iloczyn czynników liniowych

\({Q}(x) =q_0(1-\rho_1x)^{m_1}\cdot(1-\rho_2x)^{m_2}\cdot\ldots\cdot(1-\rho_kx)^{m_k}. \)

Warto wspomnieć, że dalecy nie każdy wielomian ma taki rozkład. Na przykład \( 1+x^2 \) jest nierozkładalny i nieliniowy. Wykorzystując parokrotnie Twierdzenie 7.8 otrzymujemy wielomiany \( {P_1}(x),\ldots,{P_k}(x) \) takie, że

\( {R}(x) =\frac{{P}(x)}{{Q}(x)}=\frac{{P_1}(x)}{(1-\rho_1x)^{m_1}}+\frac{{P_2}(x)}{(1-\rho_2x)^{m_2}}+\ldots+\frac{{P_k}(x)}{(1-\rho_kx)^{m_k}}, \)

gdzie \( deg{{P_i}(x)} < m_i \). Na mocy Obserwacji 7.6 możemy sprowadzić wielomian \( {P_i}(x) \) do

\( \begin{align*}{P_i}(x) & ={P_i^1}(x)(1-\rho_ix)+\gamma_{m_i} \\ & ={P_i^2}(x)(1-\rho_ix)^2+\gamma_{m_i-1}(1-\rho_ix)+\gamma_{m_i} \\ & \vdots \\ & =\gamma_1(1-\rho_ix)^{m_i-1}+\ldots+\gamma_{m_i-1}(1-\rho_ix)+\gamma_{m_i}, \end{align*} \)

gdzie \( m_i\geq deg{{P_i}(x)}>deg{{P_i^1}(x)}>deg{{P_i^2}(x)}>\ldots \). W konsekwencji otrzymamy

\( \displaystyle {R}(x)\ =\ \sum_{i=1}^k{(\frac{\gamma_{i,1}}{1-\rho_ix}+\frac{\gamma_{i,2}}{(1-\rho_ix)^2}+\ldots+\frac{\gamma_{i,m_i}}{(1-\rho_ix)^{m_i}})}. \)

Mnożąc teraz obie strony przez

\( {Q}(x)/q_0=(1-\rho_1x)^{m_1}\cdot(1-\rho_2x)^{m_2}\cdot\ldots\cdot(1-\rho_kx)^{m_k} \)

i porównując współczynniki przy odpowiadających potęgach \( x^i \) uzyskujemy pewien układ równań, rozwiązanie którego da nam poszukiwane współczynniki \( \gamma_{i,j} \). Z drugiej strony, z Wniosku 7.5 wynika, że

\( \displaystyle \frac{1}{(1-\rho x)^{m+1}} =\sum_{n=1}^{\infty}{ { m+n \choose m } \rho^n x^n} \)

i w konsekwencji:

\( \displaystyle [x^n]{R}(x)\ =\ \sum_{i=1}^k{\left(\gamma_{i,1}+ \gamma_{i,2}{n+1\choose 1}+ \ldots+ \gamma_{i,m_i}{n+m_i-1\choose m_i - 1}\right) }\rho_i^n. \) (12)

Przykład

Opisaną wyżej metodę ogólną zilustrujemy na przykładzie funkcji

\( {R}(x)=\frac{x^2}{1-x-x^2+x^3}. \)

Wielomian \( 1-x-x^2+x^3 \) ma jeden podwójny pierwiastek \( x=1 \) oraz jeden pojedynczy \( x=-1 \). Poznana metoda rozwijania funkcji wymiernej w szereg daje więc

\( {R}(x) =\frac{x^2}{(1-x)^2\cdot(1+x)}=\frac{\alpha}{1-x}+\frac{\beta}{(1-x)^2}+\frac{\gamma}{1+x}. \)

Mnożąc obie strony przez \( (1-x)^2\cdot(1+x) \) otrzymujemy:

\( x^2=\alpha(1-x^2)+\beta(1+x)+\gamma(1-2x+x^2). \)

Dwa wielomiany są równe, gdy współczynniki przy odpowiadających potęgach są sobie równe. Wartości \( \alpha, \beta, \gamma \) można więc wyliczyć z układu równań

\(\left \{ \begin{array} {l} \alpha & +\ \beta & +\ \gamma & = & 0 \\ \alpha & & -\ 2\gamma & = & 0 \\ & -\ \beta & +\ \gamma & = & 1. \end{array} \right. \)

Rozwiązaniem powyższego układu są wartości \( \alpha=-\frac{1}{4},\ \beta=\frac{1}{2},\ \gamma=-\frac{1}{4}. \) W konsekwencji otrzymujemy szereg

\( \begin{align*}{R}(x) & =\sum_{n=0}^{\infty}(-\frac{1}{4}+\frac{1}{2}(n+1) - \frac{1}{4}(-1)^n)x^n \\ & =x^2+x^3+2x^4+2x^5+3x^6+3x^7+4x^8+\ldots. \end{align*} \)

Jeżeli mianownik \( {Q}(x) \) funkcji wymiernej \( {R}(x)=\frac{{P}(x)}{{Q}(x)} \) posiada jedynie pierwiastki jednokrotne, to następne twierdzenie znacznie przyspiesza rozkład \( {R}(x) \) na sumę.

Twierdzenie 7.9

Jeśli \({R}(x)={P}(x)/{Q}(x) \), gdzie \( {Q}(x)=q_0\cdot(1-\rho_1x)\cdot\ldots\cdot(1-\rho_1x) \) i liczby \( \rho_1,\ldots,\rho_l \) są parami różne, to w przypadku gdy \({P}(x) \) jest wielomianem stopnia mniejszego niż \( l \), zachodzi

\( {x^n}{R}(x) =a_1\rho_1^n+\ldots+a_l\rho_l^n, \quad\textrm{dla}\ a_k=\frac{-\rho_k\cdot{P}(1/\rho_k)}{{Q'}(1/\rho_k)}. \)

Przykład

Mianownik \( {Q}(x) \) funkcji wymiernej

\( {R}(x)=\frac{{P}(x)}{{Q}(x)}=\frac{2x}{1-5x-2x^2+24x^3}. \)

ma trzy różne pierwiastki i można \( {R}(x) \) przedstawić jako

\({R}(x)=\frac{2x}{(1+2x)(1-3x)(1-4x)}. \)

Na mocy Twierdzenia 7.9 otrzymujemy więc, że

\({x^n}{R}(x)=-\frac{2}{15}(-2)^n-\frac{6}{5}3^n+\frac{4}{3}4^n. \)

Jak widzieliśmy na przykładzie ciągu Fibonacci'ego, funkcje tworzące mogą być bardzo pomocne przy szukaniu postaci zwartej pewnych ciągów zadanych rekurencyjnie.

Jednorodne, liniowe równanie rekurencyjneto równanie postaci

\(\left \{ \begin{array} {l} r_0 & = & c_0, \\ & \cdots & \\ r_{k-1} & = & c_{k-1}, \\ r_n & = & a_1r_{n-1}+a_2r_{n-2}+\ldots+a_kr_{n-k}\quad\textrm{dla}\ n\geq k, \end{array} \right . \)

gdzie \( c_0,\ldots,c_{k-1},a_1,\ldots,a_k \) są liczbami rzeczywistymi (niezależnymi od parametru rekurencyjnego \( n \)).

Rozważmy najpierw przypadek, gdy \( k=2 \), tzn. równanie postaci

\( \left \{ \begin{array} {l} r_0 & = & c_0, \\ r_1 & = & c_1, \\ r_n & = & a_1r_{n-1}+a_2r_{n-2}\quad\textrm{dla}\ n\geq 2. \end{array} \right . \) (13)

Przykładem takiego równania była zależność opisująca ciąg Fibonacci'ego. Zastosowanie ostatniej równości z (13) do funkcji tworzącej ciągu \( (r_0,r_1,r_2,\ldots) \) daje:

\( \begin{align*}{R}(x) & =r_0+r_1x+r_2x^2+r_3x^3+\ldots+r_nx^n+\ldots \\ & =c_0+c_1x+(a_1r_1+a_2r_0)x^2+\ldots+(a_1r_{n-1}+a_2r_{n-2})x^n+\ldots \\ & =c_0+(c_1-a_1c_0)x+a_1x{R}(x)+a_2x^2{R}(x), \end{align*} \)

tak więc

\( {R}(x)\ =\ \frac{c_0+(c_1-a_1c_0)x}{1-a_1x-a_2x^2} \)

Dla funkcji \({A}(x)=1-a_1x-a_2x^2=(1-\rho_1x)(1-\rho_2x) \) mogą zajść trzy przypadki:

\( \rho_1 \neq \rho_2 \) są różnymi liczbami rzeczywistymi. Wtedy

\( r_n\ =\ \alpha\rho_1^n+\beta\rho_2^n, \)

gdzie \( \alpha \) oraz \( \beta \) są liczbami rzeczywistymi.

\( \rho_1 = \rho_2 \). Wtedy

\( r_n\ =\ (\alpha n+\beta)\rho_1^n, \)

gdzie \( \alpha \) oraz \( \beta \) są liczbami rzeczywistymi.

\( \bigtriangledown \) Wartości \( \rho_1 \) oraz \( \rho_2 \) są różnymi liczbami zespolonymi. W tym wypadku całe rozumowanie przeprowadzone wcześniej dla liczb rzeczywistych pozostaje w mocy, tyle że dokonywane jest teraz na liczbach zespolonych. Dostajemy więc

\( r_n\ =\ \alpha\rho_1^n+\beta\rho_2^n. \)

gdzie \( \alpha \) oraz \( \beta \) są pewnymi liczbami zespolonymi. Przypadek pierwszy jest więc szczególną sytuacją obecnego przypadku. Może być jednak rozważany bez znajomości liczb zespolonych.

Wracamy teraz do ogólnego, jednorodnego liniowego równania rekurencyjnego. Analogicznie do przypadku, gdy \( k=2 \), otrzymujemy że

\( {R}(x)\ =\ \frac{{P}(x)}{1-a_1x-a_2x^2-\ldots-a_kx^k}, \)

gdzie \( {P}(x) \) jest wielomianem co najwyżej stopnia \( k-1 \), zależnym od wartości \( c_0,\ldots,c_{k-1},a_1,\ldots,a_k \). Korzystając z ogólnej metody rozwijania funkcji wymiernej w szereg, możemy odzyskać wyrazy ciągu \( r_n \), jako współczynniki \( [x^n]{R}(x) \) zgodnie z równaniem (12).

Przykład

Równanie rekurencyjne ma następującą postać

\(\left \{ \begin{array} {l} r_0 & = & 0, \\ r_1 & = & 0, \\ r_2 & = & 1, \\ r_n & = & r_{n-1}+r_{n-2}-r_{n-3}\quad\textrm{dla}\ n\geq 3. \end{array}\right . \)

Ostatnia zależność prowadzi do funkcji tworzącej \( {R}(x) \) spełniającej

\({R}(x)=x^2 + x{R}(x) + x^2{R}(x) - x^3{R}(x). \)

Po dokonaniu prostego wyliczenia dostajemy:

\( {R}(x)=\frac{x^2}{1-x-x^2+x^3}. \)

W przykładzie omawianym przy okazji metody rozwijania funkcji wymiernej w szereg, wyliczyliśmy współczynniki \( [x^n]{R}(x) \), a zatem mamy:

\( r_n=-\frac{1}{4}+\frac{1}{2}(n+1) - \frac{1}{4}(-1)^n\quad\textrm{dla dowolnego}\ n=0,1,2,3,\ldots. \)