Skip to Content

Wartość oczekiwana

W tym rozdziale będziemy starali się odpowiadać na pytania w rodzaju:

  • jaka jest średnia łączna liczba oczek na dwóch kostkach?
  • w ciągu 10 rzutów monetą, ile razy średnio pojawia się sekwencja orzeł-reszka?

Zanim zdefiniujemy pojęcia, które pozwalają w elegancki i prosty sposób na nie odpowiadać, zastanówmy się co właściwie mamy na myśli mówiąc o średniej?

Wyobraźmy sobie, że rzucamy dwiema kostkami N razy. Niech \(x_1,x_2,\ldots,x_N\) będą sumami oczek z obu kostek w poszczególnych rzutach. Wtedy liczbę \( \frac{\sum_{i=1}^N x_i}{N}\) nazywa się średnią sumą oczek. Ile wynosi ta średnia? Ma ona oczywiście charakter losowy, ale jeśli N jest bardzo dużą liczbą, powiedzmy N = 10000, to następujące rozumowanie wydaje się prowadzić do dobrego oszacowania.

Dla dowolnej możliwej sumy \(k \in \{2,3,\ldots,12\}\) niech pk będzie prawdopodobieństwem uzyskania sumy k w pojedynczym rzucie. Wtedy w N rzutach spodziewamy się, że mniej więcej pkN razy pojawi się suma k. A zatem szukana przez nas średnia powinna mieć wartość bliską

\(\frac{\sum_{k=2}^{12} p_k N k}{N} = \sum_{k=2}^{12} p_k k .\)

W powyższej sumie obliczamy średnią ważoną ze wszystkich możliwych sum dla pojedynczego rzutu, przy czym wagami poszczególnych sum są ich prawdopodobieństwa. O powyższej wielkości można myśleć jako o swojego rodzaju oczekiwanej wartości średniej sumy oczek. Nie spodziewamy się, że faktyczna średnia suma będzie równa swojej wartości oczekiwanej, ale spodziewamy się, że będzie jej bliska, szczególnie dla dużych N.

Uwaga: W powyższym rozumowaniu pojawia się sformułowanie "W N rzutach spodziewamy się, że mniej więcej pkN razy pojawi się suma k". Jest ono intuicyjnie oczywiste, w szczególności traktowanie prawdopodobieństw jako częstości występowania zdarzeń jest jednym ze sposobów definiowania funkcji prawdopodobieństwa. Tym niemniej, w naszej (aksjomatycznej) teorii jedynym miejscem w którym odwołujemy się do doświadczenia bądź intuicji jest przypisywanie poszczególnym zdarzeniom prawdopodobieństw (np. używanie, bądź nie schematu klasycznego). To, że zdarzenie o prawdopodobieństwie p występuje około pN razy w N próbach jest (prawdziwym) stwierdzeniem, które należałoby w sposób ścisły sformułować i udowodnić. Wykracza to jednak poza ramy tego elementarnego wykładu.


Zmienne losowe i wartość oczekiwana

Zdefiniujemy teraz pojęcie wartości oczekiwanej/średniej na wzór oczekiwanej wartości sumy oczek opisanej w poprzednim podrozdziale. Następująca definicja wydaje się dobrze oddawać istotę przeprowadzonego tam rozumowania:

Wartość oczekiwana (definicja nieformalna)

Wartością oczekiwaną/średnią wielkości X, ozn. EX, nazywamy wartość sumy \( \sum_k p_k \cdot k ,\) gdzie k przebiega po wszystkich możliwych wartościach X, a pk jest prawdopodobieństwem tego, że X przyjmuje wartość k.

Definicji tej brakuje jednak ścisłości i odrobiny matematycznego formalizmu. W szczególności, nie jest jasne czym jest tajemnicza "wielkość" pojawiająca się w tej definicji. Spróbujmy lepiej zbadać naturę "wielkości" analizując kilka przykładów. Rzucając dwiema kostkami moglibyśmy chcieć obliczyć wartość oczekiwaną:

  • sumy oczek,
  • iloczynu oczek,
  • liczby oczek na pierwszej kostce,
  • łącznej liczby czwórek, itp.

Zauważmy, że każdemu z tych przykładów odpowiada pewna funkcja, której dziedziną jest Ω, a przeciwdziedziną zbiór liczb rzeczywistych. Przyjmijmy, dla ustalenia uwagi, że Ω jest zbiorem wszystkich par postaci (i,j), gdzie \(i,j \in \{1,2,3,4,5,6\}\). Wtedy sumę oczek opisuje funkcja

f1(i,j) = i + j,

iloczyn funkcja

f2(i,j) = ij,

a oczka na pierwszej kostce funkcja

f3(i,j) = i.

Zadanie 1 Opisz funkcję f4 opisującą łączną liczbę czwórek.

Rozwiązanie:
Funkcja ta jest określona następująco:

  • f4(4,4) = 2,
  • f4(4,i) = f4(i,4) = 1 dla \( i \in \{1,2,3,5,6\}\),
  • f4(i,j) = 0 dla \( i,j \in \{1,2,3,5,6\}\).

A zatem pojawiająca się w naszej nieformalnej definicji "wielkość" to po prostu pewna funkcja z Ω w liczby rzeczywiste. Takie funkcje nazywa się w teorii prawdopodobieństwa zmiennymi losowymi. Oznacza się je z reguły wielkimi literami, najczęściej X,Y,Z, a nie jak jesteśmy przywyczajeni f,g,h.

Uwaga: Warto w tym miejscu zwrócić uwagę na to, że zmienne losowe, pomimo swojej nazwy, nie są zmiennymi, tylko funkcjami. Nie są też w żadnym sensie losowe, jak widać na podanych przez nas powyżej przykładach.

Zanim podamy formalną wersję definicji wartości oczekiwanej przyjmijmy pewną umowę notacyjną. Zauważmy mianowicie, że napis "X(ω) = k" lub w skrócie "X = k" opisuje pewien podzbiór Ω, czyli zdarzenie. Zdarzenie to zawiera wszystkie takie \(\omega \in \Omega\), dla których X(ω) = k, a zatem jest ono równe X − 1({k}). W dalszym ciągu będziemy po prostu pisać "X = k" wszędzie tam, gdzie będziemy chcieli użyć tego zdarzenia. W ten sam sposób będziemy interpretować napisy w rodzaju "\(X \ge 2\)" czy "\(X \in \{1,2,5\}\)".

Jesteśmy już gotowi aby podać definicję wartości oczekiwanej korzystającą z pojęcia zmiennej losowej:

Wartość oczekiwana

Wartością oczekiwaną/średnią zmiennej losowej X, ozn. EX, nazywamy wartość sumy \( \sum_k P(X=k) \cdot k ,\) gdzie k przebiega po wszystkich wartościach przyjmowanych przez X.

Przykład 1 Spróbujmy obliczyć wartość oczekiwaną łącznej liczby oczek na dwóch kostkach. Niech Ω będzie, tak jak poprzednio, zbiorem par postaci (i,j), gdzie \(i,j \in \{1,2,3,4,5,6\}\) oraz niech X(i,j) = i + j. Interesuje nas wartość EX. Aby ją obliczyć wprost z definicji, musimy znać prawdopodobieństwa P(X = k) dla wszystkich \(k \in \{2,3,\ldots,12\}\). Łatwo sprawdzić, że są one równe:

P(X = 2) P(X = 3) P(X = 4) P(X = 5) P(X = 6) P(X = 7) P(X = 8) P(X = 9) P(X = 10) P(X = 11) P(X = 12)
\(\frac{1}{36}\) \(\frac{2}{36}\) \(\frac{3}{36}\) \(\frac{4}{36}\) \(\frac{5}{36}\) \(\frac{6}{36}\) \(\frac{5}{36}\) \(\frac{4}{36}\) \(\frac{3}{36}\) \(\frac{2}{36}\) \(\frac{1}{36}\)

Stąd

\(EX = \frac{2}{36} \cdot 1 + \frac{3}{36} \cdot 2 + \frac{4}{36} \cdot 3 + \frac{5}{36} \cdot 4 + \frac{6}{36} \cdot 5 + \frac{7}{36} \cdot 6 + \frac{8}{36} \cdot 5 + \frac{9}{36} \cdot 4 + \frac{10}{36} \cdot 3 + \frac{11}{36} \cdot 2 + \frac{12}{36} \cdot 1 = \frac{252}{36}= 7 \)

Wkrótce dowiemy się jak można obliczyć tę wartość oczekiwaną dużo prościej.


Alternatywny wzór na wartość oczekiwaną

W tym i następnym podrozdziale zajmiemy się badaniem własności wartości oczekiwanej. Na początek zauważmy następujący fakt:

Fakt
Niech X będzie zmienną losową określoną na przestrzeni Ω z funkcją prawdopodobieństwa P. Wtedy

\( EX = \sum_{\omega \in \Omega} P(\omega) X(\omega) \)

Dowód:
Aby uzyskać wzór z tezy twierdzenia wystarczy we wzorze z definicji

\( EX = \sum_k P(X=k) \cdot k \)

zastąpić każdy P(X = k) = P({ω:X(ω) = k}) przez

P(ω).
ω:X(ω) = k

Na pierwszy rzut oka nie jest tak łatwo zorientować się jaki właściwie sens ma powyższy fakt. Otóż chodzi w nim o to, że aby obliczyć wartość oczekiwaną, nie musimy obliczać wszystkich prawdopodobieństw P(X = k). Zamiast tego wystarczy dla każdego zdarzenia elementarnego \(\omega \in \Omega\) obliczyć P(ω) i X(ω). To podejście prowadzi często do dużo prostszych rachunków. Zobaczmy to na przykładzie.

Przykład 2 Obliczmy ponownie wartość oczekiwaną sumy oczek z dwóch kostek, tym razem korzystając z podanego powyżej faktu. Przy definicji Ω jak poprzednio, dostajemy następującą sumę

\(EX = \sum_{ \omega \in \Omega} P(\omega) X(\omega) = \sum_{i,j \in \{1,2,3,4,5,6\}} \frac{1}{36} (i+j) \)

Osoby bardziej wprawione w tego rodzaju rachunkach zapewne już widzą w jaki sposób obliczyć tę sumę. Mniej doświadczonym proponujemy następującą metodę. Suma powyżej wygląda następująco:

\( EX = \frac{1}{36}\left( (1+1)+(1+2)+\ldots+(1+6)+(2+1)+(2+2)+\ldots+(6+6)\right).\)

Każda z liczb 1,2,3,4,5,6 pojawia się sześciokrotnie na pierwszej pozycji i sześciokrotnie na drugiej, a zatem

\( EX = \frac{1}{36} \cdot 12 \cdot (1+2+3+4+5+6) = \frac{1}{3} \cdot 21 = 7 \)

Udało nam się uniknąć pieczołowitego obliczania P(X = k) dla wszystkich k. Warto zwrócić uwagę na to, że głównym powodem, dla którego ta metoda zadziałała tak dobrze jest to, że wszystkie P(ω) były u nas równe. Jest to oczywiście prawdą zawsze wtedy, gdy mamy do czynienia ze schematem klasycznym, czyli bardzo często.


Liniowość wartości oczekiwanej

Zanim odkryjemy jeszcze bardziej fascynujące własności wartości oczekiwanej, zauważmy rzecz następującą: Zmienne losowe są funkcjami. W związku z tym, tak samo jak funkcje, można je dodawać, odejmować i wykonywać wszelkie inne działania arytmetyczne. Wynikami tych działań są nowe zmienne losowe, dla których także możemy obliczać wartość oczekiwaną. Naturalne wydaje się pytanie: Czy istnieje prosty na sposób na obliczenie E(X + Y) lub E(XY), jeśli znamy EX i EY (można pytać także o inne działania, np. mnożenie, ale odpowiedź na to pytanie wykracza poza ramy tego wykładu). Okazuje się, że tak. Zanim jednak sformułujemy odpowiednie twierdzenie, zobaczmy na przykładzie dlaczego taki sposób może się okazać bardzo przydatny.

Przykład 3 Wróćmy do naszego przykładu z wartością oczekiwaną sumy oczek na dwóch kostkach. Niech Ω i X będą jak poprzednio. Niech ponadto X1 będzie liczbą oczek na pierwszej kostce, a X2 liczbą oczek na drugiej kostce. Wtedy zachodzi X = X1 + X2. Ponadto bardzo łatwo jest obliczyć EX1 wprost z definicji:

\( EX_1 = \frac{1}{6} \cdot 1 + \frac{1}{6} \cdot 2 + \frac{1}{6} \cdot 3 + \frac{1}{6} \cdot 4 + \frac{1}{6} \cdot 5 + \frac{1}{6} \cdot 6 = 3 \frac{1}{2} .\) Wartość EX2 można oczywiście obliczyć w identyczny sposób. Widać więc, że wzór pozwalający obliczyć EX przy użyciu EX1 i EX2 dawałby bardzo prosty sposób obliczenia EX.

Twierdzenie (Liniowość):

Niech X,Y będą zmiennymi losowymi określonymi na przestrzeni Ω z funkcją prawdopodobieństwa P, oraz niech \(c \in \mathbb{R}\). Wtedy:

  • E(X + Y) = EX + EY, oraz
  • E(cX) = cEX.

Uwaga: Słowo "liniowość" jest technicznym nazwą dwóch równości z tezy tego twierdzenia. Sformułowanie "wartość oczekiwana jest liniowa" znaczy dokładnie to samo co "wartość oczekiwana spełnia te dwie równości".

Dowód:
Drugi punkt tezy twierdzenia wynika natychmiast z faktu podanego w poprzednim rozdziale:

\( E(cX) = \sum_{\omega \in \Omega} P(\omega) cX(\omega)= c \sum_{\omega \in \Omega} P(\omega) X(\omega) = cEX .\)

Aby pokazać pierwszy punkt, trzeba rozbić sumę na dwa składniki:

\( E(X+Y) = \sum_{\omega \in \Omega} P(\omega) (X+Y)(\omega)=\sum_{\omega \in \Omega} P(\omega) (X(\omega)+Y(\omega))=\sum_{\omega \in \Omega} P(\omega) X(\omega)+\sum_{\omega \in \Omega} P(\omega) Y(\omega) = EX+EY.\)

Przykład 3 (c.d.) Wracając do naszego przykładu z kostkami widzimy, że skoro \(EX_1=EX_2 = 3 \frac{1}{2}\) oraz X = X1 + X2, to EX = 7.

W powyższym przykładzie zastosowanie liniowości wartości oczekiwanej pozwoliło na znaczne uproszczenie rachunków. Często jest jednak tak, że bez zastosowania tej metody praktycznie nie da się obliczyć wartości oczekiwanej, lub też jest to nieporównywalnie bardziej skomplikowane.

Przykład 4 Spróbujmy stwierdzić ile razy średnio pojawia się sekwencja orzeł-reszka w ciągu 10 (lub ogólniej n) rzutów monetą.

Niech Ω będzie zbiorem wszystkich ciągów długości 10 składających się z elementów O i R. Niech Xi (dla \(i=1,2,\ldots,9\)) będzie zmienną losową, która przyjmuje wartość 1 dla tych ciągów, w których na pozycjach i,i + 1 występuje sekwencja OR, oraz 0 w.p.p. Niech ponadto X będzie zmienną losową odpowiadającą liczbie wystąpień sekwencji OR w danym ciągu. Wtedy

\( X = X_1+X_2+\ldots+X_9. \)

A zatem, na mocy twierdzenia o liniowości wartości oczekiwanej, zachodzi też

\( EX = EX_1 + EX_2 + \ldots + EX_9. \)

Ale wartości EXi oblicza się bardzo łatwo. Obliczmy dla przykładu EX1:

\(EX_1 = P(X_1 = 0) \cdot 0 + P(X_1 = 1) \cdot 1 = P(X_1 = 1) = \frac{2^8}{2^{10}} = \frac{1}{4} ,\) bo jest 28 ciągów długości 10 zawierających sekwencję OR na pozycjach 1,2, oraz 210 wszystkich ciągów.

W identyczny sposób można pokazać, że \(EX_i=\frac{1}{4}\) dla wszystkich \(i=1,2,\ldots,9\). A zatem

\(EX = \frac{9}{4}.\)

Łatwo zauważyć, że jeśli interesują nas ciągi długości n, a nie 10, to analogiczne rozwiązanie prowadzie do odpowiedzi \(\frac{n-1}{4}\).

Zachęcamy czytelnika do próby obliczenia tej wartości wprost z definicji wartości oczekiwanej. Jest to wykonalne, ale dużo trudniejsze niż przedstawione tu rozwiązanie.

Zastosowany w tym przykładzie trick polegający na przedstawieniu interesującej nas zmiennej losowej jako sumy zmiennych przyjmujących tylko wartości 0 i 1 jest niezwykle ważny. W przypadku takich zmiennych obliczenie wartości oczekiwanej jest bowiem, jak to zauważyliśmy powyżej, wyjątkowo proste.


Zadania

Zadanie 2 Koło ruletki ma 37 pól ponumerowanych liczbami \(0,1,\ldots,36\). Stawiamy 1 zł na jedną z liczb, a następnie:

  • przegrywamy postawioną złotówkę, jeśli na ruletce wypadnie inna liczba niż obstawiona przez nas,
  • w.p.p. wygrywamy z powrotem postawioną złotówke i dodatkowo wygraną w wysokości 35 zł.

Jaka jest wartość oczekiwana zysku z pojedynczego zakładu?

Rozwiązanie:
Niech X będzie zmienną losową opisującą naszą wygraną z pojedynczego zakładu wyrażoną w złotówkach. Wtedy X przyjmuje wartość -1 z prawdopodobieństwem \(\frac{36}{37}\) oraz wartość 35 z prawdopodobieństwem \(\frac{1}{37}\). Żadnych innych wartości zmienna X nie przyjmuje. A zatem:

\( EX = -1 \cdot \frac{36}{37} + 35 \cdot \frac{1}{37} = -\frac{1}{37}\).

Tak jak można się było spodziewać, gra w ruletkę przynosi oczekiwaną stratę.

Zadanie 3 Oblicz wartość oczekiwaną łącznej liczby oczek w n rzutach kostką.

Rozwiązanie:
Definiujemy dla każdego \(i=1,2,\ldots,n\) zmienną losową Xi, która jest liczbą oczek na i-tej kostce. Ponadto niech zmienna losowa X będzie łączną liczbą oczek. Wtedy

\( X = X_1+X_2 + \ldots + X_n. \)

Wiemy z poprzednich rozważań, że \(EX_1 = EX_2 = \ldots = EX_n = 3\frac{1}{2} \) Stąd

\( EX = \left(3 \frac{1}{2} \right) n .\)

Obliczenie tej wartości wprost z definicji nie jest łatwe.

Zadanie 4 (*) Wrzucamy n kul do n urn. Jaka jest wartość oczekiwana liczby pełnych urn?

Wskazówka:
Zdefiniuj dla każdego \(i=1,2,\ldots,n\) zmienną losową Xi, która jest równa 1 wtw gdy urna i-ta jest pełna i skorzystaj z liniowości wartości oczekiwanej.

Aby obliczyć prawdopodobieństwo tego, że konkretna urna jest pełna, oblicz najpierw prawdopodobieństwo tego, że jest ona pusta.

Rozwiązanie:

Zgodnie ze wskazówką zdefiniujmy dla każdego \(i=1,2,\ldots,n\) zmienną losową Xi, która jest równa 1 wtw gdy urna i-ta jest pełna. Niech ponadto X będzie interesującą nas zmienną losową opisującą liczbę pełnych urn. Wtedy

\( X = X_1 + \ldots + X_n. \)

Z liniowości wartości oczekiwanej dostajemy:

\( EX = EX_1 + \ldots + EX_n. \)

Wystarczy zatem umieć policzyć każdą z wartości oczekiwanych EXi. Obliczmy EX1:

\(EX_1 = P(X_1 = 0) \cdot 0 + P(X_1 = 1) \cdot 1 = P(X_1 = 1).\)

To ostatnie prawdopodobieństwo jest po prostu prawdopodobieństwem tego, że pierwsza urna jest pełna. Najłatwiej jest je znaleźć obliczając, zgodnie ze wskazówką, prawdopodobieństwo tego, że jest ona pusta. To już jest łatwe. Za Ω przyjmiemy zbiór wszystkich n-elementowych ciągów o wyrazach w zbiorze \(\{1,\ldots,n\}\) (każdy taki ciąg opisuje numery urn, do których wpadają kolejne kule). Wtedy | Ω | = nn. Ponadto możemy użyć schematu klasycznego, bo wszystkie rozmieszczenia są równie prawdopodobne. Zbiór rozmieszczeń kul, w których pierwsza urna pozostaje pusta odpowiada podzbiorowi \(A \subseteq \Omega\) zawierającemu wszystkie ciągi, w których nigdzie nie występuje liczba 1. Ciągów takich jest | A | = (n − 1)n, a zatem \(P(A)=\left(\frac{n-1}{n}\right)^n\).

Stąd \( EX_1 = 1 - \left(\frac{n-1}{n}\right)^n\). W identyczny sposób obliczamy pozostałe EXi.

Wreszcie \( EX = EX_1 + \ldots + EX_n = n \cdot \left( 1 - \left(\frac{n-1}{n}\right)^n \right).\)

Zadanie dla chętnych: spróbuj obliczyć granicę ilorazu \(\frac{EX}{n}\) przy \(n \rightarrow \infty \).


Wartość oczekiwana, a podejmowanie decyzji

Chcielibyśmy zakończyć wykład dotyczący wartości oczekiwanej, a tym samym i cały kurs, krótką dyskusją na temat korzystania z wartości oczekiwanej jako kryterium przy podejmowaniu decyzji.

Zacznijmy od najprostszego przykładu, t.j. gier hazardowych, takich jak ruletka z zadania 2. Można by sądzić, że jeśli wartość oczekiwana wygranej w pojedynczej rundzie gry jest dodatnia, to warto w taką grę grać, jeśli natomiast jest ona ujemna (tak jak w przypadku ruletki), to grać nie należy. Wynika to wprost ze sposobu w jaki doszliśmy do definicji wartości oczekiwanej. Jeśli wartość oczekiwana gry jest dodatnia/ujemna, to spodziewamy się, że średni wynik po rozegraniu pewnej liczby gier także będzie dodatni/ujemny. Jest to tym bardziej prawdopodobne im dłużej gramy.

To rozumowanie wydaje się rozsądne i faktycznie bardzo często wartość oczekiwana jest sensownym kryterium przy podejmowaniu decyzji, nie tylko tych dotyczących gier hazardowych, ale dowolnych decyzji, dla których jesteśmy w stanie opisać dostępne nam opcje w języku przestrzeni probabilistycznych i zmiennych losowych. Należy jednak zachowywać ostrożność - w wielu sytuacjach rozumowania oparte wyłącznie na wartości oczekiwanej mogą prowadzić nas na manowce.

Zadanie 5 Proponujemy Ci zagranie w następującą grę. Rzucamy monetą i jeśli wypadnie orzeł wygrywasz 3 miliony zł, w przeciwnym przypadku przegrywasz 2 miliony. Czy chciałbyś zagrać w taką grę? Dlaczego?

Odpowiedź:
Większość osób, a przynajmniej większość odpowiedzialnych osób, nie chciałaby grać w tę grę z bardzo prostego powodu: nie mają 2 milionów, a nawet jeśli mają to nie chcą ich ryzykować w jednym rzucie monetą.

Ale gdyby zamiast 3 milionów i 2 milionów zaproponować 30 zł i 20 zł, wiele osób chętnie by zagrało.

Zadanie 6 Masz do wyboru:

  • 1 milion zł,
  • udział w grze, w której z prawdopodobieństwem \(\frac{1}{2}\) wygrasz 3 miliony zł, a z prawdopodobieństwem \(\frac{1}{2}\) nie wygrasz nic.

Którą opcję wybierzesz i dlaczego?

Odpowiedź:
Większość osób wybiera pierwszą opcję pomimo tego, że druga opcja ma większą wartość oczekiwaną (1.5 miliona zł). Powód jest prosty: 3 miliony nie są dla nich trzykrotnie cenniejsze od miliona. Zastanów się w jaki sposób zmieni się sytuacja, jeśli zastąpimy milion i 3 miliony przez 10 i 30 zł.

Spróbuj znaleźć inne sytuacje, w których wartość oczekiwana nie jest dobrym sposobem oceny różnych wariantów. Spróbuj też znaleźć takie, w których jest.