Rachunek prawdopodobieństwa i statystyka/Wykład 8: Przegląd ważniejszych rozkładów: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Pitab (dyskusja | edycje)
Nie podano opisu zmian
 
Pitab (dyskusja | edycje)
Linia 167: Linia 167:


{| border=1
{| border=1
|+ <span style="font-variant:small-caps">Uzupelnij tytul</span>
|+ <span style="font-variant:small-caps">Rozkład dwumianowy a rozkład Poissona</span>
|-  
|-  
|  
|  

Wersja z 09:10, 14 sie 2006

Omówimy kilka najczęściej spotykanych w zastosowaniach rozkładów dyskretnych i ciągłych, charakteryzujących często zmienne losowe związane ze zliczaniem oraz czasem oczekiwania na szczególne zdarzenia. Jednak najważniejszy rozkład, tak zwany rozkład normalny, zostanie omówiony w następnym rozdziale.

W poprzednich wykładach "uprawialiśmy" dość ogólną teorię rachunku prawdopodobieństwa, dlatego teraz zajmiemy się aspektem bardziej praktycznym i omówimy kilka podstawowych rozkładów oraz wskażemy na niektóre typowe sytuacje, w których rozkłady te występują. Pragniemy jednak podkreślić, iż rozważane tutaj rozkłady nie wyczerpują wszystkich ważnych, występujących w literaturze przedmiotu rozkładów prawdopodobieństwa.

Rozkłady związane ze zliczaniem

  • Ile eksperymentów zakończy się sukcesem?
  • Ile jest zdarzeń sprzyjających wylosowaniu "naszych" numerów w grze liczbowej?
  • Ile zgłoszeń napływa średnio w ciągu godziny do pogotowia ratunkowego w godzinach nocnych?
  • Ile wypadków śmiertelnych ma miejsce podczas kąpieli w morzu?

Aby umieć odpowiadać na te i podobne pytania, najpierw należy zawsze zdać sobie sprawę z natury rozważanego zjawiska, czyli, mówiąc bardziej precyzyjnie, z charakteru rozkładu prawdopodobieństwa odpowiadającego danej sytuacji. Okazuje się, że wiele zupełnie różnych od siebie zjawisk zachodzi według podobnych schematów - na przykład jest w istocie losowaniem bez zwracania lub ze zwracaniem. Omówimy teraz kolejno kilka podstawowych rozkładów, odpowiedzialnych za większość tego typu sytuacji.

Na początku powtórzymy poznaną już wcześniej (patrz przykład 6.6) definicję rozkładu dwumianowego.

Rozkład dwumianowy

Rozkład P nazywamy rozkładem dwumianowym, jeżeli istnieją liczby n>0 oraz p i q takie, że 0<p,q<1, p+q=1 oraz zachodzi równość:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle P(k) = \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)p^kq^{n-k}\;\; \mbox{ dla } k = 0,1,\dots,n. }


Następujący wykres przedstawia rozkład dwumianowy z parametrami n=12 i p=0.6:

81.eps (r.dwumianowy)

Wzór dwumienny Newtona pozwala stwierdzić, że k=0nP(k)=1, a więc powyższa równość rzeczywiście określa rozkład P w sposób jednoznaczny (jest to oczywiście rozkład dyskretny). Poprzednio mieliśmy już okazję poznać różne sytuacje, w których on występuje - następujące twierdzenie formalizuje nasze dotychczasowe rozważania:

Twierdzenie 8.1

Niech X1,,Xn będą niezależnymi zmiennymi losowymi o takim samym rozkładzie dwupunktowym. Wtedy suma:


Sn=X1++Xn


ma rozkład dwumianowy.

Dowód

Zdarzenie {Sn=k} jest sumą rozłącznych zdarzeń polegających na tym, że dokładnie k spośród zmiennych losowych X1,,Xn przyjmuje wartość 1, a więc pozostałe nk zmiennych przyjmuje wartość 0. Niech Ai1,,ik będzie jednym z takich zdarzeń, gdzie i1,,ik oznaczają numery tych zmiennych, które przyjmują wartość 1. Z kolei każde zdarzenie Ai1,,ik jest iloczynem n zdarzeń postaci {Xj=εj}, gdzie εj=1 lub εj=0, a prawdopodobieństwa tych zdarzeń są równe odpowiednio p i q. Z niezależności zmiennych X1,,Xn wynika, że:


P(Ai1,,ik)=pkqnk.


Ponieważ wskaźniki i1,,ik można wybrać na Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)} sposobów, więc:


P(A)=P(i1,,ikAi1,,ik)=i1,,ikP(Ai1,,ik)


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle = \sum_{i_1, \dots, i_k}p^kq^{n-k} = \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)p^kq^{n-k}. }


Przykład 8.2 [Losowanie ze zwracaniem]

Przypuśćmy, że pewna populacja składa się z N elementów. Niech p będzie prawdopodobieństwem tego, że dany element z tej populacji ma pewną własność, powiedzmy własność W. Losujemy ze zwracaniem n elementów i oznaczamy przez X liczbę tych spośród nich, które mają własność W. Widać, że zmienna losowa X ma rozkład dwumianowy.

Przypomnimy teraz wyprowadzone w ćwiczeniu 7.2 wzory na nadzieję matematyczną i wariancję zmiennej losowej o rozkładzie dwumianowym. Wyrażają się one następującymi wzorami:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle {\Bbb E}(X) = np, \hspace{1.5cm} {\Bbb D}^2(X) = npq. }


W celu wyrobienia sobie intuicji związanej z rozkładem dwumianowym, proponujemy obejrzeć animację:

animacja 81.gif

Rozkład wielomianowy

Uogólnieniem rozkładu dwumianowego jest rozkład wielomianowy.

Rozkład P nazywamy rozkładem wielomianowym, jeżeli istnieje liczba naturalna n oraz liczby pi>0, i=1.r, r>1, takie, że i=1rpi=1 oraz dla wszystkich układów liczb całkowitych nieujemnych k1,,kr, dla których i=1rki=n, zachodzi równość:


P(k1,,kr)=n!k1!kr!p1k1prkr.


Widzimy oczywiście, że gdy r=2, rozkład wielomianowy jest w istocie równoważny rozkładowi dwumianowemu (kładziemy p1=p i p2=q).

Wyobraźmy sobie, że pewien eksperyment powtarzamy n razy, przy czym spełnione są następujące warunki:

  1. każdy eksperyment może dać dokładnie r różnych wyników, powiedzmy "1",... , "r",
  2. prawdopodobieństwa poszczególnych wyników są w każdym eksperymencie zawsze takie same - oznaczamy je przez pi, i=1r,
  3. eksperymenty są niezależne od siebie.

Niech X1,,Xr oznaczają odpowiednio liczbę eksperymentów zakończonych wynikiem "1", ... , "r". Wtedy łatwo stwierdzić, stosując indukcję, że wektor losowy (X,,Xr) ma rozkład wielomianowy.

Rozkład Poissona

życiorys, zdjęcie Poissona

Rozkład P jest rozkładem Poissona, jeżeli istnieje taka liczba λ>0, że:


P(k)=eλλkk! dla k=0,1,2,


Poniższy wykres przedstawia rozkład Poissona o parametrze λ=5.

82.eps (r.Poissona)

Okazuje się, że wiele zjawisk podlega właśnie rozkładowi Poissona. Kolejne twierdzenie mówi o tym, że jest on w pewnym sensie granicą rozkładów dwumianowych. W szczególności, gdy mamy do czynienia z dużą (n>100) liczbą niezależnych prób Bernoulliego, z jednakowym, małym (p<0.1) prawdopodobieństwem sukcesu każda, to liczba sukcesów ma niemal dokładnie rozkład Poissona z parametrem λ=np. Zgodność taka została zaobserwowana w wielu konkretnych sytuacjach praktycznych. Co więcej, istnieją dość dokładne oszacowania błędu, jaki popełniamy przybliżając rozkład dwumianowy rozkładem Poissona. W tym miejscu poprzestaniemy jedynie na wykazaniu prostego twierdzenia wskazującego na możliwość takiego przybliżania oraz na podaniu danych liczbowych ilustrujących jego dokładność.

Twierdzenie 8.3

Niech liczby pn>0 tworzą taki ciąg, że:


limnnpn=λ>0


oraz niech k będzie nieujemną liczbą naturalną. Wtedy:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \lim_{n\rightarrow \infty} \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)p_n^k(1 - p_n)^{n-k} = e^{-\lambda}\,\frac{\lambda^k}{k!}. }


Dowód

Oznaczając λn=npn, dostajemy równość:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)p_n^k(1-p_n)^{n-k} = \frac{\lambda_n^k}{k!}\cdot\frac{n(n-1)\cdot \dots \cdot(n-k+1)}{n^k}\cdot\left(1- \frac{\lambda_n}{n}\right)^n\cdot \left(1-\frac{\lambda_n}{n}\right)^{-k}\!\!. }


Ponieważ k jest ustalone, zatem ostatni czynnik zmierza do 1. Drugi czynnik jest równy:


1(11n)(1k1n),


a więc też zmierza do 1. Istotne są natomiast czynniki pierwszy oraz trzeci, które zmierzają odpowiednio do:


λkk!orazeλ.


Poniższa tabela porównuje rozkład dwumianowy z rozkładem Poissona.


Rozkład dwumianowy a rozkład Poissona
n=100, p=0,01 n=50, p=0,1 n=100,

p=0,1

rozkład rozkład rozkład rozkład rozkład rozkład
k dwum. Poissona dwum. Poissona dwum. Poissona
0 0,3660 0,3679 0,0052 0,0067 0,0000 0,0000
1 0,3697 0,3679 0,0286 0,0337 0,0003 0,0005
2 0,1849 0,1839 0,0779 0,0842 0,0016 0,0023
3 0,0610 0,0613 0,1386 0,1404 0,0059 0,0076
4 0,0149 0,0153 0,1809 0,1755 0,0159 0,0189
5 0,0029 0,0031 0,1849 0,1755 0,0339 0,0378
6 0,0005 0,0005 0,1541 0,1462 0,0596 0,0631
7 0,0001 0,0001 0,1076 0,1044 0,0889 0,0901
8 0,0000 0,0000 0,0643 0,0653 0,1148 0,1126
9 0,0000 0,0000 0,0333 0,0363 0,1304 0,1251
10 0,0000 0,0000 0,0152 0,0181 0,1319 0,1251
11 0,0000 0,0000 0,0061 0,0082 0,1199 0,1137
12 0,0000 0,0000 0,0022 0,0034 0,0988 0,0948
13 0,0000 0,0000 0,0007 0,0013 0,0743 0,0729
14 0,0000 0,0000 0,0002 0,0005 0,0513 0,0521
15 0,0000 0,0000 0,0001 0,0002 0,0327 0,0347

Nadzieja matematyczna oraz wariancja w rozkładzie Poissona wyrażają się wzorami:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle {\Bbb E}(X) = \lambda, \hspace{2cm} {\Bbb D}^2 (X) = \lambda. }


Następująca animacja pokazuje, jak zmienia się kształt rozkładu Poissona dla najczęściej spotykanych wartości parametrów:

animacja 82.gif

Rozkład hipergeometryczny