Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów

From Studia Informatyczne

Ćwiczenia



Ćwiczenie 8.1

II rok informatyki składa się z czterech grup ćwiczeniowych o liczebnościach: 15, 11, 10 oraz 14 studentów. W czasie trwania zajęć przeprowadzono pięć sprawdzianów pisemnych dla całego roku. Za każdym razem wykładowca wybierał sobie w sposób losowy jedną pracę, aby osobiście ją sprawdzić. Jakie jest prawdopodobieństwo, że wśród wybranych prac znajdą się prace pochodzące ze wszystkich grup?

Mamy tutaj rozkład wielomianowy o parametrach:


\displaystyle n= 5, \;r=  4, \;\; p_1 = \frac{15}{50},\; p_2   = \frac{11}{50}, \;  p_3   = \frac{10}{50},\; p_4 = \frac{14}{50}.


Chcemy więc policzyć:


\displaystyle  P(2,1,1,1) + P(1,2,1,1) + P(1,1,2,1) + P(1,1,1,2).


Korzystając z definicji rozkładu wielomianowego łatwo obliczyć, że suma ta wynosi:


\displaystyle \frac {693}{3125} = 0.22176.


Ćwiczenie 8.2

Uzasadnimy wzory na średnią i wariancję w rozkładzie Poissona.

Otrzymujemy:


\displaystyle {\Bbb E}(X) = \sum_{k=0}^\infty k e^{-\lambda}\frac{\lambda^k}{k!} = \lambda e^{-\lambda} \sum_{k=1}^\infty \frac{\lambda^{k-1}}{(k-1)!} =\lambda e^{-\lambda} \sum_{k=0}^\infty \frac{\lambda^{k}}{k!} = \lambda e^{-\lambda} e^{\lambda} = \lambda,


\displaystyle {\Bbb D}^2(X) = \sum_{k=0}^\infty (k-\lambda)^2 e^{-\lambda}\frac{\lambda^k}{k!} = \sum_{k=1}^\infty k^2 e^{-\lambda}\frac{\lambda^k}{k!}- \sum_{k=1}^\infty 2k\lambda e^{-\lambda}\frac{\lambda^k}{k!}+ \sum_{k=0}^\infty \lambda^2 e^{-\lambda}\frac{\lambda^k}{k!}


\displaystyle  =\lambda\sum_{k=1}^\infty (k-1) e^{-\lambda}\frac{\lambda^{k-1}}{(k-1)!}+ \lambda e^{-\lambda}\sum_{k=1}^\infty \frac{\lambda^{k-1}}{(k-1)!}- 2\lambda\sum_{k=1}^\infty k e^{-\lambda}\frac{\lambda^k}{k!}+ \lambda^2 e^{-\lambda}\sum_{k=0}^\infty \frac{\lambda^k}{k!}


\displaystyle =\lambda^2 +\lambda- 2\lambda^2 +\lambda^2 = \lambda.


Ćwiczenie 8.3

Porównamy graficznie rozkład dwumianowy o parametrach \displaystyle n=50 i \displaystyle p = 0.1 (kolor niebieski) z rozkładem Poissona o parametrze \displaystyle \lambda = 5 (kolor czerwony).

Oto właściwy rysunek:



Ćwiczenie 8.4

Udowodnimy podane na wykładzie wzory na wartość oczekiwaną i wariancję w rozkładzie wykładniczym.

Otrzymujemy:


\displaystyle  {\Bbb E}(X) = \int_{-\infty}^\infty x f(x)\,dx = \int_{0}^\infty \lambda x e^{-\lambda x}\,dx = \left[ -e^{-\lambda x}(x+\frac{1}{\lambda})\right]_0^\infty = 0 - \left(-\frac{1}{\lambda}\right)= \frac{1}{\lambda},


\displaystyle  {\Bbb E}(X^2) = \int_{-\infty}^\infty x^2 f(x)\,dx = \int_{0}^\infty \lambda x^2 e^{-\lambda z}\,dx = \left[ -e^{-\lambda x}\frac{2+2\lambda x+x^2\lambda^2}{\lambda^2} \right]_0^\infty


\displaystyle = 0 - \left(-\frac{2}{\lambda^2}\right) = \frac{2}{\lambda^2},


\displaystyle  {\Bbb D}^2 (X) = {\Bbb E}(X^2) - {\Bbb E}(X)^2 =  \frac{1}{\lambda^2}.


Ćwiczenie 8.5

Narysujemy wykresy gęstości rozkładu Erlanga dla \displaystyle n = 2, \dots, 10, z ustalonym parametrem \displaystyle \lambda=0.25.

Oto żądane wykresy:




Licząc odpowiednie całki można sprawdzić, że rozkłady te mają następujące nadzieje matematyczne:
\displaystyle 8, \, 12, \,16, \,20, \,24,  28, \,32, \,36, \, 40.


Ćwiczenie 8.6

Przypuśćmy, że ze zbioru \displaystyle N-elementowego losujemy w kolejnych momentach czasu po jednym elemencie, przy czym jest to losowanie ze zwracaniem. Interesuje nas średnia długość czasu oczekiwania na wylosowanie \displaystyle r różnych elementów.

Niech \displaystyle T oznacza interesujący nas czas. Nie jest całkiem widoczne, jak wyznaczyć rozkład \displaystyle T, jednak samą nadzieję matematyczną można obliczyć stosunkowo łatwo. Zauważmy w tym celu, że gdy w pewnym momencie mamy już wylosowanych \displaystyle n różnych elementów, to czas oczekiwania \displaystyle T_n na pojawienie się następnego, różnego od nich, elementu jest zmienną losową o rozkładzie, którego charakter jest w istocie taki sam jak rozkład czasu oczekiwania na pierwszą "szóstkę". Mianowicie, \displaystyle T_n ma rozkład:


\displaystyle  P(T_n = k) = \left(\frac{n}{N}\right)^{k-1}\frac{N-n}{N}, \ \ k = 1,2,3, \dots


- jest to więc rozkład geometryczny o parametrze \displaystyle p=\frac{N-n}{N}.

W związku z powyższym, zmienna losowa \displaystyle T_n ma określoną nadzieję matematyczną i wariancję:


\displaystyle \displaystyle {\Bbb E}(T_n) =  \frac{N}{N-n}, \;\; {\Bbb D}^2 (T_n) =\frac{nN}{(n-N)^2}.


Zauważmy teraz, że:


\displaystyle T = T_0 + T_1+\dots +T_{r-1},


a więc:


\displaystyle  {\Bbb E}(T) = \sum_{n=0}^{r-1}E(T_n) =  \sum_{n=0}^{r-1}\frac{N}{N-n}.


Ponieważ zmienne losowe \displaystyle T_0, T_1,\dots, T_{r-1} są niezależne, mamy także:


\displaystyle  {\Bbb D}^2 (T)           =           \sum_{n=0}^{r-1}D^2(T_n)           = \sum_{n=0}^{r-1}\frac{N n}{(N-n)^2}.


Wykorzystując wspomaganie komputerowe (na przykład program Maple), obliczmy nadzieję i wariancję w kilku szczególnych przypadkach:


\displaystyle N = 100, \displaystyle r = 30: \displaystyle {\Bbb E}(T) \approx 35.45407600, \displaystyle {\Bbb D}^2 (X) \approx 6.885850949,
\displaystyle N = 200, \displaystyle r = 100: \displaystyle {\Bbb E}(T) \approx 138.1306861, \displaystyle {\Bbb D}^2 (X) \approx 60.37514711,
\displaystyle N = 200, \displaystyle r = 190: \displaystyle {\Bbb E}(T) \approx 589.8125388, \displaystyle {\Bbb D}^2 (X) \approx 3017.340055,
\displaystyle N = 100, \displaystyle r = 8: \displaystyle {\Bbb E}(T) \approx 8.294833858, \displaystyle {\Bbb D}^2 (X) \approx 0.3105547438.


Zwróćmy uwagę na to, że wyniki te są zgodne z intuicją - gdy chcemy wylosować niewiele elementów, wystarczy niewiele losowań, a ponieważ wariancja, będąca miarą rozrzutu, jest mała, mamy właściwie pewność, że do wylosowania 30 różnych elementów potrzebujemy 40 lub niewiele więcej losowań. Natomiast, gdy chcemy mieć dużo, w porównaniu z liczebnością populacji, elementów różnych, liczba losowań musi być duża, a jej konkretne przewidywanie jest obarczone poważnym błędem.

Otrzymane wyniki mogą być wykorzystane do określenia wielkości populacji na podstawie próbki. Jeżeli, na przykład, w 12 losowaniach uzyskamy jedynie 8 elementów różnych, możemy przypuszczać, że wielkość populacji jest nieco mniejsza niż 100. Statystyka matematyczna podaje metody, jak w miarę precyzyjnie określić wielkość populacji oraz, przede wszystkim, jak precyzyjnie postawić problem.

Ćwiczenie 8.7

Ile należy wykonać losowań ze zwracaniem, aby z populacji \displaystyle 200-elementowej wybrać 100 różnych elementów z prawdopodobieństwem nie mniejszym niż \displaystyle 0.95?

Przyjmijmy oznaczenia jak w ćwiczeniu 8.6 (tutaj \displaystyle r=100). Mamy znaleźć liczbę losowań \displaystyle x, dla której:


\displaystyle P(T  \leq  x)  \geq 0.95.


Możemy od razu założyć, że \displaystyle x > m = {\Bbb E}(T). Wówczas, korzystając m. in. z nierówności Czebyszewa (twierdzenie 7.20), dla \displaystyle \varepsilon  =  x  -  m otrzymujemy:


\displaystyle  P(T \leq x) = P(T \leq m+\varepsilon) = 1 - P(T> m + \varepsilon)


\displaystyle  \ge 1 -P(|T -m| \geq \varepsilon) \ge 1 -\frac{{\Bbb D}^2 (T)}{\varepsilon^2}.


Wystarczy więc dobrać \displaystyle x tak, aby:


\displaystyle 1 -\frac{{\Bbb D}^2 (T)}{(x-  m)^2} \ge 0.95.


Ponieważ wiemy już (z poprzedniego ćwiczenia), że \displaystyle m \approx 138.1306861 oraz \displaystyle D^2(T)  \approx 60.37514711, możemy wyliczyć \displaystyle x rozwiązując powyższą prostą nierówność kwadratową. Tak więc otrzymujemy:


\displaystyle  x \ge m + \sqrt{\frac{{\Bbb D}^2 (T)}{0.05}} \approx 172.879829.


Zatem przy 173 rzutach mamy 95 pewności, że wylosujemy 100 różnych elementów. Jeżeli wystarczy nam 90 pewności, możemy podobnie obliczyć, że wystarczy wykonać jedynie 163 rzuty. Jak zobaczymy później, wyniki te można jeszcze wzmocnić.


Zadanie 8.1
Oblicz (skorzystaj, w miarę potrzeby, z tablic lub komputera):

  1. \displaystyle P(X > 1), gdy \displaystyle X ma rozkład wykładniczy z parametrem \displaystyle \lambda = 1,
  2. \displaystyle P(X^2 > 1), gdy \displaystyle X ma rozkład jednostajny na odcinku \displaystyle (-2,3),
  3. \displaystyle P(X > 4), gdy \displaystyle X ma rozkład geometryczny z parametrem \displaystyle p = 0.1,
  4. \displaystyle P(|X-5| > 2), gdy \displaystyle X ma rozkład dwumianowy z parametrami \displaystyle n=8 i \displaystyle p=0.2,
  5. \displaystyle P(|X-5| > 2), gdy \displaystyle X ma rozkład dwumianowy z parametrami \displaystyle n=80 i \displaystyle p=0.02 (w tym przypadku są dwa różne, praktyczne sposoby).

Uzyskane wyniki zilustruj geometrycznie.

Zadanie 8.2
Wylosuj 200 liczb według: (a) rozkładu dwupunktowego \displaystyle (0,1,0.3), (b) rozkładu jednostajnego na odcinku \displaystyle U(0,10), (c) rozkładu dwumianowego z parametrami \displaystyle 10 i \displaystyle 0.6. Oblicz w każdym przypadku nadzieję matematyczną i wariancję oraz porównaj je z wartościami teoretycznymi.

Zadanie 8.3
Jakie jest prawdopodobieństwo tego, że wśród 200 losowo wybranych osób znajdują się co najmniej cztery osoby leworęczne, jeżeli przyjmiemy, że takie osoby stanowią \displaystyle 1\% całej populacji? Jak duża powinna być grupa osób, aby z prawdopodobieństwem \displaystyle 0.95 lub większym, co najmniej jedna osoba w tej grupie była leworęczna?

Zadanie 8.4
Ile rodzynek podczas wyrabiania ciasta trzeba średnio przeznaczyć na bułeczkę, aby losowo wybrana bułeczka zawierała co najmniej jedną rodzynkę z prawdopodobieństwem \displaystyle 0.95 lub większym?

Zadanie 8.5
Dwóch ludzi wykonuje \displaystyle n rzutów monetą symetryczną. Jakie jest prawdopodobieństwo tego, że obaj otrzymają tyle samo orłów?

Zadanie 8.6
Ze stawu, w którym pływa \displaystyle N ryb, w tym \displaystyle M ryb jadalnych, odłowiono \displaystyle n ryb. Jaka jest oczekiwana liczba odłowionych ryb jadalnych?

Zadanie 8.7
Niezależne zmienne losowe \displaystyle X i \displaystyle Y mają rozkłady wykładnicze z parametrami \displaystyle \lambda oraz \displaystyle \mu. Wykaż, że zmienna losowa \displaystyle \min(X,Y) też ma rozkład wykładniczy.

Zadanie 8.8
Dla grupy \displaystyle n osób znajdź oczekiwaną liczbę dni, które są dniami urodzin tych osób.

Zadanie 8.9
Oblicz prawdopodobieństwo tego, że pierwiastki równania \displaystyle x^2 + px + q są rzeczywiste, wiedząc, że \displaystyle p oraz \displaystyle q są niezależnymi zmiennymi losowymi o rozkładzie jednostajnym na odcinku \displaystyle (-1,1).

Zadanie 8.10
Wykaż, że zmienna losowa \displaystyle \frac{\xi}{\xi + \eta} ma rozkład jednostajny na przedziale \displaystyle (0,1), o ile \displaystyle \xi oraz \displaystyle \eta mają taki sam rozkład wykładniczy i są niezależne.