Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów: Różnice pomiędzy wersjami
Nie podano opisu zmian |
|||
Linia 1: | Linia 1: | ||
==Ćwiczenia | ==Ćwiczenia== | ||
{{cwiczenie||| | {{cwiczenie|8.1|cw 8.1| | ||
II rok informatyki składa się z czterech grup | II rok informatyki składa się z czterech grup | ||
ćwiczeniowych o liczebnościach: 15, 11, 10 oraz 14 studentów. W | ćwiczeniowych o liczebnościach: 15, 11, 10 oraz 14 studentów. W | ||
Linia 11: | Linia 11: | ||
}} | }} | ||
Mamy tutaj rozkład wielomianowy o parametrach: <center><math>\displaystyle n= 5, \;r= 4, \;\; p_1 = | Mamy tutaj rozkład wielomianowy o parametrach: | ||
<center><math>\displaystyle n= 5, \;r= 4, \;\; p_1 = | |||
\frac{15}{50},\; p_2 = \frac{11}{50}, \; p_3 = | \frac{15}{50},\; p_2 = \frac{11}{50}, \; p_3 = | ||
\frac{10}{50},\; p_4 = \frac{14}{50}.</math></center> | \frac{10}{50},\; p_4 = \frac{14}{50}.</math></center> | ||
Chcemy więc policzyć: | Chcemy więc policzyć: | ||
<center><math>\displaystyle | <center><math>\displaystyle | ||
P(2,1,1,1) + P(1,2,1,1) + P(1,1,2,1) + P(1,1,1,2). | P(2,1,1,1) + P(1,2,1,1) + P(1,1,2,1) + P(1,1,1,2). | ||
</math></center> | </math></center> | ||
{{cwiczenie||| | Korzystając z definicji rozkładu wielomianowego łatwo obliczyć, że suma ta wynosi: | ||
<center><math>\displaystyle \frac {693}{3125} = 0.22176.</math></center> | |||
{{cwiczenie|8.2|cw 8.2| | |||
Uzasadnimy wzory na średnią i wariancję w rozkładzie Poissona. | Uzasadnimy wzory na średnią i wariancję w rozkładzie Poissona. | ||
}} | }} | ||
Otrzymujemy: | Otrzymujemy: | ||
<center><math>\displaystyle {\Bbb E}(X) = \sum_{k=0}^\infty k e^{-\lambda}\frac{\lambda^k}{k!} = \lambda e^{-\lambda} \sum_{k=1}^\infty \frac{\lambda^{k-1}}{(k-1)!} | <center><math>\displaystyle {\Bbb E}(X) = \sum_{k=0}^\infty k e^{-\lambda}\frac{\lambda^k}{k!} = \lambda e^{-\lambda} \sum_{k=1}^\infty \frac{\lambda^{k-1}}{(k-1)!} | ||
=\lambda e^{-\lambda} \sum_{k=0}^\infty \frac{\lambda^{k}}{k!} = \lambda e^{-\lambda} e^{\lambda} = \lambda,</math></center> | =\lambda e^{-\lambda} \sum_{k=0}^\infty \frac{\lambda^{k}}{k!} = \lambda e^{-\lambda} e^{\lambda} = \lambda,</math></center> | ||
<center><math>\displaystyle {\Bbb D}^2(X) = \sum_{k=0}^\infty (k-\lambda)^2 e^{-\lambda}\frac{\lambda^k}{k!} = | <center><math>\displaystyle {\Bbb D}^2(X) = \sum_{k=0}^\infty (k-\lambda)^2 e^{-\lambda}\frac{\lambda^k}{k!} = | ||
Linia 33: | Linia 48: | ||
\sum_{k=1}^\infty 2k\lambda e^{-\lambda}\frac{\lambda^k}{k!}+ | \sum_{k=1}^\infty 2k\lambda e^{-\lambda}\frac{\lambda^k}{k!}+ | ||
\sum_{k=0}^\infty \lambda^2 e^{-\lambda}\frac{\lambda^k}{k!}</math></center> | \sum_{k=0}^\infty \lambda^2 e^{-\lambda}\frac{\lambda^k}{k!}</math></center> | ||
<center><math>\displaystyle | <center><math>\displaystyle | ||
Linia 39: | Linia 55: | ||
2\lambda\sum_{k=1}^\infty k e^{-\lambda}\frac{\lambda^k}{k!}+ | 2\lambda\sum_{k=1}^\infty k e^{-\lambda}\frac{\lambda^k}{k!}+ | ||
\lambda^2 e^{-\lambda}\sum_{k=0}^\infty \frac{\lambda^k}{k!}</math></center> | \lambda^2 e^{-\lambda}\sum_{k=0}^\infty \frac{\lambda^k}{k!}</math></center> | ||
<center><math>\displaystyle =\lambda^2 +\lambda- | <center><math>\displaystyle =\lambda^2 +\lambda- | ||
2\lambda^2 +\lambda^2 = \lambda.</math></center> | 2\lambda^2 +\lambda^2 = \lambda.</math></center> | ||
{{cwiczenie||| | |||
{{cwiczenie|8.3|cw 8.3| | |||
Porównamy graficznie rozkład dwumianowy o parametrach <math>\displaystyle n=50</math> i <math>\displaystyle p = 0.1</math> (kolor niebieski) | Porównamy graficznie rozkład dwumianowy o parametrach <math>\displaystyle n=50</math> i <math>\displaystyle p = 0.1</math> (kolor niebieski) | ||
z rozkładem Poissona o parametrze <math>\displaystyle \lambda = 5</math> (kolor czerwony). | z rozkładem Poissona o parametrze <math>\displaystyle \lambda = 5</math> (kolor czerwony). | ||
Linia 54: | Linia 72: | ||
</center> | </center> | ||
{{cwiczenie||| | {{cwiczenie|8.4|cw 8.4| | ||
Udowodnimy podane na wykładzie wzory na wartość oczekiwaną i wariancję w | Udowodnimy podane na wykładzie wzory na wartość oczekiwaną i wariancję w | ||
rozkładzie wykładniczym. | rozkładzie wykładniczym. | ||
Linia 60: | Linia 78: | ||
Otrzymujemy: | Otrzymujemy: | ||
<center><math>\displaystyle {\Bbb E}(X) = \int_{-\infty}^\infty x f(x)\,dx = | <center><math>\displaystyle {\Bbb E}(X) = \int_{-\infty}^\infty x f(x)\,dx = | ||
\int_{0}^\infty \lambda x e^{-\lambda x}\,dx = \left[ | \int_{0}^\infty \lambda x e^{-\lambda x}\,dx = \left[ | ||
-e^{-\lambda x}(x+\frac{1}{\lambda})\right]_0^\infty = 0 - \left(-\frac{1}{\lambda}\right) = \frac{1}{\lambda},</math></center> | -e^{-\lambda x}(x+\frac{1}{\lambda})\right]_0^\infty = 0 - \left(-\frac{1}{\lambda}\right) = \frac{1}{\lambda},</math></center> | ||
<center><math>\displaystyle {\Bbb E}(X^2) = \int_{-\infty}^\infty x^2 f(x)\,dx = | <center><math>\displaystyle {\Bbb E}(X^2) = \int_{-\infty}^\infty x^2 f(x)\,dx = | ||
Linia 69: | Linia 89: | ||
\right]_0^\infty</math></center> | \right]_0^\infty</math></center> | ||
<center><math>\displaystyle = 0 - \left(-\frac{2}{\lambda^2}\right) = \frac{2}{\lambda^2},</math></center> | <center><math>\displaystyle = 0 - \left(-\frac{2}{\lambda^2}\right) = \frac{2}{\lambda^2},</math></center> | ||
<center><math>\displaystyle | <center><math>\displaystyle | ||
Linia 74: | Linia 95: | ||
</math></center> | </math></center> | ||
{{cwiczenie||| | |||
{{cwiczenie|8.5|cw 8.5| | |||
Narysujemy wykresy gęstości rozkładu Erlanga dla <math>\displaystyle n = 2, | Narysujemy wykresy gęstości rozkładu Erlanga dla <math>\displaystyle n = 2, | ||
\dots, 10</math>, z ustalonym parametrem <math>\displaystyle \lambda=0.25</math>. | \dots, 10</math>, z ustalonym parametrem <math>\displaystyle \lambda=0.25</math>. | ||
Linia 80: | Linia 102: | ||
Oto żądane wykresy: | Oto żądane wykresy: | ||
<center> | <center> | ||
<flash>file=Rp.1.88.swf|width=350|height=350</flash> | <flash>file=Rp.1.88.swf|width=350|height=350</flash> | ||
</center> | </center> | ||
Licząc odpowiednie całki można sprawdzić, że rozkłady te mają następujące nadzieje matematyczne: | Licząc odpowiednie całki można sprawdzić, że rozkłady te mają następujące nadzieje matematyczne: | ||
<center><math>\displaystyle 8, \, 12, \,16, \,20, \,24, 28, \,32, \,36, \, 40.</math></center> | <center><math>\displaystyle 8, \, 12, \,16, \,20, \,24, 28, \,32, \,36, \, 40.</math></center> | ||
{{cwiczenie||| | |||
{{cwiczenie|8.6|cw 8.6| | |||
Przypuśćmy, że ze zbioru <math>\displaystyle N</math>-elementowego losujemy w | Przypuśćmy, że ze zbioru <math>\displaystyle N</math>-elementowego losujemy w | ||
kolejnych momentach czasu po jednym elemencie, przy | kolejnych momentach czasu po jednym elemencie, przy | ||
Linia 108: | Linia 134: | ||
sam jak rozkład czasu oczekiwania na pierwszą | sam jak rozkład czasu oczekiwania na pierwszą | ||
"szóstkę". Mianowicie, <math>\displaystyle T_n</math> ma rozkład: | "szóstkę". Mianowicie, <math>\displaystyle T_n</math> ma rozkład: | ||
<center><math>\displaystyle | <center><math>\displaystyle | ||
P(T_n = k) = \left(\frac{n}{N}\right)^{k-1}\frac{N-n}{N}, \ \ k = | P(T_n = k) = \left(\frac{n}{N}\right)^{k-1}\frac{N-n}{N}, \ \ k = | ||
Linia 113: | Linia 141: | ||
</math></center> | </math></center> | ||
- jest to więc rozkład geometryczny o parametrze <math>\displaystyle p=\frac{N-n}{N}</math>. | |||
W związku z powyższym, zmienna losowa <math>\displaystyle T_n</math> ma określoną nadzieję matematyczną i wariancję: | W związku z powyższym, zmienna losowa <math>\displaystyle T_n</math> ma określoną nadzieję matematyczną i wariancję: | ||
<center><math>\displaystyle \displaystyle {\Bbb E}(T_n) = \frac{N}{N-n}, \;\; {\Bbb D}^2 (T_n) =\frac{nN}{(n-N)^2}.</math></center> | <center><math>\displaystyle \displaystyle {\Bbb E}(T_n) = \frac{N}{N-n}, \;\; {\Bbb D}^2 (T_n) =\frac{nN}{(n-N)^2}.</math></center> | ||
Zauważmy teraz, że: | |||
Zauważmy teraz, że: | |||
<center><math>\displaystyle T = T_0 + T_1+\dots +T_{r-1},</math></center> | |||
a więc: | a więc: | ||
<center><math>\displaystyle | <center><math>\displaystyle | ||
{\Bbb E}(T) = \sum_{n=0}^{r-1}E(T_n) = \sum_{n=0}^{r-1}\frac{N}{N-n}. | {\Bbb E}(T) = \sum_{n=0}^{r-1}E(T_n) = \sum_{n=0}^{r-1}\frac{N}{N-n}. | ||
</math></center> | </math></center> | ||
Ponieważ zmienne losowe <math>\displaystyle T_0, T_1,\dots, T_{r-1}</math> są | Ponieważ zmienne losowe <math>\displaystyle T_0, T_1,\dots, T_{r-1}</math> są | ||
niezależne, mamy także: | niezależne, mamy także: | ||
<center><math>\displaystyle | <center><math>\displaystyle | ||
{\Bbb D}^2 (T) = \sum_{n=0}^{r-1}D^2(T_n) = | {\Bbb D}^2 (T) = \sum_{n=0}^{r-1}D^2(T_n) = | ||
\sum_{n=0}^{r-1}\frac{N n}{(N-n)^2}. | \sum_{n=0}^{r-1}\frac{N n}{(N-n)^2}. | ||
</math></center> | </math></center> | ||
Wykorzystując wspomaganie komputerowe (na przykład program Maple), | Wykorzystując wspomaganie komputerowe (na przykład program Maple), | ||
obliczmy nadzieję i wariancję w kilku szczególnych przypadkach: | obliczmy nadzieję i wariancję w kilku szczególnych przypadkach: | ||
{| border=1 | {| border=1 | ||
Linia 148: | Linia 191: | ||
|} | |} | ||
Zwróćmy uwagę na to, że wyniki te są zgodne z intuicją -- gdy | Zwróćmy uwagę na to, że wyniki te są zgodne z intuicją -- gdy | ||
Linia 169: | Linia 211: | ||
problem. | problem. | ||
{{cwiczenie||| | {{cwiczenie|8.7|cw 8.7| | ||
Ile należy wykonać losowań ze zwracaniem, aby z | Ile należy wykonać losowań ze zwracaniem, aby z | ||
populacji <math>\displaystyle 200</math>-elementowej wybrać 100 różnych | populacji <math>\displaystyle 200</math>-elementowej wybrać 100 różnych | ||
Linia 176: | Linia 217: | ||
}} | }} | ||
Przyjmijmy oznaczenia jak w ćwiczeniu [[# | Przyjmijmy oznaczenia jak w ćwiczeniu [[#cw_8.6|8.6]] (tutaj <math>\displaystyle r=100</math>). | ||
Mamy znaleźć liczbę losowań <math>\displaystyle x</math>, dla której: <center><math>\displaystyle P(T \leq x) \geq | Mamy znaleźć liczbę losowań <math>\displaystyle x</math>, dla której: | ||
<center><math>\displaystyle P(T \leq x) \geq | |||
0.95.</math></center> | 0.95.</math></center> | ||
Możemy od razu założyć, że <math>\displaystyle x > m = {\Bbb E}(T)</math>. | Możemy od razu założyć, że <math>\displaystyle x > m = {\Bbb E}(T)</math>. | ||
Wówczas, korzystając m. in. z nierówności Czebyszewa (twierdzenie [[# | Wówczas, korzystając m. in. z nierówności Czebyszewa (twierdzenie [[Rachunek prawdopodobieństwa i statystyka/Wykład 7: Parametry rozkładów zmiennych losowych#tw_7.20|7.20]]), dla <math>\displaystyle \varepsilon = x - m</math> otrzymujemy: | ||
<center><math>\displaystyle | <center><math>\displaystyle | ||
P(T \leq x) = P(T \leq m+\varepsilon) = 1 - P(T> m + \varepsilon) | P(T \leq x) = P(T \leq m+\varepsilon) = 1 - P(T> m + \varepsilon) | ||
</math></center> | </math></center> | ||
<center><math>\displaystyle | <center><math>\displaystyle | ||
Linia 189: | Linia 238: | ||
\varepsilon) \ge 1 -\frac{{\Bbb D}^2 (T)}{\varepsilon^2}. | \varepsilon) \ge 1 -\frac{{\Bbb D}^2 (T)}{\varepsilon^2}. | ||
</math></center> | </math></center> | ||
Wystarczy więc dobrać <math>\displaystyle x</math> tak, aby: | Wystarczy więc dobrać <math>\displaystyle x</math> tak, aby: | ||
<center><math>\displaystyle 1 | <center><math>\displaystyle 1 | ||
-\frac{{\Bbb D}^2 (T)}{(x- m)^2} \ge 0.95. | -\frac{{\Bbb D}^2 (T)}{(x- m)^2} \ge 0.95. | ||
</math></center> | </math></center> | ||
Ponieważ wiemy już (z poprzedniego ćwiczenia), że | Ponieważ wiemy już (z poprzedniego ćwiczenia), że | ||
Linia 199: | Linia 252: | ||
wyliczyć <math>\displaystyle x</math> rozwiązując powyższą prostą nierówność kwadratową. | wyliczyć <math>\displaystyle x</math> rozwiązując powyższą prostą nierówność kwadratową. | ||
Tak więc otrzymujemy: | Tak więc otrzymujemy: | ||
<center><math>\displaystyle x \ge m + \sqrt{\frac{{\Bbb D}^2 (T)}{0.05}} \approx 172.879829.</math></center> | <center><math>\displaystyle x \ge m + \sqrt{\frac{{\Bbb D}^2 (T)}{0.05}} \approx 172.879829.</math></center> | ||
Zatem przy 173 rzutach mamy 95 pewności, że | Zatem przy 173 rzutach mamy 95 pewności, że | ||
Linia 206: | Linia 262: | ||
Jak zobaczymy później, wyniki te można jeszcze wzmocnić. | Jak zobaczymy później, wyniki te można jeszcze wzmocnić. | ||
===Zadanie 8.1=== | |||
Oblicz (skorzystaj, w miarę potrzeby, z tablic lub | Oblicz (skorzystaj, w miarę potrzeby, z tablic lub | ||
komputera): | komputera): |
Wersja z 17:06, 23 sie 2006
Ćwiczenia
Ćwiczenie 8.1
II rok informatyki składa się z czterech grup ćwiczeniowych o liczebnościach: 15, 11, 10 oraz 14 studentów. W czasie trwania zajęć przeprowadzono pięć sprawdzianów pisemnych dla całego roku. Za każdym razem wykładowca wybierał sobie w sposób losowy jedną pracę, aby osobiście ją sprawdzić. Jakie jest prawdopodobieństwo, że wśród wybranych prac znajdą się prace pochodzące ze wszystkich grup?
Mamy tutaj rozkład wielomianowy o parametrach:
Chcemy więc policzyć:
Korzystając z definicji rozkładu wielomianowego łatwo obliczyć, że suma ta wynosi:
Ćwiczenie 8.2
Uzasadnimy wzory na średnią i wariancję w rozkładzie Poissona.
Otrzymujemy:
Ćwiczenie 8.3
Porównamy graficznie rozkład dwumianowy o parametrach i (kolor niebieski) z rozkładem Poissona o parametrze (kolor czerwony).
Oto właściwy rysunek:
<flash>file=Rp.1.87.swf|width=350|height=350</flash>
Ćwiczenie 8.4
Udowodnimy podane na wykładzie wzory na wartość oczekiwaną i wariancję w rozkładzie wykładniczym.
Otrzymujemy:
Ćwiczenie 8.5
Narysujemy wykresy gęstości rozkładu Erlanga dla , z ustalonym parametrem .
Oto żądane wykresy:
<flash>file=Rp.1.88.swf|width=350|height=350</flash>
Licząc odpowiednie całki można sprawdzić, że rozkłady te mają następujące nadzieje matematyczne:
Ćwiczenie 8.6
Przypuśćmy, że ze zbioru -elementowego losujemy w kolejnych momentach czasu po jednym elemencie, przy czym jest to losowanie ze zwracaniem. Interesuje nas średnia długość czasu oczekiwania na wylosowanie różnych elementów.
Niech oznacza interesujący nas czas. Nie jest całkiem widoczne, jak wyznaczyć rozkład , jednak samą nadzieję matematyczną można obliczyć stosunkowo łatwo. Zauważmy w tym celu, że gdy w pewnym momencie mamy już wylosowanych różnych elementów, to czas oczekiwania na pojawienie się następnego, różnego od nich, elementu jest zmienną losową o rozkładzie, którego charakter jest w istocie taki sam jak rozkład czasu oczekiwania na pierwszą "szóstkę". Mianowicie, ma rozkład:
- jest to więc rozkład geometryczny o parametrze .
W związku z powyższym, zmienna losowa ma określoną nadzieję matematyczną i wariancję:
Zauważmy teraz, że:
a więc:
Ponieważ zmienne losowe są
niezależne, mamy także:
Wykorzystując wspomaganie komputerowe (na przykład program Maple),
obliczmy nadzieję i wariancję w kilku szczególnych przypadkach:
, : | , , |
, : | , , |
, : | , , |
, : | , . |
Zwróćmy uwagę na to, że wyniki te są zgodne z intuicją -- gdy
chcemy wylosować niewiele elementów, wystarczy niewiele
losowań, a ponieważ wariancja, będąca miarą rozrzutu, jest
mała, mamy właściwie pewność, że do wylosowania 30 różnych
elementów potrzebujemy 40 lub niewiele więcej losowań. Natomiast,
gdy chcemy mieć dużo, w porównaniu z liczebnością populacji,
elementów różnych, liczba losowań musi być duża, a jej
konkretne przewidywanie jest obarczone poważnym błędem.
Otrzymane wyniki mogą być wykorzystane do określenia wielkości populacji na podstawie próbki. Jeżeli, na przykład, w 12 losowaniach uzyskamy jedynie 8 elementów różnych, możemy przypuszczać, że wielkość populacji jest nieco mniejsza niż 100. Statystyka matematyczna podaje metody, jak w miarę precyzyjnie określić wielkość populacji oraz, przede wszystkim, jak precyzyjnie postawić problem.
Ćwiczenie 8.7
Ile należy wykonać losowań ze zwracaniem, aby z populacji -elementowej wybrać 100 różnych elementów z prawdopodobieństwem nie mniejszym niż ?
Przyjmijmy oznaczenia jak w ćwiczeniu 8.6 (tutaj ). Mamy znaleźć liczbę losowań , dla której:
Możemy od razu założyć, że .
Wówczas, korzystając m. in. z nierówności Czebyszewa (twierdzenie 7.20), dla otrzymujemy:
Wystarczy więc dobrać tak, aby:
Ponieważ wiemy już (z poprzedniego ćwiczenia), że
oraz , możemy
wyliczyć rozwiązując powyższą prostą nierówność kwadratową.
Tak więc otrzymujemy:
Zatem przy 173 rzutach mamy 95 pewności, że
wylosujemy 100 różnych elementów. Jeżeli wystarczy nam
90 pewności, możemy podobnie obliczyć, że wystarczy wykonać jedynie 163 rzuty.
Jak zobaczymy później, wyniki te można jeszcze wzmocnić.
Zadanie 8.1
Oblicz (skorzystaj, w miarę potrzeby, z tablic lub komputera):
, gdy ma rozkład wykładniczy z parametrem ,
, gdy ma rozkład jednostajny na odcinku ,
, gdy ma rozkład geometryczny z parametrem ,
, gdy ma rozkład dwumianowy z parametrami i ,
, gdy ma rozkład dwumianowy z parametrami i (w tym przypadku są dwa różne, praktyczne sposoby).
Uzyskane wyniki zilustruj geometrycznie.
}}
Ćwiczenie
Wylosuj 200 liczb według: (a) rozkładu dwupunktowego , (b) rozkładu jednostajnego na odcinku , (c) rozkładu dwumianowego z parametrami i . Oblicz w każdym przypadku nadzieję matematyczną i wariancję oraz porównaj je z wartościami teoretycznymi.
Ćwiczenie
Jakie jest prawdopodobieństwo tego, że wśród 200 losowo wybranych osób znajdują się co najmniej cztery osoby leworęczne, jeżeli przyjmiemy, że takie osoby stanowią całej populacji? Jak duża powinna być grupa osób, aby z prawdopodobieństwem lub większym, co najmniej jedna osoba w tej grupie była leworęczna?
Ćwiczenie
Ile rodzynek podczas wyrabiania ciasta trzeba średnio przeznaczyć na bułeczkę, aby losowo wybrana bułeczka zawierała co najmniej jedną rodzynkę z prawdopodobieństwem lub większym?
Ćwiczenie
Dwóch ludzi wykonuje rzutów monetą symetryczną. Jakie jest prawdopodobieństwo tego, że obaj otrzymają tyle samo orłów?
Ćwiczenie
Ze stawu, w którym pływa ryb, w tym ryb jadalnych, odłowiono ryb. Jaka jest oczekiwana liczba odłowionych ryb jadalnych?
Ćwiczenie
Niezależne zmienne losowe i mają rozkłady wykładnicze z parametrami oraz . Wykaż, że zmienna losowa też ma rozkład wykładniczy.
Ćwiczenie
Dla grupy osób znajdź oczekiwaną liczbę dni, które są dniami urodzin tych osób.
Ćwiczenie
Oblicz prawdopodobieństwo tego, że pierwiastki równania są rzeczywiste, wiedząc, że oraz są niezależnymi zmiennymi losowymi o rozkładzie jednostajnym na odcinku .
Ćwiczenie
Wykaż, że zmienna losowa ma rozkład jednostajny na przedziale , o ile oraz mają taki sam rozkład wykładniczy i są niezależne.