Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 9: Rozkład normalny i centralne twierdzenie graniczne: Różnice pomiędzy wersjami
Nie podano opisu zmian |
m Zastępowanie tekstu – „<math> ” na „<math>” |
||
(Nie pokazano 36 wersji utworzonych przez 6 użytkowników) | |||
Linia 1: | Linia 1: | ||
==Ćwiczenia | ==Ćwiczenia== | ||
Podajemy tu przykłady kilku konkretnych zastosowań centralnego | Podajemy tu przykłady kilku konkretnych zastosowań centralnego | ||
twierdzenia granicznego. | twierdzenia granicznego. | ||
{{cwiczenie||| | |||
Rzucono <math> | {{cwiczenie|9.1|cw 9.1| | ||
Rzucono <math>1000</math> razy symetryczną kostką do | |||
gry. Oblicz prawdopodobieństwo tego, że | gry. Oblicz prawdopodobieństwo tego, że | ||
"szóstka" wypadła więcej niż 150 razy. | "szóstka" wypadła więcej niż 150 razy. | ||
Aby rozwiązać to zadanie zauważmy najpierw, że interesująca nas | Aby rozwiązać to zadanie zauważmy najpierw, że interesująca nas | ||
ilość "szóstek" jest sumą 1000 | ilość "szóstek" jest sumą 1000 | ||
niezależnych prób Bernoulliego | niezależnych prób Bernoulliego | ||
o prawdopodobieństwie sukcesu <math> | o prawdopodobieństwie sukcesu <math>p = {1\over 6}</math> w każdej | ||
próbie (oznaczymy ją, tradycyjnie, przez <math> | próbie (oznaczymy ją, tradycyjnie, przez <math>S_{1000}</math>). Zgodnie z centralnym twierdzeniem granicznym | ||
(patrz | (patrz [[Rachunek prawdopodobieństwa i statystyka/Wykład 9: Rozkład normalny i centralne twierdzenie graniczne#tw_9.4|twierdzenie 9.4]]), suma ta ma w | ||
przybliżeniu rozkład <math> | przybliżeniu rozkład <math>N(np,\sqrt{npq})</math>. Wstawiając | ||
wartości liczbowe i korzystając ze | wartości liczbowe i korzystając ze [[Rachunek prawdopodobieństwa i statystyka/Wykład 9: Rozkład normalny i centralne twierdzenie graniczne#9.2|wzoru 9.2]], | ||
otrzymujemy: | otrzymujemy: | ||
<center><math> | |||
<center> | |||
<math> | |||
P(S_{1000} > 150) = 1 - P(S_{1000} \le 150) \approx 1 - | P(S_{1000} > 150) = 1 - P(S_{1000} \le 150) \approx 1 - | ||
\Phi_{1000\cdot \frac{1}{6}, \sqrt{1000\cdot \frac{1}{6}\cdot \frac{5}{6}}}(150) | \Phi_{1000\cdot \frac{1}{6}, \sqrt{1000\cdot \frac{1}{6}\cdot \frac{5}{6}}}(150) | ||
</math></center> | </math> | ||
</center> | |||
<center><math> | <center> | ||
<math> | |||
= 1 - \Phi\left(\frac{150 - | = 1 - \Phi\left(\frac{150 - | ||
\frac{1000}{6}}{\sqrt{\frac{5000}{36}}}\right) | \frac{1000}{6}}{\sqrt{\frac{5000}{36}}}\right) | ||
\approx 1 - \Phi(-1.41) = \Phi(1.41) \approx 0.9207 | \approx 1 - \Phi(-1.41) = \Phi(1.41) \approx 0.9207 | ||
</math></center> | </math> | ||
</center> | |||
gdzie ostatnia liczba pochodzi z tablic rozkładu | gdzie ostatnia liczba pochodzi z tablic rozkładu normalnego.}} | ||
normalnego. | |||
{{cwiczenie||| | {{cwiczenie|9.2|cw 9.2| | ||
Jakie jest prawdopodobieństwo, że | Jakie jest prawdopodobieństwo, że | ||
przy <math> | przy <math>1000</math> rzutach monetą symetryczną, różnica między | ||
ilością reszek i orłów będzie wynosić co najmniej | ilością reszek i orłów będzie wynosić co najmniej | ||
<math> | <math>100</math>? | ||
}} | }} | ||
Podobnie jak poprzednio, ilość uzyskanych orłów jest | Podobnie jak poprzednio, ilość uzyskanych orłów jest | ||
sumą <math> | sumą <math>1000</math>, niezależnych prób | ||
Bernoulliego (<math> | Bernoulliego (<math>S_{1000}</math>) o prawdopodobieństwie sukcesu | ||
<math> | <math>p = \frac{1}{2}</math> w pojedynczej próbie. Chcemy | ||
obliczyć: <center><math> | obliczyć: | ||
<center> | |||
<math>P(|S_{1000} -(1000 - S_{1000})| \ge 100)=P(|S_{1000} -500| \ge 50)</math> | |||
</center> | |||
Zauważmy, że prawdopodobieństwo zdarzenia | Zauważmy, że prawdopodobieństwo zdarzenia | ||
przeciwnego jest równe: | przeciwnego jest równe: | ||
<center><math> | |||
<center><math> | |||
F_{S_{1000}}(550) - F_{S_{1000}}(450) \approx \Phi_{500,\,5 \sqrt{10}}(550) - | F_{S_{1000}}(550) - F_{S_{1000}}(450) \approx \Phi_{500,\,5 \sqrt{10}}(550) - | ||
\Phi_{500,\,5 \sqrt{10}}(450) | \Phi_{500,\,5 \sqrt{10}}(450) | ||
</math></center> | </math></center> | ||
<center><math> | |||
<center><math> | |||
=\Phi(\sqrt{10}) - \Phi(-\sqrt{10}) = | =\Phi(\sqrt{10}) - \Phi(-\sqrt{10}) = | ||
2\Phi(\sqrt{10}) - 1 \approx 2 \Phi(3.16227766) - 1 \approx 0.9984346 | 2\Phi(\sqrt{10}) - 1 \approx 2 \Phi(3.16227766) - 1 \approx 0.9984346 | ||
</math></center> | </math></center> | ||
Tak więc interesujące nas prawdopodobieństwo | Tak więc interesujące nas prawdopodobieństwo | ||
jest w przybliżeniu równe <math>0.0016</math> - jest to o wiele | |||
bardziej zgodne z oczekiwaniami niż rozwiązanie | bardziej zgodne z oczekiwaniami niż rozwiązanie | ||
tego samego zagadnienia w | tego samego zagadnienia w [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 7: Parametry rozkładów zmiennych losowych#cw_7.6|ćwiczeniu 7.6]]. | ||
[[File:Rp-9-c3.mp4|253x253px|thumb|right]] | |||
{{cwiczenie||| | {{cwiczenie|9.3|cw 7.6| | ||
Wykonano <math> | Wykonano <math>10^4</math> dodawań, z dokładnością | ||
<math> | <math>10^{-8}</math> w każdym. Jakim błędem obarczona jest suma? | ||
}} | }} | ||
Zwróćmy uwagę, że tak postawiony problem nie ma większego | Zwróćmy uwagę, że tak postawiony problem nie ma większego | ||
sensu | sensu - w najbardziej optymistycznym przypadku, gdy | ||
wszystkie dodawania były dokładne, błąd sumy jest równy | wszystkie dodawania były dokładne, błąd sumy jest równy | ||
zeru, zaś w najgorszym wypadku wynosi on <math> | zeru, zaś w najgorszym wypadku wynosi on <math>10^4 10^{-8} | ||
= 10^{-4}</math>. Sprecyzujmy więc nasze zadanie i spróbujmy | = 10^{-4}</math>. Sprecyzujmy więc nasze zadanie i spróbujmy | ||
znaleźć taki przedział, w którym mieści się błąd sumy z | znaleźć taki przedział, w którym mieści się błąd sumy z | ||
prawdopodobieństwem co najmniej <math> | prawdopodobieństwem co najmniej <math>0.99</math>. | ||
Oznaczając błędy powstające w kolejnych | Oznaczając błędy powstające w kolejnych | ||
dodawaniach przez <math> | dodawaniach przez <math>X_i</math>, <math>i = 1,\dots</math>, <math>10^4</math>, | ||
widzimy, że błąd sumy jest znowu sumą | widzimy, że błąd sumy jest znowu sumą | ||
<math> | <math>S_{10000}</math>. Poszukujemy zatem takich liczb <math>a</math> i <math>b</math>, że: | ||
<center><math> | <center> | ||
<math>P(S_{10000} \in (a,b)) \ge 0.99</math> | |||
</center> | |||
Zauważmy, że | Zauważmy, że | ||
chociaż zadanie może mieć wiele rozwiązań, jednak w tym | chociaż zadanie może mieć wiele rozwiązań, jednak w tym | ||
przypadku najrozsądniejsze wydaje się szukanie możliwie | przypadku najrozsądniejsze wydaje się szukanie możliwie | ||
najmniejszego przedziału, symetrycznego względem punktu <math> | najmniejszego przedziału, symetrycznego względem punktu <math>0</math> (czasem | ||
ważniejsze są inne przedziały, na przykład | ważniejsze są inne przedziały, na przykład | ||
nieograniczone, ale zawsze decyduje o tym | nieograniczone, ale zawsze decyduje o tym | ||
specyfika konkretnego problemu). Szukamy więc | specyfika konkretnego problemu). Szukamy więc | ||
ostatecznie możliwie najmniejszej liczby <math> | ostatecznie możliwie najmniejszej liczby <math>\varepsilon > 0</math>, dla której: | ||
<center><math> | |||
<center> | |||
<math>P(|S_{10000}| \le \varepsilon) \ge 0.99</math> | |||
</center> | |||
Z założenia wiemy, że wszystkie zmienne losowe | Z założenia wiemy, że wszystkie zmienne losowe | ||
<math> | <math>X_i</math> mają taki sam rozkład jednostajny na przedziale | ||
<math> | <math>(-\frac{1}{2}\cdot 10^{-8},\,\frac{1}{2}\cdot 10^{-8})</math> i | ||
dlatego ich nadzieja matematyczna <math> | dlatego ich nadzieja matematyczna <math>m</math> jest równa <math>0</math>, zaś | ||
odchylenie standardowe <math> | odchylenie standardowe <math>\sigma</math> wynosi | ||
<math> | <math>\frac{1}{2\sqrt{3}}10^{-8}</math>. Mamy więc: | ||
<center><math> | |||
<center> | |||
<math> | |||
P(|S_{10000}| \le \varepsilon) \approx F_{S_{10000}}(\varepsilon) - | P(|S_{10000}| \le \varepsilon) \approx F_{S_{10000}}(\varepsilon) - | ||
F_{S_{10000}}(-\varepsilon) | F_{S_{10000}}(-\varepsilon) | ||
\approx 2\Phi(\beta) - 1 | \approx 2\Phi(\beta) - 1 | ||
</math></center> | </math> | ||
</center> | |||
gdzie (ćwiczenie) | gdzie (ćwiczenie) | ||
<math> | <math>\beta = 2\sqrt{3}\cdot10^6\varepsilon</math>. | ||
W tablicach znajdujemy, że najmniejszym <math>\beta</math> | |||
spełniającym warunek: | |||
<center> | |||
<math>2\Phi(\beta) - 1 | |||
\ge 0.99</math> | |||
</center> | |||
czyli: | czyli: | ||
jest <math> | |||
<center><math> | <center> | ||
<math>\Phi(\beta) | |||
\ge 0.995</math> | |||
</center> | |||
jest <math>\beta = 2.58</math>. Tak więc: | |||
<center> | |||
<math>\varepsilon \approx 0.745\cdot 10^{-6}</math> | |||
</center> | |||
jest szukaną przez | jest szukaną przez | ||
nas liczbą. Zauważmy, że zmniejszając nasze żądania | nas liczbą. Zauważmy, że zmniejszając nasze żądania | ||
co do pewności wyniku, możemy zwiększyć jego | co do pewności wyniku, możemy zwiększyć jego | ||
dokładność. Przykładowo, gdybyśmy zażądali, aby: | dokładność. Przykładowo, gdybyśmy zażądali, aby: | ||
{{cwiczenie||| | |||
<center> | |||
<math>P(|S_n| \le | |||
\varepsilon) \ge 0.9</math> | |||
</center> | |||
(tylko <math>90\%</math> pewności zamiast | |||
<math>99\%</math>), to powtarzając poprzednie rachunki, można | |||
stwierdzić, że szukana liczba to: | |||
<center><math>\varepsilon \approx | |||
0.476\cdot 10^{-6}</math></center> | |||
[[File:Rp-9-c4_a.mp4|253x253px|thumb|right]] | |||
{{cwiczenie|9.4|cw 9.4| | |||
Aby stwierdzić, jak wielu wyborców popiera obecnie | Aby stwierdzić, jak wielu wyborców popiera obecnie | ||
partię <math> | partię <math>ABC^2</math> (w sierpniu 2006 partia taka jeszcze | ||
nie istniała... | nie istniała...), losujemy spośród nich reprezentatywną | ||
próbkę i na niej przeprowadzamy badanie. Jak duża | próbkę i na niej przeprowadzamy badanie. Jak duża | ||
powinna być ta próbka, aby uzyskany wynik różnił się | powinna być ta próbka, aby uzyskany wynik różnił się | ||
od rzeczywistego poparcia dla partii <math> | od rzeczywistego poparcia dla partii <math>ABC</math> nie więcej niż | ||
o <math> | o <math>b =3\%</math>, z prawdopodobieństwem co najmniej <math>1 - \alpha | ||
= 0.95</math>? | = 0.95</math>? | ||
}} | }} | ||
Niech <math> | Niech <math>p \in (0,1)</math> oznacza faktyczne (lecz nieznane) | ||
poparcie dla partii <math> | poparcie dla partii <math>ABC</math>. Jeżeli próbka składa się z | ||
<math> | <math>n</math> osób, z których <math>S_n</math> wyraziło poparcie dla | ||
<math> | <math>ABC</math>, to liczba <math>\frac{S_n}{n}</math> jest poparciem | ||
wyznaczonym na podstawie próbki. Możemy założyć, że | wyznaczonym na podstawie próbki. Możemy założyć, że | ||
<math> | <math>S_n</math> jest sumą niezależnych zmiennych losowych | ||
<math> | <math>X_i</math> o rozkładzie: | ||
= 1) =p | |||
Chcemy znaleźć takie <math> | |||
<center><math> | <center> | ||
<math>P(X_i =0) = 1-p,\;\;P(X_i | |||
= 1) =p</math> | |||
</center> | |||
Chcemy znaleźć takie <math>n</math>, aby: | |||
<center> | |||
<math> | |||
P\left( \left| \frac{S_n}{n} - p \right| \le b \right) \ge 1 - | P\left( \left| \frac{S_n}{n} - p \right| \le b \right) \ge 1 - | ||
\alpha | \alpha</math> | ||
</center> | |||
Ponieważ średnia arytmetyczna <math> | Ponieważ średnia arytmetyczna <math>\frac{S_n}{n}</math> ma w | ||
przybliżeniu rozkład <math> | przybliżeniu rozkład <math>N(p,\sqrt{\frac{p(1-p)}{n}})</math> (patrz [[Rachunek prawdopodobieństwa i statystyka/Wykład 9: Rozkład normalny i centralne twierdzenie graniczne#tw_9.5|twierdzenie 9.5]]), więc powyższa nierówność | ||
jest (w przybliżeniu) równoważna następującej | jest (w przybliżeniu) równoważna następującej | ||
nierówności: | nierówności: | ||
<center><math> | |||
<center><math> | |||
2 \Phi\left(\frac{b\sqrt{n}}{\sqrt{p(1-p)}} \right) - 1 | 2 \Phi\left(\frac{b\sqrt{n}}{\sqrt{p(1-p)}} \right) - 1 | ||
\ge 1 - \alpha | \ge 1 - \alpha</math></center> | ||
która jest z kolei równoważna nierówności: | która jest z kolei równoważna nierówności: | ||
<center><math> | |||
<center><math> | |||
n \ge \left( \frac{\Phi^{-1} \left(1- \frac{\alpha}{2} | n \ge \left( \frac{\Phi^{-1} \left(1- \frac{\alpha}{2} | ||
\right)}{b} \right)^2(1-p)p | \right)}{b} \right)^2(1-p)p | ||
</math></center> | </math></center> | ||
Chociaż nie znamy <math> | |||
\frac{1}{4} | Chociaż nie znamy <math>p</math>, wiemy, że: | ||
W takim razie liczba naturalna <math> | |||
<center><math> | |||
<center><math>(1-p) p \le | |||
\frac{1}{4}</math></center> | |||
W takim razie liczba naturalna <math>n</math>, spełniająca nierówność: | |||
<center><math> | |||
n \ge 0.25\cdot \left( \frac{\Phi^{-1} \left(1- \frac{\alpha}{2} | n \ge 0.25\cdot \left( \frac{\Phi^{-1} \left(1- \frac{\alpha}{2} | ||
\right)}{b} \right)^2, | \right)}{b} \right)^2</math>,</center> | ||
</math></center> | |||
określa wystarczającą wielkość próbki. Podstawiając <math>b | |||
= 0.03</math> i <math>\alpha = 0.05</math>, otrzymujemy: | |||
<center><math>n \ge 1067</math>.</center> | |||
Jeżeli jeszcze przed losowaniem próbki mamy wstępne | Jeżeli jeszcze przed losowaniem próbki mamy wstępne | ||
informacje o poparciu dla partii <math> | informacje o poparciu dla partii <math>ABC</math> - na przykład | ||
wiemy, że poparcie to jest mniejsze niż <math> | wiemy, że poparcie to jest mniejsze niż <math>20 \%</math> - | ||
możemy powyższy wynik znacznie polepszyć: w tym przypadku <math> | możemy powyższy wynik znacznie polepszyć: w tym przypadku <math>p | ||
\le 0.2</math>, a więc <math> | \le 0.2</math>, a więc <math>(1-p)p \le 0.16</math>, co oznacza, że <math>n | ||
\ge 683</math> jest wystarczającą wielkością próbki. | \ge 683</math> jest wystarczającą wielkością próbki. | ||
{{cwiczenie||| | {{cwiczenie|9.5|cw 9.5| | ||
W | W [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.7|ćwiczeniu 8.7]] pokazano, stosując | ||
nierówność Czebyszewa, że aby mieć <math> | nierówność Czebyszewa, że aby mieć <math>95 \%</math> pewności | ||
otrzymania <math> | otrzymania <math>100</math> różnych elementów ze zbioru | ||
<math> | <math>200</math>-elementowego, należy wykonać <math>173</math> losowania ze | ||
zwracaniem. Czy wynik ten można polepszyć, stosując centralne | zwracaniem. Czy wynik ten można polepszyć, stosując centralne | ||
twierdzenie graniczne? | twierdzenie graniczne? | ||
Linia 194: | Linia 281: | ||
gdyż nie są w naszym przypadku spełnione jego | gdyż nie są w naszym przypadku spełnione jego | ||
założenia. Pytamy jednak, czy mimo tego zmienna | założenia. Pytamy jednak, czy mimo tego zmienna | ||
losowa <math> | losowa <math>T</math> (określona w [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.7|ćwiczeniu 8.7]]), | ||
oznaczająca liczbę potrzebnych losowań, ma rozkład | oznaczająca liczbę potrzebnych losowań, ma rozkład | ||
normalny. Sprawdzimy normalność zmiennej losowej <math> | normalny. Sprawdzimy normalność zmiennej losowej <math>T</math> | ||
"doświadczalnie", przeprowadzając odpowiednią symulację | "doświadczalnie", przeprowadzając odpowiednią symulację | ||
komputerową. | komputerową. | ||
Wykonamy <math> | Wykonamy <math>500</math> takich samych doświadczeń - w | ||
każdym z nich losujemy <math> | każdym z nich losujemy <math>100</math> różnych elementów ze zbioru | ||
<math> | <math>200</math>-elementowego. Za każdym razem notujemy liczbę wykonanych | ||
losowań, otrzymując ciąg o nazwie "dane". Przytaczamy istotny fragment kodu programu Maple, | losowań, otrzymując ciąg o nazwie "dane". Przytaczamy istotny fragment kodu programu Maple, | ||
umożliwiającego realizację powyższego zadania: | umożliwiającego realizację powyższego zadania: | ||
''> losuj :<nowiki>=</nowiki> rand(1..200): | |||
> liczba_prob :<nowiki>=</nowiki> 500: | |||
> dane :<nowiki>=</nowiki> NULL: | |||
> from 1 to liczba_prob do | |||
> lista :<nowiki>=</nowiki> NULL: n :<nowiki>=</nowiki> 1: nowy :<nowiki>=</nowiki> losuj(): | |||
> while nops([lista]) < 100 do | |||
> while member(nowy,[lista]) do | |||
> nowy :<nowiki>=</nowiki> losuj(): n :<nowiki>=</nowiki> n+1 od; | |||
> lista :<nowiki>=</nowiki> lista,nowy: | |||
> od: | |||
> dane :<nowiki>=</nowiki> dane,n: | |||
> od:'' | |||
Obliczamy średnią <math>m</math> i odchylenie standardowe: | |||
<math>\sigma</math>. | |||
''> m :<nowiki>=</nowiki> evalf(describe[mean]([dane])); | |||
> sigma :<nowiki>=</nowiki> evalf(describe[standarddeviation]([dane]));'' | |||
<center><math>m := 138.9340000 | |||
<center><math> | |||
</math></center> | </math></center> | ||
<center><math> | <center><math>\sigma := 7.614567880 | ||
</math></center> | </math></center> | ||
Na podstawie otrzymanych danych rysujemy histogram, zaznaczając także wykres gęstości rozkładu | Na podstawie otrzymanych danych rysujemy histogram, zaznaczając także wykres gęstości rozkładu | ||
normalnego o obliczonych przed chwilą parametrach: | normalnego o obliczonych przed chwilą parametrach: | ||
<center> | <center> | ||
Linia 252: | Linia 328: | ||
</center> | </center> | ||
Otrzymane wyniki sugerują, że zmienna losowa <math> | |||
ma rozkład normalny | Otrzymane wyniki sugerują, że zmienna losowa <math>T</math> | ||
na | ma rozkład normalny - | ||
wariancję | na [[Rachunek prawdopodobieństwa i statystyka/Wykład 13: Przedziały ufności i testy|wykładzie 13]] poznamy test statystyczny, umożliwiający bardziej formalną weryfikację tego faktu. Zakładając więc, że zmienna losowa <math>T</math> ma rozkład normalny i znając jej nadzieję matematyczną oraz | ||
możemy łatwo poprawić wynik z | wariancję - obliczone w [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.6|ćwiczeniu 8.6]] - | ||
możemy łatwo poprawić wynik z [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.7|ćwiczenia 8.7]]. | |||
Mianowicie: | Mianowicie: | ||
<center><math> | |||
<center><math>P(T\leq x) \geq 0.5</math>,</center> | |||
gdy: | gdy: | ||
<center><math> | |||
x \approx \Phi_{138.1306861,\sqrt{60.37514711}}^{-1}(0.95) = 150.9114366</math></center> | |||
Zauważmy, że jest to wynik istotnie lepszy niż w [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.7|ćwiczeniu 8.7]]. | |||
------------------------------------------- | |||
<math> | '''Zadanie 9.1'''<br> | ||
<math>\ | Zmienna losowa <math>\xi</math> ma rozkład normalny | ||
<math>N(m,\sigma)</math>. Znajdź rozkład zmiennej losowej | |||
<math>e^\xi</math>. | |||
'''Zadanie 9.2'''<br> | |||
Niech <math>q_p</math> będzie kwantylem rzędu <math>p</math> w rozkładzie | |||
<math>N(0,1)</math>. Oblicz kwantyl rzędu <math>p</math> w rozkładzie | |||
<math>N(m,\sigma)</math>. | |||
'''Zadanie 9.3'''<br> | |||
Zaprojektuj i przeprowadź eksperyment komputerowy, | Zaprojektuj i przeprowadź eksperyment komputerowy, | ||
który weryfikuje centralne twierdzenie graniczne. | który weryfikuje centralne twierdzenie graniczne. | ||
'''Zadanie 9.4'''<br> | |||
Prawdopodobieństwo zapłacenia kary za jazdę bez | Prawdopodobieństwo zapłacenia kary za jazdę bez | ||
biletu wynosi <math> | biletu wynosi <math>0.02</math>. Jakie jest prawdopodobieństwo tego, że w | ||
trakcie <math> | trakcie <math>100</math> takich przejazdów co najmniej raz zapłacimy | ||
karę? Podaj dwa sposoby rozwiązania. | karę? Podaj dwa sposoby rozwiązania. | ||
'''Zadanie 9.5'''<br> | |||
Przeprowadź symulację komputerową poprzedniego | Przeprowadź symulację komputerową poprzedniego | ||
zadania: wylosuj 20 serii po 100 przejazdów w każdej serii | zadania: wylosuj 20 serii po 100 przejazdów w każdej serii | ||
i zobacz, ile razy w każdej serii płaciło się karę. | i zobacz, ile razy w każdej serii płaciło się karę. | ||
'''Zadanie 9.6'''<br> | |||
Rozwiąż jeszcze raz | Rozwiąż jeszcze raz [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 7: Parametry rozkładów zmiennych losowych#zad_7.10|zadanie 7.10]]. | ||
'''Zadanie 9.7'''<br> | |||
Wykonano 1000 rzutów monetą symetryczną. Jakie | Wykonano 1000 rzutów monetą symetryczną. Jakie | ||
jest prawdopodobieństwo tego, że liczba | jest prawdopodobieństwo tego, że liczba | ||
orłów zawiera się w przedziale: (a) <math> | orłów zawiera się w przedziale: (a) <math>(490,510)</math>, (b) | ||
<math> | <math>(450,550)</math>, (c) <math>(500,600)</math>. Przed przystąpieniem do | ||
rozwiązywania podaj przewidywane wyniki w celu | rozwiązywania podaj przewidywane wyniki w celu | ||
późniejszego porównania. | późniejszego porównania. | ||
'''Zadanie 9.8'''<br> | |||
Ile razy należy rzucić kostką do gry, aby mieć | Ile razy należy rzucić kostką do gry, aby mieć | ||
<math> | <math>99\%</math> pewności, że "szóstka" pojawi się co najmniej w | ||
<math> | <math>15\%</math> wszystkich rzutów? | ||
'''Zadanie 9.9'''<br> | |||
Zakładając, że <math> | Zakładając, że <math>90\%</math> osób | ||
przekraczających granicę nie popełnia [2] | przekraczających granicę nie popełnia [2] | ||
żadnego wykroczenia celnego oraz wiedząc, że osoba, | żadnego wykroczenia celnego oraz wiedząc, że osoba, | ||
która takie wykroczenie popełnia, jest ujawniana z | która takie wykroczenie popełnia, jest ujawniana z | ||
prawdopodobieństwem <math> | prawdopodobieństwem <math>0.2</math>, oblicz | ||
prawdopodobieństwo tego, że spośród tysiąca | prawdopodobieństwo tego, że spośród tysiąca | ||
osób przekraczających granicę, będzie ujawnionych co | osób przekraczających granicę, będzie ujawnionych co | ||
najmniej <math> | najmniej <math>10</math> przypadków popełnienia wykroczenia. | ||
'''Zadanie 9.10'''<br> | |||
Rozwiąż jeszcze raz | Rozwiąż jeszcze raz [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 7: Parametry rozkładów zmiennych losowych#zad_7.11|zadanie 7.11]] i porównaj wyniki. | ||
'''Zadanie 9.11'''<br> | |||
Dokumentacja linii lotniczej XYZ wskazuje na to, że na | Dokumentacja linii lotniczej XYZ wskazuje na to, że na | ||
lot w klasie business do Tokio zgłasza się średnio 6.72 | lot w klasie business do Tokio zgłasza się średnio 6.72 | ||
pasażera. Ile miejsc w tej klasie należy przygotować na | pasażera. Ile miejsc w tej klasie należy przygotować na | ||
następny lot, aby mieć <math> | następny lot, aby mieć <math>90\%</math> pewności, że wszyscy chętni | ||
dostaną miejsce w klasie business. | dostaną miejsce w klasie business. | ||
'''Zadanie 9.12'''<br> | |||
Pewną trasą, obsługiwaną przez dwie | Pewną trasą, obsługiwaną przez dwie | ||
całkowicie równorzędne linie lotnicze, lata | całkowicie równorzędne linie lotnicze, lata | ||
codziennie <math> | codziennie <math>1000</math> osób. Ile miejsc powinna | ||
przygotować każda z tych linii, aby obsłużyć | przygotować każda z tych linii, aby obsłużyć | ||
<math> | <math>95\%</math> klientów, którzy się do niej zgłoszą? | ||
'''Zadanie 9.13'''<br> | |||
Ile osób należy przebadać, aby mieć <math> | Ile osób należy przebadać, aby mieć <math>95\%</math> | ||
pewności, że wyznaczona na jej podstawie frakcja ludzi | pewności, że wyznaczona na jej podstawie frakcja ludzi | ||
palących (liczba palaczy do liczebności całej populacji) | palących (liczba palaczy do liczebności całej populacji) | ||
jest obarczona błędem mniejszym niż <math> | jest obarczona błędem mniejszym niż <math>0.005</math>? | ||
'''Zadanie 9.14'''<br> | |||
Wykonaj 100 serii po 60 rzutów monetą symetryczną, | Wykonaj 100 serii po 60 rzutów monetą symetryczną, | ||
znajdując w każdej serii liczbę uzyskanych orłów <math> | znajdując w każdej serii liczbę uzyskanych orłów <math>S_{60}</math>. | ||
Narysuj histogram dla wartości <math> | Narysuj histogram dla wartości <math>S_{60}</math>. | ||
Oblicz teoretyczną średnią i odchylenie standardowe | Oblicz teoretyczną średnią i odchylenie standardowe | ||
zmiennej losowej <math> | zmiennej losowej <math>S_{60}</math>. | ||
Oblicz średnią i odchylenie standardowe | Oblicz średnią i odchylenie standardowe | ||
zmiennej losowej <math> | zmiennej losowej <math>S_{60}</math>, na podstawie uzyskanej 100-elementowej próbki. | ||
Oblicz <math> | Oblicz <math>P(|S_{60} - 30| \le 5)</math>. | ||
Ile spośród obliczonych sum <math> | Ile spośród obliczonych sum <math>S_{60}</math> spełnia warunek <math>|S_{60} - 30| \le | ||
5</math>? | 5</math>? | ||
'''Zadanie 9.15'''<br> | |||
Niech <math>S_n</math> oznacza sumę orłów uzyskanych w trakcie <math>n</math> | |||
rzutów monetą symetryczną. Niech <math>\varepsilon >0</math> będzie dowolną | |||
Niech <math> | |||
rzutów monetą symetryczną. Niech <math> | |||
liczbą. | liczbą. | ||
Oblicz: | Oblicz: | ||
<math> | <math>\lim_{n\rightarrow \infty} | ||
P\left(\left|S_n-\frac{n}{2} \right| \ge \varepsilon\right), | P\left(\left|S_n-\frac{n}{2} \right| \ge \varepsilon\right),\lim_{n\rightarrow \infty} | ||
P\left(\left|S_n-\frac{n}{2} \right| \ge \varepsilon n\right), | P\left(\left|S_n-\frac{n}{2} \right| \ge \varepsilon n\right),\lim_{n\rightarrow \infty} | ||
P\left(\left|S_n-\frac{n}{2} \right| \ge | P\left(\left|S_n-\frac{n}{2} \right| \ge | ||
\varepsilon\sqrt{n}\right). </math> | \varepsilon\sqrt{n}\right).</math> | ||
Wykaż, że: | Wykaż, że: | ||
<math> | <math>\lim_{n\rightarrow \infty} | ||
P\left(\left|S_n-(n-S_n) \right| \ge \varepsilon\right) = 1, | P\left(\left|S_n-(n-S_n) \right| \ge \varepsilon\right) = 1,\lim_{n\rightarrow \infty} | ||
P\left(\left|\frac{n-S_n}{S_n} - 1 \right| \ge \varepsilon\right) = | P\left(\left|\frac{n-S_n}{S_n} - 1 \right| \ge \varepsilon\right) = | ||
1. </math> | 1.</math> | ||
Zinterpretuj powyższe wyniki. | Zinterpretuj powyższe wyniki. | ||
'''Zadanie 9.16'''<br> | |||
Niech <math>R</math> oznacza liczbę różnych elementów, | |||
otrzymanych podczas <math>150</math> losowań ze zwracaniem ze | |||
Niech <math> | zbioru <math>200</math>-elementowego. Wykonując odpowiednią | ||
otrzymanych podczas <math> | |||
zbioru <math> | |||
symulację komputerową, określ charakter rozkładu | symulację komputerową, określ charakter rozkładu | ||
zmiennej <math> | zmiennej <math>R</math>. | ||
Aktualna wersja na dzień 22:16, 11 wrz 2023
Ćwiczenia
Podajemy tu przykłady kilku konkretnych zastosowań centralnego twierdzenia granicznego.
Ćwiczenie 9.1
Rzucono razy symetryczną kostką do gry. Oblicz prawdopodobieństwo tego, że "szóstka" wypadła więcej niż 150 razy.
Aby rozwiązać to zadanie zauważmy najpierw, że interesująca nas
ilość "szóstek" jest sumą 1000
niezależnych prób Bernoulliego
o prawdopodobieństwie sukcesu w każdej
próbie (oznaczymy ją, tradycyjnie, przez ). Zgodnie z centralnym twierdzeniem granicznym
(patrz twierdzenie 9.4), suma ta ma w
przybliżeniu rozkład . Wstawiając
wartości liczbowe i korzystając ze wzoru 9.2,
otrzymujemy:
Ćwiczenie 9.2
Jakie jest prawdopodobieństwo, że przy rzutach monetą symetryczną, różnica między ilością reszek i orłów będzie wynosić co najmniej ?
Podobnie jak poprzednio, ilość uzyskanych orłów jest sumą , niezależnych prób Bernoulliego () o prawdopodobieństwie sukcesu w pojedynczej próbie. Chcemy obliczyć:
Zauważmy, że prawdopodobieństwo zdarzenia
przeciwnego jest równe:
Tak więc interesujące nas prawdopodobieństwo
jest w przybliżeniu równe - jest to o wiele
bardziej zgodne z oczekiwaniami niż rozwiązanie
tego samego zagadnienia w ćwiczeniu 7.6.
Ćwiczenie 9.3
Wykonano dodawań, z dokładnością w każdym. Jakim błędem obarczona jest suma?
Zwróćmy uwagę, że tak postawiony problem nie ma większego sensu - w najbardziej optymistycznym przypadku, gdy wszystkie dodawania były dokładne, błąd sumy jest równy zeru, zaś w najgorszym wypadku wynosi on . Sprecyzujmy więc nasze zadanie i spróbujmy znaleźć taki przedział, w którym mieści się błąd sumy z prawdopodobieństwem co najmniej .
Oznaczając błędy powstające w kolejnych dodawaniach przez , , , widzimy, że błąd sumy jest znowu sumą . Poszukujemy zatem takich liczb i , że:
Zauważmy, że chociaż zadanie może mieć wiele rozwiązań, jednak w tym przypadku najrozsądniejsze wydaje się szukanie możliwie najmniejszego przedziału, symetrycznego względem punktu (czasem ważniejsze są inne przedziały, na przykład nieograniczone, ale zawsze decyduje o tym specyfika konkretnego problemu). Szukamy więc ostatecznie możliwie najmniejszej liczby , dla której:
Z założenia wiemy, że wszystkie zmienne losowe
mają taki sam rozkład jednostajny na przedziale
i
dlatego ich nadzieja matematyczna jest równa , zaś
odchylenie standardowe wynosi
. Mamy więc:
gdzie (ćwiczenie)
.
W tablicach znajdujemy, że najmniejszym spełniającym warunek:
czyli:
jest . Tak więc:
jest szukaną przez
nas liczbą. Zauważmy, że zmniejszając nasze żądania
co do pewności wyniku, możemy zwiększyć jego
dokładność. Przykładowo, gdybyśmy zażądali, aby:
(tylko pewności zamiast
), to powtarzając poprzednie rachunki, można
stwierdzić, że szukana liczba to:
Ćwiczenie 9.4
Aby stwierdzić, jak wielu wyborców popiera obecnie partię (w sierpniu 2006 partia taka jeszcze nie istniała...), losujemy spośród nich reprezentatywną próbkę i na niej przeprowadzamy badanie. Jak duża powinna być ta próbka, aby uzyskany wynik różnił się od rzeczywistego poparcia dla partii nie więcej niż o , z prawdopodobieństwem co najmniej ?
Niech oznacza faktyczne (lecz nieznane) poparcie dla partii . Jeżeli próbka składa się z osób, z których wyraziło poparcie dla , to liczba jest poparciem wyznaczonym na podstawie próbki. Możemy założyć, że jest sumą niezależnych zmiennych losowych o rozkładzie:
Chcemy znaleźć takie , aby:
Ponieważ średnia arytmetyczna ma w
przybliżeniu rozkład (patrz twierdzenie 9.5), więc powyższa nierówność
jest (w przybliżeniu) równoważna następującej
nierówności:
która jest z kolei równoważna nierówności:
Chociaż nie znamy , wiemy, że:
W takim razie liczba naturalna , spełniająca nierówność:
określa wystarczającą wielkość próbki. Podstawiając i , otrzymujemy:
Jeżeli jeszcze przed losowaniem próbki mamy wstępne
informacje o poparciu dla partii - na przykład
wiemy, że poparcie to jest mniejsze niż -
możemy powyższy wynik znacznie polepszyć: w tym przypadku , a więc , co oznacza, że jest wystarczającą wielkością próbki.
Ćwiczenie 9.5
W ćwiczeniu 8.7 pokazano, stosując nierówność Czebyszewa, że aby mieć pewności otrzymania różnych elementów ze zbioru -elementowego, należy wykonać losowania ze zwracaniem. Czy wynik ten można polepszyć, stosując centralne twierdzenie graniczne?
Z formalnego punktu widzenia nie możemy stosować tutaj centralnego twierdzenia granicznego, gdyż nie są w naszym przypadku spełnione jego założenia. Pytamy jednak, czy mimo tego zmienna losowa (określona w ćwiczeniu 8.7), oznaczająca liczbę potrzebnych losowań, ma rozkład normalny. Sprawdzimy normalność zmiennej losowej "doświadczalnie", przeprowadzając odpowiednią symulację komputerową.
Wykonamy takich samych doświadczeń - w każdym z nich losujemy różnych elementów ze zbioru -elementowego. Za każdym razem notujemy liczbę wykonanych losowań, otrzymując ciąg o nazwie "dane". Przytaczamy istotny fragment kodu programu Maple, umożliwiającego realizację powyższego zadania:
> losuj := rand(1..200): > liczba_prob := 500: > dane := NULL: > from 1 to liczba_prob do > lista := NULL: n := 1: nowy := losuj(): > while nops([lista]) < 100 do > while member(nowy,[lista]) do > nowy := losuj(): n := n+1 od; > lista := lista,nowy: > od: > dane := dane,n: > od:
Obliczamy średnią i odchylenie standardowe: .
> m := evalf(describe[mean]([dane])); > sigma := evalf(describe[standarddeviation]([dane]));
Na podstawie otrzymanych danych rysujemy histogram, zaznaczając także wykres gęstości rozkładu
normalnego o obliczonych przed chwilą parametrach:
<flash>file=Rp.1.96.swf|width=350|height=350</flash>
Otrzymane wyniki sugerują, że zmienna losowa
ma rozkład normalny -
na wykładzie 13 poznamy test statystyczny, umożliwiający bardziej formalną weryfikację tego faktu. Zakładając więc, że zmienna losowa ma rozkład normalny i znając jej nadzieję matematyczną oraz
wariancję - obliczone w ćwiczeniu 8.6 -
możemy łatwo poprawić wynik z ćwiczenia 8.7.
Mianowicie:
gdy:
Zauważmy, że jest to wynik istotnie lepszy niż w ćwiczeniu 8.7.
Zadanie 9.1
Zmienna losowa ma rozkład normalny
. Znajdź rozkład zmiennej losowej
.
Zadanie 9.2
Niech będzie kwantylem rzędu w rozkładzie
. Oblicz kwantyl rzędu w rozkładzie
.
Zadanie 9.3
Zaprojektuj i przeprowadź eksperyment komputerowy,
który weryfikuje centralne twierdzenie graniczne.
Zadanie 9.4
Prawdopodobieństwo zapłacenia kary za jazdę bez
biletu wynosi . Jakie jest prawdopodobieństwo tego, że w
trakcie takich przejazdów co najmniej raz zapłacimy
karę? Podaj dwa sposoby rozwiązania.
Zadanie 9.5
Przeprowadź symulację komputerową poprzedniego
zadania: wylosuj 20 serii po 100 przejazdów w każdej serii
i zobacz, ile razy w każdej serii płaciło się karę.
Zadanie 9.6
Rozwiąż jeszcze raz zadanie 7.10.
Zadanie 9.7
Wykonano 1000 rzutów monetą symetryczną. Jakie
jest prawdopodobieństwo tego, że liczba
orłów zawiera się w przedziale: (a) , (b)
, (c) . Przed przystąpieniem do
rozwiązywania podaj przewidywane wyniki w celu
późniejszego porównania.
Zadanie 9.8
Ile razy należy rzucić kostką do gry, aby mieć
pewności, że "szóstka" pojawi się co najmniej w
wszystkich rzutów?
Zadanie 9.9
Zakładając, że osób
przekraczających granicę nie popełnia [2]
żadnego wykroczenia celnego oraz wiedząc, że osoba,
która takie wykroczenie popełnia, jest ujawniana z
prawdopodobieństwem , oblicz
prawdopodobieństwo tego, że spośród tysiąca
osób przekraczających granicę, będzie ujawnionych co
najmniej przypadków popełnienia wykroczenia.
Zadanie 9.10
Rozwiąż jeszcze raz zadanie 7.11 i porównaj wyniki.
Zadanie 9.11
Dokumentacja linii lotniczej XYZ wskazuje na to, że na
lot w klasie business do Tokio zgłasza się średnio 6.72
pasażera. Ile miejsc w tej klasie należy przygotować na
następny lot, aby mieć pewności, że wszyscy chętni
dostaną miejsce w klasie business.
Zadanie 9.12
Pewną trasą, obsługiwaną przez dwie
całkowicie równorzędne linie lotnicze, lata
codziennie osób. Ile miejsc powinna
przygotować każda z tych linii, aby obsłużyć
klientów, którzy się do niej zgłoszą?
Zadanie 9.13
Ile osób należy przebadać, aby mieć
pewności, że wyznaczona na jej podstawie frakcja ludzi
palących (liczba palaczy do liczebności całej populacji)
jest obarczona błędem mniejszym niż ?
Zadanie 9.14
Wykonaj 100 serii po 60 rzutów monetą symetryczną,
znajdując w każdej serii liczbę uzyskanych orłów .
Narysuj histogram dla wartości .
Oblicz teoretyczną średnią i odchylenie standardowe zmiennej losowej .
Oblicz średnią i odchylenie standardowe zmiennej losowej , na podstawie uzyskanej 100-elementowej próbki.
Oblicz .
Ile spośród obliczonych sum spełnia warunek ?
Zadanie 9.15
Niech oznacza sumę orłów uzyskanych w trakcie
rzutów monetą symetryczną. Niech będzie dowolną
liczbą.
Oblicz:
Wykaż, że:
Zinterpretuj powyższe wyniki.
Zadanie 9.16
Niech oznacza liczbę różnych elementów,
otrzymanych podczas losowań ze zwracaniem ze
zbioru -elementowego. Wykonując odpowiednią
symulację komputerową, określ charakter rozkładu
zmiennej .