Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 9: Rozkład normalny i centralne twierdzenie graniczne: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Moskala (dyskusja | edycje)
Nie podano opisu zmian
Pitab (dyskusja | edycje)
Linia 1: Linia 1:
==Ćwiczenia i zadania==
==Ćwiczenia==


Podajemy tu przykłady  kilku  konkretnych  zastosowań centralnego
Podajemy tu przykłady  kilku  konkretnych  zastosowań centralnego
twierdzenia granicznego.
twierdzenia granicznego.


{{cwiczenie|||
{{cwiczenie|9.1|cw 9.1|
Rzucono <math>\displaystyle 1000</math> razy symetryczną  kostką  do
Rzucono <math>\displaystyle 1000</math> razy symetryczną  kostką  do
gry.  Oblicz prawdopodobieństwo tego, że
gry.  Oblicz prawdopodobieństwo tego, że
Linia 15: Linia 15:
o&nbsp;prawdopodobieństwie sukcesu <math>\displaystyle p = {1\over 6}</math> w  każdej
o&nbsp;prawdopodobieństwie sukcesu <math>\displaystyle p = {1\over 6}</math> w  każdej
próbie (oznaczymy ją, tradycyjnie, przez <math>\displaystyle S_{1000}</math>). Zgodnie z centralnym twierdzeniem granicznym
próbie (oznaczymy ją, tradycyjnie, przez <math>\displaystyle S_{1000}</math>). Zgodnie z centralnym twierdzeniem granicznym
(patrz twierdzenia [[##rozsum|Uzupelnic rozsum|]]), suma ta ma w
(patrz twierdzenia [[Rachunek prawdopodobieństwa i statystyka/Wykład 9: Rozkład normalny i centralne twierdzenie graniczne#tw_9.4|9.4]]), suma ta ma w
przybliżeniu rozkład <math>\displaystyle N(np,\sqrt{npq})</math>. Wstawiając
przybliżeniu rozkład <math>\displaystyle N(np,\sqrt{npq})</math>. Wstawiając
wartości liczbowe i korzystając ze wzoru ([[##eq:47|Uzupelnic eq:47|]]),
wartości liczbowe i korzystając ze wzoru ([[Rachunek prawdopodobieństwa i statystyka/Wykład 9: Rozkład normalny i centralne twierdzenie graniczne#9.2|9.2]]),
otrzymujemy:
otrzymujemy:
<center><math>\displaystyle  
<center><math>\displaystyle  
P(S_{1000}  >  150)  =  1  -  P(S_{1000}  \le  150)  \approx  1  -
P(S_{1000}  >  150)  =  1  -  P(S_{1000}  \le  150)  \approx  1  -
\Phi_{1000\cdot \frac{1}{6}, \sqrt{1000\cdot \frac{1}{6}\cdot \frac{5}{6}}}(150)
\Phi_{1000\cdot \frac{1}{6}, \sqrt{1000\cdot \frac{1}{6}\cdot \frac{5}{6}}}(150)
</math></center>
</math></center>


<center><math>\displaystyle  
<center><math>\displaystyle  
Linia 29: Linia 32:
\approx 1 - \Phi(-1.41) = \Phi(1.41) \approx 0.9207,
\approx 1 - \Phi(-1.41) = \Phi(1.41) \approx 0.9207,
</math></center>
</math></center>


gdzie ostatnia liczba pochodzi z tablic rozkładu
gdzie ostatnia liczba pochodzi z tablic rozkładu
normalnego.
normalnego.


{{cwiczenie|||
{{cwiczenie|9.2|cw 9.2|
Jakie jest  prawdopodobieństwo, że
Jakie jest  prawdopodobieństwo, że
przy  <math>\displaystyle 1000</math> rzutach monetą symetryczną, różnica między
przy  <math>\displaystyle 1000</math> rzutach monetą symetryczną, różnica między
Linia 44: Linia 48:
Bernoulliego  (<math>\displaystyle S_{1000}</math>) o prawdopodobieństwie  sukcesu
Bernoulliego  (<math>\displaystyle S_{1000}</math>) o prawdopodobieństwie  sukcesu
<math>\displaystyle p  =  \frac{1}{2}</math>  w pojedynczej próbie. Chcemy
<math>\displaystyle p  =  \frac{1}{2}</math>  w pojedynczej próbie. Chcemy
obliczyć: <center><math>\displaystyle P(|S_{1000} -(1000 -  S_{1000})|  \ge  100)=P(|S_{1000} -500| \ge 50).</math></center>
obliczyć:
 
 
<center><math>\displaystyle P(|S_{1000} -(1000 -  S_{1000})|  \ge  100)=P(|S_{1000} -500| \ge 50).</math></center>
 


Zauważmy, że prawdopodobieństwo  zdarzenia
Zauważmy, że prawdopodobieństwo  zdarzenia
przeciwnego jest równe:
przeciwnego jest równe:
<center><math>\displaystyle  
<center><math>\displaystyle  
F_{S_{1000}}(550) - F_{S_{1000}}(450) \approx \Phi_{500,\,5 \sqrt{10}}(550) -
F_{S_{1000}}(550) - F_{S_{1000}}(450) \approx \Phi_{500,\,5 \sqrt{10}}(550) -
\Phi_{500,\,5 \sqrt{10}}(450)
\Phi_{500,\,5 \sqrt{10}}(450)
</math></center>
</math></center>


<center><math>\displaystyle  
<center><math>\displaystyle  
Linia 57: Linia 68:
2\Phi(\sqrt{10}) - 1 \approx 2 \Phi(3.16227766) - 1 \approx 0.9984346.
2\Phi(\sqrt{10}) - 1 \approx 2 \Phi(3.16227766) - 1 \approx 0.9984346.
</math></center>
</math></center>


Tak więc interesujące  nas  prawdopodobieństwo
Tak więc interesujące  nas  prawdopodobieństwo
wynosi w przybliżeniu równe <math>\displaystyle 0.0016</math> -- jest to o wiele
wynosi w przybliżeniu równe <math>\displaystyle 0.0016</math> - jest to o wiele
bardziej  zgodne  z  oczekiwaniami  niż rozwiązanie
bardziej  zgodne  z  oczekiwaniami  niż rozwiązanie
tego samego zagadnienia w ćwiczeniu  [[##d775|Uzupelnic d775|]].
tego samego zagadnienia w ćwiczeniu  [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 7: Parametry rozkładów zmiennych losowych#cw_7.6|7.6]].


{{cwiczenie|||
{{cwiczenie|9.3|cw 7.6|
Wykonano <math>\displaystyle 10^4</math> dodawań, z dokładnością
Wykonano <math>\displaystyle 10^4</math> dodawań, z dokładnością
<math>\displaystyle 10^{-8}</math> w  każdym. Jakim błędem obarczona jest suma?
<math>\displaystyle 10^{-8}</math> w  każdym. Jakim błędem obarczona jest suma?
Linia 69: Linia 81:


Zwróćmy uwagę, że tak postawiony problem nie ma większego
Zwróćmy uwagę, że tak postawiony problem nie ma większego
sensu -- w najbardziej optymistycznym przypadku, gdy
sensu - w najbardziej optymistycznym przypadku, gdy
wszystkie  dodawania były dokładne, błąd sumy jest równy
wszystkie  dodawania były dokładne, błąd sumy jest równy
zeru, zaś  w  najgorszym  wypadku  wynosi on  <math>\displaystyle 10^4 10^{-8}
zeru, zaś  w  najgorszym  wypadku  wynosi on  <math>\displaystyle 10^4 10^{-8}
Linia 89: Linia 101:
specyfika konkretnego problemu). Szukamy    więc
specyfika konkretnego problemu). Szukamy    więc
ostatecznie możliwie najmniejszej liczby <math>\displaystyle \varepsilon > 0</math>, dla której:
ostatecznie możliwie najmniejszej liczby <math>\displaystyle \varepsilon > 0</math>, dla której:
<center><math>\displaystyle P(|S_{10000}| \le \varepsilon) \ge 0.99.</math></center>
<center><math>\displaystyle P(|S_{10000}| \le \varepsilon) \ge 0.99.</math></center>


Z założenia wiemy, że wszystkie  zmienne  losowe
Z założenia wiemy, że wszystkie  zmienne  losowe
Linia 97: Linia 112:
odchylenie standardowe <math>\displaystyle \sigma</math> wynosi
odchylenie standardowe <math>\displaystyle \sigma</math> wynosi
<math>\displaystyle \frac{1}{2\sqrt{3}}10^{-8}</math>. Mamy więc:
<math>\displaystyle \frac{1}{2\sqrt{3}}10^{-8}</math>. Mamy więc:
<center><math>\displaystyle  
<center><math>\displaystyle  
P(|S_{10000}|  \le  \varepsilon)  \approx    F_{S_{10000}}(\varepsilon)    -
P(|S_{10000}|  \le  \varepsilon)  \approx    F_{S_{10000}}(\varepsilon)    -
Linia 102: Linia 119:
\approx 2\Phi(\beta) - 1,
\approx 2\Phi(\beta) - 1,
</math></center>
</math></center>


gdzie (ćwiczenie)
gdzie (ćwiczenie)
Linia 107: Linia 125:


W tablicach  znajdujemy,  że  najmniejszym  <math>\displaystyle \beta</math>
W tablicach  znajdujemy,  że  najmniejszym  <math>\displaystyle \beta</math>
spełniającym warunek: <center><math>\displaystyle 2\Phi(\beta)  -  1
spełniającym warunek:
 
 
<center><math>\displaystyle 2\Phi(\beta)  -  1
\ge  0.99,</math></center>
\ge  0.99,</math></center>


czyli:
czyli:
<center><math>\displaystyle \Phi(\beta)
<center><math>\displaystyle \Phi(\beta)
\ge  0.995,</math></center>
\ge  0.995,</math></center>


jest  <math>\displaystyle \beta  =  2.58</math>.  Tak więc:
jest  <math>\displaystyle \beta  =  2.58</math>.  Tak więc:
<center><math>\displaystyle \varepsilon \approx 0.745\cdot 10^{-6}</math></center>
<center><math>\displaystyle \varepsilon \approx 0.745\cdot 10^{-6}</math></center>
jest szukaną przez
jest szukaną przez
nas liczbą.  Zauważmy,  że zmniejszając nasze żądania
nas liczbą.  Zauważmy,  że zmniejszając nasze żądania
co  do  pewności  wyniku,  możemy  zwiększyć  jego
co  do  pewności  wyniku,  możemy  zwiększyć  jego
dokładność. Przykładowo, gdybyśmy zażądali, aby: <center><math>\displaystyle P(|S_n| \le
dokładność. Przykładowo, gdybyśmy zażądali, aby:
 
 
<center><math>\displaystyle P(|S_n| \le
\varepsilon) \ge 0.9</math></center>
\varepsilon) \ge 0.9</math></center>
(tylko <math>\displaystyle 90\%</math> pewności  zamiast
(tylko <math>\displaystyle 90\%</math> pewności  zamiast
<math>\displaystyle 99\%</math>),  to  powtarzając  poprzednie  rachunki, można
<math>\displaystyle 99\%</math>),  to  powtarzając  poprzednie  rachunki, można
stwierdzić, że szukana  liczba  to: <center><math>\displaystyle \varepsilon  \approx
stwierdzić, że szukana  liczba  to:
 
 
<center><math>\displaystyle \varepsilon  \approx
0.476\cdot 10^{-6}.</math></center>
0.476\cdot 10^{-6}.</math></center>


{{cwiczenie|||
 
{{cwiczenie|9.4|cw 9.4|
Aby stwierdzić, jak wielu  wyborców  popiera obecnie
Aby stwierdzić, jak wielu  wyborców  popiera obecnie
partię <math>\displaystyle AB</math>C{W sierpniu 2006 partia taka jeszcze
partię <math>\displaystyle AB</math>C<ref>W sierpniu 2006 partia taka jeszcze
nie istniała...}, losujemy  spośród  nich reprezentatywną
nie istniała...</ref>, losujemy  spośród  nich reprezentatywną
próbkę  i  na  niej przeprowadzamy badanie. Jak duża
próbkę  i  na  niej przeprowadzamy badanie. Jak duża
powinna  być  ta  próbka,  aby uzyskany  wynik różnił się
powinna  być  ta  próbka,  aby uzyskany  wynik różnił się
Linia 143: Linia 181:
wyznaczonym na podstawie próbki. Możemy założyć,  że
wyznaczonym na podstawie próbki. Możemy założyć,  że
<math>\displaystyle S_n</math>  jest sumą niezależnych zmiennych losowych
<math>\displaystyle S_n</math>  jest sumą niezależnych zmiennych losowych
<math>\displaystyle X_i</math>  o&nbsp;rozkładzie:  <center><math>\displaystyle P(X_i =0) = 1-p,\;\;P(X_i
<math>\displaystyle X_i</math>  o&nbsp;rozkładzie:   
 
 
<center><math>\displaystyle P(X_i =0) = 1-p,\;\;P(X_i
= 1) =p.</math></center>
= 1) =p.</math></center>
Chcemy znaleźć takie <math>\displaystyle n</math>, aby:
Chcemy znaleźć takie <math>\displaystyle n</math>, aby:
<center><math>\displaystyle  
<center><math>\displaystyle  
P\left( \left| \frac{S_n}{n} - p \right| \le b \right)  \ge  1  -
P\left( \left| \frac{S_n}{n} - p \right| \le b \right)  \ge  1  -
\alpha. </math></center>
\alpha. </math></center>


Ponieważ średnia arytmetyczna <math>\displaystyle \frac{S_n}{n}</math> ma  w
Ponieważ średnia arytmetyczna <math>\displaystyle \frac{S_n}{n}</math> ma  w
przybliżeniu rozkład  <math>\displaystyle N(p,\sqrt{\frac{p(1-p)}{n}})</math> (patrz twierdzenie [[##ctgsr|Uzupelnic ctgsr|]]), więc powyższa nierówność
przybliżeniu rozkład  <math>\displaystyle N(p,\sqrt{\frac{p(1-p)}{n}})</math> (patrz twierdzenie [[Rachunek prawdopodobieństwa i statystyka/Wykład 9: Rozkład normalny i centralne twierdzenie graniczne#tw_9.5|9.5]]), więc powyższa nierówność
jest (w  przybliżeniu) równoważna następującej
jest (w  przybliżeniu) równoważna następującej
nierówności:
nierówności:
<center><math>\displaystyle  
<center><math>\displaystyle  
2 \Phi\left(\frac{b\sqrt{n}}{\sqrt{p(1-p)}} \right) - 1
2 \Phi\left(\frac{b\sqrt{n}}{\sqrt{p(1-p)}} \right) - 1
\ge  1  - \alpha, </math></center>
\ge  1  - \alpha, </math></center>
która jest z kolei równoważna nierówności:
która jest z kolei równoważna nierówności:
<center><math>\displaystyle  
<center><math>\displaystyle  
n  \ge  \left(  \frac{\Phi^{-1}  \left(1-    \frac{\alpha}{2}
n  \ge  \left(  \frac{\Phi^{-1}  \left(1-    \frac{\alpha}{2}
Linia 163: Linia 215:
</math></center>
</math></center>


Chociaż nie znamy <math>\displaystyle p</math>, wiemy, że: <center><math>\displaystyle (1-p)  p  \le
 
Chociaż nie znamy <math>\displaystyle p</math>, wiemy, że:  
 
 
<center><math>\displaystyle (1-p)  p  \le
\frac{1}{4}.</math></center>
\frac{1}{4}.</math></center>
W takim razie liczba naturalna <math>\displaystyle n</math>, spełniająca nierówność:
W takim razie liczba naturalna <math>\displaystyle n</math>, spełniająca nierówność:
<center><math>\displaystyle  
<center><math>\displaystyle  
n  \ge  0.25\cdot \left(  \frac{\Phi^{-1}  \left(1-    \frac{\alpha}{2}
n  \ge  0.25\cdot \left(  \frac{\Phi^{-1}  \left(1-    \frac{\alpha}{2}
\right)}{b} \right)^2,
\right)}{b} \right)^2,
</math></center>
</math></center>


określa wystarczającą wielkość próbki. Podstawiając <math>\displaystyle b
określa wystarczającą wielkość próbki. Podstawiając <math>\displaystyle b
=  0.03</math> i <math>\displaystyle \alpha = 0.05</math>, otrzymujemy: <center><math>\displaystyle  n \ge 1067.</math></center>
=  0.03</math> i <math>\displaystyle \alpha = 0.05</math>, otrzymujemy:  
 
 
<center><math>\displaystyle  n \ge 1067.</math></center>
 


Jeżeli jeszcze przed losowaniem próbki mamy wstępne
Jeżeli jeszcze przed losowaniem próbki mamy wstępne
informacje  o&nbsp;poparciu dla partii <math>\displaystyle ABC</math> -- na przykład
informacje  o&nbsp;poparciu dla partii <math>\displaystyle ABC</math> - na przykład
wiemy, że poparcie to  jest  mniejsze niż <math>\displaystyle 20 \%</math> --
wiemy, że poparcie to  jest  mniejsze niż <math>\displaystyle 20 \%</math> -
możemy powyższy wynik znacznie polepszyć: w tym przypadku <math>\displaystyle p
możemy powyższy wynik znacznie polepszyć: w tym przypadku <math>\displaystyle p
\le 0.2</math>, a więc <math>\displaystyle (1-p)p \le 0.16</math>, co oznacza,  że  <math>\displaystyle n
\le 0.2</math>, a więc <math>\displaystyle (1-p)p \le 0.16</math>, co oznacza,  że  <math>\displaystyle n
\ge 683</math> jest wystarczającą wielkością próbki.
\ge 683</math> jest wystarczającą wielkością próbki.


{{cwiczenie|||
{{cwiczenie|9.5|cw 9.5|
W ćwiczeniu  [[##pr133|Uzupelnic pr133|]]  pokazano,  stosując
W ćwiczeniu  [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.7|8.7]]  pokazano,  stosując
nierówność Czebyszewa, że aby  mieć  <math>\displaystyle 95  \%</math> pewności
nierówność Czebyszewa, że aby  mieć  <math>\displaystyle 95  \%</math> pewności
otrzymania <math>\displaystyle 100</math> różnych  elementów  ze zbioru
otrzymania <math>\displaystyle 100</math> różnych  elementów  ze zbioru
Linia 194: Linia 259:
gdyż  nie  są  w  naszym przypadku spełnione jego
gdyż  nie  są  w  naszym przypadku spełnione jego
założenia. Pytamy jednak,  czy  mimo tego zmienna
założenia. Pytamy jednak,  czy  mimo tego zmienna
losowa  <math>\displaystyle T</math> (określona  w  ćwiczeniu [[##pr133|Uzupelnic pr133|]]),
losowa  <math>\displaystyle T</math> (określona  w  ćwiczeniu [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.7|8.7]]),
oznaczająca liczbę  potrzebnych losowań,  ma  rozkład
oznaczająca liczbę  potrzebnych losowań,  ma  rozkład
normalny.  Sprawdzimy normalność zmiennej losowej <math>\displaystyle T</math>
normalny.  Sprawdzimy normalność zmiennej losowej <math>\displaystyle T</math>
Linia 200: Linia 265:
komputerową.
komputerową.


Wykonamy  <math>\displaystyle 500</math>  takich  samych  doświadczeń --  w
Wykonamy  <math>\displaystyle 500</math>  takich  samych  doświadczeń -  w
każdym z nich losujemy <math>\displaystyle 100</math> różnych elementów ze zbioru
każdym z nich losujemy <math>\displaystyle 100</math> różnych elementów ze zbioru
<math>\displaystyle 200</math>-elementowego. Za każdym razem notujemy liczbę wykonanych
<math>\displaystyle 200</math>-elementowego. Za każdym razem notujemy liczbę wykonanych
Linia 206: Linia 271:
umożliwiającego realizację powyższego zadania:
umożliwiającego realizację powyższego zadania:


{active}{1d}{losuj :<nowiki>=</nowiki> rand(1..200):}{}
  ''> losuj :<nowiki>=</nowiki> rand(1..200):
 
  > liczba_prob :<nowiki>=</nowiki> 500:
{active}{1d}{liczba_prob :<nowiki>=</nowiki> 500:}{}
  > dane :<nowiki>=</nowiki> NULL:
 
  > from 1 to liczba_prob do
{active}{1d}{dane :<nowiki>=</nowiki> NULL:}{}
  > lista :<nowiki>=</nowiki> NULL:  n :<nowiki>=</nowiki> 1: nowy :<nowiki>=</nowiki> losuj():
 
  > while nops([lista]) < 100 do
{active}{1d}{from 1 to liczba_prob do}{}
  > while member(nowy,[lista]) do
 
  > nowy :<nowiki>=</nowiki> losuj(): n :<nowiki>=</nowiki> n+1 od;
{active}{1d}{lista :<nowiki>=</nowiki> NULL:  n :<nowiki>=</nowiki> 1: nowy :<nowiki>=</nowiki> losuj():}{}
  > lista :<nowiki>=</nowiki> lista,nowy:
 
  > od:
{active}{1d}{while nops([lista]) < 100 do
  > dane :<nowiki>=</nowiki> dane,n:
while member(nowy,[lista]) do
  > od:''
nowy :<nowiki>=</nowiki> losuj(): n :<nowiki>=</nowiki> n+1 od;
lista :<nowiki>=</nowiki> lista,nowy:
od:
dane :<nowiki>=</nowiki> dane,n:
od:}{}


Obliczamy średnią <math>\displaystyle m</math> i  odchylenie standardowe:
Obliczamy średnią <math>\displaystyle m</math> i  odchylenie standardowe:
<math>\displaystyle \sigma</math>.
<math>\displaystyle \sigma</math>.


{active}{1d}{m :<nowiki>=</nowiki> evalf(describe[mean]([dane]));
  ''> m :<nowiki>=</nowiki> evalf(describe[mean]([dane]));
sigma :<nowiki>=</nowiki> evalf(describe[standarddeviation]([dane]));
  > sigma :<nowiki>=</nowiki> evalf(describe[standarddeviation]([dane]));''
}{}
 
{inert}{2d}{m :<nowiki>=</nowiki> 138.9340000;}{


<center><math>\displaystyle m := 138.9340000
<center><math>\displaystyle m := 138.9340000
</math></center>
</math></center>


}
{inert}{2d}{sigma :<nowiki>=</nowiki> 7.614567880;}{


<center><math>\displaystyle \sigma  := 7.614567880
<center><math>\displaystyle \sigma  := 7.614567880
</math></center>
</math></center>


}


Na podstawie otrzymanych danych rysujemy histogram,  zaznaczając także wykres gęstości rozkładu
Na podstawie otrzymanych danych rysujemy histogram,  zaznaczając także wykres gęstości rozkładu
normalnego o obliczonych przed chwilą parametrach:
normalnego o obliczonych przed chwilą parametrach:


<center>
<center>
<flash>file=Rp.1.96.swf|width=350|height=350</flash>   
<flash>file=Rp.1.96.swf|width=350|height=350</flash>   
</center>
</center>


Otrzymane wyniki sugerują,  że  zmienna  losowa  <math>\displaystyle T</math>
Otrzymane wyniki sugerują,  że  zmienna  losowa  <math>\displaystyle T</math>
ma  rozkład normalny --
ma  rozkład normalny -
na wykładzie [[##wy13|Uzupelnic wy13|]] poznamy test statystyczny, umożliwiający bardziej formalną weryfikację tego faktu. Zakładając więc, że zmienna losowa  <math>\displaystyle T</math>  ma  rozkład normalny  i znając jej nadzieję matematyczną oraz
na wykładzie [[Rachunek prawdopodobieństwa i statystyka/Wykład 13: Przedziały ufności i testy|13]] poznamy test statystyczny, umożliwiający bardziej formalną weryfikację tego faktu. Zakładając więc, że zmienna losowa  <math>\displaystyle T</math>  ma  rozkład normalny  i znając jej nadzieję matematyczną oraz
wariancję  --  obliczone  w ćwiczeniu [[##cco|Uzupelnic cco|]] --
wariancję  -  obliczone  w ćwiczeniu [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.6|8.6]] -
możemy łatwo poprawić wynik z ćwiczenia [[##pr133|Uzupelnic pr133|]].
możemy łatwo poprawić wynik z ćwiczenia [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.7|8.7]].
Mianowicie:
Mianowicie:
<center><math>\displaystyle P(T\leq  x)  \geq  0.5,</math></center>
<center><math>\displaystyle P(T\leq  x)  \geq  0.5,</math></center>


gdy:
gdy:
<center><math>\displaystyle  
<center><math>\displaystyle  
x \approx \Phi_{138.1306861,\sqrt{60.37514711}}^{-1}(0.95) = 150.9114366.
x \approx \Phi_{138.1306861,\sqrt{60.37514711}}^{-1}(0.95) = 150.9114366.
</math></center>
</math></center>


Zauważmy, że jest to wynik istotnie lepszy niż w ćwiczeniu [[##pr133|Uzupelnic pr133|]].


'''. . .'''
Zauważmy, że jest to wynik istotnie lepszy niż w ćwiczeniu [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów#cw_8.7|8.7]].


{{cwiczenie|||
===Zadanie 9.1===
Zmienna losowa <math>\displaystyle \xi</math> ma rozkład normalny
Zmienna losowa <math>\displaystyle \xi</math> ma rozkład normalny
<math>\displaystyle N(m,\sigma)</math>. Znajdź rozkład zmiennej losowej
<math>\displaystyle N(m,\sigma)</math>. Znajdź rozkład zmiennej losowej

Wersja z 19:13, 23 sie 2006

Ćwiczenia

Podajemy tu przykłady kilku konkretnych zastosowań centralnego twierdzenia granicznego.

Ćwiczenie 9.1

Rzucono 1000 razy symetryczną kostką do gry. Oblicz prawdopodobieństwo tego, że "szóstka" wypadła więcej niż 150 razy.

Aby rozwiązać to zadanie zauważmy najpierw, że interesująca nas ilość "szóstek" jest sumą 1000 niezależnych prób Bernoulliego o prawdopodobieństwie sukcesu p=16 w każdej próbie (oznaczymy ją, tradycyjnie, przez S1000). Zgodnie z centralnym twierdzeniem granicznym (patrz twierdzenia 9.4), suma ta ma w przybliżeniu rozkład N(np,npq). Wstawiając wartości liczbowe i korzystając ze wzoru (9.2), otrzymujemy:


P(S1000>150)=1P(S1000150)1Φ100016,10001656(150)


=1Φ(15010006500036)1Φ(1.41)=Φ(1.41)0.9207,


gdzie ostatnia liczba pochodzi z tablic rozkładu normalnego.

Ćwiczenie 9.2

Jakie jest prawdopodobieństwo, że przy 1000 rzutach monetą symetryczną, różnica między ilością reszek i orłów będzie wynosić co najmniej 100?

Podobnie jak poprzednio, ilość uzyskanych orłów jest sumą 1000, niezależnych prób Bernoulliego (S1000) o prawdopodobieństwie sukcesu p=12 w pojedynczej próbie. Chcemy obliczyć:


P(|S1000(1000S1000)|100)=P(|S1000500|50).


Zauważmy, że prawdopodobieństwo zdarzenia przeciwnego jest równe:


FS1000(550)FS1000(450)Φ500,510(550)Φ500,510(450)


=Φ(10)Φ(10)=2Φ(10)12Φ(3.16227766)10.9984346.


Tak więc interesujące nas prawdopodobieństwo wynosi w przybliżeniu równe 0.0016 - jest to o wiele bardziej zgodne z oczekiwaniami niż rozwiązanie tego samego zagadnienia w ćwiczeniu 7.6.

Ćwiczenie 9.3

Wykonano 104 dodawań, z dokładnością 108 w każdym. Jakim błędem obarczona jest suma?

Zwróćmy uwagę, że tak postawiony problem nie ma większego sensu - w najbardziej optymistycznym przypadku, gdy wszystkie dodawania były dokładne, błąd sumy jest równy zeru, zaś w najgorszym wypadku wynosi on 104108=104. Sprecyzujmy więc nasze zadanie i spróbujmy znaleźć taki przedział, w którym mieści się błąd sumy z prawdopodobieństwem co najmniej 0.99.

Oznaczając błędy powstające w kolejnych dodawaniach przez Xi, i=1,, 104, widzimy, że błąd sumy jest znowu sumą S10000. Poszukujemy zatem takich liczb a i b, że:

P(S10000(a,b))0.99.

Zauważmy, że chociaż zadanie może mieć wiele rozwiązań, jednak w tym przypadku najrozsądniejsze wydaje się szukanie możliwie najmniejszego przedziału, symetrycznego względem punktu 0 (czasem ważniejsze są inne przedziały, na przykład nieograniczone, ale zawsze decyduje o tym specyfika konkretnego problemu). Szukamy więc ostatecznie możliwie najmniejszej liczby ε>0, dla której:


P(|S10000|ε)0.99.


Z założenia wiemy, że wszystkie zmienne losowe Xi mają taki sam rozkład jednostajny na przedziale (12108,12108) i dlatego ich nadzieja matematyczna m jest równa 0, zaś odchylenie standardowe σ wynosi 123108. Mamy więc:


P(|S10000|ε)FS10000(ε)FS10000(ε)2Φ(β)1,


gdzie (ćwiczenie) β=23106ε.

W tablicach znajdujemy, że najmniejszym β spełniającym warunek:


2Φ(β)10.99,


czyli:


Φ(β)0.995,


jest β=2.58. Tak więc:


ε0.745106


jest szukaną przez nas liczbą. Zauważmy, że zmniejszając nasze żądania co do pewności wyniku, możemy zwiększyć jego dokładność. Przykładowo, gdybyśmy zażądali, aby:


P(|Sn|ε)0.9


(tylko 90% pewności zamiast 99%), to powtarzając poprzednie rachunki, można stwierdzić, że szukana liczba to:


ε0.476106.


Ćwiczenie 9.4

Aby stwierdzić, jak wielu wyborców popiera obecnie partię ABC<ref>W sierpniu 2006 partia taka jeszcze nie istniała...</ref>, losujemy spośród nich reprezentatywną próbkę i na niej przeprowadzamy badanie. Jak duża powinna być ta próbka, aby uzyskany wynik różnił się od rzeczywistego poparcia dla partii ABC nie więcej niż o b=3%, z prawdopodobieństwem co najmniej 1α=0.95?

Niech p(0,1) oznacza faktyczne (lecz nieznane) poparcie dla partii ABC. Jeżeli próbka składa się z n osób, z których Sn wyraziło poparcie dla ABC, to liczba Snn jest poparciem wyznaczonym na podstawie próbki. Możemy założyć, że Sn jest sumą niezależnych zmiennych losowych Xi o rozkładzie:


P(Xi=0)=1p,P(Xi=1)=p.


Chcemy znaleźć takie n, aby:


P(|Snnp|b)1α.


Ponieważ średnia arytmetyczna Snn ma w przybliżeniu rozkład N(p,p(1p)n) (patrz twierdzenie 9.5), więc powyższa nierówność jest (w przybliżeniu) równoważna następującej nierówności:


2Φ(bnp(1p))11α,


która jest z kolei równoważna nierówności:


n(Φ1(1α2)b)2(1p)p.


Chociaż nie znamy p, wiemy, że:


(1p)p14.


W takim razie liczba naturalna n, spełniająca nierówność:


n0.25(Φ1(1α2)b)2,


określa wystarczającą wielkość próbki. Podstawiając b=0.03 i α=0.05, otrzymujemy:


n1067.


Jeżeli jeszcze przed losowaniem próbki mamy wstępne informacje o poparciu dla partii ABC - na przykład wiemy, że poparcie to jest mniejsze niż 20% - możemy powyższy wynik znacznie polepszyć: w tym przypadku p0.2, a więc (1p)p0.16, co oznacza, że n683 jest wystarczającą wielkością próbki.

Ćwiczenie 9.5

W ćwiczeniu 8.7 pokazano, stosując nierówność Czebyszewa, że aby mieć 95% pewności otrzymania 100 różnych elementów ze zbioru 200-elementowego, należy wykonać 173 losowania ze zwracaniem. Czy wynik ten można polepszyć, stosując centralne twierdzenie graniczne?

Z formalnego punktu widzenia nie możemy stosować tutaj centralnego twierdzenia granicznego, gdyż nie są w naszym przypadku spełnione jego założenia. Pytamy jednak, czy mimo tego zmienna losowa T (określona w ćwiczeniu 8.7), oznaczająca liczbę potrzebnych losowań, ma rozkład normalny. Sprawdzimy normalność zmiennej losowej T "doświadczalnie", przeprowadzając odpowiednią symulację komputerową.

Wykonamy 500 takich samych doświadczeń - w każdym z nich losujemy 100 różnych elementów ze zbioru 200-elementowego. Za każdym razem notujemy liczbę wykonanych losowań, otrzymując ciąg o nazwie "dane". Przytaczamy istotny fragment kodu programu Maple, umożliwiającego realizację powyższego zadania:

 > losuj := rand(1..200):
 > liczba_prob := 500:
 > dane := NULL:
 > from 1 to liczba_prob do
 > lista := NULL:  n := 1: nowy := losuj():
 > while nops([lista]) < 100 do
 > while member(nowy,[lista]) do
 > nowy := losuj(): n := n+1 od;
 > lista := lista,nowy:
 > od:
 > dane := dane,n:
 > od:

Obliczamy średnią m i odchylenie standardowe: σ.

 > m := evalf(describe[mean]([dane]));
 > sigma := evalf(describe[standarddeviation]([dane]));
m:=138.9340000


σ:=7.614567880


Na podstawie otrzymanych danych rysujemy histogram, zaznaczając także wykres gęstości rozkładu normalnego o obliczonych przed chwilą parametrach:


<flash>file=Rp.1.96.swf|width=350|height=350</flash>


Otrzymane wyniki sugerują, że zmienna losowa T ma rozkład normalny - na wykładzie 13 poznamy test statystyczny, umożliwiający bardziej formalną weryfikację tego faktu. Zakładając więc, że zmienna losowa T ma rozkład normalny i znając jej nadzieję matematyczną oraz wariancję - obliczone w ćwiczeniu 8.6 - możemy łatwo poprawić wynik z ćwiczenia 8.7. Mianowicie:


P(Tx)0.5,


gdy:


xΦ138.1306861,60.375147111(0.95)=150.9114366.


Zauważmy, że jest to wynik istotnie lepszy niż w ćwiczeniu 8.7.

Zadanie 9.1

Zmienna losowa ξ ma rozkład normalny N(m,σ). Znajdź rozkład zmiennej losowej eξ. }}

Ćwiczenie

Niech qp będzie kwantylem rzędu p w rozkładzie N(0,1). Oblicz kwantyl rzędu p w rozkładzie N(m,σ).

Ćwiczenie

Zaprojektuj i przeprowadź eksperyment komputerowy, który weryfikuje centralne twierdzenie graniczne.

Ćwiczenie

Prawdopodobieństwo zapłacenia kary za jazdę bez biletu wynosi 0.02. Jakie jest prawdopodobieństwo tego, że w trakcie 100 takich przejazdów co najmniej raz zapłacimy karę? Podaj dwa sposoby rozwiązania.

Ćwiczenie

Przeprowadź symulację komputerową poprzedniego zadania: wylosuj 20 serii po 100 przejazdów w każdej serii i zobacz, ile razy w każdej serii płaciło się karę.

Ćwiczenie

Rozwiąż jeszcze raz zadanie Uzupelnic noworodki|.

Ćwiczenie

Wykonano 1000 rzutów monetą symetryczną. Jakie jest prawdopodobieństwo tego, że liczba orłów zawiera się w przedziale: (a) (490,510), (b) (450,550), (c) (500,600). Przed przystąpieniem do rozwiązywania podaj przewidywane wyniki w celu późniejszego porównania.

Ćwiczenie

Ile razy należy rzucić kostką do gry, aby mieć 99% pewności, że "szóstka" pojawi się co najmniej w 15% wszystkich rzutów?

Ćwiczenie

Zakładając, że 90% osób przekraczających granicę nie popełnia [2] żadnego wykroczenia celnego oraz wiedząc, że osoba, która takie wykroczenie popełnia, jest ujawniana z prawdopodobieństwem 0.2, oblicz prawdopodobieństwo tego, że spośród tysiąca osób przekraczających granicę, będzie ujawnionych co najmniej 10 przypadków popełnienia wykroczenia.

Ćwiczenie

Rozwiąż jeszcze raz zadanie Uzupelnic z41| i porównać wyniki.

Ćwiczenie

Dokumentacja linii lotniczej XYZ wskazuje na to, że na lot w klasie business do Tokio zgłasza się średnio 6.72 pasażera. Ile miejsc w tej klasie należy przygotować na następny lot, aby mieć 90% pewności, że wszyscy chętni dostaną miejsce w klasie business.

Ćwiczenie

Pewną trasą, obsługiwaną przez dwie całkowicie równorzędne linie lotnicze, lata codziennie 1000 osób. Ile miejsc powinna przygotować każda z tych linii, aby obsłużyć 95% klientów, którzy się do niej zgłoszą?

Ćwiczenie

Ile osób należy przebadać, aby mieć 95% pewności, że wyznaczona na jej podstawie frakcja ludzi palących (liczba palaczy do liczebności całej populacji) jest obarczona błędem mniejszym niż 0.005?

Ćwiczenie

Wykonaj 100 serii po 60 rzutów monetą symetryczną, znajdując w każdej serii liczbę uzyskanych orłów S60.

Narysuj histogram dla wartości S60.

Oblicz teoretyczną średnią i odchylenie standardowe zmiennej losowej S60.

Oblicz średnią i odchylenie standardowe zmiennej losowej S60, na podstawie uzyskanej 100-elementowej próbki.

Oblicz P(|S6030|5).

Ile spośród obliczonych sum S60 spełnia warunek |S6030|5?

Ćwiczenie

Niech Sn oznacza sumę orłów uzyskanych w trakcie n rzutów monetą symetryczną. Niech ε>0 będzie dowolną liczbą.

Oblicz:

limnP(|Snn2|ε),limnP(|Snn2|εn),limnP(|Snn2|εn). Wykaż, że:

limnP(|Sn(nSn)|ε)=1,limnP(|nSnSn1|ε)=1.

Zinterpretuj powyższe wyniki.

Ćwiczenie

Niech R oznacza liczbę różnych elementów, otrzymanych podczas 150 losowań ze zwracaniem ze zbioru 200-elementowego. Wykonując odpowiednią symulację komputerową, określ charakter rozkładu zmiennej R.