Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 9: Rozkład normalny i centralne twierdzenie graniczne
Ćwiczenia i zadania
Podajemy tu przykłady kilku konkretnych zastosowań centralnego twierdzenia granicznego.
Ćwiczenie
Rzucono razy symetryczną kostką do gry. Oblicz prawdopodobieństwo tego, że "szóstka" wypadła więcej niż 150 razy.
Aby rozwiązać to zadanie zauważmy najpierw, że interesująca nas ilość "szóstek" jest sumą 1000 niezależnych prób Bernoulliego o prawdopodobieństwie sukcesu w każdej próbie (oznaczymy ją, tradycyjnie, przez ). Zgodnie z centralnym twierdzeniem granicznym (patrz twierdzenia Uzupelnic rozsum|), suma ta ma w przybliżeniu rozkład . Wstawiając wartości liczbowe i korzystając ze wzoru (Uzupelnic eq:47|), otrzymujemy:
gdzie ostatnia liczba pochodzi z tablic rozkładu normalnego.
Ćwiczenie
Jakie jest prawdopodobieństwo, że przy rzutach monetą symetryczną, różnica między ilością reszek i orłów będzie wynosić co najmniej ?
Podobnie jak poprzednio, ilość uzyskanych orłów jest sumą , niezależnych prób Bernoulliego () o prawdopodobieństwie sukcesu w pojedynczej próbie. Chcemy
obliczyć:
Zauważmy, że prawdopodobieństwo zdarzenia przeciwnego jest równe:
Tak więc interesujące nas prawdopodobieństwo wynosi w przybliżeniu równe -- jest to o wiele bardziej zgodne z oczekiwaniami niż rozwiązanie tego samego zagadnienia w ćwiczeniu Uzupelnic d775|.
Ćwiczenie
Wykonano dodawań, z dokładnością w każdym. Jakim błędem obarczona jest suma?
Zwróćmy uwagę, że tak postawiony problem nie ma większego sensu -- w najbardziej optymistycznym przypadku, gdy wszystkie dodawania były dokładne, błąd sumy jest równy zeru, zaś w najgorszym wypadku wynosi on . Sprecyzujmy więc nasze zadanie i spróbujmy znaleźć taki przedział, w którym mieści się błąd sumy z prawdopodobieństwem co najmniej .
Oznaczając błędy powstające w kolejnych dodawaniach przez , , , widzimy, że błąd sumy jest znowu sumą . Poszukujemy zatem takich liczb i , że:
Zauważmy, że chociaż zadanie może mieć wiele rozwiązań, jednak w tym przypadku najrozsądniejsze wydaje się szukanie możliwie najmniejszego przedziału, symetrycznego względem punktu (czasem ważniejsze są inne przedziały, na przykład nieograniczone, ale zawsze decyduje o tym specyfika konkretnego problemu). Szukamy więc ostatecznie możliwie najmniejszej liczby , dla której:
Z założenia wiemy, że wszystkie zmienne losowe mają taki sam rozkład jednostajny na przedziale i dlatego ich nadzieja matematyczna jest równa , zaś odchylenie standardowe wynosi . Mamy więc:
gdzie (ćwiczenie) .
W tablicach znajdujemy, że najmniejszym
spełniającym warunek:
czyli:
jest . Tak więc:
jest szukaną przez nas liczbą. Zauważmy, że zmniejszając nasze żądania co do pewności wyniku, możemy zwiększyć jego
dokładność. Przykładowo, gdybyśmy zażądali, aby:
(tylko pewności zamiast ), to powtarzając poprzednie rachunki, można
stwierdzić, że szukana liczba to:
Ćwiczenie
Aby stwierdzić, jak wielu wyborców popiera obecnie partię C{W sierpniu 2006 partia taka jeszcze nie istniała...}, losujemy spośród nich reprezentatywną próbkę i na niej przeprowadzamy badanie. Jak duża powinna być ta próbka, aby uzyskany wynik różnił się od rzeczywistego poparcia dla partii nie więcej niż o , z prawdopodobieństwem co najmniej ?
Niech oznacza faktyczne (lecz nieznane) poparcie dla partii . Jeżeli próbka składa się z osób, z których wyraziło poparcie dla , to liczba jest poparciem wyznaczonym na podstawie próbki. Możemy założyć, że jest sumą niezależnych zmiennych losowych
o rozkładzie:
Chcemy znaleźć takie , aby:
Ponieważ średnia arytmetyczna ma w przybliżeniu rozkład (patrz twierdzenie Uzupelnic ctgsr|), więc powyższa nierówność jest (w przybliżeniu) równoważna następującej nierówności:
która jest z kolei równoważna nierówności:
Chociaż nie znamy
, wiemy, że:
W takim razie liczba naturalna , spełniająca nierówność:
określa wystarczającą wielkość próbki. Podstawiając
i
, otrzymujemy:
Jeżeli jeszcze przed losowaniem próbki mamy wstępne informacje o poparciu dla partii -- na przykład wiemy, że poparcie to jest mniejsze niż -- możemy powyższy wynik znacznie polepszyć: w tym przypadku , a więc , co oznacza, że jest wystarczającą wielkością próbki.
Ćwiczenie
W ćwiczeniu Uzupelnic pr133| pokazano, stosując nierówność Czebyszewa, że aby mieć pewności otrzymania różnych elementów ze zbioru -elementowego, należy wykonać losowania ze zwracaniem. Czy wynik ten można polepszyć, stosując centralne twierdzenie graniczne?
Z formalnego punktu widzenia nie możemy stosować tutaj centralnego twierdzenia granicznego, gdyż nie są w naszym przypadku spełnione jego założenia. Pytamy jednak, czy mimo tego zmienna losowa (określona w ćwiczeniu Uzupelnic pr133|), oznaczająca liczbę potrzebnych losowań, ma rozkład normalny. Sprawdzimy normalność zmiennej losowej "doświadczalnie", przeprowadzając odpowiednią symulację komputerową.
Wykonamy takich samych doświadczeń -- w każdym z nich losujemy różnych elementów ze zbioru -elementowego. Za każdym razem notujemy liczbę wykonanych losowań, otrzymując ciąg o nazwie "dane". Przytaczamy istotny fragment kodu programu Maple, umożliwiającego realizację powyższego zadania:
{active}{1d}{losuj := rand(1..200):}{}
{active}{1d}{liczba_prob := 500:}{}
{active}{1d}{dane := NULL:}{}
{active}{1d}{from 1 to liczba_prob do}{}
{active}{1d}{lista := NULL: n := 1: nowy := losuj():}{}
{active}{1d}{while nops([lista]) < 100 do while member(nowy,[lista]) do nowy := losuj(): n := n+1 od; lista := lista,nowy: od: dane := dane,n: od:}{}
Obliczamy średnią i odchylenie standardowe: .
{active}{1d}{m := evalf(describe[mean]([dane])); sigma := evalf(describe[standarddeviation]([dane])); }{}
{inert}{2d}{m := 138.9340000;}{
}
{inert}{2d}{sigma := 7.614567880;}{
}
Na podstawie otrzymanych danych rysujemy histogram, zaznaczając także wykres gęstości rozkładu normalnego o obliczonych przed chwilą parametrach:
tutaj rysunek 96.eps
Otrzymane wyniki sugerują, że zmienna losowa ma rozkład normalny -- na wykładzie Uzupelnic wy13| poznamy test statystyczny, umożliwiający bardziej formalną weryfikację tego faktu. Zakładając więc, że zmienna losowa ma rozkład normalny i znając jej nadzieję matematyczną oraz wariancję -- obliczone w ćwiczeniu Uzupelnic cco| -- możemy łatwo poprawić wynik z ćwiczenia Uzupelnic pr133|. Mianowicie:
gdy:
Zauważmy, że jest to wynik istotnie lepszy niż w ćwiczeniu Uzupelnic pr133|.
. . .
Ćwiczenie
Zmienna losowa ma rozkład normalny . Znajdź rozkład zmiennej losowej
Ćwiczenie
Niech będzie kwantylem rzędu w rozkładzie . Oblicz kwantyl rzędu w rozkładzie .
Ćwiczenie
Zaprojektuj i przeprowadź eksperyment komputerowy, który weryfikuje centralne twierdzenie graniczne.
Ćwiczenie
Prawdopodobieństwo zapłacenia kary za jazdę bez biletu wynosi . Jakie jest prawdopodobieństwo tego, że w trakcie takich przejazdów co najmniej raz zapłacimy karę? Podaj dwa sposoby rozwiązania.
Ćwiczenie
Przeprowadź symulację komputerową poprzedniego zadania: wylosuj 20 serii po 100 przejazdów w każdej serii i zobacz, ile razy w każdej serii płaciło się karę.
Ćwiczenie
Rozwiąż jeszcze raz zadanie Uzupelnic noworodki|.
Ćwiczenie
Wykonano 1000 rzutów monetą symetryczną. Jakie jest prawdopodobieństwo tego, że liczba orłów zawiera się w przedziale: (a) , (b) , (c) . Przed przystąpieniem do rozwiązywania podaj przewidywane wyniki w celu późniejszego porównania.
Ćwiczenie
Ile razy należy rzucić kostką do gry, aby mieć pewności, że "szóstka" pojawi się co najmniej w wszystkich rzutów?
Ćwiczenie
Zakładając, że osób przekraczających granicę nie popełnia [2] żadnego wykroczenia celnego oraz wiedząc, że osoba, która takie wykroczenie popełnia, jest ujawniana z prawdopodobieństwem , oblicz prawdopodobieństwo tego, że spośród tysiąca osób przekraczających granicę, będzie ujawnionych co najmniej przypadków popełnienia wykroczenia.
Ćwiczenie
Rozwiąż jeszcze raz zadanie Uzupelnic z41| i porównać wyniki.
Ćwiczenie
Dokumentacja linii lotniczej XYZ wskazuje na to, że na lot w klasie business do Tokio zgłasza się średnio 6.72 pasażera. Ile miejsc w tej klasie należy przygotować na następny lot, aby mieć pewności, że wszyscy chętni dostaną miejsce w klasie business.
Ćwiczenie
Pewną trasą, obsługiwaną przez dwie całkowicie równorzędne linie lotnicze, lata codziennie osób. Ile miejsc powinna przygotować każda z tych linii, aby obsłużyć klientów, którzy się do niej zgłoszą?
Ćwiczenie
Ile osób należy przebadać, aby mieć pewności, że wyznaczona na jej podstawie frakcja ludzi palących (liczba palaczy do liczebności całej populacji) jest obarczona błędem mniejszym niż ?
Ćwiczenie
Wykonaj 100 serii po 60 rzutów monetą symetryczną, znajdując w każdej serii liczbę uzyskanych orłów .
Narysuj histogram dla wartości .
Oblicz teoretyczną średnią i odchylenie standardowe zmiennej losowej .
Oblicz średnią i odchylenie standardowe zmiennej losowej , na podstawie uzyskanej 100-elementowej próbki.
Oblicz .
Ile spośród obliczonych sum spełnia warunek ?
Ćwiczenie
Niech oznacza sumę orłów uzyskanych w trakcie rzutów monetą symetryczną. Niech będzie dowolną liczbą.
Oblicz:
Wykaż, że:
Zinterpretuj powyższe wyniki.
Ćwiczenie
Niech oznacza liczbę różnych elementów, otrzymanych podczas losowań ze zwracaniem ze zbioru -elementowego. Wykonując odpowiednią symulację komputerową, określ charakter rozkładu zmiennej .