Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów

Z Studia Informatyczne
Wersja z dnia 11:00, 22 sie 2006 autorstwa Arek (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Ćwiczenia i Zadania

Ćwiczenie

II rok informatyki składa się z czterech grup ćwiczeniowych o liczebnościach: 15, 11, 10 oraz 14 studentów. W czasie trwania zajęć przeprowadzono pięć sprawdzianów pisemnych dla całego roku. Za każdym razem wykładowca wybierał sobie w sposób losowy jedną pracę, aby osobiście ją sprawdzić. Jakie jest prawdopodobieństwo, że wśród wybranych prac znajdą się prace pochodzące ze wszystkich grup?

Mamy tutaj rozkład wielomianowy o parametrach:

n=5,r=4,p1=1550,p2=1150,p3=1050,p4=1450.

Chcemy więc policzyć:

P(2,1,1,1)+P(1,2,1,1)+P(1,1,2,1)+P(1,1,1,2).

Korzystając z definicji rozkładu wielomianowego łatwo obliczyć, że suma ta wynosi:

6933125=0.22176.

Ćwiczenie

Uzasadnimy wzory na średnią i wariancję w rozkładzie Poissona.

Otrzymujemy:

𝔼(X)=k=0keλλkk!=λeλk=1λk1(k1)!=λeλk=0λkk!=λeλeλ=λ,
𝔻2(X)=k=0(kλ)2eλλkk!=k=1k2eλλkk!k=12kλeλλkk!+k=0λ2eλλkk!
=λk=1(k1)eλλk1(k1)!+λeλk=1λk1(k1)!2λk=1keλλkk!+λ2eλk=0λkk!
=λ2+λ2λ2+λ2=λ.

Ćwiczenie

Porównamy graficznie rozkład dwumianowy o parametrach n=50 i p=0.1 (kolor niebieski) z rozkładem Poissona o parametrze λ=5 (kolor czerwony).

Oto właściwy rysunek:

tutaj rysunek 87.eps

Ćwiczenie

Udowodnimy podane na wykładzie wzory na wartość oczekiwaną i wariancję w rozkładzie wykładniczym.

Otrzymujemy:

𝔼(X)=xf(x)dx=0λxeλxdx=[eλx(x+1λ)]0=0(1λ)=1λ,
𝔼(X2)=x2f(x)dx=0λx2eλzdx=[eλx2+2λx+x2λ2λ2]0
=0(2λ2)=2λ2,
𝔻2(X)=𝔼(X2)𝔼(X)2=1λ2.

Ćwiczenie

Narysujemy wykresy gęstości rozkładu Erlanga dla n=2,,10, z ustalonym parametrem λ=0.25.

Oto żądane wykresy:

tutaj rysunek 88.eps

Licząc odpowiednie całki można sprawdzić, że rozkłady te mają następujące nadzieje matematyczne:

8,12,16,20,24,28,32,36,40.

Ćwiczenie

Przypuśćmy, że ze zbioru N-elementowego losujemy w kolejnych momentach czasu po jednym elemencie, przy czym jest to losowanie ze zwracaniem. Interesuje nas średnia długość czasu oczekiwania na wylosowanie r różnych elementów.

Niech T oznacza interesujący nas czas. Nie jest całkiem widoczne, jak wyznaczyć rozkład T, jednak samą nadzieję matematyczną można obliczyć stosunkowo łatwo. Zauważmy w tym celu, że gdy w pewnym momencie mamy już wylosowanych n różnych elementów, to czas oczekiwania Tn na pojawienie się następnego, różnego od nich, elementu jest zmienną losową o rozkładzie, którego charakter jest w istocie taki sam jak rozkład czasu oczekiwania na pierwszą "szóstkę". Mianowicie, Tn ma rozkład:

P(Tn=k)=(nN)k1NnN,  k=1,2,3,

-- jest to więc rozkład geometryczny o parametrze p=NnN.

W związku z powyższym, zmienna losowa Tn ma określoną nadzieję matematyczną i wariancję:

𝔼(Tn)=NNn,𝔻2(Tn)=nN(nN)2.

Zauważmy teraz, że:

T=T0+T1++Tr1,

a więc:

𝔼(T)=n=0r1E(Tn)=n=0r1NNn.

Ponieważ zmienne losowe T0,T1,,Tr1 są niezależne, mamy także:

𝔻2(T)=n=0r1D2(Tn)=n=0r1Nn(Nn)2.

Wykorzystując wspomaganie komputerowe (na przykład program Maple), obliczmy nadzieję i wariancję w kilku szczególnych przypadkach: .1in

Uzupelnij tytul
{0.1in}

N=100, r=30: || 𝔼(T)35.45407600, 𝔻2(X)6.885850949,

{0.1in}

N=200, r=100: || 𝔼(T)138.1306861, 𝔻2(X)60.37514711,

{0.1in}

N=200, r=190: || 𝔼(T)589.8125388, 𝔻2(X)3017.340055,

N=100, r=8: 𝔼(T)8.294833858, 𝔻2(X)0.3105547438.

.1in

Zwróćmy uwagę na to, że wyniki te są zgodne z intuicją -- gdy chcemy wylosować niewiele elementów, wystarczy niewiele losowań, a ponieważ wariancja, będąca miarą rozrzutu, jest mała, mamy właściwie pewność, że do wylosowania 30 różnych elementów potrzebujemy 40 lub niewiele więcej losowań. Natomiast, gdy chcemy mieć dużo, w porównaniu z liczebnością populacji, elementów różnych, liczba losowań musi być duża, a jej konkretne przewidywanie jest obarczone poważnym błędem.

Otrzymane wyniki mogą być wykorzystane do określenia wielkości populacji na podstawie próbki. Jeżeli, na przykład, w 12 losowaniach uzyskamy jedynie 8 elementów różnych, możemy przypuszczać, że wielkość populacji jest nieco mniejsza niż 100. Statystyka matematyczna podaje metody, jak w miarę precyzyjnie określić wielkość populacji oraz, przede wszystkim, jak precyzyjnie postawić problem.

Ćwiczenie

Ile należy wykonać losowań ze zwracaniem, aby z populacji 200-elementowej wybrać 100 różnych elementów z prawdopodobieństwem nie mniejszym niż 0.95?

Przyjmijmy oznaczenia jak w ćwiczeniu Uzupelnic cco| (tutaj r=100).

Mamy znaleźć liczbę losowań

x

, dla której:

P(Tx)0.95.

Możemy od razu założyć, że x>m=𝔼(T). Wówczas, korzystając m. in. z nierówności Czebyszewa (twierdzenie Uzupelnic tnc|), dla ε=xm otrzymujemy:

P(Tx)=P(Tm+ε)=1P(T>m+ε)
1P(|Tm|ε)1𝔻2(T)ε2.

Wystarczy więc dobrać x tak, aby:

1𝔻2(T)(xm)20.95.

Ponieważ wiemy już (z poprzedniego ćwiczenia), że m138.1306861 oraz D2(T)60.37514711, możemy wyliczyć x rozwiązując powyższą prostą nierówność kwadratową. Tak więc otrzymujemy:

xm+𝔻2(T)0.05172.879829.

Zatem przy 173 rzutach mamy 95 pewności, że wylosujemy 100 różnych elementów. Jeżeli wystarczy nam 90 pewności, możemy podobnie obliczyć, że wystarczy wykonać jedynie 163 rzuty. Jak zobaczymy później, wyniki te można jeszcze wzmocnić.

. . .

Ćwiczenie

Oblicz (skorzystaj, w miarę potrzeby, z tablic lub komputera):

P(X>1), gdy X ma rozkład wykładniczy z parametrem λ=1,

P(X2>1), gdy X ma rozkład jednostajny na odcinku (2,3),

P(X>4), gdy X ma rozkład geometryczny z parametrem p=0.1,

P(|X5|>2), gdy X ma rozkład dwumianowy z parametrami n=8 i p=0.2,

P(|X5|>2), gdy X ma rozkład dwumianowy z parametrami n=80 i p=0.02 (w tym przypadku są dwa różne, praktyczne sposoby).

Uzyskane wyniki zilustruj geometrycznie.

Ćwiczenie

Wylosuj 200 liczb według: (a) rozkładu dwupunktowego (0,1,0.3), (b) rozkładu jednostajnego na odcinku U(0,10), (c) rozkładu dwumianowego z parametrami 10 i 0.6. Oblicz w każdym przypadku nadzieję matematyczną i wariancję oraz porównaj je z wartościami teoretycznymi.

Ćwiczenie

Jakie jest prawdopodobieństwo tego, że wśród 200 losowo wybranych osób znajdują się co najmniej cztery osoby leworęczne, jeżeli przyjmiemy, że takie osoby stanowią 1% całej populacji? Jak duża powinna być grupa osób, aby z prawdopodobieństwem 0.95 lub większym, co najmniej jedna osoba w tej grupie była leworęczna?

Ćwiczenie

Ile rodzynek podczas wyrabiania ciasta trzeba średnio przeznaczyć na bułeczkę, aby losowo wybrana bułeczka zawierała co najmniej jedną rodzynkę z prawdopodobieństwem 0.95 lub większym?

Ćwiczenie

Dwóch ludzi wykonuje n rzutów monetą symetryczną. Jakie jest prawdopodobieństwo tego, że obaj otrzymają tyle samo orłów?

Ćwiczenie

Ze stawu, w którym pływa N ryb, w tym M ryb jadalnych, odłowiono n ryb. Jaka jest oczekiwana liczba odłowionych ryb jadalnych?

Ćwiczenie

Niezależne zmienne losowe X i Y mają rozkłady wykładnicze z parametrami λ oraz μ. Wykaż, że zmienna losowa min(X,Y) też ma rozkład wykładniczy.

Ćwiczenie

Dla grupy n osób znajdź oczekiwaną liczbę dni, które są dniami urodzin tych osób.

Ćwiczenie

Oblicz prawdopodobieństwo tego, że pierwiastki równania x2+px+q są rzeczywiste, wiedząc, że p oraz q są niezależnymi zmiennymi losowymi o rozkładzie jednostajnym na odcinku (1,1).

Ćwiczenie

Wykaż, że zmienna losowa ξξ+η ma rozkład jednostajny na przedziale (0,1), o ile ξ oraz η mają taki sam rozkład wykładniczy i są niezależne.