Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 8: Przegląd ważniejszych rozkładów

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Ćwiczenia

<flashwrap>file=Rp-8-c1.swf|size=small</flashwrap> <div.thumbcaption>Rp-8-c1.swf

Ćwiczenie 8.1

II rok informatyki składa się z czterech grup ćwiczeniowych o liczebnościach: 15, 11, 10 oraz 14 studentów. W czasie trwania zajęć przeprowadzono pięć sprawdzianów pisemnych dla całego roku. Za każdym razem wykładowca wybierał sobie w sposób losowy jedną pracę, aby osobiście ją sprawdzić. Jakie jest prawdopodobieństwo, że wśród wybranych prac znajdą się prace pochodzące ze wszystkich grup?

Mamy tutaj rozkład wielomianowy o parametrach:


n=5,r=4,p1=1550,p2=1150,p3=1050,p4=1450.


Chcemy więc policzyć:


P(2,1,1,1)+P(1,2,1,1)+P(1,1,2,1)+P(1,1,1,2).


Korzystając z definicji rozkładu wielomianowego łatwo obliczyć, że suma ta wynosi:


6933125=0.22176.


Ćwiczenie 8.2

Uzasadnimy wzory na średnią i wariancję w rozkładzie Poissona.

Otrzymujemy:


𝔼(X)=k=0keλλkk!=λeλk=1λk1(k1)!=λeλk=0λkk!=λeλeλ=λ,


𝔻2(X)=k=0(kλ)2eλλkk!=k=1k2eλλkk!k=12kλeλλkk!+k=0λ2eλλkk!


=λk=1(k1)eλλk1(k1)!+λeλk=1λk1(k1)!2λk=1keλλkk!+λ2eλk=0λkk!


=λ2+λ2λ2+λ2=λ.


Ćwiczenie 8.3

Porównamy graficznie rozkład dwumianowy o parametrach n=50 i p=0.1 (kolor niebieski) z rozkładem Poissona o parametrze λ=5 (kolor czerwony).

Oto właściwy rysunek:

<flash>file=Rp.1.87.swf|width=350|height=350</flash>

Ćwiczenie 8.4

Udowodnimy podane na wykładzie wzory na wartość oczekiwaną i wariancję w rozkładzie wykładniczym.

Otrzymujemy:


𝔼(X)=xf(x)dx=0λxeλxdx=[eλx(x+1λ)]0=0(1λ)=1λ,


𝔼(X2)=x2f(x)dx=0λx2eλzdx=[eλx2+2λx+x2λ2λ2]0


=0(2λ2)=2λ2,


𝔻2(X)=𝔼(X2)𝔼(X)2=1λ2.


Ćwiczenie 8.5

Narysujemy wykresy gęstości rozkładu Erlanga dla n=2,,10, z ustalonym parametrem λ=0.25.

Oto żądane wykresy:


<flash>file=Rp.1.88.swf|width=350|height=350</flash>


Licząc odpowiednie całki można sprawdzić, że rozkłady te mają następujące nadzieje matematyczne:


8,12,16,20,24,28,32,36,40.


Ćwiczenie 8.6

Przypuśćmy, że ze zbioru N-elementowego losujemy w kolejnych momentach czasu po jednym elemencie, przy czym jest to losowanie ze zwracaniem. Interesuje nas średnia długość czasu oczekiwania na wylosowanie r różnych elementów.

Niech T oznacza interesujący nas czas. Nie jest całkiem widoczne, jak wyznaczyć rozkład T, jednak samą nadzieję matematyczną można obliczyć stosunkowo łatwo. Zauważmy w tym celu, że gdy w pewnym momencie mamy już wylosowanych n różnych elementów, to czas oczekiwania Tn na pojawienie się następnego, różnego od nich, elementu jest zmienną losową o rozkładzie, którego charakter jest w istocie taki sam jak rozkład czasu oczekiwania na pierwszą "szóstkę". Mianowicie, Tn ma rozkład:


P(Tn=k)=(nN)k1NnN,  k=1,2,3,


- jest to więc rozkład geometryczny o parametrze p=NnN.

W związku z powyższym, zmienna losowa Tn ma określoną nadzieję matematyczną i wariancję:


𝔼(Tn)=NNn,𝔻2(Tn)=nN(nN)2.


Zauważmy teraz, że:


T=T0+T1++Tr1,


a więc:


𝔼(T)=n=0r1E(Tn)=n=0r1NNn.


Ponieważ zmienne losowe T0,T1,,Tr1 są niezależne, mamy także:


𝔻2(T)=n=0r1D2(Tn)=n=0r1Nn(Nn)2.


Wykorzystując wspomaganie komputerowe (na przykład program Maple), obliczmy nadzieję i wariancję w kilku szczególnych przypadkach:

N=100, r=30: 𝔼(T)35.45407600, 𝔻2(X)6.885850949,
N=200, r=100: 𝔼(T)138.1306861, 𝔻2(X)60.37514711,
N=200, r=190: 𝔼(T)589.8125388, 𝔻2(X)3017.340055,
N=100, r=8: 𝔼(T)8.294833858, 𝔻2(X)0.3105547438.

Zwróćmy uwagę na to, że wyniki te są zgodne z intuicją -- gdy chcemy wylosować niewiele elementów, wystarczy niewiele losowań, a ponieważ wariancja, będąca miarą rozrzutu, jest mała, mamy właściwie pewność, że do wylosowania 30 różnych elementów potrzebujemy 40 lub niewiele więcej losowań. Natomiast, gdy chcemy mieć dużo, w porównaniu z liczebnością populacji, elementów różnych, liczba losowań musi być duża, a jej konkretne przewidywanie jest obarczone poważnym błędem.

Otrzymane wyniki mogą być wykorzystane do określenia wielkości populacji na podstawie próbki. Jeżeli, na przykład, w 12 losowaniach uzyskamy jedynie 8 elementów różnych, możemy przypuszczać, że wielkość populacji jest nieco mniejsza niż 100. Statystyka matematyczna podaje metody, jak w miarę precyzyjnie określić wielkość populacji oraz, przede wszystkim, jak precyzyjnie postawić problem.

Ćwiczenie 8.7

Ile należy wykonać losowań ze zwracaniem, aby z populacji 200-elementowej wybrać 100 różnych elementów z prawdopodobieństwem nie mniejszym niż 0.95?

Przyjmijmy oznaczenia jak w ćwiczeniu 8.6 (tutaj r=100). Mamy znaleźć liczbę losowań x, dla której:


P(Tx)0.95.


Możemy od razu założyć, że x>m=𝔼(T). Wówczas, korzystając m. in. z nierówności Czebyszewa (twierdzenie 7.20), dla ε=xm otrzymujemy:


P(Tx)=P(Tm+ε)=1P(T>m+ε)


1P(|Tm|ε)1𝔻2(T)ε2.


Wystarczy więc dobrać x tak, aby:


1𝔻2(T)(xm)20.95.


Ponieważ wiemy już (z poprzedniego ćwiczenia), że m138.1306861 oraz D2(T)60.37514711, możemy wyliczyć x rozwiązując powyższą prostą nierówność kwadratową. Tak więc otrzymujemy:


xm+𝔻2(T)0.05172.879829.


Zatem przy 173 rzutach mamy 95 pewności, że wylosujemy 100 różnych elementów. Jeżeli wystarczy nam 90 pewności, możemy podobnie obliczyć, że wystarczy wykonać jedynie 163 rzuty. Jak zobaczymy później, wyniki te można jeszcze wzmocnić.

Zadanie 8.1

Oblicz (skorzystaj, w miarę potrzeby, z tablic lub komputera):

  1. P(X>1), gdy X ma rozkład wykładniczy z parametrem λ=1,
  2. P(X2>1), gdy X ma rozkład jednostajny na odcinku (2,3),
  3. P(X>4), gdy X ma rozkład geometryczny z parametrem p=0.1,
  4. P(|X5|>2), gdy X ma rozkład dwumianowy z parametrami n=8 i p=0.2,
  5. P(|X5|>2), gdy X ma rozkład dwumianowy z parametrami n=80 i p=0.02 (w tym przypadku są dwa różne, praktyczne sposoby).

Uzyskane wyniki zilustruj geometrycznie.

Zadanie 8.2

Wylosuj 200 liczb według: (a) rozkładu dwupunktowego (0,1,0.3), (b) rozkładu jednostajnego na odcinku U(0,10), (c) rozkładu dwumianowego z parametrami 10 i 0.6. Oblicz w każdym przypadku nadzieję matematyczną i wariancję oraz porównaj je z wartościami teoretycznymi.

Zadanie 8.3

Jakie jest prawdopodobieństwo tego, że wśród 200 losowo wybranych osób znajdują się co najmniej cztery osoby leworęczne, jeżeli przyjmiemy, że takie osoby stanowią 1% całej populacji? Jak duża powinna być grupa osób, aby z prawdopodobieństwem 0.95 lub większym, co najmniej jedna osoba w tej grupie była leworęczna?

Zadanie 8.4

Ile rodzynek podczas wyrabiania ciasta trzeba średnio przeznaczyć na bułeczkę, aby losowo wybrana bułeczka zawierała co najmniej jedną rodzynkę z prawdopodobieństwem 0.95 lub większym?

Zadanie 8.5

Dwóch ludzi wykonuje n rzutów monetą symetryczną. Jakie jest prawdopodobieństwo tego, że obaj otrzymają tyle samo orłów?

Zadanie 8.6

Ze stawu, w którym pływa N ryb, w tym M ryb jadalnych, odłowiono n ryb. Jaka jest oczekiwana liczba odłowionych ryb jadalnych?

Zadanie 8.7

Niezależne zmienne losowe X i Y mają rozkłady wykładnicze z parametrami λ oraz μ. Wykaż, że zmienna losowa min(X,Y) też ma rozkład wykładniczy.

Zadanie 8.8

Dla grupy n osób znajdź oczekiwaną liczbę dni, które są dniami urodzin tych osób.

Zadanie 8.9

Oblicz prawdopodobieństwo tego, że pierwiastki równania x2+px+q są rzeczywiste, wiedząc, że p oraz q są niezależnymi zmiennymi losowymi o rozkładzie jednostajnym na odcinku (1,1).

Zadanie 8.10

Wykaż, że zmienna losowa ξξ+η ma rozkład jednostajny na przedziale (0,1), o ile ξ oraz η mają taki sam rozkład wykładniczy i są niezależne.