Rachunek prawdopodobieństwa i statystyka/Wykład 4: Przestrzeń probabilistyczna II

From Studia Informatyczne

Najpierw zajmiemy się losowaniami ze zwracaniem i bez zwracania; można je opisać za pomocą schematu klasycznego. Natomiast schemat geometryczny stanowi zupełnie inny rodzaj przestrzeni probabilistycznej. Zwrócimy uwagę na problem właściwego doboru przestrzeni probabilistycznej.

Losowania

Podamy teraz dwa ważne przykłady zastosowania schematu klasycznego - losowanie bez zwracania  i losowanie ze zwracaniem. Przypuśćmy, że mamy dany r elementowy zbiór R, z którego losujemy n elementów. Zakładamy, że wszystkie wyniki naszego losowania są jednakowo możliwe. Wyobraźmy sobie, na przykład, że w urnie jest r = 10 ponumerowanych kul i że wyciągamy z tej urny po kolei n = 5 kul.


Zauważmy, że mogą być tu zastosowane dwie metody losowania:

  • po wyciągnięciu kuli zapisujemy jej numer i wrzucamy ją z powrotem do urny,
  • kolejne wyciągnięte kule ustawiamy obok urny.

W pierwszym przypadku, wynikiem naszego eksperymentu jest ciąg pięciu liczb, który, przykładowo, może mieć postać:


4,2,10,5,7;\  \  3,3,6,1,2;  \  \  1,2,3,4,5  \  \mbox{   lub   } \ 7,7,7,7,5;


każdy taki ciąg jest dla nas zdarzeniem elementarnym. Zauważmy, że kule mogą się powtarzać i że musimy uwzględniać kolejność, w jakiej się pojawiają. Gdybyśmy nie uwzględnili kolejności, wynik 1,2,3,4,5 odpowiadałby wielu losowaniom, a wynik 4,4,4,4,4 tylko jednemu, tak więc prawdopodobieństwo drugiego wyniku musiałoby być mniejsze niż prawdopodobieństwo wyniku pierwszego, co w schemacie klasycznym nie może zachodzić - a właśnie ten schemat chcemy wykorzystać.

W drugim przypadku, wynikiem naszego eksperymentu jest zbiór pięciu liczb, na przykład:


\{3,5,6,7,8\};\ \ \{1,2,4,8,10\}\ \mbox{ lub }\ \{2,3,4,5,6\};


każdy taki zbiór jest dla nas zdarzeniem elementarnym. Zauważmy, że kule nie mogą się oczywiście powtarzać i że nie uwzględniamy kolejności - wyobraźmy sobie, że zamiast wyciągać kule po kolei bierzemy pięć kul jednocześnie (i dopiero wtedy odczytujemy numery).

Wróćmy teraz do sytuacji ogólnej i określmy zbiór \Omega zdarzeń elementarnych oraz obliczmy liczbę jego elementów w przypadku losowania ze zwracaniem i losowania bez zwracania.

W losowaniu ze zwracaniem, \Omega jest zbiorem wszystkich n-elementowych ciągów (dawniej takie ciągi nazywano n-elementowymi wariacjami z powtórzeniami) o wyrazach ze zbioru R, albo inaczej n-krotnym iloczynem kartezjańskim (patrz wykład z Logiki i teori mnogości):


\Omega = R^n = \{(r_1, \dots ,r_n): r_i \in R\; \textrm{ dla }\; i=1,\ldots,n\}.


Stosując prostą indukcję, można łatwo stwierdzić, że \#\Omega=r^n. Na przykład, dla n=2 zbiór \Omega jest zbiorem wszystkich możliwych par utworzonych z elementów zbioru R, a więc ma r^2 elementów. W takim razie, podczas losowania ze zwracaniem prawdopodobieństwo zdarzenia elementarnego wynosi \frac{1}{r^n}.

W losowaniu bez zwracania, \Omega jest zbiorem wszystkich n-elementowych podzbiorów (mówi się też o n-elementowych kombinacjach) zbioru R:


\Omega = \{K: K \subset R,\  \# K = n \}.


Można łatwo obliczyć moc zbioru \Omega. Mianowicie, \# \Omega  = \left(^{r}_{n}  \right), gdzie \left(^{r}_{n} \right) = \frac{r!}{n!(r-n)!} jest znanym ze szkoły symbolem Newtona. W takim razie, podczas losowania bez zwracania prawdopodobieństwo zdarzenia elementarnego wynosi \frac{1}{\left(^{r}_{n} \right)}.

Prawdopodobieństwo geometryczne

Definicja 4.1 [Prawdopodobieństwo geometryczne]

Niech G \subset \mathbb R^n będzie zbiorem borelowskim, to jest G \in \mathcal B(\mathbb R^n), oraz niech jego miara Lebesgue'a \mu(G) będzie dodatnia i skończona. Określamy \sigma-algebrę


\Sigma = \{A\cap G: A \in \mathcal B(\mathbb R^n)\}


i prawdopodobieństwo


P(A\cap G) = {\mu(A\cap G)\over \mu(G)}.


Można sprawdzić, że trójka (G,\Sigma ,P) jest przestrzenią probabilistyczną.

Model opisany przy pomocy prawdopodobieństwa geometrycznego jest niekiedy stosowany w sytuacji, gdy zdarzenia mogą być w sposób naturalny interpretowane jako liczby rzeczywiste (czas, długość) lub wektory w przestrzeni \mathbb R^n.

Przykład 4.2

Dwoje internautów umówiło się na spotkanie w sieci między godziną 17 a 18, przy czym ze względu na koszty połączenia będą na siebie czekać co najwyżej 10 minut i nie dłużej niż do godziny 18. Jakie jest prawdopodobieństwo tego, że się spotkają?

Wydaje się (patrz następny przykład), że w tym przypadku przestrzenią zdarzeń elementarnych \Omega może być kwadrat [0,1] \times [0,1] (jednostką jest 1 godzina), a miarą probabilistyczną miara Lebesgue'a (każdy moment między 17 a 18 włączenia się do sieci jest jednakowo możliwy). Chcemy obliczyć prawdopodobieństwo zdarzenia


A =\{(x,y) \in \Omega: |x-y|  <  \frac{1}{6} \}.


Jak łatwo się przekonać, wynosi ono \frac{11}{36}.



Kłopoty z wyborem przestrzeni
- Paradoks Bertranda

Zdarza się często, że mając konkretną sytuację musimy skonstruować odpowiadającą jej przestrzeń probabilistyczną. W wielu przypadkach procedura jest oczywista, ale czasem mogą powstać wątpliwości. Typowym przykładem jest tu następujące zadanie:



Przykład 4.3 [Ostrzeżenie]

Dany jest okrąg o promieniu r = 1. Jakie jest prawdopodobieństwo tego, że losowo wybrana cięciwa tego okręgu jest krótsza niż bok trójkąta równobocznego wpisanego w ten okrąg?

Zadanie to ma kilka różnych rozwiązań, w zależności od metody losowania.

1. Mając ustalony jeden z końców cięciwy, wybieramy taki trójkąt równoboczny wpisany, że jego wierzchołek jest w tym punkcie. Losowanie cięciwy oznacza ustalenie drugiego jej końca. Tak więc \Omega jest całym okręgiem, za \Sigma naturalnie jest przyjąć rodzinę zbiorów mierzalnych na okręgu, a P jest miarą Lebesgue'a (jeżeli A jest łukiem okręgu, to jego miara Lebesgue'a pokrywa się z jego długością. Ponieważ jednak łuki nie tworzą \sigma-algebry, musimy posługiwać się pojęciem zbioru mierzalnego i w konsekwencji pojawia się pojęcie miary Lebesgue'a) podzieloną przez 2\pi. Widać, że prawdopodobieństwo interesującego nas zdarzenia jest równe 2\over 3.

2. Aby wylosować cięciwę, wystarczy podać jej środek. Tutaj \Omega jest kołem, \Sigma jest rodziną zbiorów borelowskich zawartych w kole, a P jest miarą Lebesgue'a podzieloną przez pole koła \pi^2. Łatwo policzyć, że teraz prawdopodobieństwo naszego zdarzenia wynosi 3\over 4.

Zauważmy, że można też podać inne rozwiązania tego zadania. Powyższy paradoks, zwany paradoksem Bertranda, jest spowodowany tym, że nie sprecyzowaliśmy, co to znaczy, że cięciwa jest wybierana w sposób "losowy".