Rachunek prawdopodobieństwa i statystyka/Wykład 3: Przestrzeń probabilistyczna I

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Podamy podstawowe definicje i własności pojęć stanowiących fundamenty rachunku prawdopodobieństwa. Wskażemy ścisły związek tych pojęć z pojęciem geometrycznym, jakim jest miara. Omówimy najważniejszy model przestrzeni probabilistycznej - tak zwany schemat klasyczny.

Definicja prawdopodobieństwa

Definicja prawdopodobieństwa, którą będziemy się posługiwać (i która jest obecnie w powszechnym użyciu) jest definicją aksjomatyczną. Na wykładzie 7| wspomnimy jednak o innym podejściu do tego zagadnienia.

Aby ułatwić Czytelnikowi zrozumienie idei definicji aksjomatycznej, przeprowadzimy na wstępie pewne nieformalne rozumowania. Zaczniemy od analizy bardzo prostej sytuacji. Wyobraźmy sobie, że Marek rzuca wielokrotnie dwiema kostkami do gry i podaje przez telefon swojemu koledze Tomkowi uzyskaną sumę oczek, która jest liczbą z zakresu od 2 do 12. Na przykład, przy 10 rzutach Tomek mógłby zanotować:

Może to zilustrować?. 10 rzutów parą kostek: nie widać oczek, ale jest wyraźnie napisana sumaoczek.


4,7,5,2,6,11,7,9,9,6.


Nie wydaje się, aby powyższy ciąg liczb wykazywał jakieś ciekawe prawidłowości, jednak przy większej liczbie prób, powiedzmy przy 100 podwójnych rzutach, Tomek zauważa, że pewne wyniki powtarzają się zdecydowanie częściej niż inne. Zaintrygowany próbuje zbadać rzecz dokładniej - postanawia powtórzyć doświadczenie kolegi. Oczywiście, może w tym celu rzucać wielokrotnie parą kostek i zapisywać sumy oczek, ale może też (po odłożeniu słuchawki) przeprowadzić symulację komputerową. Oto przykładowy ciąg, jaki może wtedy otrzymać:

11, 4, 7, 11, 4, 9, 7, 6, 9, 7, 8, 8, 12, 10, 6, 8, 6, 6, 6, 10, 7, 3, 6, 10, 5, 8, 6, 7, 8, 3, 5, 8, 7, 8, 7, 8, 7, 11, 12, 5, 8, 5, 8, 5, 10, 3, 5, 8, 9, 6, 3, 9, 5, 6, 10, 7, 10, 9, 9, 10, 5, 4, 10, 2, 6, 8, 3, 4, 3, 4, 9, 7, 9, 7, 7, 11, 7, 7, 8, 4, 5, 6, 6, 3, 8, 6, 6, 6, 7, 6, 5, 6, 4, 5, 3, 10, 11, 11, 8, 7.

Wyraźnie teraz widać, że najczęstszymi wynikami są: "6", "7" oraz "8", zaś najrzadziej pojawiało się "2" i "12". Tomek powtarza kilkakrotnie swoją symulację i chociaż za każdym razem otrzymuje inny ciąg wyników, powyższe spostrzeżenie pozostaje zawsze bez zmian.

Pomożemy Tomkowi wytłumaczyć powody, dla których tak się dzieje. Policzymy mianowicie prawdopodobieństwo, z jakim wypadają liczby "środkowe" - "6", "7" i "8" oraz prawdopodobieństwo, z jakim wypadają liczby będące liczbami "skrajnymi"- "2" i "12". Jednak wcześniej zastanowimy się, co właściwie dla nas znaczy słowo "prawdopodobieństwo".

Sprawa definicji pojęcia prawdopodobieństwa nie jest bynajmniej banalna. Absorbowała ona uwagę wielu wybitnych matematyków w okresie ostatnich 300 lat i chociaż jeszcze dzisiaj wzbudza pewne kontrowersje w niektórych środowiskach naukowych, to z matematycznego punktu widzenia sprawa jest już dobrze zbadana. Podamy za chwilę pełną formalną definicję, wzorowaną na pomyśle Kołmogorowa

życiorys, zdjęcie!!!

sprzed 70 lat, jednak najpierw doprecyzujemy pewne intuicje, wykorzystując opisaną powyżej zabawę z kostkami.

W naszym przypadku interesują nas zdarzenia odpowiadające wartości sumy oczek na dwóch kostkach. Oznaczmy zbiór interesujących nas zdarzeń literą Σ. Jest wiele zdarzeń należących do Σ - są nimi na przykład zdarzenia, powiedzmy S2,S3,S4,,S12, w których suma oczek jest dokładnie jedną z liczb od 2 do 12. Oprócz tych 11 zdarzeń mogą nas interesować także inne zdarzenia, na przykład zdarzenie A, w którym suma oczek jest jedną z liczb 6, 7 lub 8, albo zdarzenie B, w którym suma oczek nie jest równa ani 2, ani 12. Te dwa ostatnie zdarzenia mogą być wyrażone jako, odpowiednio, alternatywa zdarzeń S6, S7, S8 oraz negacja alternatywy zdarzeń S2 z S12. Do zbioru Σ należą też dwa istotne, chociaż niezbyt ciekawe, zdarzenia: tak zwane zdarzenie niemożliwe (na przykład, że suma oczek na dwóch kostkach wynosi 13) oraz zdarzenie pewne (na przykład, że suma oczek jest liczbą całkowitą).

Chcemy teraz każdemu zdarzeniu przypisać liczbę określającą jego prawdopodobieństwo. Mamy więc do czynienia z funkcją [LM], oznaczmy ją literą P, która zdarzeniom przyporządkowuje liczby. Możemy więc napisać:


P:ΣSP(S).


Zanim powiemy, jak wyznaczyć funkcję P, zwróćmy uwagę, że powinna mieć ona kilka charakterystycznych własności. Na przykład, nasza intuicja podpowiada, że prawdopodobieństwo musi być liczbą nieujemną, a więc wartości funkcji P powinny być nieujemne. Zgodnie z intuicją, wartość funkcji odpowiadająca zdarzeniu niemożliwemu musi być równa 0. Rozsądnie jest też przyjąć, że zdarzenie pewne ma prawdopodobieństwo równe 1 (100%, gdy wolimy używać procentów). Najistotniejszym jednak warunkiem, który musi spełniać nasza funkcja P, jest żądanie, aby prawdopodobieństwo alternatywy zdarzeń równało się sumie prawdopodobieństw tych zdarzeń, oczywiście pod warunkiem, że zdarzenia te wzajemnie się wykluczają. Założenie to, zwane zasadą addytywności, oznacza natychmiast, że:


P(A)=P(S6)+P(S7)+P(S8).


Potrafimy także wtedy pokazać, że:


P(B)=1(P(S2)+P(S12)).


Aby policzyć konkretne wartości prawdopodobieństw P(S) dla wszystkich zdarzeń SΣ, musimy wniknąć nieco głębiej w naturę badanego zjawiska. Spróbujmy najpierw odpowiedzieć na pytanie o to, czym się różnią od siebie zdarzenia, na przykład, S2 oraz S6, i dlaczego pierwsze z nich zachodzi rzadziej niż drugie. Otóż zdarzenie S2 zachodzi dokładnie wtedy, gdy na obu kostkach wypadnie "1", natomiast zdarzeniu S5 odpowiadają następujące cztery wyniki:


(1,4),(2,3),(3,2),(4,1).


Wyraźnie więc widać, że zdarzenie S5 ma szansę zajść cztery razy częściej niż zdarzenie S2.

Rozwijając tę myśl dalej zauważmy, że każde zdarzenie z interesującego nas zbioru Σ może być utożsamione ze zbiorem par liczb określających wyniki uzyskane na obu kostkach. Niech Ω oznacza zbiór tych par, czyli:


Ω={(i,j):i,j=1,2,,6}.


Elementy zbioru Ω będą w dalszym ciągu nazywane zdarzeniami elementarnymi. Tak więc każde zdarzenie S składa się ze zdarzeń elementarnych, jest więc w istocie podzbiorem zbioru Ω, przy czym zdarzenie niemożliwe utożsamiamy ze zbiorem pustym, natomiast zdarzenie pewne z całym zbiorem Ω. Zauważmy jednak, że nie wszystkie zdarzenia elementarne należą do Σ. Na przykład para (2,3) jest co prawda elementem S5, ale przez Tomka, który zna jedynie sumy oczek, nie jest identyfikowana. Natomiast zdarzenia elementarne (1,1) oraz (6,6) odpowiadają zdarzeniom S2 oraz S12 należącym do Σ.

Można łatwo wyznaczyć prawdopodobieństwo każdego zdarzenia elementarnego - ponieważ jest 36 takich zdarzeń i wszystkie one tworzą zdarzenie pewne Ω, którego prawdopodobieństwo jest równe 1, więc zakładając, że prawdopodobieństwo każdego z nich jest takie samo i równa się, powiedzmy, x, z zasady addytywności otrzymujemy:


36x=1,


a stąd:


x=136.


Korzystając dalej z tej zasady, możemy policzyć prawdopodobieństwo każdego zdarzenia SΣ, a to oznacza poprawne określenie funkcji P. Na przykład:


P(S5)=536,P(S7)=636,P(A)=536+636+536=1636,


P(B)=1(136+136)=3436.


Przyjrzyjmy się jeszcze raz, teraz nieco w innej kolejności, naszemu postępowaniu. Mając konkretny problem, określiliśmy najpierw pewien zbiór Ω, nazwany zbiorem zdarzeń elementarnych. Następnie wyróżniliśmy zbiór interesujących nas zdarzeń Σ w ten sposób, że każde ze zdarzeń jest zbudowane ze zdarzeń elementarnych, więc zdarzenia można traktować jako podzbiory zbioru Ω. Określiliśmy wreszcie funkcję P:Σ, która zdarzeniom przyporządkowuje ich prawdopodobieństwa. Zauważyliśmy przy tym, że zbiór zdarzeń Σ oraz funkcja P muszą posiadać pewne uniwersalne własności.

Okazuje się, że jest to podejście typowe. Gdy mamy rozpatrywać określoną sytuację, w której uwzględniamy losowość, powinniśmy w zasadzie postępować według powyższego schematu, wyznaczając kolejno Ω, Σ oraz P. Oczywiście, obiekty te mogą mieć zupełnie inną postać niż w naszym przykładzie. Ponadto, w pewnych sytuacjach zbiór zdarzeń elementarnych może być nieskończony, co już wyklucza możliwość zdefiniowania P tak jak poprzednio. Niemniej jednak, w każdej sytuacji zbiór zdarzeń Σ oraz funkcja P powinny mieć podobne własności do tych sugerowanych w powyższym przykładzie.

Podamy teraz formalną definicję, precyzującą nasze dotychczasowe rozważania.

Definicja 3.1 [Przestrzeń probabilistyczna]

Niech będą dane: niepusty zbiór Ω, pewna rodzina Σ podzbiorów zbioru Ω i funkcja P:Σ. Trójkę (Ω,Σ,P) nazywamy przestrzenią probabilistyczną, gdy zachodzą następujące warunki:

  1. ΩΣ,
  2. jeżeli zbiory A1,A2,A3,Σ, to i=1AiΣ,
  3. jeżeli A,BΣ, to ABΣ,
  4. jeżeli AΣ, to P(A)0,
  5. jeżeli zbiory A1,A2,A3,Σ są parami rozłączne, to:


P(i=1Ai)=i=1P(Ai),
  1. P(Ω)=1.

Elementy zbioru Ω nazywamy zdarzeniami elementarnymi, zaś elementy Σ - zdarzeniami (oczywiście zdarzenie elementarne ωΩ może być traktowane jako zdarzenie, o ile tylko 1-elementowy zbiór {ω} należy do Σ; tak jest w wielu przypadkach, ale nie zawsze!). Zbiór pusty reprezentuje zdarzenie niemożliwe, a zbiór Ω - zdarzenie pewne. Zdarzenie ΩA nazywamy zdarzeniem przeciwnym do zdarzenia A. Liczbę P(A) nazywamy prawdopodobieństwem zdarzenia A, zaś funkcję P -miarą probabilistyczną.

Podamy teraz (bez dowodu) kilka podstawowych własności przestrzeni probabilistycznych. Większość z nich (poza trzema ostatnimi) jest omawiana w szkole.

Twierdzenie 2.2

Niech (Ω,Σ,P) będzie przestrzenią probabilistyczną. Wtedy:

  1. P()=0.
  2. jeżeli AiAj= dla ij, to:


P(i=1nAi)=i=1nP(Ai),


  1. jeżeli A i B są takimi zdarzeniami, że AB, to:


P(B)=P(A)+P(BA),


  1. dla każdego zdarzenia A:


P(ΩA)=1P(A),


  1. jeżeli A i B są takimi zdarzeniami, że AB, to:


P(A)P(B),


  1. dla dowolnych zdarzeń A i B:


P(AB)=P(A)+P(B)P(AB),


  1. dla dowolnych zdarzeń A1,A2,A3,:


P(i=1Ai)i=1P(Ai),


  1. jeżeli A1A2A3, to:


limnP(An)=P(n=1An),


  1. jeżeli A1A2A3, to:


limnP(An)=P(n=1An).


W następnych punktach omówimy podstawowe przykłady przestrzeni probabilistycznych.

Schemat klasyczny

Omówimy najpierw najbardziej naturalną przestrzeń probabilistyczną, nazywaną schematem klasycznym.

Niech Ω będzie zbiorem skończonym, składającym się z n jednakowo prawdopodobnych (na razie w sensie potocznym) zdarzeń elementarnych, czyli niech:


Ω={ω1,,ωn}


oraz niech Σ składa się ze wszystkich podzbiorów zbioru Ω, czyli:


Σ=𝒫(Ω).


Jeżeli AΣ, to przyjmijmy:


P(A)=#An.


Jest oczywiste, że trójka (Ω,Σ,P) stanowi przestrzeń probabilistyczną. Z definicją tą spotykamy się po raz pierwszy w szkole średniej.

Schemat klasyczny jest modelem wielu zjawisk. Na przykład, przy rzucie kostką symetryczną możemy za Ω przyjąć zbiór liczb {1,2,3,4,5,6} - wtedy prawdopodobieństwo każdego zdarzenia elementarnego wynosi 16, gdy rzucamy dwiema kostkami symetrycznymi, za zbiór Ω bierzemy zbiór wszystkich 36 par utworzonych z liczb 1,2,3,4,5,6 - wtedy prawdopodobieństwo każdego zdarzenia elementarnego wynosi 136, zaś gdy startując w konkursie wybieramy jedno z 20 pytań, nasz zbiór Ω ma 20 elementów i prawdopodobieństwo zdarzenia elementarnego jest równe 120. We wszystkich tych przypadkach jest zupełnie naturalnym przyjęcie założenia, że wszystkie zdarzenia elementarne są jednakowo prawdopodobne.

Natomiast gdy kostka została sfałszowana (np. jedna ze ścianek jest nieco cięższa, tak aby "1" wypadała częściej niż "6"), schemat klasyczny nie jest odpowiednim modelem do opisu rzutu tą kostką. Jednak i wtedy można zbudować odpowiednią przestrzeń probabilistyczną - musimy sami odpowiednio określić prawdopodobieństwa zdarzeń elementarnych. Jeżeli na podstawie dłuższej "pracy" ze sfałszowaną kostką wiemy, jak często wypadają poszczególne wyniki, możemy zbudować odpowiednią przestrzeń w następujący sposób: biorąc Ω={1,2,3,4,5,6} określamy sześć liczb, na przykład:


p1=0.26;  p2=p3=p4=p5=0.15;  p6=0.14,


a następnie dla każdego zbioru AΣ=𝒫(Ω) definiujemy:


P(A)=i:ωiApi.


Łatwo teraz sprawdzić, że tak zbudowana trójka (Ω,Σ,P) jest przestrzenią probabilistyczną, przy czym istotne znaczenie ma to, że suma wszystkich liczb pi równa się 1, gdyż suma ta jest prawdopodobieństwem zdarzenia pewnego.

W schemacie klasycznym, zbiór interesujących nas zdarzeń Σ pokrywa się ze zbiorem wszystkich podzbiorów zbioru Ω. Odpowiada to sytuacji, gdy mamy pełną informację o przebiegu zjawiska. Czasem jednak dysponujemy jedynie częściową informacją - taką sytuację poznaliśmy w poprzednim punkcie (punkt Uzupelnic pdp|), gdy Tomek znał sumę oczek na obu kostkach, ale nie wiedział, jakie wyniki wypadły na każdej z nich. W takich przypadkach klasa zdarzeń Σ jest istotnie mniejsza niż 𝒫(Ω). Ogólny sposób budowy odpowiedniej przestrzeni probabilistycznej opisujemy poniżej.

Określamy zbiór zdarzeń elementarnych Ω oraz funkcję P jak w schemacie klasycznym, natomiast klasa zdarzeń Σ będzie określona w sposób następujący. Przypuśćmy, że:


Ω=S1Sr,


przy czym:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle S_i \cap S_j = \O\;\;\textrm{dla} \;\textrm{wszytkich} \; i, j \;\textrm{takich, że}\; 1 \le i < j \le r.}


Określamy Σ jako zbiór wszystkich możliwych sum, które można utworzyć biorąc dowolne zbiory spośród S1,,Sr. Wyraźnie widać, że powyższa konstrukcja spełnia warunki definicji Uzupelnic wy1.1|, a więc (Ω,Σ,P) jest przestrzenią probabilistyczną. Zauważmy ponadto, że konkretna przestrzeń tego typu była już omówiona w przykładzie ze strony {tomek} - mieliśmy wówczas rozkład:


Ω=S2S12.


Prawdopodobieństwo jako miara