Rachunek prawdopodobieństwa i statystyka/Wykład 3: Przestrzeń probabilistyczna I

From Studia Informatyczne

Podamy podstawowe definicje i własności pojęć stanowiących fundamenty rachunku prawdopodobieństwa. Wskażemy ścisły związek tych pojęć z pojęciem geometrycznym, jakim jest miara. Omówimy najważniejszy model przestrzeni probabilistycznej - tak zwany schemat klasyczny.

Definicja prawdopodobieństwa



Definicja prawdopodobieństwa, którą będziemy się posługiwać (i która jest obecnie w powszechnym użyciu) jest definicją aksjomatyczną. Na wykładzie 7 wspomnimy jednak o innym podejściu do tego zagadnienia. Aby ułatwić Czytelnikowi zrozumienie idei definicji aksjomatycznej, przeprowadzimy na wstępie pewne nieformalne rozumowania. Zaczniemy od analizy bardzo prostej sytuacji. Wyobraźmy sobie, że Marek rzuca wielokrotnie dwiema kostkami do gry i podaje przez telefon swojemu koledze Tomkowi uzyskaną sumę oczek, która jest liczbą z zakresu od 2 do 12. Na przykład, przy 10 rzutach Tomek mógłby zanotować:


4, 7, 5, 2, 6, 11, 7, 9, 9, 6.


Nie wydaje się, aby powyższy ciąg liczb wykazywał jakieś ciekawe prawidłowości, jednak przy większej liczbie prób, powiedzmy przy 100 podwójnych rzutach, Tomek zauważa, że pewne wyniki powtarzają się zdecydowanie częściej niż inne. Zaintrygowany próbuje zbadać rzecz dokładniej - postanawia powtórzyć doświadczenie kolegi. Oczywiście, może w tym celu rzucać wielokrotnie parą kostek i zapisywać sumy oczek, ale może też (po odłożeniu słuchawki) przeprowadzić symulację komputerową. Oto przykładowy ciąg, jaki może wtedy otrzymać:

11, 4, 7, 11, 4, 9, 7, 6, 9, 7, 8, 8, 12, 10, 6, 8, 6, 6, 6, 10, 7, 3, 6, 10, 5, 8, 6, 7, 8, 3, 5, 8, 7, 8, 7, 8, 7, 11, 12, 5, 8, 5, 8, 5, 10, 3, 5, 8, 9, 6, 3, 9, 5, 6, 10, 7, 10, 9, 9, 10, 5, 4, 10, 2, 6, 8, 3, 4, 3, 4, 9, 7, 9, 7, 7, 11, 7, 7, 8, 4, 5, 6, 6, 3, 8, 6, 6, 6, 7, 6, 5, 6, 4, 5, 3, 10, 11, 11, 8, 7.

Wyraźnie teraz widać, że najczęstszymi wynikami są: "6", "7" oraz "8", zaś najrzadziej pojawiało się "2" i "12". Tomek powtarza kilkakrotnie swoją symulację i chociaż za każdym razem otrzymuje inny ciąg wyników, powyższe spostrzeżenie pozostaje zawsze bez zmian.

Pomożemy Tomkowi wytłumaczyć powody, dla których tak się dzieje. Policzymy mianowicie prawdopodobieństwo, z jakim wypadają liczby "środkowe" - "6", "7" i "8" oraz prawdopodobieństwo, z jakim wypadają liczby będące liczbami "skrajnymi"- "2" i "12". Jednak wcześniej zastanowimy się, co właściwie dla nas znaczy słowo "prawdopodobieństwo".

Andriej Nikołajewicz Kołmogorow (1903-1987)Zobacz biografię
Enlarge
Andriej Nikołajewicz Kołmogorow (1903-1987)
Zobacz biografię
Sprawa definicji pojęcia prawdopodobieństwa nie jest bynajmniej banalna. Absorbowała ona uwagę wielu wybitnych matematyków w okresie ostatnich 300 lat i chociaż jeszcze dzisiaj wzbudza pewne kontrowersje w niektórych środowiskach naukowych, to z matematycznego punktu widzenia sprawa jest już dobrze zbadana. Podamy za chwilę pełną formalną definicję, wzorowaną na pomyśle Kołmogorowa sprzed 70 lat, jednak najpierw doprecyzujemy pewne intuicje, wykorzystując opisaną powyżej zabawę z kostkami.

W naszym przypadku interesują nas zdarzenia odpowiadające wartości sumy oczek na dwóch kostkach. Oznaczmy zbiór interesujących nas zdarzeń literą \Sigma. Jest wiele zdarzeń należących do \Sigma - są nimi na przykład zdarzenia, powiedzmy S_2,   S_3,   S_4,   \dots, S_{12}, w których suma oczek jest dokładnie jedną z liczb od 2 do 12. Oprócz tych 11 zdarzeń mogą nas interesować także inne zdarzenia, na przykład zdarzenie A, w którym suma oczek jest jedną z liczb 6, 7 lub 8, albo zdarzenie B, w którym suma oczek nie jest równa ani 2, ani 12. Te dwa ostatnie zdarzenia mogą być wyrażone jako, odpowiednio, alternatywa zdarzeń S_6, S_7, S_8 oraz negacja alternatywy zdarzeń S_2 z S_{12}. Do zbioru \Sigma należą też dwa istotne, chociaż niezbyt ciekawe, zdarzenia: tak zwane zdarzenie niemożliwe (na przykład, że suma oczek na dwóch kostkach wynosi 13) oraz zdarzenie pewne (na przykład, że suma oczek jest liczbą całkowitą).

Chcemy teraz każdemu zdarzeniu przypisać liczbę określającą jego prawdopodobieństwo. Mamy więc do czynienia z funkcją (patrz wykład z Logiki i teorii mnogości), oznaczmy ją literą P, która zdarzeniom przyporządkowuje liczby. Możemy więc napisać:


P\colon \Sigma \ni S \longrightarrow P(S) \in \mathbb R.


Zanim powiemy, jak wyznaczyć funkcję P, zwróćmy uwagę, że powinna mieć ona kilka charakterystycznych własności. Na przykład, nasza intuicja podpowiada, że prawdopodobieństwo musi być liczbą nieujemną, a więc wartości funkcji P powinny być nieujemne. Zgodnie z intuicją, wartość funkcji odpowiadająca zdarzeniu niemożliwemu musi być równa 0. Rozsądnie jest też przyjąć, że zdarzenie pewne ma prawdopodobieństwo równe 1 (100\%, gdy wolimy używać procentów). Najistotniejszym jednak warunkiem, który musi spełniać nasza funkcja P, jest żądanie, aby prawdopodobieństwo alternatywy zdarzeń równało się sumie prawdopodobieństw tych zdarzeń, oczywiście pod warunkiem, że zdarzenia te wzajemnie się wykluczają. Założenie to, zwane zasadą addytywności, oznacza natychmiast, że:


P(A) = P(S_6) + P(S_7) + P(S_8).


Potrafimy także wtedy pokazać, że:


P(B) = 1 - (P(S_2) + P(S_{12})).


Aby policzyć konkretne wartości prawdopodobieństw P(S) dla wszystkich zdarzeń S \in \Sigma, musimy wniknąć nieco głębiej w naturę badanego zjawiska. Spróbujmy najpierw odpowiedzieć na pytanie o to, czym się różnią od siebie zdarzenia, na przykład, S_2 oraz S_6, i dlaczego pierwsze z nich zachodzi rzadziej niż drugie. Otóż zdarzenie S_2 zachodzi dokładnie wtedy, gdy na obu kostkach wypadnie "1", natomiast zdarzeniu S_5 odpowiadają następujące cztery wyniki:


(1,4),\; (2,3),\; (3,2),\; (4,1).


Wyraźnie więc widać, że zdarzenie S_5 ma szansę zajść cztery razy częściej niż zdarzenie S_2.

Rozwijając tę myśl dalej zauważmy, że każde zdarzenie z interesującego nas zbioru \Sigma może być utożsamione ze zbiorem par liczb określających wyniki uzyskane na obu kostkach. Niech \Omega oznacza zbiór tych par, czyli:


\Omega = \{(i,j): i,j = 1,2, \dots ,6\}.


Elementy zbioru \Omega będą w dalszym ciągu nazywane zdarzeniami elementarnymi. Tak więc każde zdarzenie S składa się ze zdarzeń elementarnych, jest więc w istocie podzbiorem zbioru \Omega, przy czym zdarzenie niemożliwe utożsamiamy ze zbiorem pustym, natomiast zdarzenie pewne z całym zbiorem \Omega. Zauważmy jednak, że nie wszystkie zdarzenia elementarne należą do \Sigma. Na przykład para (2,3) jest co prawda elementem S_5, ale przez Tomka, który zna jedynie sumy oczek, nie jest identyfikowana. Natomiast zdarzenia elementarne (1,1) oraz (6,6) odpowiadają zdarzeniom S_2 oraz S_{12} należącym do \Sigma.

Można łatwo wyznaczyć prawdopodobieństwo każdego zdarzenia elementarnego - ponieważ jest 36 takich zdarzeń i wszystkie one tworzą zdarzenie pewne \Omega, którego prawdopodobieństwo jest równe 1, więc zakładając, że prawdopodobieństwo każdego z nich jest takie samo i równa się, powiedzmy, x, z zasady addytywności otrzymujemy:


36 x = 1,


a stąd:


x =\frac{1}{36}.


Korzystając dalej z tej zasady, możemy policzyć prawdopodobieństwo każdego zdarzenia S \in \Sigma, a to oznacza poprawne określenie funkcji P. Na przykład:


P(S_5) = \frac{5}{36},\; P(S_7) = \frac{6}{36}, \; P(A)   = \frac{5}{36} + \frac{6}{36} + \frac{5}{36} = \frac{16}{36},


P(B) = 1  - \left(\frac{1}{36} + \frac{1}{36} \right) = \frac{34}{36}.


Przyjrzyjmy się jeszcze raz, teraz nieco w innej kolejności, naszemu postępowaniu. Mając konkretny problem, określiliśmy najpierw pewien zbiór \Omega, nazwany zbiorem zdarzeń elementarnych. Następnie wyróżniliśmy zbiór interesujących nas zdarzeń \Sigma w ten sposób, że każde ze zdarzeń jest zbudowane ze zdarzeń elementarnych, więc zdarzenia można traktować jako podzbiory zbioru \Omega. Określiliśmy wreszcie funkcję P\colon \Sigma \longrightarrow \mathbb R, która zdarzeniom przyporządkowuje ich prawdopodobieństwa. Zauważyliśmy przy tym, że zbiór zdarzeń \Sigma oraz funkcja P muszą posiadać pewne uniwersalne własności.

Okazuje się, że jest to podejście typowe. Gdy mamy rozpatrywać określoną sytuację, w której uwzględniamy losowość, powinniśmy w zasadzie postępować według powyższego schematu, wyznaczając kolejno \Omega, \Sigma oraz P. Oczywiście, obiekty te mogą mieć zupełnie inną postać niż w naszym przykładzie. Ponadto, w pewnych sytuacjach zbiór zdarzeń elementarnych może być nieskończony, co już wyklucza możliwość zdefiniowania P tak jak poprzednio. Niemniej jednak, w każdej sytuacji zbiór zdarzeń \Sigma oraz funkcja P powinny mieć podobne własności do tych sugerowanych w powyższym przykładzie.

Podamy teraz formalną definicję, precyzującą nasze dotychczasowe rozważania.

Definicja 3.1 [Przestrzeń probabilistyczna]

Niech będą dane: niepusty zbiór \Omega, pewna rodzina \Sigma podzbiorów zbioru \Omega i funkcja P\colon\Sigma\longrightarrow \mathbb R. Trójkę (\Omega ,\Sigma ,P) nazywamy przestrzenią probabilistyczną, gdy zachodzą następujące warunki:

1.
\Omega \in \Sigma,

2. jeżeli zbiory A_1,A_2,A_3,\dots \in \Sigma , to \bigcup_{i=1}^{\infty}A_i \in \Sigma,

3. jeżeli A,B \in \Sigma, to A\setminus B \in \Sigma,

4. jeżeli A \in \Sigma, to P(A) \ge 0,

5. jeżeli zbiory A_1,A_2,A_3,\dots \in  \Sigma są parami rozłączne, to:

P(\bigcup_{i=1}^{\infty}A_i) = \sum _{i=1}^{\infty}P(A_i),
6. P(\Omega) = 1.

Elementy zbioru \Omega nazywamy zdarzeniami elementarnymi, zaś elementy \Sigma - zdarzeniami (oczywiście zdarzenie elementarne \omega  \in \Omega może być traktowane jako zdarzenie, o ile tylko 1-elementowy zbiór \{\omega  \} należy do \Sigma; tak jest w wielu przypadkach, ale nie zawsze!). Zbiór pusty reprezentuje zdarzenie niemożliwe, a zbiór \Omega - zdarzenie pewne. Zdarzenie \Omega \setminus A nazywamy zdarzeniem przeciwnym do zdarzenia A. Liczbę P(A) nazywamy prawdopodobieństwem zdarzenia A, zaś funkcję P -miarą probabilistyczną.

Podamy teraz (bez dowodu) kilka podstawowych własności przestrzeni probabilistycznych. Większość z nich (poza trzema ostatnimi) jest omawiana w szkole.

Twierdzenie 3.2

Niech (\Omega,\Sigma ,P) będzie przestrzenią probabilistyczną. Wtedy:

1.
\displaystyle P(\emptyset)=0,


2. jeżeli A_{i}\cap A_{j} = \emptyset dla i\neq j, to:


P(\bigcup_{i=1}^{n}A_i) = \sum _{i=1}^{n}P(A_i),


3. jeżeli A i B są takimi zdarzeniami, że A\subset B, to:


P(B)=P(A)+P(B\setminus A),


4. dla każdego zdarzenia A:


P(\Omega \backslash A)=1-P(A),


5. jeżeli A i B są takimi zdarzeniami, że A\subset B, to:


P(A)\le P(B),


6. dla dowolnych zdarzeń A i B:


P(A\cup B)=P(A)+P(B)-P(A\cap B),


7. dla dowolnych zdarzeń A_1, A_2, A_3,\dots:


P(\bigcup_{i=1}^{\infty}A_i) \le \sum_{i=1}^{\infty}P(A_i),


8. jeżeli A_{1}\subset A_{2} \subset A_3 \subset \dots, to:


\lim_{n \rightarrow \infty} P(A_n) =P(\bigcup_{n=1}^{\infty}A_n),


9. jeżeli A_{1}\supset A_{2}\supset A_3\supset\dots, to:


\lim_{n \rightarrow \infty} P(A_n) =P(\bigcap_{n=1}^{\infty}A_n).


W następnych punktach omówimy podstawowe przykłady przestrzeni probabilistycznych.

Schemat klasyczny



Omówimy najpierw najbardziej naturalną przestrzeń probabilistyczną, nazywaną schematem klasycznym.

Niech \Omega będzie zbiorem skończonym, składającym się z n jednakowo prawdopodobnych (na razie w sensie potocznym) zdarzeń elementarnych, czyli niech:


\Omega =\{\omega _{1},\dots  ,\omega _{n}\}


oraz niech \Sigma składa się ze wszystkich podzbiorów zbioru \Omega, czyli:


\Sigma ={\cal P}(\Omega ).


Jeżeli A\in \Sigma, to przyjmijmy:


P(A)={\# A\over n}.


Jest oczywiste, że trójka (\Omega ,\Sigma ,P) stanowi przestrzeń probabilistyczną. Z definicją tą spotykamy się po raz pierwszy w szkole średniej.

Schemat klasyczny jest modelem wielu zjawisk. Na przykład, przy rzucie kostką symetryczną możemy za \Omega przyjąć zbiór liczb \{1,2,3,4,5,6\} - wtedy prawdopodobieństwo każdego zdarzenia elementarnego wynosi \frac{1}{6}, gdy rzucamy dwiema kostkami symetrycznymi, za zbiór \Omega bierzemy zbiór wszystkich 36 par utworzonych z liczb 1,2,3,4,5,6 - wtedy prawdopodobieństwo każdego zdarzenia elementarnego wynosi \frac{1}{36}, zaś gdy startując w konkursie wybieramy jedno z 20 pytań, nasz zbiór \Omega ma 20 elementów i prawdopodobieństwo zdarzenia elementarnego jest równe \frac{1}{20}. We wszystkich tych przypadkach jest zupełnie naturalnym przyjęcie założenia, że wszystkie zdarzenia elementarne są jednakowo prawdopodobne.

Natomiast gdy kostka została sfałszowana (np. jedna ze ścianek jest nieco cięższa, tak aby "1" wypadała częściej niż "6"), schemat klasyczny nie jest odpowiednim modelem do opisu rzutu tą kostką. Jednak i wtedy można zbudować odpowiednią przestrzeń probabilistyczną - musimy sami odpowiednio określić prawdopodobieństwa zdarzeń elementarnych. Jeżeli na podstawie dłuższej "pracy" ze sfałszowaną kostką wiemy, jak często wypadają poszczególne wyniki, możemy zbudować odpowiednią przestrzeń w następujący sposób: biorąc \Omega = \{1,2,3,4,5,6\} określamy sześć liczb, na przykład:


p_1 = 0.26;\ \ p_2 = p_3 = p_4 = p_5 = 0.15; \ \ p_6 = 0.14,


a następnie dla każdego zbioru A \in \Sigma = {\cal P}(\Omega ) definiujemy:


P(A) =  \sum_{i: \omega_i \in A}p_i.


Łatwo teraz sprawdzić, że tak zbudowana trójka (\Omega,\Sigma ,P) jest przestrzenią probabilistyczną, przy czym istotne znaczenie ma to, że suma wszystkich liczb p_i równa się 1, gdyż suma ta jest prawdopodobieństwem zdarzenia pewnego.

W schemacie klasycznym, zbiór interesujących nas zdarzeń \Sigma pokrywa się ze zbiorem wszystkich podzbiorów zbioru \Omega. Odpowiada to sytuacji, gdy mamy pełną informację o przebiegu zjawiska. Czasem jednak dysponujemy jedynie częściową informacją - taką sytuację poznaliśmy w poprzednim punkcie (punkt Definicja Prawdopodobieństwa), gdy Tomek znał sumę oczek na obu kostkach, ale nie wiedział, jakie wyniki wypadły na każdej z nich. W takich przypadkach klasa zdarzeń \Sigma jest istotnie mniejsza niż {\cal P}(\Omega ). Ogólny sposób budowy odpowiedniej przestrzeni probabilistycznej opisujemy poniżej.

Określamy zbiór zdarzeń elementarnych \Omega oraz funkcję P jak w schemacie klasycznym, natomiast klasa zdarzeń \Sigma będzie określona w sposób następujący. Przypuśćmy, że:


\Omega  =  S_1  \cup \dots \cup S_r,


przy czym:


S_i \cap S_j = \emptyset\;\;\textrm{dla} \;\textrm{wszytkich} \; i, j \;\textrm{takich, że}\; 1  \le i < j \le r.


Określamy \Sigma jako zbiór wszystkich możliwych sum, które można utworzyć biorąc dowolne zbiory spośród S_1,  \dots, S_r. Wyraźnie widać, że powyższa konstrukcja spełnia warunki definicji 3.1, a więc (\Omega,\Sigma  ,P) jest przestrzenią probabilistyczną. Zauważmy ponadto, że konkretna przestrzeń tego typu była już omówiona w przykładzie ze strony {tomek} - mieliśmy wówczas rozkład:


\Omega  =  S_2 \cup \dots \cup S_{12}.

Prawdopodobieństwo jako miara

W punkcie Definicja prawdopodobieństwa (patrz definicja 3.1) określiliśmy aksjomatycznie przestrzeń probabilistyczną oraz podaliśmy kilka przykładów takich przestrzeni. Okazuje się, że prawdopodobieństwo jest szczególnym przypadkiem tak zwanej miary, a cały współczesny rachunek prawdopodobieństwa ma swoje teoretyczne podstawy nierozerwalnie związane z teorią miary. Ograniczymy się tutaj do podania jedynie niezbędnych informacji dotyczących teorii miary.



Mieliście zapewne sposobność wielokrotnie obliczać długości odcinków, łuków, a może nawet innych krzywych. Obliczaliście też pola różnych figur płaskich oraz pola powierzchni i objętości figur przestrzennych, chociaż przypuszczalnie nie zastanawialiście się zbyt często, co to jest właściwie długość, pole lub objętość. Pojęcia te wydają się przecież tak naturalne, że nie było potrzeby, żeby zajmować się ich naturą. Zastanówmy się jednak teraz nad tymi sprawami, stawiając najpierw dwa, z pozoru naiwne, pytania:

  • czy każdy podzbiór leżący na prostej ma określoną długość?
  • czy każda figura zawarta w płaszczyźnie ma pole?

Pytania te mogą wydawać się z początku dość sztuczne - przecież wszystkie figury na płaszczyźnie, które znamy, mają chyba pola (nawet okrąg lub prosta mają przecież pola równe 0). Okazuje się jednak, iż jesteśmy w błędzie - otóż są figury na płaszczyźnie, dla których nie można w sposób rozsądny określić pola. Podobnie, są też zbiory zawarte w prostej, dla których nie możemy określić długości. Inna sprawa, że konstrukcja takich zbiorów nie jest łatwa i nie będziemy jej tu przytaczać. Aby jednak pokazać, gdzie mogą być problemy, zastanówmy się, jaką długość posiadają zbiory liczb wymiernych oraz liczb niewymiernych (patrz wykład z Logiki i teorii mnogości) należących do przedziału (0,1). Chociaż są to dobrze określone, rozłączne zbiory, mające w sumie długość równą 1, nie potrafimy dać rozsądnej odpowiedzi na nasze pytanie, dopóki nie ustalimy, co właściwie mamy na myśli, mówiąc długość zbioru. Podobnie powinniśmy wcześniej wyjaśnić pojęcia pola figury płaskiej oraz objętości figury przestrzennej. Sprawy te są dyskutowane na gruncie tak zwanej teorii miary.

Zanim jednak podamy odpowiednie definicje podkreślmy, że sprawa dotyczy bardzo istotnych problemów matematycznych, mających bezpośredni związek z zastosowaniami. W szczególności, współczesny rachunek prawdopodobieństwa i statystyka opierają się głównie na teorii miary.

Poniżej przeprowadzimy dość abstrakcyjne rozważania oraz podamy definicje tak zwanej \sigma-algebry oraz miary, a następnie wrócimy do poprzednio zasygnalizowanego problemu.

Zastanówmy się najpierw, jakie wspólne własności mają długość, pole oraz objętość, rozumiane (na razie) jedynie intuicyjnie. Przede wszystkim, możemy trzy te wielkości traktować jako funkcje, które odpowiednim podzbiorom przyporządkowują liczby rzeczywiste (ewentualnie nieskończoność). Funkcje te są nieujemne oraz addytywne, to znaczy że ich wartość dla sumy zbiorów rozłącznych A i B jest sumą ich wartości dla A oraz dla B. Wiemy także, że długość odcinka (0,1) jest równa 1 oraz że, podobnie, pole kwadratu o boku 1 oraz objętość sześcianu o krawędzi 1 także wynoszą 1. Interesuje nas to, czy funkcje te są określone dla wszystkich podzbiorów, odpowiednio, prostej, płaszczyzny i przestrzeni. Tak czy inaczej wiemy, że są one określone dla szerokiej klasy zbiorów. Na przykład, pole jest określone dla wszystkich prostokątów, trójkątów, kół oraz dla zbiorów, które są skończonymi sumami, przecięciami lub różnicami tych zbiorów. Zwróćmy jeszcze uwagę na to, że wspomniane wyżej własności pozwalają, między innymi, na obliczanie pól prostokątów, które można zbudować z kwadratu o boku 1, prostokątów o bokach mających długości wymierne, pewnych trójkątów (jako połówek prostokątów) i tak dalej. Intuicje te są podstawą dla zrozumienia znaczenia poniższych definicji.

Niech będzie dany niepusty zbiór \Omega. Rozważmy rodzinę \Sigma podzbiorów zbioru \Omega, czyli \Sigma  \subset {\cal P}(\Omega).

Definicja 3.3 [\sigma-algebra]

Mówimy, że rodzina \Sigma jest \sigma-algebrą, jeżeli:

1. \displaystyle \Omega \in \Sigma,

2. dla dowolnych zbiorów A_1,A_2,A_3,\dots \in \Sigma:


\bigcup_{i=1}^{\infty}A_i \in \Sigma,


3. dla dowolnych zbiorów A,B \in \Sigma:
A\setminus  B \in \Sigma.


Oczywiście widać, że powyższa definicja składa się z trzech pierwszych warunków nałożonych na przestrzeń probabilistyczną w definicji 3.1. Zauważmy także, że rozważamy tutaj sumy nieskończonej liczby zbiorów, składające się jednak tylko z przeliczalnie wielu składników. Przypominamy, że zbiór jest przeliczalny (patrz wykład z Logiki i teorii mnogości), jeżeli jego elementy potrafimy ustawić w ciąg nieskończony. Przeliczalnymi zbiorami są, na przykład, zbiór liczb naturalnych oraz zbiór liczb całkowitych, gdyż ich elementy można ustawić w następujące ciągi:


0,1,2,3,\dots\;\;\textrm{i}\;\; 0,1,-1,2,-2,3,-3, \dots


Można też udowodnić, że zbiór liczb wymiernych jest przeliczalny, natomiast zbiór liczb rzeczywistych jest przykładem zbioru, który nie jest przeliczalny. Bardziej obrazowo można powiedzieć, że zbiory przeliczalne, chociaż nieskończone, mogą być przeglądnięte - element po elemencie (stosunkowo łatwo można sobie wyobrazić, że zbiór liczb rzeczywistych nie posiada takiej własności). W teorii miary i w rachunku prawdopodobieństwa założenie, że pewne sumy oraz iloczyny mają przeliczalnie wiele składników, jest bardzo istotne. Wprost z definicji 3.3 można również pokazać, że zbiór pusty jest elementem \sigma-algebry, czyli:


\emptyset \in \Sigma,


oraz że \sigma-algebra jest zamknięta również ze względu na iloczyn, to znaczy:


A_1,A_2,A_3,\dots \in \Sigma\Longrightarrow \bigcap_{i=1}^{\infty}A_i \in \Sigma.


Powyższa własność, jak również własność 2 z definicji 3.3, zachodzi także wtedy, gdy rozważamy skończone ciągi zbiorów A_1,A_2,A_3,\dots, A_n.

Zamiast mówić, że zbiór A należy do \sigma-algebry \Sigma, mówi się często, że A jest \Sigma-mierzalny lub po prostu mierzalny, jeżeli nie ma wątpliwości, o jaką \sigma-algebrę w danym momencie chodzi. Używa się też sformułowania przestrzeń mierzalna, na określenie pary (\Omega,\Sigma), gdy \Sigma jest \sigma-algebrą na \Omega.

Trywialnymi przykładami \sigma-algebr są: rodzina {\cal P}(\Omega) oraz 2-elementowa rodzina \{\emptyset, \Omega\}. Z drugiej strony zauważmy, że wiele znanych klas zbiorów nie stanowi \sigma-algebr. Jedną z takich klas jest klasa wszystkich zbiorów otwartych w \mathbb R^n. Przypominamy[AM2], że zbiór G \subset \mathbb R^n nazywamy otwartym, jeżeli dla każdego punktu a = (a_1,\dots, a_n) \in G istnieje liczba \varepsilon > 0 taka, że jeżeli punkt x = (x_1,\dots, x_n) spełnia warunek:


|x_i - a_i| < \varepsilon \;\;\textrm{dla wszystkich } i = 1,\dots, n,


to x \in G. Uzupełnienia zbiorów otwartych nazywa się zbiorami domkniętymi. Bardziej obrazowo można powiedzieć, że zbiory otwarte to zbiory nie zawierające swojego brzegu, natomiast zbiory domknięte to zbiory zawierające wszystkie swoje punkty brzegowe.

Félix Édouard Justin Émile Borel (1871-1956)Zobacz biografię
Enlarge
Félix Édouard Justin Émile Borel (1871-1956)
Zobacz biografię
Henri Léon Lebesgue (1875-1941)Zobacz biografię
Enlarge
Henri Léon Lebesgue (1875-1941)
Zobacz biografię

Przykład 3.4 [Zbiory borelowskie]

Bardzo ważną \sigma-algebrą jest rodzina {\cal B}(\mathbb R^n), zdefiniowana jako najmniejsza \sigma-algebra zawierająca wszystkie otwarte podzbiory przestrzeni \mathbb R^n. Elementy tej rodziny nazywane są zbiorami borelowskimi.

Tak więc każdy zbiór otwarty jest zbiorem borelowskim, a także zbiory domknięte, jako uzupełnienia zbiorów otwartych, są też zbiorami borelowskimi -w szczególności, zbiorami borelowskimi są zbiory 1-punktowe. Dalej, zbiór liczb wymiernych \mathbb Q\subset \mathbb R jest borelowski, jako

przeliczalna suma zbiorów 1-punktowych, a w takim razie liczby niewymierne także stanowią zbiór borelowski \mathbb R\setminus \mathbb Q.

Przykład 3.5 [Zbiory mierzalne w sensie Lebesgue'a]

Nieco większą \sigma-algebrą niż \mathcal B(\mathbb R^n) jest \sigma-algebra \mathcal L(\mathbb R^n), zwana \sigma-algebrą zbiorów mineralnych w sensie Lebesgue'a albo w skrócie \sigma-algebrą zbiorów mierzalnych. Nie podajemy tutaj formalnej definicji, wspominamy jedynie, że \mathcal L(\mathbb R^n) powstaje z \mathcal B(\mathbb R^n) przez dołączenie

podzbiorów tych zbiorów borelowskich, które w pewnym sensie są bardzo chude w przestrzeni \mathbb R^n. Okazuje się, że istnieją podzbiory \mathbb R^n nie będące elementami \mathcal L(\mathbb R^n).

Niech będą dane niepusty zbiór \Omega, \sigma-sigma algebra \Sigma \subset \mathcal P(\Omega) oraz funkcja:


\mu\colon  \Sigma \longrightarrow \mathbb R \cup \{\infty\}.


Definicja 3.6 [Miara]

Mówimy, że funkcja \mu jest miarą, jeżeli:

1. dla każdego zbioru A \in \Sigma:

\mu(A) \ge 0,

2.

\mu(\O) = 0,
3. jeżeli zbiory A_1,A_2,A_3,\dots \in \Sigma są parami rozłączne , to:

\mu(\bigcup_{i=1}^{\infty}A_i)  = \sum_{i=1}^{\infty}\mu(A_i).

Porównując powyższą definicję z definicją 3.1 widzimy natychmiast, że funkcja P tam określona jest miarą. Zauważmy jednak, że w definicji 3.1 założyliśmy dodatkowo, że P(\Omega) = 1.

Okazuje się, że długość, pole i objętość mogą być traktowane jako miary w przestrzeniach \mathbb R, \mathbb R^2 oraz \mathbb R^3. Jednym z ważniejszych twierdzeń w teorii miary jest następujące:

Twierdzenie 3.7 [Miara Lebesgue'a]

Ustalmy wymiar przestrzeni n. Wówczas istnieje dokładnie jedna miara (zwana miarą Lebesgue'a):


\mu = \mu_n\colon \mathcal L(\mathbb R^n) \longrightarrow \mathbb R\cup \{\infty \},


spełniająca następujące warunki:

1. jeżeli [0,1]^n oznacza n-krotny iloczyn kartezjański (patrz wykład z Logiki i teorii mnogości) przedziału [0,1], to:


\mu([0,1]^n) =  1,


2. dla każdego A \in \mathcal L(\mathbb R^n) oraz p \in \mathbb R^n:


\mu(A+p) = \mu(A),


co oznacza niezmienniczość miary względem przesunięcia.
Uwaga 3.8
Można pokazać, że miary Lebesgue'a nie można rozszerzyć na \sigma-algebrę \mathcal P(\mathbb R^n).

Powyższe twierdzenie oraz uwagę można rozumieć w następujący sposób: długość podzbioru prostej - \mu_1, pole figury płaskiej - \mu_2, czy też objętość bryły przestrzennej - \mu_3, daje się określić dla bardzo wielu, ale nie dla wszystkich, zbiorów.

Uwaga 3.9
Ponieważ \mathcal B(\mathbb R^n) \subset \mathcal L(\mathbb R^n), więc miara Lebesgue'a \mu indukuje miarę na \mathcal B(\mathbb R^n).

Powróćmy teraz do pytania o długość zbioru liczb wymiernych z odcinka (0,1) i zauważmy, że (w związku z powyższym) sprowadza się ono do wyznaczenia \mu_1(\mathbb Q \cap (0,1)) - wiemy już, że zbiór ten jest mierzalny. Można udowodnić, co jest dla nas oczywiste, że miara Lebesgue'a zbiorów 1-punktowych jest równa 0, więc nasz zbiór ma też miarę równą 0 (jako przeliczalna suma zbiorów o mierze 0). W takim razie, zbiór liczb niewymiernych z odcinka (0,1) ma miarę \mu_1 równą 1.

Zauważmy na koniec, że gdybyśmy w definicji 3.3 i definicji 3.6 ograniczyli się tylko do sum skończonych, nie potrafilibyśmy określić miary dla wielu ważnych zbiorów (w tym dla tych dyskutowanych przed chwilą), co istotnie zubożyłoby teorię oraz możliwość jej stosowania.