Rachunek prawdopodobieństwa i statystyka/Wykład 8: Przegląd ważniejszych rozkładów

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Omówimy kilka najczęściej spotykanych w zastosowaniach rozkładów dyskretnych i ciągłych, charakteryzujących często zmienne losowe związane ze zliczaniem oraz czasem oczekiwania na szczególne zdarzenia. Jednak najważniejszy rozkład, tak zwany rozkład normalny, zostanie omówiony w następnym rozdziale.

W poprzednich wykładach "uprawialiśmy" dość ogólną teorię rachunku prawdopodobieństwa, dlatego teraz zajmiemy się aspektem bardziej praktycznym i omówimy kilka podstawowych rozkładów oraz wskażemy na niektóre typowe sytuacje, w których rozkłady te występują. Pragniemy jednak podkreślić, iż rozważane tutaj rozkłady nie wyczerpują wszystkich ważnych, występujących w literaturze przedmiotu rozkładów prawdopodobieństwa.

Rozkłady związane ze zliczaniem

  • Ile eksperymentów zakończy się sukcesem?
  • Ile jest zdarzeń sprzyjających wylosowaniu "naszych" numerów w grze liczbowej?
  • Ile zgłoszeń napływa średnio w ciągu godziny do pogotowia ratunkowego w godzinach nocnych?
  • Ile wypadków śmiertelnych ma miejsce podczas kąpieli w morzu?

Aby umieć odpowiadać na te i podobne pytania, najpierw należy zawsze zdać sobie sprawę z natury rozważanego zjawiska, czyli, mówiąc bardziej precyzyjnie, z charakteru rozkładu prawdopodobieństwa odpowiadającego danej sytuacji. Okazuje się, że wiele zupełnie różnych od siebie zjawisk zachodzi według podobnych schematów - na przykład jest w istocie losowaniem bez zwracania lub ze zwracaniem. Omówimy teraz kolejno kilka podstawowych rozkładów, odpowiedzialnych za większość tego typu sytuacji.

Na początku powtórzymy poznaną już wcześniej (patrz przykład 6.6) definicję rozkładu dwumianowego.

Rozkład dwumianowy

Rozkład P nazywamy rozkładem dwumianowym, jeżeli istnieją liczby n>0 oraz p i q takie, że 0<p,q<1, p+q=1 oraz zachodzi równość:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle P(k) = \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)p^kq^{n-k}\;\; \mbox{ dla } k = 0,1,\dots,n. }

Następujący wykres przedstawia rozkład dwumianowy z parametrami n=12 i p=0.6:

<flash>file=Rp.1.81.swf|width=350|height=350</flash>

Wzór dwumienny Newtona pozwala stwierdzić, że k=0nP(k)=1, a więc powyższa równość rzeczywiście określa rozkład P w sposób jednoznaczny (jest to oczywiście rozkład dyskretny). Poprzednio mieliśmy już okazję poznać różne sytuacje, w których on występuje - następujące twierdzenie formalizuje nasze dotychczasowe rozważania


Twierdzenie 8.1

Niech X1,,Xn będą niezależnymi zmiennymi losowymi o takim samym rozkładzie dwupunktowym. Wtedy suma:


Sn=X1++Xn


ma rozkład dwumianowy.

Dowód

Zdarzenie {Sn=k} jest sumą rozłącznych zdarzeń polegających na tym, że dokładnie k spośród zmiennych losowych X1,,Xn przyjmuje wartość 1, a więc pozostałe nk zmiennych przyjmuje wartość 0. Niech Ai1,,ik będzie jednym z takich zdarzeń, gdzie i1,,ik oznaczają numery tych zmiennych, które przyjmują wartość 1. Z kolei każde zdarzenie Ai1,,ik jest iloczynem n zdarzeń postaci {Xj=εj}, gdzie εj=1 lub εj=0, a prawdopodobieństwa tych zdarzeń są równe odpowiednio p i q. Z niezależności zmiennych X1,,Xn wynika, że:


P(Ai1,,ik)=pkqnk.


Ponieważ wskaźniki i1,,ik można wybrać na Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)} sposobów, więc:


P(A)=P(i1,,ikAi1,,ik)=i1,,ikP(Ai1,,ik)


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle = \sum_{i_1, \dots, i_k}p^kq^{n-k} = \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)p^kq^{n-k}. }


Przykład 8.2 [Losowanie ze zwracaniem]

Przypuśćmy, że pewna populacja składa się z N elementów. Niech p będzie prawdopodobieństwem tego, że dany element z tej populacji ma pewną własność, powiedzmy własność W. Losujemy ze zwracaniem n elementów i oznaczamy przez X liczbę tych spośród nich, które mają własność W. Widać, że zmienna losowa X ma rozkład dwumianowy.

Przypomnimy teraz wyprowadzone w ćwiczeniu 7.2 wzory na nadzieję matematyczną i wariancję zmiennej losowej o rozkładzie dwumianowym. Wyrażają się one następującymi wzorami:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle {\Bbb E}(X) = np, \hspace{1.5cm} {\Bbb D}^2(X) = npq. }


W celu wyrobienia sobie intuicji związanej z rozkładem dwumianowym, proponujemy obejrzeć animację:

animacja 81.gif

Rozkład wielomianowy

Uogólnieniem rozkładu dwumianowego jest rozkład wielomianowy.

Rozkład P nazywamy rozkładem wielomianowym, jeżeli istnieje liczba naturalna n oraz liczby pi>0, i=1.r, r>1, takie, że i=1rpi=1 oraz dla wszystkich układów liczb całkowitych nieujemnych k1,,kr, dla których i=1rki=n, zachodzi równość:


P(k1,,kr)=n!k1!kr!p1k1prkr.


Widzimy oczywiście, że gdy r=2, rozkład wielomianowy jest w istocie równoważny rozkładowi dwumianowemu (kładziemy p1=p i p2=q).

Wyobraźmy sobie, że pewien eksperyment powtarzamy n razy, przy czym spełnione są następujące warunki:

  1. każdy eksperyment może dać dokładnie r różnych wyników, powiedzmy "1",... , "r",
  2. prawdopodobieństwa poszczególnych wyników są w każdym eksperymencie zawsze takie same - oznaczamy je przez pi, i=1r,
  3. eksperymenty są niezależne od siebie.

Niech X1,,Xr oznaczają odpowiednio liczbę eksperymentów zakończonych wynikiem "1", ... , "r". Wtedy łatwo stwierdzić, stosując indukcję, że wektor losowy (X,,Xr) ma rozkład wielomianowy.

Rozkład Poissona

Siméon Denis Poisson (1781-1840)
Zobacz biografię

Rozkład

P

jest rozkładem Poissona, jeżeli istnieje taka liczba

λ>0

, że:


P(k)=eλλkk! dla k=0,1,2,


Poniższy wykres przedstawia rozkład Poissona o parametrze λ=5.

<flash>file=Rp.1.82.swf|width=350|height=350</flash>

Okazuje się, że wiele zjawisk podlega właśnie rozkładowi Poissona. Kolejne twierdzenie mówi o tym, że jest on w pewnym sensie granicą rozkładów dwumianowych. W szczególności, gdy mamy do czynienia z dużą (n>100) liczbą niezależnych prób Bernoulliego, z jednakowym, małym (p<0.1) prawdopodobieństwem sukcesu każda, to liczba sukcesów ma niemal dokładnie rozkład Poissona z parametrem λ=np. Zgodność taka została zaobserwowana w wielu konkretnych sytuacjach praktycznych. Co więcej, istnieją dość dokładne oszacowania błędu, jaki popełniamy przybliżając rozkład dwumianowy rozkładem Poissona. W tym miejscu poprzestaniemy jedynie na wykazaniu prostego twierdzenia wskazującego na możliwość takiego przybliżania oraz na podaniu danych liczbowych ilustrujących jego dokładność.

Twierdzenie 8.3

Niech liczby pn>0 tworzą taki ciąg, że:


limnnpn=λ>0


oraz niech k będzie nieujemną liczbą naturalną. Wtedy:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \lim_{n\rightarrow \infty} \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)p_n^k(1 - p_n)^{n-k} = e^{-\lambda}\,\frac{\lambda^k}{k!}. }


Dowód

Oznaczając λn=npn, dostajemy równość:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \left(\begin{array} {@{}c@{}}n\\k\end{array} \right)p_n^k(1-p_n)^{n-k} = \frac{\lambda_n^k}{k!}\cdot\frac{n(n-1)\cdot \dots \cdot(n-k+1)}{n^k}\cdot\left(1- \frac{\lambda_n}{n}\right)^n\cdot \left(1-\frac{\lambda_n}{n}\right)^{-k}\!\!. }


Ponieważ k jest ustalone, zatem ostatni czynnik zmierza do 1. Drugi czynnik jest równy:


1(11n)(1k1n),


a więc też zmierza do 1. Istotne są natomiast czynniki pierwszy oraz trzeci, które zmierzają odpowiednio do:


λkk!orazeλ.


Poniższa tabela porównuje rozkład dwumianowy z rozkładem Poissona.


Rozkład dwumianowy a rozkład Poissona
n=100, p=0,01 n=50, p=0,1 n=100,

p=0,1

rozkład rozkład rozkład rozkład rozkład rozkład
k dwum. Poissona dwum. Poissona dwum. Poissona
0 0,3660 0,3679 0,0052 0,0067 0,0000 0,0000
1 0,3697 0,3679 0,0286 0,0337 0,0003 0,0005
2 0,1849 0,1839 0,0779 0,0842 0,0016 0,0023
3 0,0610 0,0613 0,1386 0,1404 0,0059 0,0076
4 0,0149 0,0153 0,1809 0,1755 0,0159 0,0189
5 0,0029 0,0031 0,1849 0,1755 0,0339 0,0378
6 0,0005 0,0005 0,1541 0,1462 0,0596 0,0631
7 0,0001 0,0001 0,1076 0,1044 0,0889 0,0901
8 0,0000 0,0000 0,0643 0,0653 0,1148 0,1126
9 0,0000 0,0000 0,0333 0,0363 0,1304 0,1251
10 0,0000 0,0000 0,0152 0,0181 0,1319 0,1251
11 0,0000 0,0000 0,0061 0,0082 0,1199 0,1137
12 0,0000 0,0000 0,0022 0,0034 0,0988 0,0948
13 0,0000 0,0000 0,0007 0,0013 0,0743 0,0729
14 0,0000 0,0000 0,0002 0,0005 0,0513 0,0521
15 0,0000 0,0000 0,0001 0,0002 0,0327 0,0347

Nadzieja matematyczna oraz wariancja w rozkładzie Poissona wyrażają się wzorami:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle {\Bbb E}(X) = \lambda, \hspace{2cm} {\Bbb D}^2 (X) = \lambda. }


Następująca animacja pokazuje, jak zmienia się kształt rozkładu Poissona dla najczęściej spotykanych wartości parametrów:

animacja 82.gif

Rozkład hipergeometryczny

Rozkład P nazywamy hipergeometrycznym, jeżeli istnieją liczby naturalne N i n oraz liczby dodatnie p i q takie, że p+q=1 oraz dla każdego k=0,1,2,n zachodzi równość:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle P(k) =\frac{\left(\begin{array} {@{}c@{}}Np\\k\end{array} \right) \left(\begin{array} {@{}c@{}}Nq\\n-k\end{array} \right)} {\left(\begin{array} {@{}c@{}}N\\k\end{array} \right)}. }


Mamy tutaj do czynienia z uogólnionym symbolem Newtona (Np nie jest na ogół liczbą naturalną). Symbol ten definiuje się dla x oraz k w sposób nastpujący:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \left(\begin{array} {@{}c@{}}x\\k\end{array} \right) = \frac{x(x-1) \dots (x-k+1)}{k!}, }


co oczywiście jest zgodne ze standardową definicją, gdy x jest liczbą naturalną.

Poniższy wykres przedstawia rozkład hipergeometryczny o parametrach N=50, n=5 oraz p=0.4.

<flash>file=Rp.1.83.swf|width=350|height=350</flash>

Przykład 8.4 [Losowanie bez zwracania]

Przypuśćmy, że pewna populacja składa się z N elementów. Niech p będzie prawdopodobieństwem tego, że dany element z tej populacji ma pewną własność, powiedzmy własność A. Losujemy bez zwracania n elementów i oznaczamy przez X liczbę wylosowanych elementów mających własność A. Dość łatwo zauważyć, nawiązując do przeprowadzonych w punkcie Schemat klasyczny rozważań dotyczących losowania ze zwracaniem, że zmienna losowa X ma rozkład hipergeometryczny.

Nadzieja matematyczna oraz wariancja w rozkładzie hipergeometrycznym wyrażają się wzorami:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle {\Bbb E}(X) = np, \hspace{2cm} {\Bbb D}^2 (X) = npq\frac{N-n}{N-1}. }


Uwaga 8.5
Przy losowaniu n elementów ze zwracaniem i przy losowaniu n elementów bez zwracania z populacji o liczebności N z frakcją elementów wyróżnionych, losujemy średnio tyle samo elementów wyróżnionych. Zauważmy jednak, że przy losowaniu bez zwracania wariancja jest mniejsza.

W poniższej animacji założono, że losujemy bez zwracania n elementów spośród 50 elementów, przy czym wiadomo, że 20 elementów ma własność A. Animacja pokazuje rozkład liczby wylosowanych elementów mających własność A, w zależności od n.

animacja 83.gif

Rozkłady czasu oczekiwania

  • Jak długo trzeba rzucać kostką, aby wypadła "szóstka"?
  • Jak długi jest czas oczekiwania na kolejne zgłoszenie do centrali telefonicznej?
  • Jak często dochodzi do wypadków drogowych?

Podobnie jak w poprzednim punkcie, omówimy tutaj kilka typowych rozkładów prawdopodobieństwa, które na ogół występują, gdy rozważamy zmienną losową będącą czasem czekania na określone zdarzenie.

Rozkład geometryczny

Rozkład P jest rozkładem geometrycznym, jeżeli istnieją liczby p i q takie, że 0<p, q<1, p+q=1 oraz zachodzi równość:


P(k)=qk1p dla k=1,2,3,


Następujący wykres przedstawia rozkład geometryczny o parametrze p=0.25:

<flash>file=Rp.1.84.swf|width=350|height=350</flash>

Zauważmy, że jest to rozkład dyskretny skupiony na zbiorze nieskończonym.

Rozkład geometryczny jest związany z nieskończonym ciągiem niezależnych prób Bernoulliego. Wykażemy mianowicie, że czas oczekiwania na pierwszy sukces w takim ciągu posiada właśnie rozkład geometryczny. Konkretną sytuację oczekiwanie na pierwszą "szóstkę") omawia ćwiczenie 4.2.

Twierdzenie 8.6

Niech X1,X2,X3, będą niezależnymi zmiennymi losowymi o takim samym rozkładzie dwupunktowym. Wtedy funkcja:


T=min{n1:Xn=1},


nazywana czasem oczekiwania na pierwszy sukces w nieskończonym ciągu prób Bernoulliego, jest zmienną losową o rozkładzie geometrycznym.

Dowód

Zauważmy, że zdarzenie {T=n} jest takie samo jak zdarzenie:


{X1=0,,Xn1=0,Xn=1}.


Z niezależności zmiennych losowych Xi otrzymujemy:


P(T=n)=P(X1=0,,Xn1=0,Xn=1)=


P(X1=0)P(Xn1=0)P(Xn=1)=qn1p.


Pokażemy jeszcze inną sytuację, w której pojawia się rozkład geometryczny -będzie to, w pewnym sensie, uogólnienie poprzedniego twierdzenia. Mianowicie, intuicja podpowiada, że czas oczekiwania na pierwszy sukces w nieskończonym ciągu niezależnych prób Bernoulliego ma następującą własność, zwaną brakiem pamięci:


P(T>m+n|T>n)=P(T>m) dla wszystkich m,n1.      (8.1)


Poniższe twierdzenie, a w szczególności implikacja "", odpowiada powyższej intuicji. Ponieważ zachodzi nawet równoważność, warunek (8.1) może być przyjęty za inną definicję rozkładu geometrycznego.

Twierdzenie 8.7

Niech T będzie zmienną losową przyjmującą jedynie wartości naturalne taką, że P(T>1)>0. Wtedy:


T spełnia warunek (8.1)T ma rozkład geometryczny.

Dowód

 () Oznaczmy an=P(T>n). Z założenia otrzymujemy:


an+1=P(T>n+1)=P(T>n+1,T>1)=P(T>n+1|T>1)P(T>1)


=P(T>n)P(T>1)=anq,


gdzie q=P(T>1). Tak więc liczby an tworzą ciąg geometryczny i stąd mamy:


an=qn1a1=qn.


Następnie obliczamy:


P(T=n)=P(T>n1)P(T>n)=qn1qn=qn1p,


gdzie p=1q.

 () Obliczmy lewą stronę wzoru (8.1):


P(T>m+n|T>n)=P(T>m+n,T>n)P(T>n)=P(T>m+n)P(T>n)=


k>m+nP(T=k)k>nP(T=k)=k>m+nqk1pk>nqk1p=qn+mp1qqnp1q=qm.


Jak łatwo sprawdzić, również P(T>m)=qm.

Nadzieja matematyczna oraz wariancja w rozkładzie geometrycznym wyrażają się wzorami:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle {\Bbb E}(X) = \frac{1}{p}, \hspace{2cm} {\Bbb D}^2 (X) = \frac{1-p}{p^2}. }


Poniższa animacja pokazuje kształt rozkładu geometrycznego w zależności od parametru p.

animacja 84.gif

Rozkład Pascala

Rozkład P nazywamy ujemnym rozkładem dwumianowym (lub rozkładem Pascala), jeżeli istnieją liczba naturalna r1 oraz liczba rzeczywista p>0 takie, że:


Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle P(r+k) = \left(\begin{array} {@{}c@{}}r+k-1\\\ r-1\end{array} \right)p^r(1-p)^k\;\; \mbox{ dla } k = 0,1,2,\dots }


Poniższy wykres przedstawia ujemny rozkład dwumianowy o parametrach r=5 i p=0.25.

<flash>file=Rp.1.85.swf|width=350|height=350</flash>

Zauważmy, że rozkład geometryczny jest szczególnym przypadkiem ujemnego rozkładu dwumianowego.

Twierdzenie 8.8

Niech X1,X2,X3, będzie ciągiem niezależnych prób Bernoulliego o takim samym prawdopodobieństwie sukcesu p w każdej próbie. Określmy:


Tr=min{n:k1,,kr takie, że 1k1<<kr=n


orazXki=1 dla i=1,,r}.


Wtedy Tr jest zmienną losową o ujemnym rozkładzie dwumianowym.

Inaczej: czas oczekiwania na pierwszych r sukcesów w nieskończonym schemacie Bernoulliego ma ujemny rozkład dwumianowy.

Dowód

Dowód jest bardzo podobny do analogicznego twierdzenia o rozkładzie geometrycznym (twierdzenie 8.6).

Można także udowodnić następujące twierdzenie, które jeszcze inaczej pozwala spojrzeć na problem czasu oczekiwania:

Twierdzenie 8.9

Niech T1,,Tr będzie ciągiem niezależnych zmiennych losowych o takim samym rozkładzie geometrycznym każda. Wtedy suma T1++Tr ma ujemny rozkład dwumianowy.

Nadzieja matematyczna oraz wariancja w rozkładzie Pascala wyrażają się wzorami:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle {\Bbb E}(X) = \frac{r}{p}, \hspace{2cm} {\Bbb D}^2 (X) = \frac{r(1-p)}{p^2}. }


Rozkład wykładniczy

Rozkład P nazywamy rozkładem wykładniczym, jeżeli istnieje taka liczba λ>0, że funkcja f:, określona wzorem:


f(x)={0 dla x<0λeλx dla x0,


jest gęstością tego rozkładu.

Poniższy wykres przedstawia rozkład wykładniczy o parametrze λ=0.25.

<flash>file=Rp.1.86.swf|width=350|height=350</flash>

Wykres ten oraz wykres rozkładu geometrycznego (84.eps) sugerują, że między rozkładem geometrycznym i wykładniczym mogą istnieć pewne związki. Tak rzeczywiście jest - będzie to uzasadnione poniżej.

Jak łatwo sprawdzić, dystrybuanta tego rozkładu wyraża się wzorem:


F(x)=xf(t)dt={0 dla x<01eλx dla x0.


Nadzieja matematyczna oraz wariancja w rozkładzie wykładniczym wyrażają się wzorami:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle {\Bbb E}(X) = \frac{1}{\lambda}, \hspace{2cm} {\Bbb D}^2 (X) = \frac{1}{\lambda^2}. }


Następująca animacja pokazuje, jak zmienia się gęstość rozkładu wykładniczego w zależności od parametru λ:

animacja 85.gif

Spróbujemy teraz uzasadnić, że rozkład wykładniczy jest ciągłym odpowiednikiem rozkładu geometrycznego. Mówiąc niezbyt ściśle, najpierw pokażemy, że czas oczekiwania na pierwszy sukces w nieskończonym ciągu niezależnych prób Bernoulliego ma w przybliżeniu rozkład wykładniczy o parametrze λ, o ile czas pomiędzy kolejnymi próbami jest bardzo mały, a prawdopodobieństwo sukcesu w pojedynczej próbie jest małe i wprost proporcjonalne do tego czasu, przy czym parametr λ jest współczynnikiem tej proporcjonalności.

Niech λ>0 będzie ustalone. Oznaczamy:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle p = p_\delta = \lambda \delta\;\; \textrm{dla każdego} \;\delta >0.}


Niech X1,X2,X3, będzie ciągiem niezależnych zmiennych losowych, z których każda ma rozkład dwupunktowy o parametrze p oraz niech:


T=δmin{n1:Xn=1}.


Oznaczmy przez F dystrybuantę rozkładu wykładniczego o parametrze λ.

Twierdzenie 8.10

Dla każdego t:


FT(t)F(t), gdy δ0.


Dowód

Dla t0 sytuacja jest trywialna. Niech zatem t>0. Zauważając, że zmienna losowa Tδ ma rozkład geometryczny (patrz twierdzenie 8.6) i oznaczając część całkowitą liczby tδ przez n, mamy kolejno:


FT(t)=P(Tt)=1P(T>t)=1P(Tδ>tδ)=1k=n+1(1p)k1p


=1(1p)n=1(1λδ1)δ1trδ1eλt=F(t),
przy δ0, gdyż 0rδ=tδn<1.

Można też pokazać (dowody pomijamy) odpowiedniki twierdzeń 8.7 i 8.9 dla przypadku ciągłego.

Twierdzenie 8.11

Niech T będzie nieujemną zmienną losową, spełniającą warunek:


P(T>t+s|T>s)=P(T>t) dla wszystkich s,t>0,


zwany brakiem pamięci. Wówczas T ma rozkład wykładniczy.
Uwaga 8.12
Zachodzi także twierdzenie odwrotne do twierdzenia 8.11.

Twierdzenie 8.13

Niech T1,,Tn będą niezależnymi zmiennymi losowymi o takim samym rozkładzie wykładniczym z parametrem λ oraz niech Sn=T1++Tn. Wtedy Sn ma rozkład o gęstości fn, zadanej wzorem:


fn(x)={λ(λx)n1(n1)!eλx dla x>00 dla x0.


Rozkład ten nosi nazwę rozkładu Erlanga.

Proces Poissona

Na zakończenie niniejszego wykładu sformułujemy twierdzenie, które pokazuje głęboki związek między rozkładem wykładniczym i rozkładem Poissona. Zdefiniujemy mianowicie tak zwany proces Poissona, czyli dla każdego dodatniego t określimy zmienną losową Nt mającą rozkład Poissona o parametrze λt. Mówiąc (na razie) nieprecyzyjnie, zmienna Nt oznacza liczbę sukcesów w ciągu niezależnych prób Bernoulliego, o ile próby te mogą być powtarzane nieskończenie często, zaś prawdopodobieństwo pojawienia się sukcesu w bardzo krótkim odcinku czasu Δt wynosi w przybliżeniu λt - mamy więc sytuację opisaną w twierdzeniu 8.10 i w poprzedzającym go komentarzu. W takim razie, czas oczekiwania na pierwszy sukces ma rozkład wykładniczy o parametrze λ, a czas oczekiwania na n sukcesów ma, zgodnie z twierdzeniem 8.13, rozkład Erlanga. Na tej podstawie nietrudno jest już określić rozkład zmiennej Nt.

Twierdzenie 8.14

Niech T1,T2,T3, będą niezależnymi zmiennymi losowymi o takim samym rozkładzie wykładniczym z parametrem λ. Niech Sn=T1++Tn oraz niech S0=0. Wtedy zmienna losowa Nt, zdefiniowana wzorem:


Nt:=max{n:Snt},


gdzie t>0 jest ustaloną liczbą, ma rozkład Poissona o parametrze λt.

Dowód

Zauważmy, że zdarzenie {Nt=k} jest równoważne zdarzeniu:


{Skt}{Sk+1t}.


Tak więc:


P(Nt=k)=Fk(t)Fk+1(t),


gdzie Fk oznacza dystrybuantę zmiennej losowej Sk. Z twierdzenia 8.13 wynika, że Sk na rozkład Erlanga, tak więc:


Fk(t)=0tλ(λx)k1(k1)!eλxdx dla t>0.

Indukcyjnie można pokazać, że:


Fk(t)=1eλt(1+λt1!++(λt)k1(k1)!),


a stąd:


P(Nt=k)=(λt)kk!eλt.