Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 12: Metoda największej wiarygodności: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Arek (dyskusja | edycje)
Nie podano opisu zmian
m Zastępowanie tekstu – „<math> ” na „<math>”
 
(Nie pokazano 15 wersji utworzonych przez 3 użytkowników)
Linia 1: Linia 1:
==Ćwiczenia i zadania==
==Ćwiczenia==


{{cwiczenie|||
{{cwiczenie|12.1|cw 12.1|
Rozważmy próbkę prostą  <math>\displaystyle x_1, \dots, x_n</math>  z rozkładu <math>\displaystyle N(m,\sigma)</math>. Znajdziemy
Rozważmy próbkę prostą  <math>x_1, \dots, x_n</math>  z rozkładu <math>N(m,\sigma)</math>. Znajdziemy
estymatory największej wiarygodności parametrów <math>\displaystyle m</math> i <math>\displaystyle \sigma</math>.  
estymatory największej wiarygodności parametrów <math>m</math> i <math>\sigma</math>.  
}}
}}


Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:
Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:
<center><math>\displaystyle
 
 
<center><math>
f(x) =  \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x
f(x) =  \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x
- m}{\sigma})^2}\;\; </math>  dla  <math>\displaystyle  x\in {\Bbb R}.
- m}{\sigma})^2}\;\;</math>  dla  <math> x\in {\Bbb R}</math></center>
</math></center>
 


W związku z tym, funkcja wiarygodności ma postać:
W związku z tym, funkcja wiarygodności ma postać:
<center><math>\displaystyle
 
 
<center><math>
l(m,\sigma) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_1
l(m,\sigma) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_1
- m}{\sigma})^2} \cdot \dots \cdot \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_n
- m}{\sigma})^2} \cdot \dots \cdot \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_n
Linia 19: Linia 23:
</math></center>
</math></center>


<center><math>\displaystyle
= \frac{1}{(\sqrt{2\pi}\sigma)^n}e^{- \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - m)^2}.
</math></center>


Z postaci funkcji <math>\displaystyle l</math> od razu widać, że przy każdym ustalonym <math>\displaystyle \sigma</math> przyjmuje ona wartość największą dla takiego <math>\displaystyle m</math>,
<center><math>
dla którego funkcja: <center><math>\displaystyle l_1(m)=\sum_{i=1}^n(x_i - m)^2</math></center>
= \frac{1}{(\sqrt{2\pi}\sigma)^n}e^{- \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - m)^2}</math></center>
 
 
Z postaci funkcji <math>l</math> od razu widać, że przy każdym ustalonym <math>\sigma</math> przyjmuje ona wartość największą dla takiego <math>m</math>,
dla którego funkcja:
 
 
<center><math>l_1(m)=\sum_{i=1}^n(x_i - m)^2</math></center>
 


osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową
osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej <math>m</math>, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla: <center><math>\hat{m} = \bar{x}</math>.</center>
zmiennej <math>\displaystyle m</math>, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla: <center><math>\displaystyle \hat{m} = \bar{x}.</math></center>


Rozważmy zatem funkcję:
Rozważmy zatem funkcję:
<center><math>\displaystyle l_2(\sigma)=(\sqrt{2\pi})^n l(\bar{x},\sigma),</math></center>
 
 
<center><math>l_2(\sigma)=(\sqrt{2\pi})^n l(\bar{x},\sigma)</math>,</center>
 
 
a następnie jej logarytm:
a następnie jej logarytm:
<center><math>\displaystyle
 
L(\sigma) = -n \ln \sigma - \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - \bar{x})^2.
 
</math></center>
<center><math>
L(\sigma) = -n \ln \sigma - \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - \bar{x})^2</math></center>
 


Obliczamy pochodną:
Obliczamy pochodną:
<center><math>\displaystyle
 
L'(\sigma) = \frac{-n}{\sigma} - \frac{1}{2\sigma^{3}}(-2)\sum_{i=1}^n(x_i - \bar{x})^2 = - \frac{n}{\sigma} + \frac{1}{\sigma^{3}}\sum_{i=1}^n(x_i - \bar{x})^2.
 
</math></center>
<center><math>
L'(\sigma) = \frac{-n}{\sigma} - \frac{1}{2\sigma^{3}}(-2)\sum_{i=1}^n(x_i - \bar{x})^2 = - \frac{n}{\sigma} + \frac{1}{\sigma^{3}}\sum_{i=1}^n(x_i - \bar{x})^2</math></center>
 


Zauważmy, jedynym rozwiązaniem równania:
Zauważmy, jedynym rozwiązaniem równania:
<center><math>\displaystyle
 
 
<center><math>
L'(\sigma) = 0
L'(\sigma) = 0
</math></center>
</math></center>


jest liczba:
jest liczba:
<center><math>\displaystyle
 
\widehat{\sigma} = \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i - \bar{x})^2}.
 
</math></center>
<center><math>
\widehat{\sigma} = \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i - \bar{x})^2}</math></center>
 


Ostatecznie więc otrzymujemy następujące estymatory:
Ostatecznie więc otrzymujemy następujące estymatory:
<center><math>\displaystyle \displaystyle \hat{m} = \bar{x} =
 
 
<center><math>\hat{m} = \bar{x} =
\frac{x_1+ \dots + x_n}{n}, \ \  \widehat{\sigma} =\sqrt{
\frac{x_1+ \dots + x_n}{n}, \ \  \widehat{\sigma} =\sqrt{
\frac{(x_1-\bar{x}_n)^2 + \dots + (x_n - \bar{x}_n)^2}{n}}.
\frac{(x_1-\bar{x}_n)^2 + \dots + (x_n - \bar{x}_n)^2}{n}}</math></center>
</math></center>
 


{{cwiczenie|||
{{cwiczenie|12.2|cw 12.2|
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano <math>\displaystyle n</math> próbek wody po
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano <math>n</math> próbek wody po
100 ml (próbki typu <math>\displaystyle A</math>) oraz <math>\displaystyle m</math> próbek wody po 300 ml (próbki typu <math>\displaystyle B</math>). Metoda laboratoryjna pozwala jedynie
100 ml (próbki typu <math>A</math>) oraz <math>m</math> próbek wody po 300 ml (próbki typu <math>B</math>). Metoda laboratoryjna pozwala jedynie
na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii
na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii
w <math>\displaystyle k</math> próbkach typu <math>\displaystyle A</math> oraz <math>\displaystyle l</math> próbkach typu <math>\displaystyle B</math>. Jaka jest
w <math>k</math> próbkach typu <math>A</math> oraz <math>l</math> próbkach typu <math>B</math>. Jaka jest
średnia liczba bakterii w 1 litrze wody?
średnia liczba bakterii w 1 litrze wody?


Linia 77: Linia 100:
uzyskując w ten sposób żądany wynik).
uzyskując w ten sposób żądany wynik).


Niech więc <math>\displaystyle X</math> oznacza liczbę bakterii w 100 ml wody. Zakładamy, że <math>\displaystyle X</math> ma rozkład Poissona
Niech więc <math>X</math> oznacza liczbę bakterii w 100 ml wody. Zakładamy, że <math>X</math> ma rozkład Poissona
z parametrem <math>\displaystyle \lambda</math>. W związku z tym zmienna losowa <math>\displaystyle Y</math>, oznaczająca liczbę bakterii w 300 ml wody,
z parametrem <math>\lambda</math>. W związku z tym zmienna losowa <math>Y</math>, oznaczająca liczbę bakterii w 300 ml wody,
ma rozkład Poissona z parametrem <math>\displaystyle 3\lambda</math>. Teraz wyniki badania można interpretować następująco:
ma rozkład Poissona z parametrem <math>3\lambda</math>. Teraz wyniki badania można interpretować następująco:
zaobserwowano zdarzenie, polegające na jednoczesnym
zaobserwowano zdarzenie, polegające na jednoczesnym
zajściu:
zajściu:
* <math>\displaystyle k</math> zdarzeń postaci <math>\displaystyle \{X_i > 0\}</math>,
* <math>k</math>zdarzeń postaci <math>\{X_i > 0\}</math>,
* <math>\displaystyle n- k</math> zdarzeń postaci <math>\displaystyle \{X_i = 0\}</math>,
* <math>n- k</math>zdarzeń postaci <math>\{X_i = 0\}</math>,
* <math>\displaystyle l</math> zdarzeń postaci <math>\displaystyle \{Y_i > 0\}</math>,
* <math>l</math>zdarzeń postaci <math>\{Y_i > 0\}</math>,
* <math>\displaystyle m - l</math> zdarzeń postaci <math>\displaystyle \{Y_i = 0\}</math>,
* <math>m - l</math>zdarzeń postaci <math>\{Y_i = 0\}</math>,


gdzie zmienne <math>\displaystyle X_i</math> tworzą próbkę prostą z <math>\displaystyle X</math>, zaś zmienne <math>\displaystyle Y_i</math> -- próbkę prostą z <math>\displaystyle Y</math>.
gdzie zmienne <math>X_i</math> tworzą próbkę prostą z <math>X</math>, zaś zmienne <math>Y_i</math> - próbkę prostą z <math>Y</math>.
Prawdopodobieństwo zaobserwowanego  zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy
Prawdopodobieństwo zaobserwowanego  zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy
jednak, że: <center><math>\displaystyle P(X_i = 0) = P(X=0)  = e^{-\lambda},</math></center>
jednak, że:
 
 
<center><math>P(X_i = 0) = P(X=0)  = e^{-\lambda}</math></center>
 


a więc:
a więc:
<center><math>\displaystyle P(X_i > 0) = P(X>0)  = 1- e^{-\lambda}.</math></center>
 
 
<center><math>P(X_i > 0) = P(X>0)  = 1- e^{-\lambda}</math></center>
 


Podobnie:
Podobnie:
<center><math>\displaystyle P(Y_i = 0) = P(Y=0)  = e^{-3\lambda},</math></center>


zatem: <center><math>\displaystyle P(Y_i > 0) = P(Y>0)  = 1- e^{-3\lambda}.</math></center>
 
<center><math>P(Y_i = 0) = P(Y=0)  = e^{-3\lambda}</math></center>
 
 
zatem:
 
 
<center><math>P(Y_i > 0) = P(Y>0)  = 1- e^{-3\lambda}</math></center>
 


Ostatecznie więc funkcja wiarygodności ma postać:
Ostatecznie więc funkcja wiarygodności ma postać:
<center><math>\displaystyle
 
l(q) = q^{n-k}(1-q)^{k}(q^3)^{m-l}(1-q^3)^{l},
 
<center><math>
l(q) = q^{n-k}(1-q)^{k}(q^3)^{m-l}(1-q^3)^{l}
</math></center>
</math></center>


gdzie  <math>\displaystyle q = e^{-\lambda}</math>.
 
Widać, że <math>\displaystyle l(0) = l(1) = 0</math> oraz że <math>\displaystyle l</math> jest ciągła na przedziale <math>\displaystyle [0,1]</math>,
gdzie  <math>q = e^{-\lambda}</math>.
tak więc istnieje w tym przypadku  estymator największej wiarygodności, aczkolwiek wzór określający funkcję <math>\displaystyle l</math>
Widać, że <math>l(0) = l(1) = 0</math> oraz że <math>l</math> jest ciągła na przedziale <math>[0,1]</math>,
tak więc istnieje w tym przypadku  estymator największej wiarygodności, aczkolwiek wzór określający funkcję <math>l</math>
wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego
wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego
estymatora.
estymatora.
Linia 112: Linia 152:
W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz
W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz
ustalając konkretne wartości parametrów, powiedzmy:
ustalając konkretne wartości parametrów, powiedzmy:
<center><math>\displaystyle n =30,\; k = 8,\; m = 5, \;l = 3.</math></center>


Wyznaczamy logarytm z  funkcji wiarygodności, różniczkujemy go i przyrównujemy do <math>\displaystyle 0</math>, otrzymując następujące równanie:
 
<center><math>\displaystyle
<center><math>n =30,\; k = 8,\; m = 5, \;l = 3</math></center>
 
 
Wyznaczamy logarytm z  funkcji wiarygodności, różniczkujemy go i przyrównujemy do <math>0</math>, otrzymując następujące równanie:
 
 
<center><math>
28\,{q}^{27} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{3}-8\,
28\,{q}^{27} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{3}-8\,
{q}^{28} \left( 1-q \right) ^{7} \left( 1-{q}^{3} \right) ^{3}</math></center>
{q}^{28} \left( 1-q \right) ^{7} \left( 1-{q}^{3} \right) ^{3}</math></center>


<center><math>\displaystyle -9\,{q}^
 
<center><math>-9\,{q}^
{30} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{2}
{30} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{2}
=0.
=0</math></center>
</math></center>
 


Po podzieleniu obu stron przez wspólny czynnik dostajemy:
Po podzieleniu obu stron przez wspólny czynnik dostajemy:
<center><math>\displaystyle
 
-28+8q+8q^2+45q^3 = 0.
 
<center><math>
-28+8q+8q^2+45q^3 = 0
</math></center>
</math></center>


Równanie to można rozwiązać numerycznie w przedziale <math>\displaystyle (0,1)</math> otrzymując:
<center><math>\displaystyle \hat{q} = 0.7342,</math></center>
czyli: <center><math>\displaystyle \hat{\lambda} = -\ln \hat{q} = 0.3089.</math></center>


Tak więc w jednym litrze wody są średnio nieco ponad <math>\displaystyle 3</math>
Równanie to można rozwiązać numerycznie w przedziale <math>(0,1)</math> otrzymując:
 
 
<center><math>\hat{q} = 0.7342</math>,</center>
czyli: <center><math>\hat{\lambda} = -\ln \hat{q} = 0.3089</math></center>
 
 
Tak więc w jednym litrze wody są średnio nieco ponad <math>3</math>
bakterie.
bakterie.


{{cwiczenie|||
{{cwiczenie|12.3|cw 12.3|
Zmodyfikujemy przykład [[##122|Uzupelnic 122|]]. Treść zadania wygląda teraz następująco.
Zmodyfikujemy [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykład 12.4]]. Treść zadania wygląda teraz następująco.
Chcąc zbadać wadliwość nowej serii komputerów
Chcąc zbadać wadliwość nowej serii komputerów
przeprowadzono następujące badanie: przez 20 dni
przeprowadzono następujące badanie: przez 20 dni
Linia 152: Linia 204:


Ta drobna zmiana oznacza istotną komplikację techniczną.
Ta drobna zmiana oznacza istotną komplikację techniczną.
Stosując oznaczenia z przykładu [[##122|Uzupelnic 122|]] widzimy, że
Stosując oznaczenia z [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykładu 12.4]] widzimy, że
funkcja wiarygodności ma teraz postać:
funkcja wiarygodności ma teraz postać:
<center><math>\displaystyle
 
l(p) = a_0^{14}a_1^4(1 - a_0 - a_1)^2,
 
<center><math>
l(p) = a_0^{14}a_1^4(1 - a_0 - a_1)^2
</math></center>
</math></center>


gdyż <math>\displaystyle 1 - a_0 - a_1</math> oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:
 
<center><math>\displaystyle
gdyż <math>1 - a_0 - a_1</math> oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:
 
 
<center><math>
l(p) = \left((1-p)^{10}\right)^{14}
l(p) = \left((1-p)^{10}\right)^{14}
\left(10 p(1-p)^{9}\right)^{4}\left(1 - (1-p)^{10} - 10 p(1-p)^{9}\right)^2,
\left(10 p(1-p)^{9}\right)^{4}\left(1 - (1-p)^{10} - 10 p(1-p)^{9}\right)^2
</math></center>
</math></center>


a więc sytuacja jest podobna do tej z ćwiczenia [[##cb|Uzupelnic cb|]] --
 
można wziąć logarytm z funkcji <math>\displaystyle l</math>, obliczyć jego pochodną i przyrównać do <math>\displaystyle 0</math>, jednak otrzymane
a więc sytuacja jest podobna do tej z [[#cw_12.2|ćwiczenia 12.2]] -
można wziąć logarytm z funkcji <math>l</math>, obliczyć jego pochodną i przyrównać do <math>0</math>, jednak otrzymane
w ten sposób równanie trzeba rozwiązywać numerycznie.
w ten sposób równanie trzeba rozwiązywać numerycznie.
Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru <math>\displaystyle p</math> jest:
Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru <math>p</math> jest:
<center><math>\displaystyle \hat{p} = 0.041,</math></center>
<center><math>\hat{p} = 0.041</math>,</center>
a więc nieznacznie więcej niż w przykładzie [[##122|Uzupelnic 122|]].
a więc nieznacznie więcej niż w [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykładzie 12.4]].


{{cwiczenie|||
{{cwiczenie|12.4|cw 12.4|
Znajdziemy estymator największej wiarygodności parametru <math>\displaystyle a</math>, w rozkładzie jednostajnym na przedziale <math>\displaystyle (0,a)</math>.
Znajdziemy estymator największej wiarygodności parametru <math>a</math>, w rozkładzie jednostajnym na przedziale <math>(0,a)</math>.


}}
}}


Z warunków zadania wynika, że dysponujemy  próbką prostą  <math>\displaystyle x_1, \dots, x_n</math>  z rozkładu ciągłego, którego gęstość <math>\displaystyle f</math> jest następująca:
Z warunków zadania wynika, że dysponujemy  próbką prostą  <math>x_1, \dots, x_n</math>  z rozkładu ciągłego, którego gęstość <math>f</math> jest następująca:
<math>\displaystyle f(x) = \frac{1}{a}</math> dla <math>\displaystyle 0 \leq x \leq a</math> oraz <math>\displaystyle f(x) = 0</math> dla pozostałych <math>\displaystyle x</math>. Funkcją wiarygodności jest więc tutaj:
<math>f(x) = \frac{1}{a}</math> dla <math>0 \leq x \leq a</math> oraz <math>f(x) = 0</math> dla pozostałych <math>x</math>. Funkcją wiarygodności jest więc tutaj:
<center><math>\displaystyle
 
l(a) = f(x_1) \cdot \dots \cdot f(x_n),
 
<center><math>
l(a) = f(x_1) \cdot \dots \cdot f(x_n)
</math></center>
</math></center>


W związku z tym, jeżeli wszystkie punkty <math>\displaystyle x_i</math> leżą w przedziale <math>\displaystyle (0,a)</math>,
 
W związku z tym, jeżeli wszystkie punkty <math>x_i</math> leżą w przedziale <math>(0,a)</math>,
to:
to:
<center><math>\displaystyle l(a) = \frac{1}{a^n},</math></center>
 
 
<center><math>l(a) = \frac{1}{a^n}</math></center>
 
 
zaś w przeciwnym wypadku:
zaś w przeciwnym wypadku:
<center><math>\displaystyle l(a) = 0.</math></center>
 
 
<center><math>l(a) = 0</math></center>
 


Zatem:
Zatem:
<center><math>\displaystyle
 
 
<center><math>
l(a) = \left\{ \begin{array} {rl}
l(a) = \left\{ \begin{array} {rl}
\frac{1}{a^n} &  \textrm{dla} \displaystyle  a \geq  \max\{ \displaystyle x_1, \dots, x_n\displaystyle  \}\\
\frac{1}{a^n} &  \text{dla} a \geq  \max\{x_1, \dots, x_n \}\\
0 &  \textrm{dla} \displaystyle  0 <  a < \max\{ \displaystyle x_1, \dots, x_n\displaystyle  \}.
0 &  \text{dla} 0 <  a < \max\{x_1, \dots, x_n \}.
\end{array}  \right.
\end{array}  \right
</math></center>
</math></center>


W nietrywialnym przypadku, czyli gdy <math>\displaystyle \max( \displaystyle x_1, \dots, x_n\displaystyle  ) > 0</math>, funkcja ta jest dobrze określona,
lecz nie jest ciągła w punkcie <math>\displaystyle a = \max\{ \displaystyle x_1, \dots, x_n\displaystyle  \}</math>.
Jednak widać (narysuj wykres funkcji <math>\displaystyle l</math>), że akurat w tym punkcie funkcja <math>\displaystyle l</math> przyjmuje wartość
największą. Tak więc estymatorem największej wiarygodności parametru <math>\displaystyle a</math> jest:
<center><math>\displaystyle \hat{a} = \max\{ \displaystyle x_1, \dots, x_n\displaystyle  \},</math></center>
o którym była już mowa w ćwiczeniu [[##earjm|Uzupelnic earjm|]].


'''. . .'''
W nietrywialnym przypadku, czyli gdy <math>\max(x_1, \dots, x_n ) > 0</math>, funkcja ta jest dobrze określona,
lecz nie jest ciągła w punkcie <math>a = \max\{x_1, \dots, x_n \}</math>.
Jednak widać (narysuj wykres funkcji <math>l</math>), że akurat w tym punkcie funkcja <math>l</math> przyjmuje wartość
największą. Tak więc estymatorem największej wiarygodności parametru <math>a</math> jest:


{{cwiczenie|||
Znajdź wartość największą (o ile istnieje) funkcji <math>\displaystyle f</math> na zbiorze <math>\displaystyle A</math>:


<math>\displaystyle f(x) = x^3 - x^2 + 8x - 2</math>, <math>\displaystyle A = [-2.2]</math>,
<center><math>\hat{a} = \max\{x_1, \dots, x_n \}</math></center>


<math>\displaystyle f(x) = x - \sqrt{x^2 + 8x - 2}</math>, <math>\displaystyle A = [0.4]</math>,


<math>\displaystyle f(x) = x^2\ln|x|</math> dla <math>\displaystyle x\neq 0</math>, <math>\displaystyle f(0) = 0</math>, <math>\displaystyle A = {\Bbb R}</math>,
o którym była już mowa w [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 11: Wnioskowanie statystyczne#cw_11.1|ćwiczeniu 11.1]].
------------------------------------------------


<math>\displaystyle \displaystyle f(x) = x^2 - \frac{1}{x}</math><math>\displaystyle A = [1,2]</math>,
'''{{kotwica|zad 12.1|Zadanie 12.1}}'''
Znajdź wartość największą (o ile istnieje) funkcji <math>f</math> na zbiorze <math>A</math>:


<math>\displaystyle f(x) = \max\{x,1-x^2\}</math>, <math>\displaystyle A = (0,1)</math>,
# <math>f(x) = x^3 - x^2 + 8x - 2</math>, <math>A = [-2.2]</math>,
# <math>f(x) = x - \sqrt{x^2 + 8x - 2}</math>, <math>A = [0.4]</math>,
# <math>f(x) = x^2\ln|x|</math> dla <math>x\neq 0</math>, <math>f(0) = 0</math>, <math>A = {\Bbb R}</math>,
# <math>f(x) = x^2 - \frac{1}{x}</math>,  <math>A = [1,2]</math>,
# <math>f(x) = \max\{x,1-x^2\}</math>, <math>A = (0,1)</math>,
# <math>f(x) = e^{-|x|}</math>, <math>A = {\Bbb R}</math>,
# <math>f(x) = \frac{x-2}{x^2}</math>, <math>A = \{0,1,2, \dots\}</math>.


<math>\displaystyle f(x) = e^{-|x|}</math>, <math>\displaystyle A = {\Bbb R}</math>,
'''{{kotwica|zad 12.2|Zadanie 12.2}}'''
 
<math>\displaystyle f(x) = \frac{x-2}{x^2}</math>, <math>\displaystyle A = \{0,1,2, \dots\}</math>.
 
}}
 
{{cwiczenie|||
Wyprowadź wzór na estymator największej wiarygodności
Wyprowadź wzór na estymator największej wiarygodności
parametru <math>\displaystyle p</math>, gdy próbka prosta pochodzi z rozkładu
parametru <math>p</math>, gdy próbka prosta pochodzi z rozkładu
geometrycznego.
geometrycznego.


}}
'''{{kotwica|zad 12.3|Zadanie 12.3}}'''
 
{{cwiczenie|||
Wyprowadź wzór na estymator największej wiarygodności
Wyprowadź wzór na estymator największej wiarygodności
parametru <math>\displaystyle \lambda</math>, gdy próbka prosta  pochodzi z rozkładu
parametru <math>\lambda</math>, gdy próbka prosta  pochodzi z rozkładu
Poissona.
Poissona.


}}
'''{{kotwica|zad 12.4|Zadanie 12.4}}'''
Testowano czas działania <math>T</math> nowej serii baterii do
telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):
 
 
<center><math>239,\; 209,\; 208,\; 235,\; 226,\; 204,\; 203,\; 204,\; 217,\; 232</math></center>


{{cwiczenie|||
Testowano czas działania <math>\displaystyle T</math> nowej serii baterii do
telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):
<center><math>\displaystyle 239,\; 209,\; 208,\; 235,\; 226,\; 204,\; 203,\; 204,\; 217,\; 232,</math></center>


natomiast pięć innych baterii działało dłużej niż 240 godzin.
natomiast pięć innych baterii działało dłużej niż 240 godzin.
Znajdź estymator parametru <math>\displaystyle p</math> zakładając, że rozkładu czasu działania baterii
Znajdź estymator parametru <math>p</math> zakładając, że rozkładu czasu działania baterii
jest postaci: <center><math>\displaystyle P(T = k) = (1-p)^{k - 201}p\;\; </math> dla  <math>\displaystyle  k = 201,
jest postaci:
202, 203, \dots .</math></center>
 
 
<center><math>P(T = k) = (1-p)^{k - 201}p\;\;</math> dla  <math>k = 201,
202, 203, \dots</math></center>
 
 
Korzystając z otrzymanego wyniku, określ średni czas
Korzystając z otrzymanego wyniku, określ średni czas
działania baterii oraz oblicz prawdopodobieństwo tego,
działania baterii oraz oblicz prawdopodobieństwo tego,
bateria z tej serii działa dłużej niż 220 godzin.  
bateria z tej serii działa dłużej niż 220 godzin.  
}}


{{cwiczenie|||
'''{{kotwica|zad 12.5|Zadanie 12.5}}'''
Metodą największej wiarygodności znajdź estymator
Metodą największej wiarygodności znajdź estymator
parametru <math>\displaystyle a</math>, gdy próbka  <math>\displaystyle x_1, \dots, x_n</math>  pochodzi z rozkładu jednostajnego na odcinku <math>\displaystyle (-a,0)</math>.
parametru <math>a</math>, gdy próbka  <math>x_1, \dots, x_n</math>  pochodzi z rozkładu jednostajnego na odcinku <math>(-a,0)</math>.
 
}}


{{cwiczenie|||
'''{{kotwica|zad 12.6|Zadanie 12.6}}'''
W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?
W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?


}}
'''{{kotwica|zad 12.7|Zadanie 12.7}}'''
 
Mamy próbkę prostą  <math>x_1, \dots, x_n</math>  z rozkładu wykładniczego oraz wiemy, że <math>k</math> dalszych
{{cwiczenie|||
niezależnych obserwacji <math>x_i</math> z tego rozkładu  ma wartość większą niż dana liczba <math>T</math>.
Mamy próbkę prostą  <math>\displaystyle x_1, \dots, x_n</math>  z rozkładu wykładniczego oraz wiemy, że <math>\displaystyle k</math> dalszych
niezależnych obserwacji <math>\displaystyle x_i</math> z tego rozkładu  ma wartość większą niż dana liczba <math>\displaystyle T</math>.
Jaka jest nadzieja matematyczna tego rozkładu?
Jaka jest nadzieja matematyczna tego rozkładu?
}}

Aktualna wersja na dzień 22:17, 11 wrz 2023

Ćwiczenia

Ćwiczenie 12.1

Rozważmy próbkę prostą x1,,xn z rozkładu N(m,σ). Znajdziemy estymatory największej wiarygodności parametrów m i σ.

Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:


f(x)=12πσe12(xmσ)2 dla x


W związku z tym, funkcja wiarygodności ma postać:


l(m,σ)=12πσe12(x1mσ)212πσe12(xnmσ)2


=1(2πσ)ne12σ2i=1n(xim)2


Z postaci funkcji l od razu widać, że przy każdym ustalonym σ przyjmuje ona wartość największą dla takiego m, dla którego funkcja:


l1(m)=i=1n(xim)2


osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej

m

, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla:

m^=x¯.

Rozważmy zatem funkcję:


l2(σ)=(2π)nl(x¯,σ),


a następnie jej logarytm:


L(σ)=nlnσ12σ2i=1n(xix¯)2


Obliczamy pochodną:


L(σ)=nσ12σ3(2)i=1n(xix¯)2=nσ+1σ3i=1n(xix¯)2


Zauważmy, jedynym rozwiązaniem równania:


L(σ)=0


jest liczba:


σ^=1ni=1n(xix¯)2


Ostatecznie więc otrzymujemy następujące estymatory:


m^=x¯=x1++xnn,  σ^=(x1x¯n)2++(xnx¯n)2n


Ćwiczenie 12.2

Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano n próbek wody po 100 ml (próbki typu A) oraz m próbek wody po 300 ml (próbki typu B). Metoda laboratoryjna pozwala jedynie na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii w k próbkach typu A oraz l próbkach typu B. Jaka jest średnia liczba bakterii w 1 litrze wody?

Zanim przejdziemy do właściwego rozwiązania powyższego zadania, należy najpierw zdać sobie sprawę z tego, że rozkład bakterii w ustalonej porcji wody podlega w przybliżeniu rozkładowi Poissona -- mamy tu bowiem dużo doświadczeń (znalezienie się pojedynczej bakterii w ustalonej porcji wody) z niezwykle małym prawdopodobieństwem sukcesu każde. Dla ułatwienia zapisu przyjmujemy, że podstawowa objętość ma 100 ml (gdy już będziemy mieć średnią liczbę bakterii w tej objętości, to pomnożymy ją przez 10, uzyskując w ten sposób żądany wynik).

Niech więc X oznacza liczbę bakterii w 100 ml wody. Zakładamy, że X ma rozkład Poissona z parametrem λ. W związku z tym zmienna losowa Y, oznaczająca liczbę bakterii w 300 ml wody, ma rozkład Poissona z parametrem 3λ. Teraz wyniki badania można interpretować następująco: zaobserwowano zdarzenie, polegające na jednoczesnym zajściu:

  • kzdarzeń postaci {Xi>0},
  • nkzdarzeń postaci {Xi=0},
  • lzdarzeń postaci {Yi>0},
  • mlzdarzeń postaci {Yi=0},

gdzie zmienne Xi tworzą próbkę prostą z X, zaś zmienne Yi - próbkę prostą z Y. Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy jednak, że:


P(Xi=0)=P(X=0)=eλ


a więc:


P(Xi>0)=P(X>0)=1eλ


Podobnie:


P(Yi=0)=P(Y=0)=e3λ


zatem:


P(Yi>0)=P(Y>0)=1e3λ


Ostatecznie więc funkcja wiarygodności ma postać:


l(q)=qnk(1q)k(q3)ml(1q3)l


gdzie q=eλ. Widać, że l(0)=l(1)=0 oraz że l jest ciągła na przedziale [0,1], tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję l wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego estymatora.

W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz ustalając konkretne wartości parametrów, powiedzmy:


n=30,k=8,m=5,l=3


Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do 0, otrzymując następujące równanie:


28q27(1q)8(1q3)38q28(1q)7(1q3)3


9q30(1q)8(1q3)2=0


Po podzieleniu obu stron przez wspólny czynnik dostajemy:


28+8q+8q2+45q3=0


Równanie to można rozwiązać numerycznie w przedziale (0,1) otrzymując:


q^=0.7342,

czyli:

λ^=lnq^=0.3089


Tak więc w jednym litrze wody są średnio nieco ponad 3 bakterie.

Ćwiczenie 12.3

Zmodyfikujemy przykład 12.4. Treść zadania wygląda teraz następująco. Chcąc zbadać wadliwość nowej serii komputerów przeprowadzono następujące badanie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: ciągu 14 dni wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria jednego z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie więcej niż jednego komputera. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako prawdopodobieństwo awarii w czasie jednego dnia pracy?

Ta drobna zmiana oznacza istotną komplikację techniczną. Stosując oznaczenia z przykładu 12.4 widzimy, że funkcja wiarygodności ma teraz postać:


l(p)=a014a14(1a0a1)2


gdyż 1a0a1 oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:


l(p)=((1p)10)14(10p(1p)9)4(1(1p)1010p(1p)9)2


a więc sytuacja jest podobna do tej z ćwiczenia 12.2 - można wziąć logarytm z funkcji l, obliczyć jego pochodną i przyrównać do 0, jednak otrzymane w ten sposób równanie trzeba rozwiązywać numerycznie. Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru p jest:

p^=0.041,

a więc nieznacznie więcej niż w przykładzie 12.4.

Ćwiczenie 12.4

Znajdziemy estymator największej wiarygodności parametru a, w rozkładzie jednostajnym na przedziale (0,a).

Z warunków zadania wynika, że dysponujemy próbką prostą x1,,xn z rozkładu ciągłego, którego gęstość f jest następująca: f(x)=1a dla 0xa oraz f(x)=0 dla pozostałych x. Funkcją wiarygodności jest więc tutaj:


l(a)=f(x1)f(xn)


W związku z tym, jeżeli wszystkie punkty xi leżą w przedziale (0,a), to:


l(a)=1an


zaś w przeciwnym wypadku:


l(a)=0


Zatem:


Parser nie mógł rozpoznać (błąd składni): {\displaystyle l(a) = \left\{ \begin{array} {rl} \frac{1}{a^n} & \text{dla} a \geq \max\{x_1, \dots, x_n \}\\ 0 & \text{dla} 0 < a < \max\{x_1, \dots, x_n \}. \end{array} \right }


W nietrywialnym przypadku, czyli gdy max(x1,,xn)>0, funkcja ta jest dobrze określona, lecz nie jest ciągła w punkcie a=max{x1,,xn}. Jednak widać (narysuj wykres funkcji l), że akurat w tym punkcie funkcja l przyjmuje wartość największą. Tak więc estymatorem największej wiarygodności parametru a jest:


a^=max{x1,,xn}


o którym była już mowa w ćwiczeniu 11.1.


Zadanie 12.1 Znajdź wartość największą (o ile istnieje) funkcji f na zbiorze A:

  1. f(x)=x3x2+8x2, A=[2.2],
  2. f(x)=xx2+8x2, A=[0.4],
  3. f(x)=x2ln|x| dla x0, f(0)=0, A=,
  4. f(x)=x21x, A=[1,2],
  5. f(x)=max{x,1x2}, A=(0,1),
  6. f(x)=e|x|, A=,
  7. f(x)=x2x2, A={0,1,2,}.

Zadanie 12.2 Wyprowadź wzór na estymator największej wiarygodności parametru p, gdy próbka prosta pochodzi z rozkładu geometrycznego.

Zadanie 12.3 Wyprowadź wzór na estymator największej wiarygodności parametru λ, gdy próbka prosta pochodzi z rozkładu Poissona.

Zadanie 12.4 Testowano czas działania T nowej serii baterii do telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):


239,209,208,235,226,204,203,204,217,232


natomiast pięć innych baterii działało dłużej niż 240 godzin. Znajdź estymator parametru p zakładając, że rozkładu czasu działania baterii jest postaci:


P(T=k)=(1p)k201p dla k=201,202,203,


Korzystając z otrzymanego wyniku, określ średni czas działania baterii oraz oblicz prawdopodobieństwo tego, bateria z tej serii działa dłużej niż 220 godzin.

Zadanie 12.5 Metodą największej wiarygodności znajdź estymator parametru a, gdy próbka x1,,xn pochodzi z rozkładu jednostajnego na odcinku (a,0).

Zadanie 12.6 W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?

Zadanie 12.7 Mamy próbkę prostą x1,,xn z rozkładu wykładniczego oraz wiemy, że k dalszych niezależnych obserwacji xi z tego rozkładu ma wartość większą niż dana liczba T. Jaka jest nadzieja matematyczna tego rozkładu?