Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 12: Metoda największej wiarygodności: Różnice pomiędzy wersjami
Nie podano opisu zmian |
m Zastępowanie tekstu – „<math> ” na „<math>” |
||
(Nie pokazano 15 wersji utworzonych przez 3 użytkowników) | |||
Linia 1: | Linia 1: | ||
==Ćwiczenia | ==Ćwiczenia== | ||
{{cwiczenie||| | {{cwiczenie|12.1|cw 12.1| | ||
Rozważmy próbkę prostą <math> | Rozważmy próbkę prostą <math>x_1, \dots, x_n</math> z rozkładu <math>N(m,\sigma)</math>. Znajdziemy | ||
estymatory największej wiarygodności parametrów <math> | estymatory największej wiarygodności parametrów <math>m</math> i <math>\sigma</math>. | ||
}} | }} | ||
Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem: | Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem: | ||
<center><math> | |||
<center><math> | |||
f(x) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x | f(x) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x | ||
- m}{\sigma})^2}\;\; </math> dla <math> | - m}{\sigma})^2}\;\;</math> dla <math> x\in {\Bbb R}</math></center> | ||
</math></center> | |||
W związku z tym, funkcja wiarygodności ma postać: | W związku z tym, funkcja wiarygodności ma postać: | ||
<center><math> | |||
<center><math> | |||
l(m,\sigma) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_1 | l(m,\sigma) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_1 | ||
- m}{\sigma})^2} \cdot \dots \cdot \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_n | - m}{\sigma})^2} \cdot \dots \cdot \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_n | ||
Linia 19: | Linia 23: | ||
</math></center> | </math></center> | ||
Z postaci funkcji <math> | <center><math> | ||
dla którego funkcja: <center><math> | = \frac{1}{(\sqrt{2\pi}\sigma)^n}e^{- \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - m)^2}</math></center> | ||
Z postaci funkcji <math>l</math> od razu widać, że przy każdym ustalonym <math>\sigma</math> przyjmuje ona wartość największą dla takiego <math>m</math>, | |||
dla którego funkcja: | |||
<center><math>l_1(m)=\sum_{i=1}^n(x_i - m)^2</math></center> | |||
osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową | osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej <math>m</math>, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla: <center><math>\hat{m} = \bar{x}</math>.</center> | ||
zmiennej <math> | |||
Rozważmy zatem funkcję: | Rozważmy zatem funkcję: | ||
<center><math> | |||
<center><math>l_2(\sigma)=(\sqrt{2\pi})^n l(\bar{x},\sigma)</math>,</center> | |||
a następnie jej logarytm: | a następnie jej logarytm: | ||
<center><math> | |||
L(\sigma) = -n \ln \sigma - \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - \bar{x})^2 | |||
</math></center> | <center><math> | ||
L(\sigma) = -n \ln \sigma - \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - \bar{x})^2</math></center> | |||
Obliczamy pochodną: | Obliczamy pochodną: | ||
<center><math> | |||
L'(\sigma) = \frac{-n}{\sigma} - \frac{1}{2\sigma^{3}}(-2)\sum_{i=1}^n(x_i - \bar{x})^2 = - \frac{n}{\sigma} + \frac{1}{\sigma^{3}}\sum_{i=1}^n(x_i - \bar{x})^2 | |||
</math></center> | <center><math> | ||
L'(\sigma) = \frac{-n}{\sigma} - \frac{1}{2\sigma^{3}}(-2)\sum_{i=1}^n(x_i - \bar{x})^2 = - \frac{n}{\sigma} + \frac{1}{\sigma^{3}}\sum_{i=1}^n(x_i - \bar{x})^2</math></center> | |||
Zauważmy, jedynym rozwiązaniem równania: | Zauważmy, jedynym rozwiązaniem równania: | ||
<center><math> | |||
<center><math> | |||
L'(\sigma) = 0 | L'(\sigma) = 0 | ||
</math></center> | </math></center> | ||
jest liczba: | jest liczba: | ||
<center><math> | |||
\widehat{\sigma} = \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i - \bar{x})^2} | |||
</math></center> | <center><math> | ||
\widehat{\sigma} = \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i - \bar{x})^2}</math></center> | |||
Ostatecznie więc otrzymujemy następujące estymatory: | Ostatecznie więc otrzymujemy następujące estymatory: | ||
<center><math> | |||
<center><math>\hat{m} = \bar{x} = | |||
\frac{x_1+ \dots + x_n}{n}, \ \ \widehat{\sigma} =\sqrt{ | \frac{x_1+ \dots + x_n}{n}, \ \ \widehat{\sigma} =\sqrt{ | ||
\frac{(x_1-\bar{x}_n)^2 + \dots + (x_n - \bar{x}_n)^2}{n}} | \frac{(x_1-\bar{x}_n)^2 + \dots + (x_n - \bar{x}_n)^2}{n}}</math></center> | ||
</math></center> | |||
{{cwiczenie||| | {{cwiczenie|12.2|cw 12.2| | ||
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano <math> | Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano <math>n</math> próbek wody po | ||
100 ml (próbki typu <math> | 100 ml (próbki typu <math>A</math>) oraz <math>m</math> próbek wody po 300 ml (próbki typu <math>B</math>). Metoda laboratoryjna pozwala jedynie | ||
na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii | na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii | ||
w <math> | w <math>k</math> próbkach typu <math>A</math> oraz <math>l</math> próbkach typu <math>B</math>. Jaka jest | ||
średnia liczba bakterii w 1 litrze wody? | średnia liczba bakterii w 1 litrze wody? | ||
Linia 77: | Linia 100: | ||
uzyskując w ten sposób żądany wynik). | uzyskując w ten sposób żądany wynik). | ||
Niech więc <math> | Niech więc <math>X</math> oznacza liczbę bakterii w 100 ml wody. Zakładamy, że <math>X</math> ma rozkład Poissona | ||
z parametrem <math> | z parametrem <math>\lambda</math>. W związku z tym zmienna losowa <math>Y</math>, oznaczająca liczbę bakterii w 300 ml wody, | ||
ma rozkład Poissona z parametrem <math> | ma rozkład Poissona z parametrem <math>3\lambda</math>. Teraz wyniki badania można interpretować następująco: | ||
zaobserwowano zdarzenie, polegające na jednoczesnym | zaobserwowano zdarzenie, polegające na jednoczesnym | ||
zajściu: | zajściu: | ||
* <math> | * <math>k</math>zdarzeń postaci <math>\{X_i > 0\}</math>, | ||
* <math> | * <math>n- k</math>zdarzeń postaci <math>\{X_i = 0\}</math>, | ||
* <math> | * <math>l</math>zdarzeń postaci <math>\{Y_i > 0\}</math>, | ||
* <math> | * <math>m - l</math>zdarzeń postaci <math>\{Y_i = 0\}</math>, | ||
gdzie zmienne <math> | gdzie zmienne <math>X_i</math> tworzą próbkę prostą z <math>X</math>, zaś zmienne <math>Y_i</math> - próbkę prostą z <math>Y</math>. | ||
Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy | Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy | ||
jednak, że: <center><math> | jednak, że: | ||
<center><math>P(X_i = 0) = P(X=0) = e^{-\lambda}</math></center> | |||
a więc: | a więc: | ||
<center><math> | |||
<center><math>P(X_i > 0) = P(X>0) = 1- e^{-\lambda}</math></center> | |||
Podobnie: | Podobnie: | ||
zatem: | |||
<center><math>P(Y_i = 0) = P(Y=0) = e^{-3\lambda}</math></center> | |||
zatem: | |||
<center><math>P(Y_i > 0) = P(Y>0) = 1- e^{-3\lambda}</math></center> | |||
Ostatecznie więc funkcja wiarygodności ma postać: | Ostatecznie więc funkcja wiarygodności ma postać: | ||
<center><math> | |||
l(q) = q^{n-k}(1-q)^{k}(q^3)^{m-l}(1-q^3)^{l} | |||
<center><math> | |||
l(q) = q^{n-k}(1-q)^{k}(q^3)^{m-l}(1-q^3)^{l} | |||
</math></center> | </math></center> | ||
gdzie <math> | |||
Widać, że <math> | gdzie <math>q = e^{-\lambda}</math>. | ||
tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję <math> | Widać, że <math>l(0) = l(1) = 0</math> oraz że <math>l</math> jest ciągła na przedziale <math>[0,1]</math>, | ||
tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję <math>l</math> | |||
wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego | wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego | ||
estymatora. | estymatora. | ||
Linia 112: | Linia 152: | ||
W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz | W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz | ||
ustalając konkretne wartości parametrów, powiedzmy: | ustalając konkretne wartości parametrów, powiedzmy: | ||
Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do <math> | |||
<center><math> | <center><math>n =30,\; k = 8,\; m = 5, \;l = 3</math></center> | ||
Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do <math>0</math>, otrzymując następujące równanie: | |||
<center><math> | |||
28\,{q}^{27} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{3}-8\, | 28\,{q}^{27} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{3}-8\, | ||
{q}^{28} \left( 1-q \right) ^{7} \left( 1-{q}^{3} \right) ^{3}</math></center> | {q}^{28} \left( 1-q \right) ^{7} \left( 1-{q}^{3} \right) ^{3}</math></center> | ||
<center><math> | |||
<center><math>-9\,{q}^ | |||
{30} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{2} | {30} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{2} | ||
=0 | =0</math></center> | ||
</math></center> | |||
Po podzieleniu obu stron przez wspólny czynnik dostajemy: | Po podzieleniu obu stron przez wspólny czynnik dostajemy: | ||
<center><math> | |||
-28+8q+8q^2+45q^3 = 0 | |||
<center><math> | |||
-28+8q+8q^2+45q^3 = 0 | |||
</math></center> | </math></center> | ||
Tak więc w jednym litrze wody są średnio nieco ponad <math> | Równanie to można rozwiązać numerycznie w przedziale <math>(0,1)</math> otrzymując: | ||
<center><math>\hat{q} = 0.7342</math>,</center> | |||
czyli: <center><math>\hat{\lambda} = -\ln \hat{q} = 0.3089</math></center> | |||
Tak więc w jednym litrze wody są średnio nieco ponad <math>3</math> | |||
bakterie. | bakterie. | ||
{{cwiczenie||| | {{cwiczenie|12.3|cw 12.3| | ||
Zmodyfikujemy | Zmodyfikujemy [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykład 12.4]]. Treść zadania wygląda teraz następująco. | ||
Chcąc zbadać wadliwość nowej serii komputerów | Chcąc zbadać wadliwość nowej serii komputerów | ||
przeprowadzono następujące badanie: przez 20 dni | przeprowadzono następujące badanie: przez 20 dni | ||
Linia 152: | Linia 204: | ||
Ta drobna zmiana oznacza istotną komplikację techniczną. | Ta drobna zmiana oznacza istotną komplikację techniczną. | ||
Stosując oznaczenia z | Stosując oznaczenia z [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykładu 12.4]] widzimy, że | ||
funkcja wiarygodności ma teraz postać: | funkcja wiarygodności ma teraz postać: | ||
<center><math> | |||
l(p) = a_0^{14}a_1^4(1 - a_0 - a_1)^2 | |||
<center><math> | |||
l(p) = a_0^{14}a_1^4(1 - a_0 - a_1)^2 | |||
</math></center> | </math></center> | ||
gdyż <math> | |||
<center><math> | gdyż <math>1 - a_0 - a_1</math> oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej: | ||
<center><math> | |||
l(p) = \left((1-p)^{10}\right)^{14} | l(p) = \left((1-p)^{10}\right)^{14} | ||
\left(10 p(1-p)^{9}\right)^{4}\left(1 - (1-p)^{10} - 10 p(1-p)^{9}\right)^2 | \left(10 p(1-p)^{9}\right)^{4}\left(1 - (1-p)^{10} - 10 p(1-p)^{9}\right)^2 | ||
</math></center> | </math></center> | ||
a więc sytuacja jest podobna do tej z | |||
można wziąć logarytm z funkcji <math> | a więc sytuacja jest podobna do tej z [[#cw_12.2|ćwiczenia 12.2]] - | ||
można wziąć logarytm z funkcji <math>l</math>, obliczyć jego pochodną i przyrównać do <math>0</math>, jednak otrzymane | |||
w ten sposób równanie trzeba rozwiązywać numerycznie. | w ten sposób równanie trzeba rozwiązywać numerycznie. | ||
Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru <math> | Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru <math>p</math> jest: | ||
<center><math> | <center><math>\hat{p} = 0.041</math>,</center> | ||
a więc nieznacznie więcej niż w | a więc nieznacznie więcej niż w [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykładzie 12.4]]. | ||
{{cwiczenie||| | {{cwiczenie|12.4|cw 12.4| | ||
Znajdziemy estymator największej wiarygodności parametru <math> | Znajdziemy estymator największej wiarygodności parametru <math>a</math>, w rozkładzie jednostajnym na przedziale <math>(0,a)</math>. | ||
}} | }} | ||
Z warunków zadania wynika, że dysponujemy próbką prostą <math> | Z warunków zadania wynika, że dysponujemy próbką prostą <math>x_1, \dots, x_n</math> z rozkładu ciągłego, którego gęstość <math>f</math> jest następująca: | ||
<math> | <math>f(x) = \frac{1}{a}</math> dla <math>0 \leq x \leq a</math> oraz <math>f(x) = 0</math> dla pozostałych <math>x</math>. Funkcją wiarygodności jest więc tutaj: | ||
<center><math> | |||
l(a) = f(x_1) \cdot \dots \cdot f(x_n) | |||
<center><math> | |||
l(a) = f(x_1) \cdot \dots \cdot f(x_n) | |||
</math></center> | </math></center> | ||
W związku z tym, jeżeli wszystkie punkty <math> | |||
W związku z tym, jeżeli wszystkie punkty <math>x_i</math> leżą w przedziale <math>(0,a)</math>, | |||
to: | to: | ||
<center><math> | |||
<center><math>l(a) = \frac{1}{a^n}</math></center> | |||
zaś w przeciwnym wypadku: | zaś w przeciwnym wypadku: | ||
<center><math> | |||
<center><math>l(a) = 0</math></center> | |||
Zatem: | Zatem: | ||
<center><math> | |||
<center><math> | |||
l(a) = \left\{ \begin{array} {rl} | l(a) = \left\{ \begin{array} {rl} | ||
\frac{1}{a^n} & \ | \frac{1}{a^n} & \text{dla} a \geq \max\{x_1, \dots, x_n \}\\ | ||
0 & \ | 0 & \text{dla} 0 < a < \max\{x_1, \dots, x_n \}. | ||
\end{array} \right | \end{array} \right | ||
</math></center> | </math></center> | ||
W nietrywialnym przypadku, czyli gdy <math>\max(x_1, \dots, x_n ) > 0</math>, funkcja ta jest dobrze określona, | |||
lecz nie jest ciągła w punkcie <math>a = \max\{x_1, \dots, x_n \}</math>. | |||
Jednak widać (narysuj wykres funkcji <math>l</math>), że akurat w tym punkcie funkcja <math>l</math> przyjmuje wartość | |||
największą. Tak więc estymatorem największej wiarygodności parametru <math>a</math> jest: | |||
<math>\ | <center><math>\hat{a} = \max\{x_1, \dots, x_n \}</math></center> | ||
o którym była już mowa w [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 11: Wnioskowanie statystyczne#cw_11.1|ćwiczeniu 11.1]]. | |||
------------------------------------------------ | |||
<math> | '''{{kotwica|zad 12.1|Zadanie 12.1}}''' | ||
Znajdź wartość największą (o ile istnieje) funkcji <math>f</math> na zbiorze <math>A</math>: | |||
<math>\ | # <math>f(x) = x^3 - x^2 + 8x - 2</math>, <math>A = [-2.2]</math>, | ||
# <math>f(x) = x - \sqrt{x^2 + 8x - 2}</math>, <math>A = [0.4]</math>, | |||
# <math>f(x) = x^2\ln|x|</math> dla <math>x\neq 0</math>, <math>f(0) = 0</math>, <math>A = {\Bbb R}</math>, | |||
# <math>f(x) = x^2 - \frac{1}{x}</math>, <math>A = [1,2]</math>, | |||
# <math>f(x) = \max\{x,1-x^2\}</math>, <math>A = (0,1)</math>, | |||
# <math>f(x) = e^{-|x|}</math>, <math>A = {\Bbb R}</math>, | |||
# <math>f(x) = \frac{x-2}{x^2}</math>, <math>A = \{0,1,2, \dots\}</math>. | |||
'''{{kotwica|zad 12.2|Zadanie 12.2}}''' | |||
Wyprowadź wzór na estymator największej wiarygodności | Wyprowadź wzór na estymator największej wiarygodności | ||
parametru <math> | parametru <math>p</math>, gdy próbka prosta pochodzi z rozkładu | ||
geometrycznego. | geometrycznego. | ||
'''{{kotwica|zad 12.3|Zadanie 12.3}}''' | |||
{{ | |||
Wyprowadź wzór na estymator największej wiarygodności | Wyprowadź wzór na estymator największej wiarygodności | ||
parametru <math> | parametru <math>\lambda</math>, gdy próbka prosta pochodzi z rozkładu | ||
Poissona. | Poissona. | ||
}} | '''{{kotwica|zad 12.4|Zadanie 12.4}}''' | ||
Testowano czas działania <math>T</math> nowej serii baterii do | |||
telefonów komórkowych. Otrzymano następujące wyniki (w godzinach): | |||
<center><math>239,\; 209,\; 208,\; 235,\; 226,\; 204,\; 203,\; 204,\; 217,\; 232</math></center> | |||
natomiast pięć innych baterii działało dłużej niż 240 godzin. | natomiast pięć innych baterii działało dłużej niż 240 godzin. | ||
Znajdź estymator parametru <math> | Znajdź estymator parametru <math>p</math> zakładając, że rozkładu czasu działania baterii | ||
jest postaci: <center><math> | jest postaci: | ||
202, 203, \dots | |||
<center><math>P(T = k) = (1-p)^{k - 201}p\;\;</math> dla <math>k = 201, | |||
202, 203, \dots</math></center> | |||
Korzystając z otrzymanego wyniku, określ średni czas | Korzystając z otrzymanego wyniku, określ średni czas | ||
działania baterii oraz oblicz prawdopodobieństwo tego, | działania baterii oraz oblicz prawdopodobieństwo tego, | ||
bateria z tej serii działa dłużej niż 220 godzin. | bateria z tej serii działa dłużej niż 220 godzin. | ||
{{ | '''{{kotwica|zad 12.5|Zadanie 12.5}}''' | ||
Metodą największej wiarygodności znajdź estymator | Metodą największej wiarygodności znajdź estymator | ||
parametru <math> | parametru <math>a</math>, gdy próbka <math>x_1, \dots, x_n</math> pochodzi z rozkładu jednostajnego na odcinku <math>(-a,0)</math>. | ||
{{ | '''{{kotwica|zad 12.6|Zadanie 12.6}}''' | ||
W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów? | W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów? | ||
'''{{kotwica|zad 12.7|Zadanie 12.7}}''' | |||
Mamy próbkę prostą <math>x_1, \dots, x_n</math> z rozkładu wykładniczego oraz wiemy, że <math>k</math> dalszych | |||
{{ | niezależnych obserwacji <math>x_i</math> z tego rozkładu ma wartość większą niż dana liczba <math>T</math>. | ||
Mamy próbkę prostą <math> | |||
niezależnych obserwacji <math> | |||
Jaka jest nadzieja matematyczna tego rozkładu? | Jaka jest nadzieja matematyczna tego rozkładu? | ||
Aktualna wersja na dzień 22:17, 11 wrz 2023
Ćwiczenia
Ćwiczenie 12.1
Rozważmy próbkę prostą z rozkładu . Znajdziemy estymatory największej wiarygodności parametrów i .
Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:
W związku z tym, funkcja wiarygodności ma postać:
Z postaci funkcji od razu widać, że przy każdym ustalonym przyjmuje ona wartość największą dla takiego ,
dla którego funkcja:
osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej
, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla:
Rozważmy zatem funkcję:
a następnie jej logarytm:
Obliczamy pochodną:
Zauważmy, jedynym rozwiązaniem równania:
jest liczba:
Ostatecznie więc otrzymujemy następujące estymatory:
Ćwiczenie 12.2
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano próbek wody po 100 ml (próbki typu ) oraz próbek wody po 300 ml (próbki typu ). Metoda laboratoryjna pozwala jedynie na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii w próbkach typu oraz próbkach typu . Jaka jest średnia liczba bakterii w 1 litrze wody?
Zanim przejdziemy do właściwego rozwiązania powyższego zadania, należy najpierw zdać sobie sprawę z tego, że rozkład bakterii w ustalonej porcji wody podlega w przybliżeniu rozkładowi Poissona -- mamy tu bowiem dużo doświadczeń (znalezienie się pojedynczej bakterii w ustalonej porcji wody) z niezwykle małym prawdopodobieństwem sukcesu każde. Dla ułatwienia zapisu przyjmujemy, że podstawowa objętość ma 100 ml (gdy już będziemy mieć średnią liczbę bakterii w tej objętości, to pomnożymy ją przez 10, uzyskując w ten sposób żądany wynik).
Niech więc oznacza liczbę bakterii w 100 ml wody. Zakładamy, że ma rozkład Poissona z parametrem . W związku z tym zmienna losowa , oznaczająca liczbę bakterii w 300 ml wody, ma rozkład Poissona z parametrem . Teraz wyniki badania można interpretować następująco: zaobserwowano zdarzenie, polegające na jednoczesnym zajściu:
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
gdzie zmienne tworzą próbkę prostą z , zaś zmienne - próbkę prostą z . Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy jednak, że:
a więc:
Podobnie:
zatem:
Ostatecznie więc funkcja wiarygodności ma postać:
gdzie .
Widać, że oraz że jest ciągła na przedziale ,
tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję
wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego
estymatora.
W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz ustalając konkretne wartości parametrów, powiedzmy:
Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do , otrzymując następujące równanie:
Po podzieleniu obu stron przez wspólny czynnik dostajemy:
Równanie to można rozwiązać numerycznie w przedziale otrzymując:
czyli:
Tak więc w jednym litrze wody są średnio nieco ponad
bakterie.
Ćwiczenie 12.3
Zmodyfikujemy przykład 12.4. Treść zadania wygląda teraz następująco. Chcąc zbadać wadliwość nowej serii komputerów przeprowadzono następujące badanie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: ciągu 14 dni wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria jednego z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie więcej niż jednego komputera. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako prawdopodobieństwo awarii w czasie jednego dnia pracy?
Ta drobna zmiana oznacza istotną komplikację techniczną. Stosując oznaczenia z przykładu 12.4 widzimy, że funkcja wiarygodności ma teraz postać:
gdyż oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:
a więc sytuacja jest podobna do tej z ćwiczenia 12.2 -
można wziąć logarytm z funkcji , obliczyć jego pochodną i przyrównać do , jednak otrzymane
w ten sposób równanie trzeba rozwiązywać numerycznie.
Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru jest:
a więc nieznacznie więcej niż w przykładzie 12.4.
Ćwiczenie 12.4
Znajdziemy estymator największej wiarygodności parametru , w rozkładzie jednostajnym na przedziale .
Z warunków zadania wynika, że dysponujemy próbką prostą z rozkładu ciągłego, którego gęstość jest następująca: dla oraz dla pozostałych . Funkcją wiarygodności jest więc tutaj:
W związku z tym, jeżeli wszystkie punkty leżą w przedziale ,
to:
zaś w przeciwnym wypadku:
Zatem:
W nietrywialnym przypadku, czyli gdy , funkcja ta jest dobrze określona,
lecz nie jest ciągła w punkcie .
Jednak widać (narysuj wykres funkcji ), że akurat w tym punkcie funkcja przyjmuje wartość
największą. Tak więc estymatorem największej wiarygodności parametru jest:
o którym była już mowa w ćwiczeniu 11.1.
Zadanie 12.1 Znajdź wartość największą (o ile istnieje) funkcji na zbiorze :
- , ,
- , ,
- dla , , ,
- , ,
- , ,
- , ,
- , .
Zadanie 12.2 Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu geometrycznego.
Zadanie 12.3 Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu Poissona.
Zadanie 12.4 Testowano czas działania nowej serii baterii do telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):
natomiast pięć innych baterii działało dłużej niż 240 godzin.
Znajdź estymator parametru zakładając, że rozkładu czasu działania baterii
jest postaci:
Korzystając z otrzymanego wyniku, określ średni czas
działania baterii oraz oblicz prawdopodobieństwo tego,
bateria z tej serii działa dłużej niż 220 godzin.
Zadanie 12.5 Metodą największej wiarygodności znajdź estymator parametru , gdy próbka pochodzi z rozkładu jednostajnego na odcinku .
Zadanie 12.6 W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?
Zadanie 12.7 Mamy próbkę prostą z rozkładu wykładniczego oraz wiemy, że dalszych niezależnych obserwacji z tego rozkładu ma wartość większą niż dana liczba . Jaka jest nadzieja matematyczna tego rozkładu?