Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 12: Metoda największej wiarygodności: Różnice pomiędzy wersjami
m Zastępowanie tekstu – „<math> ” na „<math>” |
|||
(Nie pokazano 13 wersji utworzonych przez 2 użytkowników) | |||
Linia 2: | Linia 2: | ||
{{cwiczenie|12.1|cw 12.1| | {{cwiczenie|12.1|cw 12.1| | ||
Rozważmy próbkę prostą <math> | Rozważmy próbkę prostą <math>x_1, \dots, x_n</math> z rozkładu <math>N(m,\sigma)</math>. Znajdziemy | ||
estymatory największej wiarygodności parametrów <math> | estymatory największej wiarygodności parametrów <math>m</math> i <math>\sigma</math>. | ||
}} | }} | ||
Linia 9: | Linia 9: | ||
<center><math> | <center><math> | ||
f(x) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x | f(x) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x | ||
- m}{\sigma})^2}\;\; </math> dla <math> | - m}{\sigma})^2}\;\;</math> dla <math> x\in {\Bbb R}</math></center> | ||
</math></center> | |||
Linia 18: | Linia 17: | ||
<center><math> | <center><math> | ||
l(m,\sigma) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_1 | l(m,\sigma) = \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_1 | ||
- m}{\sigma})^2} \cdot \dots \cdot \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_n | - m}{\sigma})^2} \cdot \dots \cdot \frac{1}{\sqrt{2\pi}\sigma}\,e^{-\frac{1}{2}(\frac{x_n | ||
Linia 25: | Linia 24: | ||
<center><math> | <center><math> | ||
= \frac{1}{(\sqrt{2\pi}\sigma)^n}e^{- \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - m)^2} | = \frac{1}{(\sqrt{2\pi}\sigma)^n}e^{- \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - m)^2}</math></center> | ||
</math></center> | |||
Z postaci funkcji <math> | Z postaci funkcji <math>l</math> od razu widać, że przy każdym ustalonym <math>\sigma</math> przyjmuje ona wartość największą dla takiego <math>m</math>, | ||
dla którego funkcja: | dla którego funkcja: | ||
<center><math> | <center><math>l_1(m)=\sum_{i=1}^n(x_i - m)^2</math></center> | ||
osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową | osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej <math>m</math>, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla: <center><math>\hat{m} = \bar{x}</math>.</center> | ||
zmiennej <math> | |||
Rozważmy zatem funkcję: | Rozważmy zatem funkcję: | ||
<center><math> | <center><math>l_2(\sigma)=(\sqrt{2\pi})^n l(\bar{x},\sigma)</math>,</center> | ||
Linia 49: | Linia 46: | ||
<center><math> | <center><math> | ||
L(\sigma) = -n \ln \sigma - \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - \bar{x})^2 | L(\sigma) = -n \ln \sigma - \frac{1}{2\sigma^2}\sum_{i=1}^n(x_i - \bar{x})^2</math></center> | ||
</math></center> | |||
Linia 57: | Linia 53: | ||
<center><math> | <center><math> | ||
L'(\sigma) = \frac{-n}{\sigma} - \frac{1}{2\sigma^{3}}(-2)\sum_{i=1}^n(x_i - \bar{x})^2 = - \frac{n}{\sigma} + \frac{1}{\sigma^{3}}\sum_{i=1}^n(x_i - \bar{x})^2 | L'(\sigma) = \frac{-n}{\sigma} - \frac{1}{2\sigma^{3}}(-2)\sum_{i=1}^n(x_i - \bar{x})^2 = - \frac{n}{\sigma} + \frac{1}{\sigma^{3}}\sum_{i=1}^n(x_i - \bar{x})^2</math></center> | ||
</math></center> | |||
Linia 65: | Linia 60: | ||
<center><math> | <center><math> | ||
L'(\sigma) = 0 | L'(\sigma) = 0 | ||
</math></center> | </math></center> | ||
Linia 73: | Linia 68: | ||
<center><math> | <center><math> | ||
\widehat{\sigma} = \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i - \bar{x})^2} | \widehat{\sigma} = \sqrt{\frac{1}{n} \sum_{i=1}^n(x_i - \bar{x})^2}</math></center> | ||
</math></center> | |||
Linia 81: | Linia 75: | ||
<center><math> | <center><math>\hat{m} = \bar{x} = | ||
\frac{x_1+ \dots + x_n}{n}, \ \ \widehat{\sigma} =\sqrt{ | \frac{x_1+ \dots + x_n}{n}, \ \ \widehat{\sigma} =\sqrt{ | ||
\frac{(x_1-\bar{x}_n)^2 + \dots + (x_n - \bar{x}_n)^2}{n}} | \frac{(x_1-\bar{x}_n)^2 + \dots + (x_n - \bar{x}_n)^2}{n}}</math></center> | ||
</math></center> | |||
{{cwiczenie|12.2|cw 12.2| | {{cwiczenie|12.2|cw 12.2| | ||
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano <math> | Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano <math>n</math> próbek wody po | ||
100 ml (próbki typu <math> | 100 ml (próbki typu <math>A</math>) oraz <math>m</math> próbek wody po 300 ml (próbki typu <math>B</math>). Metoda laboratoryjna pozwala jedynie | ||
na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii | na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii | ||
w <math> | w <math>k</math> próbkach typu <math>A</math> oraz <math>l</math> próbkach typu <math>B</math>. Jaka jest | ||
średnia liczba bakterii w 1 litrze wody? | średnia liczba bakterii w 1 litrze wody? | ||
Linia 107: | Linia 100: | ||
uzyskując w ten sposób żądany wynik). | uzyskując w ten sposób żądany wynik). | ||
Niech więc <math> | Niech więc <math>X</math> oznacza liczbę bakterii w 100 ml wody. Zakładamy, że <math>X</math> ma rozkład Poissona | ||
z parametrem <math> | z parametrem <math>\lambda</math>. W związku z tym zmienna losowa <math>Y</math>, oznaczająca liczbę bakterii w 300 ml wody, | ||
ma rozkład Poissona z parametrem <math> | ma rozkład Poissona z parametrem <math>3\lambda</math>. Teraz wyniki badania można interpretować następująco: | ||
zaobserwowano zdarzenie, polegające na jednoczesnym | zaobserwowano zdarzenie, polegające na jednoczesnym | ||
zajściu: | zajściu: | ||
* <math> | * <math>k</math>zdarzeń postaci <math>\{X_i > 0\}</math>, | ||
* <math> | * <math>n- k</math>zdarzeń postaci <math>\{X_i = 0\}</math>, | ||
* <math> | * <math>l</math>zdarzeń postaci <math>\{Y_i > 0\}</math>, | ||
* <math> | * <math>m - l</math>zdarzeń postaci <math>\{Y_i = 0\}</math>, | ||
gdzie zmienne <math> | gdzie zmienne <math>X_i</math> tworzą próbkę prostą z <math>X</math>, zaś zmienne <math>Y_i</math> - próbkę prostą z <math>Y</math>. | ||
Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy | Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy | ||
jednak, że: | jednak, że: | ||
<center><math> | <center><math>P(X_i = 0) = P(X=0) = e^{-\lambda}</math></center> | ||
Linia 128: | Linia 121: | ||
<center><math> | <center><math>P(X_i > 0) = P(X>0) = 1- e^{-\lambda}</math></center> | ||
Linia 134: | Linia 127: | ||
<center><math> | <center><math>P(Y_i = 0) = P(Y=0) = e^{-3\lambda}</math></center> | ||
Linia 140: | Linia 133: | ||
<center><math> | <center><math>P(Y_i > 0) = P(Y>0) = 1- e^{-3\lambda}</math></center> | ||
Linia 146: | Linia 139: | ||
<center><math> | <center><math> | ||
l(q) = q^{n-k}(1-q)^{k}(q^3)^{m-l}(1-q^3)^{l} | l(q) = q^{n-k}(1-q)^{k}(q^3)^{m-l}(1-q^3)^{l} | ||
</math></center> | </math></center> | ||
gdzie <math> | gdzie <math>q = e^{-\lambda}</math>. | ||
Widać, że <math> | Widać, że <math>l(0) = l(1) = 0</math> oraz że <math>l</math> jest ciągła na przedziale <math>[0,1]</math>, | ||
tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję <math> | tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję <math>l</math> | ||
wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego | wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego | ||
estymatora. | estymatora. | ||
Linia 161: | Linia 154: | ||
<center><math> | <center><math>n =30,\; k = 8,\; m = 5, \;l = 3</math></center> | ||
Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do <math> | Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do <math>0</math>, otrzymując następujące równanie: | ||
<center><math> | <center><math> | ||
28\,{q}^{27} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{3}-8\, | 28\,{q}^{27} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{3}-8\, | ||
{q}^{28} \left( 1-q \right) ^{7} \left( 1-{q}^{3} \right) ^{3}</math></center> | {q}^{28} \left( 1-q \right) ^{7} \left( 1-{q}^{3} \right) ^{3}</math></center> | ||
<center><math> | <center><math>-9\,{q}^ | ||
{30} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{2} | {30} \left( 1-q \right) ^{8} \left( 1-{q}^{3} \right) ^{2} | ||
=0 | =0</math></center> | ||
</math></center> | |||
Linia 181: | Linia 173: | ||
<center><math> | <center><math> | ||
-28+8q+8q^2+45q^3 = 0 | -28+8q+8q^2+45q^3 = 0 | ||
</math></center> | </math></center> | ||
Równanie to można rozwiązać numerycznie w przedziale <math> | Równanie to można rozwiązać numerycznie w przedziale <math>(0,1)</math> otrzymując: | ||
<center><math> | <center><math>\hat{q} = 0.7342</math>,</center> | ||
czyli: <center><math> | czyli: <center><math>\hat{\lambda} = -\ln \hat{q} = 0.3089</math></center> | ||
Tak więc w jednym litrze wody są średnio nieco ponad <math> | Tak więc w jednym litrze wody są średnio nieco ponad <math>3</math> | ||
bakterie. | bakterie. | ||
{{cwiczenie|12.3|cw 12.3| | {{cwiczenie|12.3|cw 12.3| | ||
Zmodyfikujemy | Zmodyfikujemy [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykład 12.4]]. Treść zadania wygląda teraz następująco. | ||
Chcąc zbadać wadliwość nowej serii komputerów | Chcąc zbadać wadliwość nowej serii komputerów | ||
przeprowadzono następujące badanie: przez 20 dni | przeprowadzono następujące badanie: przez 20 dni | ||
Linia 212: | Linia 204: | ||
Ta drobna zmiana oznacza istotną komplikację techniczną. | Ta drobna zmiana oznacza istotną komplikację techniczną. | ||
Stosując oznaczenia z | Stosując oznaczenia z [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykładu 12.4]] widzimy, że | ||
funkcja wiarygodności ma teraz postać: | funkcja wiarygodności ma teraz postać: | ||
<center><math> | <center><math> | ||
l(p) = a_0^{14}a_1^4(1 - a_0 - a_1)^2 | l(p) = a_0^{14}a_1^4(1 - a_0 - a_1)^2 | ||
</math></center> | </math></center> | ||
gdyż <math> | gdyż <math>1 - a_0 - a_1</math> oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej: | ||
<center><math> | <center><math> | ||
l(p) = \left((1-p)^{10}\right)^{14} | l(p) = \left((1-p)^{10}\right)^{14} | ||
\left(10 p(1-p)^{9}\right)^{4}\left(1 - (1-p)^{10} - 10 p(1-p)^{9}\right)^2 | \left(10 p(1-p)^{9}\right)^{4}\left(1 - (1-p)^{10} - 10 p(1-p)^{9}\right)^2 | ||
</math></center> | </math></center> | ||
a więc sytuacja jest podobna do tej z | a więc sytuacja jest podobna do tej z [[#cw_12.2|ćwiczenia 12.2]] - | ||
można wziąć logarytm z funkcji <math> | można wziąć logarytm z funkcji <math>l</math>, obliczyć jego pochodną i przyrównać do <math>0</math>, jednak otrzymane | ||
w ten sposób równanie trzeba rozwiązywać numerycznie. | w ten sposób równanie trzeba rozwiązywać numerycznie. | ||
Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru <math> | Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru <math>p</math> jest: | ||
<center><math> | <center><math>\hat{p} = 0.041</math>,</center> | ||
a więc nieznacznie więcej niż w | a więc nieznacznie więcej niż w [[Rachunek prawdopodobieństwa i statystyka/Wykład 12: Metoda największej wiarygodności#przy_12.4|przykładzie 12.4]]. | ||
{{cwiczenie|12.4|cw 12.4| | {{cwiczenie|12.4|cw 12.4| | ||
Znajdziemy estymator największej wiarygodności parametru <math> | Znajdziemy estymator największej wiarygodności parametru <math>a</math>, w rozkładzie jednostajnym na przedziale <math>(0,a)</math>. | ||
}} | }} | ||
Z warunków zadania wynika, że dysponujemy próbką prostą <math> | Z warunków zadania wynika, że dysponujemy próbką prostą <math>x_1, \dots, x_n</math> z rozkładu ciągłego, którego gęstość <math>f</math> jest następująca: | ||
<math> | <math>f(x) = \frac{1}{a}</math> dla <math>0 \leq x \leq a</math> oraz <math>f(x) = 0</math> dla pozostałych <math>x</math>. Funkcją wiarygodności jest więc tutaj: | ||
<center><math> | <center><math> | ||
l(a) = f(x_1) \cdot \dots \cdot f(x_n) | l(a) = f(x_1) \cdot \dots \cdot f(x_n) | ||
</math></center> | </math></center> | ||
W związku z tym, jeżeli wszystkie punkty <math> | W związku z tym, jeżeli wszystkie punkty <math>x_i</math> leżą w przedziale <math>(0,a)</math>, | ||
to: | to: | ||
<center><math> | <center><math>l(a) = \frac{1}{a^n}</math></center> | ||
Linia 261: | Linia 253: | ||
<center><math> | <center><math>l(a) = 0</math></center> | ||
Linia 267: | Linia 259: | ||
<center><math> | <center><math> | ||
l(a) = \left\{ \begin{array} {rl} | l(a) = \left\{ \begin{array} {rl} | ||
\frac{1}{a^n} & \ | \frac{1}{a^n} & \text{dla} a \geq \max\{x_1, \dots, x_n \}\\ | ||
0 & \ | 0 & \text{dla} 0 < a < \max\{x_1, \dots, x_n \}. | ||
\end{array} \right | \end{array} \right | ||
</math></center> | </math></center> | ||
W nietrywialnym przypadku, czyli gdy <math> | W nietrywialnym przypadku, czyli gdy <math>\max(x_1, \dots, x_n ) > 0</math>, funkcja ta jest dobrze określona, | ||
lecz nie jest ciągła w punkcie <math> | lecz nie jest ciągła w punkcie <math>a = \max\{x_1, \dots, x_n \}</math>. | ||
Jednak widać (narysuj wykres funkcji <math> | Jednak widać (narysuj wykres funkcji <math>l</math>), że akurat w tym punkcie funkcja <math>l</math> przyjmuje wartość | ||
największą. Tak więc estymatorem największej wiarygodności parametru <math> | największą. Tak więc estymatorem największej wiarygodności parametru <math>a</math> jest: | ||
<center><math>\hat{a} = \max\{x_1, \dots, x_n \}</math></center> | |||
o którym była już mowa w [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 11: Wnioskowanie statystyczne#cw_11.1|ćwiczeniu 11.1]]. | |||
------------------------------------------------ | |||
'''{{kotwica|zad 12.1|Zadanie 12.1}}''' | |||
Znajdź wartość największą (o ile istnieje) funkcji <math> | Znajdź wartość największą (o ile istnieje) funkcji <math>f</math> na zbiorze <math>A</math>: | ||
# <math> | # <math>f(x) = x^3 - x^2 + 8x - 2</math>, <math>A = [-2.2]</math>, | ||
# <math> | # <math>f(x) = x - \sqrt{x^2 + 8x - 2}</math>, <math>A = [0.4]</math>, | ||
# <math> | # <math>f(x) = x^2\ln|x|</math> dla <math>x\neq 0</math>, <math>f(0) = 0</math>, <math>A = {\Bbb R}</math>, | ||
# <math> | # <math>f(x) = x^2 - \frac{1}{x}</math>, <math>A = [1,2]</math>, | ||
# <math> | # <math>f(x) = \max\{x,1-x^2\}</math>, <math>A = (0,1)</math>, | ||
# <math> | # <math>f(x) = e^{-|x|}</math>, <math>A = {\Bbb R}</math>, | ||
# <math> | # <math>f(x) = \frac{x-2}{x^2}</math>, <math>A = \{0,1,2, \dots\}</math>. | ||
'''{{kotwica|zad 12.2|Zadanie 12.2}}''' | |||
Wyprowadź wzór na estymator największej wiarygodności | Wyprowadź wzór na estymator największej wiarygodności | ||
parametru <math> | parametru <math>p</math>, gdy próbka prosta pochodzi z rozkładu | ||
geometrycznego. | geometrycznego. | ||
'''{{kotwica|zad 12.3|Zadanie 12.3}}''' | |||
Wyprowadź wzór na estymator największej wiarygodności | Wyprowadź wzór na estymator największej wiarygodności | ||
parametru <math> | parametru <math>\lambda</math>, gdy próbka prosta pochodzi z rozkładu | ||
Poissona. | Poissona. | ||
'''{{kotwica|zad 12.4|Zadanie 12.4}}''' | |||
Testowano czas działania <math> | Testowano czas działania <math>T</math> nowej serii baterii do | ||
telefonów komórkowych. Otrzymano następujące wyniki (w godzinach): | telefonów komórkowych. Otrzymano następujące wyniki (w godzinach): | ||
<center><math> | <center><math>239,\; 209,\; 208,\; 235,\; 226,\; 204,\; 203,\; 204,\; 217,\; 232</math></center> | ||
natomiast pięć innych baterii działało dłużej niż 240 godzin. | natomiast pięć innych baterii działało dłużej niż 240 godzin. | ||
Znajdź estymator parametru <math> | Znajdź estymator parametru <math>p</math> zakładając, że rozkładu czasu działania baterii | ||
jest postaci: | jest postaci: | ||
<center><math> | <center><math>P(T = k) = (1-p)^{k - 201}p\;\;</math> dla <math>k = 201, | ||
202, 203, \dots | 202, 203, \dots</math></center> | ||
Linia 329: | Linia 321: | ||
bateria z tej serii działa dłużej niż 220 godzin. | bateria z tej serii działa dłużej niż 220 godzin. | ||
'''{{kotwica|zad 12.5|Zadanie 12.5}}''' | |||
Metodą największej wiarygodności znajdź estymator | Metodą największej wiarygodności znajdź estymator | ||
parametru <math> | parametru <math>a</math>, gdy próbka <math>x_1, \dots, x_n</math> pochodzi z rozkładu jednostajnego na odcinku <math>(-a,0)</math>. | ||
'''{{kotwica|zad 12.6|Zadanie 12.6}}''' | |||
W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów? | W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów? | ||
'''{{kotwica|zad 12.7|Zadanie 12.7}}''' | |||
Mamy próbkę prostą <math> | Mamy próbkę prostą <math>x_1, \dots, x_n</math> z rozkładu wykładniczego oraz wiemy, że <math>k</math> dalszych | ||
niezależnych obserwacji <math> | niezależnych obserwacji <math>x_i</math> z tego rozkładu ma wartość większą niż dana liczba <math>T</math>. | ||
Jaka jest nadzieja matematyczna tego rozkładu? | Jaka jest nadzieja matematyczna tego rozkładu? |
Aktualna wersja na dzień 22:17, 11 wrz 2023
Ćwiczenia
Ćwiczenie 12.1
Rozważmy próbkę prostą z rozkładu . Znajdziemy estymatory największej wiarygodności parametrów i .
Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:
W związku z tym, funkcja wiarygodności ma postać:
Z postaci funkcji od razu widać, że przy każdym ustalonym przyjmuje ona wartość największą dla takiego ,
dla którego funkcja:
osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej
, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla:
Rozważmy zatem funkcję:
a następnie jej logarytm:
Obliczamy pochodną:
Zauważmy, jedynym rozwiązaniem równania:
jest liczba:
Ostatecznie więc otrzymujemy następujące estymatory:
Ćwiczenie 12.2
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano próbek wody po 100 ml (próbki typu ) oraz próbek wody po 300 ml (próbki typu ). Metoda laboratoryjna pozwala jedynie na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii w próbkach typu oraz próbkach typu . Jaka jest średnia liczba bakterii w 1 litrze wody?
Zanim przejdziemy do właściwego rozwiązania powyższego zadania, należy najpierw zdać sobie sprawę z tego, że rozkład bakterii w ustalonej porcji wody podlega w przybliżeniu rozkładowi Poissona -- mamy tu bowiem dużo doświadczeń (znalezienie się pojedynczej bakterii w ustalonej porcji wody) z niezwykle małym prawdopodobieństwem sukcesu każde. Dla ułatwienia zapisu przyjmujemy, że podstawowa objętość ma 100 ml (gdy już będziemy mieć średnią liczbę bakterii w tej objętości, to pomnożymy ją przez 10, uzyskując w ten sposób żądany wynik).
Niech więc oznacza liczbę bakterii w 100 ml wody. Zakładamy, że ma rozkład Poissona z parametrem . W związku z tym zmienna losowa , oznaczająca liczbę bakterii w 300 ml wody, ma rozkład Poissona z parametrem . Teraz wyniki badania można interpretować następująco: zaobserwowano zdarzenie, polegające na jednoczesnym zajściu:
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
gdzie zmienne tworzą próbkę prostą z , zaś zmienne - próbkę prostą z . Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy jednak, że:
a więc:
Podobnie:
zatem:
Ostatecznie więc funkcja wiarygodności ma postać:
gdzie .
Widać, że oraz że jest ciągła na przedziale ,
tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję
wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego
estymatora.
W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz ustalając konkretne wartości parametrów, powiedzmy:
Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do , otrzymując następujące równanie:
Po podzieleniu obu stron przez wspólny czynnik dostajemy:
Równanie to można rozwiązać numerycznie w przedziale otrzymując:
czyli:
Tak więc w jednym litrze wody są średnio nieco ponad
bakterie.
Ćwiczenie 12.3
Zmodyfikujemy przykład 12.4. Treść zadania wygląda teraz następująco. Chcąc zbadać wadliwość nowej serii komputerów przeprowadzono następujące badanie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: ciągu 14 dni wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria jednego z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie więcej niż jednego komputera. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako prawdopodobieństwo awarii w czasie jednego dnia pracy?
Ta drobna zmiana oznacza istotną komplikację techniczną. Stosując oznaczenia z przykładu 12.4 widzimy, że funkcja wiarygodności ma teraz postać:
gdyż oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:
a więc sytuacja jest podobna do tej z ćwiczenia 12.2 -
można wziąć logarytm z funkcji , obliczyć jego pochodną i przyrównać do , jednak otrzymane
w ten sposób równanie trzeba rozwiązywać numerycznie.
Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru jest:
a więc nieznacznie więcej niż w przykładzie 12.4.
Ćwiczenie 12.4
Znajdziemy estymator największej wiarygodności parametru , w rozkładzie jednostajnym na przedziale .
Z warunków zadania wynika, że dysponujemy próbką prostą z rozkładu ciągłego, którego gęstość jest następująca: dla oraz dla pozostałych . Funkcją wiarygodności jest więc tutaj:
W związku z tym, jeżeli wszystkie punkty leżą w przedziale ,
to:
zaś w przeciwnym wypadku:
Zatem:
W nietrywialnym przypadku, czyli gdy , funkcja ta jest dobrze określona,
lecz nie jest ciągła w punkcie .
Jednak widać (narysuj wykres funkcji ), że akurat w tym punkcie funkcja przyjmuje wartość
największą. Tak więc estymatorem największej wiarygodności parametru jest:
o którym była już mowa w ćwiczeniu 11.1.
Zadanie 12.1 Znajdź wartość największą (o ile istnieje) funkcji na zbiorze :
- , ,
- , ,
- dla , , ,
- , ,
- , ,
- , ,
- , .
Zadanie 12.2 Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu geometrycznego.
Zadanie 12.3 Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu Poissona.
Zadanie 12.4 Testowano czas działania nowej serii baterii do telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):
natomiast pięć innych baterii działało dłużej niż 240 godzin.
Znajdź estymator parametru zakładając, że rozkładu czasu działania baterii
jest postaci:
Korzystając z otrzymanego wyniku, określ średni czas
działania baterii oraz oblicz prawdopodobieństwo tego,
bateria z tej serii działa dłużej niż 220 godzin.
Zadanie 12.5 Metodą największej wiarygodności znajdź estymator parametru , gdy próbka pochodzi z rozkładu jednostajnego na odcinku .
Zadanie 12.6 W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?
Zadanie 12.7 Mamy próbkę prostą z rozkładu wykładniczego oraz wiemy, że dalszych niezależnych obserwacji z tego rozkładu ma wartość większą niż dana liczba . Jaka jest nadzieja matematyczna tego rozkładu?