Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 12: Metoda największej wiarygodności: Różnice pomiędzy wersjami
Linia 287: | Linia 287: | ||
===Zadanie 12.1=== | ==={{kotwica|zad 12.1|Zadanie 12.1}}=== | ||
Znajdź wartość największą (o ile istnieje) funkcji <math>\displaystyle f</math> na zbiorze <math>\displaystyle A</math>: | Znajdź wartość największą (o ile istnieje) funkcji <math>\displaystyle f</math> na zbiorze <math>\displaystyle A</math>: | ||
<math>\displaystyle f(x) = x^3 - x^2 + 8x - 2</math>, <math>\displaystyle A = [-2.2]</math>, | # <math>\displaystyle f(x) = x^3 - x^2 + 8x - 2</math>, <math>\displaystyle A = [-2.2]</math>, | ||
# <math>\displaystyle f(x) = x - \sqrt{x^2 + 8x - 2}</math>, <math>\displaystyle A = [0.4]</math>, | |||
# <math>\displaystyle f(x) = x^2\ln|x|</math> dla <math>\displaystyle x\neq 0</math>, <math>\displaystyle f(0) = 0</math>, <math>\displaystyle A = {\Bbb R}</math>, | |||
# <math>\displaystyle \displaystyle f(x) = x^2 - \frac{1}{x}</math>, <math>\displaystyle A = [1,2]</math>, | |||
# <math>\displaystyle f(x) = \max\{x,1-x^2\}</math>, <math>\displaystyle A = (0,1)</math>, | |||
# <math>\displaystyle f(x) = e^{-|x|}</math>, <math>\displaystyle A = {\Bbb R}</math>, | |||
# <math>\displaystyle f(x) = \frac{x-2}{x^2}</math>, <math>\displaystyle A = \{0,1,2, \dots\}</math>. | |||
==={{kotwica|zad 12.2|Zadanie 12.2}}=== | |||
Wyprowadź wzór na estymator największej wiarygodności | Wyprowadź wzór na estymator największej wiarygodności | ||
parametru <math>\displaystyle p</math>, gdy próbka prosta pochodzi z rozkładu | parametru <math>\displaystyle p</math>, gdy próbka prosta pochodzi z rozkładu | ||
geometrycznego. | geometrycznego. | ||
==={{kotwica|zad 12.3|Zadanie 12.3}}=== | |||
{{ | |||
Wyprowadź wzór na estymator największej wiarygodności | Wyprowadź wzór na estymator największej wiarygodności | ||
parametru <math>\displaystyle \lambda</math>, gdy próbka prosta pochodzi z rozkładu | parametru <math>\displaystyle \lambda</math>, gdy próbka prosta pochodzi z rozkładu | ||
Poissona. | Poissona. | ||
==={{kotwica|zad 12.4|Zadanie 12.4}}=== | |||
{{ | |||
Testowano czas działania <math>\displaystyle T</math> nowej serii baterii do | Testowano czas działania <math>\displaystyle T</math> nowej serii baterii do | ||
telefonów komórkowych. Otrzymano następujące wyniki (w godzinach): | telefonów komórkowych. Otrzymano następujące wyniki (w godzinach): | ||
<center><math>\displaystyle 239,\; 209,\; 208,\; 235,\; 226,\; 204,\; 203,\; 204,\; 217,\; 232,</math></center> | <center><math>\displaystyle 239,\; 209,\; 208,\; 235,\; 226,\; 204,\; 203,\; 204,\; 217,\; 232,</math></center> | ||
natomiast pięć innych baterii działało dłużej niż 240 godzin. | natomiast pięć innych baterii działało dłużej niż 240 godzin. | ||
Znajdź estymator parametru <math>\displaystyle p</math> zakładając, że rozkładu czasu działania baterii | Znajdź estymator parametru <math>\displaystyle p</math> zakładając, że rozkładu czasu działania baterii | ||
jest postaci: <center><math>\displaystyle P(T = k) = (1-p)^{k - 201}p\;\; </math> dla <math>\displaystyle k = 201, | jest postaci: | ||
<center><math>\displaystyle P(T = k) = (1-p)^{k - 201}p\;\; </math> dla <math>\displaystyle k = 201, | |||
202, 203, \dots .</math></center> | 202, 203, \dots .</math></center> | ||
Korzystając z otrzymanego wyniku, określ średni czas | Korzystając z otrzymanego wyniku, określ średni czas | ||
działania baterii oraz oblicz prawdopodobieństwo tego, | działania baterii oraz oblicz prawdopodobieństwo tego, | ||
bateria z tej serii działa dłużej niż 220 godzin. | bateria z tej serii działa dłużej niż 220 godzin. | ||
{{ | ==={{kotwica|zad 12.5|Zadanie 12.5}}=== | ||
Metodą największej wiarygodności znajdź estymator | Metodą największej wiarygodności znajdź estymator | ||
parametru <math>\displaystyle a</math>, gdy próbka <math>\displaystyle x_1, \dots, x_n</math> pochodzi z rozkładu jednostajnego na odcinku <math>\displaystyle (-a,0)</math>. | parametru <math>\displaystyle a</math>, gdy próbka <math>\displaystyle x_1, \dots, x_n</math> pochodzi z rozkładu jednostajnego na odcinku <math>\displaystyle (-a,0)</math>. | ||
==={{kotwica|zad 12.6|Zadanie 12.6}}=== | |||
{{ | |||
W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów? | W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów? | ||
==={{kotwica|zad 12.7|Zadanie 12.7}}=== | |||
{{ | |||
Mamy próbkę prostą <math>\displaystyle x_1, \dots, x_n</math> z rozkładu wykładniczego oraz wiemy, że <math>\displaystyle k</math> dalszych | Mamy próbkę prostą <math>\displaystyle x_1, \dots, x_n</math> z rozkładu wykładniczego oraz wiemy, że <math>\displaystyle k</math> dalszych | ||
niezależnych obserwacji <math>\displaystyle x_i</math> z tego rozkładu ma wartość większą niż dana liczba <math>\displaystyle T</math>. | niezależnych obserwacji <math>\displaystyle x_i</math> z tego rozkładu ma wartość większą niż dana liczba <math>\displaystyle T</math>. | ||
Jaka jest nadzieja matematyczna tego rozkładu? | Jaka jest nadzieja matematyczna tego rozkładu? | ||
Wersja z 11:18, 24 sie 2006
Ćwiczenia
Ćwiczenie 12.1
Rozważmy próbkę prostą z rozkładu . Znajdziemy estymatory największej wiarygodności parametrów i .
Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:
W związku z tym, funkcja wiarygodności ma postać:
Z postaci funkcji od razu widać, że przy każdym ustalonym przyjmuje ona wartość największą dla takiego ,
dla którego funkcja:
osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową
zmiennej
, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla:
Rozważmy zatem funkcję:
a następnie jej logarytm:
Obliczamy pochodną:
Zauważmy, jedynym rozwiązaniem równania:
jest liczba:
Ostatecznie więc otrzymujemy następujące estymatory:
Ćwiczenie 12.2
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano próbek wody po 100 ml (próbki typu ) oraz próbek wody po 300 ml (próbki typu ). Metoda laboratoryjna pozwala jedynie na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii w próbkach typu oraz próbkach typu . Jaka jest średnia liczba bakterii w 1 litrze wody?
Zanim przejdziemy do właściwego rozwiązania powyższego zadania, należy najpierw zdać sobie sprawę z tego, że rozkład bakterii w ustalonej porcji wody podlega w przybliżeniu rozkładowi Poissona -- mamy tu bowiem dużo doświadczeń (znalezienie się pojedynczej bakterii w ustalonej porcji wody) z niezwykle małym prawdopodobieństwem sukcesu każde. Dla ułatwienia zapisu przyjmujemy, że podstawowa objętość ma 100 ml (gdy już będziemy mieć średnią liczbę bakterii w tej objętości, to pomnożymy ją przez 10, uzyskując w ten sposób żądany wynik).
Niech więc oznacza liczbę bakterii w 100 ml wody. Zakładamy, że ma rozkład Poissona z parametrem . W związku z tym zmienna losowa , oznaczająca liczbę bakterii w 300 ml wody, ma rozkład Poissona z parametrem . Teraz wyniki badania można interpretować następująco: zaobserwowano zdarzenie, polegające na jednoczesnym zajściu:
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
gdzie zmienne tworzą próbkę prostą z , zaś zmienne - próbkę prostą z . Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy jednak, że:
a więc:
Podobnie:
zatem:
Ostatecznie więc funkcja wiarygodności ma postać:
gdzie .
Widać, że oraz że jest ciągła na przedziale ,
tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję
wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego
estymatora.
W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz ustalając konkretne wartości parametrów, powiedzmy:
Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do , otrzymując następujące równanie:
Po podzieleniu obu stron przez wspólny czynnik dostajemy:
Równanie to można rozwiązać numerycznie w przedziale otrzymując:
czyli:
Tak więc w jednym litrze wody są średnio nieco ponad
bakterie.
Ćwiczenie 12.3
Zmodyfikujemy przykład 12.4. Treść zadania wygląda teraz następująco. Chcąc zbadać wadliwość nowej serii komputerów przeprowadzono następujące badanie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: ciągu 14 dni wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria jednego z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie więcej niż jednego komputera. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako prawdopodobieństwo awarii w czasie jednego dnia pracy?
Ta drobna zmiana oznacza istotną komplikację techniczną. Stosując oznaczenia z przykładu 12.4 widzimy, że funkcja wiarygodności ma teraz postać:
gdyż oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:
a więc sytuacja jest podobna do tej z ćwiczenia 12.2 -
można wziąć logarytm z funkcji , obliczyć jego pochodną i przyrównać do , jednak otrzymane
w ten sposób równanie trzeba rozwiązywać numerycznie.
Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru jest:
a więc nieznacznie więcej niż w przykładzie 12.4.
Ćwiczenie 12.4
Znajdziemy estymator największej wiarygodności parametru , w rozkładzie jednostajnym na przedziale .
Z warunków zadania wynika, że dysponujemy próbką prostą z rozkładu ciągłego, którego gęstość jest następująca: dla oraz dla pozostałych . Funkcją wiarygodności jest więc tutaj:
W związku z tym, jeżeli wszystkie punkty leżą w przedziale ,
to:
zaś w przeciwnym wypadku:
Zatem:
W nietrywialnym przypadku, czyli gdy , funkcja ta jest dobrze określona,
lecz nie jest ciągła w punkcie .
Jednak widać (narysuj wykres funkcji ), że akurat w tym punkcie funkcja przyjmuje wartość
największą. Tak więc estymatorem największej wiarygodności parametru jest:
o którym była już mowa w ćwiczeniu 11.1.
Zadanie 12.1
Znajdź wartość największą (o ile istnieje) funkcji na zbiorze :
- , ,
- , ,
- dla , , ,
- , ,
- , ,
- , ,
- , .
Zadanie 12.2
Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu geometrycznego.
Zadanie 12.3
Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu Poissona.
Zadanie 12.4
Testowano czas działania nowej serii baterii do telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):
natomiast pięć innych baterii działało dłużej niż 240 godzin.
Znajdź estymator parametru zakładając, że rozkładu czasu działania baterii
jest postaci:
Korzystając z otrzymanego wyniku, określ średni czas
działania baterii oraz oblicz prawdopodobieństwo tego,
bateria z tej serii działa dłużej niż 220 godzin.
Zadanie 12.5
Metodą największej wiarygodności znajdź estymator parametru , gdy próbka pochodzi z rozkładu jednostajnego na odcinku .
Zadanie 12.6
W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?
Zadanie 12.7
Mamy próbkę prostą z rozkładu wykładniczego oraz wiemy, że dalszych niezależnych obserwacji z tego rozkładu ma wartość większą niż dana liczba . Jaka jest nadzieja matematyczna tego rozkładu?