Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 12: Metoda największej wiarygodności
Ćwiczenia
Ćwiczenie 12.1
Rozważmy próbkę prostą z rozkładu . Znajdziemy estymatory największej wiarygodności parametrów i .
Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:
W związku z tym, funkcja wiarygodności ma postać:
Z postaci funkcji od razu widać, że przy każdym ustalonym przyjmuje ona wartość największą dla takiego ,
dla którego funkcja:
osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej
, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla:
Rozważmy zatem funkcję:
a następnie jej logarytm:
Obliczamy pochodną:
Zauważmy, jedynym rozwiązaniem równania:
jest liczba:
Ostatecznie więc otrzymujemy następujące estymatory:
Ćwiczenie 12.2
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano próbek wody po 100 ml (próbki typu ) oraz próbek wody po 300 ml (próbki typu ). Metoda laboratoryjna pozwala jedynie na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii w próbkach typu oraz próbkach typu . Jaka jest średnia liczba bakterii w 1 litrze wody?
Zanim przejdziemy do właściwego rozwiązania powyższego zadania, należy najpierw zdać sobie sprawę z tego, że rozkład bakterii w ustalonej porcji wody podlega w przybliżeniu rozkładowi Poissona -- mamy tu bowiem dużo doświadczeń (znalezienie się pojedynczej bakterii w ustalonej porcji wody) z niezwykle małym prawdopodobieństwem sukcesu każde. Dla ułatwienia zapisu przyjmujemy, że podstawowa objętość ma 100 ml (gdy już będziemy mieć średnią liczbę bakterii w tej objętości, to pomnożymy ją przez 10, uzyskując w ten sposób żądany wynik).
Niech więc oznacza liczbę bakterii w 100 ml wody. Zakładamy, że ma rozkład Poissona z parametrem . W związku z tym zmienna losowa , oznaczająca liczbę bakterii w 300 ml wody, ma rozkład Poissona z parametrem . Teraz wyniki badania można interpretować następująco: zaobserwowano zdarzenie, polegające na jednoczesnym zajściu:
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
gdzie zmienne tworzą próbkę prostą z , zaś zmienne - próbkę prostą z . Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy jednak, że:
a więc:
Podobnie:
zatem:
Ostatecznie więc funkcja wiarygodności ma postać:
gdzie .
Widać, że oraz że jest ciągła na przedziale ,
tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję
wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego
estymatora.
W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz ustalając konkretne wartości parametrów, powiedzmy:
Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do , otrzymując następujące równanie:
Po podzieleniu obu stron przez wspólny czynnik dostajemy:
Równanie to można rozwiązać numerycznie w przedziale otrzymując:
czyli:
Tak więc w jednym litrze wody są średnio nieco ponad
bakterie.
Ćwiczenie 12.3
Zmodyfikujemy przykład 12.4. Treść zadania wygląda teraz następująco. Chcąc zbadać wadliwość nowej serii komputerów przeprowadzono następujące badanie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: ciągu 14 dni wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria jednego z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie więcej niż jednego komputera. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako prawdopodobieństwo awarii w czasie jednego dnia pracy?
Ta drobna zmiana oznacza istotną komplikację techniczną. Stosując oznaczenia z przykładu 12.4 widzimy, że funkcja wiarygodności ma teraz postać:
gdyż oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:
a więc sytuacja jest podobna do tej z ćwiczenia 12.2 -
można wziąć logarytm z funkcji , obliczyć jego pochodną i przyrównać do , jednak otrzymane
w ten sposób równanie trzeba rozwiązywać numerycznie.
Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru jest:
a więc nieznacznie więcej niż w przykładzie 12.4.
Ćwiczenie 12.4
Znajdziemy estymator największej wiarygodności parametru , w rozkładzie jednostajnym na przedziale .
Z warunków zadania wynika, że dysponujemy próbką prostą z rozkładu ciągłego, którego gęstość jest następująca: dla oraz dla pozostałych . Funkcją wiarygodności jest więc tutaj:
W związku z tym, jeżeli wszystkie punkty leżą w przedziale ,
to:
zaś w przeciwnym wypadku:
Zatem:
W nietrywialnym przypadku, czyli gdy , funkcja ta jest dobrze określona,
lecz nie jest ciągła w punkcie .
Jednak widać (narysuj wykres funkcji ), że akurat w tym punkcie funkcja przyjmuje wartość
największą. Tak więc estymatorem największej wiarygodności parametru jest:
o którym była już mowa w ćwiczeniu 11.1.
Zadanie 12.1 Znajdź wartość największą (o ile istnieje) funkcji na zbiorze :
- , ,
- , ,
- dla , , ,
- , ,
- , ,
- , ,
- , .
Zadanie 12.2 Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu geometrycznego.
Zadanie 12.3 Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu Poissona.
Zadanie 12.4 Testowano czas działania nowej serii baterii do telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):
natomiast pięć innych baterii działało dłużej niż 240 godzin.
Znajdź estymator parametru zakładając, że rozkładu czasu działania baterii
jest postaci:
Korzystając z otrzymanego wyniku, określ średni czas
działania baterii oraz oblicz prawdopodobieństwo tego,
bateria z tej serii działa dłużej niż 220 godzin.
Zadanie 12.5 Metodą największej wiarygodności znajdź estymator parametru , gdy próbka pochodzi z rozkładu jednostajnego na odcinku .
Zadanie 12.6 W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?
Zadanie 12.7 Mamy próbkę prostą z rozkładu wykładniczego oraz wiemy, że dalszych niezależnych obserwacji z tego rozkładu ma wartość większą niż dana liczba . Jaka jest nadzieja matematyczna tego rozkładu?