Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 12: Metoda największej wiarygodności
Ćwiczenia i zadania
Ćwiczenie
Rozważmy próbkę prostą z rozkładu . Znajdziemy estymatory największej wiarygodności parametrów i .
Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:
W związku z tym, funkcja wiarygodności ma postać:
Z postaci funkcji od razu widać, że przy każdym ustalonym przyjmuje ona wartość największą dla takiego ,
dla którego funkcja:
osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową
zmiennej
, a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla:
Rozważmy zatem funkcję:
a następnie jej logarytm:
Obliczamy pochodną:
Zauważmy, jedynym rozwiązaniem równania:
jest liczba:
Ostatecznie więc otrzymujemy następujące estymatory:
Ćwiczenie
Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano próbek wody po 100 ml (próbki typu ) oraz próbek wody po 300 ml (próbki typu ). Metoda laboratoryjna pozwala jedynie na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii w próbkach typu oraz próbkach typu . Jaka jest średnia liczba bakterii w 1 litrze wody?
Zanim przejdziemy do właściwego rozwiązania powyższego zadania, należy najpierw zdać sobie sprawę z tego, że rozkład bakterii w ustalonej porcji wody podlega w przybliżeniu rozkładowi Poissona -- mamy tu bowiem dużo doświadczeń (znalezienie się pojedynczej bakterii w ustalonej porcji wody) z niezwykle małym prawdopodobieństwem sukcesu każde. Dla ułatwienia zapisu przyjmujemy, że podstawowa objętość ma 100 ml (gdy już będziemy mieć średnią liczbę bakterii w tej objętości, to pomnożymy ją przez 10, uzyskując w ten sposób żądany wynik).
Niech więc oznacza liczbę bakterii w 100 ml wody. Zakładamy, że ma rozkład Poissona z parametrem . W związku z tym zmienna losowa , oznaczająca liczbę bakterii w 300 ml wody, ma rozkład Poissona z parametrem . Teraz wyniki badania można interpretować następująco: zaobserwowano zdarzenie, polegające na jednoczesnym zajściu:
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
- zdarzeń postaci ,
gdzie zmienne tworzą próbkę prostą z , zaś zmienne -- próbkę prostą z . Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy
jednak, że:
a więc:
Podobnie:
zatem:
Ostatecznie więc funkcja wiarygodności ma postać:
gdzie . Widać, że oraz że jest ciągła na przedziale , tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego estymatora.
W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz ustalając konkretne wartości parametrów, powiedzmy:
Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do , otrzymując następujące równanie:
Po podzieleniu obu stron przez wspólny czynnik dostajemy:
Równanie to można rozwiązać numerycznie w przedziale otrzymując:
czyli:
Tak więc w jednym litrze wody są średnio nieco ponad bakterie.
Ćwiczenie
Zmodyfikujemy przykład Uzupelnic 122|. Treść zadania wygląda teraz następująco. Chcąc zbadać wadliwość nowej serii komputerów przeprowadzono następujące badanie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: ciągu 14 dni wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria jednego z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie więcej niż jednego komputera. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako prawdopodobieństwo awarii w czasie jednego dnia pracy?
Ta drobna zmiana oznacza istotną komplikację techniczną. Stosując oznaczenia z przykładu Uzupelnic 122| widzimy, że funkcja wiarygodności ma teraz postać:
gdyż oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:
a więc sytuacja jest podobna do tej z ćwiczenia Uzupelnic cb| -- można wziąć logarytm z funkcji , obliczyć jego pochodną i przyrównać do , jednak otrzymane w ten sposób równanie trzeba rozwiązywać numerycznie. Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru jest:
a więc nieznacznie więcej niż w przykładzie Uzupelnic 122|.
Ćwiczenie
Znajdziemy estymator największej wiarygodności parametru , w rozkładzie jednostajnym na przedziale .
Z warunków zadania wynika, że dysponujemy próbką prostą z rozkładu ciągłego, którego gęstość jest następująca: dla oraz dla pozostałych . Funkcją wiarygodności jest więc tutaj:
W związku z tym, jeżeli wszystkie punkty leżą w przedziale , to:
zaś w przeciwnym wypadku:
Zatem:
W nietrywialnym przypadku, czyli gdy , funkcja ta jest dobrze określona, lecz nie jest ciągła w punkcie . Jednak widać (narysuj wykres funkcji ), że akurat w tym punkcie funkcja przyjmuje wartość największą. Tak więc estymatorem największej wiarygodności parametru jest:
o którym była już mowa w ćwiczeniu Uzupelnic earjm|.
. . .
Ćwiczenie
Znajdź wartość największą (o ile istnieje) funkcji na zbiorze :
, ,
, ,
dla , , ,
, ,
, ,
, ,
, .
Ćwiczenie
Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu geometrycznego.
Ćwiczenie
Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu Poissona.
Ćwiczenie
Testowano czas działania nowej serii baterii do telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):
natomiast pięć innych baterii działało dłużej niż 240 godzin. Znajdź estymator parametru zakładając, że rozkładu czasu działania baterii
jest postaci:Korzystając z otrzymanego wyniku, określ średni czas działania baterii oraz oblicz prawdopodobieństwo tego, bateria z tej serii działa dłużej niż 220 godzin.
Ćwiczenie
Metodą największej wiarygodności znajdź estymator parametru , gdy próbka pochodzi z rozkładu jednostajnego na odcinku .
Ćwiczenie
W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?
Ćwiczenie
Mamy próbkę prostą z rozkładu wykładniczego oraz wiemy, że dalszych niezależnych obserwacji z tego rozkładu ma wartość większą niż dana liczba . Jaka jest nadzieja matematyczna tego rozkładu?