Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 12: Metoda największej wiarygodności

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Ćwiczenia

Ćwiczenie 12.1

Rozważmy próbkę prostą z rozkładu . Znajdziemy estymatory największej wiarygodności parametrów i .

Przypominamy, że gęstość rozkładu normalnego wyraża się wzorem:


dla


W związku z tym, funkcja wiarygodności ma postać:




Z postaci funkcji od razu widać, że przy każdym ustalonym przyjmuje ona wartość największą dla takiego , dla którego funkcja:



osiąga wartość najmniejszą, ta ostatnia zaś jest zwykłą funkcją kwadratową zmiennej , a więc łatwo sprawdzić, że przyjmuje ona wartość najmniejszą dla:

Rozważmy zatem funkcję:



a następnie jej logarytm:



Obliczamy pochodną:



Zauważmy, jedynym rozwiązaniem równania:



jest liczba:



Ostatecznie więc otrzymujemy następujące estymatory:



Ćwiczenie 12.2

Aby stwierdzić ile jest średnio bakterii pewnego rodzaju w 1 litrze wody, pobrano próbek wody po 100 ml (próbki typu ) oraz próbek wody po 300 ml (próbki typu ). Metoda laboratoryjna pozwala jedynie na stwierdzenie obecności (nie ilości!) bakterii w danej próbce wody. Metodą tą stwierdzono obecność bakterii w próbkach typu oraz próbkach typu . Jaka jest średnia liczba bakterii w 1 litrze wody?

Zanim przejdziemy do właściwego rozwiązania powyższego zadania, należy najpierw zdać sobie sprawę z tego, że rozkład bakterii w ustalonej porcji wody podlega w przybliżeniu rozkładowi Poissona -- mamy tu bowiem dużo doświadczeń (znalezienie się pojedynczej bakterii w ustalonej porcji wody) z niezwykle małym prawdopodobieństwem sukcesu każde. Dla ułatwienia zapisu przyjmujemy, że podstawowa objętość ma 100 ml (gdy już będziemy mieć średnią liczbę bakterii w tej objętości, to pomnożymy ją przez 10, uzyskując w ten sposób żądany wynik).

Niech więc oznacza liczbę bakterii w 100 ml wody. Zakładamy, że ma rozkład Poissona z parametrem . W związku z tym zmienna losowa , oznaczająca liczbę bakterii w 300 ml wody, ma rozkład Poissona z parametrem . Teraz wyniki badania można interpretować następująco: zaobserwowano zdarzenie, polegające na jednoczesnym zajściu:

  • zdarzeń postaci ,
  • zdarzeń postaci ,
  • zdarzeń postaci ,
  • zdarzeń postaci ,

gdzie zmienne tworzą próbkę prostą z , zaś zmienne - próbkę prostą z . Prawdopodobieństwo zaobserwowanego zdarzenia jest więc iloczynem prawdopodobieństw powyższych zdarzeń. Zauważmy jednak, że:



a więc:



Podobnie:



zatem:



Ostatecznie więc funkcja wiarygodności ma postać:



gdzie . Widać, że oraz że jest ciągła na przedziale , tak więc istnieje w tym przypadku estymator największej wiarygodności, aczkolwiek wzór określający funkcję wydaje się być zbyt skomplikowany, aby można było znaleźć analityczną postać tego estymatora.

W związku z powyższym, rozwiążemy nasze zadanie wykorzystując program Maple oraz ustalając konkretne wartości parametrów, powiedzmy:



Wyznaczamy logarytm z funkcji wiarygodności, różniczkujemy go i przyrównujemy do , otrzymując następujące równanie:




Po podzieleniu obu stron przez wspólny czynnik dostajemy:



Równanie to można rozwiązać numerycznie w przedziale otrzymując:


czyli:


Tak więc w jednym litrze wody są średnio nieco ponad bakterie.

Ćwiczenie 12.3

Zmodyfikujemy przykład 12.4. Treść zadania wygląda teraz następująco. Chcąc zbadać wadliwość nowej serii komputerów przeprowadzono następujące badanie: przez 20 dni uruchamiano codziennie 10 nowych komputerów i każdy z nich poddawano wszechstronnemu testowi. Otrzymano następujące wyniki: ciągu 14 dni wszystkie komputery działały bez zarzutu, w ciągu 4 dni miała miejsce awaria jednego z komputerów, natomiast w ciągu 2 dni zaobserwowano awarie więcej niż jednego komputera. Jaka jest wadliwość losowo wybranego komputera, rozumiana jako prawdopodobieństwo awarii w czasie jednego dnia pracy?

Ta drobna zmiana oznacza istotną komplikację techniczną. Stosując oznaczenia z przykładu 12.4 widzimy, że funkcja wiarygodności ma teraz postać:



gdyż oznacza prawdopodobieństwo zajścia więcej niż jednej awarii w danym dniu. Mamy dalej:



a więc sytuacja jest podobna do tej z ćwiczenia 12.2 - można wziąć logarytm z funkcji , obliczyć jego pochodną i przyrównać do , jednak otrzymane w ten sposób równanie trzeba rozwiązywać numerycznie. Okazuje się, że w tym przypadku estymatorem największej wiarygodności parametru jest:

a więc nieznacznie więcej niż w przykładzie 12.4.

Ćwiczenie 12.4

Znajdziemy estymator największej wiarygodności parametru , w rozkładzie jednostajnym na przedziale .

Z warunków zadania wynika, że dysponujemy próbką prostą z rozkładu ciągłego, którego gęstość jest następująca: dla oraz dla pozostałych . Funkcją wiarygodności jest więc tutaj:



W związku z tym, jeżeli wszystkie punkty leżą w przedziale , to:



zaś w przeciwnym wypadku:



Zatem:



W nietrywialnym przypadku, czyli gdy , funkcja ta jest dobrze określona, lecz nie jest ciągła w punkcie . Jednak widać (narysuj wykres funkcji ), że akurat w tym punkcie funkcja przyjmuje wartość największą. Tak więc estymatorem największej wiarygodności parametru jest:



o którym była już mowa w ćwiczeniu 11.1.


Zadanie 12.1 Znajdź wartość największą (o ile istnieje) funkcji na zbiorze :

  1. , ,
  2. , ,
  3. dla , , ,
  4. , ,
  5. , ,
  6. , ,
  7. , .

Zadanie 12.2 Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu geometrycznego.

Zadanie 12.3 Wyprowadź wzór na estymator największej wiarygodności parametru , gdy próbka prosta pochodzi z rozkładu Poissona.

Zadanie 12.4 Testowano czas działania nowej serii baterii do telefonów komórkowych. Otrzymano następujące wyniki (w godzinach):



natomiast pięć innych baterii działało dłużej niż 240 godzin. Znajdź estymator parametru zakładając, że rozkładu czasu działania baterii jest postaci:


dla


Korzystając z otrzymanego wyniku, określ średni czas działania baterii oraz oblicz prawdopodobieństwo tego, bateria z tej serii działa dłużej niż 220 godzin.

Zadanie 12.5 Metodą największej wiarygodności znajdź estymator parametru , gdy próbka pochodzi z rozkładu jednostajnego na odcinku .

Zadanie 12.6 W pewnej liczbie rzutów monetą symetryczną uzyskano 5 orłów. Ile było rzutów?

Zadanie 12.7 Mamy próbkę prostą z rozkładu wykładniczego oraz wiemy, że dalszych niezależnych obserwacji z tego rozkładu ma wartość większą niż dana liczba . Jaka jest nadzieja matematyczna tego rozkładu?