Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 11: Wnioskowanie statystyczne
Ćwiczenia
Ćwiczenie 11.1
Przypuśćmy, że próbka prosta pochodzi z rozkładu jednostajnego na odcinku , gdzie jest nieznanym parametrem. Zastanowimy się, co może być "dobrym" estymatorem parametru .
Jako sensowne przybliżenie można wziąć największy element próbki, czyli statystykę:
Można udowodnić, że jest to estymator zgodny. Sprawdzimy, czy jest on także nieobciążony.
Aby obliczyć nadzieję matematyczną zmiennej losowej , wyznaczymy najpierw dystrybuantę oraz gęstość tej zmiennej, a następnie wykorzystamy wzór (patrz definicja 7.22):
Oczywiście, z określenia naszej zmiennej losowej wynika natychmiast, że dla oraz
dla (wtedy też ), zaś dla , z niezależności
zmiennych otrzymujemy:
Stąd:
zatem:
Powyższy estymator jest więc obciążony, ale jest także asymptotycznie nieobciążony.
Jednak już teraz widać, że estymatorem nieobciążonym parametru jest estymator:
Zauważmy, iż właściwie można było z góry przewidzieć, że estymator będzie obciążony, gdyż
praktycznie zawsze:
- okazuje się, że wymnożenie przez współczynnik zwiększa go tyle, ile trzeba.
Ćwiczenie 11.2
Innym podejściem do estymacji parametru w rozkładzie jednostajnym na przedziale , jest wykorzystanie wiadomości, że nadzieja matematyczna, której "dobrym" estymatorem jest średnia, w tym rozkładzie wynosi ,
a więc jako estymator można przyjąć estymator określony przez statystykę:Można łatwo stwierdzić, że jest to estymator zgodny i nieobciążony. Nasuwa się więc naturalne pytanie o to, który estymator jest lepszy: estymator , określony w ćwiczeniu 11.1, czy zdefiniowany powyżej estymator .
Aby odpowiedzieć na powyższe pytanie, należy ustalić jakieś kryterium pozwalające na porównywanie estymatorów. Wśród estymatorów nieobciążonych kryterium tym jest wielkość wariancji, przy czym im mniejsza wariancja, tym lepszy estymator. Liczymy więc wariancje i , wykorzystując (między innymi) wzór na wariancję w rozkładzie jednostajnym (patrz przykład 7.11) oraz twierdzenie 7.13 (patrz punkt 6):
Dzielimy teraz przez siebie te dwie wariacje:
co oznacza, że wariancja estymatora jest
większa od wariancji estymatora , a w związku z tym, ten drugi estymator jest lepszy w sensie naszego kryterium.
Co więcej, im większa jest próbka, tym większy jest stosunek obu wariancji.
Ćwiczenie 11.3
Naturalnym estymatorem parametru w rozkładzie dwupunktowym jest średnia z próbki. Zauważmy, że tutaj:
gdzie jest liczbą zaobserwowanych jedynek.
Łatwo sprawdzić, że jest to estymator zgodny i nieobciążony parametru .
Zadanie 11.1
Wylosowano następującą próbkę prostą z rozkładu geometrycznego:
Jaka liczba będzie dobrym przybliżeniem parametru ?
}}
Ćwiczenie
Wylosowano następującą próbkę prostą z rozkładu jednostajnego na odcinku :
Jak przybliżyć wartość parametru ?
Ćwiczenie
Dana jest próbka prosta z rozkładu dwupunktowego . Znajdź rozkład estymatora .
Ćwiczenie
Uzasadnij tezy zawarte w przykładzie Uzupelnic 111|.
Ćwiczenie
Uzasadnij, że estymator z ćwiczenia Uzupelnic cw111| jest zgodny i nieobciążony.
Ćwiczenie
Zaproponuj estymator odchylenia standardowego.
Ćwiczenie
Zaproponuj estymator parametru w rozkładzie Poissona.
Ćwiczenie
Zaproponuj estymator parametru w rozkładzie wykładniczym.
Ćwiczenie
Sprawdź, że estymator:
jest zgodnym estymatorem wariancji (, jak zwykle, oznacza nadzieję matematyczną ).
Ćwiczenie
Czy następujący estymator:
jest obciążonym estymatorem odchylenia standardowego?
Ćwiczenie
Wykorzystując statystykę pozycyjną, zaproponuj estymator kwantyla .
Ćwiczenie
Wykaż wzór:
Ćwiczenie
Wykonaj 100 razy następujący eksperyment: z rozkładu jednostajnego na przedziale losujemy 30 liczb i obliczamy wartości statystyk oraz . Otrzymasz dwa ciągi liczb, powiedzmy oraz . Dla każdego z tych dwóch ciągów oblicz średnią i wariancję. Porównaj otrzymane wyniki z wnioskami zawartymi w ćwiczeniu Uzupelnic cw111|.