Rachunek prawdopodobieństwa i statystyka/Wykład 2: Statystyka opisowa
Zdefiniujemy podstawowe parametry cechy statystycznej. Charakteryzują one tendencje centralną cechy, jak i tak zwaną miarę rozrzutu. Dużo uwagi poświęcimy interpretacji graficznej. Zwrócimy uwagę na istnienie różnych sposobów określania tych samych parametrów.
Miary tendencji centralnej
W przypadku cechy o skali nominalnej, rozważa się zasadniczo jeden parametr charakteryzujący tendencję centralną.
Niech zatem będzie cechą w skali nominalnej.
Definicja 2.1
Moda (wartość modalna) jest to najczęściej występująca wartość zmiennej . W przypadku, gdy kilka wartości jest osiąganych taką samą liczbę razy, wówczas każda z nich jest modą.
{{przyklad|2.2|| Załóżmy, że rozważaną populacją jest zbiór samochodów znajdujących się w określonym czasie na pewnym parkingu, zaś cechą - nazwa producenta samochodu. Jej wartości mogą wyglądać, na przykład, tak:
Fiat, BMW, Ford, Ford, Fiat, Skoda, Fiat, Polonez, Toyota, Toyota, Toyota, Renault, Opel, Fiat, Opel, Opel, Toyota.
Nasza cecha ma dwie mody: Fiat i Toyota.
W przypadku cechy o skali porządkowej, mówiąc o tendencji centralnej, mamy na myśli jej "środek", czyli położenie centralnych wartości tej cechy. Można to rozumieć zarówno jako przeciętną wartość, czyli średnią (ale którą?), lub jako wartość, która dzieli posortowany ciąg wartości na równe części. Zajmiemy się najpierw sytuacją, gdy dysponujemy danymi surowymi.
Rozumując pierwszym sposobem zdefiniujmy podstawowy, zapewne doskonale przez nas znany parametr, zwany średnią arytmetyczną.
Niech będzie cechą w skali porządkowej.
Definicja 2.3
Jeżeli cecha przyjmuje wartości , wówczas jej średnią arytmetyczną, lub krótko średnią, nazywamy:
Definiuje się też inne wartości średnie, np. średnią harmoniczną lub średnią geometryczną, lecz nie mają one takiego znaczenia jak zdefiniowana powyżej średnia arytmetyczna.
Inną miarą tendencji centralnej jest tak zwana mediana. Dla danego ciągu liczb , określamy ciąg , który powstaje przez jego niemalejące uporządkowanie, czyli:
Definicja 2.4
Medianą cechy , przyjmującej wartości , nazywamy środkowy wyraz ciągu , gdy jest liczbą nieparzystą, lub średnią arytmetyczną dwóch wyrazów środkowych, gdy jest liczbą parzystą. Zatem:
Tendencję centralną cechy w skali porządkowej charakteryzuje również moda, o której mówiliśmy w przypadku cechy nominalnej - w tym przypadku ma ona jednak niewielkie znaczenie.
Zobaczmy teraz na przykładzie, w jaki sposób oblicza się zdefiniowane powyżej parametry, a następnie jak można z nich "odczytać" pewne globalne informacje na temat interesującej nas cechy.
Przykład 2.5
Wskazać miary tendencji centralnej wynagrodzeń pracowniczych, na podstawie poniższej listy płac pewnego zakładu liczącego dziesięciu pracowników:}