Rachunek prawdopodobieństwa i statystyka/Wykład 2: Statystyka opisowa

Z Studia Informatyczne
Wersja z dnia 19:27, 10 sie 2006 autorstwa Pitab (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Zdefiniujemy podstawowe parametry cechy statystycznej. Charakteryzują one tendencje centralną cechy, jak i tak zwaną miarę rozrzutu. Dużo uwagi poświęcimy interpretacji graficznej. Zwrócimy uwagę na istnienie różnych sposobów określania tych samych parametrów.

Miary tendencji centralnej

W przypadku cechy o skali nominalnej, rozważa się zasadniczo jeden parametr charakteryzujący tendencję centralną.

Niech zatem X będzie cechą w skali nominalnej.

Szablon:DEFINICJA

{{PRZYKŁAD|2.2|| Załóżmy, że rozważaną populacją jest zbiór samochodów znajdujących się w określonym czasie na pewnym parkingu, zaś cechą - nazwa producenta samochodu. Jej wartości mogą wyglądać, na przykład, tak:

Fiat, BMW, Ford, Ford, Fiat, Skoda, Fiat, Polonez, Toyota, Toyota, Toyota, Renault, Opel, Fiat, Opel, Opel, Toyota.

Nasza cecha ma dwie mody: Fiat i Toyota.

Może rysunek Fiata i Toyoty?

W przypadku cechy o skali porządkowej, mówiąc o tendencji centralnej, mamy na myśli jej "środek", czyli położenie centralnych wartości tej cechy. Można to rozumieć zarówno jako przeciętną wartość, czyli średnią (ale którą?), lub jako wartość, która dzieli posortowany ciąg wartości na równe części. Zajmiemy się najpierw sytuacją, gdy dysponujemy danymi surowymi.

Rozumując pierwszym sposobem zdefiniujmy podstawowy, zapewne doskonale przez nas znany parametr, zwany średnią arytmetyczną.

Niech X będzie cechą w skali porządkowej.

Szablon:DEFINICJA


Definiuje się też inne wartości średnie, np. średnią harmoniczną lub średnią geometryczną, lecz nie mają one takiego znaczenia jak zdefiniowana powyżej średnia arytmetyczna.

Inną miarą tendencji centralnej jest tak zwana mediana. Dla danego ciągu liczb x1,,xn, określamy ciąg x(1),,x(n), który powstaje przez jego niemalejące uporządkowanie, czyli:


x(1)x(2)x(n).


Szablon:DEFINICJA


Tendencję centralną cechy w skali porządkowej charakteryzuje również moda, o której mówiliśmy w przypadku cechy nominalnej - w tym przypadku ma ona jednak niewielkie znaczenie.

Zobaczmy teraz na przykładzie, w jaki sposób oblicza się zdefiniowane powyżej parametry, a następnie jak można z nich "odczytać" pewne globalne informacje na temat interesującej nas cechy.

Szablon:PRZYKŁAD

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned 1 \quad & \qquad 850 zł\\ 2 \quad & \qquad 870 zł\\ 3 \quad & \qquad 950 zł\\ 4 \quad & \qquad 1000 zł\\ 5 \quad & \qquad 1050 zł\\ 6 \quad & \qquad 1080 zł\\ 7 \quad & \qquad 1090 zł\\ 8 \quad & \qquad 2700 zł\\ 9 \quad & \qquad 2900 zł\\ 10 \quad & \qquad 7200 zł\\ \endaligned }