Rachunek prawdopodobieństwa i statystyka/Wykład 2: Statystyka opisowa: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Pitab (dyskusja | edycje)
Nie podano opisu zmian
 
Pitab (dyskusja | edycje)
Nie podano opisu zmian
Linia 7: Linia 7:
Niech zatem <math>X</math> będzie cechą w skali nominalnej.
Niech zatem <math>X</math> będzie cechą w skali nominalnej.


{{DEFINICJA|2.1||
{{definicja|2.1||
Moda (wartość modalna) jest to najczęściej występująca wartość zmiennej <math>X</math>. W przypadku, gdy kilka wartości jest osiąganych taką samą liczbę razy, wówczas każda z nich jest modą.
Moda (wartość modalna) jest to najczęściej występująca wartość zmiennej <math>X</math>. W przypadku, gdy kilka wartości jest osiąganych taką samą liczbę razy, wówczas każda z nich jest modą.
}}
}}


{{PRZYKŁAD|2.2||
{{przyklad|2.2||
Załóżmy, że rozważaną populacją jest zbiór samochodów znajdujących się w określonym czasie na pewnym parkingu, zaś cechą - nazwa producenta samochodu. Jej wartości mogą wyglądać, na przykład, tak:
Załóżmy, że rozważaną populacją jest zbiór samochodów znajdujących się w określonym czasie na pewnym parkingu, zaś cechą - nazwa producenta samochodu. Jej wartości mogą wyglądać, na przykład, tak:


Linia 29: Linia 29:
Niech <math>X</math> będzie cechą w skali porządkowej.
Niech <math>X</math> będzie cechą w skali porządkowej.


{{DEFINICJA|2.3||
{{definicja|2.3||
Jeżeli cecha <math>X</math> przyjmuje wartości <math> x_{1},x_{2}, \ldots ,x_{n} </math>, wówczas jej średnią arytmetyczną, lub krótko średnią, nazywamy:
Jeżeli cecha <math>X</math> przyjmuje wartości <math> x_{1},x_{2}, \ldots ,x_{n} </math>, wówczas jej średnią arytmetyczną, lub krótko średnią, nazywamy:


Linia 45: Linia 45:




{{DEFINICJA|2.4||
{{definicja|2.4||
Medianą cechy <math>X</math>, przyjmującej wartości <math>x_1, \dots, x_n</math>, nazywamy środkowy wyraz ciągu <math>x_{(1)}, \dots, x_{(n)}</math>, gdy <math>n</math> jest liczbą nieparzystą, lub średnią arytmetyczną dwóch
Medianą cechy <math>X</math>, przyjmującej wartości <math>x_1, \dots, x_n</math>, nazywamy środkowy wyraz ciągu <math>x_{(1)}, \dots, x_{(n)}</math>, gdy <math>n</math> jest liczbą nieparzystą, lub średnią arytmetyczną dwóch
wyrazów środkowych, gdy <math>n</math> jest liczbą parzystą. Zatem:
wyrazów środkowych, gdy <math>n</math> jest liczbą parzystą. Zatem:
Linia 62: Linia 62:
parametry, a następnie jak można z nich "odczytać" pewne globalne informacje na temat interesującej nas cechy.
parametry, a następnie jak można z nich "odczytać" pewne globalne informacje na temat interesującej nas cechy.


{{PRZYKŁAD|2.5||
{{przyklad|2.5||
Wskazać miary tendencji centralnej wynagrodzeń pracowniczych, na podstawie poniższej listy płac pewnego zakładu liczącego dziesięciu pracowników:}
Wskazać miary tendencji centralnej wynagrodzeń pracowniczych, na podstawie poniższej listy płac pewnego zakładu liczącego dziesięciu pracowników:}



Wersja z 19:28, 10 sie 2006

Zdefiniujemy podstawowe parametry cechy statystycznej. Charakteryzują one tendencje centralną cechy, jak i tak zwaną miarę rozrzutu. Dużo uwagi poświęcimy interpretacji graficznej. Zwrócimy uwagę na istnienie różnych sposobów określania tych samych parametrów.

Miary tendencji centralnej

W przypadku cechy o skali nominalnej, rozważa się zasadniczo jeden parametr charakteryzujący tendencję centralną.

Niech zatem X będzie cechą w skali nominalnej.

Definicja 2.1

Moda (wartość modalna) jest to najczęściej występująca wartość zmiennej X. W przypadku, gdy kilka wartości jest osiąganych taką samą liczbę razy, wówczas każda z nich jest modą.

{{przyklad|2.2|| Załóżmy, że rozważaną populacją jest zbiór samochodów znajdujących się w określonym czasie na pewnym parkingu, zaś cechą - nazwa producenta samochodu. Jej wartości mogą wyglądać, na przykład, tak:

Fiat, BMW, Ford, Ford, Fiat, Skoda, Fiat, Polonez, Toyota, Toyota, Toyota, Renault, Opel, Fiat, Opel, Opel, Toyota.

Nasza cecha ma dwie mody: Fiat i Toyota.

Może rysunek Fiata i Toyoty?

W przypadku cechy o skali porządkowej, mówiąc o tendencji centralnej, mamy na myśli jej "środek", czyli położenie centralnych wartości tej cechy. Można to rozumieć zarówno jako przeciętną wartość, czyli średnią (ale którą?), lub jako wartość, która dzieli posortowany ciąg wartości na równe części. Zajmiemy się najpierw sytuacją, gdy dysponujemy danymi surowymi.

Rozumując pierwszym sposobem zdefiniujmy podstawowy, zapewne doskonale przez nas znany parametr, zwany średnią arytmetyczną.

Niech X będzie cechą w skali porządkowej.

Definicja 2.3

Jeżeli cecha X przyjmuje wartości x1,x2,,xn, wówczas jej średnią arytmetyczną, lub krótko średnią, nazywamy:


x¯=x1+x2+  +xnn=1ni=1nxi.


Definiuje się też inne wartości średnie, np. średnią harmoniczną lub średnią geometryczną, lecz nie mają one takiego znaczenia jak zdefiniowana powyżej średnia arytmetyczna.

Inną miarą tendencji centralnej jest tak zwana mediana. Dla danego ciągu liczb x1,,xn, określamy ciąg x(1),,x(n), który powstaje przez jego niemalejące uporządkowanie, czyli:


x(1)x(2)x(n).


Definicja 2.4

Medianą cechy X, przyjmującej wartości x1,,xn, nazywamy środkowy wyraz ciągu x(1),,x(n), gdy n jest liczbą nieparzystą, lub średnią arytmetyczną dwóch wyrazów środkowych, gdy n jest liczbą parzystą. Zatem:


me={x(k+1) dla n=2k+1x(k)+x(k+1)2 dla n=2k.


Tendencję centralną cechy w skali porządkowej charakteryzuje również moda, o której mówiliśmy w przypadku cechy nominalnej - w tym przypadku ma ona jednak niewielkie znaczenie.

Zobaczmy teraz na przykładzie, w jaki sposób oblicza się zdefiniowane powyżej parametry, a następnie jak można z nich "odczytać" pewne globalne informacje na temat interesującej nas cechy.

Przykład 2.5

Wskazać miary tendencji centralnej wynagrodzeń pracowniczych, na podstawie poniższej listy płac pewnego zakładu liczącego dziesięciu pracowników:}

Może rysunek banknotów?

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned 1 \quad & \qquad 850 zł\\ 2 \quad & \qquad 870 zł\\ 3 \quad & \qquad 950 zł\\ 4 \quad & \qquad 1000 zł\\ 5 \quad & \qquad 1050 zł\\ 6 \quad & \qquad 1080 zł\\ 7 \quad & \qquad 1090 zł\\ 8 \quad & \qquad 2700 zł\\ 9 \quad & \qquad 2900 zł\\ 10 \quad & \qquad 7200 zł\\ \endaligned }