Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 2: Statystyka opisowa: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Arek (dyskusja | edycje)
Nie podano opisu zmian
 
m Zastępowanie tekstu – „<math> ” na „<math>”
 
(Nie pokazano 43 wersji utworzonych przez 7 użytkowników)
Linia 1: Linia 1:
==Ćwiczenia i zadania==
==Ćwiczenia ==
 
[[File:Rp-2-c1.mp4|253x253px|thumb|right| ]]
{{cwiczenie|||
{{cwiczenie|2.1|cw 2.1|
Oprócz średniej arytmetycznej rozważa się także
Oprócz średniej arytmetycznej rozważa się także
inne średnie. Na przykład, dla cechy o wartościach dodatnich <math>\displaystyle x_1, \dots, x_n</math>,
inne średnie. Na przykład, dla cechy o wartościach dodatnich <math>x_1, \dots, x_n</math>,
warto czasem używać tak zwanej średniej
warto czasem używać tak zwanej średniej
geometrycznej:
geometrycznej:
<center><math>\displaystyle
 
s_g = \sqrt[n]{x_1\cdot \dots \cdot x_n}.
 
</math></center>
<center>
<math>
s_g = \sqrt[n]{x_1\cdot \dots \cdot x_n}</math>
</center>
 


}}
}}
Linia 16: Linia 20:
kierunek studiów, oferujący tylko 25 miejsc, o przyjęciu decydują
kierunek studiów, oferujący tylko 25 miejsc, o przyjęciu decydują
punkty z dwóch przedmiotów maturalnych, powiedzmy z
punkty z dwóch przedmiotów maturalnych, powiedzmy z
przedmiotu <math>\displaystyle A</math> oraz z przedmiotu <math>\displaystyle B</math>.  
przedmiotu <math>A</math> oraz z przedmiotu <math>B</math>.  
Z danego przedmiotu można
Z danego przedmiotu można
uzyskać od 0 do 100 punktów, ale w praktyce zgłaszają się
uzyskać od 0 do 100 punktów, ale w praktyce zgłaszają się
Linia 27: Linia 31:
samą liczbę punktów, co może powodować kłopoty z decyzją o
samą liczbę punktów, co może powodować kłopoty z decyzją o
przyjęciu. Natomiast biorąc pod uwagę średnią geometryczną, a właściwie jej kwadrat, wydłużamy sobie
przyjęciu. Natomiast biorąc pod uwagę średnią geometryczną, a właściwie jej kwadrat, wydłużamy sobie
skalę -- od 4 900 do 10 000 tysięcy -- a więc te same wyniki
skalę - od 4 900 do 10 000 tysięcy - a więc te same wyniki
nie powinny się zbyt często powtarzać.
nie powinny się zbyt często powtarzać.


{{cwiczenie|||
{{cwiczenie|2.2|cw 2.2|
Rozważa się też często tak zwaną średnią ważoną. Niech będą
Rozważa się też często tak zwaną średnią ważoną. Niech będą
dane wartości cechy <math>\displaystyle x_1, \dots, x_n</math>oraz dodatnie liczby <math>\displaystyle w_1, \dots, w_n</math>,
dane wartości cechy <math>x_1, \dots, x_n</math> oraz dodatnie liczby <math>w_1, \dots, w_n</math>,
zwane wagami. Wówczas średnia ważona to
zwane wagami. Wówczas średnia ważona to
wielkość:
wielkość:
<center><math>\displaystyle
 
s_w = \frac{1}{w}(w_1x_1 + \dots + w_nx_n),
 
</math></center>
<center><math>
gdzie <math>\displaystyle w = w_1 + \dots + w_n</math>.
s_w = \frac{1}{w}(w_1x_1 + \dots + w_nx_n)</math>,</center>
 
 
gdzie <math>w = w_1 + \dots + w_n</math>.


}}
}}
Linia 50: Linia 57:
mogą z kolei przyjąć, odpowiednio, następujące wagi: 6, 1, 1.
mogą z kolei przyjąć, odpowiednio, następujące wagi: 6, 1, 1.


{{cwiczenie|||
{{cwiczenie|2.3|cw 2.3|
Wyznaczymy parametry dla danych z GPW, zaprezentowanych w ćwiczeniu [[##cwgpw|Uzupelnic cwgpw|]].
Wyznaczymy parametry dla danych z GPW, zaprezentowanych w [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 1: Wstęp#cw_1.4|ćwiczeniu 1.4]].


}}
}}
Linia 57: Linia 64:
Najpierw policzymy parametry dla danych surowych.
Najpierw policzymy parametry dla danych surowych.


.1in
Średnia: <math>\bar{x} = -0.365625</math>.
Średnia: <math>\displaystyle \bar{x} = -0.365625</math>.


Co prawda, w tamtym dniu na GPW był WZROST a nie spadek indeksów,
Co prawda, w tamtym dniu na GPW był WZROST a nie spadek indeksów,
Linia 64: Linia 70:
wzrostu są średnimi ważonymi, a nie arytmetycznymi.
wzrostu są średnimi ważonymi, a nie arytmetycznymi.


.1in
Mediana: <math>me = 0</math>.
Mediana: <math>\displaystyle me = 0</math>.


Na pierwszy rzut oka jest to dość dziwny wynik, ale po dokładniejszym przyjrzeniu się danym można go łatwo uzasadnić.
Na pierwszy rzut oka jest to dość dziwny wynik, ale po dokładniejszym przyjrzeniu się danym można go łatwo uzasadnić.


.1in
Moda: <math>0</math>.
Moda: <math>\displaystyle 0</math>.


.1in
Wariancja: <math>s_n^2 \approx 6.02148</math>.
Wariancja: <math>\displaystyle s_n^2 \approx 6.02148</math>.


Ale można także dostać wynik: <math>\displaystyle s_n^2 \approx 5.99796</math>! To, że pewne parametry statystyczne daje się zdefiniować na dwa (lub nawet
Ale można także dostać wynik: <math>s_n^2 \approx 5.99796</math>! To, że pewne parametry statystyczne daje się zdefiniować na dwa (lub nawet
trzy), nieznacznie różniące się między sobą sposoby,
trzy), nieznacznie różniące się między sobą sposoby,
jest dość typową sytuacją. W tym przypadku, ta druga wielkość została obliczona z następującego wzoru:
jest dość typową sytuacją. W tym przypadku, ta druga wielkość została obliczona z następującego wzoru:
<center><math>\displaystyle  s_{n}^{2}=\frac{1}{n-1} \sum_{i=1}^{n} ( y_{i}-\bar{x})^{2}. </math></center>
 
 
<center><math>s_{n}^{2}=\frac{1}{n-1} \sum_{i=1}^{n} ( y_{i}-\bar{x})^{2}</math></center>
 
 
Co ciekawe, oba wyniki można otrzymać wykorzystując dwa różne pakiety statystyczne programu Maple,
Co ciekawe, oba wyniki można otrzymać wykorzystując dwa różne pakiety statystyczne programu Maple,
o których wspominaliśmy na poprzednich ćwiczeniach (czy pamiętasz ich nazwy?).
o których wspominaliśmy na poprzednich ćwiczeniach (czy pamiętasz ich nazwy?).
Jak zobaczymy na wykładzie [[##wy11|Uzupelnic wy11|]], dzielenie przez <math>\displaystyle n-1</math> (zamiast przez <math>\displaystyle n</math>) jest w pewien sposób uzasadnione.
Jak zobaczymy na [[Rachunek prawdopodobieństwa i statystyka/Wykład 11: Wnioskowanie statystyczne|wykładzie 11]], dzielenie przez <math>n-1</math> (zamiast przez <math>n</math>) jest w pewien sposób uzasadnione.
 
.1in


Na zakończenie obliczymy parametry dla danych skumulowanych w szereg rozdzielczy.
Na zakończenie obliczymy parametry dla danych skumulowanych w szereg rozdzielczy.


.1in
Średnia: <math>\bar{x} = -0.234375</math>.
Średnia: <math>\displaystyle \bar{x} = -0.234375</math>.


.1in
Mediana: <math>me \approx 0.034722</math>.
Mediana: <math>\displaystyle me \approx 0.034722</math>.


.1in
Wariancja: <math>s_n^2 \approx 6.3123</math>.
Wariancja: <math>\displaystyle s_n^2 \approx 6.3123</math>.


{{cwiczenie|||
{{cwiczenie|2.4|cw 2.4|
Do graficznej reprezentacji kwantyli, a w zasadzie kwartyli, służy
Do graficznej reprezentacji kwantyli, a w zasadzie kwartyli, służy
wykres określany mianem "pudełko z wąsami".
wykres określany mianem "pudełko z wąsami".
 
Górna i dolna krawędź owego pudełka to <math>Q_{3}</math> oraz <math>Q_{1}</math>. Przez środek
Górna i dolna
krawędź owego pudełka to <math>\displaystyle Q_{3}</math> oraz <math>\displaystyle Q_{1}</math>. Przez środek
pudełka przechodzi linia, która oznacza medianę. "Wąsy" to wypustki biegnące od pudełka w górę i w dół, zakończone liniami poziomymi określającymi położenie najbardziej skrajnych elementów.
pudełka przechodzi linia, która oznacza medianę. "Wąsy" to wypustki biegnące od pudełka w górę i w dół, zakończone liniami poziomymi określającymi położenie najbardziej skrajnych elementów.
}}
}}
 
<center>
<flash>file=box-and-whisker.swf|width=500|height=500</flash> 
</center>
Istnieje pewne zróżnicowanie pudełek z wąsami, związane ze znaczeniem poszczególnych linii. Warto jest zawsze
Istnieje pewne zróżnicowanie pudełek z wąsami, związane ze znaczeniem poszczególnych linii. Warto jest zawsze
spojrzeć na stronę
spojrzeć na stronę
Pomocy programu z którego się korzysta. Oto fragment Pomocy pakietu <tt>stats</tt> z programu Maple:
Pomocy programu z którego się korzysta. Oto fragment Pomocy pakietu <math>\texttt stats</math> z programu Maple:
<br>
<pre>
A box plot comprises these elements:
 
1) A box with


{ "A box plot comprises these elements:
  - a central line showing the median,


; 1)
  - a lower line showing the first quartile,
:  A box with


:; -
  - an upper line showing the third quartile;
::  a central line showing the median,


:; -
  2) Two lines extending from the central box of maximal length 3/2 the interquartile range but not extending past the range of the data;
:: a lower line showing the first quartile,


:; -
  3) Outliers, points that lie outside the extent of the previous elements.
:: an upper line showing the third quartile;
</pre>
<br>


; 2)
A oto pudełko z wąsami dla danych (surowych) z GPW:
: Two lines extending from the central box of maximal
length 3/2 the interquartile range but not extending past the range of the data;


; 3)
:  Outliers, points that lie outside the extent of the previous elements."
}


A oto pudełko z wąsami dla danych (surowych) z GPW:
<center>
<flash>file=Rp.1.21.swf|width=350|height=350</flash> 
</center>


''tutaj rysunek 21.eps''


{{cwiczenie|||
{{cwiczenie|2.5|cw 2.5|
W trakcie pisemnego egzaminu ze statystyki osoby rozwiązujące zestawy <math>\displaystyle A</math> i <math>\displaystyle B</math> otrzymały następujące wyniki (w punktach): <br>
W trakcie pisemnego egzaminu ze statystyki osoby rozwiązujące zestawy <math>A</math> i <math>B</math> otrzymały następujące wyniki (w punktach): <br>


A :<nowiki>=</nowiki> [11, 9, 9.5, 12.5, 10, 4.5, 4.5, 5, 6, 16, 12, 11, 10, 3.5, 7, 7, 7, 8, 6, 0.5, 15.5],<br>
A :<nowiki>=</nowiki> [11, 9, 9.5, 12.5, 10, 4.5, 4.5, 5, 6, 16, 12, 11, 10, 3.5, 7, 7, 7, 8, 6, 0.5, 15.5],<br>
Linia 146: Linia 147:
Pierwsze porównanie wyników można zrobić używając pudełek:
Pierwsze porównanie wyników można zrobić używając pudełek:


''tutaj rysunek 22.eps''


Od razu widać, że raczej lepsze wyniki były w grupie <math>\displaystyle B</math>, jakkolwiek w grupie <math>\displaystyle A</math> osiągnięto najlepszy wynik.
<center>
<flash>file=Rp.1.22.swf|width=350|height=350</flash>
</center>


'''. . .'''


{{cwiczenie|||
Od razu widać, że raczej lepsze wyniki były w grupie <math>B</math>, jakkolwiek w grupie <math>A</math> osiągnięto najlepszy wynik.
Przypuśćmy, że jest dwóch kandydatów na studia w sytuacji opisanej w ćwiczeniu [[##wy23|Uzupelnic wy23|]]: jeden ma dobre i
 
porównywalne ze sobą wyniki z przedmiotu <math>\displaystyle A</math>, natomiast drugi jest zdecydowanie lepszy z przedmiotu <math>\displaystyle A</math> lecz, niestety,
 
zdecydowanie gorszy z przedmiotu <math>\displaystyle B</math>. Załóżmy, że średnie arytmetyczne tych kandydatów są takie same. Który z nich
-----------------------------------------------
 
'''Zadanie 2.1'''<br>
Przypuśćmy, że jest dwóch kandydatów na studia w sytuacji opisanej w ćwiczeniu [[#cw_2.1|2.1]]: jeden ma dobre i
porównywalne ze sobą wyniki z przedmiotu <math>A</math>, natomiast drugi jest zdecydowanie lepszy z przedmiotu <math>A</math> lecz, niestety,
zdecydowanie gorszy z przedmiotu <math>B</math>. Załóżmy, że średnie arytmetyczne tych kandydatów są takie same. Który z nich
dostanie się na studia?
dostanie się na studia?


}}
'''Zadanie 2.2'''<br>
 
{{cwiczenie|||
Ocena z egzaminu końcowego z pewnego przedmiotu, ustalana jest na podstawie średniej ważonej ocen z dwóch
Ocena z egzaminu końcowego z pewnego przedmiotu, ustalana jest na podstawie średniej ważonej ocen z dwóch
sprawdzianów w trakcie semestru oraz oceny z testu końcowego w sesji. Jakie wagi powinno się, Twoim zdaniem, przyjąć
sprawdzianów w trakcie semestru oraz oceny z testu końcowego w sesji. Jakie wagi powinno się, Twoim zdaniem, przyjąć
w tym przypadku?
w tym przypadku?


}}
'''Zadanie 2.3'''<br>
Zastanów się, jak zdefiniować geometryczną średnią ważoną.


{{cwiczenie|||
'''Zadanie 2.4'''<br>
Zastanów się, jak zdefiniować geometryczną średnią ważoną.
Ściągnij ze strony GPW:


}}
<center>
[http://www.gpw.com.pl http://www.gpw.com.pl]
</center>


{{cwiczenie|||
bieżące
Ściągnij ze strony GPW: .1in
{http://www.gpw.com.pl} .1in  bieżące
dane dotyczące zmian kursów akcji i porównaj je z danymi
dane dotyczące zmian kursów akcji i porównaj je z danymi
załączonymi do ćwiczenia [[##cwgpw|Uzupelnic cwgpw|]]: (a) obliczając i porównując
załączonymi do [[Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 1: Wstęp#cw_1.4|ćwiczenia 1.4]]: (a) obliczając i porównując
odpowiednie parametry, (b) rysując obok siebie dwa pudełka z
odpowiednie parametry, (b) rysując obok siebie dwa pudełka z
wąsami.  
wąsami.
}}
 
'''Zadanie 2.5'''<br>
Dane są następujące wartości cechy <math>X</math>:
 
 
<center><math>3, 5, 10, 6, 8, 6, 8, 10, 12</math>.</center>


{{cwiczenie|||
Dane są następujące wartości cechy <math>\displaystyle X</math>: <center><math>\displaystyle 3, 5, 10, 6, 8, 6, 8, 10, 12.</math></center> Naszkicuj dystrybuantę empiryczną
dla cechy <math>\displaystyle X</math>, a następnie, na tym rysunku, zaznacz wszystkie kwartyle tej cechy.


}}
Naszkicuj dystrybuantę empiryczną
dla cechy <math>X</math>, a następnie, na tym rysunku, zaznacz wszystkie kwartyle tej cechy.


{{cwiczenie|||
'''Zadanie 2.6'''<br>
Podaj przykładowe wartości cechy, dla której mediana jest dwa
Podaj przykładowe wartości cechy, dla której mediana jest dwa
razy większa od średniej.  
razy większa od średniej.
}}
 
'''Zadanie 2.7'''<br>
Niech <math>x_1, \dots, x_n</math> będą wartościami pewnej cechy w skali porządkowej. Określmy liczby:
 
 
<center><math>
z_i = \frac{x_i - \bar{x}}{s}</math>,</center>
 


{{cwiczenie|||
gdzie <math>s</math> jest odchyleniem standardowym danej cechy. Wykaż, że średnia z tak otrzymanych wartości wynosi 0, zaś
Niech  <math>\displaystyle x_1, \dots, x_n</math>  będą wartościami pewnej cechy w skali porządkowej. Określmy liczby:
<center><math>\displaystyle
z_i = \frac{x_i - \bar{x}}{s},
</math></center>
gdzie <math>\displaystyle s</math> jest odchyleniem standardowym danej cechy. Wykaż, że średnia z tak otrzymanych wartości wynosi 0, zaś
odchylenie standardowe jest równe 1.
odchylenie standardowe jest równe 1.
}}

Aktualna wersja na dzień 22:14, 11 wrz 2023

Ćwiczenia

Ćwiczenie 2.1

Oprócz średniej arytmetycznej rozważa się także inne średnie. Na przykład, dla cechy o wartościach dodatnich x1,,xn, warto czasem używać tak zwanej średniej geometrycznej:


sg=x1xnn


Rozpatrzmy (prawie rzeczywisty) przykład. Na pewien elitarny kierunek studiów, oferujący tylko 25 miejsc, o przyjęciu decydują punkty z dwóch przedmiotów maturalnych, powiedzmy z przedmiotu A oraz z przedmiotu B. Z danego przedmiotu można uzyskać od 0 do 100 punktów, ale w praktyce zgłaszają się kandydaci mający co najmniej 70 punktów z każdego przedmiotu. W celu ustalenia odpowiedniego rankingu trzeba brać pod uwagę oczywiście oba przedmioty, a więc najprostszym rozwiązaniem wydaje się być wzięcie średniej arytmetycznej. Jednak wtedy wszystkie wyniki będą zawierać się w przedziale od 70 do 100, zatem (biorąc pod uwagę także połówki punktów) będzie możliwych 61 wyników. Przy 200 kandydatach, wiele osób będzie miało taką samą liczbę punktów, co może powodować kłopoty z decyzją o przyjęciu. Natomiast biorąc pod uwagę średnią geometryczną, a właściwie jej kwadrat, wydłużamy sobie skalę - od 4 900 do 10 000 tysięcy - a więc te same wyniki nie powinny się zbyt często powtarzać.

Ćwiczenie 2.2

Rozważa się też często tak zwaną średnią ważoną. Niech będą dane wartości cechy x1,,xn oraz dodatnie liczby w1,,wn, zwane wagami. Wówczas średnia ważona to wielkość:


sw=1w(w1x1++wnxn),


gdzie w=w1++wn.

Wagi są najczęściej określane indywidualnie i subiektywnie. Przydzielając dużą wagę konkretnej wartości powodujemy, że wielkość ta ma większy wpływ na średnią obliczaną w powyższy sposób. Na przykład, na zakończenie studiów ustala się ocenę końcową na podstawie następujących parametrów: średniej ocen ze wszystkich przedmiotów, oceny pracy dyplomowej oraz wyniku egzaminu dyplomowego. Zdarza się, że uczelnie na niektórych kierunkach przyjmują wagi: 4 dla średniej ocen, 2 dla oceny pracy dyplomowej oraz 2 dla wyniku egzaminu dyplomowego. Inne uczelnie, preferujące jeszcze bardziej średnią ze studiów, mogą z kolei przyjąć, odpowiednio, następujące wagi: 6, 1, 1.

Ćwiczenie 2.3

Wyznaczymy parametry dla danych z GPW, zaprezentowanych w ćwiczeniu 1.4.

Najpierw policzymy parametry dla danych surowych.

Średnia: x¯=0.365625.

Co prawda, w tamtym dniu na GPW był WZROST a nie spadek indeksów, jednakże nie jest sprzeczne z naszym wyliczeniem, bo indeksy wzrostu są średnimi ważonymi, a nie arytmetycznymi.

Mediana: me=0.

Na pierwszy rzut oka jest to dość dziwny wynik, ale po dokładniejszym przyjrzeniu się danym można go łatwo uzasadnić.

Moda: 0.

Wariancja: sn26.02148.

Ale można także dostać wynik: sn25.99796! To, że pewne parametry statystyczne daje się zdefiniować na dwa (lub nawet trzy), nieznacznie różniące się między sobą sposoby, jest dość typową sytuacją. W tym przypadku, ta druga wielkość została obliczona z następującego wzoru:


sn2=1n1i=1n(yix¯)2


Co ciekawe, oba wyniki można otrzymać wykorzystując dwa różne pakiety statystyczne programu Maple, o których wspominaliśmy na poprzednich ćwiczeniach (czy pamiętasz ich nazwy?). Jak zobaczymy na wykładzie 11, dzielenie przez n1 (zamiast przez n) jest w pewien sposób uzasadnione.

Na zakończenie obliczymy parametry dla danych skumulowanych w szereg rozdzielczy.

Średnia: x¯=0.234375.

Mediana: me0.034722.

Wariancja: sn26.3123.

Ćwiczenie 2.4

Do graficznej reprezentacji kwantyli, a w zasadzie kwartyli, służy wykres określany mianem "pudełko z wąsami". Górna i dolna krawędź owego pudełka to Q3 oraz Q1. Przez środek pudełka przechodzi linia, która oznacza medianę. "Wąsy" to wypustki biegnące od pudełka w górę i w dół, zakończone liniami poziomymi określającymi położenie najbardziej skrajnych elementów.

<flash>file=box-and-whisker.swf|width=500|height=500</flash>

Istnieje pewne zróżnicowanie pudełek z wąsami, związane ze znaczeniem poszczególnych linii. Warto jest zawsze spojrzeć na stronę Pomocy programu z którego się korzysta. Oto fragment Pomocy pakietu stats z programu Maple:

 A box plot comprises these elements:

 1) A box with

   - a central line showing the median,

   - a lower line showing the first quartile,

   - an upper line showing the third quartile;

 2) Two lines extending from the central box of maximal length 3/2 the interquartile range but not extending past the range of the data;

 3) Outliers, points that lie outside the extent of the previous elements.


A oto pudełko z wąsami dla danych (surowych) z GPW:


<flash>file=Rp.1.21.swf|width=350|height=350</flash>


Ćwiczenie 2.5

W trakcie pisemnego egzaminu ze statystyki osoby rozwiązujące zestawy A i B otrzymały następujące wyniki (w punktach):

A := [11, 9, 9.5, 12.5, 10, 4.5, 4.5, 5, 6, 16, 12, 11, 10, 3.5, 7, 7, 7, 8, 6, 0.5, 15.5],

B := [4, 10, 11.5, 8, 8.5, 12, 11, 8, 8, 10, 13.5, 3.5, 12, 11, 11, 5.5, 6, 9, 1.5, 11, 8, 8.5 ].

Pierwsze porównanie wyników można zrobić używając pudełek:


<flash>file=Rp.1.22.swf|width=350|height=350</flash>


Od razu widać, że raczej lepsze wyniki były w grupie B, jakkolwiek w grupie A osiągnięto najlepszy wynik.



Zadanie 2.1
Przypuśćmy, że jest dwóch kandydatów na studia w sytuacji opisanej w ćwiczeniu 2.1: jeden ma dobre i porównywalne ze sobą wyniki z przedmiotu A, natomiast drugi jest zdecydowanie lepszy z przedmiotu A lecz, niestety, zdecydowanie gorszy z przedmiotu B. Załóżmy, że średnie arytmetyczne tych kandydatów są takie same. Który z nich dostanie się na studia?

Zadanie 2.2
Ocena z egzaminu końcowego z pewnego przedmiotu, ustalana jest na podstawie średniej ważonej ocen z dwóch sprawdzianów w trakcie semestru oraz oceny z testu końcowego w sesji. Jakie wagi powinno się, Twoim zdaniem, przyjąć w tym przypadku?

Zadanie 2.3
Zastanów się, jak zdefiniować geometryczną średnią ważoną.

Zadanie 2.4
Ściągnij ze strony GPW:

http://www.gpw.com.pl

bieżące dane dotyczące zmian kursów akcji i porównaj je z danymi załączonymi do ćwiczenia 1.4: (a) obliczając i porównując odpowiednie parametry, (b) rysując obok siebie dwa pudełka z wąsami.

Zadanie 2.5
Dane są następujące wartości cechy X:


3,5,10,6,8,6,8,10,12.


Naszkicuj dystrybuantę empiryczną dla cechy X, a następnie, na tym rysunku, zaznacz wszystkie kwartyle tej cechy.

Zadanie 2.6
Podaj przykładowe wartości cechy, dla której mediana jest dwa razy większa od średniej.

Zadanie 2.7
Niech x1,,xn będą wartościami pewnej cechy w skali porządkowej. Określmy liczby:


zi=xix¯s,


gdzie s jest odchyleniem standardowym danej cechy. Wykaż, że średnia z tak otrzymanych wartości wynosi 0, zaś odchylenie standardowe jest równe 1.