Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 1: Wstęp: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Moskala (dyskusja | edycje)
m Zastępowanie tekstu - "<div class="thumb"><div style="width:(.*);"> <flash>file=(.*)\.swf\|width=(.*)\|height=(.*)<\/flash> <div\.thumbcaption>(.*)<\/div> <\/div><\/div>" na "$3x$4px|thumb|center|$5"
 
(Nie pokazano 19 wersji utworzonych przez 3 użytkowników)
Linia 7: Linia 7:
Poniżej kopiujemy pewne fragmenty Pomocy programu Microsoft Excel.
Poniżej kopiujemy pewne fragmenty Pomocy programu Microsoft Excel.


''W programie Microsoft Excel udostępniono szereg narzędzi do
''W programie Microsoft Excel udostępniono szereg narzędzi do analizy statystycznej danych – zebranych w dodatku Analysis ToolPak – z którego można korzystać na różnych etapach opracowywania złożonych analiz statystycznych lub technicznych. Zadaniem użytkownika jest dostarczenie danych oraz innych niezbędnych parametrów; poszczególne narzędzia korzystają ze statystycznych lub inżynierskich makr funkcji i przedstawiają rezultaty w tabeli wyników. Niektóre spośród narzędzi oprócz tabeli tworzą także wykresy. (...). Aby zapoznać się z listą dostępnych narzędzi, kliknij polecenie Analiza danych w menu Narzędzia. Jeżeli polecenie Analiza danych nie jest dostępne w menu Narzędzia, musisz zainstalować dodatek Analysis ToolPak. (...). W programie Excel dostępnych jest wiele innych funkcji statystycznych, finansowych i inżynierskich. Niektóre funkcje statystyczne są wbudowane, a inne stają się dostępne po zainstalowaniu pakietu Analysis ToolPak. Warto przejrzeć listę dostępnych funkcji statystycznych.''
analizy statystycznej danych – zebranych w dodatku Analysis ToolPak – z którego można korzystać na różnych etapach opracowywania złożonych analiz statystycznych lub technicznych. Zadaniem użytkownika jest dostarczenie danych oraz innych niezbędnych parametrów; poszczególne narzędzia korzystają ze statystycznych lub inżynierskich makr funkcji i przedstawiają rezultaty w tabeli wyników. Niektóre spośród narzędzi oprócz tabeli tworzą także wykresy. (...). Aby zapoznać się z listą dostępnych narzędzi, kliknij polecenie Analiza danych w menu Narzędzia. Jeżeli polecenie Analiza danych nie jest dostępne w menu Narzędzia, musisz zainstalować dodatek Analysis ToolPak. (...). W programie Excel dostępnych jest wiele innych funkcji statystycznych, finansowych i inżynierskich. Niektóre funkcje statystyczne są wbudowane, a inne stają się dostępne po zainstalowaniu pakietu Analysis ToolPak. Warto przejrzeć listę dostępnych funkcji statystycznych.''


W Dodatku Analiza danych dostępne są następujące procedury:
W Dodatku Analiza danych dostępne są następujące procedury:
Linia 45: Linia 44:


<center>
<center>
<div class="thumb"><div style="width:520px;">
[[File:Rp-1-c1.svg|500x500px|thumb|center|Funkcje statystyczne w programie MS Excel]]
<flash>file=Rp-1-c1.swf|width=500|height=500</flash>
<div.thumbcaption>Funkcje statystyczne w programie MS Excel</div>
</div></div>
</center>
</center>


{{cwiczenie|1.2|cw 1.2|
{{cwiczenie|1.2|cw 1.2|
Program Maple zawiera pakiety procedur statystycznych. Oto pełna lista procedur pakietu <math>\texttt Statistics</math>, który w wersji Maple 10 zastępuje starszy pakiet <math>\texttt stats</math> (oczywiście, można w tej wersji korzystać także z pakietu <math>\texttt stats</math>).
Program Maple zawiera pakiety procedur statystycznych. Oto pełna lista procedur pakietu <math>\texttt Statistics</math>, który w wersji Maple 10 zastępuje starszy pakiet <math>\texttt stats</math> (oczywiście, można w tej wersji korzystać także z pakietu <math>\texttt stats</math>).
 
}}
<center>
<center>
<div class="thumb"><div style="width:520px;">
[[File:Rp-1-c2.svg|500x500px|thumb|center|Procedury statystyczne w Maple]]
<flash>file=Rp-1-c2.swf|width=500|height=500</flash>
<div.thumbcaption>Procedury statystyczne w Maple</div>
</div></div>
</center>
</center>


Linia 64: Linia 57:
Dane o skali nominalnej można prezentować graficznie. Często używanym sposobem jest tak zwany wykres kołowy  (ciasteczko).
Dane o skali nominalnej można prezentować graficznie. Często używanym sposobem jest tak zwany wykres kołowy  (ciasteczko).
}}
}}
Dla następujących danych (patrz przykład [[Rachunek prawdopodobieństwa i statystyka/Wykład 1: Wstęp#przy 1.1|1.1]] z wykładu):  
Dla następujących danych (patrz [[Rachunek prawdopodobieństwa i statystyka/Wykład 1: Wstęp#przy_1.1|przykład 1.1]] z wykładu):  




<center><math>5,2,5,4,5,4,4,3,5,5,4,5,</math></center>
<center><math>5,2,5,4,5,4,4,3,5,5,4,5</math>,</center>




Linia 76: Linia 69:
</center>
</center>


{{cwiczenie|1.4|cw 1.4|
{{cwiczenie|1.4|cw_1.4|
W dniu 23 czerwca 2006, podczas sesji GPW w Warszawie zanotowano następujące zmiany cen akcji (w procentach):<br>
W dniu 23 czerwca 2006, podczas sesji GPW w Warszawie zanotowano następujące zmiany cen akcji (w procentach):<br>
- 4.6, - 4.5, - 4.6, 0, - 0.2, - 2.4, - 1.6, - 1.5, - 5.1, - 2.3, - 0.7, - 0.6, -
- 4.6, - 4.5, - 4.6, 0, - 0.2, - 2.4, - 1.6, - 1.5, - 5.1, - 2.3, - 0.7, - 0.6, -
Linia 118: Linia 111:


<center>
<center>
<div class="thumb"><div style="width:520px;">
[[File:Rp-1-13-14.svg|500x500px|thumb|center|Sortowanie danych surowych wykresu słupkowego]]
<flash>file=Rp-1-13-14.swf|width=500|height=500</flash>
<div.thumbcaption>Sortowanie danych surowych wykresu słupkowego</div>
</div></div>
</center>
</center>


Linia 133: Linia 123:




<center><math>\aligned
<center>
Weight(-7 .. -6, 5),\\
Weight(-7 .. -6, 5),
Weight(-6 .. -5, 4),\\
 
Weight(-5 .. -4, 10),\\
Weight(-6 .. -5, 4),
Weight(-4 .. -3, 15),\\
 
Weight(-3 .. -2, 18),\\
Weight(-5 .. -4, 10),
Weight(-2 .. -1, 33),\\
 
Weight(-1 .. 0, 41),\\
Weight(-4 .. -3, 15),
Weight(0 .. 1, 72),\\
 
Weight(1 .. 2, 23),\\
Weight(-3 .. -2, 18),
Weight(2 .. 3, 16),\\
 
Weight(3 .. 4, 6),\\
Weight(-2 .. -1, 33),
Weight(4 .. 5, 5),\\
 
Weight(5 .. 6, 5),\\
Weight(-1 .. 0, 41),
Weight(6 .. 7, 0),\\
 
7 .. 8,\\
Weight(0 .. 1, 72),
8 .. 9,\\
 
Weight(1 .. 2, 23),
 
Weight(2 .. 3, 16),
 
Weight(3 .. 4, 6),
 
Weight(4 .. 5, 5),
 
Weight(5 .. 6, 5),
 
Weight(6 .. 7, 0),
 
7 .. 8,
 
8 .. 9,
 
9 .. 10.
9 .. 10.
\endaligned
</center>
</math></center>


Liczności ostatnich trzech klas były równe 1 i dlatego Maple ich nie wyświetlił.
Liczności ostatnich trzech klas były równe 1 i dlatego Maple ich nie wyświetlił.


{{uwaga|||
{{uwaga|1.3.||  
Maple stosuje klasy lewostronnie domknięte.
Maple stosuje klasy lewostronnie domknięte.
}}
}}
Linia 171: Linia 176:
</center>
</center>


==Zadania==
------------
 
'''Zadanie 1.1'''<br>
===Zadanie 1===
Proszę ustalić z jakiego programu komputerowego będziemy korzystać w trakcie tego kursu.
Proszę ustalić z jakiego programu komputerowego będziemy korzystać w trakcie tego kursu.


===Zadanie 2===
'''Zadanie 1.2'''<br>
Zastanawiano się nad możliwością wykorzystania w naszym kursie programu <math>\texttt R</math>. Odwiedź następującą stronę:
Zastanawiano się nad możliwością wykorzystania w naszym kursie programu <math>\texttt R</math>. Odwiedź następującą stronę:




<center>
<center>
[http://r-project.org. http://r-project.org.]
[http://www.r-project.org http://www.r-project.org]
</center>
</center>


===Zadanie 3===
'''Zadanie 1.3'''<br>
Używając wybranego programu komputerowego wykonaj wykresy statystyczne omówione na ćwiczeniach.
Używając wybranego programu komputerowego wykonaj wykresy statystyczne omówione na ćwiczeniach.


===Zadanie 4===
'''Zadanie 1.4'''<br>
Tworząc szereg rozdzielczy z danych surowych dla cechy w skali porządkowej, można w naturalny sposób zdefiniować pewną cechę, która posiada skalę nominalną. Wyjaśnij szczegóły.
Tworząc szereg rozdzielczy z danych surowych dla cechy w skali porządkowej, można w naturalny sposób zdefiniować pewną cechę, która posiada skalę nominalną. Wyjaśnij szczegóły.

Aktualna wersja na dzień 10:55, 3 paź 2021

Ćwiczenia

Ćwiczenie 1.1

Program MS Excel zawiera pewną liczbę funkcji i procedur statystycznych. Część z nich może być bardzo użyteczna.

Poniżej kopiujemy pewne fragmenty Pomocy programu Microsoft Excel.

W programie Microsoft Excel udostępniono szereg narzędzi do analizy statystycznej danych – zebranych w dodatku Analysis ToolPak – z którego można korzystać na różnych etapach opracowywania złożonych analiz statystycznych lub technicznych. Zadaniem użytkownika jest dostarczenie danych oraz innych niezbędnych parametrów; poszczególne narzędzia korzystają ze statystycznych lub inżynierskich makr funkcji i przedstawiają rezultaty w tabeli wyników. Niektóre spośród narzędzi oprócz tabeli tworzą także wykresy. (...). Aby zapoznać się z listą dostępnych narzędzi, kliknij polecenie Analiza danych w menu Narzędzia. Jeżeli polecenie Analiza danych nie jest dostępne w menu Narzędzia, musisz zainstalować dodatek Analysis ToolPak. (...). W programie Excel dostępnych jest wiele innych funkcji statystycznych, finansowych i inżynierskich. Niektóre funkcje statystyczne są wbudowane, a inne stają się dostępne po zainstalowaniu pakietu Analysis ToolPak. Warto przejrzeć listę dostępnych funkcji statystycznych.

W Dodatku Analiza danych dostępne są następujące procedury:

Analiza wariancji (anova)

Korelacja, narzędzie analizy

Kowariancja, narzędzie analizy

Statystyka opisowa, narzędzie analizy

Wygładzanie wykładnicze, narzędzie analizy

Analiza Fouriera, narzędzie analizy

Test F: z dwiema próbkami, narzędzie analizy

Histogram, narzędzie analizy

Średnia ruchoma, narzędzie analizy

Wykonywanie analizy testu t

Narzędzie do analizy generowania liczb losowych

Ranga i percentyl, narzędzie analizy

Regresja, narzędzie analizy

Próbkowanie, narzędzie analizy

Test z: z dwiema próbkami, narzędzie analizy.
Funkcje statystyczne w programie MS Excel

Ćwiczenie 1.2

Program Maple zawiera pakiety procedur statystycznych. Oto pełna lista procedur pakietu Statistics, który w wersji Maple 10 zastępuje starszy pakiet stats (oczywiście, można w tej wersji korzystać także z pakietu stats).

Procedury statystyczne w Maple

Ćwiczenie 1.3

Dane o skali nominalnej można prezentować graficznie. Często używanym sposobem jest tak zwany wykres kołowy (ciasteczko).

Dla następujących danych (patrz przykład 1.1 z wykładu):


5,2,5,4,5,4,4,3,5,5,4,5,


wykres kołowy wygląda tak:

<flashwrap>file=Rp-1-12-13.swf|size=small</flashwrap>

Ćwiczenie 1.4

W dniu 23 czerwca 2006, podczas sesji GPW w Warszawie zanotowano następujące zmiany cen akcji (w procentach):
- 4.6, - 4.5, - 4.6, 0, - 0.2, - 2.4, - 1.6, - 1.5, - 5.1, - 2.3, - 0.7, - 0.6, - 2.1, - 0.7, - 1.2, -5, 0.6, -3, -4, 0, 0.5, 2.3, - 1.5, - 4.7, - 1.1, 1.5, - 2.2, 0, 1.4, 0.3, 2.3, - 6.1, - 5.6, 2.7, 3.4, -2, - 0.3, 4.2, - 6.1, 0.9, - 2.3, 5.1, - 0.2, 0.6, -4, -2, 0.9, - 0.7, - 2.4, 2, - 2.9, 5.6, 0, - 0.9, 0, 0, 0 , - 2.2, - 0.8, - 1.1, - 2.2, 0, 0.9, 0.2, 1.3, 2.7, - 0.6, - 2.7, - 1.5, - 3.6 , 0, - 0.6, - 2.6, 0, - 4.3, 0, -4, 2.9, - 1.9, - 0.5, 0, 2.8, - 2.3, - 0.3, - 1.4, 1.9, 0, - 4.3, 0.4, 0, - 1.9, 2.2, 1.2, - 0.9, - 1.6, 0.8, 0, 0, - 1.3, 0.8, 0, - 3.9, -6, - 3.2, - 6.1, - 0.8, 0, 0, - 0.7, - 3.3, - 0.4, 0, - 0.5, 1.9, - 0.6, 2, 0.8, - 4.7, - 0.2, 1.3, 2.3, - 3.8, - 0.3, 0, 0, 1, 1.5, 1.6, 0.5, - 3.3, - 0.7, 0, - 4.9, 0.5, 0, 3.9, - 3.8, - 1.3, 0, - 2.5, - 3.2, 0, - 1.1, - 1.4, - 1.5 , - 2.4, - 4.6, 1.9, - 2.4, - 3.6, 1, - 0.9, 0, - 1.9, -1, - 1.7, - 0.2, - 3.4, - 0.6, - 0.7, 1.4, 1.2, 0, 5.2, 0.9, 0.8, - 0.6, 1.9, 1.5, 5.1, 1.9, 4.2, 0.9, 1.3, 0.9, - 2.3, 1.5, - 0.5, 2.2, 0, 1.1, - 1.7, - 1.1, 0, - 0.3, - 1.2, - 0.7, -1, 3.8, - 1.2, - 1.5, 2.4, 0, 0, -1, 0, - 1.2, 0.7, 0, 0.4, 0.4, - 0.3, - 1.4, 0.4, 0.4, - 6.4, - 6.3, 2, 0.8, 0.6, - 0.5, - 1.4, 0, - 0.9, - 3.3, - 1.4 , - 1.1, - 3.8, -1, - 1.6, 2.7, -3, 4.6, 0.9, 0, 0.3, - 1.3, - 5.8, - 0.6, 0.4, 0.7, 0, 3, 2, 0, 0, 4, -1, 9, -1, 4, 1, 3, 1, 7, -1, 8, -2, 0, 1, 3, 0, 0, 5, 0, 2.

Interpretacja graficzna danych surowych w postaci wykresu słupkowego nie jest zbyt pomocna, więc spróbujemy inaczej spojrzeć na te dane. Najpierw je posortujemy:
- 6.4, - 6.3, - 6.1, - 6.1, - 6.1, -6, - 5.8, - 5.6, - 5.1, -5, - 4.9, - 4.7, - 4.7, - 4.6, - 4.6, - 4.6, - 4.5, - 4.3, - 4.3, -4, -4, -4, - 3.9, - 3.8, - 3.8, - 3.8, - 3.6, - 3.6, - 3.4, - 3.3, - 3.3, - 3.3, - 3.2, - 3.2, -3, -3, - 2.9, - 2.7 , - 2.6, - 2.5, - 2.4, - 2.4, - 2.4, - 2.4, - 2.3, - 2.3, - 2.3, - 2.3, - 2.2, - 2.2, - 2.2, - 2.1, -2, -2, -2, - 1.9, - 1.9, - 1.9, - 1.7, - 1.7, - 1.6, - 1.6, - 1.6, - 1.5, - 1.5, - 1.5, - 1.5, - 1.5, - 1.4, - 1.4, - 1.4, - 1.4, - 1.4, - 1.3 , - 1.3, - 1.3, - 1.2, - 1.2, - 1.2, - 1.2, - 1.1, - 1.1, - 1.1, - 1.1, - 1.1, -1, -1, -1, -1, -1, -1, -1, - 0.9, - 0.9, - 0.9, - 0.9, - 0.8, - 0.8, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6 , - 0.5, - 0.5, - 0.5, - 0.5, - 0.4, - 0.3, - 0.3, - 0.3, - 0.3, - 0.3, - 0.2, - 0.2, - 0.2, - 0.2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 , 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.3, 0.4, 0.4, 0.4, 0.4, 0.4, 0.4, 0.5, 0.5, 0.5, 0.6, 0.6, 0.6, 0.7, 0.7, 0.8, 0.8, 0.8, 0.8, 0.8, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 1, 1, 1, 1, 1, 1.1, 1.2, 1.2, 1.3, 1.3, 1.3, 1.4, 1.4, 1.5, 1.5, 1.5, 1.5, 1.6, 1.9, 1.9, 1.9, 1.9, 1.9, 2, 2, 2, 2, 2, 2.2, 2.2, 2.3, 2.3, 2.3, 2.4, 2.7, 2.7, 2.7, 2.8, 2.9, 3, 3, 3 , 3.4, 3.8, 3.9, 4, 4, 4.2, 4.2, 4.6, 5, 5.1, 5.1, 5.2, 5.6, 7, 8, 9.
Teraz wykres słupkowy ujawnia więcej informacji.

Sortowanie danych surowych wykresu słupkowego

Widać, na przykład, że więcej było spadków niż wzrostów, ale kilka spółek miały większe wzrosty niż jakikolwiek zanotowany spadek.

Zbudujemy teraz szereg rozdzielczy. Wybieramy w tym celu punkty podziału na klasy: -8, - 7, ... 9, 10. Używając polecenia Maple (z pakietu stats):

>transform[tallyinto]([x],[seq(8+i..7+i,i=1..17)]);

gdzie x oznacza ciąg naszych danych, otrzymujemy klasy wraz z ich licznościami:


Weight(-7 .. -6, 5),

Weight(-6 .. -5, 4),

Weight(-5 .. -4, 10),

Weight(-4 .. -3, 15),

Weight(-3 .. -2, 18),

Weight(-2 .. -1, 33),

Weight(-1 .. 0, 41),

Weight(0 .. 1, 72),

Weight(1 .. 2, 23),

Weight(2 .. 3, 16),

Weight(3 .. 4, 6),

Weight(4 .. 5, 5),

Weight(5 .. 6, 5),

Weight(6 .. 7, 0),

7 .. 8,

8 .. 9,

9 .. 10.

Liczności ostatnich trzech klas były równe 1 i dlatego Maple ich nie wyświetlił.

Uwaga 1.3.

Maple stosuje klasy lewostronnie domknięte.

Możemy teraz narysować histogram wykazujący liczności klas:

<flash>file=Rp-1-15.swf|width=350|height=350</flash>

Wiele programów statystycznych rysuje histogram na podstawie danych surowych. Oto taki histogram - odpowiada on funkcji hist zdefiniowanej na wykładzie.

<flash>file=Rp-1-16.swf|width=350|height=350</flash>


Zadanie 1.1
Proszę ustalić z jakiego programu komputerowego będziemy korzystać w trakcie tego kursu.

Zadanie 1.2
Zastanawiano się nad możliwością wykorzystania w naszym kursie programu R. Odwiedź następującą stronę:


http://www.r-project.org

Zadanie 1.3
Używając wybranego programu komputerowego wykonaj wykresy statystyczne omówione na ćwiczeniach.

Zadanie 1.4
Tworząc szereg rozdzielczy z danych surowych dla cechy w skali porządkowej, można w naturalny sposób zdefiniować pewną cechę, która posiada skalę nominalną. Wyjaśnij szczegóły.