RPS/Ćwiczenia 1: Wstęp: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Pitab (dyskusja | edycje)
Pitab (dyskusja | edycje)
Nie podano opisu zmian
 
Linia 1: Linia 1:
==Ćwiczenia==


{{cwiczenie|1||
Program MS Excel zawiera pewną liczbę funkcji i procedur statystycznych. Część z nich może być bardzo użyteczna.
}}
Poniżej kopiujemy pewne fragmenty Pomocy programu Microsoft Excel.
<math>\textsf{"W programie Microsoft Excel udostępniono szereg narzędzi do
analizy statystycznej danych – zebranych w dodatku Analysis ToolPak – z którego można korzystać na różnych etapach opracowywania złożonych analiz statystycznych lub technicznych. Zadaniem użytkownika jest dostarczenie danych oraz innych niezbędnych parametrów; poszczególne narzędzia korzystają ze statystycznych lub inżynierskich makr funkcji i przedstawiają rezultaty w tabeli wyników. Niektóre spośród narzędzi oprócz tabeli tworzą także wykresy. (...). Aby zapoznać się z listą dostępnych narzędzi, kliknij polecenie Analiza danych w menu Narzędzia. Jeżeli polecenie Analiza danych nie jest dostępne w menu Narzędzia, musisz zainstalować dodatek Analysis ToolPak. (...). W programie Excel dostępnych jest wiele innych funkcji statystycznych, finansowych i inżynierskich. Niektóre funkcje statystyczne są wbudowane, a inne stają się dostępne po zainstalowaniu pakietu Analysis ToolPak. Warto przejrzeć listę dostępnych funkcji statystycznych."}</math>
W Dodatku Analiza danych dostępne są następujące procedury:
<math>\quote
Analiza wariancji (anova)
Korelacja, narzędzie analizy
Kowariancja, narzędzie analizy
Statystyka opisowa, narzędzie analizy
Wygładzanie wykładnicze, narzędzie analizy
Analiza Fouriera, narzędzie analizy
Test F: z dwiema próbkami, narzędzie analizy
Histogram, narzędzie analizy
Średnia ruchoma, narzędzie analizy
Wykonywanie analizy testu t
Narzędzie do analizy generowania liczb losowych
Ranga i percentyl, narzędzie analizy
Regresja, narzędzie analizy
Próbkowanie, narzędzie analizy
Test z: z dwiema próbkami, narzędzie analizy.
\endquote
</math>
Funkcjami statystycznymi są:
<math>\quote
ILE.LICZB
ILE.NIEPUSTYCH
KOWARIANCJA
KURTOZA
KWARTYL
MAX
MAX.A
MAX.K
MEDIANA
MIN
MIN.A
MIN.K
NACHYLENIE
NORMALIZUJ
ODCH.KWADRATOWE
ODCH.STANDARD.POPUL
ODCH.STANDARD.POPUL.A
ODCH.STANDARDOWE
ODCH.STANDARDOWE.A
ODCH.ŚREDNIE
ODCIĘTA
PEARSON
PERCENTYL
PERMUTACJE
POZYCJA
PRAWDPD
PROCENT.POZYCJA
PRÓG.ROZKŁAD.DWUM
R.KWADRAT
REGBŁSTD
REGEXPP
REGEXPW
REGLINP
REGLINW
REGLINX
ROZKŁAD.BETA
ROZKŁAD.BETA.ODW
ROZKŁAD.CHI
ROZKŁAD.CHI.ODW
ROZKŁAD.DWUM
ROZKŁAD.DWUM.PRZEC
ROZKŁAD.EXP
ROZKŁAD.F
ROZKŁAD.F.ODW
ROZKŁAD.FISHER
ROZKŁAD.FISHER.ODW
ROZKŁAD.GAMMA
ROZKŁAD.GAMMA.ODW
ROZKŁAD.HIPERGEOM
ROZKŁAD.LIN.GAMMA
ROZKŁAD.LOG
ROZKŁAD.LOG.ODW
ROZKŁAD.NORMALNY
ROZKŁAD.NORMALNY.ODW
ROZKŁAD.NORMALNY.S
ROZKŁAD.NORMALNY.S.ODW
ROZKŁAD.POISSON
ROZKŁAD.T
ROZKŁAD.T.ODW
ROZKŁAD.WEIBULL
SKOŚNOŚĆ
ŚREDNIA
ŚREDNIA.A
ŚREDNIA.GEOMETRYCZNA
ŚREDNIA.HARMONICZNA
ŚREDNIA.WEWN
TEST.CHI
TEST.F
TEST.T
TEST.Z
UFNOŚĆ
WARIANCJA
WARIANCJA.A
WARIANCJA.POPUL
WARIANCJA.POPUL.A
WSP.KORELACJI
WYST.NAJCZĘŚCIEJ
\endquote
</math>
{{cwiczenie|2||
Program Maple zawiera pakiety procedur statystycznych. Oto pełna lista procedur pakietu <math>\texttt Statistics</math>, który w wersji Maple 10 zastępuje starszy pakiet <math>\texttt stats</math> (oczywiście, można w tej wersji korzystać także z pakietu <math>\texttt stats</math>).
<math>\quote
AbsoluteDeviation, AreaChart, BarChart, Bootstrap, BoxPlot, BubblePlot, CDF, CGF, CentralMoment, CharacteristicFunction, ChiSquareGoodnessOfFitTest, ChiSquareIndependenceTest, ChiSquareSuitableModelTest, ColumnGraph, Correlation, CorrelationMatrix, Count, CountMissing, Covariance, CovarianceMatrix, Cumulant, CumulantGeneratingFunction, CumulativeDistributionFunction, CumulativeProduct, CumulativeSum, CumulativeSumChart, DataSummary, Decile, DensityPlot, Discretize, Distribution, ErrorPlot, EvaluateToFloat, ExpectedValue, ExponentialFit, ExponentialSmoothing, FailureRate, FisherInformation, Fit, FivePointSummary, FrequencyPlot, FrequencyTable, GeometricMean, HarmonicMean, HazardRate, Histogram, Information, InteractiveDataAnalysis, InterquartileRange, InverseSurvivalFunction, Join, KernelDensity, KernelDensityPlot, KernelDensitySample, Kurtosis, Likelihood, LikelihoodRatioStatistic, LineChart, LinearFilter, LinearFit, LogLikelihood, LogarithmicFit, MGF, MLE, MakeProcedure, MaximumLikelihoodEstimate, Mean, MeanDeviation, Median, MedianDeviation, MillsRatio, Mode, Moment, MomentGeneratingFunction, MovingAverage, MovingMedian, MovingStatistic, NonlinearFit, NormalPlot, OneSampleChiSquareTest, OneSampleTTest, OneSampleZTest, OneWayANOVA, OrderByRank, OrderStatistic, PDF, Percentile, PieChart, PointPlot, PolynomialFit, PowerFit, Probability, ProbabilityDensityFunction, ProbabilityFunction, ProbabilityPlot, ProfileLikelihood, ProfileLogLikelihood, QuadraticMean, Quantile, QuantilePlot, Quartile, RandomVariable, Range, Rank, Remove, RemoveInRange, RemoveNonNumeric, Sample, ScatterPlot, Score, Select, SelectInRange, SelectNonNumeric, ShapiroWilkWTest, Shuffle, Skewness, Sort, StandardDeviation, StandardError, StandardizedMoment, Support, SurfacePlot, SurvivalFunction, Tally, TallyInto, Trim, TrimmedMean, TwoSampleFTest, TwoSamplePairedTTest, TwoSampleTTest, TwoSampleZTest, Variance, Variation, WeightedMovingAverage, Winsorize, WinsorizedMean.
\endquote</math>
}}
{{cwiczenie|3||
Dane o skali nominalnej można prezentować graficznie. Często używanym sposobem jest tak zwany wykres kołowy  (ciasteczko).
}}
Dla następujących danych (patrz przykład [[RPS/Wykład 1: Wstęp#Przykład 1.1|1.1]] z wykładu):
<center><math>5,2,5,4,5,4,4,3,5,5,4,5,</math></center>
wykres kołowy wygląda tak:
<center>[[11.eps(kółko1)]]</center>
lub tak:
<center>[[12.eps(kółko2)]]</center>
{{cwiczenie|4||
W dniu 23 czerwca 2006, podczas sesji GPW w Warszawie zanotowano następujące zmiany cen akcji (w procentach):<br>
- 4.6, - 4.5, - 4.6, 0, - 0.2, - 2.4, - 1.6, - 1.5, - 5.1, - 2.3, - 0.7, - 0.6, -
2.1, - 0.7, - 1.2, -5,  0.6, -3, -4, 0,  0.5,  2.3, - 1.5, - 4.7, - 1.1,  1.5, -
2.2, 0,  1.4,  0.3,  2.3, - 6.1, - 5.6,  2.7,  3.4, -2, - 0.3,  4.2, - 6.1,  0.9, -
2.3,  5.1, - 0.2,  0.6, -4, -2,  0.9, - 0.7, - 2.4, 2, - 2.9,  5.6, 0, - 0.9, 0, 0, 0
, - 2.2, - 0.8, - 1.1, - 2.2, 0,  0.9,  0.2,  1.3,  2.7, - 0.6, - 2.7, - 1.5, - 3.6
, 0, - 0.6, - 2.6, 0, - 4.3, 0, -4,  2.9, - 1.9, - 0.5, 0,  2.8, - 2.3, - 0.3, - 1.4,
1.9, 0, - 4.3,  0.4, 0, - 1.9,  2.2,  1.2, - 0.9, - 1.6,  0.8, 0, 0, - 1.3,  0.8, 0,
- 3.9, -6, - 3.2, - 6.1, - 0.8, 0, 0, - 0.7, - 3.3, - 0.4, 0, - 0.5,  1.9, - 0.6, 2,
0.8, - 4.7, - 0.2,  1.3,  2.3, - 3.8, - 0.3, 0, 0, 1,  1.5,  1.6,  0.5, - 3.3, -
0.7, 0, - 4.9,  0.5, 0,  3.9, - 3.8, - 1.3, 0, - 2.5, - 3.2, 0, - 1.1, - 1.4, - 1.5
, - 2.4, - 4.6,  1.9, - 2.4, - 3.6, 1, - 0.9, 0, - 1.9, -1, - 1.7, - 0.2, - 3.4, -
0.6, - 0.7,  1.4,  1.2, 0,  5.2,  0.9,  0.8, - 0.6,  1.9,  1.5,  5.1,  1.9,  4.2,
0.9,  1.3,  0.9, - 2.3,  1.5, - 0.5,  2.2, 0,  1.1, - 1.7, - 1.1, 0, - 0.3, - 1.2,
- 0.7, -1,  3.8, - 1.2, - 1.5,  2.4, 0, 0, -1, 0, - 1.2,  0.7, 0,  0.4,  0.4, - 0.3, -
1.4,  0.4,  0.4, - 6.4, - 6.3, 2,  0.8,  0.6, - 0.5, - 1.4, 0, - 0.9, - 3.3, - 1.4
, - 1.1, - 3.8, -1, - 1.6,  2.7, -3,  4.6,  0.9, 0,  0.3, - 1.3, - 5.8, - 0.6,  0.4,
0.7, 0, 3, 2, 0, 0, 4, -1, 9, -1, 4, 1, 3, 1, 7, -1, 8, -2, 0, 1, 3, 0, 0, 5, 0, 2.
}}
Interpretacja graficzna danych surowych w postaci wykresu słupkowego wygląda następująco:
<center>[[13.eps(wykres1)]]</center>
Wydaje się, że nie jest ona zbyt pomocna, więc spróbujemy inaczej spojrzeć na te dane. Najpierw je posortujemy:<br>
- 6.4, - 6.3, - 6.1, - 6.1, - 6.1, -6, - 5.8, - 5.6, - 5.1, -5, - 4.9, - 4.7, -
4.7, - 4.6, - 4.6, - 4.6, - 4.5, - 4.3, - 4.3, -4, -4, -4, - 3.9, - 3.8, - 3.8, -
3.8, - 3.6, - 3.6, - 3.4, - 3.3, - 3.3, - 3.3, - 3.2, - 3.2, -3, -3, - 2.9, - 2.7
, - 2.6, - 2.5, - 2.4, - 2.4, - 2.4, - 2.4, - 2.3, - 2.3, - 2.3, - 2.3, - 2.2, -
2.2, - 2.2, - 2.1, -2, -2, -2, - 1.9, - 1.9, - 1.9, - 1.7, - 1.7, - 1.6, - 1.6, -
1.6, - 1.5, - 1.5, - 1.5, - 1.5, - 1.5, - 1.4, - 1.4, - 1.4, - 1.4, - 1.4, - 1.3
, - 1.3, - 1.3, - 1.2, - 1.2, - 1.2, - 1.2, - 1.1, - 1.1, - 1.1, - 1.1, - 1.1, -1,
-1, -1, -1, -1, -1, -1, - 0.9, - 0.9, - 0.9, - 0.9, - 0.8, - 0.8, - 0.7, - 0.7, -
0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6
, - 0.5, - 0.5, - 0.5, - 0.5, - 0.4, - 0.3, - 0.3, - 0.3, - 0.3, - 0.3, - 0.2, -
0.2, - 0.2, - 0.2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,  0.2,  0.3,  0.3,  0.4,  0.4,  0.4,  0.4,
0.4,  0.4,  0.5,  0.5,  0.5,  0.6,  0.6,  0.6,  0.7,  0.7,  0.8,  0.8,  0.8,  0.8,
0.8,  0.9,  0.9,  0.9,  0.9,  0.9,  0.9,  0.9, 1, 1, 1, 1, 1,  1.1,  1.2,  1.2,  1.3,
1.3,  1.3,  1.4,  1.4,  1.5,  1.5,  1.5,  1.5,  1.6,  1.9,  1.9,  1.9,  1.9,  1.9,
2, 2, 2, 2, 2,  2.2,  2.2,  2.3,  2.3,  2.3,  2.4,  2.7,  2.7,  2.7,  2.8,  2.9, 3, 3, 3
,  3.4,  3.8,  3.9, 4, 4,  4.2,  4.2,  4.6, 5,  5.1,  5.1,  5.2,  5.6, 7, 8, 9.
<br>
Teraz wykres słupkowy ujawnia więcej informacji.
<center>[[14.eps(wykres)]]</center>
Widać, na przykład, że więcej było spadków niż wzrostów, ale kilka spółek miały większe wzrosty niż jakikolwiek zanotowany spadek.
Zbudujemy teraz szereg rozdzielczy. Wybieramy w tym celu punkty podziału na klasy: -8, - 7, ... 9, 10. Używając polecenia Maple (z pakietu <math>\texttt stats</math>):
<math>\texttt{> transform[tallyinto]([x], [seq(-8 +i..-7 + i, i = 1..17)]);}</math>
gdzie x oznacza ciąg naszych danych, otrzymujemy klasy wraz z ich licznościami:
<center><math>\aligned
Weight(-7 .. -6, 5),\\
Weight(-6 .. -5, 4),\\
Weight(-5 .. -4, 10),\\
Weight(-4 .. -3, 15),\\
Weight(-3 .. -2, 18),\\
Weight(-2 .. -1, 33),\\
Weight(-1 .. 0, 41),\\
Weight(0 .. 1, 72),\\
Weight(1 .. 2, 23),\\
Weight(2 .. 3, 16),\\
Weight(3 .. 4, 6),\\
Weight(4 .. 5, 5),\\
Weight(5 .. 6, 5),\\
Weight(6 .. 7, 0),\\
7 .. 8,\\
8 .. 9,\\
9 .. 10.
\endaligned
</math></center>
Liczności ostatnich trzech klas były równe 1 i dlatego Maple ich nie wyświetlił.
{{uwaga|||
Maple stosuje klasy lewostronnie domknięte.
}}
Możemy teraz narysować histogram wykazujący liczności klas:
<center>[[15.eps(histogram1)]]</center>
Wiele programów statystycznych rysuje histogram na podstawie danych surowych. Oto taki histogram - odpowiada on funkcji <math>hist</math> zdefiniowanej na wykładzie.
<center>[[16.eps(histogram2)]]</center>
==Zadania==
===Zadanie 1===
Proszę ustalić z jakiego programu komputerowego będziemy korzystać w trakcie tego kursu.
===Zadanie 2===
Zastanawiano się nad możliwością wykorzystania w naszym kursie programu <math>\texttt R</math>. Odwiedź następującą stronę:
<center>
[http://r-project.org. http://r-project.org.]
</center>
===Zadanie 3===
Używając wybranego programu komputerowego wykonaj wykresy statystyczne omówione na ćwiczeniach.
===Zadanie 4===
Tworząc szereg rozdzielczy z danych surowych dla cechy w skali porządkowej, można w naturalny sposób zdefiniować pewną cechę, która posiada skalę nominalną. Wyjaśnij szczegóły.

Aktualna wersja na dzień 17:41, 5 sie 2006