Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 1: Wstęp: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Linia 44: Linia 44:
\endquote
\endquote
</math>
</math>
<center>Funkcje statystyczne w programie MS Excel:  
<center>
<flash>file=Rp-1-c1.swf|width=500|height=500</flash>
<table border="1">
<tr><td>Funkcje statystyczne w programie MS Excel: </td></tr>
<tr><td><flash>file=Rp-1-c1.swf|width=500|height=500</flash></tr></td>
</table>
</center>
</center>



Wersja z 16:21, 22 sie 2006

Ćwiczenia

Ćwiczenie 1.1

Program MS Excel zawiera pewną liczbę funkcji i procedur statystycznych. Część z nich może być bardzo użyteczna.

Poniżej kopiujemy pewne fragmenty Pomocy programu Microsoft Excel.

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \textsf{"W programie Microsoft Excel udostępniono szereg narzędzi do analizy statystycznej danych – zebranych w dodatku Analysis ToolPak – z którego można korzystać na różnych etapach opracowywania złożonych analiz statystycznych lub technicznych. Zadaniem użytkownika jest dostarczenie danych oraz innych niezbędnych parametrów; poszczególne narzędzia korzystają ze statystycznych lub inżynierskich makr funkcji i przedstawiają rezultaty w tabeli wyników. Niektóre spośród narzędzi oprócz tabeli tworzą także wykresy. (...). Aby zapoznać się z listą dostępnych narzędzi, kliknij polecenie Analiza danych w menu Narzędzia. Jeżeli polecenie Analiza danych nie jest dostępne w menu Narzędzia, musisz zainstalować dodatek Analysis ToolPak. (...). W programie Excel dostępnych jest wiele innych funkcji statystycznych, finansowych i inżynierskich. Niektóre funkcje statystyczne są wbudowane, a inne stają się dostępne po zainstalowaniu pakietu Analysis ToolPak. Warto przejrzeć listę dostępnych funkcji statystycznych."}}

W Dodatku Analiza danych dostępne są następujące procedury:

Parser nie mógł rozpoznać (nieznana funkcja „\quote”): {\displaystyle \quote Analiza wariancji (anova) Korelacja, narzędzie analizy Kowariancja, narzędzie analizy Statystyka opisowa, narzędzie analizy Wygładzanie wykładnicze, narzędzie analizy Analiza Fouriera, narzędzie analizy Test F: z dwiema próbkami, narzędzie analizy Histogram, narzędzie analizy Średnia ruchoma, narzędzie analizy Wykonywanie analizy testu t Narzędzie do analizy generowania liczb losowych Ranga i percentyl, narzędzie analizy Regresja, narzędzie analizy Próbkowanie, narzędzie analizy Test z: z dwiema próbkami, narzędzie analizy. \endquote }

Funkcje statystyczne w programie MS Excel:
<flash>file=Rp-1-c1.swf|width=500|height=500</flash>

Ćwiczenie 1.2

Program Maple zawiera pakiety procedur statystycznych. Oto pełna lista procedur pakietu Statistics, który w wersji Maple 10 zastępuje starszy pakiet stats (oczywiście, można w tej wersji korzystać także z pakietu stats).


Parser nie mógł rozpoznać (nieznana funkcja „\quote”): {\displaystyle \quote AbsoluteDeviation, AreaChart, BarChart, Bootstrap, BoxPlot, BubblePlot, CDF, CGF, CentralMoment, CharacteristicFunction, ChiSquareGoodnessOfFitTest, ChiSquareIndependenceTest, ChiSquareSuitableModelTest, ColumnGraph, Correlation, CorrelationMatrix, Count, CountMissing, Covariance, CovarianceMatrix, Cumulant, CumulantGeneratingFunction, CumulativeDistributionFunction, CumulativeProduct, CumulativeSum, CumulativeSumChart, DataSummary, Decile, DensityPlot, Discretize, Distribution, ErrorPlot, EvaluateToFloat, ExpectedValue, ExponentialFit, ExponentialSmoothing, FailureRate, FisherInformation, Fit, FivePointSummary, FrequencyPlot, FrequencyTable, GeometricMean, HarmonicMean, HazardRate, Histogram, Information, InteractiveDataAnalysis, InterquartileRange, InverseSurvivalFunction, Join, KernelDensity, KernelDensityPlot, KernelDensitySample, Kurtosis, Likelihood, LikelihoodRatioStatistic, LineChart, LinearFilter, LinearFit, LogLikelihood, LogarithmicFit, MGF, MLE, MakeProcedure, MaximumLikelihoodEstimate, Mean, MeanDeviation, Median, MedianDeviation, MillsRatio, Mode, Moment, MomentGeneratingFunction, MovingAverage, MovingMedian, MovingStatistic, NonlinearFit, NormalPlot, OneSampleChiSquareTest, OneSampleTTest, OneSampleZTest, OneWayANOVA, OrderByRank, OrderStatistic, PDF, Percentile, PieChart, PointPlot, PolynomialFit, PowerFit, Probability, ProbabilityDensityFunction, ProbabilityFunction, ProbabilityPlot, ProfileLikelihood, ProfileLogLikelihood, QuadraticMean, Quantile, QuantilePlot, Quartile, RandomVariable, Range, Rank, Remove, RemoveInRange, RemoveNonNumeric, Sample, ScatterPlot, Score, Select, SelectInRange, SelectNonNumeric, ShapiroWilkWTest, Shuffle, Skewness, Sort, StandardDeviation, StandardError, StandardizedMoment, Support, SurfacePlot, SurvivalFunction, Tally, TallyInto, Trim, TrimmedMean, TwoSampleFTest, TwoSamplePairedTTest, TwoSampleTTest, TwoSampleZTest, Variance, Variation, WeightedMovingAverage, Winsorize, WinsorizedMean. \endquote}


Ćwiczenie 1.3

Dane o skali nominalnej można prezentować graficznie. Często używanym sposobem jest tak zwany wykres kołowy (ciasteczko).

Dla następujących danych (patrz przykład 1.1 z wykładu):


5,2,5,4,5,4,4,3,5,5,4,5,


wykres kołowy wygląda tak:

11.eps(kółko1)

lub tak:

12.eps(kółko2)

Ćwiczenie 1.4

W dniu 23 czerwca 2006, podczas sesji GPW w Warszawie zanotowano następujące zmiany cen akcji (w procentach):
- 4.6, - 4.5, - 4.6, 0, - 0.2, - 2.4, - 1.6, - 1.5, - 5.1, - 2.3, - 0.7, - 0.6, - 2.1, - 0.7, - 1.2, -5, 0.6, -3, -4, 0, 0.5, 2.3, - 1.5, - 4.7, - 1.1, 1.5, - 2.2, 0, 1.4, 0.3, 2.3, - 6.1, - 5.6, 2.7, 3.4, -2, - 0.3, 4.2, - 6.1, 0.9, - 2.3, 5.1, - 0.2, 0.6, -4, -2, 0.9, - 0.7, - 2.4, 2, - 2.9, 5.6, 0, - 0.9, 0, 0, 0 , - 2.2, - 0.8, - 1.1, - 2.2, 0, 0.9, 0.2, 1.3, 2.7, - 0.6, - 2.7, - 1.5, - 3.6 , 0, - 0.6, - 2.6, 0, - 4.3, 0, -4, 2.9, - 1.9, - 0.5, 0, 2.8, - 2.3, - 0.3, - 1.4, 1.9, 0, - 4.3, 0.4, 0, - 1.9, 2.2, 1.2, - 0.9, - 1.6, 0.8, 0, 0, - 1.3, 0.8, 0, - 3.9, -6, - 3.2, - 6.1, - 0.8, 0, 0, - 0.7, - 3.3, - 0.4, 0, - 0.5, 1.9, - 0.6, 2, 0.8, - 4.7, - 0.2, 1.3, 2.3, - 3.8, - 0.3, 0, 0, 1, 1.5, 1.6, 0.5, - 3.3, - 0.7, 0, - 4.9, 0.5, 0, 3.9, - 3.8, - 1.3, 0, - 2.5, - 3.2, 0, - 1.1, - 1.4, - 1.5 , - 2.4, - 4.6, 1.9, - 2.4, - 3.6, 1, - 0.9, 0, - 1.9, -1, - 1.7, - 0.2, - 3.4, - 0.6, - 0.7, 1.4, 1.2, 0, 5.2, 0.9, 0.8, - 0.6, 1.9, 1.5, 5.1, 1.9, 4.2, 0.9, 1.3, 0.9, - 2.3, 1.5, - 0.5, 2.2, 0, 1.1, - 1.7, - 1.1, 0, - 0.3, - 1.2, - 0.7, -1, 3.8, - 1.2, - 1.5, 2.4, 0, 0, -1, 0, - 1.2, 0.7, 0, 0.4, 0.4, - 0.3, - 1.4, 0.4, 0.4, - 6.4, - 6.3, 2, 0.8, 0.6, - 0.5, - 1.4, 0, - 0.9, - 3.3, - 1.4 , - 1.1, - 3.8, -1, - 1.6, 2.7, -3, 4.6, 0.9, 0, 0.3, - 1.3, - 5.8, - 0.6, 0.4, 0.7, 0, 3, 2, 0, 0, 4, -1, 9, -1, 4, 1, 3, 1, 7, -1, 8, -2, 0, 1, 3, 0, 0, 5, 0, 2.

Interpretacja graficzna danych surowych w postaci wykresu słupkowego wygląda następująco:

13.eps(wykres1)

Wydaje się, że nie jest ona zbyt pomocna, więc spróbujemy inaczej spojrzeć na te dane. Najpierw je posortujemy:
- 6.4, - 6.3, - 6.1, - 6.1, - 6.1, -6, - 5.8, - 5.6, - 5.1, -5, - 4.9, - 4.7, - 4.7, - 4.6, - 4.6, - 4.6, - 4.5, - 4.3, - 4.3, -4, -4, -4, - 3.9, - 3.8, - 3.8, - 3.8, - 3.6, - 3.6, - 3.4, - 3.3, - 3.3, - 3.3, - 3.2, - 3.2, -3, -3, - 2.9, - 2.7 , - 2.6, - 2.5, - 2.4, - 2.4, - 2.4, - 2.4, - 2.3, - 2.3, - 2.3, - 2.3, - 2.2, - 2.2, - 2.2, - 2.1, -2, -2, -2, - 1.9, - 1.9, - 1.9, - 1.7, - 1.7, - 1.6, - 1.6, - 1.6, - 1.5, - 1.5, - 1.5, - 1.5, - 1.5, - 1.4, - 1.4, - 1.4, - 1.4, - 1.4, - 1.3 , - 1.3, - 1.3, - 1.2, - 1.2, - 1.2, - 1.2, - 1.1, - 1.1, - 1.1, - 1.1, - 1.1, -1, -1, -1, -1, -1, -1, -1, - 0.9, - 0.9, - 0.9, - 0.9, - 0.8, - 0.8, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6 , - 0.5, - 0.5, - 0.5, - 0.5, - 0.4, - 0.3, - 0.3, - 0.3, - 0.3, - 0.3, - 0.2, - 0.2, - 0.2, - 0.2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 , 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.3, 0.4, 0.4, 0.4, 0.4, 0.4, 0.4, 0.5, 0.5, 0.5, 0.6, 0.6, 0.6, 0.7, 0.7, 0.8, 0.8, 0.8, 0.8, 0.8, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 1, 1, 1, 1, 1, 1.1, 1.2, 1.2, 1.3, 1.3, 1.3, 1.4, 1.4, 1.5, 1.5, 1.5, 1.5, 1.6, 1.9, 1.9, 1.9, 1.9, 1.9, 2, 2, 2, 2, 2, 2.2, 2.2, 2.3, 2.3, 2.3, 2.4, 2.7, 2.7, 2.7, 2.8, 2.9, 3, 3, 3 , 3.4, 3.8, 3.9, 4, 4, 4.2, 4.2, 4.6, 5, 5.1, 5.1, 5.2, 5.6, 7, 8, 9.
Teraz wykres słupkowy ujawnia więcej informacji.

14.eps(wykres)

Widać, na przykład, że więcej było spadków niż wzrostów, ale kilka spółek miały większe wzrosty niż jakikolwiek zanotowany spadek.

Zbudujemy teraz szereg rozdzielczy. Wybieramy w tym celu punkty podziału na klasy: -8, - 7, ... 9, 10. Używając polecenia Maple (z pakietu stats):

>transform[tallyinto]([x],[seq(8+i..7+i,i=1..17)]);

gdzie x oznacza ciąg naszych danych, otrzymujemy klasy wraz z ich licznościami:


Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned Weight(-7 .. -6, 5),\\ Weight(-6 .. -5, 4),\\ Weight(-5 .. -4, 10),\\ Weight(-4 .. -3, 15),\\ Weight(-3 .. -2, 18),\\ Weight(-2 .. -1, 33),\\ Weight(-1 .. 0, 41),\\ Weight(0 .. 1, 72),\\ Weight(1 .. 2, 23),\\ Weight(2 .. 3, 16),\\ Weight(3 .. 4, 6),\\ Weight(4 .. 5, 5),\\ Weight(5 .. 6, 5),\\ Weight(6 .. 7, 0),\\ 7 .. 8,\\ 8 .. 9,\\ 9 .. 10. \endaligned }

Liczności ostatnich trzech klas były równe 1 i dlatego Maple ich nie wyświetlił.

Uwaga

Maple stosuje klasy lewostronnie domknięte.

Możemy teraz narysować histogram wykazujący liczności klas:

15.eps(histogram1)

Wiele programów statystycznych rysuje histogram na podstawie danych surowych. Oto taki histogram - odpowiada on funkcji hist zdefiniowanej na wykładzie.

16.eps(histogram2)

Zadania

Zadanie 1

Proszę ustalić z jakiego programu komputerowego będziemy korzystać w trakcie tego kursu.

Zadanie 2

Zastanawiano się nad możliwością wykorzystania w naszym kursie programu R. Odwiedź następującą stronę:


http://r-project.org.

Zadanie 3

Używając wybranego programu komputerowego wykonaj wykresy statystyczne omówione na ćwiczeniach.

Zadanie 4

Tworząc szereg rozdzielczy z danych surowych dla cechy w skali porządkowej, można w naturalny sposób zdefiniować pewną cechę, która posiada skalę nominalną. Wyjaśnij szczegóły.