Rachunek prawdopodobieństwa i statystyka/Ćwiczenia 1: Wstęp
Ćwiczenia
Ćwiczenie 1
Program MS Excel zawiera pewną liczbę funkcji i procedur statystycznych. Część z nich może być bardzo użyteczna.
Poniżej kopiujemy pewne fragmenty Pomocy programu Microsoft Excel.
Parser nie mógł rozpoznać (błąd składni): {\displaystyle \textsf{"W programie Microsoft Excel udostępniono szereg narzędzi do analizy statystycznej danych – zebranych w dodatku Analysis ToolPak – z którego można korzystać na różnych etapach opracowywania złożonych analiz statystycznych lub technicznych. Zadaniem użytkownika jest dostarczenie danych oraz innych niezbędnych parametrów; poszczególne narzędzia korzystają ze statystycznych lub inżynierskich makr funkcji i przedstawiają rezultaty w tabeli wyników. Niektóre spośród narzędzi oprócz tabeli tworzą także wykresy. (...). Aby zapoznać się z listą dostępnych narzędzi, kliknij polecenie Analiza danych w menu Narzędzia. Jeżeli polecenie Analiza danych nie jest dostępne w menu Narzędzia, musisz zainstalować dodatek Analysis ToolPak. (...). W programie Excel dostępnych jest wiele innych funkcji statystycznych, finansowych i inżynierskich. Niektóre funkcje statystyczne są wbudowane, a inne stają się dostępne po zainstalowaniu pakietu Analysis ToolPak. Warto przejrzeć listę dostępnych funkcji statystycznych."}}
W Dodatku Analiza danych dostępne są następujące procedury:
Parser nie mógł rozpoznać (nieznana funkcja „\quote”): {\displaystyle \quote Analiza wariancji (anova) Korelacja, narzędzie analizy Kowariancja, narzędzie analizy Statystyka opisowa, narzędzie analizy Wygładzanie wykładnicze, narzędzie analizy Analiza Fouriera, narzędzie analizy Test F: z dwiema próbkami, narzędzie analizy Histogram, narzędzie analizy Średnia ruchoma, narzędzie analizy Wykonywanie analizy testu t Narzędzie do analizy generowania liczb losowych Ranga i percentyl, narzędzie analizy Regresja, narzędzie analizy Próbkowanie, narzędzie analizy Test z: z dwiema próbkami, narzędzie analizy. \endquote }
Funkcjami statystycznymi są:
Parser nie mógł rozpoznać (nieznana funkcja „\quote”): {\displaystyle \quote ILE.LICZB ILE.NIEPUSTYCH KOWARIANCJA KURTOZA KWARTYL MAX MAX.A MAX.K MEDIANA MIN MIN.A MIN.K NACHYLENIE NORMALIZUJ ODCH.KWADRATOWE ODCH.STANDARD.POPUL ODCH.STANDARD.POPUL.A ODCH.STANDARDOWE ODCH.STANDARDOWE.A ODCH.ŚREDNIE ODCIĘTA PEARSON PERCENTYL PERMUTACJE POZYCJA PRAWDPD PROCENT.POZYCJA PRÓG.ROZKŁAD.DWUM R.KWADRAT REGBŁSTD REGEXPP REGEXPW REGLINP REGLINW REGLINX ROZKŁAD.BETA ROZKŁAD.BETA.ODW ROZKŁAD.CHI ROZKŁAD.CHI.ODW ROZKŁAD.DWUM ROZKŁAD.DWUM.PRZEC ROZKŁAD.EXP ROZKŁAD.F ROZKŁAD.F.ODW ROZKŁAD.FISHER ROZKŁAD.FISHER.ODW ROZKŁAD.GAMMA ROZKŁAD.GAMMA.ODW ROZKŁAD.HIPERGEOM ROZKŁAD.LIN.GAMMA ROZKŁAD.LOG ROZKŁAD.LOG.ODW ROZKŁAD.NORMALNY ROZKŁAD.NORMALNY.ODW ROZKŁAD.NORMALNY.S ROZKŁAD.NORMALNY.S.ODW ROZKŁAD.POISSON ROZKŁAD.T ROZKŁAD.T.ODW ROZKŁAD.WEIBULL SKOŚNOŚĆ ŚREDNIA ŚREDNIA.A ŚREDNIA.GEOMETRYCZNA ŚREDNIA.HARMONICZNA ŚREDNIA.WEWN TEST.CHI TEST.F TEST.T TEST.Z UFNOŚĆ WARIANCJA WARIANCJA.A WARIANCJA.POPUL WARIANCJA.POPUL.A WSP.KORELACJI WYST.NAJCZĘŚCIEJ \endquote }
Ćwiczenie 2
Program Maple zawiera pakiety procedur statystycznych. Oto pełna lista procedur pakietu , który w wersji Maple 10 zastępuje starszy pakiet (oczywiście, można w tej wersji korzystać także z pakietu ).
Parser nie mógł rozpoznać (nieznana funkcja „\quote”): {\displaystyle \quote AbsoluteDeviation, AreaChart, BarChart, Bootstrap, BoxPlot, BubblePlot, CDF, CGF, CentralMoment, CharacteristicFunction, ChiSquareGoodnessOfFitTest, ChiSquareIndependenceTest, ChiSquareSuitableModelTest, ColumnGraph, Correlation, CorrelationMatrix, Count, CountMissing, Covariance, CovarianceMatrix, Cumulant, CumulantGeneratingFunction, CumulativeDistributionFunction, CumulativeProduct, CumulativeSum, CumulativeSumChart, DataSummary, Decile, DensityPlot, Discretize, Distribution, ErrorPlot, EvaluateToFloat, ExpectedValue, ExponentialFit, ExponentialSmoothing, FailureRate, FisherInformation, Fit, FivePointSummary, FrequencyPlot, FrequencyTable, GeometricMean, HarmonicMean, HazardRate, Histogram, Information, InteractiveDataAnalysis, InterquartileRange, InverseSurvivalFunction, Join, KernelDensity, KernelDensityPlot, KernelDensitySample, Kurtosis, Likelihood, LikelihoodRatioStatistic, LineChart, LinearFilter, LinearFit, LogLikelihood, LogarithmicFit, MGF, MLE, MakeProcedure, MaximumLikelihoodEstimate, Mean, MeanDeviation, Median, MedianDeviation, MillsRatio, Mode, Moment, MomentGeneratingFunction, MovingAverage, MovingMedian, MovingStatistic, NonlinearFit, NormalPlot, OneSampleChiSquareTest, OneSampleTTest, OneSampleZTest, OneWayANOVA, OrderByRank, OrderStatistic, PDF, Percentile, PieChart, PointPlot, PolynomialFit, PowerFit, Probability, ProbabilityDensityFunction, ProbabilityFunction, ProbabilityPlot, ProfileLikelihood, ProfileLogLikelihood, QuadraticMean, Quantile, QuantilePlot, Quartile, RandomVariable, Range, Rank, Remove, RemoveInRange, RemoveNonNumeric, Sample, ScatterPlot, Score, Select, SelectInRange, SelectNonNumeric, ShapiroWilkWTest, Shuffle, Skewness, Sort, StandardDeviation, StandardError, StandardizedMoment, Support, SurfacePlot, SurvivalFunction, Tally, TallyInto, Trim, TrimmedMean, TwoSampleFTest, TwoSamplePairedTTest, TwoSampleTTest, TwoSampleZTest, Variance, Variation, WeightedMovingAverage, Winsorize, WinsorizedMean. \endquote}
Ćwiczenie 3
Dane o skali nominalnej można prezentować graficznie. Często używanym sposobem jest tak zwany wykres kołowy (ciasteczko).
Dla następujących danych (patrz przykład 1.1 z wykładu):
wykres kołowy wygląda tak:
lub tak:
Ćwiczenie 4
W dniu 23 czerwca 2006, podczas sesji GPW w Warszawie zanotowano następujące zmiany cen akcji (w procentach):
- 4.6, - 4.5, - 4.6, 0, - 0.2, - 2.4, - 1.6, - 1.5, - 5.1, - 2.3, - 0.7, - 0.6, -
2.1, - 0.7, - 1.2, -5, 0.6, -3, -4, 0, 0.5, 2.3, - 1.5, - 4.7, - 1.1, 1.5, -
2.2, 0, 1.4, 0.3, 2.3, - 6.1, - 5.6, 2.7, 3.4, -2, - 0.3, 4.2, - 6.1, 0.9, -
2.3, 5.1, - 0.2, 0.6, -4, -2, 0.9, - 0.7, - 2.4, 2, - 2.9, 5.6, 0, - 0.9, 0, 0, 0
, - 2.2, - 0.8, - 1.1, - 2.2, 0, 0.9, 0.2, 1.3, 2.7, - 0.6, - 2.7, - 1.5, - 3.6
, 0, - 0.6, - 2.6, 0, - 4.3, 0, -4, 2.9, - 1.9, - 0.5, 0, 2.8, - 2.3, - 0.3, - 1.4,
1.9, 0, - 4.3, 0.4, 0, - 1.9, 2.2, 1.2, - 0.9, - 1.6, 0.8, 0, 0, - 1.3, 0.8, 0,
- 3.9, -6, - 3.2, - 6.1, - 0.8, 0, 0, - 0.7, - 3.3, - 0.4, 0, - 0.5, 1.9, - 0.6, 2,
0.8, - 4.7, - 0.2, 1.3, 2.3, - 3.8, - 0.3, 0, 0, 1, 1.5, 1.6, 0.5, - 3.3, -
0.7, 0, - 4.9, 0.5, 0, 3.9, - 3.8, - 1.3, 0, - 2.5, - 3.2, 0, - 1.1, - 1.4, - 1.5
, - 2.4, - 4.6, 1.9, - 2.4, - 3.6, 1, - 0.9, 0, - 1.9, -1, - 1.7, - 0.2, - 3.4, -
0.6, - 0.7, 1.4, 1.2, 0, 5.2, 0.9, 0.8, - 0.6, 1.9, 1.5, 5.1, 1.9, 4.2,
0.9, 1.3, 0.9, - 2.3, 1.5, - 0.5, 2.2, 0, 1.1, - 1.7, - 1.1, 0, - 0.3, - 1.2,
- 0.7, -1, 3.8, - 1.2, - 1.5, 2.4, 0, 0, -1, 0, - 1.2, 0.7, 0, 0.4, 0.4, - 0.3, -
1.4, 0.4, 0.4, - 6.4, - 6.3, 2, 0.8, 0.6, - 0.5, - 1.4, 0, - 0.9, - 3.3, - 1.4
, - 1.1, - 3.8, -1, - 1.6, 2.7, -3, 4.6, 0.9, 0, 0.3, - 1.3, - 5.8, - 0.6, 0.4,
0.7, 0, 3, 2, 0, 0, 4, -1, 9, -1, 4, 1, 3, 1, 7, -1, 8, -2, 0, 1, 3, 0, 0, 5, 0, 2.
Interpretacja graficzna danych surowych w postaci wykresu słupkowego wygląda następująco:
Wydaje się, że nie jest ona zbyt pomocna, więc spróbujemy inaczej spojrzeć na te dane. Najpierw je posortujemy:
- 6.4, - 6.3, - 6.1, - 6.1, - 6.1, -6, - 5.8, - 5.6, - 5.1, -5, - 4.9, - 4.7, -
4.7, - 4.6, - 4.6, - 4.6, - 4.5, - 4.3, - 4.3, -4, -4, -4, - 3.9, - 3.8, - 3.8, -
3.8, - 3.6, - 3.6, - 3.4, - 3.3, - 3.3, - 3.3, - 3.2, - 3.2, -3, -3, - 2.9, - 2.7
, - 2.6, - 2.5, - 2.4, - 2.4, - 2.4, - 2.4, - 2.3, - 2.3, - 2.3, - 2.3, - 2.2, -
2.2, - 2.2, - 2.1, -2, -2, -2, - 1.9, - 1.9, - 1.9, - 1.7, - 1.7, - 1.6, - 1.6, -
1.6, - 1.5, - 1.5, - 1.5, - 1.5, - 1.5, - 1.4, - 1.4, - 1.4, - 1.4, - 1.4, - 1.3
, - 1.3, - 1.3, - 1.2, - 1.2, - 1.2, - 1.2, - 1.1, - 1.1, - 1.1, - 1.1, - 1.1, -1,
-1, -1, -1, -1, -1, -1, - 0.9, - 0.9, - 0.9, - 0.9, - 0.8, - 0.8, - 0.7, - 0.7, -
0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6
, - 0.5, - 0.5, - 0.5, - 0.5, - 0.4, - 0.3, - 0.3, - 0.3, - 0.3, - 0.3, - 0.2, -
0.2, - 0.2, - 0.2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.3, 0.4, 0.4, 0.4, 0.4,
0.4, 0.4, 0.5, 0.5, 0.5, 0.6, 0.6, 0.6, 0.7, 0.7, 0.8, 0.8, 0.8, 0.8,
0.8, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 1, 1, 1, 1, 1, 1.1, 1.2, 1.2, 1.3,
1.3, 1.3, 1.4, 1.4, 1.5, 1.5, 1.5, 1.5, 1.6, 1.9, 1.9, 1.9, 1.9, 1.9,
2, 2, 2, 2, 2, 2.2, 2.2, 2.3, 2.3, 2.3, 2.4, 2.7, 2.7, 2.7, 2.8, 2.9, 3, 3, 3
, 3.4, 3.8, 3.9, 4, 4, 4.2, 4.2, 4.6, 5, 5.1, 5.1, 5.2, 5.6, 7, 8, 9.
Teraz wykres słupkowy ujawnia więcej informacji.
Widać, na przykład, że więcej było spadków niż wzrostów, ale kilka spółek miały większe wzrosty niż jakikolwiek zanotowany spadek.
Zbudujemy teraz szereg rozdzielczy. Wybieramy w tym celu punkty podziału na klasy: -8, - 7, ... 9, 10. Używając polecenia Maple (z pakietu ):
gdzie x oznacza ciąg naszych danych, otrzymujemy klasy wraz z ich licznościami:
Liczności ostatnich trzech klas były równe 1 i dlatego Maple ich nie wyświetlił.
Maple stosuje klasy lewostronnie domknięte.
Możemy teraz narysować histogram wykazujący liczności klas:
Wiele programów statystycznych rysuje histogram na podstawie danych surowych. Oto taki histogram - odpowiada on funkcji zdefiniowanej na wykładzie.
Zadania
Zadanie 1
Proszę ustalić z jakiego programu komputerowego będziemy korzystać w trakcie tego kursu.
Zadanie 2
Zastanawiano się nad możliwością wykorzystania w naszym kursie programu . Odwiedź następującą stronę:
Zadanie 3
Używając wybranego programu komputerowego wykonaj wykresy statystyczne omówione na ćwiczeniach.
Zadanie 4
Tworząc szereg rozdzielczy z danych surowych dla cechy w skali porządkowej, można w naturalny sposób zdefiniować pewną cechę, która posiada skalę nominalną. Wyjaśnij szczegóły.