|
|
(Nie pokazano 1 pośredniej wersji utworzonej przez tego samego użytkownika) |
Linia 1: |
Linia 1: |
| ==Ćwiczenia==
| |
|
| |
|
| {{cwiczenie|1||Program MS Excel zawiera pewną liczbę funkcji i procedur statystycznych. Część z nich może być bardzo użyteczna.
| |
| }}
| |
|
| |
| Poniżej kopiujemy pewne fragmenty Pomocy programu Microsoft Excel.
| |
|
| |
| <math>\textsf{"W programie Microsoft Excel udostępniono szereg narzędzi do
| |
| analizy statystycznej danych – zebranych w dodatku Analysis ToolPak – z którego można korzystać na różnych etapach opracowywania złożonych analiz statystycznych lub technicznych. Zadaniem użytkownika jest dostarczenie danych oraz innych niezbędnych parametrów; poszczególne narzędzia korzystają ze statystycznych lub inżynierskich makr funkcji i przedstawiają rezultaty w tabeli wyników. Niektóre spośród narzędzi oprócz tabeli tworzą także wykresy. (...). Aby zapoznać się z listą dostępnych narzędzi, kliknij polecenie Analiza danych w menu Narzędzia. Jeżeli polecenie Analiza danych nie jest dostępne w menu Narzędzia, musisz zainstalować dodatek Analysis ToolPak. (...). W programie Excel dostępnych jest wiele innych funkcji statystycznych, finansowych i inżynierskich. Niektóre funkcje statystyczne są wbudowane, a inne stają się dostępne po zainstalowaniu pakietu Analysis ToolPak. Warto przejrzeć listę dostępnych funkcji statystycznych."}</math>
| |
|
| |
| W Dodatku Analiza danych dostępne są następujące procedury:
| |
|
| |
| <math>\quote
| |
| Analiza wariancji (anova)
| |
|
| |
| Korelacja, narzędzie analizy
| |
|
| |
| Kowariancja, narzędzie analizy
| |
|
| |
| Statystyka opisowa, narzędzie analizy
| |
|
| |
| Wygładzanie wykładnicze, narzędzie analizy
| |
|
| |
| Analiza Fouriera, narzędzie analizy
| |
|
| |
| Test F: z dwiema próbkami, narzędzie analizy
| |
|
| |
| Histogram, narzędzie analizy
| |
|
| |
| Średnia ruchoma, narzędzie analizy
| |
|
| |
| Wykonywanie analizy testu t
| |
|
| |
| Narzędzie do analizy generowania liczb losowych
| |
|
| |
| Ranga i percentyl, narzędzie analizy
| |
|
| |
| Regresja, narzędzie analizy
| |
|
| |
| Próbkowanie, narzędzie analizy
| |
|
| |
| Test z: z dwiema próbkami, narzędzie analizy.
| |
| \endquote
| |
| </math>
| |
|
| |
| Funkcjami statystycznymi są:
| |
|
| |
| <math>\quote
| |
| ILE.LICZB
| |
|
| |
| ILE.NIEPUSTYCH
| |
|
| |
| KOWARIANCJA
| |
|
| |
| KURTOZA
| |
|
| |
| KWARTYL
| |
|
| |
| MAX
| |
|
| |
| MAX.A
| |
|
| |
| MAX.K
| |
|
| |
| MEDIANA
| |
|
| |
| MIN
| |
|
| |
| MIN.A
| |
|
| |
| MIN.K
| |
|
| |
| NACHYLENIE
| |
|
| |
| NORMALIZUJ
| |
|
| |
| ODCH.KWADRATOWE
| |
|
| |
| ODCH.STANDARD.POPUL
| |
|
| |
| ODCH.STANDARD.POPUL.A
| |
|
| |
| ODCH.STANDARDOWE
| |
|
| |
| ODCH.STANDARDOWE.A
| |
|
| |
| ODCH.ŚREDNIE
| |
|
| |
| ODCIĘTA
| |
|
| |
| PEARSON
| |
|
| |
| PERCENTYL
| |
|
| |
| PERMUTACJE
| |
|
| |
| POZYCJA
| |
|
| |
| PRAWDPD
| |
|
| |
| PROCENT.POZYCJA
| |
|
| |
| PRÓG.ROZKŁAD.DWUM
| |
|
| |
| R.KWADRAT
| |
|
| |
| REGBŁSTD
| |
|
| |
| REGEXPP
| |
|
| |
| REGEXPW
| |
|
| |
| REGLINP
| |
|
| |
| REGLINW
| |
|
| |
| REGLINX
| |
|
| |
| ROZKŁAD.BETA
| |
|
| |
| ROZKŁAD.BETA.ODW
| |
|
| |
| ROZKŁAD.CHI
| |
|
| |
| ROZKŁAD.CHI.ODW
| |
|
| |
| ROZKŁAD.DWUM
| |
|
| |
| ROZKŁAD.DWUM.PRZEC
| |
|
| |
| ROZKŁAD.EXP
| |
|
| |
| ROZKŁAD.F
| |
|
| |
| ROZKŁAD.F.ODW
| |
|
| |
| ROZKŁAD.FISHER
| |
|
| |
| ROZKŁAD.FISHER.ODW
| |
|
| |
| ROZKŁAD.GAMMA
| |
|
| |
| ROZKŁAD.GAMMA.ODW
| |
|
| |
| ROZKŁAD.HIPERGEOM
| |
|
| |
| ROZKŁAD.LIN.GAMMA
| |
|
| |
| ROZKŁAD.LOG
| |
|
| |
| ROZKŁAD.LOG.ODW
| |
|
| |
| ROZKŁAD.NORMALNY
| |
|
| |
| ROZKŁAD.NORMALNY.ODW
| |
|
| |
| ROZKŁAD.NORMALNY.S
| |
|
| |
| ROZKŁAD.NORMALNY.S.ODW
| |
|
| |
| ROZKŁAD.POISSON
| |
|
| |
| ROZKŁAD.T
| |
|
| |
| ROZKŁAD.T.ODW
| |
|
| |
| ROZKŁAD.WEIBULL
| |
|
| |
| SKOŚNOŚĆ
| |
|
| |
| ŚREDNIA
| |
|
| |
| ŚREDNIA.A
| |
|
| |
| ŚREDNIA.GEOMETRYCZNA
| |
|
| |
| ŚREDNIA.HARMONICZNA
| |
|
| |
| ŚREDNIA.WEWN
| |
|
| |
| TEST.CHI
| |
|
| |
| TEST.F
| |
|
| |
| TEST.T
| |
|
| |
| TEST.Z
| |
|
| |
| UFNOŚĆ
| |
|
| |
| WARIANCJA
| |
|
| |
| WARIANCJA.A
| |
|
| |
| WARIANCJA.POPUL
| |
|
| |
| WARIANCJA.POPUL.A
| |
|
| |
| WSP.KORELACJI
| |
|
| |
| WYST.NAJCZĘŚCIEJ
| |
| \endquote
| |
| </math>
| |
|
| |
| {{cwiczenie|2||
| |
| Program Maple zawiera pakiety procedur statystycznych. Oto pełna lista procedur pakietu <math>\texttt Statistics</math>, który w wersji Maple 10 zastępuje starszy pakiet <math>\texttt stats</math> (oczywiście, można w tej wersji korzystać także z pakietu <math>\texttt stats</math>).
| |
|
| |
|
| |
| <math>\quote
| |
| AbsoluteDeviation, AreaChart, BarChart, Bootstrap, BoxPlot, BubblePlot, CDF, CGF, CentralMoment, CharacteristicFunction, ChiSquareGoodnessOfFitTest, ChiSquareIndependenceTest, ChiSquareSuitableModelTest, ColumnGraph, Correlation, CorrelationMatrix, Count, CountMissing, Covariance, CovarianceMatrix, Cumulant, CumulantGeneratingFunction, CumulativeDistributionFunction, CumulativeProduct, CumulativeSum, CumulativeSumChart, DataSummary, Decile, DensityPlot, Discretize, Distribution, ErrorPlot, EvaluateToFloat, ExpectedValue, ExponentialFit, ExponentialSmoothing, FailureRate, FisherInformation, Fit, FivePointSummary, FrequencyPlot, FrequencyTable, GeometricMean, HarmonicMean, HazardRate, Histogram, Information, InteractiveDataAnalysis, InterquartileRange, InverseSurvivalFunction, Join, KernelDensity, KernelDensityPlot, KernelDensitySample, Kurtosis, Likelihood, LikelihoodRatioStatistic, LineChart, LinearFilter, LinearFit, LogLikelihood, LogarithmicFit, MGF, MLE, MakeProcedure, MaximumLikelihoodEstimate, Mean, MeanDeviation, Median, MedianDeviation, MillsRatio, Mode, Moment, MomentGeneratingFunction, MovingAverage, MovingMedian, MovingStatistic, NonlinearFit, NormalPlot, OneSampleChiSquareTest, OneSampleTTest, OneSampleZTest, OneWayANOVA, OrderByRank, OrderStatistic, PDF, Percentile, PieChart, PointPlot, PolynomialFit, PowerFit, Probability, ProbabilityDensityFunction, ProbabilityFunction, ProbabilityPlot, ProfileLikelihood, ProfileLogLikelihood, QuadraticMean, Quantile, QuantilePlot, Quartile, RandomVariable, Range, Rank, Remove, RemoveInRange, RemoveNonNumeric, Sample, ScatterPlot, Score, Select, SelectInRange, SelectNonNumeric, ShapiroWilkWTest, Shuffle, Skewness, Sort, StandardDeviation, StandardError, StandardizedMoment, Support, SurfacePlot, SurvivalFunction, Tally, TallyInto, Trim, TrimmedMean, TwoSampleFTest, TwoSamplePairedTTest, TwoSampleTTest, TwoSampleZTest, Variance, Variation, WeightedMovingAverage, Winsorize, WinsorizedMean.
| |
| \endquote</math>
| |
| }}
| |
|
| |
|
| |
| {{cwiczenie|3||
| |
| Dane o skali nominalnej można prezentować graficznie. Często używanym sposobem jest tak zwany wykres kołowy (ciasteczko).
| |
| }}
| |
| Dla następujących danych (patrz przykład [[RPS/Wykład 1: Wstęp#Przykład 1.1|1.1]] z wykładu):
| |
|
| |
|
| |
| <center><math>5,2,5,4,5,4,4,3,5,5,4,5,</math></center>
| |
|
| |
|
| |
| wykres kołowy wygląda tak:
| |
|
| |
| <center>[[11.eps(kółko1)]]</center>
| |
|
| |
| lub tak:
| |
|
| |
| <center>[[12.eps(kółko2)]]</center>
| |
|
| |
| {{cwiczenie|4||
| |
| W dniu 23 czerwca 2006, podczas sesji GPW w Warszawie zanotowano następujące zmiany cen akcji (w procentach):<br>
| |
| - 4.6, - 4.5, - 4.6, 0, - 0.2, - 2.4, - 1.6, - 1.5, - 5.1, - 2.3, - 0.7, - 0.6, -
| |
| 2.1, - 0.7, - 1.2, -5, 0.6, -3, -4, 0, 0.5, 2.3, - 1.5, - 4.7, - 1.1, 1.5, -
| |
| 2.2, 0, 1.4, 0.3, 2.3, - 6.1, - 5.6, 2.7, 3.4, -2, - 0.3, 4.2, - 6.1, 0.9, -
| |
| 2.3, 5.1, - 0.2, 0.6, -4, -2, 0.9, - 0.7, - 2.4, 2, - 2.9, 5.6, 0, - 0.9, 0, 0, 0
| |
| , - 2.2, - 0.8, - 1.1, - 2.2, 0, 0.9, 0.2, 1.3, 2.7, - 0.6, - 2.7, - 1.5, - 3.6
| |
| , 0, - 0.6, - 2.6, 0, - 4.3, 0, -4, 2.9, - 1.9, - 0.5, 0, 2.8, - 2.3, - 0.3, - 1.4,
| |
| 1.9, 0, - 4.3, 0.4, 0, - 1.9, 2.2, 1.2, - 0.9, - 1.6, 0.8, 0, 0, - 1.3, 0.8, 0,
| |
| - 3.9, -6, - 3.2, - 6.1, - 0.8, 0, 0, - 0.7, - 3.3, - 0.4, 0, - 0.5, 1.9, - 0.6, 2,
| |
| 0.8, - 4.7, - 0.2, 1.3, 2.3, - 3.8, - 0.3, 0, 0, 1, 1.5, 1.6, 0.5, - 3.3, -
| |
| 0.7, 0, - 4.9, 0.5, 0, 3.9, - 3.8, - 1.3, 0, - 2.5, - 3.2, 0, - 1.1, - 1.4, - 1.5
| |
| , - 2.4, - 4.6, 1.9, - 2.4, - 3.6, 1, - 0.9, 0, - 1.9, -1, - 1.7, - 0.2, - 3.4, -
| |
| 0.6, - 0.7, 1.4, 1.2, 0, 5.2, 0.9, 0.8, - 0.6, 1.9, 1.5, 5.1, 1.9, 4.2,
| |
| 0.9, 1.3, 0.9, - 2.3, 1.5, - 0.5, 2.2, 0, 1.1, - 1.7, - 1.1, 0, - 0.3, - 1.2,
| |
| - 0.7, -1, 3.8, - 1.2, - 1.5, 2.4, 0, 0, -1, 0, - 1.2, 0.7, 0, 0.4, 0.4, - 0.3, -
| |
| 1.4, 0.4, 0.4, - 6.4, - 6.3, 2, 0.8, 0.6, - 0.5, - 1.4, 0, - 0.9, - 3.3, - 1.4
| |
| , - 1.1, - 3.8, -1, - 1.6, 2.7, -3, 4.6, 0.9, 0, 0.3, - 1.3, - 5.8, - 0.6, 0.4,
| |
| 0.7, 0, 3, 2, 0, 0, 4, -1, 9, -1, 4, 1, 3, 1, 7, -1, 8, -2, 0, 1, 3, 0, 0, 5, 0, 2.
| |
| }}
| |
| Interpretacja graficzna danych surowych w postaci wykresu słupkowego wygląda następująco:
| |
|
| |
| <center>[[13.eps(wykres1)]]</center>
| |
|
| |
| Wydaje się, że nie jest ona zbyt pomocna, więc spróbujemy inaczej spojrzeć na te dane. Najpierw je posortujemy:<br>
| |
| - 6.4, - 6.3, - 6.1, - 6.1, - 6.1, -6, - 5.8, - 5.6, - 5.1, -5, - 4.9, - 4.7, -
| |
| 4.7, - 4.6, - 4.6, - 4.6, - 4.5, - 4.3, - 4.3, -4, -4, -4, - 3.9, - 3.8, - 3.8, -
| |
| 3.8, - 3.6, - 3.6, - 3.4, - 3.3, - 3.3, - 3.3, - 3.2, - 3.2, -3, -3, - 2.9, - 2.7
| |
| , - 2.6, - 2.5, - 2.4, - 2.4, - 2.4, - 2.4, - 2.3, - 2.3, - 2.3, - 2.3, - 2.2, -
| |
| 2.2, - 2.2, - 2.1, -2, -2, -2, - 1.9, - 1.9, - 1.9, - 1.7, - 1.7, - 1.6, - 1.6, -
| |
| 1.6, - 1.5, - 1.5, - 1.5, - 1.5, - 1.5, - 1.4, - 1.4, - 1.4, - 1.4, - 1.4, - 1.3
| |
| , - 1.3, - 1.3, - 1.2, - 1.2, - 1.2, - 1.2, - 1.1, - 1.1, - 1.1, - 1.1, - 1.1, -1,
| |
| -1, -1, -1, -1, -1, -1, - 0.9, - 0.9, - 0.9, - 0.9, - 0.8, - 0.8, - 0.7, - 0.7, -
| |
| 0.7, - 0.7, - 0.7, - 0.7, - 0.7, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6, - 0.6
| |
| , - 0.5, - 0.5, - 0.5, - 0.5, - 0.4, - 0.3, - 0.3, - 0.3, - 0.3, - 0.3, - 0.2, -
| |
| 0.2, - 0.2, - 0.2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
| |
| , 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.2, 0.3, 0.3, 0.4, 0.4, 0.4, 0.4,
| |
| 0.4, 0.4, 0.5, 0.5, 0.5, 0.6, 0.6, 0.6, 0.7, 0.7, 0.8, 0.8, 0.8, 0.8,
| |
| 0.8, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 1, 1, 1, 1, 1, 1.1, 1.2, 1.2, 1.3,
| |
| 1.3, 1.3, 1.4, 1.4, 1.5, 1.5, 1.5, 1.5, 1.6, 1.9, 1.9, 1.9, 1.9, 1.9,
| |
| 2, 2, 2, 2, 2, 2.2, 2.2, 2.3, 2.3, 2.3, 2.4, 2.7, 2.7, 2.7, 2.8, 2.9, 3, 3, 3
| |
| , 3.4, 3.8, 3.9, 4, 4, 4.2, 4.2, 4.6, 5, 5.1, 5.1, 5.2, 5.6, 7, 8, 9.
| |
| <br>
| |
| Teraz wykres słupkowy ujawnia więcej informacji.
| |
|
| |
| <center>[[14.eps(wykres)]]</center>
| |
|
| |
| Widać, na przykład, że więcej było spadków niż wzrostów, ale kilka spółek miały większe wzrosty niż jakikolwiek zanotowany spadek.
| |
|
| |
| Zbudujemy teraz szereg rozdzielczy. Wybieramy w tym celu punkty podziału na klasy: -8, - 7, ... 9, 10. Używając polecenia Maple (z pakietu <math>\texttt stats</math>):
| |
|
| |
| <math>\texttt{> transform[tallyinto]([x], [seq(-8 +i..-7 + i, i = 1..17)]);}</math>
| |
|
| |
| gdzie x oznacza ciąg naszych danych, otrzymujemy klasy wraz z ich licznościami:
| |
|
| |
|
| |
| <center><math>\aligned
| |
| Weight(-7 .. -6, 5),\\
| |
| Weight(-6 .. -5, 4),\\
| |
| Weight(-5 .. -4, 10),\\
| |
| Weight(-4 .. -3, 15),\\
| |
| Weight(-3 .. -2, 18),\\
| |
| Weight(-2 .. -1, 33),\\
| |
| Weight(-1 .. 0, 41),\\
| |
| Weight(0 .. 1, 72),\\
| |
| Weight(1 .. 2, 23),\\
| |
| Weight(2 .. 3, 16),\\
| |
| Weight(3 .. 4, 6),\\
| |
| Weight(4 .. 5, 5),\\
| |
| Weight(5 .. 6, 5),\\
| |
| Weight(6 .. 7, 0),\\
| |
| 7 .. 8,\\
| |
| 8 .. 9,\\
| |
| 9 .. 10.
| |
| \endaligned
| |
| </math></center>
| |
|
| |
| Liczności ostatnich trzech klas były równe 1 i dlatego Maple ich nie wyświetlił.
| |
|
| |
| {{uwaga|||
| |
| Maple stosuje klasy lewostronnie domknięte.
| |
| }}
| |
| Możemy teraz narysować histogram wykazujący liczności klas:
| |
|
| |
| <center>[[15.eps(histogram1)]]</center>
| |
|
| |
| Wiele programów statystycznych rysuje histogram na podstawie danych surowych. Oto taki histogram - odpowiada on funkcji <math>hist</math> zdefiniowanej na wykładzie.
| |
|
| |
| <center>[[16.eps(histogram2)]]</center>
| |
|
| |
| ==Zadania==
| |
|
| |
| ===Zadanie 1===
| |
| Proszę ustalić z jakiego programu komputerowego będziemy korzystać w trakcie tego kursu.
| |
|
| |
| ===Zadanie 2===
| |
| Zastanawiano się nad możliwością wykorzystania w naszym kursie programu <math>\texttt R</math>. Odwiedź następującą stronę:
| |
|
| |
|
| |
| <center>
| |
| [http://r-project.org. http://r-project.org.]
| |
| </center>
| |
|
| |
| ===Zadanie 3===
| |
| Używając wybranego programu komputerowego wykonaj wykresy statystyczne omówione na ćwiczeniach.
| |
|
| |
| ===Zadanie 4===
| |
| Tworząc szereg rozdzielczy z danych surowych dla cechy w skali porządkowej, można w naturalny sposób zdefiniować pewną cechę, która posiada skalę nominalną. Wyjaśnij szczegóły.
| |