ED-4.2-m05-1.0-Slajd23

Z Studia Informatyczne
Wersja z dnia 07:27, 5 wrz 2006 autorstwa ALesniewska (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Przykład (3)

Przykład (3)


Przechodzimy do kroku drugiego znajdowania wszystkich zbiorów częstych. Zbiory częste odpowiadają w tym przypadku wszystkim sekwencjom częstym o długości 1. Pamiętamy, że w przeciwieństwie do algorytmu Apriori, w kroku znajdowania zbiorów częstych wsparcie danego zbioru X jest obliczane względem liczby sekwencji, a nie liczby transakcji (wyrazów sekwencji). Wsparciem zbioru X w bazie danych sekwencji Recepty jest iloraz liczby sekwencji zawierających wyrazy wspierające zbiór X (zbiór częsty) do całkowitej liczby sekwencji należących do bazy danych sekwencji Recepty. Rozpoczynamy od zbioru C1, czyli analizujemy wsparcie wszystkich elementów występujących w bazie danych. Zbiór elementów składa się z następujących elementów: {10},{20},{30},{40},{50},{60},{70} oraz {90}. Dla każdego zbioru jednoelementowego kandydującego obliczamy jego wsparcie. Okazuje się, że zbiorami częstymi 1-elementowymi są następujące zbiory: zbiór {30},{40},{70},{90}. Zwróćmy uwagę na wsparcie dla zbioru {30}. Wsparcie to wynosi 0.8 i jest to liczba pacjentów, którym zapisano lek 30 na jednej z wielu recept, które otrzymał on od lekarza do całkowitej liczby pacjentów. Następnie w oparciu o zbiory częste jednoelementowe są generowane zbiory kandydujące 2-elementowe. Takimi zbiorami są zbiory {30,40},{30,70},{30,90},{40,70},{40,90} oraz {70,90}. Obliczamy wsparcie zbiorów kandydujących 2-elementowych i okazuje się, że tylko jeden zbiór kandydujący {40,70} spełnia próg minimalnego wsparcia. To kończy krok znajdowania wszystkich zbiorów częstych. Znalezione w tym kroku zbiory częste są odwzorowywane w zbiór liczb naturalnych lub całkowitych przedstawionych w powyższej tabeli nazwanej kolumną Odwzorowania. Transformacja ta ma na celu poprawę efektywności algorytmu poprzez skrócenie czasu wykonywania operacji porównywania zbiorów.


<< Poprzedni slajd | Spis treści | Następny slajd >>