ED-4.2-m05-1.0-Slajd26

Z Studia Informatyczne
Wersja z dnia 07:30, 5 wrz 2006 autorstwa ALesniewska (dyskusja | edycje) (Przykład (6))
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Przykład (6)

Przykład (6)


Przechodzimy następnie do generacji zbiorów sekwencji kandydujących o długości 3. Okazuje się, że zbiór sekwencji kandydujących o długości 3 jest zbiorem pustym, gdyż w oparciu o zbiór sekwencji LS2 czyli zbiór sekwencji częstych o długości 2 nie można wygenerować żadnych sekwencji kandydujących. Wyjaśnienie tego jest następujące - w pierwszym etapie funkcji Apriori_generate() czyli etapie połączenia ze zbioru LS2 generowany jest następujący zbiór sekwencji kandydujących o długości 3, mianowicie z sekwencji {1,2} otrzymujemy sekwencje {1,2,2},{1,2,3},{1,2,4} oraz {1,2,5}, następnie {1,3,2},{1,3,3},{1,3,4},{1,3,5}, następnie {1,4,2},{1,4,3},{1,4,4},{1,4,5}. Wreszcie z ostatniej sekwencji kandydującej otrzymujemy {1,5,2},{1,5,3},{1,5,4},{1,5,5}. Jednakże żadna z wygenerowanych sekwencji o długości 3 nie wchodzi do zbioru sekwencji kandydujących o długości 3, gdyż każda z podanych wcześniej sekwencji kandydującej o długości 3 zawiera sekwencje o długości 2, która nie należy do zbioru sekwencji częstych o długości 2. W konsekwencji zbiór CS3 czyli zbiór o długości 3 jest zbiorem pustym, w konsekwencji zbiór sekwencji częstych LS3 również jest zbiorem pustym. Końcowym zbiorem wyniku sekwencjonowania jest zatem zbiór LS2.

W ten sposób otrzymujemy zbiór wzorców sekwencji:

(30), (40) wsparcie 0,4 (40%)

(30), (70) wsparcie 0,4 (40%)

(30), (90) wsparcie 0,4 (40%)

(30), (40 70) wsparcie 0,4 (40%)

Następnie możemy wykonać ostatni krok algorytmu, który jest krokiem opcjonalnym czyli krok maksymalizacji. W otrzymanym zbiorze częstych wzorców sekwencji znajdujemy te wzorce sekwencji, które są maksymalne. Łatwo zauważyć, że sekwencja {(30),(40)} oraz sekwencja {(30),(70)} nie są sekwencjami maksymalnymi gdyż zawierają się w sekwencji {(30)(40 70)}. Ostateczny zbiór maksymalnych wzorców sekwencji dla zadanego progu minsup=25% składa się z dwóch wzorców:

(30), (90) wsparcie 0,4 (40%)

(30), (40 70) wsparcie 0,4 (40%)


<< Poprzedni slajd | Spis treści | Następny slajd >>