ED-4.2-m05-1.0-Slajd26: Różnice pomiędzy wersjami
Nie podano opisu zmian |
|||
Linia 8: | Linia 8: | ||
W ten sposób otrzymujemy zbiór wzorców sekwencji: | W ten sposób otrzymujemy zbiór wzorców sekwencji: | ||
(30), (40)wsparcie 0,4 (40%) | (30), (40) wsparcie 0,4 (40%) | ||
(30), (70)wsparcie 0,4 (40%) | (30), (70) wsparcie 0,4 (40%) | ||
(30), (90)wsparcie 0,4 (40%) | (30), (90) wsparcie 0,4 (40%) | ||
(30), (40 70)wsparcie 0,4 (40%) | (30), (40 70) wsparcie 0,4 (40%) | ||
Następnie możemy wykonać ostatni krok algorytmu, który jest krokiem opcjonalnym czyli krok maksymalizacji. W otrzymanym zbiorze częstych wzorców sekwencji znajdujemy te wzorce sekwencji, które są maksymalne. Łatwo zauważyć, że sekwencja {(30),(40)} oraz sekwencja {(30),(70)} nie są sekwencjami maksymalnymi gdyż zawierają się w sekwencji {(30)(40 70)}. Ostateczny zbiór maksymalnych wzorców sekwencji dla zadanego progu minsup=25% składa się z dwóch wzorców: | Następnie możemy wykonać ostatni krok algorytmu, który jest krokiem opcjonalnym czyli krok maksymalizacji. W otrzymanym zbiorze częstych wzorców sekwencji znajdujemy te wzorce sekwencji, które są maksymalne. Łatwo zauważyć, że sekwencja {(30),(40)} oraz sekwencja {(30),(70)} nie są sekwencjami maksymalnymi gdyż zawierają się w sekwencji {(30)(40 70)}. Ostateczny zbiór maksymalnych wzorców sekwencji dla zadanego progu minsup=25% składa się z dwóch wzorców: | ||
(30), (90)wsparcie 0,4 (40%) | (30), (90) wsparcie 0,4 (40%) | ||
(30), (40 70)wsparcie 0,4 (40%) | (30), (40 70) wsparcie 0,4 (40%) | ||
[[ED-4.2-m05-1.0-Slajd25 | << Poprzedni slajd]] | [[ED-4.2-m05-1.0-toc|Spis treści ]] | Następny slajd >> | [[ED-4.2-m05-1.0-Slajd25 | << Poprzedni slajd]] | [[ED-4.2-m05-1.0-toc|Spis treści ]] | Następny slajd >> |
Aktualna wersja na dzień 07:30, 5 wrz 2006
Przykład (6)
Przechodzimy następnie do generacji zbiorów sekwencji kandydujących o długości 3. Okazuje się, że zbiór sekwencji kandydujących o długości 3 jest zbiorem pustym, gdyż w oparciu o zbiór sekwencji LS2 czyli zbiór sekwencji częstych o długości 2 nie można wygenerować żadnych sekwencji kandydujących. Wyjaśnienie tego jest następujące - w pierwszym etapie funkcji Apriori_generate() czyli etapie połączenia ze zbioru LS2 generowany jest następujący zbiór sekwencji kandydujących o długości 3, mianowicie z sekwencji {1,2} otrzymujemy sekwencje {1,2,2},{1,2,3},{1,2,4} oraz {1,2,5}, następnie {1,3,2},{1,3,3},{1,3,4},{1,3,5}, następnie {1,4,2},{1,4,3},{1,4,4},{1,4,5}. Wreszcie z ostatniej sekwencji kandydującej otrzymujemy {1,5,2},{1,5,3},{1,5,4},{1,5,5}. Jednakże żadna z wygenerowanych sekwencji o długości 3 nie wchodzi do zbioru sekwencji kandydujących o długości 3, gdyż każda z podanych wcześniej sekwencji kandydującej o długości 3 zawiera sekwencje o długości 2, która nie należy do zbioru sekwencji częstych o długości 2. W konsekwencji zbiór CS3 czyli zbiór o długości 3 jest zbiorem pustym, w konsekwencji zbiór sekwencji częstych LS3 również jest zbiorem pustym. Końcowym zbiorem wyniku sekwencjonowania jest zatem zbiór LS2.
W ten sposób otrzymujemy zbiór wzorców sekwencji:
(30), (40) wsparcie 0,4 (40%)
(30), (70) wsparcie 0,4 (40%)
(30), (90) wsparcie 0,4 (40%)
(30), (40 70) wsparcie 0,4 (40%)
Następnie możemy wykonać ostatni krok algorytmu, który jest krokiem opcjonalnym czyli krok maksymalizacji. W otrzymanym zbiorze częstych wzorców sekwencji znajdujemy te wzorce sekwencji, które są maksymalne. Łatwo zauważyć, że sekwencja {(30),(40)} oraz sekwencja {(30),(70)} nie są sekwencjami maksymalnymi gdyż zawierają się w sekwencji {(30)(40 70)}. Ostateczny zbiór maksymalnych wzorców sekwencji dla zadanego progu minsup=25% składa się z dwóch wzorców:
(30), (90) wsparcie 0,4 (40%)
(30), (40 70) wsparcie 0,4 (40%)
<< Poprzedni slajd | Spis treści | Następny slajd >>