ED-4.2-m05-1.0-Slajd15
Krok 2: znajdowanie zbiorów częstych
Kolejnym krokiem algorytmu jest krok 2 – znajdowania zbiorów częstych. Celem tego kroku jest znalezienie wszystkich zbiorów częstych w bazie danych sekwencji DS. Do tego celu można zastosować dowolny algorytm znajdowania zbiorów częstych (na przykład, algorytm Apriori). W przeciwieństwie do algorytmu Apriori, w kroku znajdowania zbiorów częstych wsparcie danego zbioru X jest obliczane względem liczby sekwencji, a nie liczby transakcji (wyrazów sekwencji). Wsparciem zbioru X w bazie danych sekwencji DS jest iloraz liczby sekwencji zawierających wyrazy wspierające zbiór X do całkowitej liczby sekwencji należących do bazy danych sekwencji DS. Przykładowo, jeżeli baza danych sekwencji zawiera dwie sekwencje: sekwencja 1: ((A, B) (B, C) (C, D)) oraz sekwencja 2: ((A, B) (B, C, D)) to wsparcie zbioru (A, B) wynosi 100%, gdyż obie sekwencje zawierają wyrazy wspierające zbiór (A, B).