ED-4.2-m06-1.0-Slajd4
Z Studia Informatyczne
Podstawowy algorytm (1)
Jaka jest geneza algorytmu PrefixSpan? Wynika ona z wad podstawowego algorytmu odkrywania wzorców sekwencji przedstawionego na poprzednim wykładzie. Podstawowy algorytm odkrywania wzorców częstych możemy przedstawić w następujących krokach:
- Wielokrotny przegląd bazy danych. Odkrywanie zbiorów częstych o minimalnym wsparciu w pierwszej iteracji (tzw. częste 1-sekwencje).
- Wykorzystanie w kolejnych iteracjach do generacji sekwencji kandydujących sekwencje częste odkryte w poprzedniej iteracji.
- Obliczenie wsparcia sekwencji kandydujących podczas odczytu bazy danych.
- Warunek stopu - nie ma więcej kandydatów lub żaden z kandydatów nie jest częsty.