ED-4.2-M13-1.0-Slajd26
Z Studia Informatyczne
Zadania eksploracji tekstu
Jak wspomnieliśmy, wyszukiwanie relewantnych dokumentów tekstowych, mimo swojej ważności, nie wyczerpuje problemu eksploracji dokumentów tekstowych. Inne, typowe, zadania eksploracji tekstu to: analiza połączeń (asocjacje) pomiędzy dokumentami, wykrywanie podobieństw i anomalii w dokumentach, klasyfikacja dokumentów, kategoryzacja dokumentów, grupowanie dokumentów, czy ekstrakcja cech dokumentów.
Analiza asocjacji (nazywane odkrywaniem asocjacji) polega na wykrywaniu niespodziewanych korelacji pomiędzy dokumentami lub słowami kluczowymi.
Metody analizy asocjacji są wykorzystywane m.in. we wstępnym przetwarzaniu tekstu:
parsing, stemming, usuwanie słów ze stop listy, itp.