ED-4.2-m10-1.0-Slajd4
Z Studia Informatyczne
Przykłady (1)
Przykłady zastosowania metod grupowania. Pierwszy przykład odnosi się do grupowania zbiorów dokumentów tekstowych. Załóżmy, że każdy dokument jest opisany zbiorem słów pochodzących z pewnego słownika, nazywanego tezaurusem. Każdy dokument, w tej reprezentacji, można interpretować jako punkt w przestrzeni wielowymiarowej, w której pojedynczy wymiar odpowiada jednemu słowu z przyjętego słownika. Współrzędne dokumentu w tej przestrzeni są zdefiniowane względną częstością występowania słów ze słownika. Klastry dokumentów odpowiadają grupom dokumentów dotyczących podobnej tematyki, tj. grupom dokumentów opisanych podobnym zbiorem słów.