ED-4.2-m10-1.0-Slajd2
Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Sformułowanie problemu
Grupowanie jest jedną z najstarszych i najbardziej popularnych metod eksploracji danych. Problem grupowania danych można zdefiniować następująco: jest proces grupowania obiektów, rzeczywistych bądź abstrakcyjnych, w klasy, nazywane klastrami lub skupieniami, zgodnie z przyjęta funkcją podobieństwa. Grupowanie może dotyczyć zarówno obiektów rzeczywistych (np. pacjentów, sekwencji DNA, dokumenty tekstowe), jak również obiektów abstrakcyjnych (sekwencja dostępów do stron WWW, grafy reprezentujące dokumenty XML, itp.).