ED-4.2-m04-1.0-Slajd24

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Dyskretyzacja atrybutów ilościowych (1)

Dyskretyzacja atrybutów ilościowych (1)


Wróćmy obecnie do problemu dyskretyzacji atrybutów ilościowych. Istnieje wiele schematów dyskretyzacji atrybutów ilościowych, jednakże trzy schematy są najbardziej popularne. Dyskretyzując atrybuty ilościowe tworzymy przedziały o równej szerokości. W tym schemacie zakładamy, że rozmiar każdego przedziału jest identyczny (np. przedziały 10tys. dla atrybutu „dochód”). Schemat dyskretyzacji na przedziały o równej gęstości zakłada, że każdy przedział posiada zbliżoną (równą) liczbę rekordów przypisanych do przedziału. Schemat dyskretyzacji poprzez grupowanie (cluster-based) zakłada on, że cały zbiór wartości poddajemy procesowi grupowania, znajdujemy skupienia wartości dyskretyzowanego atrybutu, w oparciu o skupienia tworzymy podział wartości danego atrybutu ilościowego.


<< Poprzedni slajd | Spis treści | Następny slajd >>