ED-4.2-m04-1.0-Slajd24
Dyskretyzacja atrybutów ilościowych (1)
Wróćmy obecnie do problemu dyskretyzacji atrybutów ilościowych. Istnieje wiele schematów dyskretyzacji atrybutów ilościowych, jednakże trzy schematy są najbardziej popularne. Dyskretyzując atrybuty ilościowe tworzymy przedziały o równej szerokości. W tym schemacie zakładamy, że rozmiar każdego przedziału jest identyczny (np. przedziały 10tys. dla atrybutu „dochód”). Schemat dyskretyzacji na przedziały o równej gęstości zakłada, że każdy przedział posiada zbliżoną (równą) liczbę rekordów przypisanych do przedziału. Schemat dyskretyzacji poprzez grupowanie (cluster-based) zakłada on, że cały zbiór wartości poddajemy procesowi grupowania, znajdujemy skupienia wartości dyskretyzowanego atrybutu, w oparciu o skupienia tworzymy podział wartości danego atrybutu ilościowego.