ED-4.2-m08-1.0-Slajd7

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Indeks Gini (6)

Indeks Gini (6)


„Najlepszym” punktem podziału zbioru S, jak wspomnieliśmy wcześniej jest punkt podziału, który charakteryzuje się najmniejszą wartością indeksu podziału Gini. Wracając do prezentowanego wcześniej algorytmu SPRINT i procedury Partition, zauważmy, że kluczowym punktem tej procedury jest analiza dla każdego atrybutu wszystkich możliwych punktów podziału. Oznacza to, że dla każdego atrybutu, dla wszystkich możliwych punktów podziału, obliczamy wartość indeksu podziału Gini i wybieramy punkt podziału o najmniejszej wartości giniSPLIT . Wybrany punkt podziału włączamy do drzewa decyzyjnego jako wierzchołek wewnętrzny. Punkt podziału dzieli zbiór S na dwie partycje S1 i S2. Następnie powtarzamy procedurę obliczania indeksu podziału dla partycji S1 i S2, ponownie dla każdego atrybutu i wszystkich punktów podziału poszukujemy wartości indeksu podziału poszukujemy wartości indeksu podziału Gini. Wybieramy punkty podziału o najmniejszej wartości indeksu podziału Gini. Znalezione punkty podziału włączamy do drzewa decyzyjnego. Powtarzamy tę procedurę dla kolejnych partycji aż do osiągnięcia warunku stopu.


<< Poprzedni slajd | Spis treści | Następny slajd >>