ED-4.2-m08-1.0-Slajd2

Z Studia Informatyczne
Wersja z dnia 10:04, 10 wrz 2006 autorstwa ALesniewska (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Indeks Gini (1)

Indeks Gini (1)


Jak zostało omówione wcześniej, jednym z newralgicznych punktów budowy drzewa decyzyjnego, jest wybór punktu podziału, który najlepiej wyznacza wierzchołek wewnętrzny drzewa decyzyjnego, innymi słowy „najlepiej” dzieli zbiór danych treningowych należących do tego wierzchołka. Popularnym kryterium oceny punktu podziału, stosowanym w wielu produktach komercyjnych, jest indeks Gini. Wykorzystuje się go między innymi w komercyjnym systemie IBM Inteligent Miner, w którym został zaimplementowany algorytm SPRINT. Rozważmy przykładowy zbiór treningowy, w którym każdy rekord opisuje ocenę ryzyka, że osoba, która ubezpieczyła samochód, spowoduje wypadek. Ocena została dokonana przez firmę ubezpieczeniową w oparciu o dotychczasową historię ubezpieczonego.


<< Poprzedni slajd | Spis treści | Następny slajd >>