ED-4.2-m08-1.0-Slajd16

From Studia Informatyczne

Przykład (9)

Przykład (9)


Rozważmy pierwszy punkt podziału związany z testem, Typ_samochodu należy do kategorii samochód sportowy. Punkt podziału dzieli zbiór rekordów związanych z tworzonym wierzchołkiem na dwie partycje. Pierwsza partycja składa się z jednego rekordu, który spełnia predykat Typ_samochodu należy do kategorii samochód sportowy. Klasa związana z tym rekordem Ryzyko = High. Pozostała partycja składa się z dwóch rekordów, które należą do klasy Ryzyko = Low. Indeks Gini dla pierwszej partycji wynosi 0. Gini indeks dla drugiej partycji wynosi 0. Również indeks podziału Gini dla tego podziału wynosi 0. Rozważmy drugi punkt podziału związany z testem Typ samochodu należy do kategorii samochodów rodzinnych. Ten punkt podziały dzieli zbiór rekordów na dwie partycje. Pierwsza partycja składa się z jednego rekordu, który spełnia predykat Typ_samochodu należy do kategorii {family}, natomiast druga partycja składa się z dwóch rekordów. Pierwszy rekord należy do klasy Ryzyko = Low, natomiast druga partycja zawiera rekord, który należy do klasy Ryzyko = High oraz drugi rekord należący do klasy Ryzyko = Low. Indeks Gini pierwszej partycji wynosi 0, indeks Gini drugiej partycji wynosi 1. Indeks podziału Gini dla tego punktu podziału wynosi 1/3. W podobny sposób oceniamy wszystkie punkty podziału. Łatwo zauważyć, że istnieją dwa podziały, które charakteryzują się najmniejszą wartością. Pierwszy podział związany z testem Typ_samochodu należy do kategorii sportowy dla którego indeks podziału Gini wynosi 0. Drugi podział związany jest z testem Typ_samochodu należy do kategorii (family,truck} i indeks podziału dla tego podziału również wynosi 0.


<< Poprzedni slajd | Spis treści | Następny slajd >>