ED-4.2-m08-1.0-Slajd13

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Przykład (6)

Przykład (6)


Po pierwszym podziale zbioru treningowego drzewo decyzyjne ma następującą postać przedstawioną na slajdzie. Korzeniem drzewa jest wierzchołek związany z punktem podziału Wiek<=27.5, z którego wychodzą dwie gałęzie. Pierwsza gałąź reprezentuje podział wiekowy <=27.5, druga gałąź reprezentuje rekordy dla których wartość atrybutu Wiek>27.5. Gałęzie te łączą wierzchołek korzenia z dwoma wierzchołkami, z którymi związane są dwie partycje. Do pierwszej partycji S1 należą wszystkie rekordy, dla których atrybut Wiek spełnia warunek Wiek<=27.5. Zauważmy, że pierwsza partycja S1 jest partycją „czystą”, w tym sensie, że wszystkie rekordy należące do tej partycji należą do jednej klasy. Wywołanie procedury Partition dla partycji S1, spowoduje zatrzymanie podziału i utworzenie wierzchołka liścia oraz związanie z tym wierzchołkiem etykiety Ryzyko = High. Natomiast druga partycja jest partycją, która nie jest czysta. Zawiera dwa rekordy, które należą do klasy Ryzyko = Low oraz jeden rekord należący do klasy Ryzyko = High. Jeżeli warunek stopu jest zdefiniowany w ten sposób, że liczba rekordów, które muszą należeć do danej partycji > 3, wówczas następuje zatrzymanie działania procedury Partition, utworzenie wierzchołka liścia i przydzielenie temu wierzchołkowi etykiety klasy, która dominuje w danym zbiorze partycji. Wówczas utworzony zostałby wierzchołek, który byłby wierzchołkiem liściem, którego wartość etykiety (klasy) byłaby równa Low.


<< Poprzedni slajd | Spis treści | Następny slajd >>