ED-4.2-m08-1.0-Slajd20
Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Zysk informacyjny (3)
Niech pi oznacza prawdopodobieństwo, że dowolny przykład należy do klasy Ci (oszacowanie - si/s).
Zakładamy, że atrybut A posiada v różnych wartości: {a1, a2, ..., av}.
Atrybut A dzieli zbiór S na partycje {S1, S2, ..., Sv}, gdzie Sj zawiera przykłady ze zbioru S, których wartość atrybutu A wynosi aj. Wybierając atrybut A jako atrybut testowy tworzymy wierzchołek wewnętrzny drzewa, którego łuki wychodzące posiadają etykiety {a1, a2, ..., av} i łączą dany wierzchołek A z wierzchołkami zawierającymi partycje {S1, S2, ..., Sv}.