ED-4.2-m08-1.0-Slajd20

From Studia Informatyczne

Zysk informacyjny (3)

Zysk informacyjny (3)


Niech pi oznacza prawdopodobieństwo, że dowolny przykład należy do klasy Ci (oszacowanie - si/s).

Zakładamy, że atrybut A posiada v różnych wartości: {a1, a2, ..., av}.

Atrybut A dzieli zbiór S na partycje {S1, S2, ..., Sv}, gdzie Sj zawiera przykłady ze zbioru S, których wartość atrybutu A wynosi aj. Wybierając atrybut A jako atrybut testowy tworzymy wierzchołek wewnętrzny drzewa, którego łuki wychodzące posiadają etykiety {a1, a2, ..., av} i łączą dany wierzchołek A z wierzchołkami zawierającymi partycje {S1, S2, ..., Sv}.


<< Poprzedni slajd | Spis treści | Następny slajd >>