ED-4.2-m08-1.0-Slajd22
Z Studia Informatyczne
Wersja z dnia 10:05, 10 wrz 2006 autorstwa ALesniewska (dyskusja | edycje)
Zysk informacyjny (5)
Współczynnik (s1j + s2j +...+smj)/s stanowi wagę j-tej partycji i zdefiniowany jest jako iloraz liczby przykładów w j-tej partycji (i.e. krotek posiadających wartość aj atrybutu A) do całkowitej liczby przykładów w zbiorze S. Zauważmy, że dla danej partycji Sj, wyrażenie I(s1j + s2j +...+ smj) podane wzorem przedstawionym na slajdzie, definiuje nam oczekiwaną ilość informacji niezbędną do zaklasyfikowania danego przykładu w partycji sj do określonej klasy. Jak łatwo zauważyć oczekiwana ilość informacji niezbędna do zaklasyfikowania danego przykładu jest równa 0 jeżeli cała partycja jest czysta, czyli należy do jednej klasy. W przeciwnym razie wartość tego wyrażenia określa nam nieuporządkowanie (nieczystość) partycji sj.