ED-4.2-m08-1.0-Slajd26

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Przykład 2 (3)

Przykład 2 (3)


Następnie, w kolejnym kroku przechodzimy do obliczenia entropii podziału zbioru S na partycje wg wszystkich atrybutów deskryptorów.

W rozważanym przez nas przykładzie mamy 4 atrybuty deskryptory. Są to atrybut Wiek, Dochód, Student oraz atrybut Status. Rozpocznijmy od analizy atrybutu Wiek. Załóżmy, że atrybut Wiek jest naszym atrybutem testowym. Atrybut Wiek dzieli zbiór S na 3 partycje:S1,S2 i S3. Pierwsza partycja S1 dla wartości Wiek<=30 składa się z pięciu przykładów. S11 – liczba przykładów z klasy C1 partycji S1 wynosi 2, natomiast liczba przykładów z klasy C2 partycji S1 wynosi 3. Podstawiając te wartości do wyrażenia I(S11,S21)=0.971. Zauważmy, że dla partycji S2 – partycja składa się z 4 rekordów. Wszystkie 4 rekordy należą do klasy C1. Partycja ta jest czysta, stąd też wartość wyrażenia I(S12.S22)=0. Dla partycji S3 związanej z wartością wyrażenia wiek=>40, partycja składa się z 5 rekordów, z czego 2 rekordy należą do klasy C1 i 3 rekordy należą do klasy C2. Stąd też wartość wyrażenia I(S13,S23)=0.971.


<< Poprzedni slajd | Spis treści | Następny slajd >>