ED-4.2-m04-1.0-Slajd32

Z Studia Informatyczne
Wersja z dnia 07:39, 5 wrz 2006 autorstwa ALesniewska (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Korelacja

Korelacja


Mimo, że reguła ‘kto lubi herbatę lubi również kawę’ jest regułą o stosunkowo dużym wsparciu i wysokiej ufności, to okazało się na podstawie naszego przykładu, że reguła przeciwna ‘kto nie lubi herbaty ten lubi kawę’ jest regułą o znacznie większym wsparciu i większej ufności. Jakie są praktyczne konsekwencje tego spostrzeżenia? Pierwszy wniosek mówi, że miary wsparcia i ufności nie wystarczają do pełnej oceny ważności reguł asocjacyjnych. Drugi wniosek mówi, że jeżeli wygenerowaliśmy zbiór reguł asocjacyjnych to powinniśmy jeszcze sprawdzić, czy zbiór przeciwnych reguł (nie poprzednik reguły -> następnik reguły) nie posiada przypadkiem większego wsparcia i większej ufności. W literaturze zaproponowano szereg nowych miar oceny ważności reguł asocjacyjnych: lift, conviction, any-confidence, all-confidence, bond, gain, itp., aby móc empirycznie określić przydatność reguły asocjacyjnej. Spośród zaproponowanych nowych miar skoncentrujemy się na mierze Lift (lub Interest), która szeroko stosowana jest przez wiele produktów komercyjnych. Aby wprowadzić definicję tej miary wcześniej przybliżymy definicję korelacji. Mówimy, że dwa zdarzenia A i B są niezależne, jeżeli prawdopodobieństwo wystąpienia tych zdarzeń jest równe iloczynowi prawdopodobieństw wystąpienia tych zdarzeń), w przeciwnym razie zdarzenia A i B są skorelowane.


<< Poprzedni slajd | Spis treści | Następny slajd >>