ED-4.2-m09-1.0-Slajd28
Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwaniaDokładność klasyfikatora (3)
W przypadku gdy dysponujemy zbiorem przykładów o dużej liczności stosujemy prosta metodę podziału zbioru na dwa niezależne zbiory: treningowy (70% przykładów) i testowy (30% przykładów). Zbiory treningowy i testowy powinny być reprezentatywne, co oznacza iż rozkład występowania klas w obu zbiorach powinien odpowiadać rozkładowi występowania klas w zbiorze początkowym przykładów. (ang. stratification procedure )