ZAWWW-2st1.2-w13.tresc-1.0-Slajd3

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Co to jest eksploracja WWW?

Co to jest eksploracja WWW?


Eksploracja sieci WWW (ang. Web mining) to odkrywanie nowej, interesującej, potencjalnie użytecznej i dotychczas nieznanej wiedzy ukrytej w strukturze, zawartości i sposobie korzystania z sieci WWW. Wiedza odkrywana w procesie eksploracji może być prezentowana za pomocą wielu różnych modeli, np. w postaci reguł, wzorców, wyjątków, czy zależności. Sieć WWW zawiera, poza użyteczną wiedzą, ogromną ilość szumu informacyjnego i śmieci. Pozyskanie użytecznej i wartościowej wiedzy z gigantycznego repozytorium, jakim jest sieć WWW, jest zadaniem trudnym. Metody eksploracji sieci WWW można z grubsza podzielić na trzy podstawowe kategorie. Metody eksploracji połączeń (ang. Web linkage mining) analizują strukturę połączeń i odnośników między dokumentami WWW w celu opracowania rankingu dokumentów. Metody te znajdują zastosowanie przede wszystkim w wyszukiwarkach internetowych. Drugą grupą metod są metody eksploracji zawartości dokumentów WWW (ang. Web content mining). Celem metod eksploracji zawartości jest automatyczne pozyskiwanie wiedzy o treści dokumentów. Zastosowania tych metod to, między innymi, automatyczne katalogi recenzji produktów i usług, agregatory wiadomości, itp. Ostatnią kategorią metod eksploracji sieci WWW są metody eksploracji sposobów korzystania z sieci WWW (ang. Web usage mining). Metody te mają na celu przede wszystkim analizę zawartości dzienników serwerów WWW w poszukiwaniu wzorców opisujących częste sekwencje odwołań do dokumentów przechowywanych na serwerze WWW. Ze względu na ograniczenia czasowe w trakcie tego wykładu zajmiemy się tylko pierwszą grupą, czyli algorytmami analizy połączeń między dokumentami WWW.


<< Poprzedni slajd | Spis treści | Następny slajd >>