ZAWWW-2st1.2-w13.tresc-1.0-Slajd29

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Hubs & Authorities

Hubs & Authorities


Kolejnym prezentowanym algorytmem rankingu stron jest algorytm H&A (oryginalna nazwa algorytmu to algorytm HITS, ang. Hyperlink-Induced Topic Search). Algorytm H&A składa się z dwóch modułów: modułu próbkowania oraz modułu propagacji. Moduł próbkowania konstruuje zbiór kilku tysięcy dokumentów WWW, zawierający odpowiednie, z punktu widzenia wyszukiwania, dokumenty WWW. Zbiór ten może zostać skonstruowany na podstawie wyniku zwróconego przez tradycyjną wyszukiwarkę internetową. Z kolei moduł propagacji określa oszacowanie ważności dokumentów. Algorytm wyróżnia dwa typy dokumentów: dokumenty autorytatywne (ang. authorities) – stanowią one źródło ważnej informacji na zadany temat, oraz koncentratory (ang. hubs) – są to dokumenty zawierające odnośniki do autorytatywnych dokumentów.


<< Poprzedni slajd | Spis treści | Następny slajd >>