ZAWWW-2st1.2-w13.tresc-1.0-Slajd29: Różnice pomiędzy wersjami
Nie podano opisu zmian |
(Brak różnic)
|
Aktualna wersja na dzień 12:51, 15 lis 2006
Hubs & Authorities
Kolejnym prezentowanym algorytmem rankingu stron jest algorytm H&A (oryginalna nazwa algorytmu to algorytm HITS, ang. Hyperlink-Induced Topic Search). Algorytm H&A składa się z dwóch modułów: modułu próbkowania oraz modułu propagacji. Moduł próbkowania konstruuje zbiór kilku tysięcy dokumentów WWW, zawierający odpowiednie, z punktu widzenia wyszukiwania, dokumenty WWW. Zbiór ten może zostać skonstruowany na podstawie wyniku zwróconego przez tradycyjną wyszukiwarkę internetową. Z kolei moduł propagacji określa oszacowanie ważności dokumentów. Algorytm wyróżnia dwa typy dokumentów: dokumenty autorytatywne (ang. authorities) – stanowią one źródło ważnej informacji na zadany temat, oraz koncentratory (ang. hubs) – są to dokumenty zawierające odnośniki do autorytatywnych dokumentów.