ZAWWW-2st1.2-w13.tresc-1.0-Slajd27

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

PageRank - usprawnienia

PageRank - usprawnienia


Istnieje wiele możliwości ulepszania oryginalnego algorytmu PageRank. W wielu przypadkach zamiast kosztownych obliczeń można posłużyć się predykcją prawdopodobnych wartości granicznych w wektorze własnym. Takie rozwiązanie jest szczególnie korzystne w momencie, w którym kolejne iteracje przeliczania wektora ważności dokumentów wyraźnie wskazują na niewielkie wahania asymptotyczne wokół wartości granicznych. Inną propozycją jest wykorzystanie cech lokalności odwołań. Wiadomo skądinąd, że dokumenty umieszczone na jednym serwerze/domenie są ze sobą w naturalny sposób silniej powiązane. Zamiast pracochłonnego wyliczania wektora własnego macierzy reprezentującej wszystkie dokumenty, można wcześniej pogrupować dokumenty (np. według serwera), wyliczyć lokalną wartość PageRank dla każdego dokumentu, na tej podstawie wyliczyć uśrednioną wartość PageRank dla grupy dokumentów i kontynuować wyliczenia dla grup dokumentów. Takie rozwiązanie bardzo wydatnie przyspiesza obliczenia. Wreszcie, można pokusić się o zamodelowanie wielu równolegle poruszających się surferów (szczegółowy opis tego usprawnienia wykracza jednak poza ramy tego wykładu). Mimo ogromnej popularności i praktycznej użyteczności algorytmu PageRank, doczekał się on wielu słów krytyki. Algorytm jest dość podatny na tzw. link spamming, czyli tworzenie klik tysięcy kooperujących ze sobą serwisów, które wykorzystują powiązania między sobą do skoordynowanego podniesienia rankingu wybranych stron. Zaobserwowano również tendencję PageRank do nadmiernego podnoszenia wartości wybranych typów serwerów, w szczególności serwerów bardzo silnie zorientowanych tematycznie. Bodaj największym problemem związanym z algorytmem PageRank jest jednak fakt, że ranking jest bezkontekstowy, tzn. niezależnie od aktualnie przetwarzanego zapytania ranking dokumentów pozostaje niezmienny. W przypadku gdy zapytanie jest wieloznaczne (np. "jaguar"), w odpowiedzi wyszukiwarka zwróci zarówno adres serwisu producenta samochodów, jak i adres dokumentu w encyklopedii opisującego drapieżnika południowoamerykańskiego.


<< Poprzedni slajd | Spis treści | Następny slajd >>