ZAWWW-2st1.2-w13.tresc-1.0-Slajd18

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

PageRank

PageRank


Schemat działania algorytmu PageRank jest następujący. W pierwszym kroku tworzona jest stochastyczna macierz M reprezentująca całą indeksowaną sieć WWW. Wszystkie indeksowane dokumenty muszą zostać wpierw ponumerowane. Poszczególne wiersze i kolumny macierzy M reprezentują indeksowane dokumenty. Dokument i-ty odpowiada i-tej kolumnie i i-temu wierszowi macierzy M. Komórki macierzy M są inicjalizowane w następujący sposób. Jeśli dokument j-ty posiada n odnośników do innych dokumentów, to w kolumnie j-tej w wierszach reprezentujących te dokumenty umieszcza się wartość 1/n. Innymi słowy, element M [i,j] = 1/n, jeżeli dokument j-ty posiada odnośniki do n stron (w tym do dokumentu i-tego), w przeciwnym razie M [i,j] = 0. Interpretacja macierzy M jest następująca: wartość elementu M [i,j] określa prawdopodobieństwo przejścia do i-tego dokumentu, jeśli aktualnie przeglądany jest dokument j-ty. Warto tu zauważyć, że w prezentowanym modelu prawdopodobieństwo przejścia do dowolnego dokumentu wskazywanego przez j-ty dokument jest jednakowe (wszystkie odnośniki wychodzące z danego dokumentu mają tę samą wagę).


<< Poprzedni slajd | Spis treści | Następny slajd >>