Zaawansowane algorytmy i struktury danych/Wykład 6: Różnice pomiędzy wersjami

Wersja z 23:05, 21 lip 2006

Abstrakt

W wykładzie tym zajmiemy się problemem obliczanie odległości w grafie między wszystkimi parami wierzchołków w grafie ważonym skierowanym $G = (V, E)$ . Przedstawimy trzy algorytmu rozwiązujące ten problem:

algorytm wykorzystujący mnożenie macierzy działający w czasie $O (| V |^{3} \log | V |$ ,
algorytm Floyda-Warshalla działający w czasie $O (| V |^{3})$ ,
algorytm Johnsona działający w czasie $O (V |^{2} \log | V | + | V | | E |)$ .

Problem najkrótszych ścieżek między wszystkimi parami wierzchołków

Problem najkrótszych ścieżek między wszystkimi parami wierzchołków można rozwiązać, wykonując $| V |$ razy algorytm dla problemu najkrótszych ścieżek z jednego wierzchołka. Jeżeli w grafie wagi krawędzi są nieujemne to możemy użyć algorytmu Dijkstry. Najszybsza implementacji algorytmu Dijskstry wykorzystująca kopce Fibonacciego działa w czasie $O (| V | \log | V | + | E |)$ , co daje nam algorytm rozwiązujący problem policzenia odległości między wszystkimi parami wierzchołków działający w czasie $O (| V |^{2} \log | V | + | V | | E |)$ .

Jednakże tego rozwiązania nie możemy użyć jeżeli w grafie wagi krawędzi mogą być ujemne. W takim przypadku możemy użyć algorytm Bellmana-Forda. Otrzymamy wtedy algorytm działający w czasie $O (| V |^{2} | E |$ . W rozdziale tym zaprezentujemy bardziej efektywne rozwiązania dla tego problemu.

W rozdziale tym będziemy zakładać, że algorytmy na wejściu otrzymują macierz wag $W$ rozmiaru $n \times n$ reprezentującą wagi krawędzi $n$ -wierzchołkowego grafu $G = (V, E)$ . Dla macierzy tej zachodzi:

w_{i, j} = {\begin{cases} 0, & jeśli i = j, \\ waga krawędzi (i, j), & jeśli i \neq j i (i, j) \in E, \\ \infty, & jeśli i \neq j i (i, j) \neq E . \end{cases}

W problemie najkrótszych ścieżek między wszystkimi parami wierzchołków chcemy wyznaczyć macierz $D$ rozmiaru $n \times n$ taką, że $d_{i, j}$ jest równe odległości $δ (i, j)$ z wierzchołka $i$ do wierzchołka $j$ . Chcemy także wyznaczyć dla każdego wierzchołka $v$ drzewo najkrótszych ścieżek $T_{v}$ ukorzenione w $v$ . Podobnie jak w poprzednim rozdziale drzewo $T_{v}$ możemy kodować dla każdego wierzchołka przy pomocy funkcji poprzedników $π_{v}$ . Ponieważ tutaj interesuje nas wiele drzew to łatwiej będzie nam używać 'macierzy poprzedników $Π$ . Macierz tą definiujemy używając funkcji $π_{v}$ w następujący sposób:

Π_{v, u} = π_{v} (u) .

W pozostałej części tego wykładu zajmiemy się tylko wyznaczaniem macierzy odległości $D$ . Jak to zostało pokazane w Zadaniu 3 do poprzedniego wykładu znając odległości w grafie drzewo najkrótszych ścieżek można wyznaczyć w czasie $O (| E |)$ , a więc $| V |$ drzew możemy wyliczyć w czasie $O (| E | | V |)$ . Czas ten jest mniejszy niż czas działania wszystkich prezentowanych w tym wykładzie algorytmów, więc bez straty ogólności, a zyskując na prostocie prezentacji możemy ograniczyć się tylko do wyznaczenia macierzy odległości $D$ .

Co więcej będziemy zakładać, że w grafie nie ma ujemnych cykli. Ujemne cykle można wykryć w czasie $O (| V | | E |)$ przy użyciu Algorytmu Bellmana-Forda. Zobacz Zadanie 4 do Wykładu 4.

Najkrótsze ścieżki i mnożenie macierzy

Załóżmy, że dane mamy dwie macierze wag $C$ oraz $D$ rozmiaru $n \times n$ . Dla macierzy tych definiujemy operację $\times_{\min}$ iloczyn odległości, której wynikiem jest także macierz rozmiaru $n \times n$ , zdefiniowana jako:

$(C \times_{\min} D)_{i, j} = \min_{k = 1, \dots, n} C_{i, k} + D_{k, j} .$ (1)

Wniosek wniosek_konkatenacja

Jeżeli założymy, że

C

i

D

opisują minimalne wagi odpowiednio zbioru ścieżek odpowiednio

Π_{C}

i

Π_{D}

w pewnym grafie

G

, to iloczyn odległości wyznacza minimalne wagi zbioru ścieżek powstałego z konkatenacji ścieżek ze zbioru

Π_{C}

ze ścieżkami zbioru

Π_{D}

.

Pokażemy teraz, że produkt odległości jest operacją łączną.

Lemat io_łączny

Dla macierzy

C

,

D

i

E

rozmiaru

n \times n

zachodzi:

(C \times_{\min} D) \times_{m i n} E = C \times_{\min} (D \times_{m i n} E) .

Dowód

Powyższa równość wynika wprost z wzoru (1) oraz przemienności operacji

\min

.

Co więcej produkt odległości jest przemienny względem dodawania.

Lemat io_przemienny

Dla macierzy

C

,

D

i

E

rozmiaru

n \times n

zachodzi:

C \times_{\min} (D + E) = C \times_{\min} D + C \times_{m i n} E,

oraz

(D + E) \times_{\min} C = D \times_{\min} C + E \times_{m i n} C .

Dowód

Te dwie równości wynikają ponownie z wzoru (1) oraz przemienności operacji

\min

względem dodawania.

Zdefiniujmy macierz $I_{\min}$ rozmiaru $n \times n$ jako:

{(I_{\min})}_{i, j} = {\begin{cases} 0, & jeśli i = j, \infty, & jeśli i \neq j . \end{cases}

Macierz ta jest jedynką dla iloczynu odległości.

Lemat io_jedynka

Dla macierzy

C

rozmiaru

n \times n

zachodzi:

I_{\min} \times_{\min} C = C \times_{\min} I_{\min} = C .

Szablon:Dowód

Łączność iloczynu odległości ma dla nas bardzo ważne konsekwencję i pozwoli nam na konstrukcję algorytmu obliczania odległości w grafie między wszystkimi parami wierzchołków działającego w czasie $O (n^{3} \log n)$ . Niech $W$ będzie macierzą wag grafu $G = (V, E)$ . Rozważmy macierz $W^{m}$ zdefiniowaną jako:

Parser nie mógł rozpoznać (nieznana funkcja „\begin{cases}”): {\displaystyle W^{m} = \begin{cases} I_{\min}, &\mbox{jeżeli } m=0,\\ W \times_{\min} W^{m-1}, &\mbox{jeżeli } m>0. }

Pokażemy teraz, że macierz $W^{m}$ opisuje odległości między wierzchołkami grafu ale tylko dla ścieżek używających mniej niż $m$ krawędzi.

Lemat potęgi_odległości

Element

W_{i, j}^{m}

macierzy

W^{m}

zadaje najmniejszą wagę ścieżki wychodzącej z wierzchołka

i

do wierzchołka

j

spośród ścieżek, które zawierają mniej niż

m

krawędzi, tzn.:

Parser nie mógł rozpoznać (nieznana funkcja „\mboc”): {\displaystyle w_{i,j}^{m} = \begin{cases} \min\{w(p): p \mbox{ ścieżka o długości } \le m \mboc{ z } u \mbox{ do } v\}, & \mbox{jeżeli istnieje ścieżka o długości } \le m \mboc{ z } u \mbox{ do } v,\\ \infty & \mbox{w przeciwnym przypadku.} \end{cases} }

Dowód

Tezę tą udowodnimy przez indukcję po

m

. Dla danego wierzchołka istnieją dla niech tylko ścieżki długości zero prowadzące do niego samego, a więc dla

m = 0

teza wynika wprost z definicji macierzy

W^{0}

. Załóżmy teraz, że teza zachodzi dla

m > 0

. Mamy wtedy

W^{m + 1} = W \times_{\min} W^{m}

. Zauważmy, że ze definicji macierzy wag

W

opisuje ścieżki używające

\leq 1

krawędź. Korzystając teraz z Wniosku 1 otrzymujemy tezę dla

m + 1

.

Zajmiemy się teraz konstrukcją algorytmu obliczającego najkrótsze ścieżki w grafie. W tym celu będziemy potrzebowali jeszcze udowodnić następujące dwa lematy.

Lemat lemat_6

Jeżeli w grafie

G = (V, E)

, w którym wagi krawędzi zadane są macierzą

W

nie istnieje cykl o ujemnej wadze to:

δ (u, v) = W_{u, v}^{(k)}, dla k \geq n - 1 .

Dowód

Jeżeli w grafie nie istnieje cykl o ujemnej wadze, to wszystkie najkrótsze ścieżki są ścieżkami prostymi, a więc mają długość co najwyżej

n - 1

. Z Lematu 5 wynika więc że odległości tych ścieżek są dobrze wyznaczone w

W^{k}

dla

k \leq n - 1

.

Zauważmy, że iloczyn odległości dwóch macierzy możemy policzyć w czasie $O (| V |^{3})$ wykorzystując następujący algorytm.

Algorytm algorytm_iloczyn_odległości

 {{{3}}}

Ponieważ operacja iloczynu odległości jest łączna to możemy wykorzystać algorytm szybkiego potęgowania i policzyć odległości przy pomocy następującego algorytmu.

Algorytm algorytm_apsp_mnozenie

 ODLEGŁÓŚCI-I(W)
 1   $D = W$ ,
 2   $k = 1$ 
 3 while  $n - 1 > k$  do
 4    $D =$ MNOŻENIE-ODLEGŁOŚCI $(D, D)$ 
 5    $m = 2 m$ 
 7  return  $D$

Poprawności tego algorytmu wynika wprost z Lematu 6 ponieważ na zakończenie algorytmu $D = W^{m}$ i $m > n - 1$ .

Algorytm Floyda-Warshalla

W algorytmie Floyda-Warshalla wykorzystamy inną cechę najkrótszych ścieżek niż ta użyta w algorytmie z wykorzystaniem iloczynu odległości. W poprzednim algorytmie konstruowaliśmy coraz dłuższe ścieżki, natomiast tutaj będziemy konstruować ścieżki przechodzące przez coraz większy zbiór wierzchołków. Wierzchołkiem {{kotwica|wierzchołek_wewnetrzny|wewnetrznym} ścieżki $p = (v_{0}, \dots, v_{l})$ jest każdy wierzchołek na ścieżce $p$ różny od jej początku $v_{0}$ i końca $v_{l}$ .

Niech zbiorem wierzchołków grafu $G$ będzie $V = {1, \dots, n}$ . Niech $d_{i, j}^{(k)}$ dla $k = 0, \dots, n$ oznacza najmniejszą wagę ścieżki z $i$ do $j$ , spośród ścieżek których wierzchołki wewnętrzne należą do zbioru ${v_{1}, \dots, v_{k}$ . Pokażemy następujący rekurencyjny wzór na $D^{(k)}$ .

Lemat lemat_7

Dla

k = 0, \dots, n

zachodzi:

d_{i, j}^{(k)} = {\begin{cases} w_{i, j}, & jeżeli k = 0, \\ \min (d_{i, j}^{(k - 1)}, d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)}, & jeżeli k \geq 1 . \end{cases}

Dowód

Dla

k = 0

poprawność powyższego wzoru wynika bezpośrednio z definicji

D^{0}

. Dla

k > 0

musimy pokazać, że

{{{3}}} (2

d_{i, j}^{(k)} = \min (d_{i, j}^{(k - 1)}, d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)}) .

)

Niech $p$ będzie najkrótszą ścieżką z $i$ do $j$ , której wierzchołki wewnętrzne należą do zbioru ${v_{1}, \dots, v_{k}}$ . Mamy dwa przypadki:

Wierzchołek $v_{k}$ nie leży na ścieżce $p$ . Wtedy zachodzi $d_{i, j}^{(k)} = p (w) = d_{i, j}^{(k - 1)}$ . Ponieważ $p$ jest najkrótszą ścieżką to także $p (w) \leq d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)}$ i powyższy wzór zachodzi.
Jeżeli wierzchołek $v_{k}$ należy do ścieżki $p$ , to występuje on dokładnie raz i możemy podzielić $p$ na dwie ścieżki $p_{1}$ z $i$ do $k$ oraz $p_{2}$ z $k$ do $j$ . Ścieżki $p_{1}$ i $p_{2}$ nie zawierają wierzchołka $v_{k}$ jako wierzchołka wewnętrznego. Ponieważ są to podścieżki najkrótszej ścieżki, więc same też są najkrótsze. Zachodzi więc dla nich $w (p_{1}) = d_{i, k}^{(k - 1)}$ oraz $w (p_{2}) = d_{k, j}^{(k - 1)}$ . Otrzymujemy więc $d_{i, j}^{(k)} = w (p) = w (p_{1}) + w (p_{2}) = d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)}$ . Ponieważ $p$ jest najkrótszą ścieżką to $p (w) \leq d_{i, j}^{(k - 1)}$ i wzór zachodzi także w tym przypadku.

Wykorzystując wzór (2) możemy skonstruować następujący algorytm obliczający w czasie $O (| V |^{3})$ odległości między wszystkimi parami wierzchołków.

Algorytm algorytm_Floyda-Warshalla

 między wszystkimi parami wierzchołków I
 ODLEGŁÓŚCI-II(W)
 1   $D^{(0)} = W$ ,
 2  for  $k = 1$  to  $n$  do
 3    for  $i = 1$  to  $n$  do
 4      for  $j = 1$  to  $n$  do
 5         $d_{i, j}^{(k)} = \min (d_{i, j}^{(k - 1)}, d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)})$ 
 6  return  $D^{(n)}$

@@ Linia 203: / Linia 203: @@
 == Algorytm Floyda-Warshalla ==
-W algorytmie Floyda-Warshalla wykorzystamy inną cechę najkrótszych
+W algorytmie Floyda-Warshalla wykorzystamy inną cechę najkrótszych ścieżek niż ta użyta w algorytmie z wykorzystaniem
-ścieżek niż ta użyta w algorytmie z wykorzystaniem
+[[#iloczyn_odległości|iloczynu odległości]]. W poprzednim algorytmie konstruowaliśmy coraz dłuższe ścieżki, natomiast tutaj będziemy konstruować ścieżki przechodzące przez coraz większy zbiór wierzchołków. Wierzchołkiem {{kotwica|wierzchołek_wewnetrzny|'''wewnetrznym'''} ścieżki <math>p = (v_0, \ldots, v_l)</math> jest każdy wierzchołek na ścieżce <math>p</math> różny od jej początku <math>v_0</math> i końca <math>v_l</math>.
-[[#iloczyn_odległości|iloczynu odległości]]. W poprzednim algorytmie
-konstruowaliśmy coraz dłuższe ścieżki, natomiast tutaj będziemy
-konstruować ścieżki przechodzące przez coraz większy zbiór
-wierzchołków. Wierzchołkiem
-{{kotwica|wierzchołek_wewnetrzny|'''wewnetrznym'''} ścieżki <math>p
-= (v_0, \ldots, v_l)</math> jest każdy wierzchołek na ścieżce
-<math>p</math> różny od jej początku <math>v_0</math> i końca
-<math>v_l</math>.
-Niech zbiorem wierzchołków grafu <math>G</math> będzie <math>V =
+Niech zbiorem wierzchołków grafu <math>G</math> będzie <math>V = \{1,\ldots,n\}</math>. Niech <math>d_{i,j}^{(k)}</math> dla <math>k = 0,\ldots, n</math> oznacza najmniejszą wagę ścieżki z <math>i</math> do <math>j</math>, spośród ścieżek których wierzchołki wewnętrzne należą do zbioru <math>\{v_1, \ldots,v_{k}</math>. Pokażemy następujący rekurencyjny wzór na <math>D^{(k)}</math>.
-\{1,\ldots,n\}</math>. Niech <math>d_{i,j}^{(k)}</math> dla <math>k =
-,\ldots, n</math> oznacza najmniejszą wagę ścieżki z <math>i</math>
-do <math>j</math>, spośród ścieżek których wierzchołki wewnętrzne
-należą do zbioru <math>\{v_1, \ldots,v_{k}</math>. Pokażemy następujący
-rekurencyjny wzór na <math>D^{(k)}</math>.
 {{lemat|lemat_7|7|3=
@@ Linia 235: / Linia 222: @@
-{{dowód|||3= Dla <math>k=0</math> poprawność powyższego wzoru wynika
+{{dowod|||3= Dla <math>k=0</math> poprawność powyższego wzoru wynika bezpośrednio z definicji <math>D^0</math>. Dla <math>k>0</math> musimy pokazać, że
-bezpośrednio z definicji <math>D^0</math>. Dla <math>k>0</math>
-musimy pokazać, że
 {{wzor|wzor_2|2
@@ Linia 245: / Linia 230: @@
 }}
-Niech <math>p</math> będzie najkrótszą ścieżką z <math>i</math> do <math>j</math>,
+Niech <math>p</math> będzie najkrótszą ścieżką z <math>i</math> do <math>j</math>, której wierzchołki wewnętrzne należą do zbioru <math>\{v_1,\ldots,v_k\}</math>. Mamy dwa przypadki:
-której wierzchołki wewnętrzne należą do zbioru <math>\{v_1,\ldots,v_k\}</math>. Mamy dwa przypadki:
+* Wierzchołek <math>v_k</math> nie leży na ścieżce <math>p</math>. Wtedy zachodzi <math>d_{i,j}^{(k)} = p(w) = d_{i,j}^{(k-1)}</math>. Ponieważ <math>p</math> jest najkrótszą ścieżką to także <math>p(w) \le d_{i,k}^{(k-1)} + d_{k,j}^{(k-1)}</math> i powyższy wzór zachodzi.
-* Wierzchołek <math>v_k</math> nie leży na ścieżce <math>p</math>. Wtedy zachodzi
+* Jeżeli wierzchołek <math>v_k</math> należy do ścieżki <math>p</math>,  to występuje on dokładnie raz i możemy podzielić <math>p</math> na dwie ścieżki <math>p_1</math> z <math>i</math> do <math>k</math> oraz <math>p_2</math> z <math>k</math> do <math>j</math>. Ścieżki <math>p_1</math> i <math>p_2</math> nie zawierają wierzchołka <math>v_k</math> jako wierzchołka wewnętrznego. Ponieważ są to podścieżki najkrótszej ścieżki, więc same też są najkrótsze. Zachodzi więc dla nich <math>w(p_1) = d_{i,k}^{(k-1)}</math> oraz <math>w(p_2) = d_{k,j}^{(k-1)}</math>. Otrzymujemy więc <math>d_{i,j}^{(k)} = w(p) = w(p_1) + w(p_2) = d_{i,k}^{(k-1)} + d_{k,j}^{(k-1)}</math>. Ponieważ <math>p</math> jest najkrótszą ścieżką to <math>p(w) \le d_{i,j}^{(k-1)}</math> i wzór zachodzi także w tym przypadku.
-<math>d_{i,j}^{(k)} = p(w) = d_{i,j}^{(k-1)}</math>. Ponieważ <math>p</math> jest najkrótszą
-ścieżką to także <math>p(w) \le d_{i,k}^{(k-1)} + d_{k,j}^{(k-1)}</math> i powyższy wzór zachodzi.
-* Jeżeli wierzchołek <math>v_k</math> należy do ścieżki <math>p</math>,  to występuje
-on dokładnie raz i możemy podzielić <math>p</math> na dwie ścieżki
-<math>p_1</math> z <math>i</math> do <math>k</math> oraz
-<math>p_2</math> z <math>k</math> do <math>j</math>. Ścieżki
-<math>p_1</math> i <math>p_2</math> nie zawierają wierzchołka
-<math>v_k</math> jako wierzchołka wewnętrznego. Ponieważ są to
-podścieżki najkrótszej ścieżki, więc same też są najkrótsze.
-Zachodzi więc dla nich <math>w(p_1) = d_{i,k}^{(k-1)}</math> oraz
-<math>w(p_2) = d_{k,j}^{(k-1)}</math>. Otrzymujemy więc
-<math>d_{i,j}^{(k)} = w(p) = w(p_1) + w(p_2) = d_{i,k}^{(k-1)} +
-d_{k,j}^{(k-1)}</math>. Ponieważ <math>p</math> jest najkrótszą ścieżką
-to <math>p(w) \le d_{i,j}^{(k-1)}</math> i wzór zachodzi także w tym przypadku.
 <!-- TODO: może  jakiś rysunek -->
 }}
-Wykorzystując [[#wzor_2| wzór (2)]] możemy skonstruować następujący
+Wykorzystując [[#wzor_2| wzór (2)]] możemy skonstruować następujący algorytm obliczający w czasie <math>O(|V|^3)</math> odległości między wszystkimi parami wierzchołków.
-algorytm obliczający w czasie <math>O(|V|^3)</math> odległości
-między wszystkimi parami wierzchołków.
 {{algorytm|algorytm_Floyda-Warshalla|Algorytm Floyda-Warshalla|3=

Zaawansowane algorytmy i struktury danych/Wykład 6: Różnice pomiędzy wersjami

Wersja z 23:05, 21 lip 2006

Spis treści

Abstrakt

Problem najkrótszych ścieżek między wszystkimi parami wierzchołków

Najkrótsze ścieżki i mnożenie macierzy

Algorytm Floyda-Warshalla

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia