Zaawansowane algorytmy i struktury danych/Wykład 6: Różnice pomiędzy wersjami

Wersja z 23:27, 21 lip 2006

Abstrakt

W wykładzie tym zajmiemy się problemem obliczanie odległości w grafie między wszystkimi parami wierzchołków w grafie ważonym skierowanym $G = (V, E)$ . Przedstawimy trzy algorytmu rozwiązujące ten problem:

algorytm wykorzystujący mnożenie macierzy działający w czasie $O (| V |^{3} \log | V |$ ,
algorytm Floyda-Warshalla działający w czasie $O (| V |^{3})$ ,
algorytm Johnsona działający w czasie $O (V |^{2} \log | V | + | V | | E |)$ .

Problem najkrótszych ścieżek między wszystkimi parami wierzchołków

Problem najkrótszych ścieżek między wszystkimi parami wierzchołków można rozwiązać, wykonując $| V |$ razy algorytm dla problemu najkrótszych ścieżek z jednego wierzchołka. Jeżeli w grafie wagi krawędzi są nieujemne to możemy użyć algorytmu Dijkstry. Najszybsza implementacji algorytmu Dijskstry wykorzystująca kopce Fibonacciego działa w czasie $O (| V | \log | V | + | E |)$ , co daje nam algorytm rozwiązujący problem policzenia odległości między wszystkimi parami wierzchołków działający w czasie $O (| V |^{2} \log | V | + | V | | E |)$ .

Jednakże tego rozwiązania nie możemy użyć jeżeli w grafie wagi krawędzi mogą być ujemne. W takim przypadku możemy użyć algorytm Bellmana-Forda. Otrzymamy wtedy algorytm działający w czasie $O (| V |^{2} | E |$ . W rozdziale tym zaprezentujemy bardziej efektywne rozwiązania dla tego problemu.

W rozdziale tym będziemy zakładać, że algorytmy na wejściu otrzymują macierz wag $W$ rozmiaru $n \times n$ reprezentującą wagi krawędzi $n$ -wierzchołkowego grafu $G = (V, E)$ . Dla macierzy tej zachodzi:

w_{i, j} = {\begin{cases} 0, & jeśli i = j, \\ waga krawędzi (i, j), & jeśli i \neq j i (i, j) \in E, \\ \infty, & jeśli i \neq j i (i, j) \neq E . \end{cases}

W problemie najkrótszych ścieżek między wszystkimi parami wierzchołków chcemy wyznaczyć macierz $D$ rozmiaru $n \times n$ taką, że $d_{i, j}$ jest równe odległości $δ (i, j)$ z wierzchołka $i$ do wierzchołka $j$ . Chcemy także wyznaczyć dla każdego wierzchołka $v$ drzewo najkrótszych ścieżek $T_{v}$ ukorzenione w $v$ . Podobnie jak w poprzednim rozdziale drzewo $T_{v}$ możemy kodować dla każdego wierzchołka przy pomocy funkcji poprzedników $π_{v}$ . Ponieważ tutaj interesuje nas wiele drzew to łatwiej będzie nam używać 'macierzy poprzedników $Π$ . Macierz tą definiujemy używając funkcji $π_{v}$ w następujący sposób:

Π_{v, u} = π_{v} (u) .

W pozostałej części tego wykładu zajmiemy się tylko wyznaczaniem macierzy odległości $D$ . Jak to zostało pokazane w Zadaniu 3 do poprzedniego wykładu znając odległości w grafie drzewo najkrótszych ścieżek można wyznaczyć w czasie $O (| E |)$ , a więc $| V |$ drzew możemy wyliczyć w czasie $O (| E | | V |)$ . Czas ten jest mniejszy niż czas działania wszystkich prezentowanych w tym wykładzie algorytmów, więc bez straty ogólności, a zyskując na prostocie prezentacji możemy ograniczyć się tylko do wyznaczenia macierzy odległości $D$ .

Co więcej będziemy zakładać, że w grafie nie ma ujemnych cykli. Ujemne cykle można wykryć w czasie $O (| V | | E |)$ przy użyciu Algorytmu Bellmana-Forda. Zobacz Zadanie 4 do Wykładu 4.

Najkrótsze ścieżki i mnożenie macierzy

Iloczyn odległości i jego właściwości

Załóżmy, że dane mamy dwie macierze wag $C$ oraz $D$ rozmiaru $n \times n$ . Dla macierzy tych definiujemy operację $\times_{\min}$ iloczyn odległości, której wynikiem jest także macierz rozmiaru $n \times n$ , zdefiniowana jako:

$(C \times_{\min} D)_{i, j} = \min_{k = 1, \dots, n} C_{i, k} + D_{k, j} .$ (1)

Wniosek 1

Jeżeli założymy, że

C

i

D

opisują minimalne wagi odpowiednio zbioru ścieżek odpowiednio

Π_{C}

i

Π_{D}

w pewnym grafie

G

, to iloczyn odległości wyznacza minimalne wagi zbioru ścieżek powstałego z konkatenacji ścieżek ze zbioru

Π_{C}

ze ścieżkami zbioru

Π_{D}

.

Pokażemy teraz, że produkt odległości jest operacją łączną.

Lemat 2

Dla macierzy

C

,

D

i

E

rozmiaru

n \times n

zachodzi:

(C \times_{\min} D) \times_{m i n} E = C \times_{\min} (D \times_{m i n} E) .

Dowód

Powyższa równość wynika wprost z wzoru (1) oraz przemienności operacji

\min

.

Co więcej produkt odległości jest przemienny względem dodawania.

Lemat io_przemienny

Dla macierzy

C

,

D

i

E

rozmiaru

n \times n

zachodzi:

C \times_{\min} (D + E) = C \times_{\min} D + C \times_{m i n} E,

oraz

(D + E) \times_{\min} C = D \times_{\min} C + E \times_{m i n} C .

Dowód

Te dwie równości wynikają ponownie z wzoru (1) oraz przemienności operacji

\min

względem dodawania.

Zdefiniujmy macierz $I_{\min}$ rozmiaru $n \times n$ jako:

{(I_{\min})}_{i, j} = {\begin{cases} 0, & jeśli i = j, \\ \infty, & jeśli i \neq j . \end{cases}

Macierz ta jest jedynką dla iloczynu odległości.

Lemat 4

Dla macierzy

C

rozmiaru

n \times n

zachodzi:

I_{\min} \times_{\min} C = C \times_{\min} I_{\min} = C .

Dowód

Mamy

{(I_{\min} \times_{\min} C)}_{i, j} = \min_{k = 1, \dots, n} {(I_{\min})}_{i, k} + C_{k, j} =

ponieważ wszystkie elementy ${(I_{\min})}_{i, k}$ równe są $\infty$ oprócz elementu $i = k$ , to możemy je pominąć w operacji $\min$ i:

= \min_{k = i} {(I_{\min})}_{i, k} + C_{k, j} = I_{i, i} + C_{i, j} = C_{i, j} .

Pomysł algorytmu

Łączność iloczynu odległości ma dla nas bardzo ważne konsekwencję i pozwoli nam na konstrukcję algorytmu obliczania odległości w grafie między wszystkimi parami wierzchołków działającego w czasie $O (n^{3} \log n)$ . Niech $W$ będzie macierzą wag grafu $G = (V, E)$ . Rozważmy macierz $W^{m}$ zdefiniowaną jako:

$W^{m} = {\begin{cases} I_{\min}, & jeżeli m = 0, \\ W \times_{\min} W^{m - 1}, & jeżeli m > 0 . \end{cases}$

Pokażemy teraz, że macierz $W^{m}$ opisuje odległości między wierzchołkami grafu ale tylko dla ścieżek używających mniej niż $m$ krawędzi.

Lemat 5

Element

W_{i, j}^{m}

macierzy

W^{m}

zadaje najmniejszą wagę ścieżki wychodzącej z wierzchołka

i

do wierzchołka

j

spośród ścieżek, które zawierają mniej niż

m

krawędzi, tzn.:

w_{i, j}^{m} = {\begin{cases} \min {w (p) : p ścieżka o długości \leq m z u do v}, & jeżeli istnieje ścieżka o długości \leq m z u do v, \\ \infty & w przeciwnym przypadku. \end{cases}

Dowód

Tezę tą udowodnimy przez indukcję po

m

. Dla danego wierzchołka istnieją dla niech tylko ścieżki długości zero prowadzące do niego samego, a więc dla

m = 0

teza wynika wprost z definicji macierzy

W^{0}

. Załóżmy teraz, że teza zachodzi dla

m > 0

. Mamy wtedy

W^{m + 1} = W \times_{\min} W^{m}

. Zauważmy, że ze definicji macierzy wag

W

opisuje ścieżki używające

\leq 1

krawędź. Korzystając teraz z Wniosku 1 otrzymujemy tezę dla

m + 1

.

Zajmiemy się teraz konstrukcją algorytmu obliczającego najkrótsze ścieżki w grafie. W tym celu będziemy potrzebowali jeszcze udowodnić następujące dwa lematy.

Lemat 6

Jeżeli w grafie

G = (V, E)

, w którym wagi krawędzi zadane są macierzą

W

nie istnieje cykl o ujemnej wadze to:

δ (u, v) = W_{u, v}^{(k)}, dla k \geq n - 1 .

Dowód

Jeżeli w grafie nie istnieje cykl o ujemnej wadze, to wszystkie najkrótsze ścieżki są ścieżkami prostymi, a więc mają długość co najwyżej

n - 1

. Z Lematu 5 wynika więc że odległości tych ścieżek są dobrze wyznaczone w

W^{k}

dla

k \leq n - 1

.

Algorytm

Zauważmy, że iloczyn odległości dwóch macierzy możemy policzyć w czasie $O (| V |^{3})$ wykorzystując następujący algorytm.

Algorytm Mnożenia macierzy odległości

 MNOŻENIE-ODLEGŁOŚCI(C,D)
 1   $E$  macierz rozmiaru  $n \times n$ 
 2  for  $i = 0$  to  $n - 1$  do
 3    for  $j = 0$  to  $n - 1$  do
 4       $e_{i, j} = \infty$ 
 5      for  $k = 0$  to  $n - 1$  do
 6        e_{i,j} = \min(c_{i,k} + d_{k,j}, e_{i,j})
 7  return D'

Ponieważ operacja iloczynu odległości jest łączna to możemy wykorzystać algorytm szybkiego potęgowania i policzyć odległości przy pomocy następującego algorytmu.

Algorytm Algorytm obliczania odległości między wszystkimi parami wierzchołków I

 ODLEGŁÓŚCI-I(W)
 1   $D = W$ ,
 2   $k = 1$ 
 3 while  $n - 1 > k$  do
 4    $D =$ MNOŻENIE-ODLEGŁOŚCI $(D, D)$ 
 5    $m = 2 m$ 
 7  return  $D$

Poprawności tego algorytmu wynika wprost z Lematu 6 ponieważ na zakończenie algorytmu $D = W^{m}$ i $m > n - 1$ .

Algorytm Floyda-Warshalla

W algorytmie Floyda-Warshalla wykorzystamy inną cechę najkrótszych ścieżek niż ta użyta w algorytmie z wykorzystaniem iloczynu odległości. W poprzednim algorytmie konstruowaliśmy coraz dłuższe ścieżki, natomiast tutaj będziemy konstruować ścieżki przechodzące przez coraz większy zbiór wierzchołków. Wierzchołkiem wewnetrznym ścieżki $p = (v_{0}, \dots, v_{l})$ jest każdy wierzchołek na ścieżce $p$ różny od jej początku $v_{0}$ i końca $v_{l}$ .

Niech zbiorem wierzchołków grafu $G$ będzie $V = {1, \dots, n}$ . Niech $d_{i, j}^{(k)}$ dla $k = 0, \dots, n$ oznacza najmniejszą wagę ścieżki z $i$ do $j$ , spośród ścieżek których wierzchołki wewnętrzne należą do zbioru ${v_{1}, \dots, v_{k}$ . Pokażemy następujący rekurencyjny wzór na $D^{(k)}$ .

Lemat 7

Dla

k = 0, \dots, n

zachodzi:

$d_{i, j}^{(k)} = {\begin{cases} w_{i, j}, & jeżeli k = 0, \\ \min (d_{i, j}^{(k - 1)}, d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)}, & jeżeli k \geq 1 . \end{cases}$ (2)

Dowód

Dla

k = 0

poprawność powyższego wzoru wynika bezpośrednio z definicji

D^{0}

. Dla

k > 0

musimy pokazać, że

d_{i, j}^{(k)} = \min (d_{i, j}^{(k - 1)}, d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)}) .

Niech $p$ będzie najkrótszą ścieżką z $i$ do $j$ , której wierzchołki wewnętrzne należą do zbioru ${v_{1}, \dots, v_{k}}$ . Mamy dwa przypadki:

Wierzchołek $v_{k}$ nie leży na ścieżce $p$ . Wtedy zachodzi $d_{i, j}^{(k)} = p (w) = d_{i, j}^{(k - 1)}$ . Ponieważ $p$ jest najkrótszą ścieżką to także $p (w) \leq d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)}$ i powyższy wzór zachodzi.
Jeżeli wierzchołek $v_{k}$ należy do ścieżki $p$ , to występuje on dokładnie raz i możemy podzielić $p$ na dwie ścieżki $p_{1}$ z $i$ do $k$ oraz $p_{2}$ z $k$ do $j$ . Ścieżki $p_{1}$ i $p_{2}$ nie zawierają wierzchołka $v_{k}$ jako wierzchołka wewnętrznego. Ponieważ są to podścieżki najkrótszej ścieżki, więc same też są najkrótsze. Zachodzi więc dla nich $w (p_{1}) = d_{i, k}^{(k - 1)}$ oraz $w (p_{2}) = d_{k, j}^{(k - 1)}$ . Otrzymujemy więc $d_{i, j}^{(k)} = w (p) = w (p_{1}) + w (p_{2}) = d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)}$ . Ponieważ $p$ jest najkrótszą ścieżką to $p (w) \leq d_{i, j}^{(k - 1)}$ i wzór zachodzi także w tym przypadku.

Wykorzystując wzór (2) możemy skonstruować następujący algorytm obliczający w czasie $O (| V |^{3})$ odległości między wszystkimi parami wierzchołków.

Algorytm Algorytm Floyda-Warshalla

 ODLEGŁÓŚCI-II(W)
 1   $D^{(0)} = W$ ,
 2  for  $k = 1$  to  $n$  do
 3    for  $i = 1$  to  $n$  do
 4      for  $j = 1$  to  $n$  do
 5         $d_{i, j}^{(k)} = \min (d_{i, j}^{(k - 1)}, d_{i, k}^{(k - 1)} + d_{k, j}^{(k - 1)})$ 
 6  return  $D^{(n)}$

Algorytm Johnsona

W algorytmie Johnsona wykorzystamy spostrzeżenie uczynione przez nas na początku wykładu, że odległości w grafie w którym wszystkie wagi krawędzi są dodanie można obliczyć korzystając z algorytmu Dijkstry w czasie $O (| V |^{2} \log | V | + | V | | E |)$ . Pokażemy tutaj jak zmienić wagi w grafie tak, aby stały się one dodatnie, przy zachowaniu najkrótszych ścieżek.

Lemat lemat_8

Niech będzie dany graf skierowany

$G (V, E) =$ wraz z funkcją wagową $w : E \to ℛ$ . Niech $h : V \to ℛ$ będzie dowolną funkcją z wierzchołków grafu w liczby rzeczywiste. Zdefiniujmy nową funkcję wagową $w_{h}$ na podstawie $w$ i $h$ :

$w_{h} (u, v) = w (u, v) + h (u) - h (v) .$ (3)

Niech $p = (v_{0}, \dots, v_{k})$ będzie ścieżką z

wierzchołka

v_{0}

do wierzchołka

v_{k}

. Wówczas

@@ Linia 40: / Linia 40: @@
 == Najkrótsze ścieżki i mnożenie macierzy ==
+=== Iloczyn odległości i jego właściwości ===
 Załóżmy, że dane mamy dwie [[#macierz_wag|macierze wag]] <math>C</math> oraz <math>D</math> rozmiaru <math>n\times n</math>.
@@ Linia 87: / Linia 89: @@
 <center><math>
   \left(D  + E \right) \times_{\min} C = D \times_{\min} C +   E  \times_{min} C.
 </math></center> }}
 {{dowod||| Te dwie równości wynikają ponownie z [[#wzór_1|wzoru (1)]] oraz przemienności operacji <math>\min</math> względem dodawania. }}
 Zdefiniujmy macierz <math>I_{\min}</math> rozmiaru <math>n \times n</math> jako:
@@ Linia 122: / Linia 124: @@
 = I_{i,i} + C_{i,j} = C_{i,j}. </math></center> }}
+=== Pomysł algorytmu ===
 Łączność iloczynu odległości ma dla nas bardzo ważne konsekwencję i pozwoli nam na konstrukcję algorytmu obliczania odległości w grafie między wszystkimi parami wierzchołków działającego w czasie <math>O(n^{3}\log n)</math>. Niech <math>W</math> będzie [[#macierz_wag|macierzą wag]] grafu <math>G = (V,E)</math>. Rozważmy macierz <math>W^m</math> zdefiniowaną jako:
@@ Linia 170: / Linia 174: @@
 {{dowod|||3= Jeżeli w grafie nie istnieje cykl o ujemnej wadze, to wszystkie najkrótsze ścieżki są ścieżkami prostymi, a więc mają długość co najwyżej <math>n-1</math>. Z [[potęgi_odległości|Lematu 5]] wynika więc że odległości tych ścieżek są dobrze wyznaczone w <math>W^{k}</math> dla <math>k \le n-1</math>. }}
+=== Algorytm ===
 Zauważmy, że iloczyn odległości dwóch macierzy możemy policzyć w czasie <math>O(|V|^3)</math> wykorzystując następujący
@@ Linia 229: / Linia 235: @@
 Niech <math>p</math> będzie najkrótszą ścieżką z <math>i</math> do <math>j</math>, której wierzchołki wewnętrzne należą do zbioru <math>\{v_1,\ldots,v_k\}</math>. Mamy dwa przypadki:
 * Wierzchołek <math>v_k</math> nie leży na ścieżce <math>p</math>. Wtedy zachodzi <math>d_{i,j}^{(k)} = p(w) = d_{i,j}^{(k-1)}</math>. Ponieważ <math>p</math> jest najkrótszą ścieżką to także <math>p(w) \le d_{i,k}^{(k-1)} + d_{k,j}^{(k-1)}</math> i powyższy wzór zachodzi.
 * Jeżeli wierzchołek <math>v_k</math> należy do ścieżki <math>p</math>,  to występuje on dokładnie raz i możemy podzielić <math>p</math> na dwie ścieżki <math>p_1</math> z <math>i</math> do <math>k</math> oraz <math>p_2</math> z <math>k</math> do <math>j</math>. Ścieżki <math>p_1</math> i <math>p_2</math> nie zawierają wierzchołka <math>v_k</math> jako wierzchołka wewnętrznego. Ponieważ są to podścieżki najkrótszej ścieżki, więc same też są najkrótsze. Zachodzi więc dla nich <math>w(p_1) = d_{i,k}^{(k-1)}</math> oraz <math>w(p_2) = d_{k,j}^{(k-1)}</math>. Otrzymujemy więc <math>d_{i,j}^{(k)} = w(p) = w(p_1) + w(p_2) = d_{i,k}^{(k-1)} + d_{k,j}^{(k-1)}</math>. Ponieważ <math>p</math> jest najkrótszą ścieżką to <math>p(w) \le d_{i,j}^{(k-1)}</math> i wzór zachodzi także w tym przypadku.
@@ Linia 245: / Linia 251: @@
         <math>d_{i,j}^{(k)} = \min(d_{i,j}^{(k-1)}, d_{i,k}^{(k-1)} + d_{k,j}^{(k-1)})</math>
   '''return''' <math>D^{(n)}</math>
+}}
+== Algorytm Johnsona ==
+W algorytmie Johnsona wykorzystamy spostrzeżenie uczynione przez nas
+na początku wykładu, że  odległości w grafie w którym wszystkie wagi
+krawędzi są dodanie można obliczyć korzystając z
+[[algorytm_dijkstry|algorytmu Dijkstry]] w czasie <math>O(|V|^2\log
+|V| + |V||E|)</math>. Pokażemy tutaj jak zmienić wagi w grafie tak,
+aby stały się one dodatnie, przy zachowaniu najkrótszych ścieżek.
+{{lemat|lemat_8|8|3= Niech będzie dany graf skierowany
+<math>G(V,E)=</math> wraz z funkcją wagową <math>w:E \to
+\mathcal{R}</math>. Niech  <math>h:V \to \mathcal{R}</math> będzie
+dowolną funkcją z wierzchołków grafu w liczby rzeczywiste.
+Zdefiniujmy nową funkcję wagową <math>w_h</math>na podstawie
+<math>w</math> i <math>h</math>:
+{{wzor|wzor_3|3|3=
+<math>
+w_h(u,v) = w(u,v) + h(u) - h(v).
+</math>
+}}
+Niech <math>p = (v_0, \ldots, v_k)</math> będzie ścieżką z
+wierzchołka <math>v_0</math> do wierzchołka <math>v_k</math>. Wówczas
 }}

Zaawansowane algorytmy i struktury danych/Wykład 6: Różnice pomiędzy wersjami

Wersja z 23:27, 21 lip 2006

Spis treści

Abstrakt

Problem najkrótszych ścieżek między wszystkimi parami wierzchołków

Najkrótsze ścieżki i mnożenie macierzy

Iloczyn odległości i jego właściwości

Pomysł algorytmu

Algorytm

Algorytm Floyda-Warshalla

Algorytm Johnsona

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia