Algorytmy i struktury danych/NP-zupełność: Różnice pomiędzy wersjami

Wersja z 14:40, 27 wrz 2006

Ten wykład poświęcimy klasie bardzo użytecznych problemów, dla których nieznane są algorytmy wielomianowe i nie wiadomo, czy takie algorytmy w ogóle istnieją. Rozpoczniemy od podania algorytmu rozwiązującego następujące zadanie:

Dane: Formuła boolowska $ϕ$ w postaci koniunkcji zmiennych lub ich negacji.

Pytanie: Czy formuła $ϕ$ jest spełnialna, tzn. czy istnieje takie wartościowanie zmiennych, dla którego formuła $ϕ$ przyjmuje wartość 1 (Prawda)?

Przykład: Formuła $x_{1} \land \neg x_{2} \land x_{3} \land x_{1}$ przyjmuje wartość 1 tylko dla wartościowania $x_{1} = 1, x_{2} = 0, x_{3} = 1$ .

Łatwo zauważyć, że formuła $ϕ$ (w postaci z powyższego zadania) jest spełnialna wtedy i tylko wtedy, gdy nie występują w niej jednocześnie zmienna i jej negacja. Ta obserwacja pozwala sformułować bardzo prosty algorytm rozwiązujący nasze zadanie:

1  Dla każdej zmiennej  $x$  z  $ϕ$  sprawdź, czy w  $ϕ$  występują jednocześnie  $x$  i  $\neg x$ . 
2  Jeśli taka zmienna nie istnieje, to  $ϕ$  jest spełnialna, w  
3  przeciwnym razie  $ϕ$  nie jest spełnialna.

Sprawny programista bardzo szybo zaprogramuje powyższy algorytm. Musimy tylko sprecyzować, co oznacza sformułowanie dana jest formuła boolowska. Innymi słowy musimy podać rozsądny sposób kodowania formuł. Jednym z możliwych może być następujący sposób kodowania: Przyjmujemy, że zmienne występujące w formule są ponumerowane kolejno 1,2, $\dots$ Formułę kodujemy jako ciąg liczb poddzielonych średnikami. Pierwszą liczbą w ciągu jest liczba $n$ równa liczbie literałów, czyli wystąpień w formule zmiennych lub ich negacji. W formule z przykładu mamy cztery literały. Po liczbie literałów występuje $n$ liczb ze zbioru ${- n, - (n - 1), \dots, - 1, 1, 2, \dots, n}$ . Jeśli $i$ -tym literałem jest zmienna $x_{k}$ , to za $i$ -tą spośród tych liczb bierzemy $k$ , jeśli zaś $i$ -tym literałem jest $\neg x_{k}$ , to $i$ -tą liczbą będzie $- k$ .

Kodem przykładowej formuły jest $4; 1; - 2; 3; 1$

W każdym rozsądnym kodowaniu przyjmuje się ponadto, że do kodowania liczb stosujemy dowolny zapis o podstawie co najmniej 2 (najczęściej właśnie o podstawie 2). Zauważmy, że przy takim kodowaniu długość kodu formuły wynosi co najwyżej $c n \log n$ , dla pewnej stałej $c$ . Długość kodu danych będziemy nazywali rozmiarem zadania. W przedstawionym powyżej algorytmie literały są porównywane między sobą. Nawet przy bardzo naiwnej implementacji tego algorytmu liczba takich porównań wyniesie co najwyżej $n^{2}$ . Jeśli uwzględnimy, że porównywanie kodów dwóch literałów wymaga $\log n$ porównań bitów, to liczbę wszystkich operacji da się ograniczyć przez $n^{2} \log n$ , a idąc dalej możemy powiedzieć, że liczbę operacji wykonywanych przez algorytm da się ograniczyć przez $r^{k}$ , gdzie $r$ jest rozmiarem danych, a $k$ stałą całkowitą większą od 0. (W naszym przypadku za $k$ można wziąć 3.) W takim przypadku mówimy, że algorytm rozwiązuje zadanie w czasie wielomianowym.

Klasą P nazywamy zbiór tych zadań algorytmicznych, dla których istnieją algorytmy rozwiązujące je w czasie wielomianowym.

Utrudnijmy teraz nasze wyjściowe zadanie.

Powiemy, że formuła boolowska jest w postaci koniunkcyjno-normalnej (z ang. w postaci CNF), jeśli jest koniunkcją formuł (klauzul), z których każda jest alternatywą zmiennych lub ich negacji, być może zdegenerowaną do jednego literału. Formuła jest w postaci $k$ -CNF, jeśli w każdej klauzuli występuje co najwyżej $k$ literałów.

Ćwiczenie 1

Pokaż, że każdą formułę boolowską można przekształcić do równoważnej (ze względu na spełnialność) formuły w postaci 3-CNF o długości tylko wielomianowo większej od długości formuły wyjściowej.

Oto przykład formuły w postaci 2-CNF: $(x_{1} \lor \neg x_{2}) \land (\neg x_{1} \lor x_{3}) \land (\neg x_{2} \lor \neg x_{3})$ .}

Pokazaliśmy, że zadanie spełnialności formuł w postaci 1-CNF można rozwiązać w czasie wielomianowym. To stwierdzenie pozostaje w mocy także dla formuł w postaci 2-CNF.

Ćwiczenie 2

Zaprojektuj algorytm, który rozwiązuje to zadanie w czasie liniowym, tj. w czasie proporcjonalnym do długości formuły.

Sytuacja zmienia się diametralnie, gdy weźmiemy $k \geq 3$ . Nie są znane algorytmy, które rozwiązywałyby to zadanie w czasie wielomianowym, nawet dla wielomianów bardzo dużego stopnia, np. 1000. Najlepsze znane algorytmy wymagają czasu co najmniej $c^{r}$ , gdzie $c$ jest stałą większą od 1, a $r$ jest długością kodu formuły. O takich algorytmach mówimy, że działają w czasie wykładniczym. Z praktycznego punktu widzenia oznacza to, że nawet na współczesnych komputerach takie algorytmy mają szanse dać wynik w rozsądnym czasie tylko dla danych o bardzo małych rozmiarach. Można zaryzykować stwierdzenie, że jeżeli dla zadania algorytmicznego znamy tylko rozwiązania działające w czasie wykładniczym, to zadanie to jest praktycznie algorytmicznie nierozwiązywalne.

Jaką interesującą własność ma jeszcze zadanie spełnialności formuł boolowskich? Gdyby ktoś chciał przekonać nas, że dana formuła jest spełnialna wystarczy, żeby podał odpowiednie wartościowanie zmiennych. Zauważmy, że rozmiar takiego wartościowania nie jest większy od długości formuły. Mając takie wartościowanie, w czasie wielomianowym można obliczyć odpowiadającą mu wartość logiczną formuły. Jeśli tą wartością jest 1 (Prawda), to formuła jest spełnialna. Wartościowanie, dla którego formuła jest spełnialna nazywamy świadectwem spełnialności. Algorytm, który sprawdza spełnialność formuły dla danego wartościowania nazywamy algorytmem weryfikacji. Innymi słowy, algorytmu weryfikacji można użyć do wykazania w czasie wielomianowym, że dana formuła jest spełnialna, jeżeli tylko istnieje i dane jest odpowiednie świadectwo.

Klasą NP nazywamy zbiór tych zadań algorytmicznych, które można weryfikować w czasie wielomianowym. Skróty P i NP. pochodzą z angielskiego, odpowiednio, polynomial time i nondeterministic polynomial time. Niedeterminizm dotyczy pochodzenia świadectwa, ponieważ nie żąda się podania metody jego konstrukcji.

Łatwo zauważyć, że każde zadanie z P należy do NP, ponieważ zadanie takie można zawsze rozwiązać w czasie wielomianowym i do weryfikacji nie potrzebujemy żadnego świadectwa. Zatem $P \subseteq N P$ , a problem P=NP, to problem

Czy $P \neq N P$ ?

Do klasy NP należą tysiące ważnych, praktycznych zadań algorytmicznych, o których nie wiadomo, czy należą do P. Przyjrzyjmy się jeszcze jednemu takiemu zadaniu.

Dane: Nieskierowany graf $G = (V, E)$ oraz liczba naturalna $k$ .

Pytanie: Czy w $G$ istnieje klika rozmiaru $k$ , tzn. czy w $G$ istnieje podgraf $k$ -wierzchołkowy, w którym każda para różnych wierzchołków jest połączona krawędzią?

Problem kliki z pewnością należy do NP. Dla danego $k$ -elementowego podzbioru wierzchołków (świadectwa) można łatwo w czasie wielomianowym, zależnym tylko od rozmiaru grafu, sprawdzić, czy wierzchołki te tworzą klikę. Pokażemy teraz, że gdybyśmy w czasie wielomianowym potrafili rozwiązać zadania spełnialności, to także w czasie wielomianowym można by rozwiązać zadanie kliki. W tym celu zadanie kliki sprowadzimy do zadania formuł boolowskich.

Dla każdego wierzchołka $v \in V$ , wprowadzamy $k$ zmiennych boolowskich $x_{1}^{v}$ , $x_{2}^{v}$ , $\dots$ , $x_{k}^{v}$ . Zmienna $x_{i}^{v}$ intuicyjnie mówi, że wierzchołek $v$ jest $i$ -tym wierzchołkiem w poszukiwanej klice. Skonstruujemy formułę $ϕ$ , która jest koniunkcją trzech formuł $ϕ_{1}, ϕ_{2}$ i $ϕ_{3}$ . Oto intuicyjne znaczenie i formalne definicje tych formuł:

ϕ1= dla każdego i, 1≤i≤k, istnieje co najmniej jeden wierzchołek u∈V, który jest i-tym wierzchołkiem w klice.
- $ϕ_{1} = ⋀_{i = 1}^{k} (\underset{v \in V}{⋁} x_{i}^{v}) .$
ϕ2= dla każdego i, 1≤i≤k, żadne dwa wierzchołki nie są jednocześnie i-tymi wierzchołkami w klice.
- $ϕ_{2} = ⋀_{i = 1}^{k} \underset{u, v \in V, u \neq v}{⋀} (\neg x_{i}^{u} \lor \neg x_{i}^{v}) .$
Dla każdej pary u,v, jeśli u-v nie jest krawędzią w grafie, to u i v nie są jednocześnie w klice.
- $ϕ_{3} = \underset{u -- v \in̸ E}{⋀} \underset{1 \leq i, j \leq k}{⋀} (\neg x_{i}^{u} \lor \neg x_{j}^{v}) .$

Pozostawiamy czytelnikowi wykazanie, że formuła $ϕ$ jest spełnialna wtedy i tylko wtedy, gdy w grafie $G$ istnieje klika rozmiaru $k$ . Łatwo zauważyć, że rozmiar powstałej formuły jest wielomianowo zależny od rozmiaru grafu, a samą formułę można skonstruować w czasie wielomianowym. W tym przypadku mówimy, że zadanie kliki jest redukowalne w czasie wielomianowym do zadania spełnialności. W 1971 roku R. Cook udowodnił, że każde zadanie z NP można w czasie wielomianowym zredukować do zadania spełnialności pewnej formuły boolowskiej. Zadanie, które należy do klasy NP i do którego można zredukować w czasie wielomianowym każde inne zadanie z NP nazywamy zadaniem NP-zupełnym. W tym sensie zadanie spełnialności jest NP-zupełne. Pozostawiamy czytelnikom pokazanie, że zadanie kliki jest też NP-zupełne. W tym celu wystarczy pokazać wielomianową redukcję zadania spełnialności do zadania kliki. Rozwiązanie dowolnego zadania NP-zupełnego w czasie wielomianowym pozwalałoby rozwiązywać w czasie wielomianowym każde zadanie z NP.

Pojęcie klasy P wprowadzili niezależnie Cobham i Edmonds w połowie lat sześćdziesiątych. Edmonds wprowadził też pojęcie klasy NP i jako pierwszy sformułował pytanie, czy P $\neq$ NP. Metoda redukcji pochodzi od Karpa, który przy jej pomocy pokazał, że wiele ważnych zadań kombinatorycznych jest NP-zupełnych.

@@ Linia 17: / Linia 17: @@
 algorytm rozwiązujący nasze zadanie:
-  Dla każdej zmiennej <math>x</math> z <math>\phi</math> sprawdź, czy w <math>\phi</math> występują jednocześnie <math>x</math> i <math>\neg x</math>.
+Dla każdej zmiennej <math>x</math> z <math>\phi</math> sprawdź, czy w <math>\phi</math> występują jednocześnie <math>x</math> i <math>\neg x</math>.
-  Jeśli taka zmienna nie istnieje, to <math>\phi</math> jest spełnialna, w
+Jeśli taka zmienna nie istnieje, to <math>\phi</math> jest spełnialna, w
-  przeciwnym razie <math>\phi</math> nie jest spełnialna.
+przeciwnym razie <math>\phi</math> nie jest spełnialna.
-Sprawny programista bardzo szybo zaprogramuje powyższy algorytm. Musimy tylko sprecyzować, co oznacza sformułowanie ''Dana jest formuła boolowska.'' Innymi słowy musimy podać ''rozsądny'' sposób kodowania formuł. Jednym z możliwych może
+Sprawny programista bardzo szybo zaprogramuje powyższy algorytm. Musimy tylko sprecyzować, co oznacza sformułowanie ''dana jest formuła boolowska.'' Innymi słowy musimy podać ''rozsądny'' sposób kodowania formuł. Jednym z możliwych może
-być następujący sposób kodowania: Przyjmujemy, że zmienne występujące w formule są ponumerowane kolejno 1,2,<math>\ldots</math> Formułę kodujemy jako ciąg  liczb podzielonych średnikami.  Pierwszą liczbą w ciągu jest liczba <math>n</math>
+być następujący sposób kodowania: Przyjmujemy, że zmienne występujące w formule są ponumerowane kolejno 1,2,<math>\ldots</math> Formułę kodujemy jako ciąg  liczb poddzielonych średnikami.  Pierwszą liczbą w ciągu jest liczba <math>n</math>
-równa liczbie ''literałów'', czyli wystąpień w formule zmiennych lub ich negacji. W formule z przykładu mamy cztery literały. Po niej liczbie literałów występuje <math>n</math> liczb ze zbioru <math>\{-n,-(n-1),\ldots,-1,1,2,\ldots, n\}</math>.
+równa liczbie ''literałów'', czyli wystąpień w formule zmiennych lub ich negacji. W formule z przykładu mamy cztery literały. Po liczbie literałów występuje <math>n</math> liczb ze zbioru <math>\{-n,-(n-1),\ldots,-1,1,2,\ldots, n\}</math>.
 Jeśli <math>i</math>-tym literałem jest zmienna <math>x_k</math>, to za <math>i</math>-tą spośród tych
 liczb bierzemy <math>k</math>, jeśli zaś <math>i</math>-tym literałem jest <math>\neg x_k</math>, to
@@ Linia 89: / Linia 89: @@
 długości formuły. Mając takie wartościowanie, w czasie wielomianowym
 można obliczyć odpowiadającą mu wartość logiczną formuły. Jeśli tą
-wartością jest 1 (Prawda), to formuła jest spełnialna.
+wartością jest 1 ('''Prawda'''), to formuła jest spełnialna.
 Wartościowanie, dla którego formuła jest spełnialna nazywamy ''świadectwem'' spełnialności. Algorytm, który sprawdza spełnialność
 formuły dla danego wartościowania nazywamy ''algorytmem weryfikacji''.
@@ Linia 97: / Linia 97: @@
 ''Klasą NP'' nazywamy zbiór tych zadań algorytmicznych, które
-można weryfikować w czasie wielomianowym. Skróty P i NP. pochodzą z angielskiego, odpowiednio, ''polynomial time'' i ''nondeterministic polynomial time''. Niedeterminizm dotyczy pochodzenia świadectwa, ponieważ nie żąda się podania metody jego konstrukcji.
+można weryfikować w czasie wielomianowym. Skróty ''P'' i ''NP''. pochodzą z angielskiego, odpowiednio, ''polynomial time'' i ''nondeterministic polynomial time''. Niedeterminizm dotyczy pochodzenia świadectwa, ponieważ nie żąda się podania metody jego konstrukcji.
-Łatwo zauważyć, że każde zadanie z P należy do
+Łatwo zauważyć, że każde zadanie z ''P'' należy do
-NP, ponieważ zadanie takie można zawsze rozwiązać w czasie
+''NP'', ponieważ zadanie takie można zawsze rozwiązać w czasie
-wielomianowym i do weryfikacji nie potrzebujemy żadnego świadectwa. Zatem P <math>\subseteq</math> NP, a ''problem P=NP'', to
+wielomianowym i do weryfikacji nie potrzebujemy żadnego świadectwa. Zatem <math>P \subseteq NP</math>, a ''problem P=NP'', to
 problem
-Czy P <math>\ne</math> NP?
+Czy <math>P \ne NP</math>?
-Do klasy NP należą tysiące ważnych, praktycznych zadań
+Do klasy ''NP'' należą tysiące ważnych, praktycznych zadań
 algorytmicznych, o których nie wiadomo, czy należą do P.
 Przyjrzyjmy się jeszcze jednemu takiemu zadaniu.
@@ Linia 116: / Linia 116: @@
 wierzchołków jest połączona krawędzią?
-Problem kliki z pewnością należy do NP. Dla danego
+Problem kliki z pewnością należy do ''NP''. Dla danego
 <math>k</math>-elementowego podzbioru wierzchołków  (świadectwa) można łatwo w
 czasie wielomianowym, zależnym tylko od rozmiaru grafu, sprawdzić, czy
@@ Linia 132: / Linia 132: @@
 * <math>\phi_1 =</math> dla każdego <math>i</math>, <math>1\leq i \leq k</math>, istnieje co najmniej jeden wierzchołek <math>u \in V</math>, który jest <math>i</math>-tym wierzchołkiem w klice.
 ** <math>\phi_1 = \bigwedge_{i = 1}^k(\bigvee_{v\in V} x_i^v).</math>
 * <math>\phi_2 =</math> dla każdego <math>i</math>, <math>1\leq i \leq k</math>, żadne dwa wierzchołki nie są jednocześnie <math>i</math>-tymi wierzchołkami w klice.
+** <math> \phi_2 = \bigwedge_{i=1}^k\bigwedge_{u,v\in V, u\ne v} (\neg x_i^u \vee \neg x_i^v).</math>
-** <math> \phi_2 = \bigwedge_{i=1}^k\bigwedge_{u,v\in V, u\ne v}
-(\neg x_i^u \vee \neg x_i^v).</math>
 * Dla każdej pary <math>u, v</math>, jeśli <math>u</math>-<math>v</math> nie jest krawędzią w grafie, to <math>u</math> i <math>v</math> nie są jednocześnie w klice.
+** <math>\phi_3 = \bigwedge_{u\mbox{--}v\not \in E} \bigwedge_{1\leq i,j \leq k} (\neg x_i^u \vee \neg x_j^v).</math>
-** <math>\phi_3 = \bigwedge_{u\mbox{--}v\not \in E} \bigwedge_{1\leq i,j \leq k}
-(\neg x_i^u \vee \neg x_j^v).</math>
 Pozostawiamy czytelnikowi wykazanie, że formuła <math>\phi</math> jest spełnialna
@@ Linia 151: / Linia 144: @@
 wielomianowym. W tym przypadku mówimy, że zadanie kliki jest
 ''redukowalne w czasie wielomianowym'' do zadania spełnialności. W 1971 roku
-R. Cook udowodnił, że każde zadanie z NP można w czasie
+R. Cook udowodnił, że każde zadanie z ''NP'' można w czasie
 wielomianowym zredukować do zadania spełnialności pewnej formuły
-boolowskiej. Zadanie, które należy do klasy NP i do którego można zredukować w czasie wielomianowym każde inne zadanie z NP nazywamy zadaniem ‘’NP-zupełnym’’. W tym sensie zadanie spełnialności jest NP-zupełne.
+boolowskiej. Zadanie, które należy do klasy ''NP'' i do którego można zredukować w czasie wielomianowym każde inne zadanie z ''NP'' nazywamy zadaniem ''NP-zupełnym''. W tym sensie zadanie spełnialności jest ''NP-zupełne''.
 Pozostawiamy czytelnikom pokazanie, że zadanie kliki jest też
-NP-zupełne. W tym celu wystarczy pokazać wielomianową redukcję zadania
+''NP-zupełne''. W tym celu wystarczy pokazać wielomianową redukcję zadania
 spełnialności do zadania kliki. Rozwiązanie dowolnego zadania
-NP-zupełnego w czasie wielomianowym pozwalałoby rozwiązywać w czasie
+''NP-zupełnego'' w czasie wielomianowym pozwalałoby rozwiązywać w czasie
 wielomianowym każde zadanie z NP.

Algorytmy i struktury danych/NP-zupełność: Różnice pomiędzy wersjami

Wersja z 14:40, 27 wrz 2006

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia