Złożoność obliczeniowa/Wykałd 5: Problemy NP-zupełne: Różnice pomiędzy wersjami

Wersja z 17:44, 31 lip 2006

Wstęp

Jak czytelnikowi wiadomo, w aktualnym stanie wiedzy NP-zupełność jest podstawowym narzędziem do badania probelu algorytmicznego pod kątem jego trudności obliczeniowej. Na tym wykładzie dla wielu znanych klasycznych problemów z teorii grafów, kombinatoryki, logiki i innych podajemy definicje ich decyzyjnych wersji i wykazujemy ich NP-zupełność. Z problematyką ta spotkaliśmy się już na kursie Algorytmy i struktury danych. Tutaj rozbudowujemy te wiadomości, czynimy je bardziej formalnymi posługując się modelem maszyny Turinga i redukcją logarytmiczną. Na przedstawionych przykładach omawiamy również techniki dowodzenia NP-zupełności. Następny wykład pokazuje wykorzystanie tych technik do analizy złożoności problemu i jego zawężeń.

O problemie SAT

Aby wykazać, że dany problem $Q$ z klasy NP jest NP-zupełny, zgodnie z własnościami redukcji logarytmicznej (przechodniość) wystarcza pokazać, dla dowolnego problemu $Q^{'} \in N P C$ , że $Q^{'}$ redukuje się do $Q$ . Innymi słowy, proces dowodzenia że dany problem $Q$ jest w NPC składa sie z nastepujących kroków:

dowieść że $Q$ należy do NP

wybrać znany problem NP-zupełny $Q^{'}$ i skonstruować redukcję z $Q^{'}$ do $Q$ .

Przypomnijemy, że redukcja z problemu A do B dowodzi, że B jest niełatwiejszy niż A. Zatem dla konstrukcji takiej redukcji łatwiej jest, gdy (są to rozważania czysto intuicyjne):

problem A nie jest skomplikowany, tzn. instancje tego problemu

wykazują pewną regularność, łatwą do "opisu" lub "zmierzenia"

problem B dopuszcza konstrukcje różnorodnych instancji, jest "bogaty

strukturalnie"

Stąd dla wypracowania sobie "warsztatu" dla konstruowania dowodów NP-zupełności warto rozpocząć od dowiedzenia tej własności dla kilku nieskomplikowanych (pod wzgledem opisu struktury) problemów. W rzeczywistości, w literaturze dotyczącej tych zagadnień, można wyodrębnić niewielką grupę klasycznych w tym sensie problemów, które najczęściej wystepują jako lewa strona redukcji w dowodach NP-zupełnosci. Poniżej definiujemy lub przypominamy grupe takich problemów, dość różnorodnego pochodzenia i zastosowania, i dowodzimy ich NP-zupełności.

Najpierw 3SAT

Zaczynamy od sytuacji, w której jedynym znanym problemem NP-zupełnym (a więc możliwą lewą stroną redukcji) jest problem SAT. Jest on dość niewygodny jako problem źródłowy, redukcja z SAT do innego problemu na ogół wymaga skomplikowanego opisu. Okazuje się (wykazał to już Cook w swojej fundamentalnej pracy o NP-zupełności), że podproblem problemu SAT, w którym wymagamy aby każda klauzula zawierała nie więcej niz 3 literały jest sam w sobie NP-zupełny, a dowód tego faktu jest dość łatwy.

Twierdzenie

Problem 3SAT jest NP-zupełny.

Dowód

Problem 3SAT, jako podproblem problemu w klasie NP, sam należy do NP, zatem pierwsza część dowodu jest za nami.

Konstruujemy redukcję z problemu SAT do 3SAT. Na wejściu mamy formułe $ϕ = C_{1} \land \dots \land C_{m}$ nad zmiennymi $x_{1}, \dots, x_{n}$ . Każdą z klauzul $C_{j}$ przekształcamy osobno. Bez straty ogólności załóżmy, że $C_{j} = x_{1} \lor \dots \lor x_{k}$ , gdzie $x_{i}, i = 1, \dots, k$ są parami różne. Jeśli $k \leq 3$ to kładziemy $D_{j} = C_{j}$ .

Niech $k > 3$ . Dodajemy $k - 3$ nowych zmiennych $y_{2}, \dots, y_{k - 2}$ , i zastepujemy $C_{j}$ przez

D_{j} = (x_{1} \lor x_{2} \lor y_{2}) \land (\neg y_{2} \lor x_{3} \lor y_{3}) \land (\neg y_{3} \lor x_{4} \lor y_{4}) \land . . . \land (\neg y_{k - 2} \lor x_{k - 1} \lor x_{k})

Nietrudno spostrzec, że jeśli $C_{j}$ jest spełniona przez pewne wartościowanie zmiennych $x_{1}, . . ., x_{k}$ , to da się tak dobrać wartości dla zmiennych $y_{2}, . . ., y_{k - 2}$ , aby spełnione były wszystkie klauzule w $D_{j}$ . Na odwrót, jeśli $D_{j}$ jest spełniona dla pewnego wartościowania zmiennych $x_{1}, . . ., x_{k}, y_{2}, . . ., y_{k - 2}$ , to łatwo wydedukować, że $x_{i} = 1$ dla pewnego $1 \leq i \leq k$ . Mianowicie, jeśli $x_{1} = x_{2} = 0$ , to z pierwszej klauzuli w $D_{j}$ wynika że $y_{2} = 1$ . Ale wtedy z drugiej klauzuli mamy $x_{3} = 1$ lub $y_{3} = 1$ . W pierwszym przypadku rozumowanie jest zakończone, w drugim przenosimy rozumowanie na trzecią klauzulę i tak dalej.

Zatem, po przekształceniu kolejno wszystkich alternatyw powstaje równoważna formuła o co najwyżej trójskładnikowych alternatywach. Pozostaje wykazać, że przekształcenie to realizowalne jest w pamięci logarytmicznej. Zauważmy jednak, że aby wypisać formułę wynikową, MT potrzebuje pamięć roboczą tylko na licznik bieżącej alternatywy $C_{j}$ oraz licznik wygenerowanych do tej pory nowych zmiennych.

Uwaga 1

Zapewne zauważyłaś(-łeś), że w wielu podręcznikach do algorytmiki również mówi się o NP-zupełności. Na ogół korzysta się wtedy z redukcji wielomianowej. Złożoność czasowa jest łatwiejsza do analizy w przypadku modelu obliczeń takiego jak (uproszczony) język programowania wysokiego poziomu. Analiza złożoności pamięciowej (i to tylko z uwzględnieniem pamięci roboczej) może być trudniejsza.

Redukcja logarytmiczna jest bardziej uniwersalna i dlatego stosujemy ją w teorii złożoności.

Uwaga 2

W literaturze przyjmuje sie również nieco inną definicję problemu 3SAT, w której zakłada sie dodatkowo, że w każdej klauzuli występują dokładnie 3 parami różne literały. Dowód NP-zupełności tej wersji otrzymujemy przez uzupełnienie dowodu powyższego w następujący sposób:

Załóżmy że $k = 2$ . Wprowadzamy nową zmienną $y$ i kładziemy $D_{j} = (x_{1} \lor x_{2} \lor y) \land (x_{1} \lor x_{2} \lor \neg y)$ . Jeśli istnieje wartościowanie spełniające formułę $ϕ$ , to w tym wartościowaniu formuła $ψ$ powstała z $ϕ$ przez zastąpienie klauzuli $C_{j}$ formułą $D_{j}$ jest również spełniona. I na odwrót, jeśli pewne wartościowanie spełnia formułę $ψ$ , to aby $D_{j}$ było prawdziwe $x_{1}$ lub $x_{2}$ musi mieć wartość 1, a zatem to samo wartościowanie (bez zmiennej $y$ ) spełnia formułę $ϕ$ .

Analogicznie, jesli $C_{j}$ składa się tylko z jednego literału, to przekształcamy go w koniunkcję czterech trójskładnikowych klauzul, z dodanymi dwiema nowymi zmiennymi.

Z tego spostrzeżenia będziemy korzystać w następnych dowodach NP-zupełności.

Odnotujmy w tym miejscu, że dalsze zawężenie problemu polegające na dopuszczeniu klauzul o co najwyżej dwóch literałach, 2SAT, jest problemem obliczeniowo łatwym. Dowód tego faktu odkładamy do nastepnej lekcji.

MAXSAT

Warto wspomnieć o innych NP-zupełnych wersjach problemu spełnialnosci. Na przykład, możemy zapytać o istnienie wartościowania spełniającego co najmniej zadaną liczbe $k$ klauzul (a niekoniecznie wszystkie). Problem ten nosi nazwę MAXSAT, i jest ogólniejszy niż SAT (a zatem jest również w NPC). Jego trudność przejawia sie również w tym, że zawężenie do klauzul długości dwa w przeciwieństwie do SAT, pozostawia ten problem trudnym.

Twierdzenie [MAX2SAT]

Problem MAX2SAT jest NP-zupełny.

Dowód

Konstruujemy redukcję z problemu 3SAT. Na wejściu mamy formułę $ϕ = C_{1} \lor . . . \lor C_{m}$ . Każdą klauzulę $C_{j} = a \lor b \lor c$ przekształcamy w zbiór 10 klauzul, dla wygody rozważań podzielonych na trzy grupy, następujacej postaci:

$(a) (b) (c) (z)$

$(\neg a \lor \neg b) (\neg b \lor \neg c) (\neg a \lor \neg c)$

$(a \lor \neg z) (b \lor \neg z) (c \lor \neg z)$

Tych 10 klauzul ma następujace własności:

Jeśli $a = b = c = 0$ , to niezależnie od wartości zmiennej $z$ co najwyżej 6 klauzul jest spełnionych.

Jeśli któryś z literałów $a$ , $b$ lub $c$ jest równy 1, to

można dobrać wartość $z$ tak, że 7 klauzul jest spełnionych. Można sie o tym przekonać analizując wszystkie przypadki. Na przykład, jeśli $a = 1$ , $b = c = 0$ , to kładziemy $z = 0$ ; jeśli $a = b = 1$ , $c = 0$ , to również kładziemy $z = 0$ , jeśli natomiast $a = b = c = 1$ to 7 klauzul jest spełnionych gdy $z = 1$ .

Pozostaje zdefiniować żądaną liczbę spełnionych klauzul w formule wynikowej na $7 m$ . Z wymienionych własności wynika, że formuła wynikowa posiada wartościowanie spełniające dokładnie $7 m$ alternatyw wtedy i tylko wtedy gdy formuła wejściowa jest spełnialna.

Maszyna Turinga realizująca redukcję potrzebuje pamieci roboczej jedynie na liczniki, zatem działa w pamięci logarytmicznej.

NP-zupełne problemy grafowe

Pokrycie wierzchołkowe

Pierwszym z serii problemów grafowych, dla których udowodnimy NP-zupełność, jest problem pokrycia wierzchołkowego. Dla grafu nieskierowanego $G = (V, E)$ mówimy, że podzbiór $V^{'} \subseteq V$ jest pokryciem wierzchołkowym, jeśli każda krawędź w G ma co najmniej jeden z końców w zbiorze $V^{'}$ .

Problem NODE COVER

Wejście: Graf nieskierowany $G = (V, E)$ , liczba całkowita $k \leq | V |$

Wyjście: TAK jeśli G ma pokrycie wierzchołkowe o liczności k, NIE w przeciwnym przypadku.

Twierdzenie [Problem NODE COVER]

Problem NODE COVER jest NP-zupełny.

Dowód

Dla podanego podzbioru zbioru wierzchołków bardzo łatwo sprawdzić czy stanowi on pokrycie, zatem $N O D E C O V E R \in N P$ .

Redukujemy problem 3SAT do NODE COVER. Na wejściu mamy formułę $ϕ = C_{1} \land . . . \land C_{m}$ , i zgodnie z uwagą poczyniona przy dowodzie NP-zupełności 3SAT zakładamy, że każda alternatywa $C_{j}$ zawiera dokładnie 3 różne literały. Konstruujemy graf następujący: każde wystąpienie literału jest wierzchołkiem grafu, wystąpienia wewnątrz jednej klauzuli tworzą trójkąt. Ponadto, dla każdej pary literałów przeciwnych wystepujących w różnych klauzulach odpowiadające im wierzchołki łączymy krawędzią. Na koniec, kładziemy $k = 2 m$ .

rys_5_1.jpg(Redukcja 3SAT do NODE COVER)

Teraz należy wykazać, że formuła wejsciowa jest spełnialna wtedy i tylko wtedy gdy wygenerowany graf ma pokrycie wierzchołkowe o liczności $k$ . Z ograniczenia na wielkość pokrycia wynika, że z każdego trójkąta do pokrycia muszą być wybrane dokładnie dwa wierzchołki. Jeśli formuła jest spełnialna, to w każdym trójkącie można wyróżnić jeden wierzchołek $v$ odpowiadający literałowi równemu 1. Do pokrycia wybieramy pozostałe dwa wierzchołki. Pokrywają one wszystkie krawędzie trójkątów oraz wychodzące z tych wierzchołków krawędzie między trójkątami. Każda pozostała krawędź, wychodząca z wierzchołka $v$ , prowadzi do pewnego wierzchołka $w$ odpowiadającego zaprzeczeniu literału wierzchołka $v$ , zatem literał wierzchołka $w$ ma wartość zero i $w$ jest wybrane do pokrycia w trójkącie w którym występuje. Zatem krawędź $(v, w)$ też jest pokryta.

W drugą stronę, załóżmy, że dane jest pokrycie. W każdym trójkącie, dla wierzchołka który nie jest w pokryciu, ustawiamy wartość odpowiedniej zmiennej tak aby literał w tym wierzchołku był równy 1. Należy zauważyć że takie wartościowanie jest niesprzeczne. Wynika to stąd, że przeciwne literały zawsze odpowiadają dwóm wierzchołkom z różnych trójkątów połączonych krawędzią. Co najmniej jeden z tych wierzchołków jest w pokryciu, a więc odpowiadający mu literał nie bierze udziału w obliczaniu wartościowania.

Zauważmy, że tak jak i poprzednio, do realizacji redukcji wystarczy pamięć robocza rzędu $n$ , co kończy dowód.

Cykl i ścieżka Hamiltona

Problem HAMILTONIAN CYCLE

Wejście: Graf nieskierowany $G = (V, E)$

Wyjście: TAK jeśli $G$ ma cykl Hamiltona, czyli cykl przchodzący przez każdy wierzchołek dokładnie raz, NIE w przeciwnym przypadku.

Twierdzenie [Cykl Hamiltona]

CYKL HAMILTONA jest NP-zupełny.

Dowód

Przynależnośc do klasy NP jest oczywista. Konstruujemy redukcje z problemu NODE COVER. na wejściu mamy nieskierowany graf $G = (V, E)$ oraz liczbę całkowitą $k \leq | V |$ . Oznaczmy graf wynikowy jako $G^{'} = (V^{'}, E^{'})$ .

Redukcja przeprowadzona jest techniką gadżetu (w literaturze angielskiej uzywa sie również terminu widget). Gadżet to fragment struktury wynikowej, o określonych własnościach. W naszym przypadku pierwszym krokiem redukcji jest wygenerowanie, dla każdej krawędzi $(u, v) \in E$ gadżetu $G_{u v} = (V_{u v}, E_{u v})$ będącego grafem przedstawionym na rysunku 5.2.

rys_5_2.jpg

Jedynie narożne wierzchołki grafu $G_{u v}$ będą połączone z wierzchołkami spoza $G_{u v}$ . Stąd wynika, że jeśli $G^{'}$ ma cykl Hamiltona, to musi on przechodzić przez $G_{u v}$ tylko na jeden z przedstawionych na rysunku 5.3 sposobów. Konstrukcja gadżetu uniemożliwia inne usytuowanie cyklu Hamiltona względem $G_{u v}$ .

rys_5_3.jpg

Drugi krok redukcji to wygenerowanie krawędzi w $G^{'}$ łączących gadżety w tak zwane ścieżki. Dla każdego wierzchołka $v \in V$ najpierw porządkujemy dowolnie wszystkie jego sąsiednie wierzchołki, oznaczmy je przez $u_{v}^{1}, . . ., u_{v}^{d (v)}$ , gdzie $d (v)$ jest stopniem wierzchołka $v$ . Konstrukcja ścieżki odpowiadającej wierzchołkowi $v$ , łączącej wszystkie gadżety odpowiadające krawędziom incydentnym z $v$ , dokonuje sie przez dołączenie do $G^{'}$ zbioru krawędzi postaci

E_{v} = {([v, u_{v}^{i}, 6], [v, u_{v}^{i + 1}, 1]), i = 1, \dots, d (v) - 1}

Ostatni krok to dodanie wierzchołków-selektorów $s_{1}, \dots, s_{k}$ , i połączenie krawędzią każdego selektora z początkiem i końcem ścieżki odpowiadającej wierzchołkowi $v$ , dla każdego $v$ .

E_{S} = {(s_{i}, [v, u_{v}^{1}, 1]) : v \in V, 1 \leq i \leq k} {(s_{i}, [v, u_{v}^{d} (v), 6]) : v \in V, 1 \leq i \leq k

Kładziemy zatem

V^{'} = ⋃_{(u v) \in E} V_{u v} \cup {s_{j}, 1 \leq j \leq k}

E^{'} = ⋃_{(u v) \in E} E_{u v} \cup ⋃_{v \in V} E_{v} \cup E_{S}

rys_5_4.jpg

Na rys. 5.4 pokazano graf o 4 wierzchołkach i rezultat redukcji. Zacieniowane zostały dwa wierzchołki grafu które tworzą pokrycie. Pogrubione krawędzie tworza cykl Hamiltona. Zaczynając od selektora $s_{1}$ przechodzimy do początku ścieżki odpowiadającej pierwszemu wierzchołkowi z pokrycia, czyli $x$ . Po przejściu gadżetów na tej ścieżce wracamy do $s_{2}$ , a stąd do początku ścieżki odpowiadajacej drugiemu węzłowi z pokrycia, $y$ .

Wykażemy, że $G^{'}$ ma cykl Hamiltona wtedy i tylko wtedy gdy G ma pokrycie o liczności $k$ .

Załóżmy, że $G^{'}$ ma cykl Hamiltona i prześledźmy jego bieg zaczynając od $s_{1}$ (w dowolnym kierunku). Następny wierzchołek na cyklu musi być początkiem (lub końcem - załóżmy to pierwsze) ścieżki gadżetów dla pewnego wierzchołka $v_{1} \in V$ . Dodajemy $v_{1}$ do generowanego pokrycia. Zgodnie z własnością gadżetu, cykl przebiega całą ścieżkę i na końcu przechodzi do innego selektora, załóżmy że jest to $s_{2}$ . Z $s_{2}$ musi przejść na początek lub koniec innej ścieżki, odpowiadającej wierzchołkowi $v_{2}$ . Dodajemy $v_{2}$ do pokrycia i kontynuujemy. Z ostatniej, $k$ -tej ścieżki, cykl musi wrócić do $s_{1}$ . Ponieważ cykl Hamiltona przeszedł przez wszystkie wierzchołki $G^{'}$ , a więc przez wszystkie gadżety $G_{u v}$ , zatem wybrane w ten sposób wierzchołki $v_{1}, . . ., v_{k}$ stanowią pokrycie.

Teraz załóżmy, że $G$ ma pokrycie ${v_{1}, . . ., v_{k}}$ . Konstruujemy cykl Hamiltona w $G^{'}$ . Zaczynamy od selektora $s_{1}$ i przechodzimy na początek ścieżki związanej z $v_{1}$ , czyli do węzła $[v_{1}, u_{v_{1}}^{1}, 1]$ . Przechodzimy przez kolejne gadżety aż do końca ścieżki. Dla danego gadżetu $G_{v_{1} u_{v_{1}}^{i}}$ musimy podjąć decyzję czy przechodzimy przez wszystkie wierzchołki czy tylko przez połowę (jedną "ścianę"). Decyzja zależy od tego czy $u_{v_{1}}^{i}$ również należy do pokrycia. Jeśli nie, to przechodzimy cały gadżet, jeśli tak, to drugą "ścianę" pozostawiamy, aby później, gdy trawersowana będzie ścieżka dla $u_{v_{1}}^{i}$ również można było przejść przez $G_{v_{1} u_{v_{1}}^{i}}$ . Z ostatniego węzła na ścieżce przechodzimy do selektora $s_{2}$ i powtarzamy konstrukcję. Z ostatniego węzła na $k$ -tej ścieżce wracamy do $s_{1}$ , zamykając w ten sposób cykl Hamiltona.

Ostatnim krokiem dowodu jest stwierdzenie, że konstrukcję grafu $G^{'}$ można wykonać posługując się pamięcią roboczą rozmiaru logarytmicznego. Wynika to, jak i w poprzednich dowodach, z tego że maszynie wystarcza pamięć na licznik położenia w wejściowym grafie oraz licznik numeru (nazwy) generowanego wierzchołka i krawędzi grafu $G^{'}$ .

Bardzo podobny w sformułowaniu jest problem ścieżki Hamiltona (HAMILTONIAN PATH). Na weściu jest graf nieskierowany, na wyjściu jest TAK jeśli w grafie istnieje ścieżka przechodząca przez każdy wierzchołek dokładnie raz. Oczywiste jest że istnienie cyklu Hamiltona implikuje istnienie ścieżki Hamiltona, jednak są to różne problemy, i NP-zupełnośc tego drugiwgo wymaga osobnego dowodu. Tym niemniej, na przykładzie tych problemów można pokazać pewne techniki dowodzenia NP-zupełności w takich przypadkach. Jedną z nich jest modyfikacja znanego już dowodu NP-zupełności problemu podobnego, drugą zaś redukcja z problemu podobnego.

Twierdzenie [HAMILTONIAN PATH]

Problem HAMILTONIAN PATH jest NP-zupełny.

Ćwiczenie

{{{3}}}

Ćwiczenie

{{{3}}}

Problemy na zbiorach i liczbach

Podsumowanie technik dowodów NP-zupełności

Najprostsze redukcje otrzymujemy metodą zacieśnienia. Przez narzucenie dodatkowych zależności w instancjach problemu, o którym dowodzimy NP-zupełności, otrzymujemy instancje znanego problemu NP-zupełnego. W ten sposób wykazujemy, że nasz problem jest uogólnieniem problemu znanego, a więc jest niełatwiejszy. Przykłady takich redukcji zastosowaliśmy do problemów: EXACT COVER BY 3SETS, SET COVERING, KNAPSACK.

Pozostałe dowody można by zaliczyć do metody gadżetów. Fragmenty instancji problemu wejściowego przekształca się we fragmenty instancji probelmu wynikowego (gadżety), i wiąże się zależnościami (innymi gadżetami), których zachodzenie w problemie wynikowym ma mieć ścisłe odzwierciedlenie w spełnieniu wymagań problemu źródłowego. Czasem gadżet jest trywialny (np. w redukcji SUBSET SUM do PARTITION jest to ta sama waga elementu), kiedy indziej dość naturalny i nietrudny (SAT DO 3SAT), czasem bardzo pomysłowy (VERTEX COVER do HAMILTONIAN CYCLE, 3SAT do TRIPARTITE MATCHING, 3SAT do MAX2SAT).

Ćwiczenia końcowe

ż, że następujący problem izomorfizmu podgrafu jest NP-zupełny:

Problem SUBGRAPH ISOMORPHISM
Wejście: $G_{1} = (V_{1}, E_{1})$ , $G_{2} = (V_{2}, E_{2})$ - grafy nieskierowane
Wyjście: TAK jeśli $G_{1}$ ma podgraf izomorficzny z $G_{2}$ , NIE w przeciwnym przypadku.

Wskazówka

Rozwiązanie

Jest to proste ugólnienie problemu CLIQUE: szczególnym przypadkiem podgrafu o który pytamy w problemie SUBGRAPH ISOMORPHISM jest klika o liczności $k$ o która pytamy w problemie CLIQUE.

tym ćwiczeniu pytamy o trudność obliczeniową problemu pochodzącego z teorii szergowania. Wykaż, że NP-zupełny jest następujący problem:

Problem SEQUENCING WITHIN INTERVALS
Wejście: Zbiór zadań $T$ , dla każdego zadania $t$ trzy liczby całkowite: długość zadania $l (t) > 0$ , moment pojawienia się $r (t) \geq 0$ ,oraz ograniczenie czasowe $d (t) > 0$
Wyjście: TAK, jeśli wszystkie zadania można wykonać na jednym procesorze, bez przerywania, spełniając ograniczenia czasowe, NIE w przeciwnym przypadku. Formalnie, pytamy o funkcję alokacji $A$ przydzielająca każdemu zadaniu $t$ czas rozpoczęcia wykonywania $A (t)$ taki, że $[A (t), A (t) + l (t)] \subseteq [r (t), d (t)]$ oraz $[A (t), A (t) + l (t)) \cap [A (t^{'}), A (t^{'}) + l (t^{'})) = \emptyset$ , dla każdego zadania $t^{'} \neq t$ .

Wskazówka

Rozwiązanie

Redukcja z problemu SUBSET SUM za pomocą bardzo prostych gadżetów. Niech $s_{1}, \dots, s_{n}$ oraz $B$ będą odpowiednio wagami elementów oraz żądana sumą podzbioru elementów. Niech $D = \sum_{i = 1}^{n} s_{i}$ . Konstruujemy $n + 1$ zadań, przy czym dla $i = 1, \dots, n$ zadanie $t_{i}$ ma długość $l_{i} = s_{i}$ , czas gotowości $r_{i} = 0$ oraz granicę $d_{i} = D + 1$ . Zadanie $t_{n +})$ jest "wymuszaczem podziału", o parametrach $l_{i} = 1$ , $r_{i} = B$ , $d_{i} = B + 1$ .

Zadania $s_{1}, \dots, s_{n}$ mają pozorną swobodę wykonywania sie w dowolnym miejscu osi czasu, zauważmy jednak że każde ulokowanie wszystkich zadań nie zostawia żadnej luki na osi. Dla wymuszacza jest tylko jedna możliwa wartość alokacji, $B$ . Takie położenie dzieli cały przedział, w którym moga byc wykonywane zadania, na dwa podprzedziały, rozdzielone wymuszaczem. Jeden z tych przedziałów ma długość $B$ , zatem ulokowanie zadań na osi, zgodne z warunkami zadania, jest możliwe wtedy i tylko wtedy gdy istnieje podzbiór zbioru elementów w instancji problemu SUBSET SUM, ktych wagi dają w sumie $B$ .

section

Problem cięcia w grafie zdefiniowany jest następująco:

Problem FEEDBACK VERTEX SET
Wejście: Graf skierowany $G = (V, E)$ , liczba całkowita $k, 0 < k \geq | V |$ .
Wyjście: TAK jeśli istnieje w $G$ podzbiór $k$ -wierzchołkowy, taki że graf pozostały po usunięciu tego podzbioru jest acykliczny.
Udowodnij, że FEEDBACK VERTEX SET jest NP-zupełny.

Wskazówka

Rozwiązanie

Na wejściu mamy graf nieskierowany $G = (V, E)$ i liczbę $k$ . Zamieniamy ten graf na graf skierowany $G^{'}$ , z tym samym zbiorem wierzchołków, zastępując każdą krawędź nieskierowaną $(u, v)$ przez dwie krawędzie skierowane: $(u, v)$ oraz $(v, u)$ . Liczba $k$ jest taka sama dla obu instancji.

Nietrudno zauważyć, że każde pokrycie wierzchołkowe w $G$ jest zbiorem rozcinającym wszystkie cykle w $G^{'}$ i na odwrót.

section

Kolorowanie (wierzchołkowe) grafu jest klasycznym problemem optymalizacyjnym w teorii grafów. Przypomnijmy, że chodzi o przypisanie wierzchołkom grafu nieskierowanego kolorów tak, aby końce każdej krawędzi miały różne kolory, a liczba kolorów była możliwie najmniejsza.

Okazuje sie że nawet jeśli ustalimy żądaną liczbe kolorów na 3, to problem jest NP-zupełny. Dowód tego faktu nie jest natychmiastowy.

Problem 3COLORING
Wejście: Graf nieskierowany $G = (V, E)$ .
Wyjście: TAK, jeśli istnieje funkcja $c : V \to {0, 1, 2}$ taka, że dla każdej krawędzi $(u, v) \in E$ , $c (u) \neq c (v)$ .
Za pomocą redukcji z problemu 3SAT udowodnij, że problem trójkolorowania jest NP-zupełny.

Wskazówka

Rozwiązanie

Gadżet ma następujące własności:

jeśli wierzchołkom $u, v, z$ przypisano kolory tak, że co najmniej

jeden z nich ma kolor 1, to istnieje uzupełnienie trójkolorowania pozostałych wierzchołków takie, że $c (z) = 1$

jeśli w danym trójkolorowaniu $c (u) = c (v) = c (z) = 0$ , to

również $c (z) = 0$ .

Redukcję przeprowadzamy następująco:

generujemy wierzchołki $s, t, z$ i trójkat oparty na nich

Dla każdej zmiennej $x$ występującej w instancji 3SAT definiujemy

wierzchołki $x, \neg x$ oraz trójkąt oparty na $x, \neg x$ oraz $t$

dla każdej klauzuli $C_{j} = (u \lor v \lor w)$ definiujemy kopię gadżetu,

przy czym wierzchołki $u, v, w$ to już wygenerowane w punkcie 2 wierzchołki literałów o tych samych nazwach, wierzchołek $z$ został wygenerowany w kroku 1, natomiast pozostałe wierzchołki są nowe, unikalne dla każdej klauzuli

{1cm}

[width=12cm]{rys_5_7.jpg}

{1cm}

Wykazemy, że formuła źródłowa ma spełniające wartościowanie wtedy i tylko wtedy gdy wygenerowany graf można pokolorować trzema kolorami.

Jeśli istnieje wartościowanie spełniające formułę, to

kładziemy $c (s) = 0$ , $c (z) = 1$ $c (t) = 2$

kolorujemy każdy z wierzchołków $x_{i}, \neg x_{i}$ jego wartością

logiczną, 0 lub 1

uzupełniamy kolory 0, 1, i 2 w gadżetach -- można to zrobić gdyż

zadane wartościowanie spełnia formułę, a więc na wejściu do każdego gadżetu jest co najmniej jeden wierzchołek koloru 1

Jeśli zadane jest trójkolorowanie grafu, to obliczamy wartościowanie spełniające formułę następująco:

kolory wierzchołków $s, t, z$ są różne, więc umawiamy się, że $c (s) = 0, c (t) = 2, c (z) = 1$

dla każdej zmiennej $x_{i}$ kładziemy wartość tej zmiennej równą

$c (x_{i})$ . Ponieważ $c (t) = 2$ więc wartość ta wynosi 0 lub 1.

Ponieważ $c (z) = 1$ , więc dla każdego gadżetu co najmniej jeden z jego trzech wejściowych wierzchołków ma kolor 1, a zatem w każdej klauzuli mamy co najmniej jedną jedynkę.

Złożoność obliczeniowa/Wykałd 5: Problemy NP-zupełne: Różnice pomiędzy wersjami

Wersja z 17:44, 31 lip 2006

Spis treści

Wstęp

O problemie SAT

Najpierw 3SAT

MAXSAT

NP-zupełne problemy grafowe

Pokrycie wierzchołkowe

Cykl i ścieżka Hamiltona

Problemy na zbiorach i liczbach

Podsumowanie technik dowodów NP-zupełności

Ćwiczenia końcowe

section

section

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia

@@ Linia 423: / Linia 423: @@
 ==Problemy na zbiorach i liczbach==
-===Trójdzielne skojarzenie i pokrycie zbiorami===
-Uogólnieniem klasycznego problemu skojarzenia w grafie dwudzielnym
-jest następujący problem:
-\bigskip \noindent {\bf Problem }TRIPARTITE MATCHING\\
-{\it Wejście: }parami rozłączne równoliczne zbiory <math>W,X,Y<math> o mocy
-<math>p>0<math> oraz relacja <math>R W X Y<math>\\
-{\it Wyjście: }TAK, jeśli istnieje skojarzenie w <math>R<math>, czyli podzbiór
-<math>R'  R<math> taki, że dla dowolnych trójek
-<math>(w,x,y),(w',x',y') R<math> zachodzi
-<math>w w'<math>, <math>x x'<math> oraz <math>y y'<math>. NIE w przeciwnym przypadku.\\
-Problem skojarzenia dwudzielnego jest obliczeniowo łatwy.
-Uogólnienie do trzech wymiarów utrudnia problem radykalnie.
-{{twierdzenie|[Uzupelnij]||
-Problem TRIPARTITE MATCHING jest NP-zupełny.
-}}
-{{dowod|[Uzupelnij]||
-Ponownie mamy do czynienia z dość skomplikowaną konstrukcją
-posługującą się gadżetami, redukującą problem 3SAT do naszego
-problemu.
-Na wejściu mamy zbiór klauzul <math>C=_1,...,C_m<math> nad zmiennymi
-<math>U=_1,...,u_n<math>. Najpierw dla każdej zmiennej <math>u U<math>
-konstruujemy gadżet <math>T_u<math>, który będzie odpowiadał za wybór
-wartościowania tej zmiennej. Składa się on z dwóch zbiorów trójek:
-\[T_u^t=\{(w_{2j}^u,x_j^u,y_j^u), 1\leq j\leq m\}<math></center>
-_u^f=(w_{2j+1}^u,x_{j+1}^u,y_j^u), 1 j<m(w_1^u,x_1^u,y_m^u)<center><math>
-Przykładowy gadżet dla zmiennej <math>u<math>, w przypadku gdy liczba klauzul
-wynosi <math>m=4<math> pokazano na rysunku 5.5. Grubą linią zaznaczono trójki
-ze zbioru
-\vspace{1cm}
-\begincenter
-\includegraphics[width=12cm]{rys_5_5.jpg}\\
-\endcenter
-\vspace{1cm}
-Dla każdego gadżetu pierwsze elementy trójek, <math>w_1^u,...,w_m^u<math>,
-występują jeszcze w innych trójkach, które za chwilę zdefiniujemy.
-Pozostałe elementy występuja tylko w danym gadżecie. Zatem, jeśli
-wybrano skojarzenie, to dla ustalonego gadżetu to skojarzenie
-zawiera albo cały zbiór <math>T_u^f<math> i żadnej trójki z <math>T_u^t<math>, albo na
-odwrót. W toku dalszego rozumowania, wybór do skojarzenia zbioru
-<math>T_u^f<math> będzie oznaczał wartościowanie zmiennej <math>u<math> na {\it false} i
-pozostawi niepokryte elementy <math>w<math> o indeksach parzystych. Wybór
-przeciwny ustali wartościowanie <math>u<math> na {\it true} i pozostawi
-niepokryte elementy <math>w<math> o indeksach nieparzystych. Sytuacja taka
-została przedstawiona na rysunku 5.5, pogrubioną linią zaznaczono
-wybór trójek <math>T_u^t<math>.
-Trójki które zdefiniujemy teraz mogą być nazwane "składową
-testowania". Skojarzą one niepokryte elementy z gadżetów z
-odpowiednimi wystąpieniami literałów w klauzulach. Dla każdej
-klauzuli <math>C_j=(p_j q_j r_j)<math> składowa testowania <math>S_j<math>
-zawiera 3 trójki <math>s_j^1,s_j^2,s_j^3<math> odpowiadajace kolejnym
-literałom <math>p,q,r<math>, zdefiniowane następująco: Jeśli <math>p=u_i<math> to
-<math>s_j^1=(w_{2j-1}^u,a_j, b_j)<math>. Jeśli <math>p= u_i<math> to
-<math>s_j^1=(w_{2j}^u,a_j,b_j)<math>. Analogicznie dla literałów <math>q, r<math>.
-Elementy <math>a_j, b_j<math> występują tylko w trzech trójkach zbioru <math>S_j<math>,
-zatem skojarzenie wybiera dokładnie jedną z tych trójek. Aby móc
-daną trójkę wybrać, element na pierwszej współrzędnej w tej trójce
-musi być niepokryty trójkami z odpowiedniego gadżetu. Ale to oznacza
-że wartość danego literału jest {\it true}, czyli klauzula <math>C_j<math>
-jest spełniona. Innymi słowy, możliwość pokrycia elementów <math>a_j,
-b_j<math> jest równoważna temu, że istnieje w klauzuli <math>C_j<math> literał o
-wartości logicznej {\it true}.
-Skojarzenie wybrane dla gadżetów ma liczność <math>nm<math>, składowa
-testowania daje kolejnych <math>m<math> trójek w skojarzeniu, zatem ze
-wszystkich <math>2nm<math> elementów na pierwszej współrzędnej (elementy <math>u<math>)
-<math>(n-1)m<math> pozostaje nieskojarzonych. Zatem w konstrukcji potrzebna
-jest jeszcze trzecia "składowa odśmiecania" zdefiniowana
-nastepująco:
-\[G=\{(w_i^u,g_k,h_k):u\in U, 1\leq i\leq 2m, 1\leq k\leq (n-1)m\}<math></center>
-Pozwala ona skojarzyć elementy <math>u<math> pozostałe po wyborze
-wartościowania i testu spełnialności.
-Na podstawie opisanej konstrukcji i komentarzy jej towarzyszących
-możemy juz łatwo stwierdzić, że formuła wejściowa posiada
-wartościowanie spełniające wtedy i tylko wtedy gdy utworzony w
-wyniku redukcji zbiór trójek ma skojarzenie.
-}}
-Rozważmy jeszcze trzy podobne problemy na zbiorach. Ich NP-zupełność
-stanie sie oczywista gdy zauważymy że stanowią one kolejne
-uogólnienia problemu trójdzielnego skojarzenia.
-'''Problem '''EXACT COVER BY 3-SETS (pokrycie trójelementowymi podzbiorami)<br>
-''Wejście: ''Rodzina <math>\cal F<math> trójelementowych podzbiorów zbioru
-<math>X<math>
-takiego że <math>|X|=3k<math> dla pewnej calkowitej <math>k<math><br>
-''Wyjście: ''TAK jesli istnieje podrodzina <math>\cal F' \subseteq \cal
-F<math> taka, że każdy element zbioru <math>X<math> należy do dokładnie jednego zbioru rodziny <math>\cal F"<math>,
-NIE w przeciwnym przypadku<br>
-====section====
-Wykaż że EXACT COVER BY 3-SETS jest NP-zupełny.
-<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none">
-Zauważ, że jeśli ograniczymy sie do instancji w których X jest
-podzielone na trzy rozłączne równoliczne zbiory, a wszystkie
-podzbiory w rodzinie <math>F<math> zawieraja po jednym elemencie z każdego z
-tych trzech podzbiorów, to otrzymujemy problem TRIPARTITE MATCHING
-(formalnie są to izomorficzne struktury). Zatem EXACT COVER BY
--SETS jest uogólnieniem TRIPARTITE MATCHING, a ponieważ, co
-oczywiste, jest w NP, więc jest NP-zupełny.
-</div></div>
-'''Problem''' SET COVERING (pokrycie zbiorami)<br>
-''Wejście: ''Rodzina <math>F=\{S_1,\ldots,S_n\}<math> podzbiorów zbioru
-<math>|X|<math>,
-liczba całkowita <math>k\leq n<math><br>
-''Wyjście: ''TAK, jeśli istnieje k-elementowa podrodzina rodziny
-<math>F<math>,
-która pokrywa cały zbiór <math>|X|<math>, w przeciwnym przypadku NIE.<br>
-====section====
-Wykaż NP-zupełność problemu SET COVERING.
-<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none">
-Ponownie przez ograniczenie do podproblemu: jeśli założymy że
-<math>|X|=3k<math> a wszystkie zbiory rodziny <math>F<math> są 3-elementowe, to
-otrzymujemy problem EXACT COVER BY 3-SETS.
-</div></div>
-===Suma podzbioru i inne problemy liczbowe===
-Teraz zajmiemy się kilkoma problemami związanymi z liczbami.
-Najwięcej trudu będzie kosztować udowodnienie NP-zupełności
-pierwszego z nich -- następne pójdą już łatwiej. Ta pierwsza
-trudność zasadza się na tym, że jak do tej pory dowodziliśmy
-NP-zupełność tylko dla problemów, w których tak naprawdę nie ma
-liczb, jako elementów struktury kombinatorycznej. Oczywiście, każde
-słowo wejściowe może byc traktowane jako liczba, kod maszyny Turinga
-tez jest liczbą. Tutaj jednak chodzi o naturalne sformułowanie
-problemu, w odniesieniu do obiektów abstrakcyjnych takich jak
-liczby, funkcje, relacje, grafy itd. Problematyka trudności
-obliczeniowej problemów z liczbami jest rozwinięta w następnej
-lekcji.
-'''Problem '''SUBSET SUM (suma podzbioru)<br>
-''Wejście: ''Skończony zbiór <math>A</math> elementów, dla każdego elementu
-<math>a\in A</math> waga <math>s(a)\in Z^+</math> oraz liczba <math>B\in Z^+</math>.  <br>
-''Wyjście: ''TAK jeśli istnieje podzbiór <math>A'\subseteq A</math> taki że
-<math>\sum_{a\in A'}s(a) = B</math>, NIE w przeciwnym przypadku. <br>
-{{twierdzenie|[Uzupelnij]||
-Problem SUBSET SUM jest NP-zupełny.
-}}
-{{dowod|[Uzupelnij]||
-Skonstruujemy redukcję z problemu EXACT COVER BY 3 SETS. Na wejściu
-mamy zatem zbiór <math>X</math> o liczności <math>3m</math> i rodzinę
-<math>F=\{U_1,\ldots,U_n\} </math> jego podzbiorów. Naszym zadaniem jest
-skonstruować zbiór <math>Y</math> elementów z pewnymi wagami oraz liczbę B
-taką, że istnienie podzbioru w <math>Y</math> o sumie wag elementów równej <math>B</math>
-"wymusza" istnienie pokrycia zbioru <math>X</math> wybranymi rozłącznymi
-podzbiorami z rodziny <math>F</math>.
-Niech <math>p=\lceil\log_2(n+1)\rceil</math>. Najpierw ustalamy porządek
-elementów w zbiorze <math>|X|</math> i zapisujemy każdy zbiór <math>U_j</math> jako wektor
-<math>3m</math>-bitowy (czyli jest to struktura danych -- wektor bitowy --
-reprezentująca podzbiór danego zbioru). W każdym wektorze są
-oczywiście 3 bity równe 1 a pozostałe są zerowe. Następnie przed
-każdym bitem wstawiamy dodatkowo <math>p-1</math> bitów zerowych i traktujemy
-ten wektor kjako liczbe zapisaną binarnie. Powstaje w ten sposób <math>n</math>
-liczb <math>3mp</math>-bitowych -- są to wagi elementów zbioru Y. Liczba <math>B</math>
-jest również takiej długości, powstaje przez wypisanie <math>3m</math> jedynek
-a następnie wstawienie przed każdą jedynką <math>p-1</math> zer.
-Jeśli istnieje podrodzina <math>F'\subseteq F</math> stanowiąca rozłączne
-pokrycie zbioru <math>X</math>, to wektory bitowe poszczególnych trójek z <math>F'</math>
-arytmetycznie sumują sie do <math>B</math>, a na żadnej pozycji nie występuje
-przeniesienie. Zatem z istnienia pokrycia wynika istnienie podzbioru
-dającego w sumie wagę <math>B</math>.
-Bloki zer dodane przed każdym bitem reprezentacji wektorowej
-podzbioru gwarantują, że sumując dowolny podzbiór wygenerowanych
-liczb nie napotkamy na przeniesienie poza taki blok zer. A zatem,
-jeśli istnieje podzbiór liczb dający w sumie <math>B</math>, to wszystkie te
-liczby w swoich rozwinięciach binarnych zawierają w sumie tyle
-jedynek ile jest ich w <math>B</math>, na różnych pozycjach. A więc
-odpowiadajace tym liczbom podzbiory pokrywają cały zbiór <math>X</math>.
-Zatem opisane przekształcenie jest redukcją. Jak w poprzednich
-dowodach, potrzebna jest pamięć robocza jedynie na stałą liczbę
-liczników. A więc jest to redukcja logarytmiczna.
-}}
-W tej części lekcji wykażemy NP-zupełność dwóch podobnych
-problemów liczbowych.
-'''Problem '''PARTITION (podział)<br>
-''Wejście: ''Skończony zbiór <math>A</math> elementów oraz dodatnia całkowita
-waga <math>s(a)</math> każdego elementu<br>
-''Wyjście: ''TAK jeśli istnieje podzbiór <math>A'\subseteq A</math> taki że
-<math>\sum_{a\in A'}s(a) = \sum_{a\in A-A'}s(a)</math>, NIE w przeciwnym
-przypadku.
-====section====
-Wykaż NP-zupełność problemu podziału.
-<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Wskazówka </span><div class="mw-collapsible-content" style="display:none">
-Skorzystaj z SUBSET SUM. Wystarczy dodać dwa elementy o odpowiednio
-dobranej dużej wadze.
-</div></div>
-<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none">
-Niech <math>S=\sum_{a\in A}s(a)</math>. Dodajemy do zbioru dwa elementy <math>b_1</math> i
-<math>b_2</math>, <math>s(b_1)=2S-B, s(b_2)=S+B</math>. Łatwo sprawdzić, że:
-* Jeśli w zbiorze <math>A</math> istnieje podzbiór <math>A'</math> o sumie równej <math>B</math>,
-to podzbiór ten z dołączonym elementem <math>b_1</math> daje sumę równą <math>2S</math>,
-tyle co pozostałe elementy uzupełnione o <math>b_2</math>.
-* jeśli w zbiorze <math>A\cup \{b_1,b_2\}</math> istnieje podział na 2
-podzbiory o jednakowych wagach, to elementy <math>b_1</math> i <math>b_2</math> sa w
-różnych podzbiorach, bo ich wagi sumują się do <math>3S</math>. W tym
-podzbiorze do którego należy <math>b_1</math> suma wag pozostałych elementów
-wynosi <math>B</math>.
-</div></div>
-'''Problem '''KNAPSACK (plecak)<br>
-''Wejście: ''Skończony zbiór <math>A</math> elementów, rozmiar <math>s(a)\in Z^+</math>
-i wartość <math>v(a)\in Z^+</math> dla każdego elementu, ograniczenie
-pojemności <math>B\in Z^+</math> oraz żądana wartość <math>K\in Z^+</math><br>
-''Wyjście: ''TAK jeśli istnieje podzbiór <math>A'\subseteq A</math> taki że
-<math>\sum_{a\in A'}s(a) \leq B</math> oraz <math>\sum_{a\in A}v(a)\geq K</math>, NIE w
-przeciwnym przypadku.
-====section====
-Pokaż że KNAPSACK jest NP-zupełny.
-<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Wskazówka </span><div class="mw-collapsible-content" style="display:none">
-Wykorzystaj SUBSET SUM lub PARTITION.
-</div></div>
-<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none">
-Jeśli założymy, że rozmiary elementów są równe ich wartościom, a
-pojemnośc plecaka jest równa żądanej wartości, to otrzymamy problem
-SUBSET SUM.
-</div></div>
 ==Podsumowanie technik dowodów NP-zupełności==