Języki, automaty i obliczenia/Wykład 13: Złożoność obliczeniowa.

Sformułujemy definicje podstawowych klas złożoności w języku maszyn Turinga oraz metodę ich porównywania. Przeanalizujemy związki między rodziną języków określonych przez maszyny Turinga a rodziną języków typu (0) z hierarchii Chomsky'ego. Podamy dalsze własności języków kontekstowych i typu (0). Wprowadzimy pojęcie języka rekurencyjnie przeliczalnego oraz przedstawimy tezę Churcha. Następnie omówimy teoretyczne podstawy teorii rozstrzygalności oraz przeanalizujemy kilka problemów nierozstrzygalnych w teorii języków.

Klasy złożoności obliczeniowej

Jednym z podstawowych celów wprowadzania maszyn Turinga jest dążenie do formalnej definicji złożoności obliczeniowej. Na podstawie wcześniejszych uwag możemy utożsamiać akceptację słowa przez maszynę Turinga z jej zatrzymaniem się. Intuicyjnie, można takie zachowanie maszyny Turinga utożsamić z wykonaniem programu, który zwraca odpowiedź "Tak" na postawione przez nas pytanie.

Definicja 1.1

Ustalmy funkcje $t, s : ℕ \to ℕ$ . Mówimy, że maszyna Turinga $ℳ 𝒯$ (deterministyczna lub niedeterministyczna) akceptuje słowo $w \in Σ_{I}^{*}$ w czasie $t (| w |)$ , jeśli istnieje ciąg $k ⩽ t (| w |)$ konfiguracji $d_{1}, d_{2}, \dots, d_{k}$ takich, że $d_{1} = ♯ s_{0} w ♯$ , $d_{k} = ♯ w_{1} s_{F} w_{2} ♯$ dla pewnych $w_{1}, w_{2} \in Σ_{T}^{*}, s_{F} \in S_{F}$ oraz $d_{i} \mapsto d_{i + 1}$ dla $i = 1, \dots, k - 1$ .

Jeśli istnieje ciąg konfiguracji $d_{1} \mapsto d_{2} \mapsto \dots \mapsto d_{m}$ , gdzie $d_{1} = ♯ s_{0} w ♯$ , $d_{m}$ jest konfiguracją akceptującą (tzn. $d_{m} = ♯ w_{1} s_{F} w_{2} ♯$ dla pewnych $w_{1}, w_{2} \in Σ_{T}^{*}, s_{F} \in S_{F}$ ) oraz dodatkowo $| d_{i} | ⩽ s (| w |) + 2$ , to mówimy, że maszyna $ℳ 𝒯$ akceptuje słowo $w \in Σ_{I}^{*}$ w pamięci $s (| w |)$ .

Mówimy, że język $L$ jest akceptowany w czasie $t (n)$ (pamięci $s (n)$ ), jeśli istnieje maszyna Turinga $ℳ 𝒯$ , dla której $L (ℳ 𝒯) = L$ oraz każde słowo $w \in L$ jest akceptowane w czasie $t (| w |)$ (pamięci $s (| w |)$ odpowiednio).

Uwaga 1.1

W niektórych podejściach wykorzystuje się, do definicji złożoności pamięciowej, tak zwanych maszyn Turinga off-line. Pomysł polega na tym, aby nie uwzględniać komórek taśmy, z których maszyna czytała informacje, a jedynie te, do których następował zapis. Dzięki temu zabiegowi można w sposób "rozsądny" mówić o akceptacji słowa w pamięci $\log n$ itp. W ujęciu prezentowanym w tym wykładzie zajmujemy się akceptacją w pamięci $n^{k}$ , dla $k ⩾ 1$ , zatem nie ma potrzeby dodatkowego definiowania maszyn Turinga off-line.

Definicja 1.2

Oznaczmy przez $D t i m e (t (n))$ oraz $D s p a c e (s (n))$ rodzinę języków akceptowanych w czasie $t (n)$ i odpowiednio pamięci $s (n)$ przez deterministyczną maszynę Turinga. Dla maszyn niedeterministycznych wprowadzamy w identyczny sposób klasy $N t i m e (t (n))$ oraz $N s p a c e (s (n))$ .

Określamy następujące klasy złożoności (klasy języków):

\begin{aligned} 𝐏 = ⋃_{k = 0}^{\infty} D t i m e (n^{k}), & 𝐍 𝐏 = ⋃_{k = 0}^{\infty} N t i m e (n^{k}), \\ 𝐏 𝐒 𝐏 𝐀 𝐂 𝐄 = ⋃_{k = 0}^{\infty} D s p a c e (n^{k}), & 𝐍 𝐒 𝐏 𝐀 𝐂 𝐄 = ⋃_{k = 0}^{\infty} N s p a c e (n^{k}) . \end{aligned}

Wprost z definicji otrzymujemy zależności P $\subset$ NP oraz PSPACE $\subset$ NPSPACE . W dalszej części wykładu udowodnimy kilka mniej oczywistych zależności.

Przykład 1.1

Rozważmy język:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle L = \left\{1^i 2^j 3^k: k=i\cdot j,: i,j\geqslant 1\}\right}

Język $L \in$ P . Deterministyczna maszyna Turinga $M T_{3}$ akceptująca taki język może wyglądać następująco (zaczynamy od konfiguracji $♯ s_{0} w ♯$ ):

Jeśli symbol pod głowicą, to $1$ zamień go na $♯$ . Inaczej odrzuć.
Przejdź od lewego ogranicznika do prawego, sprawdzając, czy po $1$ występuje $1$ lub $2$ , po $2$ tylko $2$ lub $3$ , a po $3$ kolejny symbol $3$ lub ogranicznik. Jeśli ta zależność nie jest spełniona, odrzuć. Gdy osiągniesz ogranicznik wykonaj następny krok.
Gdy przed ogranicznikiem nie znajduje się symbol $3$ , odrzuć. W przeciwnym razie zamień symbol $3$ na $♯$ , a następnie poruszaj się w lewo, aż dotrzesz do symbolu innego niż $3$ i $♢$ .
Jeśli symbol do którego dotarłeś to $2$ , zamień go na $♢$ . Sprawdź symbol po lewej. Jeśli to $2$ , poruszaj się w prawo aż do ogranicznika. Następnie przejdź do kroku 3.
Jeśli dotarłeś do symbolu $1$ , poruszaj się w lewo aż do ogranicznika. Zamień symbol $1$ przy ograniczniku na $♯$ , a następnie idź w prawo, zamieniając wszystkie symbole $♢$ na $2$ . Gdy dojdziesz do ogranicznika, przejdź do kroku $3$ .
Jeśli dotarłeś do ogranicznika, oznacza to, że skasowano już wszystkie symbole $1$ . Przejdź w prawo aż do ogranicznika. Jeśli natrafisz na symbol $3$ , odrzuć. W przeciwnym przypadku, akceptuj.

Nietrudno zaobserwować, że maszyna $M T_{3}$ przechodzi przez taśmę w prawo i w lewo tyle razy, ile symboli $3$ zawiera taśma oraz wykonuje jeden dodatkowy przebieg na starcie. Zatem słowa z $L$ są akceptowane w czasie ograniczonym wielomianowo.

Przykład 1.2

Rozważmy teraz język

L = {3^{k} : k = i \cdot j dla pewnych i, j > 1}

Najprostszą metodą uzasadnienia, że $L \in$ NP jest konstrukcja tak zwanej wyroczni. Polega ona na następującej dwuetapowej procedurze:

Skonstruuj niedeterministyczną maszynę Turinga (wyrocznia) generującą pewne słowo (certyfikat).
Zweryfikuj w sposób deterministyczny spełnienie założeń przez certyfikat.

W naszym przykładzie Etap 1 wygląda następująco:

Użyj dwóch taśm. Na pierwszej z nich znajduje się $3^{k}$ .
Idź po pierwszej taśmie, wykorzystując niedeterministyczną funkcję przejść. Napotykając $3$ , możesz wypisać $1$ na taśmie drugiej i przejść o jedną komórkę w prawo na taśmie pierwszej lub przejść do następnego kroku. Jeśli dotarłeś do prawego ogranicznika taśmy pierwszej, przejdź do kroku 3.
Powróć do początku pierwszej taśmy. Wykonaj sekwencję jak w kroku $2$ , z tą różnicą, że teraz na drugiej taśmie wypisuj symbole $2$ .
Jako ostatnią część tego etapu przekopiuj symbole $3$ z pierwszej taśmy na drugą (po symbolach $1$ i $2$ ).

W konstrukcji wykorzystaliśmy dwie taśmy, ale oczywiście w nawiązaniu do wcześniejszych uwag, całą konstrukcję można wykonać na jednej taśmie (z odpowiednio rozszerzonym alfabetem i bardziej skomplikowaną funkcją przejść).

Etap 2 polega na weryfikacji, czy na taśmie drugiej znajduje się słowo postaci $1^{i} 2^{j} 3^{k}$ , gdzie $i, j > 1$ oraz $k = i \cdot j$ . Jeśli tak, to słowo wejściowe $3^{k}$ pochodziło z języka $L$ i akceptujemy. Można do tego wykorzystać deterministyczną maszynę Turinga, niemal identyczną z opisaną w przykładzie poprzednim.

Jeśli słowo wejściowe pochodzi z języka $L$ , to jedno z obliczeń maszyny niedeterministycznej z Etapu 1. prowadzi do konstrukcji odpowiedniego słowa na drugiej taśmie. Nie wiemy, jaka dokładnie ścieżka obliczeń ma być wykorzystana, ale dla akceptacji języka $L$ nie ma to znaczenia.

Zastanów się, czy da się wykazać, że także $L \in$ P (Ćwiczenie 1.3, do tego wykładu).

Definicja 1.3

Funkcja $s (n)$ jest konstruowalna pamięciowo, jeśli istnieje maszyna Turinga $ℳ 𝒯 = (Σ_{T}, S, f, s_{0}, S_{F})$ , dla której $d_{1} \mapsto^{*} d_{2}$ , gdzie $d_{1} = ♯ s_{0} 1^{n} ♯$ , $d_{2} = ♯ s_{1} 1^{s (n)} w ♯$ dla $s_{1} \in S_{F}$ , $w \in (Σ_{T} ∖ {1})^{*}$ oraz dodatkowo $d_{2}$ jest konfiguracją końcową.

Inaczej mówiąc, funkcję $s (n)$ nazywamy konstruowalną pamięciowo, jeśli istnieje maszyna Turinga $ℳ 𝒯$ , otrzymując na wejściu słowo $w$ długości $| w | = n$ , zaznacza na taśmie roboczej $s (n)$ klatek i zatrzymuje się (akceptując słowo $w$ ).

Przykład 1.3

Funkcja $s (n) = 2 n$ jest konstruowalna pamięciowo. Maszyna $M T_{4}$ , która konstruuje $s (n)$ działa według schematu:

Przejdź do prawego markera. Jeśli napotkano symbol inny niż $1$ , to odrzuć.
Idź w lewo aż do pierwszego symbolu $1$ lub markera $♯$
Jeśli napotkałeś symbol $1$ , zamień go na $♣$ i przejdź do prawego markera. Dopisz do słowa symbol $♣$ (zwiększając tym samym długość słowa na taśmie o $1$ ). Następnie powtórz cykl od $2$ .
Jeśli napotkałeś marker, idź w prawo, zamieniając wszystkie wystąpienia $♣$ na $1$ . Następnie wracaj do lewego markera i zatrzymaj się, akceptując.

Twierdzenie 1.1 liniowa kompresja pamięci

Niech będzie dany język $L$ oraz maszyna Turinga $𝒯 ℳ$ akceptująca $L$ w pamięci $s (n)$ . Dla dowolnego $ε > 0$ istnieje maszyna Turinga ${𝒯 ℳ}^{'}$ akceptująca $L$ w pamięci $\max {n, ε s (n)}$ .

Dowód

(Szkic) Ustalamy liczbę naturalną $k$ , dla której $ε k ⩾ 2$ . Maszynę ${𝒯 ℳ}^{'}$ definiujemy następująco:

Przekoduj słowo wejściowe, łącząc po $r$ kolejnych symboli w jeden blok stanowiący nowy symbol na taśmie.
Symuluj maszynę $ℳ 𝒯$ na skompresowanej taśmie. Położenie głowicy wewnątrz bloku zakoduj w stanach maszyny ${ℳ 𝒯}^{'}$ .

Zauważmy, że w kroku $1$ . maszyna ${ℳ 𝒯}^{'}$ wykorzystuje $n$ komórek pamięci do odczytania słowa wejściowego. Kompresja taśmy zapewnia, że podczas symulowania maszyny $ℳ 𝒯$ nie wykorzystamy więcej niż $⌈ \frac{s (n)}{k} ⌉ ⩽ ε s (n)$ komórek. Jednocześnie można założyć, że ${ℳ 𝒯}^{'}$ akceptuje słowa wejściowe z języka $L$ o długości mniejszej niż $k$ bez symulowania $ℳ 𝒯$ .

Twierdzenie 1.2 Savitch

Dla dowolnej funkcji $s (n)$ konstruowalnej pamięciowo spełniającej warunek $s (n) ⩾ \log_{2} n$ prawdziwa jest inkluzja $N s p a c e (s (n)) \subset D S p a c e (s^{2} (n))$ .

Dowód

Niech $𝒩 ℳ 𝒯$ będzie niedeterministyczną maszyną Turinga akceptującą język $L = L (𝒩 ℳ 𝒯)$ w pamięci $s (n)$ . Niech $k (n)$ oznacza liczbę konfiguracji potrzebną do zaakceptowania słowa o długości $n$ . Istnieje liczba $c > 1$ , dla której $k (n) ⩽ c^{s (n)}$ , co z kolei oznacza, że każde słowo o długości $n$ jest akceptowane w $c^{s (n)}$ krokach czasowych.

Rozważmy algorytm:

Algorytm

  1  Wejście: słowo  $w$  długości  $| w | = n$ 
  2  oblicz  $s (n)$ 
  3  for każda konfiguracja akceptująca  $d_{A}$  dla której  $| d_{A} | ⩽ s (n)$ 
  4    do if Test( $♯ s_{0} w ♯$ ,  $d_{A}$ ,  $s (n) \log_{2} c$ ) then akceptuj

gdzie procedura Test ma następującą postać:

Algorytm Procedure Test( $d$ , $d^{'}$ , $i$ )

  1  if  $i = 0$  and [ ( $d = d^{'}$ ) or ( $d \mapsto d^{'}$ )] then return true
  2    else for każda konfiguracja  $d^{″}$  dla której  $| d^{″} | ⩽ s (n)$ 
  3      do if Test( $d$ , $d^{″}$ , $i - 1$ ) and Test  $d^{″}$ , $d^{'}$ , $i - 1$ )
  4        then return true;
  5  return false

Przedstawiony algorytm można zrealizować za pomocą wielotaśmowej maszyny Turinga. Założenie dotyczące konstruowalności pamięciowej jest istotnie wykorzystywane w tej konstrukcji przy implementacji linii 3 algorytmu i linii 2 procedury Test. Musimy zaznaczyć $s (n)$ komórek taśmy, aby móc konstruować konfiguracje o długości ograniczonej przez $s (n)$ i móc następnie wykonywać na nich symulację maszyny $𝒩 ℳ 𝒯$ .

Zauważmy, że ilość konfiguracji jest ograniczona przez $s (n)$ , a głębokość rekursji przez $\log c^{s (n)}$ . Oznacza to, że jesteśmy w stanie skonstruować maszynę Turinga, która wymaga $c^{'} s^{2} (n)$ pamięci, gdzie $c^{'}$ jest pewną stałą. Na mocy Twierdzenia 1.1 jesteśmy w stanie określić maszynę $ℳ 𝒯$ działającą w pamięci $s^{2} (n)$ .

Wniosek 1.1

PSPACE

=

NPSPACE

Lemat 1.1

Jeśli $g (n) ⩾ n$ , to $D t i m e (g (n)) \subset D s p a c e (g (n))$ oraz $N t i m e (g (n)) \subset N s p a c e (g (n))$ .

Dowód

Niech będzie dana maszyna deterministyczna $ℳ 𝒯$ akceptująca dany język $L$ w czasie $g (n)$ . Do akceptacji słowa $w$ o długości $n$ maszyna wykorzystuje co najwyżej $g (n)$ kroków czasowych, czyli odwiedza co najwyżej $g (n) + 1$ komórek taśmy.

Na podstawie Twierdzenia 1.1 istnieje maszyna Turinga ${ℳ 𝒯}^{'}$ wykorzystująca

\max {n, \frac{1}{2} (g (n) + 1)} ⩽ g (n)

komórek pamięci. Dla niedeterministycznych maszyn Turinga argumentacja jest identyczna.

Wniosek 1.2

P

\subset

NP

\subset

PSPACE

=

NPSPACE

Uwaga 1.2

Nie jest znany przykład wykazujący silną inkluzję P $⊊$ NP ani dowód wykluczający istnienie takiego przykładu. Powszechnie uznawana hipoteza głosi:

P

\neq

NP.

Rozstrzygnięcie jej prawdziwości lub fałszywości stanowi jeden z najważniejszych, a zarazem najtrudniejszych problemów współczesnej informatyki. Jak widzieliśmy w Przykładzie 1.2, nawet w przypadku konkretnego języka $L \in$ NP, problem uzasadnienia, że także $L \in$ P, jest nietrywialny, gdyż wymaga zazwyczaj konstrukcji całkiem nowej maszyny Turinga niż ta do weryfikacji $L \in$ NP .

Redukcja i problemy zupełne

Definicja 2.1 transformacja wielomianowa

Niech $L_{1}, L_{2}$ będą dowolnymi językami nad pewnym alfabetem $Σ_{I}$ . Mówimy, że $L_{1}$ redukuje się do $L_{2}$ w czasie wielomianowym, co oznaczamy $L_{1} \propto L_{2}$ , gdy istnieje deterministyczna maszyna Turinga $ℳ 𝒯 = (Σ_{T}, S, f, s_{0}, S_{F})$ taka, że dla dowolnego $w \in Σ_{I}^{*}$ istnieje $w^{'} \in Σ_{I}^{*}$ i stan $s_{1} \in S_{F}$ o własności

♯ s_{0} w ♯ \mapsto^{*} ♯ s_{1} w^{'} ♯

oraz

w \in L_{1} ⟺ w^{'} \in L_{2}

Lemat 2.1

Załóżmy, że $L_{1} \propto L_{2}$ . Wtedy zachodzą implikacje:

$L_{2} \in$ P $⟹ L_{1} \in$ P,
$L_{2} \in$ NP $⟹ L_{1} \in$ NP,
$L_{2} \in$ PSPACE $⟹ L_{1} \in$ PSPACE.

Dowód

Dane słowo $w$ transformujemy do $w^{'}$ w czasie wielomianowym, co gwarantuje założenie $L_{1} \propto L_{2}$ . Dzięki założeniu $L_{2} \in$ P możemy rozstrzygnąć, czy $w^{'} \in L_{2}$ (tzn. jeśli akceptujemy $w^{'}$ , to robimy to w czasie wielomianowym). Tym sposobem (korzystając z definicji transformacji wielomianowej) akceptujemy $w$ w czasie wielomianowym, o ile tylko $w \in L_{1}$ . Dowód dla pozostałych implikacji jest identyczny.

Definicja 2.2

Niech $𝒞$ oznacza pewną klasę języków. Język $L$ nazywamy $𝒞$ -trudnym, jeśli spełniony jest warunek:

\forall L^{'} \in 𝒞 L^{'} \propto L

Jeżeli dodatkowo spełniony jest warunek $L \in 𝒞$ , to język $L$ nazywamy $𝒞$ -zupełnym.

Intuicyjnie, fakt, że język jest $𝒞$ -zupełny, oznacza, że jest on najbardziej skomplikowany (pod względem obliczeniowym) wśród języków z klasy $𝒞$ , natomiast język $𝒞$ -trudny jest bardziej skomplikowany niż każdy z klasy $𝒞$ , choć sam nie musi do niej należeć.

Uwaga 2.1

Rozważając klasę P , NP i PSPACE, możemy mówić o językach (problemach) P -zupełnych, NP -zupełnych, czy też PSPACE -zupełnych. To samo odnosi się do języków trudnych (tzn. klasa języków P -trudnych, itd.).

Przykład 2.1

Rozważmy języki:

L_{1} = {1^{i} 2^{j} 3^{k} : k = i \cdot j, : i, j ⩾ 1}, L_{2} = {1^{i} 2^{j} 4^{2 k} : k = i \cdot j, : i, j ⩾ 1}

Języki: $L_{1}$ oraz $L_{2}$ wyglądają na bardzo podobne, zatem wydaje się, że $L_{1} \propto L_{2}$ oraz $L_{2} \propto L_{1}$ . Uzasadnienie tego faktu jest prawie natychmiastowe.

Konstruujemy deterministyczną maszynę Turinga która działa w następujący sposób:

Jeśli słowo wejściowe jest puste, to stop.
Przejdź do prawego ogranicznika. Jeśli przy ograniczniku nie występuje symbol $4$ , to wykonaj krok 1.
Jeśli w słowie wejściowym występuje symbol $4$ , to sprawdź, czy słowo przetwarzane jest postaci $♯ w 4^{s} ♯$ , gdzie $s ⩾ 1$ oraz $w \in (Σ_{I} ∖ {4})^{*}$ oraz czy dodatkowo $s$ jest liczbą parzystą. Jeśli nie, to wykonaj krok 1.
Zamień słowo $4^{s}$ na słowo $3^{\frac{s}{2}} ♯^{\frac{s}{2}}$ i wykonaj krok 1.
Przejdź nad pierwszy symbol po lewym ograniczniku i zatrzymaj się.

W ten sposób zawsze przeprowadzamy konfigurację $♯ s_{0} w ♯$ na konfigurację $♯ s_{1} w^{'} ♯$ , przy czym $w^{'} = 1^{i} 2^{j} 3^{k}$ tylko, gdy $w = 1^{i} 2^{j} 4^{2 k}$ . Zatem $w \in L_{2}$ wtedy i tylko wtedy, gdy $w^{'} \in L_{1}$ . Wykazaliśmy, że $L_{2} \propto L_{1}$ .

Warunek $L_{1} \propto L_{2}$ otrzymujemy w sposób identyczny. Trzeba tylko wypisać odpowiednią ilość symboli $4$ (a wiemy już, jak konstruować liczbę $2 n$ , mając dane $n$ ).

Języki, automaty i obliczenia/Wykład 13: Złożoność obliczeniowa.

Spis treści

Klasy złożoności obliczeniowej

Redukcja i problemy zupełne

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia