Języki, automaty i obliczenia/Wykład 13: Złożoność obliczeniowa.: Różnice pomiędzy wersjami

Wersja z 19:37, 2 wrz 2006

Sformułujemy definicje podstawowych klas złożoności w języku maszyn Turinga oraz metodę ich porównywania. Przeanalizujemy związki między rodziną języków określonych przez maszyny Turinga a rodziną języków typu (0) z hierarchii Chomsky'ego. Podamy dalsze własności języków kontekstowych i typu (0). Wprowadzimy pojęcie języka rekurencyjnie przeliczalnego oraz przedstawimy tezę Churcha. Następnie omówimy teoretyczne podstawy teorii rozstrzygalności oraz przeanalizujemy kilka problemów nierozstrzygalnych w teorii języków.

1. Klasy złożoności obliczeniowej

Jednym z podstawowych celów wprowadzania maszyn Turinga jest dążenie do formalnej definicji złożoności obliczeniowej. Na podstawie wcześniejszych uwag możemy utożsamiać akceptację słowa przez maszynę Turinga z jej zatrzymaniem się. Intuicyjnie, można takie zachowanie maszyny Turinga utożsamić z wykonaniem programu, który zwraca odpowiedź "Tak" na postawione przez nas pytanie.

Definicja 1.1

Ustalmy funkcje $t, s : ℕ \to ℕ$ . Mówimy, że maszyna Turinga $ℳ 𝒯$ (deterministyczna lub niedeterministyczna) akceptuje słowo $w \in Σ_{I}^{*}$ w czasie $t (| w |)$ , jeśli istnieje ciąg $k ⩽ t (| w |)$ konfiguracji $d_{1}, d_{2}, \dots, d_{k}$ takich, że $d_{1} = ♯ s_{0} w ♯$ , $d_{k} = ♯ w_{1} s_{F} w_{2} ♯$ dla pewnych $w_{1}, w_{2} \in Σ_{T}^{*}, s_{F} \in S_{F}$ oraz $d_{i} \mapsto d_{i + 1}$ dla $i = 1, \dots, k - 1$ .

Jeśli istnieje ciąg konfiguracji $d_{1} \mapsto d_{2} \mapsto \dots \mapsto d_{m}$ , gdzie $d_{1} = ♯ s_{0} w ♯$ , $d_{m}$ jest konfiguracją akceptującą (tzn. $d_{m} = ♯ w_{1} s_{F} w_{2} ♯$ dla pewnych $w_{1}, w_{2} \in Σ_{T}^{*}, s_{F} \in S_{F}$ ) oraz dodatkowo $| d_{i} | ⩽ s (| w |) + 2$ , to mówimy, że maszyna $ℳ 𝒯$ akceptuje słowo $w \in Σ_{I}^{*}$ w pamięci $s (| w |)$ .

Mówimy, że język $L$ jest akceptowany w czasie $t (n)$ (pamięci $s (n)$ ), jeśli istnieje maszyna Turinga $ℳ 𝒯$ , dla której $L (ℳ 𝒯) = L$ oraz każde słowo $w \in L$ jest akceptowane w czasie $t (| w |)$ (pamięci $s (| w |)$ odpowiednio).

Uwaga 1.1

W niektórych podejściach wykorzystuje się, do definicji złożoności pamięciowej, tak zwanych maszyn Turinga off-line. Pomysł polega na tym, aby nie uwzględniać komórek taśmy, z których maszyna czytała informacje, a jedynie te, do których następował zapis. Dzięki temu zabiegowi można w sposób "rozsądny" mówić o akceptacji słowa w pamięci $\log n$ itp. W ujęciu prezentowanym w tym wykładzie zajmujemy się akceptacją w pamięci $n^{k}$ , dla $k ⩾ 1$ , zatem nie ma potrzeby dodatkowego definiowania maszyn Turinga off-line.

Definicja 1.2

Oznaczmy przez $D t i m e (t (n))$ oraz $D s p a c e (s (n))$ rodzinę języków akceptowanych w czasie $t (n)$ i odpowiednio pamięci $s (n)$ przez deterministyczną maszynę Turinga. Dla maszyn niedeterministycznych wprowadzamy w identyczny sposób klasy $N t i m e (t (n))$ oraz $N s p a c e (s (n))$ .

Określamy następujące klasy złożoności (klasy języków):

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \textbd{P} \displaystyle =\bigcup_{k=0}^\infty Dtime(n^k), &\qquad\qquad& \textbd{NP} \displaystyle =\bigcup_{k=0}^\infty Ntime(n^k), \\ \textbd{PSPACE} \displaystyle =\bigcup_{k=0}^\infty Dspace(n^k), && \textbd{NSPACE} \displaystyle =\bigcup_{k=0}^\infty Nspace(n^k). \endaligned}

Wprost z definicji otrzymujemy zależności P $\subset$ NP oraz PSPACE $\subset$ NPSPACE . W dalszej części wykładu udowodnimy kilka mniej oczywistych zależności.

Przykład 1.1

Rozważmy język:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L=\left\{1^i 2^j 3^k\: k=i\cdot j,\: i,j\geqslant 1\right\}. }

Język $L \in$ P . Deterministyczna maszyna Turinga $M T_{3}$ akceptująca taki język może wyglądać następująco (zaczynamy od konfiguracji $♯ s_{0} w ♯$ ):

Jeśli symbol pod głowicą, to $1$ zamień go na $♯$ . Inaczej odrzuć.
Przejdź od lewego ogranicznika do prawego, sprawdzając, czy po $1$ występuje $1$ lub $2$ , po $2$ tylko $2$ lub $3$ , a po $3$ kolejny symbol $3$ lub ogranicznik. Jeśli ta zależność nie jest spełniona, odrzuć. Gdy osiągniesz ogranicznik wykonaj następny krok.
Gdy przed ogranicznikiem nie znajduje się symbol $3$ , odrzuć. W przeciwnym razie zamień symbol $3$ na $♯$ , a następnie poruszaj się w lewo, aż dotrzesz do symbolu innego niż $3$ i $♢$ .
Jeśli symbol do którego dotarłeś to $2$ , zamień go na $♢$ . Sprawdź symbol po lewej. Jeśli to $2$ , poruszaj się w prawo aż do ogranicznika. Następnie przejdź do kroku 3.
Jeśli dotarłeś do symbolu $1$ , poruszaj się w lewo aż do ogranicznika. Zamień symbol $1$ przy ograniczniku na $♯$ , a następnie idź w prawo, zamieniając wszystkie symbole $♢$ na $2$ . Gdy dojdziesz do ogranicznika, przejdź do kroku $3$ .
Jeśli dotarłeś do ogranicznika, oznacza to, że skasowano już wszystkie symbole $1$ . Przejdź w prawo aż do ogranicznika. Jeśli natrafisz na symbol $3$ , odrzuć. W przeciwnym przypadku, akceptuj.

Nietrudno zaobserwować, że maszyna $M T_{3}$ przechodzi przez taśmę w prawo i w lewo tyle razy, ile symboli $3$ zawiera taśma oraz wykonuje jeden dodatkowy przebieg na starcie. Zatem słowa z $L$ są akceptowane w czasie ograniczonym wielomianowo.

Przykład 1.2

Rozważmy teraz język

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L=\left\{3^k\: : \: k=i\cdot j } dla pewnych

i, j > 1} .

Najprostszą metodą uzasadnienia, że $L \in$ NP jest konstrukcja tak zwanej wyroczni. Polega ona na następującej dwuetapowej procedurze:

Skonstruuj niedeterministyczną maszynę Turinga (wyrocznia) generującą pewne słowo (certyfikat).
Zweryfikuj w sposób deterministyczny spełnienie założeń przez certyfikat.

W naszym przykładzie Etap 1 wygląda następująco:

Użyj dwóch taśm. Na pierwszej z nich znajduje się $3^{k}$ .
Idź po pierwszej taśmie, wykorzystując niedeterministyczną funkcję przejść. Napotykając $3$ , możesz wypisać $1$ na taśmie drugiej i przejść o jedną komórkę w prawo na taśmie pierwszej lub przejść do następnego kroku. Jeśli dotarłeś do prawego ogranicznika taśmy pierwszej, przejdź do kroku 3.
Powróć do początku pierwszej taśmy. Wykonaj sekwencję jak w kroku $2$ , z tą różnicą, że teraz na drugiej taśmie wypisuj symbole $2$ .
Jako ostatnią część tego etapu przekopiuj symbole $3$ z pierwszej taśmy na drugą (po symbolach $1$ i $2$ ).

W konstrukcji wykorzystaliśmy dwie taśmy, ale oczywiście w nawiązaniu do wcześniejszych uwag, całą konstrukcję można wykonać na jednej taśmie (z odpowiednio rozszerzonym alfabetem i bardziej skomplikowaną funkcją przejść).

Etap 2 polega na weryfikacji, czy na taśmie drugiej znajduje się słowo postaci $1^{i} 2^{j} 3^{k}$ , gdzie $i, j > 1$ oraz $k = i \cdot j$ . Jeśli tak, to słowo wejściowe $3^{k}$ pochodziło z języka $L$ i akceptujemy. Można do tego wykorzystać deterministyczną maszynę Turinga, niemal identyczną z opisaną w przykładzie poprzednim.

Jeśli słowo wejściowe pochodzi z języka $L$ , to jedno z obliczeń maszyny niedeterministycznej z Etapu 1. prowadzi do konstrukcji odpowiedniego słowa na drugiej taśmie. Nie wiemy, jaka dokładnie ścieżka obliczeń ma być wykorzystana, ale dla akceptacji języka $L$ nie ma to znaczenia.

Zastanów się, czy da się wykazać, że także $L \in$ P (Ćwiczenie 1.3, do tego wykładu).

Definicja 1.3

Funkcja $s (n)$ jest konstruowalna pamięciowo, jeśli istnieje maszyna Turinga $ℳ 𝒯 = (Σ_{T}, S, f, s_{0}, S_{F})$ , dla której $d_{1} \mapsto^{*} d_{2}$ , gdzie $d_{1} = ♯ s_{0} 1^{n} ♯$ , $d_{2} = ♯ s_{1} 1^{s (n)} w ♯$ dla $s_{1} \in S_{F}$ , $w \in (Σ_{T} ∖ {1})^{*}$ oraz dodatkowo $d_{2}$ jest konfiguracją końcową.

Inaczej mówiąc, funkcję $s (n)$ nazywamy konstruowalną pamięciowo, jeśli istnieje maszyna Turinga $ℳ 𝒯$ , otrzymując na wejściu słowo $w$ długości $| w | = n$ , zaznacza na taśmie roboczej $s (n)$ klatek i zatrzymuje się (akceptując słowo $w$ ).

Przykład 1.3

Funkcja $s (n) = 2 n$ jest konstruowalna pamięciowo. Maszyna $M T_{4}$ , która konstruuje $s (n)$ działa według schematu:

Przejdź do prawego markera. Jeśli napotkano symbol inny niż $1$ , to odrzuć.
Idź w lewo aż do pierwszego symbolu $1$ lub markera $♯$
Jeśli napotkałeś symbol $1$ , zamień go na $♣$ i przejdź do prawego markera. Dopisz do słowa symbol $♣$ (zwiększając tym samym długość słowa na taśmie o $1$ ). Następnie powtórz cykl od $2$ .
Jeśli napotkałeś marker, idź w prawo, zamieniając wszystkie wystąpienia $♣$ na $1$ . Następnie wracaj do lewego markera i zatrzymaj się, akceptując.

Twierdzenie 1.1 liniowa kompresja pamięci

Niech będzie dany język $L$ oraz maszyna Turinga $𝒯 ℳ$ akceptująca $L$ w pamięci $s (n)$ . Dla dowolnego $ε > 0$ istnieje maszyna Turinga ${𝒯 ℳ}^{'}$ akceptująca $L$ w pamięci $\max {n, ε s (n)}$ .

Dowód

(Szkic) Ustalamy liczbę naturalną $k$ , dla której $ε k ⩾ 2$ . Maszynę ${𝒯 ℳ}^{'}$ definiujemy następująco:

Przekoduj słowo wejściowe, łącząc po $r$ kolejnych symboli w jeden blok stanowiący nowy symbol na taśmie.
Symuluj maszynę $ℳ 𝒯$ na skompresowanej taśmie. Położenie głowicy wewnątrz bloku zakoduj w stanach maszyny ${ℳ 𝒯}^{'}$ .

Zauważmy, że w kroku $1$ . maszyna ${ℳ 𝒯}^{'}$ wykorzystuje $n$ komórek pamięci do odczytania słowa wejściowego. Kompresja taśmy zapewnia, że podczas symulowania maszyny $ℳ 𝒯$ nie wykorzystamy więcej niż $⌈ \frac{s (n)}{k} ⌉ ⩽ ε s (n)$ komórek. Jednocześnie można założyć, że ${ℳ 𝒯}^{'}$ akceptuje słowa wejściowe z języka $L$ o długości mniejszej niż $k$ bez symulowania $ℳ 𝒯$ .

Twierdzenie 1.2 Savitch

Dla dowolnej funkcji $s (n)$ konstruowalnej pamięciowo spełniającej warunek $s (n) ⩾ \log_{2} n$ prawdziwa jest inkluzja $N s p a c e (s (n)) \subset D S p a c e (s^{2} (n))$ .

Dowód

Niech $𝒩 ℳ 𝒯$ będzie niedeterministyczną maszyną Turinga akceptującą język $L = L (𝒩 ℳ 𝒯)$ w pamięci $s (n)$ . Niech $k (n)$ oznacza liczbę konfiguracji potrzebną do zaakceptowania słowa o długości $n$ . Istnieje liczba $c > 1$ , dla której $k (n) ⩽ c^{s (n)}$ , co z kolei oznacza, że każde słowo o długości $n$ jest akceptowane w $c^{s (n)}$ krokach czasowych.

Rozważmy algorytm:

Algorytm

  1  Wejście: słowo  $w$  długości  $| w | = n$ 
  2  oblicz  $s (n)$ 
  3  for każda konfiguracja akceptująca  $d_{A}$  dla której  $| d_{A} | ⩽ s (n)$ 
  4    do if Test( $♯ s_{0} w ♯$ ,  $d_{A}$ ,  $s (n) \log_{2} c$ ) then akceptuj

gdzie procedura Test ma następującą postać:

Algorytm Procedure Test( $d$ , $d^{'}$ , $i$ )

  1  if  $i = 0$  and [ ( $d = d^{'}$ ) or ( $d \mapsto d^{'}$ )] then return true
  2    else for każda konfiguracja  $d^{″}$  dla której  $| d^{″} | ⩽ s (n)$ 
  3      do if Test( $d$ , $d^{″}$ , $i - 1$ ) and Test  $d^{″}$ , $d^{'}$ , $i - 1$ )
  4        then return true;
  5  return false

Przedstawiony algorytm można zrealizować za pomocą wielotaśmowej maszyny Turinga. Założenie dotyczące konstruowalności pamięciowej jest istotnie wykorzystywane w tej konstrukcji przy implementacji linii 3 algorytmu i linii 2 procedury Test. Musimy zaznaczyć $s (n)$ komórek taśmy, aby móc konstruować konfiguracje o długości ograniczonej przez $s (n)$ i móc następnie wykonywać na nich symulację maszyny $𝒩 ℳ 𝒯$ .

Zauważmy, że ilość konfiguracji jest ograniczona przez $s (n)$ , a głębokość rekursji przez $\log c^{s (n)}$ . Oznacza to, że jesteśmy w stanie skonstruować maszynę Turinga, która wymaga $c^{'} s^{2} (n)$ pamięci, gdzie $c^{'}$ jest pewną stałą. Na mocy Twierdzenia 1.1 jesteśmy w stanie określić maszynę $ℳ 𝒯$ działającą w pamięci $s^{2} (n)$ .

Wniosek 1.1

PSPACE

=

NPSPACE

Lemat 1.1

Jeśli $g (n) ⩾ n$ , to $D t i m e (g (n)) \subset D s p a c e (g (n))$ oraz $N t i m e (g (n)) \subset N s p a c e (g (n))$ .

Dowód

Niech będzie dana maszyna deterministyczna $ℳ 𝒯$ akceptująca dany język $L$ w czasie $g (n)$ . Do akceptacji słowa $w$ o długości $n$ maszyna wykorzystuje co najwyżej $g (n)$ kroków czasowych, czyli odwiedza co najwyżej $g (n) + 1$ komórek taśmy.

Na podstawie Twierdzenia 1.1 istnieje maszyna Turinga ${ℳ 𝒯}^{'}$ wykorzystująca

\max {n, \frac{1}{2} (g (n) + 1)} ⩽ g (n)

komórek pamięci. Dla niedeterministycznych maszyn Turinga argumentacja jest identyczna.

Wniosek 1.2

P

\subset

NP

\subset

PSPACE

=

NPSPACE

Uwaga 1.2

Nie jest znany przykład wykazujący silną inkluzję P $⊊$ NP ani dowód wykluczający istnienie takiego przykładu. Powszechnie uznawana hipoteza głosi:

P

\neq

NP.

Rozstrzygnięcie jej prawdziwości lub fałszywości stanowi jeden z najważniejszych, a zarazem najtrudniejszych problemów współczesnej informatyki. Jak widzieliśmy w Przykładzie 1.2, nawet w przypadku konkretnego języka $L \in$ NP, problem uzasadnienia, że także $L \in$ P, jest nietrywialny, gdyż wymaga zazwyczaj konstrukcji całkiem nowej maszyny Turinga niż ta do weryfikacji $L \in$ NP .

2. Redukcja i problemy zupełne

Definicja 2.1 transformacja wielomianowa

Niech $L_{1}, L_{2}$ będą dowolnymi językami nad pewnym alfabetem $Σ_{I}$ . Mówimy, że $L_{1}$ redukuje się do $L_{2}$ w czasie wielomianowym, co oznaczamy $L_{1} \propto L_{2}$ , gdy istnieje deterministyczna maszyna Turinga $ℳ 𝒯 = (Σ_{T}, S, f, s_{0}, S_{F})$ taka, że dla dowolnego $w \in Σ_{I}^{*}$ istnieje $w^{'} \in Σ_{I}^{*}$ i stan $s_{1} \in S_{F}$ o własności

♯ s_{0} w ♯ \mapsto^{*} ♯ s_{1} w^{'} ♯

oraz

w \in L_{1} ⟺ w^{'} \in L_{2} .

Lemat 2.1

Załóżmy, że $L_{1} \propto L_{2}$ . Wtedy zachodzą implikacje:

$L_{2} \in$ P $⟹ L_{1} \in$ P,
$L_{2} \in$ NP $⟹ L_{1} \in$ NP,
$L_{2} \in$ PSPACE $⟹ L_{1} \in$ PSPACE.

Dowód

Dane słowo $w$ transformujemy do $w^{'}$ w czasie wielomianowym, co gwarantuje założenie $L_{1} \propto L_{2}$ . Dzięki założeniu $L_{2} \in$ P możemy rozstrzygnąć, czy $w^{'} \in L_{2}$ (tzn. jeśli akceptujemy $w^{'}$ , to robimy to w czasie wielomianowym). Tym sposobem (korzystając z definicji transformacji wielomianowej) akceptujemy $w$ w czasie wielomianowym, o ile tylko $w \in L_{1}$ . Dowód dla pozostałych implikacji jest identyczny.

Definicja 2.2

Niech $𝒞$ oznacza pewną klasę języków. Język $L$ nazywamy $𝒞$ -trudnym, jeśli spełniony jest warunek:

\forall L^{'} \in 𝒞 L^{'} \propto L .

Jeżeli dodatkowo spełniony jest warunek $L \in 𝒞$ , to język $L$ nazywamy $𝒞$ -zupełnym.

Intuicyjnie, fakt, że język jest $𝒞$ -zupełny, oznacza, że jest on najbardziej skomplikowany (pod względem obliczeniowym) wśród języków z klasy $𝒞$ , natomiast język $𝒞$ -trudny jest bardziej skomplikowany niż każdy z klasy $𝒞$ , choć sam nie musi do niej należeć.

Uwaga 2.1

Rozważając klasę P , NP i PSPACE, możemy mówić o językach (problemach) P -zupełnych, NP -zupełnych, czy też PSPACE -zupełnych. To samo odnosi się do języków trudnych (tzn. klasa języków P -trudnych, itd.).

Przykład 2.1

Rozważmy języki:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L_1=\left\{1^i 2^j 3^k\: k=i\cdot j,\: i,j\geqslant 1\right\}\quad,\quad L_2=\left\{1^i 2^j 4^{2k}\: k=i\cdot j,\: i,j\geqslant 1\right\}. }

Języki: $L_{1}$ oraz $L_{2}$ wyglądają na bardzo podobne, zatem wydaje się, że $L_{1} \propto L_{2}$ oraz $L_{2} \propto L_{1}$ . Uzasadnienie tego faktu jest prawie natychmiastowe.

Konstruujemy deterministyczną maszynę Turinga która działa w następujący sposób:

Jeśli słowo wejściowe jest puste, to stop.
Przejdź do prawego ogranicznika. Jeśli przy ograniczniku nie występuje symbol $4$ , to wykonaj krok 1.
Jeśli w słowie wejściowym występuje symbol $4$ , to sprawdź, czy słowo przetwarzane jest postaci $♯ w 4^{s} ♯$ , gdzie $s ⩾ 1$ oraz $w \in (Σ_{I} ∖ {4})^{*}$ oraz czy dodatkowo $s$ jest liczbą parzystą. Jeśli nie, to wykonaj krok 1.
Zamień słowo $4^{s}$ na słowo $3^{\frac{s}{2}} ♯^{\frac{s}{2}}$ i wykonaj krok 1.
Przejdź nad pierwszy symbol po lewym ograniczniku i zatrzymaj się.

W ten sposób zawsze przeprowadzamy konfigurację $♯ s_{0} w ♯$ na konfigurację $♯ s_{1} w^{'} ♯$ , przy czym $w^{'} = 1^{i} 2^{j} 3^{k}$ tylko, gdy $w = 1^{i} 2^{j} 4^{2 k}$ . Zatem $w \in L_{2}$ wtedy i tylko wtedy, gdy $w^{'} \in L_{1}$ . Wykazaliśmy, że $L_{2} \propto L_{1}$ .

Warunek $L_{1} \propto L_{2}$ otrzymujemy w sposób identyczny. Trzeba tylko wypisać odpowiednią ilość symboli $4$ (a wiemy już, jak konstruować liczbę $2 n$ , mając dane $n$ ).

3. Języki maszyn Turinga i rodzina $ℒ_{0}$

Powstaje naturalne pytanie o związki pomiędzy klasą języków rozpoznawanych przez maszyny Turinga a klasami zadanymi poprzez gramatyki. Odpowiemy na to pytanie w tej części wykładu.

Twierdzenie 3.1

Każdy język akceptowany przez maszynę Turinga jest typu (0).

ℒ (M T) \subset ℒ_{0} .

Dowód

Niech $L$ będzie językiem akceptowanym przez maszynę Turinga $𝐌 𝐓 = (Σ_{T}, S, f, s_{0}, S_{F})$ , o której założymy, że $f (s_{0}, #) = (s^{'}, #, 1)$ , jeśli para $(s_{0}, #)$ należy do dziedziny funkcji przejść $f$ maszyny Turinga. Założenie to nie ogranicza ogólności rozważań. Wyróżnimy pewien podzbiór ${\overline{S}}_{F}$ zbioru stanów $S$ , którego elementy, jak wskazuje oznaczenie, skojarzone są ze stanami końcowymi. Do zbioru ${\overline{S}}_{F}$ należy każdy stan $\overline{s} \in S$ , dla którego istnieje ciąg stanów $s_{1} = \overline{s}, . . ., s_{k}$ dla $k ⩾ 1$ taki, że $(s_{i}, #) \to (s_{i + 1}, #, 0)$ dla $k = 1, . . ., k - 1$ oraz $(s_{k}, #) \to (s, #, 1)$ , gdzie $s \in S_{F}$ . Zauważmy, iż wraz ze stanem $\overline{s}$ do zbioru ${\overline{S}}_{F}$ należą wszystkie elementy ciągu $s_{1} = \overline{s}, . . ., s_{k}$ .

Określamy teraz gramatykę $G = (V_{N}, V_{T}, v_{0}, P)$ . Zbiór symboli nieterminalnych $V_{N}$ zawiera wyłącznie następujące symbole:

dla każdego stanu $s \in S$ i $a \in Σ_{T} ∖ {#}$ symbole Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v_{sa},\: ^{\#}v_{sa},\: v_{sa}^{\#},\: ^{\#}v_{sa}^{\#}, }
dla każdej litery $a \in Σ_{T} ∖ {#}$ symbole $^{#} a$ i $a^{#},$
wszystkie elementy zbioru $Σ_{T} ∖ (Σ_{I} \cup {#}),$
symbole Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v_{0},\: v_{1} } nie należące do $Σ_{T} .$

Zbiór praw $P$ składa się z praw wymienionych poniżej:

$v_{0} \to^{#} v_{s a}^{#}$ , $v_{0} \to v_{1} v_{s a}^{#}$ , jeśli $f (s, a) = (\overline{s}, b, 1)$ dla pewnego $b \in Σ_{T} ∖ {#}$ , $\overline{s} \in {\overline{S}}_{F}$ ,
$v_{1} \to^{#} a$ , $v_{1} \to v_{1} a$ dla każdego $a \in Σ_{T} ∖ {#}$ ,
$v_{s_{1} c} b \to c v_{s a}$ , $^{#} v_{s_{1} c} b \to^{#} c v_{s a}$ , $v_{s_{1} c} b^{#} \to c v_{s a}^{#}$ , $^{#} v_{s_{1} c} b^{#} \to^{#} c v_{s a}^{#}$ , jeśli $f (s, a) = (s_{1}, b, - 1)$ i $c \in Σ_{T} ∖ {#}$ ,
$b v_{s_{1} c} \to v_{s a} c$ , $^{#} b v_{s_{1} c} \to^{#} v_{s a} c$ , $b v_{s_{1} c}^{#} \to v_{s a} c^{#}$ , $^{#} b v_{s_{1} c}^{#} \to^{#} v_{s a} c^{#}$ , jeśli $f (s, a) = (s_{1}, b, 1)$ i $c \in Σ_{T} ∖ {#}$ ,
$v_{s_{1} b} \to v_{s a}$ , $^{#} v_{s_{1} b} \to^{#} v_{s a}$ , $v_{s_{1} b}^{#} \to v_{s a}^{#}$ , $^{#} v_{s_{1} b}^{#} \to^{#} v_{s a}^{#}$ , jeśli $f (s, a) = (s_{1}, b, 0)$ ,
$v_{s_{1} b}^{#} \to v_{s a}^{#}$ , $^{#} v_{s_{1} b}^{#} \to^{#} v_{s a}^{#}$ , jeśli istnieją $s_{1^{'}}, . . ., s_{k^{'}} \in S$ dla $k ⩾ 1$ , takie że $f (s, a) = (s_{1^{'}}, b, 1)$ , $f (s_{i^{'}}, #) = (s_{i^{'} + 1}, #, 0)$ dla $i = 1, . . ., k - 1$ oraz $f (s_{k^{'}}, #) = (s_{1}, #, - 1)$ ,
$^{#} v_{s_{1} b} \to^{#} v_{s a}$ , $^{#} v_{s_{1} b}^{#} \to^{#} v_{s a}^{#}$ , jeśli istnieją $s_{1^{'}}, . . ., s_{k^{'}} \in S$ dla $k ⩾ 1$ takie, że $f (s, a) = (s_{1^{'}}, b, - 1)$ , $f (s_{i^{'}}, #) = (s_{i^{'} + 1}, #, 0)$ dla $i = 1, . . ., k - 1$ oraz $f (s_{k^{'}}, #) = (s_{1}, #, 1)$ ,
$a^{#} \to a$ dla wszystkich $a \in Σ_{T} ∖ {#}$ ,
$^{#} v_{s a} \to a$ , $^{#} v_{s a}^{#} \to a$ , jeśli $f (s_{0}, #) = (s, #, 1)$ (porównaj założenie na początku dowodu),
$v_{0} \Rightarrow 1$ , jeśli $1 \in L$ .

Określona powyżej gramatyka $G$ jest gramatyką typu (0). Rozważmy teraz dowolne słowo $w$ , dla którego istnieje wyprowadzenie w gramatyce $G$ ze stanu początkowego $v_{0}$ przy użyciu praw 1-7. Słowo $w$ zawiera dokładnie jeden z następujących symboli $v_{s a},^{#} v_{s a}, v_{s a}^{#}$ lub $^{#} v_{s a}^{#}$ . Pierwsza litera słowa $w$ oznaczona jest markerem $#$ z lewej strony, a ostatnia litera słowa $w$ oznaczona jest markerem $#$ ze strony prawej. Ponadto żadna z liter występujących pomiędzy pierwszą a ostatnią nie jest oznaczona markerem $#$ . Z każdym takim słowem kojarzymy konfigurację poprzez zastąpienie symbolu $v_{s a}$ przez $s a$ oraz przez dopisanie symbolu $#$ po lewej lub prawej stronie znaczonej przez ten marker litery, zgodnie z jego występowaniem. Jeśli np. $w =^{#} v_{s a}^{#}$ , to skojarzona konfiguracja jest postaci $# s a #$ . Zauważmy, że jeśli słowa $u$ i $w$ są w powyższej formie, to fakt, iż $u \mapsto^{*} w$ , jest równoważny stwierdzeniu, że z konfiguracji skojarzonej ze słowem $w$ maszyna Turinga $M T$ może przejść (bezpośrednie następstwo) do konfiguracji skojarzonej ze słowem $u$ . Każdy krok obliczenia realizowanego przez $M T$ ma swój odpowiednik - krok w wyprowadzeniu w gramatyce $G$ . Z tym, że wobec praw 6 i 7 sekwencja obliczeń

v s a # \to v b s_{1^{'}} # \to . . . \to v b s_{k^{'}} # \to v s_{1} b #

jest traktowana jako jeden krok w obliczeniu prowadzonym przez maszynę Turinga. Analogicznie traktujemy sekwencję z markerem $#$ występującym po lewej stronie. Ze stanu początkowego $v_{0}$ gramatyki $G$ można wyprowadzić wszystkie słowa $w$ , dla których konfiguracja jest równa $# v s a #$ , dla pewnego $v \in (Σ_{I} ∖ {#})^{*}$ oraz maszyna Turinga realizuje obliczenie:

s a # \to b s_{1^{'}} # \to . . . \to b s_{k^{'}} # \to b # s_{1}, s_{1} \in S_{F} .

Wynika to z praw 1 i 2 skonstruowanej gramatyki $G$ . Z kolei prawa typu 9 służą do zastąpienia symboli nieterminalnych typu $^{#} v_{s a},^{#} v_{s a}^{#}$ przez litery terminalne, a prawa typu 8 eliminują symbole nieterminalne typu $a^{#}$ . A zatem dla niepustego słowa $w \in (Σ_{I} ∖ {#})^{*}$ spełniona jest równoważność

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v_{0}\mapsto_{G}^{*}w\: \Leftrightarrow \: s_{0}\#w\#\rightarrow _{TM}^{*}\#u\#s_{1}, }

gdzie $u \in (Σ_{I} ∖ {#})^{*}$ oraz $s_{1} \in S_{F}$ . Prawo 10. zapewnia, że powyższa równoważność prawdziwa jest także dla słowa pustego $1$ . A to kończy dowód tego twierdzenia.

Język $L$ nazywamy rekurencyjnie przeliczalnym, jeśli istnieje efektywny algorytm wyliczający wyłącznie słowa z $L$ . Przez efektywny algorytm rozumiemy skończony zbiór instrukcji, który w jednoznaczny sposób opisuje działanie tego algorytmu. Klasę języków rekurencyjnie przeliczalnych oznaczamy symbolem $ℛ 𝒫$ .

Zauważmy, że każda gramatyka $G$ typu (0) jest algorytmem wyliczającym wyłącznie słowa z $L = L (G)$ . Dla każdej liczby naturalnej $k$ można bowiem rozważyć skończony zbiór wyprowadzeń w $G$ , rozpoczynających się od symbolu początkowego $v_{0}$ i o długości równej $k$ . Z tego zbioru można z kolei wybrać wyłącznie te wyprowadzenia, które kończą się słowem nad alfabetem terminalnym gramatyki $G$ i tylko te słowa dodawać do listy składającej się na język $L$ . Są to, jak łatwo zauważyć, wszystkie słowa języka $L$ i nic ponadto. A zatem

Twierdzenie 3.2

Każdy język typu (0) jest językiem rekurencyjnie przeliczalnym, czyli $ℒ_{0} \subset ℛ 𝒫$ .

Język $L$ nazywamy rekurencyjnym, jeśli istnieje efektywny algorytm rozstrzygający dla każdego słowa $w \in A^{*}$ jego przynależność do języka $L$ . Klasę języków rekurencyjnych oznaczamy symbolem $ℛ$ .

Klasa języków kontekstowych zawiera się istotnie w klasie języków rekurencyjnych, o czym przekonuje poniższe twierdzenie.

Twierdzenie 3.3

Każdy język kontekstowy jest językiem rekurencyjnym, czyli $ℒ_{1} \subset ℛ .$

Dowód

Niech $L$ będzie dowolnym językiem kontekstowym. Istnieje więc gramatyka kontekstowa $G = (V_{N}, V_{T}, v_{0}, P)$ taka, że $L = L (G)$ . Bezpośrednio z definicji gramatyki kontekstowej wynika, iż słowo puste $1 \in L$ wtedy i tylko wtedy, gdy $v_{0} \to 1 \in P$ . Załóżmy teraz, że dane jest słowo $w \in V_{T}^{*}$ , o którym mamy zadecydować, czy należy do języka $L$ . W tym celu rozważmy wszystkie ciągi słów

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle y_{0}=v_{0},\: y_{1},...,y_{n-1},\: y_{n}=w}

o tej własności, że $y_{i} \in (V_{N} \cup V_{T})^{*}$ są parami różne, dla $i = 0, . . ., n$ , $n ⩾ 1$ oraz $∣ y_{i} ∣ ⩽ ∣ y_{i + 1} ∣$ . Ilość takich ciągów jest skończona i słowo $w \in L$ wtedy i tylko wtedy, gdy wśród powyższych ciągów znajdziemy choć jeden taki, że tworzy wyprowadzenie w gramatyce $G$ . Czyli

y_{0} = v_{0} \to y_{1} \to . . . \to y_{n - 1} \to y_{n} = w .

Ponieważ ilość ciągów podlegających rozważaniom jest skończona oraz ponieważ stwierdzenie, czy pomiędzy dowolnymi słowami zachodzi relacja $\to$ , sprowadza się do przeszukania skończonego zbioru praw $P$ , efektywnie rozstrzygniemy, czy $w$ należy do języka $L$ , czy też nie.

Uzyskane dotąd rezultaty możemy podsumować następująco:

ℒ (M T) \subset ℒ_{0} \subset ℛ 𝒫 .

W określeniu języka rekurencyjnie przeliczalnego oraz języka rekurencyjnego wystąpiło pojęcie efektywnego algorytmu, efektywnej procedury. Pojęcie to, intuicyjnie dość jasne, nie zostało precyzyjnie określone. Co za tym idzie, dla matematycznie poprawnych definicji języka rekurencyjnie przeliczalnego i języka rekurencyjnego należałoby sformalizować pojęcie algorytmu. W dotychczasowych rozważaniach intuicja efektywnej procedury była o tyle wystarczająca, że naszym celem było wskazanie istnienia takiej procedury. W sytuacji, gdyby naszym celem było wykazanie, że taka procedura nie istnieje, formalizacja tego pojęcia byłaby wręcz konieczna. We wszystkich takich przypadkach powszechnie przyjmuje się, że maszyna Turinga jest właśnie taką formalizacją. Na zdefiniowaną w poprzednim wykładzie maszynę Turinga można spojrzeć jako na algorytm, efektywną procedurę dającą odpowiedź pozytywną lub negatywną w zależności od akceptacji lub nieakceptowania słowa wejściowego. Proces obliczenia prowadzony przez maszynę Turinga zgadza się z intuicyjnym rozumieniem algorytmu. O tym, że każda efektywna procedura jest reprezentowana przez pewną maszynę Turinga, mówi, powszechnie przyjęta jako prawdziwa, teza Churcha.

Teza Churcha

Każda efektywna procedura (algorytm) da się opisać przez maszynę Turinga.

Konsekwencją przyjęcia tezy Churcha jest inkluzja $ℛ 𝒫 \subset ℒ (M T)$ . Biorąc pod uwagę udowodnione powyżej twierdzenia, mamy:

ℒ (M T) \subset ℒ_{0} \subset ℛ 𝒫,

co ostatecznie prowadzi do równości $ℒ_{0} = ℒ (M T)$ .

4. Rodziny $ℒ_{1}$ i $ℒ_{0}$ - zamkniętość na działania

Dla kompletności tej części wykładu przedstawimy własności zamkniętości rodziny języków kontekstowych $ℒ_{1}$ i języków typu (0) $ℒ_{0}$ ze względu na najczęściej używane operacje. W niektórych przypadkach dowody dotyczące obu klas są takie same. W dowodach posłużymy się specjalną postacią gramatyk, a mianowicie taką, w której symbole terminalne występują tylko po prawej stronie. Prawdziwe bowiem jest twierdzenie

Twierdzenie 4.1

Dla każdej gramatyki istnieje równoważna gramatyka tego samego typu taka, że każda produkcja, w której występuje symbol terminalny $a$ , jest postaci $v ⟶ a$ .

Elementarny dowód tej własności pozostawiamy jako zadanie domowe.

Twierdzenie 4.2

Rodziny $ℒ_{0}$ i $ℒ_{1}$ są zamknięte ze względu na:

sumę mnogościową,
iloczyn mnogościowy,
katenację,
iterację $*$ ,
odbicie zwierciadlane.

Dowód

1. Niech dla $i = 1, 2 G_{i} = (V_{N}^{i}, V_{T}, v_{0}^{i}, P_{i})$ będą gramatykami typu $(1)$ (odpowiednio typu $(0)$ ) takimi, że $V_{N}^{1} \cap V_{N}^{2} = \emptyset$ . I niech $L_{i} = L (G_{i})$ . Określamy gramatykę $G$ typu $(1)$ (typu $(0)$ ) generującą język $L_{1} \cup L_{2}$ .

Jeśli $1 \notin L_{1} \cup L_{2}$ , to przyjmujemy:

G = (V_{N}^{1} \cup V_{N}^{2} \cup {v_{0}}, V_{T}, v_{0}, P_{1} \cup P_{2} \cup {v_{0} \to v_{0}^{1}, v_{0} \to v_{0}^{2}}) .

Zauważmy, że wówczas w żadnej z gramatyk nie ma prawa wymazującego. Jeśli natomiast $1 \in L_{1} \cup L_{2}$ , to konstruujemy gramatykę $G$ dla języków $L_{1} ∖ {1}$ i $L_{2} ∖ {1}$ , jak powyżej, a następnie dodajemy nowy symbol początkowy ${\overline{v}}_{0}$ i prawa ${\overline{v}}_{0} \to v_{0}, {\overline{v}}_{0} \to 1$ .

2. Przecięcie udowodnimy tylko dla języków typu $(0)$ . Dowód dla języków kontekstowych został przeprowadzony wcześniej.

Niech dla $i = 1, 2 G_{i} = (V_{N}^{i}, V_{T}, v_{0}^{i}, P_{i})$ będą gramatykami typu $(0)$ takimi, że $V_{N}^{1} \cap V_{N}^{2} = \emptyset$ . Niech $L_{i} = L (G_{i})$ . Określamy gramatykę $G$ typu $(0)$ generującą język $L_{1} \cap L_{2}$ , przyjmując:

G = (V_{N}^{1} \cup V_{N}^{2} \cup V_{N}, V_{T}, v_{0}, P_{1} \cup P_{2} \cup P),

gdzie: $V_{N} = {v_{a} : a \in V_{T}} \cup {v_{0}, {\overline{v}}_{1}, {\overline{v}}_{2}}$ , a do zbioru $P$ należą prawa:
(1) $v_{0} \to {\overline{v}}_{1} v_{0}^{1} {\overline{v}}_{2} v_{0}^{2} {\overline{v}}_{1},$
(2) ${\overline{v}}_{2} a \to v_{a} {\overline{v}}_{2}$ dla $\forall a \in V_{T},$
(3) $b v_{a} \to v_{a} b$ dla $\forall a, b \in V_{T},$
(4) ${\overline{v}}_{1} v_{a} a \to a {\overline{v}}_{1}$ dla $\forall a \in V_{T},$
(5) ${\overline{v}}_{1} {\overline{v}}_{2} {\overline{v}}_{1} \to 1 .$
Przy pomocy prawa (1) i wszystkich praw ze zbioru $P_{1} \cup P_{2}$ można wygenerować zbiór słów:

{{\overline{v}}_{1} w_{1} {\overline{v}}_{2} w_{2} {\overline{v}}_{1} : w_{1} \in L_{1}, w_{2} \in L_{2}} .

Z dowolnego słowa należącego do tego zbioru, korzystając z praw (2)-(4), można wyprowadzić słowo $w_{1} {\overline{v}}_{1} {\overline{v}}_{2} {\overline{v}}_{1}$ wtedy i tylko wtedy, gdy $w_{1} = w_{2}$ . Korzystając z prawa (5), dostajemy słowo $w_{1}$ . A więc $L (\overline{G}) = L_{1} \cap L_{2}$ .

3. Niech dla $i = 1, 2 G_{i} = (V_{N}^{i}, V_{T}, v_{0}^{i}, P_{i})$ będą tak jak poprzednio gramatykami typu $(1)$ ( $(0)$ ) takimi, że $V_{N}^{1} \cap V_{N}^{2} = \emptyset$ oraz spełniającymi warunki powyższego twierdzenia. Niech $L_{i} = L (G_{i})$ . Określamy gramatykę $G$ odpowiednio typu $(1)$ ( $(0)$ ) generującą język $L_{1} L_{2}$ .

Jeśli $1 \notin L_{1} \cup L_{2}$ , to przyjmujemy:

G = (V_{N}^{1} \cup V_{N}^{2} \cup {v_{0}}, V_{T}, v_{0}, P_{1} \cup P_{2} \cup {v_{0} \to v_{0}^{1} v_{0}^{2}}) .

Jeśli $1 \in L_{1} \cup L_{2}$ , to oznaczamy $L_{1^{'}} = L_{1} ∖ {1}, L_{2^{'}} = L_{2} ∖ {1}$ . Wówczas:

Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \displaystyle L_{1}L_{2}=\left\{ \begin{array} {lll} L_{1}'L_{2}'\cup L_{1}', & gdy & 1\in L_{2},\: 1\notin L_{1},\\ L_{1}'L_{2}'\cup L_{2}', & gdy & 1\in L_{1},\: 1\notin L_{2},\\ L_{1}'L_{2}'\cup L_{1}'\cup L_{2}'\cup \left\{ 1\right\}, & gdy & 1\in L_{1},\: 1\in L_{2}. \end{array} \right. }

Wykorzystując poprzednią konstrukcję i zamkniętość ze względu na sumę w każdym z tych przypadków, otrzymujemy gramatykę generującą katenację języków $L_{1}$ i $L_{2}$ .

4. Niech $G = (V_{N}, V_{T}, v_{0}, P)$ będzie gramatyką typu $(1)$ (typu $(0)$ ) taką, że symbole terminalne nie występują po lewej stronie żadnej produkcji z $P$ . Załóżmy też, że $1 \notin L = L (G)$ . Gramatyka

\overline{G} = (V_{N} \cup {{\overline{v}}_{0}, {\overline{v}}_{1}}, V_{T}, {\overline{v}}_{0}, \overline{P}),

gdzie

Parser nie mógł rozpoznać (nieznana funkcja „\begin{array}”): {\displaystyle \displaystyle \overline{P}=P\cup \begin{array} [t]{l} \left\{ \overline{v}_{0}\rightarrow 1,\: \overline{v}_{0}\rightarrow v_{0},\: \overline{v}_{0}\rightarrow \overline{v}_{1}v_{0}\right\} \cup \\ \left\{ \overline{v}_{1}a\rightarrow \overline{v}_{1}v_{0}a\, :\, a\in V_{T}\right\} \cup \\ \left\{ \overline{v}_{1}a\rightarrow v_{0}a\, :\, a\in V_{T}\right\} \end{array} }

generuje język $L^{*}$ . Jeśli $1 \in L$ , to usuwamy prawo wymazujące $v_{0} \to 1$ i dla języka $L ∖ {1}$ konstruujemy gramatykę $\overline{G}$ . Z faktu, że $(L \cup {1})^{*} = L^{*}$ , wynika, że również $L (\overline{G}) = L^{*}$ .

5. Jeśli $G = (V_{N}, V_{T}, v_{0}, P)$ jest gramatyką typu $(1)$ (typu $(0)$ ) taką, że $L (G) = L$ , to gramatyka $\overset{\leftarrow}{G} = (V_{N}, V_{T}, v_{0}, \overset{\leftarrow}{P})$ , gdzie $\overset{\leftarrow}{P} = {\overset{\leftarrow}{x} \to \overset{\leftarrow}{y} : x \to y \in P}$ generuje język $\overset{\leftarrow}{L}$ .

Zauważmy na koniec, że rodzina $ℒ_{0}$ nie jest zamknięta ze względu na uzupełnienie. Stwierdzenie to wynika z przyjęcia jako obowiązujacej tezy Churcha, która w tym wypadku implikuje równość rodziny języków $ℒ_{0}$ i rodziny języków rekurencyjnie przeliczalnych oraz z faktu, iż istnieje język rekurencyjnie przeliczalny, którego uzupełnienie nie jest rekurencyjnie przeliczalne. Ten ostatni fakt podajemy bez dowodu. Dodajmy, że własność zamkniętości ze względu na uzupełnienie dla rodziny $ℒ_{1}$ przez długi czas pozostawała problemem otwartym. Dopiero w roku 1987 udowodniono, iż własność ta jest spełniona dla języków kontekstowych. Podsumowanie własności zamkniętości ze względu na działania dla różnych klas języków hierarchii Chomsky'ego zawarte jest w poniższej tabeli:

	3	2	1	0
$\cup$	T	T	T	T
$\cdot$	T	T	T	T
$⋆$	T	T	T	T
$∖$	T	N	T	N
$\cap$	T	N	T	T

Na koniec podamy twierdzenie o wzajemnych relacjach pomiędzy rodzinami języków z hierarchii Chomsky'ego. Dowód tego twierdzenia wynika w części z definicji typów gramatyk wprowadzonych na wykładzie 2, a w części z udowodnionych własności poszczególnych rodzin języków z hierarchii Chomsky'ego (zakładając obowiązywanie tezy Churcha).

Twierdzenie 4.3

Rodziny języków hierarchii Chomsky'ego spełniają następujące relacje:

ℒ_{0} \subseteq_{/} ℒ_{1} \subseteq_{/} ℒ_{2} \subseteq_{/} ℒ_{3} .

5. Problemy rozstrzygalne

W poprzednim wykładzie uzasadniliśmy, że dla każdej deterministycznej maszyny Turinga jesteśmy w stanie wskazać taką która akceptuje dany język i jednocześnie zatrzymuje się tylko na słowach akceptowanych. Wymagało to przejścia przez maszynę niedeterministyczną a następnie jej symulację na maszynie deterministycznej. Z tego powodu ograniczamy się w dalszej części wykładu tylko do tego typu maszyn Turinga (akceptacja=stop). Jak to uzasadniono wcześniej, przy założeniu Tezy Churcha, maszyna Turinga może być rozpatrywana jako matematycznie ścisła definicja algorytmu.

Pojęcie rozstrzygalnego problemu zostało wprowadzone wcześniej, na innym wykładzie i jest ono znane. Przypomnijmy więc tylko, że rozstrzygalność czy też nierozstrzygalność odnosi się do pewnej klasy, którą tworzą określone przypadki ustalonego problemu. Jeśli istnieje algorytm, który rozwiązuje taki problem dla wszystkich przypadków w tej klasy, to mówimy, że problem jest rozstrzygalny (w tej klasie). Zatem taki algorytm jest uniwersalnym sposobem rozwiązywania problemu dla wszystkich danych wejściowych określających poszczególne przypadki w tej klasie. Jak łatwo zauważyć dla ustalenia rozstrzygalności problemu wystarczy się opierać na intuicyjnym pojęciu algorytmu. Są jednak takie problemy, dla których nie istnieje, w rozważanej klasie przypadków, uniwersalny sposób ich rozwiazywania. Takie problemy nazywamy nierozstrzygalnymi w danej klasie. Aby wykazać nierozstrzygalność jakiegoś problemu, nieodzownym jest sformalizowanie pojęcia algorytmu. Standardowo taką formalizacją jest, o czym wspomniano już wcześniej, maszyna Turinga.

Zwróćmy uwagę, że maszyna Turinga akceptuje języki, gdy tym czasem przyzwyczajeni jesteśmy, że algorytmy (programy) rozwiązują pewne, niekiedy bardzo skomplikowane problemy (określone przy pomocy list, kolejek, grafów itp.). Zwracamy zatem uwagę na fakt, że w przypadku maszyny Turinga musimy wykonać wstępne umowne kodowanie naszego problemu. W tym przypadku rozważany język określa te spośród "sensownych" kodowań, które stanowią rozwiązanie postawionego problemu. Z drugiej strony maszyna akceptując słowo $♯ w_{1} $ w_{2} ♯$ może informować nas o tym, że wynikiem obliczeń numerycznych na danych zakodowanych w $w_{1}$ rzeczywiście jest liczba zakodowana w $w_{2}$ itp.

Dla ilustracji powyższych dywagacji rozważmy problem skończoności w klasie jezyków regularnych. Problem ten jest rozstrzygalny, bo w oparciu o lemat o pompowaniu można skonstruować algorytm, który dla dowolnego języka regularnego rozstrzygnie, czyli odpowie twierdząco lub przecząco na pytanie o jego skończoność. W tym przypadku można np. przyjąć, że jako słowo wejściowe podajemy zakodowany opis gramatyki generującej język.

Nierozstrzygalność algorytmiczna problemu w ustalonej klasie nie oznacza, podkreślmy, niemożliwości rozwiazania konkretnego zadania z tej klasy. Nierostrzygalność oznacza niemożliwość rozwiązania za pomocą tego samego algorytmu, tej samej metody, wszystkich przypadków tego problemu należących do danej klasy.

W zamieszczonej poniżej tabeli przedstawiamy najczęściej rozważane pod kątem rozstrzygalności problemy z dziedziny języków formalnych w ramach hierarchii Chomsky'ego. Litera R oznacza rozstrzygalność problemu, N nierostrzygalność, a znak - pojawiający się przy problemie jednoznaczności oznacza, że problemu tego nie formułuje się dla gramatyk kontekstowych i typu (0).

własność	(3)	(2)	(1)	(0)
należenie $w \in L$	R	R	R	N
inkluzja $L_{1} \subset L_{2}$	R	N	N	N
równoważność	R	N	N	N
pustość $L = \emptyset$	R	R	N	N
nieskończoność $c a r d L = ℵ_{0}$	R	R	N	N
jednoznaczność gramatyki	R	N	-	-

Najczęściej używaną metodą dowodzenia nierozstrzygalności problemu $P$ jest redukcja tego problemu do innego, powiedzmy $P^{'}$ , dla którego nierozstrzygalność została ustalona wcześniej. Redukcja taka prowadzi do sformułowania implikacji:

jeśli $P$ byłby rozstrzygalny, to i $P^{'}$ byłby rozstrzygalny.

A ponieważ to ostatnie (następnik implikacji) nie jest prawdą, więc problem $P$ nie jest rozstrzygalny.

Należy w tym miejscu podkreślić fakt, że dowody nierozstrzygalności problemów uniwersalnych (takich jak problem Posta rozważany dalej) wiążą się z konstrukcją odpowiednich maszyn Turinga, kodowaniem problemu, a następnie dowodem uzasadniającym, że problem jest rzeczywiście nierozstrzygalny. Tematyka ta wykracza poza ramy wykładu. Z tego też powodu ograniczymy się tutaj do zaprezentowania jednego ze znanych problemów nierozstrzygalnych bez dowodu nierozstrzygalności.

Najczęściej występującym w literaturze problemem nierozstrzygalnym jest, bez wątpienia, problem Posta przedstawiony poniżej.

Problem Posta

Dla dowolnego alfabetu $A$ , o co najmniej dwóch elementach ( $♯ A ⩾ 2$ ), załóżmy, iż dana jest, tak zwana, lista słów, a dokładniej par słów Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \left( u_{1},w_{1}\right) \: \left( u_{2},w_{2}\right) \: \ldots \left( u_{n},w_{n}\right), } gdzie $u_{i}, w_{i} \in A^{+}$ , $n \in ℕ$ . Mówimy, że taka lista ma własność Posta (problem Posta ma rozwiązanie), jeśli istnieje ciąg indeksów $i_{1}, \dots, i_{k} \in {1, . . ., n}$ taki, że

u_{i_{1}} \dots u_{i_{k}} = w_{i_{1}} \dots w_{i_{k}} .

Jest to w ogólnym przypadku problem nierozstrzygalny.

Problem ten można sformułować równoważnie następująco. Niech $A$ będzie alfabetem interpretowanym jako zbiór indeksów, a $B$ dowolnym alfabetem. Niech Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle h:A^{*}\longrightarrow B^{*},\: g:A^{*}\longrightarrow B^{*} } będą dowolnymi homomorfizmami. Problem Posta, inaczej sformułowany, polega na odpowiedzi na pytanie, czy istnieje słowo $x \in A^{+}$ takie, że $h (x) = g (x)$ .

Dwa kolejne przykłady ilustrują technikę redukcji pewnych problemów do problemu Posta. W efekcie uzyskujemy nierozstrzygalność w sposób opisany powyżej.

Twierdzenie 5.1

W klasie gramatyk bezkontekstowych problem niejednoznaczności jest nierozstrzygalny.

Dowód

Udowodnimy, że problem jest nierozstrzygalny dla gramatyk bezkontekstowych generujących jązyki nad alfabetem dwuelementowym $A = {a, b}$ . Oznaczmy $B = {d, e}$ i określmy homomorfizm $h : B^{*} ⟶ A^{*}$ , przyjmując $h (d) = b a^{2}$ oraz $h (e) = b a^{3}$ . Niech $u$ będzie ciągiem $u_{1}, . . ., u_{n} \in B^{+}$ dowolnie wybranych i ustalonych słów. Dla dowolnej liczby naturalnej $i > 0$ niech $\overline{i} = d e^{i}$ . Określony poniżej język

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L_{u}=\{h(\overline{i_{1}}).....h(\overline{i_{k}})bah(u_{i_{k}}),...,h(u_{i_{1}})\in A^{*}\: :\: k\geqslant 1,\: 1\leqslant i_{j}\leqslant n\}}

jest językiem bezkontekstowym, jako generowany przez gramatykę $G_{u} = (V_{N}, V_{T}, v_{0}, P_{u})$ , dla której

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle V_{N}=\{v_{u}\},\: V_{T}=\{a,b\},\: v_{0}=v_{u} } oraz Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle P_{x}=\{v_{u}\rightarrow h(\overline{i})v_{u}h(u_{i}),\: v_{u}\rightarrow h(\overline{i})bah(u_{i})\} } .

Niech teraz $u$ i $w$ oznaczają ciągi dowolnie wybranych i ustalonych słów $u_{1}, . . ., u_{n} \in B^{+}$ i $w_{1}, . . ., w_{n} \in B^{+}$ . Tworzą one listę słów Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \left( u_{1},w_{1}\right) \: \left( u_{2},w_{2}\right) \: \ldots \left( u_{n},w_{n}\right), } . Zatem zasadne jest postawienie pytania, czy lista ta ma własność Posta. Niech $G_{u}$ oraz $G_{w}$ będą gramatykami bezkontekstowymi określonymi tak jak powyżej. Gramatyka $G = ({v_{0}, v_{u}, v_{w}}, {a, b}, v_{0}, P)$ , gdzie Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle P=\{v_{0}\rightarrow v_{u},\: v_{0}\rightarrow v_{w}\}\cup P_{u}\cup P_{w} } jest bezkontekstowa. Gramatyka ta jest niejednoznaczna wtedy i tylko wtedy, gdy $L_{u} \cap L_{y} \neq \emptyset$ . Ten ostatni warunek równoważny jest istnieniu liczb $i_{1}, . . ., i_{k} \in ℕ$ takich, że $u_{i_{1}} . . . . . u_{i_{k}} = w_{i_{1}} . . . . . w_{i_{k}}$ , czyli własności Posta listy Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \left( u_{1},w_{1}\right) \: \left( u_{2},w_{2}\right) \: \ldots \left( u_{n},w_{n}\right) } .Ostatecznie więc rozstrzygalność problemu niejednoznaczności w klasie gramatyk bezkontekstowych prowadziłaby do rozstrzygalności własności Posta.

Dla drugiego przykładu przyjmijmy jako alfabety Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle A_{2}=\left\{ a,b\right\} ,\: A_{3}=\left\{ a,b,c\right\} } oraz określmy język

L = {v_{1} c v_{2} c {\overset{\leftarrow}{v}}_{2} c {\overset{\leftarrow}{v}}_{1} : v_{1}, v_{2} \in A_{2}^{*}} .

Ustalmy listę Posta Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \left( u_{1},w_{1}\right) \: \left( u_{2},w_{2}\right) \: \ldots \left( u_{n},w_{n}\right) } nad alfabetem $A_{2}$ , gdzie $u_{i}, w_{i} \in A_{2}^{+}$ . Wprowadzamy teraz języki Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L_{u},\: L_{w}\: L_{PP} } nad alfabetem $A_{3}$ przyjmując:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned L_{u} &= \left\{ ba^{i_{k}}b\ldots ba^{i_{1}}cu_{i_{1}}\ldots u_{i_{k}}\, :\, k\geqslant 1,1\leqslant i_{j}\leqslant n\right\} \\ L_{w} &= \left\{ ba^{i_{k}}b\ldots ba^{i_{1}}cw_{i_{1}}\ldots w_{i_{k}}\, :\, k\geqslant 1,1\leqslant i_{j}\leqslant n\right\} \endaligned}

oraz definiujemy język

L_{P P} = L_{u} c {\overset{\leftarrow}{L}}_{w} .

Określone powyżej języki nad alfabetem $A_{3}$ mają własności konieczne do zastosowania lematu, który przytoczymy bez dowodu.

Lemat 5.1

Języki Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L,\: L_{PP},\: A_{3}^{*}\setminus L,\: A_{3}^{*}\setminus L_{PP} } są bezkontekstowe.

Dla języków $L$ i $L_{P P}$ uzasadnienie ich bezkontekstowości jest proste poprzezkonstrukcję odpowiednich gramatyk. Aby uzyskać bezkontekstowość ich uzupełnień, należy podzielić rozważane języki na rozłączne podzbiory i konstruować gramatyki bezkontekstowe dla tych wyróżnionych podzbiorów, a w końcu wykorzystać fakt, że suma języków bezkontekstowych jest językiem bezkontekstowym.

Zauważmy teraz, że istnienie rozwiązania problemu Posta nad alfabetem $A_{3}$ jest równoważne temu, że $L_{P P} \cap L \neq \emptyset$ .

Jeśli bowiem $L_{P P} \cap L ∋ b a^{i_{k}} \dots b a^{i_{1}} c u_{i_{1}} \dots u_{i_{k}} c \overset{\leftarrow}{w_{i_{1}} \dots w_{i_{k}}} c a^{i_{1}} b \dots a^{i_{k}} b$ , gdzie $k ⩾ 1, 1 ⩽ i_{j} ⩽ n$ , to oczywiście $u_{i_{1}} \dots u_{i_{k}} = w_{i_{1}} \dots w_{i_{k}}$ . Jeśli ciąg $i_{1}, \dots, i_{k}$ jest rozwiązaniem problemu Posta, to $(i_{1}, \dots, i_{k}) (i_{1}, \dots, i_{k})$ też. Zatem jeśli $L_{P P} \cap L \neq \emptyset$ , to język $L_{P P} \cap L$ jest nieskończony.

Wobec nierozstrzygalności problemu Posta wnioskujemy, że nierozstrzygalny jest problem pustości i problem nieskończoności przecięcia $L_{1} \cap L_{2}$ w klasie języków bezkontekstowych.

@@ Linia 563: / Linia 563: @@
 {{twierdzenie|4.2||}}
 Rodziny  <math>\displaystyle \mathcal{L}_{0}  </math>  i  <math>\displaystyle \mathcal{L}_{1}  </math>  są zamknięte
-ze względu na
+ze względu na:
 #  {{kotwica|pkt.1|}}sumę mnogościową,
 #  {{kotwica|pkt.2|}}iloczyn mnogościowy,
@@ Linia 573: / Linia 573: @@
 [[#pkt.1|1.]] Niech dla  <math>\displaystyle i=1,2  \displaystyle G_{i}=(V_{N}^{i},V_{T},v_{0}^{i},P_{i})  </math>  będą gramatykami
-typu  <math>\displaystyle (1)  </math>  (odpowiednio typu  <math>\displaystyle (0)  </math> ), takimi, że  <math>\displaystyle V_{N}^{1}\cap V_{N}^{2}=\emptyset   </math> . I niech  <math>\displaystyle L_{i}=L(G_{i})  </math> .
+typu  <math>\displaystyle (1)  </math>  (odpowiednio typu  <math>\displaystyle (0)  </math> ) takimi, że  <math>\displaystyle V_{N}^{1}\cap V_{N}^{2}=\emptyset   </math> . I niech  <math>\displaystyle L_{i}=L(G_{i})  </math> .
 Określamy gramatykę  <math>\displaystyle G  </math>  typu  <math>\displaystyle (1)  </math>  (typu  <math>\displaystyle (0)  </math> )
 generującą język  <math>\displaystyle L_{1}\cup L_{2}  </math> .
-Jeśli  <math>\displaystyle 1\notin L_{1}\cup L_{2}  </math> , to przyjmujemy
+Jeśli  <math>\displaystyle 1\notin L_{1}\cup L_{2}  </math> , to przyjmujemy:
 <center><math>\displaystyle G=(V_{N}^{1}\cup V_{N}^{2}\cup \left\{ v_{0}\right\}
@@ Linia 596: / Linia 596: @@
 Niech dla  <math>\displaystyle i=1,2  \displaystyle G_{i}=(V_{N}^{i},V_{T},v_{0}^{i},P_{i})  </math>
-będą gramatykami typu  <math>\displaystyle (0)  </math> , takimi, że  <math>\displaystyle V_{N}^{1}\cap
+będą gramatykami typu  <math>\displaystyle (0)  </math> takimi, że  <math>\displaystyle V_{N}^{1}\cap
 V_{N}^{2}=\emptyset   </math> . Niech  <math>\displaystyle L_{i}=L(G_{i})  </math> . Określamy
 gramatykę  <math>\displaystyle G  </math>  typu  <math>\displaystyle (0)  </math>  generującą język  <math>\displaystyle L_{1}\cap L_{2}
-</math>  przyjmując
+</math>,  przyjmując:
 <center><math>\displaystyle G=(V_{N}^{1}\cup V_{N}^{2}\cup V_{N},V_{T},v_{0},P_{1}\cup P_{2}\cup
@@ Linia 605: / Linia 605: @@
 gdzie:  <math>\displaystyle V_{N}=\left\{ v_{a}\, :\, a\in V_{T}\right\} \cup \left\{ v_{0},\overline{v}_{1},\overline{v}_{2}\right\}   </math> ,
-a do zbioru  <math>\displaystyle P  </math>  należą prawa <br>
+a do zbioru  <math>\displaystyle P  </math>  należą prawa: <br>
-(1)  <math>\displaystyle v_{0}\rightarrow \overline{v}_{1}v_{0}^{1}\overline{v}_{2}v_{0}^{2}\overline{v}_{1}  </math> <br>
+(1)  <math>\displaystyle v_{0}\rightarrow \overline{v}_{1}v_{0}^{1}\overline{v}_{2}v_{0}^{2}\overline{v}_{1},  </math> <br>
-(2)  <math>\displaystyle \overline{v}_{2}a\rightarrow v_{a}\overline{v}_{2}  </math>  dla  <math>\displaystyle \forall a\in V_{T}  </math> <br>
+(2)  <math>\displaystyle \overline{v}_{2}a\rightarrow v_{a}\overline{v}_{2}  </math>  dla  <math>\displaystyle \forall a\in V_{T},  </math> <br>
-(3)  <math>\displaystyle bv_{a}\rightarrow v_{a}b  </math>  dla  <math>\displaystyle \forall a,b\in V_{T}  </math> <br>
+(3)  <math>\displaystyle bv_{a}\rightarrow v_{a}b  </math>  dla  <math>\displaystyle \forall a,b\in V_{T},  </math> <br>
-(4)  <math>\displaystyle \overline{v}_{1}v_{a}a\rightarrow a\overline{v}_{1}  </math>  dla  <math>\displaystyle \forall a\in V_{T}  </math> <br>
+(4)  <math>\displaystyle \overline{v}_{1}v_{a}a\rightarrow a\overline{v}_{1}  </math>  dla  <math>\displaystyle \forall a\in V_{T},  </math> <br>
-(5)  <math>\displaystyle \overline{v}_{1}\overline{v}_{2}\overline{v}_{1}\rightarrow 1  </math> <br>
+(5)  <math>\displaystyle \overline{v}_{1}\overline{v}_{2}\overline{v}_{1}\rightarrow 1.  </math> <br>
 Przy pomocy prawa (1) i wszystkich praw ze zbioru  <math>\displaystyle P_{1}\cup P_{2}
-</math>  można wygenerować zbiór słów
+</math>  można wygenerować zbiór słów:
 <center><math>\displaystyle \left\{ \overline{v}_{1}w_{1}\overline{v}_{2}w_{2}\overline{v}_{1}\,
@@ Linia 618: / Linia 618: @@
 Z dowolnego słowa należącego do tego zbioru, korzystając
-z praw (2)-(4) można wyprowadzić słowo  <math>\displaystyle w_{1}\overline{v}_{1}\overline{v}_{2}\overline{v}_{1}  </math>  wtedy i
+z praw (2)-(4), można wyprowadzić słowo  <math>\displaystyle w_{1}\overline{v}_{1}\overline{v}_{2}\overline{v}_{1}  </math>  wtedy i
-tylko wtedy, gdy  <math>\displaystyle w_{1}=w_{2}  </math> . Korzystając z prawa (5)
+tylko wtedy, gdy  <math>\displaystyle w_{1}=w_{2}  </math> . Korzystając z prawa (5), dostajemy słowo  <math>\displaystyle w_{1}  </math> . A więc  <math>\displaystyle L(\overline{G})=L_{1}\cap
-dostajemy słowo  <math>\displaystyle w_{1}  </math> . A więc  <math>\displaystyle L(\overline{G})=L_{1}\cap
 L_{2}  </math> .
@@ Linia 629: / Linia 628: @@
 język  <math>\displaystyle L_{1}L_{2}  </math> .
-Jeśli  <math>\displaystyle 1\notin L_{1}\cup L_{2}  </math> , to przyjmujemy
+Jeśli  <math>\displaystyle 1\notin L_{1}\cup L_{2}  </math> , to przyjmujemy:
 <center><math>\displaystyle G=(V_{N}^{1}\cup V_{N}^{2}\cup \left\{ v_{0}\right\}
@@ Linia 636: / Linia 635: @@
 Jeśli  <math>\displaystyle 1\in L_{1}\cup L_{2}  </math> , to oznaczamy  <math>\displaystyle L_{1}'=L_{1}\setminus \left\{ 1\right\} ,\; \; L_{2}'=L_{2}\setminus
-\left\{ 1\right\}   </math> . Wówczas
+\left\{ 1\right\}   </math> . Wówczas:
 <center><math>\displaystyle L_{1}L_{2}=\left\{ \begin{array} {lll}
-L_{1}'L_{2}'\cup L_{1}' & gdy & 1\in L_{2},\: 1\notin L_{1}\\
+L_{1}'L_{2}'\cup L_{1}', & gdy & 1\in L_{2},\: 1\notin L_{1},\\
-L_{1}'L_{2}'\cup L_{2}' & gdy & 1\in L_{1},\: 1\notin L_{2}\\
+L_{1}'L_{2}'\cup L_{2}', & gdy & 1\in L_{1},\: 1\notin L_{2},\\
-L_{1}'L_{2}'\cup L_{1}'\cup L_{2}'\cup \left\{ 1\right\}  & gdy &
+L_{1}'L_{2}'\cup L_{1}'\cup L_{2}'\cup \left\{ 1\right\},  & gdy &
-\in L_{1},\: 1\in L_{2}
+\in L_{1},\: 1\in L_{2}.
 \end{array} \right. </math></center>
 Wykorzystując poprzednią konstrukcję i zamkniętość
-ze względu na sumę w każdym z tych przypadków otrzymujemy gramatykę
+ze względu na sumę w każdym z tych przypadków, otrzymujemy gramatykę
 generującą katenację języków  <math>\displaystyle L_{1}  </math>  i  <math>\displaystyle L_{2}  </math> .
@@ Linia 684: / Linia 683: @@
 zamknięta ze względu na uzupełnienie.
 Stwierdzenie to
-wynika z przyjęcia jako obowiązujacej Tezy Churcha, która w tym
+wynika z przyjęcia jako obowiązujacej tezy Churcha, która w tym
 wypadku implikuje równość rodziny języków  <math>\displaystyle \mathcal{L}_{0}  </math>  i
 rodziny języków rekurencyjnie przeliczalnych oraz z faktu, iż
@@ Linia 696: / Linia 695: @@
 Podsumowanie własności zamkniętości ze względu na działania dla
 różnych klas języków hierarchii Chomsky'ego zawarte jest w poniższej
-tabeli.
+tabeli:
 {| border=1 align=center
@@ Linia 721: / Linia 720: @@
 wynika w&nbsp;części  z definicji typów gramatyk wprowadzonych na wykładzie 2, a w części
 z udowodnionych własności poszczególnych rodzin języków z
-hierarchii Chomsky'ego (zakładając obowiązywanie Tezy Churcha).
+hierarchii Chomsky'ego (zakładając obowiązywanie tezy Churcha).
 {{twierdzenie|4.3||
-Rodziny języków  hierarchii Chomsky'ego spełniają następujące relacje
+Rodziny języków  hierarchii Chomsky'ego spełniają następujące relacje:
 <center><math>\displaystyle \mathcal{L}_{0}\subseteq \! \! \! \! \! \! _{/}\, \mathcal{L}_{1}
 \subseteq \! \! \! \! \! \! _{/}\, \mathcal{L}_{2}
-\subseteq \! \! \! \! \! \! _{/}\, \mathcal{L}_{3}
+\subseteq \! \! \! \! \! \! _{/}\, \mathcal{L}_{3}.
-</math>.</center>
+</math></center>
 }}

Języki, automaty i obliczenia/Wykład 13: Złożoność obliczeniowa.: Różnice pomiędzy wersjami

Wersja z 19:37, 2 wrz 2006

Spis treści

1. Klasy złożoności obliczeniowej

2. Redukcja i problemy zupełne

3. Języki maszyn Turinga i rodzina $ℒ_{0}$

4. Rodziny $ℒ_{1}$ i $ℒ_{0}$ - zamkniętość na działania

5. Problemy rozstrzygalne

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia

Języki, automaty i obliczenia/Wykład 13: Złożoność obliczeniowa.: Różnice pomiędzy wersjami

Wersja z 19:37, 2 wrz 2006

1. Klasy złożoności obliczeniowej

2. Redukcja i problemy zupełne

3. Języki maszyn Turinga i rodzina ℒ0

4. Rodziny ℒ1 i ℒ0 - zamkniętość na działania

5. Problemy rozstrzygalne

Menu nawigacyjne

Szukaj

3. Języki maszyn Turinga i rodzina $ℒ_{0}$

4. Rodziny $ℒ_{1}$ i $ℒ_{0}$ - zamkniętość na działania