Języki, automaty i obliczenia/Wykład 12: Języki kontekstowe i automat liniowo ograniczony. Maszyna Turinga: Różnice pomiędzy wersjami

Wersja z 18:07, 2 wrz 2006

W tym wykładzie omówimy języki i gramatyki kontekstowe oraz ich własności. Wprowadzimy automat liniowo ograniczony i uzasadnimy równość rodziny języków kontekstowych i rodziny języków rozpoznawanych przez automaty liniowo ograniczone. Zdefiniujemy maszynę Turinga i pokażemy równoważność tego modelu z wybranymi innymi modelami obliczeń.

W tym wykładzie omówimy kolejną rodzinę języków hierarchii Chomsky'ego, a mianowicie języki kontekstowe. Przedstawimy kilka własnosci gramatyk kontekstowych, czyli typu (1) oraz wprowadzimy pojęcie automatu liniowo ograniczonego. Wprowadzimy też najogólniejszy model obliczeń, a mianowicie maszynę Turinga.

1. Języki kontekstowe

Języki kontekstowe to kolejna rodzina języków w hierarchii Chomsky'ego. Rozszerza ona istotnie rodzinę języków bezkontekstowych. Wykorzystanie tej rodziny języków formalnych jest dość ograniczone. Brak jest bowiem praktycznych metod konstrukcji parserów dla tych gramatyk.

Ta część wykładu prezentuje gramatyki równoważne gramatykom kontekstowym, posiadające pewne określone własności. Te własności wykorzystuje się przy uzasadnieniu faktu, że rodzina języków kontekstowych pokrywa się z rodziną języków rozpoznawanych przez automaty liniowo ograniczone. Biorąc pod uwagę to, że zastosowania tej rodziny języków formalnych nie są powszechne oraz to, że dowody dla przedstawionych poniżej twierdzeń są mocno techniczne, postanowiliśmy zrezygnować z rygorystycznej prezentacji tego materiału i pominąć dowody. Zainteresowany Student może je znaleźć w literaturze wskazanej do tego przedmiotu.

Definicja 1.1

Gramatykę $G = (V_{N}, V_{T}, v_{0}, P)$ nazywamy rozszerzającą, jeśli każde prawo jest postaci $x \to y$ , gdzie $x, y \in (V_{N} \cup V_{T})^{*}$ i spełniona jest nierówność $∣ x ∣ ⩽ ∣ y ∣$ lub jest to prawo $v_{0} \to 1$ i wtedy $v_{0}$ nie występuje po prawej stronie w żadnej produkcji z $P$ .

Wprost z definicji wynika, że gramatyka kontekstowa jest gramatyką rozszerzającą. Prawdziwe jest również następujące twierdzenie.

Twierdzenie 1.1

Dla dowolnej gramatyki $G = (V_{N}, V_{T}, v_{0}, P)$ rozszerzającej istnieje równoważna gramatyka kontekstowa.

Wprowadzimy teraz gramatyki z markerem końca.

Definicja 1.2

Gramatyką z markerem końca $♯$ nazywamy gramatykę $G_{♯} = (V_{N} \cup {♯}, V_{T}, v_{0}, P)$ taką, że $♯ \notin V_{N} \cup V_{T}$ oraz prawa są postaci: $u \to v$ , $♯ u \to ♯ v$ lub $u ♯ \to v ♯$ , gdzie $u, v \in (V_{N} \cup V_{T})^{*}$ i w słowie $u$ występuje co najmniej jeden symbol nieterminalny z $V_{N}$ . Językiem generowanym przez tę gramatykę nazywamy zbiór

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(G_{\sharp })=\{w\in V_{T}^{*}:\: \sharp v_{0}\sharp \mapsto^{*}\sharp w\sharp \}. }

Gramatyka z markerem końca $G_{♯}$ jest kontekstowa (typu $1$ ), jeśli jej prawa po wymazaniu markera $♯$ spełniają warunki gramatyki rozszerzającej. Oczywiście dla dowolnej gramatyki kontekstowej istnieje równoważna gramatyka kontekstowa z markerem końca. Prawdziwe jest również następujące twierdzenie:

Twierdzenie 1.2

Dla dowolnej gramatyki kontekstowej z markerem końca istnieje równoważna gramatyka kontekstowa.

Dowód

Niech $G_{♯} = (V_{N} \cup {♯}, V_{T}, v_{0}, P)$ będzie dowolną gramatyką kontekstową z markerem końca. Zakładamy, bez ograniczania ogólności rozważań, że w zbiorze $P$ nie występuje prawo $v_{0} \to 1$ (po wymazaniu markera $♯$ ). Dla każdego symbolu $x$ ze zbioru $V = V_{N} \cup V_{T}$ określamy trzy symbole Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \, ^{\sharp }x,x^{\sharp },^{\: \sharp }x^{\sharp } } oraz oznaczamy odpowiednio przez $^{♯} V, V^{♯},^{♯} V^{♯}$ zbiory tych symboli. Dla $u = u_{1} . . . u_{k}$ takiego, że $k ⩾ 1$ i $u_{i} \in V$ dla $i = 1, . . ., k$ wprowadzamy także następujące oznaczenia:

$^{♯} u =^{♯} u_{1} u_{2} . . . u_{k}$ , $u^{♯} = u_{1} . . . u_{k - 1} u_{k}^{♯}$ oraz $^{♯} u^{♯} =^{♯} u_{1} u_{2} . . . u_{k - 1} u_{k}^{♯}$ gdy $k > 1$ .

Przy takich oznaczeniach definiujemy gramatykę

G_{1} = (V_{N} \cup^{♯} V \cup V^{♯} \cup^{♯} V^{♯}, V_{T},^{♯} v_{0}^{♯}, P_{1}),

w której zbiór praw $P_{1}$ składa się ze wszystkich praw uzyskanych zgodnie z poniższymi warunkami:

jeśli $u \to w \in P$ , to Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle u\rightarrow w,\: ^{\#}u\rightarrow \, ^{\#}w,\: u^{\#}\rightarrow w^{\#},\: ^{\#}u^{\#}\rightarrow \, ^{\#}w^{\#}\in P_{1}, }
jeśli $^{#} u \to^{#} w \in P$ , to Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \: u^{\#}\rightarrow w^{\#},\: ^{\#}u^{\#}\rightarrow \, ^{\#}w^{\#}\in P_{1}, }
jeśli $u^{#} \to w^{#} \in P$ , to Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle u^{\#}\rightarrow w^{\#},\: ^{\#}u^{\#}\rightarrow \, ^{\#}w^{\#}\in P_{1}, }
Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \, ^{\#}x\rightarrow x,\: x^{\#}\rightarrow x,\: ^{\#}x^{\#}\rightarrow x\in P_{1} }

dla wszystkich $x \in V$ .

Określona w ten sposób gramatyka $G_{1}$ jest gramatyką rozszerzającą i równoważną wyjściowej. Dla gramatyki $G_{1}$ istnieje, zgodnie z poprzednim twierdzeniem, równoważna gramatyka kontekstowa, co kończy dowód twierdzenia.

Prawdziwe jest także następujące twierdzenie (porównaj z 1.1).

Twierdzenie 1.3

Dla dowolnej gramatyki kontekstowej (rozszerzającej) istnieje równoważna gramatyka kontekstowa (rozszerzająca) o tej własności, że każde prawo, w którym występuje symbol terminalny, jest postaci $v \to a$ , gdzie Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v\in V_{N},\: a\in V_{T} } .

Mówimy, że gramatyka $G$ jest rzędu $n > 0$ , jeśli dla każdego prawa $x \to y$ tej gramatyki spełniony jest warunek $∣ x ∣ ⩽ n$ i $∣ y ∣ ⩽ n$ . Kolejne twierdzenie stwierdza możliwość dalszego uproszczenia praw gramatyki rozszerzającej.

Twierdzenie 1.4

Dla każdej gramatyki rozszerzającej istnieje równoważna gramatyka rozszerzająca rzędu $2$ .

Na koniec wprowadzimy jeszcze jeden rodzaj gramatyk równoważnych gramatykom kontekstowym. Są to mianowicie gramatyki liniowo ograniczone.

Definicja 1.3

Gramatyka $G = (V_{N}, V_{T}, v_{0}, P)$ jest liniowo ograniczona, jeśli każde prawo jest jednej z następujących postaci:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v_{0}\rightarrow v_{0}v,\: v_{1}v_{2}\rightarrow z_{1}z_{2},\: v\rightarrow x, }

gdzie Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle x\in V_{N}\cup V_{T},\: v,v_{1},v_{2},z_{1},z_{2}\in V_{N} } oraz $v_{0} \notin {x, z_{1}, z_{2}, v}$ .

Twierdzenie 1.5

Dla dowolnej gramatyki kontekstowej $G$ istnieje gramatyka liniowo ograniczona $G_{1}$ , która jest równoważna $G$ lub też generuje język $L (G) ∖ {1}$ .

Dowód

W świetle poprzednich twierdzeń możemy przyjąć, że gramatyka kontekstowa $G = (V_{N}, V_{T}, v_{0}, P)$ ma prawa wyłącznie w następujących postaciach:

$v_{0} \to 1,$
$v \to x$ gdzie Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v\in V_{N},\: x\in V_{N}\cup V_{T}, }
$v \to v_{1} v_{2}$ gdzie $v, v_{1}, v_{2} \in V_{N},$
$v_{1} v_{2} \to v_{3} v_{4}$ gdzie $v_{1}, v_{2}, v_{3}, v_{4} \in V_{N} .$

Określamy gramatykę $G_{1} = (V_{N} \cup {z_{0}, z_{1}}, V_{T}, z_{0}, P_{1})$ , gdzie $z_{1}, z_{2}$ są nowymi symbolami nieterminalnymi, a więc nie należą do $V_{N}$ . Natomiast zbiór praw $P_{1}$ składa się ze wszystkich praw ze zbioru $P$ postaci 2 i 4 oraz Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle z_{0}\rightarrow z_{0}z_{1},\: z_{0}\rightarrow v_{0},\: } praw Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle z_{1}v\rightarrow vz_{1},\: vz_{1}\rightarrow z_{1}v } dla $v \in V_{N}$ i praw $v_{1} z_{1} \to v_{3} v_{4}$ dla każdego prawa postaci 4 w gramatyce $G$ . Skonstruowana gramatyka jest liniowo ograniczona i spełnia tezę twierdzenia.

2. Automat liniowo ograniczony

Określimy teraz systemy, zwane automatami liniowo ograniczonymi, który rozpoznają języki kontekstowe.

Definicja 2.1

Automatem liniowo ograniczonym nazywamy system $𝒜_{L O} = (Σ_{T}, S, P, s_{0}, S_{F})$ , w którym $Σ_{T}$ jest skończonym alfabetem, $S$ skończonym zbiorem stanów, $S \cap Σ_{T} = \emptyset$ oraz wyróżniony jest podzbiór $Σ_{I} \subset Σ_{T}$ . Zbiór $Σ_{T}$ zwany jest alfabetem taśmy, a $Σ_{I}$ - alfabetem wejściowym. Wyróżnione są także: element $# \in Σ_{T} ∖ Σ_{I}$ zwany markerem końca, stan początkowy $s_{0} \in S$ oraz $S_{F} \subset S$ - zbiór stanów końcowych. Natomiast relacja przejść $P \subset (S \times Σ_{T}) \times (S \times Σ_{T} \times {- 1, 0, 1})$ spełnia następujące warunki:

jeśli $(s_{1}, #) P (s_{2}, a, k)$ , to $a = #,$
jeśli $(s_{1}, a) P (s_{2}, #, k)$ , to $a = # .$

Fakt, że $(s_{1}, a) P (s_{2}, b, k)$ , zapisujemy zazwyczaj jako $(s_{1}, a) \to (s_{2}, b, k)$ . Do opisu działania automatu liniowo ograniczonego wygodnie jest wprowadzić pojęcie konfiguracji (podobnie jak dla automatów ze stosem).

Konfiguracją automatu liniowo ograniczonego jest słowo $v s w \in (Σ_{T} \cup S)^{*}$ , w którym $s \in S, v, w \in Σ_{T}^{*}$ . Pomiędzy dwoma konfiguracjami $d_{1}, d_{2}$ zachodzi relacja bezpośredniego następstwa $d_{1} \mapsto d_{2}$ wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie $s_{1}, s_{2} \in S$ , $a, b, c \in Σ_{T}$ oraz $v, w \in Σ_{T}^{*} :$

$d_{1} = v s_{1} a w$ , $d_{2} = v s_{2} b w$ oraz $(s_{1}, a) P (s_{2}, b, 0),$
$d_{1} = v s_{1} a w$ , $d_{2} = v b s_{2} w$ oraz $(s_{1}, a) P (s_{2}, b, 1),$
$d_{1} = v c s_{1} a w$ , $d_{2} = v s_{2} c b w$ oraz $(s_{1}, a) P (s_{2}, b, - 1) .$

Przechodnie domknięcie relacji $\mapsto$ oznaczać będziemy symbolem $\mapsto^{*}$ i określać mianem obliczenia wykonanego przez automat liniowo ograniczony.

Język rozpoznawany przez automat liniowo ograniczony $𝒜_{L O}$ to zbiór słów nad alfabetem $Σ_{I}$ , pod działaniem których automat wykonuje obliczenie prowadzące do stanu końcowego, czyli

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(\mathcal{A}_{LO})=\left\{ w\in \Sigma _{I}^{*}\: :\: s_{0}\#w\#\mapsto^{*}vs,\; v\in \Sigma _{T}^{*},\, s\in S_{F}\right\} .}

Język $L \subset Σ_{I}^{*}$ jest rozpoznawany (akceptowany) przez automat liniowo ograniczony, jeśli istnieje automat $𝒜_{L O}$ taki, że $ℒ (𝒜_{L O}) = L .$

<flash>file=Wyklad12_rysunek1.swf|width=200|height=200</flash> <div.thumbcaption>Rysunek 1

Opiszemy teraz możliwe ruchy automatu liniowo ograniczonego. Automat ten może czytać słowo wejściowe w dwóch kierunkach. Jego głowica może poruszać się w lewo lub w prawo. Automat może wymieniać czytaną literę na inną, ale nie rozszerza miejsca zajętego na taśmie przez czytane słowo. Działa niedeterministycznie. Czytając literę $a$ , będąc w stanie $s$ , automat ma kilka możliwości działania. Może mianowicie:

zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 1. Głowica czytająca automatu pozostaje w poprzedniej pozycji,
zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 2. Głowica czytająca automatu przesuwa się w prawo,
zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 3. Głowica czytająca automatu przesuwa się w lewo.

Związek pomiędzy rodziną języków kontekstowych a wprowadzoną rodziną automatów liniowo ograniczonych ustalają poniższe twierdzenia.

Twierdzenie 2.1

Dla dowolnego języka kontekstowego $L$ istnieje automat liniowo ograniczony $𝒜_{L O}$ taki, że $ℒ (𝒜_{L O}) = L$ .

Dowód

Można założyć, bez ograniczenia ogólności naszych rozważań, że gramatyka $G = (V_{N}, V_{T}, v_{0}, P)$ generująca język $L$ ma prawa wyłącznie następujących postaci:

(G) $v \to x$ , gdzie $v \in V_{N}, x \in V_{N} \cup V_{T}, x \neq v_{0},$
(G) $v_{0} \to v_{0} v_{1}$ , gdzie $v_{1} \in V_{N}, v_{1} \neq v_{0},$
(G) $v_{1} v_{2} \to v_{3} v_{4}$ , gdzie $v_{1}, . . ., v_{4} \in V_{N}, v_{3}, v_{4} \neq v_{0},$
(G) $v_{0} \to 1,$ jeśli $1 \in L$ .

Określamy automat liniowo ograniczony $𝒜_{L O} = (Σ_{T}, S, P, s_{0}, S_{F})$ , przyjmując $Σ_{T} = V_{N} \cup V_{T} \cup {#, ♭}$ , $S = {s_{0}, s_{1}, s_{2}, s_{3}, s_{4}} \cup {s_{v_{1}} : v_{1} v_{2} \to v_{3} v_{4} \in P}$ , $Σ_{I} = V_{N} \cup V_{T}$ , $S_{F} = {s_{3}}$ , $s_{0}$ - stan początkowy. Relacja przejść automatu $𝒜_{L O}$ zdefiniowana jest poniżej:

(A) $(s_{0}, #) \to (s_{0}, #, 1),$
(A) $(s_{0}, #) \to (s_{4}, #, 1)$ jeśli $1 \in L,$
(A) $(s_{0}, x) \to (s_{0}, x, 1)$ , $(s_{0}, x) \to (s_{0}, x, - 1)$ dla każdego $x \in V_{N} \cup V_{T},$
(A) $(s_{0}, x) \to (s_{0}, v, 0)$ jeśli $v \to x \in P$ i $x \neq v_{0},$
(A) $(s_{0}, v_{3}) \to (s_{v_{1}}, v_{1}, 1), (s_{v_{1}}, v_{4}) \to (s_{0}, v_{2}, 0)$ jeśli $v_{1} v_{2} \to v_{3} v_{4} \in P,$
(A) $(s_{0}, v_{0}) \to (s_{1}, v_{0}, - 1),$
(A) $(s_{1}, #) \to (s_{2}, #, 1),$
(A) $(s_{1}, ♭) \to (s_{2}, ♭, 1),$
(A) $(s_{2}, v_{0}) \to (s_{3}, ♭, 1),$
(A) $(s_{3}, v_{1}) \to (s_{0}, v_{0}, 0)$ , gdy $v_{0} \to v_{0} v_{1} \in P,$
(A) $(s_{3}, #) \to s_{3}, #, 1), (s_{4}, #) \to (s_{3}, #, 1) .$

Określony automat $𝒜_{L O}$ rozpoznaje tylko te słowa, które są generowane przez gramatykę $G$ , symulując wstecz każde wyprowadzenie gramatyki $G$ .

Prawdziwe jest również następujące twierdzenie.

Twierdzenie 2.2

Dla dowolnego języka $L$ rozpoznawanego przez automat liniowo ograniczony $𝒜_{L O}$ istnieje gramatyka kontekstowa $G$ taka, że $L (G) = L$ .

W dowodzie konstruuje się odpowiednią gramatykę.Zasada tej konstrukcji jest następująca. Z symbolu startowego gramatyka generuje dowolne słowa, ustawiając zawsze na prawym końcu symbol nieterminalny związany z przejściem automatu do stanu końcowego. Następnie korzysta się z możliwości zamiany takiego symbolu nieterminalnego na inne. W ten sposób gramatyka symuluje wstecz działanie automatu, wprowadzając symbole nieterminalne odpowiadające stanom automatu. Dojście do stanu początkowego automatu w tej symulacji jest równoznaczne z usunięciem ostatniego symbolu nieterminalnego i wygenerowaniem słowa dokładnie tego samego, które rozpoznaje automat.

Udowownimy teraz zamkniętość rodziny języków kontekstowych ze względu na iloczyn mnogościowy.

Twierdzenie 2.3

Dla dowolnych języków kontekstowych $L_{1}, L_{2} \subset A^{*}$ iloczyn mnogościowy tych języków $L_{1} \cap L_{2}$ jest językiem kontekstowym.

Dowód

(szkic) Załóżmy, że języki $L_{1}, L_{2}$ są rozpoznawane przez automaty liniowo ograniczone, $𝒜_{L O}^{1}$ i $𝒜_{L O}^{2}$ . Opiszemy konstrukcję automatu liniowo ograniczonego $𝒜_{L O}$ , który rozpoznawać będzie wyłącznie słowa akceptowane równocześnie przez oba automaty. Działanie tego automatu jest następujące. Każde słowo będzie czytane trzy razy. Przy pierwszym czytaniu automat $𝒜_{L O}$ dubluje litery, to znaczy w miejsce litery $a$ wprowadza parę $(a, a)$ . Po zakończeniu tej procedury automat wraca do skrajnej lewej pozycji i rozpoczyna symulację automatu $𝒜_{L O}^{1}$ . Jeśli ta symulacja doprowadzi do zaakceptowania czytanego słowa przez automat $𝒜_{L O}^{1}$ , to automat $𝒜_{L O}$ rozpoczyna obliczenie od początku, symulując teraz pracę automatu $𝒜_{L O}^{2}$ . Jeśli i ta symulacja zakończy się zaakceptowaniem czytanego słowa, to automat przechodzi do ustalonego stanu końcowego, a to oznacza akceptację tego słowa. Działając w opisany sposób, automat $𝒜_{L O}$ rozpoznaje język $L_{1} \cap L_{2}$ , a to w świetle udowodnionego powyżej twierdzenia oznacza, że przecięcie języków kontekstowych $L_{1} \cap L_{2}$ jest językiem kontekstowym.

Ponieważ dalsze własności domkniętości rodziny języków kontekstowych pokrywają się z własnościami języków typu (0), więc omówimy te własności wspólnie, co będzie mieć miejsce w następnym wykładzie.

3. Maszyna Turinga

Alan Turing (1912-1954)
Zobacz biografię

Przejdziemy teraz do prezentacji ogólnego modelu

maszyny liczącej, który został wprowadzony w 1936 roku przez Alana M. Turinga. Na cześć swego autora został on nazwany (jednotaśmową) maszyną Turinga. Model ten jest podobny w swojej idei do rozważanych wcześniej automatów liniowo ograniczonych, przy czym jednym z podstawowych założeń (i różnic względem automatów) jest nieskończony dostęp do pamięci. Maszyna Turinga może wydawać się na początku pojęciem bardzo abstrakcyjnym. Jednak, jak później zobaczymy, stanowi ona jedną z podstawowych koncepcji współczesnej informatyki. Pozwala na formalne zdefiniowanie pojęcia algorytmu oraz jego złożoności obliczeniowej. Jako model obliczeń pozwala odpowiedzieć także na bardzo ważne pytanie: czy każdy problem można rozwiązać algorytmicznie?

Jednotaśmowa maszyna Turinga jest podobna w swej idei do automatu liniowo ograniczonego, pominięte jednak zostaje, jak wspomnieliśmy, ograniczenie dostępu do pamięci. Omawiana maszyna jest abstrakcyjnym tworem w skład którego wchodzą:

dwustronnie nieskończona taśma zbudowana z komórek zawierających symbole z pewnego zadanego alfabetu,
głowica, która może czytać i zapisywać symbole w komórkach taśmy oraz poruszać się w prawo lub lewo o jedną komórkę lub pozostawać na tej samej pozycji podczas jednego kroku czasowego,
działający sekwencyjnie mechanizm odpowiedzialny za sterowanie maszyną; mechanizm ten na podstawie symbolu odczytanego z komórki pod głowicą oraz stanu, w którym aktualnie znajduje się maszyna, dokonuje zapisu symbolu w tejże komórce, przechodzi do kolejnego stanu i przesuwa głowicę w prawo, lewo lub też nie zmienia pozycji głowicy.

Podamy teraz formalną definicję maszyny Turinga. Aby zachować analogię do poprzednich wykładów, zdefiniujemy maszynę w języku konfiguracji.

Definicja 3.1

(Jednotaśmowa deterministyczna) maszyna Turinga jest to system $𝐌 𝐓 = (Σ_{T}, S, f, s_{0}, S_{F})$ , w którym $Σ_{T}$ jest skończonym alfabetem, $S$ skończonym zbiorem stanów, $S \cap Σ_{T} = \emptyset$ oraz wyróżniony jest podzbiór $Σ_{I} \subset Σ_{T}$ . Zbiór $Σ_{T}$ zwany jest alfabetem taśmy, a $Σ_{I}$ - alfabetem wejściowym. Wyróżnione są także: element $# \in Σ_{T} ∖ Σ_{I}$ zwany markerem końca, stan początkowy $s_{0} \in S$ oraz $S_{F} \subset S$ - zbiór stanów końcowych. Natomiast funkcja przejść jest funkcją częściową Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle f:\: (S\times \Sigma _{T})\rightarrow (S\times \Sigma _{T}\times \{-1,0,1\} } .

Konfiguracją maszyny Turinga jest słowo $v s w \in (Σ_{T} \cup S)^{*}$ , w którym $s \in S, v, w \in Σ_{T}^{*}$ . Pomiędzy dwiema konfiguracjami $d_{1}, d_{2}$ zachodzi relacja bezpośredniego następstwa $d_{1} \mapsto d_{2}$ wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie $s_{1}, s_{2} \in S$ , $a, b, c \in Σ_{T}$ oraz $v, w \in Σ_{T}^{*}$ :

$d_{1} = v s_{1} a w$ , $d_{2} = v s_{2} b w$ oraz $f (s_{1}, a) = (s_{2}, b, 0),$
$d_{1} = v s_{1} a w$ , $d_{2} = v b s_{2} w$ oraz $f (s_{1}, a) = (s_{2}, b, 1)$ i $w \neq 1,$
$d_{1} = v s_{1} #$ , $d_{2} = v b s_{2} #$ oraz $f (s_{1}, #) = (s_{2}, b, 1),$
$d_{1} = v c s_{1} a w$ , $d_{2} = v s_{2} c b w$ oraz $f (s_{1}, a) = (s_{2}, b, - 1),$
$d_{1} = s_{1} # w$ , $d_{2} = s_{2} # b w$ oraz $f (s_{1}, #) = (s_{2}, b, - 1) .$

Przechodnie domknięcie relacji $\mapsto$ oznaczać będziemy symbolem $\mapsto^{*}$ i określać mianem obliczenia wykonanego przez maszynę Turinga. Konfiguracja $d_{1} \in (Σ_{T} \cup S)^{*}$ jest końcowa, jeśli stąd, że $d_{1} \mapsto d_{2}$ , wynika $d_{2} = d_{1} .$ Mówimy, że maszyna Turinga zatrzymuje się w $d_{1}$ wtedy i tylko wtedy, gdy $d_{1}$ jest konfiguracją końcową.

Zauważmy, że wprowadzenie markera końca jest zabiegiem czysto formalnym. Pozwala on z jednej strony na oznaczenie słowa wejściowego, a z drugiej strony wskazuje na elementy taśmy, które były zmieniane (czy to przez wprowadzenie słowa wejściowego, czy też poprzez ruch głowicy).

Definicja 3.2

Język rozpoznawany przez maszynę Turinga $M T$ jest to zbiór

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(\mathbf{MT})=\left\{ w\in \Sigma _{T}^{*}\: :\: \sharp s_{0}w\sharp \mapsto^{*}\sharp w_{1}s_{F}w_{2}\sharp ,\; dla\: pewnych\: w_{1},w_{2}\in \Sigma _{T}^{*},s_{F}\in S_{F}\right\} .}

Język $L \subset Σ_{I}^{*}$ jest rozpoznawany (akceptowany) przez maszynę Turinga, jeśli istnieje $M T$ taka, że $L (ℳ 𝒯) = L .$ Klasę języków rozpoznawanych przez maszynę Turinga oznaczamy $ℒ (M T)$ .

We wprowadzonym przez nas ujęciu formalnym, działanie maszyny Turinga należy wyobrażać sobie następująco. W pierwszym etapie na taśmę zostają zapisane symbole słowa wejściowego (z alfabetu $Σ_{I}$ ), a następnie komórki przyległe zostają oznaczone symbolami $♯$ . Jednocześnie maszyna jest sprowadzana do stanu $s_{0}$ , a głowica zostaje ustawiona nad pierwszym symbolem słowa wejściowego. W tym momencie rozpoczyna się sekwencyjne przetwarzanie zawartości taśmy przez maszynę. Jeśli maszyna "zatrzyma się", tzn. w dwóch kolejnych chwilach czasowych nie wykona ruchu i jednocześnie nie zmieni stanu i symbolu taśmy, sprawdzany jest jej aktualny stan. Jeśli stan był akceptujący (czyli należał do zbioru $S_{F}$ ), to maszyna zaakceptowała słowo, w przeciwnym razie - słowo odrzuciła (gdyż nie może już osiągnąć stanu ze zbioru $S_{F}$ ). Należy zwrócić uwagę na to, że dla niektórych konfiguracji początkowych maszyna może nigdy się nie zatrzymać, a mimo to słowo zostanie przez nią zaakceptowane. To samo tyczy się odrzucania słów, jednak w tej sytuacji dowód, że słowo nie zostanie zaakceptowane, może być problematyczny. Zaprezentowane podejście ma na celu uproszczenie i tak już dość technicznych dowodów twierdzeń pojawiających się w tym wykładzie. Związki pomiędzy akceptowaniem a zatrzymywaniem maszyny Turinga zostaną skomentowane później (zob. Wniosek 4.1). W pierwszej kolejności przedstawiamy dwa przykłady:

Przykład 3.1

Skonstruujemy maszynę Turinga $M T_{1}$ , która rozpoznaje język postaci $L = {0^{2^{n}} : n ⩾ 0}$ . Zamierzone działanie maszyny $M T_{1}$ można opisać następująco:

Przejdź od lewego markera do prawego, zaznaczając symbolem $♢$ co drugie $0$ .
Jeśli było tylko jedno $0$ , to akceptuj.
Jeśli w kroku 1. obszar pomiędzy markerami zawierał nieparzystą ilość $0$ , to odrzuć.
Powróć do lewego markera.
Powtórz działanie od 1.

Zwróćmy uwagę, że o ile jasne jest, w jaki sposób maszyna ma akceptować słowa wejściowe, odrzucanie tych słów nie zostało zdefiniowane. Aby ominąć ten problem, wprowadzimy jeden dodatkowy stan (nie należący do stanów końcowych), po osiągnięciu którego maszyna się zatrzymuje (tzn. nie wykonuje ruchów i przepisuje na taśmie wciąż ten sam symbol).

Określamy kolejno elementy składowe maszyny $M T_{1}$ :

Σ_{I} = {0}, Σ_{T} = {0, ♢, ♣, ♯},

S = {s_{0}, s_{1}, s_{2}, s_{3}, s_{4}, s_{A}, s_{R}}, S_{F} = {s_{A}} .

Pozostaje jeszcze zdefiniować funkcję przejść:

\begin{array}{ccccc} (s_{0}, ♯) \mapsto (s_{R}, ♯, 0) & (s_{1}, ♢) \mapsto (s 1, ♢, 1) \\ (s_{0}, 0) \mapsto (s_{1}, ♣, 1) & (s_{1}, 0) \mapsto (s_{2}, ♢, 1) \\ (s_{1}, ♯) \mapsto (s_{A}, ♯, 0) \\ (s_{2}, ♢) \mapsto (s_{2}, ♢, 1) & (s_{3}, 0) \mapsto (s_{2}, ♢, 1) \\ (s_{2}, ♯) \mapsto (s_{4}, ♯, - 1) & (s_{3}, ♢) \mapsto (s_{3}, ♢, 1) \\ (s_{2}, 0) \mapsto (s_{3}, 0, 1) & (s_{3}, ♯) \mapsto (s_{R}, ♯, 0) \\ (s_{4}, 0) \mapsto (s_{4}, 0, - 1) \\ (s_{4}, ♢) \mapsto (s_{4}, ♢, - 1) \\ (s_{4}, ♣) \mapsto (s_{2}, ♣, 1) \\ (s_{A}, ♯) \mapsto (s_{A}, ♯, 0) & (s_{R}, ♯) \mapsto (s_{R}, ♯, 0) \end{array}

W miejsce tabeli wygodniej jest zobrazować funkcję przejść maszyny Turinga na etykietowanym grafie skierowanym. Zostało to zrobione na poniższym rysunku:

<flash>file=ja-lekcja12-w-rys1.swf|width=350|height=350</flash>

<div.thumbcaption>Rysunek 2

Łatwo zauważyć, że wprowadzona funkcja przejścia określa maszynę spełniającą postawione przez nas warunki. Symbol $♣$ został wprowadzony dla odróżnienia wystąpienia pojedynczego zera od sytuacji, gdy liczba zer jest nieparzysta i większa od $1$ .

Aby lepiej zrozumieć działanie maszyny $M T_{1}$ , zasymulujemy jej działanie na dwóch słowach wejściowych, przy czym pierwsze z nich będzie należało do języka $L$ , a drugie nie:

\begin{array}{cccccccc} ♯ s_{0} 0000 ♯ & \mapsto & ♯ ♣ s_{1} 000 ♯ & \mapsto & ♯ ♣ ♢ s_{2} 00 ♯ & \mapsto & ♯ ♣ ♢ 0 s_{3} 0 ♯ \\ \mapsto & ♯ ♣ ♢ 0 ♢ s_{2} ♯ & \mapsto & ♯ ♣ ♢ 0 s_{4} ♢ ♯ & \mapsto & ♯ ♣ ♢ s_{4} 0 ♢ ♯ & \mapsto & ♯ ♣ s_{4} ♢ 0 ♢ ♯ \\ \mapsto & ♯ s_{4} ♣ ♢ 0 ♢ ♯ & \mapsto & ♯ ♣ s_{1} ♢ 0 ♢ ♯ & \mapsto & ♯ ♣ ♢ s_{1} 0 ♢ ♯ & \mapsto & ♯ ♣ ♢ ♢ s_{2} ♢ ♯ \\ \mapsto & ♯ ♣ ♢ ♢ ♢ s_{2} ♯ & \mapsto & ♯ ♣ ♢ ♢ s_{4} ♢ ♯ & \mapsto & ♯ ♣ ♢ s_{4} ♢ ♢ ♯ & \mapsto & ♯ ♣ s_{4} ♢ ♢ ♢ ♯ \\ \mapsto & ♯ s_{4} ♣ ♢ ♢ ♢ ♯ & \mapsto & ♯ ♣ s_{1} ♢ ♢ ♢ ♯ & \mapsto & ♯ ♣ ♢ s_{1} ♢ ♢ ♯ & \mapsto & ♯ ♣ ♢ ♢ s_{1} ♢ ♯ \\ \mapsto & ♯ ♣ ♢ ♢ ♢ s_{1} ♯ & \mapsto & ♯ ♣ ♢ ♢ ♢ s_{A} ♯ & ↺ \end{array}

Wykazaliśmy więc, że $♯ s_{0} 0000 ♯ \mapsto^{*} ♯ ♣ ♢ ♢ ♢ s_{A} ♯$ . Zatem $0^{4} \in L (M T_{1})$ .

<flashwrap>file=ja-lekcja12-w-anim1a.swf|size=small</flashwrap>

<div.thumbcaption>Animacja 1

Dla porównania:

\begin{array}{cccccccc} ♯ s_{0} 000 ♯ & \mapsto & ♯ ♣ s_{1} 00 ♯ & \mapsto & ♯ ♣ ♢ s_{2} 0 ♯ & \mapsto & ♯ ♣ ♢ 0 s_{3} ♯ \\ \mapsto & ♯ ♣ ♢ 0 s_{R} ♯ & ↺ \end{array}

Czyli zgodnie z naszym założeniem $0^{3} \in̸ L (M T_{1})$ .

<flashwrap>file=ja-lekcja12-w-anim1b.swf|size=small</flashwrap>

<div.thumbcaption>Animacja 2

Przykład 3.2

Przedstawimy maszynę Turinga $M T_{2}$ akceptującą język

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L=\left\{w \overleftarrow{w} \: : \: w\in \left\{0,1\right\}^*\right\}, }

gdzie $\overset{\leftarrow}{w}$ oznacza lustrzane odbicie słowa $w$ . Elementy języka $L$ nazywamy palindromami. Definiujemy alfabet maszyny:

Σ_{I} = {0, 1}, Σ_{T} = {0, 1, ♯},

oraz zbiory stanów

S = {s_{0}, r_{0}, {r_{0}}^{'}, q_{0}, r_{1}, {r_{1}}^{'}, q_{1}, l, s_{A}, s_{R}}, S_{F} = {s_{A}} .

Funkcję przejść maszyny $M T_{2}$ określa tabela:

\begin{array}{ccccc} (s_{0}, ♯) \mapsto (s_{A}, ♯, 0) & (s_{0}, 0) \mapsto (r_{0}, ♯, 1) & (s_{0}, 1) \mapsto (r_{1}, ♯, 1) \\ (r_{0}, ♯) \mapsto (s_{R}, ♯, 0) & (r_{0}, 0) \mapsto ({r_{0}}^{'}, 0, 1) & (r_{0}, 1) \mapsto ({r_{0}}^{'}, 1, 1) \\ ({r_{0}}^{'}, ♯) \mapsto (q_{0}, ♯, - 1) & ({r_{0}}^{'}, 0) \mapsto ({r_{0}}^{'}, 0, 1) & ({r_{0}}^{'}, 1) \mapsto ({r_{0}}^{'}, 1, 1) \\ (q_{0}, 0) \mapsto (l, ♯, - 1) & (q_{0}, 1) \mapsto (s_{R}, ♯, - 1) \\ (r_{1}, ♯) \mapsto (s_{R}, ♯, 0) & (r_{1}, 0) \mapsto ({r_{1}}^{'}, 0, 1) & (r_{1}, 1) \mapsto ({r_{1}}^{'}, 1, 1) \\ ({r_{1}}^{'}, ♯) \mapsto (q_{1}, ♯, - 1) & ({r_{1}}^{'}, 0) \mapsto ({r_{1}}^{'}, 0, 1) & ({r_{1}}^{'}, 1) \mapsto ({r_{1}}^{'}, 1, 1) \\ (q_{1}, 0) \mapsto (s_{R}, ♯, 0) & (q_{1}, 1) \mapsto (l, ♯, - 1) \\ (l, ♯) \mapsto (s_{0}, ♯, 1) & (l, 0) \mapsto (l, 0, - 1) & (l, 1) \mapsto (l, 1, - 1) \\ (s_{R}, ♯) \mapsto (s_{R}, ♯, 0) \\ (s_{A}, ♯) \mapsto (s_{A}, ♯, 0) \end{array}

co dla przejrzystości zobrazowano na Rysunku 3.

<flash>file=ja-lekcja12-w-rys3.swf|width=500|height=500</flash>

<div.thumbcaption>Rysunek 3

4. Inne możliwe definicje maszyn Turinga

Istnieje kilka możliwych definicji maszyny Turinga, które jak się okazuje są równoważne pod względem możliwości obliczeniowych (tzn. rozpoznają dokładnie tę samą klasę języków). Naszkicujemy kilka wybranych podejść.

4.1 Maszyna wielotaśmowa

W tym modelu zakłada się, że głowica ma do dyspozycji nie tylko jedną, ale wiele taśm, na których może zapisywać i odczytywać symbole. Zakłada się przy tym, że słowo wejściowe znajduje się na pierwszej taśmie. Aby symulować maszynę wielotaśmową na jednej taśmie, należy zamienić alfabet taśmy na alfabet $(Σ_{T})^{k}$ , gdzie $k$ oznacza ilość taśm. W tym momencie zapis na taśmie $i$ -tej jest realizowany przez zmianę odpowiedniej współrzędnej litery z nowego alfabetu (zob. Rys. 4.a). Czyli w opisywanym przypadku funkcja przejść będzie operowała na następujących zbiorach:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle f:\: (S\times \Sigma^k_{T} )\rightarrow (S \times \Sigma^k_{T} \times \{-1,0,1\} ). }

4.2 Taśma jednostronnie nieskończona

Model ten zakłada, że taśma jest ograniczona z jednej ze stron. Różnica w porównaniu z rozważaną przez nas maszyną Turinga polega na tym, że nie jest dozwolone przesuwanie lewego markera (tzn. funkcja przejść nie może zawierać przejść typu punkt 5 definicji 3.1. W tej sytuacji, aby symulować maszynę z taśmą obustronnie nieskończoną na maszynie z taśmą ograniczoną z jednej strony, wystarczy zasymulować taśmę obustronnie nieskończoną poprzez rozszerzenie alfabetu (zob. Rys. 4.b).

<flash>file=ja-lekcja12-w-rys4.swf|width=350|height=350</flash>

<div.thumbcaption>Rysunek 4

4.3 Wielogłowicowa maszyna wielotaśmowa

W tym podejściu zakłada się dodatkowo, że każda z taśm posiada swoją głowicę. Inaczej mówiąc, mamy do czynienia z iloczynem kartezjańskim $k$ niezależnych maszyn jednotaśmowych. Akceptowany język jest w tym momencie $k$ -wymiarowy. Oczywiście, słowo postaci $(w, 1, \dots, 1) \in (Σ_{T}^{*})^{k}$ można w naturalny sposób utożsamiać z $w \in Σ_{T}$ . Z drugiej strony maszynę wielogłowicową można symulować na jednotaśmowej w następujący sposób:

Jako zbiór stanów bierzemy $S^{k}$ .
Słowa startowe $w_{1}, \dots, w_{k}$ zapisujemy jako konfigurację początkową maszyny jednotaśmowej w postaci: $♯ (s_{0})^{k} $ \dot{1} w_{1} $ \dot{2} w_{2} $ \dots $ \dot{k} w_{k} $ .$ Symbole $$$ mają za zadanie wirtualnego rozdzielenia taśm. Symbole $\dot{i}$ wskazują na położenie $i$ -tej głowicy na taśmie.
W trakcie symulacji przechodzimy pomiędzy markerami i wykonujemy przejścia dla kolejnych głowic.

Widać już, że formalne podanie funkcji przejść jest w omawianym przypadku bardzo techniczne. Musimy zapewnić możliwość poszerzania obszaru zapisu na poszczególnych taśmach, co jest realizowane poprzez dopisanie nowego symbolu i przepisywanie przyległych symboli, aż do markera włącznie. Następnie należy wrócić do poprzedniego miejsca zapisu i symulować działanie kolejnych głowic. Wymaga to wprowadzenia sporej liczby stanów pomocniczych. Nie będziemy zagłębiać się w te techniczne szczegóły. Mamy nadzieję że sama idea konstrukcji jest w tym momencie zrozumiała.

Najbardziej ogólna definicja maszyny tego typu dopuszcza dodatkowo, aby głowice mogły przeglądać pozostałe taśmy, dzięki czemu zapewnia się komunikację między głowicami. Symulacja takiej maszyny na jednej taśmie jest podobna w swej idei do metody przedstawionej wcześniej.

4.4 Maszyna niedeterministyczna

Ten typ maszyn ma ogromne znaczenie dla teorii złożoności. Z tego powodu przyglądniemy mu się dokładniej. Różnica pomiędzy niedeterministyczną maszyną Turinga a maszyną deterministyczną polega na tym, że funkcja przejść może pozwalać na kilka różnych przejść na skutek tego samego symbolu czytanego (gdyż funkcja przejść w tym przypadku będzie multi-funkcją).

Definicja 4.1

(Jednotaśmowa) niedeterministyczna maszyna Turinga jest to system $𝐍 𝐌 𝐓 = (Σ_{T}, S, f, s_{0}, S_{F})$ , w którym $Σ_{T}$ jest skończonym alfabetem, $S$ skończonym zbiorem stanów, $S \cap Σ_{T} = \emptyset$ oraz wyróżniony jest podzbiór $Σ_{I} \subset Σ_{T}$ . Podobnie jak poprzednio zbiór $Σ_{T}$ zwany jest alfabetem taśmy, a $Σ_{I}$ - alfabetem wejściowym. Wyróżnione są także: element $# \in Σ_{T} ∖ Σ_{I}$ zwany markerem końca, stan początkowy $s_{0} \in S$ oraz $S_{F} \subset S$ - zbiór stanów końcowych. Natomiast funkcja przejść jest funkcją częściową Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle f:\: (S\times \Sigma _{T})\rightarrow \mathcal{P}(S\times \Sigma _{T}\times \{-1,0,1\}) } gdzie $𝒫 (A)$ oznacza zbiór podzbiorów zbioru $A$ .

Konfiguracją maszyny Turinga jest słowo $v s w \in (Σ_{T} \cup S)^{*}$ , w którym $s \in S, v, w \in Σ_{T}^{*}$ , przy czym pomiędzy dwiema konfiguracjami $d_{1}, d_{2}$ zachodzi relacja bezpośredniego następstwa $d_{1} \mapsto d_{2}$ wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie $s_{1}, s_{2} \in S$ , $a, b, c \in Σ_{T}$ oraz $v, w \in Σ_{T}^{*}$ :

$d_{1} = v s_{1} a w$ , $d_{2} = v s_{2} b w$ oraz $f (s_{1}, a) ∋ (s_{2}, b, 0),$
$d_{1} = v s_{1} a w$ , $d_{2} = v b s_{2} w$ oraz $f (s_{1}, a) ∋ (s_{2}, b, 1)$ i $w \neq 1,$
$d_{1} = v s_{1} #$ , $d_{2} = v b s_{2} #$ oraz $f (s_{1}, #) ∋ (s_{2}, b, 1),$
$d_{1} = v c s_{1} a w$ , $d_{2} = v s_{2} c b w$ oraz $f (s_{1}, a) ∋ (s_{2}, b, - 1),$
$d_{1} = s_{1} # w$ , $d_{2} = s_{2} # b w$ oraz $f (s_{1}, #) ∋ (s_{2}, b, - 1) .$

Tak jak poprzednio, przechodnie domknięcie relacji $\mapsto$ oznaczać będziemy symbolem $\mapsto^{*}$ i określać mianem obliczenia wykonanego przez maszynę Turinga. Konfiguracja $d_{1} \in (Σ_{T} \cup S)^{*}$ jest końcowa, jeśli stąd, że $d_{1} \mapsto d_{2}$ , wynika $d_{2} = d_{1} .$

Pomimo tego, że postawiona definicja maszyny niedeterministycznej jest bardzo podobna do maszyny deterministycznej, występuje tutaj jedna bardzo istotna różnica. Słowo wejściowe może prowadzić do wielu różnych obliczeń wykonanych, w szczególności jedno z obliczeń może doprowadzać do zatrzymania maszyny, a inne nie.

Przykład maszyny niedeterministycznej podamy później, przy okazji omawiania klas złożoności obliczeniowej.

Definicja 4.2

Język rozpoznawany przez niedeterministyczną maszynę Turinga $N M T$ jest to zbiór

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(\mathbf{NMT})=\left\{ w\in \Sigma _{T}^{*}\: :\: \sharp s_{0}w\sharp \mapsto^{*}\sharp w_{1}s_{F}w_{2}\sharp ,\; dla\: pewnych\: w_{1},w_{2}\in \Sigma _{T}^{*},s_{F}\in S_{F}\right\} .}

Język $L \subset Σ_{I}^{*}$ jest rozpoznawany (akceptowany) przez niedeterministyczną maszynę Turinga, jeśli istnieje $𝒩 ℳ 𝒯$ taka, że $L (𝒩 ℳ 𝒯) = L .$

Podkreślamy fakt, że aby maszyna niedeterministyczna zaakceptowała słowo wejściowe, wystarczy, aby wśród wszystkich możliwych obliczeń znalazło się co najmniej jedno akceptujące.

Wprost z definicji wynika że każda maszyna deterministyczna jest także maszyną niedeterministyczną, co oznacza, że języki rozpoznawane przez maszyny deterministyczne są zawarte w klasie języków rozpoznawanych przez maszyny niedeterministyczne. Przeciwna inkluzja jest gwarantowana przez następujące twierdzenie.

Twierdzenie 4.1

Dla każdej niedeterministycznej maszyny Turinga $𝒩 ℳ 𝒯$ istnieje maszyna deterministyczna $ℳ 𝒯$ taka, że

L (𝒩 ℳ 𝒯) = L (ℳ 𝒯) .

Dowód

(Szkic). Aby sprawdzić, czy maszyna niedeterministyczna akceptuje dane słowo wejściowe, należy przejrzeć wszystkie możliwe obliczenia wykonywane, tworzące drzewo obliczeń. Poziomy drzewa tworzone są przez kroki czasowe, wierzchołki stanowią obliczenia wykonane w danym kroku czasowym, a gałęzie zadane są przez relację bezpośredniego następstwa. W celu sprawdzenia, czy maszyna akceptuje dane słowo, przeglądamy drzewo obliczeń poziomami (por. algorytm BFS) i akceptujemy, gdy przeglądana konfiguracja była akceptująca. Tą techniką przeglądamy wszystkie możliwe obliczenia wykonane w $1, 2, 3, \dots$ krokach.

Do dokonania symulacji najwygodniej jest użyć maszyny $3$ -głowicowej z możliwością czytania na wszystkich taśmach. Wprowadzamy te taśmy kolejno do przechowywania słowa wejściowego, symulacji działania maszyny niedeterministycznej i adresowania wyboru przejść ze zbioru przejść danego przez funkcję przejść. Symulacja przebiega w czterech krokach:

Rozpocznij ze słowem wejściowym $w$ na taśmie $1$ oraz pustymi taśmami $2$ i $3$ .
Przekopiuj taśmę $1$ na taśmę $2$ .
Użyj taśmy $2$ do symulacji $w$ , wykorzystując taśmę $3$ do wyboru przejść funkcji przejść $f$ . Jeśli po wykonaniu skończonego zbioru instrukcji według adresowania z taśmy $3$ otrzymano konfigurację akceptującą, to akceptuj. W przeciwnym razie, przejdź do następnego punktu.
Zamień ciąg adresowy na następny w kolejności leksykograficznej. Jeśli zapisany ciąg jest ostatnim możliwym ciągiem adresowym o długości $N$ , zapisz na taśmie $3$ pierwszy w kolejności leksykograficznej ciąg adresowy o długości $N + 1$ oraz przejdź do $2$ .

Wniosek 4.1

Dla każdej maszyny Turinga $ℳ 𝒯$ istnieje maszyna Turinga ${ℳ 𝒯}^{'}$ taka, że

L (ℳ 𝒯) = L ({ℳ 𝒯}^{'})

oraz dla każdego $w \in L ({ℳ 𝒯}^{'})$ maszyna ${ℳ 𝒯}^{'}$ zatrzymuje się na $w$ .

Dowód

Wystarczy przerobić maszynę $ℳ 𝒯$ na maszynę niedeterministyczną $𝒩 ℳ 𝒯$ posiadającą dodatkowy stan $s_{A}$ oraz taką, że dla każdego stanu ze zbioru $S_{F}$ pod wpływem dowolnego symbolu z $Σ_{T}$ maszyna $𝒩 ℳ 𝒯$ posiada dodatkowe przejście do $s_{A}$ , w którym już pozostaje i nic nie zmienia. Stąd widać, że $L (ℳ 𝒯) = L (𝒩 ℳ 𝒯)$ .

Twierdzenie 4.1 pozwala na otrzymanie maszyny ${ℳ 𝒯}^{'}$ akceptującej ten sam język co $𝒩 ℳ 𝒯$ z dodatkowym założeniem, że gdy $𝒩 ℳ 𝒯$ osiąga stan $s_{A}$ , maszyna ${ℳ 𝒯}^{'}$ się zatrzymuje. Zauważmy, że stan $s_{A}$ można osiągnąć tylko dla słów akceptowanych prze $𝒩 ℳ 𝒯$ , a z drugiej strony, każde słowo akceptowane przez $𝒩 ℳ 𝒯$ prowadzi do co najmniej jednego obliczenia kończącego się w $s_{A}$ .

@@ Linia 580: / Linia 580: @@
 Istnieje kilka możliwych definicji maszyny Turinga, które jak się
 okazuje są równoważne pod względem możliwości obliczeniowych (tzn.
-rozpoznają dokładnie tą samą klasę języków). Naszkicujemy kilka
+rozpoznają dokładnie tę samą klasę języków). Naszkicujemy kilka
 wybranych podejść.
 ===4.1 Maszyna wielotaśmowa===
-W tym modelu zakłada się że
+W tym modelu zakłada się, że głowica ma do dyspozycji nie tylko jedną, ale wiele taśm, na których może zapisywać i odczytywać symbole. Zakłada się przy tym, że słowo wejściowe znajduje się na pierwszej taśmie. Aby symulować maszynę wielotaśmową na jednej taśmie, należy zamienić alfabet taśmy na alfabet <math>\displaystyle (\Sigma_T)^k</math>, gdzie <math>\displaystyle k</math> oznacza ilość taśm. W tym momencie zapis na taśmie <math>\displaystyle i</math>-tej jest realizowany przez zmianę odpowiedniej
-głowica ma do dyspozycji nie tylko jedną ale wiele taśma na których
-może zapisywać i odczytywać symbole. Zakłada się przy tym że słowo
-wejściowe znajduje się na pierwszej taśmie. Aby symulować maszynę
-wielotaśmową na jednej taśmie należy zamienić alfabet taśmy na
-alfabet <math>\displaystyle (\Sigma_T)^k</math> gdzie <math>\displaystyle k</math> oznacza ilość taśm. W tym momencie
-zapis na taśmie <math>\displaystyle i</math>-tej jest realizowany przez zmianę odpowiedniej
 współrzędnej litery z nowego alfabetu (zob. Rys. 4.a). Czyli w
 opisywanym przypadku funkcja przejść będzie operowała na
@@ Linia 602: / Linia 596: @@
 ===4.2 Taśma jednostronnie nieskończona===
-Model ten zakłada że
+Model ten zakłada, że taśma jest ograniczona z jednej ze stron. Różnica w porównaniu z rozważaną przez nas maszyną Turinga polega na tym, że nie jest dozwolone przesuwanie lewego markera (tzn. funkcja przejść nie może zawierać przejść typu [[#pkt.5|punkt 5]] definicji 3.1. W tej sytuacji, aby symulować maszynę z taśmą obustronnie nieskończoną na maszynie z taśmą ograniczoną z jednej strony, wystarczy zasymulować taśmę obustronnie nieskończoną poprzez rozszerzenie alfabetu (zob. Rys. 4.b).
-taśma jest ograniczona z jednej ze stron. Różnica w porównaniu z
-rozważaną przez nas maszyną Turinga polega na tym że nie jest
-dozwolone przesuwanie lewego markera (tzn. funkcja przejść nie
-może zawierać przejść typu [[#pkt.5|punkt 5]] definicji 3.1. W tej sytuacji aby
-symulować maszynę z taśmą obustronnie nieskończoną na maszynie z
-taśmą ograniczoną z jednej strony wystarczy zasymulować taśmę
-obustronnie nieskończoną poprzez rozszerzenie alfabetu (zob. Rys.
-.b).
 <center>
 <div class="thumb"><div style="width:350px;">
@@ Linia 621: / Linia 607: @@
 W tym
 podejściu zakłada się dodatkowo, że każda z taśm posiada swoją
-głowicę. Inaczej mówiąc mamy do czynienia z iloczynem kartezjańskim
+głowicę. Inaczej mówiąc, mamy do czynienia z iloczynem kartezjańskim
 <math>\displaystyle k</math> niezależnych maszyn jednotaśmowych. Akceptowany język jest w
 tym momencie <math>\displaystyle k</math>-wymiarowy. Oczywiście, słowo postaci
@@ Linia 629: / Linia 615: @@
 sposób:
 # Jako zbiór stanów bierzemy <math>\displaystyle S^k</math>.
-# Słowa startowe <math>\displaystyle w_1,\dots, w_k</math> zapisujemy jako konfigurację początkową maszyny jednotaśmowej w postaci: <center><math>\displaystyle \sharp (s_0)^k \$ \dot{1} w_1 \$ \dot{2} w_2 \$ \dots \$ \dot{k} w_k \$ </math></center> Symbole <math>\displaystyle \$</math> mają za zadanie wirtualnego rozdzielenia taśm. Symbole <math>\displaystyle \dot{i}</math> wskazują na położenie <math>\displaystyle i</math>-tej głowicy na taśmie.
+# Słowa startowe <math>\displaystyle w_1,\dots, w_k</math> zapisujemy jako konfigurację początkową maszyny jednotaśmowej w postaci: <center><math>\displaystyle \sharp (s_0)^k \$ \dot{1} w_1 \$ \dot{2} w_2 \$ \dots \$ \dot{k} w_k \$. </math></center> Symbole <math>\displaystyle \$</math> mają za zadanie wirtualnego rozdzielenia taśm. Symbole <math>\displaystyle \dot{i}</math> wskazują na położenie <math>\displaystyle i</math>-tej głowicy na taśmie.
 # W trakcie symulacji przechodzimy pomiędzy markerami i wykonujemy przejścia dla kolejnych głowic.
@@ Linia 635: / Linia 621: @@
 przypadku bardzo techniczne. Musimy zapewnić możliwość poszerzania
 obszaru zapisu na poszczególnych taśmach, co jest realizowane
-poprzez dopisanie nowego symbolu i przepisywanie przyległych symboli
+poprzez dopisanie nowego symbolu i przepisywanie przyległych symboli,
 aż do markera włącznie. Następnie należy wrócić do poprzedniego
 miejsca zapisu i symulować działanie kolejnych głowic. Wymaga to
 wprowadzenia sporej liczby stanów pomocniczych. Nie będziemy
-wchodzić w te techniczne szczegóły. Mamy nadzieję że sama idea
+zagłębiać się w te techniczne szczegóły. Mamy nadzieję że sama idea
-konstrukcji jest w tym momencie jasna.
+konstrukcji jest w tym momencie zrozumiała.
-Najbardziej ogólna definicja maszyny tego typu dopuszcza dodatkowo
+Najbardziej ogólna definicja maszyny tego typu dopuszcza dodatkowo,
 aby głowice mogły przeglądać pozostałe taśmy, dzięki czemu zapewnia
 się komunikację między głowicami. Symulacja takiej maszyny na jednej
@@ Linia 652: / Linia 638: @@
 znaczenie dla teorii złożoności. Z tego powodu przyglądniemy mu się
 dokładniej. Różnica pomiędzy niedeterministyczną maszyną Turinga a
-maszyną deterministyczną polega na tym że funkcja przejść może
+maszyną deterministyczną polega na tym, że funkcja przejść może
 pozwalać na kilka różnych przejść na skutek tego samego symbolu
 czytanego (gdyż funkcja przejść w tym przypadku będzie
@@ Linia 659: / Linia 645: @@
 {{definicja|4.1||
 '''(Jednotaśmowa) niedeterministyczna maszyna Turinga''' jest to
-system  <math>\displaystyle \mathbf{NMT}=(\Sigma _{T},S,f,s_{0},S_{F})  </math>  w którym
+system  <math>\displaystyle \mathbf{NMT}=(\Sigma _{T},S,f,s_{0},S_{F})  </math>,  w którym
 <math>\displaystyle \Sigma _{T}  </math>  jest skończonym alfabetem,  <math>\displaystyle S  </math>
 skończonym zbiorem stanów,  <math>\displaystyle S\cap \Sigma _{T}=\emptyset   </math>  oraz
@@ Linia 679: / Linia 665: @@
 d_{2}  </math>  wtedy i&nbsp;tylko wtedy, gdy spełniony jest jeden z niżej
 wypisanych warunków, gdzie  <math>\displaystyle s_{1},s_{2}\in S  </math> ,  <math>\displaystyle a,b,c\in
-\Sigma _{T}  </math>  oraz  <math>\displaystyle v,w\in \Sigma _{T}^{*}  </math>
+\Sigma _{T}  </math>  oraz  <math>\displaystyle v,w\in \Sigma _{T}^{*}  </math>:
-#  <math>\displaystyle d_{1}=vs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vs_{2}bw  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,0)  </math>
+#  <math>\displaystyle d_{1}=vs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vs_{2}bw  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,0),  </math>
-#  <math>\displaystyle d_{1}=vs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vbs_{2}w  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,1)  </math> i  <math>\displaystyle w\neq 1  </math>
+#  <math>\displaystyle d_{1}=vs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vbs_{2}w  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,1)  </math> i  <math>\displaystyle w\neq 1,  </math>
-#  <math>\displaystyle d_{1}=vs_{1}\#  </math> ,  <math>\displaystyle d_{2}=vbs_{2}\#  </math>  oraz  <math>\displaystyle f(s_{1},\#)\ni(s_{2},b,1)  </math>
+#  <math>\displaystyle d_{1}=vs_{1}\#  </math> ,  <math>\displaystyle d_{2}=vbs_{2}\#  </math>  oraz  <math>\displaystyle f(s_{1},\#)\ni(s_{2},b,1),  </math>
-#  <math>\displaystyle d_{1}=vcs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vs_{2}cbw  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,-1)  </math>
+#  <math>\displaystyle d_{1}=vcs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vs_{2}cbw  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,-1),  </math>
-#  <math>\displaystyle d_{1}=s_{1}\#w  </math> ,  <math>\displaystyle d_{2}=s_{2}\#bw  </math>  oraz  <math>\displaystyle f(s_{1},\#)\ni(s_{2},b,-1)  </math>
+#  <math>\displaystyle d_{1}=s_{1}\#w  </math> ,  <math>\displaystyle d_{2}=s_{2}\#bw  </math>  oraz  <math>\displaystyle f(s_{1},\#)\ni(s_{2},b,-1).  </math>
 Tak jak poprzednio, przechodnie domknięcie relacji  <math>\displaystyle \mapsto  </math>
@@ Linia 694: / Linia 680: @@
 Pomimo tego, że postawiona definicja maszyny niedeterministycznej
-jest bardzo podobna do maszyny deterministycznej występuje tutaj
+jest bardzo podobna do maszyny deterministycznej, występuje tutaj
 jedna bardzo istotna różnica. Słowo wejściowe może prowadzić do
 wielu różnych obliczeń wykonanych, w szczególności jedno z obliczeń
-może doprowadzać do zatrzymania maszyny a inne nie.
+może doprowadzać do zatrzymania maszyny, a inne nie.
 Przykład maszyny niedeterministycznej podamy później, przy okazji
@@ Linia 715: / Linia 701: @@
 Podkreślamy fakt, że aby maszyna niedeterministyczna zaakceptowała
-słowo wejściowe wystarczy aby wśród wszystkich możliwych obliczeń
+słowo wejściowe, wystarczy, aby wśród wszystkich możliwych obliczeń
 znalazło się co najmniej jedno akceptujące.
 Wprost z definicji wynika że każda maszyna deterministyczna jest
-także maszyną niedeterministyczną, co oznacza że języki rozpoznawane
+także maszyną niedeterministyczną, co oznacza, że języki rozpoznawane
 przez maszyny deterministyczne są zawarte w klasie języków
 rozpoznawanych przez maszyny niedeterministyczne. Przeciwna inkluzja
@@ Linia 729: / Linia 715: @@
 istnieje maszyna deterministyczna <math>\displaystyle \mathcal{MT}</math> taka, że
 <center><math>\displaystyle
-L(\mathcal{NMT})=L(\mathcal{MT})
+L(\mathcal{NMT})=L(\mathcal{MT}).
 </math></center>
@@ Linia 735: / Linia 721: @@
 {{dowod|||
-''(Szkic)''. Aby sprawdzić czy maszyna
+''(Szkic)''. Aby sprawdzić, czy maszyna
-niedeterministyczna akceptuje dane słowo wejściowe należy przejrzeć
+niedeterministyczna akceptuje dane słowo wejściowe, należy przejrzeć
 wszystkie możliwe obliczenia wykonywane, tworzące drzewo obliczeń.
 Poziomy drzewa tworzone są przez kroki czasowe, wierzchołki stanowią
-obliczenia wykonane w danym kroku czasowym a gałęzie zadane są przez
+obliczenia wykonane w danym kroku czasowym, a gałęzie zadane są przez
-relację bezpośredniego następstwa. W celu sprawdzenia czy maszyna
+relację bezpośredniego następstwa. W celu sprawdzenia, czy maszyna
-akceptuje dane słowo przeglądamy drzewo obliczeń poziomami (por.
+akceptuje dane słowo, przeglądamy drzewo obliczeń poziomami (por.
-algorytm BFS) i akceptujemy gdy przeglądana konfiguracja była
+algorytm BFS) i akceptujemy, gdy przeglądana konfiguracja była
 akceptująca. Tą techniką przeglądamy wszystkie możliwe obliczenia
 wykonane w <math>\displaystyle 1,2,3,\dots</math> krokach.
@@ Linia 754: / Linia 740: @@
 # Rozpocznij ze słowem wejściowym <math>\displaystyle w</math> na taśmie <math>\displaystyle 1</math> oraz pustymi taśmami <math>\displaystyle 2</math> i <math>\displaystyle 3</math>.
 # Przekopiuj taśmę <math>\displaystyle 1</math> na taśmę <math>\displaystyle 2</math>.
-# Użyj taśmy <math>\displaystyle 2</math> do symulacji <math>\displaystyle w</math> wykorzystując taśmę <math>\displaystyle 3</math> do wyboru przejść funkcji przejść <math>\displaystyle f</math>. Jeśli po wykonaniu skończonego zbioru instrukcji według adresowania z taśmy <math>\displaystyle 3</math> otrzymano konfigurację akceptującą to akceptuj. W przeciwnym razie przejdź do następnego punktu.
+# Użyj taśmy <math>\displaystyle 2</math> do symulacji <math>\displaystyle w</math>, wykorzystując taśmę <math>\displaystyle 3</math> do wyboru przejść funkcji przejść <math>\displaystyle f</math>. Jeśli po wykonaniu skończonego zbioru instrukcji według adresowania z taśmy <math>\displaystyle 3</math> otrzymano konfigurację akceptującą, to akceptuj. W przeciwnym razie, przejdź do następnego punktu.
-# Zamień ciąg adresowy na następny w kolejności leksykograficznej. Jeśli zapisany ciąg jest ostatnim możliwym ciągiem adresowym o długości <math>\displaystyle N</math> zapisz na taśmie <math>\displaystyle 3</math> pierwszy w kolejności leksykograficznej ciąg adresowy o długości <math>\displaystyle N+1</math> oraz przejdź do <math>\displaystyle 2</math>.
+# Zamień ciąg adresowy na następny w kolejności leksykograficznej. Jeśli zapisany ciąg jest ostatnim możliwym ciągiem adresowym o długości <math>\displaystyle N</math>, zapisz na taśmie <math>\displaystyle 3</math> pierwszy w kolejności leksykograficznej ciąg adresowy o długości <math>\displaystyle N+1</math> oraz przejdź do <math>\displaystyle 2</math>.
 }}
@@ Linia 762: / Linia 748: @@
 Dla każdej maszyny Turinga <math>\displaystyle \mathcal{MT}</math> istnieje maszyna Turinga
-<math>\displaystyle \mathcal{MT}'</math> taka że
+<math>\displaystyle \mathcal{MT}'</math> taka, że
 <center><math>\displaystyle
 L(\mathcal{MT})=L(\mathcal{MT}')
@@ Linia 774: / Linia 760: @@
 Wystarczy przerobić maszynę <math>\displaystyle \mathcal{MT}</math> na maszynę
 niedeterministyczną <math>\displaystyle \mathcal{NMT}</math> posiadającą dodatkowy stan <math>\displaystyle s_A</math>
-oraz taką że dla każdego stanu ze zbioru <math>\displaystyle S_F</math> pod wpływem dowolnego
+oraz taką, że dla każdego stanu ze zbioru <math>\displaystyle S_F</math> pod wpływem dowolnego
 symbolu z <math>\displaystyle \Sigma_T</math> maszyna <math>\displaystyle \mathcal{NMT}</math> posiada dodatkowe
-przejście do <math>\displaystyle s_A</math> w którym już pozostaje i nic nie zmienia. Jasno
+przejście do <math>\displaystyle s_A</math>, w którym już pozostaje i nic nie zmienia. Stąd widać, że <math>\displaystyle L(\mathcal{MT})=L(\mathcal{NMT})</math>.
-widać, że <math>\displaystyle L(\mathcal{MT})=L(\mathcal{NMT})</math>.
 Twierdzenie [[#prz.1b|4.1]] pozwala na otrzymanie maszyny
 <math>\displaystyle \mathcal{MT}'</math> akceptującej ten sam język co <math>\displaystyle \mathcal{NMT}</math> z
-dodatkowym założeniem, że gdy <math>\displaystyle \mathcal{NMT}</math> osiąga stan <math>\displaystyle s_A</math>
+dodatkowym założeniem, że gdy <math>\displaystyle \mathcal{NMT}</math> osiąga stan <math>\displaystyle s_A</math>,
-maszyna <math>\displaystyle \mathcal{MT}'</math> się zatrzymuje. Zauważmy że stan <math>\displaystyle s_A</math> można
+maszyna <math>\displaystyle \mathcal{MT}'</math> się zatrzymuje. Zauważmy, że stan <math>\displaystyle s_A</math> można
-osiągnąć tylko dla słów akceptowanych prze <math>\displaystyle \mathcal{NMT}</math> a z
+osiągnąć tylko dla słów akceptowanych prze <math>\displaystyle \mathcal{NMT}</math>, a z drugiej strony, każde słowo akceptowane przez <math>\displaystyle \mathcal{NMT}</math> prowadzi do co najmniej jednego obliczenia kończącego się w <math>\displaystyle s_A</math>.
-drugiej strony każde słowo akceptowane przez <math>\displaystyle \mathcal{NMT}</math>
-prowadzi do conajmniej jednego obliczenia kończącego się w
-<math>\displaystyle s_A</math>.
 }}

Języki, automaty i obliczenia/Wykład 12: Języki kontekstowe i automat liniowo ograniczony. Maszyna Turinga: Różnice pomiędzy wersjami

Wersja z 18:07, 2 wrz 2006

Spis treści

1. Języki kontekstowe

2. Automat liniowo ograniczony

3. Maszyna Turinga

4. Inne możliwe definicje maszyn Turinga

4.1 Maszyna wielotaśmowa

4.2 Taśma jednostronnie nieskończona

4.3 Wielogłowicowa maszyna wielotaśmowa

4.4 Maszyna niedeterministyczna

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia