Języki, automaty i obliczenia/Wykład 12: Języki kontekstowe i automat liniowo ograniczony. Maszyna Turinga: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Linia 580: Linia 580:
Istnieje kilka możliwych definicji maszyny Turinga, które jak się
Istnieje kilka możliwych definicji maszyny Turinga, które jak się
okazuje są równoważne pod względem możliwości obliczeniowych (tzn.
okazuje są równoważne pod względem możliwości obliczeniowych (tzn.
rozpoznają dokładnie samą klasę języków). Naszkicujemy kilka
rozpoznają dokładnie samą klasę języków). Naszkicujemy kilka
wybranych podejść.
wybranych podejść.


===4.1 Maszyna wielotaśmowa===
===4.1 Maszyna wielotaśmowa===


W tym modelu zakłada się że
W tym modelu zakłada się, że głowica ma do dyspozycji nie tylko jedną, ale wiele taśm, na których może zapisywać i odczytywać symbole. Zakłada się przy tym, że słowo wejściowe znajduje się na pierwszej taśmie. Aby symulować maszynę wielotaśmową na jednej taśmie, należy zamienić alfabet taśmy na alfabet <math>\displaystyle (\Sigma_T)^k</math>, gdzie <math>\displaystyle k</math> oznacza ilość taśm. W tym momencie zapis na taśmie <math>\displaystyle i</math>-tej jest realizowany przez zmianę odpowiedniej
głowica ma do dyspozycji nie tylko jedną ale wiele taśma na których
może zapisywać i odczytywać symbole. Zakłada się przy tym że słowo
wejściowe znajduje się na pierwszej taśmie. Aby symulować maszynę
wielotaśmową na jednej taśmie należy zamienić alfabet taśmy na
alfabet <math>\displaystyle (\Sigma_T)^k</math> gdzie <math>\displaystyle k</math> oznacza ilość taśm. W tym momencie
zapis na taśmie <math>\displaystyle i</math>-tej jest realizowany przez zmianę odpowiedniej
współrzędnej litery z nowego alfabetu (zob. Rys. 4.a). Czyli w
współrzędnej litery z nowego alfabetu (zob. Rys. 4.a). Czyli w
opisywanym przypadku funkcja przejść będzie operowała na
opisywanym przypadku funkcja przejść będzie operowała na
Linia 602: Linia 596:
===4.2 Taśma jednostronnie nieskończona===
===4.2 Taśma jednostronnie nieskończona===


Model ten zakłada że
Model ten zakłada, że taśma jest ograniczona z jednej ze stron. Różnica w porównaniu z rozważaną przez nas maszyną Turinga polega na tym, że nie jest dozwolone przesuwanie lewego markera (tzn. funkcja przejść nie może zawierać przejść typu [[#pkt.5|punkt 5]] definicji 3.1. W tej sytuacji, aby symulować maszynę z taśmą obustronnie nieskończoną na maszynie z taśmą ograniczoną z jednej strony, wystarczy zasymulować taśmę obustronnie nieskończoną poprzez rozszerzenie alfabetu (zob. Rys. 4.b).
taśma jest ograniczona z jednej ze stron. Różnica w porównaniu z
rozważaną przez nas maszyną Turinga polega na tym że nie jest
dozwolone przesuwanie lewego markera (tzn. funkcja przejść nie
może zawierać przejść typu [[#pkt.5|punkt 5]] definicji 3.1. W tej sytuacji aby
symulować maszynę z taśmą obustronnie nieskończoną na maszynie z
taśmą ograniczoną z jednej strony wystarczy zasymulować taśmę
obustronnie nieskończoną poprzez rozszerzenie alfabetu (zob. Rys.
4.b).
<center>
<center>
<div class="thumb"><div style="width:350px;">
<div class="thumb"><div style="width:350px;">
Linia 621: Linia 607:
W tym
W tym
podejściu zakłada się dodatkowo, że każda z taśm posiada swoją
podejściu zakłada się dodatkowo, że każda z taśm posiada swoją
głowicę. Inaczej mówiąc mamy do czynienia z iloczynem kartezjańskim
głowicę. Inaczej mówiąc, mamy do czynienia z iloczynem kartezjańskim
<math>\displaystyle k</math> niezależnych maszyn jednotaśmowych. Akceptowany język jest w
<math>\displaystyle k</math> niezależnych maszyn jednotaśmowych. Akceptowany język jest w
tym momencie <math>\displaystyle k</math>-wymiarowy. Oczywiście, słowo postaci
tym momencie <math>\displaystyle k</math>-wymiarowy. Oczywiście, słowo postaci
Linia 629: Linia 615:
sposób:
sposób:
# Jako zbiór stanów bierzemy <math>\displaystyle S^k</math>.
# Jako zbiór stanów bierzemy <math>\displaystyle S^k</math>.
# Słowa startowe <math>\displaystyle w_1,\dots, w_k</math> zapisujemy jako konfigurację początkową maszyny jednotaśmowej w postaci: <center><math>\displaystyle \sharp (s_0)^k \$ \dot{1} w_1 \$ \dot{2} w_2 \$ \dots \$ \dot{k} w_k \$ </math></center> Symbole <math>\displaystyle \$</math> mają za zadanie wirtualnego rozdzielenia taśm. Symbole <math>\displaystyle \dot{i}</math> wskazują na położenie <math>\displaystyle i</math>-tej głowicy na taśmie.
# Słowa startowe <math>\displaystyle w_1,\dots, w_k</math> zapisujemy jako konfigurację początkową maszyny jednotaśmowej w postaci: <center><math>\displaystyle \sharp (s_0)^k \$ \dot{1} w_1 \$ \dot{2} w_2 \$ \dots \$ \dot{k} w_k \$. </math></center> Symbole <math>\displaystyle \$</math> mają za zadanie wirtualnego rozdzielenia taśm. Symbole <math>\displaystyle \dot{i}</math> wskazują na położenie <math>\displaystyle i</math>-tej głowicy na taśmie.
# W trakcie symulacji przechodzimy pomiędzy markerami i wykonujemy przejścia dla kolejnych głowic.
# W trakcie symulacji przechodzimy pomiędzy markerami i wykonujemy przejścia dla kolejnych głowic.


Linia 635: Linia 621:
przypadku bardzo techniczne. Musimy zapewnić możliwość poszerzania
przypadku bardzo techniczne. Musimy zapewnić możliwość poszerzania
obszaru zapisu na poszczególnych taśmach, co jest realizowane
obszaru zapisu na poszczególnych taśmach, co jest realizowane
poprzez dopisanie nowego symbolu i przepisywanie przyległych symboli
poprzez dopisanie nowego symbolu i przepisywanie przyległych symboli,
aż do markera włącznie. Następnie należy wrócić do poprzedniego
aż do markera włącznie. Następnie należy wrócić do poprzedniego
miejsca zapisu i symulować działanie kolejnych głowic. Wymaga to
miejsca zapisu i symulować działanie kolejnych głowic. Wymaga to
wprowadzenia sporej liczby stanów pomocniczych. Nie będziemy
wprowadzenia sporej liczby stanów pomocniczych. Nie będziemy
wchodzić w te techniczne szczegóły. Mamy nadzieję że sama idea
zagłębiać się w te techniczne szczegóły. Mamy nadzieję że sama idea
konstrukcji jest w tym momencie jasna.
konstrukcji jest w tym momencie zrozumiała.


Najbardziej ogólna definicja maszyny tego typu dopuszcza dodatkowo
Najbardziej ogólna definicja maszyny tego typu dopuszcza dodatkowo,
aby głowice mogły przeglądać pozostałe taśmy, dzięki czemu zapewnia
aby głowice mogły przeglądać pozostałe taśmy, dzięki czemu zapewnia
się komunikację między głowicami. Symulacja takiej maszyny na jednej
się komunikację między głowicami. Symulacja takiej maszyny na jednej
Linia 652: Linia 638:
znaczenie dla teorii złożoności. Z tego powodu przyglądniemy mu się
znaczenie dla teorii złożoności. Z tego powodu przyglądniemy mu się
dokładniej. Różnica pomiędzy niedeterministyczną maszyną Turinga a
dokładniej. Różnica pomiędzy niedeterministyczną maszyną Turinga a
maszyną deterministyczną polega na tym że funkcja przejść może
maszyną deterministyczną polega na tym, że funkcja przejść może
pozwalać na kilka różnych przejść na skutek tego samego symbolu
pozwalać na kilka różnych przejść na skutek tego samego symbolu
czytanego (gdyż funkcja przejść w tym przypadku będzie
czytanego (gdyż funkcja przejść w tym przypadku będzie
Linia 659: Linia 645:
{{definicja|4.1||
{{definicja|4.1||
'''(Jednotaśmowa) niedeterministyczna maszyna Turinga''' jest to
'''(Jednotaśmowa) niedeterministyczna maszyna Turinga''' jest to
system  <math>\displaystyle \mathbf{NMT}=(\Sigma _{T},S,f,s_{0},S_{F})  </math>  w którym
system  <math>\displaystyle \mathbf{NMT}=(\Sigma _{T},S,f,s_{0},S_{F})  </math>, w którym
<math>\displaystyle \Sigma _{T}  </math>  jest skończonym alfabetem,  <math>\displaystyle S  </math>  
<math>\displaystyle \Sigma _{T}  </math>  jest skończonym alfabetem,  <math>\displaystyle S  </math>  
skończonym zbiorem stanów,  <math>\displaystyle S\cap \Sigma _{T}=\emptyset  </math>  oraz
skończonym zbiorem stanów,  <math>\displaystyle S\cap \Sigma _{T}=\emptyset  </math>  oraz
Linia 679: Linia 665:
d_{2}  </math>  wtedy i&nbsp;tylko wtedy, gdy spełniony jest jeden z niżej
d_{2}  </math>  wtedy i&nbsp;tylko wtedy, gdy spełniony jest jeden z niżej
wypisanych warunków, gdzie  <math>\displaystyle s_{1},s_{2}\in S  </math> ,  <math>\displaystyle a,b,c\in
wypisanych warunków, gdzie  <math>\displaystyle s_{1},s_{2}\in S  </math> ,  <math>\displaystyle a,b,c\in
\Sigma _{T}  </math>  oraz  <math>\displaystyle v,w\in \Sigma _{T}^{*}  </math>  
\Sigma _{T}  </math>  oraz  <math>\displaystyle v,w\in \Sigma _{T}^{*}  </math>:
#  <math>\displaystyle d_{1}=vs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vs_{2}bw  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,0)  </math>  
#  <math>\displaystyle d_{1}=vs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vs_{2}bw  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,0), </math>  
#  <math>\displaystyle d_{1}=vs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vbs_{2}w  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,1)  </math> i  <math>\displaystyle w\neq 1  </math>  
#  <math>\displaystyle d_{1}=vs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vbs_{2}w  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,1)  </math> i  <math>\displaystyle w\neq 1, </math>  
#  <math>\displaystyle d_{1}=vs_{1}\#  </math> ,  <math>\displaystyle d_{2}=vbs_{2}\#  </math>  oraz  <math>\displaystyle f(s_{1},\#)\ni(s_{2},b,1)  </math>  
#  <math>\displaystyle d_{1}=vs_{1}\#  </math> ,  <math>\displaystyle d_{2}=vbs_{2}\#  </math>  oraz  <math>\displaystyle f(s_{1},\#)\ni(s_{2},b,1), </math>  
#  <math>\displaystyle d_{1}=vcs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vs_{2}cbw  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,-1)  </math>  
#  <math>\displaystyle d_{1}=vcs_{1}aw  </math> ,  <math>\displaystyle d_{2}=vs_{2}cbw  </math>  oraz  <math>\displaystyle f(s_{1},a)\ni(s_{2},b,-1), </math>  
#  <math>\displaystyle d_{1}=s_{1}\#w  </math> ,  <math>\displaystyle d_{2}=s_{2}\#bw  </math>  oraz  <math>\displaystyle f(s_{1},\#)\ni(s_{2},b,-1)  </math>  
#  <math>\displaystyle d_{1}=s_{1}\#w  </math> ,  <math>\displaystyle d_{2}=s_{2}\#bw  </math>  oraz  <math>\displaystyle f(s_{1},\#)\ni(s_{2},b,-1). </math>  


Tak jak poprzednio, przechodnie domknięcie relacji  <math>\displaystyle \mapsto  </math>  
Tak jak poprzednio, przechodnie domknięcie relacji  <math>\displaystyle \mapsto  </math>  
Linia 694: Linia 680:


Pomimo tego, że postawiona definicja maszyny niedeterministycznej
Pomimo tego, że postawiona definicja maszyny niedeterministycznej
jest bardzo podobna do maszyny deterministycznej występuje tutaj
jest bardzo podobna do maszyny deterministycznej, występuje tutaj
jedna bardzo istotna różnica. Słowo wejściowe może prowadzić do
jedna bardzo istotna różnica. Słowo wejściowe może prowadzić do
wielu różnych obliczeń wykonanych, w szczególności jedno z obliczeń
wielu różnych obliczeń wykonanych, w szczególności jedno z obliczeń
może doprowadzać do zatrzymania maszyny a inne nie.
może doprowadzać do zatrzymania maszyny, a inne nie.


Przykład maszyny niedeterministycznej podamy później, przy okazji
Przykład maszyny niedeterministycznej podamy później, przy okazji
Linia 715: Linia 701:


Podkreślamy fakt, że aby maszyna niedeterministyczna zaakceptowała
Podkreślamy fakt, że aby maszyna niedeterministyczna zaakceptowała
słowo wejściowe wystarczy aby wśród wszystkich możliwych obliczeń
słowo wejściowe, wystarczy, aby wśród wszystkich możliwych obliczeń
znalazło się co najmniej jedno akceptujące.
znalazło się co najmniej jedno akceptujące.


Wprost z definicji wynika że każda maszyna deterministyczna jest
Wprost z definicji wynika że każda maszyna deterministyczna jest
także maszyną niedeterministyczną, co oznacza że języki rozpoznawane
także maszyną niedeterministyczną, co oznacza, że języki rozpoznawane
przez maszyny deterministyczne są zawarte w klasie języków
przez maszyny deterministyczne są zawarte w klasie języków
rozpoznawanych przez maszyny niedeterministyczne. Przeciwna inkluzja
rozpoznawanych przez maszyny niedeterministyczne. Przeciwna inkluzja
Linia 729: Linia 715:
istnieje maszyna deterministyczna <math>\displaystyle \mathcal{MT}</math> taka, że
istnieje maszyna deterministyczna <math>\displaystyle \mathcal{MT}</math> taka, że
<center><math>\displaystyle  
<center><math>\displaystyle  
L(\mathcal{NMT})=L(\mathcal{MT})
L(\mathcal{NMT})=L(\mathcal{MT}).
</math></center>
</math></center>


Linia 735: Linia 721:


{{dowod|||
{{dowod|||
''(Szkic)''. Aby sprawdzić czy maszyna
''(Szkic)''. Aby sprawdzić, czy maszyna
niedeterministyczna akceptuje dane słowo wejściowe należy przejrzeć
niedeterministyczna akceptuje dane słowo wejściowe, należy przejrzeć
wszystkie możliwe obliczenia wykonywane, tworzące drzewo obliczeń.
wszystkie możliwe obliczenia wykonywane, tworzące drzewo obliczeń.
Poziomy drzewa tworzone są przez kroki czasowe, wierzchołki stanowią
Poziomy drzewa tworzone są przez kroki czasowe, wierzchołki stanowią
obliczenia wykonane w danym kroku czasowym a gałęzie zadane są przez
obliczenia wykonane w danym kroku czasowym, a gałęzie zadane są przez
relację bezpośredniego następstwa. W celu sprawdzenia czy maszyna
relację bezpośredniego następstwa. W celu sprawdzenia, czy maszyna
akceptuje dane słowo przeglądamy drzewo obliczeń poziomami (por.
akceptuje dane słowo, przeglądamy drzewo obliczeń poziomami (por.
algorytm BFS) i akceptujemy gdy przeglądana konfiguracja była
algorytm BFS) i akceptujemy, gdy przeglądana konfiguracja była
akceptująca. Tą techniką przeglądamy wszystkie możliwe obliczenia
akceptująca. Tą techniką przeglądamy wszystkie możliwe obliczenia
wykonane w <math>\displaystyle 1,2,3,\dots</math> krokach.
wykonane w <math>\displaystyle 1,2,3,\dots</math> krokach.
Linia 754: Linia 740:
# Rozpocznij ze słowem wejściowym <math>\displaystyle w</math> na taśmie <math>\displaystyle 1</math> oraz pustymi taśmami <math>\displaystyle 2</math> i <math>\displaystyle 3</math>.
# Rozpocznij ze słowem wejściowym <math>\displaystyle w</math> na taśmie <math>\displaystyle 1</math> oraz pustymi taśmami <math>\displaystyle 2</math> i <math>\displaystyle 3</math>.
# Przekopiuj taśmę <math>\displaystyle 1</math> na taśmę <math>\displaystyle 2</math>.
# Przekopiuj taśmę <math>\displaystyle 1</math> na taśmę <math>\displaystyle 2</math>.
# Użyj taśmy <math>\displaystyle 2</math> do symulacji <math>\displaystyle w</math> wykorzystując taśmę <math>\displaystyle 3</math> do wyboru przejść funkcji przejść <math>\displaystyle f</math>. Jeśli po wykonaniu skończonego zbioru instrukcji według adresowania z taśmy <math>\displaystyle 3</math> otrzymano konfigurację akceptującą to akceptuj. W przeciwnym razie przejdź do następnego punktu.
# Użyj taśmy <math>\displaystyle 2</math> do symulacji <math>\displaystyle w</math>, wykorzystując taśmę <math>\displaystyle 3</math> do wyboru przejść funkcji przejść <math>\displaystyle f</math>. Jeśli po wykonaniu skończonego zbioru instrukcji według adresowania z taśmy <math>\displaystyle 3</math> otrzymano konfigurację akceptującą, to akceptuj. W przeciwnym razie, przejdź do następnego punktu.
# Zamień ciąg adresowy na następny w kolejności leksykograficznej. Jeśli zapisany ciąg jest ostatnim możliwym ciągiem adresowym o długości <math>\displaystyle N</math> zapisz na taśmie <math>\displaystyle 3</math> pierwszy w kolejności leksykograficznej ciąg adresowy o długości <math>\displaystyle N+1</math> oraz przejdź do <math>\displaystyle 2</math>.
# Zamień ciąg adresowy na następny w kolejności leksykograficznej. Jeśli zapisany ciąg jest ostatnim możliwym ciągiem adresowym o długości <math>\displaystyle N</math>, zapisz na taśmie <math>\displaystyle 3</math> pierwszy w kolejności leksykograficznej ciąg adresowy o długości <math>\displaystyle N+1</math> oraz przejdź do <math>\displaystyle 2</math>.


}}
}}
Linia 762: Linia 748:


Dla każdej maszyny Turinga <math>\displaystyle \mathcal{MT}</math> istnieje maszyna Turinga
Dla każdej maszyny Turinga <math>\displaystyle \mathcal{MT}</math> istnieje maszyna Turinga
<math>\displaystyle \mathcal{MT}'</math> taka że
<math>\displaystyle \mathcal{MT}'</math> taka, że
<center><math>\displaystyle  
<center><math>\displaystyle  
L(\mathcal{MT})=L(\mathcal{MT}')
L(\mathcal{MT})=L(\mathcal{MT}')
Linia 774: Linia 760:
Wystarczy przerobić maszynę <math>\displaystyle \mathcal{MT}</math> na maszynę
Wystarczy przerobić maszynę <math>\displaystyle \mathcal{MT}</math> na maszynę
niedeterministyczną <math>\displaystyle \mathcal{NMT}</math> posiadającą dodatkowy stan <math>\displaystyle s_A</math>
niedeterministyczną <math>\displaystyle \mathcal{NMT}</math> posiadającą dodatkowy stan <math>\displaystyle s_A</math>
oraz taką że dla każdego stanu ze zbioru <math>\displaystyle S_F</math> pod wpływem dowolnego
oraz taką, że dla każdego stanu ze zbioru <math>\displaystyle S_F</math> pod wpływem dowolnego
symbolu z <math>\displaystyle \Sigma_T</math> maszyna <math>\displaystyle \mathcal{NMT}</math> posiada dodatkowe
symbolu z <math>\displaystyle \Sigma_T</math> maszyna <math>\displaystyle \mathcal{NMT}</math> posiada dodatkowe
przejście do <math>\displaystyle s_A</math> w którym już pozostaje i nic nie zmienia. Jasno
przejście do <math>\displaystyle s_A</math>, w którym już pozostaje i nic nie zmienia. Stąd widać, że <math>\displaystyle L(\mathcal{MT})=L(\mathcal{NMT})</math>.
widać, że <math>\displaystyle L(\mathcal{MT})=L(\mathcal{NMT})</math>.


Twierdzenie [[#prz.1b|4.1]] pozwala na otrzymanie maszyny
Twierdzenie [[#prz.1b|4.1]] pozwala na otrzymanie maszyny
<math>\displaystyle \mathcal{MT}'</math> akceptującej ten sam język co <math>\displaystyle \mathcal{NMT}</math> z
<math>\displaystyle \mathcal{MT}'</math> akceptującej ten sam język co <math>\displaystyle \mathcal{NMT}</math> z
dodatkowym założeniem, że gdy <math>\displaystyle \mathcal{NMT}</math> osiąga stan <math>\displaystyle s_A</math>
dodatkowym założeniem, że gdy <math>\displaystyle \mathcal{NMT}</math> osiąga stan <math>\displaystyle s_A</math>,
maszyna <math>\displaystyle \mathcal{MT}'</math> się zatrzymuje. Zauważmy że stan <math>\displaystyle s_A</math> można
maszyna <math>\displaystyle \mathcal{MT}'</math> się zatrzymuje. Zauważmy, że stan <math>\displaystyle s_A</math> można
osiągnąć tylko dla słów akceptowanych prze <math>\displaystyle \mathcal{NMT}</math> a z
osiągnąć tylko dla słów akceptowanych prze <math>\displaystyle \mathcal{NMT}</math>, a z drugiej strony, każde słowo akceptowane przez <math>\displaystyle \mathcal{NMT}</math> prowadzi do co najmniej jednego obliczenia kończącego się w <math>\displaystyle s_A</math>.
drugiej strony każde słowo akceptowane przez <math>\displaystyle \mathcal{NMT}</math>
prowadzi do conajmniej jednego obliczenia kończącego się w
<math>\displaystyle s_A</math>.
}}
}}

Wersja z 18:07, 2 wrz 2006

W tym wykładzie omówimy języki i gramatyki kontekstowe oraz ich własności. Wprowadzimy automat liniowo ograniczony i uzasadnimy równość rodziny języków kontekstowych i rodziny języków rozpoznawanych przez automaty liniowo ograniczone. Zdefiniujemy maszynę Turinga i pokażemy równoważność tego modelu z wybranymi innymi modelami obliczeń.

W tym wykładzie omówimy kolejną rodzinę języków hierarchii Chomsky'ego, a mianowicie języki kontekstowe. Przedstawimy kilka własnosci gramatyk kontekstowych, czyli typu (1) oraz wprowadzimy pojęcie automatu liniowo ograniczonego. Wprowadzimy też najogólniejszy model obliczeń, a mianowicie maszynę Turinga.

1. Języki kontekstowe

Języki kontekstowe to kolejna rodzina języków w hierarchii Chomsky'ego. Rozszerza ona istotnie rodzinę języków bezkontekstowych. Wykorzystanie tej rodziny języków formalnych jest dość ograniczone. Brak jest bowiem praktycznych metod konstrukcji parserów dla tych gramatyk.

Ta część wykładu prezentuje gramatyki równoważne gramatykom kontekstowym, posiadające pewne określone własności. Te własności wykorzystuje się przy uzasadnieniu faktu, że rodzina języków kontekstowych pokrywa się z rodziną języków rozpoznawanych przez automaty liniowo ograniczone. Biorąc pod uwagę to, że zastosowania tej rodziny języków formalnych nie są powszechne oraz to, że dowody dla przedstawionych poniżej twierdzeń są mocno techniczne, postanowiliśmy zrezygnować z rygorystycznej prezentacji tego materiału i pominąć dowody. Zainteresowany Student może je znaleźć w literaturze wskazanej do tego przedmiotu.

Definicja 1.1

Gramatykę G=(VN,VT,v0,P) nazywamy rozszerzającą, jeśli każde prawo jest postaci xy , gdzie x,y(VNVT)* i spełniona jest nierówność xy lub jest to prawo v01 i wtedy v0 nie występuje po prawej stronie w żadnej produkcji z P .

Wprost z definicji wynika, że gramatyka kontekstowa jest gramatyką rozszerzającą. Prawdziwe jest również następujące twierdzenie.

Twierdzenie 1.1

Dla dowolnej gramatyki G=(VN,VT,v0,P) rozszerzającej istnieje równoważna gramatyka kontekstowa.

Wprowadzimy teraz gramatyki z markerem końca.

Definicja 1.2

Gramatyką z markerem końca nazywamy gramatykę G=(VN{},VT,v0,P) taką, że VNVT oraz prawa są postaci: uv , uv lub uv , gdzie u,v(VNVT)* i w słowie u występuje co najmniej jeden symbol nieterminalny z VN . Językiem generowanym przez tę gramatykę nazywamy zbiór

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(G_{\sharp })=\{w\in V_{T}^{*}:\: \sharp v_{0}\sharp \mapsto^{*}\sharp w\sharp \}. }

Gramatyka z markerem końca G jest kontekstowa (typu 1 ), jeśli jej prawa po wymazaniu markera spełniają warunki gramatyki rozszerzającej. Oczywiście dla dowolnej gramatyki kontekstowej istnieje równoważna gramatyka kontekstowa z markerem końca. Prawdziwe jest również następujące twierdzenie:

Twierdzenie 1.2

Dla dowolnej gramatyki kontekstowej z markerem końca istnieje równoważna gramatyka kontekstowa.

Dowód

Niech G=(VN{},VT,v0,P) będzie dowolną gramatyką kontekstową z markerem końca. Zakładamy, bez ograniczania ogólności rozważań, że w zbiorze P nie występuje prawo v01 (po wymazaniu markera ). Dla każdego symbolu x ze zbioru V=VNVT określamy trzy symbole Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \, ^{\sharp }x,x^{\sharp },^{\: \sharp }x^{\sharp } } oraz oznaczamy odpowiednio przez V,V,V zbiory tych symboli. Dla u=u1...uk takiego, że k1 i uiV dla i=1,...,k wprowadzamy także następujące oznaczenia:

u=u1u2...uk , u=u1...uk1uk oraz u=u1u2...uk1uk gdy k>1 .

Przy takich oznaczeniach definiujemy gramatykę

G1=(VNVVV,VT,v0,P1),

w której zbiór praw P1 składa się ze wszystkich praw uzyskanych zgodnie z poniższymi warunkami:

  1. jeśli uwP , to Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle u\rightarrow w,\: ^{\#}u\rightarrow \, ^{\#}w,\: u^{\#}\rightarrow w^{\#},\: ^{\#}u^{\#}\rightarrow \, ^{\#}w^{\#}\in P_{1}, }
  2. jeśli #u#wP , to Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \: u^{\#}\rightarrow w^{\#},\: ^{\#}u^{\#}\rightarrow \, ^{\#}w^{\#}\in P_{1}, }
  3. jeśli u#w#P , to Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle u^{\#}\rightarrow w^{\#},\: ^{\#}u^{\#}\rightarrow \, ^{\#}w^{\#}\in P_{1}, }
  4. Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \, ^{\#}x\rightarrow x,\: x^{\#}\rightarrow x,\: ^{\#}x^{\#}\rightarrow x\in P_{1} }

dla wszystkich xV .

Określona w ten sposób gramatyka G1 jest gramatyką rozszerzającą i równoważną wyjściowej. Dla gramatyki G1 istnieje, zgodnie z poprzednim twierdzeniem, równoważna gramatyka kontekstowa, co kończy dowód twierdzenia.

Prawdziwe jest także następujące twierdzenie (porównaj z 1.1).

Twierdzenie 1.3

Dla dowolnej gramatyki kontekstowej (rozszerzającej) istnieje równoważna gramatyka kontekstowa (rozszerzająca) o tej własności, że każde prawo, w którym występuje symbol terminalny, jest postaci va , gdzie Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v\in V_{N},\: a\in V_{T} } .

Mówimy, że gramatyka G jest rzędu n>0 , jeśli dla każdego prawa xy tej gramatyki spełniony jest warunek xn i yn . Kolejne twierdzenie stwierdza możliwość dalszego uproszczenia praw gramatyki rozszerzającej.

Twierdzenie 1.4

Dla każdej gramatyki rozszerzającej istnieje równoważna gramatyka rozszerzająca rzędu 2 .

Na koniec wprowadzimy jeszcze jeden rodzaj gramatyk równoważnych gramatykom kontekstowym. Są to mianowicie gramatyki liniowo ograniczone.

Definicja 1.3

Gramatyka G=(VN,VT,v0,P) jest liniowo ograniczona, jeśli każde prawo jest jednej z następujących postaci:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v_{0}\rightarrow v_{0}v,\: v_{1}v_{2}\rightarrow z_{1}z_{2},\: v\rightarrow x, }

gdzie Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle x\in V_{N}\cup V_{T},\: v,v_{1},v_{2},z_{1},z_{2}\in V_{N} } oraz v0{x,z1,z2,v} .

Twierdzenie 1.5

Dla dowolnej gramatyki kontekstowej G istnieje gramatyka liniowo ograniczona G1 , która jest równoważna G lub też generuje język L(G){1} .

Dowód

W świetle poprzednich twierdzeń możemy przyjąć, że gramatyka kontekstowa G=(VN,VT,v0,P) ma prawa wyłącznie w następujących postaciach:

  1. v01,
  2. vx gdzie Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle v\in V_{N},\: x\in V_{N}\cup V_{T}, }
  3. vv1v2 gdzie v,v1,v2VN,
  4. v1v2v3v4 gdzie v1,v2,v3,v4VN.

Określamy gramatykę G1=(VN{z0,z1},VT,z0,P1) , gdzie z1,z2 są nowymi symbolami nieterminalnymi, a więc nie należą do VN . Natomiast zbiór praw P1 składa się ze wszystkich praw ze zbioru P postaci 2 i 4 oraz Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle z_{0}\rightarrow z_{0}z_{1},\: z_{0}\rightarrow v_{0},\: } praw Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle z_{1}v\rightarrow vz_{1},\: vz_{1}\rightarrow z_{1}v } dla vVN i praw v1z1v3v4 dla każdego prawa postaci 4 w gramatyce G . Skonstruowana gramatyka jest liniowo ograniczona i spełnia tezę twierdzenia.

2. Automat liniowo ograniczony

Określimy teraz systemy, zwane automatami liniowo ograniczonymi, który rozpoznają języki kontekstowe.

Definicja 2.1

Automatem liniowo ograniczonym nazywamy system 𝒜LO=(ΣT,S,P,s0,SF) , w którym ΣT jest skończonym alfabetem, S skończonym zbiorem stanów, SΣT= oraz wyróżniony jest podzbiór ΣIΣT . Zbiór ΣT zwany jest alfabetem taśmy, a ΣI - alfabetem wejściowym. Wyróżnione są także: element #ΣTΣI zwany markerem końca, stan początkowy s0S oraz SFS - zbiór stanów końcowych. Natomiast relacja przejść P(S×ΣT)×(S×ΣT×{1,0,1}) spełnia następujące warunki:

  1. jeśli (s1,#)P(s2,a,k) , to a=#,
  2. jeśli (s1,a)P(s2,#,k) , to a=#.

Fakt, że (s1,a)P(s2,b,k) , zapisujemy zazwyczaj jako (s1,a)(s2,b,k) . Do opisu działania automatu liniowo ograniczonego wygodnie jest wprowadzić pojęcie konfiguracji (podobnie jak dla automatów ze stosem).

Konfiguracją automatu liniowo ograniczonego jest słowo vsw(ΣTS)* , w którym sS,v,wΣT* . Pomiędzy dwoma konfiguracjami d1,d2 zachodzi relacja bezpośredniego następstwa d1d2 wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie s1,s2S , a,b,cΣT oraz v,wΣT*:

  1. d1=vs1aw , d2=vs2bw oraz (s1,a)P(s2,b,0),
  2. d1=vs1aw , d2=vbs2w oraz (s1,a)P(s2,b,1),
  3. d1=vcs1aw , d2=vs2cbw oraz (s1,a)P(s2,b,1).

Przechodnie domknięcie relacji oznaczać będziemy symbolem * i określać mianem obliczenia wykonanego przez automat liniowo ograniczony.

Język rozpoznawany przez automat liniowo ograniczony 𝒜LO to zbiór słów nad alfabetem ΣI , pod działaniem których automat wykonuje obliczenie prowadzące do stanu końcowego, czyli

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(\mathcal{A}_{LO})=\left\{ w\in \Sigma _{I}^{*}\: :\: s_{0}\#w\#\mapsto^{*}vs,\; v\in \Sigma _{T}^{*},\, s\in S_{F}\right\} .}

Język LΣI* jest rozpoznawany (akceptowany) przez automat liniowo ograniczony, jeśli istnieje automat 𝒜LO taki, że (𝒜LO)=L.

<flash>file=Wyklad12_rysunek1.swf|width=200|height=200</flash> <div.thumbcaption>Rysunek 1


Opiszemy teraz możliwe ruchy automatu liniowo ograniczonego. Automat ten może czytać słowo wejściowe w dwóch kierunkach. Jego głowica może poruszać się w lewo lub w prawo. Automat może wymieniać czytaną literę na inną, ale nie rozszerza miejsca zajętego na taśmie przez czytane słowo. Działa niedeterministycznie. Czytając literę a, będąc w stanie s, automat ma kilka możliwości działania. Może mianowicie:

  1. zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 1. Głowica czytająca automatu pozostaje w poprzedniej pozycji,
  2. zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 2. Głowica czytająca automatu przesuwa się w prawo,
  3. zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 3. Głowica czytająca automatu przesuwa się w lewo.

Związek pomiędzy rodziną języków kontekstowych a wprowadzoną rodziną automatów liniowo ograniczonych ustalają poniższe twierdzenia.

Twierdzenie 2.1

Dla dowolnego języka kontekstowego L istnieje automat liniowo ograniczony 𝒜LO taki, że (𝒜LO)=L .

Dowód

Można założyć, bez ograniczenia ogólności naszych rozważań, że gramatyka G=(VN,VT,v0,P) generująca język L ma prawa wyłącznie następujących postaci:

  1. (G) vx , gdzie vVN,xVNVT,xv0,
  2. (G) v0v0v1 , gdzie v1VN,v1v0,
  3. (G) v1v2v3v4 , gdzie v1,...,v4VN,v3,v4v0,
  4. (G) v01, jeśli 1L .

Określamy automat liniowo ograniczony 𝒜LO=(ΣT,S,P,s0,SF) , przyjmując ΣT=VNVT{#,} , S={s0,s1,s2,s3,s4}{sv1:v1v2v3v4P} , ΣI=VNVT , SF={s3} , s0 - stan początkowy. Relacja przejść automatu 𝒜LO zdefiniowana jest poniżej:

  1. (A) (s0,#)(s0,#,1),
  2. (A) (s0,#)(s4,#,1) jeśli 1L,
  3. (A) (s0,x)(s0,x,1) , (s0,x)(s0,x,1) dla każdego xVNVT,
  4. (A) (s0,x)(s0,v,0) jeśli vxP i xv0,
  5. (A) (s0,v3)(sv1,v1,1),(sv1,v4)(s0,v2,0) jeśli v1v2v3v4P,
  6. (A) (s0,v0)(s1,v0,1),
  7. (A) (s1,#)(s2,#,1),
  8. (A) (s1,)(s2,,1),
  9. (A) (s2,v0)(s3,,1),
  10. (A) (s3,v1)(s0,v0,0) , gdy v0v0v1P,
  11. (A) (s3,#)s3,#,1),(s4,#)(s3,#,1).

Określony automat 𝒜LO rozpoznaje tylko te słowa, które są generowane przez gramatykę G , symulując wstecz każde wyprowadzenie gramatyki G .

Prawdziwe jest również następujące twierdzenie.

Twierdzenie 2.2

Dla dowolnego języka L rozpoznawanego przez automat liniowo ograniczony 𝒜LO istnieje gramatyka kontekstowa G taka, że L(G)=L .

W dowodzie konstruuje się odpowiednią gramatykę.Zasada tej konstrukcji jest następująca. Z symbolu startowego gramatyka generuje dowolne słowa, ustawiając zawsze na prawym końcu symbol nieterminalny związany z przejściem automatu do stanu końcowego. Następnie korzysta się z możliwości zamiany takiego symbolu nieterminalnego na inne. W ten sposób gramatyka symuluje wstecz działanie automatu, wprowadzając symbole nieterminalne odpowiadające stanom automatu. Dojście do stanu początkowego automatu w tej symulacji jest równoznaczne z usunięciem ostatniego symbolu nieterminalnego i wygenerowaniem słowa dokładnie tego samego, które rozpoznaje automat.

Udowownimy teraz zamkniętość rodziny języków kontekstowych ze względu na iloczyn mnogościowy.

Twierdzenie 2.3

Dla dowolnych języków kontekstowych L1,L2A* iloczyn mnogościowy tych języków L1L2 jest językiem kontekstowym.

Dowód

(szkic) Załóżmy, że języki L1,L2 są rozpoznawane przez automaty liniowo ograniczone, 𝒜LO1 i 𝒜LO2 . Opiszemy konstrukcję automatu liniowo ograniczonego 𝒜LO , który rozpoznawać będzie wyłącznie słowa akceptowane równocześnie przez oba automaty. Działanie tego automatu jest następujące. Każde słowo będzie czytane trzy razy. Przy pierwszym czytaniu automat 𝒜LO dubluje litery, to znaczy w miejsce litery a wprowadza parę (a,a) . Po zakończeniu tej procedury automat wraca do skrajnej lewej pozycji i rozpoczyna symulację automatu 𝒜LO1 . Jeśli ta symulacja doprowadzi do zaakceptowania czytanego słowa przez automat 𝒜LO1 , to automat 𝒜LO rozpoczyna obliczenie od początku, symulując teraz pracę automatu 𝒜LO2 . Jeśli i ta symulacja zakończy się zaakceptowaniem czytanego słowa, to automat przechodzi do ustalonego stanu końcowego, a to oznacza akceptację tego słowa. Działając w opisany sposób, automat 𝒜LO rozpoznaje język L1L2 , a to w świetle udowodnionego powyżej twierdzenia oznacza, że przecięcie języków kontekstowych L1L2 jest językiem kontekstowym.

Ponieważ dalsze własności domkniętości rodziny języków kontekstowych pokrywają się z własnościami języków typu (0), więc omówimy te własności wspólnie, co będzie mieć miejsce w następnym wykładzie.

3. Maszyna Turinga

Alan Turing (1912-1954)
Zobacz biografię

Przejdziemy teraz do prezentacji ogólnego modelu

maszyny liczącej, który został wprowadzony w 1936 roku przez Alana M. Turinga. Na cześć swego autora został on nazwany (jednotaśmową) maszyną Turinga. Model ten jest podobny w swojej idei do rozważanych wcześniej automatów liniowo ograniczonych, przy czym jednym z podstawowych założeń (i różnic względem automatów) jest nieskończony dostęp do pamięci. Maszyna Turinga może wydawać się na początku pojęciem bardzo abstrakcyjnym. Jednak, jak później zobaczymy, stanowi ona jedną z podstawowych koncepcji współczesnej informatyki. Pozwala na formalne zdefiniowanie pojęcia algorytmu oraz jego złożoności obliczeniowej. Jako model obliczeń pozwala odpowiedzieć także na bardzo ważne pytanie: czy każdy problem można rozwiązać algorytmicznie?

Jednotaśmowa maszyna Turinga jest podobna w swej idei do automatu liniowo ograniczonego, pominięte jednak zostaje, jak wspomnieliśmy, ograniczenie dostępu do pamięci. Omawiana maszyna jest abstrakcyjnym tworem w skład którego wchodzą:

  • dwustronnie nieskończona taśma zbudowana z komórek zawierających symbole z pewnego zadanego alfabetu,
  • głowica, która może czytać i zapisywać symbole w komórkach taśmy oraz poruszać się w prawo lub lewo o jedną komórkę lub pozostawać na tej samej pozycji podczas jednego kroku czasowego,
  • działający sekwencyjnie mechanizm odpowiedzialny za sterowanie maszyną; mechanizm ten na podstawie symbolu odczytanego z komórki pod głowicą oraz stanu, w którym aktualnie znajduje się maszyna, dokonuje zapisu symbolu w tejże komórce, przechodzi do kolejnego stanu i przesuwa głowicę w prawo, lewo lub też nie zmienia pozycji głowicy.

Podamy teraz formalną definicję maszyny Turinga. Aby zachować analogię do poprzednich wykładów, zdefiniujemy maszynę w języku konfiguracji.

Definicja 3.1

(Jednotaśmowa deterministyczna) maszyna Turinga jest to system 𝐌𝐓=(ΣT,S,f,s0,SF) , w którym ΣT jest skończonym alfabetem, S skończonym zbiorem stanów, SΣT= oraz wyróżniony jest podzbiór ΣIΣT . Zbiór ΣT zwany jest alfabetem taśmy, a ΣI - alfabetem wejściowym. Wyróżnione są także: element #ΣTΣI zwany markerem końca, stan początkowy s0S oraz SFS - zbiór stanów końcowych. Natomiast funkcja przejść jest funkcją częściową Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle f:\: (S\times \Sigma _{T})\rightarrow (S\times \Sigma _{T}\times \{-1,0,1\} } .

Konfiguracją maszyny Turinga jest słowo vsw(ΣTS)* , w którym sS,v,wΣT* . Pomiędzy dwiema konfiguracjami d1,d2 zachodzi relacja bezpośredniego następstwa d1d2 wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie s1,s2S , a,b,cΣT oraz v,wΣT*:

  1. d1=vs1aw , d2=vs2bw oraz f(s1,a)=(s2,b,0),
  2. d1=vs1aw , d2=vbs2w oraz f(s1,a)=(s2,b,1) i w1,
  3. d1=vs1# , d2=vbs2# oraz f(s1,#)=(s2,b,1),
  4. d1=vcs1aw , d2=vs2cbw oraz f(s1,a)=(s2,b,1),
  5. d1=s1#w , d2=s2#bw oraz f(s1,#)=(s2,b,1).

Przechodnie domknięcie relacji oznaczać będziemy symbolem * i określać mianem obliczenia wykonanego przez maszynę Turinga. Konfiguracja d1(ΣTS)* jest końcowa, jeśli stąd, że d1d2 , wynika d2=d1. Mówimy, że maszyna Turinga zatrzymuje się w d1 wtedy i tylko wtedy, gdy d1 jest konfiguracją końcową.

Zauważmy, że wprowadzenie markera końca jest zabiegiem czysto formalnym. Pozwala on z jednej strony na oznaczenie słowa wejściowego, a z drugiej strony wskazuje na elementy taśmy, które były zmieniane (czy to przez wprowadzenie słowa wejściowego, czy też poprzez ruch głowicy).

Definicja 3.2

Język rozpoznawany przez maszynę Turinga MT jest to zbiór

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(\mathbf{MT})=\left\{ w\in \Sigma _{T}^{*}\: :\: \sharp s_{0}w\sharp \mapsto^{*}\sharp w_{1}s_{F}w_{2}\sharp ,\; dla\: pewnych\: w_{1},w_{2}\in \Sigma _{T}^{*},s_{F}\in S_{F}\right\} .}

Język LΣI* jest rozpoznawany (akceptowany) przez maszynę Turinga, jeśli istnieje MT taka, że L(𝒯)=L. Klasę języków rozpoznawanych przez maszynę Turinga oznaczamy (MT) .

We wprowadzonym przez nas ujęciu formalnym, działanie maszyny Turinga należy wyobrażać sobie następująco. W pierwszym etapie na taśmę zostają zapisane symbole słowa wejściowego (z alfabetu ΣI), a następnie komórki przyległe zostają oznaczone symbolami . Jednocześnie maszyna jest sprowadzana do stanu s0, a głowica zostaje ustawiona nad pierwszym symbolem słowa wejściowego. W tym momencie rozpoczyna się sekwencyjne przetwarzanie zawartości taśmy przez maszynę. Jeśli maszyna "zatrzyma się", tzn. w dwóch kolejnych chwilach czasowych nie wykona ruchu i jednocześnie nie zmieni stanu i symbolu taśmy, sprawdzany jest jej aktualny stan. Jeśli stan był akceptujący (czyli należał do zbioru SF), to maszyna zaakceptowała słowo, w przeciwnym razie - słowo odrzuciła (gdyż nie może już osiągnąć stanu ze zbioru SF). Należy zwrócić uwagę na to, że dla niektórych konfiguracji początkowych maszyna może nigdy się nie zatrzymać, a mimo to słowo zostanie przez nią zaakceptowane. To samo tyczy się odrzucania słów, jednak w tej sytuacji dowód, że słowo nie zostanie zaakceptowane, może być problematyczny. Zaprezentowane podejście ma na celu uproszczenie i tak już dość technicznych dowodów twierdzeń pojawiających się w tym wykładzie. Związki pomiędzy akceptowaniem a zatrzymywaniem maszyny Turinga zostaną skomentowane później (zob. Wniosek 4.1). W pierwszej kolejności przedstawiamy dwa przykłady:

Przykład 3.1

Skonstruujemy maszynę Turinga MT1, która rozpoznaje język postaci L={02n:n0}. Zamierzone działanie maszyny MT1 można opisać następująco:

  1. Przejdź od lewego markera do prawego, zaznaczając symbolem co drugie 0.
  2. Jeśli było tylko jedno 0, to akceptuj.
  3. Jeśli w kroku 1. obszar pomiędzy markerami zawierał nieparzystą ilość 0, to odrzuć.
  4. Powróć do lewego markera.
  5. Powtórz działanie od 1.

Zwróćmy uwagę, że o ile jasne jest, w jaki sposób maszyna ma akceptować słowa wejściowe, odrzucanie tych słów nie zostało zdefiniowane. Aby ominąć ten problem, wprowadzimy jeden dodatkowy stan (nie należący do stanów końcowych), po osiągnięciu którego maszyna się zatrzymuje (tzn. nie wykonuje ruchów i przepisuje na taśmie wciąż ten sam symbol).

Określamy kolejno elementy składowe maszyny MT1:

ΣI={0},ΣT={0,,,},
S={s0,s1,s2,s3,s4,sA,sR},SF={sA}.

Pozostaje jeszcze zdefiniować funkcję przejść:

(s0,)(sR,,0)(s1,)(s1,,1)(s0,0)(s1,,1)(s1,0)(s2,,1)(s1,)(sA,,0)(s2,)(s2,,1)(s3,0)(s2,,1)(s2,)(s4,,1)(s3,)(s3,,1)(s2,0)(s3,0,1)(s3,)(sR,,0)(s4,0)(s4,0,1)(s4,)(s4,,1)(s4,)(s2,,1)(sA,)(sA,,0)(sR,)(sR,,0)

W miejsce tabeli wygodniej jest zobrazować funkcję przejść maszyny Turinga na etykietowanym grafie skierowanym. Zostało to zrobione na poniższym rysunku:

<flash>file=ja-lekcja12-w-rys1.swf|width=350|height=350</flash>

<div.thumbcaption>Rysunek 2

Łatwo zauważyć, że wprowadzona funkcja przejścia określa maszynę spełniającą postawione przez nas warunki. Symbol został wprowadzony dla odróżnienia wystąpienia pojedynczego zera od sytuacji, gdy liczba zer jest nieparzysta i większa od 1.

Aby lepiej zrozumieć działanie maszyny MT1, zasymulujemy jej działanie na dwóch słowach wejściowych, przy czym pierwsze z nich będzie należało do języka L, a drugie nie:

s00000s1000s2000s300s20s4s40s40s40s10s10s2s2s4s4s4s4s1s1s1s1sA

Wykazaliśmy więc, że s00000*sA. Zatem 04L(MT1).

<flashwrap>file=ja-lekcja12-w-anim1a.swf|size=small</flashwrap>

<div.thumbcaption>Animacja 1

Dla porównania:

s0000s100s200s30sR

Czyli zgodnie z naszym założeniem 03∉L(MT1).

<flashwrap>file=ja-lekcja12-w-anim1b.swf|size=small</flashwrap>

<div.thumbcaption>Animacja 2

Przykład 3.2

Przedstawimy maszynę Turinga MT2 akceptującą język

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L=\left\{w \overleftarrow{w} \: : \: w\in \left\{0,1\right\}^*\right\}, }

gdzie w oznacza lustrzane odbicie słowa w. Elementy języka L nazywamy palindromami. Definiujemy alfabet maszyny:

ΣI={0,1},ΣT={0,1,},

oraz zbiory stanów

S={s0,r0,r0,q0,r1,r1,q1,l,sA,sR},SF={sA}.

Funkcję przejść maszyny MT2 określa tabela:

(s0,)(sA,,0)(s0,0)(r0,,1)(s0,1)(r1,,1)(r0,)(sR,,0)(r0,0)(r0,0,1)(r0,1)(r0,1,1)(r0,)(q0,,1)(r0,0)(r0,0,1)(r0,1)(r0,1,1)(q0,0)(l,,1)(q0,1)(sR,,1)(r1,)(sR,,0)(r1,0)(r1,0,1)(r1,1)(r1,1,1)(r1,)(q1,,1)(r1,0)(r1,0,1)(r1,1)(r1,1,1)(q1,0)(sR,,0)(q1,1)(l,,1)(l,)(s0,,1)(l,0)(l,0,1)(l,1)(l,1,1)(sR,)(sR,,0)(sA,)(sA,,0)

co dla przejrzystości zobrazowano na Rysunku 3.

<flash>file=ja-lekcja12-w-rys3.swf|width=500|height=500</flash>

<div.thumbcaption>Rysunek 3

4. Inne możliwe definicje maszyn Turinga

Istnieje kilka możliwych definicji maszyny Turinga, które jak się okazuje są równoważne pod względem możliwości obliczeniowych (tzn. rozpoznają dokładnie tę samą klasę języków). Naszkicujemy kilka wybranych podejść.

4.1 Maszyna wielotaśmowa

W tym modelu zakłada się, że głowica ma do dyspozycji nie tylko jedną, ale wiele taśm, na których może zapisywać i odczytywać symbole. Zakłada się przy tym, że słowo wejściowe znajduje się na pierwszej taśmie. Aby symulować maszynę wielotaśmową na jednej taśmie, należy zamienić alfabet taśmy na alfabet (ΣT)k, gdzie k oznacza ilość taśm. W tym momencie zapis na taśmie i-tej jest realizowany przez zmianę odpowiedniej współrzędnej litery z nowego alfabetu (zob. Rys. 4.a). Czyli w opisywanym przypadku funkcja przejść będzie operowała na następujących zbiorach:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle f:\: (S\times \Sigma^k_{T} )\rightarrow (S \times \Sigma^k_{T} \times \{-1,0,1\} ). }

4.2 Taśma jednostronnie nieskończona

Model ten zakłada, że taśma jest ograniczona z jednej ze stron. Różnica w porównaniu z rozważaną przez nas maszyną Turinga polega na tym, że nie jest dozwolone przesuwanie lewego markera (tzn. funkcja przejść nie może zawierać przejść typu punkt 5 definicji 3.1. W tej sytuacji, aby symulować maszynę z taśmą obustronnie nieskończoną na maszynie z taśmą ograniczoną z jednej strony, wystarczy zasymulować taśmę obustronnie nieskończoną poprzez rozszerzenie alfabetu (zob. Rys. 4.b).

<flash>file=ja-lekcja12-w-rys4.swf|width=350|height=350</flash>

<div.thumbcaption>Rysunek 4

4.3 Wielogłowicowa maszyna wielotaśmowa

W tym podejściu zakłada się dodatkowo, że każda z taśm posiada swoją głowicę. Inaczej mówiąc, mamy do czynienia z iloczynem kartezjańskim k niezależnych maszyn jednotaśmowych. Akceptowany język jest w tym momencie k-wymiarowy. Oczywiście, słowo postaci (w,1,,1)(ΣT*)k można w naturalny sposób utożsamiać z wΣT. Z drugiej strony maszynę wielogłowicową można symulować na jednotaśmowej w następujący sposób:

  1. Jako zbiór stanów bierzemy Sk.
  2. Słowa startowe w1,,wk zapisujemy jako konfigurację początkową maszyny jednotaśmowej w postaci:
    (s0)k$1˙w1$2˙w2$$k˙wk$.
    Symbole $ mają za zadanie wirtualnego rozdzielenia taśm. Symbole i˙ wskazują na położenie i-tej głowicy na taśmie.
  3. W trakcie symulacji przechodzimy pomiędzy markerami i wykonujemy przejścia dla kolejnych głowic.

Widać już, że formalne podanie funkcji przejść jest w omawianym przypadku bardzo techniczne. Musimy zapewnić możliwość poszerzania obszaru zapisu na poszczególnych taśmach, co jest realizowane poprzez dopisanie nowego symbolu i przepisywanie przyległych symboli, aż do markera włącznie. Następnie należy wrócić do poprzedniego miejsca zapisu i symulować działanie kolejnych głowic. Wymaga to wprowadzenia sporej liczby stanów pomocniczych. Nie będziemy zagłębiać się w te techniczne szczegóły. Mamy nadzieję że sama idea konstrukcji jest w tym momencie zrozumiała.

Najbardziej ogólna definicja maszyny tego typu dopuszcza dodatkowo, aby głowice mogły przeglądać pozostałe taśmy, dzięki czemu zapewnia się komunikację między głowicami. Symulacja takiej maszyny na jednej taśmie jest podobna w swej idei do metody przedstawionej wcześniej.

4.4 Maszyna niedeterministyczna

Ten typ maszyn ma ogromne znaczenie dla teorii złożoności. Z tego powodu przyglądniemy mu się dokładniej. Różnica pomiędzy niedeterministyczną maszyną Turinga a maszyną deterministyczną polega na tym, że funkcja przejść może pozwalać na kilka różnych przejść na skutek tego samego symbolu czytanego (gdyż funkcja przejść w tym przypadku będzie multi-funkcją).

Definicja 4.1

(Jednotaśmowa) niedeterministyczna maszyna Turinga jest to system 𝐍𝐌𝐓=(ΣT,S,f,s0,SF), w którym ΣT jest skończonym alfabetem, S skończonym zbiorem stanów, SΣT= oraz wyróżniony jest podzbiór ΣIΣT . Podobnie jak poprzednio zbiór ΣT zwany jest alfabetem taśmy, a ΣI - alfabetem wejściowym. Wyróżnione są także: element #ΣTΣI zwany markerem końca, stan początkowy s0S oraz SFS - zbiór stanów końcowych. Natomiast funkcja przejść jest funkcją częściową Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle f:\: (S\times \Sigma _{T})\rightarrow \mathcal{P}(S\times \Sigma _{T}\times \{-1,0,1\}) } gdzie 𝒫(A) oznacza zbiór podzbiorów zbioru A.

Konfiguracją maszyny Turinga jest słowo vsw(ΣTS)* , w którym sS,v,wΣT* , przy czym pomiędzy dwiema konfiguracjami d1,d2 zachodzi relacja bezpośredniego następstwa d1d2 wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie s1,s2S , a,b,cΣT oraz v,wΣT*:

  1. d1=vs1aw , d2=vs2bw oraz f(s1,a)(s2,b,0),
  2. d1=vs1aw , d2=vbs2w oraz f(s1,a)(s2,b,1) i w1,
  3. d1=vs1# , d2=vbs2# oraz f(s1,#)(s2,b,1),
  4. d1=vcs1aw , d2=vs2cbw oraz f(s1,a)(s2,b,1),
  5. d1=s1#w , d2=s2#bw oraz f(s1,#)(s2,b,1).

Tak jak poprzednio, przechodnie domknięcie relacji oznaczać będziemy symbolem * i określać mianem obliczenia wykonanego przez maszynę Turinga. Konfiguracja d1(ΣTS)* jest końcowa, jeśli stąd, że d1d2 , wynika d2=d1.

Pomimo tego, że postawiona definicja maszyny niedeterministycznej jest bardzo podobna do maszyny deterministycznej, występuje tutaj jedna bardzo istotna różnica. Słowo wejściowe może prowadzić do wielu różnych obliczeń wykonanych, w szczególności jedno z obliczeń może doprowadzać do zatrzymania maszyny, a inne nie.

Przykład maszyny niedeterministycznej podamy później, przy okazji omawiania klas złożoności obliczeniowej.

Definicja 4.2

Język rozpoznawany przez niedeterministyczną maszynę Turinga NMT jest to zbiór

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(\mathbf{NMT})=\left\{ w\in \Sigma _{T}^{*}\: :\: \sharp s_{0}w\sharp \mapsto^{*}\sharp w_{1}s_{F}w_{2}\sharp ,\; dla\: pewnych\: w_{1},w_{2}\in \Sigma _{T}^{*},s_{F}\in S_{F}\right\} .}

Język LΣI* jest rozpoznawany (akceptowany) przez niedeterministyczną maszynę Turinga, jeśli istnieje 𝒩𝒯 taka, że L(𝒩𝒯)=L.

Podkreślamy fakt, że aby maszyna niedeterministyczna zaakceptowała słowo wejściowe, wystarczy, aby wśród wszystkich możliwych obliczeń znalazło się co najmniej jedno akceptujące.

Wprost z definicji wynika że każda maszyna deterministyczna jest także maszyną niedeterministyczną, co oznacza, że języki rozpoznawane przez maszyny deterministyczne są zawarte w klasie języków rozpoznawanych przez maszyny niedeterministyczne. Przeciwna inkluzja jest gwarantowana przez następujące twierdzenie.

Twierdzenie 4.1

Dla każdej niedeterministycznej maszyny Turinga 𝒩𝒯 istnieje maszyna deterministyczna 𝒯 taka, że

L(𝒩𝒯)=L(𝒯).

Dowód

(Szkic). Aby sprawdzić, czy maszyna niedeterministyczna akceptuje dane słowo wejściowe, należy przejrzeć wszystkie możliwe obliczenia wykonywane, tworzące drzewo obliczeń. Poziomy drzewa tworzone są przez kroki czasowe, wierzchołki stanowią obliczenia wykonane w danym kroku czasowym, a gałęzie zadane są przez relację bezpośredniego następstwa. W celu sprawdzenia, czy maszyna akceptuje dane słowo, przeglądamy drzewo obliczeń poziomami (por. algorytm BFS) i akceptujemy, gdy przeglądana konfiguracja była akceptująca. Tą techniką przeglądamy wszystkie możliwe obliczenia wykonane w 1,2,3, krokach.

Do dokonania symulacji najwygodniej jest użyć maszyny 3-głowicowej z możliwością czytania na wszystkich taśmach. Wprowadzamy te taśmy kolejno do przechowywania słowa wejściowego, symulacji działania maszyny niedeterministycznej i adresowania wyboru przejść ze zbioru przejść danego przez funkcję przejść. Symulacja przebiega w czterech krokach:

  1. Rozpocznij ze słowem wejściowym w na taśmie 1 oraz pustymi taśmami 2 i 3.
  2. Przekopiuj taśmę 1 na taśmę 2.
  3. Użyj taśmy 2 do symulacji w, wykorzystując taśmę 3 do wyboru przejść funkcji przejść f. Jeśli po wykonaniu skończonego zbioru instrukcji według adresowania z taśmy 3 otrzymano konfigurację akceptującą, to akceptuj. W przeciwnym razie, przejdź do następnego punktu.
  4. Zamień ciąg adresowy na następny w kolejności leksykograficznej. Jeśli zapisany ciąg jest ostatnim możliwym ciągiem adresowym o długości N, zapisz na taśmie 3 pierwszy w kolejności leksykograficznej ciąg adresowy o długości N+1 oraz przejdź do 2.

Wniosek 4.1

Dla każdej maszyny Turinga 𝒯 istnieje maszyna Turinga 𝒯 taka, że

L(𝒯)=L(𝒯)

oraz dla każdego wL(𝒯) maszyna 𝒯 zatrzymuje się na w.

Dowód

Wystarczy przerobić maszynę 𝒯 na maszynę niedeterministyczną 𝒩𝒯 posiadającą dodatkowy stan sA oraz taką, że dla każdego stanu ze zbioru SF pod wpływem dowolnego symbolu z ΣT maszyna 𝒩𝒯 posiada dodatkowe przejście do sA, w którym już pozostaje i nic nie zmienia. Stąd widać, że L(𝒯)=L(𝒩𝒯).

Twierdzenie 4.1 pozwala na otrzymanie maszyny 𝒯 akceptującej ten sam język co 𝒩𝒯 z dodatkowym założeniem, że gdy 𝒩𝒯 osiąga stan sA, maszyna 𝒯 się zatrzymuje. Zauważmy, że stan sA można osiągnąć tylko dla słów akceptowanych prze 𝒩𝒯, a z drugiej strony, każde słowo akceptowane przez 𝒩𝒯 prowadzi do co najmniej jednego obliczenia kończącego się w sA.