Języki, automaty i obliczenia/Wykład 12: Języki kontekstowe i automat liniowo ograniczony. Maszyna Turinga

Z Studia Informatyczne
Wersja z dnia 21:57, 15 wrz 2023 autorstwa Luki (dyskusja | edycje) (Zastępowanie tekstu – „,...,” na „,\ldots,”)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

W tym wykładzie omówimy języki i gramatyki kontekstowe oraz ich własności. Wprowadzimy automat liniowo ograniczony i uzasadnimy równość rodziny języków kontekstowych i rodziny języków rozpoznawanych przez automaty liniowo ograniczone. Zdefiniujemy maszynę Turinga i pokażemy równoważność tego modelu z wybranymi innymi modelami obliczeń.

W tym wykładzie omówimy kolejną rodzinę języków hierarchii Chomsky'ego, a mianowicie języki kontekstowe. Przedstawimy kilka własnosci gramatyk kontekstowych, czyli typu (1) oraz wprowadzimy pojęcie automatu liniowo ograniczonego. Wprowadzimy też najogólniejszy model obliczeń, a mianowicie maszynę Turinga.

Języki kontekstowe

Języki kontekstowe to kolejna rodzina języków w hierarchii Chomsky'ego. Rozszerza ona istotnie rodzinę języków bezkontekstowych. Wykorzystanie tej rodziny języków formalnych jest dość ograniczone. Brak jest bowiem praktycznych metod konstrukcji parserów dla tych gramatyk.

Ta część wykładu prezentuje gramatyki równoważne gramatykom kontekstowym, posiadające pewne określone własności. Te własności wykorzystuje się przy uzasadnieniu faktu, że rodzina języków kontekstowych pokrywa się z rodziną języków rozpoznawanych przez automaty liniowo ograniczone. Biorąc pod uwagę to, że zastosowania tej rodziny języków formalnych nie są powszechne oraz to, że dowody dla przedstawionych poniżej twierdzeń są mocno techniczne, postanowiliśmy zrezygnować z rygorystycznej prezentacji tego materiału i pominąć dowody. Zainteresowany Student może je znaleźć w literaturze wskazanej do tego przedmiotu.

Definicja 1.1

Gramatykę G=(VN,VT,v0,P) nazywamy rozszerzającą, jeśli każde prawo jest postaci xy , gdzie x,y(VNVT)* i spełniona jest nierówność xy lub jest to prawo v01 i wtedy v0 nie występuje po prawej stronie w żadnej produkcji z P .

Wprost z definicji wynika, że gramatyka kontekstowa jest gramatyką rozszerzającą. Prawdziwe jest również następujące twierdzenie.

Twierdzenie 1.1

Dla dowolnej gramatyki G=(VN,VT,v0,P) rozszerzającej istnieje równoważna gramatyka kontekstowa.

Wprowadzimy teraz gramatyki z markerem końca.

Definicja 1.2

Gramatyką z markerem końca nazywamy gramatykę G=(VN{},VT,v0,P) taką, że VNVT oraz prawa są postaci: uv , uv lub uv , gdzie u,v(VNVT)* i w słowie u występuje co najmniej jeden symbol nieterminalny z VN . Językiem generowanym przez tę gramatykę nazywamy zbiór

L(G)={wVT*: :v0*w}

Gramatyka z markerem końca G jest kontekstowa (typu 1 ), jeśli jej prawa po wymazaniu markera spełniają warunki gramatyki rozszerzającej. Oczywiście dla dowolnej gramatyki kontekstowej istnieje równoważna gramatyka kontekstowa z markerem końca. Prawdziwe jest również następujące twierdzenie:

Twierdzenie 1.2

Dla dowolnej gramatyki kontekstowej z markerem końca istnieje równoważna gramatyka kontekstowa.

Dowód

Niech G=(VN{},VT,v0,P) będzie dowolną gramatyką kontekstową z markerem końca. Zakładamy, bez ograniczania ogólności rozważań, że w zbiorze P nie występuje prawo v01 (po wymazaniu markera ). Dla każdego symbolu x ze zbioru V=VNVT określamy trzy symbole x,x, :x oraz oznaczamy odpowiednio przez V,V,V zbiory tych symboli. Dla u=u1...uk takiego, że k1 i uiV dla i=1,,k wprowadzamy także następujące oznaczenia:

u=u1u2...uk , u=u1...uk1uk oraz u=u1u2...uk1uk gdy k>1 .

Przy takich oznaczeniach definiujemy gramatykę

G1=(VNVVV,VT,v0,P1)

w której zbiór praw P1 składa się ze wszystkich praw uzyskanych zgodnie z poniższymi warunkami:

  1. jeśli uwP , to uw, :#u#w, :u#w#, :#u##w#P1
  2. jeśli #u#wP , to  :u#w#, :#u##w#P1
  3. jeśli u#w#P , to u#w#, :#u##w#P1
  4. #xx, :x#x, :#x#xP1

dla wszystkich xV .

Określona w ten sposób gramatyka G1 jest gramatyką rozszerzającą i równoważną wyjściowej. Dla gramatyki G1 istnieje, zgodnie z poprzednim twierdzeniem, równoważna gramatyka kontekstowa, co kończy dowód twierdzenia.

Prawdziwe jest także następujące twierdzenie (porównaj z 1.1).

Twierdzenie 1.3

Dla dowolnej gramatyki kontekstowej (rozszerzającej) istnieje równoważna gramatyka kontekstowa (rozszerzająca) o tej własności, że każde prawo, w którym występuje symbol terminalny, jest postaci va , gdzie vVN, :aVT .

Mówimy, że gramatyka G jest rzędu n>0 , jeśli dla każdego prawa xy tej gramatyki spełniony jest warunek xn i yn . Kolejne twierdzenie stwierdza możliwość dalszego uproszczenia praw gramatyki rozszerzającej.

Twierdzenie 1.4

Dla każdej gramatyki rozszerzającej istnieje równoważna gramatyka rozszerzająca rzędu 2 .

Na koniec wprowadzimy jeszcze jeden rodzaj gramatyk równoważnych gramatykom kontekstowym. Są to mianowicie gramatyki liniowo ograniczone.

Definicja 1.3

Gramatyka G=(VN,VT,v0,P) jest liniowo ograniczona, jeśli każde prawo jest jednej z następujących postaci:

v0v0v, :v1v2z1z2, :vx

gdzie xVNVT, :v,v1,v2,z1,z2VN oraz v0{x,z1,z2,v} .

Twierdzenie 1.5

Dla dowolnej gramatyki kontekstowej G istnieje gramatyka liniowo ograniczona G1 , która jest równoważna G lub też generuje język L(G){1} .

Dowód

W świetle poprzednich twierdzeń możemy przyjąć, że gramatyka kontekstowa G=(VN,VT,v0,P) ma prawa wyłącznie w następujących postaciach:

  1. v01
  2. vx gdzie vVN, :xVNVT
  3. vv1v2 gdzie v,v1,v2VN
  4. v1v2v3v4 gdzie v1,v2,v3,v4VN

Określamy gramatykę G1=(VN{z0,z1},VT,z0,P1) , gdzie z1,z2 są nowymi symbolami nieterminalnymi, a więc nie należą do VN . Natomiast zbiór praw P1 składa się ze wszystkich praw ze zbioru P postaci 2 i 4 oraz z0z0z1, :z0v0, : praw z1vvz1, :vz1z1v dla vVN i praw v1z1v3v4 dla każdego prawa postaci 4 w gramatyce G . Skonstruowana gramatyka jest liniowo ograniczona i spełnia tezę twierdzenia.

Automat liniowo ograniczony

Określimy teraz systemy, zwane automatami liniowo ograniczonymi, który rozpoznają języki kontekstowe.

Definicja 2.1

Automatem liniowo ograniczonym nazywamy system 𝒜LO=(ΣT,S,P,s0,SF) , w którym ΣT jest skończonym alfabetem, S skończonym zbiorem stanów, SΣT= oraz wyróżniony jest podzbiór ΣIΣT . Zbiór ΣT zwany jest alfabetem taśmy, a ΣI - alfabetem wejściowym. Wyróżnione są także: element #ΣTΣI zwany markerem końca, stan początkowy s0S oraz SFS - zbiór stanów końcowych. Natomiast relacja przejść P(S×ΣT)×(S×ΣT×{1,0,1}) spełnia następujące warunki:

  1. jeśli (s1,#)P(s2,a,k) , to a=#
  2. jeśli (s1,a)P(s2,#,k) , to a=#

Fakt, że (s1,a)P(s2,b,k) , zapisujemy zazwyczaj jako (s1,a)(s2,b,k) . Do opisu działania automatu liniowo ograniczonego wygodnie jest wprowadzić pojęcie konfiguracji (podobnie jak dla automatów ze stosem).

Konfiguracją automatu liniowo ograniczonego jest słowo vsw(ΣTS)* , w którym sS,v,wΣT* . Pomiędzy dwoma konfiguracjami d1,d2 zachodzi relacja bezpośredniego następstwa d1d2 wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie s1,s2S , a,b,cΣT oraz v,wΣT*:

  1. d1=vs1aw , d2=vs2bw oraz (s1,a)P(s2,b,0)
  2. d1=vs1aw , d2=vbs2w oraz (s1,a)P(s2,b,1)
  3. d1=vcs1aw , d2=vs2cbw oraz (s1,a)P(s2,b,1)

Przechodnie domknięcie relacji oznaczać będziemy symbolem * i określać mianem obliczenia wykonanego przez automat liniowo ograniczony.

Język rozpoznawany przez automat liniowo ograniczony 𝒜LO to zbiór słów nad alfabetem ΣI , pod działaniem których automat wykonuje obliczenie prowadzące do stanu końcowego, czyli

L(𝒜LO)={wΣI* :: :s0#w#*vs,vΣT*,sSF}.

Język LΣI* jest rozpoznawany (akceptowany) przez automat liniowo ograniczony, jeśli istnieje automat 𝒜LO taki, że (𝒜LO)=L

<flash>file=Wyklad12_rysunek1.swf|width=200|height=200</flash> <div.thumbcaption>Rysunek 1


Opiszemy teraz możliwe ruchy automatu liniowo ograniczonego. Automat ten może czytać słowo wejściowe w dwóch kierunkach. Jego głowica może poruszać się w lewo lub w prawo. Automat może wymieniać czytaną literę na inną, ale nie rozszerza miejsca zajętego na taśmie przez czytane słowo. Działa niedeterministycznie. Czytając literę a, będąc w stanie s, automat ma kilka możliwości działania. Może mianowicie:

  1. zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 1. Głowica czytająca automatu pozostaje w poprzedniej pozycji,
  2. zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 2. Głowica czytająca automatu przesuwa się w prawo,
  3. zamienić literę na inną literę i/lub zmienić stan na inny - zgodnie z warunkiem 3. Głowica czytająca automatu przesuwa się w lewo.

Związek pomiędzy rodziną języków kontekstowych a wprowadzoną rodziną automatów liniowo ograniczonych ustalają poniższe twierdzenia.

Twierdzenie 2.1

Dla dowolnego języka kontekstowego L istnieje automat liniowo ograniczony 𝒜LO taki, że (𝒜LO)=L .

Dowód

Można założyć, bez ograniczenia ogólności naszych rozważań, że gramatyka G=(VN,VT,v0,P) generująca język L ma prawa wyłącznie następujących postaci:

  1. (G) vx , gdzie vVN,xVNVT,xv0
  2. (G) v0v0v1 , gdzie v1VN,v1v0
  3. (G) v1v2v3v4 , gdzie v1,,v4VN,v3,v4v0
  4. (G) v01 jeśli 1L .

Określamy automat liniowo ograniczony 𝒜LO=(ΣT,S,P,s0,SF) , przyjmując ΣT=VNVT{#,} , S={s0,s1,s2,s3,s4}{sv1:v1v2v3v4P} , ΣI=VNVT , SF={s3} , s0 - stan początkowy. Relacja przejść automatu 𝒜LO zdefiniowana jest poniżej:

  1. (A) (s0,#)(s0,#,1)
  2. (A) (s0,#)(s4,#,1) jeśli 1L
  3. (A) (s0,x)(s0,x,1) , (s0,x)(s0,x,1) dla każdego xVNVT
  4. (A) (s0,x)(s0,v,0) jeśli vxP i xv0
  5. (A) (s0,v3)(sv1,v1,1),(sv1,v4)(s0,v2,0) jeśli v1v2v3v4P
  6. (A) (s0,v0)(s1,v0,1)
  7. (A) (s1,#)(s2,#,1)
  8. (A) (s1,)(s2,,1)
  9. (A) (s2,v0)(s3,,1)
  10. (A) (s3,v1)(s0,v0,0) , gdy v0v0v1P
  11. (A) (s3,#)s3,#,1),(s4,#)(s3,#,1)

Określony automat 𝒜LO rozpoznaje tylko te słowa, które są generowane przez gramatykę G , symulując wstecz każde wyprowadzenie gramatyki G .

Prawdziwe jest również następujące twierdzenie.

Twierdzenie 2.2

Dla dowolnego języka L rozpoznawanego przez automat liniowo ograniczony 𝒜LO istnieje gramatyka kontekstowa G taka, że L(G)=L .

W dowodzie konstruuje się odpowiednią gramatykę.Zasada tej konstrukcji jest następująca. Z symbolu startowego gramatyka generuje dowolne słowa, ustawiając zawsze na prawym końcu symbol nieterminalny związany z przejściem automatu do stanu końcowego. Następnie korzysta się z możliwości zamiany takiego symbolu nieterminalnego na inne. W ten sposób gramatyka symuluje wstecz działanie automatu, wprowadzając symbole nieterminalne odpowiadające stanom automatu. Dojście do stanu początkowego automatu w tej symulacji jest równoznaczne z usunięciem ostatniego symbolu nieterminalnego i wygenerowaniem słowa dokładnie tego samego, które rozpoznaje automat.

Udowownimy teraz zamkniętość rodziny języków kontekstowych ze względu na iloczyn mnogościowy.

Twierdzenie 2.3

Dla dowolnych języków kontekstowych L1,L2A* iloczyn mnogościowy tych języków L1L2 jest językiem kontekstowym.

Dowód

(szkic) Załóżmy, że języki L1,L2 są rozpoznawane przez automaty liniowo ograniczone, 𝒜LO1 i 𝒜LO2 . Opiszemy konstrukcję automatu liniowo ograniczonego 𝒜LO , który rozpoznawać będzie wyłącznie słowa akceptowane równocześnie przez oba automaty. Działanie tego automatu jest następujące. Każde słowo będzie czytane trzy razy. Przy pierwszym czytaniu automat 𝒜LO dubluje litery, to znaczy w miejsce litery a wprowadza parę (a,a) . Po zakończeniu tej procedury automat wraca do skrajnej lewej pozycji i rozpoczyna symulację automatu 𝒜LO1 . Jeśli ta symulacja doprowadzi do zaakceptowania czytanego słowa przez automat 𝒜LO1 , to automat 𝒜LO rozpoczyna obliczenie od początku, symulując teraz pracę automatu 𝒜LO2 . Jeśli i ta symulacja zakończy się zaakceptowaniem czytanego słowa, to automat przechodzi do ustalonego stanu końcowego, a to oznacza akceptację tego słowa. Działając w opisany sposób, automat 𝒜LO rozpoznaje język L1L2 , a to w świetle udowodnionego powyżej twierdzenia oznacza, że przecięcie języków kontekstowych L1L2 jest językiem kontekstowym.

Ponieważ dalsze własności domkniętości rodziny języków kontekstowych pokrywają się z własnościami języków typu (0), więc omówimy te własności wspólnie, co będzie mieć miejsce w następnym wykładzie.

Maszyna Turinga

Alan Turing (1912-1954)
Zobacz biografię

Przejdziemy teraz do prezentacji ogólnego modelu maszyny liczącej, który został wprowadzony w 1936 roku przez Alana M. Turinga. Na cześć swego autora został on nazwany (jednotaśmową) maszyną Turinga. Model ten jest podobny w swojej idei do rozważanych wcześniej automatów liniowo ograniczonych, przy czym jednym z podstawowych założeń (i różnic względem automatów) jest nieskończony dostęp do pamięci. Maszyna Turinga może wydawać się na początku pojęciem bardzo abstrakcyjnym. Jednak, jak później zobaczymy, stanowi ona jedną z podstawowych koncepcji współczesnej informatyki. Pozwala na formalne zdefiniowanie pojęcia algorytmu oraz jego złożoności obliczeniowej. Jako model obliczeń pozwala odpowiedzieć także na bardzo ważne pytanie: czy każdy problem można rozwiązać algorytmicznie?

Jednotaśmowa maszyna Turinga jest podobna w swej idei do automatu liniowo ograniczonego, pominięte jednak zostaje, jak wspomnieliśmy, ograniczenie dostępu do pamięci. Omawiana maszyna jest abstrakcyjnym tworem w skład którego wchodzą:

  • dwustronnie nieskończona taśma zbudowana z komórek zawierających symbole z pewnego zadanego alfabetu,
  • głowica, która może czytać i zapisywać symbole w komórkach taśmy oraz poruszać się w prawo lub lewo o jedną komórkę lub pozostawać na tej samej pozycji podczas jednego kroku czasowego,
  • działający sekwencyjnie mechanizm odpowiedzialny za sterowanie maszyną; mechanizm ten na podstawie symbolu odczytanego z komórki pod głowicą oraz stanu, w którym aktualnie znajduje się maszyna, dokonuje zapisu symbolu w tejże komórce, przechodzi do kolejnego stanu i przesuwa głowicę w prawo, lewo lub też nie zmienia pozycji głowicy.

Podamy teraz formalną definicję maszyny Turinga. Aby zachować analogię do poprzednich wykładów, zdefiniujemy maszynę w języku konfiguracji.

Definicja 3.1

(Jednotaśmowa deterministyczna) maszyna Turinga jest to system 𝐌𝐓=(ΣT,S,f,s0,SF) , w którym ΣT jest skończonym alfabetem, S skończonym zbiorem stanów, SΣT= oraz wyróżniony jest podzbiór ΣIΣT . Zbiór ΣT zwany jest alfabetem taśmy, a ΣI - alfabetem wejściowym. Wyróżnione są także: element #ΣTΣI zwany markerem końca, stan początkowy s0S oraz SFS - zbiór stanów końcowych. Natomiast funkcja przejść jest funkcją częściową f: :(S×ΣT)(S×ΣT×{1,0,1} .

Konfiguracją maszyny Turinga jest słowo vsw(ΣTS)* , w którym sS,v,wΣT* . Pomiędzy dwiema konfiguracjami d1,d2 zachodzi relacja bezpośredniego następstwa d1d2 wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie s1,s2S , a,b,cΣT oraz v,wΣT*:

  1. d1=vs1aw , d2=vs2bw oraz f(s1,a)=(s2,b,0)
  2. d1=vs1aw , d2=vbs2w oraz f(s1,a)=(s2,b,1) i w1
  3. d1=vs1# , d2=vbs2# oraz f(s1,#)=(s2,b,1)
  4. d1=vcs1aw , d2=vs2cbw oraz f(s1,a)=(s2,b,1)
  5. d1=s1#w , d2=s2#bw oraz f(s1,#)=(s2,b,1)

Przechodnie domknięcie relacji oznaczać będziemy symbolem * i określać mianem obliczenia wykonanego przez maszynę Turinga. Konfiguracja d1(ΣTS)* jest końcowa, jeśli stąd, że d1d2 , wynika d2=d1 Mówimy, że maszyna Turinga zatrzymuje się w d1 wtedy i tylko wtedy, gdy d1 jest konfiguracją końcową.

Zauważmy, że wprowadzenie markera końca jest zabiegiem czysto formalnym. Pozwala on z jednej strony na oznaczenie słowa wejściowego, a z drugiej strony wskazuje na elementy taśmy, które były zmieniane (czy to przez wprowadzenie słowa wejściowego, czy też poprzez ruch głowicy).

Definicja 3.2

Język rozpoznawany przez maszynę Turinga MT jest to zbiór

L(𝐌𝐓)={wΣT* :: :s0w*w1sFw2,dla :pewnych :w1,w2ΣT*,sFSF}.

Język LΣI* jest rozpoznawany (akceptowany) przez maszynę Turinga, jeśli istnieje MT taka, że L(𝒯)=L Klasę języków rozpoznawanych przez maszynę Turinga oznaczamy (MT) .

We wprowadzonym przez nas ujęciu formalnym, działanie maszyny Turinga należy wyobrażać sobie następująco. W pierwszym etapie na taśmę zostają zapisane symbole słowa wejściowego (z alfabetu ΣI), a następnie komórki przyległe zostają oznaczone symbolami . Jednocześnie maszyna jest sprowadzana do stanu s0, a głowica zostaje ustawiona nad pierwszym symbolem słowa wejściowego. W tym momencie rozpoczyna się sekwencyjne przetwarzanie zawartości taśmy przez maszynę. Jeśli maszyna "zatrzyma się", tzn. w dwóch kolejnych chwilach czasowych nie wykona ruchu i jednocześnie nie zmieni stanu i symbolu taśmy, sprawdzany jest jej aktualny stan. Jeśli stan był akceptujący (czyli należał do zbioru SF), to maszyna zaakceptowała słowo, w przeciwnym razie - słowo odrzuciła (gdyż nie może już osiągnąć stanu ze zbioru SF). Należy zwrócić uwagę na to, że dla niektórych konfiguracji początkowych maszyna może nigdy się nie zatrzymać, a mimo to słowo zostanie przez nią zaakceptowane. To samo tyczy się odrzucania słów, jednak w tej sytuacji dowód, że słowo nie zostanie zaakceptowane, może być problematyczny. Zaprezentowane podejście ma na celu uproszczenie i tak już dość technicznych dowodów twierdzeń pojawiających się w tym wykładzie. Związki pomiędzy akceptowaniem a zatrzymywaniem maszyny Turinga zostaną skomentowane później (zob. Wniosek 4.1). W pierwszej kolejności przedstawiamy dwa przykłady:

Przykład 3.1

Skonstruujemy maszynę Turinga MT1, która rozpoznaje język postaci L={02n:n0}. Zamierzone działanie maszyny MT1 można opisać następująco:

  1. Przejdź od lewego markera do prawego, zaznaczając symbolem co drugie 0.
  2. Jeśli było tylko jedno 0, to akceptuj.
  3. Jeśli w kroku 1. obszar pomiędzy markerami zawierał nieparzystą ilość 0, to odrzuć.
  4. Powróć do lewego markera.
  5. Powtórz działanie od 1.

Zwróćmy uwagę, że o ile jasne jest, w jaki sposób maszyna ma akceptować słowa wejściowe, odrzucanie tych słów nie zostało zdefiniowane. Aby ominąć ten problem, wprowadzimy jeden dodatkowy stan (nie należący do stanów końcowych), po osiągnięciu którego maszyna się zatrzymuje (tzn. nie wykonuje ruchów i przepisuje na taśmie wciąż ten sam symbol).

Określamy kolejno elementy składowe maszyny MT1:

ΣI={0},ΣT={0,,,},
S={s0,s1,s2,s3,s4,sA,sR},SF={sA}

Pozostaje jeszcze zdefiniować funkcję przejść:

(s0,)(sR,,0)(s1,)(s1,,1)(s0,0)(s1,,1)(s1,0)(s2,,1)(s1,)(sA,,0)(s2,)(s2,,1)(s3,0)(s2,,1)(s2,)(s4,,1)(s3,)(s3,,1)(s2,0)(s3,0,1)(s3,)(sR,,0)(s4,0)(s4,0,1)(s4,)(s4,,1)(s4,)(s2,,1)(sA,)(sA,,0)(sR,)(sR,,0)

W miejsce tabeli wygodniej jest zobrazować funkcję przejść maszyny Turinga na etykietowanym grafie skierowanym. Zostało to zrobione na poniższym rysunku:

Plik:File=ja-lekcja12-w-rys1.mp4
Rysunek 2

Łatwo zauważyć, że wprowadzona funkcja przejścia określa maszynę spełniającą postawione przez nas warunki. Symbol został wprowadzony dla odróżnienia wystąpienia pojedynczego zera od sytuacji, gdy liczba zer jest nieparzysta i większa od 1.

Aby lepiej zrozumieć działanie maszyny MT1, zasymulujemy jej działanie na dwóch słowach wejściowych, przy czym pierwsze z nich będzie należało do języka L, a drugie nie:

s00000s1000s2000s300s20s4s40s40s40s10s10s2s2s4s4s4s4s1s1s1s1sA

Wykazaliśmy więc, że s00000*sA. Zatem 04L(MT1).

Animacja 1

Dla porównania:

s0000s100s200s30sR

Czyli zgodnie z naszym założeniem 03∉L(MT1).

Animacja 2

Przykład 3.2

Przedstawimy maszynę Turinga MT2 akceptującą język

L={ww :: :w{0,1}*},

gdzie w oznacza lustrzane odbicie słowa w. Elementy języka L nazywamy palindromami. Definiujemy alfabet maszyny:

ΣI={0,1},ΣT={0,1,},

oraz zbiory stanów

S={s0,r0,r0,q0,r1,r1,q1,l,sA,sR},SF={sA}

Funkcję przejść maszyny MT2 określa tabela:

(s0,)(sA,,0)(s0,0)(r0,,1)(s0,1)(r1,,1)(r0,)(sR,,0)(r0,0)(r0,0,1)(r0,1)(r0,1,1)(r0,)(q0,,1)(r0,0)(r0,0,1)(r0,1)(r0,1,1)(q0,0)(l,,1)(q0,1)(sR,,1)(r1,)(sR,,0)(r1,0)(r1,0,1)(r1,1)(r1,1,1)(r1,)(q1,,1)(r1,0)(r1,0,1)(r1,1)(r1,1,1)(q1,0)(sR,,0)(q1,1)(l,,1)(l,)(s0,,1)(l,0)(l,0,1)(l,1)(l,1,1)(sR,)(sR,,0)(sA,)(sA,,0)

co dla przejrzystości zobrazowano na Rysunku 3.

Plik:File=ja-lekcja12-w-rys3.mp4
Rysunek 3

Inne możliwe definicje maszyn Turinga

Istnieje kilka możliwych definicji maszyny Turinga, które jak się okazuje są równoważne pod względem możliwości obliczeniowych (tzn. rozpoznają dokładnie tę samą klasę języków). Naszkicujemy kilka wybranych podejść.

Maszyna wielotaśmowa

W tym modelu zakłada się, że głowica ma do dyspozycji nie tylko jedną, ale wiele taśm, na których może zapisywać i odczytywać symbole. Zakłada się przy tym, że słowo wejściowe znajduje się na pierwszej taśmie. Aby symulować maszynę wielotaśmową na jednej taśmie, należy zamienić alfabet taśmy na alfabet (ΣT)k, gdzie k oznacza ilość taśm. W tym momencie zapis na taśmie i-tej jest realizowany przez zmianę odpowiedniej współrzędnej litery z nowego alfabetu (zob. Rys. 4.a). Czyli w opisywanym przypadku funkcja przejść będzie operowała na następujących zbiorach:

f: :(S×ΣTk)(S×ΣTk×{1,0,1})

Taśma jednostronnie nieskończona

Model ten zakłada, że taśma jest ograniczona z jednej ze stron. Różnica w porównaniu z rozważaną przez nas maszyną Turinga polega na tym, że nie jest dozwolone przesuwanie lewego markera (tzn. funkcja przejść nie może zawierać przejść typu punkt 5 definicji 3.1. W tej sytuacji, aby symulować maszynę z taśmą obustronnie nieskończoną na maszynie z taśmą ograniczoną z jednej strony, wystarczy zasymulować taśmę obustronnie nieskończoną poprzez rozszerzenie alfabetu (zob. Rys. 4.b).

Plik:File=ja-lekcja12-w-rys4.mp4
Rysunek 4

Wielogłowicowa maszyna wielotaśmowa

W tym podejściu zakłada się dodatkowo, że każda z taśm posiada swoją głowicę. Inaczej mówiąc, mamy do czynienia z iloczynem kartezjańskim k niezależnych maszyn jednotaśmowych. Akceptowany język jest w tym momencie k-wymiarowy. Oczywiście, słowo postaci (w,1,,1)(ΣT*)k można w naturalny sposób utożsamiać z wΣT. Z drugiej strony maszynę wielogłowicową można symulować na jednotaśmowej w następujący sposób:

  1. Jako zbiór stanów bierzemy Sk.
  2. Słowa startowe w1,,wk zapisujemy jako konfigurację początkową maszyny jednotaśmowej w postaci:
    (s0)k$1˙w1$2˙w2$$k˙wk$
    Symbole $ mają za zadanie wirtualnego rozdzielenia taśm. Symbole i˙ wskazują na położenie i-tej głowicy na taśmie.
  3. W trakcie symulacji przechodzimy pomiędzy markerami i wykonujemy przejścia dla kolejnych głowic.

Widać już, że formalne podanie funkcji przejść jest w omawianym przypadku bardzo techniczne. Musimy zapewnić możliwość poszerzania obszaru zapisu na poszczególnych taśmach, co jest realizowane poprzez dopisanie nowego symbolu i przepisywanie przyległych symboli, aż do markera włącznie. Następnie należy wrócić do poprzedniego miejsca zapisu i symulować działanie kolejnych głowic. Wymaga to wprowadzenia sporej liczby stanów pomocniczych. Nie będziemy zagłębiać się w te techniczne szczegóły. Mamy nadzieję że sama idea konstrukcji jest w tym momencie zrozumiała.

Najbardziej ogólna definicja maszyny tego typu dopuszcza dodatkowo, aby głowice mogły przeglądać pozostałe taśmy, dzięki czemu zapewnia się komunikację między głowicami. Symulacja takiej maszyny na jednej taśmie jest podobna w swej idei do metody przedstawionej wcześniej.

Maszyna niedeterministyczna

Ten typ maszyn ma ogromne znaczenie dla teorii złożoności. Z tego powodu przyglądniemy mu się dokładniej. Różnica pomiędzy niedeterministyczną maszyną Turinga a maszyną deterministyczną polega na tym, że funkcja przejść może pozwalać na kilka różnych przejść na skutek tego samego symbolu czytanego (gdyż funkcja przejść w tym przypadku będzie multi-funkcją).

Definicja 4.1

(Jednotaśmowa) niedeterministyczna maszyna Turinga jest to system 𝐍𝐌𝐓=(ΣT,S,f,s0,SF), w którym ΣT jest skończonym alfabetem, S skończonym zbiorem stanów, SΣT= oraz wyróżniony jest podzbiór ΣIΣT . Podobnie jak poprzednio zbiór ΣT zwany jest alfabetem taśmy, a ΣI - alfabetem wejściowym. Wyróżnione są także: element #ΣTΣI zwany markerem końca, stan początkowy s0S oraz SFS - zbiór stanów końcowych. Natomiast funkcja przejść jest funkcją częściową f: :(S×ΣT)𝒫(S×ΣT×{1,0,1}) gdzie 𝒫(A) oznacza zbiór podzbiorów zbioru A.

Konfiguracją maszyny Turinga jest słowo vsw(ΣTS)* , w którym sS,v,wΣT* , przy czym pomiędzy dwiema konfiguracjami d1,d2 zachodzi relacja bezpośredniego następstwa d1d2 wtedy i tylko wtedy, gdy spełniony jest jeden z niżej wypisanych warunków, gdzie s1,s2S , a,b,cΣT oraz v,wΣT*:

  1. d1=vs1aw , d2=vs2bw oraz f(s1,a)(s2,b,0)
  2. d1=vs1aw , d2=vbs2w oraz f(s1,a)(s2,b,1) i w1
  3. d1=vs1# , d2=vbs2# oraz f(s1,#)(s2,b,1)
  4. d1=vcs1aw , d2=vs2cbw oraz f(s1,a)(s2,b,1)
  5. d1=s1#w , d2=s2#bw oraz f(s1,#)(s2,b,1)

Tak jak poprzednio, przechodnie domknięcie relacji oznaczać będziemy symbolem * i określać mianem obliczenia wykonanego przez maszynę Turinga. Konfiguracja d1(ΣTS)* jest końcowa, jeśli stąd, że d1d2 , wynika d2=d1

Pomimo tego, że postawiona definicja maszyny niedeterministycznej jest bardzo podobna do maszyny deterministycznej, występuje tutaj jedna bardzo istotna różnica. Słowo wejściowe może prowadzić do wielu różnych obliczeń wykonanych, w szczególności jedno z obliczeń może doprowadzać do zatrzymania maszyny, a inne nie.

Przykład maszyny niedeterministycznej podamy później, przy okazji omawiania klas złożoności obliczeniowej.

Definicja 4.2

Język rozpoznawany przez niedeterministyczną maszynę Turinga NMT jest to zbiór

L(𝐍𝐌𝐓)={wΣT* :: :s0w*w1sFw2,dla :pewnych :w1,w2ΣT*,sFSF}.

Język LΣI* jest rozpoznawany (akceptowany) przez niedeterministyczną maszynę Turinga, jeśli istnieje 𝒩𝒯 taka, że L(𝒩𝒯)=L

Podkreślamy fakt, że aby maszyna niedeterministyczna zaakceptowała słowo wejściowe, wystarczy, aby wśród wszystkich możliwych obliczeń znalazło się co najmniej jedno akceptujące.

Wprost z definicji wynika że każda maszyna deterministyczna jest także maszyną niedeterministyczną, co oznacza, że języki rozpoznawane przez maszyny deterministyczne są zawarte w klasie języków rozpoznawanych przez maszyny niedeterministyczne. Przeciwna inkluzja jest gwarantowana przez następujące twierdzenie.

Twierdzenie 4.1

Dla każdej niedeterministycznej maszyny Turinga 𝒩𝒯 istnieje maszyna deterministyczna 𝒯 taka, że

L(𝒩𝒯)=L(𝒯)

Dowód

(Szkic). Aby sprawdzić, czy maszyna niedeterministyczna akceptuje dane słowo wejściowe, należy przejrzeć wszystkie możliwe obliczenia wykonywane, tworzące drzewo obliczeń. Poziomy drzewa tworzone są przez kroki czasowe, wierzchołki stanowią obliczenia wykonane w danym kroku czasowym, a gałęzie zadane są przez relację bezpośredniego następstwa. W celu sprawdzenia, czy maszyna akceptuje dane słowo, przeglądamy drzewo obliczeń poziomami (por. algorytm BFS) i akceptujemy, gdy przeglądana konfiguracja była akceptująca. Tą techniką przeglądamy wszystkie możliwe obliczenia wykonane w 1,2,3, krokach.

Do dokonania symulacji najwygodniej jest użyć maszyny 3-głowicowej z możliwością czytania na wszystkich taśmach. Wprowadzamy te taśmy kolejno do przechowywania słowa wejściowego, symulacji działania maszyny niedeterministycznej i adresowania wyboru przejść ze zbioru przejść danego przez funkcję przejść. Symulacja przebiega w czterech krokach:

  1. Rozpocznij ze słowem wejściowym w na taśmie 1 oraz pustymi taśmami 2 i 3.
  2. Przekopiuj taśmę 1 na taśmę 2.
  3. Użyj taśmy 2 do symulacji w, wykorzystując taśmę 3 do wyboru przejść funkcji przejść f. Jeśli po wykonaniu skończonego zbioru instrukcji według adresowania z taśmy 3 otrzymano konfigurację akceptującą, to akceptuj. W przeciwnym razie, przejdź do następnego punktu.
  4. Zamień ciąg adresowy na następny w kolejności leksykograficznej. Jeśli zapisany ciąg jest ostatnim możliwym ciągiem adresowym o długości N, zapisz na taśmie 3 pierwszy w kolejności leksykograficznej ciąg adresowy o długości N+1 oraz przejdź do 2.

Wniosek 4.1

Dla każdej maszyny Turinga 𝒯 istnieje maszyna Turinga 𝒯 taka, że

L(𝒯)=L(𝒯)

oraz dla każdego wL(𝒯) maszyna 𝒯 zatrzymuje się na w.

Dowód

Wystarczy przerobić maszynę 𝒯 na maszynę niedeterministyczną 𝒩𝒯 posiadającą dodatkowy stan sA oraz taką, że dla każdego stanu ze zbioru SF pod wpływem dowolnego symbolu z ΣT maszyna 𝒩𝒯 posiada dodatkowe przejście do sA, w którym już pozostaje i nic nie zmienia. Stąd widać, że L(𝒯)=L(𝒩𝒯).

Twierdzenie 4.1 pozwala na otrzymanie maszyny 𝒯 akceptującej ten sam język co 𝒩𝒯 z dodatkowym założeniem, że gdy 𝒩𝒯 osiąga stan sA, maszyna 𝒯 się zatrzymuje. Zauważmy, że stan sA można osiągnąć tylko dla słów akceptowanych prze 𝒩𝒯, a z drugiej strony, każde słowo akceptowane przez 𝒩𝒯 prowadzi do co najmniej jednego obliczenia kończącego się w sA.