Języki, automaty i obliczenia/Wykład 3: Automat skończenie stanowy
- Wprowadzenie
- W rozdziale tym zdefiniujemy automat -- drugi, obok gramatyki, model
obliczeń. Określimy język rozpoznawany przez automat i podamy warunki równoważne na to, by język był rozpoznawany.
- Słowa kluczowe
- automat skończenie stanowy, język rozpoznawany, prawa kongruencja
automatowa, homomorfizm automatów, monoid przejść automatu.
AUTOMATY
Wprowadzimy teraz pojęcie automatu. Jak już wspomnieliśmy w wykładzie drugim automat to drugi, obok gramatyki, model obliczeń będący przedmiotem badań teorii języków i automatów. Model realizujący warunek efektywności analitycznej, czyli taki na podstawie którego możliwe jest sformułowanie algorytmu rozstrzygającego w skończonej liczbie kroków, czy dowolne słowo należy, czy też nie należy do języka rozpoznawanego przez ten automat. Lub inaczej możemy powiedzieć, że taki automat daje algorytm efektywnie rozstrzygający, czy dowolne obliczenie sformułowane nad alfabetem automatu jest poprawne.
Wprowadzony w tym wykładzie automat, zwany automatem skończenie stanowym, jest jednym z najprostszych modeli obliczeń. Jest to model z bardzo istotnie ograniczoną pamięcią. Działanie takiego automatu sprowadza się do zmiany stanu pod wpływem określonego zewnętrznego sygnału czy impulsu.
Pomimo tych ograniczeń urządzenia techniczne oparte o modele takich automatów spotkać możemy dość często. Jako przykład służyć mogą automatyczne drzwi, automaty sprzedające napoje, winda, czy też urządzenia sterujące taśmą produkcyjną.
Przykład
Drzwi automatycznie otwierane są sterowane automatem, którego działanie opisać można, przyjmując następujące oznaczenia. Fakt, że osoba chce wejść do pomieszczenia zamykanego przez takie drzwi, identyfikowany przez odpowiedni czujnik, opiszemy symbolem . Zamiar wyjścia symbolem . Symbol będzie związany z równoczesnym zamiarem wejścia jakiejś osoby i wyjścia innej. Wreszcie symbol oznaczał będzie brak osób, które chcą wejść lub wyjść. Zatem zbiór , to alfabet nad którym określimy automat o stanach: Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle OTWARTE, ZAMKNIĘTE} poniższym grafem.
RYSUNEK ja-lekcja3-w-rys6
ANIMACJA ja-lekcja-w-rys7 działania drzwi
Automaty reagują więc na określone sygnały zewnętrzne reprezentowane przez litery alfabetu , zmieniając swój stan. Jeśli ustalimy stan początkowy automatu oraz dopuszczalne stany końcowe, to automat będzie testował dowolne słowo z , startując ze stanu początkowego. Jeśli rezultatem finalnym działania automatu (obliczenia) będzie stan końcowy, to słowo będzie rozpoznawane przez automat, a obliczenie określone takim słowem poprawne.
Podamy teraz definicję automatu. Niech oznacza dowolny alfabet. Od tego momentu wykładu zakładamy, że alfabet jest zbiorem skończonym.
Definicja
Automatem nad alfabetem nazywamy system , w którym
- jest dowolnym skończonym zbiorem zwanym zbiorem stanów,
- jest funkcją przejść.
Automat będąc w stanie po przeczytaniu litery zmienia stan na zgodnie z funkcją przejścia .
Funkcję przejść rozszerzamy na cały wolny monoid do
postaci
przyjmując:
dla każdego oraz
dla każdego i dla dowolnego
Działanie automatu pokazane jest na rysunku.
rys3.1
Zdefiniowany powyżej automat nazywamy skończonym lub
skończenie stanowym ze względu na założenie skończoności zbioru stanów .
Przykład
Niech będzie alfabetem, a automatem takim, że
, a funkcja przejść zadana jest przy pomocy tabelki
{
{Podamy teraz bardzo interesujący przykład zastosowania automatów skończonych. Przedstawimy mianowicie wykorzystanie tak zwanych automatów synchronizujących w przemyśle. Automat synchronizujący nad alfabetem to automat o następującej własności: istnieje stan oraz słowo takie, że dla każdego stanu tego automatu . Istnieje więc pewne uniwersalne słowo , pod wpływem którego wszystkie stany przechodzą w jeden, ustalony stan automatu . Mówimy, że następuje wtedy synchronizacja wszystkich stanów automatu.
Poniżej prezentujemy przykład zaczerpnięty z pracy Ananicheva i Volkova (D. S. Ananichev, M. V. Volkov, Synchronizing Monotonic Automata, Lecture Notes in Computer Science, 2710(2003), 111--121.), ukazujący ideę użycia automatów synchronizujących w tej dziedzinie.
Przykład
RYSUNEK pojedynczego detalu - ja-lekcja3-w-rys-s1
Załóżmy, że pewna fabryka produkuje detale w kształcie kwadratu z "wypustką" na jednym boku (patrz rys. Uzupelnic ja-lekcja3-w-rys-s1|). Po wyprodukowaniu detale należy umieścić w opakowaniach w ten sposób, by wszystkie były w tej samej orientacji -- mianowicie "wypustką" w lewo.
Załóżmy ponadto dla uproszczenia, że detale mogą przyjmować jedną z czterech orientacji (rys. Uzupelnic ja-lekcja3-w-rys-s2|): "wypustką" w górę, w dół, w lewo lub w prawo.
RYSUNEK ja-lekcja3-w-rys-s2
Należy zatem skonstruować takie urządzenie (orienter), które będzie ustawiało wszystkie detale w żądanej orientacji. Oczywiście istnieje wiele metod rozwiązania tego problemu, ale z praktycznego punktu widzenia potrzebne jest rozwiązanie najprostsze i najtańsze. Jednym z takich sposobów jest umieszczanie detali na pasie transmisyjnym z zamontowaną wzdłuż niego pewną ilością przeszkód dwojakiego rodzaju: niskich (low) oraz wysokich (HIGH). Wysoka przeszkoda ma tę własność, że każdy detal, który ją napotka, zostanie obrócony o 90 stopni w prawo (zakładamy, że elementy jadą od lewej do prawej strony). Przeszkoda niska obróci o 90 stopni w prawo tylko te detale, które są ułożone "wypustką" w dół. Na rys. Uzupelnic ja-lekcja3-w-rys-s3| przedstawione zostały przejścia pomiędzy orientacjami detali w zależności od napotkania odpowiedniej przeszkody.
RYSUNEK ja-lekcja3-w-rys-s3
Można zauważyć, że automat z rysunku Uzupelnic ja-lekcja3-w-rys-s3| jest automatem synchronizującym. Słowem, które go synchronizuje, jest następująca sekwencja przeszkód:
low-HIGH-HIGH-HIGH-low-HIGH-HIGH-HIGH-low.
Niezależnie od tego, w jakiej orientacji początkowej znajduje się detal, po przejściu przez powyższą sekwencję przeszkód zawsze będzie ułożony "wypustką" w lewo. Sytuację przedstawia poniższa animacja:
ANIMACJA ja-lekcja3-w-anim-s4
Rozszerzymy teraz wprowadzone pojęcie automatu w ten sposób, by uzyskać możliwość efektywnego rozstrzygania, czy dowolne słowo utworzone nad alfabetem reprezentuje poprawne obliczenie, czyli spełnia kryteria określone przez rozszerzony automat.
Definicja
Język jest rozpoznawany (akceptowany) wtedy i tylko wtedy, gdy istnieje automat skończony stan oraz zbiór takie, że
Stan nazywamy stanem początkowym, a zbiorem stanów końcowych automatu .
Rozszerzony w powyższy sposób automat, poprzez dodanie stanu początkowgo i zbioru stanów końcowych, w dalszym ciągu nazywamy automatem i oznaczamy jako piątkę lub czwórkę , jeśli wiadomo, nad jakim alfabetem rozważamy działanie automatu.
Fakt, że język jest rozpoznawany przez automat zapisujemy jako
Rodzinę wszystkich języków rozpoznawalnych nad alfabetem oznaczamy przez .
Podobnie jak w przypadku gramatyk nie ma jednoznacznej odpowiedniości pomiędzy językami rozpoznawalnymi a automatami. Wprowadza się więc relację, która identyfikuje automaty rozpoznające ten sam język.
Definicja
Automaty i są równoważne, jeśli rozpoznają ten sam język, czyli
W dalszych rozważaniach języków rozpoznawanych ograniczymy się do automatów , które spełniają warunek Nie zawęża to naszych rozważań. Jeśli bowiem język jest rozpoznawany przez pewien automat , to jest również rozpoznawany przez automat
który spełnia powyższy warunek. Zauważmy, że przyjmując to założenie, upraszczamy strukturę automatu. Z punktu widzenia grafu automatu można powiedzieć, że nie występują w nim wierzchołki (stany) nieosiagalne z . Poniżej przedstawiamy algorytm usuwający z automatu stany nieosiągalne ze stanu początkowego.
Algorytm
{UsuńStanyNieosiągalne - usuwa z automatu
stany nieosiągalne}
[1] Wejście: -- automat.
Wyjście: -- automat równoważny automatowi bez stanów nieosiągalnych.
for each
zaznaczone;
endfor
zaznaczone;
Oznacz;
Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle S' \leftarrow \{s \in S:\ } zaznaczone ;
;
flagfalse jeśli nie dodamy stanu to na końcu pętli nadal flag=false
;
for each
for each
if ; była nieokreślona flag true;
endif
endfor endfor
if flag=true
; endif
return ;
Algorytm
[1]
procedure Oznacz
for each
{flagfalse}
for each if {flagtrue} endif endfor if flag=true and zaznaczone zaznaczone;
Oznacz; endif
endfor
end procedure
Powyższy algorytm, dla ustalonego alfabetu , posiada złożoność , czyli liniową względem liczby stanów.
Przykład
Jeśli w przykładzie Uzupelnic ex.3.1.1| przyjmiemy stan jako stan początkowy, jako zbiór stanów końcowych, to automat rozpoznaje język
złożony ze słów, kończących się na .
Słowo nie jest akceptowane.
rys3.3
Słowo jest akceptowane.
rys3.4
Każdy automat wyznacza w wolnym monoidzie
prawą kongruencję, nazywaną prawą kongruencją automatową, określoną w następujący
sposób:
Dla automatu skończonego ( o skończonym zbiorze stanów), a takie rozważamy, relacja ma skończony indeks, czyli skończoną liczbę klas równoważności.
Przykład
Automat z przykładu Uzupelnic ex.3.1.1| ze stanem jako początkowym wyznacza relację równoważności o trzech klasach:
Na odwrót, każda prawa kongruencja wyznacza automat, zwany ilorazowym, w następujący sposób:
jest automatem ze stanem początkowym . jest automatem skończonym
wtedy i tylko wtedy, gdy relacja ma skończony indeks.
Z definicji prawej kongruencji wynika, że funkcja przejść jest określona poprawnie.
Definicja
Niech i będą dowolnymi automatami. Odwzorowanie nazywamy homomorfizmem automatów wtedy i tylko
wtedy, jeśliHomomorfizm automatów oznaczamy .
Twierdzenie
Prawdziwe są następujące fakty:
- Dla dowolnej prawej kongruencji
- Dowolny automat jest izomorficzny z automatem ,
- Dla dowolnych automatów
i prawdziwa jest równoważność
{ Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \sim _{\mathcal{A}_1}\: \subseteq \: \sim _{\mathcal{A}_2}\: \: \Longleftrightarrow \: } istnieje epimorfizm taki, że . }
Dowód
- Identyczność relacji wynika wprost z definicji automatu ilorazowego oraz prawej kongruencji .
- Rozważmy automat i odwzorowanie
gdzie
Istnienie słowa wynika z faktu, że jest stanem początkowym, natomiast z definicji relacji wynika, że odwzorowanie jest poprawnie określone.
Odwzorowanie ma być homomorfizmem, czyli dla każdego stanu i dowolnego
słowa spełniać warunek
Warunek ten wynika z następujących równości
gdzie .
Z prostych obserwacji wynika, że jest suriekcją i iniekcją.
- Dowód implikacji ""
Załóżmy, że Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \: \sim _{\mathcal{A}_1}\: \subseteq \: \sim _{\mathcal{A}_2 } } . Niech
będzie odwzorowaniem takim, że
Stąd, że jest stanem początkowym automatu
wynika, że istnieje słowo potrzebne do określenia epimorfizmu .
Z założenia Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \: \sim _{\mathcal{A}_1}\: \subseteq \: \sim _{\mathcal{A}_2} }
wynika, że jest poprawnie zdefiniowaną funkcją.
Uzasadnienie faktu, że jest
homomorfizmem, jest analogiczne jak w punkcie Uzupelnic tb| dla .
jest suriekcją, gdyż
jest stanem początkowym automatu .
ponieważ .
Dowód implikacji ""
Niech będzie epimorfizmem
takim, że .
Wówczas prawdziwy jest następujący ciąg wnioskowań.
To oznacza, że .

Symbolem oznaczamy rodzinę wszystkich funkcji określonych na zbiorze i przyjmujących wartości w . Łatwo zauważyć, iż rodzina ta wraz ze składaniem odwzorowań jest monoidem .
Definicja
Niech będzie dowolnym automatem. Reprezentacją automatu nazywamy funkcję , określoną dla dowolnych i równością
Reprezentacja automatu jest homomorfizmem monoidu w monoid , bowiem dla dowolnych spełnione są warunki
Definicja
Niech będzie dowolnym automatem. Monoidem przejść automatu nazywamy monoid
Następujące wnioski są konsekwencjami rozważań przeprowadzonych powyżej.
Wniosek
{-5truemm}
- Monoid przejść automatu jest podmonoidem monoidu i zbiór
jest zbiorem
generatorów tego monoidu.Wynika to z faktu, że jest epimorfizmem i z twierdzenia Uzupelnic tw:z|.
- Monoid przejść automatu skończonego jest skończony.
- Monoid przejść automatu jest izomorficzny z monoidem ilorazowym .
Jest to wniosek z twierdzenia o rozkładzie epimorfizmu, które w tym przypadku ilustruje poniższy diagram.
rys3.5
Przykład
Określimy monoid przejść dla automatu z przykładu Uzupelnic ex.3.1.1|. Wypisujemy kolejne funkcje dla . Zauważmy, że ze względu na występujące w tabelce powtórzenia, będące wynikiem równości, np. nie ma potrzeby określać funkcji dla . Podobna obserwacja ma miejsce w innych przypadkach, co sprawia, że tabelka zawiera skończoną liczbę różnych funkcji.
{0.3cm} {
{Poniżej zamieszczamy algorytm obliczający monoid przejść dla automatu skończenie stanowego.
Algorytm
{WyznaczMonoidPrzejść - wyznacza monoid przejść dla
automatu}
[1] Wejście: - automat
Wyjście: - monoid przejść dla ; jest listą
;
for each
insert; gdzie dla każdego
endfor
while ;
first ;
;
for each
for each ; endfor
if
insert;
endif
endfor
endwhile
return ;
Procedura insert wkłada na koniec listy element . Funkcja first wyjmuje pierwszy element znajdujący się na liście i zwraca go. Algorytm działa w następujący sposób: najpierw na listę wkładane są elementy monoidu przejść dla każdej litery . Te funkcje można obliczyć bezpośrednio z tabelki reprezentującej funkcję przejścia automatu . Następnie z listy po kolei ściągane są poszczególne funkcje . Każda z nich dodawana jest do zbioru , a następnie algorytm sprawdza dla każdej litery , czy funkcja istnieje już na liście lub w zbiorze . Jeśli nie, to funkcja ta dodawana jest do listy. Procedura powyższa trwa do czasu, gdy lista zostanie pusta. Wtedy wszystkie elementy monoidu przejść znajdą się w zbiorze .
Przeanalizujmy działanie algorytmu dla automatu z przykładu Uzupelnic ex.3.1.1|.
Na początku na listę włożone zostaną funkcje , oraz . Z listy zdejmujemy funkcję i dodajemy ją do zbioru . Ponieważ , a funkcje oraz znajdują się już na liście, zatem nie dodajemy ich do . Bierzemy kolejny element listy, , dodajemy go do i obliczamy funkcje oraz . Ponieważ nie jest tożsama z żadną funkcją ze zbioru , dodajemy ją do listy. Funkcja również nie jest równa żadnej z funkcji należących do zbioru , zatem wstawiamy ją na koniec listy. Na liście mamy zatem teraz następujące elementy: , oraz . Zdejmujemy z listy funkcję , dodajemy ją do i obliczamy oraz . Pierwsza z tych funkcji jest nowa, tzn. nie jest tożsama z żadną funkcją ze zbioru więc dodajemy ją na koniec listy. Druga z nich równa jest funkcji , więc nie dodajemy jej do listy. W tym momencie zbiór zawiera następujące elementy: , , , natomiast lista zawiera elementy , , . Zdejmujemy z funkcję , dodajemy ja do i ponieważ i , nic nie dodajemy do . Zdejmujemy teraz z listy funkcję , dodajemy ją do i ponieważ nie należy do dodajemy ją do listy. , więc tej funkcji nie dodajemy do . Z ściągamy , dodajemy ją do i widzimy, że oraz , więc nic nie dodajemy do . Na liście pozostała funkcja . Ściągamy ją z listy i dodajemy do . Widzimy, że i , zatem nic nie dodajemy do listy . Lista jest w tym momencie pusta i działanie algorytmu zakończyło się. Ostatecznie mamy
Co zgadza się z wynikiem otrzymanym w przykładzie.
Twierdzenie poniższe zbiera dotychczas uzyskane charakteryzacje języków rozpoznawanych.
Twierdzenie
Niech będzie dowolnym językiem. Równoważne są następujące warunki:
- Język jest rozpoznawalny,
- Język jest sumą wybranych klas równoważności pewnej prawej
- Język jest sumą wybranych klas równoważności pewnej
- Istnieje skończony monoid i istnieje epimorfizm taki,
Dowód
Dowód równoważności czterech powyższych warunków przeprowadzimy zgodnie z następującym schematem:
gdzie jest skończonym monoidem.
Określamy relację na , przyjmując dla dowolnych
Tak określona relacja jest kongruencją. Natomiast jej skończony indeks wynika z faktu, że monoid jest skończony. Pokażemy teraz, że:
Inkluzja jest oczywista.
Inkluzja w przeciwną stronę () oznacza, że każda klasa równoważności relacji
albo cała zawiera się w języku , albo cała zawiera się w uzupełnieniu języka .
Załóżmy, że dla pewnego
Oznacza to, że
Implikuje to ostatecznie, że .
Każda kongruencja jest prawą kongruencją.
Niech będzie prawą kongruencją o skończonym indeksie na taką, że
Automat dla którego
akceptuje język .
Niech język , gdzie .
Określamy odwzorowanie
przyjmując dla każdego
Jest to odwzorowanie kanoniczne monoidu na monoid ilorazowy, a więc jest to epimorfizm.
jest monoidem skończonym, ponieważ jest zbiorem skończonym.
Dla dowodu równości wystarczy udowodnić
inkluzję . (Inkluzja
wynika z definicji przeciwobrazu.)
Niech Oznacz to, że
