Test GR: Różnice pomiędzy wersjami
Linia 168: | Linia 168: | ||
Nowo obliczona relacja <math>\overline \rho_i</math> albo podzieli jedną lub kilka klas abstrakcji relacji <math>\overline \rho_{i-1}</math>, albo będzie identyczna z relacją <math>\overline \rho_{i-1}</math>. Jeśli zajdzie ta druga sytuacja, to znaczy, że dla każdego <math>j>i</math> w oczywisty sposób spełniona jest równość <math>\overline \rho_j=\overline \rho_i</math>, czyli ciąg relacji ustabilizuje się. W tym momencie algorytm kończy swoje działanie i klasy abstrakcji relacji <math>\overline \rho_i</math> będą reprezentować stany automatu minimalnego. | Nowo obliczona relacja <math>\overline \rho_i</math> albo podzieli jedną lub kilka klas abstrakcji relacji <math>\overline \rho_{i-1}</math>, albo będzie identyczna z relacją <math>\overline \rho_{i-1}</math>. Jeśli zajdzie ta druga sytuacja, to znaczy, że dla każdego <math>j>i</math> w oczywisty sposób spełniona jest równość <math>\overline \rho_j=\overline \rho_i</math>, czyli ciąg relacji ustabilizuje się. W tym momencie algorytm kończy swoje działanie i klasy abstrakcji relacji <math>\overline \rho_i</math> będą reprezentować stany automatu minimalnego. | ||
{{algorytm| | {{algorytm|Minimalizuj2 - algorytm minimalizacji automatu wykorzystujący stabilizujący się ciąg relacji|algorytm minimalizacji automatu wykorzystujący stabilizujący się ciąg relacji| | ||
1 Wejście: <math>\mathcal{A}=(S, A, f, s_0, T)</math> - automat taki, że <math>L=L(\mathcal{A})</math> | 1 Wejście: <math>\mathcal {A} = (S, A, f, s_0, T)</math> - automat taki, że <math>L = L(\mathcal{A})</math> | ||
2 Wyjście: <math> | 2 Wyjście: automat minimalny <math>\mathcal{A}' = (S',A',f', s_0', | ||
3 <math> | T')</math> dla <math>\mathcal{A}</math> | ||
4 | 3 <math>\overline \rho_1 \leftarrow \approx_ \mathcal{A}</math>; | ||
5 | 4 <math>i \leftarrow 1</math>; | ||
5 '''repeat''' | |||
6 '''włóż'''<math>(\mathcal{L}, (T, a))</math>; | 6 '''włóż'''<math>(\mathcal{L}, (T, a))</math>; | ||
7 '''end''' '''for''' | 7 '''end''' '''for''' | ||
Linia 198: | Linia 199: | ||
27 '''else''' | 27 '''else''' | ||
28 '''włóż'''<math>(\mathcal{L},(X_2,b))</math>; | 28 '''włóż'''<math>(\mathcal{L},(X_2,b))</math>; | ||
29 | 29 '''return''' | ||
}} | }} | ||
Wersja z 13:47, 16 sie 2006
W tym wykładzie podamy algorytmy konstrukcji automatu minimalnego
i twierdzenia dowodzące ich poprawności.
Algorytmy konstrukcji automatu minimalnego
Dla języka rozpoznawanego konstrukcję automatu minimalnego można rozpocząć, startując z opisu języka danego na przykład przez wyrażenie regularne lub też jakiegoś automatu rozpoznającego ten język. W niniejszym wykładzie przedstawimy algorytmy konstrukcji automatu minimalnego obejmujące oba wspomniane punkty startu. Jako pierwszy, nawiązując do rezulatów przedstawionych w poprzednim wykładzie, prezentujemy algorytm, dla którego punktem wyjścia jest język . Prezentację poprzedzimy wprowadzeniem pewnej operacji na słowach zwanej pochodną J.Brzozowskiego.
Definicja 1.1.
Niech będzie dowolnym językiem, a dowolnym słowem. Pochodną Brzozowskiego (residuum) z języka względem słowa nazywamy język
Podczas obliczeń pochodnych Brzozowskiego (residuów języka ) można wykorzystać poniższe równości.
Niech będą dowolnymi językami, dowolną literą, a dowolnymi słowami. Prawdziwe są następujące równości:
Przykład 1.1.
Obliczmy wszystkie pochodne dla języka . Okazuje się, że są tylko cztery różne pochodne liczone względem , , i słowa pustego . Mianowicie:
,
,
,
.
Dla wszystkich innych słów otrzymujemy uzyskane powyżej języki, co wynika z własności pochodnych (patrz wyżej wypisane równości) i z następujacych obliczeń:
,
,
.
Zauważmy również, nawiązując raz jeszcze do rezulatów przedstawionych w poprzednim wykładzie, że prawdziwa jest następująca równoważność wiążąca wprowadzone pojęcie pochodnej Brzozowskiego z prawą kongruencją syntaktyczną:
Rozpisując z definicji lewą stronę tej równoważności, otrzymujemy, iż dla dowolnego słowa słowo wtedy i tylko wtedy, gdy . A to równoważnie oznacza (znów z definicji), że
Z uzasadnionej równoważności oraz twierdzenia 3.4 o prawej kongruencji syntaktycznej z poprzedniego wykładu wnioskujemy równoważność rozpoznawalności języka i skończonej ilości różnych pochodnych Brzozowskiego tego języka.
Pierwszy z przedstawianych algorytmów będzie konstruował automat minimalny, wyznaczając prawą kongruencję automatową poprzez zastosowanie metody pochodnych Brzozowskiego. Metoda ta umożliwia przeprowadzanie odpowiednich obliczeń bezpośrednio na wyrażeniach regularnych. Ogólny opis algorytmu jest następujący. Stany konstruowanego automatu minimalnego etykietowane są zbiorami odpowiadającymi pewnym językom. Mając dany język , ustanawiamy stan początkowy automatu jako , wpisujemy go na listę i obliczamy dla każdej litery . Jeśli wśród obliczonych wartości znajduje się język niewystępujący na liście, dodajemy go do listy. Obliczenia pochodnych Brzozowskiego wykonujemy, dopóki będziemy uzyskiwać nowe języki (nowe stany). Funkcja przejść konstruowanego automatu minimalnego zdefiniowana jest następująco:
gdzie
jest pewnym językiem z listy
.
Obliczone języki określają stany automatu minimalnego.
Obliczone języki określające stany automatu minimalnego to elementy monoidu syntaktycznego języka .
Automatem minimalnym dla automatu będzie zatem automat
gdzie:
- ,
- ,
- ,
- .
Jeśli zdefiniujmy odwzorowanie , kładąc:
to można dowieść, że jest dobrze określone, jest epimorfizmem oraz - porównaj twierdzenie 3.1 z wykładu 4. Prawdą jest też, iż wtedy i tylko wtedy, gdy oraz że następujący diagram komutuje:
Formalny zapis algorytmu przedstawiony jest poniżej.
Algorytm Minimalizuj1 - algorytm minimalizacji wykorzystujący pochodne Brzozowskiego
1 Wejście: - automat taki, że 2 Wyjście: automat minimalny dla ; 3 4 włóż; 5 while do 6 zdejmij(); 7 for each do 8 ; 9 if then 10 ; 11 włóż; 12 end if 13 end for 14 end while 15 for each do 16 for each do 17 ; 18 end for 19 end for 20 ; 21 ; 22 return ;
Funkcja zdejmij, występująca w linii 6., zdejmuje z kolejki pierwszy element i zwraca go jako swoją wartość. Procedura włóż, występująca w liniach 4. oraz 11., wstawia na koniec kolejki element .
Przykład 1.2.
Dla języka z przykładu 1.1 w wyniku działania powyższego algorytmu
otrzymamy czterostanowy automat
gdzie
,
a funkcja
przejść zadana jest grafem:
RYSUNEK ja-lekcja5-w-rys1
Prezentowane poniżej twierdzenie uzasadnia kolejny algorytm konstrukcji automatu minimalnego. Tym razem punktem wyjścia jest dowolny automat rozpoznający język .
Algorytm oblicza również monoid syntaktyczny języka .
Analogicznie do konstrukcji relacji , przedstawionej w wykładzie 4, możemy określić ciąg odpowiednich relacji na zbiorze stanów dowolnego automatu rozpoznającego język . Relacje te służą do efektywnego określenia automatu minimalnego, równoważnego zadanemu.
Twierdzenie 1.1.
Niech będzie dowolnym automatem i niech . Przez oznaczmy relację równoważności zawierającą dwie klasy równoważności i . Przez dla oznaczmy zstępujący ciąg relacji określony następująco:
, a dla przyjmijmy
.
Wtedy jest największą prawą kongruencją automatową zawartą w relacji i automat minimalny ma postać
Dowód tego twierdzenia przebiega analogicznie do dowodu twierdzenia 3.3 z wykładu 4.
Algorytm działajacy w oparciu o powyższe twierdzenie na podstawie zadanego automatu , konstruuje efektywnie automat minimalny dla , obliczając ciąg relacji . Proces konstrukcji przebiega w sposób iteracyjny. Zaczynamy od zdefiniowania relacji Parser nie mógł rozpoznać (nieznana funkcja „\mathacal”): {\displaystyle \approx _\mathacal {A}} , która posiada tylko dwie klasy abstrakcji: do pierwszej z nich należą wszystkie stany końcowe, a do drugiej - wszystkie pozostałe stany. Tak więc
Definiujemy pierwszą z relacji , czyli relację jako równą , a następnie, dla każdej obliczonej już relacji , obliczamy relację w następujący sposób:
Nowo obliczona relacja albo podzieli jedną lub kilka klas abstrakcji relacji , albo będzie identyczna z relacją . Jeśli zajdzie ta druga sytuacja, to znaczy, że dla każdego w oczywisty sposób spełniona jest równość , czyli ciąg relacji ustabilizuje się. W tym momencie algorytm kończy swoje działanie i klasy abstrakcji relacji będą reprezentować stany automatu minimalnego.
Algorytm Minimalizuj2 - algorytm minimalizacji automatu wykorzystujący stabilizujący się ciąg relacji
1 Wejście: - automat taki, że 2 Wyjście: automat minimalny dla 3 ; 4 ; 5 repeat 6 włóż; 7 end for 8 else 9 for each do 10 włóż ; 11 end for 12 end if 13 while do 14 zdejmij ; 15 Parser nie mógł rozpoznać (nieznana funkcja „\slash”): {\displaystyle \mathcal{X} \leftarrow \{X \in P:\ |X \slash \rho^a_Y| = 2\}} ; 16 for each do 17 for each do 18 Parser nie mógł rozpoznać (nieznana funkcja „\slash”): {\displaystyle \{X_1, X_2\} \leftarrow X \slash \rho^a_Y} ; Parser nie mógł rozpoznać (nieznana funkcja „\slash”): {\displaystyle X \slash \rho^a_Y} zawiera dwie klasy abstrakcji 19 ; 20 if then 21 ; zdejmij z dokładnie parę 22 włóż; 23 włóż; 24 else 25 if then 26 włóż; 27 else 28 włóż; 29 return
{{cwiczenie|[Uzupelnij]||
Zminimalizujemy automat </math>{A}=(S,A,f,s_0,T)Parser nie mógł rozpoznać (błąd składni): {\displaystyle , dla którego\\ } S= s_{0},s_{1},s_{2},s_{3},s_{4},s_5 , A=a,b,
T=s_1, s_{2},s_{4} Parser nie mógł rozpoznać (błąd składni): {\displaystyle , a funkcja przejść określona jest przy pomocy grafu.\\ RYSUNEK ja-lekcja5-w-rys2\\ Konstruujemy ciąg relacji } {}_iParser nie mógł rozpoznać (błąd składni): {\displaystyle . Na początku } {}_1
SParser nie mógł rozpoznać (błąd składni): {\displaystyle na dwie klasy abstrakcji; pierwsza zawiera stany końcowe, a druga -- wszystkie pozostałe, czyli uzyskujemy dwa zbiory } s_1,s_2,s_4
s_0, s_3, s_5
{}_2Parser nie mógł rozpoznać (błąd składni): {\displaystyle (pierwszy przebieg pętli w liniach 5.-20. algorytmu). Aby dwa elementy (stany) } s
tParser nie mógł rozpoznać (błąd składni): {\displaystyle były ze sobą w relacji } {}_2Parser nie mógł rozpoznać (błąd składni): {\displaystyle muszą być ze sobą w relacji } {}_1Parser nie mógł rozpoznać (błąd składni): {\displaystyle oraz musi zachodzić } a A f(s, a) {}_1 f(t,a).
s_1, s_2, s_4, s_0, s_3, s_5.
s_4Parser nie mógł rozpoznać (błąd składni): {\displaystyle . Rozważmy teraz zbiór } s_0, s_3, s_5f(s_3, a)=f(s_5, a)f(s_3, b)=s_3f(s_5, b)=s_5Parser nie mógł rozpoznać (błąd składni): {\displaystyle i wiadomo, że } s_3 {}_2
s_5s_3s_5Parser nie mógł rozpoznać (błąd składni): {\displaystyle będą ze sobą w relacji } {}_3Parser nie mógł rozpoznać (błąd składni): {\displaystyle . Ponieważ } f(s_0, a)=s_2f(s_3, a)=s_1s_2s_1Parser nie mógł rozpoznać (błąd składni): {\displaystyle nie są ze sobą w relacji } {}_2Parser nie mógł rozpoznać (błąd składni): {\displaystyle , zatem nie mogą być także ze sobą w relacji } {}_3{}_3Parser nie mógł rozpoznać (błąd składni): {\displaystyle dzieli więc zbiór } s_0, s_3, s_5s_0s_3, s_5Parser nie mógł rozpoznać (błąd składni): {\displaystyle . Podział zbioru } SParser nie mógł rozpoznać (błąd składni): {\displaystyle przez relację } {}_3Parser nie mógł rozpoznać (błąd składni): {\displaystyle wygląda więc następująco: }s_0, s_1, s_2, s_4, s_3, s_5.
s_4s_3, s_5Parser nie mógł rozpoznać (błąd składni): {\displaystyle , więc uzyskujemy równość } {_4}={}_3Parser nie mógł rozpoznać (błąd składni): {\displaystyle i ponieważ ciąg relacji się ustabilizował, algorytm kończy działanie. Podsumowując, mamy: ; } {} _{1}s_1, s_{2},s_{4}, s_{0},s_{3},s_5, {} _{2}s_{1},s_2,s_{4}, s_{0},s_{3},s_5,{} _{3}s_{1},s_2,s_{4}, s_{0},s_{3},s_5.{} _{3}={} _{4}Parser nie mógł rozpoznać (błąd składni): {\displaystyle i równoważny minimalny automat } {A}_L=(S,f^*,s_0,T)4Parser nie mógł rozpoznać (błąd składni): {\displaystyle stany. \\ } q_0=s_{0}, q_1=s_{1}, q_2 = s_2,s_{4}, q_3
=s_{3},s_5T=q_1 ,q_2Parser nie mógł rozpoznać (błąd składni): {\displaystyle . Jak łatwo zauważyć jest to automat z przykładu 3.1 zamieszczonego w wykładzie 4. RYSUNEK ja-lekcja5-w-rys3 }} Jednym z najczęściej stosowanych algorytmów automatu minimalnego jest algorytm, który buduje "tabelkę" na podstawie której określa się automat minimalny. Poprawność tego algorytmu również uzasadnia twierdzenie [[##twrho|Uzupelnic twrho|]]. W algorytmie tym wyznaczać będziemy tzw. stany rozróżnialne. Algorytm działa w czasie } O(|A|n^2)|A|Parser nie mógł rozpoznać (błąd składni): {\displaystyle jest mocą alfabetu, a } nParser nie mógł rozpoznać (błąd składni): {\displaystyle -- liczbą stanów automatu wejściowego, czyli podlegajacego minimalizacji. Złożoność pamięciowa jest również } O(|A|n^2)Parser nie mógł rozpoznać (błąd składni): {\displaystyle . Prezentowany algorytm nosi nazwę algorytmu Hopcrofta-Ullmana. Znana w literaturze jest pewna zmodyfikowana wersja tego algorytmu. Jest to algorytm Aho-Sethiego-Ullmana, który ma tę samą złożoność czasową, ale lepszą złożoność pamięciową - } O(|A|n)Parser nie mógł rozpoznać (błąd składni): {\displaystyle . Natomiast w ramach ćwiczeń prezentujemy jeszcze jeden algorytm, znany jako algorytm minimalizacji Hopcrofta. Czas działania tego algorytmu wynosi } O(n n)Parser nie mógł rozpoznać (błąd składni): {\displaystyle . Niech będzie relacją zdefiniowaną przez funkcję przejść automatu w następujący sposób: }p q w A^* (f(p,w) T f(q,w) T).
(S T))Parser nie mógł rozpoznać (nieznana funkcja „\STATE”): {\displaystyle } \STATE \textbf{zaznaczone}} [p,q] 0Parser nie mógł rozpoznać (nieznana funkcja „\ENDFOR”): {\displaystyle ; \ENDFOR \FOR{} each (p,q) (T T) ((S T) (S T))Parser nie mógł rozpoznać (nieznana funkcja „\STATE”): {\displaystyle } \STATE flag\textbf{false} \FOR{\textbf{each } } a AParser nie mógł rozpoznać (nieznana funkcja „\IF”): {\displaystyle } \IF{ \textbf{zaznaczone}} [f(p,a),f(q,a)]=1Parser nie mógł rozpoznać (nieznana funkcja „\STATE”): {\displaystyle } \STATE flag\textbf{true}; \ENDIF \ENDFOR \IF{flag=\textbf{true}} \STATE \textsc{Oznacz}} (p,q)Parser nie mógł rozpoznać (nieznana funkcja „\hfill”): {\displaystyle ;\hfill para } (f(p,a),f(q,a))Parser nie mógł rozpoznać (błąd składni): {\displaystyle była oznaczona dla pewnego } aParser nie mógł rozpoznać (nieznana funkcja „\ELSE”): {\displaystyle ; \ELSE \FOR{\textbf{each } } a AParser nie mógł rozpoznać (nieznana funkcja „\IF”): {\displaystyle } \IF{} f(p,a) f(q,a)Parser nie mógł rozpoznać (nieznana funkcja „\STATE”): {\displaystyle } \STATE \textbf{włóż}} ({L}[p,q],(f(p,a),f(q,a)))Parser nie mógł rozpoznać (nieznana funkcja „\ENDIF”): {\displaystyle ; \ENDIF \ENDFOR \ENDIF \ENDFOR \STATE } S' S _Parser nie mógł rozpoznać (nieznana funkcja „\hfill”): {\displaystyle ;\hfill relacja jest dopełnieniem tabeli } zaznaczoneParser nie mógł rozpoznać (nieznana funkcja „\FOR”): {\displaystyle \FOR{\textbf{each} } [s]_{ } S _Parser nie mógł rozpoznać (nieznana funkcja „\FOR”): {\displaystyle } \FOR{\textbf{each} } a AParser nie mógł rozpoznać (nieznana funkcja „\STATE”): {\displaystyle } \STATE } f'([s]_{},a) [f(s,a)]_{}Parser nie mógł rozpoznać (nieznana funkcja „\ENDFOR”): {\displaystyle ; \ENDFOR \ENDFOR \STATE } s_0' [s_0]_{}Parser nie mógł rozpoznać (nieznana funkcja „\STATE”): {\displaystyle ; \STATE } T' [t]_{}:t TParser nie mógł rozpoznać (nieznana funkcja „\RETURN”): {\displaystyle ; \RETURN } {A}'=(S', A, f', s_0', T')Parser nie mógł rozpoznać (nieznana funkcja „\endalgorithmic”): {\displaystyle ; \endalgorithmic \endalgorithm Występujaca w algorytmie procedura \textsc{Oznacz} opisana jest poniżej. \beginalgorithm \beginalgorithmic [1] \STATE \textbf{procedure} \textsc{Oznacz}} (p,q S)Parser nie mógł rozpoznać (nieznana funkcja „\IF”): {\displaystyle \IF{\textbf{zaznaczone}} [p,q]=1Parser nie mógł rozpoznać (nieznana funkcja „\STATE”): {\displaystyle } \STATE{ \textbf{return}} \ENDIF \STATE{\textbf{zaznaczone}} [p,q] 1Parser nie mógł rozpoznać (nieznana funkcja „\WHILE”): {\displaystyle } \WHILE{\textbf{not empty}} ({L}[p,q])Parser nie mógł rozpoznać (nieznana funkcja „\STATE”): {\displaystyle } \STATE{\textsc{Oznacz}(\textbf{zdejmij}} ({L}[p,q])Parser nie mógł rozpoznać (nieznana funkcja „\ENDWHILE”): {\displaystyle )} \ENDWHILE \STATE \textbf{end procedure} \endalgorithmic \endalgorithm Działanie algorytmu łatwo przedstawić na tabelce, która złożona jest z kwadratów -- pól, odpowiadających parom stanów automatu. Fakt znalezienia przez algorytm pary stanów rozróżnialnych zaznaczamy symbolem "x" w polu tabelki odpowiadającym tej parze, co wykorzystamy w przykładzie. {{cwiczenie|[Uzupelnij]|| Zminimalizujemy automat przedstawiony na rysunku [[##ja-lekcja5-w-rys4|Uzupelnic ja-lekcja5-w-rys4|]], używając algorytmu \textsc{Minimalizuj3}. RYSUNEK ja-lekcja5-w-rys4 Proces działania algorytmu i konstrukcji tabelki przedstawiony jest na poniższej animacji }} TUTAJ ANIMACJA. Opis animacji znajduje się w pliku ja-lekcja5-w-anim1.pdf. Wygląd ekranu animacji znajduje się w pliku ja-lekcja5-w-anim1.jpg.\\ Wypełniona tabelka po zakończeniu działania algorytmu przedstawiona jest na rysunku [[##ja-lekcja5-w-rys5|Uzupelnic ja-lekcja5-w-rys5|]]. RYSUNEK ja-lekcja5-w-rys5. Z tabelki odczytujemy, że stanami równoważnymi są stany } s_1, s_5s_2, s_8s_4, s_6Parser nie mógł rozpoznać (błąd składni): {\displaystyle . Automat minimalny przedstawiony jest na rysunku [[##ja-lekcja5-w-rys6|Uzupelnic ja-lekcja5-w-rys6|]]. RYSUNEK ja-lekcja5-w-rys6.}