Języki, automaty i obliczenia/Wykład 8: Dalsze algorytmy dla języków regularnych. Problemy rozstrzygalne: Różnice pomiędzy wersjami

Wersja z 20:49, 25 sie 2006

W tym wykładzie przedstawimy algorytmy konstrukcji gramatyki regularnej, automatu skończenie stanowego oraz wyrażeń regularnych opisujących ten sam język $L$ . Omówimy także problemy rozstrzygalne algorytmicznie w klasie języków regularnych.

1. Dalsze algorytmy języków regularnych

Dowód twierdzenia z ostatniego wykładu, w którym udowodniliśmy równoważność rozpoznawania języka $L$ i generowania tego języka przez gramatykę regularną daje podstawę do określenia dwóch algorytmów. Algorytmu konstruującego automat skończony w oparciu o daną gramatykę regularną i oczywiście akceptujący język generowany przez tę gramatykę oraz algorytmu budowy gramatyki regularnej dla zadanego automatu. Bez utraty ogólności przyjmujemy, że automat jest deterministyczny.

Idea działania algorytmu Automat2GReg jest następująca: każdy symbol nieterminalny $v$ tworzonej gramatyki odpowiada pewnemu stanowi $s_{v}$ automatu. Jeśli w automacie pod wpływem litery $a$ następuje przejście ze stanu $s_{v}$ do stanu $s_{w}$ , to do zbioru praw gramatyki dodawane jest prawo $s_{v} \to a s_{w}$ . Ponadto, jeśli stan $s_{w}$ jest stanem końcowym, to dodajemy także prawo $s_{w} \to 1$ , aby w danym miejscu wywód słowa mógł zostać zakończony.

Algorytm Automat2GReg -- buduje gramatykę regularną dla zadanego automatu skończonego.

  1  Wejście:  $𝒜 = (S, A, f, s_{0}, T)$  -- automat niedeterministyczny.
  2  Wyjście:  $G = (V_{N}, V_{T}, P, v_{0})$  -- gramatyka regularna taka, że  $L (G) = L (𝒜)$ .
  3   $V_{N} \leftarrow {v_{0}, v_{1}, . . ., v_{| S | - 1}}$ ;
  4   $V_{T} \leftarrow A$ ;
  5   $v_{0} \leftarrow s_{0}$ ;
  6   $P \leftarrow \emptyset$ ;
  7  for each   $s_{i} \in S$  do
  8    for each   $a \in A$  do
  9      if  $f (s_{i}, a) \neq$ NULL then
 10         $s_{j} \leftarrow f (s_{i}, a)$ ;  $▹$  funkcja
 11         $f$  jest określona na  $(s_{i}, a) P \leftarrow P \cup {s_{i} \to a s_{j}}$ ;
 12        if  $s_{j} \in T$  then
 13           $P \leftarrow P \cup {s_{j} \to 1}$ ;
 14        endif
 15      endif
 16    endfor
 17  endfor
 18  return  $G$ ;

Oznaczmy przez $E (𝒜)$ ilość krawędzi w grafie $n$ -stanowego automatu niedeterministycznego $𝒜$ . Złożoność czasowa liczona względem $E (𝒜)$ jest liniowa i równa $O (E (𝒜))$ . Również złożoność pamięciowa jest liniowa i wynosi $O (| S | + E (𝒜))$ .

Przykład 1.1

Niech dany będzie automat $𝒜$ pokazany na rysunku Uzupelnic ja-lekcja8-w-rys1|. Zbudujemy gramatykę, która będzie

generowała język akceptowany przez

𝒜

.

<flash>file=ja-lekcja08-w-rys1.swf|width=250|height=150</flash>

<div.thumbcaption>ja-lekcja08-w-rys1

Ponieważ $f (s_{0}, a) = s_{0}$ , a ponadto $s_{0}$ jest stanem końcowym, do $P$ dodajemy produkcje $v_{0} \to a v_{0}$ oraz $v_{0} \to 1$ . Dodajemy także produkcję $v_{0} \to b v_{1}$ , gdyż mamy $f (s_{0}, b) = s_{1}$ .

Fakt, że $f (s_{1}, b) = s_{1}$ oraz $f (s_{1}, a) = s_{2}$ sprawia, że do $P$ dodajemy: $v_{1} \to b v_{1}$ , $v_{1} \to a v_{2}$ .

Ponieważ $f (s_{2}, a) = s_{1}$ do $P$ dodajemy: $v_{2} \to a v_{1}$ oraz $v_{2} \to 1$ , gdyż $s_{2} \in T$ .

Symbolem początkowym nowej gramatyki jest symbol $v_{0}$ . Ostatecznie gramatyka ma postać: {-.5cm}

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \nonumber v_0 & \rightarrow & av_0\ |\ bv_1 \ |\ 1\\ \nonumber v_1 & \rightarrow & bv_1\ |\ av_2 \\ \nonumber v_2 & \rightarrow & av_1\ |\ 1 \endaligned}

Zwróćmy uwagę na wygodny zapis produkcji gramatyki, jaki został użyty powyżej. Produkcje o tej samej lewej stronie (wspólnym symbolu nieterminalnym) zapisywane są razem, a prawe strony tych produkcji oddzielane są pionowymi kreskami.

Przedstawiony poniżej algorytm GReg2Automat konstruuje automat skończenie stanowy, akceptujący język generowany przez zadaną gramatykę.

Zauważmy, że gramatyka podana na wejściu algorytmu nie może zawierać produkcji postaci $v \to x$ , gdzie $v \in V_{N}$ , $x \in (V_{N} \cup V_{T})$ . Jeśli gramatyka zawiera takie produkcje, to możemy się ich łatwo pozbyć, zgodnie z Twierdzeniem 2.2 z Wykładu 7, uzyskując oczywiście gramatykę równoważną.

Idea działania algorytmu jest podobna do poprzedniej -- każdy tworzony stan automatu odpowiadać będzie pewnemu symbolowi nieterminalnemu gramatyki wejściowej. Zależnie od postaci produkcji gramatyki, niektóre stany będą stanami końcowymi.

Zapis $f \leftarrow$ w linii 7. symbolicznie oznacza, że funkcja przejść nie jest jeszcze określona.

W pętli 8.-15. pozbywamy się produkcji, w których występuje więcej niż jeden terminal; każdą taką produkcję "rozbijamy" na sekwencję produkcji postaci $v \to a w$ , gdzie $v, w \in V_{N}, a \in V_{T}$ .

Algorytm GReg2Automat -- buduje automat dla zadanej gramatyki regularnej.

Wejście: $G = (V_{N}, V_{T}, P, v_{0})$ -- gramatyka regularna.

Wyjście: $𝒜 = (S, A, f, v_{0}, T)$ -- automat taki, że $L (𝒜) = L (G)$ .

$S \leftarrow V_{N}$ ;

$A \leftarrow V_{T}$ ;

$T \leftarrow$ ; $▹$ nie ma jeszcze stanów końcowych

$s_{0} \leftarrow v_{0}$ ;

$f \leftarrow$ ; $▹$ funkcja $f$ nie jest określona dla żadnego argumentu

for each $(v_{i} \to a_{1} a_{2} . . . a_{n} v_{j}) \in P$

if $n > 1 V_{N} \leftarrow V_{N} \cup {v^{a_{1}}, . . ., v^{a_{n - 1}}}$ ; $▹$ rozbijamy produkcję na kilka prostszych

$P \leftarrow P ∖ {v_{i} \to a_{1} a_{2} . . . a_{n} v_{j}}; ▹$ w tym celu usuwamy produkcję z $P P \leftarrow P \cup {v_{i} \to a_{1} v^{a_{1}}, v^{a_{n - 1}} \to a_{n} v_{j}}$ ; $▹$ w zamian dodając ciąg krótszych

$P \leftarrow P \cup {v^{a_{1}} \to a_{2} v^{a_{2}}, \dots, v^{a_{n - 2}} \to a_{n - 1} v^{a_{n - 1}}}$ ;

endif

endfor

$▹$ wszystkie produkcje są postaci $u \to a v$ lub $u \to 1$ , gdzie $u, v \in V_{N}$ , $a \in V_{T}$

for each $(s_{i} \to a s_{j}) \in P f (s_{i}, a) \leftarrow s_{j}$ ;

endfor

for each $(v_{i} \to 1) \in P T \leftarrow T \cup {v_{i}}$ ;

endfor

return $𝒜 = (S, A, f, s_{0}, T)$ ;

Przykład 1.2

Jako wejście algorytmu rozważmy gramatykę z przykładu Uzupelnic przyklad_automat2gramatyka|. Używając algorytmu Greg2Automat, zbudujemy dla niej automat akceptujący język przez nią generowany.

Mamy $S = {s_{0}, s_{1}, s_{2}}$ . W liniach 17. -- 19. określana jest funkcja przejścia: $f (s_{0}, a) = s_{0}$ , $f (s_{0}, b) = s_{1}$ , $f (s_{1}, b) = s_{1}$ , $f (s_{1}, a) = s_{2}$ oraz $f (s_{2}, a) = s_{1}$ .

Pętla w liniach 20. -- 22. przebiega po dwóch produkcjach: $v_{0} \to 1$ oraz $v_{2} \to 1$ , dodaje zatem do zbioru $T$ stanów końcowych stany $s_{0}$ oraz $s_{2}$ . Szukany automat to automat z poprzedniego przykładu; przedstawiony jest na rysunku Uzupelnic ja-lekcja8-w-rys1|.

Automat powstały w wyniku działania algorytmu GReg2Automat nie musi być automatem deterministycznym (wystarczy, że w zbiorze produkcji znajdą się dwie produkcje postaci $v_{i} \to a v_{j}$ oraz $v_{i} \to a v_{k}$ dla pewnego $a \in A$ ), jednak po jego determinizacji i minimalizacji otrzymujemy minimalny automat deterministyczny akceptujący język, który jest generowany przez gramatyke podaną na wejście algorytmu.

Złożoność czasowa jak i pamięciowa algorytmu wynosi $O (p)$ , gdzie $p$ jest liczbą produkcji występujących w zbiorze praw $P$ gramatyki.

Przedstawimy teraz algorytmy związane z wyrażeniami regularnymi. Pierwszy z nich prowadzi do konstrukcji automatu skończenie stanowego, rozpoznającego język opisany wyrażeniem regularnym. Drugi, mając na wejściu automat, konstruuje wyrażenie regularne opisujące język rozpoznawany przez ten automat.

Rozpoczynamy od algorytmu prowadzącego do konstrukcji automatu na podstawie wyrażenia regularnego.

Niech $a \in A, r, s \in 𝒲 ℛ$ . Najpierw pokażemy, że językom odpowiadającym wyrażeniom regularnym , $1$ , $a$ , $r + s$ , $r s$ oraz $r^{*}$ można przyporządkować automaty akceptujące te języki, a następnie podamy algorytm konstruowania automatu rozpoznającego dowolne wyrażenie regularne.

Na rysunku Uzupelnic ja-lekcja8-w-rys3| przedstawione są trzy automaty. Automat a) rozpoznaje język pusty, automat b) -- język ${1}$ , a automat c) -- język ${a}$ , dla $a \in A$ .

RYSUNEK ja-lekcja8-w-rys3

Niech dane będą automaty: $M_{1}$ , akceptujący język opisywany wyrażeniem $r$ oraz $M_{2}$ , akceptujący język opisywany wyrażeniem $s$ . Na rysunku Uzupelnic ja-lekcja8-w-rys4| przedstawiono konstrukcje automatów akceptujących wyrażenia regularne $r + s$ (automat a)), $(r s)$ (automat b)) oraz $r^{*}$ (automat c)).

RYSUNEK ja-lekcja8-w-rys4

W automacie a) stan $q_{0}$ jest stanem początkowym, stan $f_{0}$ -- stanem końcowym, stany $q_{1}, q_{2}$ oraz $f_{1}, f_{2}$ oznaczają odpowiednio stany początkowe automatów $M_{1}$ i $M_{2}$ oraz stany końcowe automatów $M_{1}$ i $M_{2}$ .

W automacie b) stan $q_{0}$ jest jednocześnie jego stanem początkowym oraz stanem początkowym automatu $M_{1}$ , stan $f_{1}$ jest stanem końcowym automatu b) i jednocześnie stanem końcowym automatu $M_{2}$ . Stan $f_{0}$ jest stanem końcowym w $M_{1}$ , a $q_{1}$ -- początkowym w $M_{2}$ .

W automacie c) stan $q_{0}$ jest jego stanem początkowym a $f_{0}$ końcowym. Stany $q_{1}$ oraz $f_{1}$ to odpowiednio początkowy i końcowy stan automatu $M_{1}$ .

Wyrażenia regularne można przedstawiać w postaci drzewa, w którym liśćmi są litery, słowo puste 1 lub zbiór pusty , a węzły symbolizują operacje na wyrażeniach regularnych, czyli sumę, konkatenację lub iterację, czyli gwiazdkę Kleene'ego.

Przykład 1.3

Rozważmy wyrażenie regularne $r = (a^{*} b) (a b + c)$ . Drzewo odpowiadające $r$ przedstawione jest na rysunku Uzupelnic ja-lekcja6-w-rys3|. Korzeniem jest wierzchołek z małą wchodzącą strzałką.

RYSUNEK ja-lekcja8-w-rys5

Powyższe konstrukcje będą stosowane podczas iteracyjnej budowy automatu. Algorytm do tego celu będzie wykorzystywał drzewo odpowiadające wyrażeniu regularnemu w następujący sposób: drzewo będzie przeszukiwane metodą post-order (zaczynając od korzenia), tzn. najpierw rekurencyjnie przeszukiwane są poddrzewa danego węzła $x$ , a na końcu sam węzeł $x$ . Dzięki temu, wchodząc do węzła $x$ drzewa etykietowanego daną operacją na wyrażeniu regularnym oba poddrzewa $P$ i $L$ wierzchołka $x$ będą już reprezentowane przez automaty $𝒜_{P}$ oraz $𝒜_{L}$ . Teraz wystarczy zastosować jedną z konstrukcji z rysunku Uzupelnic ja-lekcja8-w-rys3| lub Uzupelnic ja-lekcja8-w-rys4|. Procedurę powtarzamy do momentu, aż przechodzenie drzewa zakończy się w korzeniu. Szukanym przez nas automatem będzie automat "odpowiadający" korzeniowi drzewa.

Poniżej przedstawiony jest algorytm konstrukcji automatu w oparciu o wyrażenie regularne. Jego istotną część składową stanowi procedura PostOrder, której pseudo-kod jest przedstawiony poniżej. Wykorzystamy także dwie procedury, mianowicie CreateAutomata(type) oraz JoinAutomata(type, $ℳ_{1}, ℳ_{2}$ ). Zmienna type może przyjmować wartości ' $a$ ', ' $b$ ' lub ' $c$ '. Funkcja zwraca automat CreateAutomata(type) przedstawiony (zależnie od zmiennej type) na rysunku Uzupelnic ja-lekcja8-w-rys3|. Procedura JoinAutomata(type, $ℳ_{1}, ℳ_{2}$ ) natomiast konstruuje na podstawie automatów $ℳ_{1}$ , $ℳ_{2}$ automat z rysunku Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle [[##ja-lekcja8-w-rys3|Uzupelnic ja-lekcja8-w-rys3|]]} , przy czym dla przypadku type= $c$ automat $ℳ_{2}$ jest bez znaczenia. Ostatnią wykorzystaną procedurą będzie BuildTree(r), tworząca drzewo (binarne) dla wyrażenia regularnego. Zakładamy, że studentowi doskonale jest znana Odwrotna Notacja Polska i budowa takiego drzewa nie będzie dla niego stanowiła problemu. Dla ustalenia uwagi zakładamy, że symbol $*$ prowadzi zawsze do lewego dziecka.

Poniżej przedstawiamy oznaczenia standardowych funkcji operujących na drzewach. Funkcja Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle \textsc{Root}(T)} zwraca korzeń drzewa $T$ , funkcje Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle \textsc{LeftChild}(T,v)} oraz Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle \textsc{RightChild}(T,v)} zwracają lewe i prawe dziecko wierzchołka $v$ (ew. NULL, gdy brak lewego lub prawego dziecka), natomiast funkcja Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle \textsc{Label}(T,v)} zwraca etykietę wierzchołka $v$ drzewa $T$ . Funkcja Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle \textsc{IsLeaf}(T,v)} zwraca wartość $true$ , gdy $v$ jest liściem w drzewie $T$ oraz $false$ w przypadku przeciwnym.

Algorytm Wr2Automat -- buduje automat rozpoznający język opisywany wyrażeniem regularnym

Wejście: $r$ -- wyrażenie regularne.

Wyjście: $𝒜 = (S, A, f, s_{0}, T)$ -- automat rozpoznający język opisywany wyrażeniem $r$ .

Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle T\leftarrow \textsc{BuildTree}(r)} ;

Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle v_0 \leftarrow \textsc{Root}(T)} ;

$𝒜 \leftarrow$ PostOrder( $T, v_{0}$ );

return $𝒜$ ;

Algorytm

procedure PostOrder ( $T$ : drzewo, $v$ : wierzchołek)

if IsLeaf( $T, v$ )

if $v$ =NULL $𝒜_{v} \leftarrow$ CreateAutomata(' $a$ ');

else

if Label( $T, v$ )='1' $𝒜_{v} \leftarrow$ CreateAutomata(' $b$ ');

else

$𝒜_{v} \leftarrow$ CreateAutomata(' $c$ '); $▹$ Label $(T, v) \in A$

endif endif

return $𝒜_{v}$ ;

else

$𝒜_{L} \leftarrow$ PostOrder( $T$ ,Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle \textsc{LeftChild}(T,v)} );

$𝒜_{P} \leftarrow$ PostOrder( $T$ ,Parser nie mógł rozpoznać (nieznana funkcja „\textsc”): {\displaystyle \displaystyle \textsc{RightChild}(T,v)} );

if Label( $T, v$ )=' $+$ ' $𝒜_{L P} \leftarrow$ JoinAutomata(' $a$ ' $, 𝒜_{L}, 𝒜_{P}$ );

endif

if Label( $T, v$ )=' $\cdot$ ' $𝒜_{L P} \leftarrow$ JoinAutomata(' $b$ ' $, 𝒜_{L}, 𝒜_{P}$ );

endif

if Label( $T, v$ )=' $*$ ' $𝒜_{L P} \leftarrow$ JoinAutomata(' $c$ ' $, 𝒜_{L}, 𝒜_{P}$ );

endif

return $𝒜_{L P}$ ;

endif

end procedure

Przykład 1.4

Zastosujemy algorytm Wr2Automat do konstrukcji automatu dla wyrażenia regularnego $w = (a^{*} b) (a b + c)$ .

ANIMACJA - opis w pliku ja-lekcja8-w-anim1.pdf

Automat $𝒜_{10}$ jest zwrócony przez algorytm jako automat akceptujący język opisywany wyrażeniem $r = (a^{*} b) (a b + c)$ . Automat ten przedstawiony jest na rysunku Uzupelnic ja-lekcja8-w-rys6|

RYSUNEK ja-lekcja8-w-rys6

Ramkami zaznaczono i opisano automaty budowane w trakcie działania procedury PostOrder.

Rezultat działania algorytmu Wr2Automat może nie być zadawalający, gdyż wynikiem działania algorytmu nie jest automat deterministyczny, lecz automat z pustymi przejściami. Automat ten można więc poddać procesowi usunięcia przejść pustych oraz determinizacji, co można przeprowadzić przy pomocy omówionych wcześniej algorytmów UsuńPustePrzejścia oraz Determinizuj.

Procedura tworzenia drzewa dla wyrażenia regularnego działa w czasie liniowym ze względu na długość napisu reprezentującego wyrażenie regularne -- napis ten można najpierw przekształcić do równoważnego mu, zapisanego w Odwrotnej Notacji Polskiej, a następnie, przechodząc od lewej strony do prawej, konstruować po kolei fragmenty drzewa.

Przechodzimy teraz do algorytmów konstruujących wyrażenie regularne na podstawie zadanego automatu. Pierwszą metodę, można powiedzieć klasyczną i omawianą w większości podręczników, prezentujemy poniżej. Drugą, nieco prostszą i wygodniejszą w zastosowaniu, przedstawimy w ćwiczeniach do tego wykładu.

Niech dany będzie automat $𝒜 = (S, A, f, s_{1}, T)$ . Zbudujemy wyrażenie regularne opisujące język akceptowany przez $𝒜$ .

Konstrukcja polega na obliczeniu zbiorów $R_{i j}^{k}$ (definicja poniżej), gdzie $i, j = 1, . . ., | S |$ , co jest równoważne konstrukcji pewnych wyrażeń regularnych $r_{i j}^{k}$ . Szukany język będzie odpowiadał sumie pewnych zbiorów $R_{i j}^{k}$ , a zatem opisywany będzie przez wyrażenie regularne postaci $r_{i j_{1}}^{k} + . . . + r_{i j_{t}}^{k}$ dla pewnych $j_{l}$ , $i$ oraz $k$ .

Załóżmy, że zbiór stanów automatu jest postaci $S = {s_{1}, s_{2}, . . ., s_{n}}$ . Wprowadźmy porządek na

zbiorze

S

, przyjmując:

s_{i} ≺ s_{j} \Leftrightarrow i < j .

Zbiory $R_{i j}^{k}$ definiujemy w następujący sposób:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned R_{ij}^0 &= \left\{ \begin{array} {ll} \{a \in A:\ f(s_i,a)=s_j\} & \mbox{ dla } i \not = j,\ 1 \leqslant i,j \leqslant n \\ \{a \in A\ f(s_i, a)=s_j\} \cup \{ 1 \} & \mbox{ dla } i=j,\ 1 \leqslant i,j \leqslant n \end{array} \right. \\ \nonumber R_{ij}^k &= R_{ik}^{k-1}(R_{kk}^{k-1})^*R_{kj}^{k-1} \cup R_{ij}^{k-1},\ 1 \leqslant i,j,k \leqslant n. \endaligned}

Intuicyjnie, zbiór $R_{i j}^{k}$ to ogół wszystkich słów $w$ takich, że $f (s_{i}, w) = s_{j}$ , a ponadto jeśli $w = a_{1} a_{2} . . . a_{m}$ , to $\forall 1 ⩽ j ⩽ m - 1 f (s_{i}, a_{1} a_{2} . . . a_{j}) = s_{l} \land l ⩽ k$ .

Zamiast obliczać zbiory $R_{i j}^{k}$ wygodniej będzie od razu zapisywać odpowiadające im wyrażenia regularne, które oznaczać będziemy poprzez $r_{i j}^{k}$ . Przez analogię mamy wzór rekurencyjny:

r_{i j}^{k} = r_{i k}^{k - 1} (r_{k k}^{k - 1})^{*} r_{k j}^{k - 1} + r_{i j}^{k - 1}, 1 ⩽ i, j, k ⩽ n .

Pozostaje wyjaśnić jak wyglądają wyrażenia $r_{i j}^{0}$ . Jeśli $R_{i j}^{k} = {a_{1}, a_{2}, \dots, a_{s}}$ to

r_{i j}^{0} = a_{1} + a_{2} + \dots + a_{s}

Twierdzenie 1.1

Niech $𝒜$ oraz $R_{i j}^{k}$ będą zdefiniowane jak powyżej i niech zbiór stanów końcowych dla $𝒜$ ma postać $T = {s_{j_{1}}, s_{j_{2}}, . . ., s_{j_{t}}}$ . Wtedy

L (𝒜) = r_{1 j_{1}}^{n} + r_{1 j_{2}}^{n} + . . . + r_{1 j_{t}}^{n} .

Powyższą metodę ujmiemy formalnie w ramy algorytmu (algorytm Automat2WR1).

Algorytm Automat2WR1 -- buduje wyrażenie regularne opisujące język akceptowany przez automat skończony.

Wejście: $𝒜 = (S = {s_{1}, s_{2}, . . ., s_{n}}, A, f, s_{1}, T)$ .

Wyjście: $w$ -- wyrażenie regularne opisujące język $L = L (𝒜)$ .

for $i \leftarrow 1 to n$

for $j \leftarrow 1 to n$

oblicz $r_{i j}^{0} ▹$ stosujemy wzór (Uzupelnic compute_rij0|);

endfor

for $k \leftarrow 1 to n$

for $i \leftarrow 1 to n$

for $j \leftarrow 1 to n r_{i j}^{k} \leftarrow r_{i k}^{k - 1} (r_{k k}^{k - 1})^{*} r_{k j}^{k - 1} + r_{i j}^{k - 1}$ ; $▹$ dokonujemy katenacji słów

endfor

$r \leftarrow$ ""; $▹$ podstaw pod $r$ słowo puste

for $i \leftarrow 1 to n$

if $s_{i} \in T$

if r="" $r \leftarrow r_{1 i}^{n}$ ; $▹$ stosujemy Twierdzenie Uzupelnic thm:FormOfL| else

$r \leftarrow r + r_{1 i}^{n}$ ; endif

endif

endfor

return $r$ ;

Podczas obliczania wyrażeń $r_{i j}^{k}$ należy je w miarę możliwości upraszczać, gdyż, szczególnie przy dużej liczbie stanów, nieskracane, mogą rozrastać się do bardzo dużych rozmiarów.

Przykład 1.5

Znajdziemy wyrażenie regularne opisujące język akceptowany przez automat z rysunku Uzupelnic ja-lekcja8-w-rys7|.

<flash>file=ja-lekcja08-w-rys7.swf|width=250|height=250</flash>

<div.thumbcaption>ja-lekcja08-w-rys7

Mamy $| S | = 3$ , $i, j \in {1, 2, 3}$ , $k \in {0, 1, 2, 3}$ , $T = {s_{3}}$ . Szukamy zatem wyrażenia regularnego $r = r_{13}^{3}$ .

Najpierw musimy obliczyć $r_{i j}^{0}$ dla wszystich $i, j \in {1, 2, 3}$ . Mamy na przykład $r_{31}^{0} = a + b$ , gdyż z definicji zachodzi: $R_{31}^{0} = {a \in A : f (s_{3}, a) = s_{1}} = {a, b}$ .

Gdy mamy wyliczone wszystkie $r_{i j}^{0}$ , przystępujemy do obliczeń dla $k = 1$ .

Na przykład:

r_{31}^{1} = r_{31}^{0} (r_{11}^{0})^{*} r_{11}^{0} + r_{31}^{0} = (a + b) (a + 1)^{*} (a + 1) + (a + b),

co po zredukowaniu daje

r_{31}^{1} = (a + b) (a + 1)^{+} + (a + b) = (a + b) a^{*} + (a + b) = (a + b) a^{*} = a^{+} + b a^{*} .

Obliczone wyrażenia $r_{i j}^{k}$ dla $k = 0, 1, 2$ oraz dla wszystkich $i, j$ przedstawione są w tabeli Uzupelnic tab_rijk|.

[!hf]

Uzupelnij tytul
	$k = 0$	$k = 1$	$k = 2$
$r_{11}^{k}$	$a + 1$	$a^{*}$	$a^{} b (a^{+} b)^{} a^{+} + a^{*}$
$r_{12}^{k}$	$b$	$a^{*} b$	$a^{} b (a^{+} b)^{} + 1$
$r_{13}^{k}$			$a^{} b (a^{+} b)^{} b$
$r_{21}^{k}$	$a$	$a^{+}$	$(a^{+} b)^{*} a^{+}$
$r_{22}^{k}$	$1$	$a^{+} b + 1$	$(a^{+} b)^{*}$
$r_{23}^{k}$	$b$	$b$	$(a^{+} b)^{*} b$
$r_{31}^{k}$	$a + b$	$a^{+} + b a^{*}$	$(1 + (a^{+} b + b a^{} b) (a^{+} b + 1)) a^{+} + b a^{}$
$r_{32}^{k}$		$a^{+} b + b a^{*} b$	$(a^{+} b + b a^{} b) (a^{} b)^{*}$
$r_{33}^{k}$	$1$	$1$	$(a^{+} b + b a^{} b) (a^{} b)^{*} b + 1$

{Obliczone wartości $r_{i j}^{k}$ dla automatu z rys. Uzupelnic ja-lekcja8-w-rys7|}

Ponieważ $T = {s_{3}}$ , szukanym wyrażeniem regularnym będzie $r = r_{13}^{3}$ . Obliczamy zatem:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \nonumber r_{13}^3 &= r_{13}^2(r_{33}^2)^*r_{33}^2+r_{13}^2 \\ \nonumber &= a^*b(a+b)^*b(a^+b+ba^*b)(a^*b)^*b+1)^*+a^*b(a^+b)^*b \\ \nonumber &= a^*b(a^+b)^*b((a^+b+ba^*b)(a^*b)^*b)^*. \endaligned}

2. Problemy rozstrzygalne algorytmicznie

Kończąc część wykładu prezentującą języki regularne, wskażemy problemy rozstrzygalne algorytmicznie w zakresie tej rodziny języków formalnych. Ponieważ pojęcia rozstrzygalności i nierozstrzygalności możemy uznać za znane (były wprowadzone na innych wykładach) nie będziemy tutaj ich definiować ani kreślić tła teorii rozstrzygalności.

W obrębie rodziny języków regularnych wszystkie podstawowe problemy są algorytmicznie rozstrzygalne. Uzasadnienia są proste. Część z nich opiera się na lemacie o pompowaniu, a część wynika bezpośrednio z algorytmicznej struktury automatu skończenie stanowego, czy też gramatyki regularnej.

Twierdzenie 2.1

W klasie języków regularnych $ℛ ℰ 𝒢 (A^{*})$ następujące problemy są rozstrzygalne:

problem niepustości języka, $L \neq \emptyset,$
problem nieskończoności języka, $c a r d L = ℵ_{0},$
problem równości języków, $L_{1} = L_{2},$
problem należenia słowa do języka, $w \in L .$

Dowód

Uzupelnic niepusty|. Aby uzasadnić ten fakt zauważmy, że wystarczy sprawdzić niepustość skończonego podzbioru języka $L,$ co wynika z równoważności:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L\neq \oslash \: \Leftrightarrow \: \exists w\in L\, :\, \mid w\mid <N,}

gdzie $N$ stała z lematu o pompowaniu. Implikacji $\Leftarrow$ jest oczywista. Natomiast fakt, że do niepustego języka należy słowo o długości ograniczonej przez $N$ , wynika z lematu o pompowaniu. Jeśli mianowicie $w \in L$ i $∣ w ∣ ⩾ N$ , to rozkładamy słowo $w$ następująco:

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle w=v_{1}uv_{2},\; \; u\neq 1,\; \; \forall i=0,1,2\ldots \: v_{1}u^{i}v_{2}\in L. }

Przyjmując teraz wartość $i = 0$ , uzyskujemy:

v_{1} v_{2} \in L, ∣ v_{1} v_{2} ∣ < ∣ w ∣

Po skończonej ilości powtórzeń powyższego rozkładu uzyskamy słowo należące do języka, o długości ograniczonej przez $N$ .

Uzupelnic nieskonczony|. Wystarczy udowodnić nastepującą równoważność:

L nieskończony ⟺ \exists w \in L : N ⩽ ∣ w ∣ < 2 N .

Jeśli $L$ jest językiem nieskończonym, to znajdziemy w $L$ słowo $w$ dowolnie długie. Niech $∣ w ∣ ⩾ N$ . Jeśli słowo $w$ nie spełnia ograniczenia $∣ w ∣ < 2 N$ , to podobnie jak poprzednio korzystamy z lematu o pompowaniu i po skończonej ilości kroków otrzymamy słowo krótsze od $2 N$ . Istotne jest, że wykorzystując lemat o pompowaniu, możemy założyć, że usuwane słowo $u$ ma długość ograniczoną przez $N$ . Zatem oznacza to, że ze słowa dłuższego od $2 N$ nie dostaniemy słowa krótszego od $N$ .

Jeśli teraz do języka $L$ należy słowo $w$ o długości większej lub równej $N$ , to znów z lematu o pompowaniu wnioskujemy, że

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle w=v_{1}uv_{2},\: u\neq 1\;\;\; i\;\;\; v_{1}u^{*}v_{2}\subset L}

Istnieje więc nieskończony podzbiór języka $L$ , a więc i sam język $L$ jest nieskończony.

Uzupelnic rownosc|. Rozważmy $L = (L_{1} \cap \overline{L_{2}}) \cup (\overline{L_{1}} \cap L_{2})$ . Język $L$ jest regularny, co wynika z domkniętości klasy $ℒ_{3}$ na operaje boolowskie. Równoważność

L \neq \emptyset ⟺ L_{1} \neq L_{2} .

sprowadza problem równości języków do problemu niepustości omówionego powyżej.

Uzupelnic nalezenie|. Konstruujemy automat $𝒜 = (S, f, s_{0}, T)$ rozpoznający język $L$ i sprawdzamy, czy $f (s_{0}, w) \in T .$

♢

Na podstawie dowodu powyższego twierdzenia nietrudno jest określić algorytmy rozstrzygające przedstawione problemy. Poniżej prezentujemy algorytm rozstrzygający problem należenia słowa do języka regularnego zadanego automatem. Bez straty ogólności możemy założyć, że automat jest deterministyczny.

Algorytm NależenieDoJęzyka -- sprawdza, czy dane słowo należy do języka $L$ akceptowanego przez zadany automat $𝒜$

Wejście: $𝒜 = (S, A, f, s_{0}, T)$ -- automat akceptujący język $L$ oraz $w = w_{1} w_{2} \dots w_{n} \in A^{*}$ -- słowo.

Wyjście: Odpowiedź true (tak) lub false (nie).

$k \leftarrow | w |$ ;

$s \leftarrow s_{0}$ ;

for $i \leftarrow 1 to k s \leftarrow f (s, w_{i})$ ;

endfor

if $s \in T$

return true;

else

return false;

endif

Algorytm działa w czasie $O (| w |)$ i posiada złożoność pamięciową $O (| A | \cdot | S |)$ , co spowodowane jest koniecznością przechowywania funkcji przejść automatu $𝒜$ .

Jeśli język zadany jest nie automatem, a gramatyką regularną, to gramatykę można przekształcić na automat poznanym na początku wykładu algorytmem GReg2Automat, następnie zdeterminizować ten automat i podać go jako wejście dla algorytmu NależenieDoJęzyka.

Jeśli język zadany jest wyrażeniem regularnym, to mając wyrażenie regularne, można zbudować odpowiadający mu automat przy pomocy algorytmu WR2Automat. A zatem, na przykład, z powyższego twierdzenia wynika, iż problem równoważności wyrażeń regularnych jest rozstrzygalny.

@@ Linia 679: / Linia 679: @@
 [[##nalezenie|Uzupelnic nalezenie|]].
 Konstruujemy automat  <math>\displaystyle \mathcal{A}  \displaystyle =(S,f,s_0,T)</math> rozpoznający język
-<math>\displaystyle L  </math>  i sprawdzamy, czy  <math>\displaystyle f(s_{0},w)\in T.  \displaystyle \diamondsuit</math>   }}
+<math>\displaystyle L  </math>  i sprawdzamy, czy  <math>\displaystyle f(s_{0},w)\in T.</math>
+<center><math>\displaystyle \diamondsuit</math></center>}}
 Na podstawie dowodu powyższego twierdzenia nietrudno jest określić algorytmy

Języki, automaty i obliczenia/Wykład 8: Dalsze algorytmy dla języków regularnych. Problemy rozstrzygalne: Różnice pomiędzy wersjami

Wersja z 20:49, 25 sie 2006

1. Dalsze algorytmy języków regularnych

2. Problemy rozstrzygalne algorytmicznie

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia