Języki, automaty i obliczenia/Wykład 7: Twierdzenie Kleene'ego. Własności języków i gramatyk regularnych: Różnice pomiędzy wersjami

Wersja z 18:04, 22 sie 2006

Wprowadzenie: W wykładzie udowodnimy twierdzenie Kleene'ego, które orzeka, że

rodzina języków regularnych jest identyczna z rodziną języków rozpoznawanych przez automaty o skończonej liczbie stanów. Przedstawimy własności języków regularnych i gramatyk typu (3). Na koniec uzasadnimy, że rodziny języków regularnych, rozpoznawalnych oraz generowanych przez gramatyki typu (3), są tożsame.

Słowa kluczowe: twierdzenie Kleene, języki regularne, języki rozpoznawane, języki typu (3)

zamkniętość na działania, gramatyka typu (3), gramatyka prawoliniowa i lewoliniowa.

Twierdzenie Kleene

Wiemy już, z poprzednich wykładów, że rodzina wyrażeń regularnych określa rodzinę języków regularnych. Celem pierwszej części tego wykładu jest ustalenie związku pomiędzy rodziną języków regularnych a rodziną języków rozpoznawanych przez automaty o skończonej liczbie stanów. Twierdzenie, udowodnione przez S.C.Kleene'ego w roku 1956, orzeka, iż te dwie rodziny języków są identyczne.

Twierdzenie

Dla dowolnego skończonego alfabetu $A$

ℛ ℰ 𝒢 (A^{*}) = ℛ ℰ 𝒞 (A^{*})

.

Dowód

Dowód pierwszej części twierdzenia, czyli inkluzja $ℛ ℰ 𝒢 (A^{*}) \subseteq ℛ ℰ 𝒞 (A^{*})$ , będzie prowadzony zgodnie ze strukturą definicji rodziny języków regularnych $ℛ ℰ 𝒢 (A^{*})$ .

1. Język pusty $\emptyset$ jest rozpoznawany przez dowolny automat $𝒜 = (S, A, f, s_{0}, T),$ w którym zbiór stanów końcowych $T$ jest pusty.

2. Język a złożony z dowolnej litery $a \in A$ jest rozpoznawany przez automat

RYSUNEK ja-lekcja7-w-rys1

Dla dalszej części dowodu ustalmy, iż dane są języki $L_{1}, L_{2}$ rozpoznawane odpowiednio przez automaty deterministyczne $𝒜_{i} = (S_{i}, f_{i}, {s_{0}}^{i}, T_{i})$ , gdzie $i = 1, 2 .$

3. Sumę mnogościową języków $L_{1}, L_{2}$ , czyli język $L = L_{1} \cup L_{2}$ rozpoznaje automat $𝒜 = (S, f, s_{0}, T)$ , dla którego $S = S_{1} \times S_{2}$ , $s_{0} = ({s_{0}}^{1}, {s_{0}}^{2})$ , Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \: \displaystyle T = T_1 \times S_2\; \cup \;S_1 \times T_2} oraz dla dowolnego stanu $(s_{1}, s_{2}) \in S$ i litery $a \in A$ funkcja przejść określona jest równością

f ((s_{1}, s_{2}), a) = (f_{1} (s_{1}, a), f_{2} (s_{2}, a)) .

4. Katenację języków $L_{1}, L_{2}$ , czyli język $L = L_{1} \cdot L_{2}$ rozpoznaje automat $𝒜 = (S, f, s_{0}, T)$ , dla którego $S = S_{1} \times 𝒫 (S_{2}), s_{0} = (s_{0}^{1}, \emptyset)$ oraz dla dowolnego stanu $(s_{1}, S'_{2}) \in S$ i litery $a \in A$ funkcja przejść określona jest następująco:

f ((s_{1}, S'_{2}), a) = {\begin{cases} (f_{1} (s_{1}, a), f_{2} (S'_{2}, a)) & gdy f_{1} (s_{1}, a) \notin T_{1}, \\ (f_{1} (s_{1}, a), f_{2} (S'_{2}, a) \cup {{s_{0}}^{2}}) & gdy f_{1} (s_{1}, a) \in T_{1}, \end{cases}

a zbiorem stanów końcowych jest

T = S_{1} \times {S^{'} \in 𝒫 (S_{2}) : S^{'} \cap T_{2} \neq \emptyset} .

5. Załóżmy, że język $L$ rozpoznaje automat $𝒜 = (S, f, s_{0}, T)$ . Określimy automat niedeterministyczny, który będzie rozpoznawał gwiazdkę Kleene języka $L$ , czyli $L^{*} .$ Automat niedeterministyczny $𝒜^{'} = (S, f^{'}, {s_{0}}, T)$ , w którym

f^{'} (s, a) = {\begin{cases} {f (s, a)} & gdy f (s, a) \notin T, \\ {f (s, a), s_{0}} & gdy f (s, a) \in T \end{cases}

rozpoznaje język język $L^{+} .$ Dowód tego faktu jest indukcyjny i pozostawiamy go na ćwiczenia. Zauważmy teraz, że język ${1}$ rozpoznaje automat

RYSUNEK ja-lekcja7-w-rys2

Ponieważ $L^{*} = L^{+} \cup {1}$ , to korzystając z udowodnionej już zamkniętości języków rozpoznawanych ze względu na sumę mnogościową, stwierdzamy, że istnieje automat rozpoznający język $L^{*}$ .

Zatem dowód inkluzji $ℛ ℰ 𝒢 (A^{*}) \subseteq ℛ ℰ 𝒞 (A^{*})$ jest zakończony.

{ Przejdziemy teraz do dowodu inkluzji $ℛ ℰ 𝒢 (A^{*}) \supseteq ℛ ℰ C (A^{*})$ . }

Niech $L$ oznacza dowolny język rozpoznawany przez automat $𝒜 = (S, f, s_{0}, T) .$ Dowód polega na rozbiciu języka $L$ na fragmenty, dla których stwierdzenie, że są to języki regularne będzie dość oczywiste. Natomiast sam język $L$ będzie wynikiem operacji regularnych określonych na tych właśnie fragmentach. Poniżej przeprowadzamy defragmentację języka $L .$

Dla $s, t \in S$ niech

L (s, t) = {w \in A^{*} : f (s, w) = t} .

Jest to język złożony ze słów, które przeprowadzają stan $s$ automatu $𝒜$ w stan $t$ . Ogół liter alfabetu $A$ przeprowadzających stan $s$ w $t$ oznaczymy przez

A (s, t) = {a \in A : f (s, a) = t} .

Dla stanów $s, t \in S$ i zbioru $S_{1} \subseteq S$ niech

L (s, S_{1}, t) = {w \in A^{*} : f (s, w) = t, f (s, w_{1}) \in S_{1} : w = w_{1} v, w_{1}, v \in A^{*}} .

Jest to język, który można przedstawić graficznie następująco:

RYSUNEK ja-lekcja7-w-rys3

Na koniec przyjmijmy

\overline{L} (s, S_{2}, t) = {w \in A^{*} : f (s, w) = t, f (s, w_{1}) \in S_{2} : w = w_{1} v, w_{1}, v \in A^{+}},

określony dla $S_{2} \subseteq S$ i $s, t \in S - S_{2}$

Język ten jest graficznie interpretowany poniżej.

RYSUNEK ja-lekcja7-w-rys4

Wprost z określeń wynika, że wszystkie wprowadzone powyżej języki są regularne, czyli należą do rodziny $ℛ ℰ 𝒢 (A^{*})$ . Dowód tego faktu przebiega indukcyjnie ze względu na liczbę elementów zbiorów $S_{1}$ i $S_{2}$ . Szczegóły tego dowodu pominiemy. Natomiast warto wskazać rolę, jaką spełniają w dowodzie wprowadzone wyżej języki. A mianowicie:

L (s, {s}, s) = A (s, s)^{*}

,

\overline{L} (s, {r}, t) = A (s, r) A (r, r)^{*} A (r, t)

,

Parser nie mógł rozpoznać (nieznana funkcja „\Large”): {\displaystyle \displaystyle L(s,S_1,t) = \overline{L}(s,S_1 \setminus \{s\},s)^*\; {\Large [}\bigcup_{r \in S_1 \setminus \{s\}}A(s,r)L(r,S_1 - \{s\},t)\;{\Large ]}.}

Tę ostatnią równość przedstawia poniższy rysunek.

RYSUNEK ja-lekcja7-w-rys5

\overline{L} (s, S_{2}, t) = ⋃_{r, r^{'} \in S_{2}} A (s, r) L (r, S_{2}, r^{'}) A (r^{'}, t),

co graficznie można przedstawić następująco:

RYSUNEK ja-lekcja7-w-rys6

Dochodzimy więc do konkluzji, iż jezyki $L (s, S_{1}, t)$ oraz $\overline{L} (s, S_{2}, t)$ są regularne. W szczególności zatem regularny jest język $L (s_{0}, S, t) = L (s_{0}, t)$ .

Język $L$ możemy przedstawić w następującej postaci:

L = ⋃_{t \in T} {w \in A^{*} : f (s_{0}, w) = t} = ⋃_{t \in T} L (s_{0}, t),

co w połączeniu z ustaleniami punktu 3 z poprzedniej części dowodu uzasadnia tezę, że

język

L

należy do rodziny

ℛ ℰ 𝒢 (A^{*}) . ♢

Własności języków regularnych i gramatyk regularnych

W tej części wykładu omówimy własności rodziny języków i gramatyk regularnych, czyli typu (3) w hierarchii Chomsky'ego. Ustalimy też związek pomiędzy językami a gramatykami regularnymi. Zbadamy zamkniętość rodziny języków regularnych ze względu na operacje mnogościowe, czyli ze względu na sumę, przecięcie, różnicę i uzupełnienie. Rozpoczniemy jednak tę część wykładu od wprowadzenia jednoargumentowego działania na słowach zwanego odbiciem zwierciadlanym.

Definicja

Odbiciem zwierciadlanym słowa $w = a_{1} \dots a_{n} \in A^{*}$ nazywamy słowo $\overset{\leftarrow}{w} = a_{n} \dots a_{1}$ . Odbiciem zwierciadlanym języka $L \subset A^{*}$ nazywamy język $\overset{\leftarrow}{L} = {\overset{\leftarrow}{w} \in A^{*} : w \in L} .$

Twierdzenie

Rodzina $ℛ ℰ 𝒢 (A^{*}) = ℛ ℰ 𝒞 (A^{*})$ jest zamknięta ze względu na:

sumę mnogościową, przecięcie, różnicę i uzupełnienie,
katenację i operację iteracji `{} $*$ `{},
obraz homomorficzny,
podstawienie regularne,
przeciwobraz homomorficzny,
odbicie zwierciadlane.

Dowód

{}

Uzupelnic uw:bool|. Zamkniętość rodziny języków $ℛ ℰ 𝒢 (A^{*})$ ze względu na sumę mnogościową wynika z twierdzenia Kleene'ego. Automat akceptujący iloczyn języków otrzymujemy, zmieniając odpowiednio zbiór stanów końcowych w automacie rozpoznającym sumę. Bowiem pozostając przy oznaczeniach punktu 3 z dowodu twierdzenia Kleene'ego, automat $𝒜 = (S, f, s_{0}, F),$ gdzie $F = T_{1} \times T_{2}$ , rozpoznaje język $L_{1} \cap L_{2} .$ Jeśli automat $𝒜 = (S, f, s_{0}, T)$ akceptuje język $L$ , to automat $\overline{𝒜} = (S, f, s_{0}, S ∖ T)$ akceptuje język $\overline{L} = A^{*} ∖ L .$ Ostatnia własność implikuje zamkniętość ze względu na uzupełnienie.

Uzupelnic uw:kat|. Z twierdzenia Kleene'ego, punkt 4 i 5, wynika zamkniętość ze względu na katenację i operację iteracji `{} $*$ `{}.

Uzupelnic uw:hom|. Niech $h : A^{*} ⟶ B^{*}$ będzie homomorfizmem. Dowód implikacji

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L\in \mathcal{REG}(A^{*})\Longrightarrow \: h(L)\in \mathcal{REG}(B^{*})}

przeprowadzimy zgodnie ze strukturą definicji rodziny języków regularnych. Dla $L = \emptyset$ i dla $L = {a}$ , gdzie $a$ jest dowolną literą alfabetu $A$ , implikacja jest oczywista. W pierwszym przypadku obrazem homomorficznym jest język pusty, a w drugim język ${w}$ , gdzie $w$ jest pewnym słowem nad alfabetem $B$ . Dla dowolnych języków regularnych $X, Y \in ℛ ℰ 𝒢 (A^{*})$ prawdziwe są równości:

$h (X \cup Y) = h (X) \cup h (Y) \in ℛ ℰ 𝒢 (B^{*})$ ,
$h (X \cdot Y) = h (X) \cdot h (Y) \in ℛ ℰ 𝒢 (B^{*})$ ,
$h (X^{*}) = h (⋃_{n = 0}^{\infty} X^{n}) = ⋃_{n = 0}^{\infty} (h (X))^{n} = (h (X))^{*} \in ℛ ℰ 𝒢 (B^{*}),$

co kończy dowód tego punktu.

Uzupelnic uw:podst|. Uzasadnienie jest podobne jak dla homomorfizmu. Jedyna różnica tkwi w tym, że dla podstawienia regularnego $s : A^{*} ⟶ 𝒫 (B^{*})$ i dla dowolnej litery $a \in A$ wartość podstawienia na literze jest pewnym językiem regularnym $s (a) = L \in ℛ ℰ 𝒢 (B^{*})$ , a nie słowem jak w przypadku homomorfizmu.

Uzupelnic uw:przec|. Niech $h : A^{*} ⟶ B^{*}$ będzie homomorfizmem. Aby udowodnić implikację

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L\in \mathcal{REG}(B^{*})\Longrightarrow \: h^{-1}(L)\in \mathcal{REG}(A^{*})}

, odwołamy się do własności, że dla języka $L \in ℛ ℰ 𝒢 (B^{*})$ istnieje skończony monoid $M$ i homomorfizm $φ : B^{*} ⟶ M$ taki, że $L = φ^{- 1} (φ (L)) .$ Dla homomorfizmu $φ \circ h : A^{*} ⟶ M$ mamy

równość:

((φ \circ h)^{- 1} \circ (φ \circ h)) (h^{- 1} (L)) = h^{- 1} (L) .

Korzystając teraz z punktu Uzupelnic 4| twierdzenia Uzupelnic ja-lekcja3-w tw2.1|, wnioskujemy, że $h^{- 1} (L) \in ℛ ℰ 𝒢 (A^{*})$ .

Uzupelnic uw:odb|. Wykorzystamy tutaj zapis języka regularnego przez wyrażenie regularne. Niech dla języka $L \in ℛ ℰ 𝒢 (A^{*})$ wyrażenie regularne $α \in 𝒲 ℛ$ będzie takie, że $L = ∣ α ∣$ . Wtedy język $\overset{\leftarrow}{L}$ jest opisany przez wyrażenie regularne $\overset{\leftarrow}{α}$ , które uzyskujemy z $α$ przez odbicie zwierciadlane, a dokładniej odwrócenie kolejności katenacji w każdej sekwencji tego działania występującej w wyrażeniu regularnym.

♢

W wykładzie drugim wprowadziliśmy pojęcie gramatyki. Wracamy do tego pojęcia, a w szczególności do gramatyki typu (3), czyli regularnej. Przypomnijmy, że produkcje takiej gramatyki $G = (V_{N}, V_{T}, v_{0}, P)$ mają postać:

v \to v^{'} x l u b v \to x,

gdzie $v, v^{'} \in V_{N}, x \in {V_{T}}^{*}$ . Gramatykę typu (3), nazywamy inaczej lewostronną lub lewoliniową. Określa się też gramatykę regularną prawostronną (prawoliniową). Jest to gramatyka $G = (V_{N}, V_{T}, v_{0}, P)$ , której produkcje są postaci:

v \to x v^{'} l u b v \to x,

gdzie $v, v^{'} \in V_{N}, x \in {V_{T}}^{*}$ . Jeśli język $L = L (G)$ jest generowany przez gramatykę typu (3) (lewoliniową), to jego odbiciem zwierciadlanym jest $\overset{\leftarrow}{L} = L (\overset{\leftarrow}{G})$ , gdzie $\overset{\leftarrow}{G}$ jest gramatyką prawoliniową, którą uzyskuje się z gramatyki $G$ przez odbicie zwierciadlane prawych stron produkcji. Oznacza to, iż zmieniamy produkcje według następujących zasad:

v \to v^{'} x

zastępujemy przez

v \to \overset{\leftarrow}{x} v^{'},

v \to x

zastępujemy przez

v \to \overset{\leftarrow}{x} .

Oczywiście, jeśli $L$ jest językiem generowanym przez gramatykę prawoliniową, to $\overset{\leftarrow}{L}$ jest generowany przez odpowiednią gramatykę lewoliniową.

Podamy teraz charakterystykę rodziny języków regularnych $ℛ ℰ 𝒢 (A^{*})$ przez rodzinę gramatyk prawoliniowych.

Twierdzenie

Niech $L \subset A^{*}$ . Język $L \in ℛ ℰ 𝒢 (A^{*})$ wtedy i tylko wtedy, gdy $L = L (G)$ dla pewnej gramatyki prawoliniowej $G$ .

Dowód

Załóżmy, że automat $𝒜 = (S, A, f, s_{0}, T)$ rozpoznaje język $L$ . Definiujemy gramatykę $G = (V_{N}, V_{T}, v_{0}, P)$ przyjmując $V_{N} = S, V_{T} = A, v_{0} = s_{0}$ oraz określając w następujący sposób zbiór produkcji

P = {s \to a f (s, a) : s \in S, a \in A} \cup {s \to 1 : s \in T} .

Dla dowolnego stanu $s \in S$ i słowa $w \in A^{+}$ prawdziwa jest równoważność

s_{0} \mapsto^{*} w s ⟺ f (s_{0}, w) = s .

Dowód przeprowadzimy indukcyjnie ze względu na długość słowa $w$ . Niech $w = a,$ dla pewnego $a \in A$ . Z definicji zbioru produkcji $P$ wynika równoważność

s_{0} \to a s ⟺ s = f (s_{0}, a) .

Rozważmy teraz $w = a_{1} \dots a_{n}$ oraz $s_{0} \mapsto^{*} w s$ . Z założenia indukcyjnego

wynika, że

f (s_{0}, a_{1} \dots a_{n - 1}) = s^{'} ⟺ s_{0} \mapsto^{*} a_{1} \dots a_{n - 1} s^{'}

oraz, że $s = f (s^{'}, a_{n})$ wtedy i tylko wtedy, gdy $s^{'} \mapsto a_{n} s .$ A więc fakt, że $s = f (s_{0}, w) = f (s_{0}, a_{1} \dots a_{n}) = f (f (s_{0}, a_{1} \dots a_{n - 1}), a_{n})$ jest równoważny temu, że $s^{'} = f (s_{0}, a_{1} \dots a_{n - 1}) \mapsto a_{n} s$ . A to z kolei równoważne jest

s_{0} \mapsto^{*} a_{1} \dots a_{n - 1} s^{'}, s^{'} \mapsto a_{n} s

i ostatecznie równoważne faktowi, że $s_{0} \mapsto^{*} a_{1} \dots a_{n - 1} a_{n} s$ . A zatem dowodzona równoważność jest prawdziwa dla $w \in A^{+}$ , ponieważ

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle w\in L(\mathcal{A})\: \Longleftrightarrow \: s=f(s_{0},w)\in T\: \Longleftrightarrow \: s_{o}\mapsto ^{*}ws,\, s\rightarrow 1\in P\: \Longleftrightarrow \: w\in L(G).}

Dla $w = 1$ mamy Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle 1\in L(\mathcal{A})\: \Longleftrightarrow \: s_{0}\rightarrow 1\in P\: \Longleftrightarrow \: 1\in L(G), } co kończy dowód w jedną stronę.

Rozważmy teraz język $L = L (G)$ generowany przez pewna gramatykę prawoliniową $G = (V_{N}, V_{T}, v_{0}, P)$ . Skonstruujemy gramatykę równoważną $G$ i taką, w której wszystkie produkcje są postaci $v \to a v^{'}$ lub $v \to 1$ , gdzie $v, v^{'} \in V_{N}, a \in A$ . Będziemy zamieniać produkcje występujące w gramatyce $G$ na inne, o żądanej postaci, zgodnie z następująmi zasadami:

1. Produkcje typu $v \to v^{'}$ , gdzie $v, v^{'} \in V_{N}$

Z symbolem nieterminalnym $v \in V_{N}$ kojarzymy określony poniżej zbiór

V_{N} (v) = {v^{'} \in V_{N} : v \to v_{1} \to \dots \to v_{n} \to v^{'} w G}

oraz zbiór produkcji

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle P(v) = \{ v \rightarrow xv" \; : \; x \neq 1 , \; \exists v' \in V_N(v) , v' \rightarrow xv" \in P \} \cup}

\cup {v \to x : \exists v^{'} \in V_{N} (v), v^{'} \to x \in P} .

Dla każdego takiego symbolu $v \in V_{N}$ usuwamy ze zbioru $P$ wszystkie produkcje $v \to v^{'}$ i wprowadzamy na to miejsce wszystkie produkcje ze zbioru $P (v)$ .

2. Produkcje typu $v \to x$ dla $x \neq 1$ .

Jeśli produkcja taka występuje w $P$ i $x \neq 1$ , to do alfabetu nieterminalnego $V_{N}$ dodajemy nowy symbol $v_{x}$ . Następnie ze zbioru $P$ usuwamy powyższą produkcję i dodajemy dwie nowe:

v \to x v_{x}, v_{x} \to 1 .

Zauważmy, że jeśli $x \neq y$ , to $v_{x} \neq v_{y}$ .

3. Produkcje typu $v \to x v^{'}$ dla $∣ x ∣ > 1 .$

Jeśli $v \to a_{1} \dots a_{n} v^{'} \in P$ , przy czym $n \geq 2$ , to do alfabetu nieterminalnego $V_{N}$ dodajemy nowe symbole $v_{1}, \dots v_{n}$ , produkcję $v \to a_{1} \dots a_{n} v^{'}$ usuwamy ze zbioru $P$ i

dodajemy produkcje:

v \to a_{1} v_{1}, v_{1} \to a_{2} v_{2}, \dots, v_{n - 1} \to a_{n} v^{'} .

Po opisanych powyżej trzech modyfikacjach gramatyki $G$ generowany język, co łatwo zauważyć, nie ulega zmianie. Zatem skonstruowana gramatyka jest równoważna wyjściowej. Dla otrzymanej gramatyki określamy teraz automat niedeterministyczny $𝒜 = (S, A, f, {s_{0}}, T)$ , przyjmując $S = V_{N}$ , $A = V_{T}$ oraz $s_{0} = v_{0}$ i definiując następująco funkcję przejść: $f (v, a) = {v^{'} \in V_{N} : v \to a v^{'} \in P} .$ Przjmując $T = {v \in V_{N} : v \to 1 \in P}$ jako zbiór stanów końcowych, stwierdzamy, że automat $𝒜$ rozpoznaje język

Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle L(\mathcal{A})=\{w\in V_{T}^{*}\: :\: f(s_{0})\cap T\neq \emptyset \}=L. }

Uzyskany rezultat, w świetle równości $ℛ ℰ 𝒢 (A^{*}) = ℛ ℰ C (A^{*})$ , kończy dowód twierdzenia.

♢

Algorytmiczną stroną równoważności udowodnionej w powyższym twierdzeniu zajmiemy się w następnym wykładzie. Przykłady ilustrujące twierdzenie zamieszczamy poniżej.

Przykład

Niech $𝒜 = (S, A, f, s_{0}, T)$ będzie automatem takim, że

$S = {s_{0}, s_{1}, s_{2}}, A = {a, b}, T = {s_{1}}$ , a graf przejść wygląda następująco:

RYSUNEK ja-lekcja7-w-rys7

Gramatyka $G = (S, A, s_{0}, P)$ , gdzie

P = {s_{0} \to a s_{1}, s_{0} \to b s_{2}, s_{1} \to a s_{2}, s_{1} \to b s_{0}, s_{1} \to 1, s_{2} \to a s_{0}, s_{2} \to b s_{1}}

akceptuje język $L (𝒜)$ .

Zauważmy, że język

L (𝒜) = L (G) = {w \in A^{*} : #_{a} w - #_{b} w = 1 m o d 3} .

Niech $G = ({v_{0}, v_{1}}, {a, b}, v_{0}, P)$ , gdzie

P = {v_{0} \to a v_{0}, v_{0} \to a b, v_{0} \to b v_{1}, v_{1} \to 1} .

Gramatykę $G$ przekształcamy w równoważną gramatykę

G^{'} = ({v_{0}, v_{1}, v_{2}, v_{b}}, {a, b}, v_{0}, P^{'}),

gdzie

P^{'} = {v_{0} \to a v_{0}, v_{0} \to a v_{2}, v_{0} \to b v_{1}, v_{2} \to b v_{b}, v_{1} \to 1, v_{b} \to 1} .

Niedeterministyczny automat $𝒜_{N D} = ({v_{0}, v_{1}, v_{2}, v_{b}}, {a, b}, f, v_{0}, {v_{1}, v_{b}})$ , gdzie graf przejśc wygląda następująco:

RYSUNEK ja-lekcja7-w-rys8

L (G) = L (𝒜_{N D}) = a^{*} b

Wykorzystując udowodnione do tej pory własności rodziny języków generowanych przez gramatyki regularne, uzasadnimy teraz, iż ta właśnie rodzina, czyli ogół języków typu (3) w hierarchii Chomsky'ego pokrywa się z rodziną $ℛ ℰ 𝒢 (A^{*})$ .

Twierdzenie

Dla dowolnego alfabetu $A$ rodziny języków regularnych $A^{*}$ oraz języków generowanych przez gramatyki regularne są równe, czyli $ℛ ℰ 𝒢 (A^{*}) = ℒ_{3}$ .

Dowód

Odbicie zwierciadlane dowolnego języka $L \in ℛ ℰ 𝒢 (A^{*})$ , czyli język $\overset{\leftarrow}{L}$ należy również do rodziny $ℛ ℰ 𝒢 (A^{*})$ , co oznacza, że $\overset{\leftarrow}{L} \in ℛ ℰ C (A^{*})$ . Na podstawie twierdzenia Uzupelnic twprawlin| istnieje więc gramatyka prawoliniowa $G$ taka, że $\overset{\leftarrow}{L} = L (G)$ . A stąd wniosek, że $L = \overset{\leftarrow}{\overset{\leftarrow}{L}} = L (\overline{G})$ dla pewnej gramatyki $\overline{G}$ typu (3). Zatem $L \in ℒ_{3}$ .

Rozważmy teraz język $L$ typu (3), czyli $L = L (G)$ dla pewnej gramatyki regularnej. A więc $\overset{\leftarrow}{L} = L (\overline{G})$ dla pewnej gramatyki prawoliniowej i $\overset{\leftarrow}{L} \in ℛ ℰ C (A^{*})$ . Z twierdzenia Kleene'ego wynika, że $\overset{\leftarrow}{L} \in ℛ ℰ 𝒢 (A^{*})$ i ostatecznie $L = \overset{\leftarrow}{\overset{\leftarrow}{L}} \in ℛ ℰ 𝒢 (A^{*})$ , co kończy dowód twierdzenia.

♢

Zamkniemy rozważania następującą konkluzją podsumowującą główne rezultaty tego wykładu.

Dla dowolnego skończonego alfabetu $A$ prawdziwe są równości:

ℛ ℰ 𝒢 (A^{*}) = ℛ ℰ 𝒞 (A^{*}) = ℒ_{3}

, czyli wprowadzone pojęcia rodziny języków regularnych, rozpoznawalnych oraz generowanych przez gramatyki typu (3) są tożsame.

@@ Linia 77: / Linia 77: @@
 w którym
-<center><math>\displaystyle f'(s,a) = \left\{ \begin{array} {ll} \{ f(s,a)\} &  </math> gdy <math>\displaystyle f(s,a) \notin T\displaystyle  ,\\
+<center><math>\displaystyle f'(s,a) = \left\{ \begin{array} {ll} \{ f(s,a)\} &  \textrm{gdy} \displaystyle f(s,a) \notin T\displaystyle  ,\\
-\{ f(s,a),s_0 \} &  </math> gdy <math>\displaystyle f(s,a) \in T\displaystyle   \end{array}  \right. </math></center>
+\{ f(s,a),s_0 \} &  \textrm{gdy} \displaystyle f(s,a) \in T\displaystyle   \end{array}  \right. </math></center>
 rozpoznaje język  język <math>\displaystyle L^+.</math>   Dowód tego faktu jest indukcyjny i pozostawiamy go na

Języki, automaty i obliczenia/Wykład 7: Twierdzenie Kleene'ego. Własności języków i gramatyk regularnych: Różnice pomiędzy wersjami

Wersja z 18:04, 22 sie 2006

Twierdzenie Kleene

Własności języków regularnych i gramatyk regularnych

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia