Test GR3

Wyrażenia regularne

Definicja 1.1

Niech $A$ będzie skończonym alfabetem. Rodzina $ℛ ℰ 𝒢 (A^{*})$ języków regularnych nad alfabetem $A$ to najmniejsza, w sensie inkluzji, rodzina $ℛ$ języków zawartych w $A^{*}$ taka, że:

(1)

\emptyset \in ℛ

,

\forall a \in A {a} \in ℛ

(2) jeśli

X, Y \in ℛ

, to

X \cup Y, X \cdot Y \in ℛ

(3) jeśli

X \in ℛ

, to

X^{*} = ⋃_{n = 0}^{\infty} X^{n} \in ℛ

Wprost z definicji wynika, że ${1} = \emptyset^{*} \in ℛ$ oraz że dla dowolnego języka regularnego zachodzi równość $X \in ℛ$ jest

X^{+} = ⋃_{n = 1}^{\infty} X^{n} = X \cdot X^{*} \in ℛ .

Wprowadzona w ten sposób definicja rodziny języków regularnych wymaga uzasadnienia faktu, iż definiowany obiekt, definiowana rodzina, istnieje. Zauważmy więc, że warunki 1-3 definicji 1.1 spełnia na przykład rodzina $𝒫 (A^{*})$ wszystkich podzbiorów $A^{*}$ , a zatem klasa takich rodzin nie jest pusta. Ponadto łatwo możemy stwierdzić, że jeśli rodziny Parser nie mógł rozpoznać (błąd składni): {\displaystyle \mathcal{R}_{1},\: \mathcal{R}_{2} } spełniają warunki 1-3 powyższej definicji, to rodzina $ℛ_{1} \cap ℛ_{2}$ również spełnia te warunki. Stąd możemy wyprowadzić wniosek, że najmniejsza rodzina spełniającą te warunki, to przecięcie

ℛ ℰ 𝒢 (A^{*}) = ⋂ ℛ,

po wszystkich rodzinach $ℛ$ spełniających warunki 1-3 definicji 1.1. Zauważmy, że w świetle powyższej definicji fakt, że $X \in ℛ ℰ 𝒢 (A^{*})$ oznacza, że $X$ można uzyskać z liter alfabetu i zbioru pustego $\emptyset$ poprzez zastosowanie wobec tych "elementarnych klocków" skończonej liczby działań: sumy, katenacji i gwiazdkowania. Na odwrót, każdy zbiór otrzymany w ten sposób jest elementem rodziny $ℛ ℰ 𝒢 (A^{*})$ . Ta obserwacja prowadzi do pojęcia wyrażeń regularnych, formalnego zapisu języków regularnych.

Definicja 1.2

Niech $A$ będzie alfabetem, a zbiór ${+, ⋆, \emptyset, (,)}$ alfabetem rozłącznym z $A$ . Słowo $α \in (A \cup {+, ⋆, \emptyset, (,)})^{*}$ jest wyrażeniem regularnym nad alfabetem $A$ wtedy i tylko wtedy, jeśli:

(1)

α = \emptyset

(2)

α = a \in A (α

jest literą)

(3)

α

jest w postaci

(β + γ), (β γ), γ^{*}

, gdzie

β, γ

są wyrażeniami regularnymi nad alfabetem

A

.

Przyjmujemy oznaczenia:

\emptyset^{*} = 1 oraz α^{*} α = α^{+} .

Rodzinę wyrażeń regularnych nad alfabetem $A$ oznaczamy symbolem $𝒲 ℛ$ . Łatwo zauważyć związek pomiędzy wyrażeniami regularnymi oraz wprowadzoną wcześniej rodziną $ℛ ℰ 𝒢 (A^{*})$ , regularnych języków wolnego monoidu $A^{*}$ . Związek ten ustala poniższa definicja. Definicja 1.3

Wartościowaniem wyrażenia regularnego nazywamy odwzorowanie

Parser nie mógł rozpoznać (błąd składni): {\displaystyle |\: \: |:\mathcal{WR}\longrightarrow \mathcal{P}(A^{*})}

określone następująco:

(1)

∣ \emptyset ∣ = \emptyset

(2)

∣ a ∣ = {a}

(3)

∣ (α + β) ∣ = ∣ α ∣ \cup ∣ β ∣

$∣ (α β) ∣ = ∣ α ∣ \cdot ∣ β ∣$

$∣ α^{*} ∣ = ∣ α ∣^{*}$

Odwzorowanie określające wartość wyrażenia regularnego nie jest, jak można zauważyć, iniekcją. Oznacza to, że różne wyrażenia regularne mogą mieć tę samą wartość, czyli określać ten sam język regularny. Prostym przykładem tego faktu są wyrażenia regularne $a^{*}$ oraz $(a^{*})^{*}$ . Zwróćmy uwagę na wartość wyrażenia regularnego oznaczonego symbolem $1$ .

Jest mianowicie

∣ 1 ∣ = ∣ \emptyset^{*} ∣ = ∣ \emptyset ∣^{*} = \emptyset^{*} = {1}

Wprowadza się następującą relację równoważności w rodzinie wyrażeń regularnych.

Definicja 1.4

Wyrażenia regularne $α, β$ nazywamy równoważnymi i oznaczamy $α = β$ , jeśli $∣ α ∣ = ∣ β ∣$ .

Problem równoważności wyrażeń regularnych jest rozstrzygalny i jest PSPACE-zupełny. Wrócimy do tego problemu w kolejnych wykładach.

Oto przykłady równoważnych wyrażeń regularnych

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned\alpha_1 + \alpha_2 & = & \alpha_2+ \alpha_1\\ (\alpha_1 + \alpha_2) +\alpha_3 & = & \alpha_1+ (\alpha_2 + \alpha_3) \\ (\alpha_1 \alpha_2) \alpha_3 & = & \alpha_1 (\alpha_2 \alpha_3) \\ (\alpha_1 + \alpha_2) \alpha_3 & = & \alpha_1\alpha_3 + \alpha_2 \alpha_3 \\ \alpha_1 ( \alpha_2 +\alpha_3) & = & \alpha_1 \alpha_2 + \alpha_1 \alpha_3 \\ (\alpha^*)^* & = & \alpha^*\\ (\alpha^*_1 \alpha^*_2)^* & = & (\alpha_1 + \alpha_2)^*\\ (\alpha^+ + 1) & = & \alpha^* \endaligned}

gdzie $α, α_{1}, α_{2}, α_{3} \in 𝒲 ℛ$ .

Wprost z definicji wyrażenia regularnego wynika następujaca równoważność:

Fakt 1.1

$L \in ℛ ℰ 𝒢 (A^{*}) ⟺ L = ∣ α ∣$ dla pewnego $α \in 𝒲 ℛ$ .

Wyrażenia regularne dają bardzo wygodne narzędzie zapisu języków należących do rodziny $ℛ ℰ 𝒢 (A^{*})$ . Np. język nad alfabetem ${a, b}$ złożony ze wszystkich słów zaczynających się lub kończących na literę $a$ zapisujemy jako $a (a + b)^{*} + (a + b)^{*} a$ .
Z kolei wyrażenie regularne $a^{+} b^{+}$ oznacza język $L = {a^{n} b^{m} : n, m \geq 1}$ . Dla dalszego uproszczenia zapisu przyjmiemy w naszym wykładzie następującą umowę. Jeśli język $L$ jest wartością wyrażenia regularnego $α$ , czyli $L = ∣ α ∣$ , to będziemy zapisywać ten fakt jako $L = α$ . Będziemy zatem mówić w dalszym ciągu wykładu o języku $α$ . Z tych samych powodów, dla dowolnego alfabetu $A = {a_{1}, . . . . ., a_{n}}$ będziemy używać zapisu $A$ w miejsce $a_{1} + . . . . . + a_{n}$ .

Zauważmy na koniec rozważań o wyrażeniach regularnych, że dość prosty w zapisie język $L = {a^{n} b^{n} : n \geq 1}$ nie należy do rodziny $ℛ ℰ 𝒢 (A^{*})$ i nie można go zapisać przy pomocy wyrażeń regularnych.

Uwaga [Dla dociekliwych]

Kończąc ten fragment wykładu poświęcony wyrażeniom regularnym warto wspomnieć o problemie "star height", czyli głębokości zagnieżdżenia gwiazdki w wyrażeniu regularnym. Mając wyrażenia regularne

α, α_{1}, α_{2} \in 𝒲 ℛ

głębokość zagnieżdżenia gwiazdki definiuje się jako liczbę

s h (α)

równą

0

, gdy

α

jest literą z alfabetu lub zbiorem pustym, równą

m a x {i, j},

gdy

α = α_{1} \cup α_{2}

lub

α = α_{1} \cdot α_{2}

i

s h (α_{1}) = i

,

s h (α_{2}) = j

oraz równą

i + 1

dla

α = (α_{1})^{*}

. Głębokość zagnieżdżenia gwiazdki dla języka regularnego

L

określa się jako najmniejszą liczbę

s h (L) = s h (α)

, gdzie

α

jest wyrażeniem regularnym reprezentującym język

L

. Głębokość zagnieżdżenia gwiazdki jest więc jakby miarą złożoności pętli występujących w automacie rozpoznającym język

L

. Ustalono, że dla alfabetu złożonego z jednej litery głębokość zagnieżdżenia gwiazdki jest równa co najwyżej 1 oraz że dla alfabetu o co najmniej dwóch literach dla dowolnej liczby

k \in ℕ

można wskazać język regularny

L

taki, że

s h (L) = k

. Problemem otwartym pozostaje określenie algorytmu określającego głębokość zagnieżdżenia gwiazdki dla dowolnego języka w klasie języków regularnych.

Prawa kongruencja syntaktyczna i kongruencja syntaktyczna

Opis języka regularnego za pomocą wyrażeń regularnych jest bardzo wygodny, ale nie jedyny. W kolejnych wykładach będziemy wprowadzać inne reprezentacje języków regularnych, takie jak automaty czy gramatyki. Pojęcia, które wprowadzimy teraz są również narzędziami dla opisu i badań własności języków regularnych. W szczególności służą do konstrukcji możliwie najprostszego automatu rozpoznającego dany język regularny, zwanego automatem minimalnym.

Niech $L \subset A^{*}$ będzie dowolnym językiem. W monoidzie $A^{*}$ wprowadzamy następujące dwie relacje:

prawą kongruencję syntaktyczną $P_{L}^{r},$ przyjmując

dla dowolnych słów $u, v \in A^{*}$ {}

Parser nie mógł rozpoznać (błąd składni): {\displaystyle u \; P_L^r \; v \;\; \mbox{ wtedy i tylko wtedy, gdy spełniony jest warunek}}

\forall w \in A^{*} u w \in L \Leftrightarrow v w \in L,

kongruencję syntaktyczną $P_{L},$ przyjmując

dla dowolnych $u, v \in A^{*}$ {}

u P_{L} v wtedy i tylko wtedy, gdy spełniony jest warunek

\forall w_{1}, w_{2} \in A^{*} w_{1} u w_{2} \in L \Leftrightarrow w_{1} v w_{2} \in L .

Łatwo stwierdzić, że nazwy wprowadzonych relacji pokrywają się z ich własnościami, to znaczy relacja $P_{L}^{r},$ jest rzeczywiście prawą kongruencją, a $P_{L},$ kongruencją.

Ćwiczenie [Uzupelnij]

Niech $A = {a, b}$ będzie alfabetem.

Dla języka $L = a^{+} b^{+}$ relacja

1. $P_{L}^{r}$ ma $4$ klasy równoważności:

$L, A^{*} b a A^{*} + b^{+}, a^{+}, 1$

1. $P_{L}$ ma $5$ klas równoważności:

$L, A^{*} b a A^{*}, b^{+}, a^{+}, 1$

Dla języka $L = {a^{n} b^{n} : n \geq 1}$ obie relacje mają nieskończony indeks

1. dla $P_{L}^{r}$ klasami równoważności są zbiory

$L_{i} = {a^{n} b^{n - i} : n \geq i, n \geq 1}$ dla $i \in ℕ_{0}$ , $A^{*} ∖ ⋃_{i = 0}^{\infty} L_{i}$

1. dla $P_{L}$ klasami równoważności są zbiory

$L_{i} = {a^{n} b^{n - i} : n \geq i, n \geq 1}$ dla $i \in ℕ_{0}$ ,
$L'_{i} = {a^{n - i} b^{n} : n \geq i, n \geq 1}$ dla $i \in ℕ$
$A^{*} ∖ [⋃_{i = 1}^{\infty} (L_{i} \cup L'_{i}) \cup L_{0}]$

Udowodnimy następujące własności relacji $P_{L}^{r}$ oraz $P_{L}$ .

Prawa kongruencja syntaktyczna $P_{L}^{r}$ jest największą w sensie inkluzji spośród wszystkich

prawych kongruencji

ρ

takich, że

L = ⋃_{w \in L} [w]_{ρ}

Kongruencja syntaktyczna $P_{L}$ jest największą w sensie inkluzji spośród wszystkich

kongruencji

ρ

takich, że

L = ⋃_{w \in L} [w]_{ρ}

Dowód przeprowadzimy dla prawej kongruencji syntaktycznej. Uzasadnienie tezy dla kongruencji $P_{L}$ przebiega podobnie. Niech $ρ$ będzie dowolną prawą kongruencją spełniającą założenia i niech $u ρ v$ . Zatem dla każdego $w \in A^{*}$ jest

u w ρ v w \Rightarrow (u w \in L \Leftrightarrow v w \in L) \Leftrightarrow u P_{L}^{r} v .

W konsekwencji $ρ \subseteq P_{L}^{r} .$ W szczególności więc dla dowolnego $u \in A^{*}$ ma miejsce inkluzja $[u]_{ρ} \subseteq [u]_{P_{L}^{r}} .$ Zatem $L \subset ⋃_{w \in L} [w]_{P_{L}^{r}}$ . Aby udowodnić inkluzję w stronę przeciwną ustalmy dowolne $u \in L$ i niech $v \in [u]_{P_{L}^{r}} .$ Przyjmując $w = 1$ w definicji Uzupelnic d1| relacji $P_{L}^{r}$ otrzymamy równoważność $u \in L \Leftrightarrow v \in L .$ A więc $v \in L .$

$♢$

Jeśli język $L$ jest regularny, to relacja $P_{L}^{r}$ jest największą w sensie inkluzji spośród wszystkich prawych kongruencji takich, że język $L$ jest sumą jej pewnych klas równoważnosci a relacja $P_{L}$ jest największą w sensie inkluzji spośród wszystkich kongruencji spełniających analogiczny warunek. Obie relacje mają skończony indeks, czyli dzielą wolny monoid $A^{*}$ na skończoną liczbę klas równoważności.

dla dociekliwych - start ----

Pojęcie, które wprowadzimy teraz - monoid syntaktyczny języka - wiąże teorię języków formalnych, a w szczególności teorię języków rozpoznawalnych, z teorią półgrup. Związek ten stanowi podstawę dla bardziej zaawansowanych problemów teorii języków i automatów wykraczających poza ramy tego wykładu.

Niech $L \subset A^{*}$ będzie dowolnym językiem. Monoidem syntaktycznym języka $L$ nazywamy strukturę ilorazową

M (L) = A^{*} / P_{L} .

Dualnie, tworząc iloraz $S (L) = A^{+} / P_{L}$ wprowadza się pojęcie półgrupy syntaktycznej języka $L$ . Oba wprowadzone tu pojęcia zilustrowane bedą w trakcie dalszych rozważań.

dla dociekliwych - end ----

AUTOMAT MINIMALNY

Określenie języka rozpoznawalnego postuluje istnienie automatu o skończonej liczbie stanów działającego w odpowiedni sposób. Należałoby zatem wskazać algorytm budowy takiego automatu dla języka rozpoznawalnego. Oczywiście interesuje nas algorytm prowadzący do automatu o możliwie najprostszej postaci. Najprostsza postać, w tym kontekście, oznacza najmniejszą liczbę stanów.

Automat

𝒜

= (S,A,f,s_0,T) Parser nie mógł rozpoznać (błąd składni): {\displaystyle rozpoznający język } LParser nie mógł rozpoznać (błąd składni): {\displaystyle na\-zy\-wa\-my \textbf{automatem minimalnym}\index{automat minimalny}, jeśli posiada najmniejszą licz\-bę stanów spośród wszystkich automatów rozpoznają\-cych język } L. Parser nie mógł rozpoznać (nieznana funkcja „\enddefin”): {\displaystyle \enddefin Kwestią istnienia takiego automatu minimalnego zajmujemy się teraz. W kolejnym wykładzie przedstawimy algorytmy konstrukcji automatu minimalnego. W poniższym twierdzeniu występuje automat ilorazowy } {A}_{P^{r}_{L}} Parser nie mógł rozpoznać (błąd składni): {\displaystyle określony przez prawą kongruencję } P_L^rParser nie mógł rozpoznać (nieznana funkcja „\begintheor”): {\displaystyle . \begintheor Dla dowolnego automatu } {A}

= (S, A, f, s_{0}, T)

rozpoznającego

język $L \subset A^{*}$ istnieje jedyny epimorfizm $φ : 𝒜 ⟶ 𝒜_{P_{L}^{r}}$ taki, że $φ (s_{0}) = [1]_{P_{L}^{r}} .$

Prawa kongruencja automatowa $\sim_{𝒜}$ ma skończony indeks i $L = ⋃_{u \in L} [u]_{\sim_{𝒜}}$ . Zatem z twierdzenia Uzupelnic trr2| wynika, że

\sim_{𝒜} \subseteq P_{L}^{r} = \sim_{𝒜_{P_{L}^{r}}} .

Istnienie epimorfizmu $φ$ wynika z twierdzenia 1.1, wykład 3. Epimorfizm ten określony jest dla dowolnego stanu $s \in S$ równością $φ (s) = f^{*} ([1]_{P_{L}^{r}}, w) = [w]_{P_{L}^{r}},$ gdzie $w$ jest słowem takim, że $f (s_{0}, w) = s$ .

Jest to jedyny epimorfizm spełniający warunki tezy dowodzonego twierdzenia. Dla każdego epimorfizmu $ψ$ takiego, że $ψ : 𝒜 ⟶ 𝒜_{P_{L}^{r}}$ i $ψ (s_{0}) = [1]_{P_{L}^{r}}$

mamy

\forall s \in S

ψ (s) = ψ (f (s_{o}, w)) = f^{*} (ψ (s_{0}), w) = f^{*} ([1]_{P_{L}^{r}}, w) = [w]_{P_{L}^{r}},

gdzie $f (s_{0}, w) = s .$ Tak więc $ψ = φ . ♢$

Zatem udowodnione twierdzenie zapewnia nas o istnieniu automatu minimalnego, co formułujemy w następującym wniosku.

Niech $L \subset A^{*}$ będzie dowolnym językiem. Automat

𝒜_{P_{L}^{r}} = (A^{*} /_{P_{L}^{r}}, A, f^{*}, [1]_{P_{L}^{r}}, T),

gdzie $T = {[w]_{P_{L}^{r}} : w \in L},$ jest automatem minimalnym rozpoznającym język $L$ . Oznaczać go będziemy symbolem $𝒜_{L}$ .

dla dociekliwych - start ----

Następne twierdzenie charakteryzuje monoid przejść automatu minimalnego i podaje kolejny warunek równoważny na to, żeby język $L$ był rozpoznawany przez automat.

Niech $L \subset A^{*}$ będzie dowolnym językiem.{}{}

1. Dla dowolnego języka $L \in ℛ ℰ 𝒞 (A^{*})$ monoid przejść automatu minimalnego $𝒜_{L}$ jest izomorficzny z monoidem syntaktycznym $M (L)$ języka $L$ , czyli

M (𝒜_{L}) \sim M (L) .

{}{}

2. (tw. J.Myhill'a) Język $L \subset A^{*}$ jest rozpoznawalny wtedy i tylko wtedy, gdy $M (L)$ jest monoidem skończonym.

Dla dowodu punktu 1, wykażemy, że

P_{L} = K e r_{τ_{𝒜_{L}}},

gdzie zgodnie z definicją dla dowolnych $w, u \in A^{*}$

τ_{𝒜_{L}} (w) ([u]_{P_{L}^{r}}) = f^{*} ([u]_{P_{L}^{r}}, w) = [u w]_{P_{L}^{r}} .

\begin{array}{c} (u, w) \in K e r_{τ_{𝒜_{L}}} \Leftrightarrow \forall v \in A^{*} τ_{𝒜_{L}} (u) ([v]_{P_{L}^{r}}) = τ_{𝒜_{L}} (w) ([v]_{P_{L}^{r}}) \Leftrightarrow [v u]_{P_{L}^{r}} = [v w]_{P_{L}^{r}} \Leftrightarrow \\ \Leftrightarrow \forall v, z \in A^{*} v u z \in L \Leftrightarrow v w z \in L \Leftrightarrow [u]_{P_{L}} = [w]_{P_{L}} \Leftrightarrow (u, v) \in P_{L} \end{array}

Korzystamy teraz z twierdzenia o rozkładzie epimorfizmu, które w tym przypadku ma postać:

RYSUNEK ja-lekcja4-w-rys1.pdf

czyli $M (𝒜_{L}) \sim M (L)$ .
Dla dowodu punktu 2 załóżmy, że język $L$ jest rozpoznawalny. Zatem

L = ⋃_{w \in L} [w]_{ρ},

gdzie

ρ

jest kongruencją o skończonym indeksie.

Z twierdzenia Uzupelnic trr2| wnioskujemy, że $ρ \subseteq P_{L} .$ Oznacza to, że indeks relacji $P_{L}$ jest niewiększy od indeksu $ρ,$ a co za tym idzie, $M (L) = A^{*} / P_{L}$ jest monoidem skończonym.

Dla dowodu implikacji w stronę przeciwną rozważmy epimorfizm kanoniczny

k : A^{*} ⟶ A^{*} / P_{L} = M (L) .

Pokażemy, że spełnia on warunki z punktu 4 twierdzenia 1.2 z wykładu 3. $M (L)$ jest skończony, więc pozostaje do wykazania równość

L = k^{- 1} (k (L)) .

W tym celu wystarczy oczywiście udowodnić inkluzję

$k^{- 1} (k (L)) \subseteq L$ .

\begin{array}{c} v \in k^{- 1} (k (L)) \Rightarrow k (v) \in k (L) \Rightarrow \exists u \in L : k (v) = k (u) \in k (L) \Leftrightarrow \\ \Leftrightarrow \exists u \in L : [v]_{P_{L}} = [u]_{P_{L}} \Leftrightarrow \exists u \in L : v \in L \Leftrightarrow u \in L . \end{array}

Czyli $v \in L$ i $L = k^{- 1} (k (L))$ . $♢$

dla dociekliwych - end ----

Z twierdzenia Uzupelnic 3.1| wynika, że określenie klas abstrakcji prawej kongruencji syntaktycznej $P_{L}^{r}$ prowadzi do określenia minimalnego automatu rozpoznającego język $L$ . Prezentowane poniżej twierdzenia wskazują sposób konstrukcji prawej kongruencji syntaktycznej dla języka $L$ .

Niech $L \subset A^{*}$ będzie dowolnym językiem,
a $Θ_{L} \subset A^{*} \times A^{*}$ relacją równoważności o dwóch klasach równoważności $L$ i $A^{*} ∖ L$ . Przez $ρ_{i}$ dla $i \in ℕ$ oznaczmy zstępujący ciąg relacji określony następująco:

$ρ_{1} = Θ_{L},$ a dla $i = 2, . . .$ przyjmijmy

$ρ_{i} = {(u, w) \in A^{*} \times A^{*} : (u a, w a) \in ρ_{i - 1} \forall a \in A \cup {1}} .$

{ Wtedy $⋂ ρ_{i} = P_{L}^{r}$ . }

Na początku uzasadnimy, że $⋂ ρ_{i}$ jest prawą kongruencją na $A^{*}$ . Załóżmy więc, że słowa $x, y \in A^{*}$ są w relacji $x ⋂ ρ_{i} y$ . Wybierzmy dowolne słowo $z \in A^{*}$ i niech $k$ oznacza długość tego słowa. Z założenia wynika, iż $x ρ_{i + k} y$ , co w świetle definicji ciągu relacji $ρ_{i}$ implikuje, że Parser nie mógł rozpoznać (błąd składni): {\displaystyle xz\: \rho _{i}\: yz. } Ponieważ $i$ jest dowolne wnioskujemy ostatecznie, że $x z ⋂ ρ_{i} y z,$ co kończy dowód faktu, że $⋂ ρ_{i}$ jest prawą kongruencją.

Dowiedziemy teraz równości

⋂ ρ_{i} = P_{L}^{r} .

Dla uzasadnienia inkluzji $⋂ ρ_{i} \subseteq P_{L}^{r}$ zauważmy, że jeśli $x ⋂ ρ_{i} y,$ to dla dowolnego $z \in A^{*}$ mamy $x z ⋂ ρ_{i} y z$ , a w szczególności $x z ρ_{1} y z .$ Z definicji relacji $ρ_{1}$ dla dowolnego $z \in A^{*}$ prawdziwa

jest równoważność

x z \in L \Leftrightarrow y z \in L .

A więc $x P_{L}^{r} y$ . Inkluzję w stronę przeciwną pokażemy, dowodząc indukcyjnie ze względu na $i = 1, 2, . . .$ , że dla dowolnych $x, y \in A^{*}$ prawdziwa jest następująca implikacja

x P_{L}^{r} y ⟹ x ρ_{i} y .

Załóżmy zatem, że $x P_{L}^{r} y .$ Z definicji $P_{L}^{r}$ wynika, że dla dowolnego $z \in A^{*}$ prawdziwa jest równoważność

x z \in L \Leftrightarrow y z \in L .

Przyjmując

z = 1

otrzymujemy

żądaną własność dla $ρ_{1} .$ Załóżmy teraz, że prawdziwa jest implikacja

x P_{L}^{r} y ⟹ x ρ_{i} y .

dla $i = 1, . . ., n - 1$ oraz dla dowolnych $x, y \in A^{*} .$ Stąd, że $P_{L}^{r}$ jest prawą kongruencją, wnioskujemy, że dla dowolnego $a \in A \cup {1}$ spełniona jest relacja $x a P_{L}^{r} y a .$ Korzystając z założenia indukcyjnego mamy $x a ρ_{n - 1} y a$ dla dowolnego $a \in A \cup {1}$ . A to oznacza z definicji $ρ_{i}$ , że $x ρ_{n} y$ i kończy dowód.

$♢$

Kolejne twierdzenie charakteryzuje relację $P_{L}^{r}$ dla języka rozpoznawalnego i orzeka, iż w przypadku języka rozpoznawalnego ciąg relacji $ρ_{i}$ , aproksymujacych $P_{L}^{r}$ , jest skończony. Równoważność dwóch pierwszych warunków poniższego twierdzenia nazywana bywa często w literaturze twierdzeniem A.Nerode.

Następujące warunki są równoważne:

Język $L$ jest rozpoznawalny

Relacja $P_{L}^{r}$ ma skończony indeks

Ciąg relacji $ρ_{i}$ stabilizuje się, co oznacza, że istnieje $i \in ℕ$ takie, że $ρ_{i} = ρ_{i + 1} = . . . .$ Dla najmniejszego takiego $i$ prawdziwa jest równość $ρ_{i} = P_{L}^{r} .$

Dowód poprowadzimy według następujacego schematu:

{ Uzupelnic u1| $⟺$ Uzupelnic u2| $⟺$ Uzupelnic u3| }

Uzupelnic u1| $⟹$ Uzupelnic u2|

{ $P_{L}^{r}$ jest największą w sensie inkluzji relacją spełniająca warunki punktu 2 z twierdzenia 1.2, wykład 3. Z tego samego twierdzenia wynika skończoność indeksu. }

Uzupelnic u1| $⟸$ Uzupelnic u2|

Relacja $P_{L}^{r}$ jest prawą kongruencją, ma skończony indeks oraz

L = ⋃_{w \in L} [w]_{P_{L}^{r}} .

Z twierdzenia z twierdzenia 1.2, wykład 3 wynika więc, że język

L

jest rozpoznawalny.

Uzupelnic u2| $⟹$ Uzupelnic u3|

Dowód poprowadzimy nie wprost. Załóżmy więc, że dla każdego $i \in ℕ$ jest $ρ_{i} \neq ρ_{i + 1} .$ Oznacza to, że dla każdego $i \in ℕ$ indeksy relacji $ρ_{i}$ tworzą ciąg silnie rosnący, to znaczy spełniają zależność $i n d ρ_{i} < i n d ρ_{i + 1} .$ Ponieważ $i n d ρ_{1} = 2,$ to dla każdego $i \in ℕ$ prawdziwa jest nierówność $i n d ρ_{i} > i .$ A to prowadzi do wniosku, że dla dowolnego $i \in ℕ$

i n d P_{L}^{r} = i n d ⋂ ρ_{i} > i .

Zatem indeks relacji

P_{L}^{r}

jest nieskończony, co jest sprzeczne z założeniem.

Uzupelnic u2| $⟸$ Uzupelnic u3|

Udowodnimy indukcyjnie ze względu na $j$ , że każda z relacji $ρ_{j}$ dla $j = 1, . . ., i$ ma skończony indeks. Oczywiście $i n d ρ_{1} = 2 .$ Załóżmy teraz, że relacja $ρ_{j}$ ma skończony indeks. Z definicji relacji $ρ_{j + 1}$ wynika, że jej klasy równoważności powstają przez podział klas równoważności $[w]_{ρ_{j}}$ na skończoną liczbę klas relacji $ρ_{j + 1}$ (skończona jest liczba możliwych do spełnienia warunków prowadzących do podziału). Oznacza to, że indeks relacji $ρ_{j + 1}$ jest również skończony, a więc relacja $P_{L}^{r}$ ma również skończony indeks.

$♢$

Wykorzystamy powyżej udowodnione własności do konstrukcji automatu minimalnego rozpoznającego język $L$ . Warto zauważyc, iż punktem wyjścia dla tej konstrukcji jest język $L$ zadany, na przykład, poprzez wyrażenie regularne.

Ćwiczenie [Uzupelnij]

Niech do języka $L$ należą wszystkie słowa nad alfabetem $A = {a, b}^{*}$ zaczynające się lub kończące literą $a$ . Skonstruujemy minimalny automat akceptujący język $L$ .

$ρ_{1}$: $L = a A^{*} + A^{*} a, A^{*} ∖ L = b A^{*} b + b + 1$

$ρ_{2}$: $a A^{*} a + a, b A^{*} a, b A^{*} b + b + 1,$

$ρ_{3}$: $a A^{*} a + a, b A^{*} a, b A^{*} b + b, 1,$

Ponieważ $ρ_{3} = ρ_{4}$ , to $P_{L}^{r} = ρ_{3}$ i automat minimalny ma $4$ stany.
Przyjmujemy $s_{0} = [1]$ , $s_{1} = b A^{*} a$ , $s_{2} = a A^{*} a + a$ , $s_{3} = b A^{*} b + b$ oraz $T = {s_{1}, s_{2}}$ , a automat minimalny $𝒜_{L} = (A^{*} /_{ρ_{3}}, f^{*}, s_{0}, T)$ przedstawiony jest przy pomocy grafu:

RYSUNEK ja-lekcja4-w-rys2.JPG

Ćwiczenie [Uzupelnij]

Dla języka $L = {w \in {a, b}^{*} : #_{a} w = 2 k, #_{b} w = 2 l + 1, k, l \geq 0}$ określimy ciąg relacji $ρ_{i}$ , a następnie relację $P_{L}^{r}$ . Umożliwi nam to, w świetle powyższych rozważań, zbudowanie automatu minimalnego rozpoznającego ten język. Poniżej wypisane są klasy równoważności relacji $ρ_{1}$ oraz $ρ_{2}$ , $ρ_{3} = ρ_{2}$ , co kończy proces obliczania relacji $ρ_{i}$ i daje równość $ρ_{2} = P_{L}^{r}$ .

$ρ_{1}$: $L, A^{*} ∖ L$

$ρ_{2}$: $L, L_{1}, L_{2}, L_{3}$ , gdzie

$L_{1} = {w \in {a, b}^{*} : #_{a} w = 2 k, #_{b} w = 2 l, k, l \geq 0},$
$L_{2} {w \in {a, b}^{*} : #_{a} w = 2 k + 1, #_{b} w = 2 l + 1, k, l \geq 0},$
$L_{3} = {w \in {a, b}^{*} : #_{a} w = 2 k + 1, #_{b} w = 2 l, k, l \geq 0},$

Przyjmując $s_{0} = L_{1} = [1]$ , $s_{1} = L_{3}$ , $s_{2} = L_{2}$ , $s_{3} = L$ oraz $T = {s_{3}}$ automat minimalny $𝒜_{L} = (A^{*} /_{ρ_{2}}, f^{*}, s_{0}, T)$ przedstawiony jest przy pomocy grafu:

RYSUNEK ja-lekcja4-w-rys3.JPG

dla dociekliwych - start ----

Powyższe twierdzenia podają również sposób konstrukcji monoidu syntaktycznego języka $L$ .

dla dociekliwych - end ----

Test GR3

Wyrażenia regularne

Prawa kongruencja syntaktyczna i kongruencja syntaktyczna

AUTOMAT MINIMALNY

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia