Języki, automaty i obliczenia/Wykład 9: Języki bezkontekstowe i ich gramatyki

W tym wykładzie rozpoczniemy omawianie drugiej w hierarchii Chomsky'ego rodziny języków formalnych, a mianowicie języków bezkontekstowych. Przedstawimy gramatyki bezkontekstowe i ich prostsze, a zarazem równoważne, postacie.

Gramatyki języków bezkontekstowych

Języki typu (2), zwane językami bezkontekstowymi, są rodziną szerszą niż omówione wcześniej języki regularne. Jak stwierdziliśmy w poprzednich wykładach gramatyki regularne generują poprawne napisy poprzez ciąg przepisywań metodą "od lewej do prawej". Natomiast gramatyki bezkontekstowe, zwane w lingwistyce gramatykami bezkontekstowych struktur frazowych, generują poprawne napisy poprzez sekwencję przepisywań, która ma strukturę drzewa. Ze względu na tę właśnie strukturę, gramatyki bezkontekstowe nadają się bardzo dobrze do opisu syntaktyki języków programowania. Z tego też powodu nastąpił szybki rozwój teorii gramatyk i języków bezkontekstowych.

Na wstępie przypomnijmy, że każda produkcja jakiejkolwiek gramatyki bezkontekstowej $G = (V_{N}, V_{T}, v_{0}, P)$ ma postać $v \to x_{1} \dots . x_{k}$ lub $v \to 1$ , gdzie $v \in V_{N}, x_{i} \in (V_{N} \cup V_{T})$ . Często korzystać będziemy z możliwości przedstawienia graficznego takiej produkcji. Mianowicie każdej produkcji odpowiada etykietowane drzewo z wyróżnionym wierzchołkiem początkowym.

Drzewo odpowiadające pojedynczej produkcji z gramatyki $G$ nazywane jest drzewem elementarnym. Mając dowolne wyprowadzenie w gramatyce $G$ , można przedstawić je graficznie w postaci etykietowanego drzewa. Niech

v_{0} \to w_{1} \to \dots . . \to w_{n} = w

będzie wyprowadzeniem słowa $w$ w gramatyce $G$ . Drzewo reprezentujące to wyprowadzenie powstaje z połączenia drzew elementarnych odpowiadających pojedynczym produkcjom występującym w wyprowadzeniu słowa $w$ w taki sposób, aby spełnić poniższe warunki:

wierzchołek początkowy jest etykietowany przez $v_{0}$ ,
każdy wierzchołek nie będący liściem, czyli wierzchołkiem maksymalnym w drzewie, jest oznaczony przez elementy z $V_{N}$ ,
jeśli $v \in V_{N}$ jest symbolem nieterminalnym występującym w słowie $w_{i}$ w wyprowadzeniu $w$ , to bezpośrednie następniki wierzchołka etykietowanego przez $v$ są oznaczone przez symbole $x_{1}, \dots, x_{k}$ (porządek od lewej do prawej), gdzie $v \to x_{1} \dots x_{k} \in P$ i ta

właśnie produkcja została wykorzystana w bezpośrednim wyprowadzeniu $w_{i} \mapsto w_{i + 1}$ , to znaczy we fragmencie wyprowadzenia $v_{0} \mapsto^{*} w_{n} = w$ ,

wierzchołki maksymalne drzewa (ciąg liści "od lewej strony") to słowo $w$ , przy czym, jeśli wszystkie wierzchołki maksymalne są etykietowane przez 1, to $w = 1$ , a w przeciwnym razie wierzchołki oznaczone przez $1$ pomijamy.

Przykład 1.1

Niech $G = (V_{N}, V_{T}, v_{0}, P)$ , gdzie $V_{N} = {v_{0}, v_{1}}, V_{T} = {a, b, c}$ ,
$P = {v_{0} \to a v_{0} c, v_{0} \to b v_{1} c, v_{1} \to b v_{1} c, v_{1} \to b c}$ .

Wówczas wyprowadzeniu

v_{0} \mapsto a v_{0} c \mapsto a b v_{1} c c \mapsto a b b c c c

odpowiada drzewo

W poniższym przykładzie, jak i w dalszych wykładach symbolem $\overline{A}$ oznaczamy kopię alfabetu $A$ , o której zakładać będziemy, że jest to zbiór rozłączny z oryginalnym alfabetem.

Przykład 1.2

Język Dycka.
Określamy bezkontekstową gramatykę $G = (V_{N}, V_{T}, v_{0}, P)$ , w której $V_{N} = {v_{0}, v_{1}}, V_{T} = A \cup \overline{A},; A = {a},; \overline{A} = {\overline{a}}, P =$
${v_{0} \to 1, v_{0} \to v_{1} v_{0}, v_{1} \to a v_{0} \overline{a}}$ .
Język generowany przez tę gramatykę, nazywany językiem Dycka, oznaczany jest przez $D_{A}^{*}$ . Język Dycka zwany jest też językiem "poprawnych nawiasów" przy interpretacji symboli $a, \overline{a}$ jako lewego i prawego nawiasu. $L (G) = {1, a \overline{a}, a a \overline{a} \overline{a}, a \overline{a} a \overline{a}, a a \overline{a} \overline{a} a \overline{a}, \dots}$ Język Dycka można zdefiniować także dla alfabetu $A = {a_{1}, \dots, a_{n}}$ mającego więcej niż dwa symbole. Do zbioru praw gramatyki $G$ wprowadza się wszystkie możliwe prawa postaci $v_{1} \to a_{i} v_{0} \overline{a_{i}}$ . W tym przypadku dla języka Dycka używa się oznaczenia $D_{n}^{*}$ , aby zaznaczyć liczbę elementów alfabetu $A$ .
Język Łukasiewicza.
Język Łukasiewicza jest generowany przez gramatykę bezkontekstową $G = (V_{N}, V_{T}, v_{0}, P)$ , gdzie $V_{N} = {v_{0}}$ , $V_{T} = {a, b, +, *}$ , $v_{0} = v$ oraz $P = {v \to a, v \to b, v \to + v v, v \to * v v}$ . Język Łukasiewicza jest więc zbiorem $L (G) = {a, : b, + a b, * b + a b, * + a b + a b, \dots}$
Używając tego języka, możemy zapisywać wyrażenia algebraiczne bez użycia nawiasów (notacja polska, prefiksowa), interpretując $+$ jako operator dodawania, $*$ jako operator mnożenia oraz $a$ i $b$ jako argumenty. Używając nawiasów, przy powyżej interpretacji, możemy ten język zapisać następująco:

L (G) = {a, : b, : a + b, : b * (a + b), : (a + b) * (a + b), \dots}

Wprost z definicji gramatyk - regularnej i bezkontekstowej - wynika, że rodzina języków regularnych jest podrodziną rodziny języków bezkontekstowych. Z lematu o pompowaniu dla języków regularnych wiemy, że język $L = {a^{n} b^{n} : n = 1, 2, \dots}$ nie jest regularny. Łatwo uzasadnić, że język ten jest bezkontekstowy, bo jest generowany przez gramatykę:

G = ({v_{0}, v_{1}}, {a, b}, v_{0}, {v_{0} \to a v_{1} b, v_{1} \to 1, v_{1} \to a v_{1} b})

.

Zatem rodzina języków regularnych jest właściwą podrodziną rodziny języków bezkontekstowych, czyli $ℒ_{3} \subseteq_{/} ℒ_{2}$

Przejdziemy teraz do omówienia pewnych własności gramatyk bezkontekstowych, które prowadzą do ich uproszczenia. Występujące w poniższym twierdzeniu sformułowanie "produkcja wymazująca" oznacza produkcję $v \to 1$ .

Twierdzenie 1.1

Niech $G = (V_{N}, V_{T}, v_{0}, P)$ będzie dowolną gramatyką bezkontekstową.

Istnieje gramatyka bezkontekstowa $G^{'}$ bez produkcji wymazującej taka, że $L (G^{'}) = L (G) ∖ {1}$ .
Jeśli $1 \in L (G)$ , to istnieje równoważna $G$ gramatyka bezkontekstowa $G^{″} = (V^{'}'_{N}, V_{T}, {v_{0}}^{″}, P^{″})$ taka,

że jedyną produkcją wymazującą w $P^{″}$ jest produkcja ${v_{0}}^{″} \to 1$ i symbol ${v_{0}}^{″}$ nie występuje po prawej stronie żadnej produkcji z $P^{″}$ .

Dowód

Dowód podaje konstrukcję odpowiednich gramatyk. Dla dowodu punktu 1 rozważmy ciąg zbiorów

\begin{array}{l} U_{1} = {v \in V_{N} : v \to 1 \in P}, \\ U_{i + 1} = U_{i} \cup {v \in V_{N} : v \to x \in P, x \in U_{i}^{*}} \end{array}

określony dla $i = 1, 2 \dots$ . Jest to ciąg podzbiorów $V_{N}$ taki, że $U_{1} \subseteq U_{2} \subseteq \dots \subseteq V_{N}$ . Ponieważ zbiór symboli nieterminalnych $V_{N}$ jest skończony, więc istnieje indeks $k$ taki, że $U_{k} = U_{k + 1}$ . Zatem ciąg $U_{i}$ jest skończony. Stąd równoważność

v \mapsto_{G}^{*} 1 ⟺ v \in U_{k} . (*)

Zatem $1 \in L (G)$ wtedy i tylko wtedy, gdy $v_{0} \in U_{k}$ . Konstruujemy teraz gramatykę $G^{'} = (V_{N}, V_{T}, v_{0}, P^{'})$ , przyjmując $V_{N}, V_{T}$ i $v_{0}$ jak w gramatyce $G$ . Natomiast nowy zbiór praw $P^{'}$ zawiera zmodyfikowane prawa gramatyki $G$ . Jeśli prawo $v \to x \in P$ , to do zbioru $P^{'}$ wprowadzamy prawa $v \to x^{'}$ , gdzie $x^{'} \neq 1$ i $x^{'}$ powstaje z $x$ przez wymazanie dowolnej liczby (także $0$ ) symboli ze zbioru $U_{k}$ . Pozostaje teraz uzasadnienie równości

L (G^{'}) = L (G) - {1}

Dowód inkluzji $\subseteq$
Zauważmy, że dla każdego prawa $v \to x^{'} \in P^{'}$ istnieje prawo $v \to x \in P$ takie, że $x$ różni się od $x^{'}$ wyłącznie pewną ilością symboli z $U_{k}$ . Z równoważności $(*)$ wynika, że symbole ze zbioru $U_{k}$ prowadzą w dalszym ciągu generowania do słowa pustego. A więc dla każdego wyprowadzenia niepustego słowa w gramatyce $G^{'}$ istnieje w gramatyce $G$ wyprowadzenie tego samego słowa. Wystarczy w wyprowadzeniu w gramatyce $G^{'}$ w miejsce praw postaci $v \to x^{'} \in P^{'}$ wprowadzić prawa $v \to x \in P$ by otrzymać wyprowadzenie tego samego słowa w $G$ .

Dowód inkluzji $\supseteq$
Określamy gramatykę pomocniczą $\overline{G} = (V_{N}, V_{T}, v_{o}, P \cup P^{'})$ . Zbiór praw tej gramatyki rozszerza $P^{'}$ o wszystkie prawa wymazujące ze zbioru $P$ . Z definicji wynika, że $L (G) \subseteq L (\overline{G})$ , więc $L (G) - {1} \subseteq L (\overline{G}) - {1}$ . Dla dowodu wystarczy więc pokazać, że

L (\overline{G}) - {1} \subseteq L (G^{'})

.

Niech $w \in L (\overline{G}) - {1}$ i niech $v_{0} \mapsto_{\overline{G}} . . . . \mapsto_{\overline{G}} w$ będzie wyprowadzeniem słowa $w$ w $\overline{G}$ . Jeśli w tym wyprowadzeniu wszystkie prawa należą do $P^{'}$ , to oczywiście słowo $w \in L (G^{'})$ . Jeśli w wyprowadzeniu słowa $w$ występuje prawo wymazujące, to oznacza, że dla pewnego $y_{i} \in U_{k}, x_{p} \to v_{1} v_{2} \in P^{'}$ oraz $x_{p} \to v_{1} y_{i} v_{2} \in P^{'}$ wyprowadzenie ma postać

\begin{array}{ccccc} x_{p} \to v_{1} y_{i} v_{2} & y_{i} \to 1 \\ v_{0} \mapsto \dots x_{1} \dots x_{p} \dots x_{n} & \mapsto & x_{1} \dots v_{1} y_{i} v_{2} \dots y_{m} & \mapsto \end{array}

\mapsto x_{1} \dots v_{1} v_{2} \dots x_{n} \mapsto \dots \mapsto w

Jednak, jak łatwo zauważyć, słowo $w$ można także wygenerować, pomijając to prawo wymazujące i wykorzystując wyłącznie prawa z $P^{'}$

\begin{array}{cccc} x_{p} \to v_{1} v_{2} \\ v_{0} \mapsto x_{1} \dots x_{p} \dots x_{n} & \mapsto & x_{1} \dots v_{1} v_{2} \dots x_{n} & \mapsto \dots \mapsto w, \end{array}

co kończy dowód punktu 1.

Przechodząc do dowodu punktu 2, załóżmy, że $1 \in L (G)$ i niech $G^{'}$ będzie gramatyką taką jak w punkcie 1. Definiujemy teraz gramatykę

G^{″} = (V_{N} \cup {v_{0^{″}}}, V_{T}, v_{0^{″}}, P^{'} \cup {v_{0^{″}} \to 1, : v_{0^{″}} \to v_{0}})

,

która spełnia żądane w twierdzeniu warunki i $L (G) = L (G^{″})$ .

Z udowodnionego powyżej twierdzenia i z definicji gramatyk bezkontekstowych i kontekstowych (definicja 2.1. z wykładu 2) wynika następujące stwierdzenie

Wniosek 1.1

Rodzina języków bezkontekstowych (typu (2)) zawiera się w rodzinie jezyków kontekstowych (typu (1))

ℒ_{2} \subseteq ℒ_{1}

.

Przejdziemy teraz do zagadnienia upraszczania gramatyki bezkontekstowej. Wprowadzimy następującą definicję.

Definicja 1.1

Mówimy, że gramatyka bezkontekstowa $G$ jest właściwa, jeśli zbiór praw nie zawiera produkcji wymazującej oraz produkcji typu $v_{1} \to v_{2}$ , gdzie $v_{1}, v_{2} \in V_{N}$ .

Lemat 1.1

Dla każdej gramatyki bezkontekstowej $G$ generującej język bez słowa pustego istnieje równoważna jej gramatyka bezkontekstowa $H$ właściwa.

Dowód

W dowodzie przedstawimy konstrukcję gramatyki o żądanych własnościach. Na podstawie udowodnionego powyżej twierdzenia możemy przyjąć, że $G = (V_{N}, V_{T}, v_{0}, P)$ jest bez produkcji wymazującej. Dla usunięcia produkcji w postaci $v_{1} \to v_{2}$ określamy ciąg zbiorów $U_{i} (x)$ dla $x \in V_{N} \cup V_{T}$ , przyjmując $U_{1} (x) = {x}$ oraz dla $i = 1, 2 \dots U_{i + 1} (x) = U_{i} (x) \cup {y \in V_{N} \cup V_{T} : \exists u \in U_{i} (x), u \to y \in P}$

Ciąg $U_{i} (x)$ jest skończony (stabilizuje się), a więc $U_{k} (x) = U_{k + 1} (x)$ dla pewnego $k$ i dla każdego $l > k$ mamy równość $U_{l} (x) = U_{k} (x)$ . Dla dowolnego $v \in V_{N}$ oraz $z \in V_{N} \cup V_{T}$ prawdziwa jest równoważność

v \mapsto^{*} z ⟺ z \in U_{k} (v)

,

która w szczególności dla symbolu terminalnego $a \in V_{T}$ oznacza, że $a \in L (G)$ wtedy i tylko wtedy, gdy $a \in U_{k} (v_{0})$ .

Określamy teraz gramatykę $H = (V_{N}, V_{T}, v_{0}, \overline{P})$ , w której zbiór $\overline{P}$ zawiera produkcje postaci:

$v_{0} \to a$ dla każdego $a \in V_{T} \cap U_{k} (v_{0})$ ,
$v \to z_{1} . . . z_{n}$ dla $v \in V_{N}$ , $n ⩾ 2$ oraz dla

każdego $z_{j} \in V_{N} \cup V_{T}$ , $j = 1, \dots, n$ takiego, że istnieje prawo $\overline{v} \to x_{1} . . . x_{n} \in P$ , $\overline{v} \in U_{k} (v)$ i $z_{j} \in U_{k} (x_{j})$ .

W gramatyce $H$ nie występują prawa postaci $v_{1} ⟶ v_{2}$ . Gramatyka $H$ nie zawiera praw wymazujących oraz $L (G) = L (H)$ , co kończy dowód lematu.

Dalsze rozważania prezentują mozliwości upraszczania gramatyk bezkontekstowych poprzez usunięcie pewnych nieistotnych symboli nieterminalnych, a także poprzez zastąpienie danej gramatyki przez równoważną o prostszej strukturze.

Niech $G = (V_{N}, V_{T}, v_{0}, P)$ będzie gramatyką bezkontekstową, generującą niepusty język. Mówimy, że symbol nieterminalny $v \in V_{N}$ jest użyteczny, jeśli istnieje słowo $w \in L (G)$ i wyprowadzenie tego słowa takie, że

v_{0} \mapsto^{*} x v y \mapsto^{*} w

dla pewnych $x, y \in (V_{N} \cup V_{T})^{*}$ . W przeciwnym wypadku mówimy, że symbol $v$ jest bezużyteczny. Symbole nieużyteczne można usunąć z gramatyki bez uszczerbku dla generowanego przez tę gramatykę języka. Przekonuje o tym następujące twierdzenie.

Twierdzenie 1.2

Dla dowolnego niepustego języka bezkontekstowego $L$ istnieje gramatyka bezkontekstowa bez bezużytecznych symboli nieterminalnych, która generuje ten język.

Konstrukcja takiej gramatyki, a więc i dowód tego twierdzenia wynika bezpośrednio z następujących dwóch lematów.

Lemat 1.2

Dla każdej gramatyki bezkontekstowej $G = (V_{N}, V_{T}, v_{0}, P)$ istnieje równoważna gramatyka bezkontekstowa $\overline{G} = ({\overline{V}}_{N}, V_{T}, v_{0}, \overline{P})$ taka, że dla dowolnego $v \in {\overline{V}}_{N}$ istnieje $w \in V_{T}^{*}$ oraz

v \mapsto_{\overline{G}}^{*} w

Dowód

Określamy rekurencyjnie ciąg podzbiorów zbioru symboli nieterminalnych $V_{N}$ :
$U_{1} = {v \in V_{N} : : : v \to w \in P, : w \in V_{T}^{*}}$ oraz dla $i = 1, 2, \dots$
$U_{i + 1} = U_{i} \cup {v \in V_{N} : : : : v \to x \in P, : x \in (U_{i} \cup V_{T})^{*}}$ . Zbiory te tworzą ciąg wstępujący i stabilizujący się dla pewnego $p$ . Oznacza to, że $U_{1} \subseteq U_{2} \subseteq \dots \subseteq U_{p} = U_{p + 1}$ . Przyjmujemy z definicji ${\overline{V}}_{N} = U_{p}$ oraz

\overline{P} = {v \to x \in P, : v \in {\overline{V}}_{N}, : x \in (V_{T} \cup {\overline{V}}_{N})^{*}}

Tak określona gramatyka $\overline{G} = ({\overline{V}}_{N}, V_{T}, v_{0}, \overline{P})$ ma własności gramatyki postulowanej w tezie lematu. Pozostaje udowodnić równoważność określonej gramatyki $\overline{G}$ i gramatyki $G$ . W tym celu wystarczy pokazać dla dowolnego $v \in V_{N}$ i $w \in V_{T}^{*}$ , że jeśli $v \mapsto_{G}^{*} w$ , to $v \in {\overline{V}}_{N}$ . Udowodnimy tę implikację indukcyjnie ze względu na długość wyprowadzenia. Dla $n = 1$ istnienie wyprowadzenia $v \mapsto_{G}^{*} w$ oznacza, że $v \to w \in P$ . Stąd zaś wynika, że $v \in U_{1} \subset {\overline{V}}_{N}$ . Dla dalszej części rozumowania załóżmy, że implikacja jest prawdziwa dla wyprowadzenia o długości nie większej od $n$ i niech

v \mapsto_{G} z \mapsto_{G}^{*} w

będzie wyprowadzeniem o długości $n + 1$ dla słowa $w \in V_{T}^{*}$ . Niech $z = y_{1} v_{1} y_{2} v_{2} \dots v_{k} y_{k + 1}$ dla pewnych $v_{1}, \dots, v_{k} \in V_{N}$ oraz $y_{1}, \dots, y_{k + 1} \in V_{T}^{*}$ . Oznaczmy dla słowa $z$ symbolem $N (z)$ słowo otrzymane przez wymazanie wszystkich symboli terminalnych, a symbolem $T (z)$ słowo otrzymane przez wymazanie wszystkich symboli nieterminalnych. Wtedy $N (z) = v_{1} \dots v_{k}, T (z) = y_{1} \dots y_{k + 1}$ . Wówczas istnieją słowa $w_{1}, \dots, w_{k} \in V_{T}^{*}$ takie, że $w = y_{1} w_{1} y_{2} \dots y_{k} w_{k} y_{k + 1}$ i dla każdego $i = 1, \dots, k$ istnieją wyprowadzenia $v_{i} \mapsto_{G}^{*} w_{i}$ o długości mniejszej lub równej od $n$ . Korzystając z założenia indukcyjnego, wnioskujemy, że dla każdego $i = 1, \dots, k, : : v_{i} \in {\overline{V}}_{N}$ , a to oznacza z definicji ${\overline{V}}_{N}$ , że istnieje $j$ takie, że dla każdego $i = 1, \dots, k, : : v_{i} \in U_{j}$ . Ostatecznie więc $v \in {\overline{V}}_{N}$ .

Lemat 1.3

Dla każdej gramatyki bezkontekstowej $G = (V_{N}, V_{T}, v_{0}, P)$ istnieje równoważna gramatyka bezkontekstowa $\overline{\overline{G}} = ({\overline{\overline{V}}}_{N}, {\overline{\overline{V}}}_{T}, v_{0}, \overline{\overline{P}})$ taka, że dla dowolnego $x \in {\overline{\overline{V}}}_{N} \cup {\overline{\overline{V}}}_{T}$ istnieją słowa $u_{1}, u_{2} \in ({\overline{\overline{V}}}_{N} \cup {\overline{\overline{V}}}_{T})^{*}$ oraz

v_{0} \mapsto_{\overline{\overline{G}}}^{*} u_{1} x u_{2}

.

Dowód

Dla rekurencyjnego określenia ciągu podzbiorów zbioru $V_{N} \cup V_{T}$ przyjmujemy:

$U_{1} = {v_{0}}$ oraz dla $k = 1, 2, \dots U_{k + 1} = U_{k} \cup {x \in a l p h_{(V_{N} \cup V_{T})} y : : : v \to y \in P, : v \in U_{k}}$

gdzie $a l p h_{(V_{N} \cup V_{T})} y$ oznacza zbiór symboli terminalnych i nieterminalnych występujących w słowie $y$ . Zbiory te tworzą stabilizujący się dla pewnego $p$ ciąg wstępujący $U_{1} \subseteq U_{2} \subseteq \dots \subseteq U_{p} = U_{p + 1}$ . Przyjmijmy

{\overline{\overline{V}}}_{N} = U_{P} \cap V_{N}, : : : {\overline{\overline{V}}}_{T} = U_{P} \cap V_{T}

.

Zbiór $\overline{\overline{P}}$ definiujemy jako zawierający te i tylko te prawa z $P$ , w których wszystkie symbole tworzące słowa należą do ${\overline{\overline{V}}}_{N} \cup {\overline{\overline{V}}}_{T}$ . Łatwo zauważyć, że tak określona gramatyka $\overline{\overline{G}} = ({\overline{\overline{V}}}_{N}, {\overline{\overline{V}}}_{T}, v_{0}, \overline{\overline{P}})$ spełnia tezę lematu.

W świetle uzyskanych rezultatów dowolną gramatykę bezkontekstową generującą niepusty język można przekształcić w oparciu o Lemat 1.2 na równoważną, a następnie raz jeszcze przekształcić uzyskaną gramatykę stosując konstrukcję opisaną w dowodzie Lematu 1.3, uzyskując ostatecznie gramatykę bez bezużytecznych symboli nieterminalnych, czyli spełniającą tezę powyższego twierdzenia.

Warto podkreślić, iż istotna jest kolejność przekształcania gramatyk. Zmiana kolejności może sprawić, iż nie uzyskamy pożądanego efektu. Załóżmy, dla ilustracji, że w gramatyce $G = (V_{N}, V_{T}, v_{0}, P)$ istnieje wyprowadzenie $v_{0} \mapsto_{G}^{*} u_{1} v_{1} u_{2} v_{2} u_{3}$ dla pewnych $v_{1}, v_{2} \in V_{N}$ oraz $u_{1}, u_{2}, u_{3} \in (V_{N} \cup V_{T})^{*}$ i jest to jedyna możliwość wygenerowania z $v_{0}$ słowa, w którym występuje $v_{1}$ . Istnieje także słowo $w \in V_{T}^{*}$ i wyprowadzenie $v_{1} \mapsto_{G}^{*} w$ . Z symbolu $v_{2}$ nie da się natomiast w gramatyce $G$ wyprowadzić żadnego słowa terminalnego. Zastosowanie drugiego z powyższych lematów, uzasadniających twierdzenie, nie usunie symboli $v_{1}$ i $v_{2}$ z alfabetu nieterminalnego. Lemat pierwszy usunie tylko $v_{2}$ . Symbol $v_{1}$ pozostanie, pomimo iż jest bezużyteczny.

Gramatyki w postaci Chomsky'ego i Greibach

Wprowadzimy teraz określenia dwóch szczególnych postaci gramatyk bezkontekstowych, a mianowicie gramatyki w postaci normalnej Chomsky'ego oraz gramatyki w postaci normalnej Greibach.

Definicja 2.1

Gramatyka bezkontekstowa $G = (V_{N}, V_{T}, v_{0}, P)$ jest

w postaci normalnej Chomsky'ego, jeśli wszystkie prawa są w formie: $v \to v_{1} v_{2}$ lub $v \to a$ , gdzie $v, v_{1}, v_{2} \in V_{N}$ , $a \in V_{T}$ .
w postaci normalnej Greibach, jeśli wszystkie prawa są w formie:

v \to a x

,

gdzie $a \in V_{T}, : x \in V_{N}^{*}$ .

Sheila Greibach (1939-)
Zobacz biografię

Łatwo zaobserwować, że gramatyka zarówno w postaci normalnej Chomsky'ego, jak i w postaci

Greibach jest gramatyką właściwą oraz że język generowany przez te gramatyki nie zawiera słowa pustego. Ponadto drzewo wywodu dowolnego słowa w gramatyce w postaci normalnej Chomsky'ego jest binarne.

Twierdzenie 2.1

Dla każdej gramatyki bezkontekstowej $G$ , generującej język bez słowa pustego, istnieje równoważna gramatyka $H$ w postaci normalnej Chomsky' ego.

Dowód

Zakładamy, że gramatyka $G = (V_{N}, V_{T}, v_{0}, P)$ jest właściwa. Konstruujemy gramatykę $H_{1} = (V_{N} \cup {\overline{V}}_{T}, V_{T}, v_{0}, P_{1})$ , gdzie ${\overline{V}}_{T} = {v_{a} : a \in V_{T}}$ jest kopią alfabetu terminalnego. Zbiór produkcji $P_{1}$ powstaje z $P$ przez zamianę w każdej produkcji, której prawa strona nie jest pojedynczą literą terminalną, symbolu $a$ na $v_{a}$ oraz dodaniu produkcji $v_{a} \to a$ dla każdego $a \in V_{T}$ . Prawdziwa jest równość $L (G) = L (H_{1})$ i w gramatyce $H_{1}$ nie występują produkcje typu $v \to \overline{v}$ .

Aby uzyskać równoważną gramatykę $H$ w postaci normalnej Chomsky' ego, produkcje typu $v \to v_{1} . . . v_{n}$ dla $n ⩾ 2$ i $v_{i} \in V_{N}$ występujące ewentualnie w $H_{1}$ zastępujemy

produkcjami:

v \to v_{1} u_{1}, u_{1} \to v_{2} u_{2}, . . ., u_{n - 2} \to v_{n - 1} v_{n}

,

dodając do zbioru symboli nieterminalnych nowe elementy $u_{1}, \dots, u_{n - 2}$ . Skonstruowana w ten sposób gramatyka $H$ jest w normalnej postaci Chomsky'ego oraz $L (G) = L (H)$ .

Przedstawiamy poniżej algorytm przekształcający gramatykę bezkontekstową właściwą w gramatykę mającą postać normalną Chomsky'ego.

Algorytm PostaćNormalnaChomsky'ego - buduje gramatykę bezkontekstową w postaci normalnej Chomsky'ego

  1  Wejście:  $G = (V_{N}, V_{T}, v_{0}, P)$  - gramatyka bezkontekstowa właściwa.
  2  Wyjście:  $G^{'} = ({V_{N}}^{'}, {V_{T}}^{'}, {v_{0}}^{'}, P^{'})$  - gramatyka bezkontekstowa w postaci
     normalnej Chomsky'ego.
  3   $P^{'} \leftarrow \emptyset$ ;                            $▹$  nowy zbiór produkcji budujemy sukcesywnie 
  4   ${V_{N}}^{'} \leftarrow V_{N}$ ;                             $▹$  tak jak i nowe symbole nieterminalne
  5   ${V_{T}}^{'} \leftarrow V_{T}$ ;                           $▹$  symbole terminalne pozostają takie same
  6   ${v_{0}}^{'} \leftarrow v_{0}$ ;                                       $▹$  podobnie jak symbol startowy
  7  for each   $a \in {V_{T}}^{'}$  do
  8     ${V_{N}}^{'} \leftarrow {V_{N}}^{'} \cup {v_{a}}$                            $▹$  dodaj nowy symbol nieterminalny
  9  end for
 10   $k \leftarrow 1$                                                      $▹$  licznik produkcji
 11  for  $(v \to x_{1} x_{2} . . . x_{m}) \in P$  do
 12    if  $m = 1$   and   $x_{1} \in V_{T}$  then
 13       $P^{'} \leftarrow P^{'} \cup {v \to x_{1}}$ ;                      $▹$  takie produkcje są dopuszczone
 14    else
 15      for  $i \leftarrow 1$   to   $m$  do
 16        if  $x_{i} \in {V_{T}}^{'}$  then
 17           $P^{'} \leftarrow P^{'} \cup {v_{x_{i}} \to x_{i}}$ ;
 18           $x_{i} \leftarrow v_{x_{i}}$ ;                     $▹$  zmień  $(v \to x_{1} x_{2} . . . x_{m})$  na parę produkcji
 19        end if
 20      end for
 21       ${V_{N}}^{'} \leftarrow {V_{N}}^{'} \cup {u_{1}^{k}, u_{2}^{k}, \dots, u_{m - 2}^{k}}$ ;                 $▹$  nowe symbole nieterminalne
 22       $P^{'} \leftarrow P^{'} \cup {v \to x_{1} u_{1}^{k}}$             $▹$  nowe produkcje w miejsce  $(v \to x_{1} x_{2} . . . x_{m})$ 
 23       $P^{'} \leftarrow P^{'} \cup {u_{m - 2} \to x_{m - 1} x_{m}}$ 
 24      for  $i \leftarrow 1$   to   $m - 3$  do
 25         $P^{'} \leftarrow P^{'} \cup {u_{i} \to x_{i + 1} u_{i + 1}}$ ;
 26      end for
 27    end if
 28  end for
 29  return  $G^{'} = ({V_{N}}^{'}, {V_{T}}^{'}, {v_{0}}^{'}, P^{'})$ ;

Przykład 2.1

Gramatykę $G = (V_{N}, V_{T}, v_{0}, P)$ , dla której $V_{N} = {v_{0}, u, w}$ , $V_{T} = {a, b}$ , a zbiór praw dany jest poniżej

\begin{aligned} v_{0} & \to b u | a w \\ u & \to b u u | a v_{0} b | a \\ w & \to a a w w | b \end{aligned}

sprowadzimy do postaci normalnej Chomsky'ego.

Do zbioru $P^{'}$ od razu włączamy produkcje $u \to a$ oraz $w \to b$ . Poniżej, dla każdej z pozostałych produkcji wypisane są (po dwukropku) produkcje dodawane do $P^{'}$ :

\begin{aligned} v_{0} \to b u & : v_{b} \to b; v_{0} \to v_{b} u \\ v_{0} \to a w & : v_{a} \to a; v_{0} \to v_{a} w \\ u \to b u u & : u \to v_{b} d_{1}; d_{1} \to u u \\ u \to a v_{0} b & : u \to v_{a} d_{2}; d_{2} \to v_{0} v_{b} \\ w \to a a w w & : w \to v_{a} d_{3}; d_{3} \to v_{a} d_{4}; d_{4} \to w w \end{aligned}

Ostatecznie gramtyka ma postać:

\begin{aligned} v_{0} & \to v_{b} u | v_{a} w \\ u & \to v_{b} d_{1} | v_{a} d_{2} | a \\ w & \to v_{a} d_{3} | b \\ d_{1} & \to u u \\ d_{2} & \to v_{0} v_{b} \\ d_{3} & \to v_{a} d_{4} \\ d_{4} & \to w w \\ v_{a} & \to a \\ v_{b} & \to b \end{aligned}

Uwaga 2.1

Rozumowanie z dowodu twierdzenia o postaci Chomsky'ego można zastosować do gramatyk regularnych prawoliniowych. W wyniku tego uzyskujemy łatwo fakt, że postać normalna Chomsky'ego oznacza tu gramatykę o prawach typu:

{ $v \to a v^{'}$ lub $v \to a$ lub $v \to 1$ . }

Podobne twierdzenie, w którym mowa o postaci normalnej Greibach podamy poniżej. Przypomnijmy następujące oznaczenie. Dla dowolnego symbolu nieterminalnego $v \in V_{N}$ w gramatyce $G$ przez $P (v)$ oznaczamy podzbiór zbioru produkcji $P$ zawierający wyłącznie takie produkcje, które po lewej stronie mają symbol $v$ . Twierdzenie poprzedzimy dwoma lematami. Obserwacja sformułowana w pierwszym lemacie jest oczywista

Lemat 2.1

Niech $G = (V_{N}, V_{T}, v_{0}, P)$ będzie gramatyką bezkontekstową, a $v \to x u y$ prawem tej gramatyki dla pewnych $v, u \in V_{N}, x, y \in {(V_{N} \cup V_{T})}^{*}$ . Gramatyka $\overline{G} = (V_{N}, V_{T}, v_{0}, \overline{P})$ , w której

\overline{P} = (P - {v \to x u y}) \cup {v \to x z y : u \to z \in P}

jest równoważna $G$ .

Usuniętą produkcję $v \to x u y$ nazywać będziemy niekońcową v-produkcją.

Definicja 2.2

Niech $G = (V_{N}, V_{T}, v_{0}, P)$ będzie gramatyką bezkontekstową.

Produkcję

v \to v x

,

gdzie $v \in V_{N}$ , $x \in (V_{N} \cup V_{T})^{*}$ nazywamy lewostronnie rekursywną.

Kolejny lemat wskazuje możliwość wyeliminowania lewostronnej rekursji z gramatyki generującej język bezkontekstowy.

Lemat 2.2

Niech $G = (V_{N}, V_{T}, v_{0}, P)$ będzie gramatyką bezkontekstową oraz $v \in V_{N}$ . Zakładając niepustość zbioru $P_{1} (v) = {v \to v x \in P (v) : x \in {(V_{N} \cup V_{T})}^{*}}$ niech

$P_{2} (v) = P (v) - P_{1} (v)$ . Gramatyka $\overline{G} = (V_{N} \cup {u}, V_{T}, v_{0}, \overline{P})$ , gdzie $u \notin V_{N}$ ,

$\overline{P} = (P - P_{1} (v)) \cup {v \to x u : v \to x \in P_{2} (v)} \cup {u \to x : v \to v x \in P_{1} (v)} \cup {u \to x u : v \to v x \in P_{1} (v)}$

jest równoważna gramatyce $G$ .

Dowód

Zaobserwujmy, że w gramatyce $G$ każdy ciąg produkcji ze zbioru $P_{1} (v)$ musi zakończyć produkcja z $P_{2} (v)$ . Zatem wyprowadzenie

v \mapsto_{G} v x_{1} \mapsto_{G} v x_{2} x_{1} \mapsto_{G} \dots \dots \mapsto_{G} v x_{k} \dots x_{1} \mapsto_{G} x x_{k} \dots x_{1}

można w gramatyce $\overline{G}$ przeprowadzić następująco:

v \mapsto_{\overline{G}} x u \mapsto_{\overline{G}} x x_{k} u \mapsto_{\overline{G}} \dots \mapsto_{\overline{G}} x x_{k} \dots x_{2} u \mapsto_{\overline{G}} x x_{k} \dots x_{1}

W podobny sposób można każde wyprowadzenie w $\overline{G}$ przeprowadzić w $G$ .

Udowodnimy teraz twierdzenie o postaci normalnej Greibach.

Twierdzenie 2.2

Dla każdej gramatyki bezkontekstowej $G$ , generującej język bez słowa pustego, istnieje równoważna gramatyka bezkontekstowa $H$ w postaci normalnej Greibach.

Dowód

Załóżmy, że gramatyka $G$ jest w postaci normalnej Chomsky'ego. W alfabecie nieterminalnym $V_{N} = {v_{0}, \dots, v_{n}}$ wprowadzamy porządek zadany przez indeksy symboli nieterminalnych. Gramatykę $G$ przekształcimy teraz na równoważną taką, że jeśli $v_{i} \to v_{j} x$ jest prawem nowej gramatyki, to $j > i$ Efekt taki uzyskamy, przekształcając prawa kolejno, zgodnie z porządkiem wprowadzonym w zbiorze $V_{N}$ i symbolem nieterminalnym występującym po lewej stronie prawa. Załóżmy, że dla pewnego $k$ , wszystkich $i = 0, \dots, k - 1$ , gdzie $1 ⩽ k ⩽ n$ jest:

jeśli v_{i} \to v_{j} x jest prawem, to j > i

oraz istnieje $j < k$ takie, że

v_{k} \to v_{j} x jest prawem

.

W oparciu o lemat 2.1 prawo $v_{k} \to v_{j} x$ zastępujemy prawami $v_{k} \to v_{l} y x$ , gdzie $v_{j} \to v_{l} y \in P$ lub $v_{k} \to a y x$ , gdzie $v_{j} \to a y \in P$ . Stąd, że $j < k$ , to $l > j$ . Powtarzamy to postępowanie (co najwyżej $k - 1$ razy), aż uzyskamy nierówność $l ⩾ k$ lub prawo $v_{k} \to a x$ , gdzie $a \in V_{T}$ . W przypadku, gdy otrzymamy $l = k$ , czyli lewą rekursję $v_{k} \to v_{k} x$ , stosujemy Lemat 2.2, wprowadzając nowy symbol nieterminalny $v_{n + k + 1}$ . Analogicznie postępujemy, gdy w gramatyce $G$ występuje lewa rekursja $v_{k} \to v_{k} x$ dla $k = 0, \dots, n$ .

W wyniku wprowadzonych przekształceń uzyskamy, równoważną wyjściowej, gramatykę ze zbiorem produkcji $\overline{P}$ , w którym

\begin{array}{ll} v_{i} \to v_{j} x oraz & j > i, i = 0, \dots, n - 1, j = 1, \dots, n \\ v_{i} \to a x, gdzie & i = 0, \dots, n, a \in V_{T} \\ v_{i} \to x, gdzie & i = n + 1, \dots, 2 n + 1, \end{array}

gdzie pierwszą literą słowa $x$ , które występuje w trzecim typie produkcji, jest symbol nieterminalny różny od $v_{i}$ (nie jest to lewa rekursja). Zauważmy, że każda produkcja z $\overline{P} (v_{n})$ ma postać $v_{n} \to a x$ oraz każda produkcja z $\overline{P} (v_{n - 1})$ ma postać $v_{n - 1} \to v_{n} x$ lub $v_{n - 1} \to a x$ . A więc dla $i = 0, \dots, n$ każda produkcja z $\overline{P} (v_{i})$ jest postaci $v_{i} \to v_{j} x, : j > i$ lub $v_{i} \to a x$ .

Stosujemy teraz Lemat 2.1 do praw ze zbioru $\overline{P} (v_{n})$ i $\overline{P} (v_{n - 1})$ , tak by prawe strony otrzymanych produkcji zaczynały się symbolem terminalnym. Następnie stosujemy Lemat 2.1 do praw ze zbioru $\overline{P} (v_{n - 2}), \dots, \overline{P} (v_{1})$ . Po tych zmianach prawe strony produkcji zaczynają się symbolem terminalnym. Natomiast żadna z produkcji należących do $\overline{P} (v_{i})$ dla $i = n + 1, \dots, 2 n + 1$ nie jest lewą rekursją, co wynika z konstrukcji gramatyki $\overline{G}$ i z Lematu 2.2. Produkcje te zaczynają się symbolem nieterminalnym i w związku z tym stosujemy kolejny raz Lemat 2.1. W rezultacie uzyskujemy bezkontekstową gramatykę $H$ w postaci normalnej Greibach równoważną wyjściowej gramatyce $G$ .

Prezentowany teraz algorytm PrzekształćDlaGreibach przekształca gramatykę bezkontekstową, realizując powyższe dwa lematy, czyli usuwając v-produkcje niekońcowe i eliminując lewostronną rekursję. Zakładamy, bez utraty ogólności, że na wejściu algorytm otrzymuje gramatykę w postaci normalnej Chomsky'ego.

Algorytm PrzekształćDlaGreibach - buduje gramatykę bezkontekstową taką, że każda produkcja jest postaci $v_{k} \to v_{j} x$ , $k < j$ lub jej prawa strona zaczyna się od symbolu terminalnego

  1  Wejście:  $G = (V_{N}, V_{T}, v_{0}, P)$  - gramatyka bezkontekstowa w postaci Chomsky'ego.
  2  Wyjście:  $G^{'} = ({V_{N}}^{'}, V_{T}, v_{0}, P^{'})$  - gramatyka bezkontekstowa
 bez niekońcowych  $v$ -produkcji i bez lewostronnej rekursji.
  3   ${V_{N}}^{'} \leftarrow V_{N}$ ;                                                   $▹ {V_{N}}^{'} = {v_{0}, \dots, v_{n}}$ 
  4   ${V_{T}}^{'} \leftarrow V_{T}$ ;
  5   $P^{'} \leftarrow P$ ;
  6  for  $k \leftarrow 1$   to   $n$  do
  7    for  $r = 1$   to   $k$  do
  8      for  $j = 0$   to   $k - 1$  do
  9        for each  $(v_{k} \to v_{j} x_{1} \dots x_{s}) \in P^{'}$  do
 10           $P^{'} \leftarrow P^{'} ∖ {v_{k} \to v_{j} x_{1} \dots x_{s}}$ ;
 11          for each  $(v_{j} \to y_{1} \dots y_{l}) \in P^{'}$  do
 12             $P^{'} \leftarrow P^{'} \cup {v_{k} \to y_{1} \dots y_{l} x_{1} \dots x_{s}}$ ;
 13          end for
 14        end for
 15      end for
 16    end for
 17    for  $j = 0$   to   $k - 1$  do
 18      for each  $(v_{k} \to v_{j} x_{1} \dots x_{s}) \in P^{'}$  do
 19         $P^{'} \leftarrow P^{'} ∖ {v_{k} \to v_{j} x_{1} \dots x_{s}}$ ;
 20      end for
 21    end for
 22  end for
 23  for  $k \leftarrow 0$  to   $n$  do
 24    for each  $(v_{k} \to v_{k} x_{1} \dots x_{s}) \in P^{'}$  do
 25       ${V_{N}}^{'} \leftarrow {V_{N}}^{'} \cup {v_{n + k + 1}}$ ;
 26       $P^{'} \leftarrow P^{'} ∖ {v_{k} \to v_{k} x_{1} \dots x_{s}}$ ;
 27       $P^{'} \leftarrow P^{'} \cup {v_{n + k + 1} \to x_{1} \dots x_{s}}$ ;
 28       $P^{'} \leftarrow P^{'} \cup {v_{n + k + 1} \to x_{1} \dots x_{s} v_{n + k + 1}}$ ;
 29    end for
 30    for each  $(v_{k} \to y_{1} \dots y_{s}) \in P^{'}$  do 
 31      if  $y_{1} \neq v_{k}$  then
 32         $P^{'} \leftarrow P^{'} \cup {v_{k} \to y_{1} \dots y_{s} v_{n + k + 1}}$ ;
 33      end if
 34    end for
 35  end for
 36  return  $G^{'} = ({V_{N}}^{'}, V_{T}, v_{0}, P^{'})$ ;

Kolejny algorytm PostaćNormalnaGreibach przekształca gramatykę bezkontekstową do postaci normalnej Greibach. Zakładamy, że algorytm ten otrzymuje na wejściu gramatykę bezkontekstową właściwą.

Algorytm PostaćNormalnaGreibach - buduje gramatykę bezkontekstową w postaci normalnej Greibach

  1  Wejście:  $G = (V_{N}, V_{T}, v_{0}, P)$  - gramatyka bezkontekstowa właściwa.
  2  Wyjście:  $G^{'} = ({V_{N}}^{'}, {V_{T}}^{'}, {v_{0}}^{'}, P^{'})$  - gramatyka bezkontekstowa w postaci normalnej Greibach.
  3   $G \leftarrow$ PostaćNormalnaChomsky'ego $(G)$ ;                             $▹ V_{N} = {v_{0}, \dots, v_{n}}$ 
  4   $G^{'} \leftarrow$ PrzekształćDlaGreibach $(G)$ ;                    $▹ {V_{N}}^{'} \subset {v_{0}, \dots, v_{2 n + 1}}$ , ${V_{T}}^{'} = V_{T}$ 
  5  for  $i \leftarrow n - 1$   downto   $0$  do
  6    for  $j \leftarrow 1$   to   $n - i$  do
  7      for each  $(v_{i} \to v_{i + j} x_{1} \dots x_{s}) \in P^{'}$  do
  8         $P^{'} \leftarrow P^{'} ∖ {v_{i} \to v_{i + j} x_{1} \dots x_{s}}$ 
  9        for each  $(v_{i + j} \to z_{1} \dots z_{l}) \in P^{'}$  do 
 10          if  $z_{1} \in V_{T}$  then
 11             $P^{'} \leftarrow P^{'} \cup {v_{i} \to z_{1} \dots z_{l} x_{1} \dots x_{s}}$ ;
 12          end if
 13        end for
 14      end for
 15    end for
 16  end for
 17  for  $i \leftarrow n + 1$   to  2n+1 do
 18    for each   $(v_{i} \to x_{1} \dots x_{s}) \in P^{'}$  do
 19       $P^{'} \leftarrow P^{'} ∖ {v_{i} \to x_{1} \dots x_{s}}$ 
 20      for each   $(x_{1} \to z_{1} \dots z_{l}) \in P^{'}$  do
 21         $P^{'} \leftarrow P^{'} \cup {v_{i} \to z_{1} \dots z_{l} x_{2} \dots x_{s}}$ 
 22      end for
 23    end for
 24  end for
 25   ${v_{0}}^{'} \leftarrow v_{0}$ ;
 26  return  $G^{'} = ({V_{N}}^{'}, {V_{T}}^{'}, {v_{0}}^{'}, P^{'})$ ;

Przykład 2.2

Gramatykę $G = (V_{N}, V_{T}, v_{1}, P)$ , dla której $V_{N} = {v_{1}, v_{2}, v_{3}}$ , $V_{T} = {a, b}$ , a zbiór praw dany jest poniżej

\begin{aligned} v_{1} & \to v_{2} v_{3} \\ v_{2} & \to v_{3} v_{1} | b \\ v_{3} & \to v_{1} v_{2} | a, \end{aligned}

sprowadzimy do postaci normalnej Greibach.

Stosujemy procedurę PrzekształćDlaGreibach, wykorzystującą lematy 2.1 oraz 2.2. Prawe strony produkcji rozpoczynających się od $v_{1}$ i $v_{2}$ rozpoczynają się symbolami terminalnymi lub nieterminalami o wyższych indeksach niż odpowiednio 1 i 2, zatem jedyna produkcja, do której zastosujemy lemat 2.1, to $v_{3} \to v_{1} v_{2}$ . Usuwamy ją, a ponieważ prawa jej strona rozpoczyna się nieterminalem $v_{1}$ , zastępujemy ten nieterminal prawą stroną produkcji $v_{1} \to v_{2} v_{3}$ i nowo otrzymaną produkcję $v_{3} \to v_{2} v_{3} v_{2}$ dodajemy do $P$ . Ponieważ pierwszy nieterminal po prawej stronie ma niższy indeks niż 3, znowu stosujemy tę samą operację: usuwamy produkcję $v_{3} \to v_{2} v_{3} v_{2}$ i na jej miejsce wstawiamy produkcje powstałe w wyniku zastąpienia pierwszego $v_{2}$ z prawej jej strony łańcuchami $v_{3} v_{1}$ oraz $b$ , czyli prawymi stronami produkcji, po których lewej stronie jest $v_{2}$ . Otrzymujemy zatem dwie nowe produkcje: $v_{3} \to v_{3} v_{1} v_{3} v_{2}$ oraz $v_{3} \to b v_{3} v_{2}$ . Teraz każda produkcja jest następującej postaci: albo prawa jej strona zaczyna się terminalem, albo nieterminalem o indeksie większym lub równym indeksowi nieterminala stojącego z lewej strony.

Następny krok to wyeliminowanie lewostronnej rekursji. Stosujemy lemat 2.2 do produkcji $v_{3} \to v_{3} v_{1} v_{3} v_{2}$ . Usuwamy ją z $P$ i w jej miejsce wstawiamy produkcje $v_{3} \to b v_{3} v_{2} w_{3}$ , $v_{3} \to a w_{3}$ , $w_{3} \to v_{1} v_{3} v_{2} w_{3}$ .

Po zakończeniu działania procedury PrzekształćDlaGreibach otrzymujemy następującą gramatykę:

\begin{aligned} v_{1} & \to v_{2} v_{3} \\ v_{2} & \to v_{3} v_{1} | b \\ v_{3} & \to b v_{3} v_{2} w_{3} | a w_{3} | b v_{3} v_{2} | a \\ w_{3} & \to v_{1} v_{3} v_{2} | v_{1} v_{3} v_{2} w_{3} \end{aligned}

Wszystkie prawe strony produkcji mających po lewej stronie $v_{3}$ zaczynają się od terminala. W pętli (linie 5. - 16.) zastępujemy tymi prawymi stronami nieterminale $v_{3}$ stojące jako pierwsze nieterminale po prawej stronie produkcji postaci $v_{2} \to v_{3} x$ ; w naszym przypadku jedyną taką produkcją jest produkcja $v_{2} \to v_{3} v_{1}$ ; teraz zarówno produkcje postaci $v_{3} \to x$ jak i $v_{2} \to x$ rozpoczynają się terminalami. Po tym przekształceniu gramatyka ma postać:

\begin{aligned} v_{1} & \to v_{2} v_{3} \\ v_{2} & \to b v_{3} v_{2} w_{3} v_{1} | a w_{3} v_{1} | b v_{3} v_{2} v_{1} | a v_{1} | b \\ v_{3} & \to b v_{3} v_{2} w_{3} | a w_{3} | b v_{3} v_{2} | a \\ w_{3} & \to v_{1} v_{3} v_{2} | v_{1} v_{3} v_{2} w_{3} \end{aligned}

Prawymi stronami produkcji postaci $v_{2} \to x$ zastępujemy teraz nieterminale $v_{2}$ stojące jako pierwsze nieterminale po prawej stronie produkcji postaci $v_{1} \to v_{2} x$ . W naszym przypadku jedyną taką produkcją jest produkcja $v_{1} \to v_{2} v_{3}$ . Gramatyka wygląda teraz tak:

\begin{aligned} v_{1} & \to b v_{3} v_{2} w_{3} v_{1} v_{3} | a w_{3} v_{1} v_{3} | b v_{3} v_{2} v_{1} v_{3} | a v_{1} v_{3} | b v_{3} \\ v_{2} & \to b v_{3} v_{2} w_{3} v_{1} | a w_{3} v_{1} | b v_{3} v_{2} v_{1} | a v_{1} | b \\ v_{3} & \to b v_{3} v_{2} w_{3} | a w_{3} | b v_{3} v_{2} | a \\ w_{3} & \to v_{1} v_{3} v_{2} | v_{1} v_{3} v_{2} w_{3} \end{aligned}

Ostatecznie, po ukończeniu pętli, każda produkcja mająca po lewej stronie $v_{1}$ , $v_{2}$ lub $v_{3}$ zaczyna się terminalem, po którym następuje ciąg nieterminali. Te produkcje są więc w postaci normalnej Greibach.

W ostatnim kroku sprowadzamy do żądanej postaci nieterminale $w_{i}$ . Obie $w_{3}$ -produkcje przekształcamy, zastępując pierwszy nieterminal stojący po ich prawych stronach (czyli $v_{1}$ ) prawymi stronami produkcji postaci $v_{1} \to x$ . Obie $w_{3}$ -produkcje zostaną z $P$ usunięte, a na ich miejsce dodane zostaną produkcje

\begin{array}{lcl} w_{3} & \to & b v_{3} v_{2} w_{3} v_{1} v_{3} v_{3} v_{2} | a w_{3} v_{1} v_{3} v_{3} v_{2} | b v_{3} v_{2} v_{1} v_{3} v_{3} v_{2} \\ | a v_{1} v_{3} v_{3} v_{2} | b v_{3} v_{3} v_{2} \end{array}

oraz

\begin{array}{lcl} w_{3} & \to & b v_{3} v_{2} w_{3} v_{1} v_{3} v_{3} v_{2} w_{3} | a w_{3} v_{1} v_{3} v_{3} v_{2} w_{3} | b v_{3} v_{2} v_{1} v_{3} v_{3} v_{2} w_{3} \\ | a v_{1} v_{3} v_{3} v_{2} w_{3} | b v_{3} v_{3} v_{2} w_{3} \end{array}

Ostatecznie, gramatyka w postaci Greibach ma postać:

\begin{array}{lcl} v_{1} & \to & b v_{3} v_{2} w_{3} v_{1} v_{3} | a w_{3} v_{1} v_{3} | b v_{3} v_{2} v_{1} v_{3} | a v_{1} v_{3} | b v_{3} \\ v_{2} & \to & b v_{3} v_{2} w_{3} v_{1} | a w_{3} v_{1} | b v_{3} v_{2} v_{1} | a v_{1} | b \\ v_{3} & \to & b v_{3} v_{2} w_{3} | a w_{3} | b v_{3} v_{2} | a \\ w_{3} & \to & b v_{3} v_{2} w_{3} v_{1} v_{3} v_{3} v_{2} | a w_{3} v_{1} v_{3} v_{3} v_{2} | b v_{3} v_{2} v_{1} v_{3} v_{3} v_{2} \\ | a v_{1} v_{3} v_{3} v_{2} | b v_{3} v_{3} v_{2} b v_{3} v_{2} w_{3} v_{1} v_{3} v_{3} v_{2} w_{3} \\ | a w_{3} v_{1} v_{3} v_{3} v_{2} w_{3} | b v_{3} v_{2} v_{1} v_{3} v_{3} v_{2} w_{3} \\ | a v_{1} v_{3} v_{3} v_{2} w_{3} | b v_{3} v_{3} v_{2} w_{3} \end{array}

Języki, automaty i obliczenia/Wykład 9: Języki bezkontekstowe i ich gramatyki

Spis treści

Gramatyki języków bezkontekstowych

Gramatyki w postaci Chomsky'ego i Greibach

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia