Semantyka i weryfikacja programów/Ćwiczenia 1: Różnice pomiędzy wersjami

← poprzednia edycja

WizualnieWikikod

Aktualna wersja na dzień 21:29, 11 wrz 2023

Zawartość

Tematem tych zajęć jest semantyka operacyjna wyrażeń (małe kroki).

Semantyka operacyjna wyrażeń

Ćwiczenie 1

Rozważmy bardzo prosty język wyrażeń, którego składnia opisana jest następującą gramatyką:

$n : : = 0 | 1 | \dots$

$x : : = \dots (i d e n t y f i k a t o r y) \dots$

$e : : = n | x | e_{1} + e_{2} | 𝐢 𝐟 e_{1} 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}$

Wynikiem wyrażenienia warunkowego $𝐢 𝐟 e_{1} 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}$ jest wartość wyrażenia $e_{2}$ , o ile wyrażenie $e_{1}$ oblicza się do wartości różnej od zera; w przeciwnym przypadku wynikiem jest wartość wyrażenia $e_{3}$ .

Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.

Rozwiązanie

Zacznijmy od ustalenia notacji i dziedzin syntaktycznych. Niech $𝐍 𝐮 𝐦$ oznacza zbiór stałych liczbowych, $n \in 𝐍 𝐮 𝐦 = {0, 1, \dots}$ . Podobnie, niech $𝐕 𝐚 𝐫$ oznacza zbiór identyfikatorów, które mogą być nazwami zmiennych; $x \in 𝐕 𝐚 𝐫$ . Wreszcie, niech $𝐄 𝐱 𝐩$ oznacza zbiór wyrażeń; $e \in 𝐄 𝐱 𝐩$ . Dla ułatwienia zapisywania reguł zakładamy, że stałe liczbowe są wyrażeniami, czyli $𝐍 𝐮 𝐦 \subseteq 𝐄 𝐱 𝐩$ .

Będziemy potrzebować zbioru "stanów", opisujących wartości przypisane zmiennym. Najprostszym rozwiązaniem jest przyjąć, że stan to funkcja z $𝐕 𝐚 𝐫$ do $𝐍 𝐮 𝐦$ . Oznaczmy przez $𝐒 𝐭 𝐚 𝐭 𝐞$ zbiór wszystkich takich funkcji; stany oznaczać będziemy przez $s, s_{1}, s^{'}, \dots \in 𝐒 𝐭 𝐚 𝐭 𝐞$ .

W naszej semantyce będziemy potrzebowac tranzycji dwóch postaci. Po pierwsze, tranzycje postaci

$e, s ⟹, e^{'}, s$

oznaczające mały krok w trakcie obliczania wyrażenia $e$ w stanie $s$ , w wyniku którego $e$ wyewoluowało do $e^{'}$ . Stan nie ulega zmianie podczas obliczania wyrażenia (nie ma tzw. efektów ubocznych), więc to samo $s$ figuruje po lewej i prawej stronie strzałki.

Po drugie, tranzycje postaci

$e, s ⟹, n$

będą oznaczaczać, że wyrażenie $e$ jest już policzone, a jego wartością jest $n$ .

Zatem przyjmijmy, że zbiór konfiguracji to

$(𝐄 𝐱 𝐩 \times 𝐒 𝐭 𝐚 𝐭 𝐞) \cup 𝐍 𝐮 𝐦$

a konfiguracje końcowe to $𝐍 𝐮 𝐦$ .

Uwaga

Tak naprawdę, druga postać tranzycji nie jest niezbędna, gdyż moglibyśmy umówić się, że konfiguracje końcowe to $𝐍 𝐮 𝐦 \times 𝐒 𝐭 𝐚 𝐭 𝐞$ .

Najprostsze są tranzycje prowadzące do konfiguracji końcowej:

$n, s ⟹, n$

Symbol $n$ po lewej stronie to wyrażenie składające się ze stałej liczbowej, podczas gdy $n$ po prawej stronie reprezentuje liczbę będącą wartością wyrażenia.

Zmienna oblicza się do swojej wartości w bieżącym stanie:

$x, s ⟹, n, s o ile s (x) = n$

Teraz zajmiemy się dodawaniem $e_{1} + e_{2}$ . Ponieważ semantyka jest w stylu małych kroków, musimy zdecydować się, czy najpierw obliczyć pierwszy (lewy) składnik $e_{1}$ , czy drugi? Jeśli wybierzemy lewy (strategia "lewostronna"), otrzymamy regułę:

$e_{1} + e_{2}, s ⟹, e'_{1} + e_{2}, s o ile e_{1}, s ⟹, e'_{1}, s$

Reguły tej postaci będziemy zapisywać tak:

$\frac{e_{1}, s ⟹, e'_{1}, s}{e_{1} + e_{2}, s ⟹, e'_{1} + e_{2}, s}$

Czyli mały krok w $e_{1}$ stanowi też mały krok w $e_{1} + e_{2}$ . Po zakończeniu obliczania $e_{1}$ przechodzimy do $e_{2}$ :

$\frac{e_{2}, s ⟹, e'_{2}, s}{n + e_{2}, s ⟹, n + e'_{2}, s}$

A na końcu dodajemy:

$n_{1} + n_{2}, s ⟹, n, s o ile n = n_{1} + n_{2}$

Zwróćmy tutaj uwagę na pewną subtelność, dotyczącą dwóch wystąpień symbolu $+$ : pierwsze wystąpienie oznacza jedną z konstrukcji składniowych języka, a drugie oznacza operację dodawania w zbiorze $𝐍 𝐮 𝐦$ . Pozwalamy sobie na taką kolizję oznaczeń, gdyż nie powinna ona prowadzić do niejednoznaczności. Pamiętajmy, że składnia języka jest składnią abstrakcyjną, więc zamiast $e_{1} + e_{2}$ moglibyśmy równie dobrze pisać np. $a d d (e_{1}, e_{2})$ , a wtedy reguła wyglądałaby tak:

$a d d (n_{1}, n_{2}), s ⟹, n, s o ile n = n_{1} + n_{2}$

Inną możliwą strategią obliczania $e_{1} + e_{2}$ jest strategia "prawostronna", którą otrzymujemy zastępując pierwsze dwie z trzech powyższych reguł przez:

$\frac{e_{2}, s ⟹, e'_{2}, s}{e_{1} + e_{2}, s ⟹, e_{1} + e'_{2}} \frac{e_{1}, s ⟹, e'_{1}, s}{e_{1} + n, s ⟹, e'_{1} + n, s}$

Ponadto, jeśli przyjmiemy regułę pierwszą (dla $e_{1}$ ), trzecią i czwartą (dla $e_{2}$ ), otrzymamy strategię "równoległą", polegającą na obliczaniu jednocześnie $e_{1}$ i $e_{2}$ :

$\frac{e_{1}, s ⟹, e'_{1}, s}{e_{1} + e_{2}, s ⟹, e'_{1} + e_{2}, s} \frac{e_{2}, s ⟹, e'_{2}, s}{e_{1} + e_{2}, s ⟹, e_{1} + e'_{2}} n_{1} + n_{2}, s ⟹, n, s o ile n = n_{1} + n_{2}$

Bardziej precyzyjnie mówiąc, małe kroki obliczające obydwa podwyrażenia przeplatają się, i to w dowolny sposób. Ta dowolność prowadzi do niedeterminizmu, czyli do sytuacji, gdy kolejna (następna) konfiguracja nie jest wyznaczona jednoznacznie. Jest tak, gdyż możemy mieć do wyboru dwie różne tranzycje

$e_{1} + e_{2}, s ⟹, e'_{1} + e_{2}, s e_{1} + e_{2}, s ⟹, e_{1} + e'_{2}, s$

Zauważmy natomiast, że kolejność przeplatania się małych kroków obliczających $e_{1}$ i $e_{2}$ nie wpływa w tym przypadku na końcową wartość całego wyrażenia.

Na koniec reguły dla wyrażenia warunkowego.

$\frac{e_{1}, s ⟹, e'_{1}, s}{𝐢 𝐟 e_{1} 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}, s ⟹, 𝐢 𝐟 e'_{1} 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}, s}$

$𝐢 𝐟 n 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}, s ⟹, e_{2}, s o ile n \neq 0$

$𝐢 𝐟 n 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}, s ⟹, e_{3}, s o ile n = 0$

Ćwiczenie 2

Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję

$e : : = \dots | 𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$

Wyrażenie $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ zawiera w sobie deklarację $x = e_{1}$ , która stanowi mechanizm wiązania identyfikatorów w naszym języku. Deklaracja $x = e_{1}$ wprowadza nową zmienną $x$ oraz przypisuje jej wartość. Wartość wyrażenia $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ obliczamy następująco: najpierw oblicza się wartość $e_{1}$ , podstawia ją za zmienną $x$ , a następnie oblicza wyrażenie $e_{2}$ . Zakresem zmiennej $x$ jest wyrażenie $e_{2}$ , czyli wewnątrz $e_{2}$ można odwoływać się (wielokrotnie) do zmiennej $x$ ; Ogólniej, odwołania do zmiennej w wyrażeniu odnoszą się do "najbliższej" (najbardziej zagnieżdzonej) deklaracji tej zmiennej. Taki mechanizm wiązania identyfikatorów nazywamy wiązaniem statycznym. Przyjmujemy zwykłe (statyczne) reguły przesłaniania zmiennych, np. jeśli w $e_{2}$ występuje podwyrażenie $𝐥 𝐞 𝐭 x = e 𝐢 𝐧 e^{'}$ , to deklaracja $x = e$ "przesłania" deklarację $x = e_{1}$ w wyrażeniu $e^{'}$ .

Zakładamy, że na początku wartości wszystkich zmiennych są nieokreślone, czyli zmienne są niezainicjowane, a odwołanie do niezainicjowanej zmiennej jest uważane za niepoprawne.

{{przyklad|||

$𝐥 𝐞 𝐭 x = 0 𝐢 𝐧 𝐥 𝐞 𝐭 y = 7 𝐢 𝐧 𝐥 𝐞 𝐭 x = y + 3 𝐢 𝐧 x + x + y \mapsto wynik = 24$

$𝐥 𝐞 𝐭 y = 5 𝐢 𝐧 𝐥 𝐞 𝐭 x = (𝐥 𝐞 𝐭 y = 3 𝐢 𝐧 y + y) 𝐢 𝐧 x + y \mapsto wynik = 11$

$𝐥 𝐞 𝐭 z = 5 𝐢 𝐧 x + z \mapsto brak wyniku, odwołanie do niezainicjowanej zmiennej x$

$𝐥 𝐞 𝐭 x = 1 𝐢 𝐧 𝐥 𝐞 𝐭 x = x + x 𝐢 𝐧 x + x \mapsto wynik = 4$

Rozwiązanie

Podobnie jak poprzednio, stan powinien opisywać wartości przypisane zmiennym. Tym razem jednak uwzględnimy niezainicjowane zmienne, czyli zmienne bez żadnej wartości. Przyjmijmy zatem, że stan to skończona funkcja częściowa z $𝐕 𝐚 𝐫$ do $𝐍 𝐮 𝐦$ . Oznaczmy symbolem $𝐒 𝐭 𝐚 𝐭 𝐞$ zbiór wszystkich takich funkcji: $𝐒 𝐭 𝐚 𝐭 𝐞 = 𝐕 𝐚 𝐫 \to_{f i n} 𝐍 𝐮 𝐦$ . Naturalnym stanem początkowym jest stan "pusty", tzn. pusta funkcja częściowa, który będziemy oznaczać symbolem $\emptyset$ . Wartość wyrażenia $e$ w stanie początkowym wynosi $n$ , o ile zachodzi:

$e, \emptyset ⟹^{*} n$

Będziemy potrzebowac tranzycji dwóch postaci, podobnie jak poprzednio, ale pierwsza postać będzie nieco ogólniejsza:

$e, s ⟹, e^{'}, s^{'}$

Tranzycja ta oznacza mały krok w trakcie obliczania wyrażenia $e$ w stanie $s$ , w wyniku którego $e$ wyewoluowało do $e^{'}$ , a nowym stanem jest $s^{'}$ . Stan może się teraz zmienić na skutek deklaracji zmiennych.

Spróbujmy rozszerzyć semantykę z poprzedniego zadania. Ponieważ stan jest funkcją częściową, musimy zmienić niektóre reguły, np.

$x, s ⟹, n, s o ile s (x) jest określone i s (x) = n$

Następnie dodajemy reguły dla wyrażenia $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ . Gdy $e_{1}$ jest już obliczone, wystarczy reguła:

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹, e_{2}, s [x \mapsto n]$

Notacja $s [x \mapsto n]$ oznacza stan $s$ , który zmodyfikowano przypisując zmiennej $x$ wartość $n$ , niezależnie od tego, czy $s (x)$ było określone, czy nie, i pozostawiając niezmienione wartości dla pozostałych zmiennych. Formalnie

$s [x \mapsto n] (y) = {\begin{cases} n & y = x \\ s (y) & y \neq x \end{cases}$

W szczególności dla $y \neq x$ , $s [x \mapsto n] (y)$ jest określone wtedy i tylko wtedy, gdy $s (y)$ jest określone.

Natomiast aby obliczyc $e_{1}$ , potrzebujemy reguły:

$\frac{e_{1}, s ⟹, e'_{1}, s^{'}}{𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}, s ⟹, 𝐥 𝐞 𝐭 x = e'_{1} 𝐢 𝐧 e_{2}, s^{'}}$

Zwróćmy uwagę, że stan $s^{'}$ może być różny od $s$ , np. dlatego, że wewnątrz $e_{1}$ znajduje się podwyrażenie $𝐥 𝐞 𝐭 y = \dots$ .

Pytanie: czy taka semantyka jest poprawna?

Niestety nie, gdyż nie uwzględniamy ograniczonego zasięgu zmiennej. Rzućmy okiem na przykład:

$𝐥 𝐞 𝐭 x = (𝐥 𝐞 𝐭 z = 4 𝐢 𝐧 z + z + z) 𝐢 𝐧 z$

Według naszych intencji to wyrażenie nie ma wartości, gdyż ostatnie odwołanie do $z$ jest błędne. Natomiast według powyższych reguł mamy

$𝐥 𝐞 𝐭 x = (𝐥 𝐞 𝐭 z = 4 𝐢 𝐧 z + z + z) 𝐢 𝐧 z, \emptyset ⟹, 𝐥 𝐞 𝐭 x = z + z + z 𝐢 𝐧 z, \emptyset [z \mapsto 4] ⟹, \dots ⟹, 𝐥 𝐞 𝐭 x = 12 𝐢 𝐧 z, \emptyset [z \mapsto 4] ⟹, 12, \emptyset [z \mapsto 4] ⟹, 12!$

Nasz błąd polega na tym, że po zakończeniu obliczania podwyrażenia $𝐥 𝐞 𝐭 z = 4 𝐢 𝐧 z + z + z$ "zapominamy" przywrócić zmiennej $z$ poprzednią wartość (a właściwie brak wartości w przykładzie powyżej). Przedyskutujmy kilka wariantów.

Wariant 1

Wygodne i eleganckie rozwiązanie tego problemu jest możliwe, jeśli rozszerzymy składnię naszego języka. Intuicyjnie, reguła

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹, e_{2}, s [x \mapsto n]$

powinna zostać zastąpiona przez

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹ e_{2} 𝐭 𝐡 𝐞 𝐧 przywróć wartość zmiennej x, s [x \mapsto n]$

czyli potrzebujemy konstrukcji składniowej, która polega na obliczeniu wyrażenia $e_{2}$ , a następnie na przypisaniu zmiennej $x$ danej wartości. Rozszerzmy zatem składnię następujaco:

$e : : = \dots | e 𝐭 𝐡 𝐞 𝐧 x : = n$

Wyrażenie $e 𝐭 𝐡 𝐞 𝐧 x : = n$ jest w pewnym sensie dualne do $𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e$ , gdyż jedyna (choć niewątpliwie istotna) różnica między nimi to kolejność obliczenia $e$ i przypisania wartości na zmienną $x$ . Oto nowa reguła

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹, e_{2} 𝐭 𝐡 𝐞 𝐧 x : = n^{'}, s [x \mapsto n] o ile s (x) = n^{'}$

Pewna trudność pojawia się w sytuacji, gdy $s (x)$ jest nieokreślone, czyli gdy zmienna $x$ jest niezainicjowana -- reguła powyższa nie obejmuje wogóle takiej sytuacji. Najprostszym sposobem rozwiązania tej trudności jest rozszerzenie konstrukcji $e 𝐭 𝐡 𝐞 𝐧 x : = n$ :

$e : : = \dots | e 𝐭 𝐡 𝐞 𝐧 x : = n | e 𝐭 𝐡 𝐞 𝐧 x : = ⊥$

gdzie symbol $⊥$ oznacza brak wartości. Dodajemy również regułę:

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹, e_{2} 𝐭 𝐡 𝐞 𝐧 x : = ⊥, s [x \mapsto n] o ile s (x) jest nieokreślone$

Rozwiązanie to jest odrobinę nieeleganckie, gdyż prawie identyczne reguły musimy napisać dwukrotnie. Widać to np. w poniższych regułach, "scalających" semantykę dla $e 𝐭 𝐡 𝐞 𝐧 x : = n$ z semantyką pozostałych wyrażeń:

$\frac{e, s ⟹, e^{'}, s^{'}}{e 𝐭 𝐡 𝐞 𝐧 x : = n, s ⟹, e^{'} 𝐭 𝐡 𝐞 𝐧 x : = n, s^{'}}$

$n^{'} 𝐭 𝐡 𝐞 𝐧 x : = n, s ⟹, n^{'}, s [x \mapsto n]$

$n^{'} 𝐭 𝐡 𝐞 𝐧 x : = ⊥, s ⟹, n^{'}, s^{'} o ile s (x) jest określone i s^{'} = s ∖ {(x, s (x))}$

Wariant 2

Zanim przejdziemy do kolejnego wariantu, zastanówmy się, czy istnieje inny sposób rozwiązania trudności związanej z $n = ⊥$ , który pozwalałby uniknąć wprowadzania dodatkowej konstrukcji $e 𝐭 𝐡 𝐞 𝐧 x : = ⊥$ . Pomysł może polegać na rozszerzeniu zbioru $𝐍 𝐮 𝐦$ o dodatkowy element $⊥$ :

$n : : = ⊥ | 0 | 1 | \dots$

Wtedy nie musimy pisać dwóch bardzo podobnych wariantów reguł. Dodatkowo, w tym rozwiązaniu warto poczynić umowę, że $s (x) = ⊥$ reprezentuje brak wartości zmiennej $x$ . Wtedy stany są funkcjami całkowitymi z $𝐕 𝐚 𝐫$ w $𝐍 𝐮 𝐦$ , przyjmującymi wartość różną od $⊥$ tylko dla skończenie wielu elementów. Pewnym mankamentem jest to, że teraz $n = ⊥$ może pojawiać się w wyrażeniach podobnie jak stałe. Tym niemniej nie musimy adaptować reguł dla stałych tak, aby radziły one sobie z $n = ⊥$ , ponieważ wyrażenia zawierające $⊥$ możemy również uważać za roszerzenie składni.

Jeśli jednak dopuścimy symbol $⊥$ w wyrażeniach, to możemy elegancko wybrnąć z sytuacji, rozszerzając operacje arytmetyczne na zbiór $𝐍 𝐮 𝐦 \cup {⊥}$ tak, aby zachowywały one nieokreśloność:

$n + ⊥ = ⊥ + n = ⊥$

Trzeba jednak w takim razie zadbać o to, aby wyrażenie $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ obliczało się normalnie tylko wtedy, gdy wartość wyrażenia $e_{1}$ jest różna od $⊥$ . ,
Wariant 3

Zrewidujmy teraz podstawowe założenia, które dotychczas poczyniliśmy. Jednym z nich było przyjęcie ogólnej postaci tranzycji:

$e, s ⟹, e^{'}, s^{'}$

pozwalającej na zmianę stanu podczas obliczania wyrażenia. Czy faktycznie był to dobry pomysł? Czy moglibyśmy poradzić sobie przy pomocy tranzycji postaci

$e, s ⟹, e^{'}, s ?$

Spróbujmy! Oto nowa wersja jednej z reguł dla $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ , dotycząca kroku wewnątrz $e_{1}$ :

$\frac{e_{1}, s ⟹, e'_{1}, s}{𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}, s ⟹, 𝐥 𝐞 𝐭 x = e'_{1} 𝐢 𝐧 e_{2}, s}$

Dotychczas nie ma problemu: podwyrażenie $e_{1}$ jest prawidłowo obliczane w stanie $s$ . Trudność pojawi się, gdy zakończymy obliczanie $e_{1}$ i przejdziemy do $e_{2}$ . Oto możliwa reguła:

$\frac{e, s [x \mapsto n] ⟹, e^{'}, s [x \mapsto n]}{𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e, s ⟹, 𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e^{'}, s}$

Okazuje się, że wszystko jest w porządku. Wyrażenie $e$ obliczamy w prawidłowym stanie, tzn. z wartością $n$ przypisaną zmiennej $x$ . Mały krok w $e$ daje przyczynek do małego kroku w całym wyrażeniu, a przy tym stan pozostaje niezmieniony. Przy tym wogóle nie potrzebujemy przywracać poprzedniej wartości zmiennej $x$ , ponieważ $x$ zyskuje nową wartość "tylko" na potrzeby obliczania podwyrażenia $e$ ! Można na to również spojrzeć inaczej: informacja o nowej wartości $n$ dla zmiennej $x$ nie jest jawnie dodawana do stanu $s$ , ale jest przechowywana w składni wyrażenia $𝐥 𝐞 𝐭 x = n 𝐢 𝐧 \dots$ jako deklaracja $x = n$ . Na końcu musimy oczywiście pozbyć się tej deklaracji za pomocą następującej tranzycji:

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 n^{'}, s ⟹, n^{'}, s$

Podsumujmy. Okazuje się, że rozwiązanie nie było wcale łatwe, nawet dla tak prościutkiego języka. W przyszłości przekonamy się, że łatwiej jest poradzić sobie z zagadnieniem wiązania identyfikatorów w semantyce naturalnej (duże kroki). W wariancie 1 i 2 wprowadziliśmy do języka dodatkowe elementy, tak by łatwiej było pisać reguły. W przyszłości będziemy czasem stosować takie podejście. Niekiedy jednak rozszerzanie języka będzie zabronione.

Zadania domowe

Ćwiczenie 1

Zapisz wariant 2 semantyki z poprzedniego zadania.

Ćwiczenie 2

Dotychczas wystąpienie błędu podczas obliczania wyrażenia, np. odwołanie do niezainicjowanej zmiennej, powodowało, że wyrażenie nie posiadało wartości (nie było ciągu tranzycji prowadzących do konfiguracji końcowej). Zmodyfikuj którąś z semantyk z poprzednich zadań tak, aby błąd był komunikowany jako jedna z konfiguracji końcowych. To znaczy: jeśli obliczenie wyrażenia $e$ w stanie $s$ jest niemożliwe bo wystąpił błąd, to

$e, s ⟹^{*} B l a d$

Ćwiczenie 3

Rozważ rozszerzenie języka wyrażeń o wyrażenia boolowskie:

$n : : = 0 | 1 | \dots$

$x : : = \dots (i d e n t y f i k a t o r y) \dots$

$b : : = 𝐭 𝐫 𝐮 𝐞 | 𝐟 𝐚 𝐥 𝐬 𝐞 | e_{1} \leq e_{2} | \neg b | b_{1} \land b_{2}$

$e : : = n | x | e_{1} + e_{2} | 𝐢 𝐟 b 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3} | 𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$

Zaproponuj semantykę małych kroków dla tego języka. Rozważ różne strategie obliczania wyrażeń boolowskich, oraz podejście leniwe. Na przykład w strategii lewostronnej dla $b_{1} \land b_{2}$ , gdy $b_{1}$ zostało obliczone do $𝐟 𝐚 𝐥 𝐬 𝐞$ , w podejściu leniwym nie ma wogóle potrzeby obliczania $b_{2}$ .

Semantyka i weryfikacja programów/Ćwiczenia 1: Różnice pomiędzy wersjami

Aktualna wersja na dzień 21:29, 11 wrz 2023

Zawartość

Semantyka operacyjna wyrażeń

Zadania domowe

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia

@@ Linia 1: / Linia 1: @@
+== Zawartość ==
-== Ćwiczenia 1: Semantyka operacyjna wyrażeń ==
+Tematem tych zajęć jest semantyka operacyjna wyrażeń (małe kroki).
-==== Zadanie: ====
+== Semantyka operacyjna wyrażeń ==
-Semantyka języka Tiny z wykładu używała funkcji semantycznych
+{{cwiczenie|1|cw1|
+Rozważmy bardzo prosty język wyrażeń, którego składnia opisana jest następującą gramatyką:
 <math>
-B, E : State \to State
+n \, ::= \,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
 </math>
-dla określenie znaczenia wyrażeń boolowskich i arytmetycznych.
-Zdefiniuj znaczenie wyrażeń za pomocą semantyki operacyjnej,
-w stylu dużych kroków (semantyka naturalna) i małych kroków.
-==== Rozwiązanie: ====
-Przypomnijmy składnię wyrażeń boolowskich i arytmetycznych:
 <math>
-b \, ::= \,\,
+x \, ::= \,\, \ldots \, (identyfikatory) \, \ldots
-        true   \,\,|\,\,
-        false  \,\,|\,\,
-        e_1 \leq e_2  \,\,|\,\,
-        \neg b  \,\,|\,\,
-        b_1  \land  b_2   \,\,|\,\,
-        b_1  \lor  b_2
 </math>
 <math>
-e \,  ::= \,\,
+e \,  ::=  \,\,
-  \,\,|\,\,   1     \,\,|\,\,   \ldots   \,\,|\,\,
+         n   \,\,|\,\,
-         x  \,\,|\,\,
+        x   \,\,|\,\,
-        e_1 + e_2  \,\,|\,\,
+        e_1 + e_2   \,\,|\,\,
-        e_1 * e_2  \,\,|\,\,
+         \mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3
-        e_1 - e_2
 </math>
+Wynikiem wyrażenienia warunkowego <math>\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3</math> jest wartość wyrażenia <math>e_2</math>, o ile wyrażenie <math>e_1</math> oblicza się do wartości różnej od zera; w przeciwnym przypadku wynikiem jest wartość wyrażenia <math>e_3</math>.
+Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.
+}}
+<div class="mw-collapsible mw-made=collapsible mw-collapsed">
+<span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie</span>
+<div class="mw-collapsible-content" style="display:none">
-Zacznijmy od dużych kroków.
+Zacznijmy od ustalenia notacji i dziedzin syntaktycznych.
+Niech <math>\mathbf{Num}</math> oznacza zbiór stałych liczbowych, <math>n \in \mathbf{Num} = \{ 0, 1, \ldots \}</math>.
+Podobnie, niech <math>\mathbf{Var}</math> oznacza zbiór identyfikatorów, które mogą być nazwami zmiennych; <math>x \in \mathbf{Var}</math>.
+Wreszcie, niech <math>\mathbf{Exp}</math> oznacza zbiór wyrażeń; <math>e \in \mathbf{Exp}</math>.
+Dla ułatwienia zapisywania reguł zakładamy, że stałe  liczbowe są wyrażeniami, czyli <math>\mathbf{Num} \subseteq \mathbf{Exp}</math>.
-===== Semantyka naturalna =====
+Będziemy potrzebować zbioru "stanów", opisujących wartości przypisane zmiennym.
+Najprostszym rozwiązaniem jest przyjąć, że stan to funkcja z <math>\mathbf{Var}</math> do <math>\mathbf{Num}</math>.
+Oznaczmy przez <math>\mathbf{State}</math> zbiór wszystkich takich funkcji; stany oznaczać będziemy przez <math>s, s_1, s', \ldots \in \mathbf{State}</math>.
-Chcemy, aby tranzycje wyrażen wyglądały następująco:
+W naszej semantyce będziemy potrzebowac tranzycji dwóch postaci.
+Po pierwsze, tranzycje postaci
 <math>
-e, s \longrightarrow n
+e, s \,\Longrightarrow, e', s
-\quad \quad \quad
-b, s \longrightarrow l,
 </math>
-gdzie
-<math>s \in State</math>,
-<math>n</math> jest liczbą całkowitą,
-<math>n \in Int</math>, a <math>l \in Bool = \{ true, false \}</math>.
-Tranzycja taka oznacza, że wyrażenie e w stanie s wylicza się do
-wartości n, oraz że wyrażenie logiczne b w stanie s wylicza się do l.
-Zauważmy, że zakładamy tu, iż obliczenie wyrażenia nie zmienia
-stanu (nie ma efektów ubocznych).
-W tym celu rozszerzamy zbiór konfiguracji <math>\Gamma</math> następująco:
+oznaczające mały krok w trakcie obliczania wyrażenia <math>e</math> w stanie <math>s</math>,  w wyniku którego <math>e</math> wyewoluowało do <math>e'</math>.
+Stan nie ulega zmianie podczas obliczania wyrażenia (nie ma tzw. ''efektów ubocznych''), więc to samo <math>s</math> figuruje po lewej i prawej stronie strzałki.
+Po drugie, tranzycje postaci
 <math>
-\Gamma = (Instr \times State) \cup (Expr \times State) \cup (BExpr \times State) \cup State \cup Int \cup Bool
+e, s \,\Longrightarrow, n
 </math>
-gdzie Instr oznacza zbiór instrukcji (jedna z kategorii syntaktycznych
+będą oznaczaczać, że wyrażenie <math>e</math> jest już policzone, a jego wartością jest <math>n</math>.
-języka Tiny), Expr zbiór wyrażeń arytmetycznych a BExpr
-zbiór wyrażeń boolowskich.
+Zatem przyjmijmy, że zbiór konfiguracji to
-<math>State = Var \to Int</math>.
-Konfiguracje końcowe pozostają bez zmian (State).
-Tranzycje dla instrukcji pozostają zasadniczo bez zmian, z tym,
-że odwołania do funkcji semantycznych dla wyrazżen zastępujemy
-przez odpowiednie tranzycje.
-Np. dla instrukcji pętli będziemy mieć następujące reguły:
 <math>
-\frac{b, s \longrightarrow true  \quad \quad
+( \mathbf{Exp} \times \mathbf{State} ) \, \cup \, \mathbf{Num}
-      I; \mbox{ while } b \mbox{ do } I, s \longrightarrow s'}
-{\mathbf{while}\, b\, \mathbf{do}\, I, s \longrightarrow s'}
 </math>
+a konfiguracje końcowe to <math>\mathbf{Num}</math>.
+{{
+uwaga||uwaga1|
+Tak naprawdę, druga postać tranzycji nie jest niezbędna, gdyż moglibyśmy umówić się, że konfiguracje końcowe to <math>\mathbf{Num} \times \mathbf{State}</math>.
+}}
+Najprostsze są tranzycje prowadzące do konfiguracji końcowej:
 <math>
-\frac{b, s \longrightarrow false}{while b do I, s \longrightarrow s}
+n, s \,\Longrightarrow, n
 </math>
-Podobnie dla instrukcji warunkowej.
+Symbol <math>n</math> po lewej stronie to wyrażenie składające się ze stałej liczbowej, podczas gdy <math>n</math> po prawej stronie reprezentuje liczbę będącą wartością wyrażenia.
-Teraz zajmiemy się tranzycjami dla wyrażeń.
-Zacznijmy od stalych arytmetycznych:
+Zmienna oblicza się do swojej wartości w bieżącym stanie:
+<math>
+x, s \,\Longrightarrow, n, s \quad \mbox{ o ile } s(x) = n</math>
+Teraz zajmiemy się dodawaniem <math>e_1 + e_2</math>. Ponieważ semantyka jest w stylu małych kroków, musimy zdecydować się, czy najpierw obliczyć pierwszy (lewy) składnik <math>e_1</math>, czy drugi?
+Jeśli wybierzemy lewy (strategia "lewostronna"), otrzymamy regułę:
+<math>
+e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s
+\quad \mbox{ o ile } \quad
+e_1, s \,\Longrightarrow, e'_1, s</math>
+Reguły tej postaci będziemy zapisywać tak:
 <math>
-n, s \longrightarrow n, \quad \quad   \mbox{dla } n \in Int
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+     {e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s}
 </math>
-Zauważmy, iż celowo nie odróżniamy liczby n \in Int od
+Czyli mały krok w <math>e_1</math> stanowi też mały krok w <math>e_1 + e_2</math>.
-stałej reprezentującej tę liczbę, która może pojawić się
+Po zakończeniu obliczania <math>e_1</math> przechodzimy do <math>e_2</math>:
-w wyrażeniach zgodnie z przyjętą przez nas składnią.
-Czyli zakładamy, że Int jest podzbiorem zbioru wyrażeń.
-W powyższej tranzycji, n po lewej stronie to stała reprezentująca
-liczbę, która widnieje po prawej stronie.
-Analogiczne tranzycje dla stałych boolowskich to:
 <math>
-true, s \longrightarrow true
+\frac{e_2, s \,\Longrightarrow, e'_2, s}
+{n + e_2, s \,\Longrightarrow, n + e'_2, s}</math>
+A na końcu dodajemy:
-false, s \longrightarrow false
+<math>
+n_1 + n_2, s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
+Zwróćmy tutaj uwagę na pewną subtelność, dotyczącą dwóch wystąpień symbolu <math>+</math>: pierwsze wystąpienie oznacza jedną z konstrukcji składniowych języka, a drugie oznacza operację dodawania w zbiorze <math>\mathbf{Num}</math>.
+Pozwalamy sobie na taką kolizję oznaczeń, gdyż nie powinna ona prowadzić do niejednoznaczności. Pamiętajmy, że składnia języka jest składnią abstrakcyjną, więc zamiast <math>e_1 + e_2</math> moglibyśmy równie dobrze pisać np. <math>{\mathrm{add}}(e_1, e_2)</math>, a wtedy reguła wyglądałaby tak:
+<math>
+\mathrm{add}(n_1, n_2), s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
+Inną możliwą strategią obliczania <math>e_1 + e_2</math> jest strategia "prawostronna", którą otrzymujemy zastępując pierwsze dwie z trzech powyższych reguł przez:
+<math>
+\frac{e_2, s \,\Longrightarrow, e'_2, s}
+     {e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2}
+\quad \quad
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+     {e_1 + n, s \,\Longrightarrow, e'_1 + n, s}</math>
+Ponadto, jeśli przyjmiemy regułę pierwszą (dla <math>e_1</math>), trzecią i czwartą (dla <math>e_2</math>), otrzymamy strategię "równoległą", polegającą na obliczaniu jednocześnie <math>e_1</math> i <math>e_2</math>:
+<math>
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+     {e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s}
+\quad \quad
+\frac{e_2, s \,\Longrightarrow, e'_2, s}
+     {e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2}
+\quad \quad
+n_1 + n_2, s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
+Bardziej precyzyjnie mówiąc, małe kroki obliczające obydwa podwyrażenia przeplatają się, i to w dowolny sposób.
+Ta dowolność prowadzi do ''niedeterminizmu'', czyli do sytuacji, gdy kolejna (następna) konfiguracja nie jest wyznaczona jednoznacznie.
+Jest tak, gdyż możemy mieć do wyboru dwie różne tranzycje
+<math>
+e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s
+\quad \quad \quad
+e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2, s</math>
+Zauważmy natomiast, że kolejność przeplatania się małych kroków obliczających <math>e_1</math> i <math>e_2</math> nie wpływa w tym przypadku na końcową wartość całego wyrażenia.
+Na koniec reguły dla wyrażenia warunkowego.
+<math>
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+     {\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, \mathbf{if}\, e'_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s}
 </math>
-Czynimy tu analogiczne założenie, że Bool jest podbiorem
-wyrażen boolowskich.
-Operatory arytmetyczne definiujemy następująco:
 <math>
-\frac{e_1, s \longrightarrow n_1
+\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, e_2, s \quad \mbox{ o ile } n \neq 0
-        e_2, s \longrightarrow n_2
-        n = n_1 + n_2    }
-{e_1 + e_2,s \longrightarrow n}
 </math>
-Czyli aby obliczyć sumę e_1 + e_2 w stanie s, trzeba
-najpierw obliczyć e_1 i e_2 w stanie s,
-a następnie dodać obliczone wartości.
-Zauważmy, że nie specyfikujemy kolejności, w jakiej mają się
-obliczać e_1 i e_2.
-I choć tutaj nie ma to żadnego znaczenia, w przyszłości
-będzie inaczej, gdy jezyk będzie dopuszczał efekty uboczne wyrażeń.
-Podobne reguły można napisać dla pozostałych operacji
+<math>
-arytmnetycznych, oraz dla spójników logicznych:
+\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, e_3, s \quad \mbox{ o ile } n = 0
+</math>
+</div></div>
+{{cwiczenie|2|cw2|
+}}
+Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję
 <math>
-\frac{b_1, s \longrightarrow l_1   b_2, s
+e \,  ::=  \,\,
-\longrightarrow l_2   l = l_1 \land l_2}
+        \ldots   \,\,|\,\,
-{b_1  \land  b_2, s \longrightarrow l}
+        \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
 </math>
-Oczywiście jeśli b_1 oblicza się do false, wartość
-całego wyrażenia jest false niezależnie od wartości wyrażenia
-b_2.
-Czyli jeśli zaczniemy od obliczenia b_1 i wynikiem będzie
+Wyrażenie <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> zawiera w sobie deklarację <math>x = e_1</math>, która stanowi mechanizm wiązania identyfikatorów w naszym języku.
-false, to nie ma wogóle potrzeby obliczania b_2.
+Deklaracja <math>x = e_1</math> wprowadza nową zmienną <math>x</math> oraz przypisuje jej wartość.
-Oto odpowiednie reguły (lewo-stronne):
+Wartość wyrażenia <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> obliczamy następująco: najpierw oblicza się wartość <math>e_1</math>, podstawia ją <font color=red>za</font> zmienną <math>x</math>, a następnie oblicza wyrażenie <math>e_2</math>.
+Zakresem zmiennej <math>x</math> jest wyrażenie <math>e_2</math>, czyli wewnątrz <math>e_2</math> można odwoływać się (wielokrotnie) do zmiennej <math>x</math>;
+Ogólniej, odwołania do zmiennej w wyrażeniu odnoszą się do "najbliższej" (najbardziej zagnieżdzonej) deklaracji tej zmiennej.
+Taki mechanizm wiązania identyfikatorów nazywamy ''wiązaniem statycznym''.
+Przyjmujemy zwykłe (statyczne) reguły przesłaniania zmiennych, np. jeśli w <math>e_2</math> występuje podwyrażenie <math>\mathbf{let}\, x = e \,\mathbf{in}\, e'</math>, to
+deklaracja <math>x = e</math> "przesłania" deklarację <math>x = e_1</math> w wyrażeniu <math>e'</math>.
+Zakładamy, że na początku wartości wszystkich zmiennych są ''nieokreślone'', czyli zmienne są niezainicjowane, a odwołanie do niezainicjowanej zmiennej jest uważane za niepoprawne.
+{{przyklad|||
 <math>
-\frac{b_1, s \longrightarrow false}
+\mathbf{let}\, x = 0 \,\mathbf{in}\, \mathbf{let}\, y = 7 \,\mathbf{in}\, \mathbf{let}\, x = y+3 \,\mathbf{in}\, x+x+y
-{b_1 \land b_2,s \longrightarrow false}
+\quad \quad \mapsto \quad \quad \mbox{wynik} = 24
+</math>
-\frac{b_1, s \longrightarrow true
+<math>
-        b_2, s \longrightarrow l}
+\mathbf{let}\, y = 5 \,\mathbf{in}\, \mathbf{let}\, x = (\, \mathbf{let}\, y = 3 \,\mathbf{in}\, y+y \,) \,\mathbf{in}\, x+y
-{b_1 + b_2,s \longrightarrow l}
+\quad \quad \mapsto \quad \quad \mbox{wynik} = 11
 </math>
-Wybraliśmy następującą kolejność obliczania wyrażeń:
+<math>
-najpierw b_1, potem b_2.
+\mathbf{let}\, z = 5 \,\mathbf{in}\, x+z \quad \quad \mapsto \quad \quad \mbox{ brak wyniku, odwołanie do niezainicjowanej zmiennej } x
-Pozostawiamy Czytelnikowi napisanie analogicznych reguł dla
+</math>
-kolejności odwrotnej (reguły prawo-stronne).
-Rozważmy też następującą kombinację obydwu semantyk
-(reguły równoległe):
 <math>
-\frac{b_1, s \longrightarrow false}
+\mathbf{let}\, x = 1 \,\mathbf{in}\, \mathbf{let}\, x = x+x \,\mathbf{in}\, x+x
-{b_1 \land b_2,s \longrightarrow false}
+\quad \quad \mapsto \quad \quad \mbox{wynik} = 4
+</math>
+<div class="mw-collapsible mw-made=collapsible mw-collapsed">
+<span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie</span>
+<div class="mw-collapsible-content" style="display:none">
-\frac{b_2, s \longrightarrow false}
+Podobnie jak poprzednio, stan powinien opisywać wartości przypisane zmiennym.
-{b_1 \land b_2,s \longrightarrow false}
+Tym razem jednak uwzględnimy niezainicjowane zmienne, czyli zmienne bez żadnej wartości.
-</math>
+Przyjmijmy zatem, że stan to skończona funkcja częściowa z <math>\mathbf{Var}</math> do <math>\mathbf{Num}</math>.
-Czyli jeśli którekolwiek z podwyrażeń daje wynik false,
+Oznaczmy symbolem <math>\mathbf{State}</math> zbiór wszystkich takich funkcji:
-to taki wynik zyskuje całe wyrażenie.
-Dodatkowo potrzebujemy jeszcze reguły:
 <math>
-\frac{b_1, s \longrightarrow true
+\mathbf{State} = \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Num}
-b_2, s \longrightarrow true}
+</math>.
-{b_1 \land b_2,s \longrightarrow true}
+Naturalnym stanem początkowym jest stan "pusty", tzn. pusta funkcja częściowa, który będziemy oznaczać symbolem <math>\emptyset</math>.
-</math>
+Wartość wyrażenia <math>e</math> w stanie początkowym wynosi <math>n</math>, o ile zachodzi:
-Zauważmy, że powyższych reguł nie da sie zaimplementować
-sekwencyjnie: nie wiadomo czy najpierw obliczać
-b_1 czy b_2.
-Reguły te odpowiadają raczej strategii ,,równoległej'':
-obliczaj ,,jednocześnie'' b_1 i b_2
-albo do pierwszego false, albo aż obydwa się zakończą
-z wynikiem true.
-W naszym prostym języku wszystkie czterech warianty
+<math>
-są równoważne. Różnice pomiędzy nimi zobaczymy jednak już w
+e, \emptyset \,\Longrightarrow^{*}\, n</math>
-następnym zadaniu, w którym pojawi się prosta
-odmiana efektów ubocznych (błąd wykonania).
+Będziemy potrzebowac tranzycji dwóch postaci, podobnie jak poprzednio, ale pierwsza postać będzie nieco ogólniejsza:
-Reguły dla pozostałych spójników logicznych oraz dla
+<math>
-negacji pozostawiamy jako ćwiczenie.
+e, s \,\Longrightarrow, e', s'</math>
-A teraz małe kroki.
+Tranzycja ta oznacza mały krok w trakcie obliczania wyrażenia <math>e</math> w stanie <math>s</math>, w wyniku którego <math>e</math> wyewoluowało do <math>e'</math>, a nowym stanem jest <math>s'</math>.
+Stan może się teraz zmienić na skutek deklaracji zmiennych.
-===== Strukturalna semantyka operacyjna (małe kroki)  =====
+Spróbujmy rozszerzyć semantykę z poprzedniego zadania.
+Ponieważ stan jest funkcją częściową, musimy zmienić niektóre reguły, np.
-Chcemy, aby tranzycje dla wyrażeń były postaci:
 <math>
-e, s \longrightarrow e', s
+x, s \,\Longrightarrow, n, s \quad \mbox{ o ile } s(x) \mbox{ jest określone i } s(x) = n
 </math>
-i podobnie dla wyrażeń boolowskich:
+Następnie dodajemy reguły dla wyrażenia <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math>.
+Gdy <math>e_1</math> jest już obliczone, wystarczy reguła:
 <math>
-b, s \longrightarrow b', s
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2, s[x \mapsto n]</math>
+Notacja <math>s[x \mapsto n]</math> oznacza stan <math>s</math>, który zmodyfikowano przypisując zmiennej <math>x</math> wartość <math>n</math>, niezależnie od tego, czy <math>s(x)</math> było określone, czy nie, i pozostawiając niezmienione wartości dla pozostałych zmiennych.
+Formalnie
+<math>
+s[x \mapsto n](y) =
+\begin{cases}
+n    & y = x \\
+s(y) & y \neq x
+\end{cases}
 </math>
-gdzie s \in State.
-Przyjmijmy na razie takie same konfiguracje i konfiguracje końcowe jak dla semantyki
-naturalnej.
-Zacznijmy od wyrażeń boolowskich.
+W szczególności dla <math>y \neq x</math>, <math>s[x \mapsto n](y)</math> jest określone wtedy i tylko wtedy, gdy <math>s(y)</math> jest określone.
+Natomiast aby obliczyc <math>e_1</math>, potrzebujemy reguły:
 <math>
-true, s \Longrightarrow true
+\frac{e_1, s \,\Longrightarrow, e'_1, s'}
+{\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow, \mathbf{let}\, x = e'_1 \,\mathbf{in}\, e_2, s'}
+</math>
+Zwróćmy uwagę, że stan <math>s'</math> może być różny od <math>s</math>, np. dlatego, że wewnątrz <math>e_1</math> znajduje się podwyrażenie <math>\mathbf{let}\, y = \ldots</math>.
+'''Pytanie:''' czy taka semantyka jest poprawna?
+Niestety nie, gdyż nie uwzględniamy ograniczonego zasięgu zmiennej.
+Rzućmy okiem na przykład:
-false, s \Longrightarrow false
+<math>
+\mathbf{let}\, x = (\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z) \,\mathbf{in}\, z
 </math>
-Przejdźmy do spójników logicznych, powiedzmy b_1 \land b_2.
+Według naszych intencji to wyrażenie nie ma wartości, gdyż ostatnie odwołanie do <math>z</math> jest błędne.
-Ponieważ opisujemy teraz pojedyncze (małe) kroki składające się na
+Natomiast według powyższych reguł mamy
-wykonanie programu, musimy podać w jakiej kolejności będą się
-wykonywać. Zacznijmy od strategii lewostronnej:
 <math>
-\frac{b_1, s \Longrightarrow b'_1, s}
+\mathbf{let}\, x = (\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z) \,\mathbf{in}\, z, \emptyset \,\Longrightarrow,
-{b_1 \land b_2, s \Longrightarrow b'_1 \land b_2, s}
+\mathbf{let}\, x = z+z+z \,\mathbf{in}\, z, \emptyset[z \mapsto 4] \,\Longrightarrow, \quad \ldots \quad \,\Longrightarrow,
-\quad
+\mathbf{let}\, x = 12 \,\mathbf{in}\, z, \emptyset[z \mapsto 4] \,\Longrightarrow,
-\frac{b_2, s \Longrightarrow b'_2, s}
+, \emptyset[z \mapsto 4] \,\Longrightarrow,
-{l_1 \land b_2, s \Longrightarrow l_1 \land b_2, s}
+!
-\quad
-l_1 \land l_2 \Longrightarrow l,
-\mbox{ o ile } l = l_1 \land l_2
 </math>
-Podobnie jak poprzednio, możemy zaniechać obliczania
+Nasz błąd polega na tym, że po zakończeniu obliczania podwyrażenia <math>\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z</math> "zapominamy" przywrócić zmiennej <math>z</math> poprzednią wartość (a właściwie brak wartości w przykładzie powyżej).
-b_2 jeśli b_1 oblicza się do false.
+Przedyskutujmy kilka wariantów.
+<br>
+'''Wariant 1'''
+<br>
+Wygodne i eleganckie rozwiązanie tego problemu jest możliwe, jeśli rozszerzymy składnię naszego języka.
+Intuicyjnie, reguła
+<math>
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2, s[x \mapsto n]</math>
+powinna zostać zastąpiona przez
 <math>
-\frac{b_1, s \Longrightarrow b'_1, s}
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow\, e_2 \,\mathbf{then}\, \mbox{przywróć wartość zmiennej x}, s[x \mapsto n]</math>
-{b_1 \land b_2, s \Longrightarrow b'_1 \land b_2, s}
-false \land b_2, s \Longrightarrow false
+czyli potrzebujemy konstrukcji składniowej, która polega na obliczeniu wyrażenia <math>e_2</math>, a następnie na przypisaniu zmiennej <math>x</math> danej wartości.
+Rozszerzmy zatem składnię następujaco:
-true  \land b_2, s \Longrightarrow b_2,s
+<math>
-</math>
+e \,  ::=  \,\,
+        \ldots   \,\,|\,\,
+        e \,\mathbf{then}\, x := n</math>
-Analogicznie reguły prawostronne to:
+Wyrażenie <math>e \,\mathbf{then}\, x:= n</math> jest w pewnym sensie dualne do <math>\mathbf{let}\, x = n \,\mathbf{in}\, e</math>, gdyż jedyna (choć niewątpliwie istotna) różnica między nimi to kolejność obliczenia <math>e</math> i przypisania wartości na zmienną <math>x</math>.
+Oto nowa reguła
 <math>
-\frac{b_2, s \Longrightarrow b'_2, s}
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2 \,\mathbf{then}\, x := n', s[x \mapsto n] \quad
-{b_1 \land b_2, s \Longrightarrow b_1 \land b'_2, s}
+\mbox{ o ile } s(x) = n'</math>
-b_1 \land false, s \Longrightarrow false
+Pewna trudność pojawia się w sytuacji, gdy <math>s(x)</math> jest nieokreślone, czyli gdy zmienna <math>x</math> jest niezainicjowana -- reguła powyższa nie obejmuje wogóle takiej sytuacji.
+Najprostszym sposobem rozwiązania tej trudności jest rozszerzenie konstrukcji <math>e \,\mathbf{then}\, x := n</math>:
-b_1 \land true, s \Longrightarrow b_1, s
+<math>
+e \,  ::=  \,\,
+        \ldots   \,\,|\,\,
+        e \,\mathbf{then}\, x := n  \,\,|\,\,
+        e \,\mathbf{then}\, x := \bot
 </math>
-Reguły równoległe otrzymujemy jako sumę reguł lewo- i
+gdzie symbol <math>\bot</math> oznacza brak wartości.
-prawostronnych (w sumie 6 reguł).
+Dodajemy również regułę:
-Oto reguła dla negacji:
 <math>
-\neg true, s \Longrightarrow false, s
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2 \,\mathbf{then}\, x := \bot, s[x \mapsto n] \quad
+\mbox{ o ile } s(x) \, \mbox{ jest nieokreślone}</math>
-\neg false, s \Longrightarrow true, s
+Rozwiązanie to jest odrobinę nieeleganckie, gdyż prawie identyczne reguły musimy napisać dwukrotnie.
+Widać to np. w poniższych regułach, "scalających" semantykę dla <math>e \,\mathbf{then}\, x := n</math> z semantyką pozostałych wyrażeń:
+<math>
+\frac{e, s \,\Longrightarrow, e', s'}
+{e \,\mathbf{then}\, x := n, s \,\Longrightarrow, e' \,\mathbf{then}\, x:= n, s'}
 </math>
-Reguły dla e_1 \leq e_2 są następujące:
+<math>
+n' \,\mathbf{then}\, x := n, s \,\Longrightarrow, n', s[x \mapsto n]
+</math>
 <math>
-\frac{e_1, s \Longrightarrow e'_1, s}
+n' \,\mathbf{then}\, x := \bot, s \,\Longrightarrow, n', s' \quad \mbox{ o ile } s(x)
-{e_1 \leq e_2, s \Longrightarrow e'_1 \leq e_2, s}
+\mbox{ jest określone i } s' = s \setminus \{ (x, s(x)) \}
+</math>
-\frac{e_2, s \Longrightarrow e'_2, s}
+<br>
-{e_1 \leq e_2, s \Longrightarrow e_1 \leq e'_2, s}
+'''Wariant 2'''
+<br>
-n_1 \leq n_2, s \Longrightarrow true, s    o ile
+Zanim przejdziemy do kolejnego wariantu, zastanówmy się, czy istnieje inny sposób rozwiązania trudności związanej z <math>n = \bot</math>, który pozwalałby uniknąć wprowadzania dodatkowej konstrukcji
-n_1 \leq n_2
+<math>e \,\mathbf{then}\, x := \bot</math>.
+Pomysł może polegać na rozszerzeniu zbioru <math>\mathbf{Num}</math> o dodatkowy element <math>\bot</math>:
-n_1 \leq n_2, s \Longrightarrow false, s    o ile
+<math>
-n_1 > n_2
+n \, ::= \,\, \bot \,\,|\,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
 </math>
-Reguły powyższe zależą od semantyki wyrażen arytmetycznych.
+Wtedy nie musimy pisać dwóch bardzo podobnych wariantów reguł.
-Zauważmy, że ponownie pozostawiliśmy dowolność jeśli chodzi o
+Dodatkowo, w tym rozwiązaniu warto poczynić umowę, że <math>s(x) = \bot</math> reprezentuje brak wartości zmiennej <math>x</math>.
-kolejność obliczania wyrażeń arytmetycznych e_1 i e_2.
+Wtedy stany są funkcjami całkowitymi z <math>\mathbf{Var}</math> w <math>\mathbf{Num}</math>, przyjmującymi wartość różną od <math>\bot</math> tylko dla skończenie wielu elementów.
+Pewnym mankamentem jest to, że teraz <math>n = \bot</math> może pojawiać się w wyrażeniach podobnie jak stałe.
+Tym niemniej nie musimy adaptować reguł dla stałych tak, aby radziły one sobie z <math>n = \bot</math>, ponieważ wyrażenia zawierające <math>\bot</math> możemy również uważać za roszerzenie składni.
-Rozważmy teraz instrukcję warunkową i instrukcję pętli.
+Jeśli jednak dopuścimy symbol <math>\bot</math> w wyrażeniach, to możemy elegancko wybrnąć z sytuacji, rozszerzając operacje arytmetyczne na zbiór <math>\mathbf{Num} \cup \{ \bot \}</math> tak, aby zachowywały one nieokreśloność:
-Najpierw obliczamy wartość dozoru:
 <math>
-\frac{b, s \Longrightarrow b', s}
+n + \bot = \bot + n = \bot</math>
-{if b then I_1 else I_2, s \Longrightarrow
-if b' then I_1 else I_2, s}
-\frac{b, s \Longrightarrow b', s}
+Trzeba jednak w takim razie zadbać o to, aby wyrażenie <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> obliczało się normalnie tylko wtedy, gdy wartość wyrażenia <math>e_1</math> jest różna od <math>\bot</math>.
-{while b do I, s \Longrightarrow while b' do I, s}
+,
+<br>
+'''Wariant 3'''
+<br>
+Zrewidujmy teraz podstawowe założenia, które dotychczas poczyniliśmy.
+Jednym z nich było przyjęcie ogólnej postaci tranzycji:
+<math>
+e, s \,\Longrightarrow, e', s'
 </math>
-a gdy dozór jest już obliczony, podejmujemy decyzję.
+pozwalającej na zmianę stanu podczas obliczania wyrażenia.
-W przypadku instrukcji warunkowej reguły są oczywiste:
+Czy faktycznie był to dobry pomysł? Czy moglibyśmy poradzić sobie przy pomocy tranzycji postaci
 <math>
-if true then I_1 else I_2, s \Longrightarrow
+e, s \,\Longrightarrow, e', s ?
-I_1, s
-if false then I_1 else I_2, s \Longrightarrow
-I_2, s
 </math>
-Gorzej jest w przypadku instukcji pętli. Reguła mogłaby wyglądać tak:
+Spróbujmy! Oto nowa wersja jednej z reguł dla <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math>, dotycząca kroku wewnątrz <math>e_1</math>:
 <math>
-while true do I, s \Longrightarrow I; while ? do I, s
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+{\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow, \mathbf{let}\, x = e'_1 \,\mathbf{in}\, e_2, s}
 </math>
-ale nie wiemy już, jaki był dozór pętli (widzimy tylko wynik
+Dotychczas nie ma problemu: podwyrażenie <math>e_1</math> jest prawidłowo obliczane w stanie <math>s</math>. Trudność pojawi się, gdy
-obliczenia tego dozoru w stanie s, true).
+zakończymy obliczanie <math>e_1</math> i przejdziemy do <math>e_2</math>.
-Możemy odwołać się więc do tranzycji dużych kroków:
+Oto możliwa reguła:
 <math>
-\frac{b, s \longrightarrow true}
+\frac{e, s[x \mapsto n] \,\Longrightarrow, e', s[x \mapsto n] }
-{while b do I, s \Longrightarrow I; while b do I, s}
+     {\mathbf{let}\, x = n \,\mathbf{in}\, e, s \,\Longrightarrow, \mathbf{let}\, x = n \,\mathbf{in}\, e', s}</math>
+Okazuje się, że wszystko jest w porządku. Wyrażenie <math>e</math> obliczamy w prawidłowym stanie, tzn. z wartością <math>n</math> przypisaną zmiennej <math>x</math>.
+Mały krok w <math>e</math> daje przyczynek do małego kroku w całym wyrażeniu, a przy tym stan pozostaje niezmieniony.
+Przy tym wogóle nie potrzebujemy przywracać poprzedniej wartości zmiennej <math>x</math>, ponieważ <math>x</math> zyskuje nową wartość "tylko" na potrzeby obliczania podwyrażenia <math>e</math>!
+Można na to również spojrzeć inaczej: informacja o nowej wartości <math>n</math>  dla zmiennej <math>x</math> nie jest jawnie dodawana do stanu <math>s</math>, ale jest przechowywana w składni wyrażenia <math>\mathbf{let}\, x = n \,\mathbf{in}\, \ldots</math> jako deklaracja <math>x = n</math>.
+Na końcu musimy oczywiście pozbyć się tej deklaracji za pomocą następującej tranzycji:
-\frac{b, s \longrightarrow false}
+<math>
-{while b do I, s \Longrightarrow s}
+\mathbf{let}\, x = n \,\mathbf{in}\, n', s \,\Longrightarrow, n', s
 </math>
-Takie rozwiązanie nie jest zatem ,,czystą'' semantyką
+Podsumujmy. Okazuje się, że rozwiązanie nie było wcale łatwe, nawet dla tak prościutkiego języka. W przyszłości przekonamy się, że łatwiej jest poradzić sobie z zagadnieniem wiązania identyfikatorów w semantyce naturalnej (duże kroki).
-małych kroków.
+W wariancie 1 i 2 wprowadziliśmy do języka dodatkowe elementy, tak by łatwiej było pisać reguły. W przyszłości będziemy czasem stosować takie podejście.
-Istnieją inne możliwe rozwiązania, w stylu małych kroków,
+Niekiedy jednak rozszerzanie języka będzie zabronione.
-których znalezienie pozostawiamy dociekliwemu czytelnikowi.
-Na koniec podajemy reguły dla operacji arytmetycznych, na przykładzie
+</div></div>
-dodawania.
-Przyjmijmy, dla przykładu, strategię lewostronną:
+== Zadania domowe ==
+{{cwiczenie|1|cw1.dom|
+Zapisz wariant 2 semantyki z poprzedniego zadania.
+}}
+{{cwiczenie|2|cw2.dom|
+Dotychczas wystąpienie błędu podczas obliczania wyrażenia, np. odwołanie do niezainicjowanej zmiennej, powodowało, że wyrażenie nie posiadało wartości (nie było ciągu tranzycji prowadzących do konfiguracji końcowej).
+Zmodyfikuj którąś z semantyk z poprzednich zadań tak, aby błąd był komunikowany jako jedna z konfiguracji końcowych.
+To znaczy: jeśli obliczenie wyrażenia <math>e</math> w stanie <math>s</math> jest niemożliwe bo wystąpił błąd, to
 <math>
-\frac{e_1, s \Longrightarrow e'_1, s}
+e, s \,\Longrightarrow^{*}\, \mathtt{Blad}</math>
-{e_1 + e_2, s \Longrightarrow e'_1 + e_2, s}
+}}
-\frac{e_2, s \Longrightarrow e'_2, s}
-{n + e_2, s \Longrightarrow n + e'_2, s}
-n_1 + n_2, s \Longrightarrow n, s   o ile
+{{cwiczenie|3|cw3.dom|
-n = n_1 + n_2
+Rozważ rozszerzenie języka wyrażeń o wyrażenia boolowskie:
+<math>
+n \, ::= \,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
 </math>
+<math>
+x \, ::= \,\, \ldots \, (identyfikatory) \, \ldots
+</math>
-==== Zadanie: ====
-Rozważ dodatkowo operację dzielenia:
 <math>
-e \, ::= \,\,   \ldots   \,\,|\,\,
+b \, ::= \,\,
-         e_1 / e_2
+        \mathbf{true}   \,\,|\,\,
+        \mathbf{false}  \,\,|\,\,
+         e_1 \leq e_2  \,\,|\,\,
+        \neg b  \,\,|\,\,
+        b_1  \land  b_2
 </math>
-i rozszerz semantyki z poprzedniego zadania tak, by dzielenie przez
-zero kończyło program.
-Zamiast stanu wynikiem programu powinna byc informacja
-o błędzie.
-==== Rozwiązanie: ====
+<math>
+e \,  ::=  \,\,
+        n   \,\,|\,\,
+        x   \,\,|\,\,
+        e_1 + e_2   \,\,|\,\,
+        \mathbf{if}\, b \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3  \,\,|\,\,
+        \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
+</math>
-....
+Zaproponuj semantykę małych kroków dla tego języka.
+Rozważ różne strategie obliczania wyrażeń boolowskich, oraz podejście leniwe.
+Na przykład w strategii lewostronnej dla <math>b_1 \land b_2</math>, gdy <math>b_1</math> zostało obliczone do <math>\mathbf{false}</math>, w podejściu leniwym nie ma wogóle potrzeby obliczania <math>b_2</math>.
+}}