Semantyka i weryfikacja programów/Ćwiczenia 1: Różnice pomiędzy wersjami

← poprzednia edycja

WizualnieWikikod

Aktualna wersja na dzień 21:29, 11 wrz 2023

Zawartość

Tematem tych zajęć jest semantyka operacyjna wyrażeń (małe kroki).

Semantyka operacyjna wyrażeń

Ćwiczenie 1

Rozważmy bardzo prosty język wyrażeń, którego składnia opisana jest następującą gramatyką:

$n : : = 0 | 1 | \dots$

$x : : = \dots (i d e n t y f i k a t o r y) \dots$

$e : : = n | x | e_{1} + e_{2} | 𝐢 𝐟 e_{1} 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}$

Wynikiem wyrażenienia warunkowego $𝐢 𝐟 e_{1} 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}$ jest wartość wyrażenia $e_{2}$ , o ile wyrażenie $e_{1}$ oblicza się do wartości różnej od zera; w przeciwnym przypadku wynikiem jest wartość wyrażenia $e_{3}$ .

Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.

Rozwiązanie

Zacznijmy od ustalenia notacji i dziedzin syntaktycznych. Niech $𝐍 𝐮 𝐦$ oznacza zbiór stałych liczbowych, $n \in 𝐍 𝐮 𝐦 = {0, 1, \dots}$ . Podobnie, niech $𝐕 𝐚 𝐫$ oznacza zbiór identyfikatorów, które mogą być nazwami zmiennych; $x \in 𝐕 𝐚 𝐫$ . Wreszcie, niech $𝐄 𝐱 𝐩$ oznacza zbiór wyrażeń; $e \in 𝐄 𝐱 𝐩$ . Dla ułatwienia zapisywania reguł zakładamy, że stałe liczbowe są wyrażeniami, czyli $𝐍 𝐮 𝐦 \subseteq 𝐄 𝐱 𝐩$ .

Będziemy potrzebować zbioru "stanów", opisujących wartości przypisane zmiennym. Najprostszym rozwiązaniem jest przyjąć, że stan to funkcja z $𝐕 𝐚 𝐫$ do $𝐍 𝐮 𝐦$ . Oznaczmy przez $𝐒 𝐭 𝐚 𝐭 𝐞$ zbiór wszystkich takich funkcji; stany oznaczać będziemy przez $s, s_{1}, s^{'}, \dots \in 𝐒 𝐭 𝐚 𝐭 𝐞$ .

W naszej semantyce będziemy potrzebowac tranzycji dwóch postaci. Po pierwsze, tranzycje postaci

$e, s ⟹, e^{'}, s$

oznaczające mały krok w trakcie obliczania wyrażenia $e$ w stanie $s$ , w wyniku którego $e$ wyewoluowało do $e^{'}$ . Stan nie ulega zmianie podczas obliczania wyrażenia (nie ma tzw. efektów ubocznych), więc to samo $s$ figuruje po lewej i prawej stronie strzałki.

Po drugie, tranzycje postaci

$e, s ⟹, n$

będą oznaczaczać, że wyrażenie $e$ jest już policzone, a jego wartością jest $n$ .

Zatem przyjmijmy, że zbiór konfiguracji to

$(𝐄 𝐱 𝐩 \times 𝐒 𝐭 𝐚 𝐭 𝐞) \cup 𝐍 𝐮 𝐦$

a konfiguracje końcowe to $𝐍 𝐮 𝐦$ .

Uwaga

Tak naprawdę, druga postać tranzycji nie jest niezbędna, gdyż moglibyśmy umówić się, że konfiguracje końcowe to $𝐍 𝐮 𝐦 \times 𝐒 𝐭 𝐚 𝐭 𝐞$ .

Najprostsze są tranzycje prowadzące do konfiguracji końcowej:

$n, s ⟹, n$

Symbol $n$ po lewej stronie to wyrażenie składające się ze stałej liczbowej, podczas gdy $n$ po prawej stronie reprezentuje liczbę będącą wartością wyrażenia.

Zmienna oblicza się do swojej wartości w bieżącym stanie:

$x, s ⟹, n, s o ile s (x) = n$

Teraz zajmiemy się dodawaniem $e_{1} + e_{2}$ . Ponieważ semantyka jest w stylu małych kroków, musimy zdecydować się, czy najpierw obliczyć pierwszy (lewy) składnik $e_{1}$ , czy drugi? Jeśli wybierzemy lewy (strategia "lewostronna"), otrzymamy regułę:

$e_{1} + e_{2}, s ⟹, e'_{1} + e_{2}, s o ile e_{1}, s ⟹, e'_{1}, s$

Reguły tej postaci będziemy zapisywać tak:

$\frac{e_{1}, s ⟹, e'_{1}, s}{e_{1} + e_{2}, s ⟹, e'_{1} + e_{2}, s}$

Czyli mały krok w $e_{1}$ stanowi też mały krok w $e_{1} + e_{2}$ . Po zakończeniu obliczania $e_{1}$ przechodzimy do $e_{2}$ :

$\frac{e_{2}, s ⟹, e'_{2}, s}{n + e_{2}, s ⟹, n + e'_{2}, s}$

A na końcu dodajemy:

$n_{1} + n_{2}, s ⟹, n, s o ile n = n_{1} + n_{2}$

Zwróćmy tutaj uwagę na pewną subtelność, dotyczącą dwóch wystąpień symbolu $+$ : pierwsze wystąpienie oznacza jedną z konstrukcji składniowych języka, a drugie oznacza operację dodawania w zbiorze $𝐍 𝐮 𝐦$ . Pozwalamy sobie na taką kolizję oznaczeń, gdyż nie powinna ona prowadzić do niejednoznaczności. Pamiętajmy, że składnia języka jest składnią abstrakcyjną, więc zamiast $e_{1} + e_{2}$ moglibyśmy równie dobrze pisać np. $a d d (e_{1}, e_{2})$ , a wtedy reguła wyglądałaby tak:

$a d d (n_{1}, n_{2}), s ⟹, n, s o ile n = n_{1} + n_{2}$

Inną możliwą strategią obliczania $e_{1} + e_{2}$ jest strategia "prawostronna", którą otrzymujemy zastępując pierwsze dwie z trzech powyższych reguł przez:

$\frac{e_{2}, s ⟹, e'_{2}, s}{e_{1} + e_{2}, s ⟹, e_{1} + e'_{2}} \frac{e_{1}, s ⟹, e'_{1}, s}{e_{1} + n, s ⟹, e'_{1} + n, s}$

Ponadto, jeśli przyjmiemy regułę pierwszą (dla $e_{1}$ ), trzecią i czwartą (dla $e_{2}$ ), otrzymamy strategię "równoległą", polegającą na obliczaniu jednocześnie $e_{1}$ i $e_{2}$ :

$\frac{e_{1}, s ⟹, e'_{1}, s}{e_{1} + e_{2}, s ⟹, e'_{1} + e_{2}, s} \frac{e_{2}, s ⟹, e'_{2}, s}{e_{1} + e_{2}, s ⟹, e_{1} + e'_{2}} n_{1} + n_{2}, s ⟹, n, s o ile n = n_{1} + n_{2}$

Bardziej precyzyjnie mówiąc, małe kroki obliczające obydwa podwyrażenia przeplatają się, i to w dowolny sposób. Ta dowolność prowadzi do niedeterminizmu, czyli do sytuacji, gdy kolejna (następna) konfiguracja nie jest wyznaczona jednoznacznie. Jest tak, gdyż możemy mieć do wyboru dwie różne tranzycje

$e_{1} + e_{2}, s ⟹, e'_{1} + e_{2}, s e_{1} + e_{2}, s ⟹, e_{1} + e'_{2}, s$

Zauważmy natomiast, że kolejność przeplatania się małych kroków obliczających $e_{1}$ i $e_{2}$ nie wpływa w tym przypadku na końcową wartość całego wyrażenia.

Na koniec reguły dla wyrażenia warunkowego.

$\frac{e_{1}, s ⟹, e'_{1}, s}{𝐢 𝐟 e_{1} 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}, s ⟹, 𝐢 𝐟 e'_{1} 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}, s}$

$𝐢 𝐟 n 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}, s ⟹, e_{2}, s o ile n \neq 0$

$𝐢 𝐟 n 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3}, s ⟹, e_{3}, s o ile n = 0$

Ćwiczenie 2

Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję

$e : : = \dots | 𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$

Wyrażenie $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ zawiera w sobie deklarację $x = e_{1}$ , która stanowi mechanizm wiązania identyfikatorów w naszym języku. Deklaracja $x = e_{1}$ wprowadza nową zmienną $x$ oraz przypisuje jej wartość. Wartość wyrażenia $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ obliczamy następująco: najpierw oblicza się wartość $e_{1}$ , podstawia ją za zmienną $x$ , a następnie oblicza wyrażenie $e_{2}$ . Zakresem zmiennej $x$ jest wyrażenie $e_{2}$ , czyli wewnątrz $e_{2}$ można odwoływać się (wielokrotnie) do zmiennej $x$ ; Ogólniej, odwołania do zmiennej w wyrażeniu odnoszą się do "najbliższej" (najbardziej zagnieżdzonej) deklaracji tej zmiennej. Taki mechanizm wiązania identyfikatorów nazywamy wiązaniem statycznym. Przyjmujemy zwykłe (statyczne) reguły przesłaniania zmiennych, np. jeśli w $e_{2}$ występuje podwyrażenie $𝐥 𝐞 𝐭 x = e 𝐢 𝐧 e^{'}$ , to deklaracja $x = e$ "przesłania" deklarację $x = e_{1}$ w wyrażeniu $e^{'}$ .

Zakładamy, że na początku wartości wszystkich zmiennych są nieokreślone, czyli zmienne są niezainicjowane, a odwołanie do niezainicjowanej zmiennej jest uważane za niepoprawne.

{{przyklad|||

$𝐥 𝐞 𝐭 x = 0 𝐢 𝐧 𝐥 𝐞 𝐭 y = 7 𝐢 𝐧 𝐥 𝐞 𝐭 x = y + 3 𝐢 𝐧 x + x + y \mapsto wynik = 24$

$𝐥 𝐞 𝐭 y = 5 𝐢 𝐧 𝐥 𝐞 𝐭 x = (𝐥 𝐞 𝐭 y = 3 𝐢 𝐧 y + y) 𝐢 𝐧 x + y \mapsto wynik = 11$

$𝐥 𝐞 𝐭 z = 5 𝐢 𝐧 x + z \mapsto brak wyniku, odwołanie do niezainicjowanej zmiennej x$

$𝐥 𝐞 𝐭 x = 1 𝐢 𝐧 𝐥 𝐞 𝐭 x = x + x 𝐢 𝐧 x + x \mapsto wynik = 4$

Rozwiązanie

Podobnie jak poprzednio, stan powinien opisywać wartości przypisane zmiennym. Tym razem jednak uwzględnimy niezainicjowane zmienne, czyli zmienne bez żadnej wartości. Przyjmijmy zatem, że stan to skończona funkcja częściowa z $𝐕 𝐚 𝐫$ do $𝐍 𝐮 𝐦$ . Oznaczmy symbolem $𝐒 𝐭 𝐚 𝐭 𝐞$ zbiór wszystkich takich funkcji: $𝐒 𝐭 𝐚 𝐭 𝐞 = 𝐕 𝐚 𝐫 \to_{f i n} 𝐍 𝐮 𝐦$ . Naturalnym stanem początkowym jest stan "pusty", tzn. pusta funkcja częściowa, który będziemy oznaczać symbolem $\emptyset$ . Wartość wyrażenia $e$ w stanie początkowym wynosi $n$ , o ile zachodzi:

$e, \emptyset ⟹^{*} n$

Będziemy potrzebowac tranzycji dwóch postaci, podobnie jak poprzednio, ale pierwsza postać będzie nieco ogólniejsza:

$e, s ⟹, e^{'}, s^{'}$

Tranzycja ta oznacza mały krok w trakcie obliczania wyrażenia $e$ w stanie $s$ , w wyniku którego $e$ wyewoluowało do $e^{'}$ , a nowym stanem jest $s^{'}$ . Stan może się teraz zmienić na skutek deklaracji zmiennych.

Spróbujmy rozszerzyć semantykę z poprzedniego zadania. Ponieważ stan jest funkcją częściową, musimy zmienić niektóre reguły, np.

$x, s ⟹, n, s o ile s (x) jest określone i s (x) = n$

Następnie dodajemy reguły dla wyrażenia $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ . Gdy $e_{1}$ jest już obliczone, wystarczy reguła:

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹, e_{2}, s [x \mapsto n]$

Notacja $s [x \mapsto n]$ oznacza stan $s$ , który zmodyfikowano przypisując zmiennej $x$ wartość $n$ , niezależnie od tego, czy $s (x)$ było określone, czy nie, i pozostawiając niezmienione wartości dla pozostałych zmiennych. Formalnie

$s [x \mapsto n] (y) = {\begin{cases} n & y = x \\ s (y) & y \neq x \end{cases}$

W szczególności dla $y \neq x$ , $s [x \mapsto n] (y)$ jest określone wtedy i tylko wtedy, gdy $s (y)$ jest określone.

Natomiast aby obliczyc $e_{1}$ , potrzebujemy reguły:

$\frac{e_{1}, s ⟹, e'_{1}, s^{'}}{𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}, s ⟹, 𝐥 𝐞 𝐭 x = e'_{1} 𝐢 𝐧 e_{2}, s^{'}}$

Zwróćmy uwagę, że stan $s^{'}$ może być różny od $s$ , np. dlatego, że wewnątrz $e_{1}$ znajduje się podwyrażenie $𝐥 𝐞 𝐭 y = \dots$ .

Pytanie: czy taka semantyka jest poprawna?

Niestety nie, gdyż nie uwzględniamy ograniczonego zasięgu zmiennej. Rzućmy okiem na przykład:

$𝐥 𝐞 𝐭 x = (𝐥 𝐞 𝐭 z = 4 𝐢 𝐧 z + z + z) 𝐢 𝐧 z$

Według naszych intencji to wyrażenie nie ma wartości, gdyż ostatnie odwołanie do $z$ jest błędne. Natomiast według powyższych reguł mamy

$𝐥 𝐞 𝐭 x = (𝐥 𝐞 𝐭 z = 4 𝐢 𝐧 z + z + z) 𝐢 𝐧 z, \emptyset ⟹, 𝐥 𝐞 𝐭 x = z + z + z 𝐢 𝐧 z, \emptyset [z \mapsto 4] ⟹, \dots ⟹, 𝐥 𝐞 𝐭 x = 12 𝐢 𝐧 z, \emptyset [z \mapsto 4] ⟹, 12, \emptyset [z \mapsto 4] ⟹, 12!$

Nasz błąd polega na tym, że po zakończeniu obliczania podwyrażenia $𝐥 𝐞 𝐭 z = 4 𝐢 𝐧 z + z + z$ "zapominamy" przywrócić zmiennej $z$ poprzednią wartość (a właściwie brak wartości w przykładzie powyżej). Przedyskutujmy kilka wariantów.

Wariant 1

Wygodne i eleganckie rozwiązanie tego problemu jest możliwe, jeśli rozszerzymy składnię naszego języka. Intuicyjnie, reguła

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹, e_{2}, s [x \mapsto n]$

powinna zostać zastąpiona przez

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹ e_{2} 𝐭 𝐡 𝐞 𝐧 przywróć wartość zmiennej x, s [x \mapsto n]$

czyli potrzebujemy konstrukcji składniowej, która polega na obliczeniu wyrażenia $e_{2}$ , a następnie na przypisaniu zmiennej $x$ danej wartości. Rozszerzmy zatem składnię następujaco:

$e : : = \dots | e 𝐭 𝐡 𝐞 𝐧 x : = n$

Wyrażenie $e 𝐭 𝐡 𝐞 𝐧 x : = n$ jest w pewnym sensie dualne do $𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e$ , gdyż jedyna (choć niewątpliwie istotna) różnica między nimi to kolejność obliczenia $e$ i przypisania wartości na zmienną $x$ . Oto nowa reguła

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹, e_{2} 𝐭 𝐡 𝐞 𝐧 x : = n^{'}, s [x \mapsto n] o ile s (x) = n^{'}$

Pewna trudność pojawia się w sytuacji, gdy $s (x)$ jest nieokreślone, czyli gdy zmienna $x$ jest niezainicjowana -- reguła powyższa nie obejmuje wogóle takiej sytuacji. Najprostszym sposobem rozwiązania tej trudności jest rozszerzenie konstrukcji $e 𝐭 𝐡 𝐞 𝐧 x : = n$ :

$e : : = \dots | e 𝐭 𝐡 𝐞 𝐧 x : = n | e 𝐭 𝐡 𝐞 𝐧 x : = ⊥$

gdzie symbol $⊥$ oznacza brak wartości. Dodajemy również regułę:

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e_{2}, s ⟹, e_{2} 𝐭 𝐡 𝐞 𝐧 x : = ⊥, s [x \mapsto n] o ile s (x) jest nieokreślone$

Rozwiązanie to jest odrobinę nieeleganckie, gdyż prawie identyczne reguły musimy napisać dwukrotnie. Widać to np. w poniższych regułach, "scalających" semantykę dla $e 𝐭 𝐡 𝐞 𝐧 x : = n$ z semantyką pozostałych wyrażeń:

$\frac{e, s ⟹, e^{'}, s^{'}}{e 𝐭 𝐡 𝐞 𝐧 x : = n, s ⟹, e^{'} 𝐭 𝐡 𝐞 𝐧 x : = n, s^{'}}$

$n^{'} 𝐭 𝐡 𝐞 𝐧 x : = n, s ⟹, n^{'}, s [x \mapsto n]$

$n^{'} 𝐭 𝐡 𝐞 𝐧 x : = ⊥, s ⟹, n^{'}, s^{'} o ile s (x) jest określone i s^{'} = s ∖ {(x, s (x))}$

Wariant 2

Zanim przejdziemy do kolejnego wariantu, zastanówmy się, czy istnieje inny sposób rozwiązania trudności związanej z $n = ⊥$ , który pozwalałby uniknąć wprowadzania dodatkowej konstrukcji $e 𝐭 𝐡 𝐞 𝐧 x : = ⊥$ . Pomysł może polegać na rozszerzeniu zbioru $𝐍 𝐮 𝐦$ o dodatkowy element $⊥$ :

$n : : = ⊥ | 0 | 1 | \dots$

Wtedy nie musimy pisać dwóch bardzo podobnych wariantów reguł. Dodatkowo, w tym rozwiązaniu warto poczynić umowę, że $s (x) = ⊥$ reprezentuje brak wartości zmiennej $x$ . Wtedy stany są funkcjami całkowitymi z $𝐕 𝐚 𝐫$ w $𝐍 𝐮 𝐦$ , przyjmującymi wartość różną od $⊥$ tylko dla skończenie wielu elementów. Pewnym mankamentem jest to, że teraz $n = ⊥$ może pojawiać się w wyrażeniach podobnie jak stałe. Tym niemniej nie musimy adaptować reguł dla stałych tak, aby radziły one sobie z $n = ⊥$ , ponieważ wyrażenia zawierające $⊥$ możemy również uważać za roszerzenie składni.

Jeśli jednak dopuścimy symbol $⊥$ w wyrażeniach, to możemy elegancko wybrnąć z sytuacji, rozszerzając operacje arytmetyczne na zbiór $𝐍 𝐮 𝐦 \cup {⊥}$ tak, aby zachowywały one nieokreśloność:

$n + ⊥ = ⊥ + n = ⊥$

Trzeba jednak w takim razie zadbać o to, aby wyrażenie $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ obliczało się normalnie tylko wtedy, gdy wartość wyrażenia $e_{1}$ jest różna od $⊥$ . ,
Wariant 3

Zrewidujmy teraz podstawowe założenia, które dotychczas poczyniliśmy. Jednym z nich było przyjęcie ogólnej postaci tranzycji:

$e, s ⟹, e^{'}, s^{'}$

pozwalającej na zmianę stanu podczas obliczania wyrażenia. Czy faktycznie był to dobry pomysł? Czy moglibyśmy poradzić sobie przy pomocy tranzycji postaci

$e, s ⟹, e^{'}, s ?$

Spróbujmy! Oto nowa wersja jednej z reguł dla $𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$ , dotycząca kroku wewnątrz $e_{1}$ :

$\frac{e_{1}, s ⟹, e'_{1}, s}{𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}, s ⟹, 𝐥 𝐞 𝐭 x = e'_{1} 𝐢 𝐧 e_{2}, s}$

Dotychczas nie ma problemu: podwyrażenie $e_{1}$ jest prawidłowo obliczane w stanie $s$ . Trudność pojawi się, gdy zakończymy obliczanie $e_{1}$ i przejdziemy do $e_{2}$ . Oto możliwa reguła:

$\frac{e, s [x \mapsto n] ⟹, e^{'}, s [x \mapsto n]}{𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e, s ⟹, 𝐥 𝐞 𝐭 x = n 𝐢 𝐧 e^{'}, s}$

Okazuje się, że wszystko jest w porządku. Wyrażenie $e$ obliczamy w prawidłowym stanie, tzn. z wartością $n$ przypisaną zmiennej $x$ . Mały krok w $e$ daje przyczynek do małego kroku w całym wyrażeniu, a przy tym stan pozostaje niezmieniony. Przy tym wogóle nie potrzebujemy przywracać poprzedniej wartości zmiennej $x$ , ponieważ $x$ zyskuje nową wartość "tylko" na potrzeby obliczania podwyrażenia $e$ ! Można na to również spojrzeć inaczej: informacja o nowej wartości $n$ dla zmiennej $x$ nie jest jawnie dodawana do stanu $s$ , ale jest przechowywana w składni wyrażenia $𝐥 𝐞 𝐭 x = n 𝐢 𝐧 \dots$ jako deklaracja $x = n$ . Na końcu musimy oczywiście pozbyć się tej deklaracji za pomocą następującej tranzycji:

$𝐥 𝐞 𝐭 x = n 𝐢 𝐧 n^{'}, s ⟹, n^{'}, s$

Podsumujmy. Okazuje się, że rozwiązanie nie było wcale łatwe, nawet dla tak prościutkiego języka. W przyszłości przekonamy się, że łatwiej jest poradzić sobie z zagadnieniem wiązania identyfikatorów w semantyce naturalnej (duże kroki). W wariancie 1 i 2 wprowadziliśmy do języka dodatkowe elementy, tak by łatwiej było pisać reguły. W przyszłości będziemy czasem stosować takie podejście. Niekiedy jednak rozszerzanie języka będzie zabronione.

Zadania domowe

Ćwiczenie 1

Zapisz wariant 2 semantyki z poprzedniego zadania.

Ćwiczenie 2

Dotychczas wystąpienie błędu podczas obliczania wyrażenia, np. odwołanie do niezainicjowanej zmiennej, powodowało, że wyrażenie nie posiadało wartości (nie było ciągu tranzycji prowadzących do konfiguracji końcowej). Zmodyfikuj którąś z semantyk z poprzednich zadań tak, aby błąd był komunikowany jako jedna z konfiguracji końcowych. To znaczy: jeśli obliczenie wyrażenia $e$ w stanie $s$ jest niemożliwe bo wystąpił błąd, to

$e, s ⟹^{*} B l a d$

Ćwiczenie 3

Rozważ rozszerzenie języka wyrażeń o wyrażenia boolowskie:

$n : : = 0 | 1 | \dots$

$x : : = \dots (i d e n t y f i k a t o r y) \dots$

$b : : = 𝐭 𝐫 𝐮 𝐞 | 𝐟 𝐚 𝐥 𝐬 𝐞 | e_{1} \leq e_{2} | \neg b | b_{1} \land b_{2}$

$e : : = n | x | e_{1} + e_{2} | 𝐢 𝐟 b 𝐭 𝐡 𝐞 𝐧 e_{2} 𝐞 𝐥 𝐬 𝐞 e_{3} | 𝐥 𝐞 𝐭 x = e_{1} 𝐢 𝐧 e_{2}$

Zaproponuj semantykę małych kroków dla tego języka. Rozważ różne strategie obliczania wyrażeń boolowskich, oraz podejście leniwe. Na przykład w strategii lewostronnej dla $b_{1} \land b_{2}$ , gdy $b_{1}$ zostało obliczone do $𝐟 𝐚 𝐥 𝐬 𝐞$ , w podejściu leniwym nie ma wogóle potrzeby obliczania $b_{2}$ .

Semantyka i weryfikacja programów/Ćwiczenia 1: Różnice pomiędzy wersjami

Aktualna wersja na dzień 21:29, 11 wrz 2023

Zawartość

Semantyka operacyjna wyrażeń

Zadania domowe

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia

@@ Linia 1: / Linia 1: @@
+== Zawartość ==
-== Ćwiczenia 1: semantyka operacyjna wyrażeń (małe kroki) ==
+Tematem tych zajęć jest semantyka operacyjna wyrażeń (małe kroki).
-==== Zadanie 1 (przygotowawcze) ====
+== Semantyka operacyjna wyrażeń ==
-Rozważmy prosty język wyrażeń, którego składnia opisana jest
-następującą gramatyką:
+{{cwiczenie|1|cw1|
+Rozważmy bardzo prosty język wyrażeń, którego składnia opisana jest następującą gramatyką:
 <math>
@@ Linia 23: / Linia 27: @@
 </math>
-Wynikiem wyrażenienia warunkowego <math> \mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3 </math>
+Wynikiem wyrażenienia warunkowego <math>\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3</math> jest wartość wyrażenia <math>e_2</math>, o ile wyrażenie <math>e_1</math> oblicza się do wartości różnej od zera; w przeciwnym przypadku wynikiem jest wartość wyrażenia <math>e_3</math>.
-jest wartość wyrażenia <math> e_2 </math>, o ile wyrażenie
-<math> e_1 </math> oblicza się do wartości różnej od zera; w przeciwnym
-przypadku wynikiem jest wartość wyrażenia <math> e_3 </math>.
 Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.
+}}
+<div class="mw-collapsible mw-made=collapsible mw-collapsed">
-==== Rozwiązanie ====
+<span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie</span>
+<div class="mw-collapsible-content" style="display:none">
 Zacznijmy od ustalenia notacji i dziedzin syntaktycznych.
-Niech <math> \mathbf{Num} </math> oznacza zbiór stałych liczbowych,
+Niech <math>\mathbf{Num}</math> oznacza zbiór stałych liczbowych, <math>n \in \mathbf{Num} = \{ 0, 1, \ldots \}</math>.
-<math> n \in \mathbf{Num} = \{ 0, 1, \ldots \} </math>.
+Podobnie, niech <math>\mathbf{Var}</math> oznacza zbiór identyfikatorów, które mogą być nazwami zmiennych; <math>x \in \mathbf{Var}</math>.
-Podobnie, niech <math> \mathbf{Var} </math> oznacza zbiór identyfikatorów, które
+Wreszcie, niech <math>\mathbf{Exp}</math> oznacza zbiór wyrażeń; <math>e \in \mathbf{Exp}</math>.
-mogą być nazwami zmiennych; <math> x \in \mathbf{Var} </math>.
+Dla ułatwienia zapisywania reguł zakładamy, że stałe  liczbowe są wyrażeniami, czyli <math>\mathbf{Num} \subseteq \mathbf{Exp}</math>.
-Wreszcie, niech <math> \mathbf{Exp} </math> oznacza zbiór wyrażeń;
-<math> e \in \mathbf{Exp} </math>.
-Dla ułatwienia zapisywania reguł zakładamy, ze stałe
-liczbowe sa wyrażeniami, czyli <math> \mathbf{Num} \subseteq \mathbf{Exp} </math>.
-Będziemy potrzebować zbioru ''stanów'', opisujących wartości
+Będziemy potrzebować zbioru "stanów", opisujących wartości przypisane zmiennym.
-przypisane zmiennym.
+Najprostszym rozwiązaniem jest przyjąć, że stan to funkcja z <math>\mathbf{Var}</math> do <math>\mathbf{Num}</math>.
-Najprostszym rozwiązaniem jest przyjąc, że stan to funkcja
+Oznaczmy przez <math>\mathbf{State}</math> zbiór wszystkich takich funkcji; stany oznaczać będziemy przez <math>s, s_1, s', \ldots \in \mathbf{State}</math>.
-z <math> \mathbf{Var} </math> do <math> \mathbf{Num} </math>.
-Oznaczmy przez <math> \mathbf{State} </math> zbiór wszystkich takich funkcji;
-stany oznaczac będziemy przez <math> s, s_1, s', \ldots \in \mathbf{State} </math>.
 W naszej semantyce będziemy potrzebowac tranzycji dwóch postaci.
-Po pierwsze, tranzycja
+Po pierwsze, tranzycje postaci
 <math>
-e, s \,\Longrightarrow\, e', s
+e, s \,\Longrightarrow, e', s
 </math>
-oznaczająca mały krok w trakcie obliczania wyrażenia <math> e </math>
+oznaczające mały krok w trakcie obliczania wyrażenia <math>e</math> w stanie <math>s</math>,  w wyniku którego <math>e</math> wyewoluowało do <math>e'</math>.
-w stanie <math> s </math>, w wyniku którego <math> e </math> wyewoluowało do
+Stan nie ulega zmianie podczas obliczania wyrażenia (nie ma tzw. ''efektów ubocznych''), więc to samo <math>s</math> figuruje po lewej i prawej stronie strzałki.
-<math> e' </math>. Stan nie ulega zmiania podczas obliczania wyrażenia,
-więc to samo <math> s </math> figuruje po lewej i prawej stronie strzałki.
+Po drugie, tranzycje postaci
-Po drugie, tranzycja
 <math>
-e, s \,\Longrightarrow\, n
+e, s \,\Longrightarrow, n
 </math>
-będzie oznaczaczać, że wyrażenie <math> e </math> jest już policzone,
+będą oznaczaczać, że wyrażenie <math>e</math> jest już policzone, a jego wartością jest <math>n</math>.
-a jego wartością jest <math> n </math>.
 Zatem przyjmijmy, że zbiór konfiguracji to
@@ Linia 76: / Linia 70: @@
 </math>
-a konfiguracje końcowe to <math> \mathbf{Num} </math>.
+a konfiguracje końcowe to <math>\mathbf{Num}</math>.
+{{
+uwaga||uwaga1|
+Tak naprawdę, druga postać tranzycji nie jest niezbędna, gdyż moglibyśmy umówić się, że konfiguracje końcowe to <math>\mathbf{Num} \times \mathbf{State}</math>.
+}}
+Najprostsze są tranzycje prowadzące do konfiguracji końcowej:
-'''Uwaga:''' tranzycje pierwszej postaci mogłyby również wyglądać
-następująco:
 <math>
-e, s \,\Longrightarrow\, e';
+n, s \,\Longrightarrow, n
 </math>
-wtedy zbiorem konfiguracji byłby zbiór
+Symbol <math>n</math> po lewej stronie to wyrażenie składające się ze stałej liczbowej, podczas gdy <math>n</math> po prawej stronie reprezentuje liczbę będącą wartością wyrażenia.
+Zmienna oblicza się do swojej wartości w bieżącym stanie:
 <math>
-( \mathbf{Exp} \times \mathbf{State} ) \, \cup \, \mathbf{Exp}
+x, s \,\Longrightarrow, n, s \quad \mbox{ o ile } s(x) = n</math>
+Teraz zajmiemy się dodawaniem <math>e_1 + e_2</math>. Ponieważ semantyka jest w stylu małych kroków, musimy zdecydować się, czy najpierw obliczyć pierwszy (lewy) składnik <math>e_1</math>, czy drugi?
+Jeśli wybierzemy lewy (strategia "lewostronna"), otrzymamy regułę:
+<math>
+e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s
+\quad \mbox{ o ile } \quad
+e_1, s \,\Longrightarrow, e'_1, s</math>
+Reguły tej postaci będziemy zapisywać tak:
+<math>
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+     {e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s}
 </math>
-a konfiguracje końcowe pozostałyby bez zmian
-'''(koniec uwagi)'''.
+Czyli mały krok w <math>e_1</math> stanowi też mały krok w <math>e_1 + e_2</math>.
+Po zakończeniu obliczania <math>e_1</math> przechodzimy do <math>e_2</math>:
+<math>
+\frac{e_2, s \,\Longrightarrow, e'_2, s}
+{n + e_2, s \,\Longrightarrow, n + e'_2, s}</math>
+A na końcu dodajemy:
+<math>
+n_1 + n_2, s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
+Zwróćmy tutaj uwagę na pewną subtelność, dotyczącą dwóch wystąpień symbolu <math>+</math>: pierwsze wystąpienie oznacza jedną z konstrukcji składniowych języka, a drugie oznacza operację dodawania w zbiorze <math>\mathbf{Num}</math>.
+Pozwalamy sobie na taką kolizję oznaczeń, gdyż nie powinna ona prowadzić do niejednoznaczności. Pamiętajmy, że składnia języka jest składnią abstrakcyjną, więc zamiast <math>e_1 + e_2</math> moglibyśmy równie dobrze pisać np. <math>{\mathrm{add}}(e_1, e_2)</math>, a wtedy reguła wyglądałaby tak:
+<math>
+\mathrm{add}(n_1, n_2), s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
+Inną możliwą strategią obliczania <math>e_1 + e_2</math> jest strategia "prawostronna", którą otrzymujemy zastępując pierwsze dwie z trzech powyższych reguł przez:
+<math>
+\frac{e_2, s \,\Longrightarrow, e'_2, s}
+     {e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2}
+\quad \quad
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+     {e_1 + n, s \,\Longrightarrow, e'_1 + n, s}</math>
+Ponadto, jeśli przyjmiemy regułę pierwszą (dla <math>e_1</math>), trzecią i czwartą (dla <math>e_2</math>), otrzymamy strategię "równoległą", polegającą na obliczaniu jednocześnie <math>e_1</math> i <math>e_2</math>:
+<math>
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+     {e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s}
+\quad \quad
+\frac{e_2, s \,\Longrightarrow, e'_2, s}
+     {e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2}
+\quad \quad
+n_1 + n_2, s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
+Bardziej precyzyjnie mówiąc, małe kroki obliczające obydwa podwyrażenia przeplatają się, i to w dowolny sposób.
+Ta dowolność prowadzi do ''niedeterminizmu'', czyli do sytuacji, gdy kolejna (następna) konfiguracja nie jest wyznaczona jednoznacznie.
+Jest tak, gdyż możemy mieć do wyboru dwie różne tranzycje
+<math>
+e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s
+\quad \quad \quad
+e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2, s</math>
-Najprostsze są tranzycje prowadzące do konfiguracji końcowej:
+Zauważmy natomiast, że kolejność przeplatania się małych kroków obliczających <math>e_1</math> i <math>e_2</math> nie wpływa w tym przypadku na końcową wartość całego wyrażenia.
+Na koniec reguły dla wyrażenia warunkowego.
+<math>
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+     {\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, \mathbf{if}\, e'_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s}
+</math>
 <math>
-n, s \,\Longrightarrow\, n
+\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, e_2, s \quad \mbox{ o ile } n \neq 0
 </math>
-Zmienna oblicza się do swojej wartości w bieżącym stanie:
 <math>
-x, s \,\Longrightarrow\, n, s \quad \mbox{ o ile } s(x) = n
+\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, e_3, s \quad \mbox{ o ile } n = 0
 </math>
-Teraz zajmiemy się dodawaniem <math> e_1 + e_2 </math>. Ponieważ semantyka jest w stylu małych
+</div></div>
-kroków, musimy zdecydować się czy najpierw obliczyć pierwszy (lewy) składnik
-<math> e_1 ] czy drugi?
-Jeśli wybierzemy lewy, otrzymamy regułę:
+{{cwiczenie|2|cw2|
+}}
+Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję
 <math>
-\frac{e_1, s \,\Longrightarrow\, e'_1, s}
+e \,  ::=  \,\,
-     {e_1 + e_2, s \,\Longrightarrow\, e'_1 + e_2}.
+        \ldots   \,\,|\,\,
+        \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
 </math>
-Czyli mały krok w <math> e_1 </math> stanowi też mały krok w <math> e_1 + e_2 </math>.
+Wyrażenie <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> zawiera w sobie deklarację <math>x = e_1</math>, która stanowi mechanizm wiązania identyfikatorów w naszym języku.
-Po zakończeniu obliczania <math> e_1 </math> przechodzimy do <math> e_2 </math>:
+Deklaracja <math>x = e_1</math> wprowadza nową zmienną <math>x</math> oraz przypisuje jej wartość.
+Wartość wyrażenia <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> obliczamy następująco: najpierw oblicza się wartość <math>e_1</math>, podstawia ją <font color=red>za</font> zmienną <math>x</math>, a następnie oblicza wyrażenie <math>e_2</math>.
+Zakresem zmiennej <math>x</math> jest wyrażenie <math>e_2</math>, czyli wewnątrz <math>e_2</math> można odwoływać się (wielokrotnie) do zmiennej <math>x</math>;
+Ogólniej, odwołania do zmiennej w wyrażeniu odnoszą się do "najbliższej" (najbardziej zagnieżdzonej) deklaracji tej zmiennej.
+Taki mechanizm wiązania identyfikatorów nazywamy ''wiązaniem statycznym''.
+Przyjmujemy zwykłe (statyczne) reguły przesłaniania zmiennych, np. jeśli w <math>e_2</math> występuje podwyrażenie <math>\mathbf{let}\, x = e \,\mathbf{in}\, e'</math>, to
+deklaracja <math>x = e</math> "przesłania" deklarację <math>x = e_1</math> w wyrażeniu <math>e'</math>.
+Zakładamy, że na początku wartości wszystkich zmiennych są ''nieokreślone'', czyli zmienne są niezainicjowane, a odwołanie do niezainicjowanej zmiennej jest uważane za niepoprawne.
+{{przyklad|||
 <math>
-\frac{e_2, s \,\Longrightarrow\, e'_2, s}
+\mathbf{let}\, x = 0 \,\mathbf{in}\, \mathbf{let}\, y = 7 \,\mathbf{in}\, \mathbf{let}\, x = y+3 \,\mathbf{in}\, x+x+y
-     {n + e_2, s \,\Longrightarrow\, n + e'_2, s}.
+\quad \quad \mapsto \quad \quad \mbox{wynik} = 24
+</math>
+<math>
+\mathbf{let}\, y = 5 \,\mathbf{in}\, \mathbf{let}\, x = (\, \mathbf{let}\, y = 3 \,\mathbf{in}\, y+y \,) \,\mathbf{in}\, x+y
+\quad \quad \mapsto \quad \quad \mbox{wynik} = 11
 </math>
-A na końcu dodajemy:
+<math>
+\mathbf{let}\, z = 5 \,\mathbf{in}\, x+z \quad \quad \mapsto \quad \quad \mbox{ brak wyniku, odwołanie do niezainicjowanej zmiennej } x
+</math>
 <math>
-n_1 + n_2, s \,\Longrightarrow\, n, s \quad \mbox{ o ile } n = n_1 + n_2.
+\mathbf{let}\, x = 1 \,\mathbf{in}\, \mathbf{let}\, x = x+x \,\mathbf{in}\, x+x
+\quad \quad \mapsto \quad \quad \mbox{wynik} = 4
 </math>
-Zauważmy tutaj pewną subtelność, dotyczącą dwóch wystąpień
+<div class="mw-collapsible mw-made=collapsible mw-collapsed">
-symbolu ''+'': pierwsze wystąpienie oznacza jedną z konstrukcji składniowych
+<span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie</span>
-języka, a drugie oznacza operację dodawania w zbiorze <math> \mathbf{Num} </math>.
+<div class="mw-collapsible-content" style="display:none">
-Pozwalamy sobie na taką kolizję oznaczeń, gdyż nie powinna ona
-prowadzić do niejednoznaczności. Pamiętajmy, że składnia języka jest
+Podobnie jak poprzednio, stan powinien opisywać wartości przypisane zmiennym.
-składnią abstrajkcyjną, więc zamiast <math> e_1 + e_2 </math> moglibyśmy równie
+Tym razem jednak uwzględnimy niezainicjowane zmienne, czyli zmienne bez żadnej wartości.
-dobrze pisać np. <math> {\mathrm{add}}(e_1, e_2) </math>.
+Przyjmijmy zatem, że stan to skończona funkcja częściowa z <math>\mathbf{Var}</math> do <math>\mathbf{Num}</math>.
+Oznaczmy symbolem <math>\mathbf{State}</math> zbiór wszystkich takich funkcji:
+<math>
+\mathbf{State} = \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Num}
+</math>.
+Naturalnym stanem początkowym jest stan "pusty", tzn. pusta funkcja częściowa, który będziemy oznaczać symbolem <math>\emptyset</math>.
+Wartość wyrażenia <math>e</math> w stanie początkowym wynosi <math>n</math>, o ile zachodzi:
+<math>
+e, \emptyset \,\Longrightarrow^{*}\, n</math>
+Będziemy potrzebowac tranzycji dwóch postaci, podobnie jak poprzednio, ale pierwsza postać będzie nieco ogólniejsza:
+<math>
+e, s \,\Longrightarrow, e', s'</math>
+Tranzycja ta oznacza mały krok w trakcie obliczania wyrażenia <math>e</math> w stanie <math>s</math>, w wyniku którego <math>e</math> wyewoluowało do <math>e'</math>, a nowym stanem jest <math>s'</math>.
+Stan może się teraz zmienić na skutek deklaracji zmiennych.
-Inna możliwą strategią obliczania <math> e_1 + e_2 </math> jest strategia
+Spróbujmy rozszerzyć semantykę z poprzedniego zadania.
-''prawostronna'', którą otrzymujemy zastępując pierwsze dwie z trzech
+Ponieważ stan jest funkcją częściową, musimy zmienić niektóre reguły, np.
-powyższych reguł przez:
 <math>
-\frac{e_2, s \,\Longrightarrow\, e'_2, s}
+x, s \,\Longrightarrow, n, s \quad \mbox{ o ile } s(x) \mbox{ jest określone i } s(x) = n
-     {e_1 + e_2, s \,\Longrightarrow\, e_1 + e'_2}
-\quad \quad \quad
-\frac{e_1, s \,\Longrightarrow\, e'_1, s}
-     {e_1 + n, s \,\Longrightarrow\, e'_1 + n, s}.
 </math>
-Ponadto, jeśli przyjmiemy wszystkie pięc reguł, otrzymamy strategię
+Następnie dodajemy reguły dla wyrażenia <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math>.
-''równoległą'', polegającą na obliczaniu jednocześnie <math> e_1 </math> i
+Gdy <math>e_1</math> jest już obliczone, wystarczy reguła:
-<math> e_2 </math>. Bardziej precyzyjnie mówiąc, małe kroki obliczające
-obydwa podwyrażenia przeplatają się, i to w dowolny sposób.
-Ta dowolność prowadzi do ''niedeterminizmu'', czyli do sytuacji, gdy
-kolejna (następna) konfiguracja nie jest wyznaczona jednoznacznie.
-Jest tak, gdyż jednocześnie możemy mieć dwie tranzycje
 <math>
-e_1 + e_2, s \,\Longrightarrow\, e'_1 + e_2, s
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2, s[x \mapsto n]</math>
-\quad \quad \quad
-e_1 + e_2, s \,\Longrightarrow\, e_1 + e'_2, s.
+Notacja <math>s[x \mapsto n]</math> oznacza stan <math>s</math>, który zmodyfikowano przypisując zmiennej <math>x</math> wartość <math>n</math>, niezależnie od tego, czy <math>s(x)</math> było określone, czy nie, i pozostawiając niezmienione wartości dla pozostałych zmiennych.
+Formalnie
+<math>
+s[x \mapsto n](y) =
+\begin{cases}
+n    & y = x \\
+s(y) & y \neq x
+\end{cases}
 </math>
-Zauważmy natomiast, że kolejność przeplatania się małych kroków obliczających
+W szczególności dla <math>y \neq x</math>, <math>s[x \mapsto n](y)</math> jest określone wtedy i tylko wtedy, gdy <math>s(y)</math> jest określone.
-<math> e_1 </math> i <math> e_2 </math> nie wpływa w tym przypadku na końcową wartość
-całego wyrażenia.
-Na koniec reguły dla wyrażenia warunkowego.
+Natomiast aby obliczyc <math>e_1</math>, potrzebujemy reguły:
 <math>
-\frac{e_1, s \,\Longrightarrow\, e'_1, s}
+\frac{e_1, s \,\Longrightarrow, e'_1, s'}
-     {\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow\, \mathbf{if}\, e'_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s}
+{\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow, \mathbf{let}\, x = e'_1 \,\mathbf{in}\, e_2, s'}
 </math>
+Zwróćmy uwagę, że stan <math>s'</math> może być różny od <math>s</math>, np. dlatego, że wewnątrz <math>e_1</math> znajduje się podwyrażenie <math>\mathbf{let}\, y = \ldots</math>.
+'''Pytanie:''' czy taka semantyka jest poprawna?
+Niestety nie, gdyż nie uwzględniamy ograniczonego zasięgu zmiennej.
+Rzućmy okiem na przykład:
 <math>
-\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow\, e_2, s \quad \mbox{ o ile } n \neq 0
+\mathbf{let}\, x = (\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z) \,\mathbf{in}\, z
 </math>
+Według naszych intencji to wyrażenie nie ma wartości, gdyż ostatnie odwołanie do <math>z</math> jest błędne.
+Natomiast według powyższych reguł mamy
 <math>
-\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow\, e_3, s \quad \mbox{ o ile } n = 0
+\mathbf{let}\, x = (\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z) \,\mathbf{in}\, z, \emptyset \,\Longrightarrow,
+\mathbf{let}\, x = z+z+z \,\mathbf{in}\, z, \emptyset[z \mapsto 4] \,\Longrightarrow, \quad \ldots \quad \,\Longrightarrow,
+\mathbf{let}\, x = 12 \,\mathbf{in}\, z, \emptyset[z \mapsto 4] \,\Longrightarrow,
+, \emptyset[z \mapsto 4] \,\Longrightarrow,
+!
 </math>
+Nasz błąd polega na tym, że po zakończeniu obliczania podwyrażenia <math>\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z</math> "zapominamy" przywrócić zmiennej <math>z</math> poprzednią wartość (a właściwie brak wartości w przykładzie powyżej).
+Przedyskutujmy kilka wariantów.
-==== Zadanie 2 ====
+<br>
+'''Wariant 1'''
+<br>
+Wygodne i eleganckie rozwiązanie tego problemu jest możliwe, jeśli rozszerzymy składnię naszego języka.
+Intuicyjnie, reguła
+<math>
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2, s[x \mapsto n]</math>
+powinna zostać zastąpiona przez
+<math>
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow\, e_2 \,\mathbf{then}\, \mbox{przywróć wartość zmiennej x}, s[x \mapsto n]</math>
+czyli potrzebujemy konstrukcji składniowej, która polega na obliczeniu wyrażenia <math>e_2</math>, a następnie na przypisaniu zmiennej <math>x</math> danej wartości.
+Rozszerzmy zatem składnię następujaco:
+<math>
+e \,  ::=  \,\,
+        \ldots   \,\,|\,\,
+        e \,\mathbf{then}\, x := n</math>
+Wyrażenie <math>e \,\mathbf{then}\, x:= n</math> jest w pewnym sensie dualne do <math>\mathbf{let}\, x = n \,\mathbf{in}\, e</math>, gdyż jedyna (choć niewątpliwie istotna) różnica między nimi to kolejność obliczenia <math>e</math> i przypisania wartości na zmienną <math>x</math>.
+Oto nowa reguła
+<math>
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2 \,\mathbf{then}\, x := n', s[x \mapsto n] \quad
+\mbox{ o ile } s(x) = n'</math>
+Pewna trudność pojawia się w sytuacji, gdy <math>s(x)</math> jest nieokreślone, czyli gdy zmienna <math>x</math> jest niezainicjowana -- reguła powyższa nie obejmuje wogóle takiej sytuacji.
+Najprostszym sposobem rozwiązania tej trudności jest rozszerzenie konstrukcji <math>e \,\mathbf{then}\, x := n</math>:
-Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję
 <math>
 e \,  ::=  \,\,
          \ldots   \,\,|\,\,
-         \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
+         e \,\mathbf{then}\, x := n  \,\,|\,\,
+        e \,\mathbf{then}\, x := \bot
 </math>
-Wyrażenie <math> \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2 </math> zawiera w sobie deklarację
+gdzie symbol <math>\bot</math> oznacza brak wartości.
-<math> x = e_1 </math>, która stanowi jedyny mechannizm wiązania
+Dodajemy również regułę:
-identyfikatorów w naszym języku.
-Wartość wyrażenia <math> \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2 </math> obliczamy następująco:
-najpierw oblicza się wartość <math> e_1 </math>, podstawia ją na zmienna
-<math> x </math>, a następnie oblicza wyrażenie <math> e_2 </math>.
-Zakresem zmiennej <math> x </math> jest wyrażenie <math> e_2 </math>, ale jeśli w
-<math> e_2 </math> występuje podwyrażenie <math> \mathbf{let}\, x = \ldots \,\mathbf{in}\, e </math> to
-odwołania do <math> x </math> wewnątrz <math> e </math> odnoszą się do ''najbliższej''
-(najbardziej zagnieżdzonej) deklaracji zmiennej <math> x </math>.
-Taki mechanizm wiązania identyfikatorów nazywamy ''wiązaniem
-statycznym''.
-Zakładamy, że na początku wartości wszystkich zmiennych są
+<math>
-''nieokreślone'', czyli zmienne są niezainicjowane, a odwołanie do
+\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2 \,\mathbf{then}\, x := \bot, s[x \mapsto n] \quad
-niezainicjowanej zmiennej jest uważane za niepoprawne.
+\mbox{ o ile } s(x) \, \mbox{ jest nieokreślone}</math>
+Rozwiązanie to jest odrobinę nieeleganckie, gdyż prawie identyczne reguły musimy napisać dwukrotnie.
+Widać to np. w poniższych regułach, "scalających" semantykę dla <math>e \,\mathbf{then}\, x := n</math> z semantyką pozostałych wyrażeń:
-==== Przykłady ====
+<math>
+\frac{e, s \,\Longrightarrow, e', s'}
+{e \,\mathbf{then}\, x := n, s \,\Longrightarrow, e' \,\mathbf{then}\, x:= n, s'}
+</math>
 <math>
-\mathbf{let}\, x = z+z \,\mathbf{in}\, \mathbf{let}\, y = 7 \,\mathbf{in}\, \mathbf{let}\, x = y+3 \,\mathbf{in}\, x+x+y
+n' \,\mathbf{then}\, x := n, s \,\Longrightarrow, n', s[x \mapsto n]
-\quad \quad \mbox{wynik} = 24
+</math>
-</math>
 <math>
-\mathbf{let}\, y = 5 \,\mathbf{in}\, \mathbf{let}\, x = (\, \mathbf{let}\, y = 3 \,\mathbf{in}\, y+y \,) \,\mathbf{in}\, x+y
+n' \,\mathbf{then}\, x := \bot, s \,\Longrightarrow, n', s' \quad \mbox{ o ile } s(x)
-\quad \quad \mbox{wynik} = 11
+\mbox{ jest określone i } s' = s \setminus \{ (x, s(x)) \}
 </math>
+<br>
+'''Wariant 2'''
+<br>
+Zanim przejdziemy do kolejnego wariantu, zastanówmy się, czy istnieje inny sposób rozwiązania trudności związanej z <math>n = \bot</math>, który pozwalałby uniknąć wprowadzania dodatkowej konstrukcji
+<math>e \,\mathbf{then}\, x := \bot</math>.
+Pomysł może polegać na rozszerzeniu zbioru <math>\mathbf{Num}</math> o dodatkowy element <math>\bot</math>:
 <math>
-\mathbf{let}\, z = 5 \,\mathbf{in}\, x+z
+n \, ::= \,\, \bot \,\,|\,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
-\quad \quad \mbox{brak wyniku; odwołanie do niezainicjowanej
-zmiennej}\, x
 </math>
+Wtedy nie musimy pisać dwóch bardzo podobnych wariantów reguł.
+Dodatkowo, w tym rozwiązaniu warto poczynić umowę, że <math>s(x) = \bot</math> reprezentuje brak wartości zmiennej <math>x</math>.
+Wtedy stany są funkcjami całkowitymi z <math>\mathbf{Var}</math> w <math>\mathbf{Num}</math>, przyjmującymi wartość różną od <math>\bot</math> tylko dla skończenie wielu elementów.
+Pewnym mankamentem jest to, że teraz <math>n = \bot</math> może pojawiać się w wyrażeniach podobnie jak stałe.
+Tym niemniej nie musimy adaptować reguł dla stałych tak, aby radziły one sobie z <math>n = \bot</math>, ponieważ wyrażenia zawierające <math>\bot</math> możemy również uważać za roszerzenie składni.
+Jeśli jednak dopuścimy symbol <math>\bot</math> w wyrażeniach, to możemy elegancko wybrnąć z sytuacji, rozszerzając operacje arytmetyczne na zbiór <math>\mathbf{Num} \cup \{ \bot \}</math> tak, aby zachowywały one nieokreśloność:
 <math>
-\mathbf{let}\, x = 1 \,\mathbf{in}\, \mathbf{let}\, x = x+x \,\mathbf{in}\, x
+n + \bot = \bot + n = \bot</math>
-\quad \quad \mbox{wynik} = 2
-</math>
+Trzeba jednak w takim razie zadbać o to, aby wyrażenie <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> obliczało się normalnie tylko wtedy, gdy wartość wyrażenia <math>e_1</math> jest różna od <math>\bot</math>.
+,
+<br>
+'''Wariant 3'''
+<br>
+Zrewidujmy teraz podstawowe założenia, które dotychczas poczyniliśmy.
+Jednym z nich było przyjęcie ogólnej postaci tranzycji:
-==== Rozwiązanie ====
+<math>
+e, s \,\Longrightarrow, e', s'
+</math>
-Podobnie jak poprzednio,
+pozwalającej na zmianę stanu podczas obliczania wyrażenia.
-stan powinien opisywać wartości przypisane zmiennym, ale powinniśmy też
+Czy faktycznie był to dobry pomysł? Czy moglibyśmy poradzić sobie przy pomocy tranzycji postaci
-uwzględnić niezainicjowane zmienne, czyli zmienne bez żadnej wartości.
-Przyjmijmy zatem, że stan to skończona funkcja częściowa z <math> \mathbf{Var} </math> do <math> \mathbf{Num} </math>.
-Oznaczmy przez <math> \mathbf{State} </math> zbiór wszystkich takich funkcji.
-Naturalnym stanem początkowym jest stan ''pusty'', tzn.
-pusta funkcja częściowa, który będziemy oznaczać <math> \emptyset </math>.
-A wartość wyrażenia <math> e </math> w stanie początkowym wynosi <math> n </math>
-o ile zachodzi:
 <math>
-e, \emptyset \,\Longrightarrow^{*}\, n.
+e, s \,\Longrightarrow, e', s ?
 </math>
-Będziemy potrzebowac tranzycji dwóch postaci, podobnie jak poprzednio,
+Spróbujmy! Oto nowa wersja jednej z reguł dla <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math>, dotycząca kroku wewnątrz <math>e_1</math>:
-ale pierwsza postać będzie trochę ogólniejsza:
 <math>
-e, s \,\Longrightarrow\, e', s'.
+\frac{e_1, s \,\Longrightarrow, e'_1, s}
+{\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow, \mathbf{let}\, x = e'_1 \,\mathbf{in}\, e_2, s}
 </math>
-Tranzycja ta oznacza mały krok w trankcie obliczania wyrażenia <math> e </math>
+Dotychczas nie ma problemu: podwyrażenie <math>e_1</math> jest prawidłowo obliczane w stanie <math>s</math>. Trudność pojawi się, gdy
-w stanie <math> s </math>, w wyniku którego <math> e </math> wyewoluowało do
+zakończymy obliczanie <math>e_1</math> i przejdziemy do <math>e_2</math>.
-<math> e' </math> a nowym stanem jest <math> s' </math>.
+Oto możliwa reguła:
-Stan może się teraz zmienić na skutek deklaracji zmiennych.
+<math>
+\frac{e, s[x \mapsto n] \,\Longrightarrow, e', s[x \mapsto n] }
+     {\mathbf{let}\, x = n \,\mathbf{in}\, e, s \,\Longrightarrow, \mathbf{let}\, x = n \,\mathbf{in}\, e', s}</math>
-Ponieważ stan jest funkcją częściową, musimy zmienić niektóre reguły, np.
+Okazuje się, że wszystko jest w porządku. Wyrażenie <math>e</math> obliczamy w prawidłowym stanie, tzn. z wartością <math>n</math> przypisaną zmiennej <math>x</math>.
+Mały krok w <math>e</math> daje przyczynek do małego kroku w całym wyrażeniu, a przy tym stan pozostaje niezmieniony.
+Przy tym wogóle nie potrzebujemy przywracać poprzedniej wartości zmiennej <math>x</math>, ponieważ <math>x</math> zyskuje nową wartość "tylko" na potrzeby obliczania podwyrażenia <math>e</math>!
+Można na to również spojrzeć inaczej: informacja o nowej wartości <math>n</math>  dla zmiennej <math>x</math> nie jest jawnie dodawana do stanu <math>s</math>, ale jest przechowywana w składni wyrażenia <math>\mathbf{let}\, x = n \,\mathbf{in}\, \ldots</math> jako deklaracja <math>x = n</math>.
+Na końcu musimy oczywiście pozbyć się tej deklaracji za pomocą następującej tranzycji:
 <math>
-x, s \,\Longrightarrow\, n, s \quad \mbox{ o ile } s(x) \mbox{ jest określone i } s(x) = n
+\mathbf{let}\, x = n \,\mathbf{in}\, n', s \,\Longrightarrow, n', s
 </math>
+Podsumujmy. Okazuje się, że rozwiązanie nie było wcale łatwe, nawet dla tak prościutkiego języka. W przyszłości przekonamy się, że łatwiej jest poradzić sobie z zagadnieniem wiązania identyfikatorów w semantyce naturalnej (duże kroki).
+W wariancie 1 i 2 wprowadziliśmy do języka dodatkowe elementy, tak by łatwiej było pisać reguły. W przyszłości będziemy czasem stosować takie podejście.
+Niekiedy jednak rozszerzanie języka będzie zabronione.
-==== Zadanie 3 ====
+</div></div>
-Zmodyfikuj semantykę z poprzedniego zadania tak, aby uzyskać
+== Zadania domowe ==
-''leniwą'' ewaluację wyrażeń, zgodnie z dyrektywą: nie obliczaj
-wyrażenia o ile jego wynik nie jest potrzebny
-(albo: obliczaj wartość wyrażenia dopiero wtedy, gdy jego wynik jest
+{{cwiczenie|1|cw1.dom|
-naprawdę potrzebny). Spojrzmy na przykład:
+Zapisz wariant 2 semantyki z poprzedniego zadania.
+}}
+{{cwiczenie|2|cw2.dom|
+Dotychczas wystąpienie błędu podczas obliczania wyrażenia, np. odwołanie do niezainicjowanej zmiennej, powodowało, że wyrażenie nie posiadało wartości (nie było ciągu tranzycji prowadzących do konfiguracji końcowej).
+Zmodyfikuj którąś z semantyk z poprzednich zadań tak, aby błąd był komunikowany jako jedna z konfiguracji końcowych.
+To znaczy: jeśli obliczenie wyrażenia <math>e</math> w stanie <math>s</math> jest niemożliwe bo wystąpił błąd, to
 <math>
-\mathbf{let}\, x = 7 \,\mathbf{in}\, \mathbf{let}\, y = y+y \,\mathbf{in}\, x+x
+e, s \,\Longrightarrow^{*}\, \mathtt{Blad}</math>
-</math>
+}}
-Według semantyki z poprzedniego zadania wyrażnie to nie ma wartości,
-bo w deklaracji <math> y = y+y </math> jest odwołanie do niezainicjowanej
-zmiennej.
-Natomiast w semantyce leniwej wyrażenie to obliczy się do wartości
-<math> 14 </math>, ponieważ wyrażenie <math> y+y </math> nie będzie wogóle obliczane.
-Będzie tak dlatego, że w wyrażeniu <math> x+x </math> nie ma odwołań do
-zmiennej <math> y </math>.
+{{cwiczenie|3|cw3.dom|
-==== Rozwiązanie ====
+Rozważ rozszerzenie języka wyrażeń o wyrażenia boolowskie:
+<math>
+n \, ::= \,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
+</math>
-==== Zadanie 4 ====
+<math>
+x \, ::= \,\, \ldots \, (identyfikatory) \, \ldots
+</math>
-Dotychczas wystąpienie błędu podczas obliczania wyrażenia,
+<math>
-np. odwołanie do niezainicjowanej zmiennej, powodowało, że
+b \, ::= \,\,
-wyrażenie nie posiadało wartości (nie było ciągu tranzycji
+        \mathbf{true}   \,\,|\,\,
-prowadzących do konfiguracji końcowej). Zmodyfikuj którąś z semantyk
+        \mathbf{false}  \,\,|\,\,
-z poprzednich zadań tak, aby błąd był komunikowany
+        e_1 \leq e_2  \,\,|\,\,
-jako jedna z konfiguracji końcowych. To znaczy: jeśli obliczenie
+        \neg b  \,\,|\,\,
-wyrażenia <math> e </math> w stanie <math> s </math> jest niemożliwe bo wystąpił
+        b_1  \land  b_2
-błąd, to
+</math>
 <math>
-e, s \,\Longrightarrow^{*}\, Blad
+e \,  ::=  \,\,
+        n   \,\,|\,\,
+        x   \,\,|\,\,
+        e_1 + e_2   \,\,|\,\,
+        \mathbf{if}\, b \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3  \,\,|\,\,
+        \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
 </math>
+Zaproponuj semantykę małych kroków dla tego języka.
+Rozważ różne strategie obliczania wyrażeń boolowskich, oraz podejście leniwe.
+Na przykład w strategii lewostronnej dla <math>b_1 \land b_2</math>, gdy <math>b_1</math> zostało obliczone do <math>\mathbf{false}</math>, w podejściu leniwym nie ma wogóle potrzeby obliczania <math>b_2</math>.
+}}