Semantyka i weryfikacja programów/Ćwiczenia 1: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Sl (dyskusja | edycje)
Nie podano opisu zmian
m Zastępowanie tekstu – „.↵</math>” na „</math>”
 
(Nie pokazano 21 wersji utworzonych przez 5 użytkowników)
Linia 1: Linia 1:
== Zawartość ==


== Ćwiczenia 1: semantyka operacyjna wyrażeń (małe kroki) ==
Tematem tych zajęć jest semantyka operacyjna wyrażeń (małe kroki).




==== Zadanie 1 (przygotowawcze) ====
== Semantyka operacyjna wyrażeń ==
Rozważmy prosty język wyrażeń, którego składnia opisana jest
 
następującą gramatyką:
 
{{cwiczenie|1|cw1|
 
Rozważmy bardzo prosty język wyrażeń, którego składnia opisana jest następującą gramatyką:


<math>
<math>
Linia 23: Linia 27:
</math>
</math>


Wynikiem wyrażenienia warunkowego <math> \mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3 </math>
Wynikiem wyrażenienia warunkowego <math>\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3</math> jest wartość wyrażenia <math>e_2</math>, o ile wyrażenie <math>e_1</math> oblicza się do wartości różnej od zera; w przeciwnym przypadku wynikiem jest wartość wyrażenia <math>e_3</math>.
jest wartość wyrażenia <math> e_2 </math>, o ile wyrażenie
<math> e_1 </math> oblicza się do wartości różnej od zera; w przeciwnym
przypadku wynikiem jest wartość wyrażenia <math> e_3 </math>.


Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.
Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.
}}


 
<div class="mw-collapsible mw-made=collapsible mw-collapsed">
==== Rozwiązanie ====
<span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie</span>
<div class="mw-collapsible-content" style="display:none">


Zacznijmy od ustalenia notacji i dziedzin syntaktycznych.
Zacznijmy od ustalenia notacji i dziedzin syntaktycznych.
Niech <math> \mathbf{Num} </math> oznacza zbiór stałych liczbowych,  
Niech <math>\mathbf{Num}</math> oznacza zbiór stałych liczbowych, <math>n \in \mathbf{Num} = \{ 0, 1, \ldots \}</math>.
<math> n \in \mathbf{Num} = \{ 0, 1, \ldots \} </math>.
Podobnie, niech <math>\mathbf{Var}</math> oznacza zbiór identyfikatorów, które mogą być nazwami zmiennych; <math>x \in \mathbf{Var}</math>.
Podobnie, niech <math> \mathbf{Var} </math> oznacza zbiór identyfikatorów, które
Wreszcie, niech <math>\mathbf{Exp}</math> oznacza zbiór wyrażeń; <math>e \in \mathbf{Exp}</math>.
mogą być nazwami zmiennych; <math> x \in \mathbf{Var} </math>.
Dla ułatwienia zapisywania reguł zakładamy, że stałe liczbowe wyrażeniami, czyli <math>\mathbf{Num} \subseteq \mathbf{Exp}</math>.
Wreszcie, niech <math> \mathbf{Exp} </math> oznacza zbiór wyrażeń;
<math> e \in \mathbf{Exp} </math>.
Dla ułatwienia zapisywania reguł zakładamy, ze stałe  
liczbowe sa wyrażeniami, czyli <math> \mathbf{Num} \subseteq \mathbf{Exp} </math>.


Będziemy potrzebować zbioru ''stanów'', opisujących wartości
Będziemy potrzebować zbioru "stanów", opisujących wartości przypisane zmiennym.
przypisane zmiennym.
Najprostszym rozwiązaniem jest przyjąć, że stan to funkcja z <math>\mathbf{Var}</math> do <math>\mathbf{Num}</math>.
Najprostszym rozwiązaniem jest przyjąc, że stan to funkcja
Oznaczmy przez <math>\mathbf{State}</math> zbiór wszystkich takich funkcji; stany oznaczać będziemy przez <math>s, s_1, s', \ldots \in \mathbf{State}</math>.
z <math> \mathbf{Var} </math> do <math> \mathbf{Num} </math>.
Oznaczmy przez <math> \mathbf{State} </math> zbiór wszystkich takich funkcji;
stany oznaczac będziemy przez <math> s, s_1, s', \ldots \in \mathbf{State} </math>.


W naszej semantyce będziemy potrzebowac tranzycji dwóch postaci.
W naszej semantyce będziemy potrzebowac tranzycji dwóch postaci.
Po pierwsze, tranzycja
Po pierwsze, tranzycje postaci


<math>
<math>
e, s \,\Longrightarrow\, e', s
e, s \,\Longrightarrow, e', s
</math>
</math>


oznaczająca mały krok w trakcie obliczania wyrażenia <math> e </math>
oznaczające mały krok w trakcie obliczania wyrażenia <math>e</math> w stanie <math>s</math>, w wyniku którego <math>e</math> wyewoluowało do <math>e'</math>.  
w stanie <math> s </math>, w wyniku którego <math> e </math> wyewoluowało do
Stan nie ulega zmianie podczas obliczania wyrażenia (nie ma tzw. ''efektów ubocznych''), więc to samo <math>s</math> figuruje po lewej i prawej stronie strzałki.
<math> e' </math>. Stan nie ulega zmiania podczas obliczania wyrażenia,
 
więc to samo <math> s </math> figuruje po lewej i prawej stronie strzałki.
Po drugie, tranzycje postaci


Po drugie, tranzycja
<math>
<math>
e, s \,\Longrightarrow\, n   
e, s \,\Longrightarrow, n   
</math>
</math>


będzie oznaczaczać, że wyrażenie <math> e </math> jest już policzone,
będą oznaczaczać, że wyrażenie <math>e</math> jest już policzone, a jego wartością jest <math>n</math>.
a jego wartością jest <math> n </math>.


Zatem przyjmijmy, że zbiór konfiguracji to
Zatem przyjmijmy, że zbiór konfiguracji to
Linia 76: Linia 70:
</math>
</math>


a konfiguracje końcowe to <math> \mathbf{Num} </math>.
a konfiguracje końcowe to <math>\mathbf{Num}</math>.
 
{{
uwaga||uwaga1|
Tak naprawdę, druga postać tranzycji nie jest niezbędna, gdyż moglibyśmy umówić się, że konfiguracje końcowe to <math>\mathbf{Num} \times \mathbf{State}</math>.
}}
 
Najprostsze są tranzycje prowadzące do konfiguracji końcowej:


'''Uwaga:''' tranzycje pierwszej postaci mogłyby również wyglądać
następująco:
<math>
<math>
e, s \,\Longrightarrow\, e';
n, s \,\Longrightarrow, n
</math>
</math>
wtedy zbiorem konfiguracji byłby zbiór
 
Symbol <math>n</math> po lewej stronie to wyrażenie składające się ze stałej liczbowej, podczas gdy <math>n</math> po prawej stronie reprezentuje liczbę będącą wartością wyrażenia.
 
Zmienna oblicza się do swojej wartości w bieżącym stanie: 
 
<math>
<math>
( \mathbf{Exp} \times \mathbf{State} ) \, \cup \, \mathbf{Exp}
x, s \,\Longrightarrow, n, s \quad \mbox{ o ile } s(x) = n</math>
 
Teraz zajmiemy się dodawaniem <math>e_1 + e_2</math>. Ponieważ semantyka jest w stylu małych kroków, musimy zdecydować się, czy najpierw obliczyć pierwszy (lewy) składnik <math>e_1</math>, czy drugi?
Jeśli wybierzemy lewy (strategia "lewostronna"), otrzymamy regułę:
 
<math>
e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s
\quad \mbox{ o ile } \quad
e_1, s \,\Longrightarrow, e'_1, s</math>
 
Reguły tej postaci będziemy zapisywać tak:
 
<math>
\frac{e_1, s \,\Longrightarrow, e'_1, s}
    {e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s}
</math>
</math>
a konfiguracje końcowe pozostałyby bez zmian
'''(koniec uwagi)'''.


Czyli mały krok w <math>e_1</math> stanowi też mały krok w <math>e_1 + e_2</math>.
Po zakończeniu obliczania <math>e_1</math> przechodzimy do <math>e_2</math>:
<math>
\frac{e_2, s \,\Longrightarrow, e'_2, s}
{n + e_2, s \,\Longrightarrow, n + e'_2, s}</math>
A na końcu dodajemy:
<math>
n_1 + n_2, s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
Zwróćmy tutaj uwagę na pewną subtelność, dotyczącą dwóch wystąpień symbolu <math>+</math>: pierwsze wystąpienie oznacza jedną z konstrukcji składniowych języka, a drugie oznacza operację dodawania w zbiorze <math>\mathbf{Num}</math>.
Pozwalamy sobie na taką kolizję oznaczeń, gdyż nie powinna ona prowadzić do niejednoznaczności. Pamiętajmy, że składnia języka jest składnią abstrakcyjną, więc zamiast <math>e_1 + e_2</math> moglibyśmy równie dobrze pisać np. <math>{\mathrm{add}}(e_1, e_2)</math>, a wtedy reguła wyglądałaby tak:
<math>
\mathrm{add}(n_1, n_2), s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
Inną możliwą strategią obliczania <math>e_1 + e_2</math> jest strategia "prawostronna", którą otrzymujemy zastępując pierwsze dwie z trzech powyższych reguł przez:
<math>
\frac{e_2, s \,\Longrightarrow, e'_2, s}
    {e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2}
\quad \quad
\frac{e_1, s \,\Longrightarrow, e'_1, s}
    {e_1 + n, s \,\Longrightarrow, e'_1 + n, s}</math>
Ponadto, jeśli przyjmiemy regułę pierwszą (dla <math>e_1</math>), trzecią i czwartą (dla <math>e_2</math>), otrzymamy strategię "równoległą", polegającą na obliczaniu jednocześnie <math>e_1</math> i <math>e_2</math>:
<math>
\frac{e_1, s \,\Longrightarrow, e'_1, s}
    {e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s}
\quad \quad
\frac{e_2, s \,\Longrightarrow, e'_2, s}
    {e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2}
\quad \quad
n_1 + n_2, s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
Bardziej precyzyjnie mówiąc, małe kroki obliczające obydwa podwyrażenia przeplatają się, i to w dowolny sposób.
Ta dowolność prowadzi do ''niedeterminizmu'', czyli do sytuacji, gdy kolejna (następna) konfiguracja nie jest wyznaczona jednoznacznie.
Jest tak, gdyż możemy mieć do wyboru dwie różne tranzycje
<math>
e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s
\quad \quad \quad
e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2, s</math>


Najprostsze są tranzycje prowadzące do konfiguracji końcowej:
Zauważmy natomiast, że kolejność przeplatania się małych kroków obliczających <math>e_1</math> i <math>e_2</math> nie wpływa w tym przypadku na końcową wartość całego wyrażenia.
 
Na koniec reguły dla wyrażenia warunkowego.
 
<math>
\frac{e_1, s \,\Longrightarrow, e'_1, s}
    {\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, \mathbf{if}\, e'_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s}
</math>


<math>
<math>
n, s \,\Longrightarrow\, n
\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, e_2, s \quad \mbox{ o ile } n \neq 0
</math>
</math>


Zmienna oblicza się do swojej wartości w bieżącym stanie: 
<math>
<math>
x, s \,\Longrightarrow\, n, s \quad \mbox{ o ile } s(x) = n
\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, e_3, s \quad \mbox{ o ile } n = 0
</math>
</math>


Teraz zajmiemy się dodawaniem <math> e_1 + e_2 </math>. Ponieważ semantyka jest w stylu małych
</div></div>
kroków, musimy zdecydować się czy najpierw obliczyć pierwszy (lewy) składnik
 
<math> e_1 ] czy drugi?
 
Jeśli wybierzemy lewy, otrzymamy regułę:
 
{{cwiczenie|2|cw2|
}}
 
Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję


<math>
<math>
\frac{e_1, s \,\Longrightarrow\, e'_1, s}
e \,  ::=  \,\,
    {e_1 + e_2, s \,\Longrightarrow\, e'_1 + e_2}.
        \ldots  \,\,|\,\,
        \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
</math>
</math>


Czyli mały krok w <math> e_1 </math> stanowi też mały krok w <math> e_1 + e_2 </math>.
Wyrażenie <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> zawiera w sobie deklarację <math>x = e_1</math>, która stanowi mechanizm wiązania identyfikatorów w naszym języku.
Po zakończeniu obliczania <math> e_1 </math> przechodzimy do <math> e_2 </math>:
Deklaracja <math>x = e_1</math> wprowadza nową zmienną <math>x</math> oraz przypisuje jej wartość.
Wartość wyrażenia <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> obliczamy następująco: najpierw oblicza się wartość <math>e_1</math>, podstawia ją <font color=red>za</font> zmienną <math>x</math>, a następnie oblicza wyrażenie <math>e_2</math>.
Zakresem zmiennej <math>x</math> jest wyrażenie <math>e_2</math>, czyli wewnątrz <math>e_2</math> można odwoływać się (wielokrotnie) do zmiennej <math>x</math>;
Ogólniej, odwołania do zmiennej w wyrażeniu odnoszą się do "najbliższej" (najbardziej zagnieżdzonej) deklaracji tej zmiennej.
Taki mechanizm wiązania identyfikatorów nazywamy ''wiązaniem statycznym''.
Przyjmujemy zwykłe (statyczne) reguły przesłaniania zmiennych, np. jeśli w <math>e_2</math> występuje podwyrażenie <math>\mathbf{let}\, x = e \,\mathbf{in}\, e'</math>, to
deklaracja <math>x = e</math> "przesłania" deklarację <math>x = e_1</math> w wyrażeniu <math>e'</math>.
 
Zakładamy, że na początku wartości wszystkich zmiennych są ''nieokreślone'', czyli zmienne są niezainicjowane, a odwołanie do niezainicjowanej zmiennej jest uważane za niepoprawne.
 
 
 
{{przyklad|||


<math>
<math>
\frac{e_2, s \,\Longrightarrow\, e'_2, s}
\mathbf{let}\, x = 0 \,\mathbf{in}\, \mathbf{let}\, y = 7 \,\mathbf{in}\, \mathbf{let}\, x = y+3 \,\mathbf{in}\, x+x+y
    {n + e_2, s \,\Longrightarrow\, n + e'_2, s}.
\quad \quad \mapsto \quad \quad \mbox{wynik} = 24
</math>
 
<math>
\mathbf{let}\, y = 5 \,\mathbf{in}\, \mathbf{let}\, x = (\, \mathbf{let}\, y = 3 \,\mathbf{in}\, y+y \,) \,\mathbf{in}\, x+y
\quad \quad \mapsto \quad \quad \mbox{wynik} = 11
</math>
</math>


A na końcu dodajemy:
<math>
\mathbf{let}\, z = 5 \,\mathbf{in}\, x+z \quad \quad \mapsto \quad \quad \mbox{ brak wyniku, odwołanie do niezainicjowanej zmiennej } x
</math>


<math>
<math>
n_1 + n_2, s \,\Longrightarrow\, n, s \quad \mbox{ o ile } n = n_1 + n_2.
\mathbf{let}\, x = 1 \,\mathbf{in}\, \mathbf{let}\, x = x+x \,\mathbf{in}\, x+x
\quad \quad \mapsto \quad \quad \mbox{wynik} = 4
</math>
</math>


Zauważmy tutaj pewną subtelność, dotyczącą dwóch wystąpień
<div class="mw-collapsible mw-made=collapsible mw-collapsed">
symbolu ''+'': pierwsze wystąpienie oznacza jedną z konstrukcji składniowych
<span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie</span>
języka, a drugie oznacza operację dodawania w zbiorze <math> \mathbf{Num} </math>.
<div class="mw-collapsible-content" style="display:none">
Pozwalamy sobie na taką kolizję oznaczeń, gdyż nie powinna ona
 
prowadzić do niejednoznaczności. Pamiętajmy, że składnia języka jest
Podobnie jak poprzednio, stan powinien opisywać wartości przypisane zmiennym.
składnią abstrajkcyjną, więc zamiast <math> e_1 + e_2 </math> moglibyśmy równie
Tym razem jednak uwzględnimy niezainicjowane zmienne, czyli zmienne bez żadnej wartości.
dobrze pisać np. <math> {\mathrm{add}}(e_1, e_2) </math>.
Przyjmijmy zatem, że stan to skończona funkcja częściowa z <math>\mathbf{Var}</math> do <math>\mathbf{Num}</math>.
Oznaczmy symbolem <math>\mathbf{State}</math> zbiór wszystkich takich funkcji:
<math>
\mathbf{State} = \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Num}
</math>.
Naturalnym stanem początkowym jest stan "pusty", tzn. pusta funkcja częściowa, który będziemy oznaczać symbolem <math>\emptyset</math>.
Wartość wyrażenia <math>e</math> w stanie początkowym wynosi <math>n</math>, o ile zachodzi:
 
<math>
e, \emptyset \,\Longrightarrow^{*}\, n</math>
 
Będziemy potrzebowac tranzycji dwóch postaci, podobnie jak poprzednio, ale pierwsza postać będzie nieco ogólniejsza:
 
<math>
e, s \,\Longrightarrow, e', s'</math>
 
Tranzycja ta oznacza mały krok w trakcie obliczania wyrażenia <math>e</math> w stanie <math>s</math>, w wyniku którego <math>e</math> wyewoluowało do <math>e'</math>, a nowym stanem jest <math>s'</math>.
Stan może się teraz zmienić na skutek deklaracji zmiennych.


Inna możliwą strategią obliczania <math> e_1 + e_2 </math> jest strategia
Spróbujmy rozszerzyć semantykę z poprzedniego zadania.
''prawostronna'', którą otrzymujemy zastępując pierwsze dwie z trzech
Ponieważ stan jest funkcją częściową, musimy zmienić niektóre reguły, np.
powyższych reguł przez:


<math>
<math>
\frac{e_2, s \,\Longrightarrow\, e'_2, s}
x, s \,\Longrightarrow, n, s \quad \mbox{ o ile } s(x) \mbox{ jest określone i } s(x) = n
    {e_1 + e_2, s \,\Longrightarrow\, e_1 + e'_2}
\quad \quad \quad
\frac{e_1, s \,\Longrightarrow\, e'_1, s}
    {e_1 + n, s \,\Longrightarrow\, e'_1 + n, s}.
</math>
</math>


Ponadto, jeśli przyjmiemy wszystkie pięc reguł, otrzymamy strategię
Następnie dodajemy reguły dla wyrażenia <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math>.
''równoległą'', polegającą na obliczaniu jednocześnie <math> e_1 </math> i
Gdy <math>e_1</math> jest już obliczone, wystarczy reguła:
<math> e_2 </math>. Bardziej precyzyjnie mówiąc, małe kroki obliczające
obydwa podwyrażenia przeplatają się, i to w dowolny sposób.
Ta dowolność prowadzi do ''niedeterminizmu'', czyli do sytuacji, gdy
kolejna (następna) konfiguracja nie jest wyznaczona jednoznacznie.
Jest tak, gdyż jednocześnie możemy mieć dwie tranzycje


<math>
<math>
e_1 + e_2, s \,\Longrightarrow\, e'_1 + e_2, s  
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2, s[x \mapsto n]</math>
\quad \quad \quad
 
e_1 + e_2, s \,\Longrightarrow\, e_1 + e'_2, s.
Notacja <math>s[x \mapsto n]</math> oznacza stan <math>s</math>, który zmodyfikowano przypisując zmiennej <math>x</math> wartość <math>n</math>, niezależnie od tego, czy <math>s(x)</math> było określone, czy nie, i pozostawiając niezmienione wartości dla pozostałych zmiennych.
Formalnie
 
<math>
s[x \mapsto n](y) =
\begin{cases}
n    & y = x \\
s(y) & y \neq x
\end{cases}
</math>
</math>


Zauważmy natomiast, że kolejność przeplatania się małych kroków obliczających
W szczególności dla <math>y \neq x</math>, <math>s[x \mapsto n](y)</math> jest określone wtedy i tylko wtedy, gdy <math>s(y)</math> jest określone.
<math> e_1 </math> i <math> e_2 </math> nie wpływa w tym przypadku na końcową wartość
całego wyrażenia.


Na koniec reguły dla wyrażenia warunkowego.
Natomiast aby obliczyc <math>e_1</math>, potrzebujemy reguły:


<math>
<math>
\frac{e_1, s \,\Longrightarrow\, e'_1, s}
\frac{e_1, s \,\Longrightarrow, e'_1, s'}
    {\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow\, \mathbf{if}\, e'_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s}
{\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow, \mathbf{let}\, x = e'_1 \,\mathbf{in}\, e_2, s'}
</math>
</math>
Zwróćmy uwagę, że stan <math>s'</math> może być różny od <math>s</math>, np. dlatego, że wewnątrz <math>e_1</math> znajduje się podwyrażenie <math>\mathbf{let}\, y = \ldots</math>.
'''Pytanie:''' czy taka semantyka jest poprawna?
Niestety nie, gdyż nie uwzględniamy ograniczonego zasięgu zmiennej.
Rzućmy okiem na przykład:


<math>
<math>
\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow\, e_2, s \quad \mbox{ o ile } n \neq 0
\mathbf{let}\, x = (\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z) \,\mathbf{in}\, z
</math>
</math>
Według naszych intencji to wyrażenie nie ma wartości, gdyż ostatnie odwołanie do <math>z</math> jest błędne.
Natomiast według powyższych reguł mamy


<math>
<math>
\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow\, e_3, s \quad \mbox{ o ile } n = 0
\mathbf{let}\, x = (\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z) \,\mathbf{in}\, z, \emptyset \,\Longrightarrow,
\mathbf{let}\, x = z+z+z \,\mathbf{in}\, z, \emptyset[z \mapsto 4] \,\Longrightarrow, \quad \ldots \quad \,\Longrightarrow,
\mathbf{let}\, x = 12 \,\mathbf{in}\, z, \emptyset[z \mapsto 4] \,\Longrightarrow,
12, \emptyset[z \mapsto 4] \,\Longrightarrow,
12 !
</math>
</math>


Nasz błąd polega na tym, że po zakończeniu obliczania podwyrażenia <math>\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z</math> "zapominamy" przywrócić zmiennej <math>z</math> poprzednią wartość (a właściwie brak wartości w przykładzie powyżej).
Przedyskutujmy kilka wariantów.


==== Zadanie 2 ====
<br>
'''Wariant 1'''
<br>
 
Wygodne i eleganckie rozwiązanie tego problemu jest możliwe, jeśli rozszerzymy składnię naszego języka.
Intuicyjnie, reguła
 
<math>
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2, s[x \mapsto n]</math>
 
powinna zostać zastąpiona przez
 
<math>
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow\, e_2 \,\mathbf{then}\, \mbox{przywróć wartość zmiennej x}, s[x \mapsto n]</math>
 
czyli potrzebujemy konstrukcji składniowej, która polega na obliczeniu wyrażenia <math>e_2</math>, a następnie na przypisaniu zmiennej <math>x</math> danej wartości.
Rozszerzmy zatem składnię następujaco:
 
<math>
e \,  ::= \,\, 
        \ldots  \,\,|\,\,
        e \,\mathbf{then}\, x := n</math>
 
Wyrażenie <math>e \,\mathbf{then}\, x:= n</math> jest w pewnym sensie dualne do <math>\mathbf{let}\, x = n \,\mathbf{in}\, e</math>, gdyż jedyna (choć niewątpliwie istotna) różnica między nimi to kolejność obliczenia <math>e</math> i przypisania wartości na zmienną <math>x</math>.
Oto nowa reguła
 
<math>
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2 \,\mathbf{then}\, x := n', s[x \mapsto n] \quad
\mbox{ o ile } s(x) = n'</math>
 
Pewna trudność pojawia się w sytuacji, gdy <math>s(x)</math> jest nieokreślone, czyli gdy zmienna <math>x</math> jest niezainicjowana -- reguła powyższa nie obejmuje wogóle takiej sytuacji.
Najprostszym sposobem rozwiązania tej trudności jest rozszerzenie konstrukcji <math>e \,\mathbf{then}\, x := n</math>:


Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję
<math>
<math>
e \,  ::=  \,\,   
e \,  ::=  \,\,   
         \ldots  \,\,|\,\,
         \ldots  \,\,|\,\,
         \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2 
         e \,\mathbf{then}\, x := n  \,\,|\,\,
        e \,\mathbf{then}\, x := \bot
</math>
</math>


Wyrażenie <math> \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2 </math> zawiera w sobie deklarację
gdzie symbol <math>\bot</math> oznacza brak wartości.
<math> x = e_1 </math>, która stanowi jedyny mechannizm wiązania
Dodajemy również regułę:
identyfikatorów w naszym języku.
Wartość wyrażenia <math> \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2 </math> obliczamy następująco:
najpierw oblicza się wartość <math> e_1 </math>, podstawia ją na zmienna
<math> x </math>, a następnie oblicza wyrażenie <math> e_2 </math>.
Zakresem zmiennej <math> x </math> jest wyrażenie <math> e_2 </math>, ale jeśli w
<math> e_2 </math> występuje podwyrażenie <math> \mathbf{let}\, x = \ldots \,\mathbf{in}\, e </math> to
odwołania do <math> x </math> wewnątrz <math> e </math> odnoszą się do ''najbliższej''
(najbardziej zagnieżdzonej) deklaracji zmiennej <math> x </math>.
Taki mechanizm wiązania identyfikatorów nazywamy ''wiązaniem
statycznym''.


Zakładamy, że na początku wartości wszystkich zmiennych są
<math>
''nieokreślone'', czyli zmienne są niezainicjowane, a odwołanie do
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2 \,\mathbf{then}\, x := \bot, s[x \mapsto n] \quad
niezainicjowanej zmiennej jest uważane za niepoprawne.
\mbox{ o ile } s(x) \, \mbox{ jest nieokreślone}</math>


Rozwiązanie to jest odrobinę nieeleganckie, gdyż prawie identyczne reguły musimy napisać dwukrotnie.
Widać to np. w poniższych regułach, "scalających" semantykę dla <math>e \,\mathbf{then}\, x := n</math> z semantyką pozostałych wyrażeń:


==== Przykłady ====
<math>
\frac{e, s \,\Longrightarrow, e', s'}
{e \,\mathbf{then}\, x := n, s \,\Longrightarrow, e' \,\mathbf{then}\, x:= n, s'}
</math>


<math>
<math>
\mathbf{let}\, x = z+z \,\mathbf{in}\, \mathbf{let}\, y = 7 \,\mathbf{in}\, \mathbf{let}\, x = y+3 \,\mathbf{in}\, x+x+y
n' \,\mathbf{then}\, x := n, s \,\Longrightarrow, n', s[x \mapsto n]
\quad \quad \mbox{wynik} = 24
</math>
</math>  
 
<math>
<math>
\mathbf{let}\, y = 5 \,\mathbf{in}\, \mathbf{let}\, x = (\, \mathbf{let}\, y = 3 \,\mathbf{in}\, y+y \,) \,\mathbf{in}\, x+y
n' \,\mathbf{then}\, x := \bot, s \,\Longrightarrow, n', s' \quad \mbox{ o ile } s(x)  
\quad \quad \mbox{wynik} = 11
\mbox{ jest określone i } s' = s \setminus \{ (x, s(x)) \}
</math>
</math>
<br>
'''Wariant 2'''
<br>
Zanim przejdziemy do kolejnego wariantu, zastanówmy się, czy istnieje inny sposób rozwiązania trudności związanej z <math>n = \bot</math>, który pozwalałby uniknąć wprowadzania dodatkowej konstrukcji
<math>e \,\mathbf{then}\, x := \bot</math>.
Pomysł może polegać na rozszerzeniu zbioru <math>\mathbf{Num}</math> o dodatkowy element <math>\bot</math>:
<math>
<math>
\mathbf{let}\, z = 5 \,\mathbf{in}\, x+z
n \, ::= \,\, \bot \,\,|\,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
\quad \quad \mbox{brak wyniku; odwołanie do niezainicjowanej
zmiennej}\, x
</math>
</math>
Wtedy nie musimy pisać dwóch bardzo podobnych wariantów reguł.
Dodatkowo, w tym rozwiązaniu warto poczynić umowę, że <math>s(x) = \bot</math> reprezentuje brak wartości zmiennej <math>x</math>.
Wtedy stany są funkcjami całkowitymi z <math>\mathbf{Var}</math> w <math>\mathbf{Num}</math>, przyjmującymi wartość różną od <math>\bot</math> tylko dla skończenie wielu elementów.
Pewnym mankamentem jest to, że teraz <math>n = \bot</math> może pojawiać się w wyrażeniach podobnie jak stałe.
Tym niemniej nie musimy adaptować reguł dla stałych tak, aby radziły one sobie z <math>n = \bot</math>, ponieważ wyrażenia zawierające <math>\bot</math> możemy również uważać za roszerzenie składni.
Jeśli jednak dopuścimy symbol <math>\bot</math> w wyrażeniach, to możemy elegancko wybrnąć z sytuacji, rozszerzając operacje arytmetyczne na zbiór <math>\mathbf{Num} \cup \{ \bot \}</math> tak, aby zachowywały one nieokreśloność:
<math>
<math>
\mathbf{let}\, x = 1 \,\mathbf{in}\, \mathbf{let}\, x = x+x \,\mathbf{in}\, x
n + \bot = \bot + n = \bot</math>
\quad \quad \mbox{wynik} = 2
 
</math>
Trzeba jednak w takim razie zadbać o to, aby wyrażenie <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> obliczało się normalnie tylko wtedy, gdy wartość wyrażenia <math>e_1</math> jest różna od <math>\bot</math>.
,
<br>
'''Wariant 3'''
<br>


Zrewidujmy teraz podstawowe założenia, które dotychczas poczyniliśmy.
Jednym z nich było przyjęcie ogólnej postaci tranzycji:


==== Rozwiązanie ====
<math>
e, s \,\Longrightarrow, e', s'
</math>


Podobnie jak poprzednio,
pozwalającej na zmianę stanu podczas obliczania wyrażenia.
stan powinien opisywać wartości przypisane zmiennym, ale powinniśmy też
Czy faktycznie był to dobry pomysł? Czy moglibyśmy poradzić sobie przy pomocy tranzycji postaci
uwzględnić niezainicjowane zmienne, czyli zmienne bez żadnej wartości.
Przyjmijmy zatem, że stan to skończona funkcja częściowa z <math> \mathbf{Var} </math> do <math> \mathbf{Num} </math>.
Oznaczmy przez <math> \mathbf{State} </math> zbiór wszystkich takich funkcji.
Naturalnym stanem początkowym jest stan ''pusty'', tzn.
pusta funkcja częściowa, który będziemy oznaczać <math> \emptyset </math>.
A wartość wyrażenia <math> e </math> w stanie początkowym wynosi <math> n </math>
o ile zachodzi:


<math>
<math>
e, \emptyset \,\Longrightarrow^{*}\, n.
e, s \,\Longrightarrow, e', s ?
</math>
</math>


Będziemy potrzebowac tranzycji dwóch postaci, podobnie jak poprzednio,
Spróbujmy! Oto nowa wersja jednej z reguł dla <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math>, dotycząca kroku wewnątrz <math>e_1</math>:
ale pierwsza postać będzie trochę ogólniejsza:


<math>
<math>
e, s \,\Longrightarrow\, e', s'.
\frac{e_1, s \,\Longrightarrow, e'_1, s}
{\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow, \mathbf{let}\, x = e'_1 \,\mathbf{in}\, e_2, s}
</math>
</math>


Tranzycja ta oznacza mały krok w trankcie obliczania wyrażenia <math> e </math>
Dotychczas nie ma problemu: podwyrażenie <math>e_1</math> jest prawidłowo obliczane w stanie <math>s</math>. Trudność pojawi się, gdy
w stanie <math> s </math>, w wyniku którego <math> e </math> wyewoluowało do
zakończymy obliczanie <math>e_1</math> i przejdziemy do <math>e_2</math>.
<math> e' </math> a nowym stanem jest <math> s' </math>.
Oto możliwa reguła:
Stan może się teraz zmienić na skutek deklaracji zmiennych.
 
<math>
\frac{e, s[x \mapsto n] \,\Longrightarrow, e', s[x \mapsto n] }
    {\mathbf{let}\, x = n \,\mathbf{in}\, e, s \,\Longrightarrow, \mathbf{let}\, x = n \,\mathbf{in}\, e', s}</math>


Ponieważ stan jest funkcją częściową, musimy zmienić niektóre reguły, np.
Okazuje się, że wszystko jest w porządku. Wyrażenie <math>e</math> obliczamy w prawidłowym stanie, tzn. z wartością <math>n</math> przypisaną zmiennej <math>x</math>.
Mały krok w <math>e</math> daje przyczynek do małego kroku w całym wyrażeniu, a przy tym stan pozostaje niezmieniony.
Przy tym wogóle nie potrzebujemy przywracać poprzedniej wartości zmiennej <math>x</math>, ponieważ <math>x</math> zyskuje nową wartość "tylko" na potrzeby obliczania podwyrażenia <math>e</math>!
Można na to również spojrzeć inaczej: informacja o nowej wartości <math>n</math>  dla zmiennej <math>x</math> nie jest jawnie dodawana do stanu <math>s</math>, ale jest przechowywana w składni wyrażenia <math>\mathbf{let}\, x = n \,\mathbf{in}\, \ldots</math> jako deklaracja <math>x = n</math>.
Na końcu musimy oczywiście pozbyć się tej deklaracji za pomocą następującej tranzycji:


<math>
<math>
x, s \,\Longrightarrow\, n, s \quad \mbox{ o ile } s(x) \mbox{ jest określone i } s(x) = n
\mathbf{let}\, x = n \,\mathbf{in}\, n', s \,\Longrightarrow, n', s
</math>
</math>


Podsumujmy. Okazuje się, że rozwiązanie nie było wcale łatwe, nawet dla tak prościutkiego języka. W przyszłości przekonamy się, że łatwiej jest poradzić sobie z zagadnieniem wiązania identyfikatorów w semantyce naturalnej (duże kroki).
W wariancie 1 i 2 wprowadziliśmy do języka dodatkowe elementy, tak by łatwiej było pisać reguły. W przyszłości będziemy czasem stosować takie podejście.
Niekiedy jednak rozszerzanie języka będzie zabronione.


==== Zadanie 3 ====
</div></div>


Zmodyfikuj semantykę z poprzedniego zadania tak, aby uzyskać
== Zadania domowe ==
''leniwą'' ewaluację wyrażeń, zgodnie z dyrektywą: nie obliczaj
 
wyrażenia o ile jego wynik nie jest potrzebny
 
(albo: obliczaj wartość wyrażenia dopiero wtedy, gdy jego wynik jest
{{cwiczenie|1|cw1.dom|
naprawdę potrzebny). Spojrzmy na przykład:
 
Zapisz wariant 2 semantyki z poprzedniego zadania.
}}
 
 
{{cwiczenie|2|cw2.dom|
 
Dotychczas wystąpienie błędu podczas obliczania wyrażenia, np. odwołanie do niezainicjowanej zmiennej, powodowało, że wyrażenie nie posiadało wartości (nie było ciągu tranzycji prowadzących do konfiguracji końcowej).
Zmodyfikuj którąś z semantyk z poprzednich zadań tak, aby błąd był komunikowany jako jedna z konfiguracji końcowych.
To znaczy: jeśli obliczenie wyrażenia <math>e</math> w stanie <math>s</math> jest niemożliwe bo wystąpił błąd, to


<math>
<math>
\mathbf{let}\, x = 7 \,\mathbf{in}\, \mathbf{let}\, y = y+y \,\mathbf{in}\, x+x
e, s \,\Longrightarrow^{*}\, \mathtt{Blad}</math>
</math>
}}


Według semantyki z poprzedniego zadania wyrażnie to nie ma wartości,
bo w deklaracji <math> y = y+y </math> jest odwołanie do niezainicjowanej
zmiennej.
Natomiast w semantyce leniwej wyrażenie to obliczy się do wartości
<math> 14 </math>, ponieważ wyrażenie <math> y+y </math> nie będzie wogóle obliczane.
Będzie tak dlatego, że w wyrażeniu <math> x+x </math> nie ma odwołań do
zmiennej <math> y </math>.


{{cwiczenie|3|cw3.dom|


==== Rozwiązanie ====
Rozważ rozszerzenie języka wyrażeń o wyrażenia boolowskie:


<math>
n \, ::= \,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
</math>


==== Zadanie 4 ====
<math>
x \, ::= \,\, \ldots \, (identyfikatory) \, \ldots
</math>


Dotychczas wystąpienie błędu podczas obliczania wyrażenia,
<math>
np. odwołanie do niezainicjowanej zmiennej, powodowało, że
b \, ::= \,\,  
wyrażenie nie posiadało wartości (nie było ciągu tranzycji
        \mathbf{true}  \,\,|\,\,
prowadzących do konfiguracji końcowej). Zmodyfikuj którąś z semantyk
        \mathbf{false}  \,\,|\,\,
z poprzednich zadań tak, aby błąd był komunikowany
        e_1 \leq e_2  \,\,|\,\,
jako jedna z konfiguracji końcowych. To znaczy: jeśli obliczenie
        \neg b  \,\,|\,\,
wyrażenia <math> e </math> w stanie <math> s </math> jest niemożliwe bo wystąpił
        b_1  \land  b_2
błąd, to
</math>


<math>
<math>
e, s \,\Longrightarrow^{*}\, Blad
e \,  ::=  \,\, 
        n  \,\,|\,\,
        x  \,\,|\,\,
        e_1 + e_2  \,\,|\,\,
        \mathbf{if}\, b \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3  \,\,|\,\,
        \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
 
</math>
</math>
Zaproponuj semantykę małych kroków dla tego języka.
Rozważ różne strategie obliczania wyrażeń boolowskich, oraz podejście leniwe.
Na przykład w strategii lewostronnej dla <math>b_1 \land b_2</math>, gdy <math>b_1</math> zostało obliczone do <math>\mathbf{false}</math>, w podejściu leniwym nie ma wogóle potrzeby obliczania <math>b_2</math>.
}}

Aktualna wersja na dzień 21:29, 11 wrz 2023

Zawartość

Tematem tych zajęć jest semantyka operacyjna wyrażeń (małe kroki).


Semantyka operacyjna wyrażeń

Ćwiczenie 1

Rozważmy bardzo prosty język wyrażeń, którego składnia opisana jest następującą gramatyką:

n::=0|1|

x::=(identyfikatory)

e::=n|x|e1+e2|𝐢𝐟e1𝐭𝐡𝐞𝐧e2𝐞𝐥𝐬𝐞e3

Wynikiem wyrażenienia warunkowego 𝐢𝐟e1𝐭𝐡𝐞𝐧e2𝐞𝐥𝐬𝐞e3 jest wartość wyrażenia e2, o ile wyrażenie e1 oblicza się do wartości różnej od zera; w przeciwnym przypadku wynikiem jest wartość wyrażenia e3.

Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.

Rozwiązanie


Ćwiczenie 2

Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję

e::=|𝐥𝐞𝐭x=e1𝐢𝐧e2

Wyrażenie 𝐥𝐞𝐭x=e1𝐢𝐧e2 zawiera w sobie deklarację x=e1, która stanowi mechanizm wiązania identyfikatorów w naszym języku. Deklaracja x=e1 wprowadza nową zmienną x oraz przypisuje jej wartość. Wartość wyrażenia 𝐥𝐞𝐭x=e1𝐢𝐧e2 obliczamy następująco: najpierw oblicza się wartość e1, podstawia ją za zmienną x, a następnie oblicza wyrażenie e2. Zakresem zmiennej x jest wyrażenie e2, czyli wewnątrz e2 można odwoływać się (wielokrotnie) do zmiennej x; Ogólniej, odwołania do zmiennej w wyrażeniu odnoszą się do "najbliższej" (najbardziej zagnieżdzonej) deklaracji tej zmiennej. Taki mechanizm wiązania identyfikatorów nazywamy wiązaniem statycznym. Przyjmujemy zwykłe (statyczne) reguły przesłaniania zmiennych, np. jeśli w e2 występuje podwyrażenie 𝐥𝐞𝐭x=e𝐢𝐧e, to deklaracja x=e "przesłania" deklarację x=e1 w wyrażeniu e.

Zakładamy, że na początku wartości wszystkich zmiennych są nieokreślone, czyli zmienne są niezainicjowane, a odwołanie do niezainicjowanej zmiennej jest uważane za niepoprawne.


{{przyklad|||

𝐥𝐞𝐭x=0𝐢𝐧𝐥𝐞𝐭y=7𝐢𝐧𝐥𝐞𝐭x=y+3𝐢𝐧x+x+ywynik=24

𝐥𝐞𝐭y=5𝐢𝐧𝐥𝐞𝐭x=(𝐥𝐞𝐭y=3𝐢𝐧y+y)𝐢𝐧x+ywynik=11

𝐥𝐞𝐭z=5𝐢𝐧x+z brak wyniku, odwołanie do niezainicjowanej zmiennej x

𝐥𝐞𝐭x=1𝐢𝐧𝐥𝐞𝐭x=x+x𝐢𝐧x+xwynik=4

Rozwiązanie

Zadania domowe

Ćwiczenie 1

Zapisz wariant 2 semantyki z poprzedniego zadania.


Ćwiczenie 2

Dotychczas wystąpienie błędu podczas obliczania wyrażenia, np. odwołanie do niezainicjowanej zmiennej, powodowało, że wyrażenie nie posiadało wartości (nie było ciągu tranzycji prowadzących do konfiguracji końcowej). Zmodyfikuj którąś z semantyk z poprzednich zadań tak, aby błąd był komunikowany jako jedna z konfiguracji końcowych. To znaczy: jeśli obliczenie wyrażenia e w stanie s jest niemożliwe bo wystąpił błąd, to

e,s*Blad


Ćwiczenie 3

Rozważ rozszerzenie języka wyrażeń o wyrażenia boolowskie:

n::=0|1|

x::=(identyfikatory)

b::=𝐭𝐫𝐮𝐞|𝐟𝐚𝐥𝐬𝐞|e1e2|¬b|b1b2

e::=n|x|e1+e2|𝐢𝐟b𝐭𝐡𝐞𝐧e2𝐞𝐥𝐬𝐞e3|𝐥𝐞𝐭x=e1𝐢𝐧e2

Zaproponuj semantykę małych kroków dla tego języka. Rozważ różne strategie obliczania wyrażeń boolowskich, oraz podejście leniwe. Na przykład w strategii lewostronnej dla b1b2, gdy b1 zostało obliczone do 𝐟𝐚𝐥𝐬𝐞, w podejściu leniwym nie ma wogóle potrzeby obliczania b2.