Semantyka i weryfikacja programów/Ćwiczenia 1: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
Sl (dyskusja | edycje)
cw 1 pierwsza przymiarka
m Zastępowanie tekstu – „.↵</math>” na „</math>”
 
(Nie pokazano 27 wersji utworzonych przez 5 użytkowników)
Linia 1: Linia 1:
== Zawartość ==


== Ćwiczenia 1: Semantyka operacyjna wyrażeń ==
Tematem tych zajęć jest semantyka operacyjna wyrażeń (małe kroki).




==== Zadanie: ====
== Semantyka operacyjna wyrażeń ==
Semantyka języka Tiny z wykładu używała funkcji semantycznych
 
 
{{cwiczenie|1|cw1|
 
Rozważmy bardzo prosty język wyrażeń, którego składnia opisana jest następującą gramatyką:
 
<math>
<math>
B, E : State \to State
n \, ::= \,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
</math>
</math>
dla określenie znaczenia wyrażeń boolowskich i arytmetycznych.
Zdefiniuj znaczenie wyrażeń za pomocą semantyki operacyjnej,
w stylu dużych kroków (semantyka naturalna) i małych kroków.
==== Rozwiązanie: ====
Przypomnijmy składnię wyrażeń boolowskich i arytmetycznych:


<math>
<math>
b \, ::= \,\,
x \, ::= \,\, \ldots \, (identyfikatory) \, \ldots
        true  \,\,|\,\,
        false  \,\,|\,\,
        e_1 \leq e_2  \,\,|\,\,
        \neg b  \,\,|\,\,
        b_1  \land  b_2  \,\,|\,\,
        b_1  \lor  b_2
</math>
</math>


<math>
<math>
e \,  ::= \,\,   
e \,  ::= \,\,   
         0   \,\,|\,\,  1    \,\,|\,\,   \ldots   \,\,|\,\,
         n   \,\,|\,\,
         x  \,\,|\,\,
        x   \,\,|\,\,
        e_1 + e_2  \,\,|\,\,
        e_1 + e_2   \,\,|\,\,
        e_1 * e_2 \,\,|\,\,
         \mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3
        e_1 - e_2
</math>
</math>


Wynikiem wyrażenienia warunkowego <math>\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3</math> jest wartość wyrażenia <math>e_2</math>, o ile wyrażenie <math>e_1</math> oblicza się do wartości różnej od zera; w przeciwnym przypadku wynikiem jest wartość wyrażenia <math>e_3</math>.
Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.
}}
<div class="mw-collapsible mw-made=collapsible mw-collapsed">
<span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie</span>
<div class="mw-collapsible-content" style="display:none">


Zacznijmy od dużych kroków.
Zacznijmy od ustalenia notacji i dziedzin syntaktycznych.
Niech <math>\mathbf{Num}</math> oznacza zbiór stałych liczbowych, <math>n \in \mathbf{Num} = \{ 0, 1, \ldots \}</math>.
Podobnie, niech <math>\mathbf{Var}</math> oznacza zbiór identyfikatorów, które mogą być nazwami zmiennych; <math>x \in \mathbf{Var}</math>.
Wreszcie, niech <math>\mathbf{Exp}</math> oznacza zbiór wyrażeń; <math>e \in \mathbf{Exp}</math>.
Dla ułatwienia zapisywania reguł zakładamy, że stałe  liczbowe są wyrażeniami, czyli <math>\mathbf{Num} \subseteq \mathbf{Exp}</math>.


===== Semantyka naturalna =====
Będziemy potrzebować zbioru "stanów", opisujących wartości przypisane zmiennym.
Najprostszym rozwiązaniem jest przyjąć, że stan to funkcja z <math>\mathbf{Var}</math> do <math>\mathbf{Num}</math>.
Oznaczmy przez <math>\mathbf{State}</math> zbiór wszystkich takich funkcji; stany oznaczać będziemy przez <math>s, s_1, s', \ldots \in \mathbf{State}</math>.


Chcemy, aby tranzycje wyrażen wyglądały następująco:
W naszej semantyce będziemy potrzebowac tranzycji dwóch postaci.
Po pierwsze, tranzycje postaci


<math>
<math>
e, s \longrightarrow n 
e, s \,\Longrightarrow, e', s
\quad \quad \quad
b, s \longrightarrow l,
</math>
</math>
gdzie
<math>s \in State</math>,
<math>n</math> jest liczbą całkowitą,
<math>n \in Int</math>, a <math>l \in Bool = \{ true, false \}</math>.
Tranzycja taka oznacza, że wyrażenie e w stanie s wylicza się do
wartości n, oraz że wyrażenie logiczne b w stanie s wylicza się do l.
Zauważmy, że zakładamy tu, iż obliczenie wyrażenia nie zmienia
stanu (nie ma efektów ubocznych).


W tym celu rozszerzamy zbiór konfiguracji <math>\Gamma</math> następująco:
oznaczające mały krok w trakcie obliczania wyrażenia <math>e</math> w stanie <math>s</math>,  w wyniku którego <math>e</math> wyewoluowało do <math>e'</math>.
Stan nie ulega zmianie podczas obliczania wyrażenia (nie ma tzw. ''efektów ubocznych''), więc to samo <math>s</math> figuruje po lewej i prawej stronie strzałki.
 
Po drugie, tranzycje postaci


<math>
<math>
\Gamma = (Instr \times State) \cup (Expr \times State) \cup (BExpr \times State) \cup State \cup Int \cup Bool
e, s \,\Longrightarrow, n 
</math>
</math>


gdzie Instr oznacza zbiór instrukcji (jedna z kategorii syntaktycznych
będą oznaczaczać, że wyrażenie <math>e</math> jest już policzone, a jego wartością jest <math>n</math>.
języka Tiny), Expr zbiór wyrażeń arytmetycznych a BExpr
 
zbiór wyrażeń boolowskich.
Zatem przyjmijmy, że zbiór konfiguracji to
<math>State = Var \to Int</math>.
Konfiguracje końcowe pozostają bez zmian (State).
Tranzycje dla instrukcji pozostają zasadniczo bez zmian, z tym,
że odwołania do funkcji semantycznych dla wyrazżen zastępujemy
przez odpowiednie tranzycje.
Np. dla instrukcji pętli będziemy mieć następujące reguły:


<math>
<math>
\frac{b, s \longrightarrow true  \quad \quad 
( \mathbf{Exp} \times \mathbf{State} ) \, \cup \, \mathbf{Num}
      I; \mbox{ while } b \mbox{ do } I, s \longrightarrow s'}
{\mathbf{while}\, b\, \mathbf{do}\, I, s \longrightarrow s'}
</math>
</math>
a konfiguracje końcowe to <math>\mathbf{Num}</math>.
{{
uwaga||uwaga1|
Tak naprawdę, druga postać tranzycji nie jest niezbędna, gdyż moglibyśmy umówić się, że konfiguracje końcowe to <math>\mathbf{Num} \times \mathbf{State}</math>.
}}
Najprostsze są tranzycje prowadzące do konfiguracji końcowej:


<math>
<math>
\frac{b, s \longrightarrow false}{while b do I, s \longrightarrow s}
n, s \,\Longrightarrow, n
</math>
</math>


Podobnie dla instrukcji warunkowej.
Symbol <math>n</math> po lewej stronie to wyrażenie składające się ze stałej liczbowej, podczas gdy <math>n</math> po prawej stronie reprezentuje liczbę będącą wartością wyrażenia.
Teraz zajmiemy się tranzycjami dla wyrażeń.
 
Zacznijmy od stalych arytmetycznych:
Zmienna oblicza się do swojej wartości w bieżącym stanie: 
 
<math>
x, s \,\Longrightarrow, n, s \quad \mbox{ o ile } s(x) = n</math>
 
Teraz zajmiemy się dodawaniem <math>e_1 + e_2</math>. Ponieważ semantyka jest w stylu małych kroków, musimy zdecydować się, czy najpierw obliczyć pierwszy (lewy) składnik <math>e_1</math>, czy drugi?
Jeśli wybierzemy lewy (strategia "lewostronna"), otrzymamy regułę:
 
<math>
e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s
\quad \mbox{ o ile } \quad
e_1, s \,\Longrightarrow, e'_1, s</math>
 
Reguły tej postaci będziemy zapisywać tak:


<math>
<math>
n, s \longrightarrow n, \quad \quad  \mbox{dla } n \in Int
\frac{e_1, s \,\Longrightarrow, e'_1, s}
    {e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s}
</math>
</math>


Zauważmy, iż celowo nie odróżniamy liczby n \in Int od
Czyli mały krok w <math>e_1</math> stanowi też mały krok w <math>e_1 + e_2</math>.
stałej reprezentującej tę liczbę, która może pojawić się
Po zakończeniu obliczania <math>e_1</math> przechodzimy do <math>e_2</math>:
w wyrażeniach zgodnie z przyjętą przez nas składnią.
Czyli zakładamy, że Int jest podzbiorem zbioru wyrażeń.
W powyższej tranzycji, n po lewej stronie to stała reprezentująca
liczbę, która widnieje po prawej stronie.


Analogiczne tranzycje dla stałych boolowskich to:
<math>
<math>
true, s \longrightarrow true
\frac{e_2, s \,\Longrightarrow, e'_2, s}
{n + e_2, s \,\Longrightarrow, n + e'_2, s}</math>
 
A na końcu dodajemy:


false, s \longrightarrow false
<math>
n_1 + n_2, s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
 
Zwróćmy tutaj uwagę na pewną subtelność, dotyczącą dwóch wystąpień symbolu <math>+</math>: pierwsze wystąpienie oznacza jedną z konstrukcji składniowych języka, a drugie oznacza operację dodawania w zbiorze <math>\mathbf{Num}</math>.
Pozwalamy sobie na taką kolizję oznaczeń, gdyż nie powinna ona prowadzić do niejednoznaczności. Pamiętajmy, że składnia języka jest składnią abstrakcyjną, więc zamiast <math>e_1 + e_2</math> moglibyśmy równie dobrze pisać np. <math>{\mathrm{add}}(e_1, e_2)</math>, a wtedy reguła wyglądałaby tak:
 
<math>
\mathrm{add}(n_1, n_2), s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
 
Inną możliwą strategią obliczania <math>e_1 + e_2</math> jest strategia "prawostronna", którą otrzymujemy zastępując pierwsze dwie z trzech powyższych reguł przez:
 
<math>
\frac{e_2, s \,\Longrightarrow, e'_2, s}
    {e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2}
\quad \quad
\frac{e_1, s \,\Longrightarrow, e'_1, s}
    {e_1 + n, s \,\Longrightarrow, e'_1 + n, s}</math>
 
Ponadto, jeśli przyjmiemy regułę pierwszą (dla <math>e_1</math>), trzecią i czwartą (dla <math>e_2</math>), otrzymamy strategię "równoległą", polegającą na obliczaniu jednocześnie <math>e_1</math> i <math>e_2</math>:
 
<math>
\frac{e_1, s \,\Longrightarrow, e'_1, s}
    {e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s}
\quad \quad
\frac{e_2, s \,\Longrightarrow, e'_2, s}
    {e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2}
\quad \quad
n_1 + n_2, s \,\Longrightarrow, n, s \quad \mbox{ o ile } n = n_1 + n_2</math>
 
Bardziej precyzyjnie mówiąc, małe kroki obliczające obydwa podwyrażenia przeplatają się, i to w dowolny sposób.
Ta dowolność prowadzi do ''niedeterminizmu'', czyli do sytuacji, gdy kolejna (następna) konfiguracja nie jest wyznaczona jednoznacznie.
Jest tak, gdyż możemy mieć do wyboru dwie różne tranzycje
 
<math>
e_1 + e_2, s \,\Longrightarrow, e'_1 + e_2, s
\quad \quad \quad
e_1 + e_2, s \,\Longrightarrow, e_1 + e'_2, s</math>
 
Zauważmy natomiast, że kolejność przeplatania się małych kroków obliczających <math>e_1</math> i <math>e_2</math> nie wpływa w tym przypadku na końcową wartość całego wyrażenia.
 
Na koniec reguły dla wyrażenia warunkowego.
 
<math>
\frac{e_1, s \,\Longrightarrow, e'_1, s}
    {\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, \mathbf{if}\, e'_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s}
</math>
</math>
Czynimy tu analogiczne założenie, że Bool jest podbiorem
wyrażen boolowskich.


Operatory arytmetyczne definiujemy następująco:
<math>
<math>
\frac{e_1, s \longrightarrow n_1   
\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, e_2, s \quad \mbox{ o ile } n \neq 0
        e_2, s \longrightarrow n_2
        n = n_1 + n_2    }
{e_1 + e_2,s \longrightarrow n}
</math>
</math>
Czyli aby obliczyć sumę e_1 + e_2 w stanie s, trzeba
najpierw obliczyć e_1 i e_2 w stanie s,
a następnie dodać obliczone wartości.
Zauważmy, że nie specyfikujemy kolejności, w jakiej mają się
obliczać e_1 i e_2.
I choć tutaj nie ma to żadnego znaczenia, w przyszłości
będzie inaczej, gdy jezyk będzie dopuszczał efekty uboczne wyrażeń.


Podobne reguły można napisać dla pozostałych operacji
<math>
arytmnetycznych, oraz dla spójników logicznych:
\mathbf{if}\, n \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\Longrightarrow, e_3, s \quad \mbox{ o ile } n = 0
</math>
 
</div></div>
 
 
 
{{cwiczenie|2|cw2|
}}
 
Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję


<math>
<math>
\frac{b_1, s \longrightarrow l_1  b_2, s
e \,  ::=  \,\,
\longrightarrow l_2   l = l_1 \land l_2}
        \ldots   \,\,|\,\,
{b_1  \land  b_2, s \longrightarrow l}
        \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
</math>
</math>
Oczywiście jeśli b_1 oblicza się do false, wartość
całego wyrażenia jest false niezależnie od wartości wyrażenia
b_2.


Czyli jeśli zaczniemy od obliczenia b_1 i wynikiem będzie
Wyrażenie <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> zawiera w sobie deklarację <math>x = e_1</math>, która stanowi mechanizm wiązania identyfikatorów w naszym języku.
false, to nie ma wogóle potrzeby obliczania b_2.
Deklaracja <math>x = e_1</math> wprowadza nową zmienną <math>x</math> oraz przypisuje jej wartość.
Oto odpowiednie reguły (lewo-stronne):
Wartość wyrażenia <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> obliczamy następująco: najpierw oblicza się wartość <math>e_1</math>, podstawia ją <font color=red>za</font> zmienną <math>x</math>, a następnie oblicza wyrażenie <math>e_2</math>.
Zakresem zmiennej <math>x</math> jest wyrażenie <math>e_2</math>, czyli wewnątrz <math>e_2</math> można odwoływać się (wielokrotnie) do zmiennej <math>x</math>;
Ogólniej, odwołania do zmiennej w wyrażeniu odnoszą się do "najbliższej" (najbardziej zagnieżdzonej) deklaracji tej zmiennej.
Taki mechanizm wiązania identyfikatorów nazywamy ''wiązaniem statycznym''.
Przyjmujemy zwykłe (statyczne) reguły przesłaniania zmiennych, np. jeśli w <math>e_2</math> występuje podwyrażenie <math>\mathbf{let}\, x = e \,\mathbf{in}\, e'</math>, to
deklaracja <math>x = e</math> "przesłania" deklarację <math>x = e_1</math> w wyrażeniu <math>e'</math>.
 
Zakładamy, że na początku wartości wszystkich zmiennych są ''nieokreślone'', czyli zmienne są niezainicjowane, a odwołanie do niezainicjowanej zmiennej jest uważane za niepoprawne.
 
 
 
{{przyklad|||


<math>
<math>
\frac{b_1, s \longrightarrow false}
\mathbf{let}\, x = 0 \,\mathbf{in}\, \mathbf{let}\, y = 7 \,\mathbf{in}\, \mathbf{let}\, x = y+3 \,\mathbf{in}\, x+x+y
{b_1 \land b_2,s \longrightarrow false}
\quad \quad \mapsto \quad \quad \mbox{wynik} = 24
</math>


\frac{b_1, s \longrightarrow true   
<math>
        b_2, s \longrightarrow l}
\mathbf{let}\, y = 5 \,\mathbf{in}\, \mathbf{let}\, x = (\, \mathbf{let}\, y = 3 \,\mathbf{in}\, y+y \,) \,\mathbf{in}\, x+y
{b_1 + b_2,s \longrightarrow l}
\quad \quad \mapsto \quad \quad \mbox{wynik} = 11
</math>
</math>


Wybraliśmy następującą kolejność obliczania wyrażeń:
<math>
najpierw b_1, potem b_2.
\mathbf{let}\, z = 5 \,\mathbf{in}\, x+z \quad \quad \mapsto \quad \quad \mbox{ brak wyniku, odwołanie do niezainicjowanej zmiennej } x
Pozostawiamy Czytelnikowi napisanie analogicznych reguł dla
</math>
kolejności odwrotnej (reguły prawo-stronne).


Rozważmy też następującą kombinację obydwu semantyk
(reguły równoległe):
<math>
<math>
\frac{b_1, s \longrightarrow false}
\mathbf{let}\, x = 1 \,\mathbf{in}\, \mathbf{let}\, x = x+x \,\mathbf{in}\, x+x
{b_1 \land b_2,s \longrightarrow false}
\quad \quad \mapsto \quad \quad \mbox{wynik} = 4
</math>
 
<div class="mw-collapsible mw-made=collapsible mw-collapsed">
<span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie</span>
<div class="mw-collapsible-content" style="display:none">


\frac{b_2, s \longrightarrow false}
Podobnie jak poprzednio, stan powinien opisywać wartości przypisane zmiennym.
{b_1 \land b_2,s \longrightarrow false}
Tym razem jednak uwzględnimy niezainicjowane zmienne, czyli zmienne bez żadnej wartości.
</math>
Przyjmijmy zatem, że stan to skończona funkcja częściowa z <math>\mathbf{Var}</math> do <math>\mathbf{Num}</math>.
Czyli jeśli którekolwiek z podwyrażeń daje wynik false,
Oznaczmy symbolem <math>\mathbf{State}</math> zbiór wszystkich takich funkcji:
to taki wynik zyskuje całe wyrażenie.
Dodatkowo potrzebujemy jeszcze reguły:
<math>
<math>
\frac{b_1, s \longrightarrow true 
\mathbf{State} = \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Num}
b_2, s \longrightarrow true}
</math>.
{b_1 \land b_2,s \longrightarrow true}
Naturalnym stanem początkowym jest stan "pusty", tzn. pusta funkcja częściowa, który będziemy oznaczać symbolem <math>\emptyset</math>.
</math>
Wartość wyrażenia <math>e</math> w stanie początkowym wynosi <math>n</math>, o ile zachodzi:
Zauważmy, że powyższych reguł nie da sie zaimplementować
sekwencyjnie: nie wiadomo czy najpierw obliczać
b_1 czy b_2.
Reguły te odpowiadają raczej strategii ,,równoległej'':
obliczaj ,,jednocześnie'' b_1 i b_2
albo do pierwszego false, albo aż obydwa się zakończą
z wynikiem true.


W naszym prostym języku wszystkie czterech warianty
<math>
są równoważne. Różnice pomiędzy nimi zobaczymy jednak już w
e, \emptyset \,\Longrightarrow^{*}\, n</math>
następnym zadaniu, w którym pojawi się prosta
odmiana efektów ubocznych (błąd wykonania).


Będziemy potrzebowac tranzycji dwóch postaci, podobnie jak poprzednio, ale pierwsza postać będzie nieco ogólniejsza:


Reguły dla pozostałych spójników logicznych oraz dla
<math>
negacji pozostawiamy jako ćwiczenie.
e, s \,\Longrightarrow, e', s'</math>


A teraz małe kroki.
Tranzycja ta oznacza mały krok w trakcie obliczania wyrażenia <math>e</math> w stanie <math>s</math>, w wyniku którego <math>e</math> wyewoluowało do <math>e'</math>, a nowym stanem jest <math>s'</math>.
Stan może się teraz zmienić na skutek deklaracji zmiennych.


===== Strukturalna semantyka operacyjna (małe kroki)  =====
Spróbujmy rozszerzyć semantykę z poprzedniego zadania.
Ponieważ stan jest funkcją częściową, musimy zmienić niektóre reguły, np.


Chcemy, aby tranzycje dla wyrażeń były postaci:
<math>
<math>
e, s \longrightarrow e', s
x, s \,\Longrightarrow, n, s \quad \mbox{ o ile } s(x) \mbox{ jest określone i } s(x) = n
</math>
</math>
i podobnie dla wyrażeń boolowskich:
 
Następnie dodajemy reguły dla wyrażenia <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math>.
Gdy <math>e_1</math> jest już obliczone, wystarczy reguła:
 
<math>
<math>
b, s \longrightarrow b', s
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2, s[x \mapsto n]</math>
 
Notacja <math>s[x \mapsto n]</math> oznacza stan <math>s</math>, który zmodyfikowano przypisując zmiennej <math>x</math> wartość <math>n</math>, niezależnie od tego, czy <math>s(x)</math> było określone, czy nie, i pozostawiając niezmienione wartości dla pozostałych zmiennych.
Formalnie
 
<math>
s[x \mapsto n](y) =
\begin{cases}
n    & y = x \\
s(y) & y \neq x
\end{cases}
</math>
</math>
gdzie s \in State.
Przyjmijmy na razie takie same konfiguracje i konfiguracje końcowe jak dla semantyki
naturalnej.


Zacznijmy od wyrażeń boolowskich.  
W szczególności dla <math>y \neq x</math>, <math>s[x \mapsto n](y)</math> jest określone wtedy i tylko wtedy, gdy <math>s(y)</math> jest określone.
 
Natomiast aby obliczyc <math>e_1</math>, potrzebujemy reguły:


<math>
<math>
true, s \Longrightarrow true
\frac{e_1, s \,\Longrightarrow, e'_1, s'}
{\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow, \mathbf{let}\, x = e'_1 \,\mathbf{in}\, e_2, s'}
</math>
 
Zwróćmy uwagę, że stan <math>s'</math> może być różny od <math>s</math>, np. dlatego, że wewnątrz <math>e_1</math> znajduje się podwyrażenie <math>\mathbf{let}\, y = \ldots</math>.
 
'''Pytanie:''' czy taka semantyka jest poprawna?
 
Niestety nie, gdyż nie uwzględniamy ograniczonego zasięgu zmiennej.
Rzućmy okiem na przykład:


false, s \Longrightarrow false
<math>
\mathbf{let}\, x = (\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z) \,\mathbf{in}\, z
</math>
</math>


Przejdźmy do spójników logicznych, powiedzmy b_1 \land b_2.
Według naszych intencji to wyrażenie nie ma wartości, gdyż ostatnie odwołanie do <math>z</math> jest błędne.
Ponieważ opisujemy teraz pojedyncze (małe) kroki składające się na
Natomiast według powyższych reguł mamy
wykonanie programu, musimy podać w jakiej kolejności będą się
wykonywać. Zacznijmy od strategii lewostronnej:


<math>
<math>
\frac{b_1, s \Longrightarrow b'_1, s}
\mathbf{let}\, x = (\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z) \,\mathbf{in}\, z, \emptyset \,\Longrightarrow,
{b_1 \land b_2, s \Longrightarrow b'_1 \land b_2, s}
\mathbf{let}\, x = z+z+z \,\mathbf{in}\, z, \emptyset[z \mapsto 4] \,\Longrightarrow, \quad \ldots \quad \,\Longrightarrow,
\quad
\mathbf{let}\, x = 12 \,\mathbf{in}\, z, \emptyset[z \mapsto 4] \,\Longrightarrow,
\frac{b_2, s \Longrightarrow b'_2, s}
12, \emptyset[z \mapsto 4] \,\Longrightarrow,
{l_1 \land b_2, s \Longrightarrow l_1 \land b_2, s}
12 !
\quad
l_1 \land l_2 \Longrightarrow l,  
\mbox{ o ile } l = l_1 \land l_2
</math>
</math>


Podobnie jak poprzednio, możemy zaniechać obliczania
Nasz błąd polega na tym, że po zakończeniu obliczania podwyrażenia <math>\mathbf{let}\, z = 4 \,\mathbf{in}\, z+z+z</math> "zapominamy" przywrócić zmiennej <math>z</math> poprzednią wartość (a właściwie brak wartości w przykładzie powyżej).
b_2 jeśli b_1 oblicza się do false.
Przedyskutujmy kilka wariantów.
 
<br>
'''Wariant 1'''
<br>
 
Wygodne i eleganckie rozwiązanie tego problemu jest możliwe, jeśli rozszerzymy składnię naszego języka.  
Intuicyjnie, reguła
 
<math>
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2, s[x \mapsto n]</math>
 
powinna zostać zastąpiona przez


<math>
<math>
\frac{b_1, s \Longrightarrow b'_1, s}
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow\, e_2 \,\mathbf{then}\, \mbox{przywróć wartość zmiennej x}, s[x \mapsto n]</math>
{b_1 \land b_2, s \Longrightarrow b'_1 \land b_2, s}


false \land b_2, s \Longrightarrow false
czyli potrzebujemy konstrukcji składniowej, która polega na obliczeniu wyrażenia <math>e_2</math>, a następnie na przypisaniu zmiennej <math>x</math> danej wartości.
Rozszerzmy zatem składnię następujaco:


true \land b_2, s \Longrightarrow b_2,s
<math>
</math>
e \,  ::=  \,\,  
        \ldots  \,\,|\,\,
        e \,\mathbf{then}\, x := n</math>


Analogicznie reguły prawostronne to:
Wyrażenie <math>e \,\mathbf{then}\, x:= n</math> jest w pewnym sensie dualne do <math>\mathbf{let}\, x = n \,\mathbf{in}\, e</math>, gdyż jedyna (choć niewątpliwie istotna) różnica między nimi to kolejność obliczenia <math>e</math> i przypisania wartości na zmienną <math>x</math>.
Oto nowa reguła


<math>
<math>
\frac{b_2, s \Longrightarrow b'_2, s}
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2 \,\mathbf{then}\, x := n', s[x \mapsto n] \quad
{b_1 \land b_2, s \Longrightarrow b_1 \land b'_2, s}
\mbox{ o ile } s(x) = n'</math>


b_1 \land false, s \Longrightarrow false
Pewna trudność pojawia się w sytuacji, gdy <math>s(x)</math> jest nieokreślone, czyli gdy zmienna <math>x</math> jest niezainicjowana -- reguła powyższa nie obejmuje wogóle takiej sytuacji.
Najprostszym sposobem rozwiązania tej trudności jest rozszerzenie konstrukcji <math>e \,\mathbf{then}\, x := n</math>:


b_1 \land true, s \Longrightarrow b_1, s
<math>
e \, ::=  \,\, 
        \ldots  \,\,|\,\,
        e \,\mathbf{then}\, x := n  \,\,|\,\,
        e \,\mathbf{then}\, x := \bot
</math>
</math>


Reguły równoległe otrzymujemy jako sumę reguł lewo- i
gdzie symbol <math>\bot</math> oznacza brak wartości.
prawostronnych (w sumie 6 reguł).
Dodajemy również regułę:


Oto reguła dla negacji:
<math>
<math>
\neg true, s \Longrightarrow false, s
\mathbf{let}\, x = n \,\mathbf{in}\, e_2, s \,\Longrightarrow, e_2 \,\mathbf{then}\, x := \bot, s[x \mapsto n] \quad
\mbox{ o ile } s(x) \, \mbox{ jest nieokreślone}</math>


\neg false, s \Longrightarrow true, s  
Rozwiązanie to jest odrobinę nieeleganckie, gdyż prawie identyczne reguły musimy napisać dwukrotnie.
Widać to np. w poniższych regułach, "scalających" semantykę dla <math>e \,\mathbf{then}\, x := n</math> z semantyką pozostałych wyrażeń:
 
<math>
\frac{e, s \,\Longrightarrow, e', s'}
{e \,\mathbf{then}\, x := n, s \,\Longrightarrow, e' \,\mathbf{then}\, x:= n, s'}
</math>
</math>


Reguły dla e_1 \leq e_2 są następujące:
<math>
n' \,\mathbf{then}\, x := n, s \,\Longrightarrow, n', s[x \mapsto n]
</math>


<math>
<math>
\frac{e_1, s \Longrightarrow e'_1, s}
n' \,\mathbf{then}\, x := \bot, s \,\Longrightarrow, n', s' \quad \mbox{ o ile } s(x)
{e_1 \leq e_2, s \Longrightarrow e'_1 \leq e_2, s}
\mbox{ jest określone i } s' = s \setminus \{ (x, s(x)) \}
</math>


\frac{e_2, s \Longrightarrow e'_2, s}
<br>
{e_1 \leq e_2, s \Longrightarrow e_1 \leq e'_2, s}
'''Wariant 2'''
<br>


n_1 \leq n_2, s \Longrightarrow true, s    o ile
Zanim przejdziemy do kolejnego wariantu, zastanówmy się, czy istnieje inny sposób rozwiązania trudności związanej z <math>n = \bot</math>, który pozwalałby uniknąć wprowadzania dodatkowej konstrukcji
n_1 \leq n_2
<math>e \,\mathbf{then}\, x := \bot</math>.
Pomysł może polegać na rozszerzeniu zbioru <math>\mathbf{Num}</math> o dodatkowy element <math>\bot</math>:


n_1 \leq n_2, s \Longrightarrow false, s    o ile
<math>
n_1 > n_2
n \, ::= \,\, \bot \,\,|\,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
</math>
</math>


Reguły powyższe zależą od semantyki wyrażen arytmetycznych.
Wtedy nie musimy pisać dwóch bardzo podobnych wariantów reguł.
Zauważmy, że ponownie pozostawiliśmy dowolność jeśli chodzi o
Dodatkowo, w tym rozwiązaniu warto poczynić umowę, że <math>s(x) = \bot</math> reprezentuje brak wartości zmiennej <math>x</math>.
kolejność obliczania wyrażeń arytmetycznych e_1 i e_2.
Wtedy stany są funkcjami całkowitymi z <math>\mathbf{Var}</math> w <math>\mathbf{Num}</math>, przyjmującymi wartość różną od <math>\bot</math> tylko dla skończenie wielu elementów.
Pewnym mankamentem jest to, że teraz <math>n = \bot</math> może pojawiać się w wyrażeniach podobnie jak stałe.
Tym niemniej nie musimy adaptować reguł dla stałych tak, aby radziły one sobie z <math>n = \bot</math>, ponieważ wyrażenia zawierające <math>\bot</math> możemy również uważać za roszerzenie składni.


Rozważmy teraz instrukcję warunkową i instrukcję pętli.
Jeśli jednak dopuścimy symbol <math>\bot</math> w wyrażeniach, to możemy elegancko wybrnąć z sytuacji, rozszerzając operacje arytmetyczne na zbiór <math>\mathbf{Num} \cup \{ \bot \}</math> tak, aby zachowywały one nieokreśloność:
Najpierw obliczamy wartość dozoru:


<math>
<math>
\frac{b, s \Longrightarrow b', s}
n + \bot = \bot + n = \bot</math>
{if b then I_1 else I_2, s \Longrightarrow
if b' then I_1 else I_2, s}


\frac{b, s \Longrightarrow b', s}
Trzeba jednak w takim razie zadbać o to, aby wyrażenie <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math> obliczało się normalnie tylko wtedy, gdy wartość wyrażenia <math>e_1</math> jest różna od <math>\bot</math>.
{while b do I, s \Longrightarrow while b' do I, s}
,
<br>
'''Wariant 3'''
<br>
 
Zrewidujmy teraz podstawowe założenia, które dotychczas poczyniliśmy.
Jednym z nich było przyjęcie ogólnej postaci tranzycji:
 
<math>
e, s \,\Longrightarrow, e', s'
</math>
</math>


a gdy dozór jest już obliczony, podejmujemy decyzję.
pozwalającej na zmianę stanu podczas obliczania wyrażenia.
W przypadku instrukcji warunkowej reguły są oczywiste:
Czy faktycznie był to dobry pomysł? Czy moglibyśmy poradzić sobie przy pomocy tranzycji postaci


<math>
<math>
if true then I_1 else I_2, s \Longrightarrow
e, s \,\Longrightarrow, e', s ?
I_1, s
 
if false then I_1 else I_2, s \Longrightarrow
I_2, s
</math>
</math>


Gorzej jest w przypadku instukcji pętli. Reguła mogłaby wyglądać tak:
Spróbujmy! Oto nowa wersja jednej z reguł dla <math>\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2</math>, dotycząca kroku wewnątrz <math>e_1</math>:


<math>
<math>
while true do I, s \Longrightarrow I; while ? do I, s
\frac{e_1, s \,\Longrightarrow, e'_1, s}
{\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow, \mathbf{let}\, x = e'_1 \,\mathbf{in}\, e_2, s}
</math>
</math>


ale nie wiemy już, jaki był dozór pętli (widzimy tylko wynik
Dotychczas nie ma problemu: podwyrażenie <math>e_1</math> jest prawidłowo obliczane w stanie <math>s</math>. Trudność pojawi się, gdy
obliczenia tego dozoru w stanie s, true).
zakończymy obliczanie <math>e_1</math> i przejdziemy do <math>e_2</math>.
Możemy odwołać się więc do tranzycji dużych kroków:
Oto możliwa reguła:


<math>
<math>
\frac{b, s \longrightarrow true}
\frac{e, s[x \mapsto n] \,\Longrightarrow, e', s[x \mapsto n] }
{while b do I, s \Longrightarrow I; while b do I, s}
    {\mathbf{let}\, x = n \,\mathbf{in}\, e, s \,\Longrightarrow, \mathbf{let}\, x = n \,\mathbf{in}\, e', s}</math>
 
Okazuje się, że wszystko jest w porządku. Wyrażenie <math>e</math> obliczamy w prawidłowym stanie, tzn. z wartością <math>n</math> przypisaną zmiennej <math>x</math>.
Mały krok w <math>e</math> daje przyczynek do małego kroku w całym wyrażeniu, a przy tym stan pozostaje niezmieniony.
Przy tym wogóle nie potrzebujemy przywracać poprzedniej wartości zmiennej <math>x</math>, ponieważ <math>x</math> zyskuje nową wartość "tylko" na potrzeby obliczania podwyrażenia <math>e</math>!
Można na to również spojrzeć inaczej: informacja o nowej wartości <math>n</math>  dla zmiennej <math>x</math> nie jest jawnie dodawana do stanu <math>s</math>, ale jest przechowywana w składni wyrażenia <math>\mathbf{let}\, x = n \,\mathbf{in}\, \ldots</math> jako deklaracja <math>x = n</math>.
Na końcu musimy oczywiście pozbyć się tej deklaracji za pomocą następującej tranzycji:


\frac{b, s \longrightarrow false}
<math>
{while b do I, s \Longrightarrow s}
\mathbf{let}\, x = n \,\mathbf{in}\, n', s \,\Longrightarrow, n', s
</math>
</math>


Takie rozwiązanie nie jest zatem ,,czystą'' semantyką
Podsumujmy. Okazuje się, że rozwiązanie nie było wcale łatwe, nawet dla tak prościutkiego języka. W przyszłości przekonamy się, że łatwiej jest poradzić sobie z zagadnieniem wiązania identyfikatorów w semantyce naturalnej (duże kroki).
małych kroków.
W wariancie 1 i 2 wprowadziliśmy do języka dodatkowe elementy, tak by łatwiej było pisać reguły. W przyszłości będziemy czasem stosować takie podejście.
Istnieją inne możliwe rozwiązania, w stylu małych kroków,
Niekiedy jednak rozszerzanie języka będzie zabronione.
których znalezienie pozostawiamy dociekliwemu czytelnikowi.


Na koniec podajemy reguły dla operacji arytmetycznych, na przykładzie
</div></div>
dodawania.
 
Przyjmijmy, dla przykładu, strategię lewostronną:  
== Zadania domowe ==
 
 
{{cwiczenie|1|cw1.dom|
 
Zapisz wariant 2 semantyki z poprzedniego zadania.
}}
 
 
{{cwiczenie|2|cw2.dom|
 
Dotychczas wystąpienie błędu podczas obliczania wyrażenia, np. odwołanie do niezainicjowanej zmiennej, powodowało, że wyrażenie nie posiadało wartości (nie było ciągu tranzycji prowadzących do konfiguracji końcowej).
Zmodyfikuj którąś z semantyk z poprzednich zadań tak, aby błąd był komunikowany jako jedna z konfiguracji końcowych.
To znaczy: jeśli obliczenie wyrażenia <math>e</math> w stanie <math>s</math> jest niemożliwe bo wystąpił błąd, to


<math>
<math>
\frac{e_1, s \Longrightarrow e'_1, s}
e, s \,\Longrightarrow^{*}\, \mathtt{Blad}</math>
{e_1 + e_2, s \Longrightarrow e'_1 + e_2, s}  
}}


\frac{e_2, s \Longrightarrow e'_2, s}
{n + e_2, s \Longrightarrow n + e'_2, s}


n_1 + n_2, s \Longrightarrow n, s  o ile
{{cwiczenie|3|cw3.dom|
n = n_1 + n_2
 
Rozważ rozszerzenie języka wyrażeń o wyrażenia boolowskie:
 
<math>
n \, ::= \,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots
</math>
</math>


<math>
x \, ::= \,\, \ldots \, (identyfikatory) \, \ldots
</math>


==== Zadanie: ====
Rozważ dodatkowo operację dzielenia:
<math>
<math>
e \, ::= \,\,  \ldots  \,\,|\,\,
b \, ::= \,\,  
         e_1 / e_2  
        \mathbf{true}   \,\,|\,\,
        \mathbf{false}  \,\,|\,\,
         e_1 \leq e_2 \,\,|\,\,
        \neg b  \,\,|\,\,
        b_1  \land  b_2
</math>
</math>
i rozszerz semantyki z poprzedniego zadania tak, by dzielenie przez
zero kończyło program.
Zamiast stanu wynikiem programu powinna byc informacja
o błędzie.


==== Rozwiązanie: ====
<math>
e \,  ::= \,\, 
        n  \,\,|\,\,
        x  \,\,|\,\,
        e_1 + e_2  \,\,|\,\,
        \mathbf{if}\, b \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3  \,\,|\,\,
        \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2
 
</math>


....
Zaproponuj semantykę małych kroków dla tego języka.
Rozważ różne strategie obliczania wyrażeń boolowskich, oraz podejście leniwe.
Na przykład w strategii lewostronnej dla <math>b_1 \land b_2</math>, gdy <math>b_1</math> zostało obliczone do <math>\mathbf{false}</math>, w podejściu leniwym nie ma wogóle potrzeby obliczania <math>b_2</math>.
}}

Aktualna wersja na dzień 21:29, 11 wrz 2023

Zawartość

Tematem tych zajęć jest semantyka operacyjna wyrażeń (małe kroki).


Semantyka operacyjna wyrażeń

Ćwiczenie 1

Rozważmy bardzo prosty język wyrażeń, którego składnia opisana jest następującą gramatyką:

n::=0|1|

x::=(identyfikatory)

e::=n|x|e1+e2|𝐢𝐟e1𝐭𝐡𝐞𝐧e2𝐞𝐥𝐬𝐞e3

Wynikiem wyrażenienia warunkowego 𝐢𝐟e1𝐭𝐡𝐞𝐧e2𝐞𝐥𝐬𝐞e3 jest wartość wyrażenia e2, o ile wyrażenie e1 oblicza się do wartości różnej od zera; w przeciwnym przypadku wynikiem jest wartość wyrażenia e3.

Zaproponuj semantykę operacyjną (małe kroki) dla tego języka.

Rozwiązanie


Ćwiczenie 2

Rozszerzmy język wyrażeń z poprzedniego zadania o jedną konstrukcję

e::=|𝐥𝐞𝐭x=e1𝐢𝐧e2

Wyrażenie 𝐥𝐞𝐭x=e1𝐢𝐧e2 zawiera w sobie deklarację x=e1, która stanowi mechanizm wiązania identyfikatorów w naszym języku. Deklaracja x=e1 wprowadza nową zmienną x oraz przypisuje jej wartość. Wartość wyrażenia 𝐥𝐞𝐭x=e1𝐢𝐧e2 obliczamy następująco: najpierw oblicza się wartość e1, podstawia ją za zmienną x, a następnie oblicza wyrażenie e2. Zakresem zmiennej x jest wyrażenie e2, czyli wewnątrz e2 można odwoływać się (wielokrotnie) do zmiennej x; Ogólniej, odwołania do zmiennej w wyrażeniu odnoszą się do "najbliższej" (najbardziej zagnieżdzonej) deklaracji tej zmiennej. Taki mechanizm wiązania identyfikatorów nazywamy wiązaniem statycznym. Przyjmujemy zwykłe (statyczne) reguły przesłaniania zmiennych, np. jeśli w e2 występuje podwyrażenie 𝐥𝐞𝐭x=e𝐢𝐧e, to deklaracja x=e "przesłania" deklarację x=e1 w wyrażeniu e.

Zakładamy, że na początku wartości wszystkich zmiennych są nieokreślone, czyli zmienne są niezainicjowane, a odwołanie do niezainicjowanej zmiennej jest uważane za niepoprawne.


{{przyklad|||

𝐥𝐞𝐭x=0𝐢𝐧𝐥𝐞𝐭y=7𝐢𝐧𝐥𝐞𝐭x=y+3𝐢𝐧x+x+ywynik=24

𝐥𝐞𝐭y=5𝐢𝐧𝐥𝐞𝐭x=(𝐥𝐞𝐭y=3𝐢𝐧y+y)𝐢𝐧x+ywynik=11

𝐥𝐞𝐭z=5𝐢𝐧x+z brak wyniku, odwołanie do niezainicjowanej zmiennej x

𝐥𝐞𝐭x=1𝐢𝐧𝐥𝐞𝐭x=x+x𝐢𝐧x+xwynik=4

Rozwiązanie

Zadania domowe

Ćwiczenie 1

Zapisz wariant 2 semantyki z poprzedniego zadania.


Ćwiczenie 2

Dotychczas wystąpienie błędu podczas obliczania wyrażenia, np. odwołanie do niezainicjowanej zmiennej, powodowało, że wyrażenie nie posiadało wartości (nie było ciągu tranzycji prowadzących do konfiguracji końcowej). Zmodyfikuj którąś z semantyk z poprzednich zadań tak, aby błąd był komunikowany jako jedna z konfiguracji końcowych. To znaczy: jeśli obliczenie wyrażenia e w stanie s jest niemożliwe bo wystąpił błąd, to

e,s*Blad


Ćwiczenie 3

Rozważ rozszerzenie języka wyrażeń o wyrażenia boolowskie:

n::=0|1|

x::=(identyfikatory)

b::=𝐭𝐫𝐮𝐞|𝐟𝐚𝐥𝐬𝐞|e1e2|¬b|b1b2

e::=n|x|e1+e2|𝐢𝐟b𝐭𝐡𝐞𝐧e2𝐞𝐥𝐬𝐞e3|𝐥𝐞𝐭x=e1𝐢𝐧e2

Zaproponuj semantykę małych kroków dla tego języka. Rozważ różne strategie obliczania wyrażeń boolowskich, oraz podejście leniwe. Na przykład w strategii lewostronnej dla b1b2, gdy b1 zostało obliczone do 𝐟𝐚𝐥𝐬𝐞, w podejściu leniwym nie ma wogóle potrzeby obliczania b2.