Semantyka i weryfikacja programów/Ćwiczenia 4

From Studia Informatyczne

Spis treści

Zawartość

Napiszemy semantykę naturalną języka wyrażeń, rozważymy strategię gorliwą (jak na wcześniejszych zajęciach, w semantyce małych kroków) i leniwą. Rozważymy i statyczne i dynamiczne wiązanie identyfikatorów. Następnie rozszerzymy ten język o lambda-abstrakcję i aplikację, otrzymując prosty język funkcyjny.


Różne semantyki naturalne wyrażeń

Ćwiczenie 1 (semantyka gorliwa)


Napisz semantykę dużych kroków dla języka wyrażeń, którego semantykę małokrokową napisaliśmy na jednych z poprzednich ćwiczeń:

n \, ::= \,\, 0 \,\,|\,\, 1 \,\,|\,\, \ldots

x \, ::= \,\, \ldots \, (identyfikatory) \, \ldots

e \,  ::=  \,\,           n   \,\,|\,\,         x   \,\,|\,\,         e_1 + e_2   \,\,|\,\,         \mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3  \,\,|\,\,         \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2


Rozwiązanie

Przypomnijmy, że zbiór stanów to

\mathbf{State} \, = \, \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Num}

Nasze tranzycje będą postaci e, s \,\longrightarrow\, n, gdzie e \in \mathbf{Exp}, s \in \mathbf{State}, n \in \mathbf{Num}.

Oto reguły semantyki naturalnej.

n, s \,\longrightarrow\, n

x, s \,\longrightarrow\, n \quad \mbox{ o ile } s(x) = n

\frac{e_1, s \,\longrightarrow\, n_1 \quad e_2, s \,\longrightarrow\, n_2}      {e_1 + e_2, s \,\longrightarrow\, n} \quad \mbox{ o ile } n = n_1 + n_2

\frac{e_1, s \,\longrightarrow\, n_1 \quad e_2, s[x \mapsto n_1] \,\longrightarrow\, n_2}      {\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\longrightarrow\, n_2}

\frac{e_1, s \,\longrightarrow\, n_1 \quad n_1 \neq 0 \quad e_2, s \,\longrightarrow\, n_2}      {\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\longrightarrow\, n_2}

\frac{e_1, s \,\longrightarrow\, n_1 \quad n_1 = 0 \quad e_3, s \,\longrightarrow\, n_3}      {\mathbf{if}\, e_1 \,\mathbf{then}\, e_2 \,\mathbf{else}\, e_3, s \,\longrightarrow\, n_3}

Zwróćmy uwagę na fakt, że prawidłowe odwzorowanie zasięgu deklaracji x = e_1 nie predstawia w semantyce naturalnej żadnych trudności, w przeciwieństwie do semantyki małych kroków.


Ćwiczenie 2 (semantyka leniwa)


Zmodyfikuj semantykę z poprzedniego zadania, aby uzyskać leniwą ewaluację wyrażeń, zgodnie z dyrektywą: nie obliczaj wyrażenia, o ile jego wynik nie jest potrzebny (albo: obliczaj wartość wyrażenia dopiero wtedy, gdy jego wynik jest naprawdę potrzebny). Spójrzmy na przykład:

\mathbf{let}\, x = 7 \,\mathbf{in}\, \mathbf{let}\, y = y+y \,\mathbf{in}\, x+x

Według semantyki z poprzedniego zadania wyrażnie to nie ma wartości, bo w deklaracji y = y+y jest odwołanie do niezainicjowanej zmiennej. Natomiast w semantyce leniwej wyrażenie to obliczy się do wartości 14, gdyż wyrażenie y+y nie będzie wogóle obliczane. Będzie tak dlatego, że w wyrażeniu x+x nie ma odwołań do zmiennej y.


Rozwiązanie

Semantyka leniwa będzie bardzo podobna do tej z poprzedniego zadania.

Zasadnicza różnica dotyczy informacji przechowywanej w stanie. Dotychczas s(x) nalażał do zbioru \in \mathbf{Num}, gdyż podwyrażenie e w \mathbf{let}\, x = e \,\mathbf{in}\, \ldots obliczało sie natychmiast. Jeśli chcemy opóżnic obliczenie tego podwyrażenia, to w s(x) powinniśmy zapamiętać całe (nieobliczone) wyrażenie e wraz ze stanem bieżącym. Czyli

\mathbf{State} \, = \, \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Exp} \times \mathbf{State}.

Np. odpowiednia reguła dla wyrażenia \mathbf{let}\, w semantyce małych kroków mogłaby wyglądać następująco:

\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\Longrightarrow\, e_2, s[x \mapsto (e_1, s)].

Czyli stan zawiera, dla każdej zmiennej, parę (wyrażenie definiujące, stan w momencie deklaracji).

Uważnego Czytelnika zapewne zaniepokoił fakt, że \mathbf{State} stoi zarówno po lewej, jak i po prawej stronie równania

\mathbf{State} \, = \, \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Exp} \times \mathbf{State}. Również zapis s[x \mapsto (e_1, s)] może wzbudzić niepokój, gdyż sugeruje on, iż s(x) zawiera jako jeden z elementów pary obiekt "tego samego typu" co s. Formalnego rozwiązania tego typu dylematów dostarcza teoria dziedzin. Natomiast na użytek semantyki operacyjnej wystarczy, jeśli uznamy, iż równanie \mathbf{State} \, = \, \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Exp} \times \mathbf{State} stanowi skrótowy zapis następującej definicji. Zdefiniujmy \mathbf{State}_0, \mathbf{State}_1, \ldots następująco:

\mathbf{State}_{0} = \{ \emptyset \}

\mathbf{State}_{n+1} = \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Exp} \times \mathbf{State}_{n}

i przyjmijmy, że

\mathbf{State} = \bigcup_{n \in \nat} \mathbf{State}_{n}

Tranzycje będą znów postaci:

e, s \,\longrightarrow\, n. Podamy tylko reguły dla wystąpienia zmiennej i dla wyrażenia \mathbf{let}\,. Reguły dla pozostałych konstrukcji języka pozostają praktycznie bez zmian.

\frac{e, s' \,\longrightarrow\, n}      {x, s \,\longrightarrow\, n} \quad \mbox{ o ile } s(x) = (e, s')

\frac{e_2, s[x \mapsto (e_1, s)] \,\longrightarrow\, n}      {\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\longrightarrow\, n}


Ćwiczenie 3 (semantyka dynamiczna)


Rozważmy teraz zupełnie inny mechanizm wiązania identyfikatorów zwany wiązaniem dynamicznym. Dla odróżnienia, dotychczasowy sposób wiązania (widoczności) identyfikatorów będziemy nazywać wiązaniem statycznym. Oto przykładowe wyrażenie:

\mathbf{let}\, y = x+1 \,\mathbf{in}\, \mathbf{let}\, x = 10 \,\mathbf{in}\, y

które nie ma wartości w pustym stanie początkowym, według semantyk z poprzednich zadań, ponieważ odwołanie do zmiennej x w deklaracji y = x+1 jest niepoprawne. Tak samo jest nawet w semantyce leniwej, gdyż wartość zmiennej y będzie w końcu policzona i będzie wymagała odwołania do x w stanie pustym.

Natomiast wyobrażmy sobie, że zmieniamy semantykę leniwą następująco: odwołanie do zmiennej x podczas obliczania wartości y będzie odnosiło się nie do stanu w momencie deklaracji y, ale do stanu w momencie odwołania do y. Jest to dość rewolucyjna zmiana, zapewne sprzeczna z intuicjami programisty (statyczne reguły widoczności zamieniamy na dynamiczne). W szczególności powyższe wyrażenie policzy się w semantyce dynamicznej do wartości 11, ponieważ stan w momencie odwołania do zmiennej y przypisuje zmiennej x wartość 10 !

Napisz semantykę naturalną dla wiązania dynamicznego.


Rozwiązanie

Teraz w stanie wystarczy przechowywać "wyrażenie" definiujące wartość danej zmiennej:

\mathbf{State} = \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Exp}.

Nie potrzebujemy zapamiętywać stanu, w którym byliśmy w momencie deklaracji.

Do obliczenia zapamiętanego wyrażenia użyjemy stanu, w którym będziemy w momencie odwołania do danej zmiennej. Znów podajemy tylko reguły dla wystąpienia zmiennej i dla wyrażenia \mathbf{let}\,, gdyż pozostałe reguły pozostają bez zmian

\frac{e, s \,\longrightarrow\, n}      {x, s \,\longrightarrow\, n} \quad \mbox{ o ile } s(x) = e

\frac{e_2, s[x \mapsto e_1] \,\longrightarrow\, n}      {\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\longrightarrow\, n}

Pytanie: czy \mathbf{let}\, x = x+1 \,\mathbf{in}\, x oblicza się do jakiejś wartości w stanie \emptyset?


Prosty język funkcyjny

Ćwiczenie 4 (przekazywanie parametru przez wartość)


Rozważmy prosty język funkcyjny F rozszerzający język wyrażeń z poprzednich zadań następująco:

e \,  ::=  \,\,           \ldots \,\,|\,\,         \lambda x.e \,\,|\,\,         e_1(e_2)

Lambda-abstrakcja \lambda x.e reprezentuje anonimową (nienazwaną) funkcję jednoargumentową, natomiast wyrażenie e_1(e_2) to aplikacja e_1 do e_2 (wyrażenie e_1 powinno zatem obliczać się do funkcji). Np.

(\lambda x. x+3)(2) \,\longrightarrow\, 5.

Przyjmijmy statyczną widoczność identyfikatorów. Możliwe są różne mechanizmy przekazywania parametrów. Na razie wybierzmy mechanizm przekazywania przez wartość, zapewne doskonale znany Czytelnikowi: wyrażenie będące parametrem aktualnym jest obliczane przed wywołaniem funkcji, czyli w stanie, w którym jesteśmy z momencie wywołania funkcji.

Zaproponuj semantykę naturalną dla tego języka dla obydwu mechanizmów przekazywania parametrów.


Rozwiązanie

Zauważmy, że oprócz deklaracji zmiennych, również machanizm przekazywania parametru do funkcji wymaga zmiany stanu.

Tranzycje będą postaci

e, s \,\longrightarrow\, v

gdzie v reprezentuje wartość, do której oblicza się program e.

Z tym, że wartościami będą nie tylko wartości liczbowe. Na przykład \lambda x. x oblicza się również do pewnej wartość, która w tym przypadku powinna reprezentować jakoś funkcję identycznościową. Wystarczającą reprezentacją funkcji będzie trójka: \langle x, e, s \rangle, gdzie x jest nazwą parametru formalnego, e jest ciałem funkcji, a s jest stanem, w którym należy obliczać wartość funkcji po zaaplikowaniu do jakiegoś parametru aktualnego. Oto prosty przykład pokazujący, dlaczego powinniśmy pamiętać stan:

\mathbf{let}\, x = 7 \,\mathbf{in}\, \mathbf{let}\, f = \lambda z.x+z \,\mathbf{in}\, \mathbf{let}\, x = f(1) \,\mathbf{in}\, f(10).

Funkcja f zwiększa parametr aktualny o x.

Program oblicza się do wartości 17, gdyż wystąpienie zmiennej x w ciele funkcji f wiąże statycznie, a zatem odnosi się zawsze do deklaracji x = 7, mimo tego, że w momencie wywołania tej funkcji wartość zmiennej x wynosi 8.

Oto jedyna reguła, jakiej będziemy potrzebować dla lambda-abstrakcji:

\lambda x.e, s \,\longrightarrow\, \langle x, e, s \rangle.

Nie potrafimy zrobić z funkcją \lambda x. e nic innego jak zapamiętać informację niezbędną do obliczania jej wartości w przyszłości.

Zatem zbiór wartości będzie następujący:

v \in  \mathbf{Values} = \mathbf{Num} \cup (\mathbf{Var} \times \mathbf{Exp} \times \mathbf{State})

a zbiór stanów \mathbf{State} określony jest następującym równaniem:

\mathbf{State} = \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Values}.

Zacznijmy od stałych, zmiennych i lambda-abstrakcji:

n, s \,\longrightarrow\, n  \quad \quad x, s \,\longrightarrow\, v \quad \mbox{ o ile } s(x) = v \quad \quad \lambda x.e, s \,\longrightarrow\, \langle x, e, s \rangle

W regule dla zmiennej, v oznacza albo wartość liczbową albo funkcyjną.

Pomijamy regułę dla dodawania, bo jest ona identyczna jak dla gorliwej semantyki wyrażeń. Reguła dla \mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2 będzie prawie taka sama jak dla wyrażeń, z tą różnicą, że wyrażenie e_1 definiujące wartość zmiennej x może się teraz obliczać do wartości funkcyjnej, np. \mathbf{let}\, x = (\lambda y.y+y) \,\mathbf{in}\, x(0).

\frac{e_1, s \,\longrightarrow\, v_1 \quad e_2, s[x \mapsto v_1] \,\longrightarrow\, v_2}      {\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\longrightarrow\, v_2}

Pozostała nam już tylko reguła dla aplikacji: najpierw oblicz funkcję; następnie oblicz wartość parametru aktualnego; wreszcie przekaż ją do ciała funkcji (czyli oblicz ciało funkcji w zmodyfikowanym stanie):

\frac{e_1, s \,\longrightarrow\, \langle x, e, s' \rangle \quad \quad       e_2, s \,\longrightarrow\, v' \quad \quad       e, s'[x \mapsto v'] \,\longrightarrow\, v}      {e_1(e_2), s \,\longrightarrow\, v}

Zwróćmy uwagę na wymóg, że e_1 oblicza się do wartości funkcyjnej \langle x, e, s' \rangle.

W szczególności np. wyrażenie 7(3+4) jest niepoprawne. Natomiast parametr aktualny nie musi być liczbą, może być funkcją, np. w programie:

\mathbf{let}\, g = \lambda f. \lambda x. f(x) \,\mathbf{in}\, g(\lambda x.x+1)(7)

który oblicza się do wartości 8.


Ćwiczenie 5 (przekazywanie parametru przez nazwę)


Zaproponuj leniwą semantykę języka F z mechnizmem przekazywanie parametru "przez nazwę". Mechanizm ten stanowi leniwy odpowiednik przekazywania przez wartość: nie obliczamy wyrażenia będącego parametrem aktualnym, a zamiast jego wartości przekazujemy do funkcji to wyrażenie wraz ze stanem z miejsca wywołania funkcji. To ten stan bedzie brany pod uwagę, gdy obliczana będzie wartość parametru, tzn. przy odwołaniu w ciele funkcji do parametru formalnego. Oto przykład programu:

\mathbf{let}\, f = \lambda x. 7 \,\mathbf{in}\, f(y)

który w stanie pustym (wszystkie zmienne nieokreślone) nie ma wartości przy przekazywaniu parametru przez wartość (bo odwołanie do zmiennej y jest niepoprawne), a oblicza się do wartości 7 jeśli wybierzemy mechanizm przekazywania przez nazwę.


Rozwiązanie

Zbiór wartości \mathbf{Values} stojących po prawej stronie symbolu \,\longrightarrow\, będzie taki sam jak w poprzednim zadaniu.

Natomiast zbiór stanów taki sam jak w semantyce leniwej wyrażeń:

\mathbf{State} = \mathbf{Var} \to_{\mathrm{fin}} \mathbf{Exp} \times \mathbf{State}.

Podamy tylko trzy reguły: dla wystąpienie zmiennej, deklaracji \mathbf{let}\, i aplikacji -- wszystkie pozostałe reguły pozostają takie same jak w poprzednim zadaniu.

\frac{e, s' \,\longrightarrow\, v}      {x, s \,\longrightarrow\, v} \quad \mbox{ o ile } s(x) = (e, s')

\frac{e_2, s[x \mapsto (e, s)] \,\longrightarrow\, v}      {\mathbf{let}\, x = e_1 \,\mathbf{in}\, e_2, s \,\longrightarrow\, v}

\frac{e_1, s \,\longrightarrow\, \langle x, e, s' \rangle \quad \quad       e, s'[x \mapsto (e_2, s)] \,\longrightarrow\, v}      {e_1(e_2), s \,\longrightarrow\, v}

Podstawowa różnica w ostatnej regule w porównaniu do poprzedniego zadania to brak ewaluacji parametru aktualnego e_2.

Zwróćmy też uwagę na wyrażenie s'[x \mapsto (e_2, s)], w którym s \neq s'. Stany, których potrzebowaliśmy dotychczas podczas poprzednich zajęć, miały zawsze postać s[x \mapsto (e, s)].


Zadania domowe

Ćwiczenie 1

Podaj przykład wyrażenia takiego, które:

  • ma wartość w semantyce statycznej i dynamicznej, ale w każdej inną
  • ma wartość w semantyce leniwej, a nie ma w dynamicznej
  • ma wartość w semantyce dynamicznej, a nie ma w leniwej.


Ćwiczenie 2

W semantyce leniwej wyrażeń, jeśli jest wiele odwołań do jakiejś zmiennej, to obliczenie wartości tej zmiennej nastąpi za każdym razem od nowa. Zmodyfikuj tę semantykę tak, aby wartość ta była obliczana co najwyżej raz. Zatem po pierwszym odwołaniu do zmiennej, jej obliczona wartość powinna zostać umieszczona w stanie, zastępując parę (wyrażenie, stan).


Ćwiczenie 3

Zaproponuj dynamiczne odpowiedniki obydwu statycznych semantyk dla języka funkcyjnego F. Czyli zakładamy, że widoczność identyfikatorów, m.in. w ciele funkcji, jest dynamiczna. Oto przykład programu, który w semantyce statycznej oblicza się do wartości 12, a w dynamicznej do wartości 5 (parametr przekazywany przez wartość):

\mathbf{let}\, x = 7 \,\mathbf{in}\, \mathbf{let}\, f = \lambda z. z+x \,\mathbf{in}\, \mathbf{let}\, x = 0 \,\mathbf{in}\, f(5)

Rozważ dwa mechanizmy przekazywania parametrów:

  • przez wartość
  • przez nazwę

Ten drugi mechanizm rozumiemy teraz następująco: parametr aktualny nie jest obliczany w momencie zaaplikowania do niego funkcji, a do ciała funkcji przekazuje się wyrażenie będące parametrem aktualnym. W momencie odwołania do parametru formalnego w ciele funkcji, wyrażenie będące parametrem aktualnym jest obliczane w bieżącym stanie (a nie w stanie z miejsca wywołania funkcji). Jako przykład rozważmy program:

(\lambda z. \mathbf{let}\, x = 10 \,\mathbf{in}\, z+z)(x) + 1

Przy przekazywaniu przez wartość w stanie pustym program się nie obliczy, ponieważ nie da się obliczyć parametru aktualnego x. Natomiast przy przekazywaniu przez nazwę, parametr aktualny będzie obliczany dopiero w momencie odwołania do parametru formalnego z, czyli w momencie obliczania wartości wyrażenia z + z. W stanie tym zmienna x ma już wartość, a zatem wartością całego programu będzie 21.