Programowanie funkcyjne/Strumienie: Różnice pomiędzy wersjami
Nie podano opisu zmian |
Nie podano opisu zmian |
||
Linia 149: | Linia 149: | ||
Sposób obliczania kolejnych elementów strumieni zdefiniowanych w sposób uwikłany najlepiej przedstawić sobie w postaci tabelki: | Sposób obliczania kolejnych elementów strumieni zdefiniowanych w sposób uwikłany najlepiej przedstawić sobie w postaci tabelki: | ||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="250"> | |||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align=" | |||
<param name="DIR" value="images/tab1/"> | <param name="DIR" value="images/tab1/"> | ||
</applet> | </applet> | ||
Linia 170: | Linia 160: | ||
Cons(0, stream_map succ nats);; | Cons(0, stream_map succ nats);; | ||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="250"> | |||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align=" | |||
<param name="DIR" value="images/tab2/"> | <param name="DIR" value="images/tab2/"> | ||
</applet> | </applet> | ||
Linia 192: | Linia 173: | ||
'''in''' w;; | '''in''' w;; | ||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="250"> | |||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align=" | |||
<param name="DIR" value="images/tab3/"> | <param name="DIR" value="images/tab3/"> | ||
</applet> | </applet> | ||
Linia 229: | Linia 199: | ||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="250"> | |||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align=" | |||
<param name="DIR" value="images/tab4/"> | <param name="DIR" value="images/tab4/"> | ||
</applet> | </applet> | ||
Linia 326: | Linia 286: | ||
Trójkąt Pascala można sobie przedstawić jako strumień strumieni liczb całkowitych. Zdefiniuj w sposób uwikłany taki strumień. | Trójkąt Pascala można sobie przedstawić jako strumień strumieni liczb całkowitych. Zdefiniuj w sposób uwikłany taki strumień. | ||
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align=" | <applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="550"> | ||
<param name="DIR" value="images/tab5/"> | <param name="DIR" value="images/tab5/"> | ||
</applet> | </applet> |
Wersja z 19:18, 28 wrz 2006
Czas rzeczywisty, a czas symulowany
Programowanie imperatywne i analogia obiektowa. Czas w modelowanym systemie jest modelowany przez czas w modelu systemu.
Programowanie strumieniowe --- nie ma takiej analogii z czasem. Staramy się w modelu oddać strukturę zależności, a niekoniecznie kolejność zdarzeń.
Strumień, to ciąg wartości --- cała, być może nieskończona, historia obiektu. Zamiast mówić o akcjach i zmianach stanu obiektów w danych chwilach patrzymy "jednym rzutem oka" na całą historię obiektu w czasoprzestrzeni. Staramy się oddać zależności między liniami świata jednych obiektów i innych.
Definiowanie form specjalnych
W Ocamlu argumenty procedur są obliczane gorliwie, tzn. najpierw są obliczane ich wartości, a dopiero potem przystępujemy do obliczania wartości procedury. Wyjątkiem są formy specjalne, np. instrukcja warunkowa if-then-else --- w zależności od wartości warunku, tylko jeden z pozostałych członów jest obliczany.
Czy można takie formy specjalne zaimplementować samemu? Tak. Potrzeba do tego dwóch rzeczy. Musimy umieć odroczyć moment obliczania wartości i wprowadzać własne makrodefinicje.
O uleniwianiu i odraczaniu obliczeń mówiliśmy w poprzednim wykładzie. W Ocamlu możemy nie tylko wprowadzając własne makrodefinicje, ale wręcz zmieniać składnię języka (sic!). Za analizę składniową odpowiedzialny jest preprocesor P4. Nie będziemy tu mówić o nim, gdyż wykracza to poza zakres tego kursu, choć raz użyjemy definicji wprowadzającej prostą formę specjalną.
Implementacja strumieni
Formalnie strumień to ciąg --- być może nieskończony. Pomysł polega jednak na tym, żeby był on "leniwy", tzn. obliczane były tylko potrzebne wartości. Tak więc strumień to para: wartość i odroczony strumień pozostałych wartości.
type 'a stream = Nil | Cons of 'a Lazy.t * 'a stream Lazy.t;; let empty s = s = Nil;; let head s = match s with Nil -> failwith "Empty" | Cons (h, _) -> force h;; let tail s = match s with Nil -> failwith "Empty" | Cons (_, t) -> force t;; EXTEND ... Makro Cons
Cons zostaje zdefiniowane jako makro:
Mając do dyspozycji takie konstruktory i selektory możemy zdefiniować kilka pomocniczych operacji na strumieniach:
let rec const_stream c = Cons (c, const_stream c);; let ones = const_stream 1;; let rec filter_stream p s = if empty s then Nil else let h = head s and t = tail s in if p h then Cons (h, filter_stream p t) else filter_stream p t;; let rec stream_ref s n = if n = 0 then head s else stream_ref (tail s) (n - 1);; let rec stream_map f s = if empty s then Nil else Cons (f (head s), stream_map f (tail s));;
Przykłady strumieni nieskończonych
Spróbujmy zdefiniować strumień liczb naturalnych:
let rec integers_from x = Cons(x, integers_from (x+1));; let nats = integers_from 0;;
Podobnie możemy zdefiniować strumień liczb Fibonacciego:
let fibs = let rec fibo a b = Cons (a, fibo b (a+b)) in fibo 0 1;;
Jak widać, jeżeli jesteśmy w stanie skonstruować iteracyjną procedurę wyliczającą kolejne elementy strumienia, to tym samym jesteśmy w stanie zdefiniować strumień tych wartości. Procedura taka stanowi ukrytą w strumieniu "maszynerię", która na żądanie podaje kolejne elementy strumienia. Takie definicje strumieni nazywamy nie uwikłanymi(w odróżnieniu od uwikłanych, które poznamy dalej).W przypadku definicji nie uwikłanych bytem rekurencyjnym jest procedura, a nie strumień. Strumień jest wtórny wobec procedury rekurencyjnej.
Strumienie to tylko jeden ze sposobów konstruowania złożonych struktur danych, taki jak np. listy. Można więc tworzyć strumienie list, listy strumieni, czy strumienie strumieni. Oto przykład:
let rec tails s = Cons (s, tails (tail s));;
Strumień liczb pierwszych - sito Eratostenesa
Spróbujmy skonstruować nieskończony strumień liczb pierwszych, generowanych metodą sita Eratostenesa. Sposób konstrukcji takiego strumienia możemy przedstawić w postaci schematu przypominającego schematy blokowe układów przetwarzających sygnały. Strumienie są zaznaczone liniami ciągłymi, a pojedyncze wartości przerywanymi.

Schemat ten możemy zapisać w postaci następującego programu:
let sitko p s = filter_stream (function x -> (x mod p) <> 0) s;; let rec sito s = Cons (head s, sito (sitko (head s) (tail s)));; let primes = sito (integers_from 2);;
Definicje uwikłane
Definiując nieskończone strumienie nie musimy tego zawsze robić poprzez podanie odpowiedniej procedury rekurencyjnej (integers-from, fibgen, sieve).Możemy użyć elementów strumienia do zdefiniowania jego samego.
let rec ones = Cons (1, ones);;
Do budowy bardziej skomplikowanych strumieni potrzebujemy dodatkowych operacji budujących strumienie. Na przykład, do utworzenia strumienia liczb naturalnych czy liczb Fibonacciego potrzebujemy dodawania strumieni.
let rec add_int_streams s1 s2 = if empty s1 or empty s2 then Nil else Cons (head s1 + head s2, add_int_streams (tail s1) (tail s2));; let rec nats = Cons (0, add_int_streams ones nats);;
Sposób obliczania kolejnych elementów strumieni zdefiniowanych w sposób uwikłany najlepiej przedstawić sobie w postaci tabelki:
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="250"> <param name="DIR" value="images/tab1/"> </applet>
Zamiast dodawania strumienia jedynek, możemy użyć operacji zwiększania o jeden:
let succ x = x + 1;; let rec nats = Cons(0, stream_map succ nats);;
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="250"> <param name="DIR" value="images/tab2/"> </applet>
let rec fibs = Cons (0, Cons (1, add_int_streams fibs (tail fibs)));; let tails s = let rec w = Cons (s, stream_map tail w) in w;;
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="250"> <param name="DIR" value="images/tab3/"> </applet>
Możemy też w uwikłany sposób zdefiniować strumień liczb pierwszych. Użyjemy do tego predykatu sprawdzającego, czy liczba jest pierwsza:
let rec primes = Cons (2, filter_stream prime (integers_from 3))
Natomiast predykat prime zdefiniujemy używając ... strumienia liczb pierwszych:
and prime n = let rec iter ps = if square (head ps) > n then true else if divisible n (head ps) then false else iter (tail ps) in iter primes;;
Całość działa poprawnie, ponieważ strumień jest leniwą strukturą danych. Pierwszy element strumienia liczb pierwszych, 2, jest dany explicite. Natomiast sprawdzając kolejne liczby, czy są pierwsze, zawsze mamy już obliczone potrzebne liczby pierwsze.
Konkretnie, największa obliczona liczba pierwsza wystarcza do przetestowania pierwszości liczb do włącznie. Natomiast kolejna liczba pierwsza spełnia .
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="250">
<param name="DIR" value="images/tab4/">
</applet>
Iteracje jako strumienie
W przypadku definicji nie uwikłanych używaliśmy procedur iteracyjnych do zdefiniowania strumieni. Możemy ten mechanizm odwrócić i użyć strumieni do opisania procesów iteracyjnych - kolejne elementy strumienia mogą reprezentować kolejne kroki iteracji. Oto przykład, strumień kolejnych przybliżeń pierwiastka, metodą Newtona:
let sqrt_improve x g = (g +. x /. g) /. 2.0;; let sqrt_stream x = let rec guesses = Cons (1.0, stream_map (sqrt_improve x) guesses) in guesses;;
Spróbujmy przybliżyć liczbę . Użyjemy do tego celu szeregu zbieżnego do :
let scale_stream c s = stream_map (function x -> x *. c) s;; let pi_summands = let succ x = if x > 0.0 then -.x -. 2.0 else -.x +. 2.0 in let rec s = Cons (1.0, stream_map succ s) in stream_map (fun x -> 1.0 /. x) s;; let partial_sums s = let rec ps = Cons (head s, add_float_streams (tail s) ps) in ps;; let pi_stream = scale_stream 4.0 (partial_sums (pi_summands 1.0));;
Taki strumień jest co prawda zbieżny, ale bardzo wolno. Po zsumowaniu pierwszych 1000 elementów ustalone są dopiero trzy pierwsze cyfry: . Jest to dosyć oczywiste, jeżeli zauważymy, że suma pierwszych elementów jest obarczona błędem rzędu
Można "przyspieszyć" zbieżność tego szeregu stosując "akcelerator Eulera". Jeśli jest sumą pierwszych wyrazów szeregu, to szereg zakcelerowany ma postać.
Działa on dobrze dla ciągów o malejących modułach błędów przybliżenia.
Dlaczego on działa? Przedstawmy kolejne sumy częściowe szeregu w postaci granica plus błąd: , . Wówczas elementy przyspieszonego szeregu mają postać:
Jeżeli np. i znaki są takie same lub naprzemienne, to , czyli ciąg natychmiast osiąga granicę.
.... sprawdzić, kiedy można strumień wiele razy przyspieszać ...
Oto implementacja akceleratora Eulera:
let euler_transform st = let transform s = let s0 = stream_ref s 0 and s1 = stream_ref s 1 and s2 = stream_ref s 2 in (s2 -. square (s2 -. s1) /. (s0 -. 2.0 *. s1 +. s2)) in stream_map transform (tails st);;
Taki strumień jest już zbieżny w rozsądnym czasie. Przeliczenie 1000 elementów przyspieszonego szeregu daje przybliżenie . Jeszcze lepsze wyniki daje wielokrotne przyspieszanie. Skonstruujmy strumień kolejnych przyspieszeń strumienia sum częściowych i wybierzemy z niego strumień pierwszych elementów:
let rec pi_table = Cons (pi_stream, stream_map euler_transform pi_table);; let pi_stream_acc = stream_map head pi_table;; let pi = stream_ref pi_stream_acc 8;;
Taki strumień już w 8 elemencie osiąga granice precyzji arytmetycznej.
Przykład: Trójkąt Pascala można sobie przedstawić jako strumień strumieni liczb całkowitych. Zdefiniuj w sposób uwikłany taki strumień.
<applet code="PSViewer" archive="images/d/dd/Psviewer.jar" align="center" width="600" height="550">
<param name="DIR" value="images/tab5/">
</applet>
Strumienie par - liczby Ramanujana
Przedstawimy teraz jako przykład operowania strumieniami, konstrukcję strumienia liczb Ramanujana. Liczby Ramanujana to takie liczby naturalne, które można przedstawić jako sumy sześcianów dwóch liczb naturalnych na dwa różne sposoby. Pierwsze z tych liczb, to: 1729, 4104, 13832, 20683. Niech waga pary liczb naturalnych to będzie suma sześcianów jej składowych. Pomysł konstrukcji strumienia liczb Ramanujana polega na skonstruowaniu strumienia (nieuporządkowanych) par liczb naturalnych uporządkowanego wg. niemalejących wag, wychwyceniu par o powtarzających się wagach i wypisaniu tych wag.
Następująca procedura łączy dwa strumienie uporządkowane wg. niemalejących wag elementów w jeden uporządkowany strumień. Waga jest określona w postaci funkcji w
let rec merge_weighted w s1 s2 = if empty s1 then s2 else if empty s2 then s1 else let h1 = head s1 and h2 = head s2 in if w h1 < w h2 then Cons (h1, merge_weighted w (tail s1) s2) else if w h1 > w h2 then Cons (h2, merge_weighted w s1 (tail s2)) else if h1 = h2 then Cons (h1, merge_weighted w (tail s1) (tail s2)) else Cons (h1, Cons (h2, merge_weighted w (tail s1) (tail s2)));;
Następujące definicje określają wagi par oraz funkcję tworzącą strumień par uporządkowanych wg. wag.
let cube x = x * x * x;; let weight (x, y) = cube x + cube y;; let rec pairs s = Cons ((head s, head s), merge_weighted weight (stream_map (function x -> (head s, x)) (tail s)) (pairs (tail s)));;
Następująca procedura pozostawia jedynie reprezentantów sekwencji elementów o powtarzających się wagach.
let rec non_uniq w s = let rec skip we s = if empty s then Nil else if we = w (head s) then skip we (tail s) else s in 'if empty s then Nil else if empty (tail s) then Nil else let h1 = head s and h2 = head (tail s) in if w h1 = w h2 then Cons (w h1, non_uniq w (skip (w h1) s)) 'else non_uniq w (tail s);;
Strumień liczb Ramanujana możemy zdefiniować następująco:
let ramanujan = in non_uniq weight (pairs nats);;
Co jeszcze ...
Strumienie jako reprezentacja danych, np. szeregów potęgowych. Operacje na funkcjach reprezentowanych w taki sposób.