Teoria kategorii dla informatyków/Wykład 11: Monady

Ważną klasę kategorii tworzą takie, których obiektami są zbiory z pewną dodatkową strukturą algebraiczną, zaś morfizmami - funkcje, które tą strukturę zachowują. Takie kategorie moglibyśmy z powodzeniem nazwać kategoriami algebraicznymi nad $𝐒 𝐞 𝐭$ . Rozważania nad odpowiednią definicją algebraiczności doprowadzą nas do odkrycia ciekawej struktury kategoryjnej: monady, która jest niejako ukryta w każdym sprzężeniu między funktorami.

W poszukiwaniu kategorii algebraicznych

Z pewnością na kategorie algebraiczne nie nadają się wszystkie kategorie konkretne, które charakteryzują się tym, że posiadają funktor zapominania o kodziedzinie $𝐒 𝐞 𝐭$ (Definicja 5.9). Nawet, gdybyśmy dodatkowo zażądali, aby tenże funktor zapominania $G : 𝐂 \to 𝐒 𝐞 𝐭$ miał lewe sprzężenie $F ⊣ G$ , które wskazuje jak odbudować w sposób wolny zapomnianą strukturę, to sytuacja ciągle nie jest zadowalająca. Na przykład, funktor zapominania $𝐓 𝐨 𝐩 \to 𝐒 𝐞 𝐭$ ma lewe sprzężenie, a my nie chcemy traktować $𝐓 𝐨 𝐩$ jako kategorii algebraicznej. Ale stąd warto rozpocząć poszukiwania, gdyż wszelkie kategorie, od których oczekujemy algebraiczności, jak $𝐆 𝐫 𝐩$ czy $𝐌 𝐨 𝐧$ , posiadają lewe sprzężenia do funktorów zapominania, które przypisują zbiorom odpowiednie algebry wolne.

Niech zatem $F : 𝐂 \to 𝐃$ i $G : 𝐃 \to 𝐂$ będą sprzężone: $F ⊣ G$ . Rozważmy funktor $T : 𝐂 \to 𝐂$ będący złożeniem funktorów $F$ i $G$ : $T = G F$ . Jedność $η : 1_{𝐂} \to G F$ sprzężenia ma zatem typ $1 \to T$ . Informacje o kojedności $ε : F G \to 1_{𝐃}$ również nietrudno zakodować w terminach funktora $T$ , bowiem skoro $ε : F G \to 1$ , to $ε_{F} : F G F \to F$ (przypomnijmy definicję: $ε_{F} (-) : = ε_{F (-)}$ ), a co za tym idzie: $G ε_{F} : G F G F \to G F$ . Transformacja $G ε_{F}$ jest naturalna; jeśli oznaczymy ją jako $μ$ , to dostajemy $μ : T T \to T$ . Diagramy trójkątne charakteryzujące sprzężenie z Twierdzenia 9.3 dają nam następujące komutujące trójkąty:

Naturalność $ε$ daje dodatkowo komutujący diagram (Zadanie Zadanie 11.1).

Widzimy więc, że po wprowadzeniu endofunktora $T$ i prostym przekształceniu sprzężenia, od którego pochodzi, pojawiła się pewna struktura. Dobrze wyróżnić je definicją i dokładnie zbadać:

Definicja 11.1 [monada]

Monadą w kategorii

𝐂

nazywamy trójkę

𝕋 = (T, η, μ)

, gdzie

T : 𝐂 \to 𝐂

jest funktorem, zaś

η : 1_{𝐂} \to T

i

μ : T T \to T

- tranformacjami naturalnymi takimi, że:

μ \circ μ T = μ \circ T μ,

μ \circ η_{T} = 1 = μ \circ T η,

tzn. takimi, że powyższe trzy diagramy komutują.

Uwaga

Dla sprzężenia

F ⊣ G

, monada

(G F, η, G η_{F})

nazywa się monadą indukowaną przez

F ⊣ G

. Jak każde pojęcie kategoryjne, monada ma swój odpowiednik dualny: komonadę. Każde sprzężenie indukuje komonadę

(F G, ε, F η_{G})

.

Czy struktura monady $𝕋 = (T, η, μ)$ nad kategorią $𝐂$ zawsze pochodzi od pewnego sprzężenia? Zauważmy, że aby odpowiedzieć na to pytanie musimy przede wszystkim odnaleźć drugą kategorię $𝐃$ i dwa funktory $F : 𝐂 \to 𝐃$ , $G : 𝐃 \to 𝐂$ , $F ⊣ G$ takie, że $T = G F$ . Okazuje się, że odpowiedź jest pozytywna: każda monada pochodzi od pewnego sprzężenia, a tak naprawdę istnieje wiele sprzężeń indukujących daną monadę. Te sprzężenia tworzą oddzielną kategorię. My wskażemy obiekt końcowy tej kategorii.

Dla monady $𝕋 = (T, η, μ)$ nad $𝐂$ definiujemy $𝕋$ -algebrę jako parę $(X, θ)$ , gdzie $X \in 𝐂_{0}$ , $θ : T X \to X$ oraz:

Morfizmem $𝕋$ -algebr $f : (X, θ) \to (Y, γ)$ jest morfizm $f : X \to Y \in 𝐂_{1}$ taki, że poniższy diagram komutuje:

Kategorię $𝕋$ -algebr będziemy oznaczać $𝐂^{𝕋}$ . Nazywamy ją od nazwisk odkrywców: kategorią Eilenberga - Moore'a. Zobaczmy, że istnieje naturalny funktor zapominania $G^{𝕋} : 𝐂^{𝕋} \to 𝐂$ definiowany jako:

G^{𝕋} ((X, θ) \overset{f}{\to} (Y, γ)) : = (X \overset{f}{\to} Y) .

Z drugiej strony, dla dowolnego $X \in 𝐂_{0}$ , para $(T X, μ_{X})$ jest tak zwaną wolną $𝕋$ -algebrą, oznaczaną jako $F^{𝕋} (X)$ . Operacja $F^{𝕋}$ rozszerza się do funktora $F^{𝕋} : 𝐂 \to 𝐂^{𝕋}$ , jeśli położymy:

F^{𝕋} (f : X \to Y) : = T f : (T X, μ_{X}) \to (T Y, μ_{Y}) .

W Zadaniu 11.2 pokażemy, że $(T X, μ_{X})$ dla dowolnego $X$ jest rzeczywiście algebrą, zaś w Zadaniu następnym nr 11.3 udowodnimy, że

Twierdzenie 11.2 [każda monada pochodzi od sprzężenia]

F^{𝕋} ⊣ G^{𝕋}

Monada indukowana przez to sprzężenie jest monadą $𝕋$ .

Przykłady monad

Niech $(P, \leq)$ będzie częściowym porządkiem. Monadą nad $P$ jest funkcja monotoniczna $T : P \to P$ taka, że $x \leq T x$ oraz $T T x \leq T x$ dla dowolnego $x \in P$ . (Te dwie nierówności wyrażają typu transformacji $η$ i $μ$ . Diagramy w definicji monady komutują, bo relacja $\leq$ jest przechodnia.) Powyższe zależności dla $T$ implikują, że $T x \leq T T x$ , czyli $T T = T$ . Funkcja $T$ jest więc idempotentna i traktuje się ją zwykle jako operację domknięcia.
Kowariantny funktor potęgowy $𝒫 : 𝐒 𝐞 𝐭 \to 𝐒 𝐞 𝐭$ indukuje monadę, gdzie $η_{X} : X \to 𝒫 (X)$ jest zanurzeniem $η_{X} (x) = {x}$ , zaś mnożenie $μ_{X} : 𝒫 𝒫 (X) \to 𝒫 (X)$ jest sumą zbiorów: $μ_{X} (𝒮) = ⋃ α$ . Własności tej monady bardzo dobrze podsumowują teoriomnogościowe własności sumy w połączeniu z notacją ${. . .}$ służącą do konstrukcji zbiorów. W Zadaniu 11.5 przedstawiamy dowód, że $(𝒫, {\cdot}, ⋃)$ jest monadą nad $𝐒 𝐞 𝐭$ . Identyczny dowód pokazuje, że $𝒫_{f i n} : {𝐒 𝐞 𝐭}_{f i n} \to {𝐒 𝐞 𝐭}_{f i n}$ (kowariantny funktor potęgowy na zbiorach skończonych) indukuje monadę nad ${𝐒 𝐞 𝐭}_{f i n}$ .
Niech $(M, *, e)$ będzie monoidem. Funktor $M \times (-) : 𝐒 𝐞 𝐭 \to 𝐒 𝐞 𝐭$ wraz z transformacjami naturalnymi $η_{X} (x) : = (e, x)$ oraz $μ_{X} (m_{2} * (m_{1}, x)) : = (m_{2} * m_{1}, x)$ definiuje monadę $𝕋$ . $𝕋$ -algebry to $M$ -automaty, które poznaliśmy w Zadaniu 1.11. Szczegóły tej konstrukcji opisujemy w Zadaniu 11.6.
Funktor $L i s t : 𝐒 𝐞 𝐭 \to 𝐌 𝐨 𝐧$ z Przykładu 5.3 jest lewym sprzężeniem do funktora zapominania $U : 𝐌 𝐨 𝐧 \to 𝐒 𝐞 𝐭$ . Złożenie $T = U F$ jest funktorem, który zbiorowi $X$ przypisuje $T (X)$ będący zbiorem skończonych słów nad $X$ . Jedność jest oczywiście zanurzeniem elementu $x \in X$ w listę jednoelementową $[x]$ . Jak zdefiniować mnożenie w tej monadzie? Jako $μ : T T X \to T X$ proponujemy transformację naturalną, która liście list:

[[x_{1}, . . ., x_{n}], [y_{1}, . . ., y_{m}], . . ., [z_{1}, . . ., z_{l}]]

przypisze listę:

[x_{1}, . . ., x_{n}, y_{1}, . . ., y_{m}, . . ., z_{1}, . . ., z_{l}] .

Łatwo pokazać, że $𝕋 = (T, η, μ)$ jest monadą nad $𝐒 𝐞 𝐭$ . Okazuje się, że kategoria $𝕋$ -algebr jest równoważna z kategorią monoidów $𝐌 𝐨 𝐧$ .

Rozważmy sprzężenie $F ⊣ G$ dla funktora wolnego $F : 𝐒 𝐞 𝐭 \to 𝐆 𝐫 𝐩$ i funktora zapominania $G : 𝐆 𝐫 𝐩 \to 𝐒 𝐞 𝐭$ . Niech $𝕋$ będzie monadą indukowaną przez to sprzężenie. A zatem $T (X)$ jest zbiorem podkładowym wolnej grupy nad zbiorem $X$ (czy Czytelnik pamięta z kursu algebry, jak taka grupa jest tworzona?). Jeśli $(X, θ)$ jest $𝕋$ -algebrą, dostaniemy strukturę grupy na $X$ , jeśli zdefiniujemy działanie jako $x \cdot y : = θ (⟨ x ⟩ ⟨ y ⟩)$ , gdzie $x \mapsto ⟨ x ⟩$ jest włożeniem generatorów, tzn. $η_{X} : X \to T X$ , $η_{X} (x) : = ⟨ x ⟩$ , zaś $⟨ x ⟩ ⟨ y ⟩$ jest mnożeniem w wolnej grupie nad $X$ . Za pomocą tej konstrukcji dostajemy funktor ${𝐒 𝐞 𝐭}^{𝕋} \to 𝐆 𝐫 𝐩$ . Odwrotnie, jeśli $G$ jest grupą, to homomorfizm $f_{G} : F (G) \to G$ , definiowany jako mnożenie liter słowa z $F (G)$ za pomocą działania grupy $G$ , daje wraz z $G$ $𝕋$ -algebrę $(G, f_{G})$ , a zatem obiektową część funktora typu $𝐆 𝐫 𝐩 \to {𝐒 𝐞 𝐭}^{𝕋}$ . Uwaga! Para funktorów, których szkic konstrukcji pokazaliśmy, stanowi równoważność kategorii $𝐆 𝐫 𝐩$ i ${𝐒 𝐞 𝐭}^{𝕋}$ .

Dwa ostatnie przykłady wskazują nam to, czego szukaliśmy od początku wykładu: odpowiedzi na pytanie, jakie kategorie chcemy uważać za algebraiczne!

Uwaga

Slogan: Kategoria

𝐂

jest algebraiczna, jeśli jest równoważna kategorii

{𝐒 𝐞 𝐭}^{𝕋}

dla pewnej monady

𝕋

nad

𝐒 𝐞 𝐭

. W ten sposób algebraiczne są grupy, grupy abelowe, monoidy, pierścienie, algebry Boole'a, półkraty, zwarte przestrzenie Hausdorffa. Przykładem kategorii, która nie jest algebraiczna są zupełne algebry Boole'a.

Monady w Haskellu

Monady są wykorzystywane m.in. w funkcyjnym języku programowania Haskell. Struktura monady doskonale nadaje się do specyfikacji: (a) operacji wejścia/wyjścia; (b) wyłapywania wyjątków (takich jak np. dzielenie przez zero); (c) interfejsów graficznych. Formalnie, monada w Haskellu jest pewnym typem danych, bardzo czytelnie opisuje tę sytuację w przypadku monady I/O (wejścia/wyjścia) fragment wykładu Paradygmaty programowania. Tenże Haskellowy typ danych jest tak naprawdę inastancją klasy Monad. Ta klasa wyposażona jest zawsze w dwie funkcje: $> > =$ i return:

class Monad m where return :: a -> m a (>>=) :: m a -> (a -> m b) -> m b

Funkcja return oczywiście pełni rolę jedności monady, zaś operacja >>= zawiera całą informację o funktorze indukującym monadę i mnożeniu. Dokładniej mówiąc, funktor indukujący monadę oznacza się jako:

map :: (t -> u) -> (M t -> M u),

zaś mnożenie monady jako:

join :: M(Mt) -> Mt.

Wtedy mamy następującą listę zależności pomiędzy tymi operacjami:

(map f) m jest tym samym, co: m >>= (\x -> return (f x)),

join m jest tym samym, co: m >>= (\x -> x),

m >>= f jest tym samym, co: join ((map f) m).

Teoria kategorii dla informatyków/Wykład 11: Monady

W poszukiwaniu kategorii algebraicznych

Przykłady monad

Monady w Haskellu

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia