Teoria kategorii dla informatyków/Wykład 4: Zaawansowane konstrukcje uniwersalne

Eksponent

Mając dane dwa zbiory $A$ i $B$ , możemy stworzyć- zgodnie z aksjomatyką teorii mnogości - zbiór wszystkich funkcji typu $A \to B$ oznaczany $B^{A}$ . W języku kategoryjnym powiedzielibyśmy, że dla danych dwóch obiektów $A, B \in {𝐒 𝐞 𝐭}_{0}$ , istnieje zawsze inny obiekt $B^{A}$ , który nazwiemy tu eksponentem. Jeszcze krócej tę samą myśl wypowiemy tak: $𝐒 𝐞 𝐭$ ma eksponenty. Spróbujmy zbadać, jaką własnością uniwersalną charakteryzują się eksponenty w $𝐒 𝐞 𝐭$ . Oto nieformalny tok rozumowania: skoro $B^{A}$ , który łatwo będzie nam też zapisywać w miarę potrzeby jako $[A, B]$ , jest pewnym specjalnym obiektem $𝐒 𝐞 𝐭$ , to muszą z nim być związane strzałki, które go dekonstruują, czyli rozkładają na czynniki $A$ , $B$ , z których powstał. (Tak było na przykład w przypadku produktu $A \times B$ , gdzie destruktorami są projekcje.) Teoria mnogości wspomaga nas tutaj twierdzeniem, że istnieje izmorfizm

$𝐒 𝐞 𝐭 (Z \times A, B) ≅ 𝐒 𝐞 𝐭 (Z, B^{A})$ (4.1)

Rzeczywiście, dowolnej funkcji $f : Z \times A \to B$ przyporządkowujemy funkcję $c u r r y (f) : Z \to B^{A}$ jako: $c u r r y (f) (z) : = f (z, -)$ . Operacja $c u r r y$ , nazywana kuryfikacją, jest szukaną bijekcją. Sens tej bijekcji możemy odczytać w następujący sposób - mając dane: funkcję $f : Z \times A \to B$ i dwa elementy $z \in Z$ , $a \in A$ , wartość $f (z, a)$ powstaje albo przez bezpośrednią aplikację funkcji $f$ do pary argumentów $(z, a)$ , albo poprzez aplikację funkcji $c u r r y (f)$ do argumentu $z$ i potem ewaluację tak powstałej funkcji na argumencie $a$ . Innymi słowy, poniższy diagram komutuje:

gdzie $e v : B^{A} \times A \to B$ jest ewaluacją definiowaną jako $e v (f, a) : = f (a)$ . Rzeczywiście:

(e v \circ (c u r r y (f) \times 1_{A})) (z, a) = e v (c u r r y (f) (z), a) = e v (f (z, -), a) = f (z, a)

albo w końcu:

e v \circ (c u r r y (f) \times 1_{A}) = f

Powyższe rozważania mają sens nie tylko w $𝐒 𝐞 𝐭$ , ale i w każdej kategorii z produktami. Otrzymujemy więc następującą definicję:

Definicja 4.1 [eksponent]

Niech $𝐂$ będzie kategorią z produktami. Eksponentem obiektów $A$ i $B$ w $𝐂$ jest obiekt $[A, B] \in 𝐂_{0}$ wraz ze strzałką $e v : [A, B] \times A \to B$ , nazywaną ewaluacją, taką że dla dowolnego obiektu $Z \in 𝐂_{0}$ i strzałki $f : Z \times A \to B$ istnieje dokładnie jedna strzałka $c u r r y (f) : Z \to [A, B]$ spełniająca równanie:

e v \circ (c u r r y (f) \times 1_{A}) = f

wyrażone na diagramie jako:

Uwaga techniczna: często w dowodach pojawiają się naraz ewaluacje różnych typów; wygodnie wtedy $e v : [A, B] \times A \to B$ oznaczyć jako ${e v}_{A, B}$ .

Zauważmy, że dla dowolnej strzałki $g : Z \to [A, B]$ możemy zdefiniować jej odwrotność jako

u n c u r r y (g) : = e v \circ (g \times 1_{A}) : Z \times A \to B

Wtedy własność uniwersalna z powyższej definicji daje nam:

c u r r y (u n c u r r y (g)) = g

oraz dla dowolnej $f : Z \times A \to B$ komutowanie powyższego diagramu natychmiast implikuje, że:

u n c u r r y (c u r r y (f)) = f

Pokazaliśmy więc izomorfizm:

${H o m}_{𝐂} (Z \times A, B) ≅ {H o m}_{𝐂} (Z, [A, B])$ , (4.2)

który uogólnia izomorfizm (4.1) dla $𝐒 𝐞 𝐭$ .

Kategorie kartezjańsko zamknięte

Kategorie, w których istnieją eksponenty zasługują na wyróżnienie:

Definicja 4.2

Kategoria

𝐂

jest kartezjańsko zamknięta, jeśli posiada obiekt końcowy, produkty binarne i eksponenty.

Oto przykłady:

$𝐒 𝐞 𝐭$ jest kartezjańsko zamknięta. Podobnie ${𝐒 𝐞 𝐭}_{f i n}$ , gdyż konstrukcje są takie same, jak dla $𝐒 𝐞 𝐭$ , a eksponent $[A, B]$ dla zbiorów skończonych jest zbiorem skończonym.
Kategoria $𝐏 𝐨 𝐬$ jest kartezjańsko zamknięta. Produkt dwóch posetów $(P, \leq) \times (Q, \leq)$ definiuje się jako produkt zbiorów $P \times Q$ wraz z relacją częściowego porządku po współrzędnych: $(p_{1}, q_{1}) \leq (p_{2}, q_{2})$ wtedy i tylko wtedy, gdy $(p_{1} \leq p_{2}) \land (q_{1} \leq q_{2})$ wraz z naturalnymi projekcjami $π_{P} (p, q) : = p$ i $π_{Q} (p, q) : = q$ . Jako eksponent $[P, Q]$ bierzemy zbiór wszystkich funkcji monotonicznych typu $P \to Q$ wraz z porządkiem po współrzędnych: $f ⊑ g ⟺ \forall z \in P (f (z) \leq g (z))$ Ewaluacja i kuryfikacja są definiowane tak jak w $𝐒 𝐞 𝐭$ , wystarczy więc sprawdzić, że są monotoniczne. Jeśli $(f, p) \leq (q, r)$ w $[P, Q] \times P$ , to $e v (f, p) = f (p) \leq g (p) \leq g (r) = e v (g, r)$ a zatem ewaluacja jest monotoniczna. Natomiast dla $f : Z \times P \to Q$ , $z ⊑ z^{'}$ , $p \in P$ mamy $c u r r y (f) (z) (p) = f (z, p) \leq f (z^{'}, p) = c u r r y (f) (z^{'}) (p)$ co świadczy o tym, że $c u r r y (f) (z) \leq c u r r y (f) (z^{'})$ , czyli że kuryfikacja jest monotoniczna dla każdej funkcji $f$ .
Dwie ważne dla semantyki języków programowania kategorie kartezjańsko zamknięte: kategorię posetów zupełnych $𝐃 𝐜 𝐩 𝐨$ i kategorię bc-dziedzin $𝐁 𝐂$ omawiamy oddzielnie w Wykładzie 13.
Poset $(P, \leq)$ z elementem najmniejszym $0$ jako kategoria jest kartezjańsko zamknięty wtedy i tylko wtedy, gdy jest algebrą Heytinga, zobacz podrozdział nt. algebr Heytinga.
$𝐂 𝐚 𝐭$ - kategoria wszystkich małych kategorii - jest kartezjańsko zamknięta.
Dla dowolnej małej kategorii $𝐂$ kategoria funktorów $[𝐂^{o p}, 𝐒 𝐞 𝐭]$ jest kartezjańsko zamknięta. Do tego przykładu wrócimy w Wykładach 7 i 8.
Kartezjańsko zamknięte nie są: $𝐕 𝐞 𝐜 𝐭$ , $𝐀 𝐛$ , $𝐓 𝐨 𝐩$ , $𝐌 𝐞 𝐭$ , ... z różnych przyczyn.

Algebry Heytinga

Przypomnijmy najpierw - w telegraficznym skrócie -pojęcia kraty dystrybutywnej i algebry Boole'a: Niech $(L, \leq)$ będzie kratą z elementem najmniejszym $𝟎$ i elementem największym $𝟏$ . Łatwo się przekonać, że kratę można również zdefiniować jako algebrę, bez relacji $\leq$ , jedynie za pomocą równości i prymitywnych operacji $\land, \lor, 𝟎, 𝟏$ .

Stwierdzenie 4.3

Niech

L

będzie zbiorem z operacjami:

\land : L \times L \to L

\lor : L \times L \to L

𝟎 : 1 \to L

𝟏 : 1 \to L

gdzie $\land$ i $\lor$ są łączne i przemienne oraz spełniają następujące aksjomaty:

x \land x = x

x \lor x = x

𝟏 \land x = x

𝟎 \lor x = x

x \land (y \lor x) = x = (x \land y) \lor x

dla dowolnych $x, y, z \in L$ . Wówczas $(L, \leq)$ jest kratą, gdzie $\leq$ definiujemy jako

x \leq y ⟺ x = x \land y

lub równoważnie:

x \leq y ⟺ y = x \lor y

Oczywiście twierdzenie odwrotne też zachodzi.

Niektóre spośród krat posiadają ciekawą własność:

Definicja 4.4

Kratę

(L, \leq)

nazywamy dystrybutywną, jeśli dla dowolnych

x, y, z \in L

zachodzi

x \land (y \lor z) = (x \land y) \lor (x \land z)

Fakt 4.5

Powyższa równość w definicji implikuje równość dualną:

x \lor (y \land z) = (x \lor y) \land (x \lor z)

Definicja 4.6

Elementem przeciwnym do

x

w kracie

L

nazywamy element

a \in L

taki, że

x \land a = 𝟎

i

x \lor a = 𝟏

.

Fakt 4.7

W kracie dystrybutywnej element przeciwny do

x

jest jedyny. Oznaczamy go wówczas jako

\neg x

.

Najbardziej znanymi kratami dystrybutywnymi są niewątpliwie algebry Boole'a.

Definicja 4.8 [algebra Boole'a]

Algebrą Boole'a nazywamy kratę dystrybutywną, w której każdy element

x

ma element przeciwny.

Fakt 4.9

W dowolnej algebrze Boole'a $L$ zachodzą równości:

\neg (x \lor y) = \neg x \land \neg y

\neg (x \land y) = \neg x \lor \neg y

\neg \neg x = x

Pierwszą i drugą równość nazywamy prawami de Morgana.

Algebry Boole'a są szczególnymi przypadkami innych krat dystrybutywnych, tzw. algebr Heytinga, które omawiamy poniżej:

Definicja 4.10 [algebra Heytinga]

Algebrą Heytinga nazywamy kratę

(L, \leq)

z elementem najmniejszym

𝟎

, elementem największym

𝟏

i operacją

\Rightarrow : L \times L \to L

definiowaną dla każdej pary elementów

x, y \in L

jako:

x \Rightarrow y : = ⋁ {z \in L ∣ z \land x \leq y}

Taka definicja może na pierwszy rzut oka wydawać się przypadkowa. Punkt widzenia teorii kategorii rozjaśnia wątpliwości natychmiast: Jeśli potraktujemy kratę $(L, \leq, 𝟎, 𝟏)$ jako kategorię, będzie to kategoria, w której pomiędzy dwoma dowolnymi obiektami istnieje co najwyżej jedna strzałka, z elementem początkowym $𝟎$ , końcowym $𝟏$ , produktami (infima binarne: $\land$ ) i koproduktami (suprema: $\lor$ ). Krata taka jest algebrą Heytinga wtedy i tylko wtedy, gdy istnieje operacja $\Rightarrow$ taka, że

x \Rightarrow y = ⋁ {z \in L ∣ z \land x \leq y}

dla każdego $x, y \in L$ . Ta definicja da się przepisać następująco:

z \leq x \Rightarrow y ⟺ z \land x \leq y

co w terminach kategoryjnych oznacza, ze istnieje bijekcja pomiędzy strzałkami ${H o m}_{L} (z, x \Rightarrow y)$ i strzałkami $H o m (z \land x, y)$ . A ten warunek jest dokładnie warunkiem uniwersalnym dla elementu $x \Rightarrow y$ traktowanego jako eksponent!

A zatem: algebra Heytinga to poset z elementem najmniejszym, który jako kategoria jest kartezjańsko zamknięty. Warto zapamiętać tę charakteryzację.

Ponieważ:

Fakt 4.11

W dowolnej algebrze Boole'a mamy:

z \leq (\neg x \lor y) ⟺ z \land x \leq y

więc każda algebra Boole'a jest algebrą Heytinga. Można też pokazać, że:

Fakt 4.12

W dowolnej algebrze Heytinga

L

, jeśli dla

x \in L

istnieje

\neg x

, to musi być

\neg x = x \Rightarrow 𝟎

.

Kartezjańska zamkniętość algebr Heytinga daje nam natychmiast następujące równości (które w innych kategoriach są izomorfizmami) i nierówności (czyli istnienie odpowiednich strzałek) - porównaj Zadanie 4.3:

Fakt 4.13

W dowolnej algebrze Heytinga zachodzą zależności:

x \leq (y \Rightarrow (x \land y))

y \land (y \Rightarrow x) \leq x

(x \Rightarrow 𝟏) = 𝟏

(𝟏 \Rightarrow x) = x

(y \land z) \Rightarrow x = (z \Rightarrow (y \Rightarrow x))

(x \Rightarrow (y \land z)) = (x \Rightarrow y) \land (x \Rightarrow z)

𝟏 \leq x \Rightarrow x

𝟏 \leq (x \Rightarrow (y \Rightarrow x))

𝟏 \leq (x \Rightarrow (y \Rightarrow z)) \Rightarrow ((x \Rightarrow y) \Rightarrow (x \Rightarrow z))

Powyższe własności doprowadzają nas do najważniejszego wniosku w tym podrozdziale: algebry Heytinga są algebraicznym odpowiednikiem rachunku intuicjonistycznej logiki zdaniowej. Naszkicujmy tę odpowiedniość w obie strony: dla danej algebry Heytinga $(L, \leq, 𝟎, 𝟏, \land, \lor, \Rightarrow)$ traktujemy elementy $x \in L$ jako zmienne, $\leq$ jako syntaktyczną relację dedukcji $⊢$ , $𝟎$ , $𝟏$ jako stałe fałsz i prawda, zaś operacje $\land, \lor, \Rightarrow$ jako spójniki zdaniowe. Wówczas taki system jest rachunkiem zdaniowym logiki intuicjonistycznej.

Odwrotnie, załóżmy, że mamy dany język zdaniowy, intuicjonistyczny, $ℒ$ , składający się ze zmiennych zdaniowych $x, y, z, . .$ , z których za pomocą spójników $\land, \lor, \Rightarrow$ i stałych $𝟎, 𝟏$ tworzymy w znany sposób zdania $p, q, r, . .$ oraz z syntaktycznej relacji dedukcji $⊢$ podlegającej aksjomatom:

$⊢$ jest zwrotna i przechodnia,
$p ⊢ 𝟏$ ,
$𝟎 ⊢ p$ ,
$p ⊢ q$ i $p ⊢ r$ wtedy i tylko wtedy, gdy $p ⊢ q \land r$ ,
$p ⊢ r$ i $q ⊢ r$ wtedy i tylko wtedy, gdy $p \lor q ⊢ r$ ,
$p \land q ⊢ r$ wtedy i tylko wtedy, gdy $p ⊢ q \Rightarrow r$ .

Wówczas z $ℒ$ tworzymy algebrę $H (ℒ)$ , tzw. algebrę Lindenbauma - Tarskiego składającą się z klas abstrakcji $[p]$ relacji równoważności $=$ danej przez

[p] = [q] ⟺ p ⊣ ⊢ q

Algebra $H (ℒ)$ jest częściowym porządkiem:

[p] \leq [q] : ⟺ p ⊢ q

z elementem największym $[𝟏]$ i najmniejszym $[𝟎]$ . Operacje algebry są zadane jako: $[p] \land [q] : = [p \land q]$ , i tak samo dla $\lor$ oraz $\Rightarrow$ . Tak utworzona algebra $H (ℒ)$ jest algebrą Heytinga, która - co więcej - ma tę własność, że zdanie $p$ można udowodnić w $ℒ$ wtedy i tylko wtedy, gdy $[p] = 𝟏$ w $H (ℒ)$ .

Kategorie kartezjańsko zamknięte a lambda rachunek

Oczywiście można i trzeba sobie zadać pytanie: skoro algebry Heytinga są algebraicznym równoważnikiem zdaniowego rachunku logiki intuicjonistycznej, to czy ten fenomen przenosi się na ogólne kategorie kartezjańsko zamknięte? Pytamy zatem: jaki język odpowiada dowolnej kategorii kartezjańsko zamkniętej $𝐂$ ? Nie dość, że pytanie jest dobrze postawione, co się okaże za chwilę, to jeszcze ma bardzo satysfakcjonującą odpowiedź: tym językiem jest rachunek lambda! W rzeczywistości struktury: kategorii kartezjańsko zamkniętej i lambda rachunku, są dwoma odbiciami tego samego zjawiska, czy też - jeśli ktoś woli inną poetykę - kategorie k.z. i $λ$ -rachunek są dwiema manifestacjami tej samej struktury matematycznej. Poniżej spróbujemy wykazać tą tezę w kilku krokach:

Po pierwsze, pokażmy, że dla $λ$ -rachunku kategoria $𝐂 (λ)$ , zdefiniowana w Zadaniu 1.11, wzbogacona o obiekt końcowy (który zawsze łatwo dodać), jest kartezjańsko zamknięta. Widzieliśmy już w podrozdziale nt. produktów, że ta kategoria posiada produkty. Pokażemy zatem, że posiada eksponenty. Oczywiście $[A, B] : = A \to B$ dla typów $A, B$ , zaś ewaluacja i odwrotność kuryfikacji są zdefiniowane, jak następuje:

e v : = λ z . π_{1} (z) π_{2} (z) : [A, B] \times A \to B

u n c u r r y (f) : = λ z . λ x . f (z, x) : Z \to [A, B]

gdzie $z : Z, x : A$ . Wtedy - pamiętając, że

g \times h = λ w . ⟨ g π_{1} (w), h π_{2} (w) ⟩

mamy:

e v \circ (c u r r y (f) \times 1_{A}) = λ v . (λ z . π_{1} (z) π_{2} (z)) (λ w . ⟨ (λ y . λ x . f (y, x)) π_{1} (w), (λ u . u) π_{2} (w) ⟩) v = λ v . (λ z . π_{1} (z) π_{2} (z)) (⟨ λ x . f (π_{1} (v), x), π_{2} (v) ⟩) = λ v . (λ x . f (π_{1} (v), x)) π_{2} (v) = λ v . f (π_{1} (v), π_{2} (v)) = λ v . f v = f

Naszkicowaliśmy zatem dowód, że $𝐂 (λ)$ jest kategorią kartezjańsko zamkniętą.

Odwrotnie, mając daną kategorię kartezjańsko zamkniętą $𝐂$ , definiujemy język $ℒ (𝐂)$ jak następuje: typy to obiekty $𝐂$ ; termy typu $A \to B$ to strzałki typu $A \to B$ ; termy proste typu $A$ to strzałki typu $𝟏 \to A$ ; równania języka $ℒ (𝐂)$ to znane równania w $𝐂$ , m.in. te wynikające z kartezjańskiej zamkniętości, np.:

λ x . π_{1} (x) = p_{1}

λ x . π_{2} (x) = p_{2}

λ y . f (x, y) = c u r r y (f) (x)

i tak dalej.

Dwie opisane powyżej konstrukcje są w ścisłym sensie odwrotne do siebie, ponieważ możemy udowodnić, że $𝐂 (ℒ (𝐂)) ≅ 𝐂$ , tzn. kategorie $𝐂 (λ (𝐂))$ i $𝐂$ są izmorficzne oraz że języki $λ$ i $ℒ (𝐂 (λ))$ są sobie równoważne w sensie, który jest dokładnie przedyskutowany w książce J.Lambeka i O. Scotta pt. Introduction to Higher-Order Categorical Logic, Cambridge University Press, 1986.

Teoria kategorii dla informatyków/Wykład 4: Zaawansowane konstrukcje uniwersalne

Spis treści

Eksponent

Kategorie kartezjańsko zamknięte

Algebry Heytinga

Kategorie kartezjańsko zamknięte a lambda rachunek

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia