Teoria kategorii dla informatyków/Wykład 1: Teoria kategorii jako abstrakcyjna teoria funkcji

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Teoria kategorii jako abstrakcyjna teoria funkcji

Teoria kategorii jako ogólny dział algebry wyrosła z prac Samuela Eilenberga i Saundersa MacLane'a: pionierską pracą jest tu General theory of natural equivalences, Transactions of the American Mathematical Society 58 (1945), str. 231-294 - autorzy wprowadzili tam pojęcie kategorii, funktora i naturalnej transformacji funktorów. Teoria kategorii szybko przekroczyła granice algebry i jej język okazał się uniwersalnym sposobem mówienia o innych teoriach matematycznych: logice, teorii zbiorów, topologii, teorii porządku, geometrii, analizie itd. Jak to możliwe? Treść tych wykładów stanowi jedną z odpowiedzi na to pytanie.

Przekształcenia i ich algebra

Zacznijmy od niegroźnego przeformułowania dwóch znanych pojęć z teorii mnogości. Jak pamiętamy, funkcja f:AB jest bijekcją, jeżeli jest różnowartościową surjekcją, tj.


x,yA f(x)=f(y)x=y

oraz

zB xA f(x)=z

Zauważmy, że drugi warunek pozwala nam każdemu elementowi z zbioru B przyporządkować element x zbioru A, zaś warunek pierwszy mówi, że to przekształcenie (nazwijmy je g) jest funkcją (śmiało napiszmy więc g:BA). W tym świetle z warunku drugiego wynika, że złożenie fg jest funkcją identycznościowś na zbiorze B, a stąd wynika fgf=f, co w połączeniu z pierwszym warunkiem oznacza, że gf jest identycznością na zbiorze A. Idąc dalej tym tropem (patrz Zadanie1.1), jesteśmy w stanie bez trudu pokazać, że:


Fakt 1.1

Funkcja f:AB jest bijekcją wtedy i tylko wtedy, gdy istnieje funkcja g:BA taka, że fg=1B oraz gf=1A.


Sam wynik nie wygląda, być może, ekscytująco, ale w koniunkcji z kolejnymi przykładami pozwoli nam wyciągnąć ekscytujące wnioski.

Rozważmy zatem zbiór liczb naturalnych . Teoria mnogości definiuje jako najmniejszy zbiór zawierający liczbę zero 𝟎 i spełniający: nsucc(n), gdzie succ(n): jest funkcją następnika (która jest injektywna i posiada tę właściwość, że succ(n)0 dla dowolnego n). Okazuje się, że zbiór liczb naturalnych można wyróżnić spośród innych zbiorów w ten sposób (Zadanie 1.2)):


Fakt 1.2 [liczby naturalne kategoryjnie]

Zbiór liczb naturalnych jest to zbiór zawierający liczbę zero oraz wyposażony w funkcję succ(n): taką, że: dla dowolnego zbioru X i elementu eX oraz funkcji g:XX istnieje dokładnie jedna funkcja f:X spełniająca dwa warunki: f(0)=e oraz fsucc=gf.
Samuel Eilenberg (1913-1998)
Zobacz biografię

Dwa powyższe przykłady wskazują na to, że definicje teorii mnogości można wyrażać, operując jedynie pojęciem funkcji i złożenia funkcji (zauważmy, że elementy zbiorów można traktować jako funkcje, których dziedziną jest singleton). Postawmy więc śmiałe pytanie: czy można prezentować różnorodne teorie matematyczne, badając jedynie własności przekształceń obiektów matematycznych będących przedmiotem zainteresowania danej teorii? A zatem pytamy: czy można prezentować teorię mnogości, badając własności funkcji między zbiorami, teorię grup badając własności homomorfizmów grup, topologię badając własności funkcji ciągłych pomiędzy przestrzeniami topologicznymi? W ogólności zapytajmy więc jeszcze raz: czy można badać dowolne obiekty matematyczne z określoną strukturą za pomocą własności przekształceń, które tę strukturę zachowują?

Odpowiedź brzmi: tak – i ta właśnie twierdząca odpowiedź powołuje do życia teorię kategorii. Teoria kategorii składa się bowiem z twierdzeń dotyczących uniwersalnych własności przekształceń, niezależnych od cech szczególnych danych teorii matematycznych. Tak więc, teoria kategorii bada wspólne, uniwersalne własnościami zbiorów, grup, przestrzeni topologicznych, przestrzeni wektorowych, częściowych porządków, i tak dalej, wszystko w języku przekształceń danej struktury.

Saunders Mac Lane (1909-2005)
Zobacz biografię

Czy da się krótko, nieformalnie zebrać najważniejsze cechy przekształceń – cechy niezależne od konkretnej teorii matematycznej? Spróbujmy! Zaczynamy od nazwy: przekształcenie nazywać będziemy również morfizmem (bo w przeróżnych teoriach matematycznych znajdujemy homomorfizmy, homeomorfizmy, endomorfizmy, itd.) lub po prostu strzałką (bo tak zwykle graficznie przedstawia się przekształcenia). Przekształcenie działa pomiędzy obiektami, np. funkcja to przekształcenie zbiorów, homomorfizm to przekształcenie grupy w grupę, funkcja ciągła to przekształcenie przestrzeni topologicznej w przestrzeń topologiczną, funkcja monotoniczna to przekształcenie posetu w poset, itd. (Załóżmy na początku dla prostoty, że w naszych przykładach nie bierzemy pod uwagę przekształceń obiektów pewnej klasy w obiekty innej klasy, na przykład wyznacznika, który przekształca macierz w liczbę. Takimi morfizmami zajmiemy się poźniej.) Każde przekształcenie

f

działa na pewien jedyny obiekt, nazwijmy go dziedziną

f

i oznaczmy

dom(f)

, i przekształca go w inny jedyny obiekt nazywany przeciwdziedziną

f

i oznaczany jako

cod(f)

. Fakt, że morfizm

f

ma dziedzinę

A

i przeciwdziedzinę

B

zapisujemy

lub po prostu f:𝐀𝐁. Nasza teoria nie może istnieć bez pojęcia złożenia przekształceń: zakładamy, że dwóm morfizmom f,g takim, że cod(g)=dom(f) (strzałki takie nazywamy składalnymi) przypisujemy morfizm fg zwany złożeniem, dla którego mamy dom(fg)=dom(g) i cod(fg)=cod(f). Przykłady wskazują na to, że kolejność złożenia składalnych przekształceń nie powinna grać roli, czyli dla:

morfizm:

może powstać albo z:

albo, równoważnie, z:

W końcu, w naszej nieformalnej teorii przekształceń postulujemy istnienie przekształceń, które - jak to się potocznie mówi: nic nie zmieniają, tak zwanych identyczności:

To kończy nieformalny opis języka, w którym główną rolę grają przekształcenia. Zapiszmy to teraz formalnie.

Definicja kategorii

Definicja 1.3 [Kategoria]

Kategoria C składa się z następujących danych:

(D1) obiektów: A,B,C...,

(D2) morfizmów: f,g,h...,

(D3) dwóch operacji dom,cod przypisującej każdemu morfizmowi f obiekty dom(f) i cod(f),

(D4) operacji 1 przypisującej każdemu obiektowi A morfizm 1A nazywany identycznością,

(D5) operacji przypisującej każdej parze morfizmów f,g takich, że cod(g)=dom(f) morfizm fg nazywany złożeniem,

spełniających następujące aksjomaty:

(A1) dom(1A)=A=cod(1A); dom(fg)=dom(g); cod(fg)=cod(f),

(A2) f1A=f=1Bf, gdzie A=dom(f) oraz B=cod(f),

(A3) jeśli f,g są składalne oraz g,h są składalne, to (fg)h=f(gh).


Kolekcję obiektów kategorii 𝐂 będziemy w dalszym ciągu oznaczać jako 𝐂0, zaś kolekcję jej morfizmów jako 𝐂1.

Uwaga [Dla dociekliwych]
Wiemy więc, z czego składa się kategoria. Nie znamy jednak odpowiedzi na – być może – równie ważne pytanie: czym jest kategoria? W naszym wykładzie przyjmiemy po prostu, że kategorią będzie każda interpretacja aksjomatów przedstawionych w Definicji 1.3 na gruncie teorii mnogości.

Pokażmy, że o kategorii można też myśleć jako o specjalnym grafie skierowanym. Oto druga, równie dobra dla naszych potrzeb, definicja kategorii:


Definicja 1.4 [Kategoria jako graf]

Grafem skierowanym nazywamy kolekcję obiektów (wierzchołków) O, kolekcję strzałek (krawędzi) A i dwie funkcje

W grafie, kolekcja składalnych par strzałek to zbiór

A×OA={(g,f)g,fAdom(g)=cod(f)}

nazywany produktem nad O. O kategorii można myśleć jako o grafie skierowanym 𝐂, który posiada dwie dodatkowe funkcje 1:OA, C1C oraz :A×OAA, (g,f)gf takie, że spełnione są warunki (A1)–(A3) Definicji 1.3.


Poniżej pokażemy trzecią, równoważną, algebraiczną definicję kategorii (na podstawie książki: Peter J. Freyd, Andre Scedrov, Categories, Allegories, North Holland, 1989).


Definicja 1.5 [Kategoria jako algebra]

Kategoria C składa się z dwóch operacji unarnych i jednej częściowej operacji binarnej. Zmienne, na które działają te operacje nazywamy morfizmami (strzałkami). Wartości tych operacji są zapisywane i czytane jako:

Operacje podlegają następującym aksjomatom:


(b1) xy jest zdefiniowane wtw, gdy x=y,

(b2) (x)=x oraz (x)=x,

(b3) (x)x=x oraz x(x)=x,

(b4) (xy)=(x(y)) oraz (xy)=((x)y,

(b5) x(yz)=(xy)z.


W tym wypadku równoważność definicji z dwiema pozostałymi (Definicje 1.3 i 1.4) nie jest oczywista. Aby ją wykazać, rozpocznijmy od lematu, który rzuci trochę światła na strukturę algebraiczną, którą przed chwilą opisaliśmy.


Lemat 1.6

Dla morfizmu e następujące warunki są równoważne:
  1. istnieje x taki, że e=x;
  2. istnieje y taki, że e=y;
  3. e=e;
  4. e=e;
  5. dla każdego x, exx (co oznacza, że jeżeli złożenie ex jest zdefiniowane, to jest równe x), dla każdego x, xex.

Dowód

(1)(2) Dla y=x mamy y=(x)=x=e. (2)(3) e=(y)=y=e. (3)(4) e=(e))=e=e. (4)(5) Załóżmy, że ex jest zdefiniowane dla każdego x; to oznacza, że e=x, czyli z (4), e=x dla każdego x. A zatem ex=(x)x=x. (3)(1) Oczywiste. (4)(3) e=(e)=e=e. (5)(4) Połóżmy x=e. Mamy x=(e)=e, czyli ex istnieje. Z (5) wynika, że e(e)=e. Ale (b3) implikuje, że e(e)=e, czyli e=e. Dowód równoważności (6) z (3) jest podobny do równoważności (5) z (4).


Morfizm e spełniający dowolny z powyższych warunków nazywamy identycznością.

A zatem równoważność trzeciej definicji kategorii z pierwszą uzyskujemy następująco (tak naprawdę, to pokażemy jedynie, że dane Definicji 1.5 wystarczą do zrekonstruowania Definicji 1.3): Identyczność 1x to zmienna x taka, że x=x=x. Dziedziną x jest x, przeciwdziedziną x. Złożenie xy to yx. Kolekcja obiektów Definicji 1.3 pokrywa się z kolekcją morfizmów identycznościowych Definicji 1.5. Zauważmy, że dla dowolnego x, zarówno x, jak i x są obiektami (identycznościami), bo (x)=x, (x)=x, (x)=((x))=(x)=x, (x)=x.

Sprawdźmy aksjomaty: dom(1x)=x=x=x=cod(1x). Aby pokazać, że f jest morfizmem, załóżmy, że x=dom(f)(czyli 1x=f) oraz y=cod(f)(czyli 1y=f). Wówczas f1x=1xf=(f)f=f, 1yf=f1y=f(f)=f.

Załóżmy teraz, że dom(f)=cod(g). Wówczas dom(fg)=(gf)=(gf)=dom(1dom(f)g)=dom(1cod(g)g)=dom(g). Ostatnia równość wynika z poprzedniego paragrafu. Podobnie, cod(fg)=(gf)=((g)f)=cod(f1cod(g))=cod(f1dom(f))=cod(f).

W końcu, f(gh)=(hg)f=h(gf)=(fg)h przy odpowiednich założeniach.


Przykłady kategorii

  • 𝐒𝐞𝐭: Obiektami są zbiory, morfizmami funkcje. Uwaga! W teorii mnogości funkcja jest zdefiniowana jako zbiór par uporządkowanych takich, że

((x,y)f  (x,y)f)  y=y      (1)

Aby traktować funkcje jako morfizmy musimy precyzyjnie znać dom(f) i cod(f). Na przykład funkcje sin:[1,1] oraz sin:, które mają takie samo działanie na argumentach, będą traktowane jako dwa różne morfizmy. Formalnie, w języku teorii mnogości morfizmem będzie trójka (X,f,Y) taka, że fX×Y spełnia powyższe równanie (1) wraz z poniższym:

xX(yY (x,y)f)      (2)

Wtedy dom jest projekcją na pierwszą współrzędną (X,f,Y)X, a cod projekcją na trzecią współrzędną.

  • Kategoria zbiorów skończonych i funkcji 𝐒𝐞𝐭fin, jak również wiele innych kategorii, w których obiektami i morfizmami są ograniczone klasy zbiorów i funkcji, np. kategoria wszystkich zbiorów skończonych i injekcji.
  • Kategorie, w których obiektami są zbiory z pewną dodatkową strukturą algebraiczną, zaś morfizmami te funkcje, które tę strukturę zachowują.
    • 𝐕𝐞𝐜𝐭: Przestrzenie wektorowe i odwzorowania liniowe
    • 𝐆𝐫𝐩: Grupy i homomorfizmy grup
    • 𝐀𝐛: Grupy abelowe i homomorfizmy grup
    • 𝐌𝐨𝐧: Monoidy i homomorfizmy monoidów
    • 𝐏𝐨𝐬: Częściowe porządki i funkcje monotoniczne
    • 𝐓𝐨𝐩: Przestrzenie topologiczne i funkcje ciągłe
    • 𝐆𝐫𝐚𝐩𝐡: Grafy i homomorfizmy grafów
    • liczby naturalne nat i wszystkie funkcje obliczalne
  • Mając dowolny częściowy porządek (poset) (P,) definiujemy kategorię o tej samej nazwie P jak następuje: jako obiekty bierzemy elementy P, zaś dla dwóch obiektów x,yP przyjmujemy, że istnieje morfizm z x do y wtedy i tylko wtedy, gdy xy. Zauważmy, że wystarczy tu, by P był preporządkiem, tzn. aby relacja była zaledwie zwrotna i przechodnia.
  • 𝐑𝐞𝐥: Obiektami tej kategorii są zbiory, zaś morfizmami relacje binarne, tzn. f:AB wtedy i tylko wtedy, gdy fA×B. Wówczas rolę identyczności spełniają relacje identycznościowe: 1A={(a,a)aA}, zaś złożeniem morfizmów jest po prostu złożenie relacji znane z kursu teorii mnogości: mając dane RA×B oraz SB×C przyjmujemy:
(a,c)SRbB ((a,b)R(b,c)S)
  • Kategorie skończone (skończoność dotyczy ilości istniejących morfizmów, choć nazwy tych kategorii odnoszą się do ilości obiektów:
    • 𝟏:Ta kategoria ma jeden obiekt i jedną strzałkę: identyczność.
    • 𝟎: Ta kategoria nie ma obiektów i nie ma strzałek.
    • 𝟐: Kategoria ta ma dwa obiekty i jedną strzałkę pomiędzy nimi (a także oczywiście dwie wymagane identyczności).
    • 𝟑: Kategoria ma trzy obiekty, trzy identyczności, dokładnie jedną strzałkę z obiektu pierwszego do drugiego, dokładnie jedną strzałkę z obiektu drugiego do trzeciego i dokładnie jedną strzałkę z obiektu pierwszego do trzeciego (co oznacza, że ta ostatnia musi być złożeniem dwóch pozostałych nieidentycznościowych strzałek!)
    • Inne kategorie skończone możemy tworzyć, biorąc skończoną ilość obiektów wraz z odpowiadającymi im identycznościami, a następnie dodając dowolną skończoną ilość morfizmów. W tym wypadku musimy jednak zadbać o to, aby - jeśli morfizmy będą tworzyły cykle - zadeklarować złożenia wszystkich morfizmów w cyklu jako równe odpowiednim identycznościom. W innym bowiem przypadku uzyskana kategoria nie musi już być skończona (może mieć nieskończenie wiele morfizmów odpowiadających wielokrotnościom cyklu).
  • Kategorie dyskretne są to takie kategorie, w których nie ma innych morfizmów niż identyczności. Łatwo uzmysłowić sobie, że kategorie dyskretne możemy utożsamiać ze zbiorami, bo przecież obiekty możemy interpretować jako elementy zbioru.
  • Niech (M,*,e) będzie monoidem (e jest jego jedynką). Wówczas biorąc M jako jedyny obiekt, zaś elementy M jako morfizmy (z dziedziną i kodziedziną M), a działanie * jako złożenie morfizmów, otrzymujemy kategorię. Można łatwo pokazać również konstrukcję odwrotną, tj. przekonać się, że każda kategoria z jednym obiektem może być traktowana jako monoid. Mówiąc krótko: kategorie z jednym obiektem to monoidy. (Jak w takim razie traktować grupy? Odpowiedź znajdziemy jeszcze przed końcem wykładu...)
  • Dla danego rachunku logicznego możemy stworzyć kategorię w ten sposób, że obiektami są formuły: ϕ,ψ,.. zaś morfizmem z ϕ do ψ jest każda dedukcja (dowód) ψ z założenia ϕ. Złożeniem morfizmów jest wtedy połączenie dowodów, które jest oczywiście łączne. Identyczność 1ϕ to dowód pusty, bowiem z aksjomatów logicznych zawsze wynika ϕϕ.
  • Dla danego typowanego języka funkcyjnego L tworzymy kategorię w ten sposób, że obiektami są typy danych, zaś strzałkami są programy (procedury) języka L. Złożeniem dwóch programów f:XY i g:YZ jest program dany poprzez zaaplikowanie wyjścia programu f na wejściu programu g. Identycznością jest procedura, która nic nie robi.

Inne przykłady kategorii zamieścimy w Ćwiczeniach do tego wykładu.

==Izomorfizmy== Definicja izomorfizmu jest pierwszą definicją teorii kategorii, definicją abstrakcyjną, niezależną od specyficznych wymagań konkretnej teorii matematycznej, definicją wyrażoną tylko w języku strzałek (czyli w języku teorii kategorii).


Definicja 1.7 [Izomorfizm]

Niech 𝐂 będzie dowolną kategorią. Morfizm f:AB jest izomorfizmem, jeśli istnieje morfizm g:BA taki, że fg=1B oraz gf=1A. Morfizm g nazywa się morfizmem odwrotnym do f. Jeśli dla obiektów A,B kategorii 𝐂 istnieje izomorfizm f:AB, to obiekty A i B nazywamy izomorficznymi, co zapisujemy jako AB.


Ponieważ dowolny morfizm f posiada dokładnie jeden morfizm odwrotny (dowód?), będziemy go oznaczać jako f1. Można łatwo pokazać (dowód?), że morfizm odwrotny do izomorfizmu jest izomorfizmem.


Fakt 1.1 wyraża zatem myśl, że izomorfizmami w 𝐒𝐞𝐭 są dokładnie bijekcje. Ale uwaga: w kategoriach, których obiektami są zbiory z pewną strukturą, a morfizmami funkcje zachowujące tę strukturę (kategorie o takich własnościach nazywamy konkretnymi, patrz Definicja 5.9, bijekcje nie zawsze są izomorfizmami. Prosty kontrprzykład stanowi tutaj kategoria 𝐏𝐨𝐬 ( Zadanie 1.3).

==Podstawy teoriomnogościowe== Teoria mnogości uczy nas, że nie istnieje zbiór wszystkich zbiorów. Jeśli więc rozważamy kategorię 𝐒𝐞𝐭, której obiektami są zbiory, to widzimy, że kolekcja wszystkich obiektów 𝐒𝐞𝐭 nie tworzy zbioru (jest zbyt duża!). Podobnie, kolekcja wszystkich morfizmów 𝐒𝐞𝐭 jest zbyt wielka, aby być zbiorem (zauważmy, że samych identyczności jest już tyle, ile obiektów). Kategoria 𝐒𝐞𝐭 nie jest taką jedyną. W związku z tym definiujemy:

Definicja 1.8

Kategorię 𝐂 nazywamy małą, jeśli kolekcja wszystkich obiektów 𝐂0 i morfizmów 𝐂1 kategorii 𝐂 są zbiorami. W przeciwnym wypadku 𝐂 jest duża.


A zatem Pos, Grp, Vec są duże, zaś kategorie skończone są małe. Kategorie duże wyglądają na pierwszy rzut oka nieprzyjaźnie, część z nich posiada jednak bardzo często następującą cechę:


Definicja 1.9

Kategorię 𝐂 nazywamy lokalnie małą, jeśli dla każdej pary obiektów A,B z 𝐂 kolekcja Hom𝐂(A,B)={f𝐂1f:AB} jest zbiorem (o takim zbiorze mówimy w skrócie homset, podobnie jak o zbiorze częściowo uporządkowanym przyjęło się mówić: poset).


Większa część teorii kategorii, którą zaprezentujemy w dalszym toku wykładu dotyczy kategorii lokalnie małych (takich jak Pos, Grp, Vec itd. czy wszystkie kategorie małe). Po dalsze wiadomości dotyczące podstaw teoriomnogościowych teorii kategorii odsyłamy do dyskusji tego tematu w podręczniku Categories for the Working Mathematician, Springer, 1997, Saundersa Mac Lane’a. Bardzo ciekawą dyskusję roli teorii kategorii w badaniach nad podstawami matematyki zaproponował Steven Awodey w artykule: An answer to Hellman’s question: Does category theory provide a framework for mathematical structuralism?, Philosophia Mathematics (3) vol. 12 (2004), dostępnym również na stronie domowej autora pracy.