Logika dla informatyków/Logika drugiego rzędu
Logika drugiego rzędu
Składnię logiki drugiego uzyskujemy przez rozszerzenie zbioru reguł składniowych dla logiki pierwszego rzędu o kwantyfikatory wiążące symbole relacyjne. Z przyczyn technicznych tym razem wygodnie nam będzie przyjąć, że podstawowymi spójnikami logicznymi są i .
Definicja 12.1
Definicja formuł drugiego rzędu jest indukcyjna, podobnie jak analogiczna Definicja 2.5 dla logiki pierwszego rzędu. Jednak tym razem nie ustalamy sygnatury z góry.
- Każda formuła atomowa nad sygnaturą jest formułą drugiego rzędu nad sygnaturą .
- Jeśli są formułami drugiego rzędu nad sygnaturą , to jest też formułą drugiego rzędu nad sygnaturą .
- Jeśli jest formułą drugiego rzędu nad sygnaturą , to jest też formułą drugiego rzędu nad sygnaturą .
- Jeśli jest formułą drugiego rzędu nad sygnaturą a Parser nie mógł rozpoznać (nieznana funkcja „\ZI”): {\displaystyle \displaystyle x\in\ZI} jest zmienną indywiduową, to jest też formułą drugiego rzędu nad sygnaturą .
- Jeśli jest formułą drugiego rzędu nad sygnaturą , a jest symbolem relacji -argumentowej z to jest formułą drugiego rzędu nad sygnaturą
Definicja semantyki jest też podobna jak dla logiki pierwszego rzędu.
- Znaczenie formuł atomowych jest identyczne jak w logice pierwszego rzędu.
- Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle (\mathfrak{A},\varrho)\vDash\varphi\vee\psi}} , gdy zachodzi lub zachodzi .
- , gdy nie zachodzi .
- wtedy i tylko wtedy, gdy istnieje takie , że zachodzi .
- Jeśli jest strukturą sygnatury oraz jest wartościowaniem w tej strukturze, to wtedy i tylko wtedy gdy istnieje struktura nad sygnaturą o postaci spełniająca
Dualny kwantyfikator drugiego rzędu wprowadzamy jako skrót notacyjny:
Nieaksjomatyzowalność logiki drugiego rzędu
Spójrzmy na następujący przykład zdania nad sygnaturą arytmetyki:
Orzeka ono, że każda relacja jednoargumentowa (czy podzbiór uniwersum), która zawiera i jest zamknięta ze względu na operację następnika, zawiera wszystkie elementy uniwersum. Jest to wyrażona w języku drugiego rzędu zasada indukcji matematycznej. Twierdzenie Dedekinda orzeka, że po dołożeniu tego aksjomatu do zwykłych aksjomatów arytmetyki Peano PA (z których można wtedy usunąć dotychczasowy schemat aksjomatu indukcji), otrzymujemy aksjomatyzację kategoryczną, czyli taką, która ma z dokładnością do izomorfizmu tylko jeden model ten standardowy. Zauważmy przy okazji, że przykład ten wskazuje, iż dla logiki drugiego rzędu nie zachodzi górne twierdzenie Skolema-Lowenheima.
Wracając do poprzedniego przykładu, widzimy, że zbiór wszystkich zdań logiki pierwszego rzędu, dla których , jest tożsamy z Parser nie mógł rozpoznać (nieznana funkcja „\strN”): {\displaystyle \displaystyle {\bf Th}(\strN)} . Możemy teraz udowodnić, że w odróżnieniu od logiki pierwszego rzędu,
Twierdzenie
Logika drugiego rzędu nie ma żadnego pełnego i poprawnego systemu dowodowego.
Dowód
Zbiór konsekwencji semantycznych Parser nie mógł rozpoznać (nieznana funkcja „\strN”): {\displaystyle \displaystyle \{\varphi~|~PA\cup\{Ind\}\models\varphi\}={\bf Th}(\strN)} nie jest nawet rekurencyjnie przeliczalny, na mocy Wniosku Uzupelnic przescieradlo|. Tymczasem dla każdego poprawnego systemu dowodzenia dla logiki drugiego rzędu, zbiór formuł wyprowadzalnych z rekurencyjnego zbioru jest rekurencyjnie przeliczalny.

Widzimy teraz jasno, że logika drugiego rzędu jest niezwykle skomplikowana w badaniu, gdyż właściwie żadne z pożytecznych twierdzeń dotyczących logiki pierwszego rzędu nie zachodzi dla logiki drugiego rzędu. Jedynym, co zostaje, to odpowiednia modyfikacja gier Ehrenfeuchta i metoda Fra{}sse. Jednak ich praktyczna użyteczność jest również znikoma wobec ich złożoności. Np.w grze muszą występować rundy, w których gracze wybierają i zaznaczają całe relacje na uniwersum obu struktur. Jednak dla bardzo ograniczonych syntaktycznie fragmentów logiki drugiego rzędu możliwym staje się zapanowanie nad strategiami w odpowiadających im uproszczonych wersjach gry. Tymi właśnie metodami udowodniono kilka twierdzeń o niemożności zdefiniowania w różnych fragmentach logiki drugiego rzędu różnych konkretnych własności.
W dalszym ciągu tego rozdziału dowiemy się, jaki jest stopień trudności pytań o wyrażalność bądĽ niewyrażalność różnych własności w logice drugiego rzędu.
Równoważność logiki MSO i automatów skończonych
W zastosowaniach często spotyka się różne fragmenty logiki drugiego rzędu, która w całości dla wielu zastosowań jest zbyt silna. W tym rozdziale będziemy zajmowali się monadyczną logiką drugiego rzędu, która jest fragmentem logiki drugiego rzędu, powstałym przez ograniczenie kwantyfikacji drugiego rzędu tylko do relacji jednoargumentowych (czyli zbiorów). Na oznaczenie tej logiki powszechnie stosuje się skrót MSO (od Monadic Second Order).
MSO jest logiką bardzo często pojawiającą się w związku z informatyką. Tutaj zaprezentujemy klasyczny wynik, łączący tę logikę z teorią automatów skończonych.
Niech będzie sygnaturą złożoną z symboli , w której wszystkie symbole relacyjne są jednoargumentowe.
Definicja
Model sygnatury nazwiemy modelem-słowem gdy jego nośnikiem jest skończony odcinek początkowy zbioru liczb naturalnych a interpretacją symbolu jest naturalny liniowy porządek liczb. Zbiór modeli-słów nad będziemy oznaczać .
Skorzystamy też tutaj z naturalnej wzajemnie jednoznacznej odpowiedniości pomiędzy modelami-słowami a niepustymi słowami nad alfabetem : słowu odpowiada model Parser nie mógł rozpoznać (nieznana funkcja „\strA”): {\displaystyle \displaystyle \strA(w)\in W_n} o mocy równej długości a jego element należy do interpretacji relacji wtedy i tylko wtedy, gdy -ta litera słowa jest ciągiem zerojedynkowym, który ma jedynkę na pozycji .
Odtąd będziemy momentami umyślnie zacierali rozróżnienie pomiędzy słowami a odpowiadającymi im modelami-słowami. Zbiór Parser nie mógł rozpoznać (nieznana funkcja „\strA”): {\displaystyle \displaystyle \{\strA\in W_n~|~\strA\models\varphi\}} można więc naturalnie uważać za język słów nad .
Sformułowane przez nas twierdzenie stosuje się wprost tylko do alfabetów o mocy postaci . Ponieważ jednak każdy język regularny można traktować (po odpowiednim zakodowaniu) jako język nad takim właśnie alfabetem, z którego nie wszystkie litery są wykorzystywane, ograniczenie to nie narusza ogólności naszych rozważań.
Twierdzenie Buchi, Elgot
Dla każdego zdania monadycznej logiki drugiego rzędu zbiór Parser nie mógł rozpoznać (nieznana funkcja „\strA”): {\displaystyle \displaystyle \{w\in A_n^+~|~\strA(w)\models\varphi\}} jest regularny, oraz dla każdego języka regularnego nad istnieje takie zdanie logiki { MSO}, że
Czasami treść tego twierdzenia wyraża się sloganem
W myśl tego twierdzenia, MSO można traktować jako jeszcze jeden formalizm służący definiowaniu (niepustych) języków regularnych, oprócz powszechnie znanych wyrażeń regularnych, automatów skończonych i gramatyk regularnych.
Dowód
Zaczniemy od prostszej drugiej części twierdzenia. Niech będzie automatem skończonym rozpoznającym , gdzie to zbiór stanów, to stan początkowy, to zbiór stanów akceptujących a to relacja przejścia. Niech Chcemy wyrazić za pomocą zdania MSO, że istnieje akceptujące obliczenie na danym słowie.
Stanom będą odpowiadały dodatkowe symbole relacji jednoargumentowych Początkowo będziemy więc mieli do czynienia z modelami-słowami nad większą sygnaturą . Modele te mają odpowiadać obliczeniom na właściwym słowie wejściowym.
Formuła postaci Parser nie mógł rozpoznać (nieznana funkcja „\Land”): {\displaystyle \displaystyle \forall x(\Land_{n<i\neq j\leq n+\ell}\lnot (X_i(x)\land X_j(x))\land\Lor_{i=n+1}^{n+\ell}X_i(x))} mówi o danym słowie, że w każdym kroku obliczenia automat był w jednym i tylko jednym stanie.
Formuła postaci mówi, że w momencie rozpoczęcia obliczenia automat był w stanie początkowym.
Formuła postaci Parser nie mógł rozpoznać (nieznana funkcja „\Lor”): {\displaystyle \displaystyle \exists x\forall y(y\leq x \land \Lor_{q_i\in F}X_{n+i}(x))} mówi, że w momencie zakończenia obliczenia automat był w jednym ze stanów akceptujących.
Formuła jest postaci Parser nie mógł rozpoznać (nieznana funkcja „\Lor”): {\displaystyle \displaystyle \forall x\forall y (\lnot\exists z( x<z\land z< y)\to \Lor_{\langle q_i,\vec{a},q_k\rangle\in \Delta}X_{n+i}(x)\land\psi_{\vec{a}}(x)\land X_{n+k}(y))} , gdzie jest literą z , zaś jest formułą Parser nie mógł rozpoznać (nieznana funkcja „\Land”): {\displaystyle \displaystyle \Land_{\{i~|~a_i=1\}}X_i(x)\land \Land_{\{i~|~a_i=0\}}\lnot X_i(x)} . Formuła ta mówi, że dla każdych dwóch bezpośrednio po sobie następujących pozycji w słowie, przejście pomiędy nimi odbyło się zgodnie z jedną z możliwości dostępnych w relacji przejścia automatu
Teraz zdanie
orzeka, że istnieje akceptujące obliczenie automatu na danym słowie.
Przechodzimy teraz do dowodu pierwszej części. Tym razem dla danego zdania MSO musimy skonstruować automat skończony, który akceptuje dokładnie te słowa nad , w których to zdanie jest prawdziwe.
W pierwszym kroku zastąpimy MSO przez trochę inną logikę, którą nazwiemy . Pokażemy, że jej formuły definiują wszystkie języki modeli-słów, które można zdefiniować w MSO.
Specyficzną cechą jest to, że nie ma w niej zmiennych indywiduowych (czyli tych, których wartościami są elementy) ani wiążących je kwantyfikatorów, a tylko symbole relacji i kwantyfikatory drugiego rzędu. Natomiast jest znacznie więcej formuł atomowych.
Oto definicja składni i jednocześnie semantyki -- oczywiście indukcyjna. Wobec braku zmiennych pierwszego rzędu w definicji semantyki nie występuje wartościowanie.
- Formuła atomowa jest prawdziwa w modelu Parser nie mógł rozpoznać (nieznana funkcja „\strA”): {\displaystyle \displaystyle \strA\in W_n} gdy relacja jest zawarta w relacji .
- Formuła atomowa jest prawdziwa w modelu Parser nie mógł rozpoznać (nieznana funkcja „\strA”): {\displaystyle \displaystyle \strA\in W_n} gdy relacja jest singletonem (to właśnie kwantyfikowaniem
po relacjach, które są singletonami zastąpimy kwantyfikację po elementach obecną w MSO).
- Formuła atomowa jest prawdziwa w modelu Parser nie mógł rozpoznać (nieznana funkcja „\strA”): {\displaystyle \displaystyle \strA\in W_n} , gdy wszystkie elementy w relacji są mniejsze bądĽ równe
od wszystkich elementów w relacji
- Jeśli są formułami a jest
symbolem relacyjnym, to formułami są także Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \varphi\lor\psi,\ \lnot\varphi} i których semantyka jest standardowa.
Tłumaczenie danego zdania z MSO nad na równoważne mu w zdanie w definiuje się następująco. Po pierwsze, zamieniamy nazwy związanych zmiennych pierwszego rzędu tak, że zmienna wiązana przez każdy kwantyfikator jest inna. Bez utraty ogólności możemy założyć, że są to zmienne Teraz wszystkim zmiennym występującym w przypisujemy dodatkowe, nowe symbole relacji, powiedzmy, że zmiennej przypisujemy .
- to .
- to
- to
- ma postać
.
- ma postać .
- Formułę definiujemy jako
- Formułę dla definiujemy jako
Przez indukcję budowę udowodnimy teraz, że
Dla każdego modelu-słowa Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \<A,X_1,\dots,X_n\>} i każdych
z jego nośnika, następujące warunki są równoważne:
- Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle (\<A,X_1,\dots,X_n\>,x_1:a_1,\dots,x_\ell:a_\ell)\models\varphi}
- Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \<A,X_1,\dots,X_n,\{a_1\},\dots,\{a_\ell\}\>\models\widetilde\varphi}
Wszystkie kroki indukcji sa całkowicie standardowe i pozostawiamy je Czytelnikowi.
Zatem istotnie, każdy zbiór słów-modeli, który można zdefiniować zdaniem MSO można też zdefiniować zdaniem . Teraz dla takiego zdania pozostaje skonstruować automat skończony, który akceptuje dokładnie te słowa nad , w których to zdanie jest prawdziwe.
Sprawa jest teraz dużo łatwiejsza niż dla oryginalnego MSO, bo każda formuła definiuje jakiś język nad .
Sprawdzenie, że formuły atomowe definiują języki regularne, pozostawiamy Czytelnikowi jako ćwiczenie.
Język definiowany przez jest sumą języków definiowanych przez i , czyli jako suma języków regularnych sam jest regularny.
Język definiowany przez jest dopełnieniem regularnego języka definiowanego przez , czyli sam też jest regularny.
W wypadku formuły , o której zakłądamy, że jest najwyższym indeksem symbolu relacyjnego występującego w bierzemy automat rozpoznający język nad definiowany przez Następnie modyfikujemy go tak, by działał nad alfabetem , przy każdym przejściu niedeterministycznie zgadując, czy -tą współrzędną litery z alfabetu znajdującej się w tej komórce taśmy jest 1 czy 0.

Twierdzenie Buchi ma daleko idące konsekwencje dla rozstrzygalności wielu interesujących problemów.
Wniosek
Następujące problemy są rozstrzygalne:
- Czy istnieje model-słowo, w którym dane zdanie z MSO
jest prawdziwe?
- Czy dane zdanie z MSO jest prawdziwe w każdym
modelu-słowie?
Dowód
Procedura rozstrzygająca oba problemy polega na przetworzeniu formuły w równoważny jej automat skończony (np.w sposób opisany w dowodzie poprzedniego twierdzenia), a następnie przeprowadzeniu testu na automacie.

Informacja o tw. Fagina i Stockmeyera
Naturalne jest pytanie, czy można równie elegancko, jak to zrobił Buchi, scharakteryzować zbiory modeli definiowalnych w pełnej logice drugiego rzędu. OdpowiedĽ na to pytanie pojawiła się w dwóch krokach.
W pierwszej charakteryzacji występuje egzystencjalna logika drugiego rzędu, czasami oznaczana symbolem czyli zbiór tych formuł pełnej logiki drugiego rzędu, w których wszystkie kwantyfikatory drugiego rzędu wystepują na początku formuły, a za nimi jest już tylko zwykłe zdanie pierwszego rzędu:
Dla tej logiki sytuacja wygląda następująco:
Twierdzenie Fagin
Dla każdego zdania egzystencjalnej logiki drugiego rzędu zbiór Parser nie mógł rozpoznać (nieznana funkcja „\strA”): {\displaystyle \displaystyle \{w\in A_n^+~|~\strA(w)\models\varphi\}} należy do { NP}, oraz dla każdego języka istnieje zdanie egzystencjalnej logiki drugiego rzędu takie, że
Podobnie jak twierdzenie Buchi i Elgota, ono też bywa reprezentowane sloganem
Oczywiście { NP} to słynna klasa złożoności probelmów rozstrzyganych przez niedeterministyczne maszyny Turinga o wielomianowej złożoności czasowej.
Pełna logika drugiego rzędu, oznaczona tu przez SO, też ma analogiczną charakteryzację, która w postaci sloganu wyraża się przez i została udowodniona przez Stockmeyera. Precyzyjna postać tego twierdzenia jest analogiczna do poprzednich, a PH to hierarchia wielomianowa, również doskonale znana z teorii złożoności.
Przed przejściem do następnego tematu wypada zauważyć, że twierdzenia Fagina i Stockmeyera w istocie obowiązują w zakresie szerszym niż tylko dla modeli-słów. Dotyczą one także dowolnych struktur skończonych, o ile założy się odpowiednio rozsądny sposób opisywania ich we wzajemnie jednoznaczny sposób za pomocą słów.
Po poznaniu twierdzeń Fagina i Stockmeyera lepiej rozumiemy trudności badania logiki drugiego rzędu. Jest to zadanie co najmniej równie niełatwe, jak najtrudniejsze pytania teorii złożoności, z którymi uczeni borykają się od kilkudziesięciu lat, jak dotychczas bezskutecznie. Np.dowód, że każdy zbiór słów, który jest definiowalny formułą logiki drugiego rzędu, jest też definiowalny formułą , implikowałby natychmiast, że a zatem także . Zauważmy przy tym, że każdy zbiór słów, który jest definiowalny w MSO, jest też definiowalny za pomocą formuły która należy jednocześnie do MSO i . Wynika to z postaci formuły definiującej zbiory regularne, która pojawia się w dowodzie twierdzenia Buchi. Zatem na poziomie kwantyfikacji wyłącznie po relacjach jednoargumentowych, pożądana równość zachodzi. Jednak przejście do relacji o dowolnej liczbie argumentów wydaje się niezmiernie trudne.
Informacja o tw. Rabina
Twierdzenie Rabina to inne, daleko idące uogólnienie twierdzenia Buchi.
Nieskończone pełne drzewo binarne to struktura Parser nie mógł rozpoznać (nieznana funkcja „\strT”): {\displaystyle \displaystyle \strT} nad sygnaturą w której i to symbole jednoargumentowych funkcji. Nośnik Parser nie mógł rozpoznać (nieznana funkcja „\strT”): {\displaystyle \displaystyle \strT} to zbiór skończonych słów zerojedynkowych, a funkcje są określone przez równości oraz
Twierdzenie Rabin
Zbiór zdań logiki MSO, które są prawdziwe w Parser nie mógł rozpoznać (nieznana funkcja „\strT”): {\displaystyle \displaystyle \strT} jest rozstrzygalny.
Wszystkie znane dowody twierdzenia Rabina opierają się na tym samym pomyśle, który poznaliśmy w dowodzie twierdzenia Buchi: formuły logiki MSO są tłumaczone na równoważne im automaty w taki sposób, że formuła jest prawdziwa w drzewie Parser nie mógł rozpoznać (nieznana funkcja „\strT”): {\displaystyle \displaystyle \strT} (poetykietowanym dodatkowymi symbolami w wierzchołkach) wtedy i tylko wtedy, gdy automat akceptuje to drzewo. Szczegóły tych dowodów są zawsze bardzo skomplikowane. Nagrodą jest za to wynik, który jest jednym z najsilniejszych znanych twierdzeń o rozstrzygalności, nie tylko zresztą w logice. Rozstrzygalność wielu innych problemów decyzyjnych wykazano po raz pierwszy przez ich odpowiednie przetłumaczenie (czyli zredukowanie) na pytanie o prawdziwość zdań MSO w nieskończonym drzewie binarnym.