Logika dla informatyków/Logika drugiego rzędu

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Logika drugiego rzędu

Składnię logiki drugiego uzyskujemy przez rozszerzenie zbioru reguł składniowych dla logiki pierwszego rzędu o kwantyfikatory wiążące symbole relacyjne. Z przyczyn technicznych tym razem wygodnie nam będzie przyjąć, że podstawowymi spójnikami logicznymi są i .

Definicja 12.1

Definicja formuł drugiego rzędu jest indukcyjna, podobnie jak analogiczna Definicja 2.5 dla logiki pierwszego rzędu. Jednak tym razem nie ustalamy sygnatury z góry.

  • Każda formuła atomowa nad sygnaturą jest formułą drugiego rzędu nad sygnaturą .
  • Jeśli są formułami drugiego rzędu nad sygnaturą , to jest też formułą drugiego rzędu nad sygnaturą .
  • Jeśli jest formułą drugiego rzędu nad sygnaturą , to jest też formułą drugiego rzędu nad sygnaturą .
  • Jeśli jest formułą drugiego rzędu nad sygnaturą a Parser nie mógł rozpoznać (nieznana funkcja „\ZI”): {\displaystyle \displaystyle x\in\ZI} jest zmienną indywiduową, to jest też formułą drugiego rzędu nad sygnaturą .
  • Jeśli jest formułą drugiego rzędu nad sygnaturą , a jest symbolem relacji -argumentowej z  to jest formułą drugiego rzędu nad sygnaturą

Definicja semantyki jest też podobna jak dla logiki pierwszego rzędu.

  • Znaczenie formuł atomowych jest identyczne jak w logice pierwszego rzędu.
  • Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle (\mathfrak{A},\varrho)\vDash\varphi\vee\psi}} , gdy zachodzi lub zachodzi .
  • , gdy nie zachodzi .
  • wtedy i tylko wtedy, gdy istnieje takie , że zachodzi .
  • Jeśli jest strukturą sygnatury oraz jest wartościowaniem w tej strukturze, to wtedy i tylko wtedy gdy istnieje struktura  nad sygnaturą o postaci spełniająca

Dualny kwantyfikator drugiego rzędu wprowadzamy jako skrót notacyjny:

Parser nie mógł rozpoznać (nieznana funkcja „\hspace”): {\displaystyle \displaystyle \forall R\varphi \hspace{4cm} } oznacza

Nieaksjomatyzowalność logiki drugiego rzędu

Spójrzmy na następujący przykład zdania nad sygnaturą arytmetyki:

Orzeka ono, że każda relacja jednoargumentowa (czy podzbiór uniwersum), która zawiera i jest zamknięta ze względu na operację następnika, zawiera wszystkie elementy uniwersum. Jest to wyrażona w języku drugiego rzędu zasada indukcji matematycznej. Twierdzenie Dedekinda orzeka, że po dołożeniu tego aksjomatu do zwykłych aksjomatów arytmetyki Peano PA (z których można wtedy usunąć dotychczasowy schemat aksjomatu indukcji), otrzymujemy aksjomatyzację kategoryczną, czyli taką, która ma z dokładnością do izomorfizmu tylko jeden model - ten standardowy. Zauważmy przy okazji, że przykład ten wskazuje, iż dla logiki drugiego rzędu nie zachodzi górne twierdzenie Skolema-Lowenheima.

Wracając do poprzedniego przykładu, widzimy, że zbiór wszystkich zdań logiki pierwszego rzędu, dla których , jest tożsamy z . Możemy teraz udowodnić, że w odróżnieniu od logiki pierwszego rzędu,

Twierdzenie 12.2

Logika drugiego rzędu nie ma żadnego pełnego i poprawnego systemu dowodowego.

Dowód

Zbiór konsekwencji semantycznych nie jest nawet rekurencyjnie przeliczalny, na mocy Wniosku 9.3. Tymczasem dla każdego poprawnego systemu dowodzenia dla logiki drugiego rzędu, zbiór formuł wyprowadzalnych z rekurencyjnego zbioru jest rekurencyjnie przeliczalny.

End of proof.gif

Widzimy teraz jasno, że logika drugiego rzędu jest niezwykle skomplikowana w badaniu, gdyż właściwie żadne z pożytecznych twierdzeń dotyczących logiki pierwszego rzędu nie zachodzi dla logiki drugiego rzędu. Jedynym, co zostaje, to odpowiednia modyfikacja gier Ehrenfeuchta i metoda Fraisse. Jednak ich praktyczna użyteczność jest również znikoma wobec ich złożoności. Np.w grze muszą występować rundy, w których gracze wybierają i zaznaczają całe relacje na uniwersum obu struktur. Jednak dla bardzo ograniczonych syntaktycznie fragmentów logiki drugiego rzędu możliwym staje się zapanowanie nad strategiami w odpowiadających im uproszczonych wersjach gry. Tymi właśnie metodami udowodniono kilka twierdzeń o niemożności zdefiniowania w różnych fragmentach logiki drugiego rzędu różnych konkretnych własności.

W dalszym ciągu tego rozdziału dowiemy się, jaki jest stopień trudności pytań o wyrażalność bądź niewyrażalność różnych własności w logice drugiego rzędu.

Równoważność logiki MSO i automatów skończonych

W zastosowaniach często spotyka się różne fragmenty logiki drugiego rzędu, która w całości dla wielu zastosowań jest zbyt silna. W tym rozdziale będziemy zajmowali się monadyczną logiką drugiego rzędu, która jest fragmentem logiki drugiego rzędu, powstałym przez ograniczenie kwantyfikacji drugiego rzędu tylko do relacji jednoargumentowych (czyli zbiorów). Na oznaczenie tej logiki powszechnie stosuje się skrót MSO (od Monadic Second Order).

MSO jest logiką bardzo często pojawiającą się w związku z informatyką. Tutaj zaprezentujemy klasyczny wynik, łączący tę logikę z teorią automatów skończonych.

Niech będzie sygnaturą złożoną z symboli , w której wszystkie symbole relacyjne są jednoargumentowe.

Definicja 12.3

Model sygnatury nazwiemy modelem-słowem gdy jego nośnikiem jest skończony odcinek początkowy zbioru liczb naturalnych a interpretacją symbolu jest naturalny liniowy porządek liczb. Zbiór modeli-słów nad będziemy oznaczać .

Skorzystamy też tutaj z naturalnej wzajemnie jednoznacznej odpowiedniości pomiędzy modelami-słowami a niepustymi słowami nad alfabetem : słowu odpowiada model o mocy równej długości a jego element należy do interpretacji relacji  wtedy i tylko wtedy, gdy -ta litera słowa jest ciągiem zerojedynkowym, który ma jedynkę na pozycji .

Odtąd będziemy momentami umyślnie zacierali rozróżnienie pomiędzy słowami a odpowiadającymi im modelami-słowami. Zbiór można więc naturalnie uważać za język słów nad .

Sformułowane przez nas twierdzenie stosuje się wprost tylko do alfabetów o mocy postaci . Ponieważ jednak każdy język regularny można traktować (po odpowiednim zakodowaniu) jako język nad takim właśnie alfabetem, z którego nie wszystkie litery są wykorzystywane, ograniczenie to nie narusza ogólności naszych rozważań.

Twierdzenie 12.4 (Buchi, Elgot)

Dla każdego zdania monadycznej logiki drugiego rzędu zbiór jest regularny, oraz dla każdego języka regularnego nad istnieje takie zdanie logiki MSO, że

Czasami treść tego twierdzenia wyraża się sloganem

W myśl tego twierdzenia, MSO można traktować jako jeszcze jeden formalizm służący definiowaniu języków regularnych nie zawierających słowa pustego, oprócz powszechnie znanych wyrażeń regularnych, automatów skończonych i gramatyk regularnych.

Dowód

Zaczniemy od prostszej drugiej części twierdzenia. Niech będzie automatem skończonym rozpoznającym , gdzie to zbiór stanów, to stan początkowy, to zbiór stanów akceptujących a to relacja przejścia. Niech Chcemy wyrazić za pomocą zdania MSO, że istnieje akceptujące obliczenie na danym słowie.

Stanom będą odpowiadały dodatkowe symbole relacji jednoargumentowych Początkowo będziemy więc mieli do czynienia z modelami-słowami nad większą sygnaturą . Modele te mają odpowiadać obliczeniom na właściwym słowie wejściowym.

Formuła postaci mówi o danym słowie, że w każdym kroku obliczenia automat był w jednym i tylko jednym stanie.

Formuła postaci mówi, że w momencie rozpoczęcia obliczenia automat był w stanie początkowym.

Formuła postaci mówi, że w momencie zakończenia obliczenia automat był w jednym ze stanów akceptujących.

Formuła jest postaci , gdzie jest literą z , zaś jest formułą . Formuła ta mówi, że dla każdych dwóch bezpośrednio po sobie następujących pozycji w słowie, przejście pomiędy nimi odbyło się zgodnie z jedną z możliwości dostępnych w relacji przejścia automatu 

Teraz zdanie

orzeka, że istnieje akceptujące obliczenie automatu na danym słowie.

Przechodzimy teraz do dowodu pierwszej części. Tym razem dla danego zdania MSO musimy skonstruować automat skończony, który akceptuje dokładnie te słowa nad , w których to zdanie jest prawdziwe.

W pierwszym kroku zastąpimy MSO przez trochę inną logikę, którą nazwiemy . Pokażemy, że jej formuły definiują wszystkie języki modeli-słów, które można zdefiniować w MSO.

Specyficzną cechą jest to, że nie ma w niej zmiennych indywiduowych (czyli tych, których wartościami są elementy) ani wiążących je kwantyfikatorów, a tylko symbole relacji i kwantyfikatory drugiego rzędu. Natomiast jest znacznie więcej formuł atomowych.

Oto definicja składni i jednocześnie semantyki -- oczywiście indukcyjna. Wobec braku zmiennych pierwszego rzędu w definicji semantyki nie występuje wartościowanie.

  • Formuła atomowa jest prawdziwa w modelu gdy relacja jest zawarta w relacji .
  • Formuła atomowa jest prawdziwa w modelu gdy relacja jest singletonem (to właśnie kwantyfikowaniem po relacjach, które są singletonami zastąpimy kwantyfikację po elementach obecną w MSO).
  • Formuła atomowa jest prawdziwa w modelu , gdy wszystkie elementy w relacji są mniejsze bądź równe od wszystkich elementów w relacji
  • Jeśli są formułami a jest symbolem relacyjnym, to formułami są także i których semantyka jest standardowa.


Tłumaczenie danego zdania z MSO nad na równoważne mu w zdanie w definiuje się następująco. Po pierwsze, zamieniamy nazwy związanych zmiennych pierwszego rzędu tak, że zmienna wiązana przez każdy kwantyfikator jest inna. Bez utraty ogólności możemy założyć, że są to zmienne Teraz wszystkim zmiennym występującym w  przypisujemy dodatkowe, nowe symbole relacji, powiedzmy, że zmiennej przypisujemy .


  • to .
  • to
  • to
  • ma postać .
  • ma postać .
  • Formułę definiujemy jako
  • Formułę dla definiujemy jako


Przez indukcję ze względu na budowę  udowodnimy teraz, że

Dla każdego modelu-słowa Parser nie mógł rozpoznać (błąd składni): {\displaystyle \displaystyle \<A,X_1,\dots,X_n\>} i każdych z jego nośnika, następujące warunki są równoważne:

Wszystkie kroki indukcji sa całkowicie standardowe i pozostawiamy je Czytelnikowi.

Zatem istotnie, każdy zbiór słów-modeli, który można zdefiniować zdaniem MSO można też zdefiniować zdaniem . Teraz dla takiego zdania pozostaje skonstruować automat skończony, który akceptuje dokładnie te słowa nad , w których to zdanie jest prawdziwe.

Sprawa jest teraz dużo łatwiejsza niż dla oryginalnego MSO, bo każda formuła definiuje jakiś język nad .

Sprawdzenie, że formuły atomowe definiują języki regularne, pozostawiamy Czytelnikowi jako ćwiczenie.

Język definiowany przez jest sumą języków definiowanych przez i , czyli jako suma języków regularnych sam jest regularny.

Język definiowany przez jest dopełnieniem regularnego języka definiowanego przez , czyli sam też jest regularny.

W wypadku formuły , o której zakłądamy, że jest najwyższym indeksem symbolu relacyjnego występującego w bierzemy automat rozpoznający język nad definiowany przez  Następnie modyfikujemy go tak, by działał nad alfabetem , przy każdym przejściu niedeterministycznie zgadując, czy -tą współrzędną litery z alfabetu znajdującej się w tej komórce taśmy jest 1 czy 0.

End of proof.gif

Twierdzenie Buchi ma daleko idące konsekwencje dla rozstrzygalności wielu interesujących problemów.

Wniosek 12.5

Następujące problemy są rozstrzygalne:

  • Czy istnieje model-słowo, w którym dane zdanie z MSO jest prawdziwe?
  • Czy dane zdanie z MSO jest prawdziwe w każdym modelu-słowie?

Dowód

Procedura rozstrzygająca oba problemy polega na przetworzeniu formuły w równoważny jej automat skończony (np.w sposób opisany w dowodzie poprzedniego twierdzenia), a następnie przeprowadzeniu testu na automacie.

End of proof.gif

Informacja o tw. Fagina i Stockmeyera

Naturalne jest pytanie, czy można równie elegancko, jak to zrobił Buchi, scharakteryzować zbiory modeli definiowalnych w pełnej logice drugiego rzędu. Odpowiedź na to pytanie pojawiła się w dwóch krokach.

W pierwszej charakteryzacji występuje egzystencjalna logika drugiego rzędu, czasami oznaczana symbolem czyli zbiór tych formuł pełnej logiki drugiego rzędu, w których wszystkie kwantyfikatory drugiego rzędu wystepują na początku formuły, a za nimi jest już tylko zwykłe zdanie pierwszego rzędu:

Parser nie mógł rozpoznać (nieznana funkcja „\hspace”): {\displaystyle \displaystyle \exists X_1~\dots \exists X_n \hspace{-4mm}\underbrace{\varphi(X_1\dots X_n)}_{\text{zdanie pierwszego rzędu}}.}

Dla tej logiki sytuacja wygląda następująco:

Twierdzenie 12.6 (Fagin)

Dla każdego zdania egzystencjalnej logiki drugiego rzędu zbiór należy do { NP}, oraz dla każdego języka istnieje zdanie egzystencjalnej logiki drugiego rzędu takie, że

Podobnie jak twierdzenie Buchi i Elgota, ono też bywa reprezentowane sloganem

Oczywiście NP to słynna klasa złożoności probelmów rozstrzyganych przez niedeterministyczne maszyny Turinga o wielomianowej złożoności czasowej.

Pełna logika drugiego rzędu, oznaczona tu przez SO, też ma analogiczną charakteryzację, która w postaci sloganu wyraża się przez i została udowodniona przez Stockmeyera. Precyzyjna postać tego twierdzenia jest analogiczna do poprzednich, a PH to hierarchia wielomianowa, również doskonale znana z teorii złożoności.

Przed przejściem do następnego tematu wypada zauważyć, że twierdzenia Fagina i Stockmeyera w istocie obowiązują w zakresie szerszym niż tylko dla modeli-słów. Dotyczą one także dowolnych struktur skończonych, o ile założy się odpowiednio rozsądny sposób opisywania ich we wzajemnie jednoznaczny sposób za pomocą słów.

Po poznaniu twierdzeń Fagina i Stockmeyera lepiej rozumiemy trudności badania logiki drugiego rzędu. Jest to zadanie co najmniej równie niełatwe, jak najtrudniejsze pytania teorii złożoności, z którymi uczeni borykają się od kilkudziesięciu lat, jak dotychczas bezskutecznie. Np.dowód, że każdy zbiór słów, który jest definiowalny formułą logiki drugiego rzędu, jest też definiowalny formułą , implikowałby natychmiast, że a zatem także . Zauważmy przy tym, że każdy zbiór słów, który jest definiowalny w MSO, jest też definiowalny za pomocą formuły która należy jednocześnie do MSO i . Wynika to z postaci formuły definiującej zbiory regularne, która pojawia się w dowodzie twierdzenia Buchi. Zatem na poziomie kwantyfikacji wyłącznie po relacjach jednoargumentowych, pożądana równość zachodzi. Jednak przejście do relacji o dowolnej liczbie argumentów wydaje się niezmiernie trudne.

Informacja o tw. Rabina

Twierdzenie Rabina to inne, daleko idące uogólnienie twierdzenia Buchi.

Nieskończone pełne drzewo binarne to struktura nad sygnaturą w której to symbole jednoargumentowych funkcji. Nośnik to zbiór skończonych słów zerojedynkowych, a funkcje są określone przez równości oraz

Twierdzenie 12.7 (Rabin)

Zbiór zdań logiki MSO, które są prawdziwe w jest rozstrzygalny.

Wszystkie znane dowody twierdzenia Rabina opierają się na tym samym pomyśle, który poznaliśmy w dowodzie twierdzenia Buchi: formuły logiki MSO są tłumaczone na równoważne im automaty w taki sposób, że formuła jest prawdziwa w drzewie (poetykietowanym dodatkowymi symbolami w wierzchołkach) wtedy i tylko wtedy, gdy automat akceptuje to drzewo. Szczegóły tych dowodów są zawsze bardzo skomplikowane. Nagrodą jest za to wynik, który jest jednym z najsilniejszych znanych twierdzeń o rozstrzygalności, nie tylko zresztą w logice. Rozstrzygalność wielu innych problemów decyzyjnych wykazano po raz pierwszy przez ich odpowiednie przetłumaczenie (czyli zredukowanie) na pytanie o prawdziwość zdań MSO w nieskończonym drzewie binarnym.