Logika dla informatyków/Ograniczenia logiki pierwszego rzędu

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Link z wykladu 8 do tw. 4.13. Nazwa linku "Cantoro"

Ograniczenia logiki pierwszego rzędu

Ten rozdział poświęcony jest ograniczeniom, którym podlega język logiki pierwszego rzędu. Okazuje się, że nie każde pojęcie da się w nim wyrazić, a także, że są pojęcia, które dają się wyrazić, ale odpowiednie zdanie lub formuła z konieczności musi być skomplikowane. Rozważania w tym rozdziale będziemy prowadzić przy założeniu, że w sygnaturze występują wyłącznie symbole relacyjne. Wyniki dają się zastosować do sygnatur z symbolami funkcyjnymi, ale wymaga to zakodowania wszystkich funkcji jako relacji.

Zaczniemy od miary skomplikowania formuł, która będzie przydatna w dalszym ciągu.

Definicja 4.1

Rangę kwantyfikatorową Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle QR\var(\varphi)} formuły Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} definiujemy jak następuje:
  • dla dowolnych termów oraz
  • Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle QR(\var\varphi\to \psi )=\max(QR(\var\varphi ),QR(\psi ) )} .
  • Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle QR(\forall x\var\varphi )=1+QR(\var\varphi ).}

Intuicyjnie to głębokość zagnieżdżenia kwantyfikatorów w formule. Jest to jedna z wielu możliwych miar stopnia komplikacji formuły Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi.} Parametr ten ma następujące znaczenie: jeśli struktura ma elementów, to pesymistyczny czas sprawdzenia, czy dla zdania Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} zachodzi Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \mathfrak A\models \var\varphi} jest asymptotycznie proporcjonalny do Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle n^{QR(\var\varphi )},} gdy użyjemy naturalnego algorytmu do wykonania tego zadania, który dla każdego kwantyfikatora w formule przegląda wszystkie elementy struktury.

Teraz możemy wyjaśnić, dlaczego nie dopuszczamy symboli funkcyjnych w sygnaturze. Otóż ich obecność zakłóca potrzebne nam własności funkcji Tytułem przykładu, formuła jest atomowa i jej ranga kwantyfikatorowa powinna wynosić . Tymczasem gdy będziemy reprezentować w strukturze jako dwuargumentową relację , ta sama formuła przybierze postać , której ranga kwantyfikatorowa wynosi 2. Twierdzenia, których dalej dowodzimy, odwołują się do wartości zdefiniowanych powyżej dla logiki bez symboli funkcyjnych. To właśnie jest przyczyna, dla której funkcje wykluczamy z rozważań.

Charakteryzacja Fraïssé

Definicja 4.2

Jeśli jest strukturą relacyjną oraz to struktura tej samej sygnatury co , nazywana podstrukturą indukowaną przez , w ma nośnik , zaś dla każdego


Definicja 4.3

Niech będą strukturami relacyjnymi tej samej sygnatury , ponadto niech i . Jeśli funkcja jest izomorfizmem podstruktur indukowanych , to mówimy, że jest częściowym izomorfizmem z . Jego dziedzina to , a obraz to

Na zasadzie konwencji umawiamy się, że jest częściowym izomorfizmem z w o pustej dziedzinie i pustym obrazie.

Dla dwóch częściowych izomorfizmów z w piszemy gdy oraz dla wszystkich , to jest wtedy, gdy jest zawarte jako zbiór w


Definicja 4.4

Niech będzie dodatnią liczbą naturalną. Dwie struktury relacyjne tej samej sygnatury są -izomorficzne, co oznaczamy gdy istnieje rodzina , w której każdy jest niepustym zbiorem częściowych izomorfizmów z w oraz spełniająca następujące dwa warunki:

  • Tam Dla każdego oraz każdego istnieje takie , że oraz .
  • Z powrotem Dla każdego oraz każdego istnieje takie , że oraz

Samą rodzinę nazywamy wówczas -izomorfizmem struktur i , co oznaczamy

Nieformalne wyjaśnienie jest takie: to zbiór częściowych izomorfizmów, które mogą być rozszerzone -krotnie o dowolne elementy w dziedzinie i obrazie, a kolejne rozszerzenia leżą w


Definicja 4.5

Dwie struktury relacyjne tej samej sygnatury są skończenie izomorficzne, symbolicznie , gdy istnieje rodzina , taka że każda podrodzina jest -izomorfizmem.


Jeśli ma powyższe własności, to piszemy , a samą rodzinę nazywamy skończonym izomorfizmem.

Fakt 4.6

  • Jeśli to .
  • Jeśli oraz nośnik math>\mathfrak A</math> jest zbiorem skończonym, to .

Dowód

End of proof.gif

Definicja 4.7

Dwie struktury i tej samej sygnatury są elementarnie równoważne, co zapisujemy symbolicznie , gdy dla każdego zdania logiki pierwszego rzędu nad tą samą sygnaturą, Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \mathfrak A\models\var\varphi} wtedy i tylko wtedy, gdy Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \mathfrak B\models\var\varphi} .

Dwie struktry i tej samej sygnatury są -elementarnie równoważne, symbolicznie , gdy dla każdego zdania Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} logiki pierwszego rzędu nad tą samą sygnaturą, o randze kwantyfikatorowej nie przekraczającej , zachodzi Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \mathfrak A\models\var\varphi} wtedy i tylko wtedy, gdy Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \mathfrak B\models\var\varphi} .

Fakt 4.8

wtedy i tylko wtedy, gdy dla każdego naturalnego zachodzi .

Dowód

Wynikanie z lewej do prawej jest oczywiste. Załóżmy teraz, że dla każdego istnieje rodzina spełniająca warunki z definicji relacji . Rozważmy rodzinę gdzie . Bezpośrednie sprawdzenie pokazuje natychmiast, że spełnia ona warunki definicji relacji .

End of proof.gif


Twierdzenie 4.9

Niech będzie dowolną sygnaturą relacyjną zawierającą skończenie wiele symboli, oraz niech będą dowolnymi strukturami nad .

  • Dla każdego zachodzi równoważność: wtedy i tylko wtedy, gdy .
  • wtedy i tylko wtedy, gdy .

Dowód

Jest oczywiste, że druga równoważnośc wynika z pierwszej. Pierwszą z kolei udowodnimy tylko z lewej do prawej strony. Dowód w stronę przeciwną jest bardziej zawiły technicznie, a w dodatku ta implikacja jest rzadko używana w praktyce. Wyraża za to istotną z metodologicznego punktu widzenia informację: jeśli dwie struktury są (- )elementarnie równoważne, to fakt ten można na pewno udowodnić posługując się metodą Fraïssé, choć oczywiście nie ma gwarancji, że będzie to metoda najprostsza.

Ustalmy . Dowód tego, że z wynika sprowadza się do wykazania następującego faktu za pomocą indukcji ze względu na budowę Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} :

\begin{quote}Niech Parser nie mógł rozpoznać (błąd składni): {\displaystyle \{I_n | n\leq m\''} będzie rodziną o której mowa w definicji , niech Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} będzie formułą o co najwyżej zmiennych wolnych (bez utraty ogólności niech będą to ) i spełniającą Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle QR(\var\varphi )\leq n\leq m} oraz niech Wówczas dla dowolnych następujące dwa warunki są równoważne:

Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \mathfrak A,x_1:a_1,\dots,x_r:a_r\models\var\varphi}
Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \mathfrak B,x_1:g(a_1 ),\dots,x_r:g(a_r )\models\var\varphi.} \end{quote}

Dla formuł atomowych powyższa teza wynika wprost z faktu, że jest częściowym izomorfizmem (przypomnijmy że w sygnaturze nie ma symboli funkcyjnych i co za tym idzie jedynymi termami są zmienne).

Gdy Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} ma postać to mamy następujący ciąg równoważnych warunków:

  • lub
  • lub


przy czym druga równoważność wynika z założenia indukcyjnego, a pierwsza i trzecia z definicji semantyki.

Gdy Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} ma postać to, jako że Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle x_{r+1}\notin FV(\var\varphi )} i co za tym idzie (patrz Fakt #alfa-konw ), możemy bez utraty ogólności założyć, że Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} ma postać Z założenia Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle QR(\var\varphi )\leq n} wynika, że . Mamy teraz następujący ciąg równoważnych warunków:

  • Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle (\mathfrak A,x_1:a_1,\dots,x_r:a_r )\models\var\varphi}
  • Dla każdego zachodzi
  • Dla każdego istnieje takie , że oraz
  • Dla każdego istnieje takie , że oraz
  • Dla każdego istnieje takie , że oraz
  • Dla każdego zachodzi
  • Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle (\mathfrak B,x_1:g(a_1 ),\dots,x_r:g(a_r ) )\models\var\varphi.}

Równoważności druga i czwarta zachodzą na mocy warunków Tam i Z powrotem, trzecia na mocy założenia indukcyjnego, a pozostałe na mocy definicji spełniania.

End of proof.gif

Pokażemy teraz pierwszy przykład inherentnego ograniczenia logiki pierwszego rzędu.

Fakt 4.10

Jeśli są dwoma skończonymi liniowymi porządkami o mocach większych niż , to .

Dowód

Bez utraty ogólności możemy założyć, że przy czym , a porządek jest porządkiem naturalnym. Dowód przeprowadzamy wykorzystując Twierdzenie #fraisse, czyli w istocie wykazujemy, że

Dla danego określmy "odległość" pomiędzy elementami naszych struktur jak następuje:

Parser nie mógł rozpoznać (nieznana funkcja „\begin{cases}”): {\displaystyle d_k(a,b) = \begin{cases}|b-a| & \text{\ jeśli } |b-a|< 2^k \\\infty & \text{\ jeśli } wpp.\end{cases}}


Niech dla będzie zbiorem wszystkich częściowych izomorfizmów z w takich, że oraz dla wszystkich . Oczywiście bo

Pokazujemy własność Tam dla rodziny Parser nie mógł rozpoznać (błąd składni): {\displaystyle \{I_k | k\leq m\} . Niech Niech Mamy wskazać w częściowy izomorfizm taki, że

Rozróżniamy dwa przypadki:

  1. Jeśli istnieje takie , że , to w jest dokładnie jeden element , który jest tak samo położony względem jak względem oraz spełnia . Kładziemy wówczas i jest wtedy częściowym izomorfizmem zachowującym odległości .
  2. Jeśli natomiast takiego nie ma, to niech gdzie są najbliższymi elementami po lewej i po prawej, które należą do . Wówczas , co w myśl definicji oznacza, że . Zatem na mocy założenia indukcyjnego także Istnieje więc takie, że Parser nie mógł rozpoznać (błąd składni): {\displaystyle {d_j(g(a' ),b )=d_j(b,g(a'' ) )=\infty} , i wówczas kładąc uzyskujemy żądane rozszerzenie.
End of proof.gif


Przykład powyższy wskazuje na kilka istotnych ograniczeń logiki pierwszego rzędu. Po pierwsze, nie da się żadnym zdaniem zdefiniować nawet tak prostego pojęcia jak "porządek liniowy o parzystej liczbie elementów", i to bez względu na to, jak byśmy je rozumieli dla modeli nieskończonych. Istotnie, zdanie które miałoby definiować taką własność musiałoby mieć jakąś rangę kwantyfikatorową, powiedzmy . Jednak w myśl poprzedniego twierdzenia, porządki o mocach i -elementarnie równoważne i nasze hipotetyczne zdanie jest albo prawdziwe w obu, albo fałszywe w obu, podczas gdy powinno być w jednym fałszywe, a w drugim prawdziwe.

Drugim ograniczeniem jest fakt, że każda specyfikacja porządku liniowego o mocy w logice pierwszego rzędu musi z konieczności mieć rangę kwantyfikatorową co najmniej , a więc sugeruje algorytm sprawdzenia, czy dany obiekt mocy istotnie spełnia tę specyfikację, którego czas działania ma rząd wielkości co jest wynikiem fatalnym.\footnote{Na szczęście znamy lepsze algorytmy wykonujące to zadanie.} Bierze się to stąd, że prawdziwość zdania o randze kwantyfikatorowej sprawdza się w danej skończonej strukturze za pomocą zagnieżdżonych pętli, z których każda przegląda cały nośnik struktury i odpowiada jednemu kwantyfikatorowi.

Gra Ehrenfeuchta

Charakteryzacja Fraïssé jest dość skomplikowana i odpychająca w bezpośrednim użyciu. W praktyce jej popularność ogromnie zwiększyło podanie przez Andrzeja Ehrenfeuchta jej równoważnego opisu w terminach dwuosobowej gry, którą teraz zdefiniujemy. Gra ta doskonale sprawdza się w rozumowaniach intuicyjnych. Praktyczne doświadczenie wskazuje, że próby napisania bardzo formalnego dowodu przy użyciu gry kończą się zwykle wskazaniem rodziny zbiorów częściowych izomorfizmów w duchu Fraïssé.

Niech będzie sygnaturą relacyjną i niech będą strukturami sygnatury

Dla uproszczenia zakładamy, że h

Definicja 4.11

Definicja powyższa dopuszcza powtarzanie ruchów przez obu graczy, czyli wybieranie elementów, które poprzednio były już wybrane. Jest to dogodne, gdyż upraszcza definicję. Gdybyśmy bowiem zakazali tego, to albo niemożliwe byłoby rozegranie gry , gdy choć jedna ze struktur ma moc mniejszą niż , albo trzeba by było wprowadzić w definicji specjalny warunek służący do rozstrzygania zwycięstwa w sytuacjach, gdy brak możliwości dalszych ruchów.

W praktyce jednak w dowodach prawie nigdy nie rozpatruje się takich ruchów, gdyż jest oczywiste, że wykonanie takiego posunięcia przez gracza I nie przybliża go do zwycięstwa, zaś gdy wykona je gracz II mimo że nie zrobił tego gracz I, powoduje to jego natychmiastową przegraną.


Twierdzenie 4.12

  • Gracz II ma strategię wygrywającą w grze wtedy i tylko wtedy, gdy .
  • Gracz II ma dla każdego strategię wygrywającą w grze wtedy i tylko wtedy, gdy .

Dowód

Ćwiczenie.

End of proof.gif

Poniższe twierdzenie ilustruje, w jaki sposób gra może zostać wykorzystana dla wskazania ograniczeń możliwości logiki pierwszego rzędu.

Twierdzenie 4.13

Jeśli i są dwoma porządkami liniowymi, gęstymi, bez elementu pierwszego i ostatniego, to .

Dowód

W myśl Twierdzenia #ehrenfeucht należy pokazać, że dla każdego gracz II ma strategię wygrywającą w grze . Opiszemy teraz tę strategię. Jej postać nie zależy od liczby rund do rozegrania. Pokażemy też, że jeśli po zakończeniu poprzedniej rundy warunek wygrywający dla gracza II był spełniony, to po wykonaniu ruchu zgodnie ze wskazaną strategią pozostanie on nadal spełniony. Wówczas na mocy zasady indukcji po rozegraniu dowolnej ilości rund, w których gracz II będzie się stosował do tej strategii, pozostanie on zwycięzcą.

Zauważmy, że warunek o częściowym izomorfizmie w naszej sytuacji oznacza tyle, że zbiory i elementów wybranych w każdej ze struktur, po posortowaniu rosnąco zgodnie z porządkiem odpowiednio oraz prowadzą do identycznych ciągów indeksów swoich oznaczeń. Dokładnie, jeśli i , to zachodzą równości dla .

  • Na pierwszy ruch gracza I gracz II odpowiada w dowolny sposób. Przed tą rundą nie było wybranych elementów, czyli przekształcenie opisane w definicji gry było przekształceniem pustym, które na mocy konwencji jest częściowym izomorfizmem. Po wykonaniu ruchu zgodnie ze strategią ciągi indeksów w obu strukturach są oczywiście identyczne.
  • We wszystkich kolejnych rundach gracz II określa swój ruch następująco. Niech i będą (identycznymi na mocy założenia indukcyjnego) ciągami indeksów przed wykonaniem tego ruchu. Ze względu na symetrię sytuacji, możemy bez utraty ogólności założyć, że gracz I wybiera strukturę . Może symbolem oznaczyć:
    • Element mniejszy od Wówczas gracz II wybiera element mniejszy od w , który istnieje na mocy założenia, że w nie ma elementu najmniejszego. Widać, że nowe ciągi indeksów pozostaną równe.
    • Element większy od Wówczas gracz II wybiera element większy od w , który istnieje na mocy założenia, że w nie ma elementu ostatniego. Widać, że także teraz nowe ciągi indeksów pozostaną równe.
    • Element spełniający dla pewnego W istnieje element spełniający , gdyż jest porządkiem gęstym. Gracz II wybiera taki element i również w tym wypadku widać, że nowe ciągi indeksów pozostaną równe.


Na tym dowód istnienia strategii wygrywającej dla gracza II jest zakończony.

End of proof.gif

Z powyższego wynika między innymi, że Zatem nie ma zdania logiki pierwszego rzędu, które definiuje pojęcie porządku ciągłego (tzn. takiego, w którym wszystkie niepuste ograniczone podzbiory mają kres górny i kres dolny), bo musiałoby ono być prawdziwe w pierwszej ze struktur, a fałszywe w drugiej.

Definicja 4.14

Teorią nazywamy dowolny zbiór zdań, zamknięty ze wszględu na konsekwencje semantyczne, tj. taki zbiór zdań , że Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \Delta\models\var\varphi} zachodzi tylko dla Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi\in\Delta} . Przykładem teorii jest każdy zbiór postaci Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \{\var\varphi\ |\ \Gamma\models\var\varphi\}} , zwany teorią aksjomatyczną wyznaczoną przez , czy też postaci Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle Th( \mathcal K )=\{\var\varphi\ | \mathfrak A\models\var\varphi,} dla każdego (teoria klasy struktur ) albo Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle Th(\mathfrak A )= \{\var\varphi\ | \mathfrak A\models\var\varphi\}} (teoria modelu ). Teorię nazywamy zupełną, gdy dla każdego zdania Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi,} dokładnie jedno ze zdań Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \var\varphi} i Parser nie mógł rozpoznać (nieznana funkcja „\var”): {\displaystyle \lnot\var\varphi} należy do Zbiór zdań prawdziwych w ustalonym modelu jest oczywiście zawsze teorią zupełną.


Wniosek 4.15

Teoria klasy wszystkich porządków liniowych, gęstych, bez elementu pierwszego i ostatniego jest zupełna.

Dowód

Teoria, o której mówimy, nie ma modeli skończonych. W myśl Twierdzenia #Cantoro wszystkie jej modele nieskończone są elementarnie równoważne. Zatem a teoria pojedynczego modelu jest zawsze zupełna.

End of proof.gif