Złożoność obliczeniowa/Wykład 3: Klasy złożoności obliczeniowej: Różnice pomiędzy wersjami

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania
m Zastępowanie tekstu – „ </math>” na „</math>”
 
Linia 266: Linia 266:
Wspominaliśmy już o tym, że kluczowym elementem symulacji maszyny niedeterministycznej jest sprawdzanie czy istnieje ścieżka od konfiguracji początkowej do końcowej maszyny.
Wspominaliśmy już o tym, że kluczowym elementem symulacji maszyny niedeterministycznej jest sprawdzanie czy istnieje ścieżka od konfiguracji początkowej do końcowej maszyny.
Problem sprawdzania czy dwa wierzchołki w grafie są połączone ścieżką jest znany jako REACHABILITY. Savitch udowodnił, że
Problem sprawdzania czy dwa wierzchołki w grafie są połączone ścieżką jest znany jako REACHABILITY. Savitch udowodnił, że
REACHABILITY należy do <math>SPACE </math>(<math>\text{log}^2n</math>), gdzie <math>n</math> to rozmiar grafu.
REACHABILITY należy do <math>SPACE</math>(<math>\text{log}^2n</math>), gdzie <math>n</math> to rozmiar grafu.
W naszym wypadku rozmiar grafu to liczba konfiguracji, czyli <math>c^{f(n)}</math>, zatem
W naszym wypadku rozmiar grafu to liczba konfiguracji, czyli <math>c^{f(n)}</math>, zatem
REACHABILITY wymaga czasu <math>\text{log}^2(c^{f(n)})=O(f(n))^2</math>, co da nam tezę.
REACHABILITY wymaga czasu <math>\text{log}^2(c^{f(n)})=O(f(n))^2</math>, co da nam tezę.
Linia 352: Linia 352:
Ponieważ <math>M'</math> akceptuje język w czasie <math>g(n)</math>, więc i na słowie <math>x</math> działa w takim czasie. Załóżmy, że
Ponieważ <math>M'</math> akceptuje język w czasie <math>g(n)</math>, więc i na słowie <math>x</math> działa w takim czasie. Załóżmy, że
odrzuca <math>x</math>. Wtedy maszyna <math>M</math> zaakceptuje <math>x</math>, gdyż symulacja którą ona przeprowadza, tzn. działanie <math>M'</math> na <math>x</math>
odrzuca <math>x</math>. Wtedy maszyna <math>M</math> zaakceptuje <math>x</math>, gdyż symulacja którą ona przeprowadza, tzn. działanie <math>M'</math> na <math>x</math>
może zostać przeprowadzona, jako że <math>g(n) </math> jest asymptotycznie mniejsze niż <math>f(n) </math> (pomijamy szczegóły techniczne, które pojawią się dla małych <math>n </math>).
może zostać przeprowadzona, jako że <math>g(n)</math> jest asymptotycznie mniejsze niż <math>f(n)</math> (pomijamy szczegóły techniczne, które pojawią się dla małych <math>n</math>).
Analogicznie, gdy <math>M' </math> akceptuje <math>x </math> to <math>M</math> je odrzuca, czyli <math>M' </math> nie może akceptować <math>L </math>, gdyż myli się na <math>x=M' </math>.
Analogicznie, gdy <math>M'</math> akceptuje <math>x</math> to <math>M</math> je odrzuca, czyli <math>M'</math> nie może akceptować <math>L</math>, gdyż myli się na <math>x=M'</math>.


Otrzymujemy sprzeczność, stąd <math>L \notin \text{SPACE}(g(n))</math>.
Otrzymujemy sprzeczność, stąd <math>L \notin \text{SPACE}(g(n))</math>.

Aktualna wersja na dzień 11:03, 5 wrz 2023

Klasy złożoności czasowej i pamięciowej

W poprzednich modułach zostały wprowadzone maszyny Turinga oraz zdefiniowane pojęcie problemu obliczeniowego. Przypomnijmy, że problem obliczeniowy to dla nas język, czyli zbiór słów. Poznaliśmy także szczegółowo maszynę w wersji deterministycznej i niedeterministycznej oraz jej miarę złożoności czasowej i pamięciowej w każdej z wersji. W tym module zajmiemy się klasyfikacją języków przy pomocy maszyn. W naszych dalszych rozważaniach przyjmujemy model obliczeń w postaci maszyny Turinga o k taśmach.

Klasa złożoności obliczeniowej to zbiór problemów (języków) spełniających określone kryterium. Najbardziej podstawowe kryteria, tzn. czas i pamięć potrzebne do klasyfikacji języka dają nam podstawowe klasy złożoności:

Definicja 1.1 [TIME(f(n)) ]

Poprzez TIME(f(n)) oznaczamy zbiór języków L takich, że są akceptowane przez deterministyczną maszynę Turinga M o złożoności czasowej f(n).

Definicja 1.2 [SPACE(f(n))]

Poprzez SPACE(f(n)) oznaczamy zbiór języków L takich, że są akceptowane przez deterministyczną maszynę Turinga M o złożoności pamięciowej f(n).

Stosowne klasy można też zdefiniować dla niedeterministycznych maszyn:

Definicja 1.3 [NTIME(f(n))]

Poprzez NTIME(f(n)) oznaczamy zbiór języków L takich, że są akceptowane przez niedeterministyczną maszynę Turinga M o złożoności czasowej f(n).

Definicja 1.4 [NSPACE(f(n))]

Poprzez NSPACE(f(n)) oznaczamy zbiór języków L takich, że są akceptowane przez niedeterministyczną maszynę Turinga M o złożoności pamięciowej f(n).

Twierdzenia o liniowym przyspieszaniu i kompresji pamięci

Pierwsze dwa twierdzenia możemy nazwać "teoretycznymi podstawami" notacji O. Pokażemy bowiem, że w obu powyższych definicjach klas funkcja f(n) może być rozpatrywana z dokładnością do stałej, ze względu na specyfikę samego modelu obliczeń. Zostały one udowodnione w latach 60 przez pionierów badań nad klasami złożoności, laureatów nagrody Turinga z roku 1993, Jurisa Hartmanisa i Richarda Stearnsa.

Twierdzenie 2.1 [twierdzenie o liniowym przyspieszaniu]

Jeśli język L jest rozpoznawany przez maszynę M o złożoności czasowej f(n) to może być rozpoznany przez maszynę M o złożoności czasowej f(n)=ϵf(n)+(1+ϵ)n, gdzie ϵ>0.
Liniowe przyspieszanie
Obszar trzech

Dowód

Idea dowodu jest oparta na powiększeniu alfabetu maszyny, a tym samym wielkości "słowa" maszyny oraz liczby jej stanów. Odpowiada to w praktyce podniesieniu technologii wytwarzania komputerów. W animacji Liniowe przyspieszanie przedstawiono schematycznie zamianę 8 komórek pamięci na jedną większą nowej maszyny.

Nasza nowa maszyna o powiększonym alfabecie rozpoczyna działanie od skompresowania słowa wejściowego na drugiej taśmie i zamiany ról taśmy drugiej i wejściowej. Następnie głowica powraca na początek słowa i rozpoczyna obliczenia.

W każdym kroku obliczeń M odczytuje bieżącą komórkę oraz dwie sąsiednie (na wszystkich taśmach), a następnie symuluje zachowanie M w obszarze tych trzech komórek dzięki zwiększonej stosownie liczbie stanów. Jako efekt następuje modyfikacja bieżącej komórki i komórek sąsiednich oraz stosowne przesunięcie głowicy.

Policzmy, czy taka symulacja rzeczywiście może być opłacalna. Załóżmy, że każda z komórek M odpowiada c komórkom maszyny M, gdzie c - stopień kompresji, który ostatecznie ustalimy na końcu (będzie on oczywiście zależał od ϵ i M). Alfabet nowej maszyny Γ to alfabet starej maszyny Γ powiększony o symbole postaci Γc, które zapewniają nam zapis c symboli M w jednym symbolu M.

W pierwszym etapie M musi dokonać kompresji, czyli odczytać c symboli i zapisać 1 symbol skompresowany. Do tego celu wystarczy jej istnienie około |Γc| dodatkowych stanów. W ostatnim skompresowanym symbolu dokładamy symbole puste dla wyrównania. Czas działania tego etapu to około n+n/c (odczyt związany z kompresją + powrót).

W drugim etapie dokonujemy symulacji. Najpierw odczytujemy "obszar trzech" komórek na każdej taśmie co zajmuje 4 kroki M (rysunek Obszar trzech).

Zapamiętujemy odczyt dzięki stosownemu powiększeniu liczby stanów M, które wykonujemy podobnie jak przy kompresji. Tym razem nowy zbiór stanów powiększamy o około Γ3c (trzeba jeszcze pamiętać o zapamiętaniu pozycji każdej głowic wewnątrz obszarów, te szczegóły techniczne pomijamy). W tym momencie mamy pełną wiedzę kiedy maszyna M opuści "obszar trzech" i jak zostanie on zmodyfikowany. Oczywiście jeśli w tym czasie maszyna M kończy działanie, to tak robi również M. W przeciwnym wypadku "obszar trzech" jest modyfikowany kolejnymi 4 ruchami M i cykl rozpoczyna się od nowa. Wiemy jednak, że aby M opuściła obszar trzech komórek M to musi wykonać przynajmniej c ruchów. Przyspieszyliśmy zatem działanie przynajmniej o czynnik c/8.

Podsumowując koszt czasowy to f(n)=n+n/c+8f(n)/c<(1+ϵ)n+ϵf(n), jeśli c=8/ϵ, dla odpowiednio dużych n (dla małych n można stosownie rozbudować maszynę).

Twierdzenie nie ma zastosowania dla subliniowych funkcji złożoności, jednak maszyny, które nie czytają całego wejścia wydają się mało interesujące. W przypadku liniowej funkcji złożoności oznacza to, że stała może być dowolnie bliska 1.

Analogicznie twierdzenie zachodzi dla złożoności pamięciowej:

Ćwiczenie 2.2 [twierdzenie o liniowej kompresji pamięci]

Jeśli język L jest rozpoznawany przez maszynę M o złożoności pamięciowej f(n) to może być rozpoznany przez maszynę M o złożoności pamięciowej f(n)=ϵf(n), gdzie ϵ>0.

Wskazówka
Rozwiązanie

Na koniec ciekawostka dotycząca przyspieszania maszyn. Mając dany język L poszukujemy najszybszego algorytmu, który go akceptuje. Okazuje się, że jest język, dla którego nie istnieje algorytm asymptotycznie najszybszy! Autorem tego przeczącego intuicji twierdzenia jest Manuel Blum, laureat nagrody Turinga z roku 1995.

Twierdzenie 2.3 [twierdzenie Bluma o przyspieszaniu]

Istnieje język L, taki, że jeśli jest akceptowany przez maszynę Turinga o złożoności czasowej f(n), to jest również akceptowany, przez maszynę Turinga o złożoności czasowej log(f(n)).

Relacje między klasami, twierdzenie Savitcha

Teraz jesteśmy gotowi do wprowadzenia podstawowych klas złożoności, w których funkcje są wyłącznie asymptotyczne:

  • Klasa P=j>0TIME(nj), to klasa tych języków, które mogą być akceptowane w deterministycznym czasie wielomianowym,
  • Klasa NP=j>0NTIME(nj), to klasa tych języków, które mogą być akceptowane w niedeterministycznym czasie wielomianowym,
  • Klasa EXP=j>0TIME(2nj), to klasa tych języków, które mogą być akceptowane w deterministycznym czasie wykładniczym,
  • Klasa NEXP=j>0NTIME(2nj), to klasa tych języków, które mogą być akceptowane w niedeterministycznym czasie wykładniczym.

dla klas pamięciowych:

  • Klasa L=SPACE(logn), to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci logarytmicznej,
  • Klasa NL=NSPACE(logn), to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci logarytmicznej,
  • Klasa PSPACE=j>0SPACE(nj), to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci wielomianowej,
  • Klasa NPSPACE=j>0NSPACE(nj), to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci wielomianowej,
  • Klasa EXPSPACE=j>0SPACE(2nj), to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci wykładniczej,
  • Klasa NEXPSPACE=j>0NSPACE(2nj), to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci wykładniczej.

Teraz zajmiemy się relacjami pomiędzy poszczególnymi klasami złożoności. Najbardziej podstawowe zależności, łączące czas, pamięć i niedeterminizm to:

  • TIME(f(n))NTIME(f(n)), gdyż z definicji, każda maszyna deterministyczna jest maszyną niedeterministyczną,
  • SPACE(f(n))NSPACE(f(n)), jak wyżej,
  • TIME(f(n))SPACE(f(n)), gdyż maszyna nie może zapisać więcej komórek niż wynosi jej czas działania,
  • NTIME(f(n))NSPACE(f(n)), jak wyżej,
  • NTIME(f(n))TIME(cf(n)), na podstawie twierdzenia z modułu pierwszego o symulacji

maszyny niedeterministycznej przez maszynę deterministyczną.

Aby powiedzieć więcej o relacjach pomiędzy klasami musimy narzucić pewne rozsądne ograniczenie na funkcję złożoności f(n). Powiemy, że f(n) jest konstruowalna pamięciowo, gdy f(n)logn oraz istnieje deterministyczna maszyna Turinga, która mając na wejściu n zapisane unarnie potrafi zużyć dokładnie f(n) komórek pamięci i zatrzymać się.

Zawężamy się w ten sposób do funkcji f(n)logn, lecz mniejszych złożoności nie będziemy tutaj rozważać (mimo, iż można). Warto dodać, że jeśli maszyna działa w pamięci o(log logn) to działa w pamięci stałej.

Okazuje się, że większość interesujących funkcji spełnia tą własność. Jest to także własność zamknięta ze względu na dodawanie, mnożenie i potęgowanie.

Ćwiczenie 3.1

Pokaż, że funkcje logn, nk, 2nkonstruowalne pamięciowo.

Wskazówka
Rozwiązanie

Poniżej przedstawiamy twierdzenie, które zachodzi, jeśli nie narzucimy dodatkowego warunku na funkcję złożoności. Wprowadzając go, chcemy uniknąć podobnych sytuacji:

Twierdzenie 3.2 [twierdzenie o luce]

Istnieje funkcja rekurencyjna f(n) taka, że TIME(f(n))=TIME(2f(n)).

Dowód

Przedstawimy bardzo specyficzną definicję funkcji f(n), dla której każda maszyna na słowie o długości n działa w czasie co najwyżej f(n) lub działa przynajmniej 2f(n)+1 kroków lub pętli się. W ten sposób pokażemy stosowną równość klas. Dowód opiera się na bardzo użytecznej i często stosowanej technice przekątniowej.

Będziemy rozważać wszystkie możliwe maszyny w pewnej ustalonej kolejności M1,M2, wynikającej np. z leksykograficznego porządku na ich kodach zdefiniowanych w module pierwszym. Ponieważ każda maszyna może być opisana skończonym słowem, więc wygenerowanie takiego ciągu wszystkich maszyn jest wykonalne.

Zdefiniujmy relację binarną P(i,k) w ten sposób, by była spełniona, gdy każda maszyna od 1 do i działając na dowolnym słowie o długości i działa w czasie co najwyżej k lub działa przynajmniej 2k+1 kroków lub pętli się. Tą relację jesteśmy w stanie obliczyć poprzez stosowną symulację maszyn M1,,Mi na wszystkich słowach długości i przez co najwyżej 2k+1 kroków (oczywiście jest to dosyć czasochłonne), tym samym ewentualne pętlenie się maszyn nie stanowi przeszkody.

Teraz jesteśmy gotowi do zdefiniowania f(n). Ustalmy n. Zauważmy, że P(n,k) musi być prawdziwa dla pewnego k. Dzieje się tak dlatego, gdyż wraz ze wzrostem k zmieniamy zabroniony obszar czasu działania maszyn od 1 do n. Liczba słów które testujemy jest jednak ograniczona - są to wszystkie słowa o długości dokładnie n dla tych maszyn. Aby P(n,k) nie było prawdą to czas działania maszyny na słowie musi trafić do obszaru zabronionego, co wobec ustalonej liczby słów i zwiększania k spowoduje, że P(n,k) w końcu będzie prawdą. Definiujemy wartość f(n) jako najmniejsze takie k.

Weźmy dowolny język LTIME(2f(n)). Jest on akceptowany przez maszynę, którą oznaczmy Mj (w naszym porządku ustalonym w pierwszej części). Maszyna ma złożoność 2f(n). Weźmy dowolne słowo o długości lj. Wiemy, że P(l,f(l)) jest spełnione, a tym samym maszyna Mj działa w czasie co najwyżej f(l) (bo więcej niż 2f(l) nie może z definicji klasy). Zatem LTIME(f(n)).

Pominęliśmy działanie na słowach krótszych niż j, jednakże jest to stała liczba słów, które łatwo zaakceptować w czasie rzędu ich długości po prostu wbudowując ich przynależność do L w maszynę.

W literaturze rozważa się wiele wersji "normujących" dopuszczalne funkcji złożoności, np. właściwie funkcje złożoności lub funkcje uczciwe. Różnice między nimi są dosyć techniczne. Przyjmijmy zatem, że funkcje złożoności f(n) są konstruowalne pamięciowo.

Przeanalizujmy teraz możliwe konfiguracje maszyny Turinga M, które tworzą tzw. graf przejść maszyny:

Ćwiczenie 3.3

W jak wielu konfiguracjach może znaleźć się maszyna Turinga o złożoności pamięciowej f(n) (konstruowalnej pamięciowo) przeprowadzając obliczenie na słowie o długości n?

Wskazówka
Rozwiązanie

Razem możemy to ograniczyć przez cf(n), dla pewnego c zależnego tylko od maszyny oraz korzystając z założenia, że f(n)logn, gdyż jest konstruowalna pamięciowo.

Teraz jesteśmy gotowi do wypowiedzenia kolejnych interesujących relacji pomiędzy wprowadzonymi klasami:

  • SPACE(f(n))TIME(cf(n)), ze względu na fakt, iż liczba możliwych konfiguracji maszyny o złożoności pamięciowej f(n),

co pokazaliśmy przed chwilą wynosi cf(n), zatem maszyna, która się nie pętli może zostać zasymulowana przez maszynę działającą co najwyżej tak długo. W przeciwnym wypadku wpadła by w nieskończoną pętlę.

  • NTIME(f(n))SPACE(f(n)), gdyż maszyna deterministyczna może zasymulować działanie maszyny niedeterministycznej.

Wystarczy wygenerować po kolei każdy z ciągów f(n) niedeterministycznych wyborów (tu korzystamy z pamięciowej konstruowalności), których musi ona dokonać w trakcie obliczeń. Następnie dokonujemy już deterministycznej symulacji obliczeń przez f(n) kroków. Wszystkie te operacje można dokonać w dostępnej pamięci f(n), gdyż każdy z ciągów niedeterministycznych wyborów możemy symulować w tej samej pamięci,

  • NSPACE(f(n))TIME(cf(n)), ponownie opierając się na symulacji maszyny.

Jak poprzednio liczba wszystkich konfiguracji wynosi cf(n), jednak tym razem przejścia pomiędzy poszczególnymi konfiguracjami tworzą graf. Wystarczy jednak obliczyć, czy istnieje ścieżka od konfiguracji początkowej do konfiguracji końcowej, co może być obliczone w czasie wielomianowym ze względu na rozmiar grafu, a zatem w czasie asymptotycznym cf(n).

Dzięki powyższym relacjom możemy wypisać kilka podstawowych zależności pomiędzy wprowadzonymi klasami:

Ćwiczenie 3.4

Uzasadnij każdą z poniższych relacji:

  • LNLPNPPSPACE
  • PSPACENPSPACEEXPNEXPEXPSPACENEXPSPACE
Wskazówka
Rozwiązanie

Przyjrzyjmy się bliżej pierwszej serii relacji z poprzedniego ćwiczenia i zobrazujmy ją w animacji Relacje pomiędzy podstawowymi klasami.

|size=small</flashwrap><div.thumbcaption style="width:250;">Relacje pomiędzy podstawowymi klasami

LNLPNPPSPACE

W następnej części z twierdzenia o hierarchii pamięciowej dowiemy się, że LPSPACE. Tym samym wiemy, że pierwszy i ostatni element są różne. Jedną z najbardziej fascynujących rzeczy w teorii złożoności jest fakt, że przynajmniej jedno z czterech powyższych zawierań musi być ścisłe, jednakże o żadnym z nich tego nie wiadomo! Najsłynniejszy fragment to oczywiście pytanie o zawieranie pomiędzy P i NP.

Ostatnią i najciekawszą relacją pomiędzy klasami jest ta odkryta przez Savitcha, mówiąca o niewielkiej przewadze niedeterministycznej złożoności pamięciowej. Przypomnijmy, że do tej pory wiemy poprzez połączenie dwóch wymienionych własności, że NSPACE(f(n))SPACE(cf(n)). Okazuje się, że zachodzi twierdzenie dużo silniejsze:

Twierdzenie 3.5 [twierdzenie Savitcha]

Jeśli f(n) jest konstruowalna pamięciowo, to NSPACE(f(n))SPACE(f2(n)).

Wierzchołek pośredni

Dowód

Wspominaliśmy już o tym, że kluczowym elementem symulacji maszyny niedeterministycznej jest sprawdzanie czy istnieje ścieżka od konfiguracji początkowej do końcowej maszyny. Problem sprawdzania czy dwa wierzchołki w grafie są połączone ścieżką jest znany jako REACHABILITY. Savitch udowodnił, że REACHABILITY należy do SPACE(log2n), gdzie n to rozmiar grafu. W naszym wypadku rozmiar grafu to liczba konfiguracji, czyli cf(n), zatem REACHABILITY wymaga czasu log2(cf(n))=O(f(n))2, co da nam tezę. Od tej pory przyjmijmy, że graf ma n wierzchołków.

Wprowadźmy pomocniczą funkcję PATH(x,y,i) która ma zwrócić 1, gdy istnieje ścieżka od x do y w grafie zawierająca co najwyżej i wierzchołków. Nasze pytanie możemy przeformułować jako PATH(b,e,n), gdzie b to stan początkowy, e końcowy, a n to maksymalna długość ścieżki w grafie konfiguracji, czyli liczba wszystkich wierzchołków.

Obliczymy PATH(x,y,i) w sposób rekurencyjny. Jeśli i=1 to sprawdzamy bezpośrednie przejście od konfiguracji x do y. W przeciwnym wypadku najpierw wybieramy dowolny wierzchołek jako kandydata na wierzchołek pośredni na ścieżce pomiędzy x i y, który oznaczmy przez t (rysunek Wierzchołek pośredni).

Potem wywołujemy rekurencyjnie PATH(x,t,i/2) oraz PATH(t,y,i/2). Jeśli obie ścieżki istnieją to zwracamy 1, w przeciwnym wypadku próbujemy kolejny wierzchołek t. Nie musimy się martwić o czas, tylko pamięć, więc policzmy ile jest nam potrzebne.

Głębokość rekurencji wyniesie logn, ze względu na fakt iż na każdym poziomie zmniejszamy długość o czynnik 2. Aby zapamiętać wywołanie rekurencyjne (stos rekurencyjny) potrzebujemy pamiętać x, y, bieżące t oraz i. Wszystkie te liczby w zapisie binarnym potrzebują logn pamięci. Razem potrzebujemy O(log2n) pamięci.

Na podstawie twierdzenia Savitcha wiemy, że niektóre z poznanych klas są sobie równe:

  • PSPACE = NPSPACE,
  • EXPSPACE = NEXPSPACE.

czyli, że niedeterminizm w złożoności pamięciowej dla większych funkcji nic nie daje. Dla klas złożoności czasowej takiej wiedzy nie posiadamy!

Dopełnienia klas

W tym rozdziale przyjrzymy się dopełnieniom języków i klas. Jeśli L jest językiem to przez L=*L oznaczamy jego dopełnienie. W przypadku problemów decyzyjnych dopełnienie (ang. COMPLEMENT) to problem decyzyjny, w którym odpowiedzi są odwrócone.

Jeśli rozważymy SAT, w którym pytamy czy formuła może zostać spełniona, to jego dopełnienie to SAT COMPLEMENT. Jest to problem bardzo blisko spokrewniony z TAUTOLOGY, w którym pytamy czy każde wartościowanie formuły ϕ ją spełnia. SAT COMPLEMENT to pytanie, czy formuła nie ma wartościowań spełniających, co jest równoważne temu, że ¬ϕ jest formułą zawsze spełnioną, czyli jest tautologią logiczną.

COMPLEMENT nie jest ściśle dopełnieniem języka, gdyż SAT zawiera także wszystkie słowa, które nie są poprawnymi opisami formuł. Te słowa nie stanowią jednak problemu w rozpoznawaniu.

Zdefiniujemy teraz pojęcie dopełnienia klasy złożoności. Przypomnijmy, że klasy złożoności składają się z języków. Jeśli C jest dowolną klasą złożoności to przez coC oznaczamy jej dopełnienie, które jest złożone z dopełnień języków z klasy C.

Zauważmy od razu, że jeśli C jest klasą deterministyczną, to coC=C ze względu na fakt, iż maszyna deterministyczna, która akceptuje język LC po zamianie rolami stanu akceptującego i odrzucającego stanie się maszyną akceptującą język L.

W module dotyczącym pamięci logarytmicznej dowiemy się, że klasy niedeterministycznej złożoności pamięciowej również zamknięte są na dopełnienia, natomiast w przypadku klas niedeterministycznych złożoności czasowej nie wiemy jakie są relacje pomiędzy nimi i jest to problem otwarty.

Twierdzenia o hierarchii czasowej i pamięciowej

W tej części poznamy dwa ważne twierdzenia, które wprowadzają pojęcia hierarchii czasowej i pamięciowej, tzn. pokażemy, że większe złożoności rzeczywiście istotnie pozwalają akceptować więcej języków.

Twierdzenie 3.6 [twierdzenie o hierarchii pamięciowej]

Jeśli f(n) jest konstruowalna pamięciowo oraz g(n)o(f(n)) (czyli rośnie asymptotycznie wolniej) to SPACE(g(n))SPACE(f(n)).

Maszyna przekątniowa

Dowód

Pokażemy, że istnieje język LSPACE(f(n)) taki, że LSPACE(g(n)). Aby zapewnić pierwszy warunek, skonstruujemy maszynę M dla L, która ma złożoność pamięciową f(n). Drugi warunek zapewnimy pokazując, że żadna z maszyn o złożoności pamięciowej g(n) nie akceptuje L.

Maszyna M działa następująco. Gdy na wejściu dostanie słowo o długości n to w pierwszym etapie oznakowuje f(n) komórek pamięci na każdej z taśm. Będziemy bowiem symulować inne maszyny i chcemy się upewnić, że nie zużywają one więcej niż f(n) pamięci. Możemy to zrobić dzięki konstruowalności pamięciowej f(n).

Teraz następuje część przekątniowa (rysunek Maszyna przekątniowa).

W drugim etapie maszyna M interpretuje słowo x z wejścia jako kod maszyny M. Maszyna M odrzuca słowa, które nie są poprawnymi kodami. Gdy kod jest poprawny, to rozpoczyna się symulacja M na tym samym słowie x. Jeśli symulacja przekroczy oznakowaną pamięć f(n) to maszyna M również odrzuca słowo x. Jeśli maszyna M zaakceptuje x to maszyna M odrzuca x i jeśli M odrzuca x to M je akceptuje.

Maszyna M ma złożoność pamięciową f(n), więc L=L(M)SPACE(f(n)). Zastanówmy się, czy język L należy do klasy SPACE(g(n)). Wtedy jest akceptowany przez maszynę M o złożoności g(n). Zastanówmy się co dzieje się, gdy M dostanie na wejściu swój kod <M>. Ponieważ M akceptuje język w czasie g(n), więc i na słowie x działa w takim czasie. Załóżmy, że odrzuca x. Wtedy maszyna M zaakceptuje x, gdyż symulacja którą ona przeprowadza, tzn. działanie M na x może zostać przeprowadzona, jako że g(n) jest asymptotycznie mniejsze niż f(n) (pomijamy szczegóły techniczne, które pojawią się dla małych n). Analogicznie, gdy M akceptuje x to M je odrzuca, czyli M nie może akceptować L, gdyż myli się na x=M.

Otrzymujemy sprzeczność, stąd LSPACE(g(n)).

A teraz pora na analogiczne twierdzenie o hierarchii czasowej. Potrzebne jest nam do niego dodatkowe ograniczenie na funkcję złożoności. Powiemy, że f(n) jest konstruowalna czasowo, gdy f(n)nlogn oraz istnieje deterministyczna maszyna Turinga, która mając na wejściu n zapisane unarnie potrafi działać przez dokładnie f(n) kroków i zatrzymać się. Również w tym wypadku większość znanych funkcji jest konstruowalna.

Twierdzenie 3.7 [twierdzenie o hierarchii czasowej]

Jeśli f(n) jest konstruowalna czasowo oraz g(n)o(f(n)/logf(n)) to TIME(g(n))TIME(f(n)).

Dowód jest przedmiotem ćwiczenia końcowego. Teraz możemy wyciągnąć kilka ważnych wniosków o silnym zawieraniu się klas złożoności:

  • SPACE(nϵ1)SPACE(nϵ2), gdy 0ϵ1<ϵ2, z własności funkcji wielomianowej,
  • TIME(nϵ1)TIME(nϵ2), gdy 1ϵ1<ϵ2, jak wyżej,
  • LPSPACE, gdyż logarytm rośnie wolniej niż funkcja wielomianowa,
  • PEXP, korzystamy z własności, że każdy wielomian rośnie wolniej niż funkcja subwykładnicza nlogn a ta z kolei rośnie wolniej, niż każda funkcja wykładnicza.
  • PSPACEEXPSPACE, jak wyżej.

Widzimy zatem, że klasa P, pojmowana jako zbiór praktycznie rozwiązywalnych problemów również podlega hierarchii. Istnieją w niej języki które są akceptowane w czasie n10000 natomiast w n9999 już nie. To sprawia, że należy patrzeć na praktyczność klasy P z pewną ostrożnością.

Ćwiczenia dodatkowe

Ćwiczenie 4.1

Udowodnij twierdzenie o hierarchii czasowej: Jeśli f(n) jest konstruowalna czasowo oraz g(n)o(f(n)/logf(n)) to TIME(g(n))TIME(f(n)).

Wskazówka
Rozwiązanie

Ćwiczenie 4.2

Udowodnij następujące fakty:

  • NTIME(n)PSPACE
  • TIME(2n)=TIME(2n+1)
  • TIME(2n)TIME(22n)
Wskazówka
Rozwiązanie

Testy końcowe