Złożoność obliczeniowa/Wykład 3: Klasy złożoności obliczeniowej
Klasy złożoności czasowej i pamięciowej
W poprzednich modułach zostały wprowadzone maszyny Turinga oraz zdefiniowane pojęcie problemu obliczeniowego. Przypomnijmy, że problem obliczeniowy to dla nas język, czyli zbiór słów. Poznaliśmy także szczegółowo maszynę w wersji deterministycznej i niedeterministycznej oraz jej miarę złożoności czasowej i pamięciowej w każdej z wersji. W tym module zajmiemy się klasyfikacją języków przy pomocy maszyn. W naszych dalszych rozważaniach przyjmujemy model obliczeń w postaci maszyny Turinga o taśmach.
Klasa złożoności obliczeniowej to zbiór problemów (języków) spełniających określone kryterium. Najbardziej podstawowe kryteria, tzn. czas i pamięć potrzebne do klasyfikacji języka dają nam podstawowe klasy złożoności:
Definicja 1.1 [ ]
Poprzez oznaczamy zbiór języków takich, że są akceptowane przez deterministyczną maszynę Turinga o złożoności czasowej .
Definicja 1.2 []
Poprzez oznaczamy zbiór języków takich, że są akceptowane przez deterministyczną maszynę Turinga o złożoności pamięciowej .
Stosowne klasy można też zdefiniować dla niedeterministycznych maszyn:
Definicja 1.3 []
Poprzez oznaczamy zbiór języków takich, że są akceptowane przez niedeterministyczną maszynę Turinga o złożoności czasowej .
Definicja 1.4 []
Poprzez oznaczamy zbiór języków takich, że są akceptowane przez niedeterministyczną maszynę Turinga o złożoności pamięciowej .
Twierdzenia o liniowym przyspieszaniu i kompresji pamięci
Pierwsze dwa twierdzenia możemy nazwać "teoretycznymi podstawami" notacji . Pokażemy bowiem, że w obu powyższych definicjach klas funkcja może być rozpatrywana z dokładnością do stałej, ze względu na specyfikę samego modelu obliczeń. Zostały one udowodnione w latach 60 przez pionierów badań nad klasami złożoności, laureatów nagrody Turinga z roku 1993, Jurisa Hartmanisa i Richarda Stearnsa.
Twierdzenie 2.1 [twierdzenie o liniowym przyspieszaniu]
Dowód
Idea dowodu jest oparta na powiększeniu alfabetu maszyny, a tym samym wielkości "słowa" maszyny oraz liczby jej stanów. Odpowiada to w praktyce podniesieniu technologii wytwarzania komputerów. W animacji Liniowe przyspieszanie przedstawiono schematycznie zamianę 8 komórek pamięci na jedną większą nowej maszyny.
Nasza nowa maszyna o powiększonym alfabecie rozpoczyna działanie od skompresowania słowa wejściowego na drugiej taśmie i zamiany ról taśmy drugiej i wejściowej. Następnie głowica powraca na początek słowa i rozpoczyna obliczenia.
W każdym kroku obliczeń odczytuje bieżącą komórkę oraz dwie sąsiednie (na wszystkich taśmach), a następnie symuluje zachowanie w obszarze tych trzech komórek dzięki zwiększonej stosownie liczbie stanów. Jako efekt następuje modyfikacja bieżącej komórki i komórek sąsiednich oraz stosowne przesunięcie głowicy.
Policzmy, czy taka symulacja rzeczywiście może być opłacalna. Załóżmy, że każda z komórek odpowiada komórkom maszyny , gdzie - stopień kompresji, który ostatecznie ustalimy na końcu (będzie on oczywiście zależał od i ). Alfabet nowej maszyny to alfabet starej maszyny powiększony o symbole postaci , które zapewniają nam zapis symboli w jednym symbolu .
W pierwszym etapie musi dokonać kompresji, czyli odczytać symboli i zapisać 1 symbol skompresowany. Do tego celu wystarczy jej istnienie około dodatkowych stanów. W ostatnim skompresowanym symbolu dokładamy symbole puste dla wyrównania. Czas działania tego etapu to około (odczyt związany z kompresją + powrót).
W drugim etapie dokonujemy symulacji. Najpierw odczytujemy "obszar trzech" komórek na każdej taśmie co zajmuje 4 kroki (rysunek Obszar trzech).
Zapamiętujemy odczyt dzięki stosownemu powiększeniu liczby stanów , które wykonujemy podobnie jak przy kompresji. Tym razem nowy zbiór stanów powiększamy o około (trzeba jeszcze pamiętać o zapamiętaniu pozycji każdej głowic wewnątrz obszarów, te szczegóły techniczne pomijamy). W tym momencie mamy pełną wiedzę kiedy maszyna opuści "obszar trzech" i jak zostanie on zmodyfikowany. Oczywiście jeśli w tym czasie maszyna kończy działanie, to tak robi również . W przeciwnym wypadku "obszar trzech" jest modyfikowany kolejnymi 4 ruchami i cykl rozpoczyna się od nowa. Wiemy jednak, że aby opuściła obszar trzech komórek to musi wykonać przynajmniej ruchów. Przyspieszyliśmy zatem działanie przynajmniej o czynnik .
Podsumowując koszt czasowy to , jeśli , dla odpowiednio dużych (dla małych można stosownie rozbudować maszynę).

Twierdzenie nie ma zastosowania dla subliniowych funkcji złożoności, jednak maszyny, które nie czytają całego wejścia wydają się mało interesujące. W przypadku liniowej funkcji złożoności oznacza to, że stała może być dowolnie bliska 1.
Analogicznie twierdzenie zachodzi dla złożoności pamięciowej:
Ćwiczenie 2.2 [twierdzenie o liniowej kompresji pamięci]
Jeśli język jest rozpoznawany przez maszynę o złożoności pamięciowej to może być rozpoznany przez maszynę o złożoności pamięciowej , gdzie .
Na koniec ciekawostka dotycząca przyspieszania maszyn. Mając dany język poszukujemy najszybszego algorytmu, który go akceptuje. Okazuje się, że jest język, dla którego nie istnieje algorytm asymptotycznie najszybszy! Autorem tego przeczącego intuicji twierdzenia jest Manuel Blum, laureat nagrody Turinga z roku 1995.
Twierdzenie 2.3 [twierdzenie Bluma o przyspieszaniu]
Istnieje język , taki, że jeśli jest akceptowany przez maszynę Turinga o złożoności czasowej , to jest również akceptowany, przez maszynę Turinga o złożoności czasowej .
Relacje między klasami, twierdzenie Savitcha
Teraz jesteśmy gotowi do wprowadzenia podstawowych klas złożoności, w których funkcje są wyłącznie asymptotyczne:
- Klasa , to klasa tych języków, które mogą być akceptowane w deterministycznym czasie wielomianowym,
- Klasa , to klasa tych języków, które mogą być akceptowane w niedeterministycznym czasie wielomianowym,
- Klasa , to klasa tych języków, które mogą być akceptowane w deterministycznym czasie wykładniczym,
- Klasa , to klasa tych języków, które mogą być akceptowane w niedeterministycznym czasie wykładniczym.
dla klas pamięciowych:
- Klasa log, to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci logarytmicznej,
- Klasa log, to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci logarytmicznej,
- Klasa , to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci wielomianowej,
- Klasa , to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci wielomianowej,
- Klasa , to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci wykładniczej,
- Klasa , to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci wykładniczej.
Teraz zajmiemy się relacjami pomiędzy poszczególnymi klasami złożoności. Najbardziej podstawowe zależności, łączące czas, pamięć i niedeterminizm to:
- , gdyż z definicji, każda maszyna deterministyczna jest maszyną niedeterministyczną,
- , jak wyżej,
- , gdyż maszyna nie może zapisać więcej komórek niż wynosi jej czas działania,
- , jak wyżej,
- , na podstawie twierdzenia z modułu pierwszego o symulacji
maszyny niedeterministycznej przez maszynę deterministyczną.
Aby powiedzieć więcej o relacjach pomiędzy klasami musimy narzucić pewne rozsądne ograniczenie na funkcję złożoności . Powiemy, że jest konstruowalna pamięciowo, gdy oraz istnieje deterministyczna maszyna Turinga, która mając na wejściu zapisane unarnie potrafi zużyć dokładnie komórek pamięci i zatrzymać się.
Zawężamy się w ten sposób do funkcji , lecz mniejszych złożoności nie będziemy tutaj rozważać (mimo, iż można). Warto dodać, że jeśli maszyna działa w pamięci to działa w pamięci stałej.
Okazuje się, że większość interesujących funkcji spełnia tą własność. Jest to także własność zamknięta ze względu na dodawanie, mnożenie i potęgowanie.
Ćwiczenie 3.1
Pokaż, że funkcje , , są konstruowalne pamięciowo.
Poniżej przedstawiamy twierdzenie, które zachodzi, jeśli nie narzucimy dodatkowego warunku na funkcję złożoności. Wprowadzając go, chcemy uniknąć podobnych sytuacji:
Twierdzenie 3.2 [twierdzenie o luce]
Dowód
Przedstawimy bardzo specyficzną definicję funkcji , dla której każda maszyna na słowie o długości działa w czasie co najwyżej lub działa przynajmniej kroków lub pętli się. W ten sposób pokażemy stosowną równość klas. Dowód opiera się na bardzo użytecznej i często stosowanej technice przekątniowej.
Będziemy rozważać wszystkie możliwe maszyny w pewnej ustalonej kolejności wynikającej np. z leksykograficznego porządku na ich kodach zdefiniowanych w module pierwszym. Ponieważ każda maszyna może być opisana skończonym słowem, więc wygenerowanie takiego ciągu wszystkich maszyn jest wykonalne.
Zdefiniujmy relację binarną w ten sposób, by była spełniona, gdy każda maszyna od do działając na dowolnym słowie o długości działa w czasie co najwyżej lub działa przynajmniej kroków lub pętli się. Tą relację jesteśmy w stanie obliczyć poprzez stosowną symulację maszyn na wszystkich słowach długości przez co najwyżej kroków (oczywiście jest to dosyć czasochłonne), tym samym ewentualne pętlenie się maszyn nie stanowi przeszkody.
Teraz jesteśmy gotowi do zdefiniowania . Ustalmy . Zauważmy, że musi być prawdziwa dla pewnego . Dzieje się tak dlatego, gdyż wraz ze wzrostem zmieniamy zabroniony obszar czasu działania maszyn od do . Liczba słów które testujemy jest jednak ograniczona - są to wszystkie słowa o długości dokładnie dla tych maszyn. Aby nie było prawdą to czas działania maszyny na słowie musi trafić do obszaru zabronionego, co wobec ustalonej liczby słów i zwiększania spowoduje, że w końcu będzie prawdą. Definiujemy wartość jako najmniejsze takie .
Weźmy dowolny język . Jest on akceptowany przez maszynę, którą oznaczmy (w naszym porządku ustalonym w pierwszej części). Maszyna ma złożoność . Weźmy dowolne słowo o długości . Wiemy, że jest spełnione, a tym samym maszyna działa w czasie co najwyżej (bo więcej niż nie może z definicji klasy). Zatem .
Pominęliśmy działanie na słowach krótszych niż , jednakże jest to stała liczba słów, które łatwo zaakceptować w czasie rzędu ich długości po prostu wbudowując ich przynależność do w maszynę.

W literaturze rozważa się wiele wersji "normujących" dopuszczalne funkcji złożoności, np. właściwie funkcje złożoności lub funkcje uczciwe. Różnice między nimi są dosyć techniczne. Przyjmijmy zatem, że funkcje złożoności są konstruowalne pamięciowo.
Przeanalizujmy teraz możliwe konfiguracje maszyny Turinga , które tworzą tzw. graf przejść maszyny:
Ćwiczenie 3.3
W jak wielu konfiguracjach może znaleźć się maszyna Turinga o złożoności pamięciowej (konstruowalnej pamięciowo) przeprowadzając obliczenie na słowie o długości ?
Razem możemy to ograniczyć przez , dla pewnego zależnego tylko od maszyny oraz korzystając z założenia, że , gdyż jest konstruowalna pamięciowo.
Teraz jesteśmy gotowi do wypowiedzenia kolejnych interesujących relacji pomiędzy wprowadzonymi klasami:
- , ze względu na fakt, iż liczba możliwych konfiguracji maszyny o złożoności pamięciowej ,
co pokazaliśmy przed chwilą wynosi , zatem maszyna, która się nie pętli może zostać zasymulowana przez maszynę działającą co najwyżej tak długo. W przeciwnym wypadku wpadła by w nieskończoną pętlę.
- , gdyż maszyna deterministyczna może zasymulować działanie maszyny niedeterministycznej.
Wystarczy wygenerować po kolei każdy z ciągów niedeterministycznych wyborów (tu korzystamy z pamięciowej konstruowalności), których musi ona dokonać w trakcie obliczeń. Następnie dokonujemy już deterministycznej symulacji obliczeń przez kroków. Wszystkie te operacje można dokonać w dostępnej pamięci , gdyż każdy z ciągów niedeterministycznych wyborów możemy symulować w tej samej pamięci,
- , ponownie opierając się na symulacji maszyny.
Jak poprzednio liczba wszystkich konfiguracji wynosi , jednak tym razem przejścia pomiędzy poszczególnymi konfiguracjami tworzą graf. Wystarczy jednak obliczyć, czy istnieje ścieżka od konfiguracji początkowej do konfiguracji końcowej, co może być obliczone w czasie wielomianowym ze względu na rozmiar grafu, a zatem w czasie asymptotycznym .
Dzięki powyższym relacjom możemy wypisać kilka podstawowych zależności pomiędzy wprowadzonymi klasami:
Ćwiczenie 3.4
Uzasadnij każdą z poniższych relacji:
Przyjrzyjmy się bliżej pierwszej serii relacji z poprzedniego ćwiczenia i zobrazujmy ją w animacji Relacje pomiędzy podstawowymi klasami.
|size=small</flashwrap><div.thumbcaption style="width:250;">Relacje pomiędzy podstawowymi klasami
W następnej części z twierdzenia o hierarchii pamięciowej dowiemy się, że . Tym samym wiemy, że pierwszy i ostatni element są różne. Jedną z najbardziej fascynujących rzeczy w teorii złożoności jest fakt, że przynajmniej jedno z czterech powyższych zawierań musi być ścisłe, jednakże o żadnym z nich tego nie wiadomo! Najsłynniejszy fragment to oczywiście pytanie o zawieranie pomiędzy P i NP.
Ostatnią i najciekawszą relacją pomiędzy klasami jest ta odkryta przez Savitcha, mówiąca o niewielkiej przewadze niedeterministycznej złożoności pamięciowej. Przypomnijmy, że do tej pory wiemy poprzez połączenie dwóch wymienionych własności, że . Okazuje się, że zachodzi twierdzenie dużo silniejsze:
Twierdzenie 3.5 [twierdzenie Savitcha]
Jeśli jest konstruowalna pamięciowo, to .
Dowód
Wspominaliśmy już o tym, że kluczowym elementem symulacji maszyny niedeterministycznej jest sprawdzanie czy istnieje ścieżka od konfiguracji początkowej do końcowej maszyny. Problem sprawdzania czy dwa wierzchołki w grafie są połączone ścieżką jest znany jako REACHABILITY. Savitch udowodnił, że REACHABILITY należy do (), gdzie to rozmiar grafu. W naszym wypadku rozmiar grafu to liczba konfiguracji, czyli , zatem REACHABILITY wymaga czasu , co da nam tezę. Od tej pory przyjmijmy, że graf ma wierzchołków.
Wprowadźmy pomocniczą funkcję która ma zwrócić 1, gdy istnieje ścieżka od do w grafie zawierająca co najwyżej wierzchołków. Nasze pytanie możemy przeformułować jako , gdzie to stan początkowy, końcowy, a to maksymalna długość ścieżki w grafie konfiguracji, czyli liczba wszystkich wierzchołków.
Obliczymy w sposób rekurencyjny. Jeśli to sprawdzamy bezpośrednie przejście od konfiguracji do . W przeciwnym wypadku najpierw wybieramy dowolny wierzchołek jako kandydata na wierzchołek pośredni na ścieżce pomiędzy i , który oznaczmy przez (rysunek Wierzchołek pośredni).
Potem wywołujemy rekurencyjnie oraz . Jeśli obie ścieżki istnieją to zwracamy 1, w przeciwnym wypadku próbujemy kolejny wierzchołek . Nie musimy się martwić o czas, tylko pamięć, więc policzmy ile jest nam potrzebne.
Głębokość rekurencji wyniesie , ze względu na fakt iż na każdym poziomie zmniejszamy długość o czynnik 2. Aby zapamiętać wywołanie rekurencyjne (stos rekurencyjny) potrzebujemy pamiętać , , bieżące oraz . Wszystkie te liczby w zapisie binarnym potrzebują pamięci. Razem potrzebujemy pamięci.

Na podstawie twierdzenia Savitcha wiemy, że niektóre z poznanych klas są sobie równe:
- PSPACE = NPSPACE,
- EXPSPACE = NEXPSPACE.
czyli, że niedeterminizm w złożoności pamięciowej dla większych funkcji nic nie daje. Dla klas złożoności czasowej takiej wiedzy nie posiadamy!
Dopełnienia klas
W tym rozdziale przyjrzymy się dopełnieniom języków i klas. Jeśli jest językiem to przez oznaczamy jego dopełnienie. W przypadku problemów decyzyjnych dopełnienie (ang. COMPLEMENT) to problem decyzyjny, w którym odpowiedzi są odwrócone.
Jeśli rozważymy SAT, w którym pytamy czy formuła może zostać spełniona, to jego dopełnienie to SAT COMPLEMENT. Jest to problem bardzo blisko spokrewniony z TAUTOLOGY, w którym pytamy czy każde wartościowanie formuły ją spełnia. SAT COMPLEMENT to pytanie, czy formuła nie ma wartościowań spełniających, co jest równoważne temu, że jest formułą zawsze spełnioną, czyli jest tautologią logiczną.
COMPLEMENT nie jest ściśle dopełnieniem języka, gdyż zawiera także wszystkie słowa, które nie są poprawnymi opisami formuł. Te słowa nie stanowią jednak problemu w rozpoznawaniu.
Zdefiniujemy teraz pojęcie dopełnienia klasy złożoności. Przypomnijmy, że klasy złożoności składają się z języków. Jeśli jest dowolną klasą złożoności to przez oznaczamy jej dopełnienie, które jest złożone z dopełnień języków z klasy .
Zauważmy od razu, że jeśli jest klasą deterministyczną, to ze względu na fakt, iż maszyna deterministyczna, która akceptuje język po zamianie rolami stanu akceptującego i odrzucającego stanie się maszyną akceptującą język .
W module dotyczącym pamięci logarytmicznej dowiemy się, że klasy niedeterministycznej złożoności pamięciowej również zamknięte są na dopełnienia, natomiast w przypadku klas niedeterministycznych złożoności czasowej nie wiemy jakie są relacje pomiędzy nimi i jest to problem otwarty.
Twierdzenia o hierarchii czasowej i pamięciowej
W tej części poznamy dwa ważne twierdzenia, które wprowadzają pojęcia hierarchii czasowej i pamięciowej, tzn. pokażemy, że większe złożoności rzeczywiście istotnie pozwalają akceptować więcej języków.
Twierdzenie 3.6 [twierdzenie o hierarchii pamięciowej]
Jeśli jest konstruowalna pamięciowo oraz (czyli rośnie asymptotycznie wolniej) to .
Dowód
Pokażemy, że istnieje język taki, że . Aby zapewnić pierwszy warunek, skonstruujemy maszynę dla , która ma złożoność pamięciową . Drugi warunek zapewnimy pokazując, że żadna z maszyn o złożoności pamięciowej nie akceptuje .
Maszyna działa następująco. Gdy na wejściu dostanie słowo o długości to w pierwszym etapie oznakowuje komórek pamięci na każdej z taśm. Będziemy bowiem symulować inne maszyny i chcemy się upewnić, że nie zużywają one więcej niż pamięci. Możemy to zrobić dzięki konstruowalności pamięciowej .
Teraz następuje część przekątniowa (rysunek Maszyna przekątniowa).
W drugim etapie maszyna interpretuje słowo z wejścia jako kod maszyny . Maszyna odrzuca słowa, które nie są poprawnymi kodami. Gdy kod jest poprawny, to rozpoczyna się symulacja na tym samym słowie . Jeśli symulacja przekroczy oznakowaną pamięć to maszyna również odrzuca słowo . Jeśli maszyna zaakceptuje to maszyna odrzuca i jeśli odrzuca to je akceptuje.
Maszyna ma złożoność pamięciową , więc . Zastanówmy się, czy język należy do klasy . Wtedy jest akceptowany przez maszynę o złożoności . Zastanówmy się co dzieje się, gdy dostanie na wejściu swój kod . Ponieważ akceptuje język w czasie , więc i na słowie działa w takim czasie. Załóżmy, że odrzuca . Wtedy maszyna zaakceptuje , gdyż symulacja którą ona przeprowadza, tzn. działanie na może zostać przeprowadzona, jako że jest asymptotycznie mniejsze niż (pomijamy szczegóły techniczne, które pojawią się dla małych ). Analogicznie, gdy akceptuje to je odrzuca, czyli nie może akceptować , gdyż myli się na .
Otrzymujemy sprzeczność, stąd .

A teraz pora na analogiczne twierdzenie o hierarchii czasowej. Potrzebne jest nam do niego dodatkowe ograniczenie na funkcję złożoności. Powiemy, że jest konstruowalna czasowo, gdy oraz istnieje deterministyczna maszyna Turinga, która mając na wejściu zapisane unarnie potrafi działać przez dokładnie kroków i zatrzymać się. Również w tym wypadku większość znanych funkcji jest konstruowalna.
Twierdzenie 3.7 [twierdzenie o hierarchii czasowej]
Jeśli jest konstruowalna czasowo oraz to .
Dowód jest przedmiotem ćwiczenia końcowego. Teraz możemy wyciągnąć kilka ważnych wniosków o silnym zawieraniu się klas złożoności:
- , gdy , z własności funkcji wielomianowej,
- , gdy , jak wyżej,
- , gdyż logarytm rośnie wolniej niż funkcja wielomianowa,
- , korzystamy z własności, że każdy wielomian rośnie wolniej niż funkcja subwykładnicza a ta z kolei rośnie wolniej, niż każda funkcja wykładnicza.
- , jak wyżej.
Widzimy zatem, że klasa P, pojmowana jako zbiór praktycznie rozwiązywalnych problemów również podlega hierarchii. Istnieją w niej języki które są akceptowane w czasie natomiast w już nie. To sprawia, że należy patrzeć na praktyczność klasy P z pewną ostrożnością.
Ćwiczenia dodatkowe
Ćwiczenie 4.1
Udowodnij twierdzenie o hierarchii czasowej: Jeśli jest konstruowalna czasowo oraz to .
Ćwiczenie 4.2
Udowodnij następujące fakty: