Złożoność obliczeniowa/Wykład 3: Klasy złożoności obliczeniowej: Różnice pomiędzy wersjami

Aktualna wersja na dzień 11:03, 5 wrz 2023

Klasy złożoności czasowej i pamięciowej

W poprzednich modułach zostały wprowadzone maszyny Turinga oraz zdefiniowane pojęcie problemu obliczeniowego. Przypomnijmy, że problem obliczeniowy to dla nas język, czyli zbiór słów. Poznaliśmy także szczegółowo maszynę w wersji deterministycznej i niedeterministycznej oraz jej miarę złożoności czasowej i pamięciowej w każdej z wersji. W tym module zajmiemy się klasyfikacją języków przy pomocy maszyn. W naszych dalszych rozważaniach przyjmujemy model obliczeń w postaci maszyny Turinga o $k$ taśmach.

Klasa złożoności obliczeniowej to zbiór problemów (języków) spełniających określone kryterium. Najbardziej podstawowe kryteria, tzn. czas i pamięć potrzebne do klasyfikacji języka dają nam podstawowe klasy złożoności:

Definicja 1.1 [ $TIME (f (n))$ ]

Poprzez $TIME (f (n))$ oznaczamy zbiór języków $L$ takich, że są akceptowane przez deterministyczną maszynę Turinga $M$ o złożoności czasowej $f (n)$ .

Definicja 1.2 [ $SPACE (f (n))$ ]

Poprzez $SPACE (f (n))$ oznaczamy zbiór języków $L$ takich, że są akceptowane przez deterministyczną maszynę Turinga $M$ o złożoności pamięciowej $f (n)$ .

Stosowne klasy można też zdefiniować dla niedeterministycznych maszyn:

Definicja 1.3 [ $NTIME (f (n))$ ]

Poprzez $NTIME (f (n))$ oznaczamy zbiór języków $L$ takich, że są akceptowane przez niedeterministyczną maszynę Turinga $M$ o złożoności czasowej $f (n)$ .

Definicja 1.4 [ $NSPACE (f (n))$ ]

Poprzez $NSPACE (f (n))$ oznaczamy zbiór języków $L$ takich, że są akceptowane przez niedeterministyczną maszynę Turinga $M$ o złożoności pamięciowej $f (n)$ .

Twierdzenia o liniowym przyspieszaniu i kompresji pamięci

Pierwsze dwa twierdzenia możemy nazwać "teoretycznymi podstawami" notacji $O$ . Pokażemy bowiem, że w obu powyższych definicjach klas funkcja $f (n)$ może być rozpatrywana z dokładnością do stałej, ze względu na specyfikę samego modelu obliczeń. Zostały one udowodnione w latach 60 przez pionierów badań nad klasami złożoności, laureatów nagrody Turinga z roku 1993, Jurisa Hartmanisa i Richarda Stearnsa.

Twierdzenie 2.1 [twierdzenie o liniowym przyspieszaniu]

Jeśli język

L

jest rozpoznawany przez maszynę

M

o złożoności czasowej

f (n)

to może być rozpoznany przez maszynę

M^{'}

o złożoności czasowej

f^{'} (n) = ϵ f (n) + (1 + ϵ) n

, gdzie

ϵ > 0

.

Liniowe przyspieszanie

Dowód

Idea dowodu jest oparta na powiększeniu alfabetu maszyny, a tym samym wielkości "słowa" maszyny oraz liczby jej stanów. Odpowiada to w praktyce podniesieniu technologii wytwarzania komputerów. W animacji Liniowe przyspieszanie przedstawiono schematycznie zamianę 8 komórek pamięci na jedną większą nowej maszyny.

Nasza nowa maszyna o powiększonym alfabecie rozpoczyna działanie od skompresowania słowa wejściowego na drugiej taśmie i zamiany ról taśmy drugiej i wejściowej. Następnie głowica powraca na początek słowa i rozpoczyna obliczenia.

W każdym kroku obliczeń $M^{'}$ odczytuje bieżącą komórkę oraz dwie sąsiednie (na wszystkich taśmach), a następnie symuluje zachowanie $M$ w obszarze tych trzech komórek dzięki zwiększonej stosownie liczbie stanów. Jako efekt następuje modyfikacja bieżącej komórki i komórek sąsiednich oraz stosowne przesunięcie głowicy.

Policzmy, czy taka symulacja rzeczywiście może być opłacalna. Załóżmy, że każda z komórek $M^{'}$ odpowiada $c$ komórkom maszyny $M$ , gdzie $c$ - stopień kompresji, który ostatecznie ustalimy na końcu (będzie on oczywiście zależał od $ϵ$ i $M$ ). Alfabet nowej maszyny $Γ^{'}$ to alfabet starej maszyny $Γ$ powiększony o symbole postaci $Γ^{c}$ , które zapewniają nam zapis $c$ symboli $M$ w jednym symbolu $M^{'}$ .

W pierwszym etapie $M^{'}$ musi dokonać kompresji, czyli odczytać $c$ symboli i zapisać 1 symbol skompresowany. Do tego celu wystarczy jej istnienie około $| Γ^{c} |$ dodatkowych stanów. W ostatnim skompresowanym symbolu dokładamy symbole puste dla wyrównania. Czas działania tego etapu to około $n + ⌈ n / c ⌉$ (odczyt związany z kompresją + powrót).

W drugim etapie dokonujemy symulacji. Najpierw odczytujemy "obszar trzech" komórek na każdej taśmie co zajmuje 4 kroki $M^{'}$ (rysunek Obszar trzech).

Zapamiętujemy odczyt dzięki stosownemu powiększeniu liczby stanów $M^{'}$ , które wykonujemy podobnie jak przy kompresji. Tym razem nowy zbiór stanów powiększamy o około $Γ^{3 c}$ (trzeba jeszcze pamiętać o zapamiętaniu pozycji każdej głowic wewnątrz obszarów, te szczegóły techniczne pomijamy). W tym momencie mamy pełną wiedzę kiedy maszyna $M$ opuści "obszar trzech" i jak zostanie on zmodyfikowany. Oczywiście jeśli w tym czasie maszyna $M$ kończy działanie, to tak robi również $M^{'}$ . W przeciwnym wypadku "obszar trzech" jest modyfikowany kolejnymi 4 ruchami $M^{'}$ i cykl rozpoczyna się od nowa. Wiemy jednak, że aby $M$ opuściła obszar trzech komórek $M^{'}$ to musi wykonać przynajmniej $c$ ruchów. Przyspieszyliśmy zatem działanie przynajmniej o czynnik $c / 8$ .

Podsumowując koszt czasowy to $f^{'} (n) = n + ⌈ n / c ⌉ + ⌈ 8 f (n) / c ⌉ < (1 + ϵ) n + ϵ f (n)$ , jeśli $c = ⌈ 8 / ϵ ⌉$ , dla odpowiednio dużych $n$ (dla małych $n$ można stosownie rozbudować maszynę).

Twierdzenie nie ma zastosowania dla subliniowych funkcji złożoności, jednak maszyny, które nie czytają całego wejścia wydają się mało interesujące. W przypadku liniowej funkcji złożoności oznacza to, że stała może być dowolnie bliska 1.

Analogicznie twierdzenie zachodzi dla złożoności pamięciowej:

Ćwiczenie 2.2 [twierdzenie o liniowej kompresji pamięci]

Jeśli język $L$ jest rozpoznawany przez maszynę $M$ o złożoności pamięciowej $f (n)$ to może być rozpoznany przez maszynę $M^{'}$ o złożoności pamięciowej $f^{'} (n) = ϵ f (n)$ , gdzie $ϵ > 0$ .

Wskazówka

Rozwiązanie

Dowód przebiega dokładnie tak samo jeśli chodzi o ideę. Wystarczy tylko dokonać obliczenia zużycia pamięci. Każda komórka nowej maszyny

M^{'}

pamięta

c

symboli maszyny

M

, więc koszt pamięciowy to

f^{'} (n) = ⌈ f (n) / c ⌉ < ϵ f (n)

, jeśli

c = ⌈ 1 / ϵ ⌉

,

dla odpowiednio dużych $n$ (ponownie dla małych $n$ można stosownie rozbudować maszynę).

Na koniec ciekawostka dotycząca przyspieszania maszyn. Mając dany język $L$ poszukujemy najszybszego algorytmu, który go akceptuje. Okazuje się, że jest język, dla którego nie istnieje algorytm asymptotycznie najszybszy! Autorem tego przeczącego intuicji twierdzenia jest Manuel Blum, laureat nagrody Turinga z roku 1995.

Twierdzenie 2.3 [twierdzenie Bluma o przyspieszaniu]

Istnieje język $L$ , taki, że jeśli jest akceptowany przez maszynę Turinga o złożoności czasowej $f (n)$ , to jest również akceptowany, przez maszynę Turinga o złożoności czasowej $log (f (n))$ .

Relacje między klasami, twierdzenie Savitcha

Teraz jesteśmy gotowi do wprowadzenia podstawowych klas złożoności, w których funkcje są wyłącznie asymptotyczne:

Klasa $P = ⋃_{j > 0} TIME (n^{j})$ , to klasa tych języków, które mogą być akceptowane w deterministycznym czasie wielomianowym,
Klasa $NP = ⋃_{j > 0} NTIME (n^{j})$ , to klasa tych języków, które mogą być akceptowane w niedeterministycznym czasie wielomianowym,
Klasa $EXP = ⋃_{j > 0} TIME (2^{n^{j}})$ , to klasa tych języków, które mogą być akceptowane w deterministycznym czasie wykładniczym,
Klasa $NEXP = ⋃_{j > 0} NTIME (2^{n^{j}})$ , to klasa tych języków, które mogą być akceptowane w niedeterministycznym czasie wykładniczym.

dla klas pamięciowych:

Klasa $L = SPACE ($ log $n)$ , to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci logarytmicznej,
Klasa $NL = NSPACE ($ log $n)$ , to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci logarytmicznej,
Klasa $PSPACE = ⋃_{j > 0} SPACE (n^{j})$ , to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci wielomianowej,
Klasa $NPSPACE = ⋃_{j > 0} NSPACE (n^{j})$ , to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci wielomianowej,
Klasa $EXPSPACE = ⋃_{j > 0} SPACE (2^{n^{j}})$ , to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci wykładniczej,
Klasa $NEXPSPACE = ⋃_{j > 0} NSPACE (2^{n^{j}})$ , to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci wykładniczej.

Teraz zajmiemy się relacjami pomiędzy poszczególnymi klasami złożoności. Najbardziej podstawowe zależności, łączące czas, pamięć i niedeterminizm to:

$TIME (f (n)) \subseteq NTIME (f (n))$ , gdyż z definicji, każda maszyna deterministyczna jest maszyną niedeterministyczną,
$SPACE (f (n)) \subseteq NSPACE (f (n))$ , jak wyżej,
$TIME (f (n)) \subseteq SPACE (f (n))$ , gdyż maszyna nie może zapisać więcej komórek niż wynosi jej czas działania,
$NTIME (f (n)) \subseteq NSPACE (f (n))$ , jak wyżej,
$NTIME (f (n)) \subseteq TIME (c^{f (n)})$ , na podstawie twierdzenia z modułu pierwszego o symulacji

maszyny niedeterministycznej przez maszynę deterministyczną.

Aby powiedzieć więcej o relacjach pomiędzy klasami musimy narzucić pewne rozsądne ograniczenie na funkcję złożoności $f (n)$ . Powiemy, że $f (n)$ jest konstruowalna pamięciowo, gdy $f (n) ⩾ log n$ oraz istnieje deterministyczna maszyna Turinga, która mając na wejściu $n$ zapisane unarnie potrafi zużyć dokładnie $f (n)$ komórek pamięci i zatrzymać się.

Zawężamy się w ten sposób do funkcji $f (n) ⩾ log n$ , lecz mniejszych złożoności nie będziemy tutaj rozważać (mimo, iż można). Warto dodać, że jeśli maszyna działa w pamięci $o (log log n)$ to działa w pamięci stałej.

Okazuje się, że większość interesujących funkcji spełnia tą własność. Jest to także własność zamknięta ze względu na dodawanie, mnożenie i potęgowanie.

Ćwiczenie 3.1

Pokaż, że funkcje $⌈ log n ⌉$ , $n^{k}$ , $2^{n}$ są konstruowalne pamięciowo.

Wskazówka

Rozwiązanie

Dowód konstruowalności pamięciowej funkcji

$⌈ log n ⌉$ opieramy na implementacji klasycznego licznika binarnego. Długość zapisu liczby binarnej $n$ to właśnie $⌈ log n ⌉$ . Dla funkcji wielomianowej wykonujemy serię prostych działań arytmetycznych polegających na mnożeniu i dodawaniu liczb naturalnych zapisanych binarnie. W przypadku funkcji wykładniczej wystarczy zaprogramować maszynę, aby $n$ razy dokonała podwojenia liczby zużytych komórek.

Poniżej przedstawiamy twierdzenie, które zachodzi, jeśli nie narzucimy dodatkowego warunku na funkcję złożoności. Wprowadzając go, chcemy uniknąć podobnych sytuacji:

Twierdzenie 3.2 [twierdzenie o luce]

Istnieje funkcja rekurencyjna

f (n)

taka, że

TIME (f (n)) = TIME (2^{f (n)})

.

Dowód

Przedstawimy bardzo specyficzną definicję funkcji $f (n)$ , dla której każda maszyna na słowie o długości $n$ działa w czasie co najwyżej $f (n)$ lub działa przynajmniej $2^{f (n)} + 1$ kroków lub pętli się. W ten sposób pokażemy stosowną równość klas. Dowód opiera się na bardzo użytecznej i często stosowanej technice przekątniowej.

Będziemy rozważać wszystkie możliwe maszyny w pewnej ustalonej kolejności $M_{1}, M_{2}, \dots$ wynikającej np. z leksykograficznego porządku na ich kodach zdefiniowanych w module pierwszym. Ponieważ każda maszyna może być opisana skończonym słowem, więc wygenerowanie takiego ciągu wszystkich maszyn jest wykonalne.

Zdefiniujmy relację binarną $P (i, k)$ w ten sposób, by była spełniona, gdy każda maszyna od $1$ do $i$ działając na dowolnym słowie o długości $i$ działa w czasie co najwyżej $k$ lub działa przynajmniej $2^{k} + 1$ kroków lub pętli się. Tą relację jesteśmy w stanie obliczyć poprzez stosowną symulację maszyn $M_{1}, \dots, M_{i}$ na wszystkich słowach długości $i$ przez co najwyżej $2^{k} + 1$ kroków (oczywiście jest to dosyć czasochłonne), tym samym ewentualne pętlenie się maszyn nie stanowi przeszkody.

Teraz jesteśmy gotowi do zdefiniowania $f (n)$ . Ustalmy $n$ . Zauważmy, że $P (n, k)$ musi być prawdziwa dla pewnego $k$ . Dzieje się tak dlatego, gdyż wraz ze wzrostem $k$ zmieniamy zabroniony obszar czasu działania maszyn od $1$ do $n$ . Liczba słów które testujemy jest jednak ograniczona - są to wszystkie słowa o długości dokładnie $n$ dla tych maszyn. Aby $P (n, k)$ nie było prawdą to czas działania maszyny na słowie musi trafić do obszaru zabronionego, co wobec ustalonej liczby słów i zwiększania $k$ spowoduje, że $P (n, k)$ w końcu będzie prawdą. Definiujemy wartość $f (n)$ jako najmniejsze takie $k$ .

Weźmy dowolny język $L \in TIME (2^{f (n)})$ . Jest on akceptowany przez maszynę, którą oznaczmy $M_{j}$ (w naszym porządku ustalonym w pierwszej części). Maszyna ma złożoność $2^{f (n)}$ . Weźmy dowolne słowo o długości $l ⩾ j$ . Wiemy, że $P (l, f (l))$ jest spełnione, a tym samym maszyna $M_{j}$ działa w czasie co najwyżej $f (l)$ (bo więcej niż $2^{f (l)}$ nie może z definicji klasy). Zatem $L \in TIME (f (n))$ .

Pominęliśmy działanie na słowach krótszych niż $j$ , jednakże jest to stała liczba słów, które łatwo zaakceptować w czasie rzędu ich długości po prostu wbudowując ich przynależność do $L$ w maszynę.

W literaturze rozważa się wiele wersji "normujących" dopuszczalne funkcji złożoności, np. właściwie funkcje złożoności lub funkcje uczciwe. Różnice między nimi są dosyć techniczne. Przyjmijmy zatem, że funkcje złożoności $f (n)$ są konstruowalne pamięciowo.

Przeanalizujmy teraz możliwe konfiguracje maszyny Turinga $M$ , które tworzą tzw. graf przejść maszyny:

Ćwiczenie 3.3

W jak wielu konfiguracjach może znaleźć się maszyna Turinga o złożoności pamięciowej $f (n)$ (konstruowalnej pamięciowo) przeprowadzając obliczenie na słowie o długości $n$ ?

Wskazówka

Rozwiązanie

Liczba możliwych konfiguracji to oczywiście iloczyn:

liczby stanów $| Q |$ ,
położeń głowic na wszystkich taśmach, jest rzędu $f (n)^{k}$ jednak nie mniej niż $n$ (dokładny wynik zależy od przyjętych wyróżnień taśmy wejściowej i wyjściowej),
zawartości taśm, czyli $| Γ |^{k f (n)}$ .

Razem możemy to ograniczyć przez $c^{f (n)}$ , dla pewnego $c$ zależnego tylko od maszyny oraz korzystając z założenia, że $f (n) ⩾ log n$ , gdyż jest konstruowalna pamięciowo.

Teraz jesteśmy gotowi do wypowiedzenia kolejnych interesujących relacji pomiędzy wprowadzonymi klasami:

$SPACE (f (n)) \subseteq TIME (c^{f (n)})$ , ze względu na fakt, iż liczba możliwych konfiguracji maszyny o złożoności pamięciowej $f (n)$ ,

co pokazaliśmy przed chwilą wynosi $c^{f (n)}$ , zatem maszyna, która się nie pętli może zostać zasymulowana przez maszynę działającą co najwyżej tak długo. W przeciwnym wypadku wpadła by w nieskończoną pętlę.

$NTIME (f (n)) \subseteq SPACE (f (n))$ , gdyż maszyna deterministyczna może zasymulować działanie maszyny niedeterministycznej.

Wystarczy wygenerować po kolei każdy z ciągów $f (n)$ niedeterministycznych wyborów (tu korzystamy z pamięciowej konstruowalności), których musi ona dokonać w trakcie obliczeń. Następnie dokonujemy już deterministycznej symulacji obliczeń przez $f (n)$ kroków. Wszystkie te operacje można dokonać w dostępnej pamięci $f (n)$ , gdyż każdy z ciągów niedeterministycznych wyborów możemy symulować w tej samej pamięci,

$NSPACE (f (n)) \subseteq TIME (c^{f (n)})$ , ponownie opierając się na symulacji maszyny.

Jak poprzednio liczba wszystkich konfiguracji wynosi $c^{f (n)}$ , jednak tym razem przejścia pomiędzy poszczególnymi konfiguracjami tworzą graf. Wystarczy jednak obliczyć, czy istnieje ścieżka od konfiguracji początkowej do konfiguracji końcowej, co może być obliczone w czasie wielomianowym ze względu na rozmiar grafu, a zatem w czasie asymptotycznym $c^{f (n)}$ .

Dzięki powyższym relacjom możemy wypisać kilka podstawowych zależności pomiędzy wprowadzonymi klasami:

Ćwiczenie 3.4

Uzasadnij każdą z poniższych relacji:

$L \subseteq NL \subseteq P \subseteq NP \subseteq PSPACE$
$PSPACE \subseteq NPSPACE \subseteq EXP \subseteq NEXP \subseteq EXPSPACE \subseteq NEXPSPACE$

Wskazówka

Rozwiązanie

Wszystkie zawierania pochodzą z wypisanych wcześniej ogólnych zależności. Nietrywialne, to:

$NL \subseteq P$ , korzystamy z faktu, że $NSPACE (f (n)) \subseteq TIME (c^{f (n)})$ , w tym wypadku mamy bowiem $c^{log n} = n^{k}$ ,
$NPSPACE \subseteq EXP$ , również korzystamy z faktu, że $NSPACE (f (n)) \subseteq TIME (c^{f (n)})$ , w tym wypadku mamy bowiem $c^{n^{k}} = 2^{n^{k^{'}}}$ .

Przyjrzyjmy się bliżej pierwszej serii relacji z poprzedniego ćwiczenia i zobrazujmy ją w animacji Relacje pomiędzy podstawowymi klasami.

|size=small</flashwrap><div.thumbcaption style="width:250;">Relacje pomiędzy podstawowymi klasami

L \subseteq NL \subseteq P \subseteq NP \subseteq PSPACE

W następnej części z twierdzenia o hierarchii pamięciowej dowiemy się, że $L ⊊ PSPACE$ . Tym samym wiemy, że pierwszy i ostatni element są różne. Jedną z najbardziej fascynujących rzeczy w teorii złożoności jest fakt, że przynajmniej jedno z czterech powyższych zawierań musi być ścisłe, jednakże o żadnym z nich tego nie wiadomo! Najsłynniejszy fragment to oczywiście pytanie o zawieranie pomiędzy P i NP.

Ostatnią i najciekawszą relacją pomiędzy klasami jest ta odkryta przez Savitcha, mówiąca o niewielkiej przewadze niedeterministycznej złożoności pamięciowej. Przypomnijmy, że do tej pory wiemy poprzez połączenie dwóch wymienionych własności, że $NSPACE (f (n)) \subseteq SPACE (c^{f (n)})$ . Okazuje się, że zachodzi twierdzenie dużo silniejsze:

Twierdzenie 3.5 [twierdzenie Savitcha]

Jeśli $f (n)$ jest konstruowalna pamięciowo, to $NSPACE (f (n)) \subseteq SPACE (f^{2} (n))$ .

Dowód

Wspominaliśmy już o tym, że kluczowym elementem symulacji maszyny niedeterministycznej jest sprawdzanie czy istnieje ścieżka od konfiguracji początkowej do końcowej maszyny. Problem sprawdzania czy dwa wierzchołki w grafie są połączone ścieżką jest znany jako REACHABILITY. Savitch udowodnił, że REACHABILITY należy do $S P A C E$ ( ${log}^{2} n$ ), gdzie $n$ to rozmiar grafu. W naszym wypadku rozmiar grafu to liczba konfiguracji, czyli $c^{f (n)}$ , zatem REACHABILITY wymaga czasu ${log}^{2} (c^{f (n)}) = O (f (n))^{2}$ , co da nam tezę. Od tej pory przyjmijmy, że graf ma $n$ wierzchołków.

Wprowadźmy pomocniczą funkcję $PATH (x, y, i)$ która ma zwrócić 1, gdy istnieje ścieżka od $x$ do $y$ w grafie zawierająca co najwyżej $i$ wierzchołków. Nasze pytanie możemy przeformułować jako $P A T H (b, e, n)$ , gdzie $b$ to stan początkowy, $e$ końcowy, a $n$ to maksymalna długość ścieżki w grafie konfiguracji, czyli liczba wszystkich wierzchołków.

Obliczymy $PATH (x, y, i)$ w sposób rekurencyjny. Jeśli $i = 1$ to sprawdzamy bezpośrednie przejście od konfiguracji $x$ do $y$ . W przeciwnym wypadku najpierw wybieramy dowolny wierzchołek jako kandydata na wierzchołek pośredni na ścieżce pomiędzy $x$ i $y$ , który oznaczmy przez $t$ (rysunek Wierzchołek pośredni).

Potem wywołujemy rekurencyjnie $PATH (x, t, i / 2)$ oraz $PATH (t, y, i / 2)$ . Jeśli obie ścieżki istnieją to zwracamy 1, w przeciwnym wypadku próbujemy kolejny wierzchołek $t$ . Nie musimy się martwić o czas, tylko pamięć, więc policzmy ile jest nam potrzebne.

Głębokość rekurencji wyniesie $log n$ , ze względu na fakt iż na każdym poziomie zmniejszamy długość o czynnik 2. Aby zapamiętać wywołanie rekurencyjne (stos rekurencyjny) potrzebujemy pamiętać $x$ , $y$ , bieżące $t$ oraz $i$ . Wszystkie te liczby w zapisie binarnym potrzebują $log n$ pamięci. Razem potrzebujemy $O ({log}^{2} n)$ pamięci.

Na podstawie twierdzenia Savitcha wiemy, że niektóre z poznanych klas są sobie równe:

PSPACE = NPSPACE,
EXPSPACE = NEXPSPACE.

czyli, że niedeterminizm w złożoności pamięciowej dla większych funkcji nic nie daje. Dla klas złożoności czasowej takiej wiedzy nie posiadamy!

Dopełnienia klas

W tym rozdziale przyjrzymy się dopełnieniom języków i klas. Jeśli $L$ jest językiem to przez $\overline{L} = \sum^{*} ∖ L$ oznaczamy jego dopełnienie. W przypadku problemów decyzyjnych dopełnienie (ang. COMPLEMENT) to problem decyzyjny, w którym odpowiedzi są odwrócone.

Jeśli rozważymy SAT, w którym pytamy czy formuła może zostać spełniona, to jego dopełnienie to SAT COMPLEMENT. Jest to problem bardzo blisko spokrewniony z TAUTOLOGY, w którym pytamy czy każde wartościowanie formuły $ϕ$ ją spełnia. SAT COMPLEMENT to pytanie, czy formuła nie ma wartościowań spełniających, co jest równoważne temu, że $\neg ϕ$ jest formułą zawsze spełnioną, czyli jest tautologią logiczną.

COMPLEMENT nie jest ściśle dopełnieniem języka, gdyż $\overline{S A T}$ zawiera także wszystkie słowa, które nie są poprawnymi opisami formuł. Te słowa nie stanowią jednak problemu w rozpoznawaniu.

Zdefiniujemy teraz pojęcie dopełnienia klasy złożoności. Przypomnijmy, że klasy złożoności składają się z języków. Jeśli $C$ jest dowolną klasą złożoności to przez $co C$ oznaczamy jej dopełnienie, które jest złożone z dopełnień języków z klasy $C$ .

Zauważmy od razu, że jeśli $C$ jest klasą deterministyczną, to $co C = C$ ze względu na fakt, iż maszyna deterministyczna, która akceptuje język $L \in C$ po zamianie rolami stanu akceptującego i odrzucającego stanie się maszyną akceptującą język $\overline{L}$ .

W module dotyczącym pamięci logarytmicznej dowiemy się, że klasy niedeterministycznej złożoności pamięciowej również zamknięte są na dopełnienia, natomiast w przypadku klas niedeterministycznych złożoności czasowej nie wiemy jakie są relacje pomiędzy nimi i jest to problem otwarty.

Twierdzenia o hierarchii czasowej i pamięciowej

W tej części poznamy dwa ważne twierdzenia, które wprowadzają pojęcia hierarchii czasowej i pamięciowej, tzn. pokażemy, że większe złożoności rzeczywiście istotnie pozwalają akceptować więcej języków.

Twierdzenie 3.6 [twierdzenie o hierarchii pamięciowej]

Jeśli $f (n)$ jest konstruowalna pamięciowo oraz $g (n) \in o (f (n))$ (czyli rośnie asymptotycznie wolniej) to $SPACE (g (n)) ⊊ SPACE (f (n))$ .

Dowód

Pokażemy, że istnieje język $L \in SPACE (f (n))$ taki, że $L \notin SPACE (g (n))$ . Aby zapewnić pierwszy warunek, skonstruujemy maszynę $M$ dla $L$ , która ma złożoność pamięciową $f (n)$ . Drugi warunek zapewnimy pokazując, że żadna z maszyn o złożoności pamięciowej $g (n)$ nie akceptuje $L$ .

Maszyna $M$ działa następująco. Gdy na wejściu dostanie słowo o długości $n$ to w pierwszym etapie oznakowuje $f (n)$ komórek pamięci na każdej z taśm. Będziemy bowiem symulować inne maszyny i chcemy się upewnić, że nie zużywają one więcej niż $f (n)$ pamięci. Możemy to zrobić dzięki konstruowalności pamięciowej $f (n)$ .

Teraz następuje część przekątniowa (rysunek Maszyna przekątniowa).

W drugim etapie maszyna $M$ interpretuje słowo $x$ z wejścia jako kod maszyny $M^{'}$ . Maszyna $M$ odrzuca słowa, które nie są poprawnymi kodami. Gdy kod jest poprawny, to rozpoczyna się symulacja $M^{'}$ na tym samym słowie $x$ . Jeśli symulacja przekroczy oznakowaną pamięć $f (n)$ to maszyna $M$ również odrzuca słowo $x$ . Jeśli maszyna $M^{'}$ zaakceptuje $x$ to maszyna $M$ odrzuca $x$ i jeśli $M^{'}$ odrzuca $x$ to $M$ je akceptuje.

Maszyna $M$ ma złożoność pamięciową $f (n)$ , więc $L = L (M) \in SPACE (f (n))$ . Zastanówmy się, czy język $L$ należy do klasy $SPACE (g (n))$ . Wtedy jest akceptowany przez maszynę $M^{'}$ o złożoności $g (n)$ . Zastanówmy się co dzieje się, gdy $M^{'}$ dostanie na wejściu swój kod $< M^{'} >$ . Ponieważ $M^{'}$ akceptuje język w czasie $g (n)$ , więc i na słowie $x$ działa w takim czasie. Załóżmy, że odrzuca $x$ . Wtedy maszyna $M$ zaakceptuje $x$ , gdyż symulacja którą ona przeprowadza, tzn. działanie $M^{'}$ na $x$ może zostać przeprowadzona, jako że $g (n)$ jest asymptotycznie mniejsze niż $f (n)$ (pomijamy szczegóły techniczne, które pojawią się dla małych $n$ ). Analogicznie, gdy $M^{'}$ akceptuje $x$ to $M$ je odrzuca, czyli $M^{'}$ nie może akceptować $L$ , gdyż myli się na $x = M^{'}$ .

Otrzymujemy sprzeczność, stąd $L \notin SPACE (g (n))$ .

A teraz pora na analogiczne twierdzenie o hierarchii czasowej. Potrzebne jest nam do niego dodatkowe ograniczenie na funkcję złożoności. Powiemy, że $f (n)$ jest konstruowalna czasowo, gdy $f (n) ⩾ n log n$ oraz istnieje deterministyczna maszyna Turinga, która mając na wejściu $n$ zapisane unarnie potrafi działać przez dokładnie $f (n)$ kroków i zatrzymać się. Również w tym wypadku większość znanych funkcji jest konstruowalna.

Twierdzenie 3.7 [twierdzenie o hierarchii czasowej]

Jeśli $f (n)$ jest konstruowalna czasowo oraz $g (n) \in o (f (n) / log f (n))$ to $TIME (g (n)) ⊊ TIME (f (n))$ .

Dowód jest przedmiotem ćwiczenia końcowego. Teraz możemy wyciągnąć kilka ważnych wniosków o silnym zawieraniu się klas złożoności:

$SPACE (n^{ϵ_{1}}) ⊊ SPACE (n^{ϵ_{2}})$ , gdy $0 ⩽ ϵ_{1} < ϵ_{2}$ , z własności funkcji wielomianowej,
$TIME (n^{ϵ_{1}}) ⊊ TIME (n^{ϵ_{2}})$ , gdy $1 ⩽ ϵ_{1} < ϵ_{2}$ , jak wyżej,
$L ⊊ PSPACE$ , gdyż logarytm rośnie wolniej niż funkcja wielomianowa,
$P ⊊ EXP$ , korzystamy z własności, że każdy wielomian rośnie wolniej niż funkcja subwykładnicza $n^{log n}$ a ta z kolei rośnie wolniej, niż każda funkcja wykładnicza.
$PSPACE ⊊ EXPSPACE$ , jak wyżej.

Widzimy zatem, że klasa P, pojmowana jako zbiór praktycznie rozwiązywalnych problemów również podlega hierarchii. Istnieją w niej języki które są akceptowane w czasie $n^{10000}$ natomiast w $n^{9999}$ już nie. To sprawia, że należy patrzeć na praktyczność klasy P z pewną ostrożnością.

Ćwiczenia dodatkowe

Ćwiczenie 4.1

Udowodnij twierdzenie o hierarchii czasowej: Jeśli $f (n)$ jest konstruowalna czasowo oraz $g (n) \in o (f (n) / log f (n))$ to $TIME (g (n)) ⊊ TIME (f (n))$ .

Wskazówka

Rozwiązanie

Jak w dowodzie twierdzenia o hierarchii pamięciowej skonstruujemy maszynę

M

, której język

L = L (M)

należy do $TIME (f (n))$ , ale nie należy do $TIME (g (n))$ .

Konstruujemy $M$ tak, że bierze $x$ z wejścia i traktuje jako kod maszyny. Następnie symuluje jej działanie nie jak poprzednio w pamięci $f (n)$ lecz w czasie $f (n)$ . Aby jednak dokonać takiej symulacji maszyna $M$ musi zliczać liczbę wykonanych kroków symulacji. Symulacja każdego kroku zajmuje teraz $log (f (n))$ potrzebnych do zaimplementowania licznika. Stąd można zasymulować każdą maszynę o złożoności asymptotycznie mniejszej niż $f (n) log f (n)$ a tym samym wykazać przy pomocy przekątniowej metody, że język $M$ jest różny od języka każdej z tych maszyn.

Ćwiczenie 4.2

Udowodnij następujące fakty:

$NTIME (n) ⊊ PSPACE$
$TIME (2^{n}) = TIME (2^{n + 1})$
$TIME (2^{n}) ⊊ TIME (2^{2 n})$

Wskazówka

Rozwiązanie

Ad. 1: Wiemy, że $NTIME (n) \subseteq SPACE (n)$ . Następnie na podstawie twierdzenia o hierarchii pamięciowej $SPACE (n) ⊊ PSPACE$ , co kończy dowód.

Ad. 2: Oczywiście $TIME (2^{n}) \subseteq TIME (2^{n + 1})$ . Weźmy teraz dowolny język $L$ należący do klasy $TIME (2^{n + 1})$ . Istnieje zatem maszyna działająca w czasie $2^{n + 1}$ . Z twierdzenia o przyspieszaniu wiemy, że istnieje inna maszyna $M^{'}$ akceptująca ten sam język $L$ , ale działająca w czasie $2^{n + 1} / 4$ , gdy zastosujemy $ϵ = 1 / 4$ (czynnik liniowy obok funkcji wykładniczej jest nieistotny). Lecz $2^{n + 1} / 4 = 2^{n} / 2$ , a zatem $L$ należy do $TIME (2^{n})$ co dowodzi tezy.

Ad. 3: Zastosujemy twierdzenie o hierarchii czasowej dla funkcji $f (n) = 2^{2 n}$ oraz $g (n) = 2^{n}$ . Musimy tylko wykazać, że funkcje spełniają założenia twierdzenia. Mamy jednak $f (n) / log (f (n)) = 2^{2 n} / 2 n = (2^{n} / 2 n) 2^{n}$ zatem dominuje asymptotycznie $2^{n}$ co kończy dowód.

@@ Linia 266: / Linia 266: @@
 Wspominaliśmy już o tym, że kluczowym elementem symulacji maszyny niedeterministycznej jest sprawdzanie czy istnieje ścieżka od konfiguracji początkowej do końcowej maszyny.
 Problem sprawdzania czy dwa wierzchołki w grafie są połączone ścieżką jest znany jako REACHABILITY. Savitch udowodnił, że
-REACHABILITY należy do <math>SPACE </math>(<math>\text{log}^2n</math>), gdzie <math>n</math> to rozmiar grafu.
+REACHABILITY należy do <math>SPACE</math>(<math>\text{log}^2n</math>), gdzie <math>n</math> to rozmiar grafu.
 W naszym wypadku rozmiar grafu to liczba konfiguracji, czyli <math>c^{f(n)}</math>, zatem
 REACHABILITY wymaga czasu <math>\text{log}^2(c^{f(n)})=O(f(n))^2</math>, co da nam tezę.
@@ Linia 352: / Linia 352: @@
 Ponieważ <math>M'</math> akceptuje język w czasie <math>g(n)</math>, więc i na słowie <math>x</math> działa w takim czasie. Załóżmy, że
 odrzuca <math>x</math>. Wtedy maszyna <math>M</math> zaakceptuje <math>x</math>, gdyż symulacja którą ona przeprowadza, tzn. działanie <math>M'</math> na <math>x</math>
-może zostać przeprowadzona, jako że <math>g(n) </math> jest asymptotycznie mniejsze niż <math>f(n) </math> (pomijamy szczegóły techniczne, które pojawią się dla małych <math>n </math>).
+może zostać przeprowadzona, jako że <math>g(n)</math> jest asymptotycznie mniejsze niż <math>f(n)</math> (pomijamy szczegóły techniczne, które pojawią się dla małych <math>n</math>).
-Analogicznie, gdy <math>M' </math> akceptuje <math>x </math> to <math>M</math> je odrzuca, czyli <math>M' </math> nie może akceptować <math>L </math>, gdyż myli się na <math>x=M' </math>.
+Analogicznie, gdy <math>M'</math> akceptuje <math>x</math> to <math>M</math> je odrzuca, czyli <math>M'</math> nie może akceptować <math>L</math>, gdyż myli się na <math>x=M'</math>.
 Otrzymujemy sprzeczność, stąd <math>L \notin \text{SPACE}(g(n))</math>.

Złożoność obliczeniowa/Wykład 3: Klasy złożoności obliczeniowej: Różnice pomiędzy wersjami

Aktualna wersja na dzień 11:03, 5 wrz 2023

Spis treści

Klasy złożoności czasowej i pamięciowej

Twierdzenia o liniowym przyspieszaniu i kompresji pamięci

Relacje między klasami, twierdzenie Savitcha

Dopełnienia klas

Twierdzenia o hierarchii czasowej i pamięciowej

Ćwiczenia dodatkowe

Testy końcowe

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia