Złożoność obliczeniowa/Klasy L, NL i coNL

Z Studia Informatyczne
Wersja z dnia 06:43, 27 lip 2006 autorstwa Ak (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

\documentclass[12pt]{article}

\usepackage{polski}

\usepackage[cp1250]{inputenc} \usepackage{amsfonts} \usepackage{amsmath} \usepackage{amssymb} \usepackage{fancyhdr} \usepackage{graphicx} \usepackage{listings} \usepackage{pstricks} \usepackage{algorithm} \usepackage{algorithmic}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% \addtolength{\textheight}{0.5cm} % \addtolength{\textwidth}{0.8cm} % \addtolength{\oddsidemargin}{ -0.4cm} % \addtolength{\evensidemargin}{ -0.4cm} % \setlength{\unitlength}{1mm} % \headheight 14.6pt %

\pagestyle{fancy}

\renewcommand{\headrulewidth}{0.5 pt} \renewcommand{\sectionmark}[1]{\markboth{\textbf{\thesection\ #1}}{}} \fancyhf{} \lhead{\leftmark} \rhead{\thepage} %\headheight{14.6pt}

\newtheorem{theorem}{Theorem}[section] \newtheorem{lemma}[theorem]{Lemma} \newtheorem{tw}[theorem]{Twierdzenie} \newtheorem{definition}[theorem]{Definicja} \newtheorem{example}[theorem]{Przykład} \newtheorem{EX}[theorem]{Ćwiczenie} \newtheorem{observation}[theorem]{Observation}

\newenvironment{proof}{\noindent \textit{Dowód: }}{\hfill$\square$} \newenvironment{hint}{\noindent \textit{Wskazówka: }}{} \newenvironment{sol}{\noindent \textit{Rozwiązanie: }}{}

\renewcommand{\encodingdefault}{T1}

\newcommand{\wciecie}{\hspace*{0.5cm}} \newcommand{\insertpicture}[2]{\vspace{1cm}

                               \begin{center}
                                   % \noindent \makebox[\textwidth][c]{\includegraphics{#1}} %
                                   \includegraphics[width=10cm]{#1.jpg}\\
                                   #2
                               \end{center}
                               \vspace{1cm}
                             }


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

\begin{document}

\thispagestyle{empty}

{\Huge \bf Informacje}

\bigskip \bigskip \bigskip \bigskip \bigskip


\begin{center}

\begin{tabular}{|l|l|}

 \hline
 Przedmiot & \textbf{Złożoność obliczeniowa} \\
 \hline
 Moduł &  \textbf{13} \\
 \hline
 Tytuł &  \textbf{Pamięć logarytmiczna i hierarchia wielomianowa} \\
 \hline
 Opracowanie &  \textbf{Przemysław Broniek} \\
 \hline

\end{tabular}

\end{center}

\bigskip \bigskip \bigskip \bigskip \bigskip

{\Huge \bf Syllabus}

\bigskip \bigskip \bigskip \bigskip \bigskip

Pamięć logarytmiczna i hierarchia wielomianowa \begin{itemize} \item klasy L, NL i coNL, \item Twierdzenie Immermana-Szelepcsényi'ego, \item klasy coNP i DP, \item maszyny alternujące, \item hierarchia wielomianowa. \end{itemize}

\newpage

\section{Klasy L, NL i coNL}

W tym rozdziale zajmiemy się klasami złożoności, w których dajemy bardzo restrykcyjne wymagania odnośnie zużywanej pamięci, a mianowicie ograniczamy jej ilość przez funkcję logarytmiczną. Przypomnijmy:

\begin{itemize} \item Klasa L = SPACE(\textnormal{log}$n$), to klasa tych języków, które mogą być akceptowane w deterministycznej pamięci logarytmicznej, \item Klasa NL = NSPACE(\textnormal{log}$n$), to klasa tych języków, które mogą być akceptowane w niedeterministycznej pamięci logarytmicznej, \item Klasa \textnormal{co}NL = \textnormal{co}NSPACE(\textnormal{log}$n$), to dopełnienie klasy tych języków, które mogą być akceptowane w niedeterministycznej pamięci logarytmicznej, \end{itemize}

Na podstawie następnego rozdziału i twierdzenia Immermana-Szelepcsényi'ego dowiemy się, że $\textnormal{NL=coNL}$. Natomiast pytanie czy L=NL pozostaje wciąż problemem otwartym.

\bigskip

Przyjrzymy się teraz problemom zupełnym w klasie NL. Zupełność definiujemy przy pomocy redukcji w pamięci logarytmicznej, gdyż jak wiemy, wszystkie z powyższych klas są zawarte w klasie P (chociaż nie wiemy, czy ściśle). Dopuszczenie redukcji wielomianowej zniwelowałoby jakiekolwiek różnice pomiędzy językami, gdyż sama redukcja miałaby moc obliczeniową pozwalającą rozwiązać wszystkie problemy z tych klas. Poniższy problem okazuje się być NL-zupełny:

\begin{definition} Problem REACHABILITY:\\ Wejście: Graf skierowany $G$ oraz wierzchołki $x$ i $y$.\\ Wyjście: Czy istnieje ścieżka od $x$ do $y$ w $G$? \end{definition}

\begin{EX} Pokaż, że problem REACHABILITY jest NL-zupełny. \end{EX}

\begin{hint} Zwróć uwagę na fakt, że problem REACHABILITY jest związany z wykonywaniem obliczeń przez maszynę Turinga. \end{hint}

\begin{sol} Pokażmy najpierw, że problem REACHABILITY należy do NL. Użyjemy dwóch zmiennych $v$ - wierzchołek bieżący, oraz $u$ wierzchołek kolejny na ścieżce od $x$ do $y$.

Początkowo ustawiamy $v:=x$. Ponieważ mamy do dyspozycji niedeterminizm to zgadujemy wierzchołek $u$ i sprawdzamy, czy jest sąsiedni do $v$. Jeśli nie, to przerywamy obliczenie, wiedząc, że na innej ścieżce obliczeń przetworzymy inne możliwości. Jeśli jest sąsiedni to sprawdzamy czy $u=y$ co oznacza, że dotarliśmy do celu i akceptujemy parę $x$, $y$. W przeciwnym wypadku ustawiamy $v:=u$ i kontynuujemy obliczenia.

Formalnie należy jeszcze użyć trzeciej zmiennej $licznik$, która zlicza liczbę kroków, tak aby ostatecznie odrzucić parę, gdy $licznik$ przekroczy liczbę wierzchołków grafu. Użyliśmy pamięci rzędu $\textnormal{log}n$ co kończy dowód pierwszego faktu.

Teraz musimy pokazać, że każdy inny problem z klasy NL redukuje się do REACHABILITY poprzez redukcję w pamięci logarytmicznej. Weźmy dowolny język L z klasy NL i odpowiadającą mu niedeterministyczną maszynę Turinga $M$.

Rozmiar grafu konfiguracji maszyny działającej w pamięci $\textnormal{log}n$ to jak wiemy $c^{\textnormal{log}n}\in O(n)$, natomiast sprawdzenie czy $x$ jest akceptowany przez $M$ możemy sprowadzić do istnienia ścieżki od konfiguracji początkowej do akceptującej. Jest to zatem instancja problemu REACHABILITY na danych wielkości rzędu $n$ . Nie potrzebujemy konstruować całego grafu, a jedynie stwierdzać, czy dwie konfiguracje są sąsiednie, co możemy zrobić w pamięci logarytmicznej. \end{sol}

\bigskip

Bardzo ciekawy rezultat, który zbliżył nas do odpowiedzi na pytanie czy L=NL, uzyskał w 2004 Reingold. Pokazał on, że problem UNDIRECTED REACHABILITY, czyli osiągalność w grafie \emph{nieskierowanym} należy do klasy L.

\section{Twierdzenie Immermana-Szelepcsényi'ego}

Ten rozdział poświęcony jest bardzo ciekawemu i całkiem młodemu wynikowi udowodnionemu niezależnie przez Neila Immermana i Róberta Szelepcsényi'ego w roku 1987, za który otrzymali w 1995 nagrodę Gödel'a.

Twierdzenie mówi o tym, że klasy niedeterministyczne złożoności pamięciowej są zamknięte na dopełnienie:

\begin{tw} (twierdzenie Immermana-Szelepcsényi'ego) Jeśli $f(n)$ jest konstruowalna pamięciowo, to \textnormal{NSPACE}(f(n))=\textnormal{coNSPACE}(f(n)). \end{tw}

\begin{proof} To co zostało pokazane przez autorów, to maszyna niedeterministyczna, która mając dany graf skierowany $G$ i wierzchołek $x$ potrafi obliczyć liczbę wierzchołków osiąganych z $x$ w grafie $G$ przy użyciu pamięci $\textnormal{log}n$. Zrobimy z niej użytek w ostatniej części głównego dowodu, gdy będziemy uruchamiać ją na grafie konfiguracji.

Maszyna jest dosyć trikowa i pokazuje jak wiele daje nam niedeterminizm. Wielokrotnie będziemy wykorzystywać fakt, że wystarczy nam, aby maszyna niedeterministyczna na dowolnej ścieżce dokonała poprawnego obliczenia. Na wszystkich pozostałych ścieżkach będziemy "wykrywać", że coś jest nie tak i kończyć działanie w stanie odrzucającym ("poddawać się").

Oznaczmy, przez $S(k)$ zbiór tych wierzchołków grafu $G$, które są osiągane z $x$ ścieżką o długości co najwyżej $k$. Natomiast przez $s(k)=|S(k)|$ oznaczymy liczność tego zbioru. Naszym obiektem zainteresowania jest zatem obliczenie wartości $s(n)$, czyli liczba wszystkich wierzchołków osiągalnych, gdyż $n$ -- rozmiar grafu -- ogranicza długość ścieżki.

Pamiętamy jednak, że mamy do dyspozycji tylko logarytmiczną ilość pamięci, więc o zapamiętaniu zbioru $S(k)$ (i obliczaniu na jego podstawie $S(k+1)$ co byłoby banalne) nie możemy marzyć - ma on wielkość liniową względem rozmiaru $G$. To brzmi niesamowicie, ale będziemy obliczać $s(k+1)$ na podstawie $s(k)$! Czyli wystarczy nam liczba stosownych wierzchołków, która to do zapisu potrzebuje pamięci logarytmicznej. Główna pętla algorytmu przedstawia się następująco:

\begin{algorithmic} \STATE{$s(0):=1$} \FOR{$i:=1$ to $n$} \STATE{Wyznacz $s(i)$ na podstawie $s(i-1)$} \ENDFOR \end{algorithmic}

Teraz procedura obliczająca $s(i)$. Jest ona całkiem prosta, jeśli zastosujemy w niej pewien skrót notacyjny:

\begin{algorithmic} \STATE{$s(i):=0$} \FORALL{$v\in V(G)$} \IF{$v\in S(i)$}\STATE{s(i)++} \ENDIF \ENDFOR \end{algorithmic}

Lecz zbioru $S(i)$ nie byliśmy w stanie zapamiętać. Zapowiedzielśmy już, że będziemy sprawdzać, czy wierzchołek do niego należy, na podstawie $s(i-1)$. To najbardziej skomplikowana część algorytmu, gdzie wykorzystujemy niedeterminizm.

Przeglądniemy teraz wszystkie wierzchołki $u$ grafu $G$ i sprawdzimy, czy któryś z nich należy do $S(i-1)$ w sposób niedeterministyczny. Przypomnijmy, że taka procedura, gdy mówi \verb"TAK", to wierzchołek na pewno należy do $S(i-1)$, natomiast gdy mówi "NIE" to mogliśmy trafić na nieodpowiednią ścieżkę obliczeń. Będziemy jednak zliczać ile wierzchołków zgadliśmy na TAK i sprawdzimy, czy wyjdzie nam $s(i-1)$. Jeśli tak się stanie, to będziemy mieć gwarancję, że o każdym wierzchołku $u$ zgadliśmy dobrze. Jeśli wyszło nam mniej, to odrzucamy, wiedząc, że na innej ścieżce obliczeń musi nam się udać. Następnie sprawdzamy, czy z $u$ można dojść do $v$ przy pomocy jednej krawędzi w ten sposób obliczymy czy $v\in S(i)$:

\begin{algorithmic} \STATE{$licznik:=0, wynik:=NIE$} \FORALL{$u\in V(G)$} \IF{$u\in S(i-1)$}

 \STATE{licznik++}
 \IF{$u=v$ lub $u\rightarrow v \in G$}\STATE{wynik:=TAK}\ENDIF

\ENDIF \ENDFOR \IF{$licznik<s(i-1)$}\RETURN{NIE}\ELSE \RETURN{wynik} \ENDIF \end{algorithmic}

Teraz przejdźmy do konstrukcji maszyny obliczającej, czy $u\in S(i-1)$ w sposób niedeterministyczny. Algorytm jest całkiem prosty i podobny do tego, w którym pokazywaliśmy, że REACHABILITY jest w NL. Zgadujemy sekwencję $k-1$ wierzchołków. Rozpoczynamy od $x$. Sprawdzamy, czy każdy kolejny wierzchołek jest sąsiadem poprzedniego (lub równy poprzedniemu) oraz czy w końcu dochodzimy do $u$. W ten sposób sprawdzimy (niedeterministycznie) wszystkie ścieżki długości co najwyżej $i-1$.

Poniżej zapis algorytmu dla sytuacji ścieżki długości $k$:

\begin{algorithmic} \STATE{$p_1:=x$} \FOR{$i := 2$ to $k$} \STATE{zgadnij $p_i$} \IF{$p_{i-1}\neq p_i$ i nie zachodzi $p_{i-1}\rightarrow p_i \in G$}\RETURN{NIE}\ENDIF \ENDFOR \IF{$p_k=u$}\RETURN{TAK}\ELSE \RETURN{NIE} \ENDIF \end{algorithmic}

To już koniec algorytmu. Krótka analiza wykazuje, że w trakcie jego działania musimy pamiętać jedynie skończoną liczbę wierzchołków i liczb wielkości co najwyżej $n$ zatem działa on w pamięci logarytmicznej.

Przejdźmy zatem do wykorzystania maszyny do udowodnienia tezy naszego twierdzenia. Weźmy język $L$ należący do NSPACE($f(n)$), gdzie $f(n)\geqslant \textnormal{log}n$, gdyż $f(n)$ jest konstruowalna pamięciowo. Istnieje zatem maszyna niedeterministyczna $M$ akceptująca $L$ w pamięci niedeterministycznej. Musimy pokazać, że istnieje maszyna niedeterministyczna $\overline{M}$ akceptująca $\overline{L}$ również w pamięci $f(n)$. Bierzemy graf konfiguracji $M$ dla słowa wejściowego $x$. Musimy stwierdzić, czy nie istnieje ścieżka od konfiguracji początkowej do akceptującej. Wtedy bowiem $x\notin L$ czyli $M'$ ma zaakceptować $x$.

Oznaczmy konfigurację akceptującą przez $y$. Liczymy zatem zbiór $S(n)$ dla grafu konfiguracji przy pomocy algorytmu z pierwszej części dowodu. Jeśli algorytm zakończy się wynikiem pozytywnym, to oznacza to, że $s(n)$ jest policzone poprawnie. Jeśli zatem w trakcie przeglądania nie zakwalifikowaliśmy wierzchołka $y$ do żadnego ze zbiorów $S(i)$ to znaczy, że \emph{nie} jest on osiągalny.

W tej sytuacji maszyna $M'$ może zaakceptować słowo $x$, które nie należy do $L$, a tym samym pokazujemy, że $L\in \textnormal{coNSPACE}(f(n))$. \end{proof}

\section{Klasy coNP i DP}

Wprowadziliśmy już zarówno klasę NP jak i pojęcie dopełnień klas. Przyjrzyjmy się bliżej klasie coNP. Klasa NP, jest to zbiór tych języków, dla których możemy łatwo weryfikować przynależność słów. Klasa coNP natomiast, to zbiór tych języków, dla których możemy łatwo weryfikować, że słowo nie należy do języka.

Podobnie jak dla NP i twierdzenia Fagina, można scharakteryzować coNP jako zbiór własności teoriografowych wyrażalnych w \emph{uniwersalnej} logice drugiego rzędu.

Oto przykłady problemów z klasy coNP:

\begin{definition} Problem TAUTOLOGY:\\ Wejście: formuła logiczna $\phi$ jak dla problemu SAT.\\ Wyjście: czy każde wartościowanie spełnia $\phi$? \end{definition}

\begin{definition} Problem HAMILTON PATH COMPLEMENT:\\ Wejście: graf nieskierowany $G$.\\ Wyjście: czy $G$ nie zawiera ścieżki Hamiltona? \end{definition}

W powyższych problemach weryfikacja negatywna słowa wejściowego jest łatwa, bo opiera się na zgadnięciu wartościowania niespełniającego lub ścieżki Hamiltona.

Nietrudno udowodnić (patrz ćwiczenie końcowe), że są to problemy zupełne dla klasy coNP. Nie jest to nic zaskakującego, bowiem równie prosto można udowodnić, że jeżeli $L$ jest NP-zupełny, to jego dopełnienie $\overline{L}$ jest coNP-zupełne.

Jak wiele pytań w teorii złożoności obliczeniowej również i to, czy NP=coNP pozostaje otwarte. Możemy jedynie stwierdzić, że jeżeli P=NP, to NP=coNP, gdyż P jest zamknięta na dopełnienie. Jednak już implikacja w drugą stronę nie jest znana. Inna podobna implikacja to:

\begin{EX} Jeśli $L$ jest coNP-zupełny i $L\in NP$ to NP=coNP. \end{EX}

\begin{hint} Pokaż inkluzje w obie strony korzystając z symetrii klas. \end{hint}

\begin{sol} Ustalmy $L$ z klasy NP, który jest coNP-zupełny.

Weźmy dowolny $L'$ z klasy coNP. Ponieważ $L$ jest coNP-zupełny, więc $L'$ redukuje się do $L$, czyli $L'$ należy do NP, bowiem redukcja jest procedurą deterministyczną.

Analogicznie, weźmy dowolny $L'$ z NP. Wiemy, że $\overline{L}$ jest NP-zupełny, i należy do coNP. Możemy zatem sprowadzić $L'$ redukcją do $\overline{L}$. Zatem $L'$ należy do coNP. \end{sol} \bigskip

Poniższy rysunek przedstawia relacje pomiędzy poznanymi klasami i omawianą za chwilę klasą DP:

\insertpicture{ZO-13-1-rys}{Relacje pomiędzy klasami NP, coNP i DP}

Oczywiście przyglądając się wszystkim takim rysunkom należy pamiętać, że mogą one w wielu miejscach kolapsować.

\subsection{Klasa DP}

Zastanówmy się nad następującym problemem:

\begin{example} Problem EXACT TSP:\\ Wejście: graf nieskierowany ważony $G$ i liczba $K$ \\ Wyjście: czy optymalna trasa komiwojażera dla $G$ ma wartość dokładnie $K$? \end{example}

Jest to wersja dokładna znanego problemu optymalizacyjnego -- problemu komiwojażera. Wiemy że wersja decyzyjna TSP(D) jest NP-zupełna. Nietrudno pokazać również, że EXACT TSP i TSP(D) są wielomianowo równoważne (ćwiczenie końcowe), tzn., że jeśli jeden z nich ma rozwiązanie w czasie wielomianowym to drugi też. W tym rozdziale sklasyfikujemy złożoność EXACT TSP dokładniej przy pomocy klasy DP. Nie umiemy bowiem pokazać, że EXACT TSP należy do NP, wszak jak poświadczyć i szybko zweryfikować, że długość optymalnej trasy wynosi dokładnie $K$? Widzimy, że odpowiedź na to pytanie wymaga stwierdzenia, że trasa ma długość co najmniej $K$ i co najwyżej $K$, co sugeruje pewne specyficzne połączenie problemu TSP(D) i jego dopełnienia.

\begin{definition} Klasa DP to zbiór języków $L$ takich, że $L=L_1\cap L_2$, gdzie $L_1\in NP$ natomiast $L_2 \in coNP$. \end{definition}

Przy tak postawionej definicji EXACT TSP należy do DP. Jest on bowiem przecięciem języka TSP(D) i TSP(D) COMPLEMENT, tzn. koszt trasy wynosi dokładnie $K$, gdy jest równy co najwyżej $K$ (to przynależność do TSP(D)) oraz co najmniej $K$ (to przynależność słowa do TSP(D) COMPLEMENT).

Klasa DP posiada problemy zupełne. Rozważmy problem następujący:

\begin{example} Problem SAT-UNSAT:\\ Wejście: formuły logiczne $\phi$ i $\psi$ jak dla SAT.\\ Wyjście: czy formuła $\phi$ jest spełnialna, natomiast $\psi$ niespełnialna? \end{example}

\begin{EX} Udowodnij, że problem SAT-UNSAT jest DP-zupełny. \end{EX}

\begin{hint} Skorzystaj z redukcji języka z NP oraz dopełnienia języka z coNP do SAT. \end{hint}

\begin{sol} Najpierw pokażmy, że SAT-UNSAT należy do klasy DP. Musimy wskazać stosowne języki $L_1$ i $L_2$ odpowiednio z klas NP i coNP. Wybieramy $L_1=\{(\phi,\psi):\phi\textnormal{ jest spełnialna}\}$ oraz $L_1=\{(\phi,\psi):\psi\textnormal{ nie jest spełnialna}\}$, o których można to łatwo stwierdzić.

Przejdźmy do części związanej z pokazaniem redukcji z dowolnego problemu z klasy DP. Weźmy $L\in$ DP. Wiemy, że $L=L_1\cap L_2$ i na mocy własności klas NP i coNP istnieją redukcje $R_1$ języka $L_1$ do SAT oraz $R2$ dopełnienia języka $L_2$ do SAT (jako że $L_2$ jest w coNP). Definiujemy redukcję jako $R(x)=(R_1(x),R_2(x))$.

Na podstawie konstrukcji wiemy, że $x\in L_1$, gdy $R_1(x)$ jest spełniona oraz $x\in L_2$, gdy $R_2(x)$ jest nie spełniona. zatem $x\in L_1 \cap L_2$ gdy $R(x)\in$SAT-UNSAT. \end{sol}

Również wspomniany na początku problem EXACT TSP jest DP-zupełny. Można rozważać także wiele innych wersji EXACT znanych problemów NP-zupełnych, które okazują się DP-zupełne.

Klasa DP zawiera także problemy DP-zupełne innego rodzaju:

\begin{example} Problem CRITICAL SAT:\\ Wejście: formuła logiczna $\phi$ jak dla SAT.\\ Wyjście: czy formuła $\phi$ jest nie spełnialna, natomiast usunięcie dowolnej klauzuli sprawia, że jest spełnialna? \end{example}

\begin{example} Problem CRITICAL HAMILTON PATH:\\ Wejście: graf nieskierowany $G$\\ Wyjście: czy $G$ nie ma ścieżki Hamiltona, natomiast dodanie dowolnej krawędzi do $G$ powoduje, że już ją posiada? \end{example}


\section{Maszyny alternujące}

W tym rozdziale przedstawimy ciekawe uogólnienie niedeterminizmu, zwane alternacją. Przypomnijmy, że maszyna niedeterministyczna akceptuje słowo, gdy na którejkolwiek ze ścieżek obliczeń trafi do stanu akceptującego.

Maszyna alternująca ma więcej możliwości. Każdy z jej stanów jest oznaczony poprzez "AND" lub "OR", które nazywamy odpowiednio stanami uniwersalnymi i egzystencjalnymi.

Gdy maszyna jest w stanie typu "OR", to dokonuje akceptacji gdy dowolna ze ścieżek obliczeń wychodzących z niego akceptuje słowo. Tak właśnie działają zawsze zwykłe maszyny niedeterministyczne.

Stany typu "AND" są rozszerzają tą funkcjonalność. Maszyna dokonuje akceptacji będąc w takim stanie, gdy \emph{każda} ze ścieżek obliczeń wychodzących z tego stanu jest akceptująca.

Miarę złożoności czasowej i pamięciowej maszyn alternujących definiujemy zupełnie tak jak dla maszyn niedeterministycznych, tzn. funkcja $f(n)$ jest miarą złożoności czasowej, gdy każda ze ścieżek obliczeń ma długość ograniczoną przez $f(n)$ oraz złożoność pamięciową $f(n)$ gdy na każdej ze ścieżek obliczeń maszyna zużywa co najwyżej $f(n)$ pamięci.

\begin{definition} Poprzez $\textsc{ATIME}(f(n))$ oznaczamy zbiór języków $L$ takich, że są akceptowane przez alternującą maszynę Turinga $M$ o złożoności czasowej $f(n)$. \end{definition} \begin{definition} Poprzez $\textsc{ASPACE}(f(n))$ oznaczamy zbiór języków $L$ takich, że są akceptowane przez alternującą maszynę Turinga $M$ o złożoności pamięciowej $f(n)$. \end{definition}

Wprowadzamy też skróty dla najpopularniejszych klas: \begin{itemize} \item Klasa AP = $\textnormal{ATIME}(n^k) = \bigcup_{j>0} \textnormal{ATIME}(n^j)$, to klasa tych języków, które mogą być akceptowane w alternującym czasie wielomianowym, \item Klasa AL = ASPACE(\textnormal{log}$n$), to klasa tych języków, które mogą być akceptowane w alternującej pamięci logarytmicznej, \end{itemize}

Nietrudno się domyślić, że alternacja jest silniejsza niż niedeterminizm z definicji działania maszyn. Wiemy zatem, w szczególności, że $AP$ zawiera w sobie $NP$. Poniższe ćwiczenie pokazuje, że o AP można powiedzieć więcej:

\begin{EX} Pokaż, że AP zawiera w sobie klasę coNP. \end{EX}

\begin{hint} Pokaż że problem coNP-zupełny TAUTOLOGY należy do AP. \end{hint}

\begin{sol} Na mocy wskazówki pokażemy, że TAUTOLOGY $\in$ AP, a tym samym ponieważ AP jest zamknięta na redukcje, to cała klasa coNP zawiera się w AP.

Maszyna dla TAUTOLOGY rozpoczyna działanie od stanu uniwersalnego. Następnie na każdej ze ścieżek obliczeń sprawdza inne wartościowanie. Jeśli $\phi$ jest spełniona na danym wartościowaniu, to obliczenie dochodzi do stanu akceptującego. W ten sposób ze względu na swój tryb działania, maszyna zaakceptuje $\phi$, gdy jest ona spełniona dla każdego wartościowania, czyli, gdy jest tautologią logiczną. \end{sol}

To jednak nie wszystko co potrafi klasa AP. Znajdują się w niej języki, o których nie wiemy czy należą do NP lub coNP.

\begin{definition} Problem MIN-FORMULA:\\ Wejście: formuła logiczna $\phi$ jak dla problemu SAT.\\ Wyjście: czy $\phi$ jest minimalna, tzn. czy żadna krótsza formuła nie jest jej równoważna? \end{definition}

\begin{EX} Pokaż, że MIN-FORMULA należy do AP. \end{EX}

\begin{hint} Wykorzystaj dwa tryby alternacji. \end{hint}

\begin{sol} W pierwszej części maszyna działa w trybie "AND". Zgadujemy formułę $\psi$ krótszą niż $\phi$, a następnie przestawiamy się na tryb "OR". Teraz zgadujemy wartościowanie $s$. Jeśli $\phi$ i $\psi$ są rozróżniane przez $s$, tzn. jedna z nich jest spełniona, a druga nie, to akceptujemy formułę $\phi$.

Załóżmy nie wprost, że formuła nie jest minimalna, a mimo to zostaje zaakceptowana. Aby tak się stało na każdej ze ścieżek z pierwszego poziomu alternacji uniwersalnej maszyna musi zaakceptować. Jeśli jednak formuła nie jest minimalna, to istnieje krótsza od niej formuła $\psi$, które jest jej równoważna. Na ścieżce obliczeń rozważającej $\psi$ maszyna w drugim poziomie alternacji musi znaleźć wartościowanie, które rozróżnia $\phi$ i $\psi$ co jest niemożliwe, stąd uzyskujemy sprzeczność. \end{sol}

Teraz przedstawimy kilka relacji pomiędzy klasami obliczeń alternujących:

\begin{tw} \label{tw:arel} Następujące relacje są prawdziwe: \begin{enumerate} \item Jeśli $f(n)\geqslant n$ to $\textnormal{ATIME}(f(n)) \subseteq \textnormal{SPACE}(f(n))$, \item Jeśli $f(n)\geqslant n$ to $\textnormal{SPACE}(f(n)) \subseteq \textnormal{ATIME}(f^2(n))$, \item Jeśli $f(n)\geqslant \textnormal{log}n$ to $\textnormal{ASPACE}(f(n)) \subseteq \textnormal{TIME}(c^{f(n)})$. \item Jeśli $f(n)\geqslant \textnormal{log}n$ to $\textnormal{ASPACE}(f(n)) \supseteq \textnormal{TIME}(c^{f(n)})$. \end{enumerate} \end{tw}

\begin{proof} Dowód własności od 1 do 3 jest przedmiotem ćwiczenia końcowego. Własność 4 wymaga trochę więcej pracy. Zauważmy, że musimy symulować maszynę działającą w czasie wykładniczym od dostępnej nam pamięci! Nie mamy zatem miejsca na potencjalną ilość pamięci, która może być potrzebna. Okazuje się jednak, że można sobie z tym poradzić:

Weźmy dowolną maszynę deterministyczną $M$ działającą w czasie $c^{f(n)}$. Będziemy symulować jej obliczenia od końca. Najpierw ustalamy, bez straty ogólności, że jest tylko jedna końcowa konfiguracja akceptująca, np. z całkowicie pustą taśmą , głowicą w komórce o numerze 1 i stanie $q_{acc}$.

Możemy przedstawić całe obliczenie w formie następującej tabelki przedstawiającej w rzędach kolejne zawartości taśmy, a w kolumnach czas. Dla uproszczenia przyjmijmy, że taśma jest jedna, i że pozycję głowicy notujemy specjalnym zapisem w tym miejscu pamięci, które ona odczytuje (podobnie notujemy stan). W ten sposób zawartość komórki $d$ zależy tylko od zawartości komórek $a$, $b$ i $c$:

\insertpicture{ZO-13-2-rys}{Zapis przebiegu obliczeń}

Teraz rozpoczynamy od dolnej części tabeli, której zawartość znamy i chcemy sprawdzić, czy obliczenie rozpoczęło się od pierwszego wiersza, który jest wejściem i którego zawartość też znamy.

Jeśli chcemy zweryfikować wartość komórki $d$, to w trybie "OR" zgadujemy zawartość komórek $a$, $b$ i $c$. Następnie w trybie "AND" weryfikujemy ich poprawność i zgodność przejścia od $a$, $b$, $c$ do $d$.

Ile pamięci jest nam potrzebne? Musimy pamiętać tylko wskaźniki do miejsc w wielkiej tabeli przedstawionej na rysunku, które sa rozmiaru $\textnormal{log}(c^{f(n)})$, co jest rzędu $f(n)$. \end{proof}

\bigskip

Dzięki wymienionym relacjom pomiędzy klasami alternującymi możemy udowodnić kilka dokładnych równości pomiędzy klasami, a to rzadka rzecz w teorii złożoności. Wiemy zatem, że:

\begin{itemize} \item AL=P, \item APSPACE = EXP, \item AP=PSPACE. \end{itemize}

\section{Hierarchia wielomianowa}

W tej części zdefiniujemy całą hierarchię klas ponad znanymi nam już P i NP, która stanowi pewne uogólnienie problematyki spotkanej w klasie DP.

W poprzednich rozdziałach zdefiniowaliśmy pojęcie maszyny z wyrocznią na język $L$ oznaczanej przez $M^L$. Przypomnijmy, że jest to zwykła maszyna $M$ z dodatkową możliwością zadania pytania postaci "czy $x\in L$?" które kosztuje jedną jednostkę czasu. Rozszerzenie tego pojęcia na klasy jest naturalne. Poprzez $P^{NP}$ oznaczamy zbiór tych języków, które mogą być rozstrzygane przez maszyny z klasy $P$ z wyrocznią na dowolny język z klasy $NP$.

Ta klasa okazuje się być mocniejsza od DP, bowiem w DP mogliśmy zadań pytanie tylko raz (dotyczące coNP, ale w sensie wyroczni działa to jak pytanie do NP), a tutaj dowolną liczbę razy i to na dodatek pytań adaptywnych, tzn. takich, które mogą zależeć od wyników odpowiedzi na poprzednie z nich. Kolejną interesującą klasą jest $NP^{NP}$. Wszystkie te klasy dają nam coraz większe możliwości, lecz oczywiście nie wiadomo, czy są to ściśle większe klasy, choć panuje takie przekonanie:

\insertpicture{ZO-13-3-rys}{Klasy relatywne}

Postępując w ten sposób Meyer i Stockmeyer w latach 70 zdefiniowali całą hierarchię klas:

\begin{definition} Hierarchia wielomianowa, to ciąg klas indeksowany poprzez $i$:\\ \begin{itemize} \item $\sum_0 P = \prod_0 P = \Delta_0 P = P$ \item $\Delta_{i+1} P = P^{\sum_i P},\textnormal{ dla }i>0$, \item $\sum_{i+1} P = NP^{\sum_i P},\textnormal{ dla }i>0$, \item $\prod_{i+1} P = coNP^{\sum_i P},\textnormal{ dla }i>0$. \end{itemize} Dodatkowo poprzez $PH$ oznaczamy sumę wszystkich tych klas, czyli:\\ $PH=\bigcup_{i\geqslant 0} \sum_i P$. \end{definition}

Ponieważ na poziomie zerowym wszystkie elementy hierarchii to P, więc na poziomie pierwszym, ponieważ taka wyrocznia nic nie daje, otrzymujemy $\Delta_1 P = P, \sum_1 P = NP, \prod_1 P = coNP$. Drugi poziom, to klasy$\Delta_2 P = P^{NP}, \sum_2 P = NP^{NP}, \prod_2 P = coNP^{NP}$. Warto zwrócić uwagę, że $\prod_i P$ jest dopełnieniem $\sum_i P$ na każdym poziomie wprost z definicji. Zawieranie się poszczególnych elementów na jednym poziomie obrazuje poniższy rysunek:

\insertpicture{ZO-13-4-rys}{Hierarchia wielomianowa}


Do tej pory często odwoływaliśmy się do odpowiedniości pomiędzy klasą NP a szczególnymi relacjami wielomianowo zrównoważonymi i rozstrzygalnymi. Przedstawimy teraz zgrabną charakteryzację klas z hierarchii wielomianowej przy pomocy podobnego kryterium:

\begin{tw} Niech $L$ będzie językiem, $i>0$. Język $L$ należy do $\sum_i P$ wtedy i tylko wtedy, gdy istnieje wielomianowo zrównoważona i rozstrzygalna relacja $R$ ($i+1$-argumentowa), taka, że $x \in L$ dokładnie wtedy, gdy $\exists{y_1}\forall{y_2}\exists{y_3}\ldots Q{y_i}$ takie, że $R(x,y_1,\ldots,y_i)$ jest spełnione ($i$-ty kwantyfikator jest uniwersalny, gdy $i$ jest parzyste, natomiast egzystencjalny, gdy $i$ jest nieparzyste). \end{tw}

Hierarchia wielomianowa jest strukturą dosyć wrażliwą na kolapsy, tzn. równości klas na pewnym poziomie. Okazuje się, że wtedy przenoszą się one automatycznie w górę:

\begin{EX} Pokaż, że jeżeli dla pewnego $i$ zachodzi $\sum_i P = \prod_i P$ to dla każdego $j>i$ zachodzi $\sum_j P = \prod_j P = \Delta_j P = \sum_i P$. \end{EX}

\begin{hint} Pokaż, że $\sum_{i+1} P = \sum P$. \end{hint}

\begin{sol} Pokażemy równość podaną we wskazówce z założenia $\sum_i P = \prod_i P$. Weźmy dowolny $L\in\sum_{i+1} P$. Z poprzedniego twierdzenia charakteryzującego wiemy, że istnieje relacja $i+1$-argumentowa $R_L$ dla $L$. Weźmy rzut relacji $R_L$, w którym pomijamy współrzędną $y_1$. Jest to relacja odpowiadająca pewnemu językowi $L'$ z $\prod_i P$ (otrzymujemy to dzięki zastosowaniu negacji i dopełnienia języka dla poprzedniego twierdzenia). W definicji tym razem jako pierwszy występuje kwantyfikator uniwersalny.

Dzięki równości klas istnieje dla języka $L'$ $i$-argumentowa relacja $R_{L'}$, definiująca go przy użyciu kwantyfikatora egzystencjalnego na początku. Dzięki tej zmianie, możemy teraz zmienić $R_{L'}$ tak, aby uwzględnić usuniętą wcześniej współrzędną współrzędną $y_1$, bez dodawania nowego kwantyfikatora, gdyż teraz jako pierwszy występuje kwantyfikator egzystencjalny, co sprawia, że $L\in\sum_{i} P$. \end{sol}

\bigskip

Zachodzi również podobny fakt. Otóż, jeśli P=NP (albo tylko NP=coNP), to hierarchia kolapsuje już na pierwszym poziomie.

Można by się zastanowić, czy kolejne poziomy hierarchii wielomianowej są interesujące z punku widzenia problemów, które pozwalają one rozwiązać. Okazuje się, że na każdym poziomie hierarchii posiada ona problemy zupełne:

\begin{definition} Problem $\textnormal{QSAT}_i$:\\ Wejście: formuła logiczna $\phi$ jak dla problemu SAT poprzedzona $i$ naprzemiennymi grupami kwantyfikatorów egzystencjalnych i uniwersalnych: $\Phi=\exists{x_1}\forall{x_2}\exists{x_3}\ldots Q{x_i}\phi$.\\ Wyjście: czy $\Phi$ jest prawdziwa? \end{definition}

\begin{tw} Problem $QSAT_i$ jest $\sum_i P$-zupełny dla $i>0$. \end{tw}

Jednak pytanie czy istnieje problem PH-zupełny (czyli zupełny dla całej hierarchii) jest otwarte i panuje przekonanie, że tak nie jest, gdyż:

\begin{EX} Pokaż, że jeśli istnieje problem PH-zupełny, to hierarchia zapada się na pewnym poziomie. \end{EX}

\begin{hint} Zauważ, że problem zupełny musi należeć do konkretnego poziomu. \end{hint}

\begin{sol} Jeśli $L$ jest zupełny dla PH, to $L$ należy do $\sum_i P$ dla pewnego $i$. Wtedy jednak dowolny język $L'$ z poziomu $\sum_{i+1} P$ redukuje się do $L$ w czasie wielomianowym. Ponieważ poziomy hierarchii są zamknięte na redukcje, stąd $L'\in \sum_i P$, a w konsekwencji

$\sum_{i+1} P=\sum_i P$.

\end{sol}

Jak silna jest cała hierarchia? Można łatwo zauważyć, że zawiera się ona w znanej już nam klasie PSPACE, ze względu na fakt, że można łatwo rozstrzygać w wielomianowej pamięci relacje, charakteryzujące problemy z PH, które opisywaliśmy wcześniej.

Jak nietrudno się domyślić pytanie, czy PH=PSPACE jest otwarte. Bardzo interesujące jest jednak, że gdyby równość zachodziła, to ponieważ PSPACE zawiera problemy zupełne, to PH również by je zawierała, stąd zapadła by się na pewnym skończonym poziomie. Stąd przekonanie, że PH zawiera się silnie w PSPACE.

Na koniec ciekawy rezultat autorstwa Seinosuke Tody (laureata nagrody Gödel'a z roku 1998) związany z klasą PH. Pokazał on, że $PH\subseteq P^{PP}$, czyli wyrocznia na klasę $PP$ jest niesamowicie silna i pozwala pochłonąć tak misternie zbudowaną piramidę coraz silniejszych klas.

\section{Ćwiczenia dodatkowe}

\begin{EX} Pokaż, że problem TAUTOLOGY jest coNP-zupełny. \end{EX}

\begin{hint} Skorzystaj z faktu, że SAT jest NP-zupełny. \end{hint}

\begin{sol} TAUTOLOGY należy do coNP. Weźmy dowolny inny problem $L$ z coNP. Wiemy, że $\overline{L}$ należy do NP, więc jest redukowalny do SAT - problemu NP-zupełnego, poprzez redukcję, którą oznaczymy jako $R$. Z definicji redukcji otrzymujemy, że $x\in \overline{L}$ wtedy i tylko wtedy, gdy $R(x)$ jest spełnialna. Po zastosowaniu negacji mamy , że $x\in L$ wtedy i tylko wtedy, gdy $R(x)$ jest nie spełnialna, tzn. $\neg R(x)$ jest tautologią. Sprowadziliśmy zatem problem przynależności do dowolnego języka $L$ z coNP do sprawdzania czy pewna formuła jest tautologią, co dowodzi coNP-zupełności problemu TAUTOLOGY. \end{sol}

\begin{EX} Udowodnij własności od 1 do 3 z twierdzenia \ref{tw:arel}. \begin{enumerate} \item Jeśli $f(n)\geqslant n$ to $\textnormal{ATIME}(f(n)) \subseteq \textnormal{SPACE}(f(n))$, \item Jeśli $f(n)\geqslant n$ to $\textnormal{SPACE}(f(n)) \subseteq \textnormal{ATIME}(f^2(n))$, \item Jeśli $f(n)\geqslant \textnormal{log}n$ to $\textnormal{ASPACE}(f(n)) \subseteq \textnormal{TIME}(c^{f(n)})$. \end{enumerate} \end{EX}

\begin{hint}\\ Ad. 1 i 3: zasymuluj maszynę alternującą przy pomocy zwykłej.\\ Ad. 2: skorzystaj z idei zaczerpniętej z twierdzenia Savitcha.\\ \end{hint}

\begin{sol}\\ Ad. 1:\\ Weźmy dowolny język $L\in\textnormal{ATIME}(f(n))$ akceptowany przez alternującą maszynę Turinga $M$. Dokonamy symulacji przy pomocy deterministycznej maszyny w pamięci $f(n)$. Wykonujemy algorytm rekurencyjnego przeglądania grafu konfiguracji w głąb. W momencie powrotu z rekurencji z ostatniego potomka danego wierzchołka decydujemy na podstawie typu "OR" lub "AND" i akceptacji potomków o tym czy dana konfiguracja jest akceptująca. Głębokość rekurencji to czas obliczeń maszyny $M$, czyli $f(n)$. Na każdy poziom rekurencji potrzeba nam jednak $f(n)$, aby zapamiętać konfigurację, czyli łącznie $f^2(n)$.

Możemy jednak zaoszczędzić na pamięci pamiętając tylko który z niedeterministycznych wyborów dokonała $M$ na danym poziomie rekurencji. Teraz aby obliczyć pełną konfigurację, będziemy musieli rozpocząć za każdym razem obliczenia od początku dokonując stosownych wyborów. Taka operacja może być jednak wykonana w pamięci $f(n)$, stąd cała symulacja potrzebuje $f(n)$ pamięci, a więc $L\in\textnormal{SPACE}(f(n))$.

\bigskip Ad. 2:\\ Tym razem mamy do dyspozycji maszynę działającą w pamięci $f(n)$ i chcemy ją zasymulować przy pomocy maszyny alternującej w czasie $f^2(n)$. Jak w twierdzeniu Savitcha odwołamy się do grafu konfiguracji maszyny rozmiaru $c^{f(n)}$ i będziemy się starali odpowiedzieć na pytanie, czy istnieje ścieżka od konfiguracji początkowej do końcowej.

Procedura, która oblicza istnienie ścieżki o długości co najwyżej $n$ ma do dyspozycji alternację i dokonuje tego w dwóch etapach. W pierwszym zgaduje wierzchołek pośredni $t$ na ścieżce działając w trybie "OR". Następnie przełącza się w tryb uniwersalny "AND" i sprawdza rekurencyjnie,

czy obydwie części ścieżki, długości $n/2$ poprzez odgadnięty wierzchołek $t$ istnieją.

Czas potrzebny do działania to głębokość rekurencji, czyli $\textnormal{log}(c^{f(n)})$ co jest rzędu $f(n)$ przemnożony przez czas potrzebny do przetworzenia każdego kroku, który wynosi również $f(n)$, gdyż jest to rozmiar konfiguracji. Łącznie daje to czas$f^2(n)$. Zwróćmy uwagę, że liczymy czas na \emph{jednej} ścieżce obliczeń, dzięki realizacji rekurencji przy pomocy alternacji!


\bigskip Ad. 3:\\ Weźmy dowolny język $L\in\textnormal{ASPACE}(f(n))$ akceptowany przez alternującą maszynę Turinga $M$. Mamy do dyspozycji czas rzędu wykładniczego względem $f(n)$, a więc możemy wygenerować cały graf konfiguracji

obliczeń maszyny $M$ (który jak wiemy ma rozmiar $c^{f(n)}$, gdy $f(n)\geqslant \textnormal{log}n$).

Następnie stosownie do typów "AND" i "OR" przeglądamy graf od konfiguracji końcowych i decydujemy o akceptacji słowa wejściowego. \end{sol}

\begin{EX} Udowodnij, że problemy TSP(D) i EXACT TSP są wielomianowo równoważne. \end{EX}

\begin{hint} Skorzystaj z problemu HAMILTON PATH. \end{hint}

\begin{sol} Załóżmy, że TSP(D) ma rozwiązanie wielomianowe. Dzięki opisywanej już metodzie wyszukiwania binarnego możemy odnaleźć $K$ - optymalny koszt dzięki temu, że potrzebujemy zadać tylko logarytmiczną liczbę pytań względem $K$, czyli liniową względem rozmiaru wejścia.

Niewiele trudniejsza jest implikacja w drugą stronę. Załóżmy, że EXACT TSP ma rozwiązanie wielomianowe. Metoda wyszukiwania binarnego tym razem zawodzi. Zgodnie ze wskazówką rozwiążemy najpierw HAMILTON PATH. Mając dany graf skierowany $G$ w którym chcemy znaleźć ścieżkę Hamiltona konstruujemy przykład $G'$ dla EXACT TSP. Jeśli krawędź istnieje w $G$ to w $G'$ otrzymuje wagę 1, jeśli nie istnieje w $G$ to w $G'$ wstawiamy ją z wagą 2. Łatwo stwierdzić, że graf $G$ ma ścieżkę Hamiltona wtedy i tylko wtedy, gdy trasa komiwojażera w $G'$ ma koszt dokładnie $n$ -- rozmiar grafu.

Ponieważ HAMILTON PATH jest NP-zupełny, więc istnieje redukcja TSP(D) do HAMILTON PATH, a tym samym składając redukcje otrzymamy algorytm wielomianowy dla TSP(D). \end{sol}

\section{Testy końcowe}

\end{document}