Teoria informacji/TI Wykład 14: Różnice pomiędzy wersjami

Wersja z 23:32, 8 sty 2007

Stała Chaitina

Tak jak w poprzednim wykładzie, ustalamy jakieś bezprefiksowe kodowanie maszyn Turinga (przypominamy, że przykład takiego kodowania można znaleźć w 1 wykładzie z Teorii złożoności) oraz bezprefiksową maszynę uniwersalną $U$ . Będziemy pisać $M (v) ↓$ na oznaczenie własności maszyna M zatrzymuje się startując ze słowa wejściowego v.

Definicja [Stała Chaitina]

Stałą Chaitina określamy jako sumę szeregu

Ω = \sum_{U (v) ↓} 2^{- | v |}

Stała Chaitina jest czasem przedstawiana jako prawdopodobieństwo, że losowo wybrany program się zatrzymuje (ma to miejsce przy pewnym wyborze kodowania i miary prawdopodobieństwa). Oczywiście konkretna wartość $Ω$ zależy od wyboru kodowania i maszyny uniwersalnej, ale jej istotne własności od tego nie zależą.

Twierdzenie [Własności $Ω$ ]

Stała Chaitina ma następujące własności.

(1) $Ω \leq 1$ .

(2) Istnieje maszyna Turinga $T$ z dodatkową taśmą nieskończoną, na której wypisane są kolejne cyfry binarnego rozwinięcia $Ω$ , która dla danego kodu $⟨ M ⟩$ maszyny $M$ odpowiada na pytanie, czy $M (ε) ↓$ .

(3) Istnieje stała $c$ taka, że

K_{U} (ω_{1} \dots ω_{n}) \geq n - c,

gdzie

ω_{1} \dots ω_{n}

oznacza pierwszych

n

bitów liczby

Ω

.

Punkt (2) oznacza, że "znając" stałą Chaitina potrafilibyśmy rozstrzygać problem stopu, natomiast (3) mówi nam, że z dokładnością do stałej, $Ω$ jest niekompresowalna.

Dowód

Ad 1. Ponieważ zbiór

L (U) = {w : U (w) ↓}

jest bezprefiksowy, każdy skończony podzbiór $𝒮 \subseteq L (U)$ , tworzy kod bezprefiksowy, a zatem z nierówności Krafta spełnia nierówność $\sum_{x \in 𝒮} 2^{- | x |} \leq 1$ , co po przejściu do supremum daje żądaną nierówność.

Ad 2. Zanim opiszemy konstrukcję maszyny $T$ , zróbmy pewne obserwacje na temat liczby $Ω$ . Znanym problemem w dowodach własności liczb rzeczywistych jest, że a priori liczba może mieć dwie różne reprezentacje (w szczególności binarne). Działoby się tak, gdyby liczba $Ω$ była dwójkowo wymierna, tzn.

(a) $Ω = 0 . ω_{1} ω_{2} \dots ω_{k} 0111 \dots$

(b) $Ω = 0 . ω_{1} ω_{2} \dots ω_{k} 1000 \dots$

Jakkolwiek w przyszłości wykluczymy taką możliwość, w tej chwili musimy jeszcze wziąć ją pod uwagę. Otóż bez zmniejszenia ogólności możemy założyć, że $Ω$ dana jest w postaci (a). Istotnie, gdybyśmy mieli maszynę $T$ dla tego przypadku, to łatwo moglibyśmy ją zmodyfikować do maszyny $T^{'}$ , która radziłaby sobie z przypadkiem (b). Maszyna $T^{'}$ działałaby tak samo jak maszyna $T$ , z tym że począwszy od $k + 1$ -szej cyfry $Ω$ , "widziałaby na odwrót", tzn. 0 traktowałaby jak 1 a 1 jak 0.

Jeśli wybierzemy wariant (a), lub jeśli $Ω$ nie jest dwójkowo wymierna, to dla każdego $n$ istnieje skończony podzbiór $𝒮_{n} \subseteq L (U)$ , taki że liczba wyznaczona przez pierwszych $n$ cyfr $Ω$ spełnia

0 . ω_{1} ω_{2} \dots ω_{n} \leq \sum_{x \in 𝒮_{n}} 2^{- | x |}

(pamiętamy, że $\sum_{i = n + 1}^{\infty} 2^{- i} = \frac{1}{2^{n}}$ ).

Opiszemy teraz działanie maszyny $T$ . Jak zwykle w takich przypadkach, opiszemy algorytm, pozostawiając Czytelnikowi jego formalizację w języku maszyn Turinga. Jeśli na wejściu jest słowo $w$ , $| w | = n$ , maszyna $T$ symuluje działanie $U$ na $w$ , a także przegląda kolejne słowa $v$ , powiedzmy w porządku wojskowym, i symuluje działanie $U$ na $v$ . Oczywiście każda z tych maszyn może się zapętlić, dlatego $T$ nie symuluje ich "po kolei"; zamiast tego wykonuje na przemian po jednej (kolejnej) instrukcji kolejnych symulowanych maszyn.

Można to sobie wyobrazić jako "ruch zygzakowy". Jeśli przyjąć, że słowa w porządku wojskowym tworzą ciąg $v_{0}, v_{1}, v_{2}, \dots$ , a $𝒲 (u_{i})$ oznacza: wykonaj kolejny krok działania maszyny $U$ na wejściu $v_{i}$ lub skip jeśli $U$ już zakończyła działanie, to plan działania maszyny $T$ można przedstawić

𝒲 (v_{0}) 𝒲 (v_{1}) 𝒲 (v_{0}) 𝒲 (v_{1}) 𝒲 (v_{2}) 𝒲 (v_{0}) 𝒲 (v_{1}) 𝒲 (v_{2}) 𝒲 (v_{3}) 𝒲 (v_{0}) \dots

W trakcie swojego obliczenia, maszyna $T$ utrzymuje zmienną, powiedzmy $𝒮'$ , której aktualną wartością jest (skończony) zbiór tych słów $v,$ dla których już udało się stwierdzić, że $U (v) ↓$ .

Zgodnie z powyższą oberwacją, w skończonym czasie jeden z dwóch przypadków ma miejsce.

(i) $T$ stwierdza, że $U (w) ↓$ ; wtedy daje odpowiedź TAK.

(ii) $T$ stwierdza, że

0 . ω_{1} ω_{2} \dots ω_{n} \leq \sum_{v \in 𝒮^{'}} 2^{- | v |},

ale $w \in̸ 𝒮^{'}$ ; wtedy daje odpowiedź NIE.

Zauważmy, że w tej chwili możemy już wykluczyć możliwość, że $Ω$ jest liczbą dwójkowo wymierną. Istotnie, Czytelnik pamięta zapewne doskonale, że problem stopu jest nierozstrzygalny, tzn. nie istnieje maszyna bez dodatkowej taśmy, realizująca postulat z warunku (2). Gdyby jednak $Ω$ była dwójkowo wymierna, to opisaną wyżej konstrukcję maszyny $T$ można przeprowadzić bez reprezentowania liczby $Ω$ ; zamiast pobierać bity liczby $Ω$ z dodatkowej nieskończonej taśmy, maszyna $T$ mogłaby je sobie łatwo obliczyć. Podobny argument pokazuje znacznie więcej: $Ω$ nie jest liczba wymierną ani algebraiczną, ani w ogole "obliczalną" (zobacz Ćwiczenie).

Ad 3. Opiszemy działanie pewnej maszyny $R$ . Na słowie wejściowym $x$ , $R$ najpierw symuluje działanie maszyny uniwersalnej $U$ na słowie $x$ . Dalszy opis prowadzimy przy założeniu, że obliczenie się zakończyło z wynikiem $U (x)$ i co więcej

U (x) = ω_{1} ω_{2} \dots ω_{n},

stanowi pierwsze $n$ cyfr rozwinięcia binarnego $Ω$ , dla pewnego $n$ . Niech

Ω_{n} = ω_{1} ω_{2} \dots ω_{n} .

Oczywiście, dla wielu $x$ nie będzie to prawdą; wtedy maszyna $R$ zgodnie z naszym opisem będzie wykonywać jakieś działania, których wynik nas nie interesuje. Ważne jest jednak, że dla pewnego $x$ istotnie zajdzie $U (x) = Ω_{n}$ (z własności maszyny uniwersalnej).

Z kolei, podobnie jak maszyna $T$ w dowodzie punktu (2), maszyna $R$ ruchem zygzakowym przegląda kolejne słowa $y$ i symuluje działanie na $U$ na $y$ , gromadząc w zmiennej $𝒮'$ te słowa $y$ , dla których obliczenie już się zakończyło. Dodatkowo, dla każdego $y \in 𝒮^{'}$ , $R$ zapamiętuje $U (y)$ . Pamiętamy, że wykluczyliśmy już możliwość podwójnej reprezentacji $Ω$ . Dlatego też, po pewnym skończonym czasie $R$ stwierdzi, że

\sum_{y \in 𝒮^{'}} 2^{- | y |} \geq Ω_{n} .

Niech $v$ będzie pierwszym w porządku wojskowym słowem takim, że $v \neq U (y)$ , dla każdego $y \in 𝒮^{'}$ . Zauważmy, że $K_{U} (v) \geq n$ (z definicji $Ω$ ). Wtedy wreszcie nasza maszyna $R$ zatrzymuje się z wynikiem $R (x) = v$ .

Zgodnie z Faktem z poprzedniego wykładu, istnieje stała $c_{U R}$ , że

K_{U} (v) \leq K_{R} (v) + c_{U R} .

Ale $K_{R} (v) \leq | x |$ (skoro $R$ wygenerowała $v$ z wejścia $x$ ). To daje nam

n \leq K_{U} (v) \leq K_{R} (v) + c_{U R} \leq | x | + c_{U R}

i nierówność ta zachodzi dla każdego $x$ , takiego że $U (x) = Ω_{n}$ . A zatem

n \leq K_{U} (Ω_{n}) + c_{U R}

dla każdego $n$ , tak więc $c = c_{U R}$ może być żądaną stałą.

@@ Linia 3: / Linia 3: @@
 Tak jak w poprzednim wykładzie, ustalamy jakieś bezprefiksowe
 kodowanie maszyn Turinga (przypominamy, że przykład takiego kodowania można znaleźć
-w 1 wykładzie z Teorii złożoności) oraz
+w 1 wykładzie z Teorii złożoności) oraz bezprefiksową
 [[Teoria informacji/TI Wykład 13#universe|maszynę uniwersalną]] <math>U</math>.
 Będziemy pisać <math>M(v) \downarrow </math> na oznaczenie własności
@@ Linia 11: / Linia 11: @@
 <center><math>
-\Omega = \sum_{U(v)\downarrow } 2^{ - |v|} = \sum_{M(\varepsilon )\downarrow } 2^{ - | \langle M \rangle |}
+\Omega = \sum_{U(v)\downarrow } 2^{ - |v|}
 </math></center>}}
@@ Linia 21: / Linia 21: @@
 {{twierdzenie|[Własności <math> \Omega </math>]|Chaitin_property|Stała Chaitina ma następujące własności.
-(1) <math> \Omega < 1</math>.
+(1) <math> \Omega \leq 1</math>.
 (2) Istnieje maszyna Turinga <math> T</math> z dodatkową taśmą nieskończoną, na której wypisane są kolejne
@@ Linia 38: / Linia 38: @@
 {{dowod|||
-Ad 1. Wykażemy, że  (*)
+Ad 1. Ponieważ zbiór
 <center><math>
-\sum_{M } 2^{ - | \langle M \rangle |} \leq 1
+L(U) = \{ w : U(w) \downarrow \}
 </math></center>
-(tu sumowanie rozciąga się na wszystkie maszyny Turinga, a nie tylko te, dla których
+jest bezprefiksowy,
-<math> M(\varepsilon )\downarrow </math>). Istotnie, przy bezprefikowsym kodowaniu, dla każdego skończonego
+każdy skończony podzbiór
-zbioru maszyn <math>{\cal M}</math>, odpowiedni
+<math>{\cal S} \subseteq L(U) </math>,
-zbiór kodów tworzy [[Teoria informacji/TI Wykład 1#kod|kod bezprefiksowy]], a zatem z
+tworzy [[Teoria informacji/TI Wykład 1#kod|kod bezprefiksowy]], a zatem z
 [[Teoria informacji/TI Wykład 1#kraft| nierówności Krafta]] spełnia nierówność
 <math>
-\sum_{M \in {\cal M}} 2^{ - | \langle M \rangle |} \leq 1
+\sum_{x \in {\cal S}} 2^{ - | x |} \leq 1
 </math>,
-co po przejściu do supremum daje nierówność (*). Ponieważ niewątpliwie istnieje maszyna, która nie zatrzymuje się na pustej
+co po przejściu do supremum daje żądaną nierówność.
-taśmie, <math>\Omega </math> jest ostro mniejsza od lewej strony (*).
 Ad 2. Zanim opiszemy konstrukcję maszyny <math> T </math>, zróbmy pewne obserwacje na temat liczby
@@ Linia 70: / Linia 69: @@
 jak 0.
-Niech <center><math>
-{\cal S}  =
-\{   M :  M(\varepsilon ) \downarrow \}.
-</math></center>
 Jeśli wybierzemy wariant (a), lub jeśli <math> \Omega </math> nie jest dwójkowo wymierna, to dla każdego
-<math> n </math> istnieje '''skończony''' podzbiór  <math> {\cal S}_n </math> zbioru  <math> {\cal S} </math>,
+<math> n </math> istnieje '''skończony''' podzbiór  <math> {\cal S}_n  \subseteq L(U)</math>,
-taki że liczba wyznaczona przez pierwszych <math> n </math>  cyfr <math> \Omega </math> przedstawia się
+taki że liczba wyznaczona przez pierwszych <math> n </math>  cyfr <math> \Omega </math> spełnia
 <center><math>
-. \omega_1 \omega_2 \ldots \omega_n =
+. \omega_1 \omega_2 \ldots \omega_n \leq
-\sum_{M \in {\cal S}_n  } 2^{ - \langle M \rangle }
+\sum_{x \in {\cal S}_n  } 2^{ - |x|  }
 </math></center>
 (pamiętamy, że <math> \sum_{i = n+1}^{\infty } 2^{-i} = \frac{1}{2^n} </math>).
@@ Linia 87: / Linia 83: @@
 Opiszemy teraz działanie maszyny <math> T </math>. Jak zwykle w takich przypadkach, opiszemy
 algorytm, pozostawiając Czytelnikowi jego formalizację w języku maszyn Turinga.
-Jeśli na wejściu jest słowo nie będące kodem żadnej maszyny, <math> T </math> je odrzuca.
+Jeśli na wejściu jest słowo <math> w </math>,  <math> |w| = n </math>,
-Przypuśćmy, że na wejściu jest <math> \langle M \rangle </math>;
+maszyna <math> T </math> symuluje działanie <math> U </math> na <math> w </math>,
-niech <math> n = | \langle M \rangle | </math>.
+a także przegląda kolejne słowa
-Maszyna <math> T </math> symuluje działanie <math> M </math> na <math> \varepsilon </math>
+<math>v </math>, powiedzmy w porządku wojskowym, i
-(tzn. na pustej taśmie), a także przegląda kolejne kody maszyn Turinga
+symuluje działanie <math> U </math> na <math> v </math>.
-<math>\langle  M' \rangle </math>, powiedzmy w porządku wojskowym, i
-symuluje działanie <math> M' </math> na <math> \varepsilon </math>.
 Oczywiście każda z tych maszyn może się zapętlić, dlatego <math> T </math>
 nie symuluje ich  "po kolei"; zamiast tego wykonuje na przemian po jednej (kolejnej) instrukcji
 kolejnych symulowanych maszyn.
-Można to sobie wyobrazić jako "ruch zygzakowy". Jeśli przyjąć, że maszyny w porządku wojskowym tworzą
+Można to sobie wyobrazić jako "ruch zygzakowy". Jeśli przyjąć, że słowa w porządku wojskowym tworzą
-ciąg <math> M_0, M_1, M_2, \ldots </math>, a <math>{\cal W} (M_i) </math> oznacza:
+ciąg <math> v_0, v_1, v_2, \ldots </math>, a <math>{\cal W} (u_i) </math> oznacza:
-wykonaj kolejną instrukcję maszyny <math> M_i </math> lub ''skip'' jeśli <math> M_i </math> już zakończyła
+wykonaj kolejny krok działania maszyny <math> U </math> na wejściu  <math> v_i</math> lub ''skip'' jeśli
+<math> U </math> już zakończyła
 działanie,
 to plan działania maszyny <math> T </math> można przedstawić
 <center><math>
-{\cal W} (M_0 ) \, {\cal W} (M_1 ) \, {\cal W} (M_0 ) \, {\cal W} (M_1 ) \, {\cal W} (M_2 ) \,
+{\cal W} (v_0 ) \, {\cal W} (v_1 ) \, {\cal W} (v_0 ) \, {\cal W} (v_1 ) \, {\cal W} (v_2 ) \,
-\, {\cal W} (M_0 ) \, {\cal W} (M_1 ) \, {\cal W} (M_2 ) \,
+\, {\cal W} (v_0 ) \, {\cal W} (v_1 ) \, {\cal W} (v_2 ) \,
-{\cal W} (M_3) \, {\cal W} (M_0 ) \dots
+{\cal W} (v_3) \, {\cal W} (v_0 ) \dots
 </math></center>
 W trakcie swojego obliczenia, maszyna <math> T </math> utrzymuje zmienną, powiedzmy
-<math> {\cal S}' </math>, której aktualną wartością jest (skończony) zbiór kodów tych maszyn
+<math> {\cal S}' </math>, której aktualną wartością jest (skończony) zbiór  tych słów
-<math> M', </math> dla których już udało się stwierdzić, że <math> M'(\varepsilon )\downarrow </math>.
+<math> v, </math> dla których już udało się stwierdzić, że <math> U(v )\downarrow </math>.
 Zgodnie z powyższą oberwacją, w skończonym czasie jeden z dwóch przypadków ma miejsce.
-'''(i)''' <math> T </math> stwierdza, że <math> M(\varepsilon )\downarrow </math>; wtedy daje odpowiedź
+'''(i)''' <math> T </math> stwierdza, że <math> U (w )\downarrow </math>; wtedy daje odpowiedź
 '''TAK'''.
 '''(ii)''' <math> T </math> stwierdza, że
 <center><math>
-. \omega_1 \omega_2 \ldots \omega_n =
+. \omega_1 \omega_2 \ldots \omega_n \leq
-\sum_{\langle M' \rangle \in {\cal S}' } 2^{ - |\langle M' \rangle | },
+\sum_{v \in {\cal S}' } 2^{ - |v | },
 </math></center>
-ale <math>M \not\in  {\cal S}'</math>; wtedy  daje odpowiedź
+ale <math>w \not\in  {\cal S}'</math>; wtedy  daje odpowiedź
 '''NIE'''.
@@ Linia 143: / Linia 138: @@
 z wynikiem <math> U(x) </math> i co więcej
 <center><math>
-U(x) = \Omega_n = 0. \omega_1 \omega_2 \ldots \omega_n ,
+U(x) =  \omega_1 \omega_2 \ldots \omega_n ,
 </math></center>
-dla pewnego <math> n </math>.
+stanowi pierwsze <math> n </math> cyfr rozwinięcia binarnego <math> \Omega </math>,
+dla pewnego <math> n </math>. Niech
+<center> <math> \Omega_n =  \omega_1 \omega_2 \ldots \omega_n . </math></center>
 Oczywiście, dla wielu <math> x </math> nie będzie to prawdą; wtedy maszyna <math> R </math> zgodnie
 z naszym opisem będzie wykonywać jakieś działania, których wynik nas nie interesuje. Ważne jest
@@ Linia 152: / Linia 150: @@
 Z kolei, podobnie jak maszyna  <math> T </math> w dowodzie punktu (2), maszyna <math> R </math> ruchem zygzakowym
-przegląda  kolejne  maszyny  <math> M' </math> i symuluje
+przegląda  kolejne  słowa  <math> y </math> i symuluje
-ich działanie na <math> \varepsilon </math>, gromadząc w zmiennej <math> {\cal S}' </math>
+działanie na <math> U </math> na <math> y </math>, gromadząc w zmiennej <math> {\cal S}' </math>
-kody tych maszyn, dla których obliczenie już się zakończyło. Dodatkowo, dla każdego
+te słowa <math> y </math>, dla których obliczenie już się zakończyło. Dodatkowo, dla każdego
-<math> \langle M' \rangle \in {\cal S}' </math>, <math> R </math> zapamiętuje
+<math>  y \in {\cal S}' </math>, <math> R </math> zapamiętuje
-<math> M' (\varepsilon ) </math>.
+<math> U(y) </math>.
 Pamiętamy, że wykluczyliśmy już możliwość podwójnej reprezentacji <math> \Omega</math>. Dlatego też,
 po pewnym skończonym czasie <math> R </math> stwierdzi, że
 <center><math>
-\sum_{\langle M' \rangle \in {\cal S}' } 2^{ - |\langle M' \rangle | } = \Omega_n .
+\sum_{y \in {\cal S}' } 2^{ - |y | } \geq \Omega_n .
 </math></center>
 Niech  <math> v </math> będzie pierwszym w porządku wojskowym słowem takim, że
-<math> v \neq M' (\varepsilon ) </math>, dla każdego <math> \langle M' \rangle \in {\cal S}' </math>.
+<math> v \neq U(y) </math>, dla każdego <math> y \in {\cal S}' </math>.
 Zauważmy, że  <math> K_U ( v ) \geq n </math> (z definicji <math> \Omega</math>).
 Wtedy wreszcie nasza maszyna <math> R </math> zatrzymuje się z wynikiem <math> R (x) = v</math>.

Teoria informacji/TI Wykład 14: Różnice pomiędzy wersjami

Wersja z 23:32, 8 sty 2007

Stała Chaitina

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia