Teoria informacji/TI Wykład 13: Różnice pomiędzy wersjami
Linia 71: | Linia 71: | ||
(1a) jeśli <math> M_v </math> się zatrzymuje, to <math> U</math> też się zatrzymuje | (1a) jeśli <math> M_v </math> się zatrzymuje, to <math> U</math> też się zatrzymuje | ||
z tym samym wynikiem, który oznaczamy <math> U(w) </math> (<math> M_v (u)</math>), | z tym samym wynikiem, który oznaczamy <math> U(w) </math> (<math> = M_v (u)</math>), | ||
(1b) jeśli <math> M_v </math> się zapętla, to <math> U</math> też się zapętla. | (1b) jeśli <math> M_v </math> się zapętla, to <math> U</math> też się zapętla. | ||
Linia 79: | Linia 79: | ||
Zauważmy, że w powyższej definicji słowo <math> u</math> może być puste; wtedy | Zauważmy, że w powyższej definicji słowo <math> u</math> może być puste; wtedy | ||
<math> U</math> symuluje działanie <math> M_v </math> | <math> U</math> symuluje działanie <math> M_v </math> startującej przy pustej taśmie. | ||
Właśnie ten przypadek będzie nas szczególnie interesował. | Właśnie ten przypadek będzie nas szczególnie interesował. | ||
{{definicja|[Złożoność Kołmogorowa]|Kołmogorow| '''Złożonością informacyjną Kołmogorowa''' słowa ''x'' jest | |||
<center><math> | |||
K_U (x) = \min \{ |v| : v \mbox{ jest kodem i } U (v) = x \} | |||
</math></center> | |||
}} | |||
Innymi słowy, <math> K_U (x) </math> jest najkrótszym kodem maszyny, która generuje <math> x</math> | |||
startując z pustej taśmy. |
Wersja z 18:54, 22 sie 2006

Złożonośc informacyjna Kołmogorowa
Odwołajmy się do codziennego doświadczenia. Chyba każdy się zgodzi, że niektóre liczby można zapamiętać łatwiej niż inne i nie zależy to tylko od wielkości liczby. Bez trudu zapamiętamy liczbę czy nawet
natomiast zapamietanie 20 ,,losowych" cyfr sprawi nam kłopot. No, chyba, że to będą np.
31415926535897932384
wtedy, nawet jeśli nie ,,trzymamy" tych cyfr w pamięci, możemy je w razie potrzeby odtworzyć, np. korzystając z formuły Leibniza .
Nie inaczej ma się sprawa z tekstami. Mamy swiadomość, że przy odpowiednim nakładzie pracy i czasu potrafilibyśmy się nauczyć na pamięć wybranej księgi ,,Pana Tadeusza" (a może nawet całego poematu), natomiast zapamietanie -- powiedzmy -- 10 stron ,,losowych" symboli wydaje się przekraczać możliwości zwykłego człowieka. No chyba, że znowu -- znaleźlibyśmy jakiś ,,klucz", na przykład okazałoby się, ze jest to tekst w obcym języku, którego jednak jesteśmy w stanie się nauczyć.
Jakie pojęcia matematyczne kryją się za tym zjawiskiem? W przypadku liczb odpowiedź jest stosunkowo prosta: niektóre liczby całkowite można opisać znacznie krócej niż podając ich rozwinięcia dziesiętne; wystarczy wtedy zapamiętać ów krótszy ,,opis". W pierwszym przybliżeniu, za złożoność liczby bylibysmy więc skłonni uznać długość jej najkrótszego opisu. Jednak widzieliśmy już na pierwszym wykładzie, że takie postawienie sprawy prowadzi do paradoksu Berry'ego, dlatego też wprowadziliśmy wtedy pojęcie notacji.
A jednak - po lepszym zrozumieniu - idea najktótszego opisu prowadzi do sensownej miary złożoności, którą przedstawimy na tym wykładzie.
Przyjmiemy, że obiekty, które chcemy opisywać, to słowa nad alfabetem ; zarówno liczby naturalne, jak też słowa nad większymi alfabetami można łatwo sprowadzić do tego przypadku.
Ideą Kołmogorowa było, by za złożoność słowa przyjąć długość najkrótszego programu generującego to słowo, przy wybranym języku programowania, np. języku Pascal. W istocie Kołmogorow nie użył języka Pascal, lecz uniwersalnej maszyny Turinga, jednak -- jak wkrótce się przekonamy -- wybór ten nie ma większego znaczenia, podobnie jak zresztą wybór innego języka programowania (np. C++ zamiast Pascala).
Zakładamy, że Czytelnik jest zaznajomiony z pojęciem maszyny Turinga, choć nie będziemy go uzywać bardzo intensywnie -- jeśli ktoś woli, może nadal myśleć o ulubionym języku programowania. Ważną własnością maszyn Turinga jest, że można je kodować za pomocą słów binarnych, jedno z wielu możliwych kodowań opisane jest w pierwszym wykładzie z Złożoności obliczeniowej. Nie jest przy tym trudno zagwarantować, by kodowanie było bezprefiksowe (tzn. żaden kod nie jest właściwym prefiksem innego).
Zakładając ustalone kodowanie, Turing podał konstrukcję maszyny uniwersalnej, tj. maszyny o następujących własnościach (zob. Języki, automaty i obliczenia, Wykład 12):
(1) jeśli na wejściu jest , gdzie jest kodem pewnej maszyny , to symuluje działanie na .
W szczególności
(1a) jeśli się zatrzymuje, to też się zatrzymuje z tym samym wynikiem, który oznaczamy (),
(1b) jeśli się zapętla, to też się zapętla.
(2) jeśli słowo wejściowe nie ma prefiksu będącego kodem maszyny, to się zapętla.
Zauważmy, że w powyższej definicji słowo może być puste; wtedy symuluje działanie startującej przy pustej taśmie. Właśnie ten przypadek będzie nas szczególnie interesował.
Definicja [Złożoność Kołmogorowa]
Innymi słowy, jest najkrótszym kodem maszyny, która generuje startując z pustej taśmy.