Teoria informacji/TI Wykład 4: Różnice pomiędzy wersjami
Nie podano opisu zmian |
Nie podano opisu zmian |
||
Linia 12: | Linia 12: | ||
<center><math>{\ell }(s) = \left\lceil \log_r \frac{1}{p(s)} \right\rceil</math></center> | <center><math>{\ell }(s) = \left\lceil \log_r \frac{1}{p(s)} \right\rceil</math></center> | ||
dla tych <math>s \in S</math> dla których <math>p(s)>0</math>. Wtedy | dla tych <math>s \in S</math>, dla których <math>p(s)>0</math>. Wtedy | ||
<center><math>\sum_{s: p(s) > 0} \frac{1}{r^{\ell (s)}} \leq \sum_{p(s) > 0} p(s) = \sum_{s \in S} p(s) = 1</math></center> | <center><math>\sum_{s: p(s) > 0} \frac{1}{r^{\ell (s)}} \leq \sum_{p(s) > 0} p(s) = \sum_{s \in S} p(s) = 1</math></center> | ||
Rozważmy kilka przypadków. W najprostszym, kiedy <math>(\forall s \in S) \, p(s) > 0</math>, powyższa nierówność odpowiada dokładnie nierówności Krafta, a zatem istnieje kod <math>\varphi</math> spełniający <math>| \varphi (s)| = \ell (s)</math> dla wszystkich <math>s \in S</math>. Uwzględniając że <math>{\ell }(s) < \log_r \frac{1}{p(s)} +1</math> dostajemy | Rozważmy kilka przypadków. W najprostszym, kiedy <math>(\forall s \in S) \, p(s) > 0</math>, powyższa nierówność odpowiada dokładnie nierówności Krafta, a zatem istnieje kod <math>\varphi</math> spełniający <math>| \varphi (s)| = \ell (s)</math> dla wszystkich <math>s \in S</math>. Uwzględniając, że <math>{\ell }(s) < \log_r \frac{1}{p(s)} +1</math>, dostajemy | ||
<center><math>\sum_{s \in S} p(s) \cdot {\ell }(s) < \sum_{s \in S} p(s) \cdot \left( \log_r \frac{1}{p(s)} +1 \right) = H_r(S) + 1</math>.</center> | <center><math>\sum_{s \in S} p(s) \cdot {\ell }(s) < \sum_{s \in S} p(s) \cdot \left( \log_r \frac{1}{p(s)} +1 \right) = H_r(S) + 1</math>.</center> | ||
Załóżmy zatem że <math>p(s)</math> może być równe 0. Jeśli | Załóżmy zatem, że <math>p(s)</math> może być równe 0. Jeśli | ||
<center><math>\sum_{p(s) > 0} \frac{1}{r^{\ell (s)}} <1</math></center> | <center><math>\sum_{p(s) > 0} \frac{1}{r^{\ell (s)}} <1</math></center> | ||
to łatwo możemy rozszerzyć definicję <math>\ell</math> na wszystkie ''s'', tak że nierówność Krafta <math>\sum_{s \in S} \frac{1}{r^{\ell (s)}} \leq 1</math> dalej będzie spełniona. Będzie zatem istniał kod o długościach <math>\ell</math> spełniający <math>{\ell }(s) < \log_r \frac{1}{p(s)} +1</math> zawsze gdy <math>p(s)>0</math>, a więc | to łatwo możemy rozszerzyć definicję <math>\ell</math> na wszystkie ''s'', tak że nierówność Krafta <math>\sum_{s \in S} \frac{1}{r^{\ell (s)}} \leq 1</math> dalej będzie spełniona. Będzie zatem istniał kod o długościach <math>\ell</math>, spełniający <math>{\ell }(s) < \log_r \frac{1}{p(s)} +1</math> zawsze, gdy <math>p(s)>0</math>, a więc | ||
<center><math>\sum_{s \in S} p(s) \cdot {\ell }(s) < \sum_{s \in S} p(s) \cdot \left( \log_r \frac{1}{p(s)} +1 \right) = H_r(S) + 1 </math></center> | <center><math>\sum_{s \in S} p(s) \cdot {\ell }(s) < \sum_{s \in S} p(s) \cdot \left( \log_r \frac{1}{p(s)} +1 \right) = H_r(S) + 1 </math></center> | ||
( | (Pamiętamy o naszej konwencji <math>0 \cdot \log \frac{1}{0} = 0</math>.) | ||
Ostatni przypadek to taki gdy | Ostatni przypadek to taki, gdy | ||
<center><math>\sum_{ p(s) > 0} \frac{1}{r^{\ell (s)}}= 1</math></center> | <center><math>\sum_{ p(s) > 0} \frac{1}{r^{\ell (s)}}= 1</math></center> | ||
Wybierzmy ''s’'' takie że <math>p(s')>0</math> i zdefiniujmy nowe długości | Wybierzmy ''s’'', takie że <math>p(s')>0</math>, i zdefiniujmy nowe długości | ||
<center><math> | <center><math> | ||
\aligned | \aligned | ||
Linia 36: | Linia 36: | ||
</math></center> | </math></center> | ||
Znów możemy rozszerzyć <math>\ell'</math> na wszystkie s w taki sposób żeby zachować nierówność Krafta. | Znów możemy rozszerzyć <math>\ell'</math> na wszystkie <math>s</math> w taki sposób, żeby zachować nierówność Krafta. Aby obliczyć średnią długość kodu musimy zauważyć, że w tym przypadku mieliśmy zawsze <math>\ell (s) = \log_r \frac{1}{p(s) }</math> gdy tylko <math>p(s) > 0</math>. (Wynika to z tego, że z definicji <math>\ell</math> musi być <math>\frac{1}{r^{\ell (s)}} \leq p(s)</math> i <math>1 = \sum_{p(s) > 0} \frac{1}{r^{\ell (s)}} = \sum_{p(s) > 0} p(s)</math>, a więc <math> p(s) = \frac{1}{r^{\ell (s)}}</math> gdy <math>p(s) > 0</math>.) Kod o długości <math>\ell'</math> spełnia | ||
<center><math>\sum_{s \in S} p(s) \cdot {\ell}' (s) = \sum_{p(s) > 0} p(s) \cdot {\ell}' (s) = p(s') + \sum_{p(s) > 0} p(s) \cdot {\ell} (s) = p(s') + H_r (S)</math></center> | <center><math>\sum_{s \in S} p(s) \cdot {\ell}' (s) = \sum_{p(s) > 0} p(s) \cdot {\ell}' (s) = p(s') + \sum_{p(s) > 0} p(s) \cdot {\ell} (s) = p(s') + H_r (S)</math></center> | ||
Ostatecznie <math>L_r (S) \leq H_r (S) + 1</math> i nierówność nie jest ostra tylko gdy nie istnieje żadne <math>0 < p(s') <1</math>.}} | Ostatecznie <math>L_r (S) \leq H_r (S) + 1</math> i nierówność nie jest ostra tylko wtedy, gdy nie istnieje żadne <math>0 < p(s') <1</math>.}} | ||
Jesteśmy gotowi do sformułowania pierwszego z głównych twierdzeń tego wykładu | Jesteśmy gotowi do sformułowania pierwszego z głównych twierdzeń tego wykładu: | ||
Linia 53: | Linia 53: | ||
<center><math>H_r (S^n) \leq L_r (S^n ) \leq H_r (S^n) + 1</math></center> | <center><math>H_r (S^n) \leq L_r (S^n ) \leq H_r (S^n) + 1</math></center> | ||
Uwzględniając <math>H_r (S^n) = n \cdot H_r(S)</math> dostajemy | Uwzględniając <math>H_r (S^n) = n \cdot H_r(S)</math>, dostajemy | ||
<center><math>H_r (S) \leq \frac{L_r (S^n )}{n} \leq H_r (S) + \frac{1}{n}</math></center>}} | <center><math>H_r (S) \leq \frac{L_r (S^n )}{n} \leq H_r (S) + \frac{1}{n}</math></center>}} |
Wersja z 18:55, 17 wrz 2006
Aby oszacować , zaczniemy od uzupełnienia naszej nierówności o górne ograniczenie.
Twierdzenie [Kod Shannona-Fano]
W ten sposób mamy
Dowód
dla tych , dla których . Wtedy
Rozważmy kilka przypadków. W najprostszym, kiedy , powyższa nierówność odpowiada dokładnie nierówności Krafta, a zatem istnieje kod spełniający dla wszystkich . Uwzględniając, że , dostajemy
Załóżmy zatem, że może być równe 0. Jeśli
to łatwo możemy rozszerzyć definicję na wszystkie s, tak że nierówność Krafta dalej będzie spełniona. Będzie zatem istniał kod o długościach , spełniający zawsze, gdy , a więc
(Pamiętamy o naszej konwencji .)
Ostatni przypadek to taki, gdy
Wybierzmy s’, takie że , i zdefiniujmy nowe długości
Znów możemy rozszerzyć na wszystkie w taki sposób, żeby zachować nierówność Krafta. Aby obliczyć średnią długość kodu musimy zauważyć, że w tym przypadku mieliśmy zawsze gdy tylko . (Wynika to z tego, że z definicji musi być i , a więc gdy .) Kod o długości spełnia

Jesteśmy gotowi do sformułowania pierwszego z głównych twierdzeń tego wykładu:
Twierdzenie [Pierwsze Twierdzenie Shannona]
Dla każdej skończonej przestrzeni probabilistycznej S i
Dowód