Teoria informacji/TI Wykład 4: Różnice pomiędzy wersjami

Wersja z 20:02, 1 paź 2006

Aby oszacować $\frac{L_{r} (S^{n})}{n} - H_{r} (S)$ , zaczniemy od uzupełnienia naszej nierówności o górne ograniczenie.

Twierdzenie [Kod Shannona-Fano]

Dla dowolnej skończonej przestrzeni probabilistycznej S i

r \geq 2

, istnieje kod

φ : S \to Σ^{*}

(gdzie

| Σ | = r

), spełniający

L (φ) \leq H_{r} (S) + 1

W ten sposób mamy

H_{r} (S) \leq L_{r} (S) \leq H_{r} (S) + 1

Dodatkowo, ścisła nierówność

L_{r} (S) < H_{r} (S) + 1

jest prawdziwa za wyjątkiem przypadku

p (s) = 1

dla pewnego

s \in S

(wtedy

H_{r} (S) = 0

).

Dowód

Dla

| S | = 1

mamy trywialnie

H_{r} (S) = 0

i

L_{r} (S) = 1

. Załóżmy że

| S | \geq 2

. Niech

ℓ (s) = ⌈ \log_{r} \frac{1}{p (s)} ⌉

dla tych $s \in S$ , dla których $p (s) > 0$ . Wtedy

\sum_{s : p (s) > 0} \frac{1}{r^{ℓ (s)}} \leq \sum_{p (s) > 0} p (s) = \sum_{s \in S} p (s) = 1

Rozważmy kilka przypadków. W najprostszym, kiedy $(\forall s \in S) p (s) > 0$ , powyższa nierówność odpowiada dokładnie nierówności Krafta, a zatem istnieje kod $φ$ spełniający $| φ (s) | = ℓ (s)$ dla wszystkich $s \in S$ . Uwzględniając, że $ℓ (s) < \log_{r} \frac{1}{p (s)} + 1$ , dostajemy

\sum_{s \in S} p (s) \cdot ℓ (s) < \sum_{s \in S} p (s) \cdot (\log_{r} \frac{1}{p (s)} + 1) = H_{r} (S) + 1

.

Załóżmy zatem, że $p (s)$ może być równe 0. Jeśli

\sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} < 1

to łatwo możemy rozszerzyć definicję $ℓ$ na wszystkie s, tak że nierówność Krafta $\sum_{s \in S} \frac{1}{r^{ℓ (s)}} \leq 1$ dalej będzie spełniona. Będzie zatem istniał kod o długościach $ℓ$ , spełniający $ℓ (s) < \log_{r} \frac{1}{p (s)} + 1$ zawsze, gdy $p (s) > 0$ , a więc

\sum_{s \in S} p (s) \cdot ℓ (s) < \sum_{s \in S} p (s) \cdot (\log_{r} \frac{1}{p (s)} + 1) = H_{r} (S) + 1

(Pamiętamy o naszej konwencji $0 \cdot \log \frac{1}{0} = 0$ .)

Ostatni przypadek to taki, gdy

\sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} = 1

Wybierzmy s’, takie że $p (s^{'}) > 0$ , i zdefiniujmy nowe długości

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \ell' (s') & = \ell (s') + 1\\ \ell' (s) & = \ell (s), \mbox{ dla } s \neq s' \endaligned }

Znów możemy rozszerzyć $ℓ^{'}$ na wszystkie $s$ w taki sposób, żeby zachować nierówność Krafta. Aby obliczyć średnią długość kodu musimy zauważyć, że w tym przypadku mieliśmy zawsze $ℓ (s) = \log_{r} \frac{1}{p (s)}$ gdy tylko $p (s) > 0$ . (Wynika to z tego, że z definicji $ℓ$ musi być $\frac{1}{r^{ℓ (s)}} \leq p (s)$ i $1 = \sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} = \sum_{p (s) > 0} p (s)$ , a więc $p (s) = \frac{1}{r^{ℓ (s)}}$ gdy $p (s) > 0$ .)

Kod o długości $ℓ^{'}$ spełnia

\sum_{s \in S} p (s) \cdot ℓ^{'} (s) = \sum_{p (s) > 0} p (s) \cdot ℓ^{'} (s) = p (s^{'}) + \sum_{p (s) > 0} p (s) \cdot ℓ (s)

= p (s^{'}) + H_{r} (S)

Ostatecznie

L_{r} (S) \leq H_{r} (S) + 1

i nierówność nie jest ostra tylko wtedy, gdy nie istnieje żadne

0 < p (s^{'}) < 1

.

Jesteśmy gotowi do sformułowania pierwszego z głównych twierdzeń tego wykładu:

Twierdzenie [Pierwsze Twierdzenie Shannona]

Dla każdej skończonej przestrzeni probabilistycznej S i $r \geq 2$

\lim_{n \to \infty} \frac{L_{r} (S^{n})}{n} = H_{r} (S)

.

Dowód

Z poprzedniego twierdzenia

H_{r} (S^{n}) \leq L_{r} (S^{n}) \leq H_{r} (S^{n}) + 1

Uwzględniając $H_{r} (S^{n}) = n \cdot H_{r} (S)$ , dostajemy

H_{r} (S) \leq \frac{L_{r} (S^{n})}{n} \leq H_{r} (S) + \frac{1}{n}

@@ Linia 36: / Linia 36: @@
 </math></center>
-Znów możemy rozszerzyć <math>\ell'</math> na wszystkie <math>s</math> w taki sposób, żeby zachować nierówność Krafta. Aby obliczyć średnią długość kodu musimy zauważyć, że w tym przypadku mieliśmy zawsze <math>\ell (s) = \log_r \frac{1}{p(s) }</math> gdy tylko <math>p(s) > 0</math>. (Wynika to z tego, że z definicji <math>\ell</math> musi być <math>\frac{1}{r^{\ell (s)}} \leq p(s)</math> i <math>1 = \sum_{p(s) > 0} \frac{1}{r^{\ell (s)}} = \sum_{p(s) > 0} p(s)</math>, a więc <math> p(s) = \frac{1}{r^{\ell (s)}}</math> gdy <math>p(s) > 0</math>.) Kod o długości <math>\ell'</math> spełnia
+Znów możemy rozszerzyć <math>\ell'</math> na wszystkie <math>s</math> w taki sposób, żeby zachować nierówność Krafta. Aby obliczyć średnią długość kodu musimy zauważyć, że w tym przypadku mieliśmy zawsze <math>\ell (s) = \log_r \frac{1}{p(s) }</math> gdy tylko <math>p(s) > 0</math>. (Wynika to z tego, że z definicji <math>\ell</math> musi być <math>\frac{1}{r^{\ell (s)}} \leq p(s)</math> i <math>1 = \sum_{p(s) > 0} \frac{1}{r^{\ell (s)}} = \sum_{p(s) > 0} p(s)</math>, a więc <math> p(s) = \frac{1}{r^{\ell (s)}}</math> gdy <math>p(s) > 0</math>.)
-<center><math>\sum_{s \in S} p(s) \cdot {\ell}' (s) = \sum_{p(s) > 0} p(s) \cdot {\ell}' (s) = p(s') + \sum_{p(s) > 0} p(s) \cdot {\ell} (s) =  p(s') + H_r (S)</math></center>
+Kod o długości <math>\ell'</math> spełnia
+<center><math>\sum_{s \in S} p(s) \cdot {\ell}' (s) = \sum_{p(s) > 0} p(s) \cdot {\ell}' (s) = p(s') + \sum_{p(s) > 0} p(s) \cdot {\ell} (s) </math></center>
+<center><math> =  p(s') + H_r (S)</math></center>
 Ostatecznie <math>L_r (S) \leq H_r (S) + 1</math> i nierówność nie jest ostra tylko wtedy, gdy nie istnieje żadne <math>0 < p(s') <1</math>.}}

Teoria informacji/TI Wykład 4: Różnice pomiędzy wersjami

Wersja z 20:02, 1 paź 2006

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia