Teoria informacji/TI Wykład 4: Różnice pomiędzy wersjami

Wersja z 19:11, 16 paź 2006

Minimalna długość kodu - kontynuacja

Aby oszacować $\frac{L_{r} (S^{n})}{n} - H_{r} (S)$ , zaczniemy od uzupełnienia naszej nierówności o górne ograniczenie.

Twierdzenie [Kod Shannona-Fano]

Dla dowolnej skończonej przestrzeni probabilistycznej S i

r \geq 2

, istnieje kod

φ : S \to Σ^{*}

(gdzie

| Σ | = r

), spełniający

L (φ) \leq H_{r} (S) + 1

W ten sposób mamy

H_{r} (S) \leq L_{r} (S) \leq H_{r} (S) + 1

Dodatkowo, ścisła nierówność

L_{r} (S) < H_{r} (S) + 1

jest prawdziwa za wyjątkiem przypadku

p (s) = 1

dla pewnego

s \in S

(wtedy

H_{r} (S) = 0

).

Dowód

Dla

| S | = 1

mamy trywialnie

H_{r} (S) = 0

i

L_{r} (S) = 1

. Załóżmy że

| S | \geq 2

. Niech

ℓ (s) = ⌈ \log_{r} \frac{1}{p (s)} ⌉

dla tych $s \in S$ , dla których $p (s) > 0$ . Wtedy

\sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} \leq \sum_{p (s) > 0} p (s) = \sum_{s \in S} p (s) = 1

Rozważmy kilka przypadków. W najprostszym, kiedy $(\forall s \in S) p (s) > 0$ , powyższa nierówność odpowiada dokładnie nierówności Krafta, a zatem istnieje kod $φ$ spełniający $| φ (s) | = ℓ (s)$ dla wszystkich $s \in S$ . Uwzględniając, że $ℓ (s) < \log_{r} \frac{1}{p (s)} + 1$ , dostajemy

\sum_{s \in S} p (s) \cdot ℓ (s) < \sum_{s \in S} p (s) \cdot (\log_{r} \frac{1}{p (s)} + 1) = H_{r} (S) + 1

.

Załóżmy zatem, że $p (s)$ może być równe 0. Jeśli

\sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} < 1

to łatwo możemy rozszerzyć definicję $ℓ$ na wszystkie s, tak że nierówność Krafta $\sum_{s \in S} \frac{1}{r^{ℓ (s)}} \leq 1$ dalej będzie spełniona. Będzie zatem istniał kod o długościach $ℓ$ , spełniający $ℓ (s) < \log_{r} \frac{1}{p (s)} + 1$ zawsze, gdy $p (s) > 0$ , a więc

\sum_{s \in S} p (s) \cdot ℓ (s) < \sum_{s \in S} p (s) \cdot (\log_{r} \frac{1}{p (s)} + 1) = H_{r} (S) + 1

(Pamiętamy o naszej konwencji $0 \cdot \log \frac{1}{0} = 0$ .)

Ostatni przypadek to taki, gdy

\sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} = 1

Wybierzmy s’, takie że $p (s^{'}) > 0$ , i zdefiniujmy nowe długości

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \ell' (s') & = \ell (s') + 1\\ \ell' (s) & = \ell (s), \mbox{ dla } s \neq s' \endaligned }

Znów możemy rozszerzyć $ℓ^{'}$ na wszystkie $s$ w taki sposób, żeby zachować nierówność Krafta. Aby obliczyć średnią długość kodu musimy zauważyć, że w tym przypadku mieliśmy zawsze $ℓ (s) = \log_{r} \frac{1}{p (s)}$ gdy tylko $p (s) > 0$ . (Wynika to z tego, że z definicji $ℓ$ musi być $\frac{1}{r^{ℓ (s)}} \leq p (s)$ i $1 = \sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} = \sum_{p (s) > 0} p (s)$ , a więc $p (s) = \frac{1}{r^{ℓ (s)}}$ gdy $p (s) > 0$ .)

Kod o długości $ℓ^{'}$ spełnia

\sum_{s \in S} p (s) \cdot ℓ^{'} (s) = \sum_{p (s) > 0} p (s) \cdot ℓ^{'} (s) = p (s^{'}) + \sum_{p (s) > 0} p (s) \cdot ℓ (s)

= p (s^{'}) + H_{r} (S)

Ostatecznie

L_{r} (S) \leq H_{r} (S) + 1

i nierówność nie jest ostra tylko wtedy, gdy nie istnieje żadne

0 < p (s^{'}) < 1

.

Jesteśmy gotowi do sformułowania pierwszego z głównych twierdzeń tego wykładu:

Twierdzenie [Pierwsze Twierdzenie Shannona]

Dla każdej skończonej przestrzeni probabilistycznej S i $r \geq 2$

\lim_{n \to \infty} \frac{L_{r} (S^{n})}{n} = H_{r} (S)

.

Dowód

Z poprzedniego twierdzenia

H_{r} (S^{n}) \leq L_{r} (S^{n}) \leq H_{r} (S^{n}) + 1

Uwzględniając $H_{r} (S^{n}) = n \cdot H_{r} (S)$ , dostajemy

H_{r} (S) \leq \frac{L_{r} (S^{n})}{n} \leq H_{r} (S) + \frac{1}{n}

@@ Linia 18: / Linia 18: @@
 <center><math>\sum_{p(s) > 0} \frac{1}{r^{\ell (s)}} \leq \sum_{p(s) > 0} p(s) = \sum_{s \in S} p(s) = 1</math></center>
-Rozważmy kilka przypadków. W najprostszym, kiedy <math>(\forall s \in S) \, p(s) > 0</math>, powyższa nierówność odpowiada dokładnie nierówności Krafta, a zatem istnieje kod <math>\varphi</math> spełniający <math>| \varphi (s)| = \ell (s)</math> dla wszystkich <math>s \in S</math>. Uwzględniając, że <math>{\ell }(s) < \log_r \frac{1}{p(s)} +1</math>, dostajemy
+Rozważmy kilka przypadków. W najprostszym, kiedy <math>(\forall s \in S) \, p(s) > 0</math>, powyższa nierówność odpowiada dokładnie [[Teoria informacji/TI Wykład 1#kraft|nierówności Krafta]], a zatem istnieje kod <math>\varphi</math> spełniający <math>| \varphi (s)| = \ell (s)</math> dla wszystkich <math>s \in S</math>. Uwzględniając, że <math>{\ell }(s) < \log_r \frac{1}{p(s)} +1</math>, dostajemy
 <center><math>\sum_{s \in S} p(s) \cdot {\ell }(s) < \sum_{s \in S} p(s) \cdot \left( \log_r \frac{1}{p(s)} +1 \right) = H_r(S) + 1</math>.</center>

Teoria informacji/TI Wykład 4: Różnice pomiędzy wersjami

Wersja z 19:11, 16 paź 2006

Minimalna długość kodu - kontynuacja

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia