Teoria informacji/TI Wykład 4: Różnice pomiędzy wersjami

Wersja z 10:44, 5 wrz 2023

Minimalna długość kodu - kontynuacja

Aby oszacować $\frac{L_{r} (S^{n})}{n} - H_{r} (S)$ , zaczniemy od uzupełnienia naszej nierówności o górne ograniczenie.

Twierdzenie [Kod Shannona-Fano]

Dla dowolnej skończonej przestrzeni probabilistycznej S i

r \geq 2

, istnieje kod

φ : S \to Σ^{*}

(gdzie

| Σ | = r

), spełniający

L (φ) \leq H_{r} (S) + 1

W ten sposób mamy

H_{r} (S) \leq L_{r} (S) \leq H_{r} (S) + 1

Dodatkowo, ścisła nierówność

L_{r} (S) < H_{r} (S) + 1

jest prawdziwa za wyjątkiem przypadku

p (s) = 1

dla pewnego

s \in S

(wtedy

H_{r} (S) = 0

).

Dowód

Dla

| S | = 1

mamy trywialnie

H_{r} (S) = 0

i

L_{r} (S) = 1

. Załóżmy że

| S | \geq 2

. Niech

ℓ (s) = ⌈ \log_{r} \frac{1}{p (s)} ⌉

dla tych $s \in S$ , dla których $p (s) > 0$ . Wtedy

\sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} \leq \sum_{p (s) > 0} p (s) = \sum_{s \in S} p (s) = 1

Rozważmy kilka przypadków. W najprostszym, kiedy $(\forall s \in S) p (s) > 0$ , powyższa nierówność odpowiada dokładnie nierówności Krafta, a zatem istnieje kod $φ$ spełniający $| φ (s) | = ℓ (s)$ dla wszystkich $s \in S$ . Uwzględniając, że $ℓ (s) < \log_{r} \frac{1}{p (s)} + 1$ , dostajemy

\sum_{s \in S} p (s) \cdot ℓ (s) < \sum_{s \in S} p (s) \cdot (\log_{r} \frac{1}{p (s)} + 1) = H_{r} (S) + 1

.

Załóżmy zatem, że $p (s)$ może być równe 0. Jeśli

\sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} < 1

to łatwo możemy rozszerzyć definicję $ℓ$ na wszystkie s, tak że nierówność Krafta $\sum_{s \in S} \frac{1}{r^{ℓ (s)}} \leq 1$ dalej będzie spełniona. Będzie zatem istniał kod o długościach $ℓ$ , spełniający $ℓ (s) < \log_{r} \frac{1}{p (s)} + 1$ zawsze, gdy $p (s) > 0$ , a więc

\sum_{s \in S} p (s) \cdot ℓ (s) < \sum_{s \in S} p (s) \cdot (\log_{r} \frac{1}{p (s)} + 1) = H_{r} (S) + 1

(Pamiętamy o naszej konwencji $0 \cdot \log \frac{1}{0} = 0$ .)

Ostatni przypadek to taki, gdy

\sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} = 1

Wybierzmy s’, takie że $p (s^{'}) > 0$ , i zdefiniujmy nowe długości

\begin{aligned} ℓ^{'} (s^{'}) & = ℓ (s^{'}) + 1 \\ ℓ^{'} (s) & = ℓ (s), dla s \neq s^{'} \end{aligned}

Znów możemy rozszerzyć $ℓ^{'}$ na wszystkie $s$ w taki sposób, żeby zachować nierówność Krafta. Aby obliczyć średnią długość kodu musimy zauważyć, że w tym przypadku mieliśmy zawsze $ℓ (s) = \log_{r} \frac{1}{p (s)}$ gdy tylko $p (s) > 0$ . (Wynika to z tego, że z definicji $ℓ$ musi być $\frac{1}{r^{ℓ (s)}} \leq p (s)$ i $1 = \sum_{p (s) > 0} \frac{1}{r^{ℓ (s)}} = \sum_{p (s) > 0} p (s)$ , a więc $p (s) = \frac{1}{r^{ℓ (s)}}$ gdy $p (s) > 0$ .)

Kod o długości $ℓ^{'}$ spełnia

\sum_{s \in S} p (s) \cdot ℓ^{'} (s) = \sum_{p (s) > 0} p (s) \cdot ℓ^{'} (s) = p (s^{'}) + \sum_{p (s) > 0} p (s) \cdot ℓ (s)

= p (s^{'}) + H_{r} (S)

Ostatecznie

L_{r} (S) \leq H_{r} (S) + 1

i nierówność nie jest ostra tylko wtedy, gdy nie istnieje żadne

0 < p (s^{'}) < 1

.

Jesteśmy gotowi do sformułowania pierwszego z głównych twierdzeń tego wykładu:

Twierdzenie [Pierwsze Twierdzenie Shannona]

Dla każdej skończonej przestrzeni probabilistycznej S i $r \geq 2$

\lim_{n \to \infty} \frac{L_{r} (S^{n})}{n} = H_{r} (S)

.

Dowód

Z poprzedniego twierdzenia

H_{r} (S^{n}) \leq L_{r} (S^{n}) \leq H_{r} (S^{n}) + 1

Uwzględniając $H_{r} (S^{n}) = n \cdot H_{r} (S)$ , dostajemy

H_{r} (S) \leq \frac{L_{r} (S^{n})}{n} \leq H_{r} (S) + \frac{1}{n}

@@ Linia 24: / Linia 24: @@
 <center><math>\sum_{p(s) > 0} \frac{1}{r^{\ell (s)}} <1</math></center>
 to łatwo możemy rozszerzyć definicję <math>\ell</math> na wszystkie ''s'', tak że nierówność Krafta <math>\sum_{s \in S}  \frac{1}{r^{\ell (s)}} \leq 1</math> dalej będzie spełniona. Będzie zatem istniał kod o długościach <math>\ell</math>, spełniający <math>{\ell }(s) < \log_r \frac{1}{p(s)} +1</math> zawsze, gdy <math>p(s)>0</math>, a więc
-<center><math>\sum_{s \in S} p(s) \cdot {\ell }(s) < \sum_{s \in S} p(s) \cdot \left( \log_r \frac{1}{p(s)} +1 \right) = H_r(S) + 1 </math></center>
+<center><math>\sum_{s \in S} p(s) \cdot {\ell }(s) < \sum_{s \in S} p(s) \cdot \left( \log_r \frac{1}{p(s)} +1 \right) = H_r(S) + 1</math></center>
 (Pamiętamy o naszej konwencji <math>0 \cdot \log \frac{1}{0} = 0</math>.)
@@ Linia 43: / Linia 43: @@
 Kod o długości <math>\ell'</math> spełnia
-<center><math>\sum_{s \in S} p(s) \cdot {\ell}' (s) = \sum_{p(s) > 0} p(s) \cdot {\ell}' (s) = p(s') + \sum_{p(s) > 0} p(s) \cdot {\ell} (s) </math></center>
+<center><math>\sum_{s \in S} p(s) \cdot {\ell}' (s) = \sum_{p(s) > 0} p(s) \cdot {\ell}' (s) = p(s') + \sum_{p(s) > 0} p(s) \cdot {\ell} (s)</math></center>
 <center><math> =  p(s') + H_r (S)</math></center>

Teoria informacji/TI Wykład 4: Różnice pomiędzy wersjami

Wersja z 10:44, 5 wrz 2023

Minimalna długość kodu - kontynuacja

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia