Teoria informacji/TI Wykład 12: Różnice pomiędzy wersjami

Wersja z 15:47, 11 gru 2006

Wracamy do szacowania $P r_{E} (Δ, C)$ . Przypomnijmy, że wyprowadzone na poprzednim wykładzie szacowanie obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz, że dla wystarczająco dużych n istnieje kod C, który spełnia warunki Twierdzenia Shannona. W szczególności taki, dla którego drugi składnik szacowania można ograniczyć z góry przez $\frac{δ}{2}$ .

Do dowodu użyjemy metody probabilistycznej. Ustalmy $m < 2^{n}$ . Niech $𝒞$ będzie zbiorem wszystkich możliwych m-elementowych sekwencji $c_{1}, \dots, c_{m} \in {0, 1}^{n}$ , takich że $c_{i}$ są parami różne. Niech $N = | 𝒞 |$ .

N = (\binom{2^{n}}{m}) \cdot m!

Od tego miejsca będziemy używać notacji $\bar{C}$ na oznaczenie sekwencji z $𝒞$ . Argument probabilistyczny Shannona opiera się na prostej obserwacji. Jeśli

\frac{1}{N} \sum_{\bar{C}} P r_{E} (Δ, \bar{C}) \leq δ

to istnieje kod C, taki że $P r_{E} (Δ, C) \leq δ$ .

Zauważmy, że jeśli $\bar{C}$ jest sekwencją w $𝒞$ o wartościach $C = {c_{1}, \dots, c_{m}}$ to

\sum_{u \in C} \sum_{v \in C - {u}} p (d (v, u \oplus E) \leq ρ) = \sum_{i = 1}^{m} \sum_{j \neq i} p (d (c_{j}, c_{i} \oplus E) \leq ρ)

Nasze szacowanie daje zatem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} Pr_E ( \Delta , \bar{C} ) & \leq \frac{1}{N} \sum_{\bar{C}} \left( \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho ) \right) \\ & = \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \underbrace{\frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho )}_{(*)} \endaligned }

Oszacujemy teraz (*) dla ustalonej pary indeksów $i \neq j$ .

Dla $e \in {0, 1}^{n}$ niech $S_{ρ} (e)$ oznacza kulę w ${0, 1}^{n}$ o promieniu $ρ$ i środku w punkcie e, tzn.

S_{ρ} (e) = {v \in {0, 1}^{n} : d (v, e) \leq ρ}

Łatwo zauważyć, że

d (v, u \oplus e) \leq ρ ⟺ v \oplus u \in S_{ρ} (e)

Zatem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho ) & = \frac{1}{N} \sum_{\bar{C}} p \left( c_i \oplus c_j \in S_{\rho } (E) \right) \\ & = \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \underbrace{\frac{1}{N} \sum_{\bar{C}} \chi (c_i \oplus c_j \in S_{\rho } (e) )}_{(**)} \endaligned }

(gdzie $χ$ oznacza funkcję charakterystyczną: $χ (φ) = 1 ⟺ φ$ jest spełniona).

Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż $0^{n}$ pojawia się jako $c_{i} \oplus c_{j}$ dla pewnej sekwencji $\bar{C} \in 𝒞$ , i łatwo zauważyć, że każdy taki wektor pojawia się taką samą liczbę razy, tzn.

| {\bar{C} : u = c_{i} \oplus c_{j}} | = | {\bar{C} : v = c_{i} \oplus c_{j}} | = \frac{N}{2^{n} - 1}

dla dowolnych $u, v \in {0, 1}^{n} - {0^{n}}$ . A zatem każde $u \in S_{ρ} (e) - {0^{n}}$ dodaje $\frac{N}{2^{n} - 1}$ do sumy $\sum_{\bar{C}} χ (c_{i} \oplus c_{j} \in S_{ρ} (e))$ , czyli

\sum_{\bar{C}} \cdot χ (c_{i} \oplus c_{j} \in S_{ρ} (e)) = \frac{N}{2^{n} - 1} | S_{ρ} (e) - {0^{n}} |

Możemy to teraz zsumować po możliwych wartościach e:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \frac{1}{N} \sum_{\bar{C}} \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) & = \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \\ & = \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \endaligned }

Znamy ponadto objętość $S_{ρ} (e)$ , więc

| S_{ρ} (e) - {0^{n}} | \leq 2^{n \cdot H (ρ)} = 2^{n \cdot H (Q + η)}

Wracając do głównego szacowania, dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) & \leq \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \frac{1}{2^n - 1} \cdot 2^{n \cdot H(Q + \eta )} \\ & = \frac{\delta }{2} + \frac{1}{m} \cdot m \cdot \underbrace{(m-1) \cdot \frac{1}{2^n - 1}}_{\leq \frac{m}{2^n}} \cdot 2^{n \cdot H(Q + \eta )} \\ & \leq \frac{\delta }{2} + \frac{m}{2^n} \cdot 2^{n \cdot H(Q + \eta )} \\ & = \frac{\delta }{2} + 2^{ n \cdot \left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right) } \endaligned }

Jesteśmy tu już blisko celu, gdyż $(\frac{\log_{2} m}{n} + H (Q + η) - 1)$ odpowiada „prawie” $R (C) - C_{Γ}$ .

Konkretniej, do tej pory wiemy, że powyższe równanie jest spełnione dla wystarczająco dużych n, np. $n \geq n_{1}$ , i dla $2 \leq m \leq 2^{n}$ , Parser nie mógł rozpoznać (błąd składni): {\displaystyle 0 < \eta < \frac{1}{2} – Q} . Twierdzimy, że można dobrać $n_{0} \geq n_{1}$ m i </math>\eta</math> w ten sposób, że dla dowolnego $n \geq n_{0}$ spełnione jest

Parser nie mógł rozpoznać (nieznana funkcja „\label”): {\displaystyle C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } \label{(i)} }

\frac{\log_{2} m}{n} + H (Q + η) - 1 \leq - \frac{ε}{3}

W szczególności druga nierówność implikuje

2^{n \cdot (\frac{\log_{2} m}{n} + H (Q + η) - 1)} \leq \frac{1}{2^{n \cdot \frac{ε}{3}}}

A więc jeśli n jest wystarczająco duże, dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\pr”): {\displaystyle \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) \leq \frac{\delta }{2} + \frac{\delta }{2} = \delta }

Używając argumentu probabilistycznego, wnioskujemy, że musi istnieć kod C rozmiaru m, spełniający $P r_{E} (Δ, C) \leq δ$ . Ponieważ $R (C) = \frac{\log_{2} m}{n}$ , ten kod spełnia warunki Shannona.

Wybór spełniający oba konieczne warunki najłatwiej przedstawić na diagramie

Używając ciągłości H, wybieramy $η$ takie, że $C_{Γ} - \frac{1}{3} \cdot ε \leq 1 - H (Q + η) \leq C_{Γ}$ . Jeśli n jest wystarczająco duże, potem możemy znaleźć k takie, że $C_{Γ} - ε \leq \frac{k}{n} \leq C_{Γ} - \frac{2}{3} \cdot ε$ . Tym samym oba warunki są spełnione, co kończy dowód.

@@ Linia 7: / Linia 7: @@
 <center><math>\frac{1}{N} \sum_{\bar{C}} Pr_E ( \Delta , \bar{C}) \leq \delta</math></center>
-to istnieje kod C, taki że <math>Pr_E(\Delta,\bar{C}) \le \delta </math>.
+to istnieje kod C, taki że <math>Pr_E(\Delta,{C}) \le \delta </math>.
-Zauważmy, że jeśli <math>\bar{C}</math> jest sekwencją w <math>\mathcal{C}</math> o wartościach <math>C=\{c_1, \ldots, \c_m \}</math> to
+Zauważmy, że jeśli <math>\bar{C}</math> jest sekwencją w <math>\mathcal{C}</math> o wartościach
+<math>C=\{c_1, \ldots, c_m \}</math> to
 <center><math> \sum_{u \in C} \sum_{v \in C - \{ u \}} p ( d (v,u \oplus E) \leq \rho ) =
 \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho )</math></center>
@@ Linia 16: / Linia 17: @@
 <center>{{kotwica|metoda_prob2|}}<math>\aligned
-\frac{1}{N} \sum_{\bar{C}} \pr_E ( \Delta , \bar{C} ) & \leq
+\frac{1}{N} \sum_{\bar{C}} Pr_E ( \Delta , \bar{C} ) & \leq
 \frac{1}{N} \sum_{\bar{C}} \left( \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho ) \right) \\
 & = \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i}
@@ Linia 38: / Linia 39: @@
 \frac{1}{N} \sum_{\bar{C}} p \left( c_i \oplus c_j \in S_{\rho } (E) \right) \\
 & = \sum_{e \in \{ 0, 1 \}^n } p (E = e)  \cdot \underbrace{\frac{1}{N} \sum_{\bar{C}}
- \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )}_{(**)}
+  \chi (c_i \oplus c_j \in S_{\rho } (e) )}_{(**)}
 \endaligned
 </math></center>
@@ Linia 44: / Linia 45: @@
 (gdzie <math>\chi</math> oznacza funkcję charakterystyczną: <math>\chi(\varphi)=1 \Longleftrightarrow \varphi</math> jest spełniona).
-Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż <math>0^n</math> pojawia się jako <math>c_i \oplus c_j</math> dla pewnej sekwencji <math>\bar{C} \in \mathcal{C}</math>, i łatwo zauważyć, że każdy taki wektor pojawia się taką samą liczbę razy
+Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż <math>0^n</math> pojawia się jako <math>c_i \oplus c_j</math> dla pewnej sekwencji <math>\bar{C} \in \mathcal{C}</math>, i łatwo zauważyć, że każdy taki wektor pojawia się taką samą liczbę razy, tzn.
 <center><math>| \{ \bar{C} : u = c_i \oplus c_j \} |  = | \{ \bar{C} : v = c_i \oplus c_j \} |  = \frac{N}{2^n - 1}</math></center>
 dla dowolnych <math>u,v \in \{0,1\}^n-\{0^n\}</math>. A zatem każde <math>u \in S_{\rho}(e) - \{0^n\}</math> dodaje <math>\frac{N}{2^n-1}</math> do sumy <math>\sum_{\bar{C}}
-\cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )</math>, czyli
+ \chi (c_i \oplus c_j \in S_{\rho } (e) )</math>, czyli
 <center><math>\sum_{\bar{C}}  \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) =
 \frac{N}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} |</math></center>

Teoria informacji/TI Wykład 12: Różnice pomiędzy wersjami

Wersja z 15:47, 11 gru 2006

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia