Teoria informacji/TI Wykład 12: Różnice pomiędzy wersjami

Wersja z 17:33, 2 sie 2006

Wracamy do szacowania $P r_{E} (Δ, C)$ . Przypomnijmy że wyprowadzone na poprzednim wykładzie szacowanie obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz że dla wystarczająco dużych n istnieje kod C który spełnia warunki Twierdzenia Shannona. W szczególności taki dla którego drugi składnik szacowania można ograniczyć z góry przez $\frac{δ}{2}$ .

Do dowodu użyjemy metody probabilistycznej. Ustalmy $m < 2^{n}$ . Niech $𝒞$ będzie zbiorem wszystkich możliwych m-elementowych sekwencji $c_{1}, \dots, c_{m} \in {0, 1}^{n}$ takich że $c_{i}$ są parami różne. Niech $N = | 𝒞 |$ .

N = (\binom{2^{n}}{m}) \cdot m!

Od tego miejsca będziemy używać notacji $\bar{C}$ na oznaczenie sekwencji z $𝒞$ . Argument probabilistyczny Shannona opiera się na prostej obserwacji. Jeśli

\frac{1}{N} \sum_{\bar{C}} P r_{E} (Δ, \bar{C}) \leq δ

to istnieje kod C taki że $P r_{E} (Δ, \bar{C}) \leq δ$ .

Zauważmy że jeśli $\bar{C}$ jest sekwencją w $𝒞$ o wartościach Parser nie mógł rozpoznać (nieznana funkcja „\c”): {\displaystyle C=\{c_1, \ldots, \c_m \}} to

\sum_{u \in C} \sum_{v \in C - {u}} p (d (v, u \oplus E) \leq ρ) = \sum_{i = 1}^{m} \sum_{j \neq i} p (d (c_{j}, c_{i} \oplus E) \leq ρ)

Nasze szacowanie daje zatem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} \pr_E ( \Delta , \bar{C} ) & \leq \frac{1}{N} \sum_{\bar{C}} \left( \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho ) \right) \\ & = \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \underbrace{\frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho )}_{(*)} \endaligned }

Oszacujemy teraz (*) dla ustalonej pary indeksów $i \neq j$ .

Dla $e \in {0, 1}^{n}$ niech $S_{ρ} (e)$ oznacza kulę w ${0, 1}^{n}$ o promieniu $ρ$ i środku w punkcie e, tzn.

S_{ρ} (e) = {v \in {0, 1}^{n} : d (v, e) \leq ρ}

Łatwo zauważyć że

d (v, u \oplus e) \leq ρ ⟺ v \oplus u \in S_{ρ} (e)

Zatem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho ) & = \frac{1}{N} \sum_{\bar{C}} p \left( c_i \oplus c_j \in S_{\rho } (E) \right) \\ & = \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \underbrace{\frac{1}{N} \sum_{\bar{C}} \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )}_{(**)} \endaligned }

(gdzie $χ$ oznacza funkcję charakterystyczną: $χ (φ) = 1 ⟺ φ$ jest spełniona).

Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż $0^{n}$ pojawia się jako $c_{i} \oplus c_{j}$ dla pewnej sekwencji $\bar{C} \in 𝒞$ , i łatwo zauważyć że każdy taki wektor pojawia się taką samą liczbę razy

| {\bar{C} : u = c_{i} \oplus c_{j}} | = | {\bar{C} : v = c_{i} \oplus c_{j}} | = \frac{N}{2^{n} - 1}

dla dowolnych $u, v \in {0, 1}^{n} - {0^{n}}$ . A zatem każde $u \in S_{ρ} (e) - {0^{n}}$ dodaje $\frac{N}{2^{n} - 1}$ do sumy $\sum_{\bar{C}} \cdot χ (c_{i} \oplus c_{j} \in S_{ρ} (e))$ , czyli

\sum_{\bar{C}} \cdot χ (c_{i} \oplus c_{j} \in S_{ρ} (e)) = \frac{N}{2^{n} - 1} | S_{ρ} (e) - {0^{n}} |

Możemy to teraz zsumować po możliwych wartościach e:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \frac{1}{N} \sum_{\bar{C}} \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) & = \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \\ & = \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \endaligned }

Znamy ponadto objętość $S_{ρ} (e)$ , więc

| S_{ρ} (e) - {0^{n}} | \leq 2^{n \cdot H (ρ)} = 2^{n \cdot H (Q + η)}

Wracając do głównego szacowania dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) & \leq \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \frac{1}{2^n - 1} \cdot 2^{n \cdot H(Q + \eta )} \\ & = \frac{\delta }{2} + \frac{1}{m} \cdot m \cdot \underbrace{(m-1) \cdot \frac{1}{2^n - 1}}_{\leq \frac{m}{2^n}} \cdot 2^{n \cdot H(Q + \eta )} \\ & \leq \frac{\delta }{2} + \frac{m}{2^n} \cdot 2^{n \cdot H(Q + \eta )} \\ & = \frac{\delta }{2} + 2^{ n \cdot \left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right) } \endaligned }

Jesteśmy tu już blisko celu, gdyż $(\frac{\log_{2} m}{n} + H (Q + η) - 1)$ odpowiada „prawie” $R (C) - C_{Γ}$ .

Konkretniej, do tej pory wiemy że powyższe równanie jest spełnione dla wystarczająco dużych n, np. $n \geq n_{1}$ , i dla $2 \leq m \leq 2^{n}$ , Parser nie mógł rozpoznać (błąd składni): {\displaystyle 0 < \eta < \frac{1}{2} – Q} . Twierdzimy że można dobrać $n_{0} \geq n_{1}$ m i </math>\eta</math> w ten sposób że dla dowolnego $n \geq n_{0}$ spełnione jest

Parser nie mógł rozpoznać (nieznana funkcja „\label”): {\displaystyle C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } \label{(i)} }

\frac{\log_{2} m}{n} + H (Q + η) - 1 \leq - \frac{ε}{3}

W szczególności druga nierówność implikuje

2^{n \cdot (\frac{\log_{2} m}{n} + H (Q + η) - 1)} \leq \frac{1}{2^{n \cdot \frac{ε}{3}}}

A więc jeśli n jest wystarczająco duże, to dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\pr”): {\displaystyle \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) \leq \frac{\delta }{2} + \frac{\delta }{2} = \delta }

Używając argumentu probabilistycznego wnioskujemy że musi istnieć kod C rozmiaru m, spełniający $P r_{E} (Δ, C) \leq δ$ . Ponieważ $R (C) = \frac{\log_{2} m}{n}$ , ten kod spełnia warunki Shannona.

Wybór spełniający oba konieczne warunki najłatwiej przedstawić na diagramie

Używając ciągłości H, wybieramy $η$ takie że $C_{Γ} - \frac{1}{3} \cdot ε \leq 1 - H (Q + η) \leq C_{Γ}$ . Jeśli n jest wystarczająco duże, to potem możemy znaleźć k takie że $C_{Γ} - ε \leq \frac{k}{n} \leq C_{Γ} - \frac{2}{3} \cdot ε$ . Tym samym oba warunki są spełnione, co kończy dowód.

@@ Linia 1: / Linia 1: @@
-Wracamy do szacowania <math>Pr_E(\Delta, C)</math>. Przypomnijmy że (link TODO) obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz że dla wystarczająco dużych n ''istnieje'' kod C który spełnia warunki Twierdzenia Shannona. W szczególności taki dla którego drugi składnik (link TODO) można ograniczyć z góry przez <math>\frac{\delta}{2}</math>.
+Wracamy do szacowania <math>Pr_E(\Delta, C)</math>. Przypomnijmy że wyprowadzone na poprzednim wykładzie [[Teoria informacji/TI Wykład 11#metoda_prob|szacowanie]] obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz że dla wystarczająco dużych n ''istnieje'' kod C który spełnia warunki Twierdzenia Shannona. W szczególności taki dla którego drugi składnik [[Teoria informacji/TI Wykład 11#metoda_prob|szacowania]] można ograniczyć z góry przez <math>\frac{\delta}{2}</math>.
 Do dowodu użyjemy ''metody probabilistycznej''. Ustalmy <math>m < 2^n</math>. Niech <math>\mathcal{C}</math> będzie zbiorem wszystkich możliwych m-elementowych sekwencji <math>c_1, \ldots, c_m \in \{0,1\}^n</math> takich że <math>c_i</math> są parami różne. Niech <math>N = |\mathcal{C}|</math>.
-:<math> N = {2^n \choose m}  \cdot m!</math>
+<center><math> N = {2^n \choose m}  \cdot m!</math></center>
 Od tego miejsca będziemy używać notacji <math>\bar{C}</math> na oznaczenie sekwencji z <math>\mathcal{C}</math>. Argument probabilistyczny Shannona opiera się na prostej obserwacji. Jeśli
-:<math>\frac{1}{N} \sum_{\bar{C}} Pr_E ( \Delta , \bar{C}) \leq \delta</math>
+<center><math>\frac{1}{N} \sum_{\bar{C}} Pr_E ( \Delta , \bar{C}) \leq \delta</math></center>
 to istnieje kod C taki że <math>Pr_E(\Delta,\bar{C}) \le \delta </math>.
 Zauważmy że jeśli <math>\bar{C}</math> jest sekwencją w <math>\mathcal{C}</math> o wartościach <math>C=\{c_1, \ldots, \c_m \}</math> to
-:<math> \sum_{u \in C} \sum_{v \in C - \{ u \}} p ( d (v,u \oplus E) \leq \rho ) =
+<center><math> \sum_{u \in C} \sum_{v \in C - \{ u \}} p ( d (v,u \oplus E) \leq \rho ) =
-\sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho )</math>
+\sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho )</math></center>
-A z (link TODO) dostajemy
+Nasze [[Teoria informacji/TI Wykład 11#metoda_prob|szacowanie]] daje zatem
-<math>\frac{1}{N} \sum_{\bar{C}} \pr_E ( \Delta , \bar{C} ) \leq
+<center>{{kotwica|metoda_prob2|}}<math>\aligned
-\frac{1}{N} \sum_{\bar{C}} \left( \frac{\delta }{2} +
+\frac{1}{N} \sum_{\bar{C}} \pr_E ( \Delta , \bar{C} ) & \leq
-\frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho )
+\frac{1}{N} \sum_{\bar{C}} \left( \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho ) \right) \\
-\right) </math>
+& = \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i}
-::<math>= \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i}
+\underbrace{\frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho )}_{(*)}
-\underbrace{\frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho )}_{(*)}</math>
+\endaligned
+</math></center>
@@ Linia 26: / Linia 27: @@
 Dla <math>e \in \{0,1\}^n</math> niech <math>S_{\rho } (e)</math> oznacza kulę w <math>\{0,1\}^n</math> o promieniu <math>\rho</math> i środku w punkcie e, tzn.
-:<math>S_{\rho } (e) = \{ v \in \{ 0,1 \}^n  : d(v,e) \leq \rho \}</math>
+<center><math>S_{\rho } (e) = \{ v \in \{ 0,1 \}^n  : d(v,e) \leq \rho \}</math></center>
 Łatwo zauważyć że
-:<math>d (v, u \oplus e ) \leq \rho \Longleftrightarrow v \oplus u \in S_{\rho } (e) </math>
+<center><math>d (v, u \oplus e ) \leq \rho \Longleftrightarrow v \oplus u \in S_{\rho } (e) </math></center>
 Zatem
-<math>\frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho ) =
+<center><math>\aligned
-\frac{1}{N} \sum_{\bar{C}} p \left( c_i \oplus c_j \in S_{\rho } (E) \right) </math>
+\frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho ) & =
-::<math>= \sum_{e \in \{ 0, 1 \}^n } p (E = e)  \cdot \underbrace{\frac{1}{N} \sum_{\bar{C}}
+\frac{1}{N} \sum_{\bar{C}} p \left( c_i \oplus c_j \in S_{\rho } (E) \right) \\
-  \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )}_{(**)}</math>
+& = \sum_{e \in \{ 0, 1 \}^n } p (E = e)  \cdot \underbrace{\frac{1}{N} \sum_{\bar{C}}
+  \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )}_{(**)}
+\endaligned
+</math></center>
-(gdzie <math>\chi</math> oznacza funkcję charakterystyczną <math>\chi(\varphi)=1 \Longleftrightarrow \varphi holds</math>).
+(gdzie <math>\chi</math> oznacza funkcję charakterystyczną: <math>\chi(\varphi)=1 \Longleftrightarrow \varphi</math> jest spełniona).
 Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż <math>0^n</math> pojawia się jako <math>c_i \oplus c_j</math> dla pewnej sekwencji <math>\bar{C} \in \mathcal{C}</math>, i łatwo zauważyć że każdy taki wektor pojawia się taką samą liczbę razy
-:<math>| \{ \bar{C} : u = c_i \oplus c_j \} |  = | \{ \bar{C} : v = c_i \oplus c_j \} |  = \frac{N}{2^n - 1}</math>
+<center><math>| \{ \bar{C} : u = c_i \oplus c_j \} |  = | \{ \bar{C} : v = c_i \oplus c_j \} |  = \frac{N}{2^n - 1}</math></center>
 dla dowolnych <math>u,v \in \{0,1\}^n-\{0^n\}</math>. A zatem każde <math>u \in S_{\rho}(e) - \{0^n\}</math> dodaje <math>\frac{N}{2^n-1}</math> do sumy <math>\sum_{\bar{C}}
- \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )</math>, czyli
+\cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )</math>, czyli
-:<math>\sum_{\bar{C}}  \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) =
+<center><math>\sum_{\bar{C}}  \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) =
-\frac{N}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} |</math>
+\frac{N}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} |</math></center>
 Możemy to teraz zsumować po możliwych wartościach e:
-<math>\sum_{e \in \{ 0, 1 \}^n } p (E = e)  \cdot \frac{1}{N} \sum_{\bar{C}}
+<center><math>\aligned
-  \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) = \sum_{e \in \{ 0, 1 \}^n } p (E = e)  \cdot
+\sum_{e \in \{ 0, 1 \}^n } p (E = e)  \cdot \frac{1}{N} \sum_{\bar{C}}
-\frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | </math>
+  \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) & = \sum_{e \in \{ 0, 1 \}^n } p (E = e)  \cdot
-::<math> = \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} |</math>
+\frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \\
+& = \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} |
+\endaligned
+</math></center>
 Znamy ponadto objętość <math>S_{\rho}(e)</math>, więc
-:<math>| S_{\rho } (e) - \{ 0^n \} | \leq 2^{n \cdot H(\rho)} = 2^{n \cdot H(Q + \eta )}</math>
+<center><math>| S_{\rho } (e) - \{ 0^n \} | \leq 2^{n \cdot H(\rho)} = 2^{n \cdot H(Q + \eta )}</math></center>
-Wracając do równania (link TODO) daje to
+Wracając do [[#metoda_prob2|głównego szacowania]] dostajemy
-<math>\frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) \leq
+<center><math>\aligned
-\frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \frac{1}{2^n - 1}  \cdot 2^{n \cdot H(Q + \eta )}</math>
+\frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) & \leq
-::<math> = \frac{\delta }{2} + \frac{1}{m} \cdot m  \cdot \underbrace{(m-1) \cdot \frac{1}{2^n - 1}}_{\leq \frac{m}{2^n}}  \cdot 2^{n \cdot H(Q + \eta )}</math>
+\frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \frac{1}{2^n - 1}  \cdot 2^{n \cdot H(Q + \eta )} \\
-::<math> \leq \frac{\delta }{2} + \frac{m}{2^n} \cdot 2^{n \cdot H(Q + \eta )} </math>
+& = \frac{\delta }{2} + \frac{1}{m} \cdot m  \cdot \underbrace{(m-1) \cdot \frac{1}{2^n - 1}}_{\leq \frac{m}{2^n}}  \cdot 2^{n \cdot H(Q + \eta )} \\
-::<math> = \frac{\delta }{2} + 2^{ n \cdot \left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right) }</math>
+& \leq \frac{\delta }{2} + \frac{m}{2^n} \cdot 2^{n \cdot H(Q + \eta )} \\
+& = \frac{\delta }{2} + 2^{ n \cdot \left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right) }
+\endaligned
+</math></center>
 Jesteśmy tu już blisko celu, gdyż <math>\left(  \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right)</math> odpowiada „prawie” <math>R(C)-C_{\Gamma}</math>.
 Konkretniej, do tej pory wiemy że powyższe równanie jest spełnione dla wystarczająco dużych n, np. <math> n \ge n_1 </math>, i dla <math>2 \le m \le 2^n</math>, <math>0 < \eta < \frac{1}{2} – Q</math>. Twierdzimy że można dobrać <math>n_0 \ge n_1</math> m i </math>\eta</math> w ten sposób że dla dowolnego <math>n \ge n_0</math> spełnione jest
-:<math>C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } \label{(i)} </math>
+<center><math>C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } \label{(i)} </math></center>
-:<math> \frac{\log_2 m}{n}   +  H(Q + \eta ) - 1 \leq - \frac{\varepsilon }{3}</math>
+<center><math> \frac{\log_2 m}{n}   +  H(Q + \eta ) - 1 \leq - \frac{\varepsilon }{3}</math></center>
 W szczególności druga nierówność implikuje
-:<math>2^{ n \cdot \left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right) } \leq
+<center><math>2^{ n \cdot \left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right) } \leq
-\frac{1}{2^{n \cdot \frac{\varepsilon }{3}}}</math>
+\frac{1}{2^{n \cdot \frac{\varepsilon }{3}}}</math></center>
 A więc jeśli n jest wystarczająco duże, to dostajemy
-:<math> \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) \leq
+<center><math> \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) \leq
-\frac{\delta }{2} + \frac{\delta }{2} =  \delta </math>
+\frac{\delta }{2} + \frac{\delta }{2} =  \delta </math></center>
 Używając argumentu probabilistycznego wnioskujemy że musi istnieć kod C rozmiaru m, spełniający <math>Pr_E(\Delta,C) \leq \delta</math>. Ponieważ <math>R(C)=\frac{\log_2 m}{n}</math>, ten kod spełnia warunki Shannona.
-Wybór spełniający warunki (link TODO) najłatwiej przedstawić na diagramie
+Wybór spełniający oba konieczne warunki najłatwiej przedstawić na diagramie
-(Rysunek TODO)
+<center>[[grafika:Teoria_Informacji_diag1.PNG]]</center>
 Używając ciągłości H, wybieramy <math>\eta</math> takie że <math>C_ {\Gamma } - \frac{1}{3} \cdot \varepsilon \leq 1 - H(Q + \eta ) \leq C_ {\Gamma }</math>. Jeśli n jest wystarczająco duże, to potem możemy znaleźć k takie że <math>C_ {\Gamma } - \varepsilon \leq \frac{k}{n} \leq C_ {\Gamma } - \frac{2}{3}\cdot \varepsilon</math>. Tym samym oba warunki są spełnione, co kończy dowód.

Teoria informacji/TI Wykład 12: Różnice pomiędzy wersjami

Wersja z 17:33, 2 sie 2006

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia