Teoria informacji/TI Wykład 12: Różnice pomiędzy wersjami

Wersja z 10:52, 20 wrz 2006

Wracamy do szacowania $P r_{E} (Δ, C)$ . Przypomnijmy, że wyprowadzone na poprzednim wykładzie szacowanie obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz, że dla wystarczająco dużych n istnieje kod C, który spełnia warunki Twierdzenia Shannona. W szczególności taki, dla którego drugi składnik szacowania można ograniczyć z góry przez $\frac{δ}{2}$ .

Do dowodu użyjemy metody probabilistycznej. Ustalmy $m < 2^{n}$ . Niech $𝒞$ będzie zbiorem wszystkich możliwych m-elementowych sekwencji $c_{1}, \dots, c_{m} \in {0, 1}^{n}$ , takich że $c_{i}$ są parami różne. Niech $N = | 𝒞 |$ .

N = (\binom{2^{n}}{m}) \cdot m!

Od tego miejsca będziemy używać notacji $\bar{C}$ na oznaczenie sekwencji z $𝒞$ . Argument probabilistyczny Shannona opiera się na prostej obserwacji. Jeśli

\frac{1}{N} \sum_{\bar{C}} P r_{E} (Δ, \bar{C}) \leq δ

to istnieje kod C, taki że $P r_{E} (Δ, \bar{C}) \leq δ$ .

Zauważmy, że jeśli $\bar{C}$ jest sekwencją w $𝒞$ o wartościach Parser nie mógł rozpoznać (nieznana funkcja „\c”): {\displaystyle C=\{c_1, \ldots, \c_m \}} to

\sum_{u \in C} \sum_{v \in C - {u}} p (d (v, u \oplus E) \leq ρ) = \sum_{i = 1}^{m} \sum_{j \neq i} p (d (c_{j}, c_{i} \oplus E) \leq ρ)

Nasze szacowanie daje zatem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} \pr_E ( \Delta , \bar{C} ) & \leq \frac{1}{N} \sum_{\bar{C}} \left( \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho ) \right) \\ & = \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \underbrace{\frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho )}_{(*)} \endaligned }

Oszacujemy teraz (*) dla ustalonej pary indeksów $i \neq j$ .

Dla $e \in {0, 1}^{n}$ niech $S_{ρ} (e)$ oznacza kulę w ${0, 1}^{n}$ o promieniu $ρ$ i środku w punkcie e, tzn.

S_{ρ} (e) = {v \in {0, 1}^{n} : d (v, e) \leq ρ}

Łatwo zauważyć, że

d (v, u \oplus e) \leq ρ ⟺ v \oplus u \in S_{ρ} (e)

Zatem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho ) & = \frac{1}{N} \sum_{\bar{C}} p \left( c_i \oplus c_j \in S_{\rho } (E) \right) \\ & = \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \underbrace{\frac{1}{N} \sum_{\bar{C}} \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )}_{(**)} \endaligned }

(gdzie $χ$ oznacza funkcję charakterystyczną: $χ (φ) = 1 ⟺ φ$ jest spełniona).

Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż $0^{n}$ pojawia się jako $c_{i} \oplus c_{j}$ dla pewnej sekwencji $\bar{C} \in 𝒞$ , i łatwo zauważyć, że każdy taki wektor pojawia się taką samą liczbę razy

| {\bar{C} : u = c_{i} \oplus c_{j}} | = | {\bar{C} : v = c_{i} \oplus c_{j}} | = \frac{N}{2^{n} - 1}

dla dowolnych $u, v \in {0, 1}^{n} - {0^{n}}$ . A zatem każde $u \in S_{ρ} (e) - {0^{n}}$ dodaje $\frac{N}{2^{n} - 1}$ do sumy $\sum_{\bar{C}} \cdot χ (c_{i} \oplus c_{j} \in S_{ρ} (e))$ , czyli

\sum_{\bar{C}} \cdot χ (c_{i} \oplus c_{j} \in S_{ρ} (e)) = \frac{N}{2^{n} - 1} | S_{ρ} (e) - {0^{n}} |

Możemy to teraz zsumować po możliwych wartościach e:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \frac{1}{N} \sum_{\bar{C}} \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) & = \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \\ & = \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \endaligned }

Znamy ponadto objętość $S_{ρ} (e)$ , więc

| S_{ρ} (e) - {0^{n}} | \leq 2^{n \cdot H (ρ)} = 2^{n \cdot H (Q + η)}

Wracając do głównego szacowania, dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) & \leq \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \frac{1}{2^n - 1} \cdot 2^{n \cdot H(Q + \eta )} \\ & = \frac{\delta }{2} + \frac{1}{m} \cdot m \cdot \underbrace{(m-1) \cdot \frac{1}{2^n - 1}}_{\leq \frac{m}{2^n}} \cdot 2^{n \cdot H(Q + \eta )} \\ & \leq \frac{\delta }{2} + \frac{m}{2^n} \cdot 2^{n \cdot H(Q + \eta )} \\ & = \frac{\delta }{2} + 2^{ n \cdot \left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right) } \endaligned }

Jesteśmy tu już blisko celu, gdyż $(\frac{\log_{2} m}{n} + H (Q + η) - 1)$ odpowiada „prawie” $R (C) - C_{Γ}$ .

Konkretniej, do tej pory wiemy, że powyższe równanie jest spełnione dla wystarczająco dużych n, np. $n \geq n_{1}$ , i dla $2 \leq m \leq 2^{n}$ , Parser nie mógł rozpoznać (błąd składni): {\displaystyle 0 < \eta < \frac{1}{2} – Q} . Twierdzimy, że można dobrać $n_{0} \geq n_{1}$ m i </math>\eta</math> w ten sposób, że dla dowolnego $n \geq n_{0}$ spełnione jest

Parser nie mógł rozpoznać (nieznana funkcja „\label”): {\displaystyle C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } \label{(i)} }

\frac{\log_{2} m}{n} + H (Q + η) - 1 \leq - \frac{ε}{3}

W szczególności druga nierówność implikuje

2^{n \cdot (\frac{\log_{2} m}{n} + H (Q + η) - 1)} \leq \frac{1}{2^{n \cdot \frac{ε}{3}}}

A więc jeśli n jest wystarczająco duże, dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\pr”): {\displaystyle \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) \leq \frac{\delta }{2} + \frac{\delta }{2} = \delta }

Używając argumentu probabilistycznego, wnioskujemy, że musi istnieć kod C rozmiaru m, spełniający $P r_{E} (Δ, C) \leq δ$ . Ponieważ $R (C) = \frac{\log_{2} m}{n}$ , ten kod spełnia warunki Shannona.

Wybór spełniający oba konieczne warunki najłatwiej przedstawić na diagramie

Używając ciągłości H, wybieramy $η$ takie, że $C_{Γ} - \frac{1}{3} \cdot ε \leq 1 - H (Q + η) \leq C_{Γ}$ . Jeśli n jest wystarczająco duże, potem możemy znaleźć k takie, że $C_{Γ} - ε \leq \frac{k}{n} \leq C_{Γ} - \frac{2}{3} \cdot ε$ . Tym samym oba warunki są spełnione, co kończy dowód.

@@ Linia 1: / Linia 1: @@
-Wracamy do szacowania <math>Pr_E(\Delta, C)</math>. Przypomnijmy że wyprowadzone na poprzednim wykładzie [[Teoria informacji/TI Wykład 11#metoda_prob|szacowanie]] obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz że dla wystarczająco dużych n ''istnieje'' kod C który spełnia warunki Twierdzenia Shannona. W szczególności taki dla którego drugi składnik [[Teoria informacji/TI Wykład 11#metoda_prob|szacowania]] można ograniczyć z góry przez <math>\frac{\delta}{2}</math>.
+Wracamy do szacowania <math>Pr_E(\Delta, C)</math>. Przypomnijmy, że wyprowadzone na poprzednim wykładzie [[Teoria informacji/TI Wykład 11#metoda_prob|szacowanie]] obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz, że dla wystarczająco dużych n ''istnieje'' kod C, który spełnia warunki Twierdzenia Shannona. W szczególności taki, dla którego drugi składnik [[Teoria informacji/TI Wykład 11#metoda_prob|szacowania]] można ograniczyć z góry przez <math>\frac{\delta}{2}</math>.
-Do dowodu użyjemy ''metody probabilistycznej''. Ustalmy <math>m < 2^n</math>. Niech <math>\mathcal{C}</math> będzie zbiorem wszystkich możliwych m-elementowych sekwencji <math>c_1, \ldots, c_m \in \{0,1\}^n</math> takich że <math>c_i</math> są parami różne. Niech <math>N = |\mathcal{C}|</math>.
+Do dowodu użyjemy ''metody probabilistycznej''. Ustalmy <math>m < 2^n</math>. Niech <math>\mathcal{C}</math> będzie zbiorem wszystkich możliwych m-elementowych sekwencji <math>c_1, \ldots, c_m \in \{0,1\}^n</math>, takich że <math>c_i</math> są parami różne. Niech <math>N = |\mathcal{C}|</math>.
 <center><math> N = {2^n \choose m}  \cdot m!</math></center>
@@ Linia 7: / Linia 7: @@
 <center><math>\frac{1}{N} \sum_{\bar{C}} Pr_E ( \Delta , \bar{C}) \leq \delta</math></center>
-to istnieje kod C taki że <math>Pr_E(\Delta,\bar{C}) \le \delta </math>.
+to istnieje kod C, taki że <math>Pr_E(\Delta,\bar{C}) \le \delta </math>.
-Zauważmy że jeśli <math>\bar{C}</math> jest sekwencją w <math>\mathcal{C}</math> o wartościach <math>C=\{c_1, \ldots, \c_m \}</math> to
+Zauważmy, że jeśli <math>\bar{C}</math> jest sekwencją w <math>\mathcal{C}</math> o wartościach <math>C=\{c_1, \ldots, \c_m \}</math> to
 <center><math> \sum_{u \in C} \sum_{v \in C - \{ u \}} p ( d (v,u \oplus E) \leq \rho ) =
 \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho )</math></center>
@@ Linia 29: / Linia 29: @@
 <center><math>S_{\rho } (e) = \{ v \in \{ 0,1 \}^n  : d(v,e) \leq \rho \}</math></center>
-Łatwo zauważyć że
+Łatwo zauważyć, że
 <center><math>d (v, u \oplus e ) \leq \rho \Longleftrightarrow v \oplus u \in S_{\rho } (e) </math></center>
@@ Linia 44: / Linia 44: @@
 (gdzie <math>\chi</math> oznacza funkcję charakterystyczną: <math>\chi(\varphi)=1 \Longleftrightarrow \varphi</math> jest spełniona).
-Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż <math>0^n</math> pojawia się jako <math>c_i \oplus c_j</math> dla pewnej sekwencji <math>\bar{C} \in \mathcal{C}</math>, i łatwo zauważyć że każdy taki wektor pojawia się taką samą liczbę razy
+Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż <math>0^n</math> pojawia się jako <math>c_i \oplus c_j</math> dla pewnej sekwencji <math>\bar{C} \in \mathcal{C}</math>, i łatwo zauważyć, że każdy taki wektor pojawia się taką samą liczbę razy
 <center><math>| \{ \bar{C} : u = c_i \oplus c_j \} |  = | \{ \bar{C} : v = c_i \oplus c_j \} |  = \frac{N}{2^n - 1}</math></center>
@@ Linia 65: / Linia 65: @@
 <center><math>| S_{\rho } (e) - \{ 0^n \} | \leq 2^{n \cdot H(\rho)} = 2^{n \cdot H(Q + \eta )}</math></center>
-Wracając do [[#metoda_prob2|głównego szacowania]] dostajemy
+Wracając do [[#metoda_prob2|głównego szacowania]], dostajemy
 <center><math>\aligned
@@ Linia 78: / Linia 78: @@
 Jesteśmy tu już blisko celu, gdyż <math>\left(  \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right)</math> odpowiada „prawie” <math>R(C)-C_{\Gamma}</math>.
-Konkretniej, do tej pory wiemy że powyższe równanie jest spełnione dla wystarczająco dużych n, np. <math> n \ge n_1 </math>, i dla <math>2 \le m \le 2^n</math>, <math>0 < \eta < \frac{1}{2} – Q</math>. Twierdzimy że można dobrać <math>n_0 \ge n_1</math> m i </math>\eta</math> w ten sposób że dla dowolnego <math>n \ge n_0</math> spełnione jest
+Konkretniej, do tej pory wiemy, że powyższe równanie jest spełnione dla wystarczająco dużych n, np. <math> n \ge n_1 </math>, i dla <math>2 \le m \le 2^n</math>, <math>0 < \eta < \frac{1}{2} – Q</math>. Twierdzimy, że można dobrać <math>n_0 \ge n_1</math> m i </math>\eta</math> w ten sposób, że dla dowolnego <math>n \ge n_0</math> spełnione jest
 <center><math>C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } \label{(i)} </math></center>
@@ Linia 87: / Linia 87: @@
 \frac{1}{2^{n \cdot \frac{\varepsilon }{3}}}</math></center>
-A więc jeśli n jest wystarczająco duże, to dostajemy
+A więc jeśli n jest wystarczająco duże, dostajemy
 <center><math> \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) \leq
 \frac{\delta }{2} + \frac{\delta }{2} =  \delta </math></center>
-Używając argumentu probabilistycznego wnioskujemy że musi istnieć kod C rozmiaru m, spełniający <math>Pr_E(\Delta,C) \leq \delta</math>. Ponieważ <math>R(C)=\frac{\log_2 m}{n}</math>, ten kod spełnia warunki Shannona.
+Używając argumentu probabilistycznego, wnioskujemy, że musi istnieć kod C rozmiaru m, spełniający <math>Pr_E(\Delta,C) \leq \delta</math>. Ponieważ <math>R(C)=\frac{\log_2 m}{n}</math>, ten kod spełnia warunki Shannona.
 Wybór spełniający oba konieczne warunki najłatwiej przedstawić na diagramie
@@ Linia 97: / Linia 97: @@
 <center>[[grafika:Teoria_Informacji_diag1.PNG]]</center>
-Używając ciągłości H, wybieramy <math>\eta</math> takie że <math>C_ {\Gamma } - \frac{1}{3} \cdot \varepsilon \leq 1 - H(Q + \eta ) \leq C_ {\Gamma }</math>. Jeśli n jest wystarczająco duże, to potem możemy znaleźć k takie że <math>C_ {\Gamma } - \varepsilon \leq \frac{k}{n} \leq C_ {\Gamma } - \frac{2}{3}\cdot \varepsilon</math>. Tym samym oba warunki są spełnione, co kończy dowód.
+Używając ciągłości H, wybieramy <math>\eta</math> takie, że <math>C_ {\Gamma } - \frac{1}{3} \cdot \varepsilon \leq 1 - H(Q + \eta ) \leq C_ {\Gamma }</math>. Jeśli n jest wystarczająco duże, potem możemy znaleźć k takie, że <math>C_ {\Gamma } - \varepsilon \leq \frac{k}{n} \leq C_ {\Gamma } - \frac{2}{3}\cdot \varepsilon</math>. Tym samym oba warunki są spełnione, co kończy dowód.

Teoria informacji/TI Wykład 12: Różnice pomiędzy wersjami

Wersja z 10:52, 20 wrz 2006

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia