Teoria informacji/TI Wykład 12

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Wracamy do szacowania PrE(Δ,C). Przypomnijmy że wyprowadzone na poprzednim wykładzie szacowanie obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz że dla wystarczająco dużych n istnieje kod C który spełnia warunki Twierdzenia Shannona. W szczególności taki dla którego drugi składnik szacowania można ograniczyć z góry przez δ2.

Do dowodu użyjemy metody probabilistycznej. Ustalmy m<2n. Niech 𝒞 będzie zbiorem wszystkich możliwych m-elementowych sekwencji c1,,cm{0,1}n takich że ci są parami różne. Niech N=|𝒞|.

N=(2nm)m!

Od tego miejsca będziemy używać notacji C¯ na oznaczenie sekwencji z 𝒞. Argument probabilistyczny Shannona opiera się na prostej obserwacji. Jeśli

1NC¯PrE(Δ,C¯)δ

to istnieje kod C taki że PrE(Δ,C¯)δ.

Zauważmy że jeśli C¯ jest sekwencją w 𝒞 o wartościach Parser nie mógł rozpoznać (nieznana funkcja „\c”): {\displaystyle C=\{c_1, \ldots, \c_m \}} to

uCvC{u}p(d(v,uE)ρ)=i=1mjip(d(cj,ciE)ρ)

Nasze szacowanie daje zatem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} \pr_E ( \Delta , \bar{C} ) & \leq \frac{1}{N} \sum_{\bar{C}} \left( \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \, p ( d (c_j,c_i \oplus E) \leq \rho ) \right) \\ & = \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \underbrace{\frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho )}_{(*)} \endaligned }


Oszacujemy teraz (*) dla ustalonej pary indeksów ij.

Dla e{0,1}n niech Sρ(e) oznacza kulę w {0,1}n o promieniu ρ i środku w punkcie e, tzn.

Sρ(e)={v{0,1}n:d(v,e)ρ}

Łatwo zauważyć że

d(v,ue)ρvuSρ(e)

Zatem

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} p ( d (c_j,c_i \oplus E) \leq \rho ) & = \frac{1}{N} \sum_{\bar{C}} p \left( c_i \oplus c_j \in S_{\rho } (E) \right) \\ & = \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \underbrace{\frac{1}{N} \sum_{\bar{C}} \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) )}_{(**)} \endaligned }

(gdzie χ oznacza funkcję charakterystyczną: χ(φ)=1φ jest spełniona).

Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż 0n pojawia się jako cicj dla pewnej sekwencji C¯𝒞, i łatwo zauważyć że każdy taki wektor pojawia się taką samą liczbę razy

|{C¯:u=cicj}|=|{C¯:v=cicj}|=N2n1

dla dowolnych u,v{0,1}n{0n}. A zatem każde uSρ(e){0n} dodaje N2n1 do sumy C¯χ(cicjSρ(e)), czyli

C¯χ(cicjSρ(e))=N2n1|Sρ(e){0n}|

Możemy to teraz zsumować po możliwych wartościach e:

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \frac{1}{N} \sum_{\bar{C}} \cdot \chi (c_i \oplus c_j \in S_{\rho } (e) ) & = \sum_{e \in \{ 0, 1 \}^n } p (E = e) \cdot \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \\ & = \frac{1}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} | \endaligned }

Znamy ponadto objętość Sρ(e), więc

|Sρ(e){0n}|2nH(ρ)=2nH(Q+η)

Wracając do głównego szacowania dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \aligned \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) & \leq \frac{\delta }{2} + \frac{1}{m} \sum_{i = 1}^m \sum_{j \neq i} \frac{1}{2^n - 1} \cdot 2^{n \cdot H(Q + \eta )} \\ & = \frac{\delta }{2} + \frac{1}{m} \cdot m \cdot \underbrace{(m-1) \cdot \frac{1}{2^n - 1}}_{\leq \frac{m}{2^n}} \cdot 2^{n \cdot H(Q + \eta )} \\ & \leq \frac{\delta }{2} + \frac{m}{2^n} \cdot 2^{n \cdot H(Q + \eta )} \\ & = \frac{\delta }{2} + 2^{ n \cdot \left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right) } \endaligned }

Jesteśmy tu już blisko celu, gdyż (log2mn+H(Q+η)1) odpowiada „prawie” R(C)CΓ.

Konkretniej, do tej pory wiemy że powyższe równanie jest spełnione dla wystarczająco dużych n, np. nn1, i dla 2m2n, Parser nie mógł rozpoznać (błąd składni): {\displaystyle 0 < \eta < \frac{1}{2} – Q} . Twierdzimy że można dobrać n0n1 m i </math>\eta</math> w ten sposób że dla dowolnego nn0 spełnione jest

Parser nie mógł rozpoznać (nieznana funkcja „\label”): {\displaystyle C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } \label{(i)} }
log2mn+H(Q+η)1ε3

W szczególności druga nierówność implikuje

2n(log2mn+H(Q+η)1)12nε3

A więc jeśli n jest wystarczająco duże, to dostajemy

Parser nie mógł rozpoznać (nieznana funkcja „\pr”): {\displaystyle \frac{1}{N} \sum_{\bar{C}} \, \pr_E ( \Delta , \bar{C} ) \leq \frac{\delta }{2} + \frac{\delta }{2} = \delta }

Używając argumentu probabilistycznego wnioskujemy że musi istnieć kod C rozmiaru m, spełniający PrE(Δ,C)δ. Ponieważ R(C)=log2mn, ten kod spełnia warunki Shannona.

Wybór spełniający oba konieczne warunki najłatwiej przedstawić na diagramie

Używając ciągłości H, wybieramy η takie że CΓ13ε1H(Q+η)CΓ. Jeśli n jest wystarczająco duże, to potem możemy znaleźć k takie że CΓεknCΓ23ε. Tym samym oba warunki są spełnione, co kończy dowód.