Teoria informacji/TI Wykład 12

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Wracamy do szacowania PrE(Δ,C). Przypomnijmy, że wyprowadzone na poprzednim wykładzie szacowanie obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz, że dla wystarczająco dużych n istnieje kod C, który spełnia warunki Twierdzenia Shannona. W szczególności taki, dla którego drugi składnik szacowania można ograniczyć z góry przez δ2.

Do dowodu użyjemy metody probabilistycznej. Ustalmy m<2n. Niech 𝒞 będzie zbiorem wszystkich możliwych m-elementowych sekwencji c1,,cm{0,1}n, takich że ci są parami różne. Niech N=|𝒞|.

N=(2nm)m!

Od tego miejsca będziemy używać notacji C¯ na oznaczenie sekwencji z 𝒞. Argument probabilistyczny Shannona opiera się na prostej obserwacji. Jeśli

1NC¯PrE(Δ,C¯)δ

to istnieje kod C, taki że PrE(Δ,C)δ.

Zauważmy, że jeśli C¯ jest sekwencją w 𝒞 o wartościach C={c1,,cm} to

uCvC{u}p(d(v,uE)ρ)=i=1mjip(d(cj,ciE)ρ)

Nasze szacowanie daje zatem

1NC¯PrE(Δ,C¯)1NC¯(δ2+1mi=1mjip(d(cj,ciE)ρ))=δ2+1mi=1mji1NC¯p(d(cj,ciE)ρ)(*)


Oszacujemy teraz (*) dla ustalonej pary indeksów ij.

Dla e{0,1}n niech Sρ(e) oznacza kulę w {0,1}n o promieniu ρ i środku w punkcie e, tzn.

Sρ(e)={v{0,1}n:d(v,e)ρ}

Łatwo zauważyć, że

d(v,ue)ρvuSρ(e)

Zatem

1NC¯p(d(cj,ciE)ρ)=1NC¯p(cicjSρ(E))=e{0,1}np(E=e)1NC¯χ(cicjSρ(e))(**)

(gdzie χ oznacza funkcję charakterystyczną: χ(φ)=1φ jest spełniona).

Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż 0n pojawia się jako cicj dla pewnej sekwencji C¯𝒞, i łatwo zauważyć, że każdy taki wektor pojawia się taką samą liczbę razy, tzn.

|{C¯:u=cicj}|=|{C¯:v=cicj}|=N2n1

dla dowolnych u,v{0,1}n{0n}. A zatem każde uSρ(e){0n} dodaje N2n1 do sumy C¯χ(cicjSρ(e)), czyli

C¯χ(cicjSρ(e))=N2n1|Sρ(e){0n}|

Na poprzednim wykładzie dokonaliśmy oszacowania rozmiaru kuli o promieniu ρ=n(Q+η), mamy zatem

|Sρ(e){0n}|2nH(Q+η)

Możemy już oszacować (**):

1NC¯χ(cicjSρ(e))1NN2n12nH(Q+η)12n12nH(Q+η)

Pamiętając, że e{0,1}np(E=e)=1, otrzymujemy stąd również szacowanie dla (*):

e{0,1}np(E=e)1NC¯χ(cicjSρ(e))(**)12n12nH(Q+η)


Wracając do głównego szacowania, dostajemy

1NC¯E(Δ,C¯)δ2+1mi=1mji12n12nH(Q+η)=δ2+1mm(m1)12n1m2n2nH(Q+η)δ2+m2n2nH(Q+η)=δ2+2n(log2mn+H(Q+η)1)

Jesteśmy tu już blisko celu, gdyż (log2mn+H(Q+η)1) odpowiada „prawie” R(C)CΓ.

Konkretniej, do tej pory wiemy, że powyższe równanie jest spełnione dla wystarczająco dużych n, powiedzmy nn1, i dla dowolnych 2m2n, 0<η<12Q. Twierdzimy, że można dobrać n0n1 m i η w ten sposób, że dla dowolnego nn0 spełnione jest

CΓεlog2mnCΓ(i)
log2mn+H(Q+η)1ε3

W szczególności druga nierówność implikuje

2n(log2mn+H(Q+η)1)12nε3

A więc jeśli n jest wystarczająco duże, dostajemy

1NC¯E(Δ,C¯)δ2+δ2=δ

Używając argumentu probabilistycznego, wnioskujemy, że musi istnieć kod C rozmiaru m, spełniający PrE(Δ,C)δ. Ponieważ R(C)=log2mn, ten kod spełnia warunki Shannona.

Wybór η i m spełniający oba konieczne warunki najłatwiej przedstawimy na diagramie

Używając ciągłości H, wybieramy η takie, że CΓ13ε1H(Q+η)CΓ. Jeśli n jest wystarczająco duże, potem możemy znaleźć k takie, że CΓεknCΓ23ε. Tym samym oba warunki są spełnione, co kończy dowód.