Teoria informacji/TI Wykład 12: Różnice pomiędzy wersjami
mNie podano opisu zmian |
m Zastępowanie tekstu – „ </math>” na „</math>” |
||
Linia 7: | Linia 7: | ||
<center><math>\frac{1}{N} \sum_{\bar{C}} Pr_E ( \Delta , \bar{C}) \leq \delta</math></center> | <center><math>\frac{1}{N} \sum_{\bar{C}} Pr_E ( \Delta , \bar{C}) \leq \delta</math></center> | ||
to istnieje kod C, taki że <math>Pr_E(\Delta,{C}) \le \delta </math>. | to istnieje kod C, taki że <math>Pr_E(\Delta,{C}) \le \delta</math>. | ||
Zauważmy, że jeśli <math>\bar{C}</math> jest sekwencją w <math>\mathcal{C}</math> o wartościach | Zauważmy, że jeśli <math>\bar{C}</math> jest sekwencją w <math>\mathcal{C}</math> o wartościach | ||
Linia 31: | Linia 31: | ||
Łatwo zauważyć, że | Łatwo zauważyć, że | ||
<center><math>d (v, u \oplus e ) \leq \rho \Longleftrightarrow v \oplus u \in S_{\rho } (e) </math></center> | <center><math>d (v, u \oplus e ) \leq \rho \Longleftrightarrow v \oplus u \in S_{\rho } (e)</math></center> | ||
Zatem | Zatem | ||
Linia 53: | Linia 53: | ||
\frac{N}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} |</math></center> | \frac{N}{2^n - 1} | S_{\rho } (e) - \{ 0^n \} |</math></center> | ||
Na poprzednim wykładzie dokonaliśmy [[Teoria informacji/TI Wykład 11#rozmiar_kuli|oszacowania rozmiaru kuli]] o promieniu <math>\rho = n \cdot (Q + \eta ) </math>, mamy zatem | Na poprzednim wykładzie dokonaliśmy [[Teoria informacji/TI Wykład 11#rozmiar_kuli|oszacowania rozmiaru kuli]] o promieniu <math>\rho = n \cdot (Q + \eta )</math>, mamy zatem | ||
<center><math>| S_{\rho } (e) - \{ 0^n \} | \leq 2^{n \cdot H(Q + \eta )}</math></center> | <center><math>| S_{\rho } (e) - \{ 0^n \} | \leq 2^{n \cdot H(Q + \eta )}</math></center> | ||
Linia 64: | Linia 64: | ||
</math></center> | </math></center> | ||
Pamiętając, że <math> \sum_{e \in \{ 0, 1 \}^n } p (E = e) = 1 </math>, otrzymujemy stąd również | Pamiętając, że <math> \sum_{e \in \{ 0, 1 \}^n } p (E = e) = 1</math>, otrzymujemy stąd również | ||
szacowanie dla (*): | szacowanie dla (*): | ||
Linia 87: | Linia 87: | ||
Jesteśmy tu już blisko celu, gdyż <math>\left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right)</math> odpowiada „prawie” <math>R(C)-C_{\Gamma}</math>. | Jesteśmy tu już blisko celu, gdyż <math>\left( \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \right)</math> odpowiada „prawie” <math>R(C)-C_{\Gamma}</math>. | ||
Konkretniej, do tej pory wiemy, że powyższe równanie jest spełnione dla wystarczająco dużych n, powiedzmy <math> n \ge n_1 </math>, i dla dowolnych <math>2 \le m \le 2^n</math>, <math>0 < \eta < \frac{1}{2} - Q</math>. Twierdzimy, że można dobrać <math>n_0 \ge n_1</math> m i <math>\eta</math> w ten sposób, że dla dowolnego <math>n \ge n_0</math> spełnione jest | Konkretniej, do tej pory wiemy, że powyższe równanie jest spełnione dla wystarczająco dużych n, powiedzmy <math> n \ge n_1</math>, i dla dowolnych <math>2 \le m \le 2^n</math>, <math>0 < \eta < \frac{1}{2} - Q</math>. Twierdzimy, że można dobrać <math>n_0 \ge n_1</math> m i <math>\eta</math> w ten sposób, że dla dowolnego <math>n \ge n_0</math> spełnione jest | ||
<center><math>C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } {(i)} </math></center> | <center><math>C_{\Gamma } - \varepsilon \leq \frac{\log_2 m}{n} \leq C_{\Gamma } {(i)}</math></center> | ||
<center><math> \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \leq - \frac{\varepsilon }{3}</math></center> | <center><math> \frac{\log_2 m}{n} + H(Q + \eta ) - 1 \leq - \frac{\varepsilon }{3}</math></center> | ||
Linia 98: | Linia 98: | ||
A więc jeśli n jest wystarczająco duże, dostajemy | A więc jeśli n jest wystarczająco duże, dostajemy | ||
<center><math> \frac{1}{N} \sum_{\bar{C}} \, _E ( \Delta , \bar{C} ) \leq | <center><math> \frac{1}{N} \sum_{\bar{C}} \, _E ( \Delta , \bar{C} ) \leq | ||
\frac{\delta }{2} + \frac{\delta }{2} = \delta </math></center> | \frac{\delta }{2} + \frac{\delta }{2} = \delta</math></center> | ||
Używając argumentu probabilistycznego, wnioskujemy, że musi istnieć kod C rozmiaru m, spełniający <math>Pr_E(\Delta,C) \leq \delta</math>. Ponieważ <math>R(C)=\frac{\log_2 m}{n}</math>, ten kod spełnia warunki Shannona. | Używając argumentu probabilistycznego, wnioskujemy, że musi istnieć kod C rozmiaru m, spełniający <math>Pr_E(\Delta,C) \leq \delta</math>. Ponieważ <math>R(C)=\frac{\log_2 m}{n}</math>, ten kod spełnia warunki Shannona. | ||
Wybór <math> \eta </math> i <math> m </math> spełniający oba konieczne warunki najłatwiej | Wybór <math> \eta</math> i <math> m</math> spełniający oba konieczne warunki najłatwiej | ||
przedstawimy na diagramie | przedstawimy na diagramie | ||
Wersja z 10:50, 5 wrz 2023
Wracamy do szacowania . Przypomnijmy, że wyprowadzone na poprzednim wykładzie szacowanie obowiązuje dla dowolnego kodu C, o ile n jest wystarczająco duże. Pokażemy teraz, że dla wystarczająco dużych n istnieje kod C, który spełnia warunki Twierdzenia Shannona. W szczególności taki, dla którego drugi składnik szacowania można ograniczyć z góry przez .
Do dowodu użyjemy metody probabilistycznej. Ustalmy . Niech będzie zbiorem wszystkich możliwych m-elementowych sekwencji , takich że są parami różne. Niech .
Od tego miejsca będziemy używać notacji na oznaczenie sekwencji z . Argument probabilistyczny Shannona opiera się na prostej obserwacji. Jeśli
to istnieje kod C, taki że .
Zauważmy, że jeśli jest sekwencją w o wartościach to
Nasze szacowanie daje zatem
Oszacujemy teraz (*) dla ustalonej pary indeksów .
Dla niech oznacza kulę w o promieniu i środku w punkcie e, tzn.
Łatwo zauważyć, że
Zatem
(gdzie oznacza funkcję charakterystyczną: jest spełniona).
Możemy oszacować teraz wartość (**) dla ustalonego e. Z pewnością każdy wektor inny niż pojawia się jako dla pewnej sekwencji , i łatwo zauważyć, że każdy taki wektor pojawia się taką samą liczbę razy, tzn.
dla dowolnych . A zatem każde dodaje do sumy , czyli
Na poprzednim wykładzie dokonaliśmy oszacowania rozmiaru kuli o promieniu , mamy zatem
Możemy już oszacować (**):
Pamiętając, że , otrzymujemy stąd również szacowanie dla (*):
Wracając do głównego szacowania, dostajemy
Jesteśmy tu już blisko celu, gdyż odpowiada „prawie” .
Konkretniej, do tej pory wiemy, że powyższe równanie jest spełnione dla wystarczająco dużych n, powiedzmy , i dla dowolnych , . Twierdzimy, że można dobrać m i w ten sposób, że dla dowolnego spełnione jest
W szczególności druga nierówność implikuje
A więc jeśli n jest wystarczająco duże, dostajemy
Używając argumentu probabilistycznego, wnioskujemy, że musi istnieć kod C rozmiaru m, spełniający . Ponieważ , ten kod spełnia warunki Shannona.
Wybór i spełniający oba konieczne warunki najłatwiej przedstawimy na diagramie
Używając ciągłości H, wybieramy takie, że . Jeśli n jest wystarczająco duże, potem możemy znaleźć k takie, że . Tym samym oba warunki są spełnione, co kończy dowód.