Teoria informacji/TI Wykład 9: Różnice pomiędzy wersjami

Aktualna wersja na dzień 22:13, 11 wrz 2023

Poprawa jakości kanału

Załóżmy, że korzystamy z symetrycznego kanału $Γ$ określonego przez macierz

(\begin{matrix} P & Q \\ Q & P \end{matrix})

gdzie $P > Q$ . W takim przypadku $Δ_{\max} (i) = i$ dla $i = 0, 1$ i dla dowolnego rozkładu A:

\begin{aligned} P r_{C} (Δ_{\max}, A) & = \sum_{b \in {0, 1}} p (Δ_{\max} (b)) \cdot p (Δ_{\max} (b) \to b) \\ = p (A = 0) \cdot P + p (A = 1) \cdot P \\ = P \end{aligned}

Z konieczności $P r_{E} (Δ_{\max}, A) = Q$ . Ponieważ nie zależy to od A, będziemy zapisywać $P r_{E} (Δ_{\max}) = Q$ .

Czy jest możliwe uzyskanie mniejszego prawdopodobieństwa błędu przez jakieś sprytniejsze wykorzystanie kanału? Z pewnością tak, jeśli poświęcimy więcej bitów na przesłanie jednego znaku. Naturalnym pomysłem jest wysyłanie każdego bitu kilka (np. 3) razy. Skoro poprawna transmisja jest bardziej prawdopodobna niż przekłamanie ( $P > Q$ ), odbiorca powinien sprawdzać po prostu, który bit na wyjściu pojawia się częściej.

\begin{matrix} 0 & \mapsto & 000 & \to \\ 1 & \mapsto & 111 & \to \end{matrix}

\begin{matrix} \to & 000 & 001 & 010 & 100 & \mapsto & 0 \\ \to & 111 & 110 & 101 & 011 & \mapsto & 1 \end{matrix}

Całą procedurę możemy interpretować jako nowy kanał $Γ^{'}$ .

\begin{matrix} 0 & \to \\ 1 & \to \end{matrix}

\begin{matrix} \to & 0 \\ \to & 1 \end{matrix}

Jaka jest macierz tego kanału?

Korzystając z niezależności symboli, możemy policzyć, że prawdopodobieństwo $p (0 | 0)$ , że wyjściowy symbol 0 odpowiada wejściowemu 0, wynosi

p (000 | 000) + p (001 | 000) + p (010 | 000) + p (100 | 000) = P^{3} + 3 P^{2} Q

Podobne obliczenia dla pozostałych prawdopodobieństw pokazują, że $Γ^{'}$ jest znów symetrycznym kanałem, charakteryzowanym przez macierz

(\begin{matrix} P^{3} + 3 P^{2} Q & Q^{3} + 3 Q^{2} P \\ Q^{3} + 3 Q^{2} P & P^{3} + 3 P^{2} Q \end{matrix})

Oczywiście $Q^{3} + 3 Q^{2} P < P^{3} + 3 P^{2} Q$ . Prawdopodobieństwo błędu wynosi tu

P r_{E} (Δ_{\max}) = Q^{3} + 3 Q^{2} P

Aby sprawdzić, czy to jest mniej niż Q, wystarczy przyjrzeć się funkcji $Q^{3} + 3 Q^{2} (1 - Q) - Q$ . Ma ona pierwiastki $Q = \frac{1}{2}, 1$ . Przyjmuje więc wartości ujemne dla $Q < \frac{1}{2}$ .

Ogólnie, jeśli każdy bit zostanie powtórzony n razy i odbiorca będzie zawsze brał wartość częściej występującą (dla uproszczenia załóżmy że n jest nieparzyste), otrzymamy kanał BSC określony macierzą

(\begin{matrix} \sum_{i = ⌈ \frac{n}{2} ⌉}^{n} (\binom{n}{i}) P^{i} \cdot Q^{n - i} & \sum_{i = 0}^{⌊ \frac{n}{2} ⌋} (\binom{n}{i}) P^{i} \cdot Q^{n - i} \\ \sum_{i = 0}^{⌊ \frac{n}{2} ⌋} (\binom{n}{i}) P^{i} \cdot Q^{n - i} & \sum_{i = ⌈ \frac{n}{2} ⌉}^{n} (\binom{n}{i}) P^{i} \cdot Q^{n - i} \end{matrix})

Prawdopodobieństwo błędu wynosi

P r_{E} (Δ_{\max}) = \sum_{i = 0}^{⌊ \frac{n}{2} ⌋} (\binom{n}{i}) P^{i} \cdot Q^{n - i} \leq \underset{= 2^{n - 1}}{\underset{⏟}{\sum_{i = 0}^{⌊ \frac{n}{2} ⌋} (\binom{n}{i})}} P^{⌊ \frac{n}{2} ⌋} \cdot Q^{⌊ \frac{n}{2} ⌋}

Ponieważ $P \cdot Q < \frac{1}{4}$ , możemy podstawić $P Q = \frac{δ}{4}$ dla pewnego $δ < 1$ . Wtedy

P r_{E} (Δ_{\max}) \leq 2^{n - 1} \cdot (P Q)^{⌊ \frac{n}{2} ⌋} = 2^{n - 1} \cdot \frac{δ^{⌊ \frac{n}{2} ⌋}}{2^{2 \cdot ⌊ \frac{n}{2} ⌋}} = δ^{⌊ \frac{n}{2} ⌋}

A więc $P r_{E} (Δ_{\max}) \to 0$ gdy $n \to \infty$ .

Pokazaliśmy, że możemy sprowadzić prawdopodobieństwo błędu do dowolnie małej wartości za cenę wydłużania coraz bardziej wiadomości. Główne twierdzenie Shannona (które poznamy na następnym wykładzie) pokazuje, że w pewnym sensie ta cena nie jest konieczna. Dla wyrobienia intuicji, że coś takiego jest możliwe, zauważmy, że wybraliśmy powtarzanie tego samego symbolu dla uproszczenia i że możliwe są inne kodowania. Przykładowo, dyktując komuś przez telefon trudne słowo, każdą literę opisujemy całym słowem: przykładowo nazwę stolicy Gruzji, powiemy: T jak Teresa, B jak Barbara, I jak Iwona, L jak Lucyna, I jak Iwona, S jak Stanisław, I jak Iwona.

Odległość Hamminga

Definicja [Odległość Hamminga]

Dla skończonego zbioru

𝒜

i

n \in ℕ

odległość Hamminga między słowami

u, v \in 𝒜^{n}

definiujemy jako:

d (u, v) = | {i : u_{i} \neq v_{i}} |

Łatwo sprawdzić, że ta odległość spełnia warunki metryki:

$d (u, v) \geq 0$
$d (u, v) = 0 ⟺ u = v$
$d (u, v) = d (v, u)$
$d (u, w) \leq d (u, v) + d (v, w)$

(ostatnia nierówność wynika z faktu że ${i : u_{i} \neq w_{i}} \subseteq {i : u_{i} \neq v_{i}} \cup {i : v_{i} \neq w_{i}}$ )

Pojęcie odległości Hamminga umożliwia wygodne zapisywanie prawdopodobieństwa warunkowego sekwencji wyjściowej $\vec{b} = b_{1} \dots b_{k}$ dla sekwencji wejściowej $\vec{a} = a_{1} \dots a_{k}$ . Dla BSC prawdopodobieństwo to ma wartość:

p (b_{1} \dots b_{k} | a_{1} \dots a_{k}) = Q^{d (\vec{a}, \vec{b})} \cdot P^{k - d (\vec{a}, \vec{b})}

@@ Linia 1: / Linia 1: @@
 ==Poprawa jakości kanału==
-Załóżmy że korzystamy z symetrycznego kanału <math>\Gamma</math> określonego przez macierz
+Załóżmy, że korzystamy z symetrycznego kanału <math>\Gamma</math> określonego przez macierz
 <center><math>\left(
 \begin{matrix}
@@ Linia 11: / Linia 11: @@
 gdzie <math>P>Q</math>. W takim przypadku <math>\Delta_{\max}(i)=i</math> dla <math>i=0,1</math> i dla dowolnego rozkładu A:
-<center><math>\aligned
+<center><math>\begin{align}
 Pr_C ( \Delta_{\max } , A ) & = \sum_{b \in \{ 0,1 \} } p (\Delta_{\max } (b) )\cdot p (\Delta_{\max } (b) \to b)\\
 & = p (A = 0)\cdot P + p (A = 1)\cdot P \\
 & = P
-\endaligned
+\end{align}
 </math></center>
-Z konieczności <math>Pr_E(\Delta_{\max},A)=Q</math>. Ponieważ nie zależy to od A, będziemy zapisywać <math> Pr_E(\Delta_{\max})=Q</math>.
+Z konieczności <math>Pr_E(\Delta_{\max},A)=Q</math>. Ponieważ nie zależy to od A, będziemy zapisywać <math>Pr_E(\Delta_{\max})=Q</math>.
-Czy jest możliwe uzyskanie mniejszego prawdopodobieństwa błędu przez jakieś sprytniejsze wykorzystanie kanału? Z pewnością tak, jeśli poświęcimy więcej bitów na przesłanie jednego znaku. Naturalnym pomysłem jest wysyłanie każdego bitu kilka (np. 3) razy. Skoro poprawna transmisja jest bardziej prawdopodobna niż przekłamanie (<math>P>Q</math>), odbiorca powinien sprawdzać po prostu który bit na wyjściu pojawia się częściej.
+Czy jest możliwe uzyskanie mniejszego prawdopodobieństwa błędu przez jakieś sprytniejsze wykorzystanie kanału? Z pewnością tak, jeśli poświęcimy więcej bitów na przesłanie jednego znaku. Naturalnym pomysłem jest wysyłanie każdego bitu kilka (np. 3) razy. Skoro poprawna transmisja jest bardziej prawdopodobna niż przekłamanie (<math>P>Q</math>), odbiorca powinien sprawdzać po prostu, który bit na wyjściu pojawia się częściej.
 <center><math>\begin{matrix}
@@ Linia 46: / Linia 46: @@
 Jaka jest macierz tego kanału?
-Korzystając z [[Teoria informacji/TI Wykład 8#niez_symboli|niezależności symboli]], możemy policzyć że prawdopodobieństwo <math>p(0|0)</math> że wyjściowy symbol 0 odpowiada wejściowemu 0, wynosi
+Korzystając z [[Teoria informacji/TI Wykład 8#niez_symboli|niezależności symboli]], możemy policzyć, że prawdopodobieństwo <math>p(0|0)</math>, że wyjściowy symbol 0 odpowiada wejściowemu 0, wynosi
 <center><math>p (000 | 000) + p (001 |000) + p (010 |000) + p (100 |000) = P^3 + 3 P^2 Q</math></center>
-Podobne obliczenia dla pozostałych prawdopodobieństw pokazują że <math>\Gamma'</math> jest znów symetrycznym kanałem, charakteryzowanym przez macierz
+Podobne obliczenia dla pozostałych prawdopodobieństw pokazują, że <math>\Gamma'</math> jest znów symetrycznym kanałem, charakteryzowanym przez macierz
 <center><math>\left(
 \begin{matrix}
@@ Linia 60: / Linia 60: @@
 <center><math>Pr_E ( \Delta_{\max } ) = Q^3 + 3 Q^2 P</math></center>
-Aby sprawdzić czy to jest mniej niż Q, wystarczy przyjrzeć się funkcji <math>Q^3 + 3 Q^2 (1-Q)-Q</math>. Przyjmuje ona wartości ujemne dla <math>Q < \frac{1}{2} + \frac{1}{\sqrt{12}}  </math>
+Aby sprawdzić, czy to jest mniej niż Q, wystarczy przyjrzeć się funkcji <math>Q^3 + 3 Q^2 (1-Q)-Q</math>. Ma ona pierwiastki <math>Q = \frac{1}{2}, 1</math>. Przyjmuje więc wartości ujemne dla <math>Q < \frac{1}{2}</math>.
-W ogólności, jeśli każdy bit zostanie powtórzony n razy i odbiorca będzie zawsze brał wartość częściej występującą (dla uproszczenia załóżmy że n jest nieparzyste), otrzymamy kanał BSC określony macierzą
+Ogólnie, jeśli każdy bit zostanie powtórzony n razy i odbiorca będzie zawsze brał wartość częściej występującą (dla uproszczenia załóżmy że n jest nieparzyste), otrzymamy kanał BSC określony macierzą
 <center><math>\left(
 \begin{matrix}
@@ Linia 78: / Linia 78: @@
 Prawdopodobieństwo błędu wynosi
-<center><math> Pr_E ( \Delta_{\max } ) = \sum_{i= 0}^{\lfloor  \frac{n}{2} \rfloor}
+<center><math>Pr_E ( \Delta_{\max } ) = \sum_{i= 0}^{\lfloor  \frac{n}{2} \rfloor}
 {n \choose i} P^i \cdot Q^{n-i} \leq \underbrace{\sum_{i= 0}^{\lfloor  \frac{n}{2} \rfloor}
 {n \choose i} }_{=2^{n-1}}
@@ Linia 85: / Linia 85: @@
 Ponieważ <math>P \cdot Q < \frac{1}{4}</math>, możemy podstawić <math>PQ= \frac{\delta }{4}</math> dla pewnego <math>\delta < 1</math>. Wtedy
-<center><math> Pr_E ( \Delta_{\max } ) \leq 2^{n-1} \cdot (PQ)^{\lfloor  \frac{n}{2} \rfloor}  =
+<center><math>Pr_E ( \Delta_{\max } ) \leq 2^{n-1} \cdot (PQ)^{\lfloor  \frac{n}{2} \rfloor}  =
 ^{n-1} \cdot \frac{\delta^{\lfloor  \frac{n}{2} \rfloor}}{2^{2 \cdot \lfloor  \frac{n}{2} \rfloor }}= \delta^{\lfloor  \frac{n}{2} \rfloor}</math></center>
-A więc <math> Pr_E ( \Delta_{\max } ) \to 0</math> gdy <math> n \to \infty</math>.
+A więc <math>Pr_E ( \Delta_{\max } ) \to 0</math> gdy <math>n \to \infty</math>.
-Pokazaliśmy że możemy sprowadzić prawdopodobieństwo błędu do dowolnie małej wartości, za cenę wydłużania coraz bardziej wiadomości. Główne twierdzenie Shannona (które poznamy na następnym wykładzie) pokazuje że, w pewnym sensie, ta cena nie jest konieczna. Dla wyrobienia intuicji że coś takiego jest możliwe, zauważmy że wybraliśmy powtarzanie tego samego symbolu dla uproszczenia, i możliwe są inne kodowania. Przykładowo, dyktując komuś przez telefon trudne słowo, każdą literę opisujemy całym słowem: przykładowo nazwę stolicy Gruzji, powiemy: T jak Teresa, B jak Barbara, I jak Iwona, L jak Lucyna, I jak Iwona, S jak Stanisław, I jak Iwona.
+Pokazaliśmy, że możemy sprowadzić prawdopodobieństwo błędu do dowolnie małej wartości za cenę wydłużania coraz bardziej wiadomości. Główne twierdzenie Shannona (które poznamy na następnym wykładzie) pokazuje, że w pewnym sensie ta cena nie jest konieczna. Dla wyrobienia intuicji, że coś takiego jest możliwe, zauważmy, że wybraliśmy powtarzanie tego samego symbolu dla uproszczenia i że możliwe są inne kodowania. Przykładowo, dyktując komuś przez telefon trudne słowo, każdą literę opisujemy całym słowem: przykładowo nazwę stolicy Gruzji, powiemy: T jak Teresa, B jak Barbara, I jak Iwona, L jak Lucyna, I jak Iwona, S jak Stanisław, I jak Iwona.
 ==Odległość Hamminga==
-{{definicja|[Odległość Hamminga]|hamming| Dla skończonego zbioru <math>\mathcal{A}</math> i <math>n \in \mathbb{N}</math>, '''odległość Hamminga''' między słowami <math>u, v \in \mathcal{A}^n</math> definiujemy jako
+{{definicja|[Odległość Hamminga]|hamming| Dla skończonego zbioru <math>\mathcal{A}</math> i <math>n \in \mathbb{N}</math> '''odległość Hamminga''' między słowami <math>u, v \in \mathcal{A}^n</math> definiujemy jako:
 <center><math>d (u,v) = | \{ i : u_i \neq v_i \}|</math></center>}}
-Łatwo sprawdzić że ta odległość spełnia warunki metryki
+Łatwo sprawdzić, że ta odległość spełnia warunki metryki:
 *<math>d(u,v)\ge 0</math>
-*<math>d(u,v) = 0 \Longleftrightarrow u = v </math>
+*<math>d(u,v) = 0 \Longleftrightarrow u = v</math>
 *<math>d(u,v) = d(v,u)</math>
 *<math>d(u,w) \leq d(u,v) + d(v,w)</math>
-(ostatnia nierówność wynika z faktu że <math>\{ i : u_i \neq w_i  \} \subseteq \{ i : u_i \neq v_i \} \cup \{ i : v_i \neq w_i  \} </math>)
+(ostatnia nierówność wynika z faktu że <math>\{ i : u_i \neq w_i  \} \subseteq \{ i : u_i \neq v_i \} \cup \{ i : v_i \neq w_i  \}</math>)
 Pojęcie odległości Hamminga umożliwia wygodne zapisywanie prawdopodobieństwa warunkowego sekwencji wyjściowej <math>\vec{b} = b_1 \ldots b_k</math> dla sekwencji wejściowej <math>\vec{a} = a_1 \ldots a_k</math>. Dla BSC prawdopodobieństwo to ma wartość:
-<center><math>p( b_1 \ldots b_k | a_1 \ldots a_k ) = Q^{d (\vec{a},\vec{b})} \cdot P^{1 - d (\vec{a},\vec{b})}</math></center>
+<center><math>p( b_1 \ldots b_k | a_1 \ldots a_k ) = Q^{d (\vec{a},\vec{b})} \cdot P^{k - d (\vec{a},\vec{b})}</math></center>

Teoria informacji/TI Wykład 9: Różnice pomiędzy wersjami

Aktualna wersja na dzień 22:13, 11 wrz 2023

Poprawa jakości kanału

Odległość Hamminga

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia