Wersja z 16:32, 25 wrz 2006

Nadokreślone układy równań liniowych

Zajmiemy się zadaniem wygładzania liniowego nazywanym też liniowym zadaniem najmniejszych kwadratów. Jest ono uogólnieniem zadania rozwiązywania kwadratowych układów równań liniowych do przy\-pa\-dku, gdy układ jest nadokreślony.

Jest to praktycznie bardzo często pojawiające się zadanie (pewien jego wariant rozwiązują np. nasze przenośne odbiorniki GPS), a autorem pierwszego rozwiązania był nie kto inny jak sam wielki Gauss.

Układ normalny

Niech $A$ będzie daną macierzą o $m$ wierszach i $n$ kolumnach, Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle A\inR^{m\times n}} , taką, że

m \geq n = rank (A),

albo równoważnie, taką że jej wektory kolumny są liniowo niezależne. Niech także dany będzie wektor Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle b\inR^m} . Jasne jest, że wtedy układ równań $A x = b$ nie zawsze ma rozwiązanie - mówimy, że układ jest nadokreślony.

Zadanie wygładzania liniowego polega na znalezieniu wektora Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle x^*\inR^n} , który minimalizuje wektor residualny $r = b - A x$ w normie drugiej, tzn.

Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle \| b\,-\,A x^*\|_2\,=\,\min_{ x\inR^n} \| b\,-\,A x\|_2. }

Przykład

Przypuśćmy, że dla pewnej funkcji Parser nie mógł rozpoznać (nieznana funkcja „\toR”): {\displaystyle \displaystyle f:[a,b]\toR} obserwujemy jej wartości $f_{i}$ (dokładne lub zaburzone) w punktach $t_{i}$ , $1 \leq i \leq m$ . Funkcję tą chcielibyśmy przybliżyć inną funkcją $w$ należącą do pewnej $n$ wymiarowej przestrzeni liniowej $W$ , np. przestrzeni wielomianów stopnia mniejszego niż $n$ . Jakość przybliżenia mierzymy wielkością

\sum_{i = 1}^{m} (f_{i} - w (t_{i}))^{2} .

Wybierając pewną bazę $(w_{j})_{j = 1}^{n}$ w $W$ i rozwijając $w$ w tej bazie, $w (t) = \sum_{j = 1}^{n} c_{j} w_{j} (t)$ , sprowadzamy problem do minimalizacji

\sum_{i = 1}^{m} {(f_{i} - \sum_{j = 1}^{n} c_{j} w_{j} (t_{i}))}^{2}

względem $c_{j}$ , a więc do zadania wygładzania liniowego. Rzeczywiście, kładąc Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle A=(a_{i,j})\inR^{m\times n}} z $a_{i, j} = w_{j} (t_{i})$ , $b = (f_{i})_{i = 1}^{m}$ i $x = (c_{j})_{j = 1}^{n}$ , wielkość (Uzupelnic: unorm ) jest równa $‖ b - A x ‖_{2}^{2}$ .

Lemat

Zadanie wygładzania liniowego ma jednoznaczne rozwiązanie $x^{*}$ , które spełnia układ równań

A^{T} A x = A^{T} b .

Zauważmy, że jeśli macierz $A$ jest kwadratowa, $m = n$ , to rozwiązaniem jest $x^{*} = A^{- 1} b$ i residuum jest zerem. Zadanie wygładzania liniowego jest więc uogólnieniem rozwiązywania kwadratowych układów równań liniowych.

Równanie (Uzupelnic: unormal ) nazywa się układem normalnym. Może ono nam sugerować sposób rozwiązania zadania wygładzania liniowego. Wystarczy bowiem pomnożyć macierz $A^{T}$ przez $A$ i rozwiązać układ normalny. Zauważmy ponadto, że macierz $A^{T} A$ jest symetryczna i dodatnio określona, bo $(A^{T} A)^{T} = A^{T} A$ i dla $x \neq 0$ mamy $x^{T} (A^{T} A) x = (A x)^{T} (A x) = ‖ A x ‖_{2} > 0$ , przy czym ostatnia nierówność wynika z faktu, że kolumny macierzy $A$ są liniowo niezależne i dlatego $A x \neq 0$ . Przy mnożeniu $A^{T}$ przez $A$ wystarczy więc obliczyć tylko elementy na głównej przekątnej i pod nią, a do rozwiązania równania z macierzą $A^{T} A$ można zastosować algorytm Banachiewicza-Choleskiego opisany w U. Uzupelnic: BC . Jak łatwo się przekonać, koszt takiego algorytmu wynosi $n^{2} (k + n / 3)$ , przy czym dominuje koszt mnożenia obliczenia macierzy $A^{T} A$ .

Ma on jednak pewne wady. Mnożenie macierzy powoduje w $f l_{ν}$ powstanie po drodze dodatkowych błędów, które mogą nawet zmienić rząd macierzy. Na przykład dla macierzy

A = (\begin{array}{cccc} 1 & 1 & 1 & 1 \\ ϵ \\ ϵ \\ ϵ \\ ϵ \end{array})

mamy

A^{T} A = (\begin{array}{cccc} 1 + ϵ^{2} & 1 & 1 & 1 \\ 1 & 1 + ϵ^{2} & 1 & 1 \\ 1 & 1 & 1 + ϵ^{2} & 1 \\ 1 & 1 & 1 & 1 + ϵ^{2} \end{array}) .

Jeśli $ϵ^{2} < ν$ to $f l_{ν} (1 + ϵ^{2}) = 1$ , co implikuje $rank (f l_{ν} (A^{T} A)) = 1$ , podczas, gdy $rank (f l_{ν} (A)) = 4$ .

Poniżej przedstawimy inną metodę rozwiązywania zadania wygładzania liniowego, która oparta jest na specjalnych przekształceniach zwanych odbiciami Householdera.

Odbicia Householdera

Dla danego wektora Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle w\inR^m} o normie $‖ w ‖_{2} = \sqrt{w^{T} w} = 1$ , odbicie (macierz) Householdera zdefiniowane jest jako

H = I - 2 w w^{T} .

Zauważmy, że

H x = x - 2 (w^{T} x) w,

a ponieważ $(w^{T} x) w = (x, w)_{2} w$ jest rzutem prostopadłym $x$ na kierunek wektora $w$ ( $(\cdot, \cdot)_{2}$ oznacza iloczyn skalarny), to $H x$ jest odbiciem lustrzanym wektora $x$ względem hiperpłaszczyzny (wymiaru $m - 1$ ) prostopadłej do $w$ .

Odbicia Householdera są przekształceniami nieosobliwymi spełniającymi

H^{- 1} = H = H^{T} .

Rzeczywiście, ponieważ $w$ ma normę jednostkową, mamy

H^{2} = (I - 2 w w^{T})^{2} = I - 4 w w^{T} + 4 w (w^{T} w) w^{T} = I,

oraz

H^{T} = (I - 2 w w^{T})^{T} = I - 2 (w^{T})^{T} w^{T} = I .

W szczególności $H$ jest więc przekształceniem ortogonalnym, $H^{- 1} = H^{T}$ , czyli nie zmienia długości wektora,

‖ H x ‖_{2} = \sqrt{(H x)^{T} (H x)} = \sqrt{x^{T} (H^{T} H) x} = \sqrt{x^{T} x} = ‖ x ‖_{2} .

Odbicia Householdera zastosujemy do przeprowadzenia danego wektora $x \neq 0$ na kierunek innego niezerowego wektora, powiedzmy $e$ , tzn.

H x = (I - 2 w w^{T}) x = α e .

<flash>file=Wektor.swf</flash><div.thumbcaption>Odbicie Househodera

Załóżmy dla uproszczenia, że $‖ e ‖_{2} = 1$ . Aby wyznaczyć $H$ zauważmy, że

w = \frac{x - α e}{2 (w^{T} x)},

a ponieważ $α = \pm ‖ x ‖_{2}$ i $‖ w ‖_{2} = 1$ to

w = \frac{x \mp ‖ x ‖_{2} e}{‖ x \mp ‖ x ‖_{2} e ‖_{2}} .

W szczególności, jeśli $e = e_{1}$ jest pierwszym wersorem, powyższe wzory dają

H = I - \frac{u u^{T}}{γ},

gdzie

u_{i} = {\begin{cases} x_{1} \mp ‖ x ‖_{2} & i = 1, \\ x_{i} & 2 \leq i \leq m, \end{cases}

oraz

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \gamma &= \frac 12\| u\|_2^2\,=\, \frac 1 2\Big((x_1\mp\| x\|_2)^2+\sum_{i=2}^m x_i^2\Big) \\ &= \frac 1 2 \Big(\sum_{i=1}^m x_i^2\,+\,\| x\|_2^2\,\mp\, 2 x_1\|x\|_2\Big) \,=\,\|x\|_2^2\,\mp\,x_1 \|x\|_2. \endaligned}

Otrzymaliśmy dwa odbicia Householdera przekształcające dany wektor $x$ na kierunek pierwszego wersora, w zależności od wybranego znaku przy $‖ x ‖_{2}$ . Ustalimy ten znak na plus gdy $x_{1} \geq 0$ , oraz na minus gdy $x_{1} < 0$ , co pozwoli na obliczenie $u_{1}$ i $γ$ z małym błędem względem w $f l_{ν}$ . Wtedy bowiem mamy

u_{1} = {\begin{cases} x_{1} + ‖ x ‖_{2} & x_{1} \geq 0, \\ x_{1} - ‖ x ‖_{2} & x_{1} < 0, \end{cases}

oraz $γ = ‖ x ‖_{2}^{2} + | x_{1} | ‖ x ‖_{2}$ , czyli zawsze dodajemy liczby tych samych znaków. Ponadto pierwsza współrzędna wektora $H x$ jest równa $- ‖ x ‖_{2}$ dla $x_{1} \geq 0$ oraz $+ ‖ x ‖_{2}$ dla $x_{1} < 0$ .

Rozkład QR

Odbić Householdera można użyć do rozkładu macierzy Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle A\inR^{m\times n}} na iloczyn ortogonalno-trójkątny.

Niech $A = (a_{1}, a_{2}, \dots, a_{n})$ , gdzie $a_{j}$ są wektorami-kolumnami macierzy $A$ . Wybierzmy pierwsze odbicie Householdera $H_{1} = I_{m} - u_{1} u_{1}^{T} / γ_{1}$ tak, aby przekształcało pierwszy wektor-kolumnę macierzy $A$ na kierunek $e_{1}$ . Efektem pomnożenia macierzy $A$ z lewej strony przez $H_{1}$ będzie wtedy macierz

A^{(1)} = (a_{1}^{(1)}, \dots, a_{n}^{(1)}) = (H_{1} a_{1}, \dots, H_{1} a_{n}),

w której pierwsza kolumna $a_{1}^{(1)}$ ma niezerową tylko pierwszą współrzędną. W następnym kroku wybieramy drugie przekształcenie Householdera ${\bar{H}}_{2} = I_{m - 1} - v_{2} v_{2}^{T} / γ_{2}$ wymiaru $m - 1$ tak, aby przeprowadzało wektor $(a_{i, 2}^{(1)})_{i = 2}^{m}$ na kierunek pierwszego wersora w $R^{m - 1}$ . Rozszerzając Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle v_2\inR^{m-1}} do wektora Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle u_2\inR^m} przez dodanie zera jako pierwszej współrzędnej, $u_{2} = (0, v_{2})^{T}$ , otrzymujemy przekształcenie (macierz) Householdera $H_{2} = I_{m} - u_{2} u_{2}^{T} / γ_{2}$ w $R^{m}$ postaci

H_{2} = (\begin{array}{cccc} 1 & 0^{T} \\ 0 & {\bar{H}}_{2} \end{array}) .

Pomnożenie macierzy $A^{(1)}$ z lewej strony przez $H_{2}$ spowoduje teraz wyzerowanie drugiej kolumny macierzy pod elementem $a_{2, 2}^{(1)}$ , przy czym pierwszy wiersz i pierwsza kolumna pozostaną niezmienione. Postępując tak dalej $n$ razy (albo $n - 1$ razy gdy $m = n$ ) otrzymujemy

H_{n} H_{n - 1} \dots H_{2} H_{1} A = R,

gdzie Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle R\inR^{m\times n}} jest uogólnioną macierzą trójkątną górną, tzn. $r_{i, j} = 0$ dla $i > j$ . Stąd, podstawiając $Q = H_{1} H_{2} \dots H_{n}$ , dostajemy rozkład macierzy na iloczyn ortogonalno-trójkątny

A = Q \cdot R .

Rzeczywiście, macierz Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle Q\inR^{m\times m}} jest ortogonalna, bo

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned Q^{-1} &= (H_1H_2\cdots H_n)^{-1}\,=\, H_n^{-1}\cdots H_2^{-1}H_1^{-1} \\ &= H_n^T\cdots H_2^TH_1^T \,=\, (H_1H_2\cdots H_n)^T\,=\,Q^T. \endaligned}

Dyspunując rozkładem (Uzupelnic: orttr ) zadanie wygładzania liniowego można rozwiązać następująco. Ponieważ mnożenie przez macierz ortogonalną nie zmienia normy drugiej wektora, mamy

Parser nie mógł rozpoznać (nieznana funkcja „\aligned”): {\displaystyle \displaystyle \aligned \| r\|_2 &= \| b-A x\|_2\;=\;\| b-QR x\|_2 \\ &= \|Q(Q^T b-R x)\|_2 \;=\;\| c-R x\|_2, \endaligned}

gdzie $c = Q^{T} b = H_{n} \dots H_{2} H_{1} b$ . Rozbijając wektor $c$ na $c = (c_{I}, c_{I I})^{T}$ , gdzie Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle c_I\inR^n} i Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle c_{II}\inR^{m-n}} , oraz macierz $R$ na

R = (\begin{array}{c} R_{I} \\ 0 \end{array}),

gdzie Parser nie mógł rozpoznać (nieznana funkcja „\inR”): {\displaystyle \displaystyle R_I\inR^{n\times n}} jest macierzą trójkątną górną, a $0$ jest macierzą zerową wymiaru $(m - n) \times n$ , otrzymujemy

‖ r ‖_{2}^{2} = ‖ c_{I} - R_{I} x ‖_{2}^{2} + ‖ c_{I I} ‖_{2}^{2} .

Rozwiązanie $x^{*}$ zadania wygładzania jest więc rozwiązaniem układu liniowego trójkątnego,

x^{*} = R_{I}^{- 1} c_{I},

oraz $‖ r^{*} ‖_{2} = ‖ b - A x^{*} ‖_{2} = ‖ c_{I I} ‖_{2}$ .

Zastanówmy się nad praktyczną realizacją tego algorytmu. Każde z kolejnych przekształceń Householdera $H_{k}$ wyznaczamy przez obliczenie $γ_{k}$ oraz współrzędnych wektora $u_{k}$ . Wektor ten ma tylko $m - k + 1$ współrzędnych niezerowych, a ponadto $u_{k, i} = a_{i, k}^{(k - 1)}$ dla $k + 1 \leq i \leq m$ . Dzięki takiej reprezentacji $H_{k}$ , mnożenia $H_{k} x$ możemy dla dowolnego $x$ realizować według wzoru

(H_{k} x)_{i} = x_{i} - s u_{k, i},

gdzie $s = u_{k}^{T} x / γ_{k}$ .

Uwzględnizjąc obecność zerowych elementów w $u_{k}$ , przejście od macierzy $A^{(k - 1)}$ do $A^{(k)}$ kosztuje rzędu $4 (m - k + 1) (n - k)$ operacji arytmetycznych i obliczenie jednego pierwiastka kwadratowego. Cały rozkład $A = Q R$ kosztuje więc rzędu (dla dużych $m$ i $n$ )

\sum_{k = 1}^{n} 4 (m - k + 1) (n - k) \approx \frac{4}{3} n^{3} + 2 n^{2} (m - n) = 2 n^{2} (m - n / 3)

operacji arytmetycznych i $n$ pierwiastków kwadratowych. Zauważmy, że w przypadku $m = n$ , a więc dla kwadratowego układu równań, koszt ten wynosi $(4 / 3) n^{3}$ i jest dwa razy większy od kosztu eliminacji Gaussa.

Uwarunkowanie

Biblioteki

@@ Linia 1: / Linia 1: @@
 =Nadokreślone układy równań liniowych=
-Zajmiemy się zadaniem wygładzania liniowego,
+Zajmiemy się zadaniem wygładzania liniowego
 nazywanym też liniowym zadaniem najmniejszych kwadratów.
 Jest ono uogólnieniem zadania rozwiązywania kwadratowych układów
@@ Linia 96: / Linia 95: @@
 Ma on jednak pewne wady. Mnożenie macierzy powoduje w <math>\displaystyle fl_\nu</math>
-powstanie "po drodze" dodatkowych błędów, które mogą nawet
+powstanie po drodze dodatkowych błędów, które mogą nawet
-zmienić rząd macierzy. Na przykład, dla macierzy
+zmienić rząd macierzy. Na przykład dla macierzy
 <center><math>\displaystyle A\,=\,\left(\begin{array} {cccc}
@@ Linia 117: / Linia 116: @@
 Jeśli <math>\displaystyle \epsilon^2<\nu</math> to <math>\displaystyle fl_\nu(1+\epsilon^2)=1</math>, co implikuje
-<math>\displaystyle  \mbox{rank} (fl_\nu(A^TA))=1</math>, podczs gdy <math>\displaystyle  \mbox{rank} (fl_\nu(A))=4</math>.
+<math>\displaystyle  \mbox{rank} (fl_\nu(A^TA))=1</math>, podczas, gdy <math>\displaystyle  \mbox{rank} (fl_\nu(A))=4</math>.
 Poniżej przedstawimy inną metodę rozwiązywania zadania
@@ Linia 194: / Linia 193: @@
 W szczególności, jeśli <math>\displaystyle  e= e_1</math> jest pierwszym
-wersorem to powyższe wzory dają
+wersorem, powyższe wzory dają
 <center><math>\displaystyle H\,=\,I\,-\,\frac{ u u^T}{\gamma},
@@ Linia 228: / Linia 227: @@
 oraz <math>\displaystyle \gamma=\| x\|_2^2+|x_1|\,\| x\|_2</math>, czyli zawsze
 dodajemy liczby tych samych znaków. Ponadto pierwsza współrzędna
-wektora <math>\displaystyle H x</math> jest równa <math>\displaystyle -\| x\|_2</math> dla <math>\displaystyle x_1\ge 0</math>, oraz
+wektora <math>\displaystyle H x</math> jest równa <math>\displaystyle -\| x\|_2</math> dla <math>\displaystyle x_1\ge 0</math> oraz
 <math>\displaystyle +\| x\|_2</math> dla <math>\displaystyle x_1<0</math>.

MN12: Różnice pomiędzy wersjami

Wersja z 16:32, 25 wrz 2006

Spis treści

Nadokreślone układy równań liniowych

Układ normalny

Odbicia Householdera

Rozkład QR

Uwarunkowanie

Biblioteki

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia