Wersja z 21:22, 29 wrz 2006

Układy liniowe z macierzami rzadkimi

<<< Powrót do strony głównej przedmiotu Metody numeryczne

Oglądaj wskazówki i rozwiązania __SHOWALL__
Ukryj wskazówki i rozwiązania __HIDEALL__

Ćwiczenie: Metoda Richardsona

Jedną z najprostszych klasycznych metod iteracyjnych dla równania $A x = b$ jest metoda Richardsona, zadana wzorem

x_{k + 1} = x_{k} + τ (b - A x_{k}),

gdzie $τ$ jest pewnym parametrem. Gdy $τ = 1$ , mamy do czynienia ze zwykłą metodą iteracji prostej, która najczęściej nie będzie zbieżna, dlatego wybór parametru $τ$ jest kluczowy dla skuteczności metody.

Dla $A$ symetrycznej, dodatnio określonej sprawdź, przy jakich założeniach o $τ$ metoda będzie zbieżna do rozwiązania $x^{*}$ z dowolnego wektora startowego $x_{0}$ i oceń szybkość tej zbieżności.

Testuj na macierzy jednowymiarowego laplasjanu $L$ różnych wymiarów. Jak najefektywniej zaimplementować mnożenie przez $L$ ?

Wskazówka

Rozwiązanie

Niech ekstremalnymi wartościami własnymi macierzy $A$ będą $0 < λ_{\min} \leq λ_{\max}$ . Ponieważ macierz iteracji metody Richardsona $B = I - τ A$ , to jej wartości własne muszą leżeć w przedziale $[1 - τ λ_{\max}, 1 - τ λ_{\min}]$ i --- oczywiście --- aby iteracja miała sens, $τ > 0$ (dlaczego?).

Co więcej, $| | B | |_{2} < 1$ wtedy i tylko wtedy, gdy $0 < τ < \frac{2}{λ_{\max}}$ , a najmniejszą normę spektralną macierzy $B$ uzyskamy, gdy $τ = \frac{2}{λ_{\max} + λ_{\min}}$ i wówczas

| | x_{k} - x | |_{2} \leq \frac{λ_{\max} - λ_{\min}}{λ_{\max} + λ_{\min}} | | x_{k - 1} - x | |_{2} .

(Przy okazji zauważ, że gdyby macierz $A$ nie była określona, tzn. miałaby zarówno dodatnie, jak i ujemne wartości własne, to metoda Richardsona mogłaby w ogóle nie być zbieżna (dla pewnych wektorów startowych))

Jeśli chodzi o mnożenie przez macierz jednowymiarowego laplasjanu, to najprościej wcale nie używać struktury macierzy! Rzeczywiście, jedyne, czego potrzebujemy to operacja mnożenia wektora przez macierz $L$ , a to realizuje pętla:

void LapMult(double *x, int N, double *y)
/* 
Mnożenie wektora przez macierz 1-wym laplasjanu L wymiaru N

	Wejście:
	x - wektor, który mnożymy przez L
	N - jego długość
	
	Wyjście:
	y - wynik: y = Lx
*/
{
	int i;

	for (i = 1; i < N-1; i++)
		y[i] = -x[i-1] + 2.0*x[i] - x[i+1];

	y[0] = 2.0*x[0] - x[1];
	y[N-1] = -x[N-2] + 2.0*x[N-1];
}

Ćwiczenie

Zaimplementuj operacje:

mnożenia macierzy $A$ przez wektor $x$ ,
wyłuskania wartości elementu $A_{i j}$ ,
zmiany wartości pewnego zerowego wyrazu macierzy na niezerową,

jeśli macierz jest zadana w formacie

AIJ,
CSC,
CSR.

Przetestuj dla kilku macierzy z kolekcji MatrixMarket.

Rozwiązanie

Ćwiczenie: Konwersja formatu macierzy rzadkiej

Napisz procedurę aij2csr, konwertującą macierz w formacie AIJ do CSR i csr2aij, działającą w drugą stronę.

Rozwiązanie

Ćwiczenie

Jak tanio rozwiązywać układ równań z macierzą cykliczną trójdiagonalną, tzn.

A = (\begin{matrix} a_{1} & c_{1} & b_{1} \\ b_{2} & a_{2} & c_{2} \\ b_{3} & a_{3} & ⋱ \\ ⋱ & ⋱ & c_{N - 1} \\ c_{N} & b_{N} & a_{N} \end{matrix})

Dla uproszczenia załóżmy, że macierz jest dodatnio określona i symetryczna.

Zaimplementuj opracowaną metodę, korzystając z BLASów i LAPACKa.

Wskazówka

Rozwiązanie

Gdyby pominąć ostatni wiersz i kolumnę, macierz byłaby trójdiagonalna, a my już wiemy, co z nią zrobić... Jak więc sprytnie pozbyć się ostatniej niewiadomej i ostatniego równania? W naszej macierzy wyróżnijmy ostatni wiersz i kolumnę:

A = (\begin{matrix} T & v \\ w^{T} & a_{N} \end{matrix}),

gdzie $T$ jest $N - 1$ podmacierzą główną $A$ ,

T = (\begin{matrix} a_{1} & c_{1} \\ b_{2} & a_{2} & c_{2} \\ b_{3} & a_{3} & ⋱ \\ ⋱ & ⋱ & c_{N - 2} \\ b_{N - 1} & a_{N - 1} \end{matrix}),

natomiast $w^{T} = [c_{N}, 0, \dots, 0, b_{N}]$ , $v = [b_{1}, 0, \dots, 0, c_{N - 1}]^{T}$ .

Mając rozkład $T = L U$ , łatwo stąd wygenerować rozkład $A$ , gdyż

(\begin{matrix} T & v \\ w^{T} & a_{N} \end{matrix}) = (\begin{matrix} L \\ l^{T} & 1 \end{matrix}) \cdot (\begin{matrix} U & u \\ u_{N} \end{matrix}),

gdzie spełnione są zależności

$T = L U$ (rozkład LU macierzy trójdiagonalnej $T$ )
$U l = w$ (rozwiązanie układu równań z macierzą dwudiagonalną)
$L u = v$ (jw.)
$l^{T} u + u_{N} = a_{N}$ .

Ćwiczenie: CGNE

Ktoś mógłby sugerować, że skoro CG działa tylko dla macierzy symetrycznych, to dowolny układ $A x = b$ z macierzą nieosobliwą można transformować do równoważnego mu układu równań normalnych

A^{T} A x = A^{T} b,

którego macierz $A^{T} A$ jest już oczywiście macierzą symetryczną i dodatnio określoną.

Wskaż potencjalne wady tej metody i podaj sposób jej implementacji.

Wskazówka

Jakie jest uwarunkowanie macierzy

A^{T} A

?

Rozwiązanie

Nietrudno sprawdzić, że dla normy spektralnej macierzy,

cond (A^{T} A) = (cond (A))^{2},

a więc w przypadku macierzy źle uwarunkowanych należy spodziewać się patologicznie dużej liczby iteracji. Chociaż dobre (symetryczne, dodatnio określone) imadło $M$ mogłoby pomóc, np.

M A^{T} M A x = M A^{T} M b,

to jednak znacznie lepiej stosować metody opracowane specjalnie dla macierzy niesymetrycznych, np. GMRES (oczywiście z nieodzownym ściskaniem macierzy, gdy jest źle uwarunkowana...).

Implementacja metody iteracyjnej to tylko decyzja, jak realizować mnożenie przez $A^{T} A$ . Niedobra metoda to

B = <math>\displaystyle A^TA</math>;
...
while ...
	y = B*x;
end

gdyż $B$ będzie bardziej wypełniona niż A. Znacznie lepiej

...
while ...
	y = A*x;
	y = (y'*A)';
end

co realizuje się kosztem równym dwukrotnemu mnożeniu przez macierz $A$ (w formacie AIJ) i nie wymaga dodatkowej pamięci.

MN08LAB: Różnice pomiędzy wersjami

Wersja z 21:22, 29 wrz 2006

Układy liniowe z macierzami rzadkimi

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia

@@ Linia 1: / Linia 1: @@
 <!--
-Konwertowane  z pliku LaTeX przez latex2mediawiki, zob. http://www.ii.uj.edu.pl/&nbsp;pawlik1/latex2mediawiki.php
+Konwertowane  z pliku LaTeX przez latex2mediawiki, zob. http://www.ii.uj.edu.pl/&nbsp;pawlik1/latex2mediawiki.php.
+Niezb�dne rozszerzenia i modyfikacje oryginalnego latex2mediawiki
+wprowadzi� przykry@mimuw.edu.pl
 -->
-=Ćwiczenia: układy liniowe z macierzami rzadkimi=
+=Układy liniowe z macierzami rzadkimi=
+{{powrot |Metody numeryczne | do strony głównej
+przedmiotu <strong>Metody numeryczne</strong>}}
+<div class="mw-collapsible mw-made=collapsible mw-collapsed">
+Oglądaj wskazówki i rozwiązania __SHOWALL__<br>
+Ukryj wskazówki i rozwiązania __HIDEALL__
+</div>
 <div style="margin-top:1em; padding-top,padding-bottom:1em;">
@@ Linia 9: / Linia 20: @@
 <div class="exercise">
-Jedną z najprostszych klasycznych metod iteracyjnych dla równania <math>\displaystyle Ax=b</math> jest metoda Richardsona zadana
+Jedną z najprostszych klasycznych metod iteracyjnych dla równania <math>\displaystyle Ax=b</math> jest metoda Richardsona, zadana
 wzorem
@@ Linia 19: / Linia 30: @@
 parametru <math>\displaystyle \tau</math> jest kluczowy dla skuteczności metody.
-Dla <math>\displaystyle A</math> symetrycznej dodatnio określonej sprawdź, przy jakich założeniach o
+Dla <math>\displaystyle A</math> symetrycznej, dodatnio określonej sprawdź, przy jakich założeniach o
 <math>\displaystyle \tau</math> metoda będzie zbieżna do rozwiązania <math>\displaystyle x^*</math> z dowolnego wektora startowego
 <math>\displaystyle x_0</math> i oceń szybkość tej zbieżności.
 Testuj na macierzy jednowymiarowego laplasjanu <math>\displaystyle L</math> różnych wymiarów. Jak najefektywniej zaimplementować mnożenie przez <math>\displaystyle L</math>?
+<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Wskazówka </span><div class="mw-collapsible-content" style="display:none">
+<div style="font-size:smaller; background-color:#f9fff9; padding: 1em"> Zadanie można rozwiązać przez analogię do opisywanego w wykładzie przypadku [[MN08#Macierz laplasjanu|zastosowania metody Jacobiego do macierzy jednowymiarowego laplasjanu]]: wystarczy uogólnić! </div>
+</div></div>
 </div></div>
+<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none"><div style="margin-left:1em">
+Niech ekstremalnymi wartościami własnymi macierzy <math>\displaystyle A</math> będą <math>\displaystyle 0 < \lambda_{\min} \leq \lambda_{\max}</math>. Ponieważ macierz iteracji metody Richardsona <math>\displaystyle B= I - \tau A</math>, to jej wartości własne muszą leżeć w przedziale <math>\displaystyle [1-\tau \lambda_{\max}, 1 - \tau \lambda_{\min}]</math> i --- oczywiście --- aby iteracja miała sens, <math>\displaystyle \tau > 0</math> (dlaczego?).
+Co więcej, <math>\displaystyle ||B||_2 < 1</math> wtedy i tylko wtedy, gdy <math>\displaystyle 0 < \tau < \frac{2}{\lambda_{\max}}</math>, a najmniejszą normę spektralną macierzy <math>\displaystyle B</math> uzyskamy, gdy <math>\displaystyle \tau = \frac{2}{\lambda_{\max} + \lambda_{\min}}</math> i wówczas
+<center><math>\displaystyle ||x_k-x||_2 \leq \frac{\lambda_{\max} - \lambda_{\min}}{\lambda_{\max} + \lambda_{\min}}||x_{k-1}-x||_2.
+</math></center>
+(Przy okazji zauważ, że gdyby macierz <math>\displaystyle A</math> nie była  określona, tzn. miałaby zarówno dodatnie, jak i ujemne wartości własne, to metoda Richardsona mogłaby w ogóle nie być zbieżna (dla pewnych wektorów startowych))
+Jeśli chodzi o mnożenie przez macierz jednowymiarowego laplasjanu, to najprościej wcale nie używać struktury macierzy! Rzeczywiście, jedyne, czego potrzebujemy to operacja <strong>mnożenia wektora przez macierz</strong> <math>\displaystyle L</math>, a to realizuje pętla:
+ <div style="margin: 1em; padding:1em; color: #000; background-color:#fcfcfc;"><pre>void LapMult(double *x, int N, double *y)
+/*
+Mnożenie wektora przez macierz 1-wym laplasjanu L wymiaru N
+	Wejście:
+	x - wektor, który mnożymy przez L
+	N - jego długość
+	Wyjście:
+	y - wynik: y = Lx
+*/
+{
+	int i;
+	for (i = 1; i < N-1; i++)
+		y[i] = -x[i-1] + 2.0*x[i] - x[i+1];
+	y[0] = 2.0*x[0] - x[1];
+	y[N-1] = -x[N-2] + 2.0*x[N-1];
+}
+</pre></div>
+</div></div></div>
 <div style="margin-top:1em; padding-top,padding-bottom:1em;">
@@ Linia 49: / Linia 100: @@
 Dodawanie nowego elementu w formacie AIJ jest bardzo łatwe. W przeciwieństwie do
 pozostałych, w których trzeba zachowywać uporządkowanie. Mnożenie przez wektor
-najwygodniejsze jest w CSR. Wyłuskanie wartości jest najmniej efektywne w
+najwygodniejsze jest w CSR, bo dodatkowo narzuca zasadę lokalności w przestrzeni. Wyłuskanie wartości jest najmniej efektywne w
-formacie AIJ.
+formacie AIJ. Szczegóły opisane są w rozdziale 3.5 książki
-Zob. [http://www-users.cs.umn.edu/&nbsp;saad/books.html  Y. Saad, Iterative methods for sparse linear systems]
+* <span style="font-variant:small-caps">Y. Saad</span>, <cite> [http://www-users.cs.umn.edu/&nbsp;saad/books.html  Iterative methods for sparse linear systems]</cite>, PWS, 1996.
+Zobacz także implementacje w Fortranie, w pakiecie [http://www-users.cs.umn.edu/&nbsp;saad/software/SPARSKIT/sparskit.html  SPARSKIT], będącym czymś w rodzaju odpowiednika BLAS dla macierzy rozrzedzonych.
 </div></div></div>
+<div style="margin-top:1em; padding-top,padding-bottom:1em;">
+<span  style="display: block; background-color:#fefeee; border-bottom: 1px solid #E5E5E5; line-height: 1.1em; padding-bottom: 0.2em; font-variant:small-caps; color:#1A6ABF;">Ćwiczenie: Konwersja formatu macierzy rzadkiej</span>
+<div class="exercise">
+Napisz procedurę <code>aij2csr</code>, konwertującą macierz w formacie AIJ do CSR i <code>csr2aij</code>, działającą w drugą stronę.
+</div></div>
+<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none"><div style="margin-left:1em">
+Zobacz, jak to zrobiono w pakiecie [http://www-users.cs.umn.edu/&nbsp;saad/software/SPARSKIT/sparskit.html  SPARSKIT].
+</div></div></div>
+<!--
+<div style="margin-top:1em; padding-top,padding-bottom:1em;">
+<span  style="display: block; background-color:#fefeee; border-bottom: 1px solid #E5E5E5; line-height: 1.1em; padding-bottom: 0.2em; font-variant:small-caps; color:#1A6ABF;">Ćwiczenie</span>
+<div class="exercise">
+Format AIJ można implementować na dwa sposoby: jako strukturę złożoną z trzech wektorów:
+ <div style="margin: 1em; padding:1em; color: #000; background-color:#fcfcfc;"><pre>typedef struct {
+int i[NNZ];
+int j[NNZ];
+double v[NNZ];
+} matrix;
+matrix A;
+</pre></div>
+lub jako wektor struktur:
+ <div style="margin: 1em; padding:1em; color: #000; background-color:#fcfcfc;"><pre>typedef struct {
+int i;
+int j;
+double v;
+} element;
+element B[NNZ];
+</pre></div>
+Przedyskutuj wady i zalety obu podejść i wskaż lepsze.
+</div></div>
+<div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none"><div style="margin-left:1em">
+Korzystniejszy jest wariant z wektorem struktur: łatwiej wtedy dodawać i wyłuskiwać całe elementy, poza tym (choć, prawdę mówiąc, zysk jest marginalny) jest wtedy mniej "skakania" po pamięci: cała informacja o elemencie jest zlokalizowana w jednym obszarze pamięci, co może trochę poprawiać wykorzystanie hierarchii pamięci.
+</div></div></div>
+-->
 <div style="margin-top:1em; padding-top,padding-bottom:1em;">
 <span  style="display: block; background-color:#fefeee; border-bottom: 1px solid #E5E5E5; line-height: 1.1em; padding-bottom: 0.2em; font-variant:small-caps; color:#1A6ABF;">Ćwiczenie</span>
@@ Linia 75: / Linia 178: @@
 <div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Wskazówka </span><div class="mw-collapsible-content" style="display:none">
-<div style="font-size:smaller; background-color:#efe"> Dziel i rządź! </div>
+<div style="font-size:smaller; background-color:#f9fff9; padding: 1em"> Dziel i rządź! (Tylko: jak?) </div>
 </div></div>
@@ Linia 82: / Linia 185: @@
 <div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none"><div style="margin-left:1em">
-Gdyby pominąć ostatni wiersz i kolumnę, macierz byłaby trójdiagonalna, a my już wiemy, co z nią zrobić... Jak więc sprytnie pozbyć się ostatniej niewiadomej i
+Gdyby pominąć ostatni wiersz i kolumnę, macierz byłaby trójdiagonalna, a  my już wiemy, co z nią zrobić... Jak więc sprytnie pozbyć się ostatniej niewiadomej i ostatniego równania? W naszej macierzy wyróżnijmy ostatni wiersz i kolumnę:
-ostatniego równania?
-W naszej macierzy wyróżnijmy ostatni wiersz i kolumnę:
 <center><math>\displaystyle A =
@@ Linia 135: / Linia 236: @@
 <div class="exercise">
-Ktoś mógłby sugerować, że skoro CG działa tylko dla macierzy symetrycznych, to dowolny układ <math>\displaystyle Ax=b</math> z macierzą nieosobliwą można transformować do równoważnego mu układu [[Dodaj WIKIlink|równań normalnych]]
+Ktoś mógłby sugerować, że skoro CG działa tylko dla macierzy symetrycznych, to dowolny układ <math>\displaystyle Ax=b</math> z macierzą nieosobliwą można transformować do równoważnego mu układu [[MN12#Układ równań normalnych|równań normalnych]]
 <center><math>\displaystyle A^TAx = A^T b,
-</math></center>,
+</math></center>
 którego macierz <math>\displaystyle A^TA</math> jest już oczywiście macierzą symetryczną i dodatnio określoną.
@@ Linia 145: / Linia 246: @@
 <div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Wskazówka </span><div class="mw-collapsible-content" style="display:none">
-<div style="font-size:smaller; background-color:#efe"> Jakie jest uwarunkowanie macierzy <math>\displaystyle A^TA</math>? </div>
+<div style="font-size:smaller; background-color:#f9fff9; padding: 1em"> Jakie jest uwarunkowanie macierzy <math>\displaystyle A^TA</math>? </div>
 </div></div>
@@ Linia 154: / Linia 255: @@
 <center><math>\displaystyle  \mbox{cond} (A^TA) = ( \mbox{cond} (A))^2,
-</math></center>,
+</math></center>
-a więc w przypadku macierzy źle uwarunkowanych należy spodziewać się patologicznie dużej liczby iteracji. Chociaż dobry prekondycjoner mógłby pomóc:
+a więc w przypadku macierzy źle uwarunkowanych należy spodziewać się patologicznie dużej liczby iteracji. Chociaż dobre (symetryczne, dodatnio określone) imadło <math>\displaystyle M</math> mogłoby pomóc, np.
 <center><math>\displaystyle MA^TMAx = MA^T Mb,
-</math></center>,
+</math></center>
-to jednak znacznie lepiej stosować metody opracowane specjalnie dla maicerzy niesymetrycznych, np. GMRES (też z dobrym prekondycjonerem...).
+to jednak znacznie lepiej stosować metody opracowane specjalnie dla macierzy niesymetrycznych, np. GMRES (oczywiście z nieodzownym ściskaniem macierzy, gdy jest źle uwarunkowana...).
-Implementacja metody to tylko decyzja, jak realizować mnożenie przez <math>\displaystyle A^TA</math>. Oczywiście niedobra metoda to
+Implementacja metody iteracyjnej to tylko decyzja, jak realizować mnożenie przez <math>\displaystyle A^TA</math>. Niedobra metoda to
-<div class="code" style="background-color:#e8e8e8; padding:1em"><pre>
+ <div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>B = <math>\displaystyle A^TA</math>;
-B = A^TA;
 ...
 while ...
 	y = B*x;
 end
-</pre></div>,
+</pre></div>
 gdyż <math>\displaystyle B</math> będzie bardziej wypełniona niż A. Znacznie lepiej
-<div class="code" style="background-color:#e8e8e8; padding:1em"><pre>
+ <div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>...
-...
 while ...
 	y = A*x;
 	y = (y'*A)';
 end
 </pre></div>
-jest to koszt równy dwukrotnemu mnożeniu przez macierz <math>\displaystyle A</math> (w formacie AIJ).
+co realizuje się kosztem równym dwukrotnemu mnożeniu przez macierz <math>\displaystyle A</math> (w formacie AIJ) i nie wymaga dodatkowej pamięci.
 </div></div></div>