Aktualna wersja na dzień 21:49, 11 wrz 2023

Układy liniowe z macierzami rzadkimi

<<< Powrót do strony głównej przedmiotu Metody numeryczne

Oglądaj wskazówki i rozwiązania __SHOWALL__
Ukryj wskazówki i rozwiązania __HIDEALL__

Ćwiczenie: Metoda Richardsona

Jedną z najprostszych klasycznych metod iteracyjnych dla równania $A x = b$ jest metoda Richardsona, zadana wzorem

x_{k + 1} = x_{k} + τ (b - A x_{k})

,

gdzie $τ$ jest pewnym parametrem. Gdy $τ = 1$ , mamy do czynienia ze zwykłą metodą iteracji prostej, która najczęściej nie będzie zbieżna, dlatego wybór parametru $τ$ jest kluczowy dla skuteczności metody.

Dla $A$ symetrycznej, dodatnio określonej sprawdź, przy jakich założeniach o $τ$ metoda będzie zbieżna do rozwiązania $x^{*}$ z dowolnego wektora startowego $x_{0}$ i oceń szybkość tej zbieżności.

Testuj na macierzy jednowymiarowego laplasjanu $L$ różnych wymiarów. Jak najefektywniej zaimplementować mnożenie przez $L$ ?

Wskazówka

Rozwiązanie

Niech ekstremalnymi wartościami własnymi macierzy $A$ będą $0 < λ_{\min} \leq λ_{\max}$ . Ponieważ macierz iteracji metody Richardsona $B = I - τ A$ , to jej wartości własne muszą leżeć w przedziale $[1 - τ λ_{\max}, 1 - τ λ_{\min}]$ i --- oczywiście --- aby iteracja miała sens, $τ > 0$ (dlaczego?).

Co więcej, $| | B | |_{2} < 1$ wtedy i tylko wtedy, gdy $0 < τ < \frac{2}{λ_{\max}}$ , a najmniejszą normę spektralną macierzy $B$ uzyskamy, gdy $τ = \frac{2}{λ_{\max} + λ_{\min}}$ i wówczas

| | x_{k} - x | |_{2} \leq \frac{λ_{\max} - λ_{\min}}{λ_{\max} + λ_{\min}} | | x_{k - 1} - x | |_{2}

(Przy okazji zauważ, że gdyby macierz $A$ nie była określona, tzn. miałaby zarówno dodatnie, jak i ujemne wartości własne, to metoda Richardsona mogłaby w ogóle nie być zbieżna (dla pewnych wektorów startowych))

Jeśli chodzi o mnożenie przez macierz jednowymiarowego laplasjanu, to najprościej wcale nie używać struktury macierzy! Rzeczywiście, jedyne, czego potrzebujemy to operacja mnożenia wektora przez macierz $L$ , a to realizuje pętla:

void LapMult(double *x, int N, double *y)
/* 
Mnożenie wektora przez macierz 1-wym laplasjanu L wymiaru N

	Wejście:
	x - wektor, który mnożymy przez L
	N - jego długość
	
	Wyjście:
	y - wynik: y = Lx
*/
{
	int i;

	for (i = 1; i < N-1; i++)
		y[i] = -x[i-1] + 2.0*x[i] - x[i+1];

	y[0] = 2.0*x[0] - x[1];
	y[N-1] = -x[N-2] + 2.0*x[N-1];
}

Ćwiczenie

Zaimplementuj operacje:

mnożenia macierzy $A$ przez wektor $x$ ,
wyłuskania wartości elementu $A_{i j}$ ,
zmiany wartości pewnego zerowego wyrazu macierzy na niezerową,

jeśli macierz jest zadana w formacie

AIJ,
CSC,
CSR.

Przetestuj dla kilku macierzy z kolekcji MatrixMarket.

Rozwiązanie

Ćwiczenie: Konwersja formatu macierzy rzadkiej

Napisz procedurę aij2csr, konwertującą macierz w formacie AIJ do CSR i csr2aij, działającą w drugą stronę.

Rozwiązanie

Ćwiczenie

Jak tanio rozwiązywać układ równań z macierzą cykliczną trójdiagonalną, tzn.

A = (\begin{matrix} a_{1} & c_{1} & b_{1} \\ b_{2} & a_{2} & c_{2} \\ b_{3} & a_{3} & ⋱ \\ ⋱ & ⋱ & c_{N - 1} \\ c_{N} & b_{N} & a_{N} \end{matrix})

Dla uproszczenia załóżmy, że macierz jest dodatnio określona i symetryczna.

Zaimplementuj opracowaną metodę, korzystając z BLASów i LAPACKa.

Wskazówka

Rozwiązanie

Gdyby pominąć ostatni wiersz i kolumnę, macierz byłaby trójdiagonalna, a my już wiemy, co z nią zrobić... Jak więc sprytnie pozbyć się ostatniej niewiadomej i ostatniego równania? W naszej macierzy wyróżnijmy ostatni wiersz i kolumnę:

A = (\begin{matrix} T & v \\ w^{T} & a_{N} \end{matrix})

,

gdzie $T$ jest $N - 1$ podmacierzą główną $A$ ,

T = (\begin{matrix} a_{1} & c_{1} \\ b_{2} & a_{2} & c_{2} \\ b_{3} & a_{3} & ⋱ \\ ⋱ & ⋱ & c_{N - 2} \\ b_{N - 1} & a_{N - 1} \end{matrix})

,

natomiast $w^{T} = [c_{N}, 0, \dots, 0, b_{N}]$ , $v = [b_{1}, 0, \dots, 0, c_{N - 1}]^{T}$ .

Mając rozkład $T = L U$ , łatwo stąd wygenerować rozkład $A$ , gdyż

(\begin{matrix} T & v \\ w^{T} & a_{N} \end{matrix}) = (\begin{matrix} L \\ l^{T} & 1 \end{matrix}) \cdot (\begin{matrix} U & u \\ u_{N} \end{matrix})

,

gdzie spełnione są zależności

$T = L U$ (rozkład LU macierzy trójdiagonalnej $T$ )
$U l = w$ (rozwiązanie układu równań z macierzą dwudiagonalną)
$L u = v$ (jw.)
$l^{T} u + u_{N} = a_{N}$ .

Ćwiczenie: CGNE

Ktoś mógłby sugerować, że skoro CG działa tylko dla macierzy symetrycznych, to dowolny układ $A x = b$ z macierzą nieosobliwą można transformować do równoważnego mu układu równań normalnych

A^{T} A x = A^{T} b

,

którego macierz $A^{T} A$ jest już oczywiście macierzą symetryczną i dodatnio określoną.

Wskaż potencjalne wady tej metody i podaj sposób jej implementacji.

Wskazówka

Jakie jest uwarunkowanie macierzy

A^{T} A

?

Rozwiązanie

Nietrudno sprawdzić, że dla normy spektralnej macierzy,

cond (A^{T} A) = (cond (A))^{2}

,

a więc w przypadku macierzy źle uwarunkowanych należy spodziewać się patologicznie dużej liczby iteracji. Chociaż dobre (symetryczne, dodatnio określone) imadło $M$ mogłoby pomóc, np.

M A^{T} M A x = M A^{T} M b

,

to jednak znacznie lepiej stosować metody opracowane specjalnie dla macierzy niesymetrycznych, np. GMRES (oczywiście z nieodzownym ściskaniem macierzy, gdy jest źle uwarunkowana...).

Implementacja metody iteracyjnej to tylko decyzja, jak realizować mnożenie przez $A^{T} A$ . Niedobra metoda to

B = <math>A^TA</math>;
...
while ...
	y = B*x;
end

gdyż $B$ będzie bardziej wypełniona niż A. Znacznie lepiej

...
while ...
	y = A*x;
	y = (y'*A)';
end

co realizuje się kosztem równym dwukrotnemu mnożeniu przez macierz $A$ (w formacie AIJ) i nie wymaga dodatkowej pamięci.

@@ Linia 19: / Linia 19: @@
 <div class="exercise">
-Jedną z najprostszych klasycznych metod iteracyjnych dla równania <math>\displaystyle Ax=b</math> jest metoda Richardsona, zadana
+Jedną z najprostszych klasycznych metod iteracyjnych dla równania <math>Ax=b</math> jest metoda Richardsona, zadana
 wzorem
-<center><math>\displaystyle x_{k+1} = x_k + \tau (b- Ax_k),
+<center><math>x_{k+1} = x_k + \tau (b- Ax_k)</math>,</center>
-</math></center>
-gdzie <math>\displaystyle \tau</math> jest pewnym parametrem. Gdy <math>\displaystyle \tau=1</math>, mamy do czynienia ze zwykłą
+gdzie <math>\tau</math> jest pewnym parametrem. Gdy <math>\tau=1</math>, mamy do czynienia ze zwykłą
 metodą iteracji prostej, która najczęściej nie będzie zbieżna, dlatego wybór
-parametru <math>\displaystyle \tau</math> jest kluczowy dla skuteczności metody.
+parametru <math>\tau</math> jest kluczowy dla skuteczności metody.
-Dla <math>\displaystyle A</math> symetrycznej, dodatnio określonej sprawdź, przy jakich założeniach o
+Dla <math>A</math> symetrycznej, dodatnio określonej sprawdź, przy jakich założeniach o
-<math>\displaystyle \tau</math> metoda będzie zbieżna do rozwiązania <math>\displaystyle x^*</math> z dowolnego wektora startowego
+<math>\tau</math> metoda będzie zbieżna do rozwiązania <math>x^*</math> z dowolnego wektora startowego
-<math>\displaystyle x_0</math> i oceń szybkość tej zbieżności.
+<math>x_0</math> i oceń szybkość tej zbieżności.
-Testuj na macierzy jednowymiarowego laplasjanu <math>\displaystyle L</math> różnych wymiarów. Jak najefektywniej zaimplementować mnożenie przez <math>\displaystyle L</math>?
+Testuj na macierzy jednowymiarowego laplasjanu <math>L</math> różnych wymiarów. Jak najefektywniej zaimplementować mnożenie przez <math>L</math>?
 <div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Wskazówka </span><div class="mw-collapsible-content" style="display:none">
@@ Linia 42: / Linia 41: @@
 <div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none"><div style="margin-left:1em">
-Niech ekstremalnymi wartościami własnymi macierzy <math>\displaystyle A</math> będą <math>\displaystyle 0 < \lambda_{\min} \leq \lambda_{\max}</math>. Ponieważ macierz iteracji metody Richardsona <math>\displaystyle B= I - \tau A</math>, to jej wartości własne muszą leżeć w przedziale <math>\displaystyle [1-\tau \lambda_{\max}, 1 - \tau \lambda_{\min}]</math> i --- oczywiście --- aby iteracja miała sens, <math>\displaystyle \tau > 0</math> (dlaczego?).
+Niech ekstremalnymi wartościami własnymi macierzy <math>A</math> będą <math>0 < \lambda_{\min} \leq \lambda_{\max}</math>. Ponieważ macierz iteracji metody Richardsona <math>B= I - \tau A</math>, to jej wartości własne muszą leżeć w przedziale <math>[1-\tau \lambda_{\max}, 1 - \tau \lambda_{\min}]</math> i --- oczywiście --- aby iteracja miała sens, <math>\tau > 0</math> (dlaczego?).
-Co więcej, <math>\displaystyle ||B||_2 < 1</math> wtedy i tylko wtedy, gdy <math>\displaystyle 0 < \tau < \frac{2}{\lambda_{\max}}</math>, a najmniejszą normę spektralną macierzy <math>\displaystyle B</math> uzyskamy, gdy <math>\displaystyle \tau = \frac{2}{\lambda_{\max} + \lambda_{\min}}</math> i wówczas
+Co więcej, <math>||B||_2 < 1</math> wtedy i tylko wtedy, gdy <math>0 < \tau < \frac{2}{\lambda_{\max}}</math>, a najmniejszą normę spektralną macierzy <math>B</math> uzyskamy, gdy <math>\tau = \frac{2}{\lambda_{\max} + \lambda_{\min}}</math> i wówczas
-<center><math>\displaystyle ||x_k-x||_2 \leq \frac{\lambda_{\max} - \lambda_{\min}}{\lambda_{\max} + \lambda_{\min}}||x_{k-1}-x||_2.
+<center><math>||x_k-x||_2 \leq \frac{\lambda_{\max} - \lambda_{\min}}{\lambda_{\max} + \lambda_{\min}}||x_{k-1}-x||_2</math></center>
-</math></center>
-(Przy okazji zauważ, że gdyby macierz <math>\displaystyle A</math> nie była  określona, tzn. miałaby zarówno dodatnie, jak i ujemne wartości własne, to metoda Richardsona mogłaby w ogóle nie być zbieżna (dla pewnych wektorów startowych))
+(Przy okazji zauważ, że gdyby macierz <math>A</math> nie była  określona, tzn. miałaby zarówno dodatnie, jak i ujemne wartości własne, to metoda Richardsona mogłaby w ogóle nie być zbieżna (dla pewnych wektorów startowych))
-Jeśli chodzi o mnożenie przez macierz jednowymiarowego laplasjanu, to najprościej wcale nie używać struktury macierzy! Rzeczywiście, jedyne, czego potrzebujemy to operacja <strong>mnożenia wektora przez macierz</strong> <math>\displaystyle L</math>, a to realizuje pętla:
+Jeśli chodzi o mnożenie przez macierz jednowymiarowego laplasjanu, to najprościej wcale nie używać struktury macierzy! Rzeczywiście, jedyne, czego potrzebujemy to operacja <strong>mnożenia wektora przez macierz</strong> <math>L</math>, a to realizuje pętla:
   <div style="margin: 1em; padding:1em; color: #000; background-color:#fcfcfc;"><pre>void LapMult(double *x, int N, double *y)
@@ Linia 82: / Linia 80: @@
 Zaimplementuj operacje:
-* mnożenia macierzy <math>\displaystyle A</math> przez wektor <math>\displaystyle x</math>,
+* mnożenia macierzy <math>A</math> przez wektor <math>x</math>,
-* wyłuskania wartości elementu <math>\displaystyle A_{ij}</math>,
+* wyłuskania wartości elementu <math>A_{ij}</math>,
 * zmiany wartości pewnego zerowego wyrazu macierzy na niezerową,
@@ Linia 101: / Linia 99: @@
 najwygodniejsze jest w CSR, bo dodatkowo narzuca zasadę lokalności w przestrzeni. Wyłuskanie wartości jest najmniej efektywne w
 formacie AIJ. Szczegóły opisane są w rozdziale 3.5 książki
-* <span style="font-variant:small-caps">Y. Saad</span>, <cite> [http://www-users.cs.umn.edu/&nbsp;saad/books.html  Iterative methods for sparse linear systems]</cite>, PWS, 1996.
+* <span style="font-variant:small-caps">Y. Saad</span>, <cite> [http://www-users.cs.umn.edu/~saad/books.html  Iterative methods for sparse linear systems]</cite>, PWS, 1996.
-Zobacz także implementacje w Fortranie, w pakiecie [http://www-users.cs.umn.edu/&nbsp;saad/software/SPARSKIT/sparskit.html  SPARSKIT], będącym czymś w rodzaju odpowiednika BLAS dla macierzy rozrzedzonych.
+Zobacz także implementacje w Fortranie, w pakiecie [http://www-users.cs.umn.edu/~saad/software/SPARSKIT/sparskit.html  SPARSKIT], będącym czymś w rodzaju odpowiednika BLAS dla macierzy rozrzedzonych.
 </div></div></div>
@@ Linia 115: / Linia 113: @@
 <div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Rozwiązanie </span><div class="mw-collapsible-content" style="display:none"><div style="margin-left:1em">
-Zobacz, jak to zrobiono w pakiecie [http://www-users.cs.umn.edu/&nbsp;saad/software/SPARSKIT/sparskit.html  SPARSKIT].
+Zobacz, jak to zrobiono w pakiecie [http://www-users.cs.umn.edu/~saad/software/SPARSKIT/sparskit.html  SPARSKIT].
 </div></div></div>
@@ Linia 161: / Linia 159: @@
 Jak tanio rozwiązywać układ równań z macierzą cykliczną trójdiagonalną, tzn.
-<center><math>\displaystyle
+<center><math>
 A =
 \begin{pmatrix}
@@ Linia 186: / Linia 184: @@
 Gdyby pominąć ostatni wiersz i kolumnę, macierz byłaby trójdiagonalna, a  my już wiemy, co z nią zrobić... Jak więc sprytnie pozbyć się ostatniej niewiadomej i ostatniego równania? W naszej macierzy wyróżnijmy ostatni wiersz i kolumnę:
-<center><math>\displaystyle A =
+<center><math>A =
 \begin{pmatrix}
 T & v\\
 w^T & a_N
-\end{pmatrix} ,
+\end{pmatrix} </math>,</center>
-</math></center>
-gdzie <math>\displaystyle T</math> jest <math>\displaystyle N-1</math> podmacierzą główną <math>\displaystyle A</math>,
+gdzie <math>T</math> jest <math>N-1</math> podmacierzą główną <math>A</math>,
-<center><math>\displaystyle T =
+<center><math>T =
 \begin{pmatrix}
   a_1 & c_1 &  &  & \\
@@ Linia 202: / Linia 199: @@
    & & \ddots & \ddots  & c_{N-2}\\
    &   &      & b_{N-1}  & a_{N-1}
-\end{pmatrix} ,
+\end{pmatrix} </math>,</center>
-</math></center>
-natomiast <math>\displaystyle w^T = [c_N, 0, \ldots, 0, b_N]</math>,  <math>\displaystyle v = [b_1, 0, \ldots, 0,
+natomiast <math>w^T = [c_N, 0, \ldots, 0, b_N]</math>,  <math>v = [b_1, 0, \ldots, 0,
 c_{N-1}]^T</math>.
-Mając rozkład <math>\displaystyle T=LU</math>, łatwo stąd wygenerować rozkład <math>\displaystyle A</math>, gdyż
+Mając rozkład <math>T=LU</math>, łatwo stąd wygenerować rozkład <math>A</math>, gdyż
-<center><math>\displaystyle \begin{pmatrix}
+<center><math>\begin{pmatrix}
 T & v\\
 w^T & a_N
@@ Linia 220: / Linia 216: @@
 U & u\\
    & u_N
-\end{pmatrix} ,
+\end{pmatrix} </math>,</center>
-</math></center>
 gdzie spełnione są zależności
-* <math>\displaystyle T = LU</math> (rozkład LU macierzy trójdiagonalnej <math>\displaystyle T</math>)
+* <math>T = LU</math> (rozkład LU macierzy trójdiagonalnej <math>T</math>)
-* <math>\displaystyle Ul = w</math> (rozwiązanie układu równań z macierzą dwudiagonalną)
+* <math>Ul = w</math> (rozwiązanie układu równań z macierzą dwudiagonalną)
-* <math>\displaystyle Lu = v</math> (jw.)
+* <math>Lu = v</math> (jw.)
-* <math>\displaystyle l^Tu + u_N = a_N</math>.
+* <math>l^Tu + u_N = a_N</math>.
 </div></div></div>
@@ Linia 235: / Linia 230: @@
 <div class="exercise">
-Ktoś mógłby sugerować, że skoro CG działa tylko dla macierzy symetrycznych, to dowolny układ <math>\displaystyle Ax=b</math> z macierzą nieosobliwą można transformować do równoważnego mu układu [[MN12#Układ równań normalnych|równań normalnych]]
+Ktoś mógłby sugerować, że skoro CG działa tylko dla macierzy symetrycznych, to dowolny układ <math>Ax=b</math> z macierzą nieosobliwą można transformować do równoważnego mu układu [[MN12#Układ równań normalnych|równań normalnych]]
-<center><math>\displaystyle A^TAx = A^T b,
+<center><math>A^TAx = A^T b</math>,</center>
-</math></center>
-którego macierz <math>\displaystyle A^TA</math> jest już oczywiście macierzą symetryczną i dodatnio określoną.
+którego macierz <math>A^TA</math> jest już oczywiście macierzą symetryczną i dodatnio określoną.
 Wskaż potencjalne wady tej metody i podaj sposób jej implementacji.
 <div class="mw-collapsible mw-made=collapsible mw-collapsed"><span class="mw-collapsible-toogle mw-collapsible-toogle-default style="font-variant:small-caps">Wskazówka </span><div class="mw-collapsible-content" style="display:none">
-<div style="font-size:smaller; background-color:#f9fff9; padding: 1em"> Jakie jest uwarunkowanie macierzy <math>\displaystyle A^TA</math>? </div>
+<div style="font-size:smaller; background-color:#f9fff9; padding: 1em"> Jakie jest uwarunkowanie macierzy <math>A^TA</math>? </div>
 </div></div>
@@ Linia 253: / Linia 247: @@
 Nietrudno sprawdzić, że dla normy spektralnej macierzy,
-<center><math>\displaystyle  \mbox{cond} (A^TA) = ( \mbox{cond} (A))^2,
+<center><math>\mbox{cond} (A^TA) = ( \mbox{cond} (A))^2</math>,</center>
-</math></center>
-a więc w przypadku macierzy źle uwarunkowanych należy spodziewać się patologicznie dużej liczby iteracji. Chociaż dobre (symetryczne, dodatnio określone) imadło <math>\displaystyle M</math> mogłoby pomóc, np.
+a więc w przypadku macierzy źle uwarunkowanych należy spodziewać się patologicznie dużej liczby iteracji. Chociaż dobre (symetryczne, dodatnio określone) imadło <math>M</math> mogłoby pomóc, np.
-<center><math>\displaystyle MA^TMAx = MA^T Mb,
+<center><math>MA^TMAx = MA^T Mb</math>,</center>
-</math></center>
 to jednak znacznie lepiej stosować metody opracowane specjalnie dla macierzy niesymetrycznych, np. GMRES (oczywiście z nieodzownym ściskaniem macierzy, gdy jest źle uwarunkowana...).
-Implementacja metody iteracyjnej to tylko decyzja, jak realizować mnożenie przez <math>\displaystyle A^TA</math>. Niedobra metoda to
+Implementacja metody iteracyjnej to tylko decyzja, jak realizować mnożenie przez <math>A^TA</math>. Niedobra metoda to
-  <div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>B = <math>\displaystyle A^TA</math>;
+  <div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>B = <math>A^TA</math>;
 ...
 while ...
@@ Linia 271: / Linia 263: @@
 </pre></div>
-gdyż <math>\displaystyle B</math> będzie bardziej wypełniona niż A. Znacznie lepiej
+gdyż <math>B</math> będzie bardziej wypełniona niż A. Znacznie lepiej
   <div style="margin: 1em; padding:1em; color: #006; background-color:#fcfcfc;"><pre>...
 while ...
@@ Linia 279: / Linia 271: @@
 </pre></div>
-co realizuje się kosztem równym dwukrotnemu mnożeniu przez macierz <math>\displaystyle A</math> (w formacie AIJ) i nie wymaga dodatkowej pamięci.
+co realizuje się kosztem równym dwukrotnemu mnożeniu przez macierz <math>A</math> (w formacie AIJ) i nie wymaga dodatkowej pamięci.
 </div></div></div>

MN08LAB: Różnice pomiędzy wersjami

Aktualna wersja na dzień 21:49, 11 wrz 2023

Układy liniowe z macierzami rzadkimi

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia