Wersja z 20:38, 29 wrz 2006

Wektory i wartości własne

<<< Powrót do strony głównej przedmiotu Metody numeryczne

Niech będzie dana rzeczywista kwadratowa macierz $A$ wymiaru $N$ . Wektorem własnym $x \in C^{N}$ oraz odpowiadającą mu wartością własną $λ \in C$ nazwiemy taką parę, dla której

A x = λ x,

przy czym $x \neq 0$ .

Zadanie wyznaczania wartości własnych i wektorów własnych macierzy ma bardzo szerokie zastosowania w tak odległych od siebie dziedzinach, jak np. analiza odporności konstrukcji mechanicznych (wieżowce, mosty, wagony kolejowe) na wibracje, czy też rankingowanie stron internetowych w wyszukiwarce Google.

Przykład: Odporność budynku na trzęsienie ziemi

Rozważmy prosty układ mechaniczny opisujący, naturalnie w pewnym jedynie przybliżeniu, zachowanie się układu $N$ ciężkich płyt połączonych ze sobą relatywnie elatycznymi dźwigarami --- co może np. modelować konstrukcję wieżowca.

Wiadomo, że jeśli częstotliwości drgań własnych tego wieżowca będą bliskie częstotliwości siły wymuszającej (o niewielkiej amplitudzie), konstrukcja wpadnie w rezonans i w końcu rozpadnie się wskutek zbyt wielkich przemieszczeń. Wychylenia naszych płyt z położenia równowagi są opisywane układem pewnych równań różniczkowych. Teoria matematyczna takich równań różniczkowych pokazuje, że częstotliwości drgań własnych to nic innego jak wartości własne pewnej symetrycznej macierzy wymiaru $2 N$ , która powstaje ze współczynników równania różniczkowego opisującego dynamikę tego układu.

Przykład: Macierz Google'a

Podstawowy algorytm rankingowania stron WWW w wyszukiwarce Google sprowadza się do znalezienia rzeczywistego wektora własnego $π$ pewnej silnie rozrzedzonej macierzy $A$ (gigantycznego rozmiaru, równego liczbie indeksowanych stron, czyli w chwili pisania tego tekstu około $2.5 \cdot 1 0^{10}$ stron), odpowiadającego wartości własnej równej 1:

A π = π .

Współrzędne wektora $π$ interpretuje się jako wartość rankingową kolejnych stron WWW. Aby wszystko miało sens, współrzędne wektora muszą być z przedziału [0,1]. Pewne twierdzenia matematyczne i subtelny dobór macierzy $A$ gwarantują, że taki wektor $π$ zawsze istnieje i jest jedyny! Co więcej, wartość 1 jest dominującą wartością własną $A$ , a to z kolei ma ważne znaczenie dla tzw. metody potęgowej numerycznego wyznaczania takiego wektora.

Przykład: Wyznaczanie miejsc zerowych wielomianu

Jak wiadomo, wartości własne to miejsca zerowe wielomianu charakterystycznego macierzy $P (λ) = \det (A - λ I)$ . Zachodzi także fakt odwrotny, to znaczy miejsca zerowe wielomianu są wartościami pewnej macierzy, np. miejsca zerowe wielomianu

p (λ) = p_{1} λ^{N} + \dots + p_{N} λ + p_{N + 1}

są wartościami własnymi m.in. macierzy stowarzyszonej,

A = (\begin{matrix} - p_{2} / p_{1} & - p_{3} / p_{1} & \dots & - p_{N + 1} / p_{1} \\ 1 \\ 1 \\ ⋱ \\ 1 \end{matrix})

Funkcja Octave'a compan(p) wyznacza macierz stowarzyszoną dla zadanego wielomianu o współczynnikach w wektorze $p = [p_{1}, \dots, p_{N}, p_{N + 1}]^{T}$ . Z tej macierzy korzysta następnie funkcja Octave'a roots, która właśnie w taki sposób wyznacza pierwiastki wielomianów: jako wartości własne macierzy stowarzyszonej.

W praktyce obliczeniowej spotyka się zazwyczaj kilka typów zagadnień:

Wyznaczenie dominującej wartości własnej (to znaczy: największej co do modułu) i odpowiadającego jej wektora własnego (a może kilku wektorów, gdy wartość własna jest wielokrotna?)
Wyznaczenie najmniejszej co do modułu wartości własnej i wektorów jej odpowiadających (zauważmy, że to jest np. zadanie wyznaczenia jądra macierzy osobliwej --- wtedy wiemy a priori, że szukana najmniejsza co do modułu wartość własna to zero)
Wyznaczenie wartości własnej najbliższej zadanej liczbie (to jest właśnie odpowiedź na pytanie jak blisko częstości wymuszającej są częstości drgań własnych budynku)
Wyznaczenie wszystkich wartości własnych (na przykład, w celu znalezienia wszystkich pierwiastków zadanego wielomianu)
Wyznaczenie wszystkich wartości i wektorów własnych (tzw. pełne zagadnienie własne)

Jak domyślamy się, dla macierzy rozrzedzonych dużego wymiaru pełne zagadnienie własne jest zbyt kosztowne, gdyż najczęściej macierz wektorów własnych --- nawet dla macierzy rzadkiej --- jest gęsta.

Ponieważ w zastosowaniach bardzo często pojawiają się macierze rzeczywiste symetryczne (powyższe przykłady pokazują, że nie tylko!) szczegółową analizę metod numerycznych ograniczymy do tego przypadku, gdyż wtedy zachodzi

Twierdzenie O symetrycznym zadaniu włanym

Każda macierz rzeczywista symetryczna $A$ wymiaru $N$ ma rozkład

A = Q Λ Q^{T},

gdzie $Q \in R^{N \times N}$ jest ortogonalna (tzn. $Q^{T} Q = I$ ), a jej kolumnami są wektory własne $A$ , natomiast $Λ \in R^{N}$ jest diagonalna z wartościami własnymi $A$ na diagonali:

Λ = (\begin{matrix} λ_{1} \\ ⋱ \\ λ_{N} \end{matrix}) .

Lokalizacja wartości własnych

Jak okaże się za chwilę, czasem warto mieć ogólne rozeznanie o tym, gdzie z grubsza leżą wartości własne danej macierzy $A$ . Przy tym mogą być nam pomocne dwa fakty:

Fakt

Dowolna wartość własna $λ \in C$ macierzy $A$ spełnia

| λ | \leq | | A | |,

gdzie $| | A | |$ jest dowolną normą macierzową indukowaną przez normę wektorową.

Dowód

Rzeczywiście, skoro istnieje wektor $x \neq 0$ taki, że $A x = λ x$ , to stąd $| | A x | | / | | x | | = | λ |$ , więc fakt powyższy wynika już z definicji normy macierzy:

| | A | | = \max_{y \neq 0} \frac{| | A y | |}{| | y | |} \geq | | A x | | / | | x | | .

Drugie twierdzenie jest równie proste w dowodzie, ale daje trochę więcej informacji o lokalizacji widma.

Twierdzenie Gerszgorina, o lokalizacji widma macierzy

Wartości własne macierzy $A$ leżą w sumie (teoriomnogościowej) dysków $K_{i}$ na płaszczyźnie zespolonej,

K_{i} = {z \in C : | z - a_{i i} | \leq \sum_{j \neq i} | a_{i j} |}, i = 1, \dots N .

Przykład: Koła Gerszgorina

Niech

A = (\begin{matrix} 1.08930 & 1.38209 & - 1.00037 & 0.69355 & 2.32178 \\ 0.14211 & 1.74696 & 1.68440 & 0.30664 & 1.26718 \\ - 0.74620 & 2.02686 & - 0.68293 & 0.19684 & 0.35854 \\ 0.83517 & 0.74987 & 1.71331 & 1.09765 & - 0.44321 \\ 1.02132 & - 2.62155 & 0.79247 & 1.11408 & 0.48076 \end{matrix})

Lokalizacja wartości własnych macierzy $A$ kołami Gerszgorina oraz zgrubna lokalizacja wewnątrz okręgu o promieniu równym $| | A | |_{1}$ . Dokładne wartości własne zaznaczone trójkącikami.

Wyznaczanie pojedynczej pary własnej

Jak wiemy z algebry, nawet gdy $A$ jest macierzą rzeczywistą, jej widmo może być zespolone! Analizując poniższe metody, będziemy zakładać, że poszukiwane wartości i wektory własne $A$ są rzeczywiste. Iterując na liczbach rzeczywistych nie mamy wszak szansy, by dotrzeć do liczb zespolonych!...

Metoda potęgowa

Przypuśćmy, że wartości własne macierzy $A \in R^{N \times N}$ spełniają

| λ_{1} | > | λ_{2} | \geq \dots \geq | λ_{N} |,

(to znaczy, istnieje dokładnie jedna dominująca wartość własna macierzy $A$ .

Załóżmy także, że istnieje baza złożona z wektorów własnych $q_{1}, \dots, q_{N}$ tej macierzy (tak jest np. dla macierzy symetrycznej na mocy twierdzenia o własnościach symetrycznego zadania własnego).

Kierunek własny $q_{k}$ jakiejś macierzy $A$ ma taką własność, że poddany działaniu przekształcenia $A$ wydłuża się $λ_{k}$ razy, wobec tego dowolny wektor $x \in R^{N}$ poddany działaniu $A$ najbardziej wydłuży się w kierunku $q_{1}$ . Iterując tę procedurę, powinniśmy dostawać w wyniku wektory, w których coraz bardziej dominuje kierunek $q_{1}$ . Formalnie, niech

x = α_{1} q_{1} + \dots + α_{N} q_{N},

wtedy

A x = A (\sum_{i} α_{i} q_{i}) = \sum_{i} α_{i} A q_{i} = \sum_{i} α_{i} λ_{i} q_{i}

i w konsekwencji

A^{k} x = \sum_{i} α_{i} λ_{i}^{k} q_{i} = λ_{1}^{k} (α_{1} q_{1} + α_{2} {(\frac{λ_{2}}{λ_{1}})}^{k} q_{2} + \dots + α_{N} {(\frac{λ_{N}}{λ_{1}})}^{k} q_{N}) .

Założenia, że istnieje dokładnie jedna dominująca wartość własna, $| \frac{λ_{N}}{λ_{1}} | < 1$ , wynika, że wyrażenie w nawiasie dąży do $α_{1} q_{1}$ i w konsekwencji wektory $x_{k} = A^{k} x$ dążą, gdy $k \to \infty$ , do kierunku wektora własnego $q_{1}$ , to znaczy wektora odpowiadającego dominującej wartości własnej $A$ (o ile tylko $α_{1} \neq 0$ ).

Szybkość zbieżności metody potęgowej jest liniowa, o współczynniku zależnym od stosunku $| λ_{2} / λ_{1} |$ . W patologicznym przypadku, gdy $| λ_{1} | \approx | λ_{2} |$ , może więc okazać się, że metoda praktycznie nie jest zbieżna.

Zbieżność metody potęgowej w zależności od stosunku $| λ_{2} / λ_{1} |$ . Na osi pionowej zaznaczono błąd przybliżenia dominującego wektora własnego.

W praktyce nie wyznaczamy wzorem $x_{k} = (A^{k}) \cdot x$ , lecz korzystamy z metody iteracyjnej

Algorytm Metoda potęgowa

<math>\displaystyle x_0</math> = dowolny wektor startowy; k = 0;
while( !stop )
{
	<math>\displaystyle y_k</math> = <math>\displaystyle Ax_{k-1}</math>;
	<math>\displaystyle x_k</math> = <math>\displaystyle y_k/||y_k||_\infty</math>;
	k++;	
}

Warunek normowania ma m.in. na celu zapobieżenie powstawania nadmiaru i niedomiaru (gdy $| λ_{1} | < 1$ , to $| | A^{k} x | | \to 0$ , a gdy $| λ_{1} | > 1$ , to $| | A^{k} x | | \to \infty$ ). Przy okazji, zauważ, że $| | y_{k} | |_{\infty} \to | λ_{1} |$ , a więc mamy także sposób na wyznaczenie przybliżenia dominującej wartości własnej.

Zazwyczaj jako warunek stopu wybiera się kryterium małej poprawki, $| | x_{k} - x_{k - 1} | | \leq ϵ$ lub warunek małego residuum, $| | A x_{k} - λ_{1, k} x_{k} | | \leq ϵ$ , gdzie $λ_{1, k}$ jest przybliżeniem $λ_{1}$ dostępnym na $k$ -tej iteracji.

Gdy $x_{0}$ nie ma składowej w kierunku dominującego wektora własnego, w teorii nie powinniśmy obserwować zbieżności. Jednak w praktyce, **dzięki błędom zaokrągleń**, w ciągu iteracji taka składowa się pojawia i doprowadza do zbieżności. Na rysunku przedstawiono zbieżność metody potęgowej w zależności od stosunku $| λ_{2} / λ_{1} |$ . Na osi pionowej zaznaczono błąd przybliżenia dominującego wektora własnego. Oczywiście, gdy $λ_{2} = λ_{1}$ na zbieżność praktycznie nie ma szans.

Metoda potęgowa doskonale sprawdza się, gdy macierz $A$ jest macierzą rozrzedzoną --- np. w przypadku macierzy Google'a.

Odwrotna metoda potęgowa

Zauważmy, że dla dowolnej macierzy kwadratowej $A$ o wartościach własnych $λ_{k}$ i odpowiadających im wektorach własnych $q_{k}$ , mamy:

Macierz $A - σ I$ ma wartości własne $λ_{k} - σ$ oraz wektory własne $q_{k}$ ,
Jeśli dodatkowo $A$ jest nieosobliwa, to macierz $A^{- 1}$ ma wartości własne $1 / λ_{k}$ oraz wektory własne $q_{k}$

Z połączenia tych dwóch własności wynika, że

Stwierdzenie O transformacji widma macierzy

Macierz $(A - σ I)^{- 1}$ (o ile istnieje), to ma wartości własne równe $\frac{1}{λ_{k} - σ}$ i wektory własne identyczne z $A$ .

Skoro tak, to jeśli najbliższą $σ$ wartością własną $A$ jest $λ_{j}$ , wówczas metoda potęgowa zastosowana do macierzy $(A - σ I)^{- 1}$ zbiegnie do $q_{j}$ . To prowadzi do następującego algorytmu, odwrotnej metody potęgowej:

Algorytm Odwrotna metoda potęgowa

<math>\displaystyle x_0</math> = dowolny wektor startowy; k = 0;
while( !stop )
{
	Rozwiąż układ równań <math>\displaystyle (A-\sigma I)y_k = x_{k-1}</math>;
	<math>\displaystyle x_k</math> = <math>\displaystyle y_k/||y_k||_\infty</math>;
	k++;	
}

Metoda Rayleigh (RQI)

Z własności metody potęgowej wynika, że metoda odwrotna potęgowa jest zbieżna tym szybciej, im bliżej $λ_{j}$ jest przesunięcie $σ$ (w stosunku do pozostałych wartości własnych). Dlatego dobrze byłoby --- dla zwiększenia szybkości zbieżności iteracji --- poprawiać wartość przesunięcia $σ$ , korzystając z dotychczas wyznaczonego wektora $x_{k} \approx q_{j}$ i ilorazu Rayleigh:

λ_{j} = \frac{q_{j}^{T} A q_{j}}{q_{j}^{T} q_{j}} \approx \frac{x_{k}^{T} A x_{k}}{x_{k}^{T} x_{k}}

Stąd nazwa metody, w skrócie RQI (Rayleigh Quotient Iteration).

Algorytm Metoda RQI

<math>\displaystyle x_0</math> = dowolny wektor startowy; <math>\displaystyle \sigma_0</math> = przybliżenie <math>\displaystyle \lambda_j</math>; k = 0;
while( !stop )
{
	Rozwiąż układ równań <math>\displaystyle (A-\sigma_k I)y_k = x_{k-1}</math>;
	<math>\displaystyle x_k</math> = <math>\displaystyle y_k/||y_k||_2</math>;
	<math>\displaystyle \sigma_{k+1}</math> = <math>\displaystyle x_k^TAx_k</math>;
	k++;	
}

(wybierając normowanie wektora $x$ w normie euklidesowej upraszczamy co nieco algorytm).

Wielką zaletą metody RQI jest jej szybkość zbieżności: kwadratowa gdy wartość własna jest pojedyncza, a nawet sześcienna w przypadku macierzy symetrycznej.

Wadą metody RQI jest to, że na każdym jej kroku należy rozwiązywać układ równań z inną macierzą.

Uwaga: Gdy złe uwarunkowanie i skończona precyzja arytmetyki pomagają...

Przez pewien czas numerycy odnosili się do tej metody z rezerwą, twierdząc, i słusznie, że im lepszym przybliżeniem $q_{j}$ będzie $σ_{k}$ , tym bardziej rośnie uwarunkowanie $A - σ_{k} I$ , a tym samym błąd numerycznego rozwiązywania układu z tą macierzą będzie coraz większy i metoda będzie tracić stabilność. Tymczasem okazuje się, że --- choć rzeczywiście rozwiązanie układu jest obarczone wielkim błędem --- to

wektor błędu ma kierunek praktycznie zgodny z kierunkiem poszukiwanego wektora $q_{j}$ , a tym samym złe uwarunkowanie macierzy i skończona precyzja arytmetyki pomagają w zbieżności metody!

Metody rozwiązywania pełnego zadania własnego

Najszybszą obecnie znaną metodą rozwiązywania pełnego zadania własnego (to znaczy znajdowania wszystkich wartości i wektorów własnych) macierzy symetrycznej jest metoda dziel i rządź.

Dla macierzy niesymetrycznych najbardziej dopracowanym i przetestowanym, a więc godnym zaufania algorytmem, jest metoda QR z przesunięciami (wykorzystująca, jak łatwo się domyślić, rozkład QR macierzy). Metoda QR przewyższa także metodę "dziel i rządź" w przypadku symetrycznym, gdy wymiar macierzy jest mały (mniej więcej $N \leq 25$ ).

Obie metody są oczywiście metodami iteracyjnymi, jednak przyjęło się nazywać je metodami bezpośrednimi, gdyż praktycznie zawsze potrzebują z góry ograniczonej liczby iteracji do tego, by zbiec do wyniku o (niemal) maksymalnej rozsądnej dokładności.

Dla efektywności obu metod kluczowy jest preprocessing macierzy, pozwalający niezbyt wygórowanym kosztem $O (N^{3})$ operacji sprowadzić przez ortogonalne podobieństwo zadanie z macierzą gęstą $A$ (w przypadku niesymetrycznym) do zadania z macierzą Hessenberga, czyli macierzą, której element $(i, j)$ jest zerowy gdy tylko $i - j > 1$ :

(\begin{matrix} * & * & * & * & \dots & * \\ * & * & * & * & \dots & * \\ * & * & * & \dots & * \\ ⋱ & ⋱ & \dots & ⋮ \\ ⋱ & ⋱ & * \\ * & * \end{matrix})

bądź wręcz trójdiagonalną, gdy $A$ była symetryczna.

Każdą macierz kwadratową $A$ da się sprowadzić do postaci Hessenberga sekwencją przekształceń postaci

A : = Q_{k} A Q_{k}^{T},

gdzie

Q_{k}

jest pewnym przekształceniem Householdera. Rzeczywiście, niech

A = (\begin{matrix} d_{1} & * & * & * & \dots & * \\ a_{1} & * & * & * & \dots & * \\ a_{2} & * & * & * & \dots & * \\ ⋮ & * & ⋱ & ⋱ & \dots & ⋮ \\ ⋮ & * & * & ⋱ & ⋱ & * \\ a_{N - 1} & * & * & * & * & * \end{matrix})

i oznaczmy $a = [a_{1}, \dots, a_{N - 1}]^{T}$ . Możemy wziąć na początek przekształcenie Householdera ${\tilde{Q}}_{1}$ takie, że ${\tilde{Q}}_{1} a = c \cdot e_{1}$ , gdzie $e_{1} = [1, 0, \dots, 0]^{T}$ . Wtedy

(\begin{matrix} 1 \\ {\tilde{Q}}_{1} \end{matrix}) \cdot A = (\begin{matrix} d_{1} & * & * & * & \dots & * \\ c & * & * & * & \dots & * \\ * & * & * & \dots & * \\ * & ⋱ & ⋱ & \dots & ⋮ \\ * & * & ⋱ & ⋱ & * \\ * & * & * & * & * \end{matrix})

To samo przekształcenie przyłożone z prawej strony zachowa pierwszą kolumnę i w efekcie nie zmieni struktury macierzy:

(\begin{matrix} 1 \\ {\tilde{Q}}_{1} \end{matrix}) \cdot A \cdot (\begin{matrix} 1 \\ {\tilde{Q}}_{1} \end{matrix}) = (\begin{matrix} d_{1} & * & * & * & \dots & * \\ c & * & * & * & \dots & * \\ * & * & * & \dots & * \\ * & ⋱ & ⋱ & \dots & ⋮ \\ * & * & ⋱ & ⋱ & * \\ * & * & * & * & * \end{matrix}) .

Dalej stosujemy tę samą metodę do podmacierzy wymiaru $N - 1$ , itd. aż dochodzimy do macierzy Hessenberga.

Gdy wyjściowa macierz $A$ jest symetryczna, to z definicji, macierz wynikowa $(\begin{matrix} I \\ {\tilde{Q}}_{N - 2} \end{matrix}) \dots (\begin{matrix} 1 \\ {\tilde{Q}}_{1} \end{matrix}) A (\begin{matrix} 1 \\ {\tilde{Q}}_{1} \end{matrix}) \dots (\begin{matrix} I \\ {\tilde{Q}}_{N - 2} \end{matrix})$ też jest symetryczna i jednocześnie Hessenberga --- a więc musi być trójdiagonalna! Ponadto, macierz wynikowa będzie miała te same wartości własne co $A$ ; wektory własne macierzy $A$ także można łatwo (jak?) odzyskać z wektorów własnych macierzy wynikowej.

Metoda "dziel i rządź" dla macierzy symetrycznej

Jest to obecnie najefektywniejsza metoda rozwiązywania zagadnienia własnego macierzy symetrycznej wymiaru powyżej kilkudziesięciu. Omówimy w zarysie jej najprostszy wariant (obarczony pewnymi wadami, usuniętymi w wersji bibliotecznej --- DSYEVD w LAPACKu).

Startując z symetrycznej macierzy $A$ już w postaci trójdiagonalnej, łatwo widzieć, że "prawie" rozpada się ona na dwie mniejsze macierze trójdiagonalne: dokładniej,

(\begin{matrix} a_{1} & b_{1} \\ b_{1} & a_{2} & ⋱ \\ ⋱ & ⋱ & b_{N - 1} \\ b_{N - 1} & a_{N} \end{matrix}) = (\begin{matrix} T_{1} \\ T_{2} \end{matrix}) + b_{m} u u^{T},

gdzie $T_{1} = (\begin{matrix} a_{1} & b_{1} \\ b_{1} & a_{2} & ⋱ \\ ⋱ & ⋱ & b_{m - 1} \\ b_{m - 1} & a_{m} - b_{m} \end{matrix})$ , $T_{2} = (\begin{matrix} a_{m + 1} - b_{m} & b_{m + 1} \\ b_{m + 1} & a_{m + 2} & ⋱ \\ ⋱ & ⋱ & b_{N - 1} \\ b_{N - 1} & a_{N} \end{matrix})$ są --- tak jak $A$ --- macierzami trójdiagonalnymi i symetrycznymi (jako podmacierze $A$ ), tylko o połowę mniejszego wymiaru, gdy $m \approx N / 2$ . Natomiast $u = e_{m} + e_{m + 1}$ , więc macierz $b_{m} u u^{T}$ ma tylko cztery niezerowe elementy, każdy równy $b_{m}$ .

Zgodnie ze swoją nazwą, metoda "dziel i rządź" sprowadza zadanie znajdowania par własnych macierzy wymiaru $N$ do dwóch takich zadań dla macierzy dwa razy mniejszych. Te z kolei można potraktować w taki sam sposób i iteracyjnie zmniejszyć wymiar macierzy do tak małego (około 25), by opłacało się zastosować metodę QR (teoretycznie, można byłoby oczywiście doprowadzić podział do momentu, gdy macierze trójdiagonalne są rozmiaru $1 \times 1$ --- dla których rozwiązanie zadania włanego jest trywialne --- ale taki algorytm byłby bardziej kosztowny od wariantu z udziałem QR).

Rzeczywiście, przypuśćmy, że dla obu macierzy trójdiagonalnych $T_{1}, T_{2}$ umiemy rozwiązać zadanie własne tak, że znamy macierze: $Q_{i}$ --- ortogonalną oraz $D_{i}$ --- diagonalną, takie, że

Q_{i}^{T} T_{i} Q_{i} = D_{i} i = 1, 2 .

Wtedy łatwo widzieć, że dla łatwo wyznaczalnego wektora $v$ ,

(\begin{matrix} Q_{1}^{T} \\ Q_{2}^{T} \end{matrix}) ((\begin{matrix} T_{1} \\ T_{2} \end{matrix}) + b_{m} u u^{T}) (\begin{matrix} Q_{1} \\ Q_{2} \end{matrix}) = (\begin{matrix} D_{1} \\ D_{2} \end{matrix}) + b_{m} v v^{T} .

W ten sposób zadanie własne dla oryginalnej macierzy $T$ wymiaru $N$ jest równoważne zadaniu własnemu macierzy diagonalnej zaburzonej o macierz rzędu 1.

Na szczęście łatwo pokazać, że jeśli $λ$ nie jest wartością własną macierzy diagonalnej $D = (\begin{matrix} D_{1} \\ D_{2} \end{matrix})$ , to wartości własne $λ$ macierzy $D + b_{m} v v^{T}$

spełniają równanie

f (λ) \equiv 1 + b_{m} \sum_{j = 1}^{N} \frac{v_{j}^{2}}{d_{j} - λ} = 0,

gdzie $d_{j}$ są elementami na diagonali macierzy $D$ .

Wykres $f (λ)$ dla macierzy jednowymiarowego laplasjanu rozmiaru 10. Zwróć uwagę na asymptoty pionowe tej funkcji oraz jej przedziałową monotoniczność.

W typowym przypadku $f$ będzie miała dokładnie $N$ pojedynczych miejsc zerowych i wykres zachęcający do stosowania do niej metody Newtona. Okazuje się, że ogólny przypadek nie jest istotnie trudniejszy, choć wymaga ważnych modyfikacji, zarówno w celu szybszego rozwiązywania powyższego równania nieliniowego, jak i w celu zapewnienia lepszej stabilności algorytmu.

Ostateczny koszt wyznaczenia wszystkich wektorów i wartości własnych jest rzędu $O (N^{3})$ z małą stałą.

Metoda QR

Dla zadania własnego z macierzą niesymetryczną najczęściej stosuje się metodę QR.

Jakkolwiek ostateczna wersja metody QR działa dla macierzy niesymetrycznych, wygodnie będzie nam założyć dla przejrzystości ekspozycji, że macierz jest symetryczna i w konsekwencji ma rzeczywiste widmo.

W najprostszym wariancie (bez przesunięć), algorytm QR ma postać:

Algorytm Metoda QR

<math>\displaystyle A_1 = A</math>;
for k = 1, 2, ...
{
	wykonaj rozkład <math>\displaystyle A_k = Q_{k}R_{k}</math>;
	<math>\displaystyle A_{k+1} = R_{k}\cdot Q_{k}</math>;
}

Można sprawdzić, że $A, A_{1}, A_{2}, \dots$ mają te same wartości własne, bo $A_{k + 1} = Q_{k + 1}^{T} A_{k} Q_{k + 1}$ . Co więcej, powyższy algorytm (gdy $A$ jest nieosobliwa) w zasadzie jest równoważny hipotetycznemu algorytmowi iteracji prostej zastosowanemu nie do pojedynczego wektora, ale do $N$ wektorów naraz:

Algorytm Iteracja prosta na przestrzeni

<math>\displaystyle V_1 = I</math>;
for k = 1, 2, ...
{
	<math>\displaystyle W_{k+1} = A\cdot V_k</math>;
	wyznacz rozkład QR <math>\displaystyle W_{k+1} = V_{k+1} R_{k+1}</math>, gdzie <math>\displaystyle V_{k+1}</math> jest ortogonalna;
}

Drugi krok w istocie ortogonalizuje kolumny $W_{k + 1}$ . Gdyby nie ortogonalizować zestawu wektorów $W_{k + 1}$ , oczywiście dostalibyśmy w efekcie zbieżność wszystkich kolumn macierzy do tego samego wektora --- odpowiadającego dominującej wartości własnej $A$ . Zapewniając sobie ortogonalność $V_{k + 1}$ , możemy liczyć na to, że kolejne kolumny macierzy $V_{k}$ będą dążyć do wektorów własnych odpowiadających kolejnym wartościom własnym $A$ (przy stosownych założeniach o $A$ , m.in. że wszystkie wartości własne $A$ spełniają $| λ_{i} | \neq | λ_{j} |$ dla $i \neq j$ ). Jeśli założyć dla uproszczenia, że oba używane rozkłady QR mają jednoznacznie określone czynniki rozkładu (na przykład, wymuszając, by diagonalne elementy macierzy $R$ były dodatnie) mamy zależności $V_{k + 1} = Q_{1} \dots Q_{k}$ oraz $A_{k + 1} = V_{k + 1}^{T} A V_{k + 1}$ .

Tak więc, w sprzyjających warunkach, metoda QR, jako równoważna iteracji prostej na podprzestrzeni, będzie zbieżna: $A_{k} \to A_{\infty}$ , gdzie $A_{\infty}$ jest macierzą trójkątną (bo wektory własne odpowiadające różnym wartościom własnym są ortogonalne. Tym samym, wartościami własnymi $A_{\infty}$ (a więc także $A$ ) będą liczby na diagonali $A_{\infty}$ .

Twierdzenie O zbieżności metody QR

Niech wartości własne $A \in R^{N \times N}$ spełniają $| λ_{1} |, \dots, | λ_{N} | > 0$ oraz macierz $T = [x_{1}, \dots, x_{N}]$ o kolumnach $x_{i}$ złożonych z kolejnych wektorów własnych $A$ ma taką własność, że $T^{- 1}$ ma rozkład LU, $T^{- 1} = L U$ .

Wtedy w metodzie QR ciąg macierzy $Q_{k}$ jest zbieżny do macierzy diagonalnej, a ciąg $A_{k}$ ma podciąg zbieżny do macierzy trójkątnej, której elementy diagonalne $u_{i i}$ są równe $λ_{i}$ dla $i = 1, \dots, N$ .

Powyższa wersja algorytmu QR jest mało praktyczna, m.in. jest zbieżna wolno i przy poważnych ograniczaniach na $A$ . Sprytna modyfikacja algorytmu wyjściowego daje w wyniku tzw. metodę QR z przesunięciami, która jest praktycznie niezawodna dla dowolnej macierzy.

Algorytm Metoda QR z przesunięciami

<math>\displaystyle A_1 = A</math>;
for k = 1, 2, ...
{
	wybierz sprytnie przesunięcie <math>\displaystyle \sigma_k</math>; 
	wykonaj rozkład <math>\displaystyle A_k - \sigma_kI = Q_{k}R_{k}</math>;
	<math>\displaystyle A_{k+1} = R_{k}\cdot Q_{k} + \sigma_kI</math>;
}

Koszt wyznaczenia wszystkich wektorów i wartości własnych jest rzędu $O (N^{3})$ ze stałą równą około 30. Omówienie sposobów wyboru "sprytnego przesunięcia" wykracza niestety poza ramy wykładu.

Metoda Jacobiego dla macierzy symetrycznej

Na zakończenie wspomnijmy o (bardzo starej) metodzie Jacobiego, która działa na oryginalnej macierzy symetrycznej (bez konieczności uprzedniego sprowadzenia do postaci trójdiagonalnej).

Nie będziemy szczegółowo jej tu omawiać z braku miejsca, wymienimy tylko jej dwie najważniejsze cechy odróżniające ją od metod omawianych wcześniej:

jest znacznie wolniejsza
(niekiedy) wyznacza dokładniejsze wartości i wektory własne niż inne metody

Dodatkową zaletą metody Jacobiego jest to, że łatwo ją zrównoleglić (w czym jest podobna do metody dziel i rządź).

Pomysł metody Jacobiego jest stosunkowo prosty: należy sekwencją przekształceń ortogonalnych $J_{0}, J_{1}, \dots$ sprowadzić wyjściową macierz symetryczną $A$ do postaci (prawie) diagonalnej:

J_{k}^{T} J_{k - 1}^{T} \dots J_{0}^{T} A J_{0} \dots J_{k - 1} J_{k} \approx (\begin{matrix} λ_{1} \\ λ_{2} \\ ⋱ \\ λ_{N} \end{matrix}) .

Tak więc iteracja Jacobiego ma postać:

Algorytm

\EATWSfor k = 0, 1, ...
	wybierz <math>\displaystyle J_k</math>;
	<math>\displaystyle A</math> = <math>\displaystyle J_k^T A J_k</math>;

Macierze $J_{k}$ wybieramy jako tzw. obroty Jacobiego, tzn. obroty Givensa dobrane tak, by w danym kroku iteracji wyzerować kolejną parę pozadiagonalnych elementów macierzy. W klasycznej wersji, zerowaniu podlega pozadiagonalna para o największym module --- w ten sposób najbardziej zredukujemy miarę niediagonalności macierzy wyrażoną jako suma kwadratów elementów pozadiagonalnych:

ω = \sum_{j < i} a_{i j}^{2} .

Twierdzenie O zbieżności metody Jacobiego

Klasyczna metoda Jacobiego jest zbieżna co najmniej liniowo, tzn.

ω_{k + 1} \leq \sqrt{1 - \frac{2}{N (N - 1)}} ω_{k},

gdzie $ω_{k}$ oznacza miarę niediagonalności na $k$ -tym kroku iteracji.

Można pokazać, że asymptotycznie (tzn. dostatecznie blisko granicy) zbieżność metody Jacobiego jest nawet kwadratowa.

Uwarunkowanie

Twierdzenie Bauera--Fike'a, o uwarunkowaniu wartości własnych

Niech $A \in R^{N \times N}$ będzie diagonalizowalna, to znaczy dla pewnej macierzy $X$ zachodzi

X^{- 1} A X = (\begin{matrix} λ_{1} \\ ⋱ \\ λ_{N} \end{matrix}),

a więc (gdyż macierz po prawej stronie jest podobna do $A$ ) $λ_{i} \in C$ , $i = 1, \dots, N$ są wartościami własnymi $A$ . Rozważmy macierz zaburzoną $\tilde{A}$ i jakąś jej wartość własną $\tilde{λ}$ . Wtedy istnieje wartość własna $λ_{j}$ macierzy $A$ taka, że

| λ_{j} - \tilde{λ} | \leq {cond}_{2} (X) | | A - \tilde{A} | |_{2} .

Ponieważ dla rzeczywistej macierzy symetrycznej macierz przejścia $X$ jest ortogonalna, $X^{- 1} = X^{T}$ , to mamy ${cond}_{2} (X) = 1$ i w konsekwencji zachodzi

Wniosek Wartości własne macierzy symetrycznej są doskonale uwarunkowane

Przy oznaczeniach jak \link{thm:Bauer-Fike}{twierdzeniu Bauera-Fike'a}, jeśli dodatkowo założymy, że macierz $A$ jest rzeczywista i symetryczna, to

\min_{j = 1, \dots, N} | λ_{j} - \tilde{λ} | \leq | | A - \tilde{A} | |_{2} .

Z drugiej strony, dla macierzy niediagonalizowalnych, uwarunkowanie wartości własnych może być dowolnie duże, co ilustruje poniższy

Przykład

A_{ϵ} = (\begin{matrix} a & 1 \\ ϵ & a \end{matrix})

Weźmy dla uproszczenia $a = 0$ . Wartości własne $A_{ϵ}$ to zera wielomianu $p_{ϵ} (λ) = λ^{2} - ϵ$ , zatem $λ_{ϵ} = \pm \sqrt{ϵ}$ i w konsekwencji

| λ_{ϵ} - λ_{0} | / | | A_{ϵ} - A_{0} | | = \sqrt{ϵ} / ϵ \to \infty,

gdy $ϵ \to 0^{+}$ , a więc uwarunkowanie takiego zadania jest nieskończone: dowolnie mała zmiana macierzy powoduje zaburzenie wartości własnych niewspółmiernie wielkie wobec zaburzenia danych. Dodatkowo, wartości własne i wektory własne macierzy $A$ dla ujemnego parametru $ϵ$ są zespolone!

Zachowanie się wartości własnych macierzy $A$ (z parametrem $a = 1$ ) w otoczeniu $δ = 0$

Bardziej spektakularny przykład pochodzi od Wilkinsona:

Przykład: Perfidny wielomian Wilkinsona

Niech

p (λ) = (λ - 1) (λ - 2) \dots (λ - 20) .

Zmiana współczynnika przy $λ^{19}$ o $1 0^{- 7}$ skutkuje przesunięciem niektórych miejsc zerowych nawet o kilka jednostek na płaszczyźnie zespolonej! Poniżej pokazujemy to na numerycznym przykładzie, gdzie prócz wyżej wymienionego zaburzenia mamy dodatkowo do czynienia z zaburzeniami powstałymi wskutek wyznaczenia współczynników wielomianu w arytmetyce zmiennoprzecinkowej.

Zera oryginalnego i lekko zaburzonego perfidnego wielomianu Wilkinsona.

Jak widzimy, zera bardzo mało zaburzonego wielomianu mogą stać się wyraźnie nie-rzeczywiste!

Jeśli chodzi o wektory własne, ich wrażliwość na zaburzenia macierzy jest bardziej skomplikowana.

Biblioteki

LAPACK zawiera w sobie kolekcję doskonałych narzędzi do rozwiązywania różnych wariantów zadania własnego, m.in. DGEEV dla macierzy niesymetrycznych oraz DSYEV dla macierzy symetrycznych rozwiązują pełne zagadnienie własne, wyznaczając wszystkie wartości własne i wektory własne. Dla macierzy symetrycznych mamy jeszcze m.in. funkcje DSYEVX (dla wybranych wartości własnych) i DSYEVD (z algorytmem "dziel i rządź")

Fortranowska biblioteka [href://www.caam.rice.edu/software/ARPACK ARPACK] rozwiązuje zadanie własne dla macierzy rozrzedzonych, znajdując kilka wybranych (np. największych co do modułu) wartości i wektorów własnych.

Funkcja eig w Octave i MATLABie wyznacza wszystkie wartości własne (i opcjonalnie wektory własne) zadaniej gęstej macierzy --- oczywiście korzystając z LAPACKa.

octave:1> A = [0 1; 1e-5, 0]
A =
  0.00000  1.00000
  0.00001  0.00000

octave:2> eig(A)
ans =
   0.0031623
  -0.0031623
  
octave:3> [V, L] = eig(A)
V =
   0.9999950  -0.9999950
   0.0031623   0.0031623
L =

   0.0031623   0.0000000
   0.0000000  -0.0031623

Jak dotąd, tylko MATLAB potrafi skorzystać z ARPACKa dla wyznaczenia fragmentów widma macierzy rzadkiej, za pomocą funkcji eigs.

Literatura

W celu dogłębnego zapoznania się z omawianym na wykładzie materiałem, przeczytaj rozdział 5.1, 5.2 i 5.5 w

D. Kincaid, W. Cheney Analiza numeryczna, Wydawnictwa Naukowo-Techniczne, Warszawa 2006, ISBN 83-204-3078-X.

Część wykładu oparto na materiałach zawartych w bardzo ciekawym podręczniku

J. Demmel, Numerical linear algebra, SIAM, 1997.

Od dziesięcioleci, wspaniałym przeżyciem jest lektura książki ojca nowoczesnej analizy numerycznej,

J. H. Wilkinson, The algebraic eigenvalue problem, Clarendon Press, 1965,

a także

B. Parlett, The symmetric eigenvalue problem, Prentice-Hall, 1980.

MN13: Różnice pomiędzy wersjami

Wersja z 20:38, 29 wrz 2006

Spis treści

Wektory i wartości własne

Lokalizacja wartości własnych

Wyznaczanie pojedynczej pary własnej

Metoda potęgowa

Odwrotna metoda potęgowa

Metoda Rayleigh (RQI)

Metody rozwiązywania pełnego zadania własnego

Metoda "dziel i rządź" dla macierzy symetrycznej

Metoda QR

Metoda Jacobiego dla macierzy symetrycznej

Uwarunkowanie

Biblioteki

Literatura

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia

@@ Linia 1: / Linia 1: @@
 <!--
-Konwertowane  z pliku LaTeX przez latex2mediawiki, zob. http://www.ii.uj.edu.pl/&nbsp;pawlik1/latex2mediawiki.php
+Konwertowane  z pliku LaTeX przez latex2mediawiki, zob. http://www.ii.uj.edu.pl/&nbsp;pawlik1/latex2mediawiki.php.
+Niezb�dne rozszerzenia i modyfikacje oryginalnego latex2mediawiki
+wprowadzi� przykry@mimuw.edu.pl
 -->
 =Wektory i wartości własne=
+{{powrot |Metody numeryczne | do strony głównej
+przedmiotu <strong>Metody numeryczne</strong>}}
 Niech będzie dana rzeczywista kwadratowa macierz <math>\displaystyle A</math> wymiaru <math>\displaystyle N</math>. Wektorem własnym <math>\displaystyle x\in C^N</math> oraz
@@ Linia 20: / Linia 26: @@
 <div style="margin-top:1em; padding-top,padding-bottom:1em;">
 <span  style="font-variant:small-caps;">Przykład: Odporność budynku na trzęsienie ziemi</span>
-<div class="solution">
+<div class="solution" style="margin-left,margin-right:3em;">
 Rozważmy prosty układ mechaniczny opisujący, naturalnie w pewnym
@@ Linia 42: / Linia 48: @@
 <div style="margin-top:1em; padding-top,padding-bottom:1em;">
 <span  style="font-variant:small-caps;">Przykład: Macierz Google'a</span>
-<div class="solution">
+<div class="solution" style="margin-left,margin-right:3em;">
-Podstawowy algorytm rankingowania stron WWW w [http://www.wikipedia.org/pagerank  wyszukiwarce Google]
+Podstawowy algorytm rankingowania stron WWW w [http://en.wikipedia.org/wiki/Pagerank  wyszukiwarce Google]
 sprowadza się do znalezienia rzeczywistego <strong>wektora własnego</strong> <math>\displaystyle \pi</math> pewnej silnie
 rozrzedzonej macierzy <math>\displaystyle A</math> (gigantycznego rozmiaru, równego liczbie indeksowanych
@@ Linia 63: / Linia 69: @@
 <div style="margin-top:1em; padding-top,padding-bottom:1em;">
 <span  style="font-variant:small-caps;">Przykład: Wyznaczanie miejsc zerowych wielomianu</span>
-<div class="solution">
+<div class="solution" style="margin-left,margin-right:3em;">
 Jak wiadomo, wartości własne to miejsca zerowe wielomianu charakterystycznego
@@ Linia 84: / Linia 90: @@
 </math></center>
-Funkcja Octave'a <code>compan(p)</code> wyznacza macierz stowarzyszoną dla zadanego
+Funkcja Octave'a <code style="color: #006">compan(p)</code> wyznacza macierz stowarzyszoną dla zadanego
 wielomianu o współczynnikach w wektorze <math>\displaystyle p = [p_1,\ldots,p_N, p_{N+1}]^T</math>. Z tej
-macierzy korzysta następnie funkcja Octave'a <code>roots</code>, która  właśnie w taki
+macierzy korzysta następnie funkcja Octave'a <code style="color: #006">roots</code>, która  właśnie w taki
 sposób wyznacza pierwiastki wielomianów: jako wartości własne macierzy
 stowarzyszonej.
@@ Linia 92: / Linia 98: @@
 W praktyce obliczeniowej spotyka się zazwyczaj kilka typów zagadnień:
-* Wyznaczenie dominującej wartości własnej (to znaczy: największej co do
+* Wyznaczenie dominującej wartości własnej (to znaczy: największej co do modułu) i odpowiadającego jej wektora własnego (a może kilku wektorów, gdy wartość własna jest wielokrotna?)
-modułu) i odpowiadającego jej wektora własnego (a może kilku wektorów?)
+* Wyznaczenie najmniejszej co do modułu wartości własnej i wektorów jej odpowiadających (zauważmy, że to jest np. zadanie wyznaczenia <strong>jądra macierzy osobliwej</strong> --- wtedy wiemy a priori, że szukana najmniejsza co do modułu wartość własna to zero)
-* Wyznaczenie najmniejszej co do modułu wartości własnej i wektorów jej
+* Wyznaczenie wartości własnej najbliższej zadanej liczbie (to jest właśnie odpowiedź na pytanie jak blisko częstości wymuszającej są częstości drgań własnych budynku)
-odpowiadających (zauważmy, że to jest np. zadanie wyznaczenia <strong>jądra
+* Wyznaczenie wszystkich wartości własnych (na przykład, w celu znalezienia wszystkich pierwiastków zadanego wielomianu)
-macierzy osobliwej</strong> --- wtedy wiemy a priori, że szukana najmniejsza co do modułu
+* Wyznaczenie wszystkich wartości i wektorów własnych (tzw. pełne zagadnienie własne)
-wartość własna to zero)
-* Wyznaczenie wartości własnej najbliższej zadanej liczbie (to jest właśnie
-odpowiedź na pytanie jak blisko częstości wymuszającej są częstości drgań
-własnych budynku)
-* Wyznaczenie wszystkich wartości własnych (na przykład, w celu znalezienia
-wszystkich pierwiastków zadanego wielomianu)
-* Wyznaczenie wszystkich wartości i wektorów własnych (tzw. pełne
-zagadnienie własne)
 Jak domyślamy się, dla macierzy rozrzedzonych dużego wymiaru pełne zagadnienie
@@ Linia 114: / Linia 112: @@
 metod numerycznych ograniczymy do tego przypadku, gdyż wtedy zachodzi
-{{twierdzenie|o symetrycznym zadaniu włanym||
+{{twierdzenie|O symetrycznym zadaniu włanym|O symetrycznym zadaniu włanym|
 Każda macierz rzeczywista symetryczna <math>\displaystyle A</math> wymiaru <math>\displaystyle N</math> ma rozkład
@@ Linia 131: / Linia 129: @@
 }}
-==Uwarunkowanie zadania==
-{{twierdzenie|Bauer'a--Fike'a||
-Niech <math>\displaystyle A\in R^{N\times N}</math> będzie diagonalizowalna, to
-znaczy dla pewnej macierzy <math>\displaystyle X</math> zachodzi
-<center><math>\displaystyle X^{-1}  A X = \begin{pmatrix}  \lambda_1 & & \\ & \ddots & \\ & &
-\lambda_N\end{pmatrix} ,
-</math></center>
-a więc (gdyż macierz po prawej stronie jest podobna do <math>\displaystyle A</math>) <math>\displaystyle \lambda_i\in C</math>,
-<math>\displaystyle i=1,\ldots,N</math> są
-wartościami własnymi <math>\displaystyle A</math>. Rozważmy macierz zaburzoną <math>\displaystyle \widetilde{A}</math> i jakąś jej
-wartość własną <math>\displaystyle \widetilde{\lambda}</math>. Wtedy istnieje wartość własna <math>\displaystyle \lambda_j</math>
-macierzy <math>\displaystyle A</math> taka, że
-<center><math>\displaystyle |\lambda_j - \widetilde{\lambda}| \leq  \mbox{cond} _2(X) ||A - \widetilde{A}||_2.
-</math></center>
-}}
-Ponieważ dla rzeczywistej macierzy symetrycznej macierz przejścia <math>\displaystyle X</math> jest
-ortogonalna,
-<math>\displaystyle X^{-1} = X^T</math>, to mamy <math>\displaystyle  \mbox{cond} _2(X) = 1</math> i w konsekwencji zachodzi
-{{wniosek|Wartości własne macierzy symetrycznej są doskonale uwarunkowane||
-Przy oznaczeniach jak [[thm:Bauer-Fike|twierdzeniu Bauera-Fike'a]], jeśli
-dodatkowo założymy, że macierz <math>\displaystyle A</math> jest rzeczywista i symetryczna, to
-<center><math>\displaystyle \min_{j=1,\ldots,N}|\lambda_j - \widetilde{\lambda}| \leq ||A - \widetilde{A}||_2.
-</math></center>
-}}
-Z drugiej strony, dla macierzy niediagonalizowalnych, uwarunkowanie wartości
-własnych może być
-dowolnie duże, co ilustruje poniższy
-<div style="margin-top:1em; padding-top,padding-bottom:1em;">
-<span  style="font-variant:small-caps;">Przykład</span>
-<div class="solution" style="margin-left,margin-right:3em;">
-<center><math>\displaystyle A_\epsilon = \begin{pmatrix}  a & 1 \\ \epsilon & a \end{pmatrix}
-</math></center>
-Weźmy dla uproszczenia <math>\displaystyle a=0</math>.
-Wartości własne <math>\displaystyle A_\epsilon</math> to zera wielomianu <math>\displaystyle p_\epsilon(\lambda) = \lambda^2 - \epsilon</math>,
-zatem <math>\displaystyle \lambda_\epsilon = \pm \sqrt{\epsilon}</math> i w konsekwencji
-<center><math>\displaystyle |\lambda_\epsilon - \lambda_0| / ||A_\epsilon - A_0|| = \sqrt{\epsilon}/\epsilon
-\rightarrow \infty,
-</math></center>
-gdy <math>\displaystyle \epsilon \rightarrow 0^+</math>, a więc uwarunkowanie takiego zadania jest
-nieskończone: dowolnie mała zmiana macierzy powoduje zaburzenie wartości
-własnych niewspółmiernie wielkie wobec zaburzenia danych. Dodatkowo, wartości własne i wektory własne macierzy <math>\displaystyle A</math> dla
-ujemnego parametru <math>\displaystyle \epsilon</math> są zespolone!
-[[Image:MNeigencond.png|thumb|450px|center|Zachowanie się wartości własnych macierzy <math>\displaystyle A</math> (z
-parametrem <math>\displaystyle a=1</math>) w otoczeniu <math>\displaystyle \delta = 0</math>]]
-</div></div>
-Bardziej spektakularny przykład pochodzi od Wilkinsona:
-<div style="margin-top:1em; padding-top,padding-bottom:1em;">
-<span  style="font-variant:small-caps;">Przykład: Perfidny wielomian Wilkinsona</span>
-<div class="solution">
-Niech
-<center><math>\displaystyle p(\lambda) = (\lambda -1)(\lambda - 2) \cdots (\lambda - 20).
-</math></center>
-Zmiana współczynnika przy <math>\displaystyle \lambda^{19}</math> o <math>\displaystyle 10^{-7}</math> skutkuje przesunięciem niektórych
-miejsc zerowych nawet o kilka jednostek na płaszczyźnie zespolonej! Poniżej
-pokazujemy to na numerycznym przykładzie, gdzie prócz wyżej wymienionego zaburzenia mamy
-dodatkowo do czynienia z zaburzeniami powstałymi wskutek wyznaczenia współczynników
-wielomianu w arytmetyce zmiennoprzecinkowej.
-[[Image:MNwilkinson.png|thumb|450px|center|Zera oryginalnego i lekko zaburzonego perfidnego wielomianu
-Wilkinsona.]]
-Jak widzimy, zera bardzo mało zaburzonego wielomianu mogą stać się wyraźnie nie-rzeczywiste!
-</div></div>
-Jeśli chodzi o wektory własne, ich wrażliwość na zaburzenia macierzy jest
-bardziej skomplikowana i zależy m.in. od  uwarunkowania wartości własnych (czego
-łatwo się domyślić) oraz od tego, jak blisko siebie leżą wartości własne.
 ==Lokalizacja wartości własnych==
-Jak okaże się za chwilę, czasem warto mieć ogólne rozeznanie o tym, gdzie <strong>z
+Jak okaże się za chwilę, czasem warto mieć ogólne rozeznanie o tym, gdzie ''z grubsza'' leżą wartości własne danej macierzy <math>\displaystyle A</math>. Przy tym mogą być nam pomocne dwa fakty:
-grubsza</strong> leżą wartości własne danej macierzy <math>\displaystyle A</math>. Przy tym mogą być nam
-pomocne dwa fakty:
 {{fakt|||
@@ Linia 240: / Linia 143: @@
 }}
+{{dowod|||
 Rzeczywiście, skoro istnieje wektor <math>\displaystyle x\neq 0</math> taki, że <math>\displaystyle Ax = \lambda x</math>, to stąd
 <math>\displaystyle ||Ax||/||x|| = |\lambda|</math>, więc fakt powyższy wynika już z definicji normy
@@ Linia 246: / Linia 150: @@
 <center><math>\displaystyle ||A|| = \max_{y\neq 0}\frac{||Ay||}{||y||} \geq ||Ax||/||x||.
 </math></center>
+}}
 Drugie twierdzenie jest równie proste w dowodzie, ale daje trochę więcej
 informacji o lokalizacji widma.
-{{twierdzenie|Gerszgorina||
+{{twierdzenie|Gerszgorina, o lokalizacji widma macierzy|Gerszgorina, o lokalizacji widma macierzy|
 Wartości własne macierzy <math>\displaystyle A</math> leżą w sumie (teoriomnogościowej) dysków <math>\displaystyle K_i</math> na
@@ Linia 263: / Linia 169: @@
 <div style="margin-top:1em; padding-top,padding-bottom:1em;">
 <span  style="font-variant:small-caps;">Przykład: Koła Gerszgorina</span>
-<div class="solution">
+<div class="solution" style="margin-left,margin-right:3em;">
 Niech
@@ Linia 276: / Linia 182: @@
 </math></center>
-[[Image:MNgershgorindisks.png|thumb|450px|center|Lokalizacja wartości własnych macierzy <math>\displaystyle A</math> kołami Gerszgorina oraz zgrubna
+[[Image:MNgershgorindisks.png|thumb|550px|center|Lokalizacja wartości własnych macierzy <math>\displaystyle A</math> kołami Gerszgorina oraz zgrubna
 lokalizacja wewnątrz okręgu
 o promieniu równym <math>\displaystyle ||A||_1</math>. Dokładne wartości własne zaznaczone trójkącikami.]]
@@ Linia 282: / Linia 188: @@
 </div></div>
-==Metoda potęgowa, odwrotna potęgowa, RQI==
+==Wyznaczanie pojedynczej pary własnej==
 Jak wiemy z algebry, nawet gdy <math>\displaystyle A</math> jest macierzą rzeczywistą, jej
-widmo może być zespolone! Analizując poniższe metody, będziemy zakładać, że poszykiwane wartości i wektory
+widmo może być zespolone! Analizując poniższe metody, będziemy zakładać, że poszukiwane wartości i wektory własne <math>\displaystyle A</math> są rzeczywiste. Iterując na liczbach rzeczywistych nie mamy wszak szansy, by dotrzeć do liczb zespolonych!...
-własne <math>\displaystyle A</math> są
-rzeczywiste. Iterując na liczbach rzeczywistych nie mamy wszak szansy, by
-dotrzeć do liczb zespolonych!...
-====Metoda potęgowa====
+===Metoda potęgowa===
 Przypuśćmy, że wartości własne macierzy <math>\displaystyle A\in R^{N\times N}</math> spełniają
@@ Linia 302: / Linia 205: @@
 Załóżmy także, że istnieje baza złożona z wektorów własnych <math>\displaystyle q_1,\ldots,q_N</math> tej
 macierzy (tak jest np. dla macierzy symetrycznej na mocy
-[[thm:symetric-eig|twierdzenia o własnościach symetrycznego zadania
+[[twierdzenia o własnościach symetrycznego zadania własnego]]).
-własnego]]).
 Kierunek własny <math>\displaystyle q_k</math> jakiejś macierzy <math>\displaystyle A</math> ma taką własność, że poddany działaniu przekształcenia
@@ Linia 327: / Linia 229: @@
 </math></center>
-Ponieważ z założenia, że istnieje dokładnie jedna dominująca wartość własna,
+Założenia, że istnieje dokładnie jedna dominująca wartość własna,
-<math>\displaystyle \left|\frac{\lambda_N}{\lambda_1}\right| < 1</math>, wynika, że wyrażenie w nawiasie dąży do
+<math>\displaystyle \left|\frac{\lambda_N}{\lambda_1}\right| < 1</math>, wynika, że wyrażenie w nawiasie dąży do <math>\displaystyle \alpha_1q_1</math> i w konsekwencji wektory <math>\displaystyle x_k = A^kx</math> dążą, gdy
-<math>\displaystyle \alpha_1q_1</math> i w konsekwencji wektory <math>\displaystyle x_k = A^kx</math> dążą, gdy
 <math>\displaystyle k\rightarrow\infty</math>, do kierunku wektora własnego <math>\displaystyle q_1</math>, to znaczy wektora
 odpowiadającego dominującej wartości własnej <math>\displaystyle A</math>  (o ile tylko <math>\displaystyle \alpha_1
@@ Linia 339: / Linia 240: @@
 zbieżna.
-[[Image:MNmetodapotegowalosowy.png|thumb|450px|center|Zbieżność metody potęgowej w zależności od stosunku <math>\displaystyle |\lambda_2/\lambda_1|</math>. Na osi pionowej zaznaczono błąd przybliżenia dominującego wektora własnego.]]
+[[Image:MNmetodapotegowalosowy.png|thumb|550px|center|Zbieżność metody potęgowej w zależności od stosunku <math>\displaystyle |\lambda_2/\lambda_1|</math>. Na osi pionowej zaznaczono błąd przybliżenia dominującego wektora własnego.]]
-W praktyce nie wyznaczamy wzorem <math>\displaystyle x_k = (A^k)\cdot x</math>, lecz raczej korzystamy z
+W praktyce nie wyznaczamy wzorem <math>\displaystyle x_k = (A^k)\cdot x</math>, lecz korzystamy z
 metody iteracyjnej
-{{algorytm|Metoda potęgowa||
+{{algorytm|Metoda potęgowa|Metoda potęgowa|
-<pre>
+<pre><math>\displaystyle x_0</math> = dowolny wektor startowy; k = 0;
-<math>\displaystyle x_0</math> = dowolny wektor startowy; k = 0;
 while( !stop )
 {
@@ Linia 358: / Linia 257: @@
 Warunek normowania ma m.in. na celu zapobieżenie powstawania nadmiaru i
 niedomiaru (gdy <math>\displaystyle |\lambda_1| < 1</math>, to <math>\displaystyle ||A^kx|| \rightarrow 0</math>, a gdy
-<math>\displaystyle |\lambda_1| > 1</math>, to <math>\displaystyle ||A^kx|| \rightarrow \infty</math>). Przy okazji
+<math>\displaystyle |\lambda_1| > 1</math>, to <math>\displaystyle ||A^kx|| \rightarrow \infty</math>). Przy okazji, zauważ, że
 <math>\displaystyle ||y_k||_\infty \rightarrow |\lambda_1|</math>, a więc mamy także sposób na wyznaczenie
 przybliżenia dominującej wartości własnej.
@@ Linia 367: / Linia 266: @@
 dostępnym na <math>\displaystyle k</math>-tej iteracji.
-[[Image:MNmetodapotegowazly.png|thumb|450px|center|Gdy <math>\displaystyle x_0</math> nie ma składowej w kierunku dominującego wektora własnego, w teorii nie powinniśmy obserwować zbieżności. Jednak w praktyce, <strong>dzięki błędom zaokrągleń</strong>, w ciągu iteracji taka składowa się pojawia i doprowadza do zbieżności. Na rysunku przedstawiono zbieżność metody potęgowej w zależności od stosunku <math>\displaystyle |\lambda_2/\lambda_1|</math>. Na osi pionowej zaznaczono błąd przybliżenia dominującego wektora własnego. Oczywiście, gdy <math>\displaystyle \lambda_2=\lambda_1</math> na zbieżność praktycznie nie ma szans.]]
+[[Image:MNmetodapotegowazly.png|thumb|550px|center|Gdy <math>\displaystyle x_0</math> nie ma składowej w kierunku dominującego wektora własnego, w teorii nie powinniśmy obserwować zbieżności. Jednak w praktyce, <strong>dzięki błędom zaokrągleń</strong>, w ciągu iteracji taka składowa się pojawia i doprowadza do zbieżności. Na rysunku przedstawiono zbieżność metody potęgowej w zależności od stosunku <math>\displaystyle |\lambda_2/\lambda_1|</math>. Na osi pionowej zaznaczono błąd przybliżenia dominującego wektora własnego. Oczywiście, gdy <math>\displaystyle \lambda_2=\lambda_1</math> na zbieżność praktycznie nie ma szans.]]
 Metoda potęgowa doskonale sprawdza się, gdy macierz <math>\displaystyle A</math> jest macierzą
 rozrzedzoną --- np. w przypadku macierzy Google'a.
-====Odwrotna metoda potęgowa====
+===Odwrotna metoda potęgowa===
 Zauważmy, że dla dowolnej macierzy kwadratowej <math>\displaystyle A</math> o wartościach własnych
 <math>\displaystyle \lambda_k</math> i odpowiadających im wektorach własnych <math>\displaystyle q_k</math>, mamy:
-* Macierz <math>\displaystyle A-\sigma I</math> ma wartości własne <math>\displaystyle \lambda_k - \sigma</math> oraz wektory
+* Macierz <math>\displaystyle A-\sigma I</math> ma wartości własne <math>\displaystyle \lambda_k - \sigma</math> oraz wektory własne <math>\displaystyle q_k</math>,
-własne <math>\displaystyle q_k</math>,
+* Jeśli dodatkowo <math>\displaystyle A</math> jest nieosobliwa, to macierz <math>\displaystyle A^{-1}</math> ma wartości własne <math>\displaystyle 1/\lambda_k</math> oraz wektory własne <math>\displaystyle q_k</math>
-* Jeśli dodatkowo <math>\displaystyle A</math> jest nieosobliwa, to macierz <math>\displaystyle A^{-1}</math> ma wartości
-własne <math>\displaystyle 1/\lambda_k</math> oraz wektory własne <math>\displaystyle q_k</math>
 Z połączenia tych dwóch własności wynika, że
-{{stwierdzenie|Transformacja widma macierzy||
+{{stwierdzenie|O transformacji widma macierzy|O transformacji widma macierzy|
 Macierz <math>\displaystyle (A-\sigma I)^{-1}</math> (o ile istnieje),
@@ Linia 392: / Linia 289: @@
 Skoro tak, to jeśli najbliższą <math>\displaystyle \sigma</math>  wartością własną <math>\displaystyle A</math> jest <math>\displaystyle \lambda_j</math>,
 wówczas metoda potęgowa zastosowana do macierzy <math>\displaystyle (A-\sigma I)^{-1}</math> zbiegnie do
-<math>\displaystyle q_j</math>. To prowadzi do następującego algorytmu odwrotnej metody potęgowej:
+<math>\displaystyle q_j</math>. To prowadzi do następującego algorytmu, odwrotnej metody potęgowej:
-{{algorytm|Odwrotna metoda potęgowa||
-<pre>
-<math>\displaystyle x_0</math> = dowolny wektor startowy; k = 0;
+{{algorytm|Odwrotna metoda potęgowa|Odwrotna metoda potęgowa|
+<pre><math>\displaystyle x_0</math> = dowolny wektor startowy; k = 0;
 while( !stop )
 {
@@ Linia 406: / Linia 301: @@
 </pre>}}
-====Metoda Rayleigh====
+===Metoda Rayleigh (RQI)===
-[[grafika:Rayleigh.jpg|thumb|right|| Rayleigh<br>  [[Biografia Rayleigh|Zobacz biografię]]]]
-Z własności metody potęgowejwynika, że metoda odwrotna potęgowa jest zbieżna tym
+Z własności metody potęgowej wynika, że metoda odwrotna potęgowa jest zbieżna tym szybciej, im bliżej <math>\displaystyle \lambda_j</math> jest przesunięcie <math>\displaystyle \sigma</math> (w stosunku do
-szybciej, im bliżej <math>\displaystyle \lambda_j</math> jest przesunięcie <math>\displaystyle \sigma</math> (w stosunku do
 pozostałych wartości własnych). Dlatego dobrze byłoby --- dla zwiększenia
 szybkości zbieżności iteracji --- poprawiać wartość przesunięcia <math>\displaystyle \sigma</math>,
-korzystając z dotychczas wyznaczonego wektora <math>\displaystyle x_k \approx q_j</math> i ilorazu
+korzystając z dotychczas wyznaczonego wektora <math>\displaystyle x_k \approx q_j</math> i <strong>ilorazu Rayleigh</strong>:
-Rayleigh:
 <center><math>\displaystyle \lambda_j = \frac{q_j^TAq_j}{q_j^Tq_j} \approx \frac{x_k^TAx_k}{x_k^Tx_k}
 </math></center>
-{{algorytm|Metoda RQI (Rayleigh Quotient Iteration)||
+Stąd nazwa metody, w skrócie RQI (''Rayleigh Quotient Iteration'').
-<pre>
-<math>\displaystyle x_0</math> = dowolny wektor startowy; <math>\displaystyle \sigma_0</math> = przybliżenie <math>\displaystyle \lambda_j</math>; k = 0;
+{{algorytm|Metoda RQI|Metoda RQI|
+<pre><math>\displaystyle x_0</math> = dowolny wektor startowy; <math>\displaystyle \sigma_0</math> = przybliżenie <math>\displaystyle \lambda_j</math>; k = 0;
 while( !stop )
 {
@@ Linia 444: / Linia 335: @@
 <div style="margin-top:1em; padding-top,padding-bottom:1em;">
 <span  style="font-variant:small-caps;">Uwaga: Gdy złe uwarunkowanie i skończona precyzja arytmetyki pomagają...</span>
-<div class="solution">
+<div class="solution" style="margin-left,margin-right:3em;">
 Przez pewien czas numerycy odnosili się do tej metody z rezerwą,
@@ Linia 450: / Linia 341: @@
 bardziej rośnie uwarunkowanie <math>\displaystyle A-\sigma_k I</math>, a tym samym błąd numerycznego
 rozwiązywania układu z tą macierzą będzie coraz większy i metoda będzie tracić
-stabilność. Tymczasem okazuje się, że --- choć rzeczywiście tak jest ---
+stabilność. Tymczasem okazuje się, że --- choć rzeczywiście rozwiązanie układu jest obarczone wielkim błędem --- to
 wektor błędu ma kierunek praktycznie zgodny z kierunkiem poszukiwanego wektora
-<math>\displaystyle q_j</math>, a tym samym tylko <strong>złe uwarunkowanie macierzy i skończona precyzja arytmetyki pomagają</strong> w zbieżności metody!
+<math>\displaystyle q_j</math>, a tym samym <strong>złe uwarunkowanie macierzy</strong> i <strong>skończona precyzja arytmetyki pomagają</strong> w zbieżności metody!
 </div></div>
@@ Linia 464: / Linia 355: @@
 godnym zaufania algorytmem, jest <strong>metoda QR z przesunięciami</strong>
 (wykorzystująca, jak łatwo się domyślić, rozkład QR macierzy). Metoda QR
-przewyższa także metodę ''dziel i rządź'' w przypadku symetrycznym, gdy wymiar
+przewyższa także metodę "dziel i rządź" w przypadku symetrycznym, gdy wymiar
 macierzy jest mały (mniej więcej <math>\displaystyle N \leq 25</math>).
@@ Linia 475: / Linia 366: @@
 pozwalający niezbyt wygórowanym kosztem <math>\displaystyle O(N^3)</math> operacji sprowadzić przez
 ortogonalne podobieństwo zadanie z
-macierzą gęstą <math>\displaystyle A</math> do zadania z macierzą Hessenberga (w przypadku
+macierzą gęstą <math>\displaystyle A</math> (w przypadku
-niesymetrycznym)
+niesymetrycznym) do zadania z macierzą Hessenberga, czyli macierzą, której element <math>\displaystyle (i,j)</math> jest zerowy gdy tylko <math>\displaystyle i-j > 1</math>:
 <center><math>\displaystyle \begin{pmatrix}
@@ Linia 497: / Linia 388: @@
 </math></center>
-gdzie <math>\displaystyle Q_k</math> jest pewnym przekształceniem Householdera. Niech <center><math>\displaystyle
+gdzie <math>\displaystyle Q_k</math> jest pewnym [[MN12#Odbicia Householdera|przekształceniem Householdera]]. Rzeczywiście, niech <center><math>\displaystyle
 A = \begin{pmatrix}
 d_1 & * & * & *       & \cdots & * \\
@@ Linia 573: / Linia 464: @@
 łatwo (jak?) odzyskać z wektorów własnych macierzy wynikowej.
-====Metoda dziel i rządź====
+===Metoda "dziel i rządź" dla macierzy symetrycznej===
 Jest to obecnie najefektywniejsza metoda rozwiązywania zagadnienia własnego
 macierzy symetrycznej wymiaru powyżej kilkudziesięciu. Omówimy w zarysie jej
 najprostszy wariant (obarczony pewnymi wadami, usuniętymi w wersji
-bibliotecznej --- <code>DSYEVD</code> w LAPACKu).
+bibliotecznej --- <code style="color: #006">DSYEVD</code> w [http://www.netlib.org/lapack  LAPACKu]).
 Startując z symetrycznej macierzy <math>\displaystyle A</math> już w postaci trójdiagonalnej, łatwo
@@ Linia 616: / Linia 507: @@
 <math>\displaystyle b_{m} uu^T</math> ma tylko cztery niezerowe elementy, każdy równy <math>\displaystyle b_m</math>.
-Zgodnie ze swoją nazwą, metoda ''dziel i rządź'' sprowadza zadanie znajdowania par
+Zgodnie ze swoją nazwą, metoda "dziel i rządź" sprowadza zadanie znajdowania par własnych macierzy wymiaru <math>\displaystyle N</math> do dwóch takich zadań dla macierzy dwa razy
-własnych macierzy wymiaru <math>\displaystyle N</math> do dwóch takich zadań dla macierzy dwa razy
 mniejszych. Te z kolei można potraktować w taki sam sposób i iteracyjnie
 zmniejszyć wymiar macierzy do tak małego (około 25), by opłacało się zastosować
-metodę QR (teoretycznie, można byłoby oczywiście doprowadzić podział do momentu,
+[[#Metoda QR|metodę QR]] (teoretycznie, można byłoby oczywiście doprowadzić podział do momentu,
 gdy macierze trójdiagonalne są rozmiaru <math>\displaystyle 1\times 1</math> --- dla których rozwiązanie
 zadania włanego jest trywialne --- ale taki algorytm byłby bardziej kosztowny od
@@ Linia 632: / Linia 522: @@
 </math></center>
-Wtedy można zobaczyć, że dla łatwo wyznaczalnego wektora <math>\displaystyle v</math>,
+Wtedy łatwo widzieć, że dla łatwo wyznaczalnego wektora <math>\displaystyle v</math>,
 <center><math>\displaystyle
@@ Linia 675: / Linia 565: @@
 gdzie <math>\displaystyle d_j</math> są elementami na diagonali macierzy <math>\displaystyle D</math>.
-[[Image:MNsecular.png|thumb|450px|center|Wykres <math>\displaystyle f(\lambda)</math> dla macierzy jednowymiarowego
+[[Image:MNsecular.png|thumb|550px|center|Wykres <math>\displaystyle f(\lambda)</math> dla macierzy jednowymiarowego
-laplasjanu rozmiaru 10. Zwróć uwagę na asymptoty pionowe tej funkcji oraz jej
+laplasjanu rozmiaru 10. Zwróć uwagę na asymptoty pionowe tej funkcji oraz jej przedziałową monotoniczność.]]
-monotoniczność.]]
 W typowym przypadku <math>\displaystyle f</math> będzie miała dokładnie <math>\displaystyle N</math> pojedynczych miejsc zerowych
-i wykres zachęcający do stosowania do niej metody Newtona. Okazuje się, że
+i wykres zachęcający do stosowania do niej [[MN02#Metoda Newtona|metody Newtona]]. Okazuje się, że
 ogólny przypadek nie jest istotnie trudniejszy, choć wymaga ważnych modyfikacji,
 zarówno w celu szybszego rozwiązywania powyższego równania nieliniowego, jak i w
@@ Linia 688: / Linia 577: @@
 małą stałą.
-====Metoda QR====
+===Metoda QR===
 Dla zadania własnego z macierzą niesymetryczną najczęściej stosuje się metodę
 QR.
-Jakkolwiek ostateczna wersja metody <math>\displaystyle QR</math> działa dla macierzy niesymetrycznych,
+Jakkolwiek ostateczna wersja metody QR działa dla macierzy niesymetrycznych,
 wygodnie będzie nam założyć dla przejrzystości ekspozycji, że macierz jest
 symetryczna i w konsekwencji ma rzeczywiste widmo.
@@ Linia 699: / Linia 588: @@
 W najprostszym wariancie (bez przesunięć), algorytm QR ma postać:
-{{algorytm|Metoda QR||
+{{algorytm|Metoda QR|Metoda QR|
-<pre>
+<pre><math>\displaystyle A_1 = A</math>;
-<math>\displaystyle A_1 = A</math>;
 for k = 1, 2, ...
 {
@@ Linia 712: / Linia 599: @@
 Można sprawdzić, że <math>\displaystyle A, A_1, A_2,\ldots</math> mają te same wartości własne, bo <math>\displaystyle A_{k+1} =
 Q_{k+1}^TA_kQ_{k+1}</math>. Co więcej, powyższy algorytm (gdy <math>\displaystyle A</math> jest nieosobliwa) w
-zasadzie jest równoważny teoretycznemu algorytmowi iteracji prostej
+zasadzie jest równoważny hipotetycznemu algorytmowi iteracji prostej
 zastosowanemu nie do pojedynczego wektora, ale do <math>\displaystyle N</math> wektorów naraz:
-{{algorytm|Iteracja prosta na przestrzeni||
+{{algorytm|Iteracja prosta na przestrzeni|Iteracja prosta na przestrzeni|
-<pre>
+<pre><math>\displaystyle V_1 = I</math>;
-<math>\displaystyle V_1 = I</math>;
 for k = 1, 2, ...
 {
@@ Linia 739: / Linia 624: @@
 Q_1\cdots Q_k</math> oraz <math>\displaystyle A_{k+1} = V_{k+1}^TAV_{k+1}</math>.
-Tak więc, w sprzyjających warunkach, metoda QR jako równoważna
+Tak więc, w sprzyjających warunkach, metoda QR, jako równoważna
-iteracji prostej na podprzestrzeni będzie zbieżna: <math>\displaystyle A_k \rightarrow A_\infty</math>,
+iteracji prostej na podprzestrzeni, będzie zbieżna: <math>\displaystyle A_k \rightarrow A_\infty</math>,
 gdzie <math>\displaystyle A_\infty</math> jest macierzą trójkątną (bo wektory własne odpowiadające różnym
-wartościom własnym są ortogonalne), a tym samym wartościami własnymi <math>\displaystyle A_\infty</math>
+wartościom własnym są ortogonalne. Tym samym, wartościami własnymi <math>\displaystyle A_\infty</math>
 (a więc także <math>\displaystyle A</math>)
 będą liczby na diagonali <math>\displaystyle A_\infty</math>.
-{{twierdzenie|Zbieżność metody QR w szczególnym przypadku||
+{{twierdzenie|O zbieżności metody QR|O zbieżności metody QR|
 Niech wartości własne <math>\displaystyle A\in R^{N\times N}</math> spełniają <math>\displaystyle |\lambda_1|,\ldots,
@@ Linia 761: / Linia 646: @@
 przy poważnych ograniczaniach na <math>\displaystyle A</math>. Sprytna modyfikacja algorytmu wyjściowego
 daje  w wyniku tzw. metodę QR z przesunięciami, która jest praktycznie
-niezawodna dla dowolnej macierzy.
+niezawodna dla ''dowolnej'' macierzy.
-{{algorytm|Metoda QR z przesunięciami||
+{{algorytm|Metoda QR z przesunięciami|Metoda QR z przesunięciami|
-<pre>
+<pre><math>\displaystyle A_1 = A</math>;
-<math>\displaystyle A_1 = A</math>;
 for k = 1, 2, ...
 {
@@ Linia 776: / Linia 659: @@
 Koszt wyznaczenia wszystkich wektorów i wartości własnych jest rzędu <math>\displaystyle O(N^3)</math> ze
-stałą równą około 30.
+stałą równą około 30. Omówienie sposobów wyboru ''"sprytnego przesunięcia"'' wykracza niestety poza ramy wykładu.
+===Metoda Jacobiego dla macierzy symetrycznej===
+Na zakończenie wspomnijmy o (bardzo starej) <strong>metodzie Jacobiego</strong>, która działa na oryginalnej macierzy symetrycznej (bez konieczności uprzedniego sprowadzenia do postaci trójdiagonalnej).
+Nie będziemy szczegółowo jej tu omawiać z braku miejsca, wymienimy tylko jej dwie najważniejsze cechy odróżniające ją od metod omawianych wcześniej:
+* jest znacznie wolniejsza
+* (niekiedy) wyznacza dokładniejsze wartości i wektory własne niż inne metody
+Dodatkową zaletą metody Jacobiego jest to, że łatwo ją zrównoleglić (w czym jest podobna do metody dziel i rządź).
+Pomysł metody Jacobiego jest stosunkowo prosty: należy sekwencją przekształceń ortogonalnych <math>\displaystyle J_0,J_1,\ldots</math> sprowadzić wyjściową macierz symetryczną <math>\displaystyle A</math> do postaci (prawie) diagonalnej:
+<center><math>\displaystyle
+J_k^T J_{k-1}^T \cdots J_0^T  A J_0 \cdots J_{k-1} J_k \approx \begin{pmatrix}  \lambda_1 & & & \\
+&  \lambda_2 & & \\
+& & \ddots & \\
+& & & \lambda_N
+\end{pmatrix} .
+</math></center>
+Tak więc iteracja Jacobiego ma postać:
+{{algorytm|||
+<pre>\EATWSfor k = 0, 1, ...
+	wybierz <math>\displaystyle J_k</math>;
+	<math>\displaystyle A</math> = <math>\displaystyle J_k^T A J_k</math>;
+</pre>}}
+Macierze <math>\displaystyle J_k</math> wybieramy jako tzw. obroty Jacobiego, tzn. [[MN12LAB|obroty Givensa]] dobrane tak, by w danym kroku iteracji wyzerować kolejną parę pozadiagonalnych elementów macierzy. W klasycznej wersji, zerowaniu podlega pozadiagonalna para o największym module --- w ten sposób najbardziej zredukujemy miarę niediagonalności macierzy wyrażoną jako suma kwadratów elementów pozadiagonalnych:
+<center><math>\displaystyle \omega = \sum_{j<i}a_{ij}^2.
+</math></center>
+{{twierdzenie|O zbieżności metody Jacobiego|O zbieżności metody Jacobiego|
+Klasyczna metoda Jacobiego jest zbieżna co najmniej liniowo, tzn.
+<center><math>\displaystyle \omega_{k+1} \leq \sqrt{1-\frac{2}{N(N-1)}} \omega_k,
+</math></center>
+gdzie <math>\displaystyle \omega_k</math> oznacza miarę niediagonalności na <math>\displaystyle k</math>-tym kroku iteracji.
+}}
+Można pokazać, że asymptotycznie (tzn. dostatecznie blisko granicy) zbieżność metody Jacobiego jest nawet kwadratowa.
+==Uwarunkowanie==
+{{twierdzenie|Bauera--Fike'a, o uwarunkowaniu wartości własnych|Bauera--Fike'a, o uwarunkowaniu wartości własnych|
+Niech <math>\displaystyle A\in R^{N\times N}</math> będzie diagonalizowalna, to
+znaczy dla pewnej macierzy <math>\displaystyle X</math> zachodzi
+<center><math>\displaystyle X^{-1}  A X = \begin{pmatrix}  \lambda_1 & & \\ & \ddots & \\ & &
+\lambda_N\end{pmatrix} ,
+</math></center>
+a więc (gdyż macierz po prawej stronie jest podobna do <math>\displaystyle A</math>) <math>\displaystyle \lambda_i\in C</math>,
+<math>\displaystyle i=1,\ldots,N</math> są
+wartościami własnymi <math>\displaystyle A</math>. Rozważmy macierz zaburzoną <math>\displaystyle \widetilde{A}</math> i jakąś jej
+wartość własną <math>\displaystyle \widetilde{\lambda}</math>. Wtedy istnieje wartość własna <math>\displaystyle \lambda_j</math>
+macierzy <math>\displaystyle A</math> taka, że
+<center><math>\displaystyle |\lambda_j - \widetilde{\lambda}| \leq  \mbox{cond} _2(X) ||A - \widetilde{A}||_2.
+</math></center>
+}}
+Ponieważ dla rzeczywistej macierzy symetrycznej macierz przejścia <math>\displaystyle X</math> jest
+ortogonalna,
+<math>\displaystyle X^{-1} = X^T</math>, to mamy <math>\displaystyle  \mbox{cond} _2(X) = 1</math> i w konsekwencji zachodzi
+{{wniosek|Wartości własne macierzy symetrycznej są doskonale uwarunkowane|Wartości własne macierzy symetrycznej są doskonale uwarunkowane|
+Przy oznaczeniach jak \link{thm:Bauer-Fike}{twierdzeniu Bauera-Fike'a}, jeśli
+dodatkowo założymy, że macierz <math>\displaystyle A</math> jest rzeczywista i symetryczna, to
+<center><math>\displaystyle \min_{j=1,\ldots,N}|\lambda_j - \widetilde{\lambda}| \leq ||A - \widetilde{A}||_2.
+</math></center>
+}}
+Z drugiej strony, dla macierzy niediagonalizowalnych, uwarunkowanie wartości
+własnych może być
+dowolnie duże, co ilustruje poniższy
+<div style="margin-top:1em; padding-top,padding-bottom:1em;">
+<span  style="font-variant:small-caps;">Przykład</span>
+<div class="solution" style="margin-left,margin-right:3em;">
+<center><math>\displaystyle A_\epsilon = \begin{pmatrix}  a & 1 \\ \epsilon & a \end{pmatrix}
+</math></center>
+Weźmy dla uproszczenia <math>\displaystyle a=0</math>.
+Wartości własne <math>\displaystyle A_\epsilon</math> to zera wielomianu <math>\displaystyle p_\epsilon(\lambda) = \lambda^2 - \epsilon</math>,
+zatem <math>\displaystyle \lambda_\epsilon = \pm \sqrt{\epsilon}</math> i w konsekwencji
+<center><math>\displaystyle |\lambda_\epsilon - \lambda_0| / ||A_\epsilon - A_0|| = \sqrt{\epsilon}/\epsilon
+\rightarrow \infty,
+</math></center>
+gdy <math>\displaystyle \epsilon \rightarrow 0^+</math>, a więc uwarunkowanie takiego zadania jest
+nieskończone: dowolnie mała zmiana macierzy powoduje zaburzenie wartości
+własnych niewspółmiernie wielkie wobec zaburzenia danych. Dodatkowo, wartości własne i wektory własne macierzy <math>\displaystyle A</math> dla
+ujemnego parametru <math>\displaystyle \epsilon</math> są zespolone!
+[[Image:MNeigencond.png|thumb|550px|center|Zachowanie się wartości własnych macierzy <math>\displaystyle A</math> (z
+parametrem <math>\displaystyle a=1</math>) w otoczeniu <math>\displaystyle \delta = 0</math>]]
+</div></div>
+Bardziej spektakularny przykład pochodzi od Wilkinsona:
+<div style="margin-top:1em; padding-top,padding-bottom:1em;">
+<span  style="font-variant:small-caps;">Przykład: Perfidny wielomian Wilkinsona</span>
+<div class="solution" style="margin-left,margin-right:3em;">
+Niech
+<center><math>\displaystyle p(\lambda) = (\lambda -1)(\lambda - 2) \cdots (\lambda - 20).
+</math></center>
+Zmiana współczynnika przy <math>\displaystyle \lambda^{19}</math> o <math>\displaystyle 10^{-7}</math> skutkuje przesunięciem niektórych miejsc zerowych nawet o kilka jednostek na płaszczyźnie zespolonej! Poniżej pokazujemy to na numerycznym przykładzie, gdzie prócz wyżej wymienionego zaburzenia mamy dodatkowo do czynienia z zaburzeniami powstałymi wskutek wyznaczenia współczynników wielomianu w arytmetyce zmiennoprzecinkowej.
+[[Image:MNwilkinson.png|thumb|550px|center|Zera oryginalnego i lekko zaburzonego perfidnego wielomianu
+Wilkinsona.]]
+Jak widzimy, zera bardzo mało zaburzonego wielomianu mogą stać się wyraźnie nie-rzeczywiste!
+</div></div>
+Jeśli chodzi o wektory własne, ich wrażliwość na zaburzenia macierzy jest
+bardziej skomplikowana.
 ==Biblioteki==
 LAPACK zawiera w sobie kolekcję doskonałych narzędzi do rozwiązywania różnych
-wariantów zadania własnego, m.in. <code>DGEEV</code> dla macierzy niesymetrycznych
+wariantów zadania własnego, m.in. <code style="color: #903">DGEEV</code> dla macierzy niesymetrycznych
-oraz <code>DSYEV</code> dla macierzy symetrycznych rozwiązują pełne zagadnienie własne
+oraz <code style="color: #903">DSYEV</code> dla macierzy symetrycznych rozwiązują pełne zagadnienie własne, wyznaczając wszystkie wartości własne i wektory własne. Dla
-wyznaczając wszystkie wartości własne i, opcjonalnie, wektory własne. Dla
+macierzy symetrycznych mamy jeszcze m.in. funkcje <code style="color: #903">DSYEVX</code> (dla wybranych
-macierzy symetrycznych mamy jeszcze m.in. funkcje <code>DSYEVX</code> (dla wybranych
+wartości własnych) i <code style="color: #903">DSYEVD</code> (z algorytmem "dziel i rządź")
-wartości własnych) i <code>DSYEVD</code> (z algorytmem ''dziel i rządź'').
-Fortranowska biblioteka ARPACK rozwiązuje zadanie własne dla macierzy
+Fortranowska biblioteka [href://www.caam.rice.edu/software/ARPACK  ARPACK] rozwiązuje zadanie własne dla macierzy rozrzedzonych, znajdując kilka wybranych (np. największych co do modułu) wartości i wektorów własnych.
-rozrzedzonych, znajdując kilka wybranych (np. największych co do modułu)
-wartości i wektorów własnych.
-Funkcja <code>eig</code> w Octave i MATLABie wyznacza wszystkie wartości własne (i
+Funkcja <code style="color: #006">eig</code> w Octave i MATLABie wyznacza wszystkie wartości własne (i
 opcjonalnie wektory własne) zadaniej gęstej macierzy --- oczywiście korzystając
-z LAPACKa. Jak dotąd, tylko MATLAB potrafi skorzystać z ARPACKa dla wyznaczenia
+z LAPACKa.
-fragmentów widma macierzy rzadkiej, za pomocą funkcji <code>eigs</code>.
+<div style="font-family: monospace; white-space: pre; border-style: dashed; border-width: thin; border-color: black; margin: 1em; padding:1em; color: #444; background-color:#fdfdfd;"><nowiki>octave:1> A = [0 1; 1e-5, 0]
+A =
+.00000  1.00000
+.00001  0.00000
+octave:2> eig(A)
+ans =
+.0031623
+  -0.0031623
+octave:3> [V, L] = eig(A)
+V =
+.9999950  -0.9999950
+.0031623   0.0031623
+L =
+.0031623   0.0000000
+.0000000  -0.0031623
+</nowiki></div>
+Jak dotąd, tylko MATLAB potrafi skorzystać z ARPACKa dla wyznaczenia
+fragmentów widma macierzy rzadkiej, za pomocą funkcji <code style="color: #006">eigs</code>.
+==Literatura==
+W celu dogłębnego zapoznania się z omawianym na wykładzie materiałem, przeczytaj <b>rozdział 5.1, 5.2 i 5.5</b> w
+* D. Kincaid, W. Cheney <cite>Analiza numeryczna</cite>, Wydawnictwa Naukowo-Techniczne, Warszawa 2006, ISBN 83-204-3078-X.
+Część wykładu oparto na materiałach zawartych w bardzo ciekawym podręczniku
+* <span style="font-variant:small-caps">J. Demmel</span>, <cite>Numerical linear algebra</cite>, SIAM, 1997.
+Od dziesięcioleci, wspaniałym przeżyciem jest lektura książki ojca nowoczesnej analizy numerycznej,
+* <span style="font-variant:small-caps">J. H. Wilkinson</span>, <cite>The algebraic eigenvalue problem</cite>, Clarendon Press, 1965,
+a także
+* <span style="font-variant:small-caps">B. Parlett</span>, <cite>The symmetric eigenvalue problem</cite>, Prentice-Hall, 1980.