MN12

Niech będzie dana rzeczywista kwadratowa macierz $A$ wymiaru $N$ . Wektorem własnym $x \in C^{N}$ oraz odpowiadającą mu wartością własną $λ \in C$ nazwiemy taką parę, dla której $A x = λ x,$ przy czym $x \neq 0$ .

Zadanie wyznaczania dupa hopla wartości własnych hopla i wektorów własnych macierzy ma bardzo szerokie zastosowania w tak odległych do siebie dziedzinach jak np. analiza odporności konstrukcji mechanicznych (wieżowce, mosty, wagony kolejowe) na wibracje, czy też rankingowanie stron internetowych w wyszukiwarce Google.

Przykład Odporność budynku na trzęsienie ziemi

Rozważmy prosty układ mechaniczny opisujący, naturalnie w pewnym jedynie przybliżeniu, zachowanie się układu $N$ ciężkich płyt połączonych ze sobą relatywnie elatycznymi dźwigarami --- co może np. modelować konstrukcję wieżowca.

\rysunek{}{Model wieżowca poddanego drganiom poprzecznym}

Wiadomo, że jeśli częstotliwości drgań własnych tego wieżowca będą bliskie częstotliwości siły wymuszającej (o niewielkiej amplitudzie), to konstrukcja wpadnie w rezonans i w końcu rozpadnie się wskutek zbyt wielkich przemieszczeń. Wychylenia naszych płyt z położenia równowagi są opisywane układem pewnych równań różniczkowych. Teoria matematyczna takich równań różniczkowych pokazuje, że częstotliwości drgań własnych to nic innego jak wartości własne pewnej \CHECK{niesymetrycznej} macierzy wymiaru

2 N

, która powstaje ze współczynników równania różniczkowego opisującego dynamikę tego układu.

Przykład Macierz Google'a

{{{3}}}

Przykład Wyznaczanie miejsc zerowych wielomianu

{{{3}}}

Przykład

Praktyczne zadanie z macierzą symetryczną

W praktyce obliczeniowej spotyka się zazwyczaj kilka typów zagadnień:

Wyznaczenie dominującej wartości własnej (to znaczy: największej co do modułu) i odpowiadającego jej wektora własnego (a może kilku wektorów?)
Wyznaczenie najmniejszej co do modułu wartości własnej i wektorów jej odpowiadających (zauważmy, że to jest np. zadanie wyznaczenia {\em jądra macierzy osobliwej} --- wtedy wiemy a priori, że szukana najmniejsza co do modułu wartość własna to zero)
Wyznaczenie wartości własnej najbliższej zadanej liczbie (to jest właśnie odpowiedź na pytanie jak blisko częstości wymuszającej są częstości drgań własnych budynku)
Wyznaczenie wszystkich wartości własnych
Wyznaczenie wszystkich wartości i wektorów własnych (tzw. pełne zagadnienie własne)

Jak domyślamy się, dla macierzy rozrzedzonych dużego wymiaru pełne zagadnienie własne jest zbyt kosztowne, gdyż najczęściej macierz wektorów własnych --- nawet dla macierzy rzadkiej --- jest gęsta.

Ponieważ w zastosowaniach bardzo często pojawiają się macierze rzeczywiste symetryczne (powyższe przykłady pokazują, że nie tylko!) szczegółową analizę metod numerycznych ograniczymy do tego przypadku, gdyż wtedy zachodzi

Twierdzenie o symetrycznym zadaniu włanym

{{{3}}}

Twierdzenie Bauer-Fike

\lambda_j - \tilde{\lambda}

Ponieważ dla rzeczywistej macierzy symetrycznej macierz przejścia $X$ jest ortogonalna, $X^{- 1} = X^{T}$ , to mamy ${cond}_{2} (X) = 1$ i w konsekwencji zachodzi

Wniosek Wartości własne macierzy symetrycznej są doskonale uwarunkowane

\lambda_j - \tilde{\lambda}

Z drugiej strony, dla macierzy niediagonalizowalnych, uwarunkowanie wartości własnych może być dowolnie duże, co ilustruje poniższy

Przykład

\lambda_\epsilon - \lambda_0

Bardziej spektakularny przykład pochodzi od Wilkinsona:

Przykład Perfidny wielomian Wilkinsona

{{{3}}}

Jeśli chodzi o wektory własne, ich wrażliwość na zaburzenia macierzy jest bardziej skomplikowana i zależy m.in. od uwarunkowania wartości własnych (czego łatwo się domyślić) oraz od tego, jak blisko siebie leżą wartości własne.

Jak okaże się za chwilę, czasem warto mieć ogólne rozeznanie o tym, gdzie {\em z grubsza} leżą wartości własne danej macierzy $A$ . W tym celu mogą być nam pomocne dwa fakty:

Fakt

Dowolna wartość własna

λ \in C

macierzy

A

spełnia \[

Rzeczywiście, skoro istnieje wektor $x \neq 0$ taki, że $A x = λ x$ , to stąd $| | A x | | / | | x | | = | λ |$ , więc fakt powyższy wynika już z definicji normy macierzy: $| | A | | = \max_{y \neq 0} \frac{| | A y | |}{| | y | |} \geq | | A x | | / | | x | | .$

Drugie twierdzenie jest równie proste w dowodzie, ale daje trochę więcej informacji o lokalizacji widma.

Twierdzenie Gerszgorina

z - a_{ii}

Przykład Koła Gerszgorina

{{{3}}}

Przykład Widmo macierzy jednowymiarowego Laplasjanu

Norma daje:

Tw. Gerszgorina daje:

W rzeczywistości,

Przypuśćmy, że wartości własne macierzy $A \in R^{N \times N}$ spełniają $| λ_{1} | > | λ_{2} | \geq \dots \geq | λ_{N} |,$ (to znaczy, istnieje dokładnie jedna dominująca wartość własna macierzy $A$ .

Załóżmy także, że istnieje baza złożona z wektorów własnych $q_{1}, \dots, q_{N}$ tej macierzy (tak jest np. dla macierzy symetrycznej na mocy \link{thm:symetric-eig}{twierdzenia o własnościach symetrycznego zadania własnego}).

Kierunek własny $q_{k}$ jakiejś macierzy $A$ ma taką własność, że poddany działaniu przekształcenia $A$ wydłuża się $λ_{k}$ razy, wobec tego, dowolny wektor $x \in R^{N}$ poddany działaniu $A$ najbardziej wydłuży się w kierunku $q_{1}$ . Iterując tę procedurę, powinniśmy dostawać w wyniku wektory, w których coraz bardziej dominuje kierunek $q_{1}$ . Formalnie, niech

$x = α_{1} q_{1} + \dots + α_{N} q_{N},$

wtedy

$A x = A (\sum_{i} α_{i} q_{i}) = \sum_{i} α_{i} A q_{i} = \sum_{i} α_{i} λ_{i} q_{i}$

i w konsekwencji $A^{k} x = \sum_{i} α_{i} λ_{i}^{k} q_{i} = λ_{1}^{k} (α_{1} q_{1} + α_{2} {(\frac{λ_{2}}{λ_{1}})}^{k} q_{2} + \dots + α_{N} {(\frac{λ_{N}}{λ_{1}})}^{k} q_{N}) .$

Ponieważ z założenia, że istnieje dokładnie jedna dominująca wartość własna, $| \frac{λ_{N}}{λ_{1}} | < 1$ , to wyrażenie w nawiasie dąży do $α_{1} q_{1}$ i w konsekwencji wektory $x_{k} = A^{k} x$ dążą, gdy $k \to \infty$ , do kierunku wektora własnego $q_{1}$ , to znaczy wektora odpowiadającego dominującej wartości własnej $A$ (o ile tylko $α_{1} \neq 0$ ).

Szybkość zbieżności metody potęgowej jest liniowa, o współczynniku zależnym od stosunku $λ_{2} / λ_{1} |$ . W patologicznym przypadku, gdy $| λ_{1} | \approx | λ_{2} |$ , może więc okazać się, że metoda praktycznie nie jest zbieżna.

W praktyce nie wyznaczamy wzorem $x_{k} = (A^{k}) \cdot x$ , lecz raczej korzystamy z metody iteracyjnej

$x_0$ = dowolny wektor startowy; k = 0;
while ( !stop )
{
  $y_k$ = $Ax_{k-1}$;
  $x_k$ = $y_k/||y_k||_\infty$;
  k++;  
}

Warunek normowania ma m.in. na celu zapobieżenie powstawania nadmiaru i niedomiaru (gdy $| λ_{1} | < 1$ , to $| | A^{k} x | | \to 0$ , a gdy $| λ_{1} | > 1$ , to $| | A^{k} x | | \to \infty$ ). Przy okazji, $| | y_{k} | |_{\infty} \to | λ_{1} |$ , a więc mamy także sposób na wyznaczenie przybliżenia dominującej wartości własnej.

Zazwyczaj jako warunek stopu wybiera się kryterium małej poprawki, $| | x_{k} - x_{k - 1} | | \leq ϵ$ , lub warunek małego residuum, $| | A x_{k} - λ_{1, k} x_{k} | | \leq ϵ$ , gdzie $λ_{1, k}$ jest przybliżeniem $λ_{1}$ dostępnym na $k$ -tej iteracji.

\rysunek{}{Zasada działania metody potęgowej}

Metoda potęgowa doskonale sprawdza się, gdy macierz $A$ jest macierzą rozrzedzoną --- np. w przypadku macierzy Google'a.

Zauważmy, że dla dowolnej macierzy kwadratowej $A$ o wartościach własnych $λ_{k}$ i odpowiadających im wektorach własnych $q_{k}$ , mamy:

Macierz $A - σ I$ ma wartości własne $λ_{k} - σ$ oraz wektory własne $q_{k}$ ,

Jeśli dodatkowo $A$ jest nieosobliwa, to macierz $A^{- 1}$ ma wartości własne $1 / λ_{k}$ oraz wektory własne $q_{k}$

Łącząc te dwie własności mamy, że

Stwierdzenie Transformacja widma macierzy

Macierz

(A - σ I)^{- 1}

(o ile istnieje), to ma wartości własne równe

\frac{1}{λ_{k} - σ}

i wektory własne identyczne z

A

.

Skoro tak, to jeśli najbliższą $σ$ wartością własną $A$ jest $λ_{j}$ , wówczas metoda potęgowa zastosowana do macierzy $(A - σ I)^{- 1}$ zbiegnie do $q_{j}$ . To prowadzi do następującego algorytmu, odwrotnej metody potęgowej:

$x_0$ = dowolny wektor startowy; k = 0;
while ( !stop )
{
  $y_k$ = $Ax_{k-1}$;
  $x_k$ = $y_k/||y_k||_\infty$;
  k++;  
}

$x_0$ = dowolny wektor startowy; k = 0;
while( !stop )
{
  Rozwiąż układ równań $(A-\sigma I)y_k = x_{k-1}$;
  $x_k$ = $y_k/||y_k||_\infty$;
  k++;  
}

Z własności metody potęgowej, metoda odwrotna potęgowa jest zbieżna tym szybciej, im bliżej $λ_{j}$ jest przesunięcie $σ$ (w stosunku do pozostałych wartości własnych). Dlatego dobrze byłoby --- dla zwiększenia szybkości zbieżności iteracji --- poprawiać wartość przesunięcia $σ$ , korzystając z dotychczas wyznaczonego wektora $x_{k} \approx q_{j}$ i ilorazu Rayleigh:

$λ_{j} = \frac{q_{j}^{T} A q_{j}}{q_{j}^{T} q_{j}} \approx \frac{x_{k}^{T} A x_{k}}{x_{k}^{T} x_{k}}$

$x_0$ = dowolny wektor startowy; k = 0;
while ( !stop )
{
  $y_k$ = $Ax_{k-1}$;
  $x_k$ = $y_k/||y_k||_\infty$;
  k++;  
}

$x_0$ = dowolny wektor startowy; k = 0;
while( !stop )
{
  Rozwiąż układ równań $(A-\sigma I)y_k = x_{k-1}$;
  $x_k$ = $y_k/||y_k||_\infty$;
  k++;  
}

$x_0$ = dowolny wektor startowy; $\sigma_0$ = przybliżenie $\lambda_j$; k = 0;
while( !stop )
{
  Rozwiąż układ równań $(A-\sigma_k I)y_k = x_{k-1}$;
  $x_k$ = $y_k/||y_k||_2$;
  $\sigma_{k+1}$ = $x_k^TAx_k$;
  k++;  
}

(wybierając normowanie wektora $x$ w normie euklidesowej upraszczamy co nieco algorytm).

Wielką zaletą metody RQI jest jej szybkość zbiezności: kwadratowa gdy wartość własna jest pojedyncza, a nawet sześcienna w przypadku macierzy symetrycznej.

Wadą metody RQI jest to, że na każdym jej kroku należy rozwiązywać układ równań z inną macierzą.

Uwaga Gdy złe uwarunkowanie pomaga...

Przez pewien czas numerycy odnosili się do tej metody z rezerwą, twierdząc, i słusznie, że im lepszym przybliżeniem

q_{j}

będzie

σ_{k}

, tym bardziej rośnie uwarunkowanie

A - σ_{k} I

, a tym samym --- błąd numerycznego rozwiązywania układu z tą macierzą będzie coraz większy i metoda będzie tracić stabilność. Tymczasem okazuje się, że --- choć rzeczywiście tak jest --- wektor błędu ma kierunek praktycznie zgodny z kierunkiem poszukiwanego wektora

q_{j}

, a tym samym tylko pomaga w zbieżności metody!

\rysunek{}{Secular equation}

MN12

%s

Menu nawigacyjne

Działania na stronie

Opcje strony

Narzędzia osobiste

Nawigacja

Szukaj

Narzędzia