Algebra liniowa z geometrią analityczną/Wykład 9: Endomorfizmy. Twierdzenie Jordana

From Studia Informatyczne

Wyznacznik, ślad, wartość własna, wielomian charakterystyczny endomorfizmu i macierzy

W wykładzie tym zakładamy, że wszystkie przestrzenie są skończenie wymiarowe nad ciałem \mathbb K o charakterystyce równej 0.

Mówimy, że macierze kwadratowe A, B\in M(n,n;\mathbb K) są podobne, jeśli istnieje taka macierz nieosobliwa P, dla której B=P^{-1}AP. Macierze podobne mają ten sam wyznacznik, bo


\det B =\det P^{-1}\det A\det P= {1\over{\det P}}\, \det A\,  \det P=\det A.


Ślad macierzy

Zdefiniujemy teraz ślad macierzy. Tak jak wyznacznik, ślad macierzy definiuje się tylko dla macierzy kwadratowych. Dla macierzy A=[a_{ij}]\in M(n,n;\mathbb K) definiujemy jej ślad \tr A jako sumę jej wyrazów leżących na głównej przekątnej, to znaczy


\displaystyle \textnormal tr A=\sum _{i=1}^n a_{ii}.


Odwzorowanie


M(n,n;\mathbb K )\ni A\longrightarrow \textnormal tr A \in \mathbb K


jest liniowe.

Pamiętamy, że mnożenie macierzy jest na ogół nieprzemienne. Mamy natomiast następujące twierdzenie

Twierdzenie 1.1

Dla dowolnych macierzy A,B\in M(n,n;\mathbb K ) zachodzi równość


\textnormal tr (AB)=\textnormal tr (BA).


Dowód

Niech A=[a_{ij}], B=[b_{ij}]. Oznaczmy przez C=[c_{ij}] macierz AB i przez D=[d_{ij}] macierz BA. Mamy następujące równości


\displaystyle \textnormal tr (AB)=\sum _{i=1}^n c_{ii}=\sum _{i=1}^n \sum _{k=1}^n a_{ik}b_{ki}= \sum _{k=1}^n\sum _{i=1}^m b_{ki}a_{ik} =\sum _{k=1}^n d_{kk}=\textnormal tr (BA).
image:End_of_proof.gif


Z twierdzenia tego wynika, że macierze podobne mają taki sam ślad. Istotnie, \textnormal tr (P^{-1}AP)=\textnormal tr (P^{-1}(AP))=\textnormal tr ((AP)P^{-1})= \textnormal tr (A(PP^{-1}))=\textnormal tr A.

Niech f:V\longrightarrow V będzie endomorfizmem. Niech e_1,..., e_n; e'_1,...,e'_n będą bazami przestrzeni V. Jeśli A jest macierzą f przy bazie e_1,..., e_n zaś B jest macierzą f przy bazie e'_1,..., e'_n, to B=P^{-1}AP, gdzie P jest macierzą przejścia od bazy e_1,...,e_n do bazy e'_1,...,e'_n. A zatem \det B=\det A. Oznacza to, że niżej wprowadzona definicja ma sens, tzn. nie zależy od wyboru bazy e_1,...,e_n.

Definicja 1.2

Wyznacznikiem endomorfizmu f:V\longrightarrow V nazywamy wyznacznik dowolnej macierzy tego endomorfizmu.

Podobnie definiuje się ślad endomorfizmu. Mianowicie, mając endomorfizm f bierzemy dowolną jego macierz A (tzn. macierz przy dowolnej bazie) i definiujemy \textnormal tr f jako \textnormal tr A. Definicja nie zależy od wyboru bazy, bo macierze podobne mają ten sam ślad.

Wprowadzimy teraz kolejne definicje.

Definicja 1.3

Mówimy, że skalar \lambda jest wartością własną endomorfizmu f:V\longrightarrow V, jeśli istnieje niezerowy wektor v\in V taki, że f(v)=\lambda v. Każdy taki wektor v nazywamy wektorem własnym odpowiadającym wartości własnej \lambda.

Definiuje się też wartości własne i wektory własne macierzy

Definicja 1.4

Mówimy, że skalar \lambda jest wartością własną macierzy A\in M(n,n;\mathbb K ), jeśli istnieje niezerowy wektor v\in \mathbb K^n taki, że Av=\lambda v. Każdy taki wektor v nazywamy wektorem własnym odpowiadającym wartości własnej \lambda.

W powyższej równości Av=\lambda v wektor v jest traktowany jako 1-kolumnowa macierz.

Istotną cechę wektorów i wartości własnych opisuje następujące twierdzenie

Twierdzenie 1.5

Jeżeli \lambda _1,...,\lambda _k są różnymi między sobą wartościami własnymi endomorfizmu f i v_1,...,v_k są wektorami własnymi odpowiadającymi tym wartościom własnym, to wektory v_1,...,v_k są liniowo niezależne.

Dowód

Dowód jest indukcyjny ze względu na k. Dla k=1 twierdzenie jest oczywiste. Załóżmy, że jest prawdziwe dla liczb mniejszych od pewnego k.

Przypuśćmy, że wektory v_1,...,v_k spełniają założenia twierdzenia i wektory te są liniowo zależne. Możemy założyć, że v_k jest kombinacją liniową wektorów v_1,...,v_{k-1}. Niech


v_k=\mu _1v_1+...+\mu _{k-1}v_{k-1},


Nie wszystkie \mu _1,...,\mu _{k-1} są równe zeru. Możemy przyjąć, że \mu _1\ne 0. Obłóżmy powyższą równość przez f. Wtedy


\lambda _k v_k=\mu _1\lambda _1v_1+...+\mu _{k-1}\lambda _{k-1} v_{k-1}.


Z drugiej strony


\lambda _kv_k=\lambda _k \mu _1 v_1+...+\lambda _k \mu _{k-1} v_{k-1}.


Zatem


0= \mu_1(\lambda _k-\lambda _1)v_1+...+\mu _{k-1}(\lambda _k-\lambda _{k-1})v_{k-1}.


Ponieważ v_1,...,v_l są liniowo niezależne i \mu _1\ne 0, więc \lambda _k=\lambda _1. Jest to sprzeczne z założeniem, że \lambda _1,..., \lambda _k są różne miedzy sobą. image:End_of_proof.gif

Mamy następujące twierdzenie charakteryzujące wartości własne.

Twierdzenie 1.6

Skalar \lambda jest wartością własną endomorfizmu f wtedy i tylko wtedy, gdy


\det (f-\lambda \textnormal I)=0,


gdzie \textnormal I jest odwzorowaniem identycznościowym przestrzeni V.

Dowód

Jeżeli \lambda jest wartością własną f i v jest wektorem własnym odpowiadającym wartości własnej \lambda, to (f-\lambda \textnormal I)(v)=0, czyli odwzorowanie f-\lambda \textnormal I nie jest monomorfizmem. A zatem \det (f-\lambda \textnormal I)=0. Odwrotnie, jeśli \det (f-\lambda \textnormal I)=0, to f-\lambda \textnormal I nie jest monomorfizmem, a zatem istnieje niezerowy wektor v taki, że (f-\lambda \textnormal I)(v)=0. Oznacza to, że \lambda jest wartością własną f a v jest wektorem własnym odpowiadającym tej wartości własnej. image:End_of_proof.gif

Wybierzmy bazę przestrzeni V. Niech A będzie macierzą f przy tej bazie. Wtedy, dla każdego t\in \mathbb K mamy \det (f-t \textnormal I) = \det (A-t \textnormal I).

Jest jasne, jeśli skorzystamy na przykład ze wzoru na wyznacznik macierzy A=[a_{ij}] z Wykładu VII, tzn. ze wzoru


\displaystyle  \det A= \sum _{\rho \in \S _n}\textnormal sgn\ \rho \ a_{\rho (1)1}\cdot\cdot\cdot a_{\rho (n)n},      (1.1)


że \det (f-t\textnormal I)=\det (A-t\textnormal I ), traktowany jako funkcja argumentu t jest wielomianem stopnia n. Wielomian ten nazywamy wielomianem charakterystycznym endomorfizmu f. Oznaczmy go przez W_f. W wielomianie tym współczynnik przy t^n jest równy (-1)^n, wyraz wolny jest równy \det A =\det f, zaś współczynnik przy t^{n-1} jest równy (1)^{n-1}\textnormal tr A=\textnormal tr f. Istotnie, wstawiając za t wartość 0 dostajemy wyraz wolny wielomianu W_f, czyli wyraz wolny jest równy \det f. Wielomian W_f możemy zapisać jako


W_f(t)= (a_{11}-t)\cdot\cdot\cdot (a_{nn}-t) + W(t),


gdzie W(t) jest wielomianem stopnia mniejszego lub równego n-1. Widać stąd, że współczynnik przy t^n jest równy (-1)^n. Zauważmy jednak, że wielomian W(t) jest stopnia silnie mniejszego od n-1. Istotnie, ciągle mając na uwadze wzór (1.1), widzimy, że składniki zawierające t^{n-1} mogą powstać tylko przy pomnożeniu n-1 wyrazów macierzy A-t\textnormal I leżących na głównej przekątnej. Ale permutacja n-elementowego zbioru, która jest identycznością na n-1 elementach jest identycznością na całym zbiorze. Oznacza to, że składniki wielomianu W_f(t) zawierające t^{n-1} powstają tylko z iloczynu (a_{11}-t)\cdot\cdot\cdot (a_{nn}-t). Teraz łatwo widać, że współczynnik przy t^{n-1} jest równy (-1)^{n-1}\textnormal tr A.

Podprzestrzenie niezmiennicze. Baza i macierz Jordana.

Niech U będzie podprzestrzenią przestrzeni V. Mówimy, że podprzestrzeń ta jest f-niezmiennicza (dokładniej mówiąc, niezmiennicza ze względu na f), jeśli f(U)\subset U. Jeśli U jest podprzestrzenią f-niezmienniczą, to po zawężeniu f do U dostajemy endomorfizm przestrzeni U. Oznaczmy go przez \tilde f. Endomorfizm ten ma swój wielomian charakterystyczny W_{\tilde f}. Zachodzi następujący lemat.

Lemat 2.1

Jeżeli U jest podprzestrzenią f-niezmienniczą, to wielomian charakterystyczny W_{\tilde f} dzieli wielomian charakterystyczny W_f.

Dowód

Niech e_1,...,e_k będzie bazą przestrzeni U. Rozszerzamy ją do bazy e_1,...,e_k, e_{k+1},...,e_n przestrzeni V. Macierz A endomorfizmu f w tej bazie ma postać blokową


A=\left [\begin{array} {l} \ B \ D \\ \ 0 \ C \end{array} \right ]


gdzie B jest macierzą \tilde f w bazie e_1,...,e_k. Mamy wtedy (na podstawie Twierdzenia 2.6 z Wykładu VII)


W_f(t)= \det (A-t\textnormal I) = \det (B- t\textnormal I) \det (C-t\textnormal I) =W_{\tilde f}\ \det (C-t\textnormal I).
image:End_of_proof.gif


Macierzą Jordana nazywa się macierz postaci


\left [\begin{array} {lccccr} \ A_1 & 0 & 0 &...& 0\\ \ 0       &A_2&0 &...&0\\ \   &   &   &   & \\ \ . & .& . & . & 0\\ \ . & . & . & .& 0\\ \ . & .& . & .& 0\\ \ &   &    &   &   \\ \ 0& 0& 0& 0& A_l, \end{array} \right ],      (2.2)


gdzie A_1, ..., A_l są macierzami kwadratowymi postaci


\left [\begin{array} {lcccccr}  \ \lambda _i &1& & & & 0\\ \ 0& \lambda _i& 1& & & 0\\ \ .&. & .& .& .& .\\ \ 0 & & & \lambda _i & 1 & 0\\ \ 0 & & & &\lambda _i & 1\\ \ 0  & & & & &\lambda _i \end{array} \right ]      (2.3)


dla i=1,...l. Macierze A_1,..., A_l nazywamy klatkami Jordana. Jeżeli macierz A_i jest jedna klatką Jordana (2.3) o wymiarach n_i na n_i, to (A_i-\lambda _i\textnormal I )^{n_i}=0. Oczywiście \lambda _i jest wartością własną macierzy A_i.

Zwróćmy uwagę na to, że klatki mogą też być wymiaru 1\times 1.

Każda klatka odpowiada pewnej wartości własnej macierzy A. Dla danej wartości własnej odpowiadające jej klatki mogą mieć różne wymiary. Klatek w danym wymiarze też może być dowolna ilość.

Przypuśćmy, że dla danego endomorfizmu f istnieje taka baza e_1,...,e_n, przy której macierz tego endomorfizmu jest macierzą Jordana. Poukładajmy klatki tej macierzy tak, aby na początku (tzn. począwszy od lewego górnego rogu macierzy) były klatki odpowiadające wartości własnej 0 - najpierw wymiaru 1\times1, potem wymiaru 2\times2, potem 3\times3, etc. Po klatkach odpowiadających wartości własnej 0, umieszczamy klatki odpowiadające pozostałym wartościom własnym. Dla każdej wartości własnej układamy klatki od najmniejszych do największych. Takie ukladanie klatek odpowiada permutowaniu bazy e_1,..., e_n. Macierz po takim układaniu jest ciągle macierzą Jordana endomorfizmu f, a spermutowana baza jest bazą Jordana dla f. Bazę tę oznaczmy przez \mathcal B.

Obserwując macierz \mathcal B łatwo odczytać pewne cechy odwzorowania f.

Dla ustalonej klatki mamy pewien ciąg wektorów bazy Jordana odpowiadający tej klatce. Ciąg taki zaczyna się od wektora własnego. Każdy wektor własny z bazy \mathcal B odpowiadający jakiejś wartości własnej rozpoczyna pewien ciąg wektorów (może być 1-wyrazowy) odpowiadający jednej klatce macierzy Jordana.

Z bazy Jordana \mathcal B można wybrać bazę podprzestrzeni \ker f. Wektory tej bazy to wektory odpowiadające wszystkim klatkom 1\times1 dla wartości własnej 0 oraz pierwsze wektory (oczywiście ciągle z bazy \mathcal B) odpowiadające wszystkim kolejnym klatkom Jordana dla wartości własnej 0.

Z bazy \mathcal B można wybrać bazę podprzestrzeni \textnormal im f. W szczególności wszystkie wektory bazy \mathcal B, które odpowiadają klatkom dla niezerowych wartości własnych stanowią część takiej bazy.

Ostatnie wektory ciągów odpowiadających poszczególnym klatkom Jordana i wartości własnej 0 rozpinają podprzestrzeń dopełniajacą do \textnormal im f. Bierzemy tu pod uwagę wszystkie klatki Jordana odpowiadające wartości własnej 0.



Macierz Jordana

Udowodnimy teraz twierdzenie Jordana.

Twierdzenie 2.2 [Jordana]

Niech f: V\longrightarrow  V będzie endomorfizmem, dla którego wielomian charakterystyczny rozkłada się na iloczyn czynników stopnia 1. Istnieje baza Jordana dla f.

Dowód

Dowód jest indukcyjny ze względu na wymiar n przestrzeni V. Jeśli n=1, to twierdzenie jest trywialne. Załóżmy, że twierdzenie jest prawdziwe dla przestrzeni wymiaru mniejszego od n. image:End_of_proof.gif

Załóżmy najpierw, że f nie jest monomorfizmem, czyli \dim\textnormal im f<n. Podprzestrzeń \textnormal im f jest f-niezmiennicza. Niech \tilde f:\textnormal im f \longrightarrow \textnormal im f będzie zawężeniem f do \textnormal im f. Wielomian charakterystyczny dla \tilde f dzieli wielomian charakterystyczny dla f. Zatem rozkłada się na iloczyn czynników stopnia 1. Możemy zastosować założenie indukcyjne dla edomorfizmu \tilde f przestrzeni \im f. Niech \dim \textnormal im f =m i w_1,..., w_m będzie bazą Jordana dla \tilde f. Jeżeli \textnormal im f\oplus \ker f=V, to do bazy w_1,...,w_mdopisujemy dowolną bazę podprzestrzeni \ker f i mamy bazę Jordana dla f.

Załóżmy teraz, że \textnormal im f\cap \ker f\ne \{0\}. Oczywiście \ker\tilde f=\ker f\cap \textnormal im f. Z bazy Jordana w_1,...,w_m wybieramy bazę przestrzeni \ker\tilde f. Niech będzie to ciąg w_{i_1},...,w_{i_k}. Wszystkie te wektory są wektorami własnymi \tilde f odpowiadającymi wartości własnej 0. Każdy z nich rozpoczyna pewien ciąg wektorów odpowiadający jednej klatce Jordana endomorfizmu \tilde f. Oznaczmy przez \tilde w_{1},...,\tilde w_{k} ostatnie wektory tych ciągów. Ponieważ wektory te należą do \textnormal im f, więc istnieją wektory v_1,...,v_k\in V takie, że


f(v_1)=\tilde w_{1},...,f(v_k)=\tilde w_{k}


Bierzemy uzupełnienie u_1,..., u_{n-m-k} ciągu w_{i_1},...,w_{i_k} do bazy przestrzeni \ker f.

Twierdzimy, że ciąg


w_1,...,w_m, v_1,...,v_k, u_1,...,u_{n-m-k}      (2.4)


jest bazą przestrzeni V. Wektorów tych jest n, a zatem wystarczy sprawdzić ich liniową niezależność.

Niech


\begin{array} {rcl} \alpha _1w_1+...+\alpha _mw_m+&& \beta _1v_1+...+\beta _kv_k\\&&+\gamma _1u_1 +...+\gamma _{n-m-k}u_{n-m-k}=0. \end{array}      (2.5)


Obłóżmy tę równość przez f. Dostajemy równość


\alpha _1\tilde f(w_1)+...+\alpha _m\tilde f(w_m)=-\beta _1\tilde w _1-...-\beta _k\tilde w_k.      (2.6)


Korzystając z uwagi poprzedzającej dowodzone twierdzenie wiemy, że obie strony równości (2.6) muszą być zerami. A zatem \beta _1,...,\beta _k są równe zeru. Wracamy teraz do równości (2.5). Mamy


\alpha _1w_1+...+\alpha _mw_m+ \gamma _1u_1 +...+\gamma _{n-m-k}u_{n-m-k}=0.      (2.7)


Zatem


\gamma _1u_1 +...+\gamma _{n-m-k}u_{n-m-k}\in \textnormal im f\cap ker f.


Pamiętając o tym, jak zostały wybrane wektory u_1,...,u_{n-m-k}, otrzymujemy, że \gamma _1u_1 +...+\gamma _{n-m-k}u_{n-m-k}=0. Wynika stąd, że \gamma_1=...=\gamma _{n-m-k}=0. Wracając teraz do równości (2.7) otrzymujemy, że \alpha _1=...=\alpha _m =0.

Na koniec zauważmy, że baza 2.4 jest bazą Jordana dla f. Widać to natychmiast, jeśli ułożymy ją następująco. Na początku


u_1,...,u_{n-m-k}, w_{i_1},...,\tilde w_{1}, v_1,w_{i_2},...,\tilde w_2, v_2,..., w_{i_k},..., \tilde w_k,v_k


a potem pozostałe wektory ciągu w_1,..., w_n w takiej kolejności jak były.

Jeśli 0 nie jest wartością własną endomorfizmu f (f jest monomorfizmem), to weźmy pewną wartość własną \lambda. Ponieważ wielomian charakterystyczny rozkłada się na czynniki stopnia 1, wartość własna istnieje. Zamiast f rozważmy endomorfizm F=f-\lambda \textnormal I. Na podstawie powyższego dowodu wiemy, że istnieje baza Jordana dla F. Baza Jordana dla F jest też bazą Jordana dla f=F+\lambda \textnormal I.

Wniosek 2.3

Dla każdego endomorfizmu przestrzeni zespolonej istnieje baza i macierz Jordana.