Algebra liniowa z geometrią analityczną/Wykład 6: Macierze a odwzorowania liniowe

From Studia Informatyczne

W niniejszym wykładzie wszystkie rozważane przestrzenie są skończenie wymiarowe a bazy są uporządkowane.

Spis treści

Macierz odwzorowania liniowego

Niech dane będą przestrzenie wektorowe V i W nad ciałem \mathbb K oraz odwzorowanie liniowe f:V\longrightarrow W.

Niech e_1,...,e_n będzie bazą przestrzeni wektorowej V, zaś e'_1,...,e'_m bazą przestrzeni W. Dla odwzorowania liniowego f mamy


\begin{array} {rcl} &&f(e_1) =a_{11}e'_1+... +a_{m1}e'_m,\\ &&\ \ \ .\\ &&\ \ \ .\\ &&\ \ \ .\\ &&f(e_n)= a_{1n}e'_1+...+a_{mn}e'_m. \end{array}      (1.1)


dla pewnych skalarów a_{ij}, i=1,...,m, j=1,...,n. Inaczej zapisując


\displaystyle f(e_j)=\sum _{i=1}^ma_{ij}e'_i


dla każdego j=1,...,n.



Macierz odwzorowania liniowego

Otrzymaliśmy więc macierz A=[a_{ij}]_ {\tiny\begin{array} {l} 1\le i\le m\\ 1\le j\le n \end{array} }, która całkowicie opisuje odwzorowanie liniowe f. Istotnie, jeśli znamy wartości odwzorowania liniowego na bazie, to znamy to odwzorowanie. Macierz tę nazywamy macierzą odwzorowania f przy bazach e_1,...,e_n i e'_1,...,e'_m.

Jeśli mamy daną macierz A, ustalone bazy w przestrzeniach V, W, to macierz ta jest macierzą odwzorowania liniowego f:V\longrightarrow W. Odwzorowanie to jest dane formułą (1.1).

Wygodnie jest myśleć o macierzach jako o odwzorowaniach liniowych. Jeśli żadne szczególne przestrzenie nie są wyróżnione, to macierz A=A_{m\times n} możemy traktować jako odwzorowanie liniowe f:\mathbb K ^n\longrightarrow \mathbb K^m dane przepisem (1.1), gdzie e_1,...,e_n jest bazą kanoniczną przestrzeni \mathbb K ^n, zaś e'_1,...,e'_m jest bazą kanoniczną przestrzeni \mathbb K ^m.

Jeśli A jest macierzą odwzorowania f:V\longrightarrow W i przez A_1,..., A_n oznaczymy kolumny macierzy A, to każda kolumna A_j jest ciągiem współrzędnych wektora f(e_j) w bazie e'_1,..., e'_m. Oznacza to, że układ kolumn macierzy A można uważać za wektory (wyrażone we współrzędnych w bazie e_1,...,e_n) f(e_1),...,f(e_n). Rząd odwzorowania f jest więc rzędem układu wektorów A_1,..., A_n macierzy A.

Mamy więc

Twierdzenie 1.1

Jeśli A jest macierzą odwzorowania f:V\longrightarrow W przy pewnych bazach przestrzeni V i W, to \textnormal rk A=\textnormal rk f.

Niech f,h :V\longrightarrow W będą dwoma odwzorowaniami liniowymi. Wiemy, że suma tych odwzorowań jest odwzorowaniem liniowym. Przy danych bazach e_1,...,e_n, e'_1,...,e'_m przestrzeni V i W odpowiednio, macierz odwzorowania f+h jest sumą macierzy A_f+A_h, gdzie A_f jest macierzą odwzorowania f a A_h macierzą odwzorowania h. A zatem dodawanie macierzy odpowiada dodawaniu odwzorowań liniowych. Podobnie mnożeniu macierzy przez skalar odpowiada mnożenie odwzorowania liniowego przez skalar.

Załóżmy teraz, że mamy trzy przestrzenie wektorowe V, W, U. Załóżmy ponadto, że e_1,...,e_n jest bazą V, e'_1,...,e'_k jest bazą W i e''_1,...,e''_m jest bazą U. Niech f:V\longrightarrow W i h:W\longrightarrow U będą odwzorowaniami liniowymi. Oznaczmy przez


A= [a_{lj}]_ {\tiny\begin{array} {l} 1\le l\le k\\ 1\le j\le n \end{array} },\ \ \ B= [b_{il}]_ {\tiny\begin{array} {l} 1\le i\le m\\ 1\le l\le k \end{array} }, \ \ \ \ C= [c_{ij}]_ {\tiny\begin{array} {l} 1\le i\le m\\ 1\le j\le n \end{array} },


macierze odwzorowania f, h i h\circ f odpowiednio, przy danych bazach. Zachodzą następujące równości


\displaystyle f(e_j)=\sum _{l=1}^k a_{lj}e'_l,\ \ \ \ h(e'_l)=\sum _{i=1}^m b_{il}e''_i,\ \ \ \  \ (h\circ f)(e_j)= \sum _{i=1}^m c_{ij}e''_i.


Z drugiej strony


\aligned(h \circ f)(e_j)= h(f(e_j))&=h(\sum _{l=1}^k a_{lj}e'_l)=\sum _{l=1}^k a_{lj}h(e'_l) \\ &=\sum _{l=1}^k a_{lj}\left(\sum _{i=1}^m b_{il}e''_i\right)\\ &=\sum _{i=1}^m \left(\sum _{l=1}^kb_{il}a_{lj}\right )e''_i . \endaligned


Zatem


\displaystyle c_{ij}=\sum _{l=1}^kb_{il}a_{lj}.


Oznacza to, że


C=BA.


Krótko mówiąc, mnożenie macierzy odpowiada składaniu odwzorowań liniowych. Ponieważ składanie odwzorowań jest łączne, więc mnożenie macierzy jest łączne. Wspomnieliśmy już tę własność w poprzednim wykładzie. Teraz uzasadniliśmy jej prawdziwość.

Zauważmy także, że jeśli h_1, h_2: W\longrightarrow U, to (h_1+h_2)\circ f= h_1\circ f +h_2\circ f. Jeśli f_1, f_2:V\longrightarrow W, to h\circ (f_1+f_2)=h\circ f_1 +h\circ f_2. W języku macierzy oznacza to, że (B_1 +B_2)A=B_1A+B_2A oraz B(A_1+A_2)=BA_1+BA_2 (jeśli występujące tu dodawania i mnożenia macierzy można wykonać). Te własności rachunku macierzy również wymieniliśmy w poprzednim wykładzie.

Macierz dualna i odwzorowanie dualne

Niech e^*_1,..., e^*_n będzie bazą dualną do bazy e_1,...,e_n przestrzeni V i e'^*_1,...,e'^*_m bazą dualną do bazy e'_1,...,e'_m przestrzeni W. Rozważmy odwzorowanie dualne f^*:W^* \longrightarrow V^*. Chcemy znaleźć macierz f^* przy wyróżnionych właśnie bazach dualnych. Oznaczmy poszukiwaną macierz przez B=[b_{ji}]_ {\tiny\begin{array} {l} 1\le j\le n\\ 1\le i\le m \end{array} }, czyli


\displaystyle f^*(e'^*_i)=\sum _{j=1}^n b_{ji}e^*_j.


Po obydwu stronach powyższej równości mamy wektory z V^*, czyli odwzorowania liniowe określone na V i o wartościach w \mathbb K. Obliczymy wartość tych odwzorowań na wektorach bazy e_1,..., e_n. Otrzymujemy


\aligned\left( f^*(e'^*_i)\right)(e_s)&=\left((e'^*_i)\circ f\right)(e_s) =e'^*_i\left(\sum _{l=1}^m a_{ls}e'_l\right) \\ &=\sum _{l=1}^m a_{ls}\left(e'^*_i(e'_l)      \right)\\ &=\sum _{l=1}^m a_{ls}\delta _{il} =a_{is}. \endaligned


Z drugiej strony


\displaystyle \left( \sum _{j=1}^n b_{ji}e^*_j\right)(e_s)=  \sum _{j=1}^n b_{ji}(e^*_j(e_s))=  \sum _{j=1}^n b_{ji}\delta _{js}=b_{si} .


A zatem a_{is}=b_{si}, co oznacza, że macierz B jest macierzą dualna do macierzy A.

Macierz odwzorowania dualnego jest macierzą dualną do macierzy odwzorowania danego, jeśli w przestrzeniach dualnych wybierzemy bazy dualne.

Stąd, że dla odwzorowań liniowych zachodzi formuła (f \circ h)^* = h^* \circ f^*, otrzymujemy analogiczną formułą dla macierzy.

Twierdzenie 2.1

Jeśli iloczyn AB jest wykonalny, to wykonalny jest iloczyn B^* A^* oraz


(AB)^* = B^* A^*.


Udowodnimy teraz następujące twierdzenie

Twierdzenie 2.2

Rząd odwzorowania dualnego do f jest równy rzędowi odwzorowania f.

Dowód

Wiemy, że

image:End_of_proof.gif

\textnormal rk f^*=\dim W^*-\dim\textnormal ker f^*=\dim W-\dim\ker f^*.      (2.2)


Przyjrzyjmy się więc przestrzeni \ker f^*. Mamy


\ker f^*=\{\beta \in W^*|\ \beta\circ f=0\}=\{\beta \in W^*|\ \beta _{|\textnormal im f}=0\}.


Weźmy bazę w_1,...,w_k przestrzeni \textnormal im f. Jeśli \textnormal im f= W, to \textnormal rk f=\dim W i \ker f^*= \{0\}. Twierdzenie w tym przypadku jest prawdziwe..

Jeśli \textnormal im f\ne W, to układ w_1,...,w_k rozszerzmy do bazy


w_1,...,w_k, w_{k+1},...,w_m


przestrzeni W. Przestrzeń U rozpięta na wektorach w_{k+1},...,w_m jest dopełnienieniem algebraicznym do \textnormal im f w W, czyli W=U\oplus\textnormal im f. Zauważmy, że odwzorowanie


\phi : \ker f^*\ni \beta\longrightarrow \beta _{|U}\in U^*


jest izomorfizmem. Oczywiście odwzorowanie \phi jest liniowe. Jeśli \phi(\beta)=0, to \beta_{|U} i \beta _{|\textnormal im f} są odwzorowaniami zerowymi. A zatem, \beta jest odwzorowaniem zerowym na całym W. Odwzorowanie \phi jest więc monomorfizmem.

Jest też epimorfizmem. Jeśli bowiem \gamma :U\longrightarrow \mathbb K jest liniowe, to odwzorowanie liniowe \beta: W\longrightarrow \mathbb K zdefiniowane na bazie przestrzeni W następująco: \beta (w_i)=0 dla i=1,...,k,\beta (w_i)=\gamma (w _i) dla i=k+1,..., m, jest takie, że \phi (\beta)=\gamma.

Ponieważ \phi jest izomorfizmem, więc \dim\ker f^* = \dim U ^* =\dim U =m-k =\dim W-\textnormal rk f. Porównując tę równość z równością z pierwszego zdania tego dowodu otrzymujemy żądaną tezę.

Z powyższego twierdzenia i stąd, że macierz odwzorowania dualnego jest macierzą dualną do macierzy odwzorowania danego wynika następujący wniosek

Wniosek 2.3

Dla dowolnej macierzy A zachodzi równość \textnormal rk A=\textnormal rk A^*.

Przypomnijmy sobie teraz operacje dopuszczalne na macierzy (ze względu na rząd macierzy). Korzystając z równości \textnormal{rk} A=\textnormal{rk} A^* dostajemy natychmiast kilka kolejnych operacji dopuszczalnych, tzn. nie zmieniających rzędu macierzy. Mianowicie, dodając do danego wiersza macierzy A kombinację liniową pozostałych wierszy tej macierzy, nie zmieniamy jej rzędu. Mnożąc dowolny wiersz przez niezerowy skalar nie zmieniamy rzędu macierzy. I wreszczcie, permutując wiersze macierzy nie zmieniamy jej rzędu.

Tak jak w dowodzie twierdzenia o istnieniu bazy z Wykładu 2. możemy stwierdzić, że rząd skończonego układu wektorów jest równy maksymalnej liczbie wektorów liniowo niezależnych, które można wybrać z danego układu wektorów.

A zatem mamy następujące twierdzenie

Twierdzenie 2.4 [Rząd macierzy]

Niech A\in M(m,n;\mathbb K).

  1. Rząd macierzy A jest równy maksymalnej liczbie kolumn liniowo niezależnych, które można wybrać z macierzy A.
  2. Rząd macierzy A jest równy maksymalnej liczbie wierszy liniowo niezależnych, które można wybrać z macierzy A.

Macierz odwrotna, ogólna grupa liniowa

Załóżmy teraz, że V=W i f:V\longrightarrow V jest endomorfizmem. Wybieramy jedną bazę, tzn. bazę e_1,...,e_n przestrzeni V, i definiujemy macierz kwadratową A=[a_{ij}]_ {\small  1\le i,j\le n} formułą


\begin{array} {rcl} &&f(e_1) =a_{11}e_1+... +a_{n1}e_n,\\ &&\ \ \ .\\ &&\ \ \ .\\ &&\ \ \ .\\ &&f(e_n)= a_{1n}e_1+...+a_{nn}e_n. \end{array}      (3.3)


Ponieważ mnożenie macierzy odpowiada składaniu odwzorowań, więc odwracalność macierzy A jest równoważna izomorficzności odwzorowania f. Ponadto macierz odwrotna A^{-1} do macierzy A jest macierzą odwzorowania odwrotnego f^{-1}.

Ogólną grupę liniową GL(n;\mathbb K) możemy traktować jako grupę wszystkich izomorfizmów liniowych f:\mathbb K^n\longrightarrow\mathbb K^n, z działaniem będącym składaniem odwzorowań. Pamiętamy, że grupa ta dla n>1 jest nieprzemienna. Zauważyliśmy już, że macierz kwadratowa A jest odwracalna wtedy i tylko wtedy, gdy jest macierzą izomorfizmu. Odwzorowanie liniowe f:\mathbb K ^n\longrightarrow \mathbb K^n jest izomorfizmem wtedy i tylko wtedy, gdy \textnormal rk f=n. Oznacza to, że prawdziwe jest następujące twierdzenie

Twierdzenie 3.1

Macierz kwadratowa A=A_{n\times n} jest odwracalna wtedy i tylko wtedy, gdy \textnormal rk A=n.

Macierz przejścia

Niech e_1,...,e_n będzie bazą przestrzeni V i niech e'_1,..., e'_n będzie inną bazą tej samej przestrzeni. Istnieją jednoznacznie określone skalary p_{ij}, 1\le i,j\le n, takie, że


\displaystyle  e'_j=\sum _{i=1}^n p_{ij}e_i,      (4.4)


dla j=1,...n. Macierz P=[p_{ij}]_{1\le i, j\le } nazywa się macierzą przejścia od bazy e_1,...,e_n do bazy e'_1,...,e'_n. Macierz przejścia jest macierzą izomorfizmu przestrzeni V, który przekształca bazę e_1,...,e_n na bazę e'_1,...,e'_n i macierz ta jest utworzona przy bazie e_1,...,e_n. W szczególności, macierz przejścia jest macierzą odwracalną.

Zamieńmy rolami dane bazy. Istnieją jednoznacznie wyznaczone skalary q_{ij}, 1\le i,j\le n, takie, że


\displaystyle e_i=\sum _{j=1}^n q_{ji}e'_j.


Macierz [q_{ij}] oznaczmy przez Q.

Otrzymujemy więc następujące równości


\displaystyle e_i=\sum _{j=1}^n q_{ji}e'_j=\sum _{j=1} ^n q_{ji}\sum _{l=1}^n p_{lj}e_l=\sum _{l=1}^n \left ( \sum _{j=1}^n p_{lj}q_{ji}\right )e_l


dla każdego i=1,...,n. Oznacza to, że \displaystyle \sum _{j=1}^n p_{lj}q_{ji}=\delta _{li} i, w konsekwencji, macierze P i Q są wzajemnie odwrotne.

Niech teraz f:V\longrightarrow V będzie odwzorowaniem liniowym. Niech A będzie macierzą tego odwzorowania przy bazie e_1,...,e_n i B będzie macierzą tego samego odwzorowania f przy bazie e'_1,...,e'_n. Chcemy ustalić związek między macierzami A i B.

Mamy następujące równości


\displaystyle f(e'_i)=\sum _{j=1}^n b_{ji}e'_j = \sum _{j=1}^n\sum _{l=1}^n p_{lj}b_{ji}e_l=\sum _{l=1}^n \left (\sum _{j=1}^n p_{lj}b_{ji}\right ) e_l.


Z drugiej strony


\aligned f(e'_i ) = f\left (\sum _{j=1} ^n p_{ji}e_j\right )= \sum _{j=1} ^np_{ji} f(e_j)&= \sum _{j=1} ^n p_{ji}\left (\sum _{l=1}^n a_{lj} e_l \right )\\&= \sum _{j=1}^n\sum _{l=1}^n a_{lj} p_{ji}e_l =\sum _{l=1}^n\left (\sum _{j=1}^n a_{lj} p_{ji}\right )e_l. \endaligned


Otrzymaliśmy równość AP=PB. A zatem udowodniliśmy następujące twierdzenie

Twierdzenie 4.1

Jeżeli A jest macierzą endomorfizmu f przy bazie e_1,..., e_n i B jest macierzą tego samego endomorfizmu przy bazie e'_1,..., e'_n, to


B=P^{-1}AP,


gdzie P jest macierzą przejścia od bazy e_1,...,e_n do bazy e'_1,...,e'_n.