Algebra liniowa z geometrią analityczną/Wykład 7: Wyznacznik

From Studia Informatyczne

Odwzorowania wieloliniowe

Niech V będzie n-wymiarową przestrzenią wektorową nad ciałem \mathbb K o charakterystyce różnej od 2. Niech dane będzie odwzorowanie \phi :V^k\longrightarrow \mathbb K. Mówimy, że odwzorowanie \phi jest k-liniowe, jeśli dla każdego i= 1,...,k oraz dla dowolnie ustalonych wektorów v_1,...,v_{i-1},v_{i+1},..., v_k odwzorowanie


V\ni v\longrightarrow \phi (v_1,...,v_{i-1},v,v_{i+1},..., v_k)\in \mathbb K


jest liniowe. Na przykład, odwzorowanie \mathbb R ^k\ni (a_1,...,a_k)\longrightarrow a_1...a_k\in \mathbb R jest k-liniowe. Zbiór wszystkich odwzorowań k-liniowych \phi :V^k\longrightarrow \mathbb K oznaczmy przez {\cal L} ^k(V). W naturalny sposób (tak jak w Przykładzie 7. Wykładu I) zbiór ten jest wyposażony w strukturę przestrzeni wektorowej.

Mówimy, że odwzorowanie \phi jest antysymetryczne, jeśli dla każdej permutacji \rho ciągu 1,...,k zachodzi wzór


\phi (v_{\rho (1)}, ..., v_{\rho (k)}) =\textnormal sgn \,\rho\ \phi (v_1,...,v_k),


gdzie \textnormal sgn\ \rho oznacza znak permutacji \rho. Podobnie definiuje się odwzorowanie symetryczne. Mianowicie, \phi jest symetryczne, jeśli dla każdej permutacji \rho zachodzi równość.


\phi (v_{\rho (1)}, ..., v_{\rho (k)}) = \phi (v_1,...,v_k).


Wyżej wspomniane mnożenie liczb rzeczywistych jest k-liniowe symetryczne.

W niniejszym wykładzie odwzorowania antysymetryczne będą odgrywać główną rolę. Zacznijmy od następującego lematu.

Lemat 1.1

Dla odwzorowania k-liniowego \phi następujace warunki są równoważne.

  1. \phi jest antysymetryczne,
  2. \phi (v_1,...,v_k)=0 dla dowolnych wektorów v_1,...,v_k\in V takich, że dwa spośród v_1,...,v_k są jednakowe.
  3. Jeśli v_1,...,v_k są liniowo zależne, to \phi (v_1,..., v_k)=0.

Dowód

Załóżmy 1. Niech wektory v_iv_j będą jednakowe w ciągu wektorów v_1,...,v_k. Niech \rho oznacza permutację, która zamienia i na j. Znak tej permutacji jest równy -1. Po zastosowaniu tej permutacji ciąg wektorów v_1,...,v_k nie ulega zmianie. Wobec tego \phi (v_{\rho (1)},...,v_{\rho (k)})=\phi (v_1,...,v_k). Z drugiej strony


\phi (v_{\rho (1)},...,v_{\rho (k)})=- \phi (v_ 1,...,v_k).


Dodajmy do obu stron tej równości \phi (v_{\rho (1)},...,v_{\rho (k)})=\phi (v_1,...,v_k). Dostajemy równość


(1+1) \phi (v_1,...,v_k)=0.


Wynika stąd, że \phi (v_1,...,v_k)=0, bo ciało \mathbb K ma charakterystykę różną od 2.

Odwrotnie, jeśli \phi spełnia warunek 2), to dla każdych wektorów v_1,..., v_k i dla każdych i< j, i,j=1,...,k mamy


0=\phi (v_1,...,v_{i-1},v_i +v_j, v_{i+1},..., v_{j-1}, v_{i}+v_{j}, v_{j+1},...,v_k).


Stąd, że \phi spełnia warunek 2. oraz z k-liniowości odwzorowania \phi dostajemy


\phi (v_1,...,v_{i-1}, v_j,v_{i+1},...,v_{j-1},v_i, v_{j+1},..., v_k)=-\phi (v_1,..., v_k).


Ponieważ każda permutacja jest złóżeniem pewnej liczby s transpozycji i znak permutacji jest równy (-1)^s, więc \phi jest antysymetryczne.

Załóżmy, że spełniony jest warunek 2. Jeśli ciąg v_1,..., v_k jest liniowo zależny, to pewien wektor z tego ciągu jest kombinacją liniową pozostałych wektorów. Korzystając z k-liniowości \phi i z warunku 2. dostajemy natychmiast, że \phi (v_1,...,v_n )=0. Na koniec, załóżmy 3). Jeśli, któreś wektory w ciągu v_1,..., v_n są równe, to ciąg v_1,..., v_n jest liniowo zależny , a zatem \phi (v_1,...,v_n)=0. Dowód lematu jest zakończony.

image:End_of_proof.gif

Jest oczywiste, że suma odwzorowań k-liniowych antysymetrycznych jest odwzorowaniem k-liniowym antysymetrycznym i odwzorowanie k-liniowe antysymetryczne pomnożone przez skalar jest też antysymetryczne. A zatem ogół odwzorowań antysymetrycznych stanowi podprzestrzeń przestrzeni {\cal L} ^k(V). Oznaczmy tę podprzestrzeń przez {\cal L} ^k_a (V). Elementy przestrzeni {\cal L}^k_a(V) nazywamy też k-formami na przestrzeni V. Choć teoria k-form jest ważna i interesująca, na potrzeby naszego wykładu zajmiemy się tylko szczególnymi przypadkami, tzn. szczególnymi przypadkami k. Po pierwsze, znamy już przestrzeń 1-form. Przestrzenią tą jest przestrzeń dualna V^*, 1-formami odwzorowania liniowe określone na V i o wartościach w ciele \mathbb K.

Zajmiemy się teraz n-formami, gdzie n=\dim V.

Niech e_1,...,e_n będzie bazą przestrzeni wektorowej V i \omega \in \La. Niech v_1,..., v_n\in V. Każdy z tych wektorów przedstawimy jako kombinację liniową wektorów bazy. A zatem \displaystyle v_j=\sum _{i=1}^n a_{ij}e_i dla każdego j=1,...,n. Korzystając z Lematu 1.1 otrzymujemy następujące równości


\aligned\omega (v_1,...,v_n)&=\omega (\sum _{{i_1}=1}^n{a_{i_11}} {e_{i_1}},...,\sum _{{i_n}=1}^n{a_{i_nn}}e_{i_n}) \\ &= \sum _{{i_1},...,{i_n}=1}^n {a_{{i_11}}}\cdot\cdot\cdot {a_{{i_nn}}}\omega ({e_{i_1}},...,{e_{i_n}})\\ &= \sum  _{\small{\begin{array} {l} \ \ \ \  {i_1},...,{i_n}\\ \ { i_a}\ne {i_b} \ {\rm dla}\ a\ne b \end{array} }} {a_{i_1 1}}\cdot\cdot\cdot{a_{i_n n}}\omega ({e_{i_1}},...,{e_{i_n}}) \endaligned


Ponieważ ciąg różnowartościowy i_1,...,i_n jest permutacją ciągu 1,...,n, więc dostajemy


\aligned\omega (v_1,...,v_n)&=\sum _{\rho\in{\cal S}_n} {a_{\rho (1)1}}\cdot\cdot\cdot{a_{\rho (n)n}} \omega (e_{\rho (1)},..., e_{\rho (n)})\\ &=\sum _{\rho\in{\cal S}_n} \textnormal sgn\, \rho \,{a_{\rho (1)1}}\cdot\cdot\cdot{a_{\rho (n)n}} \omega (e_1,..., e_n)\\ &= \omega (e_1,...,e_n) \left (\sum _{\rho\in{\cal S}_n} \textnormal sgn\, \rho \, {a_{\rho (1)1}}\cdot\cdot\cdot{a_{\rho (n)n}}\right ), \endaligned


gdzie {\cal S} _n oznacza zbiór wszystkich permutacji ciągu 1,...,n. Ostatecznie, dla każdego \omega \in\La, zachodzi wzór


\displaystyle  \omega (v_1,...,v_n)=\omega (e_1,...,e_n) \left (\sum _{\rho\in{\cal S}_n} \textnormal sgn\, \rho \ {a_{\rho (1)1}}\cdot\cdot\cdot{a_{\rho (n)n}}\right )      (1.1)


Skalar


\displaystyle  \sum _{\rho\in{\cal S}_n} \textnormal sgn\, \rho \ {a_{\rho (1)1}}\cdot\cdot\cdot{a_{\rho (n)n}}


nie zależy od \omega. A zatem przestrzeń \mathcal L_{a}^{n} jest 1-wymiarowa i każda n-forma jest wyznaczona jednoznacznie przez zdefiniowanie \omega (e_1,..., e_n) dla dowolnie wybranej bazy e_1,..., e_n.

Wyznacznik macierzy. Podstawowe własnosci

W przypadku, gdy V=\mathbb K ^n mamy bazę kanoniczną e_1,...,e_n tej przestrzeni. Każda n-forma na \mathbb K^n może być zadana na bazie kanonicznej.

Rozważmy teraz przestrzeń M(n,n;\mathbb K). Przypomnijmy, że jest to przestrzeń wszystkich macierzy kwadratowych o wymiarach n na n i o wyrazach w ciele \mathbb K. Niech A\in M(n,n;\mathbb K). Niech A_1,..., A_n oznaczają kolumny macierzy. Kolumny są wektorami przestrzeni \mathbb K ^n. Macierz możemy traktować jako ciąg kolumn A_1,...,A_n. Na podstawie wyżej przeprowadzonych rozważań, możemy stwierdzić prawdziwość następującego twierdzenia

Twierdzenie 2.1

Istnieje dokładnie jedno odwzorowanie n-liniowe antysymetryczne


\omega _o:M(n,n;\mathbb K)\ni A\longrightarrow \omega_o (A_1,...,A_n)\in \mathbb K


takie, że \omega _o(e_1,...,e_n)=1, gdzie e_1,...,e_n jest bazą kanoniczną przestrzeni \mathbb K ^n.

Odwzorowanie \omega _o nazywa się wyznacznikiem i oznacza symbolem \det.

Symbol \det A oznacza wartość odwzorowania \det na ciągu kolumn A_1,...,A_n macierzy A.

Podkreślamy, że wyznacznik macierzy definiuje się tylko dla macierzy kwadratowych. Na podstawie formuły (1.1) otrzymujemy natychmiast następujący wzór na wyznacznik macierzy A=[a_{ij}]\in M(n,n;\mathbb K)

\displaystyle  \det A= \sum _{\rho\in{\cal S}_n} \textnormal sgn\, \rho \ {a_{\rho (1)1}}...{a_{\rho (n)n}}      (2.2)



Wzór Sarrusa

Przykład 2.2

Niech dana będzie baza v_1,...,v_n przestrzeni wektorowej V. Niech P będzie macierzą przejścia od bazy v_1,..., v_n do bazy -v_1,v_2..,v_n. Widać od razu, że \det A=1.

Dowiedziemy teraz kilku podstawowych własności wyznacznika.

Twierdzenie 2.3

Dla dowolnych macierzy A,B\in M(n,n;\mathbb K) zachodzi wzór

\det AB=\det A\, \det B.      (2.3)


Dowód

Niech A=[a_{ij}] i B=[b_{ij}]. Wiemy, że wyrazy c_{ij} macierzy C=AB wyrażają się wzorem

image:End_of_proof.gif


\displaystyle  c_{ij}=\sum _{l=1}^n a_{il}b_{lj}.      (2.4)


Niech A_1,...,A_n oznaczają kolumny macierzy A zaś C_1,...,C_n - kolumny macierzy C. Na podstawie formuły (2.4 ) mamy wzór


\displaystyle  C_j=\sum _{l=1}^n b_{lj}A_l.      (2.5)


Otrzymujemy następujące równości


\aligned\det AB&=\det (C_1,...,C_n)\\ &=\det \left (\sum _{l_1=1}^nb_{l_11}{A_{l_1}},...,\sum _{l_n=1}^nb_{l_nn}{A_{l_n}}\right )\\ &= \sum _{{l_1},...,{l_n}=1}^n {b_{l_11}}...{b_{l_nn}}\, \det ({A_{l_1}},...,{A_{l_n}})\\ &=\sum _{\small{\begin{array} {l} \ \ \ \ \ \ \ l_1,...,l_n\\ \ {l_a}\ne {l_b}\ {\rm dla}\ a\ne b\end{array} }} {b_{l_11}}...{b_{l_nn}}\, \det ({A_{l_1}},...,{A_{l_n}})\\ &= \sum _{\rho \in {\cal S}_n}{b_{\rho (1)1}}...{b_{\rho (n)n}}\, \det ({A_{\rho (1)}},...,{A_{\rho (n)}})\\ &= \sum _{\small{\rho \in {\cal S}_n}}\textnormal sgn\, \rho \ {b_{\rho (1)1}}...{b_{\rho (n)n}}\, \det\, A\\ &=\det A\, \det B \endaligned


Korzystając z definicji wyznacznika, łatwo widać, że wyznacznik macierzy jednostkowej I jest równy 1. A zatem, jeśli A jest macierzą odwracalną, to


1=\det I=\det (AA^{-1})=(\det A)(\det A^{-1}).


Oznacza to, że macierz odwracalna ma wyznacznik różny on zera, a wyznacznik macierzy odwrotnej jest odwrotnością wyznacznika macierzy danej. Mamy więc wzór


\det (A^{-1})=(\det A)^{-1}      (2.6)


dla macierzy odwracalnej A. Macierz, której wyznacznik jest różny od zera nazywa się macierzą nieosobliwą.

Załóżmy teraz, że macierz A ma niezerowy wyznacznik. Wtedy kolumny macierzy A, jako wektory przestrzeni \mathbb K ^n są liniowo niezależne (na podstawie (Lematu 1.1). Oznacza to, że, jeśli A potraktujemy jako odwzorowanie liniowe z \mathbb K ^n do \mathbb K ^n, to A jest izomorfizmem. A zatem macierz A jest odwracalna. Mamy więc

Twierdzenie 2.4

Macierz A jest odwracalna wtedy i tylko wtedy, gdy jest nieosobliwa.

Twierdzenie 2.5

Jeżeli A\in M(n,n;\mathbb K), to \det A^*=\det A.

Dowód

Oznaczmy przez B=[b_{ij}] macierz dualną do A=[a_{ij}]. A zatem b_{ij}=a_{ji}. Mamy


\displaystyle \det B=\sum _{\rho \in{\cal S}_n}\textnormal sgn\rho\  b_{\rho (1)1}\cdot\cdot\cdot b_{\rho (n)n}.


Dla każdej permutacji \rho \in{\cal S} weźmy \rho ^{-1}. Jeśli \rho (i)=j, to \rho ^{-1} (j)=i. Zatem iloczyn b_{\rho (1)1}\cdot\cdot\cdot b_{\rho (n)n} jest równy iloczynowi b_{1\rho ^{-1}(1)}\cdot\cdot\cdot b_{n\rho ^{-1}(n)} (po ewentualnym spermutowaniu czynników). Ponieważ odwzorowanie {\cal S}_n\ni \rho \longrightarrow \rho ^{-1}\in {\cal S }_n jest bijekcją i dla każdej permutacji \rho zachodzi równość \textnormal sgn \ \rho =\textnormal sgn\ {\rho }^{-1}, zatem


\aligned\det B&=\sum _{\rho \in{\cal S}_n} \textnormal sgn\, \rho \, b_{1\rho (1)}\cdot\cdot\cdot n_{n\rho (n)}\\ &= \sum _{\rho \in{\cal S}_n}\textnormal sgn \, \rho \, a_{\rho (1)1}\cdot\cdot\cdot a_{\rho (n)n}=\det A. \endaligned
image:End_of_proof.gif


Z powyższego twierdzenia dostajemy następujący wzór na wyznacznik macierzy A=[a_{ij}]


\displaystyle  \det A= \sum _{\rho \in{\cal S}_n}\textnormal sgn\, \rho \,\ a_{1\rho (1)}\cdot\cdot\cdot a_{n\rho (n)}.      (2.7)


Wyznacznik jest n-liniową antysymetryczną funkcją wierszy.

Zauważmy teraz, że jeśli w macierzy A do pewnej kolumny (lub pewnego wiersza) dodamy kombinację liniową pozostałych kolumn (lub pozostałych wierszy), to wyznacznik macierzy się nie zmieni. Wynika to z wieloliniowości wyznacznika i z warunku 2. Lematu 1.1. Jeśli zamienimy miejscami dwie kolumny (lub dwa wiersze), to wyznacznik zmieni swój znak. Jeśli pewną kolumnę macierzy A pomnożymy przez skalar \lambda, to dla otrzymanej w ten sposób macierzy A' mamy wzór \det A'=\lambda \det A. W szczególności, wymienione właśnie operacje na macierzach są takie, że, po ich zastosowaniu do danej macierzy, wyznacznik macierzy się nie zmieni lub łatwo kontrolujemy ewentualne zmiany wyznacznika tej macierzy. Mówimy, że są to operacje elementarne (lub dopuszczalne ze względu na wyznacznik). Oczywiście sensowne jest mnożenie wierszy lub kolumn przez skalary różne od 0.

Udowodnimy teraz pewną pożyteczną rachunkową własność wyznacznika.

Twierdzenie 2.6

Niech A\in (k,k;\mathbb K), B\in M(k,n-k;\mathbb K), C\in M(n-k,n-k;\mathbb K) zaś O oznacza zerową macierz z M(n-k,k;\mathbb K). Zachodzi wzór

\det\left [\begin{array} {lr} \ A \ B\\ \ O\ C \end{array}  \right ]=\det A\ \det C      (2.8)


Dowód

Dla ustalonych macierzy A i B rozważmy następujące odwzorowanie


\phi :M( n-k,n-k;\K)\ni C\longrightarrow \phi  (C)= \det\left [\begin{array} {lr} \ A \ B\\ \ O\ C. \end{array}  \right ]


Odwzorowanie \phi, jako odwzorowanie n-k rzędów macierzy C jest (n-k)-liniowe i antysymetryczne. A zatem, na podstawie rozważań z początku tego wykładu, wiemy, że


\phi (C)= \phi (I) \ \det C,


gdzie I jest macierzą jednostkową. Pokażemy, że \phi (I)=\det A. Ustalmy macierz B i rozważmy odwzorowanie


\psi :M(k,k;\mathbb K)\ni  A\longrightarrow \psi (A)=\det \left [\begin{array} {lr} \ A \ B\\ \ O\ I. \end{array}  \right ]


Traktując to odwzorowanie jako odwzorowanie k kolumn macierzy A, widzimy, że odwzorowanie to jest k-liniowe antysymetryczne. A zatem, tak jak wyżej, dostajemy


\psi (A)=\psi (I) \ \det A .


Wystarczy teraz udowodnić, że


\det \left [\begin{array} {lr} \ I \ B\\ \ O\ I \end{array}  \right ]=1,


gdzie I w odpowiednim miejscu oznacza macierz jednostkową odpowiedniego wymiaru. Ostatni wzór zostawiamy jako ćwiczenie.

image:End_of_proof.gif

W szczególności, zachodzi wzór


\det \left [ \begin{array} {lcccr}  \ 1\ a_{12}\ .\ .\ .\ a_{1n}\\ \ 0\ \ \ \ \ \\ \ . \ \  \ \ \ \ \\ \ .\  \ \  \ \ \ \ B \ \\ \ . \  \  \  \ \ \  \\ \ 0\  \  \  \  \  \  \  \ \end{array} \right ]= \det B,      (2.9)


gdzie B\in M(n-1,n-1;\mathbb K).

Udowodnimy teraz twierdzenie o tzw. rozwinięciu Laplace'a względem j-tej kolumny.

Twierdzenie 2.7

Niech A=[a_{ij}]\in M(n,n;\mathbb K). Dla każdego ustalonego wskaźnika j (j=1,...,n) zachodzi wzór


\det A = a_{1j}\Delta _{1j}+...+a_{nj}\Delta _{nj},      (2.10)


gdzie \Delta _{ij} oznacza wyznacznik macierzy otrzymanej z macierzy A powstałej z macierzy A przez wykreślenie i-tego wiersza i j-tej kolumny, pomnożony przez (-1) ^{i+j}.



Rozwinięcie Laplace'a

Dowód

Niech A_1,...,A_n będą kolumnami macierzy A. Macierz A traktujemy jako ciąg kolumn, tzn. A= [A_1,...,A_n]. Jeśli e_1,...,e_n jest bazą kanoniczną przestrzeni \K ^n, to


\displaystyle A_j =\sum _{i=1}^n a_{ij} e_i.


Zatem, pamiętając o tym, że wyznacznik jest n-liniową antysymetryczną funkcją kolumn, dostajemy


\displaystyle \det A= \sum _{i=1}^n a_{ij}\det [ A_1,...,A_{j-1}, e_i, A_{j+1},...,A_n].


Wystarczy zauważyć, że


\displaystyle \det [A_1,..., A_{j-1}, e_i,A_{j+1},..., A_n] = \Delta _{ij}.


W tym celu przesuńmy j-tą kolumnę macierzy [A_1,..., A_{j-1}, e_i,A_{j+1},..., A_n] w lewo na pierwsze miejsce. Wykonujemy j-1 transpozycji. W tak otrzymanej macierzy przesuńmy i-ty wiersz na pierwsze miejsce. W tym celu dokonujemy i-1 transpozycji. Po tych operacjach dostajemy macierz postaci


\left [ \begin{array} {lcccr} \ 1\ a_{i2}\ .\ .\ .\ a_{in}\\ \ 0\ \ \ \ \ \\ \ . \ \  \ \ \ \ \\ \ .\  \ \  \ \ \ \ A_{ij} \ \\ \ . \  \  \  \ \ \  \\ \ 0\  \  \  \  \  \  \  \ \end{array} \right ],


gdzie A_{ij} jest macierzą otrzymaną z macierzy A przez wykreślenie i-tego wiersza i j-tej kolumny.

Korzystając ze wzoru (2.9) otrzymujemy


\det [A_1,..., A_{j-1}, e_i,A_{j+1},..., A_n] =(-1)^{j-1}(-1) ^{i-1}\det A_{ij}= \Delta _{ij}.


image:End_of_proof.gif

Na podstawie Twierdzenia 2.5 otrzymujemy wzory na rozwinięcie Laplace'a względem i-tego wiersza.

Twierdzenie 2.8

Niech A=[a_{ij}]\in M(n,n;\mathbb K). Dla każdego ustalonego wskaźnika i (i=1,...,n) zachodzi wzór


\det A = a_{i1}\Delta _{i1}+...+a_{in}\Delta _{in},      (2.11)