Algebra liniowa z geometrią analityczną/Wykład 11: Formy kwadratowe

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Niech V będzie przestrzenią wektorową nad ciałem o charakterystyce różnej od 2. Odwzorowanie


f:V𝕂


nazywamy formą kwadratową, jeśli istnieje odwzorowanie dwuliniowe


Φ:V2𝕂


takie, że


Φ(v,v)=f(v)


dla każdego vV. Mówimy, że odwzorowanie dwuliniowe Φ indukuje formę kwadratową f.

Udowodnimy najpierw następujący lemat

Lemat 0.1

Dla formy kwadratowej f:V𝕂 istnieje dokładnie jedno odwzorowanie dwuliniowe symetryczne ϕ:V2𝕂 indukujące f.

Dowód

Niech Φ będzie pewnym odwzorowaniem dwuliniowym indukującym f. Zdefiniujmy odwzorowanie ϕ następująco


ϕ(u,v)=(1+1)1(Φ(u,v)+Φ(v,u)).


Odwzorowanie to jest dwuliniowe, symetryczne i indukuje f. Zauważmy, że tutaj właśnie wykorzystaliśmy założenie, że charakterystyka ciała 𝕂 jest różna od 2.

Jedyność symetrycznego ϕ indukującego f wykazujemy jak następuje.

Niech ϕ, ϕ będą odwzorowaniami dwuliniowymi symetrycznymi indukującymi f. Wtedy ϕ=ϕϕ jest odwzorowaniem dwuliniowym symetrycznym takim, że ϕ(v,v)=0 dla każdego vV. Wykorzystując dwuliniowość i symetrię ϕ otrzymujemy następujące równości


0=ϕ(u+v,u+v)=ϕ(u,u)+2ϕ(u,v)+ϕ(v,v)=2ϕ(u,v)


dla dowolnych wektorów u,vV. A zatem ϕ(u,v)=ϕ(u,v) dla dowolnych u,vV.

Jedyne dwuliniowe odwzorowanie symetryczne indukujące f nazywa się odwzorowaniem dwuliniowym skojarzonym z formą kwadratową f.

Dla odwzorowania dwuliniowego Φ rozważamy odwzorowanie


Φ~:Vv{VuΦ(u,v)𝕂}V*      (0.1)


Odwzorowanie to jest oczywiście liniowe.

Od tego momentu zakładamy, że wszystkie rozważane w tym wykładzie przestrzenie są skończenie wymiarowe.

Plik:Ag11 1a.mp4
Macierz odwzorowania dwuliniowego

Niech e1,...en będzie bazą przestrzeni V zaś e1*,,en* będzie jej bazą dualną. Znajdźmy macierz odwzorowania Φ~ przy tak wybranych baz. Skorzystajmy ze wzoru (5.4) z Wykładu IV.

Otrzymujemy następujące równości


Φ~(ej)=(Φ~(ej))(e1)e1*+...+(Φ~(ej))(en)en*=Φ(ej,e1)e1*+...+Φ(ej,en)en*.


Oznacza to, że poszukiwana macierz Φ~ jest równa macierzy [Φ(ei,ej)]. Macierz tę nazywamy macierzą odwzorowania dwuliniowego w bazie e1,,en.


Jeżeli ϕ jest odwzorowaniem dwuliniowym skojarzonym z formą kwadratową f, to macierz tę nazywa się macierzą formy kwadratowej f przy bazie e1,,en. Macierz formy kwadratowej jest symetryczna. Rząd tej macierzy jest rzędem odwzorowania liniowego ϕ~ i nazywa się rzędem formy kwadratowej f.

Mając bazę e1,,en przestrzeni V i macierz formy kwadratowej f możemy znaleźć wartość f na dowolnym wektorze vV. Mianowicie, jeśli ϕ jest odwzorowaniem dwuliniowym skojarzonym z f, aij=ϕ(ei,ej) oraz v=v1e1+...+enen, to


f(v)=i,j=1nvivjaij      (0.2)


Zobaczmy jeszcze, jak zmienia się macierz odwzorowania dwuliniowego, jeśli zmienimy bazę. Niech więc dane będą dwie bazy przestrzeni wektorowej V: e1,,en, e'1,...e'n. Niech P będzie macierzą przejścia od bazy e1,,en do bazy e'1,,e'n, tzn.


e'j=i=1kpijei,


dla j=1,,n (porównaj rozdział 4. Wykładu VI). Jeśli Φ:V×V𝕂 jest odwzorowaniem dwuliniowym, to zachodzą następujące równości


Φ(e'i,e'j)=Φ(k=1npkiek,l=1npljel)=k,l=1npkiΦ(ek,el)plj


A zatem przy zmianie bazy macierz odwzorowania dwuliniowego zmienia się według wzoru


A=P*AP,      (0.3)


gdzie A jest macierzą Φ przy bazie e1,,en, zaś A jest macierzą Φ przy bazie e'1,,e'n.

Co prawda udowodniliśmy już, że rząd macierzy Φ nie zależy od wyboru bazy, ale warto zauważyć, że wynika to również z powyższego wzoru, bo P jest macierzą nieosobliwą.

Formy kwadratowe w przestrzeni nad ciałem

Celem tego rozdziału jest pokazanie, że w przestrzeni wektorowej nad ciałem , każda forma kwadratowa ma macierz szczególnie prostej postaci.

Rozważymy najpierw formy kwadratowe w przestrzeniach euklidesowych. Udowodnimy teraz twierdzenie Lagrange'a

Twierdzenie 1.1

Niech f będzie formą kwadratową na skończenie wymiarowej przestrzeni euklidesowej V. Istnieje baza ortonormalna e1,,en przestrzeni V, przy której macierz A formy kwadratowej f jest diagonalna i a11...ann, gdzie a11,,ann są wyrazami głównej przekątnej macierzy A.

Dowód

Dowód twierdzenia jest indukcyjny ze względu na wymiar przestrzeni V.

Dla n=1 twierdzenie jest trywialne. Załóżmy, że jest prawdziwe dla (n1).

Niech f będzie formą kwadratową na n-wymiarowej przestrzeni euklidesowej V. W przestrzeni V mamy naturalną topologię. Albo wprowadzimy ją przez normę (którą mamy, bo iloczyn skalarny definiuje normę), albo bierzemy dowolny izomorfizm liniowy h:Vn i mówimy, że podzbiór C przestrzeni V jest otwarty wtedy i tylko wtedy, gdy h(C) jest otwarty w n. Ponieważ każde odwzorowanie liniowe przestrzeni n jest ciągłe, więc tak zdefiniowana topologia nie zależy od wyboru izomorfizmu h. Tak czy inaczej, sfera jednostkowa


Sn1={vV|  v=1}


jest zbiorem zwartym a forma kwadratowa jest odwzorowaniem ciągłym na V (porównaj wzór (0.2)).

A zatem istnieje wektor e1Sn1, w którym funkcja f osiąga swoje maksimum. Niech W będzie dopełnieniem ortogonalnym do podprzestrzeni lin{e1}. Podprzestrzeń W jest (n1)-wymiarowa.

Na podstawie założenia indukcyjnego wiemy, że dla f~=f|W istnieje baza ortonormalna e2,,en przestrzeni W, przy której macierz f~ jest diagonalna i wyrazy na głównej przekątnej tworzą ciąg niemalejący. Twierdzimy, że e1,,en jest bazą V spełniającą żądane warunki.

Po pierwsze e1,...en jest oczywiście bazą ortonormalną V i ϕ(e1,e1)=f(e1)f(ei)=ϕ(ei,ei) dla każdego i=2,...n, bo wszystkie e2,,en należą do Sn1. Wystarczy teraz pokazać, że ϕ(e1,ei)=0 dla każdego i=2,...n. W tym celu, dla ustalonego wskaźnika i=2,,n, rozważmy funkcję


F:τf((cosτ)e1+(sinτ)ei).


Wektor (cosτ)e1+(sinτ)ei należy do Sn1 dla każdego τ. Ponieważ f osiąga w e1 maksimum, więc funkcja F osiąga maksimum w τ=0. Zatem F(0)=0. Mamy następujące równości


F(τ)=(cos2τ)ϕ(e1,e1)+(sin2τ)ϕ(ei,ei)+12sin(2τ)ϕ(e1,ei).


Łatwo stad wyliczyć, że


F(0)=ϕ(e1,ei).


Wobec tego ϕ(e1,ei)=0, co kończy dowód twierdzenia.

Udowodnimy teraz twierdzenie o bezwładności form kwadratowych, zwane także twierdzeniem Sylvestera.

Twierdzenie 1.2 [Sylvestera]

Niech V będzie n-wymiarową przestrzenią wektorową nad ciałem . Dla każdej formy kwadratowej f na V istnieje baza e1,,en, przy której macierz f jest postaci blokowej


[ Ip  0   0 0 Iq  0 0   0   0],


gdzie Ik jest macierzą jednostkową o wymiarach k na k.

Liczby p i q nie zależą od wyboru bazy e1,,en.

Dowód

Na przestrzeni wektorowej V wprowadzamy dowolny iloczyn skalarny (porównaj Przykład 1.4 z Wykładu X) Z twierdzenia Lagrange'a wiemy, że istnieje baza ortonormalna, przy której macierz formy f jest taka, jak to opisano w poprzednim twierdzeniu. Uporządkujmy tę bazę tak, aby na głównej przekątnej najpierw (tzn. począwszy od lewego górnego rogu) pojawiły się wyrazy dodatnie, potem ujemne i na końcu wyrazy zerowe. Wystarczy teraz pomnożyć wektory bazy odpowiadające niezerowym wyrazom macierzy pomnożyć przez przez odpowiedni skalar. Jeśli ϕ(ei,ei)=aii0, to ei zastępujemy wektorem 1|aii|ei.

Udowodnimy teraz druga część twierdzenia. Widać, że p+q jest rzędem formy kwadratowej f, a zatem nie zależy od wyboru bazy. Załóżmy, że dla dwóch baz e1,,en i e'1,...e'n spełniających tezę twierdzenia mamy pary liczb p,q oraz p,q odpowiednio. Wiemy, że p+q=p+q. Wystarczy więc pokazać, że p=p.

Dla dowodu nie wprost przypuśćmy, że p>p. Niech U będzie podprzestrzenią wektorową generowaną przez wektory ep+1,,en, zaś W - podprzestrzenią generowaną przez wektory e'1,,e'p. Mamy następujący ciąg równości i nierówności


n=dimVdim(U+W)=dimU+dimWdim(UW)=(np)+pdim(UW).


Wobec tego dim(UW)pp>0. Istnieje więc wektor 0v(UW). Niech v=v1e1+...+vnen i v=v'1e'1+...+v'ne'n. Ponieważ vU, więc


f(v)=(vp+1)2...(vp+q)20.


Ponieważ vW, więc


f(v)=(v'1)2+...+(v'p)20.


Porównując te nierowności widzimy, że f(v)=0. Ponieważ vU, więc v=vp+1ep+1+...+vp+qep+q. Korzystając z tego, że 0=f(v)=(vp+1)2...(vp+q)2, otrzymujemy, że v=0, co jest sprzeczne z naszym założeniem. Dowód twierdzenia jest

zakończony.

Z twierdzenia Sylvestera wynika, że przy pewnej bazie e1,,en forma kwadratowa dana jest w postaci kanonicznej, tj. wyraża się wzorem


f(v)=(v1)2+...+(vp)2(vp+1)2...(vp+q)2,      (1.4)


dla v=i=1nviei.

Definicja 1.3 [Sygnatura]

Parę liczb (p,q) nazywamy sygnaturą formy kwadratowej.

Mówimy, że forma kwadratowa f jest półokreślona dodatnio, jeśli w powyższym przedstawieniu (1.4) są same plusy. Jeśli są same plusy i p=n=dimV, to mówimy, że forma kwadratowa jest dodatnio określona. Podobnie definiuje się formy półokreślone ujemnie i określone ujemnie. Forma kwadratowa nazywa się formą określoną, jeśli jest określona dodatnio lub ujemnie.

Niech f:VV będzie endomorfizmem. Mówimy, że odwzorowanie f jest symetryczne, jeśli


f(v)w=f(w)v


dla każdych wektorów v,wV.

Niech ϕ będzie odwzorowaniem dwuliniowym (symetrycznym) zdefiniowanym formułą


ϕ(v,w)=f(v)w.


Odwzorowanie to jest odwzorowaniem skojarzonym pewnej formy kwadratowej. Ze wzoru (1.4) z Wykładu XI i z twierdzenia Lagrange'a wynika, że istnieje baza ortonormalna, przy której macierz odwzorowania f jest diagonalna. Jest to bardzo szczególny przypadek endomorfizmu mającego bardzo prostą macierz Jordana.