Algebra liniowa z geometrią analityczną/Wykład 10: Euklidesowe przestrzenie wektorowe

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Iloczyn skalarny

Zaczniemy od definicji iloczynu skalarnego


Definicja 1.1 [Iloczyn Skalarny]

Niech V będzie przestrzenią wektorową nad ciałem . Odwzorowanie


g:V×V


nazywa się iloczynem skalarnym, jeśli spełnia trzy następujące warunki:

S1) jest dwuliniowe,
S2) jest symetryczne,
S3) jest dodatnio określone, tzn. dla każdego vV zachodzi

nierówność g(v,v)0 i g(v,v)=0 wtedy i tylko wtedy, gdy v=0.

Wartość iloczynu skalarnego na wektorach v,w oznaczamy także przez <v,w> lub vw. Jak zwykle kropkę często pomijamy w zapisie. Nazwa iloczyn skalarny pochodzi stąd, że wynikiem takiego mnożenia jest skalar. Zwróćmy także uwagę na to, że wybór ciała liczb rzeczywistych jest tutaj nieprzypadkowy. W innych ciałach nie mamy skalarów większych od zera.

Zbierzemy teraz kilka najważniejszych przykładów iloczynów skalarnych.

Przykład 1.2

W przestrzeni n mamy tzw. standardowy (lub kanoniczny) iloczyn skalarny. Mianowicie, dla wektorów v=(v1,....vn),  w=(w1,,wn)n definiujemy


vw=v1w1+...+vnwn.


Ogólniej, niech λ1,,λn będą dowolnymi liczbami dodatnimi. Definiujemy iloczyn skalarny


vw=λ1v1w1+...+λnvnwn.


Przykład 1.3

Rozważmy przestrzeń funkcji ciągłych określonych na przedziale [a,b]. Definiujemy iloczyn skalarny


<f,h>=abfh.


Przykład 1.4

Niech e1,,en będzie bazą przestrzeni wektorowej V nad ciałem . Definiujemy iloczyn skalarny formułą


vw=v1w1+...+vnwn,


gdzie (v1,,vn), (w1,,wn) są współrzędnymi wektorów v i w w danej bazie.

Istotne w tym przykładzie jest to, że każda skończenie wymiarowa przestrzeń wektorowa nad ciałem może być łatwo wyposażona w iloczyn skalarny.

Definicja 1.5 [Norma]

Normą na przestrzeni wektorowej V nad ciałem nazywamy funkcję


Vvv[0,),


która spełnia warunki

N 1) dla każdego wektora vV i liczby rzeczywistej λ zachodzi równość λv=|λ|v,
N 2) zachodzi nierówność trójkąta, tzn. dla każdych wektorów v,wV mamy


v+wv+w.


Iloczyn skalarny dany w przestrzeni V wyznacza normę w tej przestrzeni. Mianowicie, definiujemy


v=vv      (1.1)


Normę wektora nazywamy też jego długością. Stosowany jest zapis v2, który oznacza vv lub, co na jedno wychodzi, v2.

Sprawdzenie, że funkcja zdefiniowana formułą (1.1) spełnia warunki N1) i N2) jest natychmiastowe. Warunek trójkąta sprawdzimy po udowodnieniu następującej nierówności Schwarza.

Twierdzenie 1.5 [Nierówność Schwarza]

Dla funkcji określonej wzorem (1.1) i każdych dwóch wektorów v,wV zachodzi nierówność


|vw|vw      (1.2)


Równość w powyższej nierówności zachodzi wtedy i tylko wtedy, gdy wektory v, w są liniowo zależne.

Dowód

Jeśli któryś z wektorów v, w jest zerowy, to twierdzenie jest oczywiste. Załóżmy więc, że wektory te są niezerowe.

Rozważmy funkcję zmiennej rzeczywistej t


f(t)=tv+w2


Funkcja ta przybiera wartości nieujemne. Z drugiej strony mamy


f(t)=t2v2+2t(vw)+w2


A zatem funkcja f(t) jest trójmianem kwadratowym przyjmującym wartości nieujemne, którego współczynnik przy t2 jest dodatni. Oznacza to, że wyróżnik Δ jest niedodatni. Wobec tego


Δ=4(vw)24v2w20


czyli (vw)2v2w2. Po spierwiastkowaniu tej nierówności dostajemy nierówność Schwarza.

Dla udowodnienia drugiej tezy zauważmy najpierw, że jeśli v=λw, to oczywiście w (1.2) mamy równość. Odwrotnie, równość w (1.2) oznacza, że wyróżnik trójmianu f(t) jest równy 0 i, co za tym idzie, istnieje to, takie, że f(to)=0. To zaś oznacza, że tov+w=0, czyli v, w są liniowo zależne.

Korzystając, miedzy innymi, z nierowności Schwarza otrzymujemy teraz, dla dowolnych wektorów v, w, ciąg równości i nierówności


v+w2=(v+w)(v+w)=v2+2vw+w2v2+2|vw|+w2v2+2vw+w2=(v+w)2


Udowodniliśmy więc nierówność trójkąta N 2) dla funkcji (1.1).

Przy okazji zauważmy, że otrzymaliśmy twierdzenie Pitagorasa. Mianowicie, jeśli wektory v, w są do siebie prostopadłe, czyli vw=0, to


v+w2=v2+w2.


Jeśli wektory v, w sa niezerowe, to liczbę rzeczywistą α[0,π) taką, że


cosα=vwvw,


nazywamy kątem między wektorami v i w.

Układy ortogonalne. Proces Grama - Schmidta. Bazy ortonormalne

Mówimy, że wektory są do siebie prostopadłe (ortogonalne), jeśli ich iloczyn skalarny jest równy 0. Ogólniej, układ wektorów v1,,vn nazywa się układem ortogonalnym, jeśli każde dwa wektory tego układu są do siebie prostopadłe, tzn. vivj=0 dla ij. Oczywiście wektor zerowy jest prostopadły do każdego wektora. Dowolny zbiór (niekoniecznie skończony) nazywa się ortogonalny, jeśli każde dwa wektory tego zbiory są ortogonalne.

Wektory ortogonalne (prostopadłe)

Mamy następujący

Lemat 2.1

Ortogonalny i nie zawierający zera układ wektorów v1,,vn jest liniowo niezależny.

Dowód

Niech λ1v1+...+λnvn=0. Obie strony tej równości pomnóżmy skalarnie przez vi, dla i=1,,n. Otrzymujemy równość λi(vivi)=0, a stąd λi=0.

Wektor vV nazywa się jednostkowym, jeśli v=1. Układ wektorów v1,,vn nazywa się ortonormalnym, jeśli każdy z tych wektorów jest jednostkowy, a cały układ jest ortogonalny. Jeśli v jest wektorem niezerowym, to


vv


jest wektorem jednostkowym. Mówimy, że wektor v został znormalizowany.

Niech v1,,vn będzie pewnym układem liniowo niezależnym przestrzeni wektorowej V wyposażonej w iloczyn skalarny. Niech

e1=v1v1.

Wektor e1 jest jednostkowy i generuje tę samą przestrzeń co v1. Zdefiniujmy teraz wektor e2 następująco


e~2=v2(v2e1)e1.


Łatwo sprawdzić, że wektor ten jest prostopadły do e1. Ponadto układ wektorów e1,e~2 rozpina tę samą podprzestrzeń co układ wektorów v1,v2. Co więcej, jeśli oznaczymy przez V2 tę podprzestrzeń, to e1,e~2 oraz v1,v2 są takimi bazami tej przestrzeni V2, że macierz przejścia od bazy v1,v2 do bazy e1,e~2 ma wyznacznik dodatni.

Definiujemy teraz


e2=e~2e~2


Oczywiście układy v1,v2 i e1,e2 rozpinają tę samą podprzestrzeń V2, układ e1,e2 jest ortonormalny a macierz przejścia od bazy v1,v2 do bazy e1,e2 przestrzeni V2 ma wyznacznik dodatni.

Załóżmy, że zdefiniowaliśmy już k kolejnych wektorów e1,,ek takich, że układy e1,,ek i v1,,vk rozpinają tę samą podprzestrzeń Vk, układ e1,,ek jest ortonormalny a macierz przejścia od bazy v1,,vk do bazy e1,,ek ma wyznacznik dodatni. Definiujemy wektor e~k+1 wzorem


e~k+1=vk+1(vk+1e1)e1...(vk+1ek)ek      (2.3)


Następnie definiujemy


ek+1=e~k+1e~k+1.


Łatwo widać, że e~k+1 jest prostopadły do każdego z wektorów e1,,ek, a zatem układ e1,,ek+1 jest ortonormalny. Łatwo tez widać, że układy v1,,vk+1; e1,,ek+1 rozpinają tę samą podprzestrzeń, powiedzmy Vk+1. Ponadto macierz przejścia od bazy v1,,vk+1 do bazy e1,,ek+1 przestrzeni Vk+1 ma wyznacznik dodatni.

Powyższy proces otrzymywania układu ortonormalnego nazywa się procesem Grama-Schmidta. Jeśli v1,,vk jest układem ortonormalnym, to proces Grama-Schmidta nie zmienia tego układu.

Proces Grama-Schmidta

Z powyższych rozumowań wynika natychmiast

Twierdzenie 2.2

Każda skończenie wymiarowa przestrzeń wektorowa wyposażoną w iloczyn skalarny ma bazę ortonormalną.

Od tego momentu do końca niniejszego wykładu zakładamy, że przestrzenie wektorowe są skończenie wymiarowe.

Jeżeli e1,,en jest bazą ortonormalną przestrzeni euklidesowej V, to wektor vV wyraża się jako kombinacja liniowa wektorów tej bazy następującym wzorem


v=(ve1)e1+...+(ven)en      (2.4)


Aby sprawdzić ten wzór wystarczy pomnożyć skalarnie obie strony tej równości przez kolejne wektory bazy e1,,en.

Rzutowanie prostokątne. Izometrie

Niech dana będzie podprzestrzeń wektorowa U przestrzeni euklidesowej V. Podprzestrzeń ta jest wyposażona w indukowany iloczyn skalarny, tzn. jest to iloczyn skalarny będący zawężeniem iloczynu skalarnego z V do U (dokładniej mówiąc, zawężeniem V×V do U×U). Zdefiniujmy podprzestrzeń


U={wV|  wv=0 dla kazdego vV}.


Łatwo sprawdzić, że U jest podprzestrzenią wektorową. Ponadto, UU={0}. Istotnie, jeśli vUU, to vv=0, a stąd wynika, że v=0.

Niech v1,,vk będzie bazą podprzestrzeni U. Rozrzerzmy tę bazę do bazy v1,,vk,vk+1,,vn przestrzeni V. Zastosujmy do tej bazy proces Grama-Schmidta. Otrzymujemy bazę ortonormalną e1,,en przestrzeni V. Pierwszych k wektorów tej bazy rozpina podprzestrzeń U, pozostałe rozpinają pewne dopełnienie algebraiczne do U i należą do podprzestrzeni U. A zatem U jest dopełnieniem algebraicznym do U. Podprzestrzeń U nazywa się dopełnieniem ortogonalnym (prostopadłym) do U.

Przypomnijmy, że dopełnienia algebraiczne nie są wyznaczone jednoznacznie. Dopełnienie ortogonalne (istniejące tylko w przestrzeni wyposażonej w iloczyn skalarny) jest wyznaczone jednoznacznie. Oto kilka podstawowych własności dopełnienia ortogonalnego:


Dopełnienie ortogonalne (prostopadłe)
Rzutowanie prostokątne


Lemat 3.1

Dla każdych podprzestrzeni U, W przestrzeni euklidesowej V zachodzą następujące związki.

  1. (U)=U.
  2. Jeżeli UW, to WU.
  3. (U+W)=UW.
  4. (UW)=U+W.

Udowodnienie powyższych własności pozostawiamy jako ćwiczenie.

W przestrzeni euklidesowej dla ustalonej podprzestrzeni U mamy


V=UU.


A zatem mamy rzutowanie na U równoległe do U. Ponieważ dopełnienie ortogonalne jest wyznaczone jednoznacznie, więc wymienianie przestrzeni U jest niekonieczne. Używamy określenia " rzutowanie prostokątne na podprzestrzeń U ". Podkreślmy, że możemy mówić o rzutowaniu prostokątnym tylko w przypadku przestrzeni wyposażonych w iloczyn skalarny.

Niech teraz V i W będą przestrzeniami wektorowymi wyposażonymi w iloczyny skalarne - obydwa oznaczane kropką. Mówimy, że odwzorowanie f:VW jest izometrią, jeśli zachowuje iloczyn skalarny, tzn. dla każdych wektorów u,vV zachodzi równość f(uv)=f(u)f(v). Oczywiście odwzorowanie, które zachowuje iloczyn skalarny zachowuje też normę, czyli f(v)=v dla każdej izometrii f.

Twierdzenie 3.2 [O izometrii]

Izometria jest odwzorowaniem liniowym. Co więcej, jest monomorfizmem.

Dowód

Załóżmy, że e1,,en jest bazą ortonormalną przestrzeni wektorowej V. Ponieważ odwzorowanie f zachowuje iloczyn skalarny, więc wektory


f(e1),,f(en)


stanowią układ ortonormalny w W, a więc jest to układ liniowo niezależny. Jest wiec bazą ortonormalną przestrzeni imf. Na podstawie wzoru (2.4) i faktu, że f(v)f(ei)=vei dla każdego i=1,,n, mamy


f(v)=(f(v)f(e1))f(e1)+...+(f(v)f(en))f(en)=(ve1)f(e1)+...+(ven)f(en).


Oznacza to, że jeśli v=λ1e1+...λnen, to


f(v)=λ1f(e1)+...+λnf(en).


Łatwo sprawdzić, że takie odwzorowanie jest liniowe.

Jeśli f(v)=0, to f(v)=0. A zatem v=f(v)=0, czyli v=0. W ten sposób udowodniliśmy monomorficzność f.

Twierdzenie 3.3

Odwzorowanie liniowe zachowujące normę jest izometrią.

Dowód

Niech f będzie odwzorowaniem spełniającym założenia twierdzenia. Zachodzą równości


v+w2=v2+2vw+w2,


f(v+w)2=f(v)+f(w)2=f(v)2+2f(v)f(w)+f(w)2.


Ponieważ f(v+w)=v+w, f(v)=v i f(w)=w, więc f(v)f(w)=vw.

Dowód kolejnego twierdzenia jest standardowy i pozostawiamy go czytelnikowi.

Twierdzenie 3.4

Złożenie izometrii jest izometrią. Jeśli izometria jest bijekcją, to odwzorowanie odwrotne do izometrii jest izometrią.

Niech f:VV będzie izometrią przestrzeni euklidesowej V. Niech e1,,en będzie bazą ortonormalną przestrzeni V. Wiemy, że f(ei)f(ej)=eiejδij, dla i,j=1,,n. Jeśli więc A jest macierzą f przy bazie ortonormalnej, to


A*A=I.


Macierz spełniającą powyższy warunek nazywa się macierzą ortogonalną. Macierz taką można też traktować jako izometrię przestrzeni n wyposażonej w standardowy iloczyn skalarny. Zbiór wszystkich macierzy ortogonalnych wymiarów n na n stanowi podgrupę grupy ogólnej GL(n;). Podgrupę tę nazywa się grupą ortogonalną i oznacza przez O(n).

Dla macierzy ortogonalnej mamy detA*detA=1. A zatem (detA)2=1, czyli detA=±1.

Zbiór wszystkich macierzy ortogonalnych wymiarów n na n o wyznaczniku dodatnim (czyli o wyznaczniku 1) stanowi podgrupę grupy ortogonalnej.