Algebra liniowa z geometrią analityczną/Wykład 10: Euklidesowe przestrzenie wektorowe

Z Studia Informatyczne
Przejdź do nawigacjiPrzejdź do wyszukiwania

Iloczyn skalarny

Zaczniemy od definicji iloczynu skalarnego


Definicja 1.1 [Iloczyn Skalarny]

Niech będzie przestrzenią wektorową nad ciałem . Odwzorowanie



nazywa się iloczynem skalarnym, jeśli spełnia trzy następujące warunki:

S1) jest dwuliniowe,
S2) jest symetryczne,
S3) jest dodatnio określone, tzn. dla każdego zachodzi

nierówność i wtedy i tylko wtedy, gdy .

Wartość iloczynu skalarnego na wektorach oznaczamy także przez lub . Jak zwykle kropkę często pomijamy w zapisie. Nazwa iloczyn skalarny pochodzi stąd, że wynikiem takiego mnożenia jest skalar. Zwróćmy także uwagę na to, że wybór ciała liczb rzeczywistych jest tutaj nieprzypadkowy. W innych ciałach nie mamy skalarów większych od zera.

Zbierzemy teraz kilka najważniejszych przykładów iloczynów skalarnych.

Przykład 1.2

W przestrzeni mamy tzw. standardowy (lub kanoniczny) iloczyn skalarny. Mianowicie, dla wektorów definiujemy



Ogólniej, niech będą dowolnymi liczbami dodatnimi. Definiujemy iloczyn skalarny



Przykład 1.3

Rozważmy przestrzeń funkcji ciągłych określonych na przedziale . Definiujemy iloczyn skalarny



Przykład 1.4

Niech będzie bazą przestrzeni wektorowej nad ciałem . Definiujemy iloczyn skalarny formułą



gdzie , są współrzędnymi wektorów i w danej bazie.

Istotne w tym przykładzie jest to, że każda skończenie wymiarowa przestrzeń wektorowa nad ciałem może być łatwo wyposażona w iloczyn skalarny.

Definicja 1.5 [Norma]

Normą na przestrzeni wektorowej nad ciałem nazywamy funkcję



która spełnia warunki

N 1) dla każdego wektora i liczby rzeczywistej zachodzi równość ,
N 2) zachodzi nierówność trójkąta, tzn. dla każdych wektorów mamy



Iloczyn skalarny dany w przestrzeni wyznacza normę w tej przestrzeni. Mianowicie, definiujemy


     (1.1)


Normę wektora nazywamy też jego długością. Stosowany jest zapis , który oznacza lub, co na jedno wychodzi, .

Sprawdzenie, że funkcja zdefiniowana formułą (1.1) spełnia warunki N1) i N2) jest natychmiastowe. Warunek trójkąta sprawdzimy po udowodnieniu następującej nierówności Schwarza.

Twierdzenie 1.5 [Nierówność Schwarza]

Dla funkcji określonej wzorem (1.1) i każdych dwóch wektorów zachodzi nierówność


     (1.2)


Równość w powyższej nierówności zachodzi wtedy i tylko wtedy, gdy wektory , są liniowo zależne.

Dowód

Jeśli któryś z wektorów , jest zerowy, to twierdzenie jest oczywiste. Załóżmy więc, że wektory te są niezerowe.

Rozważmy funkcję zmiennej rzeczywistej



Funkcja ta przybiera wartości nieujemne. Z drugiej strony mamy



A zatem funkcja jest trójmianem kwadratowym przyjmującym wartości nieujemne, którego współczynnik przy jest dodatni. Oznacza to, że wyróżnik jest niedodatni. Wobec tego



czyli . Po spierwiastkowaniu tej nierówności dostajemy nierówność Schwarza.

Dla udowodnienia drugiej tezy zauważmy najpierw, że jeśli , to oczywiście w (1.2) mamy równość. Odwrotnie, równość w (1.2) oznacza, że wyróżnik trójmianu jest równy i, co za tym idzie, istnieje , takie, że . To zaś oznacza, że , czyli , są liniowo zależne. End of proof.gif

Korzystając, miedzy innymi, z nierowności Schwarza otrzymujemy teraz, dla dowolnych wektorów , , ciąg równości i nierówności



Udowodniliśmy więc nierówność trójkąta N 2) dla funkcji (1.1).

Przy okazji zauważmy, że otrzymaliśmy twierdzenie Pitagorasa. Mianowicie, jeśli wektory , są do siebie prostopadłe, czyli , to



Jeśli wektory , sa niezerowe, to liczbę rzeczywistą taką, że



nazywamy kątem między wektorami i .

Układy ortogonalne. Proces Grama - Schmidta. Bazy ortonormalne

Mówimy, że wektory są do siebie prostopadłe (ortogonalne), jeśli ich iloczyn skalarny jest równy . Ogólniej, układ wektorów nazywa się układem ortogonalnym, jeśli każde dwa wektory tego układu są do siebie prostopadłe, tzn. dla . Oczywiście wektor zerowy jest prostopadły do każdego wektora. Dowolny zbiór (niekoniecznie skończony) nazywa się ortogonalny, jeśli każde dwa wektory tego zbiory są ortogonalne.

Mamy następujący

Lemat 2.1

Ortogonalny i nie zawierający zera układ wektorów jest liniowo niezależny.

Dowód

Niech . Obie strony tej równości pomnóżmy skalarnie przez , dla . Otrzymujemy równość , a stąd . End of proof.gif

Wektor nazywa się jednostkowym, jeśli . Układ wektorów nazywa się ortonormalnym, jeśli każdy z tych wektorów jest jednostkowy, a cały układ jest ortogonalny. Jeśli jest wektorem niezerowym, to



jest wektorem jednostkowym. Mówimy, że wektor został znormalizowany.

Niech będzie pewnym układem liniowo niezależnym przestrzeni wektorowej wyposażonej w iloczyn skalarny. Niech

Wektor jest jednostkowy i generuje tę samą przestrzeń co . Zdefiniujmy teraz wektor następująco



Łatwo sprawdzić, że wektor ten jest prostopadły do . Ponadto układ wektorów rozpina tę samą podprzestrzeń co układ wektorów . Co więcej, jeśli oznaczymy przez tę podprzestrzeń, to oraz są takimi bazami tej przestrzeni , że macierz przejścia od bazy do bazy ma wyznacznik dodatni.

Definiujemy teraz



Oczywiście układy i rozpinają tę samą podprzestrzeń , układ jest ortonormalny a macierz przejścia od bazy do bazy przestrzeni ma wyznacznik dodatni.

Załóżmy, że zdefiniowaliśmy już kolejnych wektorów takich, że układy i rozpinają tę samą podprzestrzeń , układ jest ortonormalny a macierz przejścia od bazy do bazy ma wyznacznik dodatni. Definiujemy wektor wzorem


     (2.3)


Następnie definiujemy



Łatwo widać, że jest prostopadły do każdego z wektorów , a zatem układ jest ortonormalny. Łatwo tez widać, że układy ; rozpinają tę samą podprzestrzeń, powiedzmy . Ponadto macierz przejścia od bazy do bazy przestrzeni ma wyznacznik dodatni.

Powyższy proces otrzymywania układu ortonormalnego nazywa się procesem Grama-Schmidta. Jeśli jest układem ortonormalnym, to proces Grama-Schmidta nie zmienia tego układu.

Z powyższych rozumowań wynika natychmiast

Twierdzenie 2.2

Każda skończenie wymiarowa przestrzeń wektorowa wyposażoną w iloczyn skalarny ma bazę ortonormalną.

Od tego momentu do końca niniejszego wykładu zakładamy, że przestrzenie wektorowe są skończenie wymiarowe.

Jeżeli jest bazą ortonormalną przestrzeni euklidesowej , to wektor wyraża się jako kombinacja liniowa wektorów tej bazy następującym wzorem


     (2.4)


Aby sprawdzić ten wzór wystarczy pomnożyć skalarnie obie strony tej równości przez kolejne wektory bazy .

Rzutowanie prostokątne. Izometrie

Niech dana będzie podprzestrzeń wektorowa przestrzeni euklidesowej . Podprzestrzeń ta jest wyposażona w indukowany iloczyn skalarny, tzn. jest to iloczyn skalarny będący zawężeniem iloczynu skalarnego z do (dokładniej mówiąc, zawężeniem do ). Zdefiniujmy podprzestrzeń



Łatwo sprawdzić, że jest podprzestrzenią wektorową. Ponadto, . Istotnie, jeśli , to , a stąd wynika, że .

Niech będzie bazą podprzestrzeni . Rozrzerzmy tę bazę do bazy przestrzeni . Zastosujmy do tej bazy proces Grama-Schmidta. Otrzymujemy bazę ortonormalną przestrzeni . Pierwszych wektorów tej bazy rozpina podprzestrzeń , pozostałe rozpinają pewne dopełnienie algebraiczne do i należą do podprzestrzeni . A zatem jest dopełnieniem algebraicznym do . Podprzestrzeń nazywa się dopełnieniem ortogonalnym (prostopadłym) do .

Przypomnijmy, że dopełnienia algebraiczne nie są wyznaczone jednoznacznie. Dopełnienie ortogonalne (istniejące tylko w przestrzeni wyposażonej w iloczyn skalarny) jest wyznaczone jednoznacznie. Oto kilka podstawowych własności dopełnienia ortogonalnego:



Lemat 3.1

Dla każdych podprzestrzeni , przestrzeni euklidesowej zachodzą następujące związki.

  1. .
  2. Jeżeli , to .
  3. .
  4. .

Udowodnienie powyższych własności pozostawiamy jako ćwiczenie.

W przestrzeni euklidesowej dla ustalonej podprzestrzeni mamy



A zatem mamy rzutowanie na równoległe do . Ponieważ dopełnienie ortogonalne jest wyznaczone jednoznacznie, więc wymienianie przestrzeni jest niekonieczne. Używamy określenia " rzutowanie prostokątne na podprzestrzeń ". Podkreślmy, że możemy mówić o rzutowaniu prostokątnym tylko w przypadku przestrzeni wyposażonych w iloczyn skalarny.

Niech teraz i będą przestrzeniami wektorowymi wyposażonymi w iloczyny skalarne - obydwa oznaczane kropką. Mówimy, że odwzorowanie jest izometrią, jeśli zachowuje iloczyn skalarny, tzn. dla każdych wektorów zachodzi równość . Oczywiście odwzorowanie, które zachowuje iloczyn skalarny zachowuje też normę, czyli dla każdej izometrii .

Twierdzenie 3.2 [O izometrii]

Izometria jest odwzorowaniem liniowym. Co więcej, jest monomorfizmem.

Dowód

Załóżmy, że jest bazą ortonormalną przestrzeni wektorowej . Ponieważ odwzorowanie zachowuje iloczyn skalarny, więc wektory



stanowią układ ortonormalny w , a więc jest to układ liniowo niezależny. Jest wiec bazą ortonormalną przestrzeni . Na podstawie wzoru (2.4) i faktu, że dla każdego , mamy



Oznacza to, że jeśli , to



Łatwo sprawdzić, że takie odwzorowanie jest liniowe.

Jeśli , to . A zatem , czyli . W ten sposób udowodniliśmy monomorficzność . End of proof.gif

Twierdzenie 3.3

Odwzorowanie liniowe zachowujące normę jest izometrią.

Dowód

Niech będzie odwzorowaniem spełniającym założenia twierdzenia. Zachodzą równości




Ponieważ , i , więc . End of proof.gif

Dowód kolejnego twierdzenia jest standardowy i pozostawiamy go czytelnikowi.

Twierdzenie 3.4

Złożenie izometrii jest izometrią. Jeśli izometria jest bijekcją, to odwzorowanie odwrotne do izometrii jest izometrią.

Niech będzie izometrią przestrzeni euklidesowej . Niech będzie bazą ortonormalną przestrzeni . Wiemy, że , dla . Jeśli więc jest macierzą przy bazie ortonormalnej, to



Macierz spełniającą powyższy warunek nazywa się macierzą ortogonalną. Macierz taką można też traktować jako izometrię przestrzeni wyposażonej w standardowy iloczyn skalarny. Zbiór wszystkich macierzy ortogonalnych wymiarów na stanowi podgrupę grupy ogólnej . Podgrupę tę nazywa się grupą ortogonalną i oznacza przez .

Dla macierzy ortogonalnej mamy . A zatem , czyli .

Zbiór wszystkich macierzy ortogonalnych wymiarów na o wyznaczniku dodatnim (czyli o wyznaczniku 1) stanowi podgrupę grupy ortogonalnej.