Iloczyn skalarny
Zaczniemy od definicji iloczynu skalarnego
Definicja 1.1 [Iloczyn Skalarny]
Niech
będzie przestrzenią wektorową nad ciałem
. Odwzorowanie
nazywa się iloczynem skalarnym, jeśli spełnia trzy następujące warunki:
S1) jest dwuliniowe,
S2) jest symetryczne,
S3) jest dodatnio określone, tzn. dla każdego
zachodzi
nierówność
i
wtedy i tylko wtedy, gdy
.
Wartość iloczynu skalarnego na wektorach
oznaczamy także
przez
lub
. Jak zwykle kropkę często pomijamy w zapisie. Nazwa iloczyn skalarny pochodzi stąd, że wynikiem takiego
mnożenia jest skalar. Zwróćmy także uwagę na to, że wybór ciała
liczb rzeczywistych jest tutaj nieprzypadkowy. W innych ciałach
nie mamy skalarów większych od zera.
Zbierzemy teraz kilka najważniejszych przykładów iloczynów
skalarnych.
Przykład 1.2
W przestrzeni
mamy tzw. standardowy (lub kanoniczny)
iloczyn skalarny. Mianowicie, dla wektorów
definiujemy
Ogólniej, niech
będą dowolnymi liczbami dodatnimi. Definiujemy iloczyn skalarny
Przykład 1.3
Rozważmy przestrzeń funkcji ciągłych określonych na przedziale
. Definiujemy iloczyn skalarny
Przykład 1.4
Niech
będzie bazą przestrzeni wektorowej
nad ciałem
. Definiujemy iloczyn skalarny formułą
gdzie
,
są współrzędnymi wektorów
i
w danej bazie.
Istotne w tym przykładzie jest to, że każda skończenie wymiarowa przestrzeń wektorowa nad ciałem
może być łatwo wyposażona w
iloczyn skalarny.
Definicja 1.5 [Norma]
Normą na przestrzeni wektorowej
nad ciałem
nazywamy funkcję
która spełnia warunki
N 1) dla każdego wektora
i liczby rzeczywistej
zachodzi równość
,
N 2) zachodzi nierówność trójkąta, tzn. dla każdych wektorów
mamy
Iloczyn skalarny dany w przestrzeni
wyznacza normę w tej
przestrzeni. Mianowicie, definiujemy
(1.1)
Normę wektora nazywamy też jego długością. Stosowany jest zapis
, który oznacza
lub, co na jedno wychodzi,
.
Sprawdzenie, że funkcja zdefiniowana formułą (1.1) spełnia warunki N1) i N2) jest natychmiastowe. Warunek trójkąta sprawdzimy po udowodnieniu następującej nierówności Schwarza.
Twierdzenie 1.5 [Nierówność Schwarza]
Dla funkcji określonej wzorem (
1.1) i każdych dwóch wektorów

zachodzi nierówność
(1.2)
Równość w powyższej nierówności zachodzi wtedy i tylko wtedy, gdy wektory
,
są liniowo zależne.
Dowód
Jeśli któryś z wektorów
,
jest zerowy, to twierdzenie jest oczywiste. Załóżmy więc, że wektory te są niezerowe.
Rozważmy funkcję zmiennej rzeczywistej
Funkcja ta przybiera wartości nieujemne. Z drugiej strony mamy
A zatem funkcja
jest trójmianem kwadratowym przyjmującym
wartości nieujemne, którego współczynnik przy
jest dodatni.
Oznacza to, że wyróżnik
jest niedodatni. Wobec tego
czyli
. Po
spierwiastkowaniu tej nierówności dostajemy nierówność Schwarza.
Dla udowodnienia drugiej tezy zauważmy najpierw, że jeśli

, to oczywiście w (
1.2) mamy równość. Odwrotnie, równość w (
1.2) oznacza, że wyróżnik trójmianu

jest równy

i, co za tym idzie, istnieje

, takie, że

. To zaś oznacza, że

, czyli

,

są liniowo zależne.

Korzystając, miedzy innymi, z nierowności Schwarza otrzymujemy teraz, dla dowolnych wektorów
,
, ciąg równości i nierówności
Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \aligned\Vert v+w \Vert ^2&=& (v+w)(v+w) =\Vert v\Vert ^2 +2v\cdot w +\Vert w\Vert ^2\\ &\le & \Vert v\Vert ^2 +2 | v\cdot w | +\Vert w\Vert ^2\le \Vert v\Vert ^2 +2 \Vert v\Vert \Vert w \Vert +\Vert w\Vert ^2\\ &=& (\Vert v\Vert +\Vert w\Vert )^2\endaligned}
Udowodniliśmy więc nierówność trójkąta N 2) dla funkcji (1.1).
Przy okazji zauważmy, że otrzymaliśmy twierdzenie Pitagorasa. Mianowicie, jeśli wektory
,
są do siebie prostopadłe, czyli
, to
Jeśli wektory
,
sa niezerowe, to liczbę rzeczywistą
taką, że
nazywamy kątem między wektorami
i
.
Układy ortogonalne. Proces Grama - Schmidta. Bazy ortonormalne
Mówimy, że wektory są do siebie prostopadłe (ortogonalne), jeśli ich iloczyn skalarny jest równy
. Ogólniej, układ wektorów
nazywa się układem ortogonalnym, jeśli każde dwa wektory tego układu są do siebie prostopadłe, tzn.
dla
. Oczywiście wektor zerowy jest prostopadły do każdego wektora. Dowolny zbiór (niekoniecznie skończony) nazywa się ortogonalny, jeśli każde dwa wektory tego zbiory są ortogonalne.
Mamy następujący
Lemat 2.1
Ortogonalny i nie zawierający zera układ wektorów
jest liniowo niezależny.
Dowód
Niech

. Obie strony tej równości pomnóżmy skalarnie przez

, dla

. Otrzymujemy równość

, a stąd

.

Wektor
nazywa się jednostkowym, jeśli
. Układ wektorów
nazywa się ortonormalnym, jeśli każdy z tych wektorów jest jednostkowy, a cały układ jest ortogonalny.
Jeśli
jest wektorem niezerowym, to
jest wektorem jednostkowym. Mówimy, że wektor
został znormalizowany.
Niech
będzie pewnym układem liniowo niezależnym
przestrzeni wektorowej
wyposażonej w iloczyn skalarny.
Niech
Wektor
jest jednostkowy i generuje tę samą przestrzeń co
. Zdefiniujmy teraz wektor
następująco
Łatwo sprawdzić, że wektor ten jest prostopadły do
. Ponadto
układ wektorów
rozpina tę samą podprzestrzeń co
układ wektorów
. Co więcej, jeśli oznaczymy przez
tę podprzestrzeń, to
oraz
są takimi bazami tej przestrzeni
, że macierz przejścia od bazy
do bazy
ma wyznacznik dodatni.
Definiujemy teraz
Oczywiście układy
i
rozpinają tę samą
podprzestrzeń
, układ
jest ortonormalny a macierz przejścia od bazy
do bazy
przestrzeni
ma wyznacznik dodatni.
Załóżmy, że zdefiniowaliśmy już
kolejnych wektorów
takich, że układy
i
rozpinają tę samą podprzestrzeń
, układ
jest ortonormalny a macierz przejścia od bazy
do bazy
ma wyznacznik dodatni. Definiujemy wektor
wzorem
(2.3)
Następnie definiujemy
Łatwo widać, że
jest prostopadły do każdego z
wektorów
, a zatem układ
jest ortonormalny. Łatwo tez widać, że układy
;
rozpinają tę samą podprzestrzeń, powiedzmy
. Ponadto macierz przejścia od bazy
do bazy
przestrzeni
ma wyznacznik dodatni.
Powyższy proces otrzymywania układu ortonormalnego nazywa się procesem Grama-Schmidta. Jeśli
jest układem ortonormalnym, to proces Grama-Schmidta nie zmienia tego układu.
Z powyższych rozumowań wynika natychmiast
Twierdzenie 2.2
Każda skończenie wymiarowa przestrzeń wektorowa wyposażoną w iloczyn skalarny ma bazę ortonormalną.
Od tego momentu do końca niniejszego wykładu zakładamy, że przestrzenie wektorowe są skończenie wymiarowe.
Jeżeli
jest bazą ortonormalną przestrzeni euklidesowej
, to wektor
wyraża się jako kombinacja liniowa wektorów tej bazy następującym wzorem
(2.4)
Aby sprawdzić ten wzór wystarczy pomnożyć skalarnie obie strony tej równości przez kolejne wektory bazy
.
Rzutowanie prostokątne. Izometrie
Niech dana będzie podprzestrzeń wektorowa
przestrzeni euklidesowej
. Podprzestrzeń ta jest wyposażona w indukowany
iloczyn skalarny, tzn. jest to iloczyn skalarny będący zawężeniem iloczynu skalarnego z
do
(dokładniej mówiąc, zawężeniem
do
). Zdefiniujmy podprzestrzeń
Łatwo sprawdzić, że
jest podprzestrzenią wektorową. Ponadto,
. Istotnie, jeśli
, to
, a stąd wynika, że
.
Niech
będzie bazą podprzestrzeni
. Rozrzerzmy tę bazę do bazy
przestrzeni
. Zastosujmy do tej bazy proces Grama-Schmidta.
Otrzymujemy bazę ortonormalną
przestrzeni
. Pierwszych
wektorów tej bazy rozpina podprzestrzeń
, pozostałe rozpinają pewne dopełnienie algebraiczne do
i należą do podprzestrzeni
. A zatem
jest dopełnieniem algebraicznym do
. Podprzestrzeń
nazywa się dopełnieniem ortogonalnym (prostopadłym) do
.
Przypomnijmy, że dopełnienia algebraiczne nie są wyznaczone jednoznacznie. Dopełnienie ortogonalne (istniejące tylko w przestrzeni wyposażonej w iloczyn skalarny) jest wyznaczone jednoznacznie. Oto kilka podstawowych własności dopełnienia ortogonalnego:
Lemat 3.1
Udowodnienie powyższych własności pozostawiamy jako ćwiczenie.
W przestrzeni euklidesowej dla ustalonej podprzestrzeni
mamy
A zatem mamy rzutowanie na
równoległe do
.
Ponieważ dopełnienie ortogonalne jest wyznaczone jednoznacznie, więc wymienianie przestrzeni
jest niekonieczne. Używamy określenia " rzutowanie prostokątne na podprzestrzeń
". Podkreślmy, że możemy mówić o rzutowaniu prostokątnym tylko w przypadku przestrzeni wyposażonych w iloczyn skalarny.
Niech teraz
i
będą przestrzeniami wektorowymi wyposażonymi w iloczyny skalarne - obydwa oznaczane kropką. Mówimy, że
odwzorowanie
jest izometrią, jeśli
zachowuje iloczyn skalarny, tzn. dla każdych wektorów
zachodzi równość
. Oczywiście odwzorowanie, które zachowuje iloczyn skalarny zachowuje też normę, czyli
dla każdej izometrii
.
Twierdzenie 3.2 [O izometrii]
Izometria jest odwzorowaniem liniowym. Co więcej, jest monomorfizmem.
Dowód
Załóżmy, że
jest bazą ortonormalną przestrzeni
wektorowej
. Ponieważ odwzorowanie
zachowuje iloczyn skalarny, więc wektory
stanowią układ ortonormalny w
, a więc jest to układ liniowo niezależny. Jest wiec bazą ortonormalną przestrzeni
. Na podstawie wzoru (2.4) i faktu, że
dla każdego
, mamy
Parser nie mógł rozpoznać (SVG (MathML może zostać włączone przez wtyczkę w przeglądarce): Nieprawidłowa odpowiedź („Math extension cannot connect to Restbase.”) z serwera „https://wazniak.mimuw.edu.pl/api/rest_v1/”:): {\displaystyle \alignedf(v)&=&(f(v)\cdot f(e_1))f(e_1) +...+(f(v)\cdot f(e_n))f(e_n)\\ &= &(v\cdot e_1)f(e_1)+...+(v\cdot e_n)f(e_n). \endaligned}
Oznacza to, że jeśli
, to
Łatwo sprawdzić, że takie odwzorowanie jest liniowe.
Jeśli

, to

. A zatem

, czyli

. W ten sposób udowodniliśmy monomorficzność

.

Twierdzenie 3.3
Odwzorowanie liniowe zachowujące normę jest izometrią.
Dowód
Niech
będzie odwzorowaniem spełniającym założenia twierdzenia. Zachodzą równości
Ponieważ

,

i

, więc

.

Dowód kolejnego twierdzenia jest standardowy i pozostawiamy go czytelnikowi.
Twierdzenie 3.4
Złożenie izometrii jest izometrią. Jeśli izometria jest bijekcją, to odwzorowanie odwrotne do izometrii jest izometrią.
Niech
będzie izometrią przestrzeni euklidesowej
. Niech
będzie bazą ortonormalną przestrzeni
. Wiemy, że
, dla
. Jeśli więc
jest macierzą
przy bazie ortonormalnej, to
Macierz spełniającą powyższy warunek nazywa się macierzą ortogonalną. Macierz taką można też traktować jako izometrię przestrzeni
wyposażonej w standardowy iloczyn skalarny. Zbiór wszystkich macierzy ortogonalnych wymiarów
na
stanowi podgrupę grupy ogólnej
. Podgrupę tę nazywa się grupą ortogonalną i oznacza przez
.
Dla macierzy ortogonalnej mamy
. A
zatem
, czyli
.
Zbiór wszystkich macierzy ortogonalnych wymiarów
na
o wyznaczniku dodatnim (czyli o wyznaczniku 1) stanowi podgrupę
grupy ortogonalnej.