Algebra liniowa z geometrią analityczną/Wykład 10: Euklidesowe przestrzenie wektorowe: Różnice pomiędzy wersjami
(Nie pokazano 18 wersji utworzonych przez 3 użytkowników) | |||
Linia 1: | Linia 1: | ||
− | + | ==Iloczyn skalarny== | |
+ | |||
+ | Zaczniemy od definicji iloczynu skalarnego | ||
+ | |||
+ | |||
+ | {{definicja|1.1 [Iloczyn Skalarny]|def 1.1| | ||
+ | Niech <math>V</math> będzie przestrzenią wektorową nad ciałem <math>{\mathbb R}</math>. Odwzorowanie | ||
+ | |||
+ | |||
+ | <center><math>g: V\times V\longrightarrow {\mathbb R}</math></center> | ||
+ | |||
+ | |||
+ | nazywa się iloczynem skalarnym, jeśli spełnia trzy następujące warunki: | ||
+ | |||
+ | ;S1) jest dwuliniowe, | ||
+ | ;S2) jest symetryczne, | ||
+ | ;S3) jest dodatnio określone, tzn. dla każdego <math>v\in V</math> zachodzi | ||
+ | nierówność <math>g(v,v)\ge 0</math> i <math>g(v,v)=0 </math> wtedy i tylko wtedy, gdy <math>v=0</math>. | ||
+ | }} | ||
+ | |||
+ | Wartość iloczynu skalarnego na wektorach <math>v,w</math> oznaczamy także | ||
+ | przez <math><v,w></math> lub <math>v\cdot w</math>. Jak zwykle kropkę często pomijamy w zapisie. Nazwa iloczyn skalarny pochodzi stąd, że wynikiem takiego | ||
+ | mnożenia jest skalar. Zwróćmy także uwagę na to, że wybór ciała | ||
+ | liczb rzeczywistych jest tutaj nieprzypadkowy. W innych ciałach | ||
+ | nie mamy skalarów większych od zera. | ||
+ | |||
+ | Zbierzemy teraz kilka najważniejszych przykładów iloczynów | ||
+ | skalarnych. | ||
+ | |||
+ | {{przyklad|1.2|przy 1.2| | ||
+ | W przestrzeni <math>{\mathbb R} ^n</math> mamy tzw. standardowy (lub kanoniczny) | ||
+ | iloczyn skalarny. Mianowicie, dla wektorów <math>v=(v_1,.... v_n),\ \ w=(w_1,...,w_n)\in {\mathbb R} ^n</math> definiujemy | ||
+ | |||
+ | |||
+ | <center><math>v\cdot w = v_1w_1+...+v_nw_n.</math></center> | ||
+ | |||
+ | |||
+ | Ogólniej, niech <math>\lambda _1,...,\lambda _n</math> będą dowolnymi liczbami dodatnimi. Definiujemy iloczyn skalarny | ||
+ | |||
+ | |||
+ | <center><math>v\cdot w =\lambda _1v_1w_1+...+\lambda _nv_nw_n.</math></center> | ||
+ | |||
+ | |||
+ | }} | ||
+ | |||
+ | {{przyklad|1.3|przy 1.3| | ||
+ | Rozważmy przestrzeń funkcji ciągłych określonych na przedziale <math>[a,b]</math>. Definiujemy iloczyn skalarny | ||
+ | |||
+ | |||
+ | <center><math>\displaystyle <f,h>=\int _a^b fh.</math></center> | ||
+ | |||
+ | |||
+ | }} | ||
+ | |||
+ | {{przyklad|1.4|przy 1.4| | ||
+ | Niech <math>e_1,...,e_n</math> będzie bazą przestrzeni wektorowej <math>V</math> nad ciałem <math>{\mathbb R}</math>. Definiujemy iloczyn skalarny formułą | ||
+ | |||
+ | |||
+ | <center><math>v\cdot w =v_1w_1+...+v_nw_n,</math></center> | ||
+ | |||
+ | |||
+ | gdzie <math>(v_1,...,v_n)</math>, <math>(w_1,...,w_n)</math> są współrzędnymi wektorów <math>v</math> i <math>w</math> w danej bazie. | ||
+ | |||
+ | Istotne w tym przykładzie jest to, że każda skończenie wymiarowa przestrzeń wektorowa nad ciałem <math>{\mathbb R}</math> może być łatwo wyposażona w | ||
+ | iloczyn skalarny. | ||
+ | }} | ||
+ | |||
+ | {{definicja|1.5 [Norma]|def 1.5| | ||
+ | Normą na przestrzeni wektorowej <math>V</math> nad ciałem <math>{\mathbb R}</math> nazywamy funkcję | ||
+ | |||
+ | |||
+ | <center><math>V\ni v\longrightarrow \Vert v\Vert \in [0,\infty )\subset {\mathbb R} ,</math></center> | ||
+ | |||
+ | |||
+ | która spełnia warunki | ||
+ | |||
+ | ; N 1) dla każdego wektora <math>v\in V</math> i liczby rzeczywistej <math>\lambda</math> zachodzi równość <math>\Vert \lambda v\Vert =|\lambda |\Vert v\Vert</math>, | ||
+ | ; N 2) zachodzi nierówność trójkąta, tzn. dla każdych wektorów <math>v,w\in V</math> mamy | ||
+ | |||
+ | |||
+ | <center><math>\Vert v+w\Vert \le \Vert v\Vert | ||
+ | +\Vert w\Vert .</math></center> | ||
+ | |||
+ | |||
+ | }} | ||
+ | |||
+ | Iloczyn skalarny dany w przestrzeni <math>V</math> wyznacza normę w tej | ||
+ | przestrzeni. Mianowicie, definiujemy | ||
+ | |||
+ | |||
+ | {{wzor|norma|1.1| | ||
+ | <math> | ||
+ | \Vert v\Vert =\sqrt {v\cdot v} . | ||
+ | </math>}} | ||
+ | |||
+ | |||
+ | Normę wektora nazywamy też jego długością. Stosowany jest zapis <math>v^2</math>, który oznacza <math>v\cdot v</math> lub, co na jedno wychodzi, <math>\Vert v\Vert ^2</math>. | ||
+ | |||
+ | Sprawdzenie, że funkcja zdefiniowana formułą ([[#norma|1.1]]) spełnia warunki N1) i N2) jest natychmiastowe. Warunek trójkąta sprawdzimy po udowodnieniu następującej nierówności Schwarza. | ||
+ | |||
+ | {{twierdzenie|1.5 [Nierówność Schwarza]|tw 1.5| | ||
+ | Dla funkcji określonej wzorem ([[#norma|1.1]]) i każdych dwóch wektorów <math>v,w\in V</math> zachodzi nierówność}} | ||
+ | |||
+ | |||
+ | {{wzor|schwarz|1.2| | ||
+ | <math> | ||
+ | | v\cdot w |\le \Vert v\Vert\Vert w\Vert . | ||
+ | </math>}} | ||
+ | |||
+ | |||
+ | Równość w powyższej nierówności zachodzi wtedy i tylko wtedy, gdy wektory <math>v</math>, <math>w</math> są liniowo zależne. | ||
+ | |||
+ | {{dowod||| | ||
+ | Jeśli któryś z wektorów <math>v</math>, <math>w</math> jest zerowy, to twierdzenie jest oczywiste. Załóżmy więc, że wektory te są niezerowe. | ||
+ | |||
+ | Rozważmy funkcję zmiennej rzeczywistej <math>t</math> | ||
+ | |||
+ | |||
+ | <center><math>f(t)= \Vert tv +w\Vert ^2.</math></center> | ||
+ | |||
+ | |||
+ | Funkcja ta przybiera wartości nieujemne. Z drugiej strony mamy | ||
+ | |||
+ | |||
+ | <center><math>f(t)=t^2\Vert v\Vert ^2 +2t(v\cdot w) +\Vert w \Vert ^2.</math></center> | ||
+ | |||
+ | |||
+ | A zatem funkcja <math>f(t)</math> jest trójmianem kwadratowym przyjmującym | ||
+ | wartości nieujemne, którego współczynnik przy <math>t^2</math> jest dodatni. | ||
+ | Oznacza to, że wyróżnik <math>\Delta</math> jest niedodatni. Wobec tego | ||
+ | |||
+ | |||
+ | <center><math>\Delta =4(v\cdot w) ^2 -4\Vert v\Vert ^2\Vert w\Vert ^2\le 0,</math></center> | ||
+ | |||
+ | |||
+ | czyli <math>(v\cdot w) ^2\le \Vert v\Vert ^2 \Vert w\Vert ^2</math>. Po | ||
+ | spierwiastkowaniu tej nierówności dostajemy nierówność Schwarza. | ||
+ | |||
+ | Dla udowodnienia drugiej tezy zauważmy najpierw, że jeśli <math>v=\lambda w</math>, to oczywiście w ([[#schwarz|1.2]]) mamy równość. Odwrotnie, równość w ([[#schwarz|1.2]]) oznacza, że wyróżnik trójmianu <math>f(t)</math> jest równy <math>0</math> i, co za tym idzie, istnieje <math>t_o</math>, takie, że <math>f(t_o)=0</math>. To zaś oznacza, że <math>t_ov+w=0</math>, czyli <math>v</math>, <math>w</math> są liniowo zależne.}} | ||
+ | |||
+ | Korzystając, miedzy innymi, z nierowności Schwarza otrzymujemy teraz, dla dowolnych wektorów <math>v</math>, <math>w</math>, ciąg równości i nierówności | ||
+ | |||
+ | |||
+ | <center><math>\begin{align}\Vert v+w \Vert ^2&= (v+w)(v+w) =\Vert v\Vert ^2 +2v\cdot w | ||
+ | +\Vert w\Vert ^2\\ &\le \Vert v\Vert ^2 +2 | v\cdot w | +\Vert | ||
+ | w\Vert ^2\le \Vert | ||
+ | v\Vert ^2 +2 \Vert v\Vert \Vert w \Vert +\Vert w\Vert ^2\\ | ||
+ | &= (\Vert v\Vert +\Vert w\Vert )^2\end{align}</math></center> | ||
+ | |||
+ | |||
+ | Udowodniliśmy więc nierówność trójkąta N 2) dla funkcji ([[#norma|1.1]]). | ||
+ | |||
+ | Przy okazji zauważmy, że otrzymaliśmy twierdzenie Pitagorasa. Mianowicie, jeśli wektory <math>v</math>, <math>w</math> są do siebie prostopadłe, czyli <math>v\cdot w=0</math>, to | ||
+ | |||
+ | |||
+ | <center><math>\Vert v+w\Vert ^2 =\Vert v\Vert ^2 +\Vert w\Vert ^2.</math></center> | ||
+ | |||
+ | |||
+ | Jeśli wektory <math>v</math>, <math>w</math> sa niezerowe, to liczbę rzeczywistą <math>\alpha\in [0,\pi )</math> taką, że | ||
+ | |||
+ | |||
+ | <center><math>\cos \alpha ={{v\cdot w}\over {\Vert v\Vert \Vert w\Vert}},</math></center> | ||
+ | |||
+ | |||
+ | nazywamy ''kątem między wektorami <math>v</math> i <math>w</math>''. | ||
+ | |||
+ | ==Układy ortogonalne. Proces Grama - Schmidta. Bazy ortonormalne== | ||
+ | |||
+ | Mówimy, że wektory są do siebie ''prostopadłe (ortogonalne)'', jeśli ich iloczyn skalarny jest równy <math>0</math>. Ogólniej, układ wektorów <math>v_1,..., v_n</math> nazywa się układem ortogonalnym, jeśli każde dwa wektory tego układu są do siebie prostopadłe, tzn. <math>v_i\cdot v_j=0</math> dla <math>i\ne j</math>. Oczywiście wektor zerowy jest prostopadły do każdego wektora. Dowolny zbiór (niekoniecznie skończony) nazywa się ortogonalny, jeśli każde dwa wektory tego zbiory są ortogonalne. | ||
+ | |||
+ | [[File:ag_10_1a.mp4|253x253px|thumb|right|Wektory ortogonalne (prostopadłe)]] | ||
+ | |||
+ | Mamy następujący | ||
+ | |||
+ | {{lemat|2.1|lem 2.1| | ||
+ | Ortogonalny i nie zawierający zera układ wektorów <math>v_1,...,v_n</math> | ||
+ | jest liniowo niezależny. | ||
+ | }} | ||
+ | |||
+ | {{dowod||| | ||
+ | Niech <math>\lambda _1v_1+...+\lambda _nv_n=0</math>. Obie strony tej równości pomnóżmy skalarnie przez <math>v_i</math>, dla <math>i=1,..., n</math>. Otrzymujemy równość <math>\lambda _i (v_ i\cdot v_i)=0</math>, a stąd <math>\lambda _i=0</math>.}} | ||
+ | |||
+ | Wektor <math>v\in V</math> nazywa się jednostkowym, jeśli <math>\Vert v\Vert =1</math>. Układ wektorów <math>v_1,...,v_n</math> nazywa się ortonormalnym, jeśli każdy z tych wektorów jest jednostkowy, a cały układ jest ortogonalny. | ||
+ | Jeśli <math>v</math> jest wektorem niezerowym, to | ||
+ | |||
+ | |||
+ | <center><math>{v\over{\Vert v\Vert}}</math></center> | ||
+ | |||
+ | |||
+ | jest wektorem jednostkowym. Mówimy, że wektor <math>v</math> został znormalizowany. | ||
+ | |||
+ | Niech <math>v_1,...,v_n</math> będzie pewnym układem liniowo niezależnym | ||
+ | przestrzeni wektorowej <math>V</math> wyposażonej w iloczyn skalarny. | ||
+ | Niech | ||
+ | |||
+ | <center><math>e_1 = {{v_1}\over {\Vert v_1\Vert}}.</math></center> | ||
+ | |||
+ | Wektor <math>e_1</math> jest jednostkowy i generuje tę samą przestrzeń co | ||
+ | <math>v_1</math>. Zdefiniujmy teraz wektor <math>e_2</math> następująco | ||
+ | |||
+ | |||
+ | <center><math> \tilde e_2= v_2- (v_2\cdot e_1)e_1.</math></center> | ||
+ | |||
+ | |||
+ | Łatwo sprawdzić, że wektor ten jest prostopadły do <math>e_1</math>. Ponadto | ||
+ | układ wektorów <math>e_1, \tilde e_2</math> rozpina tę samą podprzestrzeń co | ||
+ | układ wektorów <math>v_1,v_2</math>. Co więcej, jeśli oznaczymy przez <math>V_2</math> tę podprzestrzeń, to <math>e_1,\tilde e_2</math> oraz <math>v_1,v_2</math> są takimi bazami tej przestrzeni <math>V_2</math>, że macierz przejścia od bazy <math>v_1,v_2</math> do bazy <math>e_1, \tilde e_2</math> ma wyznacznik dodatni. | ||
+ | |||
+ | Definiujemy teraz | ||
+ | |||
+ | |||
+ | <center><math>e_2 ={{\tilde e_2}\over {\Vert\tilde e_2\Vert}}</math></center> | ||
+ | |||
+ | |||
+ | Oczywiście układy <math>v_1, v_2</math> i <math>e_1,e_2</math> rozpinają tę samą | ||
+ | podprzestrzeń <math>V_2</math>, układ <math>e_1, e_2</math> jest ortonormalny a macierz przejścia od bazy <math>v_1, v_2</math> do bazy <math>e_1, e_2</math> przestrzeni <math>V_2</math> ma wyznacznik dodatni. | ||
+ | |||
+ | Załóżmy, że zdefiniowaliśmy już <math>k</math> kolejnych wektorów <math>e_1,...,e_k</math> takich, że układy <math>e_1,...,e_k</math> i <math>v_1,..., v_k</math> rozpinają tę samą podprzestrzeń <math>V_k</math>, układ <math>e_1,...,e_k</math> jest ortonormalny a macierz przejścia od bazy <math>v_1,..., v_k</math> do bazy <math>e_1,...,e_k</math> ma wyznacznik dodatni. Definiujemy wektor <math>\tilde e_{k+1}</math> wzorem | ||
+ | |||
+ | |||
+ | {{wzor|wektor|2.3| | ||
+ | <math> | ||
+ | \tilde e_{k+1} = v_{k+1}-(v_{k+1}\cdot e_1)e_1-...-(v_{k+1}\cdot | ||
+ | e_k)e_k. </math>}} | ||
+ | |||
+ | |||
+ | Następnie definiujemy | ||
+ | |||
+ | |||
+ | <center><math>e_{k+1}= {{\tilde e_{k+1}}\over {\Vert \tilde e_{k+1}\Vert }}.</math></center> | ||
+ | |||
+ | |||
+ | Łatwo widać, że <math>\tilde e_{k+1}</math> jest prostopadły do każdego z | ||
+ | wektorów <math>e_1,...,e_k</math>, a zatem układ <math>e_1,...,e_{k+1}</math> jest ortonormalny. Łatwo tez widać, że układy <math>v_1,...,v_{k+1}</math>; | ||
+ | <math>e_1,...,e_{k+1}</math> rozpinają tę samą podprzestrzeń, powiedzmy <math>V_{k+1}</math>. Ponadto macierz przejścia od bazy <math>v_1,...,v_{k+1}</math> do bazy <math>e_1,...,e_{k+1}</math> przestrzeni <math>V_{k+1}</math> ma wyznacznik dodatni. | ||
+ | |||
+ | Powyższy proces otrzymywania układu ortonormalnego nazywa się ''procesem Grama-Schmidta''. Jeśli <math>v_1,...,v_k</math> jest układem ortonormalnym, to proces Grama-Schmidta nie zmienia tego układu. | ||
+ | |||
+ | <center> | ||
+ | {| border="0" align="center" cellspacing="10" | ||
+ | | | ||
+ | [[File:ag_10_2a.mp4|253x253px|thumb|left|Proces Grama-Schmidta]] | ||
+ | |} | ||
+ | </center> | ||
+ | |||
+ | Z powyższych rozumowań wynika natychmiast | ||
+ | |||
+ | {{twierdzenie|2.2|tw 2.2| | ||
+ | Każda skończenie wymiarowa przestrzeń wektorowa wyposażoną w iloczyn skalarny ma bazę ortonormalną. | ||
+ | }} | ||
+ | |||
+ | Od tego momentu do końca niniejszego wykładu zakładamy, że przestrzenie wektorowe są skończenie wymiarowe. | ||
+ | |||
+ | Jeżeli <math>e_1,...,e_n</math> jest bazą ortonormalną przestrzeni euklidesowej <math>V</math>, to wektor <math>v\in V</math> wyraża się jako kombinacja liniowa wektorów tej bazy następującym wzorem | ||
+ | |||
+ | |||
+ | {{wzor|baza_ortonormalna|2.4| | ||
+ | <math> | ||
+ | v=(v\cdot e_1)e_1+...+(v\cdot e_n)e_n. | ||
+ | </math>}} | ||
+ | |||
+ | |||
+ | Aby sprawdzić ten wzór wystarczy pomnożyć skalarnie obie strony tej równości przez kolejne wektory bazy <math>e_1,..., e_n</math>. | ||
+ | |||
+ | ==Rzutowanie prostokątne. Izometrie== | ||
+ | |||
+ | Niech dana będzie podprzestrzeń wektorowa <math>U</math> przestrzeni euklidesowej <math>V</math>. Podprzestrzeń ta jest wyposażona w indukowany | ||
+ | iloczyn skalarny, tzn. jest to iloczyn skalarny będący zawężeniem iloczynu skalarnego z <math>V</math> do <math>U</math> (dokładniej mówiąc, zawężeniem | ||
+ | <math>V\times V</math> do <math>U\times U</math>). Zdefiniujmy podprzestrzeń | ||
+ | |||
+ | |||
+ | <center><math>U^{\perp }=\{ w\in V |\ \ w\cdot v =0 \ {\rm dla\ kazdego\ v\in V}\}.</math></center> | ||
+ | |||
+ | |||
+ | Łatwo sprawdzić, że <math>U^{\perp}</math> jest podprzestrzenią wektorową. Ponadto, <math>U^{\perp}\cap U=\{0\}</math>. Istotnie, jeśli <math>v\in U^{\perp}\cap U</math>, to <math>v\cdot v =0</math>, a stąd wynika, że <math>v=0</math>. | ||
+ | |||
+ | Niech <math>v_1,...,v_k</math> będzie bazą podprzestrzeni <math>U</math>. Rozrzerzmy tę bazę do bazy <math>v_1,...,v_k, v_{k+1},..., v_n</math> przestrzeni <math>V</math>. Zastosujmy do tej bazy proces Grama-Schmidta. | ||
+ | Otrzymujemy bazę ortonormalną <math>e_1,...,e_n</math> przestrzeni <math>V</math>. Pierwszych <math>k</math> wektorów tej bazy rozpina podprzestrzeń <math>U</math>, pozostałe rozpinają pewne dopełnienie algebraiczne do <math>U</math> i należą do podprzestrzeni <math>U^{\perp}</math>. A zatem <math>U^{\perp}</math> jest dopełnieniem algebraicznym do <math>U</math>. Podprzestrzeń <math>U^{\perp}</math> nazywa się dopełnieniem ortogonalnym (prostopadłym) do <math>U</math>. | ||
+ | |||
+ | Przypomnijmy, że dopełnienia algebraiczne nie są wyznaczone jednoznacznie. Dopełnienie ortogonalne (istniejące tylko w przestrzeni wyposażonej w iloczyn skalarny) jest wyznaczone jednoznacznie. Oto kilka podstawowych własności dopełnienia ortogonalnego: | ||
+ | |||
+ | |||
+ | <center> | ||
+ | {| border="0" align="center" cellspacing="10" | ||
+ | | | ||
+ | [[File:ag_10_3a.mp4|253x253px|thumb|right|Dopełnienie ortogonalne (prostopadłe)]] | ||
+ | | | ||
+ | [[File:ag_10_3b.mp4|253x253px|thumb|left|Rzutowanie prostokątne]] | ||
+ | |} | ||
+ | </center> | ||
+ | |||
+ | |||
+ | {{lemat|3.1|lem 3.1| | ||
+ | Dla każdych podprzestrzeni <math>U</math>, <math>W</math> przestrzeni euklidesowej <math>V</math> zachodzą następujące związki. | ||
+ | |||
+ | # <math>(U^{\perp})^{\perp}=U</math>. | ||
+ | # Jeżeli <math>U\subset W</math>, to <math>W^{\perp}\subset U^{\perp}</math>. | ||
+ | # <math>(U+W)^{\perp}=U^{\perp}\cap W^{\perp}</math>. | ||
+ | # <math>(U\cap W)^{\perp}=U^{\perp}+W^{\perp}</math>. | ||
+ | |||
+ | }} | ||
+ | |||
+ | Udowodnienie powyższych własności pozostawiamy jako ćwiczenie. | ||
+ | |||
+ | W przestrzeni euklidesowej dla ustalonej podprzestrzeni <math>U</math> mamy | ||
+ | |||
+ | |||
+ | <center><math>V=U\oplus U^{\perp}.</math></center> | ||
+ | |||
+ | |||
+ | A zatem mamy rzutowanie na <math>U</math> równoległe do <math>U^{\perp}</math>. | ||
+ | Ponieważ dopełnienie ortogonalne jest wyznaczone jednoznacznie, więc wymienianie przestrzeni <math>U^{\perp}</math> jest niekonieczne. Używamy określenia " rzutowanie prostokątne na podprzestrzeń <math>U</math> ". Podkreślmy, że możemy mówić o rzutowaniu prostokątnym tylko w przypadku przestrzeni wyposażonych w iloczyn skalarny. | ||
+ | |||
+ | Niech teraz <math>V</math> i <math>W</math> będą przestrzeniami wektorowymi wyposażonymi w iloczyny skalarne - obydwa oznaczane kropką. Mówimy, że | ||
+ | odwzorowanie <math>f:V\longrightarrow W</math> jest ''izometrią'', jeśli | ||
+ | zachowuje iloczyn skalarny, tzn. dla każdych wektorów <math>u,v \in V</math> | ||
+ | zachodzi równość <math>f(u\cdot v)=f(u)\cdot f(v)</math>. Oczywiście odwzorowanie, które zachowuje iloczyn skalarny zachowuje też normę, czyli <math>\Vert f(v)\Vert=\Vert v\Vert </math> dla każdej izometrii <math>f</math>. | ||
+ | |||
+ | {{twierdzenie|3.2 [O izometrii]|tw 3.2| | ||
+ | Izometria jest odwzorowaniem liniowym. Co więcej, jest monomorfizmem. | ||
+ | }} | ||
+ | |||
+ | {{dowod||| | ||
+ | Załóżmy, że <math>e_1,...,e_n</math> jest bazą ortonormalną przestrzeni | ||
+ | wektorowej <math>V</math>. Ponieważ odwzorowanie <math>f</math> zachowuje iloczyn skalarny, więc wektory | ||
+ | |||
+ | |||
+ | <center><math>f(e_1),...,f(e_n)</math></center> | ||
+ | |||
+ | |||
+ | stanowią układ ortonormalny w <math>W</math>, a więc jest to układ liniowo niezależny. Jest wiec bazą ortonormalną przestrzeni <math>{\rm im} f</math>. Na podstawie wzoru ([[#baza_ortonormalna|2.4]]) i faktu, że <math>f(v)\cdot f(e_i)=v\cdot e_i</math> dla każdego <math>i=1,...,n</math>, mamy | ||
+ | |||
+ | |||
+ | <center><math>\begin{align} f(v)&=(f(v)\cdot f(e_1))f(e_1) +...+(f(v)\cdot | ||
+ | f(e_n))f(e_n)\\ | ||
+ | &= (v\cdot e_1)f(e_1)+...+(v\cdot e_n)f(e_n). | ||
+ | \end{align}</math></center> | ||
+ | |||
+ | |||
+ | Oznacza to, że jeśli <math>v=\lambda _1e_1+...\lambda _ne_n</math>, to | ||
+ | |||
+ | |||
+ | <center><math>f(v) =\lambda _1 f(e_1)+...+\lambda _n f(e_n).</math></center> | ||
+ | |||
+ | |||
+ | Łatwo sprawdzić, że takie odwzorowanie jest liniowe. | ||
+ | |||
+ | Jeśli <math>f(v)=0</math>, to <math>\Vert f(v)\Vert =0</math>. A zatem <math>\Vert v \Vert =\Vert f(v)\Vert =0</math>, czyli <math> v =0</math>. W ten sposób udowodniliśmy monomorficzność <math>f</math>.}} | ||
+ | |||
+ | {{twierdzenie|3.3|tw 3.3| | ||
+ | Odwzorowanie liniowe zachowujące normę jest izometrią. | ||
+ | }} | ||
+ | |||
+ | {{dowod||| | ||
+ | Niech <math>f</math> będzie odwzorowaniem spełniającym założenia twierdzenia. Zachodzą równości | ||
+ | |||
+ | |||
+ | <center><math> \Vert v+w\Vert ^2= \Vert v\Vert ^2 +2 v\cdot w +\Vert w\Vert ^2,</math></center> | ||
+ | |||
+ | |||
+ | <center><math> \Vert f(v+w)\Vert ^2 = \Vert f(v)+f(w)\Vert ^2 = \Vert f(v)\Vert | ||
+ | ^2+ 2f(v)\cdot f(w) +\Vert f(w)\Vert ^2.</math></center> | ||
+ | |||
+ | |||
+ | Ponieważ <math>\Vert f(v+w)\Vert = \Vert v+w\Vert</math>, <math>\Vert f(v)\Vert =\Vert v\Vert</math> i <math>\Vert f(w)\Vert =\Vert w\Vert</math>, więc <math>f(v)\cdot f(w)= v\cdot w</math>.}} | ||
+ | |||
+ | Dowód kolejnego twierdzenia jest standardowy i pozostawiamy go czytelnikowi. | ||
+ | |||
+ | {{twierdzenie|3.4|tw 3.4| | ||
+ | Złożenie izometrii jest izometrią. Jeśli izometria jest bijekcją, to odwzorowanie odwrotne do izometrii jest izometrią. | ||
+ | }} | ||
+ | |||
+ | Niech <math>f:V\longrightarrow V</math> będzie izometrią przestrzeni euklidesowej <math>V</math>. Niech <math>e_1,...,e_n</math> będzie bazą ortonormalną przestrzeni <math>V</math>. Wiemy, że <math>f(e_i)\cdot f(e_j)=e_i\cdot e_j \delta _{ij}</math>, dla <math>i,j=1,...,n</math>. Jeśli więc <math>A</math> jest macierzą <math>f</math> przy bazie ortonormalnej, to | ||
+ | |||
+ | |||
+ | <center><math>A^*A=I.</math></center> | ||
+ | |||
+ | |||
+ | Macierz spełniającą powyższy warunek nazywa się macierzą ortogonalną. Macierz taką można też traktować jako izometrię przestrzeni <math>{\mathbb R} ^n</math> wyposażonej w standardowy iloczyn skalarny. Zbiór wszystkich macierzy ortogonalnych wymiarów <math>n</math> na <math>n</math> stanowi podgrupę grupy ogólnej <math>GL(n;{\mathbb R} )</math>. Podgrupę tę nazywa się grupą ortogonalną i oznacza przez <math>O(n)</math>. | ||
+ | |||
+ | Dla macierzy ortogonalnej mamy <math>{\rm det} A^*{\rm det} A =1</math>. A | ||
+ | zatem <math>({\rm det} A)^2=1</math>, czyli <math>{\rm det} A= \pm 1</math>. | ||
+ | |||
+ | Zbiór wszystkich macierzy ortogonalnych wymiarów <math>n</math> na <math>n</math> o wyznaczniku dodatnim (czyli o wyznaczniku 1) stanowi podgrupę | ||
+ | grupy ortogonalnej. |
Aktualna wersja na dzień 13:19, 3 paź 2021
Iloczyn skalarny
Zaczniemy od definicji iloczynu skalarnego
Definicja 1.1 [Iloczyn Skalarny]
Niech
będzie przestrzenią wektorową nad ciałem . Odwzorowanie
nazywa się iloczynem skalarnym, jeśli spełnia trzy następujące warunki:
- S1) jest dwuliniowe,
- S2) jest symetryczne,
- S3) jest dodatnio określone, tzn. dla każdego zachodzi
nierówność
i wtedy i tylko wtedy, gdy .Wartość iloczynu skalarnego na wektorach
oznaczamy także przez lub . Jak zwykle kropkę często pomijamy w zapisie. Nazwa iloczyn skalarny pochodzi stąd, że wynikiem takiego mnożenia jest skalar. Zwróćmy także uwagę na to, że wybór ciała liczb rzeczywistych jest tutaj nieprzypadkowy. W innych ciałach nie mamy skalarów większych od zera.Zbierzemy teraz kilka najważniejszych przykładów iloczynów skalarnych.
Przykład 1.2
W przestrzeni
mamy tzw. standardowy (lub kanoniczny) iloczyn skalarny. Mianowicie, dla wektorów definiujemy
Ogólniej, niech będą dowolnymi liczbami dodatnimi. Definiujemy iloczyn skalarny
Przykład 1.3
Rozważmy przestrzeń funkcji ciągłych określonych na przedziale
. Definiujemy iloczyn skalarny
Przykład 1.4
Niech
będzie bazą przestrzeni wektorowej nad ciałem . Definiujemy iloczyn skalarny formułą
gdzie , są współrzędnymi wektorów i w danej bazie.
Istotne w tym przykładzie jest to, że każda skończenie wymiarowa przestrzeń wektorowa nad ciałem
może być łatwo wyposażona w iloczyn skalarny.Definicja 1.5 [Norma]
Normą na przestrzeni wektorowej
nad ciałem nazywamy funkcję
która spełnia warunki
- N 1) dla każdego wektora i liczby rzeczywistej zachodzi równość ,
- N 2) zachodzi nierówność trójkąta, tzn. dla każdych wektorów mamy
Iloczyn skalarny dany w przestrzeni
wyznacza normę w tej przestrzeni. Mianowicie, definiujemy
(1.1)
Normę wektora nazywamy też jego długością. Stosowany jest zapis , który oznacza lub, co na jedno wychodzi, .
Sprawdzenie, że funkcja zdefiniowana formułą (1.1) spełnia warunki N1) i N2) jest natychmiastowe. Warunek trójkąta sprawdzimy po udowodnieniu następującej nierówności Schwarza.
Twierdzenie 1.5 [Nierówność Schwarza]
(1.2)
Równość w powyższej nierówności zachodzi wtedy i tylko wtedy, gdy wektory , są liniowo zależne.
Dowód
Jeśli któryś z wektorów
, jest zerowy, to twierdzenie jest oczywiste. Załóżmy więc, że wektory te są niezerowe.Rozważmy funkcję zmiennej rzeczywistej
Funkcja ta przybiera wartości nieujemne. Z drugiej strony mamy
A zatem funkcja jest trójmianem kwadratowym przyjmującym
wartości nieujemne, którego współczynnik przy jest dodatni.
Oznacza to, że wyróżnik jest niedodatni. Wobec tego
czyli . Po
spierwiastkowaniu tej nierówności dostajemy nierówność Schwarza.

Korzystając, miedzy innymi, z nierowności Schwarza otrzymujemy teraz, dla dowolnych wektorów
, , ciąg równości i nierówności
Udowodniliśmy więc nierówność trójkąta N 2) dla funkcji (1.1).
Przy okazji zauważmy, że otrzymaliśmy twierdzenie Pitagorasa. Mianowicie, jeśli wektory
, są do siebie prostopadłe, czyli , to
Jeśli wektory , sa niezerowe, to liczbę rzeczywistą taką, że
nazywamy kątem między wektorami i .
Układy ortogonalne. Proces Grama - Schmidta. Bazy ortonormalne
Mówimy, że wektory są do siebie prostopadłe (ortogonalne), jeśli ich iloczyn skalarny jest równy
. Ogólniej, układ wektorów nazywa się układem ortogonalnym, jeśli każde dwa wektory tego układu są do siebie prostopadłe, tzn. dla . Oczywiście wektor zerowy jest prostopadły do każdego wektora. Dowolny zbiór (niekoniecznie skończony) nazywa się ortogonalny, jeśli każde dwa wektory tego zbiory są ortogonalne.Mamy następujący
Lemat 2.1
Ortogonalny i nie zawierający zera układ wektorów
jest liniowo niezależny.Dowód
. Obie strony tej równości pomnóżmy skalarnie przez , dla . Otrzymujemy równość , a stąd .Wektor
nazywa się jednostkowym, jeśli . Układ wektorów nazywa się ortonormalnym, jeśli każdy z tych wektorów jest jednostkowy, a cały układ jest ortogonalny. Jeśli jest wektorem niezerowym, to
jest wektorem jednostkowym. Mówimy, że wektor został znormalizowany.
Niech
będzie pewnym układem liniowo niezależnym przestrzeni wektorowej wyposażonej w iloczyn skalarny. NiechWektor
jest jednostkowy i generuje tę samą przestrzeń co . Zdefiniujmy teraz wektor następująco
Łatwo sprawdzić, że wektor ten jest prostopadły do . Ponadto
układ wektorów rozpina tę samą podprzestrzeń co
układ wektorów . Co więcej, jeśli oznaczymy przez tę podprzestrzeń, to oraz są takimi bazami tej przestrzeni , że macierz przejścia od bazy do bazy ma wyznacznik dodatni.
Definiujemy teraz
Oczywiście układy i rozpinają tę samą
podprzestrzeń , układ jest ortonormalny a macierz przejścia od bazy do bazy przestrzeni ma wyznacznik dodatni.
Załóżmy, że zdefiniowaliśmy już
kolejnych wektorów takich, że układy i rozpinają tę samą podprzestrzeń , układ jest ortonormalny a macierz przejścia od bazy do bazy ma wyznacznik dodatni. Definiujemy wektor wzorem
(2.3)
Następnie definiujemy
Łatwo widać, że jest prostopadły do każdego z
wektorów , a zatem układ jest ortonormalny. Łatwo tez widać, że układy ;
rozpinają tę samą podprzestrzeń, powiedzmy . Ponadto macierz przejścia od bazy do bazy przestrzeni ma wyznacznik dodatni.
Powyższy proces otrzymywania układu ortonormalnego nazywa się procesem Grama-Schmidta. Jeśli
jest układem ortonormalnym, to proces Grama-Schmidta nie zmienia tego układu.Z powyższych rozumowań wynika natychmiast
Twierdzenie 2.2
Każda skończenie wymiarowa przestrzeń wektorowa wyposażoną w iloczyn skalarny ma bazę ortonormalną.
Od tego momentu do końca niniejszego wykładu zakładamy, że przestrzenie wektorowe są skończenie wymiarowe.
Jeżeli
jest bazą ortonormalną przestrzeni euklidesowej , to wektor wyraża się jako kombinacja liniowa wektorów tej bazy następującym wzorem
(2.4)
Aby sprawdzić ten wzór wystarczy pomnożyć skalarnie obie strony tej równości przez kolejne wektory bazy .
Rzutowanie prostokątne. Izometrie
Niech dana będzie podprzestrzeń wektorowa
przestrzeni euklidesowej . Podprzestrzeń ta jest wyposażona w indukowany iloczyn skalarny, tzn. jest to iloczyn skalarny będący zawężeniem iloczynu skalarnego z do (dokładniej mówiąc, zawężeniem do ). Zdefiniujmy podprzestrzeń
Łatwo sprawdzić, że jest podprzestrzenią wektorową. Ponadto, . Istotnie, jeśli , to , a stąd wynika, że .
Niech
będzie bazą podprzestrzeni . Rozrzerzmy tę bazę do bazy przestrzeni . Zastosujmy do tej bazy proces Grama-Schmidta. Otrzymujemy bazę ortonormalną przestrzeni . Pierwszych wektorów tej bazy rozpina podprzestrzeń , pozostałe rozpinają pewne dopełnienie algebraiczne do i należą do podprzestrzeni . A zatem jest dopełnieniem algebraicznym do . Podprzestrzeń nazywa się dopełnieniem ortogonalnym (prostopadłym) do .Przypomnijmy, że dopełnienia algebraiczne nie są wyznaczone jednoznacznie. Dopełnienie ortogonalne (istniejące tylko w przestrzeni wyposażonej w iloczyn skalarny) jest wyznaczone jednoznacznie. Oto kilka podstawowych własności dopełnienia ortogonalnego:
Lemat 3.1
Dla każdych podprzestrzeni
, przestrzeni euklidesowej zachodzą następujące związki.- .
- Jeżeli , to .
- .
- .
Udowodnienie powyższych własności pozostawiamy jako ćwiczenie.
W przestrzeni euklidesowej dla ustalonej podprzestrzeni
mamy
A zatem mamy rzutowanie na równoległe do .
Ponieważ dopełnienie ortogonalne jest wyznaczone jednoznacznie, więc wymienianie przestrzeni jest niekonieczne. Używamy określenia " rzutowanie prostokątne na podprzestrzeń ". Podkreślmy, że możemy mówić o rzutowaniu prostokątnym tylko w przypadku przestrzeni wyposażonych w iloczyn skalarny.
Niech teraz
i będą przestrzeniami wektorowymi wyposażonymi w iloczyny skalarne - obydwa oznaczane kropką. Mówimy, że odwzorowanie jest izometrią, jeśli zachowuje iloczyn skalarny, tzn. dla każdych wektorów zachodzi równość . Oczywiście odwzorowanie, które zachowuje iloczyn skalarny zachowuje też normę, czyli dla każdej izometrii .Twierdzenie 3.2 [O izometrii]
Izometria jest odwzorowaniem liniowym. Co więcej, jest monomorfizmem.
Dowód
Załóżmy, że
jest bazą ortonormalną przestrzeni wektorowej . Ponieważ odwzorowanie zachowuje iloczyn skalarny, więc wektory
stanowią układ ortonormalny w , a więc jest to układ liniowo niezależny. Jest wiec bazą ortonormalną przestrzeni . Na podstawie wzoru (2.4) i faktu, że dla każdego , mamy
Oznacza to, że jeśli , to
Łatwo sprawdzić, że takie odwzorowanie jest liniowe.

Twierdzenie 3.3
Odwzorowanie liniowe zachowujące normę jest izometrią.
Dowód
Niech
będzie odwzorowaniem spełniającym założenia twierdzenia. Zachodzą równości

Dowód kolejnego twierdzenia jest standardowy i pozostawiamy go czytelnikowi.
Twierdzenie 3.4
Złożenie izometrii jest izometrią. Jeśli izometria jest bijekcją, to odwzorowanie odwrotne do izometrii jest izometrią.
Niech
będzie izometrią przestrzeni euklidesowej . Niech będzie bazą ortonormalną przestrzeni . Wiemy, że , dla . Jeśli więc jest macierzą przy bazie ortonormalnej, to
Macierz spełniającą powyższy warunek nazywa się macierzą ortogonalną. Macierz taką można też traktować jako izometrię przestrzeni wyposażonej w standardowy iloczyn skalarny. Zbiór wszystkich macierzy ortogonalnych wymiarów na stanowi podgrupę grupy ogólnej . Podgrupę tę nazywa się grupą ortogonalną i oznacza przez .
Dla macierzy ortogonalnej mamy
. A zatem , czyli .Zbiór wszystkich macierzy ortogonalnych wymiarów
na o wyznaczniku dodatnim (czyli o wyznaczniku 1) stanowi podgrupę grupy ortogonalnej.