Algebra liniowa z geometrią analityczną/Wykład 15: Euklidesowe przestrzenie afiniczne

Z Studia Informatyczne
Wersja z dnia 21:56, 15 wrz 2023 autorstwa Luki (dyskusja | edycje) (Zastępowanie tekstu – „,...,” na „,\ldots,”)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)
Przejdź do nawigacjiPrzejdź do wyszukiwania

Własności euklidesowych przestrzeni afinicznych

Jeżeli X jest przestrzenią afiniczną o kierunku V i V jest euklidesową przestrzenią wektorową, to przestrzeń X nazywamy euklidesową przestrzenią afiniczną.

Mając wybrany punkt bazowy mamy też bijekcję Φo:XV zdefiniowana w 2. paragrafie Wykładu XIII. Za pomocą tej bijekcji można przenieść nie tylko strukturę przestrzeni wektorowej z V na X, ale także iloczyn skalarny. Tak jak w przypadku struktury liniowej, przeniesiony iloczyn skalarny w istotny sposób zależy od wyboru punktu bazowego.

W euklidesowej przestrzeni afinicznej właściwym pojęciem geometrycznym jest odległość punktów, którą definiujemy przy pomocy normy wektora. Mianowicie, dla dowolnych punktów x,yX odległość d(x,y) definiujemy wzorem


d(x,y)=xy.


Łatwo sprawdzić, że jest to dobrze zdefiniowana funkcja odległości.

Mówimy, że wektor vV jest prostopadły do podprzestrzeni afinicznej X0, jeśli v jest prostopadły do każdego wektora kierunku tej podprzestrzeni.

Twierdzenie 15.1

Niech X0 będzie podprzestrzenią afiniczna przestrzeni X. Dla każdego punktu xX istnieje dokładnie jeden punkt xX0 taki, że xx jest prostopadły do X0. Dla każdego punktu yX0 zachodzi nierówność


d(x,x)d(x,y),


przy czym równość zachodzi wtedy i tylko wtedy, gdy y=x.

Dowód

Niech V0 będzie kierunkiem X0. Niech x0X0 i xX. Niech V0 będzie dopełnieniem ortogonalnym do V0. Rozłóżmy wektor x0x na sumę wektorów v+w, gdzie vV0 i wV0. Zdefiniujmy


x=x0+v.


Punkt ten należy do X0. Ponadto


xx=xx0+x0x=xx0+v=(v+w)+v=wV0


A zatem xx jest prostopadły do X0.

Załóżmy, że xX0 jest również takim punktem, że xxV0. Zachodzą równości


xx=xx+xx=xx+xxV0


Z drugiej strony xxV0, bo oba punkty x,x należą do X0. A zatem x=x.

Niech yX0. Wtedy xy=xx+xy. Składniki sumy po prawej stronie tej równości są prostopadłe, a zatem, z twierdzenia Pitagorasa, mamy


xy2=xx2+xy2.


A zatem d2(x,y)d2(x,x) i równość zachodzi wtedy i tylko wtedy, gdy y=x.

Odwzorowanie XxxX0 nazywamy rzutowaniem prostokątnym na podprzestrzeń X0. Oznaczmy to odwzorowanie przez ΠX0. Punkt x=ΠX0(x) można otrzymać jako przecięcie X0 i podprzestrzeni x+V0.

Liczbę d(x,x) nazywamy odległością punktu x od podprzestrzeni X0. Oznaczać ją będziemy przez d(x,X0).

Ilustracja do twierdzenia 1.2

Twierdzenie 15.2

Rzutowanie prostokątne w euklidesowej przestrzeni afinicznej X jest odwzorowaniem afinicznym indukującym rzutowanie prostokątne w przestrzeni V.

Dowód

Niech ΠV0 oznacza rzutowanie prostokątne na podprzestrzeń wektorową V0. Z dowodu poprzedniego twierdzenia wiemy, że x=x0+v, gdzie x0x=v+w i vV0, wV0. Niech zV i z=z+z, gdzie zV0 i zV0.

Zachodzą następujące równości


x0(x+z)=x0x+z=v+w+z+z=(v+z)+(w+z).


Zatem


ΠX0(x+z)=x0+(v+z)=(x0+v)+z=ΠX0(x)+ΠV0(z).


Zdefiniujemy teraz odbicie symetryczne względem podprzestrzeni X0. Definiujemy to odwzorowanie formułą


SX0(x)=x+2xΠX0(x)


Odwzorowanie SX0 nazywa się też symetrią względem podprzestrzeni X0.


Odbicie symetryczne jest izometrią


Twierdzenie 15.3

Odbicie symetryczne względem podprzestrzeni jest odwzorowaniem afinicznym.

Dowód

Twierdzimy, że symetria SX0 indukuje odwzorowanie liniowe φ zdefiniowane wzorem


φ(z)=2ΠV0(z)z.


Niech zV będzie dowolnym wektorem i niech z=z+z, gdzie zV0, zV0. Oznaczmy przez x punkt ΠX0(x). Zachodzą następujące równości


SX0(x+z)=(x+z)+2(x+z)(x+z)=x+z+2xx+2(zz)=SX0(x)+z+2(zz)=SX0(x)+(2zz).


Izometrią euklidesowej przestrzeni afinicznej X nazywamy odwzorowanie zachowujące odległość, tzn. odwzorowanie f:XX takie, że dla każdych x,yX zachodzi równość


d(f(x),f(y))=d(x,y).


Jest oczywiste, że odwzorowanie afiniczne indukujące izometrię liniową jest izometrią. Istotnie, wystarczy zauważyć, że jeśli f indukuje izometrię φ, to


d(f(x),f(y))=f(x)f(y)=φ(xy)=xy=d(x,y).


Zachodzi też twierdzenie odwrotne.

Twierdzenie 15.4

Izometria jest odwzorowaniem afinicznym indukującym izometrię liniową.

Dowód

Niech oX będzie ustalonym punktem przestrzeni X. Niech dane będą dwa dowolne wektory v,wV. Oznaczmy przez x,y punkty o+v i o+w odpowiednio. Definiujemy odwzorowanie φ:VV formułą


φ(v)=f(o)f(o+v).


Zachodzą równości


d(x,y)2=xy2=xo+oy2=ox2+oy22oxoy=d(o,x)2+d(o,y)22oxoy,


d(f(x),f(y))2=f(x)f(y)2=f(x)f(o)+f(o)f(y)2=f(o)f(x)2+f(o)f(y)22f(o)f(x)f(o)f(y)=d(f(o),f(x))2+d(f(o)f(y))22f(o)f(x)f(o)f(y).


Porównując te równości i korzystając z tego, że f zachowuje odległość punktów otrzymujemy równość


φ(v)φ(w)=vw


dla dowolnych wektorów v,wV. Z Twierdzenia 1.10 z Wykładu X wiemy, że φ jest odwzorowaniem liniowym. Pozostaje więc zauważyć, że


f(x+z)=f(x)+φ(z)


dla dowolnych x i z. W tym celu zauważamy, że zachodzą równości


f(x+z)=f(o+ox+z)=f(o)+φ(ox+z)=f(o)+φ(ox)+φ(z)=f(x)+φ(z).


Twierdzenie 15.5

Odbicie symetryczne jest izometrią.

Dowód

Korzystamy z dowodu Twierdzenia 15.3. Mamy równość 2zz=zz i kolejne równości (pamiętamy, że zz=0)


(zz)(zz)=zz+zz=(z+z)(z+z)=zz.


A zatem φ jest odwzorowaniem liniowym zachowującym normę. Jest więc izometrią liniową.

Na koniec tego paragrafu podamy bez dowodu

Twierdzenie 15.6

Każda izometria n-wymiarowej afinicznej przestrzeni euklidesowej X jest złożeniem co najwyżej n+1 odbić symetrycznych względem hiperpłaszczyzn.

Analityczny opis podprzestrzeni afinicznej podprzestrzeni euklidesowej

Rozważmy n-wymiarową afiniczną podprzestrzeń euklidesową. Bez utraty ogólności możemy założyć, że jest to przestrzeń afiniczna n o kierunku n wyposażonym w standardowy iloczyn skalarny. W przypadku wymiarów 2 i 3 można też myśleć o tych przestrzeniach jako o znanych ze szkoły płaszczyźnie i trójwymiarowej przestrzeni fizycznej z ustalonym prostokątnym układem współrzędnych.

Przypomnijmy, że hiperpłaszczyzna afiniczna jest opisana jednym równaniem liniowym


a0+a1x1+...+anxn=0,      (2.2)


gdzie któryś ze skalarów a1,,an jest różny od 0, czyli a12+...+an20. Jeśli wszystkie te skalary są równe zeru, to równanie opisuje całą przestrzeń n lub zbiór pusty. W dalszych rozważaniach zakładamy, że zadane równania nie będą opisywały tego typu trywialnych sytuacji. Równanie (2.2) nazywa się równaniem ogólnym hiperpłaszczyzny. W przypadkach n=2, n=3 rozpoznajemy znane ze szkoły równania ogólne prostej na płaszczyźnie i płaszczyzny w trójwymiarowej przestrzeni.

Kierunek hiperpłaszczyzny danej równaniem (2.2) jest dany równaniem jednorodnym


a1x1+...+anxn=0      (2.3)


A zatem, jeśli oznaczymy


x=(x1,,xn),    a=(a1,,an),


to hiperpłaszczyzna wektorowa (2.3) jest równa


{xn | xa=0}.


Wektor a jest prostopadły do hiperpłaszczyzny. Ponieważ a jest niezerowy, rozpina prostą prostopadłą do danej hiperpłaszczyzny wektorowej. Wektor a jest prostopadły do przestrzeni afinicznej (2.2).

Ogólniej, mówimy, że dwie podprzestrzenie afiniczne są prostopadłe, jeżeli ich kierunki są prostopadłe, czyli każde dwa wektory wzięte z tych podprzestrzeni (różnych) są prostopadłe.

Jeśli układ równań liniowych


{ a10+a11x1+...+a1nxn=0 .............................................. am0+am1x1+...+amnxn=0      (2.4)


ma rozwiązanie, to opisuje (nk)-wymiarową podprzestrzeń afiniczną L przestrzeni n, gdzie k=rkA i A=[aij]M(m,n;) jest macierzą układu (2.4). Każde z równań opisuje hiperpłaszyznę (zgodnie z umową zakładamy, że zadane równania ogólne nie opisują sytuacji trywialnych) i koniunkcja m równań opisuje zbiór będący przecięciem tych hiperpłaszczyzn. Układ (2.4) nazywamy równaniem krawędziowym podprzestrzeni L.

Każdy z wektorów


a1=(a11,,a1n),  .  .  .  ,am=(am1,,amn)      (2.5)


jest prostopadły do przestrzeni L. Wektory te generują dopełnienie ortogonalne do kierunku podprzestrzeni L opisanego układem równań


{ a11x1+...+a1nxn=0 .............................................. am1x1+...+amnxn=0      (2.6)


Oczywiście, jeśli m>k oznacza to, że w układzie (2.2) są równania niepotrzebne a wektory a1,,am są liniowo zależne. Na ogół, podprzestrzeń zadana jest najmniejszą możliwą liczbą równań, czyli m=k. W szczególności, prosta w trójwymiarowej przestrzeni jest zadana dwoma równaniami. Prosta taka jest krawędzią przecięcia dwóch płaszczyzn.

Każda hiperpłaszczyzna jest zbiorem rozwiązań pewnego równania liniowego, a każda nm-wymiarowa podprzestrzeń L jest zbiorem rozwiązań pewnego układu m równań. Istotnie, niech V oznacza kierunek przestrzeni L. Weźmy dopełnienie ortogonalne V do podprzestrzeni V. Niech a1,,am będzie bazą V. Kierunek V dany jest układem równań (2.6), gdzie aij dane są przez (2.5). Przypuśćmy, że dany jest jakiś punkt podprzestrzeni L, np. punkt o współrzędnych (b1,,bn). Wstawiamy te współrzędne do układu (2.4) w miejsce x1,,xn i otrzymujemy wyrazy wolne a10,,am0.

Równanie ogólne dla danej hiperpłaszczyzny nie jest jedyne. Można je pomnożyć przez niezerowy skalar i otrzymać inne równanie (proporcjonalne do poprzedniego) opisujące tę samą hiperpłaszczyznę. Jest to jedyna dowolność jaka tu występuje. Istotnie, dla danej hiperpłaszczyzny L dopełnienie ortogonalne do jej kierunku jest 1-wymiarowe, a zatem generowane przez wektory proporcjonalne. W przypadku równania krawędziowego dowolność jest znacznie większa. Na przykład, łatwo widać, że prosta w trójwymiarowej przestrzeni może być krawędzią przecięcia rozmaitych układów płaszczyzn. Równanie ogólne hiperpłaszczyzny, w którym wektor a=(a1,,an) jest jednostkowy nazywa się równaniem normalnym hiperpłaszczyzny.

Niech L będzie k-wymiarową podprzestrzenią o kierunku V. Niech teraz v1,,vk będzie bazą podprzestrzeni wektorowej V. Niech dany będzie pewien punkt x0=(x01,,x0n) podprzestrzeni afinicznej X. Wiemy, że X=x0+V a V jest zbiorem wszystkich kombinacji liniowych wektorów v1,,vk. A zatem podprzestrzeń L jest zbiorem punktów o współrzędnych (x1,,xn) wyrażonych wzorami


{ x1=x01+t1v11+...+tkvk1 .......................................... xn=x0n+t1v1n+...+tkvkn,      (2.7)


gdzie (vi1,,vin) są współrzędnymi wektora vi dla i=1,,k i t1,,tk są parametrami przebiegającymi zbiór . Równanie to może też być zapisane bez użycia współrzędnych, tzn. w postaci


x=x0+t1v1+...tkvk      (2.8)


Układ (2.7) lub równanie (2.8) nazywa się równaniem parametrycznym podprzestrzeni L. W szczególności, mamy równanie parametryczne prostej (jest jeden parametr) i równanie parametryczne płaszczyzny (są dwa parametry). Zamiana równania parametrycznego na ogólne lub krawędziowe (dla danej podprzestrzeni) jak również operacja odwrotna będą przerobione na ćwiczeniach.

Dysponujemy już metodą na znajdowanie rzutu prostokątnego punktu na podprzestrzeń afiniczną.

Załóżmy, że mamy (nm) - wymiarową podprzestrzeń L daną równaniem krawędziowym (lub ogólnym) (2.4) (lub (2.2)). Mamy więc wektory prostopadłe a1,,am rozpinające przestrzeń V.

Dany jest też punkt, powiedzmy p=(p1,,pn), który chcemy zrzutować prostokątnie na podprzestrzeń. Możemy więc napisać równanie parametryczne podprzestrzeni L(p):=p+V. Wstawiamy kolejne x1,\ldots,xn z tego równania (wyrażone przez parametry t1,,tm i pewne stałe) do równania krawędziowego. Otrzymujemy układ m równań ze względu na niewiadome t1,,tm. Rozwiązujemy ten układ (istnieje jedno jedyne rozwiązanie, bo istnieje dokładnie jeden rzut prostokątny punktu na podprzestrzeń) i otrzymujemy parametry, które odpowiadają punktowi przecięcia podprzestrzeni L z podprzestrzenią L(p). Z równania parametrycznego obliczamy współrzędne punktu odpowiadającego takim parametrom.

Na przykład, niech dana będzie hiperpłaszczyzna L opisana równaniem ogólnym


a0+a1x1+...+anxn=0.


i punkt p=(p1,...pn). Oznaczmy przez p=(p'1,,p'n) rzut prostokątny punktu p na L i przez a wektor (a1,,an). Równanie parametryczne prostej prostopadłej do L i przechodzącej przez punkt p jest następujące


{ x1=p1+ta1 ..................... xn=pn+tan.


Po wstawieniu x1,,xn do równania ogólnego dostajemy


a0+a1(p1+ta1)+...+an(pn+tan)=0.


A zatem punkt przecięcia L i L(p)odpowiada parametrowi


t0=a0+a1p1+...+anpna2      (2.9)


Punkt p ma współrzędne


p'1=p1+t0a1,  ...  ,p'n=pn+t0an.


Jeśli podprzestrzeń L dana jest równaniem parametrycznym (2.8), to rzut prostokątny znajdujemy następująco. Wektory v1,,vk traktujemy jako wektory rozpinające dopełnienie ortogonalne do V. A zatem mamy równanie krawędziowe przestrzeni L(p). Wstawiając x1,,xn z danego równania parametrycznego do równania krawędziowego podprzestrzeni L(p) otrzymujemy układ równań ze względu na niewiadome t1,,tk. Rozwiązujemy ten układ i rozwiązanie wstawiamy do równania parametrycznego.

Załóżmy na przykład, że dana jest prosta L


x=x0+tv


i punkt p=(p1,,pn). Hiperpłaszczyzna L(p) prostopadła do L i przechodząca przez punkt p ma równanie ogólne


a0+v1x1+...vnxn=0,


gdzie a0=v1p1...vnpn i v=(v1,,vn). Po wstawieniu za x1,,xn wyrażeń z parametrem i rozwiązaniu równania ze względu na niewiadomą t otrzymujemy wzór na wartość parametru t0 odpowiadającego punktowi przecięcia, czyli punktowi p. Ostatecznie, rzut prostokątny p punktu p jest dany wzorem


p=x0+(v(pxo))v2v      (2.10)

Odległość punktu od podprzestrzeni

Odległością dwóch zbiorów B, C zawartych w afinicznej przestrzeni euklidesowej nazywamy liczbę


inf{d(x,y) | xB,yC.}


W przypadku rozważanej przez nas przestrzeni n


d(x,y)=xy=(y1x1)2+...+(ynxn)2,


gdzie x=(x1,,xn), y=(y1,,yn).

Z Twierdzenia 15.1 wynika, że odległość punktu p od podprzestrzeni afinicznej L jest równa d(p,p), gdzie p jest rzutem prostokątnym punktu p na L. Z rozważań prowadzonych w ostatnim rozdziale wiemy, że odległość punktu p od hiperpłaszczyzny L dana jest wzorem


(p,p)=|a0+a1p1+...+anpn|a      (3.11)


Aby obliczyć odległość punktu od dowolnej podprzestrzeni (danej równaniem krawędziowym lub parametrycznym) możemy postępować podobnie, tzn. znaleźć rzut prostokątny danego punktu na podprzestrzeń i znaleźć odległość punktu danego od jego rzutu prostokątnego.

Załóżmy, że podprzestrzeń L dana jest równaniem parametrycznym


x=x0+t1v1+...+tkvk      (3.12)


i v1,,vk są liniowo niezależne.

Do obliczania odległości punktu od tak zadanej podprzestrzeni można skorzystać z wyznacznika Grama. Mianowicie, korzystając z Twierdzenia 2.4 z Wykładu XII, otrzymujemy


G(v1,,vk,px0)=d(p,p)2G(v1,,vk).


A zatem


d(p,p)=G(v1,,vk,px0)G(v1,,vk)      (3.13)

Miara układu punktów

Niech dane będą a punkty x0,,xk. Liczbę


1k!vol(x0x1,,x0xk)      (4.14)


nazywamy miarą k-wymiarową lub objętością k-wymiarową układu punktów x0,,xk i oznaczamy symbolem


vol(x0,,xk)      (4.15)


Miara punktów jest równa zeru wtedy i tylko wtedy, gdy punkty te są afinicznie zależne.

W przypadku k=1 miara jest odległością punktów, w przypadku k=2 miara jest polem trójkąta o zadanych wierzchołkach, zaś w przypadku k=3 - objętością czworościanu o zadanych wierzchołkach. A zatem wprowadzone pojęcie objętości jest zgodne ze szkolną wiedzą. Korzystając z Twierdzenia 2.1 Wykładu XII mamy wzór


vol{x0,,xk}=1k!G(x0x1,,x0xk)      (4.16)


Objętości innych figur otrzymujemy rozkładając je na sumy figur takich jak odcinki, trójkąty, czworościany etc.

Wzajemne położenie podprzestrzeni

Hiperpłaszczyzna L rozcina całą przestrzeń na dwie półprzestrzenie. Ustalmy, jak opisać sytuację, gdy dwa punkty x,y nie leżące w L, znajdują się w jednej z tych półprzestrzeni (po jednej stronie L) lub w dwu różnych półprzestrzeniach. Załóżmy najpierw, że hiperpłaszczyzna dana jest równaniem ogólnym a0+a1x1+...+anxn=0. W szczególności mamy wektor a=(a1,,an) prostopadły do hiperpłaszczyzny. Możemy też łatwo znaleźć jakiś punkt xoL. Np., jeśli ai0, to x0=(0,,a0ai,,0) jest takim punktem. Punkty x, yn leżą po jednej stronie L, wtedy i tylko wtedy, gdy


(x0xa)(x0ya)0.


Jeśli hiperpłaszczyzna dana jest równaniem parametrycznym x0+t1v1+....+tn1vn1, to punkty x,y leżą po tej samej stronie hiperpłaszczyzny L, wtedy i tylko wtedy wyznaczniki det[v1,,vn1,x0,x], det[v1,,vn1,x0,y] mają ten sam znak, gdzie v1,,vn1 wypisane we współrzędnych stanowią kolumny w powyższych macierzach.

Wiemy już, co oznacza, że podprzestrzenie są prostopadłe lub równoległe.

Podprzestrzenie afiniczne nazywamy wichrowatymi (lub skośnymi), jeśli nie są równoległe i nie mają wspólnego punku. Dobrze znany jest przykład prostych skośnych w 3.