Norma. Iloczyn skalarny

Norma. Iloczyn skalarny


W wykładzie tym wprowadzamy pojęcie normy i przestrzeni unormowanej. Pokazujemy, że kule w przestrzeniach unormowanych są zbiorami wypukłymi. Wprowadzamy pojęcia iloczynu skalarnego i przestrzeni unitarnej. Dowodzimy nierówność Schwarza, warunek równoległoboku i twierdzenie Pitagorasa.

Przestrzenie unormowane

Przypomnijmy, że na pierwszym wykładzie z Analizy Matematycznej 2 wprowadziliśmy pojęcie metryki, czyli funkcji, która każdym dwóm punktom danego zbioru przyporządkowuje ich odległość. W przypadku, gdy dany zbiór jest przestrzenią wektorową, możemy wprowadzić funkcję mierzącą "długość" wektora. Funkcję tę nazwiemy normą. Okaże się (zgodnie z intuicją, jak dla przypadku płaszczyzny \( \displaystyle \displaystyle\mathbb{R}^2 \)), że jeśli umiemy zmierzyć długość wektorów przestrzeni wektorowej \( \displaystyle X, \) to możemy także mierzyć odległość między punktami zbioru \( \displaystyle X. \)

Pojęcie normy jest szczególnie przydatne w przestrzeniach funkcji (np. przestrzeniach funkcji liniowych lub przestrzeniach funkcji ciągłych). Norma będzie nam również przydatna w przyszłości do zdefiniowania pochodnych wyższych rzędów dla funkcji wielu zmiennych.

Wprowadźmy formalną definicję (wektor zerowy przestrzeni wektorowej \( \displaystyle X \) będziemy oznaczać przez \( \displaystyle \Theta \)).

Definicja 3.1.

Niech \( \displaystyle X \) będzie przestrzenią wektorową nad ciałem \( \displaystyle K \) (\( \displaystyle K=\mathbb{R} \) lub \( \displaystyle K=\mathbb{C} \)).
Odwzorowanie \( \displaystyle \displaystyle\|\cdot\|\colon X\longrightarrow\mathbb{R}_+ \) nazywamy normą w \( \displaystyle X, \) jeśli:
(1) \( \displaystyle \displaystyle\forall x\in X:\ \ \|x\|=0\ \Longleftrightarrow\ x=\Theta \);
(2) \( \displaystyle \displaystyle\forall x\in X,\ \ \lambda\in K:\ \ \|\lambda x\|=|\lambda|\cdot\|x\| \) (jednorodność);
(3) \( \displaystyle \displaystyle\forall x,y\in X:\ \ \|x+y\|\le\|x\|+\|y\| \) (subaddytywność).
Parę \( \displaystyle \displaystyle (X,\|\cdot\|) \) nazywamy przestrzenią unormowaną.

Zauważmy, że definicja powyższa precyzuje nasze naturalne wymagania w stosunku do długości wektora, a mianowicie:
(1) długość wektora wynosi zero wtedy i tylko wtedy, gdy wektor jest zerowy;
(2) długość iloczynu wektora przez liczbę, to iloczyn długości tego wektora i wartości bezwzględnej tej liczby;
(3) długość sumy wektorów jest nie większa od sumy ich długości.

wykres

Przykład 3.2.

W przestrzeni wektorowej \( \displaystyle \displaystyle\mathbb{R}^N \) nad \( \displaystyle \displaystyle\mathbb{R} \) możemy wprowadzić następujące normy:
\( \displaystyle \displaystyle \|x\|_{2} \stackrel{df}{=} \sqrt{\sum_{i=1}^N x_i^2}, \qquad x=(x_1,\ldots,x_N)\in\mathbb{R}^N \) (norma euklidesowa),
\( \displaystyle \displaystyle \|x\|_{1} \stackrel{df}{=} \sum_{i=1}^N |x_i|, \qquad x=(x_1,\ldots,x_N)\in\mathbb{R}^N \) (norma taksówkowa),
\( \displaystyle \displaystyle \|x\|_{\infty} \stackrel{df}{=} \max_{1\le i\le N} |x_i|, \qquad x=(x_1,\ldots,x_N)\in\mathbb{R}^N \) (normamaksimowa).
Dowód faktu, że powyższe odwzorowania są normami, pozostawiamy na ćwiczenia (patrz ćwiczenie 3.1.). Nazwy powyższych norm nie są przypadkowe (patrz uwaga 3.4.).

Okazuje się, że każda przestrzeń unormowana jest w naturalny sposób przestrzenią metryczną. Mówi o tym następujące twierdzenie.

Twierdzenie 3.3.

Jeśli \( \displaystyle \displaystyle (X,\|\cdot\|) \) jest przestrzenią unormowaną, \( \displaystyle d\colon X\times X\longrightarrow\mathbb{R}_+ \) jest funkcją zadaną przez \( \displaystyle d(x,y)\stackrel{df}{=}\|x-y\|, \) to \( \displaystyle \displaystyle (X,d) \) jest przestrzenią metryczną.
Mówimy, że \( \displaystyle d \) jest metryką zadaną przez normę \( \displaystyle \displaystyle\|\cdot\|. \)

Dowód 3.3.

Załóżmy, że \( \displaystyle \displaystyle\|\cdot\| \) jest normą w \( \displaystyle X. \) Pokażemy, że odwzorowanie \( \displaystyle d\colon X\times X\longrightarrow\mathbb{R}_+ \) zadane przez \( \displaystyle d(x,y)\stackrel{df}{=}\|x-y\| \) jest metryką w \( \displaystyle X. \)
(1) Zauważmy, że dla dowolnych \( \displaystyle x,y\in X \):

\( \displaystyle d(x,y) \ =\ \|x-y\| \ \ge\ 0 \)

oraz

\( \displaystyle d(x,y)=0 \quad\Longleftrightarrow\quad \|x-y\|=0 \quad\Longleftrightarrow\quad x=y. \)

(2) Dla dowolnych \( \displaystyle x,y\in X \) mamy

\( \displaystyle d(x,y) \ =\ \|x-y\| \ =\ |-1|\|x-y\| \ =\ \|(-1)(x-y)\| \ =\ \|-x+y\| \ =\ \|y-x\| \ =\ d(y,x). \)

(3) Dla dowolnych \( \displaystyle x,y,z\in X \) mamy

\( \displaystyle d(x,y) \ =\ \|x-y\| \ =\ \|x-z+z-y\| \ \le\ \|x-z\|+\|z-y\| \ =\ d(x,z)+d(z,y), \)

a więc zachodzi warunek trójkąta dla \( \displaystyle d. \)

Pokazaliśmy zatem, że \( \displaystyle d \) jest metryką.

Uwaga 3.4.

(1) Z powyższego twierdzenia wynika, że każda norma zadaje metrykę.
(2) Nie każda metryka jest zadana przez normę (patrz wniosek 3.13.).
(3) Zbieżność w sensie metryki zadanej przez normę nazywamy zbieżnością silną lub zbieżnością w normie, to znaczy jeśli \( \displaystyle \displaystyle\{x_n\}\subseteq X \) jest ciągiem, to

\( \displaystyle x_n \ \stackrel{\|\cdot\|}{\longrightarrow} x \ \ \ \stackrel{df}{\Longleftrightarrow}\ \ \ \|x_n-x\| \ \longrightarrow\ 0. \)

(4) Normy: euklidesowa, taksówkowa, maksimowa, zdefiniowane w przykładzie 3.2., zadają odpowiednio metryki: euklidesową, taksówkową, maksimową (patrz ćwiczenie 3.2.).

W przypadku norm można rozważać ich równoważność.

Definicja 3.5.

Dwie normy \( \displaystyle \displaystyle\|\cdot\|_{a} \) i \( \displaystyle \displaystyle\|\cdot\|_{b} \) w przestrzeni unormowanej \( \displaystyle X \) nazywamy równoważnymi, jeśli

\( \displaystyle \exists m,M>0\ \ \forall x\in X:\ \ m\|x\|_{a} \ \le\ \|x\|_{b} \ \le\ M\|x\|_{a}. \)

Równoważność norm ma następujące własności.

Uwaga 3.6.

(1) Relacja równoważności norm jest relacją równoważnościową w zbiorze wszystkich norm na danej przestrzeni unormowanej.
(2) Normy: euklidesowa \( \displaystyle \displaystyle\|\cdot\|_2 \); maksimowa \( \displaystyle \displaystyle\|\cdot\|_{\infty} \) taksówkowa \( \displaystyle \displaystyle\|\cdot\|_1 \) są równoważne (będzie to pokazane na ćwiczeniach; patrz ćwiczenie 3.3.). Okazuje się, że w przestrzeniach wektorowych skończenie wymiarowych wszystkie normy są równoważne.

Twierdzenie 3.7.

Twierdzenie to podajemy tu bez dowodu. Wszystkie normy w \( \displaystyle \displaystyle\mathbb{R}^N \) są równoważne.

Kolejne twierdzenie mówi, że odwzorowanie normy \( \displaystyle \displaystyle\|\cdot\|\colon X\longrightarrow\mathbb{R}_+ \) jest ciągłe (oczywiście w przestrzeni \( \displaystyle X \) rozważamy metrykę zadaną przez normę, a w \( \displaystyle \displaystyle\mathbb{R} \) metrykę euklidesową).

Twierdzenie 3.8.

Wszystkie normy w \( \displaystyle \displaystyle\mathbb{R}^{N} \) są równoważne.

Twierdzenie 3.9. [ciągłość normy]

Norma jest funkcją ciągłą, to znaczy

\( \displaystyle \lim\limits_{n \to +\infty} x_n = x \ \ \ \Longrightarrow\ \ \ \lim\limits_{n \to+\infty}\|x_n\|=\|x\|. \)

W dowodzie powyższego twierdzenia wykorzystamy następujący lemat, będący wariantem nierówności trójkąta.

Lemat 3.9.

Jeśli \( \displaystyle X \) jest przestrzenią unormowaną, to

\( \displaystyle \forall x,y\in X:\ \big|\|x\|-\|y\|\big| \ \le\ \|x-y\|. \)

Dowód 3.9.

Korzystając z subaddytywności normy, dla dowolnych \( \displaystyle x,y\in X \) mamy

\( \displaystyle \|x\| \ =\ \|x+(-y)+y\| \ \le\ \|x-y\|+\|y\|, \)

czyli

\( \displaystyle \|x\|-\|y\| \ \le\ \|x-y\|. \) Analogicznie pokazujemy, że

\( \displaystyle \|y\|-\|x\| \ \le\ \|x-y\|. \)

Obie powyższe nierówności implikują nierówność w tezie lematu.

Dowód 3.8.

Warunek \( \displaystyle \displaystyle\lim\limits_{n \to +\infty} x_n = x \) oznacza, że

\( \displaystyle \lim\limits_{n \to +\infty} \|x_n-x\| \ =\ 0. \)

Ustalmy dowolne \( \displaystyle \displaystyle\varepsilon>0. \) Z powyższej równości wynika, że

\( \displaystyle \exists N\forall n\ge N:\ \|x_n-x\| \ \le\ \varepsilon. \)

Zatem dla \( \displaystyle n\ge N \) mamy

\( \displaystyle \big|\|x_n\|-\|x\|\big| \ \le\ \|x_n-x\| \ \le\ \varepsilon. \)

Zatem pokazaliśmy, że \( \displaystyle \displaystyle\|x_n\|\stackrel{\mathbb{R}}{\longrightarrow}\|x\|. \)

Uwaga 3.10.

(1) Implikacja odwrotna do implikacji w twierdzenieu 3.7. nie jest prawdziwa.
Aby to zobaczyć, rozważmy ciąg \( \displaystyle \displaystyle\{x_n\}\subseteq \mathbb{R} \) zadany przez \( \displaystyle x_n=(-1)^n. \) Wówczas

\( \displaystyle \|x_n\|_2 \ =\ 1 \ \longrightarrow\ 1, \)

ale sam ciąg \( \displaystyle \displaystyle\{x_n\} \) nie jest silnie zbieżny (dlaczego?)
(2) Jeżeli granicą ciągu \( \displaystyle \displaystyle\{x_n\} \) jest \( \displaystyle \displaystyle\Theta \) (wektor "zerowy" przestrzeni wektorowej), to implikację w twierdzenieu 3.7. można odwrócić, to znaczy zachodzi równoważność:

\( \displaystyle \lim\limits_{n \to +\infty} x_n = \Theta \ \ \ \Longleftrightarrow\ \ \ \lim\limits_{n \to +\infty}\|x_n\|=0 \)
(dowód pozostawiamy jako proste ćwiczenie).

W przestrzeniach wektorowych możemy mówić o wypukłości zbiorów.

Definicja 3.11.

Niech \( \displaystyle X \) będzie przestrzenią unormowaną oraz \( \displaystyle A\subseteq X. \)
(1) Jeśli \( \displaystyle x,y\in X, \) to odcinkiem w \( \displaystyle X \) łączącym punkty \( \displaystyle x \) i \( \displaystyle y \) nazywamy zbiór

\( \displaystyle [x,y] \ \stackrel{df}{=}\ \bigg\{z\in X:\ z=\lambda x+(1-\lambda)y:\ \ \lambda\in[0,1]\bigg\}. \)

(2) Mówimy, że zbiór \( \displaystyle A \) jest wypukły, jeśli

\( \displaystyle \forall x,y\in A:\ \ [x,y]\subseteq A. \)

wykres

Dowód 3.12.

Niech \( \displaystyle a\in X \) oraz \( \displaystyle r>0. \) Pokażemy, że kula \( \displaystyle K(a,r) \) jest zbiorem wypukłym. W tym celu wybierzmy dowolne \( \displaystyle x_1,x_2\in K(a,r). \) Z definicji kuli wynika, że

\( \displaystyle \|x_1-a\| < r,\quad \|x_2-a\| < r. \)

Niech \( \displaystyle x\in[x_1,x_2]. \) Należy pokazać, że \( \displaystyle x\in K(a,r). \) Z definicji odcinka w \( \displaystyle X \) wiemy, że

\( \displaystyle \exists \lambda\in[0,1]:\ x=\lambda x_1+(1-\lambda)x_2. \)

Zatem

\( \displaystyle \|x-a\| \ =\ \|\lambda x_1+(1-\lambda)x_2-a\| \ =\ \|\lambda(x_1-a)+(1-\lambda)(x_2-a)\| \ \le\ \lambda\|x_1-a\|+(1-\lambda)\|x_2-a\| \ < \ \lambda r+(1-\lambda)r \ =\ r. \)

Zatem pokazaliśmy, że \( \displaystyle x\in K(a,r). \) Dowód, że \( \displaystyle \overline{K}(a,r) \) jest zbiorem wypukłym, jest analogiczny.

Powyższe twierdzenie dostarcza nam pewnego warunku koniecznego na to, aby dana przestrzeń metryczna była zadana przez normę.
Wniosek 3.13.

Metryka kolejowa i metryka rzeka w \( \displaystyle \displaystyle\mathbb{R}^2 \) nie są zadane przez żadną normę, ponieważ kule w tych metrykach nie są zbiorami wypukłymi (patrz przykład 1.5. oraz przykład 1.6.).

wykresy x2

Przypomnijmy, że przestrzeń metryczną nazywamy zupełną, gdy każdy ciąg Cauchy'ego tej przestrzeni ma granicę (patrz definicja 2.10.). Wśród przestrzeni unormowanych szczególną rolę odgrywają przestrzenie unormowane zupełne.

rycina

Definicja 3.13. [przestrzeń Banacha]

Przestrzenią Banacha nazywamy przestrzeń unormowaną zupełną.

Przykład 3.14.

(1) \( \displaystyle \displaystyle\big(\mathbb{R}^N,\|\cdot\|_{2}\big) \) jest przestrzenią Banacha (patrz wniosek 2.21.).
(2) Przestrzeń \( \displaystyle C\big([a,b];\mathbb{R}\big) \) z normą \( \displaystyle \displaystyle\|f\|_{\infty}=\sup\limits_{x\in[a,b]}\big|f(x)\big| \) jest przestrzenią Banacha (patrz ćwiczenie 3.5.).

Przestrzenie unitarne

W przestrzeniach wektorowych możemy wprowadzić pojęcie iloczynu skalarnego. Dzięki niemu będziemy mogli mówić o prostopadłości wektorów. Okaże się, że przestrzenie z iloczynem skalarnym są także przestrzeniami unormowanymi z naturalnie wprowadzoną normą.

Definicja 3.15.

Niech \( \displaystyle X \) będzie rzeczywistą przestrzenią wektorową. Odwzorowanie \( \displaystyle \displaystyle (\cdot|\cdot)\colon X\times X\longrightarrow \mathbb{R} \) nazywamy iloczynem skalarnym w \( \displaystyle X, \) jeśli:
(1) \( \displaystyle \displaystyle\forall x\in X:\ \ \big[(x|x)\ge 0\big] \ \) i \( \displaystyle \ \big[ (x|x)=0 \ \Longleftrightarrow\ x=\Theta \big], \)
(2) \( \displaystyle \displaystyle\forall x,y\in X,\ \lambda\in\mathbb{R}:\ \ (\lambda x|y)=\lambda(x|y), \)
(3) \( \displaystyle \displaystyle\forall x,y,z\in X:\ \ (x+y|z)=(x|z)+(y|z), \)
(4) \( \displaystyle \displaystyle\forall x,y\in X:\ \ (x|y)=(y|x) \) (symetria).
Parę \( \displaystyle \displaystyle (X,(\cdot|\cdot)) \) nazywamy przestrzenią unitarną.

Uwaga 3.16.

(a) Warunki (2) i (3) mówią, że iloczyn skalarny jest liniowy ze względu na pierwszą zmienną.
(b) Ze względu na symetrię (4), iloczyn skalarny jest także liniowy ze względu na drugą zmienną, zatem jest on dwuliniowy.

Przykład 3.17

Odwzorowanie zdefiniowane przez

\( \displaystyle (x|y) \ \stackrel{df}{=}\ \displaystyle \sum_{i=1}^N x_iy_i \quad \) dla \( \displaystyle \ x=(x_1,\ldots,x_N),\ y=(y_1,\ldots,y_N)\in\mathbb{R}^N \)

jest iloczynem skalarnym w \( \displaystyle \displaystyle\mathbb{R}^N. \) Nazywamy go standardowym iloczynem skalarnym w \( \displaystyle \mathbb{R}^N \). Iloczyn ten znamy ze szkoły dla przestrzeni \( \displaystyle \mathbb{R}^2 \) i \( \displaystyle \mathbb{R}^3 \).

Sprawdzimy kolejno punkty definicji iloczynu skalarnego.
(1) Dla dowolnego \( \displaystyle x\in\mathbb{R}^N \) mamy

\( \displaystyle (x|x) \ =\ \sum_{n=1}^N x_i^2 \ \ge\ 0 \)

oraz

\( \displaystyle (x|x)=0 \ \Longleftrightarrow\ \sum_{n=1}^N x_i^2=0 \ \Longleftrightarrow\ x_1=\ldots=x_N \ \Longleftrightarrow\ x=\Theta. \)

(2) Dla dowolnych \( \displaystyle x,y\in\mathbb{R}^N \) oraz \( \displaystyle \lambda\in\mathbb{R} \) mamy

\( \displaystyle (\lambda x,y) \ =\ \sum_{n=1}^N \lambda x_iy_i \ =\ \lambda \sum_{n=1}^N x_iy_i \ =\ \lambda (x|y) \)

(3) Dla dowolnych \( \displaystyle x,y,z\in\mathbb{R}^N \) mamy

\( \displaystyle (x+y|z) \ =\ \sum_{n=1}^N (x_i+y_i)z_i \ =\ \sum_{n=1}^N(x_iz_i+y_iz_i) \ =\ \sum_{n=1}^N x_iz_i +\sum_{n=1}^Ny_iz_i \ =\ (x|z)+(y|z). \) (4) Dla dowolnych \( \displaystyle x,y\in\mathbb{R}^N \) mamy

\( \displaystyle (x|y) \ =\ \sum_{n=1}^N x_iy_i \ =\ \sum_{n=1}^N y_ix_i \ =\ (y|x). \)

Zatem pokazaliśmy, że odwzorowanie \( \displaystyle (x|y)=\displaystyle \sum_{i=1}^N x_iy_i \) jest iloczynem skalarnym w \( \displaystyle \mathbb{R}^N \).

Okazuje się, że przestrzeń z iloczynem skalarnym jest przestrzenią unormowaną.

Twierdzenie 3.18.

Jeśli \( \displaystyle \displaystyle (X,(\cdot|\cdot)) \) jest przestrzenią unitarną oraz \( \displaystyle \displaystyle\forall x\in X:\ \|x\|_{}\ \stackrel{df}{=}\ \sqrt{(x|x)} , \) to \( \displaystyle \displaystyle\|\cdot\|_{} \) jest normą w \( \displaystyle X. \)
Mówimy, że \( \displaystyle \displaystyle\|\cdot\|_{} \) jest normą zadaną przez iloczyn skalarny \( \displaystyle \displaystyle (\cdot|\cdot). \)

W dowodzie wykorzystamy następującą nierówność Schwarza, zachodzącą w przestrzeniach unitarnych.

Lemat 3.19. [nierówność Schwarza]

Jeśli \( \displaystyle \displaystyle (X,(\cdot|\cdot)) \) jest przestrzenią unitarną, to

\( \displaystyle \forall x,y\in X:\ \ |(x|y)|\le\|x\|\|y\|. \)

Dowód 3.20.

Ustalmy dowolne \( \displaystyle x,y\in X. \) Jeśli \( \displaystyle y=\Theta \) to powyższa nierówność jest oczywistą równością. Załóżmy, że \( \displaystyle y\ne \Theta. \) Niech \( \displaystyle \displaystyle \lambda=\frac{(x|y)}{(y|y)} \) Korzystając z dwuliniowości iloczynu skalarnego, mamy:

\( \displaystyle 0 \ \le\ (x-\lambda y|x-\lambda y) \ =\ (x|x)-2\lambda(x|y)+\lambda^2(y|y) \ =\ (x|x)-2\frac{(x|y)^2}{(y|y)} +\frac{(x|y)^2}{(y|y)} \)

\( \displaystyle =\ (x|x) -\frac{(x|y)^2}{(y|y)} \ =\ \|x\|-\frac{(x|y)^2}{\|y\|}. \)

Zatem mamy

\( \displaystyle \frac{(x|y)^2}{\|y\|^2} \ \le\ \|x\|^2, \)

skąd

\( \displaystyle (x|y)^2 \ \le\ \|x\|^2\cdot \|y\|^2, \)

a zatem

\( \displaystyle |(x|y)| \ \le\ \|x\|\cdot\|y\|, \)

co należało dowieść.

Uwaga 3.21.

Zauważmy, że nierówność Cauchy'ego (patrz lemat 3.8.) jest szczególnym przypadkiem nierówności Schwarza, gdy w przestrzeni \( \displaystyle \displaystyle\mathbb{R}^N \) mamy standardowy iloczyn skalarny.

Dowód 3.21.

(1)

\( \displaystyle \|x\|=0 \ \Longleftrightarrow\ (x|x)=0 \ \Longleftrightarrow x=\Theta, \)

a więc pierwszy warunek w definicji normy jest spełniony.
(2)

\( \displaystyle \|\lambda x\| \ =\ \sqrt{(\lambda x|\lambda x)} \ =\ \sqrt{\lambda^2}\sqrt{(x|x)} \ =\ |\lambda|\|x\|, \)

zatem drugi warunek (jednorodność) w definicji normy jest spełniony.
(3) Korzystając z nierówności Schwarza, mamy

\( \displaystyle \|x+y\|^2 \ =\ (x+y|x+y) \ =\ (x|x)+2(x|y)+(y|y) \ \le\ \|x\|^2+2\|x\|\cdot\|y\| +\|y^2\| \ =\ (\|x\|+\|y\|)^2, \)

a więc

\( \displaystyle \|x+y\| \ \le\ \|x\|+\|y\|. \) zatem trzeci warunek (subaddytywność) w definicji normy jest spełniony.

Przykład 3.22.

Iloczyn skalarny w \( \displaystyle \mathbb{R}^N \) dany wzorem (patrz przykład 3.17.)

\( \displaystyle (x|y) \ \stackrel{df}{=}\ \displaystyle \sum_{i=1}^N x_iy_i \quad \) dla \( \displaystyle \ x=(x_1,\ldots,x_N),\ y=(y_1,\ldots,y_N)\in\mathbb{R}^N \)

zadaje normę euklidesową, bo

\( \displaystyle \sqrt{(x|x)} \ =\ \sqrt{\displaystyle \sum_{i=1}^N x_i^2} \ =\ \|x\|_{2}. \)

Podobnie jak dla przestrzeni unormowanych, tak i dla przestrzeni unitarnych szczególną rolę odgrywają przestrzenie unitarne zupełne.

wykłady

Twierdzenie 3.24. [ciągłość iloczynu skalarnego]

Iloczyn skalarny w przestrzeni unitarnej jest funkcją ciągłą, to znaczy

\( \displaystyle \bigg[ x_n\stackrel{X}{\longrightarrow} x,\ y_n\stackrel{X}{\longrightarrow} y \bigg] \ \ \Longrightarrow\ \ \bigg[ (x_n|y_n) \ \stackrel{\mathbb{R}}{\longrightarrow}\ (x|y) \bigg] \)

(oczywiście zbieżność \( \displaystyle \displaystyle x_n\stackrel{X}{\longrightarrow} x \) oznacza zbieżność w normie zadanej przez iloczyn skalarny \( \displaystyle \displaystyle (\cdot|\cdot) \)).

Dowód 3.24. [dowód nadobowiązkowy]

Niech \( \displaystyle \displaystyle\{(x_n,y_n)\} \) będzie ciągiem takim, że \( \displaystyle \displaystyle x_n\stackrel{X}{\longrightarrow} x \) i \( \displaystyle \displaystyle y_n\stackrel{X}{\longrightarrow} y. \) Oznacza to, że

\( \displaystyle \|x_n-x\| \ \longrightarrow\ 0,\quad \|y_n-y\| \ \longrightarrow\ 0 \)

oraz z ciągłości normy (patrz twierdzenie 3.7.), mamy

\( \displaystyle \|x_n\|\longrightarrow \|x\|. \)

Korzystając z nierówności Schwarza, mamy

\( \displaystyle \big|(x_n|y_n)-(x|y)\big| \ =\ \big|(x_n|y_n)-(x_n|y)+(x_n|y)-(x|y)\big| \ \le\ \big|(x_n|y_n-y)+(x_n-x|y)\big| \)

\( \displaystyle \le\ \|x_n\|\cdot\|y_n-y\| +\|x_n-x\|\cdot\|y\|. \)

Z wyżej wskazanych zbieżności w \( \displaystyle \displaystyle\mathbb{R} \) wynika, że prawa strona nierówności, a zatem także lewa, zmierza do zera, gdy \( \displaystyle n \to +\infty. \) Oznacza to, że \( \displaystyle \displaystyle (x_n|y_n)\stackrel{\mathbb{R}}{\longrightarrow}(x|y), \) co należało dowieść.

W przestrzeni unitarnej możemy wprowadzić pojęcie prostopadłości wektorów.

wykres

Definicja 3.25.

Niech \( \displaystyle \displaystyle\big(X,(\cdot|\cdot)\big) \) będzie przestrzenią unitarną.

(1) Jeśli \( \displaystyle \displaystyle (x|y)=0, \) to mówimy, że wektory \( \displaystyle x \) i \( \displaystyle y \) są ortogonalne (lub prostopadłe) i piszemy \( \displaystyle x\perp y. \)

(2) Niech \( \displaystyle Y \) będzie podprzestrzenią wektorową \( \displaystyle X. \) Mówimy, że wektor \( \displaystyle x \) jest ortogonalny (prostopadły, normalny) do podprzestrzeni \( \displaystyle Y, \) jeśli

\( \displaystyle \forall y\in Y:\ x\perp y. \)

Piszemy \( \displaystyle x\perp Y. \)

(3) Mówimy, że wektory \( \displaystyle a_1,\ldots,a_k\in X \) tworzą układ ortogonalny, jeśli

\( \displaystyle (a_i|a_j)=0 \qquad\forall\ i\ne j. \)

(4) Mówimy, że wektory \( \displaystyle a_1,\ldots,a_k\in X \) tworzą układ ortonormalny, jeśli

\( \displaystyle \forall i,j:\ \ (a_i|a_j)=\delta_{ij} \ \stackrel{df}{=}\ \{ \begin{array} {ll} 1 & \quad i=j, \\ 0 & \quad i\ne j \end{array} . \)

(to znaczy wektory \( \displaystyle a_1,\ldots,a_k \) są parami ortogonalne oraz mają normę \( \displaystyle 1 \)).

Poniższe twierdzenie podamy tu bez dowodu.

wykres

Twierdzenie 3.26.

Każda przestrzeń unitarna skończenie wymiarowa posiada bazę ortonormalną (to znaczy bazę tworzącą układ ortonormalny).

Przykład 3.27.

Baza kanoniczna w \( \displaystyle \displaystyle\mathbb{R}^N \) jest bazą ortonormalną.

Twierdzenie 3.28. [warunek równoległoboku]

Jeśli \( \displaystyle \displaystyle\big(X,(\cdot|\cdot)\big) \) jest przestrzenią unitarną oraz \( \displaystyle \displaystyle\|\cdot\| \) jest normą zadaną przez iloczyn skalarny, to

\( \displaystyle \forall x,y\in X:\ \ \|x+y\|^{2} +\|x-y\|^{2} \ =\ 2\big(\|x\|^{2}+\|y\|^{2}\big). \)

Dowód 3.28.

Dla dowolnych ustalonych \( \displaystyle x,y\in X \) liczymy

\( \displaystyle \|x+y\|^2 \ =\ \|x\|^2+2(x|y)+\|y\|^2, \)

oraz

\( \displaystyle \|x-y\|^2 \ =\ \|x\|^2-2(x|y)+\|y\|^2. \)

Dodając stronami powyższe równości, dostajemy tezę twierdzenia.

Twierdzenie 3.29. [Twierdzenie Pitagorasa]

Jeśli \( \displaystyle \displaystyle\big(X,(\cdot|\cdot)\big) \) jest przestrzenią unitarną oraz \( \displaystyle \displaystyle\|\cdot\| \) jest normą zadaną przez iloczyn skalarny, to

\( \displaystyle \forall x,y\in X:\ \ \bigg[ x\perp y \ \ \Longleftrightarrow\ \ \|x+y\|^{2} = \|x\|^{2}+\|y\|^{2} \bigg]. \)

Dowód 3.29.

Dla dowolnych ustalonych \( \displaystyle x,y\in X \) liczymy

\( \displaystyle \|x+y\|^2 \ =\ \|x\|^2+2\underbrace{(x|y)}_{=0}+\|y\|^2 \ =\ \|x\|^2+\|y\|^2, \)

co należało dowieść.
Zauważmy, że gdy \( \displaystyle X=\mathbb{R}^2, \) to implikacja w prawą stronę w powyższym twierdzeniu \( \displaystyle (\Rightarrow) \), to znane ze szkoły twierdzenie Pitagorasa. Implikację \( \displaystyle (\Leftarrow) \), znamy ze szkoły, jako twierdzenie odwrotne do twierdzenia Pitagorasa.