Odległość

Odległość


W szkole spotkaliśmy się już z pojęciem odległości na przykład liczb na osi rzeczywistej lub punktów na płaszczyźnie \( \displaystyle\mathbb{R}^2 \) (odległość euklidesowa).

Okazuje się, że odległość można mierzyć na wiele różnych sposobów. Umówiono się, że funkcja przyporządkowująca parze punktów zbioru liczbę, którą nazwiemy ich odległością, musi spełniać kilka warunków. Tę funkcję będziemy nazywać metryką, a warunki precyzuje poniższa definicja.

Definicja 3.1. [metryka]

grafka

Metryką w \( \mathbb{R}^N \) nazywamy dowolną funkcję \( d\colon \mathbb{R}^N\times \mathbb{R}^N\longrightarrow\mathbb{R}_+=[0,+\infty) \) spełniającą następujące warunki:
(1) \( \displaystyle\forall x\in \mathbb{R}^N:\ d(x,y)=0\ \Longleftrightarrow\ x=y \);
(2) \( \displaystyle\forall x,y\in \mathbb{R}^N:\ d(x,y)=d(y,x) \) (warunek symetrii);
(3) \( \displaystyle\forall x,y,z\in \mathbb{R}^N:\ d(x,y)+d(y,z)\ge d(x,z) \) (warunek trójkąta).

Dla dowolnych \( x,y\in \mathbb{R}^N, \) liczbę \( d(x,y) \) nazywamy odległością punktów \( x \) i \( y \) oraz mówimy, że punkty \( x \) i \( y \) są oddalone od siebie o \( d(x,y). \)

wykres

Zwróćmy uwagę, że warunki w powyższej definicji są dość naturalnymi warunkami jakie powinna spełniać odległość. Mówią one, że odległość dwóch punktów wynosi zero tylko wtedy, gdy punkty się pokrywają. Odległość od punktu \( A \) do punktu \( B \) jest równa odległości od punktu \( B \) do punktu \( A \). Trzeci warunek mówi, że odległość od \( A \) do \( B \) nie może być większa, od sumy odległości od \( A \) do \( C \) i od \( C \) do \( B \), co także jest naturalnym żądaniem.

Jeśli potrafimy już mierzyć odległość, to możemy zdefiniować kulę o promieniu \( r \), czyli zbiór punktów, których odległość od wybranego punktu (zwanego środkiem kuli) jest mniejsza niż \( r \).

Definicja 3.2. [kula, kula domknięta]

Niech \( x_0\in \mathbb{R}^N \) oraz \( r\ge 0. \)
Kulą o środku w punkcie \( x_0 \) i promieniu \( r \) nazywamy zbiór:

\( K(x_0,r) \ \stackrel{df}{=}\ \big\{x\in \mathbb{R}^N:\ d(x_0,x) < r\big\}. \)

Kulą domkniętą o środku w punkcie \( x_0 \) i promieniu \( r \) nazywamy zbiór:

\( \overline{K}(x_0,r) \ \stackrel{df}{=}\ \big\{x\in \mathbb{R}^N:\ d(x_0,x)\le r\big\}. \)

Z powyższej definicji wynika, iż kulą o środku \( x_0 \) i promieniu \( r\ge 0 \) nazywamy zbiór punktów przestrzeni \( \mathbb{R}^N, \) których odległość od środka \( x_0 \) jest mniejsza od \( r. \) Analogicznie kulą domkniętą o środku \( x_0 \) i promieniu \( r\ge 0 \) nazywamy zbiór punktów przestrzeni \( \mathbb{R}^N, \) których odległość od środka \( x_0 \) nie jest większa od \( r. \)

Zanim przejdziemy do przykładów przestrzeni metrycznych oraz kul, podamy pewne własności kul.

Uwaga 3.3. [własności kul]

Niech \( x_0\in \mathbb{R}^N. \)
(1) Jeśli \( r>0, \) to \( x_0\in K(x_0,r). \)
(2) Jeśli \( r=0, \) to \( K(x_0,r)=\emptyset. \)
(3) Jeśli \( r_1 < r_2, \) to \( K(x_0,r_1)\subseteq K(x_0,r_2). \)

Powyższa uwaga (wynikająca w oczywisty sposób z definicji kuli) mówi, że:
(1) środek zawsze należy do kuli (o ile promień jest dodatni);
(2) kula jest zbiorem niepustym wtedy i tylko wtedy, gdy promień jest dodatni;
(3) jeśli dwie kule mają ten sam środek, to kula o mniejszym promieniu zawiera się w kuli o większym promieniu.

Podamy teraz przykłady metryk w \( \displaystyle\mathbb{R}^N \) oraz powiemy jak wyglądają kule w tych metrykach.

Pierwszy przykład wprowadza naturalną metrykę w \( \displaystyle\mathbb{R}. \) Z tym sposobem mierzenia odległości między punktami prostej spotkaliśmy się już w szkole.

Przykład 3.4. [metryka euklidesowa na prostej]

Niech \( N=1 \). Definiujemy

\( d_2(x,y) \ \stackrel{df}{=}\ |x-y| \quad\textrm{dla}\ x,y\in\mathbb{R}. \)

Funkcję \( d_2 \) nazywamy metryką euklidesową w \( \displaystyle\mathbb{R}. \)

Kule są przedziałami otwartymi i ograniczonymi w \( \displaystyle\mathbb{R}, \) a kule domknięte są przedziałami domkniętymi i ograniczonymi w \( \displaystyle\mathbb{R}. \)

Zauważmy, że już w powyższym przykładzie kula nie przypomina tego co potocznie uważa się za kulę. Za chwilę zobaczymy, że (w zależności od sposobu mierzenia odległości) kula na płaszczyźnie może wyglądać inaczej niż by to wynikało z naszych przyzwyczajeń.

Trzy kolejne przykłady podają naturalne metryki jakie można wprowadzić w \( \displaystyle\mathbb{R}^N. \)

wykres

Przykład 3.5. [metryka maksimowa]

Niech

\( d_{\infty}(x,y) \ \stackrel{df}{=}\ \max_{i=1,\ldots, N}|x_i-y_i| \quad\textrm{dla}\ x,y\in\mathbb{R}^N, \)

gdzie \( x=(x_1,\ldots,x_N) \) oraz \( y=(y_1,\ldots,y_N). \)

Tak zdefiniowana funkcja \( d_{\infty} \) jest metryką (dowód tego faktu pozostawiony jest na ćwiczenia; patrz ćwiczenie 3.1.). Nazywamy ją metryką maksimową w \( \displaystyle\mathbb{R}^N. \)

Poniższe rysunki przedstawiają kule w metryce maksimowej.

wykres

Przykład 3.6. [metryka taksówkowa]

Definiujemy

\( \displaystyle d_1(x,y) \ \stackrel{df}{=}\ \sum_{i=1}^{N}|x_i-y_i| \quad\textrm{dla}\ x,y\in\mathbb{R}^N. \)

Tak zdefiniowana funkcja \( (\mathbb{R}^N,d_1) \) jest metryką (dowód tego faktu pozostawiony jest na ćwiczenia; patrz ćwiczenie 3.1.). Nazywamy ją

metryką taksówkową w \( \mathbb{R}^N \).

wykres

Metryka taksówkowa jest naturalnym sposobem mierzenia odległości w niektórych miastach (patrz mapa Turynu). Jeśli mieszkamy w Turynie przy Corso Vittorio Emanuele II, a nasz przyjaciel przy Corso Galileo Ferraris, to odległość jaką musimy przejechać taksówką by go odwiedzić, to będzie długość drogi od naszego domu do skrzyżowania obu ulic (czyli wartość bezwzględna różnicy współrzędnych na jednej osi) oraz długość drogi od skrzyżowania do domu przyjaciela (czyli wartość bezwzględna różnicy współrzędnych na drugiej osi).

Przykład 3.7. [metryka euklidesowa]

Zdefiniujmy

\( \displaystyle d_2(x,y) \ \stackrel{df}{=}\ \sqrt{\sum_{i=1}^N(x_i-y_i)^2} \quad\textrm{dla}\ x,y\in\mathbb{R}^N. \)

Tak zdefiniowana funkcja \( d_2 \) jest metryką. Nazywamy ją metryką euklidesową w \( \mathbb{R}^N \). Ten sposób mierzenia odległości między punktami

\( \mathbb{R}^2 \) lub \( \mathbb{R}^3 \) jest nam znany ze szkoły.

wykresy 2

Wykażemy teraz, że \( d_2 \) spełnia warunki definicji metryki. Dowód dwóch pierwszych warunków zostawiamy jako proste ćwiczenie. W dowodzie nierówności trójkąta dla metryki \( d_2 \) wykorzystamy następującą nierówność Cauchy'ego.

Lemat 3.8. [nierówność Cauchy'ego]

\( \forall a,b\in\mathbb{R}^N:\ \bigg(\displaystyle \sum_{i=1}^N a_ib_i\bigg)^2 \ \le\ \bigg(\displaystyle \sum_{i=1}^N a_i^2\bigg) \bigg(\displaystyle \sum_{i=1}^N b_i^2\bigg) \)

Dowód 3.8.

Ustalmy dowolne \( a,b\in\mathbb{R}^N \). Rozważmy następujący trójmian kwadratowy zmiennej \( \displaystyle\lambda \):

\( w(\lambda) \ =\ \bigg(\displaystyle \sum_{i=1}^N a_i^2\bigg)\lambda^2 +2 \bigg(\displaystyle \sum_{i=1}^N a_i b_i\bigg)\lambda +\bigg(\displaystyle \sum_{i=1}^N b_i^2\bigg). \)

Grupując składniki w powyższym wielomianie dostajemy

\( w(\lambda) \ =\ \displaystyle \sum_{i=1}^N \bigg[a_i^2\lambda^2+2 a_i b_i\lambda+b_i^2\bigg] \ =\ \displaystyle \sum_{i=1}^N(a_i\lambda+b_i)^2, \)

a zatem \( w(\lambda)\ge 0 \) dla dowolnego \( \displaystyle\lambda\in\mathbb{R}. \) Skoro trójmian kwadratowy jest stale nieujemny, to jego wyróżnik \( \displaystyle\Delta \) jest niedodatni, czyli

\( 0 \ \ge\ \Delta \ =\ 4\bigg(\displaystyle \sum_{i=1}^N a_ib_i\bigg)^2 -4\bigg(\displaystyle \sum_{i=1}^N a_i^2\bigg)\bigg(\displaystyle \sum_{i=1}^N b_i^2\bigg), \)

skąd dostajemy

\( \bigg( \displaystyle \sum_{i=1}^N a_ib_i \bigg)^2 \le\bigg(\displaystyle \sum_{i=1}^N a_i^2\bigg) \bigg(\displaystyle \sum_{i=1}^N b_i^2\bigg), \)

co należało dowieść.

Możemy teraz przystąpić do dowodu nierówności trójkąta dla \( d_2. \)

Lemat 3.9. [nierówność trójkąta dla metryki euklidesowej]

\( \forall x,y,z\in\mathbb{R}^N:\ d_2(x,z) \ \le\ d_2(x,y)+d_2(y,z). \)

Dowód 3.9.

Ustalmy dowolne \( x,y,z\in\mathbb{R}^N. \) Liczymy

\( \displaystyle (d_2(x,z))^2 \ =\ \displaystyle \sum_{i=1}^N (x_i-z_i)^2 \ =\ \displaystyle \sum_{i=1}^N (x_i-y_i+y_i-z_i)^2 \ =\ \)

\( \displaystyle \sum_{i=1}^N (x_i-y_i)^2 +2\displaystyle \sum_{i=1}^N (x_i-y_i)(y_i-z_i) +\displaystyle \sum_{i=1}^N (y_i-z_i)^2. \)

Korzystając z nierówności Cauchy'ego (patrz lemat 3.8.), mamy

\( \displaystyle \begin{align*} \big(d_2(x,z)\big)^2 & \le & \displaystyle \sum_{i=1}^N (x_i-y_i)^2 +2\sqrt{\displaystyle \sum_{i=1}^N (x_i-y_i)^2\displaystyle \sum_{i=1}^N (y_i-z_i)^2} +\displaystyle \sum_{i=1}^N (y_i-z_i)^2 \\ & = & \bigg[ \sqrt{\displaystyle \sum_{i=1}^N(x_i-y_i)^2} +\sqrt{\displaystyle \sum_{i=1}^N(y_i-z_i)^2} \bigg]^2 \ =\ \big(d_2(x,y)+d_2(y,z)\big)^2. \end{align*} \)

Zatem pokazaliśmy, że \( d_2(x,z)\le d_2(x,y)+d_2(y,z). \)

Uwaga 3.10.

Zauważmy, że w przypadku \( N=1 \) metryki euklidesowa, taksówkowa i maksimowa pokrywają się, to znaczy \( d_2=d_1=d_{\infty}. \) Kulami w tych metrykach są przedziały otwarte.

Zdefiniujemy teraz pewne pojęcia związane z metrykami.

grafika

Definicja 3.11.

Niech \( x_0\in \mathbb{R}^N \), \( A\subseteq \mathbb{R}^N \) oraz ustalmy pewną metrykę \( d \) w \( \mathbb{R}^N \).
(1) Zbiór \( U\subseteq\mathbb{R}^N \) nazywamy otwartym (w metryce \( d \)), jeśli każdy punkt tego zbioru zawiera się w tym zbiorze wraz z pewną kulą o środku w tym punkcie (i dodatnim promieniu), czyli

\( \forall x\in U\ \exists r>0:\ K(x,r)\subseteq U. \)

(2) Mówimy, że punkt \( x_0 \) jest punktem skupienia zbioru \( A\subseteq \mathbb{R}^N, \) jeśli każda kula o środku w punkcie \( x_0 \) (i dodatnim promieniu) zawiera przynajmniej jeden punkt zbioru \( A \) różny od \( x_0. \)
(3) Mówimy, że punkt \( x_0 \) jest punktem izolowanym zbioru \( A\subseteq \mathbb{R}^N \), jeśli \( x_0\in A \) oraz \( x_0 \) nie jest punktem skupienia zbioru \( A \).
(4) Zbiór \( A\subseteq \mathbb{R}^N \) nazywamy domkniętym, jeśli każdy punkt skupienia zbioru \( A \) należy do \( A. \)
(5) Zbiór nazywamy ograniczonym, jeśli jest zawarty w pewnej kuli, to znaczy

\( \exists x \in \mathbb{R}^N \, \exists r>0: \, A \subseteq K(x,r) \)

Zauważmy, że pojęcia występujące w powyższej definicji

grafika

(zbiór otwarty, domknięty, punkt skupienia, punkt izolowany, zbiór ograniczony) są związane nie tylko ze zbiorem \( \mathbb{R}^N \), ale także z wybraną w nim metryką \( d \). W definicji wszystkich tych pojęć używamy bowiem pojęcia kuli.

Przykład 3.12.

Rozważmy \( \mathbb{R} \) z metryką euklidesową oraz zbiór \( A=[0,1)\cup\{2\}\subseteq\mathbb{R} \). Punktami skupienia zbioru \( A \) są punkty przedziału \( \displaystyle [0,1]. \)

Jedynym punktem izolowanym zbioru \( A \) jest \( 2. \)

A nie jest zbiorem domkniętym, bo punkt \( 1 \) jest jego punktem skupienia, który do niego nie należy.

Zbiór \( A \) jest ograniczony, gdyż na przykład

\( A\subseteq K(0,3)=(-3,3). \)

wykresy

Przykład 3.13.

(1) Przedziały otwarte w przestrzeni euklidesowej \( \mathbb{R} \) są zbiorami otwartymi. Dla dowodu weźmy przedział \( \displaystyle (a,b) \) (\( a < b \)) oraz dowolny \( x\in (a,b) \). Niech \( r=\min\{x-a,b-x\}. \) Wówczas \( K(x,r)=(x-r,x+r)\subseteq (a,b). \)

(2) Kule są zawsze zbiorami otwartymi, a kule domknięte są zbiorami domkniętymi (fakt ten udowodnimy na wykładzie z Analiza matematyczna 2).

W kolejnym twierdzeniu zebrano szereg własności zbiorów w \( \mathbb{R}^N \) z ustaloną metryką \( d \) (twierdzenie pozostawiamy bez dowodu). Poniżej podamy jedynie pewne komentarze i wnioski wynikające z tego twierdzenia.

Twierdzenie 3.14. [zbiory związane z metryką]

Jeśli \( d \) jest metryką w \( \mathbb{R}^N \), to
(1) Zbiór \( U\subseteq\mathbb{R}^N \) jest otwarty, wtedy i tylko wtedy, gdy \( U^c \) (dopełnienie zbioru \( U \)) jest zbiorem domkniętym.
(2) Kule są zbiorami otwartymi, a kule domknięte są zbiorami domkniętymi.
(3) Suma dowolnej ilości zbiorów otwartych jest zbiorem otwartym.
(4) Przecięcie (część wspólna) skończonej ilości zbiorów otwartych jest zbiorem otwartym.
(5) Przecięcie (część wspólna) dowolnej ilości zbiorów domkniętych jest zbiorem domkniętym.
(6) Suma skończonej ilości zbiorów domkniętych jest zbiorem domkniętym.

wykres

Przykład 3.15.

Rozważmy \( \mathbb{R} \) z metryką euklidesową \( d_2 \). Podamy przykłady ilustrujące powyższe twierdzenie.
(1) Zbiór \( \displaystyle (-\infty,-1]\cup [1,+\infty) \) jest zbiorem domkniętym (jako uzupełnienie kuli \( K(0,1)=(-1,1) \), która jest zbiorem otwartym).
(2) Przedział \( \displaystyle [-1,1] \) jest zbiorem domkniętym, gdyż jest to kula domknięta \( \displaystyle\overline{K}(0,1) \). Zatem jej uzupełnienie \( \displaystyle (-\infty,-1)\cup (1,+\infty) \) jest zbiorem otwartym.
(3) Zbiory jednopunktowe są domknięte, gdyż są to kule domknięte o promieniu \( r=0 \).
(4) Ponieważ przedziały \( \displaystyle (n,n+1) \) dla \( n\in\mathbb{Z} \) są otwarte, więc ich suma (przeliczalna) jest także zbiorem otwartym. Zauważmy, że uzupełnieniem tej sumy jest zbiór liczb całkowitych \( \displaystyle\mathbb{Z} \). Zatem pokazaliśmy, że \( \displaystyle\mathbb{Z} \) jest zbiorem domkniętym.
(5) Powyższe twierdzenie mówi, że przecięcie skończonej ilości zbiorów otwartych jest zbiorem otwartym. Okazuje się, że dla nieskończonej ilości zbiorów otwartych nie musi być to prawdą. Podobnie suma nieskończenie wielu zbiorów domkniętych nie musi być zbiorem domkniętym (patrz ćwiczenie 3.5.)
(6) Zbiory skończone są domknięte (jako sumy skończonej ilości zbiorów jednoelementowych, które są zbiorami domkniętymi).