Uzupełniające materiały z logiki

Opis

Zapoznanie się z podstawowymi pojęciami i narzędziami matematyki. Wprowadzenie fundamentalnych obiektów matematycznych i opis ich własności.

Sylabus

Autorzy

Zawartość

Literatura

  1. H. Rasiowa, Wstęp do matematyki, Państwowe Wydawnictwo Naukowe, Warszawa 1971, 1984, 1998.
  2. K. Kuratowski, A. Mostowski, Teoria mnogości, Państwowe Wydawnictwo Naukowe, Warszawa 1978.
  3. W. Marek, J. Onyszkiewicz, Elementy logiki i teorii mnogosci w zadaniach, Wydawnictwo Naukowe PWN, Warszawa 1996.

Po co nam teoria mnogości? Naiwna teoria mnogości, naiwna indukcja, naiwne dowody niewprost

"Naiwna" teoria mnogości

Teoria zbiorów, zwana również teorią mnogości, została stworzona około połowy XIX wieku, przez niemieckiego matematyka Georga Cantora. Teoria mnogości to gałąź matematyki zajmująca się zbiorami - kolekcja obiektów. Skończone zbiory można definiować, wypisując kolejno wszystkie ich elementy. Georg Cantor był pierwszą osobą, która podjęła się przeniesienia na ścisły grunt matematyczny pojęcia zbioru nieskończonego. Według Georga Cantora zbiór może być dowolną kolekcją obiektów zwanych elementami. Według tego podejścia zbiór jest pojęciem podstawowym i niedefiniowalnym. Niestety podejście do teorii zbiorów w ten sposób rodzi paradoksy i dlatego teoria mnogości prezentowana w ten sposób jest często nazywana "naiwną" teorią mnogości.

Teoria matematyczna nie może dopuszczać istnienia paradoksów i dlatego na początku XX wieku zmieniono podejście do teorii mnogości. Zaproponowany przez Ernsta Zermelo i uzupełniony przez Adolfa Abrahama Halevi Fraenkela system aksjomatów wyklucza paradoksy, które spowodowały, że naiwna teoria zbiorów musiała zostać porzucona. Aksjomaty te nakładają pewne ograniczenia na konstrukcje zaproponowane przez Georga Cantora. W większości przypadków jednak intuicje związane z naiwną teorią mnogości sprawdzają się również w aksjomatycznej teorii zbiorów. Zaprezentowane poniżej, skrótowe przedstawienie "naiwnej teorii mnogości" ma na celu wyrobienie intuicji niezbędnych przy dalszej pracy nad formalną wersją tych teorii. Aksjomatyczna teoria zbiorów zostanie przedstawiona w Wykładzie 4.

W podejściu zaproponowanym przez Georga Cantora zbiory skończone można łatwo wskazywać poprzez wyliczenie ich elementów. Definiowanie zbiorów nieskończonych wymaga bardziej rozwiniętego języka, niemniej jednak, według Georga Cantora, każda kolekcja obiektów jest zbiorem. Podstawowym symbolem używanym przy definiowaniu i opisywaniu zbiorów jest
\( \in \)
oznaczający, że dany byt jest "elementem" pewnego zbioru. Napis

"Kraków" \( \in \) "zbiór wszystkich miast Polski"

ilustruje zastosowanie tego symbolu.

Aby zdefiniować zbiór należy określić definitywny sposób na rozpoznawania, czy dany byt jest elementem zbioru, czy nie. Najczęściej używanym symbolem przy definiowaniu zbioru są nawiasy klamrowe. Definicja skończonego zbioru może być bardzo łatwa. Zbiór
\( \{2,3, \) Kraków \( \} \)

posiada trzy elementy. Liczba 2 jest elementem tego zbioru \( 2\in\{2,3, \) Kraków \( \} \), ale również
Kraków \( \in\{2,3, \) Kraków\( \} \).

Dwa zbiory są sobie równe (takie same), jeśli posiadają dokładnie te same elementy. Jedynymi elementami zbioru \( \{2,3\} \) są liczby naturalne 2 i 3 - ten sam fakt jest prawdziwy dla zbioru \( \{2,2,3\} \), a więc

\( \{2,3\} = \{2,3,3\}. \)

Podobnie \( \{2,3\}=\{3,2\} \) i

\( \{2,3\}= \) "zbiór liczb naturalnych ściśle pomiędzy 1 a 4".

W definicji zbioru nie ma znaczenia kolejność, w jakiej wymienione są jego elementy, ani krotność w jakiej dany element pojawia się w zbiorze.

Zbiory można definiować na wiele sposobów. Najprostszym sposobem zdefiniowania zbioru jest wyliczenie jego elementów. Strategia ta zawodzi jednak w odniesieniu do zbiorów nieskończonych -- nie jesteśmy w stanie wypisać wszystkich liczb naturalnych. Zgodnie z postulatami Georga Cantora możemy przyjąć, że istnieje zbiór wszystkich liczb naturalnych. Czasami, na określenie zbiorów nieskończonych używamy nieformalnego zapisu - zbiór wszystkich liczb naturalnych może być zapisany jako \( \{0,1,2,3,4,\ldots\}. \)

W podejściu zaproponowanym przez Georga Cantora równoważna definicja tego zbioru brzmi

"zbiór wszystkich liczb naturalnych"

Bardzo często tworzymy zbiory składające się z obiektów spełniających daną własność. Zbiór liczb parzystych możemy zdefiniować w sposób następujący
\( \{x\,|\, x \) jest liczbą parzystą \( \}. \)

Bardziej ogólnie

\( \{x\,|\, \) warunek. \( \} \)

W skład powyżej zdefiniowanego zbioru wchodzą te elementy, które spełniają warunek występujący po znaku \( \,|\, \). Żeby zakwalifikować element do powyższego zbioru, wstawiamy go w miejsce \( x \) w warunku występującym po \( \,|\, \) i sprawdzamy, czy jest on prawdziwy. Żeby pokazać, że \( 2\in\{x\,|\, x \) jest liczbą parzystą \( \}, \) musimy dowieść, że warunek "2 jest liczbą parzystą" jest prawdziwy.

Pomiędzy zbiorem liczb parzystych a zbiorem wszystkich liczb naturalnych występuje oczywista zależność. Każda liczba parzysta jest liczbą naturalną, co, ujęte w języku zbiorów, oznacza, że każdy element zbioru liczb parzystych jest elementem zbioru liczb naturalnych. Zbiór liczb parzystych jest podzbiorem zbioru liczb naturalnych (a zbiór liczb naturalnych nadzbiorem zbioru liczb parzystych). Zapisujemy to w następujący sposób

\( \{x\,|\, x \) jest liczbą parzystą \( \}\subseteq \) "zbiór liczb naturalnych" \( . \)

Ogólniej, jeśli każdy element zbioru \( A \) jest elementem zbioru \( B \) mówimy, że zbiór \( A \) jest podzbiorem zbioru \( B \) i piszemy
\( A\subseteq B. \)
W takim przypadku mówimy, że pomiędzy zbiorami \( A \) i \( B \) zachodzi inkluzja.

W szczególności, dla dowolnego zbioru \( A \) zachodzi \( A \subseteq A \). Wspomnieliśmy wcześniej, że dwa zbiory są sobie równe wtedy i tylko wtedy, kiedy posiadają dokładnie takie same elementy. Fakt ten możemy zapisać formalnie w następujący sposób

\( A = B \) wtedy i tylko wtedy, kiedy \( A \subseteq B \) i \( B \subseteq A. \)

Często zależy nam na określeniu znaczącym, że jeden zbiór jest podzbiorem drugiego i że zbiory te nie są sobie równe. Używamy wtedy symbolu \( ⊊ \) w następujący sposób

\( A ⊊ B \) wtedy i tylko wtedy, kiedy \( ( A \subseteq B \) i nieprawda, że \( A=B). \)


Ćwiczenie 1.1

Dla każdej pary zbiorów poniżej określ, czy są sobie równe oraz czy jeden z nich jest nadzbiorem drugiego

  1. \( \{2,3\} \), \( \{x\,|\, x \) dzieli liczbę \( 6 \} \),
  2. "zbiór liczb naturalnych" , \( \{x\,|\, 2 \) dzieli \( x^2 \} \),
  3. \( \{x\,|\, x^2 =1\} \), \( \{x\,|\, x^3=1\} \).

Najczęstszymi operacjami wykonywanymi na zbiorach są operacje sumy, przecięcia i różnicy. Sumą dwóch zbiorów \( A \) i \( B \) jest zbiór oznaczony przez \( A\cup B \) w skład którego wchodzą wszystkie elementy zbioru \( A \), wszystkie elementy zbioru \( B \) i żadne elementy spoza tych zbiorów

\( A\cup B = \{x\,|\, x\in A \) lub \( x\in B\}. \)

rycina

Podobnie definiujemy przecięcie zbiorów
\( A\cap B = \{x\,|\, x\in A \) i \( x\in B\}. \)

ryvina

\( A\setminus B = \{x\,|\, x\in A \) i \( x\notin B\}. \)

rycina

Standardowy obrazek ilustrujący różnicę zbiorów.

Ćwiczenie 1.2

Dla następujących par zbiorów ustal zawieranie lub równość

  1. \( A= \) "zbiór liczb naturalnych" \( \setminus\{x\,|\, \) liczba nieparzysta, większa niż 2 dzieli \( x \} \)
    i drugi zbiór \( B=\{2^n\,|\, \) gdzie \( n \) jest liczbą naturalną \( \} \),
  2. \( A=\{x\,|\, \) liczba 2 dzieli \( x \}\cup\{x\,|\, \) liczba 3 dzieli \( x \} \) i zbiór \( B=\{x\,|\, \) liczba 6 dzieli \( x \} \).

Dla dowolnego zbioru \( \mathrm {A} \) zachodzi \( A\cup A = A \) i \( A\cap A = A \). Zbiór, który otrzymujemy jako wynik operacji \( A\setminus A \) jest zbiorem pustym. Na mocy definicji różnicy zbiorów elementami zbioru \( A\setminus A \) są wyłącznie te elementy \( A \), które nie należą do \( A \). Takie elementy nie istnieją - żaden element ze zbioru \( A \) nie należy do \( A\setminus A \) i żaden element spoza \( A \) nie należy do tego zbioru. Zbiór pusty jest oznaczany przez \( \emptyset \). Odejmowanie zbiorów od samych siebie nie jest jedynym sposobem na otrzymanie zbioru pustego.

\( \{1,2,2006\}\setminus \) "zbiór liczb naturalnych" \( = \) "zbiór psów" \( \setminus \) "zbiór wszystkich zwierząt"

Zbiór po lewej stronie nierówności jest równy zbiorowi po prawej stronie nierówności. Każdy element zbioru po prawej stronie jest również elementem zbioru po lewej stronie nierówności i vice versa, dlatego że żaden z tych zbiorów nie posiada elementów.

Niestety, podejście zaproponowane przez Georga Cantora i uściślone Friedricha Frege posiada błędy. Jedną z pierwszych osób które zwróciły uwagę na niedociągnięcia tej teorii jest Bertrand Russell. Zgodnie z zasadami zaproponowanymi przez [Biografia_Cantor|Georga Cantora]] można zdefiniować dowolny zbiór. Zdefiniujmy, więc zbiór

\( Z = \{A\,|\, A\notin A\}. \)

Zbiór \( Z \) składa się ze zbiorów, które nie są swoimi własnymi elementami. Paradoks zaproponowany przez Bertranda Russella polega na tym, że pytanie czy \( Z \) jest swoim własnym elementem prowadzi do sprzeczności. Jeśli \( Z\in Z \) to, zgodnie z definicją zbioru \( Z \) otrzymujemy \( Z\notin Z \), co jest sprzecznością z założeniem. Jeśli \( Z\notin Z \), to \( Z \) spełnia warunek na przynależność do \( Z \) i w związku z tym \( Z\in Z \), co jest kolejną sprzecznością. Definicja zbioru zaproponowana przez Georga Cantora prowadzi do powstania logicznych paradoksów. Okazuje się, że pytanie: co jest zbiorem, jest trudniejsze niż wydawało się matematykom końca XIX wieku.

W dalszej części wykładu przedstawimy właściwe podejście do teorii mnogości. Podejście to jest oparte o część logiki zwaną rachunkiem predykatów. Podejście to zostało zaproponowane przez Ernsta Zermelo na początku XX wieku i ma na celu dostarczenie spójnej teorii zbiorów o mocy podobnej do naiwnej teorii, przy równoczesnym uniknięciu paradoksów. Aksjomatyczna teoria mocy definiuje bardzo dokładnie, które kolekcje obiektów są zbiorami. W szczególności paradoks zaproponowany przez Bertranda Russella nie pojawia się w aksjomatycznej teorii zbiorów, ponieważ zbiór zdefiniowany powyżej jako \( Z \) w niej nie istnieje.

"Naiwna" indukcja

Zasada indukcji matematycznej jest o prawie trzysta lat starsza niż teoria mnogości. Pierwszy dowód indukcyjny pojawił się w pracy
Francesco Maurolico w 1575 roku. W pracy tej autor wykazał, że suma \( n \) pierwszych liczb nieparzystych równa się \( {n^2} \).

Aby zastosować zasadę indukcji matematycznej, należy wykazać dwa fakty:

  • hipoteza jest prawdziwa dla \( n=1 \),
  • jeśli hipoteza jest prawdziwa dla \( n \), to jest również prawdziwa dla \( n+1 \).

Drugi z powyższych punktów musi być prawdą dla wszystkich \( n\geq 1 \). Jeśli oba fakty są prawdą, to hipoteza jest prawdziwa dla wszystkich liczb naturalnych większych od 1. Rozumowanie, które stoi za tym wnioskiem wygląda następująco:

  1. hipoteza jest prawdziwa dla \( n=1 \) na podstawie podstawy indukcji,
  2. hipoteza jest prawdziwa dla \( n=2 \), ponieważ jest prawdziwa dla 1 i po zastosowaniu kroku     indukcyjnego również dla 2,
  3. hipoteza jest prawdziwa dla \( n=3 \); w poprzednim punkcie pokazaliśmy, że jest prawdziwa dla     2 i na podstawie kroku indukcyjnego jest również prawdziwa 3,
  4. i tak dalej.

Zasadę indukcji matematycznej można porównać do domina. Aby mieć pewność, że przewrócone zostaną wszystkie klocki wystarczy wykazać, że przewrócony zostanie pierwszy klocek i że każdy klocek pociąga za sobą następny.

Dowód indukcyjny przedstawiony przez Francesco Maurolico pokazuje, że suma pierwszych \( n \) liczb nieparzystych jest równa \( {n^2} \).

  • Jeśli \( n=1 \) to pierwsza liczba nieparzysta 1 jest równa \( 1^2 \).
  • Jeśli hipoteza jest prawdą dla \( n \), to znaczy że suma pierwszych \( n \) liczb nieparzystych równa się \( {n^2} \). Bardziej formalnie

\( 1+3+\dotsb+(2n-1) = n^2 \)
tak więc suma pierwszych \( {n+1} \) liczb nieparzystych \( 1+3+\dotsb+(2n-1)+(2(n+1)-1) \), przy użyciu założenia powyżej może być zapisana jako
\( 1+3+\dotsb+(2n-1)+(2(n+1)-1) = n^2 +(2(n+1)-1)= n^2+2n+1= {(n+1)}^2. \)
Krok indukcyjny został dowiedziony.

Ćwiczenie 2.1
Wykaż, że suma pierwszych \( \mathrm {n} \) liczb naturalnych jest równa \( \frac{1}{2}n(n+1) \).

Ćwiczenie 2.2

Wykaż, że suma kwadratów pierwszych \( \mathrm {n} \) liczb naturalnych jest równa \( \frac{1}{6}n(n+1)(2n+1) \).

Ćwiczenie 2.3

Wykaż, że dla \( n\geq 1 \) zachodzi \( 4|3^{2n-1}+1 \).

Często bardzo niepraktyczne jest używanie indukcji w jej podstawowej formie. Używa się wtedy indukcji, która w pierwszym kroku nie zaczyna się od \( n=1 \), ale \( n=0 \), \( n=2 \) lub dowolnej innej liczby naturalnej. W takim przypadku drugi krok indukcyjny nie musi działać dla wszystkich \( n \), a wystarczy, by działał dla \( n \) większych lub równych od liczby, którą wybraliśmy w pierwszym kroku. Końcowy dowód indukcyjny pokaże, że dana hipoteza nie jest prawdziwa dla wszystkich liczb naturalnych, a jedynie dla liczb większych od tej wybranej na pierwszy krok indukcyjny.

Jako przykład pokażemy, że \( n!>2^n \). Po pierwsze nierówność ta nie zachodzi dla \( 1,2,3 \), więc nie można rozpocząć kroku indukcyjnego od \( {n=1} \). Indukcja będzie wyglądać następująco:

  • Hipoteza jest prawdą dla \( n=4 \), ponieważ \( 4!=24>16=2^4 \).
  • Jeśli hipoteza jest prawdą dla \( n \) i jeśli \( n\geq 4 \) to

\( (n+1)!= n!\cdot (n+1)>2^n\cdot(n+1)>2^{n+1}, \)

gdzie pierwsza nierówność pochodzi z założenia indukcyjnego, a druga z faktu, że dowodzimy krok indukcyjny dla liczb większych niż 4.

Ćwiczenie 2.4

W tym ćwiczeniu dowodzimy wariant nierówności Bernoulliego. Dla dowolnego \( x \) takiego, że \( x> -1 \) i \( x\neq 0 \) i dla dowolnego \( n\geq 2 \) zachodzi \( {(1+x)}^n> 1+nx \).

Ćwiczenie 2.5
Liczby Fibonacciego zdefiniowane są następująco:
\( f_1=1, f_2=1 \) oraz \( f_i=f_{i-2}+f_{i-1} \) dla \( i>3. \)
Udowodnij, że dla dowolnego \( n\geq 2 \) liczby \( f_n \) i \( f_{n-1} \) są względnie pierwsze.

Kolejnym uogólnieniem zasady indukcji matematycznej jest indukcja, w której w drugim kroku indukcyjnym zakładamy, że hipoteza jest prawdą dla wszystkich liczb mniejszych niż \( n \) i dowodzimy, że jest również prawdziwa dla \( n+1 \).
Jako przykład udowodnimy, że każda liczba naturalna większa niż 2 jest produktem jednej, lub więcej liczb pierwszych.

  • Hipoteza jest prawdą dla \( n=2 \), ponieważ 2 jest liczbą pierwszą.
  • Zakładamy, że hipoteza jest prawdziwa dla liczb od 2 do \( n \). Weźmy liczbę \( n+1 \), jeśli \( n+1 \) jest liczbą pierwszą, to hipoteza jest udowodniona. Jeśli \( n+1 \) nie jest liczbą pierwszą, to \( n+1=k\cdot l \), gdzie \( 2\leq k,l\leq n \). Założenie indukcyjne gwarantuje, że

\( k=p_1\cdot p_2\cdot\dotsb\cdot p_i \) i \( l=q_1\cdot q_2\cdot\dotsb\cdot q_j, \)

gdzie \( p_1,\dotsc,p_i,q_1,\dotsc,q_j \) są liczbami pierwszymi. W związku z tym

\( n+1=p_1\cdot p_2\cdot\dotsb\cdot p_i\cdot q_1\cdot q_2\cdot\dotsb\cdot q_j \)

i krok indukcyjny jest udowodniony.

Ćwiczenie 2.6

Udowodnij, że każda liczba naturalna większa niż 1 może być przedstawiona jako suma liczb Fibonacciego tak, że żadna liczba nie występuje w tej sumie więcej niż raz.

Ćwiczenie 2.7

Znajdź błąd w poniższym dowodzie indukcyjnym. Dowodzimy indukcyjnie twierdzenia, że wszystkie liczby są parzyste.

  • Twierdzenie jest prawdą dla \( n=0 \) ponieważ 0 jest liczbą parzystą.
  • Zakładamy, że twierdzenie jest prawdą dla wszystkich liczb mniejszych lub równych \( n \). Liczba \( n+1 \) jest niewątpliwie sumą dwóch liczb silnie mniejszych od siebie \( n+1=k+l \). Liczby \( k \) i \( l \), na podstawie założenia indukcyjnego, są parzyste, zatem ich suma równa \( n+1 \) jest parzysta. Krok indukcyjny został dowiedziony.

Na zasadzie indukcji matematycznej wszystkie liczby są parzyste.

Ćwiczenie 2.8

W trójwymiarowej przestrzeni znajduje się \( n \) punktów. Ilość punktów w rzutowaniu na płaszczyznę \( O_x, O_y \) oznaczamy przez \( n_{xy} \). Podobnie ilość punktów w rzutowaniu na \( O_x, O_z \) przez \( n_{xz} \) i ilość punktów w rzutowaniu na \( O_y, O_z \) przez \( n_{yz} \). Wykaż, że dla dowolnego rozkładu punktów w przestrzeni zachodzi nierówność

\( n^2\leq n_{xy}n_{xz}n_{yz}. \)



Zasada indukcji matematycznej jest bardzo potężnym narzędziem. Intuicyjnie wydaje się jasne, że dowody przeprowadzone przy jej pomocy są poprawne. Niemniej jednak, żeby uzasadnić poprawność samej zasady, należy sięgnąć do teorii mnogości i definicji zbioru liczb naturalnych. Wiemy już, że "naiwna teoria mnogości" nie daje nam poprawnych zbiorów, na których można oprzeć ścisłe rozumowanie. W dalszej części wykładu wyprowadzimy zasadę indukcji matematycznej w oparciu o aksjomaty i aksjomatycznie zdefiniowany zbiór liczb naturalnych. Takie podejście gwarantuje nam poprawność rozumowania -- podejście naiwne zapewnia intuicje niezbędne do budowania poprawnych teorii.

"Naiwne" dowody niewprost

Częstą metodą dowodzenia twierdzeń matematycznych jest dowodzenie niewprost. Dowód niewprost polega na założeniu zaprzeczenia twierdzenia, które chcemy udowodnić i doprowadzeniu do sprzeczności. Wykazujemy, że jeśli twierdzenie nasze jest nieprawdziwe, jesteśmy w stanie udowodnić jakąś tezę, która jest w sposób oczywisty fałszywa.
Jednym z najbardziej znanych dowodów niewprost jest dowód istnienia nieskończenie wielu liczb pierwszych. Dowód ten został zaproponowany przez Euklidesa z Aleksandrii, a my prezentujemy go w wersji podanej przez Ernsta Kummera. Twierdzenie 3.1
Istnieje nieskończenie wiele liczb pierwszych.
Dowód
Załóżmy, że istnieje jedynie skończenie wiele liczb pierwszych \( p_0,\dotsc,p_n \). Zdefiniujmy liczbę
\( k = p_0\cdot p_1\cdot\dotsb\cdot p_n \)
i rozważmy \( {k+1} \). Liczba \( {k+1} \) posiada dzielnik pierwszy, a ponieważ jedynymi pierwszymi liczbami są liczby \( p_0,\dotsc,p_n \), wnioskujemy, że \( {p_i} \) dzieli \( {k+1} \) dla pewnego \( i \). Liczba \( {p_i} \) dzieli również \( k \), a więc \( {p_i} \) dzieli \( (k+1)-k=1 \) co jest sprzecznością.
Ćwiczenie 3.1
Wykaż, że nie istnieje największa liczba naturalna.

Ćwiczenie 3.2
Wykaż, że \( \sqrt{2} \) jest liczbą niewymierną.

Ścisłe uzasadnienie poprawności dowodów niewprost leży na gruncie logiki, której poświęcony jest następny wykład.

Test 1

Czy zbiór bocianów jest elementem zbioru wszystkich ptaków?

Rachunek zdań

Wprowadzenie



Logika zdaniowa jest językiem, który pozwala opisywać zależności pomiędzy zdaniami. Przykładem może być zdanie:


Jeśli \( \mathrm {n} \) jest liczbą pierwszą to \( \mathrm {n} \) jest liczbą nieparzystą lub \( \mathrm {n} \) jest równe 2. W powyższym zdaniu spójniki jeśli [..] to, lub mówią o związkach które zachodzą pomiędzy zdaniami:
  1. \( \mathrm {n} \) jest liczbą pierwszą,
  2. \( \mathrm {n} \) jest liczbą nieparzystą,
  3. \( \mathrm {n} \) jest równe 2.

Oznaczmy powyższe zdania przez \( p,q,r \) (w takiej właśnie kolejności). Używając symboli, które zwyczajowo odpowiadają potocznemu rozumieniu spójników jeśli [..] to, lub oraz powyższych oznaczeń, otrzymamy formułę

\( p \Rightarrow (q \vee r). \)

Jeśli powyższą formułę uznamy za prawdziwą, to może nam ona posłużyć do otrzymania nowych wniosków. Na przykład, jeśli o jakiejś liczbie \( \mathrm {n} \) będziemy wiedzieć, że jest liczbą pierwszą oraz że nie jest nieparzysta, to klasyczny rachunek zdań pozwoli nam formalnie wywnioskować fakt, że liczba \(\mathrm {n} \) jest równa 2. Podsumowując, jeśli uznamy za prawdziwe następujące zdania:

  1. \( p \Rightarrow (q \vee r) \),
  2. \( p \),
  3. \( \neg q \) (przez \( \neg \) oznaczamy negację)

to zgodnie z klasycznym rachunkiem zdań powinniśmy uznać za prawdziwe zdanie \( \mathrm {r} \), czyli \( \mathrm {n} \) jest równe 2. Powyższy schemat wnioskowania można również opisać formułą


\( ((p \Rightarrow (q \vee r)) \wedge p \wedge (\neg q))\Rightarrow q. \)

W powyższej formule symbol \( \wedge \) odpowiada spójnikowi \( \mathrm {i} \) (oraz).

Dzięki rachunkowi zdań możemy precyzyjnie opisywać schematy wnioskowania i zdania złożone oraz oceniać ich prawdziwość.

Język logiki zdaniowej

Język logiki zdaniowej



Zaczniemy od definicji języka logiki zdaniowej. Składa się on z formuł zdefiniowanych następująco:
Definicja 2.1 [Formuła logiki zdaniowej]

  1. zmienna zdaniowa jest formułą (zmienne zdaniowe oznaczamy zwykle literami alfabetu rzymskiego np. \( p,q,r \)),
  2. jeśli \( {\phi} \) oraz \( {\psi} \) są formułami to \( (\phi \Rightarrow \psi) \) jest formułą (spójnik \( \Rightarrow \) nazywamy implikacją),
  3. jeśli \( {\phi} \) jest formułą to \( \neg \phi \) jest formułą (spójnik \( \neg \) nazywamy negacją),
  4. nic innego nie jest formułą.

Powyższa definicja mówi, że formułami nazywamy te napisy, które dają się skonstruować ze zmiennych zdaniowych przy pomocy spójników \( \Rightarrow \) oraz \( \neg \).
Uwaga 2.2.

Zgodnie z powyższą definicją nie jest formułą napis \( p\Rightarrow q \), gdyż brakuje w nim nawiasów. Pomimo, iż poprawnie powinniśmy napisać \( (p\Rightarrow q) \) możemy przyjąć że nie będzie konieczne pisanie nawiasów, jeśli nawiasy można jednoznacznie uzupełnić. Często przyjmuje się również prawostronne nawiasowanie dla implikacji, czyli formuła \( p \Rightarrow q \Rightarrow r \) jest domyślnie nawiasowana w następujący sposób \( (p \Rightarrow (q \Rightarrow r)) \).

Przykład 2.3 Poniższe napisy nie są formułami

  • \( p \Rightarrow \Rightarrow q \),
  • \( \neg \neg \neg \),
  • ten napis na pewno nie jest formułą,
  • \( (p \Rightarrow \neg q)) \).

Poniższe napisy są formułami

  • \( (p \Rightarrow (r \Rightarrow q)) \),
  • \( \neg \neg \neg q \),
  • \( (p \Rightarrow \neg q) \).

Ćwiczenie 2.1

Rozmiarem formuły nazwiemy ilość występujących w niej spójników. Na przykład formuła \( \neg \neg q \) ma rozmiar 2, a formuła \( (p\Rightarrow q) \) ma rozmiar 1. Przypuśćmy, że jedyną zmienną zdaniową jaką wolno nam użyć jest \( \mathrm {p} \). Ile można skonstruować rożnych formuł o rozmiarze 3?

Uwaga 2.4.

Język logiki zdaniowej można równoważnie zdefiniować nie używając nawiasów za pomocą tzw. Odwrotnej Notacji Polskiej.

Aksjomatyka Klasycznego Rachunku Zdań

Aksjomatyka Klasycznego Rachunku Zdań



Podobnie jak nie wszystkie zdania języka naturalnego mają sens, nie wszystkie formuły opisują prawdziwe schematy wnioskowania lub zdania, które bylibyśmy skłonni uznać za prawdziwe. W tym rozdziale skupimy się na tym, które spośród wszystkich formuł zdaniowych wyróżnić jako prawdziwe.

Aksjomaty

Wielu matematyków zgadza się dzisiaj co do tego, że zdania pasujące do poniższych schematów powinny być uznane za prawdziwe:

Definicja 3.1 Aksjomaty klasycznego rachunku zdań

  1. \( (\phi \Rightarrow (\psi \Rightarrow \phi)) \) (formuła ta jest nazywana aksjomatem K),
  2. \( (\phi \Rightarrow (\nu \Rightarrow \psi)) \Rightarrow ((\phi \Rightarrow \nu) \Rightarrow (\phi \Rightarrow \psi) ) \) (formuła ta jest nazywana aksjomatem S),
  3. \( (\neg \phi \Rightarrow \psi) \Rightarrow ((\neg \phi \Rightarrow \neg \psi) \Rightarrow \phi) \) (tzw. schemat dowodu niewprost)

Zdania pasujące do powyższych schematów to wszystkie zdania, które można otrzymać, podstawiając w miejsce \( \phi, \nu, \psi \) dowolne formuły.

Reguła dowodzenia

Przyglądnijmy się teraz jak posługujemy się implikacją we wnioskowaniu. W przykładzie z początku wykładu implikacja odpowiadała konstrukcji językowej:
jeśli \( {\phi} \) to \( {\psi} \).
W takim przypadku, jeśli akceptujemy powyższą implikacjię jako zdanie prawdziwe oraz jeśli zdanie \( {\phi} \) jako prawdziwe, to powinniśmy także zaakceptować \( {\psi} \). Przedstawiony sposób wnioskowania nosi nazwę reguły Modus Ponens (nazywana też regułą odrywania, często będziemy używać skrótu MP) i jest skrótowo notowany w poniższy sposób
\( \frac{\phi \Rightarrow \psi, \phi} {\psi}. \)
Reguła modus ponens posłuży nam do uzupełniania zbioru aksjomatów o ich konsekwencje logiczne, które również uznamy za prawdziwe. Aby precyzyjnie zdefiniować zbiór wszystkich konsekwencji logicznych aksjomatów, definiujemy poniżej pojęcie dowodu.

Definicja 3.2

Ciąg formuł \( \phi_0, \dots ,\phi_n \) jest dowodem formuły \( {\psi} \) wtedy i tylko wtedy, gdy:

  1. \( \phi_n \) jest formułą \( {\psi} \),
  2. dla każdego \( i\leq n \) formuła \( \phi_i \) jest aksjomatem lub istnieją \( j,k < i \) takie, że formuła \( \phi_i \) jest wynikiem zastosowania reguły modus ponens do formuł \( \phi_j, \phi_k \).

W drugim punkcie powyższej definicji, jeśli formuła \( \phi_i \) nie jest aksjomatem (a więc powstaje przez zastosowanie MP), to formuły \( \phi_j,\phi_k \) muszą pasować do przesłanek reguły MP, a więc \( \phi_j \) musi być postaci \( \phi_k \Rightarrow \phi_i \) lub \( \phi_k \) postaci \( \phi_j \Rightarrow \phi_i \).
Definicja 3.3
Formułę nazywamy twierdzeniem klasycznego rachunku zdań jeśli istnieje jej dowód z aksjomatów klasycznego rachunku zdań 3.1

Przykład

Zastanówmy się na formułą postaci \( \phi \Rightarrow \phi \). Intuicja podpowiada, że taką formułę powinniśmy uznać za prawdziwą. Nie pasuje ona jednak do żadnego ze schematów aksjomatów 3.1. Formuła ta jest jednak twierdzeniem klasycznego rachunku zdań. Poniżej przedstawiamy jej dowód. Aby łatwiej dopasować formuły do schematów aksjomatów, użyliśmy nawiasów kwadratowych dla nawiasów, które pochodzą ze schematów.

  1. \( [\phi \Rightarrow [(q \Rightarrow \phi) \Rightarrow \phi)]\Rightarrow [[\phi \Rightarrow (q \Rightarrow \phi)] \Rightarrow [\phi \Rightarrow\phi]] \) formuła ta jest aksjomatem zgodnym ze schematem S,
  2. \( \phi \Rightarrow [(q \Rightarrow \phi) \Rightarrow \phi] \) aksjomat zgodny ze schematem K,
  3. \( (\phi \Rightarrow (q \Rightarrow \phi)) \Rightarrow (\phi \Rightarrow \phi) \) z modus ponens z formuł 1 i 2,
  4. \( \phi \Rightarrow [q \Rightarrow \phi] \) aksjomat zgodny ze schematem K,
  5. \( (\phi \Rightarrow \phi) \) z modus ponens z formuł 3 i 4.

Podsumowanie

Klasyczny rachunek zdań, czyli zbiór formuł które uznajemy za prawdziwe, zdefiniowaliśmy, wyróżniając pewne formuły jako aksjomaty 3.1 i dorzucając do nich wszystkie formuły, które dają się z nich wywnioskować przy pomocy reguły Modus Ponens. Warto zwrócić uwagę, że pomimo tego, iż w doborze aksjomatów i reguł wnioskowania kierowaliśmy się intuicyjnym pojęciem implikacji i konsekwencji, klasyczny rachunek zdań jest teorią syntaktyczną, zbiorem pewnych napisów o których znaczeniu nie musimy nic mówić.

Uwaga 3.4

Warto przyglądnąć się przyjętym aksjomatom i zastanowić się jakim zdaniom odpowiadają i czy rzeczywiście bylibyśmy skłonni uznać je za prawdziwe. Pomocne może być interpretowanie formuł postaci \( \phi \Rightarrow (\nu \Rightarrow \psi) \) jako „jeśli prawdziwe jest \( {\phi} \) i prawdziwe jest \( \nu \) to prawdziwe jest \( {\psi} \)”. W kolejnych rozdziałach przekonamy się, że taka interpretacja jest uzasadniona.

Matryca boolowska

Matryca boolowska


W poprzednim rozdziale zdefiniowaliśmy klasyczny rachunek zdań jako teorię aksjomatyczną. Jeśli pozwolimy sobie na używanie skończonych zbiorów i funkcji, możemy równoważnie zdefiniować klasyczny rachunek zdań za pomocą tzw. matrycy boolowskiej.
Definicja 4.1
Dwuelementową matrycą boolowską nazywamy zbiór dwuelementowy \( \mathbb{B}=\{0,1\} \) w którym 1 jest wyróżnioną wartością prawdy, wraz z dwoma funkcjami odpowiadającymi za interpretacje spójników \( \Rightarrow \) oraz \( \neg \) zdefiniowanymi następująco


\( \Rightarrow \) 0 1
0 1 1
1 0 1
    
\( \mathrm {p} \) \( \neg p \)
0 1
1 0

\( \quad \mbox{(4.1)} \)

Definicja 4.2

Wartościowaniem nazywamy funkcję, która przypisuje zmiennym zdaniowym elementy zbioru \( \mathbb{B} \). Wartościowanie zmiennych można rozszerzyć na wartościowanie formuł interpretując spójniki \( \Rightarrow \) oraz \( \neg \) jako funkcje zgodnie z tabelami 4.1.

Przykład 4.3

Niech \( {v} \) będzie wartościowaniem zmiennych takim, że \( v(p)=0,v(q)=1, v(r)=0 \). Wtedy

  • formuła \( q \Rightarrow p \) jest wartościowana na 0 (będziemy to zapisywać jako \( v(q \Rightarrow p)=0 \)),
  • formuła \( r \Rightarrow (q \Rightarrow p) \) jest wartościowana na 1 (czyli \( v(r \Rightarrow (q \Rightarrow p))=1 \)),
  • formuła \( \neg p \Rightarrow r \) jest wartościowana na 0 (czyli \( v(\neg p \Rightarrow r)=0 \)).

Ćwiczenie 4.1

Przy wartościowaniu \( v \) z przykładu 4.3 jakie wartości przyjmują następujące formuły

  1. \( p \Rightarrow (q \Rightarrow r) \),
  2. \( p \Rightarrow (p \Rightarrow q) \),
  3. \( \neg \neg q \Rightarrow p \),
  4. \( (\neg q\Rightarrow q) \Rightarrow (q \Rightarrow \neg q) \).

Ćwiczenie 4.2

     1. Podaj przykład wartościowania zmiennych tak aby poniższe formuły były wartościowane na 0

(a) \( p \Rightarrow (q \Rightarrow r) \)
(b) \( (\neg p \Rightarrow q) \)
(c) \( (p\Rightarrow q) \Rightarrow q \)

     2. Podaj przykład wartościowania zmiennych tak aby poniższe formuły były wartościowane na 1

(a) \( \neg (p \Rightarrow q) \)
(b) \( \neg (\neg p \Rightarrow \neg q) \)
(c) \( (\neg q\Rightarrow q) \Rightarrow (q \Rightarrow \neg q) \)

Twierdzenie o pełności

Zauważmy, że istnieją formuły, które dla każdego wartościowania zmiennych zdaniowych, zawsze przyjmują wartość 1 (np. \( p \Rightarrow p \)). Takie formuły będziemy nazywać tautologiami.

Ćwiczenie 4.3
Sprawdź czy poniższe formuły są tautologiami

  1. \( (\phi \Rightarrow (\psi \Rightarrow \phi)) \),
  2. \( (\phi \Rightarrow (\nu \Rightarrow \psi) \Rightarrow ((\phi \Rightarrow \nu \Rightarrow (\phi \Rightarrow \nu) ) \),
  3. \( (\neg \phi \Rightarrow \psi) \Rightarrow (\neg \phi \Rightarrow \neg \psi) \Rightarrow \phi \),
  4. \( ((\phi \Rightarrow q) \Rightarrow p) \Rightarrow p \).



Nie przez przypadek pierwsze trzy formuły z poprzedniego zadania odpowiadają aksjomatom klasycznego rachunku zdań 3.1. Okazuje się że istnieje ścisły związek pomiędzy tautologiami a twierdzeniami klasycznego rachunku zdań. Mówi o tym ważny wynik Emila Posta

Twierdzenie 4.4

Post 1921 Formuła jest twierdzeniem klasycznego rachunku zdań wtedy i tylko wtedy kiedy jest tautologią.

Dowód powyższego twierdzenia jest przedstawiony na wykładzie Logika dla informatyków Dzięki powyższemu twierdzeniu możemy w miarę łatwo stwierdzać, czy dana formuła jest twierdzeniem klasycznego rachunku zdań, sprawdzając, czy jest tautologią, co wymaga rozważenia jedynie skończonej (chociaż często niemałej) liczby wartościowań. Co więcej, mamy też możliwość dowodzenia, że jakaś formuła nie jest twierdzeniem klasycznego rachunku zdań. Uzasadnienie, że nie da się jakiejś formuły udowonić z aksjomatów poprzez stosowanie reguły MP wydaje się zadaniem trudnym, znacznie łatwiej jest poszukać wartościowania, które wartościuje formułę na 0 (znowu wystarczy sprawdzić jedynie skończenie wiele wartościowań).

Ćwiczenie 4.4
Udowodnij że każde twierdzenie klasycznego rachunku zdań jest tautologią.



Inne spójniki

Do tej pory jedynymi rozważanymi spójnikami była implikacja i negacja. W analogiczny sposób do 4.1 możemy wprowadzać kolejne spójniki. Często używane spójniki to koniunkcja (spójnik i) oznaczana przez \( \wedge \) oraz alternatywa (spójnik lub) oznaczana przez \( \vee \), które będziemy interpretować w następujący sposób:


\( \wedge \) 0 1
 0   0   0 
 1   0   1 
    
\( \vee \) 0 1
 0   0   1 
 1   1   1 

\( \quad \mbox{(4.2)} \)



Zgodnie z intuicją koniunkcja \( \phi \wedge\psi \) jest wartościowana na 1 wtedy i tylko wtedy, gdy zarówno \( {\phi} \) jak i \( {\psi} \) są wartościowane na 1. Alternatywa \( \phi \vee \psi \) jest wartościowana na 1, jeśli przynajmniej jedna z formuł \( \phi, \psi \) jest wartościowana na 1.

Definicja 4.5

Formuły \( {\phi} \) oraz \( {\psi} \) są równoważne (oznaczamy ten fakt przez \( \phi \equiv \psi \) wtedy i tylko wtedy, gdy dla każdego wartościowania formuła \( {\phi} \) przyjmuje tą samą wartość co formuła \( {\psi} \).

Ćwiczenie 4.5

Udowodnij, że następujące formuły są równoważne

  1. \( \phi \vee \psi \equiv \neg \phi \Rightarrow \psi \)
  2. \( \phi \wedge \psi \equiv \neg (\phi \Rightarrow \neg \psi) \)

Z powyższego zadania wynika, że każdą formułę w której występują spójniki \( \wedge \) lub \( \vee \) można zastąpić równoważną formułą, w której jedynymi spójnikami są \( \Rightarrow \) oraz \( \neg \). Tak naprawdę więc nowe spójniki nie wprowadzają nic nowego poza użytecznymi skrótami w zapisywaniu formuł. Aby się oswoić z własnościami spójników, prześledzimy szereg ich praw.

Ćwiczenie 4.6

Udowodnij następujące równoważności

  1. \( \neg \neg p \equiv p \),
  2. \( p\Rightarrow q \equiv \neg p \vee q \),
  3. \( p \Rightarrow (q \Rightarrow r) \equiv (p \wedge q) \Rightarrow r \),
  4. \( \neg( p \wedge q) \equiv \neg p \vee \neg q \),
  5. \( \neg( p \vee q) \equiv \neg p \wedge \neg q \),
  6. \( p \wedge (q \vee r) \equiv (p \wedge q) \vee (p\wedge r) \),
  7. \( p \vee (q \wedge r) \equiv (p \vee q) \wedge (p\vee r) \),
  8. \( (p \Rightarrow q) \Rightarrow (\neg p \Rightarrow \neg q) \).

Ćwiczenie 4.7

Sprawdź które z następujących formuł są tautologiami

  1. \( ( (p \vee r)\wedge( q \vee \neg r) )\Rightarrow (p \vee q) \),
  2. \( (p \vee q) \Rightarrow ( (p \vee r)\wedge( q \vee \neg r)) \),
  3. \( ( (p \wedge r)\vee( q \wedge \neg r) )\Rightarrow(p \wedge q) \),
  4. \( (p \wedge q) \Rightarrow ( (p \wedge r)\vee( q \wedge \neg r)) \).

Binarne spójniki logiczne interpretowaliśmy jako funkcje z \( \mathbb{B}\times \mathbb{B} arrow \mathbb{B} \). Nie trudno przekonać się, że takich funkcji jest dokładnie 16. Dla każdej takiej funkcji możemy dodać spójnik, który będzie interpretowany dokładnie jako ta funkcja. W poniższej tabeli zamieszczamy wszystkie takie funkcje wraz ze zwyczajowymi oznaczeniami odpowiadających im spójników.

Definicja 4.6

W poniższej tabeli przedstawiamy wszystkie spójniki binarne.


Numer
funkcji
\( p=0 \)
\( q=0 \)
\( p=0 \)
\( {q=1} \)
\( p=1 \)
\( q=0 \)
\( p=1 \)
\( {q=1} \)
   
0 0 0 0 0   \( F \)
1 0 0 0 1   \( \wedge \)
2 0 0 1 0   \( \neg (p \Rightarrow q) \)
3 0 0 1 1   \( \mathrm{p} \)
4 0 1 0 0   \( \neg (q \Rightarrow p) \)
5 0 1 0 1   \( \mathrm{q} \)
6 0 1 1 0   \( XOR \)
7 0 1 1 1   \( \vee \)
8 1 0 0 0   \( NOR \)
9 1 0 0 1   \( \Leftrightarrow \)
10 1 0 1 0   \( \neg q \)
11 1 0 1 1   \( q \Rightarrow p \)
12 1 1 0 0   \( \neg p \)
13 1 1 0 1   \( p \Rightarrow q \)
14 1 1 1 0   \( NAND \)
15 1 1 1 1   \( T \)

Spójnik binarny \( \circ \) będziemy nazywać przemiennym, jeśli zachodzi następująca równoważność

\( p \circ q \equiv q \circ p \quad \mbox{(4.3)} \)

Ćwiczenie 4.8

Sprawdź następujące równoważności

  1. \( x NAND y \equiv \neg (x \wedge y) \)
  2. \( x NOR y \equiv \neg (x \vee y) \)
  3. \( x XOR y \equiv \neg (x \Leftrightarrow y) \)

Ćwiczenie 4.9
Ile spójników binarnych jest przemiennych? Wypisz je wszystkie.


Ćwiczenie 4.10

Udowodnij, że następujące spójniki są łączne

  1. \( \vee \)
  2. \( \wedge \)
  3. \( \Leftrightarrow \)
  4. \( XOR \)

Możemy również rozważać spójniki 3 i więcej argumentowe. Spójnik \( k \)-argumetowy powinien odpowiadać funkcji \( \mathbb{B}^k arrow \mathbb{B} \).

Przykład 4.7

W poniższej tabeli przedstawiamy przykład spójnika trójargumentowego


\( \mathrm {p} \) \( \mathrm {q} \) \( \mathrm {r} \) \( \circ (p, q, r) \)
 0   0   0   0 
0 0 1 1
0 1 0 1
0 1 1 0
1 0 0 1
1 0 1 0
1 1 0 0
1 1 1 1

Uwaga 4.1
Różnych spójników \( k \)-argumentowych jest dokładnie \( 2^{2^k} \).

Systemy funkcjonalnie pełne

Systemy funkcjonalnie pełne


Każda formuła odpowiada pewnej funkcji przekształcającej wartościowania zmiennych w niej występujących w element zbioru \( \mathbb{B} \). Na przykład formuła \( p \Rightarrow (q\Rightarrow r) \) wyznacza funkcję \( f_{p \Rightarrow (q\Rightarrow r)} \) opisaną poniższą tabelą

\( \mathrm {p} \) \( \mathrm {q} \) \( \mathrm {r} \) \( f_{p arrow _(q arrow r)} \)
 0   0   0  1
0 0 1 1
0 1 0 1
0 1 1 1
1 0 0 1
1 0 1 1
1 1 0 0
1 1 1 1

Mówimy, wtedy że formuła \( {\phi} \) definuje funkcję \( f_{\phi} \).

Definicja 5.1

Skończony zbiór funkcji boolowskich \( {\Gamma} \) nazywamy funkcjonalnie pełnym, jeśli każdą funkcję boolowską da się zdefiniować przy pomocy formuły zbudowanej wyłącznie ze spójników odpowiadających funkcjom ze zbioru \( {\Gamma} \).

Twierdzenie 5.2

Zbiór \( \{\wedge, \vee, \neg\} \) jest funkcjonalnie pełny.

Dowód

Dla dowolnej funkcji boolowskiej skonstruujemy formułę która ją definiuje. Niech \( \displaystyle k\in \) oraz \( \displaystyle f:\mathbb{B}^k arrow \; \mathbb{B} \). W definiowanej formule będziemy używać zmiennych \( \displaystyle p_1, \dots,p_k \), a każdy element \( \displaystyle (w_1,\ldots,w_k) \in \mathbb{B}^k \) będzie odpowiadał wartościowaniu \( \displaystyle v_w \) takiemu, że \( \displaystyle v(p_i)=w_i \).

Niech \( \displaystyle F \) będzie zbiorem tych argumentów, dla których funkcja \( \displaystyle f \) przyjmuje wartość 1. Dla dowolnego elementu \( \displaystyle x_i \in F \) skonstruujemy formułę \( \displaystyle \phi_i \) w taki sposób, aby była spełniona tylko dla wartościowania odpowiadającego elementowi \( \displaystyle x_i \). Niech \( \displaystyle x_i= (w_1,\dots,w_k) \), wtedy formułę \( \displaystyle \phi_i \) definiujemy jako \( \displaystyle l^i_1 \wedge l^i_2 \wedge \dots \wedge l^i_k \) gdzie

\( \displaystyle l^i_j \begin{cases} p_j, & \mbox{gdy } w_j = 1 \displaystyle ; \\ \neg p_j, & \mbox{gdy } w_j = 0 \displaystyle .\end{cases} \)

Łatwo sprawdzić, że formuła \( \displaystyle \phi_i \) jest spełniona tylko dla wartościowania odpowiadającego elementowi \( \displaystyle x_i \).

Postępując w ten sposób dla każdego elementu zbioru \( \displaystyle F \) otrzymamy formuły \( \displaystyle \phi_1, \dots \phi_m \). Biorąc
\( \displaystyle \phi_1 \vee \dots \vee \phi_m \)

otrzymamy formułę która definiuje funkcję \( \displaystyle f \), oznaczmy ją przez \( \displaystyle \Phi \). Jeśli dla wartościowania \( \displaystyle v \) formuła \( \displaystyle \Phi \) jest spełniona to znaczy, że któraś z formuł \( \displaystyle \phi_i \) jest spełniona. Oznacza to że wartościowanie \( \displaystyle v \) odpowiada pewnemu elementowi \( \displaystyle x_i \) zbioru \( \displaystyle F \), wobec tego funkcja \( \displaystyle f(x_i)=1 \) co jest zgodne z tym, że spełniona jest \( \displaystyle \Phi \). W drugą stronę załóżmy że dla pewnego elementu \( \displaystyle a\in \mathbb{B}^k \) mamy \( \displaystyle f(a)=1 \). Wobec tego \( \displaystyle a\in F \). Wtedy \( \displaystyle a \) odpowiada pewnej formule \( \displaystyle \phi_i \), która jest spełniona dla wartościowania odpowiadającego \( \displaystyle a \). Wobec tego również cała formuła \( \displaystyle \Phi \) jest spełniona dla tego wartościowania (bo jeden z elementów alternatywy jest spełniony). Wynika stąd, że formuła \( \displaystyle \Phi \) definiuje funkcję \( \displaystyle f \). Na koniec zauważmy jeszcze że jedynymi spójnikami występującymi w formule \( \displaystyle \Phi \) są \( \displaystyle \neg, \vee, \wedge \).

Twierdzenie 5.3

Zbiory \( \{\wedge, \neg\} \), \( \{\vee, \neg\} \) są funkcjonalnie pełne.

Dowód

Aby pokazać, że \( \displaystyle \{\wedge, \neg\} \) jest funkcjonalnie pełny wystarczy pokazać, że przy pomocy spójników \( \displaystyle \{\wedge, \neg\} \) da się zdefiniować \( \displaystyle \vee \). Wtedy funkcjonalną pełność otrzymamy z twierdzenia 5.2. W ćwiczeniu 4.2 pokazaliśmy, że

\( \displaystyle \neg (x \vee y) = \neg x \wedge \neg y. \)
Wobec tego
\( \displaystyle x \vee y =\neg(\neg x \wedge \neg y) \)

a więc zdefiniowaliśmy \( \displaystyle \vee \) przy pomocy \( \displaystyle \neg, \wedge \).

Analogicznie aby pokazać funkcjonalną pełność zbioru \( \displaystyle \{\vee, \neg\} \) zdefiniujemy \( \displaystyle \wedge \) przy pomocy spójników \( \displaystyle \vee, \neg \). Z <ćwiczenia 4.2 mamy
\( \displaystyle \neg(x \wedge y)= \neg x \vee \neg y \)
a więc
\( \displaystyle x \wedge y=\neg( \neg x \vee \neg y). \)

Ćwiczenie 5.1

Udowodnij, że zbiór \( \displaystyle \{\Rightarrow, \neg\} \) jest funkcjonalnie pełny.

Twierdzenie 5.4

Zbiór \( \{NOR\} \) jest funkcjonalnie pełny.

Dowód
Pokażemy, że przy pomocy \( \displaystyle NOR \) można zdefiniować \( \displaystyle \neg \) oraz \( \displaystyle \vee \). Wtedy z twierdzenia twierdzenia 5.3 otrzymamy tezę twierdzenia.

Łatwo sprawdzić, że
\( \displaystyle p NOR p \equiv \neg. \)
Wiemy, że
\( \displaystyle p NOR q \equiv \neg (p\vee q). \)
Wobec tego mamy również
\( \displaystyle \neg(p NOR q) \equiv p\vee q. \)
Możemy teraz wyrazić negację za pomocą \( \displaystyle NOR \), otrzymamy wtedy
\( \displaystyle (p NOR q) NOR (p NOR q) \equiv p\vee q. \)

Ćwiczenie 5.2

Udowodnij, że zbiór \( \displaystyle \{NAND\} \) jest funkcjonalnie pełny.

Ćwiczenie 5.3

Zdefiniuj alternatywę przy pomocy samej implikacji.

Ćwiczenie 5.4

Jakie funkcje binarne da się zdefiniować przy pomocy samej implikacji?

Ćwiczenie 5.5

Udowodnij, że poniższe zbiory nie są funkcjonalnie pełne

  1. \( \{\wedge\} \)
  2. \( \{\vee\} \)
  3. \( \{\Leftrightarrow\} \)
  4. \( \{XOR\} \)

Ćwiczenie 5.6

Czy funkcje binarne, zdefiniowane za pomocą formuł zawierającyh jedynie przemienne spójniki, muszą być przemienne?


Ćwiczenie 5.7

(z wykładu prof. P.M.Idziaka) Niech \( F_n \) oznacza ilość boolowskich funkcji \( \mathrm {n} \) argumetnowych, a \( P_n \) ilość boolowskich funkcji \( \mathrm {n} \) argumentowych, takich że przy pomocy każdej z nich da się zdefiniować dowolną funkcję boolowską (czyli jeśli \( \circ \) jest takim spójnikiem to zbiór \( \{\circ\} \) jest funkcjonalnie pełny). Udowdnij istenienie poniższej granicy i wyznacz jej wartość
\( \lim_{n arrow \infty} \frac{P_n}{F_n} \)

Postacie normalne

Postacie normalne



Definicja 6.1

Literałem nazywamy formułę, która jest zmienną zdaniową lub negacją zmiennej zdaniowej.

Zauważmy, że formuła konstruowana w dowodzie twierdzenia 5.2 jest w pewnej standartowej postaci - formuła jest alternatywą formuł, które są koniunkcjami literałów. Przypomnijmy, że dla \( p \Rightarrow q \) zbudujemy formułę

\( (p \wedge q) \vee (\neg p \wedge q) \vee (\neg p \wedge \neg q). \)

Definicja 6.2

Formuła jest w dyzjunktywnej postaci normalnej (DNF), jeśli jest alternatywą formuł które są koniunkcjami literałów. Czyli wtedy, gdy jest postaci

\( \phi_1\vee \dots \vee \phi_n \)

oraz każda z formuł \( \phi_i \) jest koniunkcją literałów, czyli jest postaci

\( l_l^i \wedge \dots \wedge l_k^i \)

dla pewnych literałów \( l_l^i, \dots,l_k^i \)

Twierdzenie 6.3

Dla każdej formuły istnieje równoważna formuła w DNF.

Dowód

Wynika bezpośrednio z konstrukcji w dowodzie twierdzenia 5.2.

Definicja 6.4

Formuła jest w koniunktywnej postaci normalnej (CNF), jeśli jest koniunkcją formuł które są alternatywami literałów.

Twierdzenie 6.5

Dla każdej formuły istnieje równoważna formuła w CNF.

Dowód

Niech \( \displaystyle \Phi \) będzie dowolną formułą. Z twierdzenia twierdzenia 6.3 wynika, że dla formuły \( \displaystyle \neg \Phi \) istnieje dyzjunktywna postać normalna. Niech \( \displaystyle \Psi \) będzie taką formułą. Wtedy mamy

\( \displaystyle \Phi \equiv \neg \Psi. \)

Stosując wielokrotnie prawa de'Morgana dla formuły \( \displaystyle \neg \Psi \) otrzymamy formułę w koniunktywnej postaci normalnej. Indukcyjny dowód tego faktu pomijamy.

Ćwiczenie 6.1

Jak sprawdzić, czy formuła w CNF jest tautologią?

Ćwiczenie 6.2

Dla poniższych formuł wypisz ich najkrótsze równoważne formuły w CNF

  1. \( p \Leftrightarrow q \),
  2. \( p \Rightarrow (q \Rightarrow p) \),
  3. \( (p \Rightarrow q) \Rightarrow p \),
  4. \( (p \vee a \vee b) \wedge (\neg q \vee \neg a) \wedge(r \vee \neg b \vee \neg c) \wedge(c \vee p)) \),
  5. \( (p \wedge q) \vee (r \wedge s) \).

Spełnialność

Spośród wszystkich formuł wyróżnimy też zbiór formuł spełnialnych.

Definicja 6.6

Formuła jest spełnialna, jeśli istenieje takie wartościowanie, które wartościuje tą formułę na 1.

Formuły spełnialne są w ścisłym związku z tautologiami.

Twierdzenie 6.7

Formuła \( {\phi} \) jest tautologią wtedy i tylko wtedy, kiedy formuła \( \neg \phi \) nie jest spełnialna.

Dowód

Przypuśćmy, że formuła \( {\phi} \) jest tautologią. Wtedy dla każdego wartościowania \( \mathrm{v} \) mamy \( v(\phi)=1 \). Stąd otrzymujemy, że dla każdego wartościowania \( \mathrm{v} \) mamy \( v(\neg \phi)=0 \), a więc nie istnieje wartościwanie, które spełnia \( \neg \phi \), czyli formuła ta nie jest spełnialna.

Przypuśćmy, że formuła \( \neg \phi \) nie jest spełnialna, czyli nie istnieje wartościowanie \( \mathrm{v} \) takie, że \( v(\neg \phi)=0 \). Wynika stąd, że dla każdego wartościowania mamy \( v(\phi)=1 \), a więc \( {\phi} \) jest tautologią.

Ćwiczenie 6.3

Sprawdź spełnialność następujących formuł

  1. \( (\neg p \vee q) \wedge (\neg q \vee \neg r) \wedge (\neg q \vee \neg p) \)
  2. \( (\neg p \vee q) \wedge (\neg q \vee \neg r) \wedge (\neg q \vee p) \)

Formuły z powyższego zadania, poza tym że są w koniunktywnej postaci normalnej, to jeszcze występujące w nich klauzule mają dokładnie dwa literały. Problem spełnialności takich formuł jest nazywany w literaturze problemem 2SAT. Dla takich formuł istnieją szybkie algorytmy pozwalające ocenić ich spełnialność. Dopuszczanie klauzul o długości 3, bardzo komplikuje problem. Do dziś nie wiadomo czy dla takich formuł istnieją szybkie algorytmy oceniające spełnialność. Więcej na ten temat można się dowiedzieć z wykładu Teoria złożoności.

Logika intuicjonistyczna

Logika intuicjonistyczna


Niektórzy logicy mają wątpliwości co do tego, czy powinniśmy przyjmować schemat dowodu niewprost jako aksjomat. Poddanie w wątpliwość tego aksjomatu doprowadziło do powstnia tzw. logiki intuicjonistycznej. Ważnym powodem zajmowania się logiką intuicjonistyczną są jej zadziwiające związki z teorią obliczeń (patrz izomorfizm Curryego-Howarda).

Implikacyjny fragment logiki intuicjonistycznej, który będziemy oznaczać przez \( I_\Rightarrow \) to zbiór tych formuł, które da się dowodnić przy pomocy reguły MP z aksjomatów S i K.

Definicja 7.1

Aksjomaty \( I_\Rightarrow \)

  1. \( (\phi \Rightarrow (\psi \Rightarrow \phi)) \) (formuła ta jest nazywana aksjomatem K),
  2. \( (\phi \Rightarrow (\nu \Rightarrow \psi) \Rightarrow ((\phi \Rightarrow \nu) \Rightarrow (\phi \Rightarrow \nu) ) \) (formuła ta jest nazywana aksjomatem S).

W pełnej wersji logiki intucjonistycznej pojawiają się również aksjomaty dla spójników \( \wedge, \vee \) oraz \( \neg \). Dla uproszczenia zajmiemy się jedynie formułami, w których jedynym spójnikiem jest implikacja. Dodatkowym argumentem uzasadniającym takie podejście jest fakt, że każde twierdzenie logiki intuicjonistycznej, w którym jedynymi spójnikami są \( \Rightarrow \), da się udowodnić przy pomocy aksjomatów 7.1. Zobaczymy, że analogiczne twierdzenie nie jest prawdą dla logiki klasycznej. Logika intuicjonistyczna jest bardziej skomplikowana od logiki klasycznej. W szczególności nie istnieje skończona matryca, za pomocą której moglibyśmy rozstrzygać czy dana formuła jest twierdzeniem logiki intuicjonistycznej.

Twierdzenie 7.2

Każde twierdzenie logiki intuicjonistycznej jest twierdzeniem klasycznego rachunku zdań.

Dowód

Każdy dowód twierdzenia logiki inuicjonistycznej jest równocześnie dowodem twierdzenia klasycznego rachunku zdań.

Implikacja w drugą stronę nie zachodzi. Istnieją formuły zbudowane jedynie przy pomocy \( \Rightarrow \), które nie należą do \( I_\Rightarrow \), pomimo że są twierdzeniami klasycznego rachunku zdań. Przykładem takiej formuły jest prawo Pierce'a:

\( ((p \Rightarrow q) \Rightarrow p ) \Rightarrow p. \)

W zadaniu 4.1 pokazaliśmy, że formuła ta jest w istocie tautologią więc w myśl twierdzenia Posta 4.4 również twierdeniem klasycznego rachunku zdań.
W poniższych zadaniach udowodnimy poniższe twierdzenie

Twierdzenie 7.3

Prawo Pierce'a nie jest twierdzeniem intuicjonizmu.

Zauważmy, że oznacza to również, że każdy dowód prawa Pierce'a w logice klasycznej korzysta z aksjomatu 3 3.1, a więc wymaga używania spójnika \( \neg \).
Aby udowodnić twierdzenie 7.3, zdefiniujemy jeszcze jedną logikę którą nazwiemy \( I_3 \). Podobnie do 4.1 zdefiniujemy matrycę tym razem 3-elementową.

Definicja 7.4

Matrycą \( \mathbb{M}_3 \) będziemy nazywać zbiór trójelementowy \( M_3=\{0,1,2\} \), w którym 2 jest wyróżnioną wartością prawdy, wraz z funkcją odpowiadają za interpretacje \( \Rightarrow \) zdefiniowaną następująco


\( \Rightarrow \) 0 1 2
 0   2   2   2 
 1   0   2   2 
 2   0   1   2 

W przypadku rozważanej matrycy \( \mathbb{M}_3 \) wartościowanie będzie funkcją przypisującą zmiennym zdaniowym elementy zbioru \( M_3 \). Podobnie jak dla logiki klasycznej wartościowanie zmiennych rozszzerzamy na wartościowanie formuł zgodnie z tabelą 7.4.

Przykład 7.5

Dla wartościowania \( v \) takiego, że \( v(p)=2, v(q)=1, v(r)=0 \) formuła

\( (p \Rightarrow q) \Rightarrow r \)

przyjmuje wartość 0.

Definicja 7.6

Tautologią logiki \( I_3 \) będziemy nazywać każdą formułę implikacyjną, która przy każdym wartościowaniu zmiennych w \( M_3 \) przyjmuje wartość 2.

Ćwiczenie 7.1

Udowodnij, że aksjomaty S i K są tautologiami \( I_3 \).

Ćwiczenie 7.2

Udowodnij, że jeśli formuła postaci \( \phi \Rightarrow \psi \) oraz formuła \( {\phi} \) są tautologiami \( I_3 \), to formuła \( {\psi} \) jest tautologią \( I_3 \).

Ćwiczenie 7.3

Udowodnij, że każde twierdzenie logiki \( I_\Rightarrow \) jest tautologią \( I_3 \).


Ćwiczenie 7.4

Sprawdź, czy prawo Pierce'a jest tautologią \( I_3 \).


Podsumujmy wyniki powyższych zadań. Wskazaliśmy logikę \( I_3 \) taką, że każda twierdzenie intuicjonizmu jest tautologią \( I_3 \). Skoro prawo Pierce'a nie jest tautologią \( I_3 \), to nie jest też twierdzeniem \( I_\Rightarrow \).

UWAGA! W dalszej części będziemy się posługiwać wyłącznie logiką klasyczną.

Rachunek predykatów, przykład teorii w rachunku predykatów

Wprowadzenie


Na początku rozdziału o logice zdaniowej rozważaliśmy zdanie

Jeśli \( \mathrm {n} \) jest liczbą pierwszą to \( \mathrm {n} \) jest liczbą nieparzystą lub \( \mathrm {n} \) jest równe 2.

Opisaliśmy je wtedy formułą

\( p \Rightarrow (q \vee r). \)
w której \( p,q,r \) odpowiadały odpowiednio zdaniom

1. \( \mathrm {n} \) jest liczbą pierwszą,
2. \( \mathrm {n} \) jest liczbą nieparzystą,
3. \( \mathrm {n} \) jest równe 2.

Podstawiając zamiast zdania \(\mathrm {n} \) jest liczbą pierwszą zmienną zdaniową \( \mathrm {p} \) ukrywamy jednak część informacji. Zdanie to mówi przecież o pewnej liczbie \( \mathrm {n} \), co więcej zdania \( {p,q} \) i \( \mathrm {r} \) dotyczą tej samej liczby \( \mathrm {n} \). Zapiszmy więc \( p(n) \) zamiast \( {p} \) aby podkreślić fakt że prawdziwość \( {p} \) zależy od tego jaką konkretną wartość przypiszemy zmiennej \( \mathrm {n} \). Zdanie \( p(n) \) będzie prawdziwe jeśli za \( \mathrm {n} \) podstawimy jakąś liczbę pierwszą i fałszywe w przeciwnym przypadku. Zgodnie z tą konwencją nasze zdanie przyjmie postać

\( p(n) \Rightarrow (q(n) \vee r(n)). \)

Zwróćmy uwagę jednak, że trudno ocenić prawdziwość zdania \( \mathrm {p} \) dopóki nie podstawimy w miejsce \( \mathrm {n} \) jakiejś konkretnej liczby. Z drugiej strony jednak zdanie jakąkolwiek liczbę nie postawimy w miejsce \( \mathrm {n} \) zdanie będzie prawdziwe. Możemy więc przeformułować je jako

Dla każdej liczby naturalnej \( \mathrm {n} \), jeśli \( \mathrm {n} \) jest liczbą pierwszą to \( \mathrm {n} \) jest liczbą nieparzystą lub \( \mathrm {n} \) jest równe 2.

Aby móc formalnie zapisywać zdania takie jak powyższe wprowadzimy kwantyfikator \( \forall \) który będzie oznaczał ,,dla każdego" oraz \( \exists \) który będzie oznaczał ,,istnieje". Każde wystąpienie kwantyfikatora będzie dotyczyło pewnej zmiennej. W naszym przykładzie napiszemy

\( \forall_n p(n) \Rightarrow (q(n) \vee r(n)). \quad \mbox{(1.1)} \)

Możemy teraz powiedzieć, że powyższa formuła jest prawdziwa w zbiorze liczb naturalnych, gdzie \( p(n),q(n),r(n) \) będą oznaczać odpowiednio \(\mathrm {n} \) jest liczbą pierwszą, \( \mathrm {n} \) jest liczbą nieparzystą, \( \mathrm {n} \) jest równe 2.

Przy tej samej interpretacji \( p(n),q(n) \) moglibyśmy wyrazić zdanie

Istnieje parzysta liczba pierwsza.

jako

\( \exists_n p(n) \wedge \neg q(n) \quad \mbox{(1.2)} \)

Język rachunku predykatów

Język rachunku predykatów


Podobnie jak dla rachunku zdań zaczniemy od zdefiniowania języka rachunku predykatów.
Definicja 2.1.
Alfabet języka rachunku predykatów składa się z:

1. symboli stałych (a,b,c,)
2. symboli zmiennych (x,y,z,)
3. symboli funkcji \( (f^1, f^2, f^3, \dots ,g^1,g^2,g^3, \dots ,h^1, h^2, h^3, \dots) \)
4. symboli predykatów \( (p^1, p^2, p^3, \dots ,q^1,q^2,q^3, \dots ,r^1, r^2, r^3, \dots) \)
5. spójników logicznych: \( \Rightarrow,\neg \)
6. kwantyfikatorów: \( \forall,\exists \)
7. nawiasów i przecinków (niekonieczne)

Przyjmujemy, że cztery pierwsze alfabety są nieskończone, w tym sensie że nigdy nam nie braknie ich symboli. Z każdym symbolem funkcyjnym oraz predykatywnym jest związana liczba (którą zapisujemy w indeksie górnym) która będzie oznaczała liczbę jego argumetów.
Zwykle będą nam wystarczały symbole wymienione w nawiasach. Zanim przystąpimy do konstrukcji formuł zdefiniujemy tzw. termy.
Definicja 2.2. [Termy]

1. każdy symbol stałej jest termem
2. każdy symbol zmiennej jest termem
3. jeśli \( t_1,..,t_n \) są termami, a \( \alpha^n \) jest symbolem funkcyjnym, to \( \alpha^n(t_1,..,t_n) \) jest termem
4. nic innego nie jest termem

Przykład 2.3.
Jeśli rozważymy język, w którym 1,2,3 są symbolami stałych, \( {x,y} \) są symbolami zmiennych a \( +^2,\times^2,-^1,s^1 \) są symbolami funkcji to poniższe napisy będą termami

1. \( +^2(1,x) \)
2. \( -^1(3) \)
3. \( s^1(-^1(3)) \)
4. \( \times^2(y,+^2(x,-^1(2))) \)

Dla uproszczenia zapisu będziemy często pomijać liczby opisujące ilość argumentów symbolu. Symbole binarne będziemy czasem zapisywać w notacji infiksowej. Zgodnie z tą konwencją powyższe termy możemy zapisać jako

1. \( 1+x \)
2. \( -3 \)
3. \( s(-3) \)
4. \( y\times(x+(-3)) \)

Kiedy będziemy mówić o modelach zobaczymy, że termy będą interpretowane jako elementy rozważanej dziedziny, np. jeśli tą dziedziną będą liczby naturalne to termy będą interpretowane jako liczby naturalne. Formuły rachunku predykatów zdefiniujemy w dwóch krokach. Zaczniemy od formuł atomowych.

Definicja 2.4. [Formuły atomowe]

Jeśli \( t_1,..,t_n \) są termami, a \( \beta^n \) jest symbolem predykatu, to \( \beta^n(t_1,..,t_n) \) jest formułą atomową.

Przykład 2.5.

Kontynuując przykład dotyczący termów przyjmijmy dodatkowo, że w rozważanym języku \( p^3, q^1, =^2 \) są symbolami predykatów wtedy formułami atomowymi będą

1. \( p^3(1+x,-3,y\times(x+(-3))) \)
2. \( q^1(1) \)
3. \( =^2(y\times(x+(-3)),2) \)

Stosując analogiczną konwencję jak dla termów powyższe formuły atomowe zapiszemy jako

1. \( p(1+x,-3,y\times(x+(-3))) \)
2. \( q(1) \)
3. \( y\times(x+(-3))=2 \)

Symbole predykatywne będą odpowiadały funkcjom, które elementom rozważanej dziedziny (lub parom, trójkom itd. elementów) przypisują wartość prawdy lub fałszu. Takie funkcje nazywamy predykatami. W przypadku liczb naturalnych możemy na przykład mówić o predykacie pierwszości \( p(n) \), który przyjmuje wartość prawdy jeśli \( n \) jest liczbą pierwszą i fałszu w przeciwnym przypadku. Podobnie możemy mówić o binarnym predykacie równości (zwyczajowo oznaczanym przez \( = \)). Dla argumentów \( {x,y} \) przyjmuje on wartość prawdy wtedy kiedy \( \mathrm{x} \) jest tą samą liczbą co \( \mathrm{y} \) i fałszu w przeciwnym przypadku. Formuły atomowe będą opisywały proste zdania typu \( \mathrm{x} \) jest liczbą pierwszą, \( \mathrm{x} \) dzieli \( \mathrm{y} \), \( \mathrm{x} \) jest równe \( \mathrm {y} \). Innymi słowy sprowadzają sie do stwierdzania czy dany zestaw argumentów ma pewną własność opisywaną predykatem.

Uwaga 2.6.

W oznaczeniach z poprzednich przykładów, napis \( y\times(x+(-3))=q(1) \) nie jest formułą atomową ani termem. Gdyby predykat \( \mathrm{q} \) oznaczał np. bycie liczbą nieparzystą to powyższy napis powinniśmy przeczytać jako

\( y\times(x+(-3)) \) jest równe temu, że 1 jest liczbą nieparzystą.

Nie wolno porównywać elementów dziedziny (opisywanych przez termy) z wartościami prawdy i fałszu.

Z formuł atomowych będziemy budować bardziej złożone formuły zgodnie z poniższą definicją

Definicja 2.7. [Formuły rachunku predykatów]

1. Formuły atomowe są formułami.
2. Jeśli \( \mathrm{A} \) i \( B \) są formułami, to \( (A \Rightarrow B) \) oraz \( \neg A \) są formułami.
3. Jeśli \( \mathrm {A} \) jest formułą i \(\mathrm {x} \) jest zmienną, to \( \forall_x A \) jest formułą.
4. Nic innego nie jest formułą.

Przyjmujemy analogiczną konwencję dotyczącą nawiasowania jak dla rachunku zdań.

Przykład 2.8.

W oznaczeniach z poprzednich przykładów poniższe napisy nie są formułami rachunku predykatów

  • \( x+1 \)
  • \( (x=1) \Rightarrow 2 \)
  • \( \forall_x (x+y) \)
  • \( \forall_x (\neg x) \)

Poniższe napisy są formułami rachunku predykatów

  • \( x=1 \)
  • \( x=1 \Rightarrow x=2 \)
  • \( \forall_x q(x+y) \)
  • \( \forall_x \neg (x=0) \)
  • \( \forall_x \forall_z \neg (x=0) \)
  • \( \forall_x \forall_y \neg (x=y) \)

Ćwiczenie 2.1

Z poniższych formuł wypisz wszytkie termy i formuły atomowe

1. \( \forall_x \forall_y (s(x)=s(y) \Rightarrow x=y) \)
2. \( \forall_x \neg s(x)=0 \)
3. \( \forall_x (\neg (x=0) \Rightarrow (\exists_y s(y)=x)) \)
4. \( \forall_x x+0=x \)
5. \( \forall_x \forall_y x+s(y)=s(x+y) \)

Często będziemy używać dodatkowych spójników \( \wedge, \vee, \Leftrightarrow \). Ponieważ wszystkie dadzą się zdefiniować przy pomocy \( \Rightarrow \) i \( \neg \) nie włączamy ich do języka, a napisy w których występują będziemy traktować jako skróty. Ustalmy poniższe definicje

1. \( \phi \vee \psi \stackrel{\textrm{def}}{\equiv} \neg \phi \Rightarrow \psi \)
2. \( \phi \wedge \psi \stackrel{\textrm{def}}{\equiv} \neg ( \phi \Rightarrow \neg \psi) \)
3. \( \phi \Leftrightarrow \psi \stackrel{\textrm{def}}{\equiv} (\phi \Rightarrow \psi) \wedge (\psi \Rightarrow \phi) \)

Kwantyfikator egzystencjalny

Wprowadzimy jeszcze jeden bardzo ważny skrót - kwantyfikator egzystencjalny, oznaczamy go przez \( \exists \) i definiujemy w następujący sposób

\( \exists_x \phi \stackrel{\textrm{def}}{\equiv} \neg (\forall_x \neg \phi) \)

Nieformalnie kwantyfikator egzystencjalny mówi o tym, że istnieje jakiś obiekt, który podstawiony w miejsce \( \mathrm{x} \) uczyni formułę \( {\phi} \) prawdziwą. Zdefiniowaliśmy go poprzez równoważne stwierdzenie które mówi że nieprawdą jest, że każdy obiekt podstawiony w miejsce \( \mathrm {x} \) falsyfikuje \( {\phi} \). Zgodnie z powyższą konwencją formułę ze wstępu

\( \exists_n [p(n) \wedge \neg q(n)] \)

powinniśmy rozumieć jako

\( \neg \forall_n \neg (p(n) \wedge \neg q(n)). \)

Kwantyfikatory ograniczone

Kwantyfikatory ograniczone są skrótami które definujemy następująco

1. \( \forall_{x:\phi} \psi \stackrel{\textrm{def}}{\equiv} \forall_x \phi \Rightarrow \psi \)
2. \( \exists_{x:\phi} \psi \stackrel{\textrm{def}}{\equiv} \exists_x \phi \wedge \psi \)

i czytamy

1. dla każdego \(\mathrm {x} \) które spełnia \( {\phi} \) spełnione jest \( {\psi} \)
2. istnieje \( \mathrm {x} \) spełniające \( {\phi} \) które spełnia \( {\psi} \)

Zgodnie z tą konwencją formułę 1.1 możemy zapisać następująco

\( \forall_{n:p(n)} q(n) \vee r(n). \)

Podobnie formułę 1.2 zapiszemy jako

\( \exists_{n:p(n)}\neg q(n) \)

Ćwiczenie 2.2

Wyeliminuj wszystkie skróty z napisu

\( \exists_{x:\phi} \psi \)



Zmienne wolne i związane

Jeśli \( \mathrm {x} \) jest zmienną, a \( {\phi} \) jest formułą to każda pozycję w napisie \( {\phi} \) na której występuje symbol \(\mathrm {x} \) i nie jest poprzedzony bezpośrednio kwantyfikatorem, nazywamy wystąpieniem zmiennej \( \mathrm {x} \). Wystąpienia dzielimy na wolne i związanie. Wystąpienie jest związane jeśli znajduje się ,,pod działaniem" jakiegoś kwantyfikatora.

Definicja 2.9.

Rodzaj wystąpienia zmiennej w formule określamy zgodnie z poniższymi regułami:

1. Jeśli \( {\gamma} \) jest formułą atomową to wszystkie wystąpienia zmiennych w napisie \( {\gamma} \) są wolne.
2. Jeśli formuła jest postaci \( \phi \Rightarrow \psi \) lub \( \neg \phi \) to wystąpienia zmiennych pozostają takie same jak wystąpienia w w \( {\phi} \) oraz \( {\psi} \).
3. Jeśli formuła jest postaci \( \forall_x \phi \) to wszystkie wystąpienia zmiennej \( \mathrm {x} \) w \( \forall_x \phi \) są związane, a wystąpienia innych zmiennych pozostają takie jak w \( \phi \).

Przykład 2.10.

Rozważamy język z przykładu 2.5 (patrz przykład 2.5.)

1. w formule \( y\times(x+(-3))=x \) wszystkie wystąpienia zmiennych są wolne. Zmienna \( x \) ma dwa wystąpienia a zmienna \( y \) jedno.
2. w formule \( \forall_x y\times(x+(-3))=x \) wszystkie wystąpienia zmiennej \( y \) są wolne, i wszystkie wystąpienia zmiennej \( x \) są związane     (nadal są tylko dwa wystąpienia \( x \) ponieważ zgodnie z definicją nie liczymy symbolu \( x \) w \( \forall_x \))
3. w formule \( \forall_x \exists_y y\times(x+(-3))=x \) wszystkie wystąpienia zmiennych \( x \) oraz \( y \) są związane
4. w formule \( x=2 \Rightarrow \exists_x x=2 \) zmienna \( x \) ma jedno wystąpienie wolne (pierwsze) i jedno związane (drugie).
5. w formule \( \forall_x (x=2 \Rightarrow \exists_x x=2) \) obydwa wystąpienia zmiennej \( x \) są związane.

Ćwiczenie2.3

W podanych poniżej formułach podkreśl wszystkie wolne wystąpienia zmiennych.

1. \( p(z) \Rightarrow \exists_z p(z) \)
2. \( \forall_y ((\exists_z q(y,z)) \Rightarrow q(y,z)) \)
3. \( q(x,y) \Rightarrow \forall_x (q(x,y)\Rightarrow (\forall_y q(x,y))) \)
4. \( \forall_x \exists_y q(x,y) \Rightarrow \exists_x \forall_y q(x,y) \)
5. \( (\exists_z p(z)) \Rightarrow (\forall_z q(z,z) \vee \exists_x q(z,x)) \)

Definicja 2.11.

Formułę \( {\phi} \) nazywamy domkniętą jeśli żadna zmienna nie ma wolnych wystąpień w \( {\phi} \).

Ćwiczenie 2.4

Które z formuł z ćwiczenia 2.3 są domknięte?

Podstawienia

Często będziemy w formułach zastępować wystąpienia zmiennych pewnymi termami. Częstym przykładem jest podstawienie w miejsce zmiennej pewnej stałej np. w formule \( \displaystyle \forall_x x+y >x \), wstawiając w miejsce \( \displaystyle y \) stałą \( \displaystyle 1 \), otrzymamy \( \displaystyle \forall_x x+1 >x \).

Definicja 2.10.

Przez \( [x arrow t]\phi \) będziemy oznaczać formułę powstałą przez zastąpienie wszystkich wolnych wystąpień zmiennej \( \displaystyle x \) w formule \( \displaystyle \phi \) termem \( \displaystyle t \). Pisząc \( [x arrow t]\phi \) zakładamy również, że w formule \( \displaystyle \phi \) żadna ze zmiennych występujących w termie \( \displaystyle t \) nie ma związanych wystąpień w \( \displaystyle \phi \).

Aksjomatyka Rachunku Predykatów

Aksjomatyka Rachunku Predykatów


Rachunek predykatów podobnie jak klasyczny rachunek zdań może być wprowadzony aksjomatycznie. Pierwsza grupa aksjomatów to aksjomaty klasycznego rachunku zdań. Druga dotyczy kwantyfikatora \( \forall \) oraz jego interakcji z implikacją. Przypomnijmy, że kwantyfikator \( \exists \) traktujemy jako pewien skrót zapisu.

Definicja 3.1. Schematy aksjomatów rachunku predykatów

1. (Aksjomaty logiki zdaniowej) Każda formuła pasująca do któregokolwiek z poniższych schematów jest tautologią
(a) \( (\phi \Rightarrow (\psi \Rightarrow \phi)) \)
(b) \( (\phi \Rightarrow (\nu \Rightarrow \psi) \Rightarrow ((\phi \Rightarrow \nu) \Rightarrow (\phi \Rightarrow \psi) ) \)
(c) \( (\neg \phi \Rightarrow \psi) \Rightarrow ((\neg \phi \Rightarrow \neg \psi) \Rightarrow \phi) \)
2. (Aksjomaty dotyczące kwantyfikatora)
(a) Dla dowolnej formuły \( \phi \) oraz termu \( t \) następująca formuła jest aksjomatem \( \forall_x \phi \Rightarrow (\phi [x arrow t]) \) (uwaga na podstawienie)
(b) Dla dowolnej formuły \( \phi \) oraz zmiennej \(\mathrm {x} \), która nie ma wolnych wystąpień w \( \phi \) następująca formuła jest aksjomatem \( \phi \Rightarrow \forall_x \phi \)
(c) Dla dowolnych formuł \( {\phi} \) i \( {\psi} \) aksjomatem jest formuła \( \forall_x(\phi \Rightarrow \psi) \Rightarrow ((\forall_x \phi)\Rightarrow(\forall_x \psi)) \)

Poza tym do aksjomatów dorzucamy również wszystkie generalizacje formuł pasujących do powyższych schematów. Generalizacja formuły jest to ta sama formuła poprzedzona blokiem kwantyfikatorów ogólnych - dla dowolej formuły \( \phi \) oraz dowolnych zmiennych \( x_1,\dots,x_k \) formuła \( \forall_{x_1} \dots \forall_{x_k} \phi \) jest generalizacją \( \phi \).

Podobnie jak w rachunku zdań dowodem formuły \( {\phi} \) nazwiemy ciąg formuł \( \phi_0, \dots, \phi_n \) taki, że \( \phi_n \) jest tym samym napisem co \( {\phi} \) a każda formuła \( \phi_i \) dla \( i < n \) jest aksjomatem rachunku predykatów lub powstaje z dwóch formuł występujących wcześniej w dowodzie poprzez zastosowanie reguły Modus Ponens z Wykładu 2.

Definicja 3.2.

Twierdzeniem rachunku predykatów nazywamy dowolną formułę którą da się dowieść z aksjomatów rachunku predykatów.

Przykład 3.3.

Formalne dowody twierdzeń rachunku predykatów są zwykle skomplikowane. Dlatego w rozważanym przykładzie poczynimy kilka uproszczeń. Będziemy się zajmować formułą \( \displaystyle p(t) \Rightarrow \exists_x p(x). \)

Zamiast dowodzić dokładnie powyższą formułę, dowiedziemy podobny fakt, a mianowicie, że jeśli dołączymy do zbioru aksjomatów formułę \( \displaystyle p(t) \), to będziemy w stanie udowodnić \( \displaystyle \exists_x p(x) \). Twierdzenie o dedukcji, które można znaleźć w wykładzie Logika dla informatyków, mówi, że te podejścia są równoważne.

W poniższym dowodzie pominiemy również dowód formuły \( \displaystyle \neg \neg \forall_x \neg p(x) \Rightarrow \forall_x \neg p(x) \). Formuła ta pasuje do schematu \( \displaystyle \neg \neg \phi \Rightarrow \phi \). Łatwo więc sprawdzić, że formuła \( \displaystyle \neg \neg \phi \Rightarrow \phi \) jest tautologią klasycznego rachunku zdań, a więc -- w myśl twierdzenia Posta (patrz Wykład 2, Twierdzenie 4.4) -- ma dowód. Po zastąpieniu w tym dowodzie zmiennej \( \displaystyle \phi \) formułą \( \displaystyle \forall_x \neg p(x) \), otrzymamy dowód formuły \( \displaystyle \neg \neg \forall_x \neg p(x) \Rightarrow \forall_x \neg p(x) \).

Przestawiamy uproszczony dowód formuły \( \displaystyle p(t) \Rightarrow \exists_x p(x) \):

  1. \( \displaystyle \neg \neg \forall_x \neg p(x) \Rightarrow \forall_x \neg p(x) \) (patrz komentarz powyżej)
  2. \( \displaystyle (\forall_x \neg p(x)) \Rightarrow \neg p(t) \) (aksjomat 2a)
  3. \( \displaystyle [(\forall_x \neg p(x)) \Rightarrow \neg p(t)] \Rightarrow ([\neg \neg \forall_x \neg p(x)] \Rightarrow [(\forall_x \neg p(x)) \Rightarrow \neg p(t)]) \) (aksjomat 1a)
  4. \( \displaystyle [\neg \neg \forall_x \neg p(x)] \Rightarrow [(\forall_x \neg p(x)) \Rightarrow \neg p(t)] \) (MP z 2 i 3)
  5. \( \displaystyle ([\neg \neg \forall_x \neg p(x)] \Rightarrow [(\forall_x \neg p(x)) \Rightarrow \neg p(t)]) \Rightarrow [(\neg \neg \forall_x \neg p(x) \Rightarrow \forall_x \neg p(x)) \Rightarrow [(\neg \neg \forall_x \neg p(x))\Rightarrow \neg p(t)]] \) (aksjomat 1b)
  6. \( \displaystyle (\neg \neg \forall_x \neg p(x) \Rightarrow \forall_x \neg p(x)) \Rightarrow [(\neg \neg \forall_x \neg p(x))\Rightarrow \neg p(t)] \) (MP z 4 i 5)
  7. \( \displaystyle (\neg \neg \forall_x \neg p(x))\Rightarrow \neg p(t) \) (MP z 6 i 1)
  8. \( \displaystyle p(t) \Rightarrow ([\neg \neg \forall_x \neg p(x)]\Rightarrow p(t)) \) (aksjomat 1a)
  9. \( \displaystyle p(t) \) (dołączyliśmy tę formułę jako aksjomat)
  10. \( \displaystyle [\neg \neg \forall_x \neg p(x)]\Rightarrow p(t) \) (MP z 8 i 9)
  11. \( \displaystyle ([\neg \neg \forall_x \neg p(x)]\Rightarrow p(t)) \Rightarrow [((\neg \neg \forall_x \neg p(x))\Rightarrow \neg p(t)) \Rightarrow \neg \forall_x \neg p(x)] \) (aksjomat 1c)
  12. \( \displaystyle (\neg \neg \forall_x \neg p(x))\Rightarrow \neg p(t)) \Rightarrow \neg \forall_x \neg p(x) \) (MP z 10 i 11)
  13. \( \displaystyle \neg \forall_x \neg p(x) \) (MP z 7 i 12)

Ostatnia formuła to dokładnie \( \displaystyle \exists_x p(x) \) po rozpisaniu skrótu \( \displaystyle \exists \).

Przykład teorii w rachunku predykatów

W oparciu o logikę predykatów możemy budować nowe teorie, dokładając inne, tzw. pozalogiczne aksjomaty. W językach wielu teorii pojawia się symbol predykatywny \( =^2 \), mający symbolizować równość. Ponieważ zwykle wymagamy aby te same własności były spełnione dla \( =^2 \), zostały wyodrębnione specjalne aksjomaty dla równości. Aksjomaty, te to wszystkie formuły oraz ich generalizacje odpowiadające poniższym schematom:

1. \( t=t \), dla każdego termu \( t \)


2. \( ( t_1=t_1' \wedge \ldots \wedge t_k= t_k' ) \Rightarrow f(t_1,\ldots,t_k) = f(t_1', \ldots,t_k') \), dla dowolnego symbolu funkcyjnego \( f \), oraz dowolnych termów \( t_1,\ldots,t_k, t_1', \ldots, t_k' \), gdzie \( k \) jest ilością argumentów symbolu \( f \)


3. \( ( t_1=t_1' \wedge \ldots \wedge t_k= t_k' ) \Rightarrow ( p(t_1,\ldots,t_k) \Rightarrow p(t_1', \ldots,t_k') ) \), dla dowolnego symbolu predykatywnego \( p \), oraz dowolnych termów \( t_1,\ldots,t_k, t_1', \ldots, t_k' \), gdzie \( k \) jest ilością argumentów symbolu \( p \)

Rozważmy język, w którym mamy jeden binarny symbol predykatywny \( =^2 \), jeden symbol stałej \( 0 \) oraz symbole funkcyjne \( s^1, +^2, \times^2 \). Zgodnie z przyjętą konwencją termy i formuły będziemy zapisywać infixowo. Do aksjomatów logicznych, oraz aksjomatów dla równości, dokładamy następujące aksjomaty:

1. \( \forall_x \forall_y (s(x)=s(y) \Rightarrow x=y) \)
2. \( \forall_x \neg s(x)=0 \)
3. \( \forall_x (\neg (x=0) \Rightarrow (\exists_y s(y)=x)) \)
4. \( \forall_x x+0=x \)
5. \( \forall_x \forall_y x+s(y)=s(x+y) \)
6. \( \forall_x x\times 0= 0 \)
7. \( \forall_x \forall_y x\times s(y)=x \times y+y \)

Teorią Q nazwiemy wszystkie formuły w ustalonym języku które da się udowodnić z aksjomatów logiki predykatów z dołączonymi aksjomatami równości oraz 1-7. Nietrudno się przekonać, że wszystkie twierdzenia teorii Q są prawdziwe w liczbach naturalnych, przy naturalnej interpretacji występujących symboli (\( s(x) \) interpretujemy jako \( x+1 \)). W następnym wykładzie (patrz Wykład 4) przedstawiamy aksjomatyczną teorię w rachunku predykatów nazywaną teorią mnogości ZFC.

Modele

Modele



Dotychczas wprowadziliśmy rachunek predykatów aksjomatycznie. Zaletą takiego definiowania jest niewielka ilość potrzebnych pojęć. Z drugiej strony jednak dowody z aksjomatów są żmudne i nie sprzyjają budowaniu intuicji. W przypadku rachunku zdań widzieliśmy, że ten sam zbiór formuł można równoważnie zdefiniować za pomocą matrycy Boolowskiej z Wykładu 2. Niestety w przypadku rachunku predykatów nie istnieje taka skończona struktura, która pozwalałaby nam stwierdzać czy formuła jest twierdzeniem. Zobaczymy jednak, że pewne struktury warto rozważać. Mówiąc o modelach będziemy musieli użyć naiwnej teorii zbiorów opisanej w pierwszym rozdziale. Decydujemy się na to nadużycie w celu zdobycia dobrych intuicji i sprawności w posługiwaniu się kwantyfikatorami.

Przykład 4.1.

Rozważmy następujące zdanie
\( \forall_x \exists_y x \prec y \)

Sytuacja 1.

Przypuśćmy, że to zdanie mówi o liczbach naturalnych, a \( x \prec y \) jest prawdą wtedy i tylko wtedy gdy liczba \( \mathrm {x} \) jest silnie mniejsza od liczby \( \mathrm {y} \). Wtedy zdanie to powinniśmy uznać za nieprawdziwe, gdyż dla liczby 0 nie istnieje silnie mniejsza liczba naturalna.

Sytuacja 2.

Przypuśćmy, że to zdanie mówi o liczbach całkowitych, a \( x \prec y \) jest prawdą wtedy i tylko wtedy gdy liczba \( \mathrm {x} \) jest silnie mniejsza od liczby \( \mathrm {y} \). Wtedy zdanie to powinniśmy uznać prawdziwe. Istotnie, dla każdej liczby całkowitej \( \mathrm {x} \) możemy dobrać liczbę \( \mathrm {y} \) (na przykład równą \( x-1 \)) która jest od niej silnie mniejsza.

Sytuacja 3.

Przypuśćmy, że to zdanie mówi o liczbach naturalnych, a \( x \prec y \) jest prawdą wtedy i tylko wtedy gdy liczba \(\mathrm {x} \) jest równa liczbie \( \mathrm {y} \). Wtedy zdanie to powinniśmy uznać prawdziwe (do każdej liczby \( \mathrm {x} \) możemy dobrać liczbę \( \mathrm {y} \) tak aby była równa \( \mathrm {x} \)).

Powyższe przykłady pokazują różne interpretacje tej samej formuły. Wydaje się również że prawdziwość zdania zmienia się w zależności od interpretacji. Aby mówić o interpretacji danej formuły powinniśmy powiedzieć w jakim zbiorze będziemy interpretować zmienne i stałe (w naszym przykładzie były to kolejno zbiory \( N, Z, N \)) oraz jak interpretujemy symbole funkcyjne i predykatywne (w naszym przykładzie występował jedynie symbol predykatywny \( \prec \) który był interpretowany kolejno jako silna mniejszość, silna mniejszość, równość). Poniżej definiujemy formalnie pojęcie modelu.

Definicja 4.2. [Model]

Modelem języka rachunku predykatów nazywamy \( M=(D,I) \), gdzie:

1. \( D \) - jest niepustym zbiorem (dziedziną).
2. \( \mathrm {I} \) - jest interpretacją symboli języka taką, że:
(a) dla symboli stałych: \( I(c)\in D \) (symbole stałych są interpretowane jako elementy dziedziny)
(b) dla symboli funkcyjnych: \( I(f):D^k \rightarrow D \), gdzie \( \mathrm {k} \) jest ilością argumentów \( \mathrm {f} \) (symbole funkcyjne są interpretowane jako funkcje z potęgi dziedziny w dziedzinę)
(c) dla symboli predykatów: \( I(p):D^k \rightarrow {0,1} \), gdzie \( k \) jest ilością argumentów \( \mathrm {p} \) (symbole predykatywne są interpretowane jako funkcje przekształcające ciągi elementów z dziedziny w prawdę lub fałsz)

Definicja 4.3.

Mówimy, że model \( M \) jest odpowiedni dla formuły \( {\phi} \) jeśli są w nim zdefiniowane interpretacje wszystkich symboli stałych funkcji oraz predykatów występujących w formule \( {\phi} \).

Zanim ustalimy co to znaczy że formuła jest prawdziwa w modelu zdefiniujemy tzw. wartościowanie zmiennych

Definicja 4.4.

Wartościowanie zmiennych modelu \( M=(D,I) \) to funkcja która zmiennym przypisuje wartości dziedziny.
Jeśli ustalimy już wartościowanie zmiennych w modelu to możemy też mówić o wartościach przyjmowanych przez termy.
Definicja 4.5. [Wartościowanie termów]

Przy ustalonym modelu \( M=(D,I) \) wartościowanie zmiennych \( \sigma \) możemy rozszerzyć na wszytekie termy. Oznaczymy je przez \( \hat{\sigma} \). Rozszerzenie definiujemy w następujący sposób

1. jeśli term \( \mathrm {t} \) jest zmienną, \( \hat{\sigma}(t) = \sigma(t) \)
2. jeśli term \( \mathrm {t} \) jest stałą, to \( \hat{\sigma}(t)=I(t) \) (stałe wartościujemy zgodnie z interpretacją w modelu)
3. jeśli term \( \mathrm {t} \) jest postaci \( f(t_0,..,t_n) \), to

\( \hat{\sigma}(f(t_0,..,t_n))= I(f)(\hat{\sigma}(t_0),..,\hat{\sigma}(t_n)) \)

czyli aby poznać wartość termu najpierw obliczamy wartości poddtermów a potem obliczamy wartość funkcji odpowiadającej w modelu \( M \) symbolowi \( \mathrm {f} \) na wartościach poddtermów. Funkcję wartościującą termy będziemy często oznaczali tym samym symbolem co wartościowanie zmiennych.

Przykład 4.6.

Przypuśćmy, że w rozważanym języku symbol \( o \) jest symbolem stałej, symbole \( s,+,\times \) są symbolami funkcji, symbole \( < ,= \) są symbolami predykatów, \( {x,y,z} \) są zmiennymi. Ustalmy model w którym dziedziną jest zbiór liczb naturalnych, a symbole są interpretowane zgodnie z ich zwyczajowym znaczeniem (\( \mathrm {s} \) będziemy interpretować jako jednoargumentową funkcję która każdej liczbie przypisuje liczbę większą o jeden, \( o \) interpretujemy jako 0). Jeśli ustalimy ocenę zmiennych tak, że \( \sigma(x)=2, \sigma(y)=3, \sigma(z)=5 \) to

1. term \( {x+y} \) będzie wartościowany na 5
2. term \( s(x) \) będzie wartościowany na 3
3. term \( o \) będzie wartościowany na 0 (zgodnie z interpretacją stałych)
4 term \( s(o) \times s(z) \) będzie wartościowany na 6

Definicja 4.7. [Waluacja formuł]

Zdefiniujemy teraz prawdziwość formuł w ustalonym modelu \( M=(D,I) \) przy ustalonym wartościowaniu zmiennych \( {\sigma} \).

1. Jeśli formuła jest postaci \( p(t_0,..,t_n) \) (czyli jest formułą atomową), to jest ona prawdziwa wtedy i tylko wtedy jeśli wartością predykatu odpowiadającego w modelu \( M \) symbolowi \( \mathrm {p} \) (czyli \( I(p) \)) na elementach dziedziny odpowiadających termom \( t_0, \dots, t_n \) jest prawdą.
2. Jeśli formuła jest postaci \( A\Rightarrow B \), to jest ona prawdziwa wtedy i tylko wtedy, gdy formuła \( \mathrm {A} \) jest wartościowana na fałsz lub formuła \( B \) jest wartościowana na prawdę (zgodnie z tabelą dla implikacji)
3. Jeśli formuła jest postaci \( \neg A \) to jest ona prawdziwa wtedy i tylko wtedy gdy formuła \( \mathrm {A} \) jest wartościowana na fałsz (zgodnie z tabelą dla negacji)
4. Jeśli formuła jest postaci \( \forall_x \; A \), to jest ona prawdziwa jeśli prawdziwe jest \( \mathrm {A} \) i dla każdego wartościowania zmiennych różniącego się od \( {\sigma} \) co najwyżej interpretacją symbolu \( \mathrm {x} \) prawdziwe jest \( \mathrm {A} \).
5. Jeśli formuła jest postaci \( \exists_x \; A \), to jest ona prawdziwa jeśli istnieje ocena zmiennych różniąca się od \( {\sigma} \) co najwyżej interpretacją symbolu \( \mathrm {x} \) taka, że przy tej ocenie prawdziwe jest \( \mathrm {A} \).

Interpretacje kwantyfikatorów, jest w gruncie rzeczy bardzo intuicyjna. Formuła \( \forall_x A \) jest prawdziwa wtedy i tylko wtedy gdy dla każdego elementu dziedziny ,,podstawionego" w miejsce \( \mathrm {x} \) w formule \( \mathrm {A} \) prawdziwa jest formuła \( \mathrm {A} \) (uwaga! podstawiamy jedynie w miejsca wolnych wystąpień \( \mathrm {x} \)). Analogicznie formuła \( \exists_x A \) jest prawdziwa wtedy i tylko wtedy gdy istnieje taki element dziedziny, który ,,podstawiony" w miejsce \( \mathrm {x} \) w formule \( \mathrm {A} \) uczyni ją prawdziwa. Dotąd rozważaliśmy kwantyfikator \( \exists \) jako skrót pewnego napisu, jednak ze względu na jego naturalną interpretacje zdecydowaliśmy się dodać go do definicji waluacji formuł. W ćwiczeniu 4 pokażemy, że zdefiniowana powyżej waluacja formuł z kwantyfikatorem egzystencjalnym jest zgodna z waluacją zdefiniowanego wcześniej skrótu.

Przykład 4.8.

Możemy teraz powiedzieć, że formuła

\( \forall_y (x < y \vee x=y) \)

jest prawdziwa w modelu z Przykładu 4.6 przy ocenie zmiennych \( \sigma_1 \) takiej, że \( \sigma_1(x)=0 \), oraz że jest fałszywa w tym samym modelu dla przy ocenie zmiennej \( \sigma_2 \) takiej, że \( \sigma_2(x)=7 \) (bo na przykład wartościując \( \mathrm {y} \) na 3 formuła \( x < y \vee x=y \) nie będzie prawdziwa).

Istnieją jednak formuły które są prawdziwe w modelu z Przykładu 4.6 niezależnie od oceny zmiennych. Przykładem może być
\( \forall_y (x < y+x \vee y=o). \)

Definicja 4.9.

Formuła \( {\phi} \) jest prawdziwa w modelu \( M \) jeśli jest prawdziwa w tym modelu przy każdej ocenie zmiennych. Mówimy wtedy, że model \( M \) jest modelem formuły \( {\phi} \).

Ciekawe, że istnieją również formuły które są prawdziwe we wszystkich modelach. Rozważmy formułę

\( (\forall_x p(x)) \Rightarrow (\exists_x p(x)). \quad \mbox{(4.1)} \)

Rozważmy dowolny model \( M \) odpowiedni dla powyższej formuły (odpowiedni to znaczy taki który ustala interpretację wszystkich symboli stałychm, funkcji i predykatów występujących w formule, w tym przypadku symbolu predykatywnego \( \mathrm {p} \)). Jeśli w tym modelu nie jest prawdziwa formuła \( (\forall_x p(x)) \) to cała implikacja 4.1 jest prawdziwa a więc wszystkie te modele są modelami formuły 4.1. Pozostają więc do rozważenia te modele w których prawdziwe jest \( (\forall_x p(x)) \). Weźmy dowolny taki model i oznaczmy go przez \( M \). Aby pokazać, że \( (\exists_x p(x)) \) jest prawdziwe w \( M \) wystarczy wskazać że istnieje w dziedzinie taka wartość, że podstawiona w miejsce \( \mathrm {x} \) uczyni predykat oznaczony przez \( \mathrm {p} \) prawdziwym. Formuła \( (\forall_x p(x)) \) jest prawdziwa w \( M \) więc każda wartość podstawiona pod \( \mathrm {x} \) czyni predykat odpowiadający \( \mathrm {p} \) prawdziwym. Ponieważ dziedzina modelu \( M \) zgodnie z definicją 4.2 nie może być pusta więc istnieje przynajmniej jeden element dziedziny. Ponieważ w dziedzinie istnieje przynajmiej jeden element, oraz że formuła \( {p(x)} \) jest prawdziwy niezależnie od tego co podstawimy w miejsce \( \mathrm {x} \), to rzeczywiście istnieje taki element dziedziny, który podstawiony w miejsce \( \mathrm {x} \) uczyni formułę \( {p(x)} \) prawdziwą. A więc formuła \( \exists_x p(x) \) również jest prawdziwa. Wobec tego cała implikacja 4.1 jest prawdziwa w \( M \). Pokazaliśmy więc, że formuła 4.1 jest prawdziwa w każdym modelu.

Definicja 4.10.

Formułę rachunku predykatów nazywamy tautologią rachunku predykatów jeśli jest prawdziwa w każdym odpowiednim dla niej modelu .

Podobnie jak klasycznym rachunku zdań, w rachunku predykatów również tautologie okazują się tym samym co twierdzenia. Mówi o tym następujące klasyczne twierdzenie udowodnione przez Kurta Gödela.

Formuła rachunku predykatów jest tautologią rachunku predykatów wtedy i tylko wtedy gdy jest twierdzeniem rachunku predykatów.

Dowód powyższego twierdzenia jest przedstawiony na wykładzie Logika dla informatyków. Zauważmy, że zgodnie z powyższym twierdzeniem aby udowodnić, że formuła nie jest twierdzeniem rachunku predykatów wystarczy wskazać model w którym nie jest prawdziwa.

Ćwiczenie 4.1

Rozważmy model \( M \), którego dziedziną będą liczby naturalne, oraz w którym jest jeden predykat binarny oznaczony symbolem \( \mathrm {p} \), który przyjmuje wartość prawdy jeśli pierwszy z jego argumentów dzieli drugi. Napisz formuły które w modelu \( M \) są równowążne następującym zdaniom (w kolejnych formułach można wykorzystywać skróty dla formuł zdefiniowanych wcześniej)

1. \( \mathrm {x} \) jest równe \( \mathrm {y} \)
2. \( \mathrm {x} \) jest zerem
3. \(\mathrm {x} \) jest jedynką
4. \( \mathrm {x} \) jest liczbą pierwszą
5. \( \mathrm {x} \) jest kwadratem pewnej liczby pierwszej
6. \( \mathrm {x} \) jest iloczynem dwóch różnych liczb pierwszych
7. \( \mathrm {x} \) jest iloczynem dwóch liczb pierwszych
8. \(\mathrm {x} \) jest potęgą liczby pierwszej
9. dla każdych dwóch liczb istnieje ich największy wspólny dzielnik
10. dla każdych dwóch liczb istnieje ich najmniejsza wspólna wielokrotność
11 liczby \( \mathrm {x} \) i \( \mathrm {y} \) są względnie pierwsze


Ćwiczenie 4.2

Rozważmy model \( M \), którego dziedziną będą wszytkie punkty, odcinki i okręgi płaszyczny, oraz w którym jest jeden predykat binarny oznaczony symbolem \( \mathrm {p} \), który przyjmuje wartość prawdy jeśli jego argumenty mają przynajmniej jeden punkt wspólny. Napisz formuły które w modelu \( M \) są równowążne następującym zdaniom (w kolejnych formułach można wykorzystywać skróty dla formuł zdefiniowanych wcześniej)

1. \( \mathrm {x} \) jest równe \( \mathrm {y} \)
2. \( \mathrm {x} \) jest nadzbiorem \( \mathrm {y} \)
3. \( \mathrm {x} \) jest punktem
4. \( \mathrm {x} \) jest odcinkiem
5. \( \mathrm {x} \) jest okręgiem
6. \( \mathrm {x} \) jest równoległe do \( \mathrm {y} \)
7. \( \mathrm {x} \) i \( \mathrm {y} \) mają dokładenie jeden punkt wspólny
8. okręgi \( \mathrm {x} \) i \( \mathrm {y} \) są do siebie styczne
9. okręgi \( \mathrm {x} \) i \( \mathrm {y} \) są do siebie wewnętrznie styczne i okrąg \( \mathrm {x} \) jest okręgiem wewnętrznym
10. okręgi \( \mathrm{x} \) i \( \mathrm {y} \) są do siebie zewnętrzenie styczne
11. punkt \(\mathrm {x} \) jest końcem odcinka \( \mathrm {y} \)
12. odcinek \(\mathrm {x} \) jest styczny do okręgu \( \mathrm {y} \)
13. okręgi \( \mathrm{x} \) i \( \mathrm {y} \) mają taką samą średnicę
14. okrąg \( \mathrm {x} \) ma średnicę mniejszą niż okrąg \( \mathrm {y} \)


Ćwiczenie 4.3

Napisz formuły które mówią:

  • każdy odcinek ma dokładnie dwa końce
  • dla każdego okręgu wszystkie jego średnice przecinają się w dokładnie jednym punkcie
  • dla dowolnego odcinka istnieje dłuższy odcinek, który go zawiera
  • dla dowolnych trzech punktów niewspółliniowych istnieje okrąg który przechodzi przez wszystkie trzy punkty
  • istnieją dwa okręgi, które przecinają się w dokładnie 5 punktach.

Ćwiczenie4.4
Dla każdej z poniższych formuł znajdź model w którym jest prawdziwa oraz model w którym jest fałszywa

1. \( \forall_x \forall_y p(x,y) \Rightarrow p(y,x) \)
2. \( (\forall_x \exists_y p(x,y)) \Rightarrow \exists_y \forall_x p(x,y) \)
3. \( (\forall_x (p(x)\vee q(x))) \Rightarrow (\forall_x(p(x)) \vee \forall_x q(x)) \)
4. \( \forall_y [(\forall_x (p(x) \Rightarrow q(x)) \wedge q(y)) \Rightarrow p(z)] \)
5. \( \forall_x \forall_y(p(x,y) \Rightarrow \exists_z (p(x,z)\wedge p(z,y)) \)

Ćwiczenie 4.5

Udowodnij, że w dowolnym ustalonym modelu \( M \) prawdziwe są następujące formuły

1. \( \forall_x p(x) \Rightarrow (p(c)) \)
2. \( p(c) \Rightarrow \forall_x p(c) \)
3. \( \forall_x(p(x) \Rightarrow q(x)) \Rightarrow ((\forall_x p(x))\Rightarrow(\forall_x q (x))) \)
4. \( \exists_x p(x) \Leftrightarrow \neg \forall_x \neg p(x) \)
5. \( \neg \forall_x p(x) \Leftrightarrow \exists_x \neg p(x) \)
6. \( \forall_x r(x, f(x)) \Rightarrow \forall_x \exists_y r(x,y) \)

Ćwiczenie 4.6

Rozważmy formułę \( \forall_x (\neg g(x,x) \Leftrightarrow g(b,x)) \) (golibroda \( b \) goli wszystkich tych i tylko tych, którzy nie golą się sami). Udowodnij, że nie istnieje model dla powyższej formuły.

Teoria mnogości ZFC. Operacje na zbiorach

Wstęp



Aksjomatyczna teoria mnogości powstała jako odpowiedź na paradoksy powstające w teorii naiwnej. Jest ona oparta o uzupełniony aksjomatami rachunek predykatów. Aksjomaty to formuły, o których zakładamy, że są prawdziwe. Słowo \( \alpha \xi \iota \omega \mu \alpha \), z którego wywodzi się aksjomat, oznaczało wśród filozofów greckich tezę, która jest oczywista i nie potrzebuje dowodu. Aksjomaty teorii mnogości to formuły, które definiują podstawowe własności zbiorów - przyjmujemy je bez dowodów i w oparciu o nie wyprowadzamy bardziej skomplikowane własności. Dlatego właśnie niezwykle istotne jest, aby aksjomaty były możliwie najprostsze w formie i aby ich "prawdziwość" była oczywista. Przyjęcie złej aksjomatyki może doprowadzić do sytuacji, w której udaje się poprawnie dowodzić twierdzenia zupełnie sprzeczne z intuicją. Aksjomaty to podstawy naszej teorii -- jeśli podstawy są nieodpowiednie, stworzona na nich teoria może być zupełnie nieprzydatna.

Istnieje wiele różnych aksjomatyzacji teorii mnogości. Aksjomatyka, którą przedstawiamy w tym wykładzie, została zaproponowana, w podstawowej wersji, przez Ernsta Zermelo i uzupełniona później przez Adolfa Abrahama Halevi Fraenkela. Stąd też pochodzi jej nazwa ZF (aksjomatyka Zermelo-Fraenkla). Jeden spośród aksjomatów prezentowanych w tym wykładzie zasługuje na szczególną uwagę, jest to aksjomat wyboru. Ten pozornie oczywisty aksjomat pociąga za sobą konsekwencje sprzeczne z intuicją. Aksjomat ten często wyróżniany jest z podstawowego zestawu i aksjomatyka bez niego oznaczana jest przez ZF, a z nim przez ZFC (gdzie ostatnia litera pochodzi od nazwy dodatkowego aksjomatu: Axiom of Choice).

Podstawowe definicje

Podstawowe definicje


Aksjomatyczna teoria mnogości jest oparta o rachunek predykatów posługujący się jedynym symbolem predykatowym. Symbol ten jest dwuargumentowy i oznaczamy go przez

\( \in \)

Predykat ten jest najczęściej interpretowany w modelu jako symbol przynależności do zbioru. Zbiór, który jest wartością zmiennej po lewej stronie symbolu jest elementem zbioru, który jest wartością zmiennej występującej po prawej.
Dla ułatwienia posługiwania się formalizmem związanym z aksjomatyczną teorią mnogości używamy wielu skrótów pozwalających na bardziej zwięzłe zapisywanie formuł. Często używany symbol \( \notin \) jest skrótem mówiącym, że dwa elementy nie są ze sobą w relacji \( \in \), to znaczy

\( x \notin y \stackrel{\textrm{def}}{\equiv} \lnot x\in y. \)

Kolejny skrót oznaczamy przez \( = \) i definiujemy go w następujący sposób,

\( x = y \stackrel{\textrm{def}}{\equiv} \forall z ( z\in x\iff z\in y). \)

Zgodnie z intuicją wyniesioną z naiwnej teorii zbiorów skrót ten definiuje dwa zbiory jako równe, jeśli dla każdego wartościowania zmiennej \( z \) element jest w zbiorze \( x \) wtedy i tylko wtedy, kiedy jest w zbiorze \( y \). Nieformalnie, dwa zbiory są równe jeśli posiadają dokładnie te same elementy. W naszym języku nie mamy możliwości zdefiniowania pojedynczego bytu w modelu, gdyż nie mamy wpływu na to, jak interpretowane są predykaty. Będziemy mówić, że zbiór posiadający daną cechę jest unikalny, jeśli wszystkie zbiory posiadające tą cechę są równe.
Podobnie do równości jesteśmy w stanie zdefiniować zawieranie, czyli inkluzji zbiorów

\( x \subset y \stackrel{\textrm{def}}{\equiv} \forall z ( z\in x \Longrightarrow z\in y). \)

Inkluzja ta spełnia własności, które pochodzą z naiwnej teorii mnogości. Przede wszystkim, dwa zbiory są sobie równe wtedy i tylko wtedy, kiedy jeden jest podzbiorem drugiego, a drugi pierwszego.

Fakt 2.1.

Następująca formuła jest prawdziwa w aksjomatycznej teorii mnogości

\( \forall x \forall y ( x = y \iff x\subset y \land y\subset x). \)

Dowód

Zastępując skróty przez odpowiadające im napisy, otrzymujemy:

\( \forall x \forall y [ \forall z ( z\in x\iff z\in y) \iff \forall z ( z\in x \Longrightarrow z\in y)\land \forall z ( z\in y \Longrightarrow z\in x)]. \)

Używając podstawowych własności rachunku predykatów, otrzymujemy:

\( \forall x \forall y [\forall z ( z\in x\iff z\in y) \iff \forall z ( (z\in x \Longrightarrow z\in y)\land ( z\in y \Longrightarrow z\in x))] \)

i dalej

\( \forall x \forall y [\forall z ( z\in x\iff z\in y) \iff \forall z (z\in x\iff z\in y)], \)

co jest tautologią rachunku predykatów.

W bardzo podobny sposób możemy pokazać, że

\( \forall x \forall y \forall z (x\subset y \land y\subset z ) \Longrightarrow x\subset z. \)

Czyli, że zawieranie zbiorów zdefiniowane w rachunku predykatów jest przechodnie.

Aksjomat zbioru pustego

Aksjomat zbioru pustego


Formuły, które daje się udowodnić wyłącznie na gruncie rachunku predykatów nie są interesujące. Aby na gruncie aksjomatycznej teorii mnogości udało się udowodnić nawet podstawowe fakty, potrzebujemy aksjomatów. Pierwszy aksjomat gwarantuje, oczywiste w naiwnej teorii mnogości, istnienie zbioru pustego.

Aksjomat zbioru pustego Zakładamy, że następująca formuła, zwana aksjomatem zbioru pustego, jest prawdą

\( \exists x \forall y\; y\notin x, \)

a zbiór \( x \) spełniający ten warunek nazywamy zbiorem pustym i oznaczamy przez \( \emptyset \).

Aksjomat zbioru pustego mówi, że istnieje zbiór nieposiadający elementów. Dokładnie, definiująca go formuła mówi, że każdy \( y \) nie należy do \( \emptyset \). Symbol \( \emptyset \) oznacza dokładnie jeden zbiór, czego dowodzą poniższe fakty.

W następującym fakcie pokażemy, że istnieje nie więcej niż jeden zbiór pusty. Aksjomat zbioru pustego gwarantuje nam istnienie przynajmniej jednego zbioru pustego i w związku z tym zbiór pusty jest dokładnie jeden.

Fakt 3.1.

Istnieje co najwyżej jeden zbiór pusty, czyli następująca formuła jest prawdziwa

\( \forall x\forall y \;(\forall z\,z\notin x\land \forall z \,z\notin y ) \Longrightarrow x=y. \)

Dowód

Niewątpliwie

\( \forall x\forall y \;(\forall z\,z\notin x\land \forall z \,z\notin y ) \Longrightarrow (\forall z\,(z\notin x\land z\notin y )) \)

skąd możemy wnioskować, że

\( \forall x\forall y \;(\forall z\,z\notin x\land \forall z \,z\notin y ) \Longrightarrow (\forall z\,z\in x\iff z\in y ) \)

gdzie prawa strona implikacji jest definicją równości zbiorów. Intuicyjnie dowód przebiega następująco. Dwa zbiory są sobie równe, jeśli każdy element albo należy do obu z nich równocześnie, albo do żadnego. Weźmy dwa zbiory puste i dowolny element. Element ten nie należy do żadnego z tych zbiorów. Wnioskujemy, że zbiory te muszą być sobie równe.

Aksjomat Pary

Aksjomat Pary


Aby aksjomatyczna teoria mnogości była podobna do naiwnej teorii, którą chcemy naśladować, powinna gwarantować istnienie więcej niż jednego zbioru. Niestety, aksjomat zbioru pustego gwarantuje istnienie tylko jednego zbioru. Jednoelementowy model \( \{a\} \), gdzie \( a\notin a \), spełnia aksjomat zbioru pustego. Wprowadzenie następnego aksjomatu gwarantuje istnienie "nieskończonej ilości" zbiorów. Jest to aksjomat mówiący, że dla dowolnych dwóch bytów możemy stworzyć zbiór zawierający je i żadnych innych elementów. Stwierdzenie to jest prawdziwe w naiwnej teorii mnogości i zgodne z intuicją.

Zakładamy, że następująca formuła, zwana aksjomatem pary, jest prawdą

\( \forall x \forall y \exists z \forall w\;\ w\in z \iff (w = x\lor w =y). \)

Zbiór \( z \) którego istnienie gwarantuje ten aksjomat jest oznaczany przez \( \{x,y\} \). W przypadku kiedy \( x=y \) stosujemy skrót \( \{x,x\} = \{x\} \).

Podobnie jak dowodziliśmy unikalności zbioru pustego, możemy wykazać, że dla ustalonych zbiorów \( x \) i \( y \) istnieje dokładnie jeden zbiór \( \{x,y\} \). Weźmy dwa zbiory \( z_1 \) i \( z_2 \) takie, że dla każdego \( w \) mamy \( w\in z_1 \iff (w=x\lor w = y) \) i \( w\in z_2 \iff (w=z\lor w=y) \). Natychmiast otrzymujemy \( w\in z_1 \iff w\in z_2 \), co dowodzi, że \( z_1=z_2 \) i że dla dowolnych dwóch zbiorów istnieje dokładnie jeden zbiór zawierający wyłącznie te zbiory jako elementy.

Aksjomat pary razem z aksjomatem zbioru pustego gwarantują, że modele dla aksjomatycznej teorii mnogości zawierają nieskończenie wiele zbiorów. Każdy model zawiera, na mocy aksjomatu zbioru pustego, zbiór pusty oznaczony przez \( \emptyset \). Na mocy aksjomatu pary w modelu istnieje również zbiór \( \{\emptyset\} \) różny od zbioru pustego. Używając aksjomatu pary, jeszcze raz możemy skonstruować następny, różny od poprzednich zbiór \( \{\{\emptyset\}\} \). Tą procedurę możemy powtarzać dowolną ilość razy, konstruując za każdym razem nowy zbiór. Aksjomat pary nie gwarantuje istnienia zbiorów więcej niż dwuelementowych. Na podstawie aksjomatu zbioru pustego posiadamy zbiór zeroelementowy, aksjomat pary gwarantuje istnienie zbiorów jedno- i dwuelementowych.

Ćwiczenie 4.1

Skonstruuj model dla dwu pierwszych aksjomatów posiadający wyłącznie zbiory zero, jedno oraz dwuelementowe.


Aksjomat Sumy

Aksjomat Sumy



Aby teoria mnogości mogła się rozwijać, potrzebujemy gwarancji istnienia zbiorów trzy-, cztero- i więcej elementowych. Tę i wiele innych własności gwarantuje aksjomat sumy. Aksjomat ten mówi, że jeśli posiadamy zbiór zbiorów, to można utworzyć nowy zbiór składający się z elementów tych zbiorów. Postać tego aksjomatu jest techniczna, ale w połączeniu z aksjomatem pary pozwala on między innymi stworzyć zbiór równoważny sumie zbiorów z naiwnej teorii mnogości.

Aksjomat sumy. Zakładamy, że następująca formuła, zwana aksjomatem sumy, jest prawdą
\( \forall x \exists y \forall z \; (z\in y) \iff (\exists w\; w\in x \land z\in w). \)

Zbiór \( y \), którego istnienie gwarantuje ten aksjomat oznaczamy przez \( \bigcup x \).

Aksjomat sumy oznacza, że dla dowolnego zbioru istnieje zbiór składający się dokładnie z elementów elementów tego zbioru. Podobnie jak powyżej bardzo proste rozumowanie gwarantuje, że zbiór \( \bigcup x \) jest unikalny dla każdego \( x \). Aksjomat sumy pozwala nam sumować zbiory w sposób nieco inny niż ten, który dawała naiwna teoria mnogości. Wykażemy kilka podstawowych własności dotyczących sum zbiorów.

Fakt 5.1.

Następująca formuła jest prawdą

\( \bigcup \emptyset = \emptyset. \)

Dowód

Dla dowolnego zbioru \( z \) na mocy definicji \( \bigcup\emptyset \) mamy \( z\in\bigcup\emptyset \) wtedy i tylko wtedy, kiedy \( \exists w\; w\in\emptyset \land z\in w \). Ponieważ nic nie należy do zbioru pustego, ten ostatni warunek nigdy nie jest spełniony, co dowodzi, że dla dowolnego \( z \) mamy \( z\notin\bigcup\emptyset \). Natychmiastowym wnioskiem z tego jest, że \( \bigcup\emptyset = \emptyset \), co należało pokazać.

Kolejny fakt jest nieco bardziej skomplikowany.

Fakt 5.2. Następująca formuła jest prawdą

\( \bigcup \{\emptyset\} = \emptyset. \)

Dowód

Dla dowolnego zbioru \( z \) na mocy definicji \( \bigcup\{\emptyset\} \) mamy \( z\in\bigcup\{\emptyset\} \) wtedy i tylko wtedy, kiedy \( \exists w\; w\in\{\emptyset\} \land z\in w \). Pierwsza część koniunkcji jest spełniona wtedy i tylko wtedy, kiedy \( w=\emptyset \), ale wtedy druga część koniunkcji \( z\in\emptyset \) jest nieprawdą. Wnioskujemy z tego, że każdego \( z \) mamy \( z\notin\bigcup\{\emptyset\} \) i \( \bigcup\{\emptyset\} = \emptyset \).

Jeśli jeden zbiór jest podzbiorem drugiego zbioru, to również ich sumy powinny pozostać w takiej samej zależności. Formalnie fakt ten przedstawia się następująco:

Fakt 5.3.

Następująca formuła jest prawdą

\( \forall x \forall y \;x\subset y \Longrightarrow \bigcup x\subset \bigcup y. \)

Dowód

Chcemy pokazać, że dla dowolnego \( z \), jeśli \( z\in\bigcup x \), to \( z\in\bigcup y \). Ustalmy dowolne \( z \) takie, że \( z\in\bigcup x \). To implikuje, że istnieje zbiór \( w \) spełniający \( w\in x \) i \( z\in w \). Na mocy założenia mówiącego, że \( x\subset y \) wnioskujemy, że \( w\in y \), a co za tym idzie \( \exists w\; w\in y \land z\in w \), czyli \( z\in\bigcup y \), co należało pokazać.

Kolejną własność podajemy w formie ćwiczenia.

Ćwiczenie 5.1

Wykaż, że dla dowolnego zbioru \( x \) mamy \( x=\bigcup\{x\} \).

Przy pomocy aksjomatu sumy, posiłkując się aksjomatem pary, możemy zdefiniować sumę zbiorów znaną z naiwnej teorii mnogości. Aby zsumować dwa zbiory \( x \) i \( y \), tworzymy zbiór \( \{x,y\} \), a następnie używamy w stosunku do niego aksjomatu sumy.

\( x\cup y \stackrel{\textrm{def}}{\equiv} \bigcup\{x,y\}. \) Suma ta posiada identyczne własności jak suma naiwna.

Fakt 5.4.

Element występuje w sumie dwóch zbiorów wtedy i tylko wtedy, kiedy występuje w którymś z nich. Formalnie, następująca formuła jest prawdą

\( \forall x\forall y\forall z \; z\in x\cup y \iff (z\in x \lor z\in y). \)

Dowód

Ustalmy dowolne \( x, y \) i \( z \). Dla dowodu implikacji w prawą stronę załóżmy, że \( z\in x\cup y \), to znaczy, że \( z\in \bigcup\{x,y\} \), czyli, że istnieje element \( \{x,y\} \) taki, że \( z \) do niego należy. Tym elementem może być \( x \) lub \( y \), więc \( z\in x \lor z\in y \) -- pokazaliśmy implikację w prawą stronę. Dla dowodu implikacji w drugą stronę zakładamy, że \( z\in x\lor z\in y \). Wtedy niewątpliwie istnieje element \( \{x,y\} \) zawierający w sobie \( z \) i \( z\in\bigcup\{x,y\}=x\cup y \). Dowodzi to implikacji w drugą stronę i równocześnie całego faktu.

Ćwiczenie 5.2

Udowodnij następujące własności dotyczące sumy zbiorów. Dla dowolnych zbiorów \( x \), \( y \):

1. \( x\cup y = y\cup x \),
2. \( x\subset x\cup y \),
3. \( y\subset x\cup y \),
4. \( x\cup x = x \),
5. \( x\cup \emptyset = x \).

Aksjomat sumy gwarantuje istnienie zbiorów więcej niż dwuelementowych w modelu. Skończone zbiory składające się z pewnej liczby elementów będziemy oznaczać, podobnie jak zbiory dwuelementowe, używając nawiasów klamrowych. Na przykład czteroelementowy zbiór składający się ze zbiorów \( x,y,z,w \) będzie oznaczany przez \( \{x,y,z,w\} \). Na podstawie aksjomatu zbioru pustego i aksjomatu pary możemy skonstruować zbiór \( \{\{\emptyset, \{\emptyset\}\},\{\{\{\emptyset\}\},\{\{\{\emptyset\}\}\}\}\} \) i otrzymać
\( \bigcup\{\{\emptyset, \{\emptyset\}\},\{\{\{\emptyset\}\},\{\{\{\emptyset\}\}\}\}\} = \{\emptyset,\{\emptyset\},\{\{\emptyset\}\},\{\{\{\emptyset\}\}\}\} \)

zbiór czteroelementowy. Rzeczą, której aksjomat sumy nie gwarantuje, jest istnienie zbiorów nieskończonych.

Ćwiczenie 5.3.

Skonstruuj model dla trzech pierwszych aksjomatów posiadający wyłącznie zbiory skończone.


Schemat aksjomatu wyróżniania

Schemat aksjomatu wyróżniania



Zanim przejdziemy do wprowadzenia aksjomatu gwarantującego istnienie zbiorów nieskończonych, wprowadzimy jeszcze jeden aksjomat. Zasada zwana Aksjomatem Wyróżniania nie jest, formalnie rzecz biorąc aksjomatem - jest schematem aksjomatu albo rodziną aksjomatów o bardzo podobnej strukturze. Aksjomat ten mówi, że z każdego zbioru możemy wybrać podzbiór elementów spełniających konkretną własność, jeśli tylko własność tę można zdefiniować w języku rachunku predykatów.

Aksjomat Wyróżniania Dla dowolnej formuły \( \varphi \) nieposiadającej zmiennych wolnych innych niż \( z \) następująca formuła jest prawdą

\( \forall x \exists y \forall z\; z\in y \iff (z\in x \land \varphi). \)

Zbiór, którego istnienie gwarantuje ta formuła, jest często oznaczany przez \( \{z\in x\,:\, \varphi\} \).

W powyższym aksjomacie formuła \( \varphi \) definiuje własność, na podstawie której kwalifikujemy elementy do podzbioru zbioru \( x \). Schemat aksjomatu wyróżniania będziemy nazywać w skrócie aksjomatem wyróżniania. Aksjomat ten jest bardzo ważnym i mocnym narzędziem. Zwróćmy uwagę, że aksjomat ten pozwala nam tworzyć wyłącznie zbiory mniejsze od tych, których istnienie jest wcześniej gwarantowane - oczywistym wnioskiem z definicji jest, że \( \{z\in x\,:\, \varphi\}\subset x \).

Aksjomat wyróżniania jest nieco kłopotliwy w użyciu w formie zaprezentowanej powyżej. Poniższa własność jest konsekwencją tego aksjomatu, a jest dużo prostsza w zastosowaniach. Dla dowolnej formuły \( \varphi \) nieposiadającej zmiennych wolnych innych niż \( z \) i \( x_1 \) następująca formuła jest prawdą:

\( \forall x_1 \forall x \exists y \forall z\; z\in y \iff (z\in x \land \varphi). \quad \mbox{(*)} \)

Powyższa własność wynika z aksjomatu wyróżniania. Dowód tego faktu korzysta z powyżej zdefiniowanych aksjomatów i aksjomatu zbioru potęgowego (który zostanie wprowadzony dalej w tym wykładzie) i jest przedstawiony w wykładzie Iloczyn kartezjański i aksjomat wyróżniania.

Rozważmy zbiór \( \bigcup x_1 \), którego istnienie, dla każdego zbioru \( x_1 \), gwarantuje aksjomat sumy. Jest to zbiór takich \( z \), że istnieje \( w \) spełniające \( z\in w\in x_1 \). Mówiąc prościej, jest to zbiór bytów występujących w którymkolwiek z elementów \( x_1 \). Naturalną konsekwencją wydaje się definicja zbioru elementów występujących w każdym z elementów \( x_1 \). Definicja takiego zbioru jest możliwa właśnie dzięki aksjomatowi wyróżniania. Zbiór taki oznaczamy przez \( \bigcap x_1 \) i definiujemy jako

\( \bigcap x_1 = \{y\in\bigcup x_1\,:\, \forall z\; z\in x_1\Longrightarrow y\in z\}. \)

Aby wykazać istnienie tego zbioru, korzystamy z konsekwencji aksjomatu wyróżniania \( \mbox{(*)} \) w następującej formie:

\( \forall x_1 \forall x \exists y \forall z\; z\in y \iff (z\in x \land (\forall w\; w\in x_1\Longrightarrow z\in w)). \)
Jeśli w powyższej formule zastosujemy \( \bigcup x_1 \) jako \( x \), to otrzymujemy dowód istnienia \( \bigcap x_1 \).

Naturalnie zbiór \( \bigcap x \) jest podzbiorem zbioru \( \bigcup x \) i co za tym idzie \( \bigcap\emptyset \subset \bigcup \emptyset = \emptyset \), czyli \( \bigcap \emptyset = \emptyset \). Co więcej konstrukcja ta pozwala nam zdefiniować kolejną, znaną z naiwnego podejścia do teorii mnogości, operację
\( x\cap y \stackrel{\textrm{def}}{\equiv} \bigcap\{x,y\}. \)
Przecięcie dwóch zbiorów to zbiór tych elementów, które występują w obu zbiorach równocześnie. Rozumując analogicznie do dowodu Faktu 5.4 (patrz fakt 5.4.), można pokazać, że, podobnie jak dla unii, przecięcie ma znaczenie identyczne z tym używanym w naiwnej teorii mnogości:

\( \forall x\forall y \forall z\; z\in x \cap y \iff (z\in x \land z\in y). \quad \mbox{(+)} \)

Ćwiczenie 6.1

Udowodnij następujące własności dotyczące przecięcia zbiorów. Dla dowolnych zbiorów \( x \), \( y \) i \( z \)

1. \( x\cap y = y\cap x \),
2. \( x\supset x\cap y \),
3. \( y\supset x\cap y \),
4. \( x\cap x = x \),
5. \( x\cap \emptyset = \emptyset \),
6. \( x\cap(y\cup z) = (x\cap y)\cup (x\cap z) \),
7. \( x\cup(y\cap z) = (x\cup y)\cap(x\cup z) \).

Dowiedziemy teraz prostego faktu dotyczącego przecięć zbiorów. Fakt ten wyrazimy najpierw intuicyjnie, a następnie jako formułę, która będzie prawdziwa w naszej aksjomatyce:

Fakt 6.1.

Przecięcie niepustego zbioru \( x \) jest największym pod względem inkluzji zbiorem zawartym w każdym elemencie \( x \). To znaczy, że następująca formuła jest prawdą:

\( \forall x \; x\neq\emptyset \Longrightarrow ( \forall y\; (\forall z\; z\in x \Longrightarrow y\subset z)\Longrightarrow y\subset \bigcap x) \)

Dowód

Ustalmy niepusty zbiór \( x \) i zbiór \( y \) taki, że \( y \) jest podzbiorem każdego elementu \( x \). Weźmy dowolny element zbioru \( y \) i nazwijmy go \( z \). Ponieważ \( y \) jest podzbiorem każdego elementu \( x \), to prawdą jest, że \( \forall w\; w\in x \Longrightarrow z\in w \). Ponieważ zbiór \( x \) nie jest pusty otrzymujemy \( z\in \bigcup x \), a ponieważ \( z \) spełnia formułę powyżej \( z\in \bigcap x \). Pokazaliśmy, że każdy element \( y \) jest elementem \( \bigcap x \), czyli że \( y\subset \bigcap x \), czego należało dowieść.

Kolejny fakt dowodzi, że, zgodnie z intuicją, przecięcie większej rodziny zbiorów jest mniejsze.

Fakt 6.2.

Jeśli zbiór \( x \) jest niepustym podzbiorem zbioru \( y \), to \( \bigcap y \) jest podzbiorem \( \bigcap x \). Równoważnie następująca formuła jest prawdą

\( \forall x \forall y (x\subset y \land x\neq \emptyset) \Longrightarrow \bigcap y \subset \bigcap x. \)
Dowód

Ustalmy zbiór \( x\neq\emptyset \) i zbiór \( y \) spełniające \( x \subset y \). Z definicji zbioru zbioru \( \bigcap y \) wnioskujemy, że \( \bigcap y \) jest podzbiorem każdego elementu zbioru \( y \). Ponieważ \( x\subset y \) zbiór \( \bigcap y \) jest również podzbiorem każdego elementu zbioru \( x \). Stosując Fakt 6.1, natychmiast otrzymujemy, że \( \bigcap y\subset \bigcap x \) -- co należało pokazać.

Kolejny fakt ilustruje zależność pomiędzy elementami zbioru, jego unią i przecięciem.

Fakt 6.3.

Zbiór \( \bigcap x \) jest podzbiorem, a zbiór \( \bigcup x \) nadzbiorem każdego elementu zbioru \( x \). Równoważnie następująca formuła jest prawdziwa:

\( \forall x\forall y\; y\in x \Longrightarrow \bigcap x\subset y \subset \bigcup x. \)

Dowód

Ustalmy dowolne zbiory \( x \) i \( y \) takie, że \( y\in x \). Dla dowodu pierwszej inkluzji ustalmy dowolne \( z\in\bigcap x \). Definicja \( \bigcap x \) implikuje, że \( z \) jest elementem każdego z elementów \( x \), w szczególności \( z\in y \), czyli \( \bigcap x\subset y \).

Dla dowodu drugiej inkluzji ustalmy dowolne \( z\in y \). Ponieważ istnieje element \( x \), którego \( z \) jest elementem, to \( z\in\bigcup x \). To dowodzi, że \( y\subset \bigcup x \) i druga inkluzja jest dowiedziona.

Przy pomocy aksjomatu wyróżniania jesteśmy w stanie zdefiniować różnicę dwóch zbiorów. Dla zbiorów \( x \) i \( x_1 \) ich różnica to zbiór elementów, które występują w pierwszym i nie występują w drugim zbiorze. Istnienie zbioru będącego różnicą dwu zbiorów dowodzimy przy użyciu równania (*). Piszemy:
\( x\setminus x_1 \stackrel{\textrm{def}}{\equiv} \{z\in x\,:\, z\notin x_1\}. \)
W powyższym przykładzie formuła \( \varphi \) występująca w definicji aksjomatu wyróżniania to \( z\notin x_1 \). Aby umotywować zgodność z intuicją dotyczącą różnicy zbiorów, wykażemy następujący fakt.

Fakt 6.4.

Zbiór \( x\setminus y \) jest największym zbiorem zawartym w \( x \) i przecinającym się pusto z \( y \). Równoważnie, następująca formuła jest prawdą

\( \forall x\forall y \forall z\; (z\subset x \land z\cap y = \emptyset )\Longrightarrow z\subset x\setminus y. \)

Dowód

Ustalmy dowolne zbiory \( x,y,z \) takie, że \( z\subset x \land z\cap y = \emptyset \) i dowolne \( w\in z \). Wtedy \( w\in x \), ponieważ \( z\subset x \) i \( w\notin y \), ponieważ \( z\cap y = \emptyset \). To implikuje, że \( w\in x\setminus y \), co należało pokazać.

Ćwiczenie 6.2

Udowodnij następujące własności dotyczące różnicy zbiorów. Dla dowolnych zbiorów \( x, y \) i \( z \):

1. \( x\setminus(x\setminus y) = x\cap y \),
2. \( x\setminus (y\cap z) = (x\setminus y)\cup (x\setminus z) \),
3. \( x\setminus y = y \setminus x \Longrightarrow x=y \).

Aksjomat Nieskończoności

Aksjomat Nieskończoności

Następujący aksjomat gwarantuje istnienie zbiorów nieskończonych. Działanie tego aksjomatu jest podobne do działania indukcji matematycznej omawianej wcześniej. Intuicyjnie aksjomat ten gwarantuje nam istnienie przynajmniej jednego zbioru zawierającego wszystkie liczby naturalne. Zbiór taki musi być nieskończony.

Aksjomat Nieskończoności Zakładamy, że następująca formuła, zwana aksjomatem nieskończoności, jest prawdą:

\( \exists x\; (\emptyset\in x \land (\forall y\; y\in x\Longrightarrow y\cup\{y\}\in x )). \)

Rozważmy zbiór \( x \), którego istnienie jest gwarantowane przez aksjomat nieskończoności. Niewątpliwie \( \emptyset\in x \). Na podstawie drugiej części definicji wnioskujemy, że \( \emptyset\cup \{\emptyset\}=\{\emptyset\}\in x \). Stosując drugą część definicji raz jeszcze, otrzymujemy dalej \( \{\emptyset\}\cup\{\{\emptyset\}\}=\{\emptyset,\{\emptyset\}\}\in x \). Powtarzając tę operację za każdym razem, otrzymujemy nowy element zbioru \( x \). Intuicyjnie, wymagania stawiane zbiorowi \( x \) w definicji gwarantują, że, na zasadzie podobnej do zasady indukcji matematycznej, będzie on posiadał "nieskończenie" wiele elementów. Zbiór ten może posiadać inne elementy niż te, które udają się skonstruować za pomocą procedury wymienionej powyżej.

Zbiór, którego istnienie gwarantuje aksjomat nieskończoności, jest używany do konstruowania liczb naturalnych. W konstrukcji liczb naturalnych opartej na liczbach porządkowych wprowadzonych po raz pierwszy przez Johna von Neumanna wyżej wymienione zbiory to kolejne liczby naturalne.

\( \begin{array} {ll} \text{liczba naturalna zero to zbiór } & \emptyset \\ \text{liczba naturalna jeden to zbiór } & \{\emptyset\} \\ \text{liczba naturalna dwa to zbiór } & \{\emptyset,\{\emptyset\}\} \\ \text{liczba naturalna trzy to zbiór } & \{\emptyset,\{\emptyset\},\{\emptyset,\{\emptyset\}\}\} \\ \text{i tak dalej\dots} & \text{ } \end{array} \)

W powyższej konstrukcji liczba naturalna to bardzo konkretny zbiór. Zbiór będący liczbą naturalną ma, intuicyjnie mówiąc, tyle elementów, jaka jest wartość tej liczby, choć nie każdy zbiór posiadający tyle elementów jest liczbą naturalną. Wykład 7 jest w całości poświęcony konsekwencjom tego aksjomatu; uzyskany tam zbiór liczb naturalnych jest najmniejszym \( x \) spełniającym warunki aksjomatu nieskończoności.

Aksjomat Zbioru Potęgowego

Aksjomat Zbioru Potęgowego

Aksjomat nieskończoności pozwala nam tworzyć zbiory nieskończone. Dzięki poniższemu aksjomatowi możemy tworzyć zbiory wszystkich podzbiorów danego zbioru. Jak będzie to przedstawione w wykładzie: "Teoria mocy twierdzenie Cantora-Bernsteina, twierdzenie Cantora. Zbiory przeliczalne, zbiory mocy kontinuum", tworzenie zbioru składającego się z wszystkich podzbiorów danego zbioru jest prostym sposobem na tworzenie jeszcze liczniejszych zbiorów. W wykładzie tym wykażemy, że nawet dla zbiorów nieskończonych zbiór wszystkich podzbiorów danego zbioru jest liczniejszy niż sam zbiór.

Aksjomat Zbioru Potęgowego Zakładamy, że następująca formuła, zwana aksjomatem zbioru potęgowego, jest prawdą:

\( \forall x \exists y \forall z \; z\in y \iff z\subset x. \)

Zbiór potęgowy \( y \), którego istnienie gwarantuje ten aksjomat, oznaczamy przez \( \mathcal{P}(x) \) lub przez \( 2^x \).

Aksjomat zbioru potęgowego gwarantuje, że dla każdego zbioru \( x \) istnieje zbiór \( \mathcal{P}(x) \) zawierający wyłącznie wszystkie podzbiory \( x \). Bardzo łatwo zauważyć, że dla dowolnego zbioru \( x \) mamy \( \emptyset\in\mathcal{P}(x) \) oraz \( x\in\mathcal{P}(x) \). Oznaczanie zbioru potęgowego przez \( 2^x \) ma głębsze znaczenie, które zostanie przedstawione w zbiór funkcji \( x^y \). Na razie możemy jedynie dla zbiorów skończonych odpowiedzieć na dwa pytania:

Ćwiczenie 8.1

Czy następujące fakty są prawdziwe:

1. Jeśli \( x \) jest skończonym, \( n \)-elementowym zbiorem, to \( \mathcal{P}(x) \) posiada dokładnie \( 2^n \) elementów?
2. Jeśli \( x \) jest zbiorem będącym liczbą naturalną (oznaczmy ją nieformalnie jako \( n \)), to zbiór \( \mathcal{P}(x) \) jest zbiorem będącym liczbą naturalną oznaczoną nieformalnie jako \( 2^n \)?


Wykażemy kilka prostych faktów dotyczących zbiorów potęgowych.

Fakt 8.1.

Dla dowolnego zbioru \( x \) mamy \( x=\bigcup \mathcal{P}(x) \), ale istnieje taki zbiór, że \( \mathcal{P}(\bigcup x)\neq x \).

Dowód

Dla dowodu równości \( x=\bigcup\mathcal{P}(x) \), ustalmy dowolne \( z\in x \). Wnioskujemy, że \( z\in\{z\}\in\mathcal{P}(x) \) i w związku z tym \( z\in\bigcup\mathcal{P}(x) \), czyli \( x\subset\bigcup\mathcal{P}(x) \). Dla dowodu inkluzji w drugą stronę ustalamy \( z\in\bigcup\mathcal{P}(x) \). To oznacza, że istnieje \( y\in\mathcal{P}(x) \) takie, że \( z\in y \). To z kolei implikuje, że \( z\in y\subset x \), czyli \( z\in x \) i \( \bigcup\mathcal{P}(x)\subset x \). Oba te fakty razem dowodzą, że \( x=\bigcup\mathcal{P}(x) \), co dowodzi pierwszej części tezy. Zbiór \( x \), dla którego \( \mathcal{P}(\bigcup x)\neq x \), to zbiór \( \{\{\emptyset\}\} \). Zbiór

\( \mathcal{P}(\bigcup\{\{\emptyset\}\})= \mathcal{P}(\{\emptyset\}) = \{\emptyset,\{\emptyset\}\}\neq \{\{\emptyset\}\}, \)

co potwierdza fakt, że istnieją zbiory, dla których \( \mathcal{P}(\bigcup x)\neq x \).

Kolejny fakt dowodzi, że inkluzja przenosi się na zbiory potęgowe.

Fakt 8.2.

Większe zbiory mają więcej podzbiorów, czyli następująca formuła jest prawdą:

\( \forall x\forall y\; x\subset y\Longrightarrow \mathcal{P}(x)\subset\mathcal{P}(y). \)

Dowód
Aby dowieść faktu, ustalamy dowolne \( x \), \( y \) takie, że \( x\subset y \) oraz dowolne \( z \) takie, że \( z\in\mathcal{P}(x) \). To implikuje, że \( z\subset x \) i korzystając z założenia, otrzymujemy \( z\subset x\subset y \), co oznacza, że \( z\in\mathcal{P}(y) \).

Następujące własności zbiorów potęgowych przedstawiamy w formie ćwiczeń

Ćwiczenie 8.2

Dla dowolnego zbioru \( x \) zachodzi \( x\subset \mathcal{P}(\bigcup x) \).

Ćwiczenie 8.3

Jakie implikacje zachodzą pomiędzy dwoma warunkami \( \bigcup x\subset x \) i \( x\subset \mathcal{P}(x) \).

Ćwiczenie 8.4

Czy następujące równości są prawdziwe dla dowolnych zbiorów \( x \) i \( y \)?

1. \( \mathcal{P}(\bigcup(x\cap y))= \mathcal{P}(\bigcup x)\cap\mathcal{P}(\bigcup y) \),
2. \( \bigcap\mathcal{P}(x\cap y) = \bigcap\mathcal{P}(x)\cap\bigcap\mathcal{P}(y) \).

Schemat Aksjomatu Zastępowania

Schemat Aksjomatu Zastępowania


Kolejnym aksjomatem lub raczej schematem aksjomatu jest aksjomat zastępowania. Aksjomat ten, wraz z aksjomatem zbioru pustego, implikuje aksjomat wyróżniania i dlatego aksjomat wyróżniania jest często omijany w liście aksjomatów. Intuicyjna interpretacja tego aksjomatu jest następująca. Jeśli pewna własność, opisana formułą, ma cechy funkcji, to obrazem każdego zbioru, względem tej własności, jest również zbiór.

Aksjomat Zastępowania Dla dowolnej formuły \( \varphi \) nieposiadającej zmiennych wolnych innych niż \( w \) i \( v \) następująca formuła jest prawdą:

\( (\forall w \exists u \forall v\; \varphi \Longrightarrow u=v) \Longrightarrow (\forall x \exists y\forall v\; (v\in y \iff \exists w\; w\in x \land \varphi)) \)

Aksjomat zastępowania posiada specyficzną formę. Istnienie zbioru \( y \) jest zagwarantowane pod warunkiem, że formuła \( \varphi \) spełnia wymaganą własność. Formuła \( \varphi \) musi działać jak "funkcja częściowa", to znaczy, że jeśli jest spełniona dla zbiorów \( w,v \), to nie może być prawdą dla żadnych innych zbiorów \( w,v' \). Nieformalnie, formuła \( \varphi \) przyporządkowuje jednoznacznie pewnym zbiorom inne zbiory. Pod tym warunkiem istnieje zbiór bytów przyporządkowany bytom z danego zbioru \( x \). Zupełnie nieformalnie możemy stwierdzić, że dla zdefiniowanej formułą częściowej funkcji, jeśli jako dziedzinę weźmiemy dowolny zbiór \( x \), to przeciwdziedzina tej funkcji również jest zbiorem.

Aksjomat zastępowania nie był jednym z aksjomatów zaproponowanych przez Ernsta Zermelo. Został on dodany później przez Adolfa Abrahama Halevi Fraenkela i jest stosowany obecnie jako część aksjomatyki, którą nazywamy potocznie ZF. Pokażemy teraz, że aksjomat zastępowania implikuje aksjomat wyróżniania.

Rozpoczynając dowód, ustalamy \( x \) i \( \varphi \), do których chcielibyśmy zastosować aksjomat wyróżniania. Jedyną zmienną wolną w \( \varphi \) jest \( z \) i aksjomat wyróżniania gwarantuje istnienie zbioru \( y \) będącego podzbiorem \( x \) i składającego się dokładnie z tych elementów, dla których \( \varphi \) jest prawdą. Aby istnienie zbioru \( y \) zostało zagwarantowane przez aksjomat zastępowania, musimy zmienić formułę \( \varphi \). Nowa formuła \( \varphi' \) wygląda następująco

\( \exists z\; \varphi \land z=w=v. \)

Formuła \( \varphi' \) posiada dwie zmienne wolne \( w \) i \( v \) i spełnia warunek jednoznaczności, gdyż jeśli jest prawdą dla \( w \) i \( v \), to niewątpliwie \( w=v \). Co więcej formuła jest prawdą dla wyłącznie tych \( w=v \), dla których \( \varphi \) jest prawdą przy założeniu, że \( z=w=v \). Stosując aksjomat zastępowania dla tego samego \( x \), dla którego chcielibyśmy stosować aksjomat wyróżniania, otrzymujemy zbiór tych \( v \), dla których \( \varphi' \) jest prawdą dla pewnego \( w\in x \). Ale skoro tak, to \( w=z=v \) i \( \varphi \) jest prawdą dla \( z \), co dowodzi, że otrzymaliśmy dokładnie ten sam zbiór. Dowiedliśmy, że aksjomat zastępowania implikuje aksjomat wyróżniania.

Aksjomat Regularności

Aksjomat Regularności


W skład zestawu aksjomatów zaproponowanych przez Ernsta Zermelo i uzupełnionych później przez Adolfa Abrahama Halevi Fraenkela wchodzą dodatkowe dwa aksjomaty. Pierwszym z nich jest aksjomat regularności.

Aksjomat Regularności Zakładamy, że następująca formuła, zwana aksjomatem regularności, jest prawdą:

\( \forall x\; (x\neq\emptyset \Longrightarrow \exists y\; (y\in x \land y\cap x = \emptyset )). \)

(Zwróćmy uwagę, że występujący w formule napis \( y\cap x =\emptyset \), można zastąpić równoważnym napisem \( \neg \exists z\; z \in y \wedge z \in x \), unikając tym samym symbolu \( \cap \). ) Aksjomat regularności nazywamy czasem aksjomatem ufundowania. Gwarantuje on, że zbiory budowane są zgodnie z intuicją. Mówi, że każdy zbiór posiada element przecinający się pusto z nim samym. W szczególności, używając aksjomatu regularności możemy pokazać, że żaden zbiór nie zawiera samego siebie.

Fakt 10.1.

Żaden zbiór nie jest swoim własnym elementem, równoważnie, następująca formuła jest prawdziwa:

\( \forall x\; x\notin x. \)

Dowód

Dla dowodu niewprost załóżmy, że nasz fakt jest nieprawdziwy i ustalmy \( x \) takie, że \( x\in x \). Na podstawie aksjomatu pary możemy stworzyć zbiór \( \{x\} \). Istnienie takiego zbioru przeczy jednak aksjomatowi regularności, ponieważ jedynym elementem \( \{x\} \) jest \( x \) i \( \{x\}\cap x \neq \emptyset \), ponieważ \( x\in \{x\}\cap x \). Sprzeczność z aksjomatem w dowodzie niewprost gwarantuje, że fakt jest prawdziwy.

Aksjomat Wyboru

Aksjomat Wyboru


Ostatnim aksjomatem jest aksjomat wyboru. Jest to aksjomat, który wywołał dużą liczbę kontrowersji. Wielu znakomitych matematyków początku XX wieku uważało, że nie należy go dopuścić do zestawu podstawowych aksjomatów. W chwili obecnej większość matematyków uważa, że aksjomat wyboru jest prawdziwy, nawet jeśli jego konsekwencje są bardzo nieintuicyjne. System aksjomatów przedstawionych powyżej oznaczamy przez ZF -- skrót pochodzący od pierwszych liter nazwisk jego twórców. Zestaw aksjomatów z przedstawionym poniżej aksjomatem wyboru oznaczamy przez ZFC, gdzie C jest symbolicznym zapisem dodatkowego aksjomatu (Axiom of Choice). Prezentujemy poniżej jedną z wielu równoważnych postaci aksjomatu.

Aksjomat Wyboru. Następująca formuła jest prawdziwa:

\( \forall x\ ( \emptyset\notin x\land \forall y\forall z\ (z\in x\land y\in x) \Longrightarrow (z=y \lor z\cap y = \emptyset))\Longrightarrow \exists w \forall v\ (v \in x \Longrightarrow \exists u\ v\cap w=\{u\}) \)

Aksjomat wyboru mówi, że jeśli \( x \) jest zbiorem nie zawierającym zbioru pustego oraz takim, że każde dwa jego elementy są rozłączne, to istnieje zbiór \( w \), który z każdym z elementów \( x \) ma dokładnie jeden element wspólny. Intuicyjnie znaczy to, że mając rodzinę rozłącznych zbiorów, możemy stworzyć zbiór, wybierając po jednym elemencie z każdego zbioru.

Własność gwarantowana przez aksjomat wyboru może wydawać się intuicyjnie oczywista. Niestety konsekwencje, jakie pociąga za sobą przyjęcie tego aksjomatu, zniechęciły wielu matematyków. Jedną z konsekwencji aksjomatu wyboru jest twierdzenie znane jako Paradoks Banacha-Tarskiego - nie jest to sprzeczność logiczna jak paradoks Bertrandta Russella, a jedynie bardzo nieintuicyjny fakt. Twierdzenie to mówi, że trójwymiarową kulę można podzielić na sześć części, z których, za pomocą obrotów i translacji, da się skonstruować dwie kule identyczne z tą pierwszą.

Podsumowanie

Podsumowanie



Wszystkie dowody pojawiające się w kolejnych wykładach bazują na aksjomatyce ZF lub ZFC. Część dowodów przedstawionych podczas pozostałych wykładów nie korzysta z aksjomatu wyboru. Z kontekstu, w jakim są prezentowane, jest oczywiste, czy dany dowód wymaga, czy też nie wymaga tego aksjomatu.

Iloczyn kartezjański i relacje

Para uporządkowana

Para uporządkowana



Bardzo często będziemy chcieli mieć do czynienia ze zbiorem, który niesie w sobie informację o dwóch innych zbiorach, informację tak trafnie zakodowaną, aby można było odzyskać z niej każdą z jego składowych. Do tego celu wprowadzimy zbiór nazywany parą uporządkowaną dwóch innych zbiorów.

Definicja 1.1.

Niech \( \displaystyle x \) oraz \( \displaystyle y \) będą zbiorami. Przez parę uporządkowaną \( \displaystyle (x,y) \) rozumiemy zbiór

\( \displaystyle \{ \{x\}, \{x,y\}\} \)

Parę uporządkowaną można zdefiniować inaczej na wiele sposobów. Chodzi jednak o to, aby ze zbioru, który jest parą, można było odzyskać jednoznacznie każdą z jego składowych. Tak więc moglibyśmy zaakceptować każdą inną inną definicję pod warunkiem, że będzie spełnione następujące twierdzenie:

Twierdzenie 1.2.

Dla dowolnych zbiorów \( \displaystyle a,b,c,d \) zachodzi:

\( \displaystyle (a,b) = (c,d) \Leftrightarrow a=c \hspace {0.1mm} \wedge b= d \)

Dowód

Dowód przeprowadzimy tylko ze strony lewej do prawej, bo w odwrotnym kierunku jest to fakt oczywisty. Niech zatem dwie pary \( \displaystyle (a,b) \) i \( \displaystyle (c,d) \) będą równe. Ponieważ \( \displaystyle \{a\} \in (a,b) \), więc \( \displaystyle \{a\} \in (c,d) \). Mamy zatem \( \displaystyle \{a\} = \{c\} \) lub \( \displaystyle \{a\} = \{c,d\} \). W pierwszym przypadku \( \displaystyle a=c \), ale w drugim również jest tak, mamy bowiem, że \( \displaystyle c \in \{a\} \). Pierwszą część twierdzenia mamy za sobą, bo już wiemy, że pierwsze współrzędne równych par są równe.

\( \displaystyle (a,b) = (a,d). \)

Następnie przeprowadzamy dowód przez przypadki. Jeżeli jest tak, że \( \displaystyle a=b \), to \( \displaystyle (a,b)=\{\{a\}\} \). Zatem \( \displaystyle \{\{a\}\} = \{\{a\},\{a,d\}\} \), co daje, że \( \displaystyle \{a,d\}=\{a\} \), a zatem \( \displaystyle d=a \). W przeciwnym przypadku, gdy \( \displaystyle a \neq b \) mamy, że \( \displaystyle \{a,b\} \in \{\{a\},\{a,d\}\} \). Daje to dwie możliwości albo \( \displaystyle \{a,b\} = \{a\} \), co nie może mieć miejsca, bo mielibyśmy, że \( \displaystyle a=b \) albo zaś \( \displaystyle \{a,b\} = \{a,d\} \). To drugie prowadzi do naszej tezy \( \displaystyle b=d \).

Ćwiczenie 1.3

Dla każdej pary \( \displaystyle x=(a,b) \) udowodnij, że

\( \displaystyle \bigcap \bigcap x= a. \)

Ćwiczenie 1.4

Udowodnij, że dla dowolnej pary uporządkowanej \( \displaystyle x \) zbiór

\( \displaystyle \bigcap \bigcap (\mathcal{P}(x) \setminus \mathcal{P}(\emptyset)) \)

jest pusty, gdy współrzędne par są różne, a w przeciwnym przypadku jest zbiorem jednoelementowym zawierającym współrzędną pary \( \displaystyle x \).

Ćwiczenie 1.5

Pokaż, że z każdej pary \( \displaystyle x \) można otrzymać jej drugą współrzędną, posługując się jedynie parą \( \displaystyle x \), mnogościowymi operacjami \( \displaystyle \bigcup, \bigcap, \cup,\cap,\setminus,\mathcal{P}() \) oraz stałą \( \displaystyle \emptyset \).


Iloczyn kartezjański

Iloczyn kartezjański


Zanim wprowadzimy definicję zbioru wszystkich par uporządkowanych elementów dwóch zbiorów (zwanego dalej iloczynem kartezjańskim), należy nam się krótkie wprowadzenie. Otóż niech \( \displaystyle x\in X \) oraz \( \displaystyle y \in Y \). Łatwo zauważyć, że zarówno \( \displaystyle \{x,y\} \), jak i \( \displaystyle \{x\} \) są podzbiorami \( \displaystyle X \cup Y \). Zatem \( \displaystyle \{x,y\} \in \mathcal{P} (X \cup Y) \) oraz \( \displaystyle \{x\} \in \mathcal{P} (X \cup Y) \). Więc \( \displaystyle \{\{x\},\{x,y\}\} \subseteq \mathcal{P} (X \cup Y) \), co daje, że \( \displaystyle (x,y) \in \mathcal{P} (\mathcal{P} (X \cup Y)) \).

Istnienie i konstrukcja iloczynu kartezjańskiego zostało dokładnie omówione w dodatkowym rozdziale "Iloczyn kartezjański i aksjomat wyróżniania". Proponuję przestudiowanie dodatkowego rozdziału dopiero po zapoznaniu się z rozdziałami wcześniejszymi, pomimo braku precyzji w następnej definicji.

Definicja 2.1.

Niech \( \displaystyle x,y \) będą zbiorami. Iloczynem kartezjańskim (produktem) \( \displaystyle x \times y \) nazywamy zbiór

\( \displaystyle \{z\in \mathcal{P}( \mathcal{P}( x \cup y)): \exists_{a \in x} \exists_{b \in y} \;\; (a,b) =z\}. \)

Będziemy używać specjalnej notacji \( \displaystyle x^2 \) na zbiór \( \displaystyle x \times x \).

Ćwiczenie 2.2

Pokaż następujące elementarne własności iloczynu kartezjańskiego:

\( \displaystyle \begin{align*} x \times \emptyset & = \emptyset \quad \mbox{(2.1)} \\ x \times (y \cup z) & = (x \times y) \cup (x \times z) \quad \mbox{(2.2)} \\ x \times (y \cap z) & = (x \times y) \cap (x \times z) \quad \mbox{(2.3)} \\ x \times (y \setminus z) & = (x \times y) \setminus (x \times z) \quad \mbox{(2.4)} \end{align*} \)

Ćwiczenie 2.3

Produkt kartezjański \( \displaystyle \times \) jest monotoniczny ze względu na każdą współrzędną osobno, to znaczy:

\( \displaystyle \begin{align*} x \subset y & \hspace {0.1mm} \Rightarrow & (x \times z) \subset (y \times z) \quad \mbox{(2.5)} \\ x \subset y & \hspace {0.1mm} \Rightarrow & (z \times x) \subset (z \times y) \quad \mbox{(2.6)} \end{align*} \)

Ćwiczenie 2.4

Sprawdź, czy dla dowolnych zbiorów \( \displaystyle A,B,C \), prawdziwa jest następująca implikacja:

\( \displaystyle A\times B = A\times C \Rightarrow B=C \)

Relacje

Relacje



Definicja 3.1.

Relacją nazywamy każdy podzbiór iloczynu \( \displaystyle x \times y \).

Operacje na relacjach:

Definicja 3.2.

Niech \( \displaystyle R \subset A \times B \) oraz \( \displaystyle S \subset B \times C \).

\( \displaystyle S \circ R  := \{(x,z)\in A \times C : \exists_{y\in B} (x,y)\in R \hspace {0.1mm} \wedge (y,z)\in S \} \)

\( \displaystyle R^{-1} := \{(y,x)\in B \times A : \;\; (x,y)\in R \} \)
\( \displaystyle R_L := \{x\in A : \exists_{y\in B} \;\; (x,y) \in R\} \)
\( \displaystyle R_P := \{y\in B : \exists_{x\in A} \;\; (x,y) \in R\} \)

Ćwiczenie 3.3

Niech relacja \( \displaystyle R \subset A \times B, S \subset B \times C \) oraz \( \displaystyle T \subset C \times D \). Pokazać elementarne własności operacji na relacjach:

\( \displaystyle \begin{array}{rllll} T \circ ( S \circ R ) & = & (T \circ S)\circ R \quad \mbox{(3.1)} \\ (S \circ R )^{-1} & = & R^{-1} \circ S^{-1} \quad \mbox{(3.2)} \\ R & \subset & R_L \times R_P \quad \mbox{(3.3)} \\ (S \circ R)_L & \subset & R_L \quad \mbox{(3.4)} \\ (S \circ R)_P & \subset & S_P \quad \mbox{(3.5)} \\ (R^{-1} )_L & = & R_P \quad \mbox{(3.6)} \end{array} \)

Ćwiczenie 3.4

Niech relacja \( \displaystyle R \subset B \times C,\; S \subset B \times C \) oraz \( \displaystyle T \subset A \times B \). Pokaż własności:

\( \displaystyle \begin{array}{rlllll} (R \cup S )^{-1} & = & R^{-1} \cup S^{-1} \quad \mbox{(3.7)} \\ (R \cap S )^{-1} & = & R^{-1} \cap S^{-1} \quad \mbox{(3.8)} \\ (R^{-1})^{-1} & = & R \quad \mbox{(3.9)} \\ (R \cup S ) \circ T & = & (R \circ T) \cup (S \circ T) \quad \mbox{(3.10)} \\ (R \cap S ) \circ T & \subset & (R \circ T) \cap (S \circ T) \quad \mbox{(3.11)}\end{array} \)

Ćwiczenie 3.5

Podaj przykład relacji, dla których poniższa równość nie jest prawdziwa.

\( \displaystyle (R \cap S ) \circ T = (R \circ T) \cap (S \circ T). \)

Niech \( \displaystyle R=\{(1,3)\}, S= \{(2,3)\}, T=\{(0,1),(0,2)\} \), wtedy

  1. \( \displaystyle R\cap S=\emptyset \), więc \( \displaystyle (R\cap S)\circ T=\emptyset \).
  2. \( \displaystyle T\circ R =\{(0,3)\} \) i \( \displaystyle T \circ S=\{0,3\} \), a więc \( \displaystyle (R \circ T) \cap (S \circ T) =\{0,3\} \)

Ćwiczenie 3.6

Udowodnij, że zbiór \( \displaystyle A \) jest relacją wtedy i tylko wtedy, gdy

\( \displaystyle A \subset (\bigcup \bigcup A) \times (\bigcup \bigcup A). \)

Relacje równoważności

Relacje równoważności


W tym podrozdziale poznamy ważną klasę (zbiór) relacji zwaną klasą relacji równoważności(w innych podręcznikach mogą się państwo spotkać z nazwą relacja abstrakcji). Relacje takie będą służyły do definiowania pojęć abstrakcyjnych, o czym przekonamy się w wielu miejscach tego i innych wykładów. Bardzo dobrym ćwiczeniem pokazującym abstrakcyjne metody definiowania pojęć będzie wykład 8 "Konstrukcje liczbowe, liczby całkowite, wymierne, konstrukcja Cantora liczb rzeczywistych: działania i porządek", w którym zaprzęgniemy relacje abstrakcji do definiowania liczb.

Rozpoczynamy rozdział od koniecznej definicji.

Definicja 4.1.

Dla zbioru \( \displaystyle X \) definiujemy relację \( \displaystyle 1_X \subset X \times X \) jako \( \displaystyle \{ z \in X \times X : \exists_{x\in X} \;\; (x,x)=z \} \).

Definicja 4.2.

Relację \( \displaystyle R \subset X \times X \) nazywamy relacją równoważnością o polu \( \displaystyle X \), jeżeli:

  • zawiera relacje \( \displaystyle 1_X \) (zwrotność \( \displaystyle R \)),
  • \( \displaystyle R^{-1} \subset R \) (symetria \( \displaystyle R \)),
  • \( \displaystyle R \circ R \subset R \) (przechodniość \( \displaystyle R \)).

Ćwiczenie 4.3

Pokazać, że definicje zwrotności, symetryczności i przechodniości relacji o polu \( \displaystyle X \) są odpowiednio równoważne następującym własnościom:

  • \( \displaystyle \forall_{ x\in X} (x,x) \in R \),
  • \( \displaystyle \forall_{ x,y \in X} (x,y) \in R arrow (y,x) \in R \),
  • \( \displaystyle \forall_{ x,y,z\in X} (x,y)\in R \wedge (y,z) \in R arrow (x,z)\in R \).

Definicja 4.4.

Niech \( \displaystyle R \) będzie relacją równoważności o polu \( \displaystyle X \). Klasą równoważności elementu \( \displaystyle x\in X \) jest zbiór

\( \displaystyle [x]_R := \{y \in X : (x,y) \in R\}. \)

Definicja 4.5.

Zbiór klas równoważności relacji \( \displaystyle R \) będący elementem zbioru \( \displaystyle \mathcal{P} ( \mathcal{P} (X \times X)) \) oznaczamy przez \( \displaystyle X/R \).

Twierdzenie 4.6.

Niech \( \displaystyle R \) będzie relacją równoważności o polu \( \displaystyle X \). Następujące warunki są równoważne:

  1. \( \displaystyle [x]_R \cap [y]_R \neq \emptyset \),
  2. \( \displaystyle [x]_R = [y]_R \),
  3. \( \displaystyle (x,y) \in R \).

Dowód

Pokażemy, że \( \displaystyle (1)arrow (2) \). Niech wspólny element dwóch klas \( \displaystyle [x]_R \) oraz \( \displaystyle [y]_R \) nazywa się \( \displaystyle z \). Ze względu na pełną symetrię tezy wystarczy pokazać, że \( \displaystyle [x]_R \subseteq [y]_R \). Niech zatem \( \displaystyle p\in [x]_R \). Mamy więc \( \displaystyle (x,p) \in R \). Z założenia jest również \( \displaystyle (y,z) \in R \) oraz \( \displaystyle (x,z) \in R \). Z symetrii otrzymujemy \( \displaystyle (z,x) \in R \). Zatem \( \displaystyle (y,z) \in R \) i \( \displaystyle (z,x) \in R \) i \( \displaystyle (x,p) \in R \). Natychmiast z przechodniości otrzymujemy, że \( \displaystyle (y,p) \in R \).
Pokażemy, że \( \displaystyle (2)arrow (3) \). Ze zwrotności mamy, że \( \displaystyle y\in [y]_R \), co z założenia \( \displaystyle (2) \) daje \( \displaystyle y\in [x]_R \), a to tłumaczy się na \( \displaystyle (x,y) \in R \). Pokażemy, że \( \displaystyle (3)arrow (1) \). Wystarczy pokazać, że wspólnym elementem klas \( \displaystyle [x]_R \) oraz \( \displaystyle [y]_R \) jest \( \displaystyle y \). Dla pierwszej z nich wynika to z założenia \( \displaystyle (3) \), a dla drugiej ze zwrotności \( \displaystyle R \).

W następnym twierdzeniu zobaczymy, jak rodzina relacji równoważności jest odporna na przecinanie. Pokażemy mianowicie, że przecięcie dowolnej liczby relacji równoważności jest nadal relacją równoważności.

Twierdzenie 4.7.

Niech \( \displaystyle \kappa \neq \emptyset \) będzie pewną rodziną (zbiorem) relacji równoważności o tym samym polu \( \displaystyle X \). Mamy że:

  1. \( \displaystyle \bigcap \kappa \) jest relacją równoważności o polu \( \displaystyle X \),
  2. \( \displaystyle [x]_{ \bigcap \kappa } = \bigcap \{[x]_R : R\in \kappa\} \).

Dowód
\( \displaystyle (1) \) Zwrotność \( \displaystyle \bigcap \kappa \) jest oczywista, ponieważ \( \displaystyle 1_X \) zawiera się w każdej relacji rodziny \( \displaystyle \kappa \). Symetria. Weźmy \( \displaystyle (x,y)\in \bigcap \kappa \). Dla każdej relacji \( \displaystyle R\in\kappa \) jest \( \displaystyle (x,y)\in R \). Z symetrii każdej \( \displaystyle R \) jest więc \( \displaystyle (y,x)\in R \), co daje \( \displaystyle (y,x)\in \bigcap \kappa \). Przechodniość. Niech \( \displaystyle (x,y)\in \bigcap \kappa \) oraz \( \displaystyle (y,z)\in \bigcap \kappa \). Dla każdej relacji \( \displaystyle R\in\kappa \) jest więc \( \displaystyle (x,y)\in R \) i \( \displaystyle (y,z)\in R \). Z przechodniości każdej relacji \( \displaystyle R \) mamy, że \( \displaystyle (x,z) \in R \), co daje \( \displaystyle (x,z)\in \bigcap \kappa \).
\( \displaystyle (2) \) Niech \( \displaystyle y \in [x]_{ \bigcap \kappa } \). Mamy zatem, że \( \displaystyle (x,y) \in \bigcap \kappa \), co daje \( \displaystyle (x,y)\in R \) dla każdej relacji \( \displaystyle R\in\kappa \). To zaś daje, że \( \displaystyle y \in [x]_R \) dla każdej \( \displaystyle R \in \kappa \), co jest równoważne z \( \displaystyle y\in\bigcap \{[x]_R : R\in \kappa\} \).

W szczególności przecięcie wszystkich relacji równoważności o polu \( \displaystyle X \) daje \( \displaystyle 1_X \). Jest ona najsilniejszą relacją równoważności. Najsłabszą jest \( \displaystyle X^2 \).

Rozkłady zbiorów

Definicja 4.8.

Niech \( \displaystyle X \neq \emptyset \). Rodzinę \( \displaystyle r \in \mathcal{P} ( \mathcal{P} (X)) \) nazywamy rozkładem zbioru \( \displaystyle X \), gdy:

  1. \( \displaystyle \forall_{C \in r} \;\; C \neq \emptyset \),
  2. \( \displaystyle \bigcup r =X \),
  3. \( \displaystyle (C \in r \hspace {0.1mm} \wedge D \in r \hspace {0.1mm} \wedge C \neq D )\hspace {0.1mm} \Rightarrow C\cap D =\emptyset \).

Lemat 4.9.

Dla relacji równoważności \( \displaystyle R \) o polu \( \displaystyle X \) zbiór \( \displaystyle X/R \) jest rozkładem \( \displaystyle X \).

Dowód

\( \displaystyle (1) \) Każda klasa jest niepusta, bo zawiera element, który ją wyznacza. \( \displaystyle (2)\displaystyle \bigcup X/R \subseteq X \), bo każda klasa jest podzbiorem \( \displaystyle X \). Odwrotnie każdy \( \displaystyle x \in [x]_R \in X/R \). \( \displaystyle (3) \) Dwie klasy, gdy są różne, muszą być rozłączne co udowodniliśmy w twierdzeniu 4.6.

Definicja 4.10.

Niech \( \displaystyle r \) będzie rozkładem zbioru \( \displaystyle X \). Definiujemy relacje \( \displaystyle R_r \subset X \times X \) następująco:

\( \displaystyle (x,y) \in R_r \) wtw \( \displaystyle \exists_{C\in r} \;\; x \in C \; \hspace {0.1mm} \wedge \; y\in C. \)

Lemat 4.11.

Dla rozkładu \( \displaystyle r \in \mathcal{P} ( \mathcal{P} (X)) \) relacja \( \displaystyle R_r \) jest:

  1. równoważnością,
  2. \( \displaystyle X/{R_r} = r. \)

Dowód

\( \displaystyle (1) \) Relacja \( \displaystyle R_r \) jest zwrotna, każdy bowiem \( \displaystyle x\in X \) musi leżeć w pewnym zbiorze \( \displaystyle C \) rozkładu \( \displaystyle r \). Symetria \( \displaystyle R_r \) nie wymaga dowodu. Przechodniość \( \displaystyle R_r \). Niech \( \displaystyle (x,y) \in R_r \) i \( \displaystyle (y,z) \in R_r \). Istnieją zatem dwa zbiory \( \displaystyle C \) i \( \displaystyle D \) rozkładu \( \displaystyle r \) takie, że \( \displaystyle x,y \in C \) oraz \( \displaystyle y,z \in D \). Przecięcie \( \displaystyle C \) i \( \displaystyle D \) jest więc niepuste, zatem \( \displaystyle C=D \), co daje tezę \( \displaystyle (x,z) \in R_r \).
\( \displaystyle (2) \) Inkluzja w prawo \( \displaystyle \subseteq \). Niech \( \displaystyle C \in X/{R_r} \). Klasa \( \displaystyle C \) jest zatem wyznaczona przez pewien element \( \displaystyle x \) taki, że \( \displaystyle C= [x]_{R_r} \). Niech \( \displaystyle D\in r \) będzie zbiorem rozkładu \( \displaystyle r \), do którego należy \( \displaystyle x \). Łatwo wykazać, że \( \displaystyle C=D \). Inkluzja w lewo \( \displaystyle \supset \). Niech \( \displaystyle C \in r \). \( \displaystyle C \) jest niepusty, więc istnieje \( \displaystyle x \in C \). Klasa \( \displaystyle [x]_{R_r} =C \).

Ćwiczenie 4.12

Niech \( \displaystyle X \) będzie niepustym zbiorem oraz niech \( \displaystyle Y \subset X \). Zdefiniujemy relację \( \displaystyle R \subset \mathcal{P}(X) \times \mathcal{P}(X) \) następująco: dla dowolnych zbiorów \( \displaystyle A,B \subset X \) mamy

\( \displaystyle (A,B)\in R \Leftrightarrow A\frac{.}{} B \subset Y. \)

(\( \displaystyle A\frac{.}{}B \) oznacza różnicę symetryczną zbiorów, czyli \( \displaystyle A\frac{.}{} B = (A\setminus B)\cup (B \setminus A) \)). Udowodnij, że relacja \( \displaystyle R \) jest relacją równoważności.


Ćwiczenie 4.13

Udowodnij, że dla relacji równoważności \( \displaystyle R,S \) na zbiorze \( \displaystyle X \), relacja \( \displaystyle R\cup S \) jest relacją równoważności wtedy i tylko wtedy, gdy

\( \displaystyle \forall_{x\in X}( [x]_R \subset [x]_S \vee [x]_R \supset [x]_S). \quad \mbox{(4.1)} \)

Podaj przykłady relacji równoważności \( \displaystyle R,S \) takich, że \( \displaystyle R\cup S \) jest relacją równoważności oraz \( \displaystyle R ⊈ S \) i \( \displaystyle S ⊈ R \).


Domykanie relacji

W praktyce matematycznej często potrzebne jest rozważanie domknięć relacji ze względu na wiele przeróżnych własności. W podrozdziale tym dokonamy charakteryzacji domknięć. Pokażemy między innymi, kiedy takie domykanie jest możliwe.

Definicja 4.14.

Niech \( \displaystyle \alpha \) będzie rodziną relacji o polu \( \displaystyle X \), czyli niech \( \displaystyle \alpha \in \mathcal{P} ( \mathcal{P} (X^2)) \). Rodzina \( \displaystyle \alpha \) jest zamknięta na przecięcia, gdy:

  1. \( \displaystyle X^2 \in \alpha, \)
  2. jeżeli \( \displaystyle \emptyset \neq \alpha ' \subset \alpha \) to \( \displaystyle \bigcap \alpha ' \in \alpha. \)

Poniżej podamy definicję domknięcia relacji w pewnej klasie (zbiorze) relacji. Definiujemy intuicyjnie najmniejszą relację zawierającą daną należącą do klasy.

Definicja 4.15.

Relacja \( \displaystyle S \subset X^2 \) jest domknięciem relacji \( \displaystyle R \subset X^2 \) w klasie (zbiorze) relacji \( \displaystyle \alpha, \) gdy:

  1. \( \displaystyle R \subset S, \)
  2. \( \displaystyle S \in \alpha, \)
  3. dla każdej relacji \( \displaystyle T \) jeżeli \( \displaystyle R \subset T \) oraz \( \displaystyle T \in \alpha \) to \( \displaystyle S \subset T. \)

Lemat 4.16.

Domknięcie relacji (w dowolnej klasie), jeżeli istnieje, to jest jedyne.

Dowód

Gdyby istniały dwa domknięcia pewnej relacji, to ze względu na warunek \( \displaystyle (3) \) wzajemnie by się zawierały.

Twierdzenie 4.17.

Następujące warunki są równoważne:

  1. Klasa relacji \( \displaystyle \alpha \) jest domknięta na przecięcia.
  2. Każda relacja ma domknięcie w klasie relacji \( \displaystyle \alpha \).

Dowód

\( \displaystyle (1) arrow (2) \). Niech \( \displaystyle R \) będzie relacją. Utwórzmy zbiór relacji \( \displaystyle \alpha ' \) jako \( \displaystyle \{S\in\mathcal{P} (X^2) : R\subset S \hspace {0.1mm} \wedge S\in\alpha \} \). Takie \( \displaystyle \alpha ' \) nie jest puste, bowiem relacja totalna \( \displaystyle X^2 \) należy do \( \displaystyle \alpha ' \). Pokażmy, że \( \displaystyle \bigcap \alpha ' \) jest domknięciem \( \displaystyle R \) w \( \displaystyle \alpha \). Istotnie \( \displaystyle R\subset \bigcap \alpha ' \). Z założenia mamy też \( \displaystyle \bigcap \alpha ' \in \alpha \). Minimalność \( \displaystyle \bigcap \alpha ' \) stwierdzamy przez: niech \( \displaystyle R \subset S' \) takie że \( \displaystyle S' \in \alpha \). Takie \( \displaystyle S' \) musi leżeć w zbiorze \( \displaystyle \alpha ' \), jest więc \( \displaystyle \bigcap \alpha ' \subset S' \).
\( \displaystyle (2) arrow (1) \). Po pierwsze \( \displaystyle X^2 \) leży w zbiorze \( \displaystyle \alpha \), bo wystarczy domknąć \( \displaystyle X^2 \). Niech \( \displaystyle \alpha ' \) będzie niepustym podzbiorem \( \displaystyle \alpha \). Niech \( \displaystyle S_0 \) będzie domknięciem \( \displaystyle \bigcap \alpha ' \) w \( \displaystyle \alpha \). Wiemy, że dla dowolnej relacji \( \displaystyle S' \), o ile \( \displaystyle \bigcap \alpha ' \subset S' \) i \( \displaystyle S'\in \alpha \) to \( \displaystyle S_0 \subset S' \). Połóżmy za \( \displaystyle S' \) dowolny element z \( \displaystyle \alpha ' \). Założenia implikacji pozostają automatycznie spełnione, jest więc tak, że \( \displaystyle S_0 \subset S' \) dla dowolnej \( \displaystyle S' \) wyjętej z \( \displaystyle \alpha ' \). W takim razie \( \displaystyle S_0 \subset \bigcap \alpha ' \). Ponieważ mamy też \( \displaystyle \bigcap \alpha '\subset S_0 \), bo \( \displaystyle S_0 \) było domknięciem, jest więc \( \displaystyle \bigcap \alpha '= S_0 \), a to oznacza, że \( \displaystyle S_0 \in \alpha \).

Ćwiczenie 4.18

Pokazać jak wyglądają domknięcia w klasie relacji, zwrotnych, symetrycznych i przechodnich.

Pokazać, stosując twierdzenie 4.17, że nie istnieje domknięcie spójne ani antysymetryczne. (Relacja \( \displaystyle R \) jest spójna, gdy \( \displaystyle \forall x,y (x,y) \in R \hspace {0.1mm} \vee (y,x)\in R \). Relacja \( \displaystyle R \) jest antysymetryczna, gdy z faktu, że \( \displaystyle (x,y) \in R \) oraz \( \displaystyle (y,x) \in R \), da się pokazać, że \( \displaystyle x=y \)).

Ćwiczenie 4.19

Dla relacji \( \displaystyle R \) niech \( \displaystyle R^\alpha \), \( \displaystyle R^\beta \), \( \displaystyle R^\gamma \) oznaczają odpowiednio zwrotne, symetryczne, przechodnie domknięcie relacji \( \displaystyle R \). Czy prawdą jest, że:

  1. dla dowolnej relacji \( \displaystyle R \) relacja \( \displaystyle ((R^\alpha)^\beta)^\gamma \) jest relacją równoważności,
  2. dla dowolnej relacji \( \displaystyle R \) zachodzi

\( \displaystyle ((R^\alpha)^\beta)^\gamma =((R^\gamma)^\beta)^\alpha. \)

W każdym z powyższych przypadków proszę podać dowód lub kontrprzykład.

Iloczyn kartezjański i podobne konstrukcje

Iloczyn kartezjański i podobne konstrukcje


W definicji iloczynu kartezjańskiego (patrz Wykład 5: "Para uporządkowana, iloczyn kartezjański, relacje, domykanie relacji, relacja równoważności, rozkłady zbiorów" Definicja 2.1) jest pewna nieścisłość. Konstrukcja iloczynu kartezjańskiego odwołuje się do aksjomatu wyróżniania w wersji nieuprawomocnionej. Konstrukcja, którą zobaczą państwo w tym rozdziale, usuwa tę poprzednią niedogodność.

Twierdzenie 5.1.

Dla dowolnych dwóch zbiorów \( \displaystyle x \) i \( \displaystyle y \) istnieje zbiór \( \displaystyle x\times y \) zawierający wszystkie pary postaci \( \displaystyle (w,z) \), gdzie \( \displaystyle w\in x \) i \( \displaystyle z\in y \).

Dowód

Ustalmy dwa dowolne zbiory \( \displaystyle x \) i \( \displaystyle y \). Jeśli \( \displaystyle x=\emptyset \) lub \( \displaystyle y=\emptyset \), to \( \displaystyle x\times y = \emptyset \) istnieje na podstawie aksjomatu zbioru pustego. W przeciwnym przypadku \( \displaystyle x\cup y \) jest zbiorem jednoelementowym \( \displaystyle \{z\} \), to \( \displaystyle x\times y=\{\{\{z\}\}\} \) istnieje na podstawie aksjomatu pary. W dalszej części dowodu zakładamy, że zbiory \( \displaystyle x \) i \( \displaystyle y \) są niepuste i że \( \displaystyle x\cup y \) ma więcej niż jeden element. Na podstawie aksjomatu zbioru potęgowego, aksjomatu unii i aksjomatu wycinania następujące zbiory istnieją:

\( \displaystyle \begin{align*} A & =\{z\in\mathcal{P}(x)\,|\, \exists w\; z =\{w\}\}, \\ B & =\{z\in\mathcal{P}(x\cup y)\,|\, \exists w \exists v\; (w \neq v \land z=\{v,w\})\}, \\ C & =\{z\in\mathcal{P}(\mathcal{P}(y))\,|\, \exists v\; z=\{\{v\}\}=(v,v)\}. \end{align*} \)

Nasze założenia gwarantują, że żaden z powyższych zbiorów nie jest pusty. Kontynuując, możemy stworzyć:

\( \displaystyle \begin{align*} D_0 & =\{z\in\mathcal{P}(A\cup B)\,|\, \exists w \exists v\; w\neq v \land z=\{\{w\},\{w,v\}\}=(w,v)\}, \end{align*} \)

w którym to zbiorze mamy pewność, że \( \displaystyle w \) jest elementem \( \displaystyle x \). Kontynuujemy, definiując:

\( \displaystyle \begin{align*} D_0' & =\{z\in\mathcal{P}(D_0\cup C)\,|\, \exists w \exists v\; w\neq v \land z=\{(w,v),(v,v)\}\}, \end{align*} \)

gdzie mamy pewność, że \( \displaystyle w \) jest elementem \( \displaystyle x \), a \( \displaystyle v \) elementem \( \displaystyle y \) oraz:

\( \displaystyle \begin{align*} D_0'' & =\{z\in\mathcal{P}(D_0\cup C)\,|\, \exists w \exists v\; w\neq v \land z=\{(w,v),(w,w )\}\}, \end{align*} \)

gdzie mamy pewność, że \( \displaystyle w\in A\cap B \). Kończąc:

\( \displaystyle \begin{align*} x\times y & =\{z\in\bigcup D_0' \,|\, \exists w \exists v\; w\neq v \land z=(w,v)\}\cup \{z\in\bigcup D_0'' \,|\, \exists w\; z=(w,w)\}. \end{align*} \)

Twierdzenie 5.2.

Jeśli \( \displaystyle x,y \) i \( \displaystyle z \) są zbiorami i \( \displaystyle z\subseteq x\times y \), to zbiorem jest również ogół \( \displaystyle v \) takich, że istnieje \( \displaystyle w \) spełniające \( \displaystyle (v,w)\in z \). Zbiór takich \( \displaystyle v \) oznaczamy przez \( \displaystyle \pi_1(z) \) i nazywamy projekcją na pierwszą współrzędną.

Dowód

Zbiór \( \displaystyle \pi_1(z) \) istnieje na podstawie aksjomatów ZF i jest równy:

\( \displaystyle \pi_1(z) = \bigcup\{w\in\bigcup z\,|\, \exists u\; w=\{u\}\}. \)

W tej chwili jesteśmy gotowi dowieść własność zapowiedzianą w Wykładzie 4 (patrz Wykład 4: "Teoria mnogości ZFC. Operacje na zbiorach"). Dla dowolnej formuły \( \displaystyle \varphi' \) nieposiadającej zmiennych wolnych innych niż \( \displaystyle z' \) i \( \displaystyle x_1' \), następująca formuła jest prawdą:

\( \displaystyle \forall x_1' \forall x' \exists y' \forall z'\; z'\in y' \iff (z'\in x' \land \varphi'). \)

Aby dowieść tę własność, ustalmy dowolną formułę \( \displaystyle \varphi' \) i dowolny zbiór \( \displaystyle x_1' \). Stosujemy aksjomat wyróżniania do \( \displaystyle x=x\times \{x_1'\} \) (który istnieje na mocy Twierdzenia 5.1 i do formuły

\( \displaystyle \exists z' \exists x_1'\; z=(z',x_1')\land\varphi', \)

otrzymując zbiór \( \displaystyle y \). Wymagany zbiór \( \displaystyle y' \) istnieje na mocy Twierdzenia 5.2 i jest równy \( \displaystyle \pi_1(y) \).

Przykładem zastosowania powyższego twierdzenia może być otrzymanie drugiej projekcji z iloczynu kartezjańskiego. Aby otrzymać \( \displaystyle \pi_2(z) \), stosujemy powyższe twierdzenie do \( \displaystyle x_1'=z \), \( \displaystyle x=\bigcup\bigcup{z} \) i wyrażenia \( \displaystyle \varphi' \) mówiącego \( \displaystyle \exists w\; (w,z')\in x_1' \).

Funkcje, tw. o faktoryzacji, produkt uogólniony, obrazy i przeciwobrazy, tw. Knastera-Tarskiego i lemat Banacha

Wprowadzenie



W poniższym wykładzie wprowadzamy formalnie pojęcie funkcji. Bardzo duży fragment współczesnej matematyki dotyczy właśnie badania własności funkcji. W teorii zbiorów funkcje są relacjami, które spełniają dodatkowy warunek jednoznaczności. Każda funkcja jest więc zbiorem par. W teorii zbiorów, której pojęciem pierwotnym jest należenie do zbioru, reprezentowanie funkcji za pomocą zbiorów jest pewną koniecznością. W praktyce jednak patrzymy na funkcje raczej jako na operacje, działające na elementach pewnych zbiorów. Często do opisu funkcji używamy wzorów, np. \( f(a)=a^2 \). Warto jednak podkreślić różnicę pomiędzy wzorem a funkcją. Przykładowy wzór może opisywać wiele funkcji, w zależności od tego, z jakiego zbioru elementy będziemy podstawiać w miejsce \( a \), a nawet od tego, jak będziemy rozumieć podnoszenie do kwadratu (np. przez \( a^2 \) oznaczaliśmy iloczyn kartezjański \( a\times a \), ale równocześnie dla liczby naturalnej \( n \) przez \( n^2 \) będziemy oznaczać jej kwadrat). W kolejnych wykładach przekonamy się również, że istnieją funkcje, których nie da się opisać żadnym wzorem.

Warto wspomnieć, że rozważa się również teorie, w których pierwotnymi pojęciami są właśnie funkcje i składanie funkcji. Okazuje się, że bardzo wiele twierdzeń klasycznej matematyki (opartej na teorii zbiorów) da się udowodnić na ich gruncie. Takiemu właśnie podejściu poświęcony jest wykład Teoria kategorii dla informatyków.

Funkcja jako relacja

Funkcja jako relacja


W poprzednim wykładzie wyróżniliśmy pewną grupę relacji (relacje zwrotne, symetryczne i przechodnie), które to relacje nazwaliśmy relacjami równoważności. Podobnie teraz wyróżnimy pewne relacje, które nazwiemy funkcjami. Podkreślmy jeszcze raz, że funkcja jako relacja jest zbiorem, którego elementami są pary.

Definicja 2.1.

Relację \( f\subset X \times Y \) nazywamy funkcją ze zbioru \( X \) w zbiór \( Y \), jeśli ma następujące własności:

1. \( \forall_{x\in X} \forall_{y\in Y}\forall_{z\in Y}((x,y)\in f \wedge (x,z)\in f) \Rightarrow (y=z). \quad \mbox{(2.1)} \)

2. \( f_L = X. \)

Zbiór wszystkich funkcji ze zbioru \( X \) w zbiór \( Y \) będziemy oznaczać przez \( Y^X \).

Czyli funkcja to relacja taka, że do każdego elementu \( x \) ze zbioru \( X \) można dobrać dokładnie jeden element \( y\in Y \) taki, że \( (x,y)\in f \). Pierwsza własność mówi dokładnie tyle, że jeśli do jakiegoś elementu \( x \) możemy dobrać elementy \( y \) i \( z \) takie, aby obydwa były w relacji z \( x \), to muszą one być sobie równe, a więc do każdego elementu zbioru \( X \) można dobrać co najwyżej jeden element będący z nim w relacji \( f \). Druga własność mówi, że do każdego elementu ze zbioru \( X \) da się dobrać przynjamniej jeden element będący z nim w relacji \( f \). Często będziemy używać skrótowego zapisu \( f:X \rightarrow Y \), który będzie oznaczał, że \( f \) jest funkcją ze zbioru \( X \) w zbiór \( Y \) (a więc \( f_L=X \) i \( f_P\subset Y \)). Mówimy też, że funkcja \( f \) odwzorowuje zbiór \( X \) w zbiór \( Y \).

W definicji funkcji konieczne było odwołanie się do zbioru, na którym funkcja jest określona. Zwróćmy uwagę, że dla konkretnej relacji nie możemy powiedzieć, czy jest ona funkcją, czy nie, gdyż zależy to od tego, jaki zbiór przyjmiemy za \( X \). Na przykład relacja \( r=\{(0,0), (1,1)\} \) jest funkcją ze zbioru \( \{0,1\} \) w zbiór \( \{0,1\} \), ale nie jest funkcją ze zbioru \( N \) w zbiór \( \{0,1\} \). Czasem wygodniej jest rozważać funkcje po prostu jako relacje, dlatego wprowadzamy pojęcie funkcji częściowej.

Definicja 2.2.

Relację \( f \) nazywamy funkcją częściową, jeśli ma następującą własność:

\( \forall_{x} \forall_{y}\forall_{z}((x,y)\in f \wedge (x,z)\in f) \Rightarrow (y=z). \quad \mbox{(2.1)} \)

Zwróćmy uwagę, że równie dobrze powyższą własność moglibyśmy sformułować następująco:

\( \forall_{x\in f_L} \forall_{y\in f_P}\forall_{z \in f_P}((x,y)\in f \wedge (x,z)\in f) \Rightarrow (y=z). \)

Sformułowanie to jest równoważne z (patrz definicja 2.2.), gdyż we wszysktich przypadkach, w których poprzednik implikacji jest prawdziwy, mamy \( x\in f_L, y\in f_P, z \in f_P \).

Fakt 2.1.

Każda funkcja częściowa \( f \) jest funkcją ze zbioru \( f_L \) w zbiór \( f_P \). Dla dowolnych zbiorów \( X,Y \) każda relacja, która jest funkcją ze zbioru \( X \) w zbiór \( Y \), jest funkcją częściową.

Wobec powyższego faktu, w przypadkach, kiedy nie jest istotne, na jakim zbiorze funkcja jest zdefiniowana, będziemy rozważać odpowiadającą jej funkcję częściową. Dla dowolnej funkcji częściowej \( f \) wprowadzamy poniższe oznaczenia, których będziemy również używać dla funkcji. Dla dowolnego \( x \), jeśli istnieje taki element \( y \), dla którego \( (x,y)\in f \), to oznaczamy go przez \( f(x) \), podobnie fakt \( (x,y) \in f \) notujemy jako \( f(x)=y \). Mówimy wtedy, że funkcja częściowa \( f \) przyporządkowuje elementowi \( x \) element \( y \). Elementy \( f_L \) nazywamy argumentami funkcji częściowej \( f \), a elementy \( f_P \) wartościami funkcji częściowej \( f \).

Przykład 2.3.

Poniżej przedstawiamy przykłady relacji, które są funkcjami częściowymi:

1. \( \emptyset \) (poprzednik implikacji (patrz definicja 2.2.), jest zawsze fałszywy więc implikacja (patrz definicja 2.2.), jest zawsze prawdziwa),
2. \( \{ (\emptyset,\emptyset) \} \),
3. \( \{ (0,0), (1,0),(2,1)\} \),
4. \( X \times \{0\} \) dla dowolnego zbioru \( X \),
5. \( \mathbb{I}_{X} \)

oraz relacje, które funkcjami częściowymi nie są:

1. \( \{(0,0), (0,1)\} \),
2. \( X\times \{0,1\} \), dla dowolnego niepustego zbioru \( X \).

Ćwiczenie 2.1

1. Udowodnij, że złożenie funkcji częściowych jest funkcją częściową.
2. Udowodnij, że jeśli \( f:X \rightarrow Y \) i \( g:Y \rightarrow Z \), to relacja \( g\circ f \) jest

funkcją ze zbioru \( X \) w zbiór \( Z \).


Ćwiczenie 2.2

Czy na każdym zbiorze \( X \) istnieje relacja równoważności, która jest funkcją z \( X \) w \( X \)?

Obrazy i przeciwobrazy

Obrazy i przeciwobrazy


Czasem warto spojrzeć na funkcję z szerszej perspektywy. Rozważmy pewną funkcję \( f:X \rightarrow
Y \). Funkcja ta w naturalny sposób wyznacza pewną funkcję przekształcającą podzbiory zbioru \( X \) w podzbiory zbioru \( Y \), przyporządkowując zbiorowi \( A\subset X \), zbiór elementów zbioru \( Y \), które są wartościami funkcji \( f \) dla pewnych argumentów ze zbioru \( A \). Funkcję tą formalnie definujemy w poniższy sposób.

Definicja 3.1.

Każda funkcja \( f:X \rightarrow Y \) wyznacza pewną funkcję \( \vec{f} : \mathcal{P}(X) \rightarrow \mathcal{P}(Y) \) tak, że dla dowolnego zbioru \( A\subset X \)

\( \vec{f}(A)= \{y\in Y: \exists_{x\in A} f(x)=y\}. \)

Dla dowolnego zbioru \( A\subset X \) zbiór \( \vec{f}(A) \) nazywamy obrazem zbioru \( A \) przez funkcję \( f \).

Przykład 3.2.

Niech \( f:N \rightarrow N \) będzie określona wzorem \( f(x)=2\cdot x \). Wtedy

1. \( \vec{f}(N) \) jest zbiorem liczb parzystych,
2. \( \vec{f} (\emptyset)= \emptyset \),
3. \( \vec{f} (\{1\})= \{2\} \),
4. \( \vec{f} (\{1,2\})= \{2,4\} \),
5. obrazem zbioru liczb parzystych przez funkcję \( f \) jest zbiór liczb podzielnych przez 4.

W podobny sposób definiujemy przeciwobrazy zbiorów przez funkcję. Przeciwobrazem zbioru \( B \subset Y \) przez funkcję \( f:X \rightarrow Y \) nazwiemy zbiór tych elementów zbioru \( X \), którym funkcja przypisuje wartości ze zbioru \( B \).

Definicja 3.3.

Każda funkcja \( f:X \rightarrow Y \) wyznacza pewną funkcję \( \vec{f}^{-1} : \mathcal{P}(Y) \rightarrow \mathcal{P}(X) \) w następujący sposób. Dla dowolnego zbioru \( B\subset Y \)

\( \vec{f}^{-1}(B)= \{x\in X: \exists_{y\in B} f(x)=y\}. \)

Dla dowolnego zbioru \( B\subset Y \) zbiór \( \vec{f}^{-1}(B) \) nazywamy przeciwobrazem zbioru \( B \) przez funkcję \( f \).

Przykład 3.4.

Niech \( f:N \rightarrow N \) będzie określona wzorem \( f(x)=2\cdot x \). Wtedy

1. \( \vec{f}^{-1}(N)=N \),
2. \( \vec{f}^{-1} (\emptyset)= \emptyset \),
3. \( \vec{f}^{-1} (\{1\})= \emptyset \),
4. \( \vec{f}^{-1} (\{1,2\})= \{1\} \),
5. przeciwobrazem zbioru liczb nieparzystych przez funkcję \( f \) jest zbiór pusty,
6. przeciwobrazem zbioru liczb podzielnych przez 4, przez funkcję \( f \) jest zbiór liczb parzystych,
7. przeciwobrazem zbioru liczb parzystych przez funkcję \( f \) jest \( N \).

Fakt 3.1.

Nietrudno zauważyć, że dla dowolnej funkcji częściowej \( f \)

\( \vec{f}(\emptyset)=\emptyset=\vec{f}^{-1}(\emptyset). \)

W poniższych ćwiczeniach badamy podstawowe własności obrazów i przeciwobrazów dowolnych funkcji.

Ćwiczenie 3.1

Dla dowolnej funkcji \( f:X \rightarrow Y \) i dla dowolnych zbiorów \( A_1,A_2 \subset X \) udowodnij następujące fakty:

1. \( \vec{f}(A_1 \cup A_2)= \vec{f}(A_1) \cup \vec{f}(A_2) \),
2. \( \vec{f}(A_1 \cap A_2) \subset \vec{f}(A_1) \cap \vec{f}(A_2) \),
3. \( \vec{f}(X \setminus A_1) \supset \vec{f}(X) \setminus \vec{f}(A_1) \).



Ćwiczenie 3.2

Dla dowolnej funkcji \( f:X \rightarrow Y \) i dowolnej rodziny \( \kappa \) podzbiorów \( X \) (czyli \( \kappa \in \mathcal{P}(\mathcal{P}(X)) \)) udowodnij następujące fakty:

1. \( \vec{f}(\bigcup \kappa)= \bigcup\{\vec{f}(A): A\in \kappa\} \),
2. \( \vec{f}(\bigcap \kappa) \subset \bigcap\{\vec{f}(A): A\in \kappa\} \).


Ćwiczenie 3.3

Skonstruuj kontrprzykłady dla poniższych inkluzji:

1. \( \vec{f}(A_1 \cap A_2) \supset \vec{f}(A_1) \cap \vec{f}(A_2) \),
2. \( \vec{f}(X \setminus A_1) \subset \vec{f}(X) \setminus \vec{f}(A_1) \),
3. \( \vec{f}(\bigcap \kappa) \supset \bigcap\{\vec{f}(A): A\in \kappa\} \).

Znacznie bardziej regularnie zachowują się przeciwobrazy funkcji. Podstawowe własności są tematem następnych ćwiczeń.

Ćwiczenie 3.4

Dla dowolnej funkcji \( f:X \rightarrow Y \) i dla dowolnych zbiorów \( B_1,B_2 \subset Y \) udowodnij następujące fakty:

1. \( \vec{f}^{-1}(B_1 \cup B_2)= \vec{f}^{-1}(B_1) \cup \vec{f}^{-1}(B_2) \),
2. \( \vec{f}^{-1}(B_1 \cap B_2) = \vec{f}(B_1) \cap \vec{f}(B_2) \),
3. \( \vec{f}^{-1}(Y \setminus B_1) = \vec{f}^{-1}(Y) \setminus \vec{f}^{-1}(B_1) \).



Ćwiczenie 3.5
Dla dowolnej funkcji \( f:X \rightarrow Y \) i dowolnej rodziny \( \kappa \) podzbiorów \( Y \) (czyli \( \kappa \in \mathcal{P}(\mathcal{P}(Y)) \)) udowodnij następujące fakty:

1. \( \vec{f}^{-1}(\bigcup \kappa)= \bigcup\{\vec{f}^{-1}(B): B\in \kappa\} \),
2. \( \vec{f}^{-1}(\bigcap \kappa) \subset \bigcap\{\vec{f}^{-1}(B): B\in \kappa\} \).


Istnieje ścisły związek pomiędzy funkcjami a relacjami równoważności. Każda funkcja wyznacza pewną relację binarną w poniższy sposób.

Definicja 3.5.

Dla dowolnej funkcji \( f:X \rightarrow Y \) definujemy relację binarną \( \sim_{f} \subset X^2 \) następująco:

\( (x_1,x_2) \in \sim_{f} \Leftrightarrow f(x_1)=f(x_2). \)

W myśl powyższej definicji elementy \( x_1,x_2 \in X \) są w relacji \( \sim_{f} \), jeśli funkcja \( f \) na tych elementach przyjmuje te same wartości. W poniższym ćwiczeniu dowodzimy, że relacja ta jest relacją równoważności na zbiorze \( X \). Relacja ta pełni ważną rolę w podstawowych konstrukcjach liczb, które będą tematem wykłady "Konstrukcje liczbowe, liczby całkowite, wymierne, konstrukcja Cantora liczb rzeczywistych".

Ćwiczenie 3.6

Udowodnij, że dla dowolnej funkcji \( f:X \rightarrow Y \) relacja \( \sim_{f} \) jest relacją równoważności na zbiorze \( X \).

Iniekcja i suriekcja

Iniekcja i suriekcja


Istotną własnością funkcji jest to, czy różnym elementom może ona przypisać tę samą wartość. Na przykład, w przypadku szyfrowania używamy takich funkcji, które dają się odszyfrować, a więc generują różne kody dla różnych wiadomości. Takie funkcje, których wartości są różne na różnych argumentach nazywamy iniekcjami. Ponieważ ta własność nie zależy od zbioru, na którym funkcja jest zdefiniowana, zdefiniujemy ją dla wszystkich funkcji częściowych.

Definicja 4.1.

Funkcję częściową \( f \) nazywamy iniekcją, jeśli różnym elementom przyporządkowuje różne wartości. Formalnie, jeśli spełnia następujący warunek:

\( \forall_{y \in f_P} \forall_{x_1,x_2 \in f_L} (f(x_1)=y \wedge f(x_2)=y) \Rightarrow x_1=x_2 \)

Powyższy warunek mówi dokładnie tyle, że jeśli elementom \( x_1,x_2 \) funkcja przypisuje tę samą wartość \( y \), to te elementy muszą być równe.

Przykład 4.2.

Następujące funkcje częściowe są iniekcjami:

1. \( \emptyset \),
2. \( \{(\emptyset,\emptyset)\} \),
3. \( \{ (0,1),(1,0)\} \),
4. funkcja, która każdej liczbie naturalnej przypisuje liczbę dwukrotnie większą.

Przykłady funkcji częściowych, które nie są iniekcjami:

1. \( \{ (\emptyset, \emptyset), (\{\emptyset\}, \emptyset)\} \),
2. \( \{ (0, 0), (1,0)\} \),
3. funkcja, która każdej liczbie naturalnej przypisuje największą

liczbę parzystą nie większą od niej.

W poniższym ćwiczeniu pokazujemy, że jeśli funkcja częściowa nie "zlepia" ze sobą dwóch różnych argumentów, to jest "odwracalna".

Ćwiczenie 4.1.

Udowodnij, że funkcja częściowa \( f \) jest iniekcją wtedy i tylko wtedy, gdy \( f^{-1} \) jest funkcją częściową.

Ćwiczenie 4.2.

Udowodnij, że funkcja \( f:X \rightarrow Y \) jest iniekcją wtedy i tylko wtedy, gdy istnieje funkcja częściowa \( g \) taka, że \( g \circ f=\mathbb{I}_{X} \).

Ćwiczenie 4.3

Czy funkcja częściowa stała może być iniekcją? (funkcja częściowa jest stała, jeśli ma jednoelementowy zbiór wartości).

Przypuśćmy, że \( f \) nie jest suriekcją na \( Y \), istnieje wtedy \( y\in Y \), dla którego \( \vec{f}^{-1}(\{y\}) = \emptyset \). Wobec tego dla dowolnego \( B\subset Y\setminus \{y\} \) mamy

\( \vec{f}^{-1}(B)= \vec{f}^{-1}(B) \cup \vec{f}^{-1}(\{y\})= \vec{f}^{-1}(B \cup \{y\}), \)

a więc funkcja \( \vec{f}^{-1} \) nie jest iniekcją.

Przypuśćmy teraz, że \( f \) jest suriekcją na \( Y \). Weźmy dwa różne zbiory \( A,B \subset Y \). Skoro są różne, to istnieje element \( y_1\in A \setminus B \) lub \( y_2 \in B \setminus A \). Zajmiemy się pierwszym przypadkiem, drugi jest symetryczny. Skoro \( y_1\notin B \), to \( \vec{f}^{-1}(\{y_1\}) \cap \vec{f}^{-1}(B) = \emptyset \). Ponieważ, \( f \) jest suriekcją, to \( \vec{f}^{-1}(\{y_1\}) \neq \emptyset \), więc istnieje element \( x\in \vec{f}^{-1}(\{y_1\}) \). Mamy więc element \( x \) taki, że \( x\in \vec{f}^{-1}(\{y_1\}) \subset \vec{f}^{-1}(A) \) oraz \( x\notin \vec{f}^{-1}(B) \), więc zbiory \( \vec{f}^{-1}(A) \) i \( \vec{f}^{-1}(B) \) są różne. Wobec tego funkcja \( \vec{f}^{-1} \) jest iniekcją.

Ćwiczenie 4.5

Udowodnij, że dla dowolnej funkcji \( f:X \rightarrow Y \), \( f \) jest iniekcją wtedy i tylko wtedy, gdy funkcja \( \vec{f}^{-1} \) jest suriekcją na \( \mathcal{P}(X) \).

Funkcję nazywamy bijekcją pomiędzy zbiorami \( X \) i \( Y \), jeśli każdemu elementowi zbioru \( X \) przypisuje dokładnie jeden element zbioru \( Y \), i w dodatku każdy element zbioru \( Y \) występuje w jakimś przypisaniu. Oznacza to dokładnie, że funkcja ta jest zarówno iniekcją jak i suriekcją na zbiór \( Y \).

Definicja 4.5.

Funkcję częściową \( f \) nazywamy bijekcją ze zbioru \( X \) w zbiór \( Y \), jeśli są spełnione poniższe warunki:

1. \( f:X \rightarrow Y \),
2. \( f \) jest iniekcją,
3. \( f \) jest suriekcją na \( Y \).

Każda funkcja bijektywna pomiędzy zbiorem \( X \) a \( Y \) dobiera elementy tych zbiorów w pary.

Twierdzenie 4.6.

Funkcja \( f \) jest bijekcją ze zbioru \( X \) w zbiór \( Y \) wtedy i tylko wtedy, gdy \( f^{-1} \) jest bijekcją (a więc także funkcją) ze zbioru \( Y \) w zbiór \( X \).

Dowód

Z ćwiczenia 4 wynika, że relacja \( f^{-1} \) jest iniekcją (bo \( f \) jest iniekcją). Z własności przeciwobrazów wynika, że \( \vec{f}^{-1}(Y)=X \). Pozostaje pokazać, że funkcja częściowa \( f^{-1} \) jest określona na całym \( Y \). Weźmy dowolny element \( y\in Y \). Ponieważ \( f \) jest suriekcją, to istnieje \( x\in X \), dla którego \( (x,y)\in f \). Wtedy \( (y,x)\in f^{y} \), a więc \( y \) należy do dziedziny \( f^{-1} \). Wobec dowolności wyboru \( y \) dziedziną \( f^{-1} \) jest cały zbiór \( Y \). Podsumowując, \( f^{-1}:Y \rightarrow Y \) jest iniekcją oraz \( \vec{f}^{-1}(Y)=X \), a więc \( f^{-1} \) jest bijekcją ze zbioru \( Y \) w zbiór \( X \). Implikacja w drugą stronę wynika z faktu, że \( f=(f^{-1})^{-1} \).

Twierdzenie 4.7.

Jeśli funkcje częściowe \( f,g \) są iniekcjami, to ich złożenie jest iniekcją.

Dowód

Jeśli funkcja częściowa \( g\circ f \) jest pusta to jest iniekcją. W przeciwnym razie weźmy dwie dowolne (niekoniecznie różne) pary należące do niej, które mają taką samą drugą współrzędną \( (x_1,y), (x_2,y) \in g\circ f \). Skoro należą one do złożenia \( f \) z \( g \), to istnieją elementy \( z_1,z_2 \) w dziedzinie relacji \( f \) takie, że \( (x_1,z_1), (x_2,z_2) \in f \) oraz \( (z_1,y), (z_2,y) \in g \). Z iniektywności funkcji częściowej \( g \) otrzymujemy, że \( z_1=z_2 \), oznaczmy ten element przez \( z \). Mamy więc \( (x_1,z), (x_2,z) \in f \). Z iniektywności funkcji częściowej \( f \) dostajemy \( x_1=x_2 \), co dowodzi, że funkcja częściowa \( g \circ f \) jest iniekcją.

Ćwiczenie 4.6

Udowodnij że w twierdzeniu 4.7. (patrz twierdzenie 4.7.) implikacja w przeciwną stronę nie jest prawdziwa.

Twierdzenie 4.8.

Dla dowolnych funkcji \( f:X \rightarrow Y ,g:Y \rightarrow Z \), jeśli \( f \) jest suriekcją na \( Y \) i \( g \) jest suriekcją na \( Z \), to \( g\circ f \) jest suriekcją na \( Z \).

Dowód

Weźmy dowolny \( z \in Z \). Ponieważ funkcja \( g \) jest suriekcją na \( Z \), to istnieje element \( y\in Y \) taki, że \( (y,z) \in g \). Skoro funkcja \( f \) jest suriekcją na \( Y \), to istnieje \( x\in X \) taki, że \( (x,y) \in f \). Z faktów \( (x,y) \in f \) oraz \( (y,z) \in g \) otrzymujemy \( (x,z) \in g \circ f \). Dobraliśmy więc do \( z \) element \( x\in X \), z którym jest on w relacji \( g \circ f \). Wobec dowolności wyboru \( z \) funkcja \( g \circ f \) jest suriekcją.

Ćwiczenie 4.7

Udowodnij, że w twierdzeniu 4.8. implikacja w przeciwną stronę nie jest prawdziwa.

Ćwiczenie 4.8

W ćwiczeniu 3 pokazaliśmy, że poniższe równości nie są prawdziwe dla wszystkich funkcji. Udowodnij, że:

1.dla funkcji \( f:X \rightarrow Y \) równość \( \vec{f}(A_1 \cap A_2) = \vec{f}(A_1) \cap \vec{f}(A_2) \) jest prawdą dla dowolnych zbiorów \( A_1,A_2 \) wtedy i tylko wtedy, gdy \( f \) jest iniekcją,
2. dla funkcji \( f:X \rightarrow Y \) równość \( \vec{f}(X \setminus A_1) = \vec{f}(X) \setminus \vec{f}(A_1) \) jest prawdą dla dowolnego zbioru \( A_1 \) wtedy i tylko wtedy, gdy \( f \) jest iniekcją,
3. dla funkcji \( f:X \rightarrow Y \) równość \( \vec{f}(X \setminus A_1) = Y \setminus \vec{f}(A_1) \) jest prawdą dla dowolnego zbioru \( A_1 \) wtedy i tylko wtedy, gdy \( f \) jest bijekcją.



Ćwiczenie 4.9

Udowodnij, że funkcja \( f:N^2 \rightarrow N \) określona w następujący sposób

\( f(x,y)= \frac{(x+y+1)\cdot(x+y)}{2}+x \)

jest iniekcją.

Twierdzenie o faktoryzacji

Twierdzenie o faktoryzacji



W tym rozdziale udowodnimy ważne twierdzenie dobrze ilustrujące rolę, którą spełniają iniekcje i suriekcje wśród wszystkich funkcji.

Twierdzenie 5.1.

Dla każdej funkcji \( f:X \rightarrow Y \) istnieje zbiór \( Z \) oraz funkcje \( g:X \rightarrow Z ,h:Z \rightarrow Y \) takie, że \( f= h \circ g \), \( g \) jest suriekcją i \( h \) jest iniekcją.

Dowód

Niech \( Z \) będzie zbiorem klas abstrakcji relacji \( \sim_{f} \). Wtedy definujemy \( g \) jako funkcję, która każdemu elementowi zbioru \( x \) przypisuje jego klasę abstrakcji względem relacji \( \sim_{f} \), czyli

\( g= \{(x,k)\in X\times \mathcal{P}(X):x\in X \wedge k=[x]_{\sim_{f}} \}. \)

Zauważmy, że tak zdefiniowana funkcja \( g \) jest suriekcją na zbiór \( Z \), gdyż klasy abstrakcji nie mogą być puste. Funkcję \( h \) defniujemy jako funkcję przypisującą klasom abstrakcji relacji \( \sim_{f} \) wartość funkcji na dowolnym elemencie tej klasy, czyli

\( h= \{(k,y)\in \mathcal{P}(X)\times Y: \exists_{x\in X} k=[x]_{\sim_{f}} \wedge f(x)=y\}. \)

Zauważmy, że \( h \) rzeczywiście jest funkcją, gdyż, zgodnie z definicją relacji \( \sim_{f} \), funkcja \( f \) przypisuje wszystkim elementom danej klasy te same wartości.

Pokażemy teraz, że \( h \) jest iniekcją. Weźmy dowolne dwie klasy \( k_1,k_2 \in Z \) i przypuśćmy, że \( h(k_1)=h(k_2) \). Niech \( x_1,x_2 \in X \) będą takimi elementami, że \( [x_1]_{\sim_{f}}=k_1 \) oraz \( [x_2]_{\sim_{f}}=k_2 \). Zgodnie z definicją \( h \) mamy \( h(k_1)= f(x_1) \) oraz \( h(k_2)=f(x_2) \). Założyliśmy, że \( h(k_1)=h(k_2) \), więc również \( f(x_1)=f(x_2) \). Wynika stąd, że \( x_1 \sim_{f} x_2 \), a więc \( [x_1]_{\sim_{f}}=[x_2]_{\sim_{f}} \), co oznacza dokładnie, że \( k_1 = k_2 \). Pokazaliśmy więc, że \( h \) jest iniekcją.

Pozostaje pokazać, że \( f= h \circ g \). Dla dowolnego elementu \( x\in X \) mamy

\( g(x)=[x]_{\sim_{f}} \)

oraz

\( h([x]_{\sim_{f}})= f(x). \)

Wobec czego otrzymujemy \( h(g(x))=f(x). \)

Skoro własność ta zachodzi dla każdego \( x\in X \), otrzymujemy \( f= h\circ g \).

Ćwiczenie 5.1

Dla poniższych funkcji podaj przykład funkcji \( g,h \) oraz zbioru \( Z \) z twierdzenia 5.1 o faktoryzacji (patrz twierdzenie 5.1.)

1. Niech \( K \) będzie zbiorem okręgów na płaszczyźnie, funkcja \( f:K \rightarrow R \) niech przypisuje okręgom długości ich średnic,

2. \( f:N^2 \rightarrow R \) w taki sposób, że \( f(x,y)=\frac{x}{y} \).

Produkt uogólniony

Produkt uogólniony



W wykładzie "Para uporządkowana, iloczyn kartezjański, relacje, domykanie relacji, relacja równoważności, rozkłady zbiorów" zdefiniowaliśmy iloczyn kartezjański skończonej liczby zbiorów. Poniższa definicja uogólnia tamte rozważania, definiując produkt dowolnej (nawet nieskończonej) rodziny zbiorów.

Definicja 6.1.

Produktem uogólnionym zbioru \( X \) nazwiemy zbiór \( \mathbb{P} X \) zdefiniowany następująco:

\( \mathbb{P} X \stackrel{\textrm{def}}{\equiv} \{f \in \mathcal{P}(X \times \bigcup X): (f:X arrow \bigcup X) \wedge\forall_{x\in X} f(x) \in x\}. \)

Czyli zbiór \( \mathbb{P} X \) to zbiór wszystkich tych funkcji, które zbiorom z rodziny \( X \) przypisują ich elementy.

Zauważmy, że istnienie produktu uogólnionego dla każdego zbioru \( X \) wynika z aksjomatu wyróżniania. Znacznie ważniejszą własnością jednak jest niepustość produktu uogólnionego. Z aksjomatu wyboru w "Teoria mnogości ZFC. Operacje na zbiorach" wynika, że produkt uogólniony dowolnej niepustej rodziny niepustych zbiorów jest zawsze niepusty. W konkretnych przypadkach można wykazać niepustość, nie odwołując się do aksjomatu wyboru (np. \( \{\{0\}\} \)).

W poniższym twierdzeniu pokazujemy, że produkt uogólniony jest w dużej mierze zgodny ze zdefiniowanym wcześniej iloczynem kartezjańskim. Jest to przy okazji pierwszy przykład konstrukcji funkcji bijektywnej, która pozwala "tłumaczyć" elementy jednego zbioru na drugi, co z kolei usprawiedliwia wymienne posługiwanie się nimi.

Twierdzenie 6.2.

Dla dowolnych różnych zbiorów \( A, B \) istnieje bijekcja pomiędzy zbiorami \( \mathbb{P} \{A,B\} \) a zbiorem \( A\times B \).

Dowód

Jeśli któryś ze zbiorów \( A, B \) jest pusty, to \( \mathbb{P} \{A,B\} = A\times B= \emptyset \), a więc istnieje pomiędzy nimi bijekcja (ćwiczenie: jaka?). Poniżej rozważamy przypadek, gdy oba zbiory są niepuste.

Zdefiniujemy funkcję \( F: \mathbb{P} \{A,B\} arrow A\times B \). Dla dowolnej funkcji \( h\in \mathbb{P} \{A,B\} \) niech \( F(h)=(h(A),h(B)) \). Zauważmy najpierw, że para \( (h(A),h(B)) \) jest rzeczywiście elementem zbioru \( A\times B \), ponieważ z definicji zbioru \( \mathbb{P} \{A,B\} \) mamy \( h(A)\in A \) oraz \( h(B) \in B \).

Pokażemy, że funkcja \( F \) jest iniekcją. Weźmy dowolne funkcje \( g,h \in \mathbb{P} \{A,B\} \), dla których \( F(g)=F(h) \). Z definicji funkcji \( F \) otrzymujemy \( (g(A),g(B))= (h(A),h(B)) \), a to jest spełnione tylko wtedy, gdy \( g(A)=h(A) \) i \( g(B)=h(B) \). Przypomnijmy, że dziedziną funkcji \( g \) i \( h \) jest zbiór \( \{A,B\} \). Skoro przyjmują te same wartości na elementach dziedziny, to są sobie równe, a to wobec dowolności wyboru \( g \) i \( h \) oznacza, że \( F \) jest iniekcją.

Pozostało pokazać, że \( F \) jest suriekcją. Weźmy dowolną parę \( (a,b) \in A \times B \) i rozważmy funkcję \( g=\{(A,a), (B,b)\} \). Ponieważ zbiory \( A \) i \( B \) są różne, to \( g \) jest funkcją określoną na zbiorze \( \{A,B\} \). Dodatkowo \( g \) spełnia warunek \( g(A)\in A \) i \( g(B)\in B \), a więc \( g\in \mathbb{P} \{A,B\} \). Zauważmy, że \( F(g)=(g(A),g(B))=(a,b) \). Wskazaliśmy więc element dziedziny funkcji \( F \), dla którego wartością jest właśnie \( (a,b) \). Wobec dowolności wyboru \( (a,b) \in A \times B \) dowiedliśmy, że \( F \) jest suriekcją.

Ćwiczenie 6.1

Udowodnij, że założenie o różności zbiorów \( A \) i \( B \) w powyższym twierdzeniu jest konieczne.

Twierdzenie Knastra-Tarskiego

Twierdzenie Knastra-Tarskiego


W tym rozdziale przedstawimy podstawową wersję twierdzenia

Knastra-Tarskiego o punktach stałych funkcji monotonicznych oraz kilka przykładów zastosowań.

Definicja 7.1.

Funkcję \( f:\mathcal{P}(X) \rightarrow \mathcal{P}(X) \) nazwiemy monotoniczną ze względu na inkluzję, jeśli

\( \forall_{x\subset X} \forall_{y \subset X} (x\subset y \Rightarrow f(x) \subset f(y)). \)

Funkcje monotoniczne ze względu na inkluzję zachowują relację inkluzji pomiędzy przekształcanymi zbiorami. Nie oznacza to jednak wcale, że argument funkcji musi byc podzbiorem wartości funkcji na tym argumencie.

Ćwiczenie 7.1

Podaj przykład funkcji monotonicznej \( f:\mathcal{P}(X) \rightarrow \mathcal{P}(X) \), dla której nieprawdą jest, że dla każdego zbioru \( A\subset X \), zachodzi \( f(A) \supset A \).

Definicja 7.2.

Element \( x \in X \) jest punktem stałym funkcji \( f:X \rightarrow X \), jeśli

\( f(x)=x. \)

Ćwiczenie 7.2

Podaj przykłady punktów stałych następujących funkcji:

1. \( f: R \rightarrow R \) jest określona wzorem \( f(x)= \frac{x}{2} \),
2. \( f:\mathcal{P}(\mathcal{P}(X)) \rightarrow \mathcal{P}(\mathcal{P}(X)) \) jest określona wzorem \( f(x) = \{\bigcup x,\bigcap x \} \),
3. \( f:\mathcal{P}(X^2)\rightarrow \mathcal{P}(X^2) \) jest określona wzorem \( f(r) =r^{-1} \).



Zwróćmy uwagę, że istnieją funkcje, które nie mają punktów stałych. Prostym przykładem może być funkcja \( \{(0,1),(1,0)\} \).

Ćwiczenie 7.3

Niech \( X \) będzie niepustym zbiorem. Udowodnij, że dla funkcji \( f:\mathcal{P}(X) \rightarrow\mathcal{P}(X) \) zdefiniowanej wzorem \( f(A)= X \setminus A \) nie istnieje punkt stały.

Definicja 7.3.

Punkt \( x_0 \subset X \) jest najmniejszym punktem stałym funkcji \( f:\mathcal{P}(X) \rightarrow
\mathcal{P}(X) \), jeśli \( f(x_0)=x_0 \) oraz

\( \forall_{x_1\subset X} f(x_1)= x_1 \Rightarrow x_0 \subset x_1. \)

Czyli wtedy, kiedy każdy inny punkt stały jest jego nadzbiorem.

Definicja 7.4.

Punkt \( x_0 \subset X \) jest największym punktem stałym funkcji \( f:\mathcal{P}(X) \rightarrow
\mathcal{P}(X) \), jeśli \( f(x_0)=x_0 \) oraz

\( \forall_{x_1\subset X} f(x_1)= x_1 \Rightarrow x_0 \supset x_1. \)

Czyli wtedy, kiedy każdy inny punkt stały jest jego podzbiorem.

Poniższy przykład ilustruje, że istnienie najmniejszego i największego punktu stałego wcale nie jest oczywiste.

Przykład 7.5.

Dla funkcji \( f:\mathcal{P}(\mathcal{P}(X)) \rightarrow \mathcal{P}(\mathcal{P}(X)) \) określonej wzorem \( f(A) = \{\bigcap A\} \) punktami stałymi są \( \emptyset \) oraz singletony zawierające podzbiory zbioru \( X \) (czyli zbiory postaci \( \{A\} \) dla \( A\subset X \)). Jeśli \( X \) jest niepusty, to istnieją przynajmniej dwa różne punkty stałe będące singletonami. Nie istnieje wtedy punkt stały będący ich nadzbiorem, gdyż musiałby zawierać przynajmniej dwa elementy. Wobec tego nie istnieje największy punkt stały funkcji \( f \).

Każda monotoniczna funkcja \( f:\mathcal{P}(X) \rightarrow \mathcal{P}(X) \) posiada najmniejszy i największy punkt stały.

Dowód

Niech \( L=\{x \subset X: f(x) \supset x\} \). Pokażemy, że \( \bigcup L \) jest największym punktem stałym funkcji \( f \). Zauważmy, że dla każdego \( x\in L \) z monotoniczności \( f \) otrzymujemy

\( f(\bigcup L) \supset f(x) \supset x. \)

Wobec tego również

\( f(\bigcup L) \supset \bigcup L, \quad \mbox{(7.1)} \)

skąd otrzymujemy, że \( \bigcup L \in L \). Przekształcając obie strony poprzedniego równania przez \( f \) dzięki monotoniczności tej funkcji, otrzymamy

\( f(f(\bigcup L)) \supset f(\bigcup L). \)

Wobec czego również \( f(\bigcup L) \in L \). Ponieważ każdy element \( L \) jest podzbiorem \( \bigcup L \), to również \( f(\bigcup L) \subset \bigcup L \). Stąd i z równania 7.1 otrzymujemy

\( f(\bigcup L) = \bigcup L, \)

a więc \( \bigcup L \) jest punktem stałym funkcji \( f \). Co więcej, wszystkie punkty stałe należą do zbioru \( L \), wobec czego każdy z nich jest podzbiorem \( \bigcup L \), co oznacza dokładnie, że \( \bigcup L \) jest największym punktem stałym.

Analogicznie wykażemy istnienie najmniejszego punktu stałego. Niech \( U=\{x \subset X: f(x) \subset x\} \). Pokażemy, że \( \bigcap U \) jest najmniejszym punktem stałym. Z monotoniczności \( f \) mamy dla każdego \( x\in U \)

\( f(\bigcap U) \subset f(x) \subset x, \)

skąd otrzymujemy

\( f(\bigcap U) \subset \bigcap U, \quad \mbox{(7.2)} \) wobec czego \( \bigcap U \in U \). Przekształcając obie strony ostatniego równania przez \( f \), dzięki monotoniczności tej fukcji, otrzymamy

\( f(f(\bigcap U)) \subset f(\bigcap U), \)

skąd wynika, że \( f(\bigcap U) \in U \). Ponieważ \( \bigcap U \) jest podzbiorem każdego elementu \( U \), więc również \( \bigcap U \subset f(\bigcap U) \). Stąd i z równania 7.2 otrzymujemy \( f(\bigcap U) = \bigcap U \). Oznacza to, że \( \bigcap U \) jest punktem stałym funkcji \( f \). Ponieważ wszystkie punkty stałe należą do zbioru \( U \), to \( \bigcap U \) jest najmniejszym punktem stałym.

Przykład 7.7.

Niech \( X \) będzie zbiorem induktywnym (czyli takim, którego istnienie jest gwarantowane przez aksjomat nieskończoności). Zdefiniujmy funkcję \( f:\mathcal{P}(X) \rightarrow \mathcal{P}(X) \) w następujący sposób. Dla dowolnego \( A\subset X \) niech

\( f(A) \stackrel{\textrm{def}}{\equiv} A\cup \{x \cup \{x\}: x\in A\} \cup \{\emptyset\}. \)

Zwróćmy uwagę, że \( f(A)\subset X \) dzięki temu, że zbiór \( X \) jest induktywny. Z definicji łatwo wynika, że funkcja \( f \) jest monotoniczna. Wobec tego z twierdzenia 7.6 wynika, że ma najmniejszy i największy punkt stały. Zauważmy, że z definicji funkcji \( f \) wynika, że każdy punkt stały tej funkcji jest zbiorem induktywnym. Największy punkt stały łatwo wskazać, gdyż jest to cały zbiór \( X \). Znacznie ciekawszy jest najmniejszy punkt stały, nazwijmy go \( \omega \). Jest to najmniejszy zbiór induktywny będący podzbiorem \( X \). W wykładzie "Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje" dotyczącym liczb naturalnych pokażemy, że zbiór \( \omega \) jest również podzbiorem każdego innego zbioru induktywnego (dociekliwi mogą spróbować udowodnić to już teraz).

Ćwiczenie 7.4

Niech \( X \) będzie ustalonym zbiorem i \( R\subset X^2 \) będzie dowolną relacją. Zdefiniujmy funkcję \( f:\mathcal{P}(X^2) \rightarrow X^2 \) następująco: \( f(S)= (S \circ S) \cup R \). Udowodnij, że funkcja \( f \) jest monotoniczna. Co jest najmniejszym, a co największym punktem stałym funkcji \( f \)?

Ćwiczenie 7.5

Niech \( f:\mathcal{P}(\mathcal{P}(N)) \rightarrow \mathcal{P}(\mathcal{P}(N)) \) będzie zdefiniowana tak, że dla każdego \( A\subset N \)

\( f(A)= \{x \cup y: x,y\in A\} \cup \{\{n\}: n\in N\}. \)

Czyli funkcja \( f \) przekształca rodziny zbiorów liczb w rodziny zbiorów liczb. Udowodnij, że funkcja \( f \) jest monotoniczna. Co jest najmniejszym punktem stałym funkcji \( f \)? Czy \( \emptyset \) jest elementem tego punktu stałego?

Lemat Banacha

Lemat Banacha


Twierdzenie Knastra-Tarskiego posłuży nam do udowodnienia lematu

Banacha, który z kolei wykorzystamy w wykładzie "Teoria mocy twierdzenie Cantora-Bernsteina, twierdzenie Cantora. Zbiory przeliczalne, zbiory mocy kontinuum" dotyczącym teorii mocy.

Twierdzenie 7.8.

Dla dowolnych zbiorów \( X,Y \) oraz funkcji \( f:X \rightarrow Y \) i \( g:Y \rightarrow X \) istnieją zbiory \( A_1,A_2 \subset X \) oraz \( B_1,B_2 \subset Y \) takie, że:

1. \( \{A_1,A_2\} \) jest podziałem zbioru \( X \),
2. \( \{B_1,B_2\} \) jest podziałem zbioru \( Y \),
3. \( \vec{f}(A_1)= B_1 \),
4. \( \vec{g}(B_2)= A_2 \).

Dowód

Rozważmy funkcję \( F:\mathcal{P}(X) \rightarrow \mathcal{P}(X) \) zdefiniowaną następująco. Dla dowolnego \( A\subset X \) niech

\( F(A)= X\setminus \vec{g}(Y\setminus \vec{f}(A)). \)

Pokażemy najpierw, że \( F \) jest monotoniczna. Weźmy dowolne zbiory \( C_1,C_2 \subset X \) takie, że \( C_1 \subset C_2 \). Wtedy

\( \vec{f}(C_1) \subset \vec{f}(C_2), \)

więc

\( Y \setminus \vec{f}(C_1) \supset Y\setminus \vec{f}(C_2) \)

\( \vec{g}( Y \setminus \vec{f}(C_1)) \supset \vec{g}(Y\setminus \vec{f}(C_2)) \)

\( X \setminus \vec{g}( Y \setminus \vec{f}(C_1)) \subset X \setminus \vec{g}(Y\setminus \vec{f}(C_2)), \)

a więc \( F(C_1) \subset F(C_2) \).

Skoro \( F \) jest monotoniczna, to na mocy twierdzenia 7.6 Knastra-Tarskiego posiada najmniejszy punkt stały. Oznaczmy go przez \( A_1 \). Zdefiniujemy teraz pozostałe zbiory z tezy twierdzenia. Niech:

\( A_2\stackrel{\textrm{def}}{\equiv} X \setminus A_1, \)

\( B_1 \stackrel{\textrm{def}}{\equiv} \vec{f}(A_1), \)

\( B_2 \stackrel{\textrm{def}}{\equiv} Y \setminus B_1. \)

Z definicji zbiorów \( A_1,A_2,B_1,B_2 \) natychmiast wynika, że zbiory \( \{A_1,A_2\} \) oraz \( \{B_1,B_2\} \) tworzą odpowiednio podziały zbiorów \( X \) i \( Y \). Również z definicji spełniony jest punkt trzeci tezy (czyli \( B_1 \stackrel{\textrm{def}}{\equiv} \vec{f}(A_1) \)). Pozostaje pokazać, że zachodzi punkt czwarty. Skoro \( A_1 \) jest punktem stałym funkcji \( F \), to

\( A_1= X\setminus \vec{g}(Y\setminus \vec{f}(A_1)). \)

Podstawiając kolejno w powyższym wzorze zdefiniowane zbiory, otrzymujemy:

\( A_1= X\setminus \vec{g}(Y\setminus B_1), \)

\( A_1= X\setminus \vec{g}( B_2). \)

Odejmując obie strony od \( X \), otrzymamy:

\( X \setminus A_1 = \vec{g}( B_2). \)

Ponieważ jednak lewa strona w powyższej równości jest z definicji równa \( A_2 \), to otrzymujemy: \( A_2 = \vec{g}( B_2). \)

Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje

Wstęp



Liczby naturalne to jedna z najbardziej podstawowych idei matematycznych. Operacje dodawania i mnożenia liczb naturalnych są najczęściej uznawane za najprostsze operacje matematyczne. W aksjomatycznym podejściu do teorii mnogości wszystkie "oczywiste fakty" dotyczące liczb naturalnych należy wywieść z aksjomatów. W pierwszej części tego wykładu wykażemy, że aksjomatyka ZF gwarantuje istnienie zbioru liczb naturalnych. Druga część poświęcona jest dowodzeniu własności tych liczb.

W teorii mnogości liczby naturalne, podobnie jak wszystkie inne byty, muszą być zbiorami. Od aksjomatyki teorii mnogości niewątpliwie należy wymagać, aby gwarantowała ich istnienie. W aksjomatyce ZF opisanej w wykładzie "Teoria mnogości ZFC. Operacje na zbiorach" jako liczby naturalne przyjmuje się zbiory, do których istnienia niezbędny jest aksjomat zbioru pustego, aksjomat pary i aksjomat sumy. Konstrukcja liczb naturalnych przedstawiona w dalszej części wykładu została zaproponowanych przez Johna von Neumanna jak specyficzny przypadek liczb porządkowych, które będą dokładniej przedstawione w wykładzie "Zbiory dobrze uporządkowane. Lemat Kuratowskiego Zorna i twierdzenie Zermelo, przykłady".

Liczby naturalne definiujemy następująco. Liczbą naturalną zero jest zbiór pusty \( \emptyset \). Każdą następną liczbę naturalną otrzymujemy z poprzedniej w prosty sposób:

jeśli \( n \) jest liczbą naturalną, to następną po niej liczbą jest \( n'\stackrel{\textrm{def}}{\equiv} \{n\} \cup n \)

Początkowe liczby naturalne to:

\( \begin{array} {ll} \text{liczba naturalna zero to zbiór } & \emptyset , \\ \text{liczba naturalna jeden to zbiór } & \{\emptyset\} , \\ \text{liczba naturalna dwa to zbiór } & \{\emptyset,\{\emptyset\}\}, \\ \text{liczba naturalna trzy to zbiór } & \{\emptyset,\{\emptyset\},\{\emptyset,\{\emptyset\}\}\}, \\ \text{i tak dalej\dots} & \text{ } \end{array} \)

Liczby naturalne to zbiory, których istnienie jest zagwarantowane przez aksjomaty ZF. Intuicyjnie, patrząc na nie widzimy, że posiadają tyle elementów jaka jest "wartość" liczby. Zero, to zbiór pusty, jeden, to zbiór którego jedynym elementem jest \( \emptyset \) i tak dalej.

Zbiory induktywne

Zbiory induktywne



Aksjomaty ZF gwarantują więcej. Nie tylko każda z liczb naturalnych istnieje, ale również istnieje zbiór zawierający je wszystkie. Najmniejszy z takich zbiorów nazywamy zbiorem liczb naturalnych. Aby wykazać istnienie tego zbioru, niezbędny jest aksjomat nieskończoności. Przytoczymy jego brzmienie zgodnie z wykładu "Teoria mnogości ZFC. Operacje na zbiorach".

Zakładamy, że następująca formuła, zwana aksjomatem nieskończoności, jest prawdą:

\( \exists x\; (\emptyset\in x \land (\forall y\; y\in x \Longrightarrow y\cup\{y\}\in x )). \) Każdy zbiór \( x \) spełniający warunek występujący w aksjomacie nieskończoności nazywamy zbiorem induktywnym. Aksjomat nieskończoności nie nakłada żadnych ograniczeń górnych na zbiory induktywne -- mogą być one dowolnie wielkie. Zbiorem liczb naturalnych będziemy nazywać najmniejszy ze zbiorów induktywnych. Wcześniej jednak musimy udowodnić, że zbiór taki istnieje. Następujące fakty pozwolą nam go zdefiniować.

Lemat 2.1.

Jeśli \( x \) jest niepustym zbiorem zbiorów induktywnych to \( \bigcap x \) jest również zbiorem induktywnym.

Dowód

Aby wykazać, że \( \bigcap x \) jest zbiorem induktywnym, musimy wykazać, że:

  • \( \emptyset \in \bigcap x \)

oraz że

  • \( \forall y\; y\in \bigcap x \Longrightarrow y\cup\{y\}\in \bigcap x \).

Ponieważ każdy z elementów \( x \) jest zbiorem induktywnym, to \( \forall z\; z\in x\Longrightarrow \emptyset\in z \), czyli zbiór pusty jest w każdym z elementów \( x \). Jeśli jakiś zbiór jest w każdym elemencie zbioru, to jest również w jego przecięciu, czyli \( \emptyset \in \bigcap x \). Pozostaje wykazać drugi fakt, weźmy dowolny \( y\in\bigcap x \). Natychmiastową konsekwencją jest, że dla każdego \( z \), elementu \( x \) mamy \( y\in z \). Skoro każdy element \( x \) jest zbiorem induktywnym, to dla każdego \( z \) w \( x \) mamy \( y\cup\{y\}\in z \) i, z definicji przecięcia, \( y\cup \{y\}\in\bigcap x \). W ten sposób udowodniliśmy oba warunki i równocześnie lemat.

Przechodzimy do dowodu głównego twierdzenia. Mówi ono, że istnieje zbiór induktywny będący podzbiorem wszystkich zbiorów induktywnych.

Twierdzenie 2.2.

Istnieje najmniejszy, pod względem inkluzji, zbiór induktywny.

Dowód

Na mocy aksjomatu nieskończoności istnieje co najmniej jeden zbiór induktywny -- oznaczmy go przez \( x \). Rozważmy wszystkie podzbiory \( \mathcal{P}(x) \) tego zbioru i wybierzmy z nich, na mocy aksjomatu wyróżniania, zbiory induktywne -- powstały w ten sposób podzbiór \( \mathcal{P}(x) \) nazwijmy \( y \). Zbiór \( y \) jest niepusty, ponieważ \( x\in y \) jest zagwarantowane przez fakt, że \( x\subset x \) i założenie mówiące, że \( x \) jest zbiorem induktywnym. Wnioskujemy, że zbiór \( y \) spełnia założenia Lematu 2.1 i w związku z tym \( \bigcap y \) jest zbiorem induktywnym.

Postulujemy, że zbiór \( \bigcap y \) jest najmniejszym zbiorem induktywnym. Aby to wykazać, pokażemy, że dla dowolnego zbioru induktywnego \( z \) mamy \( \bigcap y\subset z \). Ustalmy dowolny zbiór induktywny \( z \), na mocy Lematu 2.1, zastosowanego do zbioru \( \{x,z\} \) otrzymujemy, że \( x\cap z \) jest zbiorem induktywnym. W związku z tym \( x\cap z \in y \) i dalej \( \bigcap y\subset x\cap z \subset z \). To dowodzi, że zbiór \( \bigcap y \) jest podzbiorem każdego zbioru induktywnego, czyli najmniejszym pod względem inkluzji zbiorem induktywnym.

Natychmiastowym wnioskiem jest, że zbiór taki jest jedyny.

Wniosek 2.3.

Istnieje unikalny, najmniejszy pod względem inkluzji, zbiór induktywny.

Dowód

Ustalmy dwa dowolne, najmniejsze pod względem inkluzji zbiory induktywne \( x \) i \( y \). Wtedy \( x\subset y \) i \( y\subset x \), skąd wnioskujemy, że \( x=y \), co należało wykazać.

Tak skonstruowany zbiór nazywamy zbiorem liczb naturalnych.

Definicja 2.4.
Najmniejszy pod względem inkluzji zbiór induktywny nazywamy zbiorem liczb naturalnych i oznaczamy, przez \( \mathbb{N} \). Elementy tego zbioru nazywamy liczbami naturalnymi.
Skonstruowaliśmy, przy pomocy aksjomatów ZF zbiór posiadający pewne własności i nazwaliśmy go zbiorem liczb naturalnych. Zbiór ten niewątpliwie zawiera liczbę zero, zdefiniowaną wcześniej jako zbiór pusty. Zawiera również liczbę jeden \( 1=0'=\{\emptyset\} \), ponieważ zawiera \( 0 \) i dla każdego elementu zawiera również jego następnik. Każda, z intuicyjnie oczywistych własności liczb naturalnych, musi być wykazana na gruncie aksjomatów ZF zanim uznamy ją za prawdziwą. Pozostała część tego wykładu poświęcona jest dowodzeniu podstawowych faktów dotyczących liczb naturalnych.

Indukcja matematyczna

Indukcja matematyczna


Podstawową metodą dowodzenia twierdzeń o liczbach naturalnych jest zasada indukcji matematycznej. Używając aksjomatów, możemy wykazać, że indukcja matematyczna działa. Formalnie, dla dowolnej własności, którą chcemy dowodzić przez indukcję, definiujemy zbiór elementów, które ją spełniają. Jeśli zbiór ten spełnia wymagane własności, jest on równy zbiorowi liczb naturalnych, czyli własność jest prawdą dla wszystkich liczb naturalnych. W formalny sposób przedstawia to poniższe twierdzenie.

Twierdzenie 3.1. [o indukcji matematycznej]

Dla dowolnego zbioru \( P \) jeśli \( P\subset\mathbb{N} \)

  • \( \emptyset\in P \)

oraz

  • \( \forall x\; x\in P \Longrightarrow x'=x\cup\{x\}\in P, \)

to \( P=\mathbb{N} \).

Dowód

Ustalmy dowolny zbiór \( P \) spełniający założenia twierdzenia. Zbiór \( P \) jest zbiorem induktywnym, a więc, na mocy definicji zbioru liczb naturalnych, \( \mathbb{N}\subset P \). Równocześnie założyliśmy, że \( P\subset\mathbb{N} \) i w związku z tym \( P=\mathbb{N} \), co dowodzi twierdzenia.

Własności liczb naturalnych

Własności liczb naturalnych


Pierwszym twierdzeniem, które udowodnimy przy użyciu indukcji matematycznej jest twierdzenie mówiące, że każdy element liczby naturalnej jest również liczbą naturalną.

Twierdzenie 4.1.

Każdy element liczby naturalnej jest również liczbą naturalną. Formalnie:
\( \forall x\; x\in\mathbb{N} \Longrightarrow \forall y\;( y\in x \Longrightarrow y\in\mathbb{N}). \)

Dowód

Dowiedziemy tego faktu przez indukcję. Oznaczmy przez \( P \) zbiór tych wszystkich elementów \( \mathbb{N} \) które spełniają naszą własność:

\( P = \{n\in\mathbb{N}\,:\, \forall y\; y\in n \Longrightarrow y\in\mathbb{N}\} \)

Innymi słowy, jest to zbiór liczb naturalnych, dla których dowodzony fakt jest prawdą. Aby móc zastosować Twierdzenie 3.1., musimy wykazać trzy własności zbioru \( P \). Niewątpliwie \( P\subset\mathbb{N} \), skoro \( P \) jest zbiorem niektórych liczb naturalnych. Przechodzimy teraz do pierwszego kroku indukcyjnego.

  • Po pierwsze musimy wykazać, że \( \emptyset\in P \). Aby to sprawdzić, musimy stwierdzić, czy każdy element zbioru \( \emptyset \) jest liczbą naturalną. Ponieważ \( \emptyset \) nie posiada żadnych elementów nie trzeba niczego dowodzić.
  • Załóżmy teraz, że \( n\in P \). To oznacza, że każdy element \( n \) jest liczbą naturalną. Rozważmy \( n'=n\cup \{n\} \). Każdy element \( n \) jest liczbą naturalną, na mocy założenia indukcyjnego, również jedyny element \( \{n\} \) równy \( n \) jest liczbą naturalną, ponieważ \( n\in P\subset \mathbb{N} \). W związku z tym każdy z elementów unii \( n\cup\{n\} \) jest również liczbą naturalną. To implikuje, że \( n' \) należy do \( P \).

Udowodniliśmy wszystkie przesłanki Twierdzenia 3.1. i w związku z tym twierdzenie to gwarantuje, że \( P=\mathbb{N} \), czyli że każdy z elementów dowolnej liczby naturalnej jest również liczbą naturalną.

Dowiedziemy teraz paru własności dotyczących liczb naturalnych. Wiemy, że liczbami naturalnymi są \( 0=\emptyset \) oraz następniki liczb naturalnych. Niewątpliwie \( 0 \) nie jest następnikiem żadnej liczby naturalnej, ponieważ następnik dowolnego zbioru posiada przynajmniej jeden element - dla \( n \) mamy \( n\in n' \). Poniższy fakt pokazuje własność przeciwną.

Fakt 4.2.

Każda liczba naturalna jest albo zbiorem pustym, albo następnikiem liczby naturalnej. Formalnie:

\( \forall x\; x\in\mathbb{N} \Longrightarrow (x = \emptyset \lor \exists y\; (y\in\mathbb{N} \land x=y')) \)

Dowód

Aby dowieść tego faktu skorzystamy z twierdzenia o indukcji matematycznej. Zdefiniujemy zbiór \( P \) jako zbiór elementów spełniających nasze założenia:

\( P = \{n\in\mathbb{N}\,:\, n=\emptyset \lor \exists m\; (m\in\mathbb{N} \land n=m')\}. \)

Aby skorzystać z twierdzenia o indukcji wykażemy, że:

  • Zbiór pusty jest elementem \( P \) -- jest to oczywista konsekwencja definicji \( P \).
  • Jeśli \( n\in P \) to również \( n'\in P \). Aby to wykazać, załóżmy, że \( n\in P\subset \mathbb{N} \). Oczywiście \( n' \) jest następnikiem pewnej liczby naturalnej - \( n \).

Na podstawie twierdzenia o indukcji \( P=\mathbb{N} \), czyli fakt jest prawdziwy.

Kolejny fakt mówi o zależnościach pomiędzy różnymi liczbami naturalnymi.

Fakt 4.3.

Dla dowolnej liczby naturalnej \( n \) i dowolnego zbioru \( y \), jeśli \( y\in n \), to \( y\subset n \).

Dowód

Dowód przeprowadzimy indukcyjnie, czyli w oparciu o Twierdzenie 3.1.. Zdefiniujmy zbiór \( P \) jako zbiór tych wszystkich \( n \), elementów \( \mathbb{N} \), które spełniają nasze założenie -- formalnie:

\( P=\{n\in\mathbb{N}\,:\, \forall y\; y\in n \Longrightarrow y\subset n\}. \)

Aby skorzystać z indukcji, należy wykazać dwa fakty:

  • Oczywiście \( 0=\emptyset\in P \), ponieważ \( \emptyset\in\mathbb{N} \) i warunek \( y \in \emptyset \) jest fałszem, dla wszystkich \( y \).
  • Załóżmy teraz że \( n\in P \) i dowiedźmy, że \( n' \) jest również elementem \( P \). W tym celu ustalmy dowolny \( y \) taki, że \( y\in n' = n\cup\{n\} \). Rozważamy dwa przypadki - albo \( y\in n \), albo \( y\in\{n\} \) (równoważnie \( y=n \)). Jeśli \( y\in n \), to, na mocy założenia indukcyjnego, \( y\subset n \), a ponieważ \( n\subset n\cup\{n\} \), wnioskujemy, że \( y\subset n' \), co należało wykazać. W drugim przypadku \( y=n \), ale, ponieważ \( n'=n\cup\{n\} \), otrzymujemy natychmiast, że \( y=n\subset n' \), co należało wykazać.

No mocy twierdzenia o indukcji matematycznej \( P=\mathbb{N} \) i fakt jest dowiedziony dla wszystkich liczb naturalnych.

Kilka podobnych własności liczb naturalnych podajemy jako ćwiczenie:

Ćwiczenie 4.1

Jeśli \( m \) i \( n \) są liczbami naturalnymi, to:

1. jeżeli \( m'=n' \), to \( m=n \),
2. jeżeli \( m\subset n \) i \( m\neq n \), to \( m\in n \),
3. \( m\subset n \) lub \( n\subset m \) - czyli wszystkie liczby naturalne są porównywalne przez inkluzję
4. \( m\in n \) albo \( m=n \) albo \( m\ni n \) - czyli dla dowolnych dwóch różnych liczb naturalnych jedna jest elementem drugiej.

Przedstawimy kolejno rozwiązania do powyższych podpunktów:




Porządek na liczbach naturalnych

Porządek na liczbach naturalnych


Wśród naiwnie interpretowanych liczb naturalnych mamy zdefiniowany porządek mniejszości. Aby zdefiniować taki porządek w aksjomatycznie skonstruowanym zbiorze liczb naturalnych musimy go wyrazić za pomocą symboli predykatowych. Dla dowolnych dwóch liczb naturalnych \( m \) i \( n \) piszemy:

\( m\leq n \stackrel{\textrm{def}}{\equiv} m\subset n \)

oraz

\( m < n \stackrel{\textrm{def}}{\equiv} m\in n. \)

Przy takim zdefiniowaniu relacji Fakt 4.3. i poprzednie ćwiczenie natychmiast gwarantują, że dla dowolnych liczb naturalnych \( m \) i \( n \):

  • \( m < n \Longrightarrow m\leq n \),
  • \( (m\leq n \land m\neq n) \Longrightarrow m < n \),
  • \( m \leq n \lor n\leq m \),
  • \( m < n \lor m=n \lor n < m \) - gdzie dokładnie jeden z warunków jest prawdziwy.

Kolejne własności dotyczące porządku na liczbach naturalnych podajemy w formie ćwiczenia:

Ćwiczenie 5.1

Dla dowolnych liczb naturalnych \( k,m \) i \( n \) następujące warunki są spełnione:

1. \( m=n\iff (m\leq n \land n\leq m) \),
2. \( \lnot (n < n) \),
3. \( (k\leq m \land m\leq n) \Longrightarrow k\leq n \),
4. \( (k < m \land m\leq n) \Longrightarrow k < n \),
5. \( (k\leq m \land m < n) \Longrightarrow k < n \),
6. \( (k < m \land m < n) \Longrightarrow k < n \).

Ustalmy dowolne liczby naturalne \( k,m \) i \( n \)






Często używać będziemy zbioru wszystkich liczb naturalnych mniejszych niż dana liczba. Okazuje się, że zdefiniowaliśmy już takie zbiory - każda liczba naturalna to zbiór liczb silnie mniejszych od niej.

Wniosek 5.1.

Każda liczba naturalna \( n \) to zbiór liczb istotnie mniejszych od \( n \). Formalnie:
\( \forall n\; n\in\mathbb{N}\Longrightarrow ( \forall z\; z\in n \iff (z\in\mathbb{N} \land z < n)). \)
Dowód

Dla dowolnego ustalonego \( n \) i \( z \) implikacja w lewą stronę jest oczywista (z definicji \( < \)). Implikacja w prawą stronę jest natychmiastową konsekwencją Twierdzenia 4.1. i definicji \( < \).

Ćwiczenie 5.2

Ile jest funkcji \( f:\mathbb{N}arrow\mathbb{N} \) takich, że \( \vec{f}(n) = f(n) \), dla każdej liczby naturalnej \( n \).


Następujące twierdzenie mówi, że każdy zbiór liczb naturalnych zawiera liczbę najmniejszą w porządku \( \leq \). Pozwala ono dowody przez indukcję zamieniać na dowody niewprost. Zamiast przeprowadzać dowód indukcyjny dla zbioru \( P \), rozważyć możemy zbiór \( \mathbb{N}\setminus P \). Na mocy poniższego twierdzenia zbiór taki posiada element minimalny, który jest albo zerem, albo następnikiem pewnej liczby naturalnej, co pozwala na uzyskanie sprzeczności.

Twierdzenie 5.2. [Zasada minimum]

Każdy niepusty zbiór liczb naturalnych zawiera element najmniejszy, to znaczy taki, że wszystkie elementy w tym zbiorze są od niego większe lub równe.

Dowód

Faktu tego dowodzimy indukcyjnie. Na początku ustalmy zbiór \( P \):

\( P=\{n\in\mathbb{N}\,:\, \forall x (x\subset\mathbb{N} \land x\cap n \neq \emptyset) \Longrightarrow \bigcap x\in x\}. \)

Zbiór \( P \) zawiera takie liczby naturalne, że dla dowolnego zbioru liczb naturalnych \( x \) jeśli \( x\cap n\neq \emptyset \) (czyli w zbiór \( x \) zawiera liczbę naturalną silnie mniejszą od \( n \)), to zbiór \( \bigcap x \) jest elementem \( x \). Wykażmy, indukcyjnie, że \( P=\mathbb{N} \).

  • Niewątpliwie \( 0\in P \), ponieważ, dla dowolnego, \( x \) fałszem jest \( x\cap\emptyset\neq\emptyset \).
  • Załóżmy, że \( n\in P \) i ustalmy zbiór \( x \) taki, że \( x\subset \mathbb{N} \) i \( x\cap n'\neq \emptyset \). Ponieważ \( n'=n\cup\{n\} \) naturalnie jest rozważyć dwa przypadki. Jeśli \( x\cap n\neq \emptyset \), otrzymujemy \( \bigcap x\in x \) na mocy założenia indukcyjnego. W przeciwnym przypadku \( x\cap n = \emptyset \), czyli \( x\cap n'=\{n\} \). Otrzymujemy wtedy \( n\in x \). Równocześnie, dla każdego \( z\in x \) mamy \( n\in z \) lub \( n=z \) (na mocy identyczności pokazanych wcześniej) ponieważ \( z\in n \) -trzecia możliwość jest zabroniona na mocy \( x\cap n = \emptyset \). To wykazuje, że dla każdego \( z\in\mathbb{N} \) mamy, na mocy własności liczb naturalnych, \( n\subset z \). Używając własności przecięcia dostajemy \( n\subset \bigcap x \), a ponieważ \( n\in x \) otrzymujemy \( \bigcap x\subset n \) - to daje \( \bigcap x = n\in x \) - co należało wykazać.

Aby dowieść twierdzenie, ustalmy niepusty zbiór \( x \subset \mathbb {N} \). Niewątpliwie istnieje \( n\in\mathbb{N} \) takie, że \( n\in x \). Wtedy \( n'\cap x\neq\emptyset \), ponieważ \( n\in n'\cap x \). Na mocy dowiedzionego chwilę wcześniej faktu wnioskujemy, że \( \bigcap x\in x\subset\mathbb{N} \). Czyli że \( \bigcap x \) jest najmniejszą liczbą naturalną występującą w \( x \).

Oczywistym faktem jest, że nie istnieje największa liczba naturalna. Aksjomatyczny dowód tego faktu przebiega niewprost. Jeśli \( n \) jest liczbą naturalną, to \( n' \) jest również liczbą naturalną i \( n'> n \), więc \( n \) nie mogła być większa od wszystkich liczb. Niemniej jednak, jeśli pewien podzbiór liczb naturalnych jest ograniczony z góry, to posiada element największy.

Twierdzenie 5.3. [Zasada maksimum]

Jeśli \( x \) jest niepustym zbiorem liczb naturalnych ograniczonym z góry, tzn.:

\( \exists y\; y\in\mathbb{N} \land \forall z\; z\in x \Longrightarrow z \leq y, \)

to \( x \) posiada element największy, tzn.:

\( \exists y\; y\in x \land \forall z\; z\in x \Longrightarrow z\leq y. \)

Dowód

Faktu tego dowodzimy przez indukcję. Zdefiniujmy zbiór \( P \) jako zbiór tych ograniczeń górnych dla których zachodzi nasza teza:

\( P = \{n\in\mathbb{N}\,:\, \forall x\; ( x\neq \emptyset \land x\subset n ) \Longrightarrow \bigcup x \in x\}. \)

Zbiór \( P \) jest zdefiniowany jako zbiór tych liczb naturalnych \( n \), że dla każdego zbioru \( x \) składającego się z liczb silnie mniejszych od \( n \) zbiór ten posiada największy element (którym jest \( \bigcup x \)). Przechodzimy do indukcyjnego dowodu tego faktu.

  • Niewątpliwie \( 0=\emptyset\in P \), ponieważ \( \emptyset \) nie posiada żadnych niepustych podzbiorów.
  • Załóżmy, że \( n\in P \) i ustalmy dowolne, niepuste \( x\subset n' \). Jeśli \( n\in x \), to, ponieważ pozostałe elementy \( n' \) są podzbiorami \( n \), otrzymujemy \( \bigcup x = \bigcup n' = n\in x \). Jeśli \( n\notin x \), to \( x\subset n \) i, na mocy założenia indukcyjnego otrzymujemy \( \bigcup x\in x \).

Ustalmy teraz dowolny niepusty zbiór liczb naturalnych \( x \) ograniczony z góry przez liczbę naturalną \( y \). Natychmiast otrzymujemy, że \( x\subset y' \) i na mocy dowiedzionej wcześniej własności \( \bigcup x\in x\subset \mathbb{N} \), czyli \( \bigcup x \) jest liczbą naturalną i elementem \( x \). Niewątpliwie \( \bigcup x \) jest nadzbiorem każdego z elementów \( x \), co dowodzi, że \( \bigcup x \) jest elementem maksymalnym zbioru \( x \).

Definiowanie przez indukcję

Definiowanie przez indukcję



Następujące twierdzenie pozwala nam zdefiniować dodawanie, mnożenie i wiele ważnych operacji na liczbach naturalnych. Twierdzenie to mówi, że jeśli wiemy, jak zdefiniować pewną operację dla zera oraz jak zdefiniować ją dla następnika danej liczby, to możemy zdefiniować ją równocześnie dla wszystkich liczb.

Twierdzenie 6.1. [o definiowaniu przez indukcję]

Niech \( A \) i \( B \) będą zbiorami, a \( f: A \rightarrow B \) i \( g:B\times \mathbb{N}\times A \rightarrow B \) funkcjami. Istnieje unikalna funkcja \( h:\mathbb{N}\times A \rightarrow B \) taka, że:

\( h(0, a) = f(a), \mbox{ dla każdego }a \in A, \)
\( h(n', a) = g(h(n, a), n, a), \mbox{ dla każdego }a \in A \mbox{ i }n \in \mathbb{N}. \)

Dowód

Dowód istnienia funkcji \( h \) będzie się opierał na analizie elementów następującego zbioru:

\( H = \{e\,:\, \exists m\; m\in\mathbb{N} \land e:m'\times A \rightarrow B \land \mbox{(*)} \}, \)

gdzie

\( e(0, a) = f(a), \mbox{ dla każdego }a \in A, \)
\( e(g(n, a), n, a), \mbox{ dla każdego }a \in A \mbox{ i }n \in m \quad \mbox{(*)} \)

Zbiór \( H \) jest to zbiór funkcji, które częściowo rozwiązują nasz problem -- funkcje ze zbioru \( H \) działają dla liczb naturalnych mniejszych niż pewne, ustalone \( m \). Funkcja \( h \), której istnienia dowodzimy, powinna działać dla wszystkich liczb naturalnych.

W pierwszej części dowiedziemy, że zbiór \( H \) jest niepusty i, co więcej, zawiera przynajmniej jedną funkcję \( e:m'\times A \rightarrow B \) dla każdej liczby naturalnej \( m \). Dowód jest indukcyjny -- zdefiniujmy zbiór \( P \) jako zbiór tych liczb, dla których istnieją odpowiednie funkcje w \( H \):

\( P = \{m\in\mathbb{N}\,:\, \exists e\; e:m'\times A \rightarrow B \land e\in H\}. \)

Dowiedziemy indukcyjnie, że \( P=\mathbb{N} \):

  • Niewątpliwie \( 0\in P \) ponieważ funkcja \( e:\{0\}\times A \rightarrow B \) zdefiniowana jako \( e(0,a)=f(a) \) jest elementem \( H \).
  • Załóżmy, że \( m\in P \). To oznacza, że istnieje funkcja \( e:m'\times A \rightarrow B \) spełniająca (*). Funkcja \( e' \)

zdefiniowana jako:

\( e'(n, a) = \begin{cases} e(n, a), & \mbox{jeśli } n \in m', \\ g(e(n, a), n, a), & \mbox{jeśli} n = m', \end{cases} \)

przeprowadza \( m''\times A \) w \( B \) i należy do \( H \), gwarantując, że \( m'\in P \).

Na podstawie twierdzenia o indukcji istnieje funkcja \( e:m'\times A \rightarrow B \) należąca do \( H \), dla każdego \( m\in\mathbb{N} \).

Kolejną rzeczą jako wykażemy jest to, że dowolne funkcje \( e\in H \) i \( e'\in H \) dla tych samych argumentów zwracają takie same wyniki (oczywiście zakładając, że argumenty należą do przecięcia dziedzin tych funkcji). Nasz dowód przebiega niewprost. Załóżmy że funkcje \( e,e'\in H \) są takie, że istnieje \( n\in\mathbb{N} \) i \( a\in A \) spełniające \( e(n,a)\neq e'(n,a) \). Zastosujmy Twierdzenie 5.2. do zbioru tych wszystkich \( n \), dla których istnieje \( a\in A \) spełniające \( e(n,a)\neq e'(n,a) \) (na mocy naszego założenia zbiór ten jest niepusty). Otrzymujemy najmniejszą liczbę naturalną \( n \) taką, że \( e(n,a)\neq e'(n,a) \). Liczba \( n \) nie może być równa \( 0 \), bo wtedy \( e(0,a) = f(a) = e'(0,a) \), więc, na mocy Faktu 4.2. \( n=k' \), dla pewnego \( k \). Ponieważ \( k < n \), więc \( e(k,a)=e'(k,a) \) i otrzymujemy sprzeczność dzięki:

\( e(n,a) = e(k',a)=g(e(k,a),k,a) = g(e'(k,a),k,a) = e'(k',a) = e'(n,a). \)

Dowód twierdzenia kończymy, definiując \( h = \bigcup H \). Na mocy wcześniejszego faktu \( h \) jest funkcją, a na mocy faktu, który dowodziliśmy indukcyjnie dziedziną \( h \) jest zbiór liczb naturalnych. Warunki stawiane \( h \) są spełnione w sposób oczywisty dzięki definicji zbioru \( H \).

Aby wykazać unikalność funkcji \( h \) załóżmy, że istnieje funkcja \( h'\neq h \) spełniająca tezę twierdzenia. Wnioskujemy, że istnieje \( n\in\mathbb{N} \) i \( a\in A \) takie, że \( h(n,a)\neq h'(n,a) \). Wtedy jednak \( h' \) zawężone do \( n' \) jest elementem zbioru \( H \), co stoi w sprzeczności z faktem wykazanym o \( H \).

Operacje na liczbach naturalnych

Operacje na liczbach naturalnych


Definiowanie przez indukcję pozwala nam na wprowadzenie podstawowych operacji arytmetycznych na liczbach naturalnych. Jako pierwszą z tych operacji wprowadzimy dodawanie.

Dodawanie liczb naturalnych

Dodawanie jest funkcją dwuargumentową przekształcającą \( \mathbb{N} \times \mathbb{N} \) w \( \mathbb{N} \). Aby wykazać istnienie dodawania, korzystamy z twierdzenia o indukcji, kładąc za \( A \) i \( B \) zbiór liczb naturalnych \( \mathbb{N} \) i definiując \( f(n)=n \) oraz \( g(m,n,p) = m' \). Na mocy twierdzenia o definiowaniu przez indukcję istnieje funkcja \( h:\mathbb{N}^2 \rightarrow \mathbb{N} \) taka, że \( h(0,m) = m \) i \( h(n',m)= h(n,m)' \). Funkcja ta to dodawanie liczb naturalnych i będziemy używać zwyczajnej notacji \( h(n,m) = n+m \). Zgodnie z intuicją, dla dowolnej liczby naturalnej \( n \) mamy \( n' = n+1 \).

Jedyną udowodnioną w tej chwili własnością funkcji zapisywanej przez \( + \) są wynikające wprost z definicji własności. Wiemy, że,

\( 0+n = n, \)

dla każdego liczby naturalnej \( n \) oraz że,

\( n'+m = (n+m)', \) dla dowolnych liczb \( n \) i \( m \). Poniżej przedstawiamy parę podstawowych faktów dotyczących dodawania liczb naturalnych.

Fakt 7.1.

Jeśli suma dwóch liczb jest równa \( 0 \), to obie liczby muszą być równe \( 0 \).

Dowód

Załóżmy, że dla dwu liczb naturalnych \( n \) i \( m \) zachodzi \( n+m=0 \). Jeśli liczba \( n \) jest następnikiem jakiejś liczby naturalnej, to również \( n+m \) jest następnikiem jakiejś liczby i w związku z tym \( n+m\neq 0 \). Na podstawie Faktu 4.2. wnioskujemy, że \( n=0 \). Wtedy \( 0+m=m \) i otrzymujemy \( m=0 \), co należało wykazać.

Kolejny fakt mówi o łączności dodawania liczb naturalnych.

Fakt 7.2.

Dodawanie liczb naturalnych jest łączne. Formalnie:

\( \forall k \forall m \forall n\; (k\in\mathbb{N} \land m\in \mathbb{N} \land n\in \mathbb{N}) \Longrightarrow k+(m+n)=(k+m)+n. \)

Dowód

Dowód jest indukcją ze względu na \( k \).

  • Jeśli \( k=0 \), to \( 0+(m+n) = m+n \) oraz \( 0+m=m \) i w związku z tym \( (0+m)+n = m+n \), co należało pokazać.
  • Zakładamy, że równość jest prawdziwa dla \( k \) (dla

dowolnych \( m \) i \( n \)). Ustalmy dowolne liczby naturalne \( m \) i \( n \), wtedy:

\( k'+(m+n) = (k+(m+n))' = ((k+m) + n)' = (k+m)' +n = (k'+m) +n \)

gdzie druga równość wynika z założenia indukcyjnego, a wszystkie pozostałe równości z definicji funkcji \( + \).

Dzięki twierdzenie o indukcji matematycznej dodawanie jest łączne dla wszystkich liczb naturalnych.

Dalsze własności dodawania liczb naturalnych prezentujemy jako ćwiczenie.

Ćwiczenie 7.1

Dla dowolnych liczb naturalnych \( k,m \) i \( n \) udowodnij:

1. \( n+0=n \),
2. \( k'+m=k+m' \),
3. \( k+m = m+k \), czyli dodawanie jest przemienne,
4. jeśli \( k+n = m+n \), to \( k=m \), czyli dodawanie jest skracalne,
5. jeśli \( k>m \), to istnieje \( n>0 \) takie, że \( k=m+n \).





Ćwiczenie 7.2

Wykaż, że dla dowolnych liczb naturalnych \( k \) i \( n \):

1. jeśli \( n \neq 0 \), to \( k+ n > k \),
2. \( k + n \geq k \).


Mnożenie liczb naturalnych

Podobnie do dodawania możemy zdefiniować mnożenie. Stosujemy twierdzenie o definiowaniu przez indukcję do \( A=B=\mathbb{N} \) oraz \( f(n) = 0 \) i \( g(m,n,p) = m + p \). Twierdzenie o definiowaniu przez indukcję gwarantuje istnienie funkcji \( h:\mathbb{N}^2 \rightarrow \mathbb{N} \) takiej, że:

\( h(0,m) = 0 \)

oraz:

\( h(n',m) = h(n,m) + m. \)

Funkcję \( h \) definiującą mnożenie oznaczamy w notacji infiksowej symbolem \( \cdot \) tak, że \( n\cdot m = h(n,m) \). Podobnie jak dla dodawania musimy wykazać własności dotyczące mnożenia liczb naturalnych, posługując się wyłącznie powyższą definicją.

Fakt 7.3.

Dla dowolnej liczby naturalnej \( k \) mamy \( k\cdot 1 = k \).

Dowód

Dowód tego faktu jest indukcją ze względu na \( k \). Jeśli \( k=0 \), to \( 0\cdot 1 = 0 \). Jeśli równość jest prawdą dla \( k \), to \( k'\cdot 1 = k\cdot 1 + 1 \), co, na mocy założenia indukcyjnego, jest równe \( k+1=k' \). Dowiedliśmy kroku indukcyjnego, a co za tym idzie całej identyczności.

Ćwiczenie 7.3

Wykaż, że dla dowolnych liczb naturalnych \( k,m \) i \( n \) zachodzi:

1. \( k\cdot (m+n) = k\cdot m +k\cdot n \) - dodawanie jest rozdzielne względem mnożenia z prawej strony,
2. \( (k+m)\cdot n = k\cdot n + m\cdot n \) - dodawanie jest rozdzielne względem mnożenia z lewej strony,
3. \( k\cdot(m\cdot n) = (k\cdot m)\cdot n \) - mnożenie jest łączne,
4. \( k\cdot 0 = 0, \)
5. \( k\cdot m = 0 \) wtedy i tylko wtedy, kiedy \( k=0\lor m=0, \)
6. \( k\cdot m = m\cdot k \) - mnożenie jest przemienne,
7. jeśli \( k\cdot n = m\cdot n \) i \( n\neq 0 \) to \( k=m \).







Ćwiczenie 7.4

Wykaż, że dla dowolnych liczb naturalnych \( k \) i \( n \).

1. jeśli \( n > 1 \) i \( k\neq 0 \), to \( k\cdot n > k \),
2. jeśli \( n\neq 0 \), to \( k\cdot n \geq k \).


Konstrukcje liczbowe, liczby całkowite, wymierne, konstrukcja Cantora liczb rzeczywistych: działania i porządek

Liczby całkowite

Liczby całkowite



W poprzednim wykładzie skonstruowaliśmy przy pomocy aksjomatu nieskończoności liczby naturalne. Określiliśmy dla nich podstawowe operacje, takie jak dodawanie i mnożenie. Teraz własności tych operacji będą użyte do dalszych konstrukcji liczbowych. Pokażemy, że mając liczby naturalne zbudowane na bazie liczby \( \displaystyle 0 \), czyli zbioru pustego, możemy definiować bardziej skomplikowane twory liczbowe takie, jak liczby całkowite, wymierne i w końcu liczby rzeczywiste. Wszystkie te obiekty mają ogromne zastosowanie w praktyce matematycznej i informatycznej. Będziemy później w innych wykładach odwoływać się do niebanalnej reprezentacji tych obiektów, które stworzymy w tym rozdziale.

Konstrukcja liczb całkowitych

Definicja 1.1.

Niech \( \displaystyle \approx \) będzie relacją określoną na \( \displaystyle \mathbb{N} \times \mathbb{N} \) następująco:

\( \displaystyle (n,k)\approx (p,q) \) wtw \( \displaystyle n+q = k+p. \)

Ćwiczenie 1.2

Relacja \( \displaystyle \approx \) jest relacją równoważności o polu \( \displaystyle \mathbb{N} \times \mathbb{N} \).

Ćwiczenie 1.3

Wykaż, że dla dowolnej pary \( \displaystyle (n,k)\in\mathbb{N}\times \mathbb{N} \) istnieje para \( \displaystyle (p,q)\in \mathbb{N}\times \mathbb{N} \) taka, że \( \displaystyle (n,k)\approx (p,q) \) oraz \( \displaystyle p=0 \) lub \( \displaystyle q=0 \).

Definicja 1.4.

Niech \( \displaystyle \mathbb{Z} = \mathbb{N} \times\mathbb{N} / \approx \)

Ćwiczenie1.5

Które z liczb całkowitych \( \displaystyle [(n,k)]_{\approx} \) są relacjami równoważności na \( \displaystyle \mathbb{N} \)?

Definicja 1.6.

Element zero \( \displaystyle 0 \in \mathbb{Z} \) to element \( \displaystyle [ (0,0) ]_{\approx} \).
Element przeciwny do danego: jeżeli \( \displaystyle x = [ (n,k) ]_{\approx} \), to przez \( \displaystyle -x = [ (k,n) ]_{\approx} \)

Dodawanie: \( \displaystyle [ (n,k) ]_{\approx} + [ (p,q) ]_{\approx} = [ (n+p,k+q) ]_{\approx} \).

Mnożenie: \( \displaystyle [ (n,k) ]_{\approx} \cdot [ (p,q) ]_{\approx} = [ (n \cdot p + k \cdot q \;,\; n \cdot q + k \cdot p ) ]_{\approx} \){Dla przejrzystości zapisu będziemy czasami pomijać znak \( \displaystyle \cdot \), pisząc \( \displaystyle xy \), zamiast \( \displaystyle x\cdot y \)}.

Odejmowanie: \( \displaystyle x-y = x+ (-y) \)

Proszę o zwrócenie uwagi na pewną kolizję oznaczeń. Po lewej stronie definicji (dodawania, mnożenia i odejmowania) używamy tych samych znaków działań co po stronie prawej. Jest to ewidentna kolizja oznaczeń, którą wykonujemy z pełną świadomością. W praktyce matematycznej i informatycznej przyjęło się używać te same znaki działań, wiedząc, że mają one zgoła inne znaczenie. Również element \( \displaystyle 0 \) będziemy oznaczać identycznie jak \( \displaystyle 0 \) w liczbach naturalnych, pomimo że jest to zupełnie inny zbiór. Pod koniec tej konstrukcji podamy naturalne włożenie (iniekcje wkładającą liczby naturalne w całkowite) takie, które zachowuje działania na liczbach, co upewni nas, że stosowanie tych samych oznaczeń nie grozi konfliktem.

Ćwiczenie 1.7

Pokazać, że działania na liczbach całkowitych są dobrze określone. To znaczy pokazać, że zbiory (klasy równoważności) będące wynikiem działań nie zależą od wyboru reprezentantów:


Ćwiczenie 1.8

Pokaż własności działań dodawania i mnożenia. Dla dowolnych liczb całkowitych \( \displaystyle x,y,z \) zachodzą równości:

  1. \( \displaystyle x+y = y+x \) (przemienność dodawania),
  2. \( \displaystyle x \cdot y = y \cdot x \) (przemienność mnożenia),
  3. \( \displaystyle x \cdot y = z \cdot y \) oraz \( \displaystyle y\neq 0 \) to \( \displaystyle x=z \) (prawo skracania),
  4. \( \displaystyle x \cdot(y+z) = x\cdot y + x\cdot z \) (rozdzielność).


Porządek liczb całkowitych

Definicja 1.9.

Liczba \( \displaystyle [ (n,k) ]_{\approx} \leq [ (p,q) ]_{\approx} \) zachodzi, gdy \( \displaystyle n+q \leq p+k \).

Ćwiczenie 1.10

Pokaż, że definicja porządku nie jest zależna od wyboru reprezentanta. <

Niech \( \displaystyle (n,k),(m,l),(p,q),(r,s) \) będą parami liczb naturalnych takimi, że \( \displaystyle (n,k)\approx (m,l) \) oraz \( \displaystyle (p,q)\approx (r,s) \). Załóżmy dodatkowo, że \( \displaystyle [(n,k)]_{\approx}\leq[(p,q)]_{\approx} \). Wykażemy, iż w takim przypadku również \( \displaystyle [(m,l)]_{\approx}\leq [(r,s)]_{\approx} \), czyli że porządek na liczbach całkowitych jest niezależny od wyboru reprezentantów dla klas równoważności. Skoro \( \displaystyle [(n,k)]_{\approx}\leq[(p,q)]_{\approx} \), to \( \displaystyle n+q \leq p+k \) i z wykładu o liczbach naturalnych wiemy, że istnieje liczba naturalna \( \displaystyle t \) taka, że \( \displaystyle n+q+t = p+k \). Równocześnie nasze założenia gwarantują, że \( \displaystyle n+l=k+m \) i \( \displaystyle p+s=q+r \), czyli że:

\( \displaystyle n+l+q+r = k+m+p+s. \)

Korzystając z udowodnionej własności \( \displaystyle t \) podstawiamy liczby do wzoru, otrzymując:

\( \displaystyle n+l+q+r=n+m+q+t+s, \)

co z kolei możemy skrócić przez \( \displaystyle n+q \), otrzymując:

\( \displaystyle l+r = m+s+t \text{ co oznacza } l+r\geq m+s. \)

Czyli \( \displaystyle [(m,l)]_{\approx}\leq[(r,s)]_{\approx} \), co należało wykazać.

Ćwiczenie 1.11

Pokaż, że porządek liczb całkowitych spełnia postulaty porządku liniowego, to znaczy jest zwrotny, antysymetryczny, przechodni i spójny.


Definicja 1.12.

Rozważmy funkcje \( \displaystyle i:\mathbb{N} arrow \mathbb{Z} \) zadaną wzorem:

\( \displaystyle i(n) = [ (n,0)]_{\approx}. \)

Funkcja ta jest naturalnym włożeniem zbioru \( \displaystyle \mathbb{N} \) w zbiór \( \displaystyle \mathbb{Z} \). Jako ćwiczenie pokażemy, że funkcja \( \displaystyle i \) jest iniektywna i zgodna z działaniami. Dzięki włożeniu \( \displaystyle i \) będziemy utożsamiali liczbę naturalną \( \displaystyle n \) z odpowiadającą jej liczbą całkowitą \( \displaystyle i(n) \). W ten sposób każdą liczbę naturalną możemy traktować jak całkowitą.

Ćwiczenie 1.13

Pokaż, że funkcja \( \displaystyle i \) jest iniekcją. Pokaż, że \( \displaystyle i \) jest zgodne z działaniami i porządkiem, to znaczy:

  1. \( \displaystyle i(0) =0 \),
  2. \( \displaystyle i(n+m) = i(n)+i(m) \),
  3. \( \displaystyle i(n \cdot m) = i(n) \cdot i(m) \),
  4. jeżeli \( \displaystyle n \leq k \), to \( \displaystyle i(n) \leq i(k) \).


Liczby wymierne

Liczby wymierne



Niech \( \displaystyle \mathbb{Z}^* = \mathbb{Z} \setminus \{\emptyset\} \). Określamy relację \( \displaystyle \sim \) na zbiorze \( \displaystyle \mathbb{Z} \times \mathbb{Z}^* \) następująco:

\( \displaystyle (a,b) \sim (c,d) \) wtw \( \displaystyle a \cdot d = c \cdot b. \)

Ćwiczenie 2.1

Relacja \( \displaystyle \sim \) jest równoważnością.


Definicja 2.2.

Niech \( \displaystyle \mathbb{Q} = \mathbb{Z} \times\mathbb{Z}^* / \sim. \)

OZNACZENIE: Będziemy tradycyjne oznaczać ułamek \( \displaystyle \frac{a}{b} \). Oznacza on zbiór \( \displaystyle [ (a,b) ]_{\sim} \).

Ćwiczenie 2.3

Dla jakich liczb wymiernych \( \displaystyle [(a,b)]_{\sim} \) mamy \( \displaystyle \bigcup\bigcup [(a,b)]_{\sim} = \mathbb{Z} \)?

Działania na ułamkach

Definiujemy stałe i standardowe działania na ułamkach.

  • Zero w liczbach wymiernych \( \displaystyle 0 \in \mathbb{Q} \) to \( \displaystyle [(0, 1) ]_{\sim} \).
  • Jedynka w liczbach wymiernych \( \displaystyle 1 \in \mathbb{Q} \) to ułamek \( \displaystyle [(1, 1) ]_{\sim} \).
  • \( \displaystyle - [ (a,b) ]_{\sim} = [(-a, b) ]_{\sim}. \)
  • Dodawanie \( \displaystyle [ (a,b) ]_{\sim} + [ (c,d) ]_{\sim} = [(ad +bc, bd) ]_{\sim} \).
  • Odejmowanie \( \displaystyle [ (a,b) ]_{\sim} - [ (c,d) ]_{\sim} = [(ad - bc, bd)]_{\sim} \).
  • Mnożenie \( \displaystyle [ (a,b) ]_{\sim} \cdot [ (c,d) ]_{\sim} = [(ac, bd) ]_{\sim} \).
  • Dzielenie, \( \displaystyle [ (a,b) ]_{\sim} : [ (c,d) ]_{\sim} = [(ad, bc) ]_{\sim} \) gdy \( \displaystyle [ (c,d) ]_{\sim} \neq [(0, d) ]_{\sim} \).

Tak jak poprzednio w przypadku liczb całkowitych będziemy starali się utożsamiać liczby całkowite z pewnymi ułamkami.

Proszę tak jak poprzednio o zwrócenie uwagi na kolizję oznaczeń. Jest to zamierzona kolizja oznaczeń, którą wprowadzamy z pełną świadomością. Po lewej stronie definicji (dodawania, mnożenia, odejmowania i liczby przeciwnej) używamy tych samych znaków działań co po stronie prawej. Pod koniec tej konstrukcji podamy naturalne włożenie (iniekcje wkładającą liczby całkowite w wymierne) takie, które zachowuje działania na liczbach. Upewni nas to, że stosowanie tych samych oznaczeń de facto nie grozi konfliktem.

Ćwiczenie 2.4

Pokazać, że działania na liczbach wymiernych są dobrze określone. To znaczy pokazać, że zbiory (klasy równoważności) będące wynikiem działań nie zależą od wyboru reprezentantów:


Porządek ułamków.

Definicja 2.5.

\( \displaystyle \frac{a}{b} \geq \frac{c}{d} \), gdy \( \displaystyle (a\cdot d - b \cdot c) \cdot b \cdot d \geq 0. \)

Ćwiczenie 2.6

Pokaż, że definicja porządku nie jest zależna od wyboru reprezentanta.


Ćwiczenie 2.7

Pokaż, że porządek liczb wymiernych spełnia postulaty porządku liniowego, to znaczy jest zwrotny, antysymetryczny, przechodni i spójny.


Do rozważań nad konstrukcją liczb rzeczywistych potrzebna nam będzie definicja wartości bezwzględnej

Definicja 2.8.

\( \displaystyle | x |\ = \left\{ \begin{array}{rll} x, & \text{ gdy } x\geq 0, \\ -x, & \text{ w przeciwnym przypadku}. \end{array}\right. \)

Ćwiczenie 2.9

Pokaż warunek trójkąta, czyli:

\( \displaystyle | x+y | \leq | x | + | y |. \)


Definicja 2.10.

Rozważmy teraz funkcje \( \displaystyle j:\mathbb{Z} arrow \mathbb{Q} \) identyfikującą liczby całkowite jako pewne specjalne liczby wymierne zadaną wzorem:

\( \displaystyle j(a) = [ (a,1)]_{\sim}. \)

Funkcja ta jest naturalnym włożeniem zbioru \( \displaystyle \mathbb{Z} \) w zbiór \( \displaystyle \mathbb{Q} \). Jest iniektywna, zgodna z działaniami i zachowująca stałe. Pokazanie tych własności będzie treścią następnego ćwiczenia.

Ćwiczenie 2.11

Pokaż własności włożenia \( \displaystyle j \):

  1. \( \displaystyle j(0) = 0 \),
  2. \( \displaystyle j(1)=1 \),
  3. \( \displaystyle j(a+b) = j(a)+j(b) \),
  4. \( \displaystyle j(a-b) = j(a)-j(b) \),
  5. \( \displaystyle j(a \cdot b) = j(a) \cdot j(b) \),
  6. jeżeli \( \displaystyle x \leq y \), to \( \displaystyle j(x) \leq j(y) \).


Dzięki włożeniu \( \displaystyle j \) będziemy utożsamiali liczbę całkowitą \( \displaystyle a \) z odpowiadającą jej liczbą wymierną \( \displaystyle j(a) = [ (a,1)]_{\sim} \).

Konstrukcja Cantora liczb rzeczywistych

Konstrukcja Cantora liczb rzeczywistych



Definicja 3.1.

Ciągiem elementów zbioru \( \displaystyle A \) nazywamy każdą funkcje \( \displaystyle a: \mathbb{N} \rightarrow A \). Przez \( \displaystyle a_n \) oznaczamy element ciągu \( \displaystyle a(n) \).

Konstrukcja liczb rzeczywistych pochodzi od Georga Cantora. Genialny pomysł Georga Cantora polega na rozważaniu nieskończonych ciągów liczb wymiernych spełniających warunek Augustina Louis Cauchy'ego. Wiemy z analizy (patrz wykład Szeregi liczbowe), że ciągi takie są zbieżne. Dlatego ciąg ten można uważać za aproksymacje liczby rzeczywistej. Będziemy za liczbę rzeczywistą brać wszystkie takie ciągi aproksymacji, które w sensie poniższych definicji będą dowolnie bliskie siebie.

Definicja 3.2.

Ciągiem Cauchy'ego zbioru liczb wymiernych \( \displaystyle \mathbb{Q} \) nazywamy każdy taki ciąg \( \displaystyle a: \mathbb{N} \rightarrow \mathbb{Q} \) który spełnia warunek (Cauchy'ego):

\( \displaystyle \forall_{\varepsilon \in \mathbb{Q} \hspace{0.1mm} \wedge \varepsilon >0} \;\; \exists_{n_0 \in \mathbb{N}} \;\; \forall_{p,k \in \mathbb{N}} \;\; ( p>n_0 \wedge k >n_0 \hspace{0.1mm} \Rightarrow | a_p - a_k | < \varepsilon ) \)

Definicja 3.3.

Ciąg \( \displaystyle a: \mathbb{N} \rightarrow \mathbb{Q} \) nazywamy ograniczonym, gdy spełnia:

\( \displaystyle \exists_{M>0} \;\; \forall_{n \in \mathbb{N}} \;\; | a_n | < M \)

Fakt 1

Ciągi Cauchy'ego są ograniczone.

Dowód

Do ciągu Cauchy'ego \( \displaystyle a \) będziemy dobierać ograniczenie \( \displaystyle M \). Weźmy dodatnią liczbę wymierną \( \displaystyle \varepsilon \). Dla niej, zgodnie z Definicją 3.2, znajdziemy tak duże \( \displaystyle n_0 \), że dla wszystkich liczb naturalnych \( \displaystyle p,k \), poczynając od \( \displaystyle n_0 +1 \) będzie zachodzić: \( \displaystyle | a_p - a_k | < \varepsilon \). Połóżmy za \( \displaystyle M \) największą z pośród liczb \( \displaystyle | a_0 | ,\ldots | a_{n_0} | \) oraz \( \displaystyle | a_{n_0 +1} | + \varepsilon \) powiększoną o \( \displaystyle 1 \). Łatwo sprawdzić, że tak zdefiniowane \( \displaystyle M \) majoryzuje moduły wszystkich liczb ciągu.

Poniżej wprowadzimy relacje równoważności na zborze ciągów Cauchy'ego, taką która skleja ciągi, które leżą dowolnie blisko. Każdy taki ciąg będzie inną aproksymacją tej samej liczby rzeczywistej. Zbiór wszystkich takich aproksymacji będzie dla nas właśnie liczbą rzeczywistą.

Definicja 3.4.

Niech \( \displaystyle X=\{ a: \mathbb{N} \rightarrow \mathbb{Q} : a \) jest ciągiem Cauchy'ego \( \displaystyle \} \).

Definicja 3.5.

Na zbiorze \( \displaystyle X \) ciągów Cauchy'ego określamy relację następująco: dwa ciągi \( \displaystyle a \) i \( \displaystyle b \) są równoważne, co zapisujemy jako \( \displaystyle a \simeq b \), gdy:

\( \displaystyle \forall_{\varepsilon >0} \;\; \exists_{n_0 \in \mathbb{N}} \;\; \forall_{n \in \mathbb{N}} \;\; ( n>n_0 \hspace{0.1mm} \Rightarrow | a_n - b_n | < \varepsilon ). \)

Twierdzenie 3.6.

Relacja \( \displaystyle \simeq \) określona na \( \displaystyle X \) jest relacją równoważności.

Dowód

Zwrotność i symetria relacji \( \displaystyle \simeq \) są oczywiste. Zajmijmy się dowodem przechodniości. Niech \( \displaystyle a \simeq b \) oraz \( \displaystyle b\simeq c \). Oznacza to:

\( \displaystyle \begin{align*} \forall_{\varepsilon >0} \;\; \exists_{n_1 \in \mathbb{N}} \;\; \forall_{n \in \mathbb{N}} \;\; ( n>n_1 \hspace{0.1mm} \Rightarrow | a_n - b_n | < \varepsilon ) \quad \mbox{(3.1)} \\ \forall_{\varepsilon >0} \;\; \exists_{n_2 \in \mathbb{N}} \;\; \forall_{n \in \mathbb{N}} \;\; ( n>n_0 \hspace{0.1mm} \Rightarrow | b_n - c_n | < \varepsilon ) \quad \mbox{(3.2)} \end{align*} \)

Weźmy \( \displaystyle \varepsilon >0 \). Będziemy dobierać niezależnie liczby \( \displaystyle n_1 \) i \( \displaystyle n_2 \) do \( \displaystyle \varepsilon /2 \) dla pierwszej i drugiej pary ciągów. Mamy zatem parę nierówności: dla \( \displaystyle n>n_1 \) zachodzi \( \displaystyle | a_n - b_n | < \varepsilon/2 \) oraz dla \( \displaystyle n>n_2 \) zachodzi \( \displaystyle | b_n - c_n | < \varepsilon/2 \). Biorąc większą z tych dwóch liczb, będziemy oczywiście jednocześnie spełniać obie nierówności. Zatem dla \( \displaystyle n>\max(n_1 , n_2) \) zachodzą \( \displaystyle | a_n - b_n | < \varepsilon/2 \) oraz \( \displaystyle | b_n - c_n | < \varepsilon/2 \). Używając nierówności trójkąta, mamy:

\( \displaystyle | a_n - c_n | \leq | a_n - b_n | + | b_n - c_n | < \varepsilon/2 + \varepsilon/2 = \varepsilon, \)

co kończy dowód.

Definicja 3.7.

Przez liczby rzeczywiste będziemy rozumieli zbiór \( \displaystyle X/\simeq \) i oznaczamy przez \( \displaystyle \mathbb{R} \).

Liczbą rzeczywistą jest zatem zbiór ciągów Cauchy'ego, które leżą dowolnie blisko siebie. Na każdy taki ciąg można patrzeć jak na pewną aproksymację danej liczby rzeczywistej.

Ćwiczenie 3.8

Ile razy należy poprzedzić znakiem \( \displaystyle \bigcup \) zbiór \( \displaystyle \mathbb{R} \), aby otrzymać \( \displaystyle \mathbb{N} \)?

Działania na \( \displaystyle \mathbb{R} \)

Definicja 3.9.

Dla ciągów \( \displaystyle a \) i \( \displaystyle b \) ciąg \( \displaystyle a+ b \) oraz \( \displaystyle a \cdot b \) oznaczają ciągi zadane jako \( \displaystyle (a +b)(i) = a(i) + b(i) \), dla każdego \( \displaystyle i \). Tak samo definiujemy mnożenie: \( \displaystyle (a \cdot b)(i) = a(i) \cdot b(i) \).

Definicja 3.10.

Dodawanie i mnożenie ciągów liczb wymiernych definiujemy po współrzędnych, to znaczy:

  • dodawanie \( \displaystyle [ a ]_{\simeq} + [b]_{\simeq} = [a+b]_{\simeq} \),
  • mnożenie \( \displaystyle [ a ]_{\simeq} \cdot [b]_{\simeq} = [a \cdot b]_{\simeq} \).

Ćwiczenie 3.11

Poniższe ćwiczenie odpowiada dowodowi ciągłości dodawania i mnożenia. W innej wersji będziecie państwo zapoznawać się z tym zagadnieniem na wykładzie 8 analizy matematycznej "Granica i ciągłość funkcji". Pokazać, że definicja dodawania i mnożenia liczb rzeczywistych jest poprawna i niezależna od wyboru reprezentantów:


Porządek na \( \displaystyle \mathbb {R} \)

Definicja 3.12.

Relacja \( \displaystyle [ a ]_{\simeq} < [b]_{\simeq} \) na zbiorze liczb rzeczywistych \( \displaystyle \mathbb{R} \) jest zdefiniowana jako:

\( \displaystyle \exists_{\varepsilon > 0} \;\; \exists_{n_0 \in \mathbb{N}} \;\; \forall_{k>n_0} \;\; a_k +\varepsilon < b_k. \)

Będziemy mówili, że liczba wymierna \( \displaystyle \varepsilon > 0 \) rozdziela dwa ciągi Cauchy'ego, poczynając od elementu \( \displaystyle a_{n_0 +1} \).

Definicja 3.13.

Słaby porządek definiujemy tak jak zazwyczaj: dla liczb rzeczywistych \( \displaystyle x \leq y \), gdy \( \displaystyle x < y \) (patrz definicja 3.12.) lub gdy \( \displaystyle x=y \) (patrz Definicja 3.5).

Twierdzenie 3.14.

Porządek na \( \displaystyle \mathbb{R} \) jest liniowy.

Dowód

Pokażemy, że dla dowolnych ciągów Cauchy'ego \( \displaystyle a \) i \( \displaystyle b \), jeżeli \( \displaystyle [ a ]_{\simeq} \neq [b]_{\simeq} \) to \( \displaystyle [ a ]_{\simeq} < [b]_{\simeq} \) lub \( \displaystyle [ a ]_{\simeq} > [b]_{\simeq} \). Niech zatem \( \displaystyle [ a ]_{\simeq} \neq [b]_{\simeq} \). Zgodnie z definicją \( \displaystyle \simeq \) oznacza to:

\( \displaystyle \exists_{\varepsilon>0} \;\; \forall_{n\in\mathbb{N}} \;\; \exists_{p\in\mathbb{N}} \;\; p>n \hspace{0.1mm} \wedge | a_p -b_p | \geq \varepsilon. \)

Dobierzmy do \( \displaystyle \varepsilon/3 \) liczby \( \displaystyle n_a \) i \( \displaystyle n_b \) odpowiednio dla ciągów \( \displaystyle a \) i \( \displaystyle b \) tak, aby dla wszystkich \( \displaystyle k,r > \max(n_a ,n_b) \) zachodziło \( \displaystyle | a_k - a_r | < \varepsilon/3 \) oraz \( \displaystyle | b_k - b_r | < \varepsilon/3 \). Zgodnie z formulą powyżej dla \( \displaystyle \max(n_a ,n_b) \) musi istnieć \( \displaystyle p_0 > \max(n_a ,n_b) \) takie, że \( \displaystyle | a_{p_0} -b_{p_0} | \geq \varepsilon \). Ustalmy, że to \( \displaystyle a_{p_0} < b_{p_0} \) (gdy będzie odwrotnie rozumowania jest identyczne). Weźmy zatem dowolne \( \displaystyle k>p_0 \). Zachodzą następujące nierówności:

\( \displaystyle \begin{align*} a_{p_0} + \varepsilon & \leq b_{p_0}, \quad \mbox{(3.3)} \\ a_k - \varepsilon/3 & < a_{p_0} < a_k + \varepsilon/3, \quad \mbox{(3.4)} \\ b_k - \varepsilon/3 & < b_{p_0} < b_k + \varepsilon/3, \quad \mbox{(3.5)} \end{align*} \)

Łatwo pokazać, stosując powyższe nierówności, że poczynając od \( \displaystyle p_0 \) liczba wymierna \( \displaystyle \varepsilon/3 \), będzie rozdzielała obydwa ciągi Cauchy'ego. Mianowicie:

\( \displaystyle a_k + \varepsilon/3 < a_{p_0} + 2 \varepsilon/3 \leq b_{p_0} - \varepsilon/3 < b_{p_0}. \)

Włożenie \( \displaystyle \mathbb{Q} \) w \( \displaystyle \mathbb{R} \)

Rozważmy funkcje \( \displaystyle k:\mathbb{Q} \rightarrow \mathbb{R} \) zadaną następująco: dla liczby wymiernej \( \displaystyle q\in \mathbb{Q} \) liczba rzeczywista \( \displaystyle k(q) \) jest klasą równoważności ciągu stale równego \( \displaystyle q \), czyli \( \displaystyle k(q) = [b]_{\simeq} \), gdzie \( \displaystyle b(n) = q \). Tak więc liczby wymierne stają się częścią liczb rzeczywistych. Funkcja \( \displaystyle k \) jest naturalnym włożeniem zbioru \( \displaystyle \mathbb{Q} \) w zbiór \( \displaystyle \mathbb{R} \). Jest ona iniektywna i zgodna z działaniami i porządkiem:

  1. \( \displaystyle k(a+b) = k(a)+k(b) \),
  2. \( \displaystyle k(a-b) = k(a)-k(b) \),
  3. \( \displaystyle k(a \cdot b) = k(a) \cdot k(b) \),
  4. jeżeli \( \displaystyle a < b \), to \( \displaystyle k(a) < k(b) \).

Dzięki włożeniu \( \displaystyle k \) będziemy utożsamiali liczbę wymierną \( \displaystyle q \) z odpowiadającą jej liczbą rzeczywistą \( \displaystyle k(q) \).

Rozwijanie liczb rzeczywistych przy podstawie \( \displaystyle 2 \)

Twierdzenie 3.15.

Dla każdej liczby rzeczywistej \( \displaystyle 0\leq x < 1 \) istnieje ciąg \( \displaystyle a_x \in 2^{\mathbb{N}} \) taki, że ciąg jego sum częściowych \( \displaystyle b_x: \mathbb{N} \rightarrow
\mathbb{Q} \), dany jako \( \displaystyle b_k = \sum_{i=0}^{k} \frac{a_i}{2^{i+1}} \), spełnia:

  1. \( \displaystyle b_x \) jest ciągiem Cauchy'ego,
  2. \( \displaystyle [ b_x ]_{\simeq} = x \).

Taki ciąg \( \displaystyle a_x \) nazywamy rozwinięciem liczby \( \displaystyle x \) przy podstawie \( \displaystyle 2 \).

Dowód

Dla liczby rzeczywistej \( \displaystyle x \) podamy indukcyjną konstrukcję ciągu \( \displaystyle a \) będącego rozwinięciem dwójkowym liczby \( \displaystyle x \) i równolegle ciągu \( \displaystyle b \) jego sum częściowych. Jeżeli \( \displaystyle 0 \leq x < 1/2 \), to definiujemy \( \displaystyle a_0 = 0 \), w przeciwnym wypadku, to znaczy kiedy \( \displaystyle 1/2 \leq x < 1 \), definiujemy \( \displaystyle a_0 =1 \). Załóżmy, że mamy zdefiniowany ciąg \( \displaystyle a \) do wyrazu \( \displaystyle k \). Wyraz \( \displaystyle k+1 \) definiujemy:

  1. \( \displaystyle a_{k+1} = 1, \) jeżeli \( \displaystyle \sum_{i=0}^{k} \frac{a_i}{2^{i+1}} + \frac{1}{2^{k+2}} \leq x \),
  2. \( \displaystyle a_{k+1} = 0, \) jeżeli \( \displaystyle \sum_{i=0}^{k} \frac{a_i}{2^{i+1} }+ \frac{1}{2^{k+2}} > x \).

Ciąg \( \displaystyle b \) definiujemy tak jak w tezie twierdzenia, to znaczy \( \displaystyle b_k = \sum_{i=0}^{k} \frac{a_i}{2^{i+1}} \).

Pokażemy indukcyjnie, że dla każdego \( \displaystyle k \) zachodzi:

\( \displaystyle \sum_{i=0}^{k} \frac{a_i}{2^{i+1}} \leq x \leq \sum_{i=0}^{k} \frac{a_i}{2^{i+1}} + \frac{1}{2^{k+1}}. \quad \mbox{(3.6)} \)

Dowód tego faktu pozostawimy jako Ćwiczenie 3.16. Z powyższej nierówności mamy pierwszy fakt, a mianowicie: ciąg sum częściowych \( \displaystyle b \) jest ciągiem Cauchy'ego.

Ćwiczenie 3.16

Uzupełnij dowód indukcyjny nierówności 3.6 pierwszej części tezy Twierdzenia 3.15. Wykonaj dowód drugiej części tezy Twierdzenia 3.15. poprzedzającego to ćwiczenie.

Konstrukcja przedstawiona powyżej rozwija liczbę rzeczywistą z przedziału \( \displaystyle [0,1) \) przy podstawie \( \displaystyle 2 \). Na każdym etapie konstrukcji sprawdzamy, czy w przedziale, w którym pracujemy aktualnie, liczba znajduje się w lewej czy też prawej połówce przedziału. Stosownie do tego wybieramy cyfrę \( \displaystyle 0 \) lub \( \displaystyle 1 \) rozwinięcia. Jak łatwo można przypuścić podobną konstrukcję jak w Twierdzeniu 3.15 można wykonać przy dowolnej innej podstawie \( \displaystyle k\geq 2 \). W takim wypadku aktualny analizowany przedział dzielilibyśmy na \( \displaystyle k \) podprzedziałów i stosownie do położenia liczby wybieralibyśmy jedną z \( \displaystyle k \) cyfr ze zbioru \( \displaystyle \{0,\ldots k-1\} \). Przykładowo, gdy za \( \displaystyle k \) wybierzemy \( \displaystyle k=10 \), dostaniemy przy pomocy takiej konstrukcji rozwinięcie dziesiętne danej liczby rzeczywistej.

Twierdzenie poniżej upewni nas o pewnej ciekawej własności rozwinięć. Otóż rozwinięcie przy podstawie \( \displaystyle k=2 \) otrzymane przy pomocy Twierdzenia 3.15 zawsze jest takie, że zera w tym rozwinięciu występują dowolnie daleko. Innymi słowy, nie jest możliwe, aby w rozwinięciu od pewnego miejsca występowały same jedynki. W przykładzie dotyczącym rozwinięcia dziesiętnego liczby odpowiada to sytuacji, w której nie występują ciągi, które stale od pewnego miejsca mają cyfrę \( \displaystyle 9 \). <

Twierdzenie 3.17.

Rozwinięcia \( \displaystyle a \) uzyskane przy pomocy konstrukcji twierdzenia 3.15 dla liczby \( \displaystyle 0\leq x < 1 \) jest zawsze takie, że:

\( \displaystyle \forall_{k} \;\; \exists_{n>k} \;\; a_n = 0. \)

Dowód

Przypuśćmy, że jest przeciwnie, niż mówi teza, czyli \( \displaystyle \exists_{k} \;\; \forall_{n>k} \;\; a_n = 0 \). Weźmy najmniejsze takie \( \displaystyle k \) i nazwijmy \( \displaystyle k_0 \). Mamy zatem \( \displaystyle a_{k_0} = 0 \) oraz wszystkie późniejsze wyrazy \( \displaystyle a_i =1 \) dla \( \displaystyle i>k_0 \). Rozwijana liczba \( \displaystyle x \) spełniać będzie dla każdego \( \displaystyle p\geq 1 \) nierówność 3.6, czyli zachodzić będzie:

\( \displaystyle b_{k_0 -1} + \frac{1}{2^{k_0 +2}} + \ldots +\frac{1}{2^{k_0 +p+1}} \leq x \leq b_{k_0 -1} + \frac{1}{2^{k_0 +2}} + \ldots +\frac{1}{2^{k_0+ p+1}} + \;\; \frac{1}{2^{k_0 p+ 1}}. \)

Liczbą, która spełnia wszystkie te nierówności jest: \( \displaystyle b_{k_0 -1} + \frac{1}{2^{k_0 +1}} \). Mamy zatem zamiast rozwinięcia, które nieformalnie zapiszemy jako \( \displaystyle a_0 \ldots a_{k_0 -1} 0 1 1 1 \ldots \) rozwinięcie \( \displaystyle a_0 \ldots a_{k_0 -1} 1 0 0 0 \ldots \). To właśnie to drugie rozwinięcie zostanie znalezione przez procedurę rekurencyjną przedstawioną w Twierdzeniu 3.15

Twierdzenie 3.18.

Istnieje bijekcja pomiędzy odcinkiem \( \displaystyle [0;1) \) a zbiorem \( \displaystyle \{a\in 2^{\mathbb{N}}: \forall_{k} \;\; \exists_{n>k} \;\; a_n = 0\} \)

Dowód

Bijekcja jest zdefiniowana przy pomocy techniki wprowadzonej w Twierdzeniu 3.15. Istnienie funkcji przypisującej liczbie rzeczywistej \( \displaystyle x \) jej rozwinięcie dwójkowe zostało tam opisane. Własność tego rozwinięcia \( \displaystyle \forall_{k} \;\; \exists_{n>k} \;\; a_n = 0 \) została pokazana w Twierdzeniu 3.17. Pozostaje uzasadnić iniektywność takiego przypisania. Niech \( \displaystyle x \neq y \). Załóżmy, że \( \displaystyle x < y \). Rozważmy zatem ciągi \( \displaystyle a \) oraz \( \displaystyle a' \) rozwinięć dwójkowych \( \displaystyle x \) i \( \displaystyle y \). Nazwijmy ciągi ich sum częściowych, odpowiednio przez \( \displaystyle b \) i \( \displaystyle b' \). Ciągi sum wyznaczają te liczby, czyli \( \displaystyle [ b ]_{\simeq} = x , [b']_{\simeq} = y \). Ciągi \( \displaystyle b \) i \( \displaystyle b' \) muszą być różne, bo inaczej wyznaczałyby te same liczby. W takim razie ciągi rozwinięć \( \displaystyle a \) i \( \displaystyle a' \) muszą być różne.

Powyższe twierdzenie będzie miało fundamentalne znaczenie w teorii mocy, o którym mowa będzie w wykładzie "Teoria mocy twierdzenie Cantora-Bernsteina, twierdzenie Cantora. Zbiory przeliczalne, zbiory mocy kontinuum". Pokazuje bowiem, że liczby rzeczywiste są równoliczne ze zbiorem \( \displaystyle 2^\mathbb{N} \).

Teoria mocy twierdzenie Cantora-Bernsteina, twierdzenie Cantora. Zbiory przeliczalne, zbiory mocy kontinuum

Teoria mocy

Teoria mocy


Zadaniem teorii mocy, do której wstęp znajdą państwo w tym wykładzie, będzie uogólnienie pojęcia ilości elementów zbioru. Dla zbiorów skończonych powołaliśmy do życia liczby naturalne wykład "Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje", przy pomocy których możemy rachować i opisywać ilościowe własności innych zbiorów. Niestety to nam nie wystarcza. Są zbiory, których liczbę elementów nie sposób opisać żadną liczbą naturalną. Zgodziliśmy się wszak, przyjmując aksjomat nieskończoności, na istnienie takich niezwykłych zbiorów . Aksjomat ten wraz z innymi, na przykład, aksjomatem zbioru potęgowego, będzie miał dla nas wiele niespodzianek. Powołamy do życia zbiory nieskończone, a co więcej pokażemy, że istnieją różne rodzaje nieskończoności. Jedne zbiory nieskończone będą bardziej nieskończone od innych. Aby umieć porównywać liczby elementów zbiorów nieskończonych, wprowadzimy podstawowe definicje. Z punktu widzenia tych definicji na całą teorię mocy można patrzeć jak na teorie bijekcji i iniekcji (lub dualnie surjekcji - patrz wykład "Zbiory dobrze uporządkowane. Lemat Kuratowskiego Zorna i twierdzenie Zermelo, przykłady").

Definicja 1.1

Zbiory \( \displaystyle A \) i \( \displaystyle B \) nazywamy równolicznymi, gdy istnieje bijekcja \( \displaystyle f:A \rightarrow B \). Równoliczność zbiorów oznaczamy przez \( \displaystyle A \sim_m B \).

\( \displaystyle \sim_m \) ma podobne własności do relacji równoważności.

Twierdzenie 1.2

Równoliczność ma własności:

  1. \( \displaystyle A \sim_m A \).
  2. jeżeli \( \displaystyle A \sim_m B \), to \( \displaystyle B \sim_m A \).
  3. jeżeli \( \displaystyle A \sim_m B \) i \( \displaystyle B \sim_m C \), to \( \displaystyle A \sim_m C \).

Trywialne dowody tych faktów pozostawimy jako ćwiczenia.

Ćwiczenie 1.3

Udowodnij własności 1, 2, 3. z Twierdzenia 1.2.

Twierdzenie 1.4

Podstawowe własności relacji równoliczności:

  1. \( \displaystyle A \sim_m B \) i \( \displaystyle C \sim_m D \) oraz \( \displaystyle A \cap C = B \cap D = \emptyset \), to \( \displaystyle A \cup C \sim_m B \cup D \).
  2. \( \displaystyle A \sim_m B \) i \( \displaystyle C \sim_m D \), to \( \displaystyle A^C \sim_m B^D \).
  3. \( \displaystyle (A^B)^C \sim_m A^{ B \times C} \).
  4. \( \displaystyle (A \times B)^C \sim_m A^C \times B^C \).
  5. Gdy \( \displaystyle B \cap C = \emptyset \), to \( \displaystyle A^{B \cup C} \sim_m A^B \times A^C \).
  6. \( \displaystyle P(A) \sim_m 2^A \).

Znowu dowody twierdzeń z 1.4 podamy jako ćwiczenia.

Ćwiczenie 1.5

Dowiedź Twierdzenia 1.4.


Definicja 1.6

Zbiór \( \displaystyle A \) nazywamy skończonym, gdy \( \displaystyle A \sim_m n \), dla pewnej liczby naturalnej \( \displaystyle n \).

Zbiór \( \displaystyle A \) nazywamy nieskończonym, gdy \( \displaystyle A \) nie jest skończony.

Jako zadania podamy dwa następujące proste fakty:

Ćwiczenie 1.7

Podzbiór zbioru skończonego jest skończony. Obraz przez funkcje zbioru skończonego jest skończony.


Podamy twierdzenie, podobne do twierdzenia, które zobaczą państwo w wykładzie 11 "Zbiory dobrze uporządkowane. Lemat Kuratowskiego Zorna i twierdzenie Zermelo, przykłady" Twierdzenie 4.1. Wersja ogólniejsza będzie dotyczyła sytuacji, kiedy zbiór \( \displaystyle N_0 \) jest nieskończony, ale niekoniecznie jest podzbiorem \( \displaystyle \mathbb{N} \). W takim wypadku do dowodu tego twierdzenia będzie potrzebny aksjomat wyboru. W uproszczonej wersji, która podana jest poniżej, aksjomat ten nie będzie nam potrzebny.

Twierdzenie 1.8

Jeżeli \( \displaystyle N_0 \) jest nieskończonym podzbiorem \( \displaystyle \mathbb{N} \), to \( \displaystyle N_0 \sim_m \mathbb{N} \).

Dowód

Przy pomocy definiowania przez indukcję (patrz wykład 7 "Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje" Twierdzenie 6.1), zbudujmy bijekcję \( \displaystyle h \) pomiędzy zbiorem \( \displaystyle \mathbb{N} \) a \( \displaystyle N_0 \). Zbiór \( \displaystyle N_0 \) będąc nieskończonym jest niepusty, więc z zasady minimum (patrz wykład 7: "Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje" Twierdzenie 5.2) posiada element najmniejszy. Niech:

\( \displaystyle h(0) = \) najmniejszy element w \( \displaystyle N_0 , \)

\( \displaystyle h(n') = \) najmniejszy element, który w \( \displaystyle N_0 \) jest istotnie większy niż \( \displaystyle h(n)\displaystyle \).

Łatwo zauważyć, że dla obraz, dowolnej liczby naturalnej \( \displaystyle \overrightarrow{h} (n) \) jest odcinkiem początkowym \( \displaystyle N_0 \). Równocześnie, na mocy poprzedniego ćwiczenia, wiemy, że obraz ten jest skończony. Ponieważ zbiór \( \displaystyle N_0 \) jest nieskończony, więc zawsze istnieją w nim elementy poza \( \displaystyle \overrightarrow{h} (n) \). Elementy te muszą być większe od \( \displaystyle h(n) \), co gwarantuje, że funkcja \( \displaystyle h \) jest zdefiniowana dla całego \( \displaystyle \mathbb{N} \). Funkcja \( \displaystyle h \) jest oczywiście iniekcją, ponieważ dla \( \displaystyle n < m \) mamy \( \displaystyle h(n) < h(m) \). Funkcja \( \displaystyle h \) jest bijekcją, ponieważ łatwo możemy pokazać, że jeśli \( \displaystyle n\in N_0 \), to \( \displaystyle n\in\overrightarrow{h} (n') \).

Zbiory przeliczalne

Zbiory przeliczalne



Podamy poniżej dwie równoważne, jak się okaże, definicje przeliczalności.

Definicja 2.1

Zbiór \( \displaystyle X \) jest przeliczalny, gdy \( \displaystyle X \sim_m N_0 \), dla pewnego \( \displaystyle N_0 \subset \mathbb{N} \).

Definicja 2.2

Zbiór \( \displaystyle X \) daje się ustawić w ciąg, gdy istnieje surjekcja \( \displaystyle f: \mathbb{N} \rightarrow X \).

Twierdzenie 2.3

Niepusty zbiór \( \displaystyle X \) daje się ustawić w ciąg wtedy i tylko wtedy, gdy jest przeliczalny.

Dowód

Jeśli \( \displaystyle X \) jest przeliczalny przy bijekcji \( \displaystyle f: N_0 \rightarrow X \), to niewątpliwie daje się ustawić w ciąg - uzupełniamy bijekcje jednym elementem wyjętym z niepustego \( \displaystyle X \). Jeśli \( \displaystyle X \) daje sie ustawić w ciąg przy użyciu funkcji \( \displaystyle f: \mathbb{N} \rightarrow X \) , to z surjektywności mamy, że \( \displaystyle \overrightarrow{f}^{-1} (\{x\}) \) jest niepusty dla każdego \( \displaystyle x \). Zdefiniujmy funkcje \( \displaystyle g:X \rightarrow \mathbb{N} \) jako \( \displaystyle g(x) = \bigcap\overrightarrow{f}^{-1} (\{x\}) \). Funkcja ta wybiera najmniejsze elementy z przeciwobrazów elementów \( \displaystyle X \), jest zatem iniekcją, a więc bijekcja pomiędzy \( \displaystyle X \) a podzbiorem \( \displaystyle \mathbb{N} \).

Znowu, tak jak w przypadku Twierdzenia 1.8, radziłbym zapoznać sie z wykładem 11 "Zbiory dobrze uporządkowane. Lemat Kuratowskiego Zorna i twierdzenie Zermelo, przykłady" dotyczącym aksjomatu wyboru i jego konsekwencji. W szczególności pożyteczne byłoby przeczytanie podrozdziału 3.1 Twierdzenia dotyczące zbiorów i zawartego w nim Ćwiczenia 3.1. Znajdą tam państwo uogólnienie poprzedniego twierdzenia na sytuacje, gdzie nie zakłada się przeliczalności zbioru \( \displaystyle X \).

Twierdzenie 2.4

\( \displaystyle X \) jest przeliczalny wtedy i tylko wtedy, gdy \( \displaystyle X \) jest skończony lub równoliczny z \( \displaystyle \mathbb{N} \).

Proponuję dowód wykonać jako proste ćwiczenie.

Ćwiczenie 2.5

Dowiedź Twierdzenia 2.4.


Lemat 2.6

Własności zbiorów przeliczalnych:

  1. Podzbiór przeliczalnego zbioru jest przeliczalny.
  2. Suma zbiorów przeliczalnych jest przeliczalna.
  3. \( \displaystyle \mathbb{N}^2 \) jest przeliczalny.
  4. Iloczyn kartezjański zbiorów przeliczalnych jest przeliczalny.
  5. \( \displaystyle \mathbb{N}^k \) dla \( \displaystyle k\geq 1 \) jest przeliczalny.
  6. Niech \( \displaystyle x \in \mathcal{P} ( \mathcal{P} (X)) \) będzie skończoną rodziną zbiorów przeliczalnych. Wtedy \( \displaystyle \prod x \) jest przeliczalny.
  7. Jeżeli \( \displaystyle X \) przeliczalny oraz \( \displaystyle r \in \mathcal{P} ( \mathcal{P} (X)) \)jest rozkładem, to \( \displaystyle r \) jest przeliczalny.

Twierdzenie jest proste i dlatego proponuję wykonać dowody samodzielnie jako ćwiczenie.

Ćwiczenie 2.7

Dowiedź Lematu 2.6.


Twierdzenie 2.8

Zbiory liczb całkowitych i wymiernych są przeliczalne.

Dowód

Jest to prosta konsekwencja punktu 7 Lematu 2.6. Zbiór \( \displaystyle \mathbb{Z} = \mathbb{N} \times \mathbb{N} / \approx \) oraz zbiór \( \displaystyle \mathbb{Q} = \mathbb{Z} \times\mathbb{Z}^* / \sim \) są rozkładami zbiorów przeliczalnych.

Dla kontrastu udowodnimy, że zbiór liczb rzeczywistych przeliczalny nie jest.

Twierdzenie 2.9 [Cantora]

Zbiór liczb rzeczywistych nie jest przeliczalny.

Dowód

Podany poniżej dowód pochodzi od Georga Cantora. Pokażemy, że odcinek liczb rzeczywistych \( \displaystyle [0,1] \) nie jest przeliczalny. Cały zbiór \( \displaystyle \mathbb{R} \) jako większy też nie może być przeliczalny. Dla dowodu niewprost przypuśćmy, że jest przeciwnie. Załóżmy zatem, że istnieje surjektywny ciąg \( \displaystyle f: \mathbb{N} \rightarrow [0,1] \). Zdefiniujemy indukcyjnie dwa ciągi punktów \( \displaystyle a: \mathbb{N} \rightarrow [0,1] \) i \( \displaystyle b: \mathbb{N} \rightarrow [0,1] \) odcinka \( \displaystyle [0,1] \) o własności \( \displaystyle a_i < b_i \) tak, aby \( \displaystyle i \)-ty element ciągu \( \displaystyle f \) nie należał do odcinka domkniętego \( \displaystyle [a_{i+1} , b_{i+1}] \). Tak więc kładziemy początkowo \( \displaystyle a_0 =0 \) i \( \displaystyle b_0 =1 \). Przypuśćmy, że zdefiniowane są już obydwa ciągi, dla \( \displaystyle i\leq n \). Odcinek \( \displaystyle [a_i,b_i] \) dzielimy na trzy równe części i za \( \displaystyle a_{i+1} \) i \( \displaystyle b_{i+1} \) wybieramy końce tego spośród nich, do którego nie należy element \( \displaystyle f_i \) ciągu \( \displaystyle f \).

Jako ćwiczenie podamy sprawdzenie następujących własności ciągów \( \displaystyle a_i \) i \( \displaystyle b_i \):

  1. Ciąg \( \displaystyle a \) jest słabo rosnący, czyli \( \displaystyle a_i \leq a_{i+1} \).
  2. Ciąg \( \displaystyle b \) jest słabo malejący, czyli \( \displaystyle b_i \geq b_{i+1} \).
  3. \( \displaystyle b_i - a_i = \frac{1}{3^i} \).
  4. \( \displaystyle | b_{i+1} - b_i | \leq ( \frac{2}{3} )^i \).
  5. \( \displaystyle | a_{i+1} - a_i | \leq ( \frac{2}{3} )^i \).

Własności te implikują fakt, że zarówno \( \displaystyle a_i \) jak i \( \displaystyle b_i \) są ciągami Cauchy'ego; jak i to, że są równoważne w sensie definicji liczb rzeczywistych. Zatem istnieje liczba rzeczywista \( \displaystyle x \) zadana jednocześnie przez aproksymacje \( \displaystyle a \) i \( \displaystyle b \), czyli \( \displaystyle x= [a] = [b] \). Ze względu na na 1. i 2. \( \displaystyle a_i \leq x \leq b_i \), dla każdego \( \displaystyle i \). To przeczy samej definicji wybierania odcinków, którą przeprowadzono tak, by elementy ciągu \( \displaystyle f \) nie leżały w żadnym z nich. Zatem \( \displaystyle f \) nie mógł być surjekcją.

Podamy poniżej definicje nierówności na mocach zbiorów.

Definicja 2.10

\( \displaystyle A \leq_m B \) wtw istnieje iniekcja \( \displaystyle f:A \to B \).

\( \displaystyle A < _m B \) wtw \( \displaystyle A \leq_m B \) i nieprawda, że \( \displaystyle A \sim_m B \).

Twierdzenie 2.11

Następujące warunki są równoważne:

  1. Dla dowolnych zbiorów \( \displaystyle A,B \) zachodzi \( \displaystyle A \leq_m B \) i \( \displaystyle B \leq_m A \), to \( \displaystyle A \sim_m B \).
  2. Dla dowolnych zbiorów \( \displaystyle A,B \) zachodzi \( \displaystyle A \leq_m B \) i \( \displaystyle B \subset A \), to \( \displaystyle A \sim_m B \).
  3. Dla dowolnych zbiorów \( \displaystyle A,B,C \) zachodzi \( \displaystyle A < _m B \) i \( \displaystyle B < _m C \), to \( \displaystyle A < _m C \).

Dowód

\( \displaystyle (2) \hspace {0.1mm} \Rightarrow (1) \). Niech \( \displaystyle A \leq_m B \) i \( \displaystyle B \leq_m A \). Niech \( \displaystyle f: B \to A \) iniekcja oraz niech \( \displaystyle B_0 = \overrightarrow{f} (B) \). Mamy więc \( \displaystyle A \sim_m B_0 \) oraz \( \displaystyle B_0 \subset A \). Stosując \( \displaystyle (2) \) do \( \displaystyle A, B_0 \), otrzymujemy \( \displaystyle A \sim_m B_0 \), co wobec \( \displaystyle B \sim_m B_0 \) daje \( \displaystyle A \sim_m B \).

\( \displaystyle (1) \hspace {0.1mm} \Rightarrow (3) \). Z założeń (3) mamy, że \( \displaystyle A < _m B \) i \( \displaystyle B < _m C \). Można je osłabić, otrzymując \( \displaystyle A \leq_m B \) i \( \displaystyle B \leq_m C \). Z przechodniości \( \displaystyle \leq_m \) (co odpowiada składaniu iniekcji) otrzymujemy \( \displaystyle A \leq_m C \). Pozostaje dowieść, że nieprawdą jest \( \displaystyle A \sim_m C \). Gdyby \( \displaystyle A \sim_m C \), to mielibyśmy \( \displaystyle B \leq_m A \). Stosując \( \displaystyle (1) \) dla \( \displaystyle A,B \), mielibyśmy \( \displaystyle A \sim_m B \), co przeczy \( \displaystyle A < _m B \).

\( \displaystyle (3) \hspace {0.1mm} \Rightarrow (2) \). Niech \( \displaystyle A \leq_m B \) i \( \displaystyle B \subset A \), co daje też \( \displaystyle B \leq_m A \). Gdyby nieprawdą było, że \( \displaystyle A \sim_m B \), to mielibyśmy zarówno \( \displaystyle A < _m B \) jak i \( \displaystyle B < _m A \), co na mocy \( \displaystyle (3) \) dawałoby sprzeczność \( \displaystyle A < _m A \).

W twierdzeniu powyżej pokazaliśmy równoważność trzech warunków, nie pokazując, czy którykolwiek z nich jest prawdziwy. Teraz pokażemy \( \displaystyle (1) \). Twierdzenie to znane jest pod nazwą twierdzenia Cantora-Bernsteina. Zatem twierdzenie to wyraża słabą antysymetrię relacji porządku na mocach zbiorów. Zobaczymy, że jest ono niezwykle przydatne do uzasadnienia wielu faktów teorii mocy, co bez tego twierdzenia często pociągałoby konieczność przeprowadzania długich i skomplikowanych dowodów.

Twierdzenie 2.12 [Cantora - Bernsteina]

Jeżeli \( \displaystyle A \leq_m B \) i \( \displaystyle B \leq_m A \) to \( \displaystyle A \sim_m B \).

Dowód

Przygotowania do tego dowodu zostały podjęte wcześniej. Służył do tego Wykład 6 poświęcony między innymi obrazom zbiorów przez funkcje. Nietrywialnym było dowiedzenie twierdzenia Knastera-Tarskiego, a przy jego pomocy lematu Banacha. Ten wysiłek zwróci się nam teraz (patrz wykład 6: "Funkcje, tw. o faktoryzacji, produkt uogólniony, obrazy i przeciwobrazy, tw. Knastera-Tarskiego i lemat Banacha"). Niech zatem \( \displaystyle f:A\to B \) i \( \displaystyle g: B\to A \) będą iniekcjami. Na mocy lematu Banacha (patrz wykład 6: "Funkcje, tw. o faktoryzacji, produkt uogólniony, obrazy i przeciwobrazy, tw. Knastera-Tarskiego i lemat Banacha", Lemat Banacha), istnieją rozłączne zbiory \( \displaystyle A_1 ,A_2 \) wzajemnie uzupełniające się do \( \displaystyle A \) jak i rozłączne zbiory \( \displaystyle B_1 ,B_2 \) wzajemnie uzupełniające się do \( \displaystyle B \) takie, że \( \displaystyle \overrightarrow{f} (A_1) = B_1 \) i symetrycznie \( \displaystyle \overrightarrow{g} (B_2) = A_2 \). Możemy zatem na rozłącznych zbiorach \( \displaystyle A_1, A_2 \) skleić dwie iniekcje \( \displaystyle f|_{A_1} \) i \( \displaystyle g^{-1}|_{A_2} \) będące zawężeniami oryginalnych funkcji. Otrzymane sklejenie \( \displaystyle f|_{A_1} \cup g^{-1}|_{A_2} \) jest bijekcją.

Poniżej poznamy twierdzenie pochodzące od Cantora, pokazujące, że można budować zbiory o dowolnie wielkiej mocy. Z niego i z twierdzenia Cantora-Bernstaina pokażemy, że zbiorów jest tak dużo, że same nie tworzą zbioru. Fakt ten jest już nam znany \( \displaystyle x \notin x \) (patrz wykład 4: "Teoria mnogości ZFC. Operacje na zbiorach", Fakt 10.1) i jest konsekwencja aksjomatu regularności. Niemniej przeprowadzimy prosty dowód, odwołujący się do faktów z teorii mocy. Dowód poniższy jest dowodem przekątniowym. W wykładach dotyczących teorii obliczeń i logiki znajdą państwo wiele takich dowodów.

Twierdzenie 2.13 [Cantora]

\( \displaystyle A < _m \mathcal{P} (A) \).

Dowód

Łatwo zauważyć, że istnieje iniekcja wkładająca \( \displaystyle A \) w \( \displaystyle \mathcal{P} (A) \). Przykładowo możemy wziąć funkcje przypisującą elementowi \( \displaystyle x \) zbioru \( \displaystyle A \) singleton \( \displaystyle \{x\} \). Załóżmy, że istnieje bijekcja \( \displaystyle f: A \rightarrow \mathcal{P} (A) \). Obrazami elementów ze zbioru \( \displaystyle A \) są podzbiory \( \displaystyle A \). Utwórzmy zbiór \( \displaystyle C= \{z\in A: z \notin f(z)\} \). Ze względu na surjektywność \( \displaystyle f \) musi istnieć taki element \( \displaystyle z_0 \in A \), że \( \displaystyle f(z_0) = C \). Rozstrzygnijmy problem, czy \( \displaystyle z_0 \in f(z_0) \). Jeżeli tak, to \( \displaystyle z_0 \in C \), a zatem \( \displaystyle z_0 \notin f(z_0) \) sprzeczność. Jeżeli nie to, \( \displaystyle z_0 \notin f(z_0) \), a zatem \( \displaystyle z_0 \in C \), czyli \( \displaystyle z_0 \in f(z_0) \) sprzeczność.

Twierdzenie 2.14 [Cantora]

Nie istnieje zbiór wszystkich zbiorów.

Dowód

Gdyby taki zbiór istniał, mielibyśmy trudności z przypisaniem mu mocy. Mianowicie, niech ten zbiór nazywa się \( \displaystyle A \). W takim razie \( \displaystyle \mathcal{P} (A) \subset A \), bo każdy podzbiór \( \displaystyle A \) jest zbiorem. Trywialnie mamy w drugą stronę \( \displaystyle A \leq_m \mathcal{P} (A) \). Zatem z twierdzenia Cantora-Bernsteina otrzymujemy \( \displaystyle A \sim_m \mathcal{P} (A) \), co jest sprzeczne z twierdzeniem Cantora.

Twierdzenie 2.15

Każdy zbiór nieskończony zawiera podzbiór przeliczalny równoliczny z \( \displaystyle \mathbb{N} \).

Dowód

Dowód tego bardzo intuicyjnego faktu odwołuje się do aksjomatu wyboru. Proszę o zapoznanie się z dowodem tego twierdzenia w wykładzie 11, Twierdzenie 4.1, oraz o zapoznanie się z innymi faktami tego rozdziału, które wymagają aksjomatu wyboru (patrz wykład 11: "Zbiory dobrze uporządkowane. Lemat Kuratowskiego Zorna i twierdzenie Zermelo, przykłady", Twierdzenie 4.1>).

Zbiory mocy continuum

Zbiory mocy continuum



Definicja 3.1

Zbiór nazywamy nieprzeliczalnym, gdy nie jest przeliczalny.

Ćwiczenie 3.2

Zbiory \( \displaystyle 2^{\mathbb{N}} \) oraz \( \displaystyle \mathbb{N}^{\mathbb{N}} \) nie są przeliczalne.


Definicja 3.3

Mówimy, że zbiór jest mocy continuum, gdy jest równoliczny z \( \displaystyle \mathbb{R} \).

Lemat 3.4

Każdy przedział obustronnie otwarty jest mocy continuum.

Dowód

Na początku pokażemy, że istnieje bijekcja pomiędzy przedziałem otwartym liczb rzeczywistych \( \displaystyle (-1,1) \) a \( \displaystyle \mathbb R \). Bijekcją taką jest \( \displaystyle x \rightarrow \frac{x}{1-x^2} \). (Jako ćwiczenie spróbuj narysować wykres tej funkcji.) Następnie łatwo zauważyć, że każde dwa przedziały otwarte są równoliczne. (Jako ćwiczenie napisz wzór na funkcję liniową pomiędzy dwoma zadanymi otwartymi przedziałami.)

Lemat 3.5

Jeżeli \( \displaystyle A \subset \mathbb{R} \) i \( \displaystyle A \) zawiera pewien przedział otwarty, to \( \displaystyle A \) jest mocy continuum.

Dowód

Prosta konsekwencja Twierdzenia 2.12 Cantora-Bernsteina.

Następne dwa lematy pokazują, że zbiory mocy kontinuum są odporne na dodawanie i ujmowanie zbiorów przeliczalnych. Po każdej takiej operacji moc zbioru jest taka, jak była. Proszę o zapoznanie się z prostymi dowodami tych lematów. Może to być pomocne w rozwiązywaniu zadań.

Lemat 3.6

Jeżeli \( \displaystyle B \subset A \) jest przeliczalnym podzbiorem zbioru \( \displaystyle A \) mocy continuum, to
\( \displaystyle A \setminus B \) jest mocy continuum.

Dowód

Załóżmy bez straty ogólności, że \( \displaystyle B \subset A \). Zauważmy, że \( \displaystyle A \setminus B \) jest nieprzeliczalny. Inaczej przeczyłoby to Twierdzeniu 2.9 o nieprzeliczalności \( \displaystyle \mathbb R \). W takim razie \( \displaystyle A \setminus B \) jest nieskończony. Można zatem odnaleźć w nim na mocy Twierdzenia 2.15 (stosując aksjomat wyboru, zapoznaj się z dowodem tego twierdzenie w wykładzie 11, "Zbiory dobrze uporządkowane. Lemat Kuratowskiego Zorna i twierdzenie Zermelo, przykłady", Twierdzenie 4.1) nieskończony zbiór przeliczalny \( \displaystyle B' \). Mamy więc \( \displaystyle B \cup B' \) jest nieskończonym zbiorem przeliczalnym. Istnieje zatem bijekcja \( \displaystyle f: B \cup B' \rightarrow B' \). Mając ją, możemy określić bijekcję \( \displaystyle h: A \rightarrow A \setminus B \) następująco:

\( \displaystyle h(x) =\left\{\begin{array}{lll} f(x) , & x \in B\cup B', \\ x, & x \notin B\cup B'. \end{array} \right. \)

Lemat 3.7

Jeżeli \( \displaystyle B \) jest przeliczalnym, a \( \displaystyle A \) jest mocy continuum, to \( \displaystyle A \cup B \) jest mocy continuum.

Dowód

Opiszmy słowami dowód podobny do poprzedniego. Na początku należy odnaleźć w \( \displaystyle A \) zbiór nieskończony przeliczalny \( \displaystyle B_0 \). Zbiór ten musi być równoliczny z \( \displaystyle B\cup B_0 \). W takim razie można bijektywnie schować zbiór \( \displaystyle B\cup B_0 \) w zbiorze \( \displaystyle B_0 \). Następnie należy zdefiniować bijekcję między \( \displaystyle A \cup B \) a \( \displaystyle A \) tak, aby na fragmencie z poza \( \displaystyle B_0 \) była identycznością, a na \( \displaystyle B \cup B_0 \) była poprzednią bijekcją. Sklejenie takich bijekcji na zbiorach rozłącznych jest bijekcją.

Twierdzenie poniższe będzie mieć dla nas fundamentalne znaczenie. Porównuje ono moc dwóch podstawowych dla nas zbiorów \( \displaystyle \mathbb N \) i \( \displaystyle \mathbb R \). Do dowodu posłużymy się konstrukcją rozwinięcia dwójkowego przeprowadzonego w Twierdzeniu 3.15 z Wykładu 8 (patrz "Konstrukcje liczbowe, liczby całkowite, wymierne, konstrukcja Cantora liczb rzeczywistych: działania i porządek", Twierdzenie 3.15). Twierdzenie 3.18 tego rozdziału pokazuje bijekcje pomiędzy pewnymi specjalnymi ciągami ze zbioru \( \displaystyle 2^\mathbb N \) a przedziałem \( \displaystyle [0,1) \). Przed przeczytaniem tego dowodu zapoznaj sie z Twierdzeniami 3.15, 3.17, 3.18 z Wykładu 8 (patrz "Konstrukcje liczbowe, liczby całkowite, wymierne, konstrukcja Cantora liczb rzeczywistych: działania i porządek").

Twierdzenie 3.8

\( \displaystyle 2^{\mathbb{N}} \) jest mocy continuum.

Dowód

Zbiór \( \displaystyle 2^\mathbb N \) rozbijmy na dwa rozłączne podzbiory. Zbiór \( \displaystyle X \) taki, jak w Twierdzeniu 3.18 wykładu 8 to znaczy \( \displaystyle X= \{a\in 2^{\mathbb{N}}: \forall_{k} \;\; \exists_{n>k} \;\; a_n = 0\} \) oraz zbiór \( \displaystyle X' = \{a \in 2^{\mathbb{N}}: \exists_{k} \;\; \forall_{n>k} \;\; a_n = 1\} \) będący jego uzupełnieniem. Łatwo zauważyć, że \( \displaystyle X' \) jest przeliczalny, bo można go przedstawić jako przeliczalną sumę zbiorów skończonych. \( \displaystyle X' \) składa się z ciągów, które od pewnego miejsca są stale równe \( \displaystyle 1 \). Zauważmy, że jest jedynie \( \displaystyle 2^{k_0} \) takich ciągów, które od \( \displaystyle k_0 +1 \) miejsca są stale równe \( \displaystyle 1 \). Zbiór \( \displaystyle X \), jak pokazaliśmy w Twierdzeniu 3.18 w wykładzie 8, jest równoliczny z przedziałem \( \displaystyle [0,1) \), a więc przeliczalny. Nasz zbiór \( \displaystyle 2^\mathbb N = X \cup X' \) jako suma zbioru continuum i przeliczalnego na mocy Lematu 3.7 jest mocy continuum.

Twierdzenie 3.9

\( \displaystyle \mathbb{N} < _m \mathcal{P} (\mathbb{N}) \sim_m 2^{\mathbb{N}} \sim_m \mathbb{R}. \)

Rodzi się naturalne pytanie. Czy istnieje taki zbiór, którego moc dałoby się ulokować pomiędzy mocą zbioru liczb naturalnych a mocą continuum. Czyli, czy istnieje \( \displaystyle A \) takie, że

\( \displaystyle \mathbb N < _m A < _m \mathbb R \quad \mbox{(3.1)} \)

Cantor przypuszczał, że takiego zbioru (mocy) nie ma i że następnym w hierarchii mocy zbiorem po \( \displaystyle \mathbb N \) jest \( \displaystyle \mathbb R \). Przypuszczenie Cantora nazywa się hipotezą continuum. Hipoteza ta była intensywnie badana przez matematyków. W roku 1939 Kurt Gödel pokazał niesprzeczność tej hipotezy z aksjomatami teorii mnogości. Można zatem przyjąć, że taki zbiór jak w hipotezie kontinuum istnieje i nie doprowadzi to teorii mnogości do sprzeczności, o ile sama nie jest sprzeczna. W roku 1963 Paul Joseph Cohen pokazał niezależność hipotezy continuum od aksjomatów teorii mnogości. Oznacza to, że nie można hipotezy udowodnić na gruncie tej teorii, ale nie można też udowodnić jej zaprzeczenia.

Na koniec podamy jako ćwiczenie inną bardzo elegancką i nieodwołującą się do pojęcia liczb naturalnych definicję nieskończoności.

Definicja 3.10

(definicja nieskończoności Dedekinda) Zbiór \( \displaystyle X \) jest nieskończony w sensie Dedekinda, gdy istnieje podzbiór właściwy \( \displaystyle X_0 \) zbioru \( \displaystyle X \), który jest z nim równoliczny. Zbiór jest skończony, w sensie Dedekinda, jeśli nie jest nieskończony w sensie Dedekinda.

Ćwiczenie 3.11

Pokaż, że zbiór jest nieskończony wtedy i tylko wtedy, gdy jest nieskończony w sensie Dedekinda.



Ćwiczenia

Ćwiczenia



Ćwiczenie 4.1

Wykaż, że \( \displaystyle \mathbb{R}^{\mathbb{R}} \) jest równoliczne z \( \displaystyle 2^{\mathbb{R}} \).

Ćwiczenie 4.2

Wykaż, że \( \displaystyle \mathbb{N}^{\mathbb{N}} \sim_m 2^{\mathbb{N}} \)

Ćwiczenie 4.3

Jakiej mocy może być zbiór punktów nieciągłości silnie rosnącej funkcji z \( \displaystyle \mathbb{R} \) do \( \displaystyle \mathbb{R} \)?


Ćwiczenie 4.4

Jaka jest moc zbioru wszystkich silnie rosnących funkcji z \( \displaystyle \mathbb{N} \) w \( \displaystyle \mathbb{N} \)?

Ćwiczenie 4.5

Czy na płaszczyźnie istnieje okrąg taki, że każdy jego punkt ma przynajmniej jedną współrzędną niewymierną?

Ćwiczenie 4.6

Zbiór \( \displaystyle A\subset \mathbb{Q} \) nazywamy wypukłym, jeśli dla dowolnych \( \displaystyle a,b\in A \), jeśli \( \displaystyle c\in\mathbb{Q} \) i \( \displaystyle a < c < b \), to \( \displaystyle c\in A \). Ile jest zbiorów wypukłych w \( \displaystyle \mathbb{Q} \)?

Ćwiczenie 4.7

Ile elementów posiada największy, pod względem mocy, łańcuch w \( \displaystyle (\mathcal{P}(\mathbb{N}),\subset) \)?

Ćwiczenie 4.8

Jaka jest moc zbioru bijekcji z \( \displaystyle \mathbb{N} \) do \( \displaystyle \mathbb{N} \)?

Ćwiczenie 4.9

Jakiej mocy jest zbiór porządków na \( \displaystyle \mathbb{N} \), które są równocześnie funkcjami \( \displaystyle \mathbb{N} \rightarrow \mathbb{N} \)?

Ćwiczenie 4.10

Dowolna rodzina \( \displaystyle X\subset \mathcal{P}(\mathbb{N}) \) taka, że dla dowolnych dwóch różnych elementów \( \displaystyle X \) ich przecięcie jest co najwyżej jednoelementowe, jest przeliczalna.

Zbiory uporządkowane. Zbiory liniowo uporządkowane. Pojęcia gęstości i ciągłości

Zbiory uporządkowane

Zbiory uporządkowane



Definicja 1.1. Porządkiem (w wielu podręcznikach jest używana jest również nazwa poset, pochodząca od angielskiego skrótu partially ordered set) nazywamy parę \( \displaystyle (X,R) \), gdzie \( \displaystyle X \) jest zbiorem, a \( \displaystyle R \subset X^2 \) jest relacją:

  1. zwrotną,
  2. przechodnią,
  3. antysymetryczną, to znaczy jeżeli \( \displaystyle (x,y) \in R \) oraz \( \displaystyle (y,x) \in R \), to \( \displaystyle x=y \).

Jeżeli dodatkowo relacja \( \displaystyle R \) jest spójna (to znaczy taka, że \( \displaystyle \forall_{x,y \in X} \;\; (x,y)\in R \) lub \( \displaystyle (y,x)\in R \) ), to porządek nazywamy liniowym.

Często oznaczamy relacje porządkującą jako \( \displaystyle \leq \). Oznaczamy też \( \displaystyle x < y \), gdy \( \displaystyle x \leq y \) oraz \( \displaystyle x\neq y \).

Definicja 1.2.

Element \( \displaystyle a \) nazywamy maksymalnym w porządku \( \displaystyle (X,\leq ) \), gdy \( \displaystyle \forall_{x\in X} \;\; a\leq x \hspace {0.1mm} \Rightarrow a=x \).

Element \( \displaystyle a \) nazywamy minimalnym w porządku \( \displaystyle (X,\leq ) \), gdy \( \displaystyle \forall_{x\in X} \;\; x \leq a \hspace {0.1mm} \Rightarrow a=x \).

Element \( \displaystyle a \) nazywamy największym w porządku \( \displaystyle (X,\leq ) \), gdy \( \displaystyle \forall_{x\in X} \;\; x \leq a \).

Element \( \displaystyle a \) nazywamy najmniejszym w porządku \( \displaystyle (X,\leq ) \), gdy \( \displaystyle \forall_{x\in X} \;\; a \leq x \).

Definicja 1.3.

Niech \( \displaystyle A \subset X \) oraz \( \displaystyle b\in X \). Mówimy, że \( \displaystyle b \) jest majorantą zbioru \( \displaystyle A \), gdy \( \displaystyle \forall_{a\in A} \;\; a\leq b \).

Niech \( \displaystyle A \subset X \) oraz \( \displaystyle b\in X \). Mówimy, że \( \displaystyle b \) jest minorantą zbioru \( \displaystyle A \), gdy \( \displaystyle \forall_{a \in A} \;\; b \leq a \).

Definicja 1.4.

\( \displaystyle A \subset X \). Element \( \displaystyle a_0 \in X \) nazywamy supremum zbioru \( \displaystyle A \), gdy:

  1. \( \displaystyle \forall_{a\in A} \;\; a \leq a_0 \),
  2. \( \displaystyle (\forall_{a\in A} \;\; a \leq b) \hspace {0.1mm} \Rightarrow a_0 \leq b \).

Łatwo zauważyć, że supremum, o ile istnieje, jest jedyne i jest najmniejszą z majorant. Jeżeli istnieje supremum dla \( \displaystyle A \) będziemy je oznaczać \( \displaystyle \bigvee A \).

Definicja 1.5.

\( \displaystyle A \subset X \). Element \( \displaystyle b_0 \in X \) nazywamy infimum zbioru \( \displaystyle A \), gdy:

  1. \( \displaystyle \forall_{a\in A} \;\; b_0 \leq a \)
  2. \( \displaystyle (\forall_{a \in A} \;\; b \leq a ) \hspace {0.1mm} \Rightarrow b \leq b_0 \)

Tak jak w przypadku supremum infimum, o ile istnieje, jest jedyne i jest największą z minorant zbioru. Jeżeli istnieje infimum dla \( \displaystyle A \), będziemy je oznaczać \( \displaystyle \bigwedge A \).

Ćwiczenie 1.6

Niech \( \displaystyle X \) będzie ustalonym zbiorem i niech \( \displaystyle A\subset \mathcal{P}(X) \). Zdefiniujmy relację \( \displaystyle \sqsubseteq \subset A\times A \) następująco:

\( \displaystyle a \sqsubseteq b \Leftrightarrow a\subseteq b. \)

Udowodnij, że \( \displaystyle (A,\sqsubseteq) \) jest zbiorem uporządkowanym.

Uwaga 1.7.

Nadużywając notacji, będziemy czasem używać symbolu \( \displaystyle \subset \) dla oznaczenia relacji \( \displaystyle \sqsubseteq \) zdefiniowanej w poprzednim ćwiczeniu. Zwracamy przy tym uwagę, że nie ma czegoś takiego jak relacja \( \displaystyle \subset \), gdyż musiałaby ona być określona w zbiorze wszystkich zbiorów, który nie istnieje. W przypadku jednak, gdy rozważamy jedynie podzbiory ustalonego zbioru \( \displaystyle X \), możemy mówić o relacji bycia podzbiorem. Czasem dla podkreślenia, że mówimy o podzbiorach ustalonego zbioru, będziemy pisać \( \displaystyle \subset_X \).

Ćwiczenie 1.8

Dla dowolnego zbioru \( \displaystyle A \), jego zbiór potęgowy \( \displaystyle \mathcal{P}(A) \) jest uporządkowany przez inkluzję. Czy dla dowolnej niepustej rodziny \( \displaystyle r \subset \mathcal{P}(A) \) istnieje supremum i infimum?


Ćwiczenie 1.9

W zbiorze liczb naturalnych zdefiniujemy relację \( \displaystyle | \subset \mathbb{N}^2 \) następująco:

\( \displaystyle \forall_{a,b\in \mathbb{N}} [a|b \Leftrightarrow \exists_{c\in \mathbb{N}} c\cdot a =b]. \)

Udowodnij, że relacja ta porządkuje zbiór \( \displaystyle \mathbb{N} \). Czy w tak uporządkowanym zbiorze istnieją elementy najmniejszy i największy?

Ćwiczenie 1.10

W zbiorze funkcji z \( \displaystyle \mathbb{N} \) w \( \displaystyle \mathbb{N} \) (czyli \( \displaystyle \mathbb{N}^\mathbb{N} \)) zdefiniujmy relację \( \displaystyle R \) następująco:
\( \displaystyle \forall_{f,g\in \mathbb{N}^\mathbb{N}} [ f R g \Leftrightarrow \exists_{h\in \mathbb{N}^\mathbb{N}} h \circ f = g \circ h]. \)

Sprawdź, czy relacja ta jest zwrotna, przechodnia i antysymetryczna.


Ćwiczenie 1.11

Niech \( \displaystyle I=[0,1] \subset \mathbb R \). W zbiorze \( \displaystyle I^I \) zdefiniujemy relację \( \displaystyle R \) następująco:

\( \displaystyle \forall_{f,g \in I^I} [f R g \Leftrightarrow \exists_{x\in I} f(x) \leq g(x)]. \)

Sprawdź, czy relacja \( \displaystyle R \) jest zwrotna, przechodnia i antysymetryczna.


Ćwiczenie 1.12

Niech \( \displaystyle I=[0,1] \subset \mathbb R \). W zbiorze \( \displaystyle I^I \) zdefiniujemy relację \( \displaystyle R \) następująco:

\( \displaystyle \forall_{f,g \in I^I} [f R G \Leftrightarrow \forall_{x\in I} f(x) \leq g(x)]. \)

Udowodnij, że relacja \( \displaystyle R \) porządkuje zbiór \( \displaystyle I \). Czy w porządku istnieją elementy najmniejszy i największy?

Ćwiczenie 1.13

Podaj przykład przeliczalnego porządku, w którym istnieje element najmniejszy i największy.

Ćwiczenie 1.14

Podaj przykład porządku, w którym istnieje element maksymalny, który nie jest elementem największym. Czy istnieje taki porządek, żeby element maksymalny był jedyny?

Ćwiczenie 1.15

Podaj przykład zbioru liniowo uporządkowanego \( \displaystyle (X,\leq) \), w którym istnieje podzbiór niemający supremum.

Takim zbiorem jest \( \displaystyle \mathbb{N} \) uporządkowany naturalną relacją \( \displaystyle \leq \). Wtedy cały zbiór \( \displaystyle \mathbb{N} \) nie ma supremum, gdyż takie supremum musiałoby być największą liczbą naturalną, a taka nie istnieje.

Ćwiczenie 1.16

Udowodnij, że zbiorze uporządkowanym \( \displaystyle (X,\leq) \) istnieje \( \displaystyle \bigvee \emptyset \) wtedy i tylko wtedy, gdy w \( \displaystyle X \) istnieje element najmniejszy.

Ćwiczenie 1.17

Udowodnij, że zbiorze uporządkowanym \( \displaystyle (X,\leq) \), jeśli każdy podzbiór ma supremum, to każdy podzbiór ma infimum.

Ćwiczenie 1.18

Podaj przykład porządku \( \displaystyle (X,\leq) \) takiego, że podzbiór \( \displaystyle A\subset X \) ma supremum wtedy i tylko wtedy, gdy jest skończony.

Przykładem takiego porządku są skończone podzbiory liczb naturalnych, uporządkowane przez inkluzję; oznaczymy ten porządek przez \( \displaystyle (\mathcal{P}_{fin}(\mathbb{N}),\subset) \). Dla dowolnego skończonego zbioru \( \displaystyle A\subset \mathcal{P}_{fin}(\mathbb{N}) \) mamy \( \displaystyle \bigcup A \in \mathcal{P}_{fin}(\mathbb{N}) \), a więc zbiór ten ma supremum w \( \displaystyle \mathcal{P}_{fin}(\mathbb{N}) \). Jeśli zbiór \( \displaystyle A \) jest nieskończony, to \( \displaystyle \bigcup A \) jest nieskończony, a więc \( \displaystyle \bigcup A \notin \mathcal{P}_{fin}(\mathbb{N}) \), co oznacza, że w \( \displaystyle \mathcal{P}_{fin}(\mathbb{N}) \) nie istnieje supremum zbioru \( \displaystyle A \) (gdyby istniało, to w zbiorze \( \displaystyle (\mathcal{P}(\mathbb{N}),\subset) \) istniałyby dwa suprema zbioru \( \displaystyle A \), co jest niemożliwe).

Definicja 1.19

\( \displaystyle L \subset X \) jest łańcuchem w porządku \( \displaystyle (X,\leq) \), gdy każde dwa elementy \( \displaystyle L \) są porównywalne w sensie \( \displaystyle \leq \). Oznacza to, że porządek indukowany na zbiorze \( \displaystyle L \), czyli \( \displaystyle (L, R \cap L \times L) \) jest porządkiem liniowym.

Definicja 1.20.

Zbiór \( \displaystyle A \subset X \) jest antyłańcuchem w porządku \( \displaystyle (X,\leq) \), gdy żadne dwa różne elementy \( \displaystyle A \) nie są porównywalne w sensie \( \displaystyle \leq \). Formalnie, jeśli następująca formuła jest prawdziwa:

\( \displaystyle \forall_{a,b\in A} (a \leq b \Rightarrow a=b). \)

Ćwiczenie 1.21

Sprawdź, czy suma antyłańcuchów musi być antyłańcychem oraz czy suma łańcuchów musi być łańcuchem.

Ćwiczenie 1.22

Czy antyłańcuch może być łańcuchem?

Ćwiczenie 1.23

Podaj przykład porządku, w których nie istnieje największy w sensie inkluzji łańcuch ani antyłańcuch.

Ćwiczenie 1.24

Kiedy w porządku \( \displaystyle (X,\leq) \) istnieje największy w sensie inkluzji łańcuch.

Ćwiczenie 1.25

Kiedy w porządku \( \displaystyle (X,\leq) \) istnieje największy w sensie inkluzji antyłańcuch.

Ćwiczenie 1.26

Czy porządek, w którym każdy łańcuch jest skończony, musi być skończony? Czy taki porządek może zawierać łańcuchy o dowolnie dużej skończonej mocy?

Ćwiczenie 1.27

Rozważmy zbiór \( \displaystyle 7=\{0,1,2,3,4,5,6\} \) uporządkowany relacją podzielności (czyli \( \displaystyle a|b \Leftrightarrow \exists_{c\in 7} a \cdot c =b \)). Wypisz wszystkie łańcuchy maksymalne w sensie inkluzji. Wypisz wszystkie antyłańcuchy maksymalne w sensie inkluzji.

Zbiory liniowo uporządkowane

Zbiory liniowo uporządkowane


Definicja 2.1.

Porządki liniowe \( \displaystyle (X,\leq ) \) i \( \displaystyle (Y,\leq ) \) nazywamy podobnymi, gdy istnieje bijekcja \( \displaystyle f:X \to Y \) rosnąca, czyli taka, że jeżeli \( \displaystyle x \leq y \), to \( \displaystyle f(x) \leq f(y) \).

Ćwiczenie 2.2

Dla podobieństwa \( \displaystyle f \), jeżeli \( \displaystyle f(x) \leq f(y) \), to \( \displaystyle x \leq y \)

Definicja 2.3.

Porządek \( \displaystyle (X,\leq ) \) nazywamy gęstym, gdy \( \displaystyle \forall_{x,y\in X} \;\; x < y \hspace {0.1mm} \Rightarrow \exists_{z\in X} \;\; x < z < y \)

Ćwiczenie 2.4

Gęstość jest przenoszona przez podobieństwo.

Ćwiczenie 2.5

W zbiorze \( \displaystyle \mathbb{N}^\mathbb{N} \) rozważymy dwie relacje porządkujące zdefiniowane następująco:
\( \displaystyle \begin{align*} f \sqsubseteq_1 g \Leftrightarrow \forall_{n \in \mathbb{N}} f(n) \leq g(n), \\ f \sqsubseteq_2 g \Leftrightarrow [f=g \vee \exists_{n_0 \in \mathbb{N}} (f(n) < g(n)\wedge \forall_{n < n_0} f(n) =g(n))]. \end{align*} \)

Sprawdź, czy te porządki są podobne.


Definicja 2.6.

Niech \( \displaystyle (X,\leq ) \) będzie porządkiem liniowym. Przekrojem Dedekinda w \( \displaystyle (X,\leq ) \) nazywamy parę zbiorów \( \displaystyle X_1 , X_2 \subset X \), taką że:

  1. \( \displaystyle X_1 \cup X_2 = X \).
  2. \( \displaystyle X_1 \cap X_2 = \emptyset \).
  3. \( \displaystyle \forall_{x_1 \in X_1, x_2 \in X_2 } \;\; x_1 < x_2 \).
  4. \( \displaystyle X_1 \neq \emptyset \) i \( \displaystyle X_2 \neq \emptyset \).

Definicja 2.7.

Przekrój \( \displaystyle X_1 , X_2 \) daje skok, jeżeli \( \displaystyle X_1 \) ma element największy i \( \displaystyle X_2 \) ma element najmniejszy.

Ćwiczenie 2.8

Liniowy porządek \( \displaystyle (X,\leq ) \) jest gęsty wtedy i tylko wtedy, gdy żaden przekrój nie daje skoku.

Ćwiczenie 2.9

W zbiorze \( \displaystyle \{0,1\}^\mathbb{N} \) rozważymy relację porządkującą zdefiniowaną następująco:

\( \displaystyle \begin{align*} f \sqsubseteq g \Leftrightarrow [f=g \vee \exists_{n_0 \in \mathbb{N}} (f(n_0) < g(n_0)\wedge \forall_{n < n_0} f(n) =g(n))]. \end{align*} \)

Sprawdź, czy ten porządek jest gęsty.

Definicja 2.10.

Przekrój \( \displaystyle X_1 , X_2 \) daje lukę, jeżeli \( \displaystyle X_1 \) nie ma elementu największego i \( \displaystyle X_2 \) nie ma elementu najmniejszego.

Definicja 2.11.

Porządek liniowy \( \displaystyle (X,\leq ) \) nazywamy ciągłym wtedy i tylko wtedy, gdy żaden przekrój nie daje luki.

Twierdzenie 2.12.

W porządku ciągłym \( \displaystyle (X,\leq ) \) każdy niepusty zbiór ograniczony od góry ma supremum.

Dowód

Niech \( \displaystyle A \neq \emptyset \) będzie zbiorem ograniczonym od góry. Łatwo zauważyć, że jeżeli jakieś ograniczenie zbioru \( \displaystyle A \) należy do \( \displaystyle A \), to jest jego supremum. Załóżmy zatem, że żadne ograniczenie do \( \displaystyle A \) nie należy. Utwórzmy parę zbiorów: \( \displaystyle X_1 = \{y\in X: \exists_{x\in A} \;\; y \leq x\} \) oraz \( \displaystyle X_2 = \{y\in X: \forall_{x\in A} \;\; y >x\} \). Pierwszy \( \displaystyle X_1 \) jest domknięciem w dół zbioru \( \displaystyle A \), czyli wraz z każdym jego elementem dołączamy do niego wszystkie mniejsze. Zatem \( \displaystyle \emptyset \neq A \subset X_1 \). Do \( \displaystyle X_2 \) należą wszystkie ograniczenia górne zbioru \( \displaystyle A \) więc musi on być niepusty. Z konstrukcji wynika \( \displaystyle X_1 \cup X_2 = X \). Korzystając z ciągłości, otrzymujemy, że \( \displaystyle X_1 \) ma element największy lub \( \displaystyle X_2 \) ma element najmniejszy. Gdy \( \displaystyle X_1 \) posiada element największy \( \displaystyle b \), to jest on supremum \( \displaystyle A \). Istotnie, element \( \displaystyle b \) góruje nad \( \displaystyle X_1 \), więc tym bardziej nad \( \displaystyle A \). Gdy element \( \displaystyle b' \) góruje nad \( \displaystyle A \), to góruje też nad \( \displaystyle X_1 \), zatem jeżeli należy do \( \displaystyle X_1 \), musi być równy \( \displaystyle b \), gdy zaś należy do \( \displaystyle X_2 \), to \( \displaystyle b' > b \). W drugim przypadku, gdy w \( \displaystyle X_1 \) nie ma elementu największego, supremum \( \displaystyle A \) jest najmniejszy element \( \displaystyle b \) z \( \displaystyle X_2 \) . Istotnie, \( \displaystyle b \) góruje nad \( \displaystyle A \). Jeżeli jakiś \( \displaystyle b' \) góruje nad \( \displaystyle A \), to również nad \( \displaystyle X_1 \). \( \displaystyle b' \) nie może należeć do \( \displaystyle X_1 \), bo w \( \displaystyle X_1 \) nie ma największego. Należy więc do \( \displaystyle X_2 \), zatem \( \displaystyle b \leq b ' \). Proszę o zwrócenie uwagi na fakt, że możliwe jest, aby zarówno \( \displaystyle X_1 \) miał element największy, jak i \( \displaystyle X_2 \) miał element najmniejszy. Wtedy supremum jest ten pochodzący z \( \displaystyle X_1 \).

Twierdzenie 2.13.

W porządku liniowym \( \displaystyle (X,\leq ) \), jeżeli każdy niepusty zbiór ograniczony od góry ma supremum, to porządek jest ciągły.

Dowód

Weźmy przekrój Dedekinda \( \displaystyle X_1 , X_2 \subset X \). \( \displaystyle X_1 \) jest ograniczony od góry przez elementy z \( \displaystyle X_2 \). \( \displaystyle X_1 \), ma więc supremum \( \displaystyle a \). Jeżeli \( \displaystyle a\in X_1 \), to \( \displaystyle X_1 \) ma element największy. W przeciwnym przypadku \( \displaystyle a \in X_2 \). Gdyby \( \displaystyle a > x_2 \) dla pewnego \( \displaystyle x_2 \in X_2 \), to zbiór \( \displaystyle X_1 \) miałby mniejsze ograniczenie górne niż \( \displaystyle a \). To jest niemożliwe, musi więc być \( \displaystyle a \leq x_2 \) dla każdego \( \displaystyle x_2 \in X_2 \). Zatem \( \displaystyle a \) jest najmniejszy w \( \displaystyle X_2 \).

Ćwiczenie 2.14

W porządku liniowym \( \displaystyle (X,\leq ) \) każdy niepusty zbiór ograniczony od dołu ma infimum wtedy i tylko wtedy, gdy porządek jest ciągły.

Ćwiczenie 2.15.

Udowodnij, że ciągłość jest przenoszona przez podobieństwo.


Ćwiczenie 2.16

Pokaż, że zbiór \( \displaystyle \mathbb{N} \) liczb naturalnych jest ciągły.


Ćwiczenie 2.17

Udowodnij, że dla dowolnych liczb rzeczywistych \( \displaystyle A,B\in \mathbb R \) takich, że \( \displaystyle A < B \) istnieje liczba wymierna \( \displaystyle q\in \mathbb{Q} \) taka, że \( \displaystyle A\leq q \leq B \).

Ćwiczenie 2.18

Pokaż, że zbiór \( \displaystyle \mathbb{Q} \) nie jest ciągły.


Twierdzenie 2.19.

\( \displaystyle \mathbb{R} \) jest ciągła.

Dowód

Przed przystąpieniem do dowodu przejrzyj dowód twierdzenia Cantora 2.9 z wykładu 9 o nieprzeliczalności \( \displaystyle \mathbb{R} \) (patrz Wykład 9: "Teoria mocy twierdzenie Cantora-Bernsteina, twierdzenie Cantora. Zbiory przeliczalne, zbiory mocy kontinuum", Twierdzenie Cantora). Niech \( \displaystyle (X_1 , X_2) \) będzie przekrojem w \( \displaystyle \mathbb{R} \). Zbiory \( \displaystyle X_1 , X_2 \) są niepuste. Wybierzmy dwie liczby wymierne \( \displaystyle x_0 \) w \( \displaystyle X_1 \) i \( \displaystyle y_0 \) w \( \displaystyle X_2 \). (Sprawdź jako ćwiczenie, że z każdego przekroju da się wybrać liczby wymierne). Skonstruujmy dwa ciągi \( \displaystyle x: \mathbb{N} \rightarrow X_1 \) oraz \( \displaystyle y: \mathbb{N} \rightarrow X_2 \) zdefiniowane indukcyjnie. \( \displaystyle x_0, y_0 \) są zadane.

\( \displaystyle x_{i+1} = \left\{ \begin{array} {ll} \frac{x_i + y_i}{2}, & \hbox{gdy } \frac{x_i + y_i}{2} \in X_1 ; \\ x_i , & \hbox{gdy; } \frac{x_i + y_i}{2} \notin X_1. \end {array} \right. . \;\;\;\;\;\;\;y_{i+1} =\left\{ \begin{array} {ll} \frac{x_i + y_i}{2}, & \hbox{gdy } \frac{x_i + y_i}{2} \in X_2 ; \\ y_i , & \hbox{gdy } \frac{x_i + y_i}{2} \notin X_2. \end {array} \right. . \)

Jako ćwiczenie podamy sprawdzenie następujących własności ciągów \( \displaystyle x_i \) i \( \displaystyle y_i \):

  1. ciąg \( \displaystyle x \) jest słabo rosnący czyli \( \displaystyle x_i \leq x_{i+1} \),
  2. ciąg \( \displaystyle y \) jest słabo malejący czyli \( \displaystyle y_i \geq y_{i+1} \),
  3. \( \displaystyle y_i - x_i = \frac{y_0 - x_0}{2^i} \),
  4. \( \displaystyle | x_{i+1} - x_i | \leq \frac{y_0 - x_0}{2^{i+1}} \),
  5. \( \displaystyle | y_{i+1} - y_i | \leq \frac{y_0 - x_0}{2^{i+1}} \).

Własności te implikują fakt, że zarówno \( \displaystyle x_i \) jak i \( \displaystyle y_i \) są ciągami Cauchy'ego, jak i to, że są równoważne w sensie definicji liczb rzeczywistych. Zatem istnieje liczba rzeczywista \( \displaystyle G \) zadana jednocześnie przez aproksymacje \( \displaystyle x \) i \( \displaystyle y \), czyli \( \displaystyle G= [x]_{\simeq} = [y]_\simeq \). Gdy \( \displaystyle G\in X_1 \), to \( \displaystyle X_1 \) ma element największy. W przeciwnym wypadku \( \displaystyle G\in X_2 \) i wtedy \( \displaystyle X_2 \) ma element najmniejszy.

Ćwiczenie 2.20

Udowodnij, że porządki \( \displaystyle (\mathbb R, \leq) \) i \( \displaystyle (\mathbb R\setminus \mathbb{Q}, \leq) \) nie są podobne.

Zbiory dobrze uporządkowane. Lemat Kuratowskiego Zorna i twierdzenie Zermelo, przykłady

Wstęp


Poniższy wykład poświęcony jest konsekwencjom aksjomatu wyboru. Aksjomat wyboru jest niewątpliwie najbardziej kontrowersyjnym z aksjomatów ZFC. Wielu znanych matematyków poddawało go w wątpliwość. W chwili obecnej znakomita większość uważa, że aksjomat wyboru jest prawdziwy, nawet jeśli niektóre z jego konsekwencji są sprzeczne z intuicją.

W tym wykładzie przedstawiamy szereg twierdzeń, które są równoważne lub wynikają z aksjomatu wyboru. Zanim przejdziemy do wypowiedzi tych faktów, wprowadzimy jeszcze jeden koncept.

Zbiory dobrze uporządkowane

Zbiory dobrze uporządkowane


Definicja dobrego porządku nie zależy od aksjomatu wyboru. W aksjomatyce ZF istnieje wiele zbiorów dobrze uporządkowanych. Jednak w obecności aksjomatu wyboru zbiory dobrze uporządkowane nabierają zupełnie nowego znaczenia.

Definicja 2.1.

Częściowy porządek \( (A,\sqsubseteq) \) jest dobrym porządkiem, jeśli

  • jest porządkiem liniowym,
  • każdy niepusty podzbiór \( A \) zawiera element najmniejszy względem \( \sqsubseteq \).

Mówimy wtedy, że zbiór \( A \) jest dobrze uporządkowany przez \( \sqsubseteq \).

Istnienie zbiorów dobrze uporządkowanych nie jest nowością. Zdefiniowany w wykładzie 7 "Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje" zbiór liczb naturalnych jest dobrze uporządkowany na mocy dowiedzionych tam twierdzeń. Łatwo zauważyć, że również każda liczba naturalna \( n \) wraz z relacją inkluzji jest zbiorem dobrze uporządkowanym. Ogólnie, następujący fakt jest prawdziwy

Fakt 2.2.

Dla dowolnego dobrego porządku \( (A,\sqsubseteq) \) i dla dowolnego zbioru \( B\subset A \) zbiór ten jest dobrze uporządkowany przez relację \( \sqsubseteq\cap B\times B \).

Dowód

Relacja \( \sqsubseteq\cap B\times B \) to relacja \( \sqsubseteq \) zawężona do elementów zbioru \( B \). Mamy dla każdego \( a,b\in B \)

\( a\sqsubseteq b \iff a (\sqsubseteq\cap B\times B) b. \)

Oczywistym wnioskiem jest, że zbiór \( B \) jest uporządkowany liniowo przez \( \sqsubseteq\cap B\times B \). Pozostaje wykazać, że każdy podzbiór zbioru \( B \) ma element najmniejszy. Ustalmy dowolne \( C\subset B \), ponieważ \( B\subset A \) zbiór \( C \) jest również podzbiorem \( A \) i z definicji zbioru dobrze uporządkowanego wynika, że \( C \) posiada element najmniejszy względem \( \sqsubseteq \). Ponieważ \( C\subset B \), to ten sam element jest elementem najmniejszym w \( C \) względem \( \sqsubseteq\cap B\times B \), co kończy dowód faktu.

Dokładnej analizie własności zbiorów dobrze uporządkowanych jest poświęcony wykład 12 "Twierdzenie o indukcji. Liczby porządkowe. Zbiory liczb porządkowych. Twierdzenie o definiowaniu przez indukcje pozaskończoną". W dalszej części wykładu ograniczamy się do własności tych porządków bezpośrednio powiązanych z aksjomatem wyboru.

Aksjomat wyboru i twierdzenia mu równoważne

Aksjomat wyboru i twierdzenia mu równoważne


Tę część wykładu zaczniemy od przytoczenia aksjomatu wyboru w postaci, w jakiej został wprowadzony w wykładzie 4 "Teoria mnogości ZFC. Operacje na zbiorach".

Aksjomat Wyboru. Następująca formuła jest prawdziwa:

\( \forall x\; ( \emptyset\notin x\land \forall y\forall z\; (z\in x\land y\in x) \Longrightarrow (z=y \lor z\cap y = \emptyset)) \Longrightarrow \exists w \forall v\;(v\in x \Longrightarrow \exists u\;v\cap w=\{u\}). \)

Rysunek 1

Aksjomat ten mówi, że jeśli \( x \) jest rodziną niepustych, parami rozłącznych zbiorów, to istnieje zbiór mający z każdym elementem \( x \) dokładnie jeden element wspólny. Zbiór \( w \), którego istnienie gwarantuje aksjomat wyboru, "wybiera" z każdego elementu rodziny dokładnie jeden element (rysynek 1). Zbiory jako pionowe, nieregularne obszary, zbiór wybierający jako poziomy zbiór przecinający każdy z nich na dokładnie jednym elemencie.

W dalszej części wykładu prezentujemy kilka twierdzeń równoważnych aksjomatowi wyboru. To znaczy, że na gruncie aksjomatyki ZF, bez aksjomatu wyboru, założenie prawdziwości któregokolwiek z tych twierdzeń implikuje prawdziwość aksjomatu wyboru i vice versa. Bardzo istotną częścią dowodów jest wykazanie, że twierdzenia te są dokładnie równoważne aksjomatowi wyboru na gruncie ZF. Na gruncie aksjomatyki ZFC twierdzenia te dają się udowodnić przy użyciu aksjomatu wyboru.

Aby wykazać równoważność między aksjomatem wyboru a poniższymi twierdzeniami, pokażemy, że każde twierdzenie implikuje następne i że ostatnie implikuje aksjomat wyboru. Jest to najprostszy sposób na wykazanie równoważności.

Twierdzenia dotyczące zbiorów

Pierwsze, równoważne aksjomatowi wyboru, twierdzenie mówi o istnieniu funkcji wybierającej. W aksjomacie wyboru, z rodziny zbiorów wybieraliśmy elementy przez utworzenie zbioru. Aby możliwe było wybranie dokładnie jednego elementu z każdego zbioru, niezbędne było założenie o rozłączności tych zbiorów. Poniższe twierdzenie mówi o istnieniu funkcji wybierającej elementy ze zbiorów.

Twierdzenie 3.1.

Dla dowolnej rodziny niepustych zbiorów istnieje funkcja, która każdemu zbiorowi w tej rodzinie przyporządkowuje któryś z jego elementów. Formalnie

\( \forall x\; \emptyset\notin x \Longrightarrow \exists f\; f:x \rightarrow \bigcup x \land( \forall y\; y\in x \Longrightarrow f(y)\in y). \)

Poniżej przedstawiamy dowód, na gruncie ZF, że aksjomat wyboru implikuje powyższe twierdzenie.

Dowód

Aksjomat wyboru implikuje Twierdzenie 3.1 (patrz Twierdzenie 3.1.) Ustalmy dowolny, niezawierający zbioru pustego, zbiór \( x \). Skonstruujemy zbiór \( x_1 \), do którego stosować będziemy aksjomat wyboru. Zbiór

\( x_1 = \{\{y\}\times y\,:\, y\in x\} \)

jest rodziną zbiorów parami rozłącznych - elementy pochodzące z różnych zbiorów \( x \) różnią się w \( x_1 \) na pierwszej współrzędnej. Do zbioru \( x_1 \) stosujemy aksjomat wyboru i otrzymujemy zbiór \( w\subset x\times \bigcup x \). Ponieważ z każdego zbioru \( x_1 \) wybraliśmy dokładnie jeden element, to \( w \) jest funkcją z \( x \) do \( \bigcup x \). Definicja \( x_1 \) gwarantuje również, że \( w(y)\in y \) dla każdego \( y\in x \). Wnioskujemy, że \( w \) może być wzięte jako \( f \) i że aksjomat wyboru implikuje Twierdzenie 3.1 (patrz Twierdzenie 3.1.).

Kolejny fakt, równoważny aksjomatowi wyboru, przedstawiamy w formie ćwiczenia:

Ćwiczenie 3.1

Wykaż, że stwierdzenie "dla każdej surjekcji \( f:x \rightarrow y \) istnieje iniekcja \( g:y \rightarrow
x \) taka, że \( f\circ g \) jest funkcją identycznościową na \( y \)" jest równoważne aksjomatowi wyboru na gruncie ZF.

Twierdzenia dotyczące porządków

Kolejne dwa twierdzenia dotyczą częściowych porządków. Pierwsze z nich gwarantuje istnienie maksymalnych łańcuchów.

Twierdzenie 3.2. [Zasada maksimum Felixa Hausdorff'a]

W każdym zbiorze częściowo uporządkowanym istnieje maksymalny, pod względem inkluzji, łańcuch. Zgodnie z przyjętą strategią postępowania wykażemy, że Twierdzenie 3.1 implikuje zasadę maksimum Felixa Hausdorffa.

Dowód

Twierdzenie 3.1 implikuje zasadę maksimum Felixa Hausdorffa. Dowód tej implikacji opiera się na Twierdzeniu Bourbakiego-Witta z Wykładu 10 (patrz Twierdzenie Bourbakiego-Witta). Ustalmy dowolny zbiór częściowo uporządkowany \( (A,\sqsubseteq) \). Jeśli \( A=\emptyset \), to zbiór ten posiada dokładnie jeden łańcuch i fakt jest dowiedziony. Jeśli \( A\neq\emptyset \), oznaczmy przez \( (B,\subset) \) zbiór częściowo uporządkowany składający się z łańcuchów w \( (A,\sqsubseteq) \) uporządkowanych przez inkluzję

\( B = \{C\subset A\,:\, C \) jest uporządkowany liniowo przez \( \sqsubseteq\}. \)

Zbiór częściowo uporządkowany \( (B,\subset) \) jest łańcuchowo zupełny. Aby to pokazać, ustalmy dowolny, uporządkowany liniowo przez inkluzję zbiór \( D\subset B \). Jeśli \( \bigcup D \) należy do \( B \), to jest to niewątpliwie supremum zbioru \( D \). Aby wykazać, że \( \bigcup D \) jest elementem \( B \), należy wykazać, że jest on uporządkowany liniowo przez \( \sqsubseteq \). Weźmy dwa elementy \( \bigcup D \) - \( x \) i \( y \). Istnieje \( C_x\in D \) i \( C_y\in D \) takie, że \( x\in C_x \), a \( y\in C_y \). Ponieważ \( D \) jest łańcuchem, to, bez straty ogólności, możemy założyć, że \( C_x\subset C_y \). Wtedy, zarówno \( x \) jak i \( y \), należą do \( C_y \) i ponieważ \( C_y\in B \), wnioskujemy, że \( x \) i \( y \) są porównywalne. Wykazaliśmy, że dowolne dwa elementy \( \bigcup D \) są porównywalne, czyli że \( \bigcup D \) jest uporządkowany liniowo przez \( \sqsubseteq \).

Na mocy Twierdzenia 3.1 definiujemy funkcję wyboru \( f \) dla zbioru \( \mathcal{P}(A)\setminus\{\emptyset\} \) zwracającą, dla każdego niepustego podzbioru \( A \), jego element. Twierdzenie Bourbakiego-Witta będziemy stosować do funkcji \( g \) przeprowadzającej \( B \) w \( B \) i zdefiniowanej następująco:

\( g(C)=\left\{\begin{array}{lll} C\cup \{f(C')\}, & \quad \textrm{jeśli } C', \textrm{zbiór elementów porównywalnych z każdym elementem } C, \textrm{jest niepusty} \\ C , & \quad \textrm{w przeciwnym przypadku}. \end{array} \right. \)

Funkcja \( g \) dostaje jako argument łańcuch w \( (A,\sqsubseteq) \) oznaczony przez \( C \) i przy pomocy funkcji \( f \) rozszerza (jeśli jest to możliwe) \( C \) o jeden element porównywalny ze wszystkimi elementami \( C \), otrzymując w ten sposób nowy, większy łańcuch.

Zbiór \( (B,\subset) \) i funkcja \( g \) spełniają założenia Twierdzenia Bourbakiego-Witta i, na jego mocy, istnieje punkt stały \( g \), czyli zbiór \( D \) taki, że \( g(D) = D \). To gwarantuje, że zbiór \( D' \) elementów porównywalnych z każdym elementem \( D \) jest pusty, czyli że \( D \) jest maksymalnym pod względem inkluzji łańcuchem w \( A \).

Równoważną wersję zasady Felixa Hausdorffa pozostawiamy jako ćwiczenie.

Ćwiczenie 3.2

Wykaż, na gruncie ZF, że następujące stwierdzenie jest równoważne zasadzie Felixa Hausdorffa: "W każdym zbiorze częściowo uporządkowanym każdy łańcuch jest zawarty w maksymalnym, pod względem inkluzji, łańcuchu".

Kolejne z równoważnych aksjomatowi wyboru twierdzeń nosi nazwę Lematu Maxa Augusta Zorna. Nazwa ta ma korzenie historyczne i dlatego pozostawiamy ją w tym brzmieniu.

Twierdzenie 3.3. [Lemat Maxa Augusta Zorna]

Jeśli w pewnym zbiorze częściowo uporządkowanym, każdy łańcuch jest ograniczony od góry, to istnieje w nim element maksymalny.

Dowodzimy kolejną implikację

Dowód

Zasada maksimum Felixa Hausdorffa implikuje Lemat Maxa Augusta Zorna. Dowód tej implikacji jest bardzo prosty. Wybierzmy dowolny zbiór częściowo uporządkowany spełniający założenia Lematu Maxa Augusta Zorna, czyli taki, że każdy łańcuch jest w nim ograniczony od góry. Na mocy zasady maksimum Felixa Hausdorffa istnieje w tym zbiorze łańcuch maksymalny pod względem inkluzji. Łańcuch ten posiada ograniczenie górne, które musi być elementem łańcucha i równocześnie elementem maksymalnym zbioru. Jeśliby tak nie było, to dodając element istotnie większy od tego ograniczenia do łańcucha danego przez zasadę maksimum Hausdorffa, uzyskalibyśmy łańcuch istotnie większy pod względem inkluzji.

Kolejne ćwiczenie mówi o istnieniu maksymalnego antyłańcucha.

Ćwiczenie 3.3

Udowodnij, używając lematu Maxa Augusta Zorna, że w każdym zbiorze częściowo uporządkowanym istnieje antyłańcuch maksymalny pod względem inkluzji.

Poniższe ćwiczenie dotyczy rozszerzeń porządków.

Ćwiczenie 3.4

Wykaż, używając lematu Maxa Augusta Zorna, że każdy częściowy porządek da się rozszerzyć do porządku liniowego. To znaczy, że dla każdego zbioru częściowo uporządkowanego \( (A,\sqsubseteq) \) istnieje liniowy porządek \( ≼ \) na \( A \) taki, że

\( x \sqsubseteq y \Longrightarrow x ≼ y. \)

dla dowolnych \( x \) i \( y \) w \( A \).

W Wykładzie 5 "Para uporządkowana, iloczyn kartezjański, relacje, domykanie relacji, relacja równoważności, rozkłady zbiorów" pokazaliśmy, że dla dowolnej relacji istnieje najmniejsza relacja równoważności zawierająca tą relację. W poniższym ćwiczeniu pokażemy, że dla niektórych relacji istnieje maksymalna, pod względem inkluzji, relacja równoważności zawarta w nich

Ćwiczenie 3.5

Użyj lematu Maxa Augusta Zorna, aby wykazać, że dla każdej relacji \( \rho \subset A\times A \), jeśli \( 1_{A}\subset\rho \), to istnieje maksymalna pod względem inkluzji relacja równoważności zawarta w \( \rho \).

Kolejny warunek równoważny dotyczy zbiorów dobrze uporządkowanych.

Twierdzenie Ernsta Zermelo

Twierdzenie Zermelo jest jedną z równoważnych postaci aksjomatu wyboru, w którą wyjątkowo trudno uwierzyć.

Twierdzenie 3.4. [Zermelo]

Dla każdego zbioru istnieje relacja, która jest dobrym porządkiem na tym zbiorze. Kolejny dowód to

Dowód

Lemat Maxa Augusta Zorna implikuje Twierdzenie Ernsta Zermelo. Ustalmy dowolny zbiór niepusty \( A \) (dla zbioru pustego porządek pusty porządkuje go dobrze). Rozważmy zbiór \( B \) składający się z podzbiorów \( A \), które mogą być dobrze uporządkowane, wraz z dobrymi porządkami

\( B = \{(C,\sqsubseteq)\,:\, C\subset A \land \sqsubseteq \) jest dobrym porządkiem na \( C \} \) i zdefiniujmy relację na elementach \( B \) w następujący sposób

\(\begin{array}{ll} \displaystyle (C,\sqsubseteq) ≼ (C',\sqsubseteq') \iff & C\subset C' \land \begin{cases}\forall c \forall d\ (c\in C\land d\in C) \Longrightarrow (c\sqsubseteq d \iff c\sqsubseteq' d) \textrm{ oraz } \\ \forall c \forall d\ (c\in C\land d\in C'\setminus C) \Longrightarrow c\sqsubseteq' d \end{cases} \end{array}\)

czyli dwa elementy \( B \) są porównywalne wtedy i tylko wtedy, jeśli zbiory, na których, są określone są porównywalne w sensie inkluzji i porządek zdefiniowany na większym zbiorze jest rozszerzeniem porządku zdefiniowanego na mniejszym przez dodanie elementów większych od wszystkich zastanych. Aby zastosować Lemat Maxa Augusta Zorna do zbioru częściowo uporządkowanego \( (B, ≼ ) \) musimy wykazać, że każdy łańcuch w tym zbiorze ma ograniczenie górne.

Niech \( D\subset B \) będzie łańcuchem w sensie \( ≼ \). Zdefiniujmy \( C_0 \) jako unię wszystkich pierwszych współrzędnych elementów \( D \) i \( \sqsubseteq_0 \) jako unię drugich współrzędnych elementów \( D \). Niewątpliwie \( C_0\subset A \). Ponieważ \( D \) jest łańcuchem w sensie \( ≼ \), to relacja \( \sqsubseteq_0 \) jest porządkiem liniowym na \( C_0 \). Aby wykazać, że \( \sqsubseteq_0 \) jest dobrym porządkiem na \( C_0 \), ustalmy dowolny \( E\subset C_0 \). Niewątpliwie istnieje element \( (C,\sqsubseteq)\in D \) taki, że \( E\cap C\neq\emptyset \). Ponieważ \( (C,\sqsubseteq)\in B \), to \( C \) jest dobrze uporządkowany przez \( \sqsubseteq \) i w związku z tym \( E\cap C \) posiada element najmniejszy w \( C,\sqsubseteq) \) - oznaczmy go przez \( x \). Element \( x \) będzie również najmniejszym elementem \( E \) w \( C_0 \). Aby to wykazać, ustalmy \( y\in E \). Jeśli \( y\in C \), to niewątpliwie \( x\sqsubseteq y \) i w związku z tym \( x\sqsubseteq_0 y \). Jeśli \( y\notin C \), to \( y \in C'\setminus C \) dla jakiegoś \( (C',\sqsubseteq')\in D \). Ponieważ \( D \) jest łańcuchem wnioskujemy, że \( C\subset C' \) i na mocy definicji \( ≼ \), że \( x\sqsubseteq' y \), czyli \( x\sqsubseteq_0 y \), co należało wykazać.

Stosując Lemat Maxa Augusta Zorna wnioskujemy, że w zbiorze częściowo uporządkowanym \( (B, ≼ ) \) istnieje element maksymalny \( (D,\sqsubseteq) \). Jeśli \( D = A \), to \( \sqsubseteq \) jest wymaganym dobrym porządkiem na \( A \). Aby wykazać, że tak musi być, załóżmy niewprost, że \( D ⊊ A \), czyli że istnieje \( d\in A\setminus D \). Wtedy zbiór \( D\cup\{d\} \) wraz z dobrym porządkiem \( \sqsubseteq' \) zdefiniowanym jako

\( a\sqsubseteq' b \iff b=d \lor (a\in D\land b\in D \land a\sqsubseteq b) \)

jest większy w sensie relacji \( ≼ \), co przeczy maksymalności \( D \). Uzyskana w dowodzie niewprost sprzeczność kończy rozumowanie.

Twierdzenie Ernsta Zermelo jest sprzeczne z intuicją wielu matematyków. Gwarantuje ono między innymi istnienie dobrego porządku na liczbach rzeczywistych, czyli takiego liniowego uporządkowania liczb rzeczywistych, w którym każdy zbiór posiada element najmniejszy. Porządek taki jest trudnym do wyobrażenia konceptem matematycznym.

Aby zamknąć ciąg rozumowań, wystarczy wykazać, że Twierdzenie Zermelo implikuje aksjomat wyboru.

Dowód

Twierdzenie Zermelo implikuje aksjomat wyboru. Niech \( x \) będzie dowolnym zbiorem spełniającym założenia aksjomatu wyboru, to znaczy takim, że \( \emptyset\notin x \) i że wszystkie elementy \( x \) są parami rozłączne. Niech \( \sqsubseteq \) będzie istniejącym, na podstawie Twierdzenia Zermelo, dobrym uporządkowaniem zbioru \( \bigcup x \). Zbiór wybierający po jednym elemencie z każdego elementu \( x \) otrzymujemy, stosując zasadę wycinania do \( \bigcup x \)

\( w = \{y\in\bigcup x\,:\, \exists z\; y\in z\in x \land y \) jest najmniejszym elementem \( z \) względem relacji \( \sqsubseteq\}. \)

Zbiór \( w \) posiada po dokładnie jednym elemencie wspólnym z każdym zbiorem \( z\in x \) - jest to element najmniejszy w \( z \) względem dobrego uporządkowania \( \bigcup x \).

Nasze rozumowanie wykazało, że wszystkie powyższe fakty są równoważne na gruncie ZF. Jak wspomnieliśmy na początku, aksjomat wyboru jest kontrowersyjnym aksjomatem. Niektóre z równoważnych mu stwierdzeń są intuicyjnie oczywiste, inne przeczą intuicji. Podsumujemy rozdział żartem autorstwa Jerrego Bona:

The Axiom of Choice is obviously true; the Well Ordering Principle is obviously false; and who can tell about Max August Zorn's Lemma? (Aksjomat wyboru jest oczywiście prawdziwy; twierdzenie Ernsta Zermelo jest oczywiście fałszem; lemat Zorn'a kto wie?)

Twierdzenia wymagające aksjomatu wyboru

Twierdzenia wymagające aksjomatu wyboru


Wiele twierdzeń wymaga aksjomatu wyboru, choć założenie ich prawdziwości w ZF nie implikuje prawdziwości tego aksjomatu. W tej części wykładu przedstawimy kilka tego typu twierdzeń. Zwróćmy uwagę, że żadna z dostępnych w tej chwili technik dowodowych nie nadaje się do udowodnienia, że jakiś fakt jest słabszy od aksjomatu wyboru. Możemy pokazać, że jeśli aksjomat wyboru jest prawdą, to dane twierdzenie jest prawdziwe, ale nie możemy pokazać, że jeśli założymy dane twierdzenie, to aksjomat wyboru nie musi być prawdą. Nie jesteśmy w stanie zdecydować, czy aksjomat wyboru jest niezbędny do udowodnienia danego twierdzenia - tego typu dowody wykraczają poza zakres tego kursu i nie będą prezentowane.

Pierwszy z faktów, które będziemy dowodzić brzmi następująco:

Twierdzenie 4.1.

Dla dowolnego zbioru nieskończonego istnieje iniekcja ze zbioru liczb naturalnych w ten zbiór.

Dowód 1

Co możemy dowieść bez aksjomatu wyboru. Ustalmy dowolny zbiór nieskończony \( A \). Na mocy definicji z wykładu "Teoria mocy twierdzenie Cantora-Bernsteina, twierdzenie Cantora. Zbiory przeliczalne, zbiory mocy kontinuum" wiemy, że nie istnieje bijekcja między \( A \) a żadną liczbą naturalną. Pokażmy najpierw, że dla każdej liczby naturalnej \( n \) istnieje iniekcja z \( n \) do \( A \). Dowód przeprowadzamy przez indukcję na \( n \).

  • Jeśli \( n=0 \), to niewątpliwie istnieje iniekcja ze zbioru pustego w \( A \) - jest to funkcja pusta.
  • Załóżmy, że istnieje iniekcja \( f:n \rightarrow A \). Ponieważ nie istnieje bijekcja pomiędzy \( n \) a \( A \), wnioskujemy, że \( \vec{f}(n) ⊊ A \), czyli że istnieje \( a\in A\setminus \vec{f}(n) \). Zdefiniujmy \( f':n' \rightarrow A \) jako

\( \displaystyle f'(m)=\left\{\begin{array}{ll} f(m), & \quad \textrm{jeśli } m \in n, \\ a , & \quad \textrm{jeśli } m=n. \end {array} \right. \)

Funkcja \( f' \) jest iniekcją, co kończy dowód indukcyjny.

Wykazaliśmy jedynie, że dla każdej liczby naturalnej istnieje iniekcja z niej w \( A \). Nie udało nam się wykazać istnienia jednej funkcji dla całego zbioru \( \mathbb{N} \).

Dowód 2

Dowód przy użyciu aksjomatu wyboru. Aby udowodnić istnienie iniekcji z \( \mathbb{N} \) w \( A \), skorzystamy z Twierdzenia  twierdzenie 3.1. równoważnego aksjomatowi wyboru. Zastosujmy je do zbioru \( \mathcal{P}(A)\setminus \{\emptyset\} \), dostając funkcję \( e:\mathcal{P}(A)\setminus \{\emptyset\} \rightarrow A \) taką, że \( e(B)\in B \) dla każdego \( B \), jeśli tylko \( \emptyset \neq B \subset A \). Aby udowodnić istnienie żądanej funkcji, zastosujemy twierdzenie o definiowaniu przez indukcję. Dzięki temu twierdzeniu dostaniemy funkcję \( h: \mathbb{N}\times\{\emptyset\} \rightarrow
\mathcal{P}(A) \) taką, że

\( h(0, \emptyset) = \{e(A)\} \)

oraz

\( h(n',\emptyset) = h(n,\emptyset)\cup \{e(A\setminus h(n))\}. \)

Jest to funkcja, która każdej liczbie naturalnej przyporządkowuje zbiór o jeden element większy niż przyporządkowany poprzedniej liczbie naturalnej. Aby otrzymać żądaną iniekcję wystarczy zdefiniować:

\( f(n) = x \iff h(n',\emptyset)\setminus h(n,\emptyset) = \{x\}. \)

Funkcja \( f \) jest dobrze zdefiniowana, ponieważ dla każdego \( n \) zbiór \( h(n',\emptyset)\setminus h(n',\emptyset) \) jest jednoelementowy (co gwarantuje definicja funkcji \( e \)). A jest iniekcją, ponieważ \( h(m,\emptyset)\subset h(n,\emptyset) \), jeśli tylko \( m\leq n \).

Kolejną konsekwencję podajemy w formie ćwiczenia.

Ćwiczenie 4.1

Rozważmy przedział \( [-1,3] \) w zbiorze liczb rzeczywistych. Niech funkcja \( f:\mathcal{P}([-1,3]) \rightarrow \mathbb{R} \) będzie "miłą miarą zbiorów", jeśli:

  • dla każdego zbioru jego miara jest większa lub równa \( 0 \) i \( f([0,1])=1 \),
  • jeśli zbiór \( A \) ma miarę \( f(A) \) to \( f(\{x+r\,:\, x\in A\})=f(A) \) dla dowolnego \( r \) - to znaczy, że przesunięcie zbioru o wektor nie zmienia jego miary,
  • jeśli \( A_0, A_1,\dotsc \) są zbiorami parami rozłącznymi, to suma tych zbiorów ma miarę równą sumie miar

\( f(\bigcup_i A_i) =\sum_i f(A_i), \)

to znaczy, że sumowanie zbiorów rozłącznych zachowuje miarę.

Wykaż, że nie istnieje miła miara zbiorów.

Podpowiedź

Połóż dwie liczby w relacji ze sobą jeśli ich różnica jest wymierna.

Podpowiedź

Wybierz po jednym reprezentancie z każdej klasy równoważności i przesuń go o wektor.

Rozwiązanie

Załóżmy, niewprost, że istnieje miła miara \( f \). Zdefiniujmy relację równoważności \( \,\rho\, \) na zbiorze \( [0,1] \) w następujący sposób

\( x\,\rho\, y \iff x-y\in\mathbb{Q}. \)

Niewątpliwie relacja \( \,\rho\, \) jest relacją równoważności:

  • \( x\,\rho\, x \) ponieważ \( x-x=0\in\mathbb{Q} \),
  • \( x\,\rho\, y \Longrightarrow y\,\rho\, x \) ponieważ, jeśli \( x-y\in\mathbb{Q} \) to również \( y-x = -(x-y)\in\mathbb{Q} \),
  • \( x\,\rho\, y \land y\,\rho\, z \Longrightarrow x\,\rho\, z \) ponieważ jeśli \( x-y\in \mathbb{Q} \) i \( y-z\in \mathbb{Q} \), to również \( x-z = (x-y)+(y-z)\in\mathbb{Q} \).

W związku z tym zbiór \( [0,1] \) podzielony jest na klasy równoważności i, na mocy aksjomatu wyboru, możemy wybrać zbiór \( C \) posiadający po jednym elemencie z każdej klasy równoważności. Rozważmy przeliczalną rodzinę zbiorów \( \{C_r\} \), gdzie \( r \) jest liczbą wymierną z przedziału \( [-1,1] \), a zbiór \( C_r \) jest translacją zbioru \( C \) o liczbę \( r \)

\( C_r=\{c+r\,:\, c\in C\}. \)

Ponieważ każdy element zbioru \( [0,1] \) jest odległy o liczbę wymierną od jakiegoś elementu \( C \) (ponieważ jest z nim w tej samej klasie równoważności) i ponieważ ta odległość nie może być większa niż \( 1 \), to

\( [0,1] \subset \bigcup_r C_r \subset [-1,2], \)

czyli miara zbioru \( \bigcup_r C_r \) musi być pomiędzy \( f([0,1])=1 \), a \( f([-1,2])\leq 3 \). Ale, z założenia o mierze \( f \) mamy \( f(C) = f(C_r) \) dla każdego \( r \). Oraz

\( f(\bigcup_r C_r) = \sum_r f(C_r) = \sum_r f(C), \)

skąd wnioskujemy, że \( f(\bigcup_r C_r) \) musi być równe zero (w przeciwnym przypadku suma po prawej stronie równości byłaby nieskończona) i w związku z tym również \( \sum_r f(C_r) = 0 \), czyli zbiór \( C \) ma miarę \( 0 \), co jest żądaną sprzecznością. Skonstruowany przez nas zbiór \( C \) nazywa się, od nazwiska pomysłodawcy, zbiorem Vitaliego.

Podsumowanie

Podsumowanie



W powyższym wykładzie przedstawiliśmy twierdzenia równoważne aksjomatowi wyboru i udowodniliśmy kilka jego konsekwencji. Aksjomat wyboru jest kontrowersyjnym aksjomatem. Przyjęcie go, pociąga za sobą nieintuicyjne konsekwencje. Zakładając aksjomat wyboru, możemy wykazać, że zbiór liczb rzeczywistych daje się uporządkować w taki sposób, że każdy jego podzbiór ma element najmniejszy. Kolejną nieintuicyjną konsekwencją jest wykazany przez Stefana Banacha i Alfreda Tarskiego paradoksalny rozkład trójwymiarowej kuli na sześć części, z których, za pomocą obrotów i translacji, możemy skleić dwie kule identyczne z pierwszą.

Z drugiej strony, wiele intuicyjnych faktów wymaga aksjomatu wyboru lub jednej z jego słabszych wersji. Twierdzenie, że jeśli zbiór jest nieskończony, to istnieje iniekcja liczb naturalnych w ten zbiór, jest intuicyjnym faktem. Bertrand Russell powiedział o aksjomacie wyboru:

The Axiom of Choice is necessary to select a set from an infinite number of socks, but not an infinite number of shoes (Aksjomat wyboru jest niezbędny, aby wybrać zbiór z nieskończonej ilości skarpet, ale nie z nieskończonej ilości butów).

Znaczenie tego cytatu powinno być jasne. Jesteśmy w stanie wybrać po jednym bucie z nieskończonego zbioru par mówiąc "wybierzmy buty lewe". Nie jesteśmy w stanie przeprowadzić tego rozumowania, jeśli byty występujące w zbiorach są identyczne.

Twierdzenie o indukcji. Liczby porządkowe. Zbiory liczb porządkowych. Twierdzenie o definiowaniu przez indukcje pozaskończoną

Wprowadzenie



W poniższym wykładzie przyjrzymy się dokładnie zbiorom dobrze uporządkowanym. Jedną z ważniejszych własności tych zbiorów jest to, że prawdziwa jest w nich uogólniona zasada indukcji zwana "indukcją pozaskończoną". Jest to szczególnie istotne w kontekście twierdzenia Zermelo które mówi, że każdy zbiór da się dobrze uporządkować. Możemy dzięki temu przeprowadzać dowody indukcyjne oraz definiować nowe funkcje za pomocą indukcji pozaskończonej na zbiorach większych niż przeliczalne.

Dobre uporządkowanie

Dobre uporządkowanie



Przypomnijmy, że zbiorem dobrze uporządkowanym nazywamy zbiór częściowo uporządkowany, w którym każdy niepusty podzbiór ma element najmniejszy. Wynika stąd, że również w całym zbiorze musi istnieć element najmniejszy, o ile tylko zbiór jest niepusty.

Przykład 2.1.

Przykładem zbioru dobrze uporządkowanego jest zbiór \( \displaystyle \mathbb{N} \) uporządkowany, przez \( \displaystyle \subset \). Zasada minimum, wykład 7 "Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje", Twierdzenie 5.2 mówi, że w każdym podzbiorze \( \displaystyle \mathbb{N} \) istnieje element najmniejszy, a więc, że ten porządek jest dobry.

Ćwiczenie 2.2

Udowodnij, że każdy dobry porządek jest porządkiem liniowym.


Zbiory dobrze uporządkowane mają bardzo specyficzną strukturę. Jedną z własności jest istnienie następników dla prawie wszystkich elementów.

Definicja 2.3.

W zbiorze uporządkowanym \( \displaystyle (X,\leq) \) element \( \displaystyle y \) nazywamy następnikiem elementu \( \displaystyle x \), jeśli \( \displaystyle x \leq y \), \( \displaystyle x\neq y \) oraz każdy element silnie większy od \( \displaystyle x \) jest nie mniejszy od \( \displaystyle y \) (czyli \( \displaystyle (x \leq z \wedge x \neq z) \Rightarrow y\leq z \)).

Ćwiczenie 2.4

Podaj przykład zbioru uporządkowanego, w którym żaden element nie ma następnika.

Twierdzenie 2.5.

W zbiorze dobrze uporządkowanym każdy element, który nie jest elementem największym, ma następnik.

Dowód

Niech \( \displaystyle (X,\leq) \) będzie zbiorem dobrze uporządkowanym. Niech \( \displaystyle x \) będzie dowolnym elementem zbioru \( \displaystyle X \), który nie jest elementem największym. Zdefiniujmy zbiór \( \displaystyle A \) następująco:

\( \displaystyle A= \{y\in X: x < y\}. \)

Zbiór \( \displaystyle A \) jest niepusty, gdyż \( \displaystyle x \) nie jest elementem największym. Ponieważ \( \displaystyle X \) jest dobrze uporządkowany, to w zbiorze \( \displaystyle A \) istnieje element najmniejszy, nazwijmy go \( \displaystyle y \). Pokażemy, że jest następnikiem \( \displaystyle x \). Ponieważ \( \displaystyle y\in A \), to \( \displaystyle x < y \). Weźmy dowolny element \( \displaystyle z\in X \), który jest silnie większy od \( \displaystyle x \). Wtedy \( \displaystyle z \) musi należeć do \( \displaystyle A \), a więc ponieważ \( \displaystyle y \) jest najmniejszy w \( \displaystyle A \), to \( \displaystyle y\leq z \). Wobec tego \( \displaystyle y \) jest następnikiem elementu \( \displaystyle x \).

Definicja 2.6.

Element zbioru dobrze uporządkowanego nazywamy elementem granicznym, jeśli nie jest następnikiem, żadnego elementu.

Ćwiczenie 2.7

Podaj przykład zbioru uporządkowanego liniowo, w którym każdy element ma następnik, a zbiór nie jest dobrze uporządkowany. Czy zbiór tak uporządkowany może mieć element najmniejszy?

Pokażemy teraz, że każdy zbiór \( \displaystyle (X,\leq) \) dobrze uporządkowany jest podobny do pewnej rodziny zbiorów uporządkowanych przez inkluzję.

Definicja 2.8.

Niech \( \displaystyle (X,\leq) \) będzie zbiorem uporządkowanym. Zbiór \( \displaystyle A\subset X \) nazywamy przedziałem początkowym \( \displaystyle (X,\leq) \) jeśli

\( \displaystyle \forall_{x\in A} \forall_{y\in X} ( y\leq x \Rightarrow y\in A ). \)

Czyli \( \displaystyle A \) jest przedziałem początkowym, jeśli wraz z każdym swoim elementem zawiera także wszystkie elementy zbioru \( \displaystyle X \), które są od niego mniejsze. Będziemy używać następujących oznaczeń, dla \( \displaystyle x_0\in X \) niech:

\( \displaystyle O(x_0)=\{x\in X: x < x_0\} \)

oraz:

\( \displaystyle \overline{O(x_0)}=\{x\in X: x \leq x_0\}. \)

Zbiór \( \displaystyle \overline{O(x_0)} \) będziemy nazywać domkniętym przedziałem początkowym.

Twierdzenie 2.9.

Jeśli \( \displaystyle (X,\leq) \) będzie zbiorem dobrze uporządkowanym. Wtedy każdy jego przedział początkowy, różny od \( \displaystyle X \), jest postaci \( \displaystyle \{x\in X: x < x_0\} \), dla pewnego elementu \( \displaystyle x_0\in X \) (czyli każdy przedział początkowy jest postaci \( \displaystyle O(x_0) \)).

Dowód

Niech \( \displaystyle A \) będzie przedziałem początkowym \( \displaystyle X \) różnym od \( \displaystyle X \). Wtedy zbiór \( \displaystyle X\setminus A \) jest niepusty i jest podzbiorem \( \displaystyle X \), więc posiada element najmniejszy, oznaczmy go przez \( \displaystyle x_0 \). Pokażemy, że \( \displaystyle A=O(x_0) \). Przypuśćmy, że istnieje element \( \displaystyle y\in X \) taki, że \( \displaystyle y\in A \) oraz \( \displaystyle x_0\leq y \). Wtedy ponieważ \( \displaystyle A \) jest przedziałem początkowym, to \( \displaystyle x_0 \) również musiałby być elementem \( \displaystyle A \), co jest sprzeczne z tym, że \( \displaystyle x_0\in X\setminus A \). Wobec tego wszystkie elementy \( \displaystyle A \) są silnie mniejsze od \( \displaystyle x_0 \). Przypuśćmy teraz, że istnieje element \( \displaystyle y\in X \), który jest silnie mniejszy od \( \displaystyle x_0 \) i nie należy do \( \displaystyle A \). Wtedy \( \displaystyle y\in X \setminus A \) i ponieważ jest silnie mniejszy od \( \displaystyle x_0 \), to dostajemy sprzeczność z faktem, że \( \displaystyle x_0 \) jest najmniejszy w tym zbiorze. Wobec tego zbiór \( \displaystyle A \) składa się dokładnie z elementów silnie mniejszych od \( \displaystyle x_0 \), co oznacza, że \( \displaystyle A=O(x_0) \).

Ćwiczenie 2.10

Podaj przykład zbioru dobrze uporządkowanego \( \displaystyle X \), w którym istnieje przedział początkowy różny od \( \displaystyle X \), który nie jest postaci \( \displaystyle \{x\in X: x \leq x_0\} \) (uwaga! nierówność jest słaba).


Ćwiczenie 2.11

Udowodnij, że dla każdego dobrego porządku \( \displaystyle (X,\leq) \) istnieje funkcja, która niepustym podzbiorom \( \displaystyle X \) przypisuje ich element najmniejszy. Funkcje tę nazywamy \( \displaystyle \min: \mathcal{P}(X) \setminus \{\emptyset\} \rightarrow X \).

W poniższym twierdzeniu przedstawiamy konstrukcję rodziny zbiorów uporządkowanej przez \( \displaystyle \subset \) podobnej do danego zbioru dobrze uporządkowanego.

Twierdzenie 2.12

Niech \( \displaystyle (X,\leq) \) będzie zbiorem dobrze uporządkowanym, a \( \displaystyle \mathcal{R} \) będzie zbiorem jego istotnych przedziałów początkowych. Wtedy \( \displaystyle (X,\leq) \) jest podobny do \( \displaystyle (\mathcal{R},\subseteq) \).

Dowód

Zdefiniujmy funkcję \( \displaystyle f:X \rightarrow \mathcal{R} \), tak aby \( \displaystyle f(x)=O(x) \). Pokażemy, że ta funkcja ustala podobieństwo. Pokażemy po kolei, że jest suriekcją , iniekcją oraz że jest monotoniczna:

  1. Suriektywność funkcji \( \displaystyle f \) wynika z Twierdzenia 2.9 (patrz Twierdzenie 2.9).
  2. Weźmy dowolne \( \displaystyle x,y \in X \) takie, że \( \displaystyle x < y \). Wtedy z definicji \( \displaystyle x \in O(y) \) oraz \( \displaystyle x\notin O(x) \), a więc \( \displaystyle f(x)\neq f(y) \).
  3. Weźmy dowolne \( \displaystyle x,y \in X \) takie, że \( \displaystyle x < y \). Weźmy dowolny \( \displaystyle z\in f(x) \).

Oznacza to, że \( \displaystyle z\in O(x) \), a więc \( \displaystyle z < x \). Wtedy również \( \displaystyle z < y \), a więc \( \displaystyle z\in O(y)=f(y) \). Wobec dowolności wyboru \( \displaystyle z \) otrzymujemy \( \displaystyle f(x) \subset f(z) \), a więc funkcja \( \displaystyle f \) jest monotoniczna.

Zauważmy, że własność bycia dobrym porządkiem jest przenoszona przez podobieństwo porządków.

Ćwiczenie 2.13

Jeśli porządki \( \displaystyle (X,\leq_X) \) oraz \( \displaystyle (Y,\leq_Y) \) są podobne, to \( \displaystyle (X,\leq_X) \) jest dobry wtedy i tylko wtedy, gdy \( \displaystyle (Y,\leq_Y) \) jest dobry.

Ćwiczenie 2.14

Dla zbiorów uporządkowanych \( \displaystyle (X,\leq_X) \), \( \displaystyle (Y,\leq_Y) \) porządek leksykograficzny \( \displaystyle \prec \subset X\times Y \) definiujemy tak, że:

\( \displaystyle (a,b) \prec (c,d) \Leftrightarrow (a\leq_X c) \vee (a=c \wedge b\leq_Y c), \)

Dla zbiorów \( \displaystyle \{0,1\},\mathbb{N}, \mathbb{Z}, \mathbb{R} \) uporządkowanych w naturalny sposób, sprawdź, czy następujące ich produkty są dobrze uporządkowane:

  1. \( \displaystyle \{0,1\} \times \mathbb{N} \),
  2. \( \displaystyle \mathbb{N} \times \mathbb{N} \),
  3. \( \displaystyle \mathbb{Z} \times \mathbb{N} \),
  4. \( \displaystyle \mathbb{N} \times \mathbb{Z} \).

Ćwiczenie 2.15

Rozważmy dwa porządki \( \displaystyle \ll,\prec \) na zbiorze \( \displaystyle \mathbb{N} \times \mathbb{N} \) zdefiniowane w następujący sposób:

\( \displaystyle (a,b)\prec(c,d) \Leftrightarrow (a < c) \vee (a=c \wedge b\leq d) \)
\( \displaystyle (a,b)\ll (c,d) \Leftrightarrow (a=b=0) \vee (\neg(a=b=0) \wedge ((a < c) \vee (a=c \wedge d\leq b))). \)

Czy porządki te są podobne?


Ćwiczenie 2.16

Czy porządek leksykograficzny na zbiorze \( \displaystyle \{0,1\}^* \) jest dobrym porządkiem. (Zbiór \( \displaystyle \{0,1\}^* \) to zbiór wszystkich skończonych ciągów złożonych z 0 i 1. Porządek leksykograficzny na takim zbiorze definiujemy jako \( \displaystyle x\prec y \), jeśli \( \displaystyle x \) jest prefiksem \( \displaystyle y \) lub jeśli na pierwszej współrzędnej, na której się różnią w \( \displaystyle x \) występuje 0, a w \( \displaystyle y \) występuje 1.)


Zasada indukcji

Zasada indukcji


Zdefiniujemy teraz zasadę indukcji, która będzie obowiązywała w zbiorach dobrze uporządkowanych.

Definicja 3.1.

Niech \( \displaystyle (X,\leq) \) będzie liniowym porządkiem. W \( \displaystyle (X,\leq) \) obowiązuje zasada indukcji, jeśli dla dowolnego zbioru \( \displaystyle Z \) takiego, że:

  1. \( \displaystyle Z \subset X \),
  2. \( \displaystyle Z\neq \emptyset \),
  3. dla dowolnego \( \displaystyle x\in X \), jeśli \( \displaystyle \{y\in X: y < x\} \subset Z \), to \( \displaystyle x\in Z \).

zachodzi \( \displaystyle Z=X \).

W wykładzie o liczbach naturalnych udowodniliśmy twierdzenie o indukcji (patrz wykład 7 "Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje", Twierdzenie 3.1), z którego wynika, że zasada indukcji obowiązuje w \( \displaystyle (\mathbb{N},\leq) \). W poniższym twierdzeniu dowodzimy analogiczne twierdzenie, dla wszystkich zbiorów dobrze uporządkowanych.

Twierdzenie 3.2.

W każdym zbiorze dobrze uporządkowanym obowiązuje zasada indukcji.

Dowód

Niech \( \displaystyle (X,\leq) \) będzie dobrym porządkiem. Niech \( \displaystyle Z \) będzie dowolnym zbiorem takim, że:

  1. \( \displaystyle Z \subset X \),
  2. element najmniejszy \( \displaystyle X \) należy do \( \displaystyle Z \),
  3. dla dowolnego \( \displaystyle x\in X \) jeśli \( \displaystyle \{y\in X: y < x\} \subset Z \) to \( \displaystyle x\in Z \).

Pokażemy, że \( \displaystyle Z=X \). Niech \( \displaystyle A=X \setminus Z \). Dla dowodu niewprost przypuśćmy, że \( \displaystyle A\neq \emptyset \). W takim przypadku w zbiorze \( \displaystyle A \) istnieje element najmniejszy \( \displaystyle a \). Skoro \( \displaystyle a \) jest najmniejszy w \( \displaystyle A \), to każdy element \( \displaystyle b\in X \), dla którego \( \displaystyle b < a \) musi należeć do \( \displaystyle Z \) (nie może należeć do \( \displaystyle A \) więc należy do \( \displaystyle X\setminus A =Z \)). Wtedy wiemy, że \( \displaystyle \{b\in X: b < a\}\subset Z \), a więc z trzeciej własności zbioru \( \displaystyle Z \) otrzymujemy \( \displaystyle a\in Z \), a więc dostaliśmy sprzeczność (bo \( \displaystyle a \in A \cap Z \), a te zbiory są rozłączne).

Okazuje się, że dobre porządki są nawet bardziej związane z zasadą indukcji. Wyrazem tego jest poniższe twierdzenie.

Twierdzenie 3.3.

Każdy porządek liniowy, w którym istnieje element najmniejszy i obowiązuje zasada indukcji jest dobry.

Dowód

Niech \( \displaystyle (X,\leq) \) będzie liniowym porządkiem, w którym istnieje element najmniejszy \( \displaystyle \bot \) oraz obowiązuje zasada indukcji. Niech \( \displaystyle A\subset X \) będzie podzbiorem \( \displaystyle X \), w którym nie ma elementu najmniejszego. Zdefiniujmy zbiór \( \displaystyle Z \) jako zbiór tych elementów \( \displaystyle X \), które są mniejsze od wszystkich elementów z \( \displaystyle A \), czyli:

\( \displaystyle Z= \{z\in X: \forall_{a\in A} z < a\}. \)

Zbiór \( \displaystyle Z \) jest niepusty, gdyż \( \displaystyle \bot \in Z \) (\( \displaystyle \bot \) nie może należeć do \( \displaystyle A \), gdyż byłby najmniejszy). Pokażemy, że dla dowolnego \( \displaystyle x\in X \), jeśli \( \displaystyle \{y\in X: y < x \} \subset Z \), to \( \displaystyle x\in Z \). Przypuśćmy, że tak nie jest. Wtedy dla pewnego \( \displaystyle x_0\in X \) mamy \( \displaystyle \{y\in X: y < x_0 \} \subset Z \) oraz \( \displaystyle x_0\notin Z \). Wynika stąd, że istnieje element \( \displaystyle a\in A \) taki, że \( \displaystyle a\leq x_0 \), ponieważ jednak żaden element mniejszy od \( \displaystyle x_0 \) nie należy do \( \displaystyle A \), to \( \displaystyle a=x_0 \), a więc \( \displaystyle x_0\in A \). Z tego samego powodu i z faktu, że porządek jest liniowy otrzymujemy, że element \( \displaystyle x_0 \) jest najmniejszy w \( \displaystyle A \), co jest sprzeczne z założeniem, że w \( \displaystyle A \) nie ma elementu najmniejszego. Wobec tego konieczne jest, aby \( \displaystyle x\in Z \).

Pokazaliśmy, że zbiór \( \displaystyle Z \) spełnia założenia zasady indukcji. Ponieważ zasada ta obowiązuje w \( \displaystyle (X,\leq) \), to otrzymujemy \( \displaystyle Z=X \). Wynika stąd, że zbiór \( \displaystyle A \) musi być pusty. Wobec tego każdy niepusty podzbiór \( \displaystyle X \) ma element najmniejszy, a więc \( \displaystyle (X,\leq) \) jest dobrym porządkiem.

Twierdzenie o definiowaniu przez indukcję udowodnione dla liczb naturalnych również ma swój odpowiednik dla dobrych porządków. Mówi ono, że jeśli wyspecyfikujemy sposób konstrukcji wartości funkcji na argumentach \( \displaystyle (x,b) \) na podstawie wartości \( \displaystyle x,b \) oraz wartości tej funkcji dla wszystkich \( \displaystyle (y,b) \) takich, że \( \displaystyle y < x \), to wyznaczymy jednoznacznie funkcję \( \displaystyle h \) odpowiadającą tej specyfikacji. Twierdzenie to, nazywane jest twierdzeniem o definiowaniu przez indukcję pozaskończoną, gdyż najważniejsze zastosowania ma właśnie dla zbiorów nieskończonych.

Twierdzenie 3.4. [o definiowaniu przez indukcję pozaskończoną]

Niech \( \displaystyle (X,\leq) \) będzie dobrym porządkiem. Przez \( \displaystyle PF(P,Q) \) oznaczamy zbiór wszystkich funkcji częściowych ze zbioru \( \displaystyle P \) do \( \displaystyle Q \). Pokażemy, że dla każdej funkcji \( \displaystyle g:PF(X \times B,C)\times X \times B \rightarrow C \) istnieje dokładnie jedna funkcja \( \displaystyle h:X \times B \rightarrow C \), dla której:

\( \displaystyle h(x,b)= g( h \cap (O(x) \times B \times C) ,x,b). \quad \quad \quad (3.1) \)

Dowód

Dowód przebiega analogicznie jak dla liczb naturalnych. Rozważmy następujący zbiór

\( \displaystyle H=\{e \in PF(X \times B,C): \exists_{a\in X} [(1) \wedge (2)]\}, \)

gdzie \( \displaystyle (1) \) i \( \displaystyle (2) \) oznaczają odpowiednio:

  1. \( \displaystyle e:\overline{O(a)} \times B \rightarrow C \),
  2. \( \displaystyle \forall_{x\in \overline{O(a)}}\forall_{b\in B}\; e(x,b)= g( e \cap (O(x) \times B \times C) ,x,b) \).

Innymi słowy, \( \displaystyle H \) jest zbiorem funkcji częściowych określonych na przedziałach początkowych \( \displaystyle X \), spełniających równość 3.1.

Pokażemy, że dla każdych dwóch funkcji częściowych \( \displaystyle h_1, h_2 \in H \) jedna z nich jest rozszerzeniem drugiej. Przypuśćmy, że tak nie jest. Weźmy funkcje \( \displaystyle h_1, h_2 \in H \) określone odpowiednio na zbiorach \( \displaystyle \overline{O(a_1)} \times B, \overline{O(a_2)} \times B \), które różnią się na pewnym argumencie, na którym obie są określone. Bez straty ogólności możemy założyć, że \( \displaystyle a_1\leq a_2 \). Rozważmy zbiór \( \displaystyle D=\{y\in \overline{O(a_1)}: \exists_{b\in B} h_1(y,b) \neq h_2(y,b) \). Zbiór \( \displaystyle D \) jest podzbiorem \( \displaystyle X \). Skoro funkcje się różnią na jakimś argumencie, to jest \( \displaystyle D \) niepusty, a więc zawiera element najmniejszy, oznaczmy go przez \( \displaystyle z \). Skoro \( \displaystyle z \) jest najmniejszy, to dla \( \displaystyle v < z \) dla wszystkich \( \displaystyle b\in B \) funkcje muszą być równe. Czyli:

\( \displaystyle h_1\cap (O(z) \times B \times C) = h_2\cap (O(z) \times B \times C), \)

wobec tego dla dowolnego \( \displaystyle b\in B \) mamy:

\( \displaystyle g(h_1\cap (O(z) \times B \times C),z,b) = g( h_2\cap (O(z) \times B \times C),z,b). \)

I skoro obie funkcje są określone na \( \displaystyle z \) i należą do \( \displaystyle H \), to dla dowolnego \( \displaystyle b\in B \) z warunku (2) otrzymamy \( \displaystyle h_1(z,b)=h_2(z,b) \). Otrzymaliśmy więc sprzeczność z faktem, że \( \displaystyle z\in D \). Wobec tego \( \displaystyle D \) jest pusty i \( \displaystyle h_2 \) jest rozszerzeniem \( \displaystyle h_1 \).

Pokażemy teraz, że dla każdego \( \displaystyle a\in X \) istnieje w \( \displaystyle H \) funkcja określona na \( \displaystyle \overline{O(a)} \times B \). Niech \( \displaystyle A \subset X \) będzie zbiorem tych elementów \( \displaystyle y\in X \), dla których nie istnieje w \( \displaystyle H \) funkcja określona na \( \displaystyle \overline{O(y)} \times B \). Załóżmy dla dowodu niewprost, że ten zbiór jest niepusty. Jako podzbiór zbioru dobrze uporządkowanego posiada element najmniejszy, oznaczmy go przez \( \displaystyle z \). Niech \( \displaystyle H_z \) będzie zbiorem funkcji częściowych z \( \displaystyle H \) określonych na domkniętych przedziałach początkowych silnie mniejszych od \( \displaystyle \overline{O(z)} \), ponieważ \( \displaystyle z \) jest najmniejszy w \( \displaystyle A \), to na każdym takim przedziale jest określona jakaś funkcja należąca do \( \displaystyle H \). Określimy funkcję \( \displaystyle h_z \) jako:

\( \displaystyle h_z= \bigcup H_z \cup \bigcup_{b\in B} \{((z,b),g(\bigcup H_z,z,b))\}. \)

Zauważmy \( \displaystyle \bigcup H_z \) jest funkcją częściową, gdyż dla każdych dwóch funkcji z \( \displaystyle H_z \) jedna z nich jest rozszerzeniem drugiej. Z powyższej definicji wynika, że \( \displaystyle h_z:\overline{O(z)} \times B \rightarrow C \). Wobec tego \( \displaystyle h_z \) spełnia pierwszy warunek przynależności do zbioru \( \displaystyle H \). Pokażemy, że spełnia również drugi. Weźmy dowolny \( \displaystyle x\in \overline{O(z)} \) oraz \( \displaystyle b\in B \). Rozważymy dwa przypadki.

1. Jeśli \( \displaystyle x=z \), to:

\( \displaystyle h_z(z,b)= g(\bigcup H_z,b,z) \)

i ponieważ \( \displaystyle h_z \cap (O(z) \times B \times C)= \bigcup H_z \), to:

\( \displaystyle h_z(z,b)= g(h_z \cap (O(z) \times B \times C),z,b). \)

2. W pozostałym przypadku \( \displaystyle x < z \). Wtedy \( \displaystyle (x,h_z(x)) \in \bigcup H_z \), a więc musi należeć do którejś z funkcji z \( \displaystyle H_z \), nazwijmy tę funkcję \( \displaystyle h_x \). Ponieważ \( \displaystyle h_x \in H \), to:

\( \displaystyle h_z(x,b)=h_x(x,b)= g(h_x \cap (O(x) \times B \times C),z,b). \)

Skoro \( \displaystyle h_x \in H_z \) to \( \displaystyle h_x\subset \bigcup H_z \), a więc \( \displaystyle h_x\subset h_z \). Ponieważ jednak \( \displaystyle h_x \) jest określona na całym zbiorze \( \displaystyle O(x) \times B \), to:

\( \displaystyle h_z(x,b)=g(h_x \cap (O(x) \times B \times C),x,b)=g( h_z \cap (O(x) \times B \times C),x,b). \)

Stąd otrzymujemy:

\( \displaystyle h_z(x,b)= g(h_z \cap (O(x) \times B \times C),z,b). \)

Wobec tego funkcja \( \displaystyle h_z \) spełnia także drugi warunek przynależności do \( \displaystyle H \), a więc \( \displaystyle h_z\in H \). Ponieważ \( \displaystyle h_z:\overline{O(z)} \times B \rightarrow C \) to otrzymaliśmy sprzeczność z \( \displaystyle z\in A \). Wobec tego zbiór \( \displaystyle A \) musi być pusty. Czyli dla każdego \( \displaystyle a\in X \) istnieje w \( \displaystyle H \) funkcja określona na \( \displaystyle \overline{O(a)} \times B \).

Pokażemy, że szukaną funkcją \( \displaystyle h \) jest \( \displaystyle \bigcup H \). Ponieważ elementy zbioru \( \displaystyle H \) są funkcjami częściowymi i zbiór \( \displaystyle H \) jest uporządkowanymi przez inkluzję, to \( \displaystyle h \) jest funkcją częściową. Ponieważ dla każdego \( \displaystyle x\in X \) istnieje w \( \displaystyle H \) funkcja \( \displaystyle h_x: \overline{O(x)} \times B \rightarrow C \), to \( \displaystyle h \) jest określona na wszystkich elementach \( \displaystyle X \times B \). Stąd otrzymujemy \( \displaystyle h:X\times B \rightarrow C \). Ze sposobu konstrukcji \( \displaystyle h \) wynika również, że spełniona jest równość 3.1.

Pozostało pokazać, że \( \displaystyle h \) jest jedyną taką funkcją. Przypuśćmy, że istnieje funkcja \( \displaystyle h':X \times B \rightarrow C \) różna od \( \displaystyle h \), która spełnia równość 3.1. Niech \( \displaystyle D=\{x\in X: \exists_{b\in B} \; h(x,b)\neq h'(x,b)\} \). Ponieważ \( \displaystyle D \) jest niepustym podzbiorem \( \displaystyle X \), to posiada element najmniejszy \( \displaystyle z \). Ponieważ \( \displaystyle z \) jest najmniejszy w \( \displaystyle D \), to:

\( \displaystyle h\cap O(z) \times B \times C= h'\cap O(z) \times B \times C. \)

Ustalmy dowolne \( \displaystyle b\in B \). Wtedy:

\( \displaystyle g((h\cap O(z) \times B \times C),z,b)= g((h'\cap O(z) \times B \times C),z,b). \)

Ponieważ obie funkcje spełniają 3.1, to lewa strona powyższej równości jest równa \( \displaystyle h(z,b) \), a prawa \( \displaystyle h'(z,b) \). Wynika stąd, że \( \displaystyle h(z,b)= h'(z,b) \), co wobec dowolności wyboru \( \displaystyle b \) jest sprzeczne z przynależnością \( \displaystyle z \) do zbioru \( \displaystyle D \). Wynika stąd, że zbiór \( \displaystyle D \) musi być pusty, a więc funkcje \( \displaystyle h \) i \( \displaystyle h' \) muszą być równe.

Ćwiczenie 3.5

Udowodnij, że każdy zbiór nieskończony można podzielić na dwa równoliczne rozłączne podzbiory.


Pokażemy teraz ważne twierdzenie, które mówi, że dla dowolnych dwóch zbiorów dobrze uporządkowanych jeden z nich jest podobny do przedziału początkowego drugiego.

Twierdzenie 3.6.

Niech \( \displaystyle (X,\leq_X) \), \( \displaystyle (Y,\leq_Y) \) będą dobrymi porządkami. Wtedy przynajmniej jedno z poniższych zdań jest prawdziwe:

  1. istnieje przedział początkowy \( \displaystyle P\subset X \) taki, że \( \displaystyle (P,\leq_X \cap P\times P) \) jest podobny do \( \displaystyle (Y,\leq_Y) \),
  2. istnieje przedział początkowy \( \displaystyle S \subset Y \) taki, że \( \displaystyle (S,\leq_Y \cap S\times S) \) jest podobny do \( \displaystyle (X,\leq_X) \).

Dowód

Niech \( \displaystyle \top \) będzie elementem nienależącym do \( \displaystyle Y \) (w roli \( \displaystyle \top \) może wystąpić \( \displaystyle Y \), ze względu na przejrzystość dowodu decydujemy się na oznaczenie \( \displaystyle \top \)). Rozważmy zbiór \( \displaystyle Z=Y\cup \{\top\} \), który uporządkujemy relacją \( \displaystyle \leq_Z = [\leq_Y \cup (Y \times\{\top\})] \), czyli \( \displaystyle \top \) jest większy od wszystkich elementów \( \displaystyle Y \). Zauważmy, że \( \displaystyle (Z,\leq_Z) \) jest dobrym porządkiem.

Zdefiniujmy funkcję \( \displaystyle g:PF(X,Z) \rightarrow Z \) następująco, dla dowolnej funkcji częściowej \( \displaystyle r \in PF(X,Z) \) niech

\( \displaystyle g(r)= \min((Z\setminus \vec{r}(X)) \cup \{\top\}). \)

Pokażemy, że funkcja \( \displaystyle g \) jest monotoniczna (funkcje częściowe porządkujemy za pomocą inkluzji). Dla dowolnych dwóch funkcji częściowych \( \displaystyle s,r \in PF(X,Z) \) takich, że \( \displaystyle s \subset r \) mamy:

\( \displaystyle \begin{align*} \vec{s}(X) \subset \vec{r}(X) \\ Z \setminus \vec{s}(X) \supset Z\setminus \vec{r}(X) \\ g(s)= \min_Z(Z \setminus \vec{s}(X)) \leq \min_Z(Z\setminus \vec{r}(X))= g(r). \end{align*} \)

Z twierdzenia o definiowaniu przez indukcję wynika, że istnieje funkcja \( \displaystyle h:X \rightarrow
Y \), dla której

\( \displaystyle h(x)= g( h \cap (O(x) \times Z) ). \)

Łatwo pokazać, że funkcja \( \displaystyle h \) jest monotoniczna. Dla dowolnych \( \displaystyle x,y \in X \) dla których \( \displaystyle x\leq_X y \) mamy:

\( \displaystyle \begin{align*} O(x) \subset O(y) \\ h \cap (O(x) \times Z) \subset h \cap (O(y) \times Z) \end{align*} \)

i z monotoniczności funkcji \( \displaystyle g \) otrzymujemy:

\( \displaystyle h(x) = g( h \cap (O(x) \times Z) ) \subset g( h \cap (O(y) \times Z) )= h(y). \)

Pokażemy, że dla każdego \( \displaystyle x\in X \) prawdą jest, że \( \displaystyle \vec{h}(\overline{O(x)}) =\overline{O(h(x))} \). Ustalmy dowolny element \( \displaystyle x\in X \). Z monotoniczności \( \displaystyle h \) dostajemy prawie natychmiast \( \displaystyle \vec{h}(\overline{O(x)}) \subset \overline{O(h(x))} \). Dla pokazania inkluzji w drugą stronę, weźmy dowolny element \( \displaystyle y \in \overline{O(h(x))} \). Wtedy \( \displaystyle y \leq_Y h(x) \). Przypuśćmy dla dowodu nie wprost, że \( \displaystyle y\notin \vec{h}(\overline{O(x)}) \) wtedy \( \displaystyle y < _Y h(x) \) oraz \( \displaystyle y\in (Z \setminus \vec{h}(O(x)) \cup \{\top\}) \) co jest sprzeczne z definicją funkcji \( \displaystyle h \) w punkcie \( \displaystyle x \), bo element \( \displaystyle h(x) \) miał być najmniejszy w tym zbiorze. Pokazaliśmy więc inkluzje w obie strony. Wobec dowolności wyboru \( \displaystyle x\in X \) dowiedliśmy żądaną własność.

Pokażemy, że dla różnych elementów \( \displaystyle x,y\in X \), jeśli wartości \( \displaystyle h(x),h(y) \) są równe sobie, to są równe \( \displaystyle \top \). Weźmy dowolne różne elementy \( \displaystyle x,y\in X \), dla których \( \displaystyle h(x)=h(y) \). Bez straty ogólności możemy założyć, że \( \displaystyle x\leq_X y \). Wtedy:

\( \displaystyle h(y)= \min_Z((Z \setminus \vec{h}(O(y))) \cup \{\top\}). \) Ponieważ \( \displaystyle x \in O(y) \), to \( \displaystyle h(x)\notin Z \setminus \vec{h}(O(y)) \), a więc skoro \( \displaystyle h(x)=h(y) \), to \( \displaystyle h(y) \) musi należeć do \( \displaystyle \{\top\} \), czyli \( \displaystyle h(y)=h(x)=\top \).

Rozważymy teraz dwa przypadki.

1. Jeśli \( \displaystyle \top \notin \vec{h}(X) \), to \( \displaystyle h \) jest iniekcją. Zauważmy, że

\( \displaystyle X=\bigcup_{x\in X} \overline{O(x)} \). Ponieważ \( \displaystyle \vec{h}(\overline{O(x)}) =\overline{O(h(x))} \), to

\( \displaystyle \vec{h}(X)= \vec{h}(\bigcup_{x\in X} \overline{O(x)})= \bigcup_{x\in X} \vec{h}(\overline{O(x)})= \bigcup_{x\in X} \ (h{x}). \)

A więc \( \displaystyle \vec{h}(X) \), jako suma przedziałów początkowych, jest przedziałem początkowym. Wobec tego \( \displaystyle h:X \rightarrow Z \) jest monotoniczną iniekcją, której obrazem jest istotny przedział początkowy \( \displaystyle Z \), a więc również przedział początkowy \( \displaystyle Y \). Wobec tego \( \displaystyle X \) jest podobny do przedziału początkowego \( \displaystyle Y \).

2. Jeśli \( \displaystyle \top \in \vec{h}(X) \), to niech \( \displaystyle v\in X \) będzie takim elementem, że

\( \displaystyle h(v)=\top \). Rozważymy zbiór \( \displaystyle A=\{ x \in X: h(x)\neq \top\} \). Z monotoniczności \( \displaystyle h \) wynika, że \( \displaystyle A \) jest odcinkiem początkowym \( \displaystyle X \). Ponieważ \( \displaystyle \vec{h}(\overline{O(v)})= Z \) to \( \displaystyle \vec{h}(A)=Y \). Wobec tego funkcja \( \displaystyle h \) zawężona do zbioru \( \displaystyle A \) jest monotoniczną bijekcją w zbiór \( \displaystyle Y \). Wynika stąd, że \( \displaystyle A \) jest podobny do \( \displaystyle Y \). Ponieważ \( \displaystyle A \) jest przedziałem początkowym, to \( \displaystyle Y \) jest podobny do pewnego przedziału początkowego \( \displaystyle X \).

Z powyższego twierdzenia wynika bardzo ważny następujący wniosek:

Twierdzenie 3.7.

Każde dwa zbiory są porównywalne na moc. Czyli dla dowolnych zbiorów \( \displaystyle x,y \), prawdą jest, że

\( \displaystyle x \leq_m y \vee y \leq_m x. \)

Dowód

Z Twierdzenia 3.6 (patrz Twierdzenie 3.6.) wynika, że dowolne zbiory dobrze uporządkowane można porównywać na moc. Z twierdzenia Ernsta Zermelo (patrz Wykład 11 "Zbiory dobrze uporządkowane. Lemat Kuratowskiego Zorna i twierdzenie Zermelo, przykłady", Twierdzenie 3.4) wynika, że dowolne zbiory \( \displaystyle x,y \) można dobrze uporządkować. Wobec tego dowolne zbioru można porównywać na moc.

Twierdzenie 3.8.

Żaden zbiór dobrze uporządkowany nie jest podobny do swojego istotnego przedziału początkowego.

Dowód

Niech \( \displaystyle (X,\leq) \) będzie dobrym porządkiem. Przypuśćmy, że istnieje przedział początkowy \( \displaystyle A ⊊ X \), który uporządkowany relacją \( \displaystyle \leq \cap A \) jest podobny do \( \displaystyle X \). Niech \( \displaystyle f:A\cap X \) będzie funkcją podobieństwa, niech \( \displaystyle C= \{x\in X: f(x) < x\} \). Skoro \( \displaystyle A ⊊ X \), to \( \displaystyle C \) jest zbiorem niepustym, a więc ma element najmniejszy, oznaczmy go przez \( \displaystyle c \). Wtedy \( \displaystyle f(c) < c \), a więc ponieważ \( \displaystyle c \) jest najmniejszy w zbiorze \( \displaystyle C \), to \( \displaystyle f(f(c)) \geq f(c) \). Rozważmy dwa przypadki:

  1. \( \displaystyle f(f(c))=f(c) \), wtedy \( \displaystyle f \) nie jest iniekcją, a więc dostaliśmy sprzeczność.
  2. \( \displaystyle f(f(c)) > f(c) \), a więc \( \displaystyle f \) nie jest monotoniczna i dostaliśmy sprzeczność.

Liczby porządkowe

Liczby porządkowe


W poprzednim rozdziale pokazaliśmy, że dla dowolnych dwóch zbiorów dobrze uporządkowanych jeden z nich jest podobny do odcinka początkowego drugiego.

Powiemy, że dobre porządki \( \displaystyle A \) i \( \displaystyle B \) są tego samego typu, jeśli \( \displaystyle A \) jest podobny do \( \displaystyle B \).

Łatwo wykazać, że każdy dobry porządek jest tego samego typu co on sam, jeśli \( \displaystyle A \) jest tego samego typu co \( \displaystyle B \), to \( \displaystyle B \) jest tego samego typu co \( \displaystyle A \) oraz że, jeśli \( \displaystyle A \) jest tego samego typu co \( \displaystyle B \) i \( \displaystyle B \) jest tego samego typu co \( \displaystyle C \), to \( \displaystyle A \) jest tego samego typu co \( \displaystyle C \). Te trzy własności dokładnie odpowiadają wymaganiom jakie stawiamy relacji, aby była relacją równoważności. Może się wydawać kuszące zdefiniowanie relacji podobieństwa. Niestety takie próby skazane są na niepowodzenie, gdyż taka relacja musiałaby być określona na zbiorze wszystkich dobrych porządków, a taki zbiór (podobnie jak zbiór wszystkich zbiorów) nie istnieje. Co więcej dla ustalonego niepustego zbioru dobrze uporządkowanego nie istnieje nawet zbiór dobrych porządków, które są tego samego typu co on. W podejściach do teorii mnogości, które dopuszczają pojęcie klasy, mówi się o typach porządkowych jako o klasach. W przypadku rozważanej teorii ZFC nie możemy definiować klas, które nie są zbiorami. Zamiast tego wyróżnimy pewne porządki, które będą reprezentować wszystkie porządki podobne do nich. Porządki te, będące czymś w rodzaju reprezentantów "klas" podobieństwa, nazwiemy liczbami porządkowymi. Poniższa definicja liczb porządkowych pochodzi od Johna von Neumanna. Jest to formalizacja idei aby liczba porządkowa była zbiorem liczb porządkowych od niej mniejszych.

Definicja 4.1.

Zbiór \( \displaystyle X \) nazwiemy liczbą porządkową, jeśli ma następujące własności:

  1. \( \displaystyle \forall_{x,y\in X} \;x \in y \vee y\in x \vee x=y \).
  2. \( \displaystyle \forall_{x\in X} \;x\subset X \).

Najprostszym przykładem liczby porządkowej jest zbiór pusty. W poniższym ćwiczeniu pokazujemy, jak można konstruować kolejne liczby porządkowe.

Ćwiczenie 4.2

Udowodnij, że jeśli \( \displaystyle X \) jest liczbą porządkową, to \( \displaystyle X \cup \{X\} \) jest liczbą porządkową.

Z twierdzenia udowodnionego w poprzednim ćwiczeniu możemy wywnioskować, że każda liczba naturalna jest liczbą porządkową. Nie koniec na tym, zauważmy, że cały \( \displaystyle \mathbb{N} \) też jest liczbą porządkową (patrz Wykład 7 "Konstrukcja von Neumanna liczb naturalnych, twierdzenie o indukcji, zasady minimum, maksimum, definiowanie przez indukcje", Twierdzenie 4.1), a więc także \( \displaystyle \mathbb{N} \cup \{\mathbb{N}\} \) oraz \( \displaystyle \mathbb{N} \cup \{\mathbb{N}\} \cup \{\mathbb{N} \cup \{\mathbb{N}\}\} \), itd.

Twierdzenie 4.3.

Każdy element liczby porządkowej jest liczbą porządkową.

Dowód

Niech \( \displaystyle X \) będzie liczbą porządkową i niech \( \displaystyle x\in X \). Z drugiej własności liczb porządkowych otrzymujemy \( \displaystyle x\subset X \). Pokażemy, że \( \displaystyle x \) spełnia warunki bycia liczbą porządkową:

  1. Weźmy dowolne różne elementy \( \displaystyle a,b \in x \). Wtedy ponieważ \( \displaystyle x\subset X \), to \( \displaystyle a,b \in X \). Skoro \( \displaystyle X \) jest liczbą porządkową, to \( \displaystyle a\in b \) lub \( \displaystyle b\in a \). Zbiór \( \displaystyle x \) spełnia więc pierwszy warunek bycia liczbą porządkową.
  2. Weźmy dowolny element \( \displaystyle a \in x \). Ponieważ \( \displaystyle x\subset X \), to \( \displaystyle a\in X \) i z drugiej własności liczb porządkowych otrzymujemy \( \displaystyle a\subset X \). Przypuśćmy, że \( \displaystyle a ⊊ x \), wtedy istnieje \( \displaystyle b\in a \) taki, że \( \displaystyle b\notin x \). Ponieważ jednak \( \displaystyle a\subset X \), to \( \displaystyle b\in X \); zatem z drugiej własności liczb porządkowych otrzymujemy \( \displaystyle b=x \) lub \( \displaystyle x \in b \). W pierwszym przypadku otrzymujemy \( \displaystyle x\in a \in x \) a w drugim \( \displaystyle x \in x \).

Obydwa te przypadki prowadzą do sprzeczności z aksjomatem regularności. Wobec tego, konieczne jest, aby \( \displaystyle a\subset x \).

Z powyższego twierdzenia natychmiast wynika następujący fakt, z którego będziemy często korzystać.

Fakt 4.1.

Dla dowolnej liczby porządkowej \( \displaystyle X \) oraz elementów \( \displaystyle x,y\in X \), jeśli \( \displaystyle x\in y \), to \( \displaystyle x \subset y \).

Jeśli liczby porządkowe mają reprezentować "klasy" podobnych dobrych porządków, to same powinny być dobrymi porządkami. Dowodzimy tego w następnym twierdzeniu.

Twierdzenie 4.4.

Każdy zbiór będący liczbą porządkową jest dobrze uporządkowany relacją inkluzji.

Dowód

Rozważmy zbiór \( \displaystyle X \) będący liczbą porządkową. Skoro dla każdych dwóch różnych elementów \( \displaystyle x,y\in X \) mamy \( \displaystyle x\in y \) lub \( \displaystyle y\in x \), to z poprzedniego twierdzenia otrzymujemy \( \displaystyle x\subset y \) lub \( \displaystyle y \subset x \). A więc \( \displaystyle X \) jest uporządkowany liniowo przez relację inkluzji.

Pokażemy teraz, że w każdym podzbiorze \( \displaystyle A\subset X \) istnieje element najmniejszy ze względu na inkluzję. Weźmy dowolny taki zbiór \( \displaystyle A \). Z aksjomatu regularności (patrz Wykład 4 "Teoria mnogości ZFC. Operacje na zbiorach", Aksjomat Regularności) wynika, że istnieje element \( \displaystyle a\in A \) taki, że \( \displaystyle a \cap A =\emptyset \). Pokażemy, że \( \displaystyle a \) należy do każdego elementu \( \displaystyle b\in A \), który jest różny od \( \displaystyle a \). Weźmy dowolny taki element \( \displaystyle b \). Wiemy, że jest różny od \( \displaystyle a \), a więc z pierwszej własności liczb porządkowych otrzymujemy \( \displaystyle a\in b \) lub \( \displaystyle b\in a \). Przypuśćmy, że \( \displaystyle b\in a \), wtedy, ponieważ \( \displaystyle b\in A \), to również \( \displaystyle b\in a\cap A \), co prowadzi do sprzeczności, ponieważ ten zbiór jest niepusty. Wobec tego konieczne jest, aby \( \displaystyle a\in b \). Z drugiej własności liczb porządkowych otrzymujemy, że \( \displaystyle a\subset b \). Wobec czego pokazaliśmy, że dla dowolnego \( \displaystyle b\in A \) mamy \( \displaystyle a \subset b \), co znaczy że, \( \displaystyle a \) jest najmniejszym w sensie inkluzji elementem \( \displaystyle A \).

Twierdzenie 4.5.

Każdy przedział początkowy liczby porządkowej jest liczbą porządkową.

Dowód

Jeśli przedział początkowy jest zbiorem pustym, to jest liczbą początkową. Zajmiemy się więc tylko niepustymi. Weźmy dowolną liczbę porządkową \( \displaystyle X \). Niech \( \displaystyle A \) będzie jej niepustym przedziałem początkowym. Pokażemy, że \( \displaystyle A \) jest liczbą porządkową.

  1. Własność pierwsza wynika natychmiast z faktu, że \( \displaystyle A \subset X \).
  2. Weźmy dowolną liczbę \( \displaystyle x\in A \). Skoro \( \displaystyle X \) jest liczbą porządkową, to \( \displaystyle x\subset X \). Weźmy dowolny element \( \displaystyle z\in x \), wynika stąd, że \( \displaystyle z\subset x \), a więc skoro \( \displaystyle A \)

jest przedziałem początkowym to \( \displaystyle z \in A \).

Ćwiczenie 4.6

Niech \( \displaystyle X \) będzie liczbą porządkową. Udowodnij, że dla dowolnych elementów \( \displaystyle x,y \in X \), jeśli \( \displaystyle x ⊊ y \), to \( \displaystyle x\in y \).


Z powyższego ćwiczenia wynika następujący fakt.

Fakt 4.2.

Każdy element liczby porządkowej jest liczbą porządkową.

Ćwiczenie 4.7

Udowodnij, że \( \displaystyle \emptyset \) jest elementem każdej niepustej liczby porządkowej.

Twierdzenie 4.8.

Dla każdych dwóch liczb porządkowych jedna jest podzbiorem drugiej.

Dowód

Dowiedliśmy już, że liczby porządkowe są dobrze uporządkowane przez inkluzję. Wobec tego z Twierdzenia 3.6 (patrz Twierdzenie 3.6.) wynika, że dla każdych dwóch liczb porządkowych jedna z nich jest podobna do przedziału początkowego drugiej. Ponieważ przedziały początkowe liczb porządkowych są liczbami porządkowymi, to wystarczy wykazać, że każde podobieństwo liczb porządkowych uporządkowanych inkluzją jest identycznością.

Weźmy liczby porządkowe \( \displaystyle X,Y \) i przypuśćmy, że funkcja \( \displaystyle f:X arrow Y \) jest podobieństwem pomiędzy porządkami \( \displaystyle (X,\subset) \) i \( \displaystyle (Y,\subset) \). Pokażemy, że \( \displaystyle f \) jest identycznością.

Niech \( \displaystyle A\subset X \) będzie zbiorem \( \displaystyle x\in X \), dla których \( \displaystyle f(x)\neq x \). Jeśli \( \displaystyle A= \emptyset \), to funkcja \( \displaystyle f \) jest identycznością. Dla dowodu niewprost załóżmy więc, że \( \displaystyle A\neq \emptyset \). Ponieważ \( \displaystyle X \) jest dobrze uporządkowany, to w zbiorze \( \displaystyle A \) istnieje element najmniejszy, oznaczmy go przez \( \displaystyle a \).

Pokażemy, że \( \displaystyle f(a) \supset a \). Weźmy dowolny element \( \displaystyle b\in a \), wtedy \( \displaystyle b\subset a \) i z monotoniczności \( \displaystyle f \) otrzymujemy \( \displaystyle f(b) \subset f(a) \), ponieważ jednak \( \displaystyle b\notin A \), to \( \displaystyle f(b)=b \), a więc \( \displaystyle b\in f(a) \). Wobec dowolności wyboru \( \displaystyle b \) dostajemy \( \displaystyle a\subset f(a) \).

Skoro \( \displaystyle a\neq f(a) \), to istnieje element \( \displaystyle z\in f(a) \), który nie należy do \( \displaystyle a \). Ponieważ \( \displaystyle f(a)\in Y \), to również \( \displaystyle z\in Y \). Funkcja \( \displaystyle f \) jest bijekcją, więc musi istnieć \( \displaystyle b\in X \), dla którego \( \displaystyle f(b)=z \). Łatwo zauważyć, że \( \displaystyle b\neq a \), gdyż \( \displaystyle f(b)=z\ \in f(a) \). Element \( \displaystyle b \) nie może być elementem \( \displaystyle a \), gdyż wtedy \( \displaystyle f(b)=b \) i \( \displaystyle z=b \in a \). Wobec tego \( \displaystyle a \) musi być elementem \( \displaystyle b \), ale wtedy \( \displaystyle a \subset b \) i z monotoniczności \( \displaystyle f \) dostajemy \( \displaystyle f(a) \subset f(b) \), co jest sprzeczne z faktem \( \displaystyle f(b) \in f(a) \) (bo wtedy \( \displaystyle f(b)\in f(b) \)).

Pokazaliśmy, że założenie o niepustości zbioru \( \displaystyle A \) prowadzi do sprzeczności. Zbiór ten musi więc być pusty co oznacza, że funkcja \( \displaystyle f \) jest identycznością. Wobec tego, każde dwie podobne liczby porządkowe są sobie równe.

Powyższe twierdzenie mówi, że każde dwie liczby porządkowe są porównywalne przez inkluzję. Przez analogię do liczb naturalnych używamy jednak dla liczb porządkowych oznaczenia \( \displaystyle x \leq y \), zamiast \( \displaystyle x\subset y \).

Z powyższego twierdzenia wynika, że każdy zbiór liczb porządkowych jest uporządkowany liniowo przez inkluzję.

Ćwiczenie 4.9

Udowodnij, że każdy zbiór liczb porządkowych jest dobrze uporządkowany inkluzją.

Twierdzenie 4.10. [Antynomia Burali-Forti]

Nie istnieje zbiór liczb porządkowych.

Dowód

Dla dowodu nie wprost przypuśćmy, że taki zbiór istnieje, nazwijmy go \( \displaystyle X \). Pokażemy, że \( \displaystyle X \) jest liczbą porządkową. W poprzednich ćwiczeniach pokazaliśmy, że \( \displaystyle X \) jest dobrze uporządkowany, przez inkluzję.

  1. Niech \( \displaystyle x,y \) będą różnymi elementami \( \displaystyle X \). Wtedy \( \displaystyle x ⊊ y \) lub \( \displaystyle y ⊊ x \). Z Ćwiczenia 4.6 wynika, że w pierwszym przypadku mamy \( \displaystyle x \in y \), a w drugim \( \displaystyle y\in x \). Więc zbiór \( \displaystyle X \) spełnia pierwszy z warunków bycia liczbą porządkową.
  2. Weźmy dowolny element \( \displaystyle x \) ze zbioru \( \displaystyle X \). Z Faktu 4.2 wiemy, że każdy element \( \displaystyle y \) należący do zbioru \( \displaystyle x \) jest liczbą porządkową. Ponieważ do \( \displaystyle X \) należą wszystkie liczby porządkowe, to \( \displaystyle x\subset X \). A więc \( \displaystyle X \) spełnia drugi warunek bycia liczbą porządkową.

Wobec powyższych faktów zbiór \( \displaystyle X \) jest liczbą porządkową, a więc musi być własnym elementem. Otrzymaliśmy więc sprzeczność.

W ostatnim twierdzeniu w tym rozdziale pokażemy, że każdy dobry porządek jest podobny do pewnej liczby porządkowej, a więc każda "klasa" podobnych dobrych porządków ma swojego reprezentanta, który jest liczbą porządkową.

Twierdzenie 4.11.

Każdy zbiór dobrze uporządkowany jest podobny do pewnej liczby porządkowej.

Dowód

Dla dowodu nie wprost załóżmy, że istnieje dobry porządek \( \displaystyle (X,\leq) \), który nie jest podobny do żadnej liczby porządkowej. Z Twierdzenia 3.6 wynika, że każda liczba porządkowa jest podobna do jakiegoś przedziału początkowego \( \displaystyle X \). Używając aksjomatu zastępowania z (patrz Wykład 4, Aksjomat Zastępowania) pokażemy, że istnieje wtedy zbiór liczb porządkowych.

Niech \( \displaystyle \phi(o,p) \) będzie formułą o zmiennych wolnych \( \displaystyle o,p \), która będzie spełniona wtedy i tylko wtedy, gdy \( \displaystyle o \) jest dobrym porządkiem, \( \displaystyle p \) jest liczbą porządkową i \( \displaystyle o \) jest podobne do \( \displaystyle p \). Nie jest trudno napisać taką formułę, ale nie jest ona krótka, dlatego ten fragment dowodu pozostawiamy czytelnikowi. Ponieważ dwie liczby porządkowe są podobne wtedy i tylko wtedy, gdy są równe, to do każdy dobry porządek \( \displaystyle o \) jest podobny do co najwyżej jednej liczby porządkowej. Wobec tego dla dowolnego \( \displaystyle o \) można dobrać co nawyżej jedno \( \displaystyle p \) takie, aby formuła \( \displaystyle \phi(o,p) \) była prawdziwa. To znaczy że dla formuły \( \displaystyle \phi(o,p) \) przesłanka aksjomatu zastępowania jest spełniona. Wobec tego prawdą jest również:

\( \displaystyle \forall_x \exists_y \forall_p (p\in y \Leftrightarrow (\exists_o o\in x \wedge \phi(o,p)) \)

Biorąc za \( \displaystyle x \) zbiór odcinków początkowych \( \displaystyle X \), dostaniemy, że istnieje zbiór \( \displaystyle y \) taki, że \( \displaystyle p \) należy do \( \displaystyle y \) wtedy i tylko wtedy, gdy istnieje \( \displaystyle o \) będący odcinkiem początkowym \( \displaystyle X \), dla którego prawdziwa jest formuła \( \displaystyle \phi(o,p) \). Oznacza to dokładnie, że istnieje zbiór wszystkich liczb porządkowych podobnych do przedziałów początkowych \( \displaystyle X \). Skoro założyliśmy, że każda liczba porządkowa jest podobna do pewnego przedziału początkowego \( \displaystyle X \), to istnieje zbiór liczb porządkowych. Otrzymaliśmy więc sprzeczność z Twierdzeniem 4.10.

Najmniejszą nieskończoną liczbę porządkową będziemy oznaczać przez \( \displaystyle \omega \). W naszym podejściu \( \displaystyle \omega \) jest po prostu zbiorem \( \displaystyle \mathbb{N} \), który jest dobrze uporządkowany przez inkluzję. Przyjęło się jednak używać oznaczenia \( \displaystyle \omega \) dla podkreślenia, że mówimy o dobrym uporządkowaniu. Będziemy mówić, że zbiór częściowo uporządkowany jest typu \( \displaystyle \omega \), jeśli jest podobny do \( \displaystyle (\mathbb{N},\subset_\mathbb{N}) \). Podobnie dla dowolnej innej liczby porządkowej \( \displaystyle x \) powiemy, że zbiór częściowo uporządkowany jest typu \( \displaystyle x \), jeśli jest podobny do \( \displaystyle (x,\subset_x) \)

Ćwiczenie 4.12

Udowodnij, że dla dowolnych rozłącznych dobrych porządków \( \displaystyle (A,\leq_A), (B,\leq_B) \) następujące zbiory są dobrymi porządkami:

  1. \( \displaystyle (A,\leq_A) \oplus (B,\leq_B) =(A\cup B, \leq_A \cup \leq_B \cup A \times B) \), czyli na zbiorach \( \displaystyle A,B \) porządki są takie, jak w zbiorach wyjściowych, a do tego każdy element zbioru \( \displaystyle A \) jest mniejszy od każdego elementu zbioru \( \displaystyle B \).
  2. \( \displaystyle (A,\leq_A) \otimes (B,\leq_B)= (A \times B, \leq_{A \times B}) \), gdzie \( \displaystyle \leq_{A \times B} \) jest porządkiem leksykograficznym, czyli

\( \displaystyle (a_1,b_1) \leq_{A \times B} (a_2,b_2) \Leftrightarrow (a_1 < _A a_2) \vee (a_1=a_2\wedge b_1\leq_A b_2). \)

Powyższe konstrukcje łatwo zaadaptować do operowania na zbiorach, które nie są rozłączne. W miejsce \( \displaystyle A \) wystarczy wziąć zbiór \( \displaystyle \{0\} \times A \), a w miejsce \( \displaystyle B \) zbiór \( \displaystyle \{1\} \times B \). Wtedy będziemy mieli zagwarantowaną rozłączność. Porządek na tak zmienionych zbiorach łatwo przenieść z wyjściowych zbiorów poprzez naturalną bijekcję pomiędzy nimi (czyli \( \displaystyle [(0,a_1) \leq_{\{0\} \times A }(0,a_2)] \Leftrightarrow a_1\leq_A a_2 \)). W dalszej części będziemy sie posługiwać tak zmodyfikowanymi konstrukcjami, nie dbając o rozłączność zbiorów. Zdefiniujemy teraz arytmetykę na liczbach porządkowych.

Definicja 4.13.

Niech \( \displaystyle a,b \) będą liczbami porządkowymi. Wtedy:

  1. Liczbę porządkową podobną do \( \displaystyle (a,\subset) \oplus (b,\subset) \) będziemy oznaczać przez \( \displaystyle a+b \).
  2. Liczbę porządkową podobną do \( \displaystyle (a,\subset) \otimes (b,\subset) \) będziemy oznaczać przez \( \displaystyle a \cdot b \).

Ćwiczenie 4.14

Sprawdź, czy prawdziwe są następujące własności liczb porządkowych:

  1. \( \displaystyle 1+\omega= \omega \).
  2. \( \displaystyle \omega +1 \neq \omega \).
  3. \( \displaystyle \omega + \omega = 2 \cdot \omega \).
  4. \( \displaystyle a < b \Rightarrow a+c < b+c \).
  5. \( \displaystyle b+a= c+a \Rightarrow b=c \).
  6. \( \displaystyle a+b= a+c \Rightarrow b=c \).
  7. \( \displaystyle a \cdot b= a \cdot c \Rightarrow b=c \).
  8. \( \displaystyle x \cdot y = y \cdot x \).

Ćwiczenie 4.15

Udowodnij, że liczba porządkowa \( \displaystyle x \) jest skończona wtedy i tylko wtedy, gdy relacja \( \displaystyle \subset_x^{-1} \) (czyli \( \displaystyle \supset_x \)) jest dobrym porządkiem na \( \displaystyle x \).