W rozdziale tym zdefiniujemy automat - drugi, obok gramatyki, model obliczeń. Określimy język rozpoznawany przez automat i podamy warunki równoważne na to, by język był rozpoznawany.
Wprowadzimy teraz pojęcie automatu. Jak już wspomnieliśmy w wykładzie drugim automat to drugi, obok gramatyki, model obliczeń będący przedmiotem badań teorii języków i automatów. Model realizujący warunek efektywności analitycznej, czyli taki na podstawie którego możliwe jest sformułowanie algorytmu rozstrzygającego w skończonej liczbie kroków, czy dowolne słowo należy, czy też nie należy do języka rozpoznawanego przez ten automat. Lub inaczej możemy powiedzieć, że taki automat daje algorytm efektywnie rozstrzygający, czy dowolne obliczenie sformułowane nad alfabetem automatu jest poprawne.
Wprowadzony w tym wykładzie automat, zwany automatem skończenie stanowym, jest jednym z najprostszych modeli obliczeń. Jest to model z bardzo istotnie ograniczoną pamięcią. Działanie takiego automatu sprowadza się do zmiany stanu pod wpływem określonego zewnętrznego sygnału czy impulsu.
Pomimo tych ograniczeń urządzenia techniczne oparte o modele takich automatów spotkać możemy dość często. Jako przykład służyć mogą automatyczne drzwi, automaty sprzedające napoje, winda, czy też urządzenia sterujące taśmą produkcyjną.
Przykład 1.1.
Drzwi automatycznie otwierane są sterowane automatem, którego działanie opisać można, przyjmując następujące oznaczenia. Fakt, że osoba chce wejść do pomieszczenia zamykanego przez takie drzwi, identyfikowany przez odpowiedni czujnik, opiszemy symbolem WE. Zamiar wyjścia symbolem WY. Symbol WEWY będzie związany z równoczesnym zamiarem wejścia jakiejś osoby i wyjścia innej. Wreszcie symbol BRAK oznaczał będzie brak osób, które chcą wejść lub wyjść. Zatem zbiór {WE,WY,WEWY,BRAK}, to alfabet nad którym określimy automat o 2 stanach: OTWARTE,ZAMKNIĘTE poniższym grafem.
Automaty reagują więc na określone sygnały zewnętrzne reprezentowane przez litery alfabetu A, zmieniając swój stan. Jeśli ustalimy stan początkowy automatu oraz dopuszczalne stany końcowe, to automat będzie testował dowolne słowo z A∗ , startując ze stanu początkowego. Jeśli rezultatem finalnym działania automatu (obliczenia) będzie stan końcowy, to słowo będzie rozpoznawane przez automat, a obliczenie określone takim słowem poprawne. Automaty można graficznie reprezentować jako etykietowane grafy skierowane. W takim grafie każdy wierzchołek odpowiada stanowi automatu, a każda strzałka pomiędzy wierzchołkami u i v, etykietowana symbolem a, oznacza rzejście automatu ze stanu u do stanu v pod wpływem litery a. Podamy teraz definicję automatu. Niech A oznacza dowolny alfabet. Od tego momentu wykładu zakładamy, że alfabet jest zbiorem skończonym.
Definicja 1.1
Automatem nad alfabetem A nazywamy system A=(S,f), w którym
S - jest dowolnym skończonym zbiorem zwanym zbiorem stanów,
f:S×A→S - jest funkcją przejść.
Automat będąc w stanie si po przeczytaniu litery a zmienia stan na sj zgodnie z funkcją przejścia f(si,a)=sj .
Funkcję przejść rozszerzamy na cały wolny monoid A∗ do postaci
przyjmując:
dla każdego s∈Sf(s,1)=s oraz
dla każdego s∈S,a∈A i dla dowolnego w∈A∗
Działanie automatu pokazane jest na poniższej animacji 2.
Zdefiniowany powyżej automat A nazywamy skończonym lub
skończenie stanowym ze względu na założenie skończoności zbioru stanów S.
Przykład 1.2.
Niech A={a,b} będzie alfabetem, a A=(S,f) automatem takim, że
S={s0,s1,s2} , a funkcja przejść zadana jest przy pomocy tabelki
Automat możemy również jednoznacznie określić przy pomocy grafu.
Podamy teraz bardzo interesujący przykład zastosowania automatów skończonych. Przedstawimy mianowicie wykorzystanie tak zwanych automatów synchronizujących w przemyśle. Automat synchronizujący nad alfabetem A to automat (S,f) o następującej własności: istnieje stan t∈S oraz słowo w∈A∗ takie, że dla każdego stanu s tego automatu f(s,w)=t. Istnieje więc pewne uniwersalne słowo w, pod wpływem którego wszystkie stany przechodzą w jeden, ustalony stan automatu t∈S. Mówimy, że następuje wtedy synchronizacja wszystkich stanów automatu.
Poniżej prezentujemy przykład zaczerpnięty z pracy Ananicheva i Volkova (D. S. Ananichev, M. V. Volkov, Synchronizing Monotonic Automata, Lecture Notes in Computer Science, 2710(2003), 111-121.), ukazujący ideę użycia automatów synchronizujących w tej dziedzinie.
Przykład 1.3.
Załóżmy, że pewna fabryka produkuje detale w kształcie kwadratu z "wypustką" na jednym boku (patrz rys. 3). Po wyprodukowaniu detale należy umieścić w opakowaniach w ten sposób, by wszystkie były w tej samej orientacji - mianowicie "wypustką" w lewo.
Załóżmy ponadto dla uproszczenia, że detale mogą przyjmować jedną z czterech orientacji (rys. 4): "wypustką" w górę, w dół, w lewo lub w prawo.
Należy zatem skonstruować takie urządzenie (orienter), które będzie ustawiało wszystkie detale w żądanej orientacji. Oczywiście istnieje wiele metod rozwiązania tego problemu, ale z praktycznego punktu widzenia potrzebne jest rozwiązanie najprostsze i najtańsze. Jednym z takich sposobów jest umieszczanie detali na pasie transmisyjnym z zamontowaną wzdłuż niego pewną ilością przeszkód dwojakiego rodzaju: niskich (low) oraz wysokich (HIGH). Wysoka przeszkoda ma tę własność, że każdy detal, który ją napotka, zostanie obrócony o 90 stopni w prawo (zakładamy, że elementy jadą od lewej do prawej strony). Przeszkoda niska obróci o 90 stopni w prawo tylko te detale, które są ułożone "wypustką" w dół. Na rys. 5 przedstawione zostały przejścia pomiędzy orientacjami detali w zależności od napotkania odpowiedniej przeszkody.
Można zauważyć, że automat z rysunku 5 jest automatem synchronizującym. Słowem, które go synchronizuje, jest następująca sekwencja przeszkód:
low-HIGH-HIGH-HIGH-low-HIGH-HIGH-HIGH-low.
Niezależnie od tego, w jakiej orientacji początkowej znajduje się detal, po przejściu przez powyższą sekwencję przeszkód zawsze będzie ułożony "wypustką" w lewo. Sytuację przedstawia poniższa animacja 3:
Rozszerzymy teraz wprowadzone pojęcie automatu w ten sposób, by uzyskać możliwość efektywnego rozstrzygania, czy dowolne słowo utworzone nad alfabetem A reprezentuje poprawne obliczenie, czyli spełnia kryteria określone przez rozszerzony automat.
Definicja 1.2.
Język L ⊂A∗ jest rozpoznawany (akceptowany) wtedy i tylko wtedy, gdy istnieje automat skończony A=(S,f), stan s0∈S oraz zbiór T⊂S takie, że
Stan s0 nazywamy stanem początkowym, a T zbiorem stanów końcowych automatu A .
Rozszerzony w powyższy sposób automat, poprzez dodanie stanu początkowgo i zbioru stanów końcowych, w dalszym ciągu nazywamy automatem i oznaczamy jako piątkę A=(S,A,f,s0,T) lub czwórkę A=(S,f,s0,T), jeśli wiadomo, nad jakim alfabetem rozważamy działanie automatu.
Fakt, że język L jest rozpoznawany przez automat A, zapisujemy jako
Rodzinę wszystkich języków rozpoznawalnych nad alfabetem A oznaczamy przez REC(A∗) .
Podobnie jak w przypadku gramatyk nie ma jednoznacznej odpowiedniości pomiędzy językami rozpoznawalnymi a automatami. Wprowadza się więc relację, która identyfikuje automaty rozpoznające ten sam język.
Definicja 1.3.
Automaty A1 i A2 są równoważne, jeśli rozpoznają ten sam język, czyli
W dalszych rozważaniach języków rozpoznawanych ograniczymy się do automatów A=(S,A,f,s0,T), które spełniają warunek f(s0,A∗)=S. Nie zawęża to naszych rozważań. Jeśli bowiem język L jest rozpoznawany przez pewien automat A=(S,A,f,s0,T), to jest również rozpoznawany przez automat
który spełnia powyższy warunek. Zauważmy, że przyjmując to założenie, upraszczamy strukturę automatu. Z punktu widzenia grafu automatu można powiedzieć, że nie występują w nim wierzchołki (stany) nieosiagalne z s0. Poniżej przedstawiamy algorytm usuwający z automatu stany nieosiągalne ze stanu początkowego.
Algorytm UsuńStanyNieosiągalne - usuwa z automatu A stany nieosiągalne
for each p in S do zaznaczone[p] <- 0; end for zaznaczone[s_0] <- 1; OZNACZ (s_0); S' <- {s in S: zaznaczone[s]=1}; T' <- T cap S'; flag <-false # jeśli nie dodamy stanu to na końcu pętli nadal flag=false f' <- f; for each p in S do for each a in A do if f'(p,a)=NULL then f'(p,a)<- s_f; # f'(p,a) była nieokreślona flag <-true; end if end for end for if flag=true then S'<- S' cup {s_f}; end if return A'=(S', A, f', s_0, T');
Algorytm Procedure Oznacz
procedure OZNACZ (x in S) for each p in S flag <-false for each a in A do if f(x,a)=p then flag <-true end if end for if flag=true and zaznaczone [p]=0 then zaznaczone [p] <- 1; OZNACZ (p); end if end for end procedure
Powyższy algorytm, dla ustalonego alfabetu A, posiada złożoność O(|A|⋅|S|), czyli liniową względem liczby stanów.
Przedstawiając automat przy pomocy grafu przyjmujemy następującą konwencję. Jeśli w automacie występuje stan początkowy, oznaczać go będziemy zieloną strzałką wchodzącą do tego stanu. Jeśli w automacie występują stany końcowe, oznaczać je będziemy niebieską obwódką.
Przykład 1.4.
Jeśli w przykładzie 1.2 (patrz przykład 1.2.) przyjmiemy stan s0 jako stan początkowy, T={s2} jako zbiór stanów końcowych, to automat A=(S,A,f,s0,T) rozpoznaje język
złożony ze słów, kończących się na a2 .
Słowo aba nie jest akceptowane.
Słowo abaa jest akceptowane.
Każdy automat A=(S,A,f,s0,T) wyznacza w wolnym monoidzie A∗ prawą kongruencję, nazywaną prawą kongruencją automatową, określoną w następujący sposób:
∀u,v∈A∗
Dla automatu skończonego (o skończonym zbiorze stanów), a takie rozważamy, relacja ∼A ma skończony indeks, czyli skończoną liczbę klas równoważności.
Przykład 1.5.
Automat z przykładu 1.2 (patrz przykład 1.2.) ze stanem s0 jako początkowym wyznacza relację równoważności o trzech klasach:
[1]=A∗{b}∪{1},
[a]=A∗{ba}∪{a},
[a2]=A∗{a2}.
Na odwrót, każda prawa kongruencja ρ⊂(A∗)2 wyznacza automat, zwany ilorazowym, w następujący sposób:
Aρ jest automatem ze stanem początkowym [1]ρ. Aρ jest automatem skończonym wtedy i tylko wtedy, gdy relacja ρ ma skończony indeks.
Z definicji prawej kongruencji wynika, że funkcja przejść f∗ jest określona poprawnie.
Definicja 1.4.
Niech A=(S,f) i B=(T,g) będą dowolnymi automatami. Odwzorowanie φ:S⟶T nazywamy homomorfizmem automatów wtedy i tylko
wtedy, jeśli
Homomorfizm automatów oznaczamy φ:A⟶B .
Twierdzenie 1.1.
Prawdziwe są następujące fakty:
(1) Dla dowolnej prawej kongruencji ρ⊂(A∗)2
(2) Dowolny automat A=(S,A,f,s0,T) jest izomorficzny z automatem A∼A ,
(3) Dla dowolnych automatów A1=(S1,A,f1,s10,T1) i A2=(S2,A,f2,s20,T2) prawdziwa jest równoważność
∼A1⊆∼A2⟺ istnieje epimorfizm φ:A1⟶A2 taki, że φ(s10)=s20.
Dowód
(1) Identyczność relacji wynika wprost z definicji automatu ilorazowego Aρ oraz prawej kongruencji ∼Aρ .
(2) Rozważmy automat A=(S,A,f,s0,T) i odwzorowanie
gdzie ∀s∈S
Istnienie słowa w wynika z faktu, że s0 jest stanem początkowym, natomiast z definicji relacji ∼A wynika, że odwzorowanie ψ jest poprawnie określone.
Odwzorowanie ψ ma być homomorfizmem, czyli dla każdego stanu s∈S i dowolnego słowa w∈A∗ spełniać warunek
Warunek ten wynika z następujących równości
gdzie f(s0,u)=s.
Z prostych obserwacji wynika, że ψ jest suriekcją i iniekcją.
(3) Dowód implikacji "⇒"
Załóżmy, że ∼A1⊆∼A2 . Niech
będzie odwzorowaniem takim, że
∀s∈S1 φ(s)=f2(s20,w),gdziew∈A∗if1(s10,w)=s.
Stąd, że s10 jest stanem początkowym automatu A1,
wynika, że istnieje słowo w∈A∗ potrzebne do określenia epimorfizmu φ.
Z założenia ∼A1⊆∼A2
wynika, że φ jest poprawnie zdefiniowaną funkcją.
Uzasadnienie faktu, że φ jest homomorfizmem, jest analogiczne jak w punkcie (2) dla ψ.
φ jest suriekcją, gdyż s20 jest stanem początkowym automatu A2 .
φ(s10)=s20, ponieważ f1(s10,1)=s10.
Dowód implikacji "⇐"
Niech φ:A1⟶A2 będzie epimorfizmem
takim, że φ(s10)=s20.
Wówczas prawdziwy jest następujący ciąg wnioskowań.
To oznacza, że ∼A1⊆∼A2 .
Symbolem SS oznaczamy rodzinę wszystkich funkcji określonych na zbiorze S i przyjmujących wartości w S. Łatwo zauważyć, iż rodzina ta wraz ze składaniem odwzorowań jest monoidem (SS,∘) .
Definicja 1.5.
Niech A=(S,f) będzie dowolnym automatem. Reprezentacją automatu A nazywamy funkcję τA:A∗⟶SS , określoną dla dowolnych w∈A∗ i s∈S równością
Reprezentacja automatu jest homomorfizmem monoidu A∗ w monoid SS, bowiem dla dowolnych v,w∈A∗ spełnione są warunki
Definicja 1.6.
Niech A=(S,f) będzie dowolnym automatem. Monoidem przejść automatu A nazywamy monoid
Następujące wnioski są konsekwencjami rozważań przeprowadzonych powyżej.
Wniosek 1.1.
(1) Monoid przejść automatu A jest podmonoidem monoidu SS i zbiór {τA(a):a∈A} jest zbiorem generatorów tego monoidu.
Wynika to z faktu, że τA jest epimorfizmem i z twierdzenia 2.1 z wykładu 1. (patrz twierdzenie 2.1. wykład 1)
(2) Monoid przejść automatu skończonego jest skończony.
(3) Monoid przejść automatu A jest izomorficzny z monoidem ilorazowym A∗/KerτA .
Jest to wniosek z twierdzenia o rozkładzie epimorfizmu, które w tym przypadku ilustruje poniższy diagram.
Przykład 1.6.
Określimy monoid przejść dla automatu z przykładu 1.2 (patrz przykład 1.2.). Wypisujemy kolejne funkcje τA(w) dla w∈{a,b}∗ . Zauważmy, że ze względu na występujące w tabelce powtórzenia, będące wynikiem równości, np. τA(b2)=τA(b), nie ma potrzeby określać funkcji τA(bn) dla n≥3 . Podobna obserwacja ma miejsce w innych przypadkach, co sprawia, że tabelka zawiera skończoną liczbę różnych funkcji.
Poniżej zamieszczamy algorytm obliczający monoid przejść dla automatu skończenie stanowego.
Algorytm WyznaczMonoidPrzejść - wyznacza monoid przejść dla automatu
Wejście: A=(S, A, f, s_0, T) - automat Wyjście: M - monoid przejść dla \mathcal{A} L <- emptyset; #L jest listą M <- emptyset; for each a in A cup {1} do insert (L, {tau_A(a)}); # gdzie tau_A(a)(s)=f(s, a) dla każdego s in S end for while L not = emptyset; do tau_A(w) <- first(L); M <- M cup tau_A(w); for each a in A do for each s in S do tau'_A(wa)(s)<- f(tau_A(w)(s),a); end for if tau'_A(wa) not in L cup M insert (L, tau'_A(wa)); end if end for end while return M;
Procedura insert(L,x) wkłada na koniec listy L element x. Funkcja first(L) wyjmuje pierwszy element znajdujący się na liście L i zwraca go. Algorytm działa w następujący sposób: najpierw na listę L wkładane są elementy monoidu przejść τA(a) dla każdej litery a∈A∪1. Te funkcje można obliczyć bezpośrednio z tabelki reprezentującej funkcję przejścia automatu A. Następnie z listy po kolei ściągane są poszczególne funkcje τA(w). Każda z nich dodawana jest do zbioru M, a następnie algorytm sprawdza dla każdej litery a∈A, czy funkcja τA(wa)
istnieje już na liście L lub w zbiorze M. Jeśli nie, to funkcja ta dodawana jest do listy. Procedura powyższa trwa do czasu, gdy lista L zostanie pusta. Wtedy wszystkie elementy monoidu przejść
znajdą się w zbiorze M.
Przeanalizujmy działanie algorytmu dla automatu z przykładu 1.2 (patrz przykład 1.2.).
Na początku na listę L włożone zostaną funkcje τA(1), τA(a) oraz τA(b). Z listy zdejmujemy funkcję τA(1) i dodajemy ją do zbioru M. Ponieważ ∀a∈AτA(1a)=τA(a), a funkcje τA(a) oraz τA(b) znajdują się już na liście, zatem nie dodajemy ich do L. Bierzemy kolejny element listy, τA(a), dodajemy go do M i obliczamy funkcje τA(aa) oraz τA(ab). Ponieważ τA(aa) nie jest tożsama z żadną funkcją ze zbioru L∪M, dodajemy ją do listy. Funkcja τA(ab) również nie jest równa żadnej z funkcji należących do zbioru L∪M, zatem wstawiamy ją na koniec listy. Na liście L mamy zatem teraz następujące elementy: τA(b), τA(a2) oraz τA(ab). Zdejmujemy z listy funkcję τA(b), dodajemy ją do M i obliczamy τA(ba) oraz τA(bb). Pierwsza z tych funkcji jest nowa, tzn. nie jest tożsama z żadną funkcją ze zbioru L∪M więc dodajemy ją na koniec listy. Druga z nich równa jest funkcji τA(b), więc nie dodajemy jej do listy. W tym momencie zbiór M zawiera następujące elementy: τA(1), τA(a), τA(b), natomiast lista zawiera elementy τA(a2), τA(ab), τA(ba). Zdejmujemy z L funkcję τA(a2), dodajemy ja do M i ponieważ τA(a2a)=τA(a2) i τA(a2b)=τA(b), nic nie dodajemy do L. Zdejmujemy teraz z listy funkcję τA(ab), dodajemy ją do M i ponieważ τA(aba) nie należy do L∪M dodajemy ją do listy. τA(abb)=τA(b), więc tej funkcji nie dodajemy do L. Z L ściągamy τA(ba), dodajemy ją do M i widzimy, że τA(baa)=τA(a2) oraz τA(bab)=τA(b), więc nic nie dodajemy do L. Na liście pozostała funkcja τA(aba). Ściągamy ją z listy i dodajemy do M. Widzimy, że τA(abaa)=τA(a2) i τA(abab)=τA(b), zatem nic nie dodajemy do listy L. Lista jest w tym momencie pusta i działanie algorytmu zakończyło się. Ostatecznie mamy
co zgadza się z wynikiem otrzymanym w przykładzie.
Twierdzenie poniższe zbiera dotychczas uzyskane charakteryzacje języków rozpoznawanych.
Twierdzenie 1.2.
Niech L⊂A∗ będzie dowolnym językiem. Równoważne są następujące warunki:
Dowód
Dowód równoważności czterech powyższych warunków przeprowadzimy zgodnie z następującym schematem:
4⟹3
Dany jest homomorfizm
gdzie M jest skończonym monoidem.
Określamy relację ρ na A∗, przyjmując dla dowolnych u,v∈A∗
Tak określona relacja jest kongruencją. Natomiast jej skończony indeks wynika z faktu, że monoid M jest skończony. Pokażemy teraz, że:
Inkluzja ⊆ jest oczywista.
Inkluzja w przeciwną stronę (L⊇⋃w∈L[w]ρ,) oznacza, że każda klasa równoważności relacji
ρ albo cała zawiera się w języku L, albo cała zawiera się w uzupełnieniu języka L.
Załóżmy, że u∈[w]ρ dla pewnego w∈L.
Oznacza to, że
Implikuje to ostatecznie, że u∈L.
3⟹2
Każda kongruencja jest prawą kongruencją.
2⟹1
Niech ρ będzie prawą kongruencją o skończonym indeksie na A∗ taką, że
Automat Aρ=(A∗/ρ,f∗,[1]ρ,T), dla którego
akceptuje język L.
1⟹4
Niech język L=L(A), gdzie A=(S,f,s0,T).
Określamy odwzorowanie
przyjmując dla każdego v∈A∗
Jest to odwzorowanie kanoniczne monoidu A∗ na monoid ilorazowy, a więc jest to epimorfizm.
A∗/KerτA jest monoidem skończonym, ponieważ S jest zbiorem skończonym.
Dla dowodu równości L=φ−1(φ(L)) wystarczy udowodnić
inkluzję L⊃φ−1(φ(L)). (Inkluzja L⊆φ−1(φ(L))
wynika z definicji przeciwobrazu.)
Niech u∈φ−1(φ(L)). Oznacz to, że
W szczególności
czyli u∈L.