Lõplik muundur

Allikas: testwiki
Mine navigeerimisribale Mine otsikasti

Mall:Liita Lõplik muundur või lõplik olekumuundur on Turingi masinate terminoloogia kohaselt kahe mälulindiga (sisend- ja väljundlint) lõplik automaat. Tavalisel lõplikul automaadil on ainult üks mälulint. Lõplik muundur on lõplik automaat, mis seab omavahel vastavusse kaks hulka sümboleid.[1]

Lõpliku muunduri mõiste on üldisem kui lõpliku automaadi oma. Lõplik automaat defineerib formaalse keele aktsepteeritavate sõnede hulga abil, samas kui lõplik muundur defineerib seosed sõnede hulkade vahel. Lõplik muundur loeb sisendlingilt sõnede hulga ning loob väljundlindile hulga seoseid. Lõplikku muundurit võib vaadata kui sõnedevahelist tõlki või sidujat.[2]

Morfoloogilisest parsimisest võib näiteks tuua olukorra, kus muundurisse sisestatakse tähtedest koosnev sõne ning saadakse väljundiks morfeemidest koosnev sõne.

Ülevaade

Öeldakse, et automaat tuvastab sõne, kui vaatame selle lindi sisu sisendina. Teisisõnu leiab automaat funktsiooni, mis vastendab sõned hulga {0,1} väärtustega. Samuti võime vaadelda automaadi linti väljundina ning öelda, et automaat genereerib sõnesid. Sel juhul loob automaat konkreetse sõnede hulga ehk formaalse keele. Need kaks viisi automaadi kirjeldamiseks on samaväärsed: automaadi genereeritud funktsioon on enda loodud sõnede hulga karakteristlik funktsioon. Lõpliku automaadi loodud keelte klassi nimetatakse regulaarsete keelte klassiks.[3]

Muunduri kahte linti vaadeldakse tavaliselt kui sisend- ja väljundlinti. Öeldakse, et muundur muundab ehk tõlgib sisendlindil olevad väärtused väljundlindile - sisendlindile antud sõne jaoks genereeritakse väljundlindile uus sõne. Muundur võib seda teha mittedeterministlikult ning ühele sisendsõnele võib vastata mitu väljundsõne. Muundur võib sisendsõne ka tagasi lükata - sel juhul sisendsõnele vastavat väljundsõne ei genereerita.[3]

Üldsõnaliselt võib öelda, et muundur arvutab välja suhte kahe formaalse keele vahel.

Iga sõnest-sõneks-tüüpi lõplik muundur vastendab sisendtähestiku Σ väljundtähestikuga Γ. Relatsioone R hulgal Σ*×Γ*, mis on rakendatavad lõplike muunduritena, nimetatakse ratsionaalrelatsioonideks. Ratsionaalrelatsioone, mis on ühtlasi ka osafunktsioonid (ehk mis vastendavad iga sisendsõne hulgast Σ* kõige enam ühe sõnega hulgast Γ*), nimetatakse ratsionaalfunktsioonideks.[4]

Lõplikud muundurid leiavad sageli kasutust keeletehnoloogias fonoloogilise ning morfoloogilise analüüsi juures.[5]

Formaalne kirjeldus

Formaalse kirjelduse järgi on lõplik muundur T viiekohaline ennik (Q,Σ,Γ,I,F,δ), kus

  • Q on olekute hulk (lõplik hulk);
  • Σ on sisendtähestik (lõplik hulk);
  • Γ on väljundtähestik (lõplik hulk);
  • I on algolekute hulk (Q alamhulk);
  • F on lõppolekute hulk (Q alamhulk);
  • kehtib δQ×(Σ{ϵ})×(Γ{ϵ})×Q, kus ϵ on siirderelatsioonis tühi sõne.[6]

Võime vaadata paari (Q,δ) kui sildistatud suunatud graafi ehk T siirdegraafi. Q on tippude hulk ning (q,a,b,r)δtähendab, et leidub sildistatud kaar tipust q tippu r. Ütleme, et a on selle kaare sisendi ning b väljundi silt.

Defineerime laiendatud siirderelatsiooni δ* kui vähima hulga, mille puhul kehtivad järgmised tingimused:

  • δδ;
  • (q,ϵ,ϵ,q)δ*iga qQkorral;
  • alati kui kehtivad (q,x,y,r)δ* ja (r,a,b,s)δ*, siis kehtib ka (q,xa,yb,s)δ*.

Laiendatud siirderelatsioon on olemuslikult siirdegraafi refleksiivne transitiivne sulund, mis võtab arvesse ka servade silte. Ühe tee sildi leidmiseks konkateneeritakse seda teed moodustavate servade sildid kindlas järjekorras.[7]

Muunduri T käitumine on ratsionaalrelatsioon [T], mida defineeritakse järgnevalt: x[T]y siis ja ainult siis, kui leiduvad iIja fFselliselt, et (i,x,y,f)δ*. See tähendab, et T muundab sõne xΣ*sõneks yΓ*, kui algolekust lõppolekuni viib tee, mille sisendi silt on x ning väljundi silt y.

Kaalutud automaat

Lõplikud muundurid võivad olla kaalutud. Sellised juhul on igal siirdel lisaks sisend- ja väljundsildile ka kaalu tähistav silt. Kaalutud lõplik muundur üle kaalude hulga K defineeritakse sarnaselt kaalumata muunduriga kaheksakohalise ennikuna T=(Q,Σ,Γ,I,F,E,λ,ρ), kus

  • Q,Σ,Γ,I,F defineeritakse samamoodi, kui ülalpool näidatud;
  • EQ×(Σ{ϵ})×(Γ{ϵ})×Q×K, kus ε tähistab tühisõnet, on lõplik siirete hulk;
  • λ:IK vastendab algolekud kaaludega;
  • ρ:FK vastendab lõppolekud kaaludega.[6]

Võimaldamaks kaalutud lõpliku muunduri operatsioonide täpset defineerimist, kehtib nõue, et kaalude hulk peab moodustama poolringi.[8] Kaks kõige tavalisemat poolringi varianti on log-poolring ja troopiline poolring. Kaalumata automaati võib vaadelda kui juhtu, mil kõik kaalud kuuluvad Booleani poolringi.[9]

Tehted lõplike muunduritega

Järgnevad lõplikel automaatidel defineeritud tehted kehtivad ka lõplike muundurite puhul.

  • Ühend. Kui on antud muundurid T ja S, siis eksisteerib muundur TS nii, et x[TS]y kehtib siis ja ainult siis, kui kehtib x[T]y või x[S]y.
  • Konkatenatsioon. Kui on antud muundurid T ja S, siis eksisteerib muundur TSnii, et x[TS]ysiis ja ainult siis, kui leiduvad x1,x2,y1,y2 nii, et x=x1x2,y=y1y2,x1[T]y1,x2[S]y2.
  • Kleene sulund. Kui on antud muundurid T ja S, siis eksisteerib muundur T*, mille kohta kehtivad järgmised omadused:
    1. ϵ[T*]ϵ (k1)
    2. kui w[T*]yja x[T]zsiis wx[T*]yz (k2)
    3. ei kehti x[T*]y, kui just (k1) või (k2) vastupidist ei nõua.
  • Kompositsioon. Kui on antud muundur T üle tähestike Σ ja Γ ning muundur S üle tähestike Γ ja Δ, siis eksisteerib muundur TSüle tähestike Σ ja Δ nii, et x[TS]zsiis ja ainult siis, kui leidub sõne yΓ*nii, et x[T]yja y[S]z. See tehe kehtib ka kaalutud juhu korral.[10] See definitsioon järgib tähistust, mis on kasutusel matemaatikas relatsioonide kompositsiooni märkimiseks. Traditsiooniliselt loetakse relatsioonide kompositsiooni aga teisiti: kui on antud relatsioonid T ja S, siis (x,z)TS, kui leidub y selliselt, et (x,y)Sja (y,z)T.
  • Projektsioon automaadiks. On antud kaks projektsiooni funktsiooni: π1säilitab sisendlinti ning π2väljundlinti. Funktsiooni π1projektsioon defineeritakse järgnevalt: Kui on antud muundur T, siis leidub lõplik automaat π1T selliselt, et π1Taktsepteerib sõne x siis ja ainult siis, kui leidub sõne y, mille puhul kehtib x[T]y. Teine projektsioon π2defineeritakse analoogselt.
  • Determineerimine. Kui on antud muundur T, soovime luua ekvivalentse muunduri, millel on ainult üks algolek ning mille puhul ei välju ühestki olekust mitu sama sisendsildiga kaart.
  • Kaalutud muunduri minimeerimine.[10]
  • Epsilonsiirete eemaldamine.

Lõplike muundurite omadused

  • On võimalik otsustada, kas muunduri T relatsioon [T] on tühi.
  • On võimalik otsustada, kas leidub sõne y selliselt, et antud sõne x puhul kehtiks x[T]y.
  • Ei ole võimalik otsustada, kas kaks muundurit on ekvivalentsed. [11]Ekvivalentsuse üle on võimalik otsustada erijuhul, kus muunduri T relatsioon [T] on osafunktsioon.

Rakendused

Kaalutud lõplikud muundurid on kasutusel keeletehnoloogias, muuhulgas masintõlke ning masinõppe juures.[12][13]

Viited

Mall:Viited