FI103156B - Menetelmä ja järjestely informaation kääntämiseksi - Google Patents

Menetelmä ja järjestely informaation kääntämiseksi Download PDF

Info

Publication number
FI103156B
FI103156B FI964742A FI964742A FI103156B FI 103156 B FI103156 B FI 103156B FI 964742 A FI964742 A FI 964742A FI 964742 A FI964742 A FI 964742A FI 103156 B FI103156 B FI 103156B
Authority
FI
Finland
Prior art keywords
language
segment
knowledge base
information
character string
Prior art date
Application number
FI964742A
Other languages
English (en)
Swedish (sv)
Other versions
FI964742A (fi
FI103156B1 (fi
FI964742A0 (fi
Inventor
Ari Becks
Simo Sakari Heikkilae
Original Assignee
Master S Innovations Ltd Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8547161&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=FI103156(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Master S Innovations Ltd Oy filed Critical Master S Innovations Ltd Oy
Priority to FI964742A priority Critical patent/FI103156B/fi
Publication of FI964742A0 publication Critical patent/FI964742A0/fi
Publication of FI964742A publication Critical patent/FI964742A/fi
Application granted granted Critical
Publication of FI103156B1 publication Critical patent/FI103156B1/fi
Publication of FI103156B publication Critical patent/FI103156B/fi

Links

Landscapes

  • Machine Translation (AREA)

Description

103156
Menetelmä ja järjestely informaation kääntämiseksi - Förfarande och anord-ning för att översätta information 5 Keksinnön kohteena on menetelmä ja järjestely ensimmäisen kielen merkkijonona esitetyn informaation kääntämiseksi toisen kielen merkkijonoksi. Keksintöä sovelletaan edullisesti teksti-informaation kääntämiseen tietokoneessa.
Ennestään tunnetaan lingvistiikkaan perustuvia menetelmiä teksti-informaation 10 kääntämiseksi tietokoneella. Tällaisia menetelmiä on esitetty mm. seuraavissa julkaisuissa: [1] EP-A-0 672 989, [2] US-A- 5 267 156, 15 [3] Proceedings of International Joint Conference of Artificial Intelligence, 28 Aug.-3. Sept. 1993, Chambery, France; Morgan Kaufman Publishers, USA, Part vol. 2, 1993, H. Kitano: ”A comprehensive and practical model of Memory-based machine translation”, s. 1276-82, [4] Artificial Intelligence, vol. 75, no 1, 1995, Netherlands, S. Sato,: ”MBT2: 20 a method of combining fragments of examples in example-based translation”, s. 31-49, [5] Advances in Case-Based Reasoning, Third European Workshop, EWCBR-96,
Proceedings, Springler-Verlag, Berlin, Germany, B. Collins et al.: ’’Adaption-guided retrieval in EBMT: a case-based approach to machine translation”, . 25 s. 91-104, ,*:* [6] 1995 IEEE International Conference on Systems, Man and Cybernetics, Intel- ligent Systems for the 21st Century, Part vol. 2, IEEE, New York, USA, ··· R. Jain et al.: ’’Role of examples in translation”, s. 1615-20, . [7] Proceedings of the AAAI Fall Symposioum Series, 23-25 Oct. 1992, Cambrid- .···. 30 ge, MA, USA, AAAI Press, 1993, Menlo Park, CA USA, D. Jones: ’’Virtual • · · machine translation”, s. 84-88 ja . . [8] IEICE Transaction on Information and Systems, voi. E75-D, no. 4, 1992, • · ·
Japan, E. Sumita et al.: ’’Example-based transfer of Japanese adnominal particles into English”, s. 585-594.
Näissä ennestään tunnetuissa menetelmissä kunkin kielen syntaksi eli lauseoppi ohjelmoidaan tarkasti, jolloin kullekin kielelle tarvitaan oma ohjelma-algoritmi. Eri kieliin liittyvien sanastojen tallennusta varten käytetään suurikapasiteettista, keski- 35 103156 2 tettyä käännösmuistia. Esimerkkinä tällaisesta menetelmästä voidaan mainita Euroopan Unionin käännösjärjestelmä EuroTra. Tällaisilla ennestään tunnetuilla menetelmillä on useita epäkohtia. Syntaksin tarkka ohjelmointi edellyttää erittäin suuren ohjelmointityön. Tällainen syntaksialgoritmi samoin kuin tarvittava käännösmuisti-5 kin vaativat suuren muistitilan tietokannassa. Koska näin toimiva käännösmenetelmä on monimutkainen, käännösten suorittaminen kohtuullisessa ajassa edellyttää tietokoneelta erittäin tehokasta suorituskykyä. Edellä mainittujen epäkohtien vuoksi käännökseen soveltuva laitteisto on kallis. Lisäksi tunnettuihin menetelmiin liittyvänä epäkohtana on se, että käännösalgoritmin päivitys edellyttää aina ohjelmointityö-10 tä ja ohjelmapäivityksen tietokoneessa.
Esillä olevan keksinnön tarkoituksena on luoda ratkaisu informaation kääntämiseksi, jonka avulla edellä esitetyt, tekniikan tasoon liittyvät epäkohdat voidaan välttää.
15 Keksinnön eräänä oivalluksena on se, että käännettävä informaatio jaetaan rakenne-segmentteihin ja suoritetaan käännös rakennesegmenttikohtaisesti. Käännös suoritetaan tietämyskantaan tallennettujen mallisegmenttien ja sääntöjen perusteella. Tietämyskannan sisältämää tietoa laajennetaan edullisesti siten, että käännöksen suoritukseen liittyen käyttäjältä kysytään tarvittaessa käyttöliitynnän välityksellä uusien 20 rakennesegmenttien käännöksiä, jotka sitten tallennetaan mallisegmentteinä tietämyskantaan. Keksinnön mukaisen ratkaisun ansiosta käännöksiä suorittavassa laitteistossa riittää pienempi muistikapasiteetti ja prosessorin nopeus. Lisäksi ohjelmointityötä tarvitaan huomattavasti vähemmän ja laitteiston toimintaa voidaan kehittää ilman ohjelmistopäivityksiä.
25 ji* Keksinnön mukaiselle menetelmälle ensimmäisen kielen merkkijonona esitetyn in- formaation kääntämiseksi koneellisesti toisen kielen merkkijonoksi, jossa menetel-mässä «·· . .·. - tallennetaan tietämyskantaan mainittuina ensimmäisen kielen merkkijonoina *j*. 30 olevia mallisegmenttejä ja niihin loogisesti liittyen toisen kielen merkkijonoina ole- 1 · « ’ via mallisegmenttejä, mainitusta ensimmäisen kielen merkkijonosta tunnistetaan rakennesegmentti • « · Y ensimmäisen säännön perusteella, mainittua tunnistettua rakennesegmenttiä verrataan toisen säännön avulla tal-• 35 lennettuihin ensimmäisen kielen merkkijonoina oleviin mallisegmentteihin, mainitun vertailun perusteella pyritään valitsemaan yksi mallisegmentti, luetaan valittuun mallisegmenttiin loogisesti liittyvä toisen kielen merkkijonona oleva mallisegmentti eli vastasegmentti ja 3 103156 mainittu rakennesegmentti käännetään mainituksi toisen kielen merkkijonona olevaksi käännössegmentiksi mainitun vastasegmentin ja kolmannen säännön perusteella, on tunnusomaista se, että menetelmässä tunnistetaan välikesana ja/tai sanapääte ja 5 mainittu ensimmäinen sääntö perustuu oleellisesti mainittuun välikesanan ja/tai sa-napäätteen tunnistamiseen.
Keksinnön mukaiselle järjestelylle ensimmäisen kielen merkkijonona esitetyn informaation kääntämiseksi toisen kielen merkkijonoksi, joka järjestely käsittää 10 - tietämyskantavälineet mainittuina ensimmäisen kielen merkkijonoina olevien mallisegmenttien ja niihin loogisesti liittyen toisen kielen merkkijonoina olevien vastasegmenttien tallentamiseksi sekä ensimmäisen, toisen ja kolmannen säännön tallentamiseksi, välineet rakenne segmentin tunnistamiseksi mainitusta ensimmäisen kielen 15 merkkijonona esitetystä informaatiosta ensimmäisen säännön perusteella, välineet mainitun tunnistetun rakennesegmentin vertaamiseksi tallennettuihin ensimmäisen kielen merkkijonoina oleviin mallisegmentteihin toisen säännön perusteella, välineet yhden mallisegmentin valitsemiseksi mainitun vertailun perusteella, 20 - välineet valittuun mallisegmenttiin loogisesti liittyvän toisen kielen merkki jonona olevan mallisegmentin eli vastasegmentin lukemiseksi mainituista tietämys-kantavälineistäja välineet mainitun rakennesegmentin kääntämiseksi mainituksi toisen kielen merkkijonona olevaksi käännössegmentiksi mainitun vastasegmentin ja kolmannen 25 säännön perusteella, jolloin mainittu käännössegmentti edustaa mainitulla toisella ! I ’ kielellä esitettävää informaatiota, ’.· on tunnusomaista se, että mainitut välineet rakennesegmentin tunnistamiseksi maini- ·· tusta ensimmäisen kielen merkkijonona esitetystä informaatiosta käsittävät välineet välikesanan ja/tai sanapäätteen tunnistamiseksi, jolloin mainittu ensimmäinen sääntö
• I
30 perustuu oleellisesti mainittuun välikesanan ja/tai sanapäätteen tunnistamiseen.
Keksinnön edullisia suoritusmuotoja on esitetty epäitsenäisissä patenttivaatimuksissa.
35 Keksintöä selostetaan seuraavassa tarkemmin oheisten piirustusten avulla, joissa kuvio 1 esittää vuokaaviona erästä keksinnön mukaista menetelmää informaation kääntämiseksi, 4 103156 kuvio 2 esittää lohkokaaviona erästä keksinnön mukaista järjestelyä informaation kääntämiseksi, kuvio 3 esittää erästä rakennesegmentteihin jaettua teksti-informaatiota, kuvio 4 esittää erään rakennesegmentin käännöstoimintoa, kun läheinen malliseg-5 mentti esiintyy tietämyskannassa, ja kuvio 5 esittää erään rakennesegmentin käännöstoimintoa, kun läheinen malliseg-mentti ei esiinny tietämyskannassa.
Kuvio 1 esittää erästä keksinnön mukaista menetelmää informaation kääntämiseksi. 10 Käännettävä informaatio ensin luetaan, lohko 101, ja jaetaan rakennesegmentteihin ensimmäisen säännön perusteella, lohko 102. Tämän jälkeen luetaan ensimmäinen rakennesegmentti kääntämättömästä informaatiosta, lohko 103. Luettua rakenne-segmenttiä verrataan tietämyskantaan tallennettuihin mallisegmentteihin, lohkot 104 ja 110. Tällöin vertailu suoritetaan toisen säännön mukaisesti, jonka perusteella 15 määräytyy, onko mallisegmentti käännettävään rakennesegmenttiin nähden läheinen. Jos tietämyskannasta löytyy kyseiseen rakennesegmenttiin nähden läheinen malli-segmentti, luetaan tietämyskannasta läheiseen mallisegmenttiin loogisesti liitetty, toisella kielellä oleva mallisegmentti eli vastasegmentti, lohko 121. Tämän jälkeen luetun vastasegmentin perusteella muodostetaan käännettävästä rakennesegmentistä 20 toiselle kielelle käännetty käännössegmentti kolmannen säännön mukaisesti, lohko 122. Tämän jälkeen tarkistetaan, onko jäljellä kääntämättömiä rakennesegmenttejä, lohko 123. Jos kääntämättömiä rakennesegmenttejä on jäljellä, palataan lohkoon 103, jossa luetaan seuraava kääntämätön rakennesegmentti käännöstä varten. Jos kääntämättömiä rakennesegmenttejä ei ole jäljellä lohkossa 123, järjestetään kään-25 nössegmentit lauseiksi neljännen säännön perusteella, minkä jälkeen käännetty in-.T formaatio tallennetaan. Tallennettu informaatio voidaan edelleen esittää esim. näy- *·· tössä tai tulostaa esim. paperille tai levykkeelle, lohko 124.
• · « • ·
Jos lohkossa 110 tietämyskannasta ei löydy rakennesegmentille läheistä malliseg- • · :·; 30 menttiä, esitetään ko. rakennesegmentti käyttöliityntävälineellä, esim. näytöllä, loh ko 131. Tämän jälkeen käyttäjä syöttää rakennesegmentin käännöksen eli vastasegmentin, lohko 132. Kyseiset rakennesegmentti ja vastasegmentti tallennetaan malli- • _ : segmenteiksi tietämyskantaan tulevaa käyttöä varten, lohkot 133, 134. Tämän jäl keen siirrytään lohkoon 123 ja jatketaan kuten edellä selostettiin. Tässä tapauksessa 35 vastasegmentti on yleensä suoraan käännössegmentti, jos käyttäjältä on kysytty rakennesegmentin käännöstä alkuperäisessä informaatiossa esitetyssä muodossa. Siten lohkon 122 toimintoa ei tässä tapauksessa välttämättä tarvita.
5 103156
Mainittu ensimmäinen sääntö, jonka avulla rakennesegmentit tunnistetaan, voi perustua esim. ns. välikesanojen tai sijamuotojen tunnistukseen. Välikesanoja voivat olla esim. prepositiot ja partikkelit, jotka ovat yleensä vakioita merkkijonoja. Siten ne on mahdollista tunnistaa yksinkertaisesti vertaamalla kunkin sanan muodostavia 5 merkkijonoja em. tunnettuihin välikesanan muodostaviin merkkijonoihin. Sijamuotojen tunnistus voidaan suorittaa esim. päätteiden eli suffiksien avulla vertailemalla sanojen viimeisiä merkkejä tunnettuihin päätteisiin. Sanan muodostavat merkkijonot voidaan erottaa toisistaan tunnetusti välimerkin avulla. Koska rakennesegmentti voi edullisesti käsittää useita sanoja, se voi sisältää myös yhden tai useamman välimer-10 kin.
Mainittu toinen sääntö, jonka perusteella rakennesegmenttiä verrataan malliseg-mentteihin, voi yksinkertaisimmillaan tarkoittaa yhtäläisyyttä. Tällöin siis tietämyskannasta etsitään tarkasti samaa mallisegmenttiä kuin esillä oleva käännettävä ra-15 kennesegmentti. Tietämyskannalta vaadittavan muistitilan kannalta on kuitenkin edullista, jos tietämyskantaan ei tallenneta esim. malli segmentin eri sijamuotoja erikseen vaan toisen säännön avulla tunnistetaan myös eri sijamuodossa oleva malli-segmentti. Tällöin mallisegmenttiin loogisesti liittyvä vastasegmentti on myös muutettava tarvittavaan sijamuotoon käännös segmentin muodostamiseksi. Tämä tapah-20 tuu kolmannen säännön perusteella, joka siis tällöin käsittää tiedot ko. kielen sijamuodoista.
Mainittu neljäs sääntö, jonka perusteella käännössegmentit järjestetään käännetyiksi lauseiksi, tarkoittaa useissa tapauksissa käännössegmenttien asettamista samaan 25 järjestykseen, jossa käännettävät rakennesegmentit olivat ensimmäisessä kielessä. ,T Järjestys voi kuitenkin olla kielestä riippuva, joten myös mainittu neljäs sääntö on *.· kielikohtainen.
»# # *«
Malli segmentin tallennuksen yhteydessä voidaan edullisesti tallentaa myös malli- «· :·. 30 segmentin lajitunnus. Tällöin lajitunnus tallennetaan kuhunkin mallisegmenttiin loogisesti liittyvänä. Jos lajitunnuksia käytetään, voidaan rakennesegmentin tunnistukseen ja käännökseen mallisegmentin perusteella soveltaa eri sääntöjä riippuen ra-
« V
kennesegmentin lajista. Rakennesegmenttien lajeja voivat olla mm. teon kohde, erisnimi, verbi, paikan ilmaisu, adjektiivi ja idiomi. Jos lajitunnuksia käytetään, ky-; 35 sytään käyttäjältä rakennesegmentin käännöksen yhteydessä myös, mihin lajiin ko.
rakennesegmentti ja sen käännös kuuluvat.
6 103156
Eräs keksintöön liittyvä oivallus on se, että tietämyskantaa päivitetään interaktiivisesti suoritettavan käännöstapahtuman yhteydessä. On huomattava, että tietämyskannan päivityksen ei tarvitse rajoittua uusien malli- ja vastasegmenttien tallentamiseen, vaan myös mainittuja sääntöjä voidaan edullisesti päivittää. Tällöin päivitys 5 tapahtuu esim. käyttäjän syöttämän uuden rakennesegmentin käännöksen yhteydessä tunnistamalla syötettyyn käännökseen liittyvä säännönmukaisuus.
Edellä on esitetty yhden informaation kääntämistä ensimmäiseltä kieleltä toiselle kielelle. Tietämyskantaan suoritettyja päivityksiä käytetään edullisesti hyväksi seulo raavien informaatioiden kääntämisessä. Siten keksinnön mukainen menettely toistaan seuraavien ensimmäisen ja toisen informaation kääntämiseksi voi koostua esim. seuraavista vaiheista: luetaan ensimmäisen kielen merkkijonona esitetty ensimmäinen informaatio, 15 - suoritetaan tietämyskannassa olevien tietojen perusteella mainitun ensimmäi sen kielen merkkijonona esitetyn ensimmäisen informaation kääntäminen toisen kielen merkkijonona esitetyksi ensimmäiseksi informaatioksi siltä osin kuin se on tietämyskannassa olevien tietojen perusteella mahdollista, määritetään ne lisätiedot, jotka tarvitaan ensimmäisen kielen merkkijonona 20 esitetyn ensimmäisen informaation kääntämisen toisen kielen merkkijonona esitetyksi ensimmäiseksi informaatioksi loppuun suorittamiseksi, syötetään tietämyskantaan mainitut lisätiedot tietämyskannan päivittämiseksi, suoritetaan loppuun ensimmäisen kielen merkkijonona esitetyn ensimmäisen informaation kääntäminen toisen kielen merkkijonona esitetyksi ensimmäiseksi in-25 formaatioksi, - tallennetaan mainittu toisen kielen merkkijonona esitetty ensimmäinen infor- ’.· maatio, ;:· - tallennetaan ensimmäisen kielen merkkijonona esitetty toinen informaatio, - suoritetaan tietämyskannassa olevien mainittujen päivitettyjen tietojen perus- •» 30 teella mainitun ensimmäisen kielen merkkijonona esitetyn toisen informaation kääntäminen toisen kielen merkkijonona esitetyksi toiseksi informaatioksi.
• *
Kuvio 2 esittää lohkokaaviota eräästä keksinnön mukaisesta laitejärjestelystä informaation kääntämiseksi. Siinä prosessoriin 20 liittyvät käyttöliityntävälineet levyke-35 asema 21, näyttö 22 ja näppäimistö 23. Levykeaseman avulla laitteeseen voidaan syöttää levykkeeltä käännettävä informaatio ja tallentaa käännetty informaatio levykkeelle informaation käyttämiseksi muissa laitteissa. Ko. informaatiota voidaan siirtää laitteen ja muiden tiedonkäsittelylaitteiden välillä myös tiedonsiirtoväylän I/O
7 103156 kautta. Näyttöä 22 voidaan käyttää sellaisten rakennesegmenttien esittämiseen käyttäjälle, joiden käännöstä ei löydy tietämyskannasta. Käyttäjä voi syöttää tällaisen rakennesegmentin käännöksen näppäimistön 23 avulla. Em. käyttöliityntäväli-neitä voidaan käyttää myös käännetyn informaation tarkastuksessa ja korjauksessa.
5
Kuvion 2 mukainen laite käsittää lisäksi sähköisen muistin 24 mm. käännettävien rakennesegmenttien ja käännössegmenttien väliaikaista tallennusta varten. Lisäksi laitteessa on massamuisti 25 mm. tietämyskannan eli mallisegmenttien, lajitunnus-ten ja sääntöjen sekä ohjelmien tallennusta varten. Massamuistina voidaan käyttää 10 esim. kovalevyasemaa tai optista levykeasemaa. Edellä mainitut laiteosat voidaan toteuttaa ennestään tunnettujen tietokonekomponenttien avulla saattamalla ne erityisen ohjelmiston avulla toimimaan keksinnön mukaisesti. Laiteosien välillä merkkijonot ym. tiedot siirretään edullisesti sähköisinä signaaleina.
15 Keksinnön soveltaminen ei millään tavoin rajoitu edellä esitettyihin komponentteihin vaan keksinnön mukainen järjestely voidaan toteuttaa lukuisilla tavoilla, jotka alan ammattilainen pystyy tämän selostuksen perusteella suunnittelemaan.
Kuvio 3 esittää erästä rakennesegmentteihin 31, 32, 33 ja 34 jaettua englanninkie-20 listä lausetta. Kuten huomataan, rakennesegmentti käsittää tyypillisesti lauseessa toisiaan seuraavia sanoja, jotka liittyvät läheisesti toisiinsa. Siten rakennesegmentti sisältää usein myös sanoja erottavan välimerkin.
Kuvio 4 esittää kuviossa 3 esitetyn lauseen ensimmäisen rakennesegmentin kään-25 nöstä erään keksinnön mukaisen ratkaisun avulla. Siinä käännettävä rakenneseg-!:* mentti 42 on tallennettu käännösmuistiin 41 ja ko. rakennesegmenttiä verrataan tie- ’·· tämyskantaan 44 tallennettuihin mallisegmentteihin. Kuvion 4 esittämässä tapauk- ; j* sessa kyseinen rakennesegmentti on jo aiemmin tallennettu tietämyskantaan malli- segmentiksi 45, joka vertailussa löydetään. Jos esim. halutaan kääntää esillä oleva • · 30 informaatio suomeksi, luetaan tietämyskannasta edellä mainittuun englanninkieliseen mallisegmenttiin loogisesti liitetty suomenkielinen malli segmentti 46. Kuviossa 4 mallisegmenttien 45 ja 46 välillä oleva kaksoisviiva kuvaa loogista liittymistä.
* ·
Kun suomenkielinen mallisegmentti on luettu, se tallennetaan käännössegmentiksi käännösmuistiin.
Kuvio 5 esittää kuviossa 3 esitetyn lauseen toisen rakennesegmentin käännöstä erään keksinnön mukaisen ratkaisun avulla. Tässä tapauksessa tietämyskantaan ei ole ennestään tallennettu mallisegmentiksi käännettävää englanninkielistä rakenne- 35 8 103156 segmenttiä tai sen suomenkielistä vastasegmenttiä tai kumpaakaan niistä. Tässä tapauksessa käännösmuistiin 51 tallennettua käännettävää rakennesegmenttiä 52 verrataan tietämyskannan mallisegmentteihin, ja kun tietämyskannasta ei löydetä haluttua vastasegmenttiä, esitetään käännettävä rakennesegmentti 58 käyttöliittymän 57 5 näytöllä. Tämän jälkeen käyttäjä syöttää rakennesegmentin 58 käännöksen 59 käyttöliittymän välityksellä tietämyskantaan 54. Siten tietämyskantaan tallennetaan toisiinsa loogisesti liittyen englanninkielinen ja suomenkielinen mallisegmentti. Tämän jälkeen rakennesegmentin suomenkielinen käännös tallennetaan käännössegmentiksi 53 käännösmuistiin 51.
10
Jos tämän jälkeen edellä mainitut rakennesegmentit esiintyvät uudelleen käännettävässä informaatiossa, niitä vastaavat malli- ja vastasegmentit löytyvät tietämyskannasta, joten niitä ei tarvitse kysyä käyttäjältä uudelleen. Mutta jos seuraavaksi käännettävässä informaatiossa esiintyy lause "we have expanded our operation largely in 15 Finland", esiintyy tässä uutena rakennesegmenttinä "largely". Jos sille läheistä mal-lisegmenttiä ei ennestään ole tallennettu tietämyskantaan, kysytään sen käännös käyttäjältä ja tallennetaan "largely" mallisegmenttinä tietämyskantaan ja siihen loogisesti liitettynä myös sen käännös, jonka käyttäjä on syöttänyt.
20 On huomattava, että laitteiston toiminta voidaan järjestää siten, että käännöstyö suoritetaan ensin koneellisesti koko informaatiolle siltä osin kuin se on tietämyskantaan tallennettujen malli segmenttien perusteella mahdollista. Tämän jälkeen käyttäjä voi syöttää tarvittavat uusien rakennesegmenttien käännökset tietämyskantaan. Tällaisen järjestelyn etuna on se, että käyttäjän ei tarvitse odottaa laitteen ääressä kään-25 nöstyön suoritusta vaan voi suorittaa tietämyskannan täydentämisen kerralla hänelle sopivana ajankohtana.
• · • · · | Mallisegmentit voidaan tallentaa tietämyskantaan segmenttipareina, jolloin kutakin kieliparia varten tallennetaan omat mallisegmenttiparit. Toinen mahdollisuus on ; 30 liittää loogisesti toisiinsa useamman kielen mukaisia mallisegmenttejä, jolloin samo ja mallisegmenttejä voidaan käyttää sellaisenaan useiden kielipelien käännösten yhteydessä. Tällöin kunkin kielen mallisegmenttejä voidaan täydentää tietämyskan-'; taan aina silloin, kun ne esiintyvät kyseisellä kielellä ensimmäisen kerran. Kun sil loin tietoa syötetään tietämyskantaan yhden kieliparin käännöksen yhteydessä, li-35 sääntyy tietämyskannan sisältämä informaatio automaattisesti myös muissa kielipa-reissa.
9 103156
Keksinnön mukainen ratkaisu ei periaatteeltaan ole kielisidonnainen, vaan sitä voidaan soveltaa mille tahansa kieliparille. Keksinnön käyttö ei myöskään ole rajoitettu tavanomaisessa kommunikaatiossa käytettäviin ns. luonnollisiin kieliin vaan sitä voidaan käyttää minkä tahansa merkkijonoista koostuvan kielen kääntämiseksi toi-5 seksi merkkijonoista koostuvalle kielelle. Esimerkkinä tällaisista muista kielistä voidaan mainita ohjelmointikielet ja tiedonsiirtoprotokollat.
Keksinnön mukaisella ratkaisulla on useita etuja ennestään tunnettuun tekniikan tasoon verrattuna. Ratkaisun toiminta edellyttää vain vähäisen kielikohtaisen tiedon 10 ko. kielen jakamiseksi rakennesegmenteiksi. Toinen ratkaisun etu on siinä, että suorituksen aikana muistiin kerätään lisää tietoa, jolloin laite "oppii" uusia malli-segmenttipareja ja sääntöjä. Siten yksinkertaisella laitekokoonpanolla ja vähäisellä ohjelmointi-ja päivitystyöllä voidaan aikaansaada tehokas väline koneellisten käännösten suorittamiseksi.
15
Keksinnön mukainen ratkaisu soveltuu hyvin tilanteisiin, joissa keksinnön mukaista järjestelyä käytetään usean käyttäjän tarpeisiin. Tällöin järjestely käsittää edullisesti useita käyttöliityntöjä, jotka voivat olla yhteydessä tietämyskantaan esim. tiedonsiirtoverkon välityksellä. Tietämyskanta voi tällöin olla edullisesti hajautettu siten, että 20 ensimmäistä tietämyskantaa eli päätietämyskantaa voivat käyttää määrätty käyttäjäjoukko ja toista tietämyskantaa eli alitietämyskantaa voi käyttää vain osa tällaisesta määrätystä käyttäjäjoukosta. Näin eri käyttäjät voivat päivittää esim. erikoissanastolla tai -sanonnoilla omaa tietämyskantaansa, eikä tällaista erikoiskäyttöön soveltuvaa tietoa tällöin käytetä muiden käyttäjien toimesta.
; 25 Tällaisessa hajautetussa tietämyskannassa voidaan suorittaa ensimmäisen eli pää- ” tietämyskannan päivitys toisista eli alitietämyskannoista. Tällöin siirretään toisiin • · j tietämyskantoihin tallennettua tietoa ensimmäiseen tietämyskantaan ennalta määrät tyjen kriteerien perusteella. Tällainen kriteeri voi olla esim. se, kuinka usein tiettyä : ; 30 tietoa on käytetty. Tiedonsiirto tietämyskantojen välillä voidaan suorittaa myös si ten, että yhteisen päätietämyskannan ylläpitäjä tarkastaa ja hyväksyy jokaisen siir-rettävän tiedon.
*
Edellä on esitetty eräitä keksinnön mukaisen ratkaisun suoritusmuotoja. Luonnolli-35 sesti keksinnön mukaista periaatetta voidaan muunnella patenttivaatimusten suoja-alueen puitteissa esim. toteutuksen yksityiskohtien sekä käyttöalueiden osalta.

Claims (15)

10 103156
1. Menetelmä ensimmäisen kielen merkkijonona esitetyn informaation kääntämiseksi koneellisesti toisen kielen merkkijonoksi, jossa menetelmässä 5. tallennetaan tietämyskantaan mainittuina ensimmäisen kielen merkkijonoina olevia mallisegmenttejä ja niihin loogisesti liittyen toisen kielen merkkijonoina olevia mallisegmenttejä (133, 134), mainitusta ensimmäisen kielen merkkijonosta tunnistetaan rakennesegmentti ensimmäisen säännön perusteella (102), 10. mainittua tunnistettua rakennesegmenttiä verrataan toisen säännön avulla tal lennettuihin ensimmäisen kielen merkkijonoina oleviin mallisegmentteihin (104), mainitun vertailun perusteella pyritään valitsemaan yksi mallisegmentti (110), luetaan valittuun mallisegmenttiin loogisesti liittyvä toisen kielen merkkijonona oleva mallisegmentti eli vastasegmentti (121) ja 15 - mainittu rakennesegmentti käännetään mainituksi toisen kielen merkkijonona olevaksi käännös segmentiksi mainitun vastasegmentin ja kolmannen säännön perusteella (122), tunnettu siitä, että menetelmässä tunnistetaan välikesana ja/tai sanapääte ja mainittu ensimmäinen sääntö perustuu oleellisesti mainittuun välikesanan ja/tai sanapäätteen 20 tunnistamiseen.
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että mainittu toisen kielen merkkijonona esitettävä informaatio muodostetaan käännössegmenttien ja neljännen säännön perusteella (124). 25
3. Patenttivaatimuksen 1 tai 2 mukainen menetelmä, tunnettu siitä, että milloin ” rakennesegmenttien vertailun tuloksena ei löydy toisen säännön perusteella välittä- - · · : vaa malli segmenttiä, rakennesegmentti esitetään käyttöliitynnän avulla (131) ja esi- v tetyn rakennesegmentin vastasegmentti tallennetaan tietämyskantaan käyttöliitynnän 30 avulla (132, 133).
4. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että mainittu rakennesegmentti sisältää välimerkin.
5. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että mallisegmenttiin loogisesti liittyväsi! tallennetaan sen lajitunnus. 11 103156
6. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että toisiinsa loogisesti liitettyjä, eri kieliä edustavia mallisegmenttejä on enemmän kuin kaksi.
7. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että jotakin mainittua sääntöä päivitetään käyttöliitynnästä syötetyn tiedon perusteella.
8. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että käyttöliitynnän avulla syötetään informaatiota tietämyskannan päivittämiseksi en- 10 simmäisen informaation kääntämiseksi ja mainittua syötettyä tietoa käytetään muun kuin mainitun ensimmäisen informaation kääntämiseen tarvittavan tiedon päivittämiseen mainitussa tietämyskannassa.
9. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että 15 se käsittää vaiheet, joissa luetaan ensimmäisen kielen merkkijonona esitetty ensimmäinen informaatio, suoritetaan tietämyskannassa olevien tietojen perusteella mainitun ensimmäisen kielen merkkijonona esitetyn ensimmäisen informaation kääntäminen toisen kielen merkkijonona esitetyksi ensimmäiseksi informaatioksi siltä osin kuin se on 20 tietämyskannassa olevien tietojen perusteella mahdollista, määritetään ne lisätiedot, jotka tarvitaan ensimmäisen kielen merkkijonona esitetyn ensimmäisen informaation kääntämisen toisen kielen merkkijonona esitetyksi ensimmäiseksi informaatioksi loppuun suorittamiseksi, syötetään tietämyskantaan mainitut lisätiedot tietämyskannan päivittämiseksi, 25. suoritetaan loppuun ensimmäisen kielen merkkijonona esitetyn ensimmäisen informaation kääntäminen toisen kielen merkkijonona esitetyksi ensimmäiseksi in- • · . formaatioksi, • · ; - tallennetaan mainittu toisella kielellä esitetty ensimmäinen informaatio, - luetaan ensimmäisen kielen merkkijonona esitetty toinen informaatio, 30. suoritetaan tietämyskannassa olevien mainittujen päivitettyjen tietojen perus teella mainitun ensimmäisen kielen merkkijonona esitetyn toisen informaation • S kääntäminen toisen kielen merkkijonona esitetyksi toiseksi informaatioksi.
10. Järjestely ensimmäisen kielen merkkijonona esitetyn informaation kääntämi-35 seksi toisen kielen merkkijonoksi, joka järjestely käsittää tietämyskantavälineet (20, 25) mainittuina ensimmäisen kielen merkkijonoina olevien mallisegmenttien ja niihin loogisesti liittyen toisen kielen merkkijonoina 12 103156 olevien vastasegmenttien tallentamiseksi sekä ensimmäisen, toisen ja kolmannen säännön tallentamiseksi, välineet (20, 24) rakennesegmentin tunnistamiseksi mainitusta ensimmäisen kielen merkkijonona esitetystä informaatiosta ensimmäisen säännön perusteella, 5. välineet (20, 25) mainitun tunnistetun rakennesegmentin vertaamiseksi tallen nettuihin ensimmäisen kielen merkkijonoina oleviin mallisegmentteihin toisen säännön perusteella, välineet (20) yhden malli segmentin valitsemiseksi mainitun vertailun perusteella, 10. välineet (20, 25) valittuun mallisegmenttiin loogisesti liittyvän toisen kielen merkkijonona olevan mallisegmentin eli vastasegmentin lukemiseksi mainituista tietämyskantavälineistä ja välineet (20, 24) mainitun rakennesegmentin kääntämiseksi mainituksi toisen kielen merkkijonona olevaksi käännös segmentiksi mainitun vastasegmentin ja kol-15 mannen säännön perusteella, jolloin mainittu käännössegmentti edustaa mainitulla toisella kielellä esitettävää informaatiota, tunnettu siitä, että mainitut välineet (20, 24) rakennesegmentin tunnistamiseksi mainitusta ensimmäisen kielen merkkijonona esitetystä informaatiosta käsittävät välineet välikesanan ja/tai sanapäätteen tunnistamiseksi, jolloin mainittu ensimmäinen 20 sääntö perustuu oleellisesti mainittuun välikesanan ja/tai sanapäätteen tunnistamiseen.
11. Patenttivaatimuksen 10 mukainen järjestely, tunnettu siitä, että se lisäksi käsittää välineet (20, 25) toisen kielen merkkijonona esitettävän informaation muodos-25 tamiseksi vähintään kahden käännössegmentin ja neljännen säännön perusteella. • · . 12. Patenttivaatimuksen 10 tai 11 mukainen järjestely, tunnettu siitä, että se käsit- j tää käyttöliityntävälineet (22, 23) käyttäjän liittymiseksi mainittuihin tietämyskanta- välineisiin. 30
13. Patenttivaatimuksen 12 mukainen järjestely, tunnettu siitä, että mainitut käyt-/· töliityntävälineet liittyvät mainittuihin tietämyskantavälineisiin tiedonsiirtoverkon välityksellä.
14. Jonkin patenttivaatimuksen 10-13 mukainen järjestely, tunnettu siitä, että mai nitut tietämyskantavälineet käsittävät ensimmäisen tietämyskantavälineen (25) ja toisen tietämyskantavälineen siten, että mainittuun ensimmäiseen tietämyskantaväli- 13 103156 neeseen on pääsy määrätyillä käyttäjillä ja mainittuun toiseen tietämyskantavälinee-seen on pääsy vain osalla mainituista määrätyistä käyttäjistä.
15. Jonkin patenttivaatimuksen 10-14 mukainen järjestely, tunnettu siitä, että mainitut tietämyskantavälineet käsittävät ensimmäisen tietämyskantavälineen (25) ja 5 toisen tietämyskantavälineen, jolloin järjestely käsittää välineet tiedon syöttämiseksi käyttöliityntävälineistä mainittuun toiseen tietämyskantavälineeseen sekä välineet mainittuun toiseen tietämyskantaan tallennetun tiedon siirtämiseksi valikoidusti mainittuun ensimmäiseen tietämyskantavälineeseen.
10 Patentkrav
FI964742A 1996-11-28 1996-11-28 Menetelmä ja järjestely informaation kääntämiseksi FI103156B (fi)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FI964742A FI103156B (fi) 1996-11-28 1996-11-28 Menetelmä ja järjestely informaation kääntämiseksi

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI964742A FI103156B (fi) 1996-11-28 1996-11-28 Menetelmä ja järjestely informaation kääntämiseksi
FI964742 1996-11-28

Publications (4)

Publication Number Publication Date
FI964742A0 FI964742A0 (fi) 1996-11-28
FI964742A FI964742A (fi) 1998-05-29
FI103156B1 FI103156B1 (fi) 1999-04-30
FI103156B true FI103156B (fi) 1999-04-30

Family

ID=8547161

Family Applications (1)

Application Number Title Priority Date Filing Date
FI964742A FI103156B (fi) 1996-11-28 1996-11-28 Menetelmä ja järjestely informaation kääntämiseksi

Country Status (1)

Country Link
FI (1) FI103156B (fi)

Also Published As

Publication number Publication date
FI964742A (fi) 1998-05-29
FI103156B1 (fi) 1999-04-30
FI964742A0 (fi) 1996-11-28

Similar Documents

Publication Publication Date Title
US7565281B2 (en) Machine translation
JP4404211B2 (ja) マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
JP4911028B2 (ja) 単語翻訳装置、翻訳方法および翻訳プログラム
US5646840A (en) Language conversion system and text creating system using such
US6782384B2 (en) Method of and system for splitting and/or merging content to facilitate content processing
US20050137853A1 (en) Machine translation
Cranias et al. A matching technique in example-based machine translation
US20050171757A1 (en) Machine translation
US7330810B2 (en) Method and apparatus for developing a transfer dictionary used in transfer-based machine translation system
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JP2002215617A (ja) 品詞タグ付けをする方法
US7957956B2 (en) Systems and methods for normalization of linguistic structures
Cranias et al. Example retrieval from a translation memory
Forcada et al. Documentation of the open-source shallow-transfer machine translation platform Apertium
EP1080424B1 (en) A method and arrangement for translation of information
FI103156B (fi) Menetelmä ja järjestely informaation kääntämiseksi
Nishida et al. Feedback of correcting information in postediting to a machine translation system
Thurmair Hybrid architectures for machine translation systems
Jordan et al. Computerized Russian translation at ORNL
Piperidis et al. A Multi-level Framework for Memory-Based Translation Aid Tools
Badia et al. A modular architecture for the processing of free text
Marchenko et al. English text parsing by means of error correcting automaton
JP2806352B2 (ja) 機械翻訳用辞書メンテナンス装置
JP2000276479A (ja) 電子辞書装置及び電子辞書プログラムを記録した記録媒体
Piperidis et al. TrAID: a memory-based translation-aid framework