JP2002517040A - 情報の機械翻訳に対する処理と方法 - Google Patents

情報の機械翻訳に対する処理と方法

Info

Publication number
JP2002517040A
JP2002517040A JP2000551334A JP2000551334A JP2002517040A JP 2002517040 A JP2002517040 A JP 2002517040A JP 2000551334 A JP2000551334 A JP 2000551334A JP 2000551334 A JP2000551334 A JP 2000551334A JP 2002517040 A JP2002517040 A JP 2002517040A
Authority
JP
Japan
Prior art keywords
language
knowledge base
character string
section
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000551334A
Other languages
English (en)
Inventor
ベックス アリ
サカリ ヘイキラ シモ
Original Assignee
マスターズ イノベーションズ エルティーディー オーワイ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マスターズ イノベーションズ エルティーディー オーワイ filed Critical マスターズ イノベーションズ エルティーディー オーワイ
Publication of JP2002517040A publication Critical patent/JP2002517040A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Exchange Systems With Centralized Control (AREA)

Abstract

(57)【要約】 この発明は、第一言語にて与えられた文字列を第二言語による文字列に、情報を翻訳する処理と方法に関するものである。この発明は、文字情報の機械による翻訳において利点を提供するものである。本発明における1つの考え方は、翻訳される情報を構造的な区分(102)に分割し、その区分(122)により翻訳を履行することである。翻訳はモデル分割にもとづいて行われ、その規範は知識ベースに蓄えられる。その知識ベースに含まれるデータは、翻訳時においていつでも必要なときに、使用者がユーザーインターフェースをとおして新しいモデル区分の翻訳情報(132)を入力でき、これらの翻訳情報は知識ベース(133,134)にモデル区分として連続して蓄えられる。本発明の解決手段によれば、翻訳装置はメモリ容量と演算処理スピードを多く必要としない。またさらに、プログラミングの手間を省き、装置の操作性もソフトウェアのアップデートなしで向上させることができる。

Description

【発明の詳細な説明】
【0001】 この発明は、第一言語にて与えられた文字列を第二言語による文字列に、情報
を翻訳するための処理と方法に関するものである。この発明は、文字情報の機械
による翻訳において利点を提供するものである。
【0002】 言語学にもとづいた文字情報の機械翻訳に対しては、以前から知られた方法が
あったが、これらの方法においては、それぞれの言語の系統的配列が厳密にプロ
グラムされていたため、それぞれの言語に対して固有のプログラムのアルゴリズ
ムが必要とされている。また、異なる言語の語彙の保管には、集中方式の高容量
の変換メモリが用いられている。そのような方法の例としては、ヨーロッパ連合
のEuroTra翻訳システムがあげられるが、それらのように以前から知られ
た方法には、いくつかの欠点がある。厳密な系統的配列のプログラミングには、
非常に高度なプログラミング操作が要求され、そのような系統的配列のアルゴリ
ズムは、必要とされる変換メモリと同様に、データベースにおいて多くのメモリ
スペースを要する。また、このような翻訳方式の操作は複雑であるので、適切な
時間内で翻訳するには非常にパワーのあるコンピューターを要する。これらの短
所により、翻訳に適した装置は高価となる。公知の方法はまた、翻訳アルゴリズ
ムを新しくするには、毎回、コンピュータープログラムの更新とプログラミング
を要するという欠点を伴う。
【0003】 本発明の目的は、情報の変換に対する、先に述べた先行技術における不都合を
解消する方法を提供することである。
【0004】 本発明における1つの考え方は、翻訳される情報を構造的な区分に分割し、そ
れらの区分により翻訳を行うということである。翻訳はモデル区分にもとづいて
行われ、知識ベースに規範が蓄えられる。知識ベースに格納されるデータは、翻
訳時のいつでも必要なときに、ユーザーインターフェース越しに使用者が新しい
構造区分の翻訳を用意するか尋ねられ、これらの翻訳データが知識ベースにモデ
ル区分として続いて蓄えられることで都合にあわせて増加される。本発明によっ
て提供される解決法によれば、翻訳装置は、メモリ容量と演算処理スピードをあ
まり必要としない。さらに、プログラミングを必要としないだけでなく、装置の
操作性もプログラムの更新なしで向上させることができる。
【0005】 第一言語における文字列として与えられた情報を、第二言語の文字列に機械翻
訳することに対する発明の方法は、以下のことによって特徴づけられる。 ・知識ベースに第一言語の文字列の形態でモデルとなる区分を蓄え、第二言語の
文字列の形態のモデル区分にこれらを論理的に関係づけること。 ・第1番目の規範にそって、指示された第一言語の文字列における構造的な区分
を認定すること。 ・第2番目の規範にそって、蓄えられた第一言語の文字列の形態のモデル区分と
先の認定済みの構造区分を比較すること。 ・上述の比較にもとづいて、1つのモデル区分の選択を試みること。 ・選択されたモデルに、論理的に関連した第二言語の文字列の形態におけるモデ
ル区分、すなわち相当する区分を読み込むこと。 ・第3番目の規範と先の相当区分にもとづいて、指示された構造区分を第二言語
の文字列の形態の翻訳された区分に変換すること。
【0006】 第一言語の文字列として与えられた情報を、第二言語の文字列に変換すること
に対する発明の処理は、以下の手段より成ることにおいて特徴づけられる。 ・知識ベースは、第一言語の指示された文字列の形態で格納されているモデル区
分、またこれらと論理的に関係づけられて、第二言語の文字列の形態で相当する
区分を格納していること、そして第1、第2、第3番目の規範を格納しているこ
と。 ・第1番目の規範に従って、第一言語の文字列として与えられた、指示された情
報における構造的な区分を特定すること。 ・第2番目の規範に従って、第一言語の文字列の形態で格納されたモデル区分と
、先の特定された構造区分を比較すること。 ・上述の比較にもとづいて、1つのモデル区分を選ぶこと。 ・先の知識ベースの手段において、選択されたモデルに論理的に関連づけられた
、第二言語の文字列の形態のモデル区分、すなわち相当区分を読み込むこと。 ・第3番目の規範と先の相当区分にもとづいて、指定された構造区分を第二言語
の文字列の形態の指定された翻訳区分に変換すること。なお、指定された翻訳区
分は、上述の第二言語にて与えられるべき情報を表している。
【0007】 本発明の好ましい実施態様は、従属請求項にあげられている。 本発明のより詳しい説明は、以下に図を用いて述べられている。
【0008】 図1は、本発明による情報翻訳の方法を説明するものである。まず始めに、翻
訳される情報はブロック101にて読み込まれ、ブロック102にて第1番目の
規範にそって構造区分(structural segment)に分割される。続いて、最初の構
造区分はブロック103にて未翻訳の情報に読み込まれる。読み込まれた構造区
分は、ブロック104と110にて、知識ベースに保管されたモデル区分(mode
l segment)と比較され、第2番目の規範に従い、そのモデル区分が翻訳される
構造区分と似通っているかどうかを決定する。知識ベースにこの特定の構造区分
に密接に関連したモデル区分が見つかった場合、ブロック121にてその似通っ
たモデルに論理的に結合した第二言語のモデル区分、すなわち相当区分(equival
ent segment:等価(該当)セグメント)が知識ベースに読み込まれる。この後、
ブロック122にて、第3番目の規範に従い読み込まれた相当区分にもとづいて
、翻訳される構造区分から第二言語に変換される翻訳区分(translation segmen
t)が形成される。その次にブロック123にて、まだ未翻訳の構造区分がある
かどうか確認される。もしまだ未変換の構造区分があれば、処理過程はブロック
103に戻り、そこで引き続いて未変換の構造区分が翻訳のために読み込まれる
。もしブロック123に未変換の構造区分が残されていなければ、第4番目の規
範に従い、それらの翻訳区分は文章に配置され、変換された情報は保管される。
さらに、それらの保管された情報をブロック124にて、例えばスクリーン上で
表示させたり、紙やディスク上等に出力させたりすることができる。
【0009】 もしブロック110にて、知識ベースにその構造区分に近いモデル区分が見つ
からなければ、この特定の構造区分はブロック131にてユーザーインターフェ
イス手段越しに、すなわちディスプレイ画面に表示される。その後、ユーザーは
ブロック132にてその構造区分の翻訳、すなわち相当区分を入力する。その構
造区分とその相当区分は、ブロック133、134にて、将来の利用のためにモ
デル区分として知識ベースに保管される。この後、処理過程はブロック123へ
進み、上述のように続行される。この場合、もしユーザーが元の情報の形態で構
造区分の翻訳を依頼したならば、通常、相当区分は直接に翻訳区分となる。従っ
て、この場合ではブロック122の操作は、必須ではない。
【0010】 先に述べた第1番目の規範により、構造区分は特定されるが、それは例えば「
媒介語(intermediate words)」の識別などをもとに行うことができる。媒介語と
は、例えば、前置詞や接頭辞、接尾辞などで、通常、標準的な文字列を形成する
ものである。従って、それらはそれぞれの言葉を形成している文字列、例えば上
記の知られたintermediate wordという言葉を形成している一つの文字列と単純
に比較することによって識別される。事例の特定は、例えば接尾辞を用いて、公
知の接尾辞と言葉の最後の文字を比較することによって行うことができる。よく
知られたように、言葉を形成している文字列は句読法によって区切られているが
、構造区分は都合良くいくつかの言語から成っているので、一つまたはそれ以上
の句読点をも含む。
【0011】 最もまっすぐでわかりやすい翻訳では、先に述べた第2番目の規範により、構
造区分はモデル区分と比較されるが、類似性を当然伴なう。この場合では、翻訳
される当構造区分とまさしく同じモデル区分が、知識ベースにおいて検索される
。しかしながら、知識ベースに必要とされるメモリスペースを考えると、例えば
知識ベースに別々のモデル区分というように異なる事例を保管することは好まし
くないが、第2番目の規範にそって異なる事例を持つモデル区分を識別すること
は望ましい。この状況では、そのモデル区分に論理的に関連した相当区分がまた
、翻訳区分を生成するために必要とされる事例に入力される。このことは、審議
中の言語の事例について引き続いて情報を担当する第3番目の規範に従って行わ
れる。
【0012】 多くの事例で、上述の第4番目の規範により翻訳区分が翻訳された文章中に配
置されるが、それは同じ順番に、ここでは翻訳される構造区分は第一言語である
が、翻訳区分を設置することを当然伴なう。しかし、この順番は言語によるもの
なので、第4番目の規範はまた、言語特有のものとなる。
【0013】 モデル区分の保管において、モデル区分のタイプ識別子はまた、都合良く格納
することができる。この場合では、タイプ識別子はそれぞれのモデル区分との論
理的な結合で格納される。もしタイプ識別子が用いられると、構造区分のタイプ
によって、モデル区分にもとづいた構造区分の特定と変換にさまざまな規範が適
用される。構造区分のタイプには、例えば、動作の目的語、固有名詞、動詞、挿
入語、形容詞、イディオム等があげられる。タイプ識別子が用いられると、構造
区分が翻訳されるにつれて、ユーザーはまた当構造区分とその翻訳が関係するタ
イプを指示するように求められる。
【0014】 本発明の一つの考えは、翻訳過程において対話式に操作することで知識ベース
のアップデートを行なうことである。ここで特筆すべきことは、知識ベースのア
ップデートは新しいモデルや相当区分の保管に限定される必要はなく、上述の規
範もまた都合良くアップデートされることができる。アップデートは例えば、入
力された翻訳の規則性を特定することによってユーザーが提供した新しい構造区
分の翻訳に関連して行われる。
【0015】 第一言語から第二言語への情報の一部の変換については、上に述べた。先の知
識ベースのアップデートは、情報の連続した部分の変換に都合が良い。従って、
連続した1番目と2番目の情報部分の翻訳に対する本発明の過程は、例えば以下の
ステップから成る。 ・第一言語における文字列として与えられた1番目の情報を読み込む。 ・第一言語の文字列として与えられた1番目の情報を、知識ベースにある利用可
能なデータに関して最適になるまで、第二言語の文字列として与えられた1番目
の情報に、知識ベースにあるデータにもとづいて翻訳を行なう。 ・第一言語の文字列として与えられた1番目の情報を、第二言語の文字列として
与えられた1番目の情報に変換することを完成するために要求される追加データ
を決定する。 ・知識ベースのアップデートを行なう見地で、知識ベースに先の追加データを供
給する。 ・第一言語の文字列として与えられた1番目の情報を、第二言語の文字列として
与えられた1番目の情報に変換することを完了する。 ・先の第二言語における文字列として与えられた1番目の情報を格納する。 ・第一言語の文字列として与えられた2番目の情報を格納する。 ・前述の第一言語の文字列として与えられた2番目の情報を、知識ベースにアッ
プデートされた先のデータにもとづいて、第二言語の文字列として与えられた2
番目の情報に翻訳を行なう。
【0016】 図2は、情報の翻訳に対する本発明のデバイスの配置のブロック図である。本
配置は、プロセッサー20に接続するインターフェイス手段として、ディスク装
置21、ディスプレイ画面22、キーボード23より構成される。ディスク装置
手段によって、翻訳される情報はディスクからデバイスへ提供でき、翻訳された
情報は他のデバイスにおける利用のためにディスクに保管できる。審議中の情報
はまた、I/Oバスを通してそのデバイスと他のデータ処理装置の間を移動でき
る。ディスプレイ画面22は、知識ベースに翻訳が見つからなかった構造区分を
ユーザーに示すことに用いられる。ユーザーは、キーボード23を利用して、そ
のような構造区分の翻訳を提供することができる。上述したインターフェイス手
段はまた、翻訳された情報の校正や改訂にも利用することができる。
【0017】 図2に示されたデバイスはまた、構造区分と翻訳区分の一時的な保管のための
電子メモリ24から構成される。さらに本デバイスは、知識ベース、すなわちプ
ログラムのみならず、規範、タイプ識別子、モデル区分の保管のための集積記憶
装置25も含む。例えば、ハードディスクドライブや光学的ディスクドライブは
、集積記憶装置として利用することができる。上述した構成部分は、特別なソフ
トウェアを用いている本発明にそって、以前から知られたコンピューターのパー
ツの処理を行なうことにより提供することが可能である。文字列やその他のデー
タは、パーツの間を電子信号として好都合に移動することができる。
【0018】 本発明の実施は、先に述べた構成部に限定されるどころか、対照的に、本発明
のアレンジはたくさんの異なった構成を持つことができる。そのことは、この記
載が技に熟練した人物に設計することを可能にさせる。
【0019】 図3は、構造区分31、32、33、34に分割された英語の文を説明してい
る。図に示されているように、構造区分は一般的に1つの文において、連続した
密接に関連した言葉から構成される。従って、さらに、構造区分はしばしば言葉
を分ける句読点も含む。
【0020】 図4は、本発明の1つの解決により、図3の文の1番目の構造区分が翻訳される
実例である。当図において、翻訳される構造区分42は、翻訳メモリ41に格納
され、この構造区分は知識ベース44に格納されたモデル区分と比較される。図
4に示された例では、この特定の構造区分は、モデル区分45として知識ベース
に前もって保管されていることが、比較において見つかった。例えば、当情報が
フィンランド語に翻訳される場合、先の英語のモデル区分に論理的に関連したフ
ィンランド語のモデル区分46が、知識ベースに読み込まれる。図4におけるモ
デル区分45と46を結ぶ二重線は、論理結合を示している。フィンランド語の
モデル区分が読まれると、それは変換メモリに翻訳区分として保管される。
【0021】 図5は、本発明の1つの解決により、図3に示された2番目の構造区分が翻訳
される実例である。この実例では、翻訳される英語の構造区分とフィンランド語
の相当区分は、知識ベースにモデル区分として事前に保管されていない。このよ
うな場合では、変換メモリ51に格納された翻訳される構造区分52は、知識ベ
ースにあるモデル区分と比較され、知識ベースに望む相当区分が見つからない場
合は、翻訳される構造区分58は、インターフェイス57のディスプレイ画面に
表示される。この後、ユーザーは構造区分58の翻訳59を、知識ベース54に
インターフェイスを通して入力する。このやり方では、英語とフィンランド語の
モデル区分は、知識ベースに論理的結合で保管される。次いで、その構造区分の
フィンランド語訳は、変換メモリ51に翻訳区分53として保管される。
【0022】 先に述べた構造区分は、入力情報に再現され、符号するモデルと相当区分は知
識ベースで得られるようになる。それにより、ユーザーにそれらを繰り返し尋ね
る必要がなくなる。しかしながらもし、以下の入力情報が、「we have expanded
our operation largely in Finland」という文を含む場合、「largely」は新しい構
造区分となる。知識ベースに事前に似通ったモデル区分が保管されていない場合
、ユーザーはその訳を提供するように求められる。そして、「largely」は知識ベ
ースにモデル区分として保管され、さらにこれとの論理的結合で、ユーザーによ
って入力された翻訳がまた保管される。
【0023】 ここで特筆すべきことは、本設備の操作は、翻訳処理が全ての情報に対して、
知識ベースに格納されたモデル区分によって可能な限りまで、まず第一に機械に
よって行われるようにアレンジできることである。この後、ユーザーは知識ベー
スに、新しい構造区分の必要な翻訳を供給できる。そのようなアレンジはユーザ
ーにとって、翻訳処理が完了するのをコンピューターのそばで待たなくてもよい
という利点があるが、知識ベースはいつでも適宜、ただ一度の入力でアップデー
トすることができる。
【0024】 モデル区分は知識ベースに、それぞれの言語の組に対して格納されたモデル区
分の特定の組、区分のペアとして保管することができる。その他の仕方は、いく
つかの言語におけるモデル区分を論理的に結合することである。それにより、同
じモデル区分はいくつかの言語のペアの変換において、そのように利用すること
ができる。この場合では、それぞれの言語のモデル区分は、審議中の言語におい
て新しいものが現れる度に知識ベースに入力することで供給することができる。
一組の言語の翻訳中に、知識ベースに入力情報が提供されたときは、知識ベース
に含まれる情報は自動的にまた、他の言語のペアにおいても増加する。
【0025】 本発明の解決策は、原則として言語に固有のものではなくて、どんな言語の組
み合わせにも適用できるものである。本発明は、文字列から成るどんな言語でも
、文字列から成る第二言語に翻訳することに利用できるので、通常のコミュニケ
ーションに用いられる「自然な」言語に、本発明の実施は限られるものではない。
プログラミング言語やデータ変換プロトコルが、そのようなその他の言語の例と
してあげられる。
【0026】 本発明の解決策は、先行技術を超える有利な点がたくさんある。その操作には
、構造区分に言語を分割するのに、言語特有の知識はほとんど要しない。第二の
利点は、処理中にメモリに収集された付加的な情報にある。それにより、デバイ
スは新しいモデル区分の組や規範を「学習」する。従って、平易な構成と少量のプ
ログラミングとアップデートにより、機械翻訳に能率的な手段を提供することが
できる。
【0027】 本発明の解決策は、本発明のアレンジが何人かのユーザーの必要性を鑑みて用
いられている状況での利用によく適合されている。この状態では、アレンジはい
くつかのインターフェイスから構成されるのが好ましく、例えば、データ伝送ネ
ットワークを通して知識ベースと通信する。知識ベースは、以下に述べる方法で
なるべく分散させることができる。第一に、主知識ベースは、一定のユーザーグ
ループが利用可能であること。第二に、副知識ベースはそのような一定のユーザ
ーグループにおける少数のみが利用可能であること。このことは、異なるユーザ
ーに、例えば、特別な語彙や表現を、他のユーザーが使用している別の目的に合
った知識と関係なく、彼ら固有の知識ベースをアップデートすることを可能にす
る。
【0028】 そのように分散された知識ベースにおいては、第一のアップデートすなわち主
知識ベースは、第二すなわち副知識ベースから行うことができる。第二の知識ベ
ースに保管されたデータは、既定の基準により第一の知識ベースに転送される。
そのような基準の一つは、特定のデータの発生率である。知識ベース間でのデー
タ交換はまた、転送される個々のデータの確認と承認を行う共有の主知識データ
ベースアドミニストレーターにより、行うことができる。
【0029】 本発明による解決策のいくつかの実施態様は、先に述べた。本発明の原則は、
もちろん、例えば適用の範囲や実施態様の詳細に関して、クレイムの範囲内で変
わることができる。
【図面の簡単な説明】
【図1】 本発明による情報の翻訳に対する方法のフローチャート。
【図2】 本発明による情報の翻訳に対するアレンジのブロック図。
【図3】 文字情報を構造区分に分割する説明図。
【図4】 一つの構造区分が、知識ベースにある似通ったモデル区分と翻訳される過程を
説明する図。
【図5】 一つの構造区分が、知識ベースにないモデル区分と翻訳される過程を説明する
図。

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 以下にあげる項目からなる、第一言語における文字列として
    与えられた情報を、第二言語における文字列に機械翻訳を行なう方法。 ・指定された第一言語の文字列の形態におけるモデル区分と、これらと論理的に
    結合した、第二言語の文字列の形態におけるモデル区分(133、134)の知識
    ベースにおける格納。 ・第1番目の規範(102)に従い、先の第一言語の文字列において構造区分を認
    定する。 ・前述の認定された構造区分を、第2番目の規範にそって、保管されている第一
    言語の文字列の形態におけるモデル区分(104)と比較する。 ・先の比較にもとづいて、1つのモデル区分(110)を選択することを試みる。 ・1つのモデル、すなわち、選択されたモデル区分に論理的に結合した、第二言
    語の文字列の形態における相当区分(121)を読み込む。 ・第3番目の規範(122)と前述した相当区分にもとづいて、第二言語の文字列
    の形態における前記の翻訳区分に、上記の構造区分を変換する。 なお、本方法は、接尾辞や媒介語の認定から構成され、前述の第1番目の規範
    は、必然的に接尾辞や媒介語の認定にもとづいていることにおいて特徴づけられ
    ている。
  2. 【請求項2】 第二言語の文字列として与えられる指定された情報が、第4
    番目の規範(124)と翻訳区分にもとづいて作成されることにおいて特徴づけら
    れた、請求項1に記載の方法。
  3. 【請求項3】 構造区分の比較の結果として、第2番目の規範に従う、選択
    されるモデル区分が見つからなかった場合、その構造区分はユーザーインターフ
    ェイス(131)により表示され、その表示された構造区分の相当区分が、ユーザ
    ーインターフェイス(132、133)を用いて知識ベースに蓄えられることにお
    いて特徴づけられた、請求項1または2に記載の方法。
  4. 【請求項4】 前述の構造区分は、句読点を含むことにおいて特徴づけられ
    た、先の全請求項のいずれかに記載の方法。
  5. 【請求項5】 モデル区分のタイプ識別子は、モデル区分との論理的結合で
    保管されることにおいて特徴づけられた、先の全請求項のいずれかに記載の方法
  6. 【請求項6】 互いに論理的に結合した、異なる言語を表わしている2以上
    のモデル区分をもつことにおいて特徴づけられた、先の全請求項のいずれかに記
    載の方法。
  7. 【請求項7】 前述の規範の中の1つが、ユーザーインターフェイスから出
    力されるデータにもとづいて更新されることにおいて特徴づけられた、先の全請
    求項のいずれかに記載の方法。
  8. 【請求項8】 情報は、1番目の情報を翻訳する見地で、知識ベースを更新
    するためにユーザーインターフェイスを通して提供され、その入力データは前記
    の知識ベースにおいて、先の1番目の情報を翻訳するために必要とされたデータ
    より、他のデータを更新するために用いられることにおいて特徴づけられた、先
    の全請求項のいずれかに記載の方法。
  9. 【請求項9】 以下にあげる段階を含むことにおいて特徴づけられた、先の
    全請求項のいずれかに記載の方法。 ・第一言語における文字列として与えられた1番目の情報を読み込む。 ・知識ベースにあるデータにもとづいて、先の第一言語における文字列として与
    えられた1番目の情報を、第二言語における文字列として与えられた1番目の情報
    に、知識ベースにある利用できるデータによって可能な範囲まで翻訳を行なう。 ・第一言語における文字列として与えられた1番目の情報を、第二言語における
    文字列の形態の1番目の情報に、翻訳することを完成するのに必要な追加データ
    を決定する。 ・知識ベースを更新するために、知識ベースに前述の追加データを入力する。 ・第一言語における文字列として与えられた1番目の情報を、第二言語における
    文字列として与えられた1番目の情報に翻訳することを完成する。 ・第二言語にて与えられた先の1番目の情報を保管する。 ・第一言語における文字列として与えられた2番目の情報を読み込む。 ・先の第一言語における文字列として与えられた2番目の情報を、知識ベースに
    ある先程の更新されたデータにもとづいて、第二言語における文字列として与え
    られた2番目の情報に翻訳する。
  10. 【請求項10】 以下の手段から構成された、第一言語における文字列とし
    て与えられた情報を、第二言語における文字列に翻訳するための処理。 ・指示された第一言語における文字列の形態のモデル区分と、これらと論理的に
    結合した、第二言語における文字列の形態の相当区分と、第1、第2、第3番目
    の規範を保管するための知識ベース(20、25)。 ・第1番目の規範に従い、指示された第一言語の文字列として与えられた情報に
    おける構造区分を認定するための手段(20、24)。 ・第2番目の規範に従い、第一言語の文字列の形態において保管されたモデル区
    分と、先の認定された構造区分を比較するための手段(20、25)。 ・上記の比較にもとづいて、一つのモデル区分を選択するための手段(20)。 ・そのモデル、すなわち、前述した知識ベースにおいて選択されたモデル区分に
    、論理的に結合した第二言語の文字列の形態における相当区分、を読み込むため
    の手段(20、25)。 ・第3番目の規範と先の相当区分にもとづいて、前述の構造区分を第二言語の文
    字列の形態における前述の翻訳区分に変換するための手段(20、24)。ここで
    、前述の翻訳区分は、上記の第二言語において与えられる情報を表している。 なお、第一言語の文字列として与えられた、前述の情報における構造区分を認
    定するための上記の手段(20、24)は、接尾辞や媒介語の認定のための手段か
    ら構成され、前記の第1番目の規範は、接尾辞や媒介語の先の認定に必然的にも
    とづいていることにおいて特徴づけられている。
  11. 【請求項11】 第4番目の規範と少なくとも2つの翻訳区分にもとづいて
    、第二言語の文字列として与えられる情報を、作成するための手段(20、25)
    をさらに含むことにおいて特徴づけられた、請求項10に記載の処理。
  12. 【請求項12】 前記の知識ベース手段に、ユーザーを結ぶためのユーザー
    インターフェイス手段(22、23)を含むことにおいて特徴づけられた、請求項
    10または11に記載の処理。
  13. 【請求項13】 ユーザーインターフェイス手段が、データ転送ネットワー
    クを通して、前記の知識ベース手段に結ばれていることにおいて特徴づけられた
    、請求項12に記載の処理。
  14. 【請求項14】 前記の知識ベース手段は、特定のユーザーが第一の知識ベ
    ース手段にアクセスし、先の特定のユーザーのうちの何人かのみが、第二の知識
    ベース手段にアクセスできるように、第一の知識ベース手段(25)と第二の知識
    ベース手段から構成されていることにおいて特徴づけられた、請求項10から1
    3のいずれかに記載の処理。
  15. 【請求項15】 前記の知識ベース手段は、第一の知識ベース手段(25)と
    第二の知識ベース手段、ユーザーインターフェイス手段から前記の第二の知識ベ
    ース手段へ入力されるデータのための手段と、前記の第二の知識ベース手段に保
    管されたデータの前記の第一の知識ベース手段へ選択的に転送するための手段か
    ら成る処理、を含むことにおいて特徴づけられた、請求項10から14のいずれ
    かに記載の処理。
JP2000551334A 1998-05-27 1998-05-27 情報の機械翻訳に対する処理と方法 Pending JP2002517040A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FI1998/000441 WO1999062002A1 (en) 1998-05-27 1998-05-27 A method and arrangement for translation of information

Publications (1)

Publication Number Publication Date
JP2002517040A true JP2002517040A (ja) 2002-06-11

Family

ID=8556719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000551334A Pending JP2002517040A (ja) 1998-05-27 1998-05-27 情報の機械翻訳に対する処理と方法

Country Status (6)

Country Link
EP (1) EP1080424B1 (ja)
JP (1) JP2002517040A (ja)
DE (1) DE69835239T2 (ja)
EA (1) EA004243B1 (ja)
NO (1) NO319431B1 (ja)
WO (1) WO1999062002A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7096210B1 (en) 2000-03-10 2006-08-22 Honeywell International Inc. Trainable, extensible, automated data-to-knowledge translator
EP1306775A1 (en) 2001-10-29 2003-05-02 BRITISH TELECOMMUNICATIONS public limited company Machine translation
FI114347B (fi) * 2002-03-20 2004-09-30 Master S Innovations Ltd Oy Menetelmä ja laitteisto datan kääntämiseksi
EP1349079A1 (en) * 2002-03-28 2003-10-01 BRITISH TELECOMMUNICATIONS public limited company Machine translation
US8706477B1 (en) 2008-04-25 2014-04-22 Softwin Srl Romania Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code
US8762131B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
US8762130B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3788488T2 (de) * 1986-10-03 1994-05-11 British Telecomm Sprachenübersetzungssystem.
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation

Also Published As

Publication number Publication date
EP1080424B1 (en) 2006-07-12
EP1080424A1 (en) 2001-03-07
DE69835239D1 (de) 2006-08-24
DE69835239T2 (de) 2007-06-14
NO319431B1 (no) 2005-08-08
EA200001108A1 (ru) 2001-06-25
WO1999062002A1 (en) 1999-12-02
EA004243B1 (ru) 2004-02-26
NO20005930L (no) 2001-01-29
NO20005930D0 (no) 2000-11-23

Similar Documents

Publication Publication Date Title
US5590039A (en) Natural language processing apparatus and method for performing processing to analyze the meaning of an input sentence entered in the form of a natural language
US5268839A (en) Translation method and system for communication between speakers of different languages
US5845143A (en) Language conversion system and text creating system using such
JP4404211B2 (ja) マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
US5802504A (en) Text preparing system using knowledge base and method therefor
JP3055545B1 (ja) 関連文検索装置
JPH01501977A (ja) 言語翻訳システム
JPH0869470A (ja) 自然言語処理装置及びその方法
JPH07282063A (ja) 機械翻訳装置
JPH11184855A (ja) 翻訳方法およびシステム
JP2001195404A (ja) 句翻訳方法およびシステム
JP2002517040A (ja) 情報の機械翻訳に対する処理と方法
JP3657338B2 (ja) 翻訳装置
JP2001101186A (ja) 機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
JP3294966B2 (ja) 機械翻訳装置
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置
JP2759123B2 (ja) かな漢字変換装置
JP3884807B2 (ja) 文書処理方法及びその装置
FI103156B (fi) Menetelmä ja järjestely informaation kääntämiseksi
JP3884001B2 (ja) 言語解析システムおよび方法
JPS5920077A (ja) 電子式翻訳機の変化語形翻訳方式
JPH10105553A (ja) 機械翻訳システム
JPH01300378A (ja) 翻訳処理装置
JPH05250413A (ja) テキストデータ検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070605

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071030