JP3385141B2 - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JP3385141B2
JP3385141B2 JP30910795A JP30910795A JP3385141B2 JP 3385141 B2 JP3385141 B2 JP 3385141B2 JP 30910795 A JP30910795 A JP 30910795A JP 30910795 A JP30910795 A JP 30910795A JP 3385141 B2 JP3385141 B2 JP 3385141B2
Authority
JP
Japan
Prior art keywords
target language
code
substructure
grammar
language code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30910795A
Other languages
English (en)
Other versions
JPH08263497A (ja
Inventor
ポナンスキ ビクター
ルイス ビーバン ジョン
ジョージ ジョンソン イアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPH08263497A publication Critical patent/JPH08263497A/ja
Application granted granted Critical
Publication of JP3385141B2 publication Critical patent/JP3385141B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、機械翻訳システム
に関する。
【0002】
【従来の技術】WhitelockによるProc. of COLING-92、A
ug.23-28, 1992、「Shake-and-Bake Translation」に開
示された「語彙−意味変換」方法に基づくいくつかの機
械翻訳システムが知られている。これらのすべては、文
を入力として取り込む計算システムによって概念的に分
割され得る。入力は、基本的な言語要素を、本来の言語
から翻訳される言語へ変換し、これらを文法的な方法で
再構成するいくつかのモジュールに渡される。再構成が
成功すると、翻訳された文は、翻訳された言語構造から
抽出され、出力される。モジュールの種類には以下のも
のがある。
【0003】1.「解析モジュール」:翻訳される文
(ソース文)を解析して、得られる語彙項目または語彙
符号(文法的に、詳しくは直前に行われた解析によって
作製されるソース言語用の辞書から得られる項目)を抽
出する。
【0004】2.「変換モジュール」:ソース言語の語
彙項目をターゲット言語の語彙項目セットに翻訳する。
この方法が機能するためには、ソース解析から推論され
る重要な意味的情報のいくつかもまたターゲット符号間
に維持されなければならない。これが「語彙−意味変
換」という用語の源である。
【0005】3.「生成モジュール」:(a)いくつか
の構造の中で1つの構造が最終的には正しいはずである
ため、ターゲット言語の語彙符号に適合し得る構造の任
意の置換を生成することによって(これはまた「生成お
よび試験」として知られる)、または(b)制約のシス
テムによって不可能な構造を削除することによって、タ
ーゲット符号の任意の組み合わせを減らすように努める
ことによって、ターゲット符号の集合を1つの文法的な
構造へと縮小する。
【0006】しかし、これらの方法は両方とも、ターゲ
ット言語構造を組み立てる系統的な手段がないという点
であいまいである。このように操作に任意の面があるた
め、これらの方法は一般的な翻訳に用いるにはコンピュ
ータ操作上極めて高くつく。 4.生成モジュールが文法的な構造を生成するのに成功
すると、「出力モジュール」はその綴りを抽出する。綴
りは、前の工程で適用された様々な文法上の規則または
制約を用いて得られており、これにより翻訳された文
(ターゲット文)を与える。
【0007】
【発明が解決しようとする課題】しかしながら、上述の
従来技術においては、次に示す問題があった。
【0008】上述のように、生成および試験方法に伴う
問題は、正しい翻訳に到達するかまたは可能な構造すべ
てに当たった後あきらめるまでには、大量の処理時間が
必要となり得ることである。例えば、X個のターゲット
符号が1つの文法的な構造へと形成される場合は、シス
テムはこれらの符号のすべての可能な置換を試みる。多
くのソース言語の文に対しては、合理的な量の処理時間
の後で正しい構造が見い出される。しかし、多くの文に
対して、正しい構造が導き出されるのは、すべての可能
な置換のうちの大部分が試さた後である。システムが翻
訳不可能ないくつかの文に対しては、置換のすべてが試
された後初めて、システムは敗北を認めて別の文に移
る。このような場合には、置換数はX!(階乗X)であ
る。例えば、Xが比較的小さな数、例えば5または6で
あるときは、これは不利とはならない。しかし、ソース
言語の文が、例えば、10以上のターゲット言語符号を
生じさせる場合は、このようなシステムは、何百万回も
の試みを行うまでは失敗を認めない。実行可能な時間フ
レーム内で翻訳を行うことを可能とするためには、この
ようなシステムの処理速度では不十分である。この結
果、システムを現時点で利用可能なデータ処理システム
によって具体化すれば、システムは制御不能となる。ソ
ース言語が複合文の場合は、失敗を認めるまでに必要な
処理時間は、数日、数年、または宇宙の推定寿命より長
い年月となり得る。
【0009】欧州特許第0 568 319号には、基本的な「s
hake-and-bake」機械翻訳システムの改良を表す配置が
開示されている。この配置は、ターゲット言語符号のす
べての可能なペアの組み合わせを特定し、これにより1
組の関係を形成する。次にシステムは、これらペアの組
み合わせが層構造へと組み立てられ得る方法を探求す
る。例えば、組み立てられた構造内に符号のすべてを用
いることに失敗した構造は拒絶され、全く新しい構造が
試される。
【0010】本発明は、上記課題を解決するためになさ
れたものであり、その目的とするところは、比較的少な
い評価工程で正しい翻訳を可能とする機械翻訳システム
を提供し、これにより、先行技術に比べて処理時間が実
質的に減少させる点にある。
【0011】
【課題を解決するための手段】本発明の機械翻訳システ
ムは、ソース言語のテキストをターゲット言語のテキス
トに翻訳する機械翻訳システムであって、該ソース言語
のテキストを該システムに入力するための入力インタフ
ェースと、該入力テキストの文法的に完全な部分をソー
ス言語形態素に解析して、各形態素毎に、その形態素を
識別する識別子と、その形態素とは文法的に関連する他
の形態素を識別するためのデータとによって形成される
標識を有するソース言語符号とするアナライザと、該ソ
ース言語符号の識別子およびデータを、該ソース言語お
よび前記ターゲット言語の同義規則に基づいて、対応す
るターゲット言語形態素の識別子およびデータを有する
ターゲット言語符号に変換する、第1変換器と、各ター
ゲット言語符号を、関連する少なくとも1つの他のター
ゲット言語符号と結合させたサブ構造を有するターゲッ
ト言語構造とする結合器と、該サブ構造とされる各ター
ゲット言語符号の識別子およびデータに基づいて、該タ
ーゲット言語構造を、文法規則に適合したサブ構造と文
法規則に適合したサブ構造の一部を形成しないターゲッ
ト言語符号とに識別して評価する評価器と、該評価器に
よって識別された文法規則に適合したサブ構造を形成す
る各ターゲット言語符号を相互に分離させることなく新
たな標識を有するターゲット言語符号として該ターゲッ
ト言語構造を変換する第2変換器とを備え、該評価器と
該第2変換器とは該ターゲット言語構造を交互に評価お
よび変換を繰り返し、そのことにより上記目的が達成さ
れる。
【0012】ある実施形態では、前記第2変換器は、
法規則に適合した第1のサブ構造または文法規則に適合
したサブ構造の一部を形成しない第1のターゲット言語
符号を、関連する標識を有する文法規則に適合した第2
のサブ構造または第2のターゲット言語符号、該第1
および第2のターゲット言語符号または文法規則に適合
したサブ構造のうちの一方の識別子が該第1および第2
のターゲット言語符号または文法規則に適合したサブ構
造の他方のデータ内に含まれるように関連付けるように
なっている。
【0013】別の実施形態では、前記ターゲット言語構
造は、最低次のノードに前記ターゲット言語符号を有す
る階層的なノード構造を包含し、前記第2変換器は前記
第1のターゲット言語符号または文法規則に適合したサ
ブ構造を最高次のノードの前記第2のターゲット言語符
号または文法規則に適合したサブ構造と関連付けるよう
なっている。
【0014】また、別の実施形態では、前記評価器は、
少なくとも1つの文法規則に適合したサブ構造が変更さ
れないような前記第2変換器による前記ターゲット言語
構造の変換の後で、該変更されない文法規則に適合した
サブ構造を再評価しないようになっている
【0015】更に、別の実施形態では、前記評価器は、
少なくとも1つの文法規則に適合したサブ構造が変更さ
れるような前記第2変換器による前記ターゲット言語構
造の変換の後で、該変更されたサブ構造の変更された部
分のみに関して再評価するようになっている
【0016】ある実施形態では、前記評価器は第3の
ターゲット言語符号または文法規則に適合したサブ構造
が第4のターゲット言語符号または文法規則に適合した
サブ構造と関連付けられる文法規則に適合した第5の
ブ構造の一部を形成するよう、前記第2変換器によっ
て前記ターゲット言語構造が変換された後に文法規則
に適合した該第5のサブ構造を、該第3のターゲット言
語符号および文法規則に適合したサブ構造と第4のター
ゲット言語符号および文法規則に適合したサブ構造との
関連についてのみ構造が評価および変換によっていつ
でも改良される単調文法に従って再評価するようになっ
ている。
【0017】
【0018】また、他の実施形態では、前記アナライザ
は、前記入力テキストのソース言語構造を前記結合器に
供給するように配置され、該結合器は前記ソース言語構
造に類似させて前記ターゲット言語構造を形成するよう
なっている
【0019】
【0020】以下に本発明の作用を説明する。
【0021】本発明によれば、請求項1で定義されたよ
うな機械翻訳システムが提供される。
【0022】本発明の好適な実施態様は他の請求項に定
義されている通りである。
【0023】「テキストの文法的に完全な部分」という
用語は、テキストの中のそれ自体本質的に完全な部分を
意味する。一般に、これは文であるが、変形例として節
または句を含む。
【0024】従って、現時点で利用可能なデータ処理シ
ステムによって具体化され得、また制御可能なシステム
である機械翻訳システムを提供することが可能である。
つまり、システムは、例えば1つの文を翻訳するのに成
功するか、または合理的な時間内にすべての可能なター
ゲット言語構造を探求した後あきらめる。例えば、X個
のターゲット言語符号に対して、あきらめるまでに実行
される最大変換数はX3以下であるかまたはXにおける
合理的なほどに低い次数の多項式であると考えられる。
実際においては、これよりはるかに少ない変換で十分で
あり得る。従って、システムが望ましくないモードで効
果的にロックされる可能性は防止され得る。
【0025】本システムは、良好に形成されたサブ構造
を、このようなサブ構造は、適切であれば追加はされ得
るが、形成された後は破壊されることはないという意味
で保存することによって、効率性が改善される。従っ
て、完全な翻訳が可能であるときは、翻訳は、従来のシ
ステム、例えば欧州特許第0 568 319号で開示されたタ
イプのシステムにおけるより迅速に行われる。
【0026】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しながら説明する。
【0027】図1に示す機械翻訳システムは、以下に述
べる動作を実行するための専用のハードウェアによって
具体化され得る。しかし、一般に、システムは、例え
ば、半導体または磁気メモリに記憶された適切なソフト
ウェアによって制御されるプログラム可能なデータプロ
セッサによって具体化される。図面および以下の記述か
ら、当業者であれば、専用ハードウェアを作製するこ
と、またはプログラム可能なハードウェアを制御するた
めの専用ソフトウェアを書くことは容易に行われ得る。
【0028】図1に示すシステムは、ソース言語のテキ
ストがシステム内に入力されることを可能にする入力イ
ンタフェース100を有する。例えば、入力インタフェ
ース100はキーボードまたは磁気ディスク読み取り装
置を包含し得る。インタフェースの出力は形態素アナラ
イザ101に接続する。形態素アナライザは、入力され
たテキストを、語の基本形態と基本形態を修飾する接辞
(接頭辞および接尾辞)とからなる、形態素として知ら
れる最も基本的な語単位に解析する。
【0029】アナライザ101からの形態素は、構文ア
ナライザまたはパーサ102に供給される。構文アナラ
イザは、ソース言語の文法の規則を形態素に適用して、
形態素間の文法的な関係を定義する。この情報は二カ国
語同義語変換器103に供給される。さらに、アナライ
ザ102は、形態素がソース言語内でどのように結合さ
れていたかを定義する「ツリー」を生成する。
【0030】形態素およびこれに関連するデータは合わ
せて「符号」と呼ばれ、二カ国語同義語変換器103に
供給される。変換器103は、ソース言語の各符号を同
義のターゲット言語の符号に置換して、これにより、ソ
ース言語の各形態素をその同義のターゲット言語の形態
素に変換し、ソース言語の各符号の文法データをターゲ
ット言語の対応する文法データに変換する、二カ国語同
義語規則を利用する。かくして、変換器103は出力言
語符号を生成し、結合器104に供給する。
【0031】結合器104はターゲット言語符号を結合
して、入力テキストと同義のターゲット言語を形成する
ための最初の試みを行う。結合器は、所定のまたは不規
則な構造であり得るターゲット言語ツリー(解析ツリ
ー)を定義する。しかし、多くの言語の解析ツリーは本
質的な類似性を有するため、結合器104は好ましく
は、アナライザ102からのソース言語の解析ツリーを
利用して、ターゲット言語テキストの最初の試みを行
う。
【0032】ソース言語解析ツリーとターゲット言語符
号とによって定義される言語構造は評価器105に供給
される。評価器は、ターゲット言語の文法規則セットを
符号に適用することによって、ターゲット言語テキスト
の最初の試みの有効性を評価する。評価が成功すれば、
テキスト情報は出力インタフェース107に渡され、出
力インタフェースはシステムの出力テキストを、例え
ば、プリンタ、視覚表示ユニット、またはメモリに供給
する。評価が成功しない場合は、その構造は変換器10
6で変換され、構造のなかで正しいと評価された部分は
破壊せずに解析ツリーを効果的に変更し、評価器105
により再評価が行われる。各変換は構造を向上させる効
果を有し、その結果、構造が正しいターゲット言語に翻
訳されるようにすべきである。もしくは、システムが正
しい翻訳を生成することができない場合は、比較的少な
い繰り返しの後に失敗とされ、別の入力文に移る。シス
テムが失敗しない場合は、このプロセスは評価が成功す
るまで繰り返され、符号および正しい構造が出力インタ
フェース107に渡され得る。このように、形態素は正
しいターゲット言語テキスト単位、すわわち語に変換さ
れ、ターゲット言語における正しい順番で配置される。
【0033】図1に示すシステムの動作をより明瞭に説
明するために、フランス語(ソース言語)の文を英語
(ターゲット言語)の同義の文に翻訳する場合の工程を
示すことにより、特定の例を詳細に示す。図2は、入力
インタフェース100によって供給される、フランス語
の文「Le rapide renard brun plait au chien.」とい
う入力テキストAを示す。このテキストは形態素アナラ
イザに供給され、ここでフランス語のテキストの各語が
同義の1つのまたは複数の形態素に置換される。形態素
は、図3にアナライザ101によって供給される情報B
として示す。形態素は、フランス語の文法規則を適用す
ることによって解析動作を行う構文アナライザ102に
供給され、図4に示すような解析ツリーを生成する。例
えば、フランス語のテキストの語の順序にほとんど対応
する形態素の順序に従って、指標が形態素に割り当てら
れる。従って、第1の形態素(指標=1)は語「Le」、
第2の形態素(指標=2)は語「rapide」などとなる。
定形動詞「plait」は指標5および6の2つの形態素に
よって置換される。第5の形態素は不定形動詞「plair
e」であり、第6の形態素は、入力テキストの動詞が現
在形であることを示す「現在」である。同様に、第7お
よび第8の形態素はフランス語「au」を「a」と「le」
とに分解する。従って、第5、第7、および第8の形態
素は基本形態を表し、第6の形態素は第5の形態素の接
辞を表す。
【0034】形態素間の構文上の関係を定義する解析
作の結果として、構文アナライザ102は、各形態素を
形態素間の関係を示す所定のデータにより標識化して、
フランス語の符号を生成する。図5は、いくつかの異な
るタイプの形態素を標識化するために、アナライザ10
2によって生成される情報を示す。このように、フラン
ス語の名詞からなる形態素に対しては、符号は、この形
態素が名詞であることを示し、その指標を割り当て、ま
たその形態素の綴りを与える標識110を有する。動詞
符号111は、同様に、その形態素の割り当てられた指
標および綴りを有する。これらに加えて、符号は、ソー
ス言語(フランス語)における動詞の主語である形態素
の指標と動詞の目的語である形態素の指標とを含む。
【0035】形容詞および前置詞のための符号は各々1
12および113で示される。これらの符号の各々は、
形態素の指標、その綴り、および文法的に関連する形態
素の指標を含む。図6は、図2に示すフランス語の文に
対応する、アナライザ102によって生成された符号D
を示す。第1の符号は、第1の形態素に対応する指標1
として標識化される。これは指標3の形態素を修飾し、
綴り「le」を有する。第2の形態素に対応する第2の符
号は指標2を有し、第3の形態素(指標3)を修飾し、
綴り「rapide」を有する。第3の形態素に対応する第3
の符号は、指標3および綴り「renard」を有する。第4
の形態素に対応する第4の符号は指標4を有し、形態素
3を修飾し、綴り「brun」を有する。
【0036】第5の形態素に対応する第5の符号は指標
5を有し、主語が形態素3で目的語が形態素9の動詞で
あり、綴り「plaire」を有する。第6の符号は第6の形
態素に対応し、指標6を有し、第5の形態素を修飾し、
現在形を示す綴り「現在」を有する。第7の符号は第7
の形態素に対応し、指標7を有し、形態素9を修飾し、
綴り「a」を有する。第8の形態素に対応する第8の符
号は指標8を有し、第9の形態素を修飾し、綴り「le」
を有する。第9の符号は指標9を有し、綴り「chien」
を有する。
【0037】フランス語の符号は変換器103に供給さ
れ、変換器は二カ国語同義規則セットを適用して、フラ
ンス語の符号を同義の英語の符号に変換する。これらの
同義規則は、各フランス語の符号の綴りが英語の符号の
綴りによって置換され、フランス語の符号の標識が英語
の符号の同義の標識によって置換される二カ国語辞書に
等しい効果を持つ。図6に示す符号に関連する規則Eを
図7に示す。規則(i)〜(iii)および(v)〜
(viii)の場合には、英語の各符号は対応するフラ
ンス語の符号と同じ修飾語および指標を有するため、唯
一の相違は、フランス語の形態素が英語の形態素に置き
換わる「綴り標識」である。しかし、規則(iv)の場
合には、変換器103は図6に示した第5および第7の
符号を認識し、図7に示すように標識を変換する。かく
して、不定形動詞「plaire」と前置詞「a」とは英語の
不定形動詞「to like」に対応するものとして認識さ
れ、これに応じて綴りが変換される。しかし、フランス
語と英語間の翻訳では、主語と目的語とは倒置しなけれ
ばならないということが規則で認められている。従っ
て、指標5のフランス語の符号は、主語および目的語と
して、各々、指標3および9の形態素を有する一方で、
英語の符号は、目的語として指標3の形態素を、および
主語として指標9の形態素を有する。指標は変化しな
い。図7の規則(iv)によって示される他の変換は英
語からフランス語への翻訳の場合に必要なものであり、
従って、本実施例を説明する目的にとってはこれ以上の
説明は必要ない。図8は、図6に示したフランス語の符
号に対応するものとして変換器103によって生成され
る英語の符号Fを示す。従って、図7の規則(i)を図
6に示したフランス語の第1の符号(指標1)に適用す
ることによって、綴りは「le」から「the」に変化し、
英語の符号の指標は1、すなわち対応するフランス語の
符号と同じである。また、この符号は、フランス語の符
号の場合のように、指標3の形態素を修飾する。同様
に、英語の符号3、4、6、8、および9は指標と修飾
語(各々修飾する形態素の指標)に関しては変更はな
い。従って、フランス語から英語への変換に対応する綴
りが異なるだけである。上述のように、第5の符号はフ
ランス語の第5の符号に対応するが、主語と目的語の指
標が互いに交換される。
【0038】結合器104は、図8に示す英語の符号を
取り出して、アナライザ102によってフランス語の構
文から生成された、図4に示した解析ツリーCに従って
これらを組み合わせる。図9では、符号は標識を有する
ボックスとして示されている。ここでは、「I」は「指
標」、「M」は「修飾」、「S」は「主語」、および
「O」は「目的語」のように省略されている。指標7の
フランス語の符号は図9では存在しない。これは、この
符号はフランス語の動詞の一部を効果的に形成するが、
対応する独立した英語の符号は存在しないと変換器10
3が認識したからである。つまり、指標5の英語の符号
が、指標5および7のフランス語の符号両方を表す。こ
れ以外では、符号は、図4のツリー構造を適用して、指
標の順番に効果的に配置される。
【0039】図9に示すツリー構造は、ノードG1から
G7の各々が2つの枝を有する2値タイプである。従っ
て、ノードG1は、ノードG2およびG5に延びる2つ
の枝を有する「幹」ノードと考えられ得る。最下位レベ
ルのノードは、「葉ノード」と呼ばれ、符号よりなる。
【0040】図9にGで示す情報は、ターゲット言語
(英語)の構造が正しいかどうかを評価する評価器10
5に供給される。これを行うためには、評価器は、図1
0に示す英語の文法規則セットHを適用する。特に、図
10は、図9の符号および構造を評価し得るのに十分な
英語の文法規則を示す。図10では、垂直の棒線は変形
例を示す。
【0041】従って、第1の規則によれば、ノードが、
名詞句とこれに続く動詞句とを表す2つのサブノードに
接続され、その動詞句の主語が名詞句の指標に等しい場
合は、ノードは良好に形成されており、文を表す。第2
の規則によれば、ノードが、限定詞とこれに続く名詞
「副句」を表す2つのサブノードに接続され、限定詞が
名詞句を修飾する場合は、名詞句の指標は名詞副句の指
標に等しい。つまり、このノードは、指標が名詞句の指
標に等しい標識を与えられ得る。
【0042】第3の規則によれば、ノードが1つまたは
2つの従属ノードに接続される場合は、ノードを良好に
形成されたものとして定義しこれを標識化するためには
2つの可能性がある。名詞を表す従属ノードが1つある
場合は、ノードは良好に形成され、名詞と同じ指標で標
識化される。もしくは、ノードが形容詞とこれに続く名
詞を表す2つのノードに接続される場合、および形容詞
修飾子が名詞の指標に等しい(すなわち、形容詞がその
名詞を修飾する)場合は、ノードは良好に形成され、名
詞の指標に等しい指標が割り当てられる。
【0043】上記以外の規則を、略語の定義と共に図1
0に示す。かくして、規則(a)〜(f)は評価器10
5によって、図9に示した解析ツリーによって示される
構造を評価するために用いられる。
【0044】図10に示す文法規則に加えて、評価器1
04は、図9に示す構造を評価するためのアルゴリズム
となる別の規則セットを適用する。先ず、ノードG1〜
G7は評価されていないものとして標識化される。ノー
ドが既に評価され、従って指標により標識化されている
場合は、ノードは変更されない。ノードが葉ノードであ
る、すなわち、サブノードまたは「子供」を有しない場
合は、関連するターゲット言語符号の指標により標識化
される。ノードがまだ評価に成功していない場合は、そ
のサブノードまたは子供の標識に基づいて評価される。
最後に、各評価は先頭ノードまたは幹(図9ではG1)
から開始される。
【0045】アルゴリズムおよび文法を、正しい構造に
おける第1の試みを表す図9に示す構造に適用すれば、
ノードG1は評価されていないことが見い出され、子供
G2およびG5に基づいてこれを評価する試みがなされ
る。評価器105は、例えば、左側の枝を選択して、子
供G3および指標I=1の葉ノードからノードG2を評
価しようと試みる。葉ノードには指標1が与えられてい
るが、ノードG3は評価されていない。従って、評価器
はその子供からノードG3を評価しようとするが、直ち
に、ノードG4が評価されていないことが分かる。評価
器は従ってノードG4を評価しようと試みる。
【0046】図9に示すように、ノードG4は、形容詞
およびこれに続く名詞を表す指標2および3を有する葉
ノードに接続する。この形容詞はこの名詞を修飾する
(形容詞はM=3、および名詞はI=3)。評価器は図
10に示す文法規則Hを適用し、規則(d)の第2の選
択肢がノードG4にあてはまると決定する。ノードG4
は従って、名詞副句を表すものとして、名詞の指標に等
しい、すなわち3に等しい指標を有するものとして、お
よびその綴りとして指標I=2の符号の綴りおよびこれ
に続いて指標I=3の符号の綴りを有するものとして、
良好に形成されるとして標識化される。
【0047】次に、評価器105はノードG1より右側
の枝に対しても同じアルゴリズムを実行し、ノードG5
〜G7を評価する。ノードG5はまだ評価されていない
ため、評価器はこれをその子供から評価しようと試み
る。評価器は先ず、ノードG6が評価されていないと決
定し、文法規則Hに基づいてこれを評価しようと試み
る。ノードG6の子供は葉ノードであり、規則(f)に
適合する。従って、ノードG6は、指標が5で主語が9
で目的語が3で綴りが「likes」である定形動詞を表す
ものとして標識化される。
【0048】ノードG5より左側の枝を完了すると、評
価器は右側の枝を評価し、ノードG7がまだ評価されて
いないことを見い出す。ノードG7はその子供から評価
される。その子供は葉ノードであり図10に示す規則
(b)を満たす。従って、ノードG7は指標9を有する
名詞句であり、その綴りとして指標I=8の符号の綴り
とこれに続く指標I=9の符号の綴りを有するものとし
て標識化される。
【0049】これにより評価器105による最初の評価
が完了し、ノードG4、G6、およびG7の標識を図1
1に示す。ノードG4、G6、およびG7の評価は成功
したが、残りのノードは評価され得ず、従って良好に形
成されるとして標識化されなかった。図9に示す構造は
従って不正確であり、これは変換器106に知らされ
る。
【0050】変換器は再評価のために図9に示す構造を
改変するが、良好に形成されたとして既に評価された構
造は保存される。特に、ツリーの中であるノードより下
の部分は良好に形成されたノードのみからなるがそのノ
ード自体は良好に形成されていないような場合は、この
ノードより下の部分では、この部分からこれらノードが
取り去られることはないが、引き続いての工程でノード
が追加されることはある。従って、全体的に良好に形成
される「サブツリー」は再評価される必要はないが、ノ
ードが追加される場合は、追加されたノードを評価する
必要がある。この限定された再評価は、文法が「単調」
となるように所定の制約が満たされるならば可能であ
る。この文脈では、「単調」という用語は、構造が評価
および変換によりいつでも改良されるような文法を意味
する。詳しくは、「単調」な文法とは、第1に、結果の
綴りにおける2つの連結する符号の綴りの順序は決定さ
れなければならない。その結果が後に受け得る連結に依
存してはならない。第2に、良好に形成されていない第
2の構造の一部である良好に形成された構造が、別の構
造内の最も可能性の高い箇所(place)と関連付けられる
場合には、結果は、評価器によって再評価された後は良
好に評価される。ひねくれた文法を用いると、良好に形
成されたサブツリーを一部または完全に再評価する必要
が生じる場合がある。
【0051】従って、「最大ツリー断片」とは、もっと
大きな良好に形成された断片の一部ではない良好に形成
されたツリー断片(すなわち、ノードのすべてが良好に
形成されている)を包含する。
【0052】変換器106は、ツリーの他の部分と結合
し得る最大ツリー断片を選択する。図面に示した実施例
では、ノードを任意の順序で、例えば、右から左へ試験
することによって、変換器106は、指標4を有する符
号または葉ノードは指標3の符号または葉ノードを修飾
するため、前者は後者と関連付けられ得ると決定する。
従って、変換器はこのようにして構造を変更させて、図
12に示すツリーを生成する。図12では、既に評価が
成功し標識化されているノードG4、G6、およびG7
は各々の(略語)標識と共に定位置に示されている。評
価器105は次に、前と同じ文法規則Hおよび同じアル
ゴリズムを用いて図12に示すツリーを評価する。かく
して、ノードG8は良好に形成されず、ノードG9もま
た良好に形成されない。ノードG9の左側の枝は良好に
形成される葉ノードに接続し、右側の枝は良好に形成さ
れるノードG4に接続する。G9は従って規則(b)を
満たすとして評価され得る。従って、ノードG9は、指
標3を有する名詞句として良好に形成されるものとし
て、およびその綴りとして指標が1である符号の綴りお
よびこれに続いてノードG4の綴りを有するものとして
標識化される。次に、変換器106による変換中に評価
されていない場合、ノードG10が評価され得、図10
に示す規則(d)を満たす。かくしてノードG10は指
標3の名詞副句として標識化される。簡単のために、指
標2および3を有する形容詞が正しい順序で現れている
ことを確実にする規則は示しておらず、またこれについ
ても記述しない。
【0053】次にノードG8より右側の枝をノードG1
1を評価することによって評価する。子供G6およびG
7は良好に形成されているが、図10の規則(a)〜
(f)のいずれも満足しない。ノードG6は定形動詞と
して標識化され、ノードG7は名詞句として標識化され
るが、ノードG6およびG7に規則(e)が適用される
と、G6の目的語Oは指標3に等しく、ノードG7の指
標Iは9に等しい。従って、定形動詞および名詞句は結
合して動詞句を形成し得るが、ノードG7での名詞句は
その定形動詞の目的語ではなく、従ってノードG11は
規則(e)を満たさない。従って、ノードG11は依然
として良好に形成されない。
【0054】ノードG9およびG10の標識を図13に
示す。
【0055】変換器106は従って図12に示すツリー
をさらに変換する。ノードG4、G6,G7、G9、お
よびG10はすべて良好に形成されているため、変換器
106はこれらを妨害しない。しかし、ノードG11は
良好に形成されていないため、ノードG6およびその葉
ノードを有する最大ツリー断片をツリー構造内のある位
置に移動させる。すなわち、定形動詞を表すこの最大ツ
リー断片は、これが恐らく正しく結合し得る、指標3の
名詞句が存在する位置に移動する。この改変した構造を
図14に示す。
【0056】評価器105は図14に示すツリーを、G
12から開始して評価する。G12は良好に形成されて
いないため、評価器は左側の枝の子供ノード、すなわち
ノードG13を評価する。このノードは良好に形成され
ていないが、良好に形成されたノードG9およびG6に
接続する。図10に示す規則がノードG9およびG6の
標識に適用され、特に、規則(e)が満たされる、この
ときノードG9およびG6の位置が倒置され、定形動詞
(ノードG6)および名詞句(ノートG9)は、G6の
主語がG9の指標に等しいようにされる。図15に示す
ように、ノードG13は、9に等しい主語、ならびにG
6の綴りおよび続いてG9の綴りに等しい綴りを有する
動詞句として良好に形成されるとして標識化される。
【0057】ノードG12は良好に形成されたノードG
13およびG7に接続しているため、評価を行うことが
できる。ノードG13およびG7の位置が倒置されると
規則(a)は満たされる。何故なら、ノードG7は、指
標がノードG13の動詞句の主語に等しい名詞句を表す
からである。ノードG12は従って、その綴りとしてG
7の綴りおよびこれに続くG13の綴りを有する文とし
て標識化される。かくして評価は成功して完了し、図1
5に示すように、「The dog likes the quickbrown fo
x」という最終的な綴りが与えられる。
【0058】
【発明の効果】このように、本機械翻訳システムは、比
較的少ない評価工程で正しい翻訳を提供し、これによ
り、先行技術に比べて処理時間が実質的に減少する。変
換器103による変換中に文法的な関係を保持すること
によって、および変換器106の正しく評価された構造
を妨害しないことによって、ソース言語からターゲット
言語に迅速におよび正確に翻訳するための効果的かつ洗
練された方法が与えられる。変換器103によって生成
されるターゲット言語符号がX個ある最悪の場合には、
評価器105は、正しいターゲット言語の文を見い出す
かまたは試みをあきらめる前に約X4回より少ない回数
の評価を行わなければならない。先行技術では、構造を
変換して効果的に評価することはないため、ターゲット
言語の符号がX個ある最悪の場合には、正しいターゲッ
ト言語の文を見い出すかまたはあきらめるためには、X
!(階乗X)に等しい回数の評価が必要である。従っ
て、Xが通常の文を表す現実的な値の場合は、本機械翻
訳システムと従来のシステムとの間の処理時間の相違は
数桁におよび得る。例えば、10個のターゲット言語符
号を有する翻訳を見い出すのに失敗する場合は、あきら
めて失敗を認めるまでに、本システムでは約1万回以下
の評価しか必要としないのに対し、従来のシステムで
は、約350万回の評価を行う必要がある。従って、現
在可能なデータ処理速度では、本システムは実現可能で
あるのに対し、従来のシステムは実行不可能である。
【図面の簡単な説明】
【図1】本発明の好適な実施態様を構成する機械翻訳シ
ステムの概略ブロック図。
【図2】図1のシステムの動作中に生成される情報を示
す。
【図3】図1のシステムの動作中に生成される情報を示
す。
【図4】図1のシステムの動作中に生成される情報を示
す。
【図5】図1のシステムの動作中に生成される情報を示
す。
【図6】図1のシステムの動作中に生成される情報を示
す。
【図7】図1のシステムの動作中に生成される情報を示
す。
【図8】図1のシステムの動作中に生成される情報を示
す。
【図9】図1のシステムの動作中に生成される情報を示
す。
【図10】図1のシステムの動作中に生成される情報を
示す。
【図11】図1のシステムの動作中に生成される情報を
示す。
【図12】図1のシステムの動作中に生成される情報を
示す。
【図13】図1のシステムの動作中に生成される情報を
示す。
【図14】図1のシステムの動作中に生成される情報を
示す。
【図15】図1のシステムの動作中に生成される情報を
示す。
【符号の説明】
100 入力インタフェース 101 形態素アナライザ 102 構文アナライザ 103 二カ国語同義語変換器 104 結合器 105 評価器 106 変換器 107 出力インタフェース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 イアン ジョージ ジョンソン イギリス国 ハンプシャー エスオー22 6エスジー,ウィンチェスター,フェ アフィールド ロード 44 (56)参考文献 特開 平5−151256(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28 EUROPAT(QUESTEL)

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 ソース言語のテキストをターゲット言語
    のテキストに翻訳する機械翻訳システムであって、 該ソース言語のテキストを該システムに入力するための
    入力インタフェースと、 該入力テキストの文法的に完全な部分をソース言語形態
    素に解析して、各形態素毎に、その形態素を識別する識
    別子と、その形態素とは文法的に関連する他の形態素を
    識別するためのデータとによって形成される標識を有す
    るソース言語符号とするアナライザと、該ソース言語符号の識別子およびデータを、該ソース言
    語および前記ターゲット言語の同義規則に基づいて、対
    応するターゲット言語形態素の識別子およびデータを有
    するターゲット言語符号に変換する、 第1変換器と、各ターゲット言語符号を、関連する少なくとも1つの他
    のターゲット言語符号と結合させたサブ構造を有するタ
    ーゲット言語構造とする 結合器と、該サブ構造とされる各ターゲット言語符号の識別子およ
    びデータに基づいて、該ターゲット言語構造を、文法規
    則に適合したサブ構造と文法規則に適合したサブ構造の
    一部を形成しないターゲット言語符号とに識別して評価
    する 評価器と、 該評価器によって識別された文法規則に適合したサブ構
    造を形成する各ターゲット言語符号を相互に分離させる
    ことなく新たな標識を有するターゲット言語符号として
    該ターゲット言語構造を変換する第2変換器とを備え、 該評価器と該第2変換器とは該ターゲット言語構造を交
    互に評価および変換を繰り返す、機械翻訳システム。
  2. 【請求項2】 前記第2変換器は、文法規則に適合した
    第1のサブ構造または文法規則に適合したサブ構造の一
    部を形成しない第1のターゲット言語符号を、関連する
    標識を有する文法規則に適合した第2のサブ構造または
    第2のターゲット言語符号、該第1および第2のター
    ゲット言語符号または文法規則に適合したサブ構造のう
    ちの一方の識別子が該第1および第2のターゲット言語
    符号または文法規則に適合したサブ構造の他方のデータ
    内に含まれるように関連付けるようになっている、請求
    項1に記載の機械翻訳システム。
  3. 【請求項3】 前記ターゲット言語構造は、最低次のノ
    ードに前記ターゲット言語符号を有する階層的なノード
    構造を包含し、前記第2変換器は前記第1のターゲット
    言語符号または文法規則に適合したサブ構造を最高次の
    ノードの前記第2のターゲット言語符号または文法規則
    に適合したサブ構造と関連付けるようになっている、請
    求項2に記載の機械翻訳システム。
  4. 【請求項4】 前記評価器は、少なくとも1つの文法規
    則に適合したサブ構造が変更されないような前記第2変
    換器による前記ターゲット言語構造の変換の後で、該変
    更されない文法規則に適合したサブ構造を再評価しない
    ようになっている、請求項1〜3のいずれか1つに記載
    の機械翻訳システム。
  5. 【請求項5】 前記評価器は、少なくとも1つの文法規
    則に適合したサブ構造が変更されるような前記第2変換
    器による前記ターゲット言語構造の変換の後で、該変更
    されたサブ構造の変更された部分のみに関して再評価す
    るようになっている、請求項1〜4のいずれか1つに記
    載の機械翻訳システム。
  6. 【請求項6】 前記評価器は第3のターゲット言語符
    号または文法規則に適合したサブ構造が第4のターゲッ
    ト言語符号または文法規則に適合したサブ構造と関連付
    けられる文法規則に適合した第5のサブ構造の一部を形
    成するよう、前記第2変換器によって前記ターゲット
    言語構造が変換された後に文法規則に適合した該第5
    サブ構造を、該第3のターゲット言語符号および文法
    規則に適合したサブ構造と第4のターゲット言語符号お
    よび文法規則に適合したサブ構造との関連についての
    構造が評価および変換によっていつでも改良される
    単調文法に従って再評価するようになっている、請求項
    5に記載の機械翻訳システム。
  7. 【請求項7】 前記アナライザは、前記入力テキストの
    ソース言語構造を前記結合器に供給するように配置さ
    れ、該結合器は前記ソース言語構造に類似させて前記タ
    ーゲット言語構造を形成するようになっている請求項
    に記載の機械翻訳システム。
JP30910795A 1994-11-28 1995-11-28 機械翻訳システム Expired - Fee Related JP3385141B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9423995A GB2295470A (en) 1994-11-28 1994-11-28 Machine translation system
GB9423995.1 1994-11-28

Publications (2)

Publication Number Publication Date
JPH08263497A JPH08263497A (ja) 1996-10-11
JP3385141B2 true JP3385141B2 (ja) 2003-03-10

Family

ID=10765092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30910795A Expired - Fee Related JP3385141B2 (ja) 1994-11-28 1995-11-28 機械翻訳システム

Country Status (5)

Country Link
US (1) US5848385A (ja)
EP (1) EP0715265B1 (ja)
JP (1) JP3385141B2 (ja)
DE (1) DE69527026T2 (ja)
GB (1) GB2295470A (ja)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6279018B1 (en) * 1998-12-21 2001-08-21 Kudrollis Software Inventions Pvt. Ltd. Abbreviating and compacting text to cope with display space constraint in computer software
AU2001261505A1 (en) 2000-05-11 2001-11-20 University Of Southern California Machine translation techniques
US7295962B2 (en) * 2001-05-11 2007-11-13 University Of Southern California Statistical memory-based translation system
WO2002097663A1 (en) * 2001-05-31 2002-12-05 University Of Southern California Integer programming decoder for machine translation
WO2003005166A2 (en) 2001-07-03 2003-01-16 University Of Southern California A syntax-based statistical translation model
WO2004001623A2 (en) 2002-03-26 2003-12-31 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7711545B2 (en) * 2003-07-02 2010-05-04 Language Weaver, Inc. Empirical methods for splitting compound words with application to machine translation
WO2005089340A2 (en) * 2004-03-15 2005-09-29 University Of Southern California Training tree transducers
US8296127B2 (en) * 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US7593843B2 (en) * 2004-03-30 2009-09-22 Microsoft Corporation Statistical language model for logical form using transfer mappings
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
DE112005002534T5 (de) 2004-10-12 2007-11-08 University Of Southern California, Los Angeles Training für eine Text-Text-Anwendung, die eine Zeichenketten-Baum-Umwandlung zum Training und Decodieren verwendet
KR101130457B1 (ko) * 2004-11-04 2012-03-28 마이크로소프트 코포레이션 트리렛 번역쌍 추출
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US7974833B2 (en) 2005-06-21 2011-07-05 Language Weaver, Inc. Weighted system of expressing language information using a compact notation
US7389222B1 (en) 2005-08-02 2008-06-17 Language Weaver, Inc. Task parallelization in a text-to-text system
US7813918B2 (en) * 2005-08-03 2010-10-12 Language Weaver, Inc. Identifying documents which form translated pairs, within a document collection
US7624020B2 (en) * 2005-09-09 2009-11-24 Language Weaver, Inc. Adapter for allowing both online and offline training of a text to text system
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US8548795B2 (en) 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US8195447B2 (en) * 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
KR100912501B1 (ko) * 2007-08-09 2009-08-17 한국전자통신연구원 번역 지식 구축 방법 및 장치
DE102008003572A1 (de) 2008-01-09 2009-10-01 Grunert, Florian Silver Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie
DE102008003886A1 (de) 2008-01-10 2009-07-16 Grunert, Florian Silver Verfahren zur Übertragung eines Textes einer beliebigen Ausgangssprache in einen Text einer beliebigen Zielsprache basierend auf dem Prinzip der von mir entwickelten Farbontologie
US8849665B2 (en) * 2008-01-30 2014-09-30 At&T Intellectual Property I, L.P. System and method of providing machine translation from a source language to a target language
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US9189475B2 (en) * 2009-06-22 2015-11-17 Ca, Inc. Indexing mechanism (nth phrasal index) for advanced leveraging for translation
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
JP6070809B1 (ja) * 2015-12-03 2017-02-01 国立大学法人静岡大学 自然言語処理装置及び自然言語処理方法
JP6805927B2 (ja) * 2017-03-28 2020-12-23 富士通株式会社 インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58201175A (ja) * 1982-05-20 1983-11-22 Kokusai Denshin Denwa Co Ltd <Kdd> 機械翻訳方式
US5416696A (en) * 1989-12-27 1995-05-16 Kabushiki Kaisha Toshiba Method and apparatus for translating words in an artificial neural network
US5369574A (en) * 1990-08-01 1994-11-29 Canon Kabushiki Kaisha Sentence generating system
GB9209346D0 (en) * 1992-04-30 1992-06-17 Sharp Kk Machine translation system
JP2892548B2 (ja) * 1992-05-25 1999-05-17 シャープ株式会社 自動翻訳装置

Also Published As

Publication number Publication date
EP0715265B1 (en) 2002-06-12
GB2295470A (en) 1996-05-29
US5848385A (en) 1998-12-08
EP0715265A2 (en) 1996-06-05
JPH08263497A (ja) 1996-10-11
GB9423995D0 (en) 1995-01-11
EP0715265A3 (en) 1997-07-02
DE69527026D1 (de) 2002-07-18
DE69527026T2 (de) 2002-12-05

Similar Documents

Publication Publication Date Title
JP3385141B2 (ja) 機械翻訳システム
US5895446A (en) Pattern-based translation method and system
JP5452868B2 (ja) トレーニングおよび復号のためにストリングからツリーへの変換を使うテキスト‐テキスト・アプリケーションのためのトレーニング
JP3971373B2 (ja) ルールベース方式と翻訳パターン方式とを混合したハイブリッド自動翻訳装置
JP3189186B2 (ja) パターンに基づく翻訳装置
US7707026B2 (en) Multilingual translation memory, translation method, and translation program
JPS62163173A (ja) 機械翻訳方法
US20050137853A1 (en) Machine translation
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JP2003030185A (ja) 2カ国語コーパスからの変換マッピングの自動抽出
JP2003050797A (ja) スケーラブル機械翻訳システム
JPH02308370A (ja) 機械翻訳システム
CN103020045B (zh) 一种基于谓词论元结构的统计机器翻译方法
JPS638864A (ja) 翻訳装置
Lavie et al. Experiments with a Hindi-to-English transfer-based MT system under a miserly data scenario
EP0316743B1 (en) Method for removing enclitic endings from verbs in romance languages
JP3236027B2 (ja) 機械翻訳装置
JP3892227B2 (ja) 機械翻訳システム
Arnoult Adjunction in hierarchical phrase-based translation
Bernth et al. LMT at Tivoli Gardens
Hupkes An Empirical Account of Compositionality of Translation through Translation Data
JPS6244876A (ja) 機械翻訳装置
JP2004086919A (ja) 機械翻訳システム
JPH0550778B2 (ja)
JPH0546370A (ja) プログラム生成装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021217

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071227

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081227

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091227

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees