JP3326646B2 - 機械翻訳システム用辞書・ルール学習装置 - Google Patents

機械翻訳システム用辞書・ルール学習装置

Info

Publication number
JP3326646B2
JP3326646B2 JP03447794A JP3447794A JP3326646B2 JP 3326646 B2 JP3326646 B2 JP 3326646B2 JP 03447794 A JP03447794 A JP 03447794A JP 3447794 A JP3447794 A JP 3447794A JP 3326646 B2 JP3326646 B2 JP 3326646B2
Authority
JP
Japan
Prior art keywords
translation
ideal
machine translation
sentence
natural language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03447794A
Other languages
English (en)
Other versions
JPH07244665A (ja
Inventor
浩巳 中岩
節夫 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03447794A priority Critical patent/JP3326646B2/ja
Publication of JPH07244665A publication Critical patent/JPH07244665A/ja
Application granted granted Critical
Publication of JP3326646B2 publication Critical patent/JP3326646B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳システム用辞
書・ルール学習装置に係り、特に、機械翻訳システムで
用いる辞書やルールを自動的に学習するための機械翻訳
システム用辞書・ルール学習装置に関する。
【0002】
【従来の技術】従来は、機械翻訳システムの辞書やルー
ルを構築する場合、人間が翻訳等に利用する辞書等を参
考にして機械翻訳システム用の辞書やルールを人手で構
築している。また、このようにして、構築された機械翻
訳システム用の辞書やルールや機械翻訳システムの翻訳
結果を基に、不適切な訳が生成されている場合には、そ
の訳を生成した原因となる辞書やルールを、機械翻訳シ
ステムの内部処理を良く理解したエキスパートが人手で
変更追加している。
【0003】この辞書やルールの追加修正作業を自動化
する手法としては、対訳関係にある原言語の文と目的言
語の文の対の集合(対訳コーパス)を用いて、原言語の
表現とそれに相当する目的言語の表現の対を抽出し、そ
の対を用いて辞書やルールを変更追加する改良方法(例
えば、「機械翻訳方式及びシステム(特開平2−903
64)」や対訳コーパスを用いて、原言語を機械翻訳シ
ステムで翻訳した目的言語の機械訳文と理想訳文を比較
し、両者が異なる場合には、機械訳文を機械翻訳システ
ムが生成する過程で利用したルールの1つである生成方
法を調査し、誤っている生成文法を変更追加する改良方
法(たとえば「生成文法自動生成装置(特開昭63−4
4276)」が知られている。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の機械翻訳システムの辞書やルールの構築方法では、
人間用に作成された辞書等を利用するため、機械翻訳用
に用いた場合、正しい訳が生成される保証がないという
問題がある。
【0005】また、機械翻訳システムの辞書やルールを
変更追加する方法では、翻訳結果を翻訳システムの内部
処理を良く理解したエキスパートにより検証する必要が
あり、エキスパートでないと辞書やルールの変更追加が
不可能であるという問題がある。また、このような作業
は人手によるので、辞書やルールの構築のための時間的
経済的コストが高くなってしまうという問題がある。
【0006】また、上記従来の技術の前者の改良方法の
場合、対訳コーパスの情報のみから機械翻訳システムの
翻訳結果を考慮せずに、辞書やルールが変更追加される
ため、既存の辞書やルールに対して対訳コーパスにより
不適切な変更追加がなされ、機械翻訳結果に悪影響を及
ぼすという問題がある。
【0007】後者の改良方法の場合、機械翻訳システム
の翻訳結果を考慮して変更追加すべきルールを抽出する
ので、前者の改良方法の「機械翻訳方式及びシステム」
のような機械翻訳結果への悪影響は少ないが、対訳コー
パス中に原言語の文が同一であるが、理想訳文が異なる
ものがある場合、同一の原言語表現に対しても異なる目
的言語表現を生成するための辞書やルールが変更追加さ
れるので、辞書やルールの整合が取れないという問題が
ある。例えば、原言語が日本語、目的言語が英語である
場合を考えると、日本語文 『記憶装置を有すること』 という文に対して、対訳コーパスには、 "Strage units is to be provided." と "To be equipped with the strage units." の2種類の理想訳文が付与されていたとする。この場
合、1つの日本語表現「記憶装置」に対して"strage un
its"という目的言語表現と"the strage units"という目
的言語表現を生成するための2種類の辞書やルールが生
成され、また、1つの日本語表現「〜を有すること」に
対して " 〜is to be provided." という目的言語表現と "To be equipped with 〜" という目的言語表現を生成するための2種類の辞書やル
ールが生成され、既存の辞書やルールに変更追加される
という問題がある。
【0008】本発明は、上記の点に鑑みてなされたもの
で、上記従来の問題点を解決し、対訳コーパスの情報だ
けでなく、機械翻訳システムにより出力された機械訳文
も参照して、対訳コーパス中に原言語の文が同一である
が理想訳文が異なるものがある場合に、機械訳文との違
いが最も少ない機械翻訳システムが生成できる可能性の
最も高い理想訳文を参考にして、変更追加すべき辞書
や、ルールを抽出することによって、既存の辞書やルー
ルに不適切な変更追加をすることなく、最も実現性が高
く効果的な方法で、自動的に辞書やルールを変更追加す
ることが可能な機械翻訳システム用辞書・ルール学習装
を提供することを目的とする。
【0009】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図(その1)である。本発明の機械翻訳
システム用辞書・ルール学習方法は、第1の自然言語の
文を第2の自然言語の文に変換する手段を有する機械翻
訳システムにおいて、互いに対訳関係にある第1の自然
言語の入力文と第2の自然言語の理想訳文を読み込み
(ステップ1)、機械翻訳システムを用いて第1の自然
言語の入力文を第2の自然言語の機械訳文に翻訳し(ス
テップ2)、第2の自然言語の機械訳文と第2の自然言
語の理想訳文とを比較し(ステップ3)、ステップ3で
得られた比較結果により、入力文1種類に対して複数の
種類の理想訳文が付与されている場合には(ステップ
4)、差分が最も少ない理想訳文(差分最小理想訳文)
を抽出し(ステップ5)、理想訳と機械訳文を比較した
比較結果及び差分最小理想訳文を基に辞書やルールを変
更追加する(ステップ6)。
【0010】図2は、本発明の原理を説明するための図
(その2)である。本発明の機械翻訳システム用辞書・
ルール学習方法は、第1の自然言語の文を第2の自然言
語の文に変換する手段を有する機械翻訳システムにおい
て、互いに対訳関係にある第1の自然言語の入力文と第
2の自然言語の理想訳文の集まりである対訳文章を読み
込み(ステップ11)、対訳文章中から同一の入力文と
当該入力文に対応する対訳文章を抽出し(ステップ1
2)、機械翻訳システムを用いて入力文を第2の自然言
語の機械訳文に翻訳し(ステップ13)、その機械翻訳
文と、理想訳文を比較し(ステップ14)、その比較結
果によって、同一入力文抽出により抽出された入力文1
種類に対して複数種類の理想訳文が付与されている対訳
文章に対して(ステップ15)、差分が最も少ない理想
訳文を抽出し(ステップ16)、ステップ14で得られ
た比較結果及びステップ16で得られた差分が最も少な
い理想訳文に基づいて、辞書やルールを変更追加する
(ステップ17)。
【0011】図3は、本発明の原理を説明するための図
(その3)である。本発明の機械翻訳システム用辞書・
ルール学習方法は、第1の自然言語の文を第2の自然言
語の文に変換する手段を有する機械翻訳システムにおい
て、互いに対訳関係にある第1の自然言語の入力文と第
2の自然言語の理想訳文を読み込み(ステップ21)、
機械翻訳システムを用いて入力文を第2の自然言語の機
械訳文に翻訳する際に(ステップ22)、第2の自然言
語の機械訳概念構造を生成し(ステップ23)、理想訳
文から第2の自然言語の理想訳概念構造を生成し(ステ
ップ24)、機械訳概念構造と理想訳概念構造を比較し
(ステップ25)、これにより得られた比較結果によっ
て、入力文1種類に対して複数種類の理想訳概念構造が
付与されている場合には(ステップ26)、差分が最も
少ない理想訳概念構造を抽出し(ステップ27)、比較
結果及び差分最小理想訳概念構造抽出処理で得られた差
分抽出結果に基づいて、辞書やルールを変更追加する
(ステップ28)。
【0012】図4は、本発明の原理を説明するための図
(その4)である。本発明の機械翻訳システム用辞書・
ルール学習方法は、第1の自然言語の文を第2の自然言
語の文に変換する手段を有する機械翻訳システムにおい
て、互いに対訳関係にある第1の自然言語の入力文と第
2の自然言語の理想訳文の集まりである対訳文章を読み
込み(ステップ31)、対訳文章中から同一の入力文と
入力文に対応する理想訳の集まりを抽出し(ステップ3
2)、機械訳翻訳システムを用いて入力文を第2の自然
言語の機械訳文に翻訳する際に(ステップ33)、第2
の自然言語の機械訳概念構造を生成し(ステップ3
4)、理想訳文を解析して第2の自然言語の理想文概念
構造を生成し(ステップ35)、機械訳概念構造と理想
訳概念構造を比較し(ステップ36)、その比較結果に
よって、ステップ32で抽出された入力文1種類に対し
て複数種類の理想訳概念構造が付与されている対訳文章
に対して(ステップ37)、差分が最も少ない理想訳概
念構造を抽出し(ステップ38)、機械訳理想訳概念構
造比較処理で得られた比較結果及び差分最小理想訳概念
構造を基に、辞書やルールを変更追加する(ステップ3
9)。
【0013】さらに、本発明の機械翻訳システム用辞書
・ルール学習装置は、第1の自然言語の文を第2の自然
言語の文に変換する翻訳手段を有する機械翻訳システム
2において、互いに対訳関係にある第1の自然言語の入
力文と第2の自然言語の理想訳文を読み込む対訳文読み
込み手段1と、機械翻訳システムを用いて第1の自然言
語の入力文を翻訳した第2の自然言語の機械訳文と第2
の自然言語の理想訳文を比較する機械訳理想訳比較手段
5と、機械訳理想訳比較手段5で得られた比較結果によ
り、入力文1種類に対して複数の種類の理想訳文が付与
されている場合には、差分が最も少ない理想訳文を抽出
する差分最小理想訳抽出手段6と、機械訳理想訳比較手
段5で得られた比較結果及び差分最小理想訳抽出手段6
で得られた差分が最も少ない理想訳文を基に辞書やルー
ルを変更追加する辞書ルール変更追加手段7とを含む。
【0014】本発明の機械翻訳システム用辞書・ルール
学習装置は、第1の自然言語の文を第2の自然言語の文
に変換する翻訳手段を有する機械翻訳システム2におい
て、互いに対訳関係にある第1の自然言語の入力文と第
2の自然言語の理想訳文の集まりである対訳文章を読み
込む対訳文章読み込み手段10と、対訳文章中から、同
一の入力文と対応する対訳文章を抽出する同一入力文抽
出手段11と、機械翻訳システム2を用いて入力文を第
2の自然言語の文に翻訳した機械翻訳文と、理想訳文を
比較する機械訳理想訳比較手段5と、機械訳理想訳比較
手段5で得られた比較結果によって、同一入力文抽出手
段11で抽出された入力文1種類に対して複数種類の理
想訳文が付与されている対訳文章に対して、差分が最も
少ない理想訳文を抽出する差分最小理想訳抽出手段6
と、機械訳理想訳比較手段5で得られた比較結果及び差
分最小理想訳抽出手段6で得られた差分が最も少ない理
想訳文を基に、辞書やルールを変更追加する辞書ルール
変更追加手段7とを含む。
【0015】また、本発明の機械翻訳システム辞書・ル
ール学習装置は、第1の自然言語の文を第2の自然言語
の文に変換する翻訳手段を有する機械翻訳システム2に
おいて、互いに対訳関係にある第1の自然言語の入力文
と第2の自然言語の理想訳文を読み込む対訳文読み込み
手段10と、機械翻訳システムを用いて入力文を第2の
自然言語の機械訳文に翻訳する際に第2の自然言語の機
械訳概念構造を生成する機械訳概念構造生成手段と、理
想訳文から第2の自然言語の理想訳概念構造を生成する
理想訳概念構造生成手段と、機械訳概念構造と理想訳概
念構造を比較する機械訳理想訳概念構造比較手段5と、
機械訳理想訳概念構造比較手段5で得られた比較結果に
よって、入力文1種類に対して複数種類の理想訳概念構
造が付与されている場合には、差分が最も少ない理想訳
概念構造を抽出する差分最小理想訳概念構造抽出手段6
と、機械訳理想訳概念構造比較手段5で得られた比較結
果及び差分最小理想訳概念構造抽出手段6で得られた差
分抽出結果に基づいて辞書やルールを変更追加する辞書
ルール変更追加手段7とを含む。
【0016】また、本発明の機械翻訳システム用辞書・
ルール学習装置は、第1の自然言語の文を第2の自然言
語の文に変換する翻訳手段を有する機械翻訳システム2
において、互いに対訳関係にある第1の自然言語の入力
文と第2の自然言語の理想訳文の集まりである対訳文章
を読み込む対訳文章読み込み手段10と、対訳文章中か
ら同一の入力文と入力文に対応する理想訳文の集まりを
抽出する同一入力文抽出手段11と、機械訳翻訳システ
ムを用いて入力文を第2の自然言語の機械訳文に翻訳す
る際に第2の自然言語の機械訳概念構造を生成する機械
訳概念構造生成手段と、理想訳文から第2の自然言語の
理想訳概念構造を生成する理想訳概念構造生成手段と、
機械訳概念構造と理想訳概念構造を比較する機械訳理想
訳概念構造比較手段5と、機械訳理想訳概念構造比較手
段5で得られた比較結果によって、同一入力文抽出手段
11で抽出された入力文1種類に対して複数種類の理想
訳概念構造が付与されている対訳文章に対して、差分が
最も少ない理想訳概念構造を抽出する差分最小理想訳概
念構造抽出手段6と、機械訳理想訳概念構造比較手段5
で得られた比較結果及び差分最小理想訳概念構造抽出手
段6で得られた差分抽出結果を基に、辞書やルールを変
更追加する辞書ルール変更追加手段7とを含む。
【0017】
【作用】本発明は、第1の自然言語の文を辞書やルール
を用いて第2の自然言語の文に変換する手段を有する機
械翻訳システムにおいて、入力文の翻訳結果(機械訳
文)と、事前に準備された入力文の理想訳文を比較する
ことにより、辞書やルールを変更追加する際に、同一の
入力文に対して複数種類の理想訳文が付与されている場
合には、機械訳文との違いが最も少ない理想訳文を用い
るものである。
【0018】詳細には、本発明は、対訳文章を読み込
み、互いに対訳関係にある第1の自然言語の入力文と第
2の自然言語の理想訳文を読み込み、これ以降の処理に
より機械翻訳システム用辞書・ルールが自動的に変更追
加される。
【0019】まず、理想訳文と機械訳文を比較する処理
は、対訳文読み込みにより読み込まれた第1の自然言語
の入力文を機械翻訳システムを用いて第2の自然言語の
機械訳文に翻訳し、機械訳文と理想訳文を例えば、機械
翻訳システム用辞書を用いて機械訳文中の語と理想訳文
中の語との対応関係を取ることにより比較する。
【0020】次に、この比較により入力文1文に対して
複数種類の理想文が付与されている場合には、例えば、
理想訳文と機械訳文で異なる単語の数を調査し、最も異
なる単語数の少ない理想訳文を抽出する等によって差分
が最も少ない理想訳文(差分最小理想訳文)を抽出す
る。辞書ルールを変更する場合には、理想訳文と機械訳
文とを比較した結果及び差分最小理想訳文に基づいて、
辞書やルールを変更追加する。これにより、入力文1文
に対して、複数種類の理想訳文が付与されている場合で
も、最も機械訳文に近い理想訳文を利用して、辞書やル
ールを変更追加する。
【0021】また、本発明は、対訳関係にある第1の自
然言語の入力文と第2の自然言語の理想訳文の集まり対
訳文章を読み込む。同一入力文を抽出する処理は、同一
の入力文とその理想訳文の集まりを抽出し、理想訳文と
機械訳文を比較し、機械訳文との差分が最小の理想訳文
を抽出し、入力文1種類に対して複数種類の理想訳文が
付与されている場合でも最も機械訳文に近い理想訳文を
利用して辞書やルールを変更追加する。
【0022】また、本発明は、機械訳概念構造と理想訳
概念構造を生成し、この2つの概念構造を比較し、入力
文1種類に対して複数種類の理想訳概念構造が付与され
ている場合には、差分が最も少ない理想訳概念構造を抽
出し、その差分最小理想訳概念構造に基づいて辞書やル
ールを変更追加する。これにより、入力文1種類に対し
て複数種類の理想訳文が付与されている場合でも、最も
機械訳概念構造に近い理想概念構造を利用して辞書やル
ールを変更追加する。
【0023】また、本発明は、抽出された同一入力文1
種類に対して複数種類の理想訳文が付与されている場合
に、機械訳概念構造に近い理想訳概念構造を比較して、
差分が最も少ない理想訳概念構造の理想訳文を選択して
辞書やルールを変更追加する。
【0024】
【実施例】以下、本発明の実施例を図面と共に詳細に説
明する。本実施例では、第1自然言語が日本語、第2の
自然言語が英語であるとする。
【0025】[第1の実施例]図5は、本発明の第1の
実施例の機械翻訳用辞書・ルール自動学習システムの基
本ブロック構成を示す。同図に示すシステムは、対訳関
係にある第1自然言語の文(入力文)と第2自然言語の
文(理想訳文)を入力するための対訳文読み込み部1、
入力された第1自然言語の文をルール3や辞書4を用い
て第2自然言語の文(機械訳文)に翻訳する機械翻訳シ
ステム2、機械翻訳システム2によって得られた機械訳
文と対訳文読み込み部1によって得られた第2自然言語
の理想訳文を比較する理想訳機械訳比較部5、理想訳機
械訳比較部5によって得られた比較結果に基づいて、複
数の理想訳文が第1自然言語の入力文に対して付与され
ている対訳文に対して差分が最も少ない理想訳文を抽出
する差分最小理想訳抽出部6、及び理想訳機械訳比較部
5によって得られた比較結果及び差分最小理想訳抽出部
6によって得られた差分の最も少ない理想訳文に基づい
て機械翻訳システム2で用いるルール3や辞書4を追加
修正する辞書ルール変更追加部7より構成される。
【0026】図6は、本発明の第1の実施例の追加修正
される辞書やルールを用いた機械翻訳システムの基本ブ
ロック構成図である。同図に示すシステムは、第1自然
言語入力部8、ルール3、機械翻訳システム2、辞書4
及び第2自然言語出力部9より構成される。
【0027】機械翻訳システム2は、第1自然言語文を
第1自然言語の概念構造に変換する第1言語解析部2
1、第1言語解析部21で生成された第1自然言語の概
念構造を第2自然言語の概念構造に変換する言語変換部
22、言語変換部22で生成された第2自然言語の概念
構造を基に第2自然言語文を生成する第2言語生成部2
3より構成される。
【0028】ルール3は、第1言語解析部21で用いる
第1言語解析ルール31、言語変換部22で用いる言語
変換ルール32、第2言語生成部23で用いる第2言語
生成ルール33より構成される。
【0029】辞書4は、第1言語解析部21で用いられ
る第1言語解析辞書41、言語変換部22で用いる言語
変換辞書42、第2言語生成部23で用いる第2言語生
成辞書43から構成される。
【0030】図7は、言語変換辞書の辞書エントリ例を
示す図である。言語変換辞書42は、名詞部には、第1
自然言語である日本語の各名詞に対応する第2自然言語
である英語がそれぞれ記入され、1つの名詞に対し、複
数の訳語がある場合は使うべき訳語の優先順位を示す優
先度や、その訳語の使われ方を示す名詞句からなる選択
条件が記入されている。例えば、名詞「記憶装置」に対
しては、"memory", "strage device" の訳語がこの順番
の優先順位で付与されている。また、動詞部には、日本
語の各動詞だけではなく、動詞の助詞がパターンとして
付けられており、例えば、動詞「有すること」について
は“「O」(目的語、名詞)「を」8(助詞)”と助詞
パターンが、動詞「走る」については、“「S」(主
語、名詞)「が」(助詞)「O」(目的語、名詞)
「を」(助詞)”と助詞パターンが記入されており、動
詞をその助詞を含めてキーとして動詞の訳語を検索する
ように記入されている。さらに動詞の格要素の意味を示
す選択条件が記入されている。例えば、動詞「有するこ
と」については、その助詞パターン(Oを)に示されて
いる格要素の意味に関して制約はないことを示してい
る。また、動詞「走る」については、その助詞パターン
(SがOを)に示されている格要素の意味に対して、
“S”が人が動物の意味を持ち、“O”が場所の意味を
持つ場合は、 “S run on O” という表現で訳し、“S”が「船」の意味を持ち、
“O”が「場所」の意味を持つ場合は、 “S sail on O” という表現で訳すことを示している。
【0031】次に、図5の基本ブロック構成の機械翻訳
用辞書・ルール自動学習システムの処理手順について説
明する。ここでは、図8に示す対訳文を例にとって、実
際の処理手順を説明する。
【0032】(1)まず、対訳文読み込み部1は、対訳
関係にある第1自然言語の入力文と第2自然言語の理想
訳文の対(対訳文)を入力する。この対訳文は、機械翻
訳用辞書・ルールの自動学習のために用いるものであ
る。この辞書・ルールの学習用の対訳文の集合(対訳文
章)を選択することにより、学習させた対訳文書と類似
の言語表現が頻出する同様の分野の文章向きに、機械翻
訳システムをチューンすることが可能となる。図8の例
では、第1自然言語である日本語の文(入力日本文) 「記憶装置を有すること」 に対して、対訳関係にある第2自然言語である英語の理
想英訳文として、 "Strage device is to be provided." と、 "To be equipped with the strage device." の2種類が付与されており、これらが対訳文として入力
される。人間による翻訳では、複数種類の表現で翻訳可
能な場合、実際にこの翻訳結果を利用する人に複数種類
の翻訳結果を提示し、その人が最適と思う訳を選択させ
るということがある。また、1種類の文章を複数人の翻
訳者が翻訳した場合に、翻訳者の癖等により翻訳結果が
異なる場合がある。従って、図8に示す例のように、1
種類の第1自然言語の入力文に対して複数種類の第2自
然言語の文が付与されるということは頻繁に行われるた
め、このような現象を考慮することが必須となる。
【0033】(2)入力された対訳文のうち、第1自然
言語の文である入力日本文は、ルール3や辞書4を用い
た機械翻訳システム2によって第2自然言語文である機
械英訳文に翻訳される。この機械翻訳システム2による
翻訳の処理手順は、図6の基本ブロック構成の機械翻訳
システム3を用いて説明する。
【0034】2−1)まず、第1自然言語の文である入
力日本文は、第1言語解析ルール31や第1言語解析辞
書41を用いた第1言語解析部21によって解析され、
日本語の概念構造を生成する。例えば、図8の入力され
た日本文に対しては、図9に示すような概念構造が生成
される。この概念構造は、動詞「有すること」を名詞
「記憶装置」が修飾しており、両者の修飾関係は、助詞
「を」による関係であることを示している。この概念構
造は、個々の単語の性質や品詞等を記述した第1言語解
析辞書41や、語と語の修飾関係等を記述した第1言語
解析ルール31を用いることによって得られる。
【0035】2−2)次に、この日本語の概念構造は、
言語変換ルール32や言語変換辞書42を用いた言語変
換部22によって変換され、英語の概念構造(機械訳)
を生成する。例えば、図9の日本語の概念構造に対して
は図10のような英語の概念構造が生成される。この英
語の概念構造は、動詞"be"を名詞"memory"がSubjの関係
で、動詞"be provided" がTo-ph の関係で修飾している
ことを示す。ここで、Subjの関係とは、名詞が動詞の主
語として機能していることを示し、To-ph の関係とは、
動詞が動詞をTo不定詞句を介して修飾していることを示
す。
【0036】この概念構造は、図7に示すような名詞や
動詞等の語の対訳関係等を記述した言語変換辞書42や
日本語の語と語の関係を、英語の語と語の関係に変換す
る情報や訳語選択のためのルール等を記述した言語変換
ルール32を用いることによって得られる。
【0037】2−3)次に、この英語の概念構造は、第
2言語生成ルール33や第2言語生成辞書43によっ
て、機械英訳文を生成する。例えば、図10の英語の概
念構造に対しては、図8の機械英訳文 "Memory is to be provided." が生成される。この機械英訳文は、時制や数、人称によ
る語の変化の情報等を記述した第2言語生成辞書43や
訳語の語順を決定するルール等を記述した第2言語生成
ルール33を用いることによって得られる。なお、この
機械翻訳システムの各段階で参照・生成される概念構造
や辞書情報は、以降の辞書・ルール自動学習処理で参照
可能となるように情報を保存しておく。
【0038】例えば、図8に示すような、機械翻訳処理
で認定される機械訳文の単語の単位の情報や、図7に示
すような言語変換辞書42を検索する際に得られる個々
の単語の他訳語候補の情報も保存しておく。
【0039】2−4)上記のようにして得られた機械訳
文は、理想訳文と理想訳機械訳比較部5によって比較さ
れ、その比較結果が得られる。
【0040】図11は、本発明の第1の実施例の理想訳
機械訳比較処理のフローチャートである。以下のフロー
チャートは理想訳機械訳比較部5の動作である。
【0041】ステップ501)機械訳文が機械翻訳時に
設定した単語単位別に分割される。例えば、図8の機械
英訳文の場合、機械翻訳処理の過程で保存された情報を
基に、Memory" と"is to be provided" に分割される。
【0042】ステップ502)理想訳文を1文ずつ取り
出す。図8に示す理想英訳文では、まず、 "Strage device is to be provided." が、次に、 "To be equipped with the strage device." が取り出される。
【0043】ステップ503)ステップ501で分割さ
れた機械訳文の個々の単語を取り出す。図8の機械英訳
文の場合、まず"memory"が、次に"is to be provided"
が取り出される。
【0044】ステップ504)ステップ503で取り出
された機械訳単語について、機械翻訳時に利用した言語
変換辞書の辞書エントリを検索して、他の訳語候補を探
す。図8において、機械訳英単語の場合は、"memory"に
対しては"strage device" の他の訳語候補が取り出さ
れ、"is to be provided" に対しては、他の訳語候補が
存在しないので、取りだされない。
【0045】ステップ505)ステップ503で取り出
された機械訳単語がステップ502で取り出された理想
訳文中に存在するか検索する。
【0046】ステップ506)理想訳文中に機械訳単語
が存在するか否を判断し、存在する場合には、ステップ
512で理想訳文の単語、他の訳語候補、一致した理想
訳文中の単語を組で保持する。存在しない場合には、ス
テップ507に移行する。
【0047】ステップ507)他の訳語候補の個々の単
語を取り出す。図8の機械訳英単語の場合は、"memory"
に対しては、"strage device" が取り出される。ま
た、"isto be provided" に対しては他の訳語候補が存
在しないので、取り出されずステップ511に移行す
る。
【0048】ステップ508)ステップ507で取り出
された他の訳語候補がステップ502で取り出された理
想訳文中に存在するか検索する。
【0049】ステップ509)次に、理想訳文中に他の
訳語候補と一致する単語が存在するか否かを判断し、存
在する場合には、ステップ512に移行する。存在しな
い場合には、ステップ510に移行する。
【0050】ステップ510)全ての他の訳語候補につ
いて理想訳文中の単語を調査したかを判断し、調査した
場合には、機械訳単語及びその単語に対する全ての他の
訳語候補がステップ502で取り出された理想訳文中に
存在しないことを示すので、ステップ511に移行す
る。また、全ての他の訳語候補について調査が終了して
いない場合には、ステップ507の処理に移行し、他の
訳語候補全てに上記処理が繰り返される。
【0051】ステップ511)理想訳文の単語と他の訳
語候補のみが対で保持され、ステップ513に移行す
る。
【0052】ステップ512)機械訳文の単語、他の訳
語候補、一致した理想訳文中の単語を組で保持する。
【0053】ステップ513)全ての機械訳単語につい
て理想訳文中の単語を調査したかを判断し、調査した場
合には、ステップ514に移行する。また、調査が終了
していない場合には、ステップ502に戻る。
【0054】ステップ514)全ての理想訳文について
調査したかを判断し、調査終了していない場合には、ス
テップ502に戻り、理想訳文全てについて調査が終了
するまで上記処理が繰り返される。また、全て調査した
場合には終了し、上記の処理で得られた機械訳文と個々
の理想訳文毎の単語の対応を示すデータが理想訳機械訳
比較部5の比較結果として得られる。
【0055】図8の例の場合には、理想訳機械訳比較部
5の比較結果は図12に示すようになる。図12(A)
は、理想英訳文Aの "Strage device is to be provided" に関しては、機械訳英単語"Memory"及びその他訳語候補
について他訳語候補"strage device" が、機械訳英単
語" 〜is to be provided"及びその他訳語候補につい
て、機械訳英単語" 〜 is to be provided" が一致して
いるという結果を示している。
【0056】また、図12(B)は、理想英訳文 "To be equipped with the strage device." に関しては、機械訳英単語"Memory"及びその他訳語候補
について他訳語候補"strage device" が一致し、機械訳
英単語" 〜 is to be provided" 及びその他訳語候補に
ついて、「一致単語なし」という結果を示している。
【0057】図8の比較結果では、機械翻訳時に得られ
た各種辞書情報が付与されている。これは、辞書ルール
変更追加処理を行う際に活用する。
【0058】更に、図11のフローチャートで示した理
想訳機械訳比較部5の処理は、言語変換辞書42の辞書
情報を用いて理想訳文と機械訳文の比較を行っている
が、他の辞書やルールを用いて比較する形態も考えられ
る。
【0059】また、理想訳機械訳比較部5は、理想訳文
と機械訳文を比較する際に、第2の自然言語の解析装置
を用いて理想訳文から第2自然言語の理想訳概念構造を
生成し、機械翻訳の際に生成された機械訳の第2自然言
語の機械訳概念構造と比較することにより、理想訳文と
機械訳文の比較結果を得る形態も考えられる。なお、理
想訳概念構造及び機械訳概念構造を生成する手段は、理
想訳機械比較部5内に設けてもよいし、または理想訳機
械比較部5の前段に設けてもよい。
【0060】上記のようにして得れた比較結果から差分
最小理想訳抽出部6によって差分が最小の理想訳文と機
械訳文の比較結果が抽出される。図13は、本発明の第
1の実施例の差分最小理想訳抽出部の動作のフローチャ
ートである。
【0061】ステップ601)理想訳文が複数あるか判
断する。1種類の場合には、差分最小理想訳はその1種
類の理想訳文となるので、本処理は終了する。複数ある
場合には、ステップ602に移行する。
【0062】ステップ602)理想訳文順に比較結果を
取り出す。図12の比較結果では2種類の理想英訳文に
対応する比較結果が順に取り出される。
【0063】ステップ603)ステップ602で抽出さ
れた理想訳文と機械訳文の差を計算するための変数、理
想訳機械訳距離を0にし、初期化する。
【0064】ステップ604)抽出された理想訳文の比
較結果を機械訳文の単語順に取り出す。図12の比較結
果では、2種類の機械英訳単語に相当する比較結果の情
報が取り出される。
【0065】ステップ605)抽出された機械訳単語に
相当する比較結果の中で機械訳単語と、理想訳単語が一
致するか判断し、一致すれば、ステップ609に移行
し、一致しなければ、ステップ606に移行する。
【0066】ステップ606)抽出された機械訳単語に
相当する比較結果の中で、他訳語候補と理想訳単語が一
致するか判断し、一致すればステップ607に移行し、
一致しなければステップ608に移行する。
【0067】ステップ607)変数、理想訳機械訳距離
に1が足され、ステップ609に移行する。
【0068】ステップ608)変数、理想訳機械訳距離
に2が足され、ステップ609に移行する。
【0069】ステップ609)全ての機械訳単語につい
て比較結果を評価したか判断し、評価した場合には、ス
テップ610に移行する。評価していない場合にはステ
ップ604に戻り、上記の処理を全ての機械訳単語につ
いて終了するまで繰り返す。
【0070】ステップ610)比較結果の評価の終了し
た理想訳文について変数、理想訳機械訳距離の値を付与
する。
【0071】ステップ611)全ての理想訳文について
比較結果を評価したか判断し、評価した場合には、ステ
ップ612に移行する。評価していない場合には、ステ
ップ602に戻り、上記の処理を全て理想訳文について
終了するまで繰り返す。
【0072】ステップ612)全ての理想訳文の中で理
想訳機械訳距離が最も低かった理想訳文の比較結果が本
処理により出力される。
【0073】図12の例では、理想英訳文A"Strage de
vice is to be provided."については“1”、"To be e
quipped with the strage device" については、“3”
の評価結果が得られるので、図14の差分最小理想訳抽
出部の結果に示すように、図12の "Strage device is to be provided." の比較結果が上記の処理により出力される。
【0074】図13のフローチャートで示した差分最小
理想訳抽出部6は、言語変換辞書42の辞書情報を用い
て理想訳文と機械訳文の比較を行っているが、他の辞書
やルールを用いて、差分最小理想訳文を決定する形態も
考えられる。
【0075】また、理想訳機械訳比較部5で、第2の自
然言語の解析装置を用いて、理想訳文から第2自然言語
の理想訳概念構造を生成し、この理想訳概念構造と機械
訳翻訳の際に生成された機械訳概念構造とを比較し、こ
の比較結果を利用して差分最小理想訳を決定する形態も
考えられる。
【0076】差分最小理想訳抽出部6で得られた差分最
小理想訳文の比較情報を基に、辞書ルール変更追加部7
によって、追加修正すべきルールや辞書の情報が抽出さ
れ、その結果に応じて、追加修正される。
【0077】図15は、本発明の第1の実施例の辞書・
ルール変更追加処理の動作を示すフローチャートであ
る。
【0078】ステップ701)差分最小理想訳抽出部6
の結果を機械訳文の単語の順に取り出す。例えば、図1
4に示す差分最小理想訳抽出部6の結果では、まず"mem
ory"の情報が取り出され、次に" 〜is to be provided"
の情報が取り出される。
【0079】ステップ702)抽出された情報から日本
語単語、品詞及び一致単語の情報を抽出する。
【0080】ステップ703)ステップ702で抽出さ
れた日本語単語をキーにして、品詞に応じた言語変換辞
書42を検索し、辞書情報を抽出する。例えば、"memor
y"に関しては日本語単語「記憶装置」をキーにして図7
の言語変換辞書42の名詞部を検索し、辞書情報を抽出
する。また、" 〜is to be provided"に関しては日本語
単語「〜を有すること」をキーに図7の言語変換辞書4
2の名詞部を検索し、辞書情報を抽出する。
【0081】なお、本実施例で説明した図11の理想訳
比較部5のフローチャートの方法を用いた場合には、辞
書情報は検索できるが、例えば、理想訳機械訳比較部5
で、辞書には情報がないが、理想訳文と機械訳文が一単
語同士であれば、その理想訳文を一致単語とする方法等
がとられている場合には、辞書情報が検索できないこと
もあり得る。
【0082】ステップ704)辞書情報が抽出できたか
を判断し、抽出できたら、ステップ705に移行する。
【0083】ステップ705)一致単語の訳語の優先度
が最も高くなるように優先度等の訳語の選択条件を変更
する。例えば、図14の例では、2種類の単語両方とも
辞書情報が抽出できるので、「記憶装置」の辞書エント
リに関しては訳語"Strage device" の訳語が最も優先さ
れるように優先度を“1”に変更し、訳語"memory"の優
先度“2”に変更する。また、「〜を有すること」の辞
書エントリに関しては、1種類の訳語しかなく、訳語が
一致単語と同一なので、一致単語はすでに最優先となっ
ているため辞書情報は変更しない。図14の訳語の例で
は、「記憶装置」の辞書エントリの優先度を変更しただ
けであるが、場合によっては、その単語を修飾する単語
や修飾される単語の種類等の情報を訳語の選択条件とし
て登録する手法も考えられる。
【0084】ステップ706)日本語単語と一致単語の
訳語から新たに辞書エントリを作成し、新規登録する。
【0085】ステップ707)全ての機械英訳単語につ
いて辞書への追加修正の検証を行ったかを判断し、行っ
た場合には、辞書ルール変更追加部7の処理は終了す
る。行っていない場合には、ステップ701に戻り上記
処理を全ての機械英訳単語について終了するまで繰り返
す。
【0086】図16は、本発明の第1の実施例の差分最
小理想訳抽出部の結果を用いて辞書・ルール変更追加処
理を行った結果の言語変換辞書42の辞書情報を示す。
同図のように、名詞部の「記憶装置」の訳語の優先度が
図7の情報から変更されている。
【0087】図15のフローチャートで示した辞書ルー
ル変更追加部7では、言語変換辞書42の辞書情報を用
いて言語変換辞書42のみの辞書情報の変更追加を行っ
ているが、他の辞書やルールを用いてそれらの辞書やル
ールの辞書情報を変更追加する形態も考えられる。
【0088】また、辞書・ルール変更追加部7におい
て、図15に示すフローチャートでは、辞書4、ルール
3は自動的に変更・追加されるが、この変更追加時に、
変更追加情報を表示して、変更・追加等の登録の判断を
人間に委ねる形態であってもよい。
【0089】上記の方法で学習した辞書やルールを用い
て、再度入力日本文を機械翻訳すると、学習データであ
る対訳コーパス中に現れる訳文傾向を反映した機械訳文
が得られる。例えば、図8の入力日本文に関しては、理
想英訳文の1つである"Strage device is to be proive
d." の訳が機械英訳文として得られる。
【0090】[第2の実施例]次に、本発明の第2の実
施例の機械翻訳システム用辞書・ルール学習方法につい
て説明する。この第2の実施例は、互いに対訳関係にあ
る第1自然言語の文(入力文)と第2自然言語の理想訳
文の集まり(対訳文章)を学習に用いて、この対訳文章
中から同一の入力文とその理想文の集まりを抽出するよ
うにした点が上記の第1の実施例と異なる。
【0091】第1の実施例では、入力文に対して複数の
理想訳文が付与されている場合を想定していたが、第2
の実施例では、学習用に用いる対訳文章中に同一の入力
文が存在する場合に、入力文の種類別に理想訳文をまと
めて学習処理を行っている。従って、このようにしてま
とめた後の1種類の入力文に対して複数種類の理想訳文
が付与されている場合の学習処理は、第1の実施例にお
ける入力文に対して複数の理想文が付与させるた場合と
同様に学習処理を行うことができる。
【0092】図17は、本発明の第2の実施例の機械翻
訳用辞書・ルール自動学習システムの基本ブロック構成
を示す。同図において、図5と同一構成部分には、同一
符号を付し、その説明を省略する。同図に示すシステム
は、図5に示すシステム構成とは対訳文章を入力する対
訳文章読み込み部10と、対訳文章読み込み部10で入
力された対訳文章中から同一の入力文とその理想訳文の
集まりを読み込む同一入力文抽出部11の構成が異な
り、他のシステム構成は図5の構成と同様である。
【0093】図17に示す基本ブロック構成の機械翻訳
用辞書・ルール自動学習システムの処理手順を説明す
る。ここでは、図18に示す対訳文章を例として説明す
る。
【0094】対訳文章読み込み部10は、対訳関係にあ
る第1自然言語の文と第2自然言語の文の集まり(対訳
文章)を入力する。図18の例では、対訳文章中に第1
自然言語である日本語の入力文「記憶装置を有する」が
2個存在し、それぞれの箇所で、その対訳関係にある第
2自然言語である英語の理想英訳文として、 "Strage device is to be provided." と、 "To be equippped with the strage device." の2種類が付与されている。このように、同一文章中に
全く同一の第1言語文が存在する場合に、翻訳者のその
ときの気分等によって翻訳結果が異なる場合がある。図
18の例のように、1種類の第1自然言語の文に対して
複数種類の第2自然言語の文が付与されるということは
頻繁に行われるために、このような現象を考慮する必要
がある。
【0095】(1)同一入力文抽出部11において、入
力された対訳文章を異なる入力文別に分類する。図18
の対訳文章中の入力日本文「記憶装置を有すること」に
関して図19に示すように、異なる箇所に現れた2種類
の理想英訳文は1箇所に分類される。
【0096】(2)次に同一入力文抽出部11で異なる
入力文別に分類された対訳文章の個々の異なる入力文と
それに対する理想英訳文の対について、第1の実施例と
同様に、図6に示すような機械翻訳システム2におい
て、ルール3や辞書4を用いて第2自然言語の機械英訳
文に翻訳する。図19に示す入力日本文「記憶を有する
こと」に関しては、第1の実施例の図8に示すような機
械英訳文が生成される。
【0097】上記のようにして得られた機械英訳文は、
理想英訳文と理想訳機械訳比較部5によって比較され、
理想訳文と機械訳文の比較結果が得られる。例えば、第
1の実施例で説明した図11のフローチャートに示す理
想訳機械訳比較処理によって得られる。図11の処理を
用いれば、図19に示した日本文「記憶を有すること」
に関しては、図12に示すような比較結果に対して得ら
れる。
【0098】次に、このようにして得られた理想訳と機
械訳の比較結果から、差分最小理想訳抽出部5によって
差分が最小の理想訳文と機械訳文の比較結果が抽出され
る。例えば、第1の実施例で説明した図13のフローチ
ャートに示す差分最小理想訳抽出処理によって得られ
る。図13の例を用いれば、図19に示した入力日本文 「記憶を有すること」 に関しては、図12に示すような比較結果に対して図1
4に示すような差分最小理想訳抽出結果が得られる。
【0099】最後に、差分最小理想訳抽出部6で得られ
た差分最小理想訳文の比較情報を基に、辞書ルール変更
追加部7によって、追加修正すべきルールや辞書の情報
が抽出され、その結果に応じて追加修正される。例え
ば、第1の実施例で説明した図15のフローチャートに
示す辞書ルール変更追加処理によってルールや辞書が変
更追加される。図15の処理を用いれば、図19に示す
入力日本文 「記憶を有すること」 に関しては、図14に示すような差分最小理想訳文抽出
結果から図7に示すような機械翻訳システムで用いる言
語変換辞書の情報が図16に示すように変更される。
【0100】上記のような学習処理を同一抽出部11で
得られたすべての異なる入力日本文とその理想英訳文に
ついて繰り返すことによって、入力された対訳文章の訳
文品質を向上することが可能となる機械翻訳システム用
辞書やルールが構築できる。
【0101】なお、辞書・ルール変更追加部7に表示機
能を持たせ、ルール3や辞書4を更新する際に、更新す
る内容を表示し、ユーザが表示内容を確認するも可能で
あり、さらに、表示内容を確認して必要に応じて修正を
加えることも可能である。
【0102】なお、本発明は、上記実施例に限定される
ことなく、特許請求の範囲内で種々変更または応用が可
能である。
【0103】
【発明の効果】本発明は、入力文の翻訳結果(機械訳)
と、事前に準備された入力文の理想訳文を比較すること
により、言語変換辞書や言語変換ルールを変更追加する
際に、同一の入力文に対して複数種類の理想訳文が付与
されている場合には、機械訳文との違いが最も少ない理
想訳文を用いるものである。
【0104】本発明は、対訳文を読み込み、互いに対訳
関係にある第1の自然語の入力文と第2の自然言語の理
想訳文を読み込み、これ以降の処理により機械翻訳シス
テム用辞書・ルールが自動的に変更追加される。まず、
理想訳文と機械訳文を比較する処理は、対訳文読み込み
により読み込まれた第1の自然言語の入力文を機械翻訳
システムを用いて第2の自然言語の機械訳文に翻訳し、
機械訳文と理想訳文を例えば、機械翻訳システム用辞書
を用いて機械訳文中の語と理想訳文中の語との対応関係
を取ることにより比較する。次に、この比較により入力
文1文に対して複数種類の理想文が付与されている場合
には、例えば、理想訳文と機械訳文で異なる単語の数を
調査し、最も異なる単語数の少ない理想訳文を抽出する
等によって差分が最も少ない理想訳文(差分最小理想訳
文)を抽出する。辞書ルールを変更する場合には、理想
訳文と機械訳文とを比較した結果及び差分最小理想訳文
に基づいて、辞書やルールを変更追加する。これによ
り、入力文1文に対して、複数種類の理想訳文が付与さ
れている場合でも、最も機械訳文に近い理想訳文を利用
して、辞書やルールを変更追加するため、以後、翻訳さ
れる機械訳文はより理想訳文に近いものが訳出される。
【0105】また、本発明は、機械訳概念構造と理想訳
概念構造を生成し、この2つの概念構造を比較し、入力
文1種類に対して複数種類の理想訳概念構造が付与され
ている場合には、差分が最も少ない理想訳概念構造を抽
出し、その差分最小理想訳概念構造に基づいて辞書やル
ールを変更追加する。これにより、入力文1種類に対し
て複数種類の理想訳文が付与されている場合でも、最も
機械訳概念構造に近い理想概念構造を利用して辞書やル
ールを変更追加する。
【0106】また、本発明は、入力文1種類に対して、
複数種類の理想訳文が付与されている場合に、機械訳概
念構造に近い理想訳概念構造を利用することにより辞書
やルールを変更追加する。
【0107】また、本発明は、対訳関係にある第1の自
然言語の入力文と第2の自然言語の理想訳文の集まり対
訳文章を読み込む。同一入力文を抽出する処理は、同一
の入力文とその理想訳文の集まりを抽出し、理想訳文と
機械訳文を比較し、差分最小の理想訳文を抽出し、入力
文1種類に対して複数種類の理想訳文が付与されている
場合でも最も機械訳文に近い理想訳文を利用して辞書や
ルールを変更追加する。
【0108】上述のように本発明によれば、対訳文もし
くは、対訳文章を用いて機械翻訳用の辞書やルールを学
習する際に1種類の入力文に対して複数の理想訳文また
は複数の種類の理想訳文が付与されていても、そのうち
で最も機械訳文に近い理想訳文を選択して学習すること
ができる。そのため、同一の入力文表現に対して複数の
異なる翻訳表現を生成する辞書やルールを登録してしま
うことが避けられる。
【0109】また、機械翻訳システムが最も目標とし易
い理想訳文を参照して辞書やルールを登録することがで
きる。そのため、機械翻訳システムにとって最も実現性
が高く効果的な方法で自動的に辞書やルールを追加修正
することが可能である。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図(その1)で
ある。
【図2】本発明の原理を説明するための図(その2)で
ある。
【図3】本発明の原理を説明するための図(その3)で
ある。
【図4】本発明の原理を説明するための図(その4)で
ある。
【図5】本発明の第1の実施例の機械翻訳用辞書・ルー
ル自動学習システムの基本ブロック構成図である。
【図6】本発明の第1の実施例の追加修正される辞書や
ルールを用いた機械翻訳システムの基本ブロック構成図
である。
【図7】言語変換辞書の辞書エントリ例を示す図であ
る。
【図8】入力日本文とそれに対する理想英訳文、機械英
訳文及び入力日本文を機械翻訳する際に得られた機械英
訳文の単語の情報の例を示す図である。
【図9】機械翻訳システムの第1言語解析部で得られる
日本語の概念構造を示す図である。
【図10】機械翻訳システムの言語変換部で得られる英
語の概念構造を示す図である。
【図11】本発明の第1の実施例の理想訳機械訳比較動
作のフローチャートである。
【図12】本発明の第1の実施例の理想訳機械訳比較の
比較結果を示す図である。
【図13】本発明の第1の実施例の差分最小理想訳抽出
部の動作のフローチャートである。
【図14】本発明の第1の実施例の差分最小理想訳抽出
部の結果を示す図である。
【図15】本発明の第1の実施例の辞書・ルール変更追
加処理の動作のフローチャートである。
【図16】本発明の第1の実施例の差分最小理想訳抽出
部の結果を用いて辞書・ルール変更追加の処理を行った
時の辞書情報を示す図である。
【図17】本発明の第2の実施例の機械翻訳システム用
辞書・ルール学習システムの基本ブロック構成図であ
る。
【図18】本発明の第2の実施例の対訳文章の例を示す
図である。
【図19】本発明の第2の実施例の同一入力文抽出ステ
ップによって変更された対訳文章の例を示す図である。
【符号の説明】
1 対訳文読み込み部、対訳文読み込み手段 2 機械翻訳システム 3 ルール 4 辞書 5 機械訳理想訳比較部、機械訳理想訳比較手段、機械
訳理想訳概念構造比較手段 6 差分最小理想訳抽出部、差分最小理想訳抽出手段、
差分最小理想訳概念構造抽出手段 7 辞書ルール変更追加部、辞書ルール変更追加手段 8 第1自然言語入力部 9 第2自然言語出力部 10 対訳文章読み込み部、対訳文章読み込み手段 11 同一入力文抽出部、同一入力文抽出手段 21 第1言語解析部 22 言語変換部 23 第2言語生成部 31 第1言語解析ルール 32 言語変換ルール 33 第2言語生成ルール 41 第1言語解析辞書 42 言語変換辞書 43 第2言語生成辞書
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 原言語である第1の自然言語の文を、目
    的言語である第2の自然言語の文に変換する手段を有す
    る機械翻訳システムにおける機械翻訳システム用辞書・
    ルール学習装置であって、 互いに対訳関係にある第1の自然言語の入力文と第2の
    自然言語の理想訳文の集まりである対訳文章を入力する
    対訳文章読み込み手段と、 前記機械翻訳システムを用いて該第1の自然言語の入力
    文を翻訳した第2の自然言語の機械訳文と該第2の自然
    言語の理想訳文を比較する機械訳理想訳比較手段と、 前記機械訳理想訳比較手段で得られた比較結果により、
    前記入力文1文に対して複数の種類の理想訳文が付与さ
    れている場合には、差分が最も少ない理想訳文を抽出す
    る差分最小理想訳抽出手段と、 前記機械訳理想訳比較手段で得られた比較結果及び該差
    分最小理想訳抽出手段で得られた差分が最も少ない理想
    訳文を基に、辞書やルールを変更追加する辞書ルール変
    更追加手段とを有することを特徴とする機械翻訳システ
    ム用辞書・ルール学習装置。
  2. 【請求項2】 原言語である第1の自然言語の文を、目
    的言語である第2の自然言語の文に変換する手段を有す
    る機械翻訳システムにおける機械翻訳システム用辞書・
    ルール学習装置であって、 互いに対訳関係にある第1の自然言語の入力文と第2の
    自然言語の理想訳文の集まりである対訳文章を入力する
    対訳文章読み込み手段と、 前記対訳文章中から、同一の入力文と対応する該対訳文
    章を抽出する同一入力文抽出手段と、 前記機械翻訳システムを用いて前記入力文を第2の自然
    言語の文に翻訳された機械翻訳文と、理想訳文を比較す
    る機械訳理想訳比較手段と、 前記機械訳理想訳比較手段で得られた比較結果によっ
    て、前記同一入力文抽出手段で抽出された入力文1種類
    に対して複数種類の理想訳文が付与されている対訳文章
    に対して、差分が最も少ない理想訳文を抽出する差分最
    小理想訳抽出手段と、 前記機械訳理想訳比較手段で得られた比較結果及び前記
    差分最小理想訳抽出手段で得られた差分が最も少ない理
    想訳文を基に、辞書やルールを変更追加する辞書ルール
    変更追加手段とを有することを特徴とする機械翻訳シス
    テム用辞書・ルール学習方法。
  3. 【請求項3】 原言語である第1の自然言語の文を、目
    的言語である第2の自然言語の文に変換する手段を有す
    る機械翻訳システムにおける機械翻訳システム用辞書・
    ルール学習装置であって、 互いに対訳関係にある第1の自然言語の入力文と第2の
    自然言語の理想訳文の集まりである対訳文章を入力する
    対訳文章読み込み手段と、 前記機械翻訳システムを用いて前記入力文を第2の自然
    言語の機械訳文に翻訳する際に、第2の自然言語の機械
    訳概念構造を生成する機械訳概念構造生成手段と、 前記理想訳文から第2の自然言語の理想訳概念構造を生
    成する理想訳概念構造生成手段と、 前記機械訳概念構造と前記理想訳概念構造を比較する機
    械訳理想訳概念構造比較手段と、 前記機械訳理想訳概念構造比較手段で得られた比較結果
    によって、前記入力文1種類に対して複数種類の理想訳
    概念構造が付与されている場合には、差分が最も少ない
    理想訳概念構造を抽出する差分最小理想訳概念構造抽出
    手段と、 前記機械訳理想訳概念構造比較手段で得られた比較結果
    及び前記差分最小理想訳概念構造抽出手段で得られた差
    分抽出結果を基に、辞書やルールを変更追加する辞書ル
    ール変更追加手段とを有することを特徴とする機械翻訳
    システム辞書・ルール学習装置。
  4. 【請求項4】 原言語である第1の自然言語の文を、目
    的言語である第2の自然言語の文に変換する手段を有す
    る機械翻訳システムにおける機械翻訳システム用辞書・
    ルール学習装置であって、 互いに対訳関係にある第1の自然言語の入力文と第2の
    自然言語の理想訳文の集まりである対訳文章を入力する
    対訳文章読み込み手段と、 前記対訳文章中から同一の入力文と該入力文に対応する
    理想訳文の集まりを抽 出する同一入力文抽出手段と、 前記機械翻訳システムを用いて前記入力文を第2の自然
    言語の機械訳文に翻訳する際に、機械訳概念構造を生成
    する機械訳概念構造生成手段と、 前記理想訳文を解析して第2の自然言語の理想訳概念構
    造を生成する理想訳概念構造生成手段と、 前記機械訳概念構造と前記理想訳概念構造を比較する機
    械訳理想訳概念構造比較手段と、 前記機械訳理想訳概念構造比較手段で得られた比較結果
    によって、前記同一入力文抽出手段で抽出された入力文
    1種類に対して複数種類の理想訳概念構造が付与されて
    いる対訳文章に対して、差分が最も少ない理想訳概念構
    造を抽出する差分最小理想訳概念構造抽出手段と、 前記機械訳理想訳概念構造比較手段で得られた比較結果
    及び前記差分最小理想訳概念構造抽出手段で得られた差
    分抽出結果を基に、辞書やルールを変更追加する辞書ル
    ール変更追加手段とを有することを特徴とする機械翻訳
    システム用辞書・ルール学習装置。
  5. 【請求項5】 前記辞書ルール変更追加手段は、 前記辞書や前記ルールを変更する情報を表示するための
    表示手段を含む請求項1乃至5記載の機械翻訳システム
    用辞書・ルール学習装置。
JP03447794A 1994-03-04 1994-03-04 機械翻訳システム用辞書・ルール学習装置 Expired - Fee Related JP3326646B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03447794A JP3326646B2 (ja) 1994-03-04 1994-03-04 機械翻訳システム用辞書・ルール学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03447794A JP3326646B2 (ja) 1994-03-04 1994-03-04 機械翻訳システム用辞書・ルール学習装置

Publications (2)

Publication Number Publication Date
JPH07244665A JPH07244665A (ja) 1995-09-19
JP3326646B2 true JP3326646B2 (ja) 2002-09-24

Family

ID=12415336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03447794A Expired - Fee Related JP3326646B2 (ja) 1994-03-04 1994-03-04 機械翻訳システム用辞書・ルール学習装置

Country Status (1)

Country Link
JP (1) JP3326646B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08101837A (ja) * 1994-09-30 1996-04-16 Toshiba Corp 機械翻訳装置における翻訳規則学習方法
JP3960456B2 (ja) * 2000-08-30 2007-08-15 沖電気工業株式会社 翻訳サービス提供装置
JP5456260B2 (ja) * 2008-02-01 2014-03-26 ニフティ株式会社 翻訳処理プログラム、翻訳処理方法及び翻訳処理
JP6884945B2 (ja) * 2016-09-06 2021-06-09 国立研究開発法人情報通信研究機構 訓練用データ生成装置、最適パラメータ取得装置、訓練用データ生成方法、および最適パラメータ取得方法
CN109241539B (zh) * 2018-08-02 2023-09-08 爱云保(上海)科技有限公司 机器学习人工智能翻译数据库的更新方法

Also Published As

Publication number Publication date
JPH07244665A (ja) 1995-09-19

Similar Documents

Publication Publication Date Title
US5895446A (en) Pattern-based translation method and system
Al‐Sughaiyer et al. Arabic morphological analysis techniques: A comprehensive survey
KR101031970B1 (ko) 구문들 사이의 번역 관계를 학습하기 위한 통계적 방법
JP4504555B2 (ja) 翻訳支援システム
US20050171757A1 (en) Machine translation
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPS6299865A (ja) 自然言語の共起関係辞書保守方法
JP5146979B2 (ja) 自然言語における多義解消装置及びコンピュータプログラム
KR20060124632A (ko) 대역 판단 장치, 방법 및 프로그램
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
Smadja et al. Translating collocations for use in bilingual lexicons
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JP4018668B2 (ja) 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
JP5025603B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
KR100327114B1 (ko) 문장골격을 기반으로 한 자동번역 시스템 및 그 방법
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JP3358096B2 (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
JP3698454B2 (ja) 並列句解析装置および学習データ自動作成装置
JP3176750B2 (ja) 自然言語の翻訳装置
JP3419748B2 (ja) 辞書作成装置および方法と辞書作成プログラムを記録した記録媒体
JPH0561902A (ja) 機械翻訳システム
JP2000250914A (ja) 機械翻訳方法、装置、および機械翻訳プログラムを記録した記録媒体
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070712

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080712

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080712

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090712

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090712

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100712

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100712

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110712

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120712

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees