JPH10326276A - 機械翻訳システム用辞書・ルール学習方法及びシステム及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体 - Google Patents

機械翻訳システム用辞書・ルール学習方法及びシステム及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体

Info

Publication number
JPH10326276A
JPH10326276A JP9135553A JP13555397A JPH10326276A JP H10326276 A JPH10326276 A JP H10326276A JP 9135553 A JP9135553 A JP 9135553A JP 13555397 A JP13555397 A JP 13555397A JP H10326276 A JPH10326276 A JP H10326276A
Authority
JP
Japan
Prior art keywords
translation
word
ideal
dictionary
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9135553A
Other languages
English (en)
Other versions
JP3353647B2 (ja
Inventor
Setsuo Yamada
節夫 山田
Hiromi Nakaiwa
浩巳 中岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP13555397A priority Critical patent/JP3353647B2/ja
Publication of JPH10326276A publication Critical patent/JPH10326276A/ja
Application granted granted Critical
Publication of JP3353647B2 publication Critical patent/JP3353647B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 理想訳概念辞書生成手段の使用を前提にせず
に機械翻訳システム用辞書やルールを抽出し、理想訳に
近い翻訳文を生成することが可能な、機械翻訳システム
用辞書・ルール学習方法及び装置及び機械翻訳システム
用辞書・ルール学習プログラムを格納した記憶媒体を提
供することを目的とする。 【解決手段】 本発明は、辞書対訳コーパスの入力文及
び理想文の情報のみならず、機械翻訳システムが出力し
た機械訳文の情報も利用し、対訳辞書や目的言語である
第2言語の辞書を参照して、入力文、機械訳文、理想訳
文の3種類の文から、入力文中の入力単語とその入力単
語と対訳関係にある機械訳文中の機械訳語及び理想訳文
中の理想訳語の3組の集合を抽出し、現在の機械訳文の
結果も考慮しつつ、最適な辞書やルールを追加修正す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、機械翻訳システム
用辞書・ルール学習方法及びシステム及び機械翻訳シス
テム用辞書・ルール学習プログラムを格納した記憶媒体
に係り、特に、機械翻訳システムで用いる辞書やルール
を自動的に学習するための機械翻訳システム用辞書・ル
ール学習方法及びシステム及び機械翻訳システム用辞書
・ルール学習プログラムを格納した記憶媒体に関する。
【0002】
【従来の技術】従来は、機械翻訳システム用辞書やルー
ルを構築する場合、人間が翻訳等に利用する辞書などを
参考にして機械翻訳システム用の辞書やルールを人手で
構築するのが一般的である。また、このようにして構築
された機械翻訳システム用の辞書やルールは、機械翻訳
システムの翻訳結果をもとに、不適切な訳が生成されて
いる場合には、その訳を生成した原因となる辞書やルー
ルを、機械翻訳システムの内部処理を良く理解したエキ
スパートが人手で追加修正している。
【0003】この辞書やルールの追加修正作業を自動化
する第1の手法としては、対訳関係にある原言語の文と
目的言語の文(理想訳文)に対の集合(対訳コーパス)
からそれぞれを解析することによって、生成される原言
語概念構造と理想訳文概念構造を比較することによっ
て、辞書を追加・修正する改良方法(例えば、『機械翻
訳装置』(特開平4−205056号))がある。
【0004】また、第2の手法としては、対応関係にあ
る表現対を対訳コーパス中の原言語の文と目的言語の文
から抽出し、その結果に基づいて追加修正すべき翻訳規
則の候補をユーザに提示し、ユーザが指定した翻訳規則
を追加・修正する改良方法(例えば、『機械翻訳装置に
おける翻訳規則学習方法』(特開平8−101837
号))がある。
【0005】また、第3の手法としては、機械訳概念構
造と理想訳概念構造の違いから差分を抽出し、それを機
械翻訳システムにおける解決方法別に分類することによ
って、辞書やルールを追加修正し、追加修正された辞書
やルールを用いて最適な辞書やルールが登録されるまで
繰り返す方法(『機械翻訳システム用辞書・ルール学習
方法及び機械翻訳システム用辞書・ルール学習装置』
(特願平6−34476号))が知られている。
【0006】
【発明が解決しようとする課題】しかしながら、上記の
従来の機械翻訳システムの辞書やルールの構築方法で
は、人間用に作成された辞書等を利用するため、機械翻
訳用に用いた場合、正しい訳が生成される保証がないと
いう問題がある。また、機械翻訳システムの辞書やルー
ルを追加修正するには、翻訳結果を機械翻訳システムの
内部処理を良く理解したエキスパートにより検証する必
要がある。よって、エキスパートでないと辞書やルール
の追加修正が不可能であるという問題点がある。また、
本作業は人手によるので、辞書やルールの構築のための
時間的経済的コストが高くなってしまうという問題点が
ある。
【0007】また、上記従来の技術のうちの後者、即
ち、改良方法においては、第1の手法の場合、対訳コー
パスの情報のみから、機械翻訳システムの翻訳結果を考
慮せずに、辞書やルールが追加変更されるため、既存の
辞書やルールに対して対訳コーパスにより不適切な追加
変更がなされ、機械翻訳結果に悪影響を及ぼすという問
題がある。
【0008】また、第2の手法の場合、ユーザによる人
手による操作を前提としているため、辞書やルールの構
築のための時間的経済的コストが高くなるという問題が
ある。さらに、第1の手法と第2の手法と共に学習過程
が一度しかないため、学習した結果が本当に正しいもの
かどうか不明である。第3の手法の場合、利用訳概念構
造生成手段の使用を前提としているため、理想訳概念構
造を生成する手段がない場合や、理想訳が大量にあり、
理想訳構造を生成するための時間的計算機的余裕がない
場合には、この手法で解決することは不可能である。ま
た、理想訳概念構造を生成する手段があっても、生成さ
れる理想訳概念構造の信頼性が低い場合には、誤った理
想訳概念構造を参考にして辞書やルールを追加修正され
てしまう場合があるため、効果的な追加修正を効率的に
行うことができない。
【0009】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、理想訳概念辞書生成手
段の使用を前提にせず、辞書対訳コーパスの入力文及び
理想文の情報のみならず、機械翻訳システムが出力した
機械訳文の情報も利用し、対訳辞書や目的言語である第
2言語の辞書を参照して、入力文、機械訳文、理想訳文
の3種類の文から、入力文中の入力単語とその入力単語
と対訳関係にある機械訳文中の機械訳語及び理想訳文中
の理想訳語の3組の集合を抽出し、現在の機械訳文の結
果も考慮しつつ、最適な辞書やルールを追加修正する機
械翻訳システム用辞書・ルール学習方法及びシステム及
び機械翻訳システム用辞書・ルール学習プログラムを格
納した記憶媒体を提供することを目的とする。
【0010】
【課題を解決するための手段】図1は、本発明を説明す
るための図である。本発明は、原言語である第1の自然
言語の入力文を目的言語である第2の自然言語の文に変
換する機械翻訳システムで利用する辞書やルールを追加
及び/又は、変更する機械翻訳システム用辞書・ルール
学習方法において、入力文と対訳関係にある第2の自然
言語の理想訳文を入力し(ステップ1)、入力された入
力文を機械翻訳システムで変換した第2の自然言語の機
械訳文と、該入力文とを比較して(ステップ2)、該入
力文中の入力単語と対訳関係にある該機械訳語及び理想
訳文中の理想訳語の3組の集合を抽出することにより
(ステップ3)、辞書やルールの何れかまたは、両方を
追加変更する(ステップ4)。
【0011】また、本発明は、互いに対訳関係にある入
力文と、第2の自然言語の理想訳文を読み込む対訳文読
み込みステップと、入力文と理想訳文と機械訳文を比較
して、該入力文中の入力単語と該入力単語と対訳関係に
ある該機械訳文中の機械訳語及び該理想訳文中の理想訳
語の3組である対訳表現組の集合である対訳表現集合を
抽出する対訳表現組抽出ステップと、対訳表現抽出ステ
ップで抽出された対訳表現組集合に基づいて、辞書や、
ルールを追加変更する辞書・ルール追加変更ステップを
含む。
【0012】また、本発明は、対訳表現抽出ステップに
おいて、対訳表現集合を抽出する際に、入力文を機械翻
訳システムで機械訳文に変換する際の変換履歴を用いて
該入力文中の入力単語と対訳関係にある該機械訳文中の
機械訳語を抽出する対訳機械訳語対抽出ステップを行
う。
【0013】また、本発明は、対訳表現抽出ステップに
おいて、対訳表現集合を抽出する際に、入力文中の入力
単語と対訳関係にある理想訳文中の理想訳語を抽出する
対訳理想訳語対抽出ステップを行う。また、本発明は、
対訳理想訳語対抽出ステップにおいて、理想訳語を抽出
する際に、第1の自然言語と第2の自然言語の対訳辞書
を利用して、該入力文中の入力単語をキーにして、対訳
辞書を検索し、該入力単語と対訳関係にある第2の自然
言語の入力単語訳語候補を抽出する入力単語訳語候補抽
出ステップと、入力単語訳語候補と理想訳語を比較し
て、対訳関係にある入力文中の入力単語と理想訳文中の
理想訳語の対の組を抽出する入力単語・理想訳語対抽出
ステップとを行う。
【0014】また、本発明は、対訳理想訳語対抽出ステ
ップにおいて、理想訳語を抽出する際に、入力単語訳語
候補抽出ステップで抽出される入力単語訳語候補をキー
にして、第2の自然言語の辞書を検索して抽出される入
力単語訳語候補関連語と理想訳語とを比較して、対訳関
係にある入力文中の入力単語と該理想訳文中の理想訳語
の対の組を抽出する。
【0015】また、本発明は、対訳表現抽出ステップに
おいて、対訳表現組集合を抽出する際に、対応関係にあ
る機械訳文中の機械訳語と理想訳文中の理想訳語を抽出
する対応機械訳語理想語対抽出ステップを行う。また、
本発明は、対応機械訳語理想語対抽出ステップにおい
て、機械訳文中の機械訳語と理想訳文中の理想訳語を抽
出する際に、第2の自然言語の辞書を利用する。
【0016】また、本発明は、対応機械訳語理想語対抽
出ステップにおいて、機械訳文中の機械訳語と理想訳文
中の理想訳語を抽出する際に、第2の自然言語の辞書を
利用して、機械訳文中の機械訳語をキーに、該第2の自
然言語の辞書を検索して抽出される機械訳語関連語と理
想訳語を比較する。また、本発明は、対応機械訳語理想
語対抽出ステップにおいて、機械訳文中の機械訳語と理
想訳文中の理想訳語を抽出する際に、第2の自然言語の
辞書を利用して、理想訳文中の理想訳語をキーに該第2
の自然言語の辞書を検索して抽出される理想訳語関連語
と機械訳語を比較する。
【0017】また、本発明は、対応機械訳語理想語対抽
出ステップにおいて、機械訳文中の機械訳語と理想訳文
中の理想訳語を抽出する際に、第1の自然言語と第2の
自然言語の対訳辞書を利用して、機械訳文中の機械訳語
をキーに得られる第1の自然言語の訳語の集合である機
械訳逆引訳語候補と、理想訳文中の理想訳語をキーに得
られる第1の自然言語の訳語の集合である理想訳逆引訳
語候補を抽出し、該機械訳逆引訳語候補と該理想訳逆引
訳語候補を比較することによって、対応関係にある該機
械訳文中の機械訳語と、該理想訳文中の理想訳語を抽出
する。
【0018】また、本発明は、対訳表現組抽出ステップ
において、第2の自然言語の語同士を比較する際に、機
械訳文中の機械語または、入力単語訳語候補または、入
力単語訳語候補関連語または、機械訳語関連語の少なく
とも1つの語の異なり別に集計した機械訳語異なり語リ
ストを作成し、理想訳文中の理想訳語または、理想訳語
関連語のいずれか、または、両方の語の異なり別に集計
した理想訳異なり語リストを作成し、該機械訳異なり語
リスト中の語と、該理想訳異なり語リスト中の語を比較
する。
【0019】また、本発明は、対訳表現組抽出ステップ
において、第1の自然言語の語同士を比較する際に、入
力単語、機械訳逆引訳語候補の少なくとも1つを、語の
異なり別に集計した入力単語機械訳逆引訳語候補異なり
語リストを作成し、理想訳逆引訳語候補を語の異なり別
に集計した理想訳逆引訳語候補異なり語リストを作成
し、入力単語機械訳逆引訳語候補異なり語リスト中の語
と理想訳逆引訳語候補異なり語リスト中の語を比較す
る。
【0020】また、本発明は、対訳表現組抽出ステップ
において、第1の自然言語の語同士、第2の自然言語の
語同士を比較する際に、両方の語が一致するか、一方の
語が他方の語を含んでいるか、両方の語の一部が一致す
るかにより、対応の度合を区別する。また、本発明は、
対訳表現組抽出ステップにおいて、理想訳文を形態素解
析し、理想訳形態素構造を抽出する際に、理想訳形態素
構造の情報を利用して、機械訳逆引訳語候補、理想訳逆
引訳語候補、理想訳異なり語リスト中の語の少なくとも
1つと、機械訳異なり語リスト中の語、機械訳逆引訳語
候補異なり語リスト中の語、理想訳逆引訳語候補異なり
語リスト中の語の少なくとも1つを比較する。
【0021】また、本発明は、対訳表現抽出ステップに
よって抽出される対訳表現組集合から、入力文と理想訳
文と機械訳文の1組から抽出できる対訳表現組の組み合
わせである対訳表現組み合わせの集合を抽出する対訳表
現組み合わせ抽出ステップを行う。また、本発明は、対
訳表現組抽出ステップにおいて、対訳表現組抽出ステッ
プによって、抽出される対訳表現組集合の個々の対訳表
現組に、個々の対訳表現組の抽出過程に応じた確度であ
る対訳表現組確度を付与する対訳表現組確度付与ステッ
プを行い、対訳表現組み合わせ抽出ステップにおいて、
対訳表現集合中の個々の対訳表現組に付与された対訳表
現組確度を利用して、個々の対訳表現組み合わせに確度
を付与し、辞書・ルール追加変更ステップにおいて、対
訳表現組み合わせ抽出ステップによって、抽出される対
訳表現組み合わせ集合中の個々の対訳表現組み合わせに
付与された確度を利用して辞書やルールを追加変更す
る。
【0022】また、本発明は、機械翻訳システム用辞書
・ルール学習方法によって得られる辞書やルールを用い
て該学習方法を繰り返す。また、本発明は、辞書・ルー
ル変更ステップにおいて、学習終了を判定する学習終了
判定ステップを行う。また、本発明は、機械翻訳システ
ム用辞書・ルール学習方法によって得られる辞書やルー
ルを用いて該入力文を翻訳した結果の履歴である機械訳
文履歴格納手段に記録する機械訳翻訳履歴保持ステップ
を行い、学習終了判定ステップにおいて、機械訳文履歴
格納手段の記録内容が定常状態になったときに、学習が
終了する。
【0023】また、本発明は、辞書・ルール追加変更ス
テップにおいて、辞書または、ルールを変更する情報を
表示する。本発明は、原言語である第1の自然言語の入
力文を目的言語である第2の自然言語の文に変換する機
械翻訳システムで利用する辞書やルールを追加や変更す
る機械翻訳システム用辞書・ルール学習システムであっ
て、入力文と対訳関係にある第2の自然言語の理想訳文
を入力する理想訳文入力手段と、理想訳文入力手段によ
り、入力された入力文を機械翻訳システムで変換した第
2の自然言語の機械訳文と、該入力文とを比較する比較
手段と、比較手段により、該入力文中の入力単語と対訳
関係にある該機械訳語及び理想訳文中の理想訳語の3組
の集合を抽出することにより、辞書やルールの何れかま
たは、両方を追加変更する更新手段とを有する。
【0024】図2は、本発明の原理構成図である。ま
た、本発明は、互いに対訳関係にある入力文と、第2の
自然言語の理想訳文を読み込む対訳文読み込み手段1
と、入力文と理想訳文と機械訳文を比較して、該入力文
中の入力単語と該入力単語と対訳関係にある該機械訳文
中の機械訳語及び該理想訳文中の理想訳語の3組である
対訳表現組の集合である対訳表現集合を抽出する対訳表
現組抽出手段5と、対訳表現組抽出手段5で抽出された
対訳表現組集合に基づいて、辞書4や、ルール3を追加
変更する辞書・ルール追加変更手段6を含む。
【0025】また、本発明の対訳表現組抽出手段5は、
対訳表現集合を抽出する際に、入力文を機械翻訳システ
ムで機械訳文に変換する際の変換履歴を用いて該入力文
中の入力単語と対訳関係にある該機械訳文中の機械訳語
を抽出する対訳機械訳語対抽出手段を含む。また、本発
明の対訳表現組抽出手段5は、対訳表現集合を抽出する
際に、入力文中の入力単語と対訳関係にある理想訳文中
の理想訳語を抽出する対訳理想訳語対抽出手段を含む。
【0026】また、本発明の対訳理想訳語対抽出手段
は、第1の自然言語と第2の自然言語の対訳辞書と、理
想訳語を抽出する際に利用して、該入力文中の入力単語
をキーにして、対訳辞書を検索し、該入力単語と対訳関
係にある第2の自然言語の入力単語訳語候補を抽出する
入力単語訳語候補抽出手段と、入力単語訳語候補と理想
訳語を比較して、対訳関係にある入力文中の入力単語と
理想訳文中の理想訳語の対の組を抽出する入力単語・理
想訳語対抽出手段とを含む。
【0027】また、本発明の対訳理想訳語対抽出手段
は、第2の自然言語の辞書と、入力単語訳語候補抽出手
段で抽出される入力単語訳語候補をキーにして、第2の
自然言語の辞書を検索して抽出される入力単語訳語候補
関連語と理想訳語とを比較して、対訳関係にある入力文
中の入力単語と該理想訳文中の理想訳語の対の組を抽出
する手段を含む。
【0028】また、本発明の対訳表現組抽出手段5は、
対訳表現組集合を抽出する際に、対応関係にある機械訳
文中の機械訳語と理想訳文中の理想訳語を抽出する対応
機械訳語理想語対抽出手段を含む。また、本発明の対応
機械訳語理想語対抽出手段は、機械訳文中の機械訳語と
理想訳文中の理想訳語を抽出する際に、第2の自然言語
の辞書を利用する手段を含む。
【0029】また、本発明の対応機械訳語理想語対抽出
手段は、機械訳文中の機械訳語と理想訳文中の理想訳語
を抽出する際に、第2の自然言語の辞書を利用して、機
械訳文中の機械訳語をキーに、該第2の自然言語の辞書
4を検索して抽出される機械訳語関連語と理想訳語を比
較する手段を含む。また、本発明の対応機械訳語理想語
対抽出手段は、機械訳文中の機械訳語と理想訳文中の理
想訳語を抽出する際に、第2の自然言語の辞書4を利用
して、理想訳文中の理想訳語をキーに該第2の自然言語
の辞書4を検索して抽出される理想訳語関連語と機械訳
語を比較する手段を含む。
【0030】また、本発明の対応機械訳語理想語対抽出
手段は、機械訳文中の機械訳語と理想訳文中の理想訳語
を抽出する際に、第1の自然言語と第2の自然言語の対
訳辞書を利用して、機械訳文中の機械訳語をキーに得ら
れる第1の自然言語の訳語の集合である機械訳逆引訳語
候補と、理想訳文中の理想訳語をキーに得られる第1の
自然言語の訳語の集合である理想訳逆引訳語候補を抽出
する手段と、機械訳逆引き訳語候補と該理想訳逆引訳語
候補を比較することによって、対応関係にある該機械訳
文中の機械訳語と、該理想訳文中の理想訳語を抽出する
手段を含む。
【0031】また、本発明の対訳表現組抽出手段5は、
第2の自然言語の語同士を比較する際に、機械訳文中の
機械語または、入力単語訳語候補または、入力単語訳語
候補関連語または、機械訳語関連語の少なくとも1つの
語の異なり別に集計した機械訳語異なり語リストを作成
する手段と、理想訳文中の理想訳語または、理想訳語関
連語のいずれか、または、両方の語の異なり別に集計し
た理想訳異なり語リストを作成する手段と、該機械訳異
なり語リスト中の語と、理想訳異なり語リスト中の語を
比較する手段とを含む。
【0032】また、本発明の対訳表現組抽出手段5は、
第1の自然言語の語同士を比較する際に、入力単語、機
械訳逆引訳語候補の少なくとも1つを、語の異なり別に
集計した入力単語機械訳逆引訳語候補異なり語リストを
作成する手段と、理想訳逆引訳語候補を語の異なり別に
集計した理想訳逆引訳語候補異なり語リストを作成する
手段と、入力単語機械訳逆引訳語候補異なり語リスト中
の語と理想訳逆引訳語候補異なり語リスト中の語を比較
する手段を含む。
【0033】また、本発明の対訳表現組抽出手段5は、
第1の自然言語の語同士、第2の自然言語の語同士を比
較する際に、両方の語が一致するか、一方の語が他方の
語を含んでいるか、両方の語の一部が一致するかによ
り、対応の度合を区別する手段を含む。また、本発明の
対訳表現組抽出手段5は、理想訳文を形態素解析し、理
想訳形態素構造を抽出する際に、理想訳形態素構造の情
報を利用して、機械訳逆引訳語候補、理想訳逆引訳語候
補、理想訳異なり語リスト中の語の少なくとも1つと、
機械訳異なり語リスト中の語、機械訳逆引訳語候補異な
り語リスト中の語、理想訳逆引訳語候補異なり語リスト
中の語の少なくとも1つを比較する手段を含む。
【0034】また、本発明の対訳表現組抽出手段5によ
って抽出される対訳表現組集合から、入力文と理想訳文
と機械訳文の1組から抽出できる対訳表現組の組み合わ
せである対訳表現組み合わせの集合を抽出する対訳表現
組み合わせ抽出手段を更に有する。また、本発明は、対
訳表現組抽出手段5によって、抽出される対訳表現組集
合の個々の対訳表現組に、個々の対訳表現組の抽出過程
に応じた確度である対訳表現組確度を付与する対訳表現
組確度付与手段を更に有し、対訳表現組み合わせ抽出手
段は、対訳表現集合中の個々の対訳表現組に付与された
対訳表現組確度を利用して、個々の対訳表現組み合わせ
に確度を付与する手段を有し、辞書・ルール追加変更手
段6は、対訳表現組み合わせ抽出手段によって、抽出さ
れる対訳表現組み合わせ集合中の個々の対訳表現組み合
わせに付与された確度を利用して辞書4やルール3を追
加変更する手段を有する。
【0035】また、本発明は、機械翻訳システム用辞書
・ルール学習システムによって得られる辞書4やルール
3を用いて該学習方法を繰り返す繰り返し手段を有す
る。また、本発明の辞書・ルール変更手段は、学習終了
を判定する学習終了判定手段を含む。また、本発明は、
機械翻訳システム用辞書・ルール学習方法によって得ら
れる辞書4やルール3を用いて該入力文を翻訳した結果
の履歴である機械訳文履歴格納手段に記録する機械訳翻
訳履歴保持手段を有し、学習終了判定手段は、機械訳文
履歴格納手段の記録内容が定常状態になったときに、学
習が終了すると判定する手段を含む。
【0036】また、本発明は、辞書・ルール追加変更手
段6は、辞書4または、ルール3を変更する情報を表示
する表示手段を含む。本発明は、原言語である第1の自
然言語の入力文を目的言語である第2の自然言語の文に
変換する機械翻訳システムで利用する辞書4やルール3
を追加や変更する機械翻訳システム用辞書・ルール学習
プログラムを格納した記憶媒体であって、入力文と対訳
関係にある第2の自然言語の理想訳文を入力させる理想
訳文入力プロセスと、理想訳文入力プロセスにより、入
力された入力文を機械翻訳システムで変換した第2の自
然言語の機械訳文と、該入力文とを比較する比較プロセ
スと、比較プロセスにより、該入力文中の入力単語と対
訳関係にある該機械訳語及び理想訳文中の理想訳語の3
組の集合を抽出することにより、辞書4やルール3の何
れかまたは、両方を追加変更する更新プロセスとを有す
る。
【0037】上記のように、本発明の機械翻訳システム
用辞書・ルール学習方法においては、対訳文読み込みス
テップは、互いに対訳関係にある第1の自然言語(入力
文)と第2の自然言語(理想文)を読み込む。これから
以下のステップによって機械翻訳システム用辞書やルー
ルが自動的に新規作成及び追加修正される。対訳表現組
抽出ステップは、入力文と理想訳文を比較して、入力文
中の入力単語と、入力単語と対訳関係にある機械訳文中
の機械訳語及び理想訳文中の理想訳語の3組である対訳
表現組の集合である対訳表現組集合を抽出する。辞書・
ルール追加ステップは、対訳表現組抽出ステップで抽出
された対訳表現組集合を基に辞書やルールを追加変更す
る。これにより、入力文と理想訳文から機械翻訳システ
ム用辞書やルールが自動的に作成または追加変更でき
る。
【0038】また、対訳表現組抽出ステップは、入力文
を機械翻訳システムで機械訳文に変換する際の変換履歴
を用いて、入力文中の入力単語と対訳関係にある機械訳
文中の機械訳語を抽出する対訳機械訳語対抽出ステップ
を設けることができる。これにより、入力文中の入力単
語と対訳関係にある機械訳文中の機械訳語を正確に対応
付けすることができ、入力文中の入力単語と対訳関係に
ある機械訳文中の機械訳語の組を抽出できる。
【0039】また、対訳表現組抽出ステップに、入力文
中の入力単語と、対訳関係にある理想訳文中の理想訳語
を抽出する対訳理想訳語対抽出ステップを設けることが
できる。これにより、機械翻訳システム用辞書やルール
を作成、または、追加変更するための基となる対の組を
抽出できる。また、対訳理想訳語対抽出ステップに、第
1の自然言語と第2の自然言語の対訳辞書を利用して、
入力文中の入力単語をキーに対訳辞書を検索し、入力単
語と対訳関係にある第2の自然言語の入力単語訳語候補
を抽出する入力単語訳語候補抽出ステップを設けること
ができる。これにより、入力単語候補と理想訳語を対訳
辞書に基づき比較することができ、一致した入力単語訳
語候補の元となる入力単語と、対訳関係にある理想訳語
の対を、より正確に、より多く抽出することができる。
【0040】また、入力単語訳語候補抽出ステップで抽
出される入力単語訳語候補をキーに、第2の自然言語の
辞書を検索して抽出される入力単語訳語候補関連語と理
想訳語を比較することができる。これにより、より多く
の対訳関係にある入力文中の入力単語と理想訳文中の理
想訳語の対の組を抽出することができる。また、対訳表
現組抽出ステップに、対応関係にある機械訳文中の機械
訳語と理想訳文中の理想訳語を抽出する対応機械訳語理
想訳語対抽出ステップを設けることができる。これによ
り、対応関係にある機械訳文中の機械訳語と、理想訳文
中の理想訳語の組の情報を活用して、辞書やルールを追
加変更するかどうかを決めることができる。
【0041】また、対応機械訳語理想訳語対抽出ステッ
プにおいて、第2の自然言語の辞書を利用することがで
き、機械訳文中の機械訳語をキーに第2の自然言語の辞
書を検索して抽出される機械訳語関連語と理想訳語を比
較することや、理想訳文中の理想訳語をキーに第2の自
然言語の辞書を検索して抽出される理想訳語関連語と機
械訳語を比較することができる。これにより、より多く
の対応関係にある機械訳文中の機械訳語と理想訳文中の
理想訳語の対の組を抽出することができる。
【0042】また、対応機械訳語理想訳語対抽出ステッ
プにおいて、第1の自然言語と第2の自然言語の対訳辞
書を利用して、機械訳文中の機械訳語をキーに得られる
第1の自然言語の訳語の集合である機械訳逆引訳語候補
と、理想訳文中の理想訳語をキーにして得られる第1の
自然言語の訳語の集合である理想訳逆引訳語候補を抽出
し、機械訳逆引訳語候補を比較することができる。これ
により、対応関係にある機械訳文中の機械訳語と理想訳
文中の理想訳語をより多く抽出することができる。
【0043】また、対訳表現組抽出ステップにおいて、
第2の自然言語の語同士を比較する際に、機械訳文中の
機械訳語及び/又は入力単語訳語候補及び/または、入
力単語訳語候補関連語及び/又は機械訳語関連語を語の
異なり別に集計した機械訳異なり語リストを作成し、理
想訳文中の理想訳語及び/又は、理想訳関連語を語の異
なり別に集計した理想訳異なり語リストを作成し、機械
訳異なり語リスト中の語と理想訳異なり語リスト中の語
を比較することができる。これにより、繰り返し同じ訳
語同士の比較することが避けられる。
【0044】また、対訳表現組抽出ステップにおいて、
第1の自然言語の語同士を比較する際に、入力単語及び
/又は機械訳逆引訳語候補を語の異なり別に集計した入
力単語機械訳逆引訳語候補異なり語リストを作成し、理
想訳逆引訳語候補を語の異なり別に集計した理想訳逆引
訳語候補異なり語リストを作成し、入力単語機械訳逆引
訳語候補異なり語リスト中の語と理想訳逆引訳語候補異
なり語リスト中の語を比較することができる。これによ
り、繰り返し同じ訳語同士の比較をすることが避けられ
る。
【0045】また、対訳表現組抽出ステップにおいて、
第1の自然言語の語同士及び/又は、第2の自然言語の
語同士を比較する際に、両者の語が一致するか、一方の
語が他方の語を含んでいるか、両方の語の一部が一致す
るかにより対応の度合を区別することができる。これに
より、より多くの対訳表現組を抽出することができる。
【0046】また、対訳表現組抽出ステップに、理想訳
文を形態素解析し、理想訳形態素構造を抽出する理想訳
文形態素解析ステップを設けることができる。これによ
り、理想訳形態素構造の情報を利用して機械訳逆引訳語
候補と理想訳逆引語候補及び/又は、理想訳異なり語リ
ストの語の機械訳異なり語リスト中の語及び/又は機械
訳逆引訳語候補異なり語リスト中の語と理想訳逆引訳語
候補異なり語リスト中の語を比較することができる。こ
れにより、より正確な対訳表現組を抽出できる。
【0047】また、対訳表現組抽出ステップによって抽
出される対訳表現組集合から、入力文と理想訳文と機械
訳文の1組から抽出できる対訳表現組の組合せである対
訳表現組合せ集合を抽出する対訳表現組合せ抽出ステッ
プを設けることができる。これにより、入力文と理想訳
文と機械訳文の1組から抽出され得る対訳表現組の組合
せを抽出することができる。
【0048】また、対訳表現組抽出ステップに、個々の
対訳表現組の抽出過程に応じた確度である対訳表現組確
度を付与する対訳表現組確度付与ステップを設けること
ができ、対訳表現組合せ抽出ステップにおいて、対訳表
現組集合中の個々の対訳表現組に付与された対訳表現組
確度を利用して個々の対訳表現組合せに確度を付与し、
辞書・ルール追加変更ステップにおいて、対訳表現組合
せ抽出ステップによって抽出される対訳表現組合せ集合
中の個々の該対訳表現組合せに付与された確度を利用し
て辞書やルールを追加変更することができる。これによ
り、対訳表現組合せ集合中、確度が高い対訳表現組合せ
を利用して、より正確で効率的に機械翻訳システム用辞
書やルールを作成または、追加変更することができる。
【0049】本発明の機械翻訳システム用辞書・ルール
学習方法によって得られる辞書やルールを用いて機械翻
訳システム用辞書・ルール学習方法を繰り返すことがで
きる。これにより、作成または、追加変更された辞書や
ルールの検証ができ、さらに、1回の学習過程では得ら
れなかった対訳表現対やルールを抽出することも可能と
なる。
【0050】学習終了判定ステップは、本機械翻訳シス
テム用辞書・ルール学習方法によって、得られる辞書や
ルールを用いて入力文を翻訳した結果の履歴である機械
訳文履歴格納部へ記録し、学習終了判定ステップにより
得られた機械訳文履歴格納部の記録内容が定常状態にな
ったときに学習を終了することができる。これにより、
最適な辞書やルールが登録される。
【0051】また、辞書・ルール追加変更ステップに、
辞書または、ルールを変更する情報を表示する機能を持
たせることができる。これにより、ユーザが辞書やルー
ルの変更を確認することができ、より正確な辞書やルー
ルを作成することが可能となる。従って、上記ステップ
を全て実行する、及び上記手段を用いることにより、機
械翻訳システム用辞書やルールが自動的に作成または、
追加変更され、機械翻訳システム用辞書やルールの学習
が可能となる。
【0052】上記は、機械翻訳システム用辞書・ルール
学習方法について述べているが、機械翻訳システム用辞
書・ルール学習装置及び機械翻訳システム用辞書・ルー
ル学習プログラムを格納した記憶媒体についても同様で
ある。
【0053】
【発明の実施の形態】以下に、本発明の一実施例につい
て図面により説明する。本実施例では、第1の自然言語
が日本語、第2の自然言語が英語であるとする。図3
は、本発明の一実施例の機械翻訳用辞書・ルール学習シ
ステムの基本ブロック図である。同図に示す機械翻訳用
辞書・ルール学習システムは、対訳文読み込み部1、機
械翻訳システム部2、ルール3、辞書4、対訳表現組抽
出部5、対訳表現組み合わせ抽出部6、辞書・ルール追
加変更部7より構成される。
【0054】対訳文読み込み部1は、対訳関係にある第
1の自然言語の文(入力文)と第2の自然言語の文(理
想訳文)の対(対訳文)を入力する。機械翻訳システム
部2は、入力された第1の自然言語の文をルール3や辞
書4を用いて第2の自然言語の機械訳文に翻訳する。対
訳表現組抽出部5は、対訳機械訳語抽出部51、対訳理
想訳語抽出部52、対応機械訳語理想訳語対抽出部53
より構成され、機械翻訳システム部2で得られた機械訳
文と対訳文から得られた入力文と理想訳文から対応する
表現組である入力語、機械訳語、理想訳語の組を抽出す
る。
【0055】対訳機械訳語抽出部51は、機械翻訳シス
テム部2で機械訳文に変換する際の変換履歴を用いて入
力単語と対訳関係にある機械訳語を抽出する。対訳理想
訳語抽出部52は、例えば、第1の自然言語と第2の自
然言語の対訳辞書を利用して、入力単語をキーに対訳辞
書を検索し、入力単語と対訳関係になる理想訳語を抽出
する。
【0056】対応機械訳語理想訳語対抽出部53は、例
えば、第2の自然言語の辞書を利用して機械訳語関連語
や理想訳語関連語を検索したり、また、機械訳語をキー
に得られる第1の自然言語の訳語の集合である機械訳逆
引訳語候補と理想訳語をキーに得られる第1の自然言語
の訳語の集合である理想訳逆引訳語候補を検索したりす
る等で、対応関係にある機械訳語と理想訳語を抽出す
る。
【0057】対訳表現組み合わせ抽出部6は、対訳表現
確度付与部61、対訳表現組み合わせ作成部62より構
成され、対訳表現組抽出部5で得られた入力単語、機械
訳語、理想訳語の組の集合から、対訳文中で矛盾のない
対応関係からなる入力単語、機械訳語、理想訳語の組の
組み合わせを全て抽出する。対訳表現組確度付与部61
は、個々の対訳表現組に個々の対訳表現組の抽出過程に
応じた確度である対訳表現組確度を付与する。
【0058】対訳表現組み合わせ作成部62は、対訳文
中で矛盾のない対応関係からなる入力単語、機械訳語、
理想訳語の組の組み合わせを全て作成し、対訳表現組確
度付与部61の結果を元に対訳表現組の組み合わせ毎に
確度を付与する。辞書・ルール追加変更部7は、対訳表
現組み合わせ抽出部6で得られた対訳表現組を基に辞書
やルールを追加変更する。
【0059】図4は、本発明の一実施例の追加変更され
る辞書やルールを用いた機械翻訳システムの基本ブロッ
ク構成の例を示す。同図に示す機械翻訳システムは、機
械翻訳システム部2、機械翻訳システム部2で用いられ
るルール3、機械翻訳システム部2で用いられる辞書
4、翻訳する第1の自然言語文を入力する第1自然言語
入力部8及び、機械翻訳システム部2により翻訳された
第2の自然言語を出力する第2自然言語出力部9より構
成される。
【0060】機械翻訳システム部2は、第1の自然言語
文を第1の自然言語の概念構造に変換する第1自然言語
解析部21、第1言語解析部21で生成された第1の自
然言語の概念構造を第2の自然言語の概念構造に変換す
る言語変換部22、言語変換部22で生成された第2の
自然言語の概念構造を基に第2の自然言語文を生成する
第2言語生成部23より構成される。
【0061】ルール3は、第1言語解析部21で用いる
第1言語解析ルール31、言語変換部22で用いる言語
変換ルール32、第2言語生成部23で用いる第2言語
生成ルール33より構成される。辞書4は、第1言語解
析部21で用いる第1言語解析辞書41、言語変換部2
2で用いる言語変換辞書42、第2言語生成部23で用
いる第2言語生成辞書43より構成される。
【0062】図5は、本発明の一実施例の言語変換辞書
のエントリの例を示す。言語変換辞書42として、例え
ば、名詞変換辞書があり、その名詞変換辞書には、第1
の自然言語である日本語の各名詞に対する第2の自然言
語である英語がそれぞれ記入され、1つの名詞に対して
複数の訳語がある場合には、使うべき訳語の優先順位を
示す優先度やその訳語の使われ方を示す名詞句からなる
選択条件等が記入されている。例えば、「地形図」に対
しては、“topographic chart ”の訳語が、また、「会
社」に対しては、“company ”、“office”の訳語がこ
の順番の優先順位で付与されている。
【0063】図6は、本発明の一実施例の言語変換ルー
ルのエントリの例を示す。言語変換ルール32は、例え
ば、動詞変換ルールがあり、その動詞変換ルールには、
日本語の各動詞だけではなく、動詞の助詞がパターンと
して付けられており、つまり、例えば、動詞「書く」に
ついては、(「S」(主語、名詞)「が」(助詞)「O
1」(目的語、名詞)「を」(助詞))という助詞パタ
ーンが記入されており、動詞をその動詞を含めてキーと
して動詞の訳語を検索するように記入されている。さら
に、動詞の各要素の意味を示す選択条件が記されてい
る。例えば、動詞「書く」については、「O1」には意
味制約はないが、「S」が主体をもつ時に“S write
O1”を適用する制約があることを示している。
【0064】次に、図3の基本ブロック構成の機械翻訳
用辞書・ルール学習システムの処理手順について説明す
る。ここでは、図7に示す対訳文を例として説明する。
まず、対訳文読み込み部1は、対訳関係にある第1の自
然言語の文と第2の自然言語の文の対(対訳文)を入力
する。この対訳文は、機械翻訳用辞書・ルールの自動学
習のために用いるものである。この辞書・ルールの学習
用に対訳文の集合(対訳文章)を選択することによっ
て、学習させた対訳文章と類似の言語現象が頻出する同
様の分野文章向きに、機械翻訳システムをチューンする
ことが可能となる。図7の例では、第1の自然言語であ
る日本語の文(入力日本文) 「彼は地形図を会社で書く。」 に対して対訳関係にある第2の自然言語である英語の文
(理想英訳文) “He draw a topographical map in a office.” が対訳文として入力される。
【0065】入力された対訳文のうち、第1の自然言語
文である入力日本文は、ルール3や辞書4を用いた機械
翻訳システム部2によって第2の自然言語文である機械
英訳文に翻訳される。この機械翻訳の処理の手順を図4
の基本ブロック構成の機械翻訳システムを用いて説明す
る。まず、第1の自然言語文である入力日本語文は、第
1の言語解析ルール31や第1の言語解析辞書41を用
いた第1言語解析部21により解析され、日本語の概念
構造を生成する。生成された日本語の概念構造は、例え
ば、図5に示す名詞変換辞書のような言語変換辞書42
や、例えば、図6に示す動詞変換ルールのような言語変
換ルール32を用いて言語変換部22によって変換さ
れ、英語の概念構造を生成する。生成された英語の概念
構造は、第2言語生成ルール33や第2言語生成辞書4
3によって、機械英訳文を生成する。生成された英文は
第2自然言語出力部9によって出力される。なお、この
機械翻訳システムの各段階で参照・生成された概念構造
や辞書情報は、辞書・ルール自動学習処理で参照可能と
なるように情報を保存しておく。例えば、図5の言語変
換辞書42を検索した際に得られる個々の他訳語候補の
情報も保存しておく。
【0066】上記のような機械翻訳システムで、例とし
て図5で示した名詞変換辞書42、図6で示した動詞変
換ルール32を用いることによって、図7に示す入力日
本文として、 “He write a topographic chart in a company.” が訳出される。
【0067】次に、対訳表現組抽出部5について説明す
る。この対訳表現組抽出部5は、対訳文読み込み部1で
得られる入力文、理想訳文及び機械翻訳システム部2で
得られる機械訳文から対訳機械訳語抽出部51、対訳理
想訳語抽出部52、対応機械訳語理想訳語対抽出部53
によって、入力単語、入力単語と対訳関係にある機械訳
語、及び理想訳語の組を抽出する。
【0068】対訳機械訳語抽出部51は、機械翻訳シス
テム部2で参照・生成された概念構造や辞書情報を利用
することによって、入力単語、入力単語と対訳関係にあ
る機械訳語が抽出される。例えば、図7の入力日本文と
機械訳文に関しては、図5で示した名詞変換辞書42等
を参照することによって「彼」と“he”、「地形図」と
“topographic chart ”、「会社」と“company ”が抽
出される。また、図6で示した動詞変換ルール32等を
参照することによって「書く」と“write ”が抽出され
る。
【0069】対訳理想訳語抽出部52は、本発明の一実
施例である図8に示したフローチャートに基づいて説明
する。図8は、 本発明の一実施例の対訳理想訳語を抽
出する処理のフローチャートである。 ステップ5201) 対訳理想訳語抽出部52は、対訳
機械訳語抽出部51の結果から入力単語と機械訳語のペ
アを順に取り出す。図7の例では、まず「彼」と“he”
が取り出されるが、説明の都合上「会社と」“company
”が取り出されるところまで進んだとする。
【0070】ステップ5202) 次に、対訳文読み込
み部1の結果から入力文と対訳関係にある理想訳文中の
理想訳語を順に取り出す。図7の例では、まず“he”が
取り出されるが、説明の都合上“office”が取り出され
るところまで進んだとする。 ステップ5203) ステップ5201で取り出した入
力語をキーにして変換辞書を検索し、入力単語訳語候補
の集合を抽出する。上記の例では、入力単語「会社」を
キーにして変換辞書を検索すると、図5で示した名詞変
換辞書42より“company ”と“office”が抽出され
る。
【0071】ステップ5204) ステップ5203で
取り出した入力単語訳語候補の集合の中で、ステップ5
202で取り出された理想訳語と一致するもの、あるい
はどちらか一方の語が他方の語を含んでいるものがある
かどうかを判定する。判定の結果、理想訳語と一致する
もの、あるいはどちらか一方の語が他方の語を含んでい
るものがあれば(Yes)、ステップ5205に移行
し、なければ(No)、ステップ5206へ移行する。
上記の例では、入力単語訳語候補“office”と理想訳語
“office”は一致しているので、入力単語「会社」と理
想訳語“office”が対訳関係にあると判断され、この判
定はYesとなり、ステップ5205へ移行する。
【0072】ステップ5205) 対訳機械訳語抽出部
51の結果、及びステップ5204での一致具合を参照
して、入力単語、機械訳単語、理想訳単語及び対応の取
り方を出力する。上記の例では、図9に示す 「会社」、“company ”、“office”、「他訳語候補一
致」 が出力される。
【0073】ステップ5206) 現在の入力単語と機
械訳語のペアに対して、全ての理想訳語を検査したかど
うかを判定する。もしまだなら(No)、ステップ52
02へ移行し、全て検査済みなら(Yes)、5207
へ移行する。上記の例では、理想訳語の“office”は理
想訳文の最後の語なので、全て検査済みと判定され、ス
テップ5207へ移行する。
【0074】ステップ5207) 全ての入力単語と機
械訳語のペアを取り出して検査したかどうかを判定す
る。もしまだなら(No)、ステップ5201へ移行
し、全て検査済みなら(Yes)、この処理は終了す
る。上記の例では、最終的には図9に示す対訳表現組が
抽出される。対応機械訳語理想訳語抽出部53は、本発
明の一実施例である図8、及び図11に示したフローチ
ャートに基づいて説明する。
【0075】図10は、本発明の一実施例の対応機械訳
語理想訳語対を抽出する処理のフローチャート(その
1)である。 ステップ53101) 対応機械訳語理想訳語対抽出部
53は、対訳機械訳語抽部51の結果から入力単語と機
械訳語のペアを順に取り出す。図7の例では、まず
「彼」と“he”が取り出されるが、説明の都合上「地形
図」と、“topographic chart ”が取り出されるところ
まで進んだとする。
【0076】ステップ53102) 次に、対訳文読み
込み部1の結果から入力文と対訳関係にある理想訳文中
の理想訳語を順に取り出す。図7の例では、まず“he”
が取り出されるが、説明の都合上“topographical ”が
取り出されるところまで進んだとする。 ステップ53103) ステップ53101で取り出し
た入力語をキーにして変換辞書を検索し、入力単語訳語
候補の集合を抽出する。上記の例では、入力単語「地形
図」をキーにして変換辞書を検索すると、図5で示した
名詞変換辞書42より“topographic chart ”が抽出さ
れる。
【0077】ステップ53104) ステップ5310
1で取り出した機械訳語、ステップ53103で抽出さ
れた入力単語訳語候補、及びステップ53102で取り
出した理想訳語をキーに第2言語生成辞書43を検索し
て機械訳関連語の集合と理想訳関連語の集合を得る。上
記の例では、機械訳語が“topographic chart ”なの
で、各英単語“topographic ”と“chart ”にばらして
から英語辞書(言語変換辞書42)を検索し、理想訳語
は“topographic ”をキーに英語辞書(言語変換辞書4
2)を検索する。その結果“topographic ”と“topogr
aphical ”に関しては、例えば図11に示す結果とな
る。図11は、本発明の一実施例の第2言語生成エント
リの例を示す。
【0078】ステップ53105) ステップ5310
4で取り出した機械訳語関連語の集合と理想訳関連語の
集合の間で単語が一致するもの、あるいはどちらか一方
の語が他方の語を含んでいるものがあるかどうか検査す
る。一致するもの、あるいはどちらか一方の語が他方の
語を含んでいるものがある場合には(Yes)、ステッ
プ53106へ移行し、そうでなければ(No)、ステ
ップ53107へ移行する。上記の例では、図11より
名詞形が“topography”で一致、または副詞形が“topo
graphically ”で一致しているので、機械訳語“topogr
aphic ”と理想訳語“topographical ”が対応している
と判断され、この判定はYESとなり、ステップ531
06へ移行する。
【0079】ステップ53106) 対訳機械訳語抽出
部51の結果、及びステップ53105での一致具合を
参照して、入力単語、機械訳単語、理想訳単語及び対応
の取り方を出力する。上記の例では、「地形図」、“to
pographic chart ”、“topographical ”、「関連語一
致」が出力され、対訳理想訳語抽出部52の結果に追加
されて図12に示すようになる。図12は、本発明の一
実施例の図10の結果得られる対訳表現組と対応の取れ
方を示す。
【0080】ステップ53107) 現在の入力単語と
機械訳語のペアに対して、全ての理想訳語を検査したか
どうかを判定する。もしまだなら(No)、ステップ5
3101へ移行し、全て検査済みなら(Yes)、ステ
ップ53108へ移行する。上記の例では、理想訳語の
“topographical ”の次の語は“map ”なので、判定
(No)となり、ステップ53102へ移行する。
【0081】ステップ53108) 全ての入力単語と
機械訳語のペアを取り出して検査したかどうかを判定す
る。もしまだなら(No)、ステップ53101へ移行
し、全て検査済みなら(Yes)、この処理は終了す
る。上記の例では、最終的には図12に示す対訳表現組
が抽出される。次に、本発明の一実施例である図13に
示したフローチャートに基づいて、対応機械訳語理想訳
語抽出部53を説明する。
【0082】ステップ53201)対応機械訳語理想訳
語対抽出部53は、対訳機械訳語抽出部51の結果から
入力単語と機械訳語のペアを順に取り出す。図7の例で
は、まず「彼」と“he”が取り出されるが、説明の都合
上「地形図」と“topographic chart ”が取り出される
ことろまで進んだとする。 ステップ53202)次に、対訳文読み込み部1の結果
から入力文と対訳関係にある理想訳文中の理想訳語を順
に取り出す。図7の例では、先ず“he”が取り出される
が、説明の都合上“map ”が取り出されるところまで進
んだとする。
【0083】ステップ53203)ステップ53201
で取り出した機械訳語とステップ53202で取り出し
た理想訳語をキーに変換辞書(言語変換辞書42)を逆
引きして機械訳逆引訳語候補の集合と理想訳逆引訳語候
補の集合を得る。上記の例では、機械訳語“topographi
c chart ”とばらした英単語“topographic ”及び“ch
art ”、さらに理想訳語“map ”をキーにして変換辞書
(言語変換辞書42)を逆に引いて検索する。その結
果、例えば、“chart ”と“map ”に関して図14のよ
うに、逆引訳語候補が得られる。
【0084】ステップ53204)ステップ53203
で取り出した機械訳逆引訳語候補の集合と理想訳引訳語
候補の集合の間で単語が一致するもの、あるいはどちら
か一方の語が他方の語を含んでいるものがあるかどうか
検査する。一致するもの、あるいはどちらか一方の語が
他方の語を含んでいるものがある場合には(Yes)、
ステップ53205へ移行し、そうでなければ(N
o)、ステップ53206へ移行する。上記の例では、
図14より機械訳語逆引訳語候補である「図」が理想訳
語逆引訳語候補である「地図」や「絵図」に含まれてい
るので、“chart ”と“map ”が対応すると判断され、
この判定はYesとなり、ステップ53205へ移行す
る。
【0085】ステップ53205) 対訳機械訳語抽出
部51の結果、及びステップ53204での一致具合を
参照して、入力単語、機械訳単語、理想訳単語及び対応
の取れ方を出力する。上記の例では、 「地形図」、"topographic chart" 、"map" 、「逆引き
訳語部分一致」 が出力され、対訳理想訳語抽出部52及び図10で示す
対応機械訳語理想訳語対抽出処理の結果に追加されて、
図15に示すようになる。図15は、本発明の一実施例
の図13の結果得られる対訳表現組と対応の取れ方を示
す図である。
【0086】ステップ53206) 現在の入力単語と
機械訳語のペアに対して全ての理想訳語を検索したどう
かを判定する。もし、まだなら(No)、ステップ53
202へ移行し、全て検査済なら(Yes)、ステップ
53207へ移行する。上記の例では、理想訳語"map"
の次の語"in"なので、判定は(No)となり、ステップ
53202へ移行する。
【0087】ステップ53207) 全ての入力単語と
機械訳語のペアを取り出して検査したかどうかを判定す
る。もしまだなら(No)、ステップ53201へ移行
し、全て検査済なら(Yes)、この処理は終了する。
上記の例では、最終的には、図15に示す対訳表現組が
抽出される。次に、対訳表現組合せ抽出部6について説
明する。この対訳表現組合せ抽出部6は、対訳表現組抽
出部5の結果から対訳表現組確度付与部61によって、
個々の対訳表現組に個々の対訳表現組の抽出過程に応じ
た確度を付与し、対訳表現組合せ作成部62によって、
対訳文の中で矛盾のない対応関係からなる入力単語、機
械訳語の組合せを全て作成し、その組合せ毎の確度を対
訳表現組確度付与部61の結果を元に付与する。
【0088】上記の例では、図15に示す最終的に得ら
れた各対訳表現組の対応の取れ方を参照して確度を付与
する。例えば、他訳語候補一致は6点、関連語一致は5
点、逆引き訳語候補一致は4点、他訳語候補部分一致は
3点、関連語部分一致が2点、逆引き訳語部分一致は1
点というような確度を付与する。また、図15からでき
る可能な組合せは1通り、つまり「地形図」、"topogra
phical chart" と「会社」、"company" 、"office"の組
のみ作成される。
【0089】次に、辞書・ルール追加変更部7について
説明する。この辞書・ルール追加変更部7は、対訳表現
組合せ抽出部6の結果を元に、対訳表現組合せ集合中、
最も確度が高い対訳表現組合せを利用して、機械翻訳シ
ステム用辞書4やルール3を作成又は、追加変更する。
上記の例では、対訳表現組合せ抽出部6の結果が1通り
であるので、入力単語「地形図」と対訳関係にあるの
は、"topographical map" で、入力単語「会社」と対訳
関係にあるのは、"office"と決定される。この結果「地
形図」の訳語として、"topographical map" が優先順位
1として追加され、「会社」の訳語として"office"の優
先順位を1に変更し、図16に示す名詞変換辞書42
(言語変換辞書)となる。
【0090】なお、対訳表現組抽出部5に、第2の自然
言語の語同士を比較する、及び/または、第1の自然言
語の語同士を比較する際に、比較対象とする語を異なり
別に集計して比較し、対訳表現組を抽出する方法を加え
ることも考えられる。また、対訳表現組抽出部5に、理
想訳文を形態素解析し、理想訳形態素構造の情報を利用
して、より正確な対訳表現組を抽出する方法も考えられ
る。
【0091】上記のようにして、図3の基本ブロック構
成の機械翻訳用辞書・ルール自動学習システムの1回の
処理は終了となる。しかし、学習した結果を用いて対応
が取れるものがあるかもしれないことや、追加変更した
辞書4やルール3が翻訳対象文全てを考慮すると、翻訳
の質が追加変更する前に比べて悪くなる可能性もある。
上記の例では、1回の学習処理では、機械訳語である"w
rite" と理想訳語である"draw"の対応が取れていない。
そこで、学習終了条件を設定して、終了条件が満たされ
るまで、図3の機械翻訳用辞書・ルール自動学習処理を
繰り返す必要がある。
【0092】この繰り返しの処理を、図17に示す本発
明の一実施例のフローチャートに基づいて説明する。 ステップ1001) 対訳文読み込み部1によって順に
対訳文を読み込む。 ステップ1002) 機械翻訳システム部2によって翻
訳し、その結果を保存する。
【0093】ステップ1003) 対訳表現組抽出部5
によって対訳表現組を抽出する。 ステップ1004) 対訳表現組合せ抽出部6によって
対訳表現組毎に確度を付与し、1つの文の中で可能な対
訳表現組の組合せを全て作成する。 ステップ1005) 辞書・ルール変更部7によって、
ステップ1004の結果の中で最も確度が高い組合せを
保存する。
【0094】ステップ1006) 翻訳対象文中の全て
の対訳文を読み込んだかどうかを判定する。もし、まだ
なら(No)、ステップ1001へ移行し、全て読み込
んでいるなら(Yes)、ステップ1007に移行す
る。図7の例では、1文しかないので、ステップ100
7に移行する。 ステップ1007) 辞書・ルール追加変更部7によっ
て、全ての文の対訳表現組を考慮して辞書4やルール3
を追加変更する。図7の例では、図16に示す名詞変換
辞書42(言語変換辞書)が作成される。
【0095】ステップ1008) ステップ1007で
追加変更された辞書4やルール3を用いて再度翻訳す
る。上記の例では、図16に示す名詞変換辞書42を用
いて再度翻訳すると、図18に示す機械翻訳文 "He write a topographical map in a office" が得られる。
【0096】ステップ1009) 保存されている機械
翻訳結果と比較して変化があるかどうかを検査し、変化
があれば(Yes)、ステップ1001に移行し、変化
がなければ(No)、この学習処理は終了する。上記の
例では、保存されている機械翻訳結果と比較すると変化
があるので、ここの判定はYesとなり、ステップ10
01に移行する。
【0097】上記の例では、2回目のステップ1003
で、例えば、対応の取れない語が機械訳文の中に1語
で、かつ理想訳文の中にも1語であるならば、対応関係
があるとみなすことを対訳表現組抽出部5の処理に入れ
ると、図19に示すように、入力単語「書く」、機械訳
語の"write" 、理想訳語の"draw"が対訳表現組として、
また、対応の取れ方は残りものを一致として抽出され
る。これにより、ステップ1007では、「書く」の訳
語として"draw"が図6に示す動詞変換ルール32(言語
変換ルール)に追加され、図20に示す動詞変換ルール
32となる。但し、変換条件は、例えば、機械翻訳シス
テム部2で保存してある概念構造等を参照して、機械訳
語と理想訳語の対応関係から生成する。上記の例では、
選択条件は「S」に対応しているのは、"he"で「主体」
となり、「O1」に対応しているのは、"toporographic
al map" で、「地形図」となる。
【0098】上記のように、本発明は、第1の自然言語
である入力文、入力文を機械翻訳システムで翻訳した第
2の自然言語である機械訳文、入力文と対訳関係にある
第2の自然言語である理想訳文から対応関係にある、入
力語、機械訳語、理想訳語を抽出して、その結果から機
械翻訳用の辞書4やルール3を追加変更できる。従っ
て、機械翻訳システムにおいて、第1の自然言語文が入
力されて翻訳される場合に、上記のようにして追加変更
された辞書4やルール3を用いることにより、理想訳に
近似する第2の自然言語文を出力することが可能とな
る。
【0099】また、追加変更された辞書4または、ルー
ル3を用いて、第1自然言語文を機械翻訳システムで翻
訳し、その前の翻訳結果と比較して変化がなくなった時
に、この学習を終了することによって、辞書4やルール
3が最適な状態で登録される。なお、辞書・ルール追加
変更部7にも表示機能を持たせ、追加屁項する辞書4や
ルール3の内容をユーザに提示することにより、ユーザ
が確認した上で辞書4やルール3を更新することも可能
である。
【0100】なお、上記の実施例では、図3及び図4に
示す構成に基づいて説明したが、この例に限定されるこ
となく、図3及び図4に記載されている対訳文読み込み
部1、対訳表現組抽出部5、対訳表現組み合わせ抽出部
6及び辞書・ルール追加変更部7をプログラムとして構
築し、フロッピーディスクやCD−ROM等の可搬媒体
に格納する、または、ディスク装置等の媒体に格納し、
各プログラムを起動して機械翻訳システム部2から出力
された情報を処理することにより、ルールや辞書を追加
変更するようにすることも可能である。
【0101】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0102】
【発明の効果】本発明によれば、互いに対訳関係にある
第1の自然言語の文(入力文)と第2の自然言語の文
(理想訳文)を読み込ませることにより、機械翻訳シス
テム用辞書・ルールを自動的に追加変更することが可能
となる。これは、機械翻訳システムが翻訳する際に生成
した概念構造等の情報や機械翻訳システムが使用してい
る辞書の情報を参照することによって、対訳関係にある
入力語、機械訳語、理想訳語の組を抽出し、その結果か
ら機械翻訳用の辞書やルールを追加変更する。これによ
り、機械翻訳システムの辞書やルールを翻訳対象分野向
きにチューンすることができる。
【0103】また、辞書・ルール追加変更ステップに表
示機能を持たせ、追加変更する辞書やルールの内容をユ
ーザに提示することが可能である。これにより、ユーザ
が確認した上で辞書やルールを更新することも可能であ
る。上記辞書・ルール追加変更ステップにより得られた
辞書やルールを用いて、辞書・ルール学習方法を繰り返
すことによって、登録された辞書やルールの検証がで
き、さらに1回の学習過程では得られなかった辞書やル
ールを抽出することができる。
【0104】学習終了判定ステップは、学習を終了する
かどうかを自動的に判定する。これによって、学習結果
を人が見ずに、自動的に学習が終了する。機械翻訳結果
は、自動的に保存される。これによって、機械訳文が定
常状態になったときに学習が自動的に終了し、最適な辞
書やルールが登録される。従って、上記ステップを全て
実行することにより、機械翻訳システム用辞書やルール
が自動的に翻訳対象分野にチューンされ、機械翻訳シス
テム用辞書、ルールの学習が可能となる。
【0105】上述のように、本発明によれば、対訳コー
パスの情報だけを利用するのではなく、機械翻訳システ
ムが参照・生成した情報を利用することによって、辞書
やルールが追加変更され、追加変更された辞書やルール
を用いて最適なルールが登録されるまで繰り返すことに
より、対訳コーパスから得られるその翻訳対象分野用の
機械翻訳システムの辞書やルールを抽出することができ
る。
【0106】このようにして登録された辞書やルールを
用いることにより、機械翻訳システムでは、理想訳に近
い翻訳文を生成でき、また、翻訳対象文が違っていても
学習に用いた対訳コーパスと同じ分野の第1の自然言語
文を入力すれば、より理想訳に近い翻訳文を生成するこ
とが可能となる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施例の機械翻訳用辞書・ルール自
動学習システムの基本ブロック構成図である。
【図4】本発明の一実施例の追加変更される辞書やルー
ルを用いた機械翻訳システムの基本ブロック図である。
【図5】本発明の一実施例の言語変換辞書のエントリの
例を示す図である。
【図6】本発明の一実施例の言語変換ルールのエントリ
の例を示す図である。
【図7】本発明の一実施例の対訳文の例を示す図であ
る。
【図8】本発明の一実施例の対訳理想訳語を抽出する処
理のフローチャートである。
【図9】本発明の一実施例の図8の結果得られる対訳表
現組と対応の取れ方を示す図である。
【図10】本発明の一実施例の対応機械訳語理想訳語対
を抽出する処理のフローチャート(その1)である。
【図11】本発明の一実施例の第二言語生成辞書のエン
トリの例を示す図である。
【図12】本発明の一実施例の図10の結果得られる対
訳表現組と対応の取れ方を示す図である。
【図13】本発明の一実施例の対応機械訳語対を抽出す
る処理のフローチャート(その2)である。
【図14】本発明の一実施例の言語変換辞書を第2の自
然言語をキーに逆引きした時のエントリの例を示す図で
ある。
【図15】本発明の一実施例の図13の結果得られる対
訳表現組と対応の取れ方を示す図である。
【図16】本発明の一実施例の図5の名詞変換辞書のエ
ントリから辞書の追加変更処理を行った結果得られる名
詞変換辞書の例を示す図である。
【図17】本発明の一実施例の学習を繰り返し行う処理
のフローチャートである。
【図18】本発明の一実施例の学習を繰り返し行う処理
のフローチャートである。
【図19】本発明の一実施例の図17において2回目の
学習処理を行った結果得られる対訳表現組と対応の取れ
方を示す図である。
【図20】本発明の一実施例の図6の動詞変換ルールの
エントリからルールの追加変更処理を行った結果得られ
る動詞変換ルールの例を示す図である。
【符号の説明】
1 対訳文読み込み部、対訳文読み込み手段 2 機械翻訳システム部 3 ルール 4 辞書 5 対訳表現組抽出部,対訳表現組抽出手段 6 対応表現組合せ抽出部 7 辞書・ルール追加変更部辞書・ルール追加変更手段 8 第1自然言語入力部 9 第2自然言語出力部 21 第1言語解析部 22 言語変換部 23 第2言語生成部 31 第1言語解析ルール 32 言語変換ルール 33 第2言語生成ルール 41 第1言語解析辞書 42 言語変換辞書 43 第2言語生成辞書 51 対訳機械訳語抽出部 52 対訳理想訳語抽出部 53 対訳機械訳語理想訳語対抽出部 61 対訳表現組確度付与部 62 対訳表現組合せ作成部

Claims (43)

    【特許請求の範囲】
  1. 【請求項1】 原言語である第1の自然言語の入力文を
    目的言語である第2の自然言語の文に変換する機械翻訳
    システムで利用する辞書やルールを追加及び/又は、変
    更する機械翻訳システム用辞書・ルール学習方法におい
    て、 前記入力文と対訳関係にある第2の自然言語の理想訳文
    を入力し、 入力された前記入力文を前記機械翻訳システムで変換し
    た前記第2の自然言語の機械訳文と、該入力文とを比較
    して、該入力文中の入力単語と対訳関係にある該機械訳
    語及び理想訳文中の理想訳語の3組の集合を抽出するこ
    とにより、前記辞書や前記ルールの何れかまたは、両方
    を追加変更することを特徴とする機械翻訳システム用辞
    書・ルール学習方法。
  2. 【請求項2】 互いに対訳関係にある前記入力文と、前
    記第2の自然言語の理想訳文を読み込む対訳文読み込み
    ステップと、 前記入力文と前記理想訳文と前記機械訳文を比較して、
    該入力文中の入力単語と該入力単語と対訳関係にある該
    機械訳文中の機械訳語及び該理想訳文中の理想訳語の3
    組である対訳表現組の集合である対訳表現集合を抽出す
    る対訳表現組抽出ステップと、 前記対訳表現抽出ステップで抽出された前記対訳表現組
    集合に基づいて、前記辞書や、前記ルールを追加変更す
    る辞書・ルール追加変更ステップを含む請求項1記載の
    機械翻訳システム用辞書・ルール学習方法。
  3. 【請求項3】 前記対訳表現抽出ステップにおいて、前
    記対訳表現集合を抽出する際に、 前記入力文を前記機械翻訳システムで前記機械訳文に変
    換する際の変換履歴を用いて該入力文中の入力単語と対
    訳関係にある該機械訳文中の機械訳語を抽出する対訳機
    械訳語対抽出ステップを行う請求項2記載の機械翻訳シ
    ステム用辞書・ルール学習方法。
  4. 【請求項4】 前記対訳表現抽出ステップにおいて、前
    記対訳表現集合を抽出する際に、 前記入力文中の入力単語と対訳関係にある前記理想訳文
    中の理想訳語を抽出する対訳理想訳語対抽出ステップを
    行う請求項2及び3記載の機械翻訳システム用辞書・ル
    ール学習方法。
  5. 【請求項5】 前記対訳理想訳語対抽出ステップにおい
    て、前記理想訳語を抽出する際に、 前記第1の自然言語と前記第2の自然言語の対訳辞書を
    利用して、該入力文中の入力単語をキーにして、前記対
    訳辞書を検索し、該入力単語と対訳関係にある第2の自
    然言語の入力単語訳語候補を抽出する入力単語訳語候補
    抽出ステップと、 前記入力単語訳語候補と前記理想訳語を比較して、対訳
    関係にある前記入力文中の入力単語と前記理想訳文中の
    理想訳語の対の組を抽出する入力単語・理想訳語対抽出
    ステップとを行う請求項4記載の機械翻訳システム用辞
    書・ルール学習方法。
  6. 【請求項6】 前記対訳理想訳語対抽出ステップにおい
    て、前記理想訳語を抽出する際に、 前記入力単語訳語候補抽出ステップで抽出される前記入
    力単語訳語候補をキーにして、第2の自然言語の辞書を
    検索して抽出される入力単語訳語候補関連語と前記理想
    訳語とを比較して、対訳関係にある前記入力文中の入力
    単語と該理想訳文中の理想訳語の対の組を抽出する請求
    項5記載の機械翻訳システム用辞書・ルール学習方法。
  7. 【請求項7】 前記対訳表現抽出ステップにおいて、前
    記対訳表現組集合を抽出する際に、 対応関係にある前記機械訳文中の機械訳語と前記理想訳
    文中の理想訳語を抽出する対応機械訳語理想語対抽出ス
    テップを行う請求項2乃至6記載の機械翻訳システム用
    辞書・ルール学習方法。
  8. 【請求項8】 前記対応機械訳語理想語対抽出ステップ
    において、前記機械訳文中の機械訳語と前記理想訳文中
    の理想訳語を抽出する際に、 前記第2の自然言語の辞書を利用する請求項7記載の機
    械翻訳システム用辞書・ルール学習方法。
  9. 【請求項9】 前記対応機械訳語理想語対抽出ステップ
    において、前記機械訳文中の機械訳語と前記理想訳文中
    の理想訳語を抽出する際に、 前記第2の自然言語の辞書を利用して、前記機械訳文中
    の機械訳語をキーに、該第2の自然言語の辞書を検索し
    て抽出される機械訳語関連語と前記理想訳語を比較する
    請求項8記載の機械翻訳システム用辞書・ルール学習方
    法。
  10. 【請求項10】 前記対応機械訳語理想語対抽出ステッ
    プにおいて、前記機械訳文中の機械訳語と前記理想訳文
    中の理想訳語を抽出する際に、 前記第2の自然言語の辞書を利用して、前記理想訳文中
    の理想訳語をキーに該第2の自然言語の辞書を検索して
    抽出される理想訳語関連語と前記機械訳語を比較する請
    求項8及び9記載の機械翻訳システム用辞書・ルール学
    習方法。
  11. 【請求項11】 前記対応機械訳語理想語対抽出ステッ
    プにおいて、前記機械訳文中の機械訳語と前記理想訳文
    中の理想訳語を抽出する際に、 第1の自然言語と第2の自然言語の対訳辞書を利用し
    て、前記機械訳文中の機械訳語をキーに得られる第1の
    自然言語の訳語の集合である機械訳逆引訳語候補と、前
    記理想訳文中の理想訳語をキーに得られる第1の自然言
    語の訳語の集合である理想訳逆引訳語候補を抽出し、該
    機械訳逆引訳語候補と該理想訳逆引訳語候補を比較する
    ことによって、対応関係にある該機械訳文中の機械訳語
    と、該理想訳文中の理想訳語を抽出する請求項7乃至1
    0記載の機械翻訳システム用辞書・ルール学習方法。
  12. 【請求項12】 前記対訳表現組抽出ステップにおい
    て、前記第2の自然言語の語同士を比較する際に、前記
    機械訳文中の機械語または、前記入力単語訳語候補また
    は、前記入力単語訳語候補関連語または、前記機械訳語
    関連語の少なくとも1つの語の異なり別に集計した機械
    訳語異なり語リストを作成し、前記理想訳文中の理想訳
    語または、前記理想訳語関連語のいずれか、または、両
    方の語の異なり別に集計した理想訳異なり語リストを作
    成し、該機械訳異なり語リスト中の語と、該理想訳異な
    り語リスト中の語を比較する請求項2乃至11記載の機
    械翻訳システム用辞書・ルール学習方法。
  13. 【請求項13】 前記対訳表現組抽出ステップにおい
    て、前記第1の自然言語の語同士を比較する際に、 前記入力単語、前記機械訳逆引訳語候補の少なくとも1
    つを、語の異なり別に集計した入力単語機械訳逆引訳語
    候補異なり語リストを作成し、 前記理想訳逆引訳語候補を語の異なり別に集計した理想
    訳逆引訳語候補異なり語リストを作成し、 前記入力単語機械訳逆引訳語候補異なり語リスト中の語
    と前記理想訳逆引訳語候補異なり語リスト中の語を比較
    する請求項11及び12記載の機械翻訳システム用辞書
    ・ルール学習方法。
  14. 【請求項14】 前記対訳表現組抽出ステップにおい
    て、前記第1の自然言語の語同士、前記第2の自然言語
    の語同士を比較する際に、 両者の語が一致するか、一方の語が他方の語を含んでい
    るか、両方の語の一部が一致するかにより、対応の度合
    を区別する請求項2乃至13記載の機械翻訳システム用
    辞書・ルール学習方法。
  15. 【請求項15】 前記対訳表現組抽出ステップにおい
    て、 前記理想訳文を形態素解析し、理想訳形態素構造を抽出
    する際に、 前記理想訳形態素構造の情報を利用して、前記機械訳逆
    引訳語候補、前記理想訳逆引訳語候補、前記理想訳異な
    り語リスト中の語の少なくとも1つと、前記機械訳異な
    り語リスト中の語、前記機械訳逆引訳語候補異なり語リ
    スト中の語、前記理想訳逆引訳語候補異なり語リスト中
    の語の少なくとも1つを比較する請求項2乃至14記載
    の機械翻訳システム用辞書・ルール学習方法。
  16. 【請求項16】 前記対訳表現抽出ステップによって抽
    出される前記対訳表現組集合から、前記入力文と前記理
    想訳文と前記機械訳文の1組から抽出できる対訳表現組
    の組み合わせである対訳表現組み合わせの集合を抽出す
    る対訳表現組み合わせ抽出ステップを行う請求項2乃至
    15記載の機械翻訳システム用辞書・ルール学習方法。
  17. 【請求項17】 前記対訳表現組抽出ステップにおい
    て、 前記対訳表現組抽出ステップによって、抽出される前記
    対訳表現組集合の個々の対訳表現組に、個々の対訳表現
    組の抽出過程に応じた確度である対訳表現組確度を付与
    する対訳表現組確度付与ステップを行い、 前記対訳表現組み合わせ抽出ステップにおいて、 前記対訳表現集合中の個々の対訳表現組に付与された対
    訳表現組確度を利用して、個々の前記対訳表現組み合わ
    せに確度を付与し、 前記辞書・ルール追加変更ステップにおいて、 前記対訳表現組み合わせ抽出ステップによって、抽出さ
    れる前記対訳表現組み合わせ集合中の個々の対訳表現組
    み合わせに付与された確度を利用して前記辞書や前記ル
    ールを追加変更する請求項16記載の機械翻訳システム
    用辞書・ルール学習方法。
  18. 【請求項18】 前記機械翻訳システム用辞書・ルール
    学習方法によって得られる前記辞書や前記ルールを用い
    て該学習方法を繰り返す請求項2乃至17記載の機械翻
    訳システム用辞書・ルール学習方法。
  19. 【請求項19】 前記辞書・ルール変更ステップにおい
    て、 学習終了を判定する学習終了判定ステップを行う請求項
    18記載の機械翻訳システム用辞書・ルール学習方法。
  20. 【請求項20】 前記機械翻訳システム用辞書・ルール
    学習方法によって得られる前記辞書や前記ルールを用い
    て該入力文を翻訳した結果の履歴である機械訳文履歴格
    納手段に記録する機械訳翻訳履歴保持ステップを行い、 前記学習終了判定ステップにおいて、前記機械訳文履歴
    格納手段の記録内容が定常状態になったときに、学習が
    終了する請求項19記載の機械翻訳システム用辞書・ル
    ール学習方法。
  21. 【請求項21】 前記辞書・ルール追加変更ステップに
    おいて、 前記辞書または、前記ルールを変更する情報を表示する
    請求項2乃至20記載の機械翻訳システム用辞書・ルー
    ル学習方法。
  22. 【請求項22】 原言語である第1の自然言語の入力文
    を目的言語である第2の自然言語の文に変換する機械翻
    訳システムで利用する辞書やルールを追加や変更する機
    械翻訳システム用辞書・ルール学習システムであって、 前記入力文と対訳関係にある第2の自然言語の理想訳文
    を入力する理想訳文入力手段と、 前記理想訳文入力手段により、入力された前記入力文を
    前記機械翻訳システムで変換した前記第2の自然言語の
    機械訳文と、該入力文とを比較する比較手段と、 前記比較手段により、該入力文中の入力単語と対訳関係
    にある該機械訳語及び理想訳文中の理想訳語の3組の集
    合を抽出することにより、前記辞書や前記ルールの何れ
    かまたは、両方を追加変更する更新手段とを有すること
    を特徴とする機械翻訳システム用辞書・ルール学習シス
    テム。
  23. 【請求項23】 互いに対訳関係にある前記入力文と、
    前記第2の自然言語の理想訳文を読み込む対訳文読み込
    み手段と、 前記入力文と前記理想訳文と前記機械訳文を比較して、
    該入力文中の入力単語と該入力単語と対訳関係にある該
    機械訳文中の機械訳語及び該理想訳文中の理想訳語の3
    組である対訳表現組の集合である対訳表現集合を抽出す
    る対訳表現組抽出手段と、 前記対訳表現組抽出手段で抽出された前記対訳表現組集
    合に基づいて、前記辞書や、前記ルールを追加変更する
    辞書・ルール追加変更手段を含む請求項22記載の機械
    翻訳システム用辞書・ルール学習システム。
  24. 【請求項24】 前記対訳表現組抽出手段は、 前記対訳表現集合を抽出する際に、前記入力文を前記機
    械翻訳システムで前記機械訳文に変換する際の変換履歴
    を用いて該入力文中の入力単語と対訳関係にある該機械
    訳文中の機械訳語を抽出する対訳機械訳語対抽出手段を
    含む請求項22記載の機械翻訳システム用辞書・ルール
    学習システム。
  25. 【請求項25】 前記対訳表現組抽出手段は、 前記対訳表現集合を抽出する際に、 前記入力文中の入力単語と対訳関係にある前記理想訳文
    中の理想訳語を抽出する対訳理想訳語対抽出手段を含む
    請求項22及び23記載の機械翻訳システム用辞書・ル
    ール学習システム。
  26. 【請求項26】 前記対訳理想訳語対抽出手段は、 前記第1の自然言語と前記第2の自然言語の対訳辞書
    と、 前記理想訳語を抽出する際に利用して、該入力文中の入
    力単語をキーにして、前記対訳辞書を検索し、該入力単
    語と対訳関係にある第2の自然言語の入力単語訳語候補
    を抽出する入力単語訳語候補抽出手段と、 前記入力単語訳語候補と前記理想訳語を比較して、対訳
    関係にある前記入力文中の入力単語と前記理想訳文中の
    理想訳語の対の組を抽出する入力単語・理想訳語対抽出
    手段とを含む請求項25記載の機械翻訳システム用辞書
    ・ルール学習システム。
  27. 【請求項27】 前記対訳理想訳語対抽出手段は、 第2の自然言語の辞書と、 前記入力単語訳語候補抽出手段で抽出される前記入力単
    語訳語候補をキーにして、前記第2の自然言語の辞書を
    検索して抽出される入力単語訳語候補関連語と前記理想
    訳語とを比較して、対訳関係にある前記入力文中の入力
    単語と該理想訳文中の理想訳語の対の組を抽出する手段
    を含む請求項26記載の機械翻訳システム用辞書・ルー
    ル学習システム。
  28. 【請求項28】 前記対訳表現組抽出手段は、 前記対訳表現組集合を抽出する際に、対応関係にある前
    記機械訳文中の機械訳語と前記理想訳文中の理想訳語を
    抽出する対応機械訳語理想語対抽出手段を含む請求項2
    2乃至27記載の機械翻訳システム用辞書・ルール学習
    システム。
  29. 【請求項29】 前記対応機械訳語理想語対抽出手段
    は、前記機械訳文中の機械訳語と前記理想訳文中の理想
    訳語を抽出する際に、前記第2の自然言語の辞書を利用
    する手段を含む請求項28記載の機械翻訳システム用辞
    書・ルール学習システム。
  30. 【請求項30】 前記対応機械訳語理想語対抽出手段
    は、 前記機械訳文中の機械訳語と前記理想訳文中の理想訳語
    を抽出する際に、前記第2の自然言語の辞書を利用し
    て、前記機械訳文中の機械訳語をキーに、該第2の自然
    言語の辞書を検索して抽出される機械訳語関連語と前記
    理想訳語を比較する手段を含む請求項29記載の機械翻
    訳システム用辞書・ルール学習システム。
  31. 【請求項31】 前記対応機械訳語理想語対抽出手段
    は、 前記機械訳文中の機械訳語と前記理想訳文中の理想訳語
    を抽出する際に、前記第2の自然言語の辞書を利用し
    て、前記理想訳文中の理想訳語をキーに該第2の自然言
    語の辞書を検索して抽出される理想訳語関連語と前記機
    械訳語を比較する手段を含む請求項29及び30記載の
    機械翻訳システム用辞書・ルール学習システム。
  32. 【請求項32】 前記対応機械訳語理想語対抽出手段
    は、 前記機械訳文中の機械訳語と前記理想訳文中の理想訳語
    を抽出する際に、第1の自然言語と第2の自然言語の対
    訳辞書を利用して、前記機械訳文中の機械訳語をキーに
    得られる第1の自然言語の訳語の集合である機械訳逆引
    訳語候補と、前記理想訳文中の理想訳語をキーに得られ
    る第1の自然言語の訳語の集合である理想訳逆引訳語候
    補を抽出する手段と、 前記機械訳逆引き訳語候補と該理想訳逆引訳語候補を比
    較することによって、対応関係にある該機械訳文中の機
    械訳語と、該理想訳文中の理想訳語を抽出する手段を含
    む請求項28乃至31記載の機械翻訳システム用辞書・
    ルール学習システム。
  33. 【請求項33】 前記対訳表現組抽出手段は、 前記第2の自然言語の語同士を比較する際に、前記機械
    訳文中の機械語または、前記入力単語訳語候補または、
    前記入力単語訳語候補関連語または、前記機械訳語関連
    語の少なくとも1つの語の異なり別に集計した機械訳語
    異なり語リストを作成する手段と、 前記理想訳文中の理想訳語または、前記理想訳語関連語
    のいずれか、または、両方の語の異なり別に集計した理
    想訳異なり語リストを作成する手段と、 前記該機械訳異なり語リスト中の語と、前記理想訳異な
    り語リスト中の語を比較する手段とを含む請求項23乃
    至32記載の機械翻訳システム用辞書・ルール学習シス
    テム。
  34. 【請求項34】 前記対訳表現組抽出手段は、 前記第1の自然言語の語同士を比較する際に、前記入力
    単語、前記機械訳逆引訳語候補の少なくとも1つを、語
    の異なり別に集計した入力単語機械訳逆引訳語候補異な
    り語リストを作成する手段と、 前記理想訳逆引訳語候補を語の異なり別に集計した理想
    訳逆引訳語候補異なり語リストを作成する手段と、 前記入力単語機械訳逆引訳語候補異なり語リスト中の語
    と前記理想訳逆引訳語候補異なり語リスト中の語を比較
    する手段を含む請求項32及び33記載の機械翻訳シス
    テム用辞書・ルール学習システム。
  35. 【請求項35】 前記対訳表現組抽出手段は、 前記第1の自然言語の語同士、前記第2の自然言語の語
    同士を比較する際に、 両者の語が一致するか、一方の語が他方の語を含んでい
    るか、両方の語の一部が一致するかにより、対応の度合
    を区別する手段を含む請求項23乃至34記載の機械翻
    訳システム用辞書・ルール学習システム。
  36. 【請求項36】 前記対訳表現組抽出手段は、 前記理想訳文を形態素解析し、理想訳形態素構造を抽出
    する際に、前記理想訳形態素構造の情報を利用して、前
    記機械訳逆引訳語候補、前記理想訳逆引訳語候補、前記
    理想訳異なり語リスト中の語の少なくとも1つと、前記
    機械訳異なり語リスト中の語、前記機械訳逆引訳語候補
    異なり語リスト中の語、前記理想訳逆引訳語候補異なり
    語リスト中の語の少なくとも1つを比較する手段を含む
    請求項22乃至35記載の機械翻訳システム用辞書・ル
    ール学習システム。
  37. 【請求項37】 前記対訳表現組抽出手段によって抽出
    される前記対訳表現組集合から、前記入力文と前記理想
    訳文と前記機械訳文の1組から抽出できる対訳表現組の
    組み合わせである対訳表現組み合わせの集合を抽出する
    対訳表現組み合わせ抽出手段を更に有する請求項23乃
    至36記載の機械翻訳システム用辞書・ルール学習シス
    テム。
  38. 【請求項38】 前記対訳表現組抽出手段は、 前記対訳表現組抽出手段によって、抽出される前記対訳
    表現組集合の個々の対訳表現組に、個々の対訳表現組の
    抽出過程に応じた確度である対訳表現組確度を付与する
    対訳表現組確度付与手段を有し、 前記対訳表現組み合わせ抽出手段は、 前記対訳表現集合中の個々の対訳表現組に付与された対
    訳表現組確度を利用して、個々の前記対訳表現組み合わ
    せに確度を付与する手段を有し、 前記辞書・ルール追加変更手段は、 前記対訳表現組み合わせ抽出手段によって、抽出される
    前記対訳表現組み合わせ集合中の個々の対訳表現組み合
    わせに付与された確度を利用して前記辞書や前記ルール
    を追加変更する手段を有する請求項37記載の機械翻訳
    システム用辞書・ルール学習システム。
  39. 【請求項39】 前記機械翻訳システム用辞書・ルール
    学習システムによって得られる前記辞書や前記ルールを
    用いて該学習方法を繰り返す繰り返し手段を有する請求
    項23乃至38記載の機械翻訳システム用辞書・ルール
    学習システム。
  40. 【請求項40】 前記辞書・ルール変更手段は、 学習終了を判定する学習終了判定手段を含む請求項39
    記載の機械翻訳システム用辞書・ルール学習システム。
  41. 【請求項41】 前記機械翻訳システム用辞書・ルール
    学習方法によって得られる前記辞書や前記ルールを用い
    て該入力文を翻訳した結果の履歴である機械訳文履歴格
    納手段に記録する機械訳翻訳履歴保持手段を有し、 前記学習終了判定手段は、前記機械訳文履歴格納手段の
    記録内容が定常状態になったときに、学習が終了すると
    判定する手段を含む請求項40記載の機械翻訳システム
    用辞書・ルール学習システム。
  42. 【請求項42】 前記辞書・ルール追加変更手段は、 前記辞書または、前記ルールを変更する情報を表示する
    表示手段を含む請求項23乃至41記載の機械翻訳シス
    テム用辞書・ルール学習システム。
  43. 【請求項43】 原言語である第1の自然言語の入力文
    を目的言語である第2の自然言語の文に変換する機械翻
    訳システムで利用する辞書やルールを追加や変更する機
    械翻訳システム用辞書・ルール学習プログラムを格納し
    た記憶媒体であって、 前記入力文と対訳関係にある第2の自然言語の理想訳文
    を入力させる理想訳文入力プロセスと、 前記理想訳文入力プロセスにより、入力された前記入力
    文を前記機械翻訳システムで変換した前記第2の自然言
    語の機械訳文と、該入力文とを比較する比較プロセス
    と、 前記比較プロセスにより、該入力文中の入力単語と対訳
    関係にある該機械訳語及び理想訳文中の理想訳語の3組
    の集合を抽出することにより、前記辞書や前記ルールの
    何れかまたは、両方を追加変更する更新プロセスとを有
    することを特徴する機械翻訳システム用辞書・ルール学
    習プログラムを格納した記憶媒体。
JP13555397A 1997-05-26 1997-05-26 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体 Expired - Fee Related JP3353647B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13555397A JP3353647B2 (ja) 1997-05-26 1997-05-26 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13555397A JP3353647B2 (ja) 1997-05-26 1997-05-26 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JPH10326276A true JPH10326276A (ja) 1998-12-08
JP3353647B2 JP3353647B2 (ja) 2002-12-03

Family

ID=15154497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13555397A Expired - Fee Related JP3353647B2 (ja) 1997-05-26 1997-05-26 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP3353647B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000073975A1 (fr) * 1999-05-31 2000-12-07 Cai Co., Ltd. Systeme de reecriture
JP2018041184A (ja) * 2016-09-06 2018-03-15 国立研究開発法人情報通信研究機構 訓練用データ生成装置、最適パラメータ取得装置、訓練用データ生成方法、および最適パラメータ取得方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000073975A1 (fr) * 1999-05-31 2000-12-07 Cai Co., Ltd. Systeme de reecriture
JP2018041184A (ja) * 2016-09-06 2018-03-15 国立研究開発法人情報通信研究機構 訓練用データ生成装置、最適パラメータ取得装置、訓練用データ生成方法、および最適パラメータ取得方法

Also Published As

Publication number Publication date
JP3353647B2 (ja) 2002-12-03

Similar Documents

Publication Publication Date Title
US5895446A (en) Pattern-based translation method and system
US7904291B2 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
KR101031970B1 (ko) 구문들 사이의 번역 관계를 학습하기 위한 통계적 방법
JPH05151260A (ja) 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JP3765799B2 (ja) 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム
US11568150B2 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
US20050273316A1 (en) Apparatus and method for translating Japanese into Chinese and computer program product
JP2010244385A (ja) 機械翻訳装置、機械翻訳方法、およびプログラム
Foster Text prediction for translators
CN116306594A (zh) 一种医学ocr识别纠错方法
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
JP5298834B2 (ja) 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
US20040054677A1 (en) Method for processing text in a computer and a computer
CN112965909A (zh) 测试数据、测试用例生成方法及系统、存储介质
JP3825645B2 (ja) 表現変換方法及び表現変換装置
KR20010057775A (ko) 문장골격을 기반으로 한 자동번역 시스템 및 그 방법
JP4007630B2 (ja) 対訳例文登録装置
JP2006024114A (ja) 機械翻訳装置および機械翻訳コンピュータプログラム
JP5521670B2 (ja) パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム
JP2004264960A (ja) 用例ベースの文変換装置、およびコンピュータプログラム
JP3358096B2 (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
JPH11259482A (ja) 複合名詞の機械翻訳方式
Bowden Cooperative error handling and shallow processing

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees