JPH07244664A - 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置 - Google Patents

機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置

Info

Publication number
JPH07244664A
JPH07244664A JP6034476A JP3447694A JPH07244664A JP H07244664 A JPH07244664 A JP H07244664A JP 6034476 A JP6034476 A JP 6034476A JP 3447694 A JP3447694 A JP 3447694A JP H07244664 A JPH07244664 A JP H07244664A
Authority
JP
Japan
Prior art keywords
dictionary
machine translation
rule
translation
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6034476A
Other languages
English (en)
Other versions
JP3358096B2 (ja
Inventor
Setsuo Yamada
節夫 山田
Hiromi Nakaiwa
浩巳 中岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03447694A priority Critical patent/JP3358096B2/ja
Publication of JPH07244664A publication Critical patent/JPH07244664A/ja
Application granted granted Critical
Publication of JP3358096B2 publication Critical patent/JP3358096B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、最適な辞書やルールを登録
することが可能な機械翻訳システム用辞書・ルールの学
習方法及び機械翻訳システム用辞書・ルールの学習装置
を提供することである。 【構成】 本発明は、機械概念構造と理想訳概念構造の
差分を抽出する手段21、22と、その差分を求める手
段61と、差分に応じて解決法別に分類することにより
辞書またはルールを追加修正する手段65より構成され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、機械翻訳システム用辞
書・ルール学習方法及び機械翻訳システム用辞書・ルー
ル学習装置に係り、特に、機械翻訳システムで用いる辞
書やルールを自動的に学習するための機械翻訳システム
用辞書ルール学習方法及び機械翻訳システム用辞書・ル
ール学習装置に関する。
【0002】
【従来の技術】従来は、機械翻訳システム用辞書やルー
ルを構築する場合、人間が翻訳等に利用する辞書等を参
考にして機械翻訳システム用の辞書やルールを人手で構
築するのが一般的である。また、このようにして構築さ
れた機械翻訳システム用の辞書やルールは、機械翻訳シ
ステムの翻訳結果を基に、不適切な訳が生成されている
場合には、その訳を生成した原因となる辞書やルール
を、機械翻訳システムの内部処理を良く理解したエキス
パートが人手で追加修正している。
【0003】この辞書やルールの追加修正作業を自動化
する第1の手法としては、対訳関係にある原言語の文と
目的言語の文(理想訳文)の対の集合(対訳コーパス)
からそれぞれ解析することによって、生成される原言語
の概念構造と理想訳文の概念構造を比較することによっ
て、辞書を追加・修正する改良方法(例えば『機械翻訳
用自動学習装置』(特開平4−372061)や、第2
の手法として、対訳コーパスを用いて原言語を機械翻訳
システムで翻訳した目的言語の文(機械訳文)と理想訳
文を比較し、両者が異なる場合には、機械訳文を機械翻
訳システムが生成する過程で利用したルールの一つであ
る生成文法を調査し、誤っている生成文法を追加・修正
する改良方法(例えば、『生成文法自動生成装置』(特
開昭6344276))が知られている。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の機械翻訳システムの辞書やルールの構築方法では、
人間用に作成された辞書等を利用するため、機械翻訳用
に用いた場合、正しい訳が生成される保証がないという
問題がある。
【0005】また、機械翻訳システムの辞書やルールを
追加修正するには、翻訳結果を機械翻訳システムの内部
処理を良く理解したエキスパートにより検証する必要が
ある。従って、エキスパートでないと辞書やルールの追
加修正が不可能であるという問題点がある。
【0006】また、本作業は人手によるので、辞書やル
ールの構築のための時間的経済的コストが高くなってし
まうという問題がある。
【0007】さらに、上記従来のうち、即ち、改良方法
においては、第1の手法の場合、対訳コーパスの情報の
みから機械翻訳システムの翻訳結果を考慮せずに辞書や
ルールが追加変更されるため、既存の辞書やルールに対
して対訳コーパスにより不適切な追加変更がなされ、機
械翻訳結果に悪影響を及ぼすという問題がある。第2の
手法の場合、機械翻訳システムの翻訳結果を考慮してい
るが、辞書で解決すべき場合もルールで解決すべき場合
も同じ扱いをしているので、機械翻訳システムにおける
最も効率的な解決策をとっていないという問題がある。
【0008】さらに、第1の手法と第2の手法ともに学
習過程が一度しかないため、学習した結果が本当に正し
いものかどうか不明である。
【0009】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、対訳コーパスの情報だ
けを利用するのではなく、機械翻訳システムが出力した
機械訳文の機械訳概念構造と理想訳概念構造の差分を抽
出し、それを解決方法別に分類することにより、機械翻
訳システムにおける解決方法別に最適な辞書やルールを
登録することが可能な機械翻訳システム用辞書・ルール
の学習方法及び機械翻訳システム用辞書・ルールの学習
装置を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明の機械翻訳システ
ム用辞書・ルールの学習方法は、原言語である第1の自
然言語の入力文を目的言語である第2の自然言語の文に
変換する手段を有する機械翻訳システムに利用される辞
書やルールを変更するシステムにおいて、第1の自然言
語を該機械翻訳システムにより翻訳された機械訳文を解
析することにより得られる機械訳概念構造と第2の自然
言語の理想訳文を解析することにより生成される理想訳
概念構造の差分を抽出し、差分を機械翻訳システムにお
いて翻訳する場合の解決方法別に分類することにより該
辞書または該ルールを追加修正する。
【0011】図1は、本発明の原理を説明するための図
である。
【0012】本発明の機械翻訳システム用辞書・ルール
の学習方法は、互いに、対訳関係にある入力文と事前に
準備された理想訳文としての模範訳文を読み込み(ステ
ップ1)、理想訳文から目的言語の理想訳概念構造を生
成し(ステップ2)、機械翻訳システムを用いて入力文
を機械訳文としての目的言語の文に翻訳し、翻訳された
目的言語の機械訳概念構造を生成し(ステップ3)、機
械訳概念構造と理想訳概念構造を比較して違いを抽出し
(ステップ4)、差分を機械翻訳システムにおける解決
方法別に分類し(ステップ5)、ステップ5で得られた
結果を基に辞書やルールを追加変更する(ステップ
6)。
【0013】また、本発明は、理想訳概念構造生成ステ
ップにより得られた理想訳概念構造を人が修正する。
【0014】また、本発明は、機械翻訳システム用辞書
・ルール学習方法によって得られる辞書やルールを用い
て、辞書・ルール学習方法を繰り返す。
【0015】また、本発明は、辞書・ルール追加変更ス
テップにおいて、学習終了を判定する。
【0016】また、本発明は、差分抽出ステップで得ら
れた差分を差分格納部へ記録する差分記録ステップを設
け、学習終了判定ステップにおいて差分格納部の記録内
容が定常状態になったときに学習が終了する。
【0017】図2は、本発明の原理構成図である。
【0018】さらに本発明の機械翻訳システム用辞書・
ルール学習装置は、原言語である第1の自然言語の入力
文を目的言語である第2の自然言語に変換する手段を有
する機械翻訳システムに利用される辞書やルールを変更
するシステムにおいて、対訳関係にある第1の自然言語
の文と第2の自然言語の理想訳文との対である対訳文を
入力する対訳文入力手段1と、対訳文入力手段1により
入力された第2の自然言語の理想訳文を解析し理想訳概
念を生成する理想訳概念構造生成手段2と、対訳文入力
手段1により入力された第1の自然言語の文が機械翻訳
する過程で機械訳概念構造を生成する機械訳概念構造生
成手段321と、理想訳概念構造生成手段2で生成され
た理想訳概念構造と機械訳概念構造生成手段321で生
成された目的言語の機械訳概念構造とを比較して差分を
求める差分抽出手段61と、差分抽出手段61で求めら
れた差分に基づいて機械翻訳システムの解決方法別に分
類する解決方法別分類手段64と、解決方法別分類手段
64の結果に応じて辞書やルールを追加変更する辞書・
ルール追加変更手段65とを有する。また、本発明の理
想訳概念構造生成手段2は、生成された理想訳概念構造
を人手により修正する修正手段を含む。
【0019】また、機械翻訳システム用辞書・ルール学
習装置によって得られる辞書やルールを用いて機械訳概
念構造生成手段321、差分抽出手段61、解決方法別
分類手段64及び辞書・ルール追加変更手段65の処理
を繰り返す学習手段を含む。
【0020】また、本発明の学習手段の学習終了を判定
する判定手段を含む。
【0021】また、本発明の差分抽出手段61で得られ
た差分を記録する差分記録手段を含み、判定手段は、差
分記録手段の記録内容が定常状態になった時に学習を終
了する。
【0022】また、本発明の辞書・ルール追加変更手段
65は、辞書またはルールを変更する情報を表示する表
示手段を含む。
【0023】
【作用】本発明の機械翻訳システム用辞書・ルール学習
方法及び機械翻訳システム用辞書・ルールの学習装置に
おいては、対訳文読み込みステップ及び対訳文読み込み
手段は、互いに対訳関係にある第1自然言語の文(入力
文)と第2自然言語の文(理想訳文)を読み込む。これ
から以下のステップ及び手段によって機械翻訳システム
用辞書・ルールが自動的に追加修正される。
【0024】理想訳概念構造生成ステップ及び理想訳概
念構造生成手段は、理想訳文から第2自然言語の概念構
造(理想訳概念構造)を生成する。機械訳概念構造生成
ステップ及び機械訳概念構造生成手段は、機械翻訳シス
テムを用いて入力文を第2自然言語の文(機械訳文)に
翻訳する際に第2自然言語の概念構造(機械訳概念構
造)を生成する。差分抽出ステップ及び差分抽出手段
は、機械訳概念構造と理想訳概念構造を比較して違いを
抽出する。解決方法別分類ステップ及び解決方法別分類
手段は、差分抽出ステップ及び上記差分抽出手段で得ら
れた差分を機械翻訳システムにおける解決方法別に分類
する。辞書・ルール追加変更ステップ及び辞書・ルール
追加変更手段は、上記解決方法別分類ステップ及び上記
解決方法別分類手段で得られた結果を基に、辞書やルー
ルを追加変更する。これにより、機械翻訳システムで正
しくない翻訳結果だけを利用して、機械翻訳システムに
おける解決方法別に辞書やルールが登録できる。
【0025】また、辞書・ルール・追加変更ステップ及
び辞書・ルール追加変更手段に、表示手段を持たせ、辞
書やルールを変更する場合に変更する内容を表示し、ユ
ーザに提示することが可能である。これにより、ユーザ
が辞書・ルールの変更を確認することができると共に、
適宜修正等行うことも可能である。
【0026】概念構造修正ステップ及び概念構造修正手
段は、上記理想訳概念構造生成ステップ及び理想訳概念
構造生成手段によって得られた概念構造を人が修正す
る。これによって、全て人手により理想訳概念構造を生
成するより効率的に正しい概念構造を生成できる。
【0027】上記辞書・ルール追加変更ステップ及び上
記辞書・ルール追加変更手段より得られた辞書やルール
を用いて辞書・ルール学習方法を繰り返すことによっ
て、登録された辞書やルールの検証ができ、さらに1回
の学習過程では得られなかった辞書やルールを抽出する
ことも可能となる。
【0028】終了条件判定ステップ及び終了条件判定手
段は、学習終了条件を自動的に判定する。これによっ
て、学習結果を人が見ずに自動的に学習が終了する。
【0029】差分記録ステップ及び差分記録手段は、上
記差分抽出ステップ及び上記差分抽出手段で得られた差
分を差分格納部へ記録する。これによって、差分記録ス
テップ及び差分記録手段より得られた差分格納部への記
録内容が定常状態になったときに学習が自動的に終了
し、最適な辞書やルールが登録される。
【0030】従って、上記ステップを全て実行する及び
上記手段を全て用いることにより、機械翻訳システムに
おける解決方法別に最適な辞書やルールが自動的に登録
され、機械翻訳システム用辞書・ルールの学習が可能と
なる。
【0031】
【実施例】以下、本発明の実施例を図面と共に説明す
る。以下に示す実施例では、第1の自然言語が日本語、
第2の自然言語が英語であるとする。
【0032】図3は、本発明の一実施例の機械翻訳用辞
書・ルール自動学習システムの基本ブロック構成を示
す。同図に示す機械翻訳用辞書・ルール自動学習システ
ムは、対訳文読み込み部1、概念構造生成部2、機械翻
訳システム部3、ルール4、辞書5、及び学習部6より
構成される。
【0033】対訳文読み込み部1は、対訳関係にある第
1の自然言語(日本語)の文と第2の自然言語(英語)
の文の対(対訳文)を入力する。
【0034】概念構造生成部2は、入力された第2の自
然言語の理想訳文から理想訳概念構造を生成する。
【0035】機械翻訳システム部3は、入力された第1
の自然言語の文をルール4や辞書5を用いて第2の自然
言語の機械訳文に翻訳する。
【0036】学習部6は、対訳文読み込み部1で入力さ
れた対訳文から辞書5やルール4を抽出する。学習部6
は、差分抽出部61、差分記録部62、差分格納部6
3、格要素に関する処理部641と述部に関する処理部
642からなる解決方法別分類部64、及び辞書・ルー
ル追加変更部65から構成される。
【0037】学習部6の差分抽出部61は、機械翻訳シ
ステム部3によって生成された機械訳概念構造と概念構
造生成部2で生成された理想訳概念構造とを比較して違
いを抽出する。差分記録部62は、差分抽出部61によ
って抽出される差分情報を差分格納部63へ記録する。
解決方法別分類部64は、差分抽出部61によって抽出
された差分情報を機械翻訳システム部3の解決方法別に
分類する。辞書・ルール追加変更部65は、解決方法別
分類部64によって得られた結果を基に辞書5やルール
4を追加変更する。また、解決方法別分類部64は、差
分情報のなかでも辞書5によって解決できる処理を行う
格要素に関する処理部641、ルール4によって解決で
きる処理を行う述部に関する処理部642から構成され
る。
【0038】図4は、本発明の一実施例の追加変更され
る辞書やルールを用いた機械翻訳システムの基本ブロッ
ク構成の例を示す。同図に示す機械翻訳システムは、機
械翻訳システム部3、機械翻訳システム部3で用いられ
るルール4、機械翻訳システム部3で用いられる辞書
5、翻訳する第1自然言語文を入力する第1自然言語入
力部7及び、機械翻訳システム部3により翻訳された第
2自然言語を出力する第2自然言語出力部8より構成さ
れる。
【0039】機械翻訳システム部3は、第1自然言語文
を第1自然言語の概念構造に変換する第1言語解析部3
1、第1言語解析部31で生成された第1自然言語の概
念構造を第2自然言語の概念構造に変換する言語変換部
32、言語変換部32で生成された第2自然言語の概念
構造を基に第2自然言語文を生成する第2言語生成部3
3より構成される。ルール4は、第1言語解析部31で
用いる第1言語解析ルール41、言語変換部32で用い
る言語変換ルール42、第2言語生成部33で用いる第
2言語生成ルール43より構成される。辞書5は、第1
言語解析部31で用いる第1言語解析辞書51、言語変
換部32で用いる言語変換辞書52及び第2言語生成部
33で用いる第2言語生成辞書53より構成される。
【0040】図5は、本発明の一実施例の言語変換辞書
のエントリの例を示す。言語変換辞書52は、例えば、
名詞変換辞書があり、その名詞変換辞書には、第1自然
言語である日本語の各名詞に対する第2自然言語である
英語がそれぞれ記入され、1つの名詞に対して複数の訳
語がある場合には、使うべき訳語の優先順位を示す優先
度やその訳語の使われ方を示す名詞句からなる選択条件
等が記入されている。例えば、「月」に対しては、" mo
nth"、"moon"の訳語が、また、「道」に対しては、"roa
d","way"の訳語がこの順番の優先順位で付与されてい
る。
【0041】図6は、本発明の一実施例の言語変換ルー
ルのエントリの例を示す。言語変換ルール42は、例え
ば、動詞変換ルールがあり、その動詞変換ルールには、
日本語の各動詞だけではなく、動詞の助詞がパターンと
して付けられており、つまり、例えば、動詞「出る」に
ついては、“「S」(主語、名詞)「が」(助詞)”と
いう助詞パターンが、動詞「付ける」については、
“「S」(主語、名詞)「が」(助詞)「O1」(目的
語、名詞)「を」(助詞)「O2」(目的語、名詞)
「に(助詞)”という助詞パターンが記入されており、
動詞をその動詞を含めてキーとして動詞の訳語を検索す
るように記入されている。さらに、動詞の格要素の意味
を示す選択条件が記されている。例えば、動詞「出る」
については、その助詞パターン(Sが)に示されている
格要素の意味に関しては制約はないことを示している。
また、動詞「付ける」については、その助詞パターン
(SがO1をO2に)に示されている格要素の意味につ
いて、 “S attach O1 to O2” という表現で訳す場合には、制約はないことを示してい
るが、 “S put O1 to O2” という表現で訳す場合には、Sが主体の意味を持ち、O
1が能力の意味を持ちO2が機械の意味を持つ時にその
表現を適用する制約があることを示している。
【0042】次に、図3の基本ブロック構成の機械翻訳
用辞書・ルール自動学習システムの処理手順について説
明する。ここでは、図7に示す対訳文を例として説明す
る。
【0043】1)まず、対訳文読み込み部1は、対訳関
係にある第1自然言語の文と第2自然言語の文の対(対
訳文)を入力する。この対訳文は、機械翻訳用辞書・ル
ールの自動学習のために用いるものである。この辞書・
ルールの学習用に対訳文の集合(対訳文章)を選択する
ことによって、学習させた対訳文章と類似の言語現象が
頻出する同様の分野文章向きに、機械翻訳システムをチ
ューンすることが可能となる。図7(A)の例では、、
第1自然言語である日本語の文(入力日本文A) 「彼は駅へ行く道を尋ねた」 に対して対訳関係にある第2自然言語である英語の文
(理想英訳文A) "He asked his way to the station" 図7(B)の例では、入力日本文B 「彼女はボタンを服に付けた」 に対して対訳関係にある理想英訳文B "She sewed a button on her clothes" 図7(C)の例では、入力日本文C 「月が出た」 に対して対訳関係にある理想英訳文C "The moon came up" が対訳文として入力される。
【0044】2)入力された対訳文のうち、第1自然言
語文である入力日本語文は、ルール4や辞書5を用いた
機械翻訳システム部3によって第2自然言語文である機
械英語訳文に翻訳される。この機械翻訳の処理の手順を
図4の基本ブロック構成の機械翻訳システムを用いて説
明する。
【0045】2−1)まず、第1自然言語文である入力
日本語文は、第1言語解析ルール41や第1言語解析辞
書51を用いた第1言語解析部31により解析され、日
本語の概念構造を生成する。
【0046】2−2)生成された日本語の概念構造は、
例えば、図6に示す動詞変換ルールのような言語変換ル
ール42や、例えば、図5に示す名詞変換辞書のような
言語変換辞書52を用いて言語変換部32によって変換
され、英語の概念構造を生成する。生成された英語の概
念構造は、第2言語生成ルール43や第2言語生成辞書
53によって、機械英訳文を生成する。
【0047】2−3)生成された英文は第2自然言語出
力部8によって出力される。なお、この機械翻訳システ
ムの各段階で参照・生成された概念構造や辞書情報は、
辞書・ルール自動学習処理で参照可能となるように情報
を保存しておく。例えば、図5の言語変換辞書52を検
索した際に得られる個々の他訳語候補の情報も保存して
おく。
【0048】上記のような機械翻訳システムで、例とし
て図5で示した名詞変換辞書52、図6で示した動詞変
換ルール42を用いることによって、図7の入力日本文
Aに対しては機械英訳文A "He asked his road to the station" が、入力日本文Bに対しては、機械英訳文B "She attached a button to her clothes." が、入力日本文Cに対しては機械英訳文C "The month go out." が訳出される。また、機械英訳文Aに対しては、図8に
示す機械訳概念構造Aが、機械英訳文Bに対しては、図
9に示す機械訳概念構造Bが、機械英訳文Cに対して
は、図10に示す機械訳概念構造Cが図4の機械翻訳シ
ステム部3の言語変換部32で生成される。これらの機
械訳概念構造は、動詞と格要素の関係と機能別に単語の
機械訳が記されている。
【0049】ここで、「主格」の関係とは、名詞句が動
詞の主語として機能していることを示し、「目的格」の
関係とは、名詞句が動詞の目的語として機能しているこ
とを示、「to- 格」や「on- 格」の関係とは、表記の前
置詞が付与されている名詞句が動詞の目的語して機能し
ていることを示す。
【0050】次に、図3の概念構造生成部2について説
明する。この概念構造生成部2は、対訳文読み込み部1
で読み込まれた第2自然言語(理想英訳文)を解析する
ことによって自動的に理想訳概念構造を生成する。この
概念構造生成部2で解析され生成された概念構造の質を
向上させるために、人手で修正する方法も考えられる。
【0051】図7の理想英訳文Aに対しては、図8に示
す理想訳概念構造Aが、理想英訳文Bに対しては、図9
に示す理想訳概念構造Bが、理想英訳文Cに対しては図
10で示した理想訳概念構造Cが概念構造生成部2によ
って生成される。これらの理想訳概念構造は、機械訳概
念構造と同様に動詞と格要素の関係と機能別に単語の理
想訳が記されている。
【0052】上記のようにして得られた機械訳概念構造
と理想訳概念構造の違いは、差分抽出部61によって概
念構造の差分が抽出され、その情報は差分記録部62に
よって差分格納部63へ保存される。概念構造の違い
は、動詞との関係と機能別の単語の訳の比較によって抽
出される。例えば図8、図9、図10の機械訳概念構造
と理想訳概念構造のそれぞれの差分は、差分抽出部61
によって抽出され、図11に示すような差分情報が得ら
れる。図8に関しては、"go out"と名詞の"way"と"roa
d"が違い、図9に関しては、動詞の"sew" と"attach"と
格要素の関係の「on- 格」と「to- 格」が違い、図10
に関しては、動詞の"come up" と名詞の"moon"と"mont
h" が違う。なお、図11の日本語の情報は、機械翻訳
システム部3によって得られる情報である。
【0053】上記差分情報のうち、辞書で解決できるも
のとルールで解決できるものを格要素に関する処理部6
41と述部に関する処理部642によって分類する。こ
こでは、格要素に関する処理は、図12のフローチャー
トに示し、述部に関する処理は、図13のフローチャー
トに示す。
【0054】まず、格要素に関する処理部641の処理
を説明する。図12は、本発明の一実施例の格要素に関
する処理を示すフローチャートである。
【0055】ステップ6411)学習部6の解決方法別
分類部64の格要素に関する処理部641は、差分抽出
部61の結果から機械訳概念構造の格要素の集合と理想
訳概念構造の格要素の集合の対を順に取り出す。図11
の例では、最初に"way"(理想訳) と"road"(機械訳) が
取り出される。
【0056】ステップ6412)次に、格要素に関する
処理部641は、機械訳概念構造の格要素を順に取り出
す。上記の例では、格要素が1つしかないので、"road"
のみが取り出される。
【0057】ステップ6413)ステップ6412で取
り出した格要素の名詞について機械翻訳時に利用した言
語変換辞書52の辞書エントリを検索し、他の訳語候補
を探す。上記の例では、機械翻訳時に利用した名詞に関
する言語変換辞書52は図5の名詞変換辞書であるの
で、"road"の他訳語候補をその中で探すと"way" が見つ
かる。
【0058】ステップ6414)ステップ6413で見
つけた他訳語候補と理想訳概念構造の各格要素の名詞と
一致するかどうか判定する。判定が一致すれば(YE
S)、ステップ6415に移行し、不一致(NO)であ
れば、ステップ6416へ移行する。上記の例では、理
想訳概念構造の名詞は"way" で、ステップ6413で見
つけた他訳語候補である"way" と一致するので、判定は
YESとなり、ステップ6415に移行する。
【0059】ステップ6415)一致した名詞について
機械翻訳システム部3を実行した時の情報を利用して、
言語変換辞書52の辞書エントリを抽出する。上記の例
は、図14に示す日本語が「道」に対して"way" という
エントリが抽出される。ステップ6416)まだ、検査
をしていない機械訳概念構造が残っていないかどうか判
定する。
【0060】ステップ6417)まだ、検査をしていな
い機械訳概念構造の格要素の集合と理想訳概念構造の格
要素の集合の対が残っていないかどうか判定する。最終
的に差分抽出部61で抽出された差分の格要素の全てに
ついて検査が終了すると、この格要素に関する処理部6
41の処理は終了する。
【0061】図11に示す例については、最終的に格要
素に関する処理部641によって図14に示す辞書エン
トリが抽出される。
【0062】次に、述部に関する処理部642の処理を
説明する。図14は、本発明の一実施例の述部に関する
処理を示すフローチャートである。
【0063】ステップ6421)述部に関する処理部6
42は、差分抽出部61の結果から機械訳概念構造と理
想訳概念構造の両方に述部が含まれている概念構造の対
を順に取り出す。図11の例では、最初に述部"sew"(理
想訳) と述部"attach"(機械訳)が含まれている概念構
造の対が取り出される。
【0064】ステップ6422)ステップ6421で取
り出された概念構造の対の中の格要素が全て一致するか
どうかを判定する。一致してれば(YES)ステップ6
423に移行し、不一致であれば(NO)ステップ64
24に移行する。上記の例では、取り出された理想訳概
念構造の格要素の名詞は"clothes" で、対する機械訳概
念構造の格要素の名詞も"clothes" であるので、ステッ
プ6422の判定は、YESとなりステップ6423に
移行する。
【0065】ステップ6423)一致した概念構造と機
械翻訳システム部3を実行した時の情報から得られる格
要素の制約等を利用して言語変換ルール42の辞書エン
トリを抽出する。上記の例では、図15に示すように日
本語が「(SがO1をO2に)付ける」に対して“Sse
w O1 on O2”というエントリが抽出される。
【0066】ステップ6424)まだ、検査していない
概念構造の対があるかどうか判定する。最終的に差分抽
出部61で抽出された概念構造の全てについて検査が終
了すると、この述部に関する処理部642の処理は終了
する。図11の例については、最終的に述部要素に関す
る処理部642によって、図15に示すようにルールエ
ントリが抽出される。
【0067】上記のようにして得られた辞書・ルールの
エントリは、図3の辞書・ルール追加変更部65によっ
て適切に辞書4とルール5へ追加変更される。例えば、
辞書に関して得られたエントリについての選択条件の優
先度を最優先にしたり、ルールに関して得られたエント
リはルール5に追加する。図14の例では、図16に示
すように、"moon"と"way" の優先順位を最優先に変更す
る。図15の例では、図17に示すように日本語が
「(SがO1をO2に)付ける」に対して" S sewO1
on O2”というエントリを追加する。この時、格要素
の意味属性を用いることによって、格要素の意味的制約
も付与する。
【0068】上記のようにして、図3の基本ブロック構
成の機械翻訳用辞書・ルール自動学習システムの1回の
処理は終了となる。しかし、同じ文に複数の問題が混在
している場合、1回の走行ではその全てを抽出できると
は限らないことや、追加変更した辞書やルールが追加変
更する前と較べて悪くなる可能性もある。図7の例で
は、入力文Cに対する問題が名詞変換辞書で解決できる
ものと動詞変換ルールで解決できるものが混在してい
て、上記で示したように1回の走行では動詞変換ルール
で解決できる問題が解決されない。そこで、学習終了条
件を設定して、終了条件が満たされるまで、図3の学習
部6の処理を繰り返すべきである。学習終了判定の第1
の方法として、図3の差分格納部63の記録内容が変化
しない定常状態か否かを検査する。
【0069】繰り返し実行する学習システムの手順を図
18のフローチャートを用いて説明する。図18は、本
発明の他の実施例の学習手順を示すフローチャートであ
る。
【0070】ステップ91)図3に示す対訳文読み込み
部1において、対訳文を読み込む。
【0071】ステップ92)図3に示す学習部6により
辞書・ルール追加変更する。
【0072】ステップ93)ステップ92で追加変更さ
れた辞書・ルールを用いて再度翻訳する。図7の例文で
は、1回目の走行結果である。図16に示す辞書や図1
7に示すルールが得られるので、これを用いて再度翻訳
する。
【0073】ステップ94)学習終了条件として差分記
録部62に保存されている差分の記録内容が定常状態か
どうかを判定する。定常状態ならば(YES)終了し、
定常状態でなければ(NO)、ステップ92に移行す
る。上記の例では、1回目の走行しか行っていないので
定常状態とは言えない。従って、判定はNOとなり、ス
テップ92に戻る。
【0074】この例の2回目のステップ92では、差分
抽出部61より図19に示す差分情報が抽出され、それ
を基に解決方法別分類部64を実行し、続いて辞書・ル
ール追加変更部65を実行すると、図20に示す言語変
換ルール42内の動詞変換ルールが抽出される。次に、
ステップ93でステップ92で追加変更された辞書・ル
ールを用いて、再度翻訳する。上記の例では、2回目終
了時に、図16と図20の辞書・ルールが得られるの
で、これを用いて再度翻訳する。
【0075】次に、学習終了条件として、ステップ94
で保存されている差分の記録内容が定常状態かどうかを
判定する。上記の例では、1回目と2回目の記録内容
は、それぞれ図11と図19に示すように記録状態が違
うので、学習処理は続く。このように学習部6を繰り返
し実行することにより、上記の例では、差分がなくな
り、差分情報が定常状態になるので、学習はその時点で
終了し、最終的に辞書・ルールは、図11と図19に示
すようになる。
【0076】上記のように、本発明は、第1自然言語を
第2自然言語に翻訳される過程で機械訳概念構造を生成
し、また、入力された第2自然言語の理想訳文から理想
訳概念構造を生成し、この2つの概念構造の差分を求
め、求められた差分を辞書やルール等の機械翻訳システ
ムの解決方法に応じて分類し、辞書またはルールを追加
修正して登録する。従って、機械翻訳システムにおい
て、第1自然言語が入力されて翻訳される場合に、上記
のように追加修正された辞書やルールを用いることによ
り、理想訳に近似する第2自然言語を出力することが可
能となる。
【0077】また、追加変更された辞書またはルールを
用いて第1自然言語を機械翻訳システム部3で翻訳し
て、再度機械訳概念構造を生成し、上記理想訳概念構造
との差分を求めて記録しておき、差分に基づいて解決方
法別に辞書やルールの追加修正を行い、記録されている
差分が定常状態となった時にこの学習を終了することに
より、辞書やルールが最適な状態で登録される。
【0078】なお、辞書・ルール追加変更部65に表示
機能を持たせ、追加・変更する辞書5やルール4の内容
をユーザに提示することにより、ユーザが確認した上で
辞書5またはルール4を更新することも可能である。ま
た、ユーザが表示内容を確認し、適宜変更を加えて辞書
5やルール4に登録することも可能である。
【0079】本発明は、上記の実施例に限定されること
なく、特許請求の範囲内で種々変更または応用が可能で
ある。
【0080】
【発明の効果】本発明の機械翻訳システム用辞書・ルー
ル学習方法及び機械翻訳システム用辞書・ルールの学習
装置によれば、互いに対訳関係にある第1自然言語の文
(入力文)と第2自然言語の文(理想訳文)を読み込ま
せることにより、機械翻訳システム用辞書・ルールが自
動的に追加修正することが可能となる。これは、理想訳
概念構造と機械訳概念構造を生成し、これらの概念構造
を比較して抽出された差分を機械翻訳システムにおける
解決方法別に分類し、この分類結果に基づいて辞書やル
ールを追加変更する。これにより、機械翻訳システムで
正しくない翻訳結果だけを利用して、機械翻訳システム
における解決方法別に辞書やルールに登録できる。
【0081】また、辞書・ルール・追加変更ステップ及
び辞書・ルール追加変更手段に、表示手段を持たせ、辞
書やルールを変更する場合に変更する内容を表示し、ユ
ーザに提示することが可能である。これにより、ユーザ
が辞書・ルールの変更を確認することができると共に、
適宜修正等行うことも可能である。
【0082】また、本発明の概念構造を修正する機能及
び概念構造修正手段は、理想訳概念構造生成ステップ及
び理想訳概念構造生成手段によって得られた概念構造を
人が修正する。これによって、全て人手により理想訳概
念構造を生成するより効率的に正しい概念構造を生成で
きる。
【0083】上記辞書・ルール追加変更ステップ及び上
記辞書・ルール追加変更手段より得られた辞書やルール
を用いて辞書・ルール学習方法を繰り返すことによっ
て、登録された辞書やルールの検証ができ、さらに1回
の学習過程では得られなかった辞書やルールを抽出する
ことも可能となる。終了条件判定ステップ及び終了条件
判定手段は、学習終了条件を自動的に判定する。これに
よって、学習結果を人が見ずに自動的に学習が終了す
る。
【0084】差分記録ステップ及び差分記録手段は、上
記差分抽出ステップ及び上記差分抽出手段で得られた差
分を差分格納部へ記録する。これによって、差分記録ス
テップ及び差分記録手段より得られた差分格納部への記
録内容が定常状態になったときに学習が自動的に終了
し、最適な辞書やルールが登録される。
【0085】従って、上記ステップを全て実行する及び
上記手段を全て用いることにより、機械翻訳システムに
おける解決方法別に最適な辞書やルールが自動的に登録
され、機械翻訳システム用辞書・ルールの学習が可能と
なる。
【0086】上述のように、本発明によれば、対訳コー
パスの情報だけを利用するのではなく、機械翻訳システ
ムが出力した機械訳文の機械訳概念構造と理想訳概念構
造の違いから差分を抽出し、それを機械翻訳システムに
おける解決方法別に分類することによって、辞書やルー
ルを追加修正し、追加修正された辞書やルールを用いて
最適な辞書やルールが登録されるまで繰り返すことによ
り、対訳コーパスから得られる最適な機械翻訳システム
の辞書やルールを抽出することができる。
【0087】このようにして登録された辞書やルールを
用いることにより、機械翻訳システムでは、理想訳に近
い翻訳文を生成でき、また、翻訳対象文が違っても学習
に用いた対訳コーパスと同じ分野の第1自然言語文を入
力すれば、より理想訳に近い翻訳文を生成することが可
能となる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施例の機械翻訳用辞書・ルール自
動学習システムの基本ブロック構成図である。
【図4】本発明の一実施例の追加変更される辞書やルー
ルを用いた機械翻訳システムの基本ブロック図である。
【図5】本発明の一実施例の言語変換辞書のエントリの
例を示す図である。
【図6】本発明の一実施例の言語変換ルールのエントリ
の例を示す図である。
【図7】本発明の一実施例の対訳文の例を示す図であ
る。
【図8】本発明の一実施例の理想訳文と機械訳文の概念
構造を示す図(その1)である。
【図9】本発明の一実施例の理想訳文と機械訳文の概念
構造を示す図(その2)である。
【図10】本発明の一実施例の理想訳文と機械訳文の概
念構造を示す図(その3)である。
【図11】本発明の一実施例の差分情報と日本語情報を
示す図である。
【図12】本発明の一実施例の格要素に関する処理を示
すフローチャートである。
【図13】本発明の一実施例の述部に関する処理を示す
フローチャートである。
【図14】本発明の一実施例の図11に示す情報から得
られる名詞変換辞書のエントリを示す図である。
【図15】本発明の一実施例の図11に示す情報から得
られる動詞変換ルールのエントリを示す図である。
【図16】本発明の一実施例の図14の名詞変換辞書の
エントリから辞書の追加変更処理を行った結果得られる
名詞変換辞書の例を示す図である。
【図17】本発明の一実施例の図15の動詞変換ルール
のエントリからルールの追加変更処理を行った結果得ら
れる動詞変換ルールの例を示す図である。
【図18】本発明の他の実施例の学習手順を示すフロー
チャートである。
【図19】本発明の他の実施例の学習処理の結果抽出さ
れた概念構造の差分情報と日本語情報を示す図である。
【図20】本発明の他の実施例の2回目の学習処理を行
った結果得られる動詞変換ルールの例を示す図である。
【符号の説明】
1 対訳読み込み部、対訳文入力手段 2 概念構造生成部、理想訳概念構成生成手段 3 機械翻訳システム 4 ルール 5 辞書 6 学習部 7 第1自然言語入力部 8 第2自然言語出力部 31 第1言語解析部 32 言語変換部 33 第2言語生成部 41 第1言語解析ルール 42 言語変換ルール 43 第2言語生成ルール 51 第1言語解析辞書 52 言語変換辞書 53 第2言語生成辞書 61 差分抽出部、差分抽出手段 62 差分記録部 63 差分格納部 64 解決方法別分類部、解決方法別分類手段 65 辞書・ルール追加変更部、辞書・ルール追加変更
手段 321 機械訳概念構造生成手段 641 格要素に関する処理部 642 述部に関する処理部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 原言語である第1の自然言語の入力文を
    目的言語第2の自然言語の文に変換する手段を有する機
    械翻訳システムに利用される辞書やルールを変更するシ
    ステムにおいて、 該第1の自然言語を該機械翻訳システムにより翻訳され
    た機械訳文から得られる機械訳概念構造と該第2の自然
    言語の理想訳文を解析することにより生成される理想訳
    概念構造の差分を抽出するステップと、 該差分を該機械翻訳システムにおいて翻訳する場合の解
    決方法別に分類することにより該辞書または該ルールを
    追加修正することを特徴とする機械翻訳システム用辞書
    ・ルール学習方法。
  2. 【請求項2】 原言語である第1の自然言語の入力文を
    目的言語である第2の自然言語の文に変換する手段を有
    する機械翻訳システムに利用される辞書やルールを変更
    するシステムにおいて、 互いに対訳関係にある該入力部と事前に準備された理想
    訳文を読み込む対訳文読み込みステップと、 該理想訳文から目的言語の理想訳概念構造を生成する理
    想訳概念構造生成ステップと、 前記機械訳文の機械訳概念構造を生成する機械訳概念構
    造生成ステップと、 該機械訳概念構造と該理想訳概念構造を比較して違いを
    抽出する差分抽出ステップと、 該差分抽出ステップで得られた差分を該機械翻訳システ
    ムにおける解決方法別に分類する解決方法別分類ステッ
    プと、 該解決方法別分類ステップで得られた結果を基に辞書や
    ルールを追加変更する辞書・ルール追加変更ステップを
    含む請求項1記載の機械翻訳システム用辞書・ルール学
    習方法。
  3. 【請求項3】 前記理想訳概念構造生成ステップにおい
    て、 前記理想訳概念構造生成ステップにより得られた理想訳
    概念構造を人が修正する概念構造修正ステップを設ける
    請求項2記載の機械翻訳システム用辞書・ルール学習方
    法。
  4. 【請求項4】 前記機械翻訳システム用辞書・ルール学
    習方法によって得られる辞書やルールを用いて、前記辞
    書・ルール学習方法を繰り返す請求項2乃び3記載の機
    械翻訳システム用辞書・ルール学習方法。
  5. 【請求項5】 前記辞書・ルール追加変更ステップにお
    いて、 学習終了を判定する学習終了判定ステップを設ける請求
    項4記載の機械翻訳システム用辞書・ルール学習方法。
  6. 【請求項6】 前記差分抽出ステップで得られた差分を
    差分格納部へ記録する差分記録ステップを設け、前記学
    習終了判定ステップにおいて該差分格納部の記録内容が
    定常状態になったときに学習が終了する請求項5記載の
    機械翻訳システム用辞書・ルール学習方法。
  7. 【請求項7】 原言語である第1の自然言語の入力文を
    目的言語である第2の自然言語に変換する手段を有する
    機械翻訳システムに利用される辞書やルールを変更する
    システムにおいて、 対訳関係にある第1の自然言語の文と第2の自然言語の
    理想訳文との対である対訳文を入力する対訳文入力手段
    と、 該対訳文入力手段により入力された第2の自然言語の理
    想訳文を解析し理想訳概念を生成する理想訳概念構造生
    成手段と、 該対訳文入力手段により入力された第1の自然言語の文
    を機械翻訳する過程で機械訳概念構造を生成する機械訳
    概念構造生成手段と、 該理想訳概念構造生成手段で生成された該理想訳概念構
    造と該機械訳概念構造生成手段で生成された該機械訳概
    念構造とを比較して差分を求める差分抽出手段と、 該差分抽出手段で求められた差分に基づいて該機械翻訳
    システムの解決方法別に分類する解決方法別分類手段
    と、 該解決方法別分類手段の結果に応じて辞書やルールを追
    加変更する辞書・ルール追加変更手段とを有することを
    特徴とする機械翻訳システム用辞書・ルール学習装置。
  8. 【請求項8】 前記理想訳概念構造生成手段は、 生成された理想訳概念構造を人手により修正する修正手
    段を含む請求項7記載の機械翻訳システム用辞書・ルー
    ル学習装置。
  9. 【請求項9】 前記機械翻訳システム用辞書・ルール学
    習装置によって得られる辞書やルールを用いて前記機械
    訳概念構造生成手段、前記差分抽出手段、前記解決方法
    別分類手段及び前記辞書・ルール追加変更手段の処理を
    繰り返す学習手段を含む請求項7記載の機械翻訳用シス
    テム用辞書・ルール学習装置。
  10. 【請求項10】 前記学習手段の学習終了を判定する判
    定手段を含む請求項9記載の機械翻訳用システム用辞書
    ・ルール学習装置。
  11. 【請求項11】 前記差分抽出手段で得られた差分を記
    録する差分記録手段を含み、 前記判定手段は、該差分記録手段の記録内容が定常状態
    になった時に学習を終了する請求項10記載の機械翻訳
    用システム用辞書・ルール学習装置。
  12. 【請求項12】 前記辞書・ルール追加変更手段は、辞
    書またはルールを変更する情報を表示する表示手段を含
    む請求項7記載の機械翻訳用システム用辞書・ルール学
    習装置。
JP03447694A 1994-03-04 1994-03-04 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置 Expired - Lifetime JP3358096B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03447694A JP3358096B2 (ja) 1994-03-04 1994-03-04 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03447694A JP3358096B2 (ja) 1994-03-04 1994-03-04 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置

Publications (2)

Publication Number Publication Date
JPH07244664A true JPH07244664A (ja) 1995-09-19
JP3358096B2 JP3358096B2 (ja) 2002-12-16

Family

ID=12415311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03447694A Expired - Lifetime JP3358096B2 (ja) 1994-03-04 1994-03-04 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置

Country Status (1)

Country Link
JP (1) JP3358096B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073604A (ja) * 2000-08-30 2002-03-12 Oki Electric Ind Co Ltd 翻訳サービス提供装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073604A (ja) * 2000-08-30 2002-03-12 Oki Electric Ind Co Ltd 翻訳サービス提供装置

Also Published As

Publication number Publication date
JP3358096B2 (ja) 2002-12-16

Similar Documents

Publication Publication Date Title
US5161105A (en) Machine translation apparatus having a process function for proper nouns with acronyms
Neumann et al. An information extraction core system for real world german text processing
KR100911621B1 (ko) 한영 자동번역 방법 및 장치
US20050171757A1 (en) Machine translation
JPH07244666A (ja) 自然言語自動翻訳方法及び自然言語自動翻訳装置
US5608623A (en) Special cooccurrence processing method and apparatus
US20040243394A1 (en) Natural language processing apparatus, natural language processing method, and natural language processing program
EP0398513B1 (en) Method and apparatus for translating a sentence including a compound word formed by hyphenation
JPH0261763A (ja) 機械翻訳装置
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
JP3358096B2 (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
KR100327115B1 (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JP2632806B2 (ja) 言語解析装置
Elleuch et al. Lexical data mining‐based approach for the self‐enrichment of LMF standardized dictionaries: Case of the syntactico‐semantic knowledge
JP3353647B2 (ja) 機械翻訳システム用辞書・ルール学習装置及び機械翻訳システム用辞書・ルール学習プログラムを格納した記憶媒体
JP3698454B2 (ja) 並列句解析装置および学習データ自動作成装置
Rosé et al. Recovering from parser failures: A hybrid statistical/symbolic approach
JPS61210479A (ja) 日本語文の形態素解析方式
JPH0869466A (ja) 自然言語解析装置
JP4103311B2 (ja) 自然言語処理装置及び方法
JPS6344276A (ja) 生成文法自動生成装置
JP2895137B2 (ja) 日本文誤り自動検出および訂正装置
JP3388393B2 (ja) データベースを利用したテンス、アスペクトあるいはモダリティに関する翻訳装置
JPH1031676A (ja) 対訳例文検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071011

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081011

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091011

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101011

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101011

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111011

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111011

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121011

Year of fee payment: 10