JP3353647B2 - Dictionary / rule learning device for machine translation system and storage medium storing dictionary / rule learning program for machine translation system - Google Patents

Dictionary / rule learning device for machine translation system and storage medium storing dictionary / rule learning program for machine translation system

Info

Publication number
JP3353647B2
JP3353647B2 JP13555397A JP13555397A JP3353647B2 JP 3353647 B2 JP3353647 B2 JP 3353647B2 JP 13555397 A JP13555397 A JP 13555397A JP 13555397 A JP13555397 A JP 13555397A JP 3353647 B2 JP3353647 B2 JP 3353647B2
Authority
JP
Japan
Prior art keywords
translation
word
ideal
dictionary
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13555397A
Other languages
Japanese (ja)
Other versions
JPH10326276A (en
Inventor
節夫 山田
浩巳 中岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP13555397A priority Critical patent/JP3353647B2/en
Publication of JPH10326276A publication Critical patent/JPH10326276A/en
Application granted granted Critical
Publication of JP3353647B2 publication Critical patent/JP3353647B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、機械翻訳システム
用辞書・ルール学習装置及び機械翻訳システム用辞書・
ルール学習プログラムを格納した記憶媒体に係り、特
に、機械翻訳システムで用いる辞書やルールを自動的に
学習するための機械翻訳システム用辞書・ルール学習
置及び機械翻訳システム用辞書・ルール学習プログラム
を格納した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dictionary / rule learning device for a machine translation system and a dictionary / machine dictionary for a machine translation system.
The present invention relates to a storage medium storing a rule learning program, and particularly to a dictionary and rule learning device for a machine translation system for automatically learning dictionaries and rules used in the machine translation system.
The present invention relates to a storage medium storing a dictionary / rule learning program for a translation and machine translation system.

【0002】[0002]

【従来の技術】従来は、機械翻訳システム用辞書やルー
ルを構築する場合、人間が翻訳等に利用する辞書などを
参考にして機械翻訳システム用の辞書やルールを人手で
構築するのが一般的である。また、このようにして構築
された機械翻訳システム用の辞書やルールは、機械翻訳
システムの翻訳結果をもとに、不適切な訳が生成されて
いる場合には、その訳を生成した原因となる辞書やルー
ルを、機械翻訳システムの内部処理を良く理解したエキ
スパートが人手で追加修正している。
2. Description of the Related Art Conventionally, when constructing a dictionary or a rule for a machine translation system, it is general to manually construct a dictionary or a rule for the machine translation system with reference to a dictionary or the like used for translation or the like by a human. It is. In addition, the dictionary and rules for the machine translation system constructed in this way are, if an inappropriate translation is generated based on the translation result of the machine translation system, the cause of the generation of the translation. Experts who have a good understanding of the internal processing of machine translation systems manually add and modify dictionaries and rules.

【0003】この辞書やルールの追加修正作業を自動化
する第1の手法としては、対訳関係にある原言語の文と
目的言語の文(理想訳文)に対の集合(対訳コーパス)
からそれぞれを解析することによって、生成される原言
語概念構造と理想訳文概念構造を比較することによっ
て、辞書を追加・修正する改良方法(例えば、『機械翻
訳装置』(特開平4−205056号))がある。
As a first technique for automating the work of adding and modifying dictionaries and rules, a set (a bilingual corpus) of pairs of a source language sentence and a target language sentence (ideal translation sentence) having a bilingual relationship.
An improved method for adding and modifying dictionaries by analyzing the source language concept structure and the ideal translation concept structure by analyzing each of them (for example, "Machine Translator" (Japanese Patent Laid-Open No. Hei 4-205056)) ).

【0004】また、第2の手法としては、対応関係にあ
る表現対を対訳コーパス中の原言語の文と目的言語の文
から抽出し、その結果に基づいて追加修正すべき翻訳規
則の候補をユーザに提示し、ユーザが指定した翻訳規則
を追加・修正する改良方法(例えば、『機械翻訳装置に
おける翻訳規則学習方法』(特開平8−101837
号))がある。
As a second technique, a pair of corresponding expressions is extracted from a source language sentence and a target language sentence in a bilingual corpus, and a translation rule candidate to be additionally corrected based on the result is extracted. An improved method of presenting to a user and adding / correcting a translation rule specified by the user (for example, “Translation rule learning method in machine translator”
No.)).

【0005】また、第3の手法としては、機械訳概念構
造と理想訳概念構造の違いから差分を抽出し、それを機
械翻訳システムにおける解決方法別に分類することによ
って、辞書やルールを追加修正し、追加修正された辞書
やルールを用いて最適な辞書やルールが登録されるまで
繰り返す方法(『機械翻訳システム用辞書・ルール学習
方法及び機械翻訳システム用辞書・ルール学習装置』
(特願平6−34476号))が知られている。
[0005] As a third technique, a difference is extracted from a difference between a machine translation concept structure and an ideal translation concept structure, and the difference is classified according to a solution method in a machine translation system to add or modify a dictionary or rule. , A method of repeating until an optimal dictionary or rule is registered using the dictionary or rule that has been added and corrected (“Dictionary / rule learning method for machine translation system and dictionary / rule learning device for machine translation system”)
(Japanese Patent Application No. 6-34476) is known.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上記の
従来の機械翻訳システムの辞書やルールの構築方法で
は、人間用に作成された辞書等を利用するため、機械翻
訳用に用いた場合、正しい訳が生成される保証がないと
いう問題がある。また、機械翻訳システムの辞書やルー
ルを追加修正するには、翻訳結果を機械翻訳システムの
内部処理を良く理解したエキスパートにより検証する必
要がある。よって、エキスパートでないと辞書やルール
の追加修正が不可能であるという問題点がある。また、
本作業は人手によるので、辞書やルールの構築のための
時間的経済的コストが高くなってしまうという問題点が
ある。
However, in the above-described method of constructing a dictionary or rule of the conventional machine translation system, a dictionary or the like created for humans is used. Is not guaranteed to be generated. Further, in order to add or modify the dictionary or rule of the machine translation system, it is necessary to verify the translation result by an expert who understands the internal processing of the machine translation system. Therefore, there is a problem that the dictionary and the rules cannot be additionally modified unless the user is an expert. Also,
Since this work is performed manually, there is a problem that time and economic costs for constructing a dictionary and rules are increased.

【0007】また、上記従来の技術のうちの後者、即
ち、改良方法においては、第1の手法の場合、対訳コー
パスの情報のみから、機械翻訳システムの翻訳結果を考
慮せずに、辞書やルールが追加変更されるため、既存の
辞書やルールに対して対訳コーパスにより不適切な追加
変更がなされ、機械翻訳結果に悪影響を及ぼすという問
題がある。
In the latter of the above conventional techniques, that is, in the improvement method, in the case of the first method, a dictionary or a rule can be obtained from the bilingual corpus information without considering the translation result of the machine translation system. However, there is a problem that an improper additional change is made to an existing dictionary or rule by a bilingual corpus, which adversely affects a machine translation result.

【0008】また、第2の手法の場合、ユーザによる人
手による操作を前提としているため、辞書やルールの構
築のための時間的経済的コストが高くなるという問題が
ある。さらに、第1の手法と第2の手法と共に学習過程
が一度しかないため、学習した結果が本当に正しいもの
かどうか不明である。第3の手法の場合、利用訳概念構
造生成手段の使用を前提としているため、理想訳概念構
造を生成する手段がない場合や、理想訳が大量にあり、
理想訳構造を生成するための時間的計算機的余裕がない
場合には、この手法で解決することは不可能である。ま
た、理想訳概念構造を生成する手段があっても、生成さ
れる理想訳概念構造の信頼性が低い場合には、誤った理
想訳概念構造を参考にして辞書やルールを追加修正され
てしまう場合があるため、効果的な追加修正を効率的に
行うことができない。
In the second method, since a manual operation by a user is assumed, there is a problem that time and economic costs for constructing a dictionary and rules are increased. Further, since there is only one learning process together with the first method and the second method, it is unclear whether the learning result is really correct. In the case of the third method, it is assumed that there is no means for generating an ideal translation concept structure, or there is a large number of ideal translations,
If there is not enough time and computer space to generate the ideal translation structure, it is impossible to solve the problem using this method. In addition, even if there is a means for generating an idealized translation concept structure, if the generated ideal translation concept structure has low reliability, the dictionary and rules are added and corrected by referring to the incorrect ideal translation concept structure. In some cases, effective additional correction cannot be performed efficiently.

【0009】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、理想訳概念辞書生成手
段の使用を前提にせずに、辞書対訳コーパスの入力文及
び理想文の情報のみならず、機械翻訳システムが出力し
た機械訳文の情報も利用し、対訳辞書や目的言語である
第2の言語の辞書を参照して、入力文、機械訳文、理想
訳文の3種類の文から、入力文中の入力単語とその入力
単語と対訳関係にある機械訳文中の機械訳語及び理想訳
文中の理想訳語の3組の集合を抽出し、現在の機械訳文
の結果も考慮しつつ、最適な辞書やルールを追加修正す
る機械翻訳用システム用辞書・ルール学習装置及び機械
翻訳システム用辞書・ルール学習プログラムを格納した
記憶媒体を提供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above points, and solves the above-mentioned conventional problems. The present invention is not limited to the use of the ideal translation concept dictionary generating means, and is not limited to the use of the ideal bilingual corpus. Using not only the information but also the information of the machine translation sentence output by the machine translation system, referring to the bilingual dictionary and the dictionary of the second language which is the target language, the input sentence, the machine translation, and the ideal translation are three types of sentences. From the input word in the input sentence, and a set of three sets of a machine translation word in the machine translation sentence and the ideal translation word in the ideal translation, which are in parallel with the input word, are extracted. An object of the present invention is to provide a dictionary / rule learning device for a machine translation system for adding and modifying a simple dictionary and rules, and a storage medium storing a dictionary / rule learning program for a machine translation system.

【0010】[0010]

【課題を解決するための手段】[Means for Solving the Problems]

【0011】[0011]

【0012】[0012]

【0013】[0013]

【0014】[0014]

【0015】[0015]

【0016】[0016]

【0017】[0017]

【0018】[0018]

【0019】[0019]

【0020】[0020]

【0021】[0021]

【0022】[0022]

【0023】本発明は、原言語である第1の自然言語の
入力文を目的言語である第2の自然言語の文に変換する
機械翻訳システムで利用する辞書やルールを追加変更
る機械翻訳システム用辞書・ルール学習装置であって、
入力文と対訳関係にある第2の自然言語の理想訳文を入
力する理想訳文入力手段と、理想訳文入力手段により、
入力された入力文を機械翻訳システムで変換した第2の
自然言語の機械訳文と、該入力文とを比較する比較手段
と、比較手段により、入力文中の入力単語と対訳関係に
ある該機械訳語及び理想訳文中の理想訳語の3組の集合
を抽出することにより、辞書やルールの何れかまたは、
両方を追加変更する更新手段とを有する。
According to the present invention, a dictionary and rules used in a machine translation system for converting an input sentence of a first natural language which is a source language into a sentence of a second natural language which is a target language are additionally changed . A machine translation system dictionary / rule learning device,
An ideal translation input means for inputting an ideal translation of a second natural language having a bilingual relationship with the input sentence, and an ideal translation input means,
A second natural language machine translation sentence converted from the input sentence by the machine translation system, a comparing means for comparing the input sentence, and the comparing means, the machine translation word having a parallel translation with the input word in the input sentence. And, by extracting a set of three sets of ideal translation words in the ideal translation, either a dictionary or a rule,
Update means for adding and changing both.

【0024】また、本発明は、互いに対訳関係にある入
力文と、第2の自然言語の理想訳文を読み込む対訳文読
み込み手段と、 入力文と理想訳文と機械訳文を比較し
て、該入力文中の入力単語と該入力単語と対訳関係にあ
る該機械訳文中の機械訳語及び該理想訳文中の理想訳語
の3組である対訳表現組の集合である対訳表現集合を抽
出する対訳表現組抽出手段と、 対訳表現組抽出手段で抽
出された対訳表現組集合に基づいて、辞書や、ルールを
追加変更する辞書・ルール追加変更手段を含む。
Further, the present invention relates to input data having a bilingual relation with each other.
Bilingual reading that reads the literary sentence and the ideal translation of the second natural language
Compare the input sentence, the ideal translation and the machine translation
The input word in the input sentence and the input word
The machine translation in the machine translation and the ideal translation in the ideal translation
Extract a bilingual expression set, which is a set of bilingual expression sets
The extracted bilingual expression set extracting means and the bilingual expression
Based on the set of bilingual expression sets issued, a dictionary or rule
Includes dictionary / rule addition / change means for additional change.

【0025】また、本発明の対訳表現組抽出手段は、
訳表現集合を抽出する際に、入力文を機械翻訳システム
で機械訳文に変換する際の変換履歴を用いて該入力文中
の入力単語と対訳関係にある該機械訳文中の機械訳語を
抽出する対訳機械訳語対抽出手段を含む。また、本発明
の対訳表現組抽出手段は、対訳表現集合を抽出する際
に、入力文中の入力単語と対訳関係にある理想訳文中の
理想訳語を抽出する対訳理想訳語対抽出手段を含む。
Further, the bilingual expression set extracting means of the present invention, when extracting the bilingual expression set, uses the conversion history when the input sentence is converted into the machine translated sentence by the machine translation system and compares the input word in the input sentence with the input word. A bilingual machine translation word pair extracting means for extracting a machine translation word in the machine translation sentence having a bilingual relationship. Further, the bilingual expression set extraction means of the present invention includes a bilingual ideal translation word pair extracting means for extracting an ideal translation word in an ideal translation text having a bilingual relationship with the input word in the input sentence when extracting the bilingual expression set.

【0026】また、本発明の対訳理想訳語対抽出手段
は、第1の自然言語と第2の自然言語の対訳辞書と、理
想訳語を抽出する際に利用して、該入力文中の入力単語
をキーにして、対訳辞書を検索し、該入力単語と対訳関
係にある第2の自然言語の入力単語訳語候補を抽出する
入力単語訳語候補抽出手段と、入力単語訳語候補と理想
訳語を比較して、対訳関係にある入力文中の入力単語と
理想訳文中の理想訳語の対の組を抽出する入力単語・理
想訳語対抽出手段とを含む。
The bilingual ideal translation pair extracting means of the present invention uses the bilingual dictionaries of the first natural language and the second natural language, and extracts the ideal translation word to extract the input word in the input sentence. Using the key as a key, a bilingual dictionary is searched, and an input word translation candidate extracting means for extracting an input word translation candidate of a second natural language having a bilingual relationship with the input word, and comparing the input word translation candidate with an ideal translation. And an input word / ideal translation word pair extracting means for extracting a pair of a pair of an input word in an input translation and an ideal translation word in an ideal translation.

【0027】また、本発明の対訳理想訳語対抽出手段
は、第2の自然言語の辞書と、入力単語訳語候補抽出手
段で抽出される入力単語訳語候補をキーにして、第2の
自然言語の辞書を検索して抽出される入力単語訳語候補
関連語と理想訳語とを比較して、対訳関係にある入力文
中の入力単語と該理想訳文中の理想訳語の対の組を抽出
する手段を含む。
The bilingual ideal translation pair extraction means of the present invention uses the second natural language dictionary and the input word translation candidate extracted by the input word translation candidate extraction key as keys, Means for comparing the input word candidate candidate related word extracted by searching the dictionary with the ideal translation and extracting a set of a pair of the input word in the input sentence and the ideal translation in the ideal translation having a bilingual relationship .

【0028】また、本発明の対訳表現組抽出手段は、
訳表現組集合を抽出する際に、対応関係にある機械訳文
中の機械訳語と理想訳文中の理想訳語を抽出する対応機
械訳語理想語対抽出手段を含む。また、本発明の対応機
械訳語理想語対抽出手段は、機械訳文中の機械訳語と理
想訳文中の理想訳語を抽出する際に、第2の自然言語の
辞書を利用する手段を含む。
The bilingual expression set extracting means of the present invention, when extracting a bilingual expression set set, extracts a corresponding machine translation word in a corresponding machine translation sentence and an ideal machine translation ideal word in an ideal translation sentence. Including pair extraction means. Further, the corresponding machine translated word ideal word pair extracting means of the present invention includes means for using a second natural language dictionary when extracting the machine translated word in the machine translated sentence and the ideal translated word in the ideal translated sentence.

【0029】また、本発明の対応機械訳語理想語対抽出
手段は、機械訳文中の機械訳語と理想訳文中の理想訳語
を抽出する際に、第2の自然言語の辞書を利用して、機
械訳文中の機械訳語をキーにし、該第2の自然言語の辞
書を検索して抽出される機械訳語関連語と理想訳語を比
較する手段を含む。また、本発明の対応機械訳語理想語
対抽出手段は、機械訳文中の機械訳語と理想訳文中の理
想訳語を抽出する際に、第2の自然言語の辞書を利用し
て、機械訳文中の機械訳語をキーにし、該第2の自然言
語の辞書を検索して抽出される機械訳語関連語と理想訳
語を比較する手段を含む。
The corresponding machine translated word ideal word pair extracting means of the present invention uses a second natural language dictionary when extracting the machine translated word in the machine translated sentence and the ideal translated word in the ideal translated sentence. the machine translation in translation as a key, comprising a means for comparing the machine translation related words and ideal translation extracted by searching the second natural language dictionary. Further, the corresponding machine translated word ideal word pair extracting means of the present invention uses the second natural language dictionary when extracting the machine translated word in the machine translated sentence and the ideal translated word in the ideal translated sentence. Means for comparing a machine-translated word extracted from the second natural-language dictionary by using the machine-translated word as a key and an ideal translated word;

【0030】また、本発明の対応機械訳語理想語対抽出
手段は、機械訳文中の機械訳語と理想訳文中の理想訳語
を抽出する際に、第1の自然言語と第2の自然言語の対
訳辞書を利用して、機械訳文中の機械訳語をキーに得ら
れる第1の自然言語の訳語の集合である機械訳逆引訳語
候補と、理想訳文中の理想訳語をキーに得られる第1の
自然言語の訳語の集合である理想訳逆引訳語候補を抽出
する手段と、機械訳逆引き訳語候補と該理想訳逆引訳語
候補を比較することによって、対応関係にある該機械訳
文中の機械訳語と、該理想訳文中の理想訳語を抽出する
手段を含む。
The corresponding machine translated word ideal word pair extracting means of the present invention, when extracting the machine translated word in the machine translated sentence and the ideal translated word in the ideal translated sentence, translates between the first natural language and the second natural language. Using the dictionary, a machine translation reverse translation candidate that is a set of translations of the first natural language obtained using the machine translation in the machine translation as a key, and a first translation using the ideal translation in the ideal translation as a key Means for extracting a candidate for a reverse translation word, which is a set of translations of a natural language; and comparing the candidate for a reverse translation word for a machine translation with the candidate for a reverse translation word for a machine. It includes a translation and means for extracting an ideal translation in the ideal translation.

【0031】また、本発明の対訳表現組抽出手段は、
2の自然言語の語同士を比較する際に、機械訳文中の機
械語または、入力単語訳語候補または、入力単語訳語候
補関連語または、機械訳語関連語の少なくとも1つの語
の異なり別に集計した機械訳語異なり語リストを作成す
る手段と、理想訳文中の理想訳語または、理想訳語関連
語のいずれか、または、両方の異なり別に集計した理想
訳語異なり語リストを作成する手段と、機械訳異なり語
リスト中の語と、理想訳異なり語リスト中の語を比較す
手段とを含む
Further, the bilingual expression set extraction means of the present invention, when comparing the words of the second natural language, can use the machine language in the machine translation, the input word translation candidate, or the input word translation candidate related word or A means for creating a list of different machine-translated words, which are calculated separately for at least one of the machine-translated words, and a method for calculating the list of ideal-translated words or ideal-translated words in an ideal translation, or both. Means for creating a word list different from the ideal translation word, and means for comparing words in the word list different from the machine translation and words in the word list different from the ideal translation are included .

【0032】また、本発明の対訳表現組抽出手段は、
1の自然言語の語同士を比較する際に、入力単語、機械
訳逆引訳語候補の少なくとも1つを、語の異なり別に集
計した入力単語機械訳逆引訳語候補異なり語リストを作
する手段と、理想訳逆引訳語候補を語の異なり別に集
計した理想訳逆引訳語候補異なり語リストを作成する手
段と、入力単語機械訳逆引訳語候補異なり語リスト中の
語と理想訳逆引訳語候補異なり語リスト中の語を比較す
る手段を含む。
Further, the bilingual expression set extracting means of the present invention, when comparing the words of the first natural language, sums up at least one of the input word and the machine translation reverse-translated word candidate separately for each word. A means for creating a list of words that are different from the input word machine translation reverse translation candidate, a means for creating a list of words that are different from the ideal translation reverse translation word candidate by summing up the ideal translation reverse translation word candidates, and an input word machine translation reverse Means for comparing a word in the word list with a different candidate word and a word in a word list with a different ideal translation word candidate are included.

【0033】また、本発明の対訳表現組抽出手段は、
1の自然言語の語同士、第2の自然言語の語同士を比較
する際に、 両者の語が一致するか、一方の語が他方の
語を含んでいるか、両方の語の一部が一致するかによ
り、対応の度合を区別する手段を含む。また、本発明の
対訳表現組抽出手段は、理想訳文を形態素解析し、理想
訳形態素構造を抽出する際に、理想訳形態素構造の情報
を利用して、機械訳逆引訳語候補、理想訳逆引訳語候
補、理想訳異なり語リスト中の語の少なくとも1つと、
機械訳異なり語リスト中の語、機械訳逆引訳語候補異な
り語リスト中の語、理想訳逆引訳語候補異なり語リスト
中の語の少なくとも1つを比較する手段を含む。
Further, the bilingual expression set extracting means of the present invention, when comparing the words of the first natural language and the words of the second natural language, whether the two words match or one of the words Means for distinguishing the degree of correspondence depending on whether the other word is included or a part of both words match is included. Further, the bilingual expression set extraction means of the present invention performs morphological analysis of the ideal translation and extracts information of the ideal translation morpheme structure using information of the ideal translation morpheme structure, and uses the information of the machine translation reverse translation word candidate and the ideal translation reverse translation. At least one of the words in the word list, unlike the ideal translation,
Means for comparing at least one of the words in the word list different from the machine translation, the words in the word list different from the candidate for machine translation reverse word, and the words in the word list different from the candidate word for ideal translation reverse translation are included.

【0034】また、本発明の対訳表現組抽出手段によっ
て抽出される対訳表現組集合から、入力文と理想訳文と
機械訳文の1組から抽出できる対訳表現組の組み合わせ
である対訳表現組み合わせの集合を抽出する対訳表現組
み合わせ抽出手段を更に有する。また、本発明の対訳表
現組抽出手段は、対訳表現組抽出手段によって、抽出さ
れる対訳表現組集合の個々の対訳表現組に、個々の対訳
表現組の抽出過程に応じた確度である対訳表現組確度を
付与する対訳表現組確度付与手段を有し、対訳表現組み
合わせ抽出手段は、対訳表現集合中の個々の対訳表現組
に付与された対訳表現組確度を利用して、個々の対訳表
現組み合わせに確度を付与する手段を有し、辞書・ルー
ル追加変更手段は、対訳表現組み合わせ抽出手段によっ
て、抽出される対訳表現組み合わせ集合中の個々の対訳
表現組み合わせに付与された確度を利用して辞書やルー
ルを追加変更する手段を有する
A set of bilingual expression sets that can be extracted from a set of an input sentence, an ideal translated sentence, and a machine translated sentence from a set of bilingual expression sets extracted by the bilingual expression set extracting means of the present invention. There is further provided a bilingual expression combination extracting means for extracting a set of bilingual expression combinations. The bilingual table of the present invention
Current set extraction means, the translated expression set extraction unit, the individual translated expression of sets of translated expression set set to be extracted, imparting translated expression set accuracy is accuracy in accordance with the individual translated expression of sets of extraction process bilingual has a representation of sets accuracy imparting means, translated expression combination extraction means uses the translated expression set accuracy granted to individual translated expression of sets of translated expression set in, means for applying a probability to each translated expression combination The dictionary / rule addition / change means is provided by the bilingual expression combination extraction means.
Te, dictionaries and rules using the probability granted to each translated expression combinations of translated expression combination set in which is extracted
A means for adding and changing files .

【0035】また、本発明は、機械翻訳システム用辞書
・ルール学習装置によって得られる辞書やルールを用い
学習を繰り返す繰り返し手段を有する。また、本発明
の辞書・ルール追加変更手段は、学習終了を判定する学
習終了判定手段を含む。また、本発明は、機械翻訳シス
テム用辞書・ルール学習装置によって得られる辞書やル
ールを用いて該入力文を翻訳した結果の履歴である機械
訳文履歴格納手段に記録する機械翻訳履歴保持手段を有
し、学習終了判定手段は、機械訳文履歴格納手段の記録
内容が定常状態になったときに、学習が終了すると判定
する手段を含む。
Further, the present invention has a repetition means for repeating learning using dictionaries and rules obtained by a dictionary / rule learning device for a machine translation system. Further, the dictionary / rule addition / change means of the present invention includes a learning end determining means for determining the end of learning. Further, the present invention has a machine translation history holding unit that records in a machine translation history storage unit which is a history of a result of translating the input sentence using a dictionary or a rule obtained by a dictionary / rule learning device for a machine translation system. The learning end determining means includes means for determining that learning is to be ended when the recorded contents of the machine translation history storage means are in a steady state.

【0036】また、本発明は、辞書・ルール追加変更手
段は、辞書または、ルールを変更する情報を表示する表
示手段を含む。本発明は、原言語である第1の自然言語
の入力文を目的言語である第2の自然言語の文に変換す
る機械翻訳システムで利用する辞書やルールを追加変更
する機械翻訳システム用辞書・ルール学習プログラムを
格納した記憶媒体であって、入力文と対訳関係にある第
2の自然言語の理想訳文を入力する理想訳文入力ステッ
プと、理想訳文入力ステップにより、入力された入力文
を機械翻訳システムで変換した第2の自然言語の機械訳
文と、該入力文とを比較する比較ステップと、比較ステ
ップにより、該入力文中の入力単語と対訳関係にある該
機械訳語及び理想訳文中の理想訳語の3組の集合を抽出
することにより、辞書やルールの何れかまたは、両方を
追加変更する更新ステップからなる機械翻訳システム用
辞書・ルール学習プログラムを格納する。
Further, the present invention is a dictionary rules additional changing means comprises display means for displaying the dictionary or information to change the rule. The present invention additionally modifies a dictionary and rules used in a machine translation system that converts an input sentence of a first natural language as a source language into a sentence of a second natural language as a target language.
To a storage medium storing a machine translation system for a dictionary-rule learning program, ideal translation input to enter the ideal translation of the second of natural language in the input sentence and the bilingual relationship steps
And a comparison step of comparing the input sentence with the machine translation sentence of the second natural language obtained by converting the input sentence by the machine translation system in the ideal translation inputting step , and a comparison step.
By-up by extracting the three sets of the set of ideal translation of the machine translation and the ideal in translation in the input word and translation relationship of the input sentence, adds change either or both dictionary and rules update Machine translation system consisting of steps
Stores dictionary / rule learning programs.

【0037】上記のように、本発明の機械翻訳システム
用辞書・ルール学習装置においては、対訳文読み込み
段は、互いに対訳関係にある第1の自然言語(入力文)
と第2の自然言語(理想文)を読み込む。これから以下
手段によって機械翻訳システム用辞書やルールが自動
的に新規作成及び追加修正される。対訳表現組抽出手段
は、入力文と理想訳文を比較して、入力文中の入力単語
と、入力単語と対訳関係にある機械訳文中の機械訳語及
び理想訳文中の理想訳語の3組である対訳表現組の集合
である対訳表現組集合を抽出する。辞書・ルール追加
は、対訳表現組抽出手段で抽出された対訳表現組集合
を基に辞書やルールを追加変更する。これにより、入力
文と理想訳文から機械翻訳システム用辞書やルールが自
動的に作成または追加変更できる。
[0037] As described above, in machine translation dictionary rule learning device for the system of the present invention, the translation reads hand
Stage, a first natural language in the translation of each other (input sentence)
And the second natural language (ideal sentence). From now on, the dictionary and rules for the machine translation system are automatically created and added and corrected by the following means . The bilingual expression set extracting means compares the input sentence with the ideal translation, and finds the input word in the input sentence, the machine translation in the machine translation having a bilingual relationship with the input word, and the ideal translation in the ideal translation. A bilingual expression set set, which is a set of bilingual expression sets, is extracted. Dictionary rules additional hand
In the stage , the dictionary and rules are additionally changed based on the bilingual expression group set extracted by the bilingual expression group extracting means . As a result, a dictionary or a rule for a machine translation system can be automatically created or additionally changed from the input sentence and the ideal translation.

【0038】また、対訳表現組抽出手段は、入力文を機
械翻訳システムで機械訳文に変換する際の変換履歴を用
いて、入力文中の入力単語と対訳関係にある機械訳文中
の機械訳語を抽出する対訳機械訳語対抽出手段を設ける
ことができる。これにより、入力文中の入力単語と対訳
関係にある機械訳文中の機械訳語を正確に対応付けする
ことができ、入力文中の入力単語と対訳関係にある機械
訳文中の機械訳語の組を抽出できる。
The bilingual expression set extracting means extracts a machine translation word in a machine translation sentence having a bilingual relationship with an input word in the input sentence by using a conversion history when the input sentence is converted into a machine translation sentence by a machine translation system. A bilingual machine translation word pair extracting means can be provided. As a result, it is possible to accurately associate a machine translation word in a machine translation sentence having a parallel translation with an input word in an input sentence, and to extract a set of machine translation words in a machine translation sentence having a parallel translation with the input word in the input sentence. .

【0039】また、対訳表現組抽出手段に、入力文中の
入力単語と、対訳関係にある理想訳文中の理想訳語を抽
出する対訳理想訳語対抽出手段を設けることができる。
これにより、機械翻訳システム用辞書やルールを作成、
または、追加変更するための基となる対の組を抽出でき
る。また、対訳理想訳語対抽出手段に、第1の自然言語
と第2の自然言語の対訳辞書を利用して、入力文中の入
力単語をキーに対訳辞書を検索し、入力単語と対訳関係
にある第2の自然言語の入力単語訳語候補を抽出する入
力単語訳語候補抽出手段を設けることができる。これに
より、入力単語候補と理想訳語を対訳辞書に基づき比較
することができ、一致した入力単語訳語候補の元となる
入力単語と、対訳関係にある理想訳語の対を、より正確
に、より多く抽出することができる。
Further, the bilingual expression set extracting means may be provided with a bilingual ideal translation pair extracting means for extracting an input word in the input sentence and an ideal translation in an ideal translation having a bilingual relationship.
This creates a dictionary and rules for machine translation systems,
Alternatively, it is possible to extract a pair pair serving as a base for additional change. Also, the bilingual ideal translation word pair extracting means uses the bilingual dictionaries of the first natural language and the second natural language to search the bilingual dictionary using the input word in the input sentence as a key, and has a bilingual relationship with the input word. An input word translation candidate extraction means for extracting an input word translation candidate of the second natural language can be provided. Thereby, the input word candidate and the ideal translation can be compared based on the bilingual dictionary, and the number of pairs of the input word that is the source of the matched input word translation candidate and the ideal translation having a bilingual relationship can be more accurately and more often. Can be extracted.

【0040】また、入力単語訳語候補抽出手段で抽出さ
れる入力単語訳語候補をキーに、第2の自然言語の辞書
を検索して抽出される入力単語訳語候補関連語と理想訳
語を比較することができる。これにより、より多くの対
訳関係にある入力文中の入力単語と理想訳文中の理想訳
語の対の組を抽出することができる。また、対訳表現組
抽出手段に、対応関係にある機械訳文中の機械訳語と理
想訳文中の理想訳語を抽出する対応機械訳語理想訳語対
抽出手段を設けることができる。これにより、対応関係
にある機械訳文中の機械訳語と、理想訳文中の理想訳語
の組の情報を活用して、辞書やルールを追加変更するか
どうかを決めることができる。
Further, using the input word translation candidate extracted by the input word translation candidate extraction means as a key, a second natural language dictionary is searched to compare the input word translation candidate candidate related word extracted with the ideal translation. Can be. As a result, more pairs of pairs of the input word in the input sentence and the ideal translated word in the ideal translated sentence having a bilingual relationship can be extracted. Further, the bilingual expression set extracting means may be provided with a corresponding machine translation ideal translation word pair extracting means for extracting a machine translation word in the corresponding machine translation sentence and an ideal translation word in the ideal translation sentence. This makes it possible to determine whether to add or change a dictionary or a rule by using information on a set of a machine translation word in a corresponding machine translation and an ideal translation in an ideal translation.

【0041】また、対応機械訳語理想訳語対抽出手段
おいて、第2の自然言語の辞書を利用することができ、
機械訳文中の機械訳語をキーに第2の自然言語の辞書を
検索して抽出される機械訳語関連語と理想訳語を比較す
ることや、理想訳文中の理想訳語をキーに第2の自然言
語の辞書を検索して抽出される理想訳語関連語と機械訳
語を比較することができる。これにより、より多くの対
応関係にある機械訳文中の機械訳語と理想訳文中の理想
訳語の対の組を抽出することができる。
In the corresponding machine translation ideal translation pair extraction means , the second natural language dictionary can be used.
A second natural language dictionary is searched using a machine translation word in a machine translation key as a key to compare a machine translation related word extracted with an ideal translation word, or a second natural language using an ideal translation word in an ideal translation key as a key And the machine translation can be compared with the ideal translation related word extracted by searching the dictionary. This makes it possible to extract pairs of pairs of the machine translation words in the machine translation and the ideal translations in the ideal translation that have more correspondence.

【0042】また、対応機械訳語理想訳語対抽出手段
おいて、第1の自然言語と第2の自然言語の対訳辞書を
利用して、機械訳文中の機械訳語をキーにして得られる
第1の自然言語の訳語の集合である機械訳逆引訳語候補
と、理想訳文中の理想訳語をキーにして得られる第1の
自然言語の訳語の集合である理想訳逆引訳語候補を抽出
し、機械訳逆引訳語候補を比較することができる。これ
により、対応関係にある機械訳文中の機械訳語と理想訳
文中の理想訳語をより多く抽出することができる。
Further, the corresponding machine translation ideal translation pair extracting means <br/> Oite, by utilizing the first natural language and a second natural language bilingual dictionary, the machine translation in the machine translation key and machine translation reverse引訳word candidate is a collection of the first natural language translation obtained Te, ideal translation reverse引訳language is a set of the first natural language translation obtained by the ideal translation in the ideal translation in key Candidates can be extracted and machine translation reverse translated word candidates can be compared. As a result, it is possible to extract more machine translation words in the corresponding machine translation and ideal translations in the ideal translation.

【0043】また、対訳表現組抽出手段において、第2
の自然言語の語同士を比較する際に、機械訳文中の機械
訳語及び/又は入力単語訳語候補及び/は、入力単語
訳語候補関連語及び/又は機械訳語関連語を語の異なり
別に集計した機械訳異なり語リストを作成し、理想訳文
中の理想訳語及び/又は、理想訳関連語を語の異なり別
に集計した理想訳異なり語リストを作成し、機械訳異な
り語リスト中の語と理想訳異なり語リスト中の語を比較
することができる。これにより、繰り返し同じ訳語同士
比較することが避けられる。
In the bilingual expression set extracting means , the second
When comparing the word to each other in the natural language of, machine translation and / or input word translation candidate and / or in machine translation, obtained by aggregating the input word translation candidate related words and / or machine translation related words for each different word Create a list of words that are different from the machine translation, and create a list of words that are different from the ideal translation and / or the related words that are related to the ideal translation. Different words in the word list can be compared. This allows the same translation to be repeated
It is avoided to compare.

【0044】また、対訳表現組抽出手段において、第1
の自然言語の語同士を比較する際に、入力単語及び/又
は機械訳逆引訳語候補を語の異なり別に集計した入力単
語機械訳逆引訳語候補異なり語リストを作成し、理想訳
逆引訳語候補を語の異なり別に集計した理想訳逆引訳語
候補異なり語リストを作成し、入力単語機械訳逆引訳語
候補異なり語リスト中の語と理想訳逆引訳語候補異なり
語リスト中の語を比較することができる。これにより、
繰り返し同じ訳語同士の比較をすることが避けられる。
[0044] In addition, in the bilingual representation of sets extracted detemir stage, the first
When comparing the natural language words of each other, the input word and / or the machine translation reverse translation word candidate are aggregated separately for each word, and the input word machine translation reverse translation word candidate different word list is created, and the ideal translation reverse translation word is created. Creates a list of words that differ in terms of ideal translations and reverse translations, and compares the words in the list of words that are different from those in the list of input translations. can do. This allows
Avoiding repeated comparisons of the same translation.

【0045】また、対訳表現組抽出手段において、第1
の自然言語の語同士及び/又は、第2の自然言語の語同
士を比較する際に、両者の語が一致するか、一方の語が
他方の語を含んでいるか、両方の語の一部が一致するか
により対応の度合を区別することができる。これによ
り、より多くの対訳表現組を抽出することができる。
In the bilingual expression set extracting means , the first
When comparing natural language words and / or second natural language words, both words match, one word contains the other word, or a part of both words The degree of correspondence can be distinguished depending on whether or not. As a result, more bilingual expression sets can be extracted.

【0046】また、対訳表現組抽出手段に、理想訳文を
形態素解析し、理想訳形態素構造を抽出する理想訳文形
態素解析手段を設けることができる。これにより、理想
訳形態素構造の情報を利用して機械訳逆引訳語候補と理
想訳逆引訳語候補及び/又は、理想訳異なり語リストの
語の機械訳異なり語リスト中の語及び/又は機械訳逆引
訳語候補異なり語リスト中の語と理想訳逆引訳語候補異
なり語リスト中の語を比較することができる。これによ
り、より正確な対訳表現組を抽出できる。
Further, the bilingual expression set extracting means may be provided with an ideal translation morphological analysis means for morphologically analyzing an ideal translation and extracting an ideal translation morpheme structure. Thus, the machine translation reverse candidate word candidate and the ideal translation reverse translation word candidate and / or the machine translation of the word of the ideal translation different word list using the information of the ideal translation morphological structure and / or the machine and / or the machine in the different word list are different. It is possible to compare the words in the word list different from the candidate reverse translation word candidate with the words in the word list different from the ideal translation reverse translation word candidate. As a result, a more accurate bilingual expression set can be extracted.

【0047】また、対訳表現組抽出手段によって抽出さ
れる対訳表現組集合から、入力文と理想訳文と機械訳文
の1組から抽出できる対訳表現組の組合せである対訳表
現組合せ集合を抽出する対訳表現組合せ抽出手段を設け
ることができる。これにより、入力文と理想訳文と機械
訳文の1組から抽出され得る対訳表現組の組合せを抽出
することができる。
Further, the translated expression set set extracted by the translated expression set extraction unit, translated expression of extracting translated expressions combination set is translated expression of sets of combinations that can be extracted from a set of input text and the ideal translation and machine translation Combination extraction means may be provided. This makes it possible to extract a combination of bilingual expression sets that can be extracted from one set of the input sentence, the ideal translation, and the machine translation.

【0048】また、対訳表現組抽出手段に、個々の対訳
表現組の抽出過程に応じた確度である対訳表現組確度を
付与する対訳表現組確度付与手段を設けることができ、
対訳表現組合せ抽出手段において、対訳表現組集合中の
個々の対訳表現組に付与された対訳表現組確度を利用し
て個々の対訳表現組合せに確度を付与し、辞書・ルール
追加変更手段において、対訳表現組合せ抽出手段によっ
て抽出される対訳表現組合せ集合中の個々の該対訳表現
組合せに付与された確度を利用して辞書やルールを追加
変更することができる。これにより、対訳表現組合せ集
合中、確度が高い対訳表現組合せを利用して、より正確
で効率的に機械翻訳システム用辞書やルールを作成また
は、追加変更することができる。
Further, the bilingual expression group extracting means can be provided with a bilingual expression group certainty providing means for giving a bilingual expression group certainty which is a certainty according to the extraction process of each bilingual expression group,
The bilingual expression combination extracting means assigns certainty to each bilingual expression combination using the bilingual expression set accuracy given to each bilingual expression set in the bilingual expression set set, and the bilingual expression combination changing means adds The dictionary or rule can be additionally changed using the certainty given to each of the bilingual expression combinations in the bilingual expression combination set extracted by the expression combination extracting means . As a result, it is possible to more accurately and efficiently create or add a dictionary or a rule for a machine translation system by using a bilingual expression combination having high accuracy in the bilingual expression combination set.

【0049】本発明の機械翻訳システム用辞書・ルール
学習装置によって得られる辞書やルールを用いて機械翻
訳システム用辞書・ルールの学習を繰り返すことができ
る。これにより、作成または、追加変更された辞書やル
ールの検証ができ、さらに、1回の学習過程では得られ
なかった対訳表現対やルールを抽出することも可能とな
る。
[0049] The dictionary and rules obtained by machine translation system dictionary rule learning device of the present invention can be repeated a learning dictionary rules for machine translation systems using. As a result, the created or added dictionary or rule can be verified, and a bilingual expression pair or rule that cannot be obtained in one learning process can be extracted.

【0050】学習終了判定手段は、本機械翻訳システム
用辞書・ルール学習装置によって、得られる辞書やルー
ルを用いて入力文を翻訳した結果の履歴である機械訳文
履歴格納部へ記録し、学習終了判定手段により得られた
機械訳文履歴格納部の記録内容が定常状態になったとき
に学習を終了することができる。これにより、最適な辞
書やルールが登録される。
The learning end judging means records, in the machine translation sentence storage unit, which is a history of the result of translating the input sentence by using the dictionary and rules obtained by the dictionary / rule learning apparatus for the machine translation system, and ends the learning. The learning can be terminated when the recorded content of the machine translation history storage unit obtained by the determination unit has reached a steady state. Thereby, the optimal dictionary and rules are registered.

【0051】また、辞書・ルール追加変更手段に、辞書
または、ルールを変更する情報を表示する機能を持たせ
ることができる。これにより、ユーザが辞書やルールの
変更を確認することができ、より正確な辞書やルールを
作成することが可能となる。従って、上記手段を用いる
ことにより、機械翻訳システム用辞書やルールが自動的
に作成または、追加変更され、機械翻訳システム用辞書
やルールの学習が可能となる。
Further, the dictionary / rule addition / change means may have a function of displaying information for changing the dictionary or the rule. As a result, the user can confirm the change of the dictionary or rule, and can create a more accurate dictionary or rule. Therefore, by using the above-mentioned means, a dictionary or a rule for a machine translation system is automatically created or additionally changed, and learning of a dictionary or a rule for a machine translation system becomes possible.

【0052】[0052]

【0053】[0053]

【発明の実施の形態】以下に、本発明の一実施例につい
て図面により説明する。本実施例では、第1の自然言語
が日本語、第2の自然言語が英語であるとする。図1
は、本発明の一実施例の機械翻訳用辞書・ルール学習シ
ステムの基本ブロック図である。同図に示す機械翻訳用
辞書・ルール学習システムは、対訳文読み込み部1、機
械翻訳システム部2、ルール3、辞書4、対訳表現組抽
出部5、対訳表現組合せ抽出部6、辞書・ルール追加変
更部7より構成される。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below.
This will be described with reference to the drawings. In this embodiment, the first natural language
Is Japanese, and the second natural language is English.FIG.
Is a machine translation dictionary / rule learning system according to an embodiment of the present invention.
It is a basic block diagram of a stem. For machine translation shown in the figure
The dictionary / rule learning system consists of a bilingual sentence reading unit 1,
Machine translation system part 2, rule 3, dictionary 4, bilingual expression group extraction
Output unit 5, bilingual expression combination extraction unit 6, dictionary / rule addition change
It is composed of a further part 7.

【0054】対訳文読み込み部1は、対訳関係にある第
1の自然言語の文(入力文)と第2の自然言語の文(理
想訳文)の対(対訳文)を入力する。機械翻訳システム
部2は、入力された第1の自然言語の文をルール3や辞
書4を用いて第2の自然言語の機械訳文に翻訳する。対
訳表現組抽出部5は、対訳機械訳語抽出部51、対訳理
想訳語抽出部52、対応機械訳語理想訳語対抽出部53
より構成され、機械翻訳システム部2で得られた機械訳
文と対訳文から得られた入力文と理想訳文から対応する
表現組である入力語、機械訳語、理想訳語の組を抽出す
る。
The bilingual sentence reading unit 1 inputs a pair (a bilingual sentence) of a first natural language sentence (input sentence) and a second natural language sentence (ideal translated sentence) having a bilingual relationship. The machine translation system unit 2 translates the input first natural language sentence into a second natural language machine translation using the rule 3 and the dictionary 4. The bilingual expression set extraction unit 5 includes a bilingual machine translation word extraction unit 51, a bilingual ideal translation word extraction unit 52, and a corresponding machine translation ideal translation word pair extraction unit 53.
A set of an input word, a machine translation word, and an ideal translation word, which is a corresponding expression group, is extracted from the input translation obtained from the machine translation sentence and the bilingual translation obtained by the machine translation system unit 2 and the ideal translation.

【0055】対訳機械訳語抽出部51は、機械翻訳シス
テム部2で機械訳文に変換する際の変換履歴を用いて入
力単語と対訳関係にある機械訳語を抽出する。対訳理想
訳語抽出部52は、例えば、第1の自然言語と第2の自
然言語の対訳辞書を利用して、入力単語をキーに対訳辞
書を検索し、入力単語と対訳関係になる理想訳語を抽出
する。
The bilingual machine translation word extracting unit 51 extracts a machine translation word having a bilingual relationship with the input word by using a conversion history when the machine translation system unit 2 converts it into a machine translation sentence. The bilingual ideal translation extraction unit 52 searches the bilingual dictionary using the input word as a key by using, for example, a bilingual dictionary of the first natural language and the second natural language, and finds an ideal translation having a bilingual relationship with the input word. Extract.

【0056】対応機械訳語理想訳語対抽出部53は、例
えば、第2の自然言語の辞書を利用して機械訳語関連語
や理想訳語関連語を検索したり、また、機械訳語をキー
に得られる第1の自然言語の訳語の集合である機械訳逆
引訳語候補と理想訳語をキーに得られる第1の自然言語
の訳語の集合である理想訳逆引訳語候補を検索したりす
る等で、対応関係にある機械訳語と理想訳語を抽出す
る。
The corresponding machine translation ideal translation pair extraction unit 53 retrieves a machine translation related word or an ideal translation related word using, for example, a second natural language dictionary, or obtains the machine translated word as a key. By searching for a machine translation reverse translation candidate candidate that is a set of first natural language translations and an ideal translation reverse translation candidate that is a set of first natural language translations obtained using an ideal translation as a key, Extract the corresponding machine translation and ideal translation.

【0057】対訳表現組み合わせ抽出部6は、対訳表現
確度付与部61、対訳表現組み合わせ作成部62より構
成され、対訳表現組抽出部5で得られた入力単語、機械
訳語、理想訳語の組の集合から、対訳文中で矛盾のない
対応関係からなる入力単語、機械訳語、理想訳語の組の
組み合わせを全て抽出する。対訳表現組確度付与部61
は、個々の対訳表現組に個々の対訳表現組の抽出過程に
応じた確度である対訳表現組確度を付与する。
The bilingual expression combination extraction unit 6 is composed of a bilingual expression certainty imparting unit 61 and a bilingual expression combination creating unit 62, and is a set of sets of input words, machine translation words, and ideal translation words obtained by the bilingual expression combination extraction unit 5. Then, all combinations of pairs of input words, machine translations, and ideal translations, which have a consistent correspondence in the bilingual sentence, are extracted. Bilingual expression set accuracy giving unit 61
Assigns, to each bilingual expression set, a bilingual expression set accuracy which is a certainty according to the extraction process of each bilingual expression set.

【0058】対訳表現組み合わせ作成部62は、対訳文
中で矛盾のない対応関係からなる入力単語、機械訳語、
理想訳語の組の組み合わせを全て作成し、対訳表現組確
度付与部61の結果を元に対訳表現組の組み合わせ毎に
確度を付与する。辞書・ルール追加変更部7は、対訳表
現組み合わせ抽出部6で得られた対訳表現組を基に辞書
やルールを追加変更する。
The bilingual expression combination creating unit 62 outputs an input word, a machine translated word,
All combinations of ideal translation word pairs are created, and the accuracy is given for each combination of the translation expression pairs based on the result of the translation expression pair accuracy giving unit 61. The dictionary / rule addition / change unit 7 adds / changes a dictionary or a rule based on the bilingual expression set obtained by the bilingual expression combination extracting unit 6.

【0059】図2は、本発明の一実施例の追加変更され
る辞書やルールを用いた機械翻訳システムの基本ブロッ
ク構成の例を示す。同図に示す機械翻訳システムは、機
械翻訳システム部2、機械翻訳システム部2で用いられ
るルール3、機械翻訳システム部2で用いられる辞書
4、翻訳する第1の自然言語文を入力する第1自然言語
入力部8及び、機械翻訳システム部2により翻訳された
第2の自然言語を出力する第2自然言語出力部9より構
成される。
FIG . 2 shows an example of a basic block configuration of a machine translation system using a dictionary or rule which is additionally changed according to an embodiment of the present invention. The machine translation system shown in FIG. 1 includes a machine translation system unit 2, a rule 3 used in the machine translation system unit 2, a dictionary 4 used in the machine translation system unit 2, and a first natural language sentence to be translated. It comprises a natural language input unit 8 and a second natural language output unit 9 for outputting the second natural language translated by the machine translation system unit 2.

【0060】機械翻訳システム部2は、第1の自然言語
文を第1の自然言語の概念構造に変換する第1自然言語
解析部21、第1言語解析部21で生成された第1の自
然言語の概念構造を第2の自然言語の概念構造に変換す
る言語変換部22、言語変換部22で生成された第2の
自然言語の概念構造を基に第2の自然言語文を生成する
第2言語生成部23より構成される。
The machine translation system 2 converts a first natural language sentence into a first natural language conceptual structure, and a first natural language generated by the first natural language analyzer 21. A language conversion unit 22 that converts a conceptual structure of a language into a conceptual structure of a second natural language; and a second natural language sentence that generates a second natural language sentence based on the conceptual structure of the second natural language generated by the language conversion unit 22. It is composed of a bilingual generation unit 23.

【0061】ルール3は、第1言語解析部21で用いる
第1言語解析ルール31、言語変換部22で用いる言語
変換ルール32、第2言語生成部23で用いる第2言語
生成ルール33より構成される。辞書4は、第1言語解
析部21で用いる第1言語解析辞書41、言語変換部2
2で用いる言語変換辞書42、第2言語生成部23で用
いる第2言語生成辞書43より構成される。
The rule 3 includes a first language analysis rule 31 used by the first language analysis unit 21, a language conversion rule 32 used by the language conversion unit 22, and a second language generation rule 33 used by the second language generation unit 23. You. The dictionary 4 includes a first language analysis dictionary 41 used by the first language analysis unit 21 and a language conversion unit 2
2 includes a language conversion dictionary 42 used in the second language generation dictionary 43 and a second language generation dictionary 43 used in the second language generation unit 23.

【0062】図3は、本発明の一実施例の言語変換辞書
のエントリの例を示す。言語変換辞書42として、例え
ば、名詞変換辞書があり、その名詞変換辞書には、第1
の自然言語である日本語の各名詞に対する第2の自然言
語である英語がそれぞれ記入され、1つの名詞に対して
複数の訳語がある場合には、使うべき訳語の優先順位を
示す優先度やその訳語の使われ方を示す名詞句からなる
選択条件等が記入されている。例えば、「地形図」に対
しては、“topographic chart ”の訳語が、また、「会
社」に対しては、“company ”、“office”の訳語がこ
の順番の優先順位で付与されている。
FIG . 3 shows an example of entries in the language conversion dictionary according to one embodiment of the present invention. As the language conversion dictionary 42, for example, there is a noun conversion dictionary.
If English is used as the second natural language for each Japanese noun that is a natural language, and there are multiple translations for one noun, the priority indicating the priority of the translation to be used, A selection condition or the like consisting of a noun phrase indicating how the translated word is used is entered. For example, a translation of “topographic chart” is assigned to “topographic map”, and a translation of “company” and “office” are assigned to “company” in this order of priority.

【0063】図4は、本発明の一実施例の言語変換ルー
ルのエントリの例を示す。言語変換ルール32は、例え
ば、動詞変換ルールがあり、その動詞変換ルールには、
日本語の各動詞だけではなく、動詞の助詞がパターンと
して付けられており、つまり、例えば、動詞「書く」に
ついては、(「S」(主語、名詞)「が」(助詞)「O
1」(目的語、名詞)「を」(助詞))という助詞パタ
ーンが記入されており、動詞をその動詞を含めてキーと
して動詞の訳語を検索するように記入されている。さら
に、動詞の各要素の意味を示す選択条件が記されてい
る。例えば、動詞「書く」については、「O1」には意
味制約はないが、「S」が主体を持つ時に“S write
O1”を適用する制約があることを示している。
FIG . 4 shows an example of an entry of a language conversion rule according to an embodiment of the present invention. The language conversion rule 32 includes, for example, a verb conversion rule.
Not only each verb in Japanese but also the particle of the verb is attached as a pattern. That is, for example, for the verb "write", ("S" (subject, noun) "ga" (particle) "O
A particle pattern of "1" (object, noun) "wo" (particle) is entered, and a search is made to search for a translation of the verb using the verb as a key including the verb. Further, a selection condition indicating the meaning of each element of the verb is described. For example, for the verb “write”, “O1” has no semantic restriction, but “S write” when “S” has a subject.
This indicates that there is a restriction to apply O1 ″.

【0064】次に、図1の基本ブロック構成の機械翻訳
用辞書・ルール学習システムの処理手順について説明す
る。ここでは、図5に示す対訳文を例として説明する。
まず、対訳読み込み部1は、対訳関係にある第1の自然
言語の文と第2の自然言語の文の対(対訳文)を入力す
る。この対訳文は、機械翻訳用辞書・ルールの自動学習
のために用いるものである。この辞書・ルールの学習用
に対訳文の集合(対訳文章)を選択することによって、
学習させた対訳文章と類似の言語現象が頻出する同様の
分野文章向きに、機械翻訳システムをチューンすること
が可能でとなる。図5の例では、第1の自然言語である
日本語の文(入力日本文) 「彼は地形図を会社で書く。」 に対して対訳関係にある第2の自然言語である英語の文
(理想英訳文) “He draw a toppographical map in a office. ” が対訳文として入力される。
Next, the processing procedure of the machine translation dictionary / rule learning system having the basic block configuration shown in FIG. 1 will be described. Here, the bilingual sentence shown in FIG. 5 will be described as an example.
First, the bilingual reading unit 1 inputs a pair (a bilingual sentence) of a first natural language sentence and a second natural language sentence having a bilingual relationship. This bilingual sentence is used for automatic learning of a dictionary and rules for machine translation. By selecting a set of bilingual sentences (bilingual sentences) for learning this dictionary / rule,
It is possible to tune the machine translation system for sentences in the same field where similar language phenomena frequently appear in the learned translated sentences. In the example of FIG. 5 , the first natural language Japanese sentence (input Japanese sentence) "He writes a topographic map at the company." (Ideal English translation) "He draw a toppographical map in a office."

【0065】入力された対訳文のうち、第1の自然言語
文である入力日本文は、ルール3や辞書4を用いた機械
翻訳システム部2によって第2の自然言語文である機械
英訳文に翻訳される。この機械翻訳の処理の手順を図2
の基本ブロック構成の機械翻訳システムを用いて説明す
る。まず、第1の自然言語文である入力日本語文は、第
1の言語解析ルール31や第1の言語解析辞書41を用
いた第1言語解析部21により解析され、日本語の概念
構造を生成する。生成された日本語の概念構造は、例え
ば、図3に示す名詞変換辞書のような言語変換辞書42
や、例えば、図4に示す動詞変換ルールのような言語変
換ルール32を用いて言語変換部22によって変換さ
れ、英語の概念構造を生成する。生成された英語の概念
構造は、第2言語生成ルール33や第2言語生成辞書4
3によって、機械英訳文を生成する。生成された英文は
第2自然言語出力部9によって出力される。なお、この
機械翻訳システムの各段階で参照・生成された概念構造
や辞書情報は、辞書・ルール自動学習処理で参照可能と
なるように情報を保存しておく。例えば、図3の言語変
換辞書42を検索した際に得られる個々の他訳語候補の
情報も保存しておく。
The input Japanese sentence, which is the first natural language sentence, of the input translated sentence is converted into the second natural language sentence, a machine English translated sentence, by the machine translation system unit 2 using the rule 3 and the dictionary 4. Be translated. Figure 2 shows the procedure of this machine translation process .
A description will be given using a machine translation system having the basic block configuration of FIG. First, an input Japanese sentence, which is a first natural language sentence, is analyzed by a first language analysis unit 21 using a first language analysis rule 31 and a first language analysis dictionary 41 to generate a Japanese conceptual structure. I do. The generated Japanese conceptual structure is, for example, a language conversion dictionary 42 such as the noun conversion dictionary shown in FIG.
Alternatively, the language conversion unit 22 converts the language using a language conversion rule 32 such as the verb conversion rule shown in FIG. 4 to generate an English conceptual structure. The generated conceptual structure of English is described in the second language generation rule 33 and the second language generation dictionary 4.
3, a machine English translation is generated. The generated English sentence is output by the second natural language output unit 9. The concept structure and the dictionary information referred and generated at each stage of the machine translation system are stored so that they can be referred to in the dictionary / rule automatic learning process. For example, the information of each other translated word candidate obtained when the language conversion dictionary 42 of FIG. 3 is searched is also stored.

【0066】上記のような機械翻訳システムで、例とし
図3で示した名詞変換辞書42、図4で示した動詞変
換ルール32を用いることによって、図5に示す入力日
本文として、 “He write a topographic chart in a company.” が訳出される。
By using the noun conversion dictionary 42 shown in FIG. 3 and the verb conversion rule 32 shown in FIG. 4 as an example in the machine translation system as described above, the input Japanese sentence shown in FIG. a topographic chart in a company. "

【0067】次に、対訳表現組抽出部5について説明す
る。この対訳表現組抽出部5は、対訳文読み込み部1で
得られる入力文、理想訳文及び機械翻訳システム部2で
得られる機械訳文から対訳機械訳語抽出部51、対訳理
想訳語抽出部52、対応機械訳語理想訳語対抽出部53
によって、入力単語、入力単語と対訳関係にある機械訳
語、及び理想訳語の組を抽出する。
Next, the bilingual expression set extraction unit 5 will be described. The bilingual expression set extraction unit 5 converts the input sentence obtained by the bilingual sentence reading unit 1, the ideal translation and the machine translation obtained by the machine translation system unit 2 into a bilingual machine translation word extraction unit 51, a bilingual ideal translation word extraction unit 52, and a corresponding machine. Translated word ideal translation word pair extraction unit 53
Thus, a set of an input word, a machine translation word having a bilingual relationship with the input word, and an ideal translation word are extracted.

【0068】対訳機械訳語抽出部51は、機械翻訳シス
テム部2で参照・生成された概念構造や辞書情報を利用
することによって、入力単語、入力単語と対訳関係にあ
る機械訳語が抽出される。例えば、図5の入力日本文と
機械訳文に関しては、図3で示した名詞変換辞書42等
を参照することによって「彼」と“he”、「地形図」と
“topographic chart ”、「会社」と“company ”が抽
出される。また、図4で示した動詞変換ルール32等を
参照することによって「書く」と“write ”が抽出され
る。
The bilingual machine translation word extraction unit 51 extracts an input word and a machine translation word having a bilingual relationship with the input word by using the concept structure and dictionary information referred to and generated by the machine translation system unit 2. For example, regarding the input Japanese sentence and the machine translation sentence of FIG. 5 , by referring to the noun conversion dictionary 42 shown in FIG. 3 , "he" and "he", "topographic chart" and "topographic chart", "company" And "company" are extracted. Further, "Write" and "write" are extracted by referring to the verb conversion rule 32 and the like shown in FIG.

【0069】対訳理想訳語抽出部52は、本発明の一実
施例である図6に示したフローチャートに基づいて説明
する。図6、本発明の一実施例の対訳理想訳語を抽出
する処理のフローチャートである。ステップ5201)
対訳理想訳語抽出部52は、対訳機械訳語抽出部51
の結果から入力単語と機械訳語のペアを順に取り出す。
図5の例では、まず「彼」と“he”が取り出されるが、
説明の都合上「会社」と“company ”が取り出されると
ころまで進んだとする。
The bilingual ideal translation word extracting section 52 will be described with reference to the flowchart shown in FIG. 6 which is an embodiment of the present invention. FIG. 6 is a flowchart of a process for extracting a bilingual ideal translation word according to an embodiment of the present invention. Step 5201)
The bilingual ideal translation extraction unit 52 includes a bilingual machine translation extraction unit 51.
The pairs of the input word and the machine translation word are sequentially extracted from the result of the above.
In the example of FIG. 5 , "he" and "he" are extracted first,
For the sake of explanation, it is assumed that "company" and "company" have been extracted.

【0070】ステップ5202) 次に、対訳文読み込
み部1の結果から入力文と対訳関係にある理想訳文中の
理想訳語を順に取り出す。図5の例では、まず“he”が
取り出されるが、説明の都合上“office”が取り出され
るところまで進んだとする。ステップ5203) ステ
ップ5201で取り出した入力語をキーにして変換辞書
を検索し、入力単語訳語候補の集合を抽出する。上記の
例では、入力単語「会社」をキーにして変換辞書を検索
すると、図3で示した名詞変換辞書42より“company
”と“office”が抽出される。
Step 5202) Next, from the results of the bilingual sentence reading unit 1, the ideal translation words in the ideal translation having a bilingual relationship with the input sentence are sequentially extracted. In the example of FIG. 5 , “he” is extracted first, but it is assumed that the process has proceeded to the point where “office” is extracted for convenience of explanation. (Step 5203) The conversion dictionary is searched using the input word extracted in Step 5201 as a key, and a set of input word translation word candidates is extracted. In the above example, when the conversion dictionary is searched by using the input word “company” as a key, “company” is obtained from the noun conversion dictionary 42 shown in FIG.
"And" office "are extracted.

【0071】ステップ5204) ステップ5203で
取り出した入力単語訳語候補の集合の中で、ステップ5
202で取り出された理想訳語と一致するもの、あるい
はどちらか一方の語が他方の語を含んでいるものがある
かどうかを判定する。判定の結果、理想訳語と一致する
もの、あるいはどちらか一方の語が他方の語を含んでい
るものがあれば(Yes)、ステップ5205に移行
し、なければ(No)、ステップ5206へ移行する。
上記の例では、入力単語訳語候補“office”と理想訳語
“office”は一致しているので、入力単語「会社」と理
想訳語“office”が対訳関係にあると判断され、この判
定はYesとなり、ステップ5205へ移行する。
Step 5204) In the set of input word translation candidate extracted in step 5203, step 5
It is determined whether or not there is a word that matches the ideal translation extracted in step 202, or a word in which one of the words includes the other word. As a result of the determination, if there is a word that matches the ideal translation word or one of the words includes the other word (Yes), the process proceeds to step 5205; otherwise (No), the process proceeds to step 5206. .
In the above example, since the input word translation candidate "office" matches the ideal translation "office", it is determined that the input word "company" and the ideal translation "office" have a bilingual relationship, and this determination is Yes. , To step 5205.

【0072】ステップ5205) 対訳機械訳語抽出部
51の結果、及びステップ5204での一致具合を参照
して、入力単語、機械訳単語、理想訳単語及び対応の取
り方を出力する。上記の例では、図7に示す 「会社」、“company ”、“office”、「他訳語候補一
致」 が出力される。
Step 5205) With reference to the result of the bilingual machine translation word extraction unit 51 and the degree of matching in step 5204, the input word, the machine translation word, the ideal translation word, and the correspondence method are output. In the above example, “company”, “company”, “office”, and “matching other translation candidate” shown in FIG. 7 are output.

【0073】ステップ5206) 現在の入力単語と機
械訳語のペアに対して、全ての理想訳語を検査したかど
うかを判定する。もしまだなら(No)、ステップ52
02へ移行し、全て検査済みなら(Yes)、5207
へ移行する。上記の例では、理想訳語の“office”は理
想訳文の最後の語なので、全て検査済みと判定され、ス
テップ5207へ移行する。
Step 5206) It is determined whether all ideal translations have been checked for the current input word / machine translation pair. If not (No), step 52
02, if all have been inspected (Yes), 5207
Move to. In the above example, since the ideal translation “office” is the last word of the ideal translation, it is determined that all have been checked, and the process proceeds to step 5207.

【0074】ステップ5207) 全ての入力単語と機
械訳語のペアを取り出して検査したかどうかを判定す
る。もしまだなら(No)、ステップ5201へ移行
し、全て検査済みなら(Yes)、この処理は終了す
る。上記の例では、最終的には図7に示す対訳表現組が
抽出される。対応機械訳語理想訳語抽出部53は、本発
明の一実施例である図6、及び図9に示したフローチャ
ートに基づいて説明する。
Step 5207) It is determined whether or not all pairs of input words and machine translation words have been extracted and inspected. If not (No), the process proceeds to step 5201, and if all have been inspected (Yes), this process ends. In the above example, the bilingual expression set shown in FIG. 7 is finally extracted. The corresponding machine translation ideal translation extraction unit 53 will be described with reference to the flowcharts shown in FIGS . 6 and 9 , which are one embodiment of the present invention.

【0075】図8は、本発明の一実施例の対応機械訳語
理想訳語対を抽出する処理のフローート(その1)であ
る。ステップ53101) 対応機械訳語理想訳語対抽
出部53は、対訳機械訳語出部51の結果から入力単
語と機械訳語のペアを順に取り出す。図5の例では、ま
ず、「彼」と“he”が取り出されるが、説明の都合上
「地形図」と、“topographic chart ”が取り出される
ところまで進んだとする。
FIG . 8 is a flowchart (part 1) of a process for extracting a corresponding machine translation ideal translation pair according to an embodiment of the present invention. Step 53101) corresponding machine translation ideal translation pair extraction unit 53 extracts a pair of input words and machine translation in order from the results of the translation machinery translation Extraction section 51. In the example of FIG. 5 , first, "he" and "he" are extracted, but for convenience of explanation, it is assumed that the process proceeds to the point where "topographic map" and "topographic chart" are extracted.

【0076】ステップ53102) 次に、対訳文読み
込み部1の結果から入力文と対訳関係にある理想訳文中
の理想訳語を順に取り出す。図5の例では、まず“he”
が取り出されるが、説明の都合上“topographical ”が
取り出されるところまで進んだとする。ステップ531
03) ステップ53101で取り出した入力語をキー
にして変換辞書を検索し、入力単語訳語候補の集合を抽
出する。上記の例では、入力単語「地形図」をキーにし
て変換辞書を検索すると、図3で示した名詞変換辞書4
2より“topographic chart ”が抽出される。
Step 53102) Next, from the result of the bilingual sentence reading unit 1, the ideal translation words in the ideal translation having a bilingual relationship with the input sentence are sequentially extracted. In the example of FIG. 5 , first, "he"
Is extracted, but for the sake of explanation, it is assumed that "topographical" has been extracted. Step 531
03) The conversion dictionary is searched using the input word extracted in step 53101 as a key, and a set of input word translation word candidates is extracted. In the above example, when the conversion dictionary is searched using the input word “topographic map” as a key, the noun conversion dictionary 4 shown in FIG.
2, a "topographic chart" is extracted.

【0077】ステップ53104) ステップ5310
1で取り出した機械訳語、ステップ53103で抽出さ
れた入力単語訳語候補、及びステップ53102で取り
出した理想訳語をキーに第2言語生成辞書43を検索し
て機械訳関連語の集合と理想訳関連語の集合を得る。上
記の例では、機械訳語が“topographic chart ”なの
で、各英単語“topographic ”と“chart ”にばらして
から英語辞書(言語変換辞書42)を検索し、理想訳語
は“topographic ”をキーに英語辞書(言語変換辞書4
2)を検索する。その結果“topographic ”と“topogr
aphical ”に関しては、例えば、図9に示す結果とな
る。図9は、本発明の一実施例の第2言語生成エントリ
の例を示す。
Step 53104) Step 5310
The second language generation dictionary 43 is searched using the machine translation word extracted in step 1, the input word translation candidate extracted in step 53103, and the ideal translation word extracted in step 53102 as keys, and a set of machine translation related words and ideal translation related words. Get the set of In the above example, since the machine translation word is “topographic chart”, the English words (topographic) and “chart” are separated, and then the English dictionary (language conversion dictionary 42) is searched, and the ideal translation word is “topographic” as the key. Dictionary (language conversion dictionary 4
2) Search. As a result, “topographic” and “topogr
Regarding Aphical ", for example, the result shown in FIG. 9 shows an example of a second language generation entry of an embodiment of the present invention.

【0078】ステップ53105) ステップ5310
4で取り出した機械訳語関連語の集合と理想訳関連語の
集合の間で単語が一致するもの、あるいはどちらか一方
の語が他方の語を含んでいるものがあるかどうか検査す
る。一致するもの、あるいはどちらか一方の語が他方の
語を含んでいるものがある場合には(Yes)、ステッ
プ53106へ移行し、そうでなければ(No)、ステ
ップ53107に移行する。上記の例では、図9により
名詞形が“topography”で一致、または副詞形が“topo
graphically ”で一致しているので、機械訳語“topogr
aphic ”と理想訳語“topographical ”が対応している
と判断され、この判定はYESとなり、ステップ531
06へ移行する。
Step 53105) Step 5310
It is checked whether there is a match between the set of machine translation related words extracted in step 4 and the set of ideal translation related words, or whether one of the words includes the other. If there is a match, or if one of the words includes the other (Yes), the process proceeds to step 53106; otherwise (No), the process proceeds to step 53107. In the above example, the noun form matches “topography” or the adverb form matches “topo” in FIG.
graphically ”, so the machine translation“ topogr
aphic "and the ideal translation word" topographical "correspond to each other.
Shift to 06.

【0079】ステップ53106) 対訳機械訳語抽出
部51の結果、及びステップ53105での一致具合を
参照して、入力単語、機械訳単語、理想訳単語及び対応
の取り方を出力する。上記の例では、「地形図」、“to
pographic chart ”、“topographical ”、「関連語一
致」が出力され、対訳理想訳語抽出部52の結果に追加
されて図10に示すようになる。図10は、本発明の一
実施例の図8の結果得られる対訳表現組と対応の取れ方
を示す。
Step 53106) By referring to the result of the bilingual machine translation word extraction unit 51 and the degree of matching in step 53105, the input word, the machine translation word, the ideal translation word, and the correspondence method are output. In the above example, "topographic map", "to
“pographic chart”, “topographical”, and “related word match” are output and added to the result of the bilingual ideal translation word extraction unit 52, as shown in FIG . FIG. 10 shows how to correspond to the bilingual expression sets obtained as a result of FIG. 8 according to one embodiment of the present invention.

【0080】ステップ53107) 現在の入力単語と
機械訳語のペアに対して、全ての理想訳語を検査したか
どうかを判定する。もしまだなら(No)、ステップ5
3101へ移行し、全て検査済みなら(Yes)、ステ
ップ53108へ移行する。上記の例では、理想訳語の
“topographical ”の次の語は“map ”なので、判定
(No)となり、ステップ53102へ移行する。
Step 53107) It is determined whether all ideal translations have been checked for the current pair of the input word and the machine translation. If not (No), step 5
The flow shifts to 3101. If all the inspections have been completed (Yes), the flow shifts to step 53108. In the above example, since the word next to the ideal translated word “topographical” is “map”, the determination is No (No), and the flow shifts to step 53102.

【0081】ステップ53108) 全ての入力単語と
機械訳語のペアを取り出して検査したかどうかを判定す
る。もしまだなら(No)、ステップ53101へ移行
し、全て検査済みなら(Yes)、この処理は終了す
る。上記の例では、最終的には図10に示す対訳表現組
が抽出される。次に、本発明の一実施例である図11
示したフローチャートに基づいて、対応機械訳語理想訳
語対抽出部53を説明する。
Step 53108) It is determined whether or not all pairs of input words and machine translation words have been extracted and inspected. If not (No), the process proceeds to step 53101, and if all have been inspected (Yes), this process ends. In the above example, the bilingual expression set shown in FIG. 10 is finally extracted. Next, the corresponding machine translation ideal translation word pair extraction unit 53 will be described based on the flowchart shown in FIG. 11 which is an embodiment of the present invention.

【0082】ステップ53201)対応機械訳語理想訳
語対抽出部53は、対訳機械訳語抽出部51の結果から
入力単語と機械訳語のペアを順に取り出す。図5の例で
は、まず「彼」と“he”が取り出されるが、説明の都合
上「地形図」と“topographic chart ”が取り出される
ところまで進んだとする。ステップ53202)次に、
対訳文読み込み部1の結果から入力文と対訳関係にある
理想訳文中の理想訳語を順に取り出す。図5の例では、
先ず“he”が取り出されるが、説明の都合上“map ”が
取り出されるところまで進んだとする。
Step 53201) The corresponding machine translated word ideal translation word pair extraction unit 53 sequentially extracts pairs of the input word and the machine translation word from the result of the parallel machine translation word extraction unit 51. In the example of FIG. 5 , “he” and “he” are first extracted, but it is assumed that the process has proceeded to the point where “topographic chart” and “topographic chart” are extracted for convenience of explanation. Step 53202) Next,
From the result of the bilingual sentence reading unit 1, the ideal translation words in the ideal translation having a bilingual relationship with the input sentence are sequentially extracted. In the example of FIG.
First, it is assumed that "he" is extracted, but for the sake of explanation, the process proceeds to the point where "map" is extracted.

【0083】ステップ53203)ステップ53201
で取り出した機械訳語とステップ53202で取り出し
た理想訳語をキーに変換辞書(言語変換辞書42)を逆
引きして機械訳逆引訳語候補の集合と理想訳逆引訳語候
補の集合を得る。上記の例では、機械訳語“topographi
c chart ”とばらした英単語“topographic ”及び“ch
art ”、さらに理想訳語“map ”をキーにして変換辞書
(言語変換辞書42)を逆に引いて検索する。その結
果、例えば、“chart ”と“map ”に関して図12のよ
うに、逆引訳語候補が得られる。
Step 53203) Step 53201
The conversion dictionary (language conversion dictionary 42) is reversely searched using the machine translation word extracted in step 53202 and the ideal translation word extracted in step 53202 as a key to obtain a set of machine translation reverse translation word candidates and a set of ideal translation reverse translation word candidates. In the above example, the machine translation "topographi
The English words “topographic” and “ch
The search is performed by reversely searching the conversion dictionary (language conversion dictionary 42) using the key word “art” and the ideal translation word “map.” As a result, for example, reverse lookup is performed on “chart” and “map” as shown in FIG. Translated word candidates are obtained.

【0084】ステップ53204)ステップ53203
で取り出した機械訳逆引訳語候補の集合と理想訳引訳
語候補の集合の間で単語が一致するもの、あるいはどち
らか一方の語が他方の語を含んでいるものがあるかどう
か検査する。一致するもの、あるいは、どちらか一方の
語が他方の語を含んでいるものがある場合には(Ye
s)、ステップ53205へ移行し、そうでなければ
(No)、ステプ53206へ移行する。上記の例で
は、図12より機械訳語逆引訳語候補である「図」が理
想訳語逆引訳語候補である「地図」や「絵図」に含まれ
ているので、“chart”と“map ”が対応すると判断さ
れ、この判定はYesとなり、ステップ53205へ移
行する。
Step 53204) Step 53203
Check whether there is a word match between the set of machine translation reverse-translated word candidates extracted in step 2 and the set of ideal translation reverse- translated word candidates, or whether one of the words contains the other. . If there is a match, or if one of the words contains the other, (Ye
s) The process moves to step 53205; otherwise (No), the process moves to step 53206. In the above example, since FIG. 12 shows that the machine translation word reverse translation word candidate “figure” is included in the ideal translation reverse translation word candidate “map” or “picture”, “chart” and “map” are It is determined that they correspond, and the determination is Yes, and the flow shifts to step 53205.

【0085】ステップ53205) 対訳機械訳語抽出
部51の結果、及びステップ53204での一致具合を
参照して、入力単語、機械訳単語、理想訳単語及び対応
のとれ方を出力する。上記の例では、 「地形図」、“topographic chart ”、“map ”、「逆引訳語部分一致」 が出力され、対訳理想訳語抽出部52及び図8で示す対
応機械訳語理想訳語対抽出処理の結果に追加されて、
13に示すようになる。図13は、本発明の一実施例の
図11の結果得られる対訳表現組と対応の取れ方を示す
図である。
Step 53205) The input word, the machine translation word, the ideal translation word, and the correspondence are output with reference to the result of the bilingual machine translation word extraction unit 51 and the degree of matching in step 53204. In the above example, the “topographic map”, “topographic chart”, “map”, and “reverse translated word partial match” are output, and the bilingual ideal translation word extraction unit 52 and the corresponding machine translation ideal translation word pair extraction processing shown in FIG. Figure added to the result of
As shown in FIG. FIG. 13 shows an embodiment of the present invention .
FIG. 12 is a diagram showing how to correspond to a bilingual expression set obtained as a result of FIG. 11 .

【0086】ステップ53206) 現在の入力単語と
機械訳語のペアに対して全ての理想訳語を検索したどう
かを判定する。もし、まだなら(No)、ステップ53
202へ移行し、全て検査済なら(Yes)、ステップ
53207へ移行する。上記の例では、理想訳語"map"
の次の語"in"なので、判定は(No)となり、ステップ
53202へ移行する。
Step 53206) It is determined whether or not all ideal translations have been searched for the current pair of the input word and the machine translation. If not (No), step 53
The process proceeds to step 202, and if all have been inspected (Yes), the process proceeds to step 53207. In the above example, the ideal translation "map"
Since the next word is "in", the determination is (No), and the flow shifts to step 53202.

【0087】ステップ53207) 全ての入力単語と
機械訳語のペアを取り出して検査したかどうかを判定す
る。もしまだなら(No)、ステップ53201へ移行
し、全て検査済みなら(Yes)、この処理は終了す
る。上記の例では、最終的には図13に示す対訳表現組
が抽出される。次に、対訳表現組合せ抽出部6について
説明する。この対訳表現組合せ抽出部6は、対訳表現組
抽出部5の結果から対訳表現組確度付与部61によっ
て、個々の対訳表現組に個々の対訳表現組の抽出過程に
応じた確度を付与し、対訳表現組合せ作成部62によっ
て、対訳文の中で矛盾のない対応関係からなる入力単
語、機械訳語の組合せを全て作成し、その組合せ毎の確
度を対訳表現組確度付与部61の結果を元に付与する。
Step 53207) It is determined whether or not all pairs of input words and machine translation words have been extracted and inspected. If not (No), the process proceeds to step 53201, and if all have been inspected (Yes), this process ends. In the above example, the bilingual expression set shown in FIG. 13 is finally extracted. Next, the bilingual expression combination extraction unit 6 will be described. The bilingual expression combination extracting unit 6 assigns certainty to each bilingual expression set according to the extraction process of each bilingual expression set by the bilingual expression group accuracy giving unit 61 based on the result of the bilingual expression set extracting unit 5. The expression combination creation unit 62 creates all combinations of input words and machine translation words having a consistent correspondence in the bilingual sentence, and assigns the accuracy of each combination based on the result of the translation expression combination accuracy assignment unit 61. I do.

【0088】上記の例では、図13に示す最終的に得ら
れた各対訳表現組の取れ方を参照して確度を付与する。
例えば、他訳語候補一致は6点、関連語一致は5点、逆
引訳語候補一致は4点、他訳語候補部分一致は3点、関
連語部分一致が2点、逆引訳語部分一致は1点というよ
うな確度を付与する。また、図13からできる可能な組
合せは1通り、つまり「地形図」、“topographical ca
hrt ”と「会社」、“company ”、“office”の組のみ
作成される。
In the above example, certainty is given by referring to the finally obtained bilingual expression sets shown in FIG .
For example, another word candidate match is 6 points, related word match is 5 points, reverse
Accuracy is given such as 4 points for bilingual word candidate matching, 3 points for other translated word candidate partial matching, 2 points for related word partial matching, and 1 point for reverse translated word partial matching. In addition, one possible combination that can be made from FIG. 13 is “topographic map”, “topographical ca
Only pairs of "hrt", "company", "company", and "office" are created.

【0089】次に、辞書・ルール追加変更部7について
説明する。この辞書・ルール追加変更部7は、対訳表現
組合せ抽出部6の結果を元に、対訳表現組合せ集合中、
最も確度が高い対訳表現組合せを利用して、機械翻訳シ
ステム用辞書4やルール3を作成又は、追加変更する。
上記の例では、対訳表現組合せ抽出部6の結果が1通り
であるので、入力単語「地形図」と対訳関係にあるの
は、"topographical map”で、入力単語「会社」と対訳
関係にあるのは、"office"と決定される。この結果「地
形図」の訳語として、"topographical map”が優先順位
1として追加され、「会社」の訳語として"office"の優
先順位を1に変更し、図14に示す名詞変換辞書42
(言語変換辞書)となる。
Next, the dictionary / rule addition changing unit 7 will be described. Based on the result of the bilingual expression combination extracting unit 6, the dictionary / rule addition changing unit 7
The dictionary 4 and the rule 3 for the machine translation system are created or additionally changed by using the bilingual expression combination having the highest accuracy.
In the above example, since the result of the bilingual expression combination extraction unit 6 is one, there is a bilingual relation with the input word "topographic map" and the bilingual relation with the input word "company" is "topographical map". Is determined to be "office". As a result, “topographical map” is added as a priority of “topographical map” as a translation of “topographic map”, and priority of “office” is changed to 1 as a translation of “company”, and the noun conversion dictionary 42 shown in FIG.
(Language conversion dictionary).

【0090】なお、対訳表現組抽出部5に、第2の自然
言語の語同士を比較する、及び/または、第1の自然言
語の語同士を比較する際に、比較対象とする語を異なり
別に集計して比較し、対訳表現組を抽出する方法を加え
ることも考えられる。また、対訳表現組抽出部5に、理
想訳文を形態素解析し、理想訳形態素構造の情報を利用
して、より正確な対訳表現組を抽出する方法も考えられ
る。
When the words in the second natural language are compared with each other and / or the words in the first natural language are compared with each other in the bilingual expression set extraction unit 5, the words to be compared differ. It is also conceivable to add a method of separately compiling and comparing and extracting a bilingual expression set. Further, a method is also conceivable in which the bilingual expression set extracting unit 5 performs a morphological analysis of the ideal translation and uses the information of the ideal morphological structure to extract a more accurate bilingual expression set.

【0091】上記のようにして、図1の基本ブロック構
成の機械翻訳用辞書・ルール自動学習システムの1回の
処理は終了となる。しかし、学習した結果を用いて対応
が取れるものがあるかもしれないことや、追加変更した
辞書4やルール3が翻訳対象文全てを考慮すると、翻訳
の質が追加変更する前に比べて悪くなる可能性もある。
上記の例では、1回の学習処理では、機械訳語である"w
rite" と理想訳語である"draw"の対応が取れていない。
そこで、学習終了条件を設定して、終了条件が満たされ
るまで、図1の機械翻訳用辞書・ルール自動学習処理を
繰り返す必要がある。
As described above, one process of the machine translation dictionary / rule automatic learning system having the basic block configuration of FIG. 1 is completed. However, if there is a possibility that there is something that can be dealt with using the result of learning, and if the dictionary 4 or the rule 3 that has been added and changed considers all the sentences to be translated, the quality of the translation will be worse than before the additional change. There is a possibility.
In the above example, in one learning process, the machine translated word "w
There is no correspondence between "rite" and the ideal word "draw".
Therefore, it is necessary to set a learning end condition and repeat the machine translation dictionary / rule automatic learning process of FIG. 1 until the end condition is satisfied.

【0092】この繰り返しの処理を、図15に示す本発
明の一実施例のフローチャートに基づいて説明する。ス
テップ1001) 対訳文読み込み部1によって順に対
訳文を読み込む。ステップ1002) 機械翻訳システ
ム部2によって翻訳し、その結果を保存する。
The repetitive processing will be described with reference to the flowchart of FIG. 15 of the embodiment of the present invention. Step 1001) The bilingual sentence reading unit 1 reads bilingual sentences in order. Step 1002) Translate by the machine translation system unit 2 and save the result.

【0093】ステップ1003) 対訳表現組抽出部5
によって対訳表現組を抽出する。 ステップ1004) 対訳表現組合せ抽出部6によって
対訳表現組毎に確度を付与し、1つの文の中で可能な対
訳表現組の組合せを全て作成する。 ステップ1005) 辞書・ルール変更部7によって、
ステップ1004の結果の中で最も確度が高い組合せを
保存する。
Step 1003) Bilingual expression set extraction unit 5
To extract a bilingual expression set. Step 1004) The bilingual expression combination extracting unit 6 assigns certainty to each bilingual expression set, and creates all possible bilingual expression combination combinations in one sentence. Step 1005) By the dictionary / rule changing unit 7,
The combination with the highest probability among the results of step 1004 is saved.

【0094】ステップ1006) 翻訳対象文中の全て
の対象文を読み込んだかどうかを判定する。もし、まだ
なら(No)、ステップ1001へ移行し、全て読み込
んでいるなら(Yes)、ステップ1007に移行す
る。図5の例では、1文しかないので、ステップ100
7に移行する。ステップ1007) 辞書・ルール追加
変更部7によって、全ての文の対訳表現組を考慮して辞
書4やルール3を追加変更する。図5の例では、図14
に示す名詞変換辞書42(言語変換辞書)が作成され
る。
Step 1006: It is determined whether all the target sentences in the translation target sentence have been read. If not (No), the process proceeds to step 1001, and if all data has been read (Yes), the process proceeds to step 1007. In the example of FIG. 5 , since there is only one sentence, step 100
Move to 7. Step 1007) The dictionary / rule addition / change unit 7 adds / changes the dictionary 4 and the rule 3 in consideration of the bilingual expression sets of all sentences. In the example of FIG.
No. conversion dictionary 42 (language conversion dictionary) shown in FIG.

【0095】ステップ1008) ステップ1007で
追加変更された辞書4やルール3を用いて再度翻訳す
る。上記の例では、図14に示す名詞変換辞書42を用
いて再度翻訳すると、図16に示す機械翻訳文 "He write a topographical map in a office" が得られる。
Step 1008) The translation is performed again using the dictionary 4 and the rule 3 added and changed in step 1007. In the above example, when the translation is performed again using the noun conversion dictionary 42 shown in FIG. 14 , the machine translation sentence "He write a topographical map in a office" shown in FIG. 16 is obtained.

【0096】ステップ1009) 保存されている機械
翻訳結果と比較して変化があるかどうかを検査し、変化
があれば(Yes)、ステップ1001に移行し、変化
がなければ(No)、この学習処理は終了する。上記の
例では、保存されている機械翻訳結果と比較すると変化
があるので、ここの判定はYesとなり、ステップ10
01に移行する。
Step 1009) Compare with the stored machine translation result to check whether there is any change. If there is a change (Yes), go to Step 1001. If there is no change (No), this learning is performed. The process ends. In the above example, since there is a change as compared with the stored machine translation result, the determination here is Yes and step 10
Move to 01.

【0097】上記の例では、2回目のステップ1003
で、例えば、対応の取れない語が機械訳文の中に1語
で、かつ理想訳文の中にも1語であるならば、対応関係
があるとみなすことを対訳表現組抽出部5の処理に入れ
ると、図17に示すように、入力単語「書く」、機械訳
語の"write" 、理想訳語の"draw"が対訳表現組として、
また、対応の取れ方は残りものを一致として抽出され
る。これにより、ステップ1007では、「書く」の訳
語として"draw"が図4に示す動詞変換ルール32(言語
変換ルール)に追加され、図18に示す動詞変換ルール
32となる。但し、変換条件は、例えば、機械翻訳シス
テム部2で保存してある概念構造等を参照して、機械訳
語と理想訳語の対応関係から生成する。上記の例では、
選択条件は「S」に対応しているのは、"he"で「主体」
となり、「O1」に対応しているのは、"toporographic
al map" で「地形図」となる。
In the above example, the second step 1003
For example, if the unreachable word is one word in the machine translation and one word in the ideal translation, it is determined by the processing of the bilingual expression group extraction unit 5 that there is a correspondence. As shown in FIG. 17 , the input word “write”, the machine translation “write”, and the ideal translation “draw” as a bilingual expression set as shown in FIG.
Moreover, how to take the correspondence it is extracted as a match to the remainder. Thus, in step 1007, "draw" is added to the verb conversion rule 32 (language conversion rule) shown in FIG. 4 as a translation of "write", and becomes the verb conversion rule 32 shown in FIG . However, the conversion condition is generated from the correspondence between the machine translation word and the ideal translation word with reference to, for example, the conceptual structure stored in the machine translation system unit 2. In the example above,
The selection condition corresponding to "S" is "he" and "subject"
And "O1" corresponds to "toporographic
al map "becomes" topographic map ".

【0098】上記のように、本発明は、第1の自然言語
である入力文、入力文を機械翻訳システムで翻訳した第
2の自然言語である機械訳文、入力文と対訳関係にある
第2の自然言語である理想訳文から対応関係にある、入
力語、機械訳語、理想訳語を抽出して、その結果から機
械翻訳用の辞書4やルール3を追加変更できる。従っ
て、機械翻訳システムにおいて、第1の自然言語文が入
力されて翻訳される場合に、上記のようにして追加変更
された辞書4やルール3を用いることにより、理想訳に
近似する第2の自然言語文を出力することが可能とな
る。
As described above, the present invention provides an input sentence which is a first natural language, a machine translation sentence which is a second natural language obtained by translating the input sentence by a machine translation system, and a second translation which has a bilingual relationship with the input sentence. An input word, a machine translation word, and an ideal translation word which are in correspondence with each other are extracted from the ideal translation sentence, which is a natural language, and the dictionary 4 and the rule 3 for machine translation can be additionally changed from the result. Therefore, in the machine translation system, when the first natural language sentence is input and translated, the dictionary 4 and the rule 3 that have been added and changed as described above are used, so that the second translation that approximates the ideal translation is performed. It is possible to output a natural language sentence.

【0099】また、追加変更された辞書4または、ルー
ル3を用いて、第1自然言語文を機械翻訳システムで翻
訳し、その前の翻訳結果と比較して変化がなくなった時
に、この学習を終了することによって、辞書4やルール
3が最適な状態で登録される。なお、辞書・ルール追加
変更部7にも表示機能を持たせ、追加変更する辞書4や
ルール3の内容をユーザに提示することにより、ユーザ
が確認した上で辞書4やルール3を更新することも可能
である。
Further, the first natural language sentence is translated by the machine translation system using the dictionary 4 or the rule 3 which has been added and changed, and when there is no change compared with the previous translation result, this learning is performed. Upon completion, the dictionary 4 and the rule 3 are registered in an optimal state. The dictionary / rule addition / change unit 7 is also provided with a display function, and presents the contents of the dictionary 4 or the rule 3 to be added / changed to the user so that the user can confirm and update the dictionary 4 or the rule 3. Is also possible.

【0100】なお、上記の実施例では、図1及び図2
示す構成に基づいて説明したが、この例に限定されるこ
となく、図1及び図2に記載されている対訳文読み込み
部1、対訳表現組抽出部5、対訳表現組み合わせ抽出部
6及び辞書・ルール追加変更部7をプログラムとして構
築し、フレキシブルディスクやCD−ROM等の可搬
媒体に格納する、または、ディスク装置等の媒体に格
納し、各プログラムを起動して機械翻訳システム部2か
ら出力された情報を処理することにより、ルールや辞書
を追加変更するようにすることも可能である。
[0100] In the above embodiment has been described based on the configuration shown in FIGS. 1 and 2, without being limited to this example, FIG. 1 and translated sentence reading unit 1 that is described in Figure 2 , translated expression set extraction unit 5 constructs a translated expression combination extraction section 6 and the dictionary rules additional changing unit 7 as a program, portable Stories such as a flexible disk or a CD-ROM
Stored in medium or stored on a medium of a disk device or the like, by processing the information output from the machine translation system unit 2 to start each program, be adapted to add change rules and dictionaries Is also possible.

【0101】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
The present invention is not limited to the above-described embodiment, but can be variously modified and applied within the scope of the claims.

【0102】[0102]

【発明の効果】本発明によれば、互いに対訳関係にある
第1の自然言語の文(入力文)と第2の自然言語の文
(理想訳文)を読み込ませることにより、機械翻訳シス
テム用辞書・ルールを自動的に追加変更することが可能
となる。これは、機械翻訳システムが翻訳する際に生成
した概念構造等の情報や機械翻訳システムが使用してい
る辞書の情報を参照することによって、対訳関係にある
入力語、機械訳語、理想訳語の組を抽出し、その結果か
ら機械翻訳用の辞書やルールを追加変更する。これによ
り、機械翻訳システムの辞書やルールを翻訳対象分野向
きにチューンすることができる。
According to the present invention, a sentence in a first natural language (input sentence) and a sentence in a second natural language (ideal translation) that are bilingually related to each other are read, thereby providing a dictionary for a machine translation system.・ Rules can be automatically added and changed. This is a combination of bilingual input words, machine translations, and ideal translations by referring to information such as the conceptual structure generated during translation by the machine translation system and information in the dictionary used by the machine translation system. Is extracted, and the dictionary and rules for machine translation are added and changed from the result. As a result, the dictionary and rules of the machine translation system can be tuned for the translation target field.

【0103】また、辞書・ルール追加変更ステップに表
示機能を持たせ、追加変更する辞書やルールの内容をユ
ーザに提示することが可能である。これにより、ユーザ
が確認した上で辞書やルールを更新することも可能であ
る。上記辞書・ルール追加変更ステップにより得られた
辞書やルールを用いて、辞書・ルール学習方法を繰り返
すことによって、登録された辞書やルールの検証がで
き、さらに1回の学習過程では得られなかった辞書やル
ールを抽出することができる。
Further, it is possible to provide a display function to the dictionary / rule addition / change step, and to present the contents of the dictionary or rule to be added / changed to the user. Thereby, it is also possible to update the dictionary and the rules after the user confirms. By repeating the dictionary / rule learning method using the dictionary / rule obtained in the dictionary / rule addition / change step, the registered dictionary / rule can be verified, and cannot be obtained in a single learning process. Dictionaries and rules can be extracted.

【0104】学習終了判定ステップは、学習を終了する
かどうかを自動的に判定する。これによって、学習結果
を人が見ずに、自動的に学習が終了する。機械翻訳結果
は、自動的に保存される。これによって、機械訳文が定
常状態になったときに学習が自動的に終了し、最適な辞
書やルールが登録される。従って、上記ステップを全て
実行することにより、機械翻訳システム用辞書やルール
が自動的に翻訳対象分野にチューンされ、機械翻訳シス
テム用辞書、ルールの学習が可能となる。
The learning end determination step automatically determines whether to end learning. As a result, the learning is automatically terminated without a person watching the learning result. Machine translation results are automatically saved. As a result, when the machine translation is in a steady state, the learning is automatically terminated, and the optimal dictionary and rules are registered. Therefore, by executing all of the above steps, the machine translation system dictionary and rules are automatically tuned to the translation target field, and the machine translation system dictionary and rules can be learned.

【0105】上述のように、本発明によれば、対訳コー
パスの情報だけを利用するのではなく、機械翻訳システ
ムが参照・生成した情報を利用することによって、辞書
やルールが追加変更され、追加変更された辞書やルール
を用いて最適なルールが登録されるまで繰り返すことに
より、対訳コーパスから得られるその翻訳対象分野用の
機械翻訳システムの辞書やルールを抽出することができ
る。
As described above, according to the present invention, instead of using only the information of the bilingual corpus, the dictionary and rules are added and changed by using the information referred to and generated by the machine translation system. By repeating until the optimal rule is registered using the changed dictionary or rule, a dictionary or rule of the machine translation system for the translation target field obtained from the bilingual corpus can be extracted.

【0106】このようにして登録された辞書やルールを
用いることにより、機械翻訳システムでは、理想訳に近
い翻訳文を生成でき、また、翻訳対象文が違っていても
学習に用いた対訳コーパスと同じ分野の第1の自然言語
文を入力すれば、より理想訳に近い翻訳文を生成するこ
とが可能となる。
By using the dictionary and rules registered in this way, the machine translation system can generate a translated sentence close to the ideal translation, and can use the bilingual corpus used for learning even if the translation target sentence is different. If a first natural language sentence in the same field is input, a translated sentence closer to the ideal translation can be generated.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例の機械翻訳用辞書・ルール自
動学習システムの基本ブロック構成図である。
FIG. 1 is a dictionary / rule for machine translation according to an embodiment of the present invention .
It is a basic block configuration diagram of a dynamic learning system.

【図2】本発明の一実施例の追加変更される辞書やルー
ルを用いた機械翻訳システムの基本ブロック図である。
FIG. 2 is a diagram illustrating a dictionary and a rule to be added and changed according to an embodiment of the present invention;
FIG. 1 is a basic block diagram of a machine translation system using a file.

【図3】本発明の一実施例の言語変換辞書のエントリの
例を示す図である。
FIG. 3 shows an example of an entry in a language conversion dictionary according to an embodiment of the present invention;
It is a figure showing an example.

【図4】本発明の一実施例の言語変換ルールのエントリ
の例を示す図である。
FIG. 4 shows an entry of a language conversion rule according to an embodiment of the present invention .
It is a figure showing the example of.

【図5】本発明の一実施例の対訳文の例を示す図であ
る。
FIG. 5 is a diagram showing an example of a bilingual sentence according to an embodiment of the present invention.
You.

【図6】本発明の一実施例の対訳理想訳語を抽出する処
理のフローチャートである。
FIG. 6 is a diagram illustrating a process for extracting a bilingual ideal translation according to an embodiment of the present invention;
It is a flowchart of a process.

【図7】本発明の一実施例の図6の結果得られる対訳表
現組と対応の取れ方を示す図である。
FIG. 7 is a bilingual table obtained as a result of FIG. 6 according to an embodiment of the present invention;
It is a figure which shows how to take correspondence with the present group.

【図8】本発明の一実施例の対応機械訳語理想訳語対を
抽出する処理のフローチャート(その1)である。
FIG. 8 shows a corresponding machine translation ideal translation pair according to an embodiment of the present invention .
It is a flowchart (the 1) of the process which extracts.

【図9】本発明の一実施例の第2言語生成辞書のエント
リの例を示す図である。
FIG. 9 illustrates an entry of a second language generation dictionary according to an embodiment of the present invention .
FIG. 6 is a diagram illustrating an example of a file.

【図10】本発明の一実施例の図8の結果得られる対訳
表現組と対応の取れ方を示す図である。
FIG. 10 is a translation obtained from the result of FIG. 8 according to an embodiment of the present invention;
It is a figure which shows how to take correspondence with an expression group.

【図11】本発明の一実施例の対応機械訳語対を抽出す
る処理のフローチャート(その2)である。
FIG. 11 extracts a corresponding machine translation word pair according to an embodiment of the present invention .
10 is a flowchart (No. 2) of the process of FIG.

【図12】本発明の一実施例の言語変換辞書を第2の自
然言語をキーに逆引きした時のエントリの例を示す図で
ある。
FIG. 12 is a diagram illustrating a case where a language conversion dictionary according to an embodiment of the present invention is stored in a second directory
In the figure which shows the example of the entry when the reverse is done with the language as the key
is there.

【図13】本発明の一実施例の図11の結果得られる対
訳表現組と対応の取れ方を示す図である。
FIG. 13 shows the resulting pair of FIG. 11 for one embodiment of the present invention.
It is a figure which shows how to take correspondence with a translation expression group.

【図14】本発明の一実施例の図3の名詞変換辞書のエ
ントリから辞書の追加変更処理を行った結果得られる名
詞変換辞書の例を示す図である。
14 is a diagram showing an example of the noun conversion dictionary of FIG. 3 according to an embodiment of the present invention; FIG.
Name obtained as a result of adding and changing the dictionary from the entry
It is a figure showing the example of a lyric conversion dictionary.

【図15】本発明の一実施例の学習を繰り返し行う処理
のフローチャートである。
FIG. 15 is a diagram illustrating a process of repeatedly performing learning according to an embodiment of the present invention;
It is a flowchart of FIG.

【図16】本発明の一実施例の学習を繰り返し行う処理
のフローチャートである。
FIG. 16 is a diagram illustrating a process of repeatedly performing learning according to an embodiment of the present invention;
It is a flowchart of FIG.

【図17】本発明の一実施例の図15において2回目の
学習処理を行った結果得られる対訳表現組と対応の取れ
方を示す図である。
FIG. 17 shows a second example in FIG. 15 of one embodiment of the present invention.
Correspondence between bilingual expression sets obtained as a result of learning processing
FIG.

【図18】本発明の一実施例の図4の動詞変換ルールの
エントリからルールの追加変更処理を行った結果得られ
る動詞変換ルールの例を示す図である。
FIG. 18 shows a verb conversion rule of FIG. 4 according to an embodiment of the present invention;
Obtained as a result of adding and changing rules from the entry
FIG. 9 is a diagram showing an example of a verb conversion rule.

【符号の説明】[Explanation of symbols]

1 対訳文読み込み部 2 機械翻訳システム部 3 ルール 4 辞書 5 対訳表現組抽出部 6 対応表現組合わせ抽出部 7 辞書・ルール追加変更部 8 第1自然言語入力部 9 第2自然言語出力部 21 第1言語解析部 22 言語変換部 23 第2言語生成部 31 第1言語解析ルール 32 言語変換ルール 33 第2言語生成ルール 41 第1言語解析辞書 42 言語変換辞書 43 第2言語生成辞書 51 対訳機械訳語抽出部 52 対訳理想訳語抽出部 53 対訳機械訳語理想訳語対抽出部 61 対訳表現組確度付与部 62 対訳表現組合せ作成部 1 bilingual sentence reading unit 2 machine translation system unit 3 rule 4 dictionary 5 bilingual expression set extraction unit 6 corresponding expression combination extraction unit 7 dictionary / rule addition / change unit 8 first natural language input unit 9 second natural language output unit 21 1 language analyzer 22 language converter 23 second language generator 31 first language analysis rule 32 language conversion rule 33 second language generation rule 41 first language analysis dictionary 42 language conversion dictionary 43 second language generation dictionary 51 bilingual machine translation Extraction unit 52 Bilingual ideal translation word extraction unit 53 Bilingual machine translation ideal translation word pair extraction unit 61 Bilingual expression group accuracy giving unit 62 Bilingual expression combination creating unit

フロントページの続き (56)参考文献 特開 平7−244664(JP,A) 日英翻訳システムにおける用言意味属 性を用いたゼロ代名詞照応解析,情報処 理学会論文誌,1993年 8月15日,Vo l.34,No.8,p.1705−p.1715 日英対訳コーパス中のゼロ代名詞とそ の指示対象の自動認定,情報処理学会研 究報告98−NL−123,1998年 1月19 日,Vol.98,No.1,p.33− p.40 日英対訳コーパスを用いた文章外照応 ゼロ代名詞解析規則の自動獲得,情報処 理学会第55回(平成9年前期)全国大会 講演論文集(2),1997年 9月24日, p.45−p.46 (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28 JICSTファイル(JOIS)Continuation of the front page (56) References JP-A-7-244664 (JP, A) Zero-pronoun anaphoric analysis using semantic attributes in Japanese-to-English translation systems, Transactions of the Information Processing Society of Japan, August 15, 1993 Day, Vol. 34, no. 8, p. 1705-p. 1715 Automatic recognition of zero pronouns and their referents in a Japanese-English bilingual corpus, IPSJ Research Report 98-NL-123, January 19, 1998, Vol. 98, No. 1, p. 33-p. 40 Text-to-Sentence Correlation Using a Japanese-English Bilingual Corpus Automatic Acquisition of Zero-Pronoun Parsing Rules, Information Processing Society of Japan 55th (Early 1997) National Congress 45-p. 46 (58) Field surveyed (Int.Cl. 7 , DB name) G06F 17/21-17/28 JICST file (JOIS)

Claims (22)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 原言語である第1の自然言語の入力文を
目的言語である第2の自然言語の文に変換する機械翻訳
システムで利用する辞書やルールを追加変更する機械翻
訳システム用辞書・ルール学習装置であって、 前記入力文と対訳関係にある第2の自然言語の理想訳文
を入力する理想訳文入力手段と、 前記理想訳文入力手段により、入力された前記入力文を
前記機械翻訳システムで変換した前記第2の自然言語の
機械訳文と、該入力文とを比較する比較手段と、 前記比較手段により、前記入力文中の入力単語と対訳関
係にある該機械訳語及び理想訳文中の理想訳語の3組の
集合を抽出することにより、前記辞書や前記ルールの何
れかまたは、両方を追加変更する更新手段とを有するこ
とを特徴とする機械翻訳システム用辞書・ルール学習装
置。
1. An input sentence of a first natural language which is a source language is
Machine translation that translates into a second natural language sentence that is the target language
The dictionaries and rules used by the systemAdditional changesMachine translation
Dictionary and rule learning for translation systemA device, An ideal translation of a second natural language in parallel with the input sentence
An ideal translation input means for inputting The input sentence input by the ideal translation input means is
Of the second natural language converted by the machine translation system
Comparing means for comparing the machine translated sentence with the input sentence, The comparing means compares the input word in the input sentence
Three sets of the machine translation and the ideal translation in the ideal translation
By extracting a set, the contents of the dictionary and the rules
Update means to add or change both or both.
Dictionary and rule learning equipment for machine translation systems
Place.
【請求項2】 互いに対訳関係にある前記入力文と、前
記第2の自然言語の理想訳文を読み込む対訳文読み込み
手段と、 前記入力文と前記理想訳文と前記機械訳文を比較して、
該入力文中の入力単語と該入力単語と対訳関係にある該
機械訳文中の機械訳語及び該理想訳文中の理想訳語の3
組である対訳表現組の集合である対訳表現集合を抽出す
対訳表現組抽出手段と、 前記対訳表現組抽出手段で抽出された前記対訳表現組集
合に基づいて、前記辞書や、前記ルールを追加変更する
辞書・ルール追加変更手段を含む請求項1記載の機械翻
訳システム用辞書・ルール学習装置
2. The input sentence having a bilingual relationship with each other and
Read the ideal translation of the second natural languageRead bilingual sentence
Means,  Comparing the input sentence, the ideal translation and the machine translation,
The input word in the input sentence and the input word having a bilingual relationship with the input word
3 of the machine translation in the machine translation and the ideal translation in the ideal translation
Extract the bilingual expression set that is the set of bilingual expression sets
ToBilingual expression set extraction means,  The bilingual expression set extractionDepartureThe set of bilingual expressions extracted in the column
Add or change the dictionary or rule based on the
Dictionary / rule addition changemeansThe machine translation according to claim 1, comprising:
Dictionary and rule learning for translation systemapparatus.
【請求項3】 前記対訳表現組抽出手段は、 前記対訳表現集合を抽出する際に、前記入力文を前記機
械翻訳システムで前記機械訳文に変換する際の変換履歴
を用いて該入力文中の入力単語と対訳関係にある該機械
訳文中の機械訳語を抽出する対訳機械訳語対抽出手段
含む請求項1記載の機械翻訳システム用辞書・ルール学
装置
3. Extracting the bilingual expression setMeans are  When extracting the bilingual expression set, the input sentence
Conversion history when converting to the machine translation by machine translation system
The machine having a bilingual relationship with the input word in the input sentence using
Bilingual Machine Translation Pair Extraction to Extract Machine Translation Words in Translated TextmeansTo
2. A dictionary and rules science for a machine translation system according to claim 1.
Learningapparatus.
【請求項4】 前記対訳表現組抽出手段は、 前記対訳表現集合を抽出する際に、 前記入力文中の入力単語と対訳関係にある前記理想訳文
中の理想訳語を抽出する対訳理想訳語対抽出手段を含む
請求項2記載の機械翻訳システム用辞書・ルール学習装
置。
4. Extraction of the bilingual expression setMeans are  When extracting the bilingual expression set, the ideal translation having a bilingual relationship with an input word in the input sentence
Extraction of ideal translation word pairsIncluding means
A dictionary / rule learning device for a machine translation system according to claim 2.
Place.
【請求項5】 前記対訳理想訳語対抽出手段は、 前記第1の自然言語と前記第2の自然言語の対訳辞書
と、 前記理想訳語を抽出する際に利用して、前記入力文中の
入力単語をキーにし、前記対訳辞書を検索し、該入力単
語と対訳関係にある第2の自然言語の入力単語訳語候補
を抽出する入力単語訳語候補抽出手段と、 前記入力単語訳語候補と前記理想訳語を比較して、対訳
関係にある前記入力文中の入力単語と前記理想訳文中の
理想訳語の対の組を抽出する入力単語・理想訳語対訳抽
手段とを含む請求項4記載の機械翻訳システム用辞書
・ルール学習装置。
5. Extraction of the bilingual ideal translation pairMeans are Bilingual dictionary of the first natural language and the second natural language
When, It is used when extracting the ideal translation word, and is used in the input sentence.
Using the input word as a key, the bilingual dictionary is searched, and the input unit is searched.
Input word translation candidate of the second natural language that has a bilingual relationship with the word
Input word translation word extraction means for extracting  Comparing the input word translation candidate with the ideal translation,
The input word in the input sentence and the
Input word / ideal translation bilingual extraction to extract pairs of ideal translations
Out5. The dictionary for a machine translation system according to claim 4, comprising:
-Rule learning device.
【請求項6】 前記対訳理想訳語対抽出手段は、 第2の自然言語の辞書と、 前記入力単語訳語候補抽出手段で抽出される前記入力単
語訳語候補をキーにして、前記第2の自然言語の辞書を
検索して抽出される入力単語訳語候補関連語と前記理想
訳語とを比較して、対訳関係にある前記入力文中の入力
単語と該理想訳文中の理想訳語の対の組を抽出する手段
を含む請求項5記載の機械翻訳システム用辞書・ルール
学習装置。
6. Extraction of the bilingual ideal translation pairMeans are A second natural language dictionary;  Extraction of the input word translation candidatemeansThe input unit extracted by
Using the word translation candidate as a key, the second natural language dictionary is
Input word translation candidate candidate related words extracted by searching and the ideal
The input in the input sentence having a bilingual relation is compared with the translated word.
Extract pairs of words and ideal translations in the ideal translationmeans
6. The dictionary and rule for a machine translation system according to claim 5, wherein
Learning device.
【請求項7】 前記対訳表現組抽出手段は、 前記対訳表現組集合を抽出する際に、対応関係にある前
記機械訳文中の機械訳語と前記理想訳文中の理想訳語を
抽出する対応機械訳語理想語対抽出手段を含む請求項2
乃至4のいずれか1項記載の機械翻訳システム用辞書・
ルール学習装置。
7. Extracting the bilingual expression setMeans are  When extracting the bilingual expression group set,
Machine translation in the machine translation and the ideal translation in the ideal translation
Extraction of corresponding machine translation ideal word pairs to be extractedClaim 2 including means
The dictionary for a machine translation system according to any one of claims 1 to 4,
Rule learning device.
【請求項8】 前記対応機械訳語理想語対抽出手段は、 前記機械訳文中の機械訳語と前記理想訳文中の理想訳語
を抽出する際に、前記第2の自然言語の辞書を利用する
手段を含む請求項7記載の機械翻訳システム用辞書・ル
ール学習装置。
8. The corresponding machine translated word ideal word pair extracting means , when extracting the machine translated word in the machine translated sentence and the ideal translated word in the ideal translated sentence, uses the dictionary of the second natural language.
8. A dictionary for a machine translation system according to claim 7, comprising means.
Learning device.
【請求項9】 前記対応機械訳語理想語対抽出手段は、 前記機械訳文中の機械訳語と前記理想訳文中の理想訳語
を抽出する際に、前記第2の自然言語の辞書を利用し
て、前記機械訳文中の機械訳語をキーにし、該第2の自
然言語の辞書を検索して抽出される機械訳語関連語と前
記理想訳語を比較する手段を含む請求項7記載の機械翻
訳システム用辞書・ルール学習装置。
9. The corresponding machine translated word ideal word pair extracting means, when extracting a machine translated word in the machine translated sentence and an ideal translated word in the ideal translated sentence, using the second natural language dictionary, It said machine machine translation in translation to the key of claim 7, including means for comparing the ideal translation with machine translation related words are extracted by searching the second natural language dictionaries machine transliteration
Dictionary / rule learning device for translation system.
【請求項10】 前記対応機械訳語理想語対抽出手段
、 前記機械訳文中の機械訳語と前記理想訳文中の理想訳語
を抽出する際に、前記第2の自然言語の辞書を利用し
て、前記機械訳文中の機械訳語をキーにし、該第2の自
然言語の辞書を検索して抽出される機械訳語関連語と前
記理想訳語を比較する手段を含む請求項7記載の機械翻
訳システム用辞書・ルール学習装置。
10. The corresponding machine translated word ideal word pair extracting means.
, There is provided a method for calculating the ideal translation in the ideal translation and machine translation in the machine translation, using the second natural language dictionaries, the machine translation in the machine translation as a key, said 8. The machine translation according to claim 7, further comprising means for comparing said ideal translation with a machine translation related word extracted by searching a second natural language dictionary.
Dictionary / rule learning device for translation system.
【請求項11】 前記対応機械訳語理想語対抽出手段
は、 前記機械訳文中の機械訳語と前記理想訳文中の理想訳語
を抽出する際に、前記第1の自然言語と前記第2の自然
言語の対訳辞書を利用して、前記機械訳文中の機械訳語
をキーにして得られる第1の自然言語の訳語の集合であ
る機械訳逆引訳語候補と、前記理想訳文中の理想訳語を
キーにして得られる第1の自然言語の訳語の集合である
理想訳逆引訳語候補を抽出する手段と、 前記機械訳逆引訳語候補と前記理想訳逆引訳語候補を比
較することによって、対応関係にある該機械訳文中の機
械訳語と、前記理想訳文中の理想訳語を抽出する手段を
含む請求項7記載の機械翻訳システム用辞書・ルール学
習装置。
11. The corresponding machine translated word ideal word pair extraction.means
Is  The machine translation in the machine translation and the ideal translation in the ideal translation
Extracting the first natural language and the second natural language
Using a bilingual dictionary of languages, machine translation words in the machine translation sentence
Is the set of first natural language translations obtained using
Machine translation reverse translation candidate and the ideal translation in the ideal translation
A set of first natural language translations obtained as keys
Means for extracting an ideal translation reverse-translated word candidate;
By comparing, the corresponding machine in the machine translation
Extract the machine translation and the ideal translation in the ideal translationMeans
The dictionary and rules science for a machine translation system according to claim 7.
Learning device.
【請求項12】 前記対訳表現組抽出手段は、 前記第2の自然言語の語同士を比較する際に、前記機械
訳文中の機械語または、前記入力単語訳語候補または、
前記入力単語訳語候補関連語または、前記機械訳語関連
語の少なくとも1つの語の異なり別に集計した機械訳語
異なり語リストを作成する手段と、 前記理想訳文中の理想訳語または、前記理想訳語関連語
のいずれか、または、両方の異なり別に集計した理想訳
語異なり語リストを作成する手段と、 前記 機械訳異なり語リスト中の語と、前記理想訳異なり
語リスト中の語を比較する手段とを含む請求項2、3、
4または、7のいずれいか1項記載の機械翻訳システム
用辞書・ルール学習装置。
12. The bilingual expression set extractionMeans are  When comparing words of the second natural language,
The machine language in the translation, or the input word translation candidate, or
The input word translation word candidate related word or the machine translation word related
Machine translations aggregated separately for at least one of the words
Create different word listMeans to  Ideal translation in the ideal translation or the ideal translation related word
Ideal translations that are aggregated separately for either or both
Create list of different wordsMeans to Said Unlike the machine translation, the words in the word list,SaidDifferent ideal translation
Compare words in word listClaims 2 and 3, including means
8. The machine translation system according to any one of 4 or 7,
Dictionary / rule learning device.
【請求項13】 前記対訳表現組抽出手段は、 前記第1の自然言語の語同士を比較する際に、前記入力
単語、前記機械訳逆引訳語候補の少なくとも1つを、語
の異なり別に集計した入力単語機械訳逆引訳語候補異な
り語リストを作成する手段と、 前記理想訳逆引訳語候補を語の異なり別に集計した理想
訳逆引訳語候補異なり語リストを作成する手段と、 前記入力単語機械訳逆引訳語候補異なり語リスト中の語
と前記理想訳逆引訳語候補異なり語リスト中の語を比較
する手段を含む請求項2、3、4、または、7のいずれ
か1項記載の機械翻訳システム用辞書・ルール学習装
置。
13. The bilingual expression set extracting means, when comparing the words of the first natural language, sums up at least one of the input word and the machine translation reverse-translated word candidate separately for different words. and means for creating the means for creating an input word machine translation reverse引訳word candidate different word list, the ideal translation reverse引訳word candidate Unlike word list obtained by aggregating the ideal translation reverse引訳word candidates by different words, the input word Compare the words in the list of words with different machine translation reverse-translated words to the words in the list of words that are different from the ideal translation reverse-translated words.
8. The method of claim 2, 3, 4 or 7, including means for performing
A dictionary / rule learning device for a machine translation system according to claim 1.
Place.
【請求項14】 前記対訳表現組抽出手段は、 前記第1の自然言語の語同士、前記第2の自然言語の語
同士を比較する際に、 両者の語が一致するか、一方の語が他方の語を含んでい
るか、両方の語の一部が一致するかにより、対応の度合
を区別する手段を含む請求項2、3、4、または、7の
いずれか1項記載の機械翻訳システム用辞書・ルール学
習装置。
14. Extraction of the bilingual expression setMeans are  Words of the first natural language, words of the second natural language
When comparing two words that match, or that one word contains the other
Or the degree of correspondence depends on whether or not both words match.
Distinguish9. The method of claim 2, 3, 4, or 7, including means.
Dictionaries and rules science for machine translation systems according to any one of the above.
Learning device.
【請求項15】 前記対訳表現組抽出手段は、 前記理想訳文を形態素解析し、理想訳形態素構造を抽出
する際に、前記理想訳形態素構造の情報を利用して、前
記機械訳逆引訳語候補、前記理想訳逆引訳語候補、前記
理想訳異なり語リスト中の語の少なくとも1つと、前記
機械訳異なり語リスト中の語、前記機械訳逆引訳語候補
異なり語リスト中の語、前記理想訳逆引訳語候補異なり
語リスト中の語の少なくとも1つを比較する手段を含む
請求項2、3、4、または、7のいずれか1項記載の機
械翻訳システム用辞書・ルール学習装置。
15. The extraction of the bilingual expression setMeans are  Morphological analysis of the ideal translation and extraction of ideal translation morphological structure
When using the information of the ideal morphological structure,
The machine translation reverse translation word candidate, the ideal translation reverse translation word candidate,
Different from the ideal translation, at least one of the words in the word list and the
A word in the word list that is different from the machine translation, and the machine translation reverse translation word candidate
Different words in the word list, different from the ideal translation reverse candidate word
Compare at least one of the words in the word listIncluding means
A machine according to any one of claims 2, 3, 4, or 7.
Dictionary and rule learning device for machine translation system.
【請求項16】 前記対訳表現組抽出手段によって抽出
される前記対訳表現組集合から、前記入力文と前記理想
訳文と前記機械訳文の1組から抽出できる対訳表現組の
組み合わせである対訳表現組み合わせの集合を抽出する
対訳表現組み合わせ抽出手段を更に有する請求項2、
3、4、7、13、14、または、15のいずれか1項
記載の機械翻訳システム用辞書・ルール学習装置。
From the translated expression set set 16. is extracted by the translated expression set extraction unit, translated expressions the input sentence and the ideal translation is a combination of translated expression set which can be extracted from a set of said machine translation 3. The system according to claim 2, further comprising a bilingual expression combination extracting means for extracting a set of combinations .
Any one of 3, 4, 7, 13, 14, or 15
Dictionary / rule learning device for machine translation system described.
【請求項17】 前記対訳表現組抽出手段は、 前記対訳表現組抽出手段 によって、抽出される前記対訳
表現組集合の個々の対訳表現組に、個々の対訳表現組の
抽出過程に応じた確度である対訳表現組確度を付与する
対訳表現組確度付与手段を有し、 前記対訳表現組み合わせ抽出手段は、 前記対訳表現集合中の個々の対訳表現組に付与された対
訳表現組確度を利用して、個々の前記対訳表現組み合わ
せに確度を付与する手段を有し、 前記辞書・ルール追加変更手段は、 前記対訳表現組み合わせ抽出手段によって、抽出される
前記対訳表現組み合わせ集合中の個々の対訳表現組み合
わせに付与された確度を利用して前記辞書や前記ルール
を追加変更する手段を有する請求項16記載の機械翻訳
システム用辞書・ルール学習装置。
17.The bilingual expression set extracting means, The bilingual expression set extracting means The bilingual extracted by
Each bilingual expression set in the expression set
Gives the accuracy of the bilingual expression group corresponding to the extraction process
Bilingual expression group accuracy assignmentHaving means,  Extraction of the bilingual expression combinationMeans are  Pairs assigned to each set of bilingual expressions in the set of bilingual expressions
Using the translation expression combination accuracy, the individual translation expression combination
AccuracyHaving means to  Dictionary / rule addition changeMeans are  Extraction of the bilingual expression combinationBy meansExtracted
Individual bilingual expression combinations in the bilingual expression combination set
The dictionary or the rule using the accuracy given to the
Add or change17. The machine translation according to claim 16, comprising means.
System dictionary / rule learning device.
【請求項18】 前記機械翻訳システム用辞書・ルール
学習装置によって得られる前記辞書や前記ルールを用い
て、学習を繰り返す繰り返し手段を有する請求項1乃至
17のいずれか1項記載の機械翻訳システム用辞書・ル
ール学習装置。
18. The apparatus according to claim 1, further comprising a repeating unit for repeating learning using the dictionary and the rules obtained by the dictionary and rule learning device for the machine translation system.
The dictionary for machine translation system according to any one of claims 17 to 17
Learning device.
【請求項19】 前記辞書・ルール追加変更手段は、 学習終了を判定する学習終了判定手段を含む請求項18
記載の機械翻訳システム用辞書・ルール学習装置。
19. The dictionary / rule addition changeMeans are  Learning end judgment to judge learning end19. The method of claim 18, including means.
Dictionary / rule learning device for machine translation system described.
【請求項20】 前記機械翻訳システム用辞書・ルール
学習装置によって得られる前記辞書や前記ルールを用い
て前記入力文を翻訳した結果の履歴である機械訳文履歴
格納手段に記録する機械訳翻訳履歴保持手段を有し、 前記学習終了判定手段は、 前記機械訳文履歴格納手段の記録内容が定常状態になっ
たときに、学習が終了すると判定する手段を含む請求項
19記載の機械翻訳システム用辞書・ルール学習装置。
20. A dictionary / rule for the machine translation system
LearningEquipmentUsing the dictionary and the rules
Machine translation history, which is the history of the result of translating the input sentence
Machine translation history stored in storageHaving means,  The end of learningMeans are  The recorded content of the machine translation history storage unit is in a steady state.
When learning endsClaims including means
19. The dictionary / rule learning device for a machine translation system according to item 19.
【請求項21】 前記辞書・ルール追加変更手段は、 前記辞書または、前記ルールを変更する情報を表示する
表示手段を含む請求項17または、19記載の機械翻訳
システム用辞書・ルール学習装置。
21. The dictionary / rule addition / changeMeans are  Display information for changing the dictionary or the rule
display20. Machine translation according to claim 17 or claim 19 including means.
System dictionary / rule learning device.
【請求項22】 原言語である第1の自然言語の入力文
を目的言語である第2の自然言語の文に変換する機械翻
訳システムで利用する辞書やルールを追加変更する機械
翻訳システム用辞書・ルール学習プログラムを格納した
記憶媒体であ って、 前記入力文と対訳関係にある第2の自然言語の理想訳文
を入力する理想訳文入力ステップと、 前記理想訳文入力ステップにより、入力された前記入力
文を前記機械翻訳システムで変換した前記第2の自然言
語の機械訳文と、該入力文とを比較する比較ステップ
、 前記比較ステップにより、前記入力文中の入力単語と対
訳関係にある該機械訳語及び理想訳文中の理想訳語の3
組の集合を抽出することにより、前記辞書や前記ルール
の何れかまたは、両方を追加変更する更新ステップから
なる機械翻訳システム用辞書・ルール学習プログラムを
格納した記憶媒体。
22. An input sentence of a first natural language which is a source language
Translation that translates a sentence into a second natural language sentence that is the target language
Dictionary and rules used in translation systemAdditional changesMachine
Dictionary and rule learning for translation systemsStored program
Storage media What  An ideal translation of a second natural language in parallel with the input sentence
Enter ideal translationSteps and  Input ideal translationStepsBy the input
The second natural language converted from a sentence by the machine translation system
Comparison between the machine translation of a word and the input sentenceSteps
WhenThe comparisonStepsWith the input word in the input sentence
3 of the machine translation and the ideal translation in the ideal translation
By extracting a set of sets, the dictionary or the rule
Update that adds or changes one or both ofFrom step
A machine learning dictionary and rule learning program
The storage medium in which it was stored.
JP13555397A 1997-05-26 1997-05-26 Dictionary / rule learning device for machine translation system and storage medium storing dictionary / rule learning program for machine translation system Expired - Fee Related JP3353647B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13555397A JP3353647B2 (en) 1997-05-26 1997-05-26 Dictionary / rule learning device for machine translation system and storage medium storing dictionary / rule learning program for machine translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13555397A JP3353647B2 (en) 1997-05-26 1997-05-26 Dictionary / rule learning device for machine translation system and storage medium storing dictionary / rule learning program for machine translation system

Publications (2)

Publication Number Publication Date
JPH10326276A JPH10326276A (en) 1998-12-08
JP3353647B2 true JP3353647B2 (en) 2002-12-03

Family

ID=15154497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13555397A Expired - Fee Related JP3353647B2 (en) 1997-05-26 1997-05-26 Dictionary / rule learning device for machine translation system and storage medium storing dictionary / rule learning program for machine translation system

Country Status (1)

Country Link
JP (1) JP3353647B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000073975A1 (en) * 1999-05-31 2000-12-07 Cai Co., Ltd. Rewrite system
JP6884945B2 (en) * 2016-09-06 2021-06-09 国立研究開発法人情報通信研究機構 Training data generator, optimal parameter acquisition device, training data generation method, and optimal parameter acquisition method

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
日英対訳コーパスを用いた文章外照応ゼロ代名詞解析規則の自動獲得,情報処理学会第55回(平成9年前期)全国大会講演論文集(2),1997年 9月24日,p.45−p.46
日英対訳コーパス中のゼロ代名詞とその指示対象の自動認定,情報処理学会研究報告98−NL−123,1998年 1月19日,Vol.98,No.1,p.33−p.40
日英翻訳システムにおける用言意味属性を用いたゼロ代名詞照応解析,情報処理学会論文誌,1993年 8月15日,Vol.34,No.8,p.1705−p.1715

Also Published As

Publication number Publication date
JPH10326276A (en) 1998-12-08

Similar Documents

Publication Publication Date Title
JP3973549B2 (en) Bilingual dependency structure associating apparatus, method and program, and recording medium recording parallel translation dependency structure associating program
US5895446A (en) Pattern-based translation method and system
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
KR100530154B1 (en) Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system
WO2003056450A1 (en) Syntax analysis method and apparatus
JPH11110416A (en) Method and device for retrieving document from data base
JPH05151260A (en) Method and system for learning translation templet
JPWO2006090732A1 (en) Word translation device, translation method, and translation program
JP3765799B2 (en) Natural language processing apparatus, natural language processing method, and natural language processing program
JP3353647B2 (en) Dictionary / rule learning device for machine translation system and storage medium storing dictionary / rule learning program for machine translation system
JP3326646B2 (en) Dictionary / rule learning device for machine translation system
Georgantopoulos MSc in Speech and Language Processing Dissertation: Automatic summarising based on sentence extraction: A statistical approach
JP2546245B2 (en) Natural language sentence generation method
KR20010057775A (en) System for automatic translation based on sentence frame and method using the same
JP3323517B2 (en) Machine translation equipment
JP4007630B2 (en) Bilingual example sentence registration device
JP4031492B2 (en) Template creation device, dictionary creation device, template creation method, dictionary creation method, template creation program, dictionary creation program, and recording medium
JP2840258B2 (en) Method of creating bilingual dictionary and co-occurrence dictionary for machine translation system
JPH0561902A (en) Mechanical translation system
JPH11259482A (en) Machine translation system for composite noun
Bowden Cooperative error handling and shallow processing
JP3329371B2 (en) Machine translation rule device and recording medium recording machine translation rule generation program
JPH05225232A (en) Automatic text pre-editor
JP2000250914A (en) Machine translation method and device and recording medium recording machine translation program
JPH0320866A (en) Text base retrieval system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090927

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees