JP2000148756A - Translation error detecting device - Google Patents

Translation error detecting device

Info

Publication number
JP2000148756A
JP2000148756A JP10321782A JP32178298A JP2000148756A JP 2000148756 A JP2000148756 A JP 2000148756A JP 10321782 A JP10321782 A JP 10321782A JP 32178298 A JP32178298 A JP 32178298A JP 2000148756 A JP2000148756 A JP 2000148756A
Authority
JP
Japan
Prior art keywords
sentence
unit
error
translated
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10321782A
Other languages
Japanese (ja)
Inventor
Yukako Otani
友佳子 大谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10321782A priority Critical patent/JP2000148756A/en
Publication of JP2000148756A publication Critical patent/JP2000148756A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve the efficiency of operation for correcting a translation by calculating the error rate of the translation from the original text and its translation. SOLUTION: A translation error detecting device is equipped with a sentence input part 101 which inputs the original text and translation, an information extraction part 102 which extracts original sentence information from the original text and extracts translation information from the translation, a comparison part 105 which compares the original text information and translation information with each other, an error rate calculation part 106 which calculates the error rate of the translation on the basis of the comparison result of the comparison part 105, and a notification part 107 which notifies a user of the translation having a high error rate. Consequently, the original text and its translation are correlated with each other, the translation is compared to calculate its error rate, and the extent of errors of the translation is explicitly displayed.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書修正箇所検索
の作業効率の向上と、翻訳文の品質向上をはかる対訳文
誤り検出装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a bilingual sentence error detecting device for improving the efficiency of searching for a document correction portion and improving the quality of a translated sentence.

【0002】[0002]

【従来の技術】従来、機械翻訳システムを利用し第1の
言語を第2の言語へ翻訳する場合、品質の高い翻訳文を
得るために、前記システムが扱いやすい形に第1の言語
の文を書き換える前編集や、熟練者が翻訳文をその言語
らしい言い回しに置き換えるリライト等が行なわれてい
る。
2. Description of the Related Art Conventionally, when a first language is translated into a second language by using a machine translation system, the first language sentence is translated into a format which is easy to handle in order to obtain a high quality translation. Before rewriting, and rewriting, etc., in which a skilled person replaces a translated sentence with language-like expressions.

【0003】しかし、上述の前編集やリライトを機械的
に効率良く行なう手法は確立しておらず、その作業には
熟練者の知識、経験と多大な時間を要する。
However, there is no established technique for mechanically and efficiently performing the pre-editing and rewriting as described above, and the work requires knowledge, experience and a great deal of time of a skilled person.

【0004】また、第1の言語を第2の言語へ翻訳する
場合、訳抜けや訳語の不統一、誤訳などの問題があり、
特に、翻訳者が複数人の場合に著しい。
When translating a first language into a second language, there are problems such as missing translations, inconsistent translations, and mistranslations.
This is especially true when there are multiple translators.

【0005】このため、熟練者が改めて訳文をチェック
したり、最後に翻訳文を集め、訳語の統一をはかったり
しなければならないため、これらの作業にも熟練者の知
識、経験と多大な時間が必要となる。
[0005] For this reason, a skilled person must check the translated sentence anew, collect translated sentences at the end, and unify the translated words. Is required.

【0006】特開平5−298360号公報記載の「翻
訳文評価方法、翻訳文評価装置、翻訳文評価機能付き機
械翻訳システムおよび機械翻訳システム評価装置」で
は、第1の言語の原文と、前記原文に対する第2の言語
の第1の翻訳文と、前記原文に対する第2の言語の第2
の翻訳文とを用意し、第1の翻訳文と第2の翻訳文の一
致度を算出し、機械翻訳文の評価を行なっている。
Japanese Patent Application Laid-Open No. 5-298360 discloses a "translation sentence evaluation method, translation sentence evaluation device, machine translation system with translation sentence evaluation function and machine translation system evaluation device". A first translation of a second language for the original and a second translation of a second language for the original
Are prepared, the degree of coincidence between the first translated sentence and the second translated sentence is calculated, and the machine translated sentence is evaluated.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、上記
「翻訳文評価方法、翻訳文評価装置、翻訳文評価機能付
き機械翻訳システムおよび機械翻訳システム評価装置」
は、翻訳文の評価を行なうことを目的としており、上記
装置では、翻訳文の誤りを修正する際の作業効率の向上
や、翻訳文の品質の向上を図ることはできない。
However, the above-mentioned "translation sentence evaluation method, translation sentence evaluation device, machine translation system with translation sentence evaluation function, and machine translation system evaluation device"
Is intended to evaluate a translated sentence, and the above-described device cannot improve the work efficiency when correcting an error in the translated sentence or improve the quality of the translated sentence.

【0008】また、上記装置を利用するには、第2の言
語の翻訳文が2つ以上必要であり、さらにより正確な評
価を行なうには、第2の翻訳文として熟練者が翻訳した
文、あるいは翻訳文を熟練者が編集した文を用意する必
要がある。
Further, in order to use the above-mentioned apparatus, two or more translations of the second language are required, and in order to perform an even more accurate evaluation, a sentence translated by an expert as a second translation is required. Alternatively, it is necessary to prepare a translated sentence edited by a skilled person.

【0009】つまり、上記システムは理想的な翻訳文が
あらかじめ用意されている文書、あるいはいくつかの機
械翻訳システムを所有している利用者に対しては有効で
あるが、翻訳作業の得意でない人あるいは機械翻訳シス
テムを複数所有できない人は使うことができない。さら
に、利用者に修正すべき箇所をわかりやすい形で表示す
る方法なども考慮されていない。
That is, the above system is effective for a document in which an ideal translation is prepared in advance, or for a user who has several machine translation systems, but is not good at translation work. Alternatively, those who cannot own multiple machine translation systems cannot use it. Further, there is no method of displaying a portion to be corrected to the user in an easy-to-understand manner.

【0010】そこで、本発明は、上記課題を解決するた
めに、理想的な翻訳文や複数の翻訳文を用意することな
しに、第1の言語の原文と第2の言語の翻訳文とを機械
的に比較し、誤っている可能性の高い文と誤りの程度を
利用者にわかりやすい形式で提示することにより、修正
の作業効率の向上と翻訳文の品質向上をはかる対訳文誤
り検出装置を提供することを目的とする。
In order to solve the above-mentioned problems, the present invention provides an original translation in a first language and a translation in a second language without preparing an ideal translation or a plurality of translations. A bilingual sentence error detection device that improves the work efficiency of correction and the quality of translated sentences by mechanically comparing and presenting sentences that are likely to be incorrect and the degree of error in an easy-to-understand format to the user. The purpose is to provide.

【0011】[0011]

【課題を解決するための手段】本発明は、第1言語によ
って表現された原文と前記原文を第2の言語に翻訳した
翻訳文とを入力する文入力部と、前記原文からの原文情
報の抽出と前記翻訳文からの翻訳文情報の抽出とを行な
う情報抽出部と、前記原文情報と前記翻訳文情報とを比
較する比較部と、前記比較部における比較結果をもとに
前記翻訳文の誤り率を計算する誤り率計算部と、誤り率
の高い前記翻訳文の対訳文を利用者に伝える報知部とを
備えるる。
According to the present invention, there is provided a sentence input unit for inputting an original sentence expressed in a first language and a translated sentence obtained by translating the original sentence into a second language, and an original sentence information from the original sentence. An information extracting unit that performs extraction and extraction of translated sentence information from the translated sentence; a comparing unit that compares the original sentence information with the translated sentence information; and a comparing unit that compares the translated sentence based on the comparison result in the comparing unit. An error rate calculation unit that calculates an error rate, and a notification unit that notifies a user of a bilingual sentence of the translated sentence having a high error rate are provided.

【0012】このような構成によって、誤り率の高い文
かどうかを利用者が容易に判断できるため、修正の作業
効率を向上させることができる。
With such a configuration, the user can easily determine whether a sentence has a high error rate, and therefore, the work efficiency of correction can be improved.

【0013】[0013]

【発明の実施の形態】以下、本発明に係る対訳文誤り検
出装置の実施の形態を図面を用い説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a bilingual sentence error detecting apparatus according to the present invention will be described below with reference to the drawings.

【0014】(実施の形態1)図1は、本発明に係る対
訳文誤り検出装置の実施の形態1の構成図である。この
対訳文誤り検出装置は、文入力部101と、情報抽出部
102と、検索部103と、辞書104と、比較部10
5と、誤り率計算部106と、報知部107とを備えて
いる。
(Embodiment 1) FIG. 1 is a block diagram of Embodiment 1 of a bilingual sentence error detecting apparatus according to the present invention. This bilingual sentence error detection device includes a sentence input unit 101, an information extraction unit 102, a search unit 103, a dictionary 104, a comparison unit 10
5, an error rate calculation unit 106, and a notification unit 107.

【0015】文入力部101は、第1の言語によって表
現された原文と、その原文を第2の言語に翻訳した翻訳
文とを入力するキーボードや、音声入力装置、原文とそ
の原文の翻訳文が記録された記録媒体から文章を読み出
す読出し装置からなる。
The sentence input unit 101 includes a keyboard for inputting an original sentence expressed in a first language and a translated sentence obtained by translating the original sentence into a second language, a voice input device, and a translated sentence of the original sentence and the original sentence. And a reading device for reading a sentence from a recording medium on which is recorded.

【0016】情報抽出部102は、文入力部101から
通知された原文と翻訳文に対して、検索部103を通し
て、辞書104を参照しながら形態素解析を行ない、単
語に分割し、各単語の情報を得る。そして、その情報の
中から比較に必要な情報を抽出し、比較部105に通知
する。
The information extraction unit 102 performs a morphological analysis on the original sentence and the translated sentence notified from the sentence input unit 101 through the search unit 103 with reference to the dictionary 104, divides the words into words, and obtains information of each word. Get. Then, information necessary for comparison is extracted from the information, and notified to the comparing unit 105.

【0017】辞書104には、第1の言語と第2の言語
それぞれの形態素情報と構文情報、意味情報とが登録さ
れている。
In the dictionary 104, morphological information, syntax information, and semantic information of each of the first language and the second language are registered.

【0018】検索部103は、情報抽出部102から通
知された原文の単語をキーワードとして辞書104を検
索し、検索結果を情報抽出部102に通知する。また情
報抽出部102から通知された翻訳文の単語をキーワー
ドとして辞書104を検索し、検索結果を情報抽出部1
02に通知する。
The search unit 103 searches the dictionary 104 using the words of the original sentence notified from the information extraction unit 102 as keywords, and notifies the information extraction unit 102 of the search results. The dictionary 104 is searched using the word of the translation sentence notified from the information extracting unit 102 as a keyword, and the search result is stored in the information extracting unit 1.
02 is notified.

【0019】比較部105は、情報抽出部102から通
知された原文情報と翻訳文情報の比較を行ない、その比
較結果を誤り率計算部106に通知する。
The comparing unit 105 compares the original sentence information and the translated sentence information notified from the information extracting unit 102, and notifies the error rate calculating unit 106 of the comparison result.

【0020】誤り率計算部106は、比較部105から
通知された誤り率をもとに翻訳文の誤り率を計算する。
The error rate calculator 106 calculates the error rate of the translated sentence based on the error rate notified from the comparator 105.

【0021】報知部107は、原文と翻訳文、誤りの程
度を表示するCRTや、誤りの程度を音で提示する音声
出力装置や、液晶ディスプレイからなり、原文と翻訳文
の対訳を報知する手段と誤りの程度を報知する。
The notifying unit 107 comprises a CRT for displaying the original sentence, the translated sentence, and the degree of error, an audio output device for presenting the degree of error by sound, and a liquid crystal display, and a means for notifying the translation of the original sentence and the translated sentence. And the degree of error.

【0022】例えば、対訳文を表示する画面と誤り率に
応じた網掛け模様の設定を表示する画面とから構成され
ている。誤りの程度を報知する手段としては、誤り率を
いくつかの段階にわけ、その段階ごとに異なる網掛け模
様を設定し、誤り率に応じて網掛け模様を決定し、誤り
のある対訳文の背景に対応する網掛け模様をつける。こ
れにより、利用者は一目でその対訳文の誤りの程度を発
見することができる。なお、この例では誤りの程度を網
掛け模様を使って表現したが、色を使って表現してもよ
い。また、音の大きさで表現してもよい。
For example, it is composed of a screen displaying a bilingual sentence and a screen displaying a setting of a hatching pattern according to an error rate. As a means of reporting the degree of error, the error rate is divided into several stages, different shading patterns are set for each stage, and the shading pattern is determined according to the error rate. Add a shaded pattern corresponding to the background. As a result, the user can discover at a glance the degree of error in the translation. In this example, the degree of error is expressed using a hatched pattern, but may be expressed using a color. Moreover, you may express with the loudness of a sound.

【0023】次に、本実施の形態の動作を図2のフロー
チャートを用いて説明する。文入力部101から、原文
とその原文の翻訳文とが入力されると(S101)、情
報抽出部102で、検索部103を通して(S103)
辞書104を参照しながら(S104)、原文と翻訳文
に対して形態素解析を行ない、単語に分割し、各単語の
情報を得る(S102)。そして、得られた情報をもと
に、比較部105で、原文情報と翻訳文情報の比較を行
なう(S105)。そして、比較部105から通知され
た誤り率をもとに、誤り率計算部106で、翻訳文の誤
り率を計算し(S106)、報知部107で翻訳文の誤
り率の程度を利用者に報知する(S107)。
Next, the operation of this embodiment will be described with reference to the flowchart of FIG. When an original sentence and a translated sentence of the original sentence are input from the sentence input unit 101 (S101), the information extraction unit 102 passes through the search unit 103 (S103).
While referring to the dictionary 104 (S104), a morphological analysis is performed on the original sentence and the translated sentence, the words are divided into words, and information on each word is obtained (S102). Then, based on the obtained information, the comparing unit 105 compares the original sentence information and the translated sentence information (S105). Then, based on the error rate notified from the comparing section 105, the error rate calculating section 106 calculates the error rate of the translated sentence (S106), and the notification section 107 notifies the user of the degree of the error rate of the translated sentence. A notification is issued (S107).

【0024】請求項6記載の対訳文誤り検出装置では、
比較部は、図3に示すような構成となる。
According to a sixth aspect of the present invention, there is provided a bilingual sentence error detecting apparatus.
The comparison unit has a configuration as shown in FIG.

【0025】請求項3記載の対訳文誤り検出装置では、
比較部は、文長さ比較部601で構成されている。
According to a third aspect of the present invention, there is provided a bilingual sentence error detecting apparatus.
The comparison unit includes a sentence length comparison unit 601.

【0026】請求項4記載の対訳文誤り検出装置では、
比較部は、形態素比較部602で、請求項5記載の対訳
文誤り検出装置では、比較部は、構文・意味解析部60
3と、構文・意味比較部604とで構成されている。
According to a fourth aspect of the present invention, there is provided a bilingual sentence error detecting apparatus.
The comparison unit is a morphological comparison unit 602, and in the bilingual sentence error detection device according to claim 5, the comparison unit is a syntactic / semantic analysis unit 60.
3 and a syntax / semantics comparison unit 604.

【0027】文長さ比較部601は、内容語に対応する
要素のみからなる形態素、すなわち機能語(前置詞、接
続詞、冠詞、助詞、助動詞など)を除いた形態素の数を
比較する。
The sentence length comparing unit 601 compares the number of morphemes consisting only of elements corresponding to content words, that is, the number of morphemes excluding functional words (prepositions, conjunctions, articles, particles, auxiliary verbs, etc.).

【0028】形態素比較部は602は、原文の形態素の
情報と翻訳文の形態素の情報を比較し、誤り率を計算す
る。
The morpheme comparison unit 602 compares the morpheme information of the original sentence with the morpheme information of the translated sentence, and calculates an error rate.

【0029】構文・意味解析部603は、文法規則に従
って構文構造を作り、その構造に意味情報を付加した構
文木を生成する。
The syntax / semantic analysis unit 603 creates a syntax structure according to the grammar rules, and generates a syntax tree in which semantic information is added to the structure.

【0030】構文・意味比較部604は、前記構文・意
味解析の結果をもとに、構文の比較や形態素の対象領域
の比較や文体レベルの比較、時制の比較を行ない、誤り
率を計算する。
The syntactic / semantic comparison unit 604 performs a syntactic comparison, a comparison of morpheme target areas, a stylistic level comparison, and a tense comparison based on the result of the syntactic / semantic analysis, and calculates an error rate. .

【0031】次に、本実施の形態の文長さ比較部601
の動作を、図4のフローチャートを用いて説明する。
Next, the sentence length comparing unit 601 according to the present embodiment.
Will be described with reference to the flowchart of FIG.

【0032】文長さ比較部601は、形態素解析部10
3から原文と翻訳文の形態素情報を受けとると、原文の
文長さを 記憶領域Slen1に、翻訳文の文長さを記
憶領域Slen2に書き込む(C001、C002)。
次に、文長さSlen1とSlen2を比較し(C00
3)、原文の長さより翻訳文の長さの方が長い場合は、
翻訳によって情報量が増えているので誤り率を0%とし
(C004)、原文の長さより翻訳文の長さの方が短い
場合は、情報量が減っているため、誤り率を100*
(1−Slen2/Slen1)で求める(C00
5)。
The sentence length comparing unit 601 is provided for the morphological analysis unit 10
When the morpheme information of the original sentence and the translated sentence is received from No. 3, the sentence length of the original sentence is written into the storage area Slen1 and the sentence length of the translated sentence is written into the storage area Slen2 (C001, C002).
Next, the sentence lengths Slen1 and Slen2 are compared (C00
3) If the length of the translated sentence is longer than the length of the original sentence,
Since the amount of information has increased due to translation, the error rate is set to 0% (C004). If the length of the translated sentence is shorter than the length of the original sentence, the error rate is reduced to 100 * because the amount of information is reduced.
(1−Slen2 / Slen1)
5).

【0033】例えば、図5(a)(b)に示す形態素情
報を受けとった場合、原文の文長さSlen1は8、翻
訳文の文長さSlen2は4であり、翻訳によって情報
量が減っているため、C004の式を用いて誤り率50
%を得ることができる。文長さ比較部は、上記例のよう
な、重文や複文における訳抜けに特に有効である。
For example, when the morpheme information shown in FIGS. 5A and 5B is received, the sentence length Slen1 of the original sentence is 8, and the sentence length Slen2 of the translated sentence is 4, and the information amount is reduced by translation. Therefore, the error rate 50
% Can be obtained. The sentence length comparing unit is particularly effective for missing translations in multiple sentences and compound sentences as in the above example.

【0034】なお、言語間の内容語の数が極端に異なる
ことがわかっている場合は、言語間の内容語の比率rを
用いて、誤り率を計算する式を、100*(1−Sle
n2’/Slen1), Slen2’=Slen2*
rとする。
If it is known that the number of content words between languages is extremely different, the equation for calculating the error rate using the ratio r of the content words between languages is expressed as 100 * (1-Sle).
n2 '/ Slen1), Slen2' = Slen2 *
r.

【0035】なお、請求項3記載の対訳文誤り検出装置
では、第1の言語と第2の言語それぞれの形態素情報だ
けが登録されている辞書でもよい。
In the parallel sentence error detecting device according to the third aspect, a dictionary in which only morpheme information of each of the first language and the second language may be registered.

【0036】次に、本実施の形態の形態素比較部602
の動作を、図6のフローチャートを用いて説明する。
Next, the morphological comparison unit 602 of this embodiment
Will be described with reference to the flowchart of FIG.

【0037】文長さ比較部602は、形態素解析部10
3、あるいは文長さ比較部601から原文と翻訳文の形
態素情報を受けとると、原文の文長さを記憶領域Sle
n1に、翻訳文の文長さを記憶領域Slen2に書き込
む(C001、C002)。次に、原文中の名詞の数、
動詞の数、形容詞の数、副詞の数をそれぞれ 記憶領域
cntN1,cntV1,cntADJ1,cntAD
V1に書き込み(C010)、翻訳文中の名詞の数、動
詞の数、形容詞の数、副詞の数をそれぞれ記憶領域cn
tN2,cntV2,cntADJ2,cntADV2
に書き込む(C011)。次に、原文中と翻訳文中の各
品詞の数を比較し(C012、C015、C018、C
021)、その品詞の数が原文の方が大きければ、その
品詞の誤り率を1−(cnt2/Slen2)/(cn
t1/Slen1)で求め (C013、C016、C019、C022)、 小さければ、1−(cnt1/Slen1)/(cnt
2/Slen2)で求める (C014、C017、C020、C023)。 最後に各品詞の誤り率を考慮し、その文全体の誤り率を
計算する(C024)。
The sentence length comparing unit 602 includes the morphological analysis unit 10
3 or the morpheme information of the original sentence and the translated sentence from the sentence length comparing unit 601, the sentence length of the original sentence is stored in the storage area Sle.
The sentence length of the translated sentence is written into the storage area Slen2 in n1 (C001, C002). Next, the number of nouns in the original text,
The number of verbs, the number of adjectives, and the number of adverbs are respectively stored in the storage areas cntN1, cntV1, cntADJ1, and cntAD.
V1 is written (C010), and the number of nouns, the number of verbs, the number of adjectives, and the number of adverbs in the translation are respectively stored in the storage area cn.
tN2, cntV2, cntADJ2, cntADV2
(C011). Next, the numbers of parts of speech in the original sentence and the translated sentence are compared (C012, C015, C018, C
021), if the number of parts of speech is greater in the original sentence, the error rate of the part of speech is 1- (cnt2 / Slen2) / (cn
t1 / Slen1) (C013, C016, C019, C022) If smaller, 1- (cnt1 / Slen1) / (cnt
2 / Slen2) (C014, C017, C020, C023). Finally, considering the error rate of each part of speech, the error rate of the entire sentence is calculated (C024).

【0038】例えば、図7(a)(b)に示す形態素情
報を受けとった場合、原文の文長さSlen1、翻訳文
の文長さSlen2はどちらも5であり、原文中の名詞
の数は3、動詞の数は2、翻訳文中の名詞の数は4、動
詞の数は1である。
For example, when the morpheme information shown in FIGS. 7A and 7B is received, the sentence length Slen1 of the original sentence and the sentence length Slen2 of the translated sentence are both 5, and the number of nouns in the original sentence is 3, the number of verbs is 2, the number of nouns in the translation is 4, and the number of verbs is 1.

【0039】図6のアルゴリズムで各品詞の誤り率を求
めると、 errNは、1−(3/5)/(4/5)=0.25 errVは、1−(1/5)/(2/5)=0.5 errADJ,errADVは0となる。各品詞の誤り
率を用いて全体の誤り率を計算すると、100*max
(0.25,0.5,0,0)=50%となる。
When the error rate of each part of speech is calculated by the algorithm shown in FIG. 6, errN is 1- (3/5) / (4/5) = 0.25 errV is 1- (1/5) / (2 /5)=0.5 errADJ and errADV become 0. When the overall error rate is calculated using the error rate of each part of speech, 100 * max
(0.25, 0.5, 0, 0) = 50%.

【0040】次に、本実施の形態の構文・意味比較部6
04の動作を図8のフローチャートを用いて説明する。
Next, the syntax / semantics comparison section 6 of the present embodiment.
The operation of Step 04 will be described with reference to the flowchart of FIG.

【0041】構文・意味比較部604は、構文・意味解
析部603から英語構文木と日本語構文木を受けとる
と、英語の構文木中の動詞を親とする親子木を順次抽出
し、記憶領域EngSubTree(0)からEngS
ubTree(n1)に書き込み、日本語の構文木中の
動詞を親とする親子木を順次抽出し、記憶領域JapS
ubTree(0)からJapSubTree(n2)
に書き込む(C031)。そして、英語の親子構文木と
日本語の親子構文木との対応付けを行なう(C032か
らC039)。対応付けされた構文木は、記憶領域Pa
ir(0)からPair(k)に記憶されている(C0
35)。
Upon receiving the English syntax tree and the Japanese syntax tree from the syntax / semantic analysis unit 603, the syntax / semantics comparison unit 604 sequentially extracts parent-child trees having verbs as parents in the English syntax tree, and stores them in the storage area. From EngSubTree (0) to EngS
ubTree (n1), and sequentially extracts parent-child trees having the verb as a parent in the Japanese syntax tree, and stores the extracted data in the storage area JapS.
ubTree (0) to JapSubTree (n2)
(C031). Then, the English parent-child syntax tree is associated with the Japanese parent-child syntax tree (C032 to C039). The associated syntax tree is stored in the storage area Pa
stored in ir (0) to Pair (k) (C0
35).

【0042】次に、名詞を中心にみた場合の誤り個数を
記憶する領域errCntNと、動詞を中心にみた場合
の誤り個数を記憶する領域errCntVとを初期化し
(C040)、対応親子木がなくなるまで(C04
1)、英語と日本語の親子木を比較し(C042)、名
詞を中心にみた場合の誤り個数errCntNと、動詞
を中心にみた場合の誤り個数errCntVを求める
(C042)。最後に、名詞を中心にみた場合の誤り個
数errCntNと、動詞を中心にみた場合の誤り個数
errCntVから、構文・意味比較部における誤り率
を計算する。
Next, an area errCntN for storing the number of errors when focusing on nouns and an area errCntV for storing the number of errors when focusing on verbs are initialized (C040). (C04
1) Compare the parent and child trees of English and Japanese (C042), and determine the number of errors errCntN when focusing on nouns and the number of errors errCntV when focusing on verbs (C042). Finally, the error rate in the syntax / semantic comparison unit is calculated from the number of errors errCntN when focusing on nouns and the number of errors errCntV when focusing on verbs.

【0043】次に、親子木比較部(C042)の詳細な
動作について図9を用いて説明する。
Next, the detailed operation of the parent-child tree comparison unit (C042) will be described with reference to FIG.

【0044】親子木比較部(C042)では、名詞を中
心にみた場合の誤り個数の計算(C050からC05
5)と、動詞を中心にみた場合の誤り個数の計算(C0
56からC063)を行なう。
The parent-child tree comparison unit (C042) calculates the number of errors when focusing on nouns (from C050 to C05).
5) and calculation of the number of errors when focusing on verbs (C0
56 to C063).

【0045】まず名詞を中心にみた場合の誤り個数の計
算について説明する。英語の親子木の子供の名詞ノード
を抽出し、記憶領域EngChildに書き込む(C0
50)。もし、子供の名詞ノードがなければ(C05
1)、動詞を中心にみた場合の誤り個数の計算処理に入
る。子供の名詞ノードがあれば、名詞のノードの個数c
ntNをインクリメントし(C052)、日本語の親子
木の子供の名詞ノードを抽出し、記憶領域JapChi
ldに書き込む(C053)。そして、EngChil
dの意味制限とJapChildの意味制限を比較して
(C054)、意味制限が一致していれば、次の子供に
ついてC050からの処理を繰り返す。一致しなけれ
ば、名詞を中心にみた場合の誤り個数errCntNを
インクリメントし(C055)、次の子供についてC0
50からの処理を繰り返す。
First, the calculation of the number of errors when focusing on nouns will be described. The noun node of the child of the English parent-child tree is extracted and written to the storage area EngChild (C0
50). If there is no child noun node (C05
1) The processing for calculating the number of errors when focusing on verbs is started. If there is a child noun node, the number of noun nodes c
ntN is incremented (C052), the noun node of the child of the Japanese parent-child tree is extracted, and the storage area JapChi is extracted.
Write to ld (C053). And EngChil
The semantic restriction of d is compared with the semantic restriction of JapanChild (C054). If the semantic restrictions match, the processing from C050 is repeated for the next child. If they do not match, the number of errors errCntN when focusing on the noun is incremented (C055), and C0 is set for the next child.
The processing from step 50 is repeated.

【0046】次に動詞を中心にみた場合の誤り個数の計
算について説明する。日本語の親子木の親ノードをキー
として、辞書検索を行ない、その結果を記憶領域Dic
tInfo(0)からDictInfo(k)に書き込
む(C056)。入力された親子木に動詞を中心にみた
場合の誤りがあるかどうかを示すための記憶領域err
Tmpを初期化する(C057)。kが0かどうかを調
べ(C058)、kが0ならば、対応する辞書情報を全
て調べ追えているので、動詞を中心にみた場合に誤りが
あるかどうかを示すための記憶領域errTmpが1か
どうかを調べ(C062)、errTmpが1ならば、
動詞を中心にみた場合の誤り個数をインクリメントし
(C063)、処理を終了する。errTmpが0なら
ば、そのまま処理を終了する。kが0でなければ、Di
ctInfo(k)の格の意味制限と、日本語の親子木
のコア格の意味制限が一致するかどうかを調べ(C05
9)、一致した場合は、kをデクリメントし、C058
からの処理を繰り返す。一致しなかった場合は、動詞を
中心にみた場合に誤りがあるかどうかを示すための記憶
領域errTmpを1にした後に(C060)、kをデ
クリメントし、C058からの処理を繰り返す。
Next, calculation of the number of errors when focusing on verbs will be described. A dictionary search is performed using the parent node of the Japanese parent-child tree as a key, and the result is stored in a storage area Dic.
Writing is performed from tInfo (0) to DictInfo (k) (C056). A storage area err for indicating whether or not the input parent-child tree has an error when focusing on verbs.
Tmp is initialized (C057). It is checked whether or not k is 0 (C058). If k is 0, all the corresponding dictionary information is checked and tracked, so that the storage area errTmp for indicating whether or not there is an error when focusing on the verb is 1 (C062), and if errTmp is 1,
The number of errors when focusing on the verb is incremented (C063), and the process ends. If errTmp is 0, the process ends. If k is not 0, Di
It is checked whether the semantic restriction of the case of ctInfo (k) matches the semantic restriction of the core case of the Japanese parent-child tree (C05).
9) If coincident, decrement k and C058
Is repeated. If they do not match, the storage area errTmp for indicating whether or not there is an error when focusing on the verb is set to 1 (C060), k is decremented, and the processing from C058 is repeated.

【0047】例えば、図10(a)(b)に示す構文木
を受けとった場合について説明する。ただし、使用する
辞書は、図10(c)(d)に示す情報を持つ動詞辞書
と名詞辞書とを含むものとする。図10(a)(b)に
示す構文木は、すでに対応親子木になっているため、C
039以前の処理についての説明は省略する。
For example, a case where the syntax trees shown in FIGS. 10A and 10B are received will be described. However, the dictionaries used include a verb dictionary and a noun dictionary having the information shown in FIGS. 10C and 10D. Since the syntax trees shown in FIGS. 10A and 10B are already corresponding parent-child trees,
Description of the processing before 039 is omitted.

【0048】図8に示す親子木比較部(C042)に、
この対応親子木が入力されると、英語構文木の名詞ノー
ドの意味制限と、日本語構文木の名詞ノードの意味制限
は、一致しているため、名詞を中心にみた場合の誤り個
数errCntNは0となる。次に、「食べる」をキー
として辞書検索を行ない(C056)、主格の意味制限
は「生き物」、目的格の意味制限は「物」という情報を
得る。日本語構文木の主格の意味制限は「物」であるた
め、動詞を中心にみた場合の誤り個数errCntVは
1となる。名詞を中心にみた場合の誤り個数と動詞を中
心にみた場合の誤り個数をもとに、構文・意味比較部に
おける誤り率を計算すると、誤り率は、100*max
(1,0)=100%となる。
The parent-child tree comparison unit (C042) shown in FIG.
When the corresponding parent-child tree is input, the semantic restriction of the noun node of the English syntax tree and the semantic restriction of the noun node of the Japanese syntax tree match, so the number of errors errCntN when focusing on the noun is: It becomes 0. Next, a dictionary search is performed using "eating" as a key (C056), and information is obtained that the semantic restriction of the nominative case is "living" and the semantic restriction of the target case is "thing". Since the semantic restriction of the nominative case of the Japanese syntax tree is “thing”, the number of errors errCntV when the verb is mainly viewed is one. When the error rate in the syntax / semantic comparison unit is calculated based on the number of errors when focusing on nouns and the number of errors when focusing on verbs, the error rate is 100 * max
(1, 0) = 100%.

【0049】次に、図10(e)(f)に示す構文木を
受けとった場合について説明する。図10(e)(f)
に示す構文木も、すでに対応親子木になっているため、
C039以前の処理についての説明は省略する。図11
に示す親子木比較部(C042)に、この構文木ペアを
入力すると、「crane」の意味制限は「物」、「つ
る」の意味制限は「生き物」であるため、名詞を中心に
みた場合の誤り個数errCntNは1となる。
Next, a case where the syntax trees shown in FIGS. 10E and 10F are received will be described. FIG. 10 (e) (f)
Since the syntax tree shown in is already a corresponding parent-child tree,
Description of the processing before C039 is omitted. FIG.
When this syntax tree pair is input to the parent-child tree comparison unit (C042) shown in (1), since the semantic restriction of “crane” is “thing” and the semantic restriction of “vine” is “creature”, The error number errCntN of is 1.

【0050】次に、「である」をキーとして辞書検索を
行ない(C056)、主格の意味制限は「物」、目的格
の意味制限は「物」、という情報と、主格の意味制限は
「生き物」、目的格の意味制限は「生き物」という情報
とを得る。
Next, a dictionary search is performed using "is" as a key (C056). The information that the semantic restriction of the nominative case is "thing" and the semantic restriction of the target case is "thing", and the semantic restriction of the nominative case is " Information on "creatures" and the meaning of the purpose are obtained as "creatures".

【0051】日本語構文木の主格の意味制限は「生き
物」、目的格の意味制限は「物」であるため、辞書から
得たどちらの情報とも一致しないため、動詞を中心にみ
た場合の誤り個数errCntVは1となる。
The semantic restriction of the nominative case of the Japanese parse tree is "living", and the semantic restriction of the object case is "thing", which does not match any of the information obtained from the dictionary. The number errCntV becomes 1.

【0052】名詞を中心にみた場合の誤り個数と動詞を
中心にみた場合の誤り個数をもとに、構文・意味比較部
における誤り率を計算すると、誤り率は、100*ma
x(0,1)=100%となる。
When the error rate in the syntactic / semantic comparison unit is calculated based on the number of errors when focusing on nouns and the number of errors when focusing on verbs, the error rate is 100 * ma
x (0,1) = 100%.

【0053】なお、検索部104は、2つ以上の単語の
並びをキーワードとして辞書105の検索を行なっても
よい。なお、辞書105は、第1の言語の第2の言語に
対する辞書と、第2の言語の第1の言語に対する辞書と
の、別々の辞書から構成されてもよい。
The search unit 104 may search the dictionary 105 using a sequence of two or more words as a keyword. The dictionary 105 may be composed of separate dictionaries of a first language of the second language and a second language of the first language.

【0054】(実施の形態2)図11は、本発明に係る
対訳文誤り検出装置の実施の形態2の構成図である。こ
の対訳文誤り検出装置は、文書入力部1010と、文対
応判定部1011と、情報抽出部102と、検索部10
3と、辞書104と、比較部105と、誤り率計算部1
06と、報知部1070とを備えている。
(Embodiment 2) FIG. 11 is a configuration diagram of a bilingual sentence error detecting apparatus according to Embodiment 2 of the present invention. This bilingual sentence error detection device includes a document input unit 1010, a sentence correspondence determination unit 1011, an information extraction unit 102, a search unit 10
3, the dictionary 104, the comparison unit 105, and the error rate calculation unit 1
06 and a notifying unit 1070.

【0055】なお、上記実施の形態1と同様の構成を有
する部分には、同一の符合を付してその説明を省略し、
本実施の形態固有の構成部分についてのみ説明する。
Parts having the same configuration as in the first embodiment are denoted by the same reference numerals, and description thereof will be omitted.
Only the components unique to the present embodiment will be described.

【0056】文書入力部1010は、第1の言語の文章
である原文書と、その原文書を第2の言語に翻訳した結
果である翻訳文書とを入力するキーボードや、音声入力
装置、原文書とその原文書の翻訳文書が記録された記録
媒体から文章を読み出す読出し装置からなる。
A document input unit 1010 includes a keyboard for inputting an original document as a sentence in a first language and a translated document as a result of translating the original document into a second language, a voice input device, and an original document. And a reading device for reading a sentence from a recording medium on which a translated document of the original document is recorded.

【0057】文対応判定部1020は、文書入力部10
10から通知された原文書とその原文書の翻訳文書から
文を一文単位で抽出し、例えば、特開平5−20355
号公報記載の対訳対応関係判定方式を使い、原文とその
原文の翻訳文の対応付けを行なう。
The sentence correspondence determination unit 1020 is provided in the document input unit 10
10 is extracted in units of one sentence from the original document notified from the document 10 and the translated document of the original document.
The correspondence between the original sentence and the translated sentence of the original sentence is determined by using the bilingual correspondence determination method described in the publication.

【0058】ただし、機械翻訳の結果のように対応関係
が明らかな場合は何もしない。また、対応付けの際に一
文全体が抜けている場合は、「空文」を設定して、仮の
対応付けを行ない、誤り率を100%に設定し、その情
報を報知部107に通知する。上記以外の場合は、原文
とその原文の翻訳文との対訳文を情報抽出部102に通
知する。
However, if the correspondence is clear as in the result of machine translation, nothing is performed. If the entire sentence is missing at the time of association, “empty sentence” is set, a temporary association is performed, the error rate is set to 100%, and the information is notified to the notification unit 107. . In cases other than the above, a bilingual sentence between the original sentence and the translated sentence of the original sentence is notified to the information extracting unit 102.

【0059】報知部1070は、原文書と翻訳文書、誤
りの程度を表示するCRTや、誤りの程度を音の大きさ
で提示する音声出力装置や、液晶ディスプレイや、キー
ボードからなり、原文と翻訳文の対訳を報知する手段
と、誤り箇所を報知する手段と、誤りの程度を報知する
手段とを有する。
The notification unit 1070 is composed of an original document and a translated document, a CRT for displaying the degree of error, a voice output device for presenting the degree of error in a loud volume, a liquid crystal display, and a keyboard. It has means for notifying a bilingual sentence, means for notifying an error location, and means for notifying the degree of error.

【0060】例えば、表示画面は図12に示すように、
第1の言語の文書を表示する画面と、対応関係がわかる
ようにリンクされた第2の言語の文書を表示する画面
と、誤り率に応じた網掛け模様の設定を表示する画面と
から構成されている。
For example, the display screen is as shown in FIG.
A screen for displaying a document in a first language, a screen for displaying a document in a second language linked so that correspondence can be understood, and a screen for displaying a setting of a hatching pattern according to an error rate Have been.

【0061】誤りの程度を報知する手段としては、誤り
率をいくつかの段階にわけ、その段階ごとに異なる網掛
け模様を設定し、誤り率に応じて網掛け模様を決定し、
誤りのある対訳文の背景に対応する網掛け模様をつけて
いく。これにより、利用者は一目で誤り率の高い対訳文
を発見することができる。
As means for informing the degree of error, the error rate is divided into several stages, different shading patterns are set for each stage, and the shading pattern is determined according to the error rate.
A shaded pattern corresponding to the background of the erroneous translation is added. As a result, the user can find a bilingual sentence with a high error rate at a glance.

【0062】なお、この例では誤りの程度を網掛け模様
を使って表現したが、色を使って表現してもよい。ま
た、誤り率の高い対訳文から順に並べて表示してもよ
い。また、誤り率の高い文を音声出力しても良い。
In this example, the degree of error is represented by using a hatched pattern, but may be represented by using a color. Also, the translated sentences with the highest error rate may be displayed in order. Alternatively, a sentence with a high error rate may be output as speech.

【0063】次に、本実施の形態の動作を図13のフロ
ーチャートを用いて説明する。文書入力部1010か
ら、原文書とその原文書の翻訳文書とが入力されると
(S1010)、文書の終りか否かを判定し(S101
1)。文書の終りであれば、終了し、文書の終りでなけ
れば、文対応判定部1020で、原文と翻訳文の対応付
けを行なう(S1012)。そして、文対応判定部10
20から通知された対訳文が「空文」を含んでいるかど
うかを調べ(S1013)、「空文」を含んでいる場合
は、誤り率を100%に設定し(S111)、報知部1
07で、対訳文と誤り率をわかりやすい形で報知する
(S107)。「空文」を含んでいない場合は、検索部
103を通して辞書104を参照しながら、情報抽出部
102で、原文と翻訳文とを形態素に分割する形態素解
析を行ない、各単語の情報を抽出する(S102)。そ
して、情報抽出部102から通知された各単語の情報を
利用して、比較部105で、対訳文の比較を行なう(S
105)。そして、比較部105から通知された誤り率
をもとに、誤り率計算部106で、翻訳文の誤り率を計
算し(S106)、報知部107で対訳文と誤り率をわ
かりやすい形で報知する(S107)。そして、文書の
終りがくるまで上記の処理を繰り返す。
Next, the operation of this embodiment will be described with reference to the flowchart of FIG. When an original document and a translated document of the original document are input from the document input unit 1010 (S1010), it is determined whether or not the document is at the end (S101).
1). If it is the end of the document, the process ends. If it is not the end of the document, the sentence correspondence determination unit 1020 associates the original sentence with the translated sentence (S1012). Then, the sentence correspondence determination unit 10
It is checked whether the bilingual sentence notified from 20 includes “empty sentence” (S1013). If it contains “empty sentence”, the error rate is set to 100% (S111), and the notification unit 1
At 07, the bilingual sentence and the error rate are reported in an easy-to-understand format (S107). If it does not include “empty sentence”, the information extracting unit 102 performs morphological analysis to divide the original sentence and the translated sentence into morphemes while referring to the dictionary 104 through the search unit 103, and extracts information of each word. (S102). Then, using the information of each word notified from the information extracting unit 102, the comparing unit 105 compares the bilingual sentences (S
105). Then, based on the error rate notified from the comparing section 105, the error rate calculating section 106 calculates the error rate of the translated sentence (S106), and the notifying section 107 notifies the bilingual sentence and the error rate in an easy-to-understand manner. (S107). Then, the above processing is repeated until the end of the document comes.

【0064】(実施の形態3)図14は、本発明に係る
対訳文誤り検出装置の実施の形態3の構成図である。こ
の対訳文誤り検出装置は、文入力部101と、情報抽出
部102と、検索部103と、辞書104と、文長さ比
較部601と、形態素比較部602と、構文・意味解析
部603と、構文・意味比較部604と、比較レベル入
力部605と、比較レベル制御部606と、誤り率計算
部106と、報知部107とを備えている。
(Embodiment 3) FIG. 14 is a configuration diagram of Embodiment 3 of a bilingual sentence error detecting apparatus according to the present invention. The bilingual sentence error detection device includes a sentence input unit 101, an information extraction unit 102, a search unit 103, a dictionary 104, a sentence length comparison unit 601, a morpheme comparison unit 602, a syntax / semantic analysis unit 603, , A syntax / meaning comparison unit 604, a comparison level input unit 605, a comparison level control unit 606, an error rate calculation unit 106, and a notification unit 107.

【0065】なお、上記実施の形態1、2と同様の構成
を有する部分には、同一の符合を付してその説明を省略
し、本実施の形態固有の構成部分についてのみ説明す
る。
Parts having the same configuration as those in the first and second embodiments are denoted by the same reference numerals, and the description thereof will be omitted. Only the components unique to the present embodiment will be described.

【0066】比較レベル入力部605は、前記文長さ比
較部601および形態素比較部602、構文・意味解析
部603と構文意味比較部604のどの比較を、どの組
合せで行なうかを入力するキーボードや、音声入力装置
や、入力された比較レベル情報を表示するCRTや液晶
ディスプレイ、マウス等のポインティングデバイスから
なる。そして、入力された比較レベルを比較レベル制御
部606に通知する。
The comparison level input unit 605 includes a keyboard for inputting which combination of the sentence length comparing unit 601 and morphological comparing unit 602, and the syntactic / semantic analyzing unit 603 and the syntactic / semantic comparing unit 604 to perform, and in which combination. , A voice input device, and a pointing device such as a CRT, a liquid crystal display, and a mouse for displaying the input comparison level information. Then, the comparison level control unit 606 is notified of the input comparison level.

【0067】比較レベル制御部606は、比較レベル入
力部605から通知された比較レベルに基づき、文長さ
比較部601と、形態素比較部602、構文・意味解析
部603と構文・意味比較部604のどの比較を、どの
組合せで行なうかを制御する。
The comparison level control unit 606 is based on the comparison level notified from the comparison level input unit 605, and based on the sentence length comparison unit 601, the morphological comparison unit 602, the syntax / semantic analysis unit 603, and the syntax / meaning comparison unit 604. Controls which comparisons are made and in which combinations.

【0068】次に、本実施の形態の動作を図15のフロ
ーチャートを用いて説明する。なお、上記実施の形態
1、2と同様の動作をする部分には、同一の符合を付し
てその説明を省略し、本実施の形態固有の動作部分につ
いてのみ説明する。
Next, the operation of this embodiment will be described with reference to the flowchart of FIG. In addition, parts that perform the same operations as those in the first and second embodiments are denoted by the same reference numerals, and the description thereof is omitted. Only the operation parts unique to the present embodiment will be described.

【0069】比較レベル入力部605から、どの比較を
どの組合せで行なうかが入力されると(S600)、比
較レベル制御部606で、文長さ比較を行なう入力があ
ったかどうかを調べ(S601)、入力があった場合、
文長さ比較部601で、原文と翻訳文の文の長さを比較
し、誤り率を計算する(S602)。入力がなかった場
合、この処理をとばす。次に、比較レベル制御部606
で、形態素比較を行なう入力があったかどうかを調べ
(S603)、入力があった場合、形態素比較部602
で、原文と翻訳文の形態素情報を比較し、誤り率を計算
する(S604)。入力がなかった場合、この処理をと
ばす。最後に、比較レベル制御部606で、構文比較を
行なう入力があったかどうかを調べ(S605)、入力
があった場合、構文・意味解析部603で、原文と翻訳
文の構文木を生成し(S606)、構文・意味比較部6
04でこれらの構文木を比較し、誤り率を計算する(S
607)。入力がなかった場合、これらの処理をとば
す。そして、誤り率計算部106で、上記の比較で得た
誤り率を総合して翻訳文の誤り率を計算する(S10
6)。
When the comparison level input unit 605 inputs which combination is to be performed in which combination (S600), the comparison level control unit 606 checks whether there is an input for performing sentence length comparison (S601). If there is input,
The sentence length comparison unit 601 compares the lengths of the original sentence and the translated sentence, and calculates the error rate (S602). If there is no input, this process is skipped. Next, the comparison level control unit 606
It is checked whether there is an input for performing morpheme comparison (S603).
Then, the morpheme information of the original sentence and the translated sentence are compared, and the error rate is calculated (S604). If there is no input, this process is skipped. Finally, the comparison level control unit 606 checks whether there is an input for syntactic comparison (S605). If there is an input, the syntax / semantic analysis unit 603 generates a syntax tree of the original sentence and the translated sentence (S606). ), Syntax and semantic comparison unit 6
04, these syntax trees are compared, and the error rate is calculated (S
607). If there is no input, these processes are skipped. Then, the error rate calculator 106 calculates the error rate of the translated sentence by summing up the error rates obtained by the above comparison (S10).
6).

【0070】(実施の形態4)図16は、本発明に係る
対訳文誤り検出装置の実施の形態4の構成図である。こ
の対訳文誤り検出装置は、文書入力部1010と、文対
応判定部1020と、情報抽出部102と、検索部10
3と、辞書104と、比較部105と、誤り率計算部1
06と、報知部107と、誤りパターン自動修正箇所判
定部310と、誤りパターン自動修正部311と、マン
マシンインターフェース部312と、誤りパターンデー
タベース制御部313と、誤りパターンデータベース3
14とを備えている。
(Embodiment 4) FIG. 16 is a block diagram of a bilingual sentence error detecting apparatus according to Embodiment 4 of the present invention. This bilingual sentence error detection device includes a document input unit 1010, a sentence correspondence determination unit 1020, an information extraction unit 102, a search unit 10
3, the dictionary 104, the comparison unit 105, and the error rate calculation unit 1
06, the notification unit 107, the error pattern automatic correction location determination unit 310, the error pattern automatic correction unit 311, the man-machine interface unit 312, the error pattern database control unit 313, and the error pattern database 3
14 is provided.

【0071】なお、上記実施の形態1、2、3と同様の
構成を有する部分には、同一の符合を付してその説明を
省略し、本実施の形態固有の構成部分についてのみ説明
する。
Parts having the same configuration as in the first, second, and third embodiments are denoted by the same reference numerals, and description thereof will be omitted. Only the components unique to the present embodiment will be described.

【0072】マンマシンインターフェース部312は、
利用者が報知部107に報知された誤りの程度に応じて
なんらかの修正を加えたり、確認を行なったりするため
のインターフェース部分で、CRTや、液晶ディスプレ
イや、キーボード、マウスなどのポインティングデバイ
スからなる。
The man-machine interface 312
An interface portion for allowing the user to make some corrections or check according to the degree of error notified to the notifying section 107, and comprises a CRT, a liquid crystal display, a pointing device such as a keyboard and a mouse.

【0073】誤りパターンデータベース制御部313
は、マンマシンインターフェース部312で利用者が修
正を行なった対訳文を誤り文とみなし、原文と、翻訳文
と、修正された翻訳文と、誤り率を誤りパターンとして
誤りパターンデータベース314に登録したり、誤りパ
ターンデータベース314を変更したり、誤りパターン
データベース314から誤りパターンを削除したりす
る。
Error pattern database control section 313
Considers the translated sentence corrected by the user in the man-machine interface unit 312 as an error sentence, and registers the original sentence, the translated sentence, the corrected translated sentence, and the error rate in the error pattern database 314 as an error pattern. Or the error pattern database 314 is changed, or the error pattern is deleted from the error pattern database 314.

【0074】誤りパターンデータベース314は、誤り
パターンが登録されている。誤りパターン自動修正箇所
判定部310は、文対応判定部1020から通知された
対訳文が対訳文が誤りパターンデータベース314にあ
るかどうかを調べるために、その対訳文をキーとして誤
りパターンデータベース314を検索し、検索結果を誤
りパターン自動修正部311に通知する。
The error pattern database 314 has registered therein error patterns. The error pattern automatic correction portion determining unit 310 searches the error pattern database 314 using the bilingual sentence as a key to check whether the bilingual sentence notified from the sentence correspondence determining unit 1020 has a bilingual sentence in the error pattern database 314. Then, the search result is notified to the error pattern automatic correction unit 311.

【0075】誤りパターン自動修正部311は、誤りパ
ターン自動修正箇所判定部310から通知された検索結
果が誤りパターンの場合、翻訳文を誤りパターン中の修
正された翻訳文で置き換える。
When the search result notified from the error pattern automatic correction portion judging section 310 is an error pattern, the error pattern automatic correction section 311 replaces the translated sentence with the corrected translated sentence in the error pattern.

【0076】次に、本実施の形態の動作を図17のフロ
ーチャートを用いて説明する。なお、上記実施の形態
1、2、3と同様の動作をする部分には、同一の符合を
付してその説明を省略し、本実施の形態固有の動作部分
についてのみ説明する。
Next, the operation of this embodiment will be described with reference to the flowchart of FIG. In addition, portions that perform the same operations as those in the first, second, and third embodiments are denoted by the same reference numerals, and the description thereof is omitted. Only the operation portions unique to the present embodiment will be described.

【0077】誤りパターン自動修正箇所判定部310で
は、文対応判定部1020から通知された対訳文をキー
として誤りパターンデータベースを検索し(S30
0)、対訳文が誤りパターンデータベース中にあるかど
うかを調べ(S301)、情報があった場合、誤りパタ
ーン自動修正部311で、誤りパターン自動修正箇所判
定部での検索結果をを利用して、入力した対訳文の翻訳
文を自動修正し(S304)、次の対訳文の処理に移
る。
The error pattern automatic correction location judging section 310 searches the error pattern database using the bilingual sentence notified from the sentence correspondence judging section 1020 as a key (S30).
0), it is checked whether or not the bilingual sentence exists in the error pattern database (S301). If there is information, the error pattern automatic correction section 311 uses the search result of the error pattern automatic correction section determination section. Then, the translation of the input translation is automatically corrected (S304), and the process proceeds to the next translation.

【0078】情報がなかった場合、情報抽出部102か
らの処理を続ける。報知部107に報知された対訳文に
対して、マンマシンインターフェース部312を利用し
てユーザが修正を行なったかどうかを調べ(S30
2)、修正を行なっていた場合、誤りパターンデータベ
ース制御部313で、原文と、翻訳文と、修正された翻
訳文と、翻訳文の誤り率などの誤りパターンを誤りパタ
ーンデータベース314に登録し(S303)次の対訳
文の処理に移る。修正を行なっていなかった場合、次の
対訳文の処理に移る。そして、文書の終りがくるまで上
記の処理を繰り返す。
If there is no information, the processing from the information extracting unit 102 is continued. It is checked whether or not the user has corrected the bilingual sentence notified to the notifying unit 107 using the man-machine interface unit 312 (S30).
2) If the correction has been made, the error pattern database control unit 313 registers the original sentence, the translated sentence, the corrected translated sentence, and the error pattern such as the error rate of the translated sentence in the error pattern database 314 ( S303) The process proceeds to the next bilingual sentence. If no correction has been made, the process proceeds to the next parallel sentence. Then, the above processing is repeated until the end of the document comes.

【0079】例えば、図12に示す3番目の対訳文をキ
ーとして図18に示す誤りパターンデータベースを検索
すると、誤りパターンデータベース中にすでにその対訳
文が登録されているため、そのデータベース中の修正翻
訳文を用いて、その対訳文を自動修正する(図19)。
For example, when the error pattern database shown in FIG. 18 is searched using the third parallel sentence shown in FIG. 12 as a key, the corrected translation in that database is already registered in the error pattern database. Using the sentence, the bilingual sentence is automatically corrected (FIG. 19).

【0080】また、図19に示す4番目の対訳文をキー
として図18に示す誤りパターンデータベースを検索す
ると、誤りパターンデータベース中に、その対訳文がま
だ登録されていないため、誤り判定処理を行ない、誤り
率100%を得て、図20のように表示が更新される。
Further, when the error pattern database shown in FIG. 18 is searched using the fourth parallel sentence shown in FIG. 19 as a key, the error determination processing is performed because the parallel sentence has not been registered in the error pattern database yet. , An error rate of 100% is obtained, and the display is updated as shown in FIG.

【0081】ユーザが図20に示す網掛け模様のついた
4番目の翻訳文を、「酸は金属を腐食する」と修正する
と、対訳文と、修正した翻訳文と、誤り率100%が誤
りパターンデータベースに登録される(図21)。
When the user corrects the fourth translated sentence with a hatched pattern shown in FIG. 20 as “acid corrodes metal”, the translated sentence, the corrected translated sentence, and an error rate of 100% are incorrect. It is registered in the pattern database (FIG. 21).

【0082】(実施の形態5)図22は、本発明に係る
対訳文誤り検出装置の実施の形態5の構成図である。こ
の対訳文誤り検出装置は、文書入力部1010と、文対
応判定部1020と、情報抽出部102と、検索部10
3と、辞書104と、比較部105と、誤り率計算部1
06と、報知部107と、誤りパターン自動修正箇所判
定部310と、誤りパターン自動修正部311と、マン
マシンインターフェース部312と、誤りパターンデー
タベース制御部313と、誤りパターンデータベース3
14と、自動修正問い合わせ部315とを備えている。
(Embodiment 5) FIG. 22 is a configuration diagram of a bilingual sentence error detecting apparatus according to Embodiment 5 of the present invention. This bilingual sentence error detection device includes a document input unit 1010, a sentence correspondence determination unit 1020, an information extraction unit 102, a search unit 10
3, the dictionary 104, the comparison unit 105, and the error rate calculation unit 1
06, the notification unit 107, the error pattern automatic correction location determination unit 310, the error pattern automatic correction unit 311, the man-machine interface unit 312, the error pattern database control unit 313, and the error pattern database 3
14 and an automatic correction inquiry unit 315.

【0083】なお、上記実施の形態1、2、3、4と同
様の構成を有する部分には、同一の符合を付してその説
明を省略し、本実施の形態固有の構成部分についてのみ
説明する。
Parts having the same configuration as in the first, second, third, and fourth embodiments are denoted by the same reference numerals, and description thereof will be omitted. Only the components unique to the present embodiment will be described. I do.

【0084】自動修正問い合わせ部315は、誤りパタ
ーン自動修正箇所判定部310から通知された検索結果
を使って自動的に修正するかどうかをユーザに問い合わ
せ、自動修正するかどうかを決定し、自動修正を行なう
場合、誤りパターン自動修正部311に、誤りパターン
と、文対応判定部1020から通知された対訳文とを通
知し、自動修正を行なわない場合は、文対応判定部10
20から通知された対訳文を情報抽出部102に通知す
る。
The automatic correction inquiry section 315 inquires of the user whether or not to make automatic correction using the search result notified from the error pattern automatic correction location judging section 310, determines whether or not to make automatic correction, and makes an automatic correction. Is performed, the error pattern and the bilingual sentence notified from the sentence correspondence determining unit 1020 are notified to the error pattern automatic correcting unit 311. If automatic correction is not performed, the sentence correspondence determining unit 1011 is used.
The bilingual sentence notified from 20 is notified to the information extracting unit 102.

【0085】次に、本実施の形態の動作を図23のフロ
ーチャートを用いて説明する。なお、上記実施の形態
1、2、3、4と同様の動作をする部分には、同一の符
合を付してその説明を省略し、本実施の形態固有の動作
部分についてのみ説明する。
Next, the operation of this embodiment will be described with reference to the flowchart of FIG. In addition, parts that perform the same operations as those in the first, second, third, and fourth embodiments are denoted by the same reference numerals, and the description thereof is omitted. Only the operation parts unique to the present embodiment will be described.

【0086】誤りパターン自動修正箇所検索部310
で、文対応判定部1020から通知された対訳文が誤り
パターンデータベース314中にあるかどうかを調べる
(S300、S301)、その対訳文が、誤りパターン
データベース314中にある場合、自動修正問い合わせ
部315で、ユーザに自動修正するかどうかの問い合わ
せを行ない(S305)、ユーザが自動修正を選択した
場合、誤りパターン自動修正部311で、自動修正を行
ない(S304)、ユーザが自動修正を行なわない選択
した場合、情報抽出部102からの処理を続ける。
Error pattern automatic correction point search section 310
Then, it is checked whether or not the bilingual sentence notified from the sentence correspondence determining unit 1020 is in the error pattern database 314 (S300, S301). If the bilingual sentence is in the error pattern database 314, the automatic correction inquiry unit 315 Then, an inquiry is made to the user as to whether or not to perform automatic correction (S305). If the user selects automatic correction, the error pattern automatic correction unit 311 performs automatic correction (S304), and the user selects not to perform automatic correction. If so, the processing from the information extraction unit 102 is continued.

【0087】(実施の形態6)図24は、本発明に係る
対訳文誤り検出装置の実施の形態6の構成図である。こ
の対訳文誤り検出装置は、文書入力部1010と、文対
応判定部1020と、情報抽出部102と、検索部10
3と、辞書104と、比較部105と、誤り率計算部1
06と、報知部107と、誤りパターン自動修正箇所判
定部310と、誤りパターン自動修正部311と、マン
マシンインターフェース部312と、誤りパターン制御
部313と、誤りパターンデータベース314と、自動
修正問い合わせ部315と、正解パターン判定部400
と、正解パターンデータベース制御部401と、正解パ
ターンデータベース402とを備えている。
(Embodiment 6) FIG. 24 is a block diagram of a bilingual sentence error detecting apparatus according to Embodiment 6 of the present invention. This bilingual sentence error detection device includes a document input unit 1010, a sentence correspondence determination unit 1020, an information extraction unit 102, a search unit 10
3, the dictionary 104, the comparison unit 105, and the error rate calculation unit 1
06, a notification unit 107, an error pattern automatic correction location determination unit 310, an error pattern automatic correction unit 311, a man-machine interface unit 312, an error pattern control unit 313, an error pattern database 314, and an automatic correction inquiry unit. 315 and the correct answer pattern determination unit 400
And a correct answer pattern database control unit 401 and a correct answer pattern database 402.

【0088】なお、上記実施の形態1、2、3、4、5
と同様の構成を有する部分には、同一の符合を付してそ
の説明を省略し、本実施の形態固有の構成部分について
のみ説明する。
In the first, second, third, fourth and fifth embodiments,
Portions having the same configuration as those described above are denoted by the same reference numerals, and description thereof will be omitted. Only components specific to the present embodiment will be described.

【0089】正解パターン判定部400は、文対応判定
部102から通知された対訳文をキーとして、正解パタ
ーンデータベース402を検索し、正解パターンであっ
た場合は、誤り判定処理を行なわず、次の対訳文の処理
に移る。
The correct pattern judging section 400 searches the correct pattern database 402 using the bilingual sentence notified from the sentence correspondence judging section 102 as a key. Move on to parallel translation processing.

【0090】正解パターンデータベース制御部401
は、マンマシンインターフェース部311で利用者が正
解対訳文とすると指定した対訳文を正解パターンとみな
し、その対訳文を正解パターンデータベース402に登
録したり、正解パターンデータベース402を更新・変
更したり、正解パターンデータベース402から正解パ
ターンを削除したりする。
Correct answer pattern database control section 401
Considers a bilingual sentence specified by the user as a correct bilingual sentence in the man-machine interface unit 311 as a correct pattern, registers the bilingual sentence in the correct pattern database 402, updates / changes the correct pattern database 402, The correct pattern is deleted from the correct pattern database 402.

【0091】正解パターンデータベース402は、正解
パターンが登録されている。次に、本実施の形態の動作
を図25のフローチャートを用いて説明する。なお、上
記実施の形態1、2、3、4、5と同様の動作をする部
分には、同一の符合を付してその説明を省略し、本実施
の形態固有の動作部分についてのみ説明する。
The correct answer pattern database 402 has registered therein correct answer patterns. Next, the operation of the present embodiment will be described with reference to the flowchart of FIG. Note that the same reference numerals are given to portions that perform the same operations as those in the first, second, third, fourth, and fifth embodiments, and description thereof is omitted. Only the operation portions unique to the present embodiment will be described. .

【0092】正解パターン判定部400で、文対応判定
部102から通知された対訳文が正解パターンデータベ
ース402中にあるかどうかを調べ(S400、S40
1)、その対訳文が正解パターンデータベース402中
にある場合、その対訳文は正解対訳文とみなされるた
め、次の対訳文の処理に移る。その対訳文が正解パター
ンデータベース402中にない場合、誤り自動修正処
理、あるいは誤り検出処理を行なう。そして、文書の終
りがくるまで上記の処理を繰り返す。
The correct pattern judging section 400 checks whether or not the bilingual sentence notified from the sentence correspondence judging section 102 exists in the correct pattern database 402 (S400, S40).
1) If the bilingual sentence is in the correct pattern database 402, the bilingual sentence is regarded as a correct bilingual sentence, and the process proceeds to the next bilingual sentence. If the bilingual sentence is not in the correct answer pattern database 402, an error automatic correction process or an error detection process is performed. Then, the above processing is repeated until the end of the document comes.

【0093】例えば、図26に示すように6番目の対訳
文の誤り率は、31%以上50%以下と表示されている
が、ユーザが、その翻訳文は正しいと思い、正解指定を
行なった場合、原文と翻訳文が正解パターンとして、正
解パターンデータベースに登録される(図27)。
For example, as shown in FIG. 26, the error rate of the sixth translated sentence is displayed as 31% or more and 50% or less, but the user thinks that the translated sentence is correct, and designates the correct answer. In this case, the original sentence and the translated sentence are registered as the correct answer pattern in the correct answer pattern database (FIG. 27).

【0094】その後、上記の対訳文が入力された場合
は、正解パターンデータベース中にすでにその対訳文が
登録されているため、誤り判定処理を行なわない。な
お、自動修正問い合わせ部315が省略された構成でも
よい。
Thereafter, when the above-mentioned translated text is input, since the translated text has already been registered in the correct answer pattern database, the error determination processing is not performed. Note that the configuration may be such that the automatic correction inquiry unit 315 is omitted.

【0095】また、上記の実施の形態1から実施の形態
6の対訳文誤り検出装置は、プログラムによって実現
し、これをフロッピーディスク等の記録媒体に記録して
移送し、あるいは、通信回線を通して移送することによ
り、独立した他のコンピュータシステムで容易に実施す
ることができる。
Further, the bilingual sentence error detecting apparatus according to the first to sixth embodiments is realized by a program, which is recorded on a recording medium such as a floppy disk and transferred, or transferred through a communication line. By doing so, it can be easily implemented by another independent computer system.

【0096】[0096]

【発明の効果】以上のように本発明によれば、第1言語
によって表現された原文と前記原文を第2の言語に翻訳
した翻訳文とを入力する文入力部と、前記原文からの原
文情報の抽出と前記翻訳文からの翻訳文情報の抽出とを
行なう情報抽出部と、前記原文情報と前記翻訳文情報と
を比較する比較部と、前記比較部における比較結果をも
とに、前記翻訳文の誤り率を計算する誤り率計算部と、
誤り率の高い前記翻訳文の対訳文を利用者に伝える報知
部とを備えることとしているので、理想的な翻訳文や複
数の翻訳文を用意することなしに、第1の言語の原文と
前記原文を第2の言語に翻訳した翻訳文とを機械的に比
較し、誤っている可能性の高い文と誤りの程度を利用者
にわかりやすい形式で提示できるため、修正の作業効率
を向上させることができる。
As described above, according to the present invention, a sentence input unit for inputting an original sentence expressed in a first language and a translated sentence obtained by translating the original sentence into a second language, an original sentence from the original sentence An information extracting unit that extracts information and extracts translated sentence information from the translated sentence; a comparing unit that compares the original sentence information with the translated sentence information; and An error rate calculator for calculating an error rate of the translation,
A notification unit for transmitting a bilingual sentence of the translated sentence having a high error rate to the user is provided, so that the original sentence of the first language and the translated sentence can be prepared without preparing an ideal translated sentence or a plurality of translated sentences. Improve the efficiency of correction work by mechanically comparing the original sentence into a second language and presenting the sentence that is likely to be incorrect and the degree of error in a user-friendly format. Can be.

【0097】また、請求項9の発明においては、さら
に、利用者が誤り箇所を修正するマンマシンインターフ
ェース部と、利用者が修正を行なった対訳文に対して、
第1の言語の文と、第1の言語の文を翻訳した第2の言
語の文と、利用者が第2の言語の文に修正を施した修正
翻訳文と、誤り率とを誤りパターンとして保持する誤り
パターンデータベースと、前記誤りパターンデータベー
スへのアクセスを制御する誤りパターンデータベース制
御部と、自動修正を行なうべき対訳文かどうかを判定す
る誤りパターン自動修正箇所判定部と、前記誤りパター
ン自動修正箇所判定部で自動修正を行なうべきであると
判定された対訳文を、前記誤りパターンデータベースの
情報を利用して自動的に修正する誤りパターン自動修正
部とを備えることとしているので、同じ文に対しては、
一度誤りを修正しさえすれば誤りパターンデータベース
にその情報が登録され、次回からは自動的に修正を行な
ってくれるため、利用者の修正作業の負担を軽減でき
る。
According to the ninth aspect of the present invention, there is further provided a man-machine interface unit for correcting an erroneous part by a user, and a bilingual sentence corrected by the user.
A sentence in the first language, a sentence in the second language translated from the sentence in the first language, a corrected translated sentence in which the user has modified the sentence in the second language, and an error rate An error pattern database that holds the error pattern database, an error pattern database control unit that controls access to the error pattern database, an error pattern automatic correction location determination unit that determines whether a translation is to be automatically corrected, and the error pattern automatic An error pattern automatic correction unit that automatically corrects a bilingual sentence determined to be automatically corrected by the correction part determination unit by using information of the error pattern database is provided. For
Once the error is corrected, the information is registered in the error pattern database, and the correction is automatically performed from the next time, so that the burden of the user on the correction work can be reduced.

【0098】また、請求項11の発明においては、さら
に、誤りありと表示された対訳文に対して、今後利用者
が前記対訳文は正しい文として扱うという情報を入力す
るマンマシンインターフェース部と、利用者が正しい文
として扱うと入力した前記対訳文を正解パターンとして
保持する正解パターンデータベースと、前記正解パター
ンデータベースへのアクセスを制御する正解パターンデ
ータベース制御部と、入力文書中の正解パターンを判定
する正解パターン判定部とを備えることとしているの
で、利用者が正しい翻訳文として扱いたい文に対して
は、誤り表示を行なわないようにできる。
[0098] In the invention of claim 11, further, a man-machine interface unit for inputting information that a user will treat the translated sentence displayed as having an error as a correct sentence in the future, A correct pattern database that holds the translated text input as a correct pattern when the user treats it as a correct sentence, a correct pattern database controller that controls access to the correct pattern database, and determines a correct pattern in the input document. Since a correct pattern determination unit is provided, an error display can be prevented from being performed for a sentence that the user wants to treat as a correct translated sentence.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る対訳文誤り検出装置の実施の形態
1の構成図
FIG. 1 is a configuration diagram of a bilingual sentence error detection device according to a first embodiment of the present invention;

【図2】上記実施の形態の動作を説明するフローチャー
FIG. 2 is a flowchart illustrating an operation of the embodiment.

【図3】上記実施の形態の比較部の構成要素を示す図FIG. 3 is a diagram showing components of a comparison unit according to the embodiment.

【図4】上記実施の形態の文長さ比較部の動作を説明す
るフローチャート
FIG. 4 is a flowchart for explaining the operation of a sentence length comparing unit according to the embodiment;

【図5】上記実施の形態の形態素解析部から通知された
形態素情報の一部を抜きだした図
FIG. 5 is a diagram showing a part of the morphological information notified from the morphological analyzer of the embodiment.

【図6】上記実施の形態の形態素比較部の動作を説明す
るフローチャート
FIG. 6 is a flowchart illustrating an operation of a morphological comparison unit according to the embodiment.

【図7】上記実施の形態の形態素解析部あるいは文長さ
比較部から通知された形態素情報の一部を抜きだした図
FIG. 7 is a diagram showing a part of the morpheme information notified from the morpheme analysis unit or the sentence length comparison unit of the embodiment.

【図8】上記実施の形態の構文・意味比較部の動作を説
明するフローチャート
FIG. 8 is a flowchart for explaining the operation of the syntax / semantics comparison unit of the embodiment.

【図9】上記実施の形態の構文・意味比較部の動作を説
明するフローチャート
FIG. 9 is a flowchart for explaining the operation of the syntax / semantics comparison unit of the embodiment.

【図10】上記実施の形態の構文・意味解析部から通知
された構文木の一部を抜きだした図
FIG. 10 is a diagram illustrating a part of a syntax tree notified from the syntax and semantic analysis unit according to the embodiment;

【図11】本発明に係る対訳文誤り検出装置の実施の形
態2の構成図
FIG. 11 is a configuration diagram of a bilingual sentence error detection apparatus according to a second embodiment of the present invention.

【図12】上記実施の形態の表示部の画面の構成の一例
を示す図
FIG. 12 is a diagram illustrating an example of a configuration of a screen of a display unit in the embodiment.

【図13】上記実施の形態の動作を説明するフローチャ
ート
FIG. 13 is a flowchart illustrating the operation of the embodiment.

【図14】本発明に係る対訳文誤り検出装置の実施の形
態3の構成図
FIG. 14 is a configuration diagram of a bilingual sentence error detection device according to a third embodiment of the present invention.

【図15】上記実施の形態の動作を説明するフローチャ
ート
FIG. 15 is a flowchart illustrating an operation of the embodiment.

【図16】本発明に係る対訳文誤り検出装置の実施の形
態3の構成図
FIG. 16 is a configuration diagram of a bilingual sentence error detection device according to a third embodiment of the present invention.

【図17】上記実施の形態の動作を説明するフローチャ
ート
FIG. 17 is a flowchart illustrating an operation of the embodiment.

【図18】上記実施の形態の誤りパターンデータベース
の内容例の一例を示す図
FIG. 18 is a diagram showing an example of the content example of an error pattern database according to the embodiment.

【図19】上記実施の形態の表示部の画面の構成の一例
を示す図
FIG. 19 is a diagram illustrating an example of a screen configuration of a display unit according to the above embodiment.

【図20】上記実施の形態の表示部の画面の構成の一例
を示す図
FIG. 20 is a diagram illustrating an example of a screen configuration of a display unit according to the above embodiment.

【図21】上記実施の形態の誤りパターンデータベース
の内容例の一例を示す図
FIG. 21 is a diagram showing an example of the content example of an error pattern database according to the embodiment.

【図22】本発明に係る対訳文誤り検出装置の実施の形
態4の構成図
FIG. 22 is a configuration diagram of a bilingual sentence error detection apparatus according to a fourth embodiment of the present invention.

【図23】上記実施の形態の動作を説明するフローチャ
ート
FIG. 23 is a flowchart illustrating the operation of the above embodiment.

【図24】本発明に係る対訳文誤り検出装置の実施の形
態5の構成図
FIG. 24 is a configuration diagram of a bilingual sentence error detection apparatus according to a fifth embodiment of the present invention.

【図25】上記実施の形態の動作を説明するフローチャ
ート
FIG. 25 is a flowchart illustrating the operation of the above embodiment.

【図26】上記実施の形態の表示部の画面の構成の一例
を示す図
FIG. 26 illustrates an example of a screen configuration of a display unit in the above embodiment.

【図27】上記実施の形態の正解パターンデータベース
の内容例の一例を示す図
FIG. 27 is a diagram showing an example of the content example of a correct answer pattern database according to the embodiment.

【符号の説明】[Explanation of symbols]

101 文入力部 102 情報抽出部 103 検索部 104 辞書 105 比較部 106 誤り率計算部 107 報知部 1010 文書入力部 1020 文対応判定部 601 文長さ比較部 602 形態素比較部 603 構文・意味解析部 604 構文・意味比較部 605 比較レベル入力部 606 比較レベル制御部 310 誤りパターン自動修正箇所判定部 311 誤りパターン自動修正部 312 マンマシンインターフェース部 313 誤りパターンデータベース制御部 314 誤りパターンデータベース 315 自動修正問い合わせ部 400 正解パターン判定部 401 正解パターンデータベース制御部 400 正解パターンデータベース Reference Signs List 101 sentence input unit 102 information extraction unit 103 search unit 104 dictionary 105 comparison unit 106 error rate calculation unit 107 notification unit 1010 document input unit 1020 sentence correspondence determination unit 601 sentence length comparison unit 602 morpheme comparison unit 603 syntax / meaning analysis unit 604 Syntax / meaning comparison section 605 Comparison level input section 606 Comparison level control section 310 Error pattern automatic correction section determination section 311 Error pattern automatic correction section 312 Man-machine interface section 313 Error pattern database control section 314 Error pattern database 315 Automatic correction inquiry section 400 Correct answer pattern determination unit 401 Correct answer pattern database control unit 400 Correct answer pattern database

Claims (11)

【特許請求の範囲】[Claims] 【請求項1】 第1言語によって表現された原文と前記
原文を第2の言語に翻訳した翻訳文とを入力する文入力
部と、 前記原文からの原文情報の抽出と前記翻訳文からの翻訳
文情報の抽出とを行なう情報抽出部と、 前記原文情報と前記翻訳文情報とを比較する比較部と、 前記比較部における比較結果をもとに、前記翻訳文の誤
り率を計算する誤り率計算部と、 誤り率の高い前記翻訳文の対訳文を利用者に伝える報知
部とを備えた対訳文誤り検出装置。
1. A sentence input unit for inputting an original sentence expressed in a first language and a translated sentence obtained by translating the original sentence into a second language, extraction of original sentence information from the original sentence, and translation from the translated sentence An information extracting unit for extracting sentence information; a comparing unit for comparing the original sentence information and the translated sentence information; and an error rate for calculating an error rate of the translated sentence based on a comparison result in the comparing unit. A bilingual sentence error detection device comprising: a calculating unit; and a notifying unit that notifies a user of a bilingual sentence of the translated sentence having a high error rate.
【請求項2】 第1言語によって表現された原文の集ま
りである原文書と前記原文を第2の言語に翻訳した翻訳
文の集まりである翻訳文書とを入力する文書入力部と、 前記原文書と前記翻訳文書とから、前記原文と前記翻訳
文との対応付けを行ない対訳文を得る文対応判定部と、 前記原文からの原文情報の抽出と前記翻訳文からの翻訳
文情報の抽出とを行なう情報抽出部と、 前記原文情報と前記翻訳文情報とを比較する比較部と、 前記比較部における比較結果をもとに、前記翻訳文の誤
り率を計算する誤り率計算部と、 誤り率の高い前記翻訳文の対訳文を利用者に伝える報知
部とを備えたことを特徴とする請求項1記載の対訳文誤
り検出装置。
2. A document input unit for inputting an original document as a set of original sentences expressed in a first language and a translated document as a set of translations obtained by translating the original sentence into a second language; A sentence correspondence determining unit that associates the original sentence with the translated sentence from the translated document to obtain a translated sentence; and extracts original sentence information from the original sentence and extracts translated sentence information from the translated sentence. An information extraction unit to perform; a comparison unit that compares the original text information with the translation text information; an error rate calculation unit that calculates an error rate of the translated text based on a comparison result in the comparison unit; 2. A bilingual sentence error detecting apparatus according to claim 1, further comprising: a notifying unit that notifies a user of a bilingual sentence of the translated sentence with a high level.
【請求項3】 前記情報抽出部を、前記原文と前記翻訳
文の文長さを抽出する文長さ抽出部で実現し、 前記比較部を、前記文長さ抽出部で抽出した前記原文の
文長さと前記翻訳文の文長さとを比較する文長さ比較部
で実現した請求項1記載の対訳文誤り検出装置。
3. The information extracting unit is realized by a sentence length extracting unit that extracts a sentence length of the original sentence and the translated sentence, and the comparing unit is configured to extract the sentence length of the original sentence extracted by the sentence length extracting unit. 2. The bilingual sentence error detecting apparatus according to claim 1, wherein the sentence length comparing unit compares the sentence length with the sentence length of the translated sentence.
【請求項4】 第1言語の情報と第2言語の情報とを記
憶している辞書と、 前記辞書を検索して情報を取り出す検索部とを有し、 前記情報抽出部を、前記辞書の情報を利用して前記原文
と前記翻訳文の形態素解析を行なう形態素解析部で実現
し、 前記比較部を、前記形態素解析部から得られる前記原文
の形態素情報と前記翻訳文の形態素情報とを比較する形
態素比較部で実現した請求項1記載の対訳文誤り検出装
置。
4. A dictionary that stores information in a first language and information in a second language, and a search unit that searches the dictionary to extract information, wherein the information extraction unit A morphological analysis unit that performs morphological analysis of the original sentence and the translated sentence using information is implemented. The comparing unit compares morphological information of the original sentence obtained from the morphological analysis unit with morphological information of the translated sentence. 2. The bilingual sentence error detection device according to claim 1, wherein the bilingual sentence error detection device is implemented by a morphological comparison unit.
【請求項5】 第1言語の情報と第2言語の情報とを記
憶している辞書と、前記辞書を検索して情報を取り出す
検索部とを有し、 前記情報抽出部を、前記辞書の情報を利用して前記原文
と前記翻訳文の形態素解析を行なう形態素解析部と前記
形態素解析部で得られた形態素情報を利用して構文・意
味解析を行なう構文・意味解析部とで実現し、 前記比較部を、前記構文・意味解析部から得られる前記
原文の構文と前記翻訳文の構文の比較を行なう構文比較
部と、 前記原文の形態素の対象領域と前記翻訳文の形態素の対
象領域の比較や、前記原文の文体レベルと前記翻訳文の
文体レベルの比較を行なう意味比較部とで実現した請求
項1記載の対訳文誤り検出装置。
5. A dictionary that stores information of a first language and information of a second language, and a search unit that searches the dictionary and retrieves information. A morphological analysis unit that performs morphological analysis of the original sentence and the translated sentence using information and a syntactic and semantic analysis unit that performs syntactic and semantic analysis using morphological information obtained by the morphological analysis unit, A comparing unit configured to compare a syntax of the original sentence obtained from the syntactic / semantic analysis unit with a syntax of the translated sentence; and a target area of a morpheme of the original sentence and a target area of a morpheme of the translated sentence. 2. The bilingual sentence error detecting apparatus according to claim 1, wherein the bilingual sentence error detecting device is realized by a semantic comparison unit that performs comparison and compares the style of the original sentence with the style of the translated sentence.
【請求項6】 前記情報抽出部を、文長さ抽出部と、形
態素解析部、構文・意味解析部とで実現し、 前記比較部を、文長さ比較部と、形態素比較部と、構文
比較部と、意味比較部とで実現した請求項1記載の対訳
文誤り検出装置。
6. The information extracting unit is realized by a sentence length extracting unit, a morphological analyzing unit, and a syntactic / semantic analyzing unit, and the comparing unit is a sentence length comparing unit, a morphological comparing unit, 2. The bilingual sentence error detecting device according to claim 1, wherein the bilingual sentence error detecting device is realized by a comparing unit and a meaning comparing unit.
【請求項7】 文長さ比較部および形態素比較部および
構文比較部と意味比較部をどの組合わせで用いるかのレ
ベルを入力する比較レベル入力部と、比較レベルに応じ
て処理を選択する比較レベル判定部とを備えた請求項1
記載の対訳文誤り検出装置。
7. A comparison level input section for inputting a level of a combination of a sentence length comparison section, a morphological comparison section, a syntax comparison section, and a semantic comparison section, and a comparison for selecting a process according to the comparison level. 2. The apparatus according to claim 1, further comprising a level determination unit.
A bilingual sentence error detection device described.
【請求項8】 前記報知部は、誤りの程度に応じて報知
形態を変えることを特徴とする請求項1記載の対訳文誤
り検出装置。
8. The bilingual sentence error detection apparatus according to claim 1, wherein the notification unit changes the notification mode according to the degree of the error.
【請求項9】 前記報知部により報知される誤り率の高
い対訳文に対して利用者が前記対訳文の翻訳文を修正す
るマンマシンインターフェース部と、 前記対訳文の原文と、前記対訳文の修正前翻訳文と、前
記対訳文の修正後翻訳文と、前記誤り率とを誤りパター
ンとして保持する誤りパターンデータベースと、前記誤
りパターンデータベースへのアクセスを制御する誤りパ
ターンデータベース制御部と、 自動修正を行なうべき対訳文かどうかを判定する誤りパ
ターン自動修正箇所判定部と、 前記誤りパターン自動修正箇所判定部で自動修正を行な
うべきであると判定された前記対訳文を、前記誤りパタ
ーンデータベースの情報を利用して自動的に修正する誤
りパターン自動修正部とを備えた請求項1記載の対訳文
誤り検出装置。
9. A man-machine interface unit for a user to correct a translated sentence of the translated sentence for a translated sentence with a high error rate notified by the notifying unit, an original sentence of the translated sentence, and An error pattern database that retains the translated sentence before correction, the translated sentence of the translated sentence, and the error rate as an error pattern; an error pattern database control unit that controls access to the error pattern database; An error pattern automatic correction location determination unit that determines whether the translation is to be performed, and the bilingual text determined that the automatic correction should be performed by the error pattern automatic correction location determination unit, based on information in the error pattern database. 2. The bilingual sentence error detecting apparatus according to claim 1, further comprising: an error pattern automatic correcting unit that automatically corrects the error using the error pattern.
【請求項10】 前記報知部により報知される誤り率の
高い対訳文に対して 利用者が前記対訳文の翻訳文を修正するマンマシンイン
ターフェース部と、 前記対訳文の原文と、前記対訳文の修正前翻訳文と、 前記対訳文の修正後翻訳文と、前記誤り率とを誤りパタ
ーンとして保持する誤りパターンデータベースと、 前記誤りパターンデータベースへのアクセスを制御する
誤りパターンデータベース制御部と、 自動修正を行なうべき対訳文かどうかを判定する誤りパ
ターン自動修正箇所判定部と、 前記誤りパターン自動修正箇所判定部で自動修正を行な
うべきであると判定された前記対訳文を自動修正して良
いか否かを利用者に問い合わせる自動修正問い合わせ部
と、 前記自動修正問い合わせ部に対する利用者の応答に応じ
て前記対訳文を自動的に修正する誤りパターン自動修正
部とを備えた請求項1記載の対訳文誤り検出装置。
10. A man-machine interface unit for a user to correct a translated sentence of the translated sentence with respect to a translated sentence with a high error rate notified by the notifying unit, an original sentence of the translated sentence, A translated sentence before correction, a translated sentence of the translated text, and an error pattern database that holds the error rate as an error pattern; an error pattern database control unit that controls access to the error pattern database; An error pattern automatic correction location determining unit that determines whether the translation is to be performed, and whether or not the parallel text determined to be automatically corrected by the error pattern automatic correction location determination unit may be automatically corrected. An automatic correction inquiry section for inquiring of the user whether or not the bilingual sentence is automatically sent in response to a user response to the automatic correction inquiry section. Translated sentence error detecting apparatus according to claim 1, further comprising a error pattern automatic correction unit for correcting manner.
【請求項11】 前記報知部に誤りありと表示された対
訳文に対して、今後利用者が前記対訳文は正しい文とし
て扱うという情報を入力するマンマシンインターフェー
ス部と、 利用者が正しい文として扱うと入力した前記対訳文を正
解パターンとして保持する正解パターンデータベース
と、 前記正解パターンデータベースへのアクセスを制御する
正解パターンデータベース制御部と、 入力文書中の正解パターンを判定する正解パターン判定
部とを備えた請求項1記載の対訳文誤り検出装置。
11. A man-machine interface unit for inputting information that the user will treat the translated sentence as a correct sentence in response to the translated sentence in which the notification unit indicates that there is an error, and A correct pattern database that holds the translated text input as a correct pattern to be handled, a correct pattern database control unit that controls access to the correct pattern database, and a correct pattern determination unit that determines the correct pattern in the input document. The bilingual sentence error detection device according to claim 1 provided.
JP10321782A 1998-11-12 1998-11-12 Translation error detecting device Pending JP2000148756A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10321782A JP2000148756A (en) 1998-11-12 1998-11-12 Translation error detecting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10321782A JP2000148756A (en) 1998-11-12 1998-11-12 Translation error detecting device

Publications (1)

Publication Number Publication Date
JP2000148756A true JP2000148756A (en) 2000-05-30

Family

ID=18136374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10321782A Pending JP2000148756A (en) 1998-11-12 1998-11-12 Translation error detecting device

Country Status (1)

Country Link
JP (1) JP2000148756A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100961717B1 (en) 2008-09-16 2010-06-10 한국전자통신연구원 Method and apparatus for detecting errors of machine translation using parallel corpus
JP2014194668A (en) * 2013-03-28 2014-10-09 Fujitsu Ltd Translation support device, translation support system and translation support program
JP2015525928A (en) * 2012-07-13 2015-09-07 マイクロソフト コーポレーション Phrase-based dictionary extraction and translation quality evaluation
JP2018055689A (en) * 2017-10-04 2018-04-05 シャープ株式会社 Display device, display method, and program
JP2019003552A (en) * 2017-06-19 2019-01-10 パナソニックIpマネジメント株式会社 Processing method, processing device, and processing program
JPWO2018131259A1 (en) * 2017-01-11 2019-11-07 パナソニックIpマネジメント株式会社 Text evaluation device and text evaluation method
JP2021089705A (en) * 2019-12-05 2021-06-10 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド Method and device for evaluating translation quality

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8606559B2 (en) 2008-09-16 2013-12-10 Electronics And Telecommunications Research Institute Method and apparatus for detecting errors in machine translation using parallel corpus
KR100961717B1 (en) 2008-09-16 2010-06-10 한국전자통신연구원 Method and apparatus for detecting errors of machine translation using parallel corpus
JP2015525928A (en) * 2012-07-13 2015-09-07 マイクロソフト コーポレーション Phrase-based dictionary extraction and translation quality evaluation
JP2018037095A (en) * 2012-07-13 2018-03-08 マイクロソフト テクノロジー ライセンシング,エルエルシー Phrase-based dictionary extraction and translation quality evaluation
JP2014194668A (en) * 2013-03-28 2014-10-09 Fujitsu Ltd Translation support device, translation support system and translation support program
JP2021120882A (en) * 2017-01-11 2021-08-19 パナソニックIpマネジメント株式会社 Arithmetic processing device, sentence evaluation device, and sentence evaluation method
JP7122582B2 (en) 2017-01-11 2022-08-22 パナソニックIpマネジメント株式会社 Arithmetic processing device, text evaluation device, and text evaluation method
US11182568B2 (en) 2017-01-11 2021-11-23 Panasonic Intellectual Property Management Co., Ltd. Sentence evaluation apparatus and sentence evaluation method
JPWO2018131259A1 (en) * 2017-01-11 2019-11-07 パナソニックIpマネジメント株式会社 Text evaluation device and text evaluation method
JP2019003552A (en) * 2017-06-19 2019-01-10 パナソニックIpマネジメント株式会社 Processing method, processing device, and processing program
US10402497B2 (en) 2017-06-19 2019-09-03 Panasonic Intellectual Property Management Co., Ltd. Processing method, processing apparatus, and recording medium
JP2018055689A (en) * 2017-10-04 2018-04-05 シャープ株式会社 Display device, display method, and program
JP2021089705A (en) * 2019-12-05 2021-06-10 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド Method and device for evaluating translation quality
JP7122341B2 (en) 2019-12-05 2022-08-19 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド Method and apparatus for evaluating translation quality
US11481562B2 (en) 2019-12-05 2022-10-25 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for evaluating translation quality

Similar Documents

Publication Publication Date Title
US5555169A (en) Computer system and method for converting a conversational statement to computer command language
US5418717A (en) Multiple score language processing system
JP3170400B2 (en) Character string search method and device using semantic pattern recognition
JP2963463B2 (en) Interactive language analyzer
JP3114181B2 (en) Interlingual communication translation method and system
US6789231B1 (en) Method and system for providing alternatives for text derived from stochastic input sources
JP3695191B2 (en) Translation support apparatus and method and computer-readable recording medium
US20030158723A1 (en) Syntactic information tagging support system and method
JPS62163173A (en) Mechanical translating device
JP2004078962A (en) Method for performing syntax analysis of text in corpus and recording medium
KR20050033420A (en) Method and apparatus for identifying semantic structures from text
JP2004110835A (en) Method and system for retrieving confirmation text
US7225121B2 (en) Generating with Lexical Functional Grammars
JPH0721183A (en) Machine translation system
JP2000148756A (en) Translation error detecting device
US5132901A (en) System and method for input of target language equivalents and determination of attribute data associated therewith
Srinivas et al. An approach to robust partial parsing and evaluation metrics
JP3168829B2 (en) Search formula creation support system
JPS58192173A (en) System for selecting word used in translation in machine translation
JP2778025B2 (en) Learning Co-occurrence Dictionary
US20030171913A1 (en) Generating with lexical functional grammars
JP3027553B2 (en) Parser
JP3339006B2 (en) Parallel Noun Phrase Processor in Machine Translation Equipment
JP3135221B2 (en) Example-driven language structure analyzer
JP2002183134A (en) Translating device