JPH05101095A - Method and device for detecting nonuniformity of translated word - Google Patents

Method and device for detecting nonuniformity of translated word

Info

Publication number
JPH05101095A
JPH05101095A JP3285742A JP28574291A JPH05101095A JP H05101095 A JPH05101095 A JP H05101095A JP 3285742 A JP3285742 A JP 3285742A JP 28574291 A JP28574291 A JP 28574291A JP H05101095 A JPH05101095 A JP H05101095A
Authority
JP
Japan
Prior art keywords
text
word
minimum
element unit
syntax element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3285742A
Other languages
Japanese (ja)
Inventor
Hiroko Kida
裕子 木田
Hiroyuki Kaji
博行 梶
Yasutsugu Morimoto
康嗣 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP3285742A priority Critical patent/JPH05101095A/en
Publication of JPH05101095A publication Critical patent/JPH05101095A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PURPOSE:To improve efficiency for the uniform of a translated word and the correction of spelling error by dividing a source text into words, also dividing a text edited after translation into word, drawing a dictionary concerning words in the source text and executing the extraction and display of words which corresponding relation can not be recognized. CONSTITUTION:The source text added a sentence number for each sentence is divided into words and stored in a first word division table 41. Next, an analysis processing processor 1 divides the translated text added a sentence number corresponding to that of the source text by one-to-one into words by drawing the dictionary while processing the end of the word or the like, and a processing program in a main memory 2 stores the respective divided words into a second word division table 42. Afterwards, the words in the first word division table 41 are extracted, and a corresponding relation decision table 43 with the second word division table 42 is prepared by using a translation dictionary 3. Then, the words not uniforming the translated word corresponding to the source word are extracted from this table 43, and an alarm information table 44 is prepared and displayed at a display device 7.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、第1言語から第2言語
への機械翻訳と人手による後編集作業に伴う訳語不統一
をチェックする訳語不統一検出方法及び装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a translation word inconsistency detection method and apparatus for checking translation word inconsistency associated with machine translation from a first language to a second language and manual post-editing work.

【0002】[0002]

【従来の技術】従来から、第1言語から第2言語への機
械翻訳処理装置は、一般に辞書と文法規則、そして、文
法規則を適用するための処理装置によって構成されてい
る。しかし、第1言語の持つ多義性を主とする曖昧さの
解消が困難なため、第1言語を完全に解析することは不
可能とされている。また、第1言語の解析に成功して
も、第2言語の生成において、人間が日常使っているよ
うな自然な言語の流れに沿ったものができるとは限らな
い。その結果、機械翻訳処理装置により翻訳されたテキ
ストを人間が後編集する作業の必要性が生ずる。機械翻
訳処理装置により翻訳を行う場合、原テキスト中の同じ
パターンに対して翻訳アルゴリズムは同じように動作す
るので、原テキスト中の同一の単語については、同じ訳
語が適用される。しかし、人間が後編集すると、原単語
と機械翻訳処理装置によって一通りに統一されていた訳
語が不統一になる可能性がある。そこで、人間の後編集
作業によっても訳語が不統一にならないように、同一の
修正をテキスト全体の複数箇所に対し実行する等の方式
がとられて来た。機械翻訳処理に伴う後編集作業に関し
ては、特開昭58−151677号公報に開示されてい
る。特開昭58−151677号公報には、第1言語に
よるテキストとその第2言語による翻訳テキスト及び両
テキストの構文要素単位の対応関係を記憶し、翻訳テキ
ストが修正された時に修正された構文要素の修正前後の
文字列を記憶し、修正された構文要素と同じ構文要素を
テキスト全体にわたって検索し、これに対しても同一の
修正を施すということが開示されている。
2. Description of the Related Art Conventionally, a machine translation processing device from a first language to a second language generally comprises a dictionary, grammatical rules, and a processing device for applying the grammatical rules. However, since it is difficult to resolve the ambiguity mainly due to the polysemy of the first language, it is impossible to completely analyze the first language. Further, even if the analysis of the first language is successful, the generation of the second language does not always follow the natural language flow that humans use everyday. As a result, it becomes necessary for a human to post-edit the text translated by the machine translation processor. When the translation is performed by the machine translation processing device, the translation algorithm operates in the same manner for the same pattern in the original text, and thus the same translated word is applied to the same word in the original text. However, when a human post-edits, there is a possibility that the original word and the translated word that has been unified by the machine translation processing device may become inconsistent. Therefore, a method has been adopted in which the same correction is performed on multiple parts of the entire text so that the translated words do not become inconsistent even by human post-editing work. The post-editing work associated with the machine translation process is disclosed in Japanese Patent Application Laid-Open No. 58-151677. Japanese Laid-Open Patent Publication No. 58-151677 stores a text in a first language, a translated text in a second language, and a correspondence relationship between syntax element units of both texts, and a syntax element modified when the translation text is modified. It is disclosed that the character strings before and after the correction are stored, the same syntax element as the corrected syntax element is searched over the entire text, and the same correction is applied to this.

【0003】[0003]

【発明が解決しようとする課題】現状の機械翻訳処理装
置は、翻訳品質が十分とはいえず、翻訳したテキストに
対して、作業者が後編集作業を行うことが必要不可欠で
あるが、その結果、原テキスト中の同一の単語に対して
訳語が不統一になる可能性があり、その訳語不統一の発
生を防止する必要がある。従来技術として開示している
方式でも、その訳語不統一の発生防止に一定の効果はあ
るが、作業者が一般のワードプロセッサの文字修正機能
を使用して、後編集作業を行う場合が想定でき、このよ
うな後編集作業を行う場合には効果がない。本発明の目
的は、上述の事情に鑑み、後編集作業が終了した後に、
テキストから不統一になっている訳語を自動的に検出
し、また、後編集作業に伴うスペルミスの発生を自動的
に検出し、訳語の統一及びスペルミスの校正作業を高能
率化することにある。
In the current machine translation processing apparatus, the translation quality is not sufficient, and it is indispensable for the operator to perform post-editing work on the translated text. As a result, there is a possibility that the translated words of the same word in the original text may become inconsistent, and it is necessary to prevent the translation inconsistency from occurring. Even with the method disclosed as the conventional technique, there is a certain effect in preventing the occurrence of the word inconsistency, but it can be assumed that the worker uses the character correction function of a general word processor to perform post-editing work. There is no effect when performing such post-editing work. In view of the above circumstances, the purpose of the present invention is to
It is to automatically detect a translated word that is inconsistent in a text and also to automatically detect the occurrence of a spelling error associated with a post-editing operation, thereby increasing the efficiency of the unifying translation word and the proofreading operation of the misspelling.

【0004】[0004]

【問題点を解決するための手段】上記課題は、第1言語
による第1のテキストを単語に分割して第1単語分割テ
ーブルに記憶し、第2言語による第2のテキストを単語
に分割して第2単語分割テーブルに記憶し、対訳辞書を
利用して第1のテキストの単語と第2のテキストの単語
を対応付けて対応関係決定テーブルに記憶し、第2のテ
キストの単語との対応関係が不統一の第1のテキストの
単語を対応関係決定テーブルから抽出し、警告情報テー
ブルに記憶し、これを利用して不統一である対応関係に
ついて訳語不統一の警告情報を表示画面に表示すること
によって、達成される。また、第1言語によるテキスト
を第2言語に機械翻訳して得られる第1のテキストを単
語に分割して第1単語分割テーブルに記憶し、前記機械
翻訳結果を更に後編集して得られる第2のテキストを単
語に分割して第2単語分割テーブルに記憶し、第1のテ
キストの単語と第2のテキストの単語を対応付けて対応
関係決定テーブルに記憶し、第2のテキストの単語との
対応関係がつく出現箇所と対応関係がつかない出現箇所
の両方を有する第1のテキストの単語を対応関係決定テ
ーブルから抽出し、警告情報テーブルに記憶し、抽出し
た単語について対応関係が不統一であることを表示画面
に表示することによって、達成される。
[Means for Solving the Problems] The above problem is that the first text in the first language is divided into words and stored in the first word division table, and the second text in the second language is divided into words. Stored in the second word division table, the words of the first text and the words of the second text are associated with each other using the bilingual dictionary and stored in the correspondence determination table, and the correspondence with the words of the second text is stored. The words of the first text with ununiform relations are extracted from the correspondence relation determination table, stored in the warning information table, and using this, the warning information of unconcordance translations is displayed on the display screen. It is achieved by doing. Further, the first text obtained by machine-translating the text in the first language into the second language is divided into words and stored in the first word division table, and the machine translation result is further edited to obtain the first text. The second text is divided into words and stored in the second word division table, the words of the first text and the words of the second text are associated and stored in the correspondence determination table, and the words of the second text are stored. The words of the first text having both the occurrence places with the correspondence relation and the appearance places without the correspondence relation are extracted from the correspondence relation determination table and stored in the warning information table, and the correspondence relations of the extracted words are not unified. This is achieved by displaying that

【0005】[0005]

【作用】本発明の訳語不統一検出方法において、まず、
原テキストを単語分割して第1単語分割テーブルに記憶
し、翻訳し後編集されたテキスト(以後、翻訳テキスト
と称する)を単語分割して第2単語分割テーブルに記憶
し、第1単語分割テーブル中の単語について辞書引きし
て、辞書に登録された該単語の訳語全てについて、第2
単語分割テーブルを検索し、それぞれに一致するものを
抽出して、第1単語分割テーブル中の単語とともに対応
関係決定テーブルに記憶する。この場合の単語とは、文
における構成要素単位の最小のものである。一致するも
のが見つけられなかった第1単語分割テーブル中の単語
については、特別の対応関係を持つものとして「??
?」の文字列とともに対応関係決定テーブルに記憶す
る。原テキスト中のある単語に対応しているはずの翻訳
テキスト中の単語にスペルミスが発生しているときは、
当然辞書中の該単語の訳語と一致するものがみつけられ
ないため、原テキスト中の該単語に対応するものは「?
??」となる。このようにして、対応関係決定テーブル
を参照することにより、原テキスト中の単語が翻訳テキ
スト中においてどのような訳語を割り当てられているか
が分かる。つぎに、対応関係決定テーブルの原単語と訳
語との対応を参照し、同一の原単語に対して複数の訳語
が割り当てられている対応関係を抽出し、警告情報テー
ブルに記憶し、記憶された対応関係について警告情報を
表示画面に表示する。原テキスト中にある単語が複数出
現し、そのうちのいくつかにスペルミスが発生した場合
も、原テキスト中の単語に対応するものは「???」
と、辞書に登録されている訳語とが混在することにな
り、上記の同一の原単語に対して複数の訳語が割り当て
られている対応関係に該当する。そこで、このようなス
ペルミスが発生している対応関係についても、警告情報
が表示されることとなる。尚、処理を行うテキストは、
機械翻訳処理によるものだけではなく、人間による翻訳
テキストを対象としても同様の効果を得られる。また、
本発明の訳語不統一検出方法において、原テキストを機
械翻訳して得られる機械翻訳テキストを単語に分割して
第1単語分割テーブルに記憶し、前記機械翻訳結果を更
に後編集して得られる翻訳テキストを単語に分割して第
2単語分割テーブルに記憶し、機械翻訳テキストの単語
と翻訳テキストの単語を対応付けて対応関係決定テーブ
ルに記憶し、翻訳テキストの単語との対応関係がつく出
現箇所と、対応関係がつかない出現箇所の両方を有する
機械翻訳テキストの単語を対応関係決定テーブルから抽
出し、警告情報テーブルに記憶し、抽出した単語につい
て対応関係が不統一であることを表示画面に表示する。
これにより、対訳辞書を参照することなく、第1単語分
割テーブルの単語を直接第2単語分割テーブルから検索
すれば良いことになるため、処理が簡略化される。
In the method for detecting inconsistency of translated words of the present invention, first,
The original text is word-divided and stored in the first word division table, and the translated and edited text (hereinafter referred to as translated text) is word-divided and stored in the second word division table, and the first word division table. The word in the dictionary is looked up in the dictionary, and the second word is extracted for all the translations of the word registered in the dictionary.
The word division table is searched, the matching ones are extracted, and stored in the correspondence determination table together with the words in the first word division table. The word in this case is the minimum of the constituent element unit in the sentence. Words in the first word division table for which no match is found are treated as “??
? It is stored in the correspondence relationship determination table together with the character string “”. If there is a misspelling in a word in the translated text that should correspond to a word in the original text,
Of course, since a match with the translated word of the word in the dictionary cannot be found, the word corresponding to the word in the original text is "?
? ? Will be In this way, by referring to the correspondence relationship determination table, it is possible to know what translated word is assigned to the word in the original text. Next, referring to the correspondence between the original word and the translated word in the correspondence relationship determination table, the correspondence relationship in which a plurality of translated words are assigned to the same original word is extracted, stored in the warning information table, and stored. Display warning information about the correspondence on the display screen. Even if multiple words appear in the original text and some of them are misspelled, the corresponding word in the original text is "????".
And the translated words registered in the dictionary are mixed, which corresponds to the correspondence relationship in which a plurality of translated words are assigned to the same original word. Therefore, warning information is also displayed for the correspondence relationship in which such a spelling error has occurred. The text to be processed is
Similar effects can be obtained not only by machine translation processing but also by human translated text. Also,
In the translation word inconsistency detection method of the present invention, a machine translation text obtained by machine translation of an original text is divided into words, stored in a first word division table, and a translation obtained by further editing the machine translation result. The text is divided into words and stored in the second word division table, the words of the machine translation text and the words of the translation text are associated with each other and stored in the correspondence relationship determination table, and the appearance locations having the correspondence relationship with the words of the translation text are stored. , And the words of the machine-translated text that have both occurrences that do not correspond to each other are extracted from the correspondence determination table and stored in the warning information table, and it is displayed on the display screen that the correspondences of the extracted words are inconsistent. indicate.
This simplifies the process because the words in the first word division table can be directly searched from the second word division table without referring to the bilingual dictionary.

【0006】[0006]

【実施例】本発明の実施例として、日本語から英語への
機械翻訳処理を行い、人手によって後編集されたものに
関して、原テキスト中のある単語に対する訳語が翻訳テ
キスト全体で統一されているかどうかを調べる場合につ
いて説明する。図1は、本発明の一実施例を示すブロッ
ク図である。図1において、1は解析処理プロセッサ、
2は解析等の内部処理用テーブルや処理プログラムを有
するメインメモリ、3は辞書用メモリ、4は訳語不統一
をチェックする訳語チェック用メモリ、5はチェックす
るテキストをいれた文書ファイル、6は作業者がチェッ
クするテキストを手により入力する場合に使用するキー
ボード、7は作業者がチェック結果を確認するための表
示装置を示している。また、訳語不統一チェック用メモ
リ4の内部の割付けにおいて、41は翻訳対象である原
テキストを単語分割した結果を格納する第1単語分割テ
ーブル、42は翻訳処理を行い、人手によって後編集さ
れた翻訳テキストを単語分割した結果を格納する第2単
語分割テーブル、43は原テキストの単語と翻訳テキス
トの訳語とを一対一に対応付けた対応関係決定テーブ
ル、44は翻訳テキスト内の訳語が統一されていない対
応関係を抽出して格納する警告情報テーブルを示してい
る。
[Embodiment] As an embodiment of the present invention, whether or not a translated word corresponding to a word in the original text is unified in the entire translated text in a machine translated from Japanese to English and manually post-edited The case of examining is explained. FIG. 1 is a block diagram showing an embodiment of the present invention. In FIG. 1, 1 is an analysis processor,
2 is a main memory having an internal processing table for analysis and the like, and a processing program, 3 is a dictionary memory, 4 is a translation word checking memory for checking inconsistency of translation words, 5 is a document file with text to be checked, and 6 is work. A keyboard used when the operator manually inputs the text to be checked, and 7 is a display device for the operator to confirm the check result. In the internal allocation of the translation word inconsistency check memory 4, 41 is a first word division table for storing the result of word division of the original text to be translated, 42 is a translation process, and is post-edited manually. A second word division table that stores the result of word division of the translated text, 43 is a correspondence relationship determination table that associates the words of the original text and the translated words of the translated text in a one-to-one correspondence, and 44 is the unified translated words in the translated text. 11 shows a warning information table for extracting and storing uncorresponding correspondences.

【0007】図2は、本発明の一実施例の処理動作を示
すフローチャートである。以下、図2に沿って、処理動
作を説明する。作業者によりキーボード6から入力され
るか、あるいは、文書ファイル5中にあれば文書ファイ
ル5から取り込まれた(ステップ11)1文ごとに文番
号の付いた原テキストを単語分割し、第1単語分割テー
ブル41に格納する(ステップ12)。図3は、該(ス
テップ12)の処理動作を示すフローチャートである。
図3に従って該処理動作について詳述する。解析処理プ
ロセッサ1は、入力された翻訳テキストを対訳辞書3を
参照しながら単語に分割する(ステップ121)。この
場合、翻訳テキストというのは、機械翻訳処理装置によ
り翻訳し、人手により後編集したテキストであり、単語
というのは、文の構成要素の中で最小の単位である。単
語分割の方式としては、例えば、特開昭62−1692
62号公報があり、これを用いることが可能である。解
析処理プロセッサ1が分割した単語を、図1のメインメ
モリ2中の処理プログラムは、まず、図4に示すような
第1単語分割テーブル41に格納する(ステップ12
2)。該テキスト中の単語を全て第1単語分割テーブル
42に格納し終えたら(ステップ123)、該処理動作
を終える。 図4の第1単語分割テーブル41におい
て、411は文の番号を格納し、412は1文中の全て
の単語をその出現順に格納している。この第1単語分割
テーブル41の411の行数と412の列数は、処理対
象とする原テキストの大きさに応じて増減するものとす
る。
FIG. 2 is a flow chart showing the processing operation of an embodiment of the present invention. The processing operation will be described below with reference to FIG. The first text is divided into words by dividing the original text with a sentence number for each sentence input by the operator from the keyboard 6 or fetched from the document file 5 if it is in the document file 5 (step 11). The data is stored in the division table 41 (step 12). FIG. 3 is a flowchart showing the processing operation of (step 12).
The processing operation will be described in detail with reference to FIG. The analysis processor 1 divides the input translated text into words while referring to the bilingual dictionary 3 (step 121). In this case, the translated text is a text translated by a machine translation processing apparatus and manually post-edited, and a word is the smallest unit among the constituent elements of a sentence. As a method of word division, for example, Japanese Patent Laid-Open No. 62-1692
There is a publication No. 62, which can be used. The processing program in the main memory 2 of FIG. 1 stores the words divided by the analysis processor 1 in the first word division table 41 as shown in FIG. 4 (step 12).
2). When all the words in the text have been stored in the first word division table 42 (step 123), the processing operation ends. In the first word division table 41 of FIG. 4, 411 stores sentence numbers, and 412 stores all words in one sentence in the order of appearance. It is assumed that the number of rows 411 and the number of columns 412 of the first word division table 41 increase or decrease according to the size of the original text to be processed.

【0008】次に、図1の解析処理プロセッサ1が、作
業者によりキーボード6から入力されるか、あるいは、
文書ファイル5中にあれば文書ファイル5から取り込ま
れた(ステップ13)、原テキストの文番号と一対一の
対応をしている文番号が一文ごとに付けられた翻訳テキ
ストを、語尾の's'や'ed'等の処理を行いながら、ブ
ランクからブランクまでの文字列により、辞書引きして
単語分割し、図1のメインメモリ2中の処理プログラム
が、分割した各単語を、図3に示したフローチャートと
同様の処理動作により、図5に示すような第2単語分割
テーブル42に格納する(ステップ14)。図5の第2
単語分割テーブル42において、421はそれぞれの文
の番号を格納し、422は1文中の全ての単語をその出
現順に格納している。この第2単語分割テーブル42の
421の行数と422の列数は、処理対象とする翻訳テ
キストの大きさに応じて増減するものとする。
Next, the analysis processor 1 of FIG. 1 is input by a worker from the keyboard 6, or
If the translated text is included in the document file 5 (step 13), the translated text in which the sentence number corresponding to the sentence number of the original text in a one-to-one correspondence is added for each sentence is's. While performing processing such as'or'ed ', the dictionary is divided into words by the character string from blank to blank, and the processing program in the main memory 2 in FIG. It is stored in the second word division table 42 as shown in FIG. 5 by the same processing operation as the flowchart shown (step 14). Second of FIG.
In the word division table 42, 421 stores the number of each sentence, and 422 stores all the words in one sentence in the order of appearance. It is assumed that the number of rows 421 and the number of columns 422 of the second word division table 42 increase or decrease according to the size of the translated text to be processed.

【0009】図6は、特に、図8の対応関係決定テーブ
ル43を作成する処理動作(ステップ15)を示したフ
ローチャートである。図6に沿って該処理動作を詳述す
る。図4の第1単語分割テーブル41中の411の1の
文の、412の1の単語「用紙」を抽出し(ステップ1
502)、該単語について対訳辞書3を検索する(ステ
ップ1503)。図7は、対訳辞書3の構造と内容を示
したものである。図7において、31は日本語の単語、
32は該単語の品詞、33は該単語の品詞が動詞/形容
詞であった場合の活用の型を示し、34は該単語に対応
する英語の訳語を示している。図7の例において、「用
紙」の対訳の英語は、「paper」、「form」と
複数登録されているが、まず、そのうちの「pape
r」を選んで(ステップ1506)、図5の第2単語分
割テーブル42中の421の1の文の全ての単語を検索
して(ステップ1507)、抽出した訳語、すなわち、
「paper」と一致するものを求める(ステップ15
08)。該単語に対応する訳語と一致するものが第2単
語分割テーブル42中の同じ文番号の行中にあれば、そ
れと第1単語分割テーブル41の該単語は対応関係にあ
ると言える。第2単語分割テーブル42の同じ文番号の
行の中に「paper」がなく、且つ、該単語に未処理
の訳語が残ってなければ、図8に示すような対応関係決
定テーブル43に、対応する訳語なしの意味の「??
?」とともに格納する(ステップ1509)。対応関係
が求められた「用紙」と「paper」についても、図
8に示すような対応関係決定テーブル43に格納する
(ステップ1510)。図8において431には抽出さ
れた全対応関係の組合せの番号を格納し、432には原
テキストの単語、433には翻訳テキストの単語を格納
している。433に「???」がある原テキストの単語
は対応する訳語がないということを示している。第1単
語分割テーブル41の文番号1の行の全ての単語につい
て、上記処理動作を繰り返し、一つの単語についての検
索が終わったら、次の単語へ進み(ステップ150
5)、一つの文が終わったら(ステップ1511)、次
の行、すなわち、次の文へ移り(ステップ1512)、
第1単語分割テーブル41中の全ての単語についての処
理が終了したら(ステップ1501)、対応関係決定テ
ーブル43を作成する処理動作を終える。
FIG. 6 is a flow chart showing the processing operation (step 15) of creating the correspondence relationship determination table 43 of FIG. The processing operation will be described in detail with reference to FIG. In the first word division table 41 of FIG. 4, the 1st sentence of 411 and the 1st word of “412” “paper” are extracted (step 1
502), the bilingual dictionary 3 is searched for the word (step 1503). FIG. 7 shows the structure and contents of the bilingual dictionary 3. In FIG. 7, 31 is a Japanese word,
Reference numeral 32 indicates a part of speech of the word, 33 indicates a type of inflection when the part of speech of the word is a verb / adjective, and 34 indicates an English translation corresponding to the word. In the example of FIG. 7, a plurality of English translations of “paper” are registered as “paper” and “form”. First, the “paper”
"r" (step 1506), all words of the sentence 1 of 421 in the second word division table 42 of FIG. 5 are searched (step 1507), and the extracted translated word, that is,
Find the one that matches "paper" (step 15)
08). If there is a match with the translated word corresponding to the word in the line of the same sentence number in the second word division table 42, it can be said that the word in the first word division table 41 has a correspondence relationship. If there is no "paper" in the line of the same sentence number in the second word division table 42 and there is no unprocessed translated word in the word, the correspondence relation determination table 43 as shown in FIG. Meaning "??"
? Is stored together with “” (step 1509). The "paper" and the "paper" for which the correspondence has been obtained are also stored in the correspondence determination table 43 as shown in FIG. 8 (step 1510). In FIG. 8, 431 stores the numbers of the combinations of the extracted all correspondences, 432 stores the words of the original text, and 433 stores the words of the translated text. A word in the original text with "???" in 433 indicates that there is no corresponding translation. The above processing operation is repeated for all the words in the row of sentence number 1 of the first word division table 41, and when the search for one word is completed, the process proceeds to the next word (step 150).
5) When one sentence ends (step 1511), move to the next line, that is, the next sentence (step 1512),
When the processing for all the words in the first word division table 41 is completed (step 1501), the processing operation for creating the correspondence relationship determination table 43 is completed.

【0010】次に、対応関係決定ーブル43中から、原
単語に対応する訳語の統一がとれていない対応関係を抽
出する(ステップ16)。図9は、特に、原単語に対応
する訳語の統一がとれていないという警告を出す対象と
なる対応関係を、対応関係決定テーブル43から、抽出
する処理動作を示したフローチャートである。図9に沿
って該処理動作を詳述する。図1のメインメモリ2中の
処理プログラムは、次に、図9の対応関係決定テーブル
43から1組目「用紙−paper」の原テキストの単
語「用紙」を抽出して(ステップ1602)、どの対応
関係の組を抽出すれば良いのかを記憶しておくために組
番号1を変数COUNTに代入しておく(ステップ16
03)。それから、抽出した1組目の原テキストの単語
「用紙」を、第1単語変数に格納し(ステップ160
4)、同じ組の翻訳テキストの単語「paper」を抽
出して第2単語変数に代入する(ステップ1605)。
2組目、3組目、4組目と進みながら(ステップ161
0)、第1単語変数中の原テキストの単語と一致する単
語が、対応関係決定テーブル43中にないかを探す(ス
テップ1607)。対応関係決定テーブル43中を検索
し終わっても(ステップ1606)、一致する単語が見
つからなければ、該原単語は原テキスト中に1つしか存
在せず、従って訳語の統一の有無を調べる必要がないの
で、変数COUNTを1つ増やした値の番号の組、この
場合は対応関係決定テーブル43の2組目の「プリント
−print」の対応関係へ移る(ステップ160
8)。一致する単語をみつけた場合(ステップ160
9)には、それに対応する訳語と第2単語変数中の翻訳
テキストの単語の文字列を比較する(ステップ161
1)。ここでは、対応関係決定テーブル43の4組目に
第1単語変数中の原テキストの単語「用紙」と一致する
文字列が存在する。そこで、4組目の翻訳テキストの単
語「form」を抽出する。該単語と第2単語変数中の
翻訳テキストの単語が一致すれば、訳語の統一がとれて
いるので、次の組へ進み(ステップ1610)、ステッ
プ1607、ステップ1609を繰り返す。ここでは、
第2単語変数中の翻訳テキストの単語は「paper」
なので、両者は一致しない。つまり、原テキストの「用
紙」という単語には「paper」と「form」とい
う2つの異なった訳語が割り当てられていることが分か
る。そこで、第1単語変数の文字列「用紙」と第2単語
変数の文字列「paper」、「form」を図10の
警告情報テーブル44に格納する(ステップ161
2)。図10の警告情報テーブル44において、441
は警告情報を表示する対応関係の組の数、442は原テ
キストの単語、443は翻訳テキスト中で該単語に割り
当てられている訳語の数、444は翻訳テキスト中で該
単語に割り当てられている訳語を格納している。警告情
報テーブル44に格納されている対応関係のうち、2組
目の原テキストの単語「キー」に対応しているのは「k
ey」と「???」であるが、これは、「キー」の訳語
の一つが「ky」とスペルミスになっているため対応関
係が付けられずに、特別の対応関係を持っているという
ことを示している。こうして対応関係決定テーブル43
中の全ての組に対して、上記検索処理を行って対応関係
決定テーブル43が終了したら(ステップ1601)、
該処理動作を終了する。
Next, from the correspondence relation determination table 43, correspondence relations in which the translated words corresponding to the original words are not unified are extracted (step 16). FIG. 9 is a flowchart showing a processing operation for extracting, from the correspondence relationship determination table 43, a correspondence relationship that is a target for issuing a warning that the translated words corresponding to the original word are not unified. The processing operation will be described in detail with reference to FIG. The processing program in the main memory 2 of FIG. 1 then extracts the word “paper” of the original text of the first set “paper-paper” from the correspondence determination table 43 of FIG. 9 (step 1602), which The group number 1 is assigned to the variable COUNT in order to store whether to extract the group of the correspondence relationship (step 16).
03). Then, the extracted word "paper" of the first set of original texts is stored in the first word variable (step 160).
4) The word "paper" of the same set of translated texts is extracted and assigned to the second word variable (step 1605).
While proceeding to the second, third, and fourth groups (step 161
0), the word matching the original text in the first word variable is searched for in the correspondence determination table 43 (step 1607). If the matching word is not found even after the search in the correspondence relationship determination table 43 is completed (step 1606), there is only one original word in the original text, and therefore it is necessary to check whether or not the translated words are unified. Since there is no variable, the variable COUNT is incremented by 1, and in this case, the correspondence relation of the second set "print-print" of the correspondence relation determination table 43 is moved to (step 160).
8). If a matching word is found (step 160)
In 9), the corresponding translated word and the character string of the word of the translated text in the second word variable are compared (step 161).
1). Here, a character string that matches the word “paper” of the original text in the first word variable exists in the fourth set of the correspondence determination table 43. Therefore, the word "form" of the fourth set of translated text is extracted. If the word and the word of the translated text in the second word variable match, the translated words have been unified, so the process proceeds to the next group (step 1610), and steps 1607 and 1609 are repeated. here,
The word of the translated text in the second word variable is "paper"
So the two do not match. That is, it can be seen that the word "paper" in the original text is assigned with two different translations "paper" and "form". Therefore, the character string "paper" of the first word variable and the character strings "paper" and "form" of the second word variable are stored in the warning information table 44 of FIG. 10 (step 161).
2). In the warning information table 44 of FIG. 10, 441
Is the number of sets of correspondences displaying warning information, 442 is the word of the original text, 443 is the number of translated words assigned to the word in the translated text, 444 is assigned to the word in the translated text Stores translated words. Of the correspondences stored in the warning information table 44, the word “key” of the second set of original texts corresponds to “k”.
"ey" and "???", but because one of the translated words of "key" is misspelled with "ky", there is no corresponding relationship and it has a special corresponding relationship. It is shown that. Thus, the correspondence determination table 43
When the above-mentioned search processing is performed for all the groups in the inside and the correspondence relationship determination table 43 ends (step 1601),
The processing operation ends.

【0011】そして、警告情報テーブル44に格納され
ている対応関係について、表示装置7に図11の如く強
調表示あるいはサマリー表示する(ステップ17)。強
調表示の方式として、特開昭58−101365で開示
されている方式を用いることが可能である。上記警告情
報の表示については、例えば、日本語の「いう」のよう
に英語において訳し分けが必要なものについて、作業者
が故意に異なった訳語を選んでいる場合は、それらに関
する訳語不統一の警告表示はかえって煩わしいので、作
業者が検出不要の単語を指定できるものとする。
Then, the correspondence relationship stored in the warning information table 44 is highlighted or summarized on the display device 7 as shown in FIG. 11 (step 17). As the highlighting method, the method disclosed in Japanese Patent Laid-Open No. 58-101365 can be used. Regarding the display of the above warning information, for example, if the operator intentionally selects different translated words such as Japanese "i" that need to be translated in English, it is possible that Since the warning display is rather annoying, it is assumed that the operator can specify a word that does not need to be detected.

【0012】また、本発明の他の実施例として、第1の
テキストに原テキストの代わりに機械翻訳しただけのテ
キストを用い、第2のテキストに翻訳テキストの代わり
に機械翻訳結果を後編集した翻訳テキストを用いれば、
原テキストがなくても前述した本発明の一実施例と同じ
効果をあげることができる。本実施例の場合、対応関係
決定テーブルを作成する処理において、前述した本発明
の一実施例では対訳辞書を参照して第1単語分割テーブ
ルの単語の訳語を求めた上で該訳語を第2単語分割テー
ブルから検索したのに対して、第1単語分割テーブルの
単語を直接第2単語分割テーブルから検索すれば良いた
め、処理が簡略化される。
As another embodiment of the present invention, a text that has been machine translated is used as the first text instead of the original text, and the machine translation result is post-edited as the second text instead of the translated text. With translated text,
Even if there is no original text, the same effect as the above-described embodiment of the present invention can be obtained. In the case of the present embodiment, in the process of creating the correspondence relationship determination table, in the above-described embodiment of the present invention, the translated word of the word in the first word division table is obtained by referring to the bilingual dictionary, and then the translated word is set to the second word. While the word division table is searched, the words in the first word division table may be directly searched from the second word division table, so that the process is simplified.

【0013】[0013]

【発明の効果】以上詳細に述べたごとく、本発明によれ
ば、機械翻訳処理装置によって翻訳し、人手によって後
編集されたテキストから、不統一になっている訳語ある
いはスペルミスが生じている訳語を自動的に検出するこ
とができ、訳語の統一あるいはスペルミスの修正を能率
良く行うことができる。そのため、翻訳テキストを分割
して、複数の作業者が後編集作業にあたった後、それら
のテキストをマージして、複数の作業者が後編集作業を
行ったために、原単語に対して不統一になった訳語を統
一しなおすといった方式が可能となり、その結果、機械
翻訳処理装置によって翻訳されたテキストに対する後編
集作業に関して、後編集作業全体にかかる時間を短縮さ
せ、労力を軽減するという顕著な効果が生ずる。
As described above in detail, according to the present invention, a translated word having a non-uniform or a misspelled word is extracted from a text translated by a machine translation processor and post-edited manually. It can be automatically detected, and the translations can be unified or spelling errors can be corrected efficiently. Therefore, the translated text is divided, and after multiple workers perform post-editing work, those texts are merged and post-editing work is performed by multiple workers. It becomes possible to unify the translated words, and as a result, regarding the post-editing work on the text translated by the machine translation processing device, the time required for the whole post-editing work is shortened and the labor is remarkably reduced. The effect occurs.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の装置のブロック図である。FIG. 1 is a block diagram of an apparatus according to an embodiment of the present invention.

【図2】本発明の一実施例の処理動作を示すフローチャ
ートである。
FIG. 2 is a flowchart showing a processing operation of an embodiment of the present invention.

【図3】本発明の一実施例における単語分割テーブルを
作成する処理動作を示すフローチャートである。
FIG. 3 is a flowchart showing a processing operation for creating a word division table in an embodiment of the present invention.

【図4】本発明の一実施例における原テキストを単語分
割した結果を表す第1単語分割テーブルである。
FIG. 4 is a first word division table showing a result of word division of an original text according to an embodiment of the present invention.

【図5】本発明の一実施例における翻訳テキストを単語
分割した結果を表す第2単語分割テーブルである。
FIG. 5 is a second word division table showing a result of word division of the translated text according to the embodiment of the present invention.

【図6】本発明の一実施例における対応関係決定テーブ
ルを作成する処理動作を示すフローチャートである。
FIG. 6 is a flowchart showing a processing operation for creating a correspondence relationship determination table in an embodiment of the present invention.

【図7】本発明の一実施例において利用される対訳辞書
の構造と内容を示す図である。
FIG. 7 is a diagram showing the structure and contents of a bilingual dictionary used in an embodiment of the present invention.

【図8】本発明の一実施例における原テキストの単語と
翻訳テキストの単語を対応づけた対応関係決定テーブル
である。
FIG. 8 is a correspondence relationship determination table in which a word of an original text and a word of a translated text are associated with each other according to an embodiment of the present invention.

【図9】本発明の一実施例における警告情報テーブルを
作成する処理動作を示すフローチャートである。
FIG. 9 is a flowchart showing a processing operation for creating a warning information table in the embodiment of the present invention.

【図10】本発明の一実施例における画面に警告表示す
る必要のある対応関係を抽出した警告情報テーブルであ
る。
FIG. 10 is a warning information table in which correspondences that need to be displayed as warnings on a screen according to an embodiment of the present invention are extracted.

【図11】本発明の一実施例における処理に伴う表示画
面の例を示す図である。
FIG. 11 is a diagram showing an example of a display screen associated with processing in an embodiment of the present invention.

【符号の説明】 1 解析処理プロセッサ 2 メインメモリ 3 辞書用メモリ 4 訳語チェック用メモリ 41 第1単語分割テーブル 42 第2単語分割テーブル 43 対応関係決定テーブル 44 警告情報テーブル 5 文書ファイル 6 キーボード 7 表示装置[Explanation of Codes] 1 Analysis Processor 2 Main Memory 3 Dictionary Memory 4 Translated Word Check Memory 41 First Word Division Table 42 Second Word Division Table 43 Correspondence Determination Table 44 Warning Information Table 5 Document File 6 Keyboard 7 Display Device

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 第1の自然言語により記述された第1の
テキストを第2の自然言語により記述された第2のテキ
ストに翻訳し、後編集作業を行った後、第1のテキスト
の最小構文要素単位に対応する第2のテキストの最小構
文要素単位が不統一になった場合、不統一な対応関係に
ついて警告表示することを特徴とする訳語不統一検出方
法。
1. A method of translating a first text described in a first natural language into a second text described in a second natural language, performing post-editing work, and then converting the minimum of the first text. A translated word inconsistency detection method characterized in that when the minimum syntactic element unit of the second text corresponding to a syntactic element unit becomes inconsistent, a warning is displayed about the inconsistent correspondence.
【請求項2】 請求項1記載の訳語不統一検出方法であ
って、第1のテキストを最小構文要素単位に分割して第
1のテーブルに記憶するステップ、第2のテキストを最
小構文要素単位に分割して第2のテーブルに記憶するス
テップ、対訳辞書を利用して第1のテキストの最小構文
要素単位と第2のテキストの最小構文要素単位を対応付
けて第3のテーブルに記憶するステップ、第2のテキス
トの最小構文要素単位との対応関係が不統一になってい
る第1のテキストの最小構文要素単位を第3のテーブル
より抽出するステップ、抽出した対応関係が不統一であ
ることを表示画面に表示するステップから成ることを特
徴とする訳語不統一検出方法。
2. The method for detecting inconsistency of translations according to claim 1, wherein the first text is divided into minimum syntax element units and stored in a first table, and the second text is divided into minimum syntax element units. And storing in the second table by using the bilingual dictionary and associating the minimum syntax element unit of the first text with the minimum syntax element unit of the second text in the third table The step of extracting the minimum syntactical element unit of the first text from the third table in which the correspondence with the minimum syntactical element unit of the second text is inconsistent, the extracted correspondence relation being inconsistent Is displayed on the display screen.
【請求項3】 第1の自然言語により記述されたテキス
トを第2の自然言語に第1のテキストとして機械翻訳
し、第1のテキストを第2のテキストとして後編集した
後、第1のテキストの最小構文要素単位に対応する第2
のテキストの最小構文要素単位が不統一になった場合、
不統一な対応関係について警告表示することを特徴とす
る訳語不統一検出方法。
3. A first text after machine-translating a text described in a first natural language into a second natural language as a first text and post-editing the first text as a second text. The second corresponding to the smallest syntax element unit of
If the minimum syntactic element unit of the text of
A method for detecting inconsistency in translated words, which is characterized by displaying a warning about inconsistent correspondence.
【請求項4】 請求項3記載の訳語不統一検出方法であ
って、第1のテキストを最小構文要素単位に分割して第
1のテーブルに記憶するステップ、第2のテキストを最
小構文要素単位に分割して第2のテーブルに記憶するス
テップ、第1のテキストの最小構文要素単位と第2のテ
キストの最小構文要素単位を対応付けて第3のテーブル
に記憶するステップ、第2のテキストの最小構文要素単
位との対応関係が不一致になっている第1のテキストの
最小構文要素単位を第3のテーブルより抽出するステッ
プ、抽出した対応関係が不一致であることを表示画面に
表示するステップから成ることを特徴とする訳語不統一
検出方法。
4. The method for detecting inconsistency of translations according to claim 3, wherein the first text is divided into minimum syntax element units and stored in the first table, and the second text is divided into minimum syntax element units. And storing in the second table, and storing in the third table in association with the minimum syntax element unit of the first text and the minimum syntax element unit of the second text. From the step of extracting from the third table the minimum syntax element unit of the first text in which the correspondence relationship with the minimum syntax element unit does not match, and the step of displaying on the display screen that the extracted correspondence relationship does not match A method for detecting inconsistency in translated words, which is characterized by being formed.
【請求項5】 解析処理プロセッサ、メインメモリ、辞
書用メモリ、訳語チェック用メモリ、文書ファイル、キ
ーボード及び表示装置からなり、第1の自然言語により
記述された第1のテキストを第2の自然言語により記述
された第2のテキストに翻訳し、後編集する手段と、第
1のテキストを最小構文要素単位に分割する手段と、第
2のテキストを最小構文要素単位に分割する手段と、対
訳辞書を利用して第1のテキストの最小構文要素単位と
第2のテキストの最小構文要素単位を対応付ける手段
と、第2のテキストの最小構文要素単位との対応関係が
不統一になっている第1のテキストの最小構文要素単位
を抽出する手段と、抽出した対応関係が不統一であるこ
とを表示する手段を有することを特徴とする訳語不統一
検出装置。
5. An analysis processor, a main memory, a dictionary memory, a word translation memory, a document file, a keyboard and a display device, wherein the first text described in the first natural language is converted into the second natural language. Means for translating and post-editing into a second text described by, a means for dividing the first text into minimum syntax element units, a means for dividing the second text into minimum syntax element units, and a bilingual dictionary A means for associating the minimum syntactical element unit of the first text with the minimum syntactical element unit of the second text by utilizing, and the correspondence relation between the minimum syntactical element unit of the second text are inconsistent. An apparatus for detecting inconsistency in translated words, comprising means for extracting the minimum syntactical element unit of the text and means for displaying that the extracted correspondence is inconsistent.
【請求項6】 解析処理プロセッサ、メインメモリ、辞
書用メモリ、訳語チェック用メモリ、文書ファイル、キ
ーボード及び表示装置からなり、第1の自然言語により
記述されたテキストを第2の自然言語に第1のテキスト
として機械翻訳する手段と、第1のテキストを第2のテ
キストとして後編集する手段と、第1のテキストを最小
構文要素単位に分割する手段と、第2のテキストを最小
構文要素単位に分割する手段と、第1のテキストの最小
構文要素単位と第2のテキストの最小構文要素単位を対
応付ける手段と、第2のテキストの最小構文要素単位と
の対応関係が不一致になっている第1のテキストの最小
構文要素単位を抽出する手段と、抽出した対応関係が不
一致であることを表示する手段を有することを特徴とす
る訳語不統一検出装置。
6. An analysis processor, a main memory, a dictionary memory, a translation check memory, a document file, a keyboard, and a display device, wherein the text described in the first natural language is converted into the second natural language in the first natural language. Means for machine-translating the text as a text, a means for post-editing the first text as a second text, a means for dividing the first text into minimum syntax element units, and a second text as a minimum syntax element unit. A first means in which the correspondence between the dividing means, the means for associating the minimum syntax element unit of the first text with the minimum syntax element unit of the second text, and the minimum syntax element unit of the second text do not match. A united word inconsistency detection device characterized by having means for extracting the minimum syntactical element unit of the text of the text and means for displaying the fact that the extracted correspondences do not match. Place
JP3285742A 1991-10-04 1991-10-04 Method and device for detecting nonuniformity of translated word Pending JPH05101095A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3285742A JPH05101095A (en) 1991-10-04 1991-10-04 Method and device for detecting nonuniformity of translated word

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3285742A JPH05101095A (en) 1991-10-04 1991-10-04 Method and device for detecting nonuniformity of translated word

Publications (1)

Publication Number Publication Date
JPH05101095A true JPH05101095A (en) 1993-04-23

Family

ID=17695464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3285742A Pending JPH05101095A (en) 1991-10-04 1991-10-04 Method and device for detecting nonuniformity of translated word

Country Status (1)

Country Link
JP (1) JPH05101095A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8719002B2 (en) 2009-01-15 2014-05-06 International Business Machines Corporation Revising content translations using shared translation databases

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8719002B2 (en) 2009-01-15 2014-05-06 International Business Machines Corporation Revising content translations using shared translation databases

Similar Documents

Publication Publication Date Title
US20070233460A1 (en) Computer-Implemented Method for Use in a Translation System
US5396419A (en) Pre-edit support method and apparatus
JPS63305463A (en) Natural language processing system
GB2241094A (en) Translation machine
JP2020190970A (en) Document processing device, method therefor, and program
JPH0658676B2 (en) How to proofread multiple parts of speech
US20040054677A1 (en) Method for processing text in a computer and a computer
JPH05101095A (en) Method and device for detecting nonuniformity of translated word
JP3085394B2 (en) Translated word selection method in multi-sentence translation and machine translation system using the same
JPS6118074A (en) Pre-editing system
JP3323517B2 (en) Machine translation equipment
JP4007630B2 (en) Bilingual example sentence registration device
JPH0696266A (en) Correction supporting system for character recognition result
JPH05151256A (en) Machine translation method and its system
KR20080029567A (en) Method and apparatus for automatically selecting a corresponding translation of a new word using bilingual corpus
JPH06337895A (en) Method for selecting translation word and device for preparing dictionary for unification of translation word
JP2871300B2 (en) Machine translation equipment
JP2893239B2 (en) Translation support dictionary search and display system
JPH05298354A (en) Method and device for detecting inconsistency of translated words
JPS6368972A (en) Unregistered word processing system
JPH07182342A (en) Machine translation system
Triantafyllou et al. An alignment architecture for Translation Memory bootstrapping
JPH04158477A (en) Machine translation device
JPH0713822B2 (en) How to translate
JPS63317879A (en) Display method for interim result of translation