JP2010287149A - Bilingual document proofreading apparatus - Google Patents

Bilingual document proofreading apparatus Download PDF

Info

Publication number
JP2010287149A
JP2010287149A JP2009141986A JP2009141986A JP2010287149A JP 2010287149 A JP2010287149 A JP 2010287149A JP 2009141986 A JP2009141986 A JP 2009141986A JP 2009141986 A JP2009141986 A JP 2009141986A JP 2010287149 A JP2010287149 A JP 2010287149A
Authority
JP
Japan
Prior art keywords
proofreading
document
language
content
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009141986A
Other languages
Japanese (ja)
Other versions
JP5508766B2 (en
Inventor
Miwako Shimazu
美和子 島津
Yumiko Yoshimura
裕美子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009141986A priority Critical patent/JP5508766B2/en
Publication of JP2010287149A publication Critical patent/JP2010287149A/en
Application granted granted Critical
Publication of JP5508766B2 publication Critical patent/JP5508766B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a bilingual document proofreading apparatus that determines whether proofreading is suitable even when both first language document and second language document have been proofread. <P>SOLUTION: A document analysis means 28 analyzes an unproofread first language document, an unproofread second language document, a proofread first language document and a proofread second language document. A proofreading classification means 30 compares the proofread first language document with the unproofread first language document and the proofread second language document with the unproofread second language document according to the analysis information to classify proofreadings into proofreading classes. A proofreading suitability determination means 32 determines whether the proofreadings are suitable according to the analysis information and proofreading classes. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、校正前の第一言語文書と校正前の第二言語文書との対訳文書を校正する対訳文書校正装置に関する。   The present invention relates to a bilingual document proofreading apparatus that proofreads a bilingual document of a first language document before proofreading and a second language document before proofreading.

グローバル化の進展とともに様々な文書を英語その他の外国語に翻訳したり、逆に外国語の文書を日本語化するニーズがますます高まっている。自然言語処理技術の発達により、機械翻訳技術も向上し、翻訳する必要のある文書をコストや速度度の面で人手による翻訳よりも優れ、機械翻訳を使うことも増えた。その一方で、機械翻訳の翻訳結果を容認可能な文書とするには、人手の介在をなお必要とする。翻訳品質が特に重要視される文書では、特にこの必要性が高い。   With the progress of globalization, there is a growing need for translating various documents into English and other foreign languages, and vice versa. With the development of natural language processing technology, machine translation technology has also improved. Documents that need to be translated are superior to manual translation in terms of cost and speed, and use of machine translation has increased. On the other hand, manual intervention is still necessary to make the translation result of machine translation an acceptable document. This is especially true for documents where translation quality is particularly important.

翻訳する必要のある文書は、原文文書の配布とほぼ同時に外国語を母国語とする読者に配布するために、原稿の初稿段階で翻訳依頼が出されることが多い。翻訳者が初稿を翻訳している間、原文の筆者は原稿に推敲を重ね、初稿との差分が増えていくことが多い。最終稿が完成すると、翻訳者は、初稿と終稿とを比較し、その間の差異がどのようなものであるかを判断し、さらに初稿の該当箇所を検出し必要な修正を行っていた。この作業は翻訳者に多大な負担を強いるものであった。   Documents that need to be translated are often requested to be translated at the initial draft stage of the manuscript to be distributed to readers whose native language is a foreign language almost simultaneously with the distribution of the original document. While the translator is translating the first draft, the original author often reviews the manuscript and increases the difference from the first draft. When the final draft was completed, the translator compared the first draft with the final draft to determine what the difference between them was, and detected the corresponding portions of the first draft and made necessary corrections. This work put a great burden on the translator.

また、人手による翻訳の場合、最低条件として原文書の言語と翻訳目的の言語の両方の知識を有していることが必須であるが、その知識量は同程度ということは少なく、ほとんどの場合、どちらかが優勢である。つまり、日本語の文書を英語に翻訳する場合、日本語を母国語とし、英語を外国語とする者により行われることが多く、一旦、この翻訳者が翻訳を終えると、より自然な翻訳文書のために、ネイティブチェックという作業を踏むことがしばしばある。   In the case of manual translation, it is indispensable to have knowledge of both the language of the original document and the language for translation as a minimum requirement, but the amount of knowledge is rarely the same, and in most cases , Either is dominant. In other words, when a Japanese document is translated into English, it is often done by a person whose native language is Japanese and English is a foreign language. For this reason, there is often a native check.

しかし、このネイティブチェックには問題がないこともない。第一に、ネイティブチェックを行う作業者は原言語の知識を有している場合と、原言語の知識を有していない場合とがある。原言語の知識を有していない場合、作業者は原文書を参照せずに、翻訳された文書のみを見て校正を行うため、校正結果が原文書の趣旨に沿っている保証はない。また、それとは無関係にそもそもネイティブチェックをそのように定義しているところもある。   However, this native check is not without problems. First, the worker who performs the native check may have knowledge of the source language or may not have knowledge of the source language. If the operator does not have knowledge of the original language, the operator does not refer to the original document and proofreads only by looking at the translated document. Therefore, there is no guarantee that the proofreading result is in accordance with the purpose of the original document. In addition, there are places where native checks are defined as such.

例えば、http://www.eigo-honyaku.jp/term/process/nativecheck.htmlでは、「ネイティブチェックを行う者をネイティブチェッカーと呼ぶ。ネイティブチェッカーは、原文に目を通す必要がなく、訳文のみをチェックし、訳文に関する専門性は問われない。」としている。   For example, in http://www.eigo-honyaku.jp/term/process/nativecheck.html, “The person who performs the native check is called the native checker. "There is no question about the expertise of the translation."

第二に、作業者が原言語の知識を多少なりとも持ち合わせていても、現実はhttp://777ch.info/でも触れられているように、「大抵、翻訳能力までは無く、…原文との突合せチェックまで行わずに翻訳された訳文を流し読みし、あまりにひどい部分を表面的に手直しする程度である。そして、仮に表面上うまく取り繕われていたとしても、内部に重大な不具合が潜んでいる可能性があり、表面上うまく作文されてしまうと、一層、誤訳などの問題に気付きにくくなる」のである。   Secondly, even if the worker has some knowledge of the source language, the reality is as mentioned in http://777ch.info/. The translated text is scanned without going through the reconciliation check, and the excessively terrible part is reworked on the surface, and even if it is repaired well on the surface, there is a serious defect inside. If you write well on the surface, it becomes even more difficult to notice problems such as mistranslations. "

このため、ネイティブチェックの効果を最大限に利用するには、両方の言語に精通している専門の翻訳家がその校正結果を吟味することが必要となる。このケースも種類は違うが第一のケースと同様、3種の文書を参照することが求められる。すなわち、ネイティブチェック前の翻訳文書とネイティブチェックを反映した翻訳文書、原文書の3者である。従ってこの確認作業も作業者に多大な負担をかけることになる。   For this reason, in order to make the best use of the effects of native checking, it is necessary for a professional translator who is familiar with both languages to examine the proofreading results. Although this case is also of a different type, it is required to refer to three types of documents as in the first case. In other words, the translation document before the native check, the translation document reflecting the native check, and the original document. Therefore, this confirmation work places a great burden on the operator.

このような翻訳チェック作業を行う場合に、表示手段に原文と訳文とが表示されている場合に、入力手段により原文が訂正された訂正原文が入力された際に、訂正原文と原文とを比較して、訂正原文が原文の手直しに該当するか否かを判別し、原文の手直しに該当すると判断された際には、訂正原文が翻訳された訂正訳文と、原文が翻訳された訳文とを比較して、両者の差分を識別表示し、訳文と訂正訳文との相違を容易に認識可能として、翻訳作業の効率を向上させ得るようにしたものがある(例えば、特許文献1参照)。   When such a translation check operation is performed, when the original text and the translated text are displayed on the display means, when the corrected original text corrected by the input means is input, the corrected original text is compared with the original text. Then, it is determined whether or not the corrected original corresponds to the reworking of the original, and when it is determined that the corrected original corresponds to the reworking of the original, the corrected translated text in which the corrected original is translated and the translated text in which the original is translated are determined. In comparison, the difference between the two is identified and displayed so that the difference between the translated text and the corrected translated text can be easily recognized, thereby improving the efficiency of the translation work (for example, see Patent Document 1).

すなわち、望ましくない訳文があったときに、訳文ではなく該当する原文に手を入れ、それを再度機械翻訳して所望の訳文を採用する。ここで原文に対して行われた変更が発明者のいう「手直し」の基準に該当するときは、変更前と変更後の機械翻訳結果の差分を識別表示し、作業者はいずれかを採用する。「手直し」に相当せず、非類似と判断されるときは、変更後の原文の機械翻訳結果をそのまま表示する。手直しの判断基準は例えば、以下のようなものである。   In other words, when there is an undesired translation, the corresponding original sentence is handled instead of the translation, and the desired translation is adopted by machine translation again. If the changes made to the original text correspond to the “rework” criteria that the inventor says, the difference between the machine translation results before and after the change is identified and displayed, and the operator adopts either . When it is determined that the result is not similar to “rework” and is not similar, the machine translation result of the original after the change is displayed as it is. The judgment criteria for reworking are as follows, for example.

(1)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字の数が所定数以下である。 (1) The number of characters that differ between the original text and the corrected original text or between the translated text and the corrected translated text is equal to or less than a predetermined number.

(2)原文と訂正原文との間、又は訳文と訂正訳文との間で相違する文字が表記の相違のみである。 (2) Characters that differ between the original text and the corrected original text or between the translated text and the corrected translated text are only differences in notation.

(3)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、その順序のみが相違する。 (3) When the original sentence and the corrected original sentence, or the translated sentence and the corrected translated sentence are divided by words, only the order is different.

(4)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語同士が同義語として辞書に記憶されている関係にある。 (4) When the original text and the corrected original text, or the translated text and the corrected translated text are divided by words, different words are stored in the dictionary as synonyms.

(5)原文と訂正原文、又は訳文と訂正訳文とを単語で分割した場合に、相違する単語の数が所定数以下である。 (5) When the original sentence and the corrected original sentence, or the translated sentence and the corrected translated sentence are divided into words, the number of different words is equal to or less than a predetermined number.

特許文献1のものでは、訳文に対する変更が加えられた場合のチェックの方法として、機械翻訳の訳文に対して変更が加えられ、かつその変更後の訳文が「手直し」に相当すると判断された場合には、逆翻訳機能を備えた機械翻訳プログラムを用いて変更前の訳文と変更後の訳文を原言語に翻訳し、両者の差分を識別表示する。作業者はいずれかを選択することになる。   In the case of Patent Document 1, when a change is made to a translation, a change is made to the translation of the machine translation, and it is determined that the translation after the change corresponds to “rework” The machine translation program having a reverse translation function is used to translate the translation before the change and the translation after the change into the original language, and the difference between the two is identified and displayed. The operator selects either one.

また、第1の自然言語の入力文から機械翻訳された第2の自然言語の機械翻訳文を自動的に校正するものとして、話し言葉を機械翻訳した結果に対し、作業者が校正した後の訳文を機械翻訳の訳文と比較し、そこから校正規則を自動的に導き出し、校正対象文に対して生成された校正規則を適用することにより自動的に校正するようにしたものがある(例えば、特許文献2参照)。   In addition, the second natural language machine translation sentence machine-translated from the first natural language input sentence is automatically proofread, and the translated sentence after the operator proofreads the result of machine translation of the spoken language. Is compared with the translation of machine translation, the proofreading rule is automatically derived from it, and the proofreading rule is automatically applied by applying the generated proofreading rule to the proofreading sentence (for example, patent Reference 2).

また、翻訳されていない原文と類似している原文をもつ対訳データから訳文を取得し、その訳文を翻訳対象の原文と類似原文を比較し、その差分のみを翻訳するようにして翻訳作業の効率化を図るようにしたものがある(例えば、特許文献3参照)。   In addition, the translation is obtained from the parallel translation data that has the original similar to the untranslated original, and the translation is compared with the original to be translated and the similar original and only the difference is translated. There are some which have been designed to be realized (see, for example, Patent Document 3).

特開2006−178682号公報JP 2006-178682 A 特許第3387437号公報Japanese Patent No. 3387437 特開平11−272671号公報JP 11-272671 A

ところが、従来のものでは、翻訳対象となる原文を機械翻訳した結果を校正して、より品質の高い訳文を作成するケースを扱っているが、意訳も含み得る人手で行われた翻訳結果に対して行われた校正内容の妥当性を判断することはしていなかった。   However, the conventional version deals with the case of creating a higher-quality translation by proofreading the result of machine translation of the original text to be translated. We did not judge the validity of the proofreading performed.

そのため、作業者は校正によって生じた校正前の原文や訳文と校正後の原文や訳文を比較し、その差分を検出し、差分があったすべての箇所について、校正後の原文あるいは訳文が妥当であるかを判断し、必要に応じて原文あるいは訳文に必要な変更を加えなければならず、多大な作業コストが課されていた。   Therefore, the operator compares the original text or translation before and after the proofreading with the original text or translation after the proofreading, detects the difference, and the corrected text or translation is valid for all the differences. It was necessary to determine whether it was present, and to make necessary changes to the original or translated text as necessary, which entailed significant work costs.

本発明の目的は、第一言語文書及び第二言語文書の双方を校正した場合であっても校正内容の適性を判断できる対訳文書校正装置を提供することである。   An object of the present invention is to provide a bilingual document proofreading apparatus that can determine the suitability of proofreading contents even when both a first language document and a second language document are proofread.

本発明に係わる対訳文書校正装置は、対訳文書校正プログラム及び翻訳辞書部を記憶した記憶装置と、第一言語文書及びその翻訳結果である第二言語文書に関し、校正前の第一言語文書、校正前の第二言語文書、校正後の第一言語文書及び校正後の第二言語文書を入力するとともに操作に必要な情報を入力する入力装置と、対訳文書校正の際に必要とする情報を表示する表示装置と、前記対訳文書校正プログラムを演算実行する演算制御装置とを備えた対訳文書校正装置において、前記入力装置から入力された校正前の第一言語文書と校正前の第二言語文書とを対にし、校正後の第一言語文書と校正後の第二言語文書とを対にして対訳文書として記憶する対訳文書記憶部と、前記翻訳辞書部を用いて前記対訳文書記憶部に記憶された校正前の第一言語文書、校正前の第二言語文書、校正後の第一言語文書及び校正後の第二言語文書を解析しその解析情報を解析情報記憶部に記憶する文書解析手段と、前記解析情報記憶部に記憶された解析情報に基づいて、校正前の第一言語文書と校正後の第一言語文書、及び校正前の第二言語文書と校正後の第二言語文書とを比較し、校正内容を分類してその校正分類を校正分類記憶部に記憶する校正内容分類手段と、前記解析情報記憶部に記憶された解析情報及び前記校正分類記憶部に記憶された校正分類とに基づいて前記校正内容の適性を判断し、その校正内容適性結果を表示装置に表示出力する校正内容適性判断手段と、前記表示装置に表示された校正内容適性結果の確認操作を運用者に対して促すとともに運用者から前記入力装置を介して入力された操作指令に基づき校正後の第一言語文書や校正後の第二言語文書の校正内容の確認操作を行う校正内容確認操作手段とを備えたことを特徴とする。   The bilingual document proofreading apparatus according to the present invention relates to a storage device storing a bilingual document proofreading program and a translation dictionary unit, a first language document and a second language document as a result of the translation. Input device for inputting previous second language document, first language document after proofreading and second language document after proofreading, as well as information necessary for proofreading of bilingual documents A bilingual document proofreading apparatus comprising a display device for performing the bilingual document proofreading program, and a first language document before proofreading and a second language document before proofreading input from the input device, And a bilingual document storage unit that stores a proofreading first language document and a proofreading second language document as a pair and stores them as a bilingual document, and is stored in the bilingual document storage unit using the translation dictionary unit. Before calibration Document analysis means for analyzing one language document, second language document before proofreading, first language document after proofreading and second language document after proofreading, and storing the analysis information in an analysis information storage unit, and the analysis information storage Compare the first language document before proofreading with the first language document after proofreading, and the second language document before proofreading with the second language document after proofreading based on the analysis information stored in the The calibration content classification means for storing the calibration classification in the calibration classification storage unit, the calibration information based on the analysis information stored in the analysis information storage unit and the calibration classification stored in the calibration classification storage unit Calibration content suitability judging means for judging the suitability of the content and displaying the calibration content suitability result on a display device, and prompting the operator to confirm the calibration content suitability result displayed on the display device and Through the input device Characterized by comprising a calibration contents confirmation operation means for performing a confirmation operation of the calibration details of the force has been operated first language document and after calibration of the second language document after calibration based on the command.

本発明によれば、第一言語文書及び第二言語文書の双方を校正した場合であっても校正内容の適性を判断できる対訳文書校正装置を提供できる。   ADVANTAGE OF THE INVENTION According to this invention, even if it is a case where both the 1st language document and the 2nd language document are proofread, the bilingual document proofreading apparatus which can judge the suitability of the proofreading content can be provided.

本発明の実施の形態に係わる対訳文書校正装置の構成図。1 is a configuration diagram of a bilingual document proofing apparatus according to an embodiment of the present invention. 本発明の実施の形態に係る対訳文書校正装置のハードウエア構成を示すブロック構成図。The block block diagram which shows the hardware constitutions of the bilingual document proofreading apparatus which concerns on embodiment of this invention. 本発明の実施の形態に係わる対訳文書校正装置の処理内容の一例を示すフローチャート。The flowchart which shows an example of the processing content of the bilingual document proofreading apparatus concerning embodiment of this invention. 本発明の実施の形態における校正前の対訳文書の一例の説明図。Explanatory drawing of an example of the bilingual document before proofreading in embodiment of this invention. 本発明の実施の形態における校正後の対訳文書の一例の説明図。Explanatory drawing of an example of the bilingual document after proofreading in embodiment of this invention. 本発明の実施の形態における校正前の対訳文書のうち校正前の第一言語文書の最初の一文目の形態素解析情報の一例を示す説明図。Explanatory drawing which shows an example of the morphological analysis information of the first sentence of the 1st language document before proofreading among the bilingual documents before proofreading in embodiment of this invention. 本発明の実施の形態における校正前の対訳文書のうち校正前の第二言語文書の最初の一文目の形態素解析情報の一例を示す説明図。Explanatory drawing which shows an example of the morphological analysis information of the first sentence of the 2nd language document before proofreading among the bilingual documents before proofreading in embodiment of this invention. 本発明の実施の形態における校正分類記憶部に記憶される校正分類の一例の説明図。Explanatory drawing of an example of the calibration classification memorize | stored in the calibration classification memory | storage part in embodiment of this invention. 本発明の実施の形態における校正内容適性判断手段により同一言語内で校正内容適性の判断処理を行う場合の一例を示すフローチャート。The flowchart which shows an example when the proofreading content suitability determination means in embodiment of this invention performs the judgment content suitability determination process in the same language. 図9の場合の対訳文書の一例の説明図。FIG. 10 is an explanatory diagram of an example of a bilingual document in the case of FIG. 9. 図10のケース4の対訳文書に含まれる文の解析例を示す説明図。Explanatory drawing which shows the example of analysis of the sentence contained in the bilingual document of case 4 of FIG. 本発明の実施の形態における校正内容適性判断手段により同一言語内で校正内容適性の判断処理を行う場合の他の一例を示すフローチャート。The flowchart which shows another example in the case of performing the judgment process of the proof content suitability in the same language by the proof content suitability judging means in the embodiment of the present invention. 本発明の実施の形態における校正内容適性判断手段により校正前後の対訳文書の異言語内で校正内容適性の判断処理を行う場合の一例を示すフローチャート。The flowchart which shows an example in the case of performing the judgment process of the proofreading content suitability in the different language of the bilingual document before and behind proofreading by the proofreading content suitability judging means in embodiment of this invention. 図13の場合の対訳文書の一例の説明図。FIG. 14 is an explanatory diagram of an example of a bilingual document in the case of FIG. 13. 図14の校正前の対訳文書のうちの第一言語文書の形態素解析情報の一例を示す説明図。Explanatory drawing which shows an example of the morphological analysis information of the 1st language document among the bilingual documents before proofreading of FIG. 図14の校正前の対訳文書のうちの第二言語文書の形態素解析情報の一例を示す説明図。Explanatory drawing which shows an example of the morphological analysis information of the 2nd language document among the bilingual documents before proofreading of FIG. 図14の校正後の対訳文書のうちの第二言語文書の形態素解析情報の一例を示す説明図。Explanatory drawing which shows an example of the morphological analysis information of the 2nd language document among the bilingual documents after proofreading of FIG. 本発明の実施の形態における校正内容適性判断手段により校正前後の対訳文書の異言語内で校正内容適性の判断処理を行う場合の他の一例を示すフローチャート。The flowchart which shows another example at the time of performing the judgment process of the proofreading content suitability in the different language of the bilingual document before and behind proofreading by the proofreading content suitability judging means in embodiment of this invention. 本発明の実施の形態における校正内容適性判断手段により校正分類が削除と追加との組合せ又は追加である場合の校正内容適性の判断処理を行う場合の一例を示すフローチャート。The flowchart which shows an example in the case of performing the judgment process of the proof content suitability in case the calibration classification | category is a combination or addition of deletion and addition by the proofreading content suitability judging means in the embodiment of the present invention. 図19を適用する場合の対訳文書の一例の説明図。Explanatory drawing of an example of the bilingual document in the case of applying FIG. ユーザが校正内容適性の判断を行う際の校正内容確認操作手段の処理内容を示すフローチャート。The flowchart which shows the processing content of the calibration content confirmation operation means at the time of a user determining calibration content suitability. 図21を適用する場合の対訳文書の一例の説明図。FIG. 22 is an explanatory diagram of an example of a bilingual document when FIG. 21 is applied. 校正内容承認のマトリックスの一例の説明図。Explanatory drawing of an example of the matrix of proofreading content approval.

以下、本発明の実施の形態を図面に基づいて説明する。図1は、本発明の実施の形態に係わる対訳文書校正装置の構成図、図2は本発明の実施の形態に係る対訳文書校正装置のハードウエア構成を示すブロック構成図である。対訳文書校正装置11は、例えば一般的なコンピュータに対訳文書校正プログラムなどのソフトウェアプログラムがインストールされ、そのソフトウェアプログラムが演算制御装置12のプロセッサ13において実行されることにより実現される。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a configuration diagram of a bilingual document proofreading apparatus according to an embodiment of the present invention, and FIG. 2 is a block configuration diagram illustrating a hardware configuration of the bilingual document proofreading apparatus according to an embodiment of the present invention. The bilingual document proofreading apparatus 11 is realized by installing a software program such as a bilingual document proofreading program in a general computer and executing the software program in the processor 13 of the arithmetic and control unit 12.

演算制御装置12は対訳文書校正に関する各種演算を行うものであり、演算制御装置12はプロセッサ13とメモリ14とを有し、メモリ14には翻訳に関する対訳文書校正プログラム15が記憶され、プロセッサ13により処理が実行される際には作業エリア16が用いられる。演算制御装置12の演算結果等は出力装置である表示装置17に表示出力される。   The arithmetic and control unit 12 performs various calculations related to bilingual document proofreading. The arithmetic and control unit 12 includes a processor 13 and a memory 14. The memory 14 stores a bilingual document proofreading program 15 related to translation. The work area 16 is used when processing is executed. The calculation results of the calculation control device 12 are displayed and output on the display device 17 which is an output device.

入力装置18は演算制御装置12に情報を入力するものであり、例えば、マウス19、キーボード20、ディスクドライブ21から構成され、例えば、マウス19やキーボード20は表示装置17を介して演算制御装置12に各種指令を入力し、キーボード20、ディスクドライブ21は対訳文書校正対象の文書を入力する。すなわち、ディスクドライブ21は対訳文書校正対象の文書のファイルを記憶媒体に入出力するものである。さらに、演算制御装置12の演算結果や対訳文書校正に必要な知識・規則を蓄積した翻訳辞書等を記憶するハードディスクドライブ(HDD)22が設けられている。   The input device 18 is used to input information to the arithmetic control device 12, and includes, for example, a mouse 19, a keyboard 20, and a disk drive 21. For example, the mouse 19 and the keyboard 20 are connected to the arithmetic control device 12 via the display device 17. Various commands are input to the keyboard 20 and the disk drive 21 to input a document to be proofread for bilingual documents. In other words, the disk drive 21 inputs / outputs a document file to be proofreaded into a bilingual document to / from a storage medium. Furthermore, a hard disk drive (HDD) 22 is provided for storing a translation dictionary and the like in which calculation results of the calculation control device 12 and knowledge / rules necessary for bilingual document proofreading are accumulated.

図1は本発明の実施の形態に係わる対訳文書校正装置11の機能ブロック図である。図1に示す演算制御装置12内の各機能ブロックは、上述の対訳文書校正プログラム15を構成する各プログラムに対応する。すなわち、プロセッサ13が対訳文書校正プログラム15を構成する各プログラムを実行することで、演算制御装置12は、各機能ブロックとして機能することとなる。また、記憶装置25の各ブロックは、演算制御装置12内のメモリ14及びハードディスクドライブ22の記憶領域に対応する。   FIG. 1 is a functional block diagram of a bilingual document proofreading apparatus 11 according to an embodiment of the present invention. Each functional block in the arithmetic and control unit 12 shown in FIG. 1 corresponds to each program constituting the bilingual document proofreading program 15 described above. That is, when the processor 13 executes each program constituting the parallel translation document proofing program 15, the arithmetic control device 12 functions as each functional block. Each block of the storage device 25 corresponds to a storage area of the memory 14 and the hard disk drive 22 in the arithmetic control device 12.

図1において、入力装置18は、校正対象となる文書の電子データを入力するものであり、例えばキーボード20、マウス19等によって構成されており、ユーザの入力操作に基づく対訳文書の入力が可能である。入力装置18から入力される文書は、校正前の第一言語文書とこの第一言語文書を第二言語に翻訳した校正前の第二言語文書とが対になっている校正前対訳文書、及びこの校正前対訳文書に対する人手による校正後の対訳文書である。校正後対訳文書は、校正後の第一言語文書と校正後の第二言語文書とが対になった対訳文書である。なお、入力装置18としては、OCR(光学式文字読み取り装置)や、磁気テープ、磁気ディスク、光ディスク等、コンピュータ可読媒体からの読み込み装置を採用することも可能であり、入力装置18によって入力された校正前対訳文書及び校正後対訳文書は、演算処理部12の入力処理部23により入力処理されて取り込まれ、制御部24を介して記憶装置25の対訳文書記憶部26に記憶される。また、入力装置18は、入力処理部23を介して制御部24に対して各種コマンドを与える。   In FIG. 1, an input device 18 inputs electronic data of a document to be proofread. The input device 18 includes, for example, a keyboard 20, a mouse 19 and the like, and can input a bilingual document based on a user input operation. is there. A document input from the input device 18 includes a first language document before proofreading and a bilingual document before proofreading in which the first language document before proofreading is translated into a second language. This is a bilingual document after manual proofreading for this pre-proofread bilingual document. The proofread bilingual document is a bilingual document in which the proofread first language document and the proofread second language document are paired. As the input device 18, a reading device from a computer-readable medium such as an OCR (optical character reading device), a magnetic tape, a magnetic disk, an optical disk or the like can be adopted. The pre-proofread bilingual document and the post-proofread bilingual document are input and captured by the input processing unit 23 of the arithmetic processing unit 12 and stored in the bilingual document storage unit 26 of the storage device 25 via the control unit 24. The input device 18 gives various commands to the control unit 24 via the input processing unit 23.

制御部24は、入力処理部23、出力処理部33、文書解析手段28、校正内容分類手段30、校正内容適性判断手段32、校正内容確認操作手段34を制御するとともに、記憶装置25とのデータの授受の制御も行う。   The control unit 24 controls the input processing unit 23, the output processing unit 33, the document analysis unit 28, the proofreading content classification unit 30, the proofreading content suitability determination unit 32, and the proofreading content check operation unit 34, and data with the storage device 25. Also controls the transfer of.

文書解析手段28は、制御部24からの指示に従って、後述する記憶装置25の翻訳辞書部27を用いて、入力装置18によって入力され、対訳文書記憶部26に記憶された校正前の第一言語文書、校正前の第二言語文書、校正後の第一言語文書及び校正後の第二言語文書を解析し、その解析情報を解析情報記憶部29に記憶する。また、その解析結果は、制御部24及び出力処理部33を介して必要に応じて表示装置17に表示出力される。   The document analysis unit 28 uses the translation dictionary unit 27 of the storage device 25 to be described later according to an instruction from the control unit 24 and is input by the input device 18 and stored in the parallel translation document storage unit 26 before the first language. The document, the second language document before proofreading, the first language document after proofreading, and the second language document after proofreading are analyzed, and the analysis information is stored in the analysis information storage unit 29. The analysis result is displayed and output on the display device 17 through the control unit 24 and the output processing unit 33 as necessary.

校正内容分類手段30は、解析情報記憶部29に記憶された解析情報に基づいて、校正前の第一言語文書と校正後の第一言語文書、及び校正前の第二言語文書と校正後の第二言語文書とを比較し、校正内容を分類してその校正分類を校正分類記憶部31に記憶する。   Based on the analysis information stored in the analysis information storage unit 29, the proofreading content classification means 30 is based on the first language document before proofreading and the first language document after proofreading, and the second language document before proofreading and after proofreading. The proofreading contents are compared with the second language document, the proofreading contents are classified, and the proofreading classification is stored in the proofreading classification storage unit 31.

校正内容適性判断手段32は、解析情報記憶部29に記憶された解析情報及び校正分類記憶部31に記憶された校正分類とに基づいて校正内容の適性を判断し、その校正内容適性結果を制御部24及び出力処理部33を介して表示装置17に表示出力する。   The calibration content suitability determination means 32 judges the suitability of the calibration content based on the analysis information stored in the analysis information storage unit 29 and the calibration classification stored in the calibration classification storage unit 31, and controls the calibration content suitability result. The data is output to the display device 17 via the unit 24 and the output processing unit 33.

校正内容確認操作手段34は、表示装置17に表示された校正内容適性結果の確認操作をユーザに対して促すとともに、ユーザにより入力装置18を介して入力された操作指令に基づき、校正後の第一言語文書や校正後の第二言語文書の校正内容の確認操作を行うものである。   The calibration content confirmation operating means 34 prompts the user to confirm the calibration content suitability result displayed on the display device 17, and based on an operation command input by the user via the input device 18, An operation for confirming the proofreading contents of the one language document or the second language document after proofreading is performed.

出力処理部33は、制御部24を介して供給された対訳文書、解析結果、校正分類、校正内容適性結果等の対訳校正情報を表示装置17に出力処理するものであり、これにより、表示装置17の表示画面上に対訳校正情報が画面表示される。また、出力処理部33は制御部24への各種コマンドに対する制御部24からの応答を表示する。   The output processing unit 33 outputs the bilingual proofreading information such as the bilingual document, the analysis result, the proofreading classification, the proofreading content suitability result supplied through the control unit 24 to the display device 17. The bilingual proofreading information is displayed on the 17 display screen. The output processing unit 33 displays responses from the control unit 24 to various commands to the control unit 24.

なお、出力装置として表示装置17を示しているが、出力装置としては、表示装置17だけでなく、印字機等の印刷装置、磁気テープ、磁気ディスク、光ディスク等のコンピュータ可読媒体への出力装置や、他のメディアに文書を送信する送信装置等を採用することもできる。   Although the display device 17 is shown as an output device, the output device is not limited to the display device 17, but may be a printing device such as a printing machine, an output device to a computer-readable medium such as a magnetic tape, a magnetic disk, or an optical disk. It is also possible to employ a transmission device that transmits a document to other media.

翻訳辞書部27は、校正内容適性判断手段32が校正内容適性判断処理を行う際に使用する各種辞書データを格納している。翻訳辞書部27は、第一言語から第二言語への翻訳を行うための辞書、及び第二言語から第一言語への翻訳を行うための辞書を格納している。   The translation dictionary unit 27 stores various types of dictionary data used when the proofreading content aptitude determination means 32 performs the proofreading content aptitude determination process. The translation dictionary unit 27 stores a dictionary for performing translation from the first language to the second language and a dictionary for performing translation from the second language to the first language.

第一言語から第二言語への翻訳を行うための辞書は、語尾等に変化のある単語・熟語をその原形に変換するための第一言語活用変化辞書27a、第一言語を解析するための文法が記憶された第一言語解析文法辞書27b、第一言語の単語・熟語に対応する第二言語の訳語がその品詞情報と共に記憶される第一言語単語・熟語辞書27c、第一言語から第二言語への変換情報が記憶された第一言語変換文法辞書27d、第二言語の文の構造を決定する第二言語生成文法辞書27e、さらに語尾等の語形を変化させて翻訳文を完成させる第二言語形態素生成文法辞書27fからなる。   The dictionary for translating from the first language to the second language is a first language utilization change dictionary 27a for converting words / idioms whose endings are changed into their original forms, and for analyzing the first language. A first language analysis grammar dictionary 27b in which grammar is stored, a first language word / idiom dictionary 27c in which translations in a second language corresponding to words / idioms in the first language are stored together with the part of speech information, A first language conversion grammar dictionary 27d that stores conversion information into two languages, a second language generation grammar dictionary 27e that determines the structure of a sentence in the second language, and further changes the word form such as endings to complete a translated sentence. Consists of a second language morpheme generation grammar dictionary 27f.

また、第二言語から第一言語への翻訳を行うための辞書は、第二言語活用変化辞書27g、第二言語を解析するための文法が記憶された第二言語解析文法辞書27h、第二言語の単語・熟語に対応する第一言語の訳語が、その品詞情報と共に記憶される第二言語単語・熟語辞書27i、第二言語から第一言語への変換情報が記憶された第二言語変換文法辞書27j、第一言語の文の構造を決定する第一言語生成文法辞書27k、さらに語尾等の語形を変化させて翻訳文を完成させる第一言語形態素生成文法辞書27lからなる。ここでは、有用と思われる辞書を挙げたが、必ずしもすべてを使用する必要はない。   A dictionary for translating from the second language to the first language is a second language utilization change dictionary 27g, a second language analysis grammar dictionary 27h in which a grammar for analyzing the second language is stored, and a second Second language word / idiom dictionary 27i in which the translation of the first language corresponding to the word / idiom of the language is stored together with the part of speech information, and the second language conversion in which the conversion information from the second language to the first language is stored It comprises a grammar dictionary 27j, a first language generation grammar dictionary 27k that determines the structure of a sentence in the first language, and a first language morpheme generation grammar dictionary 27l that completes a translated sentence by changing word forms such as endings. Here are some useful dictionaries, but not all need to be used.

以下、英語を第一言語とし日本語を第二言語とした場合を例に取り説明する。図3は、本発明の実施の形態に係わる対訳文書校正装置の処理内容の一例を示すフローチャートである。まず、制御部24は、入力装置18から入力処理部23を介して入力された校正前の対訳文書及び校正後の対訳文書を記憶する(S1)。すなわち、校正前の第一言語文書と校正前の第二言語文書とを校正前の対訳文書として、校正後の第一言語文書と校正後前の第二言語文書とを校正後の対訳文書として、対訳文書記憶部26に記憶する。   In the following, description will be made taking as an example the case where English is the first language and Japanese is the second language. FIG. 3 is a flowchart showing an example of processing contents of the parallel document proofreading apparatus according to the embodiment of the present invention. First, the control unit 24 stores the bilingual document before proofreading and the bilingual document after proofreading input from the input device 18 via the input processing unit 23 (S1). That is, the first language document before proofreading and the second language document before proofreading are used as bilingual documents before proofreading, and the first language document after proofreading and second language documents before proofreading are used as bilingual documents after proofreading. And stored in the bilingual document storage unit 26.

図4は校正前の対訳文書の一例の説明図、図5は校正後の対訳文書の一例の説明図である。なお、図4及び図5における対訳文書は、第二言語文書が第一言語文書の単語を過不足なく翻訳した逐語訳であり、対訳文書の第一言語文書が2文である場合を示している。各文には文番号が付与されている。   FIG. 4 is an explanatory diagram of an example of a bilingual document before proofreading, and FIG. 5 is an explanatory diagram of an example of a bilingual document after proofreading. The bilingual document in FIGS. 4 and 5 shows a case where the second language document is a verbatim translation in which the words of the first language document are translated without excess or deficiency, and the first language document of the bilingual document is two sentences. Yes. Each sentence is given a sentence number.

なお、図5の校正後の対訳文書では、文番号は必ずしも1文ではない場合がある。例えば、図5の校正後の第二言語文書の文番号2は1文ではなく2文である。これは、ここでいう文番号は、校正前の第一言語の1文に対応する文を示すものであるからである。つまり、校正後の対訳文書には、校正により文が削除や結合された場合には文がないことになり、校正より文が追加された場合には2文以上となる場合が有り得る。また、同じ校正前の文でも、第一言語の1文は、第二言語において必ずしも1文である必要はないので同様のことが言える。実際、図4の文番号2に対応する第二言語の文は、2文になっている。また、後述の比較処理の説明に分かりやすいように、異なり部分に下線を付している。   In the bilingual document after proofreading in FIG. 5, the sentence number may not necessarily be one sentence. For example, sentence number 2 of the second language document after proofreading in FIG. 5 is not one sentence but two sentences. This is because the sentence number here indicates a sentence corresponding to one sentence in the first language before proofreading. In other words, in the bilingual document after proofreading, there is no sentence when sentences are deleted or combined by proofreading, and there may be two or more sentences when sentences are added by proofreading. Moreover, even in the same sentence before proofreading, the same thing can be said because one sentence in the first language is not necessarily one sentence in the second language. Actually, the second language sentence corresponding to sentence number 2 in FIG. 4 is two sentences. In addition, different portions are underlined for easy understanding in the description of the comparison processing described later.

ここで、表層的文字列から何をもって挿入/ 削除/ 置換とするかは、例えば、WER(Word Error Rate)の記述にあるように、判断するソフトも既にある。これは、基準となる模範的翻訳と比較した際の編集距離(挿入/削除/置換)を反映したものである。   Here, there is already software for determining what is to be inserted / deleted / replaced from the surface character string, as described in, for example, WER (Word Error Rate). This reflects the edit distance (insertion / deletion / replacement) compared to the reference exemplary translation.

次に、制御部24は文書解析手段28を起動する。文書解析手段28は、対訳文書記憶部26から校正前の対訳文書及び校正後の対訳文書を読み出し、校正前の対訳文書及び校正後の対訳文書の各文をそれぞれ形態素に分割し、品詞などの属性情報を得る(S2)。これは、校正前の対訳文書及び校正後の対訳文書の各文の統語的特徴を得るためである。   Next, the control unit 24 activates the document analysis means 28. The document analysis means 28 reads the parallel translation document before proofreading and the parallel translation document after proofreading from the parallel translation document storage unit 26, divides each sentence of the parallel translation document before proofreading and the parallel translation document after proofreading into morphemes. Attribute information is obtained (S2). This is to obtain syntactic features of each sentence of the bilingual document before proofreading and the bilingual document after proofreading.

図6は校正前の対訳文書のうち校正前の第一言語文書の最初の一文目の形態素解析情報の一例を示す説明図である。校正前の第一言語文書の最初の一文目は、翻訳辞書部27の第一言語から第二言語への翻訳を行うための辞書、具体的には第一言語活用変化辞書27aと第一言語解析文法辞書27bとの照合により、図6に示すように、各単語につき、品詞、原型、属性が付与される。   FIG. 6 is an explanatory diagram showing an example of morphological analysis information of the first sentence of the first language document before proofreading among the bilingual documents before proofreading. The first sentence of the first language document before proofreading is a dictionary for translation from the first language to the second language in the translation dictionary unit 27, specifically, the first language utilization change dictionary 27a and the first language. By matching with the analysis grammar dictionary 27b, as shown in FIG. 6, a part of speech, a prototype, and an attribute are given to each word.

図7は校正前の対訳文書のうち校正前の第二言語文書の最初の一文目の形態素解析情報の一例を示す説明図である。第二言語である日本語は膠着語であるので、屈折語である英語と異なり、視覚的には単語の境界が分からず、翻訳辞書部27の第一言語から第二言語への翻訳を行うための辞書、具体的には第二言語活用変化辞書27g及び第一言語解析文法辞書27hを使って形態素解析を行う。これにより、図4の第二言語文書の1文目の場合、例えば、図7のように分割され、それぞれの単語に、品詞、原型、属性が付与される。   FIG. 7 is an explanatory diagram showing an example of morphological analysis information of the first sentence of the second language document before proofreading among the bilingual documents before proofreading. Japanese, which is the second language, is an agglutinative word, so unlike the refraction word, English, the boundaries of the words are not visually understood, and the translation dictionary unit 27 translates from the first language to the second language. The morpheme analysis is performed using the dictionary for use, specifically the second language utilization change dictionary 27g and the first language analysis grammar dictionary 27h. Thereby, in the case of the first sentence of the second language document of FIG. 4, for example, it is divided as shown in FIG. 7, and a part of speech, a prototype, and an attribute are given to each word.

次に、第一言語単語・熟語辞書27c、第二言語単語・熟語辞書27iを用いて、それぞれの形態素に対して、翻訳辞書部27内に定義している訳語情報を得る(S3)。なお、第一言語側の第一文の場合、第一言語単語・熟語辞書27cでは、”scientific community,”、“human genome”のような複合語も見出しとして登録されているので、これらの複合語も訳語情報を得る対象となる。校正前の対訳文書の第二文も同様の処理を行う。また、校正後の対訳文書についても同様の処理を行う。ここで得られた形態素解析情報や訳語情報は、制御部24により解析情報記憶部29に記憶される。   Next, using the first language word / idiom dictionary 27c and the second language word / idiom dictionary 27i, translation information defined in the translation dictionary unit 27 is obtained for each morpheme (S3). In the case of the first sentence on the first language side, compound words such as “scientific community,” and “human genome” are also registered as headings in the first language word / idiom dictionary 27c. Words are also subject to translation information. The same processing is performed for the second sentence of the bilingual document before proofreading. The same processing is also performed on the proofread bilingual document. The morpheme analysis information and the translated word information obtained here are stored in the analysis information storage unit 29 by the control unit 24.

次に、制御部24は校正内容分類手段30を起動する。校正内容分類手段30は、補正前の対訳文書及び校正後の対訳文書を対訳文書記憶部26から読み込み、校正前の対訳文書と校正後の対訳文書の同じ文番号の文が同一か否かを判断する(S4)。すなわち、校正前の第一言語文書と校正後の第一言語文書の同じ文番号の文、及び校正前の第二言語文書と校正後の第二言語文書の同じ文番号の文とは同一か否かを判断する。同一である文については、校正内容分類手段30は校正分類として同一の分類を付与する(S5)。そして、校正内容分類手段30は制御部24を介してその校正分類を校正分類記憶部31に記憶する。   Next, the control unit 24 activates the calibration content classification means 30. The proofreading content classification means 30 reads the bilingual document before correction and the bilingual document after proofreading from the bilingual document storage unit 26, and determines whether or not the sentences with the same sentence number in the bilingual document before proofreading and the bilingual document after proofreading are the same. Judgment is made (S4). That is, the sentence with the same sentence number in the first language document before proofreading and the first language document after proofreading, and the sentence with the same sentence number in the second language document before proofreading and the second language document after proofreading are the same. Judge whether or not. For the same sentences, the proofreading content classification means 30 assigns the same classification as the proofreading classification (S5). Then, the calibration content classification unit 30 stores the calibration classification in the calibration classification storage unit 31 via the control unit 24.

図8は校正分類記憶部31に記憶される校正分類の一例の説明図である。図4の校正前の対訳文書と図5の校正後の対訳文書においては、校正前の第一言語文書の第一文(文番号1)と第二文(文番号2)は、それぞれ校正後の第一言語文書の第一文(文番号1)と第二文と同一であるので、それらは、図8に示すように同一として分類される。   FIG. 8 is an explanatory diagram of an example of calibration classification stored in the calibration classification storage unit 31. In the bilingual document before proofreading in FIG. 4 and the bilingual document after proofreading in FIG. 5, the first sentence (sentence number 1) and the second sentence (sentence number 2) of the first language document before proofreading are after proofreading, respectively. Since the first sentence (sentence number 1) and the second sentence of the first language document are the same, they are classified as the same as shown in FIG.

一方、同一ではなかった文について、校正内容分類手段30は、同じ文番号の文中に部分的に重なる部分があるか否かを判断する(S6)。重なり部分がない場合には別の文番号の文に同一文があるか否かを判断し(S7)、同一文がある場合には、校正分類として文移動を付与する(S8)。別の文番号の文に同一文があるか否かの判断は、校正後の同じ言語の文書中の近隣の何文かをチェックして判断する。   On the other hand, for the sentences that are not identical, the proofreading content classification means 30 determines whether or not there is a partially overlapping part in the sentence having the same sentence number (S6). If there is no overlapping part, it is determined whether or not the same sentence exists in a sentence with a different sentence number (S7). If there is the same sentence, sentence movement is given as a proofreading classification (S8). Whether the same sentence exists in a sentence with a different sentence number is determined by checking some neighboring sentences in the document in the same language after proofreading.

ステップS6の判断で別の文番号においても同じ文が現れなければ、同一ではなかった文は、校正前の文であるか否かを判断する(S9)。校正前の文である場合には校正分類として文削除の分類を付与し(S10)、一方、同一ではなかった文が校正後の文であれば校正分類として文追加の分類を付与する(S11)。   If it is determined in step S6 that the same sentence does not appear in another sentence number, it is determined whether or not the sentence that is not identical is a sentence before proofreading (S9). If it is a sentence before proofreading, a sentence deletion classification is assigned as a proofreading classification (S10). On the other hand, if a sentence that is not identical is a proofreading sentence, a sentence addition classification is assigned as a proofreading classification (S11). ).

一方、校正内容分類手段30は、ステップS6の判断で部分的な重なり部分があると判断した場合は、まず、文分割又は文結合の現象が見られるか否かを判断する(S12)。この判断の基準としては、重なり部分の機能語を除き内容語が一致し、校正前と校正後とで文の数が異なっているかどうかで判断する。   On the other hand, if it is determined in step S6 that there is a partial overlap, the proofreading content classification unit 30 first determines whether a phenomenon of sentence division or sentence combination is observed (S12). As a criterion for this determination, the content words are the same except for the overlapping function words, and it is determined whether or not the number of sentences is different before and after the proofreading.

内容語であるか機能語であるか否かは、図6や図7に示した形態素解析情報の品詞情報を参照することによって情報が得られる。品詞として、名詞、形容詞、動詞、副詞は内容語に属し、代名詞、前置詞(英語の場合)、接続詞、間投詞は機能語に属する。すなわち、校正内容分類手段30は、校正前の対訳文書及び校正後の対訳文書の各文の形態素解析情報を解析情報記憶部29から読み出し、形態素解析情報の品詞情報を参照することによって、重なり部分の機能語を除き内容語が一致するか否かを判断する。そして、重なり部分の機能語を除き内容語が一致し、校正前と校正後とで文の数が異なっているときは、文分割又は文結合の現象が見られると判断する。   Whether it is a content word or a function word can be obtained by referring to the part-of-speech information of the morphological analysis information shown in FIGS. As parts of speech, nouns, adjectives, verbs, and adverbs belong to content words, pronouns, prepositions (in English), conjunctions, and interjections belong to function words. That is, the proofreading content classification unit 30 reads out the morphological analysis information of each sentence of the parallel translation document before the proofreading and the parallel translation document after the proofreading from the analysis information storage unit 29 and refers to the part of speech information of the morphological analysis information, thereby It is determined whether or not the content words match except for the function words. If the content words are the same except for the function words in the overlapping portion and the number of sentences is different before and after proofreading, it is determined that a phenomenon of sentence division or sentence combination is observed.

次に、校正後に文の数が減っているか否かを判断し(S13)、校正後に文の数が減っているときは校正分類として文結合の分類を付与する(S14)。一方、校正後に文の数が増えていれば校正分類として文分割の分類を付与する(S15)。   Next, it is determined whether or not the number of sentences is reduced after proofreading (S13). When the number of sentences is reduced after proofreading, a sentence combination classification is assigned as a proofreading classification (S14). On the other hand, if the number of sentences has increased after proofreading, sentence division classification is assigned as proofreading classification (S15).

例えば、図5の第二言語の第二文の「米国立衛生研究所は、予備調査を公式にスタートした。これは、癌に関係するゲノムの変化についての包括的な目録を作成するためのものである。」は、図4の第二言語の第二文の「米国立衛生研究所は、癌に関係するゲノムの変化についての包括的な目録を作成するための予備調査を公式にスタートした。」を2文に分割したものと判断できるので、文分割の分類を付与する。   For example, in the second sentence of the second language in FIG. 5 “The National Institutes of Health has officially started a preliminary study. This is to create a comprehensive inventory of cancer-related genomic changes. “The National Institutes of Health officially launched a preliminary study to create a comprehensive inventory of cancer-related genomic alterations, in the second sentence of the second language of FIG. Is divided into two sentences, a sentence division classification is assigned.

一方、ステップS12の判断で、部分的な重なり部分に文分割又は文結合の現象が見られないと判断したときは、校正内容分類手段30は、校正前の対訳文書であるか否かを判断し(S16)、校正前の対訳文書であれば校正分類として削除の分類を付与する(S17)。一方、校正前の対訳文書でなければ校正後の対訳文書であるので、校正分類として追加の分類を付与する(S18)。   On the other hand, if it is determined in step S12 that the phenomenon of sentence division or sentence combination is not observed in the partially overlapping portion, the proofreading content classification unit 30 determines whether the document is a parallel translation document before proofreading. If it is a bilingual document before proofreading (S16), a deletion classification is given as a proofreading classification (S17). On the other hand, if it is not a bilingual document before proofreading, it is a bilingual document after proofreading, so an additional classification is given as a proofreading classification (S18).

例えば、図4の第二言語文書の第一文の「科学者のスミスら」が削除に分類され、図5の第二言語文書の第一文の「スミスのような科学者」が追加に分類される。また、校正前にあった「癌の生態」の「の生態」が、校正後の文には存在しないので削除と分類される。図5の第二言語文書の第二文については、先述した文分割の箇所の次には「すなわち、「癌ゲノムアトラス」である。」があり、これは校正前も校正後も存在している。しかし、校正後には、「略称のTCGAは4種類の塩基にちなむ。」が後続しており、この点が異なる。従って、この一文は追加に分類される。   For example, the first sentence “Smith of Smith” in the second language document in FIG. 4 is classified as deleted, and the first sentence “Scientist like Smith” in the second language document in FIG. 5 is added. being classified. In addition, “biology” of “cancer ecology” that existed before proofreading is classified as deleted because it does not exist in the sentence after proofreading. The second sentence of the second language document in FIG. 5 is “that is,“ cancer genome atlas ”next to the sentence division described above. This exists before and after calibration. However, after proofreading, “abbreviated TCGA is named after four types of bases” follows, which is different. Therefore, this sentence is classified as additional.

そして、校正内容分類手段30は、図8に示すように、対訳文書の文番号毎に付与された校正分類を集約する(S19)。   Then, as shown in FIG. 8, the proofreading content classifying unit 30 collects the proofreading classifications assigned for each sentence number of the parallel translation document (S19).

次に、校正内容適性判断手段34は、この校正分類に基づき、文番号が同一のものについて、第一言語側と第二言語側とで同様の校正分類となっているかを判断し(S20)、同様である場合は、校正内容適性を有する可能性が高いと判断する(S21)。一方、異なる場合は、文移動、文結合、文分割のいずれかであるか否かを判断し(S22)、文移動、文結合、文分割のいずれかである場合は、校正内容適性を有する可能性が高いと判断する(S21)。また、文移動、文結合、文分割のいずれでもない場合には、校正内容適性を有する可能性が低いと判断する(S23)。これは、文移動、文結合、文分割は、言い換えにすぎず、内容的な追加や削除はないので校正内容適性を有する可能性があると考えられるためである。   Next, based on this proofreading classification, the proofreading content aptitude determination means 34 determines whether the same sentence classification is used on the first language side and the second language side for the same sentence number (S20). If they are the same, it is determined that there is a high possibility of having proofreading content suitability (S21). On the other hand, if it is different, it is determined whether it is any of sentence movement, sentence combination, and sentence division (S22). If it is any of sentence movement, sentence combination, and sentence division, the proofreading content is suitable. It is determined that the possibility is high (S21). If it is not any of sentence movement, sentence combination, and sentence division, it is determined that the possibility of having proofreading content suitability is low (S23). This is because sentence movement, sentence combination, and sentence division are only paraphrasing, and there is no content addition or deletion, so it is considered that there is a possibility of having proofreading content suitability.

ここで、図4及び図5の対訳文書の場合、第一文では、第一言語側において校正前後で同一であるのに対して、第二言語側では、校正前にあった部分が削除され、校正後の同一箇所に追加がある。別の言い方をすれば置き換えがある。さらに、後続部分で、校正前にあった部分が削除され、削除された部分には何の追加もない。従って、異なる校正内容となり、校正内容適性判断手段34は、校正内容適性が低い可能性があると判断する。   Here, in the case of the bilingual documents of FIGS. 4 and 5, the first sentence is the same before and after proofreading on the first language side, whereas the part before proofreading is deleted on the second language side. There is an addition in the same place after calibration. In other words, there is a replacement. Furthermore, in the subsequent part, the part that existed before the calibration is deleted, and there is no addition to the deleted part. Therefore, the proofreading contents suitability determination means 34 determines that the proofreading contents suitability may be low.

また、第二文では、第一言語側において校正前後で同一であるのに対して、第二言語側では、文分割と追加がある。文結合は校正内容適性を有するので、「同一」と「追加」の比較になる。従って、第二文についても異なる校正分類となっているので、校正内容適性判断手段34は、校正内容適性が低い可能性があると判断する。   The second sentence is the same before and after proofreading on the first language side, while there are sentence division and addition on the second language side. Since the sentence combination has proofreading content aptitude, it becomes a comparison between “same” and “addition”. Accordingly, since the second sentence has a different proofreading classification, the proofreading content suitability determining unit 34 determines that the proofreading content suitability may be low.

逆に、校正内容適性がある可能性が高いと考えられるケースは、第一言語側でも校正前と校正後で、削除から追加の編集が行われたときや、文移動、文結合、文分割のみが見られるときである。   On the other hand, there are cases where there is a high possibility that the proofreading content is likely to be suitable for the first language side, when proofreading and additional editing are performed after proofreading and after proofreading, as well as sentence movement, sentence combination, sentence division Is when only can be seen.

こうして、すべての文番号について判断がなされると、校正内容確認操作手段34は、表示装置に校正内容適性結果を表示する(S24)。そして、確認操作をユーザに対して促すとともにユーザからの操作指令があるか否かを判断し(S25)、校正内容確認操作手段34はユーザからの操作指令があるときは、その操作指令に従った処理を行い(S26)、処理を終了する。この場合、校正内容確認操作手段34は、校正内容適性判断手段32により校正内容適性を有する判断された校正内容を確認修正作業の対象から除外することも可能である。これにより、ユーザによる確認修正作業が迅速に行える。   Thus, when all the sentence numbers are determined, the proofreading content confirmation operation means 34 displays the proofreading content suitability result on the display device (S24). Then, it prompts the user for confirmation operation and determines whether or not there is an operation command from the user (S25). When there is an operation command from the user, the calibration content confirmation operation means 34 follows the operation command. The process is completed (S26). In this case, the proofreading content confirmation operation means 34 can also exclude the proofreading contents determined by the proofreading content aptitude determination means 32 from being subjected to the check correction work. Thereby, the confirmation correction work by a user can be performed rapidly.

このように、校正が行われた箇所について、「校正内容適性が低い可能性があるもの」と「校正内容適性がある可能性が高いもの」とに分類される。「校正内容適性が低い可能性があるもの」は目視による確認を必要とするので、この分類に該当する箇所はハイライト表示するなど、表示上の工夫を行うことによって、作業者の便宜を図ることもできる。   As described above, the locations where the calibration has been performed are classified into “things that are likely to have low suitability for calibration contents” and “things that are likely to have suitability for calibration contents”. Since “things that may have low suitability for calibration content” require visual confirmation, the location corresponding to this classification is highlighted, for example, to make it easier for the operator. You can also.

以上の説明では、校正前後の対訳文書の第一言語及び第二言語の双方を用いて校正内容適性を判断するようにしたが、校正前後の対訳文書の同一言語内での判断を行うようにしてもよい。具体的には、校正前にあった文字列が削除され、校正後に削除された文字列の箇所に新たな文字列が追加されたケース、すなわち置換についての判断を行う。   In the above description, the suitability of the proofreading contents is judged using both the first language and the second language of the bilingual document before and after the proofreading. However, the bilingual document before and after the proofreading is judged within the same language. May be. Specifically, the case where the character string that existed before the proofreading is deleted and a new character string is added at the position of the character string that was deleted after the proofreading, that is, the determination for replacement is performed.

図9は校正内容適性判断手段32により校正前後の対訳文書の同一言語内で校正内容適性の判断処理を行う場合の一例を示すフローチャート、図10はその場合の対訳文書の一例の説明図である。以下の説明では、校正前後の対訳文書の同一言語は、第一言語の英語である場合について説明する。   FIG. 9 is a flowchart showing an example of the case where the proofreading content suitability determination means 32 performs the proofreading content suitability determination process in the same language before and after the proofreading, and FIG. 10 is an explanatory diagram of an example of the bilingual document in that case. . In the following description, the case where the same language of the bilingual document before and after proofreading is English of the first language will be described.

校正内容適性判断手段32は、校正分類記憶部31から対象となる対訳文書の校正分類を読み込む(S1)。この場合、対象となる対訳文書は、図10に示した対訳文書の第一言語文書の各文である。そして、校正分類は削除や追加か否かを判断する(S2)。   The proofreading content aptitude determination means 32 reads the proofreading classification of the target bilingual document from the proofreading classification storage unit 31 (S1). In this case, the target bilingual document is each sentence of the first language document of the bilingual document shown in FIG. Then, it is determined whether or not the calibration classification is deleted or added (S2).

校正分類が削除や追加でない場合は処理を終了し、校正分類が削除や追加である場合は、校正内容適性判断手段32は、解析文書記憶部26から対象となる対訳文書の解析情報を読み出し品詞などの属性情報を得る(S3)。   If the proofreading category is not deleted or added, the process is terminated. If the proofreading category is deleted or added, the proofreading content aptitude determination unit 32 reads the analysis information of the target bilingual document from the analysis document storage unit 26 and reads the part of speech. And so on (S3).

ここで、図10のケース1(文番号1)では、校正前のgraspが原形grasp過去形の他動詞であり、校正後のsuggestedは原形suggest過去形ということがわかる。ケース2(文番号2)では、校正前のfirstも校正後のinitialも形容詞である。   Here, in case 1 (sentence number 1) in FIG. 10, it can be seen that the before-correction grasp is a transitive verb of the original grasp past tense, and the suggested after the correction is the original suggest past tense. In case 2 (sentence number 2), both the first before proofreading and the initial after proofreading are adjectives.

一方、ケース3(文番号3)は複数の単語にわたり、校正前、校正後いずれも3語である。校正前の”patience with customers”はpatience:名詞、with:前置詞、customers:原形customerの名詞複数形よりなる。校正後の”in sales networking”はin:前置詞、sales:形容詞、networking:名詞よりなる。前者は、生成文法の表記方法を用いれば、[patience [with customers]PP]NPと、後者は、[in [sales networking]NP]PPと表記することができ、全体としては前者が名詞句、後者が前置詞句であり、品詞構成が異なっている。   On the other hand, Case 3 (sentence number 3) covers a plurality of words, and is 3 words before and after proofreading. “Patience with customers” before proofreading consists of a noun plural of patience: noun, with: preposition, customers: original customer. “In sales networking” after proofreading consists of in: preposition, sales: adjective, networking: noun. The former can be expressed as [patience [with customers] PP] NP and the latter can be expressed as [in [sales networking] NP] PP, using the generation grammar notation method. The latter is a prepositional phrase, and the part of speech composition is different.

ケース4〔文番号4〕では、校正前の”there was”と校正後の”he held”が異なり部分である。品詞からみると、there:副詞、was: be動詞過去形、he:代名詞、held:他動詞hold過去形である。   In case 4 [statement number 4], “there was” before calibration and “he held” after calibration are different. From the part of speech, there are: adverb, was: be verb past tense, he: pronoun, held: transitive hold past tense.

図11はケース4(文番号4)の対訳文書に含まれる文の解析例を示す説明図であり、図11(a)は校正後の文の解析例、図11(b)は校正前の文の解析例である。図11に示すとおり、いずれも、2語の塊として構成要素(constituent)を構成しない。図11ではノードの箇所の要素が構成要素となり得る。つまり、”held a breakfast meeting with potential contributors”は構成要素だが、”held a”や”he held”は構成要素とならない。そこで、文全体における位置づけをみると、同じ2語でありながら、品詞が異なり、そのため、他の不変の部分も文中で占める役割が大幅に異なることがわかる。すなわち、校正前の文は、there構文であり、there isはその定型部分である。後続の”a breakfast meeting with potential contributors”は存在するそのものを指している。文における役割としては、主語である。一方、校正後の文では、he heldはそれぞれ、主文の主語と述語であるところの動詞句のheadである。この文においては、同じ” a breakfast meeting with potential contributors”がこの他動詞heldの目的語となっている。   FIG. 11 is an explanatory view showing an analysis example of a sentence included in a bilingual document of case 4 (sentence number 4), FIG. 11 (a) is an analysis example of a sentence after proofreading, and FIG. This is an example of sentence analysis. As shown in FIG. 11, none of them constitutes a constituent as a two-word block. In FIG. 11, an element at a node can be a constituent element. In other words, “held a breakfast meeting with potential contributors” is a component, but “held a” and “he held” are not components. Therefore, looking at the position of the sentence as a whole, it can be seen that although it is the same two words, the part of speech is different, and therefore the role that other invariant parts occupy in the sentence is significantly different. That is, the sentence before proofreading is the there syntax, and there is a fixed part. Subsequent “a breakfast meeting with potential contributors” refers to the existence itself. The role of the sentence is the subject. On the other hand, in the sentence after proofreading, he held is the head of the verb phrase that is the subject and predicate of the main sentence, respectively. In this sentence, the same “a breakfast meeting with potential contributors” is the object of this other verb held.

次に、異なり部分の品詞が同じか否かを判断する(S4)。異なる場合は、構成内容適性の校正内容適性を有する可能性が低いと判断し(S5)、同じであれば、校正内容適性を有する可能性が高いと判断する(S6)。   Next, it is determined whether or not the different parts of speech are the same (S4). If they are different from each other, it is determined that the possibility of having the calibration content suitability is low (S5), and if they are the same, it is determined that the possibility of having the calibration content suitability is high (S6).

図10のケース1(文番号1)とケース2(文番号2)とは品詞が同じであるので、校正内容適性を有する可能性が高いと判断し、図10のケース3(文番号3)とケース4(文番号4)とは品詞が異なるので、校正内容適性を有する可能性が低いと判断する。このように、校正分類が削除や追加である場合は、削除された単語の品詞と、削除された単語の置き換えにより追加された単語の品詞とが一致する場合は校正内容適性を有すると判断する。   Since case 1 (sentence number 1) and case 2 (sentence number 2) in FIG. 10 have the same part of speech, it is determined that there is a high possibility of having proofreading content suitability, and case 3 (sentence number 3) in FIG. Since the part of speech is different from Case 4 (Sentence No. 4), it is determined that the possibility of having proofreading content suitability is low. Thus, when the proofreading classification is deletion or addition, if the part of speech of the deleted word matches the part of speech of the word added by replacement of the deleted word, it is determined that the proofreading content is suitable. .

図9では、削除された単語の品詞と、削除された単語の置き換えにより追加された単語の品詞とが一致する場合に、校正内容適性を有すると判断したが、図12に示すように、さらに、各々の単語を該当する言語の翻訳辞書部を辞書引きしてそれらが同義語である場合には校正内容適性を有すると判断するようにしてもよい。この場合は、校正内容適性を有する可能性がより高くなる。   In FIG. 9, when the part of speech of the deleted word matches the part of speech of the word added by replacement of the deleted word, it is determined that the proofreading content is suitable, but as shown in FIG. Alternatively, it may be determined that each word has suitability for proofreading contents when the translation dictionary portion of the corresponding language is dictionary-didged and they are synonyms. In this case, there is a higher possibility that the proofreading content is suitable.

図12において、ステップS4〜ステップS5は、図9と同じであるので説明を省略する。異なり部分の品詞が同じである場合は、異なり部分の単語は同義語であるかどうかを判断する(S6)。この判断は、各々の単語を該当する言語の翻訳辞書部を辞書引きしてそれらが同義語であるかどうかを判断することにより行う。そして、同義語である場合には、校正内容適性を有する可能性が高いと判断する。   In FIG. 12, steps S4 to S5 are the same as those in FIG. If the parts of speech of the different parts are the same, it is determined whether or not the words of the different parts are synonyms (S6). This determination is performed by lexicographically searching each word for the corresponding language translation dictionary and determining whether or not they are synonyms. If it is a synonym, it is determined that there is a high possibility of having proofreading content suitability.

すなわち、品詞が同じだった場合は、異なり部分の単語の意味に着目する。翻訳辞書部27の第一言語単語・熟語辞書27cや第一言語単語・熟語辞書27iは同義語の情報も有している。そこで、校正内容適性判断手段32は、第一言語単語・熟語辞書27cを用いて、firstの同義語として、”archetypal, archetypical, prototypal, prototypic, prototypical, basic, introductory, initial, firstborn, eldest, freshman, first-year, original, premier, premiere, prime, prime”などの語が得られたとすると、この中に校正後のinitialがあるため、firstとinitialが同義語であると判断する。   That is, when the parts of speech are the same, focus on the meanings of the different words. The first language word / idiom dictionary 27c and the first language word / idiom dictionary 27i of the translation dictionary unit 27 also have synonym information. Therefore, the proofreading content aptitude determination means 32 uses the first language word / idiom dictionary 27c as a synonym of first, “archetypal, archetypical, prototypal, prototypic, prototypical, basic, introductory, initial, firstborn, eldest, freshman , first-year, original, premier, premiere, prime, prime ”, etc., it is determined that first and initial are synonymous because there is an initial after proofreading.

なお、firstの同義語としてinitialが含まれているので、initialの同義語については調査を打ち切ってもよいし、双方向の同等性を確認するようにしてもよい。initialについても、調べてみると、形容詞のinitialの同義語は”first”であることが得られる。こうして、形容詞firstとinitialがお互いに同義語である強力な支持が得られる。   Since initial is included as a synonym for first, the investigation may be terminated for the synonym of initial, or bidirectional equivalence may be confirmed. Examining initial as well, the synonym for the adjective initial is "first". Thus, strong support is obtained in which the adjectives first and initial are synonymous with each other.

一方、ケース2(文番号2)のgraspとsuggestについて見てみる。同じく第一言語単語・熟語辞書27cを用いて、graspの同義語を調べると、”hold on, hold, take hold, get the picture, comprehend, savvy, dig, compass, apprehend, understand”といった語が得られる。この中にはsuggestは含まれていないことがわかる。そこで、次にsuggestの同義語を調べると、例えば、以下のような語が得られる。”propose, advise, declare, hint, intimate, imply, indicate, inform, evoke, paint a picture, express, show, evince”が得られ、この中には、graspは含まれていない。ケース2(文番号2)のように同義語がない場合は校正内容適性の可能性が低いと判断する(S5)。もし、graspがある場合は校正内容適性を有する可能性が高いと判断することになる。   On the other hand, let's look at grasp and suggest in case 2 (sentence number 2). Similarly, using the first language word / idiom dictionary 27c, the synonyms of grasp are examined, and the words “hold on, hold, take hold, get the picture, comprehend, savvy, dig, compass, apprehend, understand” are obtained. It is done. It can be seen that this does not include suggestions. Then, when the synonym of suggest is checked next, for example, the following words are obtained. "Propose, advise, declare, hint, intimate, imply, indicate, inform, evoke, paint a picture, express, show, evince" is obtained, and this does not include the grasp. If there is no synonym as in case 2 (sentence number 2), it is determined that the possibility of proofreading content suitability is low (S5). If there is a grasp, it is determined that there is a high possibility of having the proofreading content suitability.

なお、ここでは、異表記への置換のケースを考慮しなかったが、第一言語単語・熟語辞書27cや第二言語単語・熟語辞書27iに異表記に関する情報が含まれていれば、上記説明において、「同義語」を「異表記」に置き換えれば、同様に校正内容適性の判断を下すことができる。また、ステップS4で品詞が同一であるか否かを判断しているが、厳密に同じでなくとも、あらかじめ許容される範囲を定めておき、柔軟に判断を下すことも可能である。   Here, the case of replacement with different notation was not considered, but if the first language word / idiom dictionary 27c and the second language word / idiom dictionary 27i contain information related to different notation, the above description will be given. If “synonym” is replaced with “different notation”, the suitability of the proofreading content can be similarly determined. Further, although it is determined in step S4 whether or not the parts of speech are the same, even if they are not exactly the same, it is possible to determine an allowable range in advance and make a flexible determination.

さらにまた、上記により、校正が行われた箇所について、「校正内容適性を有する可能性が低いもの」と「校正内容適性を有する可能性が高いもの」とに分類されたが、「校正内容適性を有する可能性が低いもの」は目視による確認が必要となるので、この分類に該当する箇所はハイライト表示するなど、表示上の工夫を行うことによって、作業者の便宜を図ることもできる。   Furthermore, according to the above, the locations where calibration was performed were classified as “low possibility of having calibration content suitability” and “high possibility of having calibration content suitability”. Since “a low possibility of having” needs to be visually confirmed, it is possible to make the operator's convenience by making a display device such as highlighting a portion corresponding to this classification.

次に、図9及び図12では、校正内容適性を判断するにあたり、校正前後の対訳文書の同一言語内での判断を行うようにしたが、校正前後の対訳文書の異言語内での判断を行うようにしてもよい。   Next, in FIG. 9 and FIG. 12, in determining the suitability of the proofreading content, the bilingual document before and after the proofreading is judged in the same language. You may make it perform.

具体的には、第一言語側と第二言語側との双方で校正前にあった文字列が削除され、校正後に削除された文字列の箇所に新たな文字列が追加されたケース、すなわち置換についての判断を行う。   Specifically, the case where the character string that was before proofreading was deleted on both the first language side and the second language side, and a new character string was added to the part of the character string deleted after proofreading, that is, Make a replacement decision.

図13は校正内容適性判断手段32により校正前後の対訳文書の異言語内で校正内容適性の判断処理を行う場合の一例を示すフローチャート、図14はその場合の対訳文書の一例の説明図である。   FIG. 13 is a flowchart showing an example of a case where the proofreading content suitability determination means 32 performs a proofreading content suitability determination process in a different language before and after the proofreading, and FIG. 14 is an explanatory diagram of an example of the bilingual document in that case. .

校正内容適性判断手段32は、校正分類記憶部31から対象となる対訳文書の校正分類を読み込む(S1)。この場合、対象となる対訳文書は、図14に示した対訳文書の第一言語文書の各文である。そして、校正分類は削除や追加か否かを判断する(S2)。   The proofreading content aptitude determination means 32 reads the proofreading classification of the target bilingual document from the proofreading classification storage unit 31 (S1). In this case, the target bilingual document is each sentence of the first language document of the bilingual document shown in FIG. Then, it is determined whether or not the calibration classification is deleted or added (S2).

校正分類が削除や追加でない場合は処理を終了し、校正分類が削除や追加である場合は、校正内容適性判断手段32は、解析文書記憶部26から対象となる対訳文書の解析情報を読み出し品詞などの属性情報を得る(S3)。   If the proofreading category is not deleted or added, the process is terminated. If the proofreading category is deleted or added, the proofreading content aptitude determination unit 32 reads the analysis information of the target bilingual document from the analysis document storage unit 26 and reads the part of speech. And so on (S3).

図15は校正前の対訳文書のうちの第一言語文書の形態素解析情報の一例を示す説明図、図16は校正前の対訳文書のうちの第二言語文書の形態素解析情報の一例を示す説明図、図17は校正後の対訳文書のうちの第二言語文書の形態素解析情報の一例を示す説明図である。   FIG. 15 is an explanatory diagram showing an example of morphological analysis information of a first language document in a bilingual document before proofreading, and FIG. 16 is an explanatory diagram showing an example of morphological analysis information of a second language document in a bilingual document before proofreading. FIG. 17 is an explanatory diagram showing an example of morpheme analysis information of the second language document in the proofread bilingual document.

図14に示す校正前の対訳文書の第一言語の文は、図15に示すような単語から構成され、それぞれ単語につき、品詞、原型、属性が付与されている。また、対訳文書の第一言語の文の文構造としては、主語、他動詞、目的語のSVOの文型をとっている。   The sentence in the first language of the bilingual document before proofreading shown in FIG. 14 is composed of words as shown in FIG. 15, and parts of speech, prototypes, and attributes are assigned to the words. The sentence structure of the first language sentence of the bilingual document is the SVO sentence pattern of the subject, the transitive verb, and the object.

一方、校正前の対訳文書の第二言語の文は、図16に示されるような単語から構成され、それぞれ単語につき、品詞、原型、属性が付与されている。また、校正前の第二言語の文の文構造としては、主語、動詞よりなる受動態である。深層構造はSOV文型であり、それを受動態に変形したと考えられるが、その際にSは失われている。   On the other hand, the sentence in the second language of the bilingual document before proofreading is composed of words as shown in FIG. 16, and each part has a part of speech, a prototype, and an attribute. The sentence structure of the second language sentence before proofreading is a passive voice composed of a subject and a verb. The deep structure is an SOV sentence pattern, and it is thought that it has been transformed into passive, but at that time S is lost.

校正後の対訳文書の第二言語の文は、図17に示されるような単語から構成され、それぞれ単語につき、品詞、原型、属性が付与されている。品詞構成としては図17に示すとおりであり、文の文構造としては、主語、目的語、他動詞のSOVの文型をとっている。   The sentence in the second language of the bilingual document after proofreading is composed of words as shown in FIG. 17, and each part has a part of speech, a prototype, and an attribute. The part-of-speech structure is as shown in FIG. 17, and the sentence structure of the sentence is the subject, object, and transitive SOV sentence pattern.

次に、校正前の第一言語文書と校正後の第二言語文書の文構造は文型上対応関係にあるか否かを判断する(S4)。   Next, it is determined whether or not the sentence structure of the first language document before proofreading and the second language document after proofreading have a correspondence in terms of sentence pattern (S4).

すなわち、ステップS4では、補正前の第二言語に対する校正後の第二言語の異なり部分「学識者たちがこれまで多くの説明を提示してきた」と、その原文に相当する”Scholars have proposed many explanations”とを比較する。前述したことからわかるように、「学識者たちがこれまで多くの説明を提示してきた」は、主部「学者たちは」+述部を修飾する副詞「これまで」+目的語と他動詞よりなる述部「多くの説明を提示してきた」というSOV構造をしており、”Scholars have proposed many explanations”は、主部”scholars”+他動詞と目的語よりなる述部”have proposed many explanations”というSVO構造をしている。   In other words, in step S4, the different part of the second language after proofreading with respect to the second language before correction “scholars have presented many explanations so far”, which corresponds to the original text “Scholars have proposed many explanations” To compare. As you can see from the above, “scholars have presented many explanations so far” consists of the main part “scholars” + the adverb “previously” that modifies the predicate + the object and the transitive verb It has an SOV structure of predicate “I have presented many explanations”, and “Scholars have proposed many explanations” is an SVO called “have proposed many explanations” consisting of the main part “scholars” + transitive verb and object. Has a structure.

従って、校正前の第一言語文書の文構造はSVOであり、校正後の第二言語文書の文構造はSOVであるので、形式上は文構造が異なるが、異言語間の言語的特質を考慮して、文型上対応関係があるか否かは以下のようにして判断する。   Therefore, the sentence structure of the first language document before proofreading is SVO, and the sentence structure of the second language document after proofreading is SOV. Considering whether or not there is a correspondence in sentence pattern, it is determined as follows.

例えば、英語と日本語との文型上対応関係については、英語がright-branching「右方分枝」の言語であり、日本語がleft-branching「左方分枝」であるため、英語では目的語が動詞に前置するが、日本語では目的語は動詞に後置する。この言語的性質を勘案して、英語の”SVO”と日本語の”SOV”とは文型上の対応関係があるとして取り扱う。   For example, regarding the sentence pattern correspondence between English and Japanese, English is the right-branching “right branch” language, and Japanese is left-branching “left branch”. The word precedes the verb, but in Japanese the object follows the verb. Considering this linguistic property, “SVO” in English and “SOV” in Japanese are treated as having a sentence pattern correspondence.

一般に、世界の言語は、およそ、SOV型(主語+目的語+動詞)、VSO型(動詞+主語+目的語)、OSV型(目的語+主語+動詞)、VOS型(動詞+目的語+主語)、OVS型(目的語+動詞+主語)に類型化される。各言語がどの分類に入るかを情報として予め記憶しておき、これを基に語順の違いを吸収するようにする。   In general, the languages of the world are roughly SOV type (subject + object + verb), VSO type (verb + subject + object), OSV type (object + subject + verb), VOS type (verb + object + Subject) and OVS type (object + verb + subject). The classification of each language is stored in advance as information, and the difference in word order is absorbed based on this information.

いま、図14で第二言語の校正前と校正後の文が逆であったとすると、注目する「霊長類の知能の進化については,これまで多くの議論がなされてきた。」の異なり部分は、「これまで多くの議論がなされてきた。」である。これは、受動態であり、第一言語の“Scholars have proposed many explanations.”や「学識者たちがこれまで多くの説明を提示してきた。」が能動態である点で性質が異なるといえる。従って、この場合、校正内容適性を有する可能性が低いと判断し処理を終える。   Now, if the sentence before and after proofreading in the second language is reversed in FIG. 14, the different part of the noticed “Many arguments have been made about the evolution of primate intelligence”. "There has been much discussion so far." This is passive, and it can be said that the first language “Scholars have proposed many explanations” and “scholars have presented many explanations so far” are different in that they are active. Accordingly, in this case, it is determined that the possibility of having the proofreading content suitability is low, and the process is terminated.

次に、異なり部分の品詞が同じか否かを判断する(S5)。異なる場合は、構成内容適性の校正内容適性を有する可能性が低いと判断し(S6)、同じであれば、校正内容適性を有する可能性が高いと判断する(S7)。   Next, it is determined whether or not the different parts of speech are the same (S5). If they are different from each other, it is determined that the possibility of having the calibration content suitability is low (S6), and if they are the same, it is determined that the possibility of having the calibration content suitability is high (S7).

図13では、校正前の第一言語文書の文構造と校正後の第二言語文書の文構造とが文型上対応関係にあるかどうかを判断して処理する場合について説明したが、校正前の第二言語文書の文構造と校正後の第一言語文書の文構造とが文型上対応関係にあるか否かを判断して処理する場合についても同様に適用できる。   FIG. 13 illustrates the case where the sentence structure of the first language document before proofreading and the sentence structure of the second language document after proofreading are determined and processed in a sentence pattern. The same applies to the case where the sentence structure of the second language document and the sentence structure of the first language document after proofreading are processed by determining whether or not the sentence structure has a correspondence relationship.

また、図13では、削除された単語の品詞と、削除された単語の置き換えにより追加された単語の品詞とが一致する場合に、校正内容適性を有すると判断したが、図18に示すように、さらに、置き換えにより追加された単語の訳語候補の中に異言語の単語があるか否かを判定し、異言語の単語があるときに校正内容適性を有する可能性が高いと判断するようにしたものである。図13と同一ステップには同一符号を付し重複する説明は省略する。   Further, in FIG. 13, when the part of speech of the deleted word matches the part of speech of the word added by replacement of the deleted word, it is determined that the proofreading content is suitable, but as shown in FIG. Further, it is determined whether or not there is a word in a different language among the translation candidates of the word added by the replacement, and when there is a word in a different language, it is determined that there is a high possibility that the proofreading content is suitable. It is a thing. The same steps as those in FIG. 13 are denoted by the same reference numerals, and redundant description is omitted.

図18において、図13に対しステップS8が追加されている。ステップS8では、ステップS4の判断で、校正後の第二言語の文中の「霊長類の知能の進化については,学識者たちがこれまで多くの説明を提示してきた。」が校正前の第一言語文書と少なくとも構造的に対応していることがわかったので、次に意味による判断を試みる。   In FIG. 18, step S8 is added to FIG. In step S8, according to the determination in step S4, "the scholars have presented many explanations so far about the evolution of primate intelligence" in the sentence of the second language after the proofreading. Now that we know that it is at least structurally compatible with the language document, we next try to make a judgment based on meaning.

異なり部分の「学識者たちがこれまで多くの説明を提示してきた。」のうち、ここでは、サ変名詞「説明」を取り上げる。この文において、「説明」は目的語のheadであるので、対応する校正前の第一言語の文でも目的語のheadにあたる語が「説明」に対応すると構造的な観点から予想がつく。   Of the different parts, "scholars have presented many explanations so far." In this sentence, since “explanation” is the head of the object, it can be predicted from a structural viewpoint that the word corresponding to the head of the object corresponds to “explanation” even in the corresponding sentence in the first language before proofreading.

そこで、”explanation”と「説明」とを比較する。翻訳辞書部27の第一言語単語・熟語辞書27cは英語を見出し語として、日本語の訳語情報を有している。このことから、explanationの日本語訳語候補を列挙すると、例えば以下のものがある。「説明、解釈、解明、弁明、釈明、弁解、意味、解釈、話し合い、和解、談合、相互譲歩」。このリストの中に、「説明」があるため、対応は取れていると判断する。   Therefore, “explanation” is compared with “explanation”. The first language word / idiom dictionary 27c of the translation dictionary unit 27 has Japanese translation information with English as an entry word. From this, Japanese translation candidates for explanation are listed as follows. "Explanation, interpretation, clarification, explanation, explanation, excuse, meaning, interpretation, discussion, reconciliation, collusion, mutual concession." Since there is an “explanation” in this list, it is determined that correspondence has been taken.

ここで、explanationの日本語訳語候補の中に「説明」があるので、”explanation”と「説明」との一致度については調査を打ち切ってもよいが、ここでは反対方向からも調べてみることにする。第二言語単語・熟語辞書27iは日本語を見出し語として、英語の訳語情報を有している。そこで、「説明」の英語訳語候補を列挙すると、”account, explanation, exposition, interpretation, elucidation, illustration, presentation, representation, portrayal, description, caption, legend”などがあり、「説明」の英語訳語候補にも”explanation”が含まれる。   Here, because there is “explanation” among the Japanese translation candidates for explanation, you may discontinue the survey on the degree of coincidence between “explanation” and “explanation”, but here you should also investigate from the opposite direction To. The second language word / idiom dictionary 27i has English translation information with Japanese as a headword. Therefore, enumeration of English explanation candidates for “explanation” includes “account, explanation, exposition, interpretation, elucidation, illustration, presentation, representation, portrayal, description, caption, legend”, etc. Also includes “explanation”.

従って、”explanation”は「説明」の訳語として妥当であることがわかる。これが、こうした意味的対応が異なり部分の少なくとも主要な語に関して確認できると、校正内容適性を有する可能性が高いと判断する(S7)。一方、訳語候補の中に置き換え単語を確認できない場合は、校正内容適性を有する可能性が低い判断する(S6)。   Therefore, it is understood that “explanation” is a valid translation of “explanation”. If this semantic correspondence is different and at least the main word of the part can be confirmed, it is determined that there is a high possibility of having proofreading content suitability (S7). On the other hand, when the replacement word cannot be confirmed in the translation word candidate, it is determined that the possibility of having the proofreading content suitability is low (S6).

例えば、確認できない例として、仮に先のサ変名詞が「議論」であったとする。上記”explanation”の日本語訳語候補の中には「議論」は含まれていない。また、「議論」の英語訳語候補を列挙すると、”argument, discussion, controversy, dispute, debate, issue, colloquy, disputation, haggle”などがあるが、この中にも”explanation”はない。従って、翻訳辞書でわかる範囲では、”explanation”と「議論」は双方向とも対応関係がないものと考えられる。   For example, as an example that cannot be confirmed, it is assumed that the previous saun noun is “discussion”. The “explanation” Japanese translation candidate does not include “discussion”. Moreover, there are “argument, discussion, controversy, dispute, debate, issue, colloquy, disputation, haggle”, etc., but there is no “explanation” among them. Therefore, within the scope of the translation dictionary, “explanation” and “discussion” are considered to have no correspondence in both directions.

このように置き換え単語が第一言語であれば第一言語から第二言語の翻訳辞書を使って辞書引きし、その訳語候補の中に対応する第二言語の単語があれば校正内容適性を有すると判断し、その単語が第二言語であれば第二言語から第一言語の翻訳辞書を使って辞書引きし、その訳語候補の中に対応する第一言語の単語があれば校正内容適性をもつと判断する。   In this way, if the replacement word is the first language, the dictionary is looked up from the first language using the translation dictionary of the second language. If the word is in the second language, the dictionary is looked up from the second language using the translation dictionary in the first language. Judge that it has.

これにより、校正が行われた箇所について、「校正内容適性を有する可能性が低いもの」と「校正内容適性を有する可能性が高いもの」とに分類されたが、「校正内容適性を有する可能性が低いもの」は目視による確認が必要となるので、この分類に該当する箇所はハイライト表示するなど、表示上の工夫を行うことによって、作業者の便宜を図ることもできる。   As a result, the locations where the calibration was performed were classified into “things that are unlikely to have proofreading content suitability” and “things that are likely to have proofreading suitability”, but “possibility to have proofreading content suitability” Since the “low-performing property” needs to be visually confirmed, it is possible to make the operator's convenience by devising the display such as highlighting the portion corresponding to this classification.

次に、図3では、校正内容適性を判断するにあたり、校正分類が文移動、文結合、文分割のいずれかの場合には、校正内容を有する可能性が高いと判断するようにしたが、校正分類が削除と追加との組合せ又は追加である場合は、その削除や追加が行われた単語が内容語であるときは校正内容確認の必要性が相対的に高いと判定し、機能語であるときは校正内容確認の必要性が相対的に低いと判定することも可能である。   Next, in FIG. 3, in determining the suitability of the proofreading content, if the proofreading classification is any of sentence movement, sentence combination, and sentence division, it is determined that the possibility of having the proofreading contents is high. If the proofreading classification is a combination or addition of deletion and addition, if the deleted or added word is a content word, it is determined that the necessity for checking the proofreading content is relatively high, and In some cases, it is possible to determine that the necessity of checking the calibration contents is relatively low.

図19は校正内容適性判断手段32により校正分類が削除と追加との組合せ又は追加である場合の校正内容適性の判断処理を行う場合の一例を示すフローチャートである。   FIG. 19 is a flowchart showing an example of the case where the proofreading content suitability determination means 32 performs a proofreading content suitability determination process when the proofreading classification is a combination or addition of deletion and addition.

校正内容適性判断手段32は、校正分類記憶部31から対象となる対訳文書の校正分類を読み込む(S1)。この場合、対象となる対訳文書は、図20に示した対訳文書の第一言語文書の文である。そして、校正分類は削除と追加の組合せ又は追加か否かを判断する(S2)。   The proofreading content aptitude determination means 32 reads the proofreading classification of the target bilingual document from the proofreading classification storage unit 31 (S1). In this case, the target bilingual document is the sentence of the first language document of the bilingual document shown in FIG. Then, it is determined whether or not the calibration classification is a combination of deletion and addition (S2).

校正分類が削除と追加の組合せ又は追加でない場合は処理を終了し、校正分類が削除と追加の組合せ又は追加である場合は、校正内容適性判断手段32は、解析文書記憶部26から対象となる対訳文書の解析情報を読み出し品詞などの属性情報を得る(S3)。   If the proofreading classification is not a deletion and addition combination or addition, the process ends. If the proofreading classification is a deletion and addition combination or addition, the proofreading content aptitude determination means 32 is targeted from the analysis document storage unit 26. The analysis information of the bilingual document is read to obtain attribute information such as part of speech (S3).

次に、校正前後の対訳文書の重なり部分の単語の品詞に内容語の品詞が含まれるか否かを判定し(S4)、含まれていなければ、校正内容確認の必要性が相対的に低いと判断し(S5)、含まれていれば、校正内容確認の必要性が相対的に高いと判断する(S6)。   Next, it is determined whether or not the part of speech of the content word is included in the part of speech of the overlapping part of the bilingual document before and after the proofreading (S4). (S5) If it is included, it is determined that the necessity of confirmation of the calibration content is relatively high (S6).

このように、校正分類が削除と追加との組合せによる変更、すなわち置換があった場合、又は追加のみがあった場合について、校正前後における対訳文書の異なり部分が内容語であるか機能語であるかを判断する。これは、内容語が文の意味や内容の大半を伝える役割を果たし、単独でも意味を持つ語であるのに対し、機能語は文法的関係を示す以外は独立した意味はほとんど持たない語であり、内容語の変更は機能語単独の変更よりも意味内容を変える可能性が高く、より注意を要するという考えに基づくものである。   As described above, when the proofreading classification is changed by a combination of deletion and addition, that is, when there is a replacement or only addition, the different parts of the parallel translation document before and after the proofreading are content words or function words Determine whether. This is because the content word serves to convey the meaning of the sentence and most of the content and is a word that has meaning alone, whereas the function word is a word that has almost no independent meaning other than showing grammatical relations. Yes, it is based on the idea that changing the content word is more likely to change the semantic content than changing the function word alone and requires more attention.

品詞別には、名詞、形容詞、動詞、副詞は内容語に属するとし、代名詞、前置詞(英語の場合)、接続詞、間投詞は機能語に属するとする。   By part of speech, nouns, adjectives, verbs, and adverbs belong to content words, and pronouns, prepositions (in English), conjunctions, and interjections belong to function words.

図20は図19を適用する場合の対訳文書の一例の説明図である。図20のケース1では、sequencingの後ろにofが入り、ケース2ではもとhumanがentireに置き換わっている。ここでは、ケース1のofが前置詞であり、ケース2の校正前のhumanは名詞であり、校正後のentireは形容詞である。従って、図20の場合、ケース1は機能語の追加であるので校正内容確認の必要性が相対的に低いことになり、ケース2は内容語の置き換えであるので校正内容確認の必要性が相対的に高いことになる。   FIG. 20 is an explanatory diagram of an example of a bilingual document when FIG. 19 is applied. In case 1 of FIG. 20, “of” is inserted after sequencing, and in case 2, human is replaced with “entire”. Here, “of” in case 1 is a preposition, “human” before proofreading in case 2 is a noun, and “entire” after proofreading is an adjective. Therefore, in the case of FIG. 20, since the function word is added in the case 1, the necessity for checking the proofreading contents is relatively low, and in the case 2 the replacement of the contents words, the necessity for checking the proofreading contents is relatively low. It will be expensive.

なお、以上の説明では、英語の場合を想定していたが、日本語の分類では、自立語・付属語の分類がより一般的である。自立語に属する品詞は、名詞・代名詞・連体詞・副詞・接続詞・感動詞・動詞・形容詞・形容動詞であり、付属語に属する品詞は、助動詞・助詞である。そこでこれを上記に当て嵌め、同様の処理を行うことができる。また、校正内容確認の必要性が相対的に高いと判断された箇所はハイライト表示するなど、表示上の工夫を行うことによって、作業者の便宜を図ることもできる。   In the above description, the case of English is assumed. However, in the Japanese classification, the classification of independent words and ancillary words is more common. The parts of speech that belong to independent words are nouns, pronouns, conjunctions, adverbs, conjunctions, emotional verbs, verbs, adjectives, and adjective verbs, and parts of speech that belong to an adjunct are auxiliary verbs and particles. Therefore, this can be applied to the above and the same processing can be performed. In addition, it is possible to improve the convenience of the operator by devising the display such as highlighting a portion that is determined to have a relatively high need for confirmation of calibration contents.

次に、ユーザによる校正内容適性の判断について説明する。図21は、ユーザが校正内容適性の判断を行う際の校正内容確認操作手段34の処理内容を示すフローチャート、図22は、図21を適用する場合の対訳文書の一例の説明図である。   Next, the determination of the suitability of the calibration content by the user will be described. FIG. 21 is a flowchart showing the processing contents of the proofreading content confirmation operation means 34 when the user determines the suitability of the proofreading contents, and FIG. 22 is an explanatory diagram of an example of a parallel translation document when FIG. 21 is applied.

図21において、まず、ユーザによる入力装置18からの指令により制御部24は校正内容確認操作手段34を起動する。校正内容確認操作手段34対訳文書記憶部26から校正前後の対訳文書を読み込み、異なり部分を識別可能に表示装置17に表示する(S1)。   In FIG. 21, first, the control unit 24 activates the calibration content confirmation operation unit 34 according to a command from the input device 18 by the user. The proofreading content confirmation operation means 34 reads the bilingual document before and after proofreading from the bilingual document storage unit 26, and displays the different parts on the display device 17 so that they can be identified (S1).

校正前の文と校正後の文との異なり部分は、図22の文番号1の文では、校正前に「所有者又は使用者」となっていた箇所が校正後に「使用者又は所有者」に、また、校正前に「所有者等」となっていた箇所が校正後に「使用者等」に変化した旨が通知される。これは、校正内容確認操作手段34によりハイライト表示したり、色分け表示したりして通知する。   The difference between the sentence before the proofreading and the sentence after the proofreading is that, in the sentence of sentence number 1 in FIG. 22, the portion that was “owner or user” before the proofreading is “user or owner” after the proofreading. In addition, the user is notified that the part that has become “owner etc.” before the calibration has changed to “user etc.” after the calibration. This is notified by highlighting or color-coded display by the calibration content confirmation operation means 34.

次に、校正内容確認操作手段34は、ユーザに対して、校正対象文のi番めの校正結果の承認を求める(S2)。これは、例えば、表示装置17に承認を求める情報を表示することにより行う。また、iは1から順次1ずつ増加させていくことになる。   Next, the proofreading confirmation operation means 34 asks the user to approve the i-th proofreading result of the proofreading sentence (S2). This is performed, for example, by displaying information requiring approval on the display device 17. In addition, i is sequentially increased from 1 by 1.

そして、校正内容確認操作手段34は、ユーザから承認があるか否かを判断し(S3)、ユーザから承認があると、承認した校正内容は文書全体に及ぼして良いかの承認を求め(S4)、ユーザから承認があるか否かを判断する(S5)。ユーザから承認があると、校正内容確認操作手段34は、承認を確定し、校正前と校正後の変化部分を抽出したマトリックスを作成し(S6)、注目している文の処理は終了する。図23は校正内容承認のマトリックスの一例の説明図である。   Then, the proofreading confirmation operation means 34 determines whether or not there is an approval from the user (S3), and if the approval is received from the user, the approval is requested whether the approved proofreading content may affect the entire document (S4). ), It is determined whether or not there is approval from the user (S5). If there is approval from the user, the proofreading confirmation operation means 34 confirms the approval, creates a matrix in which the changed parts before and after the calibration are extracted (S6), and the processing of the sentence of interest ends. FIG. 23 is an explanatory diagram of an example of a matrix for proofreading content approval.

一方、文書全体には関係しないとの回答である場合、つまり、局所的な修正であるとユーザが回答してきた場合は、注目している文の処理についてはそのまま終了し、校正対象文は最後であるか否かを判断し(S7)、iに1を加算して(S8)、ステップS2に戻る。   On the other hand, if the answer is not related to the whole document, that is, if the user answers that it is a local correction, the processing of the sentence of interest is terminated as it is, and the proofreading sentence is the last. Is determined (S7), 1 is added to i (S8), and the process returns to step S2.

例えば、図22の文番号1の「所有者等」から「使用者等」の変更について、ユーザが承認したが、文書全体には関係しないという選択をした場合、例えば、文番号8のような文においては、「所有者等」は「使用者等」に変更しないことになる。   For example, when the user approves the change from “owner etc.” to “user etc.” of sentence number 1 in FIG. In the sentence, “owner etc.” is not changed to “user etc.”.

ステップS3のユーザの判断で、ユーザが承認しない場合には、校正内容確認操作手段34は校正結果を元に戻すかの承認を求め(S9)、ユーザから承認があるか否かを判断する(S10)。元に戻すとの回答である場合には、校正内容確認操作手段34は校正結果を元に戻す(S11)。   If the user does not approve in step S3, the proofreading confirmation operation means 34 asks for approval to restore the calibration result (S9), and determines whether there is approval from the user (S9). S10). If the answer is to restore, the calibration content confirmation operation means 34 restores the calibration result (S11).

例えば、図22において、「所有者又は使用者」から「使用者又は所有者」への変更に対して、元に戻すという選択肢をとった場合、文は、「現場に当該車両の運転者等がいないために、当該運転者等に対して同項の規定による命令をすることができないときは、警察官等は、当該車両の使用者又は所有者(以下X項までにおいて「使用者等」という。)に対して、直ちに当該車両の駐車の方法を変更し、若しくは当該車両を当該駐車が禁止されている場所から移動すべき旨又は当該車両を当該時間制限駐車区間の当該車両が駐車している場所から移動すべき旨…」から、「現場に当該車両の運転者等がいないために、当該運転者等に対して同項の規定による命令をすることができないときは、警察官等は、当該車両の所有者又は使用者(以下X項までにおいて「使用者等」という。)に対して、直ちに当該車両の駐車の方法を変更し、若しくは当該車両を当該駐車が禁止されている場所から移動すべき旨又は当該車両を当該時間制限駐車区間の当該車両が駐車している場所から移動すべき旨…」に変化する。   For example, in FIG. 22, in the case where the option of returning to the original is taken in response to the change from “owner or user” to “user or owner”, the sentence is “the driver of the vehicle on the site, etc. The police officers, etc., when the instructions given in the same paragraph cannot be given to the driver, etc. due to lack of In other words, the method of parking the vehicle is immediately changed, or the vehicle should be moved from a place where the parking is prohibited, or the vehicle in the time-limited parking section is parked. From the fact that it should move from the place where it is ... ”,“ If there is no driver etc. of the vehicle at the site, the police officer etc. Is the owner or user of the vehicle Change the parking method of the vehicle immediately, or to move the vehicle from the place where the parking is prohibited, or for the time It changes to the effect that it should move from the place where the vehicle in the restricted parking section is parked.

ステップS10の判断で、元に戻す承認がない場合、及び元に戻した後に、校正内容確認操作手段34は、現在の校正対象文の修正の有無を問い合わせる(S12)。ユーザから修正要求があるか否かを判断し(S13)、ユーザからの修正要求があるときは、その修正要求処理を行う(S14)。ステップS13で修正要求がない場合、及び修正要求処理を行った後に、校正対象文は最後であるか否かを判断し(S7)、iに1を加算して(S8)、ステップS2に戻る。   If it is determined in step S10 that there is no approval to restore, and after the restoration, the proofreading content confirmation operation means 34 inquires whether or not the current proofreading sentence has been corrected (S12). It is determined whether or not there is a correction request from the user (S13). If there is a correction request from the user, the correction request processing is performed (S14). If there is no correction request in step S13, and after the correction request processing is performed, it is determined whether or not the sentence to be corrected is the last (S7), 1 is added to i (S8), and the process returns to step S2. .

このように、校正対象文の校正対象箇所がユーザにより妥当であると操作指令された場合はその校正内容を残し、ユーザより修正要求の操作指令があったときは修正内容を受け付け校正内容を修正する。   In this way, if the user is instructed to confirm that the proofreading location of the proofreading sentence is valid, the proofreading content is retained, and if there is a correction request from the user, the correction is accepted and the proofreading content is corrected. To do.

以上示したように、本発明の実施の形態によれば、以下の効果が期待できる。第一に、従来の校正システムのチェック対象が文書が機械翻訳による翻訳結果であったところを、人による翻訳結果にまで対象を広げ、用途が広がったことである。また、今までの校正システムでは、片方の言語のみが変化した場合を扱っていたが、実際の場面に照らし合わせ、両方同時並行的に変更を行う場合にも対応している。しかも、前提条件として、文構造の対応が取れていればよく、制約が少ない。   As described above, according to the embodiment of the present invention, the following effects can be expected. First, the conventional proofreading system checks the document, which was the result of machine translation, but has been expanded to include human translation results, expanding its use. In addition, the conventional proofreading system has dealt with the case where only one language has changed, but it also supports the case where both are changed in parallel in the actual situation. In addition, as a precondition, it is sufficient that the sentence structure is supported, and there are few restrictions.

第二に、原文側に行われた内容変更が、過不足なく訳文側にも反映され、また、訳文側で行った内容変更が過不足なく反映されていることを人手でチェックするには、非常に神経を使うが、これにより、チェックの候補となる箇所が洗い出されるので、漏れを軽減でき効率的である。ユーザは、今まで全文を読み返して各文に対して、第一言語校正前の文、第一言語校正後の文、第二言語校正前の文、第二言語校正後の文の四者を見比べ検討する必要があり、多大な労力を要していたが、本発明の実施の形態では、チェックに要する時間を削減でき、その時間を表現そのものの工夫など創造的な作業にあてることができる。これにより、第一言語の文書も第二言語の文書も常に最新状態に保つことができる。   Secondly, to manually check that the content changes made on the source text are reflected on the translated text side without any excess or deficiency, and that the content changes made on the translated text side are reflected without any excess or deficiency, Although it uses a lot of nerves, this makes it possible to reduce leaks since the candidate areas for checking are identified. The user has read the whole sentence up to now, and for each sentence, the sentence before the first language proofreading, the sentence after the first language proofreading, the sentence before the second language proofreading, and the sentence after the second language proofreading. Although it was necessary to compare and review, and a great deal of labor was required, in the embodiment of the present invention, the time required for checking can be reduced, and the time can be used for creative work such as ingenuity of the expression itself. . Thereby, the document in the first language and the document in the second language can always be kept up-to-date.

11…対訳文書校正装置、12…演算制御装置、13…プロセッサ、14…メモリ、15…対訳文書校正プログラム、16…作業エリア、17…表示装置、18…入力装置、19…マウス、20…キーボード、21…ディスクドライブ、22…ハードディスクドライブ、23…入力処理部、24…制御部、25…記憶装置、26…対訳文書記憶部、27…翻訳辞書部、28…文書解析手段、29…解析情報記憶部、30…校正内容分類手段、31…校正分類記憶部、32…校正内容適性判断手段、33…出力処理部、34…校正内容確認操作手段 DESCRIPTION OF SYMBOLS 11 ... Bilingual document proofreading apparatus, 12 ... Operation control apparatus, 13 ... Processor, 14 ... Memory, 15 ... Bilingual document proofreading program, 16 ... Work area, 17 ... Display apparatus, 18 ... Input device, 19 ... Mouse, 20 ... Keyboard , 21 ... disk drive, 22 ... hard disk drive, 23 ... input processing unit, 24 ... control unit, 25 ... storage device, 26 ... parallel translation document storage unit, 27 ... translation dictionary unit, 28 ... document analysis means, 29 ... analysis information Storage unit 30... Calibration content classifying unit 31... Calibration classification storage unit 32. Calibration content suitability judging unit 33... Output processing unit 34.

Claims (11)

対訳文書校正プログラム及び翻訳辞書部を記憶した記憶装置と、
第一言語文書及びその翻訳結果である第二言語文書に関し、校正前の第一言語文書、校正前の第二言語文書、校正後の第一言語文書及び校正後の第二言語文書を入力するとともに操作に必要な情報を入力する入力装置と、
対訳文書校正の際に必要とする情報を表示する表示装置と、
前記対訳文書校正プログラムを演算実行する演算制御装置とを備えた対訳文書校正装置において、
前記入力装置から入力された校正前の第一言語文書と校正前の第二言語文書とを対にし、校正後の第一言語文書と校正後の第二言語文書とを対にして対訳文書として記憶する対訳文書記憶部と、
前記翻訳辞書部を用いて前記対訳文書記憶部に記憶された校正前の第一言語文書及び校正前の第二言語文書、校正後の第一言語文書及び校正後の第二言語文書を解析しその解析情報を解析情報記憶部に記憶する文書解析手段と、
前記解析情報記憶部に記憶された解析情報に基づいて、校正前の第一言語文書と校正後の第一言語文書、及び校正前の第二言語文書と校正後の第二言語文書とを比較し、校正内容を分類してその校正分類を校正分類記憶部に記憶する校正内容分類手段と、
前記解析情報記憶部に記憶された解析情報及び前記校正分類記憶部に記憶された校正分類に基づいて前記校正内容の適性を判断する校正内容適性判断手段と、
を備えたことを特徴とする対訳文書校正装置。
A storage device storing a bilingual document proofreading program and a translation dictionary unit;
Enter the first language document before proofreading, the second language document before proofreading, the first language document after proofreading, and the second language document after proofreading for the first language document and the second language document that is the translation result. Together with an input device for inputting information necessary for operation,
A display device for displaying information necessary for proofreading a bilingual document;
In the bilingual document proofreading apparatus comprising an arithmetic control device that performs the bilingual document proofreading program,
The first language document before proofreading input from the input device is paired with the second language document before proofreading, and the first language document after proofreading and the second language document after proofreading are paired as a bilingual document. A bilingual document storage unit for storing;
Analyzing the first language document before proofreading, the second language document before proofreading, the first language document after proofreading, and the second language document after proofreading stored in the bilingual document storage unit using the translation dictionary unit Document analysis means for storing the analysis information in the analysis information storage unit,
Based on the analysis information stored in the analysis information storage unit, the first language document before proofreading and the first language document after proofreading, and the second language document before proofreading and the second language document after proofreading are compared. Calibration content classification means for classifying the calibration content and storing the calibration classification in the calibration classification storage unit;
Calibration content suitability judging means for judging the suitability of the calibration content based on the analysis information stored in the analysis information storage unit and the calibration classification stored in the calibration classification storage unit;
A bilingual document proofreading apparatus characterized by comprising:
前記校正内容分類手段は、校正前の第一言語の文書と校正後の第一言語の文書、校正後の第一言語文書と校正後の第二言語文書について、校正による異なり部分がないときは、校正分類は同一とし、校正による異なり部分があるときは、削除、追加、文移動、文分割、文結合、文削除、文追加のいずれかに分類することを特徴とする請求項1記載の対訳文書校正装置。   The proofreading content classifying means, when there is no difference due to the proofreading between the first language document before proofreading and the first language document after proofreading, the first language document after proofreading and the second language document after proofreading The proofreading classification is the same, and when there are different parts due to the proofreading, they are classified into one of deletion, addition, sentence movement, sentence division, sentence combination, sentence deletion, and sentence addition. Bilingual document proofing device. 前記校正内容適性判断手段は校正内容適性結果を前記表示装置に表示出力し、前記表示装置に表示された校正内容適性結果の確認操作をユーザに対して促すとともにユーザから前記入力装置を介して入力された操作指令に基づき校正後の第一言語文書や校正後の第二言語文書の校正内容の確認操作を行う校正内容確認操作手段を設けたことを特徴とする請求項1または2記載の対訳文書校正装置。   The calibration content suitability determination means displays and outputs the calibration content suitability result on the display device, prompts the user to confirm the calibration content suitability result displayed on the display device, and inputs it from the user via the input device. 3. The bilingual translation according to claim 1, further comprising proofreading content confirmation operation means for confirming the proofreading contents of the first language document after proofreading and the second language document after proofreading based on the operated instruction. Document proofing device. 前記校正内容確認操作手段は、前記校正内容適性判断手段により校正内容適性を有すると判断された校正内容を確認修正作業の対象から除外することを特徴とする請求項1乃至3のいずれか1項記載の対訳文書校正装置。   4. The proofreading content confirmation operation means excludes proofreading contents determined to have proofreading content suitability by the proofreading content suitability judging means from the object of confirmation and correction work. The bilingual document proofing device. 前記校正内容適性判断手段は、校正分類が削除や追加である場合は校正内容適性を有しないと判断し、校正分類が文移動、文削除、文追加である場合は校正内容適性を有すると判断することを特徴とする請求項2記載の対訳文書校正装置。   The proofreading content aptitude determination means determines that the proofreading classification is not appropriate when the proofreading classification is deletion or addition, and determines that the proofreading content is appropriate when the proofreading classification is sentence movement, sentence deletion, or sentence addition. The bilingual document proofreading apparatus according to claim 2, wherein: 前記校正内容適性判断手段は、校正分類が削除や追加である場合は、削除された単語の品詞と、削除された単語の置き換えにより追加された単語の品詞とが一致する場合は校正内容適性を有すると判断することを特徴とする請求項2記載の対訳文書校正装置。   When the proofreading classification is deletion or addition, the proofreading content aptitude determination means determines the proofreading content aptitude when the part of speech of the deleted word matches the part of speech of the word added by replacement of the deleted word. 3. The bilingual document proofreading apparatus according to claim 2, wherein the bilingual document proofreading apparatus is judged to have. 前記校正内容適性判断手段は、校正分類が削除や追加である場合は、削除された単語の品詞と、削除された単語の置き換えにより追加された単語の品詞とが一致し、かつ、各々の単語を該当する言語の翻訳辞書部を辞書引きしてそれらが同義語又は異表記である場合には校正内容適性を有すると判断することを特徴とする請求項2記載の対訳文書校正装置。   When the proofreading classification suitability is deletion or addition, the proofreading content suitability judging means matches the part of speech of the deleted word with the part of speech of the word added by replacement of the deleted word, and each word 3. The bilingual document proofreading apparatus according to claim 2, wherein a translation dictionary portion of the corresponding language is looked up in a dictionary and it is determined that the proofreading content is appropriate when they are synonyms or different notations. 前記校正内容適性判断手段は、校正分類が削除や追加であり、校正前の第一言語文書の文構造と校正後の第二言語文書の文構造、又は校正前の第二言語文書の文構造と校正後の第一言語文書の文構造とが文型上対応関係にあり、削除された単語の品詞と、削除された単語の置き換えにより追加された単語の品詞とが一致する場合は、校正内容適性を有すると判断することを特徴とする請求項2記載の対訳文書校正装置。   The proofreading content aptitude judgment means is that the proofreading classification is deletion or addition, the sentence structure of the first language document before proofreading and the sentence structure of the second language document after proofreading, or the sentence structure of the second language document before proofreading And the sentence structure of the first language document after proofreading have a correspondence in sentence pattern, and the part of speech of the deleted word matches the part of speech of the word added by replacing the deleted word. 3. The bilingual document proofreading apparatus according to claim 2, wherein the bilingual document proofreading apparatus is determined to be suitable. 前記校正内容適性判断手段は、校正分類が削除や追加であり、校正前の第一言語文書の文構造と校正後の第二言語文書の文構造、又は校正前の第二言語文書の文構造と校正後の第一言語文書の文構造とが文型上対応関係にあり、削除された単語の品詞と、削除された単語の置き換えにより追加された単語の品詞とが一致する場合は、その単語が第一言語であれば第一言語から第二言語の翻訳辞書を使って辞書引きし、その訳語候補の中に対応する第二言語の単語があれば校正内容適性を有すると判断し、その単語が第二言語であれば第二言語から第一言語の翻訳辞書を使って辞書引きし、その訳語候補の中に対応する第一言語の単語があれば校正内容適性をもつと判断することを特徴とする請求項2記載の対訳文書校正装置。   The proofreading content aptitude judgment means is that the proofreading classification is deletion or addition, the sentence structure of the first language document before proofreading and the sentence structure of the second language document after proofreading, or the sentence structure of the second language document before proofreading And the sentence structure of the first language document after proofreading have a correspondence in sentence pattern, and the part of speech of the deleted word matches the part of speech of the word added by replacement of the deleted word If it is the first language, the dictionary is looked up using the translation dictionary of the first language from the first language, and if there is a corresponding second language word among the translation candidates, it is determined that the proofreading content is suitable, If the word is in the second language, the dictionary is looked up using the translation dictionary from the second language to the first language, and if there is a corresponding word in the first language in the translation candidate, it is judged that the proofreading content is suitable The bilingual document proofreading apparatus according to claim 2. 前記校正内容適性判断手段は、校正分類が削除と追加との組合せ又は追加である場合は、その削除や追加が行われた単語が内容語であるときは校正内容確認の必要性が相対的に高いと判定し、機能語であるときは校正内容確認の必要性が相対的に低いと判定することを特徴とする請求項1記載の対訳文書校正装置。   When the proofreading classification is a combination or addition of deletion and addition, if the word that has been deleted or added is a content word, the proofreading content aptitude determination means is relatively necessary to confirm the proofreading content. 2. The bilingual document proofreading apparatus according to claim 1, wherein the bilingual document proofreading apparatus determines that the necessity of checking the proofreading content is relatively low when it is determined to be high and is a function word. 前記校正内容確認操作手段は、校正箇所がユーザにより妥当であると操作指令された場合はその校正内容を残し、ユーザより修正要求の操作指令があったときは修正内容を受け付け校正内容を修正することを特徴とする請求項3記載の対訳文書校正装置。   The calibration content confirmation operation means leaves the calibration content when the user is instructed that the calibration location is valid, and accepts the correction content and corrects the calibration content when there is a correction request operation command from the user. The bilingual document proofreading apparatus according to claim 3.
JP2009141986A 2009-06-15 2009-06-15 Bilingual document proofing device Active JP5508766B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009141986A JP5508766B2 (en) 2009-06-15 2009-06-15 Bilingual document proofing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009141986A JP5508766B2 (en) 2009-06-15 2009-06-15 Bilingual document proofing device

Publications (2)

Publication Number Publication Date
JP2010287149A true JP2010287149A (en) 2010-12-24
JP5508766B2 JP5508766B2 (en) 2014-06-04

Family

ID=43542782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009141986A Active JP5508766B2 (en) 2009-06-15 2009-06-15 Bilingual document proofing device

Country Status (1)

Country Link
JP (1) JP5508766B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104584005A (en) * 2012-08-22 2015-04-29 株式会社东芝 Document classification device and document classification method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004213646A (en) * 2002-12-18 2004-07-29 Ricoh Co Ltd Translation support system and program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004213646A (en) * 2002-12-18 2004-07-29 Ricoh Co Ltd Translation support system and program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNJ200910038176; 森田 大翼 外1名: '共同翻訳のためのプロトコルと支援システムの開発' FIT2008 第7回情報科学技術フォーラム 講演論文集 第3分冊 査読付き論文・一般論文 画像認識 , 20080820, p.417-420, 社団法人電子情報通信学会 社団法人情報処理学会 *
JPN6013031827; 森田 大翼 外1名: '共同翻訳のためのプロトコルと支援システムの開発' FIT2008 第7回情報科学技術フォーラム 講演論文集 第3分冊 査読付き論文・一般論文 画像認識 , 20080820, p.417-420, 社団法人電子情報通信学会 社団法人情報処理学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104584005A (en) * 2012-08-22 2015-04-29 株式会社东芝 Document classification device and document classification method
CN104584005B (en) * 2012-08-22 2018-01-05 株式会社东芝 Document sorting apparatus and Document Classification Method

Also Published As

Publication number Publication date
JP5508766B2 (en) 2014-06-04

Similar Documents

Publication Publication Date Title
CN107209759B (en) Annotation support device and recording medium
RU2136038C1 (en) Computer system and method for preparing texts in source language and their translation into foreign languages
US20030101044A1 (en) Word, expression, and sentence translation management tool
US20060247914A1 (en) System and method for automatic enrichment of documents
US20170199878A1 (en) Method and system for generating an architecture document for describing a system framework
JP5508766B2 (en) Bilingual document proofing device
US7620541B2 (en) Critiquing clitic pronoun ordering in french
Roturier Assessing a set of Controlled Language rules: Can they improve the performance of commercial Machine Translation systems
JP4845857B2 (en) Machine translation apparatus and machine translation program
JP4371080B2 (en) Natural language learning support apparatus and method
JP2003006191A (en) Device and method for supporting preparation of foreign language document and program recording medium
JPH08190562A (en) Machine translation system
JP3131432B2 (en) Machine translation method and machine translation device
JP5331964B2 (en) Translation support device, translation support method, and translation support program
JP6045948B2 (en) Machine translation apparatus and machine translation program
Adriaens SECC: Using text structure information to improve checker quality and coverage
JP2006127356A (en) Machine translation device, program and recording medium
Sheremetyeva Controlled Authoring In A Hybrid Russian-English Machine Translation System
Memmesheimer et al. A German Parallel Clausal Coordinate Ellipsis Corpus that Aligns Sentences from the TüBa-D/Z Treebank with Reconstructed Canonical Forms
JP3197110B2 (en) Natural language analyzer and machine translator
Supardi et al. Contrastive Analysis of Concord in Arabic, English, and Indonesian
Balcha et al. Design and Development of Sentence Parser for Afan Oromo Language
JPWO2008123081A1 (en) Character data processing method, computer program, and character data processing system
JP4023384B2 (en) Natural language translation method and apparatus and natural language translation program
Knops Controlled language–issues in checkers’ design

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130702

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140324

R150 Certificate of patent or registration of utility model

Ref document number: 5508766

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350