JP2021140281A - Translation assistance system and program - Google Patents

Translation assistance system and program Download PDF

Info

Publication number
JP2021140281A
JP2021140281A JP2020035382A JP2020035382A JP2021140281A JP 2021140281 A JP2021140281 A JP 2021140281A JP 2020035382 A JP2020035382 A JP 2020035382A JP 2020035382 A JP2020035382 A JP 2020035382A JP 2021140281 A JP2021140281 A JP 2021140281A
Authority
JP
Japan
Prior art keywords
translation
segment
language
support system
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020035382A
Other languages
Japanese (ja)
Inventor
奨 本間
Susumu Honma
奨 本間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nihon Tokkyo Honyaku Co Ltd
Original Assignee
Nihon Tokkyo Honyaku Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nihon Tokkyo Honyaku Co Ltd filed Critical Nihon Tokkyo Honyaku Co Ltd
Priority to JP2020035382A priority Critical patent/JP2021140281A/en
Publication of JP2021140281A publication Critical patent/JP2021140281A/en
Pending legal-status Critical Current

Links

Images

Abstract

To provide a translation assistance system and a program which can easily assist in translation by a combination of field-specific machine translation means.SOLUTION: The translation assistance system for assisting in work of translating a document in a first language to a document in a second language uses a plurality of machine translation engines each of which can translate sentences in the first language to sentences in the second language by machine translation, to divide the document in the first language into prescribed segment units and generates translation results of the plurality of machine translation engines with respect to each of the segments obtained by the division. The translation assistance system evaluates each of the generated translation results from the plurality of machine translation engines and selects and outputs one to be employed of the translation results on the basis of evaluation results with respect to each of the segments.SELECTED DRAWING: Figure 1

Description

本発明は、翻訳支援システム及びプログラムに関する。 The present invention relates to a translation support system and a program.

従来から翻訳支援システムと機械翻訳を組み合わせて翻訳支援する技術が知られている。例えば、特許文献1には、原言語文から目的言語文への機械翻訳を支援するための翻訳支援システムが開示されている。この特許文献1に開示されたシステムは、原言語文から目的言語文への機械翻訳が正しく行われない複数の原言語文に含まれる単語又は単語の組み合わせを格納するエラーデータベースを備えるとともに、複数の原言語文、及び該複数の原言語文に対応する所定の条件を満たす形式で表された制御された原言語文である被制御原言語文を格納する被制御原言語文データベースを備える。そしてこのシステムでは、入力された原言語文が機械翻訳可能であるか否かを判定して、機械翻訳可能でないと判定された入力された原言語文を出力する。 Conventionally, a technique for supporting translation by combining a translation support system and machine translation has been known. For example, Patent Document 1 discloses a translation support system for supporting machine translation from a source language sentence to a target language sentence. The system disclosed in Patent Document 1 includes an error database for storing words or word combinations contained in a plurality of original language sentences in which machine translation from the original language sentence to the target language sentence is not performed correctly, and a plurality of systems. It is provided with a controlled original language sentence database for storing the original language sentence of the above and the controlled original language sentence which is a controlled original language sentence expressed in a format corresponding to the plurality of original language sentences and satisfying a predetermined condition. Then, in this system, it is determined whether or not the input original language sentence is machine-translatable, and the input original language sentence determined that the input original language sentence is not machine-translatable is output.

特開2018-169715号公報Japanese Unexamined Patent Publication No. 2018-169715

しかしながら、上記従来の技術では、エラーデータベースや被制御原言語文データベースを原言語文の分野ごと、など、個別に構築する必要がある。このため例えば特許出願明細書翻訳のように多彩な技術分野を対象とした翻訳を支援する場合、これらのデータベースを構築することは、手間であり、困難なものとなる。 However, in the above-mentioned conventional technique, it is necessary to individually construct an error database and a controlled original language sentence database for each field of the original language sentence. Therefore, when supporting translation for various technical fields such as translation of patent application specifications, it is troublesome and difficult to construct these databases.

さらに、機械翻訳(MT)の手段も、特許専用MTなど分野に特化したMTは高精度化が達成しやすい反面、翻訳時に原言語文の分野に応じてMTエンジンを指定する必要がある。しかし翻訳の対象とする原言語文は、必ずしも単一の分野の文ばかりからなるとは限らない。そこで、翻訳支援システムを用いて翻訳者が翻訳に着手する際にまず一括して翻訳しようとする場合、分野が変わるごとに(原言語文の部分ごとに)、MTエンジンを指定しなければ、上記高精度化の恩恵が得られないが、このような部分ごとのMTエンジンの指定もまた、困難なものである。 Further, as for the means of machine translation (MT), while MT specialized in a field such as a patent-only MT can easily achieve high accuracy, it is necessary to specify an MT engine according to the field of the original language sentence at the time of translation. However, the original language sentences to be translated do not always consist of sentences in a single field. Therefore, when a translator uses a translation support system to start translation, if he / she first tries to translate all at once, he / she must specify the MT engine every time the field changes (for each part of the original language sentence). Although the benefits of the above-mentioned high precision cannot be obtained, it is also difficult to specify the MT engine for each part.

本発明は上記実情に鑑みて為されたもので、分野特化型の機械翻訳手段を組み合わせた翻訳支援を簡便に行うことのできる翻訳支援システム及びプログラムを提供することを、その目的の一つとする。 The present invention has been made in view of the above circumstances, and one of its purposes is to provide a translation support system and a program capable of easily performing translation support by combining field-specific machine translation means. do.

上記従来例の問題点を解決する本発明の一態様は、第一の言語の文書を第二の言語の文書へ翻訳する作業を支援する翻訳支援システムであって、それぞれが第一の言語の文を第二言語の文に機械翻訳可能な、複数の機械翻訳手段と、前記第一の言語の文書を、所定のセグメント単位に分割する分割手段と、前記分割により得られたセグメントごとに、前記複数の機械翻訳手段による翻訳結果を生成する手段と、前記複数の機械翻訳手段による翻訳結果のそれぞれを評価する評価手段と、前記セグメントごとに、前記評価結果に基づいて、前記複数の機械翻訳手段による翻訳結果のうちから採用する翻訳結果を一つ選択する選択手段と、前記セグメントごとに選択された翻訳結果を出力する出力手段と、を含むこととしたものである。 One aspect of the present invention that solves the problems of the above conventional examples is a translation support system that supports the work of translating a document in a first language into a document in a second language, each of which is of the first language. A plurality of machine translation means capable of machine translating a sentence into a sentence in a second language, a dividing means for dividing a document in the first language into predetermined segment units, and each segment obtained by the division. A means for generating translation results by the plurality of machine translation means, an evaluation means for evaluating each of the translation results by the plurality of machine translation means, and the plurality of machine translations for each of the segments based on the evaluation results. It includes a selection means for selecting one translation result to be adopted from the translation results by the means, and an output means for outputting the translation result selected for each segment.

本発明によると、分野特化型の機械翻訳手段を組み合わせた翻訳支援を簡便に行うことが可能となる。 According to the present invention, it is possible to easily perform translation support by combining field-specific machine translation means.

本発明の実施の形態に係る翻訳支援システムの構成例を表すブロック図である。It is a block diagram which shows the structural example of the translation support system which concerns on embodiment of this invention. 本発明の実施の形態に係る翻訳支援システムの例を表す機能ブロック図である。It is a functional block diagram which shows the example of the translation support system which concerns on embodiment of this invention. 本発明の実施の形態に係る翻訳支援システムが出力する情報の例を表す説明図である。It is explanatory drawing which shows the example of the information output by the translation support system which concerns on embodiment of this invention. 本発明の実施の形態に係る翻訳支援システムの動作の流れの例を表す流れ図である。It is a flow chart which shows the example of the operation flow of the translation support system which concerns on embodiment of this invention.

本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る翻訳支援システム1は、図1に例示するように、一般的なコンピュータによって実現され、制御部11,記憶部12,操作部13,並びに表示部14を少なくとも備える。 Embodiments of the present invention will be described with reference to the drawings. As illustrated in FIG. 1, the translation support system 1 according to the embodiment of the present invention is realized by a general computer and includes at least a control unit 11, a storage unit 12, an operation unit 13, and a display unit 14.

制御部11は、CPU等のプログラム制御デバイスであって、記憶部12に格納されたプログラムに従って動作する。本実施の形態の一例において、この制御部11は、翻訳の対象となる第一の言語の文の入力を受け入れる。制御部11は、入力された第一の言語の文を所定のセグメント単位に分割する。制御部11は、複数の機械翻訳プログラムモジュールを実行しており、これら複数の機械翻訳プログラムモジュールのそれぞれを実行することにより、入力された第一の言語の文を、上記分割して得たセグメント単位ごとに、第二の言語の文に機械翻訳する。なお、ここでは上記複数の機械翻訳プログラムモジュールを実行することで、制御部11は、第一の言語の文の各セグメントを第二の言語の文の対応するセグメントに翻訳可能となっているものとする。 The control unit 11 is a program control device such as a CPU, and operates according to a program stored in the storage unit 12. In an example of this embodiment, the control unit 11 accepts the input of a sentence in the first language to be translated. The control unit 11 divides the input first language sentence into predetermined segment units. The control unit 11 executes a plurality of machine translation program modules, and by executing each of the plurality of machine translation program modules, the input first language sentence is divided into the segments obtained. Machine translate each unit into a sentence in a second language. Here, by executing the plurality of machine translation program modules, the control unit 11 can translate each segment of the sentence of the first language into the corresponding segment of the sentence of the second language. And.

各機械翻訳プログラムモジュールは、それぞれ互いに異なる辞書、分析規則、あるいは機械学習結果等により、共通の第一の言語の文のセグメントを、一般的には、互いに異なる第二の言語の文のセグメントに翻訳することとなる。 Each machine translation program module uses different dictionaries, analysis rules, machine learning results, etc. to transform a common first language sentence segment into a second language sentence segment that is generally different from each other. It will be translated.

制御部11は、分割により得られたセグメントごとに、各機械翻訳プログラムモジュールの処理により得られた、対応する第二の言語の文のセグメント(翻訳結果)を評価する。制御部11は、そして、この評価の結果により、上記分割により得られたセグメントごとに、各機械翻訳プログラムモジュールの処理により得られた、対応する第二の言語の文のセグメントのいずれかを選択して、当該選択したセグメントを出力する。この制御部11の詳しい処理の内容は、後に述べる。 The control unit 11 evaluates the segment (translation result) of the sentence of the corresponding second language obtained by the processing of each machine translation program module for each segment obtained by the division. Based on the result of this evaluation, the control unit 11 selects one of the corresponding second language sentence segments obtained by the processing of each machine translation program module for each segment obtained by the above division. Then, the selected segment is output. The details of the processing of the control unit 11 will be described later.

記憶部12は、メモリやディスクデバイス等の記憶デバイスであり、制御部11によって実行されるプログラム(機械翻訳プログラムを含む)を保持する。またこの記憶部12は、制御部11のワークメモリとしても動作する。この記憶部12に格納されたプログラムは、コンピュータ可読かつ非一時的な記録媒体に格納されて提供され、この記憶部12に複写されたものであってもよい。 The storage unit 12 is a storage device such as a memory or a disk device, and holds a program (including a machine translation program) executed by the control unit 11. The storage unit 12 also operates as a work memory for the control unit 11. The program stored in the storage unit 12 may be provided by being stored in a computer-readable and non-temporary recording medium, and may be copied in the storage unit 12.

操作部13は、キーボードやマウス等を含み、ユーザの操作を受け入れて、当該操作の内容を表す情報を制御部11に出力する。表示部14は、ディスプレイ等であり、制御部11から入力される指示に従って情報を表示出力する。 The operation unit 13 includes a keyboard, a mouse, and the like, accepts a user's operation, and outputs information representing the content of the operation to the control unit 11. The display unit 14 is a display or the like, and displays and outputs information according to an instruction input from the control unit 11.

次に、制御部11の動作について説明する。本実施の形態では、この制御部11は、図2に例示するように、原文受入部21と、前処理部22と、セグメント分割部23と、機械翻訳処理部24と、翻訳評価部25と、選択部26と、後処理部27と、出力部28とを機能的に含む。 Next, the operation of the control unit 11 will be described. In the present embodiment, as illustrated in FIG. 2, the control unit 11 includes the original text receiving unit 21, the preprocessing unit 22, the segment dividing unit 23, the machine translation processing unit 24, and the translation evaluation unit 25. , A selection unit 26, a post-processing unit 27, and an output unit 28 are functionally included.

原文受入部21は、翻訳の対象となる第一の言語の文書の入力を受け入れて、前処理部22とセグメント分割部23とに出力する。具体的にこの原文受入部21は、例えば図示しないネットワークインタフェースを介してネットワーク上の他のコンピュータから第一の言語の文書を受け入れる。 The original text receiving unit 21 accepts the input of the document in the first language to be translated and outputs it to the preprocessing unit 22 and the segment dividing unit 23. Specifically, the source text receiving unit 21 receives a document in the first language from another computer on the network, for example, via a network interface (not shown).

前処理部22は、原文受入部21が受け入れた第一の言語の文書に対して、所定の前処理を実行する。この前処理は、原文受入部21が受け入れた文書の種類ごとに予め定めておけばよい。一例として特許出願文書における特許請求の範囲の請求項の翻訳における前処理が考えられる。一般に請求項は、後に述べるセグメント分割部23により、一つの請求項が複数のセグメントに分割され得る。ところが、伝統的に請求項が一文で記載されることが多いために次のような問題が生じる。ここで具体的に、 The preprocessing unit 22 executes a predetermined preprocessing on the document in the first language accepted by the original text receiving unit 21. This preprocessing may be predetermined for each type of document accepted by the original text receiving unit 21. As an example, preprocessing in translation of claims in a patent application document can be considered. In general, one claim can be divided into a plurality of segments by the segment division unit 23 described later. However, since the claims are traditionally described in one sentence, the following problems occur. Here specifically

AするA手段と、
BするB手段と、
を備えるX。
というように、「AするA手段」などの構成要素部と、「…を備えるX」のような主題部とを含む請求項を例として前処理部22の動作例について説明する。この例の請求項は、英語に翻訳される場合、
A means to A and
B means to B and
X with.
As described above, an operation example of the preprocessing unit 22 will be described by taking as an example a claim including a component unit such as "A means A" and a subject unit such as "X having ...". If the claims in this example are translated into English,

X comprising:
A means for doing A, and
B means for doing B.
のように翻訳が出力されることが期待される。
X comprising: X comprising:
A means for doing A, and
B means for doing B.
It is expected that the translation will be output as follows.

ところが後述のセグメント分割部23により、各構成要素部と、主題部とが分割されることとなり、それぞれのセグメントの機械翻訳時に、他のセグメントの情報が参照されることはないため、前処理を行わずにそのまま翻訳処理を行って連結すると、各セグメントが正しく翻訳されたとしても、 However, each component part and the subject part are divided by the segment division part 23 described later, and the information of other segments is not referred to at the time of machine translation of each segment. If you perform the translation process as it is and concatenate without doing it, even if each segment is translated correctly,

A means for doing A,
B means for doing B,
X comprises ?.
(最後の「?」は対応する語が見出せないことを示す)
のように翻訳されることとなってしまう。
A means for doing A,
B means for doing B,
X? ..
(The last "?" Indicates that the corresponding word cannot be found)
It will be translated as.

そこで前処理部22では、こうした請求項の翻訳に対応して、翻訳後に主題部を転置して、主題部が先頭に配置あるいは後置されることとなるよう、原文受入部21から入力された文書のうち請求項に係る文について、主題部と、構成要素部とをそれぞれ認識する。具体的に前処理部22は、主題部に含まれる「…を備える(comprise)」、「…を含む(include)」等の語句を手掛かりとして(このような語句を以下、手掛かり句と呼ぶ)、主題部と、当該主題部に含まれる主題語句(上述の例でいう「X」)を特定する。 Therefore, in the preprocessing unit 22, the subject unit is transposed after the translation in response to the translation of the claim, and the subject unit is input from the original text receiving unit 21 so that the subject unit is placed at the beginning or after the translation. Regarding the sentence related to the claim in the document, the subject part and the component part are recognized respectively. Specifically, the preprocessing unit 22 uses words such as “comprise” and “include” included in the subject part as clues (such words are hereinafter referred to as clues). , The subject part and the subject phrase (“X” in the above example) included in the subject part are specified.

また前処理部22は、主題部以外の文節であって、「,(カンマ)」や「;(セミコロン)」等で分割される要素を、構成要素部として取り出す。 Further, the preprocessing unit 22 extracts elements other than the subject unit and which are divided by ", (comma)", "; (semicolon)", etc., as component units.

そして前処理部22は、請求項の文の各部分について、当該部分が「主題部」であるか「構成要素部」であるかを表す範囲識別情報を関連付けて記録する。この範囲識別情報は、後の後処理部27において利用される。 Then, the preprocessing unit 22 records each part of the claim sentence in association with range identification information indicating whether the part is a “subject part” or a “component part”. This range identification information is used later in the post-processing unit 27.

セグメント分割部23は、原文受入部21が受け入れた第一の言語の文書を、所定の規則に従い、セグメントSi(i=1,2…)に分割する。一例として、このセグメント分割部23は、予め定められたセグメントの区切り句、あるいは記号等を検出して、当該検出した位置の前後で文書を分割することによりセグメントSi(i=1,2…)を得る。ここでセグメントの区切り句、あるいは記号等としては、
・ピリオド(文末記号)
・コロン
・改行
・「,and」の次に現れる「,」
・「,or」の次に現れる「,」
などとしておく。
The segment division unit 23 divides the document in the first language accepted by the original text reception unit 21 into segments Si (i = 1, 2, ...) According to a predetermined rule. As an example, the segment division unit 23 detects a predetermined segment break phrase, symbol, or the like, and divides the document before and after the detected position to divide the document into segments Si (i = 1, 2, ...). To get. Here, as a segment delimiter, a symbol, etc.,
・ Period (end of sentence)
・ Colon ・ Line feed ・ "," that appears after ", and"
・ "," Appearing after ", or"
And so on.

従って例えば、原文例:
A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising: [LF]
a cubic bag in which a liquid storage portion for containing the liquid is provided, [LF]
a liquid outlet for leading out the liquid in the bag to the liquid ejection apparatus, [LF]
wherein when the three dimensional cartesian coordinates is defined with a X-direction, a Y-direction, and a Z-direction, the X direction being defined as a direction along a direction from one edge side of the bag toward the other edge side, [LF]
a spacer member is arranged at a position of the sides of the bag, where the sides are parallel to the YZ plane. [LF]
について、このセグメント分割部23は、次のようにセグメントに分割する。なお、上記の例では、改行を明示するため、改行の位置を「[LF]」とした。
So, for example, the original example:
A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising: [LF]
a cubic bag in which a liquid storage portion for containing the liquid is provided, [LF]
a liquid outlet for leading out the liquid in the bag to the liquid ejection apparatus, [LF]
When the three dimensional cartesian coordinates is defined with a X-direction, a Y-direction, and a Z-direction, the X direction being defined as a direction along a direction from one edge side of the bag toward the other edge side, [LF]
a spacer member is arranged at a position of the sides of the bag, where the sides are parallel to the YZ plane. [LF]
The segment division unit 23 divides the segment into segments as follows. In the above example, the line feed position is set to "[LF]" in order to clearly indicate the line feed.

・セグメント1:A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising:
・セグメント2:a cubic bag in which a liquid storage portion for containing the liquid is provided,
・セグメント3:a liquid outlet for leading out the liquid in the bag to the liquid ejection apparatus,
・セグメント4:wherein when the three dimensional cartesian coordinates is defined with a X-direction, a Y-direction, and a Z-direction,
・セグメント5:the X direction being defined as a direction along a direction from one edge side of the bag toward the other edge side,
・セグメント6:a spacer member is arranged at a position of the sides of the bag, where the sides are parallel to the YZ plane.
・ Segment 1: A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising:
・ Segment 2: a cubic bag in which a liquid storage portion for containing the liquid is provided,
・ Segment 3: a liquid outlet for leading out the liquid in the bag to the liquid ejection apparatus,
・ Segment 4: where in when the three dimensional cartesian coordinates is defined with a X-direction, a Y-direction, and a Z-direction,
・ Segment 5: the X direction being defined as a direction along a direction from one edge side of the bag toward the other edge side,
・ Segment 6: a spacer member is arranged at a position of the sides of the bag, where the sides are parallel to the YZ plane.

またこのセグメント分割部23は、前処理部22が生成した範囲識別情報を参照して、各セグメントを識別する識別情報(セグメントごとの連番でよい)と、当該識別情報で識別されるセグメントが、主題部を含むか否か、及び、構成要素部を含むか否かを表す情報を関連付けて記録する。 Further, the segment division unit 23 refers to the range identification information generated by the preprocessing unit 22, and the identification information for identifying each segment (a serial number for each segment may be used) and the segment identified by the identification information are obtained. , Information indicating whether or not the subject part is included and whether or not the component part is included is recorded in association with each other.

具体的にセグメント分割部23は、請求項の項番をあらわす数字を含むセグメントの次のセグメントを、主題部とする。また、セグメント分割部23は、主題部としたセグメント(主題セグメントと呼ぶ)の次のセグメントから所定の語、例えば第一の言語が英語であれば「wherein」を先頭に含むセグメントの直前のセグメントまでを、構成要素部のセグメント(構成要素セグメント)とし、whereinより後のセグメントを構成要素説明部のセグメントとする。セグメント分割部23は、各セグメントを識別する識別情報に、各セグメントが主題部セグメント、構成要素セグメント、構成要素説明部セグメントのいずれであるかを表す情報を、関連付けて記録する。 Specifically, the segment division unit 23 has the subject unit as the next segment of the segment including the number representing the item number of the claim. Further, the segment division unit 23 is a segment immediately before a segment containing "where in" at the beginning of a predetermined word, for example, if the first language is English, from the segment next to the segment (referred to as the subject segment) as the subject portion. Up to is a segment of the component part (component segment), and the segment after wherein is a segment of the component explanation part. The segment division unit 23 records the identification information that identifies each segment in association with information indicating whether each segment is a subject segment, a component segment, or a component description segment.

さらにセグメント分割部23は、セグメント末尾が予め定めたパターンに合致する場合は、当該パターンに合致する部分を、パターンに対応して予め定めた文字列に置換することとしてもよい。例えば、末尾の「,(カンマ)」や、「,and」を、「.(ピリオド)」に置換してもよい。この処理により機械翻訳エンジンが、セグメントを一文であるかのように翻訳することとなる。 Further, when the end of the segment matches a predetermined pattern, the segment division unit 23 may replace the portion matching the pattern with a predetermined character string corresponding to the pattern. For example, the trailing ", (comma)" or ", and" may be replaced with ". (Period)". This process causes the machine translation engine to translate the segment as if it were a single sentence.

セグメント分割部23は、こうして原文受入部21が受け入れた第一の言語の文書を分割して得られたセグメントを順次、機械翻訳処理部24に出力する。 The segment division unit 23 sequentially outputs the segments obtained by dividing the document in the first language accepted by the original text receiving unit 21 to the machine translation processing unit 24.

機械翻訳処理部24は、セグメント分割部23から入力されるセグメントSi(i=1,2…)のそれぞれを、複数の翻訳エンジンEj(j=1,2,…)により翻訳して、各翻訳エンジンEjでの第二の言語への翻訳結果Tj(Si)を得る。 The machine translation processing unit 24 translates each of the segments Si (i = 1, 2, ...) Input from the segment division unit 23 by a plurality of translation engines Ej (j = 1, 2, ...), And translates each segment. The translation result Tj (Si) into the second language by the engine Ej is obtained.

ここで機械翻訳処理部24が用いる翻訳エンジンEjの機械翻訳プログラムモジュールは、それぞれ互いに異なる辞書を用い、また、互いに異なる分析規則や機械学習結果等、翻訳方式を用いているものとする。従って第一の言語の文のセグメントを、一般的には、互いに異なる第二の言語の文のセグメントに翻訳することとなる。 Here, it is assumed that the machine translation program modules of the translation engine Ej used by the machine translation processing unit 24 use different dictionaries, and use different translation methods such as analysis rules and machine learning results. Therefore, a segment of a sentence in a first language is generally translated into a segment of a sentence in a second language that is different from each other.

一例としてここでの翻訳エンジンEjは、それぞれ、
・特許文献及び一般文献から抽出した日英の対訳文(文対)を訓練データとして機械学習した汎用のニューラルトランスレータ(汎用NT)と、
・特許文献から抽出した日英の文対を訓練データとして機械学習した特許文献用ニューラルトランスレータ(特許NT)と、
・汎用NTまたは特許NTをベースに、さらに特定の分野の翻訳文から抽出した、日英の文対を追加的に機械学習させたアダプテーションエンジン(AT)と、
であるものとする。
As an example, the translation engine Ej here is
-A general-purpose neural translator (general-purpose NT) that is machine-learned using Japanese-English bilingual sentences (sentence pairs) extracted from patent documents and general documents as training data.
-A neural translator for patent documents (Patent NT) that machine-learned Japanese-English sentence pairs extracted from patent documents as training data, and
-Based on general-purpose NT or patent NT, an adaptation engine (AT) that additionally machine-learns Japanese-English sentence pairs extracted from translated sentences in a specific field, and
Suppose that

この例では、汎用NT,特許NT,ATの3つの機械翻訳プログラムモジュールが、上記セグメントのそれぞれを翻訳した結果を出力することとなる。 In this example, the three machine translation program modules, general-purpose NT, patent NT, and AT, output the results of translating each of the above segments.

翻訳評価部25は、機械翻訳処理部24が備える複数の翻訳エンジンEjのセグメントSiごとの各翻訳結果Tj(Si)を受け入れ、当該セグメントSiに係る翻訳結果のそれぞれを所定の方法で評価する。 The translation evaluation unit 25 accepts each translation result Tj (Si) for each segment Si of the plurality of translation engines Ej included in the machine translation processing unit 24, and evaluates each of the translation results related to the segment Si by a predetermined method.

一例としてこの評価は次のようにして行われる。翻訳評価部25は、セグメントSiに係る翻訳結果Tj(Si)のそれぞれを第一の言語の文に逆翻訳して、評価文Si′を得る。ここで翻訳評価部25が逆翻訳に用いる機械翻訳エンジンは、逆翻訳の対象とする翻訳結果を出力した機械翻訳エンジン(翻訳時と同じ学習データを用いて機械学習した翻訳エンジン)を利用するものとする。つまり上述の例では、汎用NTにより翻訳された翻訳結果である第二の言語の文は、同じく汎用NTにより逆翻訳して第一の言語の文とする。また特許NTにより翻訳された翻訳結果である第二の言語の文は、同じく特許NTにより逆翻訳して第一の言語の文とする…というように、対応する翻訳エンジンによりそれぞれ逆翻訳を行うこととする。 As an example, this evaluation is performed as follows. The translation evaluation unit 25 reverse-translates each of the translation results Tj (Si) related to the segment Si into a sentence in the first language to obtain an evaluation sentence Si'. Here, the machine translation engine used by the translation evaluation unit 25 for reverse translation uses a machine translation engine (a translation engine that has been machine-learned using the same learning data as at the time of translation) that outputs the translation result to be reverse-translated. And. That is, in the above example, the sentence in the second language, which is the translation result translated by the general-purpose NT, is also back-translated by the general-purpose NT to become the sentence in the first language. In addition, the sentence in the second language, which is the translation result translated by the patent NT, is also reverse-translated by the patent NT into the sentence in the first language, and so on. I will do it.

翻訳評価部25は、翻訳前のセグメントSiと、その翻訳結果の逆翻訳により得た評価文Si′とを比較して、翻訳結果Tj(Si)ごとに、機械翻訳の評価尺度であるBLEU(Bilingual Evaluation Understudy)やRIBES(Rank-based Intuitive Bilingual Evaluation Score)、あるいはその双方の評価値を演算する。双方の評価値を演算したときには、その二乗の平均の平方根等をさらに演算して一つの評価値を得てもよい。 The translation evaluation unit 25 compares the segment Si before translation with the evaluation sentence Si'obtained by reverse translation of the translation result, and BLEU (BLEU), which is an evaluation scale for machine translation, is used for each translation result Tj (Si). Bilingual Evaluation Understudy), RIBES (Rank-based Intuitive Bilingual Evaluation Score), or both evaluation values are calculated. When both evaluation values are calculated, the square root of the average of the squares and the like may be further calculated to obtain one evaluation value.

選択部26は、セグメントSiに係る翻訳結果Tj(Si)ごとに得られた評価値を参照し、セグメントSiごとに、最も高い評価値となった翻訳結果Tj(Si)を選択する。 The selection unit 26 refers to the evaluation value obtained for each translation result Tj (Si) related to the segment Si, and selects the translation result Tj (Si) having the highest evaluation value for each segment Si.

後処理部27は、選択部26が選択した翻訳結果について、所定の後処理を実行する。具体的にこの後処理部27は、前処理部22によりセグメントの識別情報に関連付けて記録された情報を参照し、主題部を含むとされたセグメントに関して選択された翻訳結果を、その直前にある、構成要素部を含むとされたセグメントに係る翻訳結果の前に移動する。 The post-processing unit 27 executes a predetermined post-processing on the translation result selected by the selection unit 26. Specifically, the post-processing unit 27 refers to the information recorded by the pre-processing unit 22 in association with the segment identification information, and immediately before the translation result selected for the segment that is supposed to include the subject unit. , Moves to the front of the translation result for the segment that is supposed to contain the component part.

また後処理部27は、少なくとも一つのセグメントの翻訳結果の末尾表現を、予め定められた規則に従って変更する。この規則は、翻訳する文書の分野ごとに定められてもよい。例えば特許文献の翻訳においては、後処理部27は、一つの「請求項」に係る文から得られたセグメントのうち、構成要素部を含むセグメントについては、並列を表す助詞「と、」を含める。また後処理部27は、一つの「請求項」に係る文から得られたセグメントのうち、最後のセグメントに係る翻訳結果に、当該請求項に係る文から抽出された主題部の語を後置する。 Further, the post-processing unit 27 changes the end representation of the translation result of at least one segment according to a predetermined rule. This rule may be set for each field of the document to be translated. For example, in translating a patent document, the post-processing unit 27 includes the particle “to,” indicating parallelism for the segment including the component unit among the segments obtained from the sentence according to one “claim”. .. Further, the post-processing unit 27 postfixes the word of the subject part extracted from the sentence of the claim to the translation result of the last segment among the segments obtained from the sentence of one "claim". do.

具体的な例として、上記原文例から得られたセグメントのそれぞれについて選択部26で選択された翻訳結果が、
・セグメント1:液体を液体噴射装置に供給するための液体収容体であって、次を備える:
・セグメント2:内部に前記液体を収容する液体収容部が設けられた立方体形状の袋。
・セグメント3:前記袋内の液体を前記液体噴射装置に導出するための液体導出部。
・セグメント4:X,Y,Z方向で三次元座標系を規定したとき、
・セグメント5:前記X方向は、前記袋の一端から他端へ向かう方向に沿った方向として規定される。
・セグメント6:前記袋の側面の部分に配され、当該側面がYZ平面に平行であるスペーサ部材。
と、なっているとき、この後処理部27は、主題部の語「液体収容体」(及び移行語「備える」)を用い、
・セグメント1:液体を液体噴射装置に供給するための液体収容体「であって、」
・セグメント2:内部に前記液体を収容する液体収容部が設けられた立方体形状の袋「と、」
・セグメント3:前記袋内の液体を前記液体噴射装置に導出するための液体導出部「と、を備え、」
・セグメント4:X,Y,Z方向で三次元座標系を規定したとき、
・セグメント5:前記X方向は、前記袋の一端から他端へ向かう方向に沿った方向として規定「され、」
・セグメント6:前記袋の側面の部分に配され、当該側面がYZ平面に平行であるスペーサ部材「を備える液体収容体。」
というように各セグメントの語の置き換え、及び変更を行う。なお、ここでは変更した箇所には、鍵括弧(「」)を付して明示したが、現実にはこのような明示は必ずしも必要ない。
As a specific example, the translation result selected by the selection unit 26 for each of the segments obtained from the above original text example is
Segment 1: A liquid container for supplying a liquid to a liquid injector, which comprises:
-Segment 2: A cube-shaped bag provided with a liquid storage portion for storing the liquid inside.
-Segment 3: A liquid lead-out unit for leading the liquid in the bag to the liquid injection device.
-Segment 4: When a three-dimensional coordinate system is defined in the X, Y, and Z directions,
Segment 5: The X direction is defined as a direction along the direction from one end to the other end of the bag.
Segment 6: A spacer member arranged on a side surface portion of the bag whose side surface is parallel to the YZ plane.
When, the post-processing unit 27 uses the word "liquid container" (and the transition word "prepared") of the subject unit.
-Segment 1: A liquid container "is" for supplying a liquid to a liquid injector.
-Segment 2: A cube-shaped bag "to," provided with a liquid storage portion for storing the liquid inside.
-Segment 3: A liquid lead-out unit "with," for leading out the liquid in the bag to the liquid injection device.
-Segment 4: When a three-dimensional coordinate system is defined in the X, Y, and Z directions,
Segment 5: The X direction is defined as a direction along the direction from one end to the other end of the bag.
Segment 6: A liquid container having a spacer member "arranged on a side surface portion of the bag and whose side surface is parallel to the YZ plane."
Replace and change the words in each segment. In addition, although the changed part is specified by adding the key brackets ("") here, such specification is not always necessary in reality.

出力部28は、後処理部27により後処理された各セグメントの翻訳結果を出力する。本実施の形態の一例では、この出力部28は、XLIFF(XML Localization Interchange File Format)のフォーマットで原文と翻訳結果とを対比可能に出力してもよい。 The output unit 28 outputs the translation result of each segment post-processed by the post-processing unit 27. In an example of the present embodiment, the output unit 28 may output the original text and the translation result in a format of XLIFF (XML Localization Interchange File Format) so as to be comparable.

具体的にこの出力部28は、原文から得られたセグメントごとに、XLIFFのソース(<source>)タグ部分に、当該セグメントの原文を挿入し、ターゲット(<target>)タグ部分に、後処理部27により後処理された対応するセグメントの翻訳結果を挿入して出力する。 Specifically, the output unit 28 inserts the original text of the segment into the source (<source>) tag portion of the XLIFF for each segment obtained from the original text, and post-processes the target (<target>) tag portion. The translation result of the corresponding segment post-processed by the unit 27 is inserted and output.

このようにして得られたXLIFFフォーマットの出力は、一般的なXLIFFのビューアを用いて表示し、参照することが可能となる。 The output in the XLIFF format thus obtained can be displayed and referenced using a general XLIFF viewer.

一例として出力部28は、XLIFFフォーマットのファイルに、上述のようにセグメントごとの原文と翻訳結果とをそれぞれソースタグ及びターゲットタグ内に含めるとともに、セグメントごとの評価値(選択部26で選択した翻訳結果に係る評価値)を関連付けて記録し、表示処理に供してもよい。 As an example, the output unit 28 includes the original text and the translation result for each segment in the source tag and the target tag, respectively, in the XLIFF format file as described above, and the evaluation value for each segment (translation selected by the selection unit 26). (Evaluation value related to the result) may be recorded in association with each other and used for display processing.

さらに出力部28は、各セグメントの翻訳結果に関連付けて、翻訳評価部25が生成した逆翻訳の結果(第一の言語の文)をXLIFFフォーマットのファイルに含めて、表示処理に供してもよい。この例のXLIFFフォーマットのファイルの表示は、図3に例示するように、セグメントごとに、原文(L)と、翻訳結果(T)と、評価値(V)と、逆翻訳の結果(B)とを含むものとなる。図3の例では、選択したセグメントについて逆翻訳の結果と原文とを対比して表示する例を示している。またこのとき、採用した翻訳結果を出力した翻訳エンジンを特定する情報を合わせて出力してもよい。 Further, the output unit 28 may include the result of the reverse translation (sentence in the first language) generated by the translation evaluation unit 25 in the XLIFF format file in association with the translation result of each segment and perform the display processing. .. As shown in FIG. 3, the display of the XLIFF format file in this example shows the original text (L), the translation result (T), the evaluation value (V), and the reverse translation result (B) for each segment, as illustrated in FIG. And will be included. In the example of FIG. 3, an example of displaying the result of reverse translation and the original text in comparison with each other for the selected segment is shown. At this time, the information that identifies the translation engine that outputs the adopted translation result may also be output.

[動作]
本実施の形態の翻訳支援システム1は、基本的に、以上の構成を備え、次のように動作する。本実施の形態の一例では、翻訳支援システム1は、ソースタグに原文である第一の言語の文書が記述されている、XLIFFフォーマットでの原文の入力を受け入れる。
[motion]
The translation support system 1 of the present embodiment basically has the above configuration and operates as follows. In an example of this embodiment, the translation support system 1 accepts an input of the original text in the XLIFF format in which the document of the first language which is the original text is described in the source tag.

翻訳支援システム1は、図4に例示するように、翻訳の原文となるデータを受け入れる(S1)。具体的にこのデータはテキストを含むPDF(Portable Document Format)のデータでよい。以下の例では、第一言語は英語であるとし、翻訳のターゲットとなる第二の言語を日本語とする。 The translation support system 1 accepts data that is the original text of the translation, as illustrated in FIG. 4 (S1). Specifically, this data may be PDF (Portable Document Format) data including text. In the example below, the first language is English and the second language targeted for translation is Japanese.

翻訳支援システム1は、このPDFデータを外部のシステムに送信してXLIFFフォーマットのデータを生成させる。この例では生成されたXLIFFフォーマットのデータには、PDFに含まれるテキストが抽出され、ソースタグ内に含められる。 The translation support system 1 transmits this PDF data to an external system to generate XLIFF format data. In this example, the text included in the PDF is extracted from the generated XLIFF format data and included in the source tag.

翻訳支援システム1は、生成されたXLIFFフォーマットのデータからソースタグのテキストを抽出する。ここで抽出されるテキストは、上述した原文例の通り、特許文献のもので、その請求項の一つが、 The translation support system 1 extracts the text of the source tag from the generated XLIFF format data. The text extracted here is that of the patent document as in the above-mentioned original text example, and one of the claims is

A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising: [LF]
a cubic bag in which a liquid storage portion for containing the liquid is provided, [LF]
a liquid outlet for leading out the liquid in the bag to the liquid ejection apparatus, [LF]
wherein when the three dimensional cartesian coordinates is defined with a X-direction, a Y-direction, and a Z-direction, the X direction being defined as a direction along a direction from one edge side of the bag toward the other edge side, [LF]
a spacer member is arranged at a position of the sides of the bag, where the sides are parallel to the YZ plane. [LF]
といったものであるとする。
A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising: [LF]
a cubic bag in which a liquid storage portion for containing the liquid is provided, [LF]
a liquid outlet for leading out the liquid in the bag to the liquid ejection apparatus, [LF]
When the three dimensional cartesian coordinates is defined with a X-direction, a Y-direction, and a Z-direction, the X direction being defined as a direction along a direction from one edge side of the bag toward the other edge side, [LF]
a spacer member is arranged at a position of the sides of the bag, where the sides are parallel to the YZ plane. [LF]
And so on.

翻訳支援システム1は、このテキストに対して所定の前処理を実行する。具体的には、手掛かり句「comprising」の直前にある名詞「the liquid container」を主題語であるとして、この主題語を含む部分(改行(LF)や、:(コロン)等で区切られる部分、上述の例では、「A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising」の部分)を主題部と認識する。また翻訳支援システム1は、「comprising」を移行語として抽出して記憶しておく。 The translation support system 1 executes a predetermined preprocessing on this text. Specifically, assuming that the noun "the liquid container" immediately before the clue phrase "comprising" is the subject word, the part containing this subject word (the part separated by a line break (LF),: (colon), etc., In the above example, the part of "A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising") is recognized as the subject part. Further, the translation support system 1 extracts and stores "comprising" as a transition word.

また主題部以外の文節から、構成要素部となる文節を予め定めた規則に従って特定する。ここでは上記主題部以外の部分であって、改行で区切られる部分を構成要素部として認識するものとする。 In addition, from the clauses other than the subject part, the clauses to be the component parts are specified according to a predetermined rule. Here, it is assumed that a part other than the above-mentioned subject part and separated by a line feed is recognized as a component part.

また翻訳支援システム1は、上記テキストを所定の規則に従ってセグメントに分割する(S2)。ここでは例えば改行、及び、「,and」の次の「,(カンマ)」の位置でセグメントに分割し、さらに文末の所定のパターンの置換を行い、既に例示した通り、
・セグメント1:A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising:
・セグメント2:a cubic bag in which a liquid storage portion for containing the liquid is provided.
・セグメント3:a liquid outlet for leading out the liquid in the bag to the liquid ejection apparatus.
・セグメント4:wherein when the three dimensional cartesian coordinates is defined with a X-direction, a Y-direction, and a Z-direction.
・セグメント5:the X direction being defined as a direction along a direction from one edge side of the bag toward the other edge side.
・セグメント6:a spacer member is arranged at a position of the sides of the bag, where the sides are parallel to the YZ plane.
と、分割したものとする。ここで翻訳支援システム1は、セグメント1を「主題部」、残るセグメント2から6を「構成要素部」として特定する。
Further, the translation support system 1 divides the text into segments according to a predetermined rule (S2). Here, for example, a line feed and a segment are divided at the position of ", (comma)" next to ", and", and a predetermined pattern at the end of the sentence is replaced.
・ Segment 1: A liquid container for supplying a liquid to a liquid ejection apparatus, the liquid container comprising:
・ Segment 2: a cubic bag in which a liquid storage portion for containing the liquid is provided.
・ Segment 3: a liquid outlet for leading out the liquid in the bag to the liquid ejection apparatus.
・ Segment 4: where in when the three dimensional cartesian coordinates is defined with a X-direction, a Y-direction, and a Z-direction.
・ Segment 5: the X direction being defined as a direction along a direction from one edge side of the bag toward the other edge side.
・ Segment 6: a spacer member is arranged at a position of the sides of the bag, where the sides are parallel to the YZ plane.
And, it is assumed that it is divided. Here, the translation support system 1 specifies the segment 1 as the "subject part" and the remaining segments 2 to 6 as the "component part".

翻訳支援システム1は、ここで得られた各セグメントを、複数の翻訳エンジンによりそれぞれ機械翻訳する(S3)。ここでの翻訳エンジンは、それぞれ、
・特許文献及び一般文献から抽出した日英の対訳文(文対)を訓練データとして機械学習した汎用のニューラルトランスレータ(汎用NT)と、
・特許文献から抽出した日英の文対を訓練データとして機械学習した特許文献用ニューラルトランスレータ(特許NT)と、
・特許NTをベースに、さらに特定の分野の翻訳文から抽出した、日英の文対を追加的に機械学習させたアダプテーションエンジン(AT)と、
であるものとする。
The translation support system 1 machine-translates each segment obtained here by a plurality of translation engines (S3). The translation engines here are, respectively.
-A general-purpose neural translator (general-purpose NT) that is machine-learned using Japanese-English bilingual sentences (sentence pairs) extracted from patent documents and general documents as training data.
-A neural translator for patent documents (Patent NT) that machine-learned Japanese-English sentence pairs extracted from patent documents as training data, and
-Based on the patent NT, an adaptation engine (AT) that additionally machine-learns Japanese-English sentence pairs extracted from translated sentences in a specific field, and
Suppose that

翻訳支援システム1は、例えばセグメント1について、汎用NTによる翻訳文:
「液体を噴射する装置に供給するための液体容器が備える:」、
特許文献から抽出した日英の文対を訓練データとして機械学習した特許NTによる翻訳文:
「液体を液体噴射装置に供給するための液体容器であって、次を備える:」、さらに、
汎用NTをベースに、さらに特定の分野の翻訳文から抽出した、日英の文対を追加的に機械学習させたATによる翻訳文、
「液体を液体噴射装置に供給するための液体収容体であって、次を備える:」
を得る。
The translation support system 1 uses, for example, a translation by a general-purpose NT for segment 1.
"Equipped with a liquid container to supply the device that ejects the liquid:",
Translated text by Patent NT, which was machine-learned using Japanese-English sentence pairs extracted from patent documents as training data:
"A liquid container for supplying a liquid to a liquid injector, which comprises:"
Based on general-purpose NT, translated sentences by AT that additionally machine-learned Japanese-English sentence pairs extracted from translated sentences in a specific field,
"A liquid container for supplying a liquid to a liquid injector, which comprises:"
To get.

翻訳支援システム1は、得られた翻訳結果のそれぞれを、対応する翻訳結果を生成した機械翻訳エンジンを用いて第一の言語の文(評価文)に逆翻訳する。例えば汎用NTによる上記翻訳文を、汎用NTで逆翻訳して、
「A container of liquid which supplies the liquid to a liquid ejector comprises ?」なる評価文を得る。
The translation support system 1 reverse-translates each of the obtained translation results into a sentence (evaluation sentence) in the first language using the machine translation engine that generated the corresponding translation result. For example, the above translation by general-purpose NT is reverse-translated by general-purpose NT,
Get the evaluation statement "A container of liquid which supplies the liquid to a liquid ejector?".

同様に、特許NTによる翻訳文を、特許NTで逆翻訳して、
「A container of liquid for supplying the liquid to a liquid ejection apparatus, comprising:」なる翻訳文を、さらに、ATによる翻訳文を、ATで逆翻訳して、
「A liquid container for supplying a liquid to a liquid ejection apparatus, comprising:」なる翻訳文を得るとする。
Similarly, the translated text by Patent NT is reverse-translated by Patent NT,
The translation "A container of liquid for supplying the liquid to a liquid ejection apparatus, comprising:" and the translation by AT are reverse-translated by AT.
Suppose you get the translation "A liquid container for supplying a liquid to a liquid ejection apparatus, comprising:".

翻訳支援システム1は、これらの評価文と、対応する原文との対比により、BREUとRIBESとの評価値を求める(S4)。なお評価値は、いずれも例えば最大値が「100」となるように正規化しておくものとする(例えばBREUの評価値の最大値が「1」であるときには、当該値を100倍する)。 The translation support system 1 obtains the evaluation values of BREU and RIBES by comparing these evaluation sentences with the corresponding original sentences (S4). The evaluation values are all normalized so that the maximum value is, for example, "100" (for example, when the maximum value of the evaluation value of BREU is "1", the value is multiplied by 100).

翻訳支援システム1は、BREUの評価値(正規化したもの)SBと、RIBESの評価値(同じく正規化したもの)SRとを用いて、一つの評価値S

Figure 2021140281

を求める。 Translation support system 1, the evaluation value of Breu (those that have been normalized) and S B, the evaluation value of Ribes (also those that have been normalized) by using the S R, one evaluation value S
Figure 2021140281

To ask.

ここでは、一例として、汎用NT、特許NT、ATのそれぞれの翻訳結果について、90,91,95の評価値が得られたとする。 Here, as an example, it is assumed that the evaluation values of 90, 91, and 95 are obtained for each of the translation results of the general-purpose NT, the patent NT, and the AT.

翻訳支援システム1は、セグメント1についてのこの評価値を参照して、セグメント1については、その評価値が最も高い、ATの翻訳結果を選択する(S5)。 The translation support system 1 refers to this evaluation value for the segment 1 and selects the translation result of the AT having the highest evaluation value for the segment 1 (S5).

以下、各セグメントについて、同様の処理を行い、セグメントごとに、複数の機械翻訳エンジンにより得られる複数の翻訳結果のうち、評価値が最も高い翻訳結果を選択する。なお、最も高い評価値となった翻訳結果が複数ある場合は、予め定めた規則に従い、いずれかの翻訳結果を選択する。例えば翻訳エンジンごとに優先度を定めておき、最も高い評価値となった複数の翻訳結果のうちから、当該優先度が最も高い翻訳エンジンによる翻訳結果を選択してもよい。 Hereinafter, the same processing is performed for each segment, and the translation result having the highest evaluation value is selected from the plurality of translation results obtained by the plurality of machine translation engines for each segment. If there are a plurality of translation results with the highest evaluation values, one of the translation results is selected according to a predetermined rule. For example, a priority may be set for each translation engine, and a translation result by the translation engine having the highest priority may be selected from a plurality of translation results having the highest evaluation value.

そして翻訳支援システム1は、セグメントのうち、構成要素部であるとされたセグメントについて、当該セグメントごとに選択された翻訳結果の文末が、「名詞+句読点」で終了する場合に、名詞+「と、」(並列助詞)に置換する処理を実行する(後処理の一つ)。 Then, the translation support system 1 has a noun + "and" when the sentence end of the translation result selected for each segment of the segment, which is considered to be a component part, ends with "noun + punctuation mark". , ”(Parallel particle) is executed (one of the post-processing).

これにより、例えばセグメント2について選択された翻訳結果が、
「内部に前記液体を収容する液体収容部が設けられた立方体形状の袋。」
である場合、この末尾が
「内部に前記液体を収容する液体収容部が設けられた立方体形状の袋と、」
のように置き換えられる。
As a result, for example, the translation result selected for segment 2 is
"A cubic-shaped bag provided with a liquid storage portion for storing the liquid inside."
If, the end is "a cubic-shaped bag provided with a liquid storage portion for storing the liquid inside."
Is replaced as.

また翻訳支援システム1は、セグメントのうち、構成要素部であるとされたセグメントについて、当該セグメントごとに選択された翻訳結果の文末が、「する。」あるいは「される。」で終わる場合は、「し、」あるいは「され、」と置換する。 Further, in the translation support system 1, when the sentence end of the translation result selected for each segment of the segment, which is considered to be the component part, ends with "do" or "do." Replace with "" or "".

これにより例えば構成要素部とされたセグメントの翻訳結果が、
「前記X方向は、前記袋の一方の縁部側から他方の縁部側に向かう方向であって、前記一方の縁部側から他方の縁部側に向かう方向を正の方向とし、前記正の方向とは逆の方向を負の方向とする。」
となっている場合、翻訳支援システム1は、
「前記X方向は、前記袋の一方の縁部側から他方の縁部側に向かう方向であって、前記一方の縁部側から他方の縁部側に向かう方向を正の方向とし、前記正の方向とは逆の方向を負の方向とし、」
と置換する。
As a result, for example, the translation result of the segment that is the component part can be obtained.
"The X direction is a direction from one edge side of the bag to the other edge side, and the direction from the one edge side to the other edge side is a positive direction, and the positive direction is defined as the positive direction. The direction opposite to the direction of is the negative direction. "
If, the translation support system 1
"The X direction is a direction from one edge side of the bag to the other edge side, and the direction from the one edge side to the other edge side is a positive direction, and the positive direction is defined as the positive direction. The direction opposite to the direction of is the negative direction. "
Replace with.

またこの翻訳支援システム1は、主題部における主題語である「the liquid container」の訳語「液体容器」を、構成要素部のセグメントのうち、末尾のセグメントの最後の部分に移動する。 Further, the translation support system 1 moves the translated word "liquid container" of the theme word "the liquid container" in the subject part to the last part of the last segment of the segments of the component part.

上述の例で、構成要素部の末尾のセグメントはセグメント6であり、その選択された翻訳結果が例えば
「前記袋の側面の部分に配され、当該側面がYZ平面に平行であるスペーサ部材。」
となっているとする。翻訳支援システム1は、このセグメントの最後の句点の直前の語が体言止め(名詞で終端されているもの)となっている場合、句点を読点に置換し、移行語の訳語+主題語の訳語+句点を後置して、
「前記袋の側面の部分に配され、当該側面がYZ平面に平行であるスペーサ部材、を備える液体容器。」
とする。
In the above example, the last segment of the component portion is segment 6, and the selected translation result is, for example, "a spacer member arranged on a side surface portion of the bag and whose side surface is parallel to the YZ plane."
It is assumed that it is. When the word immediately before the last kuten of this segment is an uninflected word (terminated by a noun), the translation support system 1 replaces the kuten with a comma, and translates the transition word + the subject word. Add a punctuation mark
"A liquid container provided with a spacer member, which is arranged on a side surface portion of the bag and whose side surface is parallel to the YZ plane."
And.

また、構成要素部の末尾のセグメントが体言止めでない場合は、句点を読点に置換し、主題語の訳語+句点を後置する。つまり、このセグメント6が例えば、
「前記袋の側面の部分に配され、当該側面がYZ平面に平行であるスペーサ部材を備える。」
となっていれば、
「前記袋の側面の部分に配され、当該側面がYZ平面に平行であるスペーサ部材を備える、液体容器。」
とする。
If the last segment of the component part is not an uninflected word, the punctuation mark is replaced with a comma, and the translation of the subject word + the punctuation mark is added. That is, this segment 6 is, for example,
"A spacer member is provided which is arranged on the side surface portion of the bag and whose side surface is parallel to the YZ plane."
If it is,
"A liquid container provided with a spacer member arranged on a side surface portion of the bag and whose side surface is parallel to the YZ plane."
And.

また本実施の形態の翻訳支援システム1では、定型表現となっている表現に対応する訳語を、予め定めた定型表現に対応する訳語に置換する処理を行ってもよい。 Further, in the translation support system 1 of the present embodiment, a process may be performed in which the translated word corresponding to the fixed expression is replaced with the translated word corresponding to the predetermined fixed expression.

翻訳支援システム1は、そして、原文から得られたセグメントごとに、ソースタグ部分に、当該セグメントの原文を挿入し、ターゲットタグ部分に、対応するセグメントの後処理後の翻訳結果を挿入した、XLIFFフォーマットのデータを得て、このデータを出力する(S6)。 The translation support system 1 then inserts the original text of the segment into the source tag part and inserts the post-processed translation result of the corresponding segment into the target tag part for each segment obtained from the original text. Obtain the data in the format and output this data (S6).

なお、この翻訳結果を挿入した後のXLIFFフォーマットのデータは、この翻訳支援システム1のユーザに対して、メール等で送信されてもよい。 The XLIFF format data after inserting the translation result may be sent to the user of the translation support system 1 by e-mail or the like.

[関係副詞に関する処理]
本実施の形態の翻訳支援システム1では、さらに、関係副詞の後の関係副詞句がセグメントを跨いでいる場合、当該関係副詞句のセグメントを認識して翻訳結果を調整する。
[Processing related to related adverbs]
In the translation support system 1 of the present embodiment, when the relational adverbial phrase after the relational adverb straddles the segment, the segment of the relational adverbial phrase is recognized and the translation result is adjusted.

具体的に、米国公開特許公報2019184710A1号の請求項1の記載を引用すると、この請求項1の記載には、
wherein when three directions orthogonal to each other are defined as a D direction, a T direction, and a W direction,
the D direction being defined as a direction along a direction from the one edge portion side of the bag toward the other edge portion side, where a direction from the one edge portion side toward the other edge portion side is defined as a +D direction and an opposite direction to the +D direction is defined as a −D direction, and
the T direction being defined as a direction in which a dimension of an outer shape of the liquid container is smallest among the three directions,
という記載が含まれている。
Specifically, citing the description of claim 1 of the US Publication of Patent Publication No. 2019184710A1, the description of claim 1 states.
When three directions orthogonal to each other are defined as a D direction, a T direction, and a W direction,
the D direction being defined as a direction along a direction from the one edge portion side of the bag toward the other edge portion side, where a direction from the one edge portion side toward the other edge portion side is defined as a + D direction and an opposite direction to the + D direction is defined as a −D direction, and
the T direction being defined as a direction in which a dimension of an outer shape of the liquid container is smallest among the three directions,
Is included.

この文を原文として本実施の形態の翻訳支援システム1に入力すると、翻訳支援システム1はこの文をセグメント分割に分割して、
セグメント1:XXXXX when three directions orthogonal to each other are defined as a D direction, a T direction, and a W direction,
セグメント2:the D direction being defined as a direction along a direction from the one edge portion side of the bag toward the other edge portion side, where a direction from the one edge portion side toward the other edge portion side is defined as a +D direction and an opposite direction to the +D direction is defined as a −D direction, and
セグメント3:the T direction being defined as a direction in which a dimension of an outer shape of the liquid container is smallest among the three directions,
を得る。
When this sentence is input to the translation support system 1 of the present embodiment as the original sentence, the translation support system 1 divides this sentence into segments and divides the sentence into segments.
Segment 1: XXXXX when three directions orthogonal to each other are defined as a D direction, a T direction, and a W direction,
Segment 2: the D direction being defined as a direction along a direction from the one edge portion side of the bag toward the other edge portion side, where a direction from the one edge portion side toward the other edge portion side is defined as a + D direction and an opposite direction to the + D direction is defined as a −D direction, and
Segment 3: the T direction being defined as a direction in which a dimension of an outer shape of the liquid container is smallest among the three directions,
To get.

なお、ここでは前処理の一つとして、wherein等の所定の語を、予め対応付けた記号列(翻訳エンジンがそのまま出力する記号列、以下、置換記号列と呼ぶ)に置き換えている。またここでは、セグメント末尾の「,」や「,and」を置き換える前の状態を示している。 Here, as one of the preprocessing, a predetermined word such as wherein is replaced with a symbol string associated in advance (a symbol string output by the translation engine as it is, hereinafter referred to as a replacement symbol string). Also, here, the state before replacing "," and ", and" at the end of the segment is shown.

翻訳支援システム1は、あるセグメントに上記置換記号列が含まれ、当該置換記号列に続いて関係副詞(whereやwhen)が含まれているときに、当該セグメントを関係副詞セグメントとして、当該関係副詞セグメント以降のセグメントの末尾を順次参照する。 In the translation support system 1, when the above substitution symbol string is included in a certain segment and a relation adverb (where or when) is included following the substitution symbol string, the segment is used as a relation adverb segment and the relation adverb Refer to the end of the segment after the segment in sequence.

翻訳支援システム1は、当該末尾が「,and」あるいは「,or」であるセグメントが見出されると、当該セグメントの次のセグメントまでを関係副詞句セグメントとして、各セグメントを識別するセグメント識別情報に関連付けて、関係副詞セグメント及び関係副詞句セグメントである旨の情報を関連付けて記録しておく。 When the translation support system 1 finds a segment ending in ", and" or ", or", the translation support system 1 associates the segment up to the next segment with the segment identification information that identifies each segment as a relational adverbial phrase segment. In addition, information indicating that it is a relational adverb segment and a relational adverbial phrase segment is recorded in association with each other.

その後、翻訳支援システム1は、セグメント末尾の「,」や「,and」を「.」に置き換えて複数の翻訳エンジンに各セグメントを機械翻訳させる。翻訳支援システム1は既に述べた方法で、セグメントごとに複数の翻訳エンジンにより得られた翻訳結果の一つを選択する。 After that, the translation support system 1 replaces "," and ", and" at the end of the segment with "." And causes a plurality of translation engines to machine-translate each segment. The translation support system 1 selects one of the translation results obtained by a plurality of translation engines for each segment by the method already described.

そしてこの例の翻訳支援システム1は既に述べた後処理に加え、翻訳結果のセグメントの一つの識別情報に関連付けて関係副詞セグメントである旨の情報が記録されている場合、当該セグメントに続くセグメントであって、当該セグメントの識別情報に関係副詞句セグメントである旨の情報が関連付けられ、その次のセグメントの識別情報に関係副詞句セグメントである旨の情報が関連付けられていないセグメント(関係副詞句セグメントの末尾のセグメント、以下末端関係副詞句セグメントと呼ぶ)を特定する。 Then, in addition to the post-processing already described, the translation support system 1 of this example is a segment following the segment when information indicating that it is a related adverb segment is recorded in association with the identification information of one of the segments of the translation result. There is a segment in which the identification information of the segment is associated with the information that it is an adverbial phrase segment, and the identification information of the next segment is not associated with the information that it is an adverbial phrase segment (relational adverbial phrase segment). The last segment of, hereinafter referred to as the terminal relation adverbial phrase segment) is specified.

翻訳支援システム1は、関係副詞セグメントである旨の情報が記録されている識別情報で識別されるセグメント(関係副詞セグメントと呼ぶ)の翻訳結果に含まれる関係副詞の訳語を特定し、当該訳語を当該関係副詞セグメントから削除して末尾の語を調整し、そして翻訳支援システム1は、当該削除した訳語を、末端関係副詞句セグメントの翻訳結果の末尾に移動する。 The translation support system 1 identifies the translation of the relational adverb included in the translation result of the segment (called the relational adverb segment) identified by the identification information in which the information indicating that it is the relational adverb segment is recorded, and determines the translation. It is deleted from the related adverb segment and the last word is adjusted, and the translation support system 1 moves the deleted translated word to the end of the translation result of the terminal relation adverb phrase segment.

上述の例では、セグメントごとに選択された翻訳結果は当初、
セグメント1(関係副詞セグメント):XXXXX 互いに直交する3つの方向をD方向、T方向、W方向とする場合。
セグメント2(関係副詞句セグメント):前記D方向は、前記袋の前記一方の縁部側から前記他方の縁部側に向かう方向であり、前記一方の縁部側から前記他方の縁部側に向かう方向を+D方向とし、前記+D方向と逆の方向を−D方向とする。
セグメント3(末端関係副詞セグメント):3つの方向のうち、液体容器の外形の寸法が最小となる方向をT方向とする。
となっている。
In the example above, the translation results selected for each segment are initially
Segment 1 (relational adverb segment): XXXXX When the three directions orthogonal to each other are the D direction, the T direction, and the W direction.
Segment 2 (related adverbial phrase segment): The D direction is a direction from the one edge side of the bag toward the other edge side, and from the one edge side to the other edge side. The direction to go is the + D direction, and the direction opposite to the + D direction is the −D direction.
Segment 3 (end-related adverb segment): Of the three directions, the direction in which the outer dimensions of the liquid container are minimized is defined as the T direction.
It has become.

翻訳支援システム1は、ここで得られた翻訳結果に対し、既に説明した後処理を行うとともに、上述の関係副詞の訳語を移動する処理を実行して、
セグメント1(関係副詞セグメント):ここで、互いに直交する3つの方向をD方向、T方向、W方向とし、
セグメント2(関係副詞句セグメント):前記D方向は、前記袋の前記一方の縁部側から前記他方の縁部側に向かう方向であり、前記一方の縁部側から前記他方の縁部側に向かう方向を+D方向とし、前記+D方向と逆の方向を−D方向とし、
セグメント3(末端関係副詞セグメント):3つの方向のうち、液体容器の外形の寸法が最小となる方向をT方向とする場合、
を得る。
The translation support system 1 performs the post-processing already described for the translation result obtained here, and also executes the process of moving the translated words of the above-mentioned related adverbs.
Segment 1 (relational adverb segment): Here, the three directions orthogonal to each other are defined as the D direction, the T direction, and the W direction.
Segment 2 (related adverbial phrase segment): The D direction is a direction from the one edge side of the bag toward the other edge side, and from the one edge side to the other edge side. The direction to go is the + D direction, and the direction opposite to the + D direction is the -D direction.
Segment 3 (end-related adverb segment): When the T direction is the direction in which the outer dimensions of the liquid container are minimized among the three directions.
To get.

当初の「ここで」はwhereinの訳語でwhereinに対応する記号列XXXXXを置換したものであり、各セグメントの末尾は「とし、」と置換され、さらに末端関係副詞セグメントの末尾は、ここでの関係副詞「when」の訳語である「する場合」に置換されている。 The original "here" is a translation of wherein, replacing the symbol string XXXXX corresponding to wherein, the end of each segment is replaced with "to," and the end of the end-related adverb segment is here. It has been replaced with "when" which is a translation of the relative adverb "when".

上述のように、セグメントに分割して機械翻訳する場合の関係副詞等に対応する関係副詞句等の訳文範囲を認識して関係副詞の訳語を移動することで、より自然な翻訳文を得ることが可能となる。 As described above, a more natural translation can be obtained by recognizing the translation range of the relational adverb phrase, etc. corresponding to the relational adverb, etc. when dividing into segments and performing machine translation, and moving the translation of the relational adverb. Is possible.

一方、比較例として、本実施の形態の翻訳支援システム1が行う前処理、セグメント分割処理における関係副詞句の認識や末尾処理、後処理等を実行しない従来例の機械翻訳システムでは、上記英文の翻訳文として、
セグメント1:ここで、直交する3つの方向をD方向、T方向、W方向としたとき
セグメント2:前記D方向は、前記袋の前記一方の縁部側から前記他方の縁部側に向かう方向を+D方向とし、前記+D方向とは逆方向を−D方向とし
セグメント3:前記T方向は、前記3つの方向のうち、前記液体容器の外形寸法が最小となる方向であり
とした訳となって、関係副詞句の認識を誤った訳となってしまう。
On the other hand, as a comparative example, in the conventional machine translation system that does not execute the recognition, end processing, post-processing, etc. of the related adverbial phrase in the pre-processing and segment division processing performed by the translation support system 1 of the present embodiment, the above English sentence As a translation,
Segment 1: Here, when the three orthogonal directions are the D direction, the T direction, and the W direction, the segment 2: the D direction is a direction from the one edge side of the bag toward the other edge side. Is the + D direction, and the direction opposite to the + D direction is the −D direction. Segment 3: The T direction is the direction in which the outer dimension of the liquid container is the smallest among the three directions. Therefore, the recognition of the related adverbial phrase is wrong.

さらに別の比較例としてセグメントに分割せずに、上記米国公開特許公報2019184710A1号の請求項1のテキストをすべて一行に連結して機械翻訳をした場合、一文が長すぎて訳抜けが生じる結果となる。 As yet another comparative example, when all the texts of claim 1 of the above-mentioned US Patent Publication No. 2019184710A1 are concatenated into one line and machine-translated without dividing them into segments, the result is that one sentence is too long and translation omission occurs. Become.

[第一の言語が日本語である場合]
また本実施の形態の翻訳支援システム1は、第一の言語により、前処理やセグメント分割及び後処理の内容を異ならせてもよい。例えば翻訳支援システム1は、第一の言語が日本語である場合には、セグメント分割の際に、セグメントの区切り句、あるいは記号等として、
・句点(文末記号)
・コロン
・改行
など、日本語(第一の言語)に対応して予め定めたものを用いる。
[When the first language is Japanese]
Further, the translation support system 1 of the present embodiment may have different contents of pre-processing, segment division and post-processing depending on the first language. For example, in the translation support system 1, when the first language is Japanese, it can be used as a segment delimiter, a symbol, or the like at the time of segment division.
・ Kuten (end-of-sentence symbol)
-Use predetermined ones such as colons and line breaks that correspond to Japanese (first language).

一例として、翻訳支援システム1は、第一の言語が日本語である場合であって、日本特許公報または日本語の出願明細書の請求項を翻訳する場合、次のようにして主題部及び主題語、構成要素部の特定を行う。この場合も第一の言語ごとに、特定のための規則を予め定めておく。例えば日本語の場合、
・請求項の最初のセグメントの末尾に「…であって」または「…において」がある場合、形態素解析または分かち書きの手段でその直前の名詞句を抽出して主題語とする。
などとして定めておく。
As an example, in the translation support system 1, when the first language is Japanese and the claims of the Japanese patent gazette or the Japanese application specification are translated, the subject part and the subject are as follows. Specify the word and component part. In this case as well, rules for identification are set in advance for each first language. For example, in Japanese
-If there is "... in" or "in ..." at the end of the first segment of the claim, the noun phrase immediately before it is extracted by morphological analysis or word-separation and used as the subject word.
And so on.

また第一の言語を日本語とする場合、構成要素部については、翻訳支援システム1は、各セグメント(先頭が主題部となったときには2つ目のセグメント以降のセグメント)について、文末の表現が、並列助詞である「と、」であるか、あるいは「…し、」となっている、との条件を満足する場合に、構成要素部であると特定する。さらに翻訳支援システム1は、「…備え、」等の移行語に対応するものとして予め定めた語を、末尾に含むセグメントより後のセグメントを、構成要素説明部セグメントとして特定する。 When the first language is Japanese, the translation support system 1 has an expression at the end of each segment (when the beginning is the subject part, the second and subsequent segments). , It is specified as a component part when the condition that it is a parallel particle "to," or "...," is satisfied. Further, the translation support system 1 specifies a segment after a segment containing a predetermined word corresponding to a transition word such as "... prepared" as a component explanation segment.

さらにこの例では、翻訳支援システム1は、主題部と係り受けになっている「…を備え、」などの手掛かり句を特定して、予め定めた移行語を取得する。例えば第二の言語が英語である場合、主題部に対応する英語手掛かり句(移行語)を取得する。具体的に「…を備え」に対しては、「comprising:」を予め関連付けて記憶しておく。翻訳支援システム1は、特定した手掛かり句に関連付けられた移行語を取得して用いればよい。 Further, in this example, the translation support system 1 identifies a clue phrase such as "equipped with ..." which is related to the subject part, and acquires a predetermined transition word. For example, if the second language is English, the English clue (transition word) corresponding to the subject part is acquired. Specifically, for "providing ...", "comprising:" is associated and stored in advance. The translation support system 1 may acquire and use the transition word associated with the specified clue phrase.

また翻訳支援システム1は、第一の言語だけでなく第二の言語も条件として、前処理やセグメント分割及び後処理の内容を異ならせてもよい。例えば第一の言語が日本語、第二の言語が英語である場合、「…のとき」や「…の場合」などの表現は、この表現の前の部分(セグメントを跨ぐ場合を含む)の翻訳結果の前に、当該表現の翻訳結果である「when」などが現れるべきである。そこでこの例の翻訳支援システム1は、原文の移行語に対応する「を備え、」以下の構成要素説明部のセグメント末尾に、「…とき、」、あるいは「…場合」の表現があるか否かを調べる。そしてこれらの表現がある場合、翻訳支援システム1は、当該表現を削除し、移行語に対応する「を備え、」以下の構成要素説明部セグメントの先頭セグメント末尾の表現を「…とき、」、あるいは「…場合」に置換する。これにより、whenや、whereの訳語が、対応するセグメントに出現するように書き換えるものである。 Further, the translation support system 1 may have different contents of pre-processing, segment division and post-processing on condition that not only the first language but also the second language is used. For example, when the first language is Japanese and the second language is English, expressions such as "when ..." and "when ..." are in the part before this expression (including the case where it straddles a segment). The translation result of the expression, such as "when", should appear before the translation result. Therefore, in the translation support system 1 of this example, whether or not there is an expression of "... when" or "... case" at the end of the segment of the component explanation part below "provides" corresponding to the transition word of the original text. Find out. Then, when these expressions are present, the translation support system 1 deletes the expressions and replaces the expressions at the beginning and end of the component explanation segment below "with" corresponding to the transition word with "... when,". Alternatively, replace it with "... case". As a result, when and where translations are rewritten so that they appear in the corresponding segment.

さらにこの例の翻訳支援システム1は、主題語を得ていないときには、各請求項の最終セグメントについて、「…を特徴とする」「…を含む」「…を有する」「…からなる」「、」「…する」など予め定められた主題手掛かり句以下の表現を抽出して主題語とする。そして翻訳支援システム1は、主題語を英訳した結果を先頭セグメントのうち、移行語とした「comprising:」の直前に配置する。 Further, in the translation support system 1 of this example, when the subject word is not obtained, for the final segment of each claim, "features ...", "contains ...", "has ...", "consists of ...", ", Predetermined subject clues such as "..." The following expressions are extracted and used as the subject words. Then, the translation support system 1 places the result of translating the subject word into English immediately before the transition word "comprising:" in the first segment.

化学分野の特許文献について、汎用NTと、特許NTと、ATとを用いた本実施の形態の翻訳支援システム1を用いて翻訳を行った結果を[表1]に示す。

Figure 2021140281
[Table 1] shows the results of translating the patent documents in the field of chemistry using the translation support system 1 of the present embodiment using the general-purpose NT, the patent NT, and the AT.
Figure 2021140281

この[表1]は、翻訳支援システム1が、セグメント(No.)ごとに、各翻訳エンジンを評価した評価点と、各セグメントについて選択した翻訳エンジンの評価値(最高評価値)及び、選択した翻訳結果を生成した翻訳エンジンとを示したものである。なお、全体で64セグメントあるが、一部を図表の都合上省略している。また参考として、表の最後の行に、各翻訳エンジンの平均の評価値と最高評価値の平均とを示している。 In this [Table 1], the translation support system 1 evaluates each translation engine for each segment (No.), the evaluation value (highest evaluation value) of the translation engine selected for each segment, and the selection. It shows the translation engine that generated the translation results. There are 64 segments in total, but some are omitted for the convenience of charts. For reference, the last row of the table shows the average rating of each translation engine and the average of the highest ratings.

[表1]の結果に示されるように、例えば汎用NTや特許NTを単独で利用している場合には、セグメント4等で十分な翻訳が得られないこととなる。またセグメント4で比較的高い評価値となっているATのみを利用した場合、セグメント1,8,9等で特許NTより評価値の低い翻訳結果を得ることとなってしまう。 As shown in the results of [Table 1], for example, when a general-purpose NT or a patent NT is used alone, sufficient translation cannot be obtained in segment 4 or the like. Further, when only the AT having a relatively high evaluation value in the segment 4 is used, the translation result having a lower evaluation value than the patent NT in the segments 1, 8 and 9 and the like is obtained.

本実施の形態の翻訳支援システム1によれば、セグメントごとに評価値の高い翻訳エンジンによる翻訳結果が選択されるため、平均の評価値も向上している。 According to the translation support system 1 of the present embodiment, the translation result by the translation engine having a high evaluation value is selected for each segment, so that the average evaluation value is also improved.

[特徴事項のまとめ]
また本発明の実施の形態の特徴は、次の点を含む。
(1)第一の言語の文書を第二の言語に翻訳する場合に用いられる翻訳支援システムにおいて、複数の異なる訓練データセットにより学習した状態にあり、第一の言語の文書と第二の言語の文書とを相互に機械翻訳可能な複数のニューラルネット機械翻訳手段を備え、第一の言語の文書をセグメントに分割し、当該セグメントを、上記複数のニューラルネット機械翻訳手段で翻訳する。また当該翻訳の結果のそれぞれを、対応するニューラルネット機械翻訳手段で第一の言語に翻訳し、第一の言語の原文と、第二の言語から第一の言語に翻訳して得た翻訳結果との類似度を算出する。そして当該算出して得られた複数の類似度から、最も類似度の高い翻訳結果に対応する第二の言語の翻訳結果を、セグメント単位に抽出する。そして、各セグメント単位で、第一の言語の原文と前記抽出された翻訳結果を表示する。
[Summary of features]
Further, the features of the embodiment of the present invention include the following points.
(1) In the translation support system used when translating a document in the first language into a second language, it is in a state of being learned by a plurality of different training datasets, and the document in the first language and the document in the second language are in a state of being learned. The document is provided with a plurality of neural net machine translation means capable of mutually machine translating the document, the document of the first language is divided into segments, and the segment is translated by the plurality of neural net machine translation means. In addition, each of the translation results is translated into the first language by the corresponding neural net machine translation means, and the original text of the first language and the translation result obtained by translating from the second language to the first language. Calculate the similarity with. Then, from the plurality of similarities obtained by the calculation, the translation result of the second language corresponding to the translation result having the highest similarity is extracted for each segment. Then, the original text of the first language and the extracted translation result are displayed for each segment.

(2)また、翻訳結果をXLIFFエディターで表示する際、翻訳結果と合わせて、抽出翻訳結果のスコアと原文と第二の言語から第一の言語への翻訳結果を併せて表示する。 (2) When displaying the translation result in the XLIFF editor, the score of the extracted translation result, the original text, and the translation result from the second language to the first language are displayed together with the translation result.

(3)また、英語または中国語を第一の言語とし、日本語を第二の言語としたとき、XLIFFファイルの複数のソースタグについて、請求項開始部を開始セグメントとし、請求項末尾を終端セグメントとして、主題部となるセグメントと、少なくとも一つの構成要素部のセグメントと、構成要素説明部のセグメント(あれば)とを所定の手掛かり句で特定し、主題部の主題手掛かり句に対応する表現を構成要素セグメント末尾に対応する日本語表現を配置する。また、関係副詞句が複数のセグメントからなる場合、対応する手掛かり句で関係副詞句の末尾のセグメントを特定した上で、該セグメント先頭に関係副詞を移動し、請求項の最終セグメントに主題の語を配置する処理を行う。これにより請求項の翻訳を自然なものにできる。 (3) When English or Chinese is the first language and Japanese is the second language, the claim start part is the start segment and the claim end is the end for multiple source tags of the XLIFF file. As a segment, a segment to be a subject part, a segment of at least one component part, and a segment of a component explanation part (if any) are specified by a predetermined clue phrase, and an expression corresponding to the subject clue phrase of the subject part is specified. Place the Japanese expression corresponding to the end of the component segment. If the relational adverbial phrase consists of multiple segments, the last segment of the relational adverbial phrase is specified by the corresponding clue phrase, the relational adverb is moved to the beginning of the segment, and the subject word is placed in the final segment of the claim. Performs the process of arranging. This makes the translation of the claims natural.

(4)さらに日本語を第一の言語とし、英語または中国語を第二の言語としたときには、XLIFFファイルの複数のソースタグについて、請求項開始部を開始セグメントとし、請求項末尾を終端セグメントとして、主題部のセグメントと、少なくとも一つの構成要素部のセグメントと、構成要素説明部のセグメント(あれば)とを特定し、関係副詞句が複数のセグメントからなる場合、対応する手掛かり句で関係副詞句の末尾のセグメントを特定した上で、対応するセグメントに関係副詞に相当する表現を移動し、請求項の先頭セグメントに、主題語と、構成要素セグメント−構成要素説明部セグメント間の手掛かり句表現と、をあわせて配置する。 (4) When Japanese is the first language and English or Chinese is the second language, the claim start part is the start segment and the claim end is the end segment for multiple source tags of the XLIFF file. As, the segment of the subject part, the segment of at least one component part, and the segment of the component explanation part (if any) are specified, and when the relation adverbial phrase consists of a plurality of segments, the relation is made by the corresponding clue phrase. After identifying the last segment of the adverbial phrase, move the expression corresponding to the related adverb to the corresponding segment, and move the subject word and the clue phrase between the component segment and the component description segment to the first segment of the claim. Place the expression together.

1 翻訳支援システム、11 制御部、12 記憶部、13 操作部、14 表示部、21 原文受入部、22 前処理部、23 セグメント分割部、24 機械翻訳処理部、25 翻訳評価部、26 選択部、27 後処理部、28 出力部。


1 Translation support system, 11 Control unit, 12 Storage unit, 13 Operation unit, 14 Display unit, 21 Original text reception unit, 22 Preprocessing unit, 23 Segment division unit, 24 Machine translation processing unit, 25 Translation evaluation unit, 26 Selection unit , 27 Post-processing unit, 28 Output unit.


Claims (7)

第一の言語の文書を第二の言語の文書へ翻訳する作業を支援する翻訳支援システムであって、
それぞれが第一の言語の文を第二言語の文に機械翻訳可能な、複数の機械翻訳手段と、
前記第一の言語の文書を、所定のセグメント単位に分割する分割手段と、
前記分割により得られたセグメントごとに、前記複数の機械翻訳手段による翻訳結果を生成する手段と、
前記複数の機械翻訳手段による翻訳結果のそれぞれを評価する評価手段と、
前記セグメントごとに、前記評価結果に基づいて、前記複数の機械翻訳手段による翻訳結果のうちから採用する翻訳結果を一つ選択する選択手段と、
前記セグメントごとに選択された翻訳結果を出力する出力手段と、を含む翻訳支援システム。
A translation support system that supports the work of translating a document in the first language into a document in the second language.
Multiple machine translation methods, each capable of machine translating a sentence in the first language into a sentence in the second language,
A dividing means for dividing a document in the first language into predetermined segment units, and
A means for generating a translation result by the plurality of machine translation means for each segment obtained by the division, and a means for generating a translation result by the plurality of machine translation means.
An evaluation means for evaluating each of the translation results by the plurality of machine translation means,
For each of the segments, a selection means for selecting one translation result to be adopted from the translation results by the plurality of machine translation means based on the evaluation result.
A translation support system including an output means for outputting a translation result selected for each segment.
請求項1に記載の翻訳支援システムであって、
前記複数の機械翻訳手段はそれぞれ、第一の言語の文を第二言語の文に機械翻訳可能であるとともに、第二の言語の文を第一の言語の文に機械翻訳可能な機械翻訳手段であり、
前記評価手段は、複数の機械翻訳手段による翻訳結果のそれぞれを、当該翻訳結果を得た機械翻訳手段により第一の言語のセグメントに再翻訳し、当該再翻訳結果と、原文である第一の言語のセグメントとを比較して、当該比較の結果に基づいて前記翻訳結果の評価を行う翻訳支援システム。
The translation support system according to claim 1.
Each of the plurality of machine translation means can machine translate a sentence in the first language into a sentence in the second language, and can machine translate a sentence in the second language into a sentence in the first language. And
The evaluation means retranslates each of the translation results by the plurality of machine translation means into a segment of the first language by the machine translation means obtained the translation result, and the retranslation result and the first original text. A translation support system that compares a language segment and evaluates the translation result based on the result of the comparison.
請求項1または2に記載の翻訳支援システムであって、
前記出力手段は、翻訳結果とともに、当該翻訳結果に対する前記評価手段による評価の結果を表す情報を出力する翻訳支援システム。
The translation support system according to claim 1 or 2.
The output means is a translation support system that outputs information indicating the result of evaluation of the translation result by the evaluation means together with the translation result.
請求項1から3のいずれか一項に記載の翻訳支援システムであって、
前記分割手段は、さらに、前記セグメント単位に分割する前、及び分割した後の少なくとも一方において、前記第一の言語の文書を、第一の言語ごとに予め定められた所定の規則に基づく前処理を実行する翻訳支援システム。
The translation support system according to any one of claims 1 to 3.
The dividing means further preprocesses the document in the first language based on a predetermined rule predetermined for each first language before and after the division into the segment units. A translation support system that runs.
請求項4に記載の翻訳支援システムであって、
前記第一の言語の文書が特許出願書類の請求項に係るものであるときには、前記前処理には、主題語を特定し、当該主題語の配置を前記第二の言語ごとに予め定められたセグメントに移動する処理を含む翻訳支援システム。
The translation support system according to claim 4.
When the document in the first language relates to the claims of the patent application document, the subject word is specified in the preprocessing, and the arrangement of the subject word is predetermined for each of the second language. A translation support system that includes the process of moving to a segment.
請求項4または5に記載の翻訳支援システムであって、
前記第一の言語の文書が特許出願書類の請求項に係るものであり、当該第一の言語が英語である場合は、前記前処理では、関係副詞を含むセグメントがある場合には、関係副詞句の範囲を特定し、
前記出力手段は前記セグメントごとに選択された翻訳結果において、前記関係副詞句の範囲に対応するセグメントの先頭に、前記関係副詞の訳語に相当する語を移動する後処理を実行する翻訳支援システム。
The translation support system according to claim 4 or 5.
When the document in the first language relates to the claims of the patent application document and the first language is English, in the preprocessing, if there is a segment containing the relation adverb, the relation adverb Identify the scope of the phrase,
The output means is a translation support system that executes post-processing that moves a word corresponding to the translated word of the related adverb to the beginning of the segment corresponding to the range of the related adverb phrase in the translation result selected for each segment.
コンピュータに、第一の言語の文書を第二の言語の文書へ翻訳する作業を支援させるためのプログラムであって、コンピュータを、
それぞれが第一の言語の文を第二言語の文に機械翻訳可能な、複数の機械翻訳手段と、
前記第一の言語の文書を、所定のセグメント単位に分割する分割手段と、
前記分割により得られたセグメントごとに、前記複数の機械翻訳手段による翻訳結果を生成する手段と、
前記複数の機械翻訳手段による翻訳結果のそれぞれを評価する評価手段と、
前記セグメントごとに、前記評価結果に基づいて、前記複数の機械翻訳手段による翻訳結果のうちから採用する翻訳結果を一つ選択する選択手段と、
前記セグメントごとに選択された翻訳結果を出力する出力手段と、
として機能させるプログラム。


A program to help a computer translate a document in a first language into a document in a second language.
Multiple machine translation methods, each capable of machine translating a sentence in the first language into a sentence in the second language,
A dividing means for dividing a document in the first language into predetermined segment units, and
A means for generating a translation result by the plurality of machine translation means for each segment obtained by the division, and a means for generating a translation result by the plurality of machine translation means.
An evaluation means for evaluating each of the translation results by the plurality of machine translation means,
For each of the segments, a selection means for selecting one translation result to be adopted from the translation results by the plurality of machine translation means based on the evaluation result.
An output means that outputs the translation result selected for each segment, and
A program that functions as.


JP2020035382A 2020-03-02 2020-03-02 Translation assistance system and program Pending JP2021140281A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020035382A JP2021140281A (en) 2020-03-02 2020-03-02 Translation assistance system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020035382A JP2021140281A (en) 2020-03-02 2020-03-02 Translation assistance system and program

Publications (1)

Publication Number Publication Date
JP2021140281A true JP2021140281A (en) 2021-09-16

Family

ID=77668591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020035382A Pending JP2021140281A (en) 2020-03-02 2020-03-02 Translation assistance system and program

Country Status (1)

Country Link
JP (1) JP2021140281A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2009088067A1 (en) * 2008-01-10 2011-05-26 日本電気株式会社 Machine translation apparatus and machine translation method
JP2016071439A (en) * 2014-09-26 2016-05-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Translation method and translation system
JP2018190287A (en) * 2017-05-10 2018-11-29 日本特許翻訳株式会社 Machine translation device and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2009088067A1 (en) * 2008-01-10 2011-05-26 日本電気株式会社 Machine translation apparatus and machine translation method
JP2016071439A (en) * 2014-09-26 2016-05-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America Translation method and translation system
JP2018190287A (en) * 2017-05-10 2018-11-29 日本特許翻訳株式会社 Machine translation device and program

Similar Documents

Publication Publication Date Title
André et al. Structured documents
Karimi et al. Machine transliteration survey
JP5356197B2 (en) Word semantic relation extraction device
US7756871B2 (en) Article extraction
US7958444B2 (en) Visualizing document annotations in the context of the source document
Rafferty et al. Parsing three German treebanks: Lexicalized and unlexicalized baselines
US20150356074A1 (en) Machine Translation System and Method
Yousef et al. A survey of text alignment visualization
CN110770735A (en) Transcoding of documents with embedded mathematical expressions
US20050131931A1 (en) Abstract generation method and program product
JP2009217689A (en) Information processor, information processing method, and program
Warburton Processing terminology for the translation pipeline
Hamann et al. Detailed mark‐up of semi‐monographic legacy taxonomic works using FlorML
JP2021140281A (en) Translation assistance system and program
Gavrila Constrained recombination in an example-based machine translation system
Robinson Collation, textual criticism, publication, and the computer
Felbur et al. Crosslinguistic semantic textual similarity of Buddhist Chinese and Classical Tibetan
US20240078827A1 (en) Method and apparatus for extracting area of interest in a document
Aransa et al. Semi-supervised transliteration mining from parallel and comparable corpora
Dershowitz et al. Relating articles textually and visually
Binongo et al. A bridge between statistics and literature: The graphs of Oscar Wilde's literary genres
US20220245326A1 (en) Semantically driven document structure recognition
Kokkinakis et al. Recognizing Acronyms and their Definitions in Swedish Medical Texts.
Peng et al. Zero-anaphora resolution in Chinese using maximum entropy
Simianer et al. The HDU Discriminative SMT System for Constrained Data PatentMT at NTCIR10.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230630

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231212