JP6096138B2 - Word order replacement apparatus, method and program, and translation quality evaluation apparatus and program - Google Patents

Word order replacement apparatus, method and program, and translation quality evaluation apparatus and program Download PDF

Info

Publication number
JP6096138B2
JP6096138B2 JP2014043222A JP2014043222A JP6096138B2 JP 6096138 B2 JP6096138 B2 JP 6096138B2 JP 2014043222 A JP2014043222 A JP 2014043222A JP 2014043222 A JP2014043222 A JP 2014043222A JP 6096138 B2 JP6096138 B2 JP 6096138B2
Authority
JP
Japan
Prior art keywords
sentence
particle
word order
replacement
subtree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014043222A
Other languages
Japanese (ja)
Other versions
JP2015170043A (en
Inventor
平尾 努
努 平尾
永田 昌明
昌明 永田
塚田 元
元 塚田
克仁 須藤
克仁 須藤
磯崎 秀樹
秀樹 磯崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014043222A priority Critical patent/JP6096138B2/en
Publication of JP2015170043A publication Critical patent/JP2015170043A/en
Application granted granted Critical
Publication of JP6096138B2 publication Critical patent/JP6096138B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、語順入替装置、方法及びプログラム、並びに翻訳品質評価装置及びプログラムに係り、特に、日本語のように、主要部後続の言語で記述された文を対象とする語順入替装置、方法及びプログラム、並びに翻訳品質評価装置及びプログラムに関する。   The present invention relates to a word order replacement apparatus, method and program, and a translation quality evaluation apparatus and program, and more particularly to a word order replacement apparatus, method and method for a sentence written in a language subsequent to a main part such as Japanese. The present invention relates to a program, a translation quality evaluation apparatus, and a program.

近年、機械翻訳研究では、翻訳済みの大量の文書を統計的に解析することで翻訳辞書を自動生成し、その翻訳辞書を用いて翻訳機を作成する統計的機械翻訳(SMT:Statistical Machine Translation)が世界を席巻している。しかし、日英翻訳や英日翻訳のような語順が全く異なる言語間では、語順の相違が問題となり、SMTによる高品質な翻訳を行うことが難しい場合がある。   In recent years, in machine translation research, statistical machine translation (SMT: Statistical Machine Translation) that automatically generates a translation dictionary by statistically analyzing a large number of translated documents and creates a translator using the translation dictionary Is sweeping the world. However, between languages with completely different word orders, such as Japanese-English translation and English-Japanese translation, the difference in word order becomes a problem, and it may be difficult to perform high-quality translation using SMT.

また、SMTで翻訳機の改良などのために用いられる翻訳自動評価装置についても、標準的に用いられてきたBLEUなどの評価手法は、日英翻訳や英日翻訳では、人間による評価点と非常に低い相関しかないことが知られている(例えば、非特許文献1参照)。   In addition, with regard to automatic translation evaluation devices used to improve translators in SMT, BLEU and other evaluation methods that have been used as standard are the human evaluation points for Japanese-English and English-Japanese translations. Is known to have a low correlation (see, for example, Non-Patent Document 1).

そこで、語順が相違する言語間のSMTについて、語順に重点を置いた自動評価方法が提案されている(例えば、特許文献1参照)。この手法は、非特許文献1でRIBES(Rank-based Intuitive Bilingual Evaluation Score)と呼ばれている手法である。RIBESは、人間が作成した理想的な翻訳文(参照訳文)とSMTによる訳文との大局的な語順の近さを、順位相関係数により評価している。RIBESでは、特に、英日翻訳や日英翻訳で、人間による評価点と高い相関を示している。   Thus, an automatic evaluation method has been proposed in which SMT between languages having different word orders is focused on the word order (see, for example, Patent Document 1). This method is a method called RIBES (Rank-based Intuitive Bilingual Evaluation Score) in Non-Patent Document 1. RIBES evaluates the closeness of the global word order between an ideal translation (reference translation) created by a human and a translation by SMT, using a rank correlation coefficient. In RIBES, English-Japanese translation and Japanese-English translation show a high correlation with human evaluation points.

特開2012−079107号公報JP 2012-079107 A

Isao Goto, Ka Po Chow, Bin Lu, Eiichiro Sumita, Benjamin K. Tsou, "Overview of the Patent Machine Translation Task at the NTCIR-10 Workshop", Proceedings of the 10th NTCIR Conference, pp.260-286, 2010.Isao Goto, Ka Po Chow, Bin Lu, Eiichiro Sumita, Benjamin K. Tsou, "Overview of the Patent Machine Translation Task at the NTCIR-10 Workshop", Proceedings of the 10th NTCIR Conference, pp.260-286, 2010.

しかし、日本語のような主要部後続の言語は、他の言語に比べて比較的語順の自由度が高いことが知られており、参照訳文が一つだけの場合には、翻訳品質を正しく評価ができない場合がある。例えば、「He read the book.」の参照訳文が「彼はその本を読んだ。」であるとき、「彼はその本を読んだ。」という訳文は高い評価となるが、「その本を彼は読んだ。」という訳文は低い評価になってしまう。従って、人間の評価では高い評価となるはずの訳文に対して、RIBESによる評価では高い評価が得られない訳文が存在する。   However, it is known that languages following the main part such as Japanese have a relatively high degree of freedom in word order compared to other languages, and if there is only one reference translation, the translation quality is correct. Evaluation may not be possible. For example, when the reference translation of "He read the book." Is "He read the book.", The translation "He read the book." The translation, “He read.” Is disappointing. Therefore, there is a translated sentence that cannot be highly evaluated by the evaluation by RIBES, while the translated sentence should be highly evaluated by human evaluation.

本発明は、上記の事情を鑑みてなされたもので、意味が同じで語順が異なる複数の文を生成することができる語順入替装置、方法、及びプログラムを提供することを目的とする。また、本発明は、語順の自由度が高い言語への翻訳の品質を適切に評価することができる翻訳品質評価装置及び方法を提供することを目的とする。   The present invention has been made in view of the above circumstances, and an object thereof is to provide a word order changing device, method, and program capable of generating a plurality of sentences having the same meaning but different word orders. It is another object of the present invention to provide a translation quality evaluation apparatus and method that can appropriately evaluate the quality of translation into a language having a high degree of freedom in word order.

上記目的を達成するために、本発明に係る語順入替装置は、文の文節間の係り受け関係を示す係り受け木において、予め定めた助詞で終わる特定文節と、該特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する複数の部分木の各々を入れ替える入替部と、前記入替部により前記部分木が入れ替えられた係り受け木に基づいて、前記文の語順を入れ替えた語順入替文を生成する生成部と、を含んで構成されている。   In order to achieve the above object, the word order permutation apparatus according to the present invention includes a specific phrase ending with a predetermined particle in a dependency tree indicating a dependency relationship between sentence phrases, a phrase that modifies the specific phrase, The sentence order is changed based on a replacement part that replaces each of a plurality of partial trees that modify the same verb, and a dependency tree in which the replacement part is replaced by the replacement part. And a generation unit that generates a word order replacement sentence.

本発明に係る語順入替装置によれば、入替部が、文の文節間の係り受け関係を示す係り受け木において、予め定めた助詞で終わる特定文節と、特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する複数の部分木の各々を入れ替える。そして、生成部が、入替部により部分木が入れ替えられた係り受け木に基づいて、文の語順を入れ替えた語順入替文を生成する。   According to the word order exchanging device according to the present invention, the replacement unit includes a specific phrase that ends with a predetermined particle and a phrase that modifies the specific phrase in a dependency tree that indicates a dependency relationship between the phrases of the sentence. Each of the subtrees that modify the same verb is replaced with a tree. And a production | generation part produces | generates the word order replacement | exchange sentence which replaced the word order of the sentence based on the dependency tree by which the subtree was replaced by the replacement part.

このように、語順の入れ替えを、予め定めた助詞で終わる特定文節と、特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する部分木の入れ替えに限定する。そのため、意味が変わったり、表現が不自然であったりする語順を排除し、元の文と意味が同じで語順が異なる複数の文を生成することができる。   As described above, the replacement of the word order is limited to the replacement of a partial tree including a specific phrase that ends with a predetermined particle and a phrase that modifies the specific phrase, and that modifies the same verb. Therefore, it is possible to eliminate a word order in which the meaning is changed or the expression is unnatural, and to generate a plurality of sentences having the same meaning and different word order as the original sentence.

また、前記予め定めた助詞を、「は」、「が」、「を」、「に」、「で」、及び「と」とすることができる。これらの助詞で終わる文節は、同一の動詞を修飾する際、順番を入れ替えることが可能な助詞である。   The predetermined particles may be “ha”, “ga”, “ha”, “ni”, “de”, and “to”. Phrases ending with these particles are particles that can be reordered when modifying the same verb.

また、本発明に係る語順入替装置は、前記入替部により、助詞「は」以外の前記予め定めた助詞を含む一方の部分木が修飾する動詞とは異なる動詞を含む他方の部分木の前に、前記一方の部分木を入れ替えた係り受け木、または、形容詞を含む一方の部分木の前に、助詞「を」以外の前記予め定めた助詞を含む他方の部分木を入れ替えた係り受け木に基づいて、前記生成部により前記語順入替文を生成しないように制限する制限部を含む構成としてもよい。これにより、不自然な語順の文をより適切に排除することができる。   Further, the word order exchanging device according to the present invention is arranged in front of the other subtree including a verb different from the verb to be modified by the one subtree including the predetermined particle other than the particle “ha” by the replacement unit. A dependency tree in which the one subtree is replaced, or a dependency tree in which the other subtree including the predetermined particle other than the particle “O” is replaced before the one subtree including the adjective On the basis of the above, it may be configured to include a restricting unit that restricts the generating unit from generating the word order replacement sentence. Thereby, the sentence of the unnatural word order can be excluded more appropriately.

また、上記目的を達成するために、本発明に係る翻訳品質評価装置は、文の文節間の係り受け関係を示す係り受け木において、予め定めた助詞で終わる特定文節と、該特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する複数の部分木の各々を入れ替える入替部と、前記入替部により前記部分木が入れ替えられた係り受け木に基づいて、前記文の語順を入れ替えた語順入替文を生成する生成部と、前記入替部により、助詞「は」以外の前記予め定めた助詞を含む一方の部分木が修飾する動詞とは異なる動詞を含む他方の部分木の前に、前記一方の部分木を入れ替えた係り受け木、または、形容詞を含む一方の部分木の前に、助詞「を」以外の前記予め定めた助詞を含む他方の部分木を入れ替えた係り受け木に基づいて、前記生成部により前記語順入替文を生成しないように制限する制限部と、原文を機械翻訳した訳文と、前記原文の理想的な訳文である参照訳文、及び前記参照訳文の意味を変えずに語順を入れ替えた語順入替参照訳文の各々との類似度を算出する算出部と、前記算出部により算出された類似度に基づいて、前記訳文の翻訳品質を評価する評価部と、を含んで構成されている。 In order to achieve the above object, the translation quality evaluation apparatus according to the present invention modifies a specific phrase ending with a predetermined particle in a dependency tree indicating a dependency relation between sentence phrases, and modifies the specific phrase. A subtree comprising a phrase to be replaced, a replacement unit that replaces each of a plurality of subtrees that modify the same verb, and a dependency tree in which the subtree is replaced by the replacement unit. A generating unit that generates a word order replacement sentence in which the word order is changed, and the other subtree including a verb different from the verb modified by the one subtree including the predetermined particle other than the particle “ha” by the replacement unit. A dependency tree in which the one subtree is replaced before, or a relationship tree in which the other subtree including the predetermined particle other than the particle “O” is replaced before the one subtree including the adjective Based on the shrub Word order and limiting section by serial generating unit limits so as not to generate the word order replacement sentence, the translated sentence and machine translation the original text, ideal translation a reference translation is of the original, and without changing the meaning of the reference translation A calculation unit that calculates the similarity with each of the word-order replacement reference translations in which the words are replaced, and an evaluation unit that evaluates the translation quality of the translation based on the similarity calculated by the calculation unit. ing.

本発明に係る翻訳品質評価装置によれば、算出部が、原文を機械翻訳した訳文と、原文の理想的な訳文である参照訳文、及び参照訳文の意味を変えずに語順を入れ替えた語順入替参照訳文の各々との類似度を算出する。そして、評価部が、算出部により算出された類似度に基づいて、訳文の翻訳品質を評価する。これにより、一つの参照訳文により評価する場合に比べて、語順の自由度が高い言語への翻訳の品質を適切に評価することができる。   According to the translation quality evaluation apparatus according to the present invention, the calculation unit translates the original sentence by machine translation, the reference translated sentence that is an ideal translation of the original sentence, and the word order replacement that changes the word order without changing the meaning of the reference translated sentence The similarity with each reference translation is calculated. Then, the evaluation unit evaluates the translation quality of the translation based on the similarity calculated by the calculation unit. Thereby, the quality of translation into a language with a high degree of freedom of word order can be appropriately evaluated compared with the case where it evaluates with one reference translation.

また、前記語順入替参照訳文を、前記制限部による制限の下、前記生成部により生成された前記参照訳文についての語順入替文とすることができる。これにより、人手による労力をかけることなく、意味が同じで語順が異なる複数の参照訳文を用いて、訳文を評価することができる。 In addition, the word order replacement reference translation sentence may be a word order replacement sentence for the reference translation sentence generated by the generation unit under the restriction of the restriction unit . Accordingly, the translation can be evaluated using a plurality of reference translations having the same meaning and different word orders without requiring manual labor.

また、本発明に係る語順入替方法は、入替部と、生成部とを含む語順入替装置における語順入替方法であって、前記入替部が、文の文節間の係り受け関係を示す係り受け木において、予め定めた助詞で終わる特定文節と、該特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する複数の部分木の各々を入れ替えるステップと、前記生成部が、前記入替部により前記部分木が入れ替えられた係り受け木に基づいて、前記文の語順を入れ替えた語順入替文を生成するステップと、を含む方法である。   Further, the word order replacement method according to the present invention is a word order replacement method in a word order replacement device including a replacement unit and a generation unit, wherein the replacement unit indicates a dependency relationship between sentence clauses. A subtree consisting of a specific phrase ending with a predetermined particle and a phrase that modifies the specific phrase, replacing each of a plurality of subtrees that modify the same verb, and the generation unit includes: Generating a word order replacement sentence in which the word order of the sentence is changed based on a dependency tree in which the subtree has been changed by the replacement section.

また、本発明に係る語順入替プログラムは、コンピュータを、上記の語順入替装置を構成する各部として機能させるためのプログラムである。   Moreover, the word order replacement program according to the present invention is a program for causing a computer to function as each unit constituting the word order replacement device.

また、本発明に係る翻訳品質評価プログラムは、コンピュータを、上記の翻訳品質評価装置を構成する各部として機能させるためのプログラムである。   Further, the translation quality evaluation program according to the present invention is a program for causing a computer to function as each part constituting the above translation quality evaluation apparatus.

以上説明したように、本発明に係る語順入替装置、方法、及びプログラムによれば、語順の入れ替えを、予め定めた助詞で終わる特定文節と、特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する部分木の入れ替えに限定する。そのため、意味が変わったり、表現が不自然であったりする語順を排除し、意味が同じで語順が異なる複数の文を生成することができる、という効果が得られる。   As described above, according to the word order replacement device, method, and program of the present invention, the word order replacement is a subtree consisting of a specific phrase that ends with a predetermined particle and a phrase that modifies the specific phrase. Limit the replacement of subtrees that modify the same verb. Therefore, it is possible to eliminate the word order in which the meaning is changed or the expression is unnatural and to generate a plurality of sentences having the same meaning but different word orders.

また、本発明に係る翻訳品質評価装置及びプログラムによれば、参照訳文の意味を変えずに語順を入れ替えた語順入替参照訳文も用いて訳文の翻訳品質を評価する。そのため、一つの参照訳文により評価する場合に比べて、語順の自由度が高い言語への翻訳の品質を適切に評価することができる、という効果が得られる。   Moreover, according to the translation quality evaluation apparatus and program concerning this invention, the translation quality of a translation is evaluated also using the word order replacement | exchange reference translation sentence which replaced the word order, without changing the meaning of a reference translation sentence. Therefore, an effect is obtained that the quality of translation into a language having a high degree of freedom in word order can be appropriately evaluated as compared with the case of evaluating with one reference translation.

本実施の形態に係る語順入替装置及び翻訳品質評価装置を含む翻訳品質評価システムを示す機能ブロック図である。It is a functional block diagram which shows the translation quality evaluation system containing the word order replacement apparatus and translation quality evaluation apparatus which concern on this Embodiment. 係り受け木の一例を示す図である。It is a figure which shows an example of a dependency tree. 係り受け木の一例を示す図である。It is a figure which shows an example of a dependency tree. 本実施の形態における語順入替処理の一例を示すフローチャートである。It is a flowchart which shows an example of the word order replacement | exchange process in this Embodiment. 係り受け木の一例を示す図である。It is a figure which shows an example of a dependency tree. ノード間の接続で表された係り受け木の一例を示す図である。It is a figure which shows an example of the dependency tree represented by the connection between nodes. 可換助詞リスト作成処理の一例を示すフローチャートである。It is a flowchart which shows an example of a commutative particle list creation process. 順列を出力する再帰的プログラムの一例を示す図である。It is a figure which shows an example of the recursive program which outputs a permutation. 順列出力処理の一例を示すフローチャートである。It is a flowchart which shows an example of a permutation output process. 別用言前助詞制限処理の一例を示すフローチャートである。It is a flowchart which shows an example of another predicative particle restriction | limiting process. 本実施の形態における翻訳品質評価処理の一例を示すフローチャートである。It is a flowchart which shows an example of the translation quality evaluation process in this Embodiment. ノード間の接続で表された係り受け木の一例を示す図である。It is a figure which shows an example of the dependency tree represented by the connection between nodes. ノード間の接続で表された係り受け木の一例を示す図である。It is a figure which shows an example of the dependency tree represented by the connection between nodes. ノード間の接続で表された係り受け木の一例を示す図である。It is a figure which shows an example of the dependency tree represented by the connection between nodes.

以下、図面を参照して本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<本実施の形態の原理>
本実施の形態では、文節間の係り受け関係を示す係り受け木で表された参照訳文の語順を入れ替えて、語順入替参照訳文を生成する。日本語らしいHead Final(主要部後続)な語順の文を生成するためには、post−orderで係り受け木を辿ればよい。
<Principle of this embodiment>
In this embodiment, the word order of the reference translation sentence represented by a dependency tree indicating the dependency relation between clauses is switched to generate a word order replacement reference translation sentence. In order to generate a Japanese-style head final (subsequent main part) word order sentence, it is sufficient to follow the dependency tree with a post-order.

post−orderは、計算機科学で木構造の全ノードを辿る(traverse)ときの順序を表す用語であり、pre−order及びin−orderと並び、古くから標準的に用いられている。なお、pre−orderでは、木構造の子ノードを処理(例えば出力)する前に親ノードを処理する。in−orderでは、子ノードを処理している合間に親ノードを処理する。post−orderでは、子ノードを全て処理した後に親ノードを処理する。   The post-order is a term that represents the order in which all nodes of a tree structure are traversed in computer science. The post-order is used alongside pre-order and in-order, and has been used as a standard for a long time. In the pre-order, the parent node is processed before the child node of the tree structure is processed (for example, output). In the in-order, the parent node is processed while the child node is being processed. In post-order, the parent node is processed after all the child nodes are processed.

係り受け木からpost−orderで生成された文は、「修飾される表現が修飾する表現より後ろに来る」という日本語の語順の条件を満たしているが、出力される文の中には、意味的に誤解を招き易い文や、分かり難い文など、不自然な語順の文が含まれる。   The sentence generated by post-order from the dependency tree satisfies the Japanese word order condition that "the expression to be modified comes after the expression to be modified", but in the output sentence, It includes sentences with unnatural word order, such as sentences that are semantically misleading and difficult to understand.

そこで、本実施の形態では、不自然な語順の文を避け、元の参照訳文と同じ意味で、日本語として通用する他の語順の文である語順入替参照訳文を生成する。そして、語順入替参照訳文も含めた参照訳文集合を、機械翻訳の品質の評価に利用する。これにより、元の参照訳文と語順が違うが同じ意味の文を用いて、これまで低い評価しか得られなかった機械訳文に高い評価を与えることができる。   Therefore, in the present embodiment, an unnatural word order sentence is avoided, and a word order replacement reference translation sentence that is another word order sentence that is valid as Japanese is generated in the same meaning as the original reference translation sentence. Then, the reference translation set including the word order replacement reference translation is used for evaluating the quality of the machine translation. This makes it possible to give a high evaluation to a machine translation sentence that has been obtained only with a low evaluation so far, using a sentence having the same meaning but having a different word order from the original reference translation sentence.

本実施の形態では、不自然な語順の文が生成されることを防ぐために、「同一の動詞を修飾する可換助詞部分木の入れ替え」による語順の並べ替えを行う。さらに、「別用言前助詞制限」により参照訳文として用いるには不適切な語順の並べ替えを制限する。   In the present embodiment, in order to prevent generation of an unnatural word order sentence, the word order is rearranged by “replacement of substitutive particle subtrees that modify the same verb”. In addition, the word order rearrangement inappropriate for use as a reference translation sentence is restricted by “another prescriptive particle restriction”.

まず、「可換助詞」とは、文節の終わりに付く特定の助詞であり、その特定の助詞で終わる文節の語順を、品詞が動詞の同一の単語(以下、品詞が動詞の単語を単に「動詞」という。他の品詞の単語についても同様)を修飾し、特定の助詞で終わる他の文節と入れ替えても、入替前後で文の意味が変わらない助詞である。具体的には、助詞「は」、「が」、「を」、「に」、「で」及び「と」である。例えば、「太郎が本屋で地図を買った。」という文は、「太郎が/本屋で/地図を/買った。」のような文節(“/”で区切られた部分)毎に区切ることができる。「太郎が」、「本屋で」、及び「地図を」は、全て可換助詞で終わる文節(以下、「可換助詞文節」という)であり、同一の動詞「買った」を修飾しているため、これらの可換助詞文節の順序を入れ替えることができる。例えば、「地図を/本屋で/太郎が/買った。」のような文節の入れ替えが可能である。   First, a commutative particle is a specific particle attached to the end of a phrase. This is a particle whose meaning does not change before and after the replacement even if it is modified with other phrases that end with a particular particle. Specifically, the particles “ha”, “ga”, “wa”, “ni”, “de”, and “to”. For example, a sentence such as “Taro bought a map at a bookstore” may be divided into phrases (parts separated by “/”) such as “Taro / at a bookstore / buy a map /”. it can. “Taro ga”, “in bookstore”, and “map” are all phrases that end with commutative particles (hereinafter referred to as “commutative particle clauses”), and qualify the same verb “Bought” Therefore, the order of these commutative particle clauses can be changed. For example, it is possible to change phrases such as “Map / at bookstore / Taro / Bought”.

ここで、可換助詞として特定の助詞だけを対象とするのは、助詞の用途によって許容される語順が異なるためである。例えば、助詞「から」及び「まで」を可換助詞として認めると、「東京から品川まで歩いた。」という文の語順を入れ替えて、「品川まで東京から歩いた。」という文が生成される。話し言葉として「品川まで東京から歩いた。」と言う場合はあるが、機械翻訳の品質を評価するための参照訳文として利用することを考慮すると、若干不自然な語順である。従って、このような語順の入れ替えは許容しないようにするために、特定の助詞だけを可換助詞として認めている。   Here, the reason why only a specific particle is used as a commutative particle is that the allowed word order varies depending on the use of the particle. For example, when the particles “from” and “to” are recognized as commutative particles, the order of the sentence “walked from Tokyo to Shinagawa” is changed, and a sentence “walked from Tokyo to Shinagawa” is generated. . The spoken language may be “I walked from Tokyo to Shinagawa”, but it is a slightly unnatural word order when it is used as a reference translation for evaluating the quality of machine translation. Therefore, in order not to allow such a change of word order, only specific particles are recognized as commutative particles.

次に、「可換助詞部分木」について説明する。例えば、元の参照訳文が「太郎が/花屋の/隣の/本屋で/大きな/地図を/買った。」の場合を考える。可換助詞文節の入れ替えだけを行うと、「地図を/花屋の/隣の/太郎が/大きな/本屋で/買った。」という文も生成されてしまうが、この文は元の参照訳文とは意味が変わってしまう。意味を変えずに語順の並べ替えを行うためには、可換助詞文節を修飾する文節も一緒に移動させる必要がある。この例文では、可換助詞文節「本屋で」に対して、この可換助詞文節を修飾する文節も含めると「花屋の/隣の/本屋で」となる。また、可換助詞文節「地図を」に対して、この可換助詞文節を修飾する文節も含めると「大きな/地図を」となる。この単位で並べ替えを行うと、「大きな/地図を/太郎が/花屋の/隣の/本屋で/買った。」となり、元の参照訳文と意味は変わらない。可換助詞文節と、その可換助詞文節を修飾する文節とからなる部分、すなわち係り受け木において、可換助詞文節に対応するノードを根とする部分木が「可換助詞部分木」である。   Next, the “commutative particle subtree” will be described. For example, consider the case where the original reference translation is “Taro / Blanker / Neighborhood / Bookstore / Large / Map / Bought”. If you just replace the commutative particle clauses, the sentence “Map / Hanaya / Neighborhood / Taro is / Large / Bookstore / Bought” will also be generated. Will change the meaning. In order to rearrange the word order without changing the meaning, it is necessary to move together the clauses that modify the commutative particle clauses. In this example sentence, if the phrase that modifies this commutative particle clause is also included for the commutative particle clause “bookstore”, it becomes “at / next to the bookstore”. In addition, if the commutative particle clause “map is” and a clause that modifies the commutative particle clause is included, “large / map” is obtained. When rearranging in this unit, it becomes “Large / Map / Taro / Hanaya / Neighborhood / Bookstore / Buy /” and the meaning is the same as the original reference translation. A part consisting of a commutative particle clause and a clause that modifies the commutative particle clause, that is, a subtree rooted at a node corresponding to the commutative particle clause is a “commutative particle subtree”. .

このように、可換助詞部分木単位で語順の入れ替えを行うことで、不自然な語順の文が生成されるのを防ぐことができる。ただし、文中に複数の用言が存在する場合、上記のように、同一の動詞を修飾する可換助詞部分木の入れ替えによって、不自然な語順の文が生成される場合がある。   Thus, by exchanging the word order on a permutable particle subtree basis, it is possible to prevent generation of an unnatural word order sentence. However, when there are a plurality of predicates in a sentence, as described above, an unnatural sentence order may be generated by exchanging a commutative particle subtree that modifies the same verb.

例えば、
花子が/経営している/花屋の/隣の/本屋で/太郎が/地図を/買った。
において、動詞「買った」を修飾する可換助詞部分木「花子が/経営している/花屋の/隣の/本屋で」と「地図を」とを入れ替えると、
地図を/花子が/経営している/花屋の/隣の/本屋で/太郎が/買った。
For example,
Hanako / operated / at the flower shop / next door / at the bookstore / Taro / buyed the map /
In subtitles, the replacement particle sub-tree “Hanako / Managed / Hanaya / Neighborhood / Bookstore” and “Map” are modified to modify the verb “Bought”.
I bought a map / Hanako / operated / florist / next to / bookstore / Taro / bought.

となり、不自然な語順の文となる。不自然な理由は、「地図を」や「太郎が」が修飾する動詞「買った」の前に、「経営している」という別の動詞があり、この動詞の前に「地図を」が置かれたことにより、「地図を経営している」のように読めてしまうからである。 Becomes an unnatural sentence order. The unnatural reason is that there is another verb “running” in front of the verb “buy” that is modified by “map” or “taro”, and “map” is in front of this verb. It is because it can be read like “I run a map”.

そこで、本実施の形態では、「別用言前助詞制限」という制限を設け、上記のような不自然な語順の文が生成されることを防止する。「別用言前助詞制限」は、具体的には、以下のような制限である。
・本来の係り先である動詞ではない別の動詞の前に出ることができる可換助詞部分木は、可換助詞「は」で終わる可換助詞部分木だけである。
・形容詞の前に出ることができる可換助詞部分木は、可換助詞「を」で終わる可換助詞部分木だけである。
Therefore, in the present embodiment, a restriction of “other prescriptive particle restriction” is provided to prevent the generation of an unnatural word order sentence as described above. Specifically, the “other prescriptive particle restrictions” are the following restrictions.
The only commutative particle subtree that can appear before another verb that is not the original verb is the commutative particle subtree that ends with the commutative particle “ha”.
• The only commutative particle subtree that can appear before an adjective is the commutative particle subtree that ends with the commutative particle "O".

<本実施の形態の構成>
図1は、本発明の実施の形態に係る語順入替装置10及び翻訳品質評価装置20を含む翻訳品質評価システム40を示すブロック図である。語順入替装置10は、CPUと、RAMと、後述する語順入替処理を実行するためのプログラムを記憶したROMとを備えたコンピュータで構成することができる。また、翻訳品質評価装置20は、CPUと、RAMと、後述する翻訳品質評価処理を実行するためのプログラムを記憶したROMとを備えたコンピュータで構成することができる。
<Configuration of the present embodiment>
FIG. 1 is a block diagram showing a translation quality evaluation system 40 including a word order replacement device 10 and a translation quality evaluation device 20 according to an embodiment of the present invention. The word order changing device 10 can be configured by a computer including a CPU, a RAM, and a ROM that stores a program for executing a word order changing process described later. Moreover, the translation quality evaluation apparatus 20 can be comprised with a computer provided with CPU, RAM, and ROM which memorize | stored the program for performing the translation quality evaluation process mentioned later.

語順入替装置10には、原文を機械翻訳した訳文の翻訳品質を評価するための原文の理想的な訳文である参照訳文の文節間の係り受け関係を示す係り受け木が入力される。参照訳文から係り受け木を得るには、既知の係り受け解析器を利用することができる。   The word order changing device 10 receives a dependency tree indicating a dependency relationship between phrases of the reference translation, which is an ideal translation of the original for evaluating the translation quality of the translation obtained by machine translation of the original. A known dependency analyzer can be used to obtain a dependency tree from the reference translation.

ここで、多くの係り受け解析器は、引用符や括弧の処理に問題がある。例えば、
「浩がアメリカに行った。」と言われた。
という文を、標準的な日本語係り受け解析器で解析すると、例えば図2及び下記に示すように文節が区切られる。
「浩が/アメリカに/行った。」と/言われた。
Here, many dependency analyzers have problems with processing of quotation marks and parentheses. For example,
“Hou went to America.”
Is analyzed by a standard Japanese dependency analyzer, the clauses are divided as shown in FIG. 2 and the following, for example.
“Hiro / went to America /” / said.

このため、文節単位で「浩が」と「アメリカに」を入れ替えようとすると、
アメリカに「浩が行った。」と言われた。
のような語順になってしまう。そこで、本実施の形態では、図3及び下記に示すように、括弧の内部の文の文節を、括弧の文節と切り直し、開き括弧の文節は閉じ括弧の文節を修飾するように修正された係り受け木を入力として受け付けるものとする。
「/浩が/アメリカに/行った。/」と/言われた。
For this reason, if you try to switch between “Haga” and “To America” by phrase,
He was told to America that "Hiro went."
It becomes the word order like. Therefore, in this embodiment, as shown in FIG. 3 and below, the clause of the sentence inside the parentheses is re-cut into the clause of the parenthesis, and the clause of the opening parenthesis is modified to modify the clause of the closing parenthesis. It is assumed that a dependency tree is accepted as an input.
“/ Hiro / went to America / /” /

語順入替装置10を構成するコンピュータは、機能的には、図1に示すように、同一の動詞を修飾する可換助詞部分木を入れ替える入替部11と、別用言前助詞制限の判定を行う制限部12と、可換助詞部分木が入れ替えられた係り受け木に基づいて語順入替参照訳文を生成する生成部13とを含んだ構成で表すことができる。以下、各部について詳述する。   As shown in FIG. 1, functionally, the computer that constitutes the word order changing device 10 performs a replacement part 11 that replaces a replaceable particle subtree that modifies the same verb, and a pre-adjunct particle restriction determination. It can be expressed by a configuration including a restriction unit 12 and a generation unit 13 that generates a word order replacement reference translation based on a dependency tree in which a commutative particle subtree is replaced. Hereinafter, each part is explained in full detail.

入替部11は、入力された参照訳文の係り受け木を受け付け、同一の動詞を修飾する可換助詞文節を、参照訳文に含まれる動詞毎に特定する。また、入替部11は、同一の動詞を修飾する可換助詞文節が複数存在する場合に、複数の可換助詞文節の全ての順列を出力する。順列の各々は、可換助詞文節と可換助詞文節を修飾する文節とからなる可換助詞部分木の入れ替えの各パターンに相当する。   The replacement unit 11 receives the dependency tree of the input reference translation sentence, and specifies a commutative particle clause that modifies the same verb for each verb included in the reference translation sentence. The replacement unit 11 outputs all permutations of a plurality of commutative particle clauses when there are a plurality of commutative particle clauses that modify the same verb. Each permutation corresponds to each pattern of replacement of a commutative particle subtree consisting of commutative particle clauses and clauses that modify commutative particle clauses.

制限部12は、入替部11により出力された順列のうち、上述した別用言前助詞制限により制限される可換助詞部分木の入れ替えに相当する順列を排除し、残りの順列を出力する。   The restriction unit 12 excludes a permutation corresponding to the replacement of a subjunction particle subtree restricted by the above-mentioned prejunctive particle restriction from the permutations output by the replacement unit 11, and outputs the remaining permutations.

生成部13は、制限部12から出力された順列の各々に従って可換助詞部分木が入れ替えられた係り受け木の各々に基づいて、語順入替参照訳文の各々を生成する。生成部13は、元の参照訳文と、生成した語順入替参照訳文とを合わせて、参照訳文集合30とし、所定の記憶領域に記憶する。   The generation unit 13 generates each of the word order replacement reference translations based on each dependency tree in which the commutative particle subtree is replaced according to each of the permutations output from the restriction unit 12. The generation unit 13 combines the original reference translation text and the generated word order replacement reference translation text into a reference translation set 30 and stores it in a predetermined storage area.

翻訳品質評価装置20を構成するコンピュータは、機能的には、図1に示すように、評価対象訳文と参照訳文の各々との類似度を算出する算出部21と、類似度に基づいて評価対象訳文の品質を評価する評価部22とを含んだ構成で表すことができる。以下、各部について詳述する。   As shown in FIG. 1, the computer constituting the translation quality evaluation apparatus 20 functionally calculates a similarity between the evaluation target translation and each of the reference translations, and an evaluation target based on the similarity. It can be expressed by a configuration including an evaluation unit 22 that evaluates the quality of the translation. Hereinafter, each part is explained in full detail.

算出部21は、機械翻訳の品質の評価対象である評価対象訳文を入力として受け付ける。また、所定の記憶領域に記憶された参照訳文集合30を読み出す。そして、算出部21は、評価対象訳文と、参照訳文集合30に含まれる複数の参照訳文(元の参照訳文及び語順入替参照訳文)の各々との類似度を算出する。類似度は、表記のマッチング等、既知の手法を用いて算出することができる。   The calculation unit 21 receives an evaluation target translated sentence that is an evaluation target of the quality of machine translation as an input. Further, the reference translation set 30 stored in a predetermined storage area is read out. Then, the calculation unit 21 calculates the degree of similarity between the evaluation target translation and each of the plurality of reference translations (the original reference translation and the word order replacement reference translation) included in the reference translation set 30. The similarity can be calculated using a known method such as notation matching.

評価部22は、算出部21により算出された、複数の参照訳文の各々に対する類似度に基づいて、評価対象訳文に対する評価結果を求めて出力する。評価結果は、複数の参照訳文の各々に対する類似度のうち、最も高い類似度に基づく評価、各類似度の平均に基づく評価等とすることができる。   The evaluation unit 22 obtains and outputs an evaluation result for the evaluation target translation based on the similarity to each of the plurality of reference translations calculated by the calculation unit 21. The evaluation result can be an evaluation based on the highest similarity among the similarities for each of the plurality of reference translations, an evaluation based on the average of the similarities, and the like.

<本実施の形態の作用>
次に、本実施の形態の語順入替装置10の作用について説明する。参照訳文の係り受け木が語順入替装置10に入力されると、語順入替装置10において、図4に示す語順入替処理が実行される。
<Operation of the present embodiment>
Next, the operation of the word order changing device 10 of the present embodiment will be described. When the dependency translation dependency tree is input to the word order replacement device 10, the word order replacement device 10 performs the word order replacement processing shown in FIG.

ステップS10で、入替部11が、入力された参照訳文の係り受け木を受け付ける。ここでは、例えば図5に示すような係り受け木を受け付けたものとする。図5の例では、文を構成する各形態素が各行に対応しており、各行には、形態素の表記、品詞、活用形等の情報が含まれる。また、各文節の最初の形態素に対応する行の前に、その文節の情報を示す文節情報行が設けられている。図5の例では、「*」で始まる行が文節情報行であることを表しており、文節情報行には、文節を識別するための文節id、及びその文節が修飾する文節の文節id(以下、「修飾先の文節id」という)の情報が含まれる。   In step S10, the replacement unit 11 receives a dependency tree of the input reference translation. Here, for example, a dependency tree as shown in FIG. 5 is accepted. In the example of FIG. 5, each morpheme constituting the sentence corresponds to each line, and each line includes information such as morpheme notation, part of speech, and utilization form. In addition, a phrase information line indicating information on the phrase is provided before the line corresponding to the first morpheme of each phrase. In the example of FIG. 5, a line starting with “*” represents a clause information line, and the clause information line includes a clause id for identifying the clause and a clause id of the clause that the clause modifies ( Hereinafter, information of “modification destination clause id”) is included.

また、図5の係り受け木を、各文節をノードで表し(図6中の四角枠)、文節間の係り受け関係をノード間の接続で表した例を図6に示す。図6の例では、親子関係にある文節間に対応する子ノードから親ノードに向かう矢印で、ノード間を接続している。また、各ノードの上または左に付記した数字は、そのノードに対応する文節の文節idである。   Further, FIG. 6 shows an example in which the dependency tree of FIG. 5 is represented by each node as a node (square frame in FIG. 6), and the dependency relationship between the clauses is expressed by connection between nodes. In the example of FIG. 6, the nodes are connected by an arrow from the child node corresponding to the parent-child relationship to the parent node. Also, the number added above or to the left of each node is the phrase id of the phrase corresponding to that node.

次に、ステップS20で、入替部11が、可換助詞リスト作成処理を実行する。可換助詞リスト作成処理は、同一の動詞を修飾する可換助詞文節を、参照訳文に含まれる動詞毎に特定して、可換助詞リストを作成する処理である。ここで、図7を参照して、図5に示す係り受け木が入力された場合における可換助詞リスト作成処理の一例を説明する。   Next, in step S20, the replacement unit 11 executes a commutative particle list creation process. The commutative particle list creation process is a process of creating a commutative particle list by specifying a commutative particle clause that modifies the same verb for each verb included in the reference translation sentence. Here, an example of commutative particle list creation processing when the dependency tree shown in FIG. 5 is input will be described with reference to FIG.

ステップS21で、入替部11が、文節idに対応する変数id、及び修飾先の文節idに対応する変数linkを空に設定する。また、可換助詞リストA[link]を空に設定にする。可換助詞リストA[link]は、文節idがlinkである動詞を修飾する可換助詞文節の文節idを格納するリストである。例えば、文節id=’0’及び’1’の可換助詞文節が、文節id=’3’の動詞を修飾している場合、A[’3’]=[’0’,’1’]と表す。   In step S21, the replacement unit 11 sets the variable id corresponding to the clause id and the variable link corresponding to the clause id of the modification destination to be empty. In addition, the commutative particle list A [link] is set to be empty. The commutative particle list A [link] is a list that stores the phrase ids of commutative particle phrases that modify the verb whose phrase id is link. For example, if commutative particle clauses with clause id = '0' and '1' modify a verb with clause id = '3', A ['3'] = ['0', '1'] It expresses.

次に、ステップS22で、係り受け木の次の行を読み込む。ここでは、本ルーチンにおいて初めて本ステップが実行されるため、係り受け木の1行目を読み込む。   Next, in step S22, the next line of the dependency tree is read. Here, since this step is executed for the first time in this routine, the first line of the dependency tree is read.

次に、ステップS23で、上記ステップS22で読み込んだ行が、最終行か、または文節情報行かを判定する。読み込んだ行が「EOS」であれば、最終行であると判定することができ、読み込んだ行の最初に「*」が記述されている場合には、文節情報行であると判定することができる。肯定判定の場合には、ステップS24へ移行し、否定判定の場合には、ステップS28へ移行する。ここでは、最初の行は「* 0 3D」であるので、文節情報行であると判定されて、ステップS24へ移行する。   Next, in step S23, it is determined whether the line read in step S22 is the last line or a phrase information line. If the read line is “EOS”, it can be determined that it is the last line, and if “*” is described at the beginning of the read line, it can be determined that it is a clause information line. it can. If the determination is affirmative, the process proceeds to step S24. If the determination is negative, the process proceeds to step S28. Here, since the first line is “* 0 3D”, it is determined that it is a phrase information line, and the process proceeds to step S24.

ステップS24では、入替部11が、変数idが空か、または、変数linkに対応したA[link]にidが格納済みか否かを判定する。肯定判定の場合には、ステップS26へ移行し、否定判定の場合には、ステップS25へ移行する。ここでは、変数idは空であるので、肯定判定されて、ステップS26へ移行する。   In step S24, the replacement unit 11 determines whether the variable id is empty or whether id is already stored in A [link] corresponding to the variable link. If the determination is affirmative, the process proceeds to step S26. If the determination is negative, the process proceeds to step S25. Here, since the variable id is empty, an affirmative determination is made, and the routine proceeds to step S26.

ステップS26では、入替部11が、上記ステップS22で読み込んだ行が、最終行か否かを判定する。肯定判定の場合には、ステップS30へ移行し、否定判定の場合には、ステップS27へ移行する。ここでは、読み込んだ行は「EOS」ではないため、否定判定されてステップS27へ移行する。   In step S26, the replacement unit 11 determines whether or not the line read in step S22 is the last line. If the determination is affirmative, the process proceeds to step S30. If the determination is negative, the process proceeds to step S27. Here, since the read line is not “EOS”, a negative determination is made and the process proceeds to step S27.

ステップS27では、上記ステップS22で読み込んだ行、すなわち文節情報行に記述された文節idを取得して、変数idに設定する。また、文節情報行に記述された修飾先の文節idを取得して、変数linkに設定する。ここでは、id=’0’、link=’3’となり、文節id=’0’の文節(以下、「第0文節」という。他の文節idの文節についても同様)「太郎が」が処理対象となる。   In step S27, the phrase id described in the line read in step S22, that is, the phrase information line, is acquired and set in the variable id. Also, the modification-destination clause id described in the clause information line is acquired and set in the variable link. Here, id = '0', link = '3', and clause id = '0' (hereinafter referred to as “0th clause”. The same applies to clauses with other clause ids) “Taro ga” is processed It becomes a target.

ステップS22に戻り、次の行「太郎 名詞,...」を読み込み、ステップS23で否定判定されてステップS28へ移行する。ステップS28では、上記ステップS22で読み込んだ行の形態素の表記及び品詞を参照し、その形態素が可換助詞であるか否かを判定する。肯定判定の場合には、ステップS29へ移行し、否定判定の場合には、ステップS22に戻る。ここでは、形態素「太郎」は名詞であり、可換助詞ではないため、ステップS22に戻る。   Returning to step S22, the next line "Taro noun, ..." is read, a negative determination is made in step S23, and the flow proceeds to step S28. In step S28, the morpheme notation and part of speech of the line read in step S22 are referred to and it is determined whether or not the morpheme is a commutative particle. If the determination is affirmative, the process proceeds to step S29. If the determination is negative, the process returns to step S22. Here, since the morpheme “Taro” is a noun and not a commutative particle, the process returns to step S22.

ステップS22で、次の行「が 助詞,格助詞,...」を読み込み、ステップS23で、否定判定されてステップS28へ移行する。ここでは、形態素「が」は、可換助詞として予め定めた特定の助詞であるため、肯定判定されて、ステップS29へ移行する。   In step S22, the next line “ga particle, case particle,...” Is read, and in step S23, a negative determination is made, and the flow proceeds to step S28. Here, since the morpheme “ga” is a specific particle predetermined as a commutative particle, an affirmative determination is made and the process proceeds to step S29.

ステップS29では、変数id、すなわち現在の処理対象の文節の文節idを、変数linkについてのA[link]に追加する。ここでは、A[’3’]=[’0’]となる。これは、第0文節「太郎が」が、第3文節「食べた」を修飾する可換助詞文節であることを表す。   In step S29, the variable id, that is, the phrase id of the currently processed clause is added to A [link] for the variable link. Here, A ['3'] = ['0']. This indicates that the 0th phrase “Taro ga” is a commutative particle phrase that modifies the third phrase “eat”.

ステップS22に戻り、次の行「* 1 3D」を読み込むみ、ステップS23で肯定判定されて、S24へ移行する。変数idは’0’、A[link]はA[’3’]=[’0’]であるので、ステップS26へ移行し、否定判定されて、ステップS27へ移行する。ステップS27で、id=’1’、link=’3’が設定され、第1文節「回転寿司で」が処理対象となる。   Returning to step S22, the next line “* 1 3D” is read, an affirmative determination is made in step S23, and the process proceeds to S24. Since the variable id is '0' and A [link] is A ['3'] = ['0'], the process proceeds to step S26, a negative determination is made, and the process proceeds to step S27. In step S27, id = '1' and link = '3' are set, and the first phrase “rotary sushi is” is processed.

次の行及びその次の行について、ステップS22、S23、及びS28を経て、再びステップS22に戻り、次の行「で 助詞,格助詞,...」が読み込まれる。そして、ステップS23を経て、S28で可換助詞と判定され、ステップS29で、A[’3’]にid=’1’が追加される。従って、A[’3’]は、A[’3’]=[’0’,’1’]となる。   With respect to the next line and the next line, the process returns to step S22 again through steps S22, S23, and S28, and the next line “particle, case particle,...” Is read. Then, after step S23, it is determined as a commutative particle in S28, and id = '1' is added to A ['3'] in step S29. Therefore, A ['3'] becomes A ['3'] = ['0', '1'].

同様の処理を繰り返し、「* 2 3D」の行から始まる処理では、id=’2’及びlink=’3’が設定され、第2文節「お寿司を」が処理対象となる。第2文節には可換助詞「を」が存在するので、A[’3’]にid=’2’が追加され、A[’3’]=[’0’,’1’,’2’]となる。   By repeating the same process and starting from the line “* 2 3D”, id = ‘2’ and link = ’3’ are set, and the second phrase “sushi” is the processing target. Since the commutative particle “O” exists in the second phrase, id = “2” is added to A ['3'], and A ['3'] = ['0', '1', '2 '].

次に、「* 3 4D」の行の処理では、id=’3’及びlink=’4’が設定され、第3文節「食べた」の処理が始まる。第3文節には可換助詞がないので、A[’4’]には追加されず、空のままである。   Next, in the processing of the row “* 3 4D”, id = “3” and link = “4” are set, and the processing of the third phrase “eat” is started. Since there is no commutative particle in the third phrase, it is not added to A ['4'] and remains empty.

次に、ステップS22で、「* 4 6D」の行が読み込まれると、S23を経て、ステップS24では、id=’3’であるので、idが空ではなく、またA[’4’]にid=’3’も格納されていないため、ステップS25へ移行する。ステップS25では、入替部11が、A[’link’]に(’X’+’id’)を追加する。ここでは、A[’4’]=[’X3’]となる。これは、第4文節を修飾する第3文節が可換助詞文節ではないことを示す。   Next, when the line “* 4 6D” is read in step S22, the process passes through S23, and in step S24, id = “3”, so that id is not empty and A [′ 4 ”] is set. Since id = '3' is not stored, the process proceeds to step S25. In step S25, the replacement unit 11 adds ('X' + 'id') to A ['link']. Here, A ['4'] = ['X3']. This indicates that the third clause that modifies the fourth clause is not a commutative particle clause.

このように、可換助詞リストA[link]に、’X3’のように、可換助詞文節ではない文節、例えば前置詞、副詞、可換助詞以外の助詞、動詞の連用形などの情報を含めておく。例えば、同じ動詞を修飾する可換助詞文節の間に、可換助詞文節以外の文節がはさまれている場合がある。この場合、A[link]は、例えばA[link]=[’4’,’X6’,’8’]のようになる。この場合に[’8’,’X6’,’4’]のように’X’をまたいだ入れ替えを行うと、不自然な表現になる場合がある。これを防止するため、可換助詞文節と同一の動詞を修飾する可換助詞文節以外の文節の情報も、例えば’X’等の記号を付与して残している。   Thus, the commutative particle list A [link] includes information such as 'X3' that is not a commutative particle clause, such as prepositions, adverbs, particles other than commutative particles, and verb conjunctive forms. deep. For example, there may be a clause other than a commutative particle clause between commutative particle clauses that modify the same verb. In this case, A [link] becomes, for example, A [link] = ['4', 'X6', '8']. In this case, if “X” is exchanged across [X8], “X6”, “4”], an unnatural expression may occur. In order to prevent this, information on clauses other than the commutative particle clause that modifies the same verb as the commutative particle clause is also left with a symbol such as 'X'.

次に、ステップS26を経てステップS27へ移行し、id=’4’及びlink=’6’が設定され、第4文節が処理対象となる。第4文節には可換助詞「に」があるので、A[’6’]=[’4’]となる。   Next, the process proceeds to step S27 through step S26, id = '4' and link = '6' are set, and the fourth phrase becomes the processing target. Since there is a commutative particle “ni” in the fourth phrase, A ['6'] = ['4'].

次に、「* 5 6D」の行から始まる処理では、第5文節が処理対象となる。第5文節には、可換助詞「を」があるので、A[’6’]にid=’5’が追加され、A[’6’]=[’4’,’5’]となる。   Next, in the process starting from the line “* 5 6D”, the fifth clause is a processing target. In the fifth clause, there is a commutative particle “O”, so id = “5” is added to A ['6'], and A ['6'] = ['4', '5']. .

ステップS22で読み込んだ行が最終行(「EOS」)の場合には、ステップS30へ移行して、入替部11が、A[link]を出力する。ここでは、A[’3’]=[’0’,’1’,’2’],A[’6’]=[’4’,’5’]が出力される。そして、可換助詞リスト作成処理を終了し、図4に示す語順入替処理へリターンする。   When the line read in step S22 is the last line (“EOS”), the process proceeds to step S30, and the replacement unit 11 outputs A [link]. Here, A ['3'] = ['0', '1', '2'], A ['6'] = ['4', '5'] is output. Then, the commutative particle list creation process ends, and the process returns to the word order replacement process shown in FIG.

次に、図4に示す語順入替処理のステップS40で、入替部11が、順列出力処理を実行する。順列出力処理は、複数の可換助詞文節に修飾されている動詞毎に、複数の可換助詞文節の全ての順列を出力する処理である。この順列に従って、可換助詞文節を根とする可換助詞部分木を入れ替えることで、同一の動詞を修飾する可換助詞部分木の入れ替えが実現される。   Next, in step S40 of the word order replacement process shown in FIG. 4, the replacement unit 11 executes the permutation output process. The permutation output process is a process for outputting all permutations of a plurality of commutative particle clauses for each verb that is modified by a plurality of commutative particle clauses. By replacing the commutative particle subtree rooted at the commutative particle clause according to this permutation, replacement of the commutative particle subtree that modifies the same verb is realized.

具体的には、例えば図8に示すような再帰的プログラムや、整数リストの順列作成の方式を用いて、可換助詞文節の順列を出力することができる。ここでは、一例として、図9に示すように、整数リストの順列作成の方式を用いた順列出力処理について説明する。図9に示す順列出力処理は、参照訳文に含まれる動詞毎に実行される。例えば、係り受け木の根から幅優先で、処理対象とする動詞を順次探索することができる。参照訳文中の全ての動詞を処理対象としてもよいが、係り受け木の根に近いほど、大局的な入れ替えが発生するため、係り受け木の根から一番近く、複数の可換助詞文節に修飾されている動詞に限定して、処理対象に設定してもよい。なお、図9に示す順列出力処理のステップS54以外の処理は、整数リストの順列作成処理である。   Specifically, for example, a permutation of commutative particle clauses can be output using a recursive program as shown in FIG. 8 or a method of creating a permutation of an integer list. Here, as an example, a permutation output process using a method for creating a permutation of an integer list will be described as shown in FIG. The permutation output process shown in FIG. 9 is executed for each verb included in the reference translation. For example, the verbs to be processed can be sequentially searched from the dependency tree root with priority given to the width. All verbs in the reference translation may be processed, but the closer to the root of the dependency tree, the more global replacement occurs, so it is the closest to the root of the dependency tree and is modified to multiple commutative particle clauses. You may limit it to a verb and set it as a processing target. The processes other than step S54 of the permutation output process shown in FIG. 9 are permutation creation processes of the integer list.

図9に示す順列出力処理のステップS41で、入替部11が、permListに、初期の順列として[0]を格納し、変数kに1を設定する。また、変数nに、処理対象の動詞を修飾する可換助詞リストA[link]に格納されているidの数を設定する。例えば、文節id=’6’に含まれる動詞を処理対象とする場合、A[’6’]=[’4’,’5’]であるので、n=2となる。なお、’X3’のように、可換助詞文節以外の情報がA[link]に含まれている場合には、それも含める。   In step S41 of the permutation output process shown in FIG. 9, the replacement unit 11 stores [0] as the initial permutation in permList and sets 1 to the variable k. The variable n is set to the number of ids stored in the commutative particle list A [link] that modifies the verb to be processed. For example, when the verb included in the phrase id = “6” is to be processed, since A [′ 6 ′] = [′ 4 ′, ’5 ′], n = 2. In addition, when information other than a commutative particle clause is included in A [link] like 'X3', it is also included.

次に、ステップS42で、入替部11が、k<nか否かを判定し、k<nの場合には、ステップS43へ移行し、k≧nの場合には、ステップS53へ移行する。ステップS43では、入替部11が、newPermListを空に設定し、変数jに0を設定し、kの階乗(kfact)を演算する。次に、ステップS44で、入替部11が、j<kfactか否かを判定し、j<kfactの場合には、ステップS45へ移行し、j≧kfactkの場合には、ステップS51へ移行する。   Next, in step S42, the replacement unit 11 determines whether or not k <n. If k <n, the process proceeds to step S43. If k ≧ n, the process proceeds to step S53. In step S43, the replacement unit 11 sets newPermList to be empty, sets 0 to the variable j, and calculates the factorial (kfact) of k. Next, in step S44, the replacement unit 11 determines whether or not j <kfact. If j <kfact, the process proceeds to step S45. If j ≧ kfactk, the process proceeds to step S51.

ステップS45では、入替部11が、変数iに0を設定する。次に、ステップS46で、入替部11が、i≦kか否かを判定し、i≦kの場合には、ステップS47へ移行し、i>kの場合には、ステップS50へ移行する。ステップS47では、入替部11が、permListのj番目の順列のi番目の要素の直前にkを挿入した順列pjkを作成する。次に、ステップS48で、入替部11が、作成した順列pjkをnewPermListに追加する。   In step S45, the replacement unit 11 sets 0 to the variable i. Next, in step S46, the replacement unit 11 determines whether or not i ≦ k. If i ≦ k, the process proceeds to step S47, and if i> k, the process proceeds to step S50. In step S47, the replacement unit 11 creates a permutation pjk in which k is inserted immediately before the i-th element of the j-th permutation of permList. Next, in step S48, the replacement unit 11 adds the created permutation pjk to newPermList.

次に、ステップS49で、入替部11が、変数iを1インクリメントして、ステップS46に戻る。ステップS46で否定判定されてステップS50へ移行すると、入替部11が、変数jを1インクリメントして、ステップS44に戻る。ステップS44で否定判定されてステップS51へ移行すると、入替部11が、permListに格納された順列を、newPermListに格納された順列で置き換える。次に、ステップS52で、入替部11が、変数kを1インクリメントして、ステップS42に戻る。   Next, in step S49, the replacement unit 11 increments the variable i by 1, and returns to step S46. When a negative determination is made in step S46 and the process proceeds to step S50, the replacement unit 11 increments the variable j by 1, and the process returns to step S44. When a negative determination is made in step S44 and the process proceeds to step S51, the replacement unit 11 replaces the permutation stored in permList with the permutation stored in newPermList. Next, in step S52, the replacement unit 11 increments the variable k by 1, and returns to step S42.

ステップS42で否定判定されてステップS53へ移行すると、入替部11が、permListに格納された整数リストの順列を出力する。ここでは、[0,1]及び[1,0]が出力される。次に、ステップS54で、入替部11が、出力した順列の整数と、可換助詞リストの何番目の文節idかを対応付けて、順列の整数を文節idに置換した順列を出力する。ここでは、A[’6’]=[’4’,’5’]であるため、0番目の文節idは’4’、1番目の文節idは’5’である。従って、[’4’,’5’]及び[’5’,’4’]が出力される。そして、順列出力処理を終了し、図4に示す語順入替処理へリターンする。   When a negative determination is made in step S42 and the process proceeds to step S53, the replacement unit 11 outputs the permutation of the integer list stored in permList. Here, [0, 1] and [1, 0] are output. Next, in step S54, the replacement unit 11 associates the output integer of the permutation with the phrase id of the commutative particle list, and outputs the permutation in which the integer of the permutation is replaced with the phrase id. Here, since A ['6'] = ['4', '5'], the 0th clause id is '4' and the first clause id is '5'. Accordingly, ['4', '5'] and ['5', '4'] are output. Then, the permutation output process ends, and the process returns to the word order replacement process shown in FIG.

次に、図4に示す語順入替処理のステップS60で、制限部12が、別用言前助詞制限処理を実行する。別用言前助詞制限処理は、出力された順列のうち、上述した別用言前助詞制限により制限される可換助詞部分木の入れ替えに相当する順列を排除する処理である。図10を参照して、図5に示す係り受け木が入力された場合における別用言前助詞制限処理の一例を説明する。図10の例は、「別用言前助詞制限」を満たさない順列を排除するため、用言を含む文節や、用言を含む表現で修飾されている文節に予めマークをつけておく方式である。   Next, in step S60 of the word order replacement process shown in FIG. 4, the restriction unit 12 executes another prescriptive particle restriction process. The pre-subject particle restriction process is a process of eliminating a permutation corresponding to the replacement of a subjunctive sub-partial tree restricted by the above-mentioned pre-subject particle restriction from the output permutations. With reference to FIG. 10, an example of another preferential particle restricting process when the dependency tree shown in FIG. 5 is input will be described. In the example of FIG. 10, in order to eliminate permutations that do not satisfy the “other prescriptive particle restriction”, a phrase that includes a prescription or a phrase that is modified with an expression that includes a prescription is marked in advance. is there.

図10に示す別用言前助詞制限処理のステップS61で、制限部12が、処理対象Yに’動詞’を設定する。次に、ステップS62で、制限部12が、文節idに対応する変数id、及び修飾先の文節idに対応する変数linkを空に設定する。また、マーク’Y’[id]を空に設定にする。マーク’Y’[id]は、文節idがidである文節にYに設定された品詞が含まれる場合に’True’、含まれない場合に’False’となるマークである。例えば、Y=’動詞’で、第6文節が動詞を含む場合、’動詞’[’6’]=Trueとなる。   In step S <b> 61 of the another prescriptive particle restriction process illustrated in FIG. 10, the restriction unit 12 sets “verb” as the processing target Y. In step S62, the restriction unit 12 sets the variable id corresponding to the clause id and the variable link corresponding to the clause id to be modified to be empty. Also, the mark “Y” [id] is set to be empty. The mark “Y” [id] is “True” when the phrase whose phrase id is “id” includes the part of speech set to Y, and becomes “False” when the phrase is not included. For example, if Y = 'verb' and the sixth clause contains a verb, then 'verb' ['6'] = True.

次に、ステップS63で、係り受け木の次の行を読み込む。ここでは、本ルーチンにおいて初めて本ステップが実行されるため、係り受け木の1行目を読み込む。   Next, in step S63, the next line of the dependency tree is read. Here, since this step is executed for the first time in this routine, the first line of the dependency tree is read.

次に、ステップS64で、可換助詞リスト作成処理(図7)のステップS23と同様に、上記ステップS63で読み込んだ行が、最終行か、または文節情報行かを判定する。肯定判定の場合には、ステップS65へ移行し、否定判定の場合には、ステップS71へ移行する。ここでは、最初の行は「* 0 3D」であるので、文節情報行であると判定されて、ステップS65へ移行する。   Next, in step S64, as in step S23 of the commutative particle list creation process (FIG. 7), it is determined whether the line read in step S63 is the last line or phrase information line. If the determination is affirmative, the process proceeds to step S65. If the determination is negative, the process proceeds to step S71. Here, since the first line is “* 0 3D”, it is determined that it is a phrase information line, and the process proceeds to step S65.

ステップS65では、制限部12が、変数idが空か、または、’Y’[id]に’True’または’False’が登録済みか否かを判定する。肯定判定の場合には、ステップS67へ移行し、否定判定の場合には、ステップS66へ移行する。ここでは、変数idは空であるので、肯定判定されて、ステップS67へ移行する。   In step S <b> 65, the limiting unit 12 determines whether the variable id is empty or “True” or “False” is already registered in “Y” [id]. If the determination is affirmative, the process proceeds to step S67. If the determination is negative, the process proceeds to step S66. Here, since the variable id is empty, an affirmative determination is made, and the routine proceeds to step S67.

ステップS67では、制限部12が、変数idが空か、または、’Y’[id]に’False’が登録済みか否かを判定する。肯定判定の場合には、ステップS69へ移行し、否定判定の場合には、ステップS68へ移行する。ここでは、変数idは空であるので、肯定判定されて、ステップS69へ移行する。   In step S <b> 67, the limiting unit 12 determines whether the variable id is empty or “False” has already been registered in “Y” [id]. If the determination is affirmative, the process proceeds to step S69. If the determination is negative, the process proceeds to step S68. Here, since the variable id is empty, an affirmative determination is made, and the routine proceeds to step S69.

ステップS69では、制限部12が、上記ステップS63で読み込んだ行が、最終行か否かを判定する。肯定判定の場合には、ステップS73へ移行し、否定判定の場合には、ステップS70へ移行する。ここでは、読み込んだ行は「EOS」ではないため、否定判定されてステップS70へ移行する。   In step S69, the limiting unit 12 determines whether or not the line read in step S63 is the last line. If the determination is affirmative, the process proceeds to step S73. If the determination is negative, the process proceeds to step S70. Here, since the read line is not “EOS”, a negative determination is made and the process proceeds to step S70.

ステップS70では、可換助詞リスト作成処理のステップS27と同様に、上記ステップS63で読み込んだ文節情報行に記述された文節id及び修飾先の文節idを取得して、変数id及び変数linkに設定する。ここでは、id=’0’、link=’3’となり、第0文節「太郎が」が処理対象となる。   In step S70, similar to step S27 of the commutative particle list creation process, the phrase id and the qualifying phrase id described in the phrase information line read in step S63 are acquired and set in the variable id and variable link. To do. Here, id = '0', link = '3', and the 0th phrase "Taroga" is the processing target.

ステップS63に戻り、次の行「太郎 名詞,...」を読み込み、ステップS64で否定判定されてステップS71へ移行する。ステップS71では、上記ステップS63で読み込んだ行の形態素の品詞を参照し、その形態素の品詞が’Y’に設定された品詞か否かを判定する。肯定判定の場合には、ステップS72へ移行し、否定判定の場合には、ステップS63に戻る。ここでは、形態素「太郎」は名詞であり、’Y’に設定された’動詞’ではないため、ステップS63に戻る。次の行「が 助詞,...」についても、同様に、ステップS64、S71を経て、ステップS63に戻る。   Returning to step S63, the next line "Taro noun, ..." is read, a negative determination is made in step S64, and the flow proceeds to step S71. In step S71, the part of speech of the morpheme read in step S63 is referred to and it is determined whether or not the part of speech of the morpheme is set to 'Y'. If the determination is affirmative, the process proceeds to step S72. If the determination is negative, the process returns to step S63. Here, since the morpheme “Taro” is a noun and not a “verb” set to “Y”, the process returns to step S63. Similarly, for the next line “ga particle,...”, The process returns to step S 63 via steps S 64 and S 71.

ステップS63で、次の行「* 1 3D」が読み込まれ、ステップS64で肯定判定されて、S65へ移行する。変数idは’0’、’Y’[id]は未登録であるので、否定判定されて、ステップS66へ移行する。ステップS66では、制限部12が、’Y’[id]に’False’を登録する。ここでは、’動詞’[’0’]=Trueとなる。そして、ステップS67及びS69を経て、ステップS70で、第1文節が処理対象に設定される。以下同様にして、第1文節、第2文節には動詞がないと判定される。   In step S63, the next line “* 1 3D” is read, an affirmative determination is made in step S64, and the process proceeds to S65. Since the variable id is “0” and “Y” [id] is not registered, a negative determination is made and the process proceeds to step S66. In step S66, the restriction unit 12 registers “False” in “Y” [id]. Here, 'verb' ['0'] = True. Then, after steps S67 and S69, the first phrase is set as a processing target in step S70. In the same manner, it is determined that there are no verbs in the first and second clauses.

次に、ステップS63に戻り、次の行「食べ 動詞,...」が読み込まれる。次に、ステップS64を経てステップS71へ移行すると、上記ステップS63で読み込んだ行の形態素の品詞が’動詞’であるため、肯定判定されてステップS72へ移行する。ステップS72では、制限部12が、’Y’[id]に’True’を登録する。ここでは、’動詞’[’3’]=Trueとなる。次の行「た 助動詞,...」は、動詞ではないため、ステップS64、S71を経て、ステップS63に戻る。   Next, returning to step S63, the next line "eat verb, ..." is read. Next, when the process proceeds to step S71 through step S64, since the part of speech of the morpheme read in step S63 is “verb”, an affirmative determination is made and the process proceeds to step S72. In step S <b> 72, the restricting unit 12 registers “True” in “Y” [id]. Here, 'verb' ['3'] = True. Since the next line “ta auxiliary verb,...” Is not a verb, the process returns to step S63 via steps S64 and S71.

ステップS63で、次の行「* 4 6D」が読み込まれ、ステップS64で肯定判定されて、ステップS65へ移行する。変数idは’3’、’Y’[id]には’True’が登録されているので、ステップS65で肯定判定、ステップS67で否定判定されて、ステップS68へ移行する。ステップS68では、制限部12が、’Y’[link]に’True’を登録する。ここでは、’動詞’[’4’]=Trueとなる。これは第3文節「食べた」に動詞があるので、第3文節に修飾されている第4文節「あとに」を根とする部分木「食べたあとに」にも動詞が含まれていることを表す。   In step S63, the next line “* 4 6D” is read, an affirmative determination is made in step S64, and the process proceeds to step S65. Since the variable id is '3' and 'True' is registered in 'Y' [id], an affirmative determination is made in step S65, a negative determination is made in step S67, and the process proceeds to step S68. In step S <b> 68, the restricting unit 12 registers “True” in “Y” [link]. Here, 'verb' ['4'] = True. This is because there is a verb in the third phrase “eated”, so the subtree “after eaten” that has the fourth phrase “after” modified in the third phrase also contains a verb. Represents that.

次に、ステップS69を経てステップS70で、第4文節が処理対象に設定される。第4文節の「あと」及び「に」は動詞ではないので、’動詞’[’4’]は変化しない。ステップS63に戻り、次の行「* 5 6D」が読み込まれると、ステップS64、S65、及びS67を経て、ステップS68で、制限部12が、’Y’[link]に’True’を登録する。ここでは、’動詞’[’6’]=Trueとなる。これにより、第4文節「あとに」に修飾されている第6文節「見た。」を根とする部分木にも、「見た。」について直接動詞が含まれるか否かを判定する前に、動詞が含まれていると判定される。すなわち、図6に示す係り受け木において、第3文節「食べた」に対応するノードから根ノードである「見た。」までのパス上にある文節全てが「その文節を根とする部分木に用言(ここでは動詞)を含む」と判定される。   Next, after step S69, the fourth phrase is set as a processing target in step S70. Since “after” and “ni” in the fourth phrase are not verbs, 'verb' ['4'] does not change. Returning to step S63, when the next line “* 5 6D” is read, through steps S64, S65, and S67, the limiting unit 12 registers “True” in “Y” [link] in step S68. . Here, 'verb' ['6'] = True. As a result, the subtree rooted at the sixth phrase “I saw” that is modified by the fourth phrase “after” also before determining whether or not a verb is directly included in “I saw.” Are determined to contain verbs. That is, in the dependency tree shown in FIG. 6, all the clauses on the path from the node corresponding to the third clause “eat” to the root node “saw” are “subtrees rooted in that clause”. Includes a predicate (in this case a verb).

S63で読み込んだ行が最終行(「EOS」)の場合には、ステップS73へ移行して、制限部12が、’Y’[id]を出力する。上記の処理により、動詞を含む文節、及び動詞を含む文節によって修飾されている文節については、’動詞’[id]=True、そうでない文節については、’動詞’[id]=Falseが出力される。ここでは、id=’3’,’4’,’6’について、’動詞’[id]=True、id=’0’,’1’,’2’,’5’について、’動詞’[id]=Falseが出力される。   When the line read in S63 is the last line ("EOS"), the process proceeds to step S73, and the restriction unit 12 outputs 'Y' [id]. As a result of the above processing, “verb” [id] = True is output for a clause including a verb and a clause modified by a clause including a verb, and “verb” [id] = False is output for a clause that is not. The Here, for id = '3', '4', '6', 'verb' [id] = True, for id = '0', '1', '2', '5', 'verb' [ id] = False is output.

次に、ステップS74で、制限部12が、処理対象Yに設定されている品詞が’形容詞’か否かを判定する。現在の設定は’動詞’であるため、否定判定されて、ステップS75へ移行し、制限部12が、処理対象Yに’形容詞’を設定し、ステップS62に戻る。以下、’動詞’の場合と同様に処理し、形容詞を含む文節、及び形容詞を含む文節によって修飾されている文節か、そうでない文節かを判定し、’形容詞’[id]を出力する。ここでは、図5に示すように、参照訳文には形容詞が含まれていないため、全てのidについて、’形容詞’[id]=Falseが出力される。   Next, in step S74, the restriction unit 12 determines whether or not the part of speech set as the processing target Y is an 'adjective'. Since the current setting is “verb”, a negative determination is made, the process proceeds to step S75, and the restriction unit 12 sets “adjective” as the processing target Y, and the process returns to step S62. Thereafter, the processing is performed in the same manner as in the case of the 'verb', and it is determined whether the phrase includes an adjective and whether the phrase is modified by a phrase including an adjective or not, and outputs an 'adjective' [id]. Here, as shown in FIG. 5, since the reference translation does not include an adjective, 'adjective' [id] = False is output for all ids.

次に、ステップS77で、制限部12は、入替部11から出力された全ての順列を受け取り、各順列について、「別用言前助詞制限」を満たす可換助詞部分木の入れ替えに相当する順列か否かを判定する。「別用言前助詞制限」を満たさない可換助詞部分木の入れ替えに相当する順列については、可換助詞リストから除外する。   Next, in step S77, the restriction unit 12 receives all the permutations output from the permutation unit 11, and for each permutation, a permutation corresponding to the replacement of a commutative particle subtree that satisfies the “other prescriptive particle restriction”. It is determined whether or not. A permutation corresponding to replacement of a subjunction sub-subtree that does not satisfy the “ancillary pre-participant particle restriction” is excluded from the commutative particle list.

例えば、図5の例で、係り受け木の根から幅優先で動詞を探索し、第6文節「見た」に着目すると、可換助詞リストA[’6’]=[[’4’,’5’],[’5’,’4’]]の順列が出力されている。順列[’4’,’5’]は元の参照訳文どおりの順列である。順列[’5’,’4’]は、第4文節を根とする可換助詞部分木「太郎が回転寿司でお寿司を食べたあとに」と第5文節を根とする可換助詞部分木「歌舞伎を」を入れ替えることを意味する。   For example, in the example of FIG. 5, when searching for a verb with breadth priority from the root of the dependency tree and paying attention to the sixth phrase “saw”, the commutative particle list A ['6'] = [['4', '5' ], ['5', '4']] are output. The permutation ['4', '5'] is a permutation as in the original reference translation. The permutation ['5', '4'] is a commutative particle part rooted at the 4th phrase, “After Taro eats sushi with carousel,” and the 5th phrase at the root part. This means replacing the tree “Kabuki”.

ここで、’動詞’[’4’]=Trueであるので、第4文節を根とする可換助詞部分木には、動詞が含まれている。従って、第4文節を根とする可換助詞部分木の前に、第5文節を根とする可換助詞部分木を置くと、第5文節に含まれる可換助詞は「別用言前助詞」となる。「別用言前助詞制限」では、別用言が動詞である場合の別用言前助詞は、可換助詞「は」しか許されないが、第5文節に含まれる可換助詞は「を」であり、別用言前助詞制限を満たさない。従って、順列[’5’,’4’]は、この順列に従って可換助詞部分木を入れ替えた係り受け木に基づいて、実際に「歌舞伎を太郎が回転寿司でお寿司を食べたあとに見た。」という文を生成する前に、可換助詞リストA[’6’]から除外される。   Here, 'verb' ['4'] = True, and therefore, the commutative particle subtree rooted at the fourth clause includes a verb. Therefore, if a commutative particle subtree rooted at the fifth clause is placed in front of a commutative particle subtree rooted at the fourth clause, then the commutative particle included in the fifth clause will be “another preface particle”. " In the “adjunct pre-participant restriction”, the pre-additive pre-subject in the case where the pre-subject is a verb is allowed only the commutative particle “ha”, but the commutative particle included in the fifth clause is “a”. And does not meet the pre-participant particle limit. Therefore, the permutation ['5', '4'] is based on the dependency tree in which the commutative particle subtrees are replaced according to this permutation. It is excluded from the commutative particle list A ['6'] before generating the sentence "I saw."

また、可換助詞リストには、可換助詞リスト作成処理(図7)のステップS25の処理で、可換助詞文節ではない文節の情報として、例えば’X3’のような情報が含まれている場合がある。制限部12は、この情報に基づいて、同じ動詞を修飾する可換助詞文節の間に、可換助詞文節以外の文節がはさまれている場合は、可換助詞文節以外の文節をまたいだ入れ替えに相当する順列を判定し、その順列を可換助詞リストから除外する。   Further, the commutative particle list includes information such as 'X3' as information on a clause that is not a commutative particle clause in the process of step S25 of the commutative particle list creation processing (FIG. 7). There is a case. Based on this information, the restriction unit 12 straddles a clause other than a commutative particle clause when a clause other than a commutative particle clause is sandwiched between commutative particle clauses that modify the same verb. A permutation corresponding to the replacement is determined, and the permutation is excluded from the commutative particle list.

制限部12は、上記の順列の排除を行った可換助詞リストを出力し、別用言前助詞制限処理を終了して、図4に示す語順入替処理にリターンする。   The restricting unit 12 outputs the commutative particle list from which the permutation has been removed, ends the pre-junction particle restricting process, and returns to the word order replacing process shown in FIG.

図4に示す語順入替処理のステップS80で、生成部13が、上記ステップS60で制限部12から出力された可換助詞リストに含まれる順列の各々に従って可換助詞部分木が入れ替えられた係り受け木の各々に基づいて、語順入替参照文の各々を生成する。そして、生成部13は、元の参照訳文と、生成した語順入替参照訳文とを合わせて、参照訳文集合30とし、所定の記憶領域に記憶して、語順入替処理を終了する。   In step S80 of the word order permutation process shown in FIG. 4, the generation unit 13 is a dependency in which the commutative particle subtree is replaced according to each permutation included in the commutative particle list output from the restriction unit 12 in step S60. Based on each of the trees, each of the word order replacement reference sentences is generated. Then, the generation unit 13 combines the original reference translation sentence and the generated word order replacement reference translation sentence into a reference translation sentence set 30, stores it in a predetermined storage area, and ends the word order replacement process.

次に、評価対象訳文が翻訳品質評価装置20に入力されると、翻訳品質評価装置20において、図11に示す翻訳品質評価処理が実行される。   Next, when an evaluation target translation is input to the translation quality evaluation apparatus 20, the translation quality evaluation apparatus 20 executes a translation quality evaluation process shown in FIG.

図11に示す翻訳品質評価処理のステップS90で、算出部21が、入力された評価対象訳文を受け付ける。また、算出部21が、所定の記憶領域に記憶された参照訳文集合30を読み出す。次に、ステップS91で、算出部21が、評価対象訳文と、参照訳文集合30に含まれる複数の参照訳文の各々との類似度を算出する。   In step S90 of the translation quality evaluation process shown in FIG. 11, the calculation unit 21 receives the input evaluation target translation. Further, the calculation unit 21 reads the reference translation set 30 stored in a predetermined storage area. Next, in step S <b> 91, the calculation unit 21 calculates the similarity between the evaluation target translation and each of the plurality of reference translations included in the reference translation set 30.

次に、ステップS92で、評価部22が、算出部21により算出された、複数の参照訳文の各々に対する類似度に基づいて、評価対象訳文に対する評価結果を求めて出力し、翻訳品質評価処理を終了する。   Next, in step S92, the evaluation unit 22 obtains and outputs an evaluation result for the evaluation target translation based on the similarity to each of the plurality of reference translations calculated by the calculation unit 21, and performs a translation quality evaluation process. finish.

以上説明したように、本実施の形態に係る語順入替装置によれば、文節単位の係り受け木において、同一の動詞を修飾する可換助詞を含む文節を根とする可換助詞部分木を入れ替えることにより、参照訳文と意味が同じで語順が異なる複数の文を生成することができる。可換助詞部分木単位で入れ替えを行うことで、不自然な語順の文が生成されることを防止することができる。   As described above, according to the word order exchanging device according to the present embodiment, in the dependency unit of the phrase unit, the commutative particle subtree rooted at the phrase including the commutative particle that modifies the same verb is replaced. Thus, it is possible to generate a plurality of sentences having the same meaning and different word order as the reference translation sentence. It is possible to prevent the generation of an unnatural word order sentence by exchanging permutable particle subtree units.

また、可換助詞部分木が修飾する動詞とは異なる動詞の前に、その可換助詞部分木を入れ替える場合、または、形容詞の前に可換助詞部分木を入れ替える場合に制限を設けることにより、不自然な語順の文が生成されることをさらに防止することができる。   In addition, by replacing the commutative particle subtree before the verb different from the verb to be modified by the commutative particle subtree, or by replacing the commutative particle subtree before the adjective, It is possible to further prevent generation of an unnatural word order sentence.

また、本実施の形態に係る翻訳品質評価装置によれば、意味が同じで語順が異なる複数の参照訳文を用いることにより、語順の自由度が高い言語への翻訳の品質を適切に評価することができる。また、本実施の形態に係る語順入替装置により生成された参照訳文を用いることで、評価に用いる参照訳文を、人手による労力をかけることなく増やすことができる。多くの翻訳品質自動評価ツールは、複数の参照訳文を受け付けることができる構成となっているため、これらのツールを改変することなく、日本語のような語順の自由度が高い言語の翻訳品質の評価にも対応することができる。   Further, according to the translation quality evaluation apparatus according to the present embodiment, by using a plurality of reference translations having the same meaning but different word orders, the quality of translation into a language having a high degree of freedom in word order can be appropriately evaluated. Can do. In addition, by using the reference translation generated by the word order replacement device according to the present embodiment, it is possible to increase the reference translation used for evaluation without any manual labor. Many automatic translation quality evaluation tools are configured to accept multiple reference translations, so there is no need to modify these tools, and translation quality of languages with high degree of word order freedom, such as Japanese. It can also handle evaluation.

以下、具体例を参照して、本実施の形態の効果をより具体的に説明する。   Hereinafter, the effects of the present embodiment will be described more specifically with reference to specific examples.

図12に示すように、参照訳文「太郎がパリでフランス料理を食べた。」を示す係り受け木が入力された場合を考える。図12に示すように、「食べた」が親ノード、「太郎が」、「パリで」、及び「フランス料理を」の各々が子ノードである。「太郎がパリでフランス料理を食べた。」の係り受け木からpost−orderで文を生成すると、親ノード「食べた」が最後に出力される点は共通している。しかし、子ノード「太郎が」、「パリで」、及び「フランス料理を」をどの順で辿るかの任意性があるため、以下の3!=6通りの語順が存在することになる。この6通りは、いずれも日本語として通用するものであり、元の参照訳文と同じ意味である。   As shown in FIG. 12, consider a case where a dependency tree indicating a reference translation “Taro ate French cuisine in Paris” is input. As shown in FIG. 12, “I ate” is a parent node, “Taro is”, “In Paris”, and “French cuisine” are child nodes. When a sentence is generated by a post-order from a dependency tree of “Taro ate French cuisine in Paris”, the parent node “eated” is output last. However, since there is an arbitrary order in which the child nodes “Taro ga”, “In Paris”, and “French cuisine” are traced, the following 3! = 6 word orders exist. These six patterns are all valid as Japanese and have the same meaning as the original reference translation.

1.太郎が/パリで/フランス料理を/食べた。
2.太郎が/フランス料理を/パリで/食べた。
3.パリで/太郎が/フランス料理を/食べた。
4.パリで/フランス料理を/太郎が/食べた。
5.フランス料理を/太郎が/パリで/食べた。
6.フランス料理を/パリで/太郎が/食べた。
1. Taro / I ate / French cuisine in Paris.
2. Taro eats / French cuisine / in Paris.
3. In Paris / Taro / French cuisine /
4). In Paris / French cuisine / Taro / ate.
5. I ate French cuisine / Taro / Paris.
6). I ate French cuisine / in Paris / Taro /.

これらはいずれも、本実施の形態における「同一の動詞(食べた)を修飾する可換助詞部分木の入れ替え」で生成可能な文である。   Each of these is a sentence that can be generated by “replacement of substitutive subpartial trees that modify the same verb (eaten)” in the present embodiment.

次に、上記実施形態の具体例としても用いた、参照訳文「太郎が回転寿司でお寿司を食べたあとに歌舞伎を見た。」を示す係り受け木(図6)が入力された場合を考える。この参照訳文では、文末の動詞「見た」を修飾する可換助詞文節は、「あとに」及び「歌舞伎を」の2つ存在し、動詞「食べた」を修飾する可換助詞文節は「太郎が」、「回転寿司で」及び「お寿司を」の3つ存在する。従って、post−orderで生成される文は、以下に示すように、2!×3!=12通り存在する。   Next, when a dependency tree (FIG. 6) indicating that the reference translation “Taro saw Kabuki after eating sushi with conveyor belt sushi”, also used as a specific example of the above embodiment, is input. think of. In this reference translation, there are two commutative particle clauses that modify the verb “see” at the end of the sentence: “after” and “kabuki wo”, and the commutative particle clause that modifies the verb “eat” is There are three types: “Taro ga”, “In Kaiten Sushi” and “Sushi”. Therefore, the sentence generated by post-order is 2! × 3! = 12 types exist.

1.太郎が/回転寿司で/お寿司を/食べた/あとに/歌舞伎を/見た。
2.太郎が/お寿司を/回転寿司で/食べた/あとに/歌舞伎を/見た。
3.回転寿司で/太郎が/お寿司を/食べた/あとに/歌舞伎を/見た。
4.回転寿司で/お寿司を/太郎が/食べた/あとに/歌舞伎を/見た。
5.お寿司を/太郎が/回転寿司で/食べた/あとに/歌舞伎を/見た。
6.お寿司を/回転寿司で/太郎が/食べた/あとに/歌舞伎を/見た。
7.歌舞伎を/太郎が/回転寿司で/お寿司を/食べた/あとに/見た。
8.歌舞伎を/太郎が/お寿司を/回転寿司で/食べた/あとに/見た。
9.歌舞伎を/回転寿司で/太郎が/お寿司を/食べた/あとに/見た。
10.歌舞伎を/回転寿司で/お寿司を/太郎が/食べた/あとに/見た。
11.歌舞伎を/お寿司を/太郎が/回転寿司で/食べた/あとに/見た。
12.歌舞伎を/お寿司を/回転寿司で/太郎が/食べた/あとに/見た。
1. Taro / at a conveyor belt sushi / eating sushi / after / watching Kabuki.
2. Taro / Sushi / At Kaiten Sushi / Eat / Later / Kabuki / I saw it.
3. At Conveyor Belt Sushi / Taro / Eat Sushi / Later / Kabuki / Saw.
4). At Conveyor Belt Sushi / Sushi / Taro / Eat / Later / Kabuki / Saw.
5. I saw sushi / Taro / at a conveyor belt sushi / after / kabuki.
6). I saw sushi / at conveyor belt sushi / Taro / ate / later / Kabuki / saw.
7). I saw Kabuki / Taro / conveyor sushi / sushi / after / after.
8). I saw Kabuki / Taro / Sushi / Rotating Sushi / Eat / After /.
9. I saw Kabuki / at Kaiten Sushi / Taro / Sushi / Eat / After /.
10. I saw Kabuki / at Kaiten Sushi / Sushi / Taro / Eat / After /.
11. I saw Kabuki, sushi, Taro, sushi, ate, and later.
12 I saw Kabuki / Sushi / Rotating Sushi / Taro / Eat / After /.

単純な文節単位の語順の入れ替えにより文を生成した場合には、例えば「太郎が/歌舞伎を/食べた/あとに/回転寿司で/お寿司を/見た。」のように、意味が変わってしまう文や不自然な文が生成される場合がある。本実施の形態では、可換助詞部分木単位での入れ替えを行うことで、このような意味が変わってしまう文や不自然な文の生成を排除することができる。   When a sentence is generated by exchanging the order of words in simple phrase units, the meaning is, for example, “Taro / Kabuki / Eat / After / Rotating Sushi / Sushi / I saw”. A sentence that changes or an unnatural sentence may be generated. In the present embodiment, it is possible to eliminate the generation of a sentence whose meaning changes or an unnatural sentence by exchanging in units of substituting particle subtrees.

また、上記1〜12はいずれも、被修飾語が修飾語より後ろに来るHead Finalな語順であるが、7〜12は不自然な文となっている。これらは、動詞「見た」を修飾する可換助詞文節「歌舞伎を」が、別の動詞である「食べた」の前に来ていることが原因である。本実施の形態においては、このような可換助詞部分木の入れ替えは、「別用言前助詞制限」により排除される。   Moreover, although said 1-12 are all the head final word order in which a to-be-modified word comes after a modifier, 7-12 is an unnatural sentence. These are because the commutative particle clause “Kabuki” that modifies the verb “see” comes before another verb “eat”. In the present embodiment, such replacement of the commutative particle sub-tree is excluded by “another prescriptive particle restriction”.

本実施の形態において許される語順が一見たくさん存在するように見えるが、図5の例のように7文節の文について、単純な文節単位での語順の入れ替えは7!=5040通り存在する。末尾に位置することが決まっている文節「見た」を除外しても、残り6文節の語順は6!=720通りもある。本実施の形態では、上記1〜6の6通りの語順が残るのみであり、720通りに対して0.8%に過ぎず、許される語順には強い制約のあることがわかる。   Although it seems that there are a lot of word orders allowed in the present embodiment at first glance, as shown in the example of FIG. There are 5040 ways. Even if you exclude the phrase “I saw” that is determined to be located at the end, the word order of the remaining 6 phrases is 6! There are 720 ways. In the present embodiment, only the six word orders 1 to 6 described above remain, which is only 0.8% with respect to 720 patterns, and it is understood that there are strong restrictions on the allowed word order.

また、本実施の形態との比較のため、名詞に複数の修飾語があった場合に、その修飾語を入れ替えて語順入替文を生成する場合を考える。例えば、図13に示すように、「彼は襟が大きな白いシャツを買った。」を示す係り受け木が入力された場合、「シャツを」には「襟が大きな」と「白い」という2つの修飾語がある。この係り受け木からpost−orderで生成される文には、「彼は白い襟が大きなシャツを買った。」という文が存在する。この語順では「白い」が「襟が」を修飾していると解釈される恐れがあるが、本実施の形態のように、可換助詞部分木の入れ替えにより語順入替文を生成する場合には、このような文が生成されることを防止することができる。   In addition, for comparison with the present embodiment, consider a case where, when a noun has a plurality of modifiers, the modifiers are replaced to generate a word order replacement sentence. For example, as shown in FIG. 13, when a dependency tree indicating “he bought a white shirt with a large collar” is input, “the shirt is large” and “white” are 2 There are two modifiers. In the sentence generated by the post-order from this dependency tree, there is a sentence "He bought a big shirt with a white collar." In this word order, “white” may be interpreted as modifying the “collar”, but as in this embodiment, when generating a word order permutation sentence by exchanging a commutative particle subtree. , Such a sentence can be prevented from being generated.

また、文頭に接続詞がある文の語順入れ替えの際にも問題が生じる場合がある。例えば、図14に示すように、「また、彼はその本を買わなかった。」を示す係り受け木が入力された場合、「また」は追加を示す接続詞であるが、語順の入れ替えにより生成される文「彼はまたその本を買わかなった。」の場合の「また」は、「またしても」の意味の副詞である。本実施の形態では、同一の動詞を修飾する可換助詞を含む文節を根とする部分木を入れ替えの対象とするため、このような問題のある語順の文は生成されない。   There may also be a problem when the order of sentences having a conjunction at the beginning of a sentence is changed. For example, as shown in FIG. 14, when a dependency tree indicating “and he did not buy the book” is input, “or” is a conjunction indicating addition, but is generated by changing the word order. In the case of the sentence "He has not bought the book again," "also" is an adverb meaning "again." In this embodiment, since a subtree rooted in a phrase including a commutative particle that modifies the same verb is used as a replacement target, such a problematic word order sentence is not generated.

なお、本発明の語順入替装置は、上記実施の形態の例に限定されない。例えば、慣用句などの表現が複数の文節に区切られることがないように、慣用句を予め登録しておき、慣用句が区切られるような語順の入れ替えを制限するようにしてもよい。例えば、「全生徒が一体になる。」を「一体に全生徒がなる。」のように語順を入れ替えた文はやや不自然である。これは「になる」という慣用句を切ったためであると考えられる。そこで、「になる」、「となる」、「に陥る」などの慣用句を予め登録しておき、これらの表現が切られて入れ替えられる語順を排除する。   In addition, the word order switching device of the present invention is not limited to the example of the above embodiment. For example, idiomatic phrases may be registered in advance so that expressions such as idiomatic phrases are not divided into a plurality of clauses, and the order of words that can be used to delimit idiomatic phrases may be restricted. For example, a sentence in which the word order is changed such as “all students become one” and “all students become one” is somewhat unnatural. This is thought to be because the idiom “become” was cut. Therefore, common phrases such as “becomes”, “becomes”, and “falls in” are registered in advance to eliminate the word order in which these expressions are cut and replaced.

また、同じ文節を修飾する表現同士を比較すると、長い修飾句が前に、短い修飾句が後ろに来る語順が好まれる傾向がある(参考文献:山下裕子、近藤公久、「言語的制約とLong-before-short語順傾向」、電子情報通信学会、信学技報、TL2011−19、pp.61−65.)。そこで、可換助詞部分木を入れ替えるときに、両者の長さを比較し、短い方の可換助詞部分木が前に来ないように制限してもよい。   Also, when comparing expressions that modify the same clause, there is a tendency to prefer a word order in which a long modifier is preceded and a short modifier is followed (Reference: Yuko Yamashita, Kimihisa Kondo, “Language Constraints and Long -before-short word order tendency ", IEICE, IEICE Technical Report, TL2011-19, pp.61-65.). Therefore, when the commutative particle subtree is replaced, the lengths of the two may be compared to restrict the shorter commutative particle subtree from coming forward.

また、SMTでは、生成された文の自然さを、単言語モデルによって評価するのが一般的である。本実施の形態で生成された語順入替参照訳文についても、単言語モデルでその自然さを評価して、スコアが低すぎるものは、参照訳文集合30から削除するようにしてもよい。   In SMT, the naturalness of a generated sentence is generally evaluated by a monolingual model. Regarding the word order replacement reference translations generated in the present embodiment, the naturalness may be evaluated using a monolingual model, and those whose scores are too low may be deleted from the reference translation set 30.

また、上記実施の形態では、語順入替装置10と翻訳品質評価装置20とを別々のコンピュータで構成する場合について説明したが、語順入替装置10の機能を有する翻訳品質評価装置20として、一つのコンピュータで構成してもよい。   Moreover, although the said embodiment demonstrated the case where the word order replacement apparatus 10 and the translation quality evaluation apparatus 20 were comprised by a separate computer, as a translation quality evaluation apparatus 20 which has the function of the word order replacement apparatus 10, one computer is used. You may comprise.

上述の語順入替装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。   Although the above-described word order changing device has a computer system therein, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.

また、本願明細書中において、プログラムが予めインストールされている実施の形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   Further, in the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.

10 語順入替装置
11 入替部
12 制限部
13 生成部
20 翻訳品質評価装置
21 算出部
22 評価部
30 参照訳文集合
10 word order replacement device 11 replacement unit 12 restriction unit 13 generation unit 20 translation quality evaluation device 21 calculation unit 22 evaluation unit 30 reference translation set

Claims (6)

文の文節間の係り受け関係を示す係り受け木において、予め定めた助詞で終わる特定文節と、該特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する複数の部分木の各々を入れ替える入替部と、
前記入替部により前記部分木が入れ替えられた係り受け木に基づいて、前記文の語順を入れ替えた語順入替文を生成する生成部と、
前記入替部により、助詞「は」以外の前記予め定めた助詞を含む一方の部分木が修飾する動詞とは異なる動詞を含む他方の部分木の前に、前記一方の部分木を入れ替えた係り受け木、または、形容詞を含む一方の部分木の前に、助詞「を」以外の前記予め定めた助詞を含む他方の部分木を入れ替えた係り受け木に基づいて、前記生成部により前記語順入替文を生成しないように制限する制限部と、
を含む語順入替装置。
A dependency tree indicating a dependency relationship between clauses of a sentence, a subtree consisting of a specific clause ending with a predetermined particle and a clause that modifies the specific clause, and a plurality of portions that modify the same verb A replacement section for replacing each of the trees;
Based on the dependency tree in which the subtree is replaced by the replacement unit, a generation unit that generates a word order replacement sentence in which the word order of the sentence is replaced;
A dependency in which the one subtree is replaced by the replacement unit before the other subtree including a verb different from the verb modified by the one subtree including the predetermined particle other than the particle “ha”. Based on the dependency tree in which the other subtree including the predetermined particle other than the particle “O” is replaced before the one subtree including the tree or the adjective, the word order replacement sentence is generated by the generation unit. A restriction part that restricts not to generate,
Word order replacement device including
前記予め定めた助詞を、「は」、「が」、「を」、「に」、「で」、及び「と」とする請求項1記載の語順入替装置。   2. The word order switching device according to claim 1, wherein the predetermined particles are “ha”, “ga”, “ha”, “ni”, “de”, and “to”. 文の文節間の係り受け関係を示す係り受け木において、予め定めた助詞で終わる特定文節と、該特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する複数の部分木の各々を入れ替える入替部と、
前記入替部により前記部分木が入れ替えられた係り受け木に基づいて、前記文の語順を入れ替えた語順入替文を生成する生成部と、
前記入替部により、助詞「は」以外の前記予め定めた助詞を含む一方の部分木が修飾する動詞とは異なる動詞を含む他方の部分木の前に、前記一方の部分木を入れ替えた係り受け木、または、形容詞を含む一方の部分木の前に、助詞「を」以外の前記予め定めた助詞を含む他方の部分木を入れ替えた係り受け木に基づいて、前記生成部により前記語順入替文を生成しないように制限する制限部と、
原文を機械翻訳した訳文と、前記原文の理想的な訳文である参照訳文、及び前記参照訳文の意味を変えずに語順を入れ替えた語順入替参照訳文の各々との類似度を算出する算出部と、
前記算出部により算出された類似度に基づいて、前記訳文の翻訳品質を評価する評価部と、を含み、
前記語順入替参照訳文を、前記制限部による制限の下、前記生成部により生成された前記参照訳文についての語順入替文とする
翻訳品質評価装置。
A dependency tree indicating a dependency relationship between clauses of a sentence, a subtree consisting of a specific clause ending with a predetermined particle and a clause that modifies the specific clause, and a plurality of portions that modify the same verb A replacement section for replacing each of the trees;
Based on the dependency tree in which the subtree is replaced by the replacement unit, a generation unit that generates a word order replacement sentence in which the word order of the sentence is replaced;
A dependency in which the one subtree is replaced by the replacement unit before the other subtree including a verb different from the verb modified by the one subtree including the predetermined particle other than the particle “ha”. Based on the dependency tree in which the other subtree including the predetermined particle other than the particle “O” is replaced before the one subtree including the tree or the adjective, the word order replacement sentence is generated by the generation unit. A restriction part that restricts not to generate,
A calculation unit that calculates a similarity between a translation obtained by machine-translating an original sentence, a reference translated sentence that is an ideal translation of the original sentence, and a word-order-replaced reference translated sentence in which the word order is changed without changing the meaning of the reference translated sentence; ,
An evaluation unit that evaluates the translation quality of the translation based on the similarity calculated by the calculation unit,
The translation quality evaluation apparatus which makes the said word order replacement reference translation sentence the word order replacement sentence about the said reference translation sentence produced | generated by the said production | generation part under the restriction | limiting by the said restriction | limiting part .
入替部と、生成部と、制限部とを含む語順入替装置における語順入替方法であって、
前記入替部が、文の文節間の係り受け関係を示す係り受け木において、予め定めた助詞で終わる特定文節と、該特定文節を修飾する文節とからなる部分木であって、同一の動詞を修飾する複数の部分木の各々を入れ替えるステップと、
前記生成部が、前記入替部により前記部分木が入れ替えられた係り受け木に基づいて、前記文の語順を入れ替えた語順入替文を生成するステップと、
前記制限部が、前記入替部により、助詞「は」以外の前記予め定めた助詞を含む一方の部分木が修飾する動詞とは異なる動詞を含む他方の部分木の前に、前記一方の部分木を入れ替えた係り受け木、または、形容詞を含む一方の部分木の前に、助詞「を」以外の前記予め定めた助詞を含む他方の部分木を入れ替えた係り受け木に基づいて、前記生成部により前記語順入替文を生成しないように制限するステップと、
を含む語順入替方法。
A word order replacement method in a word order replacement device including a replacement unit, a generation unit, and a restriction unit,
The replacement unit is a subtree consisting of a specific clause ending with a predetermined particle and a clause that modifies the specific clause in a dependency tree indicating a dependency relationship between the clauses of the sentence, and the same verb Replacing each of the plurality of subtrees to be modified;
The generation unit generates a word order replacement sentence in which the word order of the sentence is replaced based on a dependency tree in which the subtree is replaced by the replacement unit;
The one subtree before the other subtree including the verb different from the verb modified by the one subtree including the predetermined particle other than the particle “ha” by the restricting unit. Based on the dependency tree in which the other subtree including the predetermined particle other than the particle “O” is replaced before the one of the dependency tree including the adjective or the subtree including the adjective Limiting the generation of the word order replacement sentence according to:
Word order replacement method including
コンピュータを、請求項1又は請求項2記載の語順入替装置を構成する各部として機能させるための語順入替プログラム。   A word order exchanging program for causing a computer to function as each unit constituting the word order exchanging apparatus according to claim 1. コンピュータを、請求項3記載の翻訳品質評価装置を構成する各部として機能させるための翻訳品質評価プログラム。   The translation quality evaluation program for functioning a computer as each part which comprises the translation quality evaluation apparatus of Claim 3.
JP2014043222A 2014-03-05 2014-03-05 Word order replacement apparatus, method and program, and translation quality evaluation apparatus and program Active JP6096138B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014043222A JP6096138B2 (en) 2014-03-05 2014-03-05 Word order replacement apparatus, method and program, and translation quality evaluation apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014043222A JP6096138B2 (en) 2014-03-05 2014-03-05 Word order replacement apparatus, method and program, and translation quality evaluation apparatus and program

Publications (2)

Publication Number Publication Date
JP2015170043A JP2015170043A (en) 2015-09-28
JP6096138B2 true JP6096138B2 (en) 2017-03-15

Family

ID=54202752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014043222A Active JP6096138B2 (en) 2014-03-05 2014-03-05 Word order replacement apparatus, method and program, and translation quality evaluation apparatus and program

Country Status (1)

Country Link
JP (1) JP6096138B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102577584B1 (en) 2016-08-16 2023-09-12 삼성전자주식회사 Method and apparatus for performing machine translation
CN111626065A (en) * 2019-02-26 2020-09-04 株式会社理光 Training method and device of neural machine translation model and storage medium
CN110309289B (en) * 2019-08-23 2019-12-06 深圳市优必选科技股份有限公司 Sentence generation method, sentence generation device and intelligent equipment
CN111027331B (en) 2019-12-05 2022-04-05 百度在线网络技术(北京)有限公司 Method and apparatus for evaluating translation quality

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000242636A (en) * 1999-02-22 2000-09-08 Nippon Telegr & Teleph Corp <Ntt> Method and device for embedding data, storage medium stored with data embedded program, method and device for decoding embedded data, storage medium stored with embedded data decoding program, method and device for embedding and decoding data and storage medium stored with data embedding and decoding program
JP4347226B2 (en) * 2004-05-20 2009-10-21 富士通株式会社 Information extraction program, recording medium thereof, information extraction apparatus, and information extraction rule creation method

Also Published As

Publication number Publication date
JP2015170043A (en) 2015-09-28

Similar Documents

Publication Publication Date Title
CN102799578B (en) Translation rule extraction method and translation method based on dependency grammar tree
Mi et al. Forest-based translation rule extraction
JP5452868B2 (en) Training for text-to-text applications that use string-to-tree conversion for training and decoding
EP1349079A1 (en) Machine translation
JP2003308320A (en) System for realizing sentence
EP1446732A2 (en) Machine translation
CN104239290B (en) Statistical machine translation method and system based on dependency tree
JP6096138B2 (en) Word order replacement apparatus, method and program, and translation quality evaluation apparatus and program
KR20160138077A (en) Machine translation system and method
JP2006134311A (en) Extraction of treelet translation pair
CN103020045B (en) Statistical machine translation method based on predicate argument structure (PAS)
JP2004513458A (en) User-changeable translation weights
CN106156013A (en) The two-part machine translation method that a kind of regular collocation type phrase is preferential
CN106502987B (en) A kind of method and apparatus that the sentence template based on seed sentence is recalled
JP2016164707A (en) Automatic translation device and translation model learning device
Liu et al. Joint parsing and translation
Vandeghinste et al. METIS-II: machine translation for low resource languages
JP5734917B2 (en) Rearrangement model learning apparatus, method, and program, and translation apparatus, method, and program
Bertin-Lemée et al. Example-Based Machine Translation from Text to a Hierarchical Representation of Sign Language
Venkatapathy et al. A discriminative approach for dependency based statistical machine translation
Rana et al. Example based machine translation using fuzzy logic from English to Hindi
CN110287496A (en) A kind of English to Chinese Word sense disambiguation method neural network based
Ng et al. Reranking a wide-coverage CCG parser
Tiedemann Optimization of word alignment clues
KR100286649B1 (en) Method for converting vocabulary based on collocational pattern

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160920

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170215

R150 Certificate of patent or registration of utility model

Ref document number: 6096138

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150