JP5548176B2 - Translation optimization apparatus, method, and program - Google Patents
Translation optimization apparatus, method, and program Download PDFInfo
- Publication number
- JP5548176B2 JP5548176B2 JP2011203479A JP2011203479A JP5548176B2 JP 5548176 B2 JP5548176 B2 JP 5548176B2 JP 2011203479 A JP2011203479 A JP 2011203479A JP 2011203479 A JP2011203479 A JP 2011203479A JP 5548176 B2 JP5548176 B2 JP 5548176B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- pareto
- candidate
- weight
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本発明は、翻訳最適化装置、方法、及びプログラムに係り、特に、翻訳処理で用いる複数の翻訳特徴モデルに対する重みを最適化する翻訳最適化装置、方法、及びプログラムに関する。 The present invention relates to a translation optimization device, method, and program, and more particularly, to a translation optimization device, method, and program that optimize weights for a plurality of translation feature models used in translation processing.
通常、統計翻訳システムは、複数の知識ベースを活用する。例えば、日本語から英語への翻訳の場合、翻訳モデル(入力となる日本語単語に対して最も可能性の高い英語訳を表す知識ベース)、言語モデル(出力となる英語表現の自然さを表す知識ベース)、及び並び換えモデル(入出力言語間の文法構造変換の尤もらしさ表す知識ベース)などの様々なモデルを統合した上で、入力文(日本語)に対して最も尤もらしい翻訳文(英語)を生成する。 A statistical translation system typically uses multiple knowledge bases. For example, in the case of translation from Japanese to English, a translation model (a knowledge base representing the most likely English translation for the input Japanese word) and a language model (representing the naturalness of the output English expression) The most likely translation for the input sentence (Japanese) after integrating various models such as knowledge base) and rearrangement model (knowledge base representing the likelihood of grammatical structure conversion between input and output languages) English).
翻訳文の尤もらしさはモデル特徴量の重みつき組み合わせで表現される。ここで、最も重要なステップの一つは、この重みの最適化(Weight Optimization)である。従来手法では、重みの最適化の際、ただ1つの翻訳品質評価尺度(evaluation metric)を目的関数として用いている。 The likelihood of the translation is expressed by a weighted combination of model features. Here, one of the most important steps is the optimization of the weight (Weight Optimization). The conventional method uses only one translation quality evaluation metric as an objective function when optimizing the weights.
重みの最適化の流れは以下の通りである。まず開発データとして、例えば日本語の文章(入力)と正しい英語訳(出力)を用意する。(1)機械翻訳システムは、入力文を翻訳して、出力結果と正しい訳文を比較する。(2)モデルの重みを調節する。この(1)〜(2)を何回も行い、最終的に、出力と正しい訳文が十分に一致したときの重みを求める。このような統計翻訳の最適化には、次の二つの代表的な手法が使われてきた。 The flow of weight optimization is as follows. First, for example, Japanese text (input) and correct English translation (output) are prepared as development data. (1) The machine translation system translates the input sentence and compares the output result with the correct translation. (2) Adjust the model weight. This (1) to (2) is repeated many times, and finally a weight is obtained when the output and the correct translation sufficiently match. The following two representative methods have been used for such optimization of statistical translation.
一つの手法はMERT(Minimum Error Rate Training)であり(非特許文献1)、もう一つの手法はMIRA(Margin Infused Relaxed Algorithm)である(非特許文献2)。どちらの方法も、繰り返し翻訳して、翻訳品質評価尺度の観点で最もよい翻訳を生成するように重みを調整する。 One technique is MERT (Minimum Error Rate Training) (Non-Patent Document 1), and another technique is MIRA (Margin Infused Relaxed Algorithm) (Non-Patent Document 2). Both methods translate repeatedly and adjust the weights to produce the best translation in terms of a translation quality rating scale.
このように重みの最適化のために、評価尺度は重要な役割を果たす。いい評価尺度は、正しい翻訳に高いスコアを与え、悪い翻訳に低いスコア与える。現在一番広く使われている評価尺度がBLEUという尺度である(非特許文献3)。BLEUは、出力と正しい訳文との間における連続する部分単語列の一致度に基づいて計算される(よい翻訳のときBLEU値は高くなる)。もう一つの代表的な評価尺度はTER(Translation Edit Rate)である(非特許文献4)。TERは、翻訳文を正しい訳文に書き換えるときに何ステップの作業が必要かに基づいてと計算される(よい翻訳のときにTER値は低くなる)。
これまで数多くの評価尺度が提案されてきたが、人間の評価と一致する評価尺度は知られていない。実際は、評価尺度はそれぞれ違う観点で翻訳品質を評価しており、その意味で全ての評価尺度は一面の合理性を有している。そのため、機械翻訳の開発者は、複数の評価尺度を使ってシステムの性能を測っているのが実状である。
Thus, the evaluation scale plays an important role for optimizing the weight. A good rating scale gives high scores for correct translations and low scores for bad translations. The most widely used evaluation scale at present is a scale called BLEU (Non-patent Document 3). BLEU is calculated based on the degree of coincidence between successive partial word strings between the output and the correct translation (the BLEU value is high for good translation). Another representative evaluation scale is TER (Translation Edit Rate) (Non-patent Document 4). The TER is calculated based on how many steps are required when rewriting a translated sentence into a correct translation (the TER value is low when the translation is good).
Many evaluation scales have been proposed so far, but no evaluation scale that matches human evaluation is known. Actually, each evaluation scale evaluates translation quality from different viewpoints. In this sense, all evaluation scales have a certain level of rationality. Therefore, the reality is that machine translation developers measure system performance using multiple evaluation measures.
しかしながら、上記非特許文献1、2に記載されたMERTやMIRAを用いた最適化手法では一つだけの評価尺度しか利用できなかった。そのため、ある観点でよい翻訳を生成できるように最適化されるが、他の観点では適切な翻訳となることが保障されない、という問題がある。これは、開発者が、評価尺度として例えばBLEUかTERのどちらかしか使えないことに相当する。BLEUで最適化すればTERが最適ではないかもしれない。同じように、TERで最適化すればBLEUが悪くなるかもしれない。一つ評価尺度がよい一方で他の評価尺度が悪いという不均衡があると、人間が評価したときに決してよい翻訳にならない。
However, the optimization method using MERT and MIRA described in
本発明は、上記の事情を鑑みてなされたもので、複数の評価尺度を同時に用いて、複数の翻訳特徴モデルに対する重みの最適化を行うことができる翻訳最適化装置、方法、及びプログラムを提供することを目的とする。 The present invention has been made in view of the above circumstances, and provides a translation optimization device, method, and program capable of optimizing weights for a plurality of translation feature models by simultaneously using a plurality of evaluation scales. The purpose is to do.
上記の目的を達成するために本発明に係る翻訳最適化装置は、複数種類の翻訳特徴モデル及び前記複数種類の翻訳特徴モデルの各々に対する重みに基づいて、翻訳元言語の単語列を、翻訳先言語の単語列の複数の候補hに翻訳する翻訳処理手段と、前記翻訳処理手段によって翻訳された前記翻訳先言語の単語列の複数の候補hの各々について、複数種類の翻訳評価尺度を示す複数のスコアM 1 (h)、M 2 (h)を算出する翻訳評価手段と、前記複数の候補hの各々について算出された前記複数のスコアM 1 (h)、M 2 (h)に基づいて、以下の式を用いて、変数αを0から無限大まで徐々に増加させながら、変数αの各値において、前記複数の候補の集合Lから、パレート最適性を満たす候補h * を抽出すると共に、前記抽出された候補h * より前記スコアM 2 (h)が小さくなる候補を、前記パレート最適性を満たさない候補として識別するパレート識別手段と、前記パレート識別手段による識別結果に応じて、前記複数種類の翻訳特徴モデルの各々に対する重みを更新する重み更新手段と、前記翻訳処理手段による翻訳、前記翻訳評価手段による算出、前記パレート識別手段による識別、及び前記重み更新手段による更新を繰り返すことで、前記複数種類の翻訳特徴モデルの各々に対する重みを最適化する最適化手段と、を含んで構成されている。
本発明に係る翻訳最適化方法は、翻訳処理手段、翻訳評価手段、パレート識別手段、重み更新手段、及び最適化手段を含む翻訳最適化装置における翻訳最適化方法であって、前記翻訳最適化装置は、前記翻訳処理手段によって、複数種類の翻訳特徴モデル及び前記複数種類の翻訳特徴モデルの各々に対する重みに基づいて、翻訳元言語の単語列を、翻訳先言語の単語列の複数の候補hに翻訳するステップと、前記翻訳評価手段によって、前記翻訳処理手段によって翻訳された前記翻訳先言語の単語列の複数の候補hの各々について、複数種類の翻訳評価尺度を示す複数のスコアM 1 (h)、M 2 (h)を算出するステップと、前記パレート識別手段によって、前記複数の候補hの各々について算出された前記複数のスコアM 1 (h)、M 2 (h)に基づいて、以下の式を用いて、変数αを0から無限大まで徐々に増加させながら、変数αの各値において、前記複数の候補の集合Lから、パレート最適性を満たす候補h * を抽出すると共に、前記抽出された候補h * より前記スコアM 2 (h)が小さくなる候補を、前記パレート最適性を満たさない候補として識別するステップと、前記重み更新手段によって、前記パレート識別手段による識別結果に応じて、前記複数種類の翻訳特徴モデルの各々に対する重みを更新するステップと、前記最適化手段によって、前記翻訳処理手段による翻訳、前記翻訳評価手段による算出、前記パレート識別手段による識別、及び前記重み更新手段による更新を繰り返すことで、前記複数種類の翻訳特徴モデルの各々に対する重みを最適化するステップと、を含んで実行することを特徴とする。
本発明によれば、翻訳処理手段によって、複数種類の翻訳特徴モデル及び前記複数種類の翻訳特徴モデルの各々に対する重みに基づいて、翻訳元言語の単語列を、翻訳先言語の単語列の複数の候補に翻訳する。前記翻訳評価手段によって、前記翻訳処理手段によって翻訳された前記翻訳先言語の単語列の複数の候補の各々について、複数種類の翻訳評価尺度を示す複数のスコアを算出する。 According to the present invention, the translation processing means converts the plurality of types of translation feature models and the plurality of types of translation feature models into weights of the source language word strings and the translation destination language word strings. Translate to candidate. The translation evaluation means calculates a plurality of scores indicating a plurality of types of translation evaluation scales for each of a plurality of candidates for the word string in the translation target language translated by the translation processing means.
そして、パレート識別手段によって、前記複数の候補の各々について算出された前記複数のスコアに基づいて、前記複数の候補の各々が、パレート最適性を満たすか否かを識別する。重み更新手段によって、前記パレート識別手段による識別結果に応じて、前記複数種類の翻訳特徴モデルの各々に対する重みを更新する。 Then, the Pareto identifying means identifies whether each of the plurality of candidates satisfies Pareto optimality based on the plurality of scores calculated for each of the plurality of candidates. The weight updating unit updates the weight for each of the plurality of types of translation feature models according to the identification result by the Pareto identification unit.
そして、最適化手段によって、前記翻訳処理手段による翻訳、前記翻訳評価手段による算出、前記パレート識別手段による識別、及び前記重み更新手段による更新を繰り返すことで、前記複数種類の翻訳特徴モデルの各々に対する重みを最適化する。 Then, the optimization unit repeats the translation by the translation processing unit, the calculation by the translation evaluation unit, the identification by the Pareto identification unit, and the update by the weight update unit. Optimize the weights.
このように、翻訳先言語の単語列の複数の候補の各々について複数種類の翻訳評価尺度を示す複数のスコアを算出して、パレート最適性を満たすか否かを識別し、識別結果に応じて、各翻訳特徴モデルに対する重みを更新することにより、複数の評価尺度を同時に用いて、複数の翻訳特徴モデルに対する重みの最適化を行うことができる。 In this way, by calculating a plurality of scores indicating a plurality of types of translation evaluation scales for each of a plurality of candidates for the word string in the translation target language, it is identified whether or not Pareto optimality is satisfied, and according to the identification result By updating the weights for each translation feature model, it is possible to optimize the weights for a plurality of translation feature models by simultaneously using a plurality of evaluation scales.
本発明に係るパレート識別手段は、前記複数の候補hの各々について算出された前記複数のスコアM1(h)、M2(h)に基づいて、以下の式を用いて、変数αを0から無限大まで徐々に増加させながら、変数αの各値において、前記複数の候補の集合Lから、パレート最適性を満たす候補h*を抽出すると共に、前記抽出された候補h*より前記スコアM2(h)が小さくなる候補を、前記パレート最適性を満たさない候補として識別するようにする。 The Pareto identification means according to the present invention sets the variable α to 0 using the following formula based on the plurality of scores M 1 (h) and M 2 (h) calculated for each of the plurality of candidates h. The candidate h * satisfying the Pareto optimality is extracted from the plurality of candidate sets L at each value of the variable α while gradually increasing from 1 to infinity, and the score M is extracted from the extracted candidate h *. the candidate 2 (h) is smaller, you to be identified as candidates that do not satisfy the Pareto optimality.
本発明に係る翻訳処理手段は、翻訳元言語の複数の単語列の各々を、翻訳先言語の単語列の複数の候補に翻訳し、前記重み更新手段は、前記パレート識別手段による識別結果に応じて、前記翻訳先言語の複数の単語列に対する各候補について、パレート最適性を満たすと識別された場合に、該候補に対する各スコアとして、該スコアの最大値を与えて、前記複数の単語列に対する各候補について、各スコアの合計値を累積した累計スコアを算出し、前記算出された累計スコアに基づいて、前記複数種類の翻訳特徴モデルの各々に対する重みを更新するようにすることができる。 The translation processing means according to the present invention translates each of the plurality of word strings of the translation source language into a plurality of candidates of the word strings of the translation destination language, and the weight update means responds to the identification result by the Pareto identification means. When each candidate for a plurality of word strings in the target language is identified as satisfying Pareto optimality, a maximum value of the score is given as each score for the candidate, For each candidate, a cumulative score obtained by accumulating the total value of the scores can be calculated, and the weight for each of the plurality of types of translation feature models can be updated based on the calculated cumulative score.
本発明に係る重み更新手段は、前記パレート識別手段による識別結果に応じて、前記翻訳先言語の単語列に対する各候補の少なくとも一つが、パレート最適性を満たさないと識別された場合に、前記複数種類の翻訳特徴モデルの各々に対する重みを更新するようにすることができる。 The weight updating unit according to the present invention is configured such that when at least one of the candidates for the word string in the translation destination language is identified as not satisfying the Pareto optimality according to the identification result by the Pareto identifying unit, The weight for each type of translation feature model can be updated.
本発明に係るプログラムは、コンピュータを、上記の翻訳最適化装置の各手段として機能させるためのプログラムである。 The program according to the present invention is a program for causing a computer to function as each unit of the translation optimization device.
以上説明したように、本発明の翻訳最適化装置、方法、及びプログラムによれば、翻訳先言語の単語列の複数の候補の各々について複数種類の翻訳評価尺度を示す複数のスコアを算出して、パレート最適性を満たすか否かを識別し、識別結果に応じて、各翻訳特徴モデルに対する重みを更新することにより、複数の評価尺度を同時に用いて、複数の翻訳特徴モデルに対する重みの最適化を行うことができる、という効果が得られる。 As described above, according to the translation optimization device, method, and program of the present invention, a plurality of scores indicating a plurality of types of translation evaluation scales are calculated for each of a plurality of candidates for a word string of a translation target language. , Identify whether or not Pareto optimality is satisfied, and update the weights for each translation feature model according to the identification result, thereby simultaneously optimizing the weights for multiple translation feature models using multiple evaluation measures The effect that it can be performed is acquired.
以下、図面を参照して本発明の実施の形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
<第1の実施の形態>
<システム構成>
本発明の第1の実施の形態に係る翻訳最適化装置100は、翻訳元言語の入力文と翻訳先言語の正しい出力文とからなる開発データが複数入力され、複数の特徴モデルに対する重みを最適化する。この翻訳最適化装置100は、CPUと、RAMと、後述する翻訳最適化処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。図1に示すように、翻訳最適化装置100は、入力部10と、演算部20とを備えている。
<First Embodiment>
<System configuration>
The
入力部10は、入力された開発データとして、翻訳元の日本語の入力文(単語列)と正しい英語訳である出力文(単語列)とからなるデータセットを複数受け付ける。
The
演算部20は、開発データ記憶部21、特徴量重み記憶部22、翻訳部23、翻訳評価部24、パレート識別部25、及び最適化部26を備えている。なお、最適化部26が、重み更新手段及び最適化手段の一例である。
The
開発データ記憶部21は、入力部10により受け付けた複数の開発データを記憶する。
The development
特徴量重み記憶部22は、翻訳部23による翻訳処理で参照される複数の翻訳特徴モデル(例えば、翻訳モデル、言語モデル、及び並び替えモデル)の各々に対する重みからなる重みベクトルW(=(w1、w2、w3))を記憶する。
The feature amount
翻訳部23は、各開発データについて、以下のように、当該開発データの入力文を翻訳し、翻訳文の出力候補リストを出力する。
For each development data, the
まず、翻訳部23は、開発データの入力文について、翻訳処理を行い、複数の翻訳候補を求める。なお、翻訳処理については、従来既知の手法を用いればよいため、詳細な説明を省略する。翻訳部23は、各翻訳候補について、複数の翻訳特徴モデルの各々に対する特徴量を算出し、各翻訳特徴モデルの特徴量からなる特徴ベクトルF(=(f1、f2、f3))を算出する。翻訳部23は、各翻訳候補について、特徴量重み記憶部22に記憶された各翻訳特徴モデルに対する重みからなる重みベクトルWを用いて、各翻訳特徴モデルの特徴量の重み付き加算値F・W(=w1・f1+w2・f2+w3・f3))を、翻訳特徴スコアとして算出する。翻訳部23は、各翻訳候補を、翻訳特徴スコアの降順に並べ、上位k個の翻訳候補を特定し、特定された上位k個の翻訳候補を、翻訳文の出力候補リストとして出力する。
First, the
翻訳評価部24は、翻訳部23により出力された翻訳文の出力候補リストの中の各翻訳候補について、開発データに含まれる正しい翻訳文と比較して、複数種類の評価尺度(例えば、BLEU及びTER)の各々に対する複数種類の評価尺度スコア(BLEU値、1−TER値)を算出する。
The translation evaluation unit 24 compares each translation candidate in the translation sentence output candidate list output by the
パレート識別部25は、翻訳評価部24によって算出された複数種類の評価尺度スコアに基づいて、翻訳文の出力候補リストの中の各翻訳候補について、パレート最適性を満たすか否かを識別し、パレート最適性を満たす翻訳候補からなる、出力候補リストのサブセットを出力する。
The
ここで、非特許文献(Marler and Arora, “Survey of multi-objective optimization methods for Engineering”, in Journal of Structural and Multidisciplinary Optimization, vol26., 2004)に記載されているパレートの概念を説明する。説明を簡単にするため、翻訳部23は、二つの翻訳候補(H1、H2)だけを出力するものとし、この中のどちらが有効な翻訳かを決める問題として説明する。
Here, the concept of Pareto described in non-patent literature (Marler and Arora, “Survey of multi-objective optimization methods for Engineering”, in Journal of Structural and Multidisciplinary Optimization, vol. 26, 2004) will be described. In order to simplify the explanation, the
翻訳評価部24によって、出力候補リストに含まれる各翻訳候補のスコアベクトル(各要素は、出力候補のBLEU値と(1−TER値)とからなる)を計算する。ここで、翻訳候補H1のスコアベクトルをM(H1)で表わし、翻訳候補H2のスコアベクトルをM(H2)で表す。スコアベクトルの各要素の値が高いほど、よい翻訳であると考えられる。もしM(H1)のすべての要素がM(H2)のすべての要素より大きければ、翻訳候補H1はすべての評価尺度で、翻訳候補H2より良い翻訳であるといえる。逆に、スコアベクトルM(H1)のすべての要素と比べてスコアベクトルM(H2)のすべての要素が大きい場合、翻訳候補H1より翻訳候補H2の方が良い翻訳といえる。しかし、ある要素はスコアベクトルM(H1)の方が高く、他の要素はM(H2)の方が高い時、翻訳候補H1とH2はどちらが良い翻訳かは一概にいえない。このような場合、翻訳候補H1とH2は同程度の品質の翻訳文と考えられる。このような直感を定式化したのがパレート最適性である。以下に、弱パレート最適性(Weak Pareto−optimality)、及びパレート最適性(Pareto−optimality)の定義について説明する。 The translation evaluation unit 24 calculates a score vector of each translation candidate included in the output candidate list (each element is composed of a BLEU value of the output candidate and (1-TER value)). Here, the score vector of translation candidate H1 is represented by M (H1), and the score vector of translation candidate H2 is represented by M (H2). The higher the value of each element of the score vector, the better the translation. If all the elements of M (H1) are larger than all the elements of M (H2), it can be said that the translation candidate H1 is a better translation than the translation candidate H2 on all evaluation scales. Conversely, if all the elements of the score vector M (H2) are larger than all the elements of the score vector M (H1), it can be said that the translation candidate H2 is a better translation than the translation candidate H1. However, when a certain element has a higher score vector M (H1) and other elements have a higher M (H2), it cannot be generally said which translation candidate H1 or H2 is a better translation. In such a case, the translation candidates H1 and H2 are considered to be translated sentences having the same quality. It is Pareto optimality that formulated such intuition. Below, the definition of weak pareto optimality (Weak Pareto-optimality) and pareto optimality (Pareto-optimality) is demonstrated.
(定義1)弱パレート最適性:翻訳文の出力候補リストLが与えられており、すべての要素でM(H’)>M(H)を満たすH’が存在しない場合かつその場合のみ、Hは弱パレート最適性を満たすという。 (Definition 1) Weak Pareto Optimality: A translation sentence output candidate list L is given, and there is no H ′ that satisfies M (H ′)> M (H) in all elements, and only in that case, H Is said to satisfy weak Pareto optimality.
(定義2)パレート最適性:翻訳文の出力候補リストLが与えられており、すべての要素でM(H’)≧M(H)であり、かつ、ある要素iでMi(H’)>Mi(H)を満たすH’が存在しない場合、かつその場合のみ、Hはパレート最適性を満たすという。 (Definition 2) Pareto Optimality: A translation output candidate list L is given, M (H ′) ≧ M (H) for all elements, and M i (H ′) for a certain element i It is said that H satisfies Pareto optimality when and only when H ′ that satisfies> M i (H) does not exist.
上記の定義に関して、10個の翻訳候補と2つの評価尺度(metric1、2)を例として、図2にて簡単に説明する。上記図2で、「○」で示した翻訳候補はパレート最適性(および弱パレート最適性)を満たしている。一方で「△」で示した候補は、パレート最適性を満たさないが弱パレート最適性を満たしている。「+」を示される弱パレート最適性を満たさない翻訳候補は非パレートポイント(Non−pareto point)という。例えば、ポイント(0.4、0.7)はパレート最適性を満たした翻訳候補を示す。なぜなら、(metric1>=0.4,かつ、metric2>=0.7)となる他の翻訳候補が存在しないからである。一方で、ポイント(0.6,0.4)は他のポイント(0.7、0.6)と比べたとき、metric1 0.7>0.6、metric2 0.6>0.4となるため、非パレートポイントとなる。
The above definition will be briefly described with reference to FIG. 2 using ten translation candidates and two evaluation scales (
つまり、ある翻訳候補に対して、他の翻訳候補がすべての評価尺度で勝つ場合が無ければ、弱パレート最適性を満たす。ある翻訳候補に対して、全ての評価尺度で同等以上の評価値を持ち、かつ、少なくとも一つ以上の評価尺度でより大きい(勝る)評価値を持つ他の翻訳候補が存在する場合は、当該ある翻訳候補は、パレート最適性を満たさない。逆に、そのような他の翻訳候補が全く存在しない場合は、当該ある翻訳候補はパレート最適性を満たす。 That is, the weak Pareto optimality is satisfied if there is no case where other translation candidates win on all evaluation scales with respect to a certain translation candidate. For a translation candidate, if there is another translation candidate that has an evaluation value that is equal to or greater than that of all evaluation scales and that has a higher (greater) evaluation value in at least one evaluation scale, Some translation candidates do not satisfy Pareto optimality. Conversely, when there is no such other translation candidate, the certain translation candidate satisfies the Pareto optimality.
また、翻訳文の出力候補リストLが与えられたとき、パレート最適性を満たす全ての翻訳候補の集合をパレートフロンティア(Pareto Frontier)という。 When a translation sentence output candidate list L is given, a set of all translation candidates satisfying the Pareto optimality is referred to as a Pareto Frontier.
パレート識別部25の目的は、パレートフロンティアを効率的に見つけることである。従来より、いくつかのアルゴリズムが提案されているが、本実施の形態では、一例として、Convex Hull Algorithm(凸包アルゴリズム)を拡張したアルゴリズムを用いる。この拡張により、パレートフロンティアの近似解を高速に求めることができる。本実施の形態で用いるアルゴリズムは、評価尺度が2つである場合に用いることができる。
The purpose of the
本実施の形態で用いるアルゴリズムでは、以下の(1)式に従って、2つの評価尺度のあらゆる線形和の各々について、最大となるポイント(翻訳候補)h*を求める。 In the algorithm used in the present embodiment, the maximum point (translation candidate) h * is obtained for each of the linear sums of the two evaluation measures according to the following equation (1).
ここで、αの値をゼロから無限へ変化させて、αの各値で求めたすべての翻訳候補h*は、弱パレート最適性を満たしていることが証明できる。 Here, by changing the value of α from zero to infinity, it can be proved that all translation candidates h * obtained for each value of α satisfy the weak Pareto optimality.
上記(1)式は、αに関して区分的定数(piecewise−constant)であるため、パレート識別部25は、すべての0≦α<∞に関する値を検索するのに高速なアリゴリズムが利用できる。擬似-コードは図3で示される。
Since the equation (1) is a piecewise constant with respect to α, the
パレート識別部25は、図3に示すように、複数の翻訳候補hの各々について算出された評価尺度スコアM1(h)、M2(h)に基づいて、上記(1)式を用いて、変数α=0を初期値として、翻訳文の出力候補リストLから、パレート最適性を満たす翻訳候補h*を抽出する。そして、抽出された翻訳候補h*より評価尺度スコアM2(h)が小さくなる翻訳候補を、非パレートポイントとして識別する。
As shown in FIG. 3, the
そして、残りの翻訳候補hの各々について、以下の(2)式を用いて、α(h)を算出し、α(h)の最小値を、次の変数αとして、上記の処理を繰り返す。変数αが無限大になるまで上記の処理を繰り返し、処理が終了した時点で、パレート最適性を満たす翻訳候補h*として抽出された翻訳候補の集合を、パレートフロンティアとする。 For each remaining translation candidate h, α (h) is calculated using the following equation (2), and the above processing is repeated with the minimum value of α (h) as the next variable α. The above processing is repeated until the variable α becomes infinite. When the processing is completed, a set of translation candidates extracted as translation candidates h * satisfying Pareto optimality is defined as a Pareto frontier.
最適化部26は、以下に説明するように、翻訳評価部24により算出された評価尺度スコア及びパレート識別部25による識別結果に基づいて、複数の翻訳特徴モデルに対する重みを最適化する。
As will be described below, the
パレート最適性を満たす翻訳候補は、複数の評価尺度スコアを考慮して得られる翻訳であるため、良い翻訳であると考えられる。そこで、最適化部26は、翻訳候補リストの中にあるパレート最適性を満たす翻訳候補に、高い翻訳尺度スコアがつくように、各翻訳特徴モデルの重みを調整する。本実施の形態では、最適化部26において、MERTを拡張した多目的最適化手法を用いる。MERTはPOWELL法などの勾配なしアルゴリズム(Gradient−Free method)を使用して重みを更新する最適化手法である。
A translation candidate that satisfies the Pareto optimality is a translation obtained in consideration of a plurality of evaluation scale scores, and is therefore considered to be a good translation. Therefore, the
本実施の形態で用いる多目的最適化手法は以下の手順で動作する。 The multi-objective optimization method used in the present embodiment operates according to the following procedure.
まず、ランダムに決定された重みベクトルWを用いて、各開発データについて、翻訳候補リストを各々求める。そして、複数の開発データの各々について翻訳評価部24により算出された評価尺度スコア及びパレート識別部25による識別結果に基づいて、以下のように、累計スコアを算出する。
First, a translation candidate list is obtained for each development data using a randomly determined weight vector W. Then, based on the evaluation scale score calculated by the translation evaluation unit 24 and the identification result by the
パレート最適性を満たさない翻訳候補に対しては、M1(H)+M2(H)の合計スコアを与え、一方、パレートフロンティアに含まれる翻訳候補(パレート最適性を満たす翻訳候補)に対しては、M1_MAX+M2_MAXの合計スコアを与える。ここで、M1_MAXは翻訳候補リスト中で、一方の評価尺度の最大スコアであり、M2_MAXは、翻訳候補リスト中で他方の評価尺度の最大スコアを表す。 For translation candidates that do not satisfy Pareto optimality, a total score of M 1 (H) + M 2 (H) is given, while for translation candidates included in Pareto frontier (translation candidates that satisfy Pareto optimality) Gives the total score of M 1 _MAX + M 2 _MAX. Here, M 1 _MAX is the maximum score of one evaluation scale in the translation candidate list, and M 2 _MAX represents the maximum score of the other evaluation scale in the translation candidate list.
各候補リストに対して、上記の合計スコアを算出し、全開発データにおける合計スコアを累計することにより、累計スコアを算出する。 For each candidate list, the above total score is calculated, and the total score in all the development data is totaled to calculate the total score.
重みベクトルWを繰り返しランダムに決定して、重みベクトルWを毎回更新し、累計スコアを算出する。累計スコアが最大となる重みベクトルWを特定し、最適化された重みベクトルWとして、特徴量重み記憶部22に記憶されている重みベクトルを更新する。
The weight vector W is repeatedly determined at random, the weight vector W is updated each time, and the cumulative score is calculated. The weight vector W with the maximum cumulative score is specified, and the weight vector stored in the feature amount
翻訳最適化装置100は、翻訳部23、翻訳評価部24、パレート識別部25、及び最適化部26による一連の処理を繰り返し行う。重みベクトルを更新する毎に、累計スコアの最大値が次第に改善される。累計スコアの最大値の改善が止まったら、一連の処理の繰り返しを終了する。例えば、所定回数以上繰り返しても累計スコアの改善が止まったままである場合に、一連の処理の繰り返しを終了する。そして、特徴量重み記憶部22に最終的に記憶されている、最大の累計スコアを与える重みベクトルを、最適化の結果とする。
The
<翻訳最適化装置の作用>
次に、本実施の形態に係る翻訳最適化装置100の作用について説明する。まず、日本語の入力文と英語の正しい翻訳文とからなる開発データが、翻訳最適化装置100に複数入力されると、翻訳最適化装置100によって、入力された複数の開発データが、開発データ記憶部21へ格納される。そして、翻訳最適化装置100によって、図4に示す翻訳最適化処理ルーチンが実行される。
<Operation of translation optimization device>
Next, the operation of
まず、ステップS101において、開発データ記憶部21から複数の開発データの全てを取得する。そして、ステップS102において、各翻訳特徴モデルに対する重みをランダムに決定し、特徴量重み記憶部22に格納する。ステップS103では、上記ステップS101において取得した各開発データの入力文について、翻訳処理を行い、翻訳特徴モデルに対する特徴量の重み付き加算による得られる翻訳スコアが上位k個となる翻訳候補からなる翻訳文の出力候補リストを、各開発データについて生成する。
First, in step S101, all of a plurality of development data is acquired from the development
次のステップS104では、各開発データに対して、当該開発データについて上記ステップS103で生成された翻訳文の出力候補リストに含まれる各翻訳候補について、複数種類の翻訳評価尺度スコアを計算する。 In the next step S104, for each development data, a plurality of types of translation evaluation scale scores are calculated for each translation candidate included in the translation candidate output list generated in step S103 for the development data.
そして、ステップS105において、各開発データに対して、当該開発データの各翻訳候補について上記ステップS104で算出された複数種類の翻訳評価尺度スコアに基づいて、翻訳候補リストに含まれる各翻訳候補がパレート最適性を満たすか否かを識別し、各開発データに対して、パレートフロンティアを求める。 In step S105, for each development data, each translation candidate included in the translation candidate list is Pareto based on the plurality of types of translation evaluation scale scores calculated in step S104 for each translation candidate of the development data. Identify whether or not the optimality is satisfied, and obtain a Pareto frontier for each development data.
次のステップS106では、各開発データに対して、上記ステップS104で計算された各翻訳候補の翻訳評価尺度スコアと、上記ステップS105で求められたパレートフロンティアとに基づいて、各翻訳候補の合計スコアを計算し、各開発データの合計スコアを累計して、累計スコアを算出する。算出した累計スコアに基づいて、最大の累計スコアを与える、各翻訳特徴モデルに対する重みを特定する。そして、ステップS107において、特徴量重み記憶部22に記憶された各翻訳特徴モデルの重みを、上記ステップS106で特定された各翻訳特徴モデルに対する重みに更新する。
In the next step S106, for each development data, based on the translation evaluation scale score of each translation candidate calculated in step S104 and the Pareto frontier obtained in step S105, the total score of each translation candidate Is calculated, and the total score of each development data is accumulated to calculate the cumulative score. Based on the calculated cumulative score, the weight for each translation feature model that gives the maximum cumulative score is specified. In step S107, the weight of each translation feature model stored in the feature amount
そして、ステップS108において、繰り返し処理を終了するか否かを判定する。例えば、上記ステップS106で算出された累計スコアの最大値が所定回数連続して改善していない場合には、繰り返し処理を終了すると判定し、翻訳最適化処理ルーチンを終了する。このとき特徴量重み記憶部22に記憶された各翻訳特徴モデルの重みが、最適化された重みとなる。
In step S108, it is determined whether or not to end the repetition process. For example, if the maximum value of the cumulative score calculated in step S106 is not continuously improved a predetermined number of times, it is determined that the iterative process is to be terminated, and the translation optimization process routine is terminated. At this time, the weight of each translation feature model stored in the feature amount
一方、繰り返し処理を終了しないと判定された場合には、上記ステップS102へ戻り、各翻訳特徴モデルに対する重みをランダムに決定して、上記ステップS103〜ステップS107の処理を繰り返す。 On the other hand, if it is determined not to end the repetitive process, the process returns to step S102, the weight for each translation feature model is determined at random, and the processes of steps S103 to S107 are repeated.
特徴量重み記憶部22に記憶された各翻訳特徴モデルの重みが出力されて、例えば、機械翻訳装置(図示省略)に入力され、各翻訳特徴モデルの重みを用いて、機械翻訳処理が行われる。
The weight of each translation feature model stored in the feature amount
<実験結果>
次に、16個の開発データに対して実験を行った結果について説明する。4つのタイプ(EMEA:医療翻訳、Opensub:映画字幕翻訳、Europarl:国会スピーチの翻訳、NIST:新聞やブログの翻訳)の開発データを用いて実験を行った。翻訳元言語は6種類(DE:ドイツ語、ES:スペイン語、FR:フランス語、NL:オランダ語、SV:スウェーデン、ZH:中国語)とし、翻訳先言語を、英語とした。上記の第1の実施の形態で説明した最適化方法を含めて5つの最適化法を比較した。
<Experimental result>
Next, the results of experiments performed on 16 pieces of development data will be described. Experiments were conducted using development data of four types (EMEA: medical translation, Opensub: movie subtitle translation, Europarl: translation of Diet speech, NIST: translation of newspapers and blogs). There were six translation languages (DE: German, ES: Spanish, FR: French, NL: Dutch, SV: Sweden, ZH: Chinese), and the target language was English. Five optimization methods were compared including the optimization method described in the first embodiment.
比較対象として、BLEUの評価尺度スコアを目的関数にしたMERT最適化手法、TERの評価尺度スコアを目的関数にしたMERT最適化手法、BLEUの評価尺度スコアとTERの評価尺度スコアを目的関数にしたMERT最適化手法を用いた実験を行った。また、パレート識別部25で、後述するスカイラインアルゴリズムを用いた多目的最適化手法についても、同様に実験を行った。
As comparison targets, the MERT optimization method using the BLEU evaluation scale score as an objective function, the MERT optimization method using the TER evaluation scale score as an objective function, and the BLEU evaluation scale score and the TER evaluation scale score as an objective function Experiments using the MERT optimization technique were conducted. In addition, the
医療翻訳の開発データについて実験を行った結果を以下の表1に示す。実験の結果として、BLEU値と1−TER値(高いスコアがよりよい)を、各最適化法について求めた。 The results of experiments on medical translation development data are shown in Table 1 below. As a result of the experiment, BLEU values and 1-TER values (higher scores are better) were determined for each optimization method.
上記表1で、「COMBINED」は、BLEUの評価尺度スコアとTERの評価尺度スコアを目的関数にしたMERT最適化手法を用いた場合を示す。「SKYLINE」は、スカイラインアルゴリズムを使用した多目的最適化手法を用いた場合を示す。 In Table 1 above, “COMBINED” indicates a case where the MERT optimization method using the BLEU evaluation scale score and the TER evaluation scale score as an objective function is used. “SKYLINE” indicates the case where a multi-objective optimization method using the skyline algorithm is used.
「CVXHULL」は、上記の第1の実施の形態で説明した凸包アルゴリズムを使用した多目的最適化手法を用いた場合を示す。「MERT(BLEU)」は、BLEUの評価尺度スコアを目的関数にしたMERT最適化手法を用いた場合を示す。「MERT(TER)」は、TERの評価尺度スコアを目的関数にしたMERT最適化手法を用いた場合を示す。 “CVXHULL” indicates a case where the multi-objective optimization method using the convex hull algorithm described in the first embodiment is used. “MERT (BLEU)” indicates a case where a MERT optimization method using an evaluation function score of BLEU as an objective function is used. “MERT (TER)” indicates a case where a MERT optimization method using an evaluation scale score of TER as an objective function is used.
映画字幕翻訳の開発データについて実験を行った結果を以下の表2に示す。 Table 2 below shows the results of experiments conducted on development data for movie subtitle translation.
国会スピーチの翻訳の開発データ、及び新聞やブログの翻訳の開発データについて実験を行った結果を以下の表3に示す。 Table 3 below shows the results of experiments conducted on development data for translations of Diet speech and development data for translations of newspapers and blogs.
上記表1〜表3において、*は最もよいシステムを示す。また、太字(ボールド)は両方の評価尺度を使用したシステム(Combined, Skyline, CvxHull)のなかで一番良いものを示す。 In Tables 1 to 3, * indicates the best system. Bold (bold) indicates the best of the systems (Combined, Skyline, CvxHull) using both evaluation scales.
上記の実験結果から、複数の目的関数を使う場合、翻訳元言語と評価尺度の組み合わせのほとんどにおいて、上記の第1の実施の形態で提案した手法(スカイラインアルゴリズムを用いた手法も含む)で、「Combined」よりもすぐれた最適化が実現できていることがわかった。特に、上記の第1の実施の形態で提案した手法は、1−TER値で、「MERT(TER)」よりいい結果を出していることは特筆に値する。以上の実験結果から、上記の第1の実施の形態で提案した、パレート最適性に基づく最適化が有効な方法であることが分かった。 From the above experimental results, when using a plurality of objective functions, most of the combinations of the source language and the evaluation scale are the methods proposed in the first embodiment (including the method using the skyline algorithm), It turned out that the optimization which was superior to "Combined" was realized. In particular, it is worthy of special mention that the method proposed in the first embodiment produces a better result than “MERT (TER)” with a 1-TER value. From the above experimental results, it was found that the optimization based on the Pareto optimality proposed in the first embodiment is an effective method.
以上説明したように、本実施の形態に係る翻訳最適化装置によれば、翻訳文の出力候補リストの各翻訳候補について複数種類の評価尺度スコアを算出して、パレート最適性を満たすか否かを識別し、識別結果に応じて、各翻訳特徴モデルに対する重みを更新することにより、複数の評価尺度スコアを同時に用いて、複数の翻訳特徴モデルに対する重みの最適化を行うことができる。 As described above, according to the translation optimization device according to the present embodiment, whether or not the Pareto optimality is satisfied by calculating a plurality of types of evaluation scale scores for each translation candidate in the output candidate list of the translation sentence. By updating the weights for each translation feature model according to the identification result, the weights for the plurality of translation feature models can be optimized using a plurality of evaluation scale scores simultaneously.
複数の評価尺度についてパレート最適性を満たす翻訳候補(パレートポイント)に高い評価スコアがつくように翻訳特徴モデルの特徴量の重みを調整することにより、複数の評価尺度の観点で、バランスの取れた機械翻訳システムを構築することができる。 By adjusting the feature weights of the translation feature model so that translation candidates that satisfy Pareto optimality (Pareto points) for multiple evaluation scales have a high evaluation score, a balance can be achieved from the viewpoint of multiple evaluation scales. A machine translation system can be constructed.
なお、上記の実施の形態では、翻訳部23、翻訳評価部24、パレート識別部25、及び最適化部26による一連の処理を繰り返し行う毎に、毎回、翻訳特徴モデルに対する重みをランダムに決定する場合を例に説明したが、これに限定されるものではない。翻訳評価部24、パレート識別部25、及び最適化部26による一連の処理を繰り返し行う毎に、算出された累計スコアに基づいて、例えばPOWELL法を用いて、最適化方向に翻訳特徴モデルに対する重みを更新するようにしてもよい。
In the above embodiment, each time a series of processes by the
<第2の実施の形態>
次に、第2の実施の形態について説明する。なお、第2の実施の形態に係る翻訳最適化装置は、第1の実施の形態と同様の構成であるため、同一符号を付して説明を省略する。
<Second Embodiment>
Next, a second embodiment will be described. Note that the translation optimizing device according to the second embodiment has the same configuration as that of the first embodiment, and thus the same reference numerals are given and description thereof is omitted.
第2の実施の形態では、各翻訳特徴モデルに対する重みを最適化するアルゴリズムが、第1の実施の形態と異なっている。 In the second embodiment, an algorithm for optimizing the weight for each translation feature model is different from that in the first embodiment.
第2の実施の形態に係る翻訳最適化装置の最適化部26は、MIRAを拡張した多目的最適化手法を用いる。ここで想定する識別器は、翻訳候補をポジティブクラスとネガティブクラスに二値分類するものである。MIRAを拡張した多目的最適化法は、当該識別器の特徴量の重みをオンライン的に更新するもので、以下の手順で動作する。
The
まず、複数の開発データの各々について、パレート識別部25による識別結果に基づいて、パレート最適性を満たさない翻訳候補に対しては、ネガティブのクラスに分類し、パレートフロンティアに含まれる翻訳候補(パレート最適性を満たす翻訳候補)に対しては、ポジティブのクラスに分類する。各開発データの翻訳候補リストに含まれる各翻訳候補が、ポジティブである場合には、重みの更新を行わない。一方、ネガティブである翻訳候補が存在する場合には、各翻訳特徴モデルの重みを更新する。重みの更新方法は、単なる勾配法でもいいし、複雑な方法(例えば、margin−infused update)を用いてもよい。
First, for each of a plurality of development data, based on the identification result by the
翻訳最適化装置100は、翻訳部23、翻訳評価部24、パレート識別部25、及び最適化部26による一連の処理を繰り返し行う。重みベクトルが更新されなくなるまで、一連の処理を繰り返す。
The
第2の実施の形態に係る翻訳最適化処理ルーチンでは、まず、開発データ記憶部21から複数の開発データの全てを取得する。そして、各翻訳特徴モデルに対する重みをランダムに決定し、特徴量重み記憶部22に格納する。上記で取得した各開発データの入力文について、翻訳処理を行い、翻訳特徴モデルに対する特徴量の重み付き加算による得られる翻訳スコアが上位k個となる翻訳候補からなる出力候補リストを、各開発データについて生成する。
In the translation optimization processing routine according to the second embodiment, first, all of a plurality of development data is acquired from the development
次に、各開発データに対して、当該開発データについて上記で生成された出力候補リストに含まれる各翻訳候補について、複数種類の翻訳評価尺度スコアを計算する。 Next, for each development data, a plurality of types of translation evaluation scale scores are calculated for each translation candidate included in the output candidate list generated above for the development data.
そして、各開発データに対して、当該開発データの各翻訳候補について上記で算出された複数種類の翻訳評価尺度スコアに基づいて、翻訳候補リストに含まれる各翻訳候補がパレート最適性を満たすか否かを識別し、各開発データに対して、パレートフロンティアを求める。 For each development data, whether or not each translation candidate included in the translation candidate list satisfies the Pareto optimality based on the plurality of types of translation evaluation scale scores calculated above for each translation candidate of the development data And identify the Pareto frontier for each development data.
次に、各開発データに対して、上記で求められたパレートフロンティアに基づいて、各翻訳候補のクラスを分類し、ネガティブとなる翻訳候補が存在する場合には、各翻訳特徴モデルに対する重みを最適化する。そして、特徴量重み記憶部22に記憶された各翻訳特徴モデルの重みを、上記で最適化された各翻訳特徴モデルに対する重みに更新する。
Next, for each development data, classify each translation candidate class based on the Pareto frontier obtained above, and if there is a negative translation candidate, assign the optimal weight to each translation feature model Turn into. And the weight of each translation feature model memorize | stored in the feature-value weight memory |
そして、繰り返し処理を終了するか否かを判定する。例えば、重みが更新されなくなった場合には、繰り返し処理を終了すると判定し、翻訳最適化処理ルーチンを終了する。このとき特徴量重み記憶部22に記憶された各翻訳特徴モデルの重みが、最適化された重みとなる。
Then, it is determined whether or not to end the repetition process. For example, when the weight is not updated, it is determined that the iterative process is finished, and the translation optimization process routine is finished. At this time, the weight of each translation feature model stored in the feature amount
一方、繰り返し処理を終了しないと判定された場合には、上記で更新された各翻訳特徴モデルの重みを用いて上記の処理を繰り返す。 On the other hand, if it is determined not to end the repetitive process, the above process is repeated using the weight of each translation feature model updated as described above.
なお、第2の実施の形態に係る翻訳最適化装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。 Note that other configurations and operations of the translation optimization apparatus according to the second embodiment are the same as those of the first embodiment, and thus the description thereof is omitted.
このように、翻訳文の出力候補リストの各翻訳候補について識別した、パレート最適性を満たすか否かの識別結果を用いて、MIRAを拡張した多目的最適化手法により、各翻訳特徴モデルに対する重みを更新することにより、複数の評価尺度スコアを同時に用いて、複数の翻訳特徴モデルに対する重みの最適化を行うことができる。 In this way, by using the identification result of whether or not the Pareto optimality identified for each translation candidate in the translated sentence output candidate list is used, a weight for each translation feature model is obtained by a multi-objective optimization method that extends MIRA. By updating, weights for a plurality of translation feature models can be optimized using a plurality of evaluation scale scores simultaneously.
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications are possible without departing from the gist of the present invention.
例えば、パレート識別部において、スカイラインアルゴリズムを用いて、パレートフロンティアを求めるようにしてもよい。なお、スカイラインアルゴリズムとしては、非特許文献(Parke Godfrey, Ryan Shipley, Jarek Gyrz, “Algorithms and analyses for maximal vector computation”, VLDB Journal, vol16, 2006)に記載された手法と同様のものを用いればよいため、詳細な説明を省略する。 For example, the Pareto identification unit may obtain the Pareto frontier using a skyline algorithm. The skyline algorithm may be the same as that described in non-patent literature (Parke Godfrey, Ryan Shipley, Jarek Gyrz, “Algorithms and analyzes for maximal vector computation”, VLDB Journal, vol16, 2006). Therefore, detailed description is omitted.
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。 In the present specification, the embodiment has been described in which the program is installed in advance. However, the program can be provided by being stored in a computer-readable recording medium.
10 入力部
20 演算部
21 開発データ記憶部
22 特徴量重み記憶部
23 翻訳部
24 翻訳評価部
25 パレート識別部
26 最適化部
100 翻訳最適化装置
DESCRIPTION OF
Claims (7)
前記翻訳処理手段によって翻訳された前記翻訳先言語の単語列の複数の候補hの各々について、複数種類の翻訳評価尺度を示す複数のスコアM 1 (h)、M 2 (h)を算出する翻訳評価手段と、
前記複数の候補hの各々について算出された前記複数のスコアM 1 (h)、M 2 (h)に基づいて、以下の式を用いて、変数αを0から無限大まで徐々に増加させながら、変数αの各値において、前記複数の候補の集合Lから、パレート最適性を満たす候補h * を抽出すると共に、前記抽出された候補h * より前記スコアM 2 (h)が小さくなる候補を、前記パレート最適性を満たさない候補として識別するパレート識別手段と、
前記パレート識別手段による識別結果に応じて、前記複数種類の翻訳特徴モデルの各々に対する重みを更新する重み更新手段と、
前記翻訳処理手段による翻訳、前記翻訳評価手段による算出、前記パレート識別手段による識別、及び前記重み更新手段による更新を繰り返すことで、前記複数種類の翻訳特徴モデルの各々に対する重みを最適化する最適化手段と、
を含む翻訳最適化装置。
Translation for calculating a plurality of scores M 1 (h) and M 2 (h) indicating a plurality of types of translation evaluation scales for each of a plurality of candidates h of the word string in the target language translated by the translation processing means An evaluation means;
Based on the plurality of scores M 1 (h) and M 2 (h) calculated for each of the plurality of candidates h , the variable α is gradually increased from 0 to infinity using the following equation: For each value of the variable α, candidates h * satisfying Pareto optimality are extracted from the plurality of candidate sets L, and candidates whose score M 2 (h) is smaller than the extracted candidates h * are selected. Pareto identifying means for identifying as a candidate that does not satisfy the Pareto optimality ;
Weight updating means for updating weights for each of the plurality of types of translation feature models according to the identification result by the Pareto identification means;
Optimization for optimizing the weight for each of the plurality of types of translation feature models by repeating the translation by the translation processing unit, the calculation by the translation evaluation unit, the identification by the Pareto identification unit, and the update by the weight update unit Means,
Translation optimization device including
前記重み更新手段は、前記パレート識別手段による識別結果に応じて、前記翻訳先言語の複数の単語列に対する各候補について、パレート最適性を満たすと識別された場合に、該候補に対する各スコアとして、該スコアの最大値を与えて、前記複数の単語列に対する各候補について、各スコアの合計値を累積した累計スコアを算出し、前記算出された累計スコアに基づいて、前記複数種類の翻訳特徴モデルの各々に対する重みを更新する請求項1記載の翻訳最適化装置。 The translation processing means translates each of the plurality of word strings in the translation source language into a plurality of candidates for the word string in the translation destination language,
The weight updating means, when each candidate for a plurality of word strings of the translation destination language is identified as satisfying Pareto optimality according to the identification result by the Pareto identification means, Given the maximum value of the score, for each candidate for the plurality of word strings, calculate a cumulative score by accumulating the total value of each score, and based on the calculated cumulative score, the plurality of types of translation feature models claim 1 Symbol placement translation optimization apparatus updates the weighting for each.
前記翻訳最適化装置は、
前記翻訳処理手段によって、複数種類の翻訳特徴モデル及び前記複数種類の翻訳特徴モデルの各々に対する重みに基づいて、翻訳元言語の単語列を、翻訳先言語の単語列の複数の候補hに翻訳するステップと、
前記翻訳評価手段によって、前記翻訳処理手段によって翻訳された前記翻訳先言語の単語列の複数の候補hの各々について、複数種類の翻訳評価尺度を示す複数のスコアM 1 (h)、M 2 (h)を算出するステップと、
前記パレート識別手段によって、前記複数の候補hの各々について算出された前記複数のスコアM 1 (h)、M 2 (h)に基づいて、以下の式を用いて、変数αを0から無限大まで徐々に増加させながら、変数αの各値において、前記複数の候補の集合Lから、パレート最適性を満たす候補h * を抽出すると共に、前記抽出された候補h * より前記スコアM 2 (h)が小さくなる候補を、前記パレート最適性を満たさない候補として識別するステップと、
前記重み更新手段によって、前記パレート識別手段による識別結果に応じて、前記複数種類の翻訳特徴モデルの各々に対する重みを更新するステップと、
前記最適化手段によって、前記翻訳処理手段による翻訳、前記翻訳評価手段による算出、前記パレート識別手段による識別、及び前記重み更新手段による更新を繰り返すことで、前記複数種類の翻訳特徴モデルの各々に対する重みを最適化するステップと、
を含んで実行することを特徴とする翻訳最適化方法。
The translation optimization device includes:
The translation processing means translates a word string in the source language into a plurality of candidate words h in the target language based on the weights for each of the plurality of types of translation feature models and the plurality of types of translation feature models. Steps,
A plurality of scores M 1 (h) and M 2 ( M 2 ) indicating a plurality of types of translation evaluation scales for each of a plurality of candidates h of the word string in the target language translated by the translation processing unit by the translation evaluation unit. h) calculating;
Based on the plurality of scores M 1 (h) and M 2 (h) calculated for each of the plurality of candidates h by the Pareto identification unit , the variable α is changed from 0 to infinity using the following equation: while gradually increasing until, at each value of the variable alpha, the set L of the plurality of candidate, extracts the candidate h * satisfying Pareto optimality, the more the extracted candidate h * score M 2 (h ) For which the candidate is smaller as a candidate that does not satisfy the Pareto optimality ;
Updating the weight for each of the plurality of types of translation feature models by the weight updating means according to the identification result by the Pareto identifying means;
The optimization unit repeats the translation by the translation processing unit, the calculation by the translation evaluation unit, the identification by the Pareto identification unit, and the update by the weight update unit, whereby weights for each of the plurality of types of translation feature models are obtained. Steps to optimize
A translation optimizing method comprising:
前記重み更新手段によって更新するステップは、前記パレート識別手段による識別結果に応じて、前記翻訳先言語の複数の単語列に対する各候補について、パレート最適性を満たすと識別された場合には、該候補に対する各スコアとして、該スコアの最大値を与えて、前記複数の単語列に対する各候補について、各スコアの合計値を累積した累計スコアを算出し、前記算出された累計スコアに基づいて、前記複数種類の翻訳特徴モデルの各々に対する重みを更新する請求項4記載の翻訳最適化方法。 The step of translating by the translation processing means translates each of the plurality of word strings in the source language into a plurality of candidates for the word strings in the target language,
The step of updating by the weight updating means is performed when each candidate for a plurality of word strings in the translation destination language is identified as satisfying Pareto optimality according to the identification result by the Pareto identifying means. For each candidate for the plurality of word strings, a cumulative score obtained by accumulating the total value of the scores is calculated as each score for the plurality of word strings, and the plurality of scores are calculated based on the calculated cumulative score. The translation optimization method according to claim 4 , wherein the weight for each of the types of translation feature models is updated.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011203479A JP5548176B2 (en) | 2011-09-16 | 2011-09-16 | Translation optimization apparatus, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011203479A JP5548176B2 (en) | 2011-09-16 | 2011-09-16 | Translation optimization apparatus, method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013065202A JP2013065202A (en) | 2013-04-11 |
JP5548176B2 true JP5548176B2 (en) | 2014-07-16 |
Family
ID=48188637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011203479A Active JP5548176B2 (en) | 2011-09-16 | 2011-09-16 | Translation optimization apparatus, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5548176B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10713593B2 (en) * | 2016-11-04 | 2020-07-14 | Google Llc | Implicit bridging of machine learning tasks |
CN111160048B (en) * | 2019-11-27 | 2023-06-06 | 语联网(武汉)信息技术有限公司 | Translation engine optimization system and method based on cluster evolution |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100004919A1 (en) * | 2008-07-03 | 2010-01-07 | Google Inc. | Optimizing parameters for machine translation |
-
2011
- 2011-09-16 JP JP2011203479A patent/JP5548176B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013065202A (en) | 2013-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Melamud et al. | context2vec: Learning generic context embedding with bidirectional lstm | |
Yamada et al. | Joint learning of the embedding of words and entities for named entity disambiguation | |
Rastogi et al. | Weighting finite-state transductions with neural context | |
Mirowski et al. | Dependency recurrent neural language models for sentence completion | |
US20120262461A1 (en) | System and Method for the Normalization of Text | |
JP5710581B2 (en) | Question answering apparatus, method, and program | |
CN109117474B (en) | Statement similarity calculation method and device and storage medium | |
CN111967258B (en) | Method for constructing coreference resolution model, coreference resolution method and medium | |
US11227110B1 (en) | Transliteration of text entry across scripts | |
Mareček et al. | Stop-probability estimates computed on a large corpus improve unsupervised dependency parsing | |
JP2019082931A (en) | Retrieval device, similarity calculation method, and program | |
CN116306600B (en) | MacBert-based Chinese text error correction method | |
Sproat et al. | Applications of maximum entropy rankers to problems in spoken language processing | |
CN110991193B (en) | OpenKiwi-based translation matrix model selection system | |
Green et al. | An empirical comparison of features and tuning for phrase-based machine translation | |
JP6535607B2 (en) | Preprocessing model learning device, method and program | |
JP2016224483A (en) | Model learning device, method and program | |
JP5548176B2 (en) | Translation optimization apparatus, method, and program | |
Xiang et al. | A hybrid model for grammatical error correction | |
Gubelmann et al. | A philosophically-informed contribution to the generalization problem of neural natural language inference: Shallow heuristics, bias, and the varieties of inference | |
JP6232358B2 (en) | Next utterance candidate ranking apparatus, method, and program | |
Visser et al. | Sentiment and intent classification of in-text citations using bert | |
Joshi et al. | Word embeddings in low resource Gujarati language | |
Torunoglu-Selamet et al. | Exploring spelling correction approaches for turkish | |
JP6564709B2 (en) | Sentence rewriting device, method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130729 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140311 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140513 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140516 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5548176 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |