JP2014013514A - 機械翻訳結果評価装置、翻訳パラメータ最適化装置、方法、及びプログラム - Google Patents

機械翻訳結果評価装置、翻訳パラメータ最適化装置、方法、及びプログラム Download PDF

Info

Publication number
JP2014013514A
JP2014013514A JP2012150929A JP2012150929A JP2014013514A JP 2014013514 A JP2014013514 A JP 2014013514A JP 2012150929 A JP2012150929 A JP 2012150929A JP 2012150929 A JP2012150929 A JP 2012150929A JP 2014013514 A JP2014013514 A JP 2014013514A
Authority
JP
Japan
Prior art keywords
translation
pronoun
character string
pronouns
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012150929A
Other languages
English (en)
Other versions
JP5710551B2 (ja
Inventor
Hiroyori Taira
博順 平
Masaaki Nagata
昌明 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012150929A priority Critical patent/JP5710551B2/ja
Publication of JP2014013514A publication Critical patent/JP2014013514A/ja
Application granted granted Critical
Publication of JP5710551B2 publication Critical patent/JP5710551B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

【課題】代名詞の省略補完を行うことにより翻訳精度が向上した翻訳結果に対して、翻訳品質を適切に評価することができるようにする。
【解決手段】単語分割部2は、翻訳元言語の文字列を機械翻訳した目標言語の文字列である機械翻訳文字列、及び翻訳元言語の文字列を正しく翻訳した目標言語の文字列である参照訳文字列の各々を単語単位に分割する。代名詞F値計算部4は、機械翻訳文字列の分割結果に基づいて、予め求められた目標言語の代名詞リストに含まれる各代名詞の出現数をカウントすると共に、参照訳文字列の分割結果に基づいて、代名詞リストに含まれる各代名詞の出現数をカウントし、カウントされた機械翻訳文字列における各代名詞の出現数及び参照訳文字列における各代名詞の出現数に基づいて、代名詞に対する再現率、及び代名詞に対する適合率を算出し、算出した再現率及び適合率に基づいて、代名詞に対するF値を、品質スコアとして算出する。
【選択図】図1

Description

本発明は、機械翻訳結果評価装置、翻訳パラメータ最適化装置、方法、及びプログラムに係り、特に、日本語、韓国語等、主語、目的語などの単語の省略が頻繁に起こる言語から、英語、フランス語等の主語、目的語などの単語の省略に非寛容的な言語へ翻訳を行う機械翻訳器の翻訳結果を評価する機械翻訳結果評価装置、方法、プログラムおよび、翻訳モデルのパラメータを最適化する翻訳パラメータ最適化装置に関する。
従来、統計的機械翻訳システムの性能を評価する方法として、BLEU(非特許文献1参照)がある。BLEUは、基本的には、参照訳(人手で作成した正解訳)とシステム訳(機械翻訳システムが機械翻訳を行い出力した訳)との間のNグラム(通常はN=1〜4)が一致した数を計算した上で、それらの幾何平均を取り、参照訳の長さの影響を加味した補正を行って、BLEU値を得、これを翻訳精度とする。BLEU値は、ヨーロッパ言語間での翻訳では人間による評価と相関が高いといわれており、計算コストが少ない等の理由により、広く用いられている。また、翻訳品質を自動的に向上させる方法として、BLEUを評価指標に用いたMERT法(非特許文献2参照)が多く用いられている。
MERT法は、デコーダにおける言語モデルや翻訳モデルに与える重みの最適化を行う。
n個の重みの組λ1 n=λ1〜λnについて、BLEU値が最大となる翻訳結果が選ばれる重みの組を^λ1 nとしたとき、以下の(1)式に示す最適化の式を計算する。
ここで、smt(λ)はパラメータが与えられたときのデコーダの出力文、またBLEU()はデコーダの出力文と入力文に対するBLEU値を表し、erefは、あらかじめ与えられた翻訳正解文を表す。
重みの最適化は、
1.λに初期値を与える。
2.λを用いてデコーディングを行い、確率の高い上位N文を出力する
3.上位N文の中でBLEUスコアが高い文が上位に来るようλを最適化する
4.重みが収束するまで2,3を繰り返す。
Papineni, K., Roukos, S., Ward, T., and Zhu, W.J. 「 BLEU: a method for automatic evaluation of machine translation」, Proc. of the Annual Meeting of the Association of Computational Linguistics (ACL), pp. 311−318, 2002年 Franz Josef Och 「Minimum error rate training for statistical machine translation」, Proc. of the Annual Meeting of the Association of Computational Linguistics (ACL), 2003年
日本語や韓国語のように主語・目的語などの単語の省略が頻繁に起こる翻訳元言語から、英語、フランス語等の単語の省略が頻繁には起こらない目標言語へ機械翻訳を行う際、源言語側の単語の省略により、目標言語において本来省略されてはいけない代名詞の欠如を引き起こし、機械翻訳の質が低下してしまう、という問題がある。例えば、「今日の夕方までに届けてください。」という文があった場合、「あなたは」「それを」が省略されていることにより「It by this evening ?」といった意味の通じないおかしな翻訳を出力してしまうことがある。
従来、機械翻訳の質の評価方法としてBLEUがあり、翻訳品質を向上させる方法として、BLEU値の評価値を基準にしたMERT法があった。ところが、翻訳元言語の省略を原因とする目標言語の代名詞の欠如による機械翻訳の質の低下は、目標言語の代名詞の欠如がBLEU値にほとんど影響を与えないため、BLEUによる品質評価や、MERT法による機械翻訳の品質を向上させることは困難であった。
本発明は上記問題点を解決するためになされたものであり、代名詞の省略補完を行うことにより翻訳精度が向上した翻訳結果に対して、翻訳品質を適切に評価することができる翻訳品質評価装置、方法、及びプログラムを提供することを第1の目的とする。
また、代名詞の省略による翻訳の質の低下を考慮して翻訳モデルのパラメータを最適化することができる翻訳パラメータ最適化装置及びプログラムを提供することを第2の目的とする。
上記目的を達成するために、本発明の機械翻訳結果評価装置は、翻訳元言語の文字列を機械翻訳した目標言語の文字列である機械翻訳文字列、及び前記翻訳元言語の文字列を正しく翻訳した前記目標言語の文字列である参照訳文字列の各々を単語単位に分割する分割手段と、前記分割手段による前記機械翻訳文字列の分割結果に基づいて、予め求められた目標言語の代名詞リストに含まれる各代名詞の出現数をカウントすると共に、前記分割手段による前記参照訳文字列の分割結果に基づいて、前記代名詞リストに含まれる各代名詞の出現数をカウントする代名詞カウント手段と、前記代名詞カウント手段によりカウントされた前記機械翻訳文字列における各代名詞の出現数及び前記参照訳文字列における各代名詞の出現数に基づいて、代名詞に対する再現率、及び代名詞に対する適合率を算出し、前記算出した再現率及び適合率に基づいて、代名詞に対するF値を、品質スコアとして算出する算出手段と、を含んで構成されている。
本発明の機械翻訳結果評価方法は、分割手段、代名詞カウント手段、及び算出手段を含む機械翻訳結果評価装置における機械翻訳結果評価方法であって、前記機械翻訳結果評価装置は、前記分割手段によって、翻訳元言語の文字列を機械翻訳した目標言語の文字列である機械翻訳文字列、及び前記翻訳元言語の文字列を正しく翻訳した前記目標言語の文字列である参照訳文字列の各々を単語単位に分割するステップと、前記分割手段による前記機械翻訳文字列の分割結果に基づいて、予め求められた目標言語の代名詞リストに含まれる各代名詞の出現数をカウントすると共に、前記分割手段による前記参照訳文字列の分割結果に基づいて、前記代名詞リストに含まれる各代名詞の出現数をカウントするステップと、前記代名詞カウント手段によりカウントされた前記機械翻訳文字列における各代名詞の出現数及び前記参照訳文字列における各代名詞の出現数に基づいて、代名詞に対する再現率、及び代名詞に対する適合率を算出し、前記算出した再現率及び適合率に基づいて、代名詞に対するF値を、品質スコアとして算出するステップと、を含むことを特徴とする。
本発明によれば、分割手段により、翻訳元言語の文字列を機械翻訳した目標言語の文字列である機械翻訳文字列、及び前記翻訳元言語の文字列を正しく翻訳した前記目標言語の文字列である参照訳文字列の各々を単語単位に分割し、代名詞カウント手段により、分割手段による前記機械翻訳文字列の分割結果に基づいて、予め求められた代名詞リストに含まれる各代名詞の出現数をカウントすると共に、分割手段による参照訳文字列の分割結果に基づいて、代名詞リストに含まれる各代名詞の出現数をカウントする。
そして、算出手段により、代名詞カウント手段によりカウントされた機械翻訳文字列における各代名詞の出現数及び参照訳文字列における各代名詞の出現数に基づいて、代名詞に対する再現率、及び代名詞に対する適合率を算出し、算出した再現率及び適合率に基づいて、代名詞に対するF値を、品質スコアとして算出する。
このように、機械翻訳結果中の代名詞の出現数および参照訳中の代名詞の出現数から品質スコアとして代名詞F値を算出することにより、代名詞の省略補完を行うことにより翻訳精度が向上した翻訳結果に対して、翻訳品質を適切に評価することができる。
本発明の翻訳パラメータ最適化装置は、上記機械翻訳結果評価装置と、翻訳モデルに基づいて、翻訳元言語の文字列を目標言語の文字列に翻訳する機械翻訳手段と、前記機械翻訳手段によって翻訳された前記目標言語の文字列について前記機械翻訳結果装置によって算出された前記品質スコアに基づいて、前記翻訳モデルのモデルパラメータを更新する更新手段と、前記翻訳モデルのモデルパラメータが最適化されるまで、前記機械翻訳手段による翻訳、及び前記更新手段による更新を繰り返すパラメータ最適化手段と、を含んで構成されている。
第4の発明によれば、代名詞の省略による翻訳の質の低下を考慮して翻訳モデルのパラメータを最適化することができる。
また、上記の品質スコアを、全ての代名詞に対するF値とすることができる。
また、上記の品質スコアを、代名詞F値とBLEU値の線形和とすることができる。
本発明のプログラムは、コンピュータを、翻訳元言語の文字列を機械翻訳した目標言語の文字列である機械翻訳文字列、及び前記翻訳元言語の文字列を正しく翻訳した前記目標言語の文字列である参照訳文字列の各々を単語単位に分割する分割手段、前記分割手段による前記機械翻訳文字列の分割結果に基づいて、予め求められた目標言語の代名詞リストに含まれる各代名詞の出現数をカウントすると共に、前記分割手段による前記参照訳文字列の分割結果に基づいて、前記代名詞リストに含まれる各代名詞の出現数をカウントする代名詞カウント手段、及び前記代名詞カウント手段によりカウントされた前記機械翻訳文字列における各代名詞の出現数及び前記参照訳文字列における各代名詞の出現数に基づいて、代名詞に対する再現率、及び代名詞に対する適合率を算出し、前記算出した再現率及び適合率に基づいて、代名詞に対するF値を、品質スコアとして算出する算出手段として機能させるためのプログラムである。
以上説明したように、本発明の機械翻訳結果評価装置、方法、及びプログラムによれば、機械翻訳結果中の代名詞の出現数および参照訳中の代名詞の出現数から品質スコアとして代名詞F値を算出することにより、代名詞の省略補完を行うことにより翻訳精度が向上した翻訳結果に対して、翻訳品質を適切に評価することができる。
また、本発明の翻訳パラメータ最適化装置によれば、代名詞の省略による翻訳の質の低下を考慮して翻訳モデルのパラメータを最適化することができる。
第1の実施の形態の翻訳結果評価装置の機能的構成を示すブロック図である。 第1の実施の形態の翻訳結果評価装置における機械翻訳結果評価処理ルーチンの内容を示すフローチャートである。 入力するシステム翻訳結果例を示す図である。 入力する参照訳例を示す図である。 代名詞リストの例を示す図である。 システム翻訳結果中の代名詞リストに含まれる代名詞の出現回数の例を示す図である。 参照訳中の代名詞リストに含まれる代名詞の出現回数の例を示す図である。 システム翻訳結果1およびシステム翻訳結果2に関する代名詞F値の計算の例を示す図である。 第2の実施の形態の第1の実施の形態に係る翻訳結果評価装置を用いた翻訳パラメータ最適化装置の機能的構成を示すブロック図である。 第2の実施の形態の第1の実施の形態に係る翻訳結果評価装置を用いた翻訳パラメータ最適化装置における翻訳品質向上処理ルーチンの内容を示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。本実施の形態では、代名詞の省略補完による翻訳結果の翻訳品質について適切に自動評価を行うために、目標言語側の代名詞リストを用意し、目標言語側での代名詞が適切に訳出できたかどうかについてF値を利用して評価することで、翻訳品質の自動評価を行う。
図1に示すように、第1の実施の形態に係る翻訳結果評価装置20は、入力部10と、後述する機械翻訳結果評価処理ルーチンを実行するコンピュータ1と、コンピュータ1での処理により算出される品質スコアを出力する出力部6と、を備えている。
入力部10により、システム翻訳結果及び参照訳が、自然言語の形態でコンピュータ1に入力される。入力部10としては、ユーザによって操作されるキーボート、インターネット等のネットワークを介してコンピュータ1と接続可能なユーザの端末、又はコンピュータ1とユーザの端末とを中継するネットワークサーバ等が挙げられる。システム翻訳結果は、機械翻訳システムにより翻訳元言語の文字列を機械翻訳した目標言語の文字列(テキスト)であり、参照訳は、当該翻訳元言語の文字列を人手等により翻訳した正解翻訳としての目標言語の文字列(テキスト)である。ここで、翻訳元言語は日本語や韓国語等の主語や目的語などの単語の省略に対して寛容的な言語であり、目標言語は英語、フランス語等に主語、目的語などの単語の省略に対して非慣用的な言語である。
コンピュータ1は、翻訳結果評価装置20全体の制御を司るCPU、後述する翻訳結果評価ルーチンのプログラム等を記憶した記憶媒体としてのROM、ワークエリアとしてデータを一時格納するRAM、及びこれらを接続するバスを含んで構成されている。このような構成の場合には、各構成要素の機能を実現するためのプログラムをROMやHDD等の記憶媒体に記憶しておき、これをCPUが実行することによって、各機能が実現されるようにする。
このコンピュータ1をハードウエアとソフトウエアとに基づいて定まる機能実現手段毎に分割した機能ブロックで説明すると、図1に示すように、入力部10により入力されたシステム翻訳結果を記憶するシステム翻訳結果記憶部7と、入力部10により入力された参照訳を記憶する参照訳記憶部8と、予め用意された目標言語の複数の代名詞を含む代名詞リストを記憶する代名詞リスト記憶部9と、システム翻訳結果記憶部7に記憶されたシステム翻訳結果及び参照訳記憶部8に記憶された参照訳のそれぞれについて単語単位に分割する単語分割部2と、単語分割部2により分割されたシステム翻訳結果及び参照訳の各々の単語分割済みテキストを記憶する単語分割済みテキストテーブル3と、予め用意された目標言語の代名詞リストに基づいてシステム翻訳結果及び参照訳のそれぞれについて代名詞F値を計算する代名詞F値計算部4と、品質スコアである代名詞F値を記憶する評価値テーブル5と、を含んだ構成で表すことができる。
単語分割部2は、システム翻訳結果及び参照訳の各々を単語単位に単語分割する。なお、単語分割は、形態素解析等に従来既知の手法より行えばよいため、詳細な説明を省略する。
単語分割済みテキストテーブル3は、単語分割部2で分割されたシステム翻訳結果及び参照訳の各々の単語分割済みテキストを記憶する。
代名詞F値計算部4は、単語分割済みテキストテーブル3に格納されているシステム翻訳結果の単語分割済みテキストに基づいて、代名詞リストに存在する各代名詞の出現数をカウントし、単語分割済みテキストテーブル3に格納されている参照訳の単語分割済みテキストに基づいて、代名詞リストに存在する各代名詞の出現数をカウントする。代名詞F値計算部4は、システム翻訳結果についての各代名詞の出現数及び参照訳についての各代名詞の出現数から、代名詞毎に、代名詞の適合率及び再現率を計算し、計算された適合率及び再現率に基づいて、システム翻訳結果の品質スコアとして、代名詞のF値を計算する。
ここで、ある代名詞pに対する適合率P(p)は、
P(p)=min(システムが出力した翻訳結果中にある代名詞pの個数, 参照訳による正解の翻訳結果中にある代名詞pの個数) / (システムが出力した翻訳結果中にある代名詞pの個数)
で求められ、
ある代名詞pに対する再現率R(p)は、
R(p)=min(システムが出力した翻訳結果中にある代名詞pの個数, 参照訳による正解の翻訳結果中にある代名詞pの個数) / (参照訳による正解の翻訳結果中にある代名詞pの個数)
で求められ、
ある代名詞pに対するF値、F(p)は、
F(p) = 2 * P(p) * R(p) / (P(p) + R(p))
で求められる。
なお、ここでmin(A,B)とはAとBの内、値が大きくない方を示す。
評価値テーブル5は、代名詞F値計算部4で算出された各代名詞のF値を記憶する。
出力部6は、評価値テーブルに記憶されている各代名詞のF値を外部に出力する。
次に、図2を参照して、第1の実施の形態の翻訳結果評価装置20のコンピュータ1で実行される機械翻訳結果評価処理ルーチンについて説明する。
ステップS101で、システム翻訳結果記憶部7に記憶されたシステム翻訳結果に対して単語分割部2が単語分割、単語の正規化を行い、単語分割済みテキストテーブル3に単語分割済みテキストを格納する。図3にシステム翻訳結果について2つの例を示す。
次にステップS102で、参照訳記憶部8に記憶された、人手等で作成した正解訳(参照訳)に対して単語分割部2が単語分割、単語の正規化を行い、単語分割済みテキストテーブル3に格納する。図4に参照訳についての1つの例を示す。
次にステップS103で、代名詞F値計算部4が、単語分割済みテキストテーブル3に格納されているシステム翻訳結果の単語分割済みテキストから、代名詞リストに存在する各代名詞の出現数をカウントし、記憶部に保持する。図5に代名詞リストの例を示す。図6に、システム翻訳結果における各代名詞の出現数をカウントした結果を示す。
次にステップS104で、代名詞F値計算部4が、単語分割済みテキストテーブル3に格納されている参照訳の単語分割済みテキストから、代名詞リストに存在する各代名詞の出現数をカウントし、記憶部に保持する。図7に、参照訳における各代名詞の出現数をカウントした結果を示す。
次にステップS105で、代名詞F値計算部4が、記憶部に保持されたシステム翻訳結果中の各代名詞の出現数および参照訳中の代名詞の出現数から代名詞毎の適合率、再現率、F値を計算し、計算結果を評価値テーブルに格納する。図8にその計算結果を示す。
次に、ステップS106で、出力部6により評価値テーブル中の各代名詞のF値を、システム翻訳結果の品質スコアとして外部に出力して処理を終了する。
例で示したシステム翻訳結果1と2では、主語等が正しく訳出されている頻度の高いシステム翻訳結果2の方が人手評価では訳の質が高い。しかしながら、BLEU値で測ると、翻訳結果1と2ではほとんどスコアの差がなく、見かけ上、品質が向上しているようには見えない。
一方、代名詞F値による評価を行うと、主格に関しては、iの代名詞F値が0から1へとスコアが向上しており、代名詞の省略補完による品質向上を確認することができる。
以上説明したように、第1の実施の形態の翻訳結果評価装置20によれば、システム翻訳結果に対する品質スコアとして、代名詞毎にF値を算出することにより、代名詞の省略補完を行い翻訳精度が向上した翻訳結果に対して、翻訳品質を的確に評価することができる。また、目標言語が、単語の省略に対して非寛容的な言語である場合の、単語省略に関して感度の高い翻訳品質評価をすることができる。
なお、上記の実施の形態では、品質スコアとしたF値を代名詞毎に算出する場合を例に説明したが、これに限定されるものではない。例えば、代名詞F値を算出すると共に、システム翻訳結果及び参照訳に基づいてBLEU値を算出し、算出された代名詞F値とBLEUをある重み付けで線形和を取ったものを品質スコアとして算出してもよい。例えば、品質スコアを、α×代名詞F値+β×BLEU値(α+β=1)のように算出してもよい。この場合には、単語の並びと代名詞が正しく訳せているかのどちらも考慮して翻訳品質を自動評価することができる。
また、F値を代名詞毎に算出する場合を例に説明したが、これに限定されるものではない。
すべての代名詞に対するF値を求める場合には、すべての代名詞に対する適合率Pは、
P=Σp {min(システムが出力した翻訳結果中にある代名詞pの個数, 参照訳による正解の翻訳結果中にある代名詞pの個数)} / Σp { (システムが出力した翻訳結果中にある代名詞pの個数)}
で求められ、
すべての代名詞に対する再現率Rは、
R=Σp {min(システムが出力した翻訳結果中にある代名詞pの個数, 参照訳による正解の翻訳結果中にある代名詞pの個数)} /Σp { (参照訳による正解の翻訳結果中にある代名詞pの個数)}
で求められ、
すべての代名詞に対するF値、Fは、
F = 2 * P * R / (P + R)
で求められる。
次に第2の実施の形態について説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
第2の実施の形態では、第1の実施の形態である翻訳結果評価装置を組み込んだ翻訳パラメータ最適化装置という点が第1の実施の形態とは異なる。
図9に示すように、第2の実施の形態の翻訳パラメータ最適化装置50は、入力部52と、コンピュータ54と、を備えている。
入力部52は、原文テキスト及び参照訳を自然言語の形態でコンピュータ54に入力する。入力部52としては、ユーザによって操作されるキーボート、インターネット等のネットワークを介して翻訳パラメータ最適化装置50と接続可能なユーザの端末、または翻訳パラメータ最適化装置50とユーザの端末とを中継するネットワークサーバ等が挙げられる。原文テキストは、翻訳元言語の文字列であり、参照訳は、当該翻訳元言語の文字列を人手等により翻訳した正解翻訳としての目標言語の文字列(テキスト)である。
コンピュータ54をハードウェアとソフトウエアとに基づいて定まる機能実現手段毎に分割した機能ブロックで説明すると、図9に示すように、入力部52により入力された原文テキストを記憶する原文テキスト記憶部62と、統計的翻訳モデルに基づいて原文テキストを機械翻訳する統計的機械翻訳部56と、第1の実施の形態の翻訳結果評価装置と同様の構成である翻訳品質自動評価部60と、翻訳品質の品質スコアが最も高くなるように、統計的翻訳モデルのモデルパラメータを最適化する翻訳パラメータ最適化部58と、を含んだ構成で表すことができる。
統計的機械翻訳部56は、原文テキスト記憶部62に記憶されている複数の原文テキストの各々について、統計的翻訳モデルに基づいて翻訳処理を行い、システム翻訳結果として目標言語の文字列を出力する。なお、翻訳処理については、従来既知の手法を用いればよいため、詳細な説明を省略する。また、翻訳品質向上処理ルーチンが行われる前には、統計的翻訳モデルにデフォルトのモデルパラメータが設定されている。
翻訳品質自動評価部60は、第1の実施の形態の翻訳結果評価装置20のコンピュータ1と同様の構成であり、システム翻訳結果記憶部7、参照訳記憶部8、代名詞リスト9、単語分割部2、単語分割済みテキストテーブル3、代名詞F値計算部4、評価値テーブル5を備えている。翻訳品質自動評価部60は、統計的機械翻訳部56から出力された、各原文テキストについてシステム翻訳結果の各々について、各代名詞のF値を算出する。また、翻訳品質自動評価部60は、統計的機械翻訳部56から出力された、各原文テキストについてシステム翻訳結果の各々について、当該原文テキストに対する参照訳(人手で作成した正解訳)とシステム翻訳結果との間のNグラム(通常はN=1〜4)が一致した数を計算した上で、それらの幾何平均を取り、参照訳の長さの影響を加味した補正を行って、BLEU値を算出する。
翻訳品質自動評価部60は、各原文テキストについてシステム翻訳結果の各々について、代名詞毎に、当該代名詞について算出したF値とBLEU値をある重み付けで線形和を取ったものを、品質スコアとして算出する。
翻訳パラメータ最適化部58は、翻訳品質自動評価部60で算出された翻訳品質の品質スコアが最も高くなるように、統計的翻訳モデルのモデルパラメータを最適化して、統計的機械翻訳部56のモデルパラメータを更新する。
次に、図10を参照して、第2の実施の形態の翻訳パラメータ最適化装置50のコンピュータ54で実行される翻訳品質向上処理ルーチンについて説明する。
ステップS150で、原文テキスト記憶部62に記憶されている複数の原文テキスト、参照訳記憶部8に記憶されている複数の参照訳、及び代名詞リスト記憶部9に記憶されている代名詞リストを取得する。
ステップS152で、取得した原文テキストそれぞれについて統計的翻訳モデルに基づいて翻訳処理を行い、システム翻訳結果を出力する。
ステップS154で、システム翻訳結果それぞれについて翻訳品質の品質スコアを算出する。具体的には、代名詞毎に、当該代名詞について算出したF値とシステム翻訳結果及び参照訳に基づいて算出されるBLEU値とをある重み付けで線形和を取ったものを品質スコアとする。例えば、品質スコアは、α×代名詞F値+β×BLEU値(α+β=1)のように代名詞毎に算出される。
ステップS156で、各システム翻訳結果に対する品質スコアが高くなるように、統計的翻訳モデルのモデルパラメータを更新する。
ステップS158で、翻訳品質の品質スコアが収束したか判定する。品質スコアが収束した場合は、統計的翻訳モデルのモデルパラメータと判断して、処理を終了し、品質スコアが収束していない場合は、ステップS152へ移行する。
以上、第2の実施の形態の翻訳パラメータ最適化装置50によれば、第1の実施の形態の翻訳結果評価装置20を組み込んだ翻訳パラメータ最適化装置50により、代名詞の省略による翻訳品質低下も考慮して、翻訳品質の高い翻訳結果が得られる翻訳パラメータ最適化装置を構成することができる。また、翻訳品質の品質スコアが収束するまで繰り返すことによって、翻訳品質の高い統計的機械翻訳装置を得られる効果がある。
なお、上記の実施の形態では、F値を代名詞毎に算出する場合を例に説明したが、これに限定されるものではない。例えば、全ての代名詞に対するF値を算出し、全ての代名詞に対するF値とBLEU値との線形和を、品質スコアとして算出してもよい。また、BLEU値以外の評価値と、F値との線形和を品質スコアとして算出してもよい。
また、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上述の翻訳結果評価装置20及び、翻訳パラメータ最適化装置50は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。また、本実施の形態の翻訳結果評価装置20及び翻訳パラメータ最適化装置50の各部をハードウエアにより構成してもよい。また、ルールテンプレートや各種テーブルが記憶される記憶部としては、ハードディスク装置やファイルサーバ等に例示される記憶手段によって実現可能であり、翻訳結果評価装置20内部及び翻訳パラメータ最適化装置50に記憶部を設けてもよいし、外部装置に設けてもよい。
1 コンピュータ
2 単語分割部
3 単語分割済みテキストテーブル
4 代名詞F値計算部
5 評価値テーブル
6 出力部
7 システム翻訳結果記憶部
8 参照訳記憶部
9 代名詞リスト記憶部
10 入力部
20 翻訳結果評価装置
50 翻訳パラメータ最適化装置
52 入力部
54 コンピュータ
56 統計的機械翻訳部
58 翻訳パラメータ最適化部
60 翻訳品質自動評価部
62 原文テキスト記憶部

Claims (7)

  1. 翻訳元言語の文字列を機械翻訳した目標言語の文字列である機械翻訳文字列、及び前記翻訳元言語の文字列を正しく翻訳した前記目標言語の文字列である参照訳文字列の各々を単語単位に分割する分割手段と、
    前記分割手段による前記機械翻訳文字列の分割結果に基づいて、予め求められた目標言語の代名詞リストに含まれる各代名詞の出現数をカウントすると共に、前記分割手段による前記参照訳文字列の分割結果に基づいて、前記代名詞リストに含まれる各代名詞の出現数をカウントする代名詞カウント手段と、
    前記代名詞カウント手段によりカウントされた前記機械翻訳文字列における各代名詞の出現数及び前記参照訳文字列における各代名詞の出現数に基づいて、代名詞に対する再現率、及び代名詞に対する適合率を算出し、前記算出した再現率及び適合率に基づいて、代名詞に対するF値を、品質スコアとして算出する算出手段と、
    を含む機械翻訳結果評価装置。
  2. 前記算出手段は、全ての代名詞に対する再現率、及び全ての代名詞に対する適合率を算出し、前記算出した再現率及び適合率に基づいて、全ての代名詞に対するF値を、品質スコアとして算出する請求項1記載の機械翻訳結果評価装置。
  3. 前記算出手段は、前記代名詞に対するF値を算出すると共に、前記分割手段による前記機械翻訳文字列の分割結果と前記参照訳文字列の分割結果とに基づいて、BLEU値を算出し、前記算出した前記代名詞に対するF値とBLEU値との線形和を、品質スコアとして算出する、請求項1記載の機械翻訳結果評価装置。
  4. 請求項1〜請求項3の何れか1項記載の機械翻訳結果評価装置と、
    翻訳モデルに基づいて、翻訳元言語の文字列を目標言語の文字列に翻訳する機械翻訳手段と、
    前記翻訳モデルのモデルパラメータを更新する更新手段と、
    前記機械翻訳手段によって翻訳された前記目標言語の文字列について前記機械翻訳結果装置によって算出された前記品質スコアが最も高くなるように、前記翻訳モデルのモデルパラメータが最適化されるまで、前記機械翻訳手段による翻訳、及び前記更新手段による更新を繰り返すパラメータ最適化手段と、
    を含む翻訳パラメータ最適化装置。
  5. 分割手段、代名詞カウント手段、及び算出手段を含む機械翻訳結果評価装置における機械翻訳結果評価方法であって、
    前記機械翻訳結果評価装置は、
    前記分割手段によって、翻訳元言語の文字列を機械翻訳した目標言語の文字列である機械翻訳文字列、及び前記翻訳元言語の文字列を正しく翻訳した前記目標言語の文字列である参照訳文字列の各々を単語単位に分割するステップと、
    前記分割手段による前記機械翻訳文字列の分割結果に基づいて、予め求められた目標言語の代名詞リストに含まれる各代名詞の出現数をカウントすると共に、前記分割手段による前記参照訳文字列の分割結果に基づいて、前記代名詞リストに含まれる各代名詞の出現数をカウントするステップと、
    前記代名詞カウント手段によりカウントされた前記機械翻訳文字列における各代名詞の出現数及び前記参照訳文字列における各代名詞の出現数に基づいて、代名詞に対する再現率、及び代名詞に対する適合率を算出し、前記算出した再現率及び適合率に基づいて、代名詞に対するF値を、品質スコアとして算出するステップと、
    を含んで実行することを特徴とする機械翻訳結果評価方法。
  6. 前記算出手段によって算出するステップは、全ての代名詞に対する再現率、及び全ての代名詞に対する適合率を算出し、前記算出した再現率及び適合率に基づいて、全ての代名詞に対するF値を、品質スコアとして算出する請求項5記載の機械翻訳結果評価方法。
  7. コンピュータを、
    翻訳元言語の文字列を機械翻訳した目標言語の文字列である機械翻訳文字列、及び前記翻訳元言語の文字列を正しく翻訳した前記目標言語の文字列である参照訳文字列の各々を単語単位に分割する分割手段、
    前記分割手段による前記機械翻訳文字列の分割結果に基づいて、予め求められた目標言語の代名詞リストに含まれる各代名詞の出現数をカウントすると共に、前記分割手段による前記参照訳文字列の分割結果に基づいて、前記代名詞リストに含まれる各代名詞の出現数をカウントする代名詞カウント手段、及び
    前記代名詞カウント手段によりカウントされた前記機械翻訳文字列における各代名詞の出現数及び前記参照訳文字列における各代名詞の出現数に基づいて、代名詞に対する再現率、及び代名詞に対する適合率を算出し、前記算出した再現率及び適合率に基づいて、代名詞に対するF値を、品質スコアとして算出する算出手段
    として機能させるためのプログラム。
JP2012150929A 2012-07-04 2012-07-04 機械翻訳結果評価装置、翻訳パラメータ最適化装置、方法、及びプログラム Active JP5710551B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012150929A JP5710551B2 (ja) 2012-07-04 2012-07-04 機械翻訳結果評価装置、翻訳パラメータ最適化装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012150929A JP5710551B2 (ja) 2012-07-04 2012-07-04 機械翻訳結果評価装置、翻訳パラメータ最適化装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014013514A true JP2014013514A (ja) 2014-01-23
JP5710551B2 JP5710551B2 (ja) 2015-04-30

Family

ID=50109153

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012150929A Active JP5710551B2 (ja) 2012-07-04 2012-07-04 機械翻訳結果評価装置、翻訳パラメータ最適化装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5710551B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145315A (zh) * 2018-09-05 2019-01-04 腾讯科技(深圳)有限公司 文本翻译方法、装置、存储介质和计算机设备
CN110020440A (zh) * 2018-01-09 2019-07-16 深圳市腾讯计算机系统有限公司 一种机器翻译方法、装置、服务器及存储介质
CN112749316A (zh) * 2019-10-29 2021-05-04 阿里巴巴集团控股有限公司 翻译质量的确定方法、装置、存储介质和处理器

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200701365001; 安田圭志 他1名: '機械翻訳の研究・開発における翻訳自動評価技術とその応用' 人工知能学会誌 第23巻第1号, 20080101, 2-9頁, 社団法人人工知能学会 *
JPN6015003465; 安田圭志 他1名: '機械翻訳の研究・開発における翻訳自動評価技術とその応用' 人工知能学会誌 第23巻第1号, 20080101, 2-9頁, 社団法人人工知能学会 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020440A (zh) * 2018-01-09 2019-07-16 深圳市腾讯计算机系统有限公司 一种机器翻译方法、装置、服务器及存储介质
CN110020440B (zh) * 2018-01-09 2023-05-23 深圳市腾讯计算机系统有限公司 一种机器翻译方法、装置、服务器及存储介质
CN109145315A (zh) * 2018-09-05 2019-01-04 腾讯科技(深圳)有限公司 文本翻译方法、装置、存储介质和计算机设备
CN111368565A (zh) * 2018-09-05 2020-07-03 腾讯科技(深圳)有限公司 文本翻译方法、装置、存储介质和计算机设备
CN109145315B (zh) * 2018-09-05 2022-03-18 腾讯科技(深圳)有限公司 文本翻译方法、装置、存储介质和计算机设备
CN112749316A (zh) * 2019-10-29 2021-05-04 阿里巴巴集团控股有限公司 翻译质量的确定方法、装置、存储介质和处理器

Also Published As

Publication number Publication date
JP5710551B2 (ja) 2015-04-30

Similar Documents

Publication Publication Date Title
Ling et al. Latent predictor networks for code generation
US10061769B2 (en) Machine translation method for performing translation between languages
US9367541B1 (en) Terminological adaptation of statistical machine translation system through automatic generation of phrasal contexts for bilingual terms
JP5774751B2 (ja) ツリーレット翻訳対の抽出
US8660836B2 (en) Optimization of natural language processing system based on conditional output quality at risk
US10789431B2 (en) Method and system of translating a source sentence in a first language into a target sentence in a second language
EP3508992A1 (en) Error correction method and device for search term
CN105068997B (zh) 平行语料的构建方法及装置
US20140149102A1 (en) Personalized machine translation via online adaptation
CN109062912B (zh) 一种翻译质量评价方法及装置
CA2971884C (en) Method and device for general machine translation engine-oriented individualized translation
US9442922B2 (en) System and method for incrementally updating a reordering model for a statistical machine translation system
JP2008216341A (ja) 誤り傾向学習音声認識装置及びコンピュータプログラム
JP2006134311A (ja) ツリーレット翻訳対の抽出
US20130054224A1 (en) Method and system for enhancing text alignment between a source language and a target language during statistical machine translation
US20220058349A1 (en) Data processing method, device, and storage medium
Blain et al. Incremental adaptation using translation informations and post-editing analysis
JP5710551B2 (ja) 機械翻訳結果評価装置、翻訳パラメータ最適化装置、方法、及びプログラム
CN104516870A (zh) 一种译文检查方法及其系统
JP2015032307A (ja) ドメイン固有のテキストに対する機械翻訳サービスによる専門用語検証システムとその方法
JP6478382B2 (ja) 翻訳装置
JP5791097B2 (ja) 対訳フレーズ学習装置、フレーズベース統計的機械翻訳装置、対訳フレーズ学習方法、および対訳フレーズ生産方法
Formiga Fanals et al. Dealing with input noise in statistical machine translation
JP5734917B2 (ja) 並べ替えモデル学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム
KR101626386B1 (ko) 요소화 언어모델을 이용한 번역 오류 후처리 보정 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140723

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150304

R150 Certificate of patent or registration of utility model

Ref document number: 5710551

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150