JP2017097882A

JP2017097882A - 機械翻訳評価方法および装置、並びに機械翻訳方法および装置

Info

Publication number: JP2017097882A
Application number: JP2016227929A
Authority: JP
Inventors: 王暁利; Xiaoli Wang; 張永生; Yongsheng Zhang
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2015-11-24
Filing date: 2016-11-24
Publication date: 2017-06-01
Also published as: CN106776583A

Abstract

【課題】信頼性や汎用性に優れたより正確な機械翻訳評価ができる言語横断質問応答システム用の機械翻訳評価方法および装置、並びに機械翻訳方法および装置を提供する。【解決手段】機械翻訳評価方法は、源言語の質問文および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれに意味役割付与を行うステップと、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するステップと、計算された各アライメント確率に基づいて、目標言語の質問文の翻訳品質を確定するステップと、を含む。より正確な機械翻訳評価を提供することにより、言語横断質問応答システムの性能が向上する。【選択図】図１

Description

本発明は主として、機械翻訳に関し、具体的に、言語横断質問応答システム用の機械翻訳評価方法および装置、並びに機械翻訳方法および装置に関する。

言語横断質問応答システム（Ｃｒｏｓｓ-ｌａｎｇｕａｇｅｑｕｅｓｔｉｏｎａｎｓｗｅｒｉｎｇｓｙｓｔｅｍ）は、言語横断情報検索技術が自動質問応答システムに応用されてきたものであり、単言語対応の自動質問応答システムに比べて、言語横断、情報検索などのより複雑な処理技術を要する。言語横断質問応答システムは、入力として利用者から源言語で質問した問題を受け付け、この問題の最適な解答を他の言語のコーパスから自動的に探し出すとともに、この解答を源言語の形式で利用者に返す。システムが受け付けた問題の言語とコーパスの言語が異なるため、言語横断検索を実行するためには、機械翻訳により言語の変換を行う必要がある。この言語の変換に対して、２つの異なる解決策がある。その１つとして、源言語の問題をコーパスと同じ言語に変換（翻訳）してから、コーパスの言語向けの質問応答システムを用いて解答を得る。もう１つとして、機械翻訳によりコーパス全てを源言語と同じ言語に変換してから、変換されたコーパスから解答を得る。いずれにしても、機械翻訳の品質が質問応答システムの性能を大きく影響することが分かる。

上述した２番目の解決策は、コーパス全てを源言語と同じ言語に変換することで処理量が多いので、現在当分野の研究は１番目の解決策により集中している。具体的に、現在に至って、源言語の問題をコーパスと同じ言語に変換する機械翻訳に係る具体的な技術が多数提案されている。これに応じて、翻訳結果を評価して翻訳品質がより高い翻訳を選ぶために、翻訳品質を確定する様々な研究が行われてきた。しかし、現在の様々な翻訳評価方法は、信頼性や汎用性に優れているとは言い難かった。例えば、特許文献１には、目標言語クエリログでの各翻訳候補の発生頻度を確定し、発生頻度の最も高い翻訳候補を翻訳品質の最も高い翻訳として選択する言語横断クエリサジェスチョンの評価方法が開示された。しかし、この方法によると、翻訳候補から源言語によるある単語の訳漏れが発生したときに、その単語が目標言語クエリログで発生する頻度がより高くなり、また、ある特定の単語の誤訳が発生したときにも、より高い発生頻度をもたらすため、間違った翻訳評価を招く。また、例えば、特許文献２には、源言語と目標言語翻訳からの逆翻訳結果との距離によって翻訳信頼度を評価する方法が開示された。しかし、当該方法には、源言語から目標言語への翻訳および目標言語から源言語への逆翻訳という２つの翻訳モデルが必要であり、また、目標言語から源言語への逆翻訳の品質も評価の信頼性に影響を及ばす。

ＵＳ２０１２０３３０９９０Ａ１ＷＯ２０１３／０１４８７７Ａ１

少なくとも前記問題を鑑み、本発明を提案する。

本発明の一実施例で提供される機械翻訳評価方法は、言語横断質問応答システム用の機械翻訳評価方法であって、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれ意味役割付与を行うステップと、源言語の質問文において意味役割が付与された項毎と目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するステップと、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するステップと、を含む機械翻訳評価方法である。

本発明の他の実施例で提供される機械翻訳方法は、言語横断質問応答システム用の機械翻訳方法であって、翻訳しようとする第１言語の内容を受け付け、該第１言語の内容のタイプを判断するステップと、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するステップと、前記複数の翻訳エンジンを用いてそれぞれに前記第１言語の内容を翻訳して、第２言語の翻訳候補を複数得るステップと、第２言語の翻訳候補毎の翻訳品質を採点して、得点の一番高い翻訳候補を前記第１言語の内容の翻訳として選択するステップと、を含む機械翻訳方法である。

本発明の他の実施例で提供される機械翻訳評価装置は、言語横断質問応答システム用の機械翻訳評価装置であって、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれ意味役割付与を行うように配置された付与ユニットと、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するように配置されたアライメントユニットと、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するように配置された評価ユニットと、を備える機械翻訳評価装置である。

本発明のさらなる他の実施例で提供される機械翻訳装置は、言語横断質問応答システム用の機械翻訳装置であって、翻訳しようとする第１言語の内容を受け付け、該第１言語の内容のタイプを判断するように配置された判断ユニットと、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するように配置された選択ユニットと、前記複数の翻訳エンジンを用いてそれぞれ前記第１言語の内容を翻訳して、第２言語の翻訳候補を複数得るように配置された翻訳ユニットと、第２言語の翻訳候補毎の翻訳品質を採点して、得点の一番高い翻訳候補を前記第１言語の内容の翻訳として選択するように配置された確定ユニットと、を備える機械翻訳装置である。

本発明の実施例に係る機械翻訳評価技術は、意味役割付与を用い、項のアライメント確率に基づく新たな機械翻訳評価方法を提案し、当該方法によって、より正確な機械翻訳評価を提供でき、さらに言語横断質問応答システムの性能を向上する。本発明の実施例に係る機械翻訳技術は、異なるタイプの翻訳すべき内容に応じて当該タイプに適した異なる翻訳エンジンを選択し、各タイプの翻訳内容を複数の翻訳エンジンで翻訳することによって、いずれタイプの翻訳すべき内容に対してもより優れる翻訳結果を提供できる。

本発明の実施例について、図面を参照して詳細に説明することにより、本発明の上述並びに他の目的、特徴、及びメリットがより明確になる。図面は、本発明の実施例に対するより一層の理解を深め且つ明細書の一部を構成しており、本発明の実施例とともに本発明を説明する役目を担ったが、本発明はこれらに限定するものではない。図面において、同じ符号は一貫して同じユニットやステップを表す。
図１は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法のフローチャートを概略的に示す。図２は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法のフローチャートを例示する。図３は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置の機能構成を示すブロック図である。図４は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置の機能構成を示すブロック図である。図５は、本発明の実施例を実現するための、言語横断質問応答システム用の機械翻訳評価装置及び機械翻訳装置に用いられる計算装置の概略的なブロック図を示す。

以下、本発明の目的、技術手段、およびメリットをより明白にするため、本発明の例示的な実施例について図面を参照しながら詳細に説明する。説明された実施例が本発明の一部の実施例のみであり、本発明の全ての実施例ではないことは明らかであろう。理解すべきなのは、本発明はここで説明された例示的な実施例に限定されない。当業者には、本開示の説明による実施例に基づき、容易に成し遂げることができた他の実施例の全ては本発明の思想から逸脱しない。

まず、本発明の実施例に係る機械翻訳評価技術の基本思想について簡単に説明する。

本発明者は、異なるタイプの翻訳すべき内容に対して翻訳品質の評価基準が変わることを認識した。言語横断質問応答システムにおける源言語の質問文の翻訳を例にすると、一般的な翻訳品質評価基準とは異なり、源言語の質問文の翻訳結果における各要素の位置が言語横断質問応答システムの性能に大きい影響を及ばしていないため、翻訳品質を評価する基準とするべきではないことが、多くの研究を経て本発明者より発見された。例えば、英語を源言語とし、中国語を目標言語としたとき（以下、別に説明がない限り、いずれもこのように仮定する）、英語の質問である「ＩｓｉｔｃｏｌｄａｔｔｈｅｎｉｇｈｔｏｆｅａｒｌｙＤｅｃｅｍｂｅｒ，ＨＫ？」に関して、中国語の訳文である「是不是很冷，在十二月初，香港」における、各要素の位置は通常の語順に合致しないが、英語の質問の本来意味を正確に表しているため、翻訳品質が良くないとは言えない。また、翻訳結果の流暢さも、言語横断質問システムの性能に影響が大きくないため、翻訳品質を評価する標準とするべきではない。例えば、英語の質問である「ＷｈａｔｗｏｕｌｄｂｅｔｈｅｈｉｇｈｌｉｇｈｔｓａｎｄｔｈｅｂｅｓｔｔｈｉｎｇｓｔｏｓｅｅｉｎＳｈａｎｇｈａｉＥｘｐｏ２０１０？」に関して、「什麼是亮点，並看到在上海２０１０年世博会最好的東西」と、「在上海世博会上看到的２０１０個亮点和最好的東西是什麼」との２つの翻訳候補がある。そのうち、２番目の翻訳候補は、より流暢にはなったが、英語の質問の本来意味とは合致しない。これに対して、１番目の翻訳候補は、それほど流暢には出なかったが、本来意味と大体合致しているため、その翻訳品質が良くないとは言えない。本発明者は、実際に、意味役割がある程度で文の意味を表すことができるため、翻訳品質を評価する１つの重要な指標になるべきだという知見を得た上で、後述する、意味役割付与を利用し項のアライメント確率に基づく新たな機械翻訳評価方法を提案する。

意味役割付与は、表層意味解析（ｓｈａｌｌｏｗｓｅｍａｎｔｉｃｐａｒｓｉｎｇ）技術の１種であり、センテンスを単位として、センテンスに含まれる意味情報を深く分析することではなく、センテンスにおける述語―項構造のみを分析する。意味役割付与のタスクは、具体的に、センテンス中の述語を中心にして、センテンスにおける各項と述語との関係を研究するとともに、意味役割付与によって項と述語との関係を表す。例えば、意味役割付与について、幾つかの具体例を下で示す。

〔具体例１〕

〔具体例２〕
上海充分発揮地縁優勢
[ARG0] [ARGM-ADV] [Pred] [ARG1]

意味役割は、中心意味役割と付加意味役割に分けられる。中心意味役割は、ＡＲＧ＋数字で表しており、一般に、動作主を表すＡＲＧ０と、受動者を表すＡＲＧ１と、動作の道具、手段などを表すＡＲＧ２と、起点を表すＡＲＧ３と、終点を表すＡＲＧ４との５種類がある。付加意味役割は、ＡＧＲＭ−で表しており、動作の時間、場所など、例えば、前記の具体例１における「ｉｎ１９８９」を表す。

前述したように、本発明者は、意味役割がある程度で文の意味を表すことができることを認識した。２言語パラレル文対は相互に翻訳になるため、意味上では等価になるべきである。これが意味役割付与に反映されると、２つの対応するセンテンスは一致する述語―項構造を有するはずである。例えば、下記の具体例には、一対の二言語パラレル文の間における項のアライメント関係が示され、この２つのセンテンスが一致する述語―項構造を有することが分かる。

本発明の実施例では、前記知見に基づき、二言語パラレル文間の述語−項一致性、即ち項のアライメント関係に基づいて翻訳品質を確定する。より詳しく、機械翻訳によって得られた対応する目標言語の質問文と、源言語の質問文との述語−項一致性が高いと、あるいは、この２つの文の間における項のアライメント程度が高いと、目標言語の質問文の翻訳品質が高いと判断される。

以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法について、図１を参照しながら詳細に説明する。図１は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法のフローチャートを概略的に示す。

ステップＳ１１０において、図１に示すように、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文それぞれに対して意味役割付与を行う。

現在、自然言語処理の分野では意味役割付与に対する多くの研究が行われ、利用可能な多数の意味役割付与方法が存在し、かつ意味役割付与の規則もよく充実されている。該ステップでは、任意の既知の意味役割付与方法を用いて、源言語の質問文に対して意味役割付与を行うとともに、機械翻訳によって得られた対応する目標言語の質問文（つまり、翻訳評価をすべき翻訳候補）に対して意味役割付与を行う。ここで詳細な説明は省略する。

ステップＳ１２０において、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算する。

該ステップでは、ステップＳ１１０による意味役割付与結果に基づき、源言語の質問文における各項と目標言語の質問文における各項とのアライメント確率を計算する。より詳しく、該ステップでは、当該２つの文の間における項のアライメント関係を得て、さらに目標言語の質問文の翻訳品質を評価するために、源言語の質問文における項毎に対して、目標言語の質問文における項毎とのアライメント確率を計算する。

各項は幾つかの単語で構成されたものであり、源言語で１つの項に含まれる単語と目標言語の項に含まれる単語とが大部アライメントされると、当該２つの項もアライメントされる可能性が高い。そのため、１つの選択肢として、源言語の質問文における１つの項と目標言語の質問文における１つの項との項のアライメント確率を計算するときに、当該２つの項に対して単語アライメントを行い、単語アライメントの結果によって当該２つの項のアライメント確率を確定できる。

所謂単語アライメントとは、２言語パラレル文において相互翻訳関係がある単語の間で対応関係を確立することである。単語アライメントは自然言語処理での慣用技術であり、分類方法によって、監視的（supervised）および無監視的（unsupervised）の単語アライメントや、発見的（heuristic）および統計的（statistic）の単語アライメントなどに分けられる。該ステップでは、任意の適当な単語アライメント方法を採用し、源言語の質問文における１つの項と目標言語の質問文における１つの項に対して単語アライメント処理を行い、さらに、単語アライメント処理の結果に応じて当該２つの項のアライメント確率を確定できる。具体的に、２つの項の間で、アライメントされた単語が多いほど、当該２つの項のアライメント確率が大きい。

他の選択肢として、主要語のアライメント結果および項の間の距離によって項のアライメント確率を確定してもよい。主要語とは、修飾フレーズにおいて、修飾語によって修飾や限定される中心成分である。１つの項の主要語は、当該項内の他の単語よりも代表性がある場合が多い。そのため、２つの項の主要語がアライメントされる場合、他にアライメントされた単語が少ないとしても、当該２つの項がアライメントされる可能性が高い。一方、２つのアライメントされた項の意味役割タグが同じ場合が多く、同じでないとしても、当該２つの項の間の距離がかなり近いことが、数多い統計で判明された。中国語センテンスにおける項ＡＲＧ０を例にすると、多い統計から分かるように、一般的に、当該中国語センテンスにおけるＡＲＧ０が英語センテンスにおけるＡＲＧ０とアライメントされる場合、２つの項の間の距離はゼロであり、当該中国語センテンスにおけるＡＲＧ０と英語センテンスにおけるＡＲＧ１とのアライメントが大幅に減少された場合、２つの項の間の距離は１であり、当該中国語センテンスにおけるＡＲＧ０と英語センテンスにおけるＡＲＧ２とがほとんどアライメントされない場合、２つの項の間の距離は２である。即ち、２つの項の間の距離が近いほど、当該２つの項のアライメント確率が高く、２つの項の間の距離が遠いほど、当該２つの項のアライメント確率が低い。

従って、上述したように、源言語の質問文における１つの項と目標言語の質問文における１つの項に対して、当該２つの項の主要語の単語アライメント結果（即ち、アライメントされるか否か）および当該２つの項の間の距離に基づいて、当該２つの項のアライメント確率を確定してもよい。例えば、具体的な状況に応じて、主要語のアライメント結果および項の間の距離にそれぞれ適切な加重値を設定し、両者の加重和を算出して２つの項のアライメント確率を確定できる。

以上、源言語の質問文における１つの項と目標言語の質問文における１つの項との項のアライメント確率を計算する方法を例示した。もちろん、これは例示的な説明であり、本発明に対して何ら制限的な意味を有しない。具体的な状況に応じて、他の手段で２つの項の間のアライメント確率を計算してもよい。例えば、２つの項の間の単語アライメント結果、主要語のアライメント結果、および項の間の距離を同時に考えて、項のアライメント確率を確定してもよい。

図１に戻り、ステップＳ１３０において、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定する。

該ステップでは、様々な方法で、ステップＳ１２０において計算された各項のアライメント確率を利用して目標言語の質問文の翻訳品質を確定できる。

各アライメント確率のうち、最大アライメント確率が翻訳品質に響く１つの要因となることを統計から分かったため、選択肢として、計算された各アライメント確率のうち最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。そして、最大アライメント確率が大きいほど、目標言語の質問文の翻訳品質が優れる。

また、各アライメント確率の平均アライメント確率も翻訳品質に大きい影響を与えることを統計から分かったため、計算された各アライメント確率の平均アライメント確率、および最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。また、平均アライメント確率および最大アライメント確率を除いて、源言語の質問文の長さや、目標言語の質問文の長さや、目標言語の質問文における述語の数などの他の関連する影響因子をさらに併せて、目標言語の質問文の翻訳品質を確定してもよい。１つの具体例として、前記各影響因子のそれぞれに適切な加重値を設定し各影響因子の加重和を算出することで、目標言語の質問文の翻訳品質を確定する。

選択肢として、前記各影響因子を用いて数理モデルを立てることで、目標言語の質問文の翻訳品質を確定してもよい。例えば、式（１）に示すように、予めトレーニングされた多項式ロジスティック回帰モデルを利用して目標言語の質問文の翻訳品質を採点することで、翻訳品質を評価する。

そのうち、Ｐ（Ｙ＝ｋ｜ｘ）はモデルの各出力値（即ち、各翻訳品質の得点）の論理的な可能性を表し、ｘはモデルの特徴値であり、Ｗｋは各特徴値の加重値であり、その具体値はモデルのトレーニング過程でトレーニングによって求められ、Ｋは特徴値の数であり、ｋ＊は最大な論理的な可能性を有する出力値、即ち可能性が最も高い翻訳品質の得点である。前述したように、各アライメント確率のうち、最大アライメント確率が１つの要因となるため、当該モデルの特徴値は最大アライメント確率とされる。また、当該モデルの特徴値は、例えば、平均アライメント確率、源言語の質問文の長さ、目標言語の質問文の長さ、目標言語の質問文における述語の数などのような他の関連因子を含んでもよい。

当該多項式ロジスティック回帰モデルは、翻訳品質を評価する前にＳＡＳ、ＳＰＳＳなどのトレーニング方法によって予めトレーニングによって求められる。モデルトレーニングは数理統計分野の慣用技術であり、ここで詳細な説明を省略する。なお、トレーニング集合における各目標言語の質問文を用いてモデルトレーニングを行うときに、様々な規則に基づいて手動で当該各目標言語の質問文を採点できる。例えば、トレーニング集合における各目標言語の質問文によって言語横断質問応答システムで探し出した解答の正確性に基づいて、当該各目標言語の質問文を手動で採点できる。表は、採点規則の具体例の一つを示す。

前記多項式ロジスティック回帰モデルは、ただ１つの選択肢としての具体例であり、本発明を限定するものではない。ＳＶＭ（サポートベクターマシン）、非線形モデル、ニューラルネットワークなどのような他の適当なモデルを用いて目標言語の質問文の翻訳品質を採点してもよい。

以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法について詳細に説明した。本発明者は、既にテスト集合を用いて検証を行った。検証結果によると、該機械翻訳評価方法を用いて源言語の質問文の翻訳品質を評価した正確率は、約９０％に達する。これから分かるように、本発明の実施例に係る機械翻訳方法は、より正確な機械翻訳評価を提供でき、さらに言語横断質問応答システムの性能を向上させる。以下、前述した機械翻訳評価方法が適用される、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法について説明する。図２は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法のフローチャートを例示する。

図２に示すように、ステップＳ２１０において、翻訳しようとする第１言語の内容を受け付けて、該第１言語の内容のタイプを判断する。

言語横断質問応答システムにおいて、翻訳すべき内容は、ユーザに入力された源言語の質問文と、応答システムにて検索された、源言語と異なる他の言語（以下、目標言語と略称する）の質問結果と、源言語に翻訳すべき目標言語のコーパスとを少なくとも含む。

前述したように、本発明者は、異なるタイプの翻訳すべき内容によって、翻訳品質の評価基準が変わることを認識した。そのため、該ステップで翻訳しようとする第１言語の内容のタイプを判断することで、後の処理でそのタイプに適した評価基準および翻訳ツールを選べる。

ステップＳ２２０において、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択する。

他の翻訳エンジンに比べて圧倒的に優れる翻訳エンジンはなく、他の翻訳方法に比べて圧倒的に優れる翻訳方法もない。この点は統計から知られている。そのため、該ステップでは、確定された第１言語の内容のタイプに対して、該タイプに適した複数の翻訳エンジンを選択する。そのうち、該タイプに適した前記複数の翻訳エンジンは予め確定されたものである。より詳しくは、ｇｏｏｇｌｅ、ｂｉｎｇ、ｂａｉｄｕなどの様々な翻訳エンジンを予め利用して該タイプに属する第１言語の内容を大量に翻訳しておくともに、既存の様々な評価モデルまたはマニュアル評価などの手段によって各翻訳エンジンの翻訳結果を評価（オフライン評価）することで、翻訳品質が良い幾つかのエンジンを該タイプに適した翻訳エンジンとして確定する。

ステップＳ２３０において、前記複数の翻訳エンジンをそれぞれ用いて前記第１言語の内容を翻訳して、複数の第２言語の翻訳候補を得る。

ステップＳ２４０において、第２言語の翻訳候補毎の翻訳品質を採点し、得点が一番高い翻訳候補を前記第１言語の内容の翻訳として選択する。

該ステップでは、任意の適当な翻訳品質評価方法を用いて、ステップＳ２３０で得られた第２言語の翻訳候補毎の翻訳品質を採点（オンライン評価）することが可能であり、本実施例は、これに対して限定がない。

なお、前記第１言語の内容のタイプが質問文である場合、前に図１を参照しながら説明した本発明の実施例に係る機械翻訳評価方法によって、第２言語の翻訳候補毎の翻訳品質を採点する。具体的に、評価すべき１つの第２言語の翻訳候補について、第１言語の内容、および当該第２言語の翻訳候補に対してそれぞれに意味役割付与を行ってから、第１言語の内容における意味役割が付与された項毎と当該第２言語の翻訳候補における意味役割が付与された項毎とのアライメント確率を計算し、最後に計算された各アライメント確率に基づいて当該第２言語の翻訳候補の翻訳品質を採点できる。前記処理の具体的な操作は、前に図１を参照しながら説明した各ステップの操作と同じであるので、ここで重なる説明を省略する。

以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法を詳細に説明した。該実施例によれば、異なるタイプの翻訳すべき内容に対して、オフライン評価で予め確定された当該タイプに適した翻訳エンジンを選択し、複数の翻訳エンジンにてタイプ毎の翻訳内容を翻訳し、オンライン評価により得点が一番高い翻訳候補を最終の翻訳として選択する。これにより、様々なタイプの翻訳すべき内容のいずれに対しても、優れる翻訳結果の提供を確保できる。

以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置について、図３を参照しながら説明する。図３は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置の機能構成を示すブロック図である。図３に示すように、機械翻訳評価装置３００は、付与ユニット３１０と、アライメントユニット３２０と、評価ユニット３３０を備える。前記各ユニットの具体的な機能や操作は、基本的に前に図１を説明したとおりであるので、重なる説明を避けるため、以下、同じ部分に対する詳細な説明を省略ながら、前記装置を簡単に説明する。

付与ユニット３１０は、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれ意味役割付与を行うように配置される。具体的に、付与ユニット３１０は、任意な既知の意味役割付与方法を用いて源言語の質問文に対して意味役割付与を行い、機械翻訳によって得られた対応する目標言語の質問文に対して意味役割付与を行う。ここで重なる説明を省略する。

アライメントユニット３２０は、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するように配置される。具体的に、２つの文の間の項のアライメント関係を得て、さらに目標言語の質問文の翻訳品質を評価するために、アライメントユニット３２０は、源言語の質問文における項毎に対して、目標言語の質問文における項毎とのアライメント確率を計算する。

アライメントユニット３２０は、様々な適当な手段を用いて前記項のアライメント確率を計算できる。１つの選択肢として、源言語の質問文における１つの項と目標言語の質問文における１つの項との項のアライメント確率を計算するときに、当該２つの項に対して単語アライメントを行い、単語アライメントの結果によって当該２つの項のアライメント確率を確定できる。そのうち、２つの項の間でアライメントされた単語が多いほど、当該２つの項のアライメント確率が大きい。他の選択肢として、源言語の質問文における１つの項と目標言語の質問文における１つの項に対して、この２つの項における主要語の単語アライメント結果およびこの２つの項の間の距離によって、この２つの項のアライメント確率を確定してもよい。具体的に、具体的な状況に応じて、主要語のアライメント結果および項の間の距離にそれぞれ適切な加重値を設定し両者の加重和を算出して、２つの項のアライメント確率を確定できる。

評価ユニット３３０は、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するように配置される。評価ユニット３３０は、多様な手段でアライメントユニット３２０から算出された各項のアライメント確率を用いて、目標言語の質問文の翻訳品質を確定できる。

なお、評価ユニット３３０は、計算された各アライメント確率のうち最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。そのうち、最大アライメント確率が大きいほど、目標言語の質問文の翻訳品質が良い。

なお、評価ユニット３３０は、計算された各アライメント確率の平均アライメント確率および最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。また、評価ユニット３３０は、さらに、源言語の質問文の長さや、目標言語の質問文の長さや、目標言語の質問文における述語の数などの他の関連する影響因子を併せて、目標言語の質問文の翻訳品質を確定してもよい。１つの具体例として、評価ユニット３３０は、前記各影響因子にそれぞれ適切な加重値を設定し、各影響因子の加重和を算出して目標言語の質問文の翻訳品質を確定できる。

なお、評価ユニット３３０は、少なくとも最大アライメント確率を含む前記各影響因子を用いて数理モデルを立てることで、目標言語の質問文の翻訳品質を確定してもよい。例えば、前に示された式（１）によって、予めトレーニングされた多項式ロジスティック回帰モデルを利用して、目標言語の質問文の翻訳品質を採点して翻訳品質を評価できる。

当該多項式ロジスティック回帰モデルは、翻訳品質を評価する前に、ＳＡＳ、ＳＰＳＳなどのトレーニング方法によってトレーニングで予め求められる。そのうち、トレーニング集合における各目標言語の質問文を用いてモデルのトレーニングを行うときに、様々な規則に基づいて手動で当該各目標言語の質問文を採点できる。例えば、トレーニング集合における各目標言語の質問文によって言語横断質問応答システムで探し出した解答の正確性に基づいて、当該各目標言語の質問文を手動で採点できる。

前記多項式ロジスティック回帰モデルは、ただ１つの選択肢としての具体例であり、本発明を限定するものではない、ＳＶＭ（サポートベクターマシン）、非線形モデル、ニューラルネットワークなどのような他の適当なモデルを用いて目標言語の質問文の翻訳品質を採点してもよい。

以上で、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置について詳細に説明した。該装置は、より正確な機械翻訳評価を提供でき、さらに言語横断質問応答システムの性能を向上させる。

以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置について、図４を参照しながら説明する。図４は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置の機能構成を示すブロック図である。図４に示すように、機械翻訳装置４００は、判断ユニット４１０と、選択ユニット４２０と、翻訳ユニット４３０と、確定ユニット４４０とを備える。前記各ユニットの具体的な機能や操作は、基本的に、前に図２および図３で説明したのと同じであるので、重なる説明を避けるため、以下、同じ部分に対する詳細な説明を省略しながら、前記装置に対して簡単に説明する。

判断ユニット４１０は、翻訳しようとする第１言語の内容を受け付け、該第１言語の内容のタイプを判断するように配置される。前述したように、言語横断質問応答システムにおいて、翻訳すべき内容は、ユーザに入力された源言語の質問文と、応答システムにて検索された、源言語と異なる他の言語（以下、目標言語と略称する）の質問結果と、源言語に翻訳すべき目標言語のコーパスとを少なくとも含む。異なるタイプの翻訳すべき内容によって、翻訳品質の評価基準が変わるべきである。従って、判断ユニット４１０は、後の処理で翻訳しようとする第１言語の内容のタイプに適する評価基準および翻訳ツールを選べるために、翻訳しようとする第１言語の内容のタイプを判断する。

選択ユニット４２０は、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するように配置される。他の翻訳エンジンに比べて圧倒的に優れる翻訳エンジンはなく、他の翻訳方法に比べて圧倒的に優れる翻訳方法もない。この点は統計から知られている。そのため、選択ユニット４２０は、確定された第１言語の内容のタイプに対して、該タイプに適した複数の翻訳エンジンを選択する。そのうち、該タイプに適した前記複数の翻訳エンジンは予め確定されたものである。より詳しく、様々な翻訳エンジンを予め利用して該タイプに属する第１言語の内容を大量に翻訳しておくともに、既存の様々な評価モデルまたはマニュアル評価などの手段によって各翻訳エンジンの翻訳結果を評価（オフライン評価）することで、翻訳品質が良い幾つかのエンジンを該タイプに適した翻訳エンジンとして確定する。

翻訳ユニット４３０は、前記複数の翻訳エンジンを用いてそれぞれに前記第１言語の内容を翻訳して、第２言語の翻訳候補を複数得るように配置される。

確定ユニット４４０は、第２言語の翻訳候補毎の翻訳品質を採点して、得点が一番高い翻訳候補を前記第１言語の内容の翻訳として選択するように配置される。確定ユニット４４０は、任意の適当な翻訳品質評価方法を用いて、翻訳ユニット４３０によって得た第２言語の翻訳候補毎の翻訳品質を採点（オンライン評価）でき、本実施例はこれに対して限定がない。

なお、前記第１言語の内容のタイプが質問文である場合、確定ユニット４４０は、前に図３を参照しながら説明した機械翻訳評価装置を用いて、第２言語の翻訳候補毎の翻訳品質を採点できる。具体的に、確定ユニット４４０は、第１言語の内容および１つの第２言語の翻訳候補に対してそれぞれ意味役割付与を行うための付与ユニットと、第１言語の内容における意味役割が付与された項毎と、当該第２言語の翻訳候補における意味役割が付与された項毎とのアライメント確率を計算するためのアライメントユニットと、計算された各アライメント確率に基づいて、当該第２言語の翻訳候補の翻訳品質を採点するための評価ユニットとを備える。該確定ユニット４４０における各ユニットの機能や具体的な操作は、前に図３を参照しながら説明した機械翻訳評価装置と同じであるので、ここで重なる説明を省略する。

以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置を詳細に説明した。該実施例によれば、異なるタイプの翻訳すべき内容に対して、オフライン評価によって予め確定された当該タイプに適した翻訳エンジンを選択し、複数の翻訳エンジンにてタイプ毎の翻訳内容を翻訳し、オンライン評価により得点が一番高い翻訳候補を最終の翻訳として選択する。これにより、様々なタイプの翻訳すべき内容のいずれに対しても、優れる翻訳結果の提供を確保できる。

以下、本発明の実施例を実現するための、言語横断質問応答システム用の機械翻訳評価装置並びに機械翻訳装置に用いられる計算装置の概略的なブロック図について、図５を参照しながら説明する。

図５に示すように、計算装置５００は、１つまたは複数のプロセッサ５０２と、記憶手段５０４と、入力手段５０６と、出力手段５０８とを備え、これらの要素は、バスシステム５１０および／または他の形式の接続手段（図略）を介して互いに接続されている。なお、図５に示された計算装置５００の要素とその構成は例示的なものに過ぎず、本発明はこれらに限定されない。計算装置５００は、需要に応じて、他の要素や構成を備えてもよい。

プロセッサ５０２は、中央演算処理装置（ＣＰＵ）、あるいはデータ処理機能および／または命令実行機能を有する他の形の処理ユニットであってもよい。プロセッサ５０２は、計算装置５００における他の要素を制御して、所望の機能を実行できる。

記憶手段５０４は、１つまたは複数のコンピュータプログラム製品を含み、前記コンピュータプログラム製品は、様々な形式のコンピュータ読取り可能な記録媒体、例えば、揮発性メモリおよび／または不揮発性メモリを含む。前記揮発性メモリには、例えば、ランダムアクセスメモリ（ＲＡＭ）および／またはキャッシュメモリ（ｃａｃｈｅ）などが含まれる。前記不揮発性メモリには、例えば、リードオンリーメモリ（ＲＯＭ）、ハードディスク、フラッシュメモリなどが含まれる。前記コンピュータ読取り可能な記録媒体には、１つまたは複数のコンピュータプログラム命令が記憶され、プロセッサ５０２は前記プログラム命令を実行して前述した本発明の実施例の機能および／または他の所望の機能を実現できる。また、前記コンピュータ読取り可能な記録媒体には、様々なアプリケーションおよびいろいろなデータ、例えば、前述した源言語の質問文、翻訳によって得られた目標言語の質問文、各項の意味役割、２つの項の間の単語アライメント結果、各項のアライメント確率、目標言語の質問文の得点などが記憶される。

入力手段５０６は、ユーザからの入力情報、例えば、源言語質問、翻訳しようとする第１言語の内容などを受け付けるためのものであり、有線・無線ネットワークアダプタ、キーボード、マウス、タッチスクリーン、マイクなどのような色々な入力デバイスを含む。

出力手段５０８は、様々な情報、例えば目標言語の質問文の翻訳品質、第１言語の内容に対する第２言語の翻訳などを外部に出力するためのものであり、有線・無線ネットワークアダプタ、ディスプレイ、プロジェクタ、テレビのような色々な表示装置などを含む。

以上、具体的な実施例を併せて本発明の基本原理を説明したが、明細書で開示されたメリット、利点、効果などは例に過ぎず、限定の意味がない。これらメリット、利点、効果などが本明細書の各実施例にとって必要なものであるとは言えない。また、前述した詳細な説明は、例示や理解のための開示に過ぎず、限定の意味がない。前述した詳細な説明が本発明にとって必要なものであるとは言えない。

本明細書に記載されたユニット、手段、装置、およびシステムのブロック図は具体例に過ぎず、必ずブロック図に示された方法で接続、設置、配置することを要求または暗示していない。これらのユニット、手段、装置、システムが任意の方式で接続、設置、配置されることは、当業者にとっては自明であろう。「備える」、「含む」、「具備」などのような用語は開放性用語で、「あるものを含むが、それだけに限定されず」の意味であり、互いに替えて用いられる。ここで使用している「または」と「および」という用語は、「および／または」の意味で、文脈で明確に排除された場合を除く、互いに替えて用いられる。ここで使用している「例えば」という用語は、「例えば〜だが、それだけに限定されず」の意味であり、互いに替えて用いられる。

また、ここで用いられるように、「少なくとも１つ」で始まる項の列挙の中で使用される「または」は、分離の列挙を示し、例えば「Ａ、ＢまたはＣの少なくとも１つ」の列挙は、Ａ、またはＢ、またはＣ、またはＡＢ、またはＡＣ、またはＢＣ、またはＡＢＣ（即ちＡとＢとＣ）を意味する。また、「例示的」は、説明した例が好ましいとか、その他の例よりもよいことを意味しない。

なお、本明細書のシステムおよび方法において、各ユニットまたは各ステップは、分解および／または再組合せが可能である。これらの分解および／または再組合せは、本明細書の開示と等しい技術案と認められるべきである。

ここで述べている技術に対して、請求項が定義する教示技術を逸脱しない範囲で、各種の修正、入れ替え、変更を行うことが可能である。また、本願に係る特許請求の範囲は、前述した処理、装置、製造、事件の組立、手段、方法、および動作の詳細な限定に限らない。ここで述べている実施態様と基本的に同じ機能を実行するあるいは基本的に同じ結果を実現する、既存または開発しようとする処理、装置、製造、事件の組立、手段、方法、および動作を利用できる。従って、本願の特許請求の範囲は、その保護範囲に属するこのような処理、装置、製造、事件の組立、手段、方法、および動作を含む。

本明細書の実施態様の詳細は、当業者が本発明を実現または利用できるように開示された。これらの態様に対する色々な変更は、当業者にとって自明であろう。ここで定義された一般原理は、本発明の範囲を逸脱しなく、他の態様に応用できる。そのため、本発明は、ここで開示された態様に限定されず、ここで開示された原理と新たな特徴に一致する最も広い範囲を有する。

前記の説明は、例示および説明を目的で提供される。また、この説明は、本発明の実施例をここで開示した形に限定する意図がない。以上で幾つかの具体態様および実施例を検討したが、その変形、修正、変更、追加、およびその一部の組合せは、当業者にとって自明であろう。

Claims

言語横断質問応答システム用の機械翻訳評価方法であって、
源言語の質問文および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれに意味役割付与を行うステップと、
源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するステップと、
計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するステップと、
を含む機械翻訳評価方法。
源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算する前記ステップは、
源言語の質問文における１つの項と目標言語の質問文における１つの項に対して単語アライメントを行い、単語アライメントの結果に応じてこの２つの項のアライメント確率を確定するステップを含み、
この２つの項の間でアライメントされた単語が多いほど、この２つの項のアライメント確率が高いことを特徴とする請求項１に記載の機械翻訳評価方法。
源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算する前記ステップは、
源言語の質問文における１つの項と目標言語の質問文における１つの項に対して、この２つの項の主要語の単語アライメント結果およびこの２つの項の間の距離に基づいて、この２つの項のアライメント確率を確定するステップを含むことを特徴とする請求項１に記載の機械翻訳評価方法。
計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定する前記ステップは、
少なくとも計算された各アライメント確率のうち最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するステップをさらに含むことを特徴とする請求項１に記載の機械翻訳評価方法。
計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定する前記ステップは、
予めトレーニングされたモデルを用いて前記目標言語の質問文の翻訳品質を採点し、前記モデルの特徴値は少なくとも前記各アライメント確率のうち最大アライメント確率を含むステップをさらに含むことを特徴とする請求項４に記載の機械翻訳評価方法。
前記モデルが多項式ロジスティック回帰モデルであることを特徴とする請求項５に記載の機械翻訳評価方法。
前記モデルのトレーニング時に、トレーニング集合における各目標言語の質問文によって前記言語横断質問応答システムで探し出した解答の正確性に基づいて、トレーニング集合における前記各目標言語の質問文を手動で採点することを特徴とする請求項５または６に記載の機械翻訳評価方法。
言語横断質問応答システム用の機械翻訳方法であって、
翻訳しようとする第１言語の内容を受け付け、該第１言語の内容のタイプを判断するステップと、
確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するステップと、
前記複数の翻訳エンジンを用いてそれぞれに前記第１言語の内容を翻訳し、第２言語の翻訳候補を複数得るステップと、
第２言語の翻訳候補毎の翻訳品質を採点し、得点が一番高い翻訳候補を前記第１言語の内容の翻訳として選択するステップと、
を含む機械翻訳方法。
前記第１言語の内容のタイプは、質問文と、質問結果と、コーパスとを含むことを特徴とする請求項８に記載の機械翻訳方法。
該タイプに適した前記複数の翻訳エンジンは、各翻訳エンジンの、該タイプの第１言語の内容に対する翻訳結果の品質によって予め確定されることを特徴とする請求項８に記載の機械翻訳方法。
前記第１言語の内容のタイプは質問文であり、前記第２言語の翻訳候補毎の翻訳品質を採点するステップは、
前記第１言語の内容および該第２言語の翻訳候補に対してそれぞれに意味役割付与を行うステップと、
前記第１言語の内容において意味役割が付与された項毎と、該第２言語の翻訳候補において意味役割が付与された項毎とのアライメント確率を計算するステップと、
計算された各アライメント確率に基づいて、該第２言語の翻訳候補の翻訳品質を採点するステップと、
を含むことを特徴とする請求項８に記載の機械翻訳方法。
前記第１言語の内容において意味役割が付与された項毎と、該第２言語の翻訳候補において意味役割が付与された項毎とのアライメント確率を計算する前記ステップは、
第１言語の内容における１つの項と第２言語の翻訳候補における１つの項に対して単語アライメントを行い、単語アライメントの結果に応じてこの２つの項のアライメント確率を確定するステップを含み、
この２つの項の間でアライメントされた単語が多いほど、この２つの項のアライメント確率が高いことを特徴とする請求項１１に記載の機械翻訳方法。
計算された各アライメント確率に基づいて、該第２言語の翻訳候補の翻訳品質を採点する前記ステップは、
少なくとも計算された各アライメント確率のうち最大アライメント確率に基づいて、該第２言語の翻訳候補の翻訳品質を採点するステップをさらに含むことを特徴とする請求項１１に記載の機械翻訳方法。
言語横断質問応答システム用の機械翻訳評価装置であって、
源言語の質問文および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれに意味役割付与を行うように配置された付与ユニットと、
源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するように配置されたアライメントユニットと、
計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するように配置された評価ユニットと、
を備える機械翻訳評価装置。
言語横断質問応答システム用の機械翻訳装置であって、
翻訳しようとする第１言語の内容を受け付け、該第１言語の内容のタイプを判断するように配置された判断ユニットと、
確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するように配置された選択ユニットと、
前記複数の翻訳エンジンを用いてそれぞれに前記第１言語の内容を翻訳し、第２言語の翻訳候補を複数得るように配置された翻訳ユニットと、
第２言語の翻訳候補毎の翻訳品質を採点し、得点が一番高い翻訳候補を前記第１言語の内容の翻訳として選択するように配置された確定ユニットと、
を備える機械翻訳装置。
前記第１言語の内容のタイプは質問文であり、前記確定ユニットは、
前記第１言語の内容および該第２言語の翻訳候補に対してそれぞれに意味役割付与を行うように配置された付与ユニットと、
前記第１言語の内容において意味役割が付与された項毎と、該第２言語の翻訳候補において意味役割が付与された項毎とのアライメント確率を計算するように配置されたアライメントユニットと、
計算された各アライメント確率に基づいて、該第２言語の翻訳候補の翻訳品質を採点するように配置された評価ユニットと、
をさらに備えることを特徴とする請求項１５に記載の機械翻訳装置。