JP2017097882A - 機械翻訳評価方法および装置、並びに機械翻訳方法および装置 - Google Patents

機械翻訳評価方法および装置、並びに機械翻訳方法および装置 Download PDF

Info

Publication number
JP2017097882A
JP2017097882A JP2016227929A JP2016227929A JP2017097882A JP 2017097882 A JP2017097882 A JP 2017097882A JP 2016227929 A JP2016227929 A JP 2016227929A JP 2016227929 A JP2016227929 A JP 2016227929A JP 2017097882 A JP2017097882 A JP 2017097882A
Authority
JP
Japan
Prior art keywords
translation
language
question sentence
alignment
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016227929A
Other languages
English (en)
Inventor
王暁利
Xiaoli Wang
張永生
Yongsheng Zhang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JP2017097882A publication Critical patent/JP2017097882A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】信頼性や汎用性に優れたより正確な機械翻訳評価ができる言語横断質問応答システム用の機械翻訳評価方法および装置、並びに機械翻訳方法および装置を提供する。【解決手段】機械翻訳評価方法は、源言語の質問文および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれに意味役割付与を行うステップと、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するステップと、計算された各アライメント確率に基づいて、目標言語の質問文の翻訳品質を確定するステップと、を含む。より正確な機械翻訳評価を提供することにより、言語横断質問応答システムの性能が向上する。【選択図】図1

Description

本発明は主として、機械翻訳に関し、具体的に、言語横断質問応答システム用の機械翻訳評価方法および装置、並びに機械翻訳方法および装置に関する。
言語横断質問応答システム(Cross-language question answering system)は、言語横断情報検索技術が自動質問応答システムに応用されてきたものであり、単言語対応の自動質問応答システムに比べて、言語横断、情報検索などのより複雑な処理技術を要する。言語横断質問応答システムは、入力として利用者から源言語で質問した問題を受け付け、この問題の最適な解答を他の言語のコーパスから自動的に探し出すとともに、この解答を源言語の形式で利用者に返す。システムが受け付けた問題の言語とコーパスの言語が異なるため、言語横断検索を実行するためには、機械翻訳により言語の変換を行う必要がある。この言語の変換に対して、2つの異なる解決策がある。その1つとして、源言語の問題をコーパスと同じ言語に変換(翻訳)してから、コーパスの言語向けの質問応答システムを用いて解答を得る。もう1つとして、機械翻訳によりコーパス全てを源言語と同じ言語に変換してから、変換されたコーパスから解答を得る。いずれにしても、機械翻訳の品質が質問応答システムの性能を大きく影響することが分かる。
上述した2番目の解決策は、コーパス全てを源言語と同じ言語に変換することで処理量が多いので、現在当分野の研究は1番目の解決策により集中している。具体的に、現在に至って、源言語の問題をコーパスと同じ言語に変換する機械翻訳に係る具体的な技術が多数提案されている。これに応じて、翻訳結果を評価して翻訳品質がより高い翻訳を選ぶために、翻訳品質を確定する様々な研究が行われてきた。しかし、現在の様々な翻訳評価方法は、信頼性や汎用性に優れているとは言い難かった。例えば、特許文献1には、目標言語クエリログでの各翻訳候補の発生頻度を確定し、発生頻度の最も高い翻訳候補を翻訳品質の最も高い翻訳として選択する言語横断クエリサジェスチョンの評価方法が開示された。しかし、この方法によると、翻訳候補から源言語によるある単語の訳漏れが発生したときに、その単語が目標言語クエリログで発生する頻度がより高くなり、また、ある特定の単語の誤訳が発生したときにも、より高い発生頻度をもたらすため、間違った翻訳評価を招く。また、例えば、特許文献2には、源言語と目標言語翻訳からの逆翻訳結果との距離によって翻訳信頼度を評価する方法が開示された。しかし、当該方法には、源言語から目標言語への翻訳および目標言語から源言語への逆翻訳という2つの翻訳モデルが必要であり、また、目標言語から源言語への逆翻訳の品質も評価の信頼性に影響を及ばす。
US20120330990A1 WO2013/014877A1
少なくとも前記問題を鑑み、本発明を提案する。
本発明の一実施例で提供される機械翻訳評価方法は、言語横断質問応答システム用の機械翻訳評価方法であって、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれ意味役割付与を行うステップと、源言語の質問文において意味役割が付与された項毎と目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するステップと、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するステップと、を含む機械翻訳評価方法である。
本発明の他の実施例で提供される機械翻訳方法は、言語横断質問応答システム用の機械翻訳方法であって、翻訳しようとする第1言語の内容を受け付け、該第1言語の内容のタイプを判断するステップと、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するステップと、前記複数の翻訳エンジンを用いてそれぞれに前記第1言語の内容を翻訳して、第2言語の翻訳候補を複数得るステップと、第2言語の翻訳候補毎の翻訳品質を採点して、得点の一番高い翻訳候補を前記第1言語の内容の翻訳として選択するステップと、を含む機械翻訳方法である。
本発明の他の実施例で提供される機械翻訳評価装置は、言語横断質問応答システム用の機械翻訳評価装置であって、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれ意味役割付与を行うように配置された付与ユニットと、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するように配置されたアライメントユニットと、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するように配置された評価ユニットと、を備える機械翻訳評価装置である。
本発明のさらなる他の実施例で提供される機械翻訳装置は、言語横断質問応答システム用の機械翻訳装置であって、翻訳しようとする第1言語の内容を受け付け、該第1言語の内容のタイプを判断するように配置された判断ユニットと、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するように配置された選択ユニットと、前記複数の翻訳エンジンを用いてそれぞれ前記第1言語の内容を翻訳して、第2言語の翻訳候補を複数得るように配置された翻訳ユニットと、第2言語の翻訳候補毎の翻訳品質を採点して、得点の一番高い翻訳候補を前記第1言語の内容の翻訳として選択するように配置された確定ユニットと、を備える機械翻訳装置である。
本発明の実施例に係る機械翻訳評価技術は、意味役割付与を用い、項のアライメント確率に基づく新たな機械翻訳評価方法を提案し、当該方法によって、より正確な機械翻訳評価を提供でき、さらに言語横断質問応答システムの性能を向上する。本発明の実施例に係る機械翻訳技術は、異なるタイプの翻訳すべき内容に応じて当該タイプに適した異なる翻訳エンジンを選択し、各タイプの翻訳内容を複数の翻訳エンジンで翻訳することによって、いずれタイプの翻訳すべき内容に対してもより優れる翻訳結果を提供できる。
本発明の実施例について、図面を参照して詳細に説明することにより、本発明の上述並びに他の目的、特徴、及びメリットがより明確になる。図面は、本発明の実施例に対するより一層の理解を深め且つ明細書の一部を構成しており、本発明の実施例とともに本発明を説明する役目を担ったが、本発明はこれらに限定するものではない。図面において、同じ符号は一貫して同じユニットやステップを表す。
図1は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法のフローチャートを概略的に示す。 図2は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法のフローチャートを例示する。 図3は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置の機能構成を示すブロック図である。 図4は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置の機能構成を示すブロック図である。 図5は、本発明の実施例を実現するための、言語横断質問応答システム用の機械翻訳評価装置及び機械翻訳装置に用いられる計算装置の概略的なブロック図を示す。
以下、本発明の目的、技術手段、およびメリットをより明白にするため、本発明の例示的な実施例について図面を参照しながら詳細に説明する。説明された実施例が本発明の一部の実施例のみであり、本発明の全ての実施例ではないことは明らかであろう。理解すべきなのは、本発明はここで説明された例示的な実施例に限定されない。当業者には、本開示の説明による実施例に基づき、容易に成し遂げることができた他の実施例の全ては本発明の思想から逸脱しない。
まず、本発明の実施例に係る機械翻訳評価技術の基本思想について簡単に説明する。
本発明者は、異なるタイプの翻訳すべき内容に対して翻訳品質の評価基準が変わることを認識した。言語横断質問応答システムにおける源言語の質問文の翻訳を例にすると、一般的な翻訳品質評価基準とは異なり、源言語の質問文の翻訳結果における各要素の位置が言語横断質問応答システムの性能に大きい影響を及ばしていないため、翻訳品質を評価する基準とするべきではないことが、多くの研究を経て本発明者より発見された。例えば、英語を源言語とし、中国語を目標言語としたとき(以下、別に説明がない限り、いずれもこのように仮定する)、英語の質問である「Is it cold at the night of early December,HK?」に関して、中国語の訳文である「是不是很冷,在十二月初,香港」における、各要素の位置は通常の語順に合致しないが、英語の質問の本来意味を正確に表しているため、翻訳品質が良くないとは言えない。また、翻訳結果の流暢さも、言語横断質問システムの性能に影響が大きくないため、翻訳品質を評価する標準とするべきではない。例えば、英語の質問である「What would be the highlights and the best things to see in Shanghai Expo 2010?」に関して、「什麼是亮点,並看到在上海2010年世博会最好的東西」と、「在上海世博会上看到的2010個亮点和最好的東西是什麼」との2つの翻訳候補がある。そのうち、2番目の翻訳候補は、より流暢にはなったが、英語の質問の本来意味とは合致しない。これに対して、1番目の翻訳候補は、それほど流暢には出なかったが、本来意味と大体合致しているため、その翻訳品質が良くないとは言えない。本発明者は、実際に、意味役割がある程度で文の意味を表すことができるため、翻訳品質を評価する1つの重要な指標になるべきだという知見を得た上で、後述する、意味役割付与を利用し項のアライメント確率に基づく新たな機械翻訳評価方法を提案する。
意味役割付与は、表層意味解析(shallow semantic parsing)技術の1種であり、センテンスを単位として、センテンスに含まれる意味情報を深く分析することではなく、センテンスにおける述語―項構造のみを分析する。意味役割付与のタスクは、具体的に、センテンス中の述語を中心にして、センテンスにおける各項と述語との関係を研究するとともに、意味役割付与によって項と述語との関係を表す。例えば、意味役割付与について、幾つかの具体例を下で示す。
〔具体例1〕
Figure 2017097882
〔具体例2〕
上海 充分 発揮 地縁優勢
[ARG0] [ARGM-ADV] [Pred] [ARG1]
意味役割は、中心意味役割と付加意味役割に分けられる。中心意味役割は、ARG+数字で表しており、一般に、動作主を表すARG0と、受動者を表すARG1と、動作の道具、手段などを表すARG2と、起点を表すARG3と、終点を表すARG4との5種類がある。付加意味役割は、AGRM−で表しており、動作の時間、場所など、例えば、前記の具体例1における「in 1989」を表す。
前述したように、本発明者は、意味役割がある程度で文の意味を表すことができることを認識した。2言語パラレル文対は相互に翻訳になるため、意味上では等価になるべきである。これが意味役割付与に反映されると、2つの対応するセンテンスは一致する述語―項構造を有するはずである。例えば、下記の具体例には、一対の二言語パラレル文の間における項のアライメント関係が示され、この2つのセンテンスが一致する述語―項構造を有することが分かる。
Figure 2017097882
本発明の実施例では、前記知見に基づき、二言語パラレル文間の述語−項一致性、即ち項のアライメント関係に基づいて翻訳品質を確定する。より詳しく、機械翻訳によって得られた対応する目標言語の質問文と、源言語の質問文との述語−項一致性が高いと、あるいは、この2つの文の間における項のアライメント程度が高いと、目標言語の質問文の翻訳品質が高いと判断される。
以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法について、図1を参照しながら詳細に説明する。図1は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法のフローチャートを概略的に示す。
ステップS110において、図1に示すように、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文それぞれに対して意味役割付与を行う。
現在、自然言語処理の分野では意味役割付与に対する多くの研究が行われ、利用可能な多数の意味役割付与方法が存在し、かつ意味役割付与の規則もよく充実されている。該ステップでは、任意の既知の意味役割付与方法を用いて、源言語の質問文に対して意味役割付与を行うとともに、機械翻訳によって得られた対応する目標言語の質問文(つまり、翻訳評価をすべき翻訳候補)に対して意味役割付与を行う。ここで詳細な説明は省略する。
ステップS120において、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算する。
該ステップでは、ステップS110による意味役割付与結果に基づき、源言語の質問文における各項と目標言語の質問文における各項とのアライメント確率を計算する。より詳しく、該ステップでは、当該2つの文の間における項のアライメント関係を得て、さらに目標言語の質問文の翻訳品質を評価するために、源言語の質問文における項毎に対して、目標言語の質問文における項毎とのアライメント確率を計算する。
各項は幾つかの単語で構成されたものであり、源言語で1つの項に含まれる単語と目標言語の項に含まれる単語とが大部アライメントされると、当該2つの項もアライメントされる可能性が高い。そのため、1つの選択肢として、源言語の質問文における1つの項と目標言語の質問文における1つの項との項のアライメント確率を計算するときに、当該2つの項に対して単語アライメントを行い、単語アライメントの結果によって当該2つの項のアライメント確率を確定できる。
所謂単語アライメントとは、2言語パラレル文において相互翻訳関係がある単語の間で対応関係を確立することである。単語アライメントは自然言語処理での慣用技術であり、分類方法によって、監視的(supervised)および無監視的(unsupervised)の単語アライメントや、発見的(heuristic)および統計的(statistic)の単語アライメントなどに分けられる。該ステップでは、任意の適当な単語アライメント方法を採用し、源言語の質問文における1つの項と目標言語の質問文における1つの項に対して単語アライメント処理を行い、さらに、単語アライメント処理の結果に応じて当該2つの項のアライメント確率を確定できる。具体的に、2つの項の間で、アライメントされた単語が多いほど、当該2つの項のアライメント確率が大きい。
他の選択肢として、主要語のアライメント結果および項の間の距離によって項のアライメント確率を確定してもよい。主要語とは、修飾フレーズにおいて、修飾語によって修飾や限定される中心成分である。1つの項の主要語は、当該項内の他の単語よりも代表性がある場合が多い。そのため、2つの項の主要語がアライメントされる場合、他にアライメントされた単語が少ないとしても、当該2つの項がアライメントされる可能性が高い。一方、2つのアライメントされた項の意味役割タグが同じ場合が多く、同じでないとしても、当該2つの項の間の距離がかなり近いことが、数多い統計で判明された。中国語センテンスにおける項ARG0を例にすると、多い統計から分かるように、一般的に、当該中国語センテンスにおけるARG0が英語センテンスにおけるARG0とアライメントされる場合、2つの項の間の距離はゼロであり、当該中国語センテンスにおけるARG0と英語センテンスにおけるARG1とのアライメントが大幅に減少された場合、2つの項の間の距離は1であり、当該中国語センテンスにおけるARG0と英語センテンスにおけるARG2とがほとんどアライメントされない場合、2つの項の間の距離は2である。即ち、2つの項の間の距離が近いほど、当該2つの項のアライメント確率が高く、2つの項の間の距離が遠いほど、当該2つの項のアライメント確率が低い。
従って、上述したように、源言語の質問文における1つの項と目標言語の質問文における1つの項に対して、当該2つの項の主要語の単語アライメント結果(即ち、アライメントされるか否か)および当該2つの項の間の距離に基づいて、当該2つの項のアライメント確率を確定してもよい。例えば、具体的な状況に応じて、主要語のアライメント結果および項の間の距離にそれぞれ適切な加重値を設定し、両者の加重和を算出して2つの項のアライメント確率を確定できる。
以上、源言語の質問文における1つの項と目標言語の質問文における1つの項との項のアライメント確率を計算する方法を例示した。もちろん、これは例示的な説明であり、本発明に対して何ら制限的な意味を有しない。具体的な状況に応じて、他の手段で2つの項の間のアライメント確率を計算してもよい。例えば、2つの項の間の単語アライメント結果、主要語のアライメント結果、および項の間の距離を同時に考えて、項のアライメント確率を確定してもよい。
図1に戻り、ステップS130において、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定する。
該ステップでは、様々な方法で、ステップS120において計算された各項のアライメント確率を利用して目標言語の質問文の翻訳品質を確定できる。
各アライメント確率のうち、最大アライメント確率が翻訳品質に響く1つの要因となることを統計から分かったため、選択肢として、計算された各アライメント確率のうち最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。そして、最大アライメント確率が大きいほど、目標言語の質問文の翻訳品質が優れる。
また、各アライメント確率の平均アライメント確率も翻訳品質に大きい影響を与えることを統計から分かったため、計算された各アライメント確率の平均アライメント確率、および最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。また、平均アライメント確率および最大アライメント確率を除いて、源言語の質問文の長さや、目標言語の質問文の長さや、目標言語の質問文における述語の数などの他の関連する影響因子をさらに併せて、目標言語の質問文の翻訳品質を確定してもよい。1つの具体例として、前記各影響因子のそれぞれに適切な加重値を設定し各影響因子の加重和を算出することで、目標言語の質問文の翻訳品質を確定する。
選択肢として、前記各影響因子を用いて数理モデルを立てることで、目標言語の質問文の翻訳品質を確定してもよい。例えば、式(1)に示すように、予めトレーニングされた多項式ロジスティック回帰モデルを利用して目標言語の質問文の翻訳品質を採点することで、翻訳品質を評価する。
Figure 2017097882
そのうち、P(Y=k|x)はモデルの各出力値(即ち、各翻訳品質の得点)の論理的な可能性を表し、xはモデルの特徴値であり、Wkは各特徴値の加重値であり、その具体値はモデルのトレーニング過程でトレーニングによって求められ、Kは特徴値の数であり、k*は最大な論理的な可能性を有する出力値、即ち可能性が最も高い翻訳品質の得点である。前述したように、各アライメント確率のうち、最大アライメント確率が1つの要因となるため、当該モデルの特徴値は最大アライメント確率とされる。また、当該モデルの特徴値は、例えば、平均アライメント確率、源言語の質問文の長さ、目標言語の質問文の長さ、目標言語の質問文における述語の数などのような他の関連因子を含んでもよい。
当該多項式ロジスティック回帰モデルは、翻訳品質を評価する前にSAS、SPSSなどのトレーニング方法によって予めトレーニングによって求められる。モデルトレーニングは数理統計分野の慣用技術であり、ここで詳細な説明を省略する。なお、トレーニング集合における各目標言語の質問文を用いてモデルトレーニングを行うときに、様々な規則に基づいて手動で当該各目標言語の質問文を採点できる。例えば、トレーニング集合における各目標言語の質問文によって言語横断質問応答システムで探し出した解答の正確性に基づいて、当該各目標言語の質問文を手動で採点できる。表は、採点規則の具体例の一つを示す。
Figure 2017097882
前記多項式ロジスティック回帰モデルは、ただ1つの選択肢としての具体例であり、本発明を限定するものではない。SVM(サポートベクターマシン)、非線形モデル、ニューラルネットワークなどのような他の適当なモデルを用いて目標言語の質問文の翻訳品質を採点してもよい。
以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法について詳細に説明した。本発明者は、既にテスト集合を用いて検証を行った。検証結果によると、該機械翻訳評価方法を用いて源言語の質問文の翻訳品質を評価した正確率は、約90%に達する。これから分かるように、本発明の実施例に係る機械翻訳方法は、より正確な機械翻訳評価を提供でき、さらに言語横断質問応答システムの性能を向上させる。以下、前述した機械翻訳評価方法が適用される、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法について説明する。図2は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法のフローチャートを例示する。
図2に示すように、ステップS210において、翻訳しようとする第1言語の内容を受け付けて、該第1言語の内容のタイプを判断する。
言語横断質問応答システムにおいて、翻訳すべき内容は、ユーザに入力された源言語の質問文と、応答システムにて検索された、源言語と異なる他の言語(以下、目標言語と略称する)の質問結果と、源言語に翻訳すべき目標言語のコーパスとを少なくとも含む。
前述したように、本発明者は、異なるタイプの翻訳すべき内容によって、翻訳品質の評価基準が変わることを認識した。そのため、該ステップで翻訳しようとする第1言語の内容のタイプを判断することで、後の処理でそのタイプに適した評価基準および翻訳ツールを選べる。
ステップS220において、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択する。
他の翻訳エンジンに比べて圧倒的に優れる翻訳エンジンはなく、他の翻訳方法に比べて圧倒的に優れる翻訳方法もない。この点は統計から知られている。そのため、該ステップでは、確定された第1言語の内容のタイプに対して、該タイプに適した複数の翻訳エンジンを選択する。そのうち、該タイプに適した前記複数の翻訳エンジンは予め確定されたものである。より詳しくは、google、bing、baiduなどの様々な翻訳エンジンを予め利用して該タイプに属する第1言語の内容を大量に翻訳しておくともに、既存の様々な評価モデルまたはマニュアル評価などの手段によって各翻訳エンジンの翻訳結果を評価(オフライン評価)することで、翻訳品質が良い幾つかのエンジンを該タイプに適した翻訳エンジンとして確定する。
ステップS230において、前記複数の翻訳エンジンをそれぞれ用いて前記第1言語の内容を翻訳して、複数の第2言語の翻訳候補を得る。
ステップS240において、第2言語の翻訳候補毎の翻訳品質を採点し、得点が一番高い翻訳候補を前記第1言語の内容の翻訳として選択する。
該ステップでは、任意の適当な翻訳品質評価方法を用いて、ステップS230で得られた第2言語の翻訳候補毎の翻訳品質を採点(オンライン評価)することが可能であり、本実施例は、これに対して限定がない。
なお、前記第1言語の内容のタイプが質問文である場合、前に図1を参照しながら説明した本発明の実施例に係る機械翻訳評価方法によって、第2言語の翻訳候補毎の翻訳品質を採点する。具体的に、評価すべき1つの第2言語の翻訳候補について、第1言語の内容、および当該第2言語の翻訳候補に対してそれぞれに意味役割付与を行ってから、第1言語の内容における意味役割が付与された項毎と当該第2言語の翻訳候補における意味役割が付与された項毎とのアライメント確率を計算し、最後に計算された各アライメント確率に基づいて当該第2言語の翻訳候補の翻訳品質を採点できる。前記処理の具体的な操作は、前に図1を参照しながら説明した各ステップの操作と同じであるので、ここで重なる説明を省略する。
以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法を詳細に説明した。該実施例によれば、異なるタイプの翻訳すべき内容に対して、オフライン評価で予め確定された当該タイプに適した翻訳エンジンを選択し、複数の翻訳エンジンにてタイプ毎の翻訳内容を翻訳し、オンライン評価により得点が一番高い翻訳候補を最終の翻訳として選択する。これにより、様々なタイプの翻訳すべき内容のいずれに対しても、優れる翻訳結果の提供を確保できる。
以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置について、図3を参照しながら説明する。図3は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置の機能構成を示すブロック図である。図3に示すように、機械翻訳評価装置300は、付与ユニット310と、アライメントユニット320と、評価ユニット330を備える。前記各ユニットの具体的な機能や操作は、基本的に前に図1を説明したとおりであるので、重なる説明を避けるため、以下、同じ部分に対する詳細な説明を省略ながら、前記装置を簡単に説明する。
付与ユニット310は、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれ意味役割付与を行うように配置される。具体的に、付与ユニット310は、任意な既知の意味役割付与方法を用いて源言語の質問文に対して意味役割付与を行い、機械翻訳によって得られた対応する目標言語の質問文に対して意味役割付与を行う。ここで重なる説明を省略する。
アライメントユニット320は、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するように配置される。具体的に、2つの文の間の項のアライメント関係を得て、さらに目標言語の質問文の翻訳品質を評価するために、アライメントユニット320は、源言語の質問文における項毎に対して、目標言語の質問文における項毎とのアライメント確率を計算する。
アライメントユニット320は、様々な適当な手段を用いて前記項のアライメント確率を計算できる。1つの選択肢として、源言語の質問文における1つの項と目標言語の質問文における1つの項との項のアライメント確率を計算するときに、当該2つの項に対して単語アライメントを行い、単語アライメントの結果によって当該2つの項のアライメント確率を確定できる。そのうち、2つの項の間でアライメントされた単語が多いほど、当該2つの項のアライメント確率が大きい。他の選択肢として、源言語の質問文における1つの項と目標言語の質問文における1つの項に対して、この2つの項における主要語の単語アライメント結果およびこの2つの項の間の距離によって、この2つの項のアライメント確率を確定してもよい。具体的に、具体的な状況に応じて、主要語のアライメント結果および項の間の距離にそれぞれ適切な加重値を設定し両者の加重和を算出して、2つの項のアライメント確率を確定できる。
評価ユニット330は、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するように配置される。評価ユニット330は、多様な手段でアライメントユニット320から算出された各項のアライメント確率を用いて、目標言語の質問文の翻訳品質を確定できる。
なお、評価ユニット330は、計算された各アライメント確率のうち最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。そのうち、最大アライメント確率が大きいほど、目標言語の質問文の翻訳品質が良い。
なお、評価ユニット330は、計算された各アライメント確率の平均アライメント確率および最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。また、評価ユニット330は、さらに、源言語の質問文の長さや、目標言語の質問文の長さや、目標言語の質問文における述語の数などの他の関連する影響因子を併せて、目標言語の質問文の翻訳品質を確定してもよい。1つの具体例として、評価ユニット330は、前記各影響因子にそれぞれ適切な加重値を設定し、各影響因子の加重和を算出して目標言語の質問文の翻訳品質を確定できる。
なお、評価ユニット330は、少なくとも最大アライメント確率を含む前記各影響因子を用いて数理モデルを立てることで、目標言語の質問文の翻訳品質を確定してもよい。例えば、前に示された式(1)によって、予めトレーニングされた多項式ロジスティック回帰モデルを利用して、目標言語の質問文の翻訳品質を採点して翻訳品質を評価できる。
当該多項式ロジスティック回帰モデルは、翻訳品質を評価する前に、SAS、SPSSなどのトレーニング方法によってトレーニングで予め求められる。そのうち、トレーニング集合における各目標言語の質問文を用いてモデルのトレーニングを行うときに、様々な規則に基づいて手動で当該各目標言語の質問文を採点できる。例えば、トレーニング集合における各目標言語の質問文によって言語横断質問応答システムで探し出した解答の正確性に基づいて、当該各目標言語の質問文を手動で採点できる。
前記多項式ロジスティック回帰モデルは、ただ1つの選択肢としての具体例であり、本発明を限定するものではない、SVM(サポートベクターマシン)、非線形モデル、ニューラルネットワークなどのような他の適当なモデルを用いて目標言語の質問文の翻訳品質を採点してもよい。
以上で、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置について詳細に説明した。該装置は、より正確な機械翻訳評価を提供でき、さらに言語横断質問応答システムの性能を向上させる。
以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置について、図4を参照しながら説明する。図4は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置の機能構成を示すブロック図である。図4に示すように、機械翻訳装置400は、判断ユニット410と、選択ユニット420と、翻訳ユニット430と、確定ユニット440とを備える。前記各ユニットの具体的な機能や操作は、基本的に、前に図2および図3で説明したのと同じであるので、重なる説明を避けるため、以下、同じ部分に対する詳細な説明を省略しながら、前記装置に対して簡単に説明する。
判断ユニット410は、翻訳しようとする第1言語の内容を受け付け、該第1言語の内容のタイプを判断するように配置される。前述したように、言語横断質問応答システムにおいて、翻訳すべき内容は、ユーザに入力された源言語の質問文と、応答システムにて検索された、源言語と異なる他の言語(以下、目標言語と略称する)の質問結果と、源言語に翻訳すべき目標言語のコーパスとを少なくとも含む。異なるタイプの翻訳すべき内容によって、翻訳品質の評価基準が変わるべきである。従って、判断ユニット410は、後の処理で翻訳しようとする第1言語の内容のタイプに適する評価基準および翻訳ツールを選べるために、翻訳しようとする第1言語の内容のタイプを判断する。
選択ユニット420は、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するように配置される。他の翻訳エンジンに比べて圧倒的に優れる翻訳エンジンはなく、他の翻訳方法に比べて圧倒的に優れる翻訳方法もない。この点は統計から知られている。そのため、選択ユニット420は、確定された第1言語の内容のタイプに対して、該タイプに適した複数の翻訳エンジンを選択する。そのうち、該タイプに適した前記複数の翻訳エンジンは予め確定されたものである。より詳しく、様々な翻訳エンジンを予め利用して該タイプに属する第1言語の内容を大量に翻訳しておくともに、既存の様々な評価モデルまたはマニュアル評価などの手段によって各翻訳エンジンの翻訳結果を評価(オフライン評価)することで、翻訳品質が良い幾つかのエンジンを該タイプに適した翻訳エンジンとして確定する。
翻訳ユニット430は、前記複数の翻訳エンジンを用いてそれぞれに前記第1言語の内容を翻訳して、第2言語の翻訳候補を複数得るように配置される。
確定ユニット440は、第2言語の翻訳候補毎の翻訳品質を採点して、得点が一番高い翻訳候補を前記第1言語の内容の翻訳として選択するように配置される。確定ユニット440は、任意の適当な翻訳品質評価方法を用いて、翻訳ユニット430によって得た第2言語の翻訳候補毎の翻訳品質を採点(オンライン評価)でき、本実施例はこれに対して限定がない。
なお、前記第1言語の内容のタイプが質問文である場合、確定ユニット440は、前に図3を参照しながら説明した機械翻訳評価装置を用いて、第2言語の翻訳候補毎の翻訳品質を採点できる。具体的に、確定ユニット440は、第1言語の内容および1つの第2言語の翻訳候補に対してそれぞれ意味役割付与を行うための付与ユニットと、第1言語の内容における意味役割が付与された項毎と、当該第2言語の翻訳候補における意味役割が付与された項毎とのアライメント確率を計算するためのアライメントユニットと、計算された各アライメント確率に基づいて、当該第2言語の翻訳候補の翻訳品質を採点するための評価ユニットとを備える。該確定ユニット440における各ユニットの機能や具体的な操作は、前に図3を参照しながら説明した機械翻訳評価装置と同じであるので、ここで重なる説明を省略する。
以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置を詳細に説明した。該実施例によれば、異なるタイプの翻訳すべき内容に対して、オフライン評価によって予め確定された当該タイプに適した翻訳エンジンを選択し、複数の翻訳エンジンにてタイプ毎の翻訳内容を翻訳し、オンライン評価により得点が一番高い翻訳候補を最終の翻訳として選択する。これにより、様々なタイプの翻訳すべき内容のいずれに対しても、優れる翻訳結果の提供を確保できる。
以下、本発明の実施例を実現するための、言語横断質問応答システム用の機械翻訳評価装置並びに機械翻訳装置に用いられる計算装置の概略的なブロック図について、図5を参照しながら説明する。
図5に示すように、計算装置500は、1つまたは複数のプロセッサ502と、記憶手段504と、入力手段506と、出力手段508とを備え、これらの要素は、バスシステム510および/または他の形式の接続手段(図略)を介して互いに接続されている。なお、図5に示された計算装置500の要素とその構成は例示的なものに過ぎず、本発明はこれらに限定されない。計算装置500は、需要に応じて、他の要素や構成を備えてもよい。
プロセッサ502は、中央演算処理装置(CPU)、あるいはデータ処理機能および/または命令実行機能を有する他の形の処理ユニットであってもよい。プロセッサ502は、計算装置500における他の要素を制御して、所望の機能を実行できる。
記憶手段504は、1つまたは複数のコンピュータプログラム製品を含み、前記コンピュータプログラム製品は、様々な形式のコンピュータ読取り可能な記録媒体、例えば、揮発性メモリおよび/または不揮発性メモリを含む。前記揮発性メモリには、例えば、ランダムアクセスメモリ(RAM)および/またはキャッシュメモリ(cache)などが含まれる。前記不揮発性メモリには、例えば、リードオンリーメモリ(ROM)、ハードディスク、フラッシュメモリなどが含まれる。前記コンピュータ読取り可能な記録媒体には、1つまたは複数のコンピュータプログラム命令が記憶され、プロセッサ502は前記プログラム命令を実行して前述した本発明の実施例の機能および/または他の所望の機能を実現できる。また、前記コンピュータ読取り可能な記録媒体には、様々なアプリケーションおよびいろいろなデータ、例えば、前述した源言語の質問文、翻訳によって得られた目標言語の質問文、各項の意味役割、2つの項の間の単語アライメント結果、各項のアライメント確率、目標言語の質問文の得点などが記憶される。
入力手段506は、ユーザからの入力情報、例えば、源言語質問、翻訳しようとする第1言語の内容などを受け付けるためのものであり、有線・無線ネットワークアダプタ、キーボード、マウス、タッチスクリーン、マイクなどのような色々な入力デバイスを含む。
出力手段508は、様々な情報、例えば目標言語の質問文の翻訳品質、第1言語の内容に対する第2言語の翻訳などを外部に出力するためのものであり、有線・無線ネットワークアダプタ、ディスプレイ、プロジェクタ、テレビのような色々な表示装置などを含む。
以上、具体的な実施例を併せて本発明の基本原理を説明したが、明細書で開示されたメリット、利点、効果などは例に過ぎず、限定の意味がない。これらメリット、利点、効果などが本明細書の各実施例にとって必要なものであるとは言えない。また、前述した詳細な説明は、例示や理解のための開示に過ぎず、限定の意味がない。前述した詳細な説明が本発明にとって必要なものであるとは言えない。
本明細書に記載されたユニット、手段、装置、およびシステムのブロック図は具体例に過ぎず、必ずブロック図に示された方法で接続、設置、配置することを要求または暗示していない。これらのユニット、手段、装置、システムが任意の方式で接続、設置、配置されることは、当業者にとっては自明であろう。「備える」、「含む」、「具備」などのような用語は開放性用語で、「あるものを含むが、それだけに限定されず」の意味であり、互いに替えて用いられる。ここで使用している「または」と「および」という用語は、「および/または」の意味で、文脈で明確に排除された場合を除く、互いに替えて用いられる。ここで使用している「例えば」という用語は、「例えば〜だが、それだけに限定されず」の意味であり、互いに替えて用いられる。
また、ここで用いられるように、「少なくとも1つ」で始まる項の列挙の中で使用される「または」は、分離の列挙を示し、例えば「A、BまたはCの少なくとも1つ」の列挙は、A、またはB、またはC、またはAB、またはAC、またはBC、またはABC(即ちAとBとC)を意味する。また、「例示的」は、説明した例が好ましいとか、その他の例よりもよいことを意味しない。
なお、本明細書のシステムおよび方法において、各ユニットまたは各ステップは、分解および/または再組合せが可能である。これらの分解および/または再組合せは、本明細書の開示と等しい技術案と認められるべきである。
ここで述べている技術に対して、請求項が定義する教示技術を逸脱しない範囲で、各種の修正、入れ替え、変更を行うことが可能である。また、本願に係る特許請求の範囲は、前述した処理、装置、製造、事件の組立、手段、方法、および動作の詳細な限定に限らない。ここで述べている実施態様と基本的に同じ機能を実行するあるいは基本的に同じ結果を実現する、既存または開発しようとする処理、装置、製造、事件の組立、手段、方法、および動作を利用できる。従って、本願の特許請求の範囲は、その保護範囲に属するこのような処理、装置、製造、事件の組立、手段、方法、および動作を含む。
本明細書の実施態様の詳細は、当業者が本発明を実現または利用できるように開示された。これらの態様に対する色々な変更は、当業者にとって自明であろう。ここで定義された一般原理は、本発明の範囲を逸脱しなく、他の態様に応用できる。そのため、本発明は、ここで開示された態様に限定されず、ここで開示された原理と新たな特徴に一致する最も広い範囲を有する。
前記の説明は、例示および説明を目的で提供される。また、この説明は、本発明の実施例をここで開示した形に限定する意図がない。以上で幾つかの具体態様および実施例を検討したが、その変形、修正、変更、追加、およびその一部の組合せは、当業者にとって自明であろう。

Claims (16)

  1. 言語横断質問応答システム用の機械翻訳評価方法であって、
    源言語の質問文および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれに意味役割付与を行うステップと、
    源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するステップと、
    計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するステップと、
    を含む機械翻訳評価方法。
  2. 源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算する前記ステップは、
    源言語の質問文における1つの項と目標言語の質問文における1つの項に対して単語アライメントを行い、単語アライメントの結果に応じてこの2つの項のアライメント確率を確定するステップを含み、
    この2つの項の間でアライメントされた単語が多いほど、この2つの項のアライメント確率が高いことを特徴とする請求項1に記載の機械翻訳評価方法。
  3. 源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算する前記ステップは、
    源言語の質問文における1つの項と目標言語の質問文における1つの項に対して、この2つの項の主要語の単語アライメント結果およびこの2つの項の間の距離に基づいて、この2つの項のアライメント確率を確定するステップを含むことを特徴とする請求項1に記載の機械翻訳評価方法。
  4. 計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定する前記ステップは、
    少なくとも計算された各アライメント確率のうち最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するステップをさらに含むことを特徴とする請求項1に記載の機械翻訳評価方法。
  5. 計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定する前記ステップは、
    予めトレーニングされたモデルを用いて前記目標言語の質問文の翻訳品質を採点し、前記モデルの特徴値は少なくとも前記各アライメント確率のうち最大アライメント確率を含むステップをさらに含むことを特徴とする請求項4に記載の機械翻訳評価方法。
  6. 前記モデルが多項式ロジスティック回帰モデルであることを特徴とする請求項5に記載の機械翻訳評価方法。
  7. 前記モデルのトレーニング時に、トレーニング集合における各目標言語の質問文によって前記言語横断質問応答システムで探し出した解答の正確性に基づいて、トレーニング集合における前記各目標言語の質問文を手動で採点することを特徴とする請求項5または6に記載の機械翻訳評価方法。
  8. 言語横断質問応答システム用の機械翻訳方法であって、
    翻訳しようとする第1言語の内容を受け付け、該第1言語の内容のタイプを判断するステップと、
    確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するステップと、
    前記複数の翻訳エンジンを用いてそれぞれに前記第1言語の内容を翻訳し、第2言語の翻訳候補を複数得るステップと、
    第2言語の翻訳候補毎の翻訳品質を採点し、得点が一番高い翻訳候補を前記第1言語の内容の翻訳として選択するステップと、
    を含む機械翻訳方法。
  9. 前記第1言語の内容のタイプは、質問文と、質問結果と、コーパスとを含むことを特徴とする請求項8に記載の機械翻訳方法。
  10. 該タイプに適した前記複数の翻訳エンジンは、各翻訳エンジンの、該タイプの第1言語の内容に対する翻訳結果の品質によって予め確定されることを特徴とする請求項8に記載の機械翻訳方法。
  11. 前記第1言語の内容のタイプは質問文であり、前記第2言語の翻訳候補毎の翻訳品質を採点するステップは、
    前記第1言語の内容および該第2言語の翻訳候補に対してそれぞれに意味役割付与を行うステップと、
    前記第1言語の内容において意味役割が付与された項毎と、該第2言語の翻訳候補において意味役割が付与された項毎とのアライメント確率を計算するステップと、
    計算された各アライメント確率に基づいて、該第2言語の翻訳候補の翻訳品質を採点するステップと、
    を含むことを特徴とする請求項8に記載の機械翻訳方法。
  12. 前記第1言語の内容において意味役割が付与された項毎と、該第2言語の翻訳候補において意味役割が付与された項毎とのアライメント確率を計算する前記ステップは、
    第1言語の内容における1つの項と第2言語の翻訳候補における1つの項に対して単語アライメントを行い、単語アライメントの結果に応じてこの2つの項のアライメント確率を確定するステップを含み、
    この2つの項の間でアライメントされた単語が多いほど、この2つの項のアライメント確率が高いことを特徴とする請求項11に記載の機械翻訳方法。
  13. 計算された各アライメント確率に基づいて、該第2言語の翻訳候補の翻訳品質を採点する前記ステップは、
    少なくとも計算された各アライメント確率のうち最大アライメント確率に基づいて、該第2言語の翻訳候補の翻訳品質を採点するステップをさらに含むことを特徴とする請求項11に記載の機械翻訳方法。
  14. 言語横断質問応答システム用の機械翻訳評価装置であって、
    源言語の質問文および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれに意味役割付与を行うように配置された付与ユニットと、
    源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するように配置されたアライメントユニットと、
    計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するように配置された評価ユニットと、
    を備える機械翻訳評価装置。
  15. 言語横断質問応答システム用の機械翻訳装置であって、
    翻訳しようとする第1言語の内容を受け付け、該第1言語の内容のタイプを判断するように配置された判断ユニットと、
    確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するように配置された選択ユニットと、
    前記複数の翻訳エンジンを用いてそれぞれに前記第1言語の内容を翻訳し、第2言語の翻訳候補を複数得るように配置された翻訳ユニットと、
    第2言語の翻訳候補毎の翻訳品質を採点し、得点が一番高い翻訳候補を前記第1言語の内容の翻訳として選択するように配置された確定ユニットと、
    を備える機械翻訳装置。
  16. 前記第1言語の内容のタイプは質問文であり、前記確定ユニットは、
    前記第1言語の内容および該第2言語の翻訳候補に対してそれぞれに意味役割付与を行うように配置された付与ユニットと、
    前記第1言語の内容において意味役割が付与された項毎と、該第2言語の翻訳候補において意味役割が付与された項毎とのアライメント確率を計算するように配置されたアライメントユニットと、
    計算された各アライメント確率に基づいて、該第2言語の翻訳候補の翻訳品質を採点するように配置された評価ユニットと、
    をさらに備えることを特徴とする請求項15に記載の機械翻訳装置。
JP2016227929A 2015-11-24 2016-11-24 機械翻訳評価方法および装置、並びに機械翻訳方法および装置 Pending JP2017097882A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510824703.0A CN106776583A (zh) 2015-11-24 2015-11-24 机器翻译评价方法和设备及机器翻译方法和设备
CN201510824703.0 2015-11-24

Publications (1)

Publication Number Publication Date
JP2017097882A true JP2017097882A (ja) 2017-06-01

Family

ID=58807143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016227929A Pending JP2017097882A (ja) 2015-11-24 2016-11-24 機械翻訳評価方法および装置、並びに機械翻訳方法および装置

Country Status (2)

Country Link
JP (1) JP2017097882A (ja)
CN (1) CN106776583A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797215A (zh) * 2020-06-24 2020-10-20 北京小米松果电子有限公司 对话方法、装置及存储介质
CN111985251A (zh) * 2019-05-21 2020-11-24 南京大学 翻译质量测评方法及装置
JP2021089705A (ja) * 2019-12-05 2021-06-10 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 翻訳品質を評価するための方法と装置
CN113609875A (zh) * 2021-08-06 2021-11-05 科大讯飞股份有限公司 翻译质量评估方法、装置、电子设备和存储介质
JP6965982B1 (ja) * 2020-11-30 2021-11-10 凸版印刷株式会社 質問応答システム、及び質問応答方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345590B (zh) * 2017-12-28 2022-05-31 北京搜狗科技发展有限公司 一种翻译方法、装置、电子设备以及存储介质
CN108920469A (zh) * 2018-06-12 2018-11-30 深圳市合言信息科技有限公司 一种提高多语言互译准确度的方法
CN109118109B (zh) * 2018-08-31 2021-06-01 传神语联网网络科技股份有限公司 基于etm的质量评估
CN109299737B (zh) * 2018-09-19 2021-10-26 语联网(武汉)信息技术有限公司 译员基因的选取方法、装置与电子设备
CN109858042B (zh) * 2018-11-20 2024-02-20 科大讯飞股份有限公司 一种翻译质量的确定方法及装置
CN109829550B (zh) * 2019-02-01 2022-03-04 北京金山数字娱乐科技有限公司 模型评价方法和装置、模型评价系统及其训练方法和装置
CN113642337B (zh) * 2020-05-11 2023-12-19 阿里巴巴集团控股有限公司 数据处理方法和装置、翻译方法、电子设备以及计算机可读存储介质
WO2021243706A1 (zh) * 2020-06-05 2021-12-09 中山大学 一种跨语言生成提问的方法和装置
CN112100354B (zh) * 2020-09-16 2023-07-25 北京奇艺世纪科技有限公司 人机对话方法、装置、设备及存储介质
CN113158694B (zh) * 2021-04-23 2023-01-13 深圳鸿祥源科技有限公司 一种基于5g网络的在线翻译终端系统及其方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728826A (ja) * 1993-07-13 1995-01-31 Hitachi Ltd 最適翻訳システム選択方法
JP2004038406A (ja) * 2002-07-01 2004-02-05 Advanced Telecommunication Research Institute International 複数個の翻訳結果から最良訳を選択する方法、最良訳を選択するための回帰木データを生成する方法、最良訳選択型の機械翻訳プログラム、回帰木生成プログラム、および回帰木データを記憶した記憶媒体
JP2009294747A (ja) * 2008-06-03 2009-12-17 National Institute Of Information & Communication Technology 統計的機械翻訳装置
JP2015170094A (ja) * 2014-03-06 2015-09-28 株式会社Nttドコモ 翻訳装置及び翻訳方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
CN103678285A (zh) * 2012-08-31 2014-03-26 富士通株式会社 机器翻译方法和机器翻译系统
US8914395B2 (en) * 2013-01-03 2014-12-16 Uptodate, Inc. Database query translation system
CN104268132B (zh) * 2014-09-11 2017-04-26 北京交通大学 机器翻译方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0728826A (ja) * 1993-07-13 1995-01-31 Hitachi Ltd 最適翻訳システム選択方法
JP2004038406A (ja) * 2002-07-01 2004-02-05 Advanced Telecommunication Research Institute International 複数個の翻訳結果から最良訳を選択する方法、最良訳を選択するための回帰木データを生成する方法、最良訳選択型の機械翻訳プログラム、回帰木生成プログラム、および回帰木データを記憶した記憶媒体
JP2009294747A (ja) * 2008-06-03 2009-12-17 National Institute Of Information & Communication Technology 統計的機械翻訳装置
JP2015170094A (ja) * 2014-03-06 2015-09-28 株式会社Nttドコモ 翻訳装置及び翻訳方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杉山 享志朗 外6名: "言語横断質問応答に適した機械翻訳評価尺度の検討", 情報処理学会 研究報告 自然言語処理(NL) 2015−NL−223 [ONLINE], JPN6020042645, 20 September 2015 (2015-09-20), JP, pages 1 - 7, ISSN: 0004385574 *
高橋 哲朗 外2名: "テキストの構文的類似度の評価法について", 情報処理学会研究報告, vol. 第2002巻 第66号, JPN6020042647, 16 July 2002 (2002-07-16), JP, pages 163 - 170, ISSN: 0004385575 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985251A (zh) * 2019-05-21 2020-11-24 南京大学 翻译质量测评方法及装置
CN111985251B (zh) * 2019-05-21 2023-11-07 南京大学 翻译质量测评方法及装置
JP2021089705A (ja) * 2019-12-05 2021-06-10 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 翻訳品質を評価するための方法と装置
JP7122341B2 (ja) 2019-12-05 2022-08-19 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 翻訳品質を評価するための方法と装置
US11481562B2 (en) 2019-12-05 2022-10-25 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for evaluating translation quality
CN111797215A (zh) * 2020-06-24 2020-10-20 北京小米松果电子有限公司 对话方法、装置及存储介质
JP6965982B1 (ja) * 2020-11-30 2021-11-10 凸版印刷株式会社 質問応答システム、及び質問応答方法
JP2022086902A (ja) * 2020-11-30 2022-06-09 凸版印刷株式会社 質問応答システム、及び質問応答方法
CN113609875A (zh) * 2021-08-06 2021-11-05 科大讯飞股份有限公司 翻译质量评估方法、装置、电子设备和存储介质
CN113609875B (zh) * 2021-08-06 2024-02-20 中国科学技术大学 翻译质量评估方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN106776583A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
JP2017097882A (ja) 機械翻訳評価方法および装置、並びに機械翻訳方法および装置
US11640515B2 (en) Method and neural network system for human-computer interaction, and user equipment
US10311146B2 (en) Machine translation method for performing translation between languages
US10891322B2 (en) Automatic conversation creator for news
CN111417940B (zh) 用于生成问题答案的方法、系统和介质
US20160140221A1 (en) Display apparatus and method for summarizing of document
US20150269163A1 (en) Providing search recommendation
US9047563B2 (en) Performing an action related to a measure of credibility of a document
US11948113B2 (en) Generating risk assessment software
KR102285142B1 (ko) 챗봇을 위한 학습 데이터 추천 장치 및 방법
US11276010B2 (en) Method and system for extracting relevant entities from a text corpus
JP6252283B2 (ja) キュレーションされたコンテンツを評価する方法及びシステム
US10496751B2 (en) Avoiding sentiment model overfitting in a machine language model
US20210397787A1 (en) Domain-specific grammar correction system, server and method for academic text
US11151117B2 (en) Increasing the accuracy of a statement by analyzing the relationships between entities in a knowledge graph
US20220058349A1 (en) Data processing method, device, and storage medium
US11256409B2 (en) Systems, methods, devices, and computer readable media for facilitating distributed processing of documents
Kacupaj et al. Paraqa: a question answering dataset with paraphrase responses for single-turn conversation
US11403331B2 (en) Multi-term query subsumption for document classification
US20220198358A1 (en) Method for generating user interest profile, electronic device and storage medium
CN111144134B (zh) 基于OpenKiWi的翻译引擎自动化评测系统
RU2693328C2 (ru) Способы и системы для создания заменяющего запроса для введенного пользователем запроса
US20230140938A1 (en) Sentence data analysis information generation device using ontology, sentence data analysis information generation method, and sentence data analysis information generation program
JP2015203960A (ja) 部分情報抽出システム
US11443114B1 (en) Computing system for entity disambiguation and not-in-list entity detection in a knowledge graph

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210115

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210706