以下、本発明の目的、技術手段、およびメリットをより明白にするため、本発明の例示的な実施例について図面を参照しながら詳細に説明する。説明された実施例が本発明の一部の実施例のみであり、本発明の全ての実施例ではないことは明らかであろう。理解すべきなのは、本発明はここで説明された例示的な実施例に限定されない。当業者には、本開示の説明による実施例に基づき、容易に成し遂げることができた他の実施例の全ては本発明の思想から逸脱しない。
まず、本発明の実施例に係る機械翻訳評価技術の基本思想について簡単に説明する。
本発明者は、異なるタイプの翻訳すべき内容に対して翻訳品質の評価基準が変わることを認識した。言語横断質問応答システムにおける源言語の質問文の翻訳を例にすると、一般的な翻訳品質評価基準とは異なり、源言語の質問文の翻訳結果における各要素の位置が言語横断質問応答システムの性能に大きい影響を及ばしていないため、翻訳品質を評価する基準とするべきではないことが、多くの研究を経て本発明者より発見された。例えば、英語を源言語とし、中国語を目標言語としたとき(以下、別に説明がない限り、いずれもこのように仮定する)、英語の質問である「Is it cold at the night of early December,HK?」に関して、中国語の訳文である「是不是很冷,在十二月初,香港」における、各要素の位置は通常の語順に合致しないが、英語の質問の本来意味を正確に表しているため、翻訳品質が良くないとは言えない。また、翻訳結果の流暢さも、言語横断質問システムの性能に影響が大きくないため、翻訳品質を評価する標準とするべきではない。例えば、英語の質問である「What would be the highlights and the best things to see in Shanghai Expo 2010?」に関して、「什麼是亮点,並看到在上海2010年世博会最好的東西」と、「在上海世博会上看到的2010個亮点和最好的東西是什麼」との2つの翻訳候補がある。そのうち、2番目の翻訳候補は、より流暢にはなったが、英語の質問の本来意味とは合致しない。これに対して、1番目の翻訳候補は、それほど流暢には出なかったが、本来意味と大体合致しているため、その翻訳品質が良くないとは言えない。本発明者は、実際に、意味役割がある程度で文の意味を表すことができるため、翻訳品質を評価する1つの重要な指標になるべきだという知見を得た上で、後述する、意味役割付与を利用し項のアライメント確率に基づく新たな機械翻訳評価方法を提案する。
意味役割付与は、表層意味解析(shallow semantic parsing)技術の1種であり、センテンスを単位として、センテンスに含まれる意味情報を深く分析することではなく、センテンスにおける述語―項構造のみを分析する。意味役割付与のタスクは、具体的に、センテンス中の述語を中心にして、センテンスにおける各項と述語との関係を研究するとともに、意味役割付与によって項と述語との関係を表す。例えば、意味役割付与について、幾つかの具体例を下で示す。
〔具体例2〕
上海 充分 発揮 地縁優勢
[ARG0] [ARGM-ADV] [Pred] [ARG1]
意味役割は、中心意味役割と付加意味役割に分けられる。中心意味役割は、ARG+数字で表しており、一般に、動作主を表すARG0と、受動者を表すARG1と、動作の道具、手段などを表すARG2と、起点を表すARG3と、終点を表すARG4との5種類がある。付加意味役割は、AGRM−で表しており、動作の時間、場所など、例えば、前記の具体例1における「in 1989」を表す。
前述したように、本発明者は、意味役割がある程度で文の意味を表すことができることを認識した。2言語パラレル文対は相互に翻訳になるため、意味上では等価になるべきである。これが意味役割付与に反映されると、2つの対応するセンテンスは一致する述語―項構造を有するはずである。例えば、下記の具体例には、一対の二言語パラレル文の間における項のアライメント関係が示され、この2つのセンテンスが一致する述語―項構造を有することが分かる。
本発明の実施例では、前記知見に基づき、二言語パラレル文間の述語−項一致性、即ち項のアライメント関係に基づいて翻訳品質を確定する。より詳しく、機械翻訳によって得られた対応する目標言語の質問文と、源言語の質問文との述語−項一致性が高いと、あるいは、この2つの文の間における項のアライメント程度が高いと、目標言語の質問文の翻訳品質が高いと判断される。
以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法について、図1を参照しながら詳細に説明する。図1は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法のフローチャートを概略的に示す。
ステップS110において、図1に示すように、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文それぞれに対して意味役割付与を行う。
現在、自然言語処理の分野では意味役割付与に対する多くの研究が行われ、利用可能な多数の意味役割付与方法が存在し、かつ意味役割付与の規則もよく充実されている。該ステップでは、任意の既知の意味役割付与方法を用いて、源言語の質問文に対して意味役割付与を行うとともに、機械翻訳によって得られた対応する目標言語の質問文(つまり、翻訳評価をすべき翻訳候補)に対して意味役割付与を行う。ここで詳細な説明は省略する。
ステップS120において、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算する。
該ステップでは、ステップS110による意味役割付与結果に基づき、源言語の質問文における各項と目標言語の質問文における各項とのアライメント確率を計算する。より詳しく、該ステップでは、当該2つの文の間における項のアライメント関係を得て、さらに目標言語の質問文の翻訳品質を評価するために、源言語の質問文における項毎に対して、目標言語の質問文における項毎とのアライメント確率を計算する。
各項は幾つかの単語で構成されたものであり、源言語で1つの項に含まれる単語と目標言語の項に含まれる単語とが大部アライメントされると、当該2つの項もアライメントされる可能性が高い。そのため、1つの選択肢として、源言語の質問文における1つの項と目標言語の質問文における1つの項との項のアライメント確率を計算するときに、当該2つの項に対して単語アライメントを行い、単語アライメントの結果によって当該2つの項のアライメント確率を確定できる。
所謂単語アライメントとは、2言語パラレル文において相互翻訳関係がある単語の間で対応関係を確立することである。単語アライメントは自然言語処理での慣用技術であり、分類方法によって、監視的(supervised)および無監視的(unsupervised)の単語アライメントや、発見的(heuristic)および統計的(statistic)の単語アライメントなどに分けられる。該ステップでは、任意の適当な単語アライメント方法を採用し、源言語の質問文における1つの項と目標言語の質問文における1つの項に対して単語アライメント処理を行い、さらに、単語アライメント処理の結果に応じて当該2つの項のアライメント確率を確定できる。具体的に、2つの項の間で、アライメントされた単語が多いほど、当該2つの項のアライメント確率が大きい。
他の選択肢として、主要語のアライメント結果および項の間の距離によって項のアライメント確率を確定してもよい。主要語とは、修飾フレーズにおいて、修飾語によって修飾や限定される中心成分である。1つの項の主要語は、当該項内の他の単語よりも代表性がある場合が多い。そのため、2つの項の主要語がアライメントされる場合、他にアライメントされた単語が少ないとしても、当該2つの項がアライメントされる可能性が高い。一方、2つのアライメントされた項の意味役割タグが同じ場合が多く、同じでないとしても、当該2つの項の間の距離がかなり近いことが、数多い統計で判明された。中国語センテンスにおける項ARG0を例にすると、多い統計から分かるように、一般的に、当該中国語センテンスにおけるARG0が英語センテンスにおけるARG0とアライメントされる場合、2つの項の間の距離はゼロであり、当該中国語センテンスにおけるARG0と英語センテンスにおけるARG1とのアライメントが大幅に減少された場合、2つの項の間の距離は1であり、当該中国語センテンスにおけるARG0と英語センテンスにおけるARG2とがほとんどアライメントされない場合、2つの項の間の距離は2である。即ち、2つの項の間の距離が近いほど、当該2つの項のアライメント確率が高く、2つの項の間の距離が遠いほど、当該2つの項のアライメント確率が低い。
従って、上述したように、源言語の質問文における1つの項と目標言語の質問文における1つの項に対して、当該2つの項の主要語の単語アライメント結果(即ち、アライメントされるか否か)および当該2つの項の間の距離に基づいて、当該2つの項のアライメント確率を確定してもよい。例えば、具体的な状況に応じて、主要語のアライメント結果および項の間の距離にそれぞれ適切な加重値を設定し、両者の加重和を算出して2つの項のアライメント確率を確定できる。
以上、源言語の質問文における1つの項と目標言語の質問文における1つの項との項のアライメント確率を計算する方法を例示した。もちろん、これは例示的な説明であり、本発明に対して何ら制限的な意味を有しない。具体的な状況に応じて、他の手段で2つの項の間のアライメント確率を計算してもよい。例えば、2つの項の間の単語アライメント結果、主要語のアライメント結果、および項の間の距離を同時に考えて、項のアライメント確率を確定してもよい。
図1に戻り、ステップS130において、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定する。
該ステップでは、様々な方法で、ステップS120において計算された各項のアライメント確率を利用して目標言語の質問文の翻訳品質を確定できる。
各アライメント確率のうち、最大アライメント確率が翻訳品質に響く1つの要因となることを統計から分かったため、選択肢として、計算された各アライメント確率のうち最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。そして、最大アライメント確率が大きいほど、目標言語の質問文の翻訳品質が優れる。
また、各アライメント確率の平均アライメント確率も翻訳品質に大きい影響を与えることを統計から分かったため、計算された各アライメント確率の平均アライメント確率、および最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。また、平均アライメント確率および最大アライメント確率を除いて、源言語の質問文の長さや、目標言語の質問文の長さや、目標言語の質問文における述語の数などの他の関連する影響因子をさらに併せて、目標言語の質問文の翻訳品質を確定してもよい。1つの具体例として、前記各影響因子のそれぞれに適切な加重値を設定し各影響因子の加重和を算出することで、目標言語の質問文の翻訳品質を確定する。
選択肢として、前記各影響因子を用いて数理モデルを立てることで、目標言語の質問文の翻訳品質を確定してもよい。例えば、式(1)に示すように、予めトレーニングされた多項式ロジスティック回帰モデルを利用して目標言語の質問文の翻訳品質を採点することで、翻訳品質を評価する。
そのうち、P(Y=k|x)はモデルの各出力値(即ち、各翻訳品質の得点)の論理的な可能性を表し、xはモデルの特徴値であり、Wkは各特徴値の加重値であり、その具体値はモデルのトレーニング過程でトレーニングによって求められ、Kは特徴値の数であり、k*は最大な論理的な可能性を有する出力値、即ち可能性が最も高い翻訳品質の得点である。前述したように、各アライメント確率のうち、最大アライメント確率が1つの要因となるため、当該モデルの特徴値は最大アライメント確率とされる。また、当該モデルの特徴値は、例えば、平均アライメント確率、源言語の質問文の長さ、目標言語の質問文の長さ、目標言語の質問文における述語の数などのような他の関連因子を含んでもよい。
当該多項式ロジスティック回帰モデルは、翻訳品質を評価する前にSAS、SPSSなどのトレーニング方法によって予めトレーニングによって求められる。モデルトレーニングは数理統計分野の慣用技術であり、ここで詳細な説明を省略する。なお、トレーニング集合における各目標言語の質問文を用いてモデルトレーニングを行うときに、様々な規則に基づいて手動で当該各目標言語の質問文を採点できる。例えば、トレーニング集合における各目標言語の質問文によって言語横断質問応答システムで探し出した解答の正確性に基づいて、当該各目標言語の質問文を手動で採点できる。表は、採点規則の具体例の一つを示す。
前記多項式ロジスティック回帰モデルは、ただ1つの選択肢としての具体例であり、本発明を限定するものではない。SVM(サポートベクターマシン)、非線形モデル、ニューラルネットワークなどのような他の適当なモデルを用いて目標言語の質問文の翻訳品質を採点してもよい。
以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価方法について詳細に説明した。本発明者は、既にテスト集合を用いて検証を行った。検証結果によると、該機械翻訳評価方法を用いて源言語の質問文の翻訳品質を評価した正確率は、約90%に達する。これから分かるように、本発明の実施例に係る機械翻訳方法は、より正確な機械翻訳評価を提供でき、さらに言語横断質問応答システムの性能を向上させる。以下、前述した機械翻訳評価方法が適用される、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法について説明する。図2は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法のフローチャートを例示する。
図2に示すように、ステップS210において、翻訳しようとする第1言語の内容を受け付けて、該第1言語の内容のタイプを判断する。
言語横断質問応答システムにおいて、翻訳すべき内容は、ユーザに入力された源言語の質問文と、応答システムにて検索された、源言語と異なる他の言語(以下、目標言語と略称する)の質問結果と、源言語に翻訳すべき目標言語のコーパスとを少なくとも含む。
前述したように、本発明者は、異なるタイプの翻訳すべき内容によって、翻訳品質の評価基準が変わることを認識した。そのため、該ステップで翻訳しようとする第1言語の内容のタイプを判断することで、後の処理でそのタイプに適した評価基準および翻訳ツールを選べる。
ステップS220において、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択する。
他の翻訳エンジンに比べて圧倒的に優れる翻訳エンジンはなく、他の翻訳方法に比べて圧倒的に優れる翻訳方法もない。この点は統計から知られている。そのため、該ステップでは、確定された第1言語の内容のタイプに対して、該タイプに適した複数の翻訳エンジンを選択する。そのうち、該タイプに適した前記複数の翻訳エンジンは予め確定されたものである。より詳しくは、google、bing、baiduなどの様々な翻訳エンジンを予め利用して該タイプに属する第1言語の内容を大量に翻訳しておくともに、既存の様々な評価モデルまたはマニュアル評価などの手段によって各翻訳エンジンの翻訳結果を評価(オフライン評価)することで、翻訳品質が良い幾つかのエンジンを該タイプに適した翻訳エンジンとして確定する。
ステップS230において、前記複数の翻訳エンジンをそれぞれ用いて前記第1言語の内容を翻訳して、複数の第2言語の翻訳候補を得る。
ステップS240において、第2言語の翻訳候補毎の翻訳品質を採点し、得点が一番高い翻訳候補を前記第1言語の内容の翻訳として選択する。
該ステップでは、任意の適当な翻訳品質評価方法を用いて、ステップS230で得られた第2言語の翻訳候補毎の翻訳品質を採点(オンライン評価)することが可能であり、本実施例は、これに対して限定がない。
なお、前記第1言語の内容のタイプが質問文である場合、前に図1を参照しながら説明した本発明の実施例に係る機械翻訳評価方法によって、第2言語の翻訳候補毎の翻訳品質を採点する。具体的に、評価すべき1つの第2言語の翻訳候補について、第1言語の内容、および当該第2言語の翻訳候補に対してそれぞれに意味役割付与を行ってから、第1言語の内容における意味役割が付与された項毎と当該第2言語の翻訳候補における意味役割が付与された項毎とのアライメント確率を計算し、最後に計算された各アライメント確率に基づいて当該第2言語の翻訳候補の翻訳品質を採点できる。前記処理の具体的な操作は、前に図1を参照しながら説明した各ステップの操作と同じであるので、ここで重なる説明を省略する。
以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳方法を詳細に説明した。該実施例によれば、異なるタイプの翻訳すべき内容に対して、オフライン評価で予め確定された当該タイプに適した翻訳エンジンを選択し、複数の翻訳エンジンにてタイプ毎の翻訳内容を翻訳し、オンライン評価により得点が一番高い翻訳候補を最終の翻訳として選択する。これにより、様々なタイプの翻訳すべき内容のいずれに対しても、優れる翻訳結果の提供を確保できる。
以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置について、図3を参照しながら説明する。図3は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置の機能構成を示すブロック図である。図3に示すように、機械翻訳評価装置300は、付与ユニット310と、アライメントユニット320と、評価ユニット330を備える。前記各ユニットの具体的な機能や操作は、基本的に前に図1を説明したとおりであるので、重なる説明を避けるため、以下、同じ部分に対する詳細な説明を省略ながら、前記装置を簡単に説明する。
付与ユニット310は、源言語の質問文、および機械翻訳によって得られた対応する目標言語の質問文に対してそれぞれ意味役割付与を行うように配置される。具体的に、付与ユニット310は、任意な既知の意味役割付与方法を用いて源言語の質問文に対して意味役割付与を行い、機械翻訳によって得られた対応する目標言語の質問文に対して意味役割付与を行う。ここで重なる説明を省略する。
アライメントユニット320は、源言語の質問文において意味役割が付与された項毎と、目標言語の質問文において意味役割が付与された項毎とのアライメント確率を計算するように配置される。具体的に、2つの文の間の項のアライメント関係を得て、さらに目標言語の質問文の翻訳品質を評価するために、アライメントユニット320は、源言語の質問文における項毎に対して、目標言語の質問文における項毎とのアライメント確率を計算する。
アライメントユニット320は、様々な適当な手段を用いて前記項のアライメント確率を計算できる。1つの選択肢として、源言語の質問文における1つの項と目標言語の質問文における1つの項との項のアライメント確率を計算するときに、当該2つの項に対して単語アライメントを行い、単語アライメントの結果によって当該2つの項のアライメント確率を確定できる。そのうち、2つの項の間でアライメントされた単語が多いほど、当該2つの項のアライメント確率が大きい。他の選択肢として、源言語の質問文における1つの項と目標言語の質問文における1つの項に対して、この2つの項における主要語の単語アライメント結果およびこの2つの項の間の距離によって、この2つの項のアライメント確率を確定してもよい。具体的に、具体的な状況に応じて、主要語のアライメント結果および項の間の距離にそれぞれ適切な加重値を設定し両者の加重和を算出して、2つの項のアライメント確率を確定できる。
評価ユニット330は、計算された各アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定するように配置される。評価ユニット330は、多様な手段でアライメントユニット320から算出された各項のアライメント確率を用いて、目標言語の質問文の翻訳品質を確定できる。
なお、評価ユニット330は、計算された各アライメント確率のうち最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。そのうち、最大アライメント確率が大きいほど、目標言語の質問文の翻訳品質が良い。
なお、評価ユニット330は、計算された各アライメント確率の平均アライメント確率および最大アライメント確率に基づいて、前記目標言語の質問文の翻訳品質を確定してもよい。また、評価ユニット330は、さらに、源言語の質問文の長さや、目標言語の質問文の長さや、目標言語の質問文における述語の数などの他の関連する影響因子を併せて、目標言語の質問文の翻訳品質を確定してもよい。1つの具体例として、評価ユニット330は、前記各影響因子にそれぞれ適切な加重値を設定し、各影響因子の加重和を算出して目標言語の質問文の翻訳品質を確定できる。
なお、評価ユニット330は、少なくとも最大アライメント確率を含む前記各影響因子を用いて数理モデルを立てることで、目標言語の質問文の翻訳品質を確定してもよい。例えば、前に示された式(1)によって、予めトレーニングされた多項式ロジスティック回帰モデルを利用して、目標言語の質問文の翻訳品質を採点して翻訳品質を評価できる。
当該多項式ロジスティック回帰モデルは、翻訳品質を評価する前に、SAS、SPSSなどのトレーニング方法によってトレーニングで予め求められる。そのうち、トレーニング集合における各目標言語の質問文を用いてモデルのトレーニングを行うときに、様々な規則に基づいて手動で当該各目標言語の質問文を採点できる。例えば、トレーニング集合における各目標言語の質問文によって言語横断質問応答システムで探し出した解答の正確性に基づいて、当該各目標言語の質問文を手動で採点できる。
前記多項式ロジスティック回帰モデルは、ただ1つの選択肢としての具体例であり、本発明を限定するものではない、SVM(サポートベクターマシン)、非線形モデル、ニューラルネットワークなどのような他の適当なモデルを用いて目標言語の質問文の翻訳品質を採点してもよい。
以上で、本発明の実施例に係る言語横断質問応答システム用の機械翻訳評価装置について詳細に説明した。該装置は、より正確な機械翻訳評価を提供でき、さらに言語横断質問応答システムの性能を向上させる。
以下、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置について、図4を参照しながら説明する。図4は、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置の機能構成を示すブロック図である。図4に示すように、機械翻訳装置400は、判断ユニット410と、選択ユニット420と、翻訳ユニット430と、確定ユニット440とを備える。前記各ユニットの具体的な機能や操作は、基本的に、前に図2および図3で説明したのと同じであるので、重なる説明を避けるため、以下、同じ部分に対する詳細な説明を省略しながら、前記装置に対して簡単に説明する。
判断ユニット410は、翻訳しようとする第1言語の内容を受け付け、該第1言語の内容のタイプを判断するように配置される。前述したように、言語横断質問応答システムにおいて、翻訳すべき内容は、ユーザに入力された源言語の質問文と、応答システムにて検索された、源言語と異なる他の言語(以下、目標言語と略称する)の質問結果と、源言語に翻訳すべき目標言語のコーパスとを少なくとも含む。異なるタイプの翻訳すべき内容によって、翻訳品質の評価基準が変わるべきである。従って、判断ユニット410は、後の処理で翻訳しようとする第1言語の内容のタイプに適する評価基準および翻訳ツールを選べるために、翻訳しようとする第1言語の内容のタイプを判断する。
選択ユニット420は、確定されたタイプに基づいて、該タイプに適した複数の翻訳エンジンを選択するように配置される。他の翻訳エンジンに比べて圧倒的に優れる翻訳エンジンはなく、他の翻訳方法に比べて圧倒的に優れる翻訳方法もない。この点は統計から知られている。そのため、選択ユニット420は、確定された第1言語の内容のタイプに対して、該タイプに適した複数の翻訳エンジンを選択する。そのうち、該タイプに適した前記複数の翻訳エンジンは予め確定されたものである。より詳しく、様々な翻訳エンジンを予め利用して該タイプに属する第1言語の内容を大量に翻訳しておくともに、既存の様々な評価モデルまたはマニュアル評価などの手段によって各翻訳エンジンの翻訳結果を評価(オフライン評価)することで、翻訳品質が良い幾つかのエンジンを該タイプに適した翻訳エンジンとして確定する。
翻訳ユニット430は、前記複数の翻訳エンジンを用いてそれぞれに前記第1言語の内容を翻訳して、第2言語の翻訳候補を複数得るように配置される。
確定ユニット440は、第2言語の翻訳候補毎の翻訳品質を採点して、得点が一番高い翻訳候補を前記第1言語の内容の翻訳として選択するように配置される。確定ユニット440は、任意の適当な翻訳品質評価方法を用いて、翻訳ユニット430によって得た第2言語の翻訳候補毎の翻訳品質を採点(オンライン評価)でき、本実施例はこれに対して限定がない。
なお、前記第1言語の内容のタイプが質問文である場合、確定ユニット440は、前に図3を参照しながら説明した機械翻訳評価装置を用いて、第2言語の翻訳候補毎の翻訳品質を採点できる。具体的に、確定ユニット440は、第1言語の内容および1つの第2言語の翻訳候補に対してそれぞれ意味役割付与を行うための付与ユニットと、第1言語の内容における意味役割が付与された項毎と、当該第2言語の翻訳候補における意味役割が付与された項毎とのアライメント確率を計算するためのアライメントユニットと、計算された各アライメント確率に基づいて、当該第2言語の翻訳候補の翻訳品質を採点するための評価ユニットとを備える。該確定ユニット440における各ユニットの機能や具体的な操作は、前に図3を参照しながら説明した機械翻訳評価装置と同じであるので、ここで重なる説明を省略する。
以上、本発明の実施例に係る言語横断質問応答システム用の機械翻訳装置を詳細に説明した。該実施例によれば、異なるタイプの翻訳すべき内容に対して、オフライン評価によって予め確定された当該タイプに適した翻訳エンジンを選択し、複数の翻訳エンジンにてタイプ毎の翻訳内容を翻訳し、オンライン評価により得点が一番高い翻訳候補を最終の翻訳として選択する。これにより、様々なタイプの翻訳すべき内容のいずれに対しても、優れる翻訳結果の提供を確保できる。
以下、本発明の実施例を実現するための、言語横断質問応答システム用の機械翻訳評価装置並びに機械翻訳装置に用いられる計算装置の概略的なブロック図について、図5を参照しながら説明する。
図5に示すように、計算装置500は、1つまたは複数のプロセッサ502と、記憶手段504と、入力手段506と、出力手段508とを備え、これらの要素は、バスシステム510および/または他の形式の接続手段(図略)を介して互いに接続されている。なお、図5に示された計算装置500の要素とその構成は例示的なものに過ぎず、本発明はこれらに限定されない。計算装置500は、需要に応じて、他の要素や構成を備えてもよい。
プロセッサ502は、中央演算処理装置(CPU)、あるいはデータ処理機能および/または命令実行機能を有する他の形の処理ユニットであってもよい。プロセッサ502は、計算装置500における他の要素を制御して、所望の機能を実行できる。
記憶手段504は、1つまたは複数のコンピュータプログラム製品を含み、前記コンピュータプログラム製品は、様々な形式のコンピュータ読取り可能な記録媒体、例えば、揮発性メモリおよび/または不揮発性メモリを含む。前記揮発性メモリには、例えば、ランダムアクセスメモリ(RAM)および/またはキャッシュメモリ(cache)などが含まれる。前記不揮発性メモリには、例えば、リードオンリーメモリ(ROM)、ハードディスク、フラッシュメモリなどが含まれる。前記コンピュータ読取り可能な記録媒体には、1つまたは複数のコンピュータプログラム命令が記憶され、プロセッサ502は前記プログラム命令を実行して前述した本発明の実施例の機能および/または他の所望の機能を実現できる。また、前記コンピュータ読取り可能な記録媒体には、様々なアプリケーションおよびいろいろなデータ、例えば、前述した源言語の質問文、翻訳によって得られた目標言語の質問文、各項の意味役割、2つの項の間の単語アライメント結果、各項のアライメント確率、目標言語の質問文の得点などが記憶される。
入力手段506は、ユーザからの入力情報、例えば、源言語質問、翻訳しようとする第1言語の内容などを受け付けるためのものであり、有線・無線ネットワークアダプタ、キーボード、マウス、タッチスクリーン、マイクなどのような色々な入力デバイスを含む。
出力手段508は、様々な情報、例えば目標言語の質問文の翻訳品質、第1言語の内容に対する第2言語の翻訳などを外部に出力するためのものであり、有線・無線ネットワークアダプタ、ディスプレイ、プロジェクタ、テレビのような色々な表示装置などを含む。
以上、具体的な実施例を併せて本発明の基本原理を説明したが、明細書で開示されたメリット、利点、効果などは例に過ぎず、限定の意味がない。これらメリット、利点、効果などが本明細書の各実施例にとって必要なものであるとは言えない。また、前述した詳細な説明は、例示や理解のための開示に過ぎず、限定の意味がない。前述した詳細な説明が本発明にとって必要なものであるとは言えない。
本明細書に記載されたユニット、手段、装置、およびシステムのブロック図は具体例に過ぎず、必ずブロック図に示された方法で接続、設置、配置することを要求または暗示していない。これらのユニット、手段、装置、システムが任意の方式で接続、設置、配置されることは、当業者にとっては自明であろう。「備える」、「含む」、「具備」などのような用語は開放性用語で、「あるものを含むが、それだけに限定されず」の意味であり、互いに替えて用いられる。ここで使用している「または」と「および」という用語は、「および/または」の意味で、文脈で明確に排除された場合を除く、互いに替えて用いられる。ここで使用している「例えば」という用語は、「例えば〜だが、それだけに限定されず」の意味であり、互いに替えて用いられる。
また、ここで用いられるように、「少なくとも1つ」で始まる項の列挙の中で使用される「または」は、分離の列挙を示し、例えば「A、BまたはCの少なくとも1つ」の列挙は、A、またはB、またはC、またはAB、またはAC、またはBC、またはABC(即ちAとBとC)を意味する。また、「例示的」は、説明した例が好ましいとか、その他の例よりもよいことを意味しない。
なお、本明細書のシステムおよび方法において、各ユニットまたは各ステップは、分解および/または再組合せが可能である。これらの分解および/または再組合せは、本明細書の開示と等しい技術案と認められるべきである。
ここで述べている技術に対して、請求項が定義する教示技術を逸脱しない範囲で、各種の修正、入れ替え、変更を行うことが可能である。また、本願に係る特許請求の範囲は、前述した処理、装置、製造、事件の組立、手段、方法、および動作の詳細な限定に限らない。ここで述べている実施態様と基本的に同じ機能を実行するあるいは基本的に同じ結果を実現する、既存または開発しようとする処理、装置、製造、事件の組立、手段、方法、および動作を利用できる。従って、本願の特許請求の範囲は、その保護範囲に属するこのような処理、装置、製造、事件の組立、手段、方法、および動作を含む。
本明細書の実施態様の詳細は、当業者が本発明を実現または利用できるように開示された。これらの態様に対する色々な変更は、当業者にとって自明であろう。ここで定義された一般原理は、本発明の範囲を逸脱しなく、他の態様に応用できる。そのため、本発明は、ここで開示された態様に限定されず、ここで開示された原理と新たな特徴に一致する最も広い範囲を有する。
前記の説明は、例示および説明を目的で提供される。また、この説明は、本発明の実施例をここで開示した形に限定する意図がない。以上で幾つかの具体態様および実施例を検討したが、その変形、修正、変更、追加、およびその一部の組合せは、当業者にとって自明であろう。