JP7079309B2

JP7079309B2 - 質問応答処理方法、装置、電子機器及び記憶媒体

Info

Publication number: JP7079309B2
Application number: JP2020196082A
Authority: JP
Inventors: ディン，ユチン; リュウ，カイ; リュウ，ジン; チン，ヤン
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-12-27
Filing date: 2020-11-26
Publication date: 2022-06-01
Anticipated expiration: 2040-11-26
Also published as: JP2021108111A; KR102431232B1; CN111125335A; CN111125335B; KR20210086436A; US11461556B2; EP3842988A1; US20210200956A1

Description

本出願はコンピュータ技術分野に関し、具体的に自然言語処理の技術分野に関し、特に質問応答処理方法、装置、電子機器及び記憶媒体に関する。

質問応答機能は、現在様々な情報検索システムの開発者がユーザに提供するために努力している高度な機能である。人間でユーザからの質問に応答するには高い人件費がかかるゆえ、人件費を削減するために、どのようにしてユーザからの質問にスマート且つ自動的に応答するかはすでに当該分野において急務となっている技術的課題である。

関連技術において、通常は質問に対応する答えを自動的に出す方法が二種類あり、第１の方法は検索に基づく質問システムがまず質問に対応する答えをユーザに返すものであり、そのうち、第１の方法が質問に対応する答えを自動的に出す一般的なプロセスは、入力された質問に対し、まず、情報検索という方法（例えば検索エンジン技術）で大量のテキストから一定量の候補テキストを見つけ、次に、語義照合、特徴提出等の様々な方法ですべての候補テキストの答えの特徴を計算し、それにより、テキストが正確な答えである信頼度を計算し、信頼度の最も高いテキストを答えとするものである。第２の方法は質問応答のデータベースに基づいて質問に対応する答えを返すものであり、その一般的なプロセスは、ユーザからの質問ｑに対し、データベース内のすべての＜質問－応答＞グループをトラバースし、ｑと質問との照合信頼度、及びｑと回答との照合信頼度をそれぞれ計算し、両方の信頼度も既定のしきい値より高い応答を該質問の答えとするものである。

しかしながら、本出願を実現する過程において発明者は、検索に基づく質問応答システムの最適化時に、質問応答システムにおける２つのステップのモデルをそれぞれ最適化する必要があり、仕事量が多いだけではなく、異なるステップのモデルの目標が一致しないことによって引き起こされる効果損失が存在し、質問応答データベースに基づく質問応答システムにおいて、選択された技術案により、答えのカバー率が低く、又は答えの正解率が低く、性能が不足するという課題が存在し、さらに質問に対応する答えの取得に必要な時間が長いということを発見した。そのため、どのようにして質問に対応する答えを正確かつ素早く提供するかは現在急務となっている技術的課題である。

本出願は質問応答処理方法、装置、電子機器及び記憶媒体を提供し、質問応答の照合のプロセスにおいて、答え信頼度を計算する必要がなく、質問に対応する答えを取得する効率が向上し、さらに、本実施形態において答え候補に対応する語義表現ベクトルは、答え候補自体の語義表現ベクトルと、答え候補が配置されている文章の文章タイトルの語義ベクトルとを組み合わせることによって決定されるものであるため、答え候補自体、及び答え候補が配置されている文章の文章タイトルと、与えられた質問との関連性に基づき、与えられた質問に一致した正確な答えが特定され、質問応答の照会精度が向上する。

本出願の第１態様の実施例は質問応答処理方法を提供し、回答対象の質問を取得するステップと、前記回答対象の質問をそれぞれ第１の質問語義表現モデル及び第２の質問語義表現モデルに入力することにより、前記回答対象の質問の第１の語義表現ベクトル及び第２の語義表現ベクトルを取得するステップであって、前記第１の質問語義表現モデルは質問サンプル及び前記質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、前記第２の質問語義表現モデルは前記質問サンプル、及び前記答えサンプルに対応する文章タイトルに基づいてトレーニングされたものであるステップと、前記回答対象の質問の目標語義表現ベクトルが得られるように、前記第１の語義表現ベクトル及び前記第２の語義表現ベクトルに基づいて連結処理を行うステップと、前記回答対象の質問の目標語義表現ベクトルを、予め構築された答えベクトル索引ライブラリ内の各答え語義表現ベクトルと照合するステップであって、前記答えベクトル索引ライブラリは答えサンプルセル内のすべての答え候補を語義表現ベクトルに変換することによって構築されたものであり、前記答え候補に対応する答え語義表現ベクトルは前記答え候補自体の語義表現ベクトル、及び前記答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づいて得られたものであるステップと、照合して一致した答え語義表現ベクトルに基づき、対応する目標答えを取得し、かつ前記目標答えを出力するステップと、を含む。

本出願の一実施例において、前記答え候補自体の語義表現ベクトルは、答え語義表現モデルによって前記答え候補に対して語義ベクトル化表示をして得られたものであり、前記タイトル語義表現ベクトルは、タイトル語義表現モデルによって前記答え候補に対応する文章タイトルに対して語義ベクトル化表示をして得られたものであり、前記第１の質問語義表現モデルは、前記質問サンプル及び前記質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、前記タイトル語義表現モデルは、前記質問サンプル、及び前記答えサンプルに対応する文章タイトルに基づいてトレーニングされたものである。

本出願の一実施例において、前記答えサンプルは間違った答えサンプル及び正しい答えサンプルを含み、前記質問サンプルの語義表現ベクトルが得られるように、初期の第１の語義表現モデルによって前記質問サンプルに対して語義ベクトル化表示を行うステップと、前記間違った答えサンプルの語義表現ベクトル及び前記正しい答えサンプルの語義表現ベクトルが得られるように、初期の第２の語義表現モデルによって前記間違った答えサンプル及び前記正しい答えサンプルに対してそれぞれ語義ベクトル化表示を行うステップと、前記質問サンプルの語義表現ベクトル及び前記間違った答えサンプルの語義表現ベクトルに基づき、前記質問サンプルと間違った答えサンプルとの間の第１のベクトル類似度を決定するステップと、前記質問サンプルの語義表現ベクトル及び前記正しい答えサンプルの語義表現ベクトルに基づき、前記質問サンプルと正しい答えサンプルとの間の第２のベクトル類似度を決定するステップと、前記第１のベクトル類似度及び前記第２のベクトル類似度に基づき、前記第１のベクトル類似度及び前記第２のベクトル類似度が第１の予め設定された条件を満たすまで前記初期の第１の語義表現モデル及び前記第２の語義表現モデルのモデルパラメータを調整するステップと、第１の予め設定された条件が満たされる場合に得られた第１の語義表現モデルを前記答え語義表現モデルとし、第１の予め設定された条件が満たされる場合に得られた第２の語義表現モデルを前記第１の質問語義表現モデルとするステップと、によってトレーニングして前記第１の質問語義表現モデルと前記答え語義表現モデルを取得する。

本出願の一実施例において、前記答えサンプルは間違った答えサンプル及び正しい答えサンプルを含み、前記間違った答えサンプルに対応する文章タイトルの第１のタイトル語義ベクトル及び前記正しい答えサンプルに対応する文章タイトルの第２のタイトル語義ベクトルが得られるように、初期の第３の語義表現モデルによって前記間違った答えサンプルに対応する文章タイトル及び前記正しい答えサンプルに対応する文章タイトルに対して語義ベクトル化表示を行うステップと、前記質問サンプルの語義表現ベクトルが得られるように、初期の第４の語義表現モデルによって前記質問サンプルに対して語義ベクトル化表示を行うステップと、前記質問サンプルの語義表現ベクトル及び前記第１のタイトル語義表現ベクトルに基づき、前記質問サンプルと前記間違った答えサンプルに対応する文章タイトルとの間の第３のベクトル類似度を決定するステップと、前記質問サンプルの語義表現ベクトル及び前記第２のタイトル語義表現ベクトルに基づき、前記質問サンプルと前記間違った答えサンプルに対応する文章タイトルとの間の第４のベクトル類似度を決定するステップと、前記第３のベクトル類似度及び前記第４のベクトル類似度に基づき、前記第３のベクトル類似度及び前記第４のベクトル類似度が第２の予め設定された条件を満たすまで前記初期の第３の語義表現モデル及び第４の語義表現モデルのモデルパラメータを調整するステップと、第２の予め設定された条件が満たされる場合に得られた第３の語義表現モデルを前記タイトル語義表現モデルとし、第２の予め設定された条件が満たされる場合に得られた第３の語義表現モデルを前記第２の質問語義表現モデルとするステップと、によってトレーニングして前記タイトル語義表現モデル及び第２の質問語義表現モデルを取得する。

本出願の一実施例において、前記第１の語義表現モデル、前記第２の語義表現モデル、前記第３の語義表現モデル及び前記第４の語義表現モデルはいずれも予めトレーニングされた語義表現モデルであり、前記予めトレーニングされた語義表現モデルは教師なしデータを用いてトレーニングされたものである。

本出願の一実施例において、前記答え候補自体の語義表現ベクトル、及び前記答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づいて、前記答え候補に対応する答え語義表現ベクトルを取得するステップは具体的に、前記答え候補自体の語義表現ベクトルに予め設定された第１の重みをかけて、新しい語義表現ベクトルを取得するステップと、前記タイトル語義表現ベクトルに予め設定された第２の重みをかけて、新しいタイトル語義表現ベクトルを取得するステップと、前記新しい語義表現ベクトル及び前記新しいタイトル語義表現ベクトルを連結し、連結された語義表現ベクトルを前記答え候補に対応する答え語義表現ベクトルとするステップと、を含み、前記第１の語義表現ベクトル及び前記第２の語義表現ベクトルに基づいて連結処理を行うことによって、前記回答対象の質問の目標語義表現ベクトルを取得するステップは、前記回答対象の質問の第１の中間語義表現ベクトルが得られるように、前記第１の語義表現ベクトルに前記第１の重みをかけるステップと、前記回答対象の質問の第２の中間語義表現ベクトルが得られるように、前記第２の語義表現ベクトルに前記第２の重みをかけるステップと、前記回答対象の質問の目標語義表現ベクトルが得られるように、前記第１の中間語義表現ベクトル及び前記第２の中間語義表現ベクトルに対して連結処理を行うステップと、を含む。

本出願の実施例の質問応答処理方法は、回答対象の質問の答えを決定する際には、第１の質問語義表現モデルと第２の語義表現モデルを組み合わせて回答対象の質問に対してそれぞれ語義表現を行い、それぞれ得られた語義表現ベクトル結果に対して連結処理を行い、連結された語義ベクトルを回答対象の質問の語義表現ベクトルとし、回答対象の質問の語義表現ベクトルに一致した答え語義ベクトルを答えベクトル索引ライブラリから取得し、一致した答えの語義ベクトルに対応する目標答えを回答対象の質問の目標答えとし、且つ目標答えを出力する。従って、質問応答照合のプロセスにおいて、答え信頼度を計算する必要がなく、質問に対応する答えを取得する効率が向上し、さらに、本実施形態において答え候補に対応する語義表現ベクトルは、答え候補自体の語義表現ベクトルと、答え候補が配置されている文章の文章タイトルの語義ベクトルとを組み合わせることによって決定されるものであるため、答え候補自体、及び答え候補が配置されている文章の文章タイトルと、与えられた質問との関連性に基づき、与えられた質問に一致した正確な答えが特定され、質問応答の照会精度が向上する。

本出願の第２態様の実施例は質問応答処理装置を提供し、回答対象の質問を取得するための取得モジュールと、前記回答対象の質問をそれぞれ第１の質問語義表現モデル及び第２の質問語義表現モデルに入力することにより、前記回答対象の質問の第１の語義表現ベクトル及び第２の語義表現ベクトルを取得するための語義表現モジュールであって、前記第１の質問語義表現モデルは質問サンプル及び前記質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、前記第２の質問語義表現モデルは前記質問サンプル、及び前記答えサンプルに対応する文章タイトルに基づいてトレーニングされたものである語義表現モジュールと、前記回答対象の質問の目標語義表現ベクトルが得られるように、前記第１の語義表現ベクトル及び前記第２の語義表現ベクトルに基づいて連結処理を行うための連結モジュールと、前記回答対象の質問の目標語義表現ベクトルを、予め構築された答えベクトル索引ライブラリ内の各答え語義表現ベクトルと照合するための照合モジュールであって、前記答えベクトル索引ライブラリは答えサンプルセル内のすべての答え候補を語義表現ベクトルに変換することによって構築されたものであり、前記答え候補に対応する答え語義表現ベクトルは前記答え候補自体の語義表現ベクトル、及び前記答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づいて得られたものである照合モジュールと、照合して一致した答え語義表現ベクトルに基づき、対応する目標答えを取得し、かつ前記目標答えを出力するための答え取得モジュールと、を含むことを特徴とする。

本出願の実施例の質問応答処理装置は、回答対象の質問の答えを決定する際には、第１の質問語義表現モデルと第２の語義表現モデルを組み合わせて回答対象の質問に対してそれぞれ語義表現を行い、それぞれ得られた語義表現ベクトル結果に対して連結処理を行い、連結された語義ベクトルを回答対象の質問の語義表現ベクトルとし、回答対象の質問の語義表現ベクトルに一致した答え語義ベクトルを答えベクトル索引ライブラリから取得し、一致した答えの語義ベクトルに対応する目標答えを回答対象の質問の目標答えとし、且つ目標答えを出力する。従って、質問応答照合のプロセスにおいて、答え信頼度を計算する必要がなく、質問に対応する答えを取得する効率が向上し、さらに、本実施形態において答え候補に対応する語義表現ベクトルは、答え候補自体の語義表現ベクトルと、答え候補が配置されている文章の文章タイトルの語義ベクトルとを組み合わせることによって決定されるものであるため、答え候補自体、及び答え候補が配置されている文章の文章タイトルと、与えられた質問との関連性に基づき、与えられた質問に一致した正確な答えが特定され、質問応答の照会精度が向上する。

本出願の第３態様の実施例は電子機器を提供し、少なくとも１つのプロセッサと、前記少なくとも１つのプロセッサと通信可能に接続されるメモリとを含み、前記メモリには前記少なくとも１つのプロセッサにより実行可能な命令が記憶され、前記命令が、前記少なくとも１つのプロセッサにより実行される場合、本出願の実施例の質問応答処理方法が実行される。

本出願の第４態様の実施例は、コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令が実行される場合、本出願の実施例に開示された質問応答処理方法が実行される。
本出願の第５の態様の実施例は、コンピュータプログラムを提供し、前記コンピュータプログラムのおける命令が実行された場合に、第１の態様の実施例に記載の質問応答処理方法が実行される。

上記出願における一実施例は以下の利点又は有益な効果を有する。質問応答の照合のプロセスにおいて、答え信頼度を計算する必要がなく、質問に対応する答えを取得する効率が向上し、さらに、答え候補自体、及び答え候補が配置されている文章の文章タイトルと、与えられた質問との関連性に基づき、与えられた質問に一致した正確な答えが特定され、質問応答の照会精度が向上する。答え候補の答え語義表現ベクトルを予め答えベクトル索引ライブラリに記憶することにより、答えに対して語義ベクトル化表示をオンラインで行う計算量が減少し、さらに、答え候補自体、及び答え候補が配置されている文章の文章タイトルと、与えられた質問との関連性に基づき、与えられた質問匹配の正確な答えと一致した技術手段が特定されることにより、質問応答の照合効率及び正解率が低いという関連技術における技術的課題が克服され、質問に対応する答えを取得する効率が向上するとともに、質問応答の照会精度も向上するという技術的効果が達成される。

上記選択可能な方式のその他の効果は以下において具体的な実施例を参照しながら説明する。

図面は本技術案をより良く理解するために使用され、本出願を限定するものではない。そのうち、
本出願の第１の実施例に係る概略図である。質問応答の照合のフローチャートである。本出願の第２の実施例に係る概略図である。本出願の第３の実施例に係る概略図である。本出願の第４の実施例に係る概略図である。本出願の第５の実施例に係る概略図である。本出願の実施例を実現する電子機器のブロック図である。

以下、図面を参照しながら本出願の例示的な実施例を説明し、理解を促すために本出願の実施例の様々な詳細が含まれており、それらを単なる例示的なものとみなすべきである。ゆえに、当業者であれば、本出願の範囲と精神を逸脱しない限り、ここで説明された実施例に対して様々な変更と修正を行うことができることを理解されたい。同様に、明確かつ簡潔にするため、以下の説明において公知の機能や構造に対する説明が省略される。

以下、図面を参照しながら本出願の実施例の質問応答処理方法、装置、電子機器及び記憶媒体を説明する。

図１は本出願の第１の実施例に係る概略図である。なお、本実施例の質問応答処理方法の実行主体は質問応答処理装置であり、該装置はソフトウェア及び／又はハードウェアの方式で実現することができ、該装置は電子機器に配置することができ、電子機器は端末機器、サーバ等を含んでも良いがそれらに限定されず、該実施例はこれについて具体的に限定しない。本実施例は、質問応答処理装置が質問応答システムに配置され、質問応答システムがサーバに配置される場合を例として説明する。

図１に示すように、該質問応答処理方法は以下を含んでも良い。

ステップ１０１、回答対象の質問を取得する。

具体的に、現在のユーザが質問応答システムに入力する質問を回答対象の質問とすることができる。

本実施例において、ユーザが個別に質問を入力することを容易にするため、本実施例の質問応答システムは、ユーザが必要に応じて質問を入力するように、入力インターフェースを提供する。

該入力インターフェースはテキスト入力、及び／又は音声入力、及び／又は画像入力をサポートすることができる。

ユーザが音声の形式で質問を入力する際に、現在のユーザが入力する音声情報を取得し、且つ取得した音声情報に対して音声識別を行い、さらに音声識別結果から得られたテキスト情報を回答対象の質問とすることができる。ユーザが画像の形式で質問を入力する際に、画像に対して文字識別を行い、且つ文字識別結果を回答対象の質問とすることができる。

ステップ１０２、回答対象の質問をそれぞれ第１の質問語義表現モデル及び第２の質問語義表現モデルに入力することにより、回答対象の質問の第１の語義表現ベクトル及び第２の語義表現ベクトルを取得する。

第１の質問語義表現モデルは、質問サンプル及び質問サンプルに対応する答えサンプルを組み合わせてトレーニングして得られたものであり、第２の質問語義表現モデルは、質問サンプル及び答えサンプルに対応する文章タイトルを組み合わせてトレーニングして得られたものである。

なお、トレーニング終了時に、第１の質問語義表現モデルは質問サンプルの語義表現ベクトルを出力し、質問サンプルの語義表現ベクトルと正しい答えサンプルの語義表現ベクトルとの間のベクトル類似度は予め設定された類似度のしきい値より高い。

なお、トレーニング終了時に、第２の質問語義表現モデルは質問サンプルの語義表現ベクトルを出力し、質問サンプルの語義表現ベクトルと正しい答えサンプルに対応する文章タイトルのタイトル語義表現ベクトルとの間のベクトル類似度は予め設定された類似度のしきい値より高い。

正しい答えサンプルに対応する文章タイトルのタイトル語義表現ベクトルは、予め設定されたタイトル語義表現モデルによって取得してもよいし、従来のいくつかの他の方式で取得してもよく、本実施例はこれについて具体的に限定しない。本実施例は、タイトル語義表現モデルにより、対応する文章タイトルに対して語義ベクトル化表示を行って、対応する文章タイトルのタイトル語義表現ベクトルを取得する。

なお、質問サンプルと答えサンプルに対応する文章タイトルとを組み合わせ、同時にトレーニングして第２の質問語義表現モデル及びタイトル語義表現モデルを取得するプロセスは後の実施例において説明するので、ここでは説明を省略する。

ステップ１０３、回答対象の質問の目標語義表現ベクトルが得られるように、第１の語義表現ベクトル及び第２の語義表現ベクトルに基づいて連結処理を行う。

本実施例では、第１の語義表現ベクトルと第２の語義表現ベクトルとは、質問応答システムの質問応答照合のプロセスにおいて果たす役割が通常異なるものであり、後で回答対象の質問に対応する目標答えを正確に取得できるために、回答対象の質問の目標語義表現ベクトルが得られるように第１の語義表現ベクトル及び第２の語義表現ベクトルに基づいて連結処理を行うステップの具体的な実現方法は以下のとおりであってもよい。第１の語義表現ベクトルに予め設定された第１の重みをかけて、回答対象の質問の第１の中間語義表現ベクトルを得た後、第２の語義表現ベクトルに予め設定された第２の重みをかけて、回答対象の質問の第２の中間語義表現ベクトルを得られ、第１の中間語義表現ベクトル及び第２の中間語義表現ベクトルに対して連結処理を行うことによって、回答対象の質問の目標語義表現ベクトルを取得することができる。

例えば、回答対象の質問がｑである場合、第１の語義表現モデルを用いて回答対象の質問ｑの第１の語義表現ベクトルをｑ＿ｒｅｐと決定し、第２の語義表現モデルを用いて回答対象の質問ｑの第２の語義表現ベクトルをｑｔ＿ｒｅｐと決定し、第１の重みをａに、第２の重みをｂとすれば、重みに合わせて第１の語義表現ベクトル及び第２の語義表現ベクトルを連結すると、回答対象の質問の目標語義表現ベクトルのＱ＿ＲＥＰ＝［ａ＊ｑ＿ｒｅｐ，ｂ＊ｑｔ＿ｒｅｐ］が得られる。

第１の重みは、質問応答照合のプロセスにおいて答えサンプルが果たす役割を分析することによって決定され、即ち、第１の重みは、質問応答サンプルが質問に対応する正確な答えを決定する際に果たした役割を分析することによって決定される。

第２の重みは、質問応答照合のプロセスにおいて文章タイトルが果たした役割を分析することによって決定され、即ち、第２の重みは、文章タイトルが質問に対応する正確な答えを決定する際に果たした役割を分析することによって決定される。

ステップ１０４、回答対象の質問の目標語義表現ベクトルを、予め構築された答えベクトル索引ライブラリ内の各答え語義表現ベクトルと照合する。

答えベクトル索引ライブラリは答えサンプルセル内のすべての答え候補を語義表現ベクトルに変換することによって構築されたものであり、答え候補に対応する答え語義表現ベクトルは、答え候補自体の語義表現ベクトル及び答え候補に対応する文章タイトルのタイトル語義表現ベクトルによって得られたものである。

答え候補自体の語義表現ベクトル及び対応する文章タイトルのタイトル語義表現ベクトルを素早く決定するために、本出願の一実施例において、答え候補自体の語義表現ベクトルは、答え語義表現モデルによって答え候補に対して語義ベクトル化表示をして得られたものであってもよく、タイトル語義表現ベクトルは、タイトル語義表現モデルによって答え候補に対応する文章タイトルに対して語義ベクトル化表示をして得られたものであってもよい。

第１の質問語義表現モデルは、質問サンプル及び質問サンプルに対応する答えサンプルを組み合わせてトレーニングして得られたものである。

タイトル語義表現モデルは、質問サンプル、及び答えサンプルに対応する文章タイトルを組み合わせてトレーニングして得られたものである。

なお、質問サンプル及び質問サンプルに対応する答えサンプルを組み合わせて、第１の質問語義表現モデル及びタイトル語義表現モデルをトレーニングするステップの具体的なプロセスは後の実施例において紹介するので、ここでは説明を省略する。

本出願の一実施例において、なお、答え候補自体の語義表現ベクトルと文章タイトルに対応するタイトル語義表現ベクトルとは、質問に対応する正確な答えを決定するプロセスにおいて果たす役割が異なり、答え候補自体の語義表現ベクトル及び答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づき、答え候補に対応する答え語義表現ベクトルを取得するステップの具体的な実現方法は以下のとおりである。答え候補自体の語義表現ベクトルに予め設定された第１の重みをかけて、新しい語義表現ベクトルを得られ、タイトル語義表現ベクトルに予め設定された第２の重みをかけて、新しいタイトル語義表現ベクトルを得られ、新しい語義表現ベクトル及び新しいタイトル語義表現ベクトルを連結し、且つ連結された語義表現ベクトルを答え候補に対応する答え語義表現ベクトルとする。

なお、重み付け連結処理時に用いられる対応する重みは、上記回答対象の質問の語義表現ベクトルに対して重み付け連結を行う時に用いられる対応する重みと同じである。第１の重み及び第２の重みに対する解釈は上記実施例の関連する部分を参照すればよいので、ここでは説明を省略する。

ステップ１０５、照合して一致した答え語義表現ベクトルに基づき、対応する目標答えを取得し、かつ目標答えを出力する。

具体的に、回答対象の質問の目標語義表現ベクトルを、予め構築された答えベクトル索引ライブラリ内の各答え語義表現ベクトルと照合することにより、目標語義表現ベクトルに最も近い答え語義表現ベクトルを得られ、対応する答えを回答対象の質問に対応する正確な答えとし、且つ回答対象の質問に対応する正確な答えを出力することができる。

以下、図２を参照しながら、本実施例の質問応答処理方法をさらに説明する。そのうち、図２は、答え語義表現モデルによって答え候補テキストに対して語義ベクトル化表示を行うことを例として説明する。

なお、オンラインで「答え語義計算」を行うのは、語義の質問応答照合において最も時間のかかる部分であり、質問に対応する正確な答えを素早く出力し、オンライン部分の質問回答の効率を向上させるために、「答え語義計算」の部分をオフライン前処理段階に移ることができる。

本出願の全体的な技術思想は以下のとおりである。答え語義表現モデルによってすべての答え候補（答え候補テキスト）を予め語義表現ベクトルに変換し、答えベクトル索引ライブラリに記憶する。それに対応して、ユーザにより入力された質問に対し、まず、それをベクトルに変換し、次に、ベクトル検索システムにおいて質問ベクトルと最も一致した答え語義表現ベクトルを見つけ、最も一致した答え語義表現ベクトルに対応する答えを質問の答えとし、且つ質問の答えを出力する。

本実施例の答えベクトル索引ライブラリはベクトル検索システムに配置することができる。

以上から分かるように、本実施例は、すべての答え候補を予め語義ベクトルに変換して答えベクトル索引ライブラリに記憶することにより、回答対象の質問を取得すると、質問を語義表現ベクトルに変換し、質問語義表現ベクトルと一致した答え語義表現ベクトルを答えベクトル索引ライブラリから取得し、一致した答え語義表現ベクトルに対応する答えを取得するだけで、回答対象の質問の答えを迅速に取得することができ、答えの信頼度を計算するプロセスが省略され、質問に対応する答えを取得する効率が向上する。さらに、本実施例の答え候補に対応する語義表現ベクトルは、答え候補自体の語義表現ベクトルと、答え候補が配置されている文章の文章タイトルの語義ベクトルとを組み合わせることによって決定されるものであるため、答え候補自体、及び答え候補が配置されている文章の文章タイトルと、与えられた質問との関連性に基づき、与えられた質問に一致した正確な答えが特定され、質問応答の照会精度が向上する。

以下、図３を参照しながら、第１の質問語義表現モデル及び答え語義表現モデルをトレーニングするプロセスを説明する。なお、答えサンプルは間違った答えサンプル及び正しい答えサンプルを含む。そのうち、間違った答えサンプルは、質問サンプルと一定の関係を有する間違った答えを指す。

図３に示すように、以下のステップを含んでも良い。

ステップ３０１、質問サンプルの語義表現ベクトルが得られるように、初期の第１の語義表現モデルによって質問サンプルに対して語義ベクトル化表示を行う。

ステップ３０２、間違った答えサンプルの語義表現ベクトル及び正しい答えサンプルの語義表現ベクトルが得られるように、初期の第２の語義表現モデルによって間違った答えサンプル及び正しい答えサンプルに対してそれぞれ語義ベクトル化表示を行う。

ステップ３０３、質問サンプルの語義表現ベクトル及び間違った答えサンプルの語義表現ベクトルに基づいて、質問サンプルと間違った答えサンプルとの間の第１のベクトルの類似度を決定する。

具体的に、質問サンプルの語義表現ベクトル及び間違った答えサンプルの語義表現ベクトルが得られると、質問サンプルの語義表現ベクトルと間違った答えサンプルの語義表現ベクトルとの間の余弦（ｃｏｓｉｎｅ）類似度を計算し、且つ余弦類似度を質問サンプルと間違った答えサンプルとの間のベクトル類似度とすることができる。

ステップ３０４、質問サンプルの語義表現ベクトル及び正しい答えサンプルの語義表現ベクトルに基づき、質問サンプルと正しい答えサンプルとの間の第２のベクトル類似度を決定する。

具体的に、質問サンプルの語義表現ベクトル及び正しい答えサンプルの語義表現ベクトルが得られると、質問サンプルの語義表現ベクトルと正しい答えサンプルの語義表現ベクトルとの間の余弦（ｃｏｓｉｎｅ）の類似度を計算し、且つ余弦類似度を質問サンプルと正しい答えサンプルとの間のベクトル類似度とすることができる。

ステップ３０５、第１のベクトル類似度及び第２のベクトル類似度に基づき、第１のベクトル類似度及び第２のベクトル類似度が第１の予め設定された条件を満たすまで、初期の第１の語義表現モデル及び第２の語義表現モデルのモデルパラメータを調整する。

なお、初期の第１の語義表現モデル及び第２の語義表現モデルのモデルパラメータを調整した後、引き続きモデルパラメータが調整された後の第１の語義表現モデル及び第２の語義表現モデルによってそれぞれの入力に対して語義ベクトル化表示を行い、改めて計算して得られた第１のベクトル類似度及び第２のベクトル類似度が第１の予め設定された条件を満たすまで、第１の語義表現モデル及び第２の語義表現モデルに対するモデルパラメータ調整を終了し、即ち、モデルトレーニングが終了される。

第１の予め設定された条件は、予め設定される、第１のベクトル類似度及び第２のベクトル類似度がどのような条件を満たす場合、モデルトレーニングを終了するものである。例えば、第１の予め設定された条件は、質問サンプル語と正しい答えサンプルとのベクトル類似度から質問サンプル語と間違った答えサンプルとのベクトル類似度を引いて得られた相違度が、最大相違度に達するものであっても良い。

ステップ３０６、第１の予め設定された条件が満たされる際に得られた第１の語義表現モデルを答え語義表現モデルとし、第１の予め設定された条件が満たされる際に得られた第２の語義表現モデルを第１の質問語義表現モデルとする。

本実施例において、質問サンプル、正しい答えサンプル及び間違った答えサンプルを組み合わせると同時に、初期の第１の語義表現モデル及び第２の語義表現モデルをトレーニングし、質問サンプルと正しい答えサンプルとの間のベクトル類似度、及び質問サンプルと間違った答えサンプルとの間のベクトル類似度が第１の予め設定された条件を満たす時に、モデルトレーニングを終了し、トレーニング終了時に得られた第１の語義表現モデルを質問語義表現モデルとし、トレーニング終了時に得られた第２の語義表現モデルを答え語義表現モデルとする。従って、質問とその正確な答えとの語義ベクトルを可能な限り類似するものとすることによって、質問応答照合の精度を保証する。

本出願の一実施例において、質問サンプル、正しい答えサンプル及び間違った答えサンプルを組み合わせ、トレーニングして第１の質問語義表現モデル及び答え語義表現モデルを取得する具体的なプロセスは以下のとおりである。

初期には、大規模な言語資料においてトレーニングされた言語モデルを語義表現モデルの初期化とし、初期化された第１の語義表現モデルによって質問サンプルｑｕｅｒｙの語義表現ベクトルＱ＿ｒｅｐを取得し、初期化された第２の語義表現モデルによって答えサンプルｐａｒａの和（Ｐ＿ｒｅｐ）を取得し、２つのベクトルの内積を該＜ｑｕｅｒｙ、ｐａｒａ＞ペアの照合信頼度とする。

次に、モデルのトレーニングを開始する。１回ごとにｎ個のデータを固定形式でモデルの＜ｑｕｅｒｙ、ｐａｒａ＋，ｐａｒａ－＞に入力し、ｐａｒａ＋は該質問サンプルｑｕｅｒｙの正しい答えサンプルを表し、ｐａｒａ－は該質問サンプルｑｕｅｒｙと一定の関連性を持つ間違った答えサンプルを表す。モデルに入力された各ｑｕｅｒｙに対し、それと２ｎ個のｐａｒａとの関連性（自身のプラス、マイナスの答えを含む）を計算する必要があり、モデル学習の目標は、正確なｐａｒａの関連性を２ｎ個の関連性のうちの最大値とし、モデルが収斂すると、ｑｕｅｒｙとｐａｒａの語義表現モデルを取得することができる。

以下、図４を参照しながら、第１の質問語義表現モデル及び答え語義表現モデルをトレーニングするプロセスを説明する。そのうち、質問サンプル及び質問サンプルに対応する答えサンプルを説明する必要がある。

図４に示すように、以下を含んでも良い。

ステップ４０１、間違った答えサンプルに対応する文章タイトルの第１のタイトル語義ベクトル及び正しい答えサンプルに対応する文章タイトルの第２のタイトル語義ベクトルが得られるように、初期の第３の語義表現モデルによって、間違った答えサンプルに対応する文章タイトル及び正しい答えサンプルに対応する文章タイトルに対してそれぞれ語義ベクトル化表示を行う。

ステップ４０２、質問サンプルの語義表現ベクトルが得られるように、初期の第４の語義表現モデルによって質問サンプルに対して語義ベクトル化表示を行う。

ステップ４０３、質問サンプルの語義表現ベクトル及び第１のタイトル語義表現ベクトルに基づき、質問サンプルと間違った答えサンプルに対応する文章タイトルとの第３のベクトル類似度を決定する。

具体的に、質問サンプルの語義表現ベクトル及び第１のタイトル語義表現ベクトルが得られると、質問サンプルの語義表現ベクトルと第１のタイトル語義表現ベクトルとの間の余弦（ｃｏｓｉｎｅ）類似度を計算し、且つ余弦類似度を質問サンプルと間違った答えサンプルに対応する文章タイトルとの間のベクトル類似度とすることができる。

ステップ４０４、質問サンプルの語義表現ベクトル及び第２のタイトル語義表現ベクトルに基づき、質問サンプルと間違った答えサンプルに対応する文章タイトルとの間の第４のベクトル類似度を決定する。

具体的に、質問サンプルの語義表現ベクトル及び第２のタイトル語義表現ベクトルが得られると、質問サンプルの語義表現ベクトルと第２のタイトル語義表現ベクトルとの間の余弦（ｃｏｓｉｎｅ）類似度を計算し、且つ余弦類似度を質問サンプルと正しい答えサンプルに対応する文章タイトルとの間のベクトル類似度とすることができる。

ステップ４０５、第３のベクトル類似度及び第４のベクトル類似度に基づき、第３のベクトル類似度及び第４のベクトル類似度が第２の予め設定された条件を満たすまで、初期の第３の語義表現モデル及び第４の語義表現モデルのモデルパラメータを調整する。

ステップ４０６、第２の予め設定された条件が満たされる際に得られた第３の語義表現モデルをタイトル語義表現モデルとし、第２の予め設定された条件が満たされる際に得られた第３の語義表現モデルを第２の質問語義表現モデルとする。

上記実施例をもとに、上記初期の第１の語義表現モデル、第２の語義表現モデル、第３の語義表現モデル及び第４の語義表現モデルは同じモデルであってもよく、異なるモデルであってもよい。

本出願の実施例において、初期の第１の語義表現モデル、第２の語義表現モデル、第３の語義表現モデル及び第４の語義表現モデルはすでに語義知識を学習しており、かつ続きを容易にするために、少量の＜質問、答え＞タグデータに基づいてモデルをトレーニングすることができ、検索式質問応答システムにおいて候補検索モデル及び特徴抽出モデルをトレーニングする作業が省略される。本実施例における第１の語義表現モデル、第２の語義表現モデル、第３の語義表現モデル及び第４の語義表現モデルはいずれも予めトレーニングされた語義表現モデルであってもよい。

予めトレーニングされた語義表現モデルは教師なしデータでトレーニングされたものである。

予めトレーニングされた語義表現モデルは知識統合の語義表現モデルＥＲＮＩＥ（ＥｎｈａｎｃｅｄＲｅｐｒｅｓｅｎｔａｔｉｏｎｆｒｏｍｋＮｏｗｌｅｄｇｅＩｎｔＥｇｒａｔｉｏｎ）、ＢＥＲＴモデルを含むがそれらに限定されない。

本実施例において、第１の語義表現モデル、第２の語義表現モデル、第３の語義表現モデル及び第４の語義表現モデルを予めトレーニングされた語義表現モデルとすれば、一定量の＜質問、答え＞タグデータを提供するだけでモデルをトレーニングでき、検索型質問応答システムにおいて候補検索モデル及び特徴抽出モデルをトレーニングする作業が省略され、トレーニングされた語義表現モデルを取得する時間を短縮し、質問応答システムのモデルに対して更新及び最適化を行うことに役立つ。

上記実施例に基づき、回答対象の質問に対応する目標答えを出力した後、目標答えが回答対象の質問の正確な答えでないことを示すためのフィードバックを受信し、この時、更新後のトレーニングデータが得られるように、目標答えを回答対象の質問の間違った質問サンプルデータとしてトレーニングデータに追加するすることができる。それに対応して、関連する語義表現モデルが更新されるように、更新後のトレーニングデータに基づいて本実施例に関連する語義表現モデルをトレーニングし、従ってモデルの効果はますます良くなる。即ち、モデルの自動的な反復更新を実現でき、さらに質問応答照合の精度を向上させることができる。

上記実施例を実現するために、本出願の実施例はさらに質問応答処理装置を提供する。

図５は本出願の第４の実施例に係る概略図である。図５に示すように、該質問応答処理装置１００は取得モジュール１１０、語義表現モジュール１２０、連結モジュール１３０、照合モジュール１４０及び答え取得モジュール１５０を含む。

取得モジュール１１０は、回答対象の質問を取得することに用いられる。

語義表現モジュール１２０は、回答対象の質問をそれぞれ第１の質問語義表現モデル及び第２の質問語義表現モデルに入力することにより、回答対象の質問の第１の語義表現ベクトル及び第２の語義表現ベクトルを取得することに用いられる。そのうち、第１の質問語義表現モデルは質問サンプル、及び質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、第２の質問語義表現モデルは質問サンプル、及び答えサンプルに対応する文章タイトルに基づいてトレーニングされたものである。

連結モジュール１３０は、回答対象の質問の目標語義表現ベクトルが得られるように、第１の語義表現ベクトル及び第２の語義表現ベクトルに基づいて連結処理を行うことに用いられる。

照合モジュール１４０は、回答対象の質問の目標語義表現ベクトルを、予め構築された答えベクトル索引ライブラリ内の各答え語義表現ベクトルと照合することに用いられる。そのうち、答えベクトル索引ライブラリは答えサンプルセル内のすべての答え候補を語義表現ベクトルに変換することによって構築されたものであり、答え候補に対応する答え語義表現ベクトルは答え候補自体の語義表現ベクトル、及び答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づいて得られたものである。

答え取得モジュール１５０は、照合して一致した答え語義表現ベクトルに基づき、対応する目標答えを取得し、かつ目標答えを出力することに用いられる。

本出願の一実施例において、答え候補自体の語義表現ベクトルは、答え語義表現モデルによって答え候補に対して語義ベクトル化表示をして得られたものであり、タイトル語義表現ベクトルは、タイトル語義表現モデルによって答え候補に対応する文章タイトルに対して語義ベクトル化表示をして得られたものであり、第１の質問語義表現モデルは、質問サンプル、及び質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、タイトル語義表現モデルは、質問サンプル、及び答えサンプルに対応する文章タイトルに基づいてトレーニングされたものである。

本出願の一実施例において、質問及び答え候補自体に対して語義ベクトル化表示を容易かつ正確に行うために、答えサンプルは間違った答えサンプル及び正しい答えサンプルを含み、図５に示す装置の実施例を基礎として、図６に示すように、該装置はさらに、
質問サンプル、間違った答えサンプル及び正しい答えサンプルに基づき、トレーニングして第１の質問語義表現モデル及び答え語義表現モデルを取得するための第１のモデルトレーニングモジュール１６０を含む。

第１のモデルトレーニングモジュール１６０は具体的に、質問サンプルの語義表現ベクトルが得られるように、初期の第１の語義表現モデルによって質問サンプルに対して語義ベクトル化表示を行い、間違った答えサンプルの語義表現ベクトル及び正しい答えサンプルの語義表現ベクトルが得られるように、初期の第２の語義表現モデルによって間違った答えサンプル及び正しい答えサンプルに対してそれぞれ語義ベクトル化表示を行い、質問サンプルの語義表現ベクトル及び間違った答えサンプルの語義表現ベクトルに基づいて、質問サンプルと間違った答えサンプルとの間の第１のベクトルの類似度を決定し、質問サンプルの語義表現ベクトル及び正しい答えサンプルの語義表現ベクトルに基づき、質問サンプルと正しい答えサンプルとの間の第２のベクトル類似度を決定し、第１のベクトル類似度及び第２のベクトル類似度に基づき、第１のベクトル類似度及び第２のベクトル類似度が第１の予め設定された条件を満たすまで、初期の第１の語義表現モデル及び第２の語義表現モデルのモデルパラメータを調整し、第１の予め設定された条件が満たされる際に得られた第１の語義表現モデルを答え語義表現モデルとし、第１の予め設定された条件が満たされる際に得られた第２の語義表現モデルを第１の質問語義表現モデルとする。

本出願の一実施例において、質問及び文章タイトルに対して語義ベクトル化表示を容易かつ正確に行うために、答えサンプルは間違った答えサンプル及び正しい答えサンプルを含み、図５に示す装置の実施例を基礎として、図６に示すように、該装置はさらに、
質問サンプル、間違った答えサンプル及び正しい答えサンプルに基づき、トレーニングしてタイトル語義表現モデル及び第２の質問語義表現モデルを取得するための第２のモデルトレーニングモジュール１７０を含む。

第２のモデルトレーニングモジュール１７０は具体的に、間違った答えサンプルに対応する文章タイトルの第１のタイトル語義ベクトル及び正しい答えサンプルに対応する文章タイトルの第２のタイトル語義ベクトルが得られるように、初期の第３の語義表現モデルによって、間違った答えサンプルに対応する文章タイトル及び正しい答えサンプルに対応する文章タイトルに対してそれぞれ語義ベクトル化表示を行い、質問サンプルの語義表現ベクトルが得られるように、初期の第４の語義表現モデルによって質問サンプルに対して語義ベクトル化表示を行い、質問サンプルの語義表現ベクトル及び第１のタイトル語義表現ベクトルに基づき、質問サンプルと間違った答えサンプルに対応する文章タイトルとの第３のベクトル類似度を決定し、質問サンプルの語義表現ベクトル及び第２のタイトル語義表現ベクトルに基づき、質問サンプルと間違った答えサンプルに対応する文章タイトルとの間の第４のベクトル類似度を決定し、第３のベクトル類似度及び第４のベクトル類似度に基づき、第３のベクトル類似度及び第４のベクトル類似度が第２の予め設定された条件を満たすまで、初期の第３の語義表現モデル及び第４の語義表現モデルのモデルパラメータを調整し、第２の予め設定された条件が満たされる際に得られた第３の語義表現モデルをタイトル語義表現モデルとし、第２の予め設定された条件が満たされる際に得られた第３の語義表現モデルを第２の質問語義表現モデルとする。

本出願の一実施例において、第１の語義表現モデル、第２の語義表現モデル、第３の語義表現モデル及び第４の語義表現モデルはいずれも予めトレーニングされた語義表現モデルであり、予めトレーニングされた語義表現モデルは教師なしデータでトレーニングされたものである。

本出願の一実施例において、答え候補自体の語義表現ベクトル及び答え候補に対応する文章タイトルのタイトル語義表現ベクトルによって答え候補に対応する答え語義表現ベクトルを取得することは、具体的に、答え候補自体の語義表現ベクトルに予め設定された第１の重みをかけて、新しい語義表現ベクトルを取得することと、タイトル語義表現ベクトルに予め設定された第２の重みをかけて、新しいタイトル語義表現ベクトルを取得することと、新しい語義表現ベクトル及び新しいタイトル語義表現ベクトルを連結し、連結された語義表現ベクトルを答え候補に対応する答え語義表現ベクトルとすることとを含む。

連結モジュール１３０は、具体的に、第１の語義表現ベクトルに第１の重みをかけて、回答対象の質問の第１の中間語義表現ベクトルを取得することと、第２の語義表現ベクトルに第２の重みをかけて、回答対象の質問の第２の中間語義表現ベクトルを取得することと、第１の中間語義表現ベクトル及び第２の中間語義表現ベクトルを連結し、回答対象の質問の目標語義表現ベクトルを取得することと、に用いられる。

なお、前記質問応答処理方法への解釈と説明は本実施例の質問応答処理装置にも適用できるため、ここで説明を省略する。

本出願の実施例によれば、本出願はさらに電子機器及び読み取り可能な記憶媒体を提供する。

図７に示すように、本出願の実施例に係る電子機器のブロック図である。電子機器は様々な形式なデジタルコンピュータ、例えば、ラップトップパソコン、デスクトップパソコン、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、大型コンピュータ及び他の適切なコンピュータを表すことを目的としている。電子機器はさらに様々な形態のモバイル装置、例えば、携帯情報端末、セルラー電話、スマートフォン、ウェアラブルデバイス及び他の同様なコンピューティングデバイスを表すことができる。本明細書に示す部品、それらの接続と関係、及びそれらの機能は単なる例示的なものに過ぎず、本明細書で説明される及び／又は求められる本出願の実現を限定することを意図していない。

図７に示すように、該電子機器は、１つ又は複数のプロセッサ７０１、メモリ７０２、及び各部品を接続するためのインターフェースを含み、インターフェースは高速インターフェースと低速インターフェースを含む。各部品は異なるバスによって互いに接続されており、共用のマザーボードに実装されるか、又は必要に応じて他の方式で実装されてもよい。プロセッサは、電子機器内で実行される命令を処理することができ、前記命令は、外部入力／出力装置（例えば、インターフェースに接続される表示装置）にＧＵＩの図形情報を表示するようにメモリ内又はメモリ上に記憶される命令を含む。他の実施形態において、必要があれば、複数のプロセッサ及び／又は複数のバスを、複数のメモリと組み合わせて使用することができる。同様に、複数の電子機器を接続してもよく、各機器は必要とされる操作の一部を提供する（例えば、サーバアレイ、１組のブレードサーバ、又はマルチプロセッサシステムとして）。図７では、１つのプロセッサ７０１は例として取り上げられている。

メモリ７０２は本出願によって提供される非一時的なコンピュータ読み取り可能な記憶媒体である。メモリには、少なくとも１つのプロセッサによって実行可能な命令が記憶されることにより、少なくとも１つのプロセッサは、本出願によって提供される質問応答処理方法を実行する。本出願の非一時的なコンピュータ読み取り可能な記憶媒体は、本出願所によって提供される質問応答処理方法をコンピュータに実行させるためのコンピュータ命令が記憶される。

メモリ７０２は非一時的なコンピュータ読み取り可能な記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュール、例えば本出願の実施例における質問応答処理方法に対応するプログラム命令／モジュールを記憶することに用いることができる。プロセッサ７０１は、メモリ７０２に記憶される非一時的なソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能の適用及びデータ処理を実行し、即ち上記方法の実施例における質問応答処理方法を実現する。

メモリ７０２は、プログラムを記憶する領域とデータを記憶する領域とを含んでも良い。そのうち、プログラムを記憶する領域はオペレーティングシステムと、少なくとも１つの機能に必要なアプリケーションプログラムとを記憶することができる。データを記憶する領域は、電子機器の使用によって作成されたデータ等を記憶することができる。また、メモリ７０２は高速ランダムアクセスメモリだけではなく、非一時的なメモリ、例えば少なくとも１つのディスクストレージデバイス、フラッシュメモリデバイス又は他の非一時的なソリッドステートストレージデバイスを含んでも良い。一部の実施例において、メモリ７０２は選択的に、プロセッサ７０１に対してリモートで配置されるメモリを含み、これらのメモリはネットワークによって電子機器に接続することができる。上記ネットワークの実例はインターネット、企業内部のネットワーク、ローカルエリアネットワーク、移動通信ネットワーク及びそれらの組み合わせを含むが、それらに限定されない。

電子機器はさらに、入力装置７０３及び出力装置７０４を含んでも良い。プロセッサ７０１、メモリ７０２、入力装置７０３及び出力装置７０４はバス又は他の方式で接続することができ、図７では、バスによる接続は例として取り上げられている。

入力装置７０３は、入力された数字又は文字情報を受信できるだけではなく、電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、１つ又は複数のマウスボタン、トラックボール、ジョイスティック等の入力装置がある。出力装置７０４は表示装置、補助照明装置（例えば、ＬＥＤ）及び触覚フィードバック装置（例えば、振動モータ）等を含んでも良い。該表示装置は液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ及びプラズマディスプレイを含むがそれらに限定されない。一部の実施形態において、表示装置はタッチスクリーンであっても良い。
本出願の実施例によれば、コンピュータプログラムが提供される。当該コンピュータプログラムのおける命令が実行された場合に、上記質問応答処理方法が実行される。

ここで説明されたシステムと技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はそれらの組み合わせにおいて実現することができる。これらの様々な実施形態は以下を含んでもよい。１つ又は複数のコンピュータプログラムにおいて実施され、該１つ又は複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行及び／又は解釈することができ、該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであっても良く、ストレージシステム、少なくとも１つの入力装置及び少なくとも１つの出力装置からデータと命令を受信し、かつデータと命令を該ストレージシステム、該少なくとも１つの入力装置及び該少なくとも１つの出力装置に転送することができる。

これらの計算プログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードともいう）は、プログラマブルプロセッサの機械命令を含み、高度プロセス及び／又はオブジェクト指向プログラミング言語、及び／又はアセンブリ言語／機械語を用いてこれらの計算プログラム実行することができる。本明細書において用いられたように、用語の「機械読み取り可能な媒体」と「コンピュータ読み取り可能な媒体」は、機械命令及び／又はデータをプログラマブルプロセッサに提供する任意のコンピュータプログラム製品、装置、及び／又はデバイス（例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス（ＰＬＤ））を指し、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む。用語の「機械読み取り可能な信号」は、機械命令及び／又はデータをプログラマブルプロセッサに提供するためのあらゆる信号を指す。

ユーザとのインタラクションを提供するために、ここで説明されたシステムと技術をコンピュータにおいて実施することができ、該コンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（ブラウン管）又はＬＣＤ（液晶ディスプレイ）モニタ）と、キーボードと、ポインティングデバイス（例えば、マウス又はトラックボール）とを有し、ユーザは該キーボードと該ポインティングデバイスを介して入力をコンピュータに提供することができる。他の種類のデバイスはさらに、ユーザとのインタラクションを提供するために用いられてもよく、例えば、ユーザに提供されるフィードバックは、任意の形式のセンサフィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、ユーザからの入力を任意の形式（音の入力、音声入力又は触覚入力を含む）で受信することもできる。

ここで説明されたシステムと技術を、バックグラウンドパーツを含む計算システム（例えば、データサーバとして）、又はミドルウェアパーツを含む計算システム（例えば、アプリケーションサーバ）、又はフロントエンドパーツを含む計算システム（例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは該グラフィカルユーザインタフェース又は該ウェブブラウザ介して、ここで説明されたシステムと技術の実施形態と対話することができる）、又はバックグラウンドパーツ、ミドルウェアパーツ又はフロントエンドパーツの任意の組み合わせを含む計算システムにおいて実行することができる。任意の形式又は媒体のデジタルデータ通信（例えば通信ネットワーク）を介して、システムのパーツを互いに接続することができる。通信ネットワークの例としては、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）及びインターネットが含まれる。

コンピュータシステムはクライアント及びサーバを含んでもよい。一般的に、クライアントとサーバとは互いに離れており、通常は通信ネットワークを介してインタラクションを行う。対応するコンピュータで実行されると同時に互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係を生成する。

以上に示される様々な形式のプロセスを用い、順序を並べ替えるか、ステップを追加したり削除したりすることができることを理解されたい。例えば、本出願に記載の各ステップは並列的に実行してもよく、順次実行してもよく、異なる順序で実行してよく、本出願により開示された技術案の望ましい結果が実現できるならば、本明細書では限定されない。

上記具体的な実施形態は、本出願の保護範囲を制限するものではない。当業者であれば、設計の要件及び他の要素によって、様々な修正、組み合わせ、一部の組み合わせ及び代替を行うことができる。本出願の精神及び原則から逸脱しない限り、行われる修正、同等の置換及び改善等が、いずれも本出願の保護範囲内に含まれるべきである。

Claims

取得モジュールが、回答対象の質問を取得するステップと、
語義表現モジュールが、前記回答対象の質問をそれぞれ第１の質問語義表現モデル及び第２の質問語義表現モデルに入力することにより、前記回答対象の質問の第１の語義表現ベクトル及び第２の語義表現ベクトルを取得するステップであって、前記第１の質問語義表現モデルは質問サンプル及び前記質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、前記第２の質問語義表現モデルは前記質問サンプル、及び前記答えサンプルに対応する文章タイトルに基づいてトレーニングされたものであるステップと、
連結モジュールが、前記回答対象の質問の目標語義表現ベクトルが得られるように、前記第１の語義表現ベクトル及び前記第２の語義表現ベクトルに基づいて連結処理を行うステップと、
照合モジュールが、前記回答対象の質問の目標語義表現ベクトルを、予め構築された答えベクトル索引ライブラリ内の各答え語義表現ベクトルと照合するステップであって、前記答えベクトル索引ライブラリは答えサンプルセル内のすべての答え候補を語義表現ベクトルに変換することによって構築されたものであり、前記答え候補に対応する答え語義表現ベクトルは前記答え候補自体の語義表現ベクトル、及び前記答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づいて得られたものであるステップと、
答え取得モジュールが、照合して一致した答え語義表現ベクトルに基づき、対応する目標答えを取得し、かつ前記目標答えを出力するステップと、を含む、
ことを特徴とする質問応答処理方法。
前記答え候補自体の語義表現ベクトルは、答え語義表現モデルによって前記答え候補に対して語義表現ベクトル化をして得られたものであり、前記タイトル語義表現ベクトルは、タイトル語義表現モデルによって前記答え候補に対応する文章タイトルに対して語義表現ベクトル化をして得られたものであり、前記答え語義表現モデルは、前記質問サンプル及び前記質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、前記タイトル語義表現モデルは、前記質問サンプル、及び前記答えサンプルに対応する文章タイトルに基づいてトレーニングされたものである、
ことを特徴とする請求項１に記載の質問応答処理方法。
前記答えサンプルは間違った答えサンプル及び正しい答えサンプルを含み、
第１のモデルトレーニングモジュールが、前記質問サンプルの語義表現ベクトルが得られるように、初期の第１の語義表現モデルによって前記質問サンプルに対して語義表現ベクトル化を行うステップと、
第１のモデルトレーニングモジュールが、前記間違った答えサンプルの語義表現ベクトル及び前記正しい答えサンプルの語義表現ベクトルが得られるように、初期の第２の語義表現モデルによって前記間違った答えサンプル及び前記正しい答えサンプルに対してそれぞれ語義表現ベクトル化を行うステップと、
第１のモデルトレーニングモジュールが、前記質問サンプルの語義表現ベクトル及び前記間違った答えサンプルの語義表現ベクトルに基づき、前記質問サンプルと間違った答えサンプルとの間の第１のベクトル類似度を決定するステップと、
第１のモデルトレーニングモジュールが、前記質問サンプルの語義表現ベクトル及び前記正しい答えサンプルの語義表現ベクトルに基づき、前記質問サンプルと正しい答えサンプルとの間の第２のベクトル類似度を決定するステップと、
第１のモデルトレーニングモジュールが、前記第１のベクトル類似度及び前記第２のベクトル類似度に基づき、前記第１のベクトル類似度及び前記第２のベクトル類似度が第１の予め設定された条件を満たすまで前記初期の第１の語義表現モデル及び前記第２の語義表現モデルのモデルパラメータを調整するステップと、
第１のモデルトレーニングモジュールが、第１の予め設定された条件が満たされる場合に得られた第１の語義表現モデルを前記第１の質問語義表現モデルとし、第１の予め設定された条件が満たされる場合に得られた第２の語義表現モデルを前記答え語義表現モデルとするステップと、によってトレーニングして前記第１の質問語義表現モデルと前記答え語義表現モデルを取得する、
ことを特徴とする請求項２に記載の質問応答処理方法。
前記答えサンプルは間違った答えサンプル及び正しい答えサンプルを含み、
第２のモデルトレーニングモジュールが、前記間違った答えサンプルに対応する文章タイトルの第１のタイトル語義表現ベクトル及び前記正しい答えサンプルに対応する文章タイトルの第２のタイトル語義表現ベクトルが得られるように、初期の第３の語義表現モデルによって前記間違った答えサンプルに対応する文章タイトル及び前記正しい答えサンプルに対応する文章タイトルに対して語義表現ベクトル化を行うステップと、
第２のモデルトレーニングモジュールが、前記質問サンプルの語義表現ベクトルが得られるように、初期の第４の語義表現モデルによって前記質問サンプルに対して語義表現ベクトル化を行うステップと、
第２のモデルトレーニングモジュールが、前記質問サンプルの語義表現ベクトル及び前記第１のタイトル語義表現ベクトルに基づき、前記質問サンプルと前記間違った答えサンプルに対応する文章タイトルとの間の第３のベクトル類似度を決定するステップと、
第２のモデルトレーニングモジュールが、前記質問サンプルの語義表現ベクトル及び前記第２のタイトル語義表現ベクトルに基づき、前記質問サンプルと前記間違った答えサンプルに対応する文章タイトルとの間の第４のベクトル類似度を決定するステップと、
第２のモデルトレーニングモジュールが、前記第３のベクトル類似度及び前記第４のベクトル類似度に基づき、前記第３のベクトル類似度及び前記第４のベクトル類似度が第２の予め設定された条件を満たすまで前記初期の第３の語義表現モデル及び第４の語義表現モデルのモデルパラメータを調整するステップと、
第２のモデルトレーニングモジュールが、第２の予め設定された条件が満たされる場合に得られた第３の語義表現モデルを前記タイトル語義表現モデルとし、第２の予め設定された条件が満たされる場合に得られた第４の語義表現モデルを前記第２の質問語義表現モデルとするステップと、によってトレーニングして前記タイトル語義表現モデル及び第２の質問語義表現モデルを取得する、
ことを特徴とする請求項３に記載の質問応答処理方法。
前記第１の語義表現モデル、前記第２の語義表現モデル、前記第３の語義表現モデル及び前記第４の語義表現モデルはいずれも予めトレーニングされた語義表現モデルであり、前記予めトレーニングされた語義表現モデルは教師なしデータを用いてトレーニングされたものである、
ことを特徴とする請求項４に記載の質問応答処理方法。
前記答え候補自体の語義表現ベクトル、及び前記答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づいて、前記答え候補に対応する答え語義表現ベクトルを取得するステップは、具体的に、
前記答え候補自体の語義表現ベクトルに予め設定された第１の重みをかけて、新しい語義表現ベクトルを取得するステップと、
前記タイトル語義表現ベクトルに予め設定された第２の重みをかけて、新しいタイトル語義表現ベクトルを取得するステップと、
前記新しい語義表現ベクトル及び前記新しいタイトル語義表現ベクトルを連結し、連結された語義表現ベクトルを前記答え候補に対応する答え語義表現ベクトルとするステップと、を含み、
前記連結モジュールが、前記第１の語義表現ベクトル及び前記第２の語義表現ベクトルに基づいて連結処理を行うことによって、前記回答対象の質問の目標語義表現ベクトルを取得するステップは、
前記連結モジュールが、前記回答対象の質問の第１の中間語義表現ベクトルが得られるように、前記第１の語義表現ベクトルに前記第１の重みをかけるステップと、
前記連結モジュールが、前記回答対象の質問の第２の中間語義表現ベクトルが得られるように、前記第２の語義表現ベクトルに前記第２の重みをかけるステップと、
前記連結モジュールが、前記回答対象の質問の目標語義表現ベクトルが得られるように、前記第１の中間語義表現ベクトル及び前記第２の中間語義表現ベクトルに対して連結処理を行うステップと、を含む、
ことを特徴とする請求項１～５のいずれかに記載の質問応答処理方法。
回答対象の質問を取得するための取得モジュールと、
前記回答対象の質問をそれぞれ第１の質問語義表現モデル及び第２の質問語義表現モデルに入力することにより、前記回答対象の質問の第１の語義表現ベクトル及び第２の語義表現ベクトルを取得するための語義表現モジュールであって、前記第１の質問語義表現モデルは質問サンプル及び前記質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、前記第２の質問語義表現モデルは前記質問サンプル、及び前記答えサンプルに対応する文章タイトルに基づいてトレーニングされたものである語義表現モジュールと、
前記回答対象の質問の目標語義表現ベクトルが得られるように、前記第１の語義表現ベクトル及び前記第２の語義表現ベクトルに基づいて連結処理を行うための連結モジュールと、
前記回答対象の質問の目標語義表現ベクトルを、予め構築された答えベクトル索引ライブラリ内の各答え語義表現ベクトルと照合するための照合モジュールであって、前記答えベクトル索引ライブラリは答えサンプルセル内のすべての答え候補を語義表現ベクトルに変換することによって構築されたものであり、前記答え候補に対応する答え語義表現ベクトルは前記答え候補自体の語義表現ベクトル、及び前記答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づいて得られたものである照合モジュールと、
照合して一致した答え語義表現ベクトルに基づき、対応する目標答えを取得し、かつ前記目標答えを出力するための答え取得モジュールと、を含む、
ことを特徴とする質問応答処理装置。
前記答え候補自体の語義表現ベクトルは、答え語義表現モデルによって前記答え候補に対して語義表現ベクトル化をして得られたものであり、前記タイトル語義表現ベクトルは、タイトル語義表現モデルによって前記答え候補に対応する文章タイトルに対して語義表現ベクトル化をして得られたものであり、前記答え語義表現モデルは、前記質問サンプル及び前記質問サンプルに対応する答えサンプルに基づいてトレーニングされたものであり、前記タイトル語義表現モデルは、前記質問サンプル、及び前記答えサンプルに対応する文章タイトルに基づいてトレーニングされたものである、
ことを特徴とする請求項７に記載の質問応答処理装置。
前記答えサンプルは間違った答えサンプル及び正しい答えサンプルを含み、前記装置はさらに、
前記質問サンプル、前記間違った答えサンプル及び正しい答えサンプルに基づいて、トレーニングして前記第１の質問語義表現モデルと前記答え語義表現モデルを取得するための第１のモデルトレーニングモジュールを含み、
前記第１のモデルトレーニングモジュールは、
前記質問サンプルの語義表現ベクトルが得られるように、初期の第１の語義表現モデルによって前記質問サンプルに対して語義表現ベクトル化を行い、
前記間違った答えサンプルの語義表現ベクトル及び前記正しい答えサンプルの語義表現ベクトルが得られるように、初期の第２の語義表現モデルによって前記間違った答えサンプル及び前記正しい答えサンプルに対してそれぞれ語義表現ベクトル化を行い、
前記質問サンプルの語義表現ベクトル及び前記間違った答えサンプルの語義表現ベクトルに基づき、前記質問サンプルと間違った答えサンプルとの間の第１のベクトル類似度を決定し、
前記質問サンプルの語義表現ベクトル及び前記正しい答えサンプルの語義表現ベクトルに基づき、前記質問サンプルと正しい答えサンプルとの間の第２のベクトル類似度を決定し、
前記第１のベクトル類似度及び前記第２のベクトル類似度に基づき、前記第１のベクトル類似度及び前記第２のベクトル類似度が第１の予め設定された条件を満たすまで前記初期の第１の語義表現モデル及び前記第２の語義表現モデルのモデルパラメータを調整し、
第１の予め設定された条件が満たされる場合に得られた第１の語義表現モデルを前記第１の質問語義表現モデルとし、第１の予め設定された条件が満たされる場合に得られた第２の語義表現モデルを前記答え語義表現モデルとする、
ことを特徴とする請求項８に記載の質問応答処理装置。
前記答えサンプルは間違った答えサンプル及び正しい答えサンプルを含み、前記装置はさらに、
前記質問サンプル、間違った答えサンプル及び正しい答えサンプルに基づいて、トレーニングして前記タイトル語義表現モデル及び第２の質問語義表現モデルを取得するための第２のモデルトレーニングモジュールを含み、
前記第２のモデルトレーニングモジュールは、
前記間違った答えサンプルに対応する文章タイトルの第１のタイトル語義表現ベクトル及び前記正しい答えサンプルに対応する文章タイトルの第２のタイトル語義表現ベクトルが得られるように、初期の第３の語義表現モデルによって前記間違った答えサンプルに対応する文章タイトル及び前記正しい答えサンプルに対応する文章タイトルに対して語義表現ベクトル化を行い、
前記質問サンプルの語義表現ベクトルが得られるように、初期の第４の語義表現モデルによって前記質問サンプルに対して語義表現ベクトル化を行い、
前記質問サンプルの語義表現ベクトル及び前記第１のタイトル語義表現ベクトルに基づき、前記質問サンプルと前記間違った答えサンプルに対応する文章タイトルとの間の第３のベクトル類似度を決定し、
前記質問サンプルの語義表現ベクトル及び前記第２のタイトル語義表現ベクトルに基づき、前記質問サンプルと前記間違った答えサンプルに対応する文章タイトルとの間の第４のベクトル類似度を決定し、
前記第３のベクトル類似度及び前記第４のベクトル類似度に基づき、前記第３のベクトル類似度及び前記第４のベクトル類似度が第２の予め設定された条件を満たすまで前記初期の第３の語義表現モデル及び第４の語義表現モデルのモデルパラメータを調整し、
第２の予め設定された条件が満たされる場合に得られた第３の語義表現モデルを前記タイトル語義表現モデルとし、第２の予め設定された条件が満たされる場合に得られた第４の語義表現モデルを前記第２の質問語義表現モデルとする、
ことを特徴とする請求項９に記載の質問応答処理装置。
前記第１の語義表現モデル、前記第２の語義表現モデル、前記第３の語義表現モデル及び前記第４の語義表現モデルはいずれも予めトレーニングされた語義表現モデルであり、前記予めトレーニングされた語義表現モデルは教師なしデータを用いてトレーニングされたものである、
ことを特徴とする請求項１０に記載の質問応答処理装置。
前記答え候補自体の語義表現ベクトル、及び前記答え候補に対応する文章タイトルのタイトル語義表現ベクトルに基づいて、前記答え候補に対応する答え語義表現ベクトルを取得することは、
前記答え候補自体の語義表現ベクトルに予め設定された第１の重みをかけて、新しい語義表現ベクトルを取得することと、
前記タイトル語義表現ベクトルに予め設定された第２の重みをかけて、新しいタイトル語義表現ベクトルを取得することと、
前記新しい語義表現ベクトル及び前記新しいタイトル語義表現ベクトルを連結し、連結された語義表現ベクトルを前記答え候補に対応する答え語義表現ベクトルとすることと、を含み、
前記連結モジュールは、
前記回答対象の質問の第１の中間語義表現ベクトルが得られるように、前記第１の語義表現ベクトルに前記第１の重みをかけ、
前記回答対象の質問の第２の中間語義表現ベクトルが得られるように、前記第２の語義表現ベクトルに前記第２の重みをかけ、
前記回答対象の質問の目標語義表現ベクトルが得られるように、前記第１の中間語義表現ベクトル及び前記第２の中間語義表現ベクトルに対して連結処理を行うことと、に用いられる、
ことを特徴とする請求項７～１１のいずれかに記載の質問応答処理装置。
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリとを含み、
前記メモリには前記少なくとも１つのプロセッサにより実行可能な命令が記憶され、前記命令が、前記少なくとも１つのプロセッサにより実行される場合、請求項１～６のいずれかに記載の方法が実行される、
ことを特徴とする電子機器。
コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項１～６のいずれかに記載の方法を実行させる、
ことを特徴とするコンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータプログラムであって、
前記コンピュータプログラムは、コンピュータに請求項１～６のいずれかに記載の方法を実行させる、ことを特徴とするコンピュータプログラム。