JP2023012541A

JP2023012541A - テーブルに基づく質問応答方法、装置及び電子機器

Info

Publication number: JP2023012541A
Application number: JP2022178303A
Authority: JP
Inventors: ドンフンフ; Dongfeng He; ビンジンチェン; Bingjin Chen; ジァーヤントゥ; Jiayang Tu; インジャンリン; Yingzhan Lin; シューウェイフアン; Shiwei Huang
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-12-29
Filing date: 2022-11-07
Publication date: 2023-01-25
Also published as: CN114490969A; US20230141932A1; EP4187404A1; CN114490969B

Abstract

【課題】テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる質問応答方法、装置及び電子機器を提供する。【解決手段】方法は、処理対象の質問テキスト及び質問応答のための、少なくとも１つの属性名を含む情報テーブルを決定し、質問テキスト及び少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定し、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定し、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定する。【選択図】図３

Description

本開示は、人工知能技術の分野に関し、特に自然言語処理、深層学習技術の分野に関し、特にテーブルに基づく質問応答方法、装置及び電子機器に関する。

関連技術における質問応答方法は、主に、入力された質問に基づいて質問の各文字を文字ベクトルに変換して、文字ベクトルシーケンスを決定し、文字ベクトルシーケンスに基づいて質問の各文字が複数の固定カテゴリに属する確率を計算するが、テーブル質問応答におけるカテゴリは固定されていないため、質問応答の効率が低く、精度が低くなる。

本開示は、テーブルに基づく質問応答方法、装置及び電子機器を提供する。

本開示の一態様によれば、テーブルに基づく質問応答方法を提供し、処理対象の質問テキスト及び質問応答のための情報テーブルを決定するステップであって、前記情報テーブルには、少なくとも１つの属性名が含まれるステップと、前記質問テキスト及び前記少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定するステップと、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップと、前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定するステップと、を含む。

本開示の別の態様によれば、質問応答モデルのトレーニング方法を提供し、初期の質問応答モデルを構築するステップであって、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するためのベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するためのセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するためのモジュールとを含むステップと、トレーニングデータを取得するステップであって、前記トレーニングデータは、情報テーブル内の少なくとも１つの属性名と、サンプル質問テキストと、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントとを含むステップと、前記質問応答モデルの入力として前記サンプル質問テキスト、及び前記少なくとも１つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするステップとを含む。

本開示の別の態様によれば、テーブルに基づく質問応答装置を提供し、処理対象の質問テキスト及び質問応答のための情報テーブルを決定するための第１の決定モジュールであって、前記情報テーブルには、少なくとも１つの属性名が含まれる第１の決定モジュールと、前記質問テキスト及び前記少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定するための第２の決定モジュールと、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するための第３の決定モジュールと、前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定するための第４の決定モジュールと、を含む。

本開示の別の態様によれば、質問応答モデルのトレーニング装置を提供し、初期の質問応答モデルを構築するための構築モジュールであって、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンス抽出を取得するためのベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するためのセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するためのモジュールとを含む構築モジュールと、トレーニングデータを取得するための取得モジュールであって、前記トレーニングデータは、情報テーブル内の少なくとも１つの属性名と、サンプル質問テキストと、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントとを含む取得モジュールと、前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも１つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするためのトレーニングモジュールと、を含む。

本開示のさらに別の態様によれば、電子機器を提供し、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行される命令が記憶されており、前記命令は、前記少なくとも１つのプロセッサが本開示の上記の一態様によるテーブルに基づく質問応答方法、又は、本開示の上記の別の態様による質問応答モデルのトレーニング方法を実行できるように、前記少なくとも１つのプロセッサによって実行される。

本開示のさらに一態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、
前記コンピュータ命令は、コンピュータに本開示の上記の一態様によるテーブルに基づく質問応答方法、又は、本開示の上記の別の態様による質問応答モデルのトレーニング方法を実行させる。

本開示のさらに一態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本開示の上記の一態様によるテーブルに基づく質問応答方法、又は、本開示の上記の別の態様による質問応答モデルのトレーニング方法が実現される。

なお、この部分に記載の内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していない。本出願の他の特徴は下記の明細書の記載を通して理解しやすくなる。

以下、図面と組み合わせて本出願の例示的な実施例を説明する。理解を容易にするために、その中には本発明の実施例の様々な詳細が含まれ、それらは単なる例示と見なされるべきである。したがって、当業者は、本発明の範囲及び精神から逸脱することなく、本明細書に記載の実施例に対して様々な変更及び修正を行うことができる。また、わかりやすくかつ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。

上記の課題に対して、本開示は、テーブルに基づく質問応答方法、装置及び電子機器を提供する。

図１は本開示の第１の実施例による模式図であり、本開示の実施例のテーブルに基づく質問応答方法は、テーブルに基づく質問応答装置に適用され得、この装置は、電子機器がテーブルに基づく質問応答機能を実行できるように、電子機器に配置することができる。

ここで、電子機器は、コンピューティング機能を備えた任意のデバイスにすることができる。ここで、コンピューティング機能を備えたデバイスは、例えば、パーソナルコンピュータ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ、ＰＣと略す）、モバイル端末、サーバーなどであり得、例えば、モバイル端末は、車載デバイス、携帯電話、タブレットコンピュータ、携帯情報端末、ウェアラブルデバイスなど、様々なオペレーティングシステム、タッチスクリーンおよび／またはディスプレイスクリーンを備えたハードウェアデバイスであり得る。

図１に示すように、このテーブルに基づく質問応答方法は、以下のステップ１０１～１０４を含む。

ステップ１０１では、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも１つの属性名が含まれる。

本開示の実施例では、処理対象の質問テキストは、ユーザによって尋ねられる質問のテキストであり、処理対象の質問テキストは、１つまたは複数であり得る。例えば、質問テキストは、「パサートはいくらですか」、「ハヴァルＨ６の排気量はどれくらいですか」、「ハヴァルＨ６はいくらですか」などであり得る。

本開示の実施例では、情報テーブルは属性名と属性値とを含み、属性名は属性値に対応付けられ、情報テーブルは少なくとも１つの属性名を含み、各属性名は少なくとも１つの属性値に対応付けられる。図２は情報テーブルの模式図であり、図２に示すように、情報テーブルに含まれる属性名は、例えば、「車型」、「価格」、「排気量」であり、属性名が「車型」である場合、対応する属性値は、例えば「パサート」、「ＣＲ－Ｖ」、「Ａ４Ｌ」、「ハヴァルＨ６」であり得、属性名が「価格」である場合、対応する属性値は、例えば「１５.４９」、「２７.６６」、「３４.９４」、「１３.４」であり得、属性名が「排気量」である場合、対応する属性値は、例えば「２.０」、「１.４」、「１.５」であり得る。

ステップ１０２では、質問テキスト及び少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定する。

本開示の実施例では、テーブルに基づく質問応答装置がステップ１０２を実行する過程は、例えば質問テキスト内の各文字及び少なくとも１つの属性名内の各文字に基づいて、質問属性文字シーケンスを生成し、質問属性文字シーケンス内の各文字に対してベクトル化処理を行って、文字ベクトルシーケンスを取得し、質問属性文字シーケンス内の各文字の位置情報に対してベクトル化処理を行って、位置ベクトルシーケンスを取得し、質問属性文字シーケンス内の各文字のタイプ情報に基づいてベクトル化処理を行って、タイプベクトルシーケンスを取得し、ここで、タイプ情報は、文字が質問テキスト又は少なくとも１つの属性名に属していることを示す。

ここで、文字ベクトルシーケンスは、質問属性文字シーケンス内の各文字の文字ベクトルを含む。ここで、文字の文字ベクトルは、文字に対してｏｎｅ－ｈｏｔベクトルアルゴリズムやワードベクトルアルゴリズム（ｗｏｒｄ２ｖｅｃ）などのベクトル化処理を行うことで得られ、文字ベクトルによって異なる文字を区別するために使用される。実際に選択するアルゴリズムは、必要に応じて設定することができる。

ここで、位置ベクトルシーケンスは質問属性文字シーケンス内の各文字の位置ベクトルを含む。ここで、文字の位置ベクトルは、質問属性文字シーケンスにおける文字の位置を示し、異なる位置ベクトルは、異なる位置を示す。

ここで、タイプベクトルシーケンスは質問属性文字シーケンス内の各文字のタイプベクトルを含む。ここで、文字のタイプベクトルは、文字が質問テキスト又は少なくとも１つの属性名に属していることを示す。タイプベクトルは全部で２種類あり、１つは文字が質問テキストに属していることを示し、もう１つは文字が少なくとも１つの属性名に属していることを示す。

本開示の実施例では、質問テキスト内の各文字及び少なくとも１つの属性内の各文字に対して、質問属性文字シーケンスを生成することにより、質問テキスト内の各文字が属する属性名、又は属する属性名に対応する属性値を決定することができ、ここで、属性名は、必要に応じて変更することができるため、本開示におけるテーブルに基づく質問応答方法は、属性名の数およびタイプを制限しなく、さまざまなシナリオでのさまざまな情報テーブルに適用することができ、特定のシナリオでの情報テーブルを使用して、質問テキストに対応する回答を決定することができるため、テーブルに基づく質問応答のコストを削減し、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。

ステップ１０３では、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定する。

本開示の実施例では、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の各文字が属する属性名、又は属する属性名に対応する属性値を決定し、ひいてはそれが属する属性名を、属性名セグメントとして決定し、それが属する属性名に対応する属性値を、属性値セグメントとして決定する。

ステップ１０４では、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定する。

本開示の実施例では、テーブルに基づく質問応答装置がステップ１０４を実行する過程は、例えば属性名セグメントと属性値セグメントとに基づいて情報テーブルをクエリして、属性名セグメントおよび属性値セグメントに対応するコンテンツを取得し、このコンテンツを、質問テキストに対応する回答として決定する。

ここで、質問テキストが「パサートはいくらですか」であり、情報テーブルが図２に示すような情報テーブルであることを例として、質問テキスト内の「パサート」）が図２の属性値セグメント「パサート」に対応し、質問テキスト内の「いくら」が図２の属性名セグメント「価格」に対応し、この属性名セグメントと属性値セグメントとに基づいて、図２に示すような情報テーブルをクエリして、属性名セグメントおよび属性値セグメントに対応するコンテンツ「１５.４９」を、上記の質問テキストに対応する回答として取得する。

本開示の実施例では、属性名セグメントと属性値セグメントとは、質問テキスト及び情報テーブル内の少なくとも１つの属性名に基づいて決定されるため、上記の属性名セグメントと属性値セグメントに基づいて上記の情報テーブルをクエリすることにより、属性名セグメントおよび属性値セグメントに対応するコンテンツを取得することができ、テーブルに基づく質問応答の效率をさらに向上させ、テーブルに基づく質問応答の精度を向上させることができる。

以上を纏めると、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも１つの属性名が含まれ、質問テキスト及び少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定し、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定し、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定することにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。

質問テキスト内の属性名セグメントと属性値セグメントとを正確に決定して、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させるために、質問テキスト内の各文字の確率情報を決定する必要があり、図３に示すように、図３は本開示の第２の実施例による模式図であり、本開示の実施例では、まず、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて質問テキスト内の各文字の確率情報を決定し、その確率情報には、少なくとも１つの属性名に属する確率、および少なくとも１つの属性名に対応する属性値に属する確率が含まれ、ひいては質問テキスト内の属性名セグメントおよび属性値セグメントを決定する。図３に示す実施例は、以下のステップを含む。

ステップ３０１では、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも１つの属性名が含まれる。

ステップ３０２では、質問テキスト及び少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定する。

ステップ３０３では、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の各文字の確率情報を決定し、確率情報には、少なくとも１つの属性名に属する確率、および少なくとも１つの属性名に対応する属性値に属する確率が含まれる。

本開示の実施例では、テーブルに基づく質問応答装置がステップ３０３を実行する過程は、例えば文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに対して加算処理を行って、処理されたベクトルシーケンスを取得し、処理されたベクトルシーケンスに対してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得し、セマンティック表現ベクトルシーケンスには、質問テキスト内の各文字のセマンティック表現ベクトル、及び少なくとも１つの属性名内の各文字のセマンティック表現ベクトルが含まれ、各属性名について、属性名内の各文字のセマンティック表現ベクトルに対して加算および平均化処理を行って、属性名のセマンティック表現ベクトルを決定し、任意の文字属性名ペアについて、文字属性名ペアのうちの第１の文字のセマンティック表現ベクトルと文字属性名ペアのうちの第１の属性名のセマンティック表現ベクトルとをスプライシングして、第１のスプライシングベクトルを取得し、第１のスプライシングベクトルに基づいて、第１の文字が第１の属性名に属する確率、及び第１の文字が第１の属性名に対応する属性値に属する確率を決定する。

本開示の実施例では、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに対して加算処理を行って、加算処理されたベクトルシーケンスに対してセマンティック表現処理を行って、セマンティック表現ベクトルシーケンスを取得し、ひいてはテキスト内の文字が属性名および属性値に属する確率を決定することにより、質問テキスト内の文字のセマンティック表現ベクトルの精度を向上させ、属性名内の文字のセマンティック表現ベクトルの精度を向上させることができるため、確率情報の精度を向上させ、ひいては決定された属性名セグメントと属性値セグメントの精度を向上させ、さらにテーブルの質問応答の精度を向上させることができる。

ステップ３０４では、質問テキスト内の各文字が少なくとも１つの属性名に属する確率及び少なくとも１つの属性名に対応する属性値に属する確率に基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定する。

本開示の実施例では、テーブルに基づく質問応答装置がステップ３０４を実行する過程は、例えば質問テキスト内の各文字について、文字が少なくとも１つの属性名に属する確率及び少なくとも１つの属性名に対応する属性値に属する確率に基づいて、文字が属する属性名又は文字が属する属性値を決定し、質問テキスト内の各文字が属する属性名又は文字が属する属性値に基づいて、属性名セグメントと属性値セグメントとを決定する。

本開示の実施例では、文字が少なくとも１つの属性名に属する確率及び少なくとも１つの属性名に対応する属性値に属する確率が決定された後、最大確率を決定することができ、最大確率が特定の属性名に対応付けられる場合、この属性名を、文字が属する属性名として決定し、この属性名を属性名セグメントとし、最大確率が、特定の属性名の特定の属性値に対応付けられる場合、この属性値を、文字が属する属性値として決定し、この属性値を属性値セグメントとする。

本開示の実施例では、質問テキスト内の各文字が属性名及び属性名に対応する属性値に属する確率を決定することにより、文字が属する属性名又は文字が属する属性値の精度を向上させ、さらに決定された属性名セグメントと属性値セグメントの精度を向上させ、テーブルに基づく質問応答の精度を向上させることができる。

ステップ３０５では、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定する。

なお、ステップ３０１、３０２および３０５の詳細については、図１に示す実施例におけるステップ１０１、ステップ１０２およびステップ１０４を参照することができるが、ここでは詳細には説明しない。

以上を纏めると、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも１つの属性名が含まれ、質問テキスト及び少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定し、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の各文字の確率情報を決定し、確率情報には、少なくとも１つの属性名に属する確率、および少なくとも１つの属性名に対応する属性値に属する確率が含まれ、質問テキスト内の各文字が少なくとも１つの属性名に属する確率及び少なくとも１つの属性名に対応する属性値に属する確率に基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定し、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定することにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。

図４は本開示の第３の実施例による模式図である。なお、本開示の実施例の質問応答モデルのトレーニング方法は、質問応答モデルのトレーニング装置に適用され、この質問応答モデルのトレーニング装置は、電子機器が質問応答モデルのトレーニング機能を実行できるように、任意の電子機器に配置することができる。

ここで、電子機器は、コンピューティング機能を備えた任意のデバイスにすることができる。ここで、コンピューティング機能を備えたデバイスは、例えば、パーソナルコンピュータ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ、ＰＣと略す）、モバイル端末、サーバーなどであり得、モバイル端末は、例えば、車載デバイス、携帯電話、タブレットコンピュータ、携帯情報端末、ウェアラブルデバイスなど、様々なオペレーティングシステム、タッチスクリーンおよび／またはディスプレイスクリーンを備えたハードウェアデバイスであり得る。

図４に示すように、この質問応答モデルのトレーニング方法は、以下のステップ４０１～４０３を含むことができる。

ステップ４０１では、初期の質問応答モデルを構築し、質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールとを含む。

本出願の実施例では、セマンティック抽出モジュールは、例えばセマンティック表現モデル（ＥｎｈａｎｃｅｄＲｅｐｒｅｓｅｎｔａｔｉｏｎｆｒｏｍｋＮｏｗｌｅｄｇｅＩｎｔＥｇｒａｔｉｏｎ、ＥＲＮＩＥ）内のエンコーディングモジュールであり得る。

ステップ４０２では、トレーニングデータを取得し、トレーニングデータは、情報テーブル内の少なくとも１つの属性名、サンプル質問テキスト、サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントを含む。

ステップ４０３では、質問応答モデルの入力としてサンプル質問テキスト及び少なくとも１つの属性名を使用して、質問応答モデルの出力としてサンプル属性名セグメント及びサンプル属性値セグメントを使用して、質問応答モデルをトレーニングする。

本開示の実施例では、一例では、トレーニングされた質問応答モデルの精度を向上させるために、質問応答モデルのトレーニング装置がステップ４０３を実行する過程は、例えばサンプル質問テキスト、および少なくとも１つの属性名を質問応答モデルを入力して、質問応答モデルから出力された予測属性名セグメント及び予測属性値セグメントを取得し、予測属性名セグメント、予測属性値セグメント、サンプル属性名セグメントおよびサンプル属性値セグメントに基づいて、損失関数を構築し、損失関数の値に基づいて、質問応答モデルに対して係数を調整して、トレーニングを実現する。

本開示の実施例では、別の例では、トレーニングされた質問応答モデルの精度をさらに向上させるために、質問テキスト内の文字と属性名内の文字との間のマッチング度合いと組み合わせて、損失関数を構築することができる。従って、質問応答モデルは、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをセマンティックマッチングして、セマンティックマッチング度合いを決定するセマンティックマッチングモジュールをさらに含む。質問応答モデルのトレーニング装置がステップ４０３を実行する過程は、例えばサンプル質問テキスト、および少なくとも１つの属性名を質問応答モデルを入力して、質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、予測属性名セグメント、予測属性値セグメント、サンプル属性名セグメントおよびサンプル属性値セグメントに基づいて、第１の損失関数を構築し、セマンティックマッチングモジュールから出力された予測マッチング度合い及び予め設定されたマッチング度合い閾値に基づいて、第２の損失関数を構築し、第１の損失関数と第２の損失関数とに基づいて、総損失関数を構築し、総損失関数の値に基づいて、質問応答モデルに対して係数を調整して、トレーニングを実現する。

本開示の実施例では、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルのセマンティックマッチング度合いに基づいて、損失関数を構築することにより、トレーニングされた質問応答モデルの精度を向上させ、質問応答モデルのトレーニング速度を上げることができる。

以上を纏めると、初期の質問応答モデルを構築し、質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールとを含み、トレーニングデータを取得し、トレーニングデータは、情報テーブル内の少なくとも１つの属性名、サンプル質問テキスト、サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントを含み、質問応答モデルの入力としてサンプル質問テキスト及び少なくとも１つの属性名を使用して、質問応答モデルの出力としてサンプル属性名セグメント及びサンプル属性値セグメントを使用して、質問応答モデルをトレーニングすることにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。

例として、図５は質問応答モデルの概略構成図であり、図５に示すように、サンプル質問テキストおよび少なくとも１つの属性名は質問応答モデルの入力であり、具体的な入力フォーマットは、［ＣＬＳ］Ｑ_１、Ｑ_２、... ［ＳＥＰ］Ｃ_１１、Ｃ_１２...［ＳＥＰ］Ｃ_２１、Ｃ_２２、... ［ＳＥＰ］... ［ＳＥＰ］であり、ここで、Ｑ_ｉはサンプル質問テキスト内のｉ番目の文字であり、Ｃ_ｊｋは情報テーブル内のｊ番目の属性名のｋ番目の文字である。サンプル質問テキストと属性名の間、および属性名と属性名の間は、セマンティック表現モデルの内部区切り文字「［ＳＥＰ］」で区切られている。サンプル質問テキスト内の文字と情報テーブルの属性名内の文字をスプライシングして、質問属性文字シーケンスを取得し、質問属性文字シーケンス内の各文字、各文字の位置情報、および各文字のタイプ情報に対してベクトル化処理を行って、文字ベクトルシーケンス、位置ベクトルシーケンス、およびタイプベクトルシーケンスを取得し、文字ベクトルシーケンス（ｔｏｋｅｎｅｍｂｅｄｄｉｎｇ）、位置ベクトルシーケンス（ｐｏｓｉｔｉｏｎｅｍｂｅｄｄｉｎｇ）及びタイプベクトルシーケンス（ｔｙｐｅｅｍｂｅｄｄｉｎｇ）に対して加算処理を行って、処理されたベクトルシーケンス（入力シーケンス）を取得し、それをセマンティック抽出モジュール（セマンティック表現モデルのエンコーディングモジュール）に送信してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得する。ここで、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスは、それぞれ各文字のセマンティック情報、位置情報、カテゴリ情報をエンコーディングする。ｈ_ｑｉはサンプル質問テキスト内のｉ番目の文字のセマンティック表現ベクトルであり、ｈ_ｃｊｋはｊ番目の属性名内のｋ番目の文字のセマンティック表現ベクトルである。

図５では、セマンティック表現ベクトルシーケンスに含まれる各属性名のすべての文字のセマンティック表現ベクトルに対してベクトル平均化（ａｖｅｒａｇｅｐｏｏｌｉｎｇ）を行い、即ち平均プーリング（加算および平均）を行うことにより、各属性名のセマンティック表現ベクトルを取得することができ、ｊ番目の属性名のセマンティック表現ベクトルをｖ_ｃｊとして示す。例えば、「価格」が入力シーケンスの２番目の属性であり、その２つの文字のセマンティック表現ベクトルはｈ_ｃ２１とｈ_ｃ２２であり、２つのセマンティック表現ベクトルを平均することにより、価格属性のセマンティック表現ベクトルｖ_ｃ２を取得することができる。

上記実施例を実現するために、本開示は、テーブルに基づく質問応答装置をさらに提供する。

図６に示すように、図６は本開示の第４の実施例による模式図である。このテーブルに基づく質問応答装置６００は、第１の決定モジュール６１０、第２の決定モジュール６２０、第３の決定モジュール６３０および第４の決定モジュール６４０を含む。

ここで、第１の決定モジュール６１０は、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、前記情報テーブルには、少なくとも１つの属性名が含まれる。

第２の決定モジュール６２０は、前記質問テキスト及び前記少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定する。

第３の決定モジュール６３０は、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定する。

第４の決定モジュール６４０は、前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定する。

本開示の実施例の可能な一実施形態として、前記第２の決定モジュール６２０は、具体的には、前記質問テキスト内の各文字及び前記少なくとも１つの属性名内の各文字に基づいて、質問属性文字シーケンスを生成し、前記質問属性文字シーケンス内の各文字に対してベクトル化処理を行って、前記文字ベクトルシーケンスを取得し、前記質問属性文字シーケンス内の各文字の位置情報に対してベクトル化処理を行って、前記位置ベクトルシーケンスを取得し、前記質問属性文字シーケンス内の各文字のタイプ情報に基づいてベクトル化処理を行って、前記タイプベクトルシーケンスを取得し、前記タイプ情報は、前記文字が前記質問テキスト又は前記少なくとも１つの属性名に属していることを示す。

本開示の実施例の可能な実施形態として、前記第３の決定モジュール６３０は、第１の決定ユニットと第２の決定ユニットを含む。

ここで、第１の決定ユニットは、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の各文字の確率情報を決定し、前記確率情報には、前記少なくとも１つの属性名に属する確率、および前記少なくとも１つの属性名に対応する属性値に属する確率が含まれ、第２の決定ユニットは、前記質問テキスト内の各文字が前記少なくとも１つの属性名に属する確率及び前記少なくとも１つの属性名に対応する属性値に属する確率に基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定する。

本開示の実施例の可能な一実施形態として、前記第１の決定ユニットは、具体的には、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに対して加算処理を行って、処理されたベクトルシーケンスを取得し、前記処理されたベクトルシーケンスに対してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得し、前記セマンティック表現ベクトルシーケンスには、前記質問テキスト内の各文字のセマンティック表現ベクトル、及び前記少なくとも１つの属性名内の各文字のセマンティック表現ベクトルが含まれ、各属性名について、前記属性名内の各文字のセマンティック表現ベクトルに対して加算および平均化処理を行って、前記属性名のセマンティック表現ベクトルを決定し、任意の文字属性名ペアについて、前記文字属性名ペアのうちの第１の文字のセマンティック表現ベクトル及び前記文字属性名ペアのうちの第１の属性名のセマンティック表現ベクトルをスプライシングして、第１のスプライシングベクトルを取得し、前記第１のスプライシングベクトルに基づいて、前記第１の文字が前記第１の属性名に属する確率、及び前記第１の文字が前記第１の属性名に対応する属性値に属する確率を決定する。

本開示の実施例の可能な一実施形態として、前記第２の決定ユニットは、具体的には、前記質問テキスト内の各文字について、前記文字が前記少なくとも１つの属性名に属する確率及び前記少なくとも１つの属性名に対応する属性値に属する確率に基づいて、前記文字が属する属性名又は前記文字が属する属性値を決定し、前記質問テキスト内の各文字が属する属性名又は前記文字が属する属性値に基づいて、前記属性名セグメントと前記属性値セグメントとを決定する。

本開示の実施例の可能な一実施形態として、前記情報テーブルは、各前記属性名に対応する少なくとも１つの属性値をさらに含み、前記第４の決定モジュール６４０は、具体的には、前記属性名セグメントと前記属性値セグメントとに基づいて前記情報テーブルをクエリして、前記属性名セグメントおよび前記属性値セグメントに対応するコンテンツを取得し、前記コンテンツを前記質問テキストに対応する回答として決定する。

本開示の実施例のテーブルに基づく質問応答装置は、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも１つの属性名が含まれ、質問テキスト及び少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定し、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定し、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定することにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。

上記実施例を実現するために、本開示は、質問応答モデルのトレーニング装置をさらに提供する。

図７は本開示の第５の実施例の模式図であり、この質問応答モデルのトレーニング装置７００は、構築モジュール７１０、取得モジュール７２０およびトレーニングモジュール７３０を含む。

構築モジュール７１０は、初期の質問応答モデルを構築し、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンス抽出を取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールとを含む。

取得モジュール７２０は、トレーニングデータを取得し、前記トレーニングデータは、情報テーブル内の少なくとも１つの属性名、サンプル質問テキスト、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントを含む。

トレーニングモジュール７３０は、前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも１つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングする。

本開示の実施例の可能な一実施形態として、前記トレーニングモジュール７３０は、具体的には、前記サンプル質問テキストおよび前記少なくとも１つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、損失関数を構築し、前記損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現する。

本開示の実施例の可能な一実施形態として、前記質問応答モデルは、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをセマンティックマッチングして、セマンティックマッチング度合いを決定するセマンティックマッチングモジュールをさらに含み、前記トレーニングモジュール７３０は、具体的には、前記サンプル質問テキストおよび前記少なくとも１つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、第１の損失関数を構築し、前記セマンティックマッチングモジュールから出力された予測マッチング度合い及び予め設定されたマッチング度合い閾値に基づいて、第２の損失関数を構築し、前記第１の損失関数と前記第２の損失関数とに基づいて、総損失関数を構築し、前記総損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現する。

本開示の実施例の質問応答モデルのトレーニング装置は、初期の質問応答モデルを構築し、質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンス抽出を取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールとを含み、トレーニングデータを取得し、トレーニングデータは、情報テーブル内の少なくとも１つの属性名、サンプル質問テキスト、サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントを含み、質問応答モデルの入力としてサンプル質問テキスト及び少なくとも１つの属性名を使用して、質問応答モデルの出力としてサンプル属性名セグメントとサンプル属性値セグメントを使用して、質問応答モデルをトレーニングすることにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。

本開示の技術案では、関連するユーザーの個人情報の収集、保管、使用、処理、伝送、提供および開示はすべてユーザーの同意を得て行われ、関連する法規制を遵守し、公序良俗に違反しない。

本開示の実施例によれば、本開示は電子機器、および読み取り可能な記憶媒体をさらに提供する。
本開示の実施例によれば、本開示はコンピュータプログラムが含まれるコンピュータプログラム製品をさらに提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本開示によって提供されるテーブルに基づく質問応答方法、又は、本開示によって提供される質問応答モデルのトレーニング方法が実現される

図８は、本開示の実施例を実施するための例示的な電子機器８００の概略ブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセシング、セルラー電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなど、様々な形態のモバイルデバイスを表してもよい。本明細書に示されるコンポーネント、それらの接続及び関係、並びにそれらの機能は、単なる例であり、本明細書に記載及び/または求められる本願の実現を限定することを意図しない。

図８に示すように、電子機器８００は、リードオンリーメモリ（ＲＯＭ）８０２に記憶されたコンピュータプログラム、または記憶ユニット８０８からランダムアクセスメモリ（ＲＡＭ）８０３にローディングされたコンピュータプログラムに基づいて、様々な適切な動作と処理を実行できる計算ユニット８０１を含む。ＲＡＭ８０３には、電子機器８００の動作に必要な各種のプログラム及びデータをさらに記憶することができる。計算ユニット８０１と、ＲＯＭ８０２と、ＲＡＭ８０３とは、バス８０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インタフェース８０５もバス８０４に接続されている。

電子機器８００における複数のコンポーネントは、Ｉ／Ｏインタフェース８０５に接続されており、その複数のコンポーネントは、キーボードやマウスなどの入力ユニット８０６と、種々なディスプレイやスピーカなどの出力ユニット８０７と、磁気ディスクや光学ディスクなどの記憶ユニット８０８と、ネットワークカード、モデム、無線通信トランシーバーなどの通信ユニット８０９と、を備える。通信ユニット８０９は、電子機器８００がインターネットのようなコンピュータネット及び/または種々なキャリアネットワークを介して他の機器と情報/データを交換することを可能にする。

計算ユニット８０１は、処理及び計算能力を有する様々な汎用及び/または専用の処理コンポーネントであってもよい。計算ユニット８０１のいくつかの例としては、中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、様々な専用の人工知能（ＡＩ）計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタ信号プロセッサ（ＤＳＰ）、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを備えるが、これらに限定されない。計算ユニット８０１は、上述で説明された各方法及び処理、例えばテーブルに基づく質問応答方法又は質問応答モデルのトレーニング方法を実行する。例えば、いくつかの実施形態では、テーブルに基づく質問応答方法又は質問応答モデルのトレーニング方法を、記憶ユニット８０８のような機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウエアプログラムとして実現されてもよい。一部の実施例では、コンピュータプログラムの一部または全ては、ＲＯＭ８０２及び/または通信ユニット８０９を介して、電子機器８００にロード及び/またはインストールされてもよい。コンピュータプログラムがＲＡＭ８０３にロードされて計算ユニット８０１によって実行される場合に、前述したテーブルに基づく質問応答方法又は質問応答モデルのトレーニング方法のステップを実行することができる。選択的に、他の実施例では、計算ユニット８０１は、他の任意の適当な方式（例えば、ファームウェアを介する）によりテーブルに基づく質問応答方法又は質問応答モデルのトレーニング方法を実行するように構成されてもよい。

ここで記載されているシステムまたは技術の各種の実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、専用集積回路（ＡＳＩＣ）、専用標準品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、コンプレックスプログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータのハードウェア、ファームウェア、ソフトウェア、及び/またはこれらの組み合わせによって実現することができる。これらの各実施形態は、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムにて実行及び/または解釈される１つまたは複数のコンピュータプログラムにより実行することを含み得、当該プログラマブルプロセッサは、ストレージシステム、少なくとも１つの入力デバイス、及び少なくとも１つの出力デバイスからデータ及び命令を受け取り、データ及び命令を該ストレージシステム、当該少なくとも１つの入力デバイス、及び当該少なくとも１つの出力デバイスに転送することができる専用または汎用のプログラマブルプロセッサであってもよい。

本開示の方法を実施するためのプログラムコードは、１または複数のプログラミング言語の組み合わせで記述されていてもよい。これらのプログラムコードは、プロセッサ又はコントローラによって実行されると、フローチャート及び/またはブロック図で規定された機能?動作が実施されるように、汎用コンピュータや専用コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサやコントローラに提供されてもよい。プログラムコードは、機械上で完全に実行されるか、機械上で部分的に実行されるか、独立したソフトウェアパッケージとして機械上で部分的に実行されるとともにリモートマシン上で部分的に実行されるか、またはリモートマシンまたはサーバ上で完全に実行されてもよい。

本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置またはデバイスによって使用されるために、または命令実行システム、装置またはデバイスと組み合わせて使用されるためのプログラムを含むか、または記憶することができる有形媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体であってもよいし、機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体としては、電子的、磁気的、光学的、電磁的、赤外線的、半導体システム、装置、デバイス、またはこれらの任意の適切な組み合わせが挙げられるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例としては、１または複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能なプログラム可能なリードオンリメモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、光記憶装置、磁気記憶装置、またはこれらの任意の適切な組み合わせが挙げられる。

ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータで実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置（例えば、ＣＲＴ（陰極線管）またはＬＣＤ（液晶ディスプレイ）モニタ）と、キーボード及びポインティングデバイス（例えば、マウスまたはトラックボール）とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供するために用いられることができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、任意の形式（音響入力と、音声入力と、触覚入力とを含む）でユーザからの入力を受信することができる。

ここで説明されるシステム及び技術は、バックエンドコンポーネントを備えるコンピューティングシステム（例えば、データサーバとする）、またはミドルウェアコンポーネントを備えるコンピューティングシステム（例えば、アプリケーションサーバー）、またはフロントエンドコンポーネントを備えるコンピューティングシステム（例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェースまたは当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする）、またはこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを備えるコンピューティングシステムで実施することができる。任意の形式または媒体のデジタルデータ通信（例えば、通信ネットワーク）によってシステムのコンポーネントを互いに接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）と、ワイドエリアネットワーク（ＷＡＮ）と、インターネットと、ブロックチェーンネットワークとを含む。

コンピュータシステムは、クライアントとサーバとを備えることができる。クライアントとサーバは、一般的に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータで実行され、互いにクライアント－サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよく、分散システムのサーバー、またはブロックチェーンを結合したサーバーであってもよい。

なお、上述した様々な形態のフローを用いて、ステップを並び替え、追加または削除を行うことができることを理解されるべきである。例えば、本開示に記載された各ステップは、本願に開示された技術方案の所望の結果が達成できる限り、並列に実行されてもよいし、順番に実行されてもよいし、異なる順序で実行されてもよい。本明細書では制限されない。

上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組合、及び代替を行うことができることは理解される。本願の精神及び原理内で行われたあらゆる修正、同等の置換及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims

処理対象の質問テキスト及び質問応答のための情報テーブルを決定するステップであって、前記情報テーブルには、少なくとも１つの属性名が含まれるステップと、
前記質問テキスト及び前記少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定するステップと、
前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップと、
前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定するステップと、を含む、
ことを特徴とするテーブルに基づく質問応答方法。
前記質問テキスト及び前記少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定するステップは、
前記質問テキスト内の各文字及び前記少なくとも１つの属性名内の各文字に基づいて、質問属性文字シーケンスを生成するステップと、
前記質問属性文字シーケンス内の各文字に対してベクトル化処理を行って、前記文字ベクトルシーケンスを取得するステップと、
前記質問属性文字シーケンス内の各文字の位置情報に対してベクトル化処理を行って、前記位置ベクトルシーケンスを取得するステップと、
前記質問属性文字シーケンス内の各文字のタイプ情報に基づいてベクトル化処理を行って、前記タイプベクトルシーケンスを取得するステップであって、前記タイプ情報は、前記文字が前記質問テキスト又は前記少なくとも１つの属性名に属していることを示すステップと、を含む、
ことを特徴とする請求項１に記載のテーブルに基づく質問応答方法。
前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップは、
前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の各文字の確率情報を決定するステップであって、前記確率情報には、前記少なくとも１つの属性名に属する確率、および前記少なくとも１つの属性名に対応する属性値に属する確率が含まれるステップと、
前記質問テキスト内の各文字が前記少なくとも１つの属性名に属する確率及び前記少なくとも１つの属性名に対応する属性値に属する確率に基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップと、を含む、
ことを特徴とする請求項１に記載のテーブルに基づく質問応答方法。
前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の各文字の確率情報を決定するステップは、
前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに対して加算処理を行って、処理されたベクトルシーケンスを取得するステップと、
前記処理されたベクトルシーケンスに対してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得するステップであって、前記セマンティック表現ベクトルシーケンスには、前記質問テキスト内の各文字のセマンティック表現ベクトル、及び前記少なくとも１つの属性名内の各文字のセマンティック表現ベクトルが含まれるステップと、
各属性名について、前記属性名内の各文字のセマンティック表現ベクトルに対して加算および平均化処理を行って、前記属性名のセマンティック表現ベクトルを決定するステップと、
任意の文字属性名ペアについて、前記文字属性名ペアのうちの第１の文字のセマンティック表現ベクトル及び前記文字属性名ペアのうちの第１の属性名のセマンティック表現ベクトルをスプライシングして、第１のスプライシングベクトルを取得するステップと、
前記第１のスプライシングベクトルに基づいて、前記第１の文字が前記第１の属性名に属する確率、及び前記第１の文字が前記第１の属性名に対応する属性値に属する確率を決定するステップと、を含む、
ことを特徴とする請求項３に記載のテーブルに基づく質問応答方法。
前記質問テキスト内の各文字が前記少なくとも１つの属性名に属する確率及び前記少なくとも１つの属性名に対応する属性値に属する確率に基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップは、
前記質問テキスト内の各文字について、前記文字が前記少なくとも１つの属性名に属する確率及び前記少なくとも１つの属性名に対応する属性値に属する確率に基づいて、前記文字が属する属性名又は前記文字が属する属性値を決定するステップと、
前記質問テキスト内の各文字が属する属性名又は前記文字が属する属性値に基づいて、前記属性名セグメントと前記属性値セグメントとを決定するステップと、を含む、
ことを特徴とする請求項３に記載のテーブルに基づく質問応答方法。
前記情報テーブルには、各前記属性名に対応する少なくとも１つの属性値がさらに含まれ、
前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定するステップは、
前記属性名セグメントと前記属性値セグメントとに基づいて前記情報テーブルをクエリして、前記属性名セグメントおよび前記属性値セグメントに対応するコンテンツを取得するステップと、
前記コンテンツを前記質問テキストに対応する回答として決定するステップと、を含む、
ことを特徴とする請求項１に記載のテーブルに基づく質問応答方法。
初期の質問応答モデルを構築するステップであって、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールと、を含むステップと、
トレーニングデータを取得するステップであって、前記トレーニングデータは、情報テーブル内の少なくとも１つの属性名と、サンプル質問テキストと、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントとを含むステップと、
前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも１つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするステップと、を含む、
ことを特徴とする質問応答モデルのトレーニング方法。
前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも１つの属性名を使用して、前記質問応答モデルの出力として前記サンプル質問テキストに対応する前記属性名セグメント及び前記属性値セグメントを使用して、前記質問応答モデルをトレーニングするステップは、
前記サンプル質問テキストおよび前記少なくとも１つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントを取得するステップと、
前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、損失関数を構築するステップと、
前記損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現するステップと、を含む、
ことを特徴とする請求項７に記載の質問応答モデルのトレーニング方法。
前記質問応答モデルは、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをセマンティックマッチングして、セマンティックマッチング度合いを決定するセマンティックマッチングモジュールをさらに含み、
前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも１つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするステップは、
前記サンプル質問テキストおよび前記少なくとも１つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントを取得するステップと、
前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、第１の損失関数を構築するステップと、
前記セマンティックマッチングモジュールから出力された予測マッチング度合い及び予め設定されたマッチング度合い閾値に基づいて、第２の損失関数を構築するステップと、
前記第１の損失関数と前記第２の損失関数とに基づいて、総損失関数を構築するステップと、
前記総損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現するステップと、を含む、
ことを特徴とする請求項７に記載の質問応答モデルのトレーニング方法。
処理対象の質問テキスト及び質問応答のための情報テーブルを決定する第１の決定モジュールであって、前記情報テーブルには、少なくとも１つの属性名が含まれる第１の決定モジュールと、
前記質問テキスト及び前記少なくとも１つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定する第２の決定モジュールと、
前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定する第３の決定モジュールと、
前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定する第４の決定モジュールと、を含む、
ことを特徴とするテーブルに基づく質問応答装置。
前記第２の決定モジュールが、
前記質問テキスト内の各文字及び前記少なくとも１つの属性名内の各文字に基づいて、質問属性文字シーケンスを生成し、
前記質問属性文字シーケンス内の各文字に対してベクトル化処理を行って、前記文字ベクトルシーケンスを取得し、
前記質問属性文字シーケンス内の各文字の位置情報に対してベクトル化処理を行って、前記位置ベクトルシーケンスを取得し、
前記質問属性文字シーケンス内の各文字のタイプ情報に基づいてベクトル化処理を行って、前記タイプベクトルシーケンスを取得し、前記タイプ情報が、前記文字が前記質問テキスト又は前記少なくとも１つの属性名に属していることを示す、
ことを特徴とする請求項１０に記載のテーブルに基づく質問応答装置。
前記第３の決定モジュールは、
前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の各文字の確率情報を決定する第１の決定ユニットであって、前記確率情報には、前記少なくとも１つの属性名に属する確率、および前記少なくとも１つの属性名に対応する属性値に属する確率が含まれる第１の決定ユニットと、
前記質問テキスト内の各文字が前記少なくとも１つの属性名に属する確率及び前記少なくとも１つの属性名に対応する属性値に属する確率に基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定する第２の決定ユニットと、を含む、
ことを特徴とする請求項１０に記載のテーブルに基づく質問応答装置。
前記第１の決定ユニットが、
前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに対して加算処理を行って、処理されたベクトルシーケンスを取得し、
前記処理されたベクトルシーケンスに対してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得し、前記セマンティック表現ベクトルシーケンスには、前記質問テキスト内の各文字のセマンティック表現ベクトル、及び前記少なくとも１つの属性名内の各文字のセマンティック表現ベクトルが含まれ、
各属性名について、前記属性名内の各文字のセマンティック表現ベクトルに対して加算および平均化処理を行って、前記属性名のセマンティック表現ベクトルを決定し、
任意の文字属性名ペアについて、前記文字属性名ペアのうちの第１の文字のセマンティック表現ベクトル及び前記文字属性名ペアのうちの第１の属性名のセマンティック表現ベクトルをスプライシングして、第１のスプライシングベクトルを取得し、
前記第１のスプライシングベクトルに基づいて、前記第１の文字が前記第１の属性名に属する確率、及び前記第１の文字が前記第１の属性名に対応する属性値に属する確率を決定する、
ことを特徴とする請求項１２に記載のテーブルに基づく質問応答装置。
前記第２の決定ユニットが、
前記質問テキスト内の各文字について、前記文字が前記少なくとも１つの属性名に属する確率及び前記少なくとも１つの属性名に対応する属性値に属する確率に基づいて、前記文字が属する属性名又は前記文字が属する属性値を決定し、
前記質問テキスト内の各文字が属する属性名又は前記文字が属する属性値に基づいて、前記属性名セグメントと前記属性値セグメントとを決定する、
ことを特徴とする請求項１２に記載のテーブルに基づく質問応答装置。
前記情報テーブルは、各前記属性名に対応する少なくとも１つの属性値をさらに含み、
前記第４の決定モジュールが、
前記属性名セグメントと前記属性値セグメントとに基づいて前記情報テーブルをクエリして、前記属性名セグメントおよび前記属性値セグメントに対応するコンテンツを取得し、
前記コンテンツを前記質問テキストに対応する回答として決定する、
ことを特徴とする請求項１０に記載のテーブルに基づく質問応答装置。
初期の質問応答モデルを構築する構築モジュールであって、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールと、を含む構築モジュールと、
トレーニングデータを取得する取得モジュールであって、前記トレーニングデータは、情報テーブル内の少なくとも１つの属性名と、サンプル質問テキストと、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントとを含む取得モジュールと、
前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも１つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするトレーニングモジュールと、を含む、
ことを特徴とする質問応答モデルのトレーニング装置。
前記トレーニングモジュールが、
前記サンプル質問テキストおよび前記少なくとも１つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、
前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、損失関数を構築し、
前記損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現する、
ことを特徴とする請求項１６に記載の質問応答モデルのトレーニング装置。
前記質問応答モデルは、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをセマンティックマッチングして、セマンティックマッチング度合いを決定するセマンティックマッチングモジュールをさらに含み、
前記トレーニングモジュールが、
前記サンプル質問テキストおよび前記少なくとも１つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、
前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、第１の損失関数を構築し、
前記セマンティックマッチングモジュールから出力された予測マッチング度合い及び予め設定されたマッチング度合い閾値に基づいて、第２の損失関数を構築し、
前記第１の損失関数と前記第２の損失関数とに基づいて、総損失関数を構築し、
前記総損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現する、
ことを特徴とする請求項１６に記載の質問応答モデルのトレーニング装置。
電子機器であって、
少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも１つのプロセッサが請求項１～６のいずれかに記載のテーブルに基づく質問応答方法、または請求項７～９のいずれかに記載の質問応答モデルのトレーニング方法を実行できるように、前記少なくとも１つのプロセッサによって実行される、
ことを特徴とする電子機器。
コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項１～６のいずれかに記載のテーブルに基づく質問応答方法、または請求項７～９のいずれかに記載の質問応答モデルのトレーニング方法を実行させる、
ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
コンピュータプログラムであって、
前記コンピュータプログラムがプロセッサによって実行される場合、請求項１～６のいずれかに記載のテーブルに基づく質問応答方法、または請求項７～９のいずれかに記載の質問応答モデルのトレーニング方法が実現される、
ことを特徴とするコンピュータプログラム。