JP2023012541A - テーブルに基づく質問応答方法、装置及び電子機器 - Google Patents

テーブルに基づく質問応答方法、装置及び電子機器 Download PDF

Info

Publication number
JP2023012541A
JP2023012541A JP2022178303A JP2022178303A JP2023012541A JP 2023012541 A JP2023012541 A JP 2023012541A JP 2022178303 A JP2022178303 A JP 2022178303A JP 2022178303 A JP2022178303 A JP 2022178303A JP 2023012541 A JP2023012541 A JP 2023012541A
Authority
JP
Japan
Prior art keywords
character
attribute name
attribute
question
vector sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022178303A
Other languages
English (en)
Inventor
ドンフン フ
Dongfeng He
ビンジン チェン
Bingjin Chen
ジァーヤン トゥ
Jiayang Tu
インジャン リン
Yingzhan Lin
シューウェイ フアン
Shiwei Huang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2023012541A publication Critical patent/JP2023012541A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる質問応答方法、装置及び電子機器を提供する。【解決手段】方法は、処理対象の質問テキスト及び質問応答のための、少なくとも1つの属性名を含む情報テーブルを決定し、質問テキスト及び少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定し、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定し、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定する。【選択図】図3

Description

本開示は、人工知能技術の分野に関し、特に自然言語処理、深層学習技術の分野に関し、特にテーブルに基づく質問応答方法、装置及び電子機器に関する。
関連技術における質問応答方法は、主に、入力された質問に基づいて質問の各文字を文字ベクトルに変換して、文字ベクトルシーケンスを決定し、文字ベクトルシーケンスに基づいて質問の各文字が複数の固定カテゴリに属する確率を計算するが、テーブル質問応答におけるカテゴリは固定されていないため、質問応答の効率が低く、精度が低くなる。
本開示は、テーブルに基づく質問応答方法、装置及び電子機器を提供する。
本開示の一態様によれば、テーブルに基づく質問応答方法を提供し、処理対象の質問テキスト及び質問応答のための情報テーブルを決定するステップであって、前記情報テーブルには、少なくとも1つの属性名が含まれるステップと、前記質問テキスト及び前記少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定するステップと、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップと、前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定するステップと、を含む。
本開示の別の態様によれば、質問応答モデルのトレーニング方法を提供し、初期の質問応答モデルを構築するステップであって、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するためのベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するためのセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するためのモジュールとを含むステップと、トレーニングデータを取得するステップであって、前記トレーニングデータは、情報テーブル内の少なくとも1つの属性名と、サンプル質問テキストと、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントとを含むステップと、前記質問応答モデルの入力として前記サンプル質問テキスト、及び前記少なくとも1つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするステップとを含む。
本開示の別の態様によれば、テーブルに基づく質問応答装置を提供し、処理対象の質問テキスト及び質問応答のための情報テーブルを決定するための第1の決定モジュールであって、前記情報テーブルには、少なくとも1つの属性名が含まれる第1の決定モジュールと、前記質問テキスト及び前記少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定するための第2の決定モジュールと、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するための第3の決定モジュールと、前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定するための第4の決定モジュールと、を含む。
本開示の別の態様によれば、質問応答モデルのトレーニング装置を提供し、初期の質問応答モデルを構築するための構築モジュールであって、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンス抽出を取得するためのベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するためのセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するためのモジュールとを含む構築モジュールと、トレーニングデータを取得するための取得モジュールであって、前記トレーニングデータは、情報テーブル内の少なくとも1つの属性名と、サンプル質問テキストと、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントとを含む取得モジュールと、前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも1つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするためのトレーニングモジュールと、を含む。
本開示のさらに別の態様によれば、電子機器を提供し、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行される命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサが本開示の上記の一態様によるテーブルに基づく質問応答方法、又は、本開示の上記の別の態様による質問応答モデルのトレーニング方法を実行できるように、前記少なくとも1つのプロセッサによって実行される。
本開示のさらに一態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、
前記コンピュータ命令は、コンピュータに本開示の上記の一態様によるテーブルに基づく質問応答方法、又は、本開示の上記の別の態様による質問応答モデルのトレーニング方法を実行させる。
本開示のさらに一態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本開示の上記の一態様によるテーブルに基づく質問応答方法、又は、本開示の上記の別の態様による質問応答モデルのトレーニング方法が実現される。
なお、この部分に記載の内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していない。本出願の他の特徴は下記の明細書の記載を通して理解しやすくなる。
Figure 2023012541000002
以下、図面と組み合わせて本出願の例示的な実施例を説明する。理解を容易にするために、その中には本発明の実施例の様々な詳細が含まれ、それらは単なる例示と見なされるべきである。したがって、当業者は、本発明の範囲及び精神から逸脱することなく、本明細書に記載の実施例に対して様々な変更及び修正を行うことができる。また、わかりやすくかつ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。
関連技術における質問応答方法は、主に、入力された質問に基づいて質問の各文字を文字ベクトルに変換して、文字ベクトルシーケンスを決定し、文字ベクトルシーケンスに基づいて質問の各文字が複数の固定カテゴリに属する確率を計算するが、テーブル質問応答におけるカテゴリは固定されていないため、質問応答の効率が低く、精度が低くなる。
上記の課題に対して、本開示は、テーブルに基づく質問応答方法、装置及び電子機器を提供する。
図1は本開示の第1の実施例による模式図であり、本開示の実施例のテーブルに基づく質問応答方法は、テーブルに基づく質問応答装置に適用され得、この装置は、電子機器がテーブルに基づく質問応答機能を実行できるように、電子機器に配置することができる。
ここで、電子機器は、コンピューティング機能を備えた任意のデバイスにすることができる。ここで、コンピューティング機能を備えたデバイスは、例えば、パーソナルコンピュータ(Personal Computer、PCと略す)、モバイル端末、サーバーなどであり得、例えば、モバイル端末は、車載デバイス、携帯電話、タブレットコンピュータ、携帯情報端末、ウェアラブルデバイスなど、様々なオペレーティングシステム、タッチスクリーンおよび/またはディスプレイスクリーンを備えたハードウェアデバイスであり得る。
図1に示すように、このテーブルに基づく質問応答方法は、以下のステップ101~104を含む。
ステップ101では、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも1つの属性名が含まれる。
本開示の実施例では、処理対象の質問テキストは、ユーザによって尋ねられる質問のテキストであり、処理対象の質問テキストは、1つまたは複数であり得る。例えば、質問テキストは、「パサートはいくらですか」、「ハヴァル H6の排気量はどれくらいですか」、「ハヴァルH6はいくらですか」などであり得る。
本開示の実施例では、情報テーブルは属性名と属性値とを含み、属性名は属性値に対応付けられ、情報テーブルは少なくとも1つの属性名を含み、各属性名は少なくとも1つの属性値に対応付けられる。図2は情報テーブルの模式図であり、図2に示すように、情報テーブルに含まれる属性名は、例えば、「車型」、「価格」、「排気量」であり、属性名が「車型」である場合、対応する属性値は、例えば「パサート」、「CR-V」、「A4L」、「ハヴァルH6」であり得、属性名が「価格」である場合、対応する属性値は、例えば「15.49」、「27.66」、「34.94」、「13.4」であり得、属性名が「排気量」である場合、対応する属性値は、例えば「2.0」、「1.4」、「1.5」であり得る。
ステップ102では、質問テキスト及び少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定する。
本開示の実施例では、テーブルに基づく質問応答装置がステップ102を実行する過程は、例えば質問テキスト内の各文字及び少なくとも1つの属性名内の各文字に基づいて、質問属性文字シーケンスを生成し、質問属性文字シーケンス内の各文字に対してベクトル化処理を行って、文字ベクトルシーケンスを取得し、質問属性文字シーケンス内の各文字の位置情報に対してベクトル化処理を行って、位置ベクトルシーケンスを取得し、質問属性文字シーケンス内の各文字のタイプ情報に基づいてベクトル化処理を行って、タイプベクトルシーケンスを取得し、ここで、タイプ情報は、文字が質問テキスト又は少なくとも1つの属性名に属していることを示す。
ここで、文字ベクトルシーケンスは、質問属性文字シーケンス内の各文字の文字ベクトルを含む。ここで、文字の文字ベクトルは、文字に対してone-hotベクトルアルゴリズムやワードベクトルアルゴリズム(word2vec)などのベクトル化処理を行うことで得られ、文字ベクトルによって異なる文字を区別するために使用される。実際に選択するアルゴリズムは、必要に応じて設定することができる。
ここで、位置ベクトルシーケンスは質問属性文字シーケンス内の各文字の位置ベクトルを含む。ここで、文字の位置ベクトルは、質問属性文字シーケンスにおける文字の位置を示し、異なる位置ベクトルは、異なる位置を示す。
ここで、タイプベクトルシーケンスは質問属性文字シーケンス内の各文字のタイプベクトルを含む。ここで、文字のタイプベクトルは、文字が質問テキスト又は少なくとも1つの属性名に属していることを示す。タイプベクトルは全部で2種類あり、1つは文字が質問テキストに属していることを示し、もう1つは文字が少なくとも1つの属性名に属していることを示す。
本開示の実施例では、質問テキスト内の各文字及び少なくとも1つの属性内の各文字に対して、質問属性文字シーケンスを生成することにより、質問テキスト内の各文字が属する属性名、又は属する属性名に対応する属性値を決定することができ、ここで、属性名は、必要に応じて変更することができるため、本開示におけるテーブルに基づく質問応答方法は、属性名の数およびタイプを制限しなく、さまざまなシナリオでのさまざまな情報テーブルに適用することができ、特定のシナリオでの情報テーブルを使用して、質問テキストに対応する回答を決定することができるため、テーブルに基づく質問応答のコストを削減し、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。
ステップ103では、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定する。
本開示の実施例では、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の各文字が属する属性名、又は属する属性名に対応する属性値を決定し、ひいてはそれが属する属性名を、属性名セグメントとして決定し、それが属する属性名に対応する属性値を、属性値セグメントとして決定する。
ステップ104では、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定する。
本開示の実施例では、テーブルに基づく質問応答装置がステップ104を実行する過程は、例えば属性名セグメントと属性値セグメントとに基づいて情報テーブルをクエリして、属性名セグメントおよび属性値セグメントに対応するコンテンツを取得し、このコンテンツを、質問テキストに対応する回答として決定する。
ここで、質問テキストが「パサートはいくらですか」であり、情報テーブルが図2に示すような情報テーブルであることを例として、質問テキスト内の「パサート」)が図2の属性値セグメント「パサート」に対応し、質問テキスト内の「いくら」が図2の属性名セグメント「価格」に対応し、この属性名セグメントと属性値セグメントとに基づいて、図2に示すような情報テーブルをクエリして、属性名セグメントおよび属性値セグメントに対応するコンテンツ「15.49」を、上記の質問テキストに対応する回答として取得する。
本開示の実施例では、属性名セグメントと属性値セグメントとは、質問テキスト及び情報テーブル内の少なくとも1つの属性名に基づいて決定されるため、上記の属性名セグメントと属性値セグメントに基づいて上記の情報テーブルをクエリすることにより、属性名セグメントおよび属性値セグメントに対応するコンテンツを取得することができ、テーブルに基づく質問応答の效率をさらに向上させ、テーブルに基づく質問応答の精度を向上させることができる。
以上を纏めると、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも1つの属性名が含まれ、質問テキスト及び少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定し、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定し、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定することにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。
質問テキスト内の属性名セグメントと属性値セグメントとを正確に決定して、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させるために、質問テキスト内の各文字の確率情報を決定する必要があり、図3に示すように、図3は本開示の第2の実施例による模式図であり、本開示の実施例では、まず、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて質問テキスト内の各文字の確率情報を決定し、その確率情報には、少なくとも1つの属性名に属する確率、および少なくとも1つの属性名に対応する属性値に属する確率が含まれ、ひいては質問テキスト内の属性名セグメントおよび属性値セグメントを決定する。図3に示す実施例は、以下のステップを含む。
ステップ301では、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも1つの属性名が含まれる。
ステップ302では、質問テキスト及び少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定する。
ステップ303では、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の各文字の確率情報を決定し、確率情報には、少なくとも1つの属性名に属する確率、および少なくとも1つの属性名に対応する属性値に属する確率が含まれる。
本開示の実施例では、テーブルに基づく質問応答装置がステップ303を実行する過程は、例えば文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに対して加算処理を行って、処理されたベクトルシーケンスを取得し、処理されたベクトルシーケンスに対してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得し、セマンティック表現ベクトルシーケンスには、質問テキスト内の各文字のセマンティック表現ベクトル、及び少なくとも1つの属性名内の各文字のセマンティック表現ベクトルが含まれ、各属性名について、属性名内の各文字のセマンティック表現ベクトルに対して加算および平均化処理を行って、属性名のセマンティック表現ベクトルを決定し、任意の文字属性名ペアについて、文字属性名ペアのうちの第1の文字のセマンティック表現ベクトルと文字属性名ペアのうちの第1の属性名のセマンティック表現ベクトルとをスプライシングして、第1のスプライシングベクトルを取得し、第1のスプライシングベクトルに基づいて、第1の文字が第1の属性名に属する確率、及び第1の文字が第1の属性名に対応する属性値に属する確率を決定する。
本開示の実施例では、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに対して加算処理を行って、加算処理されたベクトルシーケンスに対してセマンティック表現処理を行って、セマンティック表現ベクトルシーケンスを取得し、ひいてはテキスト内の文字が属性名および属性値に属する確率を決定することにより、質問テキスト内の文字のセマンティック表現ベクトルの精度を向上させ、属性名内の文字のセマンティック表現ベクトルの精度を向上させることができるため、確率情報の精度を向上させ、ひいては決定された属性名セグメントと属性値セグメントの精度を向上させ、さらにテーブルの質問応答の精度を向上させることができる。
ステップ304では、質問テキスト内の各文字が少なくとも1つの属性名に属する確率及び少なくとも1つの属性名に対応する属性値に属する確率に基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定する。
本開示の実施例では、テーブルに基づく質問応答装置がステップ304を実行する過程は、例えば質問テキスト内の各文字について、文字が少なくとも1つの属性名に属する確率及び少なくとも1つの属性名に対応する属性値に属する確率に基づいて、文字が属する属性名又は文字が属する属性値を決定し、質問テキスト内の各文字が属する属性名又は文字が属する属性値に基づいて、属性名セグメントと属性値セグメントとを決定する。
本開示の実施例では、文字が少なくとも1つの属性名に属する確率及び少なくとも1つの属性名に対応する属性値に属する確率が決定された後、最大確率を決定することができ、最大確率が特定の属性名に対応付けられる場合、この属性名を、文字が属する属性名として決定し、この属性名を属性名セグメントとし、最大確率が、特定の属性名の特定の属性値に対応付けられる場合、この属性値を、文字が属する属性値として決定し、この属性値を属性値セグメントとする。
本開示の実施例では、質問テキスト内の各文字が属性名及び属性名に対応する属性値に属する確率を決定することにより、文字が属する属性名又は文字が属する属性値の精度を向上させ、さらに決定された属性名セグメントと属性値セグメントの精度を向上させ、テーブルに基づく質問応答の精度を向上させることができる。
ステップ305では、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定する。
なお、ステップ301、302および305の詳細については、図1に示す実施例におけるステップ101、ステップ102およびステップ104を参照することができるが、ここでは詳細には説明しない。
以上を纏めると、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも1つの属性名が含まれ、質問テキスト及び少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定し、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の各文字の確率情報を決定し、確率情報には、少なくとも1つの属性名に属する確率、および少なくとも1つの属性名に対応する属性値に属する確率が含まれ、質問テキスト内の各文字が少なくとも1つの属性名に属する確率及び少なくとも1つの属性名に対応する属性値に属する確率に基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定し、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定することにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。
図4は本開示の第3の実施例による模式図である。なお、本開示の実施例の質問応答モデルのトレーニング方法は、質問応答モデルのトレーニング装置に適用され、この質問応答モデルのトレーニング装置は、電子機器が質問応答モデルのトレーニング機能を実行できるように、任意の電子機器に配置することができる。
ここで、電子機器は、コンピューティング機能を備えた任意のデバイスにすることができる。ここで、コンピューティング機能を備えたデバイスは、例えば、パーソナルコンピュータ(Personal Computer、PCと略す)、モバイル端末、サーバーなどであり得、モバイル端末は、例えば、車載デバイス、携帯電話、タブレットコンピュータ、携帯情報端末、ウェアラブルデバイスなど、様々なオペレーティングシステム、タッチスクリーンおよび/またはディスプレイスクリーンを備えたハードウェアデバイスであり得る。
図4に示すように、この質問応答モデルのトレーニング方法は、以下のステップ401~403を含むことができる。
ステップ401では、初期の質問応答モデルを構築し、質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールとを含む。
本出願の実施例では、セマンティック抽出モジュールは、例えばセマンティック表現モデル(Enhanced Representation from kNowledge IntEgration、ERNIE)内のエンコーディングモジュールであり得る。
ステップ402では、トレーニングデータを取得し、トレーニングデータは、情報テーブル内の少なくとも1つの属性名、サンプル質問テキスト、サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントを含む。
ステップ403では、質問応答モデルの入力としてサンプル質問テキスト及び少なくとも1つの属性名を使用して、質問応答モデルの出力としてサンプル属性名セグメント及びサンプル属性値セグメントを使用して、質問応答モデルをトレーニングする。
本開示の実施例では、一例では、トレーニングされた質問応答モデルの精度を向上させるために、質問応答モデルのトレーニング装置がステップ403を実行する過程は、例えばサンプル質問テキスト、および少なくとも1つの属性名を質問応答モデルを入力して、質問応答モデルから出力された予測属性名セグメント及び予測属性値セグメントを取得し、予測属性名セグメント、予測属性値セグメント、サンプル属性名セグメントおよびサンプル属性値セグメントに基づいて、損失関数を構築し、損失関数の値に基づいて、質問応答モデルに対して係数を調整して、トレーニングを実現する。
本開示の実施例では、別の例では、トレーニングされた質問応答モデルの精度をさらに向上させるために、質問テキスト内の文字と属性名内の文字との間のマッチング度合いと組み合わせて、損失関数を構築することができる。従って、質問応答モデルは、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをセマンティックマッチングして、セマンティックマッチング度合いを決定するセマンティックマッチングモジュールをさらに含む。質問応答モデルのトレーニング装置がステップ403を実行する過程は、例えばサンプル質問テキスト、および少なくとも1つの属性名を質問応答モデルを入力して、質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、予測属性名セグメント、予測属性値セグメント、サンプル属性名セグメントおよびサンプル属性値セグメントに基づいて、第1の損失関数を構築し、セマンティックマッチングモジュールから出力された予測マッチング度合い及び予め設定されたマッチング度合い閾値に基づいて、第2の損失関数を構築し、第1の損失関数と第2の損失関数とに基づいて、総損失関数を構築し、総損失関数の値に基づいて、質問応答モデルに対して係数を調整して、トレーニングを実現する。
本開示の実施例では、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルのセマンティックマッチング度合いに基づいて、損失関数を構築することにより、トレーニングされた質問応答モデルの精度を向上させ、質問応答モデルのトレーニング速度を上げることができる。
以上を纏めると、初期の質問応答モデルを構築し、質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールとを含み、トレーニングデータを取得し、トレーニングデータは、情報テーブル内の少なくとも1つの属性名、サンプル質問テキスト、サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントを含み、質問応答モデルの入力としてサンプル質問テキスト及び少なくとも1つの属性名を使用して、質問応答モデルの出力としてサンプル属性名セグメント及びサンプル属性値セグメントを使用して、質問応答モデルをトレーニングすることにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。
例として、図5は質問応答モデルの概略構成図であり、図5に示すように、サンプル質問テキストおよび少なくとも1つの属性名は質問応答モデルの入力であり、具体的な入力フォーマットは、[CLS]Q、Q、... [SEP]C11、C12...[SEP]C21、C22、... [SEP]... [SEP]であり、ここで、Qはサンプル質問テキスト内のi番目の文字であり、Cjkは情報テーブル内のj番目の属性名のk番目の文字である。サンプル質問テキストと属性名の間、および属性名と属性名の間は、セマンティック表現モデルの内部区切り文字「[SEP]」で区切られている。サンプル質問テキスト内の文字と情報テーブルの属性名内の文字をスプライシングして、質問属性文字シーケンスを取得し、質問属性文字シーケンス内の各文字、各文字の位置情報、および各文字のタイプ情報に対してベクトル化処理を行って、文字ベクトルシーケンス、位置ベクトルシーケンス、およびタイプベクトルシーケンスを取得し、文字ベクトルシーケンス(token embedding)、位置ベクトルシーケンス(position embedding)及びタイプベクトルシーケンス(type embedding)に対して加算処理を行って、処理されたベクトルシーケンス(入力シーケンス)を取得し、それをセマンティック抽出モジュール(セマンティック表現モデルのエンコーディングモジュール)に送信してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得する。ここで、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスは、それぞれ各文字のセマンティック情報、位置情報、カテゴリ情報をエンコーディングする。hqiはサンプル質問テキスト内のi番目の文字のセマンティック表現ベクトルであり、hcjkはj番目の属性名内のk番目の文字のセマンティック表現ベクトルである。
図5では、セマンティック表現ベクトルシーケンスに含まれる各属性名のすべての文字のセマンティック表現ベクトルに対してベクトル平均化(average pooling)を行い、即ち平均プーリング(加算および平均)を行うことにより、各属性名のセマンティック表現ベクトルを取得することができ、j番目の属性名のセマンティック表現ベクトルをvcjとして示す。例えば、「価格」が入力シーケンスの2番目の属性であり、その2つの文字のセマンティック表現ベクトルはhc21とhc22であり、2つのセマンティック表現ベクトルを平均することにより、価格属性のセマンティック表現ベクトルvc2を取得することができる。
Figure 2023012541000003
Figure 2023012541000004
上記実施例を実現するために、本開示は、テーブルに基づく質問応答装置をさらに提供する。
図6に示すように、図6は本開示の第4の実施例による模式図である。このテーブルに基づく質問応答装置600は、第1の決定モジュール610、第2の決定モジュール620、第3の決定モジュール630および第4の決定モジュール640を含む。
ここで、第1の決定モジュール610は、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、前記情報テーブルには、少なくとも1つの属性名が含まれる。
第2の決定モジュール620は、前記質問テキスト及び前記少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定する。
第3の決定モジュール630は、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定する。
第4の決定モジュール640は、前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定する。
本開示の実施例の可能な一実施形態として、前記第2の決定モジュール620は、具体的には、前記質問テキスト内の各文字及び前記少なくとも1つの属性名内の各文字に基づいて、質問属性文字シーケンスを生成し、前記質問属性文字シーケンス内の各文字に対してベクトル化処理を行って、前記文字ベクトルシーケンスを取得し、前記質問属性文字シーケンス内の各文字の位置情報に対してベクトル化処理を行って、前記位置ベクトルシーケンスを取得し、前記質問属性文字シーケンス内の各文字のタイプ情報に基づいてベクトル化処理を行って、前記タイプベクトルシーケンスを取得し、前記タイプ情報は、前記文字が前記質問テキスト又は前記少なくとも1つの属性名に属していることを示す。
本開示の実施例の可能な実施形態として、前記第3の決定モジュール630は、第1の決定ユニットと第2の決定ユニットを含む。
ここで、第1の決定ユニットは、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の各文字の確率情報を決定し、前記確率情報には、前記少なくとも1つの属性名に属する確率、および前記少なくとも1つの属性名に対応する属性値に属する確率が含まれ、第2の決定ユニットは、前記質問テキスト内の各文字が前記少なくとも1つの属性名に属する確率及び前記少なくとも1つの属性名に対応する属性値に属する確率に基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定する。
本開示の実施例の可能な一実施形態として、前記第1の決定ユニットは、具体的には、前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに対して加算処理を行って、処理されたベクトルシーケンスを取得し、前記処理されたベクトルシーケンスに対してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得し、前記セマンティック表現ベクトルシーケンスには、前記質問テキスト内の各文字のセマンティック表現ベクトル、及び前記少なくとも1つの属性名内の各文字のセマンティック表現ベクトルが含まれ、各属性名について、前記属性名内の各文字のセマンティック表現ベクトルに対して加算および平均化処理を行って、前記属性名のセマンティック表現ベクトルを決定し、任意の文字属性名ペアについて、前記文字属性名ペアのうちの第1の文字のセマンティック表現ベクトル及び前記文字属性名ペアのうちの第1の属性名のセマンティック表現ベクトルをスプライシングして、第1のスプライシングベクトルを取得し、前記第1のスプライシングベクトルに基づいて、前記第1の文字が前記第1の属性名に属する確率、及び前記第1の文字が前記第1の属性名に対応する属性値に属する確率を決定する。
本開示の実施例の可能な一実施形態として、前記第2の決定ユニットは、具体的には、前記質問テキスト内の各文字について、前記文字が前記少なくとも1つの属性名に属する確率及び前記少なくとも1つの属性名に対応する属性値に属する確率に基づいて、前記文字が属する属性名又は前記文字が属する属性値を決定し、前記質問テキスト内の各文字が属する属性名又は前記文字が属する属性値に基づいて、前記属性名セグメントと前記属性値セグメントとを決定する。
本開示の実施例の可能な一実施形態として、前記情報テーブルは、各前記属性名に対応する少なくとも1つの属性値をさらに含み、前記第4の決定モジュール640は、具体的には、前記属性名セグメントと前記属性値セグメントとに基づいて前記情報テーブルをクエリして、前記属性名セグメントおよび前記属性値セグメントに対応するコンテンツを取得し、前記コンテンツを前記質問テキストに対応する回答として決定する。
本開示の実施例のテーブルに基づく質問応答装置は、処理対象の質問テキスト及び質問応答のための情報テーブルを決定し、情報テーブルには、少なくとも1つの属性名が含まれ、質問テキスト及び少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定し、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスに基づいて、質問テキスト内の属性名セグメントと属性値セグメントとを決定し、属性名セグメント、属性値セグメント及び情報テーブルに基づいて、質問テキストに対応する回答を決定することにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。
上記実施例を実現するために、本開示は、質問応答モデルのトレーニング装置をさらに提供する。
図7は本開示の第5の実施例の模式図であり、この質問応答モデルのトレーニング装置700は、構築モジュール710、取得モジュール720およびトレーニングモジュール730を含む。
構築モジュール710は、初期の質問応答モデルを構築し、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンス抽出を取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールとを含む。
取得モジュール720は、トレーニングデータを取得し、前記トレーニングデータは、情報テーブル内の少なくとも1つの属性名、サンプル質問テキスト、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントを含む。
トレーニングモジュール730は、前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも1つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングする。
本開示の実施例の可能な一実施形態として、前記トレーニングモジュール730は、具体的には、前記サンプル質問テキストおよび前記少なくとも1つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、損失関数を構築し、前記損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現する。
本開示の実施例の可能な一実施形態として、前記質問応答モデルは、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをセマンティックマッチングして、セマンティックマッチング度合いを決定するセマンティックマッチングモジュールをさらに含み、前記トレーニングモジュール730は、具体的には、前記サンプル質問テキストおよび前記少なくとも1つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、第1の損失関数を構築し、前記セマンティックマッチングモジュールから出力された予測マッチング度合い及び予め設定されたマッチング度合い閾値に基づいて、第2の損失関数を構築し、前記第1の損失関数と前記第2の損失関数とに基づいて、総損失関数を構築し、前記総損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現する。
本開示の実施例の質問応答モデルのトレーニング装置は、初期の質問応答モデルを構築し、質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンス抽出を取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールとを含み、トレーニングデータを取得し、トレーニングデータは、情報テーブル内の少なくとも1つの属性名、サンプル質問テキスト、サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントを含み、質問応答モデルの入力としてサンプル質問テキスト及び少なくとも1つの属性名を使用して、質問応答モデルの出力としてサンプル属性名セグメントとサンプル属性値セグメントを使用して、質問応答モデルをトレーニングすることにより、テーブルに基づく質問応答の效率を向上させ、テーブルに基づく質問応答の精度を向上させることができる。
本開示の技術案では、関連するユーザーの個人情報の収集、保管、使用、処理、伝送、提供および開示はすべてユーザーの同意を得て行われ、関連する法規制を遵守し、公序良俗に違反しない。
本開示の実施例によれば、本開示は電子機器、および読み取り可能な記憶媒体をさらに提供する。
本開示の実施例によれば、本開示はコンピュータプログラムが含まれるコンピュータプログラム製品をさらに提供し、前記コンピュータプログラムがプロセッサによって実行される場合、本開示によって提供されるテーブルに基づく質問応答方法、又は、本開示によって提供される質問応答モデルのトレーニング方法が実現される
図8は、本開示の実施例を実施するための例示的な電子機器800の概略ブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタルプロセシング、セルラー電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなど、様々な形態のモバイルデバイスを表してもよい。本明細書に示されるコンポーネント、それらの接続及び関係、並びにそれらの機能は、単なる例であり、本明細書に記載及び/または求められる本願の実現を限定することを意図しない。
図8に示すように、電子機器800は、リードオンリーメモリ(ROM)802に記憶されたコンピュータプログラム、または記憶ユニット808からランダムアクセスメモリ(RAM)803にローディングされたコンピュータプログラムに基づいて、様々な適切な動作と処理を実行できる計算ユニット801を含む。RAM803には、電子機器800の動作に必要な各種のプログラム及びデータをさらに記憶することができる。計算ユニット801と、ROM802と、RAM803とは、バス804を介して互いに接続されている。入力/出力(I/O)インタフェース805もバス804に接続されている。
電子機器800における複数のコンポーネントは、I/Oインタフェース805に接続されており、その複数のコンポーネントは、キーボードやマウスなどの入力ユニット806と、種々なディスプレイやスピーカなどの出力ユニット807と、磁気ディスクや光学ディスクなどの記憶ユニット808と、ネットワークカード、モデム、無線通信トランシーバーなどの通信ユニット809と、を備える。通信ユニット809は、電子機器800がインターネットのようなコンピュータネット及び/または種々なキャリアネットワークを介して他の機器と情報/データを交換することを可能にする。
計算ユニット801は、処理及び計算能力を有する様々な汎用及び/または専用の処理コンポーネントであってもよい。計算ユニット801のいくつかの例としては、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、様々な専用の人工知能(AI)計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタ信号プロセッサ(DSP)、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを備えるが、これらに限定されない。計算ユニット801は、上述で説明された各方法及び処理、例えばテーブルに基づく質問応答方法又は質問応答モデルのトレーニング方法を実行する。例えば、いくつかの実施形態では、テーブルに基づく質問応答方法又は質問応答モデルのトレーニング方法を、記憶ユニット808のような機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウエアプログラムとして実現されてもよい。一部の実施例では、コンピュータプログラムの一部または全ては、ROM802及び/または通信ユニット809を介して、電子機器800にロード及び/またはインストールされてもよい。コンピュータプログラムがRAM803にロードされて計算ユニット801によって実行される場合に、前述したテーブルに基づく質問応答方法又は質問応答モデルのトレーニング方法のステップを実行することができる。選択的に、他の実施例では、計算ユニット801は、他の任意の適当な方式(例えば、ファームウェアを介する)によりテーブルに基づく質問応答方法又は質問応答モデルのトレーニング方法を実行するように構成されてもよい。
ここで記載されているシステムまたは技術の各種の実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、専用集積回路(ASIC)、専用標準品(ASSP)、システムオンチップ(SOC)、コンプレックスプログラマブルロジックデバイス(CPLD)、コンピュータのハードウェア、ファームウェア、ソフトウェア、及び/またはこれらの組み合わせによって実現することができる。これらの各実施形態は、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムにて実行及び/または解釈される1つまたは複数のコンピュータプログラムにより実行することを含み得、当該プログラマブルプロセッサは、ストレージシステム、少なくとも1つの入力デバイス、及び少なくとも1つの出力デバイスからデータ及び命令を受け取り、データ及び命令を該ストレージシステム、当該少なくとも1つの入力デバイス、及び当該少なくとも1つの出力デバイスに転送することができる専用または汎用のプログラマブルプロセッサであってもよい。
本開示の方法を実施するためのプログラムコードは、1または複数のプログラミング言語の組み合わせで記述されていてもよい。これらのプログラムコードは、プロセッサ又はコントローラによって実行されると、フローチャート及び/またはブロック図で規定された機能?動作が実施されるように、汎用コンピュータや専用コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサやコントローラに提供されてもよい。プログラムコードは、機械上で完全に実行されるか、機械上で部分的に実行されるか、独立したソフトウェアパッケージとして機械上で部分的に実行されるとともにリモートマシン上で部分的に実行されるか、またはリモートマシンまたはサーバ上で完全に実行されてもよい。
本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置またはデバイスによって使用されるために、または命令実行システム、装置またはデバイスと組み合わせて使用されるためのプログラムを含むか、または記憶することができる有形媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体であってもよいし、機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体としては、電子的、磁気的、光学的、電磁的、赤外線的、半導体システム、装置、デバイス、またはこれらの任意の適切な組み合わせが挙げられるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例としては、1または複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能なプログラム可能なリードオンリメモリ(EPROMまたはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光記憶装置、磁気記憶装置、またはこれらの任意の適切な組み合わせが挙げられる。
ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータで実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウスまたはトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供するために用いられることができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを備えるコンピューティングシステム(例えば、データサーバとする)、またはミドルウェアコンポーネントを備えるコンピューティングシステム(例えば、アプリケーションサーバー)、またはフロントエンドコンポーネントを備えるコンピューティングシステム(例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェースまたは当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、またはこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを備えるコンピューティングシステムで実施することができる。任意の形式または媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを互いに接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットと、ブロックチェーンネットワークとを含む。
コンピュータシステムは、クライアントとサーバとを備えることができる。クライアントとサーバは、一般的に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータで実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。サーバはクラウドサーバであってもよく、分散システムのサーバー、またはブロックチェーンを結合したサーバーであってもよい。
なお、上述した様々な形態のフローを用いて、ステップを並び替え、追加または削除を行うことができることを理解されるべきである。例えば、本開示に記載された各ステップは、本願に開示された技術方案の所望の結果が達成できる限り、並列に実行されてもよいし、順番に実行されてもよいし、異なる順序で実行されてもよい。本明細書では制限されない。
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組合、及び代替を行うことができることは理解される。本願の精神及び原理内で行われたあらゆる修正、同等の置換及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims (21)

  1. 処理対象の質問テキスト及び質問応答のための情報テーブルを決定するステップであって、前記情報テーブルには、少なくとも1つの属性名が含まれるステップと、
    前記質問テキスト及び前記少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定するステップと、
    前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップと、
    前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定するステップと、を含む、
    ことを特徴とするテーブルに基づく質問応答方法。
  2. 前記質問テキスト及び前記少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定するステップは、
    前記質問テキスト内の各文字及び前記少なくとも1つの属性名内の各文字に基づいて、質問属性文字シーケンスを生成するステップと、
    前記質問属性文字シーケンス内の各文字に対してベクトル化処理を行って、前記文字ベクトルシーケンスを取得するステップと、
    前記質問属性文字シーケンス内の各文字の位置情報に対してベクトル化処理を行って、前記位置ベクトルシーケンスを取得するステップと、
    前記質問属性文字シーケンス内の各文字のタイプ情報に基づいてベクトル化処理を行って、前記タイプベクトルシーケンスを取得するステップであって、前記タイプ情報は、前記文字が前記質問テキスト又は前記少なくとも1つの属性名に属していることを示すステップと、を含む、
    ことを特徴とする請求項1に記載のテーブルに基づく質問応答方法。
  3. 前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップは、
    前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の各文字の確率情報を決定するステップであって、前記確率情報には、前記少なくとも1つの属性名に属する確率、および前記少なくとも1つの属性名に対応する属性値に属する確率が含まれるステップと、
    前記質問テキスト内の各文字が前記少なくとも1つの属性名に属する確率及び前記少なくとも1つの属性名に対応する属性値に属する確率に基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップと、を含む、
    ことを特徴とする請求項1に記載のテーブルに基づく質問応答方法。
  4. 前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の各文字の確率情報を決定するステップは、
    前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに対して加算処理を行って、処理されたベクトルシーケンスを取得するステップと、
    前記処理されたベクトルシーケンスに対してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得するステップであって、前記セマンティック表現ベクトルシーケンスには、前記質問テキスト内の各文字のセマンティック表現ベクトル、及び前記少なくとも1つの属性名内の各文字のセマンティック表現ベクトルが含まれるステップと、
    各属性名について、前記属性名内の各文字のセマンティック表現ベクトルに対して加算および平均化処理を行って、前記属性名のセマンティック表現ベクトルを決定するステップと、
    任意の文字属性名ペアについて、前記文字属性名ペアのうちの第1の文字のセマンティック表現ベクトル及び前記文字属性名ペアのうちの第1の属性名のセマンティック表現ベクトルをスプライシングして、第1のスプライシングベクトルを取得するステップと、
    前記第1のスプライシングベクトルに基づいて、前記第1の文字が前記第1の属性名に属する確率、及び前記第1の文字が前記第1の属性名に対応する属性値に属する確率を決定するステップと、を含む、
    ことを特徴とする請求項3に記載のテーブルに基づく質問応答方法。
  5. 前記質問テキスト内の各文字が前記少なくとも1つの属性名に属する確率及び前記少なくとも1つの属性名に対応する属性値に属する確率に基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定するステップは、
    前記質問テキスト内の各文字について、前記文字が前記少なくとも1つの属性名に属する確率及び前記少なくとも1つの属性名に対応する属性値に属する確率に基づいて、前記文字が属する属性名又は前記文字が属する属性値を決定するステップと、
    前記質問テキスト内の各文字が属する属性名又は前記文字が属する属性値に基づいて、前記属性名セグメントと前記属性値セグメントとを決定するステップと、を含む、
    ことを特徴とする請求項3に記載のテーブルに基づく質問応答方法。
  6. 前記情報テーブルには、各前記属性名に対応する少なくとも1つの属性値がさらに含まれ、
    前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定するステップは、
    前記属性名セグメントと前記属性値セグメントとに基づいて前記情報テーブルをクエリして、前記属性名セグメントおよび前記属性値セグメントに対応するコンテンツを取得するステップと、
    前記コンテンツを前記質問テキストに対応する回答として決定するステップと、を含む、
    ことを特徴とする請求項1に記載のテーブルに基づく質問応答方法。
  7. 初期の質問応答モデルを構築するステップであって、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールと、を含むステップと、
    トレーニングデータを取得するステップであって、前記トレーニングデータは、情報テーブル内の少なくとも1つの属性名と、サンプル質問テキストと、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントとを含むステップと、
    前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも1つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするステップと、を含む、
    ことを特徴とする質問応答モデルのトレーニング方法。
  8. 前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも1つの属性名を使用して、前記質問応答モデルの出力として前記サンプル質問テキストに対応する前記属性名セグメント及び前記属性値セグメントを使用して、前記質問応答モデルをトレーニングするステップは、
    前記サンプル質問テキストおよび前記少なくとも1つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントを取得するステップと、
    前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、損失関数を構築するステップと、
    前記損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現するステップと、を含む、
    ことを特徴とする請求項7に記載の質問応答モデルのトレーニング方法。
  9. 前記質問応答モデルは、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをセマンティックマッチングして、セマンティックマッチング度合いを決定するセマンティックマッチングモジュールをさらに含み、
    前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも1つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするステップは、
    前記サンプル質問テキストおよび前記少なくとも1つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントを取得するステップと、
    前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、第1の損失関数を構築するステップと、
    前記セマンティックマッチングモジュールから出力された予測マッチング度合い及び予め設定されたマッチング度合い閾値に基づいて、第2の損失関数を構築するステップと、
    前記第1の損失関数と前記第2の損失関数とに基づいて、総損失関数を構築するステップと、
    前記総損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現するステップと、を含む、
    ことを特徴とする請求項7に記載の質問応答モデルのトレーニング方法。
  10. 処理対象の質問テキスト及び質問応答のための情報テーブルを決定する第1の決定モジュールであって、前記情報テーブルには、少なくとも1つの属性名が含まれる第1の決定モジュールと、
    前記質問テキスト及び前記少なくとも1つの属性名に基づいて、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを決定する第2の決定モジュールと、
    前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定する第3の決定モジュールと、
    前記属性名セグメント、前記属性値セグメント及び前記情報テーブルに基づいて、前記質問テキストに対応する回答を決定する第4の決定モジュールと、を含む、
    ことを特徴とするテーブルに基づく質問応答装置。
  11. 前記第2の決定モジュールが、
    前記質問テキスト内の各文字及び前記少なくとも1つの属性名内の各文字に基づいて、質問属性文字シーケンスを生成し、
    前記質問属性文字シーケンス内の各文字に対してベクトル化処理を行って、前記文字ベクトルシーケンスを取得し、
    前記質問属性文字シーケンス内の各文字の位置情報に対してベクトル化処理を行って、前記位置ベクトルシーケンスを取得し、
    前記質問属性文字シーケンス内の各文字のタイプ情報に基づいてベクトル化処理を行って、前記タイプベクトルシーケンスを取得し、前記タイプ情報が、前記文字が前記質問テキスト又は前記少なくとも1つの属性名に属していることを示す、
    ことを特徴とする請求項10に記載のテーブルに基づく質問応答装置。
  12. 前記第3の決定モジュールは、
    前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに基づいて、前記質問テキスト内の各文字の確率情報を決定する第1の決定ユニットであって、前記確率情報には、前記少なくとも1つの属性名に属する確率、および前記少なくとも1つの属性名に対応する属性値に属する確率が含まれる第1の決定ユニットと、
    前記質問テキスト内の各文字が前記少なくとも1つの属性名に属する確率及び前記少なくとも1つの属性名に対応する属性値に属する確率に基づいて、前記質問テキスト内の属性名セグメントと属性値セグメントとを決定する第2の決定ユニットと、を含む、
    ことを特徴とする請求項10に記載のテーブルに基づく質問応答装置。
  13. 前記第1の決定ユニットが、
    前記文字ベクトルシーケンス、前記位置ベクトルシーケンス及び前記タイプベクトルシーケンスに対して加算処理を行って、処理されたベクトルシーケンスを取得し、
    前記処理されたベクトルシーケンスに対してセマンティック表現を抽出して、セマンティック表現ベクトルシーケンスを取得し、前記セマンティック表現ベクトルシーケンスには、前記質問テキスト内の各文字のセマンティック表現ベクトル、及び前記少なくとも1つの属性名内の各文字のセマンティック表現ベクトルが含まれ、
    各属性名について、前記属性名内の各文字のセマンティック表現ベクトルに対して加算および平均化処理を行って、前記属性名のセマンティック表現ベクトルを決定し、
    任意の文字属性名ペアについて、前記文字属性名ペアのうちの第1の文字のセマンティック表現ベクトル及び前記文字属性名ペアのうちの第1の属性名のセマンティック表現ベクトルをスプライシングして、第1のスプライシングベクトルを取得し、
    前記第1のスプライシングベクトルに基づいて、前記第1の文字が前記第1の属性名に属する確率、及び前記第1の文字が前記第1の属性名に対応する属性値に属する確率を決定する、
    ことを特徴とする請求項12に記載のテーブルに基づく質問応答装置。
  14. 前記第2の決定ユニットが、
    前記質問テキスト内の各文字について、前記文字が前記少なくとも1つの属性名に属する確率及び前記少なくとも1つの属性名に対応する属性値に属する確率に基づいて、前記文字が属する属性名又は前記文字が属する属性値を決定し、
    前記質問テキスト内の各文字が属する属性名又は前記文字が属する属性値に基づいて、前記属性名セグメントと前記属性値セグメントとを決定する、
    ことを特徴とする請求項12に記載のテーブルに基づく質問応答装置。
  15. 前記情報テーブルは、各前記属性名に対応する少なくとも1つの属性値をさらに含み、
    前記第4の決定モジュールが、
    前記属性名セグメントと前記属性値セグメントとに基づいて前記情報テーブルをクエリして、前記属性名セグメントおよび前記属性値セグメントに対応するコンテンツを取得し、
    前記コンテンツを前記質問テキストに対応する回答として決定する、
    ことを特徴とする請求項10に記載のテーブルに基づく質問応答装置。
  16. 初期の質問応答モデルを構築する構築モジュールであって、前記質問応答モデルは、質問テキスト及び情報テーブル内の属性名に対してベクトル抽出を行って、文字ベクトルシーケンス、位置ベクトルシーケンス及びタイプベクトルシーケンスを取得するベクトル抽出モジュールと、セマンティック表現ベクトルシーケンスを抽出するセマンティック抽出モジュールと、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをスプライシングして前記質問テキスト内の属性名セグメントと属性値セグメントを予測するモジュールと、を含む構築モジュールと、
    トレーニングデータを取得する取得モジュールであって、前記トレーニングデータは、情報テーブル内の少なくとも1つの属性名と、サンプル質問テキストと、前記サンプル質問テキストに対応するサンプル属性名セグメント及びサンプル属性値セグメントとを含む取得モジュールと、
    前記質問応答モデルの入力として前記サンプル質問テキスト及び前記少なくとも1つの属性名を使用して、前記質問応答モデルの出力として前記サンプル属性名セグメント及び前記サンプル属性値セグメントを使用して、前記質問応答モデルをトレーニングするトレーニングモジュールと、を含む、
    ことを特徴とする質問応答モデルのトレーニング装置。
  17. 前記トレーニングモジュールが、
    前記サンプル質問テキストおよび前記少なくとも1つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、
    前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、損失関数を構築し、
    前記損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現する、
    ことを特徴とする請求項16に記載の質問応答モデルのトレーニング装置。
  18. 前記質問応答モデルは、セマンティック表現ベクトルシーケンス内の質問テキスト文字のセマンティック表現ベクトル及び属性名のセマンティック表現ベクトルをセマンティックマッチングして、セマンティックマッチング度合いを決定するセマンティックマッチングモジュールをさらに含み、
    前記トレーニングモジュールが、
    前記サンプル質問テキストおよび前記少なくとも1つの属性名を前記質問応答モデルを入力して、前記質問応答モデルから出力された予測属性名セグメントと予測属性値セグメントとを取得し、
    前記予測属性名セグメント、予測属性値セグメント、前記サンプル属性名セグメントおよび前記サンプル属性値セグメントに基づいて、第1の損失関数を構築し、
    前記セマンティックマッチングモジュールから出力された予測マッチング度合い及び予め設定されたマッチング度合い閾値に基づいて、第2の損失関数を構築し、
    前記第1の損失関数と前記第2の損失関数とに基づいて、総損失関数を構築し、
    前記総損失関数の値に基づいて、前記質問応答モデルに対して係数を調整して、トレーニングを実現する、
    ことを特徴とする請求項16に記載の質問応答モデルのトレーニング装置。
  19. 電子機器であって、
    少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサと通信可能に接続されるメモリと、を含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサが請求項1~6のいずれかに記載のテーブルに基づく質問応答方法、または請求項7~9のいずれかに記載の質問応答モデルのトレーニング方法を実行できるように、前記少なくとも1つのプロセッサによって実行される、
    ことを特徴とする電子機器。
  20. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、コンピュータに請求項1~6のいずれかに記載のテーブルに基づく質問応答方法、または請求項7~9のいずれかに記載の質問応答モデルのトレーニング方法を実行させる、
    ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
  21. コンピュータプログラムであって、
    前記コンピュータプログラムがプロセッサによって実行される場合、請求項1~6のいずれかに記載のテーブルに基づく質問応答方法、または請求項7~9のいずれかに記載の質問応答モデルのトレーニング方法が実現される、
    ことを特徴とするコンピュータプログラム。
JP2022178303A 2021-12-29 2022-11-07 テーブルに基づく質問応答方法、装置及び電子機器 Pending JP2023012541A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111647546.2A CN114490969B (zh) 2021-12-29 2021-12-29 基于表格的问答方法、装置以及电子设备
CN202111647546.2 2021-12-29

Publications (1)

Publication Number Publication Date
JP2023012541A true JP2023012541A (ja) 2023-01-25

Family

ID=81509049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022178303A Pending JP2023012541A (ja) 2021-12-29 2022-11-07 テーブルに基づく質問応答方法、装置及び電子機器

Country Status (4)

Country Link
US (1) US20230141932A1 (ja)
EP (1) EP4187404A1 (ja)
JP (1) JP2023012541A (ja)
CN (1) CN114490969B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117455518B (zh) * 2023-12-25 2024-04-19 连连银通电子支付有限公司 一种欺诈交易检测方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019709B (zh) * 2017-11-22 2024-05-17 上海智臻智能网络科技股份有限公司 机器人自动问答的方法及机器人自动问答的系统
WO2019229769A1 (en) * 2018-05-28 2019-12-05 Thottapilly Sanjeev An auto-disambiguation bot engine for dynamic corpus selection per query
CN108932349B (zh) * 2018-08-17 2019-03-26 齐鲁工业大学 医疗自动问答方法及装置、存储介质、电子设备
CN111209384B (zh) * 2020-01-08 2023-08-15 腾讯科技(深圳)有限公司 基于人工智能的问答数据处理方法、装置及电子设备
CN111625635B (zh) * 2020-05-27 2023-09-29 北京百度网讯科技有限公司 问答处理方法、装置、设备及存储介质
CN112417119A (zh) * 2020-11-19 2021-02-26 上海交通大学 一种基于深度学习的开放域问答预测方法
CN113220881B (zh) * 2021-02-24 2024-02-06 盐城幼儿师范高等专科学校 基于深度学习的教育问答实现方法、装置及服务器
CN113553414B (zh) * 2021-06-30 2023-08-25 北京百度网讯科技有限公司 智能对话方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN114490969A (zh) 2022-05-13
US20230141932A1 (en) 2023-05-11
EP4187404A1 (en) 2023-05-31
CN114490969B (zh) 2023-03-07

Similar Documents

Publication Publication Date Title
KR20220005416A (ko) 다항 관계 생성 모델의 트레이닝 방법, 장치, 전자 기기 및 매체
EP4113357A1 (en) Method and apparatus for recognizing entity, electronic device and storage medium
CN114861889B (zh) 深度学习模型的训练方法、目标对象检测方法和装置
EP4123474A1 (en) Method for acquiring structured question-answering model, question-answering method and corresponding apparatus
US20230005283A1 (en) Information extraction method and apparatus, electronic device and readable storage medium
EP3992814A2 (en) Method and apparatus for generating user interest profile, electronic device and storage medium
EP3920074A2 (en) Method for industry text increment, related apparatus, and computer program product
JP2023012541A (ja) テーブルに基づく質問応答方法、装置及び電子機器
CN113468857A (zh) 风格转换模型的训练方法、装置、电子设备以及存储介质
CN113869046B (zh) 一种自然语言文本的处理方法、装置、设备及存储介质
CN113204613B (zh) 地址生成方法、装置、设备和存储介质
US20210342379A1 (en) Method and device for processing sentence, and storage medium
CN114841172A (zh) 文本匹配双塔模型的知识蒸馏方法、装置及程序产品
CN112560466B (zh) 链接实体关联方法、装置、电子设备和存储介质
CN114817476A (zh) 语言模型的训练方法、装置、电子设备和存储介质
CN113869042A (zh) 文本标题生成方法、装置、电子设备以及存储介质
CN112541346A (zh) 摘要生成方法、装置、电子设备及可读存储介质
EP4131022A1 (en) Method and apparatus of determining location information, electronic device, storage medium, and program product
CN116244432B (zh) 语言模型的预训练方法、装置及电子设备
CN116069914B (zh) 训练数据的生成方法、模型训练方法以及装置
CN114781408B (zh) 同传翻译模型的训练方法、装置及电子设备
US20220351085A1 (en) Method and apparatus for presenting candidate character string, and method and apparatus for training discriminative model
CN112989797B (zh) 模型训练、文本扩展方法,装置,设备以及存储介质
CN114461771A (zh) 问答方法、装置、电子设备和可读存储介质
CN114821566A (zh) 文本识别方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240521