JP7295200B2 - 汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム - Google Patents
汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム Download PDFInfo
- Publication number
- JP7295200B2 JP7295200B2 JP2021184476A JP2021184476A JP7295200B2 JP 7295200 B2 JP7295200 B2 JP 7295200B2 JP 2021184476 A JP2021184476 A JP 2021184476A JP 2021184476 A JP2021184476 A JP 2021184476A JP 7295200 B2 JP7295200 B2 JP 7295200B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- model
- requested
- matching
- vector representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Automation & Control Theory (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
質問応答システムの質問応答ベースには多くの質問応答ペアが含まれており、各質問応答ペアは質問と回答から構成されている。ユーザが要求された質問を入力すると、本開示の実施形態により提供される上述の方法および装置により要求された質問を汎化して1つ以上の汎化質問を得る。そして、要求された質問と汎化質問を用いてそれぞれ質問応答ベースでマッチングを行い、マッチングされた質問に対応する回答を見つけてユーザに返信する。
一般的な検索エンジンサービスでは、ユーザが検索キーワードを入力した後、本開示の実施形態により提供される上記方法および装置により上記検索キーワードを汎化して1つ以上の汎化検索キーワードを得る。そして、ユーザが入力した検索キーワードおよび汎化検索キーワードを用いて検索を行って検索結果を返す。
Claims (19)
- コンピュータにより実行される、汎化処理の方法であって、
リテラルマッチング方式、セマンティックマッチング方式、およびquery書き換え方式それぞれにより特定されたquery集合の和集合を、queryライブラリにおける要求されたqueryに類似する候補query集合として特定することと、
予め訓練されたqueryマッチングモデルを使用して前記候補query集合から前記要求されたqueryに対応する汎化queryを特定することと、を含み、
前記queryマッチングモデルは、クロスアテンションモデルに基づいて予め訓練されたものである、
汎化処理の方法。 - 前記リテラルマッチング方式、セマンティックマッチング方式、およびquery書き換え方式それぞれにより特定されたquery集合の和集合を、queryライブラリにおける要求されたqueryに類似する候補query集合として特定することは、
リテラルマッチング方式により、前記queryライブラリにおける要求されたqueryとリテラルが類似する第1のquery集合を特定し、
セマンティックマッチング方式により、前記queryライブラリにおける要求されたqueryとセマンティックが類似する第2のquery集合を特定し、
query書き換え方式により、前記queryライブラリにおける要求されたqueryの書き換えqueryを特定して第3のquery集合を構成し、
前記第1のquery集合、第2のquery集合、および第3のquery集合の和集合を前記候補query集合として特定する、
ことを含む請求項1に記載の汎化処理の方法。 - 前記セマンティックマッチング方式は、
予め訓練されたデュアルタワーモデルにおけるベクトル表現レイヤを用いて、前記要求されたqueryの特徴ベクトル表現を特定し、
ベクトル検索により、前記queryライブラリにおける、特徴ベクトル表現が前記要求されたqueryの特徴ベクトル表現との類似度が予め設定された類似度要件を満たすqueryを検索する、
ことを含む請求項1または2に記載の汎化処理の方法。 - 前記デュアルタワーモデルは、
同一のqueryに対応する相関queryおよび非相関queryを含む第1の訓練データを取得し、
前記第1の訓練データをデュアルタワーモデルの入力として前記デュアルタワーモデルを訓練することにより、予め訓練されており、
訓練の目標は、第1の類似度と第2の類似度の差を最大化することを含み、前記第1の類似度は、前記デュアルタワーモデルのベクトル表現レイヤにより出力された前記同一のqueryの特徴ベクトル表現と相関queryの特徴ベクトル表現との類似度であり、前記第2の類似度は、前記デュアルタワーモデルのベクトル表現レイヤにより出力された前記同一のqueryの特徴ベクトル表現と非相関queryの特徴ベクトル表現との類似度である、
請求項3に記載の汎化処理の方法。 - 前記query書き換え方式は、
前記要求されたqueryを予め訓練されたquery書き換えモデルに入力し、前記query書き換えモデルが出力する書き換えqueryを取得することを含み、
前記query書き換えモデルは、Seq2Seqモデルに基づいて予め訓練されている、
請求項1または2に記載の汎化処理の方法。 - 前記query書き換えモデルは、
サンプルqueryおよびそれに対応する書き換えqueryを含む第2の訓練データを取得し、
前記サンプルqueryを予め訓練されたSeq2Seqモデルの入力として、前記書き換えqueryを前記Seq2Seqモデルの目標出力として、さらに前記Seq2Seqモデルを訓練する、
ことにより予め訓練される、
請求項5に記載の汎化処理の方法。 - 前記予め訓練されたqueryマッチングモデルを使用して、前記候補query集合から前記要求されたqueryに対応する汎化queryを特定することは、
前記候補query集合からqueryを1つずつ取り出して要求されたqueryとqueryペアを構成し、
queryペアをスプライシングして前記queryマッチングモデルに入力し、前記queryマッチングモデルにより前記queryペアが相関queryであるか否かの分類結果を出力し、
前記分類結果に基づいて、要求されたqueryの相関queryを用いて前記要求されたqueryに対応する汎化queryを得る、
ことを含む請求項1または2に記載の汎化処理の方法。 - 前記queryマッチングモデルは、
サンプルqueryペアを含み、サンプルqueryペアが相関queryであるか非相関queryであるかを標識する第3の訓練データを取得し、
前記サンプルqueryペアをスプライシングしてクロスアテンションモデルに入力し、前記サンプルqueryペアに対する標識を前記クロスアテンションモデルによる前記サンプルqueryペアの目標分類結果とする、
ことにより予め訓練される、
請求項7に記載の汎化処理の方法。 - 汎化処理の装置であって、
リテラルマッチング方式、セマンティックマッチング方式、およびquery書き換え方式それぞれにより特定されたquery集合の和集合を、queryライブラリにおける要求されたqueryに類似する候補query集合として特定する候補特定モジュールと、
予め訓練されたqueryマッチングモデルを用いて、前記候補query集合から前記要求されたqueryに対応する汎化queryを特定する汎化特定モジュールと、を備え、
前記queryマッチングモデルは、クロスアテンションモデルに基づいて予め訓練されたものである、
汎化処理の装置。 - 前記候補特定モジュールは、
リテラルマッチング方式により、前記queryライブラリにおける要求されたqueryとリテラルが類似する第1のquery集合を特定するリテラルマッチングサブモジュールと、
セマンティックマッチング方式により、前記queryライブラリにおける要求されたqueryとセマンティックが類似する第2のquery集合を特定するセマンティックマッチングサブモジュールと、
query書き換え方式により、前記queryライブラリにおける要求されたqueryの書き換えqueryを特定して第3のquery集合を構成するquery書き換えサブモジュールと、
前記第1のquery集合、第2のquery集合および第3のquery集合の和集合を前記候補query集合として特定する候補和集合サブモジュールと、
を備える請求項9に記載の汎化処理の装置。 - 前記セマンティックマッチングサブモジュールは、具体的に、予め訓練されたデュアルタワーモデルにおけるベクトル表現レイヤを利用して、前記要求されたqueryの特徴ベクトル表現を特定し、ベクトル検索により、前記queryライブラリにおける、特徴ベクトル表現が前記要求されたqueryの特徴ベクトル表現との類似度が予め設定された類似度要件を満たすqueryを検索する、
請求項10に記載の汎化処理の装置。 - 同一のqueryに対応する相関queryおよび非相関queryを含む第1の訓練データを取得し、
前記第1の訓練データをデュアルタワーモデルの入力として前記デュアルタワーモデルを訓練することにより、前記デュアルタワーモデルを事前に訓練する第1の訓練モジュールを更に備え、
訓練の目標は、第1の類似度と第2の類似度の差を最大化することを含み、前記第1の類似度は、前記デュアルタワーモデルのベクトル表現レイヤにより出力された前記同一のqueryの特徴ベクトル表現と相関queryの特徴ベクトル表現との類似度であり、前記第2の類似度は、前記デュアルタワーモデルのベクトル表現レイヤにより出力された前記同一のqueryの特徴ベクトル表現と非相関queryの特徴ベクトル表現との類似度である、
請求項11に記載の汎化処理の装置。 - 前記query書き換えサブモジュールは、具体的に、前記要求されたqueryを予め訓練されたquery書き換えモデルに入力し、前記query書き換えモデルにより出力された書き換えqueryを取得し、
前記query書き換えモデルは、Seq2Seqモデルに基づいて予め訓練されている、
請求項10に記載の汎化処理の装置。 - サンプルqueryおよびそれに対応する書き換えqueryを含む第2の訓練データを取得し、
前記サンプルqueryを予め訓練されたSeq2Seqモデルの入力とし、前記書き換えqueryを前記Seq2Seqモデルの目標出力として、さらに前記Seq2Seqモデルを訓練することにより、前記query書き換えモデルを事前に訓練する第2の訓練モジュールを更に備える、
請求項13に記載の汎化処理の装置。 - 前記汎化特定モジュールは、具体的に、
前記候補query集合からqueryを1つずつ取り出して要求されたqueryとqueryペアを構成し、
queryペアをスプライシングして前記queryマッチングモデルに入力し、前記queryマッチングモデルにより前記queryペアが相関queryであるか否かの分類結果を出力し、
前記分類結果に基づいて、要求されたqueryの相関queryを用いて、前記要求されたqueryに対応する汎化queryを得る、
請求項9に記載の汎化処理の装置。 - サンプルqueryペアを含み、サンプルqueryペアが相関queryであるか非相関queryであるかを標識する第3の訓練データを取得し、
前記サンプルqueryペアをスプライシングしてクロスアテンションモデルに入力し、前記サンプルqueryペアに対する標識を前記クロスアテンションモデルによる前記サンプルqueryペアの目標分類結果とすることにより、前記queryマッチングモデルを事前に訓練する第3の訓練モジュールを更に備える、
請求項15に記載の汎化処理の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリと、を備え、
前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1~8のいずれか1項に記載の方法を実行させる電子デバイス。 - コンピュータに請求項1~8のいずれか1項に記載の方法を実行させるためのコンピュータコマンドを記憶した非一時的なコンピュータ可読記憶媒体。
- コンピュータに請求項1~8のいずれか1項に記載の方法を実行させるためのコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011445266.9A CN112541362B (zh) | 2020-12-08 | 2020-12-08 | 一种泛化处理的方法、装置、设备和计算机存储介质 |
CN202011445266.9 | 2020-12-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022091122A JP2022091122A (ja) | 2022-06-20 |
JP7295200B2 true JP7295200B2 (ja) | 2023-06-20 |
Family
ID=75018340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021184476A Active JP7295200B2 (ja) | 2020-12-08 | 2021-11-12 | 汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11704326B2 (ja) |
JP (1) | JP7295200B2 (ja) |
CN (1) | CN112541362B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113051368B (zh) * | 2021-03-24 | 2023-09-22 | 北京百度网讯科技有限公司 | 双塔模型训练方法、检索方法、装置及电子设备 |
CN113221034A (zh) * | 2021-05-06 | 2021-08-06 | 北京百度网讯科技有限公司 | 数据泛化方法、装置、电子设备和存储介质 |
CN113254714B (zh) * | 2021-06-21 | 2021-11-05 | 平安科技(深圳)有限公司 | 基于query分析的视频反馈方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815484A (zh) | 2018-12-21 | 2019-05-28 | 平安科技(深圳)有限公司 | 基于交叉注意力机制的语义相似度匹配方法及其匹配装置 |
CN111198940A (zh) | 2019-12-27 | 2020-05-26 | 北京百度网讯科技有限公司 | Faq方法、问答检索系统、电子设备和存储介质 |
CN111797216A (zh) | 2020-06-28 | 2020-10-20 | 北京百度网讯科技有限公司 | 检索项改写方法、装置、设备以及存储介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10143521A (ja) | 1996-11-11 | 1998-05-29 | Oki Electric Ind Co Ltd | 情報検索方法及び情報検索装置 |
US7840547B1 (en) * | 2004-03-31 | 2010-11-23 | Google Inc. | Methods and systems for efficient query rewriting |
MX2015010582A (es) * | 2013-02-15 | 2017-01-11 | Voxy Inc | Sistemas y metodos de aprendizaje de idiomas. |
CN104573028B (zh) * | 2015-01-14 | 2019-01-25 | 百度在线网络技术(北京)有限公司 | 实现智能问答的方法和系统 |
US10242112B2 (en) * | 2015-07-15 | 2019-03-26 | Google Llc | Search result filters from resource content |
US11243955B2 (en) * | 2017-11-29 | 2022-02-08 | International Business Machines Corporation | Latent token representations for passage and answer scoring in question answering systems |
CN108052577B (zh) * | 2017-12-08 | 2022-06-14 | 北京百度网讯科技有限公司 | 一种通用文本内容挖掘方法、装置、服务器及存储介质 |
US11157564B2 (en) * | 2018-03-02 | 2021-10-26 | Thoughtspot, Inc. | Natural language question answering systems |
US11036774B2 (en) * | 2018-10-04 | 2021-06-15 | Robert Bosch Gmbh | Knowledge-based question answering system for the DIY domain |
US11755749B2 (en) * | 2018-11-08 | 2023-09-12 | Royal Bank Of Canada | System and method for reverse-Turing bot detection |
US11281733B2 (en) * | 2019-03-14 | 2022-03-22 | Microsoft Technology Licensing, Llc | Selective presentation of rich experiences in search |
US11531818B2 (en) * | 2019-11-15 | 2022-12-20 | 42 Maru Inc. | Device and method for machine reading comprehension question and answer |
US20210286851A1 (en) * | 2020-03-11 | 2021-09-16 | Microsoft Technology Licensing, Llc | Guided query recommendations |
CN111897928A (zh) * | 2020-08-04 | 2020-11-06 | 广西财经学院 | 查询词嵌入扩展词和统计扩展词并集的中文查询扩展方法 |
-
2020
- 2020-12-08 CN CN202011445266.9A patent/CN112541362B/zh active Active
-
2021
- 2021-08-20 US US17/407,272 patent/US11704326B2/en active Active
- 2021-11-12 JP JP2021184476A patent/JP7295200B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815484A (zh) | 2018-12-21 | 2019-05-28 | 平安科技(深圳)有限公司 | 基于交叉注意力机制的语义相似度匹配方法及其匹配装置 |
CN111198940A (zh) | 2019-12-27 | 2020-05-26 | 北京百度网讯科技有限公司 | Faq方法、问答检索系统、电子设备和存储介质 |
CN111797216A (zh) | 2020-06-28 | 2020-10-20 | 北京百度网讯科技有限公司 | 检索项改写方法、装置、设备以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112541362A (zh) | 2021-03-23 |
US11704326B2 (en) | 2023-07-18 |
CN112541362B (zh) | 2022-08-23 |
JP2022091122A (ja) | 2022-06-20 |
US20220179858A1 (en) | 2022-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7247441B2 (ja) | セマンティック表現モデルの処理方法、装置、電子機器、及び記憶媒体 | |
CN112507715B (zh) | 确定实体之间关联关系的方法、装置、设备和存储介质 | |
JP7295200B2 (ja) | 汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム | |
JP7264866B2 (ja) | イベント関係の生成方法、装置、電子機器及び記憶媒体 | |
US9336298B2 (en) | Dialog-enhanced contextual search query analysis | |
KR102431568B1 (ko) | 엔티티 단어 인식 방법 및 장치 | |
US20220129448A1 (en) | Intelligent dialogue method and apparatus, and storage medium | |
US20210248471A1 (en) | Method and apparatus for creating dialogue, and storage medium | |
JP7106802B2 (ja) | リソースソート方法、ソートモデルをトレーニングする方法及び対応する装置 | |
CN112560479A (zh) | 摘要抽取模型训练方法、摘要抽取方法、装置和电子设备 | |
CN110674260B (zh) | 语义相似模型的训练方法、装置、电子设备和存储介质 | |
US20220358292A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
US11321370B2 (en) | Method for generating question answering robot and computer device | |
JP2022003537A (ja) | 対話意図の認識方法及び装置、電子機器並びに記憶媒体 | |
US11645526B2 (en) | Learning neuro-symbolic multi-hop reasoning rules over text | |
US11947578B2 (en) | Method for retrieving multi-turn dialogue, storage medium, and electronic device | |
CN112925883B (zh) | 搜索请求处理方法、装置、电子设备及可读存储介质 | |
CN112506949B (zh) | 结构化查询语言查询语句生成方法、装置及存储介质 | |
US20230008897A1 (en) | Information search method and device, electronic device, and storage medium | |
US20210191961A1 (en) | Method, apparatus, device, and computer readable storage medium for determining target content | |
US20220129770A1 (en) | Implementing relation linking for knowledge bases | |
US20230094730A1 (en) | Model training method and method for human-machine interaction | |
CN111984775A (zh) | 问答质量确定方法、装置、设备和存储介质 | |
JP7160986B2 (ja) | 検索モデルの訓練方法、装置、デバイス、コンピュータ記憶媒体、及びコンピュータプログラム | |
Tao et al. | Multi‐head attention graph convolutional network model: End‐to‐end entity and relation joint extraction based on multi‐head attention graph convolutional network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230608 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7295200 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |