JP2022544428A - 検索項目書き換え方法、装置、機器および記憶媒体 - Google Patents
検索項目書き換え方法、装置、機器および記憶媒体 Download PDFInfo
- Publication number
- JP2022544428A JP2022544428A JP2021545777A JP2021545777A JP2022544428A JP 2022544428 A JP2022544428 A JP 2022544428A JP 2021545777 A JP2021545777 A JP 2021545777A JP 2021545777 A JP2021545777 A JP 2021545777A JP 2022544428 A JP2022544428 A JP 2022544428A
- Authority
- JP
- Japan
- Prior art keywords
- search
- search term
- item
- term
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000004044 response Effects 0.000 claims abstract description 22
- 239000013598 vector Substances 0.000 claims description 19
- 230000009466 transformation Effects 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000012790 confirmation Methods 0.000 claims 3
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 6
- 230000003993 interaction Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24542—Plan optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Operations Research (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
検索項目書き換え要求に応答して、オリジナル検索項目のコンテキスト情報および前記オリジナル検索項目の意図情報のうちの少なくとも1つを抽出することと、
前記コンテキスト情報および前記意図情報のうちの少なくとも1つと、マシンワード集合とに基づいて、新規検索項目を確定することと、を含み、
マシンの前記新規検索項目に対する理解度は、前記オリジナル検索項目に対する理解度よりも高い、
検索項目書き換え方法を提供する。
検索項目書き換え要求に応答して、オリジナル検索項目のコンテキスト情報および前記オリジナル検索項目の意図情報のうちの少なくとも1つを抽出するように構成される情報抽出モジュールと、
前記コンテキスト情報および前記意図情報のうちの少なくとも1つと、マシンワード集合とに基づいて、新規検索項目を確定するように構成される検索項目確定モジュールと、を備え、
マシンの前記新規検索項目に対する理解度は、前記オリジナル検索項目に対する理解度よりも高い、
検索項目書き換え装置をさらに提供する。
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続される記憶装置と、を備え、
前記記憶装置に前記少なくとも1つのプロセッサにより実行可能な命令が記憶され、
前記命令は、前記少なくとも1つのプロセッサが本発明の実施例のいずれか1項に記載の検索項目書き換え方法を実行可能であるように、前記少なくとも1つのプロセッサに実行される、
電子機器をさらに提供する。
本発明の実施例のいずれか1項に記載の検索項目書き換え方法をコンピュータに実行させるためのコンピュータ命令が記憶されている、
非瞬時性コンピュータ可読記憶媒体をさらに提供する。
オリジナル検索項目における語句間の第1語句関係情報を抽出し、当該情報をオリジナル検索項目のコンテキスト情報とすることを含む。
オリジナル検索項目のコンテキスト情報及びオリジナル検索項目の意図情報のうちの少なくとも1つに基づいて、マシンワード集合からターゲットワードを確定することと、
シンタクスに従って、前記ターゲットワードを組み合わせ、新規検索項目をえることと、を含む。
少なくとも2つの検索項目候補のうちの各々の検索項目候補の意図とオリジナル検索項目の意図とマッチングすること、又は、
少なくとも2つの検索項目候補のうちの一部の検索項目候補の意図とオリジナル検索項目の意図とをマッチングすること、を含む。
ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスから発生時間が連続する少なくとも1つの第1検索項目を確定することと、
上記少なくとも1つの第1検索項目の発生時間と連続しており、且つ第1検索項目の後に発生する少なくとも1つの第2検索項目を検知することと、
少なくとも1つの第1検索項目及び少なくとも1つの第2検索項目に基づいて、サンプル検索項目セットを確定することと、を含む。
検索項目シーケンスのうち検索項目に関連するマシンがユーザにフィードバックする回答内容を確定することと、
もし回答内容が理解できないであれば、当該検索項目を第1検索項目とすることと、
そうでなければ、回答内容に基づき回答の信頼性を確定することと、
確定された信頼性が所定の信頼性閾値より小さければ、当該検索項目を第1検索項目とすることと、
検索項目シーケンスから発生時間が連続する少なくとも1つの第1検索項目を抽出することと、を含む。
もしサンプル検索項目セットに少なくとも2つの第1検索項目が含まれている場合、サンプル検索項目セットにおける各第1検索項目とサンプル検索項目セットにおける第2検索項目との類似度を算出することと、
算出された類似度に基づいて、サンプル検索項目セットにおける第1検索項目をフィルタリングすることと、をさらに含む。
オリジナル検索項目とその他の検索項目との入力時間の間隔に基づいて、その他の検索項目からオリジナル検索項目の関連検索項目を確定することを含んでもよい。
シーケンス対シーケンス(sequence to sequence)モデルフレームのうちの符号化部のネットワーク層に基づき、抽出された第1語句関係情報および第2語句関係情報に基づいて、オリジナル検索項目のコンテキスト情報を確定することを含む。
ヒントテキスト又は2度目問い合わせの形態によって、前記新規検索項目をユーザにフィードバックすることと、
ユーザの肯定応答を取得した後に、前記新規検索項目に基づいて検索を行い、検索結果をユーザにフィードバックすることと、をさらに含む。
もしマシンがユーザから入力されたオリジナル検索項目を理解できないと、当該オリジナル検索項目を事前トレーニングされた検索項目書き換えモデルに入力してマシンより理解され得る新規検索項目を出力することを含む。
検索項目に基づき、マシンがユーザにフィードバックする情報に基づいて、ユーザが入力した検索項目シーケンスから、サンプルデータセットを確定することを含む。
ベクトル変換層に基づき、第1検索項目とするオリジナル検索項目および少なくとも1つの関連検索項目に対してベクトル変換を行い、各検索項目に対応するベクトル表示を得ることと、
得られたベクトル表示を初期変換ネットワークおよび初期推定ネットワークにそれぞれ入力することと、に説明してもよい。
Bi-LSTMネットワークに基づき、各検索項目に対応するベクトル表示に基づいて、各検索項目における語句間の語句関係情報を抽出することと、
符号化部のLSTMネットワークに基づき、各検索項目の語句間の語句関係情報に基づいて、各検索項目のコンテキストベクトルをc1ないしcnにそれぞれ確定することと、
集中力メカニズムにより第2検索項目における語句のワードベクトルxと各検索項目のコンテキストベクトルとの相関性を算出してαとし、そして相関性の重みに従って各検索項目のコンテキストベクトルを合算することで全般的コンテキストベクトルを得、cattentionとすることと、
上記ワードベクトルxとcattentionを綴り合わせ復号化部のLSTMネットワークに入力し、発生する候補語句を得、x′とすることと、
発生されたx′で第2検索項目における語句をフィッティングし、最尤推定を行い、上記検索項目変換ネットワークを得ることと、に説明してもよい。
各第1検索項目のワードベクトルに対してプーリング操作を行い、各第1検索項目のプーリングベクトルを得ることと、
入力時間順に各プーリングベクトルに対して綴り合わせを行い、マトリックスQを得ることと、
発生された検索項目候補q′に対しても上記操作を行い、それをマトリックスQの最後の一行に綴り合わせ、最終の入力マトリックスを得ることと、
最終の入力マトリックスをTextCNNモデルに入力し、検索項目候補の意図情報を出力することと、
第1検索項目の意図情報および検索項目候補の意図情報をフィッティングし、上記意図一致性推定ネットワークを得ることと、に説明してもよい。
ここで、qsatisfyは第2検索項目に対応し、qunsatisfyは第1検索項目に対応し、Qsatisfyは第2検索項目集に対応し、
は第2検索項目の意図情報に対応し、
は第1検索項目の意図情報に対応し、yは一致性識別子であり、例えば、yが1であると、
と
とが一致していることを表し、yが0であると、
と
とが不一致であることを表す。
は、qunsatisfyが入力されると、qsatisfyを前提とする最尤関数が出力されることを指す。
は、qunsatisfyが入力されると、qsatisfyの条件確率が出力されることに対応する。
は、
と
との一致性確率に対応する。w1およびw2は重みである。
検索項目書き換え要求に応答して、オリジナル検索項目のコンテキスト情報及び前記オリジナル検索項目の意図情報のうちの少なくとも1つを抽出することに用いられる情報抽出モジュール1001と、
前記コンテキスト情報及び前記意図情報のうちの少なくとも1つと、マシンワード集合とに基づいて、新規検索項目を確定することに用いられる検索項目確定モジュール1002と、を備え、
ここで、マシンの前記新規検索項目に対する理解度は、前記オリジナル検索項目に対する理解度よりも高い。
前記コンテキスト情報および前記マシンワード集合に基づいて、少なくとも2つの検索項目候補を確定することに用いられる検索項目候補確定ユニットと、
前記検索項目候補の意図と前記オリジナル検索項目の意図とをマッチングすることに用いられる意図マッチングユニットと、
マッチング結果に基づいて、前記少なくとも2つの検索項目候補から前記新規検索項目を確定することに用いられる新規検索項目確定ユニットと、を備える。
前記コンテキスト情報を事前トレーニングされたシーケンス符号化ネットワークに入力し、前記少なくとも2つの検索項目候補を出力することに用いられる検索項目確定サブユニットを備え、
ここで、前記シーケンス符号化ネットワークは、事前トレーニングによって前記マシンワード集合を学習した。
前記オリジナル検索項目の語義ベクトルを事前トレーニングされたシーケンス変換ネットワークに入力する前に、ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスからサンプル検索項目セットを確定することに用いられるサンプル確定モジュールと、
ここで、前記サンプル検索項目セットに少なくとも1つの第1検索項目および少なくとも1つの第2検索項目が含まれており、前記第1検索項目に対するマシンの理解度が第1理解度閾値より大きく、前記第2検索項目に対するマシンの理解度が第2理解度閾値より小さく、且前記第1検索項目と前記第2検索項目との語義類似度は所定類似度閾値より大きいであり、
前記サンプル検索項目セットを利用して初期ネットワークをトレーニングし、前記シーケンス変換ネットワークを得ることに用いられるモデルトレーニングモジュールと、をさらに備える。
ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスから発生時間が連続する少なくとも1つの第1検索項目を確定することに用いられる第1検索項目確定ユニットと、
前記第1検索項目の発生時間と連続しており、且つ、前記第1検索項目以降に発生する少なくとも1つの第2検索項目を検知することに用いられる第2検索項目確定ユニットと、
前記少なくとも1つの第1検索項目および前記少なくとも1つの第2検索項目に基づいて、前記サンプル検索項目セットを確定することに用いられるサンプル確定ユニットと、を備える。
前記ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスからサンプル検索項目セットを確定した場合、もし前記サンプル検索項目セットに少なくとも2つの第1検索項目が含まれている場合、前記サンプル検索項目セットにおける各第1検索項目と前記サンプル検索項目セットにおける第2検索項目との類似度を算出することに用いられる類似算出モジュールと、
算出された類似度に基づいて、前記サンプル検索項目セットにおける少なくとも2つの第1検索項目をフィルタリングすることに用いられる検索項目フィルタリングモジュールと、をさらに備える。
前記オリジナル検索項目における語句間の第1語句関係情報、および前記関連検索項目における語句間の第2語句関係情報を抽出することに用いられる情報抽出ユニットと、
前記第1語句関係情報および前記第2語句関係情報に基づいて、前記オリジナル検索項目のコンテキスト情報を確定することに用いられる情報確定ユニットと、を備える。
前記オリジナル検索項目の語義情報及び前記オリジナル検索項目の意図情報のうちの少なくとも1つと、マシンワード集合とに基づいて、新規検索項目を確定した後に、ヒントテキスト又は2度目問い合わせの形態によって、前記新規検索項目をユーザにフィードバックすることに用いられる検索項目フィードバックモジュールと、
ユーザの肯定応答を取得した後に、前記新規検索項目に基づいて検索を行い、検索結果をユーザにフィードバックすることに用いられる検索モジュールと、をさらに備える。
前記コンテキスト情報を事前トレーニングされたシーケンス複合化ネットワークに入力し、前記少なくとも2つの検索項目候補を出力することに用いられる検索項目確定サブユニットを備え、
ここで、前記シーケンス複合化ネットワークは、事前トレーニングによって前記マシンワード集合を学習した。
Claims (18)
- 検索項目書き換え要求に応答して、オリジナル検索項目のコンテキスト情報及び前記オリジナル検索項目の意図情報のうちの少なくとも1つを抽出することと、
前記コンテキスト情報及び前記意図情報のうちの少なくとも1つと、マシンワード集合とに基づいて、新規検索項目を確定することと、を含み
マシンの前記新規検索項目に対する理解度は、前記オリジナル検索項目に対する理解度よりも高い、
検索項目書き換え方法。 - 前記コンテキスト情報および前記意図情報と、マシンワード集合とに基づいて、新規検索項目を確定することは、
前記コンテキスト情報および前記マシンワード集合に基づいて、少なくとも2つの検索項目候補を確定することと、
前記検索項目候補の意図と前記オリジナル検索項目の意図とをマッチングすることと、
マッチング結果に基づいて、前記少なくとも2つの検索項目候補から前記新規検索項目を確定することと、を含む、
請求項1に記載の検索項目書き換え方法。 - 前記コンテキスト情報および前記マシンワード集合に基づいて、少なくとも2つの検索項目候補を確定することは、
前記コンテキスト情報を事前トレーニングされたシーケンス符号化ネットワークに入力し、前記少なくとも2つの検索項目候補を出力することと、を含み、
前記シーケンス符号化ネットワークは、事前トレーニングによって前記マシンワード集合を学習した、
請求項2に記載の検索項目書き換え方法。 - 前記オリジナル検索項目の語義ベクトルを事前トレーニングされたシーケンス変換ネットワークに入力する前に、
ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスからサンプル検索項目セットを確定することと、
前記サンプル検索項目セットを利用して初期ネットワークをトレーニングし、前記シーケンス変換ネットワークを得ることと、をさらに含み、
前記サンプル検索項目セットに、少なくとも1つの第1検索項目および少なくとも1つの第2検索項目が含まれ、マシンの前記第1検索項目に対する理解度が第1理解度閾値よりも大きく、マシンの前記第2検索項目に対する理解度が第2理解度閾値よりも小さく、且つ、前記第1検索項目と前記第2検索項目との語義類似度が所定類似度閾値よりも大きい、
請求項3に記載の検索項目書き換え方法。 - ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスからサンプル検索項目セットを確定することは、
ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスから発生時間が連続する少なくとも1つの第1検索項目を確定することと、
前記第1検索項目の発生時間と連続し、且つ、前記第1検索項目以降に発生する少なくとも1つの第2検索項目を検知することと、
前記少なくとも1つの第1検索項目および前記少なくとも1つの第2検索項目に基づいて、前記サンプル検索項目セットを確定することと、を含む、
請求項4に記載の検索項目書き換え方法。 - ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスからサンプル検索項目セットを確定した後に、
前記サンプル検索項目セットに少なくとも2つの第1検索項目が含まれている場合、前記サンプル検索項目セットにおける各第1検索項目と前記サンプル検索項目セットにおける第2検索項目との類似度を算出することと、
算出された類似度に基づいて、前記サンプル検索項目セットにおける少なくとも2つの第1検索項目をフィルタリングすることと、をさらに含む、
請求項4に記載の検索項目書き換え方法。 - 前記オリジナル検索項目に関連検索項目が存在する場合、前記オリジナル検索項目のコンテキスト情報を抽出することは、
前記オリジナル検索項目における語句間の第1語句関係情報、および前記関連検索項目における語句間の第2語句関係情報を抽出することと、
前記第1語句関係情報および前記第2語句関係情報に基づいて、前記オリジナル検索項目のコンテキスト情報を確定することと、を含む、
請求項1~6のいずれか1項に記載の検索項目書き換え方法。 - 前記オリジナル検索項目の語義情報及び前記オリジナル検索項目の意図情報のうちの少なくとも1つと、マシンワード集合とに基づいて、新規検索項目を確定した後に、
ヒントテキスト又は2度目問い合わせの形態によって、前記新規検索項目をユーザにフィードバックすることと、
ユーザの肯定応答を取得した後に、前記新規検索項目に基づいて検索を行い、検索結果をユーザにフィードバックすることと、をさらに含む、
請求項1~6のいずれか1項に記載の検索項目書き換え方法。 - 検索項目書き換え要求に応答して、オリジナル検索項目のコンテキスト情報及び前記オリジナル検索項目の意図情報のうちの少なくとも1つを抽出するように構成される情報抽出モジュールと、
前記コンテキスト情報及び前記意図情報のうちの少なくとも1つと、マシンワード集合とに基づいて、新規検索項目を確定するように構成される検索項目確定モジュールと、を備え、
マシンの前記新規検索項目に対する理解度は、前記オリジナル検索項目に対する理解度よりも高い、
検索項目書き換え装置。 - 前記検索項目確定モジュールは、
前記コンテキスト情報および前記マシンワード集合に基づいて、少なくとも2つの検索項目候補を確定するように構成される検索項目候補確定ユニットと、
前記検索項目候補の意図と前記オリジナル検索項目の意図とをマッチングするように構成される意図マッチングユニットと、
マッチング結果に基づいて、前記少なくとも2つの検索項目候補から前記新規検索項目を確定するように構成される新規検索項目確定ユニットと、を備える、
請求項9に記載の検索項目書き換え装置。 - 前記検索項目候補確定ユニットは、
前記コンテキスト情報を事前トレーニングされたシーケンス符号化ネットワークに入力し、前記少なくとも2つの検索項目候補を出力するように構成される検索項目確定サブユニットを備え、
前記シーケンス符号化ネットワークは、事前トレーニングによって前記マシンワード集合を学習した、
請求項10に記載の検索項目書き換え装置。 - 前記オリジナル検索項目の語義ベクトルを事前トレーニングされたシーケンス変換ネットワークに入力する前に、ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスからサンプル検索項目セットを確定するように構成されるサンプル確定モジュールと、
前記サンプル検索項目セットを利用して初期ネットワークをトレーニングし、前記シーケンス変換ネットワークを得るように構成されるモデルトレーニングモジュールと、をさらに備え、
前記サンプル検索項目セットに、少なくとも1つの第1検索項目および少なくとも1つの第2検索項目が含まれ、マシンの前記第1検索項目に対する理解度が第1理解度閾値よりも大きく、マシンの前記第2検索項目に対する理解度が第2理解度閾値よりも小さく、且つ、前記第1検索項目と前記第2検索項目との語義類似度が所定類似度閾値よりも大きい、
請求項11に記載の検索項目書き換え装置。 - 前記サンプル確定モジュールは、
ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスから発生時間が連続する少なくとも1つの第1検索項目を確定するように構成される第1検索項目確定ユニットと、
前記第1検索項目の発生時間と連続し、且つ、前記第1検索項目発生に発生する少なくとも1つの第2検索項目を検知するように構成される第2検索項目確定ユニットと、
前記少なくとも1つの第1検索項目および前記少なくとも1つの第2検索項目に基づいて、前記サンプル検索項目セットを確定するように構成されるサンプル確定ユニットと、を備える、
請求項12に記載の検索項目書き換え装置。 - 前記ユーザにフィードバックしたマシンの回答情報に基づいて、ユーザが入力した検索項目シーケンスからサンプル検索項目セットを確定した後に、前記サンプル検索項目セットに少なくとも2つの第1検索項目が含まれている場合、前記サンプル検索項目セットにおける各第1検索項目と前記サンプル検索項目セットにおける第2検索項目との類似度を算出するように構成される類似算出モジュールと、
算出された類似度に基づいて、前記サンプル検索項目セットにおける少なくとも2つの第1検索項目をフィルタリングするように構成される検索項目フィルタリングモジュールと、をさらに備える、
請求項12に記載の検索項目書き換え装置。 - 前記オリジナル検索項目に関連検索項目が存在する場合、前記情報抽出モジュールは、
前記オリジナル検索項目における語句間の第1語句関係情報および前記関連検索項目における語句間の第2語句関係情報を抽出するように構成される情報抽出ユニットと、
前記第1語句関係情報および前記第2語句関係情報に基づいて、前記オリジナル検索項目のコンテキスト情報を確定するように構成される情報確定ユニットと、を備える、
請求項9~14のいずれか1項に記載の検索項目書き換え装置。 - 前記オリジナル検索項目の語義情報及び前記オリジナル検索項目の意図情報のうちの少なくとも1つと、マシンワード集合とに基づいて、新規検索項目を確定した後に、ヒントテキスト又は2度目問い合わせの形態によって、前記新規検索項目をユーザにフィードバックするように構成される検索項目フィードバックモジュールと、
ユーザの肯定応答を取得した後に、前記新規検索項目に基づいて検索を行い、検索結果をユーザにフィードバックするように構成される検索モジュールと、をさらに備える、
請求項9~14のいずれか1項に記載の検索項目書き換え装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続される記憶装置と、を備え、
前記記憶装置に前記少なくとも1つのプロセッサにより実行可能な命令が記憶され、
前記命令は、前記少なくとも1つのプロセッサが請求項1~8のいずれか1項に記載の検索項目書き換え方法を実行可能であるように、前記少なくとも1つのプロセッサに実行される、
電子機器。 - 請求項1~8のいずれか1項に記載の検索項目書き換え方法をコンピュータに実行させるためのコンピュータ命令が記憶されている、
非瞬時性コンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010600669.X | 2020-06-28 | ||
CN202010600669.XA CN111797216B (zh) | 2020-06-28 | 2020-06-28 | 检索项改写方法、装置、设备以及存储介质 |
PCT/CN2020/128554 WO2022000934A1 (zh) | 2020-06-28 | 2020-11-13 | 检索项改写方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022544428A true JP2022544428A (ja) | 2022-10-19 |
JP7352640B2 JP7352640B2 (ja) | 2023-09-28 |
Family
ID=77495450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021545777A Active JP7352640B2 (ja) | 2020-06-28 | 2020-11-13 | 検索項目書き換え方法、装置、機器および記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US12079215B2 (ja) |
EP (1) | EP3961424A4 (ja) |
JP (1) | JP7352640B2 (ja) |
KR (1) | KR20210104909A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024049851A1 (en) * | 2022-08-29 | 2024-03-07 | Unnanu, Inc. | System and method for searching media or data based on contextual weighted keywords |
CN116894431B (zh) * | 2023-09-07 | 2024-01-09 | 腾讯科技(深圳)有限公司 | 文本处理模型训练方法、文本改写方法及装置和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018116728A (ja) * | 2010-01-18 | 2018-07-26 | アップル インコーポレイテッド | インテリジェント自動アシスタント |
WO2019235103A1 (ja) * | 2018-06-07 | 2019-12-12 | 日本電信電話株式会社 | 質問生成装置、質問生成方法及びプログラム |
CN110969024A (zh) * | 2018-09-30 | 2020-04-07 | 北京奇虎科技有限公司 | 一种查询语句的改写方法及装置 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU3044397A (en) | 1996-06-21 | 1998-01-07 | Kdl Technologies Limited | Apparatus and method for generating optimal search queries |
US8055669B1 (en) | 2003-03-03 | 2011-11-08 | Google Inc. | Search queries improved based on query semantic information |
US8375048B1 (en) * | 2004-01-20 | 2013-02-12 | Microsoft Corporation | Query augmentation |
US7634462B2 (en) * | 2005-08-10 | 2009-12-15 | Yahoo! Inc. | System and method for determining alternate search queries |
US8694483B2 (en) * | 2007-10-19 | 2014-04-08 | Xerox Corporation | Real-time query suggestion in a troubleshooting context |
US7831588B2 (en) * | 2008-02-05 | 2010-11-09 | Yahoo! Inc. | Context-sensitive query expansion |
US20100094835A1 (en) * | 2008-10-15 | 2010-04-15 | Yumao Lu | Automatic query concepts identification and drifting for web search |
US8190601B2 (en) * | 2009-05-22 | 2012-05-29 | Microsoft Corporation | Identifying task groups for organizing search results |
US9092485B2 (en) * | 2010-04-19 | 2015-07-28 | Facebook, Inc. | Dynamic suggested search queries on online social networks |
US20110314001A1 (en) * | 2010-06-18 | 2011-12-22 | Microsoft Corporation | Performing query expansion based upon statistical analysis of structured data |
US9330083B2 (en) * | 2012-02-14 | 2016-05-03 | Facebook, Inc. | Creating customized user dictionary |
US20130282682A1 (en) * | 2012-04-18 | 2013-10-24 | Yahoo! Inc. | Method and System for Search Suggestion |
US8954360B2 (en) | 2012-10-16 | 2015-02-10 | Sap Se | Semantic request normalizer |
US10248967B2 (en) * | 2015-09-25 | 2019-04-02 | Microsoft Technology Licensing, Llc | Compressing an original query while preserving its intent |
US10654380B2 (en) * | 2016-11-18 | 2020-05-19 | Microsoft Technology Licensing, Llc | Query rewriting and interactive inquiry framework |
CN108227955A (zh) | 2017-12-29 | 2018-06-29 | 北京奇虎科技有限公司 | 一种基于用户历史搜索推荐输入联想的方法及装置 |
TWI679548B (zh) * | 2018-05-09 | 2019-12-11 | 鼎新電腦股份有限公司 | 虛擬助理的自動學習方法及系統 |
US11580145B1 (en) * | 2018-09-25 | 2023-02-14 | Amazon Technologies, Inc. | Query rephrasing using encoder neural network and decoder neural network |
CN110990578A (zh) * | 2018-09-30 | 2020-04-10 | 北京奇虎科技有限公司 | 一种改写模型的构建方法及装置 |
CN109635197B (zh) | 2018-12-17 | 2021-08-24 | 北京百度网讯科技有限公司 | 搜索方法、装置、电子设备及存储介质 |
US12086541B2 (en) * | 2019-09-04 | 2024-09-10 | Brain Technologies, Inc. | Natural query completion for a real-time morphing interface |
CN110727785A (zh) | 2019-09-11 | 2020-01-24 | 北京奇艺世纪科技有限公司 | 推荐模型的训练、搜索文本的推荐方法、装置及存储介质 |
CN110750616B (zh) | 2019-10-16 | 2023-02-03 | 网易(杭州)网络有限公司 | 检索式聊天方法、装置以及计算机设备 |
CN111797216B (zh) | 2020-06-28 | 2024-04-05 | 北京百度网讯科技有限公司 | 检索项改写方法、装置、设备以及存储介质 |
-
2020
- 2020-11-13 JP JP2021545777A patent/JP7352640B2/ja active Active
- 2020-11-13 US US17/428,384 patent/US12079215B2/en active Active
- 2020-11-13 KR KR1020217024946A patent/KR20210104909A/ko not_active Application Discontinuation
- 2020-11-13 EP EP20913071.5A patent/EP3961424A4/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018116728A (ja) * | 2010-01-18 | 2018-07-26 | アップル インコーポレイテッド | インテリジェント自動アシスタント |
WO2019235103A1 (ja) * | 2018-06-07 | 2019-12-12 | 日本電信電話株式会社 | 質問生成装置、質問生成方法及びプログラム |
CN110969024A (zh) * | 2018-09-30 | 2020-04-07 | 北京奇虎科技有限公司 | 一种查询语句的改写方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20230123581A1 (en) | 2023-04-20 |
JP7352640B2 (ja) | 2023-09-28 |
KR20210104909A (ko) | 2021-08-25 |
EP3961424A1 (en) | 2022-03-02 |
US12079215B2 (en) | 2024-09-03 |
EP3961424A4 (en) | 2022-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108334487B (zh) | 缺失语意信息补全方法、装置、计算机设备和存储介质 | |
JP7127106B2 (ja) | 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体 | |
CN112560912B (zh) | 分类模型的训练方法、装置、电子设备和存储介质 | |
EP4060565A1 (en) | Method and apparatus for acquiring pre-trained model | |
US11775254B2 (en) | Analyzing graphical user interfaces to facilitate automatic interaction | |
CN111414482B (zh) | 一种事件论元抽取方法、装置以及电子设备 | |
JP7108675B2 (ja) | 意味マッチング方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
WO2018195875A1 (en) | Generating question-answer pairs for automated chatting | |
CN111143576A (zh) | 一种面向事件的动态知识图谱构建方法和装置 | |
CN112347769B (zh) | 实体识别模型的生成方法、装置、电子设备及存储介质 | |
KR102565673B1 (ko) | 시멘틱 표현 모델의 생성 방법, 장치, 전자 기기 및 저장 매체 | |
WO2022000934A1 (zh) | 检索项改写方法、装置、设备以及存储介质 | |
CN109313650A (zh) | 在自动聊天中生成响应 | |
JP2022003537A (ja) | 対話意図の認識方法及び装置、電子機器並びに記憶媒体 | |
CN115309877B (zh) | 对话生成方法、对话模型训练方法及装置 | |
CN115359383B (zh) | 跨模态特征提取、检索以及模型的训练方法、装置及介质 | |
CN110427627A (zh) | 基于语义表示模型的任务处理方法和装置 | |
WO2023201975A1 (zh) | 一种差异描述语句生成方法、装置、设备及介质 | |
JP2021111334A (ja) | 検索データに基づくヒューマンコンピュータ対話型インタラクションの方法、装置及び電子機器 | |
EP3869359A1 (en) | Method for generating question answering robot and computer device | |
CN112131368B (zh) | 对话生成方法、装置、电子设备及存储介质 | |
CN110459211A (zh) | 人机对话方法、客户端、电子设备及存储介质 | |
JP7352640B2 (ja) | 検索項目書き換え方法、装置、機器および記憶媒体 | |
CN112507090A (zh) | 用于输出信息的方法、装置、设备和存储介质 | |
WO2023173554A1 (zh) | 坐席违规话术识别方法、装置、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210804 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230822 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7352640 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |