JP2020501229A - 質問応答のための動的相互注目ネットワーク - Google Patents
質問応答のための動的相互注目ネットワーク Download PDFInfo
- Publication number
- JP2020501229A JP2020501229A JP2019522932A JP2019522932A JP2020501229A JP 2020501229 A JP2020501229 A JP 2020501229A JP 2019522932 A JP2019522932 A JP 2019522932A JP 2019522932 A JP2019522932 A JP 2019522932A JP 2020501229 A JP2020501229 A JP 2020501229A
- Authority
- JP
- Japan
- Prior art keywords
- document
- encoding
- context
- question
- query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 84
- 230000008569 process Effects 0.000 claims abstract description 31
- 230000001143 conditioned effect Effects 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 22
- 238000003860 storage Methods 0.000 claims description 21
- 230000004044 response Effects 0.000 claims description 19
- 230000002441 reversible effect Effects 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 11
- 230000001186 cumulative effect Effects 0.000 claims description 9
- 230000002457 bidirectional effect Effects 0.000 claims description 7
- 230000006403 short-term memory Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 1
- 230000007774 longterm Effects 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 abstract description 65
- 238000005516 engineering process Methods 0.000 abstract description 23
- 230000003993 interaction Effects 0.000 abstract description 3
- 239000011159 matrix material Substances 0.000 description 27
- 239000013598 vector Substances 0.000 description 18
- 230000006870 function Effects 0.000 description 9
- 230000015654 memory Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 239000011248 coating agent Substances 0.000 description 3
- 238000000576 coating method Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 240000001436 Antirrhinum majus Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000995070 Nirvana Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000001682 microtransfer moulding Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009625 temporal interaction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本出願は、2016年11月4日に出願された米国仮特許出願第62/417,332号「DYNAMIC COATTENTION NETWORKS FOR QUESTION ANSWERING」(Atty. Docket No. SALE 1179-1/1945PROV)の利益を主張する。この優先仮出願はすべての目的に対しここで参照により援用される。
開示される技術はディープニューラルネットワークを使用する自然言語処理(NLP)に一般に関し、詳細には機械理解及び質問応答のためのエンドツーエンドニューラルネットワークアーキテクチャに関する。
質問応答(Question answering、QA)は、自然言語理解及び世界知識の双方を必要とする自然言語処理(natural language processing、NLP)において重要なタスクである。従前のQAデータセットは、人間の注釈に起因して品質が高く、しかしサイズが小さい傾向がある。ゆえに、これらは、ディープニューラルネットワークなどのデータ集中的な表現モデルを訓練することを許容しない。
図1は、ドキュメント102aを読み出して理解し、それに基づいて質問104aに応答する動的相互注目ネットワーク(DCN)100の態様を示す。ドキュメント102aは、ドキュメントデータベース102に記憶されている。質問104aは、質問データベース104に記憶されている。DCN100は、2つのタイプのコンポーネント、すなわち、エンコーディングコンポーネント(すなわち、エンコーダ)とデコーディングコンポーネント(すなわち、デコーダ)とを含む。DCN100のエンコーディングコンポーネントは、埋め込み器106、エンコーダニューラルネットワーク108、隠れ状態比較器110、指数関数的正規化器(exponential normalizer)112、エンコーディングミキサ114、及び相互注目エンコーダ116を含む。DCN100のデコーディングコンポーネントは、デコーダニューラルネットワーク118、開始ハイウェイマックスアウトネットワーク120、及び終了ハイウェイマックスアウトネットワーク122を含む。
埋め込み器106は、ドキュメント102a及び質問104a内の各ワードを、「埋め込み空間(embedding space)」と本明細書において呼ばれる高次元ベクトル空間にマッピングする。一実装において、埋め込み器106は、埋め込み行列
エンコーダニューラルネットワーク108は、文脈情報をドキュメント102a及び質問104a内の各ワードの表現に組み込むリカレントニューラルネットワーク(recurrent neural network、RNN)である。一実装において、エンコーダニューラルネットワーク108は、以下に示されるように、ドキュメント102aと質問104aとを別個に処理する標準の1方向の長短期記憶(Long Short-Term Memory、LSTM)ニューラルネットワークである。
相互注目機構は、ドキュメント102a及び質問104aに同時に注目し、双方の注目文脈を最終的に融合する。隠れ状態比較器110は、ドット積を使用してドキュメントエンコーディング212及び質問エンコーディング214を比較し、以下に示されるように、ドキュメントごと及び質問ごとの次元を有するアフィニティ行列302を出力する。
に依存して質問エンコーディング214の加重和を算出する。すなわち、質問エンコーディング214は、アフィニティ行列302内の質問対ドキュメント注目重み(μ)604の各行を要素ごとに乗算される。各々の質問ごと注目スカラ(例えば、μ1 1 614)に質問エンコーディング214内の対応する隠れ状態ベクトル(例えば、h1 Q 218)を乗算することにより、エンコーディングミキサ114は、ドキュメント102aに関して質問104aの文脈サマリ(例えば、C1 Q 712)を計算することにおける各質問ワードの関与の度合いを決定する。ゆえに、質問104aの各文脈サマリベクトルC1 Q,C2 Q,...,Cm Qは、ドキュメント102aに関して質問104a内の最も重要なワードの加重和を示す。質問の文脈サマリを作成するステップは、エンコーディングミキサ114の質問エンコーディングミキサ1808により具現化される。
SQuADの性質に起因して、応答スパンを生成する直感的な方法は、スパンの開始及び終了点を予測することによる。しかしながら、質問・ドキュメントペアを所与として、ドキュメント内にいくつかの直感的応答スパンが存在し、各々が極大値に対応する可能性がある。この問題に対処するために、DCN100は、反復的手法を使用して、ドキュメント内の応答スパンの開始及び終了点を予測することにより応答スパンを選択する。この反復的手順は、DCN100が、誤った応答スパンに対応する初期極大値から回復することを可能にする。
図15〜17は、デコーダニューラルネットワーク118により生成された開始及び終了条件付き分布の例である。図15〜17において、奇数(青)行は開始分布を表し、偶数(赤)行は終了分布を表す。iはデコーダニューラルネットワーク118の反復数を示す。より高い確率質量がより暗い領域で示されている。最も高い確率質量を有するワードに対応するオフセットが右手側に示されている。予測されたスパンが赤で下線を引かれ、グラウンドトルース応答スパンが緑で下線を引かれている。
質問に基づいてドキュメントを相互注目的に(coattentively)解析し、ドキュメントに基づいて質問に応答するシステム、方法、及び製造品を我々は説明する。実装の1つ以上の特徴が、基本の実装と組み合わせられてよい。相互排他的でない実装は、結合可能であることが教示される。実装の1つ以上の特徴が、他の実装と組み合わせられてよい。本開示は、これらの選択肢をユーザに周期的に注意する。これらの選択肢を繰り返す記載の、いくつかの実装からの省略は、前のセクションにおいて教示された組み合わせを制限するものとみなされるべきでない。これらの記載は、以後参照により以下の実装の各々にここで援用される。
図19は、動的相互注目ネットワーク(DCN)100を実現するために使用できるコンピュータシステム1900の簡略ブロック図である。コンピュータシステム1900は、バスサブシステム1922を介して複数の周辺デバイスと通信する少なくとも1つの中央処理ユニット(CPU)1924を含む。これらの周辺デバイスは、例えばメモリデバイス及びファイルストレージサブシステム1918を含むストレージサブシステム1910、ユーザインターフェース入力デバイス1920、ユーザインターフェース出力デバイス1928、及びネットワークインターフェースサブシステム1926を含んでよい。入力及び出力デバイスは、コンピュータシステム1900とのユーザ相互作用を可能にする。ネットワークインターフェースサブシステム1926は、他のコンピュータシステム内の対応するインターフェースデバイスへのインターフェースを含む、外部ネットワークへのインターフェースを提供する。
Claims (27)
- 複数の並列プロセッサ上で動作し、質問に基づいてドキュメントを解析し前記ドキュメントに基づいて前記質問に応答する相互注目質問応答システムであって、
ドキュメントワード埋め込み及び前のドキュメント文脈エンコーディングを複数の長短期記憶(略称LSTM)ゲートを通じて再帰的に処理し、ドキュメント文脈エンコーディングを作成するドキュメントエンコーダLSTMと、
質問ワード埋め込み及び前の質問文脈エンコーディングを前記LSTMゲートを通じて再帰的に処理し、質問文脈エンコーディングを作成する質問エンコーダLSTMと、
ドキュメント及び質問文脈エンコーディングのペア間のペアごと言語類似度スコアを決定する隠れ状態比較器と、
ドキュメント対質問ワードベースで生成された指数関数的に正規化されたスコアシーケンスによりスケーリングされた前記ドキュメント文脈エンコーディングの凸結合としてドキュメント文脈サマリを作成するドキュメントエンコーディングミキサと、
質問対ドキュメントワードベースで生成された指数関数的に正規化されたスコアシーケンスによりスケーリングされた前記質問文脈エンコーディングの凸結合として質問文脈サマリを作成する質問エンコーディングミキサと、
前記質問対ドキュメントワードベースで生成された前記指数関数的に正規化されたスコアシーケンスによりスケーリングされた前記ドキュメント文脈サマリの凸結合として再注目ドキュメント文脈サマリを作成する再注目器と、
連結された入力及び前のドキュメント相互注目エンコーディングを複数のLSTMゲートを通じてフォワード及びリバース方向において再帰的に処理し、ドキュメント相互注目エンコーディングを作成する相互注目エンコーダ双方向LSTMであり、前記連結された入力は、前記再注目ドキュメント文脈サマリ、前記質問文脈サマリ、及び前記ドキュメント文脈エンコーディングを含む、相互注目エンコーダ双方向LSTMと、
前記ドキュメント相互注目エンコーディングと前に推定された開始及び終了位置におけるドキュメント注目エンコーディングとデコーダLSTMの現在のデコーダ隠れ状態との結合をハイウェイマックスアウトネットワークを通じて反復的に処理して潜在的開始位置と次いで潜在的終了位置とについて前記ドキュメント相互注目エンコーディングをスコア付けするデコーダと、
を含み、前記デコーダは、
前記ハイウェイマックスアウトネットワークにより作成された潜在的スコアの中から選択し、現在推定された開始及び終了位置を生成するargmaxモジュール、及び、
終了条件に達すると、前記質問に応答するドキュメントフレーズを出力する出力生成器であり、前記ドキュメントフレーズは前記現在推定された開始及び終了位置に及びその範囲内におけるドキュメントワードを含む、出力生成器、
をさらに含む、相互注目質問応答システム。 - 前のデコーダ隠れ状態と前に推定された開始及び終了位置における前記ドキュメント注目エンコーディングとに基づいて前記現在のデコーダ隠れ状態をさらに作成する前記デコーダLSTM、をさらに含む請求項1に記載の相互注目質問応答システム。
- 前記現在のデコーダ隠れ状態と前に推定された開始及び終了位置における前記ドキュメント注目エンコーディングとを非線形射影に射影する線形層と、
スコア付けされる各位置を前記非線形射影と結合し、各結合を4つ以上の線形モデルを通じて処理して前記線形モデルのうち1つから最大出力を選択する第1のマックスアウト層と、
スコア付けされる各位置について、前記第1のマックスアウト層の出力を4つ以上の線形モデルを通じて処理して前記線形モデルのうち1つから最大出力を選択する第2のマックスアウト層と、
スコア付けされる各位置について、前記第1及び第2のマックスアウト層の出力を4つ以上の線形モデルを通じて処理して前記線形モデルのうち1つから最大出力を選択する第3のマックスアウト層と、
を通じて、前記ドキュメント内の位置について前記ドキュメント相互注目エンコーディングをさらに処理する前記ハイウェイマックスアウトネットワーク、をさらに含む請求項1乃至2のうちいずれか1項に記載の相互注目質問応答システム。 - 前記終了条件は、前記現在推定された開始及び終了位置が前記前に推定された開始及び終了位置に一致したとき達せられる、請求項1乃至3のうちいずれか1項に記載の相互注目質問応答システム。
- 前記終了条件は、最大の反復数が達せられたとき達せられる、請求項1乃至4のうちいずれか1項に記載の相互注目質問応答システム。
- 訓練例を通じてのすべての反復にわたり開始及び終了位置の推定における累積損失を最小化することにより、前記ドキュメントエンコーダLSTMと前記質問エンコーダLSTMと前記相互注目エンコーダ双方向LSTMと前記デコーダLSTMと前記ハイウェイマックスアウトネットワークとを訓練する訓練器、をさらに含む請求項1乃至5のうちいずれか1項に記載の相互注目質問応答システム。
- 前記累積損失は、逆伝播に基づくソフトマックス交差エントロピーを使用して前記訓練器により決定される、請求項1乃至6のうちいずれか1項に記載の相互注目質問応答システム。
- 前記ドキュメント及び質問文脈エンコーディングのペア間の前記ペアごと言語類似度スコアは、前記隠れ状態比較器により適用されるドット積又は双線形積を使用して決定される、請求項1乃至7のうちいずれか1項に記載の相互注目質問応答システム。
- 前記argmaxモジュールによる前記潜在的スコアのうち最大のスコアの選択に基づいて前記現在推定された開始及び終了位置をさらに生成する前記デコーダ、をさらに含む請求項1乃至8のうちいずれか1項に記載の相互注目質問応答システム。
- 前記連結された入力を前記フォワード方向においてさらに処理し、フォワード出力を作成し、前記連結された入力を前記バックワード方向においてさらに処理し、リバース出力を作成し、前記フォワード及びリバース出力をさらに連結して前記ドキュメント相互注目エンコーディングを作成する前記相互注目エンコーダ双方向LSTM、をさらに含む請求項1乃至9のうちいずれか1項に記載の相互注目質問応答システム。
- 複数の並列プロセッサ上で動作し、質問に基づいてドキュメントを解析し前記ドキュメントに基づいて前記質問に応答する相互注目質問応答システムであって、
ドキュメントエンコーダ長短期記憶(略称LSTM)及び質問エンコーダLSTMにより再帰的に作成されるドキュメント及び質問文脈エンコーディングのペア間のペアごと言語類似度スコアを決定する隠れ状態比較器と、
ドキュメント対質問ワードごと言語類似度スコアを使用して前記ドキュメント文脈エンコーディングに注目し、前記質問文脈エンコーディングを条件としたドキュメント文脈サマリを作成するドキュメントエンコーディングミキサと、
質問対ドキュメントワードごと言語類似度スコアを使用して前記質問文脈エンコーディングに注目し、前記ドキュメント文脈エンコーディングを条件とした質問文脈サマリを作成する質問エンコーディングミキサと、
前記質問対ドキュメントワードごと言語類似度スコアを使用して前記ドキュメント文脈サマリに注目し、前記質問文脈エンコーディングを再度条件とした再注目ドキュメント文脈サマリを作成する再注目器と、
前記再注目ドキュメント文脈サマリと前記質問文脈サマリと前記ドキュメント文脈エンコーディングとの連結を再帰的及び双方向に処理し、ドキュメント相互注目エンコーディングを作成する相互注目エンコーダLSTMと、
デコーダLSTM及びハイウェイマックスアウトネットワークを使用して前記ドキュメント相互注目エンコーディングを反復的に処理し、前記質問に応答するドキュメントフレーズを出力するデコーダと、
を含む相互注目質問応答システム。 - ドキュメントワード埋め込み及び前のドキュメント文脈エンコーディングを複数のLSTMゲートを通じてさらに再帰的に処理し、前記ドキュメント文脈エンコーディングを作成する前記ドキュメントエンコーダLSTMと、質問ワード埋め込み及び前の質問文脈エンコーディングを前記LSTMゲートを通じてさらに再帰的に処理し、前記質問文脈エンコーディングを作成する前記質問エンコーダLSTMと、をさらに含む請求項11に記載の相互注目質問応答システム。
- ドキュメント対質問ワードベースで生成された指数関数的に正規化されたスコアシーケンスによりスケーリングされた前記ドキュメント文脈エンコーディングの凸結合として前記ドキュメント文脈サマリをさらに作成する前記ドキュメントエンコーディングミキサ、をさらに含み、質問対ドキュメントワードベースで生成された指数関数的に正規化されたスコアシーケンスによりスケーリングされた前記質問文脈エンコーディングの凸結合として前記質問文脈サマリをさらに作成する前記質問エンコーディングミキサ、をさらに含み、前記質問対ドキュメントワードベースで生成された前記指数関数的に正規化されたスコアシーケンスによりスケーリングされた前記ドキュメント文脈サマリの凸結合として前記再注目ドキュメント文脈サマリをさらに作成する前記再注目器、をさらに含む請求項11乃至12のうちいずれか1項に記載の相互注目質問応答システム。
- 前記再注目ドキュメント文脈サマリと前記質問文脈サマリと前記ドキュメント文脈エンコーディングとの対応する要素を連結する連結器、をさらに含む請求項11乃至13のうちいずれか1項に記載の相互注目質問応答システム。
- 前記連結を前記フォワード方向においてさらに処理し、フォワード出力を作成し、前記連結を前記バックワード方向においてさらに処理し、リバース出力を作成し、前記フォワード及びリバース出力をさらに連結し、前記ドキュメント相互注目エンコーディングを作成する前記相互注目エンコーダ双方向LSTM、をさらに含む請求項11乃至14のうちいずれか1項に記載の相互注目質問応答システム。
- 前記ドキュメント相互注目エンコーディングと前に推定された開始及び終了位置におけるドキュメント注目エンコーディングと前記デコーダLSTMの現在のデコーダ隠れ状態との結合を前記ハイウェイマックスアウトネットワークを通じて反復的に処理して潜在的開始位置と次いで潜在的終了位置とについて前記ドキュメント相互注目エンコーディングをスコア付けする前記デコーダ、をさらに含み、前記デコーダは、
前記ハイウェイマックスアウトネットワークにより作成された潜在的スコアの中から選択し、現在推定された開始及び終了位置を生成するargmaxモジュール、及び、
終了条件に達すると、前記現在推定された開始及び終了位置に及びその範囲内におけるドキュメントワードを含む前記ドキュメントフレーズを出力する出力生成器
をさらに含む、請求項11乃至15のうちいずれか1項に記載の相互注目質問応答システム。 - 前のデコーダ隠れ状態と前に推定された開始及び終了位置における前記ドキュメント注目エンコーディングとに基づいて前記現在のデコーダ隠れ状態をさらに作成する前記デコーダLSTM、をさらに含む請求項11乃至16のうちいずれか1項に記載の相互注目質問応答システム。
- 前記現在のデコーダ隠れ状態と前に推定された開始及び終了位置における前記ドキュメント注目エンコーディングとを非線形射影に射影する線形層と、
スコア付けされる各位置を前記非線形射影と結合し、各結合を4つ以上の線形モデルを通じて処理して前記線形モデルのうち1つから最大出力を選択する第1のマックスアウト層と、
スコア付けされる各位置について、前記第1のマックスアウト層の出力を4つ以上の線形モデルを通じて処理して前記線形モデルのうち1つから最大出力を選択する第2のマックスアウト層と、
スコア付けされる各位置について、前記第1及び第2のマックスアウト層の出力を4つ以上の線形モデルを通じて処理して前記線形モデルのうち1つから最大出力を選択する第3のマックスアウト層と、
を通じて、前記ドキュメント内の位置について前記ドキュメント相互注目エンコーディングをさらに処理する前記ハイウェイマックスアウトネットワーク、をさらに含む請求項11乃至17のうちいずれか1項に記載の相互注目質問応答システム。 - 前記終了条件は、前記現在推定された開始及び終了位置が前記前に推定された開始及び終了位置に一致したとき達せられる、請求項11乃至18のうちいずれか1項に記載の相互注目質問応答システム。
- 前記終了条件は、最大の反復数が達せられたとき達せられる、請求項11乃至19のうちいずれか1項に記載の相互注目質問応答システム。
- 訓練例を通じてのすべての反復にわたり開始及び終了位置の推定における累積損失を最小化することにより、前記ドキュメントエンコーダLSTMと前記質問エンコーダLSTMと前記相互注目エンコーダ双方向LSTMと前記デコーダLSTMと前記ハイウェイマックスアウトネットワークとを訓練する訓練器、をさらに含む請求項11乃至20のうちいずれか1項に記載の相互注目質問応答システム。
- 前記累積損失は、逆伝播に基づくソフトマックス交差エントロピーを使用して前記訓練器により決定される、請求項11乃至21のうちいずれか1項に記載の相互注目質問応答システム。
- 前記ドキュメント及び質問文脈エンコーディングのペア間の前記ペアごと言語類似度スコアは、前記隠れ状態比較器によりドット積を使用して決定される、請求項11乃至22のうちいずれか1項に記載の相互注目質問応答システム。
- 前記argmaxモジュールの、前記潜在的スコアのうち最大のスコアの選択に基づいて、前記現在推定された開始及び終了位置をさらに生成する前記デコーダ、をさらに含む請求項11乃至23のうちいずれか1項に記載の相互注目質問応答システム。
- 質問に基づいてドキュメントを相互注目的に解析し前記ドキュメントに基づいて前記質問に応答する、コンピュータにより実現される方法であって、
ドキュメントエンコーダ長短期記憶(略称LSTM)及び質問エンコーダLSTMにより再帰的に作成されるドキュメント及び質問文脈エンコーディングのペア間のペアごと言語類似度スコアを決定するステップと、
ドキュメント対質問ワードごと言語類似度スコアを使用して前記ドキュメント文脈エンコーディングに注目し、前記質問文脈エンコーディングを条件としたドキュメント文脈サマリを作成するステップと、
質問対ドキュメントワードごと言語類似度スコアを使用して前記質問文脈エンコーディングに注目し、前記ドキュメント文脈エンコーディングを条件とした質問文脈サマリを作成するステップと、
質問対ドキュメントワードごと言語類似度スコアを使用して前記ドキュメント文脈サマリに注目し、前記質問文脈エンコーディングを再度条件とした再注目ドキュメント文脈サマリを作成するステップと、
前記再注目ドキュメント文脈サマリと前記質問文脈サマリと前記ドキュメント文脈エンコーディングとの連結を再帰的及び双方向に処理し、ドキュメント相互注目エンコーディングを作成するステップと、
デコーダLSTM及びハイウェイマックスアウトネットワークを使用して前記ドキュメント相互注目エンコーディングを反復的に処理し、前記質問に応答するドキュメントフレーズを出力するステップと、
を含む方法。 - 質問に基づいてドキュメントを相互注目的に解析し前記ドキュメントに基づいて前記質問に応答するコンピュータプログラム命令を記憶させた非一時的コンピュータ読取可能記憶媒体であって、前記命令は、複数の並列プロセッサコア上で実行されたときに、
ドキュメントエンコーダ長短期記憶(略称LSTM)及び質問エンコーダLSTMにより再帰的に作成されるドキュメント及び質問文脈エンコーディングのペア間のペアごと言語類似度スコアを決定するステップと、
ドキュメント対質問ワードごと言語類似度スコアを使用して前記ドキュメント文脈エンコーディングに注目し、前記質問文脈エンコーディングを条件としたドキュメント文脈サマリを作成するステップと、
質問対ドキュメントワードごと言語類似度スコアを使用して前記質問文脈エンコーディングに注目し、前記ドキュメント文脈エンコーディングを条件とした質問文脈サマリを作成するステップと、
質問対ドキュメントワードごと言語類似度スコアを使用して前記ドキュメント文脈サマリに注目し、前記質問文脈エンコーディングを再度条件とした再注目ドキュメント文脈サマリを作成するステップと、
前記再注目ドキュメント文脈サマリと前記質問文脈サマリと前記ドキュメント文脈エンコーディングとの連結を再帰的及び双方向に処理し、ドキュメント相互注目エンコーディングを作成するステップと、
デコーダLSTM及びハイウェイマックスアウトネットワークを使用して前記ドキュメント相互注目エンコーディングを反復的に処理し、前記質問に応答するドキュメントフレーズを出力するステップと、
を含む方法を実現する、媒体。 - 複数の並列プロセッサ上で動作する、ドキュメントに基づいて質問に応答する相互注目質問応答システムであって、
ワードのシーケンスについての文脈エンコーディングを発行し、前記ドキュメント内のワードの第1のシーケンスに適用され、前記質問内のワードの第2のシーケンスに適用され、前記ドキュメントについての文脈エンコーディングの第1のシーケンスを生成し、前記質問についての文脈エンコーディングの第2のシーケンスを生成するエンコーダ長短期記憶(略称LSTM)と、
前記第1及び第2のシーケンス内の前記文脈エンコーディング間の言語類似度を決定し、ペアごと言語類似度スコアを生成する隠れ状態比較器と、
1つの文脈エンコーディングについての、別の文脈エンコーディングのワードを条件とした文脈サマリシーケンスを発行し、前記類似度スコアを使用して前記質問についての前記文脈エンコーディングの第2のシーケンスを条件とした前記ドキュメントについての前記文脈エンコーディングの第1のシーケンスに適用されて、質問ワードを条件とした前記ドキュメントの第1の文脈サマリシーケンスを生成し、前記類似度スコアを使用して前記ドキュメントについての前記文脈エンコーディングの第1のシーケンスを条件とした前記質問についての前記文脈エンコーディングの第2のシーケンスに適用されて、ドキュメントワードを条件とした前記質問の第2の文脈サマリシーケンスを生成し、前記類似度スコアを使用して前記ドキュメントについての前記文脈エンコーディングの第1のシーケンスを条件とした前記ドキュメントの前記第1の文脈サマリシーケンスに再適用されて、前記ドキュメントの第3の再注目文脈サマリシーケンスを生成するエンコーディングミキサと、
連結された入力及び前のドキュメント相互注目エンコーディングをフォワード及びリバース方向において再帰的に処理してドキュメント相互注目エンコーディングを作成する相互注目エンコーダ双方向LSTMであり、前記連結された入力は、前記ドキュメントの前記第3の再注目文脈サマリシーケンスと前記質問の前記第2の文脈サマリシーケンスと前記ドキュメントの前記文脈エンコーディングの第1のシーケンスとを含む、相互注目エンコーダ双方向LSTMと、
前記ドキュメント相互注目エンコーディングと前に推定された開始及び終了位置におけるドキュメント注目エンコーディングとデコーダLSTMの現在のデコーダ隠れ状態との結合をハイウェイマックスアウトネットワークを通じて反復的に処理して潜在的開始位置と次いで潜在的終了位置とについて前記ドキュメント相互注目エンコーディングをスコア付けし、前記ハイウェイマックスアウトネットワークにより作成された潜在的スコアの中から選択して現在推定された開始及び終了位置を生成し、終了条件に達すると、前記質問に応答し且つ前記現在推定された開始及び終了位置に及びその範囲内におけるドキュメントワードを含むドキュメントフレーズを出力するデコーダと、
を含む相互注目質問応答システム。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662418060P | 2016-11-04 | 2016-11-04 | |
US201662417332P | 2016-11-04 | 2016-11-04 | |
US62/418,060 | 2016-11-04 | ||
US62/417,332 | 2016-11-04 | ||
US15/421,193 | 2017-01-31 | ||
US15/421,193 US10963782B2 (en) | 2016-11-04 | 2017-01-31 | Dynamic coattention network for question answering |
PCT/US2017/060026 WO2018085710A1 (en) | 2016-11-04 | 2017-11-03 | Dynamic coattention network for question answering |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020501229A true JP2020501229A (ja) | 2020-01-16 |
JP6873236B2 JP6873236B2 (ja) | 2021-05-19 |
Family
ID=62065651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019522932A Active JP6873236B2 (ja) | 2016-11-04 | 2017-11-03 | 質問応答のための動的相互注目ネットワーク |
Country Status (6)
Country | Link |
---|---|
US (1) | US10963782B2 (ja) |
EP (1) | EP3535706A1 (ja) |
JP (1) | JP6873236B2 (ja) |
CN (1) | CN109906460B (ja) |
CA (1) | CA3038812C (ja) |
WO (1) | WO2018085710A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2022003762A1 (ja) * | 2020-06-29 | 2022-01-06 |
Families Citing this family (115)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10565305B2 (en) | 2016-11-18 | 2020-02-18 | Salesforce.Com, Inc. | Adaptive attention model for image captioning |
US11354565B2 (en) | 2017-03-15 | 2022-06-07 | Salesforce.Com, Inc. | Probability-based guider |
US10572595B2 (en) * | 2017-04-13 | 2020-02-25 | Baidu Usa Llc | Global normalized reader systems and methods |
US10565318B2 (en) | 2017-04-14 | 2020-02-18 | Salesforce.Com, Inc. | Neural machine translation with latent tree attention |
US11386327B2 (en) | 2017-05-18 | 2022-07-12 | Salesforce.Com, Inc. | Block-diagonal hessian-free optimization for recurrent and convolutional neural networks |
US10817650B2 (en) | 2017-05-19 | 2020-10-27 | Salesforce.Com, Inc. | Natural language processing using context specific word vectors |
CN110692066B (zh) * | 2017-06-05 | 2023-06-02 | 渊慧科技有限公司 | 使用多模态输入选择动作 |
US10902738B2 (en) * | 2017-08-03 | 2021-01-26 | Microsoft Technology Licensing, Llc | Neural models for key phrase detection and question generation |
US11823013B2 (en) * | 2017-08-29 | 2023-11-21 | International Business Machines Corporation | Text data representation learning using random document embedding |
US11562287B2 (en) | 2017-10-27 | 2023-01-24 | Salesforce.Com, Inc. | Hierarchical and interpretable skill acquisition in multi-task reinforcement learning |
US11928600B2 (en) | 2017-10-27 | 2024-03-12 | Salesforce, Inc. | Sequence-to-sequence prediction using a neural network model |
US10573295B2 (en) | 2017-10-27 | 2020-02-25 | Salesforce.Com, Inc. | End-to-end speech recognition with policy learning |
US10592767B2 (en) | 2017-10-27 | 2020-03-17 | Salesforce.Com, Inc. | Interpretable counting in visual question answering |
US11604956B2 (en) | 2017-10-27 | 2023-03-14 | Salesforce.Com, Inc. | Sequence-to-sequence prediction using a neural network model |
US11170287B2 (en) * | 2017-10-27 | 2021-11-09 | Salesforce.Com, Inc. | Generating dual sequence inferences using a neural network model |
US10542270B2 (en) | 2017-11-15 | 2020-01-21 | Salesforce.Com, Inc. | Dense video captioning |
US11276002B2 (en) | 2017-12-20 | 2022-03-15 | Salesforce.Com, Inc. | Hybrid training of deep networks |
US11501076B2 (en) | 2018-02-09 | 2022-11-15 | Salesforce.Com, Inc. | Multitask learning as question answering |
US11227218B2 (en) | 2018-02-22 | 2022-01-18 | Salesforce.Com, Inc. | Question answering from minimal context over documents |
US10929607B2 (en) | 2018-02-22 | 2021-02-23 | Salesforce.Com, Inc. | Dialogue state tracking using a global-local encoder |
US10783875B2 (en) | 2018-03-16 | 2020-09-22 | Salesforce.Com, Inc. | Unsupervised non-parallel speech domain adaptation using a multi-discriminator adversarial network |
US11106182B2 (en) | 2018-03-16 | 2021-08-31 | Salesforce.Com, Inc. | Systems and methods for learning for domain adaptation |
US10887182B1 (en) * | 2018-05-10 | 2021-01-05 | Hrl Laboratories, Llc | System and method for pairwise network alignment |
US11600194B2 (en) | 2018-05-18 | 2023-03-07 | Salesforce.Com, Inc. | Multitask learning as question answering |
US10909157B2 (en) | 2018-05-22 | 2021-02-02 | Salesforce.Com, Inc. | Abstraction of text summarization |
US11631009B2 (en) | 2018-05-23 | 2023-04-18 | Salesforce.Com, Inc | Multi-hop knowledge graph reasoning with reward shaping |
CN108846130B (zh) * | 2018-06-29 | 2021-02-05 | 北京百度网讯科技有限公司 | 一种问题文本生成方法、装置、设备和介质 |
CN108959556A (zh) * | 2018-06-29 | 2018-12-07 | 北京百度网讯科技有限公司 | 基于神经网络的实体问答方法、装置和终端 |
KR20200023664A (ko) * | 2018-08-14 | 2020-03-06 | 삼성전자주식회사 | 응답 추론 방법 및 장치 |
US10623889B2 (en) | 2018-08-24 | 2020-04-14 | SafeGraph, Inc. | Hyper-locating places-of-interest in buildings |
US10970486B2 (en) | 2018-09-18 | 2021-04-06 | Salesforce.Com, Inc. | Using unstructured input to update heterogeneous data stores |
US11436481B2 (en) | 2018-09-18 | 2022-09-06 | Salesforce.Com, Inc. | Systems and methods for named entity recognition |
CN110569700B (zh) * | 2018-09-26 | 2020-11-03 | 创新先进技术有限公司 | 优化损伤识别结果的方法及装置 |
US11029694B2 (en) | 2018-09-27 | 2021-06-08 | Salesforce.Com, Inc. | Self-aware visual-textual co-grounded navigation agent |
US11087177B2 (en) | 2018-09-27 | 2021-08-10 | Salesforce.Com, Inc. | Prediction-correction approach to zero shot learning |
US11514915B2 (en) | 2018-09-27 | 2022-11-29 | Salesforce.Com, Inc. | Global-to-local memory pointer networks for task-oriented dialogue |
US11645509B2 (en) | 2018-09-27 | 2023-05-09 | Salesforce.Com, Inc. | Continual neural network learning via explicit structure learning |
KR20200036352A (ko) * | 2018-09-28 | 2020-04-07 | 삼성전자주식회사 | 신경망의 동작 방법과 학습 방법 및 그 신경망 |
US10963652B2 (en) | 2018-12-11 | 2021-03-30 | Salesforce.Com, Inc. | Structured text translation |
US11822897B2 (en) | 2018-12-11 | 2023-11-21 | Salesforce.Com, Inc. | Systems and methods for structured text translation with tag alignment |
US10877947B2 (en) * | 2018-12-11 | 2020-12-29 | SafeGraph, Inc. | Deduplication of metadata for places |
CN109685212B (zh) * | 2018-12-14 | 2022-12-16 | 安徽省泰岳祥升软件有限公司 | 一种机器阅读理解模型的分阶段训练方法及装置 |
US11922323B2 (en) | 2019-01-17 | 2024-03-05 | Salesforce, Inc. | Meta-reinforcement learning gradient estimation with variance reduction |
US11568306B2 (en) | 2019-02-25 | 2023-01-31 | Salesforce.Com, Inc. | Data privacy protected machine learning systems |
US11003867B2 (en) | 2019-03-04 | 2021-05-11 | Salesforce.Com, Inc. | Cross-lingual regularization for multilingual generalization |
US11366969B2 (en) | 2019-03-04 | 2022-06-21 | Salesforce.Com, Inc. | Leveraging language models for generating commonsense explanations |
US11087092B2 (en) | 2019-03-05 | 2021-08-10 | Salesforce.Com, Inc. | Agent persona grounded chit-chat generation framework |
US11580445B2 (en) | 2019-03-05 | 2023-02-14 | Salesforce.Com, Inc. | Efficient off-policy credit assignment |
CN109948700B (zh) * | 2019-03-19 | 2020-07-24 | 北京字节跳动网络技术有限公司 | 用于生成特征图的方法和装置 |
US10902289B2 (en) | 2019-03-22 | 2021-01-26 | Salesforce.Com, Inc. | Two-stage online detection of action start in untrimmed videos |
CN111858859A (zh) * | 2019-04-01 | 2020-10-30 | 北京百度网讯科技有限公司 | 自动问答处理方法、装置、计算机设备及存储介质 |
US11281863B2 (en) * | 2019-04-18 | 2022-03-22 | Salesforce.Com, Inc. | Systems and methods for unifying question answering and text classification via span extraction |
CN110175527B (zh) | 2019-04-29 | 2022-03-25 | 北京百度网讯科技有限公司 | 行人再识别方法及装置、计算机设备及可读介质 |
US11487939B2 (en) | 2019-05-15 | 2022-11-01 | Salesforce.Com, Inc. | Systems and methods for unsupervised autoregressive text compression |
US11620572B2 (en) | 2019-05-16 | 2023-04-04 | Salesforce.Com, Inc. | Solving sparse reward tasks using self-balancing shaped rewards |
US11604965B2 (en) | 2019-05-16 | 2023-03-14 | Salesforce.Com, Inc. | Private deep learning |
US11562251B2 (en) | 2019-05-16 | 2023-01-24 | Salesforce.Com, Inc. | Learning world graphs to accelerate hierarchical reinforcement learning |
US11775775B2 (en) | 2019-05-21 | 2023-10-03 | Salesforce.Com, Inc. | Systems and methods for reading comprehension for a question answering task |
US11687588B2 (en) | 2019-05-21 | 2023-06-27 | Salesforce.Com, Inc. | Weakly supervised natural language localization networks for video proposal prediction based on a text query |
US11669712B2 (en) | 2019-05-21 | 2023-06-06 | Salesforce.Com, Inc. | Robustness evaluation via natural typos |
US11657277B2 (en) * | 2019-05-23 | 2023-05-23 | Google Llc | Generating neural network outputs using insertion commands |
US11657269B2 (en) | 2019-05-23 | 2023-05-23 | Salesforce.Com, Inc. | Systems and methods for verification of discriminative models |
CN110276396B (zh) * | 2019-06-21 | 2022-12-06 | 西安电子科技大学 | 基于物体显著性和跨模态融合特征的图片描述生成方法 |
US11410667B2 (en) * | 2019-06-28 | 2022-08-09 | Ford Global Technologies, Llc | Hierarchical encoder for speech conversion system |
CN110516530A (zh) * | 2019-07-09 | 2019-11-29 | 杭州电子科技大学 | 一种基于非对齐多视图特征增强的图像描述方法 |
US11615240B2 (en) | 2019-08-15 | 2023-03-28 | Salesforce.Com, Inc | Systems and methods for a transformer network with tree-based attention for natural language processing |
CN110457710B (zh) * | 2019-08-19 | 2022-08-02 | 电子科技大学 | 一种基于动态路由机制的机器阅读理解网络模型的建立方法、方法、存储介质及终端 |
CN110633472B (zh) * | 2019-09-19 | 2021-03-12 | 电子科技大学 | 一种基于注意力与聚合机制的文章与问题的融合方法 |
US12026630B2 (en) | 2019-09-23 | 2024-07-02 | Adaptai Ltd. | Artificial intelligence methods and systems for improving user adaptability using textual communication |
US11599792B2 (en) | 2019-09-24 | 2023-03-07 | Salesforce.Com, Inc. | System and method for learning with noisy labels as semi-supervised learning |
US11568000B2 (en) | 2019-09-24 | 2023-01-31 | Salesforce.Com, Inc. | System and method for automatic task-oriented dialog system |
US11640527B2 (en) | 2019-09-25 | 2023-05-02 | Salesforce.Com, Inc. | Near-zero-cost differentially private deep learning with teacher ensembles |
CN110647354B (zh) * | 2019-09-30 | 2021-11-05 | 东软医疗系统股份有限公司 | 设备运行控制方法、装置及设备 |
US11620515B2 (en) | 2019-11-07 | 2023-04-04 | Salesforce.Com, Inc. | Multi-task knowledge distillation for language model |
US11347708B2 (en) | 2019-11-11 | 2022-05-31 | Salesforce.Com, Inc. | System and method for unsupervised density based table structure identification |
CN110827312B (zh) * | 2019-11-12 | 2023-04-28 | 北京深境智能科技有限公司 | 一种基于协同视觉注意力神经网络的学习方法 |
US11288438B2 (en) | 2019-11-15 | 2022-03-29 | Salesforce.Com, Inc. | Bi-directional spatial-temporal reasoning for video-grounded dialogues |
US11334766B2 (en) | 2019-11-15 | 2022-05-17 | Salesforce.Com, Inc. | Noise-resistant object detection with noisy annotations |
US11481636B2 (en) | 2019-11-18 | 2022-10-25 | Salesforce.Com, Inc. | Systems and methods for out-of-distribution classification |
US11922303B2 (en) | 2019-11-18 | 2024-03-05 | Salesforce, Inc. | Systems and methods for distilled BERT-based training model for text classification |
US11640505B2 (en) | 2019-12-09 | 2023-05-02 | Salesforce.Com, Inc. | Systems and methods for explicit memory tracker with coarse-to-fine reasoning in conversational machine reading |
US11487999B2 (en) | 2019-12-09 | 2022-11-01 | Salesforce.Com, Inc. | Spatial-temporal reasoning through pretrained language models for video-grounded dialogues |
US11599730B2 (en) | 2019-12-09 | 2023-03-07 | Salesforce.Com, Inc. | Learning dialogue state tracking with limited labeled data |
US11573957B2 (en) | 2019-12-09 | 2023-02-07 | Salesforce.Com, Inc. | Natural language processing engine for translating questions into executable database queries |
US11256754B2 (en) | 2019-12-09 | 2022-02-22 | Salesforce.Com, Inc. | Systems and methods for generating natural language processing training samples with inflectional perturbations |
CN111104884B (zh) * | 2019-12-10 | 2022-06-03 | 电子科技大学 | 一种基于两阶段神经网络模型的汉语唇语识别方法 |
US11669745B2 (en) | 2020-01-13 | 2023-06-06 | Salesforce.Com, Inc. | Proposal learning for semi-supervised object detection |
CN111274815B (zh) * | 2020-01-15 | 2024-04-12 | 北京百度网讯科技有限公司 | 用于挖掘文本中的实体关注点的方法和装置 |
US11562147B2 (en) | 2020-01-23 | 2023-01-24 | Salesforce.Com, Inc. | Unified vision and dialogue transformer with BERT |
US11397762B2 (en) | 2020-01-24 | 2022-07-26 | Accenture Global Solutions Limited | Automatically generating natural language responses to users' questions |
US11449556B2 (en) | 2020-02-04 | 2022-09-20 | Accenture Global Solutions Limited | Responding to user queries by context-based intelligent agents |
US20210249104A1 (en) | 2020-02-06 | 2021-08-12 | Salesforce.Com, Inc. | Systems and methods for language modeling of protein engineering |
US11461415B2 (en) * | 2020-02-06 | 2022-10-04 | Microsoft Technology Licensing, Llc | Assessing semantic similarity using a dual-encoder neural network |
CN111291188B (zh) * | 2020-02-20 | 2023-06-23 | 阿基米德(上海)传媒有限公司 | 一种智能信息抽取方法及系统 |
US11263476B2 (en) | 2020-03-19 | 2022-03-01 | Salesforce.Com, Inc. | Unsupervised representation learning with contrastive prototypes |
US11328731B2 (en) | 2020-04-08 | 2022-05-10 | Salesforce.Com, Inc. | Phone-based sub-word units for end-to-end speech recognition |
CN111428055B (zh) * | 2020-04-20 | 2023-11-10 | 神思电子技术股份有限公司 | 一种面向行业的上下文省略问答方法 |
US20210334756A1 (en) * | 2020-04-24 | 2021-10-28 | N3, Llc | Agnostic crm augmentation with a display screen |
US11625543B2 (en) | 2020-05-31 | 2023-04-11 | Salesforce.Com, Inc. | Systems and methods for composed variational natural language generation |
US11720559B2 (en) | 2020-06-02 | 2023-08-08 | Salesforce.Com, Inc. | Bridging textual and tabular data for cross domain text-to-query language semantic parsing with a pre-trained transformer language encoder and anchor text |
US11526756B1 (en) | 2020-06-24 | 2022-12-13 | Amazon Technologies, Inc. | Artificial intelligence system with composite models for multiple response-string queries |
CN111797219B (zh) * | 2020-07-07 | 2023-11-24 | 苏州大学 | 使用多通道融合模型处理答案的神经问题生成方法及系统 |
US20220050877A1 (en) | 2020-08-14 | 2022-02-17 | Salesforce.Com, Inc. | Systems and methods for query autocompletion |
US11934952B2 (en) | 2020-08-21 | 2024-03-19 | Salesforce, Inc. | Systems and methods for natural language processing using joint energy-based models |
US11934781B2 (en) | 2020-08-28 | 2024-03-19 | Salesforce, Inc. | Systems and methods for controllable text summarization |
CN112084782B (zh) * | 2020-09-14 | 2024-05-03 | 成都数联铭品科技有限公司 | 一种基于能量增强的注意力网络的答案识别方法及系统 |
US11762914B2 (en) | 2020-10-06 | 2023-09-19 | SafeGraph, Inc. | Systems and methods for matching multi-part place identifiers |
US11899696B2 (en) | 2020-10-06 | 2024-02-13 | SafeGraph, Inc. | Systems and methods for generating multi-part place identifiers |
US11995111B2 (en) * | 2020-11-13 | 2024-05-28 | Tencent America LLC | Efficient and compact text matching system for sentence pairs |
US11829442B2 (en) | 2020-11-16 | 2023-11-28 | Salesforce.Com, Inc. | Methods and systems for efficient batch active learning of a deep neural network |
CN112417126B (zh) * | 2020-12-02 | 2024-01-23 | 车智互联(北京)科技有限公司 | 一种问答方法、计算设备以及存储介质 |
CN112948563A (zh) * | 2021-04-13 | 2021-06-11 | 天津禄智技术有限公司 | 文本搜索方法及其系统 |
US20230289836A1 (en) * | 2022-03-11 | 2023-09-14 | Tredence Inc. | Multi-channel feedback analytics for presentation generation |
CN114996401A (zh) * | 2022-05-31 | 2022-09-02 | 福州大学 | 一种基于双重匹配的观点型机器阅读理解方法及系统 |
US20240126791A1 (en) * | 2022-10-14 | 2024-04-18 | Tata Consultancy Services Limited | Method and system for long-form answer extraction based on combination of sentence index generation techniques |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8204751B1 (en) * | 2006-03-03 | 2012-06-19 | At&T Intellectual Property Ii, L.P. | Relevance recognition for a human machine dialog system contextual question answering based on a normalization of the length of the user input |
US7983898B2 (en) * | 2007-06-08 | 2011-07-19 | Microsoft Corporation | Generating a phrase translation model by iteratively estimating phrase translation probabilities |
US10783900B2 (en) * | 2014-10-03 | 2020-09-22 | Google Llc | Convolutional, long short-term memory, fully connected deep neural networks |
US20160350653A1 (en) | 2015-06-01 | 2016-12-01 | Salesforce.Com, Inc. | Dynamic Memory Network |
US11113598B2 (en) | 2015-06-01 | 2021-09-07 | Salesforce.Com, Inc. | Dynamic memory network |
US20170032280A1 (en) | 2015-07-27 | 2017-02-02 | Salesforce.Com, Inc. | Engagement estimator |
US10282663B2 (en) | 2015-08-15 | 2019-05-07 | Salesforce.Com, Inc. | Three-dimensional (3D) convolution with 3D batch normalization |
US10664744B2 (en) * | 2015-10-13 | 2020-05-26 | Facebook, Inc. | End-to-end memory networks |
US10628734B2 (en) * | 2016-04-14 | 2020-04-21 | International Business Machines Corporation | Efficient determination of optimized learning settings of neural networks |
CN105956011B (zh) * | 2016-04-21 | 2020-01-21 | 百度在线网络技术(北京)有限公司 | 搜索方法及装置 |
US11449744B2 (en) * | 2016-06-23 | 2022-09-20 | Microsoft Technology Licensing, Llc | End-to-end memory networks for contextual language understanding |
US11087199B2 (en) * | 2016-11-03 | 2021-08-10 | Nec Corporation | Context-aware attention-based neural network for interactive question answering |
US10346721B2 (en) | 2017-11-01 | 2019-07-09 | Salesforce.Com, Inc. | Training a neural network using augmented training datasets |
-
2017
- 2017-01-31 US US15/421,193 patent/US10963782B2/en active Active
- 2017-11-03 WO PCT/US2017/060026 patent/WO2018085710A1/en unknown
- 2017-11-03 JP JP2019522932A patent/JP6873236B2/ja active Active
- 2017-11-03 CA CA3038812A patent/CA3038812C/en active Active
- 2017-11-03 EP EP17808240.0A patent/EP3535706A1/en not_active Ceased
- 2017-11-03 CN CN201780068572.5A patent/CN109906460B/zh active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2022003762A1 (ja) * | 2020-06-29 | 2022-01-06 | ||
WO2022003762A1 (ja) * | 2020-06-29 | 2022-01-06 | 日本電信電話株式会社 | 質問応答装置、質問応答方法及び質問応答プログラム |
JP7468654B2 (ja) | 2020-06-29 | 2024-04-16 | 日本電信電話株式会社 | 質問応答装置、質問応答方法及び質問応答プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN109906460A (zh) | 2019-06-18 |
US20180129938A1 (en) | 2018-05-10 |
CA3038812A1 (en) | 2018-05-11 |
US10963782B2 (en) | 2021-03-30 |
EP3535706A1 (en) | 2019-09-11 |
WO2018085710A1 (en) | 2018-05-11 |
JP6873236B2 (ja) | 2021-05-19 |
CN109906460B (zh) | 2023-09-19 |
CA3038812C (en) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6873236B2 (ja) | 質問応答のための動的相互注目ネットワーク | |
JP6972265B2 (ja) | ポインタセンチネル混合アーキテクチャ | |
US11244111B2 (en) | Adaptive attention model for image captioning | |
CN109952580B (zh) | 基于准循环神经网络的编码器-解码器模型 | |
JP6976324B2 (ja) | 逐次正則化を用いた同時多タスクニューラルネットワークモデルのトレーニング | |
WO2018094295A1 (en) | Adaptive attention model for image captioning | |
US20200104681A1 (en) | Neural Networks with Area Attention | |
AU2022281121B2 (en) | Generating neural network outputs by cross attention of query embeddings over a set of latent embeddings | |
US20240232580A1 (en) | Generating neural network outputs by cross attention of query embeddings over a set of latent embeddings | |
WO2024110596A1 (en) | Score interpolation diffusion models | |
Hein | Social Distancing AI: Using super-resolution to train an object detection model on low resolution images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200908 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6873236 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |