JP2022548053A - 解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成 - Google Patents
解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成 Download PDFInfo
- Publication number
- JP2022548053A JP2022548053A JP2022516147A JP2022516147A JP2022548053A JP 2022548053 A JP2022548053 A JP 2022548053A JP 2022516147 A JP2022516147 A JP 2022516147A JP 2022516147 A JP2022516147 A JP 2022516147A JP 2022548053 A JP2022548053 A JP 2022548053A
- Authority
- JP
- Japan
- Prior art keywords
- question
- hop
- follow
- neural network
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000013528 artificial neural network Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 7
- 230000004044 response Effects 0.000 abstract description 4
- 230000015654 memory Effects 0.000 description 18
- 238000012549 training Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000013500 data storage Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 235000008694 Humulus lupulus Nutrition 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ実装方法が提供される。本方法は、入力マルチホップブリッジタイプの質問の前提事項を検索するステップ(310)を含む。本方法は、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップ(320)をさらに含む。本方法は、また最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップ(330)を含む。さらに、本方法は、ニューラルネットワークによって、中間情報を含む分類に対応して、フォローアップ質問に関して検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、フォローアップ質問を生成するステップ(350)を含む。【選択図】図3
Description
この出願は、2019年12月6日に出願された米国仮特許出願第62/944,383号及び2020年12月2日に出願された米国特許出願第17/109,781号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、質問及び回答システムに関し、より詳細には解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成に関する。
最新の質問回答(QA:Question Answering)技術は、(キーワードベースの)情報検索(IR:Information Retrieval)とニューラルネットワークベースのテキスト抽出との組み合わせに依存する。IRシステムは、回答に含み得る多数の候補文(証拠として知られる)を検索し、テキスト抽出システムは該証拠における回答テキストを特定する。しかしながら、複雑(いわゆる「マルチホップ」)な質問に関しては、オリジナルの質問が、回答を含む証拠の検索に必要なキーワードを含んでおらず、IR段階における簡単なQAを失敗させる。問題は、質問と部分的な証拠が与えられたフォローアップクエリの作成を含む、解釈可能な手法でこれらの質問に答えることである。
本発明の態様によれば、マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ実装方法が提供される。本方法は、入力マルチホップブリッジタイプの質問の前提事項を検索するステップを含む。本方法は、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップをさらに含む。本方法は、また最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップを含む。本方法は、さらに、ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップを含む。
本発明の他の態様によれば、マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータプログラム製品が提供される。コンピュータプログラム製品は、プログラム命令が実装された非一時的にコンピュータで読み取り可能な記憶媒体を有する。プログラム命令は、コンピュータに本方法を実行させるためにコンピュータによって実行可能である。本方法は、入力マルチホップブリッジタイプの質問の前提事項を検索するステップを含む。本方法は、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップをさらに含む。本方法は、また最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップを含む。本方法は、さらに、ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップを含む。
本発明のさらに他の態様によれば、マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ処理システムが提供される。本コンピュータ処理システムは、プログラムコードを保存するためのメモリ装置を含む。本コンピュータ処理システムは、入力マルチホップブリッジタイプの質問の前提事項を検索するためのプログラムコードを実行する、メモリ装置に動作可能に接続されたプロセッサ装置をさらに含む。本プロセッサ装置は、さらにプログラムコードを実行することで、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップを実行する。本プロセッサ装置は、また最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップを実行する。さらに、本プロセッサ装置は、ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、フォローアップ質問を生成するステップを実行する。
これら及び他の特徴並びに利点は、以下の典型的な実施形態の詳細な説明を添付の図面と併せて読むことで明らかになるであろう。
本開示では、後述するように、以下の図面を参照しながら好ましい実施形態について詳細に説明する。
本発明の実施形態は、解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問を生成することを対象とする。
本発明の実施形態は、質問に対する回答を決定可能であり、フォローアップ質問に回答するだけでなく、フォローアップ質問をさらに生成できる。このようにして、所定のテーマに関するさらなる知識が与えられる。
図1は、本発明の一実施形態による、例示的なコンピューティングデバイス100を示すブロック図である。コンピューティングデバイス100は、解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問を生成するように構成される。
コンピューティングデバイス100は、限定されるものではないが、コンピュータ、サーバ、ラックベースのサーバ、ブレードサーバ、ワークステーション、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、モバイルコンピューティングデバイス、ウェアラブルコンピューティングデバイス、ネットワークアプライアンス、webアプライアンス、分散コンピューティングシステム、プロセッサベースのシステム及び/または消費者の電子装置を含む、本明細書に記載する機能を実行できる任意のタイプの計算またはコンピュータデバイスで実現できる。さらに、または代替として、コンピューティングデバイス100は、物理的に分離されたコンピューティングデバイスの1つまたは複数のコンピューティングスレッド、メモリスレッド、または他のラック、スレッド、コンピューティングシャーシ、または他の構成要素で実現できる。図1で示すように、コンピューティングデバイス100は、例示的に、プロセッサ110、入出力サブシステム120、メモリ130、データ記憶装置140、通信サブシステム150、及び/またはサーバまたは同様のコンピューティングデバイスに一般的に見られる他の構成要素及び装置を含む。もちろん、他の実施形態において、コンピューティングデバイス100は、サーバコンピュータ(例えば、様々な入力/出力デバイス)に一般に見られるような他のまたは追加の構成要素を含むことができる。さらに、いくつかの実施形態において、例示的な構成要素のうちの1つまたは複数は別の構成要素に組み込まれていてもよく、または別の方法で別の構成要素の一部を形成してもよい。例えば、いくつかの実施形態において、メモリ130またはその一部をプロセッサ110に組み込むことができる。
プロセッサ110は、本明細書に記載する機能を実行できる任意のタイプのプロセッサで実現できる。プロセッサ110は、単一プロセッサ、マルチプロセッサ、中央処理装置(CPU)、グラフィックス処理装置(GPU)、単一またはマルチコアプロセッサ、デジタルシグナルプロセッサ、マイクロコントローラ、または他のプロセッサあるいは処理/制御回路として実現してもよい。
メモリ130は、本明細書で説明する機能を実行できる任意のタイプの揮発性または不揮発性メモリまたはデータ記憶装置で実現できる。動作中において、メモリ130は、オペレーティングシステム、アプリケーション、プログラム、ライブラリ、ドライバ等、コンピューティングデバイス100の動作中に使用される様々なデータ及びソフトウェアを記憶できる。メモリ130は、I/Oサブシステム120を介してプロセッサ110と通信可能に接続され、これはプロセッサ110、メモリ130及びコンピューティングデバイス100の他の構成要素との入出力操作を容易にするための回路及び/または構成要素で実現できる。例えば、I/Oサブシステム120は、メモリコントローラハブ、入力/出力制御ハブ、プラットフォームコントローラハブ、集積制御回路、ファームウェア装置、通信リンク(例えば、ポイントツーポイントリンク、バスリンク、ワイヤ、ケーブル、光ガイド、プリント回路基板トレース等)、及び/または入力/出力動作を容易にするための他の構成要素及びサブシステムで実現してもよく、さもなければ、それらを含んでいてもよい。いくつかの実施形態において、I/Oサブシステム120がシステムオンチップ(SOC)の一部を形成し、プロセッサ110、メモリ130及びコンピューティングデバイス100の他の構成要素とともに、単一の集積回路チップに組み込まれていてもよい。
データ記憶装置140は、例えば、メモリ装置及び回路、メモリカード、ハードディスクドライブ、ソリッドステートドライブ、または他のデータ記憶装置等の、データを短期または長期に記憶するために構成された任意のタイプの装置または複数の装置で実現できる。データ記憶装置140は、解釈可能な再帰型マルチホップ質問回答(QA)のためのフォローアップ質問生成器のためのプログラムコードを記憶できる。コンピューティングデバイス100の通信サブシステム150は、ネットワークを介してコンピューティングデバイス100と他のリモート装置との通信を可能にする、任意のネットワークインタフェースコントローラまたは他の通信回路、装置またはそれらの集合で実現できる。通信サブシステム150は、任意の1つ以上の通信技術(例えば、有線または無線通信)及び関連するプロトコル(例えば、イーサネット(商標登録)、InfiniBand(登録商標)、Bluetooth(登録商標)、Wi-Fi(登録商標)、WiMAX(登録商標)等)を利用して通信するように構成されていてもよい。
図示のように、コンピューティングデバイス100は、1つまたは複数の周辺デバイス160を含んでいてもよい。周辺デバイス160は、任意の数の追加の入力/出力デバイス、インターフェースデバイス及び/または他の周辺デバイスを含んでいてもよい。例えば、いくつかの実施形態において、周辺デバイス160は、ディスプレイ、タッチスクリーン、グラフィック回路、キーボード、マウス、スピーカシステム、マイクロフォン、ネットワークインタフェース、及び/または他の入力/出力デバイス、インターフェースデバイス、及び/または周辺デバイスを含むことができる。
もちろん、コンピューティングデバイス100は、当業者であれば容易に思いつくような他の要素(不図示)を含んでいてもよく、特定の要素を省略してもよい。例えば、当業者であれば容易に理解できるが、コンピューティングデバイス100には、その詳細な実装に応じて他の様々な入力装置及び/または出力装置を含むことができる。例えば、無線及び/または有線による種々の入力装置及び/または出力装置を使用できる。さらに、当業者であれば容易に理解できるが、様々な構成において追加のプロセッサ、コントローラ、メモリ等を用いることも可能である。コンピューティングデバイス100の上記及び他の変形例は、本明細書で提供される本原理の教示によって当業者であれば容易に考えられるであろう。
本明細書で用いる「ハードウェアプロセッササブシステム」または「ハードウェアプロセッサ」という用語は、1つ以上の特定のタスクを実行するために協働するプロセッサ、メモリ(RAM、キャッシュ等を含む)、ソフトウェア(メモリ管理ソフトウェアを含む)またはそれらの組み合わせを指すことができる。有用な実施形態において、ハードウェアプロセッササブシステムは、1つまたは複数のデータ処理要素(例えば、論理回路、処理回路、命令実行デバイス等)を含むことができる。1つまたは複数のデータ処理要素は、中央処理装置、グラフィックス処理装置及び/または個別のプロセッサまたはコンピューティング要素ベースのコントローラ(例えば、論理ゲート等)を含めることができる。ハードウェアプロセッササブシステムは、1つ以上のオンボードメモリ(例えば、キャッシュ、専用メモリアレイ、読み出し専用メモリ等)を含むことができる。いくつかの実施形態において、ハードウェアプロセッササブシステムは、オンボードまたはオフボードとすることができる、またはハードウェアプロセッササブシステム(例えば、ROM、RAM、基本入出力システム(BIOS)等)で用いるための専用の1つ以上のメモリを含むことができる。
いくつかの実施形態において、ハードウェアプロセッササブシステムは1つ以上のソフトウェア要素を含むことが可能であり、実行できる。1つ以上のソフトウェア要素は、特定の結果を達成するために、オペレーティングシステム及び/または1つ以上のアプリケーション及び/または特定のコードを含むことができる。
他の実施形態において、ハードウェアプロセッササブシステムは、指定された結果を達成するために1つまたは複数の電子処理機能を実行する専用の回路を含むことができる。このような回路は、1つまたは複数の特定用途向け集積回路(ASIC)、FPGA及び/またはPLAを含んでいてもよい。
ハードウェアプロセッササブシステムのこれら及び他の変形例もまた、本発明の実施形態に従って企図される。
次に、本発明の一実施形態による、本発明を適用可能な質問の種類について説明する。
本発明は、ブリッジタイプの質問に利用できる。ブリッジタイプの質問は、オリジナルの質問のみに存在する用語に基づいた全ての必要な事実を検索できないようなものである。むしろ、部分的な情報が最初に検索され、追加のクエリを策定するために使用されなければならない。
本発明は、オリジナルの質問の用語で指定されていない新しい情報を発見するという課題に対処するように設計されている。最高レベルにおいて、比較タイプの質問は、比較対象であるそれぞれの量(quantity)がオリジナルの質問の一部によって指定されるため、この課題を提起しない。また、比較は、サブ質問に対する回答を検索した後に適用しなければならないため、ブリッジ質問とは異なるセマンティックを提示する。したがって、ここではブリッジタイプの質問に焦点を当てる。
図2は、本発明の一実施形態による、マルチホップブリッジタイプの質問200に回答するためのパイプラインを示すブロック図である。
パイプライン200は、前提検索器210と、三方向ニューラルネットワークベースのコントローラ(以下、互換可能な「コントローラ」または「Cont」と称す)220と、回答抽出器(以下、互換可能な「単一ホップ(SingleHop)」と称す)230と、フォローアップ質問生成器(以下、互換可能な「フォローアップ(Followup)」と称す)240とを含む。
部分的な情報が得られると、オリジナルの質問は、各ホップで生成される、より単純な質問に繰り返し縮小される。入力質問またはサブ質問が与えられると、サブ質問に回答できる可能性がある前提事項が前提検索器210から取得される。それぞれの可能性がある前提事項は、三方向ニューラルネットワークベースのコントローラ220によって、最終回答を含む、または中間情報を含む、無関係として質問に対して分類される。最終回答を含む前提事項の場合、該回答は、抽出器の単一ホップに回答する単一ホップ質問で抽出される。中間情報を含む前提事項の場合、質問生成器がフォローアップ質問を生成し、本プロセスはこの新しい質問に関して繰り返される。本発明の焦点は、この質問発生器である。そのために、コントローラによって生成され得る複数の推論パスを管理するために、様々な戦略を利用できる。
本発明の方法は、任意の数のホップを有するブリッジ質問に適用されるが、簡略化のために、本発明の1つまたは複数の例示的な実施形態は、2ホップ問題及びフォローアップ質問生成器の訓練を対象とする。
を回答A及びゴールドサポート前提事項
を含む質問とし、
ではなく
に回答が含まれているとする。フォローアップ生成器240のタスクは、
を用いて下記のようなフォローアップ質問
を生成する。
及び
パイプラインの1つの解釈不能な実装は、フォローアップ240が「フォローアップ質問」としてP1と結合された
を単に出力することである。単一ホップ230は、実際にはP2と共に単一の質問の形態を取らない入力を操作して最終回答を決定する。それから、単一ホップ230は、マルチホップ推論を行うことになる。このような自明性を回避するために、単一ホップ230は最初に単一ホップ回答抽出器として訓練され、続いてフォローアップ240及びContが訓練されている間は機能が停止される。
次に、本発明の一実施形態による方法についてさらに説明する。
理想的には、フォローアップ240は、式(1)、(2)及び(3)をきっかけとするクロスエントロピー損失を用いて単一ホップ230及びContが固定されて訓練され得るが、復号された出力
はフォローアップパラメータに関して弁別可能ではない。代わりに、フォローアップ240は、弱くラベル付けされたグラウンドトゥルースフォローアップ質問のセットに対してトークンベースの損失で訓練される。
弱くラベル付けされたグラウンドトゥルースフォローアップは、ニューラル質問生成(QG)ネットワークを用いて取得される。コンテキスト
及び回答
が与えられると、QGはそれを生成した可能性が高いと思われる質問
を見出すタスクである。逆の場合(回答及びコンテキストから質問を予測する)で使用される単一ホップ質問回答データセットは、QGモデルを訓練するために使用される。我々の訓練セットに
を適用すると、弱いグラウンドトゥルースフォローアップ
が得られる。
我々は、
及びP1を用いてポインタ生成器ネットワークで
を予測するフォローアップ質問生成器(Followup)240の例を挙げて説明する。それは、そのデコーダが固定語彙から単語を生成することと、入力から単語をコピーすることとを繰り返し選択する、シーケンストゥシーケンスモデルである。典型的には、ポインタ生成器ネットワークは生成型要約(abstractive summarization)のために使用される。出力は、ここでは異なる役割を果たすが、それらのコピー機構はオリジナルの質問及び前提事項の情報を用いるフォローアップを構築する際に有用である。
我々は、全てのPのためのグラウンドトゥルーストリプル
及び
に関するCont220を三値分類のためのクロスエントロピー損失で訓練する。一つの実装において、Cont220は複数の自己注意層(self-attention layer)を含むニューラルネットワークによって実現される。
このようにして、Cont220は、前提事項が質問に答えるのに十分な、または必要な情報をいつ有するかを予測することを学習する。
図3は、本発明の一実施形態による、解釈可能な再帰型マルチホップ質問回答に関するフォローアップ質問を生成するための例示的な適用方法300を示すフロー図である。
ブロック310において、入力マルチホップブリッジタイプの質問の前提事項を検索する。
ブロック320において、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てる。
ブロック330において、「最終回答を含む」分類に応答してマルチホップブリッジタイプの質問の第1のホップに関する最終回答を出力する。
ブロック340において、(ブロック330における)最終回答に基づいて(例えば、シャットオフされるべき装置で起こり得る故障を示す回答の場合はシャットオフする等の機能を実行するために)ハードウェアオブジェクトを制御する。例えば、質問は識別のためのものであり、ユーザが識別されると、その時点で、アクセス制御を、施設、コンピュータまたは他のハードウェア装置に与えることができる。一実施形態において、ブロック340は、例えば、オブジェクトを第1の状態から該第1の状態とは異なる第2の状態に変換することを含むことができる。当業者であれば容易に理解するように、異なる状態には動作状態または他の状態を含むことができる。
ブロック350において、ニューラルネットワークによって、中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、フォローアップ質問を生成する。
図4及び5は、本発明の一実施形態による、解釈可能な再帰型マルチホップ質問回答に関するフォローアップ質問を生成するための例示的な訓練方法400を示すフロー図である。
ブロック410において、質問、単一テキストコンテキスト及びコンテキストの部分文字列である回答を含む単一ホップ訓練セットと、質問、それぞれホップと呼ばれるテキストコンテキストのペア及び第2のホップの部分文字列である回答を含むマルチホップ訓練セットとを収集する。
ブロック420において、与えられた質問及びコンテキストの回答を予測するために、単一ホップ訓練セットに関する単一ホップ質問に回答するためのニューラルネットワークを訓練する。
ブロック430において、与えられた質問及びコンテキストの回答を予測するために、単一ホップ訓練セットに関する質問生成のためのニューラルネットワークを訓練する。
ブロック440において、ブロック430の質問生成のためのニューラルネットワークを、マルチホップ訓練セットにおける第2のホップの回答及びコンテキストに適用して、弱いグラウンドトゥルースフォローアップ質問を取得する。
ブロック450において、マルチホップ訓練セットにおける第1のホップのオリジナルの質問及びコンテキストが与えられると、ブロック440の弱いグラウンドトゥルースフォローアップ質問を出力するようにポインタ生成器ネットワークを訓練する。
ブロック460において、マルチホップ訓練セットからのコンテキスト及び質問を含むペアを分類し、ブロック420の単一ホップネットワークが訓練セットにおける回答と重複する文字列を出力する場合、質問及び第2のホップのコンテキストに関する「最終回答を含む」出力を生成し、質問及び第1のホップのコンテキストに関する「中間」の出力を生成し、質問及び訓練セットからサンプリングされた任意の他のコンテキストに関する「無関係」の出力を生成するように、三方向ニューラルネットワークベースのコントローラを訓練する。
ブロック470において、ブロック420、450及び460のニューラルネットワークを出力する。これらのニューラルネットワークは、図3で示すように、質問回答を解決するために使用できる。
図6は、本発明の一実施形態による、本発明を適用できる例示的な教育環境600を示すブロック図である。
環境は、一組のクライアントコンピュータ610とサーバ620とを含む。クライアントコンピュータ610は、スマートフォン、タブレット、ラップトップ、デスクトップ等のいずれでもよい。
環境600のエンティティ間の通信は、1つまたは複数のネットワーク630を介して実行できる。例示のために、無線ネットワーク630が示されている。他の実施形態において、エンティティ間の通信を容易にするために、有線、無線及び/またはそれらの組合せのいずれを使用してもよい。
クライアントコンピュータ610は、これらの質問に対する回答及び教育環境におけるさらなる学習のためのフォローアップ質問を得るために、質問を提出する。このようにして、最初の質問に関連する所定のテーマに関して学生の知識をさらに深めるために回答される追加の新しい質問を学生に提供できる。
図7は、本発明の一実施形態による、例示的なコンピューティング環境600を示すブロック図である。
環境700は、サーバ710と、複数のクライアント装置(図中の符号720でまとめて示す)と、被制御システムA741と、被制御システムB742とを含む。
環境700のエンティティ間の通信は、1つまたは複数のネットワーク730を介して実行できる。例示のため、無線ネットワーク730が示されている。他の実施形態において、エンティティ間の通信を容易にするために、有線、無線及び/またはそれらの組合せのいずれかを使用できる。
サーバ710は、クライアント装置720からのシーケンシャルデータ入力を受信する。サーバ710は、サーバ710に保存された解きほぐし(disentanglement)モデルから生成された予測に基づいて、被制御システム741及び/または742の1つを制御できる。一実施形態において、シーケンシャルデータ入力は時系列データに関連していてもよく、時系列データは、被制御システム741及び/または742に関連する、例えばセンサデータ等であるが、これに限定されない。制御は、差し迫った故障要素をオフにすること、故障した構成要素を別の動作する構成要素に交換すること、安全なネットワークに切り替えること等がある。
本明細書では本発明の「一実施形態」または「実施形態」、並びにその他の変形形態に言及し、実施形態に関連して説明した特定の機能、構成、特徴等が、本発明の少なくとも1つの実施形態に含まれることを意味する。したがって、「一実施形態において」または「実施形態において」という語句の出現、並びに本明細書全体を通して様々な場所に出現する任意の他の変形形態は、必ずしも全てが同じ実施形態を参照しているわけではない。しかしながら、本明細書で提供される本発明の教示を前提として、1つまたは複数の実施形態の特徴を組み合わせることができることを理解されたい。
例えば、「A/B」、「A及び/またはB」、並びに「A及びBのうちの少なくとも1つ」の場合における「/」、「及び/または」、並びに「うちの少なくとも1つ」のうちのいずれかの使用は、第1に挙げた選択肢(A)のみの選択、第2に挙げた選択肢(B)のみの選択、または両方の選択肢(A及びB)の選択を含むことを意図したものと理解すべきである。さらに例を挙げれば、「A、B及び/またはC」、並びに「A、B及びCのうちの少なくとも1つ」の場合、このような表現法は、第1に挙げた選択肢(A)のみの選択、第2に挙げた選択肢(B)のみの選択、第3に挙げた選択肢(C)のみの選択、第1及び第2に挙げた選択肢(A及びB)のみの選択、第1及び第3に挙げた選択肢(A及びC)のみの選択、第2及び第3に挙げた選択肢(B及びC)のみの選択、または3つの選択肢全て(A及びB及びC)の選択を含むことを意図したものである。上述した例は、当業者に容易に明らかとなるように、列挙される多数の項目に応じて拡大適用される。
上記は、あらゆる観点において説明的(illustrative)かつ典型的(exemplary)であって限定的でないものと理解されるべきであり、本明細書で開示する本発明の範囲は、詳細な説明から決定されるべきではなく、特許法で認められた最大限の広さに基づいて解釈される特許請求の範囲から決定されるべきである。本明細書中に図示及び記載されている実施形態は、本発明の原理を説明するものにすぎず、本発明の範囲及び主旨から逸脱することなく当業者は様々な変更を実施することができることを理解されたい。当業者は、本発明の範囲及び精神から逸脱することなく、様々な他の特徴の組み合わせを実施できる。以上、本発明の態様について、特許法で要求される細部及び詳細な事項と共に説明したが、特許証で保護されることを要求する特許請求の範囲は、添付の特許請求の範囲に示されている。
Claims (20)
- マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ実装方法であって、
入力マルチホップブリッジタイプの質問の前提事項を検索するステップ(310)と、
前記入力マルチホップブリッジタイプの質問に対する前記前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップ(320)と、
前記最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップ(330)と、
ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、前記割り当てるステップ、前記出力するステップ及び前記生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップ(350)と、
を有するコンピュータ実装方法。 - 前記入力マルチホップブリッジタイプの質問に関する別の前提事項を検索し、前記分類が無関係であることに対応して、前記割り当てるステップ、出力するステップ及び生成するステップを繰り返すステップをさらに有する、請求項1に記載のコンピュータ実装方法。
- 前記割り当てるステップのニューラルネットワークは、三値分類のための1つ以上のクロスエントロピー損失を用いて訓練される、請求項1に記載のコンピュータ実装方法。
- 前記生成するステップは、前記入力マルチホップブリッジタイプの質問と、前記入力マルチホップブリッジタイプの質問のための前記検索された前提事項とに基づいて、前記フォローアップ質問を生成する、請求項1に記載のコンピュータ実装方法。
- 前記生成するステップのニューラルネットワークは、固定語彙から単語を生成する、または前記入力マルチホップブリッジタイプの質問から単語をコピーするように構成されたデコーダを備えるシーケンストゥシーケンスモデルを有する、請求項1に記載のコンピュータ実装方法。
- 前記割り当てるステップは、1つまたは複数の自己注意層を含むニューラルネットワークを有する、請求項1に記載のコンピュータ実装方法。
- 前記出力するステップは、単一ホップ質問回答のために訓練されたニューラルネットワークによって実行される、請求項1に記載のコンピュータ実装方法。
- 前記入力マルチホップブリッジタイプの質問及び前記フォローアップ質問は自然テキストである、請求項1に記載のコンピュータ実装方法。
- 前記最終回答に基づく機能を実行するようにハードウェアオブジェクトを制御するステップをさらに有する、請求項1に記載のコンピュータ実装方法。
- マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、プログラム命令が実装された非一時的にコンピュータで読み取り可能な記憶媒体を有し、前記プログラム命令がコンピュータによって実行可能であり、
入力マルチホップブリッジタイプの質問の前提事項を検索するステップ(310)と、
前記入力マルチホップブリッジタイプの質問に対する前記前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップ(320)と、
前記最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップ(330)と、
ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、前記割り当てるステップ、前記出力するステップ及び前記生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップ(350)と、
を有する方法を前記コンピュータに実行させるための、コンピュータプログラム製品。 - 前記入力マルチホップブリッジタイプの質問に関する別の前提事項を検索し、前記分類が無関係であることに対応して、前記割り当てるステップ、出力するステップ及び生成するステップを繰り返すステップをさらに有する、請求項10に記載のコンピュータプログラム製品。
- 前記割り当てるステップのニューラルネットワークは、三値分類のための1つ以上のクロスエントロピー損失を用いて訓練される、請求項10に記載のコンピュータプログラム製品。
- 前記生成するステップは、前記入力マルチホップブリッジタイプの質問と、前記入力マルチホップブリッジタイプの質問のための前記検索された前提事項とに基づいて、前記フォローアップ質問を生成する、請求項10に記載のコンピュータプログラム製品。
- 前記生成するステップのニューラルネットワークは、固定語彙から単語を生成する、または前記入力マルチホップブリッジタイプの質問から単語をコピーするように構成されたデコーダを備えるシーケンストゥシーケンスモデルを有する、請求項10に記載のコンピュータプログラム製品。
- 前記割り当てるステップは、1つまたは複数の自己注意層を含むニューラルネットワークを有する、請求項10に記載のコンピュータプログラム製品。
- 前記出力するステップは、単一ホップ質問回答のために訓練されたニューラルネットワークによって実行される、請求項10に記載のコンピュータプログラム製品。
- 前記入力マルチホップブリッジタイプの質問及び前記フォローアップ質問は自然テキストである、請求項10に記載のコンピュータプログラム製品。
- 前記最終回答に基づく機能を実行するようにハードウェアオブジェクトを制御するステップをさらに有する、請求項10に記載のコンピュータプログラム製品。
- マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ処理システムであって、
プログラムコードを保存するためのメモリ装置(140)と、
入力マルチホップブリッジタイプの質問の前提事項を検索するステップと、
前記入力マルチホップブリッジタイプの質問に対する前記前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当るステップと、
前記最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップと、
ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、前記割り当てるステップ、前記出力するステップ及び前記生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップと、
を有するように前記プログラムコードを実行する、前記メモリ装置と動作可能に接続されたプロセッサ装置(110)と、
を有する、コンピュータ処理システム。 - 前記割り当てるステップのニューラルネットワークは、三値分類のための1つ以上のクロスエントロピー損失を用いて訓練される、請求項19に記載のコンピュータ処理システム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962944383P | 2019-12-06 | 2019-12-06 | |
US62/944,383 | 2019-12-06 | ||
US17/109,781 | 2020-12-02 | ||
US17/109,781 US20210173837A1 (en) | 2019-12-06 | 2020-12-02 | Generating followup questions for interpretable recursive multi-hop question answering |
PCT/US2020/063045 WO2021113467A1 (en) | 2019-12-06 | 2020-12-03 | Generating followup questions for interpretable recursive multi-hop question answering |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022548053A true JP2022548053A (ja) | 2022-11-16 |
Family
ID=76208999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022516147A Pending JP2022548053A (ja) | 2019-12-06 | 2020-12-03 | 解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210173837A1 (ja) |
JP (1) | JP2022548053A (ja) |
WO (1) | WO2021113467A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114780707B (zh) * | 2022-06-21 | 2022-11-22 | 浙江浙里信征信有限公司 | 基于多跳推理联合优化的多跳问题回答方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090055164A1 (en) * | 2007-08-24 | 2009-02-26 | Robert Bosch Gmbh | Method and System of Optimal Selection Strategy for Statistical Classifications in Dialog Systems |
US20150363697A1 (en) * | 2010-10-11 | 2015-12-17 | Next It Corporation | System and method for providing distributed intelligent assistance |
US10157203B2 (en) * | 2016-03-15 | 2018-12-18 | International Business Machines Corporation | Question transformation in question answer systems |
JP2019003319A (ja) * | 2017-06-13 | 2019-01-10 | 株式会社野村総合研究所 | 対話型業務支援システムおよび対話型業務支援プログラム |
WO2019202788A1 (ja) * | 2018-04-16 | 2019-10-24 | 株式会社Nttドコモ | 対話システム |
JP2019207648A (ja) * | 2018-05-30 | 2019-12-05 | 株式会社野村総合研究所 | 対話型業務支援システム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR200334515Y1 (ko) * | 2003-08-18 | 2003-11-28 | 황윤규 | 복합 센서가 일체로 구비된 절전형 자동 점멸 램프 |
US10276170B2 (en) * | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US9082310B2 (en) * | 2010-02-10 | 2015-07-14 | Mmodal Ip Llc | Providing computable guidance to relevant evidence in question-answering systems |
US9582757B1 (en) * | 2014-07-25 | 2017-02-28 | Amazon Technologies, Inc. | Scalable curation system |
US9940367B1 (en) * | 2014-08-13 | 2018-04-10 | Google Llc | Scoring candidate answer passages |
US9818062B2 (en) * | 2015-02-19 | 2017-11-14 | International Business Machines Corporation | Using cohorts to infer attributes for an input case in a question answering system |
US20190205758A1 (en) * | 2016-12-30 | 2019-07-04 | Konica Minolta Laboratory U.S.A., Inc. | Gland segmentation with deeply-supervised multi-level deconvolution networks |
JP6733809B2 (ja) * | 2017-03-31 | 2020-08-05 | 日本電気株式会社 | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム |
US20210232949A1 (en) * | 2018-06-18 | 2021-07-29 | Sony Corporation | Information processing device, information processing method, and program |
CN111089388A (zh) * | 2018-10-18 | 2020-05-01 | 珠海格力电器股份有限公司 | 控制空调的方法及系统、空调器、家用电器 |
CN110110043B (zh) * | 2019-04-11 | 2023-04-11 | 中山大学 | 一种多跳视觉问题推理模型及其推理方法 |
US11403522B2 (en) * | 2019-07-03 | 2022-08-02 | International Business Machines Corporation | Training artificial intelligence to use answer passage merging for full sentences responses in a question answering system |
WO2021015740A1 (en) * | 2019-07-23 | 2021-01-28 | Landmark Graphics Corporation | Stochastic realization of parameter inversion in physics-based empirical models |
-
2020
- 2020-12-02 US US17/109,781 patent/US20210173837A1/en active Pending
- 2020-12-03 JP JP2022516147A patent/JP2022548053A/ja active Pending
- 2020-12-03 WO PCT/US2020/063045 patent/WO2021113467A1/en active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090055164A1 (en) * | 2007-08-24 | 2009-02-26 | Robert Bosch Gmbh | Method and System of Optimal Selection Strategy for Statistical Classifications in Dialog Systems |
US20150363697A1 (en) * | 2010-10-11 | 2015-12-17 | Next It Corporation | System and method for providing distributed intelligent assistance |
US10157203B2 (en) * | 2016-03-15 | 2018-12-18 | International Business Machines Corporation | Question transformation in question answer systems |
JP2019003319A (ja) * | 2017-06-13 | 2019-01-10 | 株式会社野村総合研究所 | 対話型業務支援システムおよび対話型業務支援プログラム |
WO2019202788A1 (ja) * | 2018-04-16 | 2019-10-24 | 株式会社Nttドコモ | 対話システム |
JP2019207648A (ja) * | 2018-05-30 | 2019-12-05 | 株式会社野村総合研究所 | 対話型業務支援システム |
Also Published As
Publication number | Publication date |
---|---|
WO2021113467A1 (en) | 2021-06-10 |
US20210173837A1 (en) | 2021-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6960006B2 (ja) | 会話システムにおいて意図が不明確なクエリを処理する方法およびシステム | |
US11657231B2 (en) | Capturing rich response relationships with small-data neural networks | |
US11157693B2 (en) | Stylistic text rewriting for a target author | |
US20200171670A1 (en) | System and Method for Semantic Processing of Natural Language Commands | |
JP7361193B2 (ja) | マルチモーダルトリプレットロスを使用した時系列およびtextのための教師ありクロスモーダル検索 | |
US10395641B2 (en) | Modifying a language conversation model | |
US8635171B1 (en) | Systems and methods for reducing false positives produced by heuristics | |
US11763084B2 (en) | Automatic formulation of data science problem statements | |
JP7345046B2 (ja) | 単語重複ベースのクラスタリングクロスモーダル検索 | |
US11119979B2 (en) | Content based recommendations of file system save locations | |
CN112424768A (zh) | 电子设备及其控制方法 | |
US10699197B2 (en) | Predictive analysis with large predictive models | |
JP2019049604A (ja) | 命令文推定システムおよび命令文推定方法 | |
CN112100312A (zh) | 从数据源中智能提取因果知识 | |
US20220335209A1 (en) | Systems, apparatus, articles of manufacture, and methods to generate digitized handwriting with user style adaptations | |
CN110442877B (zh) | 使用机器人规划作为平行语言语料库 | |
US20200409948A1 (en) | Adaptive Query Optimization Using Machine Learning | |
JP2022548053A (ja) | 解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成 | |
JP7367195B2 (ja) | 解きほぐしたデータを生成するための自己教師シーケンシャル変分オートエンコーダ | |
WO2021158409A1 (en) | Interpreting convolutional sequence model by learning local and resolution-controllable prototypes | |
ZAHIDI et al. | Comparative study of the most useful Arabic-supporting natural language processing and deep learning libraries | |
US20230012316A1 (en) | Automation of leave request process | |
US11907191B2 (en) | Content based log retrieval by using embedding feature extraction | |
US11750479B1 (en) | System and method for managing issues based on pain reduction efficiency | |
US11797425B2 (en) | Data augmentation based on failure cases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230207 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230905 |