JP2022548053A - 解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成 - Google Patents

解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成 Download PDF

Info

Publication number
JP2022548053A
JP2022548053A JP2022516147A JP2022516147A JP2022548053A JP 2022548053 A JP2022548053 A JP 2022548053A JP 2022516147 A JP2022516147 A JP 2022516147A JP 2022516147 A JP2022516147 A JP 2022516147A JP 2022548053 A JP2022548053 A JP 2022548053A
Authority
JP
Japan
Prior art keywords
question
hop
follow
neural network
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022516147A
Other languages
English (en)
Inventor
クリストファー マロン、
ビン バイ、
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Laboratories America Inc
Original Assignee
NEC Laboratories America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Laboratories America Inc filed Critical NEC Laboratories America Inc
Publication of JP2022548053A publication Critical patent/JP2022548053A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ実装方法が提供される。本方法は、入力マルチホップブリッジタイプの質問の前提事項を検索するステップ(310)を含む。本方法は、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップ(320)をさらに含む。本方法は、また最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップ(330)を含む。さらに、本方法は、ニューラルネットワークによって、中間情報を含む分類に対応して、フォローアップ質問に関して検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、フォローアップ質問を生成するステップ(350)を含む。【選択図】図3

Description

この出願は、2019年12月6日に出願された米国仮特許出願第62/944,383号及び2020年12月2日に出願された米国特許出願第17/109,781号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、質問及び回答システムに関し、より詳細には解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成に関する。
最新の質問回答(QA:Question Answering)技術は、(キーワードベースの)情報検索(IR:Information Retrieval)とニューラルネットワークベースのテキスト抽出との組み合わせに依存する。IRシステムは、回答に含み得る多数の候補文(証拠として知られる)を検索し、テキスト抽出システムは該証拠における回答テキストを特定する。しかしながら、複雑(いわゆる「マルチホップ」)な質問に関しては、オリジナルの質問が、回答を含む証拠の検索に必要なキーワードを含んでおらず、IR段階における簡単なQAを失敗させる。問題は、質問と部分的な証拠が与えられたフォローアップクエリの作成を含む、解釈可能な手法でこれらの質問に答えることである。
本発明の態様によれば、マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ実装方法が提供される。本方法は、入力マルチホップブリッジタイプの質問の前提事項を検索するステップを含む。本方法は、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップをさらに含む。本方法は、また最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップを含む。本方法は、さらに、ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップを含む。
本発明の他の態様によれば、マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータプログラム製品が提供される。コンピュータプログラム製品は、プログラム命令が実装された非一時的にコンピュータで読み取り可能な記憶媒体を有する。プログラム命令は、コンピュータに本方法を実行させるためにコンピュータによって実行可能である。本方法は、入力マルチホップブリッジタイプの質問の前提事項を検索するステップを含む。本方法は、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップをさらに含む。本方法は、また最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップを含む。本方法は、さらに、ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップを含む。
本発明のさらに他の態様によれば、マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ処理システムが提供される。本コンピュータ処理システムは、プログラムコードを保存するためのメモリ装置を含む。本コンピュータ処理システムは、入力マルチホップブリッジタイプの質問の前提事項を検索するためのプログラムコードを実行する、メモリ装置に動作可能に接続されたプロセッサ装置をさらに含む。本プロセッサ装置は、さらにプログラムコードを実行することで、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップを実行する。本プロセッサ装置は、また最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップを実行する。さらに、本プロセッサ装置は、ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、フォローアップ質問を生成するステップを実行する。
これら及び他の特徴並びに利点は、以下の典型的な実施形態の詳細な説明を添付の図面と併せて読むことで明らかになるであろう。
本開示では、後述するように、以下の図面を参照しながら好ましい実施形態について詳細に説明する。
図1は、本発明の一実施形態による、例示的なコンピューティングデバイスを示すブロック図である。
図2は、本発明の一実施形態による、マルチホップブリッジタイプの質問再帰型回答パイプラインを示すブロック図である。
図3は、本発明の一実施形態による、解釈可能な再帰型マルチホップ質問回答に関するフォローアップ質問を生成するための例示的な適用方法を示すフロー図である。
図4は、本発明の一実施形態による、解釈可能な再帰型マルチホップ質問回答に関するフォローアップ質問を生成するための例示的な訓練方法を示すフロー図である。 図5は、本発明の一実施形態による、解釈可能な再帰型マルチホップ質問回答に関するフォローアップ質問を生成するための例示的な訓練方法を示すフロー図である。
図6は、本発明の一実施形態による、本発明を適用できる例示的な教育環境を示すブロック図である。
図7は、本発明の一実施形態による、例示的なコンピューティング環境を示すブロック図である。
本発明の実施形態は、解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問を生成することを対象とする。
本発明の実施形態は、質問に対する回答を決定可能であり、フォローアップ質問に回答するだけでなく、フォローアップ質問をさらに生成できる。このようにして、所定のテーマに関するさらなる知識が与えられる。
図1は、本発明の一実施形態による、例示的なコンピューティングデバイス100を示すブロック図である。コンピューティングデバイス100は、解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問を生成するように構成される。
コンピューティングデバイス100は、限定されるものではないが、コンピュータ、サーバ、ラックベースのサーバ、ブレードサーバ、ワークステーション、デスクトップコンピュータ、ラップトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、モバイルコンピューティングデバイス、ウェアラブルコンピューティングデバイス、ネットワークアプライアンス、webアプライアンス、分散コンピューティングシステム、プロセッサベースのシステム及び/または消費者の電子装置を含む、本明細書に記載する機能を実行できる任意のタイプの計算またはコンピュータデバイスで実現できる。さらに、または代替として、コンピューティングデバイス100は、物理的に分離されたコンピューティングデバイスの1つまたは複数のコンピューティングスレッド、メモリスレッド、または他のラック、スレッド、コンピューティングシャーシ、または他の構成要素で実現できる。図1で示すように、コンピューティングデバイス100は、例示的に、プロセッサ110、入出力サブシステム120、メモリ130、データ記憶装置140、通信サブシステム150、及び/またはサーバまたは同様のコンピューティングデバイスに一般的に見られる他の構成要素及び装置を含む。もちろん、他の実施形態において、コンピューティングデバイス100は、サーバコンピュータ(例えば、様々な入力/出力デバイス)に一般に見られるような他のまたは追加の構成要素を含むことができる。さらに、いくつかの実施形態において、例示的な構成要素のうちの1つまたは複数は別の構成要素に組み込まれていてもよく、または別の方法で別の構成要素の一部を形成してもよい。例えば、いくつかの実施形態において、メモリ130またはその一部をプロセッサ110に組み込むことができる。
プロセッサ110は、本明細書に記載する機能を実行できる任意のタイプのプロセッサで実現できる。プロセッサ110は、単一プロセッサ、マルチプロセッサ、中央処理装置(CPU)、グラフィックス処理装置(GPU)、単一またはマルチコアプロセッサ、デジタルシグナルプロセッサ、マイクロコントローラ、または他のプロセッサあるいは処理/制御回路として実現してもよい。
メモリ130は、本明細書で説明する機能を実行できる任意のタイプの揮発性または不揮発性メモリまたはデータ記憶装置で実現できる。動作中において、メモリ130は、オペレーティングシステム、アプリケーション、プログラム、ライブラリ、ドライバ等、コンピューティングデバイス100の動作中に使用される様々なデータ及びソフトウェアを記憶できる。メモリ130は、I/Oサブシステム120を介してプロセッサ110と通信可能に接続され、これはプロセッサ110、メモリ130及びコンピューティングデバイス100の他の構成要素との入出力操作を容易にするための回路及び/または構成要素で実現できる。例えば、I/Oサブシステム120は、メモリコントローラハブ、入力/出力制御ハブ、プラットフォームコントローラハブ、集積制御回路、ファームウェア装置、通信リンク(例えば、ポイントツーポイントリンク、バスリンク、ワイヤ、ケーブル、光ガイド、プリント回路基板トレース等)、及び/または入力/出力動作を容易にするための他の構成要素及びサブシステムで実現してもよく、さもなければ、それらを含んでいてもよい。いくつかの実施形態において、I/Oサブシステム120がシステムオンチップ(SOC)の一部を形成し、プロセッサ110、メモリ130及びコンピューティングデバイス100の他の構成要素とともに、単一の集積回路チップに組み込まれていてもよい。
データ記憶装置140は、例えば、メモリ装置及び回路、メモリカード、ハードディスクドライブ、ソリッドステートドライブ、または他のデータ記憶装置等の、データを短期または長期に記憶するために構成された任意のタイプの装置または複数の装置で実現できる。データ記憶装置140は、解釈可能な再帰型マルチホップ質問回答(QA)のためのフォローアップ質問生成器のためのプログラムコードを記憶できる。コンピューティングデバイス100の通信サブシステム150は、ネットワークを介してコンピューティングデバイス100と他のリモート装置との通信を可能にする、任意のネットワークインタフェースコントローラまたは他の通信回路、装置またはそれらの集合で実現できる。通信サブシステム150は、任意の1つ以上の通信技術(例えば、有線または無線通信)及び関連するプロトコル(例えば、イーサネット(商標登録)、InfiniBand(登録商標)、Bluetooth(登録商標)、Wi-Fi(登録商標)、WiMAX(登録商標)等)を利用して通信するように構成されていてもよい。
図示のように、コンピューティングデバイス100は、1つまたは複数の周辺デバイス160を含んでいてもよい。周辺デバイス160は、任意の数の追加の入力/出力デバイス、インターフェースデバイス及び/または他の周辺デバイスを含んでいてもよい。例えば、いくつかの実施形態において、周辺デバイス160は、ディスプレイ、タッチスクリーン、グラフィック回路、キーボード、マウス、スピーカシステム、マイクロフォン、ネットワークインタフェース、及び/または他の入力/出力デバイス、インターフェースデバイス、及び/または周辺デバイスを含むことができる。
もちろん、コンピューティングデバイス100は、当業者であれば容易に思いつくような他の要素(不図示)を含んでいてもよく、特定の要素を省略してもよい。例えば、当業者であれば容易に理解できるが、コンピューティングデバイス100には、その詳細な実装に応じて他の様々な入力装置及び/または出力装置を含むことができる。例えば、無線及び/または有線による種々の入力装置及び/または出力装置を使用できる。さらに、当業者であれば容易に理解できるが、様々な構成において追加のプロセッサ、コントローラ、メモリ等を用いることも可能である。コンピューティングデバイス100の上記及び他の変形例は、本明細書で提供される本原理の教示によって当業者であれば容易に考えられるであろう。
本明細書で用いる「ハードウェアプロセッササブシステム」または「ハードウェアプロセッサ」という用語は、1つ以上の特定のタスクを実行するために協働するプロセッサ、メモリ(RAM、キャッシュ等を含む)、ソフトウェア(メモリ管理ソフトウェアを含む)またはそれらの組み合わせを指すことができる。有用な実施形態において、ハードウェアプロセッササブシステムは、1つまたは複数のデータ処理要素(例えば、論理回路、処理回路、命令実行デバイス等)を含むことができる。1つまたは複数のデータ処理要素は、中央処理装置、グラフィックス処理装置及び/または個別のプロセッサまたはコンピューティング要素ベースのコントローラ(例えば、論理ゲート等)を含めることができる。ハードウェアプロセッササブシステムは、1つ以上のオンボードメモリ(例えば、キャッシュ、専用メモリアレイ、読み出し専用メモリ等)を含むことができる。いくつかの実施形態において、ハードウェアプロセッササブシステムは、オンボードまたはオフボードとすることができる、またはハードウェアプロセッササブシステム(例えば、ROM、RAM、基本入出力システム(BIOS)等)で用いるための専用の1つ以上のメモリを含むことができる。
いくつかの実施形態において、ハードウェアプロセッササブシステムは1つ以上のソフトウェア要素を含むことが可能であり、実行できる。1つ以上のソフトウェア要素は、特定の結果を達成するために、オペレーティングシステム及び/または1つ以上のアプリケーション及び/または特定のコードを含むことができる。
他の実施形態において、ハードウェアプロセッササブシステムは、指定された結果を達成するために1つまたは複数の電子処理機能を実行する専用の回路を含むことができる。このような回路は、1つまたは複数の特定用途向け集積回路(ASIC)、FPGA及び/またはPLAを含んでいてもよい。
ハードウェアプロセッササブシステムのこれら及び他の変形例もまた、本発明の実施形態に従って企図される。
次に、本発明の一実施形態による、本発明を適用可能な質問の種類について説明する。
本発明は、ブリッジタイプの質問に利用できる。ブリッジタイプの質問は、オリジナルの質問のみに存在する用語に基づいた全ての必要な事実を検索できないようなものである。むしろ、部分的な情報が最初に検索され、追加のクエリを策定するために使用されなければならない。
本発明は、オリジナルの質問の用語で指定されていない新しい情報を発見するという課題に対処するように設計されている。最高レベルにおいて、比較タイプの質問は、比較対象であるそれぞれの量(quantity)がオリジナルの質問の一部によって指定されるため、この課題を提起しない。また、比較は、サブ質問に対する回答を検索した後に適用しなければならないため、ブリッジ質問とは異なるセマンティックを提示する。したがって、ここではブリッジタイプの質問に焦点を当てる。
図2は、本発明の一実施形態による、マルチホップブリッジタイプの質問200に回答するためのパイプラインを示すブロック図である。
パイプライン200は、前提検索器210と、三方向ニューラルネットワークベースのコントローラ(以下、互換可能な「コントローラ」または「Cont」と称す)220と、回答抽出器(以下、互換可能な「単一ホップ(SingleHop)」と称す)230と、フォローアップ質問生成器(以下、互換可能な「フォローアップ(Followup)」と称す)240とを含む。
部分的な情報が得られると、オリジナルの質問は、各ホップで生成される、より単純な質問に繰り返し縮小される。入力質問またはサブ質問が与えられると、サブ質問に回答できる可能性がある前提事項が前提検索器210から取得される。それぞれの可能性がある前提事項は、三方向ニューラルネットワークベースのコントローラ220によって、最終回答を含む、または中間情報を含む、無関係として質問に対して分類される。最終回答を含む前提事項の場合、該回答は、抽出器の単一ホップに回答する単一ホップ質問で抽出される。中間情報を含む前提事項の場合、質問生成器がフォローアップ質問を生成し、本プロセスはこの新しい質問に関して繰り返される。本発明の焦点は、この質問発生器である。そのために、コントローラによって生成され得る複数の推論パスを管理するために、様々な戦略を利用できる。
本発明の方法は、任意の数のホップを有するブリッジ質問に適用されるが、簡略化のために、本発明の1つまたは複数の例示的な実施形態は、2ホップ問題及びフォローアップ質問生成器の訓練を対象とする。
Figure 2022548053000002
を回答A及びゴールドサポート前提事項
Figure 2022548053000003
を含む質問とし、
Figure 2022548053000004
ではなく
Figure 2022548053000005
に回答が含まれているとする。フォローアップ生成器240のタスクは、
Figure 2022548053000006
を用いて下記のようなフォローアップ質問
Figure 2022548053000007
を生成する。
Figure 2022548053000008
及び
Figure 2022548053000009
パイプラインの1つの解釈不能な実装は、フォローアップ240が「フォローアップ質問」としてP1と結合された
Figure 2022548053000010
を単に出力することである。単一ホップ230は、実際にはP2と共に単一の質問の形態を取らない入力を操作して最終回答を決定する。それから、単一ホップ230は、マルチホップ推論を行うことになる。このような自明性を回避するために、単一ホップ230は最初に単一ホップ回答抽出器として訓練され、続いてフォローアップ240及びContが訓練されている間は機能が停止される。
次に、本発明の一実施形態による方法についてさらに説明する。
理想的には、フォローアップ240は、式(1)、(2)及び(3)をきっかけとするクロスエントロピー損失を用いて単一ホップ230及びContが固定されて訓練され得るが、復号された出力
Figure 2022548053000011
はフォローアップパラメータに関して弁別可能ではない。代わりに、フォローアップ240は、弱くラベル付けされたグラウンドトゥルースフォローアップ質問のセットに対してトークンベースの損失で訓練される。
弱くラベル付けされたグラウンドトゥルースフォローアップは、ニューラル質問生成(QG)ネットワークを用いて取得される。コンテキスト
Figure 2022548053000012
及び回答
Figure 2022548053000013
が与えられると、QGはそれを生成した可能性が高いと思われる質問
Figure 2022548053000014
を見出すタスクである。逆の場合(回答及びコンテキストから質問を予測する)で使用される単一ホップ質問回答データセットは、QGモデルを訓練するために使用される。我々の訓練セットに
Figure 2022548053000015
を適用すると、弱いグラウンドトゥルースフォローアップ
Figure 2022548053000016
が得られる。
我々は、
Figure 2022548053000017
及びP1を用いてポインタ生成器ネットワークで
Figure 2022548053000018
を予測するフォローアップ質問生成器(Followup)240の例を挙げて説明する。それは、そのデコーダが固定語彙から単語を生成することと、入力から単語をコピーすることとを繰り返し選択する、シーケンストゥシーケンスモデルである。典型的には、ポインタ生成器ネットワークは生成型要約(abstractive summarization)のために使用される。出力は、ここでは異なる役割を果たすが、それらのコピー機構はオリジナルの質問及び前提事項の情報を用いるフォローアップを構築する際に有用である。
我々は、全てのPのためのグラウンドトゥルーストリプル
Figure 2022548053000019
及び
Figure 2022548053000020
に関するCont220を三値分類のためのクロスエントロピー損失で訓練する。一つの実装において、Cont220は複数の自己注意層(self-attention layer)を含むニューラルネットワークによって実現される。
このようにして、Cont220は、前提事項が質問に答えるのに十分な、または必要な情報をいつ有するかを予測することを学習する。
図3は、本発明の一実施形態による、解釈可能な再帰型マルチホップ質問回答に関するフォローアップ質問を生成するための例示的な適用方法300を示すフロー図である。
ブロック310において、入力マルチホップブリッジタイプの質問の前提事項を検索する。
ブロック320において、入力マルチホップブリッジタイプの質問に対する前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てる。
ブロック330において、「最終回答を含む」分類に応答してマルチホップブリッジタイプの質問の第1のホップに関する最終回答を出力する。
ブロック340において、(ブロック330における)最終回答に基づいて(例えば、シャットオフされるべき装置で起こり得る故障を示す回答の場合はシャットオフする等の機能を実行するために)ハードウェアオブジェクトを制御する。例えば、質問は識別のためのものであり、ユーザが識別されると、その時点で、アクセス制御を、施設、コンピュータまたは他のハードウェア装置に与えることができる。一実施形態において、ブロック340は、例えば、オブジェクトを第1の状態から該第1の状態とは異なる第2の状態に変換することを含むことができる。当業者であれば容易に理解するように、異なる状態には動作状態または他の状態を含むことができる。
ブロック350において、ニューラルネットワークによって、中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、割り当てるステップ、出力するステップ及び生成するステップを繰り返すことで、フォローアップ質問を生成する。
図4及び5は、本発明の一実施形態による、解釈可能な再帰型マルチホップ質問回答に関するフォローアップ質問を生成するための例示的な訓練方法400を示すフロー図である。
ブロック410において、質問、単一テキストコンテキスト及びコンテキストの部分文字列である回答を含む単一ホップ訓練セットと、質問、それぞれホップと呼ばれるテキストコンテキストのペア及び第2のホップの部分文字列である回答を含むマルチホップ訓練セットとを収集する。
ブロック420において、与えられた質問及びコンテキストの回答を予測するために、単一ホップ訓練セットに関する単一ホップ質問に回答するためのニューラルネットワークを訓練する。
ブロック430において、与えられた質問及びコンテキストの回答を予測するために、単一ホップ訓練セットに関する質問生成のためのニューラルネットワークを訓練する。
ブロック440において、ブロック430の質問生成のためのニューラルネットワークを、マルチホップ訓練セットにおける第2のホップの回答及びコンテキストに適用して、弱いグラウンドトゥルースフォローアップ質問を取得する。
ブロック450において、マルチホップ訓練セットにおける第1のホップのオリジナルの質問及びコンテキストが与えられると、ブロック440の弱いグラウンドトゥルースフォローアップ質問を出力するようにポインタ生成器ネットワークを訓練する。
ブロック460において、マルチホップ訓練セットからのコンテキスト及び質問を含むペアを分類し、ブロック420の単一ホップネットワークが訓練セットにおける回答と重複する文字列を出力する場合、質問及び第2のホップのコンテキストに関する「最終回答を含む」出力を生成し、質問及び第1のホップのコンテキストに関する「中間」の出力を生成し、質問及び訓練セットからサンプリングされた任意の他のコンテキストに関する「無関係」の出力を生成するように、三方向ニューラルネットワークベースのコントローラを訓練する。
ブロック470において、ブロック420、450及び460のニューラルネットワークを出力する。これらのニューラルネットワークは、図3で示すように、質問回答を解決するために使用できる。
図6は、本発明の一実施形態による、本発明を適用できる例示的な教育環境600を示すブロック図である。
環境は、一組のクライアントコンピュータ610とサーバ620とを含む。クライアントコンピュータ610は、スマートフォン、タブレット、ラップトップ、デスクトップ等のいずれでもよい。
環境600のエンティティ間の通信は、1つまたは複数のネットワーク630を介して実行できる。例示のために、無線ネットワーク630が示されている。他の実施形態において、エンティティ間の通信を容易にするために、有線、無線及び/またはそれらの組合せのいずれを使用してもよい。
クライアントコンピュータ610は、これらの質問に対する回答及び教育環境におけるさらなる学習のためのフォローアップ質問を得るために、質問を提出する。このようにして、最初の質問に関連する所定のテーマに関して学生の知識をさらに深めるために回答される追加の新しい質問を学生に提供できる。
図7は、本発明の一実施形態による、例示的なコンピューティング環境600を示すブロック図である。
環境700は、サーバ710と、複数のクライアント装置(図中の符号720でまとめて示す)と、被制御システムA741と、被制御システムB742とを含む。
環境700のエンティティ間の通信は、1つまたは複数のネットワーク730を介して実行できる。例示のため、無線ネットワーク730が示されている。他の実施形態において、エンティティ間の通信を容易にするために、有線、無線及び/またはそれらの組合せのいずれかを使用できる。
サーバ710は、クライアント装置720からのシーケンシャルデータ入力を受信する。サーバ710は、サーバ710に保存された解きほぐし(disentanglement)モデルから生成された予測に基づいて、被制御システム741及び/または742の1つを制御できる。一実施形態において、シーケンシャルデータ入力は時系列データに関連していてもよく、時系列データは、被制御システム741及び/または742に関連する、例えばセンサデータ等であるが、これに限定されない。制御は、差し迫った故障要素をオフにすること、故障した構成要素を別の動作する構成要素に交換すること、安全なネットワークに切り替えること等がある。
本明細書では本発明の「一実施形態」または「実施形態」、並びにその他の変形形態に言及し、実施形態に関連して説明した特定の機能、構成、特徴等が、本発明の少なくとも1つの実施形態に含まれることを意味する。したがって、「一実施形態において」または「実施形態において」という語句の出現、並びに本明細書全体を通して様々な場所に出現する任意の他の変形形態は、必ずしも全てが同じ実施形態を参照しているわけではない。しかしながら、本明細書で提供される本発明の教示を前提として、1つまたは複数の実施形態の特徴を組み合わせることができることを理解されたい。
例えば、「A/B」、「A及び/またはB」、並びに「A及びBのうちの少なくとも1つ」の場合における「/」、「及び/または」、並びに「うちの少なくとも1つ」のうちのいずれかの使用は、第1に挙げた選択肢(A)のみの選択、第2に挙げた選択肢(B)のみの選択、または両方の選択肢(A及びB)の選択を含むことを意図したものと理解すべきである。さらに例を挙げれば、「A、B及び/またはC」、並びに「A、B及びCのうちの少なくとも1つ」の場合、このような表現法は、第1に挙げた選択肢(A)のみの選択、第2に挙げた選択肢(B)のみの選択、第3に挙げた選択肢(C)のみの選択、第1及び第2に挙げた選択肢(A及びB)のみの選択、第1及び第3に挙げた選択肢(A及びC)のみの選択、第2及び第3に挙げた選択肢(B及びC)のみの選択、または3つの選択肢全て(A及びB及びC)の選択を含むことを意図したものである。上述した例は、当業者に容易に明らかとなるように、列挙される多数の項目に応じて拡大適用される。
上記は、あらゆる観点において説明的(illustrative)かつ典型的(exemplary)であって限定的でないものと理解されるべきであり、本明細書で開示する本発明の範囲は、詳細な説明から決定されるべきではなく、特許法で認められた最大限の広さに基づいて解釈される特許請求の範囲から決定されるべきである。本明細書中に図示及び記載されている実施形態は、本発明の原理を説明するものにすぎず、本発明の範囲及び主旨から逸脱することなく当業者は様々な変更を実施することができることを理解されたい。当業者は、本発明の範囲及び精神から逸脱することなく、様々な他の特徴の組み合わせを実施できる。以上、本発明の態様について、特許法で要求される細部及び詳細な事項と共に説明したが、特許証で保護されることを要求する特許請求の範囲は、添付の特許請求の範囲に示されている。

Claims (20)

  1. マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ実装方法であって、
    入力マルチホップブリッジタイプの質問の前提事項を検索するステップ(310)と、
    前記入力マルチホップブリッジタイプの質問に対する前記前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップ(320)と、
    前記最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップ(330)と、
    ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、前記割り当てるステップ、前記出力するステップ及び前記生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップ(350)と、
    を有するコンピュータ実装方法。
  2. 前記入力マルチホップブリッジタイプの質問に関する別の前提事項を検索し、前記分類が無関係であることに対応して、前記割り当てるステップ、出力するステップ及び生成するステップを繰り返すステップをさらに有する、請求項1に記載のコンピュータ実装方法。
  3. 前記割り当てるステップのニューラルネットワークは、三値分類のための1つ以上のクロスエントロピー損失を用いて訓練される、請求項1に記載のコンピュータ実装方法。
  4. 前記生成するステップは、前記入力マルチホップブリッジタイプの質問と、前記入力マルチホップブリッジタイプの質問のための前記検索された前提事項とに基づいて、前記フォローアップ質問を生成する、請求項1に記載のコンピュータ実装方法。
  5. 前記生成するステップのニューラルネットワークは、固定語彙から単語を生成する、または前記入力マルチホップブリッジタイプの質問から単語をコピーするように構成されたデコーダを備えるシーケンストゥシーケンスモデルを有する、請求項1に記載のコンピュータ実装方法。
  6. 前記割り当てるステップは、1つまたは複数の自己注意層を含むニューラルネットワークを有する、請求項1に記載のコンピュータ実装方法。
  7. 前記出力するステップは、単一ホップ質問回答のために訓練されたニューラルネットワークによって実行される、請求項1に記載のコンピュータ実装方法。
  8. 前記入力マルチホップブリッジタイプの質問及び前記フォローアップ質問は自然テキストである、請求項1に記載のコンピュータ実装方法。
  9. 前記最終回答に基づく機能を実行するようにハードウェアオブジェクトを制御するステップをさらに有する、請求項1に記載のコンピュータ実装方法。
  10. マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、プログラム命令が実装された非一時的にコンピュータで読み取り可能な記憶媒体を有し、前記プログラム命令がコンピュータによって実行可能であり、
    入力マルチホップブリッジタイプの質問の前提事項を検索するステップ(310)と、
    前記入力マルチホップブリッジタイプの質問に対する前記前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当てるステップ(320)と、
    前記最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップ(330)と、
    ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、前記割り当てるステップ、前記出力するステップ及び前記生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップ(350)と、
    を有する方法を前記コンピュータに実行させるための、コンピュータプログラム製品。
  11. 前記入力マルチホップブリッジタイプの質問に関する別の前提事項を検索し、前記分類が無関係であることに対応して、前記割り当てるステップ、出力するステップ及び生成するステップを繰り返すステップをさらに有する、請求項10に記載のコンピュータプログラム製品。
  12. 前記割り当てるステップのニューラルネットワークは、三値分類のための1つ以上のクロスエントロピー損失を用いて訓練される、請求項10に記載のコンピュータプログラム製品。
  13. 前記生成するステップは、前記入力マルチホップブリッジタイプの質問と、前記入力マルチホップブリッジタイプの質問のための前記検索された前提事項とに基づいて、前記フォローアップ質問を生成する、請求項10に記載のコンピュータプログラム製品。
  14. 前記生成するステップのニューラルネットワークは、固定語彙から単語を生成する、または前記入力マルチホップブリッジタイプの質問から単語をコピーするように構成されたデコーダを備えるシーケンストゥシーケンスモデルを有する、請求項10に記載のコンピュータプログラム製品。
  15. 前記割り当てるステップは、1つまたは複数の自己注意層を含むニューラルネットワークを有する、請求項10に記載のコンピュータプログラム製品。
  16. 前記出力するステップは、単一ホップ質問回答のために訓練されたニューラルネットワークによって実行される、請求項10に記載のコンピュータプログラム製品。
  17. 前記入力マルチホップブリッジタイプの質問及び前記フォローアップ質問は自然テキストである、請求項10に記載のコンピュータプログラム製品。
  18. 前記最終回答に基づく機能を実行するようにハードウェアオブジェクトを制御するステップをさらに有する、請求項10に記載のコンピュータプログラム製品。
  19. マルチホップブリッジタイプの質問回答に関するフォローアップ質問を生成するためのコンピュータ処理システムであって、
    プログラムコードを保存するためのメモリ装置(140)と、
    入力マルチホップブリッジタイプの質問の前提事項を検索するステップと、
    前記入力マルチホップブリッジタイプの質問に対する前記前提事項の分類を、最終回答を含む、または中間情報を含む、無関係なものとして、三方向ニューラルネットワークベースのコントローラによって割り当るステップと、
    前記最終回答を含む分類に対応して前記マルチホップブリッジタイプの質問の第1のホップに関する前記最終回答を出力するステップと、
    ニューラルネットワークによって、前記中間情報を含む分類に対応して、フォローアップ質問に関して前記検索するステップ、前記割り当てるステップ、前記出力するステップ及び前記生成するステップを繰り返すことで、前記フォローアップ質問を生成するステップと、
    を有するように前記プログラムコードを実行する、前記メモリ装置と動作可能に接続されたプロセッサ装置(110)と、
    を有する、コンピュータ処理システム。
  20. 前記割り当てるステップのニューラルネットワークは、三値分類のための1つ以上のクロスエントロピー損失を用いて訓練される、請求項19に記載のコンピュータ処理システム。
JP2022516147A 2019-12-06 2020-12-03 解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成 Pending JP2022548053A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962944383P 2019-12-06 2019-12-06
US62/944,383 2019-12-06
US17/109,781 2020-12-02
US17/109,781 US20210173837A1 (en) 2019-12-06 2020-12-02 Generating followup questions for interpretable recursive multi-hop question answering
PCT/US2020/063045 WO2021113467A1 (en) 2019-12-06 2020-12-03 Generating followup questions for interpretable recursive multi-hop question answering

Publications (1)

Publication Number Publication Date
JP2022548053A true JP2022548053A (ja) 2022-11-16

Family

ID=76208999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022516147A Pending JP2022548053A (ja) 2019-12-06 2020-12-03 解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成

Country Status (3)

Country Link
US (1) US20210173837A1 (ja)
JP (1) JP2022548053A (ja)
WO (1) WO2021113467A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114780707B (zh) * 2022-06-21 2022-11-22 浙江浙里信征信有限公司 基于多跳推理联合优化的多跳问题回答方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055164A1 (en) * 2007-08-24 2009-02-26 Robert Bosch Gmbh Method and System of Optimal Selection Strategy for Statistical Classifications in Dialog Systems
US20150363697A1 (en) * 2010-10-11 2015-12-17 Next It Corporation System and method for providing distributed intelligent assistance
US10157203B2 (en) * 2016-03-15 2018-12-18 International Business Machines Corporation Question transformation in question answer systems
JP2019003319A (ja) * 2017-06-13 2019-01-10 株式会社野村総合研究所 対話型業務支援システムおよび対話型業務支援プログラム
WO2019202788A1 (ja) * 2018-04-16 2019-10-24 株式会社Nttドコモ 対話システム
JP2019207648A (ja) * 2018-05-30 2019-12-05 株式会社野村総合研究所 対話型業務支援システム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200334515Y1 (ko) * 2003-08-18 2003-11-28 황윤규 복합 센서가 일체로 구비된 절전형 자동 점멸 램프
US10276170B2 (en) * 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US9082310B2 (en) * 2010-02-10 2015-07-14 Mmodal Ip Llc Providing computable guidance to relevant evidence in question-answering systems
US9582757B1 (en) * 2014-07-25 2017-02-28 Amazon Technologies, Inc. Scalable curation system
US9940367B1 (en) * 2014-08-13 2018-04-10 Google Llc Scoring candidate answer passages
US9818062B2 (en) * 2015-02-19 2017-11-14 International Business Machines Corporation Using cohorts to infer attributes for an input case in a question answering system
US20190205758A1 (en) * 2016-12-30 2019-07-04 Konica Minolta Laboratory U.S.A., Inc. Gland segmentation with deeply-supervised multi-level deconvolution networks
JP6733809B2 (ja) * 2017-03-31 2020-08-05 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム
US20210232949A1 (en) * 2018-06-18 2021-07-29 Sony Corporation Information processing device, information processing method, and program
CN111089388A (zh) * 2018-10-18 2020-05-01 珠海格力电器股份有限公司 控制空调的方法及系统、空调器、家用电器
CN110110043B (zh) * 2019-04-11 2023-04-11 中山大学 一种多跳视觉问题推理模型及其推理方法
US11403522B2 (en) * 2019-07-03 2022-08-02 International Business Machines Corporation Training artificial intelligence to use answer passage merging for full sentences responses in a question answering system
WO2021015740A1 (en) * 2019-07-23 2021-01-28 Landmark Graphics Corporation Stochastic realization of parameter inversion in physics-based empirical models

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055164A1 (en) * 2007-08-24 2009-02-26 Robert Bosch Gmbh Method and System of Optimal Selection Strategy for Statistical Classifications in Dialog Systems
US20150363697A1 (en) * 2010-10-11 2015-12-17 Next It Corporation System and method for providing distributed intelligent assistance
US10157203B2 (en) * 2016-03-15 2018-12-18 International Business Machines Corporation Question transformation in question answer systems
JP2019003319A (ja) * 2017-06-13 2019-01-10 株式会社野村総合研究所 対話型業務支援システムおよび対話型業務支援プログラム
WO2019202788A1 (ja) * 2018-04-16 2019-10-24 株式会社Nttドコモ 対話システム
JP2019207648A (ja) * 2018-05-30 2019-12-05 株式会社野村総合研究所 対話型業務支援システム

Also Published As

Publication number Publication date
WO2021113467A1 (en) 2021-06-10
US20210173837A1 (en) 2021-06-10

Similar Documents

Publication Publication Date Title
JP6960006B2 (ja) 会話システムにおいて意図が不明確なクエリを処理する方法およびシステム
US11657231B2 (en) Capturing rich response relationships with small-data neural networks
US11157693B2 (en) Stylistic text rewriting for a target author
US20200171670A1 (en) System and Method for Semantic Processing of Natural Language Commands
JP7361193B2 (ja) マルチモーダルトリプレットロスを使用した時系列およびtextのための教師ありクロスモーダル検索
US10395641B2 (en) Modifying a language conversation model
US8635171B1 (en) Systems and methods for reducing false positives produced by heuristics
US11763084B2 (en) Automatic formulation of data science problem statements
JP7345046B2 (ja) 単語重複ベースのクラスタリングクロスモーダル検索
US11119979B2 (en) Content based recommendations of file system save locations
CN112424768A (zh) 电子设备及其控制方法
US10699197B2 (en) Predictive analysis with large predictive models
JP2019049604A (ja) 命令文推定システムおよび命令文推定方法
CN112100312A (zh) 从数据源中智能提取因果知识
US20220335209A1 (en) Systems, apparatus, articles of manufacture, and methods to generate digitized handwriting with user style adaptations
CN110442877B (zh) 使用机器人规划作为平行语言语料库
US20200409948A1 (en) Adaptive Query Optimization Using Machine Learning
JP2022548053A (ja) 解釈可能な再帰型マルチホップ質問回答のためのフォローアップ質問の生成
JP7367195B2 (ja) 解きほぐしたデータを生成するための自己教師シーケンシャル変分オートエンコーダ
WO2021158409A1 (en) Interpreting convolutional sequence model by learning local and resolution-controllable prototypes
ZAHIDI et al. Comparative study of the most useful Arabic-supporting natural language processing and deep learning libraries
US20230012316A1 (en) Automation of leave request process
US11907191B2 (en) Content based log retrieval by using embedding feature extraction
US11750479B1 (en) System and method for managing issues based on pain reduction efficiency
US11797425B2 (en) Data augmentation based on failure cases

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230905