JP2020140674A - 回答選択装置及びプログラム - Google Patents

回答選択装置及びプログラム Download PDF

Info

Publication number
JP2020140674A
JP2020140674A JP2019038038A JP2019038038A JP2020140674A JP 2020140674 A JP2020140674 A JP 2020140674A JP 2019038038 A JP2019038038 A JP 2019038038A JP 2019038038 A JP2019038038 A JP 2019038038A JP 2020140674 A JP2020140674 A JP 2020140674A
Authority
JP
Japan
Prior art keywords
information
graph
answer
question
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019038038A
Other languages
English (en)
Inventor
拓誠 高橋
Hiroaki Takahashi
拓誠 高橋
友紀 谷口
Tomonori Taniguchi
友紀 谷口
康秀 三浦
Yasuhide Miura
康秀 三浦
大熊 智子
Tomoko Okuma
智子 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2019038038A priority Critical patent/JP2020140674A/ja
Publication of JP2020140674A publication Critical patent/JP2020140674A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】質問に対する回答を単語の系列情報のみを用いて選択する場合と比較して、回答を精度良く選択することができる回答選択装置及びプログラムを提供する。【解決手段】回答選択装置10Aは、質問に含まれる単語の順番を表す第1系列情報と、質問の構文構造を表す第1グラフの分散表現である第1グラフ情報とを統合して質問の第1統合情報とする第1統合部34と、質問に対する複数の回答候補の各々について、回答候補に含まれる単語の順番を表す第2系列情報と、回答候補の構文構造を表す第2グラフの分散表現である第2グラフ情報とを統合して複数の回答候補の各々の第2統合情報とする第2統合部40と、質問の第1統合情報及び複数の回答候補の各々の第2統合情報を入力として、質問に対して決定される、複数の回答候補の各々の適切度に基づいて、質問に対する回答を選択する選択部42と、を備える。【選択図】図5

Description

本発明は、回答選択装置及びプログラムに関する。
例えば、特許文献1には、文書に含まれる文の動詞を抽出し、その動詞の主体や対象となる語彙を解析して、文を構成する語彙間の関係をグラフ構造で表現し、利用者が入力した文も同様に解析してグラフ構造で表現し、文書に含まれる文のグラフ構造から利用者が入力した文のグラフ構造と一致するものを検索して利用者に提示する文章検索方法が記載されている。この文章検索方法は、文書に含まれる文を章立てや段落分け、箇条書きの方法にもとづいて木構造に整理し、文書に含まれる文のグラフ構造が利用者から入力された文のグラフ構造と一致するとき、木構造において下位に位置する文を検索し、検索した文が命令文であればそのグラフ構造を利用者に提示し、検索した文が平叙文であれば平叙文とグラフ構造が一致する文の入力を利用者に促すことを繰り返すことにより、木構造の下位に位置する文のグラフ構造を検索する。
また、特許文献2には、入力された質問文に対してノンファクトイド型の質問応答を行うための回答文を生成する質問応答装置が記載されている。この質問応答装置は、入力された質問文に対する1つ以上の文からなる回答候補の集合を抽出する回答候補抽出手段と、回答候補抽出手段によって抽出された回答候補の集合に含まれる回答候補の各々について、質問文と回答候補との組み合わせに対する、質問文と回答候補との内容の関連性に関する特徴量と、回答候補中の括弧の割合を示す特徴量とを含む特徴ベクトルを生成する特徴量生成手段と、を備える。また、この質問応答装置は、質問文と回答候補との組み合わせの各々について、予め学習された特徴ベクトルに含まれる各特徴量に対する重みと、特徴量生成手段によって生成された組み合わせに対する特徴ベクトルとに基づいて、スコアを算出するスコア算出手段と、スコア算出手段によって算出されたスコアに従って、回答候補の集合をランキングするランキング手段と、を備える。
また、特許文献3には、入力文が発話文として適格であるか否かを判定するためのモデル学習装置が記載されている。このモデル学習装置は、発話文として適格であることを示す正例の情報又は発話文として適格でないことを示す負例の情報が付加されている形態素解析済みの入力文の各々について、係り受け解析を行い、入力文に含まれる各単語に対応して単語の品詞を表す各単語ノードを含み、単語の係り受け関係に応じたエッジで単語ノード間を結んだ木構造であって、単語ノードの各々について、単語ノードに対応する単語の表記を表すノード、単語ノードに対応する単語の標準表記を表すノード、及び単語ノードに対応する単語の終止形を表すノードの少なくとも1つを単語ノードの子ノードとして追加した木構造を作成する係り受け解析部を備える。また、このモデル学習装置は、係り受け解析部において入力文の各々について作成された木構造から得られる複数の部分木と、入力文の各々に付加されている正例の情報又は負例の情報とに基づいて、木構造に対応する文が、発話文として適格な文であるか否かを判定するモデルを学習するモデル学習部を備える。
特開平5−197758号公報 特許第5431532号公報 特許第6058563号公報
ところで、質問に対する回答を単語の系列情報を用いて複数の回答候補の中から選択することが行われている。この場合、回答候補が長文になるにつれて、質問に対応する部分を特定することが困難となり、回答を選択する際の精度が低下する場合がある。
本発明は、質問に対する回答を単語の系列情報のみを用いて選択する場合と比較して、回答を精度良く選択することができる回答選択装置及びプログラムを提供することを目的とする。
上記目的を達成するために、第1態様に係る回答選択装置は、質問に含まれる単語の順番を表す第1系列情報と、前記質問の構文構造を表す第1グラフの分散表現である第1グラフ情報とを統合して前記質問の第1統合情報とする第1統合部と、前記質問に対する複数の回答候補の各々について、前記回答候補に含まれる単語の順番を表す第2系列情報と、前記回答候補の構文構造を表す第2グラフの分散表現である第2グラフ情報とを統合して前記複数の回答候補の各々の第2統合情報とする第2統合部と、前記質問の第1統合情報及び前記複数の回答候補の各々の第2統合情報を入力として、前記質問に対して決定される、前記複数の回答候補の各々の適切度に基づいて、前記質問に対する回答を選択する選択部と、を備えている。
また、第2態様に係る回答選択装置は、第1態様に係る回答選択装置において、前記第1統合部が、双線形変換を用いて、前記第1系列情報と前記第1グラフ情報とをかけ合わせて相補的に前記質問の第1統合情報を導出し、前記第2統合部が、双線形変換を用いて、前記第2系列情報と前記第2グラフ情報とをかけ合わせて相補的に前記回答候補の第2統合情報を導出する。
また、第3態様に係る回答選択装置は、第1態様又は第2態様に係る回答選択装置において、前記質問から前記第1系列情報を抽出する第1系列情報抽出部と、前記第1系列情報及び前記第1グラフから前記第1グラフ情報を抽出する第1グラフ情報抽出部と、前記回答候補から前記第2系列情報を抽出する第2系列情報抽出部と、前記第2系列情報及び前記第2グラフから前記第2グラフ情報を抽出する第2グラフ情報抽出部と、を更に備えている。
また、第4態様に係る回答選択装置は、第3態様に係る回答選択装置において、前記第1グラフ情報抽出部が、前記第1グラフを入力として、前記第1グラフを分散表現に変換して得られる第1グラフ構造情報を出力する第1変換部と、前記第1系列情報及び前記第1グラフ構造情報を入力として、前記第1グラフのエッジの重みの強弱が付与された前記第1グラフ構造情報をエッジ重み強弱付き第1グラフ構造情報として出力する第1強弱付与部と、前記エッジ重み強弱付き第1グラフ構造情報を入力として、前記第1グラフのエッジの種類が付与された前記第1グラフ構造情報を前記第1グラフ情報として出力する第1種類付与部と、を含み、前記第2グラフ情報抽出部が、前記第2グラフを入力として、前記第2グラフを分散表現に変換して得られる第2グラフ構造情報を出力する第2変換部と、前記第2系列情報及び前記第2グラフ構造情報を入力として、前記第2グラフのエッジの重みの強弱が付与された前記第2グラフ構造情報をエッジ重み強弱付き第2グラフ構造情報として出力する第2強弱付与部と、前記エッジ重み強弱付き第2グラフ構造情報を入力として、前記第2グラフのエッジの種類が付与された前記第2グラフ構造情報を前記第2グラフ情報として出力する第2種類付与部と、を含んでいる。
また、第5態様に係る回答選択装置は、第3態様又は第4態様に係る回答選択装置において、前記第1系列情報抽出部と前記第1統合部との間に設けられ、かつ、前記第1系列情報及び前記第2系列情報を入力として、単語間の対応関係が付与された前記第1系列情報を単語間対応関係付き第1系列情報として出力する第1系列情報対応関係付与部と、前記第1グラフ情報抽出部と前記第1統合部との間に設けられ、かつ、前記第1グラフ情報及び前記第2グラフ情報を入力として、単語間の対応関係が付与された前記第1グラフ情報を単語間対応関係付き第1グラフ情報として出力する第1グラフ情報対応関係付与部と、前記第2系列情報抽出部と前記第2統合部との間に設けられ、かつ、前記第2系列情報及び前記第1系列情報を入力として、単語間の対応関係が付与された前記第2系列情報を単語間対応関係付き第2系列情報として出力する第2系列情報対応関係付与部と、前記第2グラフ情報抽出部と前記第2統合部との間に設けられ、かつ、前記第2グラフ情報及び前記第1グラフ情報を入力として、単語間の対応関係が付与された前記第2グラフ情報を単語間対応関係付き第2グラフ情報として出力する第2グラフ情報対応関係付与部と、を更に備えている。
また、第6態様に係る回答選択装置は、第5態様に係る回答選択装置において、前記第1統合部が、前記単語間対応関係付き第1系列情報と前記単語間対応関係付き第1グラフ情報とを統合して前記質問の単語間対応関係付き第1統合情報とし、前記第2統合部が、前記単語間対応関係付き第2系列情報と前記単語間対応関係付き第2グラフ情報とを統合して前記回答候補の単語間対応関係付き第2統合情報とし、前記第1統合部及び前記第2統合部の各々と前記選択部との間に設けられ、かつ、前記単語間対応関係付き第1統合情報及び前記単語間対応関係付き第2統合情報を入力として、中間表現により表される対応関係が付与された前記単語間対応関係付き第1統合情報を中間表現対応関係付き第1統合情報とし、中間表現により表される対応関係が付与された前記単語間対応関係付き第2統合情報を中間表現対応関係付き第2統合情報として各々出力する統合情報対応関係付与部を更に備えている。
また、第7態様に係る回答選択装置は、第6態様に係る回答選択装置において、前記選択部が、前記質問の中間表現対応関係付き第1統合情報及び前記複数の回答候補の各々の中間表現対応関係付き第2統合情報を入力として、前記質問に対して決定される、前記複数の回答候補の各々の適切度に基づいて、前記質問に対する回答を選択する。
また、第8態様に係る回答選択装置は、第1態様〜第7態様のいずれか1の態様に係る回答選択装置において、前記第1グラフが、前記質問の構文解析により得られた前記質問の各単語をノードとし、前記質問の構文解析により得られた依存関係ラベルをエッジとする依存構造グラフとされ、前記第2グラフが、前記回答候補の構文解析により得られた前記回答候補の各単語をノードとし、前記回答候補の構文解析により得られた依存関係ラベルをエッジとする依存構造グラフとされている。
更に、上記目的を達成するために、第9態様に係るプログラムは、コンピュータを、第1態様〜第8態様のいずれか1の態様に係る回答選択装置が備える各部として機能させる。
第1態様及び第9態様によれば、質問に対する回答を単語の系列情報のみを用いて選択する場合と比較して、回答を精度良く選択することができる、という効果を有する。
第2態様によれば、双線形変換を用いない場合と比較して、質問及び回答候補の各々の系列情報及びグラフ情報の統合情報を容易に得ることができる、という効果を有する。
第3態様によれば、質問及び回答候補の各々から系列情報のみを抽出する場合と比較して、回答を精度良く選択することができる、という効果を有する。
第4態様によれば、質問及び回答候補の各々のグラフについてエッジの重みの強弱及びエッジの種類を考慮しない場合と比較して、質問及び回答候補の各々について適切なグラフ情報を得ることができる、という効果を有する。
第5態様によれば、系列情報及びグラフ情報の各々について質問と回答候補との間における単語間の対応関係を考慮しない場合と比較して、質問及び回答候補の各々について適切な系列情報及びグラフ情報を得ることができる、という効果を有する。
第6態様によれば、系列情報及びグラフ情報の各々について質問と回答候補との間における中間表現により表される対応関係を考慮しない場合と比較して、質問及び回答候補の各々について適切な統合情報を得ることができる、という効果を有する。
第7態様によれば、質問及び回答候補の各々について中間表現により表される対応関係を考慮した統合情報を用いない場合と比較して、回答を精度良く選択することができる、という効果を有する。
第8態様によれば、質問及び回答候補の各々のグラフとして依存構造グラフを用いない場合と比較して、回答を精度良く選択することができる、という効果を有する。
第1の実施形態に係る回答選択装置の電気的な構成の一例を示すブロック図である。 比較例に係る回答選択装置を用いた回答選択処理の説明に供する図である。 比較例に係る質問と回答候補との関係の説明に供する図である。 実施形態に係る依存構造グラフの一例を示す図である。 第1の実施形態に係る回答選択装置の機能的な構成の一例を示すブロック図である。 第1の実施形態に係る第1系列情報抽出部及び第1グラフ情報抽出部の具体的な構成を示すブロック図である。 実施形態に係るグラフ構造情報の構築手順の説明に供する図である。 第1の実施形態に係る第1統合部の具体的な構成を示すブロック図である。 第1の実施形態に係る第2系列情報抽出部及び第2グラフ情報抽出部の具体的な構成を示すブロック図である。 第1の実施形態に係る第2統合部の具体的な構成を示すブロック図である。 第1の実施形態に係る選択処理プログラムの処理の流れの一例を示すフローチャートである。 第1の実施形態に係る回答選択手法を適用した場合の性能評価の一例を示すグラフである。 第2の実施形態に適用される階層的コアテンションの説明に供するブロック図である。 第2の実施形態に適用される各コアテンションの具体的な対応関係算出方法の説明に供する図である。 第2の実施形態に係る回答選択装置の機能的な構成の一例を示すブロック図である。
以下、図面を参照して、本発明を実施するための形態の一例について詳細に説明する。
[第1の実施形態]
図1は、第1の実施形態に係る回答選択装置10Aの電気的な構成の一例を示すブロック図である。
図1に示すように、本実施形態に係る回答選択装置10Aは、制御部12と、記憶部14と、表示部16と、操作部18と、通信部20と、を備えている。
本実施形態に係る回答選択装置10Aには、例えば、パーソナルコンピュータ(PC:Personal Computer)やサーバコンピュータ等の汎用的なコンピュータ装置が適用される。
制御部12は、CPU(Central Processing Unit)12A、ROM(Read Only Memory)12B、RAM(Random Access Memory)12C、及び入出力インターフェース(I/O)12Dを備えており、これら各部がバスを介して各々接続されている。なお、後述のニューラルネットワークの計算では、特に機械学習の高速化のため、CPUに代えて、GPU(Graphical Processing Unit)を用いることが望ましい。
I/O12Dには、記憶部14と、表示部16と、操作部18と、通信部20と、を含む各機能部が接続されている。これらの各機能部は、I/O12Dを介して、CPU12Aと相互に通信可能とされる。
制御部12は、回答選択装置10Aの一部の動作を制御するサブ制御部として構成されてもよいし、回答選択装置10Aの全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部12の各ブロックの一部又は全部には、例えば、LSI(Large Scale Integration)等の集積回路又はIC(Integrated Circuit)チップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部12の集積化には、LSIに限らず、専用回路又は汎用プロセッサを用いてもよい。
記憶部14としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部14には、本実施形態に係る回答選択処理を行うための選択処理プログラム14Aが記憶される。なお、この選択処理プログラム14Aは、ROM12Bに記憶されていてもよい。また、記憶部14には、回答選択処理に用いる質問回答データベース(以下、「質問回答DB」という。)14Bが記憶されている。
選択処理プログラム14Aは、例えば、回答選択装置10Aに予めインストールされていてもよい。選択処理プログラム14Aは、不揮発性の記憶媒体に記憶して、又はネットワークを介して配布して、回答選択装置10Aに適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。
表示部16には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部16は、タッチパネルを一体的に有していてもよい。操作部18には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。表示部16及び操作部18は、回答選択装置10Aのユーザから各種の指示を受け付ける。表示部16は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。
通信部20は、インターネットや、LAN(Local Area Network)、WAN(Wide Area Network)等のネットワークに接続されており、画像形成装置や他のPC等の外部機器との間でネットワークを介して通信が可能とされる。
次に、図2及び図3を参照して、比較例に係る回答選択装置を用いた回答選択処理について説明する。
図2は、比較例に係る回答選択装置を用いた回答選択処理の説明に供する図である。
図2に示すように、比較例に係る回答選択装置は、ユーザから入力された質問Qに対する適切な回答Aを、複数の回答候補A(∈{A,・・・,A})の中から自動的に選択する。
このとき、複数の回答候補には、短文や長文で記述された回答文が存在する。一例として、回答候補Aや回答候補Aは短文で、回答候補Aは長文である。
図3は、比較例に係る質問と回答候補との関係の説明に供する図である。
図3に示すように、回答候補が長文になるにつれて、質問に対する部分を特定することが困難となり、回答選択の精度が低下する場合がある。
図3に示す例では、比較的短文の回答候補Aの場合、質問Qに対する部分が「15ml」と1つに特定されるが、比較的長文の回答候補Aの場合、質問Qに対する部分が「15ml」と「7mlto14ml」とあり、1つに特定することが難しい。
すなわち、上記比較例に係る回答選択装置では、単語の順番を表す系列情報のみを用いていたため、回答選択の精度が低下する場合がある。本実施形態に係る回答選択装置10Aでは、系列情報に加えて、一例として、図4に示す依存構造グラフを用いて、文の依存構造を考慮することで回答選択の精度を向上させる。
図4は、本実施形態に係る依存構造グラフの一例を示す図である。
図4に示す依存構造グラフは、構文構造、つまり、文に含まれる単語の依存関係を表すグラフである。
本実施形態に係る回答選択装置10AのCPU12Aは、記憶部14に記憶されている選択処理プログラム14AをRAM12Cに書き込んで実行することにより、図5に示す各部として機能する。
図5は、第1の実施形態に係る回答選択装置10Aの機能的な構成の一例を示すブロック図である。
図5に示すように、本実施形態に係る回答選択装置10AのCPU12Aは、第1系列情報抽出部30、第1グラフ情報抽出部32、第1統合部34、第2系列情報抽出部36、第2グラフ情報抽出部38、第2統合部40、及び選択部42として機能する。なお、記憶部14には質問回答DB14Bが記憶されている。
本実施形態に係る質問回答DB14Bには、質問と回答候補とのペアに、正解又は不正解のラベルが対応付けられて記憶されている。
本実施形態に係る第1系列情報抽出部30は、一例として、上述の図2に示すように、ユーザから入力された質問Qから、質問Qに含まれる単語の順番を表す第1系列情報を抽出する。
本実施形態に係る第1グラフ情報抽出部32は、質問Qの構文構造を表す第1グラフ及び第1系列情報から、第1グラフを分散表現に変換して得られる第1グラフ情報を抽出する。この第1グラフは、一例として、質問Qの構文解析により得られた質問Qの各単語をノードとし、質問Qの構文解析により得られた依存関係ラベルをエッジとする依存構造グラフである。この第1グラフには、例えば、上述の図4に示す依存構造グラフが用いられる。
本実施形態に係る第1統合部34は、第1系列情報抽出部30により抽出された第1抽出情報と、第1グラフ情報抽出部32により抽出された第1グラフ情報とを統合して第1統合情報を生成する。
本実施形態に係る第2系列情報抽出部36は、一例として、上述の図2に示すように、ユーザから入力された質問Qに対応する複数の回答候補Aを質問回答DB14Bから抽出する。例えば、質問Qに類似する質問に対応付けられている複数の回答候補Aを質問回答DB14Bから抽出する。第2系列情報抽出部36は、抽出した複数の回答候補Aの各々から、回答候補Aに含まれる単語の順番を表す第2系列情報を抽出する。
本実施形態に係る第2グラフ情報抽出部38は、複数の回答候補Aの各々について、回答候補Aの構文構造を表す第2グラフ及び第2系列情報から、第2グラフを分散表現に変換して得られる第2グラフ情報を抽出する。この第2グラフは、一例として、回答候補Aの構文解析により得られた回答候補Aの各単語をノードとし、回答候補Aの構文解析により得られた依存関係ラベルをエッジとする依存構造グラフである。
本実施形態に係る第2統合部40は、複数の回答候補Aの各々について、第2系列情報抽出部36により抽出された第2抽出情報と、第2グラフ情報抽出部38により抽出された第2グラフ情報とを統合して第2統合情報を生成する。
本実施形態に係る選択部42は、質問Qの第1統合情報及び複数の回答候補Aの各々の第2統合情報を入力として、質問Qに対して決定される、複数の回答候補Aの各々の適切度に基づいて、質問Qに対する回答を選択する。なお、適切度の導出には、一例として、公知のコサイン類似度が用いられる。コサイン類似度は、そのままベクトル同士の成す角度の近さを表現するため、1に近ければ類似しており(適切であり)、0に近ければ似ていない(適切でない)ことになる。選択部42は、適切度が最も高い回答候補Aを、質問Qに対する回答として選択する。
次に、図6を参照して、質問Qに関する第1系列情報抽出部30及び第1グラフ情報抽出部32の具体的な構成について説明する。
図6は、第1の実施形態に係る第1系列情報抽出部30及び第1グラフ情報抽出部32の具体的な構成を示すブロック図である。
図6に示すように、本実施形態に係る第1系列情報抽出部30は、エンベディング層(Embedding Layer)30Aと、CNN(Convolutional Neural Network)30Bと、を含む。第1グラフ情報抽出部32は、エンベディング層32Aと、ソフトエッジアテンション(Soft-Edge Attention)32Bと、ペアレントチャイルドセルフアテンション(Parent-Child Self-Attention)32Cと、を含む。
エンベディング層30Aは、質問Qに含まれる単語のワン・ホット(one-hot)ベクトルを入力として、単語の意味を表す分散表現(ここでは、単語埋め込み表現ともいう。)WW1を出力する。例えば、語彙数がMであるとき、各単語に0からM−1までのインデックスiを振る。各単語に対し、i次元の値が1で、それ以外の値が0のワン・ホットベクトルに対応させると、M次元実数空間への埋め込みが実現できる。なお、このエンベディング層30Aは、一例として、ニューラルネットワーク(NN:Neural Network)として構成されており、質問Qに対する適切な分散表現WW1を機械学習する。
CNN30Bは、エンベディング層30Aからの分散表現WW1を入力として、対象の単語だけではなく、前後N個の単語の系列情報を考慮した第1系列情報H1を出力する。第1系列情報H1は、第1系列情報素性ともいう。なお、このCNN30Bは、分散表現WW1に対する適切な第1系列情報H1を機械学習する。
一方、エンベディング層32Aは、第1変換部の一例である。エンベディング層32Aは、第1グラフの一例である第1依存構造グラフg1を入力として、第1依存構造グラフg1を分散表現に変換して得られる第1グラフ構造情報R1を出力する。このエンベディング層32Aは、上述のエンベディング層30Aと同様にNNとして構成されている。ここで、図7を参照して、エンベディング層32Aによるグラフ構造情報Rの構築手順について説明する。
図7は、本実施形態に係るグラフ構造情報Rの構築手順の説明に供する図である。
図7の(S1)では、質問Qを構文解析して依存構造グラフを生成する。
(S2)では、生成した依存構造グラフから、要素が依存関係ラベルのID(Identification)である隣接行列に変換する。
(S3)では、変換した隣接行列を分散表現に変換し、グラフ構造情報Rを生成する。
図6に戻り、ソフトエッジアテンション32Bは、第1強弱付与部の一例である。ソフトエッジアテンション32Bは、第1系列情報H1及び第1グラフ構造情報R1を入力として、第1依存構造グラフg1のエッジの重みの強弱が付与された第1グラフ構造情報R1をエッジ重み強弱付き第1グラフ構造情報R1として出力する。このソフトエッジアテンション32Bは、NNとして構成され、第1系列情報H1及び第1グラフ構造情報R1に対する適切なエッジの重みの強弱を機械学習する。ここで、単語x、x間の依存関係ラベルをエッジとした依存構造グラフのエッジの重みの強弱は、以下の式(1)により算出される。eijは単語x、x間のエッジの重みを考慮したエッジの分散表現である。つまり、eijは、分散表現rijが単語x、x間の接続重み(確率)を考慮した分散表現として算出される。この場合、ベクトルの向きは変更されず、大きさのみが変更される。

・・・(1)
但し、p(i|j)は単語xの親が単語xである確率を示す。rijは単語x、x間の依存関係ラベルの分散表現を示す。h、hは系列情報H={h,・・・,h}の要素ベクトル(Mは単語数)を示す。Wは重み行列を示す。h はhのベクトルの転置を示す。
ペアレントチャイルドセルフアテンション32Cは、第1種類付与部の一例である。ペアレントチャイルドセルフアテンション32Cは、エッジ重み強弱付き第1グラフ構造情報R1を入力として、第1依存構造グラフg1のエッジの種類が付与された第1グラフ構造情報R1を第1グラフ情報G1として出力する。第1グラフ情報G1は、第1グラフ情報素性ともいう。このペアレントチャイルドセルフアテンション32Cは、NNとして構成され、エッジ重み強弱付き第1グラフ構造情報R1に対する適切なエッジの種類を機械学習する。
次に、図8を参照して、質問Qに関する第1統合部34の具体的な構成について説明する。
図8は、第1の実施形態に係る第1統合部34の具体的な構成を示すブロック図である。
図8に示すように、本実施形態に係る第1統合部34は、双線形変換(Bilinear Transform)を用いて、第1系列情報H1と第1グラフ情報G1とをかけ合わせて相補的に質問Qの第1統合情報を導出する。具体的に、この第1統合情報は、tanh(H1WG1)により導出される。但し、H1は第1系列情報、G1は第1グラフ情報、Wは重み行列、G1は第1グラフ情報G1の転置を示す。
次に、図9を参照して、回答候補Aに関する第2系列情報抽出部36及び第2グラフ情報抽出部38の具体的な構成について説明する。
図9は、第1の実施形態に係る第2系列情報抽出部36及び第2グラフ情報抽出部38の具体的な構成を示すブロック図である。
図9に示すように、本実施形態に係る第2系列情報抽出部36は、エンベディング層36Aと、CNN36Bと、を含む。第2グラフ情報抽出部38は、エンベディング層38Aと、ソフトエッジアテンション38Bと、ペアレントチャイルドセルフアテンション38Cと、を含む。
エンベディング層36Aは、回答候補Aに含まれる単語のワン・ホット(one-hot)ベクトルを入力として、単語の意味を表す分散表現WW2を出力する。なお、このエンベディング層36Aは、上述の図6に示すエンベディング層30Aと同様に、NNとして構成されており、回答候補Aに対する適切な分散表現WW2を機械学習する。
CNN36Bは、エンベディング層36Aからの分散表現WW2を入力として、対象の単語だけではなく、前後N個の単語の系列情報を考慮した第2系列情報H2を出力する。第2系列情報H2は、第2系列情報素性ともいう。なお、このCNN36Bは、分散表現WW2に対する適切な第2系列情報H2を機械学習する。
一方、エンベディング層38Aは、第2変換部の一例である。エンベディング層38Aは、第2グラフの一例である第2依存構造グラフg2を入力として、第2依存構造グラフg2を分散表現に変換して得られる第2グラフ構造情報R2を出力する。このエンベディング層38Aは、上述のエンベディング層36Aと同様にNNとして構成されている。このエンベディング層38Aによるグラフ構造情報Rの構築手順は、上述の図7に示した手順において質問Qを回答候補Aで置き換える以外は同様である。このため、ここでの繰り返しの説明は省略する。
ソフトエッジアテンション38Bは、第2強弱付与部の一例である。ソフトエッジアテンション38Bは、第2系列情報H2及び第2グラフ構造情報R2を入力として、第2依存構造グラフg2のエッジの重みの強弱が付与された第2グラフ構造情報R2をエッジ重み強弱付き第2グラフ構造情報R2として出力する。このソフトエッジアテンション38Bは、NNとして構成され、第2系列情報H2及び第2グラフ構造情報R2に対する適切なエッジの重みの強弱を機械学習する。なお、エッジの重みの強弱の算出には、上述の式(1)が用いられる。
ペアレントチャイルドセルフアテンション38Cは、第2種類付与部の一例である。ペアレントチャイルドセルフアテンション38Cは、エッジ重み強弱付き第2グラフ構造情報R2を入力として、第2依存構造グラフg2のエッジの種類が付与された第2グラフ構造情報R2を第2グラフ情報G2として出力する。第2グラフ情報G2は、第2グラフ情報素性ともいう。このペアレントチャイルドセルフアテンション38Cは、NNとして構成され、エッジ重み強弱付き第2グラフ構造情報R2に対する適切なエッジの種類を機械学習する。
次に、図10を参照して、回答候補Aに関する第2統合部40の具体的な構成について説明する。
図10は、第1の実施形態に係る第2統合部40の具体的な構成を示すブロック図である。
図10に示すように、本実施形態に係る第2統合部40は、双線形変換を用いて、第2系列情報H2と第2グラフ情報G2とをかけ合わせて相補的に回答候補Aの第2統合情報を導出する。具体的に、この第2統合情報は、tanh(H2WG2)により導出される。但し、H2は第2系列情報、G2は第2グラフ情報、Wは重み行列、G2は第2グラフ情報G2の転置を示す。
次に、図11を参照して、第1の実施形態に係る回答選択装置10Aの作用を説明する。なお、図11は、第1の実施形態に係る選択処理プログラム14Aの処理の流れの一例を示すフローチャートである。
図11のステップ100では、第1系列情報抽出部30及び第2系列情報抽出部36の各々が、一例として、上述の図2に示すように、ユーザから質問Qの入力を受け付ける。
ステップ102では、第1系列情報抽出部30が、ステップ100で入力を受け付けた質問Qから、一例として、上述の図6に示すように、質問Qに含まれる単語の順番を表す第1系列情報H1を抽出する。
ステップ104では、第1グラフ情報抽出部32が、一例として、上述の図6に示すように、質問Qの構文構造を表す第1依存構造グラフg1及び第1系列情報H1から、第1依存構造グラフg1を分散表現に変換して得られる第1グラフ情報G1を抽出する。
ステップ106では、第1統合部34が、一例として、上述の図8に示す双線形変換を用いて、ステップ102で抽出された第1系列情報H1と、ステップ104で抽出された第1グラフ情報G1とをかけ合わせて相補的に質問Qの第1統合情報を生成し、ステップ120に移行する。
一方、ステップ108では、第2系列情報抽出部36が、ステップ100で入力を受け付けた質問Qに対応する複数の回答候補Aを質問回答DB14Bから抽出する。
ステップ110では、第2系列情報抽出部36が、ステップ108で抽出した複数の回答候補Aの中から1つの回答候補Aを特定する。
ステップ112では、第2系列情報抽出部36が、ステップ110で特定した回答候補Aから、一例として、上述の図9に示すように、回答候補Aに含まれる単語の順番を表す第2系列情報H2を抽出する。
ステップ114では、第2グラフ情報抽出部38が、一例として、上述の図9に示すように、回答候補Aの構文構造を表す第2依存構造グラフg2及び第2系列情報H2から、第2依存構造グラフg2を分散表現に変換して得られる第2グラフ情報G2を抽出する。
ステップ116では、第2統合部40が、一例として、上述の図10に示す双線形変換を用いて、ステップ112で抽出された第2系列情報H2と、ステップ114で抽出された第2グラフ情報G2とをかけ合わせて相補的に回答候補Aの第2統合情報を生成する。
ステップ118では、第2統合部40が、全ての回答候補Aについて第2統合情報の生成処理が終了したか否かを判定する。全ての回答候補Aについて第2統合情報の生成処理が終了したと判定した場合(肯定判定の場合)、ステップ120に移行し、全ての回答候補Aについて第2統合情報の生成処理が終了していないと判定した場合(否定判定の場合)、ステップ110に戻り処理を繰り返す。
ステップ120では、選択部42が、質問Qの第1統合情報及び複数の回答候補Aの各々の第2統合情報を入力として、質問Qに対して、複数の回答候補Aの各々の適切度を決定する。なお、適切度の導出には、一例として、上述した公知のコサイン類似度が用いられる。
ステップ122では、選択部42が、ステップ120で決定した適切度に基づいて、適切度が最も高い回答候補Aを、質問Qに対する回答として選択し、本選択処理プログラム14Aによる一連の処理を終了する。
次に、図12を参照して、第1の実施形態に係る回答選択手法を適用した場合の性能評価について説明する。
図12は、第1の実施形態に係る回答選択手法を適用した場合の性能評価の一例を示すグラフである。
図12に示す性能評価は、オープンデータセット「WikiQA」を用いて評価した結果を示す。横軸は平均単語数、縦軸は評価値を示す。
図12の(A)は、評価データのうち、回答候補の平均単語数が1〜25単語の短文の場合について示し、図12の(B)は、評価データのうち、回答候補の平均単語数が26〜50単語の長文の場合について示している。
図12の(A)の場合、系列情報のみを用いた従来手法と比較して、本実施形態に係る提案手法のほうが4pt(1pt=0.01)ほど高い評価値を得ていることが分かる。一方、系列情報のみを用いた従来手法と比較して、本実施形態に係る提案手法のほうが7ptほど高い評価値を得ていることが分かる。
このように本実施形態によれば、質問及び回答候補の各々に含まれる単語の順番を表す系列情報に加えて、質問及び回答候補の各々の構文構造を表すグラフ情報を用いて、質問に対する回答の選択が行われる。このため、系列情報のみを用いる場合と比較して、長文であっても適切な回答が得られる。
[第2の実施形態]
上記第1の実施形態では、系列情報及びグラフ情報を用いて、質問に対する回答の選択を行う場合について説明した。本実施形態では、更に、コアテンション(Co-Attention)機能を用いて、質問と回答候補との間の対応関係も考慮して、質問に対する回答の選択を行う場合について説明する。
図13は、第2の実施形態に適用される階層的コアテンションの説明に供するブロック図である。
図13に示す階層的コアテンションでは、第1階層コアテンション及び第2階層コアテンションが含まれる。
第1階層コアテンションでは、依存グラフ層(Dependency Graph Layer)から得られる質問側系列情報H及び回答候補側系列情報Hが文レベルコアテンション(Sentence-level Co-Attention)に入力され、依存グラフ層から得られる質問側グラフ情報G及び回答候補側グラフ情報Gがグラフレベルコアテンション(Graph-level Co-Attention)に入力される。文レベルコアテンションは、質問側系列情報H及び回答候補側系列情報Hを入力として、単語間の対応関係を算出する。グラフレベルコアテンションは、質問側グラフ情報G及び回答候補側グラフ情報Gを入力として、単語間の対応関係を算出する。
文レベルコアテンションの後段にはバイリニア層(Bilinear Layer)が設けられており、このバイリニア層では、文レベルコアテンションからの質問側系列情報Hとグラフレベルコアテンションからの質問側グラフ情報Gとが統合されて質問側統合情報が生成される。一方、グラフレベルコアテンションの後段にも同様にバイリニア層が設けられており、このバイリニア層では、文レベルコアテンションからの回答候補側系列情報Hとグラフレベルコアテンションからの回答候補側グラフ情報Gとが統合されて回答候補側統合情報が生成される。
第2階層コアテンションでは、上記2つのバイリニア層のうち、一方のバイリニア層からの質問側統合情報及び他方のバイリニア層からの回答候補側統合情報が統合コアテンションに入力される。統合コアテンションは、これらの質問側統合情報及び回答候補側統合情報を入力として、中間表現により表される対応関係を相補的に算出する。なお、ここでいう中間表現とは、特徴ベクトルとして表される。
図14は、第2の実施形態に適用される各コアテンションの具体的な対応関係算出方法の説明に供する図である。
図14に示すように、一方の入力である質問Q及び他方の入力である回答候補Aの対応関係を算出する。第1階層コアテンション(図13参照)では、質問Qと回答候補Aとの間の対応関係を単語単位で算出し、第2階層コアテンション(図13参照)では、質問Qと回答候補Aとの間の対応関係を中間表現レベルで算出する。ここで、対応関係は、双線形変換、つまり、tanh(QUA)を用いて算出される。但し、Qは質問、Aは回答候補、Uは重み行列、Qは質問Qの転置を示す。図14に示す「product」は、行列の内積を表している。
次に、図15を参照して、上記の階層的コアテンションが適用された回答選択装置10Bの構成について説明する。
図15は、第2の実施形態に係る回答選択装置10Bの機能的な構成の一例を示すブロック図である。
なお、上記第1の実施形態に係る回答選択装置10Aと同様の機能を有する構成要素には同一の符号を付し、ここでの繰り返しの説明は省略する。
本実施形態に係る回答選択装置10BのCPU12Aは、記憶部14に記憶されている選択処理プログラム14AをRAM12Cに書き込んで実行する。これにより、CPU12Aは、第1系列情報抽出部30、第1グラフ情報抽出部32、第1文レベルコアテンション44、第1グラフレベルコアテンション46、第1統合部48、第2系列情報抽出部36、第2グラフ情報抽出部38、第2文レベルコアテンション50、第2グラフレベルコアテンション52、第2統合部54、統合コアテンション56、及び選択部58として機能する。なお、記憶部14には上記第1の実施形態と同様に質問回答DB14Bが記憶されている。
第1文レベルコアテンション44は、第1系列情報対応関係付与部の一例である。第1文レベルコアテンション44は、第1系列情報抽出部30と第1統合部48との間に設けられている。第1文レベルコアテンション44は、第1系列情報H1及び第2系列情報H2を入力として、単語間の対応関係が付与された第1系列情報H1を単語間対応関係付き第1系列情報H1として出力する。
第1グラフレベルコアテンション46は、第1グラフ情報対応関係付与部の一例である。第1グラフレベルコアテンション46は、第1グラフ情報抽出部32と第1統合部48との間に設けられている。第1グラフレベルコアテンション46は、第1グラフ情報G1及び第2グラフ情報G2を入力として、単語間の対応関係が付与された第1グラフ情報G1を単語間対応関係付き第1グラフ情報G1として出力する。
第2文レベルコアテンション50は、第2系列情報対応関係付与部の一例である。第2文レベルコアテンション50は、第2系列情報抽出部36と第2統合部54との間に設けられている。第2文レベルコアテンション50は、第2系列情報H2及び第1系列情報H1を入力として、単語間の対応関係が付与された第2系列情報H2を単語間対応関係付き第2系列情報H2として出力する。
第2グラフレベルコアテンション52は、第2グラフ情報対応関係付与部の一例である。第2グラフレベルコアテンション52は、第2グラフ情報抽出部38と第2統合部54との間に設けられている。第2グラフレベルコアテンション52は、第2グラフ情報G2及び第1グラフ情報G1を入力として、単語間の対応関係が付与された第2グラフ情報G2を単語間対応関係付き第2グラフ情報G2として出力する。
第1統合部48は、単語間対応関係付き第1系列情報H1と単語間対応関係付き第1グラフ情報G1とを統合して質問Qの単語間対応関係付き第1統合情報を生成する。具体的に、双線形変換を用いて、単語間対応関係付き第1系列情報H1と単語間対応関係付き第1グラフ情報G1とをかけ合わせて相補的に質問Qの単語間対応関係付き第1統合情報を導出する。
第2統合部54は、単語間対応関係付き第2系列情報H2と単語間対応関係付き第2グラフ情報G2とを統合して回答候補Aの単語間対応関係付き第2統合情報を生成する。具体的に、双線形変換を用いて、単語間対応関係付き第2系列情報H2と単語間対応関係付き第2グラフ情報G2とをかけ合わせて相補的に回答候補Aの単語間対応関係付き第2統合情報を導出する。
統合コアテンション56は、統合情報対応関係付与部の一例である。統合コアテンション56は、第1統合部48及び第2統合部54の各々と選択部58との間に設けられている。統合コアテンション56は、単語間対応関係付き第1統合情報及び単語間対応関係付き第2統合情報を入力として、中間表現により表される対応関係が付与された単語間対応関係付き第1統合情報を中間表現対応関係付き第1統合情報とし、中間表現により表される対応関係が付与された単語間対応関係付き第2統合情報を中間表現対応関係付き第2統合情報として各々出力する。
選択部58は、質問Qの中間表現対応関係付き第1統合情報及び複数の回答候補Aの各々の中間表現対応関係付き第2統合情報を入力として、質問Qに対して決定される、複数の回答候補Aの各々の適切度に基づいて、質問Qに対する回答を選択する。なお、適切度の導出には、一例として、上述のコサイン類似度が用いられる。選択部58は、適切度が最も高い回答候補Aを、質問Qに対する回答として選択する。
このように本実施形態によれば、質問及び回答候補の各々に含まれる単語の順番を表す系列情報、質問及び回答候補の各々の構文構造を表すグラフ情報、更に、質問と回答候補との間の対応関係を用いて、質問に対する回答の選択が行われる。このため、系列情報のみを用いる場合と比較して、長文であっても適切な回答が得られる。
以上、実施形態に係る回答選択装置を例示して説明した。実施形態は、回答選択装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、これらのプログラムを記憶したコンピュータが読み取り可能な記憶媒体の形態としてもよい。
その他、上記実施形態で説明した回答選択装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。
10A、10B回答選択装置
12 制御部
12A CPU
12B ROM
12C RAM
12D I/O
14 記憶部
14A 選択処理プログラム
14B 質問回答DB
16 表示部
18 操作部
20 通信部
30 第1系列情報抽出部
30A、32A、36A、38A エンベディング層
30B、36BCNN
32 第1グラフ情報抽出部
32B、38Bソフトエッジアテンション
32C、38Cペアレントチャイルドセルフアテンション
34、48 第1統合部
36 第2系列情報抽出部
38 第2グラフ情報抽出部
40、54 第2統合部
42、58 選択部
44 第1文レベルコアテンション
46 第1グラフレベルコアテンション
50 第2文レベルコアテンション
52 第2グラフレベルコアテンション
56 統合コアテンション

Claims (9)

  1. 質問に含まれる単語の順番を表す第1系列情報と、前記質問の構文構造を表す第1グラフの分散表現である第1グラフ情報とを統合して前記質問の第1統合情報とする第1統合部と、
    前記質問に対する複数の回答候補の各々について、前記回答候補に含まれる単語の順番を表す第2系列情報と、前記回答候補の構文構造を表す第2グラフの分散表現である第2グラフ情報とを統合して前記複数の回答候補の各々の第2統合情報とする第2統合部と、
    前記質問の第1統合情報及び前記複数の回答候補の各々の第2統合情報を入力として、前記質問に対して決定される、前記複数の回答候補の各々の適切度に基づいて、前記質問に対する回答を選択する選択部と、
    を備えた回答選択装置。
  2. 前記第1統合部は、双線形変換を用いて、前記第1系列情報と前記第1グラフ情報とをかけ合わせて相補的に前記質問の第1統合情報を導出し、
    前記第2統合部は、双線形変換を用いて、前記第2系列情報と前記第2グラフ情報とをかけ合わせて相補的に前記回答候補の第2統合情報を導出する請求項1に記載の回答選択装置。
  3. 前記質問から前記第1系列情報を抽出する第1系列情報抽出部と、
    前記第1系列情報及び前記第1グラフから前記第1グラフ情報を抽出する第1グラフ情報抽出部と、
    前記回答候補から前記第2系列情報を抽出する第2系列情報抽出部と、
    前記第2系列情報及び前記第2グラフから前記第2グラフ情報を抽出する第2グラフ情報抽出部と、
    を更に備えた請求項1又は2に記載の回答選択装置。
  4. 前記第1グラフ情報抽出部は、
    前記第1グラフを入力として、前記第1グラフを分散表現に変換して得られる第1グラフ構造情報を出力する第1変換部と、
    前記第1系列情報及び前記第1グラフ構造情報を入力として、前記第1グラフのエッジの重みの強弱が付与された前記第1グラフ構造情報をエッジ重み強弱付き第1グラフ構造情報として出力する第1強弱付与部と、
    前記エッジ重み強弱付き第1グラフ構造情報を入力として、前記第1グラフのエッジの種類が付与された前記第1グラフ構造情報を前記第1グラフ情報として出力する第1種類付与部と、
    を含み、
    前記第2グラフ情報抽出部は、
    前記第2グラフを入力として、前記第2グラフを分散表現に変換して得られる第2グラフ構造情報を出力する第2変換部と、
    前記第2系列情報及び前記第2グラフ構造情報を入力として、前記第2グラフのエッジの重みの強弱が付与された前記第2グラフ構造情報をエッジ重み強弱付き第2グラフ構造情報として出力する第2強弱付与部と、
    前記エッジ重み強弱付き第2グラフ構造情報を入力として、前記第2グラフのエッジの種類が付与された前記第2グラフ構造情報を前記第2グラフ情報として出力する第2種類付与部と、
    を含む請求項3に記載の回答選択装置。
  5. 前記第1系列情報抽出部と前記第1統合部との間に設けられ、かつ、前記第1系列情報及び前記第2系列情報を入力として、単語間の対応関係が付与された前記第1系列情報を単語間対応関係付き第1系列情報として出力する第1系列情報対応関係付与部と、
    前記第1グラフ情報抽出部と前記第1統合部との間に設けられ、かつ、前記第1グラフ情報及び前記第2グラフ情報を入力として、単語間の対応関係が付与された前記第1グラフ情報を単語間対応関係付き第1グラフ情報として出力する第1グラフ情報対応関係付与部と、
    前記第2系列情報抽出部と前記第2統合部との間に設けられ、かつ、前記第2系列情報及び前記第1系列情報を入力として、単語間の対応関係が付与された前記第2系列情報を単語間対応関係付き第2系列情報として出力する第2系列情報対応関係付与部と、
    前記第2グラフ情報抽出部と前記第2統合部との間に設けられ、かつ、前記第2グラフ情報及び前記第1グラフ情報を入力として、単語間の対応関係が付与された前記第2グラフ情報を単語間対応関係付き第2グラフ情報として出力する第2グラフ情報対応関係付与部と、
    を更に備えた請求項3又は4に記載の回答選択装置。
  6. 前記第1統合部は、前記単語間対応関係付き第1系列情報と前記単語間対応関係付き第1グラフ情報とを統合して前記質問の単語間対応関係付き第1統合情報とし、
    前記第2統合部は、前記単語間対応関係付き第2系列情報と前記単語間対応関係付き第2グラフ情報とを統合して前記回答候補の単語間対応関係付き第2統合情報とし、
    前記第1統合部及び前記第2統合部の各々と前記選択部との間に設けられ、かつ、前記単語間対応関係付き第1統合情報及び前記単語間対応関係付き第2統合情報を入力として、中間表現により表される対応関係が付与された前記単語間対応関係付き第1統合情報を中間表現対応関係付き第1統合情報とし、中間表現により表される対応関係が付与された前記単語間対応関係付き第2統合情報を中間表現対応関係付き第2統合情報として各々出力する統合情報対応関係付与部を更に備えた請求項5に記載の回答選択装置。
  7. 前記選択部は、前記質問の中間表現対応関係付き第1統合情報及び前記複数の回答候補の各々の中間表現対応関係付き第2統合情報を入力として、前記質問に対して決定される、前記複数の回答候補の各々の適切度に基づいて、前記質問に対する回答を選択する請求項6に記載の回答選択装置。
  8. 前記第1グラフは、前記質問の構文解析により得られた前記質問の各単語をノードとし、前記質問の構文解析により得られた依存関係ラベルをエッジとする依存構造グラフであり、
    前記第2グラフは、前記回答候補の構文解析により得られた前記回答候補の各単語をノードとし、前記回答候補の構文解析により得られた依存関係ラベルをエッジとする依存構造グラフである請求項1〜7のいずれか1項に記載の回答選択装置。
  9. コンピュータを、請求項1〜8のいずれか1項に記載の回答選択装置が備える各部として機能させるためのプログラム。
JP2019038038A 2019-03-01 2019-03-01 回答選択装置及びプログラム Pending JP2020140674A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019038038A JP2020140674A (ja) 2019-03-01 2019-03-01 回答選択装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019038038A JP2020140674A (ja) 2019-03-01 2019-03-01 回答選択装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2020140674A true JP2020140674A (ja) 2020-09-03

Family

ID=72265019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019038038A Pending JP2020140674A (ja) 2019-03-01 2019-03-01 回答選択装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2020140674A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220083414A (ko) * 2020-12-11 2022-06-20 건국대학교 산학협력단 문서 수준 관계 추출 방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220083414A (ko) * 2020-12-11 2022-06-20 건국대학교 산학협력단 문서 수준 관계 추출 방법 및 장치
KR102511282B1 (ko) * 2020-12-11 2023-03-17 건국대학교 산학협력단 문서 수준 관계 추출 방법 및 장치

Similar Documents

Publication Publication Date Title
CN109033305B (zh) 问题回答方法、设备及计算机可读存储介质
US10170104B2 (en) Electronic device, method and training method for natural language processing
KR102542914B1 (ko) 다중언어 번역 장치 및 다중언어 번역 방법
US20210256390A1 (en) Computationally efficient neural network architecture search
US10628474B2 (en) Probabalistic generation of diverse summaries
JP6493866B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5377889B2 (ja) 言語処理装置およびプログラム
JP3768205B2 (ja) 形態素解析装置、形態素解析方法及び形態素解析プログラム
CN109376222B (zh) 问答匹配度计算方法、问答自动匹配方法及装置
CN111145718A (zh) 一种基于自注意力机制的中文普通话字音转换方法
US20210279622A1 (en) Learning with limited supervision for question-answering with light-weight markov models
WO2020170912A1 (ja) 生成装置、学習装置、生成方法及びプログラム
JP2017125921A (ja) 発話選択装置、方法、及びプログラム
JP2022145623A (ja) ヒント情報を提示する方法及び装置並びにコンピュータプログラム
JP2020060970A (ja) コンテキスト情報生成方法、コンテキスト情報生成装置およびコンテキスト情報生成プログラム
JP2019204214A (ja) 学習装置、学習方法、プログラム及び推定装置
JP7279099B2 (ja) 対話管理
JP6605997B2 (ja) 学習装置、学習方法及びプログラム
JP2020140674A (ja) 回答選択装置及びプログラム
US20240013769A1 (en) Vocabulary selection for text processing tasks using power indices
JP6545633B2 (ja) 単語スコア計算装置、単語スコア計算方法及びプログラム
JP2014232145A (ja) ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム
JP7327647B2 (ja) 発話生成装置、発話生成方法、プログラム
JP4576977B2 (ja) 情報処理装置および方法、並びにプログラム
JP6574469B2 (ja) 次発話候補ランキング装置、方法、及びプログラム