JP2019020774A - 対話システムおよび対話方法 - Google Patents

対話システムおよび対話方法 Download PDF

Info

Publication number
JP2019020774A
JP2019020774A JP2017135625A JP2017135625A JP2019020774A JP 2019020774 A JP2019020774 A JP 2019020774A JP 2017135625 A JP2017135625 A JP 2017135625A JP 2017135625 A JP2017135625 A JP 2017135625A JP 2019020774 A JP2019020774 A JP 2019020774A
Authority
JP
Japan
Prior art keywords
question
attribute
questions
intention understanding
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017135625A
Other languages
English (en)
Other versions
JP6769405B2 (ja
Inventor
拓磨 峰村
Takuma Minemura
拓磨 峰村
整 加藤
Hitoshi Kato
整 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2017135625A priority Critical patent/JP6769405B2/ja
Publication of JP2019020774A publication Critical patent/JP2019020774A/ja
Application granted granted Critical
Publication of JP6769405B2 publication Critical patent/JP6769405B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】対話システムにおいて、ユーザからの自然文による質問が曖昧である場合でも、適切な回答生成を可能とする。【解決手段】対話システムは、あらかじめ定められた複数の質問と、前記複数の質問の属性を表す1つ以上の属性項目と、前記複数の質問ごとの前記属性項目の内容を表す属性値を対応付けて保持する記憶手段と、ユーザの質問文のテキストからキーワードを抽出する抽出手段と、前記複数の質問の内、前記テキストと合致する質問の候補を求める第一意図理解手段と、前記複数の質問のそれぞれと前記テキストの一致度を表すスコアを求める第二意図理解手段と、質問を特定する質問特定手段と、を備え、前記質問特定手段は、前記第二意図理解手段の処理結果から、質問が一意に定まる場合は、当該結果からユーザの質問を特定し、質問が一意に定まらない場合は、前記第一および第二意図理解手段の処理結果からユーザの質問を特定する、対話システムである。【選択図】図5

Description

本発明は、対話システムに関し、特に、ユーザからの質問に対して回答を生成する質問応答システムに関連する。
質問応答システムでは、ユーザからの自然文による質問に対して、適切な回答を生成することが望まれている。
特許文献1では、ユーザ入力された自然文を解析した結果と、それぞれの状況において要求される機能を判別するように機械学習された識別機を用いる。そして、これらを比較することで、ユーザがシステムに要求している機能を抽出している。
特許文献2では、ユーザ入力された質問文中の単語や文節の曖昧度を求めて、曖昧度の高い単語や文節の意味を特定するための問いかけ文を生成する。これを繰り返し行い、適切な回答を生成している。
特開2016−151928号公報 特開2004−110524号公報
しかしながら、特許文献1ではユーザの入力が曖昧である場合に、適切な回答を生成することができない。また、特許文献2は、自明の事柄が省略された場合も絞込み対話が発生してしまうため、ユーザとシステムとの間の冗長な対話が発生してしまう。
本発明は、対話システムにおいて、ユーザからの自然文による質問が曖昧である場合でも、質問を特定し、適切な回答を生成することを目的とする。
本発明の第一の態様は、
ユーザの質問文のテキストを取得する取得手段と、
あらかじめ定められた複数の質問と、前記複数の質問の属性を表す1つ以上の属性項目と、前記複数の質問ごとの前記属性項目の内容を表す属性値を対応付けて保持する記憶手段と、
前記テキストから、前記属性項目もしくは前記属性値またはこれらの類義語に関連するキーワードを抽出する抽出手段と、
前記キーワードと前記記憶手段を用いて、前記複数の質問の内、前記テキストと合致する質問の候補を求める第一意図理解手段と、
前記複数の質問のそれぞれと前記テキストの一致度を表すスコアを前記複数の質問ごとに求める第二意図理解手段と、
前記第一意図理解手段または前記第二意図理解手段の処理結果から、質問を特定する質問特定手段と、
を備え、
前記質問特定手段は、
前記第二意図理解手段の処理結果から、質問が一意に定まる場合は、前記第二意図理
解手段の処理結果からユーザの質問を特定し、
前記第二意図理解手段の処理結果から、質問が一意に定まらない場合は、前記第一意図理解手段および前記第二意図理解手段の処理結果からユーザの質問を特定する、
対話システムである。
このような構成によれば、前記質問特定手段は、ユーザの質問文が曖昧である場合でも、第一意図理解手段によって得られる質問の候補または第二意図理解手段によって得られるスコアから、質問を特定することができる。よって、適切な回答を返すことができる。
本発明において、記憶手段は、あらかじめ定められた複数の質問を保持する。また、記憶手段は、前記複数の質問を特定するための項目として、前記複数の質問の属性(特徴)を表す「属性項目」を保持する。さらに、記憶手段は、各属性が実際にとる値(内容)である「属性値」を保持する。
例えば、「車のトラブルに関する質問応答システム」の場合、「属性項目」は、車のトラブルに関する任意の質問を特定可能とする項目であることが好ましい。例えば、「属性項目」は、[<パーツ>,<症状>,<質問形式>]等とすることができる。また、上記の例において、あらかじめ定められた質問「エンジンから異音がする場合どうすればよいか?」が設けられているとすると、この質問に対応する「属性値」は、[「エンジン」,「異音」,「how」]等とすることができる。
本発明において、前記質問特定手段は、前記スコアを正規化した値が所定の閾値以上となる質問が1つとなる場合に、質問が一意に定まると判断する、ことが好ましい。
また、本発明において、前記質問特定手段における、前記第二意図理解手段を用いる質問の特定は、前記複数の質問すべてを対象に前記スコアを正規化した値が所定の閾値以上となる質問を、ユーザの質問であると特定することにより行う、ことが好ましい。さらに、前記質問特定手段における、前記第一意図理解手段および前記第二意図理解手段を用いる質問の特定は、前記第一意図理解手段によって得られる質問の候補を対象に前記スコアを正規化した値が所定の閾値以上となる質問を、ユーザの質問であると特定することにより行う、ことが好ましい。
このように、第二意図理解手段の処理結果のみで質問を一意に特定することができない場合であっても、第一意図理解手段の処理結果を用いることで、質問特定手段は質問を特定することができる。
本発明において、前記質問特定手段によって質問が一意に定まらない場合に、前記抽出手段によりキーワードが抽出されていない前記属性項目についてユーザへの問いかけ文を生成する問いかけ文生成手段をさらに備える、ことが好ましい。
これにより、最初にユーザ入力された質問からキーワードが抽出されていない属性項目等について問いかけることができるため、ユーザの質問が曖昧である場合でも対処することができる。具体的な例として、上述の「車のトラブルに関する質問応答システム」において、ユーザから「エンジンがなんかおかしいな」といった質問が入力されたとする。この場合、抽出手段によってキーワード「エンジン」が抽出されるため、属性項目<パーツ>については「エンジン」に関する質問であると判断できる。ここで、属性項目<症状>については不明であるため、キーワードが抽出されていない属性項目<症状>を用いて「どのような症状でしょうか?」と問いかけ文を生成することができる。
本発明において、前記問いかけ文生成手段は、前記抽出手段によりキーワードが抽出さ
れていない前記属性項目の内、前記属性値が複数種類存在する前記属性項目の前記属性値を用いて問いかけ文を生成する、ことができる。
これにより、問いかけ文生成手段は、具体的な属性値の内容について問いかけ文を生成することができるため、ユーザとの冗長な対話を回避することができる。具体的には、上述の質問において、属性項目<パーツ>が「エンジン」に絞り込まれた結果、例えば、問いかけ文生成手段は、キーワードが抽出されていない属性項目<症状>の属性値について「Aですか?またはBですか?」といった問いかけ文を生成することができる。また、問いかけ文生成手段は、属性値が複数種類存在する属性項目の属性値を用いることで、例えば、属性項目<症状>の属性値が「xxx」の1種類しか存在しない場合に、「xxxですか?」といった冗長な問いかけ文の生成を回避することができる。
本発明において、前記問いかけ文生成手段は、前記複数の質問の内、前記スコアを正規化した値が所定値以上の質問のみを対象とし、かつ、平均情報量(エントロピー)が最大の前記属性項目の前記属性値を用いて問いかけ文を生成する、ことができる。
このように、問いかけ文生成手段は、ユーザの質問により近いと想定される質問に絞り込み、かつ、平均情報量を基にして、どの属性項目について問いかけをするかを決定することができるので、質問の特定に要する対話回数を最小限に留めることができる。
また、本発明において、前記問いかけ文生成手段は、前記属性項目の内、複数の属性項目について、前記属性値を問いかけ文として用いる、こともできる。
さらに、本発明において、前記質問特定手段において質問が一意に定まるまで、前記問いかけ文生成手段、前記第一意図理解手段、前記第二意図理解手段および前記質問特定手段の処理を繰り返す、こともできる。
また本発明において、前記第二意図理解手段は、機械学習により生成した分類器を用いて前記スコアを求める、ことが好ましい。
なお、本発明は、上記手段の少なくとも一部を備える対話システムとして捉えることもできる。本発明は、また、上記処理の少なくとも一部を実行する対話方法として捉えることができる。また、本発明は、この方法をコンピュータに実行させるためのコンピュータプログラム、あるいはこのコンピュータプログラムを非一時的に記憶したコンピュータ可読記憶媒体として捉えることもできる。上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
例えば、本発明の一態様は、
あらかじめ定められた複数の質問と、前記複数の質問の属性を表す1つ以上の属性項目と、前記複数の質問ごとの前記属性項目の内容を表す属性値を対応付ける記憶手段を備えるコンピュータが実行する対話方法であって、
ユーザの質問文のテキストを取得する取得ステップと、
前記テキストから、前記属性項目もしくは前記属性値またはこれらの類義語に関連するキーワードを抽出する抽出ステップと、
前記キーワードと前記記憶手段を用いて、前記複数の質問の内、前記テキストと合致する質問の候補を求める第一意図理解ステップと、
前記複数の質問のそれぞれと前記テキストの一致度を表すスコアを前記複数の質問ごとに求める第二意図理解ステップと、
前記第一意図理解ステップまたは前記第二意図理解ステップの処理結果から、質問を特定する質問特定ステップと、
を含み、
前記質問特定ステップでは、
前記第二意図理解ステップの処理結果から、質問が一意に定まる場合は、前記第二意図理解ステップの処理結果からユーザの質問を特定し、
前記第二意図理解ステップの処理結果から、質問が一意に定まらない場合は、前記第一意図理解ステップおよび前記第二意図理解ステップの処理結果からユーザの質問を特定する、
対話方法である。
本発明によれば、対話システムにおいて、ユーザからの自然文による質問が曖昧である場合でも、質問を特定し、適切な回答を生成することが可能となる。
図1は、実施形態に係る音声対話システムの構成を示す図である。 図2は、実施形態に係る記憶部の構成の例を示す図である。 図3は、実施形態に係る機械学習型分類部の処理の例を示す図である。 図4は、実施形態に係る質問特定部の処理の例を示す図である。 図5は、実施形態に係る音声対話処理の流れの例を示すフローチャートである。 図6は、実施形態に係る問いかけ文生成処理の流れの例を示すフローチャートである。 図7は、実施形態に係る問いかけ文生成処理の質問の絞り込み方法の例を示す図である。 図8は、実施形態に係る問いかけ文生成処理の属性項目の選択方法の例を示す図である。
以下、図面を参照して、本発明の実施の形態を例示的に詳しく説明する。なお、以下の説明は本発明を例示的に説明するものであり、本発明は以下の実施形態に限定されるものではない。
<システム構成>
図1は、本実施形態に係る音声対話システムの構成を示す図である。本実施形態に係る音声対話システムは、音声対話装置100およびスマートフォン200を備える。
本実施形態に係る音声対話装置100は、演算装置、記憶装置、入出力装置などを含む情報処理装置(コンピュータ)である。記憶装置に格納されたプログラムを演算装置が実行することで、音声対話装置100の、取得部110、記憶部120、抽出部130、ルールベース型分類部140、機械学習型分類部150、質問特定部160、問いかけ文生成部170、回答生成部180等の機能が提供される。
また、本実施形態に係るスマートフォン200は、マイクやスピーカー等を含む情報処理装置(コンピュータ)を備える。スマートフォン200は、ユーザの発話内容(質問)を取得し、発話内容をテキストに変換した後、音声対話装置100に出力する。また、スマートフォン200は、音声対話装置100より問いかけ文や回答文を取得し、音声等でユーザに出力する。
取得部110は、本実施形態では、スマートフォン200を介してユーザの質問文のテキストを取得する。
記憶部120は、あらかじめ定められた複数の質問と、複数の質問の属性を表す1つ以上の属性項目と、複数の質問それぞれに対して属性項目が実際とる値(内容)である属性値を保持する。
図2は、本実施形態に係る「車のトラブルに関する質問応答システム」における記憶部120の例を示す。図2の例では、記憶部120に複数の質問(ID)121ならびに属性項目122(パーツ)、属性項目123(症状)および属性項目124(質問形式)を記憶している。また、図2の例では、記憶部120に<パーツ>に該当する属性値「エンジン」および「タイヤ」、<症状>に該当する属性値「xxx」および「yyy」、<質問形式>に該当する属性値「how」および「what」を記憶している。
なお、図2の例では属性項目が3つの場合を示しているが、属性項目の数はいくつであっても構わない。また、記憶部120の属性項目および属性値の内容は特に限定されない。また、図2では、記憶部120の構成として表(テーブル)を用いているが、データ構造は特に限定されない。記憶部120は、あらかじめ定められた質問を特定できるように構成されていればよい。
なお、記憶部120のすべての属性値の内容が一致する質問が複数あってもよい。例えば、図2の属性項目[<パーツ>,<症状>,<質問形式>]の属性値が、[「エンジン」,「異音」,「how」]である質問が2つ以上あってもよい。このような構成とした場合でも、後述するように、記憶部120を用いて質問の候補を求めることができる。また、記憶部120は、手動で作成してもよく、機械学習等を用いて作成してもよい。さらに、記憶部120の内容は固定でもよいし、追加、更新および削除等を行ってもよい。
抽出部130は、入力されたテキストから、記憶部120の属性項目もしくは属性値またはこれらの類義語に関連するキーワードを抽出する。ここで、ユーザが以下のような曖昧な質問をした場合、抽出部130は、図2に示す記憶部120を参照して、質問文中の属性値に関連するキーワード「エンジン」を抽出する。
「エンジンがなんかおかしいな」
なお、抽出方法は特に限定されない。たとえば、抽出部130は、形態素解析等を用いてテキストに含まれるすべての単語等を抽出してもよい。
ルールベース型分類部140(第一意図理解手段)は、記憶部120および抽出部130の抽出結果から、ユーザの質問と合致する質問の候補を求める。まず、ルールベース型分類部140は、抽出部130の抽出したキーワードと、記憶部120の属性値を参照する。そして、ルールベース型分類部140は、キーワードに関連する属性値を有する質問を、ユーザの質問の候補として出力する。ここで、キーワードが抽出された属性項目を属性項目群A、キーワードが抽出されていない属性項目を属性項目群Bと称する。
例えば、ユーザが上述のような曖昧な質問をした場合、まず、ルールベース型分類部140は抽出部130が抽出した質問文のキーワード「エンジン」および記憶部120の属性値を参照する。そして、ルールベース型分類部140は、キーワード「エンジン」に関連する属性値を有する質問を候補として求める。記憶部120が図2に示す構成の場合、<パーツ>の属性値に「エンジン」が設定されている質問1から5が質問の候補として出力される。この場合、属性項目<パーツ>は属性項目群A、属性項目<症状>および<質問形式>は属性項目群Bに含まれる。
機械学習型分類部150(第二意図理解手段)は、あらかじめ定められた質問のそれぞ
れと、取得部110より出力されたテキストとの一致度(スコア)を求める。本実施形態では、機械学習型分類部150は、機械学習を用いて生成された分類器を用いてスコアの算出を行う。機械学習を用いた分類器の作成方法に関しては、既存の手法を用いる。分類器によって求められたスコアの例を図3(A)に示す。
質問特定部160は、ルールベース型分類部140または機械学習型分類部150の処理結果を用いてユーザの質問を特定する。本実施形態では、機械学習型分類部150の処理結果から質問が一意に定まる場合は、質問特定部160は、当該質問をユーザの質問であると特定する。また、機械学習型分類部150の処理結果からユーザの質問が一意に定まらない場合は、質問特定部160は、ルールベース型分類部140および機械学習型分類部150を用いて判断を行う。質問特定部160の詳細については、図5のフローチャートを用いた処理説明において行う。
問いかけ文生成部170は、質問特定部160において質問が一意に定まらない場合に、ユーザへの問いかけ文を生成する。そして、生成された問いかけ文はスマートフォン200を介してユーザに出力される。本実施形態では、問いかけ文生成部170は、ルールベース型分類部140の算出結果から得られる質問の候補を対象に、属性項目群Bの属性値を用いて問いかけ文を生成する。問いかけ文生成部170の詳細については、図5および6のフローチャートを用いた処理説明において行う。
回答生成部180は、質問特定部160によって特定された質問に対する回答を生成する。そして、生成された回答はスマートフォン200を介してユーザに出力される。本実施形態では、回答生成部180は、質問と回答が1対1に対応付けられる第2記憶手段(不図示)を参照して回答文を生成する。
<処理内容>
本実施形態に係る音声対話システムにおける処理について、上述と同様、ユーザから「エンジンがなんかおかしいな」といった質問が入力された例について図5を参照して説明する。
ステップS102において、取得部110は、スマートフォン200を介してユーザの質問のテキストを取得する。
ステップS104において、機械学習型分類部150は、あらかじめ定められた複数の質問ぞれぞれと、取得されたテキストとの一致度(スコア)を算出する。
ステップS106において、質問特定部160は、ステップS104の処理結果を用いて質問が一意に定まるか否かを判断する。具体的には、質問特定部160は、ステップS104において複数の質問すべてに対して算出されたスコアを合計値が1となるように正規化し、正規化後の値(確信度)が所定の閾値以上となる質問が一意に定まるか否かを判断する。ここで、所定の閾値とは、それ以上であればユーザの意図した質問であるとみなせるような確信度の値である。図3(B)は、図3(A)のすべての質問を対象に、スコアを正規化して得られる確信度の例である。質問特定部160は、質問が一意に定まる場合には、当該質問をユーザの質問であると特定し、ステップS118に進む。質問が一意に定まらない場合は、ステップS110に進む。
ステップS108において、ステップS106の処理の結果、質問が一意に定まらないと判断された場合(S106−NO)、抽出部130は、ステップS102において取得したテキストから、記憶部120の属性項目もしくは属性値またはこれらの類義語に関連するキーワードを抽出する。
ステップS110において、ルールベース型分類部140は、抽出されたキーワードと記憶部120を参照して、ユーザの質問の候補を算出する。
ステップS112において、質問特定部160は、ステップS110の処理結果から質問が一意に定まるか否かを判断する。具体的には、候補として算出された質問のみを対象に、再度、スコアの正規化を行う。そして、質問特定部160は、得られた値(確信度)が所定の閾値以上となる質問が一意に定まるか否かを判断する。本実施形態では、ステップS106とステップS112において同じ閾値を用いるが、異なる値を用いてもよい。質問が一意に定まる場合には、質問特定部160は当該質問をユーザの質問であると特定して、ステップS118に進む。質問が一意に定まらない場合は、ステップS114に進む。図4(A)は、あらかじめ定められた質問すべてを対象にスコアを正規化した例を示す。図4(B)は、ルールベース型分類部140が算出した質問の候補のみを対象にスコアを正規化した例を示す。
ステップS114では、ステップS112において質問が一意に定まらないと判断された場合(S112−NO)、問いかけ文生成部170がユーザへの問いかけ文を生成する。本実施形態では、問いかけ文生成部170は、属性項目群Bに含まれる属性項目の属性値を用いて問いかけ文を生成する。そして、生成された問いかけ文は、スマートフォン200を介してユーザに出力される。ステップS114の詳細については、後述の図6のフローチャートを用いた処理説明において行う。
ステップS116において、システムからユーザに対して問いかけがされた後に、ユーザからの応答が検出された場合は、ルールベース型分類部140は、再度、質問の候補の算出を行い、ステップS112に進む。そして、質問が一意に定まるまでステップS112から116の処理を繰り返す。
ステップS118では、上記ステップにおいて質問が一意に定まる場合(S106−YES、S112−YES)、回答生成部180は、質問に適した回答を行う。回答は、スマートフォン200を介してユーザに出力される。
(問いかけ文生成処理)
ステップS114の処理の詳細を、図6および7を参照して説明する。
≪ステップS1141≫
ステップS1141において、問いかけ文生成部170は質問の絞り込みを行う。具体的には、問いかけ文生成部170は確信度が所定値以上の質問を選択する。ここで、所定値とは、それ未満であればユーザの意図した質問ではないとみなせるような確信度の値である。本実施形態では、所定値は上述の所定の閾値未満の値を用いるが、所定の閾値以上でもよい。図7は、問いかけ文生成部170が、所定値0.10で質問を絞り込む例である。図7の例では、問いかけ文生成部170は、ステップS110において算出された5つの質問を、質問1から4の4つに絞り込んでいる。
≪ステップS1142≫
ステップS1142において、問いかけ文生成部170は、問いかけ文に用いる属性項目を選択する。まず、問いかけ文生成部170は、キーワードが抽出されていない属性項目群Bに着目する。そして、問いかけ文生成部170は、属性項目群Bに含まれる属性項目の内、ステップS1141の処理で絞り込まれた質問に対応する属性値が複数種類存在する属性項目を選択する。図7の例では、問いかけ文生成部170は、まず、属性項目群Bに含まれる属性項目<症状>、<質問形式>に着目する。そして、属性項目ごとに絞り
込まれた質問1から4に対応する属性値が複数種類存在する属性項目を選択する。具体的には、属性項目<症状>に該当する属性値は「xxx」、「yyy」、「zzz」および「www」の4種類、属性項目<質問形式>に該当する属性値は「how」の1種類のみである。よって、図7の例では、問いかけ文生成部170は、複数の属性値が存在する属性項目<症状>を選択する。
≪ステップS1143≫
ステップS1143において、ステップS1142の処理結果から選択された属性項目が1つか否かを判断する。選択された属性項目が1つの場合には、問いかけ文生成部170は、当該属性項目を問いかけ文に用いる属性項目とし、ステップS1145に進む。選択された属性項目が2つ以上の場合は、ステップS1144に進む。
≪ステップS1144≫
ステップS1144では、ステップS1143において属性項目が1つに決定されない場合(S1143−NO)に、問いかけ文生成部170は、ステップS1142において選択された複数の属性項目から問いかけ文に用いる属性項目を決定する。
ここで、後述するステップS1145では、問いかけ文生成部170は、ステップS1144において決定する属性項目について、2種類の属性値を用いて問いかけ文を生成する。例えば、属性項目<症状>について「Aですか?またはBですか?」(属性値が3種類以上存在する場合は「Aですか?またはBですか?それとも他の症状ですか?」)といった問いかけ文を生成する。
よって、ステップS1144における属性項目の決定方法として、問いかけ文生成部170は、例えば、上記の問いかけを行う場合の平均情報量(エントロピー)を考慮して属性項目を決定することができる。具体的には、問いかけ文生成部170は、属性項目ごとに各属性値の確信度を用いて平均情報量の算出を行い、求まる値が最大の属性項目を用いて問いかけ文を生成する。以下、図8を用いて、平均情報量を考慮した属性項目の決定方法について説明する。
図8は、ステップS1142において複数の属性項目が選択された例である。このような場合、問いかけ文生成部170は、ステップS1141において絞り込まれた質問を対象に再度正規化を行った確信度から、以下の式1を用いて平均情報量を求める。
Figure 2019020774

Eは属性項目ごとの平均情報量、PからPは所定の属性値で集約した確信度の合計値である。
ここで、問いかけ文生成部170は、2種類の属性値を選ぶ。例えば、図8に示す記憶部320の属性項目<症状>の場合、問いかけ文生成部170は、1つ目の属性値は「xxx」、2つ目の属性値は「yyy」を選ぶ。なお、本実施形態では、属性値が3種類以上存在する場合は、後述するステップS1145の処理と同様に、スコアの降順で上位2種類の属性値を用いるが、属性値の選択方法については特に限定されない。例えば、問いかけ文生成部170は、属性値をランダムに2種類選択してもよい。
そして、1つ目の属性値で集約した確信度の合計値をP、2つ目の属性値で集約した確信度の合計値をPとする。また、属性値が3種類以上ある場合は、3つ目以降のすべての属性値の確信度の合計値をP(P=1−P−P)とする。
図8に示す記憶部320の例では、属性項目<症状>の平均情報量は1.57(P=0.31,P=0.28,P=0.41)、属性項目<質問形式>の平均情報量は0.99(P=0.45,P=0.55,P=0.00)である。よって、問いかけ文生成部170は、問いかけ文生成に用いる属性項目を、平均情報量が最大の属性項目<症状>に決定する。
なお、平均情報量の算出に用いる属性値の選択方法は特に限定されず、例えば、問いかけ文生成部170は属性値をランダムに選んでもよい。また、平均情報量の算出に用いる属性値の種類は2種類に限定されず、例えば、問いかけ文生成部170は、1種類または3種類以上の属性値を用いて平均情報量を算出してもよい。
なお、ステップS1144における属性項目の決定方法として、上述の平均情報量を考慮する方法以外に、例えば、問いかけ文生成部170は、ランダムに属性項目を選んでもよい。また、あらかじめ属性項目に優先順位を設定して、問いかけ文生成部170は優先順位に従って優先度の高い属性項目を選んでもよい。さらに、問いかけ文生成部170は、属性値の種類に応じて、例えば、種類が最も多い属性項目を選んでもよい。
≪ステップS1145≫
ステップS1145では、上述の通り、ステップS1143(S1143−YES)またはステップS1144において決定された属性項目の属性値を2種類用いて問いかけ文を生成する。例えば、属性項目<症状>の属性値「xxx」および「yyy」を用いる場合、問いかけ文生成部170は、以下の問いかけ文を生成する。
「xxxですか?またはyyyですか?それとも他の症状ですか?」
ここで、本実施形態では、問いかけ文生成部170は、属性値が3種類以上存在する場合は、スコアの降順で上位2種類の属性値を用いるが、属性値の選択方法については特に限定されない。例えば、問いかけ文生成部170は、属性値をランダムに2種類選択してもよい。
なお、本実施形態では、問いかけ文に2種類の属性値を用いる例について説明したが、数は特に限定されない。例えば、問いかけ文生成部170は、該当する属性項目の全ての属性値を用いて問いかけ文を生成してもよい。
<本実施形態の有利な効果>
本実施形態によれば、ユーザの質問が曖昧なため問い返しが必要な場合でも、得られる情報量を考慮して問いかけを行うことで、質問の特定に要する対話回数を最小限に留めることができる。
<変形例>
取得部110が取得するデータはテキストに限らない。例えば、取得部110はユーザの発話の音声等を取得してもよい。また、取得部110は、通信等によりデータ取得してもよい。
また、本実施形態では、音声対話装置システムが、2つの分類部(意図理解部)を用いる例について説明したが、それぞれの構成は特に限定されない。第一の分類部については、複数の質問とそれらの特徴等を保持するテーブル等を用いる構成であればよく、第二の分類部については、複数の質問のそれぞれとユーザの質問とのスコア(一致度)が求まる構成であればよい。例えば、音声対話装置100は、スコアの算出に、ルールベース型分類部140で用いるものとは異なるルールベース型の分類器を用いてスコアを求めてもよい。
また、音声対話装置100は、回答生成部180で用いる第2記憶手段(不図示)を有していなくてもよい。例えば、回答は記憶部120に設けられていてもよい。さらに、音声対話装置100は、回答生成部180を有していなくてもよく、この場合、質問特定部160が質問の特定および回答の生成を行ってもよい。
また、本実施形態では、ステップS114において、問いかけ文生成部170は、いずれか1つの属性項目(の属性値)を用いてユーザへの問いかけ文を生成しているが、問いかけ文に用いる属性項目は1つに限らない。例えば、問いかけ文生成部は<症状>について問いかけるとともに、<質問形式>について同時に問いかけてもよい。このように複数の属性項目について問いかけ文を生成することで、問いかけに要する対話回数をさらに抑えることができる。
さらに、本実施形態では、ステップS114において、問いかけ文生成部170は属性項目群Bに含まれるいずれかの属性値を用いて問いかけ文を生成する例について説明したが、問いかけ文の生成方法はこれに限らない。ユーザの質問を特定できるような問いかけ文であればよい。例えば、上述の例において、問いかけ文生成部170は、ユーザの質問から自明な内容(属性項目群A)である「エンジン」を用いて「エンジンのどのようなトラブルでしょうか?」といった問いかけ文を生成してもよい。さらに、記憶部120に設けられた単語等を含まない問いかけ文を生成してもよく、例えば、上述の例において質問中のキーワード「エンジン」以外を用いて、「なんかおかしい、とは具体的にどのようなトラブルでしょうか」といった問いかけ文を生成してもよい。
なお、スマートフォン200への入力は音声に限らず、例えば、キーボードで入力されたテキスト等でもよい。また、スマートフォン200からユーザへの出力はテキスト等であってもよい。さらに、本実施形態に係るスマートフォン200は、音声をテキストに変換する役割を果たしていればよく、例えば、PC等に置き換えることもできる。また、質問応答システムは、スマートフォン200を用いなくてもよい。例えば、音声対話装置100に、マイク、スピーカーおよびディスプレイ等を設けて、ユーザの質問を直接取得してもよく、ユーザに直接問いかけおよび回答を行ってもよい。
また、本実施形態では、正規化後の確信度を用いた例について説明したが、これに限らない。例えば、機械学習型分類部150によって求められたスコアそのものを用いて質問の特定等を行ってもよい。この場合、上記の所定の閾値等は、スコアに対して設ければよい。
また、本実施形態では、「車のトラブルに関する質問応答システム」を例に説明をしたが、質問の対象はこれに限定されない。
<その他>
上記の実施形態および変形例の構成は、本発明の技術的思想を逸脱しない範囲内で、適宜組み合わせて利用することができる。また、本発明は、その技術的思想を逸脱しない範囲で適宜変更を加えて実現しても構わない。
100:音声対話装置
110:取得部
120,220,320:記憶部
130:抽出部
140:ルールベース型分類部
150:機械学習型分類部
160:質問特定部
170:問いかけ文生成部
180:回答生成部
200:スマートフォン

Claims (11)

  1. ユーザの質問文のテキストを取得する取得手段と、
    あらかじめ定められた複数の質問と、前記複数の質問の属性を表す1つ以上の属性項目と、前記複数の質問ごとの前記属性項目の内容を表す属性値を対応付けて保持する記憶手段と、
    前記テキストから、前記属性項目もしくは前記属性値またはこれらの類義語に関連するキーワードを抽出する抽出手段と、
    前記キーワードと前記記憶手段を用いて、前記複数の質問の内、前記テキストと合致する質問の候補を求める第一意図理解手段と、
    前記複数の質問のそれぞれと前記テキストの一致度を表すスコアを前記複数の質問ごとに求める第二意図理解手段と、
    前記第一意図理解手段または前記第二意図理解手段の処理結果から、質問を特定する質問特定手段と、
    を備え、
    前記質問特定手段は、
    前記第二意図理解手段の処理結果から、質問が一意に定まる場合は、前記第二意図理解手段の処理結果からユーザの質問を特定し、
    前記第二意図理解手段の処理結果から、質問が一意に定まらない場合は、前記第一意図理解手段および前記第二意図理解手段の処理結果からユーザの質問を特定する、
    対話システム。
  2. 前記質問特定手段は、前記スコアを正規化した値が所定の閾値以上となる質問が1つとなる場合に、質問が一意に定まると判断する、
    請求項1に記載の対話システム。
  3. 前記質問特定手段における、前記第二意図理解手段を用いる質問の特定は、
    前記複数の質問すべてを対象に前記スコアを正規化した値が所定の閾値以上となる質問を、ユーザの質問であると特定することにより行い、
    前記質問特定手段における、前記第一意図理解手段および前記第二意図理解手段を用いる質問の特定は、
    前記第一意図理解手段によって得られる質問の候補を対象に前記スコアを正規化した値が所定の閾値以上となる質問を、ユーザの質問であると特定することにより行う、
    請求項1または2に記載の対話システム。
  4. 前記質問特定手段によって質問が一意に定まらない場合に、前記抽出手段によりキーワードが抽出されていない前記属性項目についてユーザへの問いかけ文を生成する問いかけ文生成手段、
    をさらに備える請求項1から3のいずれか1項に記載の対話システム。
  5. 前記問いかけ文生成手段は、前記抽出手段によりキーワードが抽出されていない前記属性項目の内、前記属性値が複数種類存在する前記属性項目の前記属性値を用いて問いかけ文を生成する、
    請求項4に記載の対話システム。
  6. 前記問いかけ文生成手段は、前記複数の質問の内、前記スコアを正規化した値が所定値以上の質問のみを対象とし、かつ、平均情報量(エントロピー)が最大の前記属性項目の前記属性値を用いて問いかけ文を生成する、
    請求項5に記載の対話システム。
  7. 前記問いかけ文生成手段は、前記属性項目の内、複数の属性項目について、前記属性値を問いかけ文として用いる、
    請求項6に記載の対話システム。
  8. 前記質問特定手段において質問が一意に定まるまで、前記問いかけ文生成手段、前記第一意図理解手段、前記第二意図理解手段および前記質問特定手段の処理を繰り返す、
    請求項4から7のいずれか1項に記載の対話システム。
  9. 前記第二意図理解手段は、機械学習により生成した分類器を用いてスコアを求める、
    請求項1から8のいずれか1項に記載の対話システム。
  10. あらかじめ定められた複数の質問と、前記複数の質問の属性を表す1つ以上の属性項目と、前記複数の質問ごとの前記属性項目の内容を表す属性値を対応付ける記憶手段を備えるコンピュータが実行する対話方法であって、
    ユーザの質問文のテキストを取得する取得ステップと、
    前記テキストから、前記属性項目もしくは前記属性値またはこれらの類義語に関連するキーワードを抽出する抽出ステップと、
    前記キーワードと前記記憶手段を用いて、前記複数の質問の内、前記テキストと合致する質問の候補を求める第一意図理解ステップと、
    前記複数の質問のそれぞれと前記テキストの一致度を表すスコアを前記複数の質問ごとに求める第二意図理解ステップと、
    前記第一意図理解ステップまたは前記第二意図理解ステップの処理結果から、質問を特定する質問特定ステップと、
    を含み、
    前記質問特定ステップでは、
    前記第二意図理解ステップの処理結果から、質問が一意に定まる場合は、前記第二意図理解ステップの処理結果からユーザの質問を特定し、
    前記第二意図理解ステップの処理結果から、質問が一意に定まらない場合は、前記第一意図理解ステップおよび前記第二意図理解ステップの処理結果からユーザの質問を特定する、
    対話方法。
  11. 請求項10に記載の方法の各ステップをコンピュータに実行させるためのプログラム。
JP2017135625A 2017-07-11 2017-07-11 対話システムおよび対話方法 Expired - Fee Related JP6769405B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017135625A JP6769405B2 (ja) 2017-07-11 2017-07-11 対話システムおよび対話方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017135625A JP6769405B2 (ja) 2017-07-11 2017-07-11 対話システムおよび対話方法

Publications (2)

Publication Number Publication Date
JP2019020774A true JP2019020774A (ja) 2019-02-07
JP6769405B2 JP6769405B2 (ja) 2020-10-14

Family

ID=65354113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017135625A Expired - Fee Related JP6769405B2 (ja) 2017-07-11 2017-07-11 対話システムおよび対話方法

Country Status (1)

Country Link
JP (1) JP6769405B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020191009A (ja) * 2019-05-23 2020-11-26 本田技研工業株式会社 知識グラフ補完装置、および知識グラフ補完方法
JP2021096710A (ja) * 2019-12-18 2021-06-24 トヨタ自動車株式会社 エージェント装置、エージェントシステム、及びエージェントプログラム
JP2021117205A (ja) * 2020-01-29 2021-08-10 トヨタ自動車株式会社 情報処理装置
WO2021169640A1 (zh) * 2020-02-25 2021-09-02 京东方科技集团股份有限公司 一种问题查询装置、方法、设备及存储介质
CN114756663A (zh) * 2022-03-29 2022-07-15 税友信息技术有限公司 一种智能问答方法、系统、设备及计算机可读存储介质
CN117235237A (zh) * 2023-11-10 2023-12-15 腾讯科技(深圳)有限公司 一种文本生成方法及相关装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293731A (ja) * 2005-04-12 2006-10-26 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
WO2007099812A1 (ja) * 2006-03-01 2007-09-07 Nec Corporation 質問回答装置、質問回答方法および質問回答用プログラム
JP2010009471A (ja) * 2008-06-30 2010-01-14 Nec Corp 質問回答検索システム及びその方法とプログラム
WO2013051226A1 (ja) * 2011-10-07 2013-04-11 ハーディス株式会社 検索システム、検索システムの動作方法、及びプログラム
WO2013080406A1 (ja) * 2011-11-28 2013-06-06 Necソフト株式会社 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
JP2014112316A (ja) * 2012-12-05 2014-06-19 Kddi Corp 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293731A (ja) * 2005-04-12 2006-10-26 Fuji Xerox Co Ltd 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
WO2007099812A1 (ja) * 2006-03-01 2007-09-07 Nec Corporation 質問回答装置、質問回答方法および質問回答用プログラム
JP2010009471A (ja) * 2008-06-30 2010-01-14 Nec Corp 質問回答検索システム及びその方法とプログラム
WO2013051226A1 (ja) * 2011-10-07 2013-04-11 ハーディス株式会社 検索システム、検索システムの動作方法、及びプログラム
WO2013080406A1 (ja) * 2011-11-28 2013-06-06 Necソフト株式会社 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
JP2014112316A (ja) * 2012-12-05 2014-06-19 Kddi Corp 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020191009A (ja) * 2019-05-23 2020-11-26 本田技研工業株式会社 知識グラフ補完装置、および知識グラフ補完方法
JP7270188B2 (ja) 2019-05-23 2023-05-10 本田技研工業株式会社 知識グラフ補完装置、および知識グラフ補完方法
JP2021096710A (ja) * 2019-12-18 2021-06-24 トヨタ自動車株式会社 エージェント装置、エージェントシステム、及びエージェントプログラム
JP2021117205A (ja) * 2020-01-29 2021-08-10 トヨタ自動車株式会社 情報処理装置
WO2021169640A1 (zh) * 2020-02-25 2021-09-02 京东方科技集团股份有限公司 一种问题查询装置、方法、设备及存储介质
CN114756663A (zh) * 2022-03-29 2022-07-15 税友信息技术有限公司 一种智能问答方法、系统、设备及计算机可读存储介质
CN117235237A (zh) * 2023-11-10 2023-12-15 腾讯科技(深圳)有限公司 一种文本生成方法及相关装置
CN117235237B (zh) * 2023-11-10 2024-03-12 腾讯科技(深圳)有限公司 一种文本生成方法及相关装置

Also Published As

Publication number Publication date
JP6769405B2 (ja) 2020-10-14

Similar Documents

Publication Publication Date Title
JP6769405B2 (ja) 対話システムおよび対話方法
WO2021093755A1 (zh) 问题的匹配方法及装置、问题的回复方法及装置
JP5831951B2 (ja) 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム
US20100079464A1 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
US20190164540A1 (en) Voice recognition system and voice recognition method for analyzing command having multiple intents
US11270683B2 (en) Interactive system, apparatus, and method
KR20160026892A (ko) 논팩토이드형 질의 응답 시스템 및 방법
WO2019159986A1 (ja) 情報提供装置、情報提供方法、およびプログラム
JP6370962B1 (ja) 生成装置、生成方法および生成プログラム
JP7058574B2 (ja) 情報処理装置、情報処理方法、およびプログラム
WO2019088084A1 (ja) 因果文解析装置、因果文解析システム、プログラム、及び因果文解析方法
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
JP5954836B2 (ja) 不理解文判定モデル学習方法、不理解文判定方法、装置、及びプログラム
WO2022156450A1 (zh) 知识库的查询方法、装置、计算机设备和存储介质
JP6327799B2 (ja) 自然言語推論システム、自然言語推論方法及びプログラム
US20200293717A1 (en) Interactive control system, interactive control method, and computer program product
US20210224747A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20200402506A1 (en) Response device, response method, and storage medium
JP6375367B2 (ja) 反論生成方法,反論生成システム
US20170154035A1 (en) Text processing system, text processing method, and text processing program
KR101565658B1 (ko) 기억 능력을 이용한 대화 관리 방법 및 장치
CN109165277B (zh) 一种作文的输出方法及学习设备
JP2019128914A (ja) 情報処理装置、応答シナリオ生成方法、及び制御プログラム
JP6483789B1 (ja) 情報解析システム
JP6730090B2 (ja) 対話処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200907

R151 Written notification of patent or utility model registration

Ref document number: 6769405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees