JP6710007B1 - 対話管理サーバ、対話管理方法、及びプログラム - Google Patents
対話管理サーバ、対話管理方法、及びプログラム Download PDFInfo
- Publication number
- JP6710007B1 JP6710007B1 JP2019180170A JP2019180170A JP6710007B1 JP 6710007 B1 JP6710007 B1 JP 6710007B1 JP 2019180170 A JP2019180170 A JP 2019180170A JP 2019180170 A JP2019180170 A JP 2019180170A JP 6710007 B1 JP6710007 B1 JP 6710007B1
- Authority
- JP
- Japan
- Prior art keywords
- word
- unit
- answer
- text data
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
Description
また、顧客からの問い合わせに対応するために、顧客向けのマニュアルやQ&A集が用意されることがある。しかし、そのようなマニュアルは膨大な量に及ぶことがあるため、顧客はマニュアルのどこを見ればよいのか分からず、結局、電話で問い合わせをしてしまうことも多い。このように、マニュアル等が存在するにもかかわらず、それらが有効に活用されているともいえない。
図1は、本発明の実施形態に係る対話管理システムの概略構成図(システム構成図)である。図1に示すように、対話管理システム100は、例示的に、対話管理サーバ1(対話管理サーバ)、対話ログデータベース(DB)4、ユーザ端末装置6、及びオペレータ端末装置8を備えて構成されている。
図4及び図5を用いて、本発明に実施形態に係る対話管理処理を説明する。図4は、本発明の実施形態に係る対話管理処理の一例を示すフローチャートである。
図1に示す取得部15は、業務マニュアルやQ&A集などの文書を取得する。
図1に示すデータ変換部17は、図3に示すように、文書の内容が階層構造を有する文書のデータに基づいて、例えば、階層構造の末端に位置する構成単位、すなわち最下層のノードに含まれるテキストデータのそれぞれを、当該各構成単位に至る一又は複数の階層を特定可能な情報及び当該各構成単位に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する。
図1に示す記録部11は、構造化した形式に変換された文書を文書情報BIとして記録する。
図1に示す受付部19は、ユーザからの質問の入力を受け付ける。
図1に示す回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答としてユーザに返す。
なお、上記説明では、回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出するとしたが、回答生成部27の処理はこれに限定されるものではない。回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータ及び見出しとをマッチングして、質問に関連する項目を複数抽出するものでもよい。
図7は、入力された質問の内容が不明確である場合の、ユーザ端末装置6の表示部の画面の一例を示す図である。図7に示すように、図1に示す回答生成部27は、入力された質問T11「口座」の内容が不明確である場合、例えば、口座の開設について質問したいのか、口座の解約について質問したいのか等が判然とせず不明確である場合、入力された当該質問に対して、より具体的な質問を促すように、予め定められた回答T13「質問の詳細を教えてください。」を生成してもよい。具体的に、回答生成部27は、入力された質問の文字数、当該質問に対する検索スコア、及び当該質問に対して抽出される文書数などを総合的に評価することで、入力された質問の内容が不明確であるか否かを判断する。
図8は、質問及び当該質問に対する回答が所定の回数繰り返された場合の、端末装置の表示部の画面の一例を示す図である。図8に示すように、図1に示す音声対話管理部35は、あるユーザUとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザUとの間で音声対話が可能となるように管理する。例えば、音声対話管理部35は、図8のテキストT21〜T24に示すように、ユーザUとの間で質問及び回答が例えば2回実行された場合、図1に示すオペレータと電話を介して対話可能となるように電話回線にアクセスできるように管理する。なお、所定の回数は、2回に限定されない。1回であってもよいし、3回以上であってもよい。
図9は、入力された質問に対する回答として一以上の関連キーワードを提示する場合の、ユーザ端末装置6の表示部の画面の一例を示す図である。図9に示すように、図1に示す回答生成部27は、入力された質問T31「口座開設」に対する回答として、例えば、記録部11において、あらかじめ、「口座開設」という単語に関連づけて記録された、一以上の関連キーワード「手続き」、「必要書類」、「代理」及び「未成年」を含む回答T33を生成する。ここで、ある単語の関連キーワードは、当該単語の共起情報を取得し、当該共起情報に重みづけを行うことで生成される。具体的に、「口座開設」の関連キーワードとしての「手続き」、「必要書類」、「代理」及び「未成年」等は、「口座開設」の共起情報に重みづけを行うことで生成されたものである。そして、「口座開設」という単語を含む質問、並びに、当該質問に対する、「手続き」、「必要書類」、「代理」及び「未成年」等を含む回答を含む対話結果を管理することで、関連キーワードの生成の精度を向上させることができるので、質問に対する回答の精度を向上させることができる。なお、一の単語と他の単語との共起情報は、構造化した形式の文書の全テキストデータから求められる。
第5実施形態においては、ユーザから入力された質問の内容が不明確である場合に、より具体的な質問を促すように、例えば編、章、節、項、小項目等からなる階層構造を有する文書データに基づいて、段階的に回答を出力する。例えば、第5実施形態における対話管理システムにおいては、入力された当該質問に対して編階層(第1階層)における項目に基づいて回答出力情報を生成し、質問の第1回答としてユーザUに返す。その後、さらに入力された質問に対して編階層よりも下位の階層である章、節、項、又は小項目等の階層(第2階層)における項目に基づいて回答出力情報を生成し、当該質問の第2回答としてユーザUに返す。
第6実施形態は、ユーザからの質問と、質問に対する回答と、回答に対する評価とを対話結果として関連付けて格納し、格納された対話結果に基づいて、質問と回答とのマッチングの重み付けを学習する。第6実施形態を図12から図14を参照して説明する。
図15を参照して、第7実施形態に係る対話管理システムを説明する。図15は、第7実施形態に係る対話管理システムの概略構成図(システム構成図)である。第7実施形態においては、図15に示すように、対話管理サーバ1が除外用語辞書DB14をさらに備える。除外用語辞書DB14は、入力された質問と、記録部11に記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に影響が除外される「除外用語」を記憶するデータベースである。具体的には、除外用語としては、助詞、接続詞、所定の修飾語、所定の頻出語などが挙げられる。ここで、所定の修飾語とは、「いろいろな」「様々な」などの実質的に就職する単語の意味を制限しない用語が該当する。また、所定の頻出語とは、特定形式の構造化文書で用いられる全用語のうち頻出する用語のことであり、数万ワードの日本語の文書においては上位10個ぐらいの用語がこれに該当する。例えば、「確認」などの用語が頻出語として挙げられることが多い。
第8実施形態においては、第1実施形態から第7実施形態に係る構造化した形式の文書が、階層構造の末端に位置する項目に含まれるテキストデータと、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しとを対応付けたものを「単位情報」とするものである。具体的には、図3に示すようなデータが一つの単位情報として定義され、これらの集合が上述した特定形式の構造化文書として定義される。
第9実施形態においては、第1実施形態から第7実施形態に係る構造化した形式の文書に関して、説明文のテキストデータと、説明文に至る一又は複数の階層を識別するための情報及び階層の見出しを表すテキストデータとを対応付けたものを「単位情報」としてもよい。例えば、図3に示すようなデータ(「特定のXML形式で抽出」で囲まれる部分)が一つの単位情報として定義され、複数の単位情報を含む集合が上述した特定形式の構造化文書として定義される。回答生成部27は、受付部19により受け付けられた質問文のテキストデータと、各単位情報に含まれるテキストデータとをマッチングして、質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答候補(回答出力情報)を生成する。質問によっては、文書の構成単位(項目)(例えば、編、章、節、項、小項目等)に含まれるテキストデータよりも見出しの方が適切な回答を誘導する場合があるので、第9実施形態に係る対話管理サーバ1では、各項目のテキストデータのみならず、見出しも含めてマッチングをすることで質問に関連する項目を適切に抽出することを可能とする。
以上説明したように、本発明の第9実施形態に係る対話管理サーバ1は、記録部11と受付部19と回答生成部27とを備える。記録部11は、説明文のテキストデータと、説明文に至る一又は複数の階層を識別するための情報及び階層の見出しを表すテキストデータとを対応付けた単位情報を複数有する構造化した形式の文書のデータ(文書情報BI)を記録する。受付部19は、ユーザからの質問文のテキストデータを受け付ける。回答生成部27は、受付部19により受け付けられた質問文のテキストデータと、記録部11に記録された各単位情報に含まれるテキストデータとをマッチングして、質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答出力情報を生成する。
本実施形態においては、図17に示すユーザ端末装置6の表示部に表示する画面Gは様々な表示形態を採り得る。
図27に示すように、ユーザ端末装置6の表示部は、図1、15、16及び17に示す各辞書の内容を変更可能な画面Gを表示可能である。図27に示すように、ユーザは、まず、例えば、辞書検索欄S5において変更を希望する辞書の名称を入力し検索する。そして、空欄S1に追加したい単語を漢字表記等で入力し、空欄S3に追加したい単語の読み(例えば、カタカナ表記)を入力した後、追加ボタンB1が押下されると、辞書検索欄S5で検索された辞書に新たな単語が追加される。他方で、ユーザが、例えばユーザ端末装置6と接続されているマウスを操作することによって、削除ボタンB3を押下すると、削除ボタンB3に対応する、予め登録されている単語が辞書から削除される。また、ユーザにより変更ボタンB5が押下されると、変更ボタンB5に対応する、予め登録されている単語の内容を変更することが可能である。
また、対話管理サーバ1は、質問文に対する回答候補(回答出力情報)をユーザ端末装置6の表示部に表示する際のタイミングを、質問文のテキストデータと、各単位情報に含まれるテキストデータとのマッチングの精度(検索スコア)に応じて変更するように構成してもよい。例えば、対話管理サーバ1の回答生成部27は、所定の範囲内の検索スコアが算出された1又は複数の単位情報を抽出し、出力制御部31は、抽出された単位情報の数に応じて、回答出力候補の出力時間を調整する。出力制御部31は、検索スコアの類似度が近しい説明文が比較的多くマッチングした場合は、マッチングする文書の数が少ない場合に比べて、マッチングした説明文に対応する回答候補の表示のタイミング(質問に対する応答タイミング)を遅らせる。応答タイミングは例えば以下の数式(0)で表現される。
応答タイミング=1[秒]+0.2[秒]×(検索スコアの類似度が近しい単位情報の数)
応答タイミングは、例えば、質問文が入力されてから最長で2.5[秒]とする。また、応答タイミングが2.0〜2.5[秒]の場合は、出力制御部31は、回答候補を画面G上に表示する前に、フィラー表現(例えば、「えーと」「うーん」等)を表示してもよい。
また、対話管理サーバ1は、図1、15、16及び17に示す各辞書の他、ストップワード辞書を更に備えるように構成してもよい。ストップワードとは、自然言語処理を実行する際に処理対象外とする単語のことをいい、例えば、助詞や接続詞の他、「いろいろ」や「ある程度」というような単語を含む。対話管理サーバ1は、ストップワード辞書を参照することにより、特定の単語を自然言語処理から除外することで、質問文に対して、マッチング精度の高い回答候補を生成することが可能になる。
また、対話管理サーバ1の回答生成部27は、画面Gにおいて質問者に対応するアイコン画像又は回答者(対話管理サーバ1)に対応するアイコン画像の少なくとも一方の表示形態を、質問文に対する回答候補のための文書のマッチング精度に応じて変更するように構成してもよい。例えば、回答生成部27は、検索スコアが比較的上位の一又は複数の単位情報の第1平均スコアと、一又は複数の単位情報の第1平均スコアより下位の第2平均スコアとの差分に応じて、回答候補に対応付けられた回答者に対応するアイコン画像の表示形態を変更する。具体的には、回答生成部27は、検索スコアが高い順に上位10件の単位情報に基づいて回答候補を生成する場合、1位〜5位の単位情報のスコアの平均を第1平均スコアとして算出し、6位〜10位の単位情報のスコアの平均を第2平均スコアとして算出し、それらの差分に応じてアイコン画像の表示態様を変更する。
また、対話管理サーバ1の回答生成部27は、質問文のテキストデータに含まれる合成語であって、例えば、第1合成語辞書DB12A又は第2合成語辞書DB12Bに登録されている合成語の数に応じて、回答候補に対応付けられた回答者に対応するアイコン画像の表示形態を変更するように構成してもよい。予め合成語辞書DB12A及び12Bに登録されている合成語を含む質問文が入力されるということは、質問の質が向上していることの裏付けである。よって、上記と同様に、例えば、回答者に対応するアイコン画像が顔画像である場合、回答生成部27は、質問及び回答を含む対話を継続して質問の質が向上するにつれて、表示を変化させるようにしてもよい。前述同様、図28に示すように、キャラクターのアイコンKが、無表情の顔画像(図29参照)から笑顔の顔画像(図30参照)に変化するようにしてもよい。また、顔画像の変化に代えて、もしくは組み合わせて、カラースケールなどを用いて質問文に対する質の向上度合いを表現してもよい。
また、第9実施形態に係る対話管理サーバ1は、例えばTF−IDFを用いる手法により単位情報の検索スコアを算出するが、検索スコアの算出に際し、項目毎に算出したスコアの合計値を用いてもよいし、項目毎に算出したスコアに重みに乗じて求めた合計値を用いてもよい。また、項目毎のスコアのうち最大のスコアを有するものを検索スコアとして採用してもよい。さらに、項目毎に算出したスコアに重みに乗じて求めたスコアのうち最大のスコアを有するものを検索スコアとして採用してもよい。例えば、対話管理サーバ9は、説明文から算出されたスコアと、一の見出しから算出されたスコアとのうちの大きい方のスコアを用いて回答出力情報を生成するものでもよい。
また、第9実施形態に係る対話管理サーバ1は、説明文が複数の文章から構成される場合、以下のような手法により検索スコアを補正してもよい。なお、これらの手法による補正は情報処理部10において実行される。
まず、入力された質問文を形態素解析して単語を抽出する。続いて、抽出した単語と説明文を構成する各文章の単語とのマッチングを行う。抽出した単語の全てがマッチした場合、マッチした単語間距離を計測する。そして、単語間距離を用いて「単語間補正係数ha」を算出し、この単語間補正係数haを乗算することで単位情報の検索スコアを補正する。
単語間補正係数ha=(11−単語間距離)×0.01×a+1
そして、単語間距離に基づいて単位情報の検索スコアを補正する。なお、ここでは、単語間距離は11以上増加しないものとする。例えば単語間距離が12となった場合は11に置換して単語間補正係数が算出される。また、定数aは適宜調整可能な数値である。
まず、入力された質問文を形態素解析して単語を抽出する。続いて、抽出した単語と説明文を構成する各文章の単語とのマッチングを行う。ここでは、一の単位情報内の説明文に含まれる単語とマッチした単語数の最大値を「単語出現回数」と設定し、その最大値を持つ文章の数を「最大文章数」とする。そして、単語出現回数及び最大文章数を用いて「出現回数補正係数hb」を算出し、この出現回数補正係数hbを乗算することで単位情報の検索スコアを補正する。なお、出現回数補正係数hbは、次の数式(2)で算出される。ここで、定数b1、b2は適宜調整可能な数値である。
出現回数補正係数hb=(単語出現回数×0.01×定数b1)+((最大文章数−1)×0.01×定数b2)+1
(C1)事前処理
まず、事前処理について説明する。各説明文を構成する各文章に文章IDを設定する。次に、各文章を形態素解析して単語を抽出する。そして、所定のニューラルネットワークを用いて、各文章ID及び各単語の固定長ベクトルを獲得する。
(数3)
h=average(d(u)D+w(t−2)W+w(t−1)W)
ここで「average」は平均を意味する。また記号Dは文章重み行列を表しており、(U+1)行S列の要素を有するものである。また記号Wは単語重み行列を表しており、(N+1)行S列の要素を有するものである。
(数4)
h=softmax(hW’)
ここで「softmax」はソフトマックス関数を意味する。また記号W’は単語重み行列Wの転置行列である。
次に、推論処理について説明する。質問文が入力されると、入力された質問文を形態素解析して単語を抽出する。次に、事前処理で用いたのと同じニューラルネットワークを用いて、質問文の固定長ベクトルを獲得する。ここでは、質問文に含まれる連続する単語w(t−2),w(t−1)から次に続く単語w(t)を推測するタスクを行なう。入力層には、d(U+1),w(t−2),w(t−1)の情報が入力される。d(U+1)は、入力される文章(=質問文)をone-hotベクトルで表現したものであり、(U+1)次元を有する。w(t)は、t番目の単語のone-hotベクトルで表現したものであり、(N+1)次元を有する。質問文に、未知の単語が含まれている場合は、w(N+1)に情報が格納される。また、中間層には、入力層から送られてきた情報が、次数式(5)を用いてS次元ベクトルの情報に変換される。
h=average(d(U+1)D+w(t−2)W+w(t−1)W)
続いて、出力層に、中間層から送られてきた情報が入力され、次数式(6)を用いて(N+1)次元ベクトルの情報に変換される。
h=softmax(hW’)
出力層から出力された情報と、単語w(t)とを比較し、両者の差分を減らすように、文章重み行列Dの要素を更新する。質問文に存在する全ての文章及び単語について同様の処理を行なう。そして、文章重み行列Dの最終行を、入力された質問文に対応する固定長ベクトルとする。
類似度補正係数hc=(最大類似度×定数c)+1
例えば、最大類似度ms=0.8で定数c=0.1の場合、類似度補正係数hc=1.08となる。
第10実施形態では、第9実施形態に係る対話管理サーバ1において、見出しが複数存在し、各見出し及び説明文との優先順位を設定した上で検索スコアを算出するものである。すなわち、第10実施形態に係る対話管理サーバ1では、単位情報に含まれる見出し(階層)は複数あり、記録部11が階層毎に重みを有し、回答生成部27が重みを用いてスコアを算出する。第10実施形態の他の構成は第9実施形態と同様である。第10実施形態に係る対話管理サーバ1では、TF−IDFなどの手法により検索スコアを算出するが、各階層に応じた項目毎に算出したスコアの合計値を検索スコアとしてもよいし、項目毎に算出したスコアに重みに乗じて求めた合計値を検索スコアとしてもよい。また、項目毎のスコアのうち最大のスコアを有するものを検索スコアとして採用してもよい。さらに、項目毎に算出したスコアに重みに乗じて求めたスコアのうち最大のスコアを有するものを検索スコアとして採用してもよい。
まず、重み決定装置150は、複数の階層から任意のn番目の階層を「第1階層」として選択する(ステップST11)。ここでは、階層は9つあるとする。また、一例として、第1番目の階層(n=1)が第1階層として選択されるものとする。次に、第1階層の重み(ここでは、p(1))を、初期値リストの中から選択する(ステップST12)。初期値リストには、階層毎にとり得る重みの候補値が格納されている。具体的には、初期値リストには、図35に示すように、100から10000までの数値が100の間隔で並んで格納されている。ここでは、第1階層の重みとして、第1番目の重みp(1)=100が選択されるものとする。
まず、重み決定装置150の情報処理部155が、複数の階層から任意のo番目の一階層を「第3階層」として選択する(ステップST31)。ここでは、第9番目の階層が選択されるものとする。次に、情報処理部155は、選択された階層以外の重みp(1)〜p(8)を、重み候補リストからランダムに抽出する(ステップST32)。次に、情報処理部155は、ステップST32により抽出された重みp(1)〜p(8)を用いて下記の重み演算数式(11)から、ステップST31により選択された階層の重みp(9)を算出する(ステップST33)。
第11実施形態では、第9実施形態に係る対話管理サーバ1において、第1合成語辞書DB12A又は第2合成語辞書DB12Bに登録された合成語の妥当性を判定する。以下、便宜上、第1合成語辞書DB12Aに登録された合成語の妥当性を判定するものについて説明するが、第2合成語辞書12Bに登録された合成語の妥当性についても同様の処理で判定できる。
図39は本発明の第12実施形態に係る対話管理システムの構成を示す模式図である。第12実施形態に係る対話管理サーバ1は、単語分散表現データベース(DB)201をさらに備える。
Claims (24)
- 説明文のテキストデータと、前記説明文に至る一又は複数の階層を識別するための情報及び前記階層の見出しを表すテキストデータとを対応付けた単位情報を複数有する構造化した形式の文書のデータを記録する記録部と、
ユーザからの質問文のテキストデータを受け付ける受付部と、
前記受付部により受け付けられた質問文のテキストデータと、前記記録部に記録された各単位情報に含まれるテキストデータとをマッチングして、前記質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答出力情報を生成する回答生成部と、
を備え、
所定の単語と、前記単語の下位概念である下位概念語とを関連付けて登録された下位概念語辞書を記憶する下位概念語辞書記憶部をさらに備え、
前記回答生成部は、
前記質問文のテキストデータを形態素解析して抽出された単語が前記下位概念語辞書に登録されていると判定した場合、前記単語に関連付けられた前記下位概念語を含む回答出力情報を生成する、
対話管理サーバ。 - 前記回答生成部は、
前記質問文のテキストデータを形態素解析して抽出された単語の、各単位情報における出現頻度に基づいて、各単位情報のスコアを算出し、
算出したスコアを用いて回答出力情報を生成する、
請求項1に記載の対話管理サーバ。 - 前記回答生成部は、
前記質問文のテキストデータを形態素解析して抽出された単語の、各単位情報における出現頻度と、抽出された単語が含まれる単位情報の、単位情報の総数に対する割合とに基づいて、各単位情報のスコアを算出し、
算出したスコアを用いて回答出力情報を生成する、
請求項1又は2に記載の対話管理サーバ。 - 所定の名詞の単語に他の単語を合成した合成語が登録された第1合成語辞書を記憶する第1合成語辞書記憶部をさらに備え、
前記回答生成部は、
前記質問文のテキストデータを形態素解析して抽出された単語が前記第1合成語辞書に登録されていると判定した場合、前記抽出された単語の、各単位情報における出現頻度に基づいて第1スコアを算出するとともに、各単位情報における、前記合成語の出現頻度に基づいて第2スコアを算出し、
前記第1スコア及び前記第2スコアを用いて回答出力情報を生成する、
請求項1から3のいずれか一項に記載の対話管理サーバ。 - 所定の名詞の単語と、前記単語に他の単語を合成した合成語とが関連付けて登録された第2合成語辞書を記憶する第2合成語辞書記憶部をさらに備え、
前記回答生成部は、
前記質問文のテキストデータを形態素解析して抽出された単語が前記第2合成語辞書に登録されていると判定した場合、前記抽出された単語、前記名詞の単語に合成した他の単語、及び前記合成語のそれぞれに対する、各単位情報における出現頻度に基づいてスコアを算出し、前記スコアを用いて回答出力情報を生成する、
請求項1から3のいずれか一項記載の対話管理サーバ。 - 前記回答生成部は、前記質問文のテキストデータを形態素解析して抽出された単語を含む単位情報の各見出しに含まれるテキストデータに基づいて回答出力情報を生成する、
請求項1から5に記載の対話管理サーバ。 - 前記回答生成部は、前記質問文に関連する単位情報を抽出できなかった場合、前記質問文を形態素解析して抽出された単語に基づく所定の回答文に対応する回答出力情報を生成する、
請求項1から6のいずれか一項に記載の対話管理サーバ。 - 前記回答生成部は、
前記質問文のテキストデータを形態素解析して抽出された単語の、各単位情報における出現頻度と、抽出された単語が含まれる単位情報の、単位情報の総数に対する割合と、前記単位情報の長さとに基づいて各単位情報のスコアを算出し、
算出したスコアを用いて回答出力情報を生成する、
請求項1から7のいずれか一項に記載の対話管理サーバ。 - 前記説明文は一以上の文章を含んでおり、
前記回答生成部は、
前記質問文のテキストデータの形態素解析に基づいて、前記質問文に関連する単位情報のスコアを算出し、
前記形態素解析をして抽出した単語と、前記説明文に含まれる文章を構成する単語とを比較し、互いに異なる第1単語及び第2単語を特定した場合、前記第1単語の出現位置と前記第2単語の出現位置との単語間距離に基づいて前記単位情報のスコアを補正し、
前記スコアを用いて回答出力情報を生成する、
請求項1から8のいずれか一項に記載の対話管理サーバ。 - 前記回答生成部は、
前記質問文のテキストデータの形態素解析に基づいて、前記質問文に関連する単位情報のスコアを算出し、
前記形態素解析をして抽出した単語と、前記説明文に含まれる文章を構成する単語とを比較し、一文章内で合致した単語の種類の数に基づいて前記単位情報のスコアを補正し、
前記スコアを用いて回答出力情報を生成する、
請求項1から9のいずれか一項に記載の対話管理サーバ。 - 前記回答生成部は、
前記合致した単語の種類の数が所定値以上の文章の数に基づいて前記スコアを補正する、
請求項10に記載の対話管理サーバ。 - 前記回答生成部は、
前記質問文のテキストデータの形態素解析に基づいて、前記質問文に関連する単位情報のスコアを算出し、
前記説明文に含まれる文章を個別の固定長ベクトルに変換する文章モデルを用いて、前記質問文から固定長ベクトルを算出し、
前記質問文の固定長ベクトルと、前記説明文に含まれる文章の固定長ベクトルとの類似度に基づいて前記スコアを補正し、
前記スコアを用いて回答出力情報を生成する、
請求項1から11のいずれか一項に記載の対話管理サーバ。 - 前記階層は複数存在し、
前記記録部は、前記階層毎に重みを有し、
前記回答生成部は、
前記質問文のテキストデータの形態素解析及び前記重みに基づいて、前記質問文に関連する単位情報のスコアを算出し、
前記スコアを用いて回答出力情報を生成する、
請求項1から12のいずれか1項に記載の対話管理サーバ。 - 請求項13に記載の対話管理サーバにおける重みを決定する重み決定装置であって、
複数の前記階層から任意の階層を選択する選択ステップと、
前記選択ステップにより選択された階層以外の重みを、所定の重み候補リストからランダムに抽出する抽出ステップと、
前記抽出ステップにより抽出された重みを用いて所定の重み演算式から、前記選択ステップにより選択された階層の重みを算出する重み算出ステップと、
前記重み算出ステップにより算出された重みと前記抽出ステップにより抽出された重みとを含む重みセットを用いて、サンプル質問文に対応するサンプル回答に一致する説明文のスコアの順位を算出するスコア順位算出ステップと、
前記スコア順位算出ステップにより算出された前記順位と所定のポイント演算式とに基づいて前記重みセットに対するポイントを算出するポイント算出ステップと、
前記抽出ステップと、前記重み算出ステップと、前記スコア順位算出ステップと、前記ポイント算出ステップとを所定回数実行した後のポイントに基づいて前記各階層の重みを決定する決定ステップと
を実行する、重み決定装置。 - 複数の前記階層から任意の階層を第1階層として選択する第1階層選択ステップと、
前記第1階層の重みを、初期値リストの中から選択する第1重み選択ステップと、
前記第1階層以外の階層の重みを、所定の第1重み演算式から算出する第1重み算出ステップと、
前記第1重み選択ステップにより選択された第1階層の重みと前記第1重み算出ステップにより算出された前記第1階層以外の階層の重みとを含む第1重みセットを用いて、サンプル質問文に対応するサンプル回答に一致する説明文のスコアの順位を算出する第1スコア順位算出ステップと、
前記第1スコア順位算出ステップにより算出された順位と所定のポイント演算式とに基づいて前記第1重みセットに対するポイントを算出する第1ポイント算出ステップと、
前記第1ポイント算出ステップにより算出されたポイントが所定値未満である場合、前記第1階層の重みを前記初期値リストから削除する削除ステップと、
前記第1重み選択ステップで、他の重みを選択し、前記第1重み算出ステップ、前記第1スコア順位算出ステップ、前記第1ポイント算出ステップ、及び前記削除ステップを繰り返し実行して前記初期値リストを更新する第1更新ステップと、
前記第1階層選択ステップで、他の階層を選択し、前記第1重み選択ステップ、前記第1重み算出ステップ、前記第1スコア順位算出ステップ、前記第1ポイント算出ステップ、前記削除ステップ、及び前記第1更新ステップを繰り返し実行して前記初期値リストを更新する第2更新ステップと、
複数の前記階層から任意の階層を第2階層として選択する第2階層選択ステップと、
前記第2階層以外の階層の重みの最小値の合計値から前記第2階層の重みを算出する第2重み算出ステップと、
前記第2階層選択ステップで、他の階層を選択し、前記第2重み算出ステップを繰り返し実行して、前記初期値リストから重み候補リストを作成する重み候補リスト作成ステップと、
を実行する、請求項14に記載の重み決定装置。 - 請求項4に記載の第1合成語辞書に登録された合成語の妥当性を判定する妥当性判定装置であって、
前記第1合成語辞書の内容を複製した複製辞書を生成する複製辞書生成ステップと、
前記第1合成語辞書を初期化する初期化ステップと、
前記複製辞書に登録された合成語から任意の合成語を抽出して、初期化ステップ後の第1合成語辞書に登録する登録ステップと、
前記登録ステップ後の第1合成語辞書を用いて、サンプル質問文に対応するサンプル回答に一致する説明文のスコアの順位を算出するスコア順位算出ステップと、
前記スコア順位算出ステップにより算出された順位と所定のポイント演算式とに基づいて前記登録ステップにより抽出された合成語に対するポイントを算出するポイント算出ステップと、
前記登録ステップ、前記スコア順位算出ステップ、及び前記ポイント算出ステップを繰り返し、前記初期化ステップ後の第1合成語辞書に前記合成語が登録される前後のポイントの比較から、登録された合成語の妥当性を判定する妥当性判定ステップと、
を実行する、妥当性判定装置。 - 請求項5に記載の第2合成語辞書に登録された合成語の妥当性を判定する妥当性判定装置であって、
前記第2合成語辞書の内容を複製した複製辞書を生成する複製辞書生成ステップと、
前記第2合成語辞書を初期化する初期化ステップと、
前記複製辞書に登録された合成語から任意の合成語を抽出して、初期化ステップ後の第2合成語辞書に登録する登録ステップと、
前記登録ステップ後の第2合成語辞書を用いて、サンプル質問文に対応するサンプル回答に一致する説明文のスコアの順位を算出するスコア順位算出ステップと、
前記スコア順位算出ステップにより算出された順位と所定のポイント演算式とに基づいて前記登録ステップにより抽出された合成語に対するポイントを算出するポイント算出ステップと、
前記登録ステップ、前記スコア順位算出ステップ、及び前記ポイント算出ステップを繰り返し、前記初期化ステップ後の第2合成語辞書に前記合成語が登録される前後のポイントの比較から、登録された合成語の妥当性を判定する妥当性判定ステップと、
を実行する、妥当性判定装置。 - 任意の単語の分散表現を記憶する単語分散表現記憶部をさらに備え、
前記回答生成部は、
前記質問文のテキストデータを形態素解析して抽出された単語から所定のルールで単語を選択し、
前記選択された単語に関し、前記分散表現において一定距離以内にある単語を関連語として抽出し、
前記質問文のテキストデータを解析して抽出された単語及び前記関連語の、各単位情報における出現頻度に基づいてスコアを算出し、
前記スコアを用いて回答出力情報を生成する、
請求項1から13のいずれか一項に記載の対話管理サーバ。 - 説明文のテキストデータと、前記説明文に至る一又は複数の階層を識別するための情報及び前記階層の見出しを表すテキストデータとを対応付けた単位情報を複数有する構造化した形式の文書のデータを記録する記録部と、
ユーザからの質問文のテキストデータを受け付ける受付部と、
前記受付部により受け付けられた質問文のテキストデータと、前記記録部に記録された各単位情報に含まれるテキストデータとをマッチングして、前記質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答出力情報を生成する回答生成部と、を備え、
前記回答生成部は、前記質問文のテキストデータの形態素解析に基づいて、前記質問文に関連する前記単位情報のスコアを算出し、所定の範囲内のスコアが算出された前記単位情報の数に応じて、前記回答出力情報の出力時間を調整する出力制御部を更に備える、
対話管理サーバ。 - 説明文のテキストデータと、前記説明文に至る一又は複数の階層を識別するための情報及び前記階層の見出しを表すテキストデータとを対応付けた単位情報を複数有する構造化した形式の文書のデータを記録する記録部と、
ユーザからの質問文のテキストデータを受け付ける受付部と、
前記受付部により受け付けられた質問文のテキストデータと、前記記録部に記録された各単位情報に含まれるテキストデータとをマッチングして、前記質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答出力情報を生成する回答生成部と、を備え、
前記回答生成部は、
前記質問文のテキストデータの形態素解析に基づいて、前記質問文に関連する前記単位情報のスコアを算出し、
スコアが上位の一又は複数の単位情報の第1平均スコアと、前記第1平均スコアより下位の一又は複数の単位情報の第2平均スコアとの差分に応じて、前記回答出力情報に対応付けられたユーザを示すユーザ画像の表示形態を変更する、
対話管理サーバ。 - 説明文のテキストデータと、前記説明文に至る一又は複数の階層を識別するための情報及び前記階層の見出しを表すテキストデータとを対応付けた単位情報を複数有する構造化した形式の文書のデータを記録する記録部と、
ユーザからの質問文のテキストデータを受け付ける受付部と、
前記受付部により受け付けられた質問文のテキストデータと、前記記録部に記録された各単位情報に含まれるテキストデータとをマッチングして、前記質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答出力情報を生成する回答生成部と、
所定の名詞の単語に他の単語を合成した合成語が登録された合成語辞書を記憶する合成語辞書記憶部と、を備え、
前記回答生成部は、前記質問文のテキストデータに含まれる前記合成語の数に応じて、前記回答出力情報に対応付けられたユーザを示すユーザ画像の表示形態を変更する、
対話管理サーバ。 - 説明文のテキストデータと、前記説明文に至る一又は複数の階層を識別するための情報及び前記階層の見出しを表すテキストデータとを対応付けた単位情報を複数有する構造化した形式の文書のデータを記録する記録部と、
ユーザからの質問文のテキストデータを受け付ける受付部と、
前記受付部により受け付けられた質問文のテキストデータと、前記記録部に記録された各単位情報に含まれるテキストデータとをマッチングして、前記質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答出力情報を生成する回答生成部と、
任意の単語の分散表現を記憶する単語分散表現記憶部と、を備え、
前記回答生成部は、
前記質問文のテキストデータを形態素解析して抽出された単語から所定のルールで単語を選択し、
前記選択された単語に関し、前記分散表現において一定距離以内にある単語を関連語として抽出し、
前記質問文のテキストデータを解析して抽出された単語及び前記関連語の、各単位情報における出現頻度に基づいてスコアを算出し、
前記スコアを用いて回答出力情報を生成する、
対話管理サーバ。 - 説明文のテキストデータと、前記説明文に至る一又は複数の階層を識別するための情報及び前記階層の見出しを表すテキストデータとを対応付けた単位情報を複数有する構造化した形式の文書のデータを記録するステップと、
ユーザからの質問文のテキストデータを受け付けるステップと、
受け付けられた質問文のテキストデータと、記録された各単位情報に含まれるテキストデータとをマッチングして、前記質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答出力情報を生成するステップと、
所定の単語と、前記単語の下位概念である下位概念語とを関連付けて登録された下位概念語辞書を記憶するステップと、を含み、
前記生成するステップは、
前記質問文のテキストデータを形態素解析して抽出された単語が前記下位概念語辞書に登録されていると判定した場合、前記単語に関連付けられた前記下位概念語を含む回答出力情報を生成する、
対話管理方法。 - コンピュータを、
説明文のテキストデータと、前記説明文に至る一又は複数の階層を識別するための情報及び前記階層の見出しを表すテキストデータとを対応付けた単位情報を複数有する構造化した形式の文書のデータを記録する記録部、
ユーザからの質問文のテキストデータを受け付ける受付部、
前記受付部により受け付けられた質問文のテキストデータと、前記記録部に記録された各単位情報に含まれるテキストデータとをマッチングして、前記質問文に関連する単位情報を抽出し、抽出された単位情報に対応する見出し及び説明文に基づく回答出力情報を生成する回答生成部、
所定の単語と、前記単語の下位概念である下位概念語とを関連付けて登録された下位概念語辞書を記憶する下位概念語辞書記憶部、
として機能させ、
前記回答生成部が、
前記質問文のテキストデータを形態素解析して抽出された単語が前記下位概念語辞書に登録されていると判定した場合、前記単語に関連付けられた前記下位概念語を含む回答出力情報を生成する、
プログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019086893 | 2019-04-26 | ||
JP2019086893 | 2019-04-26 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020088881A Division JP2020184342A (ja) | 2019-04-26 | 2020-05-21 | 対話管理サーバ、対話管理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6710007B1 true JP6710007B1 (ja) | 2020-06-17 |
JP2020184294A JP2020184294A (ja) | 2020-11-12 |
Family
ID=71079279
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019180170A Active JP6710007B1 (ja) | 2019-04-26 | 2019-09-30 | 対話管理サーバ、対話管理方法、及びプログラム |
JP2020088881A Pending JP2020184342A (ja) | 2019-04-26 | 2020-05-21 | 対話管理サーバ、対話管理方法、及びプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020088881A Pending JP2020184342A (ja) | 2019-04-26 | 2020-05-21 | 対話管理サーバ、対話管理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP6710007B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113535911A (zh) * | 2020-12-03 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 奖励模型处理方法、电子设备、介质和计算机程序产品 |
US11687583B2 (en) | 2021-05-24 | 2023-06-27 | Samsung Eleotronicc Co., Ltd | Information retrieval system and method of information retrieval |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024014383A1 (ja) * | 2022-07-13 | 2024-01-18 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、端末装置および端末プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0740267B2 (ja) * | 1987-10-17 | 1995-05-01 | 株式会社日立製作所 | 文書作成装置 |
US5331554A (en) * | 1992-12-10 | 1994-07-19 | Ricoh Corporation | Method and apparatus for semantic pattern matching for text retrieval |
JP3583631B2 (ja) * | 1998-12-03 | 2004-11-04 | 三菱電機株式会社 | 情報マイニング方法、情報マイニング装置、および情報マイニングプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2006195667A (ja) * | 2005-01-12 | 2006-07-27 | Toshiba Corp | 構造化文書検索装置、構造化文書検索方法、及び構造化文書検索プログラム |
JP4439497B2 (ja) * | 2006-07-18 | 2010-03-24 | 株式会社東芝 | 検索処理装置及びプログラム |
US8909654B2 (en) * | 2007-11-19 | 2014-12-09 | Nippon Telegraph And Telephone Corporation | Information search method, apparatus, program and computer readable recording medium |
JP5260123B2 (ja) * | 2008-04-09 | 2013-08-14 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 検索システム、索引作成装置、検索エンジン、索引作成方法、検索方法およびプログラム |
JP5377430B2 (ja) * | 2009-07-08 | 2013-12-25 | 本田技研工業株式会社 | 質問応答データベース拡張装置および質問応答データベース拡張方法 |
JP2013120534A (ja) * | 2011-12-08 | 2013-06-17 | Mitsubishi Electric Corp | 関連語分類装置及びコンピュータプログラム及び関連語分類方法 |
JP5417471B2 (ja) * | 2012-03-14 | 2014-02-12 | 株式会社東芝 | 構造化文書管理装置、構造化文書検索方法 |
JP6093200B2 (ja) * | 2013-02-05 | 2017-03-08 | 日本放送協会 | 情報検索装置及び情報検索プログラム |
JP5718405B2 (ja) * | 2013-05-09 | 2015-05-13 | 日本電信電話株式会社 | 発話選択装置、方法、及びプログラム、対話装置及び方法 |
JP5464295B1 (ja) * | 2013-08-05 | 2014-04-09 | 富士ゼロックス株式会社 | 応答装置及び応答プログラム |
JP6787101B2 (ja) * | 2016-12-13 | 2020-11-18 | 富士通株式会社 | 検索プログラム、検索装置、および検索方法 |
-
2019
- 2019-09-30 JP JP2019180170A patent/JP6710007B1/ja active Active
-
2020
- 2020-05-21 JP JP2020088881A patent/JP2020184342A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113535911A (zh) * | 2020-12-03 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 奖励模型处理方法、电子设备、介质和计算机程序产品 |
CN113535911B (zh) * | 2020-12-03 | 2024-04-12 | 腾讯科技(深圳)有限公司 | 奖励模型处理方法、电子设备、介质和计算机程序产品 |
US11687583B2 (en) | 2021-05-24 | 2023-06-27 | Samsung Eleotronicc Co., Ltd | Information retrieval system and method of information retrieval |
Also Published As
Publication number | Publication date |
---|---|
JP2020184294A (ja) | 2020-11-12 |
JP2020184342A (ja) | 2020-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6783483B2 (ja) | 表示装置 | |
US11894140B2 (en) | Interface for patient-provider conversation and auto-generation of note or summary | |
US20220391083A1 (en) | Method and System for Generating Transcripts of Patient-Healthcare Provider Conversations | |
US7580835B2 (en) | Question-answering method, system, and program for answering question input by speech | |
US6484136B1 (en) | Language model adaptation via network of similar users | |
JP6710007B1 (ja) | 対話管理サーバ、対話管理方法、及びプログラム | |
US7567906B1 (en) | Systems and methods for generating an annotation guide | |
CN105408890A (zh) | 基于声音输入执行与列表数据有关的操作 | |
JP7297458B2 (ja) | 対話コンテンツ作成支援方法 | |
US11023503B2 (en) | Suggesting text in an electronic document | |
JP6550628B1 (ja) | 対話管理サーバ、対話管理方法、及びプログラム | |
US7383171B2 (en) | Semantic stenography using short note input data | |
Saoudi et al. | Trends and challenges of Arabic Chatbots: Literature review | |
JP2020204971A (ja) | 対話管理サーバ、対話管理方法、及びプログラム | |
US7580570B2 (en) | Accuracy model for recognition signal processing engines | |
KR20210009266A (ko) | 음성 인식 기반의 세일즈 대화 분석 방법 및 장치 | |
US20090024382A1 (en) | Language information system | |
WO2010103916A1 (ja) | 文書の特徴語提示装置及び特徴語の優先度付与プログラム | |
JP2022161375A (ja) | 回答生成装置、回答生成方法、及びプログラム | |
JP2019144755A (ja) | 対話管理サーバ、対話管理方法、及びプログラム | |
US11487798B1 (en) | Method for identifying a data segment in a data set | |
US11914844B2 (en) | Automated processing and dynamic filtering of content for display | |
US11790678B1 (en) | Method for identifying entity data in a data set | |
US11651256B1 (en) | Method for training a natural language processing model | |
US11983489B1 (en) | Extractive summary generation by abstractive trained model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191008 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20191008 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20191106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200403 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200518 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200521 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6710007 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |