JP2020204971A - 対話管理サーバ、対話管理方法、及びプログラム - Google Patents
対話管理サーバ、対話管理方法、及びプログラム Download PDFInfo
- Publication number
- JP2020204971A JP2020204971A JP2019113088A JP2019113088A JP2020204971A JP 2020204971 A JP2020204971 A JP 2020204971A JP 2019113088 A JP2019113088 A JP 2019113088A JP 2019113088 A JP2019113088 A JP 2019113088A JP 2020204971 A JP2020204971 A JP 2020204971A
- Authority
- JP
- Japan
- Prior art keywords
- answer
- question
- dialogue
- document
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims description 129
- 238000011156 evaluation Methods 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 230000007717 exclusion Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 230000008520 organization Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 23
- 238000000034 method Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 16
- 238000003058 natural language processing Methods 0.000 description 9
- 238000012795 verification Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000012790 confirmation Methods 0.000 description 7
- 230000010365 information processing Effects 0.000 description 6
- 230000000877 morphologic effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- RSPISYXLHRIGJD-UHFFFAOYSA-N OOOO Chemical compound OOOO RSPISYXLHRIGJD-UHFFFAOYSA-N 0.000 description 3
- 230000008451 emotion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009940 knitting Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】組織内の業務効率化を図ることができ、且つ、ユーザの利便性を向上できることに加え、マニュアル等を有効活用することができる対話管理サーバ等を提供すること。【解決手段】対話管理サーバは、階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部11と、ユーザからの質問の入力を受け付ける受付部19と、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答としてユーザに返す回答生成部27と、を備える。【選択図】図1
Description
本発明は、対話管理サーバ、対話管理方法、及びプログラムに関する。
従来、企業においては、事務担当者が、営業担当者から業務内容に関する質問を受け付けると、膨大な業務マニュアルの中から必要な情報を抽出し、一つ一つ回答していた。ここで、顧客からの問い合わせに対してオペレータが電話で対応するための通話システムが知られている。
例えば、特許文献1には、顧客及びオペレータの通話の内容を管理する通話システムが記載されている(特許文献1)。
しかしながら、特許文献1に記載の従来システムにおいては、顧客からの電話での問い合わせの件数が多いと、その対応を行う専属のオペレータの存在が必要となるので、組織内の業務の効率化が図れない。また、問い合わせの内容によっては、オペレータが即座に回答することができないので、顧客にとって利便性が高いサービスとはいえない。
また、顧客からの問い合わせに対応するために、顧客向けのマニュアルやQ&A集が用意されることがある。しかし、そのようなマニュアルは膨大な量に及ぶことがあるため、顧客はマニュアルのどこを見ればよいのか分からず、結局、電話で問い合わせをしてしまうことも多い。このように、マニュアル等が存在するにもかかわらず、それらが有効に活用されているともいえない。
また、顧客からの問い合わせに対応するために、顧客向けのマニュアルやQ&A集が用意されることがある。しかし、そのようなマニュアルは膨大な量に及ぶことがあるため、顧客はマニュアルのどこを見ればよいのか分からず、結局、電話で問い合わせをしてしまうことも多い。このように、マニュアル等が存在するにもかかわらず、それらが有効に活用されているともいえない。
そこで、本発明のいくつかの態様はかかる事情に鑑みてなされたものであり、組織内の業務効率化を図ることができ、且つ、ユーザの利便性を向上できることに加え、マニュアル等を有効活用することができる対話管理サーバ、対話管理方法、及びプログラムを提供することを目的とする。
本発明の一態様に係る対話管理サーバは、階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部と、ユーザからの質問の入力を受け付ける受付部と、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答としてユーザに返す回答生成部と、を備える。
上記対話管理サーバにおいて、受付部はさらに、ユーザから、回答に対する応答の入力を受け付け、対話管理サーバは、質問文と、回答と、応答とを含む対話結果を対話ログデータベースに格納する対話結果管理部をさらに備え、回答生成部はさらに、対話ログデータベースに格納された対話結果に基づいて、マッチングの重み付けを学習してもよい。
上記対話管理サーバにおいて、回答生成部はさらに、回答に、質問文に含まれる単語の同義語が含まれる場合、生成される回答において、同義語をユーザが識別できるように回答出力情報を生成してもよい。
上記対話管理サーバにおいて、回答を出力する出力制御部を更に備え、出力制御部は、入力された質問に対する回答が複数生成された場合、当該質問に対する回答としてより適合する回答を優先して出力するように制御してもよい。
上記対話管理サーバにおいて、回答生成部は、入力された質問の内容が不明確である場合、入力された当該質問に対して、予め定められた回答出力情報を生成してもよい。
上記対話管理サーバにおいて、あるユーザとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザとの間で音声対話が可能となるように管理する音声対話管理部を更に備えてもよい。
上記対話管理サーバにおいて、ユーザとの間の音声対話の音声情報を認識する音声認識処理部と、質問と回答と応答とを含む対話結果を対話ログデータベースに格納する対話結果管理部と、を更に備え、対話結果管理部は、対話結果としてユーザごとに、認識された音声情報の登録又は更新を管理してもよい。
上記対話管理サーバにおいて、回答生成部は、入力された質問の内容が不明確である場合、入力された当該質問に対して第1階層における項目に基づいて回答出力情報を生成し、質問の第1回答としてユーザに返した後、さらに入力された質問に対して第1階層よりも下位の階層である第2階層における項目に基づいて回答出力情報を生成し、当該質問の第2回答としてユーザに返してもよい。
上記対話管理サーバにおいて、入力された質問と、当該質問に対する回答と、当該回答に対応する評価を求める評価要求と、が出力され、対話結果管理部は、質問と、回答と、ユーザから受け付けた評価とを関連付けて対話結果として対話ログデータベースに格納し、回答生成部は、対話ログデータベースに格納された当該対話結果に基づいて、マッチングの重み付けを学習してもよい。
上記対話管理サーバにおいて、記録部は、特定の単語と、当該単語の共起情報に重みづけを行うことで生成される一又は複数のキーワードと、を予め記録し、回答生成部は、ユーザから入力された質問に含まれる単語に対応付けられた一又は複数のキーワードを含む回答出力情報を生成してもよい。
上記対話管理サーバにおいて、文書の内容が階層構造を有する文書のデータに基づいて、階層構造の末端に位置する項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する変換部、をさらに備えてもよい。
上記対話管理サーバにおいて、回答生成部は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータ及び見出しとをマッチングして、質問に関連する項目を複数抽出してもよい。
上記対話管理サーバにおいて、入力された質問と記録部に記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に影響が除外される除外用語を記憶する除外用語記憶部をさらに備え、回答生成部は、入力された質問と記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に、除外用語の影響が除外された回答出力情報を生成してもよい。
上記対話管理サーバにおいて、構造化した形式の文書は、階層構造の末端に位置する項目に含まれるテキストデータと、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しとを対応付けたものを単位情報とするものであり、回答生成部は、入力された質問に含まれる単語を所定の個数以上含む単位情報を候補回答として抽出し、当該候補回答に基づいて回答出力情報を生成してもよい。
上記対話管理サーバにおいて、構造化した形式の文書で使用される単語の逆文書頻度を記憶する逆文書頻度記憶部をさらに備え、回答生成部は、質問に対する回答として、文書逆頻度を用いて回答出力情報を生成してもよい。
本発明の一態様に係る対話管理方法は、階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を文書情報として記録するステップと、ユーザからの質問の入力を受け付けるステップと、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答として前記ユーザに返すステップと、を含む。
本発明の一態様に係るプログラムは、コンピュータに、文書の内容が階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部、ユーザからの質問の入力を受け付ける受付部、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答として前記ユーザに返す回答生成部、として機能させるプログラム。
なお、本発明において、「部」とは、単に物理的手段を意味するものではなく、その「部」が有する機能をソフトウェアによって実現する場合も含む。また、1つの「部」や装置が有する機能が2つ以上の物理的手段や装置により実現されても、2つ以上の「部」や装置の機能が1つの物理的手段や装置により実現されても良い。
本発明によれば、組織内の業務効率化を図ることができ、且つ、ユーザの利便性を向上できることに加え、マニュアル等を有効活用することができる。
以下、添付図面を参照しながら本発明の実施の形態について説明する。以下の実施の形態は、本発明を説明するための例示であり、本発明をその実施の形態のみに限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、様々な変形が可能である。さらに、各図面において同一の構成要素に対しては可能な限り同一の符号を付し、重複する説明は省略する。
<第1実施形態>
図1は、本発明の実施形態に係る対話管理システムの概略構成図(システム構成図)である。図1に示すように、対話管理システム100は、例示的に、対話管理サーバ装置1(対話管理サーバ)、対話ログデータベース(DB)4、ユーザ端末装置6、及びオペレータ端末装置8を備えて構成されている。
図1は、本発明の実施形態に係る対話管理システムの概略構成図(システム構成図)である。図1に示すように、対話管理システム100は、例示的に、対話管理サーバ装置1(対話管理サーバ)、対話ログデータベース(DB)4、ユーザ端末装置6、及びオペレータ端末装置8を備えて構成されている。
対話管理サーバ装置1は、所定のネットワークN上における対話を管理するサーバ用コンピュータであり、そのサーバ用コンピュータにおいて所定のサーバ用プログラムが動作することにより、サーバ機能を発現するものである。「ネットワークN上における対話」とは、ネットワークNを介する、ユーザと対話管理サーバ装置1との間の対話、及び、ネットワークNを介する、オペレータと対話管理サーバ装置1との間の対話のことをいう。例えば、「ネットワークN上における対話」は、ネットワークNを介してユーザ端末装置6から対話管理サーバ装置1に入力された質問、当該質問に対応する、対話管理サーバ装置1により生成された回答、及び、当該回答に対するユーザの応答を含む。また、「ネットワークN上における対話」は、ネットワークNを介してオペレータ端末装置8から対話管理サーバ装置1に入力された質問、当該質問に対応する、対話管理サーバ装置1により生成された回答、及び、当該回答に対するオペレータの応答を含む。
対話ログDB4は、ユーザと対話管理サーバ装置1との間の対話、及び、オペレータと対話管理サーバ装置1との間の対話を記録するデータベースであり、例えば、ネットワークNを介してユーザ端末装置6から対話管理サーバ装置1に入力された質問、当該質問に対応する、対話管理サーバ装置1により生成された回答、及び、当該回答に対するユーザの応答を含む対話ログ(対話結果)を記録する。なお、対話ログDB4は、対話管理サーバ装置1に含まれてもよい。
ユーザ端末装置6及びオペレータ端末装置8は、対話の内容が出力される装置であり、例えば、ラップトップ又はノートブック型コンピュータ等の情報出力装置である。なお、ユーザ端末装置6及びオペレータ端末装置8は、例えばスマートフォンなどの携帯電話、タブレット端末等を含む情報出力装置であってもよい。
ネットワークNは、例えばインターネット等を含む情報処理に係る通信回線又は通信網であり、その具体的な構成は、対話管理サーバ装置1、対話ログDB4、ユーザ端末装置6及びオペレータ端末装置8の間でデータの送受信が可能なように構成されていれば特に制限されない。
対話管理サーバ装置1は、例示的に、所定のネットワークN上における対話を管理するための対話管理処理を実行する情報処理部10、対話管理処理に必要な情報及び対話管理処理によって生成された情報を記録する記録部11、文書が用いられる業界の専門用語が格納された専門用語辞書DB12、及び単語の同義語が格納された同義語辞書DB13を備えて構成される。
情報処理部10は、例えば、機能的に、取得部15、データ変換部17、受付部19、自然言語処理部21、重み付け設定部23、回答生成部27、対話結果管理部29、出力制御部31、音声認識処理部33、及び音声対話管理部35を含んで構成されている。
なお、情報処理部10の上記各部は、例えば、メモリやハードディスク等の記憶領域を用いたり、記憶領域に格納されているプログラムをプロセッサが実行したりすることにより実現することができる。また、対話管理サーバ装置1の各DB12及び13は、プロセッサが実行することにより実現することができる。
取得部15は、例えば、回答の対象となる文書を取得する。ここで、「文書」とは、例えば、業務で使用される業務マニュアルやQ&A集などのテキスト文書、ワードプロセッサ・ソフト等で作成した文書及びプレゼンテーション・ソフトで作成した文書等を意味する。
データ変換部17(変換部)は、文書の内容が編、章、節、項、小項目等の階層構造を有する文書のデータに基づいて、階層構造の末端に位置する項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する。所定の単位としては、例えば、階層構造の末端(最下層)に位置する項目としてもよい。その場合、階層構造の末端に位置する項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する。
図2及び3を用いて、業務マニュアルやQ&A集などの文書をもとに、本実施形態に特有の特定形式の構造化文書に変換する処理について説明する。ここでは、一般のワープロや表計算ソフトにより作成された業務マニュアルデータ等の文書をOOXML(Office Open XML)等の構造化文書に変換した後、さらに、本実施形態の対話管理サーバ装置1で利用される特定形式の構造化文書に変換する例について説明する。しかしながら、業務マニュアル等の文書を本実施形態に特有の特定形式の構造化文書に変換する際に、必ずしもOOXMLを経由する必要は無く、種々の変換処理を採用し得る。
図2は、一般のワープロや表計算ソフトにより作成された業務マニュアルデータ等の文書をOOXML(Office Open XML)等の構造化文書へ変換する処理の一例を示す概念図である。図2に示すように、データ変換部17は、ワードファイルの業務マニュアルデータを、OOXML(Office Open XML)で記述されているファイル集合体へ変換する。
図3は、OOXML(Office Open XML)等の構造化文書から、本実施形態に特有の特定形式の構造化文書へ変換する処理の一例を示す概念図である。図3に示すように、データ変換部17は、OOXMLで記述されているファイル集合体へ変換された業務マニュアルデータについて、特定のXML形式へ変換する。具体的に、データ変換部17は、階層構造を有する業務マニュアルデータを、文書の構成単位(編、章、節、項、小項目等)ごとに参照可能なように抽出し、階層構造の末端に位置する構成単位(項目)に含まれるテキストデータ(図3においては、「取引時には、…を行なう。」)のそれぞれを、抽出された構成単位ごとに、当該構成単位の階層に関する情報と、各階層の見出しに関する情報とを対応付けて構造化した形式の文書に変換し、当該文書を後述する文書情報BI(文字情報)として記録部11に記録する。
図1に戻り、受付部19は、ユーザからの質問の入力を受け付ける。また、受付部19は、ユーザから、質問への回答に対する応答の入力を受け付ける。
自然言語処理部21は、例えば、文書内の文字情報及び入力された質問に含まれる文字情報を読み込んで形態素解析して単語ごとに切り出す。「形態素解析」とは、コンピュータの自然言語処理の一つであり、文法的な情報の注記のない自然言語のテキストデータから、対象言語の文法や、単語の品詞等の情報に基づいて、形態素の単位に区切り、形態素毎に品詞等を判別する解析処理をいう。また、自然言語処理部21は、係り受け解析(構文解析)、つまり、品詞情報から文の修飾関係を調査することを実行してもよい。
重み付け設定部23は、文書内の文字情報及び入力された質問に含まれる文字情報に含まれる単語の出現頻度を算出し、算出された単語の出現頻度に基づいて単語ごとの重み付けを設定する。
回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答を生成し、質問の回答としてユーザに返す。また、回答生成部27は、後述するように、対話ログデータベース4に格納された対話結果に基づいて、マッチングの重み付けを学習してもよい。
対話結果管理部29は、ユーザから入力された質問、当該質問に対応する回答及び当該回答に対するユーザからの応答を含む対話結果を対話ログデータベース4に格納する。対話結果管理部29は、例えば、後述する音声認識処理部33により認識された音声情報を、対話結果として対話ログデータベース4に格納する。
出力制御部31は、回答生成部27により生成された回答を出力するように制御する。出力制御部31は、生成された回答を、ユーザ端末装置6及びオペレータ端末装置8の表示部(不図示)において出力するように制御する。
音声認識処理部33は、ユーザとオペレータとの音声対話の音声情報を認識する。
音声対話管理部35は、あるユーザとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザとの間で音声対話が可能となるように管理する。
記録部11は、構造化された形式に変換された文書を文書情報BIとして記録する。また、記録部11は、ユーザから入力された質問、及び当該質問に対応する回答及び当該回答に対するユーザからの応答を含む対話結果情報TI(対話結果)を、ユーザごとに関連付けて記録する。さらに、記録部11は、ユーザがネットワークNを介して入力する情報であるスタンプ情報SIを記録してもよい。
「スタンプ」とは、ネットワークNを介して入力される、対話用の画像情報である。スタンプは、例えば感情や意思、伝えたいメッセージをイラストで表したものであり、テキストを含んでもよい。
(対話管理処理)
図4及び図5を用いて、本発明に実施形態に係る対話管理処理を説明する。図4は、本発明の実施形態に係る対話管理処理の一例を示すフローチャートである。
図4及び図5を用いて、本発明に実施形態に係る対話管理処理を説明する。図4は、本発明の実施形態に係る対話管理処理の一例を示すフローチャートである。
(ステップS1)
図1に示す取得部15は、業務マニュアルやQ&A集などの文書を取得する。
図1に示す取得部15は、業務マニュアルやQ&A集などの文書を取得する。
(ステップS3)
図1に示すデータ変換部17は、図3に示すように、文書の内容が階層構造を有する文書のデータに基づいて、例えば、階層構造の末端に位置する構成単位、すなわち最下層のノードに含まれるテキストデータのそれぞれを、当該各構成単位に至る一又は複数の階層を特定可能な情報及び当該各構成単位に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する。
図1に示すデータ変換部17は、図3に示すように、文書の内容が階層構造を有する文書のデータに基づいて、例えば、階層構造の末端に位置する構成単位、すなわち最下層のノードに含まれるテキストデータのそれぞれを、当該各構成単位に至る一又は複数の階層を特定可能な情報及び当該各構成単位に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する。
(ステップS5)
図1に示す記録部11は、構造化した形式に変換された文書を文書情報BIとして記録する。
図1に示す記録部11は、構造化した形式に変換された文書を文書情報BIとして記録する。
(ステップS7)
図1に示す受付部19は、ユーザからの質問の入力を受け付ける。
図1に示す受付部19は、ユーザからの質問の入力を受け付ける。
図5は、本発明の実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。図5に示すように、図1に示すユーザ端末装置6の画面Gに表示されているとおり、受付部19は、ユーザUから入力された「本人確認書類で年金手帳を持参した。住所の記載がない場合は有効か?」という質問T1を受け付ける。
(ステップS9)
図1に示す回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答としてユーザに返す。
図1に示す回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答としてユーザに返す。
図5に示すように、図1に示す回答生成部27は、質問T1が入力された場合、入力された当該質問T1にマッチングする回答出力情報に基づく回答T3を生成し、画面Gにおいて提示する。以下では、回答生成処理をより具体的に説明する。
まず、図1に示す自然言語処理部21は、例えば、質問T1「本人確認書類で年金手帳を持参した。住所の記載がない場合は有効か?」を読み込んで形態素解析して単語ごとに切り出す。自然言語処理部21は、例えば「本人確認書類」、「本人」、「確認」、「書類」、「確認書類」、「本人確認」、「年金手帳」、「年金」、「手帳」、「持参」、「住所」、「記載」、及び「有効」等の少なくとも一以上の単語ごとに切り出す。この際に、自然言語処理部21は、必要に応じて、専門用語辞書DB12及び同義語辞書DB13を参照してもよい。また、自然言語処理部21は、形態素解析結果に基づく品詞情報を参照して、構文解析を実行する。
次に、重み付け設定部23は、質問T1に含まれる単語の出現頻度を算出し、算出された単語の出現頻度に基づいて単語ごとの重み付けを設定する。重み付け設定部23は、切り出された、「本人確認書類」、「本人」、「確認」、「書類」、「確認書類」、「本人確認」、「年金手帳」、「年金」、「手帳」、「持参」、「住所」、「記載」、及び「有効」…等の重み付けを設定する。重み付け設定部23は、例えば、一つ又は複数の文書における、出現頻度の高い単語に対する重みをより大きく設定してもよい。また、重み付け設定部23は、一つ又は複数の文書において出現頻度が低い単語に対する重みをより大きく設定してもよい。さらに、重み付け設定部23は、より短い文書において出現回数が多い単語に対する重みをより大きく設定してもよい。なお、設定された単語ごとの重み付けを示す情報は、記録部11において、文書情報BIとして記録されてもよい。
回答生成部27は、入力された当該質問T1「本人確認書類で年金手帳を持参した。住所の記載がない場合は有効か?」に含まれる単語「本人確認書類」、「本人」、「確認」、「書類」、「確認書類」、「本人確認」、「年金手帳」、「年金」、「手帳」、「持参」、「住所」、「記載」、及び「有効」等に対応する、重み付け設定部23により設定された重み付けに基づいて、入力された質問T1に対する回答として適合する文章を図1に示す文書情報BIから抽出する。回答生成部27は、例えば、文書情報BIに含まれる構成単位(編、章、節、項、小項目等)ごとに検索し、回答として適合する文章を抽出してもよい。
回答生成部27は、例えば、質問T1に含まれる単語ごとに設定された重みに基づいて、文書情報BIとして記録されている、文書データの階層構造の末端に位置する構成単位に含まれる各テキストデータのうち、より大きい重みが設定された一以上の単語をより多く含むテキストデータを、質問T1により適合するテキストデータとして抽出する。なお、マッチング処理は上記に限られず、種々のマッチング処理を採用し得る。
そして、回答生成部27は、文書情報BIから抽出した、質問T1により適合したテキストデータ、例えば、図5に示す「管理編1章…」、「為替編6章…」、及び「管理編5章…」等に、「上位候補3つを示します。どれを詳しく見ますか?」等のテンプレートを追加した回答T3を生成する。
この構成によれば、テンプレートを含む回答を生成することで、人間との会話に近い形式で自然な対話が可能となる。
図5に示すように、図1に示す出力制御部31は、入力された質問に対する回答が複数生成された場合、当該質問に対する回答としてより適合する回答を優先して出力するように制御する。出力制御部31は、例えば、当該質問T1に対する回答としてより適合する上位3つの回答、「管理編1章…」、「為替編6章…」、及び「管理編5章…」を、表示部の画面Gにおいて上から順に出力するように制御してもよい。
この構成によれば、ある質問に対する回答としてより適合する回答をユーザが容易に把握することができるので、ユーザの利便性がより向上する。
そして、図5の選択結果T5に示すように、画面Gにおいては、回答T3において「(1)管理編1章…」が選択されると、出力制御部31は、回答詳細T7に示すように、「(1)管理編1章…」の具体的内容を出力するように構成される。具体的には、出力制御部31は、選択された番号に基づいて、当該番号に対応する構成単位(編、章、節、項、小項目等)における小項目の説明文を、文書情報BIから抽出して、出力する。なお、回答T3における選択の態様に関しては、回答T3内の詳細を確認したい番号を画面G上におけるクリック動作によって選択してもよいし、詳細を確認したい番号を入力欄EBにおいてテキスト入力することで選択してもよい。
なお、回答生成部27は、ホットワード、つまり予め設定された特定の単語を、回答T3及び回答詳細T7の少なくとも一方において、他の単語とは異なる表示形態となるように回答を生成してもよい。図5に示すように、回答生成部27は、回答T3及び回答詳細T7の少なくとも一方において、予め設定された特定の単語(例えば、本人、書類、本人確認書類等)を赤字となるように、他の単語は黒字となるように回答を生成する。また、回答生成部27は、質問T1に含まれる単語を、回答T3及び回答詳細T7の少なくとも一方において、他の単語とは異なる表示形態となるように回答を生成してもよい。
この構成によれば、ユーザが、特定の単語が回答においてどの部分で用いられているかを容易に把握することができる。
また、回答生成部27は、回答に、質問に含まれる単語の同義語が含まれる場合、生成される回答において、同義語をユーザが識別できるように回答を生成する。例えば、回答生成部27は、回答T3又は回答詳細T7において、質問T1に含まれる単語(住所)の同義語が含まれる場合、生成される回答において、同義語(住居)を「住居」と強調表示した上で回答を生成する。
この構成によれば、ユーザが回答において、質問に含まれる単語の同義語を容易に識別することができる。
また、図1に示す対話結果管理部29は、質問と、質問に対する回答と、当該回答に対する応答とを含む対話結果を対話ログデータベース4に格納する。そして、回答生成部27は、対話ログデータベース4に格納された対話結果に基づいて、質問と回答とのマッチングの重み付けを学習する。
図6は、ユーザが回答(1)を選択した後に回答(2)を選択し直した場合のユーザ端末装置の表示部の画面の一例を示す図である。図6に示すように、回答T9のテキスト情報が入力された後に、お気に入りボタンHIが選択されると、対話結果管理部29は、対話の開始から終了まで、つまり、図6に示すT1〜T9のテキスト情報を対話結果として対話ログデータベース4に格納する。ここで、ユーザUにとって、最後の回答(2)(回答T9)は、質問T1により適合した回答である。したがって、対話結果管理部29は、質問T1から最初の回答(1)及び最後の回答である回答T9までを纏めて管理し、回答生成部27は、お気に入りボタンHIが選択されたことによって対話ログデータベース4に格納された対話結果は、ユーザUにとって、質問T1には、回答(2)がより適合する回答であることを学習する。このように、回答生成部27は、対話ごとに管理された対話結果に基づいて繰り返し学習することで、入力される質問と回答とのマッチングの重み付けを学習する。
この構成によれば、質問と回答とのマッチングの重み付けを学習することができるので、回答の精度を向上させることができる。
以上、本発明の第1実施形態によれば、回答生成部27は、質問が入力された場合、入力された当該質問に含まれる単語に対応する設定された重み付けに基づいて、入力された当該質問に対する回答を生成する。よって、組織内の業務効率化を図ることができ、且つ、ユーザの利便性を向上できることに加え、マニュアル等を有効活用することができる。
(変形例)
なお、上記説明では、回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出するとしたが、回答生成部27の処理はこれに限定されるものではない。回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータ及び見出しとをマッチングして、質問に関連する項目を複数抽出するものでもよい。
なお、上記説明では、回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出するとしたが、回答生成部27の処理はこれに限定されるものではない。回答生成部27は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータ及び見出しとをマッチングして、質問に関連する項目を複数抽出するものでもよい。
さらに、この場合、重み付け設定部23が、見出しとマッチングして抽出した質問に関連する項目と、記録された文書情報の各項目に含まれるテキストデータとマッチングして抽出した質問に関連する項目との重要度を変えてもよい。例えば、重み付け設定部23は、見出しに基づいて抽出された項目の重要度を、階層構造の末端に位置する構成単位のテキストデータに基づいて抽出された項目の重要度よりも高くなるように設定するものでもよい。
補足すると、質問に対する回答として、詳細な説明よりも簡易な説明の方がユーザの利便性に資することがある。それゆえ、質問によっては、各項目に含まれるテキストデータよりも見出しの方が適切な回答を誘導する場合がある。変形例の回答生成部27では、テキストデータのみならず、見出しも含めてマッチングをすることで質問に関連する項目を適切に抽出することができる。
<第2実施形態>
図7は、入力された質問の内容が不明確である場合の、端末装置の表示部の画面の一例を示す図である。図7に示すように、図1に示す回答生成部27は、入力された質問T11「口座」の内容が不明確である場合、例えば、口座の開設について質問したいのか、口座の解約について質問したいのか等が判然とせず不明確である場合、入力された当該質問に対して、より具体的な質問を促すように、予め定められた回答T13「質問の詳細を教えてください。」を生成してもよい。具体的に、回答生成部27は、入力された質問の文字数、当該質問に対する検索スコア、及び当該質問に対して抽出される文書数などを総合的に評価することで、入力された質問の内容が不明確であるか否かを判断する。
図7は、入力された質問の内容が不明確である場合の、端末装置の表示部の画面の一例を示す図である。図7に示すように、図1に示す回答生成部27は、入力された質問T11「口座」の内容が不明確である場合、例えば、口座の開設について質問したいのか、口座の解約について質問したいのか等が判然とせず不明確である場合、入力された当該質問に対して、より具体的な質問を促すように、予め定められた回答T13「質問の詳細を教えてください。」を生成してもよい。具体的に、回答生成部27は、入力された質問の文字数、当該質問に対する検索スコア、及び当該質問に対して抽出される文書数などを総合的に評価することで、入力された質問の内容が不明確であるか否かを判断する。
このように、ユーザUがより具体的な質問をするように促された結果、追加で質問T15「口座開設」と入力されたことで、出力制御部31は、回答T17に示すように、文書情報BIに含まれる構成単位のうち、「口座開設」により適合する、複数の「章」を画面Gにおいて提示し、提示された複数の「章」の中で、より適合する一以上の「節」を提示する。そして、出力制御部31は、最終的に、この「節」の中から抽出された、より適合する文章を画面Gにおいて提示するように構成されてもよい。
この構成によれば、ユーザが文書情報BIの検索箇所をより具体的に絞り込めるため、抽出精度が向上できる。
以上、本発明の第2実施形態によれば、回答生成部27は、入力された質問の内容が不明確である場合、入力された当該質問に対して、予め定められた回答を生成する。よって、ユーザに対して、より具体的な質問を促すことができるので、質問の曖昧性を回避することができ、質問に対する回答の精度を向上させることができる。
<第3実施形態>
図8は、質問及び当該質問に対する回答が所定の回数繰り返された場合の、端末装置の表示部の画面の一例を示す図である。図8に示すように、図1に示す音声対話管理部35は、あるユーザUとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザUとの間で音声対話が可能となるように管理する。例えば、音声対話管理部35は、図8のテキストT21〜T24に示すように、ユーザUとの間で質問及び回答が例えば2回実行された場合、図1に示すオペレータと電話を介して対話可能となるように電話回線にアクセスできるように管理する。なお、所定の回数は、2回に限定されない。1回であってもよいし、3回以上であってもよい。
図8は、質問及び当該質問に対する回答が所定の回数繰り返された場合の、端末装置の表示部の画面の一例を示す図である。図8に示すように、図1に示す音声対話管理部35は、あるユーザUとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザUとの間で音声対話が可能となるように管理する。例えば、音声対話管理部35は、図8のテキストT21〜T24に示すように、ユーザUとの間で質問及び回答が例えば2回実行された場合、図1に示すオペレータと電話を介して対話可能となるように電話回線にアクセスできるように管理する。なお、所定の回数は、2回に限定されない。1回であってもよいし、3回以上であってもよい。
ユーザUとの間で質問及び回答が例えば2回実行された場合であって、ユーザUから電話のリクエストT25「電話をお願いします。」があったとき、図1に示す出力制御部31は、電話を許容するためのメッセージT26を画面Gにおいて表示するように構成されてもよい。
電話による対話は、図1に示すユーザ端末装置6とオペレータのオペレータ端末装置8との間で実行もよいし、ユーザ端末装置6やオペレータ端末装置8とは異なる他の通話機器を介して実行されてもよい。ユーザとオペレータの音声情報は、ユーザ端末装置6、オペレータ端末装置8、当該他の通話機器が収集し、対話管理サーバ装置1に送信する。なお、画面Gは、ユーザ端末装置6の表示部とオペレータ端末装置8の表示部で共通して表示されてもよい。オペレータは、電話による対話までの画面G上での対話を踏まえて、電話による応答が可能となる。
ここで、図1に示す、対話管理サーバ装置1の音声認識処理部33は、ユーザとオペレータとの音声対話の音声情報を認識し、対話結果管理部29は、対話結果としてユーザごとに、認識された音声情報の登録又は更新を管理してもよい。
以上、本発明の第3実施形態によれば、音声対話管理部35は、あるユーザとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザとの間で音声対話が可能となるように管理する。よって、ユーザが簡単にオペレータに対して電話することを防ぐことでオペレータに対する電話の回数が減少するので、組織内の業務の効率化が図れる。
ただし、音声対話管理部35の動作はこれに限定されるものではなく、対話開始前からユーザの電話を受け付けるものでもよいし、電話による音声対話と文字入力による質問との両方を受け付けるものでもよい。
<第4実施形態>
図9は、入力された質問に対する回答として一以上の関連キーワードを提示する場合の、端末装置の表示部の画面の一例を示す図である。図9に示すように、図1に示す回答生成部27は、入力された質問T31「口座開設」に対する回答として、例えば、記録部11において、あらかじめ、「口座開設」という単語に関連づけて記録された、一以上の関連キーワード「手続き」、「必要書類」、「代理」及び「未成年」を含む回答T33を生成する。ここで、ある単語の関連キーワードは、当該単語の共起情報を取得し、当該共起情報に重みづけを行うことで生成される。具体的に、「口座開設」の関連キーワードとしての「手続き」、「必要書類」、「代理」及び「未成年」等は、「口座開設」の共起情報に重みづけを行うことで生成されたものである。そして、「口座開設」という単語を含む質問、並びに、当該質問に対する、「手続き」、「必要書類」、「代理」及び「未成年」等を含む回答を含む対話結果を管理することで、関連キーワードの生成の精度を向上させることができるので、質問に対する回答の精度を向上させることができる。なお、一の単語と他の単語との共起情報は、構造化した形式の文書の全テキストデータから求められる。
図9は、入力された質問に対する回答として一以上の関連キーワードを提示する場合の、端末装置の表示部の画面の一例を示す図である。図9に示すように、図1に示す回答生成部27は、入力された質問T31「口座開設」に対する回答として、例えば、記録部11において、あらかじめ、「口座開設」という単語に関連づけて記録された、一以上の関連キーワード「手続き」、「必要書類」、「代理」及び「未成年」を含む回答T33を生成する。ここで、ある単語の関連キーワードは、当該単語の共起情報を取得し、当該共起情報に重みづけを行うことで生成される。具体的に、「口座開設」の関連キーワードとしての「手続き」、「必要書類」、「代理」及び「未成年」等は、「口座開設」の共起情報に重みづけを行うことで生成されたものである。そして、「口座開設」という単語を含む質問、並びに、当該質問に対する、「手続き」、「必要書類」、「代理」及び「未成年」等を含む回答を含む対話結果を管理することで、関連キーワードの生成の精度を向上させることができるので、質問に対する回答の精度を向上させることができる。なお、一の単語と他の単語との共起情報は、構造化した形式の文書の全テキストデータから求められる。
以上、本発明の第4実施形態によれば、質問に含まれる単語にあらかじめ関連づけられたキーワードを提示し、ユーザに選択させることで、質問の曖昧性を回避することができ、質問に対する回答の精度を向上させることができる。
<第5実施形態>
第5実施形態においては、ユーザから入力された質問の内容が不明確である場合に、より具体的な質問を促すように、例えば編、章、節、項、小項目等からなる階層構造を有する文書データに基づいて、段階的に回答を出力する。例えば、第5実施形態における対話管理システムにおいては、入力された当該質問に対して編階層(第1階層)における項目に基づいて回答出力情報を生成し、質問の第1回答としてユーザUに返す。その後、さらに入力された質問に対して編階層よりも下位の階層である章、節、項、又は小項目等の階層(第2階層)における項目に基づいて回答出力情報を生成し、当該質問の第2回答としてユーザUに返す。
第5実施形態においては、ユーザから入力された質問の内容が不明確である場合に、より具体的な質問を促すように、例えば編、章、節、項、小項目等からなる階層構造を有する文書データに基づいて、段階的に回答を出力する。例えば、第5実施形態における対話管理システムにおいては、入力された当該質問に対して編階層(第1階層)における項目に基づいて回答出力情報を生成し、質問の第1回答としてユーザUに返す。その後、さらに入力された質問に対して編階層よりも下位の階層である章、節、項、又は小項目等の階層(第2階層)における項目に基づいて回答出力情報を生成し、当該質問の第2回答としてユーザUに返す。
第5実施形態を図10及び図11を参照して説明する。図10及び図11は、入力された質問の内容が不明確である場合の、ユーザ端末装置6の表示部の画面Gの一例を示す図である。図10に示すように、図1に示す回答生成部27は、入力された質問T41「口座を統一する」の文字数、当該質問に対する検索スコア、及び当該質問に対して抽出される文書数などを総合的に評価することで、入力された質問T41「口座を統一する」の内容が不明確であるか否かを判定する。回答生成部27は、どのような内容の口座の統一について質問したいのか等が判然とせず不明確である場合、入力された当該質問に対して、より具体的な質問を促すように、入力された当該質問に対して編階層における、「預金編」、「共通編」…等に基づいて回答出力情報を生成し、質問の回答T43としてユーザUに返す。なお、回答生成部27は、例えば、回答T43の出力の際に、予め定められた回答T42「『〇〇〇〇』はどの編に該当しますか?もう少し詳しく教えてください。」を生成し返答してもよい。
回答生成部27は、その後、さらに入力された質問T44に対して前編よりも下位の階層である節階層における、「基本事項」、「取扱手続」…等に基づいて回答出力情報を生成し、当該質問の回答T46としてユーザUに返す。なお、回答生成部27は、例えば、回答T46の出力の際に、予め定められた回答T45「『〇〇〇〇』について複数の候補があります。次のうちどの項目に近いですか?」を生成し返答してもよい。
図11に示すように、回答生成部27は、さらに入力された質問T47に対して、編、章、節、項の各階層における各項目に基づいて回答出力情報を生成し、当該質問の回答T49としてユーザに返す。ここで、回答生成部27は、例えば、図10に示す質問T41及びT44、並びにT47に対する最終的な回答としてより適合する上位3つの回答を画面Gにおいて上から順に出力可能な回答出力情報を生成してもよい。なお、回答生成部27は、例えば、回答T49の出力の際に、最初に入力された、図10における質問T41「口座を統一する」を生成し返答してもよい。
以上、本発明の第5実施形態によれば、ユーザからの質問内容に応じて段階的に回答を提示する。よって、回答候補を効率的に絞り込むことができるので、回答の精度を向上させることができ、且つ、迅速に所望の回答を画面上において提示することができる。
<第6実施形態>
第6実施形態は、ユーザからの質問と、質問に対する回答と、回答に対する評価とを対話結果として関連付けて格納し、格納された対話結果に基づいて、質問と回答とのマッチングの重み付けを学習する。第6実施形態を図12から図14を参照して説明する。
第6実施形態は、ユーザからの質問と、質問に対する回答と、回答に対する評価とを対話結果として関連付けて格納し、格納された対話結果に基づいて、質問と回答とのマッチングの重み付けを学習する。第6実施形態を図12から図14を参照して説明する。
図12は、ユーザ端末装置6の表示部における、ユーザUの質問と回答とを含む対話の一例を示す画面例である。図12に示すように、回答生成部27は、入力された質問T51に対して、編、章、節、項の各階層における各項目に基づいて回答出力情報を生成し、当該質問の回答T53としてユーザUに返す。また、回答T53の出力の際に、予め定められた回答T52「『〇〇〇〇』についてこの中に答えはありますか?」を生成し返答してもよい。
図13は、図12に示す画面Gにおける回答T53において、ユーザUが一番目の回答「(1):計算編…」を選択した後に続く対話の一例を示す画面例である。なお、図12における回答T53における選択の態様に関しては、回答T53内の詳細を確認したい番号を画面G上におけるクリック動作によって選択してもよいし、詳細を確認したい番号を、不図示のユーザ入力欄においてテキスト入力することで選択してもよい。
図13に示すように、図12に示す画面Gにおける回答T53において、ユーザUが一番目の回答「(1):計算編…」を選択すると、回答生成部27は、回答詳細T55に示すように、「(1):計算編…」の具体的内容を出力可能なように回答出力情報を生成する。具体的には、回答生成部27は、選択された番号に基づいて、当該番号に対応する構成単位(編、章、節、項、小項目等)における小項目の説明文を、図1に示す文書情報BIから抽出して、回答出力情報を生成する。なお、回答生成部27は、ホットワード、つまり予め設定された特定の単語を、回答詳細T55において、他の単語とは異なる表示形態となるように回答出力情報を生成してもよい。図13に示すように、回答生成部27は、図12に示す質問T51に含まれる単語(例えば、裁判費用立替口、及び、開設)を、回答詳細T55において、他の単語とは異なる表示形態となるように回答を生成してもよい。また、回答生成部27は、予め設定された特定の単語(例えば、裁判費用立替口、及び、開設)を赤字となるように、他の単語は黒字となるように回答出力情報を生成してもよい。
また、回答生成部27は、例えば、回答詳細T55の後に、ユーザUから入力された質問に対する回答について評価を促すための回答T56(評価要求)を出力する。回答T56は、例えば、「回答の評価はいかがでしょうか?」のテキストともに、「Good」(良い)という特定の意味に対応づけられたスタンプST1、及び、「Bad」(悪い)という特定の意味に対応づけられたスタンプST2を含んで構成される。
「スタンプ」とは、ネットワークNを介して入力される、対話用の画像情報である。スタンプは、例えばユーザの感情、意図や意思、伝えたいメッセージをイラストで表したものであり、画像情報の他、テキストを含んでもよい。図1に示す記録部11は、スタンプと特定の意味とを対応づけて記録する。例えば、スタンプは、「Good」(良い)、及び、「Bad」(悪い)という特定の意味に対応づけられて記録される。また、スタンプは、イラストと、回答の精度を示す得点、例えば100点、75点等を示すテキスト情報と、関連づけて含むものであってもよい。なお、評価は、スタンプを選択することには限られない。例えば、回答T56において選択可能なように「Good」ボタン又は「Bad」ボタンが含まれる場合、ユーザは、いずれかのボタンを選択することで評価入力を実行してもよい。また、ユーザは、回答詳細T55が出力された後に、不図示のテキスト入力欄から、「Good」又は「Bad」のテキスト情報を入力することによって評価入力を実行してもよい。なお、評価は、「Good」(良い)、又は、「Bad」(悪い)の2パターンだけではなく、とても良い、良い、普通、悪い、とても悪いというように3つ以上のパターンを含んでもよい。
次に、図1に示す対話結果管理部29は、ユーザUからの質問と、当該質問に対する回答と、入力されたスタンプ(評価)と、を含む対話結果を対話ログデータベース4に格納する。以下、対話結果管理部29の処理を具体的に説明する。
図13に示すように、ユーザUにより、回答に対する良好な評価を示す「Good」を含むスタンプST1が選択された後に、例えば、不図示の対話終了ボタンが選択されると、対話結果管理部29は、対話の開始から終了まで、つまり、図12及び図13に示すT51〜T56のテキスト情報及びスタンプST1を対話結果として対話ログデータベース4に格納する。このように、対話結果管理部29は、対話の開始から終了まで纏めて(関連づけて)管理することで、対話管理サーバ装置1が入力された質問に対してより適合した回答であると評価して提示された回答、及び、実際にユーザが選択した(ユーザが所望する)回答を纏めて管理する。
図14は、本発明の実施形態に係るオペレータ端末装置の表示部における対話ログ管理画面の一例を示す図である。例えば、対話ログ管理画面LGに表示される情報は、対話結果管理部29が対話ログデータベース4に格納する情報に対応している。図14に示すように、対話ログデータベース4には、対話ログIDと、ユーザIDと、対話ログが格納された日時と、当該対話において最初に入力された質問と、当該質問に関する最終的な回答と、当該回答の番号(例えば、図12における回答T53の番号(1)、(2)(3))と、当該回答に対する評価と、が関連付けて記録されている。なお、対話ログデータベース4には、ユーザからの最初の質問に対する回答のみならず、ユーザから入力された質問ごとの一又は複数の回答が格納されてよく、対話ログ管理画面LGは、ユーザから入力された質問ごとの一又は複数の回答が出力されてもよい。
対話結果管理部29は、スタンプを含む対話結果を格納し、回答に対する評価に基づいて当該対話結果に関する検索スコアを調整する。つまり、対話結果管理部29は、入力された回答の評価を反映したスタンプとともに対話結果を繰り返し記録し、複数の対話結果(質問及び回答のセット)を回答の評価に応じて、質問に対する検索スコアを上昇させる。例えば、図14において、現在、対話ログID「7350」である対話結果、つまり、質問「新規口座開設について」及び回答「カード編1章…」のセットが上から2つ目にランクされているが、別の機会に、例えば、ユーザが「新規口座開設」に関する質問を入力し、上記と同様の回答「カード編1章…」に対して「Good」の評価を入力すると、対話ログ管理画面LGにおいて、上記セットの表示位置が最上位になるように制御される。他方で、ある質問及び回答のセットに対して「Bad」と評価されると、対話ログ管理画面LGにおいて、当該セットが非表示制御されたり、当該セットの表示位置が下位になるように制御される。
回答生成部27は、対話結果として対話ログデータベース4に格納されたスタンプに対応づけられた評価に基づいて、入力された質問と、当該質問に対する回答とのマッチングの重み付けを学習する。
例えば、回答生成部27は、ユーザUにとって、図12に示す質問T51には、回答T53に含まれる複数の回答のうち、一番目の回答「(1):計算編…」がより適合する回答であることを分析し、回答「(1):計算編…」の重み付けが他の回答に比べて上がるように制御する。例えば、回答生成部27は、回答「(1):計算編…」の重み付けをあげるとともに、回答T53に含まれる他の回答「(2)計算編…」「(3)計算編…」等の重み付けを下げてもよい。このように、回答生成部27は、対話ごとに管理された対話結果に基づいて繰り返し学習することで、入力される質問と回答とのマッチングの重み付けを学習する。
以上、本発明の第6実施形態によれば、ユーザからの質問と、質問に対する回答と、回答に対する評価とを対話結果として関連付けて格納し、格納された対話結果に基づいて、質問と回答とのマッチングの重み付けを学習する。よって、質問と回答とのマッチングの重み付けを学習することができるので、回答の精度を向上させることができる。
<第7実施形態>
図15を参照して、第7実施形態に係る対話管理システムを説明する。図15は、第7実施形態に係る対話管理システムの概略構成図(システム構成図)である。第7実施形態においては、図15に示すように、対話管理サーバ装置1が除外用語辞書DB14をさらに備える。除外用語辞書DB14は、入力された質問と、記録部11に記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に影響が除外される「除外用語」を記憶するデータベースである。具体的には、除外用語としては、助詞、接続詞、所定の修飾語、所定の頻出語などが挙げられる。ここで、所定の修飾語とは、「いろいろな」「様々な」などの実質的に就職する単語の意味を制限しない用語が該当する。また、所定の頻出語とは、特定形式の構造化文書で用いられる全用語のうち頻出する用語のことであり、数万ワードの日本語の文書においては上位10個ぐらいの用語がこれに該当する。例えば、「確認」などの用語が頻出語として挙げられることが多い。
図15を参照して、第7実施形態に係る対話管理システムを説明する。図15は、第7実施形態に係る対話管理システムの概略構成図(システム構成図)である。第7実施形態においては、図15に示すように、対話管理サーバ装置1が除外用語辞書DB14をさらに備える。除外用語辞書DB14は、入力された質問と、記録部11に記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に影響が除外される「除外用語」を記憶するデータベースである。具体的には、除外用語としては、助詞、接続詞、所定の修飾語、所定の頻出語などが挙げられる。ここで、所定の修飾語とは、「いろいろな」「様々な」などの実質的に就職する単語の意味を制限しない用語が該当する。また、所定の頻出語とは、特定形式の構造化文書で用いられる全用語のうち頻出する用語のことであり、数万ワードの日本語の文書においては上位10個ぐらいの用語がこれに該当する。例えば、「確認」などの用語が頻出語として挙げられることが多い。
回答生成部27は、入力された質問と記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に、除外用語の影響が除外された回答出力情報を生成する。
第7実施形態に係る対話管理サーバ装置1は、上述した構成を具備しているので、質問に対する回答の妥当性を高めることができる。補足すると、一般的に、記録された文書情報の各項目に含まれるテキストデータが、入力された質問に頻出する用語を多く含んでいる場合、質問の回答として妥当である可能性が高い。しかしながら、文章情報の全用語のうち他の用語に比して突出して頻出する用語等は、任意の項目で使用されている可能性があり、却って回答としての妥当性を低下させることがある。そこで、マッチングの際に、これらの用語の影響を除外することで、質問に対する回答の妥当性を高めることができる場合がある。
<第8実施形態>
第8実施形態においては、第1実施形態から第7実施形態に係る構造化した形式の文書が、階層構造の末端に位置する項目に含まれるテキストデータと、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しとを対応付けたものを「単位情報」とするものである。具体的には、図3に示すようなデータが一つの単位情報として定義され、これらの集合が上述した特定形式の構造化文書として定義される。
第8実施形態においては、第1実施形態から第7実施形態に係る構造化した形式の文書が、階層構造の末端に位置する項目に含まれるテキストデータと、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しとを対応付けたものを「単位情報」とするものである。具体的には、図3に示すようなデータが一つの単位情報として定義され、これらの集合が上述した特定形式の構造化文書として定義される。
図16を参照して、第8実施形態に係る対話管理システムを説明する。図16は、第8実施形態に係る対話管理システムの概略構成図(システム構成図)である。第8実施形態に係る対話管理サーバ装置1は、逆文書頻度DB24をさらに備える。逆文書頻度DB24は、構造化した形式の文書で使用される単語の逆文書頻度を記憶するデータベースである。ここで、「逆文書頻度」とは、構造化した形式の文書における全単位情報の総数maxDを、文書全体における単語の珍しさを示す指標であり、当該単語が含まれる単位情報の数DFreqsで除した値のことである。
重み付け設定部23は、単位情報内の文字情報に含まれる単語の出現頻度を算出し、算出された単語の出現頻度に基づいて単語ごとの重み付けを設定する。さらに、重み付け設定部23は、逆文書頻度に基づいて重み付けを補正する。
回答生成部27は、入力された質問に含まれる単語を所定の個数以上含む単位情報を候補回答として抽出し、当該候補回答に基づいて回答出力情報を生成する。ここで、回答生成部27は、重み付け設定部23により設定される重み付けに基づいて候補回答と質問との類似度を算出する。そして、回答生成部27は、類似度の高い候補回答を回答出力情報として生成する。なお、類似度の算出には、TFIDFSimilarityやBM25Similarityのアルゴリズムを用いることができる。
上記構成により、第8実施形態に係る対話管理サーバ装置1では、質問に含まれる単語が多い回答を生成するので、妥当性の高い回答を提供することができる。
また、第8実施形態に係る対話管理サーバ装置1は、逆文書頻度に基づいて単語の重みを補正してから類似度を算出することができる。これにより、文書全体における当該単語の珍しさを反映させることができる。ここで、文書全体における単語の珍しさは、当該単語が特徴的であることを示す傾向が高く、テキストデータの検索においては正解を示す可能性が高いものである。したがって、回答生成部27は、逆文書頻度で補正された類似度を用いることで、入力された質問に対して妥当な回答出力情報を生成する。
なお、第8実施形態に係る対話管理サーバ装置1に、図15に示す除外用語辞書DB14を組み合わせた場合には、候補回答の抽出の際に、当該除外用語に関しては単位情報の個数がカウントされなくなる。
なお、上記各実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するものではない。本発明はその趣旨を逸脱することなく、変更/改良され得るとともに、本発明にはその等価物も含まれる。また、本発明は、上記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の開示を形成できるものである。例えば、実施形態に示される全構成要素から幾つかの構成要素は削除してもよいものである。さらに、異なる実施形態に構成要素を適宜組み合わせてもよいものである。
また、フローチャートの各ステップは、必ずしも上記したステップとおりに実行される必要はない。例えば、図4に示すステップS1、S3及びS5は、ステップS7の後に実行されてもよい。
1…対話管理サーバ装置、4…対話ログDB、6…ユーザ端末装置、8…オペレータ端末装置、10…情報処理部、11…記録部、12…専門用語辞書DB、13…同義語辞書DB、14…除外用語辞書DB、15…取得部、17…データ変換部、19…受付部、21…自然言語処理部、23…重み付け設定部、24…、逆文書頻度DB、27…回答生成部、29…対話結果管理部、31…出力制御部、33…音声認識処理部、35…音声対話管理部、100…対話管理システム
Claims (17)
- 階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部と、
ユーザからの質問の入力を受け付ける受付部と、
前記入力された質問と、記録された前記文書情報の各項目に含まれるテキストデータとをマッチングして、前記質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、前記質問の回答として前記ユーザに返す回答生成部と、
を備える対話管理サーバ。 - 前記受付部はさらに、前記ユーザから、前記回答に対する応答の入力を受け付け、
前記対話管理サーバは、前記質問と、前記回答と、前記応答とを含む対話結果を対話ログデータベースに格納する対話結果管理部をさらに備え、
前記回答生成部はさらに、前記対話ログデータベースに格納された対話結果に基づいて、前記マッチングの重み付けを学習する、
請求項1に記載の対話管理サーバ。 - 前記回答生成部はさらに、前記回答に、前記質問に含まれる単語の同義語が含まれる場合、前記同義語を前記ユーザが識別できるように前記回答出力情報を生成する、
請求項1又は2に記載の対話管理サーバ。 - 前記回答を出力する出力制御部を更に備え、
前記出力制御部は、入力された前記質問に対する回答が複数生成された場合、当該質問に対する回答としてより適合する回答を優先して出力するように制御する、
請求項1乃至3のいずれか一項に記載の対話管理サーバ。 - 前記回答生成部は、入力された前記質問の内容が不明確である場合、入力された当該質問に対して、予め定められた回答出力情報を生成する、
請求項1乃至4のいずれか一項に記載の対話管理サーバ。 - あるユーザとの間で前記質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザとの間で音声対話が可能となるように管理する音声対話管理部を更に備える、
請求項1乃至5のいずれか一項に記載の対話管理サーバ。 - ユーザとの間の音声対話の音声情報を認識する音声認識処理部と、
前記質問と、前記回答と、前記応答とを含む対話結果を対話ログデータベースに格納する対話結果管理部と、更に備え、
前記対話結果管理部は、前記対話結果として前記ユーザごとに、認識された前記音声情報の登録又は更新を管理する、
請求項2乃至6のいずれか一項に記載の対話管理サーバ。 - 前記回答生成部は、入力された前記質問の内容が不明確である場合、入力された当該質問に対して第1階層における項目に基づいて回答出力情報を生成し、前記質問の第1回答として前記ユーザに返した後、さらに入力された質問に対して前記第1階層よりも下位の階層である第2階層における項目に基づいて回答出力情報を生成し、当該質問の第2回答として前記ユーザに返す、
請求項1乃至7のいずれか一項に記載の対話管理サーバ。 - 入力された前記質問と、当該質問に対する回答と、当該回答に対応する評価を求める評価要求と、が出力され、
前記対話結果管理部は、前記質問と、前記回答と、前記ユーザから受け付けた前記評価とを関連付けて対話結果として前記対話ログデータベースに格納し、
前記回答生成部は、前記対話ログデータベースに格納された当該対話結果に基づいて、前記マッチングの重み付けを学習する、
請求項2に記載の対話管理サーバ。 - 前記記録部は、特定の単語と、当該単語の共起情報に重みづけを行うことで生成される一又は複数のキーワードと、を予め記録し、
前記回答生成部は、前記ユーザから入力された前記質問に含まれる単語に対応付けられた一又は複数のキーワードを含む回答出力情報を生成する、
請求項1乃至9のいずれか一項に記載の対話管理サーバ。 - 文書の内容が階層構造を有する文書のデータに基づいて、前記階層構造の末端に位置する項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する変換部、
をさらに備える、請求項1乃至10のいずれか一項に記載の対話管理サーバ。 - 前記回答生成部は、前記入力された質問と、記録された前記文書情報の各項目に含まれるテキストデータ及び見出しとをマッチングして、前記質問に関連する項目を複数抽出する、
請求項1乃至11のいずれか一項に記載の対話管理サーバ。 - 前記入力された質問と前記記録部に記録された前記文書情報の各項目に含まれるテキストデータとのマッチングの際に影響が除外される除外用語を記憶する除外用語記憶部をさらに備え、
前記回答生成部は、前記入力された質問と記録された前記文書情報の各項目に含まれるテキストデータとのマッチングの際に、前記除外用語の影響が除外された回答出力情報を生成する、
請求項1乃至12のいずれか一項に記載の対話管理サーバ。 - 前記構造化した形式の文書は、前記階層構造の末端に位置する項目に含まれるテキストデータと、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しとを対応付けたものを単位情報とするものであり、
前記回答生成部は、前記入力された質問に含まれる単語を所定の個数以上含む単位情報を候補回答として抽出し、当該候補回答に基づいて回答出力情報を生成する、
請求項1乃至13のいずれか一項に記載の対話管理サーバ。 - 前記構造化した形式の文書で使用される単語の逆文書頻度を記憶する逆文書頻度記憶部をさらに備え、
前記回答生成部は、前記質問に対する回答として、前記逆文書頻度を用いて前記回答出力情報を生成する、
請求項1乃至14のいずれか一項に記載の対話管理サーバ。 - 階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録するステップと、
ユーザからの質問の入力を受け付けるステップと、
前記入力された質問と、記録された前記文書情報の各項目に含まれるテキストデータとをマッチングして、前記質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、前記質問の回答として前記ユーザに返すステップと、
を含む、対話管理方法。 - コンピュータに、
階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部、
ユーザからの質問の入力を受け付ける受付部、
前記入力された質問と、記録された前記文書情報の各項目に含まれるテキストデータとをマッチングして、前記質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、前記質問の回答として前記ユーザに返す回答生成部、
として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019113088A JP2020204971A (ja) | 2019-06-18 | 2019-06-18 | 対話管理サーバ、対話管理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019113088A JP2020204971A (ja) | 2019-06-18 | 2019-06-18 | 対話管理サーバ、対話管理方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020204971A true JP2020204971A (ja) | 2020-12-24 |
Family
ID=73837431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019113088A Pending JP2020204971A (ja) | 2019-06-18 | 2019-06-18 | 対話管理サーバ、対話管理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020204971A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115579008A (zh) * | 2022-12-05 | 2023-01-06 | 广州小鹏汽车科技有限公司 | 语音交互方法、服务器及计算机可读存储介质 |
JP7474538B1 (ja) | 2023-08-31 | 2024-04-25 | 株式会社エーアイカウンセリング | チャットプログラム、チャットシステム及びチャット方法 |
-
2019
- 2019-06-18 JP JP2019113088A patent/JP2020204971A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115579008A (zh) * | 2022-12-05 | 2023-01-06 | 广州小鹏汽车科技有限公司 | 语音交互方法、服务器及计算机可读存储介质 |
JP7474538B1 (ja) | 2023-08-31 | 2024-04-25 | 株式会社エーアイカウンセリング | チャットプログラム、チャットシステム及びチャット方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7299181B2 (en) | Homonym processing in the context of voice-activated command systems | |
US10152301B2 (en) | Providing interface controls based on voice commands | |
US7184539B2 (en) | Automated call center transcription services | |
US7672908B2 (en) | Intent-based information processing and updates in association with a service agent | |
CN105408890A (zh) | 基于声音输入执行与列表数据有关的操作 | |
US10762114B1 (en) | Ecosystem for providing responses to user queries entered via a conversational interface | |
US20130103391A1 (en) | Natural language processing for software commands | |
US7567906B1 (en) | Systems and methods for generating an annotation guide | |
JP7042693B2 (ja) | 対話型業務支援システム | |
US20140101139A1 (en) | Methods and devices for querying databases using aliasing tables on mobile devices | |
US20120023393A1 (en) | Intent-based information processing and updates | |
WO2011093025A1 (ja) | 入力支援システム、方法、およびプログラム | |
EP1901283A2 (en) | Automatic generation of statistical laguage models for interactive voice response applacation | |
JP6550628B1 (ja) | 対話管理サーバ、対話管理方法、及びプログラム | |
US20130124194A1 (en) | Systems and methods for manipulating data using natural language commands | |
MXPA05002951A (es) | Tablas de conversion con ordenes en lenguaje natural. | |
US20160275444A1 (en) | Procurement System | |
US11727213B2 (en) | Automatic conversation bot generation using input form | |
WO2003093922A2 (en) | Customer interaction reporting | |
JP6710007B1 (ja) | 対話管理サーバ、対話管理方法、及びプログラム | |
JP2020135135A (ja) | 対話コンテンツ作成支援方法およびシステム | |
Li et al. | Development of an intelligent NLP-based audit plan knowledge discovery system | |
JP2020204971A (ja) | 対話管理サーバ、対話管理方法、及びプログラム | |
CN114186016A (zh) | 人机对话方法、装置、设备及存储介质 | |
US20180357324A1 (en) | Auto Identification and Mapping of Functional Attributes from Visual Representation |