JP2020204971A

JP2020204971A - 対話管理サーバ、対話管理方法、及びプログラム

Info

Publication number: JP2020204971A
Application number: JP2019113088A
Authority: JP
Inventors: 大田　佳宏; Yoshihiro Ota; 佳宏大田; 昂平安田; Kohei Yasuda; 公陽衣笠; Kimihiro Kinugasa; 鈴木　良尚; Yoshihisa Suzuki; 良尚鈴木; 亮介田嶋; Ryosuke Tajima
Original assignee: Arithmer Inc
Current assignee: Arithmer Inc
Priority date: 2019-06-18
Filing date: 2019-06-18
Publication date: 2020-12-24

Abstract

【課題】組織内の業務効率化を図ることができ、且つ、ユーザの利便性を向上できることに加え、マニュアル等を有効活用することができる対話管理サーバ等を提供すること。【解決手段】対話管理サーバは、階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部１１と、ユーザからの質問の入力を受け付ける受付部１９と、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答としてユーザに返す回答生成部２７と、を備える。【選択図】図１

Description

本発明は、対話管理サーバ、対話管理方法、及びプログラムに関する。

従来、企業においては、事務担当者が、営業担当者から業務内容に関する質問を受け付けると、膨大な業務マニュアルの中から必要な情報を抽出し、一つ一つ回答していた。ここで、顧客からの問い合わせに対してオペレータが電話で対応するための通話システムが知られている。

例えば、特許文献１には、顧客及びオペレータの通話の内容を管理する通話システムが記載されている（特許文献１）。

国際公開第２０１２／１２０６２４号

しかしながら、特許文献１に記載の従来システムにおいては、顧客からの電話での問い合わせの件数が多いと、その対応を行う専属のオペレータの存在が必要となるので、組織内の業務の効率化が図れない。また、問い合わせの内容によっては、オペレータが即座に回答することができないので、顧客にとって利便性が高いサービスとはいえない。
また、顧客からの問い合わせに対応するために、顧客向けのマニュアルやＱ＆Ａ集が用意されることがある。しかし、そのようなマニュアルは膨大な量に及ぶことがあるため、顧客はマニュアルのどこを見ればよいのか分からず、結局、電話で問い合わせをしてしまうことも多い。このように、マニュアル等が存在するにもかかわらず、それらが有効に活用されているともいえない。

そこで、本発明のいくつかの態様はかかる事情に鑑みてなされたものであり、組織内の業務効率化を図ることができ、且つ、ユーザの利便性を向上できることに加え、マニュアル等を有効活用することができる対話管理サーバ、対話管理方法、及びプログラムを提供することを目的とする。

本発明の一態様に係る対話管理サーバは、階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部と、ユーザからの質問の入力を受け付ける受付部と、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答としてユーザに返す回答生成部と、を備える。

上記対話管理サーバにおいて、受付部はさらに、ユーザから、回答に対する応答の入力を受け付け、対話管理サーバは、質問文と、回答と、応答とを含む対話結果を対話ログデータベースに格納する対話結果管理部をさらに備え、回答生成部はさらに、対話ログデータベースに格納された対話結果に基づいて、マッチングの重み付けを学習してもよい。

上記対話管理サーバにおいて、回答生成部はさらに、回答に、質問文に含まれる単語の同義語が含まれる場合、生成される回答において、同義語をユーザが識別できるように回答出力情報を生成してもよい。

上記対話管理サーバにおいて、回答を出力する出力制御部を更に備え、出力制御部は、入力された質問に対する回答が複数生成された場合、当該質問に対する回答としてより適合する回答を優先して出力するように制御してもよい。

上記対話管理サーバにおいて、回答生成部は、入力された質問の内容が不明確である場合、入力された当該質問に対して、予め定められた回答出力情報を生成してもよい。

上記対話管理サーバにおいて、あるユーザとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザとの間で音声対話が可能となるように管理する音声対話管理部を更に備えてもよい。

上記対話管理サーバにおいて、ユーザとの間の音声対話の音声情報を認識する音声認識処理部と、質問と回答と応答とを含む対話結果を対話ログデータベースに格納する対話結果管理部と、を更に備え、対話結果管理部は、対話結果としてユーザごとに、認識された音声情報の登録又は更新を管理してもよい。

上記対話管理サーバにおいて、回答生成部は、入力された質問の内容が不明確である場合、入力された当該質問に対して第１階層における項目に基づいて回答出力情報を生成し、質問の第１回答としてユーザに返した後、さらに入力された質問に対して第１階層よりも下位の階層である第２階層における項目に基づいて回答出力情報を生成し、当該質問の第２回答としてユーザに返してもよい。

上記対話管理サーバにおいて、入力された質問と、当該質問に対する回答と、当該回答に対応する評価を求める評価要求と、が出力され、対話結果管理部は、質問と、回答と、ユーザから受け付けた評価とを関連付けて対話結果として対話ログデータベースに格納し、回答生成部は、対話ログデータベースに格納された当該対話結果に基づいて、マッチングの重み付けを学習してもよい。

上記対話管理サーバにおいて、記録部は、特定の単語と、当該単語の共起情報に重みづけを行うことで生成される一又は複数のキーワードと、を予め記録し、回答生成部は、ユーザから入力された質問に含まれる単語に対応付けられた一又は複数のキーワードを含む回答出力情報を生成してもよい。

上記対話管理サーバにおいて、文書の内容が階層構造を有する文書のデータに基づいて、階層構造の末端に位置する項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する変換部、をさらに備えてもよい。

上記対話管理サーバにおいて、回答生成部は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータ及び見出しとをマッチングして、質問に関連する項目を複数抽出してもよい。

上記対話管理サーバにおいて、入力された質問と記録部に記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に影響が除外される除外用語を記憶する除外用語記憶部をさらに備え、回答生成部は、入力された質問と記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に、除外用語の影響が除外された回答出力情報を生成してもよい。

上記対話管理サーバにおいて、構造化した形式の文書は、階層構造の末端に位置する項目に含まれるテキストデータと、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しとを対応付けたものを単位情報とするものであり、回答生成部は、入力された質問に含まれる単語を所定の個数以上含む単位情報を候補回答として抽出し、当該候補回答に基づいて回答出力情報を生成してもよい。

上記対話管理サーバにおいて、構造化した形式の文書で使用される単語の逆文書頻度を記憶する逆文書頻度記憶部をさらに備え、回答生成部は、質問に対する回答として、文書逆頻度を用いて回答出力情報を生成してもよい。

本発明の一態様に係る対話管理方法は、階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を文書情報として記録するステップと、ユーザからの質問の入力を受け付けるステップと、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答として前記ユーザに返すステップと、を含む。

本発明の一態様に係るプログラムは、コンピュータに、文書の内容が階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部、ユーザからの質問の入力を受け付ける受付部、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答として前記ユーザに返す回答生成部、として機能させるプログラム。

なお、本発明において、「部」とは、単に物理的手段を意味するものではなく、その「部」が有する機能をソフトウェアによって実現する場合も含む。また、１つの「部」や装置が有する機能が２つ以上の物理的手段や装置により実現されても、２つ以上の「部」や装置の機能が１つの物理的手段や装置により実現されても良い。

本発明によれば、組織内の業務効率化を図ることができ、且つ、ユーザの利便性を向上できることに加え、マニュアル等を有効活用することができる。

第１実施形態に係る対話管理システムの概略構成図（システム構成図）である。一般のワープロや表計算ソフトにより作成された業務マニュアルデータ等の文書をＯＯＸＭＬ（Office Open XML）等の構造化文書へ変換する処理の一例を示す概念図である。ＯＯＸＭＬ等の構造化文書から、本実施形態に特有の特定形式の構造化文書へ変換する処理の一例を示す概念図である。第１実施形態に係る対話管理処理の一例を示すフローチャートである。第１実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第１実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第２実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第３実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第４実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第５実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第５実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第６実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第６実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。第６実施形態に係るオペレータ端末装置の表示部の画面の一例を示す図である。第７実施形態に係る対話管理システムの概略構成図（システム構成図）である。第８実施形態に係る対話管理システムの概略構成図（システム構成図）である。

以下、添付図面を参照しながら本発明の実施の形態について説明する。以下の実施の形態は、本発明を説明するための例示であり、本発明をその実施の形態のみに限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、様々な変形が可能である。さらに、各図面において同一の構成要素に対しては可能な限り同一の符号を付し、重複する説明は省略する。

＜第１実施形態＞
図１は、本発明の実施形態に係る対話管理システムの概略構成図（システム構成図）である。図１に示すように、対話管理システム１００は、例示的に、対話管理サーバ装置１（対話管理サーバ）、対話ログデータベース（ＤＢ）４、ユーザ端末装置６、及びオペレータ端末装置８を備えて構成されている。

対話管理サーバ装置１は、所定のネットワークＮ上における対話を管理するサーバ用コンピュータであり、そのサーバ用コンピュータにおいて所定のサーバ用プログラムが動作することにより、サーバ機能を発現するものである。「ネットワークＮ上における対話」とは、ネットワークＮを介する、ユーザと対話管理サーバ装置１との間の対話、及び、ネットワークＮを介する、オペレータと対話管理サーバ装置１との間の対話のことをいう。例えば、「ネットワークＮ上における対話」は、ネットワークＮを介してユーザ端末装置６から対話管理サーバ装置１に入力された質問、当該質問に対応する、対話管理サーバ装置１により生成された回答、及び、当該回答に対するユーザの応答を含む。また、「ネットワークＮ上における対話」は、ネットワークＮを介してオペレータ端末装置８から対話管理サーバ装置１に入力された質問、当該質問に対応する、対話管理サーバ装置１により生成された回答、及び、当該回答に対するオペレータの応答を含む。

対話ログＤＢ４は、ユーザと対話管理サーバ装置１との間の対話、及び、オペレータと対話管理サーバ装置１との間の対話を記録するデータベースであり、例えば、ネットワークＮを介してユーザ端末装置６から対話管理サーバ装置１に入力された質問、当該質問に対応する、対話管理サーバ装置１により生成された回答、及び、当該回答に対するユーザの応答を含む対話ログ（対話結果）を記録する。なお、対話ログＤＢ４は、対話管理サーバ装置１に含まれてもよい。

ユーザ端末装置６及びオペレータ端末装置８は、対話の内容が出力される装置であり、例えば、ラップトップ又はノートブック型コンピュータ等の情報出力装置である。なお、ユーザ端末装置６及びオペレータ端末装置８は、例えばスマートフォンなどの携帯電話、タブレット端末等を含む情報出力装置であってもよい。

ネットワークＮは、例えばインターネット等を含む情報処理に係る通信回線又は通信網であり、その具体的な構成は、対話管理サーバ装置１、対話ログＤＢ４、ユーザ端末装置６及びオペレータ端末装置８の間でデータの送受信が可能なように構成されていれば特に制限されない。

対話管理サーバ装置１は、例示的に、所定のネットワークＮ上における対話を管理するための対話管理処理を実行する情報処理部１０、対話管理処理に必要な情報及び対話管理処理によって生成された情報を記録する記録部１１、文書が用いられる業界の専門用語が格納された専門用語辞書ＤＢ１２、及び単語の同義語が格納された同義語辞書ＤＢ１３を備えて構成される。

情報処理部１０は、例えば、機能的に、取得部１５、データ変換部１７、受付部１９、自然言語処理部２１、重み付け設定部２３、回答生成部２７、対話結果管理部２９、出力制御部３１、音声認識処理部３３、及び音声対話管理部３５を含んで構成されている。

なお、情報処理部１０の上記各部は、例えば、メモリやハードディスク等の記憶領域を用いたり、記憶領域に格納されているプログラムをプロセッサが実行したりすることにより実現することができる。また、対話管理サーバ装置１の各ＤＢ１２及び１３は、プロセッサが実行することにより実現することができる。

取得部１５は、例えば、回答の対象となる文書を取得する。ここで、「文書」とは、例えば、業務で使用される業務マニュアルやＱ＆Ａ集などのテキスト文書、ワードプロセッサ・ソフト等で作成した文書及びプレゼンテーション・ソフトで作成した文書等を意味する。

データ変換部１７（変換部）は、文書の内容が編、章、節、項、小項目等の階層構造を有する文書のデータに基づいて、階層構造の末端に位置する項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する。所定の単位としては、例えば、階層構造の末端（最下層）に位置する項目としてもよい。その場合、階層構造の末端に位置する項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する。

図２及び３を用いて、業務マニュアルやＱ＆Ａ集などの文書をもとに、本実施形態に特有の特定形式の構造化文書に変換する処理について説明する。ここでは、一般のワープロや表計算ソフトにより作成された業務マニュアルデータ等の文書をＯＯＸＭＬ（Office Open XML）等の構造化文書に変換した後、さらに、本実施形態の対話管理サーバ装置１で利用される特定形式の構造化文書に変換する例について説明する。しかしながら、業務マニュアル等の文書を本実施形態に特有の特定形式の構造化文書に変換する際に、必ずしもＯＯＸＭＬを経由する必要は無く、種々の変換処理を採用し得る。

図２は、一般のワープロや表計算ソフトにより作成された業務マニュアルデータ等の文書をＯＯＸＭＬ（Office Open XML）等の構造化文書へ変換する処理の一例を示す概念図である。図２に示すように、データ変換部１７は、ワードファイルの業務マニュアルデータを、ＯＯＸＭＬ（Office Open XML）で記述されているファイル集合体へ変換する。

図３は、ＯＯＸＭＬ（Office Open XML）等の構造化文書から、本実施形態に特有の特定形式の構造化文書へ変換する処理の一例を示す概念図である。図３に示すように、データ変換部１７は、ＯＯＸＭＬで記述されているファイル集合体へ変換された業務マニュアルデータについて、特定のＸＭＬ形式へ変換する。具体的に、データ変換部１７は、階層構造を有する業務マニュアルデータを、文書の構成単位（編、章、節、項、小項目等）ごとに参照可能なように抽出し、階層構造の末端に位置する構成単位（項目）に含まれるテキストデータ（図３においては、「取引時には、…を行なう。」）のそれぞれを、抽出された構成単位ごとに、当該構成単位の階層に関する情報と、各階層の見出しに関する情報とを対応付けて構造化した形式の文書に変換し、当該文書を後述する文書情報ＢＩ（文字情報）として記録部１１に記録する。

図１に戻り、受付部１９は、ユーザからの質問の入力を受け付ける。また、受付部１９は、ユーザから、質問への回答に対する応答の入力を受け付ける。

自然言語処理部２１は、例えば、文書内の文字情報及び入力された質問に含まれる文字情報を読み込んで形態素解析して単語ごとに切り出す。「形態素解析」とは、コンピュータの自然言語処理の一つであり、文法的な情報の注記のない自然言語のテキストデータから、対象言語の文法や、単語の品詞等の情報に基づいて、形態素の単位に区切り、形態素毎に品詞等を判別する解析処理をいう。また、自然言語処理部２１は、係り受け解析（構文解析）、つまり、品詞情報から文の修飾関係を調査することを実行してもよい。

重み付け設定部２３は、文書内の文字情報及び入力された質問に含まれる文字情報に含まれる単語の出現頻度を算出し、算出された単語の出現頻度に基づいて単語ごとの重み付けを設定する。

回答生成部２７は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答を生成し、質問の回答としてユーザに返す。また、回答生成部２７は、後述するように、対話ログデータベース４に格納された対話結果に基づいて、マッチングの重み付けを学習してもよい。

対話結果管理部２９は、ユーザから入力された質問、当該質問に対応する回答及び当該回答に対するユーザからの応答を含む対話結果を対話ログデータベース４に格納する。対話結果管理部２９は、例えば、後述する音声認識処理部３３により認識された音声情報を、対話結果として対話ログデータベース４に格納する。

出力制御部３１は、回答生成部２７により生成された回答を出力するように制御する。出力制御部３１は、生成された回答を、ユーザ端末装置６及びオペレータ端末装置８の表示部（不図示）において出力するように制御する。

音声認識処理部３３は、ユーザとオペレータとの音声対話の音声情報を認識する。

音声対話管理部３５は、あるユーザとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザとの間で音声対話が可能となるように管理する。

記録部１１は、構造化された形式に変換された文書を文書情報ＢＩとして記録する。また、記録部１１は、ユーザから入力された質問、及び当該質問に対応する回答及び当該回答に対するユーザからの応答を含む対話結果情報ＴＩ（対話結果）を、ユーザごとに関連付けて記録する。さらに、記録部１１は、ユーザがネットワークＮを介して入力する情報であるスタンプ情報ＳＩを記録してもよい。

「スタンプ」とは、ネットワークＮを介して入力される、対話用の画像情報である。スタンプは、例えば感情や意思、伝えたいメッセージをイラストで表したものであり、テキストを含んでもよい。

（対話管理処理）
図４及び図５を用いて、本発明に実施形態に係る対話管理処理を説明する。図４は、本発明の実施形態に係る対話管理処理の一例を示すフローチャートである。

（ステップＳ１）
図１に示す取得部１５は、業務マニュアルやＱ＆Ａ集などの文書を取得する。

（ステップＳ３）
図１に示すデータ変換部１７は、図３に示すように、文書の内容が階層構造を有する文書のデータに基づいて、例えば、階層構造の末端に位置する構成単位、すなわち最下層のノードに含まれるテキストデータのそれぞれを、当該各構成単位に至る一又は複数の階層を特定可能な情報及び当該各構成単位に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する。

（ステップＳ５）
図１に示す記録部１１は、構造化した形式に変換された文書を文書情報ＢＩとして記録する。

（ステップＳ７）
図１に示す受付部１９は、ユーザからの質問の入力を受け付ける。

図５は、本発明の実施形態に係るユーザ端末装置の表示部の画面の一例を示す図である。図５に示すように、図１に示すユーザ端末装置６の画面Ｇに表示されているとおり、受付部１９は、ユーザＵから入力された「本人確認書類で年金手帳を持参した。住所の記載がない場合は有効か？」という質問Ｔ１を受け付ける。

（ステップＳ９）
図１に示す回答生成部２７は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、質問の回答としてユーザに返す。

図５に示すように、図１に示す回答生成部２７は、質問Ｔ１が入力された場合、入力された当該質問Ｔ１にマッチングする回答出力情報に基づく回答Ｔ３を生成し、画面Ｇにおいて提示する。以下では、回答生成処理をより具体的に説明する。

まず、図１に示す自然言語処理部２１は、例えば、質問Ｔ１「本人確認書類で年金手帳を持参した。住所の記載がない場合は有効か？」を読み込んで形態素解析して単語ごとに切り出す。自然言語処理部２１は、例えば「本人確認書類」、「本人」、「確認」、「書類」、「確認書類」、「本人確認」、「年金手帳」、「年金」、「手帳」、「持参」、「住所」、「記載」、及び「有効」等の少なくとも一以上の単語ごとに切り出す。この際に、自然言語処理部２１は、必要に応じて、専門用語辞書ＤＢ１２及び同義語辞書ＤＢ１３を参照してもよい。また、自然言語処理部２１は、形態素解析結果に基づく品詞情報を参照して、構文解析を実行する。

次に、重み付け設定部２３は、質問Ｔ１に含まれる単語の出現頻度を算出し、算出された単語の出現頻度に基づいて単語ごとの重み付けを設定する。重み付け設定部２３は、切り出された、「本人確認書類」、「本人」、「確認」、「書類」、「確認書類」、「本人確認」、「年金手帳」、「年金」、「手帳」、「持参」、「住所」、「記載」、及び「有効」…等の重み付けを設定する。重み付け設定部２３は、例えば、一つ又は複数の文書における、出現頻度の高い単語に対する重みをより大きく設定してもよい。また、重み付け設定部２３は、一つ又は複数の文書において出現頻度が低い単語に対する重みをより大きく設定してもよい。さらに、重み付け設定部２３は、より短い文書において出現回数が多い単語に対する重みをより大きく設定してもよい。なお、設定された単語ごとの重み付けを示す情報は、記録部１１において、文書情報ＢＩとして記録されてもよい。

回答生成部２７は、入力された当該質問Ｔ１「本人確認書類で年金手帳を持参した。住所の記載がない場合は有効か？」に含まれる単語「本人確認書類」、「本人」、「確認」、「書類」、「確認書類」、「本人確認」、「年金手帳」、「年金」、「手帳」、「持参」、「住所」、「記載」、及び「有効」等に対応する、重み付け設定部２３により設定された重み付けに基づいて、入力された質問Ｔ１に対する回答として適合する文章を図１に示す文書情報ＢＩから抽出する。回答生成部２７は、例えば、文書情報ＢＩに含まれる構成単位（編、章、節、項、小項目等）ごとに検索し、回答として適合する文章を抽出してもよい。

回答生成部２７は、例えば、質問Ｔ１に含まれる単語ごとに設定された重みに基づいて、文書情報ＢＩとして記録されている、文書データの階層構造の末端に位置する構成単位に含まれる各テキストデータのうち、より大きい重みが設定された一以上の単語をより多く含むテキストデータを、質問Ｔ１により適合するテキストデータとして抽出する。なお、マッチング処理は上記に限られず、種々のマッチング処理を採用し得る。

そして、回答生成部２７は、文書情報ＢＩから抽出した、質問Ｔ１により適合したテキストデータ、例えば、図５に示す「管理編１章…」、「為替編６章…」、及び「管理編５章…」等に、「上位候補３つを示します。どれを詳しく見ますか？」等のテンプレートを追加した回答Ｔ３を生成する。

この構成によれば、テンプレートを含む回答を生成することで、人間との会話に近い形式で自然な対話が可能となる。

図５に示すように、図１に示す出力制御部３１は、入力された質問に対する回答が複数生成された場合、当該質問に対する回答としてより適合する回答を優先して出力するように制御する。出力制御部３１は、例えば、当該質問Ｔ１に対する回答としてより適合する上位３つの回答、「管理編１章…」、「為替編６章…」、及び「管理編５章…」を、表示部の画面Ｇにおいて上から順に出力するように制御してもよい。

この構成によれば、ある質問に対する回答としてより適合する回答をユーザが容易に把握することができるので、ユーザの利便性がより向上する。

そして、図５の選択結果Ｔ５に示すように、画面Ｇにおいては、回答Ｔ３において「（１）管理編１章…」が選択されると、出力制御部３１は、回答詳細Ｔ７に示すように、「（１）管理編１章…」の具体的内容を出力するように構成される。具体的には、出力制御部３１は、選択された番号に基づいて、当該番号に対応する構成単位（編、章、節、項、小項目等）における小項目の説明文を、文書情報ＢＩから抽出して、出力する。なお、回答Ｔ３における選択の態様に関しては、回答Ｔ３内の詳細を確認したい番号を画面Ｇ上におけるクリック動作によって選択してもよいし、詳細を確認したい番号を入力欄ＥＢにおいてテキスト入力することで選択してもよい。

なお、回答生成部２７は、ホットワード、つまり予め設定された特定の単語を、回答Ｔ３及び回答詳細Ｔ７の少なくとも一方において、他の単語とは異なる表示形態となるように回答を生成してもよい。図５に示すように、回答生成部２７は、回答Ｔ３及び回答詳細Ｔ７の少なくとも一方において、予め設定された特定の単語（例えば、本人、書類、本人確認書類等）を赤字となるように、他の単語は黒字となるように回答を生成する。また、回答生成部２７は、質問Ｔ１に含まれる単語を、回答Ｔ３及び回答詳細Ｔ７の少なくとも一方において、他の単語とは異なる表示形態となるように回答を生成してもよい。

この構成によれば、ユーザが、特定の単語が回答においてどの部分で用いられているかを容易に把握することができる。

また、回答生成部２７は、回答に、質問に含まれる単語の同義語が含まれる場合、生成される回答において、同義語をユーザが識別できるように回答を生成する。例えば、回答生成部２７は、回答Ｔ３又は回答詳細Ｔ７において、質問Ｔ１に含まれる単語（住所）の同義語が含まれる場合、生成される回答において、同義語（住居）を「住居」と強調表示した上で回答を生成する。

この構成によれば、ユーザが回答において、質問に含まれる単語の同義語を容易に識別することができる。

また、図１に示す対話結果管理部２９は、質問と、質問に対する回答と、当該回答に対する応答とを含む対話結果を対話ログデータベース４に格納する。そして、回答生成部２７は、対話ログデータベース４に格納された対話結果に基づいて、質問と回答とのマッチングの重み付けを学習する。

図６は、ユーザが回答（１）を選択した後に回答（２）を選択し直した場合のユーザ端末装置の表示部の画面の一例を示す図である。図６に示すように、回答Ｔ９のテキスト情報が入力された後に、お気に入りボタンＨＩが選択されると、対話結果管理部２９は、対話の開始から終了まで、つまり、図６に示すＴ１〜Ｔ９のテキスト情報を対話結果として対話ログデータベース４に格納する。ここで、ユーザＵにとって、最後の回答（２）（回答Ｔ９）は、質問Ｔ１により適合した回答である。したがって、対話結果管理部２９は、質問Ｔ１から最初の回答（１）及び最後の回答である回答Ｔ９までを纏めて管理し、回答生成部２７は、お気に入りボタンＨＩが選択されたことによって対話ログデータベース４に格納された対話結果は、ユーザＵにとって、質問Ｔ１には、回答（２）がより適合する回答であることを学習する。このように、回答生成部２７は、対話ごとに管理された対話結果に基づいて繰り返し学習することで、入力される質問と回答とのマッチングの重み付けを学習する。

この構成によれば、質問と回答とのマッチングの重み付けを学習することができるので、回答の精度を向上させることができる。

以上、本発明の第１実施形態によれば、回答生成部２７は、質問が入力された場合、入力された当該質問に含まれる単語に対応する設定された重み付けに基づいて、入力された当該質問に対する回答を生成する。よって、組織内の業務効率化を図ることができ、且つ、ユーザの利便性を向上できることに加え、マニュアル等を有効活用することができる。

（変形例）
なお、上記説明では、回答生成部２７は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータとをマッチングして、質問に関連する項目を複数抽出するとしたが、回答生成部２７の処理はこれに限定されるものではない。回答生成部２７は、入力された質問と、記録された文書情報の各項目に含まれるテキストデータ及び見出しとをマッチングして、質問に関連する項目を複数抽出するものでもよい。

さらに、この場合、重み付け設定部２３が、見出しとマッチングして抽出した質問に関連する項目と、記録された文書情報の各項目に含まれるテキストデータとマッチングして抽出した質問に関連する項目との重要度を変えてもよい。例えば、重み付け設定部２３は、見出しに基づいて抽出された項目の重要度を、階層構造の末端に位置する構成単位のテキストデータに基づいて抽出された項目の重要度よりも高くなるように設定するものでもよい。

補足すると、質問に対する回答として、詳細な説明よりも簡易な説明の方がユーザの利便性に資することがある。それゆえ、質問によっては、各項目に含まれるテキストデータよりも見出しの方が適切な回答を誘導する場合がある。変形例の回答生成部２７では、テキストデータのみならず、見出しも含めてマッチングをすることで質問に関連する項目を適切に抽出することができる。

＜第２実施形態＞
図７は、入力された質問の内容が不明確である場合の、端末装置の表示部の画面の一例を示す図である。図７に示すように、図１に示す回答生成部２７は、入力された質問Ｔ１１「口座」の内容が不明確である場合、例えば、口座の開設について質問したいのか、口座の解約について質問したいのか等が判然とせず不明確である場合、入力された当該質問に対して、より具体的な質問を促すように、予め定められた回答Ｔ１３「質問の詳細を教えてください。」を生成してもよい。具体的に、回答生成部２７は、入力された質問の文字数、当該質問に対する検索スコア、及び当該質問に対して抽出される文書数などを総合的に評価することで、入力された質問の内容が不明確であるか否かを判断する。

このように、ユーザＵがより具体的な質問をするように促された結果、追加で質問Ｔ１５「口座開設」と入力されたことで、出力制御部３１は、回答Ｔ１７に示すように、文書情報ＢＩに含まれる構成単位のうち、「口座開設」により適合する、複数の「章」を画面Ｇにおいて提示し、提示された複数の「章」の中で、より適合する一以上の「節」を提示する。そして、出力制御部３１は、最終的に、この「節」の中から抽出された、より適合する文章を画面Ｇにおいて提示するように構成されてもよい。

この構成によれば、ユーザが文書情報ＢＩの検索箇所をより具体的に絞り込めるため、抽出精度が向上できる。

以上、本発明の第２実施形態によれば、回答生成部２７は、入力された質問の内容が不明確である場合、入力された当該質問に対して、予め定められた回答を生成する。よって、ユーザに対して、より具体的な質問を促すことができるので、質問の曖昧性を回避することができ、質問に対する回答の精度を向上させることができる。

＜第３実施形態＞
図８は、質問及び当該質問に対する回答が所定の回数繰り返された場合の、端末装置の表示部の画面の一例を示す図である。図８に示すように、図１に示す音声対話管理部３５は、あるユーザＵとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザＵとの間で音声対話が可能となるように管理する。例えば、音声対話管理部３５は、図８のテキストＴ２１〜Ｔ２４に示すように、ユーザＵとの間で質問及び回答が例えば２回実行された場合、図１に示すオペレータと電話を介して対話可能となるように電話回線にアクセスできるように管理する。なお、所定の回数は、２回に限定されない。１回であってもよいし、３回以上であってもよい。

ユーザＵとの間で質問及び回答が例えば２回実行された場合であって、ユーザＵから電話のリクエストＴ２５「電話をお願いします。」があったとき、図１に示す出力制御部３１は、電話を許容するためのメッセージＴ２６を画面Ｇにおいて表示するように構成されてもよい。

電話による対話は、図１に示すユーザ端末装置６とオペレータのオペレータ端末装置８との間で実行もよいし、ユーザ端末装置６やオペレータ端末装置８とは異なる他の通話機器を介して実行されてもよい。ユーザとオペレータの音声情報は、ユーザ端末装置６、オペレータ端末装置８、当該他の通話機器が収集し、対話管理サーバ装置１に送信する。なお、画面Ｇは、ユーザ端末装置６の表示部とオペレータ端末装置８の表示部で共通して表示されてもよい。オペレータは、電話による対話までの画面Ｇ上での対話を踏まえて、電話による応答が可能となる。

ここで、図１に示す、対話管理サーバ装置１の音声認識処理部３３は、ユーザとオペレータとの音声対話の音声情報を認識し、対話結果管理部２９は、対話結果としてユーザごとに、認識された音声情報の登録又は更新を管理してもよい。

以上、本発明の第３実施形態によれば、音声対話管理部３５は、あるユーザとの間で質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザとの間で音声対話が可能となるように管理する。よって、ユーザが簡単にオペレータに対して電話することを防ぐことでオペレータに対する電話の回数が減少するので、組織内の業務の効率化が図れる。

ただし、音声対話管理部３５の動作はこれに限定されるものではなく、対話開始前からユーザの電話を受け付けるものでもよいし、電話による音声対話と文字入力による質問との両方を受け付けるものでもよい。

＜第４実施形態＞
図９は、入力された質問に対する回答として一以上の関連キーワードを提示する場合の、端末装置の表示部の画面の一例を示す図である。図９に示すように、図１に示す回答生成部２７は、入力された質問Ｔ３１「口座開設」に対する回答として、例えば、記録部１１において、あらかじめ、「口座開設」という単語に関連づけて記録された、一以上の関連キーワード「手続き」、「必要書類」、「代理」及び「未成年」を含む回答Ｔ３３を生成する。ここで、ある単語の関連キーワードは、当該単語の共起情報を取得し、当該共起情報に重みづけを行うことで生成される。具体的に、「口座開設」の関連キーワードとしての「手続き」、「必要書類」、「代理」及び「未成年」等は、「口座開設」の共起情報に重みづけを行うことで生成されたものである。そして、「口座開設」という単語を含む質問、並びに、当該質問に対する、「手続き」、「必要書類」、「代理」及び「未成年」等を含む回答を含む対話結果を管理することで、関連キーワードの生成の精度を向上させることができるので、質問に対する回答の精度を向上させることができる。なお、一の単語と他の単語との共起情報は、構造化した形式の文書の全テキストデータから求められる。

以上、本発明の第４実施形態によれば、質問に含まれる単語にあらかじめ関連づけられたキーワードを提示し、ユーザに選択させることで、質問の曖昧性を回避することができ、質問に対する回答の精度を向上させることができる。

＜第５実施形態＞
第５実施形態においては、ユーザから入力された質問の内容が不明確である場合に、より具体的な質問を促すように、例えば編、章、節、項、小項目等からなる階層構造を有する文書データに基づいて、段階的に回答を出力する。例えば、第５実施形態における対話管理システムにおいては、入力された当該質問に対して編階層（第１階層）における項目に基づいて回答出力情報を生成し、質問の第１回答としてユーザＵに返す。その後、さらに入力された質問に対して編階層よりも下位の階層である章、節、項、又は小項目等の階層（第２階層）における項目に基づいて回答出力情報を生成し、当該質問の第２回答としてユーザＵに返す。

第５実施形態を図１０及び図１１を参照して説明する。図１０及び図１１は、入力された質問の内容が不明確である場合の、ユーザ端末装置６の表示部の画面Ｇの一例を示す図である。図１０に示すように、図１に示す回答生成部２７は、入力された質問Ｔ４１「口座を統一する」の文字数、当該質問に対する検索スコア、及び当該質問に対して抽出される文書数などを総合的に評価することで、入力された質問Ｔ４１「口座を統一する」の内容が不明確であるか否かを判定する。回答生成部２７は、どのような内容の口座の統一について質問したいのか等が判然とせず不明確である場合、入力された当該質問に対して、より具体的な質問を促すように、入力された当該質問に対して編階層における、「預金編」、「共通編」…等に基づいて回答出力情報を生成し、質問の回答Ｔ４３としてユーザＵに返す。なお、回答生成部２７は、例えば、回答Ｔ４３の出力の際に、予め定められた回答Ｔ４２「『〇〇〇〇』はどの編に該当しますか？もう少し詳しく教えてください。」を生成し返答してもよい。

回答生成部２７は、その後、さらに入力された質問Ｔ４４に対して前編よりも下位の階層である節階層における、「基本事項」、「取扱手続」…等に基づいて回答出力情報を生成し、当該質問の回答Ｔ４６としてユーザＵに返す。なお、回答生成部２７は、例えば、回答Ｔ４６の出力の際に、予め定められた回答Ｔ４５「『〇〇〇〇』について複数の候補があります。次のうちどの項目に近いですか？」を生成し返答してもよい。

図１１に示すように、回答生成部２７は、さらに入力された質問Ｔ４７に対して、編、章、節、項の各階層における各項目に基づいて回答出力情報を生成し、当該質問の回答Ｔ４９としてユーザに返す。ここで、回答生成部２７は、例えば、図１０に示す質問Ｔ４１及びＴ４４、並びにＴ４７に対する最終的な回答としてより適合する上位３つの回答を画面Ｇにおいて上から順に出力可能な回答出力情報を生成してもよい。なお、回答生成部２７は、例えば、回答Ｔ４９の出力の際に、最初に入力された、図１０における質問Ｔ４１「口座を統一する」を生成し返答してもよい。

以上、本発明の第５実施形態によれば、ユーザからの質問内容に応じて段階的に回答を提示する。よって、回答候補を効率的に絞り込むことができるので、回答の精度を向上させることができ、且つ、迅速に所望の回答を画面上において提示することができる。

＜第６実施形態＞
第６実施形態は、ユーザからの質問と、質問に対する回答と、回答に対する評価とを対話結果として関連付けて格納し、格納された対話結果に基づいて、質問と回答とのマッチングの重み付けを学習する。第６実施形態を図１２から図１４を参照して説明する。

図１２は、ユーザ端末装置６の表示部における、ユーザＵの質問と回答とを含む対話の一例を示す画面例である。図１２に示すように、回答生成部２７は、入力された質問Ｔ５１に対して、編、章、節、項の各階層における各項目に基づいて回答出力情報を生成し、当該質問の回答Ｔ５３としてユーザＵに返す。また、回答Ｔ５３の出力の際に、予め定められた回答Ｔ５２「『〇〇〇〇』についてこの中に答えはありますか？」を生成し返答してもよい。

図１３は、図１２に示す画面Ｇにおける回答Ｔ５３において、ユーザＵが一番目の回答「（１）：計算編…」を選択した後に続く対話の一例を示す画面例である。なお、図１２における回答Ｔ５３における選択の態様に関しては、回答Ｔ５３内の詳細を確認したい番号を画面Ｇ上におけるクリック動作によって選択してもよいし、詳細を確認したい番号を、不図示のユーザ入力欄においてテキスト入力することで選択してもよい。

図１３に示すように、図１２に示す画面Ｇにおける回答Ｔ５３において、ユーザＵが一番目の回答「（１）：計算編…」を選択すると、回答生成部２７は、回答詳細Ｔ５５に示すように、「（１）：計算編…」の具体的内容を出力可能なように回答出力情報を生成する。具体的には、回答生成部２７は、選択された番号に基づいて、当該番号に対応する構成単位（編、章、節、項、小項目等）における小項目の説明文を、図１に示す文書情報ＢＩから抽出して、回答出力情報を生成する。なお、回答生成部２７は、ホットワード、つまり予め設定された特定の単語を、回答詳細Ｔ５５において、他の単語とは異なる表示形態となるように回答出力情報を生成してもよい。図１３に示すように、回答生成部２７は、図１２に示す質問Ｔ５１に含まれる単語（例えば、裁判費用立替口、及び、開設）を、回答詳細Ｔ５５において、他の単語とは異なる表示形態となるように回答を生成してもよい。また、回答生成部２７は、予め設定された特定の単語（例えば、裁判費用立替口、及び、開設）を赤字となるように、他の単語は黒字となるように回答出力情報を生成してもよい。

また、回答生成部２７は、例えば、回答詳細Ｔ５５の後に、ユーザＵから入力された質問に対する回答について評価を促すための回答Ｔ５６（評価要求）を出力する。回答Ｔ５６は、例えば、「回答の評価はいかがでしょうか？」のテキストともに、「Ｇｏｏｄ」（良い）という特定の意味に対応づけられたスタンプＳＴ１、及び、「Ｂａｄ」（悪い）という特定の意味に対応づけられたスタンプＳＴ２を含んで構成される。

「スタンプ」とは、ネットワークＮを介して入力される、対話用の画像情報である。スタンプは、例えばユーザの感情、意図や意思、伝えたいメッセージをイラストで表したものであり、画像情報の他、テキストを含んでもよい。図１に示す記録部１１は、スタンプと特定の意味とを対応づけて記録する。例えば、スタンプは、「Ｇｏｏｄ」（良い）、及び、「Ｂａｄ」（悪い）という特定の意味に対応づけられて記録される。また、スタンプは、イラストと、回答の精度を示す得点、例えば１００点、７５点等を示すテキスト情報と、関連づけて含むものであってもよい。なお、評価は、スタンプを選択することには限られない。例えば、回答Ｔ５６において選択可能なように「Ｇｏｏｄ」ボタン又は「Ｂａｄ」ボタンが含まれる場合、ユーザは、いずれかのボタンを選択することで評価入力を実行してもよい。また、ユーザは、回答詳細Ｔ５５が出力された後に、不図示のテキスト入力欄から、「Ｇｏｏｄ」又は「Ｂａｄ」のテキスト情報を入力することによって評価入力を実行してもよい。なお、評価は、「Ｇｏｏｄ」（良い）、又は、「Ｂａｄ」（悪い）の２パターンだけではなく、とても良い、良い、普通、悪い、とても悪いというように３つ以上のパターンを含んでもよい。

次に、図１に示す対話結果管理部２９は、ユーザＵからの質問と、当該質問に対する回答と、入力されたスタンプ（評価）と、を含む対話結果を対話ログデータベース４に格納する。以下、対話結果管理部２９の処理を具体的に説明する。

図１３に示すように、ユーザＵにより、回答に対する良好な評価を示す「Ｇｏｏｄ」を含むスタンプＳＴ１が選択された後に、例えば、不図示の対話終了ボタンが選択されると、対話結果管理部２９は、対話の開始から終了まで、つまり、図１２及び図１３に示すＴ５１〜Ｔ５６のテキスト情報及びスタンプＳＴ１を対話結果として対話ログデータベース４に格納する。このように、対話結果管理部２９は、対話の開始から終了まで纏めて（関連づけて）管理することで、対話管理サーバ装置１が入力された質問に対してより適合した回答であると評価して提示された回答、及び、実際にユーザが選択した（ユーザが所望する）回答を纏めて管理する。

図１４は、本発明の実施形態に係るオペレータ端末装置の表示部における対話ログ管理画面の一例を示す図である。例えば、対話ログ管理画面ＬＧに表示される情報は、対話結果管理部２９が対話ログデータベース４に格納する情報に対応している。図１４に示すように、対話ログデータベース４には、対話ログＩＤと、ユーザＩＤと、対話ログが格納された日時と、当該対話において最初に入力された質問と、当該質問に関する最終的な回答と、当該回答の番号（例えば、図１２における回答Ｔ５３の番号（１）、（２）（３））と、当該回答に対する評価と、が関連付けて記録されている。なお、対話ログデータベース４には、ユーザからの最初の質問に対する回答のみならず、ユーザから入力された質問ごとの一又は複数の回答が格納されてよく、対話ログ管理画面ＬＧは、ユーザから入力された質問ごとの一又は複数の回答が出力されてもよい。

対話結果管理部２９は、スタンプを含む対話結果を格納し、回答に対する評価に基づいて当該対話結果に関する検索スコアを調整する。つまり、対話結果管理部２９は、入力された回答の評価を反映したスタンプとともに対話結果を繰り返し記録し、複数の対話結果（質問及び回答のセット）を回答の評価に応じて、質問に対する検索スコアを上昇させる。例えば、図１４において、現在、対話ログＩＤ「７３５０」である対話結果、つまり、質問「新規口座開設について」及び回答「カード編１章…」のセットが上から２つ目にランクされているが、別の機会に、例えば、ユーザが「新規口座開設」に関する質問を入力し、上記と同様の回答「カード編１章…」に対して「Ｇｏｏｄ」の評価を入力すると、対話ログ管理画面ＬＧにおいて、上記セットの表示位置が最上位になるように制御される。他方で、ある質問及び回答のセットに対して「Ｂａｄ」と評価されると、対話ログ管理画面ＬＧにおいて、当該セットが非表示制御されたり、当該セットの表示位置が下位になるように制御される。

回答生成部２７は、対話結果として対話ログデータベース４に格納されたスタンプに対応づけられた評価に基づいて、入力された質問と、当該質問に対する回答とのマッチングの重み付けを学習する。

例えば、回答生成部２７は、ユーザＵにとって、図１２に示す質問Ｔ５１には、回答Ｔ５３に含まれる複数の回答のうち、一番目の回答「（１）：計算編…」がより適合する回答であることを分析し、回答「（１）：計算編…」の重み付けが他の回答に比べて上がるように制御する。例えば、回答生成部２７は、回答「（１）：計算編…」の重み付けをあげるとともに、回答Ｔ５３に含まれる他の回答「（２）計算編…」「（３）計算編…」等の重み付けを下げてもよい。このように、回答生成部２７は、対話ごとに管理された対話結果に基づいて繰り返し学習することで、入力される質問と回答とのマッチングの重み付けを学習する。

以上、本発明の第６実施形態によれば、ユーザからの質問と、質問に対する回答と、回答に対する評価とを対話結果として関連付けて格納し、格納された対話結果に基づいて、質問と回答とのマッチングの重み付けを学習する。よって、質問と回答とのマッチングの重み付けを学習することができるので、回答の精度を向上させることができる。

＜第７実施形態＞
図１５を参照して、第７実施形態に係る対話管理システムを説明する。図１５は、第７実施形態に係る対話管理システムの概略構成図（システム構成図）である。第７実施形態においては、図１５に示すように、対話管理サーバ装置１が除外用語辞書ＤＢ１４をさらに備える。除外用語辞書ＤＢ１４は、入力された質問と、記録部１１に記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に影響が除外される「除外用語」を記憶するデータベースである。具体的には、除外用語としては、助詞、接続詞、所定の修飾語、所定の頻出語などが挙げられる。ここで、所定の修飾語とは、「いろいろな」「様々な」などの実質的に就職する単語の意味を制限しない用語が該当する。また、所定の頻出語とは、特定形式の構造化文書で用いられる全用語のうち頻出する用語のことであり、数万ワードの日本語の文書においては上位１０個ぐらいの用語がこれに該当する。例えば、「確認」などの用語が頻出語として挙げられることが多い。

回答生成部２７は、入力された質問と記録された文書情報の各項目に含まれるテキストデータとのマッチングの際に、除外用語の影響が除外された回答出力情報を生成する。

第７実施形態に係る対話管理サーバ装置１は、上述した構成を具備しているので、質問に対する回答の妥当性を高めることができる。補足すると、一般的に、記録された文書情報の各項目に含まれるテキストデータが、入力された質問に頻出する用語を多く含んでいる場合、質問の回答として妥当である可能性が高い。しかしながら、文章情報の全用語のうち他の用語に比して突出して頻出する用語等は、任意の項目で使用されている可能性があり、却って回答としての妥当性を低下させることがある。そこで、マッチングの際に、これらの用語の影響を除外することで、質問に対する回答の妥当性を高めることができる場合がある。

＜第８実施形態＞
第８実施形態においては、第１実施形態から第７実施形態に係る構造化した形式の文書が、階層構造の末端に位置する項目に含まれるテキストデータと、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しとを対応付けたものを「単位情報」とするものである。具体的には、図３に示すようなデータが一つの単位情報として定義され、これらの集合が上述した特定形式の構造化文書として定義される。

図１６を参照して、第８実施形態に係る対話管理システムを説明する。図１６は、第８実施形態に係る対話管理システムの概略構成図（システム構成図）である。第８実施形態に係る対話管理サーバ装置１は、逆文書頻度ＤＢ２４をさらに備える。逆文書頻度ＤＢ２４は、構造化した形式の文書で使用される単語の逆文書頻度を記憶するデータベースである。ここで、「逆文書頻度」とは、構造化した形式の文書における全単位情報の総数ｍａｘＤを、文書全体における単語の珍しさを示す指標であり、当該単語が含まれる単位情報の数ＤＦｒｅｑｓで除した値のことである。

重み付け設定部２３は、単位情報内の文字情報に含まれる単語の出現頻度を算出し、算出された単語の出現頻度に基づいて単語ごとの重み付けを設定する。さらに、重み付け設定部２３は、逆文書頻度に基づいて重み付けを補正する。

回答生成部２７は、入力された質問に含まれる単語を所定の個数以上含む単位情報を候補回答として抽出し、当該候補回答に基づいて回答出力情報を生成する。ここで、回答生成部２７は、重み付け設定部２３により設定される重み付けに基づいて候補回答と質問との類似度を算出する。そして、回答生成部２７は、類似度の高い候補回答を回答出力情報として生成する。なお、類似度の算出には、TFIDFSimilarityやBM25Similarityのアルゴリズムを用いることができる。

上記構成により、第８実施形態に係る対話管理サーバ装置１では、質問に含まれる単語が多い回答を生成するので、妥当性の高い回答を提供することができる。

また、第８実施形態に係る対話管理サーバ装置１は、逆文書頻度に基づいて単語の重みを補正してから類似度を算出することができる。これにより、文書全体における当該単語の珍しさを反映させることができる。ここで、文書全体における単語の珍しさは、当該単語が特徴的であることを示す傾向が高く、テキストデータの検索においては正解を示す可能性が高いものである。したがって、回答生成部２７は、逆文書頻度で補正された類似度を用いることで、入力された質問に対して妥当な回答出力情報を生成する。

なお、第８実施形態に係る対話管理サーバ装置１に、図１５に示す除外用語辞書ＤＢ１４を組み合わせた場合には、候補回答の抽出の際に、当該除外用語に関しては単位情報の個数がカウントされなくなる。

なお、上記各実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するものではない。本発明はその趣旨を逸脱することなく、変更／改良され得るとともに、本発明にはその等価物も含まれる。また、本発明は、上記各実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の開示を形成できるものである。例えば、実施形態に示される全構成要素から幾つかの構成要素は削除してもよいものである。さらに、異なる実施形態に構成要素を適宜組み合わせてもよいものである。

また、フローチャートの各ステップは、必ずしも上記したステップとおりに実行される必要はない。例えば、図４に示すステップＳ１、Ｓ３及びＳ５は、ステップＳ７の後に実行されてもよい。

１…対話管理サーバ装置、４…対話ログＤＢ、６…ユーザ端末装置、８…オペレータ端末装置、１０…情報処理部、１１…記録部、１２…専門用語辞書ＤＢ、１３…同義語辞書ＤＢ、１４…除外用語辞書ＤＢ、１５…取得部、１７…データ変換部、１９…受付部、２１…自然言語処理部、２３…重み付け設定部、２４…、逆文書頻度ＤＢ、２７…回答生成部、２９…対話結果管理部、３１…出力制御部、３３…音声認識処理部、３５…音声対話管理部、１００…対話管理システム

Claims

階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部と、
ユーザからの質問の入力を受け付ける受付部と、
前記入力された質問と、記録された前記文書情報の各項目に含まれるテキストデータとをマッチングして、前記質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、前記質問の回答として前記ユーザに返す回答生成部と、
を備える対話管理サーバ。
前記受付部はさらに、前記ユーザから、前記回答に対する応答の入力を受け付け、
前記対話管理サーバは、前記質問と、前記回答と、前記応答とを含む対話結果を対話ログデータベースに格納する対話結果管理部をさらに備え、
前記回答生成部はさらに、前記対話ログデータベースに格納された対話結果に基づいて、前記マッチングの重み付けを学習する、
請求項１に記載の対話管理サーバ。
前記回答生成部はさらに、前記回答に、前記質問に含まれる単語の同義語が含まれる場合、前記同義語を前記ユーザが識別できるように前記回答出力情報を生成する、
請求項１又は２に記載の対話管理サーバ。
前記回答を出力する出力制御部を更に備え、
前記出力制御部は、入力された前記質問に対する回答が複数生成された場合、当該質問に対する回答としてより適合する回答を優先して出力するように制御する、
請求項１乃至３のいずれか一項に記載の対話管理サーバ。
前記回答生成部は、入力された前記質問の内容が不明確である場合、入力された当該質問に対して、予め定められた回答出力情報を生成する、
請求項１乃至４のいずれか一項に記載の対話管理サーバ。
あるユーザとの間で前記質問及び当該質問に対する回答が所定の回数繰り返された場合、当該ユーザとの間で音声対話が可能となるように管理する音声対話管理部を更に備える、
請求項１乃至５のいずれか一項に記載の対話管理サーバ。
ユーザとの間の音声対話の音声情報を認識する音声認識処理部と、
前記質問と、前記回答と、前記応答とを含む対話結果を対話ログデータベースに格納する対話結果管理部と、更に備え、
前記対話結果管理部は、前記対話結果として前記ユーザごとに、認識された前記音声情報の登録又は更新を管理する、
請求項２乃至６のいずれか一項に記載の対話管理サーバ。
前記回答生成部は、入力された前記質問の内容が不明確である場合、入力された当該質問に対して第１階層における項目に基づいて回答出力情報を生成し、前記質問の第１回答として前記ユーザに返した後、さらに入力された質問に対して前記第１階層よりも下位の階層である第２階層における項目に基づいて回答出力情報を生成し、当該質問の第２回答として前記ユーザに返す、
請求項１乃至７のいずれか一項に記載の対話管理サーバ。
入力された前記質問と、当該質問に対する回答と、当該回答に対応する評価を求める評価要求と、が出力され、
前記対話結果管理部は、前記質問と、前記回答と、前記ユーザから受け付けた前記評価とを関連付けて対話結果として前記対話ログデータベースに格納し、
前記回答生成部は、前記対話ログデータベースに格納された当該対話結果に基づいて、前記マッチングの重み付けを学習する、
請求項２に記載の対話管理サーバ。
前記記録部は、特定の単語と、当該単語の共起情報に重みづけを行うことで生成される一又は複数のキーワードと、を予め記録し、
前記回答生成部は、前記ユーザから入力された前記質問に含まれる単語に対応付けられた一又は複数のキーワードを含む回答出力情報を生成する、
請求項１乃至９のいずれか一項に記載の対話管理サーバ。
文書の内容が階層構造を有する文書のデータに基づいて、前記階層構造の末端に位置する項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書に変換する変換部、
をさらに備える、請求項１乃至１０のいずれか一項に記載の対話管理サーバ。
前記回答生成部は、前記入力された質問と、記録された前記文書情報の各項目に含まれるテキストデータ及び見出しとをマッチングして、前記質問に関連する項目を複数抽出する、
請求項１乃至１１のいずれか一項に記載の対話管理サーバ。
前記入力された質問と前記記録部に記録された前記文書情報の各項目に含まれるテキストデータとのマッチングの際に影響が除外される除外用語を記憶する除外用語記憶部をさらに備え、
前記回答生成部は、前記入力された質問と記録された前記文書情報の各項目に含まれるテキストデータとのマッチングの際に、前記除外用語の影響が除外された回答出力情報を生成する、
請求項１乃至１２のいずれか一項に記載の対話管理サーバ。
前記構造化した形式の文書は、前記階層構造の末端に位置する項目に含まれるテキストデータと、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しとを対応付けたものを単位情報とするものであり、
前記回答生成部は、前記入力された質問に含まれる単語を所定の個数以上含む単位情報を候補回答として抽出し、当該候補回答に基づいて回答出力情報を生成する、
請求項１乃至１３のいずれか一項に記載の対話管理サーバ。
前記構造化した形式の文書で使用される単語の逆文書頻度を記憶する逆文書頻度記憶部をさらに備え、
前記回答生成部は、前記質問に対する回答として、前記逆文書頻度を用いて前記回答出力情報を生成する、
請求項１乃至１４のいずれか一項に記載の対話管理サーバ。
階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録するステップと、
ユーザからの質問の入力を受け付けるステップと、
前記入力された質問と、記録された前記文書情報の各項目に含まれるテキストデータとをマッチングして、前記質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、前記質問の回答として前記ユーザに返すステップと、
を含む、対話管理方法。
コンピュータに、
階層構造を有する文書のデータに基づいて変換された文書であって、所定の項目に含まれるテキストデータのそれぞれを、当該各項目に至る一又は複数の階層を特定可能な情報及び当該各項目に至る一又は複数の各階層の見出しと対応付けて構造化した形式の文書を、文書情報として記録する記録部、
ユーザからの質問の入力を受け付ける受付部、
前記入力された質問と、記録された前記文書情報の各項目に含まれるテキストデータとをマッチングして、前記質問に関連する項目を複数抽出し、当該抽出された各項目に至る一又は複数の階層とその見出しとを含む回答出力情報を生成し、前記質問の回答として前記ユーザに返す回答生成部、
として機能させるプログラム。