WO2015125560A1

WO2015125560A1 - 情報処理装置、音声対話装置、および制御プログラム

Info

Publication number: WO2015125560A1
Application number: PCT/JP2015/052016
Authority: WO
Inventors: 貴裕井上
Original assignee: シャープ株式会社
Priority date: 2014-02-19
Filing date: 2015-01-26
Publication date: 2015-08-27
Also published as: JP6255274B2; JP2015155936A

Abstract

　使用可能性の高いデータを第１データベースに追加させる。情報処理装置（３０）は、第２データベース（４０）を参照して特定した応答フレーズを音声対話装置（１０）に通知して出力させる応答通知部（３３）と、シナリオの使用履歴情報を記録する履歴情報記録部（３６）と、該使用履歴情報を参照することにより特定したシナリオを第１データベース（２０）に追加させる更新制御部（３８）とを備える。

Description

情報処理装置、音声対話装置、および制御プログラム

　本発明は、ユーザの呼びかけに対して音声で応答する音声対話システム、該システムの構成要素であり、ユーザと直接対話する音声対話装置、および音声対話装置の発話を制御する情報処理装置等に関する。

　人間と音声で対話する音声対話装置について、従来から広く研究されている。例えば、特許文献１には、ユーザから知らないことを聞かれた場合にユーザにその答えを問い返し、その質問内容と答えを記憶し、次からの対話に用いる音声対話装置が開示されている。また、下記特許文献２には、ユーザの質問に対する応答を出力するための技術が開示されている。

日本国公開特許公報「特開２００４‐１０９３２３号（２００４年４月８日公開）」日本国公開特許公報「特開２０１１‐１８３２７号（２０１１年１月２７日公開）」日本国公開特許公報「特開２００６‐１０６７６１号（２００６年４月２０日公開）」日本国公開特許公報「特開２００４‐１６４４６６号（２００４年６月１０日公開）」

　上記のような音声対話装置は、受け答えの内容を多く記憶させておくほど、ユーザの多様な問いかけに応答できるようになるが、コストなどの面から、個別の音声対話装置の記憶容量を増やすことには限界がある。そこで、ネットワーク上のサーバに大容量のデータベースを設けて、受け答えの内容を記憶しておくことが考えられる（特許文献３参照）。

　この構成によれば、音声対話装置が記憶していない問いかけがユーザからなされた場合に、サーバからその問いかけに応じた回答を取得して、ユーザに応答することができる。また、サーバは、複数の音声対話装置で利用可能であるから、個別の音声対話装置の記憶容量を増やすよりもコスト面で有利である。

　ただし、サーバから回答を取得してユーザに応答する場合、音声対話装置が記憶している受け答えの内容を用いて応答する場合と比べて、ユーザへの応答のタイミングが遅れてしまう。そして、サーバに記憶されている受け答えの内容を音声対話装置にコピーすれば、ユーザへの迅速な応答が可能になるが、上述のように音声対話装置の記憶容量には限りがある。つまり、従来は、音声対話装置において使用される可能性の高いデータを、音声対話装置が参照するデータベースに追加させる技術がないという問題があった。なお、データベースの更新に関する技術としては、例えば上記特許文献４が挙げられるが、該文献は音声認識用の単語データベースの更新に関するものであり、音声対話装置については言及されていない。

　本発明は、上記の問題点に鑑みてなされたものであり、その目的は、音声対話装置において使用される可能性の高いデータを、音声対話装置が参照するデータベースに追加させることのできる情報処理装置等を提供することにある。

　上記の課題を解決するために、本発明の一態様に係る情報処理装置は、ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第１データベースを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置と通信可能な情報処理装置であって、上記音声対話装置から呼びかけの内容を通知されたときに、上記第１データベースに格納されていない対応情報が格納された第２データベースを参照して応答内容を特定し、該応答内容で上記音声対話装置に音声出力させる応答通知部と、上記応答通知部による応答内容の特定に用いられた対応情報の使用履歴を示す使用履歴情報を記録する履歴情報記録部と、上記使用履歴情報を参照して特定した対応情報を、上記音声対話装置に通知して上記第１データベースに追加させる更新制御部と、を備えている。

　また、本発明の一態様に係る音声対話装置は、上記の課題を解決するために、ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第１データベースを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置であって、上記第１データベースに格納されていない対応情報が格納された第２データベースを参照可能な情報処理装置に要求して、ユーザの呼びかけ内容に応じた応答内容を取得する応答取得部と、上記第２データベースに格納されている対応情報の使用履歴を示す使用履歴情報を参照して、上記第１データベースに追加する対応情報を特定する追加対象特定部と、上記追加対象特定部が特定した対応情報を上記情報処理装置から取得して上記第１データベースに追加する更新部と、を備えている。

　本発明の上記各態様によれば、音声対話装置において使用される可能性の高い対応情報を、音声対話装置が参照する第１データベースに追加させることができるという効果を奏する。

本発明の一実施形態に係る対話システムを構成する音声対話装置および情報処理装置の要部構成を示すブロック図である。上記対話システムを概略的に示す図である。複数の上記音声対話装置と通信可能な情報処理装置を示す図である。上記情報処理装置が使用するデータの一例を示す図である。ユーザからの呼びかけに応答して音声対話装置が音声を出力する対話処理、および音声対話装置からの要求に応じて情報処理装置が応答フレーズを送信する応答通知処理の一例を示すフローチャートである。情報処理装置が第１データベースに追加するシナリオを特定するシナリオ特定処理、および情報処理装置からの通知に応じて音声対話装置が第１データベースに格納されたデータを更新する更新処理の一例を示すフローチャートである。ジャンル毎の利用回数を考慮して第１データベースに追加するシナリオを特定するシナリオ特定処理の一例を示すフローチャートである。所定期間におけるシナリオの利用回数の増加量に基づいて、第１データベースに追加させるシナリオを特定する場合に使用するデータの例を示す図である。所定期間におけるシナリオの利用回数の増加量に基づいて第１データベースに追加させるシナリオを特定するシナリオ特定処理の一例を示すフローチャートである。本発明の他の実施形態に係る対話システムを構成する音声対話装置の要部構成を示すブロック図である。

　〔実施形態１〕
　本発明の一実施形態について、図１～図６に基づいて説明すれば以下のとおりである。

　（対話システムの概要）まず、図２に基づいて本実施形態の概要を説明する。図２は、本発明の一実施形態に係る対話システムを概略的に示す図である。対話システム５０は、音声対話装置１０および情報処理装置３０を含む。音声対話装置１０および情報処理装置３０は何れも音声認識機能を備える点で共通しているが、音声対話装置１０はユーザと直接対話し、情報処理装置３０はネットワーク上に設置され、ユーザと直接には対話しない点で相違している。音声対話装置１０は、例えば、対話ロボット、タブレット端末、スマートフォン、パーソナルコンピュータなどであってもよい。対話システム５０によれば、ユーザは自然言語を用いた音声によって音声対話装置１０と対話することができる。

　図２に示されるように、ユーザの呼びかけた音声１を受け付けた音声対話装置１０は、音声１に対応する応答フレーズを第１データベース内で検索する。音声１に対応する応答フレーズが第１データベース内に格納されている場合、音声対話装置１０は、音声１に対応する応答フレーズを、音声２としてユーザに向けて出力する。

　一方、音声１に対応する応答フレーズが第１データベース内に格納されていない場合、音声対話装置１０は、音声１に対応する応答フレーズを、無線通信を介して情報処理装置３０に要求する。次に、情報処理装置３０は、音声対話装置１０からの要求に応じて、音声１に対応する応答フレーズを、第１データベースよりも容量の大きい第２データベース内で検索し、音声対話装置１０に提示する。そして、音声対話装置１０は、情報処理装置３０から提示された応答フレーズを、音声３としてユーザに向けて出力する。

　第２データベースの容量は、第１データベースよりも大きいため、情報処理装置３０が第２データベースを参照して応答できるフレーズ数は、音声対話装置１０が第１データベースを参照して応答できるフレーズ数よりも多い。それゆえ、情報処理装置３０は、第２データベースを参照することにより、音声対話装置１０が応答フレーズを検出できなかった音声１に対応する応答フレーズを、音声対話装置１０に提示することができる。

　ここで、音声１に対応する応答フレーズが第１データベース内に格納されている場合、情報処理装置３０での処理が不要となるため、音声２が出力されるまでの時間は、情報処理装置３０での処理を必要とする場合における音声３が出力されるまでの時間よりも短いという利点がある。そこで、図２に示すように、情報処理装置３０は、音声１と音声１に対応した応答フレーズとが対応づけられたデータ４を第１データベースに追加させる。

　ただし、第１データベースの容量は、第２データベースよりも少ないため、追加できるデータ容量に制限がある。そこで、情報処理装置３０は、第１データベースに追加させるデータを、ユーザが利用する可能性の高いデータに限定する。これにより、使用確率の低い対応情報で第１データベースの容量を増加させることなく、音声対話装置１０が迅速に応答フレーズをユーザに返すことができる確率を高めることができることができる。

　（情報処理装置と音声対話装置との関係）図２では、音声対話装置１０と情報処理装置３０とを各１つ示したが、対話システム５０では、１つの情報処理装置３０に対し、音声対話装置１０が複数設けられていてもよい。これについて図３に基づいて説明する。図３は、複数の音声対話装置１０ａ～１０ｄと通信可能な情報処理装置３０を示す図である。

　図３の例の情報処理装置３０は、複数の音声対話装置１０ａ～１０ｄによって利用される。このため、情報処理装置３０は、各音声対話装置１０ａ～１０ｄが情報処理装置３０を利用した回数を音声対話装置１０ａ～１０ｄ毎に記録できる。それゆえ、情報処理装置３０は、複数の音声対話装置１０ａ～１０ｄの利用状況に応じて、第１データベースに追加させるデータを特定することができる。

　例えば、情報処理装置３０は、音声対話装置１０ａが情報処理装置３０に要求していないデータで、音声対話装置１０ｂ～１０ｄが情報処理装置３０に要求したデータを第１データベース２０ａに追加させることが可能となる。また、例えば、情報処理装置３０は、複数の第１データベース２０ａ～２０ｄに、同一のデータを追加させることもできる。

　（データベースに格納されるデータ）上述のように、第１データベース２０および第２データベース４０は、ユーザが音声対話装置１０に呼びかけた内容のそれぞれについて、当該内容に応じた応答フレーズを対応付けた対応情報（以下、シナリオと呼ぶ）を登録したデータベースである。ここでは、ユーザが音声対話装置１０に呼びかけた内容を示す情報として、ユーザの発話内容に含まれる単語（以下、呼びかけワードと称する）を使用する例を説明する。無論、ユーザが呼びかけた内容を示す情報は、これに限られず、例えば２以上の語からなるフレーズであってもよい。

　また、上述のように、情報処理装置３０は、第２データベース４０に格納されているデータ（シナリオ）のうち、ユーザが利用する可能性の高いデータを第１データベース２０に追加させる。このため、ユーザが利用する可能性の高いシナリオを特定することができるように、情報処理装置３０は、第２データベース４０におけるシナリオの使用履歴情報を記録する。使用履歴情報の記録先は特に限定されないが、ここではシナリオに付加する形で記録する例を説明する。

　ここで、シナリオおよび使用履歴情報の具体例を図４に基づいて説明する。図４は、情報処理装置３０が使用するデータの一例を示す図であり、同図の（ａ）は、シナリオおよび使用履歴情報の一例を示している。なお、音声対話装置１０が参照する第１データベース２０にも、図４の（ａ）に示されるようなシナリオが複数格納されている。また、同図の（ｂ）には、ジャンル毎の利用回数を示すテーブルの一例を示している。このテーブルを用いることにより、利用されたシナリオのジャンルに応じた追加対象シナリオを特定することができる。

　図４の（ａ）に示すテーブルでは、呼びかけワードと応答フレーズとジャンルとが対応付けられている。この部分が上記のシナリオに対応している。つまり、呼びかけワードと応答フレーズとの組み合わせがシナリオであり、図示の例では各シナリオに１から昇順で番号を付している。なお、図示の例のように、呼びかけワードは複数の単語の組み合わせであってもよいし、１つの単語のみであってもよい。また、応答フレーズは１つ（１組）の呼びかけワードに対して複数登録されていてもよい。この場合、複数の応答フレーズの中から実際に発話する応答フレーズを選択すればよい。なお、呼びかけワードおよび応答フレーズは、何れもテキストデータとして格納しておけばよい。

　また、ジャンルとは、シナリオの属性を示す属性情報として、シナリオ毎に予め設定されたものであり、第２データベース４０に追加させるシナリオを特定するために使用される。ジャンルは、呼びかけワードおよび応答フレーズの少なくとも何れかに関連した情報であり、１つのシナリオに対して複数設定してもよいし、ジャンルが設定されていないシナリオが存在してもよい。

　このようなシナリオを参照することにより、ユーザの呼びかけに対して応答を返すことが可能になる。例えば、ユーザから音声対話装置１０に呼びかけられた音声が、「チームＡの本拠地は？」であるとする。この場合、この音声の解析により、該音声に「チームＡ」および「本拠地」の語が含まれていることが特定される。ここで、図４の（ａ）に示されたシナリオのうち、これらの語を呼びかけワードとして含むシナリオはＮｏ．１である。このため、応答フレーズを「スタジアムＣだよ」と特定し、この応答フレーズをユーザに返すことが可能になる。

　また、図４の（ａ）のテーブルにおいて、利用回数として示された部分が使用履歴情報である。図示の例では、各シナリオについて、音声対話装置１０毎の利用回数が登録されている。この情報を参照することより、各音声対話装置１０に対し、そのユーザがどのような呼びかけを行っているかに応じたシナリオを、当該音声対話装置１０の使用する第１データベース２０のそれぞれに追加させるシナリオとして特定することができる。なお、以下では、第１データベース２０に追加させるシナリオを追加対象シナリオと呼ぶ。

　また、図示の例では、各シナリオについて、全装置の合計利用回数が登録されている。これにより、他の音声対話装置１０の利用状況も加味してシナリオを特定することができる。例えば、ある音声対話装置１０に送信したことのないシナリオであっても、他の多くの音声対話装置１０に送信したシナリオであれば、今後使用される可能性は高いと考えられる。全装置の合計利用回数を参照することにより、このようなシナリオを特定することもできる。無論、このようなシナリオの特定が不要であれば、全装置の合計利用回数の項目は省略すればよい。また、逆に、全装置の合計利用回数のみを用いてシナリオを特定する場合、各装置の利用回数の項目を省略してもよい。

　次に、同図の（ｂ）のテーブルについて説明する。このテーブルは、シナリオの利用回数をジャンル毎に集計して得たものであり、各ジャンルについて、各音声対話装置１０の利用回数および全音声対話装置１０の利用回数の合計値が登録されている。このテーブルを参照することにより、各音声対話装置１０のユーザの呼びかける可能性の高いジャンルを特定することができる。

　（要部構成）次に、音声対話装置１０および情報処理装置３０のより詳細な構成を図１に基づいて説明する。図１は、対話システム５０を構成する音声対話装置１０および情報処理装置３０の要部構成を示すブロック図である。図１に示されるように、音声対話装置１０は第１データベース２０を参照可能となっており、情報処理装置３０は第２データベース４０を参照可能となっている。

　（音声対話装置の要部構成）音声対話装置１０は、音声の入力を受け付けて音声データを生成する音声入力部１１、音声対話装置１０の各種機能を実現するための制御を行う制御部１２、制御部１２の制御に従って音声を出力する音声出力部１３、および他の装置と通信するための通信部２１を備える。音声入力部１１は例えばマイクで構成され、音声出力部１３は例えばスピーカで構成される。また、制御部１２は、音声認識部１４、応答生成部１５、音声合成部１６、履歴情報記録部１７、更新部１８、および削除対象特定部１９を備える。

　音声認識部１４は、ユーザが音声対話装置に呼びかけた音声を認識する。具体的には、音声認識部１４は、音声入力部１１から受信した音声データを変換して、ユーザの呼びかけの内容を示すテキストデータを生成する。そして、生成したテキストデータを解析して、そのテキストデータから単語を抽出する。

　応答生成部１５は、音声認識部１４の認識結果に応じた応答内容を、第１データベース２０を参照して確定する。具体的には、応答生成部１５は、音声認識部１４が抽出した単語と一致する単語を、第１データベース２０に格納されている各シナリオの呼びかけワードから検出する。そして、一致が検出された場合に、そのシナリオに含まれる応答フレーズを、ユーザからの呼びかけに応答するための応答フレーズと確定する。

　また、応答生成部１５は、ユーザからの呼びかけに応答するための応答フレーズが第１データベース２０に格納されていなかった場合には、通信部２１を介して情報処理装置３０から応答フレーズを取得する。具体的には、応答生成部１５は、第１データベース２０を参照して応答フレーズを確定できなかった場合、音声入力部１１が生成した音声データを、通信部２１を介して情報処理装置３０に送信する。そして、上記音声データに応じた応答フレーズを、通信部２１を介して情報処理装置３０から受信する。なお、応答生成部１５は、音声認識部１４が生成したテキストデータまたは該テキストデータから抽出した単語を送信してもよい。

　音声合成部１６は、応答生成部１５が確定した応答フレーズに対応する音声データを生成する。生成した音声データは、音声出力部１３を介して音声として出力される。

　履歴情報記録部１７は、応答生成部１５による応答フレーズの確定に用いられたシナリオ（第１データベース２０に格納されたシナリオ）の利用回数を、使用履歴情報として記録する。具体的には、履歴情報記録部１７は、図４の（ａ）の例と同様に、各シナリオに対し、その利用回数を対応付けて記録する。この使用履歴情報は、第１データベース２０に格納されたシナリオのうち、ユーザに使用される可能性の低いシナリオを特定するために使用される。

　更新部１８は、第１データベース２０に格納されたシナリオを更新する。具体的には、更新部１８は、情報処理装置３０から通知された追加対象シナリオ（第２データベースに格納されたシナリオ）を第１データベース２０に追加して更新する。なお、第１データベース２０の更新は、情報処理装置３０からシナリオが通知されたときに行ってもよいし、例えば所定の間隔（例えば２４時間）毎に行ってもよく、その実行タイミングは特に限定されない。

　また、更新部１８は、第１データベース２０の空き容量が不足している場合、削除対象特定部１９に削除対象のシナリオを特定させる。そして、削除対象特定部１９が特定したシナリオについては、削除するかまたは情報処理装置３０から通知されたシナリオにて上書きする。

　削除対象特定部１９は、履歴情報記録部１７が記録した使用履歴情報を参照して、第１データベースに格納されたシナリオのうち、利用回数の少ないシナリオデータを削除対象として特定する。なお、削除対象のシナリオの特定は、例えば、更新部１８からの通知があったときに行ってもよいし、所定の間隔（例えば２４時間）毎に行ってもよく、その実行タイミングは特に限定されない。

　（情報処理装置の要部構成）情報処理装置３０は、他の装置と通信するための通信部３１および情報処理装置３０の各種機能を実現するための制御を行う制御部３２を備える。そして、制御部３２は、応答通知部３３、音声認識部３４、応答通知部３３、音声合成部３５、履歴情報記録部３６、追加対象特定部３７、および更新制御部３８を備える。

　応答通知部３３は、第２データベース４０を参照して、音声対話装置１０の要求に応じた応答フレーズを確定し、通信部３１を介して音声対話装置１０に該応答フレーズを通知する。

　なお、ここでは、音声対話装置１０が、応答フレーズを確定することができなかった音声データを送信することを想定している。このため、応答通知部３３は、受信した音声データを音声認識部３４に音声認識させ、これによって抽出された単語を用いて応答フレーズを確定する。無論、音声対話装置１０が、応答フレーズを確定することができなかったテキストデータまたは該テキストデータから抽出した単語を送信する構成としてもよい。この場合には、受信した単語をそのまま用いて、あるいは受信したテキストデータから音声認識部３４が抽出した単語を用いて応答フレーズを確定する。

　また、ここでは、確定した応答フレーズのテキストデータを音声対話装置１０に通知する例を説明するが、通知する情報は、音声対話装置１０が当該応答フレーズに応じた発話を行うことができるものであればよく、例えば音声データであってもよい。音声データを送信する場合、応答通知部３３は音声合成部３５に指示して応答フレーズに応じた音声データを生成させる。

　音声認識部３４は、応答通知部３３から通知された音声データからテキストデータを生成し、生成したテキストデータから単語を抽出して応答通知部３３に通知する。音声認識部３４は、音声対話装置１０の音声認識部１４と同様の構成であるが、音声認識機能は音声認識部１４よりも高いものとすることが望ましい。これにより、音声対話装置１０において、音声認識性能が不足しているために応答フレーズが確定できなかったような場合にも、情報処理装置３０側で応答フレーズを確定することが可能になる。

　音声合成部３５は、音声対話装置１０の音声合成部１６と同様の構成であり、応答フレーズに対応する音声データを生成する。なお、本実施形態にて説明する例のように、音声データの合成を音声対話装置１０側で行う場合には、音声合成部３５を省略してもよい。一方、音声合成部３５が合成した音声データを音声対話装置１０に送信して出力させる場合、音声合成部３５は、音声合成部１６よりも多くの音素データを用いる等によって、よりクリアな音声を出力可能な音声データを生成できるものとすることが好ましい。

　履歴情報記録部３６は、応答通知部３３による応答フレーズの確定に用いられたシナリオの利用回数を示す使用履歴情報を記録する。具体的には、図４の（ａ）に示したように、各シナリオにその利用回数を対応付けて記録する。

　追加対象特定部３７は、履歴情報記録部３６が記録した使用履歴情報を参照して、第２データベースに格納されたシナリオの中から追加対象シナリオを特定する。本実施形態では、下記の（１）～（４）の情報を基準としてシナリオを特定する例を説明する。具体的には、下記の（１）または（２）の情報を用いる例を図６に基づいて、（３）または（４）の情報を用いる例を図７に基づいて後に説明する。
（１）音声対話装置１０毎の利用回数
（２）全音声対話装置１０の合計利用回数
（３）音声対話装置１０毎のジャンル別の利用回数
（４）全音声対話装置１０のジャンル別の合計利用回数
　なお、追加対象シナリオの特定は、例えば、音声対話装置１０から情報処理装置３０に応答フレーズの要求があったタイミングで行ってもよいし、所定の間隔（例えば２４時間）毎に行ってもよく、そのタイミングは特に限定されない。

　更新制御部３８は、追加対象シナリオを、通信部３１を介して音声対話装置１０に通知して、第１データベース２０に追加させる。

　（対話システムにおける処理の流れ）次に、対話システム５０における処理の流れを図５に基づいて説明する。図５は、ユーザからの呼びかけに応答して音声対話装置１０が音声を出力する対話処理、および音声対話装置１０からの要求に応じて情報処理装置３０が応答フレーズを送信する応答通知処理の一例を示すフローチャートである。これらの処理では、第１データベース２０および第２データベース４０のそれぞれについてシナリオの使用履歴情報が記録される。

　まず、対話処理では、ユーザが音声対話装置１０に対して呼びかけた音声が、音声入力部１１に入力されると、音声認識部１４がこれを検出し（Ｓ１１にてＹＥＳ）、検出した音声に対応する音声データを生成して音声認識部１４に出力する。そして、音声認識部１４は、出力された上記音声データの音声認識を行い（Ｓ１２）、これにより生成したテキストデータから単語を抽出して応答生成部１５に通知する。

　次に、応答生成部１５は、音声認識部１４から通知された単語にマッチする呼びかけワードを第１データベース２０内で検索し（Ｓ１３）、マッチするものが登録されているか否かを判断する（Ｓ１４）。

　ここでマッチすると判断した場合（Ｓ１４にてＹＥＳ）、応答生成部１５は、マッチした呼びかけワードに対応付けられた応答フレーズを、ユーザへの応答に用いる応答フレーズと確定する（Ｓ１５）。また、応答フレーズが確定されると、履歴情報記録部１７は、第１データベース２０の使用履歴情報において、当該応答フレーズの確定に使用されたシナリオの利用回数をインクリメント（＋１）する（Ｓ１６）。

　また、応答フレーズを確定した応答生成部１５は、その応答フレーズを音声合成部１６に通知し、音声合成部１６は、当該応答フレーズに対応する音声を合成する（Ｓ１７）。そして、音声出力部１３は、音声合成部１６が合成した音声を出力し（Ｓ１８）、これにより、Ｓ１１にて検出された音声に対する応答がユーザに返される。

　一方、Ｓ１４において、マッチしないと判断した場合（Ｓ１４にてＮＯ）、応答生成部１５は、Ｓ１１にて検出された音声（音声データ）を情報処理装置３０に送信して（Ｓ１９）、該音声データに対応する応答フレーズを要求する。

　そして、応答フレーズを要求された情報処理装置３０では、応答通知処理が行われる。応答通知処理において、応答通知部３３は、受信した音声データに対応する応答フレーズを第２データベース４０内で検索し（Ｓ２１）、応答フレーズを確定する（Ｓ２２）。第２データベース４０には、第１データベース２０に格納されていないシナリオが格納されているので、応答通知部３３は、音声対話装置１０が確定することができなかった応答フレーズを確定することができる。

　応答フレーズが確定されると、履歴情報記録部３６は、第２データベース４０の使用履歴情報において、当該応答フレーズの確定に使用されたシナリオの利用回数をインクリメント（＋１）する（Ｓ２３）。また、応答フレーズを確定した応答通知部３３は、当該応答フレーズを音声対話装置１０に通知し（Ｓ２４）、これにより応答通知処理は終了する。そして、音声対話装置１０は、上記送信された応答フレーズを受信し（Ｓ２０）、この後、Ｓ１７以降の処理が行われる。

　（第１データベースの更新）続いて、第１データベース２０を更新するために行われる処理の流れを図６に基づいて説明する。図６は、情報処理装置３０が追加対象シナリオを特定するシナリオ特定処理、および情報処理装置３０からの通知に応じて音声対話装置１０が第１データベース２０に格納されたデータを更新する更新処理の一例を示すフローチャートである。

　まず、シナリオ特定処理では、情報処理装置３０の追加対象特定部３７は、第２データベース４０の使用履歴情報を参照し（Ｓ３１）利用回数が閾値以上となるシナリオがあるか否かを判断する（Ｓ３２）。ここで、閾値以上となるシナリオがないと判断した場合（Ｓ３２にてＮＯ）、シナリオ特定処理は終了する。

　一方、閾値以上となるシナリオがあると判断した場合（Ｓ３２にてＹＥＳ）、追加対象特定部３７は、利用回数が閾値以上のシナリオを追加対象シナリオと特定する（Ｓ３３）。そして、シナリオが特定されると、更新制御部３８は、追加対象特定部３７が特定したシナリオを音声対話装置１０に送信し（Ｓ３４）、これによりシナリオ特定処理は終了する。なお、シナリオの送信は、厳密には該シナリオを構成する各データ（呼びかけワードおよび応答フレーズ）を送信することによって行われるが、ここでは単にシナリオを送信すると表現する。なお、ジャンルを示す情報は、該情報を音声対話装置１０にて使用するのであれば、シナリオの一部として送信すればよい。

　例えば、Ｓ３２における閾値が３に設定されている場合、図４の（ａ）の装置１では、シナリオＮｏ．１（利用回数＝５）およびシナリオＮｏ．２（利用回数＝３）が追加対象シナリオとなる。そして、Ｓ３４では、音声対話装置１０のそれぞれについて特定されたシナリオを当該音声対話装置１０に通知する。例えば、上記の例では、Ｎｏ．１および２のシナリオを装置１に通知する。

　なお、上記の例では、Ｓ３１において、音声対話装置１０毎に利用回数の多いシナリオを特定しているが、全音声対話装置１０の利用回数の合計値が多いシナリオを特定してもよい。この場合、図４の（ａ）のテーブルを用い、Ｓ３２の閾値を１００とすれば、Ｓ３３ではシナリオＮｏ．２および４が特定される。この構成では、各音声対話装置１０に通知するシナリオ（各音声対話装置１０の追加対象シナリオ）が同じになるので、Ｓ３２からＳ３４の処理の負荷を抑えることができる。

　続いて、音声対話装置１０が実行する更新処理について説明する。音声対話装置１０がシナリオを受信すると（Ｓ３５）、更新部１８は、第１データベース２０の空き容量が、Ｓ３５にて受信したシナリオのデータ容量以上であるか否かを判断する（Ｓ３６）。なお、第１データベース２０に格納可能なシナリオ数には上限が決まっている。そして、Ｓ３６では、空き容量を（格納可能な最大シナリオ数）－（現在格納されているシナリオ数）との式にて算出する。また、受信したシナリオ数を、受信したシナリオのデータ容量とする。無論、Ｓ３６では、シナリオ数ではなく、データ容量を特定して比較してもよい。

　Ｓ３６にてＹＥＳの場合、更新部１８は、Ｓ３５にて受信した追加対象シナリオを、第１データベース２０に追加し、第１データベース２０に格納されたデータを更新する（Ｓ３７）。一方、Ｓ３６にてＮＯの場合、削除対象特定部１９は、第１データベース２０の使用履歴情報を参照して、第１データベース２０に格納されたシナリオの中から、置換対象のシナリオを特定する（Ｓ３８）。具体的には、削除対象特定部１９は、利用回数が少ないシナリオから順に、Ｓ３５で受信した全シナリオを第１データベース２０に収めることができる数だけ置換対象のシナリオを特定する。そして、削除対象特定部１９は、特定したシナリオを更新部１８に通知し、更新部１８は通知されたシナリオを、Ｓ３５で受信したシナリオで置換することにより、第１データベース２０に格納されたデータを更新して（Ｓ３７）、更新処理を終了する。

　（ジャンルを考慮したシナリオ特定処理）次に、ジャンル毎の利用回数を示す情報を用いて追加対象シナリオを特定する例を図７に基づいて説明する。図７は、ジャンル毎の利用回数を考慮して追加対象シナリオを特定するシナリオ特定処理の一例を示すフローチャートである。

　情報処理装置３０の追加対象特定部３７は、ジャンル毎の利用回数を示すテーブル（図４の（ｂ）参照）を作成する（Ｓ４１）。そして、追加対象特定部３７は、Ｓ４１にて作成したテーブルを参照して利用回数が最も多いジャンルを特定する（Ｓ４２）。

　次に、追加対象特定部３７は、Ｓ４２にて特定したジャンルに、利用回数が閾値以上となるシナリオがあるか否かを判断する（Ｓ４３）。ここで利用回数が閾値以上となるシナリオがないと判断した場合（Ｓ４３にてＮＯ）、シナリオ特定処理は終了する。

　一方、利用回数が閾値以上となるシナリオがあると判断した場合（Ｓ４３にてＹＥＳ）、追加対象特定部３７は、Ｓ４２にて特定したジャンルのシナリオのうち、利用回数が閾値以上となるシナリオを追加対象シナリオと特定する（Ｓ４４）。そして、更新制御部３８は、上記追加対象シナリオを音声対話装置１０に送信し（Ｓ４５）、シナリオ特定処理は終了する。

　例えば、Ｓ４１にて図４の（ｂ）のテーブルが作成された場合、Ｓ４２では、装置１については「水泳」のジャンルが特定され、装置２については「ゴルフ」のジャンルが特定される。そして、Ｓ４３では、第２データベース４０に格納されている全シナリオから、Ｓ４２で特定されたジャンルのシナリオを抽出する。さらに、Ｓ４３では、音声対話装置１０のそれぞれについて、抽出されたシナリオから、利用回数（全音声対話装置１０の利用回数の合計値）が所定の閾値以上のシナリオを特定する。そして、Ｓ４５では、音声対話装置１０のそれぞれについて特定されたシナリオを当該音声対話装置１０に通知する。

　なお、上記の例では、Ｓ４２において、音声対話装置１０毎に利用回数の多いジャンルを特定しているが、全音声対話装置１０の利用回数の合計値が多いジャンルを特定してもよい。この場合、図４の（ａ）（ｂ）のテーブルを用い、Ｓ４３の閾値を１００とすれば、Ｓ４２では「サッカー」のジャンルが特定され、Ｓ４３ではシナリオＮｏ．２および４が特定される。この構成では、各音声対話装置１０に通知するシナリオ（各音声対話装置１０の追加対象シナリオ）が同じになるので、Ｓ４４およびＳ４５の処理の負荷を抑えることができる。

　また、上記の例では、追加対象シナリオを、利用回数の合計値が最も多いジャンルに絞り込んでいるが、この例に限られない。例えば、利用回数の合計値が所定の閾値以上であるジャンルに絞り込んでもよいし、利用回数の合計値が上位となるジャンル（例えば上位３つのジャンル）に絞り込んでもよい。

　そして、上記の例では、追加対象シナリオを、ジャンルで絞り込んだ上で、さらに使用回数で絞り込んでいるが、使用回数での絞り込みは省略してもよい。この場合、Ｓ４３の処理を省略して、Ｓ４２で特定したジャンルのシナリオを、Ｓ４４にて追加対象シナリオと特定する。

　〔実施形態２〕
　本発明の他の実施形態について、図８および図９に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、実施形態１にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。

　本実施形態では、所定期間におけるシナリオの利用回数の増加量に基づいて追加対象シナリオを特定する例を説明する。この例によれば、所定期間より前の累積の利用回数の影響が排除されるので、ユーザの興味や関心の対象の変化に応じたシナリオを特定しやすくなるという利点がある。なお、上記実施形態との相違点は、追加対象シナリオを特定する方法のみであり、システムおよび装置の構成は上記実施形態と同様である。

　（データベースに格納されるデータ）まず、本実施形態で用いる使用履歴情報について、図８に基づいて説明する。図８は、所定期間におけるシナリオの利用回数の増加量に基づいて、追加対象シナリオを特定する場合に使用するデータの例を示す図である。

　同図の（ａ）に示すように、使用するシナリオは図４の（ａ）と同様であるが、使用履歴情報について、利用回数が一日毎に集計されている点、および一日当たりの利用回数の増加分が示されている点で図４の（ａ）と相違している。なお、図８の（ａ）では、全音声対話装置１０の合計利用回数のみを示しているが、各音声対話装置１０について、一日当たりの利用回数および増加分が記録される。なお、増加分は計算によって算出可能であるため使用履歴情報から省略してもよい。また、ここでは一日当たりの利用回数を記録する例を示しているが、所定期間は一日に限られず任意である。

　また、本実施形態においても、ジャンルを考慮して追加対象シナリオを特定してもよい。この場合、例えば図８の（ｂ）のような、ジャンル毎の問合せ回数の単位期間当たりの増加量を示すテーブルを生成してもよい。

　なお、図８に示すデータは、何れも情報処理装置３０にて使用されるものであるが、音声対話装置１０において、履歴情報記録部１７が記録する第１データベース２０の使用履歴情報も同様の構成としてもよい。この場合、削除対象特定部１９は、所定期間当たりの使用回数の増加分が少ないシナリオを削除対象（上書き対象）のシナリオと特定する。また、履歴情報記録部１７が記録する第１データベース２０の使用履歴情報については、上記実施形態と同様の構成とし、累計の使用回数が少ないシナリオを削除対象（上書き対象）のシナリオと特定してもよい。

　（シナリオ特定処理）続いて、本実施形態におけるシナリオ特定処理について、図９に基づいて説明する。図９は、所定期間におけるシナリオの利用回数の増加量に基づいて追加対象シナリオを特定するシナリオ特定処理の一例を示すフローチャートである。

　図９の（ａ）に示すシナリオ特定処理では、まず、追加対象特定部３７は、第２データベース４０の使用履歴情報を参照し、所定期間におけるシナリオの利用回数の増加分（増加量）を算出する（Ｓ５１）。そして、追加対象特定部３７は、算出した増加量が閾値以上となるシナリオがあるか否かを判断する（Ｓ５２）。ここで、閾値以上となるシナリオがないと判断した場合（Ｓ５２にてＮＯ）、シナリオ特定処理は終了する。

　一方、閾値以上となるシナリオがあると判断した場合（Ｓ５２にてＹＥＳ）、追加対象特定部３７は、増加量が閾値以上のシナリオを追加対象シナリオと特定する（Ｓ５３）。そして、シナリオが特定されると、更新制御部３８は、追加対象特定部３７が特定したシナリオを音声対話装置１０に送信し（Ｓ５４）、シナリオ特定処理は終了する。

　一方、図９の（ｂ）に示すシナリオ特定処理では、ジャンル毎の利用回数を考慮して追加対象シナリオを特定する。まず、追加対象特定部３７は、ジャンル毎の利用回数の増加量を示すテーブル（図８の（ｂ）参照）を作成する（Ｓ６１）。そして、追加対象特定部３７は、Ｓ６１にて作成したテーブルを参照して、利用回数の増加量が最も多いジャンルを特定する（Ｓ６２）。

　次に、追加対象特定部３７は、Ｓ６２にて特定したジャンルに、利用回数が閾値以上となるシナリオがあるか否かを判断する（Ｓ６３）。ここでは、音声対話装置１０のそれぞれについて、Ｓ６２にて特定されたジャンルのシナリオから、利用回数（全音声対話装置１０の利用回数の合計値）が所定の閾値以上のシナリオを特定する。なお、同図の（ａ）と同様に、所定期間における利用回数の増加量が閾値以上となるシナリオがあるかを判断してもよい。ここで利用回数の増加量が閾値以上となるシナリオがないと判断した場合（Ｓ６３にてＮＯ）、シナリオ特定処理は終了する。

　一方、利用回数が閾値以上となるシナリオがあると判断した場合（Ｓ６３にてＹＥＳ）、追加対象特定部３７は、Ｓ６２にて特定したジャンルのシナリオのうち、利用回数が閾値以上となるシナリオを追加対象シナリオと特定する（Ｓ６４）。そして、更新制御部３８は、追加対象特定部３７が特定したシナリオを音声対話装置１０に送信し（Ｓ６５）、シナリオ特定処理は終了する。

　なお、Ｓ５１では、音声対話装置１０毎に利用回数の増加量を算出してもよいし、全音声対話装置１０の利用回数の増加量の合計値を算出してもよい。同様に、Ｓ６１では、音声対話装置１０毎にジャンル毎の利用回数の増加量を算出してもよいし、全音声対話装置１０のジャンル毎の利用回数の増加量の合計値を算出してもよい。

　また、所定期間における利用回数の増加量の代わりに、所定期間における利用回数を用いて追加対象シナリオを特定してもよい。この構成であっても、所定期間における利用状況に応じた追加対象シナリオを特定することができる。

　〔実施形態３〕
　本発明の他の実施形態について、図１０に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、実施形態１にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。

　まず、本実施形態の対話システム５０ｅについて図１０に基づいて説明する。図１０は、対話システム５０ｅを構成する音声対話装置１０ｅの要部構成を示すブロック図である。音声対話装置１０ｅは、追加対象シナリオを特定する機能を備えている点で上記実施形態の音声対話装置１０と相違している。図示のように、音声対話装置１０ｅは、第１データベース２０ｅのデータを参照できるようになっており、情報処理装置３０ｅと通信可能となっている。なお、同図には示していないが、情報処理装置３０ｅは第２データベース４０を参照することができる。

　第１データベース２０ｅには、音声対話装置１０ｅがユーザとの対話に使用する上述のシナリオが格納されていると共に、第２データベース４０に格納されているシナリオの使用履歴を示す使用履歴情報が格納されている。音声対話装置１０ｅは、この使用履歴情報を参照して追加対象シナリオを特定する。なお、使用履歴情報はシナリオとは別の記憶装置に格納してもよい。

　情報処理装置３０ｅは、情報処理装置３０と同様に、音声対話装置１０ｅの要求に従って応答フレーズを送信する。対話システム５０ｅでは、音声対話装置１０ｅが追加対象シナリオを特定する機能を備えているので、情報処理装置３０ｅはこの機能を備えている必要はない。

　そして、音声対話装置１０ｅの制御部１２には、音声認識部１４、応答生成部（応答取得部）１５、音声合成部１６、履歴情報記録部１７ｅ、更新部１８、削除対象特定部１９、および追加対象特定部２２が含まれている。履歴情報記録部１７ｅは、第２データベース４０に格納されているシナリオが音声対話装置１０ｅに利用された履歴を示す使用履歴情報を記録する。そして、追加対象特定部２２は、該使用履歴情報を参照して追加対象シナリオを特定する。

　（対話システムにおける処理の流れ）対話システム５０ｅにおいても、図５に示すような対話処理および応答通知処理が行われる。ここでは、図５を参照して、対話システム５０ｅにおける対話処理および応答通知処理について説明する。なお、図５と同様の処理については説明の詳細を省略する。

　まず、情報処理装置３０ｅが実行する応答通知処理では、Ｓ２３の処理は省略される。そして、Ｓ２４にて応答フレーズを送信する際に、該応答フレーズに対応するシナリオを示す情報（例えばシナリオのナンバー等、シナリオを一義的に特定できるものであればよい）を音声対話装置１０ｅに通知する。

　そして、音声対話装置１０ｅが実行する対話処理では、履歴情報記録部１７ｅが、情報処理装置３０ｅからシナリオを示す情報の受信後（Ｓ２０以降の任意のタイミング）に、使用履歴情報において、該情報の受信回数をインクリメント（＋１）する。なお、該情報が使用履歴情報に含まれていない場合には、該情報を使用履歴情報に追加し、その受信回数を１とする。これにより、シナリオを示す情報と、その情報の受信回数（第２データベース４０に格納されている当該シナリオが音声対話装置１０ｅに利用された回数とも言える）とが対応付けられた使用履歴情報が記録される。

　なお、使用履歴情報は、第２データベース４０に格納されているシナリオの使用履歴を示すものであればよく、この例に限られない。例えば、上記実施形態と同様にして情報処理装置３０ｅが生成した使用履歴情報を取得してもよい。さらに、情報処理装置３０ｅが複数の音声対話装置１０ｅと通信可能である場合、使用履歴情報は、第２データベース４０に格納されているシナリオの各音声対話装置１０ｅによる使用回数を示すものであってもよい。この場合、シナリオの使用回数は、各音声対話装置１０ｅについて個別にカウントされていてもよいし、全音声対話装置１０ｅについての合計使用回数がカウントされていてもよい。

　（第１データベースの更新）次に、対話システム５０ｅにおいて、第１データベース２０ｅを更新するために行われる処理の流れについて図６を参照して説明する。対話システム５０ｅでは、音声対話装置１０ｅの追加対象特定部２２がシナリオ特定処理を実行する。

　まず、Ｓ３１において、追加対象特定部２２は、履歴情報記録部１７ｅが記録した使用履歴情報を参照して、第２データベース４０に格納されているシナリオが音声対話装置１０ｅに利用された回数を特定する。次に、Ｓ３２では上記特定した回数と所定の閾値とを比較し、閾値以上となるシナリオがあれば、Ｓ３３にてそのシナリオを追加対象シナリオと特定する。そして、Ｓ３４では、上記追加対象シナリオの送信を情報処理装置３０ｅに要求する。情報処理装置３０ｅは、要求された追加対象シナリオを音声対話装置１０ｅに送信するので、この追加対象シナリオを受信した音声対話装置１０ｅでは図６に示す更新処理が行われ、該追加対象シナリオが第１データベース２０ｅに追加される。

　（ジャンルを考慮したシナリオ特定処理）また、シナリオ特定処理では、過去に使用されたシナリオのジャンルに基づいて追加対象シナリオを特定してもよい。この場合、音声対話装置１０ｅのユーザが過去に呼びかけた内容に応じたジャンルのシナリオを追加対象シナリオとすればよい。このため、第２データベース４０のシナリオの使用履歴情報（情報処理装置３０ｅへの要求により情報処理装置３０ｅにて使用された履歴を示す）と、第１データベース２０ｅのシナリオの使用履歴情報の少なくとも何れかを用いればよい。

　この場合、追加対象特定部２２は、第１データベース２０ｅおよび／または第２データベース４０のシナリオの使用回数をジャンル毎に合計し、合計使用回数が多いジャンルを特定する。そして、追加対象特定部２２は、特定したジャンルのシナリオを送信するように情報処理装置３０ｅに要求することにより、当該ジャンルのシナリオを受信する。これにより、受信したシナリオにて第１データベース２０ｅが更新される。

　（シナリオ特定処理を行わずに第１データベースを更新する例）次に、シナリオ特定処理を行わずに第１データベース２０ｅを更新する例について説明する。この例では、情報処理装置３０ｅは、図５の応答通知処理のＳ２４において、応答フレーズを送信する代わりに、その応答フレーズを含むシナリオを送信する。そして、音声対話装置１０ｅの更新部１８は、受信したシナリオを追加して第１データベース２０ｅを更新する。

　この場合、図６の更新処理におけるＳ３６からＳ３８の処理を行って、使用される可能性の低いシナリオを随時削除または上書きすることにより、第１データベース２０ｅに格納されているデータ量が膨大になることを防ぐことが望ましい。

　〔ソフトウェアによる実現例〕
　音声対話装置１０、１０ｅおよび情報処理装置３０、３０ｅの制御ブロック（特に制御部１２および制御部３２に含まれる各ブロック）は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ＣＰＵ（Central ProcessingUnit）を用いてソフトウェアによって実現してもよい。

　後者の場合、音声対話装置１０、１０ｅおよび情報処理装置３０、３０ｅは、各機能を実現するソフトウェアであるプログラムの命令を実行するＣＰＵ、上記プログラムおよび各種データがコンピュータ（またはＣＰＵ）で読み取り可能に記録されたＲＯＭ（Read Only Memory）または記憶装置（これらを「記録媒体」と称する）、上記プログラムを展開するＲＡＭ（Random Access Memory）などを備えている。そして、コンピュータ（またはＣＰＵ）が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

　〔まとめ〕
　本発明の態様１に係る情報処理装置３０は、ユーザからの呼びかけの内容（呼びかけワード）に応じた応答内容（応答フレーズ）を示す対応情報（シナリオ）が格納された第１データベース２０を参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置１０と通信可能な情報処理装置であって、上記音声対話装置から呼びかけの内容を通知されたときに、上記第１データベースに格納されていない対応情報が格納された第２データベース４０を参照して応答内容を特定し、該応答内容で上記音声対話装置に音声出力させる応答通知部（３３）と、上記応答通知部による応答内容の特定に用いられた対応情報の使用履歴を示す使用履歴情報を記録する履歴情報記録部（３６）と、上記使用履歴情報を参照して特定された対応情報を、上記音声対話装置に通知して上記第１データベースに追加させる更新制御部（３８）とを備える。

　上記の構成によれば、音声対話装置は、第１データベースの参照では応答内容を特定することができなかった場合に、情報処理装置に要求することにより、応答内容の通知を受け、これを出力して応答することができる。また、使用履歴情報を参照することで特定された対応情報が第１データベースに追加されるので、第２データベースに格納されている対応情報のうち、音声対話装置において使用される可能性の高い対応情報を第１データベースに追加させることが可能になる。

　つまり、上記の構成によれば、使用可能性の高い対応情報については、速やかに音声対話装置が参照できるようにすると共に、使用可能性の低い対応情報については、情報処理装置への要求により使用できるようにする。これにより、使用可能性の低い対応情報で第１データベースの容量を増加させることなく、音声対話装置が、情報処理装置を介さずに、第１データベースを参照してユーザに応答を返すことができる可能性を高めることができる。

　本発明の態様２に係る情報処理装置は、上記態様１において、上記第２データベースに格納されている対応情報には、該対応情報が予め定められた属性（ジャンル）の何れに該当するかを示す属性情報が対応付けられており、上記履歴情報記録部は、上記第２データベースに格納されている対応情報が、上記応答通知部による応答内容の特定に用いられた回数を示す使用履歴情報を記録し、上記使用履歴情報および上記属性情報を参照して特定した上記対応情報の属性毎の使用回数を基準として、上記第１データベースに追加させる対応情報の属性を特定する追加対象特定部（３７）を備え、上記更新制御部は、上記第２データベースに格納されている対応情報のうち、上記追加対象特定部が特定した属性の対応情報を、上記音声対話装置に通知して上記第１データベースに追加させる、構成であってもよい。

　上記の構成によれば、対応情報の属性毎の使用回数を基準として、上記第１データベースに追加させる対応情報の属性を特定し、該属性の対応情報を音声対話装置に通知して第１データベースに追加させる。よって、過去の使用回数が多く、今後も使用される可能性が高い属性の対応情報を第１データベースに追加させることができる。また、このように属性に基づいて対応情報を特定することにより、ある音声対話装置が過去に情報処理装置に対して通知したことのない呼びかけ内容に対応する対応情報を、その音声対話装置に送信することができる。したがって、音声対話装置は、初めての呼びかけ内容に対しても、情報処理装置を介することなく速やかに応答を返すことが可能になる。

　なお、上記情報処理装置が、複数の音声対話装置と通信可能である場合、各音声対話装置における対応情報の属性毎の使用回数の合計値を基準として属性を特定してもよい。これにより、各音声対話装置で多く使用され、各音声対話装置にて今後使用される可能性が高い属性の対応情報を第１データベースに追加させることができる。

　本発明の態様３に係る情報処理装置は、上記態様１において、複数の上記音声対話装置と通信可能であり、上記履歴情報記録部は、上記応答通知部による応答内容の特定に用いられた対応情報の使用回数を上記使用履歴情報として記録し、複数の上記音声対話装置の上記使用回数を対応情報毎に合計した合計使用回数を基準として、上記第１データベースに追加させる対応情報を特定する追加対象特定部を備え、上記更新制御部は、上記第２データベースに格納されている対応情報のうち、上記追加対象特定部が特定した対応情報を、複数の上記音声対話装置の一部または全部に通知して各音声対話装置が参照する各第１データベースに追加させる、構成であってもよい。

　上記の構成によれば、複数の音声対話装置の対応情報の使用回数を合計した合計使用回数を基準として、第１データベースに追加させる対応情報を特定し、複数の音声対話装置の一部または全部に通知して各第１データベースに追加させる。よって、各音声対話装置で多く使用され、各音声対話装置にて今後使用される可能性が高い対応情報を第１データベースに追加させることができる。また、このように複数の音声対話装置における合計使用回数を用いることにより、ある音声対話装置が過去に情報処理装置に対して通知したことのない呼びかけ内容に対応する対応情報を、その音声対話装置に送信することができる。したがって、音声対話装置は、初めての呼びかけ内容に対しても、情報処理装置を介することなく速やかに応答を返すことが可能になる。

　本発明の態様４に係る情報処理装置は、上記態様１において、上記履歴情報記録部は、上記第２データベースに格納されている対応情報が、上記応答通知部による応答内容の特定に用いられた回数を示す使用履歴情報を記録し、上記使用履歴情報を参照して特定した所定期間における使用回数、または所定期間における使用回数の増加量を基準として、上記第１データベースに追加させる対応情報を特定する追加対象特定部を備え、上記更新制御部は、上記第２データベースに格納されている対応情報のうち、上記追加対象特定部が特定した対応情報を上記音声対話装置に通知して上記第１データベースに追加させる、構成であってもよい。

　上記の構成によれば、所定期間における使用回数、または所定期間における使用回数の増加量を基準として第１データベースに追加させる対応情報を特定し、音声対話装置に通知して第１データベースに追加させる。よって、所定期間に多く使用された対応情報を第１データベースに追加させることができる。なお、所定期間をどのような期間とするかは任意であるが、該期間の終点は、第１データベースに追加させる対応情報を特定する時点と近いことが望ましい。これにより、最近の使用状況に応じた対応情報を特定することができるためである。

　本発明の態様５に係る情報処理装置は、上記態様１において、複数の上記音声対話装置と通信可能であり、上記第２データベースに格納されている対応情報には、該対応情報が予め定められた属性の何れに該当するかを示す属性情報が対応付けられており、上記履歴情報記録部は、上記第２データベースに格納されている対応情報が、上記応答通知部による応答内容の特定に用いられた回数を複数の上記音声対話装置毎に示す使用履歴情報を記録し、上記使用履歴情報および上記属性情報を参照して特定した上記対応情報の属性毎の使用回数を基準として、複数の上記音声対話装置毎に属性を特定すると共に、複数の上記音声対話装置における合計使用回数を基準として、上記特定した属性の対応情報の中から、上記第１データベースに追加させる対応情報を特定する追加対象特定部を備え、上記更新制御部は、上記第２データベースに格納されている対応情報のうち、上記追加対象特定部が特定した対応情報を、該対応情報の属性が特定された音声対話装置に通知して上記第１データベースに追加させる、構成であってもよい。

　上記の構成によれば、対応情報の属性毎の使用回数を基準として、複数の上記音声対話装置毎に属性を特定する。これにより、各音声対話装置において使用される可能性の高い属性の対応情報を特定することができる。

　そして、上記の構成によれば、複数の音声対話装置における合計使用回数を基準として上記特定した属性の対応情報を特定し、該対応情報の属性が特定された音声対話装置に通知して第１データベースに追加させる。よって、個別の音声対話装置において使用される可能性の高い属性の対応情報であって、全音声対話装置において多く使用され、個別の音声対話装置においても今後使用される可能性が高い対応情報を、各第１データベースに追加させることができる。

　本発明の態様６に係る音声対話装置１０ｅは、ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第１データベース２０ｅを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置であって、上記第１データベースに格納されていない対応情報が格納された第２データベースを参照可能な情報処理装置に要求して、ユーザの呼びかけ内容に応じた応答内容を取得する応答取得部（応答生成部１５）と、上記第２データベースに格納されている対応情報の使用履歴を示す使用履歴情報を参照して、上記第１データベースに追加する対応情報を特定する追加対象特定部（２２）と、上記追加対象特定部が特定した対応情報を上記情報処理装置から取得して上記第１データベースに追加する更新部（１８）と、を備える。

　上記の構成によれば、第１データベースの参照では応答内容を特定することができなかった場合に、情報処理装置に要求することにより、ユーザの呼びかけ内容に応じた応答内容を取得し、これを出力して応答することができる。また、使用履歴情報を参照することで特定した対応情報を第１データベースに追加するので、第２データベースに格納されている対応情報のうち、音声対話装置において使用される可能性の高い対応情報を第１データベースに追加させることが可能になる。

　なお、第２データベースに格納されている対応情報の使用履歴を示す使用履歴情報は、例えば情報処理装置から応答内容を取得したときに、その応答内容の特定に用いられた対応情報の使用回数をカウントしたものであってもよい。また、例えば、使用履歴情報を情報処理装置から取得してもよい。さらに、情報処理装置が複数の音声対話装置と通信可能である場合、使用履歴情報は、第２データベースに格納されている対応情報の複数の音声対話装置による使用回数を示すものであってもよい。この場合、対応情報の使用回数は、各音声対話装置について個別にカウントされていてもよいし、全音声対話装置についての合計使用回数がカウントされていてもよい。

　本発明の態様７に係る音声対話装置は、上記態様６において、上記第１データベースに格納されている対応情報の使用履歴を示す使用履歴情報を参照して、上記第１データベースから削除する対応情報を特定する削除対象特定部（１９）を備え、上記更新部は、上記削除対象特定部が特定した対応情報を上記第１データベースから削除するか、または上記削除対象特定部が特定した対応情報を、上記追加対象特定部が特定した対応情報で上書きする、構成であってもよい。

　上記の構成によれば、使用履歴情報を参照することで特定した対応情報を第１データベースから削除するか、または上書きする。よって、第１データベースに格納されている対応情報のうち、音声対話装置において使用される可能性の低い対応情報を第１データベースから削除することが可能になる。

　本発明の各態様に係る情報処理装置および音声対話装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記情報処理装置または上記音声対話装置が備える各部として動作させることにより上記情報処理装置または上記音声対話装置をコンピュータにて実現させる上記情報処理装置または上記音声対話装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

　本発明は、ユーザの呼びかけに音声で応答する音声対話装置、および情報処理装置を介して音声対話装置に上記の応答を行わせる対話システム等に利用することができる。

１０　　音声対話装置
２０　　第１データベース
３０　　情報処理装置
３３　　応答通知部
３６　　履歴情報記録部
３７　　追加対象特定部
３８　　更新制御部
４０　　第２データベース
１０ｅ　音声対話装置
１５　応答生成部（応答取得部）
１８　更新部
１９　削除対象特定部
２２　追加対象特定部
２０ｅ　第１データベース
３０ｅ　情報処理装置

Claims

　ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第１データベースを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置と通信可能な情報処理装置であって、
　上記音声対話装置から呼びかけの内容を通知されたときに、上記第１データベースに格納されていない対応情報が格納された第２データベースを参照して応答内容を特定し、該応答内容で上記音声対話装置に音声出力させる応答通知部と、
　上記応答通知部による応答内容の特定に用いられた対応情報の使用履歴を示す使用履歴情報を記録する履歴情報記録部と、
　上記使用履歴情報を参照して特定された対応情報を、上記音声対話装置に通知して上記第１データベースに追加させる更新制御部とを備えることを特徴とする情報処理装置。
　上記第２データベースに格納されている対応情報には、該対応情報が予め定められた属性の何れに該当するかを示す属性情報が対応付けられており、
　上記履歴情報記録部は、上記第２データベースに格納されている対応情報が、上記応答通知部による応答内容の特定に用いられた回数を示す使用履歴情報を記録し、
　上記使用履歴情報および上記属性情報を参照して特定した上記対応情報の属性毎の使用回数を基準として、上記第１データベースに追加させる対応情報の属性を特定する追加対象特定部を備え、
　上記更新制御部は、上記第２データベースに格納されている対応情報のうち、上記追加対象特定部が特定した属性の対応情報を、上記音声対話装置に通知して上記第１データベースに追加させることを特徴とする請求項１に記載の情報処理装置。
　上記情報処理装置は、複数の上記音声対話装置と通信可能であり、
　上記履歴情報記録部は、上記応答通知部による応答内容の特定に用いられた対応情報の使用回数を上記使用履歴情報として記録し、
　複数の上記音声対話装置の上記使用回数を対応情報毎に合計した合計使用回数を基準として、上記第１データベースに追加させる対応情報を特定する追加対象特定部を備え、
　上記更新制御部は、上記第２データベースに格納されている対応情報のうち、上記追加対象特定部が特定した対応情報を、複数の上記音声対話装置の一部または全部に通知して各音声対話装置が参照する各第１データベースに追加させることを特徴とする請求項１に記載の情報処理装置。
　ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第１データベースを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置であって、
　上記第１データベースに格納されていない対応情報が格納された第２データベースを参照可能な情報処理装置に要求して、ユーザの呼びかけ内容に応じた応答内容を取得する応答取得部と、
　上記第２データベースに格納されている対応情報の使用履歴を示す使用履歴情報を参照して、上記第１データベースに追加する対応情報を特定する追加対象特定部と、
　上記追加対象特定部が特定した対応情報を上記情報処理装置から取得して上記第１データベースに追加する更新部と、を備えることを特徴とする音声対話装置。
　請求項１から３のいずれか１項に記載の情報処理装置としてコンピュータを機能させるための制御プログラムであって、コンピュータを上記各部として機能させるための制御プログラム。