JP6255274B2 - 情報処理装置、音声対話装置、および制御プログラム - Google Patents
情報処理装置、音声対話装置、および制御プログラム Download PDFInfo
- Publication number
- JP6255274B2 JP6255274B2 JP2014030046A JP2014030046A JP6255274B2 JP 6255274 B2 JP6255274 B2 JP 6255274B2 JP 2014030046 A JP2014030046 A JP 2014030046A JP 2014030046 A JP2014030046 A JP 2014030046A JP 6255274 B2 JP6255274 B2 JP 6255274B2
- Authority
- JP
- Japan
- Prior art keywords
- database
- voice
- scenario
- information
- response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims description 116
- 230000004044 response Effects 0.000 claims description 185
- 230000003993 interaction Effects 0.000 claims description 107
- 230000002452 interceptive effect Effects 0.000 claims description 96
- 238000000034 method Methods 0.000 description 46
- 230000008569 process Effects 0.000 description 42
- 238000012545 processing Methods 0.000 description 21
- 238000012217 deletion Methods 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、ユーザの呼びかけに対して音声で応答する音声対話システム、該システムの構成要素であり、ユーザと直接対話する音声対話装置、および音声対話装置の発話を制御する情報処理装置等に関する。
人間と音声で対話する音声対話装置について、従来から広く研究されている。例えば、特許文献1には、ユーザから知らないことを聞かれた場合にユーザにその答えを問い返し、その質問内容と答えを記憶し、次からの対話に用いる音声対話装置が開示されている。また、下記特許文献2には、ユーザの質問に対する応答を出力するための技術が開示されている。
上記のような音声対話装置は、受け答えの内容を多く記憶させておくほど、ユーザの多様な問いかけに応答できるようになるが、コストなどの面から、個別の音声対話装置の記憶容量を増やすことには限界がある。そこで、ネットワーク上のサーバに大容量のデータベースを設けて、受け答えの内容を記憶しておくことが考えられる(特許文献3参照)。
この構成によれば、音声対話装置が記憶していない問いかけがユーザからなされた場合に、サーバからその問いかけに応じた回答を取得して、ユーザに応答することができる。また、サーバは、複数の音声対話装置で利用可能であるから、個別の音声対話装置の記憶容量を増やすよりもコスト面で有利である。
ただし、サーバから回答を取得してユーザに応答する場合、音声対話装置が記憶している受け答えの内容を用いて応答する場合と比べて、ユーザへの応答のタイミングが遅れてしまう。そして、サーバに記憶されている受け答えの内容を音声対話装置にコピーすれば、ユーザへの迅速な応答が可能になるが、上述のように音声対話装置の記憶容量には限りがある。つまり、従来は、音声対話装置において使用される可能性の高いデータを、音声対話装置が参照するデータベースに追加させる技術がないという問題があった。なお、データベースの更新に関する技術としては、例えば上記特許文献4が挙げられるが、該文献は音声認識用の単語データベースの更新に関するものであり、音声対話装置については言及されていない。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、音声対話装置において使用される可能性の高いデータを、音声対話装置が参照するデータベースに追加させることのできる情報処理装置等を提供することにある。
上記の課題を解決するために、本発明の一態様に係る情報処理装置は、ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第1データベースを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置と通信可能な情報処理装置であって、上記音声対話装置から呼びかけの内容を通知されたときに、上記第1データベースに格納されていない対応情報が格納された第2データベースを参照して応答内容を特定し、該応答内容で上記音声対話装置に音声出力させる応答通知手段と、上記応答通知手段による応答内容の特定に用いられた対応情報の使用履歴を示す使用履歴情報を記録する履歴情報記録手段と、上記使用履歴情報を参照して特定した対応情報を、上記音声対話装置に通知して上記第1データベースに追加させる更新制御手段と、を備えている。
また、本発明の一態様に係る音声対話装置は、上記の課題を解決するために、ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第1データベースを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置であって、上記第1データベースに格納されていない対応情報が格納された第2データベースを参照可能な情報処理装置に要求して、ユーザの呼びかけ内容に応じた応答内容を取得する応答取得手段と、上記第2データベースに格納されている対応情報の使用履歴を示す使用履歴情報を参照して、上記第1データベースに追加する対応情報を特定する追加対象特定手段と、上記追加対象特定手段が特定した対応情報を上記情報処理装置から取得して上記第1データベースに追加する更新手段と、を備えている。
本発明の上記各態様によれば、音声対話装置において使用される可能性の高い対応情報を、音声対話装置が参照する第1データベースに追加させることができるという効果を奏する。
〔実施形態1〕
本発明の一実施形態について、図1〜図6に基づいて説明すれば以下のとおりである。
本発明の一実施形態について、図1〜図6に基づいて説明すれば以下のとおりである。
(対話システムの概要)まず、図2に基づいて本実施形態の概要を説明する。図2は、本発明の一実施形態に係る対話システムを概略的に示す図である。対話システム50は、音声対話装置10および情報処理装置30を含む。音声対話装置10および情報処理装置30は何れも音声認識機能を備える点で共通しているが、音声対話装置10はユーザと直接対話し、情報処理装置30はネットワーク上に設置され、ユーザと直接には対話しない点で相違している。音声対話装置10は、例えば、対話ロボット、タブレット端末、スマートフォン、パーソナルコンピュータなどであってもよい。対話システム50によれば、ユーザは自然言語を用いた音声によって音声対話装置10と対話することができる。
図2に示されるように、ユーザの呼びかけた音声1を受け付けた音声対話装置10は、音声1に対応する応答フレーズを第1データベース内で検索する。音声1に対応する応答フレーズが第1データベース内に格納されている場合、音声対話装置10は、音声1に対応する応答フレーズを、音声2としてユーザに向けて出力する。
一方、音声1に対応する応答フレーズが第1データベース内に格納されていない場合、音声対話装置10は、音声1に対応する応答フレーズを、無線通信を介して情報処理装置30に要求する。次に、情報処理装置30は、音声対話装置10からの要求に応じて、音声1に対応する応答フレーズを、第1データベースよりも容量の大きい第2データベース内で検索し、音声対話装置10に提示する。そして、音声対話装置10は、情報処理装置30から提示された応答フレーズを、音声3としてユーザに向けて出力する。
第2データベースの容量は、第1データベースよりも大きいため、情報処理装置30が第2データベースを参照して応答できるフレーズ数は、音声対話装置10が第1データベースを参照して応答できるフレーズ数よりも多い。それゆえ、情報処理装置30は、第2データベースを参照することにより、音声対話装置10が応答フレーズを検出できなかった音声1に対応する応答フレーズを、音声対話装置10に提示することができる。
ここで、音声1に対応する応答フレーズが第1データベース内に格納されている場合、情報処理装置30での処理が不要となるため、音声2が出力されるまでの時間は、情報処理装置30での処理を必要とする場合における音声3が出力されるまでの時間よりも短いという利点がある。そこで、図2に示すように、情報処理装置30は、音声1と音声1に対応した応答フレーズとが対応づけられたデータ4を第1データベースに追加させる。
ただし、第1データベースの容量は、第2データベースよりも少ないため、追加できるデータ容量に制限がある。そこで、情報処理装置30は、第1データベースに追加させるデータを、ユーザが利用する可能性の高いデータに限定する。これにより、使用確率の低い対応情報で第1データベースの容量を増加させることなく、音声対話装置10が迅速に応答フレーズをユーザに返すことができる確率を高めることができることができる。
(情報処理装置と音声対話装置との関係)図2では、音声対話装置10と情報処理装置30とを各1つ示したが、対話システム50では、1つの情報処理装置30に対し、音声対話装置10が複数設けられていてもよい。これについて図3に基づいて説明する。図3は、複数の音声対話装置10a〜10dと通信可能な情報処理装置30を示す図である。
図3の例の情報処理装置30は、複数の音声対話装置10a〜10dによって利用される。このため、情報処理装置30は、各音声対話装置10a〜10dが情報処理装置30を利用した回数を音声対話装置10a〜10d毎に記録できる。それゆえ、情報処理装置30は、複数の音声対話装置10a〜10dの利用状況に応じて、第1データベースに追加させるデータを特定することができる。
例えば、情報処理装置30は、音声対話装置10aが情報処理装置30に要求していないデータで、音声対話装置10b〜10dが情報処理装置30に要求したデータを第1データベース20aに追加させることが可能となる。また、例えば、情報処理装置30は、複数の第1データベース20a〜20dに、同一のデータを追加させることもできる。
(データベースに格納されるデータ)上述のように、第1データベース20および第2データベース40は、ユーザが音声対話装置10に呼びかけた内容のそれぞれについて、当該内容に応じた応答フレーズを対応付けた対応情報(以下、シナリオと呼ぶ)を登録したデータベースである。ここでは、ユーザが音声対話装置10に呼びかけた内容を示す情報として、ユーザの発話内容に含まれる単語(以下、呼びかけワードと称する)を使用する例を説明する。無論、ユーザが呼びかけた内容を示す情報は、これに限られず、例えば2以上の語からなるフレーズであってもよい。
また、上述のように、情報処理装置30は、第2データベース40に格納されているデータ(シナリオ)のうち、ユーザが利用する可能性の高いデータを第1データベース20に追加させる。このため、ユーザが利用する可能性の高いシナリオを特定することができるように、情報処理装置30は、第2データベース40におけるシナリオの使用履歴情報を記録する。使用履歴情報の記録先は特に限定されないが、ここではシナリオに付加する形で記録する例を説明する。
ここで、シナリオおよび使用履歴情報の具体例を図4に基づいて説明する。図4は、情報処理装置30が使用するデータの一例を示す図であり、同図の(a)は、シナリオおよび使用履歴情報の一例を示している。なお、音声対話装置10が参照する第1データベース20にも、図4の(a)に示されるようなシナリオが複数格納されている。
また、同図の(b)には、ジャンル毎の利用回数を示すテーブルの一例を示している。このテーブルを用いることにより、利用されたシナリオのジャンルに応じた追加対象シナリオを特定することができる。
また、同図の(b)には、ジャンル毎の利用回数を示すテーブルの一例を示している。このテーブルを用いることにより、利用されたシナリオのジャンルに応じた追加対象シナリオを特定することができる。
図4の(a)に示すテーブルでは、呼びかけワードと応答フレーズとジャンルとが対応付けられている。この部分が上記のシナリオに対応している。つまり、呼びかけワードと応答フレーズとの組み合わせがシナリオであり、図示の例では各シナリオに1から昇順で番号を付している。なお、図示の例のように、呼びかけワードは複数の単語の組み合わせであってもよいし、1つの単語のみであってもよい。また、応答フレーズは1つ(1組)の呼びかけワードに対して複数登録されていてもよい。この場合、複数の応答フレーズの中から実際に発話する応答フレーズを選択すればよい。なお、呼びかけワードおよび応答フレーズは、何れもテキストデータとして格納しておけばよい。
また、ジャンルとは、シナリオの属性を示す属性情報として、シナリオ毎に予め設定されたものであり、第2データベース40に追加させるシナリオを特定するために使用される。ジャンルは、呼びかけワードおよび応答フレーズの少なくとも何れかに関連した情報であり、1つのシナリオに対して複数設定してもよいし、ジャンルが設定されていないシナリオが存在してもよい。
このようなシナリオを参照することにより、ユーザの呼びかけに対して応答を返すことが可能になる。例えば、ユーザから音声対話装置10に呼びかけられた音声が、「チームAの本拠地は?」であるとする。この場合、この音声の解析により、該音声に「チームA」および「本拠地」の語が含まれていることが特定される。ここで、図4の(a)に示されたシナリオのうち、これらの語を呼びかけワードとして含むシナリオはNo.1である。このため、応答フレーズを「スタジアムCだよ」と特定し、この応答フレーズをユーザに返すことが可能になる。
また、図4の(a)のテーブルにおいて、利用回数として示された部分が使用履歴情報である。図示の例では、各シナリオについて、音声対話装置10毎の利用回数が登録されている。この情報を参照することより、各音声対話装置10に対し、そのユーザがどのような呼びかけを行っているかに応じたシナリオを、当該音声対話装置10の使用する第1データベース20のそれぞれに追加させるシナリオとして特定することができる。なお、以下では、第1データベース20に追加させるシナリオを追加対象シナリオと呼ぶ。
また、図示の例では、各シナリオについて、全装置の合計利用回数が登録されている。これにより、他の音声対話装置10の利用状況も加味してシナリオを特定することができる。例えば、ある音声対話装置10に送信したことのないシナリオであっても、他の多くの音声対話装置10に送信したシナリオであれば、今後使用される可能性は高いと考えられる。全装置の合計利用回数を参照することにより、このようなシナリオを特定することもできる。無論、このようなシナリオの特定が不要であれば、全装置の合計利用回数の項目は省略すればよい。また、逆に、全装置の合計利用回数のみを用いてシナリオを特定する場合、各装置の利用回数の項目を省略してもよい。
次に、同図の(b)のテーブルについて説明する。このテーブルは、シナリオの利用回数をジャンル毎に集計して得たものであり、各ジャンルについて、各音声対話装置10の利用回数および全音声対話装置10の利用回数の合計値が登録されている。このテーブルを参照することにより、各音声対話装置10のユーザの呼びかける可能性の高いジャンルを特定することができる。
(要部構成)次に、音声対話装置10および情報処理装置30のより詳細な構成を図1に基づいて説明する。図1は、対話システム50を構成する音声対話装置10および情報処理装置30の要部構成を示すブロック図である。図1に示されるように、音声対話装置10は第1データベース20を参照可能となっており、情報処理装置30は第2データベース40を参照可能となっている。
(音声対話装置の要部構成)音声対話装置10は、音声の入力を受け付けて音声データを生成する音声入力部11、音声対話装置10の各種機能を実現するための制御を行う制御部12、制御部12の制御に従って音声を出力する音声出力部13、および他の装置と通信するための通信部21を備える。音声入力部11は例えばマイクで構成され、音声出力部13は例えばスピーカで構成される。また、制御部12は、音声認識部14、応答生成部15、音声合成部16、履歴情報記録部17、更新部18、および削除対象特定部19を備える。
音声認識部14は、ユーザが音声対話装置に呼びかけた音声を認識する。具体的には、音声認識部14は、音声入力部11から受信した音声データを変換して、ユーザの呼びかけの内容を示すテキストデータを生成する。そして、生成したテキストデータを解析して、そのテキストデータから単語を抽出する。
応答生成部15は、音声認識部14の認識結果に応じた応答内容を、第1データベース20を参照して確定する。具体的には、応答生成部15は、音声認識部14が抽出した単語と一致する単語を、第1データベース20に格納されている各シナリオの呼びかけワードから検出する。そして、一致が検出された場合に、そのシナリオに含まれる応答フレーズを、ユーザからの呼びかけに応答するための応答フレーズと確定する。
また、応答生成部15は、ユーザからの呼びかけに応答するための応答フレーズが第1データベース20に格納されていなかった場合には、通信部21を介して情報処理装置30から応答フレーズを取得する。具体的には、応答生成部15は、第1データベース20を参照して応答フレーズを確定できなかった場合、音声入力部11が生成した音声データを、通信部21を介して情報処理装置30に送信する。そして、上記音声データに応じた応答フレーズを、通信部21を介して情報処理装置30から受信する。なお、応答生成部15は、音声認識部14が生成したテキストデータまたは該テキストデータから抽出した単語を送信してもよい。
音声合成部16は、応答生成部15が確定した応答フレーズに対応する音声データを生成する。生成した音声データは、音声出力部13を介して音声として出力される。
履歴情報記録部17は、応答生成部15による応答フレーズの確定に用いられたシナリオ(第1データベース20に格納されたシナリオ)の利用回数を、使用履歴情報として記録する。具体的には、履歴情報記録部17は、図4の(a)の例と同様に、各シナリオに対し、その利用回数を対応付けて記録する。この使用履歴情報は、第1データベース20に格納されたシナリオのうち、ユーザに使用される可能性の低いシナリオを特定するために使用される。
更新部18は、第1データベース20に格納されたシナリオを更新する。具体的には、更新部18は、情報処理装置30から通知された追加対象シナリオ(第2データベースに格納されたシナリオ)を第1データベース20に追加して更新する。なお、第1データベース20の更新は、情報処理装置30からシナリオが通知されたときに行ってもよいし、例えば所定の間隔(例えば24時間)毎に行ってもよく、その実行タイミングは特に限定されない。
また、更新部18は、第1データベース20の空き容量が不足している場合、削除対象特定部19に削除対象のシナリオを特定させる。そして、削除対象特定部19が特定したシナリオについては、削除するかまたは情報処理装置30から通知されたシナリオにて上書きする。
削除対象特定部19は、履歴情報記録部17が記録した使用履歴情報を参照して、第1データベースに格納されたシナリオのうち、利用回数の少ないシナリオデータを削除対象として特定する。なお、削除対象のシナリオの特定は、例えば、更新部18からの通知があったときに行ってもよいし、所定の間隔(例えば24時間)毎に行ってもよく、その実行タイミングは特に限定されない。
(情報処理装置の要部構成)情報処理装置30は、他の装置と通信するための通信部31および情報処理装置30の各種機能を実現するための制御を行う制御部32を備える。そして、制御部32は、応答通知部(応答通知手段)33、音声認識部34、応答通知部33、音声合成部35、履歴情報記録部(履歴情報記録手段)36、追加対象特定部(追加対象特定手段)37、および更新制御部(更新制御手段)38を備える。
応答通知部33は、第2データベース40を参照して、音声対話装置10の要求に応じた応答フレーズを確定し、通信部31を介して音声対話装置10に該応答フレーズを通知する。
なお、ここでは、音声対話装置10が、応答フレーズを確定することができなかった音声データを送信することを想定している。このため、応答通知部33は、受信した音声データを音声認識部34に音声認識させ、これによって抽出された単語を用いて応答フレーズを確定する。無論、音声対話装置10が、応答フレーズを確定することができなかったテキストデータまたは該テキストデータから抽出した単語を送信する構成としてもよい。この場合には、受信した単語をそのまま用いて、あるいは受信したテキストデータから音声認識部34が抽出した単語を用いて応答フレーズを確定する。
また、ここでは、確定した応答フレーズのテキストデータを音声対話装置10に通知する例を説明するが、通知する情報は、音声対話装置10が当該応答フレーズに応じた発話を行うことができるものであればよく、例えば音声データであってもよい。音声データを送信する場合、応答通知部33は音声合成部35に指示して応答フレーズに応じた音声データを生成させる。
音声認識部34は、応答通知部33から通知された音声データからテキストデータを生成し、生成したテキストデータから単語を抽出して応答通知部33に通知する。音声認識部34は、音声対話装置10の音声認識部14と同様の構成であるが、音声認識機能は音声認識部14よりも高いものとすることが望ましい。これにより、音声対話装置10において、音声認識性能が不足しているために応答フレーズが確定できなかったような場合にも、情報処理装置30側で応答フレーズを確定することが可能になる。
音声合成部35は、音声対話装置10の音声合成部16と同様の構成であり、応答フレーズに対応する音声データを生成する。なお、本実施形態にて説明する例のように、音声データの合成を音声対話装置10側で行う場合には、音声合成部35を省略してもよい。一方、音声合成部35が合成した音声データを音声対話装置10に送信して出力させる場合、音声合成部35は、音声合成部16よりも多くの音素データを用いる等によって、よりクリアな音声を出力可能な音声データを生成できるものとすることが好ましい。
履歴情報記録部36は、応答通知部33による応答フレーズの確定に用いられたシナリオの利用回数を示す使用履歴情報を記録する。具体的には、図4の(a)に示したように、各シナリオにその利用回数を対応付けて記録する。
追加対象特定部37は、履歴情報記録部36が記録した使用履歴情報を参照して、第2データベースに格納されたシナリオの中から追加対象シナリオを特定する。本実施形態では、下記の(1)〜(4)の情報を基準としてシナリオを特定する例を説明する。具体的には、下記の(1)または(2)の情報を用いる例を図6に基づいて、(3)または(4)の情報を用いる例を図7に基づいて後に説明する。
(1)音声対話装置10毎の利用回数
(2)全音声対話装置10の合計利用回数
(3)音声対話装置10毎のジャンル別の利用回数
(4)全音声対話装置10のジャンル別の合計利用回数
なお、追加対象シナリオの特定は、例えば、音声対話装置10から情報処理装置30に応答フレーズの要求があったタイミングで行ってもよいし、所定の間隔(例えば24時間)毎に行ってもよく、そのタイミングは特に限定されない。
(1)音声対話装置10毎の利用回数
(2)全音声対話装置10の合計利用回数
(3)音声対話装置10毎のジャンル別の利用回数
(4)全音声対話装置10のジャンル別の合計利用回数
なお、追加対象シナリオの特定は、例えば、音声対話装置10から情報処理装置30に応答フレーズの要求があったタイミングで行ってもよいし、所定の間隔(例えば24時間)毎に行ってもよく、そのタイミングは特に限定されない。
更新制御部38は、追加対象シナリオを、通信部31を介して音声対話装置10に通知して、第1データベース20に追加させる。
(対話システムにおける処理の流れ)次に、対話システム50における処理の流れを図5に基づいて説明する。図5は、ユーザからの呼びかけに応答して音声対話装置10が音声を出力する対話処理、および音声対話装置10からの要求に応じて情報処理装置30が応答フレーズを送信する応答通知処理の一例を示すフローチャートである。これらの処理では、第1データベース20および第2データベース40のそれぞれについてシナリオの使用履歴情報が記録される。
まず、対話処理では、ユーザが音声対話装置10に対して呼びかけた音声が、音声入力部11に入力されると、音声認識部14がこれを検出し(S11にてYES)、検出した音声に対応する音声データを生成して音声認識部14に出力する。そして、音声認識部14は、出力された上記音声データの音声認識を行い(S12)、これにより生成したテキストデータから単語を抽出して応答生成部15に通知する。
次に、応答生成部15は、音声認識部14から通知された単語にマッチする呼びかけワードを第1データベース20内で検索し(S13)、マッチするものが登録されているか否かを判断する(S14)。
ここでマッチすると判断した場合(S14にてYES)、応答生成部15は、マッチした呼びかけワードに対応付けられた応答フレーズを、ユーザへの応答に用いる応答フレーズと確定する(S15)。また、応答フレーズが確定されると、履歴情報記録部17は、第1データベース20の使用履歴情報において、当該応答フレーズの確定に使用されたシナリオの利用回数をインクリメント(+1)する(S16)。
また、応答フレーズを確定した応答生成部15は、その応答フレーズを音声合成部16に通知し、音声合成部16は、当該応答フレーズに対応する音声を合成する(S17)。そして、音声出力部13は、音声合成部16が合成した音声を出力し(S18)、これにより、S11にて検出された音声に対する応答がユーザに返される。
一方、S14において、マッチしないと判断した場合(S14にてNO)、応答生成部15は、S11にて検出された音声(音声データ)を情報処理装置30に送信して(S19)、該音声データに対応する応答フレーズを要求する。
そして、応答フレーズを要求された情報処理装置30では、応答通知処理が行われる。応答通知処理において、応答通知部33は、受信した音声データに対応する応答フレーズを第2データベース40内で検索し(S21)、応答フレーズを確定する(S22)。第2データベース40には、第1データベース20に格納されていないシナリオが格納されているので、応答通知部33は、音声対話装置10が確定することができなかった応答フレーズを確定することができる。
応答フレーズが確定されると、履歴情報記録部36は、第2データベース40の使用履歴情報において、当該応答フレーズの確定に使用されたシナリオの利用回数をインクリメント(+1)する(S23)。また、応答フレーズを確定した応答通知部33は、当該応答フレーズを音声対話装置10に通知し(S24)、これにより応答通知処理は終了する。そして、音声対話装置10は、上記送信された応答フレーズを受信し(S20)、この後、S17以降の処理が行われる。
(第1データベースの更新)続いて、第1データベース20を更新するために行われる処理の流れを図6に基づいて説明する。図6は、情報処理装置30が追加対象シナリオを特定するシナリオ特定処理、および情報処理装置30からの通知に応じて音声対話装置10が第1データベース20に格納されたデータを更新する更新処理の一例を示すフローチャートである。
まず、シナリオ特定処理では、情報処理装置30の追加対象特定部37は、第2データベース40の使用履歴情報を参照し(S31)利用回数が閾値以上となるシナリオがあるか否かを判断する(S32)。ここで、閾値以上となるシナリオがないと判断した場合(S32にてNO)、シナリオ特定処理は終了する。
一方、閾値以上となるシナリオがあると判断した場合(S32にてYES)、追加対象特定部37は、利用回数が閾値以上のシナリオを追加対象シナリオと特定する(S33)。そして、シナリオが特定されると、更新制御部38は、追加対象特定部37が特定したシナリオを音声対話装置10に送信し(S34)、これによりシナリオ特定処理は終了する。なお、シナリオの送信は、厳密には該シナリオを構成する各データ(呼びかけワードおよび応答フレーズ)を送信することによって行われるが、ここでは単にシナリオを送信すると表現する。なお、ジャンルを示す情報は、該情報を音声対話装置10にて使用するのであれば、シナリオの一部として送信すればよい。
例えば、S32における閾値が3に設定されている場合、図4の(a)の装置1では、シナリオNo.1(利用回数=5)およびシナリオNo.2(利用回数=3)が追加対象シナリオとなる。そして、S34では、音声対話装置10のそれぞれについて特定されたシナリオを当該音声対話装置10に通知する。例えば、上記の例では、No.1および2のシナリオを装置1に通知する。
なお、上記の例では、S31において、音声対話装置10毎に利用回数の多いシナリオを特定しているが、全音声対話装置10の利用回数の合計値が多いシナリオを特定してもよい。この場合、図4の(a)のテーブルを用い、S32の閾値を100とすれば、S33ではシナリオNo.2および4が特定される。この構成では、各音声対話装置10に通知するシナリオ(各音声対話装置10の追加対象シナリオ)が同じになるので、S32からS34の処理の負荷を抑えることができる。
続いて、音声対話装置10が実行する更新処理について説明する。音声対話装置10がシナリオを受信すると(S35)、更新部18は、第1データベース20の空き容量が、S35にて受信したシナリオのデータ容量以上であるか否かを判断する(S36)。なお、第1データベース20に格納可能なシナリオ数には上限が決まっている。そして、S36では、空き容量を(格納可能な最大シナリオ数)−(現在格納されているシナリオ数)との式にて算出する。また、受信したシナリオ数を、受信したシナリオのデータ容量とする。無論、S36では、シナリオ数ではなく、データ容量を特定して比較してもよい。
S36にてYESの場合、更新部18は、S35にて受信した追加対象シナリオを、第1データベース20に追加し、第1データベース20に格納されたデータを更新する(S37)。一方、S36にてNOの場合、削除対象特定部19は、第1データベース20の使用履歴情報を参照して、第1データベース20に格納されたシナリオの中から、置換対象のシナリオを特定する(S38)。具体的には、削除対象特定部19は、利用回数が少ないシナリオから順に、S35で受信した全シナリオを第1データベース20に収めることができる数だけ置換対象のシナリオを特定する。そして、削除対象特定部19は、特定したシナリオを更新部18に通知し、更新部18は通知されたシナリオを、S35で受信したシナリオで置換することにより、第1データベース20に格納されたデータを更新して(S37)、更新処理を終了する。
(ジャンルを考慮したシナリオ特定処理)次に、ジャンル毎の利用回数を示す情報を用いて追加対象シナリオを特定する例を図7に基づいて説明する。図7は、ジャンル毎の利用回数を考慮して追加対象シナリオを特定するシナリオ特定処理の一例を示すフローチャートである。
情報処理装置30の追加対象特定部37は、ジャンル毎の利用回数を示すテーブル(図4の(b)参照)を作成する(S41)。そして、追加対象特定部37は、S41にて作成したテーブルを参照して利用回数が最も多いジャンルを特定する(S42)。
次に、追加対象特定部37は、S42にて特定したジャンルに、利用回数が閾値以上となるシナリオがあるか否かを判断する(S43)。ここで利用回数が閾値以上となるシナリオがないと判断した場合(S43にてNO)、シナリオ特定処理は終了する。
一方、利用回数が閾値以上となるシナリオがあると判断した場合(S43にてYES)、追加対象特定部37は、S42にて特定したジャンルのシナリオのうち、利用回数が閾値以上となるシナリオを追加対象シナリオと特定する(S44)。そして、更新制御部38は、上記追加対象シナリオを音声対話装置10に送信し(S45)、シナリオ特定処理は終了する。
例えば、S41にて図4の(b)のテーブルが作成された場合、S42では、装置1については「水泳」のジャンルが特定され、装置2については「ゴルフ」のジャンルが特定される。そして、S43では、第2データベース40に格納されている全シナリオから、S42で特定されたジャンルのシナリオを抽出する。さらに、S43では、音声対話装置10のそれぞれについて、抽出されたシナリオから、利用回数(全音声対話装置10の利用回数の合計値)が所定の閾値以上のシナリオを特定する。そして、S45では、音声対話装置10のそれぞれについて特定されたシナリオを当該音声対話装置10に通知する。
なお、上記の例では、S42において、音声対話装置10毎に利用回数の多いジャンルを特定しているが、全音声対話装置10の利用回数の合計値が多いジャンルを特定してもよい。この場合、図4の(a)(b)のテーブルを用い、S43の閾値を100とすれば、S42では「サッカー」のジャンルが特定され、S43ではシナリオNo.2および4が特定される。この構成では、各音声対話装置10に通知するシナリオ(各音声対話装置10の追加対象シナリオ)が同じになるので、S44およびS45の処理の負荷を抑えることができる。
また、上記の例では、追加対象シナリオを、利用回数の合計値が最も多いジャンルに絞り込んでいるが、この例に限られない。例えば、利用回数の合計値が所定の閾値以上であるジャンルに絞り込んでもよいし、利用回数の合計値が上位となるジャンル(例えば上位3つのジャンル)に絞り込んでもよい。
そして、上記の例では、追加対象シナリオを、ジャンルで絞り込んだ上で、さらに使用回数で絞り込んでいるが、使用回数での絞り込みは省略してもよい。この場合、S43の処理を省略して、S42で特定したジャンルのシナリオを、S44にて追加対象シナリオと特定する。
〔実施形態2〕
本発明の他の実施形態について、図8および図9に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
本発明の他の実施形態について、図8および図9に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
本実施形態では、所定期間におけるシナリオの利用回数の増加量に基づいて追加対象シナリオを特定する例を説明する。この例によれば、所定期間より前の累積の利用回数の影響が排除されるので、ユーザの興味や関心の対象の変化に応じたシナリオを特定しやすくなるという利点がある。なお、上記実施形態との相違点は、追加対象シナリオを特定する方法のみであり、システムおよび装置の構成は上記実施形態と同様である。
(データベースに格納されるデータ)まず、本実施形態で用いる使用履歴情報について、図8に基づいて説明する。図8は、所定期間におけるシナリオの利用回数の増加量に基づいて、追加対象シナリオを特定する場合に使用するデータの例を示す図である。
同図の(a)に示すように、使用するシナリオは図4の(a)と同様であるが、使用履歴情報について、利用回数が一日毎に集計されている点、および一日当たりの利用回数の増加分が示されている点で図4の(a)と相違している。なお、図8の(a)では、全音声対話装置10の合計利用回数のみを示しているが、各音声対話装置10について、一日当たりの利用回数および増加分が記録される。なお、増加分は計算によって算出可能であるため使用履歴情報から省略してもよい。また、ここでは一日当たりの利用回数を記録する例を示しているが、所定期間は一日に限られず任意である。
また、本実施形態においても、ジャンルを考慮して追加対象シナリオを特定してもよい。この場合、例えば図8の(b)のような、ジャンル毎の問合せ回数の単位期間当たりの増加量を示すテーブルを生成してもよい。
なお、図8に示すデータは、何れも情報処理装置30にて使用されるものであるが、音声対話装置10において、履歴情報記録部17が記録する第1データベース20の使用履歴情報も同様の構成としてもよい。この場合、削除対象特定部19は、所定期間当たりの使用回数の増加分が少ないシナリオを削除対象(上書き対象)のシナリオと特定する。また、履歴情報記録部17が記録する第1データベース20の使用履歴情報については、上記実施形態と同様の構成とし、累計の使用回数が少ないシナリオを削除対象(上書き対象)のシナリオと特定してもよい。
(シナリオ特定処理)続いて、本実施形態におけるシナリオ特定処理について、図9に基づいて説明する。図9は、所定期間におけるシナリオの利用回数の増加量に基づいて追加対象シナリオを特定するシナリオ特定処理の一例を示すフローチャートである。
図9の(a)に示すシナリオ特定処理では、まず、追加対象特定部37は、第2データベース40の使用履歴情報を参照し、所定期間におけるシナリオの利用回数の増加分(増加量)を算出する(S51)。そして、追加対象特定部37は、算出した増加量が閾値以上となるシナリオがあるか否かを判断する(S52)。ここで、閾値以上となるシナリオがないと判断した場合(S52にてNO)、シナリオ特定処理は終了する。
一方、閾値以上となるシナリオがあると判断した場合(S52にてYES)、追加対象特定部37は、増加量が閾値以上のシナリオを追加対象シナリオと特定する(S53)。そして、シナリオが特定されると、更新制御部38は、追加対象特定部37が特定したシナリオを音声対話装置10に送信し(S54)、シナリオ特定処理は終了する。
一方、図9の(b)に示すシナリオ特定処理では、ジャンル毎の利用回数を考慮して追加対象シナリオを特定する。まず、追加対象特定部37は、ジャンル毎の利用回数の増加量を示すテーブル(図8の(b)参照)を作成する(S61)。そして、追加対象特定部37は、S61にて作成したテーブルを参照して、利用回数の増加量が最も多いジャンルを特定する(S62)。
次に、追加対象特定部37は、S62にて特定したジャンルに、利用回数が閾値以上となるシナリオがあるか否かを判断する(S63)。ここでは、音声対話装置10のそれぞれについて、S62にて特定されたジャンルのシナリオから、利用回数(全音声対話装置10の利用回数の合計値)が所定の閾値以上のシナリオを特定する。なお、同図の(a)と同様に、所定期間における利用回数の増加量が閾値以上となるシナリオがあるかを判断してもよい。ここで利用回数の増加量が閾値以上となるシナリオがないと判断した場合(S63にてNO)、シナリオ特定処理は終了する。
一方、利用回数が閾値以上となるシナリオがあると判断した場合(S63にてYES)、追加対象特定部37は、S62にて特定したジャンルのシナリオのうち、利用回数が閾値以上となるシナリオを追加対象シナリオと特定する(S64)。そして、更新制御部38は、追加対象特定部37が特定したシナリオを音声対話装置10に送信し(S65)、シナリオ特定処理は終了する。
なお、S51では、音声対話装置10毎に利用回数の増加量を算出してもよいし、全音声対話装置10の利用回数の増加量の合計値を算出してもよい。同様に、S61では、音声対話装置10毎にジャンル毎の利用回数の増加量を算出してもよいし、全音声対話装置10のジャンル毎の利用回数の増加量の合計値を算出してもよい。
また、所定期間における利用回数の増加量の代わりに、所定期間における利用回数を用いて追加対象シナリオを特定してもよい。この構成であっても、所定期間における利用状況に応じた追加対象シナリオを特定することができる。
〔実施形態3〕
本発明の他の実施形態について、図10に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
本発明の他の実施形態について、図10に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、実施形態1にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
まず、本実施形態の対話システム50eについて図10に基づいて説明する。図10は、対話システム50eを構成する音声対話装置10eの要部構成を示すブロック図である。音声対話装置10eは、追加対象シナリオを特定する機能を備えている点で上記実施形態の音声対話装置10と相違している。図示のように、音声対話装置10eは、第1データベース20eのデータを参照できるようになっており、情報処理装置30eと通信可能となっている。なお、同図には示していないが、情報処理装置30eは第2データベース40を参照することができる。
第1データベース20eには、音声対話装置10eがユーザとの対話に使用する上述のシナリオが格納されていると共に、第2データベース40に格納されているシナリオの使用履歴を示す使用履歴情報が格納されている。音声対話装置10eは、この使用履歴情報を参照して追加対象シナリオを特定する。なお、使用履歴情報はシナリオとは別の記憶装置に格納してもよい。
情報処理装置30eは、情報処理装置30と同様に、音声対話装置10eの要求に従って応答フレーズを送信する。対話システム50eでは、音声対話装置10eが追加対象シナリオを特定する機能を備えているので、情報処理装置30eはこの機能を備えている必要はない。
そして、音声対話装置10eの制御部12には、音声認識部14、応答生成部(応答取得手段)15、音声合成部16、履歴情報記録部17e、更新部(更新手段)18、削除対象特定部(削除対象特定手段)19、および追加対象特定部(追加対象特定手段)22が含まれている。履歴情報記録部17eは、第2データベース40に格納されているシナリオが音声対話装置10eに利用された履歴を示す使用履歴情報を記録する。そして、追加対象特定部22は、該使用履歴情報を参照して追加対象シナリオを特定する。
(対話システムにおける処理の流れ)対話システム50eにおいても、図5に示すような対話処理および応答通知処理が行われる。ここでは、図5を参照して、対話システム50eにおける対話処理および応答通知処理について説明する。なお、図5と同様の処理については説明の詳細を省略する。
まず、情報処理装置30eが実行する応答通知処理では、S23の処理は省略される。そして、S24にて応答フレーズを送信する際に、該応答フレーズに対応するシナリオを示す情報(例えばシナリオのナンバー等、シナリオを一義的に特定できるものであればよい)を音声対話装置10eに通知する。
そして、音声対話装置10eが実行する対話処理では、履歴情報記録部17eが、情報処理装置30eからシナリオを示す情報の受信後(S20以降の任意のタイミング)に、使用履歴情報において、該情報の受信回数をインクリメント(+1)する。なお、該情報が使用履歴情報に含まれていない場合には、該情報を使用履歴情報に追加し、その受信回数を1とする。これにより、シナリオを示す情報と、その情報の受信回数(第2データベース40に格納されている当該シナリオが音声対話装置10eに利用された回数とも言える)とが対応付けられた使用履歴情報が記録される。
なお、使用履歴情報は、第2データベース40に格納されているシナリオの使用履歴を示すものであればよく、この例に限られない。例えば、上記実施形態と同様にして情報処理装置30eが生成した使用履歴情報を取得してもよい。さらに、情報処理装置30eが複数の音声対話装置10eと通信可能である場合、使用履歴情報は、第2データベース40に格納されているシナリオの各音声対話装置10eによる使用回数を示すものであってもよい。この場合、シナリオの使用回数は、各音声対話装置10eについて個別にカウントされていてもよいし、全音声対話装置10eについての合計使用回数がカウントされていてもよい。
(第1データベースの更新)次に、対話システム50eにおいて、第1データベース20eを更新するために行われる処理の流れについて図6を参照して説明する。対話システム50eでは、音声対話装置10eの追加対象特定部22がシナリオ特定処理を実行する。
まず、S31において、追加対象特定部22は、履歴情報記録部17eが記録した使用履歴情報を参照して、第2データベース40に格納されているシナリオが音声対話装置10eに利用された回数を特定する。次に、S32では上記特定した回数と所定の閾値とを比較し、閾値以上となるシナリオがあれば、S33にてそのシナリオを追加対象シナリオと特定する。そして、S34では、上記追加対象シナリオの送信を情報処理装置30eに要求する。情報処理装置30eは、要求された追加対象シナリオを音声対話装置10eに送信するので、この追加対象シナリオを受信した音声対話装置10eでは図6に示す更新処理が行われ、該追加対象シナリオが第1データベース20eに追加される。
(ジャンルを考慮したシナリオ特定処理)また、シナリオ特定処理では、過去に使用されたシナリオのジャンルに基づいて追加対象シナリオを特定してもよい。この場合、音声対話装置10eのユーザが過去に呼びかけた内容に応じたジャンルのシナリオを追加対象シナリオとすればよい。このため、第2データベース40のシナリオの使用履歴情報(情報処理装置30eへの要求により情報処理装置30eにて使用された履歴を示す)と、第1データベース20eのシナリオの使用履歴情報の少なくとも何れかを用いればよい。
この場合、追加対象特定部22は、第1データベース20eおよび/または第2データベース40のシナリオの使用回数をジャンル毎に合計し、合計使用回数が多いジャンルを特定する。そして、追加対象特定部22は、特定したジャンルのシナリオを送信するように情報処理装置30eに要求することにより、当該ジャンルのシナリオを受信する。これにより、受信したシナリオにて第1データベース20eが更新される。
(シナリオ特定処理を行わずに第1データベースを更新する例)次に、シナリオ特定処理を行わずに第1データベース20eを更新する例について説明する。この例では、情報処理装置30eは、図5の応答通知処理のS24において、応答フレーズを送信する代わりに、その応答フレーズを含むシナリオを送信する。そして、音声対話装置10eの更新部18は、受信したシナリオを追加して第1データベース20eを更新する。
この場合、図6の更新処理におけるS36からS38の処理を行って、使用される可能性の低いシナリオを随時削除または上書きすることにより、第1データベース20eに格納されているデータ量が膨大になることを防ぐことが望ましい。
〔ソフトウェアによる実現例〕
音声対話装置10、10eおよび情報処理装置30、30eの制御ブロック(特に制御部12および制御部32に含まれる各ブロック)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
音声対話装置10、10eおよび情報処理装置30、30eの制御ブロック(特に制御部12および制御部32に含まれる各ブロック)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、音声対話装置10、10eおよび情報処理装置30、30eは、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る情報処理装置30は、ユーザからの呼びかけの内容(呼びかけワード)に応じた応答内容(応答フレーズ)を示す対応情報(シナリオ)が格納された第1データベース20を参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置10と通信可能な情報処理装置であって、上記音声対話装置から呼びかけの内容を通知されたときに、上記第1データベースに格納されていない対応情報が格納された第2データベース40を参照して応答内容を特定し、該応答内容で上記音声対話装置に音声出力させる応答通知手段(応答通知部33)と、上記応答通知手段による応答内容の特定に用いられた対応情報の使用履歴を示す使用履歴情報を記録する履歴情報記録手段(履歴情報記録部36)と、上記使用履歴情報を参照して特定された対応情報を、上記音声対話装置に通知して上記第1データベースに追加させる更新制御手段(更新制御部38)とを備える。
本発明の態様1に係る情報処理装置30は、ユーザからの呼びかけの内容(呼びかけワード)に応じた応答内容(応答フレーズ)を示す対応情報(シナリオ)が格納された第1データベース20を参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置10と通信可能な情報処理装置であって、上記音声対話装置から呼びかけの内容を通知されたときに、上記第1データベースに格納されていない対応情報が格納された第2データベース40を参照して応答内容を特定し、該応答内容で上記音声対話装置に音声出力させる応答通知手段(応答通知部33)と、上記応答通知手段による応答内容の特定に用いられた対応情報の使用履歴を示す使用履歴情報を記録する履歴情報記録手段(履歴情報記録部36)と、上記使用履歴情報を参照して特定された対応情報を、上記音声対話装置に通知して上記第1データベースに追加させる更新制御手段(更新制御部38)とを備える。
上記の構成によれば、音声対話装置は、第1データベースの参照では応答内容を特定することができなかった場合に、情報処理装置に要求することにより、応答内容の通知を受け、これを出力して応答することができる。また、使用履歴情報を参照することで特定された対応情報が第1データベースに追加されるので、第2データベースに格納されている対応情報のうち、音声対話装置において使用される可能性の高い対応情報を第1データベースに追加させることが可能になる。
つまり、上記の構成によれば、使用可能性の高い対応情報については、速やかに音声対話装置が参照できるようにすると共に、使用可能性の低い対応情報については、情報処理装置への要求により使用できるようにする。これにより、使用可能性の低い対応情報で第1データベースの容量を増加させることなく、音声対話装置が、情報処理装置を介さずに、第1データベースを参照してユーザに応答を返すことができる可能性を高めることができる。
本発明の態様2に係る情報処理装置は、上記態様1において、上記第2データベースに格納されている対応情報には、該対応情報が予め定められた属性(ジャンル)の何れに該当するかを示す属性情報が対応付けられており、上記履歴情報記録手段は、上記第2データベースに格納されている対応情報が、上記応答通知手段による応答内容の特定に用いられた回数を示す使用履歴情報を記録し、上記使用履歴情報および上記属性情報を参照して特定した上記対応情報の属性毎の使用回数を基準として、上記第1データベースに追加させる対応情報の属性を特定する追加対象特定手段(追加対象特定部37)を備え、上記更新制御手段は、上記第2データベースに格納されている対応情報のうち、上記追加対象特定手段が特定した属性の対応情報を、上記音声対話装置に通知して上記第1データベースに追加させる、構成であってもよい。
上記の構成によれば、対応情報の属性毎の使用回数を基準として、上記第1データベースに追加させる対応情報の属性を特定し、該属性の対応情報を音声対話装置に通知して第1データベースに追加させる。よって、過去の使用回数が多く、今後も使用される可能性が高い属性の対応情報を第1データベースに追加させることができる。また、このように属性に基づいて対応情報を特定することにより、ある音声対話装置が過去に情報処理装置に対して通知したことのない呼びかけ内容に対応する対応情報を、その音声対話装置に送信することができる。したがって、音声対話装置は、初めての呼びかけ内容に対しても、情報処理装置を介することなく速やかに応答を返すことが可能になる。
なお、上記情報処理装置が、複数の音声対話装置と通信可能である場合、各音声対話装置における対応情報の属性毎の使用回数の合計値を基準として属性を特定してもよい。これにより、各音声対話装置で多く使用され、各音声対話装置にて今後使用される可能性が高い属性の対応情報を第1データベースに追加させることができる。
本発明の態様3に係る情報処理装置は、上記態様1において、複数の上記音声対話装置と通信可能であり、上記履歴情報記録手段は、上記応答通知手段による応答内容の特定に用いられた対応情報の使用回数を上記使用履歴情報として記録し、複数の上記音声対話装置の上記使用回数を対応情報毎に合計した合計使用回数を基準として、上記第1データベースに追加させる対応情報を特定する追加対象特定手段を備え、上記更新制御手段は、上記第2データベースに格納されている対応情報のうち、上記追加対象特定手段が特定した対応情報を、複数の上記音声対話装置の一部または全部に通知して各音声対話装置が参照する各第1データベースに追加させる、構成であってもよい。
上記の構成によれば、複数の音声対話装置の対応情報の使用回数を合計した合計使用回数を基準として、第1データベースに追加させる対応情報を特定し、複数の音声対話装置の一部または全部に通知して各第1データベースに追加させる。よって、各音声対話装置で多く使用され、各音声対話装置にて今後使用される可能性が高い対応情報を第1データベースに追加させることができる。また、このように複数の音声対話装置における合計使用回数を用いることにより、ある音声対話装置が過去に情報処理装置に対して通知したことのない呼びかけ内容に対応する対応情報を、その音声対話装置に送信することができる。したがって、音声対話装置は、初めての呼びかけ内容に対しても、情報処理装置を介することなく速やかに応答を返すことが可能になる。
本発明の態様4に係る情報処理装置は、上記態様1において、上記履歴情報記録手段は、上記第2データベースに格納されている対応情報が、上記応答通知手段による応答内容の特定に用いられた回数を示す使用履歴情報を記録し、上記使用履歴情報を参照して特定した所定期間における使用回数、または所定期間における使用回数の増加量を基準として、上記第1データベースに追加させる対応情報を特定する追加対象特定手段を備え、上記更新制御手段は、上記第2データベースに格納されている対応情報のうち、上記追加対象特定手段が特定した対応情報を上記音声対話装置に通知して上記第1データベースに追加させる、構成であってもよい。
上記の構成によれば、所定期間における使用回数、または所定期間における使用回数の増加量を基準として第1データベースに追加させる対応情報を特定し、音声対話装置に通知して第1データベースに追加させる。よって、所定期間に多く使用された対応情報を第1データベースに追加させることができる。なお、所定期間をどのような期間とするかは任意であるが、該期間の終点は、第1データベースに追加させる対応情報を特定する時点と近いことが望ましい。これにより、最近の使用状況に応じた対応情報を特定することができるためである。
本発明の態様5に係る情報処理装置は、上記態様1において、複数の上記音声対話装置と通信可能であり、上記第2データベースに格納されている対応情報には、該対応情報が予め定められた属性の何れに該当するかを示す属性情報が対応付けられており、上記履歴情報記録手段は、上記第2データベースに格納されている対応情報が、上記応答通知手段による応答内容の特定に用いられた回数を複数の上記音声対話装置毎に示す使用履歴情報を記録し、上記使用履歴情報および上記属性情報を参照して特定した上記対応情報の属性毎の使用回数を基準として、複数の上記音声対話装置毎に属性を特定すると共に、複数の上記音声対話装置における合計使用回数を基準として、上記特定した属性の対応情報の中から、上記第1データベースに追加させる対応情報を特定する追加対象特定手段を備え、上記更新制御手段は、上記第2データベースに格納されている対応情報のうち、上記追加対象特定手段が特定した対応情報を、該対応情報の属性が特定された音声対話装置に通知して上記第1データベースに追加させる、構成であってもよい。
上記の構成によれば、対応情報の属性毎の使用回数を基準として、複数の上記音声対話装置毎に属性を特定する。これにより、各音声対話装置において使用される可能性の高い属性の対応情報を特定することができる。
そして、上記の構成によれば、複数の音声対話装置における合計使用回数を基準として上記特定した属性の対応情報を特定し、該対応情報の属性が特定された音声対話装置に通知して第1データベースに追加させる。よって、個別の音声対話装置において使用される可能性の高い属性の対応情報であって、全音声対話装置において多く使用され、個別の音声対話装置においても今後使用される可能性が高い対応情報を、各第1データベースに追加させることができる。
本発明の態様6に係る音声対話装置10eは、ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第1データベース20eを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置であって、上記第1データベースに格納されていない対応情報が格納された第2データベースを参照可能な情報処理装置に要求して、ユーザの呼びかけ内容に応じた応答内容を取得する応答取得手段(応答生成部15)と、上記第2データベースに格納されている対応情報の使用履歴を示す使用履歴情報を参照して、上記第1データベースに追加する対応情報を特定する追加対象特定手段(追加対象特定部22)と、上記追加対象特定手段が特定した対応情報を上記情報処理装置から取得して上記第1データベースに追加する更新手段(更新部18)と、を備える。
上記の構成によれば、第1データベースの参照では応答内容を特定することができなかった場合に、情報処理装置に要求することにより、ユーザの呼びかけ内容に応じた応答内容を取得し、これを出力して応答することができる。また、使用履歴情報を参照することで特定した対応情報を第1データベースに追加するので、第2データベースに格納されている対応情報のうち、音声対話装置において使用される可能性の高い対応情報を第1データベースに追加させることが可能になる。
つまり、上記の構成によれば、使用可能性の高い対応情報については、速やかに音声対話装置が参照できるようにすると共に、使用可能性の低い対応情報については、情報処理装置への要求により使用できるようにする。これにより、使用可能性の低い対応情報で第1データベースの容量を増加させることなく、音声対話装置が、情報処理装置を介さずに、第1データベースを参照してユーザに応答を返すことができる可能性を高めることができる。
なお、第2データベースに格納されている対応情報の使用履歴を示す使用履歴情報は、例えば情報処理装置から応答内容を取得したときに、その応答内容の特定に用いられた対応情報の使用回数をカウントしたものであってもよい。また、例えば、使用履歴情報を情報処理装置から取得してもよい。さらに、情報処理装置が複数の音声対話装置と通信可能である場合、使用履歴情報は、第2データベースに格納されている対応情報の複数の音声対話装置による使用回数を示すものであってもよい。この場合、対応情報の使用回数は、各音声対話装置について個別にカウントされていてもよいし、全音声対話装置についての合計使用回数がカウントされていてもよい。
本発明の態様7に係る音声対話装置は、上記態様6において、上記第1データベースに格納されている対応情報の使用履歴を示す使用履歴情報を参照して、上記第1データベースから削除する対応情報を特定する削除対象特定手段(削除対象特定部19)を備え、上記更新手段は、上記削除対象特定手段が特定した対応情報を上記第1データベースから削除するか、または上記削除対象特定手段が特定した対応情報を、上記追加対象特定手段が特定した対応情報で上書きする、構成であってもよい。
上記の構成によれば、使用履歴情報を参照することで特定した対応情報を第1データベースから削除するか、または上書きする。よって、第1データベースに格納されている対応情報のうち、音声対話装置において使用される可能性の低い対応情報を第1データベースから削除することが可能になる。
本発明の各態様に係る情報処理装置および音声対話装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記情報処理装置または上記音声対話装置が備える各手段として動作させることにより上記情報処理装置または上記音声対話装置をコンピュータにて実現させる上記情報処理装置または上記音声対話装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
本発明は、ユーザの呼びかけに音声で応答する音声対話装置、および情報処理装置を介して音声対話装置に上記の応答を行わせる対話システム等に利用することができる。
10 音声対話装置
20 第1データベース
30 情報処理装置
33 応答通知部(応答通知手段)
36 履歴情報記録部(履歴情報記録手段)
37 追加対象特定部(追加対象特定手段)
38 更新制御部(更新制御手段)
40 第2データベース
10e 音声対話装置
15 応答生成部(応答取得手段)
18 更新部(更新手段)
19 削除対象特定部(削除対象特定手段)
22 追加対象特定部(追加対象特定手段)
20e 第1データベース
30e 情報処理装置
20 第1データベース
30 情報処理装置
33 応答通知部(応答通知手段)
36 履歴情報記録部(履歴情報記録手段)
37 追加対象特定部(追加対象特定手段)
38 更新制御部(更新制御手段)
40 第2データベース
10e 音声対話装置
15 応答生成部(応答取得手段)
18 更新部(更新手段)
19 削除対象特定部(削除対象特定手段)
22 追加対象特定部(追加対象特定手段)
20e 第1データベース
30e 情報処理装置
Claims (5)
- ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第1データベースを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置と通信可能な情報処理装置であって、
上記音声対話装置から呼びかけの内容を通知されたときに、上記第1データベースに格納されていない対応情報が格納された第2データベースを参照して応答内容を特定し、該応答内容で上記音声対話装置に音声出力させる応答通知手段と、
上記応答通知手段による応答内容の特定に用いられた対応情報の使用履歴を示す使用履歴情報を記録する履歴情報記録手段と、
上記使用履歴情報を参照して特定された対応情報を、上記音声対話装置に通知して上記第1データベースに追加させる更新制御手段とを備えることを特徴とする情報処理装置。 - 上記第2データベースに格納されている対応情報には、該対応情報が予め定められた属性の何れに該当するかを示す属性情報が対応付けられており、
上記履歴情報記録手段は、上記第2データベースに格納されている対応情報が、上記応答通知手段による応答内容の特定に用いられた回数を示す使用履歴情報を記録し、
上記使用履歴情報および上記属性情報を参照して特定した上記対応情報の属性毎の使用回数を基準として、上記第1データベースに追加させる対応情報の属性を特定する追加対象特定手段を備え、
上記更新制御手段は、上記第2データベースに格納されている対応情報のうち、上記追加対象特定手段が特定した属性の対応情報を、上記音声対話装置に通知して上記第1データベースに追加させることを特徴とする請求項1に記載の情報処理装置。 - 上記情報処理装置は、複数の上記音声対話装置と通信可能であり、
上記履歴情報記録手段は、上記応答通知手段による応答内容の特定に用いられた対応情報の使用回数を上記使用履歴情報として記録し、
複数の上記音声対話装置の上記使用回数を対応情報毎に合計した合計使用回数を基準として、上記第1データベースに追加させる対応情報を特定する追加対象特定手段を備え、
上記更新制御手段は、上記第2データベースに格納されている対応情報のうち、上記追加対象特定手段が特定した対応情報を、複数の上記音声対話装置の一部または全部に通知して各音声対話装置が参照する各第1データベースに追加させることを特徴とする請求項1に記載の情報処理装置。 - ユーザからの呼びかけの内容に応じた応答内容を示す対応情報が格納された第1データベースを参照し、該ユーザの呼びかけに上記応答内容で応答する音声対話装置であって、
上記第1データベースに格納されていない対応情報が格納された第2データベースを参照可能な情報処理装置に要求して、ユーザの呼びかけ内容に応じた応答内容を取得する応答取得手段と、
上記第2データベースに格納されている対応情報の使用履歴を示す使用履歴情報を参照して、上記第1データベースに追加する対応情報を特定する追加対象特定手段と、
上記追加対象特定手段が特定した対応情報を上記情報処理装置から取得して上記第1データベースに追加する更新手段と、を備えることを特徴とする音声対話装置。 - 請求項1から3のいずれか1項に記載の情報処理装置としてコンピュータを機能させるための制御プログラムであって、コンピュータを上記各手段として機能させるための制御プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014030046A JP6255274B2 (ja) | 2014-02-19 | 2014-02-19 | 情報処理装置、音声対話装置、および制御プログラム |
PCT/JP2015/052016 WO2015125560A1 (ja) | 2014-02-19 | 2015-01-26 | 情報処理装置、音声対話装置、および制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014030046A JP6255274B2 (ja) | 2014-02-19 | 2014-02-19 | 情報処理装置、音声対話装置、および制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015155936A JP2015155936A (ja) | 2015-08-27 |
JP6255274B2 true JP6255274B2 (ja) | 2017-12-27 |
Family
ID=53878074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014030046A Expired - Fee Related JP6255274B2 (ja) | 2014-02-19 | 2014-02-19 | 情報処理装置、音声対話装置、および制御プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6255274B2 (ja) |
WO (1) | WO2015125560A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6651973B2 (ja) * | 2016-05-09 | 2020-02-19 | 富士通株式会社 | 対話処理プログラム、対話処理方法および情報処理装置 |
JP6643468B2 (ja) * | 2016-05-18 | 2020-02-12 | シャープ株式会社 | 応答制御装置、制御プログラム、情報処理方法、および通信システム |
JP6655835B2 (ja) * | 2016-06-16 | 2020-02-26 | パナソニックIpマネジメント株式会社 | 対話処理方法、対話処理システム、及びプログラム |
CN107644641B (zh) * | 2017-07-28 | 2021-04-13 | 深圳前海微众银行股份有限公司 | 对话场景识别方法、终端以及计算机可读存储介质 |
CN109359211B (zh) * | 2018-11-13 | 2024-05-07 | 平安科技(深圳)有限公司 | 语音交互的数据更新方法、装置、计算机设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006277519A (ja) * | 2005-03-30 | 2006-10-12 | Toshiba Corp | 対話装置、対話シナリオ編集装置、対話方法及びプログラム |
JP2008243048A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 対話装置、対話方法及びプログラム |
JP5829000B2 (ja) * | 2008-08-20 | 2015-12-09 | 株式会社ユニバーサルエンターテインメント | 会話シナリオ編集装置 |
JP5756969B2 (ja) * | 2012-02-25 | 2015-07-29 | 株式会社クロダアンドパートナーズ | 3次元フィギアを構成するデータを配信するための方法、システム、サーバ装置、端末装置およびプログラム |
JP5616390B2 (ja) * | 2012-03-27 | 2014-10-29 | ヤフー株式会社 | 応答生成装置、応答生成方法および応答生成プログラム |
-
2014
- 2014-02-19 JP JP2014030046A patent/JP6255274B2/ja not_active Expired - Fee Related
-
2015
- 2015-01-26 WO PCT/JP2015/052016 patent/WO2015125560A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2015125560A1 (ja) | 2015-08-27 |
JP2015155936A (ja) | 2015-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6255274B2 (ja) | 情報処理装置、音声対話装置、および制御プログラム | |
US10034029B1 (en) | Systems and methods for audio object delivery based on audible frequency analysis | |
US11521038B2 (en) | Electronic apparatus and control method thereof | |
JP6317111B2 (ja) | ハイブリッド型クライアントサーバ音声認識 | |
CN104394491B (zh) | 一种智能耳机、云服务器以及音量调节方法和系统 | |
US8938388B2 (en) | Maintaining and supplying speech models | |
US11188289B2 (en) | Identification of preferred communication devices according to a preference rule dependent on a trigger phrase spoken within a selected time from other command data | |
JP6257368B2 (ja) | 情報処理装置 | |
US20160234606A1 (en) | Method for augmenting hearing | |
WO2015098306A1 (ja) | 応答制御装置、制御プログラム | |
US20200034108A1 (en) | Dynamic Volume Adjustment For Virtual Assistants | |
CN105489221A (zh) | 一种语音识别方法及装置 | |
JP5217109B2 (ja) | オペレータ教育支援プログラム、オペレータ教育支援方法及びオペレータ教育支援装置 | |
CN104335559A (zh) | 一种自动调节音量的方法、音量调节装置及电子设备 | |
US8160876B2 (en) | Interactive speech recognition model | |
CN111182390B (zh) | 音量数据处理方法、装置、计算机设备及存储介质 | |
US20230317078A1 (en) | Systems and methods for local interpretation of voice queries | |
JP2014170185A (ja) | 発話コマンド認識システム | |
KR20200050104A (ko) | Tts 서비스 제공 방법 및 이를 위한 중계 서버 | |
JP2020042131A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2018120203A (ja) | 情報処理方法及びプログラム | |
KR20180089242A (ko) | 챗봇에서의 출력 유형에 따라 대화 내용을 생성하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 | |
JP6468069B2 (ja) | 電子機器制御システム、サーバー、及び、端末装置 | |
CN112489644A (zh) | 用于电子设备的语音识别方法及装置 | |
JP2021117245A (ja) | 学習方法、評価装置、データ構造、及び評価システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160923 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6255274 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |