JP7303091B2

JP7303091B2 - 制御装置、電子機器、制御装置の制御方法および制御プログラム

Info

Publication number: JP7303091B2
Application number: JP2019200742A
Authority: JP
Inventors: 文俊田上
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2019-11-05
Filing date: 2019-11-05
Publication date: 2023-07-04
Anticipated expiration: 2039-11-05
Also published as: JP2021076914A

Description

本発明は、応答指示に対して応答する電子機器を制御する制御装置などに関する。

ユーザの発話音声を取得し、当該発話音声の内容に応じた音声を出力する電子機器が従来技術として知られている。また、このような電子機器において、ユーザの発話音声の音声認識および音声合成の少なくとも一方を、電子機器と無線通信可能に接続されたサーバにて実行する従来技術が知られている。

下記特許文献１には、以下の技術が開示されている。すなわち、端末装置の処理能力と、実行する音声応答シナリオとを比較して、端末装置で当該シナリオに基づく音声応答処理を実行できる場合は、当該シナリオに従って端末装置が音声応答処理を実行する。一方、端末装置で当該シナリオに基づく音声応答処理を実行できない場合は、当該シナリオに基づいてサーバが音声出力データを生成し、端末装置へ送信する。

特開２００４－１３３６９９号公報

特許文献１の技術は、端末装置が実行できる音声応答処理はサーバに実行させないことにより、サーバのトラフィックの増大を抑えることができる。しかしながら、特許文献１の技術は、トラフィックの増大が既に発生している状況において端末装置が実行できない音声応答処理が開始された場合、サーバと通信しなければならない。結果として、音声の出力に時間がかかるといった問題が発生し、ユーザの満足度を低下させる虞がある。

この解決策として、サーバを高機能化することが考えられるが、この解決策は、サーバコストの増大を引き起こす。

本発明の一態様は、サーバコストを増大させることなく、サーバトラフィックの増大により通信に支障が出ている状況でもユーザの満足度の低下を抑えた、ユーザへの応答を実現することを目的とする。

上記の課題を解決するために、本発明に係る制御装置は、応答指示に対して応答する電子機器を制御する制御装置であって、上記応答指示を取得した場合、上記電子機器とサーバとの間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定部と、上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置に記憶されている上記応答データに基づく応答を上記電子機器から出力させる出力制御部と、を備えている構成である。

また、上記の課題を解決するために、本発明に係る制御装置は、応答指示に対して応答する電子機器を制御する制御装置であって、上記応答に対するユーザからの入力に基づく入力データを取得する取得部と、上記入力データを、上記電子機器とサーバとの間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングで上記サーバへ送信し、上記入力データに基づいて生成された、応答指示に対して応答するための応答データを上記サーバから受信する通信制御部と、上記応答データの受信以降の応答指示に対して、当該応答データに基づく応答を上記電子機器から出力させる出力制御部と、を備えている構成である。

また、上記の課題を解決するために、本発明に係る電子機器は、少なくとも１つの出力装置と、少なくとも１つの制御装置とを備え、応答指示に対して応答する電子機器であって、上記制御装置は、上記応答指示を取得した場合、上記電子機器とサーバとの間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定処理と、上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置に記憶されている上記応答データに基づく応答を上記出力装置から出力させる出力制御処理と、を行う構成である。

また、上記の課題を解決するために、本発明に係る電子機器は、少なくとも１つの出力装置と、少なくとも１つの制御装置とを備え、応答指示に対して応答する電子機器であって、上記制御装置は、上記応答に対するユーザからの入力に基づく入力データを取得する取得処理と、上記電子機器とサーバとの間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングで、上記入力データを上記サーバへ送信し、上記入力データに基づいて生成された、応答指示に対して応答するための応答データを上記サーバから受信する通信制御処理と、上記応答データの受信以降の応答指示に対して、当該応答データに基づく応答を上記電子機器から出力させる出力制御処理と、を行う構成である。

また、上記の課題を解決するために、本発明に係る制御装置の制御方法は、ユ応答指示に対して応答する電子機器を制御する制御装置の制御方法であって、上記応答指示を取得した場合、上記電子機器とサーバとの間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定ステップと、上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置に記憶されている上記応答データに基づく応答を上記電子機器から出力させる出力制御ステップと、を含む方法である。

また、上記の課題を解決するために、本発明に係る制御装置の制御方法は、応答指示に対して応答する電子機器を制御する制御装置の制御方法であって、上記応答に対するユーザからの入力に基づく入力データを取得する取得ステップと、上記電子機器とサーバとの間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングで、上記入力データを上記サーバへ送信し、上記入力データに基づいて生成された、応答指示に対して応答するための応答データを上記サーバから受信する通信制御ステップと、上記応答データの受信以降の応答指示に対して、当該応答データに基づく応答を上記電子機器から出力させる出力制御ステップと、を含む方法である。

本発明の一態様によれば、サーバコストを増大させることなく、サーバトラフィックの増大により通信に支障が出ている状況でもユーザの満足度の低下を抑えた、ユーザへの応答を実現することができる。

実施形態１に係るロボットの要部構成の一例を示すブロック図である。図１に示すロボットが備える記憶部に記憶されているシナリオＤＢおよび出力音声ＤＢの一具体例を示す図である。図１に示すロボットが備える制御部が実行する、音声応答処理の流れの一例を示すフローチャートである。オフライン処理の一具体例を示す図である。オンライン処理の一具体例を示す図である。実施形態２に係るロボットの要部構成の一例を示すブロック図である。図６に示すロボットが備える記憶部に記憶されているＤＬシナリオＤＢおよびＤＬ出力音声ＤＢの一具体例を示す図である。図６に示すロボットが備える制御部が実行する、音声応答処理の流れの一例を示すフローチャートである。図６に示すロボットが備える制御部が実行する、応答音声データ受信処理の流れの一例を示すフローチャートである。応答音声データ受信処理の一具体例を示す図である。図１０に示す応答音声データ受信処理の後の、音声応答処理の一具体例を示す図である。実施形態３に係るロボットの要部構成の一例を示すブロック図である。図１２に示すロボットが備える制御部が実行する、音声応答処理の流れの一例を示すフローチャートである。実施形態３に係るロボットの要部構成の一例を示すブロック図である。図１４に示すロボットが備える制御部が実行する、音声応答処理の流れの一例を示すフローチャートである。

〔実施形態１〕
以下、本発明の一実施形態について、詳細に説明する。図１は、実施形態１に係るロボット１（電子機器）の要部構成の一例を示すブロック図である。

本実施形態に係るロボット１は、ユーザからの応答指示に対して応答する。具体的には、ロボット１は、当該応答指示に対して音声を出力することにより応答（すなわち、音声応答）する。また、ロボット１は、ユーザの発話音声を取得し、当該発話音声に対して音声応答する。これにより、ユーザとロボット１とが、あたかも会話を行なっているかのような状況を作ることができる。なお、以降、この状況をユーザとロボット１との「会話」と表現する場合がある。

（ロボット１の要部構成）
図１は、本実施形態に係るロボット１の要部構成の一例を説明するブロック図である。

図１に示すように、ロボット１は制御部１０（制御装置）、記憶部１１（応答データ記憶装置）、操作入力部１２、通信部１３、音声出力部１４（出力装置）および音声入力部１５を備える。

制御部１０は、ロボット１の各部を統括して制御する。記憶部１１は、ロボット１が使用するプログラムおよびデータを永続的に保持するハードウェアであり、ストレージと表現することもできる。記憶部１１は、例えば、ＲＯＭ（Read-Only Memory）、ハードディスク装置、フラッシュメモリ、その他の不揮発性記憶装置として実現される。記憶部１１は、図１に示すように、少なくともシナリオＤＢ１１１および出力音声ＤＢ１１２を記憶している。これらの詳細については後述する。

なお、記憶部１１は、メモリカードのように着脱可能な記憶装置として実現されてもよい。また、ロボット１に内蔵されたストレージの代わりに、外部の記憶装置に保存されているプログラムおよびデータを使用する構成が使用されてもよい。

操作入力部１２は、ロボット１に対する各種操作の入力を受け付ける。操作入力部１２は、例えば、ユーザによる押下操作を受け付けるボタンであってもよいが、この例に限定されない。操作入力部１２は、例えば、タッチパネルであってもよい。操作入力部１２は、受け付けた操作を示す操作信号を制御部１０へ出力する。本実施形態に係る操作入力部１２は、ロボット１に音声出力を開始させるための開始ボタンを含む。つまり、開始ボタンの押下操作による操作信号が、ユーザからロボット１への応答指示である。

通信部１３は、他の装置との無線通信を行う。すなわち、通信部１３は、制御部１０から取得した各種情報の、他の装置への送信と、他の装置からの各種情報の受信および当該情報の制御部１０への出力とを行う。他の装置は、例えば、図１に示すサーバ２であるが、この例に限定されない。ロボット１とサーバ２との間で送受信される情報の詳細については後述する。

音声出力部１４は、制御部１０により制御され、音声データに基づく音声を出力する、いわゆるスピーカである。音声入力部１５は、ロボット１の周囲で発せられた音声を取得し、音声データに変換して制御部１０へ出力する、いわゆるマイクである。

続いて、サーバ２について説明する。サーバ２は、ロボット１による音声出力に使用される音声データを生成する。具体的には、サーバ２は、ロボット１から、ユーザが発話した音声の音声データを受信する。そして、サーバ２は、当該音声データに対して音声認識処理を行い、音声認識処理の結果に基づき、音声合成処理を行う。そして、音声合成処理により生成された音声データ、すなわち、ユーザの発話に対してロボット１が応答するために使用される応答音声データ（応答データ）を、ロボット１へ送信する。なお、サーバ２は一例として、既知の音声認識処理および音声合成処理を実行する。

続いて、制御部１０の詳細を説明する。図示してはいないが、ロボット１は、一例として、制御部１０を実現するためのハードウェア構成として、さらに、プロセッサおよびメモリを備えている。プロセッサは、ロボット１に与えられる信号に基づいて、あるいは、予め定められた条件が成立したことに基づいて、メモリまたは記憶部１１に格納されているプログラムに含まれる一連の命令を実行する。プロセッサは、一例として、ＣＰＵ（Central Processing Unit）として実現される。あるいは、プロセッサは、ＧＰＵ（Graphics Processing Unit）、ＭＰＵ（Micro Processor Unit）、ＦＰＧＡ（Field-Programmable Gate Array）その他のデバイスとして実現されてもよい。メモリは、プログラムおよびデータを一時的に保存する。プログラムは、例えば、記憶部１１からロードされる。データは、ロボット１に入力されたデータと、プロセッサによって生成されたデータとを含む。メモリは、一例として、ＲＡＭ（Random Access Memory）その他の揮発性メモリとして実現される。

一例として、プロセッサは、記憶部１１にアクセスし、記憶部１１に格納されているプログラムをメモリにロードし、当該プログラムに含まれる一連の命令を実行する。これにより、制御部１０に含まれている各部が構成される。

当該各部として、制御部１０は、操作信号受付部１０１、通信制御部１０２、音声処理部１０３、音声出力制御部１０４（出力制御部）および音声入力受付部１０５を含んでいる。

操作信号受付部１０１は、操作入力部１２から出力された操作信号を受け付ける。一例として、操作信号受付部１０１は、開始ボタンが押下されたことに基づく操作信号を受け付ける。操作信号受付部１０１は、受け付けた当該操作信号を通信制御部１０２へ出力する。

通信制御部１０２は、通信部１３による情報の送受信を制御する。具体的には、通信制御部１０２は、他の装置（例えばサーバ２）へ送信すべき情報を取得すると、通信部１３を介して当該情報を他の装置へ送信する。また、通信制御部１０２は、他の装置から送信された情報を、通信部１３を介して取得する。通信制御部１０２は、取得した当該情報を制御部１０内の各部へ出力する。

通信制御部１０２は、通信制限判定部２０１（判定部）を含む。通信制限判定部２０１は、ロボット１とサーバ２との間の通信において、トラフィック量に基づく制限（すなわち通信制限）が発生しているか否かを判定する。

具体的には、通信制限判定部２０１は、サーバ２へ、アクセス要求を送信する。ここで、アクセス要求とは、ロボット１とサーバ２との通信を確立するための要求である。

サーバ２は、アクセス要求を受信すると、当該ロボット１のライセンス数と、現在のアクセス数とを比較する。ライセンス数とは、サーバ２へ同時に通信（アクセス）可能な装置の上限数である。当該装置は、例えばロボット１であるが、他の、音声出力機能を備えた装置を含んでもよい。アクセス数とは、サーバ２と現在通信が確立している装置の数である。

サーバ２は、アクセス数がライセンス数に達していない場合、アクセス許可応答をロボット１へ送信する。アクセス許可応答とは、ロボット１とサーバ２との通信を確立したことを示す応答である。一方、サーバ２は、アクセス数がライセンス数に達している場合、アクセス不可応答をロボット１へ送信する。アクセス不可応答とは、ロボット１とサーバ２との通信を確立できない、すなわち、通信制限が発生していることを示す応答である。

通信制限判定部２０１は、受信した応答が、アクセス許可応答およびアクセス不可応答の何れであるかを判定し、判定結果を音声処理部１０３へ出力する。

音声処理部１０３は、音声出力のための音声データに関する音声データ処理を行う。音声処理部１０３は、オフライン処理部３０１およびオンライン処理部３０２を含む。オフライン処理部３０１は、アクセス不可応答であるとの判定結果を取得した場合に、ロボット１とサーバ２との通信を含まない音声データ処理を行う。オンライン処理部３０２は、アクセス許可応答であるとの判定結果を取得した場合に、ロボット１とサーバ２との通信を含む音声データ処理を行う。

具体的には、オフライン処理部３０１は、記憶部１１に記憶されているデータを用いて、音声データ処理を行う。

図２は、記憶部１１に記憶されているシナリオＤＢ１１１および出力音声ＤＢ１１２の一具体例を示す図である。シナリオＤＢ１１１は、１以上のシナリオを格納するデータベースである。ここで、シナリオとは、ロボット１とユーザとの会話における、ロボット１の処理の流れを規定するデータである。

図２の例では、シナリオＤＢ１１１に格納されているシナリオとして、シナリオ００１およびシナリオ００２を示している。なお、これらのシナリオは一例であり、シナリオＤＢ１１１に格納されているシナリオの種類および数は、図２の例に限定されない。

シナリオ００１は、音声データ００１＿１を再生し、ユーザ音声を取得し、音声データ００１＿２を再生して処理が終了することを示している。すなわち、シナリオ００１は、音声データ００１＿１に基づく音声を出力した後、ユーザの発話を待機し、ユーザの発話音声を取得した後、音声データ００１＿２に基づく音声を出力するという処理の流れを示している。

シナリオ００２は、音声データ００２＿１を再生し、ユーザ音声を取得し、音声データ００１＿２を再生して処理が終了することを示している。すなわち、シナリオ００２は、音声データ００２＿１に基づく音声を出力した後、ユーザの発話を待機し、ユーザの発話音声を取得した後、音声データ００１＿２に基づく音声を出力するという処理の流れを示している。

出力音声ＤＢ１１２は、ロボット１の音声出力に使用される１以上の音声データ（応答データ）を格納するデータベースである。図２の例では、出力音声ＤＢ１１２に格納されている音声データとして、音声データ００１＿１、音声データ００１＿２および音声データ００２＿１を示している。なお、これらの音声データは一例であり、出力音声ＤＢ１１２に格納されている音声データの種類および数は、図２の例に限定されない。

音声データ００１＿１は、「ねえねえ、好きな芸能人は誰？」という音声を出力するための音声データである。音声データ００１＿２は、「そっかー。またいろいろ教えてね」という音声を出力するための音声データである。音声データ００２＿１は、「ねえねえ、好きな食べ物は何？」という音声を出力するための音声データである。

オフライン処理部３０１は、シナリオＤＢ１１１からいずれかのシナリオを読み出す。オフライン処理部３０１は、例えば、シナリオＤＢ１１１からランダムにいずれかのシナリオを読み出す。そして、オフライン処理部３０１は、読み出したシナリオ（以下、使用シナリオと称する）にて使用される音声データを、出力音声ＤＢ１１２から読み出す。そして、オフライン処理部３０１は、読み出した音声データのうち、使用シナリオにて最初に出力するよう規定されている音声データを、音声出力制御部１０４へ出力する。

使用シナリオにて、ユーザの発話音声の取得が規定されている場合、オフライン処理部３０１は、音声入力受付部１０５に対し、音声入力部１５をＯＮにするよう指示し、ユーザの発話音声の音声データの取得を待機する。当該音声データを取得すると、オフライン処理部３０１は、使用シナリオにて、発話音声の取得後に音声の出力が規定されている場合、当該音声の出力のための音声データを、音声出力制御部１０４へ出力する。このように、オフライン処理部３０１は、使用シナリオが示す一連の処理が終了するまで、使用シナリオに従って処理を実行する。

例えば、使用シナリオがシナリオ００１である場合、ロボット１とユーザとは、ロボット１「ねえねえ、好きな芸能人は誰？」、ユーザ「（発話）」、ロボット１「そっかー。またはいろいろ教えてね」との会話を行うこととなる。

また、使用シナリオがシナリオ００２である場合、ロボット１とユーザとは、ロボット１「ねえねえ、好きな食べ物は何？」、ユーザ「（発話）」、ロボット１「そっかー。またはいろいろ教えてね」との会話を行うこととなる。

オンライン処理部３０２は、アクセス許可応答であるとの判定結果を取得すると、一例として、会話開始音声データを出力音声ＤＢ１１２から読み出し、音声出力制御部１０４へ出力する。ここで、会話開始音声データとは、ユーザとの会話を開始するための音声の出力に使用される音声データである。会話開始音声データは、例えば、音声データ００１＿１や音声データ００２＿１であってもよい。会話開始音声データが出力音声ＤＢ１１２に複数格納されている場合、オンライン処理部３０２は、いずれの音声データを使用するかをランダムに選択してもよい。また、会話開始音声データは、例えば、「何か用かな？」との音声を出力するための音声データであってもよい。

オンライン処理部３０２は、会話開始音声データを音声出力制御部１０４へ出力すると、音声入力受付部１０５に対し、音声入力部１５をＯＮにするよう指示し、ユーザの発話音声の音声データの取得を待機する。当該音声データを取得すると、オンライン処理部３０２は、一例として、当該音声データを通信制御部１０２へ出力する。

通信制御部１０２は、取得した音声データをサーバ２へ送信し、サーバ２から応答音声データを受信する。通信制御部１０２は、受信した応答音声データをオンライン処理部３０２へ出力する。

オンライン処理部３０２は、取得した応答音声データを音声出力制御部１０４へ出力する。オンライン処理部３０２は、ユーザの発話音声の音声データの待機から、応答音声データの音声出力制御部１０４への出力までを、会話が終了するまで繰り返す。

オンライン処理部３０２は、例えば、以下の方法で会話の終了を検知する。サーバ２は、ロボット１から受信した音声データへの音声認識処理により、ユーザが会話終了のためのキーワードを発話しているか否かを判定する。当該キーワードは、例えば、「ありがとう」、「バイバイ」などであるが、この例に限定されない。

キーワードを発話していると判定した場合、サーバ２は、会話終了を示す情報をロボット１へ送信する。通信制御部１０２は、当該情報をオンライン処理部３０２へ出力する。これにより、オンライン処理部３０２は、会話の終了を検知することができる。なお、サーバ２は、当該情報とともに、応答音声データを送信してもよい。当該応答音声データは、例えば、「バイバイ」といった、会話を終了させる音声を出力するためのデータである。

音声出力制御部１０４は、取得した音声データに基づく音声を音声出力部１４から出力させる。上述したとおり、音声出力制御部１０４は、音声処理部１０３がアクセス不可応答を取得した場合、記憶部１１に記憶されている音声データに基づく音声を音声出力部１４から出力させる。一方、音声出力制御部１０４は、音声処理部１０３がアクセス許可応答を取得した場合、サーバ２から受信した音声データ（応答音声データ）に基づく音声を音声出力部１４から出力させる。

音声入力受付部１０５は、音声入力部１５から音声データを取得し、音声処理部１０３へ出力する。音声入力受付部１０５は、音声処理部１０３からの指示に従い、音声入力部１５をＯＮにする。これにより、音声入力部１５はユーザの発話の音声を取得し、音声データ（入力データ）に変換して音声入力受付部１０５へ出力することができる。

なお、ロボット１は、音声認識処理および音声合成処理を実行する機能を有していない。このように構成することで、ロボット１の製造コストを下げることができる。

（音声応答処理の流れ）
図３は、制御部１０が実行する、音声応答処理の流れの一例を示すフローチャートである。

操作信号受付部１０１は、操作入力部１２から出力された、開始ボタンが押下されたことに基づく操作信号（以下、開始信号と称する）を受け付ける。（ステップＳ１、以下、「ステップ」を省略）。操作信号受付部１０１は、受け付けた開始信号を、通信制御部１０２へ出力する。

通信制限判定部２０１は、開始信号を取得すると、アクセス要求をサーバ２へ送信する（Ｓ２）。そして、通信制限判定部２０１は、サーバ２からの応答を待機する状態となる。通信制限判定部２０１は受信した当該応答がアクセス不可応答およびアクセス許可応答の何れであるかを判定し（Ｓ３、判定ステップ）、判定結果を音声処理部１０３へ出力する。

音声処理部１０３は、アクセス不可応答であるとの判定結果を場合（Ｓ３でＹＥＳ）、オフライン処理部３０１は、シナリオＤＢ１１１からいずれかのシナリオを読み出す（Ｓ４）。そして、オフライン処理部３０１は、読み出したシナリオ（使用シナリオ）にて使用される音声データを、出力音声ＤＢ１１２から読み出す。そして、オフライン処理部３０１は、選択したシナリオに含まれる音声データを、音声出力制御部１０４へ出力する。

音声出力制御部１０４は、取得した音声データに基づく音声を音声出力部１４に出力させる（Ｓ５、出力制御ステップ）。すなわち、音声出力制御部１０４は、使用シナリオに含まれる音声データに基づく音声を出力させる。なお、以降、ステップＳ４およびＳ５の処理を、「オフライン処理」と称する場合がある。

図４は、オフライン処理の一具体例を示す図である。すなわち、図４は、ロボット１がサーバ２へアクセス要求を送信した結果、アクセス数がライセンス数に到達していたことにより、アクセス不可応答を受信した場合の、ロボット１とユーザ９との会話の一具体例である。

図４に示すように、オフライン処理の場合、ロボット１は、ユーザ９との会話を実現する際、サーバ２との通信を行わない。図４の例では、オフライン処理部３０１は、記憶部１１に記憶されているシナリオＤＢ１１１から、シナリオ００１を選択している。オフライン処理部３０１は、シナリオ００１に従い、音声データ００１＿１および音声データ００１＿２を記憶部１１から読み出す。そして、オフライン処理部３０１は、シナリオ００１に従い、音声データ００１＿１を音声出力制御部１０４へ出力する。これにより、音声出力制御部１０４は、音声データ００１＿１に基づく音声を、音声出力部１４から出力させる。すなわち、ロボット１は、図４に示すように、「ねえねえ、好きな芸能人は誰？」と発話する。

このように、オフライン処理によりユーザ９との会話を実現する場合、ロボット１は、開始ボタンが押下されると、例えば、ユーザ９が発話する前に具体的な質問の音声を出力する。これにより、ユーザ９が、オフライン処理では対応できない質問などを発話することを防ぐことができる。

ロボット１の発話に対し、ユーザ９は、図４に示すように、「〇〇だよ」と発話したとする。音声入力受付部１０５は、音声入力部１５から当該発話の音声データを取得し、オフライン処理部３０１へ出力する。オフライン処理部３０１は、音声データの取得をトリガとして、シナリオ００１に従い、音声データ００１＿２を音声出力制御部１０４へ出力する。これにより、音声出力制御部１０４は、音声データ００１＿２に基づく音声を、音声出力部１４から出力させる。すなわち、ロボット１は、「そっかー。また色々教えてね」と発話し、会話を終了させる。

このように、オフライン処理によりユーザ９との会話を実現する場合、ロボット１は、ユーザ９がどのような発話を行ったとしても会話が成り立つような音声（「そっかー。また色々教えてね」）を出力する。つまり、シナリオ００１の例の場合、ユーザ９が好きな芸能人として誰を答えたとしても、ロボット１はサーバ２と通信することなく会話を成り立たせることができる。

また、当該音声は、会話を終了させるニュアンスを含んでいる。これにより、ユーザ９がさらに発話することにより、オフライン処理では対応できない質問などが行われることを防ぐことができる。

オフライン処理部３０１は、例えば、使用シナリオに規定されている音声データに基づく音声の出力がすべて終了した場合、音声入力受付部１０５に、音声入力部１５をＯＦＦにするよう指示してもよい。これにより、音声入力受付部１０５は、音声入力部１５をＯＦＦにし、ユーザ９の発話の音声を取得しないようにする。

なお、ロボット１は、「そっかー。また色々教えてね」との音声を出力することにより、ユーザ９が、質問（「ねえねえ、好きな芸能人は誰？」）への回答ではない発話をした場合であっても、会話を成り立たせることができる。具体的には、このような場合は、当該音声が、「質問には答えてくれなかったけど、次は答えてほしい」というニュアンスを含むこととなるので、ロボット１とユーザ９との会話が成り立つ。

また、オフライン処理部３０１は、音声データ００１＿１に基づく音声の出力後、所定時間経過してもユーザ９の発話の音声データを取得しない場合、シナリオ００１に従い、音声データ００１＿２を音声出力制御部１０４へ出力してもよい。換言すれば、ロボット１は、ユーザ９が質問に対し、何ら発話しなかったとしても、「そっかー。また色々教えてね」との音声を出力してもよい。この場合も、当該音声が、「質問には答えてくれなかったけど、次は答えてほしい」というニュアンスを含むこととなるので、ロボット１とユーザ９との会話が成り立つ。

図３を再度参照し、音声応答処理の説明に戻る。アクセス不可応答でないとの判定結果を取得した場合（Ｓ３でＮＯ）、すなわち、アクセス許可応答であるとの判定結果を取得した場合、オンライン処理部３０２は、会話開始音声データを出力音声ＤＢ１１２から読み出し、音声出力制御部１０４へ出力する。音声出力制御部１０４は、取得した会話開始音声データに基づく会話開始音声を、音声出力部１４に出力させる（Ｓ６）。そして、オンライン処理部３０２は、ユーザの発話音声の音声データの取得を待機する状態となる。

音声入力受付部１０５は、音声入力部１５から当該音声データを取得する（Ｓ７）と、オンライン処理部３０２へ出力する。オンライン処理部３０２は、当該音声データを通信制御部１０２へ出力する。通信制御部１０２は、取得した音声データをサーバ２へ送信し（Ｓ８）、サーバ２から応答音声データを受信する（Ｓ９）。通信制御部１０２は、受信した応答音声データをオンライン処理部３０２へ出力する。

オンライン処理部３０２は、取得した応答音声データを音声出力制御部１０４へ出力する。音声出力制御部１０４は、取得した応答音声データに基づく音声を、音声出力部１４に出力させる（Ｓ１０、出力制御ステップ）。

オンライン処理部３０２は、会話の終了を検知するまで（Ｓ１１でＮＯ）、ステップＳ７からＳ１０までの処理を繰り返す。なお、以降、ステップＳ６からＳ１１までの処理を、「オンライン処理」と称する場合がある。

図５は、オンライン処理の一具体例を示す図である。すなわち、図５は、ロボット１がサーバ２へアクセス要求を送信した結果、アクセス数がライセンス数に到達していなかったことにより、アクセス許可応答を受信した場合の、ロボット１とユーザ９との会話の一具体例である。

なお、図５の例において、会話開始音声の音声データは、音声データ００１＿１、すなわち、図５に示す「ねえねえ、好きな芸能人は誰？」との音声の音声データであるとする。

ロボット１の会話開始音声の出力に対し、ユーザ９は、図５に示すように、「〇〇だよ」と発話したとする。音声入力受付部１０５は、音声入力部１５から当該発話の音声データを取得し、オンライン処理部３０２へ出力する。オンライン処理部３０２は、当該音声データを通信制御部１０２へ出力し、通信制御部１０２は、当該音声データをサーバ２へ送信する。

サーバ２は、音声データを受信すると音声認識処理を行い、当該処理の結果に基づき、音声合成用データを取得する。一例として、サーバ２は、音声認識処理により取得した単語（図５の例では「○○」）を、検索エンジンを用いて検索することにより、当該単語に関連するデータを音声合成用データとして取得する。図５の例では、音声合成用データとして、「○○は××のメンバーである」とのデータを取得したものとする。

サーバ２は、取得した音声合成用データに基づき、音声合成処理を行う。図５の例では、「○○は、××のメンバーだよね。」との音声を出力するための音声データを生成する。そして、サーバ２は、当該音声データを応答音声データとしてロボット１へ送信する。

ロボット１の通信制御部１０２は、受信した応答音声データをオンライン処理部３０２へ出力する。オンライン処理部３０２は、取得した応答音声データを音声出力制御部１０４へ出力する。音声出力制御部１０４は、取得した応答音声データに基づく音声を、音声出力部１４に出力させる。これにより、図５に示すように、ロボット１が、「○○は、××のメンバーだよね。」と発話する。

（効果）
以上のとおり、本実施形態に係る制御部１０は、ユーザからの応答指示に対して音声応答するロボット１を制御する。制御部１０は、上記応答指示を取得した場合、ロボット１とサーバ２との間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する通信制限判定部２０１を備えている。また、制御部１０は、音声出力制御部１０４を備えている。音声出力制御部１０４は、上記制限が発生していないと判定された場合、サーバ２から受信した、上記応答指示に対して応答するための音声データに基づき、上記応答指示に対する音声応答をロボット１から出力させる。一方、音声出力制御部１０４は、上記制限が発生していると判定された場合、記憶部１１に記憶されている音声データに基づく音声応答をロボット１から出力させる。

また、本実施形態に係る発明について、以下のように表現することもできる。すなわち、本実施形態に係るロボット１は、音声出力部１４と、制御部１０とを備え、ユーザからの応答指示に対して音声応答する。制御部１０は、上記応答指示を取得した場合、ロボット１とサーバ２との間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定処理を行う。そして、制御部１０は、以下に示す出力制御処理を行う。すなわち、制御部１０は、上記制限が発生していないと判定された場合、サーバ２から受信した、上記応答指示に対して応答するための音声データに基づき、上記応答指示に対する音声応答をロボット１から出力させる。一方、音声出力制御部１０４は、上記制限が発生していると判定された場合、記憶部１１に記憶されている音声データに基づく音声応答をロボット１から出力させる。

また、本実施形態に係る発明について、以下のように表現することもできる。すなわち、ユーザからの応答指示に対して音声応答するロボット１を制御する制御部１０の制御方法は、上記応答指示を取得した場合、ロボット１とサーバ２との間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定ステップを含む。また、当該制御方法は、以下に示す出力制御ステップを含む。すなわち、出力制御ステップにおいては、上記制限が発生していないと判定された場合、サーバ２から受信した、上記応答指示に対して音声応答するための音声データに基づき、上記応答指示に対する音声応答をロボット１から出力させる。一方、上記制限が発生していると判定された場合、記憶部１１に記憶されている上記音声データに基づく音声応答をロボット１から出力させる。

上記の構成によれば、通信制限が発生していると判定している場合は、サーバと異なる装置（例えば、ロボット１自体）に記憶されている音声データに基づく音声応答を出力させる。このため、通信制限が発生しているサーバ２と通信することなく、応答指示に対して音声応答することができる。

制御部１０は、例えば、アクセス数がライセンス数に到達しているか否かを判定することにより、トラフィック量に基づく制限が発生しているか否かを判定する。通信制限を発生させないようにするためには、例えば、ライセンス数を増加させることが一案であるが、ライセンス数が増加すると、サーバコストも増加する。

これに対し、上記の構成によれば、アクセス数がライセンス数に到達している場合は、これ以上ロボット１とサーバ２との通信は発生しない。そして、上述したとおり、ロボット１は、通信制限が発生しているサーバ２と通信することなく、応答指示に対して音声応答することができる。よって、サーバコストを増大させることなく、サーバトラフィックの増大により通信に支障が出ている状況でもユーザの満足度の低下を抑えた、ユーザへの音声応答を実現することができる。

〔実施形態２〕
本発明の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
（ロボット１ａの要部構成）
図６は、本実施形態に係るロボット１ａの要部構成の一例を示すブロック図である。図６に示すロボット１ａが、上述した実施形態１にて説明したロボットと異なる点は、制御部１０に代えて制御部１０ａを備えている点である。

制御部１０ａが、制御部１０と異なる点は、録音部１０６（入力データ記憶部）を新たに備える点である。

録音部１０６は、音声入力受付部１０５から取得した音声データ、すなわち、ユーザが発話した音声の音声データを記憶部１１に記憶する。具体的には、録音部１０６は、音声入力受付部１０５（取得部）から音声データを取得すると、記憶部１１（入力データ記憶装置）の発話音声ＤＢ１１３に格納する。発話音声ＤＢ１１３は、ユーザが発話した音声の音声データを格納するデータベースである。

本実施形態に係るオンライン処理部３０２は、実施形態１で説明した機能に加え、以下の機能を有する。すなわち、オンライン処理部３０２は、ロボット１ａとサーバ２との間に通信制限が発生していない可能性が高い所定のタイミングで、発話音声ＤＢ１１３に格納されている音声データを読み出し、通信制御部１０２へ出力する。

なお、「通信制限が発生していない可能性が高い所定のタイミング」とは、例えば、サーバ２へのアクセス数がライセンス数に達していない可能性が高いタイミングであり、具体的には、深夜における所定のタイミング（時刻）であるが、この例に限定されない。

通信制御部１０２は、取得した音声データをサーバ２へ送信する。そして、通信制御部１０２は、サーバ２から、応答音声データおよびシナリオを受信する。通信制御部１０２は、受信した応答音声データおよびシナリオを音声処理部１０３へ出力する。当該応答音声データは、サーバ２へ送信した音声データ、すなわち、ユーザの発話音声の音声データに基づいて、サーバ２により生成された音声データである。当該シナリオは、受信した応答音声データに基づく音声の出力を規定するシナリオである。

本実施形態に係るオフライン処理部３０１（応答データ記憶部、使用判定部）は、実施形態１で説明した機能に加え、以下の機能を有する。すなわち、オフライン処理部３０１は、通信制御部１０２から取得した音声データを、ＤＬ出力音声ＤＢ１１２Ａに格納する。また、オフライン処理部３０１は、通信制御部１０２から取得したシナリオを、ＤＬシナリオＤＢ１１１Ａに格納する。

なお、以降、上記所定のタイミングにてサーバ２から受信したシナリオおよび応答音声データを、「ＤＬシナリオ」および「ＤＬ音声データ」と称する場合がある。

ＤＬシナリオＤＢ１１１Ａは、ＤＬシナリオを格納するデータベースである。一例として、ＤＬシナリオＤＢ１１１Ａは、図６に示すように、シナリオＤＢ１１１に含まれるものであるが、この例に限定されない。例えば、ＤＬシナリオＤＢ１１１Ａは、シナリオＤＢ１１１と異なるデータベースであってもよい。

ＤＬ出力音声ＤＢ１１２Ａは、ＤＬ音声データを格納するデータベースである。ＤＬ音声データは、オフライン処理に用いられる応答音声データである。一例として、ＤＬ出力音声ＤＢ１１２Ａは、図６に示すように、出力音声ＤＢ１１２に含まれるものであるが、この例に限定されない。例えば、ＤＬ出力音声ＤＢ１１２Ａは、出力音声ＤＢ１１２と異なるデータベースであってもよい。

図７は、ＤＬシナリオＤＢ１１１ＡおよびＤＬ出力音声ＤＢ１１２Ａの一具体例を示す図である。

図７の例では、ＤＬシナリオＤＢ１１Ａに格納されているＤＬシナリオとして、シナリオ０１１を示している。なお、このシナリオは一例であり、ＤＬシナリオＤＢ１１１Ａに格納されているＤＬシナリオの種類および数は、図７の例に限定されない。

シナリオ０１１は、音声データ０１１＿１を再生して処理が終了することを示している。

また、図７の例では、ＤＬ出力音声ＤＢ１１２Ａに格納されているＤＬ音声データとして、音声データ０１１＿１を示している。なお、これらの音声データは一例であり、ＤＬ出力音声ＤＢ１１２Ａに格納されているＤＬ音声データの種類および数は、図２の例に限定されない。

音声データ０１１＿１は、「前に言ってた○○は、××のメンバーだよね。またいろいろ教えてね。」という音声を出力するための音声データである。

なお、ＤＬシナリオは、ＤＬ音声データに加え、出力音声ＤＢ１１２に予め格納されている音声データの使用を規定していてもよい。

また、オフライン処理部３０１は、アクセス不可応答を取得した場合、ＤＬシナリオＤＢ１１１Ａに、未使用のＤＬシナリオが格納されているか否かを判定する。オフライン処理部３０１は、例えば、音声応答に使用したことを示す情報（以下、使用フラグと称する）が付加されていないＤＬシナリオが格納されているか否かを判定する。

未使用のＤＬシナリオが格納されているか否かの判定は、すなわち、未使用のＤＬ音声データがＤＬ出力音声ＤＢ１１２Ａに格納されているか否かを判定することに等しい。このため、上記の判定は、ＤＬ音声データのうち、過去に音声応答に使用されていないＤＬ音声データがＤＬ出力音声ＤＢ１１２Ａに格納されているか否かを判定する、と表現することもできる。

格納されていると判定した場合、オフライン処理部３０１は、ＤＬシナリオＤＢ１１１Ａから、いずれかのＤＬシナリオを読み出す。オフライン処理部３０１は、例えば、ＤＬシナリオＤＢ１１１ＡからランダムにいずれかのＤＬシナリオを読み出す。そして、オフライン処理部３０１は、読み出したＤＬシナリオに、音声応答に使用したことを示す情報を付し、読み出したＤＬシナリオ（使用シナリオ）にて使用される音声データを、ＤＬ出力音声ＤＢ１１２Ａから読み出す。

一方、ＤＬシナリオＤＢ１１１Ａに未使用のＤＬシナリオが格納されていないと判定した場合、オフライン処理部３０１は、ＤＬシナリオＤＢ１１１Ａに格納されていない、いずれかのシナリオ（ＤＬシナリオと異なるシナリオ）を読み出す。

ＤＬ音声データは、ユーザの発話音声の音声データに基づいて生成されたものであるため、ＤＬ出力音声ＤＢ１１２Ａへの格納後、なるべく早く使用されることが好ましい。一方、格納から時間が経過してから当該ＤＬ音声データを使用した場合、ユーザの発話から時間が経過してから当該発話の内容に即した音声出力がなされることとなるため、ユーザが戸惑うおそれがある。このため、オフライン処理部３０１は、ＤＬシナリオＤＢ１１１Ａに、未使用のＤＬシナリオが格納されている場合は当該シナリオを読み出し、格納されていない場合は、ＤＬシナリオＤＢ１１１Ａに格納されていない、いずれかのシナリオを読み出す。

続いて、オフライン処理部３０１は、読み出したＤＬシナリオに従って処理を実行する。当該処理の詳細は、実施形態１にて説明しているため、ここでは説明を繰り返さない。
（音声応答処理の流れ）
図８は、制御部１０ａが実行する、音声応答処理の流れの一例を示すフローチャートである。なお、説明の便宜上、実施形態１にて説明したステップと同じ処理を行うステップについては、同じ符号を付記し、その説明を繰り返さない。また、図８において、オンライン処理における各ステップは、図３を参照して説明しているため、記載を省略している。ステップＳ３でＮＯの場合、音声応答処理は図３のステップＳ６へ進む。

オフライン処理部３０１は、アクセス不可応答を取得すると、ＤＬシナリオＤＢ１１１Ａに、未使用のＤＬシナリオがあるか否かを判定する（Ｓ２１）。

未使用のＤＬシナリオがあると判定した場合（Ｓ２１でＹＥＳ）、オフライン処理部３０１は、ＤＬシナリオＤＢ１１１Ａに格納されている未使用のダウンロードシナリオのうちのいずれかを選択し、読み出す（Ｓ２２）。

一方、未使用のＤＬシナリオが無いと判定した場合（Ｓ２１でＮＯ）、オフライン処理部３０１は、ＤＬシナリオ以外のシナリオのうちのいずれかを選択し、読み出す（Ｓ２３）。

そして、オフライン処理部３０１は、ステップＳ５（出力制御ステップ）の処理、すなわち、使用シナリオに基づく音声出力を行う。このとき、使用シナリオにユーザの発話音声の取得が規定されている場合、オフライン処理部３０１は、音声入力受付部１０５に対し、音声入力部１５をＯＮにするよう指示し、ユーザの発話音声の音声データの取得を待機する。

音声入力受付部１０５は、当該音声データを取得すると（Ｓ２４でＹＥＳ、取得ステップ）、当該音声データを録音部１０６へ出力する。録音部１０６は、取得した音声データを発話音声ＤＢ１１３へ格納する（Ｓ２５）。

なお、使用シナリオにユーザの発話音声の取得が規定されていない場合、音声入力受付部１０５は、当該発話音声の音声データを取得しない（Ｓ２４でＮＯ）。この場合、ステップＳ２５の処理は省略される。

なお、以降、図８に示すステップＳ５、Ｓ２１～Ｓ２５の処理を「オフライン処理」と称する場合がある。

（応答音声データ受信処理の流れ）
図９は、制御部１０ａが実行する、応答音声データ受信処理の流れの一例を示すフローチャートである。

オンライン処理部３０２は、現在の時刻が所定の時刻となるまで待機している（Ｓ３１）。当該所定の時刻は、上述した「通信制限が発生していない可能性が高い所定のタイミング」である。オンライン処理部３０２は、クロック（不図示）と、当該所定の時刻を示す時刻情報とを参照し、現在の時刻が、時刻情報が示す時刻となるまで待機する。時刻情報は、例えば、ロボット１ａの記憶部１１に予め格納されていてもよいし、現在の時刻が、時刻情報が示す時刻となる前にサーバ２から受信してもよい。上述したとおり、時刻情報が示す時刻は、例えば、深夜の時刻（例えば、午前１時など）である。

なお、アクセス数がライセンス数に到達することを避けるため、時刻情報が示す時刻は、ロボット１ａごとに異なることが好ましい。

現在の時刻が所定の時刻となると（Ｓ３１でＹＥＳ）、オンライン処理部３０２は、発話音声ＤＢ１１３を参照し、ユーザの発話音声の音声データが格納されているか否かを判定する（Ｓ３２）。格納されていると判定した場合（Ｓ３２でＹＥＳ）、オンライン処理部３０２は、発話音声ＤＢ１１３から音声データを読み出し、通信制御部１０２へ出力する。通信制御部１０２は、取得した音声データをサーバ２へ送信する（Ｓ３３、通信制御ステップ）。

続いて、通信制御部１０２は、サーバ２からＤＬシナリオおよびＤＬ音声データを受信すると、当該ＤＬシナリオおよびＤＬ音声データを音声処理部１０３へ出力する。オフライン処理部３０１は、取得したＤＬシナリオおよびＤＬ音声データの各々を、ＤＬシナリオＤＢ１１１ＡおよびＤＬ出力音声ＤＢ１１２Ａへ格納する（Ｓ３４、通信制御ステップ）。

図１０は、応答音声データ受信処理の一具体例を示す図である。図１０の例では、ロボット１ａは、アクセス不可応答の受信に基づき、オフライン処理を実行したものとする。このオフライン処理において、ロボット１ａは、図２に示すシナリオ００１に従い音声を出力したものとする。そして、ロボット１ａは、ユーザの発話音声として「○○だよ。」（図４参照）を取得したものとする。これにより、当該発話音声の音声データは、発話音声ＤＢ１１３に格納される。

現在の時刻が所定時刻となると、通信制御部１０２は、オンライン処理部３０２が発話音声ＤＢ１１３から読み出した音声データ（「○○だよ。」との音声の音声データ）をサーバ２へ送信する。

サーバ２は、音声データを受信すると音声認識処理を行い、当該処理の結果に基づき、音声合成用データを取得する。この処理については、実施形態１で説明しているため、ここでは説明を繰り返さない。

サーバ２は、取得した音声合成用データに基づき、音声合成処理を行う。図１０の例では、「前に言ってた○○は、××のメンバーだよね。またいろいろ教えてね。」との音声を出力するためのＤＬ音声データを生成する。また、サーバ２は、当該音声データをロボット１ａに出力させるためのＤＬシナリオ（この例では、図７に示すシナリオ０１１）を生成する。そして、サーバ２は、当該ＤＬシナリオおよびＤＬ音声データをロボット１ａへ送信する。

ロボット１ａの通信制御部１０２は、受信したＤＬシナリオおよびＤＬ音声データを音声処理部１０３へ出力する。オフライン処理部３０１は、取得したＤＬシナリオおよびＤＬ音声データの各々を、ＤＬシナリオＤＢ１１１ＡおよびＤＬ出力音声ＤＢ１１２Ａへ格納する。

図１１は、図１０に示す応答音声データ受信処理の後の、音声応答処理の一具体例を示す図である。すなわち、図１１は、ＤＬシナリオおよびＤＬ音声データの受信以降の音声応答処理の一具体例を示す図である。図１１の例では、ユーザの開始ボタンの押下により、ロボット１ａがアクセス不可応答を受信したものとする。

図１１の例では、ＤＬシナリオＤＢ１１１にシナリオ０１１が格納されているので、オフライン処理部３０１は、シナリオ０１１を読み出す。また、オフライン処理部３０１は、シナリオ０１１に規定されている音声データ０１１＿１を読み出す。そして、オフライン処理部３０１は、シナリオ０１１に従って音声データ０１１＿１を音声出力制御部１０４へ出力する。音声出力制御部１０４は、音声出力部１４に、音声データ０１１＿１に基づく音声、すなわち、図１１に示す「前に言ってた○○は、××のメンバーだよね。またいろいろ教えてね。」との音声を出力させる。

（効果）
本実施形態に係る制御部１０ａは、音声応答に対するユーザの発話に基づく音声データを取得する音声入力受付部１０５を備える。また、制御部１０ａは、通信制限が発生していると判定された場合、音声入力受付部１０５が取得した音声データを、記憶部１１に記憶させる録音部１０６を備える。また、制御部１０ａは、上記制限が発生していない可能性が高い所定のタイミングで、記憶部１１に記憶されている上記音声データをサーバ２へ送信する通信制御部１０２を備える。通信制御部１０２はさらに、当該音声データに基づいて生成された音声応答のためのＤＬ音声データをサーバ２から受信する。また、制御部１０ａは、受信したＤＬ音声データを記憶部１１に記憶させる音声処理部１０３をさらに備える。

上記の構成によれば、制限（通信制限）が発生していると判定された場合は、ロボット１ａの音声応答に対するユーザの発話の音声データを記憶しておき、通信制限が発生していない可能性が高い所定のタイミングで当該音声データをサーバ２へ送信する。そして、当該音声データに基づいて生成されたＤＬ音声データをサーバ２から受信し、記憶する。これにより、通信制限が発生しているタイミングにおける応答のための音声データを、通信制限が発生する前にサーバ２に生成させることができる。結果として、サーバトラフィックの増大により通信に支障が出ている状況でもユーザの満足度の低下を抑えた、ユーザへの応答を実現することができる。

また、ＤＬ音声データは、ユーザの発話の音声データに基づいてサーバ２が生成したものであるため、ユーザの発話内容に即した音声データとすることができる。結果として、ユーザの入力の内容に即したロボット１の音声応答を実現することができる。

なお、制御部１０ａは、各種音声データを記憶部１１とは異なる記憶装置に記憶してもよい。当該記憶装置は、例えば、ロボット１ａと通信可能に接続された、サーバ２以外の記憶装置である。

また、本実施形態に係る制御部１０ａは、応答指示を取得したとき、ＤＬ音声データのうち、過去に音声応答に使用されていないＤＬ音声データがＤＬ出力音声ＤＢ１１２Ａに格納されているか否かを判定するオフライン処理部３０１をさらに備える。本実施形態に係る音声出力制御部１０４は、通信制限が発生していると判定され、かつ、過去に音声応答に使用されていないＤＬ音声データが格納されていると判定された場合、当該ＤＬ音声データに基づく音声応答を出力させる。

上記の構成によれば、音声応答に使用されていない、ＤＬ音声データがあると判定されると、通信制限が発生している場合、当該ＤＬ音声データに基づく応音声答が行われる。当該ＤＬ音声データは、ユーザの発話音声の音声データに基づき生成された音声データであるので、ユーザの発話から、当該発話の内容に即した音声応答までの時間をできる限り短くすることができる。結果として、ユーザが不自然に感じない音声応答を実現することができる。

（実施形態２の変形例）
オフライン処理部３０１は、ＤＬシナリオＤＢ１１１Ａに格納されているＤＬシナリオおよびＤＬ出力音声ＤＢ１１２Ａに格納されているＤＬ音声データを使用した場合、これらのＤＬシナリオおよびＤＬ音声データを消去してもよい。これにより、記憶部１１の記憶容量を確保することができる。

また、オフライン処理部３０１は、ＤＬシナリオＤＢ１１１Ａに、未使用のＤＬシナリオが格納されているか否かを判定せず、シナリオＤＢ１１１に格納されている全てのシナリオから、いずれかのシナリオを選択する構成であってもよい。あるいは、オフライン処理部３０１は、未使用のＤＬシナリオが格納されていないと判定した場合、シナリオＤＢ１１１に格納されている全てのシナリオから、いずれかのシナリオを選択する構成であってもよい。

〔実施形態３〕
本発明のさらなる別の実施形態について、以下に説明する。なお、説明の便宜上、実施形態１および２にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。

図１２は、本実施形態に係るロボット１ｂの要部構成の一例を示すブロック図である。図１２に示すロボット１ｂが、上述した実施形態１にて説明したロボット１と異なる点は、制御部１０に代えて制御部１０ｂを備えている点である。

制御部１０ｂが、制御部１０と異なる点は、録音部１０６を新たに備える点である。なお、録音部１０６については、実施形態２で説明しているため、ここでは説明を繰り返さない。

また、制御部１０ｂの操作信号受付部１０１は、実施形態１および２に係る操作信号受付部１０１と異なり、取得した開始信号を音声処理部１０３へ出力する。

制御部１０ｂの音声処理部１０３（決定部）は、実施形態１および２で説明した機能に加え、以下の機能を備える。すなわち、音声処理部１０３は、操作信号受付部１０１から開始信号を取得すると、オフライン処理およびオンライン処理のいずれを行うかを決定する。音声処理部１０３は、一例として、所定の確率に基づいてオフライン処理およびオンライン処理のいずれを行うかを決定する。所定の確率は、例えば、オフライン処理の実行が７０％、オンライン処理の実行が３０％としてもよい。

音声処理部１０３が、オフライン処理を実行すると決定した場合、オフライン処理部３０１は、オフライン処理を行う。オフライン処理の詳細については、実施形態１および２で説明しているため、ここでは説明を繰り返さない。

音声処理部１０３が、オンライン処理を実行すると決定した場合、オンライン処理部３０２は、その旨を通信制限判定部２０１へ通知する。

通信制限判定部２０１は、オンライン処理部３０２からの通知に基づき、サーバ２へアクセス要求を送信し、当該要求に対する応答を受信する。そして、通信制限判定部２０１は、受信した応答がアクセス許可応答であるかアクセス不可応答であるかを判定し、判定結果をオンライン処理部３０２へ出力する。

オンライン処理部３０２は、アクセス許可応答であるとの判定結果を取得した場合、オンライン処理を行う。オンライン処理の詳細については、実施形態１および２で説明しているため、ここでは説明を繰り返さない。

一方、アクセス不可応答であるとの判定結果を取得した場合、オンライン処理部３０２は、その旨をオフライン処理部３０１へ通知する。オフライン処理部３０１は、当該通知を受けると、オフライン処理を行う。

このように、本実施形態に係る制御部１０ｂは、アクセス要求をサーバ２へ送信する前に、オフライン処理とオンライン処理とのいずれを行うかを決定する。そして、オンライン処理を行うと決定した場合に、アクセス要求をサーバ２へ送信する。アクセス要求に対する応答がアクセス許可応答であった場合、予め決定したとおりオンライン処理を行う。一方、当該応答がアクセス不可応答であった場合、決定したオンライン処理に代えてオフライン処理を行う。

（音声応答処理の流れ）
図１３は、制御部１０ｂが実行する、音声応答処理の流れの一例を示すフローチャートである。なお、説明の便宜上、実施形態１～３にて説明したステップと同じ処理を行うステップについては、同じ符号を付記し、その説明を繰り返さない。

操作信号受付部１０１から開始信号を取得すると、音声処理部１０３は、オンライン処理とオフライン処理の何れを行うかを決定する（Ｓ４１）。オンライン処理を行うと決定した場合（Ｓ４１でＮＯ）、オンライン処理部３０２は、その旨を通信制限判定部２０１へ通知する。

通信制限判定部２０１は、アクセス要求をサーバ２へ送信し（Ｓ２）、応答を受信する。通信制限判定部２０１は、受信した応答がアクセス許可応答およびアクセス不可応答の何れであるかを判定し（Ｓ３）、判定結果をオンライン処理部３０２へ出力する。

オンライン処理部３０２は、アクセス許可応答であるとの判定結果を取得した場合（Ｓ３でＮＯ）、オンライン処理を行う。オンライン処理については、実施形態１にて説明しているため、ここでは説明を繰り返さない。

一方、オンライン処理部３０２は、アクセス不可応答であるとの判定結果を取得した場合（Ｓ３でＹＥＳ）、その旨をオフライン処理部３０１へ通知する。

オフライン処理部３０１は、当該通知を受けた場合、または、音声処理部１０３がオフライン処理を行うと決定した場合（Ｓ４１でＹＥＳ）、オフライン処理を行う。オフライン処理については、実施形態１にて説明しているため、ここでは説明を繰り返さない。

（効果）
本実施形態に係る制御部１０ｂは、サーバ２から受信した音声データに基づく音声応答をロボット１ｂから出力させるか、または、記憶部１１に記憶されている音声データに基づく音声応答を出力させるかを決定する音声処理部１０３をさらに備える。そして、通信制限判定部２０１は、音声処理部１０３が、サーバ２から受信した音声データに基づく音声応答をロボット１ｂから出力させると決定した場合、ロボット１ｂとサーバ２との間に通信制限が発生しているか否かを判定する。

上記の構成によれば、音声処理部１０３が、記憶部１１に記憶されている音声データに基づく音声応答をロボット１ｂから出力させると決定した場合、通信制限判定部２０１は、通信制限が発生しているか否かの判定を行わない。よって、通信制限判定部２０１による判定の頻度を減らすことができ、制御部１０ｂの処理負荷を軽減することができる。

（実施形態３の変形例）
本実施形態は、実施形態１に適用することも可能である。換言すれば、本実施形態に係る制御部１０ｂは、録音部１０６を備えていなくてもよい。

〔実施形態４〕
本発明のさらなる別の実施形態について、以下に説明する。なお、説明の便宜上、実施形態１～３にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。

図１４は、本実施形態に係るロボット１ｃの要部構成の一例を示すブロック図である。図１４に示すロボット１ｃが、上述した実施形態１にて説明したロボット１と異なる点は、制御部１０に代えて制御部１０ｃを備えている点である。

制御部１０ｃが、制御部１０と異なる点は、通信制御部１０２が、通信制限判定部２０１を備えていない点である。すなわち、本実施形態に係るロボット１ｃは、ユーザから応答指示を入力されたとき、ロボット１ｃとサーバ２との間の通信において、トラフィック量に基づく制限が発生しているか否かを判定しない。

本実施形態に係る操作信号受付部１０１は、取得した開始信号を、音声処理部１０３へ出力する。

本実施形態に係るオフライン処理部３０１は、開始信号を取得すると、実施形態２にて説明したオフライン処理を開始する。すなわち、ロボット１ｃは、ユーザからの応答指示に対して、オフライン処理を行い音声応答する。このオフライン処理の詳細は、実施形態２にて説明したため、ここでは説明を繰り返さない。

本実施形態に係る録音部１０６は、音声入力受付部１０５（取得部）から音声データを取得すると、記憶部１１の発話音声ＤＢ１１３に格納する。

本実施形態に係るオンライン処理部３０２は、実施形態１にて説明したオンライン処理を行わない。一方、オンライン処理部３０２は、実施形態２にて説明したロボット１ａとサーバ２との間に通信制限が発生していない可能性が高い所定のタイミングで、発話音声ＤＢ１１３に格納されている音声データを読み出し、通信制御部１０２へ出力する処理を行う。

（音声応答処理の流れ）
図１５は、制御部１０ｃが実行する、音声応答処理の流れの一例を示すフローチャートである。なお、説明の便宜上、実施形態１および２にて説明したステップと同じ処理を行うステップについては、同じ符号を付記し、その説明を繰り返さない。

本実施形態に係る音声応答処理が、実施形態２で説明した音声応答処理と異なる点は、ステップＳ２およびＳ３の処理を実行しない点である。ステップＳ１において、操作信号受付部１０１は、受け付けた開始信号を音声処理部１０３へ出力する。

音声処理部１０３は、開始信号を取得すると、実施形態２にて説明したオフライン処理を実行する。

なお、制御部１０ｃが実行する応答音声データ受信処理については、実施形態２で説明したものと同様であるため、ここでは説明を繰り返さない。

（効果）
本実施形態に係る制御部１０ｃは、ユーザからの応答指示に対して音声応答するロボット１ｃを制御する。制御部１０ｃは、上記音声応答に対するユーザからの音声入力に基づく音声データを取得する音声入力受付部１０５を備えている。また、制御部１０ｃは、上記音声データを、ロボット１とサーバ２との間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングでサーバ２へ送信する通信制御部１０２を備えている。通信制御部１０２はさらに、上記音声データに基づいて生成された、上記応答指示に対して音声応答するための音声データをサーバ２から受信する。また、制御部１０ｃは、上記応答指示に対して、通信制御部１０２が受信した音声データに基づく音声応答をロボット１から出力させる音声出力制御部１０４を備えている。

また、本実施形態に係る発明について、以下のように表現することもできる。すなわち、本実施形態に係るロボット１ｃは、音声出力部１４と、制御部１０ｃとを備え、ユーザからの応答指示に対して音声応答する。制御部１０ｃは、上記音声応答に対するユーザからの音声入力に基づく音声データを取得する音声入力受付処理を行う。また、制御部１０ｃは、上記音声データを、ロボット１ｃとサーバ２との間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングでサーバ２へ送信する通信処理を行う。当該通信処理では、さらに、上記音声データに基づいて生成された、上記応答指示に対して音声応答するための音声データをサーバ２から受信する。また、制御部１０ｃは、上記応答指示に対して、通信制御処理により受信した音声データに基づく音声応答をロボット１ｃから出力させる音声出力制御処理を行う。

また、本実施形態に係る発明について、以下のように表現することもできる。すなわち、ユーザからの応答指示に対して音声応答するロボット１ｃを制御する制御部１０ｃの制御方法は、上記音声応答に対するユーザからの音声入力に基づく音声データを取得する音声入力受付ステップを含む。また、当該制御方法は、上記音声データを、ロボット１ｃとサーバ２との間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングでサーバ２へ送信する通信制御ステップを含む。当該通信制御ステップではさらに、上記音声データに基づいて生成された、上記応答指示に対して音声応答するための音声データをサーバ２から受信する。また、当該制御方法は、上記応答指示に対して、通信制御ステップにて受信した音声データに基づく音声応答をロボット１ｃから出力させる音声出力制御ステップを含む。

上記の構成によれば、音声応答に対してユーザが行った音声入力に基づく音声データを、制限（通信制限）が発生していない可能性が高い所定のタイミングでサーバ２へ送信する。そして、当該音声データに基づいて生成された音声データを、通信制限が発生していないタイミングで受信する。そして、応答指示に対して、受信した音声データに基づく応答を電子機器から出力させる。

つまり、ロボット１ｃとサーバ２との通信は、通信制限が発生していない可能性が高い所定のタイミングでのみ行われる。換言すれば、通信制限が発生している虞があるタイミングにおいて、ロボット１ｃとサーバ２とは通信を行わない。よって、サーバコストを増大させることなく、サーバトラフィックの増大により通信に支障が出ている状況でもユーザの満足度の低下を抑えた、ユーザへの応答を実現することができる。

なお、「電子機器とサーバとの間の通信においてトラフィック量に基づく制限が発生していない可能性が高い、所定のタイミング」とは、例えば、実施形態２で説明した、深夜などの電子機器を使用するユーザ数が少ないタイミングである。

〔その他の変形例〕
上述した各実施形態では、ユーザからの応答指示に対して応答する電子機器として、ロボットを例に挙げて説明した。一方、当該電子機器はロボットに限定されない。例えば、当該電子機器は、スマートフォンなどの携帯端末であってもよい。

また、当該電子機器は、制御部１０、記憶部１１、操作入力部１２、通信部１３、音声出力部１４および音声入力部１５の各々を複数備えていてもよい。

上述した各実施形態では、ユーザとロボットとの会話の開始のトリガとして、開始ボタンの押下を例に挙げて説明した。一方、会話の開始のトリガはこの例に限定されない。当該トリガは、例えば、開始ボタン以外の操作入力部１２に対する所定の操作であってもよい。また、当該トリガは、例えば、ユーザが所定のキーワードを含む発話を行うことであってもよい。また、当該トリガは、例えば、ロボットがユーザの存在を検知することであってもよい。この例の場合、ロボットは例えば、人感センサ（不図示）を備えている。この人感センサとしては、例えば、知のものを使用することができる。また、当該トリガは、例えば、所定の時刻となることであってもよい。

上述した各実施形態では、ユーザとロボットとは会話、すなわち、音声を出力することでやり取りする例を説明した。一方、ユーザとロボットとのやり取りの方法は、音声出力に限定されない。例えば、ロボットは、音声出力に代えて、表示部（不図示）にテキストや画像を表示してもよい。また、ユーザは、発話に代えて、操作入力部１２への操作入力により、ロボットへテキストや画像を入力してもよい。

上述した各実施形態に係るロボットは、音声認識処理を実行することが可能であってもよい。ただし、ロボットの製造コストを下げるため、当該音声認識処理は、数十単語のみを認識する簡単なものであることが好ましい。

上述した実施形態１～３に係るロボットは、アクセス許可応答を受信した場合であっても、記憶部１１に記憶されている音声データのみで会話が成り立つ場合には、オフライン処理を行ってもよい。ここで、「記憶部１１に記憶されている音声データのみで会話が成り立つ場合」とは、例えば、ロボットによる音声の出力に対するユーザの発話の内容を音声認識せずに会話を成立させることができるシナリオがある場合である。あるいは、ユーザに発話させない、一方的な音声を出力する音声データがある場合である。これらの例において、当該シナリオや当該音声データには、「記憶部１１に記憶されている音声データのみで会話が成り立つ」ことを示す情報が対応付けられていてもよい。この場合、ロボットの制御部は、当該情報が対応付けられているシナリオまたは音声データがあるか否かを判定することで、記憶部１１に記憶されている音声データのみで会話が成り立つか否かを判定することができる。

あるいは、「記憶部１１に記憶されている音声データのみで会話が成り立つ場合」は、ロボットが音声認識処理を実行可能な例において、ユーザの発話の音声データを音声認識することができた場合であってもよい。

〔ソフトウェアによる実現例〕
ロボット１、１ａ、１ｂ、１ｃの制御ブロック（特に制御部１０、１０ａ、１０ｂ、１０ｃ）は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ソフトウェアによって実現してもよい。

後者の場合、ロボット１、１ａ、１ｂ、１ｃは、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば少なくとも１つのプロセッサ（制御装置）を備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な少なくとも１つの記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばＣＰＵ（Central Processing Unit）を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ＲＯＭ（Read Only Memory）等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するＲＡＭ（Random Access Memory）などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

〔まとめ〕
本発明の態様１に係る制御装置（制御部１０、１０ａ、１０ｂ）は、応答指示に対して応答する電子機器（ロボット１、１ａ、１ｂ）を制御する制御装置であって、上記応答指示を取得した場合、上記電子機器とサーバ（サーバ２）との間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定部（通信制限判定部２０１）と、上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置（記憶部１１）に記憶されている上記応答データに基づく応答を上記電子機器から出力させる出力制御部（音声出力制御部１０４）と、を備えている。

本発明の態様２に係る制御装置（制御部１０ａ）は、上記態様１において、出力された上記応答に対するユーザ（ユーザ９）からの入力に基づく入力データを取得する取得部（音声入力受付部１０５）と、上記制限が発生していると判定された場合、取得された上記入力データを、上記サーバと異なる入力データ記憶装置（記憶部１１）に記憶させる入力データ記憶部（録音部１０６）と、上記制限が発生していない可能性が高い所定のタイミングで、上記入力データ記憶装置に記憶されている上記入力データを上記サーバへ送信し、上記入力データに基づいて生成された上記応答データを上記サーバから受信する通信制御部（通信制御部１０２）と、受信した上記応答データを、上記応答データ記憶装置に記憶させる応答データ記憶部（オフライン処理部３０１）と、をさらに備えてもよい。

本発明の態様３に係る制御装置は、上記態様２において、上記応答指示を取得したとき、上記サーバから受信した上記応答データのうち、過去に応答に使用されていない上記応答データが上記応答データ記憶装置にあるか否かを判定する使用判定部（オフライン処理部３０１）をさらに備え、上記出力制御部は、上記制限が発生していると判定され、かつ、過去に応答に使用されていない上記応答データがあると判定された場合、当該応答データに基づく応答を上記電子機器から出力させてもよい。

本発明の態様４に係る制御装置（制御部１０ｂ）は、上記態様１から３のいずれかにおいて、上記サーバから受信した上記応答データに基づく応答を上記電子機器から出力させるか、または、上記応答データ記憶装置に記憶されている上記応答データに基づく応答を上記電子機器から出力させるかを決定する決定部（音声処理部１０３）をさらに備え、上記判定部は、上記決定部が、上記サーバから受信した上記応答データに基づく応答を上記電子機器から出力させると決定した場合、上記制限が発生しているか否かを判定してもよい。

本発明の態様５に係る制御装置（制御部１０、１０ａ、１０ｂ）は、上記態様１から４のいずれかにおいて、上記出力制御部は、上記応答データとしての音声データに基づく音声を上記電子機器から出力させてもよい。

本発明の態様６に係る制御装置（制御部１０ｃ）は、応答指示に対して応答する電子機器（ロボット１ｃ）を制御する制御装置であって、上記応答に対するユーザ（ユーザ９）からの入力に基づく入力データを取得する取得部（音声入力受付部１０５）と、上記入力データを、上記電子機器とサーバ（サーバ２）との間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングで上記サーバへ送信し、上記入力データに基づいて生成された、応答指示に対して応答するための応答データを上記サーバから受信する通信制御部（通信制御部１０２）と、上記応答データの受信以降の応答指示に対して、当該応答データに基づく応答を上記電子機器から出力させる出力制御部（音声出力制御部１０４）と、を備えている。

本発明の態様７に係る電子機器（ロボット１、１ａ、１ｂ）は、少なくとも１つの出力装置（音声出力部１４）と、少なくとも１つの制御装置（制御部１０、１０ａ、１０ｂ）とを備え、応答指示に対して応答する電子機器であって、上記制御装置は、上記応答指示を取得した場合、上記電子機器とサーバ（サーバ２）との間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定処理と、上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置（記憶部１１）に記憶されている上記応答データに基づく応答を上記出力装置から出力させる出力制御処理と、を行う。

本発明の態様８に係る電子機器（ロボット１ｃ）は、少なくとも１つの出力装置（音声出力部１４）と、少なくとも１つの制御装置（制御部１０ｃ）とを備え、応答指示に対して応答する電子機器であって、上記制御装置は、上記応答に対するユーザ（ユーザ９）からの入力に基づく入力データを取得する取得処理と、上記電子機器とサーバ（サーバ２）との間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングで、上記入力データを上記サーバへ送信し、上記入力データに基づいて生成された、応答指示に対して応答するための応答データを上記サーバから受信する通信制御処理と、上記応答データの受信以降の応答指示に対して、当該応答データに基づく応答を上記電子機器から出力させる出力制御処理と、を行うことを特徴とする電子機器。

本発明の態様９に係る制御装置（制御部１０、１０ａ、１０ｂ）の制御方法は、応答指示に対して応答する電子機器（ロボット１、１ａ、１ｂ）を制御する制御装置の制御方法であって、上記応答指示を取得した場合、上記電子機器とサーバ（サーバ２）との間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定ステップ（ステップＳ３）と、上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置（記憶部１１）に記憶されている上記応答データに基づく応答を上記電子機器から出力させる出力制御ステップ（ステップＳ５、Ｓ１０）と、を含む。

本発明の態様１０に係る制御装置（制御部１０ｃ）の制御方法は、応答指示に対して応答する電子機器（ロボット１ｃ）を制御する制御装置の制御方法であって、上記応答に対するユーザ（ユーザ９）からの入力に基づく入力データを取得する取得ステップ（ステップＳ２４）と、上記電子機器とサーバとの間の通信においてトラフィック量に基づく制限が発生していない可能性が高い所定のタイミングで、上記入力データを上記サーバへ送信し、上記入力データに基づいて生成された、応答指示に対して応答するための応答データを上記サーバから受信する通信制御ステップ（ステップＳ３３、Ｓ３４）と、上記応答データの受信以降の応答指示に対して、当該応答データに基づく応答を上記電子機器から出力させる出力制御ステップ（Ｓ５）と、を含む。

本発明の各態様に係る制御装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記制御装置が備える各部（ソフトウェア要素）として動作させることにより上記制御装置をコンピュータにて実現させる制御装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

１、１ａ、１ｂ、１ｃロボット（電子機器）
２サーバ
９ユーザ
１０、１０ａ、１０ｂ、１０ｃ制御部（制御装置）
１１記憶部（応答データ記憶装置、入力データ記憶装置）
１４音声出力部（出力装置）
１０２通信制御部
１０３音声処理部（決定部）
１０４音声出力制御部（出力制御部）
１０５音声入力受付部（取得部）
１０６録音部（入力データ記憶部）
２０１通信制限判定部（判定部）
３０１オフライン処理部（応答データ記憶部、使用判定部）

Claims

応答指示に対して応答する電子機器を制御する制御装置であって、
上記応答指示を取得した場合、上記電子機器とサーバとの間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定部と、
上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置に記憶されている上記応答データに基づく応答を上記電子機器から出力させる出力制御部と、を備えており、
上記制御装置は、
出力された上記応答に対するユーザからの入力に基づく入力データを取得する取得部と、
上記制限が発生していると判定された場合、取得された上記入力データを、上記サーバと異なる入力データ記憶装置に記憶させる入力データ記憶部と、
上記制限が発生していない可能性が高い所定のタイミングで、上記入力データ記憶装置に記憶されている上記入力データを上記サーバへ送信し、上記入力データに基づいて生成された上記応答データを上記サーバから受信する通信制御部と、
受信した上記応答データを、上記応答データ記憶装置に記憶させる応答データ記憶部と、
上記応答指示を取得したとき、上記サーバから受信した上記応答データのうち、過去に応答に使用されていない上記応答データが上記応答データ記憶装置にあるか否かを判定する使用判定部と、をさらに備えており、
上記出力制御部は、上記制限が発生していると判定され、かつ、過去に応答に使用されていない上記応答データがあると判定された場合、当該応答データに基づく応答を上記電子機器から出力させることを特徴とする制御装置。
上記サーバから受信した上記応答データに基づく応答を上記電子機器から出力させるか、または、上記応答データ記憶装置に記憶されている上記応答データに基づく応答を上記電子機器から出力させるかを決定する決定部をさらに備え、
上記判定部は、上記決定部が、上記サーバから受信した上記応答データに基づく応答を上記電子機器から出力させると決定した場合、上記制限が発生しているか否かを判定することを特徴とする、請求項１に記載の制御装置。
上記出力制御部は、上記応答データとしての音声データに基づく音声を上記電子機器から出力させることを特徴とする、請求項１または２に記載の制御装置。
少なくとも１つの出力装置と、少なくとも１つの制御装置とを備え、応答指示に対して応答する電子機器であって、
上記制御装置は、
上記応答指示を取得した場合、上記電子機器とサーバとの間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定処理と、
上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置に記憶されている上記応答データに基づく応答を上記出力装置から出力させる出力制御処理と、を行い、
上記制御装置は、
出力された上記応答に対するユーザからの入力に基づく入力データを取得する取得処理と、
上記制限が発生していると判定された場合、取得された上記入力データを、上記サーバと異なる入力データ記憶装置に記憶させる入力データ記憶処理と、
上記制限が発生していない可能性が高い所定のタイミングで、上記入力データ記憶装置に記憶されている上記入力データを上記サーバへ送信し、上記入力データに基づいて生成された上記応答データを上記サーバから受信する通信制御処理と、
受信した上記応答データを、上記応答データ記憶装置に記憶させる応答データ記憶処理と、
上記応答指示を取得したとき、上記サーバから受信した上記応答データのうち、過去に応答に使用されていない上記応答データが上記応答データ記憶装置にあるか否かを判定する使用判定処理と、をさらに行い、
上記出力制御処理では、上記制限が発生していると判定され、かつ、過去に応答に使用されていない上記応答データがあると判定された場合、当該応答データに基づく応答を上記電子機器から出力させることを特徴とする電子機器。
応答指示に対して応答する電子機器を制御する制御装置の制御方法であって、
上記応答指示を取得した場合、上記電子機器とサーバとの間の通信において、トラフィック量に基づく制限が発生しているか否かを判定する判定ステップと、
上記制限が発生していないと判定された場合、上記サーバから受信した、上記応答指示に対して応答するための応答データに基づき、上記応答指示に対する応答を上記電子機器から出力させる一方、上記制限が発生していると判定された場合、上記サーバと異なる応答データ記憶装置に記憶されている上記応答データに基づく応答を上記電子機器から出力させる出力制御ステップと、を含んでおり、
上記制御方法は、
出力された上記応答に対するユーザからの入力に基づく入力データを取得する取得ステップと、
上記制限が発生していると判定された場合、取得された上記入力データを、上記サーバと異なる入力データ記憶装置に記憶させる入力データ記憶ステップと、
上記制限が発生していない可能性が高い所定のタイミングで、上記入力データ記憶装置に記憶されている上記入力データを上記サーバへ送信し、上記入力データに基づいて生成された上記応答データを上記サーバから受信する通信制御ステップと、
受信した上記応答データを、上記応答データ記憶装置に記憶させる応答データ記憶ステップと、
上記応答指示を取得したとき、上記サーバから受信した上記応答データのうち、過去に応答に使用されていない上記応答データが上記応答データ記憶装置にあるか否かを判定する使用判定ステップと、をさらに含んでおり、
上記出力制御ステップでは、上記制限が発生していると判定され、かつ、過去に応答に使用されていない上記応答データがあると判定された場合、当該応答データに基づく応答を上記電子機器から出力させることを特徴とする制御装置の制御方法。
請求項１に記載の制御装置としてコンピュータを機能させるための制御プログラムであって、上記判定部、上記出力制御部、上記取得部、上記入力データ記憶部、上記通信制御部、上記応答データ記憶部、および上記使用判定部としてコンピュータを機能させるための制御プログラム。