WO2018116531A1

WO2018116531A1 - サーバ、情報処理方法、ネットワークシステム、および端末

Info

Publication number: WO2018116531A1
Application number: PCT/JP2017/031344
Authority: WO
Inventors: 孝之永松; 実雄阪本; 竹内　正樹; 慎一郎太田; 真恵加城山
Original assignee: シャープ株式会社
Priority date: 2016-12-19
Filing date: 2017-08-31
Publication date: 2018-06-28
Also published as: JP2018101197A; JP6894228B2

Abstract

スピーカ（３７０）を有する端末（３００）と通信するための通信インターフェイス（１６０）と、通信インターフェイス（１６０）を介して、端末（３００）にメッセージを出力させ、端末（３００）を介して取得したユーザの動作に基づいて、ユーザがメッセージを聞いたか否かを判断するためのプロセッサ（１１０）と、を備えるサーバ（１００）が提供される。

Description

サーバ、情報処理方法、ネットワークシステム、および端末

　本発明の一態様は、メッセージなどの音声を出力するためのサーバ、情報処理方法、ネットワークシステム、および端末の技術に関する。

　従来から、ユーザに適したメッセージを出力するための技術が知られている。たとえば、特開２０１６－２４６３６号公報（特許文献１）には、制御装置、制御方法および制御プログラムが開示されている。特許文献１によると、制御装置は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、検索部によって検索された広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、を備えたことを特徴とする。このため、制御装置は、ユーザに適したメッセージを出力することができる。

特開２０１６－２４６３６号公報

　本発明の一態様の目的は、より好適なユーザとの対話を実現するための技術を提供することにある。

　この発明のある態様に従うと、スピーカを有する端末と通信するための通信インターフェイスと、通信インターフェイスを介して、端末にメッセージを出力させ、端末を介して取得したユーザの動作に基づいて、ユーザがメッセージを聞いたか否かを判断するためのプロセッサと、を備えるサーバが提供される。

　好ましくは、プロセッサは、ユーザの動作が第１の所定の動作である場合に、ユーザがメッセージを第１のレベルの興味を持って聞いたと判断し、ユーザの動作が第２の所定の動作である場合に、ユーザがメッセージを第２のレベルの興味を持って聞いたと判断する。

　好ましくは、プロセッサは、通信インターフェイスを介して端末に、メッセージとして、以前のメッセージに関する問い掛けを出力させ、ユーザの動作としての問い掛けに対するユーザからの回答を取得する。

　好ましくは、プロセッサは、通信インターフェイスを介して端末に、メッセージとして、対話を構成する複数回の往復のうちのユーザに向けた複数回のメッセージを出力させ、ユーザの動作として、対話を構成する複数回の往復のうちのユーザからの複数回のメッセージを取得する。

　好ましくは、プロセッサは、端末から取得したユーザの動作に基づいて、ユーザ毎の第１の時間帯を決定する。

　好ましくは、プロセッサは、ユーザ毎の第１の時間帯とそれ以外の時間帯とで、ユーザの動作に基づく判断の基準を異ならせる。

　好ましくは、プロセッサは、ユーザがメッセージに対して肯定的な動作を行った場合に、通信インターフェイスを介して、端末に第１の情報を出力させ、ユーザがメッセージに対して肯定的な動作を行わなかった場合に、端末に第２の情報を出力させる、または端末に第１の情報も第２の情報も出力させない。

　好ましくは、プロセッサは、通信インターフェイスを介して端末に、ユーザが所定の動作を実行するとポイントを付与する旨を出力させる。

　好ましくは、プロセッサは、ユーザの動作として、ユーザが端末に触れたことに基づいて、ユーザがメッセージを聞いたと判断する。

　この発明の別の局面に従うと、通信インターフェイスとプロセッサとを含むサーバにおける情報処理方法が提供される。情報処理方法は、プロセッサが、通信インターフェイスを介して、端末にメッセージを出力させるステップと、プロセッサが、通信インターフェイスを介して端末から取得したユーザの動作に基づいて、ユーザがメッセージを聞いたか否かを判断するステップと、を備える。

　この発明の別の局面に従うと、メッセージを出力するためのスピーカを有する端末と、端末にメッセージを出力させ、端末から取得したユーザの動作に基づいて、ユーザがメッセージを聞いたか否かを判断するサーバと、を備えるネットワークシステムが提供される。

　この発明の別の局面に従うと、スピーカと、マイクまたはカメラまたは他のセンサと、通信インターフェイスと、通信インターフェイスを介して受信したサーバからの情報に基づいてスピーカにメッセージを出力させ、マイクまたはカメラまたは他のセンサを介して取得したユーザの動作を示す情報をサーバに提供し、サーバからのデータに基づいてユーザがメッセージを聞いていると判断された際の音声またはユーザがメッセージを聞いていないと判断された際の音声をスピーカに出力させるためのプロセッサと、を備える端末が提供される。

　好ましくは、プロセッサは、ユーザの動作として、ユーザが端末に触れたことを示す情報をサーバに提供する。

　以上のように、この発明の一態様によれば、より好適なユーザとの対話が可能になる。

第１の実施の形態にかかるネットワークシステム１の全体構成を示す図である。第１の実施の形態にかかるネットワークシステム１の動作概要を示す図である。第１の実施の形態にかかる音声サービスサーバ１００の構成を示すブロック図である。第１の実施の形態にかかる音声サービスサーバ１００における情報処理を示すフローチャートである。第１の実施の形態にかかる電気機器３００の構成を示すブロック図である。第２の実施の形態にかかる音声サービスサーバ１００における第１の動作概要を示す図である。第２の実施の形態にかかる音声サービスサーバ１００における第２の動作概要を示す図である。第３の実施の形態にかかる音声サービスサーバ１００における第１の情報処理を示すフローチャートである。第３の実施の形態にかかる音声サービスサーバ１００における第２の情報処理を示すフローチャートである。第３の実施の形態にかかる音声サービスサーバ１００における第３の情報処理を示すフローチャートである。第４の実施の形態のゴールデンタイムを示す図である。第４の実施の形態にかかる音声サービスサーバ１００における第１の情報処理を示すフローチャートである。第４の実施の形態にかかる音声サービスサーバ１００における第２の情報処理を示すフローチャートである。第４の実施の形態にかかる音声サービスサーバ１００における第３の情報処理を示すフローチャートである。第５の実施の形態にかかるネットワークシステム１の動作概要を示す図である。第５の実施の形態にかかる音声サービスサーバ１００における情報処理を示すフローチャートである。第６の実施の形態にかかる音声サービスサーバ１００における情報処理を示すフローチャートである。第７の実施の形態にかかる音声サービスサーバ１００における情報処理を示すフローチャートである。第８の実施の形態にかかる電気機器３００を示す図である。

　以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
　＜第１の実施の形態＞
　＜ネットワークシステム１の全体構成＞

　まず、図１を参照して本実施の形態にかかるネットワークシステム１の全体構成について説明する。本実施の形態にかかるネットワークシステム１は、主に、音声サービスサーバ１００と、他の情報提供サーバ１００Ｂ，１００Ｃと、ロボット３００Ａや冷蔵庫やエアコンなどの電気機器（通信端末）と、を含む。本実施の形態にかかる電気機器は、ユーザからのメッセージに応じて、音声サービスサーバ１００からのデータに基づいてメッセージを音声出力するものである。

　なお、電気機器（通信端末）は、ロボット３００Ａに限らず、冷蔵庫、電子レンジ、エアコン、洗濯機、掃除機、空気清浄器、加湿器、除湿器、炊飯器、照明などの家電、携帯電話、スマートフォン、テレビ、ハードディスクレコーダ、プロジェクタ、音楽プレーヤ、ゲーム機、パーソナルコンピュータなどのＡＶ（オーディオ・ビジュアル）機器、組み込み照明、太陽光発電機、インターホン、給湯器、温水洗浄便座コントローラなどの住宅設備、などであってもよい。以下では、これらの電気機器（通信端末）を総称して、電気機器３００ともいう。
　＜ネットワークシステム１の動作概要＞

　次に、図１と図２とを参照して本実施の形態にかかるネットワークシステム１の動作概要について説明する。

　本実施の形態にかかるネットワークシステム１に関しては、ユーザがロボット３００Ａなどの電気機器３００に話しかけたり、電気機器３００がユーザに話しかけたりすることによって、対話すなわち音声メッセージのやり取りが行われる。より詳細には、本実施の形態においては、音声サービスサーバ１００が、電気機器３００に音声メッセージを出力させたり、電気機器３００を介してユーザからの音声メッセージを取得したりする。

　そして特に、音声サービスサーバ１００は、ユーザの反応に応じて、先に出力した音声メッセージをユーザが聞いたか否かを判断するものである。たとえば、図２に示すように、音声サービスサーバ１００は、ユーザからの所定のメッセージに基づいて、先のメッセージをユーザが聞いたか否かを判断するものである。

　あるいは、音声サービスサーバ１００は、ユーザの反応に応じて、先に出力した音声メッセージや当該メッセージに関する話題にユーザが興味を持っているか否かを判断する。たとえば、図２に示すように、音声サービスサーバ１００は、ユーザからの所定のメッセージに基づいて、先のメッセージや話題やテーマをユーザが興味を持って聞いたか否かを判断するものである。

　このように、音声サービスサーバ１００は、電気機器３００が出力したメッセージを、ユーザが強い興味を持って聞いたか、ユーザが通常の興味を持って聞いたか、ユーザが興味を持たずに聞いたか、ユーザが聞いていないか、に関する判断結果やそれに基づく集計結果などを取得することができる。以下、このような機能を実現するためのネットワークシステム１の具体的な構成について詳述する。
　＜音声サービスサーバ１００のハードウェア構成＞

　まず、本実施の形態にかかるネットワークシステム１を構成する音声サービスサーバ１００のハードウェア構成の一態様について説明する。他の情報提供サーバ１００Ｂ、１００Ｃも音声サービスサーバ１００と同様の構成を有しているため、ここでは説明を繰り返さない。

　図３を参照して、音声サービスサーバ１００は、主たる構成要素として、ＣＰＵ（Central Processing Unit）１１０と、メモリ１２０と、操作部１４０と、通信インターフェイス１６０とを含む。

　ＣＰＵ１１０は、メモリ１２０に記憶されているプログラムを実行することによって、音声サービスサーバ１００の各部を制御する。たとえば、ＣＰＵ１１０は、メモリ１２０に格納されているプログラムを実行し、各種のデータを参照することによって、後述する各種の処理を実行する。

　メモリ１２０は、各種のＲＡＭ（Random　Access　Memory）、各種のＲＯＭ（Read-Only　Memory）などによって実現される。メモリ１２０は、ＣＰＵ１１０によって実行されるプログラムや、ＣＰＵ１１０によるプログラムの実行により生成されたデータ、入力されたデータ、その他の音声サービスに利用されるデータベースなどを記憶する。たとえば、メモリ１２０は、ユーザがメッセージに興味を持っていることを示す第１のレベルの複数種類のキーワードや、ユーザが単にメッセージを聞いたことを示す第２のレベルの複数種類のキーワードのデータなどを格納する。

　操作部１４０は、サービスの管理者などの命令を受け付けて、当該命令をＣＰＵ１１０に入力する。

　通信インターフェイス１６０は、ＣＰＵ１１０からのデータを、インターネット、キャリア網、ルータなどを介して電気機器３００などの他の装置に送信する。逆に、通信インターフェイス１６０は、インターネット、キャリア網、ルータなどを介して他の装置からのデータを受信して、ＣＰＵ１１０に受け渡す。

　他の情報提供サーバ１００Ｂ，１００Ｃの構成は、メモリ１２０のデータやＣＰＵ１１０の処理が異なるが、ハードウェア構成は概ね音声サービスサーバ１００のそれと同様であるため、ここでは説明を繰り返さない。
　＜音声サービスサーバ１００における情報処理＞

　次に、図４を参照しながら、本実施の形態にかかる音声サービスサーバ１００における情報処理について説明する。

　音声サービスサーバ１００のＣＰＵ１１０は、通信インターフェイス１６０を介して、電気機器３００から音声データを受信すると以下の処理を実行する。まず、ＣＰＵ１１０は、音声データからメッセージを抽出して、メッセージを解析する（ステップＳ１０２）。

　ＣＰＵ１１０は、メモリ１２０のデータを参照して、ユーザが１つ前のメッセージや一連のメッセージやその話題やテーマに興味を示したか否かを判断する（ステップＳ１１２）。たとえば、ＣＰＵ１１０は、抽出したメッセージに第１のレベルのキーワード、たとえば「大好き！！」や「いいよね。」やユーザからの質問などが含まれている場合に、ユーザが一連のメッセージに興味を示したと判断し、メッセージに第１のレベルのキーワードが含まれていない場合に、ユーザが一連のメッセージに興味を示さなかったと判断する。あるいは、ＣＰＵ１１０は、電気機器３００を介してユーザにクイズを出して、ユーザの回答があったときに、ユーザが一連のメッセージに興味を示したと判断し、当該クイズに対して回答がなかった場合に、ユーザが一連のメッセージに興味を示さなかったと判断してもよい。あるいは、ユーザに「興味がありますか？」と質問したのちのユーザの「はい。」や「うん。」などの回答があったとき時に、ユーザが一連のメッセージに興味を示したと判断し、当該質問に対して「いいえ。」や「ううん。」の回答があった場合や回答がなかった場合に、ユーザがメッセージに興味を示さなかったと判断する。

　ユーザがメッセージに興味を示したと判断した場合（ステップＳ１１２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザの特定情報と、その前のメッセージの特定情報やそのテーマの特定情報や時間帯と、に対応付けて、興味を持っていることを示すデータをメモリ１２０に格納する（ステップＳ１１４）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　ユーザがメッセージに興味を示さなかったと判断した場合（ステップＳ１１２にてＮＯである場合）、ＣＰＵ１１０は、メモリ１２０のデータを参照して、ユーザがメッセージを聞いたか否かを判断する（ステップＳ１２２）。たとえば、ＣＰＵ１１０は、抽出したメッセージに第２のレベルのキーワード、たとえば「うん。」や「へえ。」などが含まれている場合に、ユーザがメッセージに興味を示したと判断し、メッセージに第２のレベルのキーワードが含まれていない場合に、ユーザがメッセージに興味を示さなかったと判断する。あるいは、ユーザに「ねえ、聞いていますか？」と質問したのちのユーザの「はい。」や「うん。」などの回答があったとき時に、ユーザがメッセージを聞いたと判断し、当該質問に対して「いいえ。」や「ううん。」などの回答があった場合や回答がなかった場合に、ユーザがメッセージを聞かなかったと判断する。

　ユーザがメッセージを聞いたと判断した場合（ステップＳ１２２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザの特定情報と、その前のメッセージの特定情報やそのテーマの特定情報や時間帯と、に対応付けて、ユーザがメッセージを聞いたことを示すデータをメモリ１２０に格納する（ステップＳ１２４）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　ユーザがメッセージを聞かなかったと判断した場合（ステップＳ１２２にてＮＯである場合）、ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　好ましくは、ＣＰＵ１１０は、「ユーザ毎の、または年齢・住所・性別などのユーザ層毎の、またはユーザ全体の」、「メッセージ毎の、またはテーマ毎の、または時間帯毎の」、「メッセージを聞いた割合、またはメッセージに興味を示した割合」などを計算してメモリ１２０に格納したり、通信インターフェイス１６０を介して他のサーバに当該情報を提供したりする。

　なお、本実施の形態においては、ＣＰＵ１１０は、第１のレベルとして、興味をもってメッセージを聞いたという判断結果と、第２のレベルとして、単にメッセージを聞いたという判断結果と、メッセージを聞かなかったという判断結果とを集計するものであった。しかしながら、ＣＰＵ１１０は、さらに、多くの段階のレベルに分けた判断結果を集計してもよい。たとえば、ＣＰＵ１１０は、第１のレベルとして、ユーザが強い興味を持ってメッセージを聞いたか、第２のレベルとして、ユーザが通常の興味を持ってメッセージを聞いたか、第３のレベルとして、ユーザが興味を持たずにメッセージを聞いたか、ユーザが聞いていないか、に関する判断結果やそれに基づく集計結果などを取得してもよい。
　＜電気機器３００のハードウェア構成＞

　次に、図５を参照して、ネットワークシステム１を構成する電気機器３００の構成の一態様について説明する。電気機器３００は、主たる構成要素として、ＣＰＵ３１０と、メモリ３２０と、ディスプレイ３３０と、操作部３４０と、カメラ３５０、通信インターフェイス３６０と、スピーカ３７０と、マイク３８０と、機器駆動部３９０とを含む。

　ＣＰＵ３１０は、メモリ３２０あるいは外部の記憶媒体に記憶されているプログラムを実行することによって、電気機器３００の各部を制御する。

　メモリ３２０は、各種のＲＡＭや、各種のＲＯＭなどによって実現される。メモリ３２０は、ＣＰＵ３１０によって実行される機器駆動プログラムや会話プログラムやその他のプログラムや、ＣＰＵ３１０によるプログラムの実行により生成されたデータ、音声サービスサーバ１００や他のサーバから受信したデータ、操作部３４０を介して入力されたデータなどを記憶する。

　ディスプレイ３３０は、ＣＰＵ３１０からの信号に基づいて、文字や画像などを出力する。ディスプレイ３３０は、図１に示すように、単にライト３３０Ａ，３３０Ｂであってもよい。

　操作部３４０は、ボタン、タッチパネルなどによって実現され、ユーザからの命令を受け付けて、当該命令をＣＰＵ３１０に入力する。なお、ディスプレイ３３０と操作部３４０とは、タッチパネルを構成してもよい。

　また、操作部３４０は、近接センサや温度センサなどであってもよい。この場合は、ＣＰＵ３１０は、操作部３４０としての近接センサや温度センサを介して、ユーザが電気機器３００に手をかざしたことを検知して、各種の動作を開始する。たとえば、電気機器３００がロボットであって、近接センサが額の近辺に配置されることによって、ユーザが電気機器３００をなでたり・たたいたりすることを電気機器３００が検知してもよい。

　カメラ３５０は、画像を撮影して、画像データをＣＰＵ３１０に受け渡す。ＣＰＵ３１０は、画像データからユーザの動きを特定してもよいし、画像データをサーバ１００に提供してサーバ１００がユーザの動きを特定してもよい。

　通信インターフェイス３６０は、無線ＬＡＮ通信あるいは有線ＬＡＮなどの通信モジュールによって実現される。通信インターフェイス３６０は、有線通信あるいは無線通信によって音声サービスサーバ１００などの他の装置との間でデータをやり取りする。

　スピーカ３７０は、ＣＰＵ３１０からの信号に基づいて、音声を出力する。より詳細には、本実施の形態においては、ＣＰＵ３１０は、通信インターフェイス３６０を介してサーバ１００から受信した音声データに基づいてスピーカ３７０に音声メッセージを出力させる。あるいは、ＣＰＵ３１０は、通信インターフェイス３６０を介してサーバ１００から受信したテキストデータに基づいて音声信号を作成し、スピーカ３７０に音声メッセージを出力させる。あるいは、ＣＰＵ３１０は、通信インターフェイス３６０を介してサーバ１００から受信したメッセージＩＤに基づいて、メモリ３２０からメッセージの音声データを読み出して、スピーカ３７０に音声メッセージを出力させる。

　マイク３８０は、外部からの音声に基づいて音声信号を作成し、ＣＰＵ３１０に入力する。

　機器駆動部３９０は、ＣＰＵ３１０からの信号に基づいて、電気機器３００の各部（モータやヒータなど）を制御する。

　このように、本実施の形態に係る音声サービスにおいては、たとえば当該音声サービスに会話情報や広告情報の提供者に、「ユーザ毎の、または年齢・住所・性別などのユーザ層毎の、またはユーザ全体の」、「メッセージ毎の、または話題毎の、またはテーマ毎の、または時間帯毎の」、「メッセージを聞いた割合、またはメッセージに興味を示した割合」などを伝えることができる。そして、このような情報は、広告の提供者から徴収する料金の算定や、他の情報の提供者へ支払う料金の算定や、各種のマーケティングなどに利用することができる。
　＜第２の実施の形態＞

　第１の実施の形態では、音声サービスサーバ１００が、電気機器３００を介して音声メッセージを出力し、電気機器３００を介して取得したユーザの反応に基づいて、ユーザが音声メッセージを聞いたか否かを判断・集計したり、またユーザが音声メッセージに興味を示したか否かを判断・集計したりするものであった。しかしながら、このような構成には限られない。

　たとえば、図６に示すように、音声サービスサーバ１００のＣＰＵ１１０は、電気機器３００を介して取得したユーザの反応に基づいて、ユーザが音声メッセージを聞いたか否かを判断・集計して、ユーザが音声メッセージに興味を示したか否かは判断しなくてもよい。

　あるいは、図７に示すように、音声サービスサーバ１００のＣＰＵ１１０が、電気機器３００を介して取得したユーザの反応に基づいて、ユーザが音声メッセージに興味を示したか否かを判断・集計して、ユーザが音声メッセージを聞いたか否かは判断しなくてもよい。
　＜第３の実施の形態＞

　第１の実施の形態では、音声サービスサーバ１００が、電気機器３００を介して取得したユーザのメッセージの内容に基づいて、ユーザが音声メッセージを聞いたか否かを判断・集計したり、またユーザが音声メッセージに興味を示したか否かを判断・集計したりするものであった。しかしながら、ユーザがメッセージを聞いたか否かの判断やユーザがメッセージに興味を持ったか否かの判断の方法はこのような構成には限られない。

　たとえば、音声サービスサーバ１００のＣＰＵ１１０は、電気機器３００に対してユーザが所定回数以上話しかけたか否かに基づいて、電気機器３００が取得中の一連のメッセージを聞いているかを判断・集計したり、電気機器３００が取得中の一連のメッセージに興味を有しているかを判断・集計したりしてもよい。本実施の形態においては、メモリ１２０には、ユーザ毎のメッセージの反応回数が格納される。

　図８を参照して、ＣＰＵ１１０は、音声データからメッセージを抽出して、メッセージを解析する（ステップＳ１０２）。このとき、ＣＰＵ１１０は、ユーザの反応回数を＋１する（ステップＳ１０４）。

　ＣＰＵ１１０は、ユーザが所定回数以上、電気機器３００が出力するメッセージに反応しているか否か、すなわち所定回数以上ユーザが電気機器３００にメッセージを入力したか否かを判断する（ステップＳ１０６）。

　所定回数以上ユーザが電気機器３００にメッセージを入力した場合（ステップＳ１０６にてＹＥＳである場合）、ＣＰＵ１１０は、ステップＳ１１２からの処理を実行する。

　あるいは、音声サービスサーバ１００のＣＰＵ１１０は、ユーザの反応回数に基づいて、ユーザが電気機器３００の出力するメッセージに興味を持っているか否かを判断したり、ユーザが電気機器３００の出力するメッセージを聞いたか否かを判断したりしてもよい。

　たとえば、図９を参照して、ＣＰＵ１１０は、音声データからメッセージを抽出して、メッセージを解析する（ステップＳ１０２）。このとき、ＣＰＵ１１０は、ユーザの反応回数を＋１する（ステップＳ１０４）。

　ＣＰＵ１１０は、ユーザが第１の所定回数以上、電気機器３００が出力するメッセージに反応しているか否か、たとえば第１の所定回数以上ユーザが電気機器３００にメッセージを入力したか否かを判断する（ステップＳ３１２）。

　第１の所定回数以上ユーザが電気機器３００にメッセージを入力している場合（ステップＳ３１２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザと、その前のメッセージまたはテーマなどと、に対応付けて、ユーザがメッセージやそのテーマに興味を持っていることを示すデータをメモリ１２０に格納する（ステップＳ３１４）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　未だ第１の所定回数以上ユーザが電気機器３００にメッセージを入力していない場合（ステップＳ３１２にてＮＯである場合）、ＣＰＵ１１０は、ユーザが第１の所定回数よりも少ない第２の所定回数以上、電気機器３００が出力するメッセージに反応しているか否か、たとえば第２の所定回数以上ユーザが電気機器３００にメッセージを入力したか否かを判断する（ステップＳ３２２）。

　第２の所定回数以上ユーザが電気機器３００にメッセージを入力している場合（ステップＳ３２２にてＹＥＳである場合）、ユーザと、その前のメッセージまたはテーマなどと、に対応付けて、メッセージを聞いたことを示すデータをメモリ１２０に格納する（ステップＳ３２４）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　さらにあるいは、図１０に示すように、音声サービスサーバ１００のＣＰＵ１１０は、電気機器３００からの音声データに基づいてユーザの抑揚や声色を特定し（ステップＳ３０２）、当該抑揚や声色に基づいてユーザが音声メッセージを聞いたか否かを判断・集計したり、またユーザが音声メッセージに興味を示したか否かを判断・集計したりしてもよい。
　＜第４の実施の形態＞

　音声サービスサーバ１００は、さらに、時間帯や曜日などに応じて、ユーザが音声メッセージを聞いたか否かの判断方法や、ユーザが音声メッセージに興味を示したか否かの判断方法を、変更してもよい。

　以下では、図１１に示すように、ユーザ毎の電気機器３００のメッセージに集中することができる可能性が高い時間帯、換言すればユーザ毎の忙しくない時間帯を、ゴールデンタイムという。たとえば、音声サービスサーバ１００のＣＰＵ１１０は、ユーザ毎または電気機器３００毎の、メッセージに対する「興味あり」との判断結果の割合に基づいて、「興味あり」との判断結果の割合が多い、たとえば３０％以上などの、時間帯をユーザ毎のゴールデンタイムとして設定する。あるいは、ＣＰＵ１１０は、ユーザ毎または電気機器３００毎の、メッセージに対する「興味あり」の判断結果の割合と「聞いた」の判断結果の割合とに基づいて、両者の割合の合計が多い、たとえば４０％以上などの、時間帯をユーザ毎のゴールデンタイムとして設定する。

　ただし、ゴールデンタイムはユーザ毎に設定される必要はなく、全ユーザに共通であってもよいし、年齢・性別・住所などの属性毎に設定されるものであってもよい。

　図１２を参照して、ＣＰＵ１１０は、電気機器３００からの音声データからメッセージを抽出して、メッセージを解析する（ステップＳ５０２）。

　ＣＰＵ１１０は、ユーザまたは電気機器３００のＩＤなどに基づいて、現在がゴールデンタイムに該当するか否かを判断する（ステップＳ５０４）。

　ゴールデンタイムのときは（ステップＳ５０４にてＹＥＳである場合）、ＣＰＵ１１０は、メモリ１２０のデータを参照して、ユーザがメッセージに興味を示したか否かを判断する（ステップＳ５１２）。ユーザがメッセージに興味を示したと判断した場合（ステップＳ５１２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザと、その前のメッセージとそのテーマと時間帯などと、に対応付けて、興味を持っていることを示すデータをメモリ１２０に格納する（ステップＳ５１４）。ＣＰＵ１１０は、ユーザが電気機器３００のメッセージに興味を持った時間を記憶して、ゴールデンタイムの判断のための反応頻度を高める補正をする（ステップＳ５１６）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　一方、ユーザがメッセージに興味を示さなかったと判断した場合（ステップＳ５１２にてＮＯである場合）、ＣＰＵ１１０は、メモリ１２０のデータを参照して、ユーザがメッセージを聞いたか否かを判断する（ステップＳ５２２）。ユーザがメッセージを聞いたと判断した場合（ステップＳ５２２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザと、その前のメッセージまたはテーマと、に対応付けて、ユーザがメッセージを聞いたことを示すデータをメモリ１２０に格納する（ステップＳ５２４）。本実施の形態においては、ＣＰＵ１１０は、ユーザが電気機器３００のメッセージを聞いた時間を記憶して、ゴールデンタイムの判断のための反応頻度を維持する（ステップＳ５２６）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　ユーザがメッセージを聞かなかったと判断した場合（ステップＳ５２２にてＮＯである場合）、ＣＰＵ１１０は、ユーザが電気機器３００のメッセージを聞かなかった時間を記憶して、ゴールデンタイムの頻度を低減する補正をする（ステップＳ５２８）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　ＣＰＵ１１０は、現在がゴールデンタイムでない場合には（ステップＳ５０４にてＮＯである場合）、次の電気機器３００からの音声データを待ち受ける。

　なお、本実施の形態においては、ゴールデンタイムだけに、ユーザが音声メッセージを聞いたか否かの判断やユーザが音声メッセージに興味を示したか否かの判断をするものであった。これは、ユーザに余裕があるときに、対象となるテーマのメッセージを聞いたか否かを調べたいときに有効である。

　しかしながら、逆に、音声サービスサーバ１００のＣＰＵ１１０は、ゴールデンタイムには、上記の判断をせずに、ゴールデンタイムでないときに、ユーザが音声メッセージを聞いたか否かの判断やユーザが音声メッセージに興味を示したか否かの判断をしてもよい。これは、ユーザに余裕がないときに、対象となるテーマのメッセージを聞いたか否かを調べたいときに有効である。

　あるいは、図１３に示すように、音声サービスサーバ１００のＣＰＵ１１０は、ゴールデンタイムには、ユーザが音声メッセージに興味を示したか否かの判断を行い、ゴールデンタイムでないときには、ユーザが音声メッセージを聞いたか否かの判断を行うものであってもよい。

　あるいは、ゴールデンタイムの判断基準とそれ以外のときの判断基準とが準備されてもよい。なお以下では、「第１の基準」は、最もユーザがメッセージやテーマに興味を示している場合の反応に対するものであって、たとえばユーザからの回答が２０文字以上、あるいはユーザとの対話の回数が１０回以上すなわちユーザが１０回以上メッセージを入力している、などである。「第２の基準」は、次にユーザがメッセージやテーマに興味を示している場合の反応に対するものであって、たとえばユーザからの回答が１４文字以上、あるいはユーザとの対話の回数が７回以上すなわちユーザが７回以上メッセージを入力している、などである。「第３の基準」は、その次にユーザがメッセージやテーマに興味を示している場合の反応に対するものであって、たとえばユーザからの回答が７文字以上、あるいはユーザとの対話の回数が４回以上すなわちユーザが４回以上メッセージを入力している、などである。「第４の基準」は、最もユーザがメッセージやテーマに興味を示していない場合の反応に対するものであって、たとえばユーザからの回答が１文字以上、あるいはユーザとの対話の回数が１回以上すなわちユーザが１回以上メッセージを入力している、などである。

　図１４を参照して、ＣＰＵ１１０は、電気機器３００からの音声データからメッセージを抽出して、メッセージを解析する（ステップＳ５０２）。

　ＣＰＵ１１０は、ゴールデンタイムであるか否かを判断する（ステップＳ５０４）。

　ゴールデンタイムのときは（ステップＳ５０４にてＹＥＳである場合）、ＣＰＵ１１０は、メモリ１２０のデータを参照して、第１の基準に基づいて、ユーザがメッセージに興味を示したか否かを判断する（ステップＳ５１２）。ユーザがメッセージに興味を示したと判断した場合（ステップＳ５１２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザとメッセージなどの特定情報に対応付けて、興味を持っていることを示すデータをメモリ１２０に格納する（ステップＳ５１４）。ＣＰＵ１１０は、ユーザが電気機器３００のメッセージに興味を持った時間を記憶して、ゴールデンタイムの判断のための反応頻度を高める補正をする（ステップＳ５１６）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　一方、ユーザがメッセージに興味を示さなかったと判断した場合（ステップＳ５１２にてＮＯである場合）、ＣＰＵ１１０は、メモリ１２０のデータを参照して、第３の基準に基づいて、ユーザがメッセージを聞いたか否かを判断する（ステップＳ５２２）。ユーザがメッセージを聞いたと判断した場合（ステップＳ５２２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザとメッセージなどの特定情報に対応付けて、ユーザがメッセージを聞いたことを示すデータをメモリ１２０に格納する（ステップＳ５２４）。本実施の形態においては、ＣＰＵ１１０は、ユーザが電気機器３００のメッセージを聞いた時間を記憶して、ゴールデンタイムの判断のための反応頻度を維持する（ステップＳ５２６）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　ユーザがメッセージを聞かなかったと判断した場合（ステップＳ５２２にてＮＯである場合）、ＣＰＵ１１０は、ユーザが電気機器３００のメッセージを聞かなかった時間を記憶して、ゴールデンタイムの判断のための反応頻度を低減する補正をする（ステップＳ５２８）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　ＣＰＵ１１０は、現在がゴールデンタイムでない場合には（ステップＳ５０４にてＮＯである場合）、ＣＰＵ１１０は、メモリ１２０のデータを参照して、第２の基準に基づいて、ユーザがメッセージに興味を示したか否かを判断する（ステップＳ５６２）。ユーザがメッセージに興味を示したと判断した場合（ステップＳ５６２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザとメッセージなどの特定情報に対応付けて、興味を持っていることを示すデータをメモリ１２０に格納する（ステップＳ５６４）。ＣＰＵ１１０は、ユーザが電気機器３００のメッセージに興味を持った時間を記憶して、ゴールデンタイムの判断のための反応頻度を高める補正をする（ステップＳ５６６）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　一方、ユーザがメッセージに興味を示さなかったと判断した場合（ステップＳ５６２にてＮＯである場合）、ＣＰＵ１１０は、メモリ１２０のデータを参照して、第４の基準に基づいて、ユーザがメッセージを聞いたか否かを判断する（ステップＳ５７２）。ユーザがメッセージを聞いたと判断した場合（ステップＳ５７２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザとメッセージなどの特定情報に対応付けて、ユーザがメッセージを聞いたことを示すデータをメモリ１２０に格納する（ステップＳ５７４）。本実施の形態においては、ＣＰＵ１１０は、ユーザが電気機器３００のメッセージを聞いた時間を記憶して、ゴールデンタイムの判断のための反応頻度を維持する（ステップＳ５７６）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　ユーザがメッセージを聞かなかったと判断した場合（ステップＳ５７２にてＮＯである場合）、ＣＰＵ１１０は、ユーザが電気機器３００のメッセージを聞かなかった時間を記憶して、ゴールデンタイムの判断のための反応頻度を低減する補正をする（ステップＳ５７８）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　なお、第２の基準よりも第３の基準の方がより難しいものであってもよいし、第１から第４の基準に同じ基準のものがあってもよい。
　＜第５の実施の形態＞

　音声サービスサーバ１００は、ユーザが興味を示したり肯定的なメッセージを話したりした場合に、企業や商品やサービスの広告を電気機器３００から出力させ（図２などを参照。）、ユーザが興味を示さなかったり否定的なメッセージを話したりした場合に、図１５に示すように、企業や商品やサービスの広告を電気機器３００から出力させないという構成であってもよい。

　より詳細には、図１６を参照して、まず、ＣＰＵ１１０は、音声データからメッセージを抽出して、メッセージを解析する（ステップＳ６０２）。

　ＣＰＵ１１０は、ユーザがメッセージを聞いたか否かを判断する（ステップＳ６１２）。ＣＰＵ１１０は、ユーザがメッセージを聞いていないと判断した場合（ステップＳ６１２にてＮＯである場合）、次の電気機器３００からの音声データを待ち受ける。

　ユーザがメッセージを聞いたと判断した場合（ステップＳ６１２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザからのメッセージが肯定的であるか否かを判断する（ステップＳ６３２）。ユーザからのメッセージが肯定的である場合（ステップＳ６３２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザとメッセージなどの特定情報に対応付けて、ユーザが肯定的なメッセージを発したことを示すデータをメモリ１２０に格納する（ステップＳ６３４）。ＣＰＵ１１０は、通信インターフェイス１６０を介して、広告用のデータを送信し、図２・図６・図７に示すように、電気機器３００は音声サービスサーバ１００からのデータに基づいて、広告を出力する（ステップＳ６３６）。ＣＰＵ１１０は、次の電気機器３００からの音声データを待ち受ける。

　ユーザからのメッセージが肯定的でない場合（ステップＳ６３２にてＮＯである場合）、ＣＰＵ１１０は、ユーザとメッセージなどの特定情報に対応付けて、ユーザが肯定的でないメッセージを発したことを示すデータをメモリ１２０に格納する（ステップＳ６３８）。ＣＰＵ１１０は、図１５に示すように、電気機器３００に広告を出力させることなく、次の電気機器３００からの音声データを待ち受ける（ステップＳ６４０）。

　なお、予め肯定的な第１のメッセージが設定されており、音声サービスサーバ１００のＣＰＵ１１０が、ユーザのメッセージが当該第１のメッセージを含む場合にユーザが肯定的であると判断し、ユーザのメッセージが当該第１のメッセージを含まない場合にユーザが否定的であると判断してもよい。

　あるいは、予め否定的な第２のメッセージが設定されており、音声サービスサーバ１００のＣＰＵ１１０が、ユーザのメッセージが当該第２のメッセージを含む場合にユーザが否定的であると判断し、ユーザのメッセージが当該第２のメッセージを含まない場合にユーザが肯定的であると判断してもよい。

　なお、予め肯定的な第１のメッセージと否定的な第２のメッセージが設定されており、音声サービスサーバ１００のＣＰＵ１１０が、ユーザのメッセージが当該第１のメッセージを含む場合にユーザが肯定的であると判断し、ユーザのメッセージが当該第２のメッセージを含む場合にユーザが否定的であると判断し、ユーザのメッセージがいずれのメッセージも含まない場合は次のメッセージまで判断を保留してもよい。

　あるいはメッセージ毎に、肯定的である度合を示す肯定ポイントが付与されている。なお、肯定的なメッセージ、たとえば「大好き。」「最高。」には“正”の大きなポイントが付与されており、否定的なメッセージ、たとえば「大嫌い。」「いや。」には“負”の大きなポイントが付与される。そして、ＣＰＵ１１０が、ユーザのメッセージのポイントまたは累積ポイントが所定値以上である場合に肯定的であると判断し、所定値未満である場合に肯定的ではないと判断してもよい。

　また、上記の実施の形態においては、肯定的なユーザのメッセージに応じて広告情報を出力させ、否定的なユーザのメッセージに応じて広告情報を出力しないものとしているがこのような形態には限られない。

　たとえば、音声サービスサーバ１００のＣＰＵ１１０は、肯定的なユーザのメッセージに応じて第１の広告情報を出力させ、否定的なユーザのメッセージに応じて第２の広告情報を出力する形態にしてもよい。なお、第１の広告情報は、第２の広告情報よりも詳しい内容を含む。あるいは、第１の広告情報には企業名と商品とを含み、第２の広告情報には企業名と商品のいずれかを含む。

　なお、広告情報に限らず、音声サービスサーバ１００のＣＰＵ１１０は、肯定的なユーザのメッセージに応じてニュースなどの情報を出力させ、否定的なユーザのメッセージに応じてニュースなどの情報を出力しない形態にしてもよい。あるいは、肯定的なユーザのメッセージに応じて詳細情報を出力させ、否定的なユーザのメッセージに応じて簡易情報を出力する形態にしてもよい。

　さらにはそれらを組み合わせて、音声サービスサーバ１００のＣＰＵ１１０は、ユーザのメッセージのポイントまたは累積ポイントが第１の所定値以上である場合、あるいはユーザのメッセージに第１の肯定メッセージが含まれている場合、第１の肯定状態であると判断し、詳細情報と広告情報とを電気機器３００に出力させる。ＣＰＵ１１０は、ユーザのメッセージのポイントまたは累積ポイントが第１の所定値未満かつ第１の所定値よりも小さな第２の所定値以上である場合、あるいはユーザのメッセージに第２の肯定メッセージが含まれている場合、第２の肯定状態であると判断し、簡易情報と広告情報とを電気機器３００に出力させる。ＣＰＵ１１０は、ユーザのメッセージのポイントまたは累積ポイントが第２の所定値未満である場合、あるいはユーザのメッセージに第１および第２の肯定メッセージが含まれていない場合、否定的な状態であると判断し、簡易情報のみを電気機器３００に出力させてもよい。

　つまり、音声サービスサーバ１００のＣＰＵ１１０は、ユーザが肯定的な場合に、第１の情報としての広告情報と第２の情報としての広告以外の情報などを出力させて、ユーザが否定的な場合に、第１の情報だけを出力させてもよい。なお、ＣＰＵ１１０は、ユーザが否定的な場合に、第１の情報も第２の情報も出力させないようにしてもよい。あるいは、ＣＰＵ１１０は、ユーザが肯定的な場合に、第１の情報としての広告情報と広告以外の情報などを出力させて、ユーザが否定的な場合に、第２の情報としての広告以外の情報を出力させてもよい。この場合も、ＣＰＵ１１０は、ユーザが否定的な場合に、第１の情報も第２の情報も出力させないようにしてもよい。
　＜第６の実施の形態＞

　図６・図７に示すように、音声サービスサーバ１００のＣＰＵ１１０は、ユーザが電気機器３００のメッセージに答えたり、電気機器３００のメッセージに興味を示した際に、ユーザにポイントを付与したり、ユーザにポイントを付与した旨を伝えたりしてもよい。なお、ＣＰＵ１１０は、ユーザに聞いてもらいたいメッセージの出力前に、「当該メッセージに回答してくれたらポイントを付与する。」という旨を伝えてもよい。

　たとえば、図１７に示すように、ＣＰＵ１１０は、ステップＳ１１４やステップＳ１２４において、ユーザとメッセージなどの特定情報に対応付けて、メッセージに興味を持っていることを示すデータやメッセージを聞いたことを示すデータをメモリ１２０に格納する際に、ユーザにポイントを付与する処理や、ユーザにポイントを付与する旨を通信インターフェイス１６０を介して電気機器３００に出力させる処理などを実行する（ステップＳ７１６，ステップＳ７２６）。

　なお、ＣＰＵ１１０は、たとえば、図２に示すように、クイズを出したり、質問や提案を行ったりして、その回答に対してポイントを付与するようにすると、ユーザを電気機器３００からのメッセージに集中させやすくなるし、メッセージを聞いたか否かの判断や興味があるか否かの判断が容易になる。あるいは、ＣＰＵ１１０は、ユーザがクイズに正解した場合に当該ユーザに多めのポイントを付与し、ユーザがクイズに不正解だった場合に当該ユーザに少なめのポイントを付与したりポイントを付与しないようしたりすると、ユーザを電気機器３００からのメッセージに集中させやすくなるし、メッセージを聞いたか否かの判断や興味があるか否かの判断が容易になる。なお、クイズや提案などに限らず、ユーザの回答を促すための、ユーザに対する問い掛けであればよい。
　＜第７の実施の形態＞

　なお、第１～第６の実施の形態においては、音声サービスサーバ１００は、ユーザからのメッセージにキーワードが含まれているか否かや音声メッセージのやり取りの回数などに基づいて、ユーザが音声メッセージを聞いたか否かを判断・集計したり、またユーザが音声メッセージに興味を示したか否かを判断・集計したりするものであった。しかしながら、このような構成には限られない。

　たとえば、音声サービスサーバ１００のＣＰＵ１１０は、音声ではなく画像に基づいて、ユーザが音声メッセージを聞いたか否かを判断・集計したり、またユーザが音声メッセージに興味を示したか否かを判断・集計したりするものであってもよい。

　具体的には、電気機器３００のＣＰＵ３１０が、カメラ３５０の撮影画像を音声サービスサーバ１００に送信してもよい。そして、図１８に示すように、音声サービスサーバ１００のＣＰＵ１１０は、電気機器３００からの画像データを解析してもよい（ステップＳ８０２）。

　ＣＰＵ１１０は、ユーザが大きくうなずいた場合（ステップＳ８１２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザとメッセージまたはテーマなどの特定情報に対応付けて、興味を持っていることを示すデータをメモリ１２０に格納する（ステップＳ８１４）。ＣＰＵ１１０は、次の電気機器３００からの画像データを待ち受ける。

　逆に、ＣＰＵ１１０は、ユーザが小さくうなずいた場合あるいは首を振った場合（ステップＳ８２２にてＹＥＳである場合）、ＣＰＵ１１０は、ユーザとメッセージまたはテーマなどの特定情報に対応付けて、ユーザがメッセージを聞いたことを示すデータをメモリ１２０に格納する（ステップＳ８２４）。ＣＰＵ１１０は、次の電気機器３００からの画像データを待ち受ける。

　あるいは、ＣＰＵ１１０は、ユーザが笑顔のときにユーザがメッセージに興味を持っている判断したり広告を出力したりして、ユーザが笑顔ではないがうなずいた際にユーザが単にメッセージを聞いたと判断したり広告を出力しないようにしたりしてもよい。

　あるいは、電気機器３００の操作部３４０としての近接センサや温度センサからのデータに基づいて、ユーザが電気機器３００に手をかざしたり、電気機器３００の頭をなでたり・たたいたりしたことを検知して、その旨を音声サービスサーバ１００に送信してもよい。音声サービスサーバ１００のＣＰＵ１１０は、電気機器３００からのそのようなデータに基づいて、ユーザがメッセージに興味をもったと判断したり、ユーザがメッセージを聞いたと判断したりしてもよい。逆に、ユーザが電気機器３００に触れなければ、ＣＰＵ１１０は、ユーザがメッセージに興味がないと判断する。

　あるいは、電気機器３００の操作部３４０としてのボタンをユーザが押した場合に、その旨を音声サービスサーバ１００に送信してもよい。音声サービスサーバ１００のＣＰＵ１１０は、電気機器３００からのそのようなデータに基づいて、ユーザがメッセージに興味をもったと判断したり、ユーザがメッセージを聞いたと判断したりしてもよい。逆に、ユーザが電気機器３００に触れなければ、ＣＰＵ１１０は、ユーザがメッセージに興味がないと判断する。

　さらに、電気機器３００が近接センサによって取得されるデータや温度センサによって取得されるデータやマイクによって取得される音声データなどを利用してユーザの動作を検知することによって、音声サービスサーバ１００がユーザがメッセージを聞いたことを認識してもよい。また、電気機器３００がボタンによって取得されるデータやカメラによって取得される画像データなどを利用してユーザの動作を検知することによって、音声サービスサーバ１００がユーザがメッセージに興味を示したことを取得してもよい。すなわち、音声サービスサーバ１００のＣＰＵ１１０は、音声データ、画像データ、近接センサや温度センサからの検知データ、ボタンへの操作命令、などを組み合わせて、ユーザの動作やメッセージを聞いたことやメッセージに興味を示したことなどを認識してもよい。
　＜第８の実施の形態＞

　なお、第１～第７の実施の形態のような、サーバ１００や電気機器３００の構造・機能・動作に限られず、たとえば各装置の役割が、他のサーバやデータベースなどの複数の装置に分担されてもよい。逆に、複数の装置の役割の一部または全部が１つの装置に集約されてもよい。

　たとえば、図１９に示すように、第１から第７の実施の形態にかかる音声サービスサーバ１００の役割の全部を、スタンドアローン型の電気機器３００が有してもよい。電気機器３００は、対話サービスの一部の更新データだけを音声サービスサーバ１００から取得してもよいし、他のサーバ１００Ｂ，１００Ｃの情報を利用してもよい。また、第１から第７の実施の形態にかかる音声サービスサーバ１００の一部だけを電気機器３００が有するものであってもよい。
　＜その他の応用例＞

　本発明の一態様は、システム或いは装置にプログラムを供給することによって達成される場合にも適用できることはいうまでもない。そして、本発明の一態様を達成するためのソフトウェアによって表されるプログラムを格納した記憶媒体（あるいはメモリ）を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ（又はＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読出し実行することによっても、本発明の一態様の効果を享受することが可能となる。

　この場合、記憶媒体から読出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明の一態様を構成することになる。

　また、コンピュータが読出したプログラムコードを実行することにより、前述した実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているＯＳ（オペレーティングシステム）などが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれることは言うまでもない。

　さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わる他の記憶媒体に書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれることは言うまでもない。

　今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した説明ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

１　　　　：ネットワークシステム
１００　　：音声サービスサーバ
１００Ｂ　：情報提供サーバ
１００Ｃ　：情報提供サーバ
１１０　　：ＣＰＵ
１２０　　：メモリ
１４０　　：操作部
１６０　　：通信インターフェイス
３００　　：電気機器
３００Ａ　：ロボット
３００Ｂ　：冷蔵庫
３００Ｃ　：洗濯機
３００Ｄ　：エアコン
３００Ｅ　：電子レンジ
３１０　　：ＣＰＵ
３２０　　：メモリ
３３０　　：ディスプレイ
３３０Ａ　：ライト
３３０Ｂ　：ライト
３４０　　：操作部
３５０　　：カメラ
３６０　　：通信インターフェイス
３７０　　：スピーカ
３８０　　：マイク
３９０　　：機器駆動部

Claims

　スピーカを有する端末と通信するための通信インターフェイスと、
　前記通信インターフェイスを介して、前記端末にメッセージを出力させ、前記端末を介して取得したユーザの動作に基づいて、前記ユーザが前記メッセージを聞いたか否かを判断するためのプロセッサと、を備えるサーバ。
　前記プロセッサは、
　前記ユーザの動作が第１の所定の動作である場合に、前記ユーザが前記メッセージを第１のレベルの興味を持って聞いたと判断し、
　前記ユーザの動作が第２の所定の動作である場合に、前記ユーザが前記メッセージを第２のレベルの興味を持って聞いたと判断する、請求項１に記載のサーバ。
　前記プロセッサは、前記通信インターフェイスを介して前記端末に、前記メッセージとして、以前のメッセージに関する問い掛けを出力させ、前記ユーザの動作としての前記問い掛けに対するユーザからの回答を取得する、請求項１または２に記載のサーバ。
　前記プロセッサは、前記通信インターフェイスを介して前記端末に、前記メッセージとして、対話を構成する複数回の往復のうちの前記ユーザに向けた複数回のメッセージを出力させ、前記ユーザの動作として、前記対話を構成する複数回の往復のうちの前記ユーザからの複数回のメッセージを取得する、請求項１から３のいずれか１項に記載のサーバ。
　前記プロセッサは、前記端末から取得したユーザの動作に基づいて、ユーザ毎の第１の時間帯を決定または補正する、請求項１から４のいずれか１項に記載のサーバ。
　前記プロセッサは、前記ユーザ毎の第１の時間帯とそれ以外の時間帯とで、前記ユーザの動作に基づく判断の基準を異ならせる、請求項５に記載のサーバ。
　前記プロセッサは、
　前記ユーザが前記メッセージに対して肯定的な動作を行った場合に、前記通信インターフェイスを介して、前記端末に第１の情報を出力させ、
　前記ユーザが前記メッセージに対して肯定的な動作を行わなかった場合に、前記端末に第２の情報を出力させる、または前記端末に第１および第２の情報を出力させない、請求項１から６のいずれか１項に記載のサーバ。
　前記プロセッサは、前記通信インターフェイスを介して前記端末に、ユーザが所定の動作を実行するとポイントを付与する旨を出力させる、請求項１から７のいずれか１項に記載のサーバ。
　前記プロセッサは、前記ユーザの動作として、前記ユーザが前記端末に触れたことに基づいて、前記ユーザが前記メッセージを聞いたと判断する、請求項１から８のいずれか１項に記載のサーバ。
　通信インターフェイスとプロセッサとを含むサーバにおける情報処理方法であって、
　前記プロセッサが、前記通信インターフェイスを介して、端末にメッセージを出力させるステップと、
　前記プロセッサが、前記通信インターフェイスを介して前記端末から取得したユーザの動作に基づいて、前記ユーザが前記メッセージを聞いたか否かを判断するステップと、を備える、情報処理方法。
　メッセージを出力するためのスピーカを有する端末と、
　前記端末に前記メッセージを出力させ、前記端末から取得したユーザの動作に基づいて、前記ユーザが前記メッセージを聞いたか否かを判断するサーバと、を備えるネットワークシステム。
　スピーカと、
　マイクまたはカメラまたは他のセンサと、
　通信インターフェイスと、
　前記通信インターフェイスを介して受信したサーバからの情報に基づいて前記スピーカにメッセージを出力させ、前記マイクまたはカメラまたは他のセンサを介して取得したユーザの動作を示す情報を前記サーバに提供し、前記サーバからのデータに基づいて前記ユーザが前記メッセージを聴いていると判断された際の音声または前記ユーザが前記メッセージを聴いていないと判断された際の音声を前記スピーカに出力させるためのプロセッサと、を備える端末。
　前記プロセッサは、前記ユーザの動作として、ユーザが端末に触れたことを示す情報を前記サーバに提供する、請求項１２に記載の端末。