JP2019207380A

JP2019207380A - 放音システム、情報処理システム、情報提供方法および情報処理方法

Info

Publication number: JP2019207380A
Application number: JP2018103922A
Authority: JP
Inventors: 石田　哲朗; Tetsuro Ishida; 哲朗石田; 優樹瀬戸; Yuki Seto
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2018-05-30
Filing date: 2018-05-30
Publication date: 2019-12-05
Anticipated expiration: 2038-05-30
Also published as: JP7196426B2; WO2019230363A1

Abstract

【課題】利用者が煩雑な作業を必要とすることなく音声に関する情報を取得する。【解決手段】放音システム２０は、利用者からの入力を受付ける収音装置２１と、音響を放音する放音装置２２と、収音装置２１が受付けた入力に対する応答を表す応答音声Ｖ2と当該応答に関する関連情報の識別情報Ｉを表す音響成分とを放音装置２２に放音させる放音制御部２４５とを具備する。【選択図】図２

Description

本発明は、端末装置に情報を提供する技術に関する。

音声により利用者に情報を提供するサービスが広く普及している。例えば特許文献１には、自動販売機を利用する利用者と対話をすることで、自動販売機の操作を補助するサービスロボットが開示されている。

特開２００７−１１８８０号公報

しかし、特許文献１の技術では、サービスロボットは利用者に対して対話のための音声を発声するにすぎない。サービスロボットが発声する音声の内容に関する更に詳細な情報を所望する利用者は、自身が聴取した音声に関する情報を、例えば端末装置を操作することで検索サイトを利用して取得する必要がある。以上の事情を背景として、本発明の好適な態様は、利用者が煩雑な作業を必要とすることなく音声に関する情報を取得することを目的とする。

以上の課題を解決するために、本発明の好適な態様に係る情報提供方法は、利用者からの入力を受付け、前記受付けた入力に対する応答を表す応答音声と当該応答に関する関連情報の識別情報を表す音響成分とを放音装置に放音させる。
本発明の好適な態様に係る情報処理方法は、利用者による入力に対する応答を生成し、前記生成した応答に関する関連情報を生成し、前記生成した応答を表す応答音声と、前記関連情報に対応する識別情報を表す音響成分とを表す音響データを、当該音響データに応じて放音する放音システムに対して送信する動作を、通信装置に実行させ、前記放音システムによる音響通信で前記識別情報を受信した端末装置からの情報要求に応じて、当該識別情報に対応する関連情報を当該端末装置に送信する動作を、前記通信装置に実行させる。
本発明の好適な態様に係る放音システムは、利用者からの入力を受付ける受付部と、音響を放音する放音装置と、前記受付部が受付けた入力に対する応答を表す応答音声と当該応答に関する関連情報の識別情報を表す音響成分とを前記放音装置に放音させる放音制御部とを具備する。
本発明の好適な態様に係る情報処理システムは、利用者による入力に対する応答を生成する応答生成部と、前記応答生成部が生成した応答に関する関連情報を生成する関連情報生成部と、前記応答生成部が生成した応答を表す応答音声と、前記関連情報生成部が生成した関連情報に対応する識別情報を表す音響成分とを表す音響データを、当該音響データに応じて放音する放音システムに対して送信する動作を、通信装置に実行させる第１通信制御部と、前記放音システムによる音響通信で前記識別情報を受信した端末装置からの情報要求に応じて、当該識別情報に対応する関連情報を当該端末装置に送信する動作を、前記通信装置に実行させる第２通信制御部とを具備する。

第１実施形態における情報提供システムの構成を例示するブロック図である。放音システムの構成を例示するブロック図である。応答サーバの構成を例示するブロック図である。関連情報テーブルの模式図である。信号生成部の構成を例示するブロック図である。情報提供サーバの構成を例示するブロック図である。端末装置の構成を例示するブロック図である。情報提供システムの全体の処理を例示するフローチャートである。

＜第１実施形態＞
図１は、本発明の第１実施形態に係る情報提供システム１００の構成を例示するブロック図である。図１に例示される通り、第１実施形態の情報提供システム１００は、放音システム２０と応答サーバ３０と情報提供サーバ４０とを具備する。情報提供システム１００は、端末装置５０の利用者Ｕに各種の情報を提供するためのコンピュータシステムである。具体的には、端末装置５０の利用者Ｕが発音した音声（以下「発話音声」という）Ｖ1に対する応答と、当該応答に関連する情報（以下「関連情報」という）Ｒとが利用者Ｕに提供される。応答サーバ３０は、例えばインターネットを含む通信網を介して、放音システム２０および情報提供サーバ４０と通信する。応答サーバ３０は、利用者Ｕの発話音声Ｖ1に対する応答と、当該応答に関連する関連情報Ｒとを生成する。応答サーバ３０が生成した応答を表す音声（以下「応答音声」という）Ｖ2が放音システム２０により再生され、応答サーバ３０が生成した関連情報Ｒが情報提供サーバ４０により端末装置５０に送信される。以下、情報提供システム１００の詳細を説明する。

＜放音システム２０＞
図２は、放音システム２０の構成を例示するブロック図である。放音システム２０は、端末装置５０の利用者Ｕによる発話音声Ｖ1に対する応答音声Ｖ2を再生するコンピュータシステムである。利用者Ｕと対話する音声対話装置（いわゆるＡＩスピーカ）が放音システム２０として好適に利用される。例えば携帯電話機やスマートフォン等の可搬型の情報処理装置、または、パーソナルコンピュータ等の情報処理装置が放音システム２０として利用される。また、動物等の外観を模擬した玩具（例えば動物のぬいぐるみ等の人形）やロボットの形態で放音システム２０を実現することも可能である。例えば、駅またはバス停等の交通施設、鉄道またはバス等の交通機関、販売店または飲食店等の商業施設、旅館またはホテル等の宿泊施設、博物館または美術館等の展示施設、史跡または名所等の観光施設、競技場または体育館等の運動施設、等に放音システム２０が設置される。

発話音声Ｖ1は、例えば問掛け（質問）および話掛けを含む発話の音声である。他方、応答音声Ｖ2は、問掛けに対する回答や話掛けに対する受応えを含む応答の音声である。例えば、商業施設内の飲食店の場所を質問する「近くにレストランはありますか？」という発話音声Ｖ1を利用者Ｕが発話すると、当該発話音声Ｖ1に対して回答する「レストランＡＢＣが近くにあります。」という応答音声Ｖ2が放音システム２０から再生される。図２に例示される通り、第１実施形態の放音システム２０は、収音装置２１（受付部の一例）と放音装置２２と記憶装置２３と制御装置２４と通信装置２５とを具備する。

収音装置２１は、周囲の音響を収音する入力機器である。第１実施形態の収音装置２１は、利用者Ｕが発音した発話音声Ｖ1を表すデータ（以下「入力データ」という）Ｄ1を生成する。すなわち、収音装置２１は、利用者Ｕが発音した発話音声Ｖ1（利用者Ｕによる入力の一例）を受付ける受付部として機能する。具体的には、収音装置２１は、利用者Ｕが発音した発話音声Ｖ1を収音して当該発話音声Ｖ1の波形を表す信号を生成するマイクロホンと、当該信号をアナログからデジタルに変換することで入力データＤ1を生成するＡ／Ｄ変換器とを具備する。

制御装置２４（コンピュータの例示）は、例えばＣＰＵ（Central Processing Unit）等の処理回路で構成され、放音システム２０の各要素を統括的に制御する。記憶装置２３は、制御装置２４が実行するプログラムと、制御装置２４が使用する各種のデータとを記憶する。例えば半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置２３として任意に採用される。

制御装置２４は、図２に例示される通り、記憶装置２３に記憶されたプログラムを実行することで複数の機能（通信制御部２４３および放音制御部２４５）を実現する。なお、制御装置２４の一部の機能を専用の電子回路で実現してもよい。また、制御装置２４の機能を複数の装置に搭載してもよい。

通信制御部２４３は、各種の情報の受信および送信を通信装置２５に実行させる。第１に、通信制御部２４３は、収音装置２１が生成した入力データＤ1を応答サーバ３０に対して送信する動作を、通信装置２５に実行させる。入力データＤ1を受信した応答サーバ３０は、当該入力データＤ1が表す発話音声Ｖ1に対する応答音声Ｖ2を放音システム２０に放音させるためのデータ（以下「音響データ」という）Ｄ2を生成する。第２に、通信制御部２４３は、応答サーバ３０が生成した音響データＤ2を応答サーバ３０から受信する動作を、通信装置２５に実行させる。放音制御部２４５は、応答サーバ３０から送信された音響データＤ2に応じた音響を放音装置２２に放音させる。

通信装置２５は、通信制御部２４３による制御のもとで通信網を介して応答サーバ３０と相互に通信する通信機器である。具体的には、通信装置２５は、送信部２５１と受信部２５３とを具備する。送信部２５１は、収音装置２１が収音した発話音声Ｖ1を表す入力データＤ1を応答サーバ３０に送信する。受信部２５３は、応答サーバ３０が生成した音響データＤ2を受信する。放音装置２２は、各種の音響を放音する出力装置である。具体的には、放音装置２２は、放音制御部２４５による制御のもとで、通信装置２５が受信した音響データＤ2に応じた音響を放音する。すなわち、音響データＤ2が表す応答音声Ｖ2が放音装置２２により放音される。したがって、発話音声Ｖ1を発音した利用者Ｕは、当該発話音声Ｖ1に対する応答音声Ｖ2を聴取することが可能である。

＜応答サーバ３０＞
図３は、応答サーバ３０の構成を例示するブロック図である。第１実施形態の応答サーバ３０は、利用者Ｕの発話音声Ｖ1に対する応答と、当該応答に関する関連情報Ｒとを生成するコンピュータシステムである。具体的には、応答サーバ３０は、記憶装置３１と制御装置３２と通信装置３３とを具備する。

記憶装置３１は、制御装置３２が実行するプログラムと、制御装置３２が使用する各種のデータとを記憶する。例えば半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置３１として任意に採用される。第１実施形態の記憶装置３１は、関連情報テーブルを記憶する。関連情報テーブルは、発話音声Ｖ1に対する応答の関連情報Ｒを特定するために利用されるデータテーブルである。関連情報テーブルの詳細については後述する。

制御装置３２（コンピュータの例示）は、例えばＣＰＵ（Central Processing Unit）等の処理回路で構成され、放音システム２０の各要素を統括的に制御する。図２に例示される通り、第１実施形態の制御装置３２は、記憶装置３１に記憶されたプログラムを実行することで複数の機能（音声認識部３２１，応答生成部３２２，関連情報生成部３２３，識別情報生成部３２４，信号生成部３２５，通信制御部３２６）を実現する。なお、制御装置３２の一部の機能を専用の電子回路で実現してもよい。また、制御装置３２の機能を複数の装置に搭載してもよい。

音声認識部３２１は、放音システム２０から送信された入力データＤ1に対する音声認識により、発話音声Ｖ1の発話内容を表す文字列（以下「発話文字列」という）を特定する。例えば、レストランの場所を質問する内容の発話音声Ｖ1を利用者Ｕが発音した場合には、「レストランは近くにありますか？」という発話文字列が特定される。入力データＤ1に対する音声認識には、例えばＨＭＭ（Hidden Markov Model）等の音響モデルと、言語的な制約を示す言語モデルとを利用した認識処理等の公知の技術が任意に採用される。

応答生成部３２２は、発話音声Ｖ1に対する応答を生成する。具体的には、応答生成部３２２は、音声認識部３２１が特定した発話文字列に対する応答を表す文字列（以下「応答文字列」という）を生成する。例えば「レストランは近くにありますか？」という発話文字列が特定された場合には、レストランＡＢＣの所在を表す「レストランＡＢＣが近くにあります。」という応答文字列が特定される。応答文字列の生成には、発話文字列に対する形態素解析等の自然言語処理および人工知能を利用した対話技術等の公知の技術が任意に採用される。

関連情報生成部３２３は、応答生成部３２２が生成した応答に関する関連情報Ｒを生成する。第１実施形態の関連情報Ｒは、例えば応答の内容を補足するためのコンテンツである。例えば応答文字列に含まれる特定の単語（以下「応答単語」という）の内容を補足するためのコンテンツが関連情報Ｒとして例示される。応答単語は、例えば応答文字列に含まれる単語のうち固有名詞等の特徴的な単語である。応答文字列「レストランＡＢＣが近くにあります。」に含まれる応答単語は、「レストランＡＢＣ」である。応答単語が表す事柄を説明する情報（例えばホームページのＵＲＬ）、応答単語が表す事柄の所在を示す情報（例えば地図画像、地図のＵＲＬ、所在を示す文字列）等の各種のコンテンツが関連情報Ｒとして例示される。例えば、応答単語が表す事柄が飲食店の場合には、当該飲食店のメニューや混雑情報を知らせるコンテンツを関連情報Ｒとしてもよい。なお、関連情報Ｒは、以上の例示に限定されず、応答単語の内容や種類に応じて任意に変更される。応答単語の抽出には、例えば形態素解析等の公知の自然言語処理が任意に採用される。

関連情報Ｒの生成には、関連情報テーブルが利用される。図４は、関連情報テーブルの模式図である。図４に例示される通り、関連情報テーブルは、複数の関連情報Ｒが登録されたテーブルである。具体的には、複数の応答単語の各々について、当該応答単語に対応する関連情報Ｒが登録される。

関連情報生成部３２３は、応答生成部３２２が生成した応答文字列から応答単語を抽出し、関連情報テーブルに登録された複数の関連情報Ｒのうち当該応答単語に対応する関連情報Ｒを特定する。以上の説明から理解される通り、第１実施形態では、応答生成部３２２が生成した応答文字列の応答単語に対応する関連情報Ｒが生成される。なお、応答に対して複数の関連情報Ｒを生成してもよい。

図３の識別情報生成部３２４は、関連情報生成部３２３が生成した関連情報Ｒを識別するための識別情報Ｉを生成する。関連情報テーブルに登録された複数の関連情報Ｒの各々について相異なる識別情報Ｉが生成される。なお、各関連情報Ｒについて事前に生成した識別情報Ｉを当該関連情報Ｒに対応付けて関連情報テーブルに予め登録してもよい。

信号生成部３２５は、応答生成部３２２が生成した応答を表す応答音声Ｖ2と、関連情報生成部３２３が生成した関連情報Ｒに対応する識別情報Ｉの音響成分とを表す音響データＤ2を生成する。第１実施形態では、応答音声Ｖ2と識別情報Ｉの音響成分との混合音を表す音響データＤ2が生成される。図５は、信号生成部３２５のブロック図である。図５に例示される通り、第１実施形態の信号生成部３２５は、音声合成部７１と変調処理部７３と加算部７４とを具備する。音声合成部７１は、応答生成部３２２が生成した応答文字列に対する音声合成で音声信号を生成する。音声信号の生成には、公知の音声合成技術が任意に採用される。

変調処理部７３は、識別情報生成部３２４が生成した識別情報Ｉの音響成分を表す変調信号を生成する。変調信号は、例えば所定の周波数の搬送波を識別情報Ｉにより周波数変調することで生成される。なお、拡散符号を利用した各情報の拡散変調と所定の周波数の搬送波を利用した周波数変換とを順次に実行することで変調信号を生成してもよい。変調信号の周波数帯域は、放音装置２２による放音と端末装置５０による収音とが可能な周波数帯域であり、かつ、端末装置５０の利用者Ｕが通常の環境で聴取する音声の周波数帯域を上回る周波数帯域（例えば１８ｋＨｚ以上かつ２０ｋＨｚ以下）に設定される。したがって、利用者Ｕは、識別情報Ｉの音響成分を殆ど聴取できない。ただし、変調信号の周波数帯域は任意であり、例えば可聴帯域内の変調信号を生成することも可能である。

加算部７４は、音声合成部７１が生成した音声信号と、変調処理部７３が生成した変調信号とを加算することで、音響データＤ2を生成する。

図３の通信制御部３２６（第１通信制御部の例示）は、各種の情報の受信および送信を通信装置３３に実行させる。第１に、通信制御部３２６は、放音システム２０から送信された入力データＤ1を受信する動作を通信装置３３に実行させる。第２に、通信制御部３２６は、信号生成部３２５が生成した音響データＤ2を放音システム２０に対して送信する動作を、通信装置３３に実行させる。第３に、通信制御部３２６は、関連情報生成部３２３が生成した関連情報Ｒと、識別情報生成部３２４が当該関連情報Ｒについて生成した識別情報Ｉとを含むデータ（以下「提供データ」という）Ｄ3を情報提供サーバ４０に対して送信する動作を、通信装置３３に実行させる。

通信装置３３は、通信制御部３２６による制御のもとで通信網を介して放音システム２０および情報提供サーバ４０の各々と相互に通信する。具体的には、通信装置３３は、送信部３３１と受信部３３３とを含む。受信部３３３は、放音システム２０から送信された入力データＤ1を受信する。送信部３３１は、信号生成部３２５が生成した音響データＤ2を放音システム２０に対して送信し、提供データＤ3を情報提供サーバ４０に対して送信する。

音響データＤ2を受信した放音システム２０の放音制御部２４５は、当該音響データＤ2に応じて放音装置２２に放音させる。具体的には、音響データＤ2を放音装置２２に供給することで、当該音響データＤ2が表す混合音が放音装置２２から放音される。すなわち、利用者Ｕの発話音声Ｖ1に対する応答音声Ｖ2と、当該応答音声Ｖ2が表す応答に関する関連情報Ｒの識別情報Ｉの音響成分とが放音装置２２から放音される。

以上の説明から理解される通り、第１実施形態の放音装置２２は、応答音声Ｖ2を再生する音響機器として機能するほか、空気振動としての音波を伝送媒体とした音響通信により識別情報Ｉを周囲に送信する送信機としても機能する。すなわち、応答音声Ｖ2を放音する放音装置２２から識別情報Ｉの音響を放音する音響通信により、当該識別情報Ｉが周囲に送信される。識別情報Ｉは、応答音声Ｖ2の放音毎に送信される。例えば、応答音声Ｖ2の放音とともに（例えば応答音声Ｖ2の放音に並行または前後して）識別情報Ｉが送信される。

＜情報提供サーバ４０＞
図６は、情報提供サーバ４０のブロック図である。情報提供サーバ４０は、利用者Ｕの発話音声Ｖ1に対する応答に関する関連情報Ｒを端末装置５０に送信するためのコンピュータシステムである。図６に例示される通り、第１実施形態の情報提供サーバ４０は、記憶装置４１と制御装置４２と通信装置４３とを具備する。

記憶装置４１は、制御装置４２が実行するプログラムと、制御装置４２が使用する各種のデータとを記憶する。例えば半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置４１として任意に採用される。第１実施形態の記憶装置４１は、情報提供テーブルを記憶する。情報提供テーブルは、発話音声Ｖ1に対する応答の関連情報Ｒを端末装置５０に提供するために利用されるデータテーブルである。具体的には、応答サーバ３０から送信された提供データＤ3に含まれる識別情報Ｉと関連情報Ｒとが相互に対応した状態で情報提供テーブルに登録される。なお、利用者Ｕからの発話音声Ｖ1毎に提供データＤ3の生成は実行されるから、複数の関連情報Ｒの各々について当該関連情報Ｒに対応する識別情報Ｉが登録される。

制御装置４２（コンピュータの例示）は、例えばＣＰＵ（Central Processing Unit）等の処理回路で構成され、放音システム２０の各要素を統括的に制御する。図２に例示される通り、第１実施形態の制御装置４２は、記憶装置４１に記憶されたプログラムを実行することで複数の機能（記憶制御部４２１、関連情報特定部４２３，通信制御部４２５）を実現する。なお、制御装置４２の一部の機能を専用の電子回路で実現してもよい。また、制御装置４２の機能を複数の装置に搭載してもよい。

記憶制御部４２１は、通信装置４３が受信した提供データＤ3を記憶装置４１に記憶させる。具体的には、記憶制御部４２１は、提供データＤ3に含まれる識別情報Ｉと関連情報Ｒとを対応させて情報提供テーブルに登録する。

関連情報特定部４２３は、放音システム２０による音響通信で識別情報Ｉを受信した端末装置５０からの情報要求に応じて、当該識別情報Ｉに対応する関連情報Ｒを特定する。端末装置５０からの情報要求には、識別情報Ｉが含まれる。具体的には、関連情報特定部４２３は、情報提供テーブルに登録された複数の関連情報Ｒのうち、端末装置５０からの情報要求に含まれる識別情報Ｉに対応する関連情報Ｒを情報提供テーブルから特定する。

通信制御部４２５（第２通信制御部の例示）は、各種の情報の受信および送信を通信装置４３に実行させる。第１に、通信制御部４２５は、応答サーバ３０から送信された提供データＤ3を受信する動作を通信装置４３に実行させる。第２に、通信制御部４２５は、放音システム２０による音響通信で識別情報Ｉを受信した端末装置５０からの情報要求に応じて、当該識別情報Ｉに対応する関連情報Ｒ（すなわち関連情報特定部４２３が特定した関連情報Ｒ）を当該端末装置５０に送信する動作を、通信装置４３に実行させる。

通信装置４３は、通信制御部４２５による制御のもとで通信網を介して応答サーバ３０および端末装置５０の各々と相互に通信する。具体的には、通信装置４３は、送信部４３１と受信部４３３とを含む。受信部４３３は、応答サーバ３０から送信された提供データＤ3を受信する。送信部４３１は、端末装置５０に対して関連情報Ｒを送信する。なお、応答サーバ３０と情報提供サーバ４０とは、利用者Ｕの発話音声Ｖ1に対する応答と、当該応答に関する関連情報Ｒとを生成する情報処理システムとして機能する。

＜端末装置５０＞
図７は、端末装置５０のブロック図である。端末装置５０は、放音システム２０の付近に所在する。端末装置５０は、利用者Ｕが発話した発話音声Ｖ1に対する応答に関連する関連情報Ｒを、情報提供サーバ４０から取得するための可搬型の情報端末である。例えば携帯電話機、スマートフォン、タブレット端末、またはパーソナルコンピュータ等が端末装置５０として好適である。

図７に例示される通り、端末装置５０は、収音装置５１と制御装置５２と記憶装置５３と通信装置５４と再生装置５５とを具備する。収音装置５１は、周囲の音響を収音する音響機器（マイクロホン）である。具体的には、収音装置５１は、放音システム２０が音響データＤ2に応じて放音した音響を収音し、当該音響の波形を表す音響信号Ｙを生成する。したがって、放音システム２０の付近での収音により生成された音響信号Ｙには、識別情報Ｉの音響成分が含まれ得る。

以上の説明から理解される通り、収音装置５１は、端末装置５０の相互間の音声通話または動画撮影時の音声収録に利用されるほか、空気振動としての音波を伝送媒体とする音響通信により識別情報Ｉを受信する受信機としても機能する。なお、収音装置５１が生成した音響信号Ｙをアナログからデジタルに変換するＡ/Ｄ変換器の図示は便宜的に省略した。また、端末装置５０と一体に構成された収音装置５１に代えて、別体の収音装置５１を有線または無線により端末装置５０に接続してもよい。

制御装置５２（コンピュータの例示）は、例えばＣＰＵ（Central Processing Unit）等の処理回路で構成され、端末装置５０の各要素を統括的に制御する。記憶装置５３は、制御装置５２が実行するプログラムと、制御装置５２が使用する各種のデータとを記憶する。例えば半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置５３として任意に採用され得る。

制御装置５２は、図７に例示される通り、記憶装置５３に記憶されたプログラムを実行することで複数の機能（情報抽出部５２１および再生制御部５２３）を実現する。なお、制御装置５２の一部の機能を専用の電子回路で実現してもよい。また、制御装置５２の機能を複数の装置に搭載してもよい。

情報抽出部５２１は、収音装置５１が生成した音響信号Ｙから識別情報Ｉを抽出する。具体的には、情報抽出部５２１は、例えば、音響信号Ｙのうち識別情報Ｉの音響成分を含む周波数帯域を強調するフィルタ処理と、識別情報Ｉに対する変調処理に対応した復調処理とにより、識別情報Ｉを抽出する。情報抽出部５２１が抽出した識別情報Ｉは、当該識別情報Ｉに対応する関連情報Ｒ（すなわち放音装置２２により放音された応答音声Ｖ2が表す応答に関する関連情報Ｒ）の取得に利用される。

なお、識別情報Ｉを受信できるのは当該識別情報Ｉに対応する応答音声Ｖ2を収音可能な範囲内の位置に制限されるから、識別情報Ｉは、端末装置５０の位置を示す情報とも表現できる。したがって、放音システム２０の周囲に位置する端末装置５０に限定して、関連情報Ｒを提供できる。

通信装置５４は、制御装置５２による制御のもとで通信網を介して情報提供サーバ４０と通信する。第１実施形態の通信装置５４は、情報抽出部５２１が抽出した識別情報Ｉを情報提供サーバ４０に送信する。情報提供サーバ４０は、端末装置５０から送信された識別情報Ｉに対応した関連情報Ｒを取得して端末装置５０に送信する。通信装置５４は、情報提供サーバ４０から送信された関連情報Ｒを受信する。

再生制御部５２３は、通信装置５４が受信した関連情報Ｒを再生装置５５に再生させる。再生装置５５は、関連情報Ｒを再生する出力機器である。具体的には、再生装置５５は、関連情報Ｒが表す画像を表示する表示装置を含む。なお、端末装置５０と一体に構成された再生装置５５に代えて、別体の再生装置５５を有線または無線により端末装置５０に接続してもよい。また、当該関連情報Ｒが表す音響を放音する放音装置を再生装置５５が含んでもよい。すなわち、再生装置５５による再生は、画像の表示と音響の放音とを包含する。

図８は、情報提供システム１００全体の処理のフローチャートである。利用者Ｕによる発話音声Ｖ1の発音を契機として図９の処理が開始される。放音システム２０の収音装置２１は、利用者Ｕからの発話音声Ｖ1を受付ける（Ｓa1）。具体的には、利用者Ｕが発話した発話音声Ｖ1を表す入力データＤ1が収音装置２１により生成される。放音システム２０の通信制御部２４３は、収音装置２１が生成した入力データＤ1を応答サーバ３０に送信する動作を通信装置２５に実行させる（Ｓa2）。

応答サーバ３０の通信制御部３２６は、放音システム２０から送信された入力データＤ1を受信する動作を通信装置３３に実行させる（Ｓa3）。音声認識部３２１は、通信装置３３が受信した入力データＤ1に対する音声認識により発話文字列を特定する（Ｓa4）。応答生成部３２２は、発話音声Ｖ1に対する応答を生成する（Ｓa5）。具体的には、音声認識部３２１が特定した発話文字列に対応する応答文字列が生成される。関連情報生成部３２３は、応答生成部３２２が生成した応答に関する関連情報Ｒを生成する（Ｓa6）。識別情報生成部３２４は、関連情報生成部３２３が生成した関連情報Ｒを識別するための識別情報Ｉを生成する（Ｓa7）。信号生成部３２５は、音響データＤ2を生成する（Ｓa8）。具体的には、応答音声Ｖ2と識別情報Ｉの音響成分との混合音を表す音響データＤ2が生成される。通信制御部３２６は、提供データＤ3を情報提供サーバ４０に送信する動作を通信装置３３に実行させる（Ｓa9）。提供データＤ3は、関連情報生成部３２３が生成した関連情報Ｒと、識別情報生成部３２４が当該関連情報Ｒについて生成した識別情報Ｉとを含む。

情報提供サーバ４０の通信制御部４２５は、応答サーバ３０から送信された提供データＤ3を受信する動作を通信装置４３に実行させる（Ｓa10）。記憶制御部４２１は、通信装置４３が受信した提供データＤ3を記憶装置４１に記憶する（Ｓa11）。具体的には、記憶制御部４２１は、提供データＤ3に含まれる関連情報Ｒと識別情報Ｉとを対応させて記憶装置４１に格納する。

応答サーバ３０の通信制御部３２６は、信号生成部３２５が生成した音響データＤ2を放音システム２０に対して送信する動作を通信装置３３に実行させる（Ｓa12）。放音システム２０の通信制御部２４３は、応答サーバ３０から送信された音響データＤ2を受信する動作を通信装置２５に実行させる（Ｓa13）。放音制御部２４５は、音響データＤ2に応じて放音装置２２に放音させる（Ｓa14）。放音装置２２は、応答音声Ｖ2と識別情報Ｉの音響成分との混合音の放音により、識別情報Ｉを端末装置５０に送信する（Ｓa15）。すなわち、放音装置２２を利用した音響通信により識別情報Ｉが端末装置５０に送信される。

端末装置５０の収音装置５１は、放音システム２０が音響データＤ2に応じて放音した音響（すなわち識別情報Ｉの音響成分を含む音響）を収音する（Ｓa16）。具体的には、収音した音響の波形を表す音響信号が生成される。情報抽出部５２１は、収音装置５１が生成した音響信号から識別情報Ｉを抽出する（Ｓa17）。通信装置５４は、情報抽出部５２１が抽出した識別情報Ｉを情報提供サーバ４０に送信する（Ｓa18）。

情報提供サーバ４０の通信制御部４２５は、端末装置５０から送信された識別情報Ｉを受信する動作を通信装置４３に実行させる（Ｓa19）。関連情報特定部４２３は、通信装置４３が受信した識別情報Ｉに対応する関連情報Ｒを特定する（Ｓa20）。通信制御部４２５は、関連情報特定部４２３が特定した関連情報Ｒを端末装置５０に送信する動作を通信装置４３に実行させる（Ｓa21）。

端末装置５０の通信装置５４は、情報提供サーバ４０から送信された関連情報Ｒを受信する（Ｓa22）。再生制御部５２３は、通信装置５４が受信した関連情報Ｒを再生装置５５に再生させる（Ｓa23）。すなわち、放音装置２２により放音された応答音声Ｖ2が表す応答に関する関連情報Ｒが再生装置５５により再生される。

以上の説明から理解される通り、第１実施形態では、応答音声Ｖ2を放音する放音装置２２を利用した音響通信により識別情報Ｉが端末装置５０に送信されるから、応答音声Ｖ2が表す応答に関する関連情報Ｒ（例えば応答に関する更に詳細な情報）を、端末装置５０が当該識別情報Ｉを利用して取得できる。したがって、応答音声Ｖ2に関する関連情報Ｒを取得するために利用者Ｕが端末装置５０に煩雑な操作を付与する負荷を軽減できる。また、応答音声Ｖ2を放音するための放音装置２２を流用して端末装置５０に識別情報Ｉを送信できる。すなわち、識別情報Ｉの送信に専用される送信機が不要である。

第１実施形態では、放音システム２０が受付けた発話音声Ｖ1が応答サーバ３０に送信され、応答サーバ３０が生成した応答を表す応答音声Ｖ2の音響データＤ2が受信部２５３により受信されるから、応答音声Ｖ2を生成するための要素を放音システム２０に内蔵する必要がない。したがって、放音システム２０の構成および動作が簡素化される。また、第１実施形態では、応答生成部３２２が生成した応答文字列に含まれる応答単語に対応する関連情報Ｒが生成されるから、応答文字列の全体に対応する関連情報Ｒを特定する構成と比較して、関連情報Ｒを簡単に特定できる。

＜第２実施形態＞
本発明の第２実施形態を説明する。なお、以下の各例示において機能が第１実施形態と同様である要素については、第１実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。

第１実施形態では、関連情報Ｒの識別情報Ｉを応答サーバ３０により生成する。それに対して、第２実施形態では、関連情報Ｒの識別情報Ｉを放音システム２０により生成する。すなわち、第２実施形態の応答サーバ３０において、識別情報生成部３２４は省略される。

第２実施形態の放音システム２０の制御装置２４は、通信制御部２４３および放音制御部２４５に加えて、識別情報生成部３２４としても機能する。利用者Ｕが発音した発話音声Ｖ1を収音装置２１が受付けると（すなわち入力データＤ1を生成すると）、識別情報生成部３２４は、当該入力データＤ1に対応する識別情報Ｉを生成する。当該入力データＤ1に応じて応答サーバ３０が生成する関連情報Ｒに対応する識別情報Ｉが、識別情報生成部３２４により予め生成される。第２実施形態の通信制御部２４３は、放音装置２２が生成した入力データＤ1と、識別情報生成部３２４が生成した識別情報Ｉとを応答サーバ３０に送信する動作を、通信装置２５に実行させる。

第２実施形態の応答サーバ３０の通信制御部３２６は、放音システム２０から送信された入力データＤ1および識別情報Ｉを受信する動作を通信装置３３に実行させる。入力データＤ1を受信した応答サーバ３０の音声認識部３２１は、第１実施形態と同様に、入力データＤ1から発話文字列を特定する。応答生成部３２２は、第１実施形態と同様に、発話文字列に対する応答文字列を生成する。関連情報生成部３２３は、第１実施形態と同様に、応答文字列が表す応答に関する関連情報Ｒを生成する。第２実施形態の信号生成部３２５は、応答音声Ｖ2と、放音システム２０から送信された識別情報Ｉの音響成分とを表す音響データＤ2を生成する。信号生成部３２５により生成された音響データＤ2は、第１実施形態と同様に、通信制御部３２６による制御のもとで放音システム２０に対して送信される。関連情報生成部３２３が生成した関連情報Ｒと、放音システム２０から送信された識別情報Ｉとを含む提供データＤ3は、通信制御部３２６による制御のもとで情報提供サーバ４０に対して送信される。

提供データＤ3を受信した情報提供サーバ４０は、第１実施形態と同様に、提供データＤ3を記憶装置４１に記憶する。すなわち、放音システム２０により生成された識別情報Ｉが、応答サーバ３０により生成された関連情報Ｒに対応した状態で記憶装置４１に登録される。音響データＤ2を受信した放音システム２０は、第１実施形態と同様に、応答音声Ｖ2と、当該応答音声Ｖ2対応する関連情報Ｒの識別情報Ｉを表す音響成分とを音響データＤ2に応じて放音する。端末装置５０は、第１実施形態と同様に、情報提供サーバ４０から関連情報Ｒを取得する。

第２実施形態においても第１実施形態と同様の効果が実現される。第２実施形態では、応答サーバ３０で識別情報Ｉを生成することなく、応答音声Ｖ2と識別情報Ｉとの対応を応答サーバ３０において管理することができる。

＜変形例＞
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された複数の態様を、相互に矛盾しない範囲で適宜に併合してもよい。

（１）前述の各形態では、発話音声Ｖ1を利用者Ｕによる入力として例示したが、利用者Ｕによる入力は発話音声Ｖ1に限定されない。例えば利用者Ｕにより指定された文字列を利用者Ｕによる入力としてもよい。例えば、利用者Ｕからの指示を受付ける操作装置（図示略）を放音システム２０が具備する構成が想定される。操作装置は、例えば利用者Ｕが操作する複数の操作子（例えば５０音の各仮名文字にそれぞれ対応した複数の操作子）を含んで構成される。利用者Ｕは、例えば問掛け（質問）および話掛けを含む文字列（以下「入力文字列」という）を操作装置に対して指示する。操作装置は、入力文字列を受付ける。具体的には、入力文字列を表す入力データＤ1が生成される。すなわち、操作装置は、利用者Ｕが操作装置に対して指示した入力文字列を受付ける受付部として機能する。入力データＤ1を受信した応答サーバ３０は、当該入力データＤ1に応じて応答文字列および関連情報Ｒを生成する。すなわち、音声認識部３２１は省略される。

また、例えば事前に準備された質問や話掛けをそれぞれ表す複数の選択肢のうち所望の選択肢を、利用者Ｕが操作装置を利用して選択してもよい。利用者Ｕが選択した選択肢に設定された質問や話掛けを示す入力データＤ1が生成される。すなわち、操作装置は、利用者Ｕによる選択肢の選択を受付ける受付部として機能する。選択肢の選択が利用者Ｕの入力に相当する。以上の説明から理解される通り、利用者Ｕからの入力は、利用者Ｕの意図に応じて受付部に付与される情報であり、発話音声Ｖ1、入力文字列、選択肢等が例示される。また、利用者Ｕによる入力の種類に応じて、利用者Ｕからの入力を受付ける受付部として利用される機器も適宜に変更される。

（２）前述の各形態では、応答文字列の応答単語に対応する関連情報Ｒが生成されたが、関連情報Ｒは、利用者Ｕからの入力に対する応答に関する情報であれば、その内容は任意である。例えば、応答文字列の全体の内容を考慮して関連情報Ｒを生成してもよい。関連情報生成部３２３は、例えば「レストランＡＢＣの場所はどこ？」という発話文字列に対して、レストランＡＢＣの所在を示す関連情報Ｒを生成する。また、応答文字列そのものや、当該応答文字列を他言語に翻訳した文字列を関連情報Ｒとしてもよい。利用者Ｕからの入力を加味して関連情報Ｒを生成してもよい。なお、関連情報Ｒの生成に関連情報テーブルを利用することは必須ではない。関連情報Ｒの内容および種類に応じて、関連情報Ｒを生成する方法は適宜に変更される。

（３）前述の各形態では、発話音声Ｖ1に対する応答として応答文字列が応答生成部３２２により生成されたが、応答生成部３２２が生成する応答は応答文字列に限定されない。例えば応答生成部３２２が生成する応答の内容が固定である場合には、例えば記憶装置２３が事前に応答音声Ｖ2を記憶しておくことも可能である。応答生成部３２２は、入力データＤ1に応じた応答音声Ｖ2を発話音声Ｖ1に対する応答として記憶装置２３から特定する。

また、応答生成部３２２は、音声認識部３２１が生成した発話文字列を他言語に翻訳した文字列を、発話音声Ｖ1に対する応答として生成してもよい。発話音声Ｖ1を他言語に翻訳した応答音声Ｖ2が放音システム２０から放音される。以上の構成によれば、利用者Ｕの発話音声Ｖ1を他言語に翻訳する自動翻訳機が放音システム２０として利用される。自動翻訳機を放音システム２０とする構成では、発話文字列を他言語に翻訳した文字列が関連情報Ｒとして好適に利用される。なお、応答サーバ３０の機能を自動翻訳機に搭載してもよい。

（４）前述の各形態では、放音システム２０は、応答音声Ｖ2の放音により、発話音声Ｖ1に対する応答を利用者Ｕに提示したが、応答音声Ｖ2の放音とともに、例えば放音システム２０の表示装置（例えば液晶ディスプレイ）により応答文字列や関連情報Ｒを表示してもよい。

（５）前述の各形態では、応答音声Ｖ2と識別情報Ｉの音響成分との混合音を表す音響データＤ2が応答サーバ３０により生成されたが、応答サーバ３０は、応答音声Ｖ2と識別情報Ｉの音響成分とを個別の音響として含む音響データＤ2を生成して、当該音響データＤ2を放音システム２０に送信してもよい。放音システム２０は、音響データＤ2に応じて放音する。応答音声Ｖ2と識別情報Ｉの音響成分との混合音を放音してもよいし、応答音声Ｖ2と識別情報Ｉの音響成分とを個別に放音してもよい。また、応答音声Ｖ2と識別情報Ｉの音響成分とが放音される時期の関係は、任意である。例えば応答音声Ｖ2と識別情報Ｉの音響成分とが並行に放音されてもよいし、応答音声Ｖ2と識別情報Ｉの音響成分とが時間軸上の別の期間に放音されてもよい。放音制御部２４５は、受付部が受付けた入力に対する応答を表す応答音声Ｖ2と、当該応答に関する関連情報Ｒの識別情報Ｉを表す音響成分とを放音装置２２に放音させる要素として包括的に表現される。

（６）前述の各形態では、応答サーバ３０が音響データＤ2を生成したが、放音システム２０が音響データＤ2を生成してもよい。応答サーバ３０は、応答文字列および識別情報Ｉを放音システム２０に生成する。放音システム２０は、応答サーバ３０から送信された応答文字列と識別情報Ｉとから音響データＤ2を生成し、当該音響データＤ2に応じて放音する。すなわち、信号生成部３２５は、応答サーバ３０から省略され得る。

（７）前述の各形態では、関連情報Ｒの生成毎に識別情報生成部３２４が識別情報Ｉを生成したが、関連情報テーブルに登録される関連情報Ｒについて、事前に識別情報Ｉを登録しておいてもよい。識別情報生成部３２４は、関連情報生成部３２３により関連情報Ｒが生成されると、当該関連情報Ｒに対応する識別情報Ｉを関連情報テーブルから特定する。なお、以上の構成によれば、複数の関連情報Ｒの各々について当該関連情報Ｒの識別情報Ｉを対応させて事前に情報提供テーブルに登録しておいてもよい。以上の構成では、情報提供サーバ４０に対する提供データＤ3の送信が省略される。

（８）前述の各形態では、放音システム２０は発話音声Ｖ1を表す音響信号を入力データＤ1として応答サーバ３０に送信したが、発話音声Ｖ1の発話文字列を入力データＤ1として応答サーバ３０に送信してもよい。すなわち、音声認識部３２１は、応答サーバ３０から省略され得る。

（９）前述の各形態では、応答サーバ３０と情報提供サーバ４０と放音システム２０とで情報提供システム１００を構成したが、情報提供システム１００の構成は以上の例示に限定されない。例えば、単独の装置で情報提供システム１００を構成してもよい。また、応答サーバ３０と放音システム２０とを単体の装置で実現してもよいし、応答サーバ３０と情報提供システム１００とを単体の装置で実現してもよい。

（１０）前述の各形態では、音声対話装置を放音システム２０として利用したが、例えば自動券売機や自動販売機等を放音システム２０として利用してもよい。以上の構成によれば、例えば利用者Ｕによる購入品に関する情報を関連情報Ｒとして利用できる。

（１１）前述の各形態に係る放音システム２０、情報処理システム（応答サーバ３０および情報提供サーバ４０）および端末装置５０の機能は、各形態での例示の通り、制御装置とプログラムとの協働により実現される。前述の各形態に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性（non-transitory）の記録媒体であり、ＣＤ-ＲＯＭ等の光学式記録媒体（光ディスク）が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号（transitory, propagating signal）を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、通信網を介した配信の形態でプログラムをコンピュータに提供してもよい。

＜付記＞
以上に例示した形態から、例えば以下の構成が把握される。

本発明の好適な態様（第１態様）に係る情報提供方法は、利用者からの入力を受付け、
前記受付けた入力に対する応答を表す応答音声と当該応答に関する関連情報の識別情報を表す音響成分とを放音装置に放音させる。以上の態様では、応答音声を放音する放音装置を利用した音響通信により識別情報が端末装置に送信されるから、応答音声が表す応答に関する関連情報（例えば応答に関する更に詳細な情報）を、端末装置が当該識別情報を利用して取得できる。したがって、応答音声に関する関連情報を取得するために利用者が端末装置に煩雑な操作を付与する負荷を軽減できる。

第１態様の好適例（第２態様）では、前記受付けた入力を表す入力データを応答サーバに送信し、前記入力データが表す入力に対する応答を表す応答音声と、当該応答に関する関連情報の識別情報を表す音響成分とを表す音響データを受信し、受信した音響データに応じて前記放音装置に放音させる。以上の態様では、受付けた入力が応答サーバに送信され、応答サーバが生成した応答を表す応答音声の音響データが受信されるから、応答音声を生成するための要素を放音システムに内蔵する必要がない。したがって、情報提供方法の構成および動作が簡素化される。

第２態様の好適例（第３態様）では、識別情報を生成し、前記入力データと、前記生成した識別情報とを前記応答サーバに送信する。以上の態様では、応答サーバで識別情報を生成することなく、応答音声と識別情報との対応を応答サーバにおいて管理することができる。

本発明の好適な態様（第４態様）に係る情報処理方法は、利用者による入力に対する応答を生成し、前記生成した応答に関する関連情報を生成し、前記生成した応答を表す応答音声と、前記関連情報に対応する識別情報を表す音響成分とを表す音響データを、当該音響データに応じて放音する放音システムに対して送信する動作を、通信装置に実行させ、前記放音システムによる音響通信で前記識別情報を受信した端末装置からの情報要求に応じて、当該識別情報に対応する関連情報を当該端末装置に送信する動作を、前記通信装置に実行させる。以上の態様では、応答音声を放音する放音装置を利用した音響通信により識別情報が端末装置に送信されるから、応答音声が表す応答に関する関連情報（例えば応答に関する更に詳細な情報）を、端末装置が当該識別情報を利用して取得できる。したがって、応答音声に関する関連情報を取得するために利用者が端末装置に煩雑な操作を付与する負荷を軽減できる。

第４態様の好適例（第５態様）では、前記関連情報の生成において、前記応答に含まれる単語に対応する関連情報を生成する。以上の態様では、応答の全体に対応する関連情報を特定する構成と比較して、関連情報を簡単に特定できる。

本発明の好適な態様（第６態様）に係る放音システムは、利用者からの入力を受付ける受付部と、音響を放音する放音装置と、前記受付部が受付けた入力に対する応答を表す応答音声と当該応答に関する関連情報の識別情報を表す音響成分とを前記放音装置に放音させる放音制御部とを具備する。以上の態様では、応答音声を放音する放音装置を利用した音響通信により識別情報が端末装置に送信されるから、応答音声が表す応答に関する関連情報（例えば応答に関する更に詳細な情報）を、端末装置が当該識別情報を利用して取得できる。したがって、応答音声に関する関連情報を取得するために利用者が端末装置に煩雑な操作を付与する負荷を軽減できる。

第６態様の好適例（第７態様）では、前記受付部が受付けた入力を表す入力データを応答サーバに送信する送信部と、前記入力データが表す入力に対する応答を表す応答音声と、当該応答に関する関連情報の識別情報を表す音響成分とを表す音響データを前記応答サーバから受信する受信部とを具備し、前記放音制御部は、前記受信部が受信した音響データに応じて前記放音装置に放音させる。以上の態様では、受付部が受付けた入力が応答サーバに送信され、応答サーバが生成した応答を表す応答音声の音響データが受信部により受信されるから、応答音声を生成するための要素を放音システムに内蔵する必要がない。したがって、放音システムの構成および動作が簡素化される。

第７態様の好適例（第８態様）では、識別情報を生成する識別情報生成部を具備し、前記送信部は、前記入力データと、前記識別情報生成部が生成した識別情報とを前記応答サーバに送信する。以上の態様では、応答サーバで識別情報を生成することなく、応答音声と識別情報との対応を応答サーバにおいて管理することができる。

本発明の好適な態様（第９態様）に係る情報処理システムは、利用者による入力に対する応答を生成する応答生成部と、前記応答生成部が生成した応答に関する関連情報を生成する関連情報生成部と、前記応答生成部が生成した応答を表す応答音声と、前記関連情報生成部が生成した関連情報に対応する識別情報を表す音響成分とを表す音響データを、当該音響データに応じて放音する放音システムに対して送信する動作を、通信装置に実行させる第１通信制御部と、前記放音システムによる音響通信で前記識別情報を受信した端末装置からの情報要求に応じて、当該識別情報に対応する関連情報を当該端末装置に送信する動作を、前記通信装置に実行させる第２通信制御部とを具備する。以上の態様では、応答音声を放音する放音装置を利用した音響通信により識別情報が端末装置に送信されるから、応答音声が表す応答に関する関連情報（例えば応答に関する更に詳細な情報）を、端末装置が当該識別情報を利用して取得できる。したがって、応答音声に関する関連情報を取得するために利用者が端末装置に煩雑な操作を付与する負荷を軽減できる。

第９態様の好適例（第１０態様）では、前記関連情報生成部は、前記応答生成部が生成した応答に含まれる単語に対応する関連情報を生成する。以上の態様では、応答の全体に対応する関連情報を特定する構成と比較して、関連情報を簡単に特定できる。

１００…情報提供システム、２０…放音システム、２１…収音装置、２２…放音装置、２３…記憶装置、２４…制御装置、２４３…通信制御部、２４５…放音制御部、２５…通信装置、２５１…送信部、２５３…受信部、３０…応答サーバ、３１…記憶装置、３２…制御装置、３２１…音声認識部、３２２…応答生成部、３２３…関連情報生成部、３２４…識別情報生成部、３２５…信号生成部、３２６…通信制御部、３３…通信装置、３３１…送信部、３３３…受信部、４０…情報提供サーバ、４１…記憶装置、４２…制御装置、４２１…記憶制御部、４２３…関連情報特定部、４２５…通信制御部、４３…通信装置、４３１…送信部、４３３…受信部、５０…端末装置、５１…収音装置、５２…制御装置、５２１…情報抽出部、５２３…再生制御部、５３…記憶装置、５４…通信装置、５５…再生装置、７１…音声合成部、７３…変調処理部、７４…加算部。

Claims

利用者からの入力を受付け、
前記受付けた入力に対する応答を表す応答音声と当該応答に関する関連情報の識別情報を表す音響成分とを放音装置に放音させる
情報提供方法。
前記受付けた入力を表す入力データを応答サーバに送信し、
前記入力データが表す入力に対する応答を表す応答音声と、当該応答に関する関連情報の識別情報を表す音響成分とを表す音響データを受信し、
受信した音響データに応じて前記放音装置に放音させる
請求項１の情報提供方法。
識別情報を生成し、
前記入力データと、前記生成した識別情報とを前記応答サーバに送信する
請求項２の情報提供方法。
利用者による入力に対する応答を生成し、
前記生成した応答に関する関連情報を生成し、
前記生成した応答を表す応答音声と、前記関連情報に対応する識別情報を表す音響成分とを表す音響データを、当該音響データに応じて放音する放音システムに対して送信する動作を、通信装置に実行させ、
前記放音システムによる音響通信で前記識別情報を受信した端末装置からの情報要求に応じて、当該識別情報に対応する関連情報を当該端末装置に送信する動作を、前記通信装置に実行させる
情報処理方法。
前記関連情報の生成では、前記応答に含まれる単語に対応する関連情報を生成する
請求項４の情報処理方法。
利用者からの入力を受付ける受付部と、
音響を放音する放音装置と、
前記受付部が受付けた入力に対する応答を表す応答音声と当該応答に関する関連情報の識別情報を表す音響成分とを前記放音装置に放音させる放音制御部と
を具備する放音システム。
前記受付部が受付けた入力を表す入力データを応答サーバに送信する送信部と、
前記入力データが表す入力に対する応答を表す応答音声と、当該応答に関する関連情報の識別情報を表す音響成分とを表す音響データを前記応答サーバから受信する受信部とを具備し、
前記放音制御部は、前記受信部が受信した音響データに応じて前記放音装置に放音させる
請求項６の放音システム。
識別情報を生成する識別情報生成部を具備し、
前記送信部は、前記入力データと、前記識別情報生成部が生成した識別情報とを前記応答サーバに送信する
請求項７の放音システム。
利用者による入力に対する応答を生成する応答生成部と、
前記応答生成部が生成した応答に関する関連情報を生成する関連情報生成部と、
前記応答生成部が生成した応答を表す応答音声と、前記関連情報生成部が生成した関連情報に対応する識別情報を表す音響成分とを表す音響データを、当該音響データに応じて放音する放音システムに対して送信する動作を、通信装置に実行させる第１通信制御部と、
前記放音システムによる音響通信で前記識別情報を受信した端末装置からの情報要求に応じて、当該識別情報に対応する関連情報を当該端末装置に送信する動作を、前記通信装置に実行させる第２通信制御部と
を具備する情報処理システム。
前記関連情報生成部は、前記応答生成部が生成した応答に含まれる単語に対応する関連情報を生成する
請求項９の情報処理システム。