<第1実施形態>
図1は、本発明の第1実施形態に係る情報提供システム100の構成を例示するブロック図である。図1に例示される通り、第1実施形態の情報提供システム100は、複数の端末装置10Aと放音装置20と配信装置30(情報処理装置の一例)と端末装置10Bとを具備する。情報提供システム100の各要素は、例えば移動体通信網またはインターネット等を含む通信網70を介して相互に通信可能である。情報提供システム100は、端末装置10Aの利用者と端末装置10Bの利用者とに各種の情報を提供するためのコンピュータシステムである。端末装置10Aおよび端末装置10Bは、例えば携帯電話機、スマートフォン、タブレット端末、またはパーソナルコンピュータ等の可搬型の情報端末である。
<放音装置20>
放音装置20は、特定の施設Pに設置される。具体的には、放音装置20は、施設Pの利用者に各種の情報を案内する音声(以下「案内音声」という)Vを放音する出力装置である。例えば、駅またはバス停等の交通施設、鉄道またはバス等の交通機関、販売店または飲食店等の商業施設、旅館またはホテル等の宿泊施設、博物館または美術館等の展示施設、史跡または名所等の観光施設、競技場または体育館等の運動施設、等が施設Pとして例示される。例えば施設Pの営業時間、施設内での販売商品、または、施設P内における非常事態(例えば火災等)の発生を案内する案内音声Vが放音される。または、電車またはバスの車輌(施設P)内において、電車の遅延等の運行状況、電車の到着、または、乗降時の注意事項等を通知する車内放送が案内音声Vとして例示される。なお、実際には複数の施設の各々に放音装置20が設置され当該施設内で案内音声V(音声の一例)が放音されるが、以下の説明では便宜的に1つの施設Pに着目する。なお、放音装置20が放音する案内音声Vは、施設Pの従業者が発音した音声でもよいし、例えば音声合成または録音により用意する音声でもよい。例えば従業者による文字列の指示に並行して、当該文字列が表す案内音声Vを音声合成によりリアルタイムで生成してもよい。
第1実施形態の放音装置20は、案内音声Vのほかに、音声情報D1を表す音響と位置情報D2を表す音響とを放音する。音声情報D1は、案内音声Vの内容(例えば案内音声Vの発音内容を表す文字列)を示す情報である。第1実施形態では、案内音声Vの内容を識別する識別子が音声情報D1として利用される。案内音声V毎に相異なる音声情報D1が事前に設定される。音声情報D1は、案内音声Vに対応する関連情報Rを特定するための情報である。
位置情報D2は、放音装置20により音響が放音される位置(以下「放音位置」)を示す情報である。放音位置毎に相異なる位置情報D2が事前に設定される。例えば、放音装置20が設置されている施設Pの名称、当該施設Pが所在する地域(例えば関東地方および近畿地方等の区分)、または当該施設Pの緯度および経度等の地理的な地点が、放音位置として例示される。なお、放音位置は、地理的な特定の地点を示す情報に限定されず、例えば施設P内での階数や施設P内の特定の場所でもよい。また、位置情報D2は、各放音装置20を識別するための情報でもよい。第1実施形態では、放音位置を識別する識別子が位置情報D2として利用される。
音響信号Xを放音装置20に供給することで、案内音声Vと音声情報D1を含む音響と位置情報D2を表す音響とが放音装置20から放音される。音響信号Xは、案内音声Vと音声情報D1を表す音響と位置情報D2を表す音響とを含む音を表す信号である。第1実施形態の放音装置20は、案内音声Vを再生する音響機器として機能するほか、空気振動としての音波を伝送媒体とした音響通信により音声情報D1および位置情報D2を周囲に送信する送信機としても機能する。すなわち、第1実施形態では、案内音声Vを放音する放音装置20から音声情報D1および位置情報D2の音響を放音する音響通信により、当該音声情報D1および位置情報D2が周囲に送信される。音声情報D1は、案内音声Vの放音毎に送信される。例えば、案内音声Vの放音とともに(例えば案内音声Vの放音に並行または前後して)音声情報D1が送信される。他方、位置情報D2は、案内音声Vの放音とは別に所定の周期で反復的に送信される。なお、位置情報D2を案内音声Vの放音とともに送信してもよい。ただし、音声情報D1の送信と位置情報D2の送信とは時間的に重複しない。
音響信号Xは、案内音声Vを表す音声信号と、音声情報D1を音響成分として表す変調信号と、位置情報D2を音響成分として表す変調信号とを加算することで生成される。各変調信号は、例えば所定の周波数の搬送波を各情報(音声情報D1または位置情報D2)により周波数変調することで生成される。なお、拡散符号を利用した各情報の拡散変調と所定の周波数の搬送波を利用した周波数変換とを順次に実行することで変調信号を生成してもよい。変調信号の周波数帯域は、放音装置20による放音と端末装置10Aによる収音とが可能な周波数帯域であり、かつ、端末装置10Aの利用者が通常の環境で聴取する音声の周波数帯域を上回る周波数帯域(例えば18kHz以上かつ20kHz以下)に設定される。したがって、利用者は、音声情報D1および位置情報D2の音響成分を殆ど聴取できない。ただし、変調信号の周波数帯域は任意であり、例えば可聴帯域内の変調信号を生成することも可能である。
<端末装置10A>
図1の複数の端末装置10Aは、放音装置20が設置される施設Pに所在する。第1実施形態の端末装置10Aは、案内音声Vに関連する情報(以下「関連情報」という)Rを配信装置30から取得する。関連情報Rは、例えば、案内音声Vの発話内容を表す文字列、当該文字列を他言語に翻訳した翻訳文、または、案内音声Vに関連するコンテンツの所在を表す情報(例えばURL)等である。関連情報Rは、音声または画像で表現されてもよい。なお、他の施設にも同様に複数の端末装置10Aが所在する。
図2は、端末装置10Aの構成を例示するブロック図である。図2に例示される通り、端末装置10Aは、制御装置11と記憶装置12と通信装置13と収音装置14と再生装置15とを具備する。端末装置10Aは、典型的には前述の通り、利用者が所有する情報端末である。ただし、交通機関に設置された電光掲示板、または商業施設に設置される電子看板(デジタルサイネージ)等の案内用の表示端末を端末装置10Aとして利用してもよい。
収音装置14は、周囲の音響を収音する音響機器(マイクロホン)である。具体的には、収音装置14は、放音装置20が施設P内に放音した音響を収音し、当該音響の波形を表す音響信号Yを生成する。したがって、施設Pでの収音により生成された音響信号Yには、音声情報D1の音響成分と位置情報D2の音響成分とが含まれ得る。位置情報D2は、案内音声Vを収音したときの端末装置10Aの位置を示す情報とも換言される。
以上の説明から理解される通り、収音装置14は、端末装置10Aの相互間の音声通話または動画撮影時の音声収録に利用されるほか、空気振動としての音波を伝送媒体とする音響通信により音声情報D1および位置情報D2を受信する受信機としても機能する。なお、収音装置14が生成した音響信号Yをアナログからデジタルに変換するA/D変換器の図示は便宜的に省略した。また、端末装置10Aと一体に構成された収音装置14に代えて、別体の収音装置14を有線または無線により端末装置10Aに接続してもよい。
制御装置11(コンピュータの例示)は、例えばCPU(Central Processing Unit)等の処理回路で構成され、端末装置10Aの各要素を統括的に制御する。記憶装置12は、制御装置11が実行するプログラムと、制御装置11が使用する各種のデータとを記憶する。例えば半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置12として任意に採用され得る。
制御装置11は、図2に例示される通り、記憶装置12に記憶されたプログラムを実行することで複数の機能(情報抽出部41および再生制御部42)を実現する。なお、制御装置11の一部の機能を専用の電子回路で実現してもよい。また、制御装置11の機能を複数の装置に搭載してもよい。
情報抽出部41は、収音装置14が生成した音響信号Yから音声情報D1および位置情報D2を抽出する。具体的には、情報抽出部41は、例えば、音響信号Yのうち各情報(音声情報D1および位置情報D2)の音響成分を含む周波数帯域を強調するフィルタ処理と、各情報に対する変調処理に対応した復調処理とにより、音声情報D1および位置情報D2を抽出する。情報抽出部41が抽出した音声情報D1は、当該音声情報D1に対応する案内音声V(すなわち放音装置20により放音された案内音声V)の関連情報Rの取得に利用される。
通信装置13は、制御装置11による制御のもとで通信網70を介して配信装置30と通信する。第1実施形態の通信装置13は、情報抽出部41が抽出した音声情報D1と位置情報D2とを配信装置30に送信する。配信装置30は、端末装置10Aから送信された音声情報D1に対応した関連情報Rを取得して端末装置10Aに送信する。通信装置13は、配信装置30から送信された関連情報Rを受信する。配信装置30が関連情報Rを取得する処理については後述する。なお、実際には複数の端末装置10Aのそれぞれから音声情報D1および位置情報D2が配信装置30に送信される。
再生制御部42は、通信装置13が受信した関連情報Rを再生装置15に再生させる。再生装置15は、関連情報Rを再生する出力機器である。具体的には、再生装置15は、関連情報Rが表す画像を表示する表示装置と、当該関連情報Rが表す音響を放音する放音装置とを具備する。すなわち、再生装置15による再生は、画像の表示と音響の放音とを包含する。なお、端末装置10Aと一体に構成された再生装置15に代えて、別体の再生装置15を有線または無線により端末装置10Aに接続してもよい。また、再生装置15が表示装置および放音装置の一方のみを含む構成としてもよい。
図3は、端末装置10Aの制御装置11が実行する処理を例示するフローチャートである。例えば所定の周期で図3の処理が反復的に実行される。図3の処理を開始すると、情報抽出部41は、収音装置14が生成した音響信号Yから音声情報D1と位置情報D2とを抽出する(Sa1)。情報抽出部41は、抽出した音声情報D1と位置情報D2とを、通信装置13から配信装置30に対して送信させる(Sa2)。なお、位置情報D2が所定の周期で反復的に放音装置20から送信される場合、制御装置11は、直近に受信した位置情報D2を記憶装置12に記憶しておいて、当該位置情報D2を配信装置30に対して送信する。再生制御部42は、配信装置30から送信された関連情報Rを再生装置15に再生させる(Sa3)。以上の処理により、放音装置20から放音された案内音声Vの関連情報Rが端末装置10Aの利用者に提供される。
<配信装置30>
図4は、配信装置30の構成を例示するブロック図である。配信装置30は、端末装置10Aおよび端末装置10Bに通信網70を介して各種の情報を送信するサーバ装置(例えばウェブサーバ)である。各端末装置10Aに対しては、当該端末装置10Aから送信された音声情報D1に対応する関連情報Rが送信される。他方、端末装置10Bに対しては、当該端末装置10Bの利用者に提供するための情報(以下「提供情報」という)Qが送信される。図4に例示される通り、第1実施形態の配信装置30は、制御装置31と記憶装置32と通信装置33とを具備する。なお、配信装置30は、単体の装置で実現されるほか、相互に別体で構成された複数の装置の集合(すなわちサーバシステム)でも実現される。
通信装置33は、制御装置31(通信制御部51)による制御のもとで通信網70を介して端末装置10Aおよび端末装置10Bと通信する。第1実施形態の通信装置33は、複数の端末装置10Aのそれぞれから音声情報D1および位置情報D2を受信し、当該端末装置10Aに関連情報Rを送信する。また、通信装置33は、端末装置10Bに提供情報Qを送信する。
制御装置31(コンピュータの例示)は、例えばCPU(Central Processing Unit)等の処理回路で構成され、配信装置30の各要素を統括的に制御する。記憶装置32は、制御装置11が実行するプログラムと、制御装置31が使用する各種のデータとを記憶する。例えば半導体記録媒体および磁気記録媒体等の公知の記録媒体、または複数種の記録媒体の組合せが、記憶装置32として任意に採用され得る。第1実施形態の記憶装置32は、関連テーブルTaと音声テーブルTbと端末テーブルTcとを記憶する。
図5は、関連テーブルTaの模式図である。図5に例示される通り、関連テーブルTaは、複数の関連情報Rが登録されたテーブルである。具体的には、複数の音声情報D1の各々について、当該音声情報D1に対応する関連情報Rが登録される。特定の案内音声Vの音声情報D1には、例えば当該案内音声Vの発話内容を表す文字列、または、当該文字列を他言語に翻訳した翻訳文等を表す関連情報Rが対応付けられる。
図6は、音声テーブルTbの模式図である。図6に例示される通り、音声テーブルTbは、複数の端末装置10Aからそれぞれ送信された複数の音声情報D1が登録されたデータテーブルである。具体的には、各端末装置10Aから受信した音声情報D1と位置情報D2とが対応付けて音声テーブルTbに登録される。複数の放音位置(A,B,C,…)の付近に所在する端末装置10Aから音声情報D1が配信装置30に送信されるから、多様な案内音声Vに対応する音声情報D1が音声テーブルTbに登録される。すなわち、音声テーブルTbは、複数の音声情報D1の集合(ビッグデータ)である。端末テーブルTcは、提供情報Qを送信する対象となる複数の端末装置10B(具体的には端末装置10Bを識別するための情報)が登録されたテーブルである。例えば、特定の放音位置に対応する提供情報Qを端末装置10Bの利用者が取得したい場合に、当該端末装置10Bに対する利用者からの操作に応じて端末装置10Bが端末テーブルTcに登録される。また、例えば音声情報D1の受信を契機として、端末テーブルTcへの登録要求を配信装置30に対して端末装置10Bが自動的に(すなわち利用者からの指示を必要とせずに)送信してもよい。
制御装置31は、図4に例示される通り、記憶装置12に記憶されたプログラムを実行することで複数の機能(通信制御部51,記憶制御部52,関連情報取得部53,提供情報生成部54)を実現する。なお、制御装置11の一部の機能を専用の電子回路で実現してもよい。また、制御装置31の機能を複数の装置に搭載してもよい。
通信制御部51は、各種の情報の受信および送信を通信装置33に実行させる。記憶制御部52は、通信装置33が受信した音声情報D1および位置情報D2を記憶装置32(具体的には音声テーブルTb)に記憶させる。関連情報取得部53は、通信装置33が受信した音声情報D1に対応する関連情報Rを取得する。提供情報生成部54は、記憶装置32に記憶された複数の音声情報D1を利用して提供情報Qを生成する。
図7は、制御装置31が関連情報Rを取得する処理のフローチャートである。図5の処理を開始すると、通信制御部51は、端末装置10Aから送信された音声情報D1と位置情報D2とを通信装置33に受信させる(Sb1)。なお、実際は複数の放音位置の付近に所在する複数の端末装置10Aのそれぞれから音声情報D1と位置情報D2とが送信される。記憶制御部52は、複数の端末装置10Aからそれぞれ受信した複数の音声情報D1を記憶装置32に記憶させる(Sb2)。具体的には、記憶制御部52は、各端末装置10Aから受信した音声情報D1と位置情報D2とを対応付けて音声テーブルTbに登録する。関連情報取得部53は、通信装置33が受信した音声情報D1に対応する関連情報Rを取得する(Sb3)。関連情報Rの取得には、図5の関連テーブルTaが利用される。具体的には、関連情報取得部53は、関連テーブルTaに登録された複数の関連情報Rのうち、通信装置33が受信した音声情報D1に対応付けられた関連情報Rを特定する。通信制御部51は、関連情報取得部53が特定した関連情報Rを端末装置10Aに対して通信装置33から送信させる(Sb4)。以上の処理により、放音装置20から放音された案内音声Vを収音した端末装置10Aに当該案内音声Vの関連情報Rが送信される。
図8は、制御装置31が提供情報Qを生成する処理のフローチャートである。例えば所定の時間毎に図8の処理が実行される。提供情報生成部54は、図6の音声テーブルTbに登録された複数の音声情報D1を利用して提供情報Qを生成する(Sc1)。通信制御部51は、提供情報生成部54が生成した提供情報Qを、端末テーブルTcに登録された複数の端末装置10Bに対して通信装置33から送信させる(Sc2)。
以下、配信装置30が生成する提供情報Qについて説明する。以下の説明では、非常事態または緊急事態等の異常事態が発生した場合に生成される提供情報Qを例示する。特定の施設(例えば交通施設)で非常事態の発生による混雑が発生している場合を想定する。例えば、交通施設(例えば駅)における人身事故の発生により電車の遅延が発生し、それにより混雑が発生している場合が例示される。非常事態が発生した施設内の放音装置20の付近に所在する多数の端末装置10Aは、非常事態の発生を知らせる案内音声Vをそれぞれが収音して、当該案内音声Vに対応する音声情報D1と当該放音位置を示す位置情報D2とを配信装置30に送信する。非常事態が発生している施設を表す放音位置を示す位置情報D2と、非常事態の発生を知らせる案内音声Vの音声情報D1とのレコード(組合せ)が、短時間に集中して音声テーブルTbに登録される。したがって、そのレコードの数に応じて混雑の発生を推定し、音声情報D1に応じて混雑の原因を推定することができる。
以上の事情を前提として、提供情報生成部54は、音声テーブルTbを利用して提供情報Qを生成する。具体的には、提供情報生成部54は、非常事態の発生を知らせる案内音声Vの音声情報D1と、当該非常事態が発生している施設を表す放音位置を示す位置情報D2とのレコードの数(以下「登録数」という)Nを音声テーブルTbから特定し、当該登録数Nが閾値を上回る場合(すなわち施設が非常事態により混雑している場合)に、非常事態の発生を示す提供情報Qを生成する。登録数Nが閾値を上回るレコードの音声情報D1が示す案内音声Vの内容に応じた提供情報Qが生成される。例えば人身事故により駅が混雑していることを示す提供情報Qが生成される。また、登録数Nが閾値を上回るレコードの音声情報D1が示す案内音声Vが火災等の非常事態を知らせる内容である場合には、例えば当該レコードの位置情報D2が示す放音位置が表す施設(つまり火災が発生している施設)を示す提供情報Qを生成してもよい。また、位置情報D2が示す放音位置からの避難経路を示す提供情報Qを生成してもよい。例えば、複数の放音位置の各々に対応付けられた避難経路が予め記憶装置32に記憶され、提供情報Qの生成に利用される。以上の説明から理解される通り、端末装置10Aから音声情報D1とともに送信された位置情報D2は、提供情報Qの生成に利用されるための情報である。
なお、登録数Nは、例えば所定の期間(以下「参照期間」という)内に端末装置10Aから受信したレコード(音声情報D1,位置情報D2)の総数である。例えば、現時点から過去にわたる所定長の参照期間内において配信装置30が端末装置10Aから受信したレコードが記憶装置32に保持される構成では、記憶装置32に記録されたレコードの総数が登録数Nとして計数される。また、配信装置30が音声情報D1および位置情報D2を端末装置10Aから受信した時刻が記憶装置32に記憶される構成では、記憶装置32に記憶された全部のレコードのうち受信時刻が参照期間内に属するレコードの総数が登録数Nとして計数される。
以上の説明から理解される通り、第1実施形態の提供情報生成部54は、音声テーブルTbに登録された複数の音声情報D1のうち、特定の放音位置(例えば混雑している施設)を示す位置情報D2に対応付けられた2以上の音声情報D1を利用して、提供情報Qを生成する。具体的には、音声テーブルTbに登録された複数の音声情報D1が示す案内音声Vの内容に応じた提供情報Qが生成される。以上の手順で生成された提供情報Qが前述の通り、端末テーブルTcに登録された複数の端末装置10Bに対して送信される。
端末装置10Bは、配信装置30から送信された提供情報Qを再生する。具体的には、端末装置10Bは、例えば提供情報Qを表す文字列の表示、または、提供情報Qが表す音響の放音により、当該提供情報Qを再生する。
以上の説明から理解される通り、第1実施形態では、複数の端末装置10Aからそれぞれ受信した複数の音声情報D1が記憶装置32(音声テーブルTb)に記憶されるから、複数の音声情報D1を様々な用途に活用するが可能である。第1実施形態では特に、記憶装置32に記憶された複数の音声情報D1を利用することで生成された提供情報Qが端末装置10Bに送信されるから、複数の端末装置10Aから送信された音声情報D1を提供情報Qの生成に活用することができる。また、第1実施形態では、記憶装置32に記憶された複数の音声情報D1のうち、特定の位置を示す位置情報D2に対応付けられた2以上の音声情報D1から提供情報Qが生成されるから、特定の位置で収音されたと推定される案内音声Vをそれぞれが示す2以上の音声情報D1から提供情報Qを生成することができるという利点がある。
<第2実施形態>
本発明の第2実施形態を説明する。なお、以下の各例示において機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
第2実施形態の端末装置10Aは、音声情報D1と位置情報D2とに加えて、時刻情報D3を配信装置30に送信する。時刻情報D3は、端末装置10Aが案内音声Vを収音した時刻(典型的には日時)を示す情報である。例えば案内音声Vを収音したときに端末装置10Aに設定されている時刻が時刻情報D3として端末装置10Aにより生成される。なお、情報抽出部41が案内音声Vの音声情報D1を抽出した時刻を時刻情報D3として生成してもよい。音声情報D1と位置情報D2とは、第1実施形態と同様に、放音装置20から送信される。
配信装置30の通信制御部51は、音声情報D1と位置情報D2と時刻情報D3とを通信装置33に受信させる。記憶制御部52は、端末装置10Aが送信した音声情報D1と位置情報D2と時刻情報D3とを音声テーブルTbに登録する。図9は、第2実施形態に係る音声テーブルTbの模式図である。図9に例示される通り、各端末装置10Aから受信した音声情報D1と位置情報D2と時刻情報D3とを対応付けて、1つのレコードとして登録する。
第2実施形態の関連情報取得部53は、第1実施形態と同様に、端末装置10Aから送信された音声情報D1から関連情報Rを取得し、当該端末装置10Aに送信する。第2実施形態の提供情報生成部54は、第1実施形態と同様に、記憶装置32に記憶された複数の音声情報D1を利用して提供情報Qを生成する。
以下、第2実施形態の配信装置30が生成する提供情報Qについて説明する。第2実施形態では、特定の施設の混雑の状況(例えば混雑の原因および混雑の度合)を知らせる提供情報Qを生成する場合を例示する。前述の通り、特定の放音位置の付近に所在する複数の端末装置10Aが各種の案内音声Vをそれぞれが収音して、音声情報D1と位置情報D2と時刻情報D3とが配信装置30に送信される。音声テーブルTbにおいて放音位置(例えば商業施設を表す放音位置)を示す位置情報D2が共通に対応付けられた時刻情報D3のうち、当該商業施設に混雑が発生している時間帯(例えば朝/昼/夜)を表す時刻情報D3は、短時間に集中して登録される。したがって、各時間帯について、特定の商業施設を表す放音位置を示す位置情報D2と時刻情報D3と含むレコードの登録数Nを算定することで、当該商業施設が混雑している時間帯を推定することができる。
以上の事情を前提として、第2実施形態の提供情報生成部54は、音声テーブルTbに登録された複数の音声情報D1を利用して、商業施設の混雑の状況を知らせる提供情報Qを生成する。例えば、提供情報生成部54は、特定の商業施設を表す放音位置を示す位置情報D2を含むレコードを音声テーブルTbから特定する。つぎに、提供情報生成部54は、特定した複数のレコードを当該レコードの時刻情報D3が示す時刻を利用して時間帯(朝/昼/夜)毎に分類する。分類されたレコードの登録数Nに応じて各時間帯の混雑の度合(例えば高/普通/低)を推定し、推定した各時間帯の混雑の度合を提供情報Qとして生成する。時刻情報D3は、提供情報Qの生成に利用されるための情報である。
また、時間帯毎に分類された音声情報D1が示す案内音声Vの内容から、時間帯毎の混雑の原因を示す提供情報Qが生成される。例えば各種のイベント(例えばタイムセール等)の発生を報知する案内音声Vを示す音声情報D1を含むレコードの登録数Nが多い場合には、当該イベントが混雑の原因であることを示す提供情報Qが生成される。すなわち、複数の案内音声Vの内容に応じた提供情報Qが生成される。なお、混雑の度合は、時間帯毎の混雑の度合に限定されず、例えば曜日毎や月毎の混雑の度合でもよい。また、音声情報D1を利用せずに、位置情報D2および時刻情報D3から混雑の状況を知らせる提供情報Qを生成してもよい。以上の手順で生成された提供情報Qが前述の通り、端末テーブルTcに登録された複数の端末装置10Bに対して送信される。
以上の説明から理解される通り、第2実施形態の提供情報生成部54は、音声テーブルTbに登録された複数の音声情報D1のうち、特定の時刻(例えば時間帯)を示す時刻情報D3に対応付けられた2以上の音声情報D1を利用して、提供情報Qを生成する。第2実施形態でも第1実施形態と同様に、記憶装置32に記憶された複数の音声情報D1を様々な用途(例えば提供情報Qの生成)に活用することが可能である。第2実施形態では特に、記憶装置32に記憶された複数の音声情報D1のうち、特定の時刻を示す時刻情報D3に対応付けられた2以上の音声情報D1から提供情報Qが生成されるから、特定の時刻に収音されたと推定される案内音声Vをそれぞれが示す2以上の音声情報D1から提供情報Qを生成できるという利点がある。
なお、第2実施形態では、端末装置10Aが時刻情報D3を生成したが、配信装置30が時刻情報D3を生成してもよい。例えば端末装置10Aから音声情報D1と位置情報D2とを受信した時刻を示す時刻情報D3が生成され、当該時刻情報D3が端末装置10Aから送信された音声情報D1と位置情報D2とに対応付けて、1つのレコードとして音声テーブルTbに登録する。
<第3実施形態>
第3実施形態の端末装置10Aは、音声情報D1と位置情報D2とに加えて、言語情報D4を配信装置30に送信する。言語情報D4は、端末装置10Aに設定された言語を示す情報である。言語情報D4を取得する方法は任意であるが、例えば、端末装置10AのOS(Operating System)の言語設定を参照して言語情報D4を生成する構成、または端末装置10Aの利用者が任意に指定した言語を示す言語情報D4を生成する構成が採用される。音声情報D1と位置情報D2とは、第1実施形態と同様に、放音装置20から送信される。
配信装置30の通信制御部51は、端末装置10Aが送信した音声情報D1と位置情報D2と言語情報D4とを通信装置33に受信させる。記憶制御部52は、通信装置33が受信した音声情報D1と位置情報D2と言語情報D4とを音声テーブルTbに登録する。図10は、第3実施形態に係る音声テーブルTbの模式図である。図10に例示される通り、各端末装置10Aから受信した音声情報D1と位置情報D2と言語情報D4とを対応付けて1つのレコードとして登録する。
第3実施形態の関連情報取得部53は、第1実施形態と同様に、端末装置10Aから送信された音声情報D1から関連情報Rを取得し、当該端末装置10Aに送信する。第3実施形態の提供情報生成部54は、音声テーブルTbを利用して提供情報Qを生成する。
以下、第3実施形態の配信装置30が生成する提供情報Qについて説明する。第3実施形態では、特定の放音位置の付近に所在する利用者が使用する言語を示す提供情報Qを生成する場合を例示する。放音位置の付近に特定の言語を使用する利用者(つまり特定の言語が設定された端末装置10A)が多く所在する場合、当該放音位置を示す位置情報D2が共通に対応付けられた言語情報D4が、短時間に集中して音声テーブルTbに登録される。したがって、各言語について、特定の放音位置を示す位置情報D2と言語情報D4とを含むレコードの登録数Nを算定することで、当該放音位置において使用する人数が多い言語を推定することができる。
以上の事情を前提として、第3実施形態の提供情報生成部54は、音声テーブルTbに登録された複数の音声情報D1を利用して、特定の放音位置において使用する人数が多い言語を示す提供情報Qを生成する。例えば、提供情報生成部54は、特定の放音位置を示す位置情報D2を含むレコードを音声テーブルTbから特定する。次に、提供情報生成部54は、特定した複数のレコードを当該レコードの言語情報D4が示す言語を利用して言語毎に分類することで、提供情報Qを生成する。例えば、分類されたレコードの登録数Nに応じて、当該レコードの位置情報D2が示す放音位置において各言語を使用する人数を推定し、推定した人数が最も多い言語を示す提供情報Qが生成される。すなわち、特定の放音位置で最も使用されていると推定される言語を示す提供情報Qが生成される。言語情報D4は、提供情報Qの生成に利用される情報である。なお、分類されたレコードの数が降順で上位に位置する複数の言語を示す提供情報Qを生成してもよい。
第3実施形態では、交通機関に設置された電光掲示板、または商業施設に設置される電子看板(デジタルサイネージ)等の案内用の表示端末を端末装置10Bとして例示する。配信装置30は、端末テーブルTcに登録された複数の端末装置10Bのうち、提供情報Qの生成に利用された言語情報D4に対応する位置情報D2が示す放音位置(すなわち提供情報Qが示す言語を使用する利用者が多く所在する放音位置)の付近に位置する端末装置10Bに、当該提供情報Qを送信する。端末装置10Bは、例えば配信装置30から送信された提供情報Qが示す言語により、各種の情報を表示する。すなわち、放音位置の付近において使用する人数が多い言語により情報が表示される。
なお、第3実施形態では、端末装置10Aが言語情報D4を生成したが、放音装置20が音声情報D1と位置情報D2とともに言語情報D4を端末装置10Aに送信してもよい。例えば、案内音声Vの言語を示す情報が言語情報D4として端末装置10Aに送信される。端末装置10Aは、放音装置20から送信された言語情報D4を配信装置30に送信する。また、以上の構成では、放音装置20からどの言語の案内音声Vが放音されているのかという情報収集が可能になる。
以上の説明から理解される通り、第3実施形態の提供情報生成部54は、音声テーブルTbに登録された複数の音声情報D1のうち、特定の言語を示す言語情報D4に対応付けられた2以上の音声情報D1を利用して、提供情報Qを生成する。第3実施形態でも第1実施形態と同様に、記憶装置32に記憶された複数の音声情報D1を様々な用途(例えば提供情報Qの生成)に活用するが可能である。第3実施形態では特に、各端末装置10Aから受信した音声情報D1と言語情報D4と対応付けて記憶装置32に記憶されるから、言語情報D4を様々な用途に活用することができる。
<変形例>
以上に例示した各態様に付加される具体的な変形の態様を以下に例示する。以下の例示から任意に選択された複数の態様を、相互に矛盾しない範囲で適宜に併合してもよい。
(1)前述の各形態では、記憶装置32(音声テーブルTb)に記憶された複数の音声情報D1を利用して提供情報Qを生成したが、記憶装置32に記憶された複数の音声情報D1は、提供情報Qの生成以外の様々な用途に活用される。例えば、記憶装置32に記憶された複数の音声情報D1またはその内容を統計的に分析することで、各種の事業(例えばマーケティング)に活用してもよい。なお、記憶装置32に記憶された音声情報D1以外の情報(例えば位置情報D2,時刻情報D3,言語情報D4)を分析に利用してもよい。また、音声テーブルTbを検索可能なデータベースとして提供してもよい。以上の説明から理解される通り、提供情報Qの生成は省略される。
(2)前述の各形態では、放音装置20が案内音声Vを放音したが、放音装置20が放音する音声は案内音声Vに限定されない。すなわち、端末装置10Aが収音する音声は案内音声V以外の音声でもよい。例えば、楽音(楽曲の演奏音)または警報音等の音声を端末装置10Aが収音し、当該音声を示す音声情報D1を生成してもよい。案内音声Vは、音声の一例である。
(3)前述の各形態では、案内音声Vを識別する識別子を音声情報D1として例示したが、音声情報D1は以上の例示に限定されない。例えば案内音声Vの発話内容を表す文字列を音声情報D1としてもよい。端末装置10Aの情報抽出部41は、収音装置14が生成した音響信号Yに対する音声認識により、案内音声Vの発話内容を表す文字列を音声情報D1として特定する。音響信号Yに対する音声認識には、例えばHMM(Hidden Markov Model)等の音響モデルと、言語的な制約を示す言語モデルとを利用した認識処理等の公知の技術が任意に採用され得る。端末装置10Aが音声認識により音声情報D1を生成する構成では、放音装置20による音声情報D1の送信は省略される。端末装置10Aは、案内音声Vの発話内容を表す文字列(音声情報D1)に対応する関連情報Rを配信装置30から受信する。また、音声情報D1は、情報の所在を表す情報(例えばURL)でもよい。以上の例示から理解される通り、音声情報D1は、端末装置10Aが収音した音声を示す情報として包括的に表現される。同様に、位置情報D2も放音位置を識別する識別子に限定されない。例えば、放音位置を示す文字列(例えば施設の名称)、または、放音位置を示すコンテンツの所在を表す情報(例えばURL)を位置情報D2として放音装置20が端末装置10Aに送信してもよい。
(4)前述の各形態で例示した位置情報D2と時刻情報D3とは、端末装置10Aによる収音の状況を示す状況情報として包括的に表現される。つまり、案内音声Vが収音された位置と、案内音声Vが収音された時刻とが収音の状況として例示される。なお、状況情報は、位置情報D2および時刻情報D3に限定されない。例えば、端末装置10Aにより撮像された画像、測位用の衛星(例えばGPS衛星)を利用して取得した位置、移動速度、アプリケーションの使用状況、ウェブブラウザによる閲覧履歴、プッシュ通知された情報、等の案内音声Vの収音時に端末装置10Aにより生成または取得される情報であれば、状況情報は任意である。
(5)第1実施形態と第2実施形態では、端末装置10Aが音声情報D1と状況情報とを配信装置30に送信し、第3実施形態では、端末装置10Aが音声情報D1と状況情報と言語情報D4とを配信装置30に送信したが、端末装置10Aが音声情報D1以外の情報を送信することは省略してもよい。
また、端末装置10Aが音声情報D1に付加して送信する情報は、状況情報および言語情報D4に限定されない。例えば、非常事態(例えば火災)の発生を知らせる案内音声Vを収音する端末装置10Aは、案内音声V以外の音(例えばサイレン等)も案内音声Vとともに収音し得る。以上の状況では、端末装置10Aが案内音声Vとともに収音した音の分類を示す情報(以下「分類情報」という)を音声情報D1に付加して配信装置30に送信してもよい。例えば、非常事態を知らせるサイレンを示す分類情報、または、爆発音および衝撃音等の異常音を示す分類情報が例示される。分類情報の生成には、公知の技術が任意に採用され得る。例えば音響信号Yの解析により分類情報が生成される。端末装置10Aは、音声情報D1と分類情報とを配信装置30に送信し、配信装置30(記憶制御部52)は、受信した音声情報D1と分類情報とを対応付けて記憶装置32に記憶させる。なお、案内音声V以外の音が含まれる音響信号Yを端末装置10Aが音声情報D1に付加して配信装置30に送信し、配信装置30が当該音響信号Yの解析により分類情報を生成してもよい。また、端末装置10Aが収音した案内音声Vの放音元である放音装置20に関する情報(例えば識別情報)を音声情報D1に付加して端末装置10Aから送信してもよい。
(6)第1実施形態および第2実施形態では、提供情報Qの生成に複数の音声情報D1を利用したが、複数の音声情報D1を利用せずに提供情報Qを生成してもよい。例えば状況情報のみを利用して提供情報Qを生成してもよい。例えば、音声テーブルTbに登録されている各放音位置を示す位置情報D2の数に応じて、当該放音位置毎に混雑の度合を示す提供情報Qを生成してもよい。
(7)音声情報D1を受信できるのはその案内音声Vを収音可能な特定の放音位置に制限されるから、音声情報D1は放音位置を示す情報とも表現できる。したがって、前述の各形態で例示した提供情報Qの生成において、複数の端末装置10Aから送信された位置情報D2を利用することは必須ではない。つまり、放音装置20による位置情報D2の送信は省略さ得る。
また、端末装置10Aは、測位用の衛星(例えばGPS衛星)からの電波を受信することで端末装置10Aの正確な位置情報D2を取得し、当該位置情報D2を音声情報D1に付加して送信してもよい。なお、衛星電波から特定される位置情報D2と、放音装置20から音響通信で受信した位置情報D2との双方を、音声テーブルTbに登録してもよい。衛星電波から特定される位置情報D2は、端末装置10Aの絶対的な位置を示すのに対し、音響通信で受信した位置情報D2は放音位置を示すという意味的な相違がある。例えば、端末装置10Aが電車等の移動体の内部に所在する場合を想定すると、衛星電波から特定される位置情報D2が示す絶対位置は移動体の移動に連動して変化するが、音響通信で受信した位置情報D2が示す放音位置は変化しない。
また、端末装置10Aが接続する通信網70を管理する電気通信事業者が生成する高精度な位置情報D2(以下「高精度位置情報」という)を提供情報Qの生成に利用してもよい。例えば音声情報D1に付加された時刻情報D3が示す時刻に端末装置10Aが所在する位置に対応した高精度位置情報が、当該音声情報D1に対応付けて音声テーブルTbに登録される。以上の構成では、電気通信事業者が生成する高精度位置情報を複数の音声情報D1の活用に利用することができる。以上の説明から理解される通り、前述の各形態において、配信装置30に対する位置情報D2の送信は省略される。なお、高精度位置情報と音声テーブルTbとの対応関係に応じて提供情報Qを生成してもよい。例えば、高精度位置情報が示す多数の端末装置10Aの移動傾向を加味して、音声テーブルTbから提供情報Qを生成してもよい。
(8)前述の各形態では、複数の音声情報D1を利用して提供情報Qを生成したが、提供情報Qの生成において複数の音声情報D1を利用することは必須ではない。すなわち、1個の音声情報D1を利用して提供情報Qを生成してもよい。例えば非常事態を知らせる案内音声Vの音声情報D1が端末装置10Aから配信装置30に送信された場合、当該音声情報D1を利用して非常事態を知らせる提供情報Qを生成してもよい。以上の構成では、配信装置30は、当該音声情報D1を利用して生成した提供情報Qを端末装置10Bに送信する要素として機能する。端末装置10Aと端末装置10Bとの異同は不問である。
(9)前述の各形態では、配信装置30は端末装置10Aに関連情報Rを送信したが、関連情報Rを端末装置10Aに送信することは省略してもよい。すなわち、端末装置10Aは音声情報D1を収集して配信装置30に送信するための情報端末として利用される。
(10)前述の各形態では、端末テーブルTcに登録される端末装置10Bに対して提供情報Qを送信したが、端末装置10Aに対して提供情報Qを送信してもよい。また、放音装置20が設置された施設Pの事業者に情報提供Qを提供してもよい。例えば、提供情報生成部54は、特定の案内音声V(例えば施設Pで放音されている案内音声V)を示す音声情報D1の増加傾向を知らせる提供情報Qを生成する。例えば、音声テーブルTbに登録された複数の音声情報D1のうち、施設Pを示す位置情報D2に対応する音声情報D1が短時間で増加傾向にある場合(例えば登録数が所定の閾値を上回る場合)に、提供情報Qが生成される。例えば、特定の案内音声Vを示す音声情報D1の登録数が増加したことを知らせる提供情報Q、または、当該音声情報D1の登録数を知らせる提供情報Qが生成される。生成された提供情報Qが施設Pの利用者の情報端末に送信される。利用者の情報端末は、例えば放音装置20を制御するための制御装置である。情報端末は、配信装置30から受信した提供情報Qが示す音声情報D1の増加傾向から、施設Pの混雑の状況(例えば混雑の度合)を推定する。次に、情報端末は、推定した混雑の状況から、施設Pの利用者を混雑の度合が低い場所に誘導するための案内音声Vを、所定のタイミングで放音装置20に放音させる。
(11)前述の各形態では、各端末装置10Aが関連情報Rの取得のために送信した音声情報D1を記憶装置32(音声テーブルTb)に記憶したが、端末装置10Aは関連情報Rの取得のために送信した音声情報D1とは異なるタイミングで送信された当該音声情報D1を記憶装置32に記憶してもよい。端末装置10Aは、案内音声Vを収音すると関連情報Rの取得のために音声情報D1を配信装置30に送信する。その後、端末装置10Aは、記憶装置32(音声テーブルTb)に記憶するための音声情報D1(および他の情報)を配信装置30に送信する。例えば、予め設定された時刻に複数の音声情報D1をまとめて送信してもよい。
(12)前述の各形態では、各端末装置10Aから送信された音声情報D1を配信装置30(音声テーブルTb)に記憶したが、配信装置30とは別体の情報処理装置に音声テーブルTb(音声情報D1)を記憶してもよい。各端末装置10Aは、配信装置30と情報処理装置とのそれぞれに音声情報D1を送信する。配信装置30は、関連テーブルTaを記憶し、音声情報D1に対応した関連情報Rを端末装置10Aに送信する。他方、情報処理装置の記憶装置は、各端末装置10Aから受信した複数の音声情報D1を含む音声テーブルTbを記憶する。提供情報Qは、情報処理装置から端末装置10Bに送信される。以上の構成では、音声情報D1を情報処理装置に送信するタイミングは任意である。例えば、配信装置30に対する音声情報D1の送信と同時でもよいし、予め設定された時刻に複数の音声情報D1をまとめて送信してもよい。なお、音声情報D1と、音声情報D1以外の情報(例えば状況情報または言語情報D4)とを情報処理装置に送信してもよい。
(13)前述の各形態では、関連情報取得部53は、関連テーブルTaから音声情報D1に対応する関連情報Rを取得したが、関連情報取得部53が関連情報Rを生成してもよい。例えば、案内音声Vの発話内容を表す文字列を示す音声情報D1から、当該文字列に応じた関連情報Rが生成される。すなわち、関連テーブルTaを記憶装置32に記憶しておくことは必須ではない。
(14)前述の各形態で例示した音声テーブルTbは、データ構造としても特定される。すなわち、音声テーブルTbは、放音装置20から放音されて端末装置10Aが収音した音声の内容をそれぞれが示す複数の音声情報D1を含むデータ構造であって、配信装置30(情報処理装置の一例)がデータ構造に含まれる複数の音声情報D1を利用して提供情報Qを生成する処理に利用される。
(15)端末装置10Aの制御装置11を情報抽出部41および再生制御部42として機能させるプログラムは、単体のアプリケーションソフトウェアのほか、例えば端末装置10Aにおいて使用される各種のアプリケーションソフトウェア(例えばブラウザ)に対するプラグインソフトウェアとして提供してもよい。
(16)前述の各形態に係る配信装置30または端末装置10(10A,10B)の機能は、各形態での例示の通り、制御装置31とプログラムとの協働により実現される。前述の各形態に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体または磁気記録媒体等の公知の任意の形式の記録媒体も包含される。なお、非一過性の記録媒体とは、一過性の伝搬信号(transitory, propagating signal)を除く任意の記録媒体を含み、揮発性の記録媒体も除外されない。また、通信網を介した配信の形態でプログラムをコンピュータに提供してもよい。
<付記>
以上に例示した形態から、例えば以下の構成が把握される。
本発明の好適な態様(第1態様)に係る情報処理方法は、放音装置から放音されて端末装置が収音した音声を示す音声情報を当該端末装置から受信し、複数の端末装置からそれぞれ受信した複数の音声情報を記憶装置に記憶する。以上の態様では、複数の端末装置からそれぞれ受信した複数の音声情報が記憶装置に記憶されるから、複数の音声情報を様々な用途に活用することができる。
第1態様の好適例(第2態様)では、前記記憶装置に記憶された前記複数の音声情報を利用して提供情報を生成し、前記提供情報を端末装置に送信する。以上の態様では、記憶装置に記憶された複数の音声情報を利用することで生成された提供情報が端末装置に送信されるから、複数の端末装置から送信された音声情報を提供情報の生成に活用することができる。
第2態様の好適例(第3態様)では、前記提供情報は、前記複数の音声情報が示す音声の内容に応じた情報である。以上の態様では、複数の端末装置が収音した音声の内容に応じた提供情報を生成することができる。
第2態様または第3態様の好適例(第4態様)では、前記端末装置による前記収音の状況を示す状況情報を当該端末装置から受信し、各端末装置から受信した前記音声情報と前記状況情報とを対応付けて前記記憶装置に記憶し、前記記憶装置に記憶された前記複数の音声情報のうち、特定の状況を示す前記状況情報に対応付けられた2以上の音声情報を利用して、前記提供情報を生成する。以上の態様では、記憶装置に記憶された複数の音声情報のうち、特定の状況を示す状況情報に対応付けられた2以上の音声情報から提供情報が生成されるから、特定の状況下で収音されたと推定される音声をそれぞれが示す2以上の音声情報から提供情報を生成することが可能である。
第4態様の好適例(第5態様)では、前記状況情報は、前記音声を収音したときの端末装置の位置を前記状況として示す位置情報を含み、前記記憶装置に記憶された複数の音声情報のうち、特定の位置を示す位置情報に対応付けられた2以上の音声情報を利用して、前記提供情報を生成する。以上の態様では、記憶装置に記憶された複数の音声情報のうち、特定の位置を示す位置情報に対応付けられた2以上の音声情報から提供情報が生成されるから、特定の位置で収音されたと推定される音声をそれぞれが示す2以上の音声情報から提供情報を生成することが可能である。
第4態様または第5態様の好適例(第6態様)では、前記状況情報は、前記音声を収音した時刻を前記状況として示す時刻情報を含み、前記記憶装置に記憶された複数の音声情報のうち、特定の時刻を示す時刻情報に対応付けられた2以上の音声情報を利用して、前記提供情報を生成する。以上の態様では、記憶装置に記憶された複数の音声情報のうち、特定の時刻を示す時刻情報に対応付けられた2以上の音声情報から提供情報が生成されるから、特定の時刻に収音されたと推定される音声をそれぞれが示す2以上の音声情報から提供情報を生成することが可能である。
第1態様から第6態様の何れかの好適例(第7態様)では、前記端末装置に設定された言語を示す言語情報を当該端末装置から受信し、各端末装置から受信した前記音声情報と前記言語情報とを対応付けて前記記憶装置に記憶する。以上の態様では、各端末装置から受信した言語情報と音声情報と対応付けて記憶装置に記憶されるから、案内音声を収音した端末装置に設定されている言語を示す言語情報を様々な用途に活用することができる。
本発明の好適な態様(第8態様)に係るデータ構造は、放音装置から放音されて端末装置が収音した音声の内容をそれぞれが示す複数の音声情報を含むデータ構造であって、情報処理装置が前記複数の音声情報を利用して提供情報を生成する処理に利用される。以上の態様では、データ構造に含まれる複数の音声情報が提供情報の生成に利用されるから、複数の端末装置から送信された音声情報を提供情報の生成に活用することができる。