WO2019142926A1

WO2019142926A1 - 音声情報提供システム、音声情報提供装置、及びプログラム

Info

Publication number: WO2019142926A1
Application number: PCT/JP2019/001546
Authority: WO
Inventors: 正義朴; 誠基中山; ノブオ原; 俊介加我; 賢司尾崎; 健佑松本; 和久前川
Original assignee: 株式会社電通ライブ; 株式会社バスキュール
Priority date: 2018-01-18
Filing date: 2019-01-18
Publication date: 2019-07-25
Also published as: JP2019126033A

Abstract

ユーザに煩わしい操作を強いることなく、必要な情報を必要なタイミングで音声により提供することができる音声情報提供システム等を提供する。　音声情報提供システムは、携帯端末と、携帯端末と通信ネットワークを介して接続された音声情報提供装置と、を備え、携帯端末は、発信機から発信された無線信号を受信し、当該携帯端末の端末ＩＤを発信機の信号ＩＤと共に音声情報提供装置に送信し、音声情報提供装置は受信した端末ＩＤ及び信号ＩＤに応じた音声データを携帯端末に送信し、携帯端末は無線信号を受信している間、音声情報提供装置から送信された音声データに基づく音声を再生する。

Description

音声情報提供システム、音声情報提供装置、及びプログラム

関連出願の相互参照

　本出願は、２０１８年１月１８日に出願された日本出願番号（特願）２０１８－００６７２９号に基づくもので、ここにその記載内容を援用する。

　本開示は、音声情報提供システム、音声情報提供装置、及びプログラムに関する。

　従来、美術館や博物館等の展示会場において、展示物に関する説明を音声で提供する音声ガイドシステムが利用されている。音声ガイドシステムは、ヘッドホン付きの端末装置に展示物と紐づけられた番号を入力すると、当該展示物の説明がヘッドホンから流れるというものである。
　また、近年では、展示会場に設置された発信機から発信されたＩＤ信号を、ユーザが携帯する携帯受信機で受信すると、携帯受信機に予め記録された音声ガイドが自動再生されるシステムも提案されている（例えば特許文献１参照）。

特開２０１１－１０９６２９号公報

　従来の音声ガイドシステムのように、ユーザの操作がトリガーとなって音声情報が提供されるシステムでは、ユーザは音声情報を得るために逐一操作をしなければならず、煩わしい。また、ユーザが移動している間に、操作が遅れたり操作し忘れたりした場合に、ユーザは必要な情報を必要なタイミングで得られなくなってしまう。

　また、特許文献１のように、携帯受信機に予め記録された音声ガイドが自動再生されるシステムでは、ユーザは居場所に応じた特定の情報しか得ることができない。

　そこで、本開示は、かかる事情に鑑みてなされたものであり、ユーザに煩わしい操作を強いることなく、必要な情報を必要なタイミングで音声により提供することができる音声情報提供システム、音声情報提供装置、及びプログラムを提供することを目的の一つとする。

　上記課題を解決するため、本発明の一態様である音声情報提供システムは、所定の範囲内に所定の強度を有する無線信号を発信する発信機であって、当該発信機の識別情報である信号ＩＤを前記無線信号に重畳して発信する発信機と、前記発信機から発信された前記無線信号を受信可能な受信デバイスと、通信ネットワークを介して情報を送受信するための通信インタフェースと、音声データに基づいて音声を再生する音声出力デバイスと、を有する携帯端末と、前記携帯端末と前記通信ネットワークを介して接続された音声情報提供装置と、を備え、前記携帯端末は、前記発信機から発信された前記無線信号を受信した場合に、当該携帯端末の識別情報である端末ＩＤを前記信号ＩＤと共に前記音声情報提供装置に送信し、前記音声情報提供装置は、前記携帯端末から前記端末ＩＤ及び前記信号ＩＤを受信した場合に、前記端末ＩＤ及び前記信号ＩＤに応じた音声データを前記携帯端末に送信し、前記携帯端末は、前記発信機から前記信号ＩＤが重畳された前記無線信号を受信している間、前記音声情報提供装置から送信された前記音声データに基づく音声を再生するものである。

　上記音声情報提供システムにおいて、前記音声情報提供装置は、前記発信機が設置された場所に関連する複数種類の音声データを格納する音声データ記憶部と、前記信号ＩＤに基づき、前記携帯端末を携帯するユーザの位置及び該ユーザの顔の向きを算出する位置及び向き算出部と、前記位置及び向き算出部により算出された前記ユーザの位置に基づき、前記複数種類の音声データのうちから、前記ユーザの位置に応じた音声データを選択する音声データ選択部と、前記音声データ選択部により選択された音声データを、予め設定された仮想的な音源の位置と前記ユーザの位置及び該ユーザの顔の向きとの関係に応じて、ステレオフォニック再生するための音声データに加工する音声データ加工部と、を有し、前記音声情報提供装置は、前記音声データ加工部により加工された音声データを前記携帯端末に送信し、前記携帯端末は、前記加工された音声データに基づき、ステレオフォニック再生を行っても良い。

　上記音声情報提供システムにおいて、前記携帯端末は、前記複数の発信機のうち２つ以上の発信機から発信された無線信号を受信した場合に、該２つ以上の発信機の信号ＩＤを前記音声情報提供装置に送信し、前記位置及び向き算出部は、前記２つ以上の発信機の信号ＩＤに基づいて、前記ユーザの位置及び該ユーザの顔の向きを算出しても良い。

　上記音声情報提供システムにおいて、前記音声出力デバイスは、右耳に装着される第１音声出力部と、左耳に装着される第２音声出力部とが設けられたヘッドホン又はイヤホンであり、前記第１及び第２音声出力部の各々に、無線信号を発信するタグが設けられ、前記タグから発信された無線信号を検出し、前記タグの位置情報を出力するリーダをさらに備え、前記位置及び向き算出部は、前記リーダから出力された前記タグの位置情報に基づいて、前記ユーザの位置及び該ユーザの顔の向きを推定しても良い。

　上記音声情報提供システムにおいて、前記音声情報提供装置は、前記発信機が設置された場所に関連する複数種類の音声データを格納する音声データ記憶部と、前記携帯端末を携帯するユーザに関する情報を前記端末ＩＤと関連付けて格納するデータベースと、前記携帯端末から前記端末ＩＤ及び前記信号ＩＤを受信した場合に、前記端末ＩＤに基づいて、前記複数種類の音声データのうち、前記ユーザに関する情報に応じた音声データを選択して前記携帯端末に送信する音声データ選択部と、を有してもよい。

　上記音声情報提供システムにおいて、前記携帯端末は、前記発信機から前記無線信号を受信している間、前記音声情報提供装置に向け、前記端末ＩＤ及び前記信号ＩＤを所定の周期で前記音声情報提供装置に送信し、前記音声情報提供装置は、前記端末ＩＤ及び前記信号ＩＤの受信ログを記録し、前記携帯端末が前記無線信号を受信していたトータルの時間を集計してもよい。

　上記音声情報提供システムにおいて、前記携帯端末は、前記発信機からの前記無線信号の受信を開始した際に、前記端末ＩＤ及び前記信号ＩＤと共に、前記無線信号の受信を開始した旨を表す情報を前記音声情報提供装置に送信し、前記無線信号の受信を終了した際に、前記端末ＩＤ及び前記信号ＩＤと共に、前記無線信号の受信を終了した旨を表す情報を前記音声情報提供装置に送信し、前記音声情報提供装置は、前記無線信号の受信を開始した旨を表す情報及び前記無線信号の受信を終了した旨を表す情報の受信ログを記録し、前記携帯端末が前記無線信号を受信していたトータルの時間を集計してもよい。

　上記音声情報提供システムにおいて、前記音声情報提供装置は、前記端末ＩＤ及び前記信号ＩＤに応じた副音声用の音声データを前記携帯端末に送信し、前記携帯端末は、前記副音声用の音声データに基づく音声を再生するか否かの設定を行う設定手段を有してもよい。

　上記音声情報提供システムにおいて、前記携帯端末は、さらに、ＧＰＳ信号を受信可能であり、前記携帯端末は、受信したＧＰＳ信号に関する情報を前記端末ＩＤと共に前記音声情報提供装置に送信し、前記音声情報提供装置は、前記携帯端末から前記ＧＰＳ信号に関する情報及び前記端末ＩＤを受信した場合に、前記ＧＰＳ信号に関する情報に基づいて前記携帯端末の位置を特定すると共に、該位置及び前記端末ＩＤに応じた音声情報を前記携帯端末に送信してもよい。

　本発明の別の態様である音声情報提供装置は、通信ネットワークに接続された携帯端末に音声を再生させる音声情報提供システムにおいて用いられる音声情報提供装置であって、前記音声情報提供システムは、所定の範囲内に所定の強度を有する無線信号を発信する発信機であって、当該発信機の識別情報である信号ＩＤを前記無線信号に重畳して発信する発信機を備え、前記携帯端末は、前記発信機から発信された前記無線信号を受信可能な受信デバイスと、前記通信ネットワークを介して情報を送受信するための通信インタフェースと、音声データに基づいて音声を再生する音声出力デバイスと、有し、前記複数種類の音声データを格納する音声データ記憶部と、前記携帯端末から当該携帯端末の識別情報である端末ＩＤ及び前記信号ＩＤが送信された場合に、前記複数種類の音声データの中から前記端末ＩＤ及び前記信号ＩＤに応じた音声データを選択する音声データ選択部と、前記音声データ選択部により選択された音声データを、前記通信ネットワークを介して前記携帯端末に送信する通信インタフェースと、を有するものである。

　本発明のさらに別の態様であるプログラムは、通信ネットワークに接続された携帯端末に音声を再生させる音声情報提供システムにおいて、コンピュータに実行させるプログラムであって、前記音声情報提供システムは、所定の範囲内に所定の強度を有する無線信号を発信する発信機であって、当該発信機の識別情報である信号ＩＤを前記無線信号に重畳して発信する発信機を備え、前記携帯端末は、前記発信機から発信された前記無線信号を受信可能な受信デバイスと、前記通信ネットワークを介して情報を送受信するための通信インタフェースと、音声データに基づいて音声を再生する音声出力デバイスと、有し、前記携帯端末から当該携帯端末の識別情報である端末ＩＤ及び前記信号ＩＤが送信された場合に、前記端末ＩＤ及び前記信号ＩＤを受信するステップ（ａ）と、記憶部に予め格納された複数種類の音声データの中から、前記端末ＩＤ及び前記信号ＩＤに応じた音声データを選択するステップ（ｂ）と、ステップ（ｂ）において選択された音声データを、前記通信ネットワークを介して前記携帯端末に送信するステップ（ｃ）と、を実行させるものである。

　本発明のさらに別の態様であるプログラムは、通信ネットワークに接続された携帯端末に音声を再生させる音声情報提供システムにおいて、前記携帯端末に実行させるプログラムであって、前記音声情報提供システムは、所定の範囲内に所定の強度を有する無線信号を発信する発信機であって、当該発信機の識別情報である信号ＩＤを前記無線信号に重畳して発信する発信機と、複数種類の音声データを格納する音声情報提供装置と、を備え、前記携帯端末は、前記発信機から発信された前記無線信号を受信可能な受信デバイスを有し、ユーザに該ユーザに関する情報を入力させるための画面を表示すると共に、入力された前記ユーザに関する情報を、当該携帯端末の識別情報である端末ＩＤと共に前記音声情報提供装置に送信するステップと、前記発信機から発信された前記無線信号を受信した場合に、前記端末ＩＤ及び前記信号ＩＤを前記音声情報提供装置に送信するステップと、
　前記音声情報提供装置において前記複数種類の音声データの中から前記端末ＩＤ及び前記信号ＩＤに応じて選択された音声データを受信するステップと、受信した前記音声データに基づいて音声を再生するステップと、前記発信機から発信された前記無線信号を受信しなくなった場合に、前記音声の再生を停止するステップと、を実行させるものである。

　本発明によれば、携帯端末から送信された端末ＩＤ及び発信機の信号ＩＤに応じた音声データを音声情報提供装置から携帯端末に送信し、音声データに基づく音声を携帯端末に再生させるので、ユーザに煩わしい操作を強いることなく、携帯端末ごとに必要な情報を必要なタイミングで音声により提供することが可能となる。

本発明の第１の実施形態に係る音声情報提供システムの一例を示す模式図である。図１に示す音声情報提供システムが使用される展示会場の一例を示す模式図である。本発明の第１の実施形態に係る携帯端末のハードウェア構成の一例を示すシステムブロック図である。本発明の第１の実施形態に係る携帯端末の機能の一例を示すブロック図である。本発明の第１の実施形態に係る音声情報提供装置（サーバ）のハードウェア構成の一例を示すシステムブロック図である。本発明の第１の実施形態に係る音声情報提供装置（サーバ）に記憶されているデータの一例を示すブロック図である。本発明の第１の実施形態に係る音声情報提供装置（サーバ）の機能の一例を示すブロック図である。本発明の第１の実施形態に係る携帯端末の動作の一例を示すフローチャートである。本発明の第１の実施形態に係る音声情報提供装置（サーバ）の動作の一例を示すフローチャートである。本発明の第１の実施形態に係る携帯端末に表示される画面の一例を示す模式図である。本発明の第１の実施形態に係る携帯端末に表示される画面の一例を示す模式図である。本発明の第１の実施形態に係る携帯端末に表示される画面の一例を示す模式図である。本発明の第２の実施形態に係る音声情報提供装置（サーバ）の機能の一例を示すブロック図である。

　以下、本発明の実施の形態について詳細に説明する。なお、以下の実施の形態は、本発明を説明するための例示であり、本発明をその実施の形態のみに限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施の形態を採用することが可能であり、かかる実施の形態も本発明の範囲に含まれる。またさらに、必要に応じて示す上下左右等の位置関係は、特に断らない限り、図示の表示に基づくものとする。さらにまた、図面における各種の寸法比率は、その図示の比率に限定されるものではない。

　図１は、本発明の第１の実施形態に係る音声情報提供システムの一例を示す模式図である。図２は、図１に示す音声情報提供システムが使用される展示会場の一例を示す模式図である。以下においては、図２に示すように、展示イベントが行われる展示会場２に音声情報提供システムを適用する例を説明する。

１．実施形態の概念
　本実施形態に係る音声情報提供システム１は、概念的には、空間又は特定の展示物などの現実世界に、「目に見えない追加情報」を音声でプロットしていくシステムであると言える。システムの概要としては、所定のアプリケーションプログラムをインストールした携帯端末（スマートフォン等）１０をユーザに携帯させ、この携帯端末がビーコン、ＧＰＳ信号、特定の高周波信号などの無線信号を受信したことをトリガーとして、インターネット等の通信ネットワークＮ経由で音声データをサーバ２０から携帯端末１０に送信し、音声を自動再生させるというものである。これにより、ユーザの居場所に応じた情報であって、現実世界のみからでは得られない情報をユーザに提供することができる。この際、本実施形態においては、ユーザの行動や属性、或いは、時間経過やイベントの進行状況などに応じて、ユーザが受け取る音声情報を変化させることができる。このような機能を活用することで、様々なイベントや施設に、単なる音声ガイダンスを超える新しい体験やサービス価値を付加することが可能となる。また、ユーザは、現実世界からの視覚情報を遮られたり、煩わしい操作を強いられたりすることなく、その場に応じた情報を入手することができるので、より自由度の高い拡張体験を提供することが可能となる。

２．第１の実施形態の構成
２－１．構成概要
　図１に示すように、本実施形態に係る音声情報提供システム１は、展示会場２を訪れるユーザが使用する携帯端末１０と、音声情報提供装置であるサーバ２０と、展示会場２の入口及び出口に設置されるオペレーション端末３０と、展示会場２の各所に設置された複数の発信機４０とを備える。このうち、携帯端末１０、サーバ２０、及びオペレーション端末３０は、通信ネットワークＮを介して接続されている。

　通信ネットワークＮは、携帯端末１０、サーバ２０、及びオペレーション端末３０の間で相互に情報を送受信可能な通信網を含む。通信ネットワークＮは、例えば、インターネット、ＬＡＮ、専用線、電話回線、企業内ネットワーク、移動体通信網、ブルートゥース（登録商標）、ＷｉＦｉ（Wireless　Fidelity）、その他の通信回線、それらの組み合わせ等のいずれであってもよく、有線であるか無線であるかを問わない。

　図２を参照して、展示会場２は、ユーザが入出場する入口及び出口を結ぶ経路が形成されるようにレイアウトされており、この会場内には、経路に沿ってストーリーが展開されるように、種々の展示物３が展示されている。また、会場内には、各展示物３の周囲の所定範囲に特定の無線信号を発信する発信機４０が、展示物３の閲覧の妨げにならないように設置されている。また、ユーザが必ず通過する入口及び出口にも、発信機４０を設置してもよい。

　各発信機４０は、ＢＬＥ（Bluetooth（登録商標）　Low　Energy）などの通信規格に基づき、所定の電波を利用した無線信号（以下、ビーコンという）を発信する。各発信機４０には識別情報であるビーコンＩＤ（信号ＩＤ）が付与されており、このビーコンＩＤを無線信号に重畳して発信する。本実施形態において、各発信機４０は特定の展示物３と紐付けられており、各発信機４０によるビーコンの発信強度は、対応する展示物３の周囲の所定範囲Ｒ（例えば数十ｃｍ～数ｍ程度の範囲）において携帯端末１０により受信可能となるように、また、隣接する発信機４０が発信したビーコンとの間で混信が生じないように設定されている。

２－２．携帯端末１０の構成
ア）ハードウェア構成
　図３は、携帯端末１０のハードウェア構成の一例を示すシステムブロック図である。携帯端末１０は、通信ネットワークＮとの通信機能を有する端末装置であり、具体的には、スマートフォン、携帯電話、タブレット端末等によって構成される。これらの端末装置に、展示会場２で開催されるイベントにおける音声情報提供サービスを利用するためのアプリケーションプログラムＰ１０をインストールして実行することにより、当該音声情報提供システム１における携帯端末１０として動作する。なお、図１においては、携帯端末１０を１台のみ示しているが、実際には、互いにユーザが異なる複数台の携帯端末１０が同時に使用され得る。

　図３に示すように、携帯端末１０は、プロセッサ１１と、記憶部１２と、音声入出力デバイス１３と、入力デバイス１４と、表示デバイス１５と、通信インタフェース１６と、受信デバイス１７と、センサ部１８と、カメラ１９と、これらを接続するシステムバスＢ１とを備える。

　プロセッサ１１は、算術演算、論理演算、ビット演算等を処理する算術論理演算ユニット（ＣＰＵなど）及び各種レジスタから構成され、記憶部１２に格納されている各種プログラムを実行することで携帯端末１０の各部を中枢的に制御する。各種レジスタは、例えば、プログラムカウンタ、データレジスタ、命令レジスタ、汎用レジスタ等である。また、プロセッサ１１は、アプリケーションプログラムＰ１０を実行することにより、ユーザの居場所に応じた音声情報を提供するための各種機能を実現する。

　記憶部１２は、物理デバイス（例えば、半導体メモリ等のコンピュータ読み取り可能な記録媒体）の記憶領域が提供する論理デバイスであり、携帯端末１０の処理に用いられるオペレーティングシステムプログラム、ドライバプログラム、各種データ等を格納する。ドライバプログラムとしては、例えば、音声入出力デバイス１３を制御するための入出力デバイスドライバプログラム、入力デバイス１４を制御するための入力デバイスドライバプログラム、表示デバイス１５を制御するための出力デバイスドライバプログラム等が挙げられる。

　音声入出力デバイス１３は、例えば、入力された音声を電気的な信号（音声信号）に変換する一般的なマイクロフォン（音声入力デバイス）、及び音声信号を音声として再生可能なサウンドプレイヤ（音声出力デバイス）である。音声出力デバイスとしては、携帯端末１０に内蔵されたスピーカであってもよいし、携帯端末１０に無線又は有線で接続されるヘッドホン又はイヤホンであってもよい。

　入力デバイス１４は、例えば各種操作ボタンや表示デバイス１５に設けられたタッチパネルを用いて構成され、操作ボタンやタッチパネルに対する入力操作を受け付けるインタフェースを提供する。
　表示デバイス１５は、例えば液晶ディスプレイや有機ＥＬディスプレイを用いて構成される。

　通信インタフェース１６は、携帯端末１０を通信ネットワークＮに接続し、通信ネットワークＮ上の他の端末と通信をするためのハードウェアモジュールである。通信インタフェース１６は、例えば、ＩＳＤＮモデム、ＡＤＳＬモデム、ケーブルモデム、光モデム、ソフトモデム等の変調復調装置である。

　受信デバイス１７は、発信機４０から発信されたビーコンや、ＧＰＳ（Global　Positioning　System）衛星４５から送信されたＧＰＳ信号や、その他の信号発信源４６から発信された高周波信号等の無線信号を受信する。

　センサ部１８は、例えば、ジャイロセンサ、加速度センサ、照度センサ、磁気センサ等のセンシングデバイスを含み、携帯端末１０の運動（移動速度、回転速度など）や姿勢（傾きなど）等を検出する。また、携帯端末１０に近距離無線通信（Near　Field　Communication：ＮＦＣ）用チップが搭載されている場合には、展示会場２の各所にＮＦＣ対応機器を設置することにより、携帯端末１０が接触（又は近接）した箇所を検出することが可能であり、この場合、ＮＦＣ用チップを接触センサとして利用することができる。

　カメラ１９は、集光レンズ等の光学素子、及びＣＣＤイメージセンサやＣＭＯＳイメージセンサ等の撮像素子を含み、被写体を撮影して画像信号を生成する機能を提供する。

イ）機能構成
　図４は、携帯端末１０の機能の一例を示すブロック図である。図４に示すように、プロセッサ１１がアプリケーションプログラムＰ１０を実行することにより実現される機能部には、表示制御部１１１、信号取得情報処理部１１２、音声再生処理部１１３、及び副音声設定部１１４が含まれる。
　表示制御部１１１は、表示デバイス１５に所定の画面を表示させる制御を行う。

　信号取得情報処理部１１２は、受信デバイス１７が所定の無線信号を受信した場合に、当該無線信号に重畳された情報を抽出し、通信ネットワークＮを介してサーバ２０に送信する処理を行う。一例として、信号取得情報処理部１１２は、発信機４０から発信されたビーコンを受信デバイス１７が受信すると、ビーコンに重畳されたビーコンＩＤを抽出し、このビーコンＩＤを、携帯端末１０に予め設定されている識別情報（以下、端末ＩＤという）と共に、通信ネットワークＮを介してサーバ２０に送信する。信号取得情報処理部１１２は、複数の発信機４０から発信されたビーコンを受信デバイス１７が受信した場合には、受信強度が最も強いビーコンからビーコンＩＤを抽出することとしてもよい。なお、「無線信号を受信した場合」とは、受信した無線信号の強度が所定の閾値を超えた場合を含む。

　信号取得情報処理部１１２は、所定の周期で、上述したビーコンＩＤ及び端末ＩＤの送信処理を行う。ここで、所定の周期とは、例えば、数秒～数分ごとといった時間間隔である。或いは、信号取得情報処理部１１２は、ある発信機４０から発信されたビーコンを検出した際に、ビーコンＩＤ及び端末ＩＤと共に、ビーコンの受信を開始した旨の情報をサーバ２０に送信し、上記発信機４０から発信されたビーコンを検出できなくなった際に、ビーコンＩＤ及び端末ＩＤと共に、ビーコンの受信を停止した旨の情報をサーバ２０に送信してもよい。

　音声再生処理部１１３は、サーバ２０から送信された音声データに基づいて、音声入出力デバイス１３に音声を再生させる。音声再生処理部１１３は、無線信号の受信強度が所定の閾値を下回った場合には、サーバ２０から送信された音声データの再生を停止する構成でもよい。これによって、携帯端末１０においては、無線信号を所定の受信強度以上で受信している場合にのみ音声データを再生するよう制御することができる。

　副音声設定部１１４は、サーバ２０から送信された音声データに、主音声用の音声データと、副音声用の音声データとが含まれている場合に、副音声を再生するか否かの設定を行う。

２－３．サーバ２０の構成
ア）ハードウェア構成
　図５は、サーバ２０のハードウェア構成の一例を示すシステムブロック図である。サーバ２０は、例えば、演算処理能力の高いコンピュータによって構成され、所定のプログラム（プログラムＰ２０）を実行することにより、携帯端末１０、オペレーション端末３０、及び発信機４０と連携して、携帯端末１０に音声情報を提供する音声情報提供装置として機能する。

　図５に示すように、サーバ２０は、プロセッサ２１と、記憶部２２と、通信インタフェース２３と、これらを接続するシステムバスＢ２とを備える。

　プロセッサ２１は、算術演算、論理演算、ビット演算等を処理する算術論理演算ユニット（ＣＰＵなど）及び各種レジスタから構成され、記憶部２２に格納されている各種プログラムを実行することでサーバ２０の各部を中枢的に制御する。また、プロセッサ２１は、プログラムＰ２０を実行することにより、携帯端末１０に音声情報を提供するための各種機能を実現する。

　記憶部２２は、例えば、ディスクドライブ又は半導体メモリ等のコンピュータ読み取り可能な記録媒体からなる物理デバイスの記憶領域が提供する論理デバイスである。記憶部２２は、複数の物理デバイスを１つの論理デバイスにマッピングして構築してもよいし、１つの物理デバイスを複数の論理デバイスにマッピングして構築してもよい。記憶部２２は、オペレーティングシステムプログラムやドライバプログラム等の各種プログラム及びこれらのプログラムの実行中に使用される各種データを格納する。

イ）データ構造
　図６は、サーバ２０の記憶部２２に記憶されているデータの一例を示すブロック図である。図６に示すように、記憶部２２には、携帯端末１０において音声を再生させるために用いられる音声データＤ１と、携帯端末１０に特定の画面を表示させるために用いられる画面データＤ２と、ログデータＤ３と、ユーザ情報データベースＤ４と、会場情報データベースＤ５と、履歴情報データベースＤ６とが記憶されている。

　音声データＤ１は、展示物３の説明やキャラクターのセリフといった主音声を提供するための主音声データ、関連する情報（例えば、展示物３の背景説明などの副音声）を提供するための副音声データ、及びＢＧＭ用の音声データ等を含む。同一の展示物３に対しては、言語が異なる複数種類の音声データが用意されていると共に、ユーザの属性や行動履歴等に応じて異なる内容の音声を提供するための複数種類の音声データが用意されている。

　音声データＤ１において、音声データは、当該音声データに関連する展示物３の識別情報（または発信機４０のビーコンＩＤ）と対応付けられて登録されていてもよい。またさらに音声データＤ１において、音声データは、関連するユーザ情報（詳細は後述）とその関連度とが対応付けられて登録されていてもよい。例えば、ある音声データには、性別が関連するユーザ情報として登録されており、女性は関連度が高く、男性は関連度が低く登録されていてもよい。なお、音声データと関連するユーザ情報は性別に限定されず、年代や、居住国、使用言語、嗜好に関する情報等、任意のユーザ情報と関連する構成が可能である。

　さらに、音声データは、携帯端末１０の外部環境に関する情報と対応付けて登録されていてもよい。例えば、携帯端末１０の環境音の種類や音量、温度や湿度、混雑度等と対応付けて登録されてもよい。また例えば音声データは、優先度と対応付けて登録されてもよい。

　画面データＤ２は、携帯端末１０において音声が再生されている間に、音声と関連する情報を表示デバイス１５に表示させるためのデータである。具体的には、画面データＤ２は、展示物３のタイトル、シーンの説明、ＢＧＭの曲名やアーティスト名といったテキストデータ及び背景画像データを含む。

　ログデータＤ３は、携帯端末１０からサーバ２０に送信された情報の受信ログを記録したものである。具体的には、ログデータには、サーバ２０における情報の受信時刻（又は携帯端末１０におけるビーコンの受信時刻）、ビーコンＩＤ、及び端末ＩＤ等が含まれる。

　ユーザ情報データベースＤ４は、携帯端末１０を使用するユーザに関する情報（ユーザ情報）を格納する。ユーザ情報は、携帯端末１０の識別情報（端末ＩＤ）、ユーザ名（ニックネーム）、使用言語（日本語、英語等）等の基本情報に加え、性別、年代、居住国（居住地域）等の属性情報や、趣味や関心事等の嗜好に関する情報を含む。さらに、ユーザ情報は、後述するユーザ情報管理部２１１が送信したアンケートに対する回答を含んでもよい。

　会場情報データベースＤ５は、音声情報提供システム１が提供される会場に関する情報（会場情報）を格納する。会場情報は、展示会場２に設置された発信機４０のビーコンＩＤ、発信機４０の設置場所、発信機４０と紐付けられた展示物３の識別情報（名称や番号等）、当該展示物３に関する音声データや画面データが格納された記憶領域のアドレス等の情報を含む。

　履歴情報データベースＤ６は、携帯端末１０を携帯するユーザの行動履歴に関する情報（履歴情報）を格納する。具体的には、履歴情報は、展示会場２への入場時刻及び退場時刻、各展示物３を閲覧していた時間や閲覧した回数、各展示物３を閲覧した順番、展示会場２に来場した回数、受信時刻におけるユーザの位置情報などを含む。これらの情報は、ログデータを集計することにより得ることができる。

　通信インタフェース２３は、サーバ２０を通信ネットワークＮに接続し、通信ネットワークＮ上の他の端末と通信をするためのハードウェアモジュールである。通信インタフェース２３は、例えば、ＩＳＤＮモデム、ＡＤＳＬモデム、ケーブルモデム、光モデム、ソフトモデム等の変調復調装置である。

　ここで、サーバ２０を構成するコンピュータは、必ずしも１台である必要はなく、通信ネットワークＮ上に分散する複数のコンピュータから構成されてもよい。例えば、ユーザ情報データベースＤ４を別のコンピュータに設け、サーバ２０と連携させてもよい。

ウ）機能構成
　図７は、サーバ２０の機能の一例を示すブロック図である。図７に示すように、サーバ２０がプログラムＰ２０を実行することにより実現される機能部には、ユーザ情報管理部２１１、会場情報管理部２１２、音声データ選択部２１３、画面データ選択部２１４、ログ記録処理部２１５、及び集計部２１６が含まれる。

　ユーザ情報管理部２１１は、携帯端末１０から送信されたユーザ情報をユーザ情報データベースＤ４に登録し、必要に応じて修正するなどして管理する。例えばユーザ情報管理部２１１は、ユーザ情報の登録依頼をアンケート形式で携帯端末１０に送信し、その回答をユーザ情報データベースＤ４に登録することができる。なお、ユーザ情報管理部２１１は、例えば展示会場２に来場したきっかけ等、展示会の主催者がユーザに確認した情報をアンケートとして携帯端末１０に送信し、その回答をユーザ情報管理部２１１に登録することも可能である。

　会場情報管理部２１２は、オペレーション端末３０等から送信された会場情報に基づいて会場情報データベースＤ５を作成し、必要に応じて修正するなどして管理する。

　音声データ選択部２１３は、携帯端末１０からサーバ２０にビーコンＩＤ及び端末ＩＤが送信された場合に、記憶部２２に記憶された音声データＤ１の中から、ビーコンＩＤに対応する展示物３に関する複数種類の音声データを抽出すると共に、端末ＩＤに対応するユーザ情報を検索し、抽出した複数種類の音声データの中から更に、ユーザ情報に応じた音声データを選択して、携帯端末１０に送信する。具体的には音声データ選択部２１３は、ユーザ情報データベースＤ４に登録されたユーザ情報について、音声データＤ１において関連度が高い音声データを選択して携帯端末１０に送信することができる。例えば、ユーザの年代が２０代として登録されている場合には、抽出した複数種類の音声データの中から、年代「２０代」と関連度が高い音声データを選択し、携帯端末１０に送信することができる。なお音声データ選択部２１３は、ユーザ情報データベースＤ４に登録された使用言語と同じ種類の言語の音声データを携帯端末１０に送信することが好ましい。

　また、例えば音声データ選択部２１３は、ユーザの履歴情報やユーザ情報が特定条件を満たしているか否かを判定し、満たしている場合には音声データを携帯端末１０に送信する構成でもよい。特定条件は、例えば、特定の展示物３の閲覧時間（すなわち、特定の発信機４０から発信されるビーコンの受信時間）や、複数の展示物３を閲覧した順番（すなわち、ビーコンを受信した順番）、特定の展示物３を閲覧した回数、展示会場２に来場した回数、ユーザ情報の登録率等である。

　さらに音声データ選択部２１３は、携帯端末１０の外部環境（携帯端末１０の環境音の種類や音量、温度や湿度、混雑度等）に応じて送信する音声データを選択することも可能である。

　また、音声データ選択部２１３は、展示会場２における複数のユーザの分布や動きを解析し、解析結果に応じて音声データを出しわけることができる。具体的には、ログデータＤ３を参照して、各受信時刻（あるいは一定範囲の時刻に含まれる受信時刻）について、各ビーコンＩＤに紐づくユーザＩＤの数を算出することで展示会場２における複数のユーザの分布や動き（人の流れ）を解析することができる。このとき音声データ選択部２１３は、例えば所定の割合以上（例えば過半数）ユーザが集まっている展示物３や、滞留時間が長い展示物３に対応する発信機４０のビーコンを受信した携帯端末１０には優先度の高い音声データを送信してもよい。また例えば、所定の割合以上（例えば過半数）のユーザが一定の順番で展示物３を閲覧している場合には、当該順番にあわせて音声データを選択してもよい。

　また、音声データ選択部２１３は、携帯端末１０の信号取得情報処理部１１２からビーコンの受信を停止した旨の情報を受信した場合には、音声データの送信を停止する構成でもよい。これによって、携帯端末１０においては、無線信号を所定の受信強度以上で受信している場合にのみ音声データを再生するよう制御することができる。

　画面データ選択部２１４は、記憶部２２に記憶された画面データＤ２の中から、音声データ選択部２１３により選択された音声データと紐付けられた画面データを選択し、音声データと共に携帯端末１０に送信する。

　ログ記録処理部２１５は、携帯端末１０からサーバ２０に送信された情報の受信ログを記録する。詳細には、ログ記録処理部２１５は、端末ＩＤごとに、ビーコンＩＤ及び受信時刻等を記録する。

　集計部２１６は、記憶部２２に記憶されたログデータＤ３を、端末ＩＤごと、且つ、ビーコンＩＤごとに所定の周期で又は所定のタイミングで集計し、集計結果を履歴情報として履歴情報データベースＤ６に記録する。ここで、所定の周期とは、例えば、数秒～数分ごとといった時間間隔である。また、所定のタイミングとは、例えば、携帯端末１０がビーコンの受信を開始した旨の情報を受信したタイミングや、該ビーコンの受信を停止した旨の情報の受信したタイミング等のことである。詳細には、集計部２１６は、携帯端末１０が同一の発信機４０から発信されたビーコンを連続して受信していた時間を集計し、ビーコンＩＤと紐付けられた展示物３を抽出し、集計した時間を、ユーザが当該展示物３を閲覧していた時間として履歴情報データベースＤ６に記録する。また集計部２１６は、発信機４０のビーコンＩＤと受信時刻とに基づいて、各展示物３を閲覧した順番や閲覧した回数を算出し、履歴情報データベースＤ６に記録することができる。さらに、集計部２１６は、ログデータＤ３を参照し、ビーコンＩＤに対応する発信機４０の配置位置に基づいて、受信時刻におけるユーザの位置情報を集計し、履歴情報データベースＤ６に記録してもよい。

２－４．オペレーション端末３０の構成
　オペレーション端末３０は、展示会場２の入口及び出口に設置された受付（イベントオペレーション）において、オペレータ４が操作する端末装置であり、具体的にはパーソナルコンピュータ（ＰＣ）、ノートＰＣ、タブレット端末等によって構成される。なお、以下に説明するオペレーション端末３０の各機能はサーバ２０が備える構成でもよい。

　オペレーション端末３０は、サーバ２０からユーザ情報、会場情報、及び履歴情報等をダウンロードし、展示会場２において閲覧中のユーザの人数や展示会場２の混み具合、移動速度、閲覧中のユーザの属性等を画面に表示する。

　また、オペレーション端末３０は、ユーザの携帯端末１０にノベルティとして所定の音声データを提供することができる。例えば、オペレーション端末３０は、ユーザの履歴情報やユーザ情報が特定条件を満たしているか否かを判定し、満たしている場合にはノベルティを提供する構成でもよい。特定条件は、例えば、特定の展示物３の閲覧時間（すなわち、特定の発信機４０から発信されるビーコンの受信時間）や、複数の展示物３を閲覧した順番（すなわち、ビーコンを受信した順番）、展示会場２に来場した回数、ユーザ情報の登録率等である。この場合、オペレーション端末３０は、ユーザ情報データベースＤ４やログデータＤ３、履歴情報データベースＤ６等を参照して、ユーザが特定条件を満たしているか否かを判定することができる。

　また、例えばオペレーション端末３０は、ユーザの履歴情報に応じて提供するノベルティを選択したり生成してもよい。例えばオペレーション端末３０は、履歴情報データベースＤ６（又はログデータＤ３）に記録された閲覧時間（すなわち、ある発信機４０からビーコンを受信した時間）に基づいて、ノベルティを選択してもよい。具体的には、オペレーション端末３０は、履歴情報データベースＤ６を参照して、携帯端末１０のユーザの閲覧時間が最も長い展示物３（すなわち、ビーコンの受信時間が最も長い発信機４０）に関する音声データ（例えば展示物３において再生される音声データ等）を携帯端末１０に提供してもよい。

　また、例えばオペレーション端末３０は、展示物３の閲覧順（ビーコンを受信した順番）に基づいてノベルティを選択する構成でもよい。この場合、例えばユーザがＮ番目とＭ番目（例えば最初と最後）に閲覧した展示物３（すなわち、展示会場２に入場してからＮ番目にビーコンを受信した発信機４０とＭ番目にビーコンを受信した発信機４０）とに関連する音声データそれぞれをノベルティとして提供してもよいし、各展示物３に関連する音声データを当該各展示物３を閲覧した順番に組み合わせた音声データをノベルティとして提供してもよい。

　また、例えばオペレーション端末３０は、ある展示物３を閲覧した回数（同一発信機４０からビーコンを受信した回数）に基づいてノベルティを選択する構成でもよい。この場合、例えば閲覧回数が最も多い展示物３に関する音声データをノベルティとして提供することができる。

　さらにオペレーション端末３０は、ユーザ情報に応じてノベルティを選択してもよい。例えば、オペレーション端末３０は、ユーザ情報データベースＤ４を参照して、ユーザ情報管理部２１１が送信したアンケートに対する回答率に基づいて、携帯端末１０にノベルティを提供してもよい。また、ユーザの使用言語や性別や年代、嗜好に関する情報に基づいてノベルティを提供してもよい。具体的には、オペレーション端末３０は、ユーザ情報データベースＤ４に登録されたユーザ情報について、音声データＤ１において関連度が高い音声データを選択してノベルティとして提供してもよい。例えば、ユーザの性別が女性として登録されている場合には、性別「女性」と関連度が高い音声データをノベルティとして提供することができる。また、例えばユーザ情報データベースＤ４に登録された使用言語と同じ種類の言語の音声データをノベルティとして提供できる。

　また、ノベルティの提供はオペレーション端末３０が自動で行う構成に限定されず、オペレータ４が手動で行う構成でもよい。この場合、オペレータ４は、オペレーション端末３０に表示された情報を見て、ユーザを展示会場２内に案内するタイミングを調整したり、閲覧が終わったユーザに渡すノベルティグッズを選択したりすることができる。

　なお、オペレーション端末３０は、ユーザが展示会場２から脱出する際に、ノベルティを提供することが好ましい。

３．第１の実施形態の動作
　図８は、携帯端末１０の動作の一例を示すフローチャートである。また、図９は、サーバ２０の動作の一例を示すフローチャートである。図１０～図１２は、携帯端末１０の表示デバイス１５に表示される画面の一例を示す模式図である。以下、図８～図１２を参照しながら、音声情報提供システム１の動作を説明する。

　まず、携帯端末１０においてアプリケーションプログラムＰ１０を実行すると、携帯端末１０は、図１０に例示するユーザ情報入力画面を表示する（図８のステップＳ１０）。ユーザ情報入力画面には、ユーザのニックネーム、性別、使用言語等の基本情報の入力欄ａ１が設けられている。この他、ユーザ情報入力画面に、ユーザの年代、ユーザの趣味や関心事、当該展示会場２を訪れるきっかけ等のアンケート項目の入力欄ａ２を設けてもよい。

　ユーザ情報入力画面に対し、ユーザが入力デバイス１４を用いて入力操作を行い、さらに、ＯＫボタンａ３をタップすると、携帯端末１０は、入力欄ａ１、ａ２に入力された情報（ユーザ情報）を、当該携帯端末１０の端末ＩＤと共にサーバ２０に送信する（図８のステップＳ１１）。

　ここで、ユーザは、展示会場２に入る前までに、携帯端末１０からサーバ２０にユーザ情報する操作を行っておくことが好ましい。また、ユーザ情報の送信後、携帯端末１０は、図１１に例示する自動再生機能のスタート画面を表示してもよい。スタート画面には、ヘッドホンを装着して画面にタッチする旨のユーザに対するメッセージａ４が示されている。メッセージａ４に従って、ユーザが画面をタッチすると、音声情報提供システム１によるサービス（後述する図８のステップＳ１２～）が開示される。このように、ユーザによる操作をトリガーとすることで、サービス開始の齟齬をなくすことができる。この他、スタート画面内のスペースａ５に、ロゴやサービスマーク等を表示してもよい。

　携帯端末１０から携帯ＩＤ及びユーザ情報が送信されると、サーバ２０は、携帯端末１０のログインを受け付け（図９のステップＳ２０）、端末ＩＤ及びユーザ情報を受信し（ステップＳ２１）、ユーザ情報を登録する（ステップＳ２２）。その後、サーバ２０は、携帯端末１０から送信された情報のログの記録を開始する（ステップＳ２３）。

　携帯端末１０は、展示会場２においてビーコンを受信すると（図８のステップＳ１２：Ｙｅｓ）、受信したビーコンに重畳されたビーコンＩＤを抽出し、自身の端末ＩＤ及び抽出したビーコンＩＤをサーバ２０に送信する（ステップＳ１３）。この際、携帯端末１０は、併せて、センサ部１８により検出された携帯端末１０の運動や姿勢を表す情報をサーバ２０に送信してもよい。また、携帯端末１０は、複数の発信機４０から発信されたビーコンを受信した場合には、受信強度が最も強いビーコンのビーコンＩＤを抽出する。また、ビーコンを受信しない場合（ステップＳ１２：Ｎｏ）、携帯端末１０の動作はステップＳ１８に移行する。

　サーバ２０は、携帯端末１０から端末ＩＤ及びビーコンＩＤを受信すると（図９のステップＳ２４：Ｙｅｓ）、会場情報データベースＤ５を参照して、受信したビーコンＩＤに対応する展示物３を特定することにより、携帯端末の位置を検出する（ステップＳ２５）。他方、端末ＩＤ及びビーコンＩＤを受信しない場合（ステップＳ２４：Ｎｏ）、サーバ２０の動作はステップＳ３０に移行する。

　携帯端末１０の位置が展示会場２の外である場合（ステップＳ２６：Ｎｏ）、サーバ２０の動作はステップＳ３０に移行する。例えば、携帯端末１０から、展示会場２の入口又は出口に設置された発信機４０のビーコンＩＤが送信された場合、当該携帯端末１０は展示会場の外に位置していると判断される。

　他方、携帯端末１０の位置が展示会場２内である場合（ステップＳ２６：Ｙｅｓ）、サーバ２０は、携帯端末１０の位置及びユーザの属性に応じた音声データを携帯端末１０に送信する（ステップＳ２７）。詳細には、サーバ２０は、記憶部２２に記憶された音声データの中から、ビーコンＩＤに対応する展示物３に関する複数種類の音声データを抽出し、これらの音声データの中から更に、端末ＩＤに対応するユーザ情報に応じた音声データを選択して携帯端末１０に送信する。例えば、ビーコンＩＤに対応する展示物３に関する説明の音声データが選択された場合、ユーザの使用言語に対応する音声データ（日本語、英語など）や、ユーザの年齢に応じた音声データ（大人向け、子ども向けなど）、ユーザの興味関心に応じた音声データ（興味がある人向けの詳しい説明、初心者向けの簡素な説明など）等がさらに選択される。また、携帯端末１０から、携帯端末１０の運動や姿勢を表す情報が送信された場合には、これらの情報に応じてさらに音声データを選択してもよい。例えば、携帯端末１０の移動速度が速い場合には、簡素な説明の音声データを送信するといった処理を行ってもよい。

　なお、サーバ２０から携帯端末１０への音声データの送信形式は、ストリーミング形式であってもよいし、ダウンロード形式であってもよい。また、サーバ２０は、音声データと共に、該音声データに対応する画面データを携帯端末１０に送信してもよい。

　続いて、サーバ２０は、携帯端末１０から送信された情報のログの集計を行い（図９のステップＳ２８）、集計結果をオペレーション端末３０に送信する（ステップＳ２９）。これにより、オペレーション端末３０を操作するオペレータ４は、携帯端末１０を携帯するユーザの行動（経路や滞留していた位置や時間など）を随時把握することが可能となる。なお、ログの集計及び送信（ステップＳ２８、Ｓ２９）は、音声データの送信（ステップＳ２７）の有無によらず、サーバ２０において随時行ってもよい。
　その後、サーバ２０の動作はステップＳ２４に戻る。

　携帯端末１０は、サーバ２０から音声データを受信すると（図８のステップＳ１４：Ｙｅｓ）、受信した音声データに基づいて音声を再生する（ステップＳ１５）。また、携帯端末１０は、音声データと共に画面データを受信した場合には、該画面データに基づいて、図１２に例示するサービス画面を表示する。サービス画面は、自動再生中の音声や音楽の名称のテキストや背景画像が表示されるタイトル表示領域ａ６と、展示会場２におけるユーザの位置を表すエリアマップ表示領域ａ７とを含む。また、サービス画面に、副音声のオン又はオフを設定するための設定アイコン（設定手段）ａ８を表示してもよい。設定アイコンａ８が副音声オンの側に設定されている場合、サーバ２０から送信された音声データに副音声データが含まれているときに、副音声も自動再生させることができる。
　他方、音声データを受信しない場合（ステップＳ１４：Ｎｏ）、携帯端末１０の動作はステップＳ１８に移行する。

　その後、携帯端末１０は、ステップＳ１２において受信したビーコンと同じビーコンＩＤを有するビーコンが停止すると（ステップＳ１６：Ｙｅｓ）、即ち、該ビーコンを所定の強度以上で受信できなくなると、音声の再生を停止する（ステップＳ１７）。

　続いて、携帯端末１０は、ログアウトする操作がなされたか否かを判定する（ステップＳ１８）。例えば、ユーザが携帯端末１０に対し、アプリケーションプログラムＰ１０の実行を中止する操作を行った場合、携帯端末１０はログアウトする。ログアウトする場合（ステップＳ１８：Ｙｅｓ）、携帯端末１０の動作は終了する。他方、ログアウトしない場合（ステップＳ１８：Ｎｏ）、携帯端末１０の動作はステップＳ１２に戻る。

　サーバ２０は、携帯端末１０がログアウトすると（図９のステップＳ３０：Ｙｅｓ）、ログの記録を終了し（ステップＳ３１）、その後、動作を終了する。他方、携帯端末１０がログアウトしない場合（ステップＳ３０：Ｎｏ）、サーバ２０の動作はステップＳ２４に戻る。

　以上説明したように、本実施形態によれば、ユーザに煩わしい操作を強いることなく、必要な情報を必要なタイミングで音声により提供することができる。特に、本実施形態においては、ユーザの居場所に応じた音声情報を提供するだけでなく、予め登録されたユーザ情報に基づいて、ユーザの属性や嗜好に応じた、よりパーソナライズされた音声情報を、個々のユーザに提供することが可能となる。つまり、本実施形態によれば、ユーザの意思や操作によらず、音声による演出をユーザに体験させることができる。反対に、体験するか否かをユーザに選択させることも可能である。

　また、本実施形態によれば、携帯端末１０から送信された情報の受信ログを記録して集計するので、ユーザがどのような経路をたどり、どのエリアにどの程度滞留していたかといった位置に関する情報を取得し、リアルタイムに可視化することができる。従って、ユーザの行動を通して、ユーザの興味や嗜好を把握することができ、このようなユーザ個人の情報をリアルタイムで活用することも可能となる。例えば、ユーザが長く滞留していたエリアの展示物３に関連するノベルティグッズを出口で渡すことにより、当該イベントに対するユーザの印象をより強めることができる。また、ユーザが１つの展示物３のエリアを繰り返し訪れている場合には、２回目、３回目で異なる音声データを提供するといった利用方法も可能である。或いは、あるユーザの行動に応じて、別のユーザに提供する情報や演出を変化させることも可能である。

　また、本実施形態によれば、センサ部１８により検出された情報を携帯端末１０からサーバ２０に送信することにより、ユーザの行動情報を蓄積することができる。このようなユーザの行動情報は、各ユーザに送信する音声データの選択に使用できる他、複数のユーザの行動情報を蓄積することにより、展示会場２の改善に活用することも可能である。例えば、ある展示物の前で多くのユーザが頻繁に動いている場合、当該展示物の展示位置が適切でないため見難いといったことを推測することができる。

　また、上記実施形態においては、本実施形態に係る音声情報提供システム１を展示会場２に提供する例を説明したが、本システムはさらに様々な場面に適用することが可能である。例えば、携帯端末１０を介してリアルタイムに情報を集約し、特定の属性や嗜好、行動や経路などの特定条件を満たしているユーザのみに反応する音声演出や画面演出を行うことが可能である。この特定条件は、システムの開発者が任意に設計することができる。

　また、本実施形態によれば、副音声のオン／オフ機能を用いることにより、外部の環境音に応じた音声を出し分けすることも可能である。例えば、特定の環境音や映像にリンクし、演出音を付加することもできる。或いは、演出音声（主音声、副音声、ＢＧＭなど）に優先順位をつけ、オン／オフの自動切り替えや、音量の大小に差をつけて同時再生することも可能である。

　上記実施形態においては、展示会場２に設置された発信機４０が発信するビーコンを携帯端末１０において受信することとしたが、ＧＰＳ信号や所定の高周波信号を受信することとしてもよい。例えば、携帯端末１０がＧＰＳ信号を受信した場合、携帯端末１０は、ＧＰＳ信号に基づいて算出した自身の位置情報を、自身の端末ＩＤと共にサーバ２０に送信する。或いは、携帯端末１０からサーバ２０に、ＧＰＳ信号の受信情報（ＧＰＳ衛星の位置情報、ＧＰＳ信号の送信時刻、及び受信時刻）を送信し、サーバ２０において携帯端末１０の位置情報を算出することとしてもよい。この場合、発信機４０を設置する必要なく、任意の場所に位置する携帯端末１０に対し、当該位置及びユーザ情報に応じた音声情報や表示デバイス１５における視覚情報を提供することが可能となる。具体例として、街歩きするユーザに対し、道案内の音声や広告を提示したりすることも可能である。

４．第２の実施形態
　上記第１の実施形態においては、ユーザの位置に応じた音声情報を、携帯端末１０を介してユーザに提供することとしたが、第２の実施形態においては、例えば、展示会の会場であれば展示物が展示されている箇所、街中であれば道案内における誘導箇所といった特定の場所に恰も音源が設置されており、その音源から、ユーザの位置に応じた音声情報が聞こえてくるかのようにユーザが認識できるようにしても良い。以下、特定の場所から音声情報が聞こえてくるかのようにユーザが認識する仮想的な音源のことを、仮想音源という。以下においては、第２の実施形態に係る音声情報提供システムを、上記第１の実施形態と同様、展示会場２（図２参照）に適用したものとして説明する。

４－１．第２の実施形態の構成
　本発明の第２の実施形態に係る音声情報提供システムの構成は、全体として、上記第１の実施形態（図１～図７参照）と同様であり、音声情報提供装置（サーバ２０）の機能の一部が上記第１の実施形態と異なる。

　ここで、本実施形態においては、音声入出力デバイス１３（図３参照）として、ユーザの右耳に装着され、右耳用の音声を出力する音声出力部と、ユーザの左耳に装着され、左耳用の音声を出力する音声出力部とが設けられたステレオフォニック再生が可能なデバイス（ヘッドホン又はイヤホン）を用いられる。ここで、本明細書においてステレオフォニック再生とは、左右に設けられた一対の音声出力部から２チャンネルの音声をそれぞれ出力する音声の再生方法のことである。

　また、本実施形態においては、記憶部２２（図６参照）に記憶される会場情報データベースＤ５に、会場情報として、予め設定された複数の仮想音源の位置情報が格納される。具体的には、展示会場２に設置された各発信機４０の位置や、展示物３の位置等が、仮想音源の位置として設定される。或いは、ある発信機４０と隣の発信機４０との間に設定された特定のルートを、移動可能な仮想音源の位置として設定しても良い。

　図１３は、本実施形態に係るサーバの機能の一例を示すブロック図である。サーバ（プロセッサ２１Ａ）が記憶部２２（図５参照）に記憶されたプログラムを実行することにより実現される機能部には、ユーザ情報管理部２１１、会場情報管理部２１２、音声データ選択部２１３、画面データ選択部２１４、ログ記録処理部２１５、及び集計部２１６に加え、位置及び向き算出部２１７並びに音声データ加工部２１８が含まれる。このうち、ユーザ情報管理部２１１～集計部２１６の機能については、上記第１の実施形態と同様である。

　位置及び向き算出部２１７は、携帯端末１０から送信されたビーコンＩＤ及び端末ＩＤに基づき、当該携帯端末１０を携帯しているユーザの位置及びユーザの顔の向きを算出する。

　音声データ加工部２１８は、ユーザ（携帯端末１０）の位置に応じて音声データ選択部２１３により選択された音声データを、仮想音源の位置とユーザの位置及び顔の向きとの関係に応じて、ステレオフォニック再生するための音声データに加工する。詳細には、音声データ加工部２１８は、ユーザの位置に応じた仮想音源を抽出し、恰もその仮想音源の方向から音声が聞こえてくるかのようにユーザが認識するように、右耳用の音声データと左耳用の音声データとを生成する。なお、仮想音源としては、ユーザの位置に最も近い仮想音源を抽出しても良いし、選択された音声データと紐付けられた固定位置の仮想音源を抽出しても良い。

　４－２．第２の実施形態の動作
　本発明の第２の実施形態に係る音声情報提供システムの動作は、全体として、上記第１の実施形態（図８及び図９参照）と同様であり、図８のステップＳ１３及びＳ１５における携帯端末１０の詳細な動作、並びに、図９のステップＳ２５及びＳ２７におけるサーバ２０の詳細な動作の上記第１の実施形態と異なる。

　即ち、携帯端末１０がビーコンを受信すると（図８のステップＳ１２：Ｙｅｓ）、携帯端末１０は、受信したビーコンに重畳されたビーコンＩＤを抽出し、自身の端末ＩＤ及び抽出したビーコンＩＤに加え、ビーコンの受信強度をサーバ２０に送信する（ステップＳ１３）。この際、携帯端末１０は、複数の発信機４０から発信されたビーコンを受信すると、複数のビーコンＩＤ及びそれぞれのビーコンの受信強度をサーバ２０に送信する。

　サーバ２０が携帯端末１０から端末ＩＤ及びビーコンＩＤに加え、ビーコンの受信強度を受信すると（図９のステップＳ２４：Ｙｅｓ）、サーバ２０は、携帯端末１０の位置（即ち、携帯端末１０を携帯するユーザの位置）に加え、ユーザの顔の向きを算出する。詳細には、サーバ２０は、複数のビーコンＩＤに基づき、携帯端末１０が受信したビーコンを発信した複数の発信機４０を特定すると共に、ビーコンの受信強度から、各発信機４０から携帯端末１０までの距離を算出する。そして、サーバ２０は、複数の発信機４０の位置及び距離に基づいて、ユーザの位置を算出する。また、サーバ２０は、所定の時間ごとにユーザの位置を複数回算出することにより、ユーザの位置の変化を表すベクトルを算出し、このベクトルの方向を、ユーザが顔を向けている方向と推定する。

　ユーザ（携帯端末１０）が展示会場２内にいる場合（ステップＳ２６：Ｙｅｓ）、サーバ２０は、記憶部２２に記憶された音声データの中から、ユーザの位置に応じた音声データを選択し、この音声データをステレオフォニック再生するための音声データに加工して、携帯端末１０に送信する（ステップＳ２７）。詳細には、サーバ２０は、ユーザの位置に応じて抽出された仮想音源の位置とユーザの位置及び向きとの関係に応じて、恰も仮想音源の方向から音声が聞こえるかのようにユーザが認識するように、右耳用の音声データと左耳用の音声データとを生成する。音声データの加工処理においては、左右の耳と仮想音源との距離に応じて左右の音声データ間に遅延を設けるバイノーラルアルゴリズム等、公知の手法を用いることができる。この際、サーバ２０は、ユーザの位置及び向きの変化や、仮想音源が移動する場合には仮想音源の位置の変化に応じて、音声データをリアルタイムに加工する。

　携帯端末１０が音声データを受信すると（図８のステップＳ１４：Ｙｅｓ）、携帯端末１０は、受信した音声データに基づいて音声を再生する（ステップＳ１５）。この際、携帯端末１０は、右耳用の音声データに基づき右耳用の音声出力部から音声を出力させると共に、左耳用の音声データに基づき左耳用の音声出力部から音声を出力させる。それにより、ユーザは、ヘッドホン又はイヤホンを装着しながらも、恰も特定の方向に位置する音源から音声が流れてきたかのように認識することができる。

　このような第２の実施形態によれば、ユーザは、よりリアリティのある音声情報を受け取ることができる。

　４－３．変形例その１
　ユーザの位置及び向きを検出する方法としては、上記第２の実施形態において説明した方法に限定されず、種々の手法を用いることができる。
　一例として、無線信号（ビーコン）を発信するタグと、該タグから発信された無線信号を検出し、タグの位置情報を出力するリーダとを含む構成される測位システムを用いて、ユーザの位置及び向きを検出しても良い。具体的には、ユーザが装着するヘッドホン又はイヤホンの左右の各々の側にタグを取り付けると共に、会場の天井等にリーダを設置しておく。ユーザがヘッドホン又はイヤホンを装着して会場内を移動すると、リーダは、タグから発信された無線信号を検出し、ヘッドホン又はイヤホンの左右の位置情報を出力する。サーバ２０は、このヘッドホン又はイヤホンの左右の位置情報を、当該ヘッドホン又はイヤホンと接続された携帯端末１０の携帯ＩＤと紐付けると共に、左右の位置情報から、ユーザの顔の高さ及び向きを推定する。この場合、ユーザの位置に加え、ユーザの顔の高さ及び向きを高精度で測定することができる。タグ及びリーダを含む測位システムとしては、例えばＱｕｕｐｐａ　Ｏｙ社のシステム「Ｑｕｕｐｐａ（登録商標）」等が挙げられる。

　別の例として、当該音声情報提供システムが適用される場所（例えば展示会場２）に複数のカメラを設置し、複数のカメラにより撮影された画像から、ユーザの位置並びに顔の高さ及び向きを検出しても良い。

　４－４．変形例その２
　上記第２の実施形態においては、ユーザは音声情報を受け取るのみであるが、ユーザのジェスチャが音声情報にフィードバックされるようにしても良い。即ち、携帯端末１０が、センサ部１８として設けられたジャイロセンサや加速度センサにより、携帯端末１０を携帯するユーザの運動（移動速度、回転速度等）や姿勢（傾き）を検出し、この運動や姿勢を表す情報をサーバ２０に送信する。サーバ２０は、ユーザの運動や姿勢に応じた音声情報を表す音声データを、ステレオフォニック再生するための音声データに加工し、携帯端末１０に送信する。携帯端末１０が、サーバ２０から受信した音声データに基づく音声を再生すると、ユーザは、恰も、自身のジェスチャにより音声が発生したかのように認識することができる。具体的には、ユーザが特定の場所でジャンプをすると、床から弾むような音が聞こえる、といった例が挙げられる。音声情報としては、複数のユーザ間で共通であっても良いし、ユーザごとに異なっていても良い。

　４－５．変形例その３
　上記第２の実施形態においては、ユーザの位置に応じた音声情報を個別に送信することとしたが、複数のユーザに対して共通の音声情報を一斉に送信するようにしても良い。例えば、特定の仮想音源と紐付けられた共通の音声データを、複数のユーザに対して同時に、各ユーザの位置及び向きに応じた音声データに加工した上で送信しても良い。それにより、複数のユーザに同じ体験を共有させることができる。

　以上説明した実施形態は、本発明を説明するための一例であり、本発明をその実施形態に限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、様々な変形が可能である。例えば、当業者であれば、実施形態で述べたリソース（ハードウェア資源又はソフトウェア資源）を均等物に置換することが可能であり、そのような置換も本発明の範囲に含まれる。

Claims

　所定の範囲内に所定の強度を有する無線信号を発信する発信機であって、当該発信機の識別情報である信号ＩＤを前記無線信号に重畳して発信する複数の発信機と、
　前記発信機から発信された前記無線信号を受信可能な受信デバイスと、通信ネットワークを介して情報を送受信するための通信インタフェースと、音声データに基づいて音声を再生する音声出力デバイスと、を有する携帯端末と、
　前記携帯端末と前記通信ネットワークを介して接続された音声情報提供装置と、
を備え、
　前記携帯端末は、前記複数の発信機のいずれかから発信された前記無線信号を受信した場合に、当該携帯端末の識別情報である端末ＩＤを前記信号ＩＤと共に前記音声情報提供装置に送信し、
　前記音声情報提供装置は、前記携帯端末から前記端末ＩＤ及び前記信号ＩＤを受信した場合に、前記端末ＩＤ及び前記信号ＩＤに応じた音声データを前記携帯端末に送信し、
　前記携帯端末は、前記発信機から前記信号ＩＤが重畳された前記無線信号を受信している間、前記音声情報提供装置から送信された前記音声データに基づく音声を再生する、
音声情報提供システム。
　前記音声情報提供装置は、
　前記発信機が設置された場所に関連する複数種類の音声データを格納する音声データ記憶部と、
　前記信号ＩＤに基づき、前記携帯端末を携帯するユーザの位置及び該ユーザの顔の向きを算出する位置及び向き算出部と、
　前記位置及び向き算出部により算出された前記ユーザの位置に基づき、前記複数種類の音声データのうちから、前記ユーザの位置に応じた音声データを選択する音声データ選択部と、
　前記音声データ選択部により選択された音声データを、予め設定された仮想的な音源の位置と前記ユーザの位置及び該ユーザの顔の向きとの関係に応じて、ステレオフォニック再生するための音声データに加工する音声データ加工部と、
を有し、
　前記音声情報提供装置は、前記音声データ加工部により加工された音声データを前記携帯端末に送信し、
　前記携帯端末は、前記加工された音声データに基づき、ステレオフォニック再生を行う、請求項１に記載の音声情報提供システム。
　前記携帯端末は、前記複数の発信機のうち２つ以上の発信機から発信された無線信号を受信した場合に、該２つ以上の発信機の信号ＩＤを前記音声情報提供装置に送信し、
　前記位置及び向き算出部は、前記２つ以上の発信機の信号ＩＤに基づいて、前記ユーザの位置及び該ユーザの顔の向きを算出する、請求項２に記載の音声情報提供システム。
　前記音声出力デバイスは、右耳に装着される第１音声出力部と、左耳に装着される第２音声出力部とが設けられたヘッドホン又はイヤホンであり、前記第１及び第２音声出力部の各々に、無線信号を発信するタグが設けられ、
　前記タグから発信された無線信号を検出し、前記タグの位置情報を出力するリーダをさらに備え、
　前記位置及び向き算出部は、前記リーダから出力された前記タグの位置情報に基づいて、前記ユーザの位置及び該ユーザの顔の向きを推定する、
請求項２に記載の音声情報提供システム。
　前記音声情報提供装置は、
　前記発信機が設置された場所に関連する複数種類の音声データを格納する音声データ記憶部と、
　前記携帯端末を携帯するユーザに関する情報を前記端末ＩＤと関連付けて格納するデータベースと、
　前記携帯端末から前記端末ＩＤ及び前記信号ＩＤを受信した場合に、前記端末ＩＤに基づいて、前記複数種類の音声データのうち、前記ユーザに関する情報に応じた音声データを選択して前記携帯端末に送信する音声データ選択部と、
を有する請求項１に記載の音声情報提供システム。
　前記携帯端末は、前記発信機から前記無線信号を受信している間、前記音声情報提供装置に向け、前記端末ＩＤ及び前記信号ＩＤを所定の周期で前記音声情報提供装置に送信し、
　前記音声情報提供装置は、前記端末ＩＤ及び前記信号ＩＤの受信ログを記録し、前記携帯端末が前記無線信号を受信していたトータルの時間、又は前記信号ＩＤに基づく位置情報を集計する、
請求項５に記載の音声情報提供システム。
　前記携帯端末は、前記発信機からの前記無線信号の受信を開始した際に、前記端末ＩＤ及び前記信号ＩＤと共に、前記無線信号の受信を開始した旨を表す情報を前記音声情報提供装置に送信し、前記無線信号の受信を終了した際に、前記端末ＩＤ及び前記信号ＩＤと共に、前記無線信号の受信を終了した旨を表す情報を前記音声情報提供装置に送信し、
　前記音声情報提供装置は、前記無線信号の受信を開始した旨を表す情報及び前記無線信号の受信を終了した旨を表す情報の受信ログを記録し、前記携帯端末が前記無線信号を受信していたトータルの時間、又は前記信号ＩＤに基づく位置情報を集計する、
請求項５に記載の音声情報提供システム。
　前記音声情報提供装置は、前記端末ＩＤ及び前記信号ＩＤに応じた副音声用の音声データを前記携帯端末に送信し、
　前記携帯端末は、前記副音声用の音声データに基づく音声を再生するか否かの設定を行う設定手段を有する、
請求項１～７のいずれか１項に記載の音声情報提供システム。
　前記携帯端末は、さらに、ＧＰＳ信号を受信可能であり、
　前記携帯端末は、受信したＧＰＳ信号に関する情報を前記端末ＩＤと共に前記音声情報提供装置に送信し、
　前記音声情報提供装置は、前記携帯端末から前記ＧＰＳ信号に関する情報及び前記端末ＩＤを受信した場合に、前記ＧＰＳ信号に関する情報に基づいて前記携帯端末の位置を特定すると共に、該位置及び前記端末ＩＤに応じた音声情報を前記携帯端末に送信する、
請求項１、５～８のいずれか１項に記載の音声情報提供システム。
　前記音声情報提供装置は、
　前記携帯端末が所定のエリア内にいる際に、前記受信ログを記録し、
　前記携帯端末が前記所定のエリアから脱出する際に、前記受信ログに基づいて前記音声データ記憶部から音声データを選択し、ノベルティとして前記携帯端末に送信する提供部をさらに有する、
　請求項６又は７に記載の音声情報提供システム。
　前記提供部は、
　前記受信ログを解析し、前記携帯端末が前記無線信号を受信した順番、又は受信した時間に基づいて、音声データを選択する、
請求項１０に記載の音声情報提供システム。
　前記音声情報提供装置は、
　複数の前記携帯端末それぞれから前記端末ＩＤ及び前記信号ＩＤを受信して、前記複数の携帯端末ごとに前記受信ログを記録し、
　前記複数の携帯端末それぞれの前記受信ログに基づいて、複数のユーザの動きを解析し、当該動きに基づいて、前記複数の携帯端末それぞれに前記音声データを送信する、
請求項６乃至１１の何れか一項に記載の音声情報提供システム。
　通信ネットワークに接続された携帯端末に音声を再生させる音声情報提供システムにおいて用いられる音声情報提供装置であって、
　前記音声情報提供システムは、所定の範囲内に所定の強度を有する無線信号を発信する発信機であって、当該発信機の識別情報である信号ＩＤを前記無線信号に重畳して発信する発信機を備え、
　前記携帯端末は、前記発信機から発信された前記無線信号を受信可能な受信デバイスと、前記通信ネットワークを介して情報を送受信するための通信インタフェースと、音声データに基づいて音声を再生する音声出力デバイスと、有し、
　複数種類の前記音声データを格納する音声データ記憶部と、
　前記携帯端末から当該携帯端末の識別情報である端末ＩＤ及び前記信号ＩＤが送信された場合に、前記複数種類の音声データの中から前記端末ＩＤ及び前記信号ＩＤに応じた音声データを選択する音声データ選択部と、
　前記音声データ選択部により選択された音声データを、前記通信ネットワークを介して前記携帯端末に送信する通信インタフェースと、
を有する音声情報提供装置。
　通信ネットワークに接続された携帯端末に音声を再生させる音声情報提供システムにおいて、コンピュータに実行させるプログラムであって、
　前記音声情報提供システムは、所定の範囲内に所定の強度を有する無線信号を発信する発信機であって、当該発信機の識別情報である信号ＩＤを前記無線信号に重畳して発信する発信機を備え、
　前記携帯端末は、前記発信機から発信された前記無線信号を受信可能な受信デバイスと、前記通信ネットワークを介して情報を送受信するための通信インタフェースと、音声データに基づいて音声を再生する音声出力デバイスと、有し、
　前記携帯端末から当該携帯端末の識別情報である端末ＩＤ及び前記信号ＩＤが送信された場合に、前記端末ＩＤ及び前記信号ＩＤを受信するステップ（ａ）と、
　記憶部に予め格納された複数種類の音声データの中から、前記端末ＩＤ及び前記信号ＩＤに応じた音声データを選択するステップ（ｂ）と、
　ステップ（ｂ）において選択された音声データを、前記通信ネットワークを介して前記携帯端末に送信するステップ（ｃ）と、
を実行させるプログラム。
　通信ネットワークに接続された携帯端末に音声を再生させる音声情報提供システムにおいて、前記携帯端末に実行させるプログラムであって、
　前記音声情報提供システムは、所定の範囲内に所定の強度を有する無線信号を発信する発信機であって、当該発信機の識別情報である信号ＩＤを前記無線信号に重畳して発信する発信機と、複数種類の音声データを格納する音声情報提供装置と、を備え、
　前記携帯端末は、前記発信機から発信された前記無線信号を受信可能な受信デバイスを有し、
　ユーザに該ユーザに関する情報を入力させるための画面を表示すると共に、入力された前記ユーザに関する情報を、当該携帯端末の識別情報である端末ＩＤと共に前記音声情報提供装置に送信するステップと、
　前記発信機から発信された前記無線信号を受信した場合に、前記端末ＩＤ及び前記信号ＩＤを前記音声情報提供装置に送信するステップと、
　前記音声情報提供装置において前記複数種類の音声データの中から前記端末ＩＤ及び前記信号ＩＤに応じて選択された音声データを受信するステップと、
　受信した前記音声データに基づいて音声を再生するステップと、
　前記発信機から発信された前記無線信号を受信しなくなった場合に、前記音声の再生を停止するステップと、
を実行させるプログラム。