JP5949311B2

JP5949311B2 - 推定プログラム、推定装置、及び推定方法

Info

Publication number: JP5949311B2
Application number: JP2012180136A
Authority: JP
Inventors: 幹篤 ▲角▼岡; 佐々木　和雄; 和雄佐々木
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2012-08-15
Filing date: 2012-08-15
Publication date: 2016-07-06
Anticipated expiration: 2032-08-15
Also published as: US9594148B2; JP2014039140A; US20140050053A1

Description

本発明は、推定プログラム、推定装置、及び推定方法に関する。

例えば、複数の展示場所において並行して展示内容の説明が行われている大規模な展示会場において、来場者は、配布されたパンフレット等に掲載されている会場のレイアウト図等を参考にして、目的とする展示場所を探すのが一般的である。

しかしながら、レイアウト図を参考に目的とする展示場所に移動するには、自分の現在位置及び自分の向いている方向が、レイアウト図上のいずれの地点のいずれの方向に対応するのかを把握するための思考作業が必要とされる。

また、パンフレットに記載されている情報は静的なものである。したがって、例えば、類似したテーマの展示場所が複数存在する場合、自分が関心を持っている内容について、現在説明を行っている展示場所をパンフレットで特定するのは困難である。

特開２０００−１９４４６０号公報特開２００５−２０４５５号公報

一方、来場者は、展示場所から聞こえてくる音声を聴取し、興味の有る内容を含む音声の方向に移動する場合もある。すなわち、視覚ではなく、聴覚を頼りに、目的とする展示場所へ移動する場合もある。

しかし、多数の展示場所が隣接している展示会場においては、各展示場所からの音声が同時に聞こえてくる。したがって、各音源の方向を区別するのが困難な場合がある。また、展示会場内における音声の反射等により、音声がその音源とは異なる方向から聞こえてくる可能性も有る。

そこで、発明者は、頭部伝達関数を用いた音源定位技術を利用して作り出される仮想的な音源によって、来場者を誘導することはできないかと考えた。但し、来場者が関心を持っている音源を特定することができなければ、来場者を正しい方向に誘導するのは困難である。

そこで、一側面では、複数の音源の中から聴取者が関心を持っている音源の推定を可能とすることを目的とする。

一つの案では、推定プログラムは、複数の音源に関してスピーカーより出力される音声の聴取者の位置情報及び前記聴取者の向きを示す方向情報と、前記複数の音源のそれぞれの位置情報とに基づいて、前記聴取者の向きに対する各音源の第一の方向を特定し、前記音源ごとに、隣り合う音源の方向との間隔が所定値以上となる第二の方向を算出しし、前記第二の方向に各音源が定位されるように、前記スピーカーより出力される音声に関して音像定位処理を実行し、前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い音源が、前記聴取者の関心の対象であると推定する処理をコンピュータに実行させる。

一態様によれば、複数の音源の中から聴取者が関心を持っている音源の推定を可能とすることができる。

本実施の形態におけるシステム構成例を示す図である。本実施の形態においてユーザが関心の有る音源を特定する方法の概要を説明するための図である。本実施の形態におけるサーバ装置のハードウェア構成例を示す図である。本実施の形態におけるサーバ装置及び携帯端末の機能構成例を示す図である。ユーザ管理部が実行する処理手順の一例を説明するためのフローチャートである。ユーザ情報記憶部の構成例を示す図である。状態記憶部の構成例を示す図である。展示場所抽出部が実行する処理手順の一例を説明するためのフローチャートである。展示場所情報記憶部の構成例を示す図である。音源方向記憶部の構成例を示す図である。位置・方位管理部が実行する処理手順の一例を説明するためのフローチャートである。状態判定部が実行する処理手順の一例を説明するためのフローチャートである。定位方向算出部が実行する処理手順の一例を説明するためのフローチャートである。初期状態における定位方向算出処理の処理手順の一例を説明するためのフローチャートである。展開状態における定位方向算出処理の処理手順の一例を説明するためのフローチャートである。音声分解特性記憶部の構成例を示す図である。音源移動状態における定位方向算出処理の処理手順の一例を説明するためのフローチャートである。選択状態における定位方向算出処理の処理手順の一例を説明するためのフローチャートである。音像定位部が実行する処理手順の一例を説明するためのフローチャートである。初期状態の一例を説明するための図である。展開状態の一例を説明するための第一の図である。展開状態の一例を説明するための第二の図である。音源移動状態の一例を説明するための第一の図である。音源移動状態の一例を説明するための第二の図である。音源移動状態から展開状態への移行の一例を説明するための第一の図である。音源移動状態から展開状態への移行の一例を説明するための第二の図である。

以下、図面に基づいて本発明の実施の形態を説明する。図１は、本実施の形態におけるシステム構成例を示す図である。図１において、サーバ装置１０は、或る展示会場の展示場所ごとに設置された展示場マイク３１と無線ＬＡＮ（Local Area Network）又は有線ＬＡＮ等の情報通信ネットワークを介して接続されている。また、サーバ装置１０は、一台以上の携帯端末２０と、無線ＬＡＮ等の無線通信網を介して通信可能とされている。

本実施の形態において、展示会場とは、複数の展示場所を含む施設をいう。展示場所とは、説明者によって、当該展示場所における展示内容に関する説明が行われるブース等、展示会場内の一区画をいう。各展示場マイク３１は、説明者の声を電気信号に変換する電子部品と、音声の電気信号をデジタル化し、デジタル化された音声データを、情報通信ネットワークを介してサーバ装置１０に転送する電子部品とを含む。展示場マイク３１は、各展示場所の識別情報（以下、「音源ＩＤ」という。）を含む音声データを、サーバ装置１０に転送する。音声データは、例えば、ＳＩＰ（Session Initiation Protocol）、ＲＴＳＰ（Real Time Streaming Protocol）、又はその他の通信プロトコルを用いて制御され、ＲＴＰ（Real-time Transport Protocol）等のストリーミング形式でサーバ装置１０に転送される。なお、音声の電気信号のデジタル化は、サーバ装置１０において行われてもよい。この場合、音声信号がサーバ装置１０に伝送されてもよい。

携帯端末２０は、展示場の来場者が使用する携帯型の情報処理装置である。携帯端末２０の一例として、携帯電話、スマートフォン、ＰＤＡ（Personal Digital Assistance）、タブレット型端末等が挙げられる。図１において、携帯端末２０には、マイク２１、ヘッドホン２２、位置センサ２３、及び方位センサ２４等が、接続又は内蔵されている。マイク２１は、携帯端末２０のユーザ（以下、単に「ユーザ」という。）の声を音声信号に変換する。ヘッドホン２２は、ユーザの両耳を覆うように設置され、サーバ装置１０より転送される各展示場所の音声データを再生する多チャンネル（２チャンネル以上）の小型のスピーカーである。ユーザの両耳に対して音声を再生可能なスピーカーであれば、イヤホン等、ヘッドホン２２の以外のスピーカーが用いられてもよい。

位置センサ２３は、携帯端末２０の位置を計測する。位置センサ２３は、ＧＰＳ（Global Positioning System）であってもよいし、展示会場内の座標系における座標値を検知可能なセンサであってもよい。例えば、展示会場の床面を座標系とする２次元空間において、Ｘ軸方向向とＹ軸方向とのそれぞれにおいて、格子状に、座標値を記憶したＲＦＩＤ（Radio Frequency Identification）タグが配置されてもよい。この場合、位置センサ２３は、各ＲＦＩＤタグが記憶した座標値を読み取るＲＦＩＤリーダであってもよい。以下、位置センサ２３によって計測又は検知される座標値の座標系を、「展示会場座標系」という。展示会場座標系は、方位を含む座標系であるとする。本実施の形態において、展示会場座標系における方位は、ユーザの位置を中心として、Ｙ軸に平行なプラス方向を０度とし、右回りに３６０度の範囲を有する値によって表現される。

方位センサ２４は、ユーザの向きを計測する。ユーザの向きとは、展示会場座標系において、ユーザの顔が向いている方位（角度）をいう。方位センサ２４は、水平方向のみならず、鉛直方向の角度を計測可能なものであるのが望ましい。ユーザの頷き等を検知可能とするためのである。同様の理由より、方位センサ２４は、ヘッドホン２２に設置されているのが好適である。但し、ユーザが関心を持っている音源の選択等が、携帯端末２０に対するユーザの手入力よって行われる場合、方位センサ２４は、鉛直方向の角度を計測不能なものであってもよい。また、この場合、方位センサ２４は、ヘッドホン２２以外の場所であって、ユーザの向きを計測可能な場所に設置されてもよい。

サーバ装置１０は、ユーザの関心の有る音源の方向へ、ユーザを誘導するサービスを提供するコンピュータである。以下、サーバ装置１０によって提供されるサービスを、「誘導サービス」という。サーバ装置１０は、サーバ装置１０は、展示場マイク３１より転送される音声データ又は音声信号について、音像定位処理を行い、各展示場所の音源が、ユーザの向きに対して、物理的に正しい方向、又は物理的に正しい方向とは異なる方向から聞こえるような音声データを生成する。音像定位処理された音声データは、携帯端末２０に転送され、ヘッドホン２２より出力される。物理的に正しい方向とは異なる方向から音声が聞こえるようにするのは、後述されるように、ユーザが関心の有る音源（すなわち、展示場所）を特定するためである。なお、音像定位処理とは、頭部伝達関数を用いた仮想音像定位技術に基づく処理をいう。サーバ装置１０は、音像定位処理された音声を聴取するユーザの動作に基づいて、ユーザが関心の有る音像を推定及び特定し、特定された音源の方向へユーザを誘導する。

以上のようなシステム構成に基づく本実施の形態において、ユーザが関心の有る音源を特定する方法の概要について説明する。

図２は、本実施の形態においてユーザが関心の有る音源を特定する方法の概要を説明するための図である。図２では、サーバ装置１０の処理状態として、（１）〜（４）の４つの処理状態が示されている。各処理状態では、ユーザを上から見た図が示されている。各図において、数字を囲む矩形は、物理的又は実際の音源の方向（すなわち、展示場所の方向）を示す。各数字の値は、展示場所の識別子である。数字を囲む円は、ヘッドホン２２から出力される音声によって、ユーザが、認識する各音源の方向である。以下、物理的な音源を、「物理音源」といい、ヘッドホン２２から出力される音声における音源を、「仮想音源」という。

（１）は、初期状態である。初期状態において、仮想音源の方向は、物理音源の方向と一致する。初期状態において、ユーザの向きがいずれかの仮想音源の方向に固定されたことが検知されると、サーバ装置１０の処理状態は、（２）の展開状態に移行する。すなわち、ユーザの向きが、所定時間以上、略一定である場合に、展開状態への移行が行われる。

展開状態では、ユーザを中心として、ユーザの向きに最も近い仮想音源から離れる方向に、各仮想音源が展開される。この際、隣り合う仮想音源の方向の間隔が、所定角度以上広げられる。その結果、ユーザは、各仮想音源を聞き分け易くなる。図２では、ユーザの向きに最も近い仮想音源３から離れる方向に、ユーザを中心として、各仮想音源が展開された例が示されている。その後、ユーザの向きが、当初固定されていた仮想音源３と異なる仮想音源の方向に固定されたことが検知されると、サーバ装置１０の処理状態は、（３）の音源移動状態に移行する。すなわち、各仮想音源を聞き分け易くなった状況において、ユーザが、当初向いていた方向と異なる方向の仮想音源に関心を持ち、当該仮想音源の方向を所定時間以上向いている場合に、音源移動状態への移行が行われる。

音源移動状態では、ユーザの向きに有る仮想音源の方向から物理音源の方向の方へ、各仮想音源の方向がゆっくり移動する。図２では、仮想音源４から物理音源４の方へ、各仮想音源が移動している例が示されている。

ユーザの向きが仮想音源４の移動に追随すると、サーバ装置１０は、ユーザが仮想音源４に関心を持っていると推定する。すなわち、図２の（３）では、仮想音源４の方向に物理音源８が存在する。この場合、ユーザは、物理音源８に係る展示場所に、聴覚ではなく視覚によって関心を持っている可能性がある。音源移動状態は、ユーザが、仮想音源４に聴覚によって関心を持っているのか、物理音源８に視覚によって関心を持っているのかを判別するための処理状態である。ユーザの向きが仮想音源４の移動に追随したということは、ユーザは、仮想音源４に聴覚によって関心を持っている可能性が高いと考えられる。そこで、この場合、サーバ装置１０は、ユーザが仮想音源４に関心を持っていると推定する。

例えば、仮想音源４が物理音源４の方向に一致するまで移動すると、処理状態は、仮想音源４を基準とした展開状態に移行する。すなわち、仮想音源４から離れる方向に、ユーザを中心として、他の仮想音源が展開される。

その後、ユーザが、仮想音源４の方向を向いたまま頷くと、サーバ装置１０の処理状態は、（４）の選択状態に移行する。なお、本実施の形態において、頷くことは、所望の仮想音源の選択操作に相当する。選択状態では、ユーザの向いている方向に最も近い仮想音源４が、ユーザの関心の有る仮想音源であると特定される。その後、仮想音源４は、物理音源４の方向と一致するように、音像定位処理が行われる。したがって、ユーザは、仮想音源４の方向を頼りに移動することで、物理音源４の位置、すなわち、ユーザが関心の有る展示場所へ辿り着くことができる。

サーバ装置１０及び携帯端末２０等について、具体的に説明する。図３は、本実施の形態におけるサーバ装置のハードウェア構成例を示す図である。図３のサーバ装置１０は、それぞれバスＢで相互に接続されているドライブ装置１００、補助記憶装置１０２、メモリ装置１０３、ＣＰＵ１０４、及びインタフェース装置１０５等を有する。

サーバ装置１０での処理を実現するプログラムは、記録媒体１０１によって提供される。プログラムを記録した記録媒体１０１がドライブ装置１００にセットされると、プログラムが記録媒体１０１からドライブ装置１００を介して補助記憶装置１０２にインストールされる。但し、プログラムのインストールは必ずしも記録媒体１０１より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置１０２は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。

メモリ装置１０３は、プログラムの起動指示があった場合に、補助記憶装置１０２からプログラムを読み出して格納する。ＣＰＵ１０４は、メモリ装置１０３に格納されたプログラムに従ってサーバ装置１０に係る機能を実行する。インタフェース装置１０５は、ネットワークに接続するためのインタフェースとして用いられる。

なお、記録媒体１０１の一例としては、ＣＤ−ＲＯＭ、ＤＶＤディスク、又はＵＳＢメモリ等の可搬型の記録媒体が挙げられる。また、補助記憶装置１０２の一例としては、ＨＤＤ（Hard Disk Drive）又はフラッシュメモリ等が挙げられる。記録媒体１０１及び補助記憶装置１０２のいずれについても、コンピュータ読み取り可能な記録媒体に相当する。

なお、携帯端末２０も、図４と同様のハードウェアを有していてもよい。但し、携帯端末２０は、ユーザからの入力を受け付ける入力装置や、情報を表示する表示装置等を備えていてもよい。

図４は、本実施の形態におけるサーバ装置及び携帯端末の機能構成例を示す図である。図４において、携帯端末２０は、接続部２１１、音声データ転送部２１２、位置・方位転送部２１３、及び再生部２１４等を有する。これら各部は、携帯端末２０にインストールされたプログラムが、携帯端末２０のＣＰＵに実行させる処理によって実現される。

接続部２１１は、サーバ装置１０との通信の開始及び終了等を制御する。音声データ転送部２１２は、マイク２１より入力されるユーザの声の音声データをサーバ装置１０に転送する。位置・方位転送部２１３は、位置センサ２３より入力される位置情報及び方位センサ２４より入力される方位情報を、サーバ装置１０に転送する。再生部２１４は、サーバ装置１０から転送される音声データを、ヘッドホン２２に再生させる。なお、サーバ装置１０からは、例えば、ストリーミングによって音声データが転送される。

サーバ装置１０は、ユーザ管理部１２１、展示場所抽出部１２２、位置・方位管理部１２３、状態判定部１２４、定位方向算出部１２５、及び音像定位部１２６等を有する。これら各部は、サーバ装置１０にインストールされたプログラムが、ＣＰＵ１０４に実行させる処理により実現される。サーバ装置１０は、また、ユーザ情報記憶部１３１、展示情報記憶部１３２、状態記憶部１３３、展示場所情報記憶部１３４、音声分解特性記憶部１３５、及び音源方向記憶部１３６等を利用する。各記憶部は、メモリ装置１０３、補助記憶装置１０２、又はサーバ装置１０にネットワークを介して接続される記憶装置等を用いて実現可能である。

ユーザ情報記憶部１３１は、ユーザごと（携帯端末２０ごと）に、位置情報及び方位情報等を記憶する。展示情報記憶部１３２は、展示場所ごとに、展示内容を示す文字列等を記憶する。状態記憶部１３３は、ユーザごとに、図２において説明した処理状態を記憶する。展示場所情報記憶部１３４は、展示場所ごとに、位置情報を記憶する。音声分解特性記憶部１３５は、展開状態における、隣り合う仮想音源間の間隔の閾値（下限値）を記憶する。すなわち、展開状態においては、隣り合う仮想音源の間隔が当該閾値以上となるように、仮想音源の展開が行われる。音源方向記憶部１３６は、ユーザと仮想音源との組み合わせごとに、各仮想音源の当該ユーザの向きに対する相対的な方向を記憶する。

ユーザ管理部１２１は、携帯端末２０からの接続要求に応じ、当該携帯端末２０に係るユーザに対するレコードを生成し、生成されたレコードをユーザ情報記憶部１３１及び状態記憶部１３３のそれぞれに記憶する。ユーザ管理部１２１は、また、携帯端末２０からの切断要求に応じ、当該携帯端末２０に係るユーザに対するレコードを、ユーザ情報記憶部１３１及び状態記憶部１３３のそれぞれから削除する。

展示場所抽出部１２２は、携帯端末２０から送信されるキーワードに関連する展示場所を、展示情報記憶部１３２を参照して抽出する。展示場所抽出部１２２は、抽出された展示場所の識別情報と、当該携帯端末２０に係るユーザの識別子との組み合わせを含むレコードを生成し、生成されたレコードを音源方向記憶部１３６に記憶する。展示場所抽出部１２２によって抽出された展示場所からの音声が、ユーザに提供される。

位置・方位管理部１２３は、携帯端末２０の位置・方位転送部２１３より転送される位置情報及び方位情報を受信し、当該位置情報及び方位情報を、ユーザ情報記憶部１３１において、当該携帯端末２０に係るユーザに対するレコードに記憶する。ユーザ情報記憶部１３１が記憶する、各ユーザの位置情報及び方位情報は、刻々と更新される。

状態判定部１２４は、ユーザ情報記憶部１３１が記憶する情報に基づいて、ユーザごとに、処理状態を判定する。状態判定部１２４は、或るユーザの処理状態を変化させる必要が有る場合、状態記憶部１３３において当該ユーザに対して記憶されている処理状態の値を更新する。

定位方向算出部１２５は、ユーザごとに、当該ユーザに対して展示場所抽出部１２２によって抽出された展示場所（物理音源）に対応する仮想音源について、処理状態に応じた方向を算出する。定位方向算出部１２５は、仮想音源ごとに算出された方向を、各仮想音源に対応付けて音源方向記憶部１３６に記憶する。

音像定位部１２６は、音源方向記憶部１３６に記憶された方向に基づいて、各音源について、音像定位処理（音源定位処理）を実行し、処理結果としての音声データを出力する。音像定位部１２６より出力される音声データは、例えば、ストリーミングによって携帯端末２０に転送され、再生部２１４によって再生される。

以下、サーバ装置１０が実行する処理手順について説明する。まず、ユーザ管理部１２１が実行する処理手順について説明する。図５は、ユーザ管理部が実行する処理手順の一例を説明するためのフローチャートである。

ユーザ管理部１２１は、携帯端末２０の接続部２１１からの接続要求の受信を待機している。いずれかの携帯端末２０から接続要求が受信されると（Ｓ１０１でＹｅｓ）、ユーザ管理部１２１は、接続要求に係る携帯端末２０に対応するレコードを、ユーザ情報記憶部１３１及び状態記憶部１３３のそれぞれに生成する（Ｓ１０２）。

図６は、ユーザ情報記憶部の構成例を示す図である。図６において、ユーザ情報記憶部１３１は、ユーザごと（携帯端末２０ごと）に、ユーザＩＤ、Ｘ座標値、Ｙ座標値、水平方位履歴、及び鉛直方位履歴等を記憶する。ユーザＩＤは、ユーザごとの識別情報である。例えば、ユーザが所持する携帯端末２０のＩＰアドレス、ＭＡＣアドレス、又はその他の識別情報が、ユーザＩＤとして用いられてもよい。Ｘ座標値及びＹ座標値は、展示会場座標系においてユーザの位置を示すＸ座標及びＹ座標である。水平方位履歴は、展示会場座標系のＸＹ平面上におけるユーザの向きを示す角度の時系列の履歴である。鉛直方位履歴は、鉛直方向（展示会場座標系におけるＺ軸方向）におけるユーザの向き（すなわち、ユーザの頭の傾き）を示す角度の時系列の履歴である。

ステップＳ１０２では、新たに生成されたレコードにユーザＩＤが記憶される。ユーザＩＤは、携帯端末２０からの接続要求に含まれていてもよいし、サーバ装置１０が割り当ててもよい。サーバ装置１０がユーザＩＤを割り当てる場合、割り当てられたユーザＩＤが、接続要求に対する応答に含められて、携帯端末２０に返信されてもよい。

図７は、状態記憶部の構成例を示す図である。図７において、状態記憶部１３３は、ユーザごと（携帯端末２０ごと）に、ユーザＩＤ、処理状態、及び関心対象等を記憶する。ユーザＩＤは、上記した通りである。処理状態は、ユーザＩＤに係るユーザに対する、サーバ装置１０の処理状態である。図２において説明したように、本実施の形態では、４つの処理状態が存在する。関心対象は、ユーザが関心を持っている仮想音源の識別情報である。ステップＳ１０２では、新たに生成されたレコードに、ユーザＩＤ及び処理状態が記憶される。処理状態には、「初期状態」が記憶される。

続いて、ユーザ管理部１２１は、接続要求元の携帯端末２０に音声データをストリーミングするための通信を開始する（Ｓ１０３）。当該通信は、音像定位部１２６からアクセス可能とされる。なお、ストリーミングのための通信プロトコルは、公知の通信プロトコルが用いられてもよい。

一方、いずれかの携帯端末２０から切断要求が受信されると（Ｓ１０４でＹｅｓ）、ユーザ管理部１２１は、切断要求に指定されているユーザＩＤに対応するレコードを、ユーザ情報記憶部１３１及び状態記憶部１３３から削除する（Ｓ１０５）。続いて、ユーザ管理部１２１は、切断要求元の携帯端末２０に音声データをストリーミングするための通信を終了させる（Ｓ１０６）。

なお、ユーザは、サーバ装置１０の誘導サービスの利用を開始する場合に、サーバ装置１０への接続指示を携帯端末２０に入力する。携帯端末２０は、当該指示に応じて、サーバ装置１０に対して接続要求を送信する。また、ユーザは、サーバ装置１０の誘導サービスの利用を終了する場合に、サーバ装置１０からの切断指示を携帯端末２０に入力する。携帯端末２０は、当該指示に応じて、サーバ装置１０に対して切断要求を送信する。

以降において説明する処理手順において処理対象となる携帯端末２０は、接続処理（ステップＳ１０２及びＳ１０３）が完了している携帯端末２０である。

続いて、展示場所抽出部１２２が実行する処理手順について説明する。図８は、展示場所抽出部が実行する処理手順の一例を説明するためのフローチャートである。

ステップＳ１１１において、展示場所抽出部１２２は、携帯端末２０より誘導要求を受信する。誘導要求には、ユーザＩＤと、ユーザの関心の対象を示すキーワードを含む音声データとが含まれている。すなわち、ユーザは、マイク２１に対して、展示内容に関するキーワードであって、自らの関心の対象を示すキーワードを発声する。携帯端末２０の音声データ転送部２１２は、マイク２１より入力される音声信号をデジタル化した音声データと、ユーザＩＤとを含む誘導要求をサーバ装置１０に送信する。

続いて、展示場所抽出部１２２は、誘導要求に含まれている音声データが示すキーワードに基づいて、展示場所情報記憶部１３４からレコードを検索する（Ｓ１１２）。

図９は、展示場所情報記憶部の構成例を示す図である。図９において、展示場所情報記憶部１３４は、展示場所ごとに、音源ＩＤ、Ｘ座標値、Ｙ座標値、及び展示内容等を記憶する。音源ＩＤは、音源ごとの識別情報である。本実施の形態では、展示場所が音源となるため、各展示場所は音源ＩＤによって識別される。展示者の識別名等が音源ＩＤとされてもよい。各展示マイク２１からの音声データには、音源ＩＤが付与されている。したがって、各展示マイク２１からの音声データがいずれの展示場所の音声データであるかは、当該音声データに付与されている音声ＩＤによって識別することができる。

Ｘ座標値及びＹ座標値は、展示会場座標系において展示場所の代表位置を示すＸ座標及びＹ座標である。Ｘ座標値及びＹ座標値は、音源ＩＤ及び展示内容とともに、予め登録されてもよいし、展示場所に位置センサを設置し、位置センサより入力される位置情報に基づいて自動的に登録されてもよい。展示場所の代表位置は、展示場所ごとに任意に定められてもよいし、統一された基準に基づく位置であってもよい。展示内容は、展示場所における展示内容を示す一以上の文字列の集合である。

ステップＳ１１２では、ユーザの興味の対象を示すキーワードを、「展示内容」に含むレコードが検索される。なお、キーワードは、複数指定されてもよい。この場合、「展示内容」に全てのキーワードを含むレコードが検索対象とされてもよいし、いずれか一つのキーワードを含むレコードが検索対象とされてもよい。また、音声データが示すキーワードは、展示場所抽出部１２２が、音声データを解析することにより、音声データより抽出される。但し、ユーザの興味の対象を示すキーワードは、テキストデータとして、誘導要求に含まれていてもよい。例えば、携帯端末２０側で音声解析を行い、音声がテキストデータに変換されてもよい。又はユーザが、手入力によってキーワードを示すテキストデータを携帯端末２０に入力してもよい。

該当するレコードが一つも検索されなかった場合（Ｓ１１３でＮｏ）、図８の処理は終了する。この場合、キーワードの再入力要求が、携帯端末２０に返信されてもよい。

一以上のレコードが検索された場合（Ｓ１１３でＹｅｓ）、展示場所抽出部１２２は、誘導要求に含まれているユーザＩＤと、検索された各レコードの音源ＩＤとの組を、音源方向記憶部１３６に記憶する（Ｓ１１４）。

図１０は、音源方向記憶部の構成例を示す図である。図１０において、音源方向記憶部１３６の各レコードは、ユーザＩＤ、音源ＩＤ、及び方向等の項目を含む。ユーザＩＤは、上記した通りユーザの識別情報である。音源ＩＤは、上記した通り音源の識別情報である。方向は、ユーザＩＤに係るユーザの現在位置におけるユーザの向きを基準とした、音源ＩＤに係る音源（展示場所）の相対的な方向である。すなわち、方向は、展示会場座標系におけるユーザの向きの方位に対する、展示会場の方位の相対値（差分）である。

ステップＳ１１４では、展示場所情報記憶部１３４より検索されたレコードごとに、音源方向記憶部１３６に新たなレコードが生成される。生成された各レコードの「音源ＩＤ」には、検索された各レコードの音源ＩＤが記憶される。また、各レコードの「ユーザＩＤ」には、誘導要求の含まれているユーザＩＤが記憶される。各レコードの「方向」には、この段階では何も記憶されない。

続いて、位置・方位管理部１２３が実行する処理手順について説明する。図１１は、位置・方位管理部が実行する処理手順の一例を説明するためのフローチャートである。

位置・方位管理部１２３は、携帯端末２０からの位置情報又は方位情報の受信を待機している（Ｓ１２１）。いずれかの携帯端末２０からの位置情報又は方位情報が受信されると（Ｓ１２２）、位置・方位管理部１２３は、当該位置情報又は方位情報を、ユーザ情報記憶部１３１（図６）に記憶する（Ｓ１２２）。具体的には、位置情報には、展示会場座標系における、Ｘ座標値及びＹ座標値が含まれている。位置・方位管理部１２３は、当該Ｘ座標値及びＹ座標値を、位置情報と共に受信されるユーザＩＤに対応するレコードの「Ｘ座標値」又は「Ｙ座標値」に記憶する。また、方位情報には、水平方向の角度及び鉛直方向の角度が含まれている。位置・方位管理部１２３は、水平方向の角度を、方位情報と共に受信されるユーザＩＤに対応するレコードの「水平方位履歴」末尾に追加的に記憶する。また、位置・方位管理部１２３は、鉛直方向の角度を、方位情報と共に受信されるユーザＩＤに対応するレコードの「鉛直方位履歴」末尾に追加的に記憶する。

続いて、位置・方位管理部１２３は、音源方向記憶部１３６（図１０）において、方位情報の送信元の携帯端末２０に係るユーザＩＤに対応付いている各仮想音源の「方向」の値を更新する（Ｓ１２３）。すなわち、当該「方向」の値が、新たに受信された方位情報に係る方位からの差分に更新される。

なお、各携帯端末２０の位置・方位転送部２１３は、例えば、定期的に、位置センサ２３によって検知又は計測されるＸ座標値及びＹ座標値を含む位置情報、並びに方位センサ２４によって検知または計測される角度を含む方位情報を、サーバ装置１０に転送する。または、Ｘ座標値若しくはＹ座標値、又は方位を示す角度に変化が有った場合に、位置情報及び方位情報の転送が行われてもよい。いずれの場合であっても、ユーザ情報記憶部１３１には、各ユーザのほぼ最新の状態における、Ｘ座標値、Ｙ座標値、並びに水平方向及び鉛直方向の方位が記憶される。

続いて、状態判定部１２４が実行する処理手順について説明する。図１２は、状態判定部が実行する処理手順の一例を説明するためのフローチャートである。図１２の処理は、定期的（例えば、数ミリ秒ごと）に繰り返し実行される。または、位置情報若しくは方位情報が受信されるたびに、当該位置情報若しくは方位情報に係るユーザＩＤに関して、図１２の処理が実行されてもよい。

ステップＳ１３１において、状態判定部１２４は、例えば、ユーザ情報記憶部１３１のレコード順に、一つのレコードを取得する。以下、取得されたレコードを、「対象ユーザレコード」という。また、対象ユーザレコードに係るユーザを、「対象ユーザ」という。続いて、状態判定部１２４は、状態記憶部１３３のレコードの中で、対象ユーザレコードのユーザＩＤを含むレコード（以下、「対象状態レコード」という。）の「処理状態」の値（以下、「対象処理状態」という。）を取得する（Ｓ１３２）。続いて、状態判定部１２４は、対象処理状態に応じて処理を分岐させる（Ｓ１３３）。

対象処理状態が、「初期状態」である場合、状態判定部１２４は、対象ユーザの向きのが、所定時間以上、略一定であるか否かを判定する（Ｓ１３４）。当該判定は、例えば、対象ユーザレコードの「水平方位履歴」に記憶されている、水平方向の角度の履歴に基づいて行われる。具体的には、最後に記憶された時から所定時間分の履歴における角度の変化の範囲が、閾値以下であるか否かが判定される。所定時間分の履歴は、水平方位履歴が一定時間隔で追加されるのであれば、当該一定時間と当該所定時間との比率に基づいて特定可能である。水平方位履歴が追加される時期が不定期である場合、履歴ごとに、その時の時刻が記録されるようにしてもよい。当該時刻に基づいて、所定時間分の履歴を特定することができる。

なお、所定時間は、ユーザの向きがほぼ固定されたことを判定するのに十分な時間であればよい。本実施の形態では、当該所定時間を、「固定判定時間」という。また、角度の変化に対する閾値は、ユーザの向きが略一定であると判定できる角度であればよい。本実施の形態では、当該閾値を「略一定角度」という。

対象ユーザの向きが、固定判定時間以上、略一定でない場合（Ｓ１３４でＮｏ）、判定部は、ユーザ情報記憶部１３１より次のレコードを取得する（Ｓ１４８）。すなわち、対象ユーザに関して処理状態は変更されない。但し、ステップＳ１３４でＮｏとなる場合は、必ずしも、ユーザの向きが固定されていないというわけではない。ユーザの向きは固定されているが、まだ、固定判定時間以上経過していない場合も含まれるからである。

次のレコードが無い場合（Ｓ１４９でＮｏ）、図１２の処理は終了する。次のレコードの取得に成功した場合（Ｓ１４９でＹｅｓ）、当該次のレコードを対象ユーザレコードとして、ステップＳ１３２以降が実行される。

一方、対象ユーザの向きが、固定判定時間以上、略一定である場合（Ｓ１３４でＹｅｓ）、状態判定部１２４は、対象状態レコードの「処理状態」の値を、「展開状態」に更新する（Ｓ１３５）。すなわち、対象ユーザに関する処理状態が、展開状態に移行する。なお、状態判定部１２４は、展開状態への移行に伴って、対象ユーザレコードの「水平方位履歴」の値を空にしてもよい。展開状態への移行時からの、ユーザの向きの略一定状態の判定を定可能とするためである。

続いて、状態判定部１２４は、対象ユーザの向きに最も近い仮想音源の音源ＩＤを、対象状態レコードの「関心対象」に記憶する（Ｓ１３６）。対象ユーザの向きに最も近い仮想音源とは、音源方向記憶部１３６において、対象ユーザのユーザＩＤに対応付けられている音源ＩＤの中で、「方向」の値が最小である仮想音源である。音源方向記憶部１３６における「方向」の値は、対象ユーザレコードにおける「水平方位履歴」の最後（最新）の角度に対する相対値（差分）であるため、当該「方向」の値が最小である仮想音源が、対象ユーザの向きに最も近い仮想音源となる。

なお、後述より明らかなように、音源方向記憶部１３６には、初期状態のユーザに関する音源については、物理音源の方向と同じ方向を示す角度が、「方向」に記憶される。

ステップＳ１３６に続いて、ステップＳ１４８以降が実行される。

展開状態に移行すると、図２（２）において説明したように、対象ユーザの向いている方向に最も近い仮想音源から離れる方向に、対象ユーザを中心として、各仮想音源が展開される。なお、各仮想音源をユーザに区別可能であれば、他の方法によって、各仮想音源が展開されてもよい。要するに、各仮想音源の方向の間に、所定以上の間隔が確保されればよい。

対象処理状態が、「展開状態」である場合、状態判定部１２４は、対象ユーザが、初期状態からほぼ同じ方向を、固定判定時間以上向いているか否かを判定する（Ｓ１３７）。すなわち、仮想音源が展開されても、対象ユーザの向きが、展開前の方位のままであるか否かが判定される。当該判定は、例えば、対象ユーザレコードの「水平方位履歴」において、展開状態へ移行後の固定判定時間内に記憶された角度の変化が、略一定角度以内であるか否かに基づいて行われる。なお、ステップＳ１３５において説明したように、展開状態への移行時に対象ユーザレコードの「水平方位履歴」を空にしておくことで、展開状態へ移行後の固定判定時間内に、対象ユーザレコードの「水平方位履歴」に記憶された角度を容易に特定することができる。

対象ユーザが、初期状態とは異なる方向を向いている場合（Ｓ１３７でＮｏ）、状態判定部１２４は、状態判定部１２４は、当該異なる方向において、対象ユーザの向きが、固定判定時間以上、略一定であるか否かを判定する（Ｓ１３８）。すなわち、仮想音源が展開され、各仮想音源を聞き分け易くなった結果、対象ユーザが顔を左右に動かしながら関心の有る音源を探索し、対象ユーザの向きが最終的に一つの音源の方向に固定されたか否かが判定される。判定の方法は、ステップＳ１３４において説明した方法と同様でよい。

対象ユーザの向きが、固定判定時間以上、略一定でない場合（Ｓ１３８でＮｏ）、ステップＳ１４８以降が実行される。但し、ステップＳ１３８でＮｏとなる場合は、必ずしも、ユーザの向きが固定されていないというわけではない。ユーザの向きは固定されているが、まだ、固定判定時間以上経過していない場合も含まれるからである。

対象ユーザの向きが、固定判定時間以上、略一定である場合（Ｓ１３８でＹｅｓ）、状態判定部１２４は、対象状態レコードの「処理状態」の値を、「音源移動状態」に更新する（Ｓ１３９）。すなわち、対象ユーザに関する処理状態が、音源移動状態に移行する。続いて、状態判定部１２４は、対象ユーザの向きに最も近い仮想音源の音源ＩＤを、対象状態レコードの「関心対象」に記憶する（Ｓ１４２）。ステップＳ１４２の処理内容は、ステップＳ１３６と同様でよい。

一方、対象ユーザが、初期状態からほぼ同じ方向を、固定判定時間以上向いている場合（Ｓ１３７でＹｅｓ）、状態判定部１２４は、対象状態レコードの「関心対象」に音源ＩＤが記憶されている仮想音源を、対象ユーザが関心の有る仮想音源であると推定する。そこで、この場合、状態判定部１２４は、対象ユーザが、頷いたか否かを判定する（Ｓ１４０）。頷いたか否かは、例えば、対象ユーザレコードの「鉛直方位履歴」に記憶されている角度の履歴に基づいて判定される。例えば、「鉛直方位履歴」に含まれている最近の所定時間内の角度と、閾値とを比較することにより、頷いたか否かが判定されてもよい。

対象ユーザが頷いたと判定されない場合（Ｓ１４０でＮｏ）、ステップＳ１４８以降が実行される。対象ユーザが頷いたと判定される場合（Ｓ１４０でＹｅｓ）、状態判定部１２４は、対象状態レコードの「処理状態」の値を、「選択状態」に更新する（Ｓ１４１）。すなわち、対象ユーザに関する処理状態が、選択状態に移行する。続いて、ステップＳ１４２以降が実行される。後述されるように、選択状態に移行すると、関心対象の仮想音源以外の音声は消去される。すなわち、ユーザから見た場合、関心対象の仮想音源の音声のみが、物理音源の方向から聞こえるようになる。

対象処理状態が、「音源移動状態」である場合、状態判定部１２４は、対象ユーザの向きが、関心対象の仮想音源の移動に追随しているか否かを判定する（Ｓ１４３）。すなわち、関心対象の仮想音源の移動方向に、対象ユーザの向きが変化したか否かが判定される。図２（３）において説明したように、音源移動状態では、ユーザの向きが固定された仮想音源が、物理音源の方向にゆっくり（所定の速度で）移動する。仮想音源の移動は、後述されるように、音源方向記憶部１３６における各仮想音源の「方向」の値が、少しずつ（例えば、一定角度ずつ）物理音源の方向に近付く方に更新される。また、「方向」の値は、対象ユーザの向きを０度とした相対値である。したがって、追随したか否かの判定は、例えば、対象状態レコードの「関心対象」に記憶されている音源ＩＤに対して音源方向記憶部１３６に記憶されている「方向」の値が、所定値未満であるか否かに基づいて行うことができる。または、対象ユーザレコードの「水平方位履歴」に記憶されている、対象ユーザの向きを示す角度の履歴を解析することにより、追随したか否かが判定されてもよい。

対象ユーザの向きが、関心対象の仮想音源の移動に追随していていると判定される場合（Ｓ１４３でＹｅｓ）、状態判定部１２４は、対象ユーザは、当該仮想音源に関心が有ると推定する。そこで、状態判定部１２４は、対象状態レコードの「処理状態」の値を、「展開状態」に更新する（Ｓ１４５）。すなわち、対象ユーザに関する処理状態が、展開状態に移行する。この場合、移動終了後の関心対象の仮想音源から離れる方向に、対象ユーザを中心として、他の仮想音源が展開される。続いて、ステップＳ１４８以降が実行される。

一方、対象ユーザの向きが、関心対象の音源の移動に追随していていないと判定される場合（Ｓ１４３でＮｏ）、状態判定部１２４は、音源移動状態に移行してから所定時間が経過したか否かを判定する（Ｓ１４４）。当該所定時間は、例えば、仮想音源の移動にユーザが反応するまでの時間に基づいて定められてもよい。

所定時間が経過していない場合（Ｓ１４４でＮｏ）、ステップＳ１４８以降が実行される。なお、この場合は、必ずしも、対象ユーザが、関心対象の仮想音源の移動に追随していないとは限らない。対象ユーザが、仮想音源の移動に反応するまでには、或る程度時間を要すると考えられる。したがって、対象ユーザが、関心対象の仮想音源の移動に追随する場合、ステップＳ１４３でＮｏとなる状況がしばらく続き、その後、ステップＳ１４３でＹｅｓとなる場合が多いと考えられる。

対象ユーザが仮想音源の移動に追随しないまま所定時間が経過した場合（Ｓ１４４でＹｅｓ）、ステップＳ１４５以降が実行される。すなわち、対象ユーザに関する処理状態は、展開状態に移行する。この場合、対象ユーザの向から離れる方向に、対象ユーザを中心として、各仮想音源が展開される。

対象処理状態が、「選択状態」である場合、状態判定部１２４は、対象ユーザがキャンセル動作をしたか否かを判定する（Ｓ１４６）。キャンセル動作とは、選択状態をキャンセルし、初期状態に戻すための動作をいう。本実施の形態によって、キャンセル動作は、首を左右に振ることである。したがって、対象ユーザが、キャンセル動作をしたか否かは、例えば、対象ユーザレコードの「水平方位履歴」の内容を解析することにより判定可能である。

対象ユーザがキャンセル動作をしたと判定される場合（Ｓ１４６でＹｅｓ）、状態判定部１２４は、対象状態レコードの「処理状態」の値を、「初期状態」に更新する（Ｓ１４７）。すなわち、対象ユーザに関する処理状態が、初期状態に移行する。続いて、ステップＳ１４８以降が実行される。

一方、対象ユーザがキャンセル動作をしていないと判定される場合（Ｓ１４６でＮｏ）、ステップＳ１４８以降が実行される。したがって、対象ユーザに関しては、選択状態が継続する。

なお、図１２の処理は、全てのユーザについて処理の終了後、即座に最初のユーザから繰り返し実行されてもよい。また、ユーザごとにスレッド又はプロセスが起動され、ユーザごとに並列的に図１２の処理が実行されてもよい。この場合、ユーザごとのループ処理は不要である。

続いて、定位方向算出部１２５が実行する処理手順について説明する。図１３は、定位方向算出部が実行する処理手順の一例を説明するためのフローチャートである。図１３の処理は、定期的（例えば、数ミリ秒ごと）に繰り返し実行される。

ステップＳ１６１において、定位方向算出部１２５は、例えば、状態記憶部１３３の記憶順に、一つのレコードを取得する。当該レコードを、以下「対象状態レコード」という。続いて、定位方向算出部１２５は、対象状態レコードの「処理状態」の値（以下、「対象処理状態」という。）に応じて処理を分岐させる（Ｓ１６２）。すなわち、定位方向算出部１２５は、対象処理状態に応じた定位方向算出処理を実行する（Ｓ１６３〜Ｓ１６６）。

続いて、定位方向算出部１２５は、状態記憶部１３３より次のレコードを取得する（Ｓ１６７）。次のレコードが無い場合（Ｓ１６８でＮｏ）、図１２の処理は終了する。次のレコードの取得に成功した場合（Ｓ１６８でＹｅｓ）、当該次のレコードを対象状態レコードとして、ステップＳ１６２以降が実行される。

なお、図１３の処理は、全てのレコードの処理の終了後、即座に最初のレコードから繰り返し実行されてもよい。また、レコードごとにスレッド又はプロセスが起動され、レコードごとに並列的に処理が実行されてもよい。この場合、レコードごとのループ処理は不要である。

続いて、ステップＳ１６３の詳細について説明する。図１４は、初期状態における定位方向算出処理の処理手順の一例を説明するためのフローチャートである。

ステップＳ１７１において、定位方向算出部１２５は、対象状態レコードのユーザＩＤ（以下、「対象ユーザＩＤ」という。）に対応付いている一以上の音源ＩＤを、音源方向記憶部１３６より取得する。取得された音源ＩＤを、以下「対象音源ＩＤ」という。続いて、定位方向算出部１２５は、ユーザ情報記憶部１３１（図６）から、対象ユーザＩＤに対応付いている「Ｘ座標値」、「Ｙ座標値」、及び「水平方位履歴」のそれぞれの値を取得する（Ｓ１７２）。「水平方位履歴」の値は、最新（最後）の値のみでよい。以下、当該最新の値を、単に「水平方向」という。

続いて、定位方向算出部１２５は、展示場所情報記憶部１３４（図９）から、対象音源ＩＤに一致する音源ＩＤに対応付いている「Ｘ座標値」及び「Ｙ座標値」の値を取得する（Ｓ１７３）。

続いて、定位方向算出部１２５は、対象ユーザＩＤに係るユーザ（以下、「対象ユーザ」という。）の現在の位置及び向きを基準とした、各対象音源ＩＤに係る仮想音源（以下、「対象仮想音源」という。）の相対的な方向を示す角度を算出する（Ｓ１７４）。対象ユーザの位置は、ステップＳ１７２において取得された「Ｘ座標値」及び「Ｙ座標値」の値によって特定される。対象ユーザの向きは、ステップＳ１７２において取得された水平方位によって特定される。これらを基準として、ステップＳ１７３において取得された、各対象音源ＩＤに係る「Ｘ座標値」及び「Ｙ座標値」によって特定される位置の方向が算出される。

続いて、定位方向算出部１２５は、算出された各角度を、音源方向記憶部１３６において、各対象音源ＩＤに対応する各レコードの「方向」に記憶する（Ｓ１７５）。なお、後述されるように、音像定位部１２６は、音源方向記憶部１３６が記憶する「方向」に基づいて、音像定位処理を行う。したがって、初期状態において、対象ユーザには、各対象仮想音源が、それぞれの物理音源（展示場所）の方向から聞こえるように音像定位処理が行われる。

続いて、図１３のステップＳ１６４の詳細について説明する。図１５は、展開状態における定位方向算出処理の処理手順の一例を説明するためのフローチャートである。

ステップＳ１８１〜Ｓ１８４は、図１４のステップＳ１７１〜Ｓ１７４と同じである。ステップＳ１８５において、定位方向算出部１２５は、隣り合う対象仮想音源の角度が閾値以上となるように、各対象仮想音源の方向を、対象ユーザの向きに最も近い対象仮想音源から離れる方に展開させた後の方向を、対象仮想音源ごとに算出する。対象仮想音源間の角度の閾値は、例えば、音声分解特性記憶部１３５に記憶されている値が用いられる。

図１６は、音声分解特性記憶部の構成例を示す図である。図１６において、音声分解特性記憶部１３５は、ユーザの向きに対する相対的な方向に応じて、仮想音源間の角度の閾値が記憶されている。図１６の例に基づく場合、ステップＳ１８４では、対象ユーザの向きに対して、０度〜±３０度以内の方向に有る仮想音源間の間隔は、４０度以上に広げられる。３０度超〜６０度以内に有る仮想音源間の間隔は、２０度以上に広げられる。６０度超〜９０度以内に有る仮想音源間の間隔は、１５度以上に広げられる。ユーザから見て、正面方向よりも横方向の閾値の方が小さいのは、人間の聴覚の分解能は、正面方向よりも、横方向の方が高いからである。但し、方向に関係なく、一律に特定の値（例えば、３０度等）が閾値とされてもよい。

なお、ユーザが混乱するのを回避するため、各仮想音源の展開がゆっくり行われるようにしてもよい。この場合、ステップＳ１８５が一回実行されるごとの展開幅は、図１５の処理が繰り返される周期を考慮して、閾値が何分割かされた値とされてもよい。但し、ステップＳ１８５における展開幅は、分割された値の累積値である必要がある。毎回同じ展開幅では、ユーザから見て展開されているように感じられないからである。したがって、定位方向算出部１２５は、展開を開始してから展開が完了するまでの展開幅の累積値をメモリ装置１０３に記憶しておき、ステップＳ１８５が実行される際は、メモリ装置１０３に記憶されている累積値に１回分の展開幅を加算した値だけ、仮想音源を展開させるようにしてもよい。なお、展開は、例えば、展開幅の累積値が、閾値に達することにより完了する。換言すれば、展開幅の累積値に対する加算は、当該累積値が閾値に達した場合、行われなくてよい。

続いて、定位方向算出部１２５は、算出後の各対象仮想音源の方向を示す角度を、音源方向記憶部１３６において、各対象音源ＩＤに対応するレコードの「方向」に記憶する（Ｓ１８６）。なお、更新後の方向が、対象ユーザの向きを基準として、例えば、±９０度の範囲（以下、「定位対象範囲」という。）外となった仮想音源については、「方向」の値は消去されてもよい。この場合、当該仮想音源は、音像定位処理の対象とされない。したがって、対象ユーザには聞こえない。対象ユーザの向きを基準として、左右方向に仮想音源を展開した結果、対象ユーザの後方に、仮想音源が集中し、他の仮想音源からの音声が聴き取りづらくなる状況を回避するためである。定位対象範囲の値は、±９０度以外であってもよい。但し、定位対象範囲外の仮想音源の音声を完全に消去するのではなく、音量が小さくされてもよい。

続いて、図１３のステップＳ１６５の詳細について説明する。図１７は、音源移動状態における定位方向算出処理の処理手順の一例を説明するためのフローチャートである。

ステップＳ１９１において、定位方向算出部１２５は、状態記憶部１３３より、対象ユーザＩＤに対応付いている「関心対象」の値（音源ＩＤ）を取得する。以下、取得された音源ＩＤに係る仮想音源を、「関心対象仮想音源」という。続くステップＳ１９２〜Ｓ１９５は、図１４のステップＳ１７１〜Ｓ１７４と同じである。すなわち、対象ユーザの位置情報及び水平方位、並びに対象仮想音源に対応する物理音源の位置情報が取得され、各対象仮想音源の方向が算出される。

続いて、定位方向算出部１２５は、隣り合う対象仮想音源の方向の角度が閾値以上となるように、各対象仮想音源の方向を、対象ユーザの向きに最も近い対象仮想音源から離れる方に展開させた後の方向を、対象仮想音源ごとに算出する（Ｓ１９６）。ステップＳ１９６の処理は、図１５のステップＳ１８５と同様でよい。但し、ステップＳ１９６では、１回で閾値分の展開が完了する。ステップＳ１９６は、ユーザに対して、各仮想音源がゆっくり展開するように感じさせるための処理ではなく、既に展開が終わった後の各仮想音源の間隔を維持するための処理だからである。

続いて、定位方向算出部１２５は、関心対象仮想音源から監視対象仮想音源に対応する物理音源の方向に、各対象仮想音源の方向を所定角度だけ移動させた後の方向を、対象仮想音源ごとに算出する（Ｓ１９７）。所定角度は、図１７の処理が繰り返される周期を考慮して、対象仮想音源がゆっくり移動するように感じられる程度の角度でよい。

続いて、定位方向算出部１２５は、算出後（移動後）の各対象仮想音源の方向を示す角度を、音源方向記憶部１３６において、各対象音源ＩＤに対応するレコードの「方向」に記憶する（Ｓ１９８）。なお、移動後の方向が、定位対象範囲外となった仮想音源については、「方向」の値は消去されてもよい。

続いて、図１３のステップＳ１６６の詳細について説明する。図１８は、選択状態における定位方向算出処理の処理手順の一例を説明するためのフローチャートである。

ステップＳ２０１において、定位方向算出部１２５は、状態記憶部１３３より、対象ユーザＩＤに対応付いている「関心対象」の値（音源ＩＤ）を取得する。以下、取得された音源ＩＤに係る仮想音源を、「関心対象仮想音源」という。ステップＳ２０２は、図１４のステップＳ１７２と同じである。

続いて、定位方向算出部１２５は、展示場所情報記憶部１３４（図９）から、関心対象仮想音源の音源ＩＤに一致する音源ＩＤに対応付いている「Ｘ座標値」及び「Ｙ座標値」の値を取得する（Ｓ２０３）。

続いて、定位方向算出部１２５は、対象ユーザの現在の位置及び向きを基準とした、関心対象仮想音源の相対的な方向を算出する（Ｓ２０４）。続いて、定位方向算出部１２５は、算出された方向を、音源方向記憶部１３６において、関心対象仮想音源の音源ＩＤに対するレコードの「方向」に記憶する（Ｓ２０５）。なお、関心対象仮想音源以外の対象仮想音源の「方向」については消去されてもよい。その結果、選択状態においては、ユーザには、関心対象仮想音源の音声のみが、物理音源（展示場所）の方向から聞こえるようになる。但し、関心対象仮想音源以外の対象仮想音源からの音声の音量が小さくされてもよい。要するに、ユーザにとって、関心対象仮想音源からの音声が、他の対象仮想音源からの音声に対してより聴き取り易くされればよい。また、選択状態において、各対象仮想音源が展開されたままとされるのであれば、関心対象仮想音源以外の対象仮想音源からの音声の音量は小さくされたり消去されたりしなくてもよい。この場合、ユーザは、監視嘆賞仮想音源を、他の仮想音源と容易に区別可能であると考えられるからである。

続いて、音像定位部１２６が実行する処理手順について説明する。図１９は、音像定位部が実行する処理手順の一例を説明するためのフローチャートである。

ステップＳ２１１において、音像定位部１２６は、例えば、音源方向記憶部１３６（図１０）の記憶順に一つのレコードを取得する。取得されたレコードを、以下「対象レコード」という。続いて、音像定位部１２６は、対象レコードの「ユーザＩＤ」に記憶されているユーザＩＤに対するストリーミングに対して音像定位処理を実行する（Ｓ２１２）。当該音像定位処理では、対象レコードの「音源ＩＤ」に対応する展示マイク２１からの音声が、対象レコードの「方向」が示す角度から聞こえるように音像定位が行われる。なお、音像定位処理については、公知技術を用いて実現されればよい。

上記において説明した処理手順内容について、具体例に基づいて説明する。なお、各具体例では、「ＡＡＡ」が、対象ユーザのユーザＩＤである場合について説明する。

図２０は、初期状態の一例を説明するための図である。図２０において、（１）には、状態記憶部１３３において、対象ユーザに関するレコード（以下、「状態レコード」という。）が示されている。（２）には、ユーザ情報記憶部１３１において、対象ユーザに関するレコード（以下「ユーザレコード」という。）が示されている。また、（３）には、展示場所情報記憶部１３４において、対象ユーザに関するレコード（以下、「展示場所レコード」という。）が示されている。なお、各レコードの具体例において、説明に不要な項目は、便宜上省略されている。また、（２）のユーザレコードの「水平方位」は、「水平方位履歴」の最後の履歴を示す。

（１）に示される状態レコードにおいて、「処理状態」の値は「初期状態」であるため、定位方向算出部１２５は、（２）に示されるユーザレコード及び（３）に示される展示場所レコードに基づいて、図１４において説明した処理を実行する。その結果、音源方向記憶部１３６において、対象ユーザに関するレコード（以下、「音源方向レコード」という。）の記憶内容は、（４）に示される通りとなる。なお、図２０において、ユーザの向きは、０度である。

（４）に示される音源方向レコードに基づいて、音像定位部１２６は、音像定位処理を行う。その結果、対象ユーザには、各仮想音源の音声は、（５）に示される方向から聞こえるようになる。すなわち、初期状態において、各仮想音源の方向は、それぞれの物理音源の方向に一致する。（５）の見方は、図２の見方と同様である。

（６）には、参考までに、展示会場座標系におけるユーザの位置と、各物理音源（展示場所）の位置とが示されている。

初期状態において、ユーザの向きが略一定方向に固定判定時間以上固定されると、処理状態は、展開状態に移行する。

次に、図２１は、展開状態の一例を説明するための第一の図である。図２１以降において、（１）〜（５）の図の意味は、図２０と同様である。また、（６）の図については、省略される。また、展示場所の位置は移動しないため、図２０以降の図において、（５）の展示場所レコードに変化は無い。

図２１では、（１）の状態レコードの「処理状態」の値が「展開状態」に更新されている。また、（２）のユーザレコードの「水平方位」は、１０度に更新されている。すなわち、図２１では、対象ユーザの向きが、１０度の方位に有る、仮想音源３の方向に固定されて展開状態に移行された例が示されている。展開状態の間、定位方向算出部１２５は、（２）に示されるユーザレコード及び（３）に示される展示場所レコードに基づいて、図１５において説明した処理を実行する。すなわち、仮想音源３から離れる方向に、対象ユーザを中心として、他の仮想音源が展開される。その結果、音源方向レコードは、（４）に示される通りとなる。

（４）では、「Ａ−Ｂ」の形式で、「方向」の値が記載されている。Ａの部分は、展開後の仮想音源の、展示会場座標系における方位を示す値である。Ｂの部分は、対象ユーザの方位である。すなわち、音源方向レコードの「方向」は、対象ユーザの方位に対する相対的な角度となるため、展開後の方位の値から、対象ユーザの方位が差し引かれた値となる。例えば、ユーザが向いている仮想音源３の「方向」は、「１０−１０＝０」である。

また、音源方向レコードの「方向」に値が記憶されていない仮想音源は、展開によって定位対象範囲外となった仮想音源である。

（４）に示される音源方向レコードに基づいて、音像定位部１２６は、音像定位処理を行う。その結果、対象ユーザには、各仮想音源の音声は、（５）に示される方向から聞こえるようになる。展開によって、各仮想音源の間隔は、所定角度以上離される。その結果、仮想音源３以外の仮想音源の方向は、それぞれの物理音源の方向とは異なったものとなる。但し、対象ユーザにとって、各仮想音源を区別し易くなる。また、状態判定部１２４にとっても、対象ユーザが関心の有る音源を区別し易くなる。

また、音源方向レコードの「方向」に値が記憶されていない仮想音源の音声は、再生されなくなる。図２１では、仮想音源２、５、及び６が再生されなくなった例が示されている。但し、定位対象範囲外の仮想音源が再生されてもよい。この場合、定位対象範囲外の仮想音源についても、音源方向レコードの「方位」に、図１５のステップＳ１８５における算出結果が記憶されるようにすればよい。また、定位対象範囲外の仮想音源の音量が小さくされてもよい。

なお、対象ユーザの向きが仮想音源３の方向に固定された状態が固定判定時間以上継続した後、対象ユーザが頷くと、処理状態は、選択状態に移行する。

図２２は、展開状態の一例を説明するための第二の図である。図２２では、（２）のユーザレコードの「水平方位」に示されるように、ユーザの向きが仮想音源４の方向である５０度に変化している。図２０の（５）に示されるように、当初、仮想音源１、３、４、及び８は、ユーザから見てほぼ同じ方向に有った。ユーザは、仮想音源４に関心が有ったが、その方向を区別することができず、仮想音源３の方向を向いていた。その後、仮想音源が展開され、各仮想音源からの音声を聞き分け易くなったため、仮想音源４の方向を区別できるようになった、という状況である。

図２２の状況においても、図２１と同様、図１５において説明した処理が実行される。すなわち、定位方向算出部１２５は、（２）に示されるユーザレコード及び（３）に示される展示場所レコードに基づいて、図１５において説明した処理を実行する。その結果、音源方向レコードは、（４）に示される通りとなる。

なお、厳密には、図１５の処理が実行されることにより、仮想音源４から離れる方向に、対象ユーザを中心として、各仮想音源の展開が行われる。但し、（４）の音源方向レコードでは、便宜上、仮想音源４からの展開に関しては加味されていない。したがって、（５）における、各仮想音源の方向は、図２１と同じである。

対象ユーザの向きが、仮想音源４の方向において固定判定時間以上固定されると、処理状態は、音源移動状態に移行する。対象ユーザが、仮想音源４に関心を持っているのか、物理音源８に係る展示場所に関心を持っているのか、又は更にその先に見える何かに関心を持っているのかを区別するためである。

図２３は、音源移動状態の一例を説明するための第一の図である。図２３では、（１）の状態レコードの「処理状態」の値が「音源移動状態」に更新されている。したがって、定位方向算出部１２５は、（２）に示されるユーザレコード及び（３）に示される展示場所レコードに基づいて、図１７において説明した処理を実行する。その結果、音源方向レコードは、（４）に示される通りとなる。すなわち、仮想音源４から物理音源４の方向に、各仮想音源の方向が移動し、移動の分だけ音源方位レコードの「方向」の値が更新される。

音像定位部１２６は、（４）に示される音源方向レコードに基づいて、音像定位処理を行う。定位方向算出部１２５による処理及び音像定位部１２６による処理が繰り返されることにより、（５）に示されるように、ユーザから見て、各仮想音源は、仮想音源４から物理音源４の方向にゆっくり移動する。なお、移動により定位対象範囲内となった仮想音源は、再生されるようになる。一方、移動により定位対象範囲外となった仮想音源は、再生されなくなる。

図２４は、音源移動状態の一例を説明するための第二の図である。図２４では、仮想音源４の移動に、対象ユーザの向きが追随した場合の例が示されている。すなわち、（２）のユーザレコードの「水平方位」の値が「３０」に更新されている。その結果、（４）の音源方向レコードにおいて、物理音源４の方向に移動した仮想音源４の「方向」の値は、３０−３０＝０度となっている。すなわち、対象ユーザは、移動後の仮想音源４の方向を向いていることが示されている。

図２５は、音源移動状態から展開状態への移行の一例を説明するための第一の図である。図２５では、図２４において示したように、対象ユーザが、仮想音源４の移動に追随し、固定判定時間以上、対象ユーザの向きが略一定方向であった状況が示されている。

この場合、（１）の状態レコードの「処理状態」の値は、「展開状態」に更新される。したがって、定位方向算出部１２５は、（２）に示されるユーザレコード及び（３）に示される展示場所レコードに基づいて、図１５において説明した処理を実行する。その結果、仮想音源４から離れる方向に、対象ユーザを中心として、他の仮想音源が左右方向に展開される。

更に、対象ユーザが頷くと、定位方向算出部１２５は、（２）に示されるユーザレコード及び（３）に示される展示場所レコードに基づいて、図１８において説明した処理を実行する。その結果、音源方向レコードは、（４）に示される通りとなる。（４）では、仮想音源４以外の仮想音源に対する「方向」の値は、消去されている。したがって、（４）に示される音源方向レコードに基づいて、音像定位部１２６よって音像定位処理が実行されると、対象ユーザには、（５）に示されるように、仮想音源４が、物理音源４の方向から聞こえるようになる。なお、（５）において仮想音源４以外の仮想音源は破線によって示されている。破線は、その音声が再生されない仮想音源であることを示す。

また、図２６は、音源移動状態から展開状態への移行の一例を説明するための第二の図である。図２６では、図２３に示した音源移動状態において、対象ユーザの向きが、仮想音源４の移動に追随せずに、物理音源８の方向に固定されたままだった場合の例が示されている。

対象ユーザの向きが物理音源８の方向に固定された状態が、固定判定時間以上継続すると、（１）に示される状態レコードの「処理状態」の値は、「展開状態」に更新される。したがって、定位方向算出部１２５は、（２）に示されるユーザレコード及び（３）に示される展示場所レコードに基づいて、図１５において説明した処理を実行する。その結果、仮想音源８から離れる方向に、対象ユーザを中心として、他の仮想音源が展開される。

音像定位部１２６は、（４）に示される音源方向レコードに基づいて、音像定位処理を行う。その結果、各仮想音源の方向は、（５）に示されるようになる。なお、（５）において、小さい円の仮想音源１、３、４、８、及び９は、図２３の状態における各仮想音源の方向を示す。大きい円の仮想音源３'、４'、８'、及び９'は、仮想音源８'を基準とした展開が行われた後の、各仮想音源の方向を示す。

上述したように、本実施の形態によれば、ユーザが関心の有る仮想音源を推定することができる。また、ユーザによる所定の動作（頷き等）又は操作によって、推定された仮想音源に、ユーザの関心の有ることを特定することができる。その結果、ユーザを、当該仮想音源に対応する物理音源の方向に誘導することができる。

また、本実施の形態では、ユーザによる手操作はできるたけ不要となるように工夫されている。したがって、例えば、ユーザが両手に荷物を持っている場合であっても、ユーザが関心の有る仮想音源の推定及び特定を行うことができる。

また、ユーザには、各展示場所からの現在の音声が提供される。したがって、現在の状況においてユーザが関心の有る展示場所へユーザを誘導することができる。

なお、本実施の形態では、展開状態において、ユーザの向いている方向に最も近い仮想音源から離れる方へ、各仮想音源が展開される例を示した。しかし、展開状態は、各仮想音源を区別し易くすることが第一の目的であるため、からなずしも、ユーザの向いている方向に最も近い仮想音源が基準とされなくてもよい。各仮想音源の方向の間に所定角度以上の間隔を確保可能であれば、ユーザの向いている方向に最も近い仮想音源が移動されてもよい。但し、ユーザの向いている方向に最も近い仮想音源は、ユーザが関心を持っている可能性が高い。したがって、当該仮想音源から離れるように各仮想音源を展開させることで、展開後の状況において、ユーザが、関心を持っている仮想音源の方向を探索するための負担を軽減させることができる。

また、音源移動状態においては、必ずしも全ての仮想音源が移動しなくてもよい。例えば、ユーザが関心の有る仮想音源のみが移動対象とされてもよい。この場合であっても、ユーザの追随を判定可能であると考えられるからである。但し、本実施の形態のように、全ての仮想音源が移動することで、ユーザが受ける違和感を軽減することができる。また、ユーザが関心の有る仮想音源が、他の仮想音源と重なることにより、当該関心の有る仮想音源からの音声が聴き取りづらくなるといった状況の発生を回避することができる。

また、本実施の形態において、各携帯端末２０に、サーバ装置１０の機能が実装されてもよい。この場合、サーバ装置１０は、設置されなくてもよい。

また、本実施の形態は、複数の音源から音声が発せられ、いずれかの音源を目的として、聴取者が移動又はその他の動作をするような環境であれば、展示会場以外の環境に適用されてもよい。

なお、本実施の形態において、サーバ装置１０又は携帯端末２０は、推定装置の一例である。定位方向算出部１２５は、特定部及び算出部の一例である。状態判定部１２４は、推定部の一例である。

以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

以上の説明に関し、更に以下の項を開示する。
（付記１）
複数の音源に関してスピーカーより出力される音声の聴取者の位置情報及び前記聴取者の向きを示す方向情報と、前記複数の音源のそれぞれの位置情報とに基づいて、前記聴取者の向きに対する各音源の第一の方向を特定し、
前記音源ごとに、隣り合う音源の方向との間隔が所定値以上となる第二の方向を算出しし、
前記第二の方向に各音源が定位されるように、前記スピーカーより出力される音声に関して音像定位処理を実行し、
前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い音源が、前記聴取者の関心の対象であると推定する処理をコンピュータに実行させる推定プログラム。
（付記２）
前記算出する処理は、前記第一の方向が方向情報の示す向きに最も近い第一の音源の第二の方向を、当該音源の前記第一の方向と一致させ、他の音源ごとに、隣り合う音源の方向との間隔が所定値以上となる前記第二の方向を算出する付記１記載の推定プログラム。
（付記３）
前記算出する処理は、前記スピーカーより出力される音声に関して各音源がそれぞれの前記第二の方向に定位されている状態において、前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い第二の音源の前記第二の方向が、当該第二の音源の前記第一の方向と異なるときは、前記第二の音源の方向を、当該第一の方向の方に移動させた値に更新し、
前記音像定位処理を実行する処理は、更新後の前記第二の方向に前記第二の音源が定位されるように、前記音像定位処理を実行し、
前記方向情報の示す向きが、前記移動の方向に変化した場合に、前記第二の音源が前記聴取者の関心の対象であると推定する１又は２記載の推定プログラム。
（付記４）
複数の音源に関してスピーカーより出力される音声の聴取者の位置情報及び前記聴取者の向きを示す方向情報と、前記複数の音源のそれぞれの位置情報とに基づいて、前記聴取者の向きに対する各音源の第一の方向を特定する特定部と、
前記音源ごとに、隣り合う音源の方向との間隔が所定値以上となる第二の方向を算出する算出部と、
前記第二の方向に各音源が定位されるように、前記スピーカーより出力される音声に関して音像定位処理を実行する音像定位部と、
前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い音源が、前記聴取者の関心の対象であると推定する推定部とを有する推定装置。
（付記５）
前記算出部は、前記第一の方向が方向情報の示す向きに最も近い第一の音源の第二の方向を、当該音源の前記第一の方向と一致させ、他の音源ごとに、隣り合う音源の方向との間隔が所定値以上となる前記第二の方向を算出する付記４記載の推定装置。
（付記６）
前記算出部は、前記スピーカーより出力される音声に関して各音源がそれぞれの前記第二の方向に定位されている状態において、前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い第二の音源の前記第二の方向が、当該第二の音源の前記第一の方向と異なるときは、前記第二の音源の方向を、当該第一の方向の方に移動させた値に更新し、
前記音像定位部は、更新後の前記第二の方向に前記第二の音源が定位されるように、前記音像定位処理を実行し、
前記推定部は、前記方向情報の示す向きが、前記移動の方向に変化した場合に、前記第二の音源が前記聴取者の関心の対象であると推定する付記４又は５記載の推定装置。
（付記７）
複数の音源に関してスピーカーより出力される音声の聴取者の位置情報及び前記聴取者の向きを示す方向情報と、前記複数の音源のそれぞれの位置情報とに基づいて、前記聴取者の向きに対する各音源の第一の方向を特定し、
前記音源ごとに、隣り合う音源の方向との間隔が所定値以上となる第二の方向を算出しし、
前記第二の方向に各音源が定位されるように、前記スピーカーより出力される音声に関して音像定位処理を実行し、
前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い音源が、前記聴取者の関心の対象であると推定する処理をコンピュータが実行する推定方法。
（付記８）
前記算出する処理は、前記第一の方向が方向情報の示す向きに最も近い第一の音源の第二の方向を、当該音源の前記第一の方向と一致させ、他の音源ごとに、隣り合う音源の方向との間隔が所定値以上となる前記第二の方向を算出する付記７記載の推定方法。
（付記９）
前記算出する処理は、前記スピーカーより出力される音声に関して各音源がそれぞれの前記第二の方向に定位されている状態において、前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い第二の音源の前記第二の方向が、当該第二の音源の前記第一の方向と異なるときは、前記第二の音源の方向を、当該第一の方向の方に移動させた値に更新し、
前記音像定位処理を実行する処理は、更新後の前記第二の方向に前記第二の音源が定位されるように、前記音像定位処理を実行し、
前記方向情報の示す向きが、前記移動の方向に変化した場合に、前記第二の音源が前記聴取者の関心の対象であると推定する７又は８記載の推定方法。

１０サーバ装置
２０携帯端末
２１マイク
２２ヘッドホン
２３位置センサ
２４方位センサ
３１展示場マイク
１００ドライブ装置
１０１記録媒体
１０２補助記憶装置
１０３メモリ装置
１０４ＣＰＵ
１０５インタフェース装置
１２１ユーザ管理部
１２２展示場所抽出部
１２３位置・方位管理部
１２４状態判定部
１２５定位方向算出部
１２６音像定位部
１３１ユーザ情報記憶部
１３２展示情報記憶部
１３３状態記憶部
１３４展示場所情報記憶部
１３５音声分解特性記憶部
１３６音源方向記憶部
２１１接続部
２１２音声データ転送部
２１３位置・方位転送部
２１４再生部
Ｂバス

Claims

並行して音声を発生させる複数の音源に関してスピーカーより出力される音声の聴取者の位置情報及び前記聴取者の向きを示す方向情報と、前記複数の音源のそれぞれの位置情報とに基づいて、前記聴取者の向きに対する各音源の第一の方向を特定し、
前記音源ごとに、隣り合う音源の方向との間隔が所定値以上となる第二の方向を算出しし、
前記第一の方向に各音源が定位された後、前記第二の方向に各音源が定位されるまで、各音源が所定量ずつ移動するように前記スピーカーより出力される音声に関して音像定位処理を実行し、
前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い音源が、前記聴取者の関心の対象であると推定する処理をコンピュータに実行させる推定プログラム。
前記算出する処理は、前記第一の方向が方向情報の示す向きに最も近い第一の音源の第二の方向を、当該音源の前記第一の方向と一致させ、他の音源ごとに、隣り合う音源の方向との間隔が所定値以上となる前記第二の方向を算出する請求項１記載の推定プログラム。
前記算出する処理は、前記スピーカーより出力される音声に関して各音源がそれぞれの前記第二の方向に定位されている状態において、前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い第二の音源の前記第二の方向が、当該第二の音源の前記第一の方向と異なるときは、前記第二の音源の方向を、当該第一の方向の方に移動させた値に更新し、
前記音像定位処理を実行する処理は、更新後の前記第二の方向に前記第二の音源が定位されるように、前記音像定位処理を実行し、
前記方向情報の示す向きが、前記移動の方向に変化した場合に、前記第二の音源が前記聴取者の関心の対象であると推定する請求項１又は２記載の推定プログラム。
並行して音声を発生させる複数の音源に関してスピーカーより出力される音声の聴取者の位置情報及び前記聴取者の向きを示す方向情報と、前記複数の音源のそれぞれの位置情報とに基づいて、前記聴取者の向きに対する各音源の第一の方向を特定する特定部と、
前記音源ごとに、隣り合う音源の方向との間隔が所定値以上となる第二の方向を算出する算出部と、
前記第一の方向に各音源が定位された後、前記第二の方向に各音源が定位されるまで、各音源が所定量ずつ移動するように前記スピーカーより出力される音声に関して音像定位処理を実行する音像定位部と、
前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い音源が、前記聴取者の関心の対象であると推定する推定部とを有する推定装置。
並行して音声を発生させる複数の音源に関してスピーカーより出力される音声の聴取者の位置情報及び前記聴取者の向きを示す方向情報と、前記複数の音源のそれぞれの位置情報とに基づいて、前記聴取者の向きに対する各音源の第一の方向を特定し、
前記音源ごとに、隣り合う音源の方向との間隔が所定値以上となる第二の方向を算出しし、
前記第一の方向に各音源が定位された後、前記第二の方向に各音源が定位されるまで、各音源が所定量ずつ移動するように前記スピーカーより出力される音声に関して音像定位処理を実行し、
前記方向情報が示す向きの変化が、所定時間継続して所定の範囲内である場合に、前記第二の方向が前記方向情報の示す向きに最も近い音源が、前記聴取者の関心の対象であると推定する処理をコンピュータが実行する推定方法。