JP7294561B2

JP7294561B2 - 情報呈示装置、情報呈示方法および情報呈示プログラム

Info

Publication number: JP7294561B2
Application number: JP2023508338A
Authority: JP
Inventors: 智治粟野; 勝木村; 耕佑細谷; 純正田; 章紘伊藤
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2021-03-25
Filing date: 2021-03-25
Publication date: 2023-06-20
Anticipated expiration: 2041-03-25
Also published as: JPWO2022201456A1; WO2022201456A1

Description

本開示は、情報呈示装置、情報呈示方法および情報呈示プログラムに関する。

従来の情報呈示装置では、ユーザに対して状況変化を伝える方法として、効果音、警告音などのサイン音、あるいは音声ガイダンスなどの音声出力による聴覚的な情報呈示が有効な方法として広く使われている。従来の情報呈示装置はクロストークキャンセラ（Ｃｒｏｓｓ－ＴａｌｋＣａｎｃｅｌｌｅｒ；ＣＴＣ）を備え、上記音声出力に対して例えば、音の到来方向及び奥行き感を示す仮想音像の位置を付与するために、２つ以上のスピーカから発せられる音声出力と、事前に用意したインパルス応答から得られる伝達関数の逆行列である、クロストークキャンセラのフィルタ係数とを用いて、ユーザの両耳に届く音声出力のクロストークを消去することで、スピーカ位置と異なる位置に仮想音像を生成する技術が知られている（例えば、特許文献１参照）。

国際公開第２０１９／１６３０１３号

上記した従来の情報呈示装置は、必要な音の到来方向及び奥行き感を示す仮想音像の位置毎に、インパルス応答の周波数特性測定結果から得られるフィルタ係数を事前に用意しておく必要があり、インパルス応答の測定工数、インパルス応答から得られるフィルタ係数データを保持するための記憶容量が大きくかかることに加え、インパルス応答を測定した位置に対応した仮想音像しか得られず、自在に仮想音像の位置を変更することはできないといった課題があった。

本開示は、上述の課題を解決するためになされたものであり、仮想音像の位置毎のインパルス応答の周波数測定結果から得られるフィルタ係数を事前に用意することなく、外部から指定される仮想音像の位置、特に、スピーカからユーザの耳元までの間に自在に定位することが可能な音声を呈示することが可能な情報呈示装置、情報呈示方法および情報呈示プログラムを得ることを目的とする。

本開示に係る情報呈示装置は、
外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定する仮想音像位置決定部と、
前記ユーザに呈示するための音響信号が入力され、
前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成する仮想音像生成部、を備えるものである。

また、本開示に係る情報呈示装置は、
外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された３つ以上の複数のスピーカの位置情報を用いて、
２つ以上の副仮想音像の位置を決定する仮想音像位置判断部と、
前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、
前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定する仮想音像位置決定部と、
前記ユーザに呈示するための音響信号が入力され、
前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成する仮想音像生成部、を備えるものである。

また、本開示に係る情報呈示方法は、
仮想音像位置決定部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置決定部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、を備えるものである。

また、本開示に係る情報呈示方法は、
仮想音像位置判断部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置判断部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された３つ以上の複数のスピーカの位置情報を用いて、
２つ以上の副仮想音像の位置を決定するステップと、
仮想音像位置決定部が、前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、を備えるものである。

また、本開示に係る情報呈示プログラムは、
仮想音像位置決定部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置決定部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、をコンピュータにより実行させるものである。

また、本開示に係る情報呈示プログラムは、
仮想音像位置判断部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置判断部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された３つ以上の複数のスピーカの位置情報を用いて、
２つ以上の副仮想音像の位置を決定するステップと、
仮想音像位置決定部が、前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、をコンピュータにより実行させるものである。

本開示によれば、仮想音像の位置毎に、インパルス応答の周波数特性測定結果から得られるフィルタ係数を事前に用意しておく必要がなく、外部から指定される仮想音像の位置、特に、スピーカからユーザの耳元までの間に自在に定位することが可能な音声を呈示することができ、ユーザにとって適切な情報呈示が可能となるという効果を有する。

実施の形態１を示す情報呈示装置及び情報呈示システムのブロック構成図である。スピーカ配置データの内容を示す表である。仮想音像生成位置を定義するための模式図である。クロストーク量を定義するための模式図である。クロストーク量とクロストーク消去量制御パラメータとの関係の一例を示す図である。実施の形態１を示す情報呈示装置の処理の流れを示すフローチャートである。実施の形態１を示す情報呈示装置のハードウェア構成の一例を示す図である。実施の形態１を示す情報呈示装置のハードウェア構成の別の一例を示す図である。実施の形態２を示す情報呈示装置のブロック構成図である。実施の形態２における複数の副仮想音像から所望する仮想音像を生成する模式図である。実施の形態２を示す情報呈示装置の処理の流れを示すフローチャートである。実施の形態２を示す情報呈示装置のハードウェア構成の一例を示す図である。実施の形態２を示す情報呈示装置のハードウェア構成の別の一例を示す図である。実施の形態３を示す情報呈示装置のブロック構成図である。実施の形態３における複数の副仮想音像の出力音量を制御して所望する仮想音像の位置を補正する模式図である。

実施の形態１．
《１－１》構成
実施の形態１における情報呈示装置について図１～図８を用いて説明する。図１は本実施の形態１を示す情報呈示装置及び情報呈示システムのブロック構成図である。図２はスピーカ配置データの内容を示す表である。図３は仮想音像生成位置を定義するための模式図である。図４はクロストーク量を定義するための模式図である。図５はクロストーク量とクロストーク消去量制御パラメータとの関係の一例を示す図である。図６は本実施の形態１を示す情報呈示装置の処理の流れを示すフローチャートである。図７は本実施の形態１を示す情報呈示装置のハードウェア構成の一例を示す図である。図８は本実施の形態１を示す情報呈示装置のハードウェア構成の別の一例を示す図である。

図１において、情報呈示システム１０００は、情報呈示装置１００と、外部装置２００と、情報出力装置２１０とで構成されている。本実施の形態では説明を簡単にするために、同一平面上で直線配置した２個のスピーカの場合で動作原理を説明するが、３個以上のスピーカを用いた３次元配置の構成であっても良い。

外部装置２００は、自動車あるいは鉄道等の車両のナビゲーションシステム、乗員モニタリングシステム、車外周囲監視システム等の車載情報システムＩＶＩと、カメラ、マイクロフォン、生体センサ、超音波センサ、レーダ及びＬｉＤＡＲ（ＬｉｇｈｔＤｅｔｅｃｔｉｏｎＡｎｄＲａｎｄｇｉｎｇ）等の単一あるいは複数の状態検出手段を組み合わせた各種センサＳＥＮＳとで構成されている。

各種センサＳＥＮＳは、車内あるいは車外に設置され、例えば、車内の乗員の視線、眠気などの人の状態、あるいは車外の障害物、交通状況などの車内外情報Ｄ１００を検出し出力する。車載情報システムＩＶＩは、各種センサＳＥＮＳで検出した車内外情報Ｄ１００が入力され、乗員であるユーザＵに呈示すべき情報を判断する。更に車載情報システムＩＶＩは、ユーザＵに呈示すべき情報に対応した音声信号の仮想音像の位置情報として、所定のフレーム周期Ｔ（例えば、１０ｍｓｅｃ）毎に、音像位置データＤ１０１を出力すると共に、ユーザＵに呈示すべき情報に対応した音声信号として、所定のフレーム周期Ｔ毎に、音源データＤ１１０を出力する。なお、以降の説明において、個々のフレームの時間順序を示すフレーム番号τは、必要な場合を除きその記載を省略し、省略されている場合は現在のフレームとして見做すこととする。

音源データＤ１１０の種類として、例えば、正弦波あるいは矩形波などのトーン音が連続あるいは断続するサイン音、あるいは音声によるガイダンス音を用いることができ、ユーザＵに呈示すべき情報の種類、または状況に応じて使い分けることが可能である。サイン音の場合は言語依存性が無いので、誰にでも呈示可能な警告音を発することができる。また、音声によるガイダンス音は音に言語情報を付加することができる、すなわち、警告の意味を付加することができるので、より分かりやすい警告音を発することができる。

情報呈示装置１００は、音像位置データＤ１０１及び音源データＤ１１０が入力され、ユーザＵに呈示するための仮想音像信号Ｄ１１１及びＤ１１２を出力する。

情報出力装置２１０は、Ｄ／Ａ変換部２２０、ＬスピーカＳＰ１及びＲスピーカＳＰ２とで構成され、仮想音像信号Ｄ２１１をＬスピーカＳＰ１から出力すると共に、仮想音像信号Ｄ２１２をＲスピーカＳＰ２から出力する。

図１において、情報呈示装置１００は、仮想音像位置決定部１、仮想音像生成部２とから構成される。また、仮想音像生成部２は、その内部に左右位置付与部３、奥行き位置付与部４から構成される。

（仮想音像位置決定部１）
仮想音像位置決定部１は、外部装置２００が出力する音像位置データＤ１０１、スピーカ配置データベースＳＰＤＢが出力するスピーカ配置データＤ１０２を入力し、後述する仮想音像生成部２で生成する所望する仮想音像Ｓの位置を決定し、所望する仮想音像Ｓの位置情報である、左右位置パラメータＤ１０３、クロストーク消去量制御パラメータλＤ１０４を、所定のフレーム周期Ｔ毎にそれぞれ出力する。

スピーカ配置データベースＳＰＤＢは、図２に示すように、スピーカ番号毎のスピーカ位置と、後述する左右位置付与部３及び奥行き位置付与部４により生成可能な仮想音像生成位置の範囲とを記憶しており、これらの情報をスピーカ配置データＤ１０２として仮想音像位置決定部１に出力する。

（仮想音像生成位置の定義）
仮想音像位置決定部１における仮想音像の生成位置の決定方法について具体的に説明する。図３に示すように、所望する仮想音像Ｓの位置の座標を（ｘ_ｓ，ｙ_ｓ，ｚ_ｓ）、ユーザＵの聴取範囲に配置されたＬスピーカＳＰ１の位置の座標を（ｘ_１，ｙ_１，ｚ_１）、同様にユーザＵの聴取範囲に配置されたＲスピーカＳＰ２の位置の座標を（ｘ_２，ｙ_２，ｚ_２）、ユーザＵの頭部は各スピーカに相対する向きに向いており、ＬスピーカＳＰ１からユーザＵまでの距離とＲスピーカＳＰ２からユーザＵまでの距離は等しいものとする。また、ユーザＵの左耳ＥＡＲｌの位置の座標を（ｘ_Ｌ，ｙ_Ｌ，ｚ_Ｌ）、ユーザＵの右耳ＥＡＲｒの位置の座標を（ｘ_Ｒ，ｙ_Ｒ，ｚ_Ｒ）とする。なお、ユーザＵの頭部の中心の座標を原点（０，０，０）に置き、ユーザＵの頭部の０より大きい所定の幅をｗとした場合、ユーザＵの左耳ＥＡＲｌ及び右耳ＥＡＲｒの位置の座標は、それぞれ（－ｗ／２，０，０）、（ｗ／２，０，０）と表現することもできる。

所望する仮想音像Ｓの到来方向である左右位置は、まず、ユーザＵの頭部の中心と所望する仮想音像Ｓの位置とを結ぶ線分の延長線（図中の線ｌ_１）と、２つのスピーカ位置を結ぶ水平方向の線分の延長線（図中の線ｌ_２）との交点Ｐの座標（ｘ_ｐ，ｙ_ｐ，ｚ_ｐ）を算出する。この交点Ｐが左右位置付与部４により付与される、所望する仮想音像Ｓの到来方向である左右位置である。この交点Ｐの座標（ｘ_ｐ，ｙ_ｐ，ｚ_ｐ）を用いて、所望する仮想音像Ｓの到来方向角度θを算出すると共に、ＬスピーカＳＰ１の位置の座標（ｘ_１，ｙ_１，ｚ_１）、ＲスピーカＳＰ２の位置の座標（ｘ_２，ｙ_２，ｚ_２）、及びユーザＵの位置の座標とからスピーカ位置角度θ_０とを算出し、左右位置パラメータＤ１０３としてそれぞれ出力する。

次に、所望する仮想音像Ｓの奥行き位置は、例えば、次の式（１）に示す、所望する仮想音像Ｓの位置からユーザＵの左耳ＥＡＲｌまでのユークリッド距離により定義される距離ｄ_Ｌ、及び所望する仮想音像Ｓの位置からユーザＵの右耳ＥＡＲｒまでのユークリッド距離により定義される距離ｄ_Ｒにより決定する。この距離ｄ_Ｌ及び距離ｄ_Ｒを用いて、後述する目標とするクロストーク量を算出し、このクロストーク量に対応するクロストーク消去量制御パラメータλＤ１０４を算出する。

（クロストーク量の定義）
ここで、クロストーク消去量制御パラメータλＤ１０４を決定するのに用いるクロストーク量を定義する。クロストーク量Ｖ_ＣＴは、図４に示すように、単一スピーカ（図４ではＬスピーカＳＰ１）で音声信号を再生する条件の下、ユーザＵの左耳ＥＡＲｌでの受音信号Ｙ_Ｌ（ω）、ユーザＵの右耳ＥＡＲｒでの受音信号Ｙ_Ｒ（ω）から次の式（２）で定義される。

この式（２）は、ＬスピーカＳＰ１から近い耳（すなわちユーザＵの左耳ＥＡＲｌ）で受音した信号とクロストーク信号の比でもある。なお、図３の例では、ＬスピーカＳＰ１とユーザＵの左耳ＥＡＲｌでクロストーク量を定義しているが、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒで定義しても良く、式（２）における、ユーザＵの左耳ＥＡＲｌの受音信号Ｙ_Ｌ（ω）が分母、ユーザＵの右耳ＥＡＲｒでの受音信号Ｙ_Ｒ（ω）が分子となり、それぞれの位置が入れ替わることとなる。

図５は、クロストーク消去量制御パラメータλＤ１０４の値を０から１まで動かした際の、ユーザＵの左耳ＥＡＲｌにおけるクロストーク量Ｖ_ＣＴの変化の一例を示すものである。図５より、λの増加に合わせてクロストーク量Ｖ_ＣＴ（縦軸）が減少、つまりクロストークを消去する量が増加していることがわかる。クロストーク消去量制御パラメータλＤ１０４は大きいほどユーザＵの耳元側に仮想音像を生成し、クロストーク消去量制御パラメータλＤ１０４が小さいほどスピーカに近い位置に仮想音像を生成する。つまり、クロストーク消去量制御パラメータλＤ１０４を調整することで、ユーザＵに対して奥行き位置に自在に仮想音像を生成することが可能となる。

より具体的に述べるならば、所望する仮想音像Ｓの位置に仮想音像を生成するためには、ユーザＵの左耳での受音信号Ｙ_Ｌ（ω）、ユーザＵの右耳での受音信号Ｙ_Ｒ（ω）の比がそれぞれの距離の逆比になるようにＬスピーカＳＰ１及びＲスピーカＳＰ２から音声信号を再生すればよい。つまり、式（２）の定義と、式（１）で得られる距離ｄ_Ｌ、距離ｄ_Ｒより、クロストーク量Ｖ_ＣＴは次の式（３）の関係が成り立つ。

ここで、ωは角周波数であり、Ｙ_Ｌ（ω）及びＹ_Ｒ（ω）は、それぞれの受音信号をフーリエ表現したものである。

よって、図５のグラフを参照し、式（３）に示すクロストーク量Ｖ_ＣＴ（縦軸）を満たすようにクロストーク消去量制御パラメータλ（横軸）を調整することで、所望する仮想音像Ｓの奥行き位置を制御することができる。なお、図５のクロストーク量Ｖ_ＣＴとクロストーク消去量制御パラメータλＤ１０４の関係を表すグラフを参照する以外の方法として、音響シミュレーションで直接的にクロストーク消去量制御パラメータλＤ１０４を算出してもよい。また、図５のグラフ情報は関数としてフィッティング（例えば、近似関数に変換）、もしくは量子化してテーブルとして保持してもよい。

なお、式（３）において、ｄ_Ｌあるいはｄ_Ｒが０の場合、式（３）が不定値を取る、あるいは、クロストーク量Ｖ_ＣＴが０となるので、例外処理としてクロストーク消去量制御パラメータλは１に設定し、ユーザＵの耳元に仮想音像を定位させる。

また、所望する仮想音像の位置がユーザＵの正面となる場合、すなわち、ｄ_Ｌとｄ_Ｒが等距離となる場合、式（３）のクロストーク量Ｖ_ＣＴの値が、ｄ_Ｌとｄ_Ｒの値にかかわらず常に０となる。これを避けるため、次の式（４）を式（３）の代わりに用いることで、クロストーク量Ｖ_ＣＴと距離ｄ_Ｌとの関係を近似的に得ることができる。式（４）より、ｄ_Ｌが０となる場合はクロストーク量Ｖ_ＣＴは０となる、すなわち、ユーザＵの耳元位置に所望する仮想音像Ｓを定位させることができ、距離ｄ_Ｌが増加するに従ってクロストーク量Ｖ_ＣＴが大きくなり、スピーカに近い位置に所望する仮想音像Ｓが定位することとなる。なお、ｄ_Ｌがｄ_Ｃと同一となる場合、クロストーク量Ｖ_ＣＴは不定値を取るので、例外処理として奥行き付与を行わず、左右位置のみ付与する。

ここで、ｄ_Ｃは図３に示すように、ユーザＵの中心から線分ｌ_２に向かって垂直に伸ばした線分の距離であり、０ではない所定の値を取る。

仮想音像生成部２は、その内部に左右位置付与部３及び奥行き位置付与部４を有しており、左右位置パラメータＤ１０３、クロストーク消去量制御パラメータλＤ１０４、音源データＤ１１０を入力し、音像の到来方向と奥行き位置を付与した仮想音像を生成する。

（左右位置付与部３）
仮想音像生成部２の内部構成である左右位置付与部３の詳細を説明する。左右位置付与部３は、音源データＤ１１０として、例えば、サンプリング周波数１６ｋＨｚのモノラル音声信号ｓ_ｍｏｎｏ（ｔ）を入力すると共に、左右位置パラメータＤ１０３である、所望する仮想音像Ｓの到来方向角度θとスピーカ位置角度θ_０とを入力し、仮想音像に音像の左右位置を付与する処理、すなわち、モノラル音声信号をステレオ化する共に、ステレオ化した音声信号に対し、それぞれのチャンネルの出力特性を調整することで、仮想音像の到来方向を付与する処理が為される。本実施の形態では、例えば、サイン則による振幅パニング法により、次の式（５）を満たすように、ＬスピーカＳＰ１から出力する音声信号のゲインｇ_Ｌ（τ）、ＲスピーカＳＰ２から出力する音声信号のゲインｇ_Ｒ（τ）をそれぞれ算出する。

続いて、式（６）に示すように、モノラル音声信号ｓ_ｍｏｎｏ（ｔ）に対して、式（５）で得られたゲインｇ_Ｌ（τ）及びｇ_Ｒ（τ）を乗算することで、ステレオ化ならびに仮想音像の左右位置を付与し、ＬスピーカＳＰ１から出力するための音声信号ｓ_１（ｔ）Ｄ１１１と、ＲスピーカＳＰ２から出力するための音声信号ｓ_２（ｔ）Ｄ１１２とをそれぞれ出力する。

ここで、ｔはサンプル時間、τはフレーム番号である。また、ｇ_Ｌ（τ）及びｇ_Ｒ（τ）は、それぞれ０≦ｇ_Ｌ（τ）≦１、０≦ｇ_Ｒ（τ）≦１の値をとる変数であり、フレーム周期Ｔ毎にその値は変化する。

なお、本実施の形態では、ゲインｇ_Ｌ（τ）及びｇ_Ｒ（τ）の算出方法として、サイン則による振幅パニング法を用いているが、これに限ることは無く、例えば、タンジェント則又は線形則などのさまざまな音像定位法を用いることができる。更に、ゲインだけでは無く音声信号Ｄ１１１及び音声信号Ｄ１１２の位相も変化させても良い。例えば、音声信号Ｄ１１１と音声信号Ｄ１１２とが逆位相となるようにする、言い換えれば、音声信号Ｄ１１１の信号の符号を反転させることである。位相を変化させることで、所望する仮想音像Ｓの到来方向を、ＬスピーカＳＰ１の位置とＲスピーカＳＰ２の位置とを結ぶ線分よりも外側に生成することが可能であり、所望する仮想音像Ｓの定位位置の範囲を広げることができる。

（奥行き位置付与部４）
続いて、奥行き位置付与部４の詳細を説明する。奥行き位置付与部４は、その内部にクロストークキャンセラＣＴＣを有する。クロストークキャンセラＣＴＣは、左右位置付与部３が出力するステレオ音声信号Ｄ１１１、Ｄ１１２に対して、仮想音像位置決定部１が算出したクロストーク消去量制御パラメータλＤ１０４を用いてクロストークを消去、すなわち、ＬスピーカＳＰ１及びＲスピーカＳＰ２からユーザＵの耳元位置までの奥行きを付与した仮想音像信号Ｄ２１１、Ｄ２１２を生成する。

（クロストークキャンセラＣＴＣの詳細）
ここで、クロストークキャンセラＣＴＣの詳細動作を説明する。まず、左右位置付与部３から得られた音声信号ｓ_１（ｔ）Ｄ１１１と音声信号ｓ_２（ｔ）Ｄ１１２とから、２チャンネルのステレオ音声信号ｄ_ｓ（ω，τ）を次の式（７）のように定義する。

ここで、ωは角周波数、τはフレーム番号であり、Ｓ_１（ω，τ）、Ｓ_２（ω，τ）は、それぞれｓ_１（ｔ）とｓ_２（ｔ）とをフーリエ表現したものである。

続いて、ＬスピーカＳＰ１とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒ、ＲスピーカＳＰ２とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒとの所定のインパルス応答の周波数成分を、それぞれＧ_{［１，Ｌ］}（ω）、Ｇ_{［１，Ｒ］}（ω）、Ｇ_{［２，Ｌ］}（ω）、Ｇ_{［２，Ｒ］}（ω）とし、次の式（８）で示す行列Ｇ（ω）を定義する。なお、ＬスピーカＳＰ１とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒ、ＲスピーカＳＰ２とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒとの所定のインパルス応答については、ＬスピーカＳＰ１、ＲスピーカＳＰ２及びユーザＵの位置を所定の位置に固定した上で、それぞれ一度だけ測定すればよい。

式（８）に示したＧ（ω）の逆行列を取ったものが、クロストークキャンセラＣＴＣのフィルタ係数Ｈ（ω）であり、次の式（９）で表される。

ここで、Ｈ_{［１，Ｌ］}（ω）、Ｈ_{［１，Ｒ］}（ω）、Ｈ_{［２，Ｌ］}（ω）、Ｈ_{［２，Ｒ］}（ω）は、それぞれ、ＬスピーカＳＰ１とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒ、ＲスピーカＳＰ２とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒのインパルス応答から得られる逆フィルタのフィルタ係数に相当する。この所定のフィルタ係数に対して、クロストーク消去量を可変とするためにクロストーク消去量制御パラメータλを導入したものを、次の式（１０）で示す。

ここでＩは単位行列である。式（１０）で得られたＨ_λ（ω）を用いて、ステレオ音声信号ｄ_ｓ（ω，τ）からクロストークを消去、すなわち、仮想音像の奥行きを付与した音声信号ｄ＾（ω，τ）は次の式（１１）で得ることができる。なお、記号”＾”は、数式でのハット（ｈａｔ）を表している。

また、式（１１）は周波数領域での表現であるので、これを時間軸での処理で表したものが式（１２）であり、仮想音像信号ｄ_１＾（ｔ）Ｄ２１１及び仮想音像信号ｄ_２＾（ｔ）Ｄ２１２を算出する。

ここで、ｈ_{λ［１，Ｌ］}、ｈ_{λ［１，Ｒ］}、ｈ_{λ［２，Ｌ］}、ｈ_{λ［２，Ｒ］}は、クロストークキャンセラＣＴＣのクロストーク消去量を可変としたフィルタ係数Ｈ_λ（ω）の各要素を逆フーリエ変換したものであり、それぞれ、ＬスピーカＳＰ１とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒ、ＲスピーカＳＰ２とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒのインパルス応答から得られる逆フィルタのフィルタ係数に相当する。以上、得られた仮想音像信号ｄ_１＾（ｔ）Ｄ２１１、及び仮想音像信号ｄ_２＾（ｔ）Ｄ２１２を出力する。

上記では、クロストークキャンセラＣＴＣのフィルタ係数Ｈ（ω）の反映する比率λの制御により奥行き量の制御を行っていたが、これに限ることは無く、例えば、式（１３）に示すρを用いることでクロストーク量を直接制御することも可能である。

ここで、ρは図５で示したλと同様に０から１までの間の値をとるとき、前出のλと同等の効果を得られ、値が１に近いほどクロストーク量が減少する。式（１３）ではフィルタ係数Ｈ_ρ（ω）の対角成分はパラメータρで制御せず、制御箇所が少ないので扱いやすくなり、フィルタ係数Ｈ_ρ（ω）の調整工数を削減できる効果がある。

また、ρに関しては０から１の値のみならず、負の値、もしくは１より大きい値を適用してもよい。その場合、クロストークが増加、もしくは逆相のクロストークを得ることとなるが、それぞれ音像が狭くなる効果、音像の拡がり感が得られる効果がある。

式（１３）で得られたＨ_ρ（ω）を用いて、ステレオ音声信号ｄ_ｓ（ω，τ）からクロストークを消去、すなわち、仮想音像の奥行きを付与した音声信号ｄ＾（ω，τ）は次の式（１４）で得ることができる。

また、式（１１）と同様に、式（１４）は周波数領域での表現であるので、これを時間軸での処理で表したものが式（１５）であり、仮想音像信号ｄ_１＾（ｔ）Ｄ２１１及び仮想音像信号ｄ_２＾（ｔ）Ｄ２１２を算出する。

ここで、ｈ_{ρ［１，Ｌ］}、ｈ_{ρ［１，Ｒ］}、ｈ_{ρ［２，Ｌ］}、ｈ_{ρ［２，Ｒ］}は、クロストークキャンセラＣＴＣのクロストーク消去量を可変としたフィルタ係数Ｈ_ρ（ω）の各要素を逆フーリエ変換したものであり、それぞれ、ＬスピーカＳＰ１とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒ、ＲスピーカＳＰ２とユーザＵの左耳ＥＡＲｌ、ＲスピーカＳＰ２とユーザＵの右耳ＥＡＲｒのインパルス応答から得られる逆フィルタのフィルタ係数に相当する。以上、得られた仮想音像信号ｄ_１＾（ｔ）Ｄ２１１、及び仮想音像信号ｄ_２＾（ｔ）Ｄ２１２を出力する。

Ｄ／Ａ変換部２２０は、サンプリングされたデジタル信号である仮想音像信号ｄ_１＾（ｔ）Ｄ２１１、及び仮想音像信号ｄ_２＾（ｔ）Ｄ２１２をアナログ信号へ変換し、スピーカで再生可能なレベルに増幅した後、仮想音像信号ｄ_１＾（ｔ）Ｄ２１１をＬスピーカＳＰ１から音声出力すると共に、仮想音像信号ｄ_２＾（ｔ）Ｄ２１２をＲスピーカＳＰ２から音声出力する。なお、仮想音像信号Ｄ２１１と仮想音像信号Ｄ２１２は時間ずれ無く同じタイミングで音声出力する。

《１－２》処理動作
続いて、実施の形態１の情報呈示装置の処理動作について図６を用いて説明する。図６は、本実施の形態１を示す情報呈示装置１００の処理の流れを示すフローチャートである。（Ａ）はステップＳＴ１とステップＳＴ２の処理の流れを示し、（Ｂ）はステップＳＴ２中の内部処理であるステップＳＴ２ＡとステップＳＴ２Ｂの処理の流れを示す。

（ステップＳＴ１）
まず、ステップＳＴ１で、仮想音像位置決定部１において、外部装置２００が出力する音像位置データＤ１０１を読み込むと共に、スピーカ配置データベースＳＰＤＢが出力するスピーカ配置データＤ１０２を読み込み、後述するステップＳＴ２の処理で生成する所望する仮想音像Ｓの位置を決定し、仮想音像の位置情報である、左右位置パラメータＤ１０３、クロストーク消去量制御パラメータλＤ１０４をそれぞれ出力する。

（ステップＳＴ２）
ステップＳＴ２では、仮想音像生成部２において、左右位置パラメータＤ１０３、クロストーク消去量制御パラメータλＤ１０４、音源データＤ１１０を読み込み、後述するステップＳＴ２Ａ、ステップＳＴ２Ｂの処理を順次行い、音像の到来方向と奥行き位置を付与した仮想音像を生成し出力する。

（ステップＳＴ２Ａ）
ステップＳＴ２Ａでは、左右位置付与部３において、左右位置パラメータＤ１０３と、音源データD１１０とを読み込み、仮想音像に音像の左右位置を付与する処理、すなわち、モノラル音声信号をステレオ化する共に、ステレオ化した音声信号に対し、それぞれのチャンネルの出力特性を調整することで、仮想音像の到来方向を付与する処理が為される。その後、Ｌスピーカ１１から出力するための音声信号ｓ_１（ｔ）Ｄ１１１と、Ｒスピーカ１２から出力するための音声信号ｓ_２（ｔ）Ｄ１１２とをそれぞれ生成し出力する。

（ステップＳＴ２Ｂ）
ステップＳＴ２Ｂでは、音声信号Ｄ１１１と、音声信号Ｄ１１２とを読み込み、クロストークキャンセラにおいて、ステップＳＴ１の処理で音像位置決定部１が算出したクロストーク消去量制御パラメータλＤ１０４を用いてクロストークを消去、すなわち、ＬスピーカＳＰ１及びＲスピーカＳＰ２からユーザＵの耳元位置までの奥行きを付与した仮想音像信号ｄ_１＾（ｔ）Ｄ２１１、仮想音像信号ｄ_２＾（ｔ）Ｄ２１２とをそれぞれ生成し出力する。ステップＳＴ２Ｂの処理が完了した後、ステップＳＴ１の処理に戻る。

《１－３》ハードウェア構成
（ハードウェア）
図１に示される情報呈示装置１００の各構成は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）内蔵の情報処理装置であるコンピュータで実現可能である。ＣＰＵ内蔵のコンピュータは、例えば、スマートフォン又はタブレットタイプの可搬型コンピュータ、カーナビゲーションシステム、乗員モニタリングシステム又は計器盤（インストルメントパネル）システム、車外周囲監視装置などの車載情報システムの機器組み込み用途のマイクロコンピュータ、及びＳｏＣ（ＳｙｓｔｅｍｏｎＣｈｉｐ）などである。

また、図１に示される情報呈示装置１００の各構成は、ＤＳＰ（ＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ）、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）、又はＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）などの電気回路であるＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｅｄｃｉｒｃｕｉｔ）により実現されてもよい。また、図１に示される情報呈示装置１００の各構成は、コンピュータとＬＳＩの組み合わせであってもよい。

図７は、ＤＳＰ、ＡＳＩＣ又はＦＰＧＡなどのＬＳＩを用いて構成される情報呈示装置１００のハードウェア構成の例を示すブロック図である。図７の例では、情報呈示装置１００は、制御回路２０１と信号入出力部２０２、を備えている。制御回路２０１は、信号処理回路２０３、記録媒体２０４、及びバスなどの信号路２０５を備える。信号入出力部２０２は、Ｄ／Ａ変換部２２０とスピーカ及びアンプで構成される情報出力装置２１０、ならびにカーナビゲーションシステム、乗員モニタリングシステム、計器盤システム、車外周囲監視装置などの車載情報システムで構成される外部装置２００との接続機能を実現するインタフェース回路である。

図１に示される仮想音像位置決定部１、仮想音像生成部２の各構成は、信号処理回路２０３と記録媒体２０４とを有する制御回路２０１で実現することができる。

記録媒体２０４は、信号処理回路２０３の各種設定データ及び信号データなどの各種データを蓄積するために使用される。記録媒体２０４としては、例えば、ＳＤＲＡＭ（ＳｙｎｃｈｒｏｎｏｕｓＤＲＡＭ）などの揮発性メモリ、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）又はＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）などの不揮発性メモリを使用することが可能である。記録媒体２０４には、例えば、情報呈示処理の初期状態及び各種設定データ、制御用の定数データ等が記憶される。

（コンピュータプログラム構成）
一方、図８は、コンピュータ等の演算装置を用いて構成される情報呈示装置１００のハードウェア構成の例を示すブロック図である。図８の例では、情報呈示装置１００の制御回路２０１は、ＣＰＵ３０１を内蔵するプロセッサ３００、メモリ３０２、記録媒体３０３、及びバスなどの信号路３０４を備えている。

メモリ３０２は、実施の形態１の情報呈示処理を実現するための各種プログラムを記憶するプログラムメモリ、プロセッサがデータ処理を行う際に使用するワークメモリ、及び信号データを展開するメモリ等として使用するＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）及びＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）等の記憶手段である。

図１に示される、仮想音像位置決定部１、仮想音像生成部２の各機能は、制御回路２０１の内部構成である、プロセッサ３００、メモリ３０２、及び記録媒体３０３で実現することができる。

記録媒体３０３は、プロセッサ３００の各種設定データ及び信号データなどの各種データを蓄積するために使用される。記録媒体３０３としては、例えば、ＳＤＲＡＭなどの揮発性メモリ、ＨＤＤ又はＳＳＤ等の不揮発性メモリを使用することが可能である。ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）を含む起動プログラム及び、各種設定データ、音響信号データ等の各種データを蓄積することができる。なお、この記録媒体３０３に、メモリ３０２内のデータを蓄積しておくこともできる。

プロセッサ３００は、メモリ３０２中のＲＡＭを作業用メモリとして使用し、メモリ３０２中のＲＯＭから読み出されたコンピュータ・プログラム（すなわち、情報呈示プログラム）に従って動作することにより、仮想音像位置決定部１、仮想音像生成部２の情報呈示処理を実行することができる。

情報呈示装置１００を実行するプログラムは、ソフトウエアプログラムを実行するコンピュータ内部の記憶装置に記憶していてもよいし、ＣＤ－ＲＯＭあるいはフラッシュメモリ等のコンピュータで読み取り可能な外部記憶媒体にて配布される形式で保持され、コンピュータ起動時に読み込んで動作させてもよい。また、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）等の無線及び有線ネットワークを通じて他のコンピュータからプログラムを取得することも可能である。さらに、情報呈示装置１００に接続される情報出力装置２１０及び外部装置２００に関しても、アナログ・デジタル変換などを介せずに、無線又は有線ネットワークを通じて各種データをデジタル信号のまま送受信してもよい。

また、情報呈示装置１００を実行するプログラムは、外部装置２００で実行されるプログラム、例えば、カーナビゲーション、乗員モニタリングシステム、計器盤装置、車外周囲監視装置を実行するプログラムとソフトウェア上で結合し、同一のコンピュータで動作させることも可能であるし、又は、複数のコンピュータ上で分散処理することも可能である。

以上、説明した実施の形態１の構成による情報呈示装置は、複数のスピーカのそれぞれの出力特性を仮想音像の位置情報に応じて制御すると共に、クロストークキャンセラのクロストーク消去量を仮想音像とユーザの耳元までの距離情報に応じて制御することにより、仮想音像の到来方向及び奥行き位置を可変としたので、事前調整を必要とせずに、外部から指定される仮想音像の位置、特に、スピーカからユーザの耳元の間に自在に定位することが可能な音声を呈示することができる効果を奏する。

また、実施の形態１の構成による情報呈示装置は、複数のスピーカのそれぞれの出力特性を仮想音像の位置情報に応じて制御すると共に、クロストークキャンセラのクロストーク消去量を仮想音像とユーザの耳元までの距離情報に応じて制御することにより、仮想音像の到来方向及び奥行き位置を可変としたので、仮想音像の位置毎に、インパルス応答の周波数特性測定結果から得られるフィルタ係数を事前に用意しておく必要が無く、インパルス応答の測定工数、及びインパルス応答から得られるフィルタ係数データを保持するための記憶容量を削減することができ、装置設計時間及び装置規模などの各種コストを低減する効果も奏する。

実施の形態２．
《２－１》構成
上記した実施の形態１では、ＬスピーカＳＰ１とＲスピーカＳＰ２の２つのスピーカを用いて所望する仮想音像の到来方向と奥行き位置を制御していたが、これに限ることは無く、３つ以上のスピーカを用いて２つ以上の副仮想音像を生成し、それらを同時に出力して合成することで、２つのスピーカでは生成できないような位置に所望する仮想音像を生成することが可能であり、これを実施の形態２として説明する。

実施の形態２における情報呈示装置について図９～図１３を用いて説明する。図９は実施の形態２を示す情報呈示装置のブロック構成図である。図１０は実施の形態２における複数の副仮想音像から所望する仮想音像を生成する模式図である。図１１は本実施の形態２を示す情報呈示装置の処理の流れを示すフローチャートである。図１２は本実施の形態２を示す情報呈示装置のハードウェア構成の一例を示す図である。図１３は本実施の形態１を示す情報呈示装置のハードウェア構成の別の一例を示す図である。図９中、図１と異なる構成としては第１副仮想音像位置決定部１ａ、第１副仮想音像位置生成部２ａ、第２副仮想音像位置決定部１ｂ、第２副仮想音像生成部２ｂ、副仮想音像位置判断部５である。図９中、図１と同一符号を付したものは同一または相当部分を示す。ＢスピーカＳＰ３は、ユーザＵの聴取範囲かつユーザＵの後方に配置されている。

副仮想音像位置判断部５は、外部装置２００が出力する音像位置データＤ１０１を入力すると共に、スピーカ配置データベースＳＰＤＢが出力するスピーカ配置データＤ１０２を入力し、音像位置データＤ１０１が指定する所望の仮想音像Ｓの位置と、スピーカ配置データＤ１０２のスピーカ位置と仮想音像生成可能範囲とから、第１副仮想音像Ｓ１の位置と第２副仮想音像Ｓ２の位置を判断すると共に、第１副仮想音像Ｓ１と第２副仮想音像Ｓ２とを生成するのに必要なスピーカ番号を判断する。この判断結果に基づいて、副仮想音像位置判断部５は、第１副音像位置データＤ１０１ａと、第２副音像位置データＤ１０１ｂとを出力する。

第１副仮想音像位置決定部１ａは、実施の形態１の仮想音像位置決定部１と同等の機能を有しており、第１副音像位置データＤ１０１ａ、スピーカ配置データＤ１０２を入力し、第１副仮想音像生成部２ａで生成する第１副仮想音像Ｓ１の位置を決定し、第１副仮想音像の位置情報である、左右位置パラメータＤ１０３ａ、クロストーク消去量制御パラメータλＤ１０４ａを、所定のフレーム周期Ｔ毎にそれぞれ出力する。

第２副仮想音像位置決定部１ｂは、実施の形態１の仮想音像位置決定部１と同等の機能を有しており、第２副音像位置データＤ１０１ｂ、スピーカ配置データＤ１０２を入力し、第２副仮想音像生成部２ｂで生成する第２副仮想音像Ｓ２の位置を決定し、第２副仮想音像Ｓ２の位置情報である、左右位置パラメータＤ１０３ｂ、クロストーク消去量制御パラメータλＤ１０４ｂを、所定のフレーム周期Ｔ毎にそれぞれ出力する。

第１副仮想音像生成部２ａは、実施の形態１の仮想音像生成部２と同等の機能を有しており、左右位置パラメータＤ１０３ａ、クロストーク消去量制御パラメータλＤ１０４ａ、音源データＤ１１０を入力し、音像の到来方向と奥行き位置を付与した第１副仮想音像Ｓ１を生成し、得られた第１副仮想音像信号Ｄ２１１ａ、及び第１副仮想音像信号Ｄ２１２ａを出力する。

第２副仮想音像生成部２ｂは、実施の形態１の仮想音像生成部２と同等の機能を有しており、左右位置パラメータＤ１０３ｂ、クロストーク消去量制御パラメータλＤ１０４ｂ、音源データＤ１１０を入力し、音像の到来方向と奥行き位置を付与した第２副仮想音像Ｓ２を生成し、得られた第２副仮想音像信号Ｄ２１１ｂ、及び第２副仮想音像信号Ｄ２１２ｂを出力する。

Ｄ／Ａ変換部２２０は、第１副仮想音像信号Ｄ２１１ａ、第１副仮想音像信号Ｄ２１２ａ、第２副仮想音像信号Ｄ２１１ｂ、及び第２副仮想音像信号Ｄ２１２ｂをそれぞれアナログ信号へ変換し、スピーカで再生可能なレベルに増幅した後、第１副仮想音像信号Ｄ２１１ａをＬスピーカＳＰ１から、第１副仮想音像信号Ｄ２１２ａをＲスピーカＳＰ２から、第２副仮想音像信号Ｄ２１１ｂをＢスピーカＳＰ３から、第２副仮想音像信号Ｄ２１２ｂをＬスピーカＳＰ１から、それぞれ音声出力する。なお、これらの副仮想音像信号は全て時間ずれ無く同じタイミングで音声出力する。

図１０は、上述した一連の処理によって生成した第１副仮想音像Ｓ１と第２副仮想音像Ｓ２により、所望する仮想音像Ｓを新たに生成する模式図である。図１０に示すように、第１副仮想音像Ｓ１と第２副仮想音像Ｓ２を３つのスピーカからユーザＵに向けて同時に出力することで、ユーザＵは聴感的に所望する仮想音像Ｓの位置に合成音像があるように知覚することができる。この方法により、２つのスピーカでは生成できないような位置、特に、図１０に示すように、ユーザＵの左耳の真横方向に奥行きを持つような仮想音像を生成することが可能である。

《２－２》処理動作
続いて、実施の形態２の情報呈示装置の処理動作について図１１を用いて説明する。図１１は、本実施の形態２を示す情報呈示装置１００の処理の流れを示すフローチャートである。

（ステップＳＴ１）
まず、ステップＳＴ１では、副仮想音像位置判断部５において、外部装置２００が出力する音像位置データＤ１０１を読み込むと共に、スピーカ配置データベースＳＰＤＢが出力するスピーカ配置データＤ１０２を読み込み、音像位置データＤ１０１が指定する所望の仮想音像Ｓの位置と、スピーカ配置データＤ１０２のスピーカ位置と仮想音像生成可能範囲とから、第１副仮想音像Ｓ１の位置と第２副仮想音像Ｓ２の位置を判断する処理を行うと共に、第１副仮想音像Ｓ１と第２副仮想音像Ｓ２とを生成するのに必要なスピーカ番号を判断する処理を行う。この判断結果に基づいて、後述するステップＳＴ２Ａ及びステップＳＴ２Ｂの処理で用いる、第１副音像位置データＤ１０１ａと、第２副音像位置データＤ１０１ｂとを出力する。

（ステップＳＴ２Ａ）
ステップＳＴ２Ａでは、第１副仮想音像位置決定部１ａにおいて、第１副音像位置データＤ１０１ａと、スピーカ配置データＤ１０２とを読み込み、第１副仮想音像Ｓ１の位置を決定する処理を行い、第１副仮想音像の位置情報である、左右位置パラメータＤ１０３ａ、クロストーク消去量制御パラメータλＤ１０４ａを、所定のフレーム周期Ｔ毎にそれぞれ出力する。

（ステップＳＴ２Ｂ）
ステップＳＴ２Ｂでは、第２副仮想音像位置決定部１ｂにおいて、第２副音像位置データＤ１０１ｂ、スピーカ配置データＤ１０２を入力し、第２副仮想音像Ｓ２の位置を決定する処理を行い、第２副仮想音像Ｓ２の位置情報である、左右位置パラメータＤ１０３ｂ、クロストーク消去量制御パラメータλＤ１０４ｂを、所定のフレーム周期Ｔ毎にそれぞれ出力する。

（ステップＳＴ３Ａ）
ステップＳＴ３Aでは、第１副仮想音像生成部２ａにおいて、左右位置パラメータＤ１０３ａ、クロストーク消去量制御パラメータλＤ１０４ａ、音源データＤ１１０を入力し、音像の到来方向と奥行き位置を付与した第１副仮想音像Ｓ１を生成する処理を行い、得られた第１副仮想音像信号Ｄ２１１ａ、及び第１副仮想音像信号Ｄ２１２ａを出力する。

（ステップＳＴ３Ｂ）
ステップＳＴ３Ｂでは、第２副仮想音像生成部２ｂにおいて、左右位置パラメータＤ１０３ｂ、クロストーク消去量制御パラメータλＤ１０４ｂ、音源データＤ１１０を入力し、音像の到来方向と奥行き位置を付与した第２副仮想音像Ｓ２を生成する処理を行い、得られた第２副仮想音像信号Ｄ２１１ｂ、及び第２副仮想音像信号Ｄ２１２ｂを出力する。ステップＳＴ３Ｂの処理が完了した後、ステップＳＴ１の処理に戻る。

なお、上述したステップＳＴ２ＡとステップＳＴ２Ｂの処理については順不同であり、ステップＳＴ２Ｂの処理をステップＳＴ２Ａの処理よりも先に実行しても良いし、両ステップの処理を同時に実行しても良い。また、ステップＳＴ３ＡとステップＳＴ３Ｂの処理も順不同であり、ステップＳＴ３Ｂの処理をステップＳＴ３Ａの処理よりも先に実行しても良いし、両ステップの処理を同時に実行しても良い。

《２－３》ハードウェア構成
（ハードウェア）
図９に示される情報呈示装置１００の各構成は、実施の形態１で示したのと同様に、ＣＰＵ内蔵の情報処理装置であるコンピュータで実現可能である。ＣＰＵ内蔵のコンピュータは、例えば、スマートフォン又はタブレットタイプの可搬型コンピュータ、カーナビゲーションシステム、乗員モニタリングシステム又は計器盤（インストルメントパネル）システム、車外周囲監視装置などの車載情報システムの機器組み込み用途のマイクロコンピュータ、及びＳｏＣなどである。

また、図９に示される情報呈示装置１００の各構成は、実施の形態１で示したのと同様に、ＤＳＰ、ＡＳＩＣ、又はＦＰＧＡなどの電気回路であるＬＳＩにより実現されてもよい。また、図９に示される情報呈示装置１００の各構成は、コンピュータとＬＳＩの組み合わせであってもよい。

図１２は、ＤＳＰ、ＡＳＩＣ又はＦＰＧＡなどのＬＳＩを用いて構成される情報呈示装置１００のハードウェア構成の例を示すブロック図である。図１２中、図７と同一符号を付したものは同一または相当部分を示すものとし、またそれらの構成は実施の形態１で示したのと同等であるので説明を省略する。

図９に示される、副仮想音像位置判断部５、第１副仮想音像位置決定部１ａ、第２副仮想音像位置決定部１ｂ、第１副仮想音像生成部２ａ、第２副仮想音像生成部２ｂの各構成は、図１２に示す、信号処理回路２０３と記録媒体２０４とを有する制御回路２０１で実現することができる。

（コンピュータプログラム構成）
一方、図１３は、コンピュータ等の演算装置を用いて構成される情報呈示装置１００のハードウェア構成の例を示すブロック図である。図１３中、図８と同一符号を付したものは同一または相当部分を示すものとし、またそれらの構成は実施の形態１で示したのと同等であるので説明を省略する。

図９に示される、副仮想音像位置判断部５、第１副仮想音像位置決定部１ａ、第２副仮想音像位置決定部１ｂ、第１副仮想音像生成部２ａ、第２副仮想音像生成部２ｂの各機能は、制御回路２０１の内部構成である、プロセッサ３００、メモリ３０２、及び記録媒体３０３で実現することができる。

プロセッサ３００は、メモリ３０２中のＲＡＭを作業用メモリとして使用し、メモリ３０２中のＲＯＭから読み出されたコンピュータ・プログラム（すなわち、情報呈示プログラム）に従って動作することにより、副仮想音像位置判断部５、第１副仮想音像位置決定部１ａ、第２副仮想音像位置決定部１ｂ、第１副仮想音像生成部２ａ、第２副仮想音像生成部２ｂの情報呈示処理を実行することができる。

以上、説明した実施の形態２の構成による情報呈示装置は、所望する仮想音像の位置と３つのスピーカ位置とから２つの副仮想音像位置を決定し、３つのスピーカのそれぞれの出力特性を２つの副仮想音像の位置情報に応じて制御すると共に、クロストークキャンセラのクロストーク消去量を２つの副仮想音像とユーザの耳元までの距離情報に応じて制御することで２つの副仮想音像を生成し、生成された２つの副仮想音像をユーザに同時に知覚させることで、ユーザに対して所望する仮想音像位置に仮想音像を呈示することができる上、２つのスピーカでは生成できないような位置、特に、ユーザの真横方向に奥行きを持つような仮想音像を生成できるという顕著な効果を奏する。

実施の形態３．
上記した実施の形態２では、２つの副仮想音像を生成し、生成された２つの副仮想音像をユーザに同時に知覚させることで、ユーザに対して所望する仮想音像位置に仮想音像を呈示していたが、ユーザの頭部の大きさあるいは位置の違いによって、所望する仮想音像の位置と異なる位置に仮想音像が知覚される場合がある。そこで、２つの副仮想音像の出力音量を制御することで仮想音像の位置を補正することが可能であり、これを実施の形態３として説明する。

実施の形態３における情報呈示装置について図１４及び図１５を用いて説明する。図１４は実施の形態３を示す情報呈示装置のブロック構成図である。図１５は実施の形態３における２つの副仮想音像の出力音量を制御して所望する仮想音像の位置を補正する模式図である。図１４中、図９と異なる構成としては音量補正部６である。図１４中、図９と同一符号を付したものは同一または相当部分を示す。

音量補正部６は、左右位置付与部３で説明した処理と同様、例えば、サイン則による振幅パニング法により、第１副仮想音像Ｓ１の一対の出力信号である第１副仮想音像信号Ｄ２１１ａ及び第１副仮想音像信号Ｄ２１２ａと、第２副仮想音像Ｓ２の一対の出力信号である第２副仮想音像信号Ｄ２１１ｂ及び第２副仮想音像信号Ｄ２１２ｂとの出力音量を補正し出力する。

図１５は、２つの副仮想音像の出力音量を制御して所望する仮想音像の位置を補正する模式図であり、所望する仮想音像ＳをユーザＵの左耳ＥＡＲｌの真横に位置するように補正する一例である。図１５において、第１副仮想音像Ｓ１と第２副仮想音像Ｓ２の楕円の大きさが出力音量の大きさを表している。図１５の例では、音量補正部６で音量補正することで、第２副仮想音像Ｓ２よりも第１副仮想音像Ｓ１の出力音量が大きくなるが、音量の大きな方向に仮想音像は移動するので、所望する仮想音像Ｓの位置は補正前よりも補正後の方向に移動することとなる。よって、副仮想音像の出力音量を制御することで所望する仮想音像の位置を補正することが可能となり、所望する仮想音像の位置の精度を高めることが可能となる。

なお、上記した実施の形態２及び実施の形態３では、３つのスピーカで２つの副仮想音像を生成する一例を示したが、これに限ることは無く、例えば、４つ以上のスピーカを用いても良いし、副仮想音像の数も３つ以上生成しても良く、その場合は、スピーカ数及び副仮想音像の数に応じた処理を行えば良い。

上記した実施の形態のそれぞれにおいて、音源データＤ１１０として、サンプリング周波数１６ｋＨｚのモノラル音声信号を用いたが、これに限ることは無く、例えば、サンプリング周波数２２ｋＨｚなどの異なるサンプリング周波数の音声信号を用いてもよく、また、音源データもモノラルではなくステレオ信号を用いても上述したのと同様の効果を奏する。

上記以外にも、本開示はその開示の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。

本開示に係る情報呈示装置は、例えば、車外周囲監視システムなどの車載情報システムに用いられるのに適している。例えば、実施の形態１または実施の形態２に係る情報呈示システム１０００の外部装置２００を車外周囲監視システムとした場合、各種センサＳＥＮＳが車外障害物を検出し、情報呈示システム１０００の使用者であるユーザＵに対し、障害物の検出方向及び遠近状況に応じた警告音を、仮想音像の到来方向と奥行き感として知覚できるように出力できるので、ユーザに対して適切な情報呈示ができ、更に機能が向上した車外周囲監視システムとして利用することができる。

１仮想音像位置決定部、１ａ第１仮想音像位置決定部、２仮想音像生成部、２ａ第２仮想音像生成部、２ｂ第２仮想音像生成部、３左右位置付与部、４奥行き位置付与部、５、仮想音像位置判断部、６音量補正部、１００情報呈示装置、
２００外部装置、
２０１制御回路、２０２信号入出力部、２０３信号処理回路、２０４記録媒体、２０５信号路、
２１０情報出力装置、２２０Ｄ／Ａ変換部、
３００プロセッサ、３０１ＣＰＵ、３０２メモリ、３０３記録媒体、３０４信号路

Claims

外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定する仮想音像位置決定部と、
前記ユーザに呈示するための音響信号が入力され、
前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成する仮想音像生成部、を備える情報呈示装置。
外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された３つ以上の複数のスピーカの位置情報を用いて、
２つ以上の副仮想音像の位置を決定する仮想音像位置判断部と、
前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、
前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定する仮想音像位置決定部と、
前記ユーザに呈示するための音響信号が入力され、
前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成する仮想音像生成部、を備える情報呈示装置。
前記副仮想音像の出力音量を補正して仮想音像の位置を補正する音量補正部を備えることを特徴とする、請求項２に記載の情報呈示装置。
仮想音像位置決定部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置決定部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、を備える情報呈示方法。
仮想音像位置判断部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置判断部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された３つ以上の複数のスピーカの位置情報を用いて、
２つ以上の副仮想音像の位置を決定するステップと、
仮想音像位置決定部が、前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、
前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、を備える情報呈示方法。
仮想音像位置決定部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置決定部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、をコンピュータにより実行させるための情報呈示プログラム。
仮想音像位置判断部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置判断部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された３つ以上の複数のスピーカの位置情報を用いて、
２つ以上の副仮想音像の位置を決定するステップと、
仮想音像位置決定部が、前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、
前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、をコンピュータにより実行させるための情報呈示プログラム。