JP7294561B2 - 情報呈示装置、情報呈示方法および情報呈示プログラム - Google Patents

情報呈示装置、情報呈示方法および情報呈示プログラム Download PDF

Info

Publication number
JP7294561B2
JP7294561B2 JP2023508338A JP2023508338A JP7294561B2 JP 7294561 B2 JP7294561 B2 JP 7294561B2 JP 2023508338 A JP2023508338 A JP 2023508338A JP 2023508338 A JP2023508338 A JP 2023508338A JP 7294561 B2 JP7294561 B2 JP 7294561B2
Authority
JP
Japan
Prior art keywords
sound image
virtual sound
user
sub
speakers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023508338A
Other languages
English (en)
Other versions
JPWO2022201456A1 (ja
Inventor
智治 粟野
勝 木村
耕佑 細谷
純 正田
章紘 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2022201456A1 publication Critical patent/JPWO2022201456A1/ja
Application granted granted Critical
Publication of JP7294561B2 publication Critical patent/JP7294561B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control

Description

本開示は、情報呈示装置、情報呈示方法および情報呈示プログラムに関する。
従来の情報呈示装置では、ユーザに対して状況変化を伝える方法として、効果音、警告音などのサイン音、あるいは音声ガイダンスなどの音声出力による聴覚的な情報呈示が有効な方法として広く使われている。従来の情報呈示装置はクロストークキャンセラ(Cross-Talk Canceller;CTC)を備え、上記音声出力に対して例えば、音の到来方向及び奥行き感を示す仮想音像の位置を付与するために、2つ以上のスピーカから発せられる音声出力と、事前に用意したインパルス応答から得られる伝達関数の逆行列である、クロストークキャンセラのフィルタ係数とを用いて、ユーザの両耳に届く音声出力のクロストークを消去することで、スピーカ位置と異なる位置に仮想音像を生成する技術が知られている(例えば、特許文献1参照)。
国際公開第2019/163013号
上記した従来の情報呈示装置は、必要な音の到来方向及び奥行き感を示す仮想音像の位置毎に、インパルス応答の周波数特性測定結果から得られるフィルタ係数を事前に用意しておく必要があり、インパルス応答の測定工数、インパルス応答から得られるフィルタ係数データを保持するための記憶容量が大きくかかることに加え、インパルス応答を測定した位置に対応した仮想音像しか得られず、自在に仮想音像の位置を変更することはできないといった課題があった。
本開示は、上述の課題を解決するためになされたものであり、仮想音像の位置毎のインパルス応答の周波数測定結果から得られるフィルタ係数を事前に用意することなく、外部から指定される仮想音像の位置、特に、スピーカからユーザの耳元までの間に自在に定位することが可能な音声を呈示することが可能な情報呈示装置、情報呈示方法および情報呈示プログラムを得ることを目的とする。
本開示に係る情報呈示装置は、
外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定する仮想音像位置決定部と、
前記ユーザに呈示するための音響信号が入力され、
前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成する仮想音像生成部、を備えるものである。
また、本開示に係る情報呈示装置は、
外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された3つ以上の複数のスピーカの位置情報を用いて、
2つ以上の副仮想音像の位置を決定する仮想音像位置判断部と、
前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、
前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定する仮想音像位置決定部と、
前記ユーザに呈示するための音響信号が入力され、
前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成する仮想音像生成部、を備えるものである。
また、本開示に係る情報呈示方法は、
仮想音像位置決定部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置決定部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、を備えるものである。
また、本開示に係る情報呈示方法は、
仮想音像位置判断部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置判断部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された3つ以上の複数のスピーカの位置情報を用いて、
2つ以上の副仮想音像の位置を決定するステップと、
仮想音像位置決定部が、前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、を備えるものである。
また、本開示に係る情報呈示プログラムは、
仮想音像位置決定部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置決定部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、をコンピュータにより実行させるものである。
また、本開示に係る情報呈示プログラムは、
仮想音像位置判断部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
前記仮想音像位置判断部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された3つ以上の複数のスピーカの位置情報を用いて、
2つ以上の副仮想音像の位置を決定するステップと、
仮想音像位置決定部が、前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、をコンピュータにより実行させるものである。

本開示によれば、仮想音像の位置毎に、インパルス応答の周波数特性測定結果から得られるフィルタ係数を事前に用意しておく必要がなく、外部から指定される仮想音像の位置、特に、スピーカからユーザの耳元までの間に自在に定位することが可能な音声を呈示することができ、ユーザにとって適切な情報呈示が可能となるという効果を有する。
実施の形態1を示す情報呈示装置及び情報呈示システムのブロック構成図である。 スピーカ配置データの内容を示す表である。 仮想音像生成位置を定義するための模式図である。 クロストーク量を定義するための模式図である。 クロストーク量とクロストーク消去量制御パラメータとの関係の一例を示す図である。 実施の形態1を示す情報呈示装置の処理の流れを示すフローチャートである。 実施の形態1を示す情報呈示装置のハードウェア構成の一例を示す図である。 実施の形態1を示す情報呈示装置のハードウェア構成の別の一例を示す図である。 実施の形態2を示す情報呈示装置のブロック構成図である。 実施の形態2における複数の副仮想音像から所望する仮想音像を生成する模式図である。 実施の形態2を示す情報呈示装置の処理の流れを示すフローチャートである。 実施の形態2を示す情報呈示装置のハードウェア構成の一例を示す図である。 実施の形態2を示す情報呈示装置のハードウェア構成の別の一例を示す図である。 実施の形態3を示す情報呈示装置のブロック構成図である。 実施の形態3における複数の副仮想音像の出力音量を制御して所望する仮想音像の位置を補正する模式図である。
実施の形態1.
《1-1》構成
実施の形態1における情報呈示装置について図1~図8を用いて説明する。図1は本実施の形態1を示す情報呈示装置及び情報呈示システムのブロック構成図である。図2はスピーカ配置データの内容を示す表である。図3は仮想音像生成位置を定義するための模式図である。図4はクロストーク量を定義するための模式図である。図5はクロストーク量とクロストーク消去量制御パラメータとの関係の一例を示す図である。図6は本実施の形態1を示す情報呈示装置の処理の流れを示すフローチャートである。図7は本実施の形態1を示す情報呈示装置のハードウェア構成の一例を示す図である。図8は本実施の形態1を示す情報呈示装置のハードウェア構成の別の一例を示す図である。
図1において、情報呈示システム1000は、情報呈示装置100と、外部装置200と、情報出力装置210とで構成されている。本実施の形態では説明を簡単にするために、同一平面上で直線配置した2個のスピーカの場合で動作原理を説明するが、3個以上のスピーカを用いた3次元配置の構成であっても良い。
外部装置200は、自動車あるいは鉄道等の車両のナビゲーションシステム、乗員モニタリングシステム、車外周囲監視システム等の車載情報システムIVIと、カメラ、マイクロフォン、生体センサ、超音波センサ、レーダ及びLiDAR(Light Detection And Randging)等の単一あるいは複数の状態検出手段を組み合わせた各種センサSENSとで構成されている。
各種センサSENSは、車内あるいは車外に設置され、例えば、車内の乗員の視線、眠気などの人の状態、あるいは車外の障害物、交通状況などの車内外情報D100を検出し出力する。車載情報システムIVIは、各種センサSENSで検出した車内外情報D100が入力され、乗員であるユーザUに呈示すべき情報を判断する。更に車載情報システムIVIは、ユーザUに呈示すべき情報に対応した音声信号の仮想音像の位置情報として、所定のフレーム周期T(例えば、10msec)毎に、音像位置データD101を出力すると共に、ユーザUに呈示すべき情報に対応した音声信号として、所定のフレーム周期T毎に、音源データD110を出力する。なお、以降の説明において、個々のフレームの時間順序を示すフレーム番号τは、必要な場合を除きその記載を省略し、省略されている場合は現在のフレームとして見做すこととする。
音源データD110の種類として、例えば、正弦波あるいは矩形波などのトーン音が連続あるいは断続するサイン音、あるいは音声によるガイダンス音を用いることができ、ユーザUに呈示すべき情報の種類、または状況に応じて使い分けることが可能である。サイン音の場合は言語依存性が無いので、誰にでも呈示可能な警告音を発することができる。また、音声によるガイダンス音は音に言語情報を付加することができる、すなわち、警告の意味を付加することができるので、より分かりやすい警告音を発することができる。
情報呈示装置100は、音像位置データD101及び音源データD110が入力され、ユーザUに呈示するための仮想音像信号D111及びD112を出力する。
情報出力装置210は、D/A変換部220、LスピーカSP1及びRスピーカSP2とで構成され、仮想音像信号D211をLスピーカSP1から出力すると共に、仮想音像信号D212をRスピーカSP2から出力する。
図1において、情報呈示装置100は、仮想音像位置決定部1、仮想音像生成部2とから構成される。また、仮想音像生成部2は、その内部に左右位置付与部3、奥行き位置付与部4から構成される。
(仮想音像位置決定部1)
仮想音像位置決定部1は、外部装置200が出力する音像位置データD101、スピーカ配置データベースSPDBが出力するスピーカ配置データD102を入力し、後述する仮想音像生成部2で生成する所望する仮想音像Sの位置を決定し、所望する仮想音像Sの位置情報である、左右位置パラメータD103、クロストーク消去量制御パラメータλD104を、所定のフレーム周期T毎にそれぞれ出力する。
スピーカ配置データベースSPDBは、図2に示すように、スピーカ番号毎のスピーカ位置と、後述する左右位置付与部3及び奥行き位置付与部4により生成可能な仮想音像生成位置の範囲とを記憶しており、これらの情報をスピーカ配置データD102として仮想音像位置決定部1に出力する。
(仮想音像生成位置の定義)
仮想音像位置決定部1における仮想音像の生成位置の決定方法について具体的に説明する。図3に示すように、所望する仮想音像Sの位置の座標を(x,y,z)、ユーザUの聴取範囲に配置されたLスピーカSP1の位置の座標を(x,y,z)、同様にユーザUの聴取範囲に配置されたRスピーカSP2の位置の座標を(x,y,z)、ユーザUの頭部は各スピーカに相対する向きに向いており、LスピーカSP1からユーザUまでの距離とRスピーカSP2からユーザUまでの距離は等しいものとする。また、ユーザUの左耳EARlの位置の座標を(x,y,z)、ユーザUの右耳EARrの位置の座標を(x,y,z)とする。なお、ユーザUの頭部の中心の座標を原点(0,0,0)に置き、ユーザUの頭部の0より大きい所定の幅をwとした場合、ユーザUの左耳EARl及び右耳EARrの位置の座標は、それぞれ(-w/2,0,0)、(w/2,0,0)と表現することもできる。
所望する仮想音像Sの到来方向である左右位置は、まず、ユーザUの頭部の中心と所望する仮想音像Sの位置とを結ぶ線分の延長線(図中の線l)と、2つのスピーカ位置を結ぶ水平方向の線分の延長線(図中の線l)との交点Pの座標(x,y,z)を算出する。この交点Pが左右位置付与部4により付与される、所望する仮想音像Sの到来方向である左右位置である。この交点Pの座標(x,y,z)を用いて、所望する仮想音像Sの到来方向角度θを算出すると共に、LスピーカSP1の位置の座標(x,y,z)、RスピーカSP2の位置の座標(x,y,z)、及びユーザUの位置の座標とからスピーカ位置角度θとを算出し、左右位置パラメータD103としてそれぞれ出力する。
次に、所望する仮想音像Sの奥行き位置は、例えば、次の式(1)に示す、所望する仮想音像Sの位置からユーザUの左耳EARlまでのユークリッド距離により定義される距離d、及び所望する仮想音像Sの位置からユーザUの右耳EARrまでのユークリッド距離により定義される距離dにより決定する。この距離d及び距離dを用いて、後述する目標とするクロストーク量を算出し、このクロストーク量に対応するクロストーク消去量制御パラメータλD104を算出する。
Figure 0007294561000001
(クロストーク量の定義)
ここで、クロストーク消去量制御パラメータλD104を決定するのに用いるクロストーク量を定義する。クロストーク量VCTは、図4に示すように、単一スピーカ(図4ではLスピーカSP1)で音声信号を再生する条件の下、ユーザUの左耳EARlでの受音信号Y(ω)、ユーザUの右耳EARrでの受音信号Y(ω)から次の式(2)で定義される。
Figure 0007294561000002

この式(2)は、LスピーカSP1から近い耳(すなわちユーザUの左耳EARl)で受音した信号とクロストーク信号の比でもある。なお、図3の例では、LスピーカSP1とユーザUの左耳EARlでクロストーク量を定義しているが、RスピーカSP2とユーザUの右耳EARrで定義しても良く、式(2)における、ユーザUの左耳EARlの受音信号Y(ω)が分母、ユーザUの右耳EARrでの受音信号Y(ω)が分子となり、それぞれの位置が入れ替わることとなる。
図5は、クロストーク消去量制御パラメータλD104の値を0から1まで動かした際の、ユーザUの左耳EARlにおけるクロストーク量VCTの変化の一例を示すものである。図5より、λの増加に合わせてクロストーク量VCT(縦軸)が減少、つまりクロストークを消去する量が増加していることがわかる。クロストーク消去量制御パラメータλD104は大きいほどユーザUの耳元側に仮想音像を生成し、クロストーク消去量制御パラメータλD104が小さいほどスピーカに近い位置に仮想音像を生成する。つまり、クロストーク消去量制御パラメータλD104を調整することで、ユーザUに対して奥行き位置に自在に仮想音像を生成することが可能となる。
より具体的に述べるならば、所望する仮想音像Sの位置に仮想音像を生成するためには、ユーザUの左耳での受音信号Y(ω)、ユーザUの右耳での受音信号Y(ω)の比がそれぞれの距離の逆比になるようにLスピーカSP1及びRスピーカSP2から音声信号を再生すればよい。つまり、式(2)の定義と、式(1)で得られる距離d、距離dより、クロストーク量VCTは次の式(3)の関係が成り立つ。
Figure 0007294561000003

ここで、ωは角周波数であり、Y(ω)及びY(ω)は、それぞれの受音信号をフーリエ表現したものである。
よって、図5のグラフを参照し、式(3)に示すクロストーク量VCT(縦軸)を満たすようにクロストーク消去量制御パラメータλ(横軸)を調整することで、所望する仮想音像Sの奥行き位置を制御することができる。なお、図5のクロストーク量VCTとクロストーク消去量制御パラメータλD104の関係を表すグラフを参照する以外の方法として、音響シミュレーションで直接的にクロストーク消去量制御パラメータλD104を算出してもよい。また、図5のグラフ情報は関数としてフィッティング(例えば、近似関数に変換)、もしくは量子化してテーブルとして保持してもよい。
なお、式(3)において、dあるいはdが0の場合、式(3)が不定値を取る、あるいは、クロストーク量VCTが0となるので、例外処理としてクロストーク消去量制御パラメータλは1に設定し、ユーザUの耳元に仮想音像を定位させる。
また、所望する仮想音像の位置がユーザUの正面となる場合、すなわち、dとdが等距離となる場合、式(3)のクロストーク量VCTの値が、dとdの値にかかわらず常に0となる。これを避けるため、次の式(4)を式(3)の代わりに用いることで、クロストーク量VCTと距離dとの関係を近似的に得ることができる。式(4)より、dが0となる場合はクロストーク量VCTは0となる、すなわち、ユーザUの耳元位置に所望する仮想音像Sを定位させることができ、距離dが増加するに従ってクロストーク量VCTが大きくなり、スピーカに近い位置に所望する仮想音像Sが定位することとなる。なお、dがdと同一となる場合、クロストーク量VCTは不定値を取るので、例外処理として奥行き付与を行わず、左右位置のみ付与する。
Figure 0007294561000004

ここで、dは図3に示すように、ユーザUの中心から線分lに向かって垂直に伸ばした線分の距離であり、0ではない所定の値を取る。
仮想音像生成部2は、その内部に左右位置付与部3及び奥行き位置付与部4を有しており、左右位置パラメータD103、クロストーク消去量制御パラメータλD104、音源データD110を入力し、音像の到来方向と奥行き位置を付与した仮想音像を生成する。
(左右位置付与部3)
仮想音像生成部2の内部構成である左右位置付与部3の詳細を説明する。左右位置付与部3は、音源データD110として、例えば、サンプリング周波数16kHzのモノラル音声信号smono(t)を入力すると共に、左右位置パラメータD103である、所望する仮想音像Sの到来方向角度θとスピーカ位置角度θとを入力し、仮想音像に音像の左右位置を付与する処理、すなわち、モノラル音声信号をステレオ化する共に、ステレオ化した音声信号に対し、それぞれのチャンネルの出力特性を調整することで、仮想音像の到来方向を付与する処理が為される。本実施の形態では、例えば、サイン則による振幅パニング法により、次の式(5)を満たすように、LスピーカSP1から出力する音声信号のゲインg(τ)、RスピーカSP2から出力する音声信号のゲインg(τ)をそれぞれ算出する。
Figure 0007294561000005
続いて、式(6)に示すように、モノラル音声信号smono(t)に対して、式(5)で得られたゲインg(τ)及びg(τ)を乗算することで、ステレオ化ならびに仮想音像の左右位置を付与し、LスピーカSP1から出力するための音声信号s(t)D111と、RスピーカSP2から出力するための音声信号s(t)D112とをそれぞれ出力する。
Figure 0007294561000006

ここで、tはサンプル時間、τはフレーム番号である。また、g(τ)及びg(τ)は、それぞれ0≦g(τ)≦1、0≦g(τ)≦1の値をとる変数であり、フレーム周期T毎にその値は変化する。
なお、本実施の形態では、ゲインg(τ)及びg(τ)の算出方法として、サイン則による振幅パニング法を用いているが、これに限ることは無く、例えば、タンジェント則又は線形則などのさまざまな音像定位法を用いることができる。更に、ゲインだけでは無く音声信号D111及び音声信号D112の位相も変化させても良い。例えば、音声信号D111と音声信号D112とが逆位相となるようにする、言い換えれば、音声信号D111の信号の符号を反転させることである。位相を変化させることで、所望する仮想音像Sの到来方向を、LスピーカSP1の位置とRスピーカSP2の位置とを結ぶ線分よりも外側に生成することが可能であり、所望する仮想音像Sの定位位置の範囲を広げることができる。
(奥行き位置付与部4)
続いて、奥行き位置付与部4の詳細を説明する。奥行き位置付与部4は、その内部にクロストークキャンセラCTCを有する。クロストークキャンセラCTCは、左右位置付与部3が出力するステレオ音声信号D111、D112に対して、仮想音像位置決定部1が算出したクロストーク消去量制御パラメータλD104を用いてクロストークを消去、すなわち、LスピーカSP1及びRスピーカSP2からユーザUの耳元位置までの奥行きを付与した仮想音像信号D211、D212を生成する。
(クロストークキャンセラCTCの詳細)
ここで、クロストークキャンセラCTCの詳細動作を説明する。まず、左右位置付与部3から得られた音声信号s(t)D111と音声信号s(t)D112とから、2チャンネルのステレオ音声信号d(ω,τ)を次の式(7)のように定義する。
Figure 0007294561000007

ここで、ωは角周波数、τはフレーム番号であり、S(ω,τ)、S(ω,τ)は、それぞれs(t)とs(t)とをフーリエ表現したものである。
続いて、LスピーカSP1とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARr、RスピーカSP2とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARrとの所定のインパルス応答の周波数成分を、それぞれG[1,L](ω)、G[1,R](ω)、G[2,L](ω)、G[2,R](ω)とし、次の式(8)で示す行列G(ω)を定義する。なお、LスピーカSP1とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARr、RスピーカSP2とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARrとの所定のインパルス応答については、LスピーカSP1、RスピーカSP2及びユーザUの位置を所定の位置に固定した上で、それぞれ一度だけ測定すればよい。
Figure 0007294561000008

式(8)に示したG(ω)の逆行列を取ったものが、クロストークキャンセラCTCのフィルタ係数H(ω)であり、次の式(9)で表される。
Figure 0007294561000009

ここで、H[1,L](ω)、H[1,R](ω)、H[2,L](ω)、H[2,R](ω)は、それぞれ、LスピーカSP1とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARr、RスピーカSP2とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARrのインパルス応答から得られる逆フィルタのフィルタ係数に相当する。この所定のフィルタ係数に対して、クロストーク消去量を可変とするためにクロストーク消去量制御パラメータλを導入したものを、次の式(10)で示す。
Figure 0007294561000010

ここでIは単位行列である。式(10)で得られたHλ(ω)を用いて、ステレオ音声信号d(ω,τ)からクロストークを消去、すなわち、仮想音像の奥行きを付与した音声信号d^(ω,τ)は次の式(11)で得ることができる。なお、記号”^”は、数式でのハット(hat)を表している。
Figure 0007294561000011

また、式(11)は周波数領域での表現であるので、これを時間軸での処理で表したものが式(12)であり、仮想音像信号d^(t)D211及び仮想音像信号d^(t)D212を算出する。
Figure 0007294561000012

ここで、hλ[1,L]、hλ[1,R]、hλ[2,L]、hλ[2,R]は、クロストークキャンセラCTCのクロストーク消去量を可変としたフィルタ係数Hλ(ω)の各要素を逆フーリエ変換したものであり、それぞれ、LスピーカSP1とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARr、RスピーカSP2とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARrのインパルス応答から得られる逆フィルタのフィルタ係数に相当する。以上、得られた仮想音像信号d^(t)D211、及び仮想音像信号d^(t)D212を出力する。
上記では、クロストークキャンセラCTCのフィルタ係数H(ω)の反映する比率λの制御により奥行き量の制御を行っていたが、これに限ることは無く、例えば、式(13)に示すρを用いることでクロストーク量を直接制御することも可能である。
Figure 0007294561000013

ここで、ρは図5で示したλと同様に0から1までの間の値をとるとき、前出のλと同等の効果を得られ、値が1に近いほどクロストーク量が減少する。式(13)ではフィルタ係数Hρ(ω)の対角成分はパラメータρで制御せず、制御箇所が少ないので扱いやすくなり、フィルタ係数Hρ(ω)の調整工数を削減できる効果がある。
また、ρに関しては0から1の値のみならず、負の値、もしくは1より大きい値を適用してもよい。その場合、クロストークが増加、もしくは逆相のクロストークを得ることとなるが、それぞれ音像が狭くなる効果、音像の拡がり感が得られる効果がある。
式(13)で得られたHρ(ω)を用いて、ステレオ音声信号d(ω,τ)からクロストークを消去、すなわち、仮想音像の奥行きを付与した音声信号d^(ω,τ)は次の式(14)で得ることができる。
Figure 0007294561000014

また、式(11)と同様に、式(14)は周波数領域での表現であるので、これを時間軸での処理で表したものが式(15)であり、仮想音像信号d^(t)D211及び仮想音像信号d^(t)D212を算出する。
Figure 0007294561000015

ここで、hρ[1,L]、hρ[1,R]、hρ[2,L]、hρ[2,R]は、クロストークキャンセラCTCのクロストーク消去量を可変としたフィルタ係数Hρ(ω)の各要素を逆フーリエ変換したものであり、それぞれ、LスピーカSP1とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARr、RスピーカSP2とユーザUの左耳EARl、RスピーカSP2とユーザUの右耳EARrのインパルス応答から得られる逆フィルタのフィルタ係数に相当する。以上、得られた仮想音像信号d^(t)D211、及び仮想音像信号d^(t)D212を出力する。
D/A変換部220は、サンプリングされたデジタル信号である仮想音像信号 d^(t)D211、及び仮想音像信号d^(t)D212をアナログ信号へ変換し、スピーカで再生可能なレベルに増幅した後、仮想音像信号d^(t)D211をLスピーカSP1から音声出力すると共に、仮想音像信号d^(t)D212をRスピーカSP2から音声出力する。なお、仮想音像信号D211と仮想音像信号D212は時間ずれ無く同じタイミングで音声出力する。
《1-2》処理動作
続いて、実施の形態1の情報呈示装置の処理動作について図6を用いて説明する。図6は、本実施の形態1を示す情報呈示装置100の処理の流れを示すフローチャートである。(A)はステップST1とステップST2の処理の流れを示し、(B)はステップST2中の内部処理であるステップST2AとステップST2Bの処理の流れを示す。
(ステップST1)
まず、ステップST1で、仮想音像位置決定部1において、外部装置200が出力する音像位置データD101を読み込むと共に、スピーカ配置データベースSPDBが出力するスピーカ配置データD102を読み込み、後述するステップST2の処理で生成する所望する仮想音像Sの位置を決定し、仮想音像の位置情報である、左右位置パラメータD103、クロストーク消去量制御パラメータλD104をそれぞれ出力する。
(ステップST2)
ステップST2では、仮想音像生成部2において、左右位置パラメータD103、クロストーク消去量制御パラメータλD104、音源データD110を読み込み、後述するステップST2A、ステップST2Bの処理を順次行い、音像の到来方向と奥行き位置を付与した仮想音像を生成し出力する。
(ステップST2A)
ステップST2Aでは、左右位置付与部3において、左右位置パラメータD103と、音源データD110とを読み込み、仮想音像に音像の左右位置を付与する処理、すなわち、モノラル音声信号をステレオ化する共に、ステレオ化した音声信号に対し、それぞれのチャンネルの出力特性を調整することで、仮想音像の到来方向を付与する処理が為される。その後、Lスピーカ11から出力するための音声信号s(t)D111と、Rスピーカ12から出力するための音声信号s(t)D112とをそれぞれ生成し出力する。
(ステップST2B)
ステップST2Bでは、音声信号D111と、音声信号D112とを読み込み、クロストークキャンセラにおいて、ステップST1の処理で音像位置決定部1が算出したクロストーク消去量制御パラメータλD104を用いてクロストークを消去、すなわち、LスピーカSP1及びRスピーカSP2からユーザUの耳元位置までの奥行きを付与した仮想音像信号d^(t)D211、仮想音像信号d^(t)D212とをそれぞれ生成し出力する。ステップST2Bの処理が完了した後、ステップST1の処理に戻る。
《1-3》ハードウェア構成
(ハードウェア)
図1に示される情報呈示装置100の各構成は、CPU(Central Processing Unit)内蔵の情報処理装置であるコンピュータで実現可能である。CPU内蔵のコンピュータは、例えば、スマートフォン又はタブレットタイプの可搬型コンピュータ、カーナビゲーションシステム、乗員モニタリングシステム又は計器盤(インストルメントパネル)システム、車外周囲監視装置などの車載情報システムの機器組み込み用途のマイクロコンピュータ、及びSoC(System on Chip)などである。
また、図1に示される情報呈示装置100の各構成は、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、又はFPGA(Field-Programmable Gate Array)などの電気回路であるLSI(Large Scale Integrated circuit)により実現されてもよい。また、図1に示される情報呈示装置100の各構成は、コンピュータとLSIの組み合わせであってもよい。
図7は、DSP、ASIC又はFPGAなどのLSIを用いて構成される情報呈示装置100のハードウェア構成の例を示すブロック図である。図7の例では、情報呈示装置100は、制御回路201と信号入出力部202、を備えている。制御回路201は、信号処理回路203、記録媒体204、及びバスなどの信号路205を備える。信号入出力部202は、D/A変換部220とスピーカ及びアンプで構成される情報出力装置210、ならびにカーナビゲーションシステム、乗員モニタリングシステム、計器盤システム、車外周囲監視装置などの車載情報システムで構成される外部装置200との接続機能を実現するインタフェース回路である。
図1に示される仮想音像位置決定部1、仮想音像生成部2の各構成は、信号処理回路203と記録媒体204とを有する制御回路201で実現することができる。
記録媒体204は、信号処理回路203の各種設定データ及び信号データなどの各種データを蓄積するために使用される。記録媒体204としては、例えば、SDRAM(Synchronous DRAM)などの揮発性メモリ、HDD(Hard Disk Drive)又はSSD(Solid State Drive)などの不揮発性メモリを使用することが可能である。記録媒体204には、例えば、情報呈示処理の初期状態及び各種設定データ、制御用の定数データ等が記憶される。
(コンピュータプログラム構成)
一方、図8は、コンピュータ等の演算装置を用いて構成される情報呈示装置100のハードウェア構成の例を示すブロック図である。図8の例では、情報呈示装置100の制御回路201は、CPU301を内蔵するプロセッサ300、メモリ302、記録媒体303、及びバスなどの信号路304を備えている。
メモリ302は、実施の形態1の情報呈示処理を実現するための各種プログラムを記憶するプログラムメモリ、プロセッサがデータ処理を行う際に使用するワークメモリ、及び信号データを展開するメモリ等として使用するROM(Read Only Memory)及びRAM(Random Access Memory)等の記憶手段である。
図1に示される、仮想音像位置決定部1、仮想音像生成部2の各機能は、制御回路201の内部構成である、プロセッサ300、メモリ302、及び記録媒体303で実現することができる。
記録媒体303は、プロセッサ300の各種設定データ及び信号データなどの各種データを蓄積するために使用される。記録媒体303としては、例えば、SDRAMなどの揮発性メモリ、HDD又はSSD等の不揮発性メモリを使用することが可能である。OS(Operating System)を含む起動プログラム及び、各種設定データ、音響信号データ等の各種データを蓄積することができる。なお、この記録媒体303に、メモリ302内のデータを蓄積しておくこともできる。
プロセッサ300は、メモリ302中のRAMを作業用メモリとして使用し、メモリ302中のROMから読み出されたコンピュータ・プログラム(すなわち、情報呈示プログラム)に従って動作することにより、仮想音像位置決定部1、仮想音像生成部2の情報呈示処理を実行することができる。
情報呈示装置100を実行するプログラムは、ソフトウエアプログラムを実行するコンピュータ内部の記憶装置に記憶していてもよいし、CD-ROMあるいはフラッシュメモリ等のコンピュータで読み取り可能な外部記憶媒体にて配布される形式で保持され、コンピュータ起動時に読み込んで動作させてもよい。また、LAN(Local Area Network)等の無線及び有線ネットワークを通じて他のコンピュータからプログラムを取得することも可能である。さらに、情報呈示装置100に接続される情報出力装置210及び外部装置200に関しても、アナログ・デジタル変換などを介せずに、無線又は有線ネットワークを通じて各種データをデジタル信号のまま送受信してもよい。
また、情報呈示装置100を実行するプログラムは、外部装置200で実行されるプログラム、例えば、カーナビゲーション、乗員モニタリングシステム、計器盤装置、車外周囲監視装置を実行するプログラムとソフトウェア上で結合し、同一のコンピュータで動作させることも可能であるし、又は、複数のコンピュータ上で分散処理することも可能である。
以上、説明した実施の形態1の構成による情報呈示装置は、複数のスピーカのそれぞれの出力特性を仮想音像の位置情報に応じて制御すると共に、クロストークキャンセラのクロストーク消去量を仮想音像とユーザの耳元までの距離情報に応じて制御することにより、仮想音像の到来方向及び奥行き位置を可変としたので、事前調整を必要とせずに、外部から指定される仮想音像の位置、特に、スピーカからユーザの耳元の間に自在に定位することが可能な音声を呈示することができる効果を奏する。
また、実施の形態1の構成による情報呈示装置は、複数のスピーカのそれぞれの出力特性を仮想音像の位置情報に応じて制御すると共に、クロストークキャンセラのクロストーク消去量を仮想音像とユーザの耳元までの距離情報に応じて制御することにより、仮想音像の到来方向及び奥行き位置を可変としたので、仮想音像の位置毎に、インパルス応答の周波数特性測定結果から得られるフィルタ係数を事前に用意しておく必要が無く、インパルス応答の測定工数、及びインパルス応答から得られるフィルタ係数データを保持するための記憶容量を削減することができ、装置設計時間及び装置規模などの各種コストを低減する効果も奏する。
実施の形態2.
《2-1》構成
上記した実施の形態1では、LスピーカSP1とRスピーカSP2の2つのスピーカを用いて所望する仮想音像の到来方向と奥行き位置を制御していたが、これに限ることは無く、3つ以上のスピーカを用いて2つ以上の副仮想音像を生成し、それらを同時に出力して合成することで、2つのスピーカでは生成できないような位置に所望する仮想音像を生成することが可能であり、これを実施の形態2として説明する。
実施の形態2における情報呈示装置について図9~図13を用いて説明する。図9は実施の形態2を示す情報呈示装置のブロック構成図である。図10は実施の形態2における複数の副仮想音像から所望する仮想音像を生成する模式図である。図11は本実施の形態2を示す情報呈示装置の処理の流れを示すフローチャートである。図12は本実施の形態2を示す情報呈示装置のハードウェア構成の一例を示す図である。図13は本実施の形態1を示す情報呈示装置のハードウェア構成の別の一例を示す図である。図9中、図1と異なる構成としては第1副仮想音像位置決定部1a、第1副仮想音像位置生成部2a、第2副仮想音像位置決定部1b、第2副仮想音像生成部2b、副仮想音像位置判断部5である。図9中、図1と同一符号を付したものは同一または相当部分を示す。BスピーカSP3は、ユーザUの聴取範囲かつユーザUの後方に配置されている。
副仮想音像位置判断部5は、外部装置200が出力する音像位置データD101を入力すると共に、スピーカ配置データベースSPDBが出力するスピーカ配置データD102を入力し、音像位置データD101が指定する所望の仮想音像Sの位置と、スピーカ配置データD102のスピーカ位置と仮想音像生成可能範囲とから、第1副仮想音像S1の位置と第2副仮想音像S2の位置を判断すると共に、第1副仮想音像S1と第2副仮想音像S2とを生成するのに必要なスピーカ番号を判断する。この判断結果に基づいて、副仮想音像位置判断部5は、第1副音像位置データD101aと、第2副音像位置データD101bとを出力する。
第1副仮想音像位置決定部1aは、実施の形態1の仮想音像位置決定部1と同等の機能を有しており、第1副音像位置データD101a、スピーカ配置データD102を入力し、第1副仮想音像生成部2aで生成する第1副仮想音像S1の位置を決定し、第1副仮想音像の位置情報である、左右位置パラメータD103a、クロストーク消去量制御パラメータλD104aを、所定のフレーム周期T毎にそれぞれ出力する。
第2副仮想音像位置決定部1bは、実施の形態1の仮想音像位置決定部1と同等の機能を有しており、第2副音像位置データD101b、スピーカ配置データD102を入力し、第2副仮想音像生成部2bで生成する第2副仮想音像S2の位置を決定し、第2副仮想音像S2の位置情報である、左右位置パラメータD103b、クロストーク消去量制御パラメータλD104bを、所定のフレーム周期T毎にそれぞれ出力する。
第1副仮想音像生成部2aは、実施の形態1の仮想音像生成部2と同等の機能を有しており、左右位置パラメータD103a、クロストーク消去量制御パラメータλD104a、音源データD110を入力し、音像の到来方向と奥行き位置を付与した第1副仮想音像S1を生成し、得られた第1副仮想音像信号D211a、及び第1副仮想音像信号D212aを出力する。
第2副仮想音像生成部2bは、実施の形態1の仮想音像生成部2と同等の機能を有しており、左右位置パラメータD103b、クロストーク消去量制御パラメータλD104b、音源データD110を入力し、音像の到来方向と奥行き位置を付与した第2副仮想音像S2を生成し、得られた第2副仮想音像信号D211b、及び第2副仮想音像信号D212bを出力する。
D/A変換部220は、第1副仮想音像信号D211a、第1副仮想音像信号D212a、第2副仮想音像信号D211b、及び第2副仮想音像信号D212bをそれぞれアナログ信号へ変換し、スピーカで再生可能なレベルに増幅した後、第1副仮想音像信号D211aをLスピーカSP1から、第1副仮想音像信号D212aをRスピーカSP2から、第2副仮想音像信号D211bをBスピーカSP3から、第2副仮想音像信号D212bをLスピーカSP1から、それぞれ音声出力する。なお、これらの副仮想音像信号は全て時間ずれ無く同じタイミングで音声出力する。
図10は、上述した一連の処理によって生成した第1副仮想音像S1と第2副仮想音像S2により、所望する仮想音像Sを新たに生成する模式図である。図10に示すように、第1副仮想音像S1と第2副仮想音像S2を3つのスピーカからユーザUに向けて同時に出力することで、ユーザUは聴感的に所望する仮想音像Sの位置に合成音像があるように知覚することができる。この方法により、2つのスピーカでは生成できないような位置、特に、図10に示すように、ユーザUの左耳の真横方向に奥行きを持つような仮想音像を生成することが可能である。
《2-2》処理動作
続いて、実施の形態2の情報呈示装置の処理動作について図11を用いて説明する。図11は、本実施の形態2を示す情報呈示装置100の処理の流れを示すフローチャートである。
(ステップST1)
まず、ステップST1では、副仮想音像位置判断部5において、外部装置200が出力する音像位置データD101を読み込むと共に、スピーカ配置データベースSPDBが出力するスピーカ配置データD102を読み込み、音像位置データD101が指定する所望の仮想音像Sの位置と、スピーカ配置データD102のスピーカ位置と仮想音像生成可能範囲とから、第1副仮想音像S1の位置と第2副仮想音像S2の位置を判断する処理を行うと共に、第1副仮想音像S1と第2副仮想音像S2とを生成するのに必要なスピーカ番号を判断する処理を行う。この判断結果に基づいて、後述するステップST2A及びステップST2Bの処理で用いる、第1副音像位置データD101aと、第2副音像位置データD101bとを出力する。
(ステップST2A)
ステップST2Aでは、第1副仮想音像位置決定部1aにおいて、第1副音像位置データD101aと、スピーカ配置データD102とを読み込み、第1副仮想音像S1の位置を決定する処理を行い、第1副仮想音像の位置情報である、左右位置パラメータD103a、クロストーク消去量制御パラメータλD104aを、所定のフレーム周期T毎にそれぞれ出力する。
(ステップST2B)
ステップST2Bでは、第2副仮想音像位置決定部1bにおいて、第2副音像位置データD101b、スピーカ配置データD102を入力し、第2副仮想音像S2の位置を決定する処理を行い、第2副仮想音像S2の位置情報である、左右位置パラメータD103b、クロストーク消去量制御パラメータλD104bを、所定のフレーム周期T毎にそれぞれ出力する。
(ステップST3A)
ステップST3Aでは、第1副仮想音像生成部2aにおいて、左右位置パラメータD103a、クロストーク消去量制御パラメータλD104a、音源データD110を入力し、音像の到来方向と奥行き位置を付与した第1副仮想音像S1を生成する処理を行い、得られた第1副仮想音像信号D211a、及び第1副仮想音像信号D212aを出力する。
(ステップST3B)
ステップST3Bでは、第2副仮想音像生成部2bにおいて、左右位置パラメータD103b、クロストーク消去量制御パラメータλD104b、音源データD110を入力し、音像の到来方向と奥行き位置を付与した第2副仮想音像S2を生成する処理を行い、得られた第2副仮想音像信号D211b、及び第2副仮想音像信号D212bを出力する。ステップST3Bの処理が完了した後、ステップST1の処理に戻る。
なお、上述したステップST2AとステップST2Bの処理については順不同であり、ステップST2Bの処理をステップST2Aの処理よりも先に実行しても良いし、両ステップの処理を同時に実行しても良い。また、ステップST3AとステップST3Bの処理も順不同であり、ステップST3Bの処理をステップST3Aの処理よりも先に実行しても良いし、両ステップの処理を同時に実行しても良い。
《2-3》ハードウェア構成
(ハードウェア)
図9に示される情報呈示装置100の各構成は、実施の形態1で示したのと同様に、CPU内蔵の情報処理装置であるコンピュータで実現可能である。CPU内蔵のコンピュータは、例えば、スマートフォン又はタブレットタイプの可搬型コンピュータ、カーナビゲーションシステム、乗員モニタリングシステム又は計器盤(インストルメントパネル)システム、車外周囲監視装置などの車載情報システムの機器組み込み用途のマイクロコンピュータ、及びSoCなどである。
また、図9に示される情報呈示装置100の各構成は、実施の形態1で示したのと同様に、DSP、ASIC、又はFPGAなどの電気回路であるLSIにより実現されてもよい。また、図9に示される情報呈示装置100の各構成は、コンピュータとLSIの組み合わせであってもよい。
図12は、DSP、ASIC又はFPGAなどのLSIを用いて構成される情報呈示装置100のハードウェア構成の例を示すブロック図である。図12中、図7と同一符号を付したものは同一または相当部分を示すものとし、またそれらの構成は実施の形態1で示したのと同等であるので説明を省略する。
図9に示される、副仮想音像位置判断部5、第1副仮想音像位置決定部1a、第2副仮想音像位置決定部1b、第1副仮想音像生成部2a、第2副仮想音像生成部2bの各構成は、図12に示す、信号処理回路203と記録媒体204とを有する制御回路201で実現することができる。
(コンピュータプログラム構成)
一方、図13は、コンピュータ等の演算装置を用いて構成される情報呈示装置100のハードウェア構成の例を示すブロック図である。図13中、図8と同一符号を付したものは同一または相当部分を示すものとし、またそれらの構成は実施の形態1で示したのと同等であるので説明を省略する。
図9に示される、副仮想音像位置判断部5、第1副仮想音像位置決定部1a、第2副仮想音像位置決定部1b、第1副仮想音像生成部2a、第2副仮想音像生成部2bの各機能は、制御回路201の内部構成である、プロセッサ300、メモリ302、及び記録媒体303で実現することができる。
プロセッサ300は、メモリ302中のRAMを作業用メモリとして使用し、メモリ302中のROMから読み出されたコンピュータ・プログラム(すなわち、情報呈示プログラム)に従って動作することにより、副仮想音像位置判断部5、第1副仮想音像位置決定部1a、第2副仮想音像位置決定部1b、第1副仮想音像生成部2a、第2副仮想音像生成部2bの情報呈示処理を実行することができる。
情報呈示装置100を実行するプログラムは、ソフトウエアプログラムを実行するコンピュータ内部の記憶装置に記憶していてもよいし、CD-ROMあるいはフラッシュメモリ等のコンピュータで読み取り可能な外部記憶媒体にて配布される形式で保持され、コンピュータ起動時に読み込んで動作させてもよい。また、LAN(Local Area Network)等の無線及び有線ネットワークを通じて他のコンピュータからプログラムを取得することも可能である。さらに、情報呈示装置100に接続される情報出力装置210及び外部装置200に関しても、アナログ・デジタル変換などを介せずに、無線又は有線ネットワークを通じて各種データをデジタル信号のまま送受信してもよい。
また、情報呈示装置100を実行するプログラムは、外部装置200で実行されるプログラム、例えば、カーナビゲーション、乗員モニタリングシステム、計器盤装置、車外周囲監視装置を実行するプログラムとソフトウェア上で結合し、同一のコンピュータで動作させることも可能であるし、又は、複数のコンピュータ上で分散処理することも可能である。
以上、説明した実施の形態2の構成による情報呈示装置は、所望する仮想音像の位置と3つのスピーカ位置とから2つの副仮想音像位置を決定し、3つのスピーカのそれぞれの出力特性を2つの副仮想音像の位置情報に応じて制御すると共に、クロストークキャンセラのクロストーク消去量を2つの副仮想音像とユーザの耳元までの距離情報に応じて制御することで2つの副仮想音像を生成し、生成された2つの副仮想音像をユーザに同時に知覚させることで、ユーザに対して所望する仮想音像位置に仮想音像を呈示することができる上、2つのスピーカでは生成できないような位置、特に、ユーザの真横方向に奥行きを持つような仮想音像を生成できるという顕著な効果を奏する。
実施の形態3.
上記した実施の形態2では、2つの副仮想音像を生成し、生成された2つの副仮想音像をユーザに同時に知覚させることで、ユーザに対して所望する仮想音像位置に仮想音像を呈示していたが、ユーザの頭部の大きさあるいは位置の違いによって、所望する仮想音像の位置と異なる位置に仮想音像が知覚される場合がある。そこで、2つの副仮想音像の出力音量を制御することで仮想音像の位置を補正することが可能であり、これを実施の形態3として説明する。
実施の形態3における情報呈示装置について図14及び図15を用いて説明する。図14は実施の形態3を示す情報呈示装置のブロック構成図である。図15は実施の形態3における2つの副仮想音像の出力音量を制御して所望する仮想音像の位置を補正する模式図である。図14中、図9と異なる構成としては音量補正部6である。図14中、図9と同一符号を付したものは同一または相当部分を示す。
音量補正部6は、左右位置付与部3で説明した処理と同様、例えば、サイン則による振幅パニング法により、第1副仮想音像S1の一対の出力信号である第1副仮想音像信号D211a及び第1副仮想音像信号D212aと、第2副仮想音像S2の一対の出力信号である第2副仮想音像信号D211b及び第2副仮想音像信号D212bとの出力音量を補正し出力する。
図15は、2つの副仮想音像の出力音量を制御して所望する仮想音像の位置を補正する模式図であり、所望する仮想音像SをユーザUの左耳EARlの真横に位置するように補正する一例である。図15において、第1副仮想音像S1と第2副仮想音像S2の楕円の大きさが出力音量の大きさを表している。図15の例では、音量補正部6で音量補正することで、第2副仮想音像S2よりも第1副仮想音像S1の出力音量が大きくなるが、音量の大きな方向に仮想音像は移動するので、所望する仮想音像Sの位置は補正前よりも補正後の方向に移動することとなる。よって、副仮想音像の出力音量を制御することで所望する仮想音像の位置を補正することが可能となり、所望する仮想音像の位置の精度を高めることが可能となる。
なお、上記した実施の形態2及び実施の形態3では、3つのスピーカで2つの副仮想音像を生成する一例を示したが、これに限ることは無く、例えば、4つ以上のスピーカを用いても良いし、副仮想音像の数も3つ以上生成しても良く、その場合は、スピーカ数及び副仮想音像の数に応じた処理を行えば良い。
上記した実施の形態のそれぞれにおいて、音源データD110として、サンプリング周波数16kHzのモノラル音声信号を用いたが、これに限ることは無く、例えば、サンプリング周波数22kHzなどの異なるサンプリング周波数の音声信号を用いてもよく、また、音源データもモノラルではなくステレオ信号を用いても上述したのと同様の効果を奏する。
上記以外にも、本開示はその開示の範囲内において、実施の形態の任意の構成要素の変形、もしくは実施の形態の任意の構成要素の省略が可能である。
本開示に係る情報呈示装置は、例えば、車外周囲監視システムなどの車載情報システムに用いられるのに適している。例えば、実施の形態1または実施の形態2に係る情報呈示システム1000の外部装置200を車外周囲監視システムとした場合、各種センサSENSが車外障害物を検出し、情報呈示システム1000の使用者であるユーザUに対し、障害物の検出方向及び遠近状況に応じた警告音を、仮想音像の到来方向と奥行き感として知覚できるように出力できるので、ユーザに対して適切な情報呈示ができ、更に機能が向上した車外周囲監視システムとして利用することができる。
1 仮想音像位置決定部、1a 第1仮想音像位置決定部、2 仮想音像生成部、2a 第2仮想音像生成部、2b 第2仮想音像生成部、3 左右位置付与部、4 奥行き位置付与部、5、仮想音像位置判断部、6 音量補正部、100 情報呈示装置、
200 外部装置、
201 制御回路、202 信号入出力部、203 信号処理回路、204 記録媒体、205 信号路、
210 情報出力装置、220 D/A変換部、
300 プロセッサ、301 CPU、302 メモリ、303 記録媒体、304 信号路

Claims (7)

  1. 外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
    前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
    前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定する仮想音像位置決定部と、
    前記ユーザに呈示するための音響信号が入力され、
    前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
    前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
    前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成する仮想音像生成部、を備える情報呈示装置。
  2. 外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
    前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された3つ以上の複数のスピーカの位置情報を用いて、
    2つ以上の副仮想音像の位置を決定する仮想音像位置判断部と、
    前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、
    前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
    前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定する仮想音像位置決定部と、
    前記ユーザに呈示するための音響信号が入力され、
    前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
    前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
    前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成する仮想音像生成部、を備える情報呈示装置。
  3. 前記副仮想音像の出力音量を補正して仮想音像の位置を補正する音量補正部を備えることを特徴とする、請求項2に記載の情報呈示装置。
  4. 仮想音像位置決定部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
    前記仮想音像位置決定部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
    前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
    仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
    前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
    前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
    前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、を備える情報呈示方法。
  5. 仮想音像位置判断部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
    前記仮想音像位置判断部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された3つ以上の複数のスピーカの位置情報を用いて、
    2つ以上の副仮想音像の位置を決定するステップと、
    仮想音像位置決定部が、前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、
    前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
    前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
    仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
    前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
    前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
    前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、を備える情報呈示方法。
  6. 仮想音像位置決定部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
    前記仮想音像位置決定部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された複数のスピーカの位置情報を用いて、前記仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
    前記入力された前記仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
    仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
    前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
    前記到来方向における左右位置を付与した仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
    前記複数のスピーカから出力される前記音響信号の、前記仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、をコンピュータにより実行させるための情報呈示プログラム。
  7. 仮想音像位置判断部に、外部から指定される、ユーザに呈示する仮想音像の位置情報が入力され、
    前記仮想音像位置判断部が、前記入力された前記仮想音像の位置情報、及び前記ユーザの聴取範囲に配置された3つ以上の複数のスピーカの位置情報を用いて、
    2つ以上の副仮想音像の位置を決定するステップと、
    仮想音像位置決定部が、前記副仮想音像の位置情報と、前記複数のスピーカの位置情報とを用いて、
    前記副仮想音像の到来方向からの音像を生成するように前記複数のスピーカのそれぞれの左右位置パラメータを決定する共に、
    前記副仮想音像の位置情報と、前記ユーザの耳元位置とから得られる距離情報とを用いて、前記副仮想音像の奥行き位置に仮想音像を生成するようにクロストーク消去量制御パラメータを決定するステップと、
    仮想音像生成部に、前記ユーザに呈示するための音響信号が入力され、
    前記仮想音像生成部が、前記音響信号と前記仮想音像位置決定部により決定された前記左右位置パラメータを用いて、前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の到来方向における左右位置を付与した仮想音像を生成し、
    前記到来方向における左右位置を付与した副仮想音像に対し、前記クロストーク消去量制御パラメータを用いてクロストーク消去を行い、
    前記複数のスピーカから出力される前記音響信号の、前記副仮想音像の前記ユーザ耳元位置までの奥行き位置を付与した仮想音像を生成するステップ、をコンピュータにより実行させるための情報呈示プログラム。
JP2023508338A 2021-03-25 2021-03-25 情報呈示装置、情報呈示方法および情報呈示プログラム Active JP7294561B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/012653 WO2022201456A1 (ja) 2021-03-25 2021-03-25 情報呈示装置、情報呈示方法および情報呈示プログラム

Publications (2)

Publication Number Publication Date
JPWO2022201456A1 JPWO2022201456A1 (ja) 2022-09-29
JP7294561B2 true JP7294561B2 (ja) 2023-06-20

Family

ID=83395490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023508338A Active JP7294561B2 (ja) 2021-03-25 2021-03-25 情報呈示装置、情報呈示方法および情報呈示プログラム

Country Status (2)

Country Link
JP (1) JP7294561B2 (ja)
WO (1) WO2022201456A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017135669A (ja) 2016-01-29 2017-08-03 沖電気工業株式会社 音響再生装置及びプログラム
WO2018207478A1 (ja) 2017-05-09 2018-11-15 株式会社ソシオネクスト 音声処理装置及び音声処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017135669A (ja) 2016-01-29 2017-08-03 沖電気工業株式会社 音響再生装置及びプログラム
WO2018207478A1 (ja) 2017-05-09 2018-11-15 株式会社ソシオネクスト 音声処理装置及び音声処理方法

Also Published As

Publication number Publication date
JPWO2022201456A1 (ja) 2022-09-29
WO2022201456A1 (ja) 2022-09-29

Similar Documents

Publication Publication Date Title
JP7139409B2 (ja) 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成
EP3320692B1 (en) Spatial audio processing apparatus
JP7183467B2 (ja) 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成
JP5603325B2 (ja) マイクロホン配列からのサラウンド・サウンド生成
US10477337B2 (en) Audio processing device and method therefor
CN112205006B (zh) 音频内容的自适应再混合
RU2693312C2 (ru) Устройство и способ генерирования выходного сигнала, имеющего по меньшей мере два выходных канала
US8638947B2 (en) Angle-dependent operating device or method for generating a pseudo-stereophonic audio signal
US20080298597A1 (en) Spatial Sound Zooming
EP3133833B1 (en) Sound field reproduction apparatus, method and program
KR101669866B1 (ko) 음향 신호 조정
JP6870078B2 (ja) 動的サウンド調整のための雑音推定
JP2009512364A (ja) 仮想オーディオシミュレーション
WO2014207990A1 (ja) 制御装置、及び、制御方法
CN107925814B (zh) 生成提升声音印象的方法和设备
JP2010541449A (ja) ヘッドホン再生に関する方法、ヘッドホン再生システム、コンピュータプログラム
WO2019198123A1 (ja) ナビゲーション装置及びナビゲーション方法
JP5010148B2 (ja) 3次元パンニング装置
JP7294561B2 (ja) 情報呈示装置、情報呈示方法および情報呈示プログラム
CN108535694A (zh) 活动说话者的位置估计
CN115303179A (zh) 车辆的主动式声浪设计调节装置及其方法
JP2021013063A (ja) オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
KR20200076365A (ko) 차량 및 그 제어방법
AU2015255287B2 (en) Apparatus and method for generating an output signal employing a decomposer
CN114401481B (zh) 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230227

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230522

R151 Written notification of patent or utility model registration

Ref document number: 7294561

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151