JP2006333067A - 音像位置定位方法、音像位置定位装置 - Google Patents

音像位置定位方法、音像位置定位装置 Download PDF

Info

Publication number
JP2006333067A
JP2006333067A JP2005153821A JP2005153821A JP2006333067A JP 2006333067 A JP2006333067 A JP 2006333067A JP 2005153821 A JP2005153821 A JP 2005153821A JP 2005153821 A JP2005153821 A JP 2005153821A JP 2006333067 A JP2006333067 A JP 2006333067A
Authority
JP
Japan
Prior art keywords
sound
sound image
reverberation
image position
sound pressure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005153821A
Other languages
English (en)
Inventor
Takashi Uematsu
尚 植松
Yoichi Haneda
陽一 羽田
Akitoshi Kataoka
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005153821A priority Critical patent/JP2006333067A/ja
Publication of JP2006333067A publication Critical patent/JP2006333067A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音声の明瞭度を低下させずに知覚される音像の距離を正確に制御する。
【解決手段】複数の話者の中の1人を基準話者と定め、この基準話者の音像位置を基準音像位置と定める。基準話者と定めた話者の音源位置を聴取位置から最も近い位置に設定し、それ以外の話者の音像位置を基準話者位置より遠方に設定し、遠方に設定した話者の音圧レベルを基準話者の音圧レベルより小さくすると共に残響を付加することで、音圧レベルの相対的な差と残響量の違いにより基準位置より遠方に音像を定位させる。
【選択図】図1

Description

本発明は、オーディオ信号を再生する音響機器、通信機器にあって、特にスピーカの位置によらずに、任意の位置に音像を定位させる音像位置定位方法及び音像位置定位装置に関する。
スピーカの位置に関わらず、音像の位置を空間の任意の場所に存在するかのように知覚させる三次元音像定位については、これまでに多くの手法が提案されている。ステレオスピーカの左右の音圧レベルを変化させることで、その二つのスピーカ間の任意の場所に音像を知覚させる方法から始まり、近年では、音を知覚させたい場所から聴取者の耳元までの空間伝達関数(以後、頭部伝達関数と呼ぶ)を精密に測定し、この頭部伝達関数を音源の情報に加えることであたかもその場所から音が出ているように知覚させる方法が提案されている(非特許文献1)。
この技術の簡単な構成を図3に示す。ここで、制御用フィルタ10の伝達関数をX、X、スピーカ11から耳元までの伝達関数をH11、H12、H21、H22、実現すべき音源12から耳元までの伝達関数をD、Dとする。ただしX、H、Dのそれぞれは周波数の関数である。また、音源12の周波数スペクトルをSとすると、制御用フィルタ10の伝達関数は式(1)をXについて解くことで求められる。
Figure 2006333067
この際、通常一般化逆行列を用いて自乗誤差最小の規範で求められる。
一方、音源が遠くにある場合と、近くの場合とを比べると、遠くにある場合には一般に部屋の残響の影響が大きく加味されることを利用して、直接音と間接音の比率を操作することで音源の位置の遠近感を制御する方法も提案されている(非特許文献2)。これは、左右に設置した2つのスピーカによって、その間に音像を知覚させることと同様に、聴取者から直線上に並んだ距離の異なる2つのスピーカを用いて知覚される音像の距離を操作するものである。この場合、聴取位置での音圧を一定にしたまま遠近の2つのスピーカのレベル比を操作することで直接音と間接音(残響音)の比率(直間比)を変化させ、知覚される音像の距離感を制御するというものである。この場合、音源が近くにある場合と遠くにある場合、及びその中間にある場合には、直間比をC値で表現するとそれぞれC=25dB、C=10dB、C=15dB程度であることが知られている。
イエンス ブラウエルト、森本政之、後藤敏幸「空間音響、204〜206項、鹿島出版会、昭和61年7月10日」 中山靖茂、梅田哲夫、西降司「スピーカアレイを用いた音像位置制御に関する基礎検討」信学技報 TECNICAL REPORT OF IEICE. EA2000-23(200-7)
以上で述べたように、音の音像位置を任意の場所に存在するかのように知覚させる技術はこれまでにもあるが、以下に述べるように実用上は様々な問題を含んでいる。まず左右に設置した2つのスピーカの音圧レベルを変化させる方法では、2つのスピーカ間でのみ音像を知覚させることが可能であるものの、左右、あるいは前後方向に任意の場所に音像を知覚させることは原理的に不可能である。また、頭部伝達関数を用いる方法は、聴取者個人の伝達関数を精密に模擬すれば任意の場所に精度よく音を知覚させることが可能であるが、一般的に聴取者個人の頭部伝達関数を用いない場合は、その精度は低下する。このため聴取者個人ごとの頭部伝達関数を知る必要があり、実用上、現実的ではない。
一方、直線上に並んだ遠近2つのスピーカの音圧レベルを変化させる方法では、直接音と間接音の比率は部屋の残響時間に大きく影響を受ける。このため、必ずしも意図したとおりの距離に音像を知覚させることができるとは限らない。また、聴取位置での音圧レベルが減少するに伴って知覚される音像は遠くなるが、実音源が遠ざかるに伴う物理的な音圧レベルの減少よりもさらに小さい音圧レベルで提示しなければ、実音源と同じ距離として知覚されないことが知らされている。これは、音を遠方に知覚させるためには物理的な音圧レベルの減少分からさらに小さな音を提示する必要があり、音声会議システムに用いるような場合には、音声の明瞭度を低下させることとなり実用上問題が生じる。
このように、あらゆる環境において音像を任意の場所に知覚させることは、現状では困難である。特に、音声会議に応用することを念頭におくと、音像の距離感あるいは奥行き感を出そうとした場合、その音の音圧レベルを小さくする必要があり、また多くの残響を付加することとなり音声の明瞭度を下げることにつながる。
本発明の目的は、この音声通信会議に対象を絞り、この際に音声の明瞭度を従来の技術よりも下げることなく効果的に音像の距離感、あるいは奥行き感を知覚させることを可能とするものである。
本発明では心理学、特に視覚心理学の分野で知られている空間対比効果を応用する。視覚における空間対比効果を、図4を用いて簡単に説明する。図4では、白から黒へなだらかに背景の明るさが変化しているパターン(図4では斜線の間隔で背景の明るさを表示している)の上に、小さな灰色の四角形A、B、C、D、E、F、Gを7つ載せた様子が示されている。小さな灰色の四角形A〜Gはどれも同じ程度の明るさの灰色であるにも関わらず、背景が黒(右端)位置における四角形Gは背景が白(左端)の位置にある四角形Aよりも明るく見える。このように注目している場所からの光だけでなく、その周辺に存在する光の影響をうけることを空間的対比効果(simultaneous contrast)と呼ぶ。
本発明では、この対比効果を音における空間定位に応用する。すなわち、複数いる会議の話者の一人(基準話者)を基準位置に設定し、その他の話者の位置をこの基準位置との対比によって、遠方に知覚させるというものである。これは、音源の距離に関する判断において、何かの基準となる音源の距離との比較を行う方が、他との比較なしに絶対的にその距離を判断するより容易であり、音源までの距離に関する精度、特に距離の違いに関する弁別精度が高くなるという人間の知覚特性を利用したものである(参考文献:金海永、鈴木陽一、高根昭一、曽根敏夫、小沢賢司、「絶対判断と相対判断による音像距離知覚の比較」日本バーチャルリアリティ学会論文誌、Vol.4, No.2, pp455-460(1999))。これにより、遠近感のある音を、音圧レベルの低下を抑制し、あるいは付加残響を小さいままに保ちつつ提示する方法、すなわち音声の明瞭性を低下させることなく遠近感ある音を提示する音像位置定位方法を提供する。
本発明の音像位置定位方法の具体的な方法としては、任意の位置にある音像位置を基準音像位置と定め、この基準音像位置を基準に他の音像位置を知覚させることを特徴とする。
更には、この音像位置定位方法において、基準音像位置は聴取位置から最も近い距離の音像位置とすることを特徴とする。
本発明では更に、基準音像位置以外の場所に定位させる音像は、音圧レベルの減少と、残響を付加することによって基準音像位置より遠方位置に知覚させることを特徴とする。
本発明では更に、音圧レベルの減少量は実音源からの距離に応じた音圧レベルの減少分より減少量を小さく設定することを特徴とする。
本発明では更に、残響の付加量は基準音像位置を除く他の音像位置は、音像位置によらず現実の残響量より小さい一定量とすることを特徴とする。
上述したように、本発明によれば基準音像位置を設定し基準音像位置との音圧レベル差と残響量の違いを手掛かりに遠近感を知覚させながら、遠近感の誤差を小さくすることができる。また、音圧レベルの減少量を実音源からの距離に応じた音圧レベルの減少分より減少量を小さく選出するから音圧レベルが極端に小さくなることが抑制され、音声の明瞭度が低下することを阻止することができる。
更に残響の付加量にあっても、基準音像位置を除く他の音像位置は、音像位置によらず現実の残響量より小さい一定量としたから、残響付加に伴う音声の明瞭度が低下することを抑制することができる。
この結果、本発明の音像位置定位方法によれば、音声の明瞭度を落とすことなく遠近感の再現性が高い音像位置定位を実現することが可能となる。
本発明による音像位置推定方法及び音像位置定位装置は全てハードウェアによって実現することが可能であるが、ハードウェア以外にコンピュータに音像位置定位プログラムをインストールし、コンピュータに本発明による音像位置定位装置として機能させる実施形態が最良の実施形態である。
コンピュータに音像位置定位装置として機能させるにはコンピュータに複数の音源の音を電気信号として各別に収集する集音部と、この集音部に収集した各音源の音に対応する電気信号のそれぞれに減衰量を与える複数の音圧減衰部と、この複数の音圧減衰部で減衰量が与えられた電気信号のそれぞれに残響を与える複数の残響付加部とを構築し、コンピュータの外部に設けた複数のスピーカにより立体音響再生手段を構築し、この立体音響再生手段から音圧減衰部で音圧レベルが付与され、更に残響付加部で残響が付加された電気信号を放音させることにより音圧レベル差と残響量とによって音像位置が定位される。
以下に図1を用いて本発明による音像位置定位装置の実施例を説明する。ここでは3人の話者の音声を2つのスピーカ9A、9Bを用いて再生する場合を例として説明する。
先ず、3人の話者1A、1B、1Cから発声される音声を、指向性マイクロホン等を用いてそれぞれ独立に集音する。集音部2A、2B、2Cは各話者の1A〜1Cの発声を電気信号として収録する。各話者1A〜1Cの音声はそれぞれ音圧減衰部3A〜3Cと、残響付加部5A〜5Cで音圧レベルと残響が付加される。各音圧減衰部3A〜3Cで付与される各音圧レベルは減衰音圧レベル決定部4により設定され、残響付加部5A〜5Cで付与される残響量は付加残響量決定部6で設定される。
ここで3人の話者1A〜1Cのなかで1人を基準話者として設定する。ここでは話者1Aを基準話者と定めた場合を説明する。本発明では話者1Aの音像位置を聴取位置から最も近い位置の音として設定する。つまり、音圧減衰部3Aで付与する音圧レベル減衰量を他の音圧減衰部3B、3Cの減衰量より小さい減衰量に定める。そして、残響付加部5Aでは残響付加量をゼロないしはゼロに近い最小値に設定する。次に他の話者1Bと1Cについては基準話者1Aの位置より遠くに音像位置を設定する。つまり、基準話者1Aの位置からどれだけ遠方に音を定位させるかを決定し、基準話者位置からの相対的な距離に応じて、話者ごとに音圧レベル減衰量と残響付加量を設定する。この際に、音圧レベルは距離が倍になるごとに本来であれば−6dB減衰させるべきであるところ、本発明では実音源の音圧レベル減衰量より小さい例えば−2dB減衰させる。
一方残響付加量は、音圧レベルの場合と同様に距離に応じて変化させることも可能であるが、この発明では比較的近い位置に音源が存在する場合の値である。C値=25dBを距離によらず一定値として設定する。残響付加方法としては別途部屋のインパルス反応を測定し、これを音源の音声信号に畳み込むことで実現することができる。または、計算機シミュレーションによる残響付加アルゴリズム(参考文献:大久保洋幸、小宮山摂「残響付加アルゴリズムの検討」日本音響学会聴覚研究会資料Vol34, No.5 pp373~373, 2004年)を用いることも可能である。
各音圧減衰部3A〜3C及び残響付加部5A〜5Cで音圧レベルと残響が付された音声信号は立体音響再生手段7に入力され、この立体音響再生手段7で音として放音され、各話者1A〜1Cの位置が音像として定位される。立体音響再生手段7は信号混合部8と、2つのスピーカ9A、9Bで構成することができる。信号混合部8では各残響付加部5A〜5Cから出力される各話者の音声信号を混合し、それぞれの音声信号を各話者の左右の位置に対応付けして2つのスピーカ9Aと9Bから出力される音の音圧レベルを設定する。
上述した実施例で重要な点は基準話者以外の他の話者の音圧レベルを実際の音源の距離差に基づく音圧レベルの差より小さい音圧差に設定したから、基準話者より遠くに位置する話者の音圧レベルが極端に小さくなることがない。従って、この点で基準話者以外の話者の音声が不明瞭になることを抑制することができる。更に、残響量も現実に距離差に基づく残響付加量により小さい残響付加量例えばC=25dBとしたから、基準話者以外の他の話者の音声の明瞭度が低下することを抑制することができる。
以上述べた方法では、実際の話者の位置に関わらず、聴取者の側で自由に各話者の位置を設定することができるという特徴がある。また、実際の話者の位置を実現する場合には、別の方法により話者の位置の情報を得る必要がある。
この発明で提案した音像位置定位手法を用いて、基準話者の音声が存在する場合と存在しない場合との音像の知覚された距離を調べる実験を行ったところ、図2に示される結果が得られた。この実験結果は、横軸に定位させた音像の物理的な距離を表し、縦軸には知覚された音像の距離と物理的な距離の誤差を、物理的な距離に対する割合で示している。物理的な距離が最も聴取者に近い場合には、両者の差はほとんど見られないが、物理的な距離が大きくなるにしたがって、基準話者が存在する場合では誤差が大きくならないのに対し、基準話者が存在しない場合には誤差が大きくなっていくことが見てとれる。これは、距離に応じて残響の量を変えていないことに起因すると考えられるが、この結果から、残響付加量を小さくしたまま、すなわち音声の明瞭度を下げないで知覚される音像の距離を効果的に制御できることが示される。
以上説明した集音部2A、2B、2C及び音圧減衰部3A、3B、3C、減衰音圧レベル決定部4、残響付加部5A、5B、5C、付加残響量決定部6、信号混合部8は上述した手順で音圧レベル減衰量を設定し、また残響付加量を設定する音像定位プログラムをコンピュータにインストールし、コンピュータに本発明による音像位置定位装置として機能させることにより実現することができる。
音像定位プログラムはコンピュータが解読可能なプログラム言語によって記述され、コンピュータが読取り可能な例えばCD−ROMのような記録媒体に記録される。これらの記録媒体からコンピュータにインストールするか、或いは通信回線を通じてコンピュータにインストールすることができ、コンピュータにインストールされたプログラムはコンピュータに備えられたCPUに解読されて実行される。
本発明による音像位置定位方法及び音像位置定位装置は拡声音声会議システムの分野で活用される。
この発明による音像位置定位装置の一実施例を説明するためのブロック図。 この発明による音像位置定位方法の作用効果を説明するためのグラフ。 従来技術である頭部伝達関数を用いた音像定位方法を説明するための図。 本発明で応用した空間対比効果を説明するための図。
符号の説明
1A〜1C 話者 5A〜5C 残響付加部
2A〜2C 集音部 6 付加残響量決定部
3A〜3C 音圧減衰部 7 立体音響再生手段
4 減衰音圧レベル決定部 9A,9B スピーカ

Claims (8)

  1. 音源の位置によらず任意の場所に音源の位置を知覚させる音像位置定位方法において、
    任意の位置における音像位置を基準音像位置と定め、この基準音像位置を基準に他の音像位置を知覚させることを特徴とする音像位置定位方法。
  2. 請求項1記載の音像位置定位方法において、上記基準音像位置は聴取位置から最も近い距離の音像位置とすることを特徴とする音像位置定位方法。
  3. 請求項1又は2の何れかに記載の音像位置定位方法において、基準音像位置以外の場所に定位させる音像は、音圧レベルの減少と、残響を付加することによって基準音像位置より遠方位置に知覚させることを特徴とする音像位置定位方法。
  4. 請求項3記載の音像位置定位方法において、上記音圧レベルの減少量は、実音源からの距離に応じた音圧レベルの減少分より減少量を小さく設定することを特徴とする音像位置定位方法。
  5. 請求項3記載の音像位置定位方法において、残響の付加量は音像位置によらず現実の残響量より小さい一定量とすることを特徴とする音像位置定位方法。
  6. 複数の音源の音を電気信号として各別に収集した集音部と、
    この集音部に集音した各音源の音に対応する電気信号のそれぞれに減衰量を与える複数の音圧減衰部と、
    この複数の音圧減衰部で減衰量が与えられた電気信号のそれぞれに残響を与える複数の残響付加部と、
    上記音圧減衰部で音圧レベルが付与され、更に残響付加部で残響が付加された電気信号を複数のスピーカに印加し、これら複数のスピーカから上記各音源の音像位置を定位する立体音響再生手段と、
    を備えた音像位置定位装置。
  7. 請求項6記載の音像位置定位装置において、上記複数の音圧減衰部の中の何れか一つは基準音像位置に音像を定位すべき電気信号が入力され、この電気信号に基準音像位置を再現するための基準音圧レベルを付与し、他の音圧減衰部では各音圧減衰部に入力された電気信号に、上記基準音圧レベルより小さい音圧レベルを付与する音像位置定位装置。
  8. 請求項6又は7の何れかに記載の音像位置定位装置において、上記複数の残響付加部の何れか一つは基準音像位置に音像を定位すべき電気信号を入力し、この電気信号は残響を付加することなく、上記立体音響再生装置に出力し、上記複数の残響付加部の中の他の残響付加部では現実の音像位置で与えられる残響より小さいレベルの残響を付加して上記立体音響再生手段に出力することを特徴とする音像位置定位装置。
JP2005153821A 2005-05-26 2005-05-26 音像位置定位方法、音像位置定位装置 Pending JP2006333067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005153821A JP2006333067A (ja) 2005-05-26 2005-05-26 音像位置定位方法、音像位置定位装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005153821A JP2006333067A (ja) 2005-05-26 2005-05-26 音像位置定位方法、音像位置定位装置

Publications (1)

Publication Number Publication Date
JP2006333067A true JP2006333067A (ja) 2006-12-07

Family

ID=37554279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005153821A Pending JP2006333067A (ja) 2005-05-26 2005-05-26 音像位置定位方法、音像位置定位装置

Country Status (1)

Country Link
JP (1) JP2006333067A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010171513A (ja) * 2009-01-20 2010-08-05 Nippon Telegr & Teleph Corp <Ntt> 音響再生装置
KR101271013B1 (ko) 2011-10-10 2013-06-04 한국과학기술원 음향 재생 장치
KR101271014B1 (ko) 2011-10-10 2013-06-04 한국과학기술원 음향 재생 장치
KR101269873B1 (ko) 2011-10-10 2013-06-07 한국과학기술원 음향 재생 장치
WO2021187335A1 (ja) * 2020-03-16 2021-09-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響再生方法、音響再生装置およびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010171513A (ja) * 2009-01-20 2010-08-05 Nippon Telegr & Teleph Corp <Ntt> 音響再生装置
KR101271013B1 (ko) 2011-10-10 2013-06-04 한국과학기술원 음향 재생 장치
KR101271014B1 (ko) 2011-10-10 2013-06-04 한국과학기술원 음향 재생 장치
KR101269873B1 (ko) 2011-10-10 2013-06-07 한국과학기술원 음향 재생 장치
WO2021187335A1 (ja) * 2020-03-16 2021-09-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響再生方法、音響再生装置およびプログラム

Similar Documents

Publication Publication Date Title
JP7367785B2 (ja) 音声処理装置および方法、並びにプログラム
US9674629B2 (en) Multichannel sound reproduction method and device
Faller Parametric coding of spatial audio
KR102507476B1 (ko) 헤드셋을 통한 공간 오디오 렌더링을 위한 룸 특성 수정 시스템 및 방법
Toole Listening tests-turning opinion into fact
Hammershøi et al. Methods for binaural recording and reproduction
CN109565633A (zh) 有源监听耳机及其双声道方法
Frank Source width of frontal phantom sources: Perception, measurement, and modeling
Lindau Binaural resynthesis of acoustical environments: technology and perceptual evaluation
Lokki et al. Subjective evaluation of auralization of physics-based room acoustics modeling
JP2008311718A (ja) 音像定位制御装置及び音像定位制御プログラム
Thiemann et al. A multiple model high-resolution head-related impulse response database for aided and unaided ears
US20160150339A1 (en) System and method for producing head-externalized 3d audio through headphones
JP2006333067A (ja) 音像位置定位方法、音像位置定位装置
Novo Auditory virtual environments
Riedel et al. Surrounding line sources optimally reproduce diffuse envelopment at off-center listening positions
KR20180018464A (ko) 입체 영상 재생 방법, 입체 음향 재생 방법, 입체 영상 재생 시스템 및 입체 음향 재생 시스템
Kahana et al. A multiple microphone recording technique for the generation of virtual acoustic images
Zotter et al. Auditory events of multi-loudspeaker playback
Lindau Binaural resynthesis of acoustical environments
Song et al. Psychoacoustic evaluation of multichannel reproduced sounds using binaural synthesis and spherical beamforming
Prodi et al. The evaluation of binaural playback systems for virtual sound fields
Sæbø Influence of reflections on crosstalk cancelled playback of binaural sound
Stärz et al. Comparing Room acoustical ratings in an interactive virtual environment to those in the real room
Cabrera et al. Auditory room size perception: a comparison of real versus binaural sound-fields