JP2022041721A - バイノーラル信号生成装置及びプログラム - Google Patents

バイノーラル信号生成装置及びプログラム Download PDF

Info

Publication number
JP2022041721A
JP2022041721A JP2020147092A JP2020147092A JP2022041721A JP 2022041721 A JP2022041721 A JP 2022041721A JP 2020147092 A JP2020147092 A JP 2020147092A JP 2020147092 A JP2020147092 A JP 2020147092A JP 2022041721 A JP2022041721 A JP 2022041721A
Authority
JP
Japan
Prior art keywords
transfer function
acoustic transfer
sound
auxiliary
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020147092A
Other languages
English (en)
Inventor
周 北島
Shu Kitajima
岳大 杉本
Takehiro Sugimoto
敦郎 伊藤
Atsuro Ito
光太郎 木下
Kotaro Kinoshita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2020147092A priority Critical patent/JP2022041721A/ja
Publication of JP2022041721A publication Critical patent/JP2022041721A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】反射音を考慮し、簡便な処理により、音色の変化を抑制しつつ知覚精度を向上させたバイノーラル信号を生成する。【解決手段】バイノーラル信号生成装置1は、任意の音源位置から聴取位置までの複数の音響伝達関数をあらかじめ記憶する音響伝達関数記憶部11と、音声信号の直接音の音響伝達関数を主音響伝達関数として選択する主音響伝達関数選択部12と、音声信号の反射音の音響伝達関数を補助音響伝達関数として選択する補助音響伝達関数選択部13と、補助音響伝達関数の主音響伝達関数に対する遅延量及び減衰量を補助音響伝達関数に適用して調整補助音響伝達関数を生成する補助音響伝達関数処理部14と、主音響伝達関数及び調整補助音響伝達関数を加算して合成音響伝達関数を生成する音響伝達関数加算部15と、合成音響伝達関数を音声信号に畳み込んでバイノーラル信号を生成する音声信号重畳部16と、を備える。【選択図】図1

Description

本発明は、バイノーラル信号生成装置及びプログラムに関する。
昨今、ヘッドマウントディスプレイや一人称視点での高精細なゲームの普及に伴って、音声に関してはヘッドホンでの聴取でありながらあたかも周りの3次元空間から音が到来しているように感じさせることができるバイノーラル再生技術が一般的になりつつある。通常、バイノーラル再生技術とは、音の到来を再現したい音源位置から両耳までの音響伝達関数(HRTF:Head Related Transfer Function)、又はその時間領域表現である頭部インパルス応答(HRIR:Head Related Impulse Response)を音源信号に畳み込むことで生成したバイノーラル信号をヘッドホンから再生することを指す。このHRTFには、人間が音の方向を知覚するうえで必要とされている手がかりがすべて含まれており、精密にHRTFを再現することができれば、任意の音空間を、ヘッドホンを通して聴取させることができるとされている。
HRTFは音源の方向(水平角・仰角)に依存して遅延・レベル・周波数特性が複雑に変化し、人間はその方向に依存した特徴を知覚することで音の方向を判断することができるということが広く知られている。一方で、音源から聴取位置までの距離に関しては、音源から聴取位置までの距離が1m以内の場合にはHRTFに距離に依存した変動がみられるが、1mを超えると距離に依存した変動がほとんど現れない。したがって、1m以内の音源であれば、精緻なHRTFの再現によって方向・距離を含めて自由に音空間を再現できることになる。
しかしながら、実際のバイノーラル再生では完全に正確なHRTFを再現することは現段階では困難であり、実空間での音空間の知覚よりも知覚精度が悪化してしまう。その理由として、実空間での音の聴取では、音源から両耳までの直接音だけでなく、壁や床からの反射音が複雑に含まれており、この反射成分が距離知覚の能力を向上させていることが大きいと考えられる。したがって、音源から1m以内の近距離であっても、単純な直接音だけのHRTFを使用した場合よりも、部屋からの反射音も含んだ場合の方が、より正確に音源までの距離を判断できる場合がある。
HRTF又はHRIRに反射成分を加えることで音声の空間的な効果を強調する技術は、いくつか提案されている。例えば、特許文献1には、反射が存在する室内で測定した頭部インパルス応答であるBRIR(Binaural Room Impulse Response)を使用した技術が開示されている。また、特許文献2には、部屋の詳細な情報を取得することで人工的にBRIRを生成し、場面に則した響きを付加する技術が開示されている。また、特許文献3には、床面反射音を含む頭部伝達関数を用いて、音像の定位やヘッドホン聴取時に頭の外側に明瞭に音像を知覚する頭外感を改善させる技術が開示されている。その他、特許文献4には、任意の距離を提示可能なバイノーラル信号を再生する技術が開示されている。
特許第4850948号公報 特開2005-80124号公報 特開2009-105565号公報 特開平10-174200号公報
しかし、先行技術文献に記載の技術には、以下の課題がある。特許文献1に記載の技術によれば、音像の定位(位置の知覚)が明確になったり、より実空間に近いリアルな印象を与えたりすることが可能な場合があるが、BRIRを取得した部屋の響きが音声に含まれてしまうために、音声を全体で1つの場面を描写するコンテンツとしてとらえたときに、表現したい場面とは異なる響きが付いてしまい、不自然になってしまうことがある。
特許文献2に記載の技術では、あくまで響きを忠実に再現することで音像の定位の明確さを得ているため、音源の特性を損なうことなく特に距離方向のみの定位の明確さだけを強調したいという要求に対しては、応えることができない。
特許文献3に記載の技術では、床面反射音を含むという特殊な頭部伝達関数を測定しなくてはいけないという制約があり、簡便に実現することは困難である。
特許文献4に記載の技術では、点音源を仮定するHRTFに基づいた技術であるため、知覚の精度に限界があり、明確な距離方向の音像の提示は未だ困難である。
また、単純な直接音だけのHRTFよりも反射音も含んだHRTFの方がより正確に距離を判断できる場合があるものの、部屋の反射音は一般的に直接音の成分を時間的周波数的に複雑に変化させる。そのため、反射音を含めると聴感上では音色の変化として知覚されてしまい、安易に適用すると音色に意図しない影響を及ぼしてしまう危険性がある。
かかる事情に鑑みてなされた本発明の目的は、反射音を考慮し、簡便な処理により、音色の変化を抑制しつつ距離の知覚精度を向上させたバイノーラル信号を生成することにある。
一実施形態に係るバイノーラル信号生成装置は、任意の位置に配置された音源から放射された音声信号からバイノーラル信号を生成するバイノーラル信号生成装置であって、任意の音源位置から聴取位置までの複数の音響伝達関数をあらかじめ記憶する音響伝達関数記憶部と、前記音響伝達関数記憶部から、前記音声信号の直接音の音響伝達関数を主音響伝達関数として選択する主音響伝達関数選択部と、前記音響伝達関数記憶部から、前記音声信号の反射音の音響伝達関数を補助音響伝達関数として選択する補助音響伝達関数選択部と、前記補助音響伝達関数の前記主音響伝達関数に対する遅延量及び減衰量を前記補助音響伝達関数に適用して調整補助音響伝達関数を生成する補助音響伝達関数処理部と、前記主音響伝達関数及び前記調整補助音響伝達関数を加算して合成音響伝達関数を生成する音響伝達関数加算部と、前記合成音響伝達関数を前記音声信号に畳み込んでバイノーラル信号を生成する音声信号重畳部と、を備える。
さらに、一実施形態において、前記補助音響伝達関数選択部は、前記主音響伝達関数を前記補助音響伝達関数の1つとして選択してもよい。
さらに、一実施形態において、前記補助音響伝達関数選択部は、前記音源における任意の音声信号放射位置から聴取位置までの音響伝達関数を前記補助音響伝達関数の1つとして選択してもよい。
さらに、一実施形態において、前記補助音響伝達関数選択部は、前記音源が存在する部屋の壁面のうち、前記反射音の反射点を求め、該反射点から聴取位置までの音響伝達関数を前記補助音響伝達関数の1つとして選択してもよい。
さらに、一実施形態において、前記補助音響伝達関数選択部は、前記音源の位置を示す音源位置情報と、前記部屋の形状及び前記部屋に対する聴取位置を含む空間情報と、に基づいて前記反射点を求めてもよい。
さらに、一実施形態において、前記補助音響伝達関数選択部は、あらかじめ反射音の聴取位置に対する方向及び距離を1つ以上設定し、該方向及び距離をパラメータとして有する音響伝達関数を前記補助音響伝達関数として選択してもよい。
さらに、一実施形態において、前記補助音響伝達関数処理部は、前記直接音及び前記反射音の経路長に基づいて前記遅延量及び前記減衰量を算出してもよい。
さらに、一実施形態において、前記遅延量及び前記減衰量は、前記直接音及び前記反射音の経路長、及び前記方向に基づいてあらかじめ算出されてもよい。
また、一実施形態係るプログラムは、コンピュータを、上記バイノーラル信号生成装置として機能させる。
本発明によれば、反射音を考慮し、簡便な処理により、音色の変化を抑制しつつ距離の知覚精度を向上させたバイノーラル信号を生成することが可能となる。
第1の実施形態に係るバイノーラル信号生成装置の構成例を示すブロック図である。 音源自身からの1次反射音を示す模式図である。 音源自身からの1次反射音を示す模式図である。 第2の実施形態に係るバイノーラル信号生成装置の構成例を示すブロック図である。 部屋からの1次反射音を示す模式図である。 部屋からの1次反射音を示す模式図である。 距離に応じた直接音と1次反射音の経路差の関係を示す模式図である。 距離に応じた直接音と1次反射音の経路差を示す数式の変数を示す模式図である。 音源距離dと経路差yの関係を示す図である。 第3の実施形態に係るバイノーラル信号生成装置の構成例を示すブロック図である。 方位角に応じた直接音と1次反射音の経路差の関係を示す模式図である。 方位角θと音源距離dに対する経路差の変数の関係を説明する図である。
以下、本発明の実施形態について、図面を参照して詳細に説明する。実施形態では、3次元空間の任意の座標を位置情報として保持する1つの音声信号を、バイノーラル再生する場合の例について説明する。ここで、位置情報はオブジェクトベース音響のメタデータとしてあらかじめ記述されているものとしているが、別の形で保持してもよい。例えば、聴取者側で予め音声信号のチャンネル番号と位置座標を組み合わせておくなどしてよい。また、実施形態では1つの音声信号に限定してバイノーラル再生する例を示しているが、番組音声のように複数の音声信号を同時に再生する場合でも、単純な重ね合わせによって実現することができる。なお、オブジェクトベース音響のメタデータの詳細については、例えば下記の参考文献を参照されたい。
[参考文献]勧告ITU-R BS.2076、"Audio Definition Model"
(第1の実施形態)
図1は、第1の実施形態に係るバイノーラル信号生成装置1の構成例を示す図である。バイノーラル信号生成装置1は、音響伝達関数記憶部11と、主音響伝達関数選択部12と、補助音響伝達関数選択部13と、補助音響伝達関数処理部14と、音響伝達関数加算部15と、音声信号重畳部16と、を備える。
音響伝達関数記憶部11は、任意の音源位置(音源位置の座標を任意に変化させた場合の音源位置)から聴取位置(聴取者の左右の耳)までの複数の音響伝達関数をあらかじめ記憶する。本明細書において、「音響伝達関数」とは、HRIR又はHRTFを意味する。音響伝達関数記憶部11は、任意の水平角(方位角)・仰角含む複数の方向、及び所定の範囲内の複数の距離において十分な解像度での音響伝達関数をデータベースとして保持する。ただし、音響伝達関数記憶部11において限定された方向及び距離だけの音響伝達関数を保持し、音響伝達関数の存在しない場所については既存の内挿・外挿技術によって合成した音響伝達関数を用いるようにしてもよい。
主音響伝達関数選択部12は、音源の位置(座標)を示す音源位置情報を取得し、音響伝達関数記憶部11から、音声信号の直接音の音響伝達関数を主音響伝達関数として選択する。そして、主音響伝達関数選択部12は、選択した主音響伝達関数を音響伝達関数加算部15に出力する。
補助音響伝達関数選択部13は、音源位置情報を取得し、音響伝達関数記憶部11から、音声信号の反射音の音響伝達関数を補助音響伝達関数として選択する。そして、補助音響伝達関数選択部13は、選択した補助音響伝達関数を補助音響伝達関数処理部14に出力する。ここで、反射音とは1次反射音を意味するが、初期反射を構成する複数の反射音を含んでもよい。
補助音響伝達関数処理部14は、音源位置情報を取得し、直接音及び反射音の経路長に基づいて、補助音響伝達関数の主音響伝達関数に対する遅延量及び減衰量を算出する。次に、補助音響伝達関数処理部14は、補助音響伝達関数選択部13から入力した補助音響伝達関数に遅延量及び減衰量を適用して、調整された補助音響伝達関数(調整補助音響伝達関数)を生成する。そして、補助音響伝達関数処理部14は、調整補助音響伝達関数を音響伝達関数加算部15に出力する。
音響伝達関数加算部15は、主音響伝達関数選択部12から入力した主音響伝達関数と、補助音響伝達関数選択部13から入力した調整補助音響伝達関数とを加算して合成音響伝達関数を生成する。そして、音響伝達関数加算部15は、生成した合成音響伝達関数を音声信号重畳部16に出力する。
音声信号重畳部16は、音響伝達関数加算部15から入力した合成音響伝達関数を、バイノーラル信号生成装置1から入力した音声信号に畳み込んでバイノーラル信号を生成する。そして、音声信号重畳部16は、生成したバイノーラル信号をバイノーラル信号生成装置1の外部に出力する。この畳み込みは、時間領域で畳み込み演算を行ってもよいし、周波数領域の積で行うなど既存の手法を利用してよい。
図2は、音源自身からの1次反射音を示す模式図である。図2に示すように、音源(スピーカ、音声オブジェクトなど)Sは大きさを持つ。バイノーラル信号生成装置1は、音源S自身からの1次反射音を含めたバイノーラル信号を生成する。図2に示す音源位置及び聴取位置を例に、主音響伝達関数選択部12、補助音響伝達関数選択部13、及び補助音響伝達関数処理部14の処理を説明する。音源Sから聴取位置までの距離(以下、「音源距離」と称する。)はd[m]とする。
主音響伝達関数選択部12は、座標rの音源Sが放射する音声信号をバイノーラル化する場合、まず座標rをパラメータとして有する音響伝達関数を主音響伝達関数として選択する。
補助音響伝達関数選択部13は、音源Sから放射された音が聴取者Uの頭部で反射して音源Sに帰ってきた反射音が再び音源Sで反射し聴取位置に届いた音を再現するために、音響伝達関数記憶部11から、座標rをパラメータとして有する音響伝達関数(主音響伝達関数)を補助音響伝達関数の1つとして選択する。なお、図2では一例として音源Sが聴取者Uの前方に配置されるが、音源Sの配置はこれに限られるものではなく、すなわち反射位置も頭部前面とは限らない。
補助音響伝達関数処理部14は、補助音響伝達関数の遅延量及び減衰量を算出する。聴取者Uの頭部形状を球と仮定した場合の半径をd’[m]とすると、音源Sから頭部表面までの距離をd-d’[m]と表せる。補助音響伝達関数で表される1次反射音の経路長と、主音響伝達関数距離で表される直接音の経路長との経路差は、d-d’[m]を往復した分の長さとなる。よって、音速をc[m/秒]とすると、2(d-d’)/c[秒]の遅延が生じることになる。減衰量については、主音響伝達関数で表される直接音の経路長dと、補助音響伝達関数で表される1次反射音の経路長d+2(d-d’)との比の、d/(3d-2d’)を減衰比としてよい。また、頭部での音の吸音率αを用いて、直接音と1次反射音のエネルギー比をより厳密に算出した値を使用して減衰量を算出してもよい。
本実施形態によれば、3次元空間上の任意の位置の音の再現に際して、簡便な処理により、音源自身からの1次反射を再現したバイノーラル信号を生成することができる。また、反射音を模擬した伝達関数を付加することにより、知覚精度を向上させることができる。さらに、反射音を必要十分な1次反射(初期反射)のみに限定して模擬することにより、音色の変化を抑制することができる。
バイノーラル再生において、実空間での音空間の知覚よりも知覚精度が悪化してしまう一つの原因として、HRTFは点音源から放射される直接音のみの伝達関数であるのに対して、実空間ではある程度の表面積を持つ放射面から音が放射されるので、ある放射面からの直接音が頭部に反射して同じ放射面に入射しその反射音が再び両耳に到達する音、つまり音源から頭部までの距離の倍の距離分の時間差と減衰を持つ反射音が存在することによる影響が考えられる。この影響は、特に音源が頭部の近くに存在するときに顕著になると考えられる。この点本実施形態では、上述したように、主音響伝達関数を補助音響伝達関数の1つとして選択し、直接音及び反射音の経路差に基づいて遅延量及び減衰量を算出するので、知覚精度を向上させることができる。
<変形例>
本実施形態では、補助音響伝達関数選択部13において主音響伝達関数と同じ音響伝達関数を選択しているが、変形例として、スピーカなどの放射面の表面の直径Aと音源距離dに応じて補助音響伝達関数を変更してもよい。
図3は、図2の状況を上から眺めた俯瞰図である。図3に示すように、音源距離dと音源の半径Aに対して,tanθ=A/dの逆関数としてθが求められる。
補助音響伝達関数選択部13は、主音響伝達関数と同じ音響伝達関数を選択する代わりに、あるいは選択するとともに、主音響伝達関数の方向に±θの範囲の任意の角度を方向パラメータとして有する音響伝達関数を補助音響伝達関数として選択してもよい。すなわち、補助音響伝達関数選択部13は、音源Sにおける任意の音声信号放射位置から聴取位置までの音響伝達関数を補助音響伝達関数の1つとして選択してもよい。
変形例によれば、直接音と方向がわずかに異なる反射音を再現することができる。また、音源の放射面の表面積が大きくなるほど、あるいは音源距離が近くなるほど、主音響伝達関数と補助音響伝達関数の方向差が大きくなりうるために、より実際の状況を正確に模擬でき、リアリティが高くなることが期待できる。
(第2の実施形態)
次に、第2の実施形態に係るバイノーラル信号生成装置について説明する。本実施形態では、音源からの反射だけでなく、部屋からの1次反射も再現したバイノーラル信号を生成する。
図4は、第2の実施形態に係るバイノーラル信号生成装置2の構成例を示すブロック図である。図4に示すバイノーラル信号生成装置2は、音響伝達関数記憶部11と、主音響伝達関数選択部12と、補助音響伝達関数選択部13aと、補助音響伝達関数処理部14aと、音響伝達関数加算部15と、音声信号重畳部16と、を備える。バイノーラル信号生成装置2は、第1の実施形態に係るバイノーラル信号生成装置1と比較して、補助音響伝達関数選択部13a及び補助音響伝達関数処理部14aの処理が異なる。その他の処理は第1の実施形態と同じであるため、説明を省略する。
補助音響伝達関数選択部13aは、音源位置情報に加えて空間情報を取得する。空間情報とは、部屋情報及び部屋に対する聴取位置を含む情報である。部屋情報とは、音源の存在する部屋の形状(寸法など)及び吸音率を含む情報である。そして、補助音響伝達関数選択部13aは、音源位置情報及び空間情報に基づいて、音源からの音声信号(再生音)が左右の壁面、床面などに反射して最初に聴取位置に到達する1次反射音を模擬した音響伝達関数を補助音響伝達関数として、音響伝達関数記憶部11から選択する。なお、本実施形態で用いる補助音響伝達関数は、第1の実施形態で選択される補助音響伝達関数を含んでもよい。
ここで、空間情報は音源から音声信号と同時に送られてきてもよいし、事前に部屋情報、及び部屋に対する聴取者の相対位置を設定しておき、必要に応じて聴取位置を算出してもよい。なお、本発明における部屋情報は、空間の響きを演出する目的ではなく、音源位置の知覚を強調するために用いるものであるため、事前に設定した情報を利用したとしても、音色・演出上に悪影響を与えないと考えられる。よって、バイノーラル信号生成装置2は、部屋情報を事前に保持しておくことが有用である。
図5は、部屋からの1次反射音を示す模式図である。図6は、図5の状況を上方から眺めた俯瞰図である。バイノーラル信号生成装置2は、部屋Rからの1次反射音を含めたバイノーラル信号を生成する。
補助音響伝達関数選択部13aは、部屋Rの壁面で反射する1次反射音の聴取位置までの反射点P(1次反射音の放射位置)の座標をパラメータとして有する音響伝達関数を、補助音響伝達関数の1つとして選択する。すなわち、補助音響伝達関数選択部13aは、音源Sが存在する部屋Rの壁面のうち、音声信号の1次反射音の反射点Pを求め、反射点Pから聴取位置までの音響伝達関数を補助音響伝達関数の1つとして選択する。この反射点Pは、1次反射音の経路を最短とする位置であってもよい。また、反射点Pは各壁面・床それぞれに対して1ずつ選択してもよいし、聴取位置から音源Sに向かって左・右・下各方向から到来するのが1つになるような反射点を1つずつ選択してもよい。ここで面として左右壁と床面のみを挙げているが天井面を含めてもよい。ただし、実空間においてあらゆる天井の高さの条件であっても問題なく距離が判断できることを考えると天井からの反射音は位置知覚への寄与が小さいものと考えられるため、図5及び図6に示すように壁面及び床面のみに着目してもよい。
補助音響伝達関数処理部14aは、補助音響伝達関数の遅延量及び減衰量を算出する。その際に、補助音響伝達関数選択部13aと同様に、音源位置情報及び空間情報を用いてもよい。すなわち、補助音響伝達関数処理部14aは、音源Sから反射点Pまでの経路に反射点Pから聴取位置までの経路を合計した経路長と、音源Sから聴取位置までの経路長との差から遅延量を算出してもよい。また、補助音響伝達関数処理部14aは、反射音及び直接音の経路長の比、壁・床の吸音率などを考慮して減衰量を算出してもよい。
なお、音源表面や壁面・床からの反射において吸音率に基づいて減衰量を算出する場合に、入射音のエネルギーに対する吸収されるエネルギーの比として吸音率が定義されているが、この吸音率を周波数ごとに異なる値としてもよい。つまり、反射による減衰の影響を周波数ごとに異なるようにしてもよい。
また、図7に示すように、通常は音源Sが聴取位置に近くなるに従って、直接音と1次反射音の経路差は大きくなる。そのため、補助音響伝達関数処理部14aは、部屋Rと音源Sの相対的な位置関係によらず、あらかじめ音源距離に対する1次反射音の遅延量を関数として複数保持しておき、その関数を使用して遅延量を算出してもよい。
例えば、図8に示すように音源距離dに加えて、音源位置及び聴取位置の床からの高さを示す定数hを設定する。この場合、補助音響伝達関数処理部14aは、床面からの1次反射音の経路長xと直接音の経路長dとの経路差yを次式(1)として求め、遅延量をy/cとしてもよい。定数hの値を複数変更することで、関数を複数表現することができる。
Figure 2022041721000002
図9に、定数hを1.5mとしたときの、音源距離d及び経路差yの関係を示す。
また、音源距離d及び経路差yの関係をさらに簡単な1次関数として、次式(2)と表現してもよい。ここでaは、距離dに伴う単調減少の傾きを表す定数であり、y>0を満たす範囲で設定する。定数h,aを複数保持することで複数の関数を表現することができる。
Figure 2022041721000003
補助音響伝達関数処理部14aは、減衰量に関しても同様に、あらかじめ反射による減衰量を定数として定めておき、直接音及び反射音の経路比を変数とした複数の関数として減衰量を算出してもよい。例えば、式(1)と同様に次式(3)のように経路比を算出し、経路比に応じた減衰量を算出してもよい。
Figure 2022041721000004
ここで関数を複数用意しているのは、複数の補助音響伝達関数にランダムに割り当てることを可能とするためである。このように補助音響伝達関数の遅延量及び減衰量を低次の関数として再現することにより、複雑な室内反射を再現することなく簡便な処理で1次反射音を再現することができる。
本実施形態では、音源が存在する部屋からの1次反射も再現したバイノーラル信号を生成することができ、反射音による音色への影響を極力排除した距離再現精度の向上が可能になる。
(第3の実施形態)
次に、第3の実施形態に係るバイノーラル信号生成装置について説明する。第2の実施形態では、1次反射音の影響をできるだけ正確に再現するために、聴取位置と音源位置、壁面までの距離などの相対関係から反射音の入射方向や遅延量及び減衰量を算出していたが、本実施形態ではこのような相対関係を考慮しないでバイノーラル信号を生成する。
図10は、第3の実施形態に係るバイノーラル信号生成装置3の構成例を示すブロック図である。図10に示すバイノーラル信号生成装置3は、音響伝達関数記憶部11と、主音響伝達関数選択部12と、補助音響伝達関数選択部13bと、補助音響伝達関数処理部14bと、音響伝達関数加算部15と、音声信号重畳部16と、を備える。バイノーラル信号生成装置3は、第2の実施形態に係るバイノーラル信号生成装置2と比較して、補助音響伝達関数選択部13b及び補助音響伝達関数処理部14bの処理が異なる。その他の処理は第1の実施形態と同じであるため、説明を省略する。
実空間において、人間は部屋の形状・材質がどのような状況であってもある程度正確に音源までの距離を判断できることを考えると、部屋と音源位置の相対位置関係によって決まる反射音の入射方向や遅延量及び減衰量の部屋ごとのばらつきは重要ではないと考えられる。そこで、補助音響伝達関数選択部13bは、あらかじめ反射音の聴取位置に対する方向及び距離を1つ以上設定(仮定)し、該方向及び距離をパラメータとして有する音響伝達関数を補助音響伝達関数として選択する。なお、本実施形態で用いる補助音響伝達関数は、第1の実施形態で選択される補助音響伝達関数を含んでもよい。
補助音響伝達関数処理部14bが使用する遅延量及び減衰量は、直接音及び仮定した反射音の経路差、及び仮定した反射音の方向に基づいてあらかじめ算出される。すなわち、バイノーラル信号生成装置3は、1次反射音の方向と、遅延量及び減衰量とを、音源の方向及び距離のみによって決定される関数として保持する。距離に関しては、第2の実施形態でも示したように距離を変数とした関数として記述し保持しておいてもよいし、距離に対応した反射方向、遅延量及び減衰量を定数のデータベースとして保持しておいてもよい。
方向に関しても、図11に示すように、方位角の変化に伴って体系的に変化していくような関数や定数として保持しておいてもよい。図11では音源Sの方向が正中面(人体を左右に2分する中心面)から遠ざかるに従って音源Sが壁面に近づくことを想定し、徐々に反射音の遅延量が小さくなるようにしてもよい。もっとも、距離方向とは異なり方向に関しては必ずしも正中面から遠ざかると反射音の遅延が小さくなるとは限らないものなので、方向の変化に関して何らかの単純な規則性を持ち反射音が変化していくように設定していれば任意の関数・定数でよい。実際に人間が実空間において部屋の形状によらず位置を正確に定位できているのは、その空間内において反射音と方向や距離の関係を学習しているものと考えられるので、任意の規則性でも有効であると考えられる。
例えば、図12に示すように、音源距離d、正中面に対する方位角θの位置に音源Sが配置されたとする。ここで、聴取位置から、音声信号が1次反射する壁面までの距離をLとする。方位角θに応じて遅延が小さくなるような関数の一例として、1次反射音と直接音との経路差zを次式(4)のような形で表してもよい。式(4)における第一項は第2の実施形態の距離dに応じた経路差と同じ形であり、それに対して方位角θに応じて経路差zが小さくなるような第二項を加えた形になる。これは一例であり、厳密に経路差を算出する関数ではなく、簡単な関数として近似したものである。
Figure 2022041721000005
第2の実施形態では距離のみに基づいて遅延量及び減衰量を決定し、第3の実施形態では、距離及び方向に基づいて遅延量及び減衰量を決定する例について説明した。その他、床面からの反射には距離に対してのみ決定される遅延量及び減衰量を用いて、壁面からの反射には距離と方向に対して決定される遅延量及び減衰量を用いるなど、使い分けてもよい。
以上のように、本実施形態によれば、補助音響伝達関数選択部13b及び補助音響伝達関数処理部14bにおいて、補助音響伝達関数の選択処理、及び調整補助音響伝達関数の生成処理をより簡便にしつつ、かつ音源の位置判断精度を損なうことなくバイノーラル信号を生成することができる。
<プログラム>
上記のバイノーラル信号生成装置1,2,3として機能させるために、プログラム命令を実行可能なコンピュータを用いることも可能である。コンピュータは、バイノーラル信号生成装置1,2,3の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのプロセッサによってこのプログラムを読み出して実行する。これらの処理内容の一部はハードウェアで実現されてもよい。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。プロセッサは、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)などであってもよい。
例えば、バイノーラル信号生成装置1として機能させるためのプログラムは、任意の音源位置から聴取位置までの複数の音響伝達関数をあらかじめ記憶部に記憶するステップと、記憶部から音声信号の直接音の音響伝達関数を主音響伝達関数として選択するステップと、記憶部から音声信号の反射音の音響伝達関数を補助音響伝達関数として選択するステップと、補助音響伝達関数の主音響伝達関数に対する遅延量及び減衰量を補助音響伝達関数に適用して調整補助音響伝達関数を生成するステップと、主音響伝達関数及び調整補助音響伝達関数を加算して合成音響伝達関数を生成するステップと、合成音響伝達関数を音声信号に畳み込んでバイノーラル信号を生成するステップと、をコンピュータに実行させる。
また、このプログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROMなどの記録媒体であってもよい。また、このプログラムは、ネットワークを介したダウンロードによって提供することもできる。
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。
1,2,3 バイノーラル信号生成装置
11 音響伝達関数記憶部
12 主音響伝達関数選択部
13,13a,13b 補助音響伝達関数選択部
14,14a,14b 補助音響伝達関数処理部
15 音響伝達関数加算部
16 音声信号重畳部

Claims (9)

  1. 任意の位置に配置された音源から放射された音声信号からバイノーラル信号を生成するバイノーラル信号生成装置であって、
    任意の音源位置から聴取位置までの複数の音響伝達関数をあらかじめ記憶する音響伝達関数記憶部と、
    前記音響伝達関数記憶部から、前記音声信号の直接音の音響伝達関数を主音響伝達関数として選択する主音響伝達関数選択部と、
    前記音響伝達関数記憶部から、前記音声信号の反射音の音響伝達関数を補助音響伝達関数として選択する補助音響伝達関数選択部と、
    前記補助音響伝達関数の前記主音響伝達関数に対する遅延量及び減衰量を前記補助音響伝達関数に適用して調整補助音響伝達関数を生成する補助音響伝達関数処理部と、
    前記主音響伝達関数及び前記調整補助音響伝達関数を加算して合成音響伝達関数を生成する音響伝達関数加算部と、
    前記合成音響伝達関数を前記音声信号に畳み込んでバイノーラル信号を生成する音声信号重畳部と、
    を備える、バイノーラル信号生成装置。
  2. 前記補助音響伝達関数選択部は、前記主音響伝達関数を前記補助音響伝達関数の1つとして選択する、請求項1に記載のバイノーラル信号生成装置。
  3. 前記補助音響伝達関数選択部は、前記音源における任意の音声信号放射位置から聴取位置までの音響伝達関数を前記補助音響伝達関数の1つとして選択する、請求項1又は2に記載のバイノーラル信号生成装置。
  4. 前記補助音響伝達関数選択部は、前記音源が存在する部屋の壁面のうち、前記反射音の反射点を求め、該反射点から聴取位置までの音響伝達関数を前記補助音響伝達関数の1つとして選択する、請求項1から3のいずれか一項に記載のバイノーラル信号生成装置。
  5. 前記補助音響伝達関数選択部は、前記音源の位置を示す音源位置情報と、前記部屋の形状及び前記部屋に対する聴取位置を含む空間情報と、に基づいて前記反射点を求める、請求項4に記載のバイノーラル信号生成装置。
  6. 前記補助音響伝達関数選択部は、あらかじめ反射音の聴取位置に対する方向及び距離を1つ以上設定し、該方向及び距離をパラメータとして有する音響伝達関数を前記補助音響伝達関数として選択する、請求項1から3のいずれか一項に記載のバイノーラル信号生成装置。
  7. 前記補助音響伝達関数処理部は、前記直接音及び前記反射音の経路長に基づいて前記遅延量及び前記減衰量を算出する、請求項1から5のいずれか一項に記載のバイノーラル信号生成装置。
  8. 前記遅延量及び前記減衰量は、前記直接音及び前記反射音の経路長、及び前記方向に基づいてあらかじめ算出される、請求項6に記載のバイノーラル信号生成装置。
  9. コンピュータを、請求項1から8のいずれか一項に記載のバイノーラル信号生成装置として機能させるためのプログラム。
JP2020147092A 2020-09-01 2020-09-01 バイノーラル信号生成装置及びプログラム Pending JP2022041721A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020147092A JP2022041721A (ja) 2020-09-01 2020-09-01 バイノーラル信号生成装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020147092A JP2022041721A (ja) 2020-09-01 2020-09-01 バイノーラル信号生成装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2022041721A true JP2022041721A (ja) 2022-03-11

Family

ID=80499943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020147092A Pending JP2022041721A (ja) 2020-09-01 2020-09-01 バイノーラル信号生成装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2022041721A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023199813A1 (ja) * 2022-04-14 2023-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響処理方法、プログラム、及び音響処理システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023199813A1 (ja) * 2022-04-14 2023-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響処理方法、プログラム、及び音響処理システム

Similar Documents

Publication Publication Date Title
JP7367785B2 (ja) 音声処理装置および方法、並びにプログラム
CN112567767B (zh) 用于交互式音频环境的空间音频
Serafin et al. Sonic interactions in virtual reality: State of the art, current challenges, and future directions
KR102502383B1 (ko) 오디오 신호 처리 방법 및 장치
JP5897219B2 (ja) オブジェクト・ベースのオーディオの仮想レンダリング
JP5285626B2 (ja) 音声空間化及び環境シミュレーション
US11937068B2 (en) Apparatus and method for reproducing a spatially extended sound source or apparatus and method for generating a bitstream from a spatially extended sound source
US6421446B1 (en) Apparatus for creating 3D audio imaging over headphones using binaural synthesis including elevation
JP6786834B2 (ja) 音響処理装置、プログラムおよび音響処理方法
US10171928B2 (en) Binaural synthesis
JP2007266967A (ja) 音像定位装置およびマルチチャンネルオーディオ再生装置
JP2005080124A (ja) リアルタイム音響再現システム
JP2023511862A (ja) 空間的に拡張された音源(Spatially Extended Sound Source)を再生する装置及び方法、又は固定化情報を用いて空間的に拡張された音源に対する記述を生成する装置及び方法
JP2022041721A (ja) バイノーラル信号生成装置及びプログラム
WO2023199817A1 (ja) 情報処理方法、情報処理装置、音響再生システム、及び、プログラム
TW202337236A (zh) 用以使用基本空間扇區合成空間擴展音源之裝置、方法及電腦程式
JP2023530516A (ja) 拡散残響信号を生成するための装置及び方法
KR20240096683A (ko) 잠재적 수정 객체에 대한 수정 데이터를 사용하여 공간 확장형 음원을 합성하는 장치, 방법 또는 컴퓨터 프로그램
KR20240096705A (ko) 분산 또는 공분산 데이터를 사용하여 공간 확장형 음원을 합성하는 장치, 방법 또는 컴퓨터 프로그램
KR20240091274A (ko) 기본 공간 섹터를 사용하여 공간 확장형 음원을 합성하는 장치, 방법 및 컴퓨터 프로그램
KR20240054885A (ko) 오디오 렌더링 방법 및 이를 수행하는 전자 장치
CN118251907A (zh) 用于使用基本空间扇区合成空间扩展声源的装置、方法或计算机程序
CN118235434A (zh) 用于使用关于潜在修改对象的修改数据合成空间扩展声源的装置、方法或计算机程序
CN118235433A (zh) 用于使用方差或协方差数据合成空间扩展声源的装置、方法或计算机程序
Yu et al. Comparison of software tools for the implementation of spatial sounds in virtual environments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230801

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240618