JP2022016988A - 音場モデリング装置及びプログラム - Google Patents

音場モデリング装置及びプログラム Download PDF

Info

Publication number
JP2022016988A
JP2022016988A JP2020120014A JP2020120014A JP2022016988A JP 2022016988 A JP2022016988 A JP 2022016988A JP 2020120014 A JP2020120014 A JP 2020120014A JP 2020120014 A JP2020120014 A JP 2020120014A JP 2022016988 A JP2022016988 A JP 2022016988A
Authority
JP
Japan
Prior art keywords
variable
sound field
orthogonal basis
interpolation
basis vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020120014A
Other languages
English (en)
Other versions
JP7449184B2 (ja
Inventor
敦郎 伊藤
Atsuro Ito
陽 佐々木
Akira Sasaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2020120014A priority Critical patent/JP7449184B2/ja
Publication of JP2022016988A publication Critical patent/JP2022016988A/ja
Application granted granted Critical
Publication of JP7449184B2 publication Critical patent/JP7449184B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】音場を実測データに則した直交基底を用いて直交展開して変数分離する。【解決手段】音場モデリング装置1は、球座標系における音源位置の座標を変化させた場合の複数の音場係数で構成される行列を特異値分解し、特異値及び直交基底ベクトルを生成する変数分離部12と、直交基底ベクトルの要素について補間を行うモデリング変数補間部14と、特異値及び補間後の直交基底ベクトルを用いて音場係数の行列を生成するデータ合成部15と、を備える。【選択図】図1

Description

本発明は、音場モデリング装置及びプログラムに関する。
近年、視聴者に高い臨場感を与える音響信号再生方式に対する機運が高まっている。例えば、5.1chサラウンド方式や、8Kスーパーハイビジョンの音響方式である22.2マルチチャンネル音響などといった「マルチチャンネル音響」と呼ばれる方式は、視聴者に高い臨場感を与えることが可能な方式として、映画やテレビ番組制作現場において広く用いられている。
他にも、オブジェクトベース音響という、音源の種類や位置情報などをメタデータとして付与し、再生時にスピーカアンプや受信機に搭載されているレンダラーが音響信号のメタデータを解釈して、再生するスピーカごとに最適な信号をレンダリングする音響方式が知られている(例えば、非特許文献1及び2参照)。オブジェクトベース音響方式は、映画製作現場などで用いられており、視聴者に高い臨場感を与えるだけでなく、再生する視聴環境や視聴者の好みに応じたレンダリングを可能とする。
また、ヘッドホンを用いた高臨場感コンテンツも数多く制作されており、特にAR(Augmented Reality)やVR(Virtual Reality)技術を用いたコンテンツにおいて非常によく用いられる。ARやVRとしての用途以外にも、スマートフォンやタブレット端末の普及速度が著しい現在、それぞれの端末を用いて個々人で好みのコンテンツをいつでも・どこでも視聴するというスタイルが広まりつつあり、この視聴スタイルのひとつとしても、ヘッドホンを用いた音響信号再生方式は欠かせない技術である。
以上のように、同一コンテンツを視聴するとしても、視聴に用いるデバイスは同一とは限られず、その多様性は考慮されるべきである。例えば、コンテンツ制作時とは異なるスピーカの配置となる視聴環境を想定して音場をレンダリングする場合、仮想的な音源(以下、「仮想音源」と表記する。)から聴取位置までのインパルス応答や伝達関数を用いてレンダリングすることがある。ヘッドホンを用いる場合においても、仮想音源からヒトの両耳までの音の伝搬特性である頭部伝達関数(HRTF:head-related transfer function)や、その時間領域表現である頭部インパルス応答(HRIR:head-related impulse response)、壁や床などの反射を含むバイノーラル室インパルス応答(BRIR:binaural room impulse response)などを用いたバイノーラル再生技術に基づくレンダリングが注目されている(例えば、特許文献1参照)。伝達関数の場合は周波数領域で、インパルス応答の場合は時間領域で音場をモデリングしていることとなる。
また近年では、空間フーリエ級数展開に基づく音場のモデリング方法が注目を集めている。代表的な例としては、円調和展開や球面調和展開に基づく方法がよく知られている。これらの方法は、円調和展開の場合は円筒座標系、球面調和展開の場合は球座標系(極座標系)に3次元の波動方程式を変数変換することで行われる。それぞれの座標系において各軸(動径方向成分と角度方向成分)は直交しているため、音波を各軸方向の波として変数分離することが可能である。したがって、仮想音源の任意方向への回転や任意位置の音圧の内挿など、柔軟な音場制御を可能とする。これらの方法は、円筒状や球状に配置したマイクロホンアレイを用いて収音する場合や、同形状に配置したスピーカで再生する場合にしばしば用いられる。特に球面調和関数に基づく直交展開はアンビソニックスという名でも知られ広く用いられており、MPEG-H 3DAで規格化されている(例えば、非特許文献3参照)。また、前述の頭部伝達関数は音源位置ごとに異なることから、3次元で測定した頭部伝達関数をアンビソニックスでエンコードする方法も提案されている(例えば、特許文献2参照)。
特許第6018485号公報 特許第6067934号公報
"Audio definition model", ITU-R BS.2076-2, 10/2019 久保、大出、「オブジェクトベース音響を用いた次世代音声放送サービス」、音講論(秋)、pp.1497-1498、2018年 "Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio", ISO/IEC 23008-3, 2019
音源信号のレンダリングにあたり、仮想音源位置制御の柔軟性は非常に重要である。音響空間を単純な伝達関数やインパルス応答としてモデリングする場合、動径方向成分と角度方向成分を変数分離できないため、仮想音源の座標のうち距離と角度のどちらか一方のみに依存する特徴量を個別に制御することはできない。
一方、円調和関数や球面調和関数に基づく音場の直交基底展開は、動径方向成分と角度方向成分へ変数分離することにより距離と角度の独立な制御が可能という大きなメリットを持つ。球面調和展開を例に考えると、デカルト座標系における波動方程式を球座標系に変換することで得られる一般解は、動径方向成分は球ベッセル関数又は球ハンケル関数、角度方向成分は球面調和関数として変数分離できる。球面調和関数は直交関数であるため、これを基底として任意の関数を直交展開することが可能である。
しかし、音場の実測データのモデリングを考えるとき、実測データは必ずしも円筒座標系又は球座標系における波動方程式の解析解通りの振る舞いをするとは限らない。例えば頭部伝達関数の実測データの球面調和展開を考えるとき、実際の頭部形状は複雑な形状をしているため、動径方向成分を球ハンケル関数で記述することは実際の物理現象を模擬しているとは限らない。
かかる事情に鑑みてなされた本発明の目的は、実測データに則した音場の特徴量を変数分離して制御することが可能な音場モデリング装置及びプログラムを提供することにある。
一実施形態に係る音場モデリング装置は、球座標系における音源位置の座標を変化させた場合の複数の音場係数で構成される行列を特異値分解し、特異値及び直交基底ベクトルを生成する変数分離部と、前記直交基底ベクトルの要素について補間を行うモデリング変数補間部と、前記特異値、及び前記モデリング変数補間部による補間後の直交基底ベクトルを用いて音場係数の行列を生成するデータ合成部と、を備える。
さらに、一実施形態において、球座標系における音源位置の座標を変化させた場合の音場係数を複数取得し、前記座標を特定する半径、方位角、及び仰角のうちの第1変数を固定し、第2変数の数がM、第3変数の数がNである場合にM行N列の音場係数の行列を生成する係数行列生成部を備え、前記変数分離部は、前記係数行列生成部により生成された行列を特異値分解し、特異値、行成分の直交基底ベクトル、及び列成分の直交基底ベクトルを生成し、前記モデリング変数補間部は、前記行成分の直交基底ベクトルの要素についての第2変数方向の補間、及び列成分の直交基底ベクトルの要素についての第3変数方向の補間の少なくとも一方を行うようにしてもよい。
また、一実施形態に係る音場モデリング装置は、球座標系における音源位置の座標、及び離散時間又は離散周波数を変化させた場合の複数の音場係数で構成される行列を特異値分解し、特異値及び直交基底ベクトルを生成する変数分離部と、前記直交基底ベクトルの要素について補間を行うモデリング変数補間部と、前記特異値、及び前記モデリング変数補間部による補間後の直交基底ベクトルを用いて音場係数の行列を生成するデータ合成部と、を備える。
さらに、一実施形態において、球座標系における音源位置の座標を変化させた場合の音場係数を複数取得し、前記座標を特定する半径、方位角、及び仰角と離散時間又は離散周波数のうちの第1変数及び第2変数を固定し、第3変数の数がM、第4変数の数がNである場合にM行N列の音場係数の行列を生成する係数行列生成部を備え、前記変数分離部は、前記係数行列生成部により生成された行列を特異値分解し、特異値、行成分の直交基底ベクトル、及び列成分の直交基底ベクトルを生成し、前記モデリング変数補間部は、前記行成分の直交基底ベクトルの要素についての第3変数方向の補間、及び列成分の直交基底ベクトルの要素についての第4変数方向の補間の少なくとも一方を行うようにしてもよい。
さらに、一実施形態において、前記音場係数は、伝達関数又はインパルス応答であってもよい。
また、一実施形態係るプログラムは、コンピュータを、上記音場モデリング装置として機能させる。
本発明によれば、実測データに則した音場の特徴量を変数分離して制御することが可能となり、未測定データを補間することが可能となる。
一実施形態に係る音場モデリング装置の構成例を示すブロック図である。 球座標系における音源位置の座標を示す図である。 一実施形態に係る音場モデリング装置の動作例を示すフローチャートである。
以下、一実施形態について、図面を参照して詳細に説明する。
図1に、一実施形態に係る音場モデリング装置の構成例を示す。図1に示す音場モデリング装置1は、係数行列生成部11と、変数分離部12と、直交基底展開モデル記憶部13と、モデリング変数補間部14と、データ合成部15と、を備える。
音場モデリング装置1は、音場(音響システム)の伝達関数又はインパルス応答(以下、「音場係数」という。)を入力し、特異値分解を用いて変数分離し、音場係数を補間する。
入力データ記憶部20は、球座標系における音源位置の座標を変化させた場合の音場係数を複数記憶し、データベースを構築する。音場係数は実測データであってもよいし、計算機シミュレーションで算出したデータであってもよい。なお、解析解を離散的にサンプリングして得られるデータに対しても本手法を適用可能である。
図2は、球座標系における音源位置の座標を示す図である。半径をr、方位角をθ、仰角をφとすると、音源位置の座標Pは(r,θ,φ)で表される。球座標系の原点Oは、聴取位置である。
係数行列生成部11は、入力データ記憶部20から、球座標系における音源位置の座標P(r,θ,φ)を変化させた場合の音場係数を複数取得する。そして、係数行列生成部11は、音源位置の座標Pを特定する半径r、方位角θ、及び仰角φのうちの第1変数を固定し、行方向に第2変数を変化させた音場係数を並べ、列方向に第3変数を変化させた音場係数を並べた行列(係数行列)Hを生成する。すなわち、係数行列生成部11は、第2変数の数がM、第3変数の数がNである場合にM行N列の係数行列Hを生成する。このとき、モデリングする第1変数及び第2変数(モデリング変数)は、モデルの設計者が任意に選択することができる。係数行列生成部11は、生成した係数行列Hを変数分離部12に出力する。
音場係数は、音源位置の座標(r,θ,φ)に加えて、インパルス応答の場合は離散時間を表すk、伝達関数の場合は離散周波数を表すωを変数として含んでもよい。この場合には、係数行列生成部11は、音源位置の座標Pを特定する半径r、方位角θ、仰角φ、及び離散時間k又は離散周波数ωのうちの第1変数及び第2変数を固定し、行方向に第3変数を変化させた音場係数を並べ、列方向に第4変数を変化させた音場係数を並べた行列(係数行列)Hを生成する。すなわち、係数行列生成部11は、第3変数の数がM、第4変数の数がNである場合にM行N列の係数行列Hを生成する。このとき、モデリングする第3変数及び第4変数(モデリング変数)は、モデルの設計者が任意に選択することができる。以下に説明する実施形態においては、音場係数がk又はωを含むものとする。
変数分離部12は、係数行列Hを特異値分解により変数分離し、行成分の直交基底ベクトルum(m=1,…,M)、列成分の直交基底ベクトルvn(n=1,…,N)、及び特異値σl(l=1,…,L)を生成し、直交基底展開モデル記憶部13に格納する。ここで、Lはモデリング次数であり、設計者が任意に設定することができる。ただし、L≦min(M,N)を満たす必要がある。L<min(M,N)の場合、L+1次以降の特異値に対応する成分は打ち切られるため、データの圧縮につながるが、出力後のデータは打ち切り誤差を含むことになる。
モデリング変数補間部14は、直交基底展開モデル記憶部13から直交基底ベクトルを取得する。そして、モデリング変数補間部14は、行成分の直交基底ベクトルumの要素についての第3変数方向の補間、及び列成分の直交基底ベクトルvnの要素についての第4変数方向の補間の少なくとも一方を行う。このとき、設計者が補間する変数を任意に選択することができる。また、補間のアルゴリズムは、線形補間や最小二乗法によるカーブフィッティングなど、設計者が任意に定めることができる。モデリング変数補間部14は、補間したデータを新たなデータとして直交基底展開モデル記憶部13に格納する。
データ合成部15は、直交基底展開モデル記憶部13から特異値、及びモデリング変数補間部14による補間後の直交基底ベクトルを取得する。そして、データ合成部15は、これらの直交基底展開モデルのデータを用いて音場係数の行列を生成する。データ合成部15は、生成した音場係数を出力データ記憶部30に格納する。
(頭部伝達関数のモデリング)
次に、具体例として、音場係数が頭部伝達関数(HRTF)である場合の、頭部伝達関数のモデリングについて、図3を参照して説明する。図3は、音場モデリング装置1の動作を示すフローチャートである。
音源位置の座標を(r,θ,φ)としたときの片耳での頭部伝達関数をH(r,θ,φ,ω)とする。ただし、ωは離散周波数ビンである。本手法は、(r,θ,φ,ω)のうちのいずれか2つの変数を固定し、残りの2つの変数を用いてモデリングを行う。ここでは仰角φ及び離散周波数ωを固定し、(r,θ)を用いてモデリングする場合について説明する。このときの片耳での頭部伝達関数をH(r,θ)とする。また、距離r方向の測定点数をM、方位角θ方向の測定点数をNとする。
ステップS101において、係数行列生成部11は、入力データ記憶部20から頭部伝達関数H(r,θ)を入力する。m番目の距離rm、及びn番目の方位角θnを音源位置としたときの頭部伝達関数をH(rm,θn)と表記する。
ステップS102において、係数行列生成部11は、行方向に距離成分、列方向に方位角成分を変化させて並べた、M行N列の係数行列Hを生成する。係数行列Hは、式(1)で表される。ここでは簡単のため、M=Nである場合を考える。また、モデリング次数LをL=Mとし、この条件に合わせて特異値の添え字をmで表す。
Figure 2022016988000002
ステップS103において、変数分離部12は、係数行列Hを式(2)で表すように特異値分解する。
Figure 2022016988000003
式(2)のσmは係数行列Hの特異値であり、Σ=diag(σ1,…,σM)は対角要素に特異値を降順に並べて配置し、対角要素以外は0となる行列である。式(2)の行列U,Vはユニタリ行列であり、V*はVのエルミート転置である。また、行列Uの列ベクトルumは式(3)で表され、行列Vの列ベクトルvnは式(4)で表される。
Figure 2022016988000004
この列ベクトルum,vnは、係数行列Hの正規直交基底である。M=Nであるため、係数行列Hは式(5)のようにM次又はN次の線形和での展開が可能であり、ここではM次で統一する。umは係数行列Hの行成分の直交基底ベクトル、vnは列成分の直交基底ベクトルであるため、umは頭部伝達関数の実測データの動径方向成分の直交基底ベクトル、vnは頭部伝達関数の実測データの方位角方向成分の直交基底ベクトルを表す。変数分離部12は、直交基底ベクトルum,vn、及び特異値σmを直交基底展開モデル記憶部13に出力する。
Figure 2022016988000005
式(3)、式(4)のum,vnの要素を、それぞれrmとθmを用いて式(6)、式(7)と表記すると、式(2)は式(8)で表すことができる。
Figure 2022016988000006
よって、(rm,θn)方向の頭部伝達関数の係数、すなわち係数行列Hのm行n列目の要素H(rm,θn)は式(9)で表され、M次で展開した直交基底ベクトルの要素を用いた線形和で表される。
Figure 2022016988000007
以上の手順で、全てのφとωの組み合わせに対して係数行列Hを生成し、特異値分解をすることで直交基底展開モデルを構築する。すなわち、固定した第1変数と第2変数の全ての要素の組み合わせに対してステップS102及びS103を実行し、直交基底展開モデルを構築する。例えば、距離rを10か所、方位角θを20か所、仰角φを30か所で測定し、離散周波数ωが40個に分割されているとすると、変数(φ,ω)を固定して変数(r,θ)を分離する場合には、仰角30か所×離散周波数40個=1200通りの(φ,ω)の組み合わせに対して、ステップS102及びS103を実行する。
以上のように、係数行列Hを行成分と列成分の直交基底で展開することにより、ある未知の方向の頭部伝達関数について、動径方向と方位角方向をそれぞれ別々に補間することが可能となる。例えば、ある方位θqにおいて音源位置の距離を変化させて測定したデータH(rp-1,θq)及びH(rp+1,θq)を用いて、動径方向に関する未知のデータH(rp,θq)を線形補間で合成する場合を考える。このとき、
Figure 2022016988000008
とすることも可能であるが、この場合、H(rp-1,θq)及びH(rp+1,θq)は変数分離されていないため、動径方向に依存する周波数スペクトル上の特徴量と方位角方向に依存する特徴量を同時に線形補間することになる。
これに対して、音場モデリング装置1では、変数分離部12により係数行列Hを直交基底ベクトルの積に分解することで、動径方向に関する未知のデータH(rp,θq)を例えば式(10)とすることができ、方位角に依存する特徴量を保持したまま、動径方向に関する特徴量のみを補間することができる。
Figure 2022016988000009
ステップS104において、モデリング変数補間部14は、式(10)の例では
Figure 2022016988000010
の各要素を算出する。同様に、モデリング変数補間部14は、動径方向の特徴量を保持したまま、方位角に関する特徴量のみを補間することも可能である。ここでは線形補間を例に挙げたが、任意のカーブフィッティングアルゴリズムで近似して内挿するなど、補間の方法は特定の方法に限定されない。すなわち、モデリング変数補間部14は任意の補間アルゴリズムで、直交基底ベクトルumの要素um(rp)、又は直交基底ベクトルvnの要素vnq)を補間し、補間したum(rp)又はvnq)を直交基底展開モデル記憶部13に出力する。
ステップS105において、データ合成部15は、モデリング変数補間部14により補間されたum(rp)又はvnq)を用いて、新たな頭部伝達関数を式(9)により合成する。
ステップS106において、データ合成部15は、合成した頭部伝達関数を出力データ記憶部30に出力する。
ここまでM=Nである場合を仮定したが、M<N、又はM>Nの場合においても、行列のサイズが変わるだけで基本的な展開及び補間方法は変わらないため、説明は省略する。なお、M<Nである場合は最大M次、M>Nである場合は最大N次の線形和での展開が可能である。また、本実施形態においては変数分離部12が動径方向成分及び方位角方向成分に変数分離する例について説明したが、全ての変数の組み合わせに対して変数分離してもよい。
(変形例)
上述した手法は、同様に頭部インパルス応答(HRIR)の展開にも適用することができる。音源位置の座標を(r,θ,φ)としたときの頭部インパルス応答をh(r,θ,φ,k)とする。ただし、kは離散時間である。(r,θ)を用いてモデリングする場合の頭部インパルス応答をh(r,θ)とする。m番目の距離及びn番目の方位で測定した頭部インパルス応答をh(rm,θn)、それを行方向に距離成分、列方向に方位角成分を変化させて並べた係数行列hを式(11)とすれば、あとは頭部伝達関数の場合と同様の手順で直交基底展開が可能であるため、説明を省略する。
Figure 2022016988000011
また、頭部伝達関数の係数行列H、及び頭部インパルス応答の係数行列hは、行方向に方位角成分、列方向に距離成分を並べた形としてもよい。つまり式(1)及を転置した形として式(12)としてもよく、式(11)を転置した形として式(13)としてもよい。この場合、umは頭部伝達関数又は頭部インパルス応答の実測データの方位角方向成分の直交基底を表し、vnは頭部伝達関数又は頭部インパルス応答の実測データの動径方向成分の直交基底を表す。
Figure 2022016988000012
以上説明したように、音場モデリング装置1は、変数分離部12により係数行列の特異値分解を行うことで、行・列成分それぞれの直交基底ベクトルum,vnを導出するため、所望の変数に対しての直交基底展開が可能となる。すなわち、動径方向成分又は方位角成分のいずれか一変数のみに依存する特徴量を制御することが可能となる。そして、モデリング変数補間部14において、任意の座標における音場係数を補間することが可能となる。すなわち、未測定データを補間することが可能となる。
<プログラム>
上記の音場モデリング装置1として機能させるために、プログラム命令を実行可能なコンピュータを用いることも可能である。コンピュータは、音場モデリング装置1の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのプロセッサによってこのプログラムを読み出して実行する。これらの処理内容の一部はハードウェアで実現されてもよい。ここで、コンピュータは、汎用コンピュータ、専用コンピュータ、ワークステーション、PC(Personal Computer)、電子ノートパッドなどであってもよい。プログラム命令は、必要なタスクを実行するためのプログラムコード、コードセグメントなどであってもよい。プロセッサは、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)などであってもよい。
例えば、音場モデリング装置1として機能させるためのプログラムは、図3を参照すると、球座標系における音源位置の座標、及び離散時間又は離散周波数を変化させた場合の複数の音場係数で構成される行列を特異値分解し、特異値及び直交基底ベクトルを生成するステップS103と、直交基底ベクトルの要素について補間を行うステップS104と、特異値及び補間後の直交基底ベクトルを用いて音場係数の行列を生成するステップS105と、をコンピュータに実行させる。
また、このプログラムは、コンピュータが読み取り可能な記録媒体に記録されていてもよい。このような記録媒体を用いれば、プログラムをコンピュータにインストールすることが可能である。ここで、プログラムが記録された記録媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROM、DVD-ROMなどの記録媒体であってもよい。また、このプログラムは、ネットワークを介したダウンロードによって提供することもできる。
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形又は変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。また、実施形態のフローチャートに記載の複数の工程を1つに組み合わせたり、あるいは1つの工程を分割したりすることが可能である。
1 音場モデリング装置
11 係数行列生成部
12 変数分離部
13 直交基底展開モデル記憶部
14 モデリング変数補間部
15 データ合成部
20 入力データ記憶部
30 出力データ記憶部

Claims (6)

  1. 球座標系における音源位置の座標を変化させた場合の複数の音場係数で構成される行列を特異値分解し、特異値及び直交基底ベクトルを生成する変数分離部と、
    前記直交基底ベクトルの要素について補間を行うモデリング変数補間部と、
    前記特異値、及び前記モデリング変数補間部による補間後の直交基底ベクトルを用いて音場係数の行列を生成するデータ合成部と、
    を備える、音場モデリング装置。
  2. 球座標系における音源位置の座標を変化させた場合の音場係数を複数取得し、前記座標を特定する半径、方位角、及び仰角のうちの第1変数を固定し、第2変数の数がM、第3変数の数がNである場合にM行N列の音場係数の行列を生成する係数行列生成部を備え、
    前記変数分離部は、前記係数行列生成部により生成された行列を特異値分解し、特異値、行成分の直交基底ベクトル、及び列成分の直交基底ベクトルを生成し、
    前記モデリング変数補間部は、前記行成分の直交基底ベクトルの要素についての第2変数方向の補間、及び列成分の直交基底ベクトルの要素についての第3変数方向の補間の少なくとも一方を行う、請求項1に記載の音場モデリング装置。
  3. 球座標系における音源位置の座標、及び離散時間又は離散周波数を変化させた場合の複数の音場係数で構成される行列を特異値分解し、特異値及び直交基底ベクトルを生成する変数分離部と、
    前記直交基底ベクトルの要素について補間を行うモデリング変数補間部と、
    前記特異値、及び前記モデリング変数補間部による補間後の直交基底ベクトルを用いて音場係数の行列を生成するデータ合成部と、
    を備える、音場モデリング装置。
  4. 球座標系における音源位置の座標を変化させた場合の音場係数を複数取得し、前記座標を特定する半径、方位角、及び仰角と離散時間又は離散周波数のうちの第1変数及び第2変数を固定し、第3変数の数がM、第4変数の数がNである場合にM行N列の音場係数の行列を生成する係数行列生成部を備え、
    前記変数分離部は、前記係数行列生成部により生成された行列を特異値分解し、特異値、行成分の直交基底ベクトル、及び列成分の直交基底ベクトルを生成し、
    前記モデリング変数補間部は、前記行成分の直交基底ベクトルの要素についての第3変数方向の補間、及び列成分の直交基底ベクトルの要素についての第4変数方向の補間の少なくとも一方を行う、請求項3に記載の音場モデリング装置。
  5. 前記音場係数は、伝達関数又はインパルス応答である、請求項1から4のいずれか一項に記載の音場モデリング装置。
  6. コンピュータを、請求項1から5のいずれか一項に記載の音場モデリング装置として機能させるためのプログラム。
JP2020120014A 2020-07-13 2020-07-13 音場モデリング装置及びプログラム Active JP7449184B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020120014A JP7449184B2 (ja) 2020-07-13 2020-07-13 音場モデリング装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020120014A JP7449184B2 (ja) 2020-07-13 2020-07-13 音場モデリング装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2022016988A true JP2022016988A (ja) 2022-01-25
JP7449184B2 JP7449184B2 (ja) 2024-03-13

Family

ID=80185709

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020120014A Active JP7449184B2 (ja) 2020-07-13 2020-07-13 音場モデリング装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7449184B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024136091A1 (ko) * 2022-12-20 2024-06-27 한국전자통신연구원 임펄스 응답 결정 방법 및 상기 방법을 수행하는 전자 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10134403B2 (en) 2014-05-16 2018-11-20 Qualcomm Incorporated Crossfading between higher order ambisonic signals
JP6920144B2 (ja) 2017-09-07 2021-08-18 日本放送協会 バイノーラル再生用の係数行列算出装置及びプログラム
EP3827603A1 (en) 2018-07-25 2021-06-02 Dolby Laboratories Licensing Corporation Personalized hrtfs via optical capture

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024136091A1 (ko) * 2022-12-20 2024-06-27 한국전자통신연구원 임펄스 응답 결정 방법 및 상기 방법을 수행하는 전자 장치

Also Published As

Publication number Publication date
JP7449184B2 (ja) 2024-03-13

Similar Documents

Publication Publication Date Title
US11950085B2 (en) Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description
US10609504B2 (en) Audio signal processing method and apparatus for binaural rendering using phase response characteristics
KR102621416B1 (ko) 음성 처리 장치 및 방법, 그리고 프로그램
JP7038725B2 (ja) オーディオ信号処理方法及び装置
JP6820613B2 (ja) 没入型オーディオ再生のための信号合成
US20200145776A1 (en) Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description
US20230100071A1 (en) Rendering reverberation
EP2394445A2 (en) Sound system
EP2954703A1 (en) Determining renderers for spherical harmonic coefficients
CN108476365B (zh) 音频处理装置和方法以及存储介质
JP7449184B2 (ja) 音場モデリング装置及びプログラム
Hold et al. Parametric binaural reproduction of higher-order spatial impulse responses
Yagunova et al. Ambisonics and Sonic Simulation in Virtual Reality
US20240284132A1 (en) Apparatus, Method or Computer Program for Synthesizing a Spatially Extended Sound Source Using Variance or Covariance Data
US20240267696A1 (en) Apparatus, Method and Computer Program for Synthesizing a Spatially Extended Sound Source Using Elementary Spatial Sectors
US20240298135A1 (en) Apparatus, Method or Computer Program for Synthesizing a Spatially Extended Sound Source Using Modification Data on a Potentially Modifying Object
Rosero et al. Demystifying Spatial Audio Plugins: Comparative Insights into Functionality and Features
WO2022034805A1 (ja) 信号処理装置および方法、並びにオーディオ再生システム
Geronazzo Sound Spatialization.
KR20150005438A (ko) 오디오 신호 처리 방법 및 장치
WO2023213501A1 (en) Apparatus, methods and computer programs for spatial rendering of reverberation
Menzies Holophonic synthesis of musical sources
Novo Virtual and real auditory environments
CN105120406A (zh) 三维音频精简方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240301

R150 Certificate of patent or registration of utility model

Ref document number: 7449184

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150