JP5773540B2 - 記録された音場の再構築 - Google Patents

記録された音場の再構築 Download PDF

Info

Publication number
JP5773540B2
JP5773540B2 JP2012532418A JP2012532418A JP5773540B2 JP 5773540 B2 JP5773540 B2 JP 5773540B2 JP 2012532418 A JP2012532418 A JP 2012532418A JP 2012532418 A JP2012532418 A JP 2012532418A JP 5773540 B2 JP5773540 B2 JP 5773540B2
Authority
JP
Japan
Prior art keywords
plw
hoa
matrix
sound field
mic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012532418A
Other languages
English (en)
Other versions
JP2013507796A (ja
Inventor
クレイグ ジン,
クレイグ ジン,
スカイク, アンドレ ヴァン
スカイク, アンドレ ヴァン
ニコラス エパイン,
ニコラス エパイン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Sydney
Original Assignee
University of Sydney
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2009904871A external-priority patent/AU2009904871A0/en
Application filed by University of Sydney filed Critical University of Sydney
Publication of JP2013507796A publication Critical patent/JP2013507796A/ja
Application granted granted Critical
Publication of JP5773540B2 publication Critical patent/JP5773540B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

本開示は一般に、記録された音場の再構築に関し、より詳細には、圧縮検知及び独立成分解析のうちの少なくとも一方に関する技術を使用して音場を記録し、次いで再構築するための機器及び方法に関する。
[関連出願の相互参照]
本出願は、本明細書にその内容が参照により完全に組み込まれる、2009年10月7日出願のオーストラリア特許仮出願第2009904871号の優先権を主張する。
マイクロフォン及びスピーカ(又はヘッドホン)を使用して音場を記録し、次いで再生するための様々な手段が存在する。本開示の焦点は、創造的な変更が許容される芸術的な音場の再生と比較して、正確な音場の再構築及び/又は再生である。現在、音場を正確に記録し、再生するために使用される主な最新の技術が2つあり、すなわち、高次アンビソニックス(higher order ambisonics:HOA)及び波面合成(wave−field synthesis:WFS)である。WFS技術は一般に、音源ごとにスポットマイクを必要とする。さらに、各音源の位置を決定し、記録しなければならない。次いで、各スポットマイクからの記録は、WFSの数学的装置を使用して行われる。スポットマイクは、音源ごとに使用可能でないことがあり、又はスポットマイクは、使いにくい場合がある。こうした場合、一般に、例えば線形、円形、又は球状のアレイなど、よりコンパクトなマイクロフォンアレイを使用する。現在、コンパクトなマイクロフォンアレイからの音場の再構築に使用可能な最適な技術は、HOAである。しかし、HOAは、(1)スイートスポットが小さいこと、及び(2)数学系が過小制約されているとき(例えば、非常に多くのスピーカが使用されるとき)、再構築の劣化という主に2つの問題を被る。スイートスポットが小さい現象は、音場が小さいスペース領域について正確であるにすぎないことを意味する。
本開示に関するいくつかの用語については、以下で定義される。
「音場を再構築すること」とは、記録された音場を再生することに加えて、1組の解析平面波の方向を使用して、1組の平面波ソース信号及びその関連のソース方向を決定することを指す。通常、密度の高い1組の平面波ソース方向に関連して、平面波ソース信号のベクトルgの各エントリが関連するソース方向に明確に一致するgを取得するための解析が行われる。
「頭部伝達関数」(HRTF)又は「頭部インパルス応答」(HRIR)とは、線型システムとして外耳、頭、肩、及び胴を含む人間の聴覚末梢系の方向の音響特性を数学的に指定する伝達関数を指す。HRTFは、周波数領域における伝達関数を表し、HRIRは、時間領域における伝達関数を表す。
「HOA領域」及び「HOA領域フーリエ展開」とは、例えばフーリエベッセルシステム、円形高調波法(circular harmonics)など、高次アンビソニックスのための解析及び合成に使用され得る任意の数学的基準の組を指す。信号は、HOA領域の数学的基準の組における信号の展開に基づいて、信号の成分で表され得る。信号がこうした成分で表されるとき、「HOA領域」で表されると言われる。HOA領域における信号は、他の信号と類似の方法で周波数及び時間領域において表され得る。
「HOA」とは、HOA領域における音場の表現及び操作を含む一般的な用語である高次アンビソニックスを指す。
「圧縮サンプリング」又は「圧縮検知(Compressed Sensing)」又は「圧縮検知(Compressive Sensing)」はすべて、スパース領域(sparse domain)(以下に定義)における信号を解析する1組の技術を指す。
「スパース領域(Sparsity Domain)」又は「スパース領域(Sparse Domain)」は、サンプリングされた観察値のベクトルyが、例えば以下の通り行列ベクトル積として書かれ得ることを指す圧縮サンプリング用語である。
y=Ψx
式中、Ψは基本関数の基準であり、xにおける係数はほとんどすべてヌルである。xにおけるS個の係数がヌル以外である場合、観察された現象がスパース領域ΨにおいてSスパースであると言う。
関数「pinv」とは、疑似逆行列、正規化された疑似逆行列、又はムーアペンローズ逆行列を指す。
ベクトルxのL1ノルムは、||x||によって表され、
Figure 0005773540

によって得られる。
ベクトルxのL2ノルムは、||x||によって表され、
Figure 0005773540

によって得られる。
行列AのL1−L2ノルムは、||A||1−2によって表され、
||A||1−2=||u||
によって得られ、この場合、
Figure 0005773540

であり、u[i]は、uのi番目の要素であり、A[i,j]は、Aのi番目の行及びj番目の列の要素である。
「ICA」は、例えば、所与の1組の混合信号について、混合行列及び非混合行列を推定するための手段を提供する数学的方法である独立成分解析である。ICAは、1組の混合信号についての1組の分離されたソース信号も提供する。
記録された音場の「スパース性(sparsity)」は、どの程度少数のソースが音場を支配するかの基準を提供する。
ベクトル又は行列の「優位な成分」とは、他の成分の一部より相対値においてかなり大きいベクトル又は行列の成分を指す。例えば、ベクトルxについて、比率
Figure 0005773540

又は比率の対数
Figure 0005773540

を計算することによって、xと比較して成分xの相対値を測定することができる。比率又はログ比が何らかの特定の閾値、すなわちθthを超える場合、xは、xと比較して優位な成分と考えられ得る。
「ベクトル又は行列をクリーニングすること」とは、ベクトル又は行列において優位な成分(上記で定義した通り)を検索し、次いで、優位な成分ではない成分の一部を削除する、又はゼロに設定することによってベクトル又は行列を変更することを指す。
「行列Mを縮小すること」とは、すべてゼロを含むMの列を削除し得る操作、及び/又は優位な成分を有していない列を削除し得る操作を指す。代わりに、「行列Mを縮小すること」とは、何らかのベクトルxに応じて行列Mの列を削除することを指し得る。この場合、ベクトルxの優位な成分に対応しない行列Mの列は削除される。さらにまた、「行列Mを縮小すること」とは、何らかの他の行列Nに応じて行列Mの列を削除することを指し得る。この場合、行列Mの列は、行列Nの列又は行に何らかの形で対応していなければならない。この対応があるとき、「行列Mを縮小すること」とは、優位な成分を有していない行列Nの行又は列に対応する行列Mの列を削除することを指す。
「行列Mを拡大すること」とは、すべてゼロを含む1組の列を行列Mに挿入し得る操作を指す。こうした操作が必要とされ得るときの一例は、行列Mの列がより小さい1組の基底関数に対応し、より大きい1組の基底関数に適した方法で行列Mを表すことが必要とされるときである。
「時間信号x(t)のベクトルを拡大すること」とは、すべてゼロを含む信号を時間信号のベクトルx(t)に挿入し得る操作を指す。こうした操作が必要とされ得るときの一例は、x(t)のエントリがより小さい1組の基底関数に一致する時間信号に対応し、より大きい1組の基底関数に適した方法で時間信号のベクトルx(t)を表すことが必要とされるときである。
「FFT」とは、高速フーリエ変換を意味する。
「IFFT」とは、逆高速フーリエ変換を意味する。
「バフル付き球状マイクロフォンアレイ」とは、固体球など、剛体バフルに取り付けられるマイクロフォンの球状アレイを指す。バフル付き球状マイクロフォンアレイは、バフルを有していないマイクロフォンのオープン球状アレイとは対照的である。
この開示に関連したいくつかの表記について、以下で説明される。
時間領域及び周波数領域のベクトルは、以下の表記を使用して表されることがある。時間領域信号のベクトルは、x(t)と書かれる。周波数領域において、このベクトルは、xと書かれる。換言すれば、xは、x(t)のFFTである。この表記との混同を避けるために、時間信号のすべてのベクトルは、明示的にx(t)と書き出される。
行列及びベクトルは、太字を使用して表される。行列は太字の大文字を使用して表され、ベクトルは太字の英小文字を使用して表される。
フィルタの行列は、太字の大文字を使用して、例えば時間領域において表されるときには明示的な時間成分によってM(t)のように、又は周波数領域において表されるときには明示的な周波数成分によってM(ω)のように表される。この定義の残りの部分では、フィルタの行列が時間領域において表されると仮定する。次いで、行列の各エントリは、それ自体、有限インパルス応答フィルタである。行列M(t)の列インデックスは、行列によってフィルタ処理されるべき時間信号の何らかのベクトルのインデックスに対応するインデックスである。行列M(t)の行インデックスは、出力信号のグループのインデックスに対応する。フィルタの行列が時間信号のベクトルに対して演算を行うとき、「乗算演算子」は、以下でさらに詳細に説明される畳込み演算子である。
Figure 0005773540

は、畳込みを意味する数学的演算子である。この演算子は、時間信号のベクトルによる(一般の行列として表される)フィルタの行列の畳込みを表すために使用され得る。例えば、
Figure 0005773540

は、x(t)の対応する時間信号のベクトルによるフィルタの行列M(t)の畳込みを表す。M(t)の各エントリはフィルタであり、M(t)の各列に沿って並ぶエントリは、時間信号x(t)のベクトルに含まれる時間信号に対応する。M(t)の各行に沿って並ぶフィルタは、出力信号のベクトルy(t)における異なる時間信号に対応する。具体例として、x(t)は、1組のマイクロフォン信号に対応し、一方、y(t)は、1組のHOA領域の時間信号に対応し得る。この場合、式
Figure 0005773540

は、マイクロフォン信号がM(t)の各行によって得られる1組のフィルタでフィルタ処理され、次いで合計されて、y(t)でHOA領域成分信号のうちの1つに対応する時間信号を提供することを示す。
信号処理操作のフローチャートは、数字を使用して、特定のステップ番号を示し、文字を使用して、いくつかの異なる操作パスのうちの1つを示すことによって表される。したがって、例えば、ステップ1.A.2.B.1は、第1のステップに、代替の操作パスAがあり、パスAは第2のステップを有し、第2のステップは代替の操作パスBを有し、パスBは第1のステップを有することを示す。
第1の態様において、記録された音場を再構築するための機器が提供され、当該機器が
音場を測定して記録されたデータを取得するための検知装置と、
検知装置と通信し、
(a)記録された音場のスパース性を推定すること、及び
(b)記録された音場を再構築することができるように平面波信号及びその関連のソース方向を取得することのうちの少なくとも1つのために記録されたデータを処理する信号処理モジュールと
を含む。
検知装置は、マイクロフォンアレイを備え得る。マイクロフォンアレイは、バフル付きアレイ及びオープン球状アレイのうちの一方でもよい。
信号処理モジュールは、以下の態様3及び4のうちの一方の方法に従って記録されたデータのスパース性を推定するように構成され得る。
さらに、信号処理モジュールは、以下の態様5〜7の方法を使用して、記録された音場を解析して、音場におけるソースを分離し、ソース位置を識別する1組の平面波信号を取得し、音場を再構築できるように構成され得る。
信号処理モジュールは、1組の平面波信号を変更して、残響などの不要なアーチファクト及び/又は不要な音源を低減するように構成され得る。残響を低減するために、信号処理モジュールは、平面波信号における信号のうちのいくつかの信号値を低減することができる。不要な音源が低減され得るように、音場の再構築において音源を分離するために、信号処理モジュールは、1組の平面波信号における信号のうちのいくつかをゼロに設定するように動作可能であり得る。
当該機器は、再構築された音場を再生するための再生装置を含み得る。再生装置は、スピーカアレイ及びヘッドホンのうちの一方とすることができる。信号処理モジュールは、再構築された音場を再生するためにどの再生装置が使用されるかに基づいて、記録されたデータを変更するように動作可能とすることができる。
第2の態様において、記録された音場を再構築するための方法が提供され、当該方法が、
時間領域技術及び周波数領域技術のうちの一方を使用して、スパース領域における記録されたデータを解析するステップと、
周波数領域技術を使用するとき、FFTを使用して1組の信号s mic (t)を周波数領域に変換してs mic を取得して、以下の第1の凸計画問題を解決することによって、前記記録された音場の平面波解析を行い、周波数領域の平面波形振幅のベクトルg plw−cs を生成し、
前記第1の凸計画問題は、
Figure 0005773540
という条件で、||g plw−cs || を最小にする問題であり、
式中で、T plw/mic が、前記平面波とマイクロフォンとの間の伝達行列であり、
mic が、マイクロフォンアレイによって記録される前記1組の信号であり、
ε が、負でない実数であり、
時間領域技術を使用するとき、信号s mic (t)から行列B HOA を取得し、以下の第2の凸計画問題を解決することによって、前記記録された音場の平面波解析を行い、時間領域の平面波形信号の行列G plw を生成し、
前記第2の凸計画問題は、
||Y plw plw −B HOA || L2 ≦ε という条件で、
||G plw || L1−L2 を最小にする問題であり、
式中のY plw が、列が何らかの組の解析平面波に対応する1組の方向についての球面調和関数の値である行列であり、
ε が、負でない実数である、ステップと、
前記記録された音場を再構築することができるように、選択された技術から生成された平面波信号及びその関連のソース方向を取得するステップと、
を含む。
当該方法は、音響検知装置を使用して、1組の信号smic(t)の形で記録されたデータを取得するために、音場の音声の時間フレームを記録するステップを含み得る。好ましくは、音響検知装置は、マイクロフォンアレイを備える。マイクロフォンアレイは、バフル付き、又はオープン球状マイクロフォンアレイとすることができる。
当該方法は、記録された音場のスパース性を計算するために圧縮検知又は凸最適化技術を使用して記録されたデータを解析することによって、記録された音場のスパース性を推定するステップを含み得る。
当該方法は、HOA領域における記録された音場を解析して、HOA領域の時間信号のベクトルbHOA(t)を取得し、所与の時間フレームLにわたってHOA領域の時間信号のベクトルをサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得して、以下によって、行列BHOAとして表される各時刻における1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得するステップを含み得る。
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
当該方法は、特異値分解をBHOAに適用して、行列分解
HOA=USV
を取得するステップを含み得る。
当該方法は、mがBHOAの行の数である場合、Sの最初のm個の列のみを保持することによって行列Sreducedを形成し、
Ω=USreduced
によって得られる行列Ωを形成するステップを含み得る。
当該方法は、行列Γについて、以下の凸計画問題を解決するステップを含み得る。
ここでの凸計画問題とは、
||YplwΓ−Ω||L2≦εの条件で、||Γ||L1−L2を最小にする問題である。
plwは、列が何らかの1組の解析平面波に対応する1組の方向についての球面調和関数の値である行列(高い球面調和次数に切り捨てられる)であり、
εは、負でない実数である。
当該方法は、以下を使用して、ΓからGplwを取得するステップを含み得る。
plw=ΓV
式中、Vは、BHOAの行列分解から取得される。
当該方法は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップを含み得る。
Π=(1−α)ΠL−1+αΓpinv(Ω)
式中、ΠL−1は、L−1時間フレームについての混合行列であり、
αは、0≦α≦1となるような忘却因子である。
当該方法は、以下を使用してGplw−smoothを取得するステップを含み得る。
plw−smooth=ΠHOA
当該方法は、標準の重畳加算(overlap−add)技術を使用して、平面波時間サンプルの集まりGplw−smoothから平面波信号のベクトルgplw−cs(t)を取得するステップを含み得る。代わりに、平面波信号のベクトルgplw−cs(t)を取得するとき、当該方法は、標準の重畳加算技術を使用して平滑化することなく、平面波時間サンプルの集まりGplwからgplw−cs(t)を取得するステップを含み得る。
当該方法は、最初にgplw−cs(t)の優位な成分の数Ncompを計算し、次いで
Figure 0005773540

を計算することによって、記録されたデータのスパース性を推定するステップを含み得る。式中、Nplwは、解析平面波基準方向の数である。
当該方法は、スパース領域における記録されたデータを解析するために圧縮サンプリング技術を使用することによって、記録された音場を再構築するステップと、記録された音場を再構築することができるように圧縮サンプリング技術から平面波信号を取得するステップとを含み得る。
当該方法は、FFTを使用して1組の信号smic(t)を周波数領域に変換してsmicを取得するステップを含み得る。
当該方法は、平面波解析を使用して周波数領域における記録された音場を解析して、平面波形振幅のベクトルgplw−csを生成するステップを含み得る。
当該方法は、平面波形振幅のベクトルgplw−csについて、以下の凸計画問題を解決することによって、記録された音場の平面波解析を行うステップを含み得る。
ここでの凸計画問題とは、
Figure 0005773540

の条件で、||gplw−cs||を最小にする問題である。
plw/micは、平面波とマイクロフォンとの間の伝達行列であり、
micは、マイクロフォンアレイによって記録される信号の組であり、
εは、負でない実数である。
当該方法は、平面波振幅のベクトルgplw−csについて、以下の凸計画問題を解決することによって、記録された音場の平面波解析を行うステップを含み得る。
ここでの凸計画問題とは、
Figure 0005773540

及び
Figure 0005773540

の条件で、||gplw−cs||を最小にする問題である。
plw/micは、平面波とマイクロフォンとの間の伝達行列であり、
micは、マイクロフォンアレイによって記録される信号の組であり、
εは、負でない実数であり、
plw/HOAは、平面波とHOA領域フーリエ展開との間の伝達行列であり、
HOAは、Tmic/HOAがマイクロフォンとHOA領域フーリエ展開との間の伝達行列である場合、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、
εは、負でない実数である。
当該方法は、平面波振幅のベクトルgplw−csについて、以下の凸計画問題を解決することによって、記録された音場の平面波解析を行うステップを含み得る。
ここでの凸計画問題とは、
Figure 0005773540

の条件で、||gplw−cs||を最小にする問題である。
plw/micは、平面波とマイクロフォンとの間の伝達行列であり、
mic/HOAは、マイクロフォンとHOA領域フーリエ展開との間の伝達行列であり、
HOAは、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、
εは、負でない実数である。
当該方法は、平面波振幅のベクトルgplw−csについて、以下の凸計画問題を解決することによって、記録された音場の平面波解析を行うステップを含み得る。
ここでの凸計画問題とは、
Figure 0005773540

及び
Figure 0005773540

の条件で、||gplw−cs||を最小にする問題である。
plw/micは、平面波とマイクロフォンとの間の伝達行列であり、
εは、負でない実数であり、
plw/HOAは、平面波とHOA領域フーリエ展開との間の伝達行列であり、
HOAは、Tmic/HOAがマイクロフォンとHOA領域フーリエ展開との間の伝達行列である場合、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、
εは、負でない実数である。
当該方法は、1組の解析平面波に対応する1組の方向の空間分割の解に基づいてεを設定するステップと、音場の計算されたスパース性に基づいてεの値を設定するステップとを含み得る。さらに、当該方法は、逆FFTを使用してgplw−csを時間領域に変換し直して、gplw−cs(t)を取得するステップを含み得る。方法は、gplw−cs又はgplw−cs(t)の各エントリによりソース方向を識別するステップを含み得る。
当該方法は、1組の基準平面波に従って平面波解析を使用して時間領域における記録された音場を解析して、1組の平面波信号gplw−cs(t)を生成するステップを含み得る。方法は、HOA領域における記録された音場を解析して、HOA領域の時間信号のベクトルbHOA(t)を取得するステップと、所与の時間フレームLにわたってHOA領域の時間信号のベクトルをサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得して、以下によって、行列BHOAとして表される各時刻における1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得するステップとを含み得る。
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
当該方法は、相関ベクトルγをγ=BHOAomniの通り計算するステップを含み得る。式中、bomniは、bHOA(t)の全方向のHOA成分である。
当該方法は、平面波利得のベクトルβplw−csについて、以下の凸計画問題を解決するステップを含み得る。
ここでの凸計画問題とは、
Figure 0005773540

の条件で、||βplw−cs||を最小にする問題である。
γ=BHOAomniであり、
plw/HOAは、平面波とHOA領域フーリエ展開との間の伝達行列であり、
εは、負でない実数である。
当該方法は、平面波利得のベクトルβplw−csについて、以下の凸計画問題を解決するステップを含み得る。
ここでの凸計画問題とは、
Figure 0005773540

及び
Figure 0005773540

の条件で、||βplw−cs||を最小にする問題である。
γ=BHOAomniであり、
plw/HOAは、平面波とHOA領域フーリエ展開との間の伝達行列であり、
εは、負でない実数であり、
εは、負でない実数である。
当該方法は、1組の解析平面波に対応する1組の方向の空間分割の解に基づいてεを設定するステップと、音場の計算されたスパース性に基づいてεの値を設定するステップとを含み得る。方法は、βplw−csを閾値処理し、クリーニングして、その小さい成分のいくつかをゼロに設定するステップを含み得る。
当該方法は、平面波基準に従って行列
Figure 0005773540

を形成し、次いでβplw−csにおけるゼロ以外の成分に対応する列のみを保持することによって
Figure 0005773540


Figure 0005773540

に縮小するステップを含むことができ、式中、
Figure 0005773540

は平面波基準についてのHOA方向行列であり、
Figure 0005773540

におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
当該方法は、gplw−cs−reduced(t)を
Figure 0005773540

により計算するステップを含み得る。さらに、gplw−cs(t)が平面波基準に一致するように、ゼロの時間信号の行を挿入することによって、gplw−cs−reduced(t)を拡大して、gplw−cs(t)を取得するステップを含み得る。
当該方法は、行列Gplwについて、以下の凸計画問題を解決するステップを含み得る。
ここでの凸計画問題とは、||Yplwplw−BHOA||L2≦ε
の条件で、||Gplw||L1−L2を最小にする問題である。
plwは、列が何らかの組の解析平面波に対応する1組の方向についての球面調和関数の値である行列(高い球面調和次数に切り捨てられる)であり、
εは、負でない実数である。
当該方法は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップを含み得る。
Π=(1−α)ΠL−1+αGplwpinv(BHOA
式中、ΠL−1は、L−1時間フレームについての非混合行列を指し、
αは、0≦α≦1となるような忘却因子である。
当該方法は、特異値分解をBHOAに適用して、行列分解
HOA=USV
を取得するステップを含み得る。
当該方法は、mがBHOAの行の数である場合、Sの最初のm個の列のみを保持することによって行列Sreducedを形成し、
Ω=USreduced
によって得られる行列Ωを形成するステップを含み得る。
当該方法は、行列Γについて、以下の凸計画問題を解決するステップを含み得る。
ここでの凸計画問題とは、||YplwΓ−Ω||L2≦ε
の条件で、||Γ||L1−L2を最小にする問題である。
ε及びYplwは、上記に定義した通りである。
当該方法は、以下を使用して、ΓからGplwを取得するステップを含み得る。
plw=ΓV
式中、Vは、BHOAの行列分解から取得される。
当該方法は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップを含み得る。
Π=(1−α)ΠL−1+αΓpinv(Ω)
式中、ΠL−1は、L−1時間フレームについての非混合行列であり、
αは、0≦α≦1となるような忘却因子である。
当該方法は、以下を使用してGplw−smoothを取得するステップを含み得る。
plw−smooth=ΠHOA
当該方法は、標準の重畳加算技術を使用して、平面波時間サンプルの集まりGplw−smoothから平面波信号のベクトルgplw−cs(t)を取得するステップを含み得る。代わりに、平面波信号のベクトルgplw−cs(t)を取得するとき、当該方法は、標準の重畳加算技術を使用して平滑化することなく、平面波時間サンプルの集まりGplwからgplw−cs(t)を取得するステップを含み得る。方法は、gplw−cs(t)の各エントリによりソース方向を識別するステップを含み得る。
当該方法は、gplw−cs(t)を変更して、残響などの不要なアーチファクト及び/又は不要な音源を低減するステップを含み得る。さらに、当該方法は、残響を低減するために、信号ベクトルgplw−cs(t)における信号のうちのいくつかの信号値を低減するステップを含み得る。方法は、不要な音源が低減され得るように、音場の再構築において音源を分離するために、信号ベクトルgplw−cs(t)における信号のうちのいくつかをゼロに設定するステップを含み得る。
さらに、当該方法は、再構築された音場の再生の手段に応じてgplw−cs(t)を変更するステップを含み得る。再構築された音場がスピーカを介して再生されることになっているとき、一実施形態において、当該方法はgplw−cs(t)を以下の通り変更するステップを含み得る。
spk(t)=Pphw/spkplw−cs(t)
式中、Pphw/spkは、スピーカパニング行列(loudspeaker panning matrix)である。
再構築された音場がスピーカを介して再生されることになっているとき、当該方法は、
Figure 0005773540
を計算することによって、gplw−cs(t)をHOA領域に変換し直すステップを含み得る。式中、bHOA−highres(t)は、任意のHOA領域次数に展開することができるgplw−cs(t)の高分解能のHOA領域表現であり、
Figure 0005773540
は、平面波基準のHOA方向行列であり、
Figure 0005773540
におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。方法は、HOAデコード技術を使用して、bHOA−highres(t)をgspk(t)にデコードするステップを含み得る。
再構築された音場がヘッドホンを介して再生されることになっているとき、当該方法は、gplw−cs(t)を以下の通り変更してヘッドホン利得を決定するステップを含み得る。
Figure 0005773540

この式中、Pplw/hph(t)は、1組の平面波方向に対応するフィルタの頭部インパルス応答行列である。
本開示は、上述したように方法を実行するようにプログラムされるとき、コンピュータに拡張する。
また、本開示は、コンピュータが上述されたように方法を実行することができるようにコンピュータ可読媒体に拡張する。
記録された音場を再構築し、また記録された音場のスパース性を推定するための機器の一実施形態のブロック図を示す図である。 図1の機器を使用して記録された音場のスパース性を推定することに関与するステップのフローチャートを示す図である。 図1の機器を使用して記録された音場のスパース性を推定することに関与するステップのフローチャートを示す図である。 図1の機器を使用して記録された音場のスパース性を推定することに関与するステップのフローチャートを示す図である。 図1の機器を使用して記録された音場のスパース性を推定することに関与するステップのフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。 記録された音場を再構築するためのHOAの解の写真表現の第1の例をそれぞれ示す図である。 記録された音場を再構築するための最初の音場の写真表現の第1の例をそれぞれ示す図である。 記録された音場を再構築するための本開示によって提供される解の写真表現の第1の例をそれぞれ示す図である。 記録された音場を再構築するためのHOAの解の写真表現の第2の例をそれぞれ示す図である。 記録された音場を再構築するための最初の音場の写真表現の第2の例をそれぞれ示す図である。 記録された音場を再構築するための本開示によって提供される解の写真表現の第2の例をそれぞれ示す図である。
図面の図1において、参照番号10は、記録された音場を再構築し、及び/又は音場のスパース性を推定するための機器の一実施形態を全般的に示す。機器10は、音場を測定して記録されたデータを取得するための検知装置12を含む。検知装置12は、例えばマイクロプロセッサなどの信号処理モジュール14に接続されており、信号処理モジュール14は、記録されたデータを処理して、平面波信号を取得して、記録された音場を再構成できるようにし、及び/又は記録されたデータを処理して、音場のスパース性を取得する。音場のスパース性、分離された平面波ソース、及びその関連のソース方向は、出力ポート24を介して提供される。簡潔にするために、信号処理モジュール14は、以下、SPM14と呼ばれる。
データアクセスモジュール16は、SPM14に接続される。一実施形態において、データアクセスモジュール16は、データが格納されるメモリモジュールである。SPM14は、必要に応じて、メモリモジュールにアクセスして、メモリモジュールから必要なデータを取り出す。他の実施形態では、データアクセスモジュール16は、SPM14が遠隔地からデータを取り出すことができるようにするための、例えばモデムなどの接続モジュールである。
機器10は、再構築された音場を再生するための再生モジュール18を含む。再生モジュール18は、スピーカアレイ20及び/又は1つ又は複数のヘッドホン22を備える。
検知装置12は、音場を記録して、1組の信号smic(t)の形で記録されたデータを生成するためのバフル付き球状マイクロフォンアレイである。
SPM14は、平面波解析を使用して音場に関係する記録されたデータを解析して、平面波信号のベクトルgplw(t)を生成する。平面波信号のベクトルgplw(t)を生成することは、関連の1組の平面波ソース方向を取得することとしても理解されたい。平面波振幅のベクトルを生成するために使用される特定の方法に応じて、gplw(t)は、より詳細には、圧縮検知技術が使用される場合、gplw−cs(t)と呼ばれ、又はICA技術が使用される場合、gplw−ica(t)と呼ばれる。以下でさらに詳しく説明されるように、SPM14は、必要に応じてgplw(t)を変更するためにも使用される。
SPM14は、一旦その解析を実行すると、音場のスパース性、分離された平面波ソース信号、及び平面波ソース信号の関連のソース方向を含み得る出力ポート24の出力データを生成する。さらに、SPM14は、一旦その解析を実行すると、信号sout(t)を生成して、スピーカアレイ20及び/又は1つ又は複数のヘッドホン22を介して再生される音声として決定されたgplw(t)をレンダリングする。
信号がマイクロフォンアレイ12によって記録された後、SPM14は、1組の信号smic(t)に一連の操作を実行して、信号を、記録された音場に著しく近似する音場に再構築できるようにする。
信号処理操作を簡潔に説明するために、マイクロフォンアレイ12を特徴付ける1組の行列が定義される。これらの行列は、SPM14によって必要に応じて計算されるようにしてもよく、又はデータアクセスモジュール16を使用してデータストレージから必要に応じて取り出されるようにしてもよい。これらの行列のうちの1つは、言及されるとき、「定義済み行列のうちの1つ」として表される。
以下は、必要に応じて計算され得る又は取り出され得る定義済み行列のリストである。
Figure 0005773540

は、球面調和領域とマイクロフォン信号との間の伝達行列であり、行列
Figure 0005773540

は、以下の通り次数Mに切り捨てられる。
Figure 0005773540

式中、
Figure 0005773540

は、列が球面調和関数
Figure 0005773540

の値である行列の転置であり、式中、(r,θ,φ)はl番目のマイクロフォンについての極座標であり、
Figure 0005773540

におけるハット演算子は、その行列が何らかの次数Mに切り捨てられたことを示し、
Figure 0005773540

は、係数が
Figure 0005773540

によって定義される対角行列であり、式中、Rは、マイクロフォンアレイの球体の半径であり、h (2)は、第2の種類の次数mの球ハンケル関数であり、jは、次数mの球ベッセル関数であり、j’’及びh’ (2)はそれぞれj及びh (2)の派生物である。この場合もまた、
Figure 0005773540

におけるハット演算子は、その行列が何らかの次数Mに切り捨てられたことを示す。
sph/micは、かなり高い次数M’’(M’’>M)に切り捨てられたことを除いて、
Figure 0005773540

と類似する。
plwは、列が何らかの組の解析平面波に対応する1組の方向についての球面調和関数の値である行列(高い次数M’’に切り捨てられる)である。
Figure 0005773540

は、低次のM(M<M’’)に切り捨てられたことを除いて、Yplwと類似する。
plw/HOAは、以下の通り、解析平面波と(マイクロフォンアレイ12から導出された)HOA推定球面調和の展開との間の伝達行列である。
Figure 0005773540
plw/micは、以下の通り、解析平面波とマイクロフォンアレイ12との間の伝達行列である。
plw/mic=Tsph/micplw
式中、Tsph/micは、上記で定義された通りである。
mic/HOA(t)は、畳込み演算を介して、マイクロフォンアレイ12の時間信号とHOA領域の時間信号との間にその変形を実施するフィルタの行列であり、以下の通り定義される。
mic/HOA(t)=IFFT(Emic/HOA(ω))
式中、Emic/HOA(ω)の各周波数成分は、
Figure 0005773540

によって得られる。
次に、図面の図2〜図16に示されるフローチャートを参照して、信号の組smic(t)に実行される操作について説明される。図2に示されるフローチャートは、記録された音場のスパース性(S)を推定するための操作のフローの概要を示す。このフローチャートは、図3〜図5における高レベルの詳細に分けられる。図6に示されるフローチャートは、記録された音場を再構築するための操作のフローの概要を示す。図6のフローチャートは、図7〜図16における高レベルの詳細に分けられる。
次に、図2〜図5のフローチャートを参照して、音場のスパース性Sを決定するために、SPM14によって信号の組smic(t)に対して実行される操作について説明される。図2において、ステップ1で、1組の信号smic(t)を記録するために、マイクロフォンアレイ12が使用される。ステップ2で、SPM14は、音場のスパース性を推定する。
図3に示されるフローチャートは、ステップ2の計算の詳細について説明する。ステップ2.1で、SPM14は、HOA領域の時間信号のベクトルbHOA(t)を以下の通り計算する。
Figure 0005773540

ステップ2.2で、ステップ2.2.A及びステップ2.2.Bの利用可能な2つの異なるオプションがある。ステップ2.2.Aで、SPM14は、HOA領域においてICAを適用することによって、音場のスパース性を推定する。代わりに、ステップ2.2.Bで、SPM14は、圧縮サンプリング技術を使用して音場のスパース性を推定する。
図4のフローチャートは、ステップ2.2.Aの詳細について説明する。ステップ2.2.A.1で、SPM14は、独立成分解析技術を使用して、混合行列MICAを決定する。
ステップ2.2.A.2で、SPM14は、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影する。この投影は、
Figure 0005773540

を計算することによって取得され、式中、
Figure 0005773540

は、定義済み行列
Figure 0005773540

の転置である。
ステップ2.2.A.3で、SPM14は、Vsource−cleanを取得するために、閾値処理技術を適用して、Vsourceをクリーニングする。Vsourceのクリーニングの操作は、以下の通りに行われる。まず、Vsourceの理想的なフォーマットが定義される。Vsourceは、理想的には、すべての成分をゼロとして有する、又は特定の平面波方向に対応する単一の優位な成分を含み、列の残りの成分がゼロである、列から成る行列である。閾値処理技術は、Vsourceがその理想的なフォーマットになることを確実にするために適用される。すなわち、優位な成分未満のすべての成分がゼロに設定されるように、列の残りの成分と比較して優位な値を含むVsourceの列は閾値処置される。また、優位な成分を有していないVsourceの列では、その成分のすべてがゼロに設定される。上記の閾値処理操作をVsourceに適用することによって、Vsource−cleanが得られる。
ステップ2.2.A.4で、SPM14は、音場のスパース性を計算する。SPM14は、Vsource−cleanの優位な平面波方向の数Nsourceを計算することによって、このステップを行う。次いでSPM14は、音場のスパース性Sを
Figure 0005773540

の通り計算する。式中、Nplwは、解析平面波基準方向の数である。
図5のフローチャートは、図3におけるステップ2.2.Bの詳細について説明し、ステップ2.2.Bは、ステップ2.2.Aの代替である。ステップ2.2.B.1で、SPM14は、時間が行列BHOAの行に沿って並び、様々なHOA次数が行列BHOAの列に沿って並ぶように、bHOA(t)における各信号をBHOAの行に沿って並ぶように設定することによって、HOA信号のベクトルbHOA(t)から、行列BHOAを計算する。より詳細には、SPM14は、Lによってラベル表示される所与の時間フレームにわたってbHOA(t)をサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得する。したがって、SPM14は、各時刻で1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得する。次いでSPM14は、以下によって行列BHOAを形成する。
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
ステップ2.2.B.2で、SPM14は、相関ベクトルγを
γ=BHOAomni
の通り計算する。式中、bomniは、列ベクトルとして表されるbHOA(t)の全方向のHOA成分である。
ステップ2.2.B.3で、SPM14は、平面波利得のベクトルβplw−csを取得するために、以下の凸計画問題を解決する。
ここでの凸計画問題とは、
Figure 0005773540

の条件で、||βplw−cs||を最小にする問題である。
plw/HOAは定義済み行列のうちの1つであり、εは負でない実数である。
ステップ2.2.B.4で、SPM14は、音場のスパース性を推定する。SPM14は、その優位な成分の数Ncompを推定するために、閾値処理技術をβplw−csに適用することによって、このステップを行う。次いで、SPM14は、音場のスパース性Sを
Figure 0005773540

の通り計算し、式中、Nplwは、解析平面波基準方向の数である。
次に、音場を再構築するために、SPM14によって信号の組smic(t)に実行される操作が説明され、図6〜図23のフローチャートを使用して示される。
図6において、ステップ1及びステップ2は、上述された図2のフローチャートと同じである。しかし、図6の操作フローで、ステップ2は、オプションであり、したがって、点線ボックスによって表される。
ステップ3で、SPM14は、音場を再構築することができるように、平面波信号gplw(t)の形でパラメータを推定する。平面波信号gplw(t)は、導出の方法に応じて、gplw−cs(t)又はgplw−ica(t)のいずれかとして表される。ステップ4で、残響を低減し、及び/又は不要な音を分離するために、推定されたパラメータがSPM14によって変更されるオプションのステップ(点線ボックスによって表される)がある。ステップ5で、SPM14は、音場を再構築し、再生するために使用される(場合によっては変更された)平面波信号gplw−cs(t)又はgplw−ica(t)を推定する。
ステップ1及びステップ2の操作は上述されており、次にステップ3に含まれる操作のフローについて説明される。
図7のフローチャートは、図6に示されるフローチャートのステップ3に必要とされる操作の概要を示す。図7のフローチャートは、ステップ3.A、ステップ3.B、ステップ3.C、及びステップ3.Dの4つの利用可能な異なるパスがあることを示す。
ステップ3.Aで、SPM14は、時間領域において圧縮サンプリング技術を使用して平面波信号を推定する。ステップ3.Bで、SPM14は、周波数領域において圧縮サンプリング技術を使用して平面波信号を推定する。ステップ3.Cで、SPM14は、HOA領域においてICAを使用して平面波信号を推定する。ステップ3.Dで、SPM14は、多重測定ベクトル技術を使用して時間領域において圧縮サンプリングを使用して平面波信号を推定する。
図8に示されるフローチャートは、ステップ3.Aの詳細について説明する。ステップ3.A.1で、bHOA(t)及びBHOAは、それぞれステップ2.1及びステップ2.2.B.1について上述されたようにSPM14によって決定される。
ステップ3.A.2で、相関ベクトルγは、ステップ2.2.B.2について上述されたようにSPM14によって決定される。
ステップ3.A.3で、ステップ3.A.3.A及びステップ3.A.3.Bの2つのオプションがある。ステップ3.A.3.Aで、SPM14は、平面波方向利得βplw−csを決定するために、凸計画問題を解決する。この凸計画問題は、スパース制約を含まない。より詳細には、以下の凸計画問題が解決される。
ここでの凸計画問題とは、
Figure 0005773540

の条件で、||βplw−cs||を最小にする問題である。
γは上記で定義された通りであり、Tplw/HOAは定義済み行列のうちの1つであり、
εは、負でない実数である。
ステップ3.A.3.Bで、SPM14は、平面波方向利得βplw−csを決定するために、凸計画問題を解決し、今回のみ、スパース制約は、凸計画問題に含まれる。より詳細には、以下の凸計画問題は、βplw−csを決定するために解決される。
ここでの凸計画問題とは、
Figure 0005773540

及び
Figure 0005773540

の条件で、||βplw−cs||を最小にする問題である。
γ、εは上記で定義された通りであり、
plw/HOAは、定義済み行列のうちの1つであり、
εは、負でない実数である。
ステップ3.A.3での凸計画問題について、εは、解析平面波の組に対応する1組の方向の空間分割の解に基づいて、SPM14によって設定され得る。さらに、εの値は、音場の計算されたスパース性に基づいて、SPM14によって設定され得る(オプションのステップ2)。
ステップ3.A.4で、SPM14は、その小さい成分のうちのいくつかがゼロに設定されるように、閾値処理技術を適用して、βplw−csをクリーニングする。
ステップ3.A.5で、SPM14は、平面波基準に従って行列
Figure 0005773540

を形成し、次いでβplw−csにおけるゼロ以外の成分に対応する列のみを保持することによって、
Figure 0005773540


Figure 0005773540

に縮小する。式中、
Figure 0005773540

は平面波基準のHOA方向行列であり、
Figure 0005773540

におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
ステップ3.A.6で、SPM14は、gplw−cs−reduced(t)を以下の通り計算する。
plw−cs−reduced(t)=pinv(Tplw/HOA−reduced)bHOA(t)
式中、
Figure 0005773540

及びbHOA(t)は、上記で定義した通りである。
ステップ3.A.7で、SPM14は、解析のために使用された平面波基準と一致させるためにゼロの時間信号の行を挿入することによって、gplw−cs−reduced(t)を拡大してgplw−cs(t)を取得する。
上述したように、ステップ3.Aの代替は、ステップ3.Bである。図9のフローチャートは、ステップ3.Bを詳述する。ステップ3.B.1で、SPM14は、bHOA(t)を
Figure 0005773540

により計算する。さらに、ステップ3.B.1で、SPM14は、smic(t)のFFT、smic、及び/又はbHOA(t)のFFT、bHOAを計算する。
ステップ3.B.2で、SPM14は、4つのオプションの凸計画問題のうちの1つを解決する。ステップ3.B.2.Aに示される凸計画問題は、smicに対して演算を行い、スパース制約を使用しない。より正確には、SPM14は、gplw−csを決定するために、以下の凸計画問題を解決する。
ここでの凸計画問題とは、
Figure 0005773540

の条件で、||gplw−cs||を最小にする問題である。
plw/micは、定義済み行列のうちの1つであり、
micは、上記で定義された通りであり、
εは、負でない実数である。
ステップ3.B.2.Bに示される凸計画問題は、smicに対して演算を行い、スパース制約を含む。より正確には、SPM14は、gplw−csを決定するために、以下の凸計画問題を解決する。
ここでの凸計画問題とは、
Figure 0005773540

及び
Figure 0005773540

の条件で、||gplw−cs||を最小にする問題である。
plw/mic、Tplw/HOAはそれぞれ、定義済み行列のうちの1つであり、
mic、bHOA、εは、上記で定義された通りであり、
εは、負でない実数である。
ステップ3.B.2.Cに示される凸計画問題は、bHOAに対して演算を行い、スパース制約を使用しない。より正確には、SPM14は、gplw−csを決定するために、以下の凸計画問題を解決する。
ここでの凸計画問題とは、
Figure 0005773540

の条件で、||gplw−cs||を最小にする問題である。
plw/mic、Tplw/HOAはそれぞれ、定義済み行列のうちの1つであり、
HOA、及びεは、上記で定義された通りである。
ステップ3.B.2.Dに示される凸計画問題は、bHOAに対して演算を行い、スパース制約を含む。より正確には、SPM14は、gplw−csを決定するために、以下の凸計画問題を解決する。
ここでの凸計画問題とは、
Figure 0005773540

及び
Figure 0005773540

の条件で、||gplw−cs||を最小にする問題である。
plw/mic、Tplw/HOA、Tmic/HOAはそれぞれ、定義済み行列のうちの1つであり、
HOA、ε、及びεは、上記で定義された通りである。
ステップ3.B.3で、SPM14は、gplw−cs(t)を取得するために、gplw−csの逆FFTを計算する。複数の時間フレームに対して演算を行うとき、重畳加算手順に従う。
ステップ3.A又はステップ3.Bに対するさらなるオプションは、ステップ3.Cである。図10のフローチャートは、ステップ3.Cの概要を提供する。ステップ3.C.1で、SPM14は、bHOA(t)を
Figure 0005773540

により計算する。
ステップ3.C.2で、ステップ3.C.2.A及びステップ3.C.2.Bの2つのオプションがある。ステップ3.C.2.Aで、SPM14は、HOA領域においてICAを使用して、混合行列を推定し、混合行列は、次いでgplw−ica(t)を取得するために使用される。代わりに、ステップ3.C.2.Bで、SPM14は、HOA領域においてICAを使用して、混合行列、及び1組の分離されたソース信号も推定する。次いで、混合行列及び分離されたソース信号は、gplw−ica(t)を取得するために、SPM14によって使用される。
図11のフローチャートは、ステップ3.C.2.Aの詳細について説明する。ステップ3.C.2.A.1で、SPM14は、混合行列MICAを取得するために、ICAを信号のベクトルbHOA(t)に適用する。
ステップ3.C.2.A.2で、SPM14は、ステップ2.2.A.2に記載されているように、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影する。すなわち、投影は、
Figure 0005773540

を計算することによって取得され、式中、
Figure 0005773540

は、定義済み行列
Figure 0005773540

の転置である。
ステップ3.C.2.A.3で、SPM14は、Vsourceにおける優位な平面波方向を識別するために、閾値処理技術をVsourceに適用する。ステップ3.C.2.A.3は、ステップ2.2.A.3を参照して上述した操作と同様に達成される。
ステップ3.C.2.A.4で、ステップ3.C.2.A.4.A及びステップ3.C.2.A.4.Bの2つのオプションがある。ステップ3.C.2.A.4.Aで、SPM14は、HOA領域行列
Figure 0005773540

を使用して、gplw−ica−reduced(t)を計算する。代わりに、ステップ3.C.2.A.4.Bで、SPM14は、マイクロフォン信号smic(t)及び行列Tplw/micを使用して、gplw−ica−reduced(t)を計算する。
図12のフローチャートは、ステップ3.C.2.A.4.Aの詳細について説明する。ステップ3.C.2.A.4.A.1で、SPM14は、行列Vsourceと関連した優位なソース方向に対応しない
Figure 0005773540

における平面波方向ベクトルを削除することによって、行列
Figure 0005773540

を縮小して、行列
Figure 0005773540

を取得する。
ステップ3.C.2.A.4.A.2で、SPM14は、gplw−ica−reduced(t)を
Figure 0005773540

により計算する。式中、
Figure 0005773540

及びbHOA(t)は、上記で定義した通りである。
ステップ3.C.2.A.4.Aの代替は、ステップ3.C.2.A.4.Bである。図13のフローチャートは、ステップ3.C.2.A.4.Bを詳述する。
ステップ3.C.2.A.4.B.1で、SPM14は、smic(t)のFFT、smicを計算する。ステップ3.C.2.A.4.B.2で、SPM14は、行列Vsourceと関連した優位なソース方向に対応しないTplw/micにおける平面波方向ベクトルを削除することによって、行列Tplw/micを縮小して、行列Tplw/mic−reducedを取得する。
ステップ3.C.2.A.4.B.3で、SPM14は、gplw−ica−reduced
plw−ica−reduced=pinv(Tplw/mic−reduced)smic
の通り計算し、式中、Tplw/mic−reduced及びsmicは、上記で定義された通りである。
ステップ3.C.2.A.4.B.4で、SPM14は、gplw−ica−reducedのIFFTとして、gplw−ica−reduced(t)を計算する。
図11に戻って、ステップ3.C.2.A.5で、SPM14は、解析のために使用された平面波基準と一致させるためにゼロの時間信号の行を挿入することによって、gplw−ica−reduced(t)を拡大してgplw−ica(t)を取得する。
ステップ3.C.2.Aの代替は、ステップ3.C.2.Bである。図14のフローチャートは、ステップ3.C.2.Bの詳細について説明する。
ステップ3.C.2.B.1で、SPM14は、混合行列MICA、及び1組の分離されたソース信号gica(t)を取得するために、ICAを信号bHOA(t)のベクトルに適用する。
ステップ3.C.2.B.2で、SPM14は、ステップ2.2.A.2に記載されているように、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影し、すなわち、投影は、
Figure 0005773540

を計算することによって取得され、式中、
Figure 0005773540

は、定義済み行列
Figure 0005773540

の転置である。
ステップ3.C.2.B.3で、SPM14は、Vsourceにおける優位な平面波方向を識別するために、閾値処理技術をVsourceに適用する。ステップ3.C.2.B.3は、ステップ2.2.A.3のために上述した操作と同様に達成される。一旦Vsourceにおける優位な平面波方向が識別されると、SPM14は、gica(t)をクリーニングして、優位な平面波方向Vsourceに対応する信号を保持し、他の信号をゼロに設定するgplw−ica(t)を取得する。
上述したように、ステップ3.A、3.B、及び3.Cに対するさらなるオプションは、ステップ3.Dである。図15のフローチャートは、ステップ3.Dの概要を示す。
ステップ3.D.1で、SPM14は、bHOA(t)をbHOA
Figure 0005773540

の通り計算する。次いでSPM14は、時間が行列BHOAの行に沿って並び、様々なHOA次数が行列BHOAの列に沿って並ぶように、bHOA(t)における各信号をBHOAの行に沿って並ぶように設定することによって、HOA信号のベクトルbHOA(t)から、行列BHOAを計算する。より詳細には、SPM14は、所与の時間フレームLにわたってbHOA(t)をサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得する。したがって、SPM14は、各時刻で1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得する。SPM14は、以下によって行列BHOAを形成する。
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
ステップ3.D.2で、ステップ3.D.2.A及びステップ3.D.2.Bの2つのオプションがある。ステップ3.D.2.Aで、SPM14は、BHOAに直接適用される多重測定ベクトル技術を使用して、gplw−csを計算する。代わりに、ステップ3.D.2.Bで、SPM14は、BHOAの特異値分解に基づいて多重測定ベクトル技術を使用してgplw−csを計算する。
図16のフローチャートは、ステップ3.D.2.Aの詳細について説明する。ステップ3.D.2.A.1で、SPM14は、Gplwを決定するために、以下の凸計画問題を解決する。
ここでの凸計画問題とは、||Yplwplw−BHOA||L2≦ε
の条件で、||Gplw||L1−L2を最小にする問題である。
plwは、定義済み行列のうちの1つであり、
HOAは、上記で定義した通りであり、
εは、負でない実数である。
ステップ3.D.2.A.2で、2つのオプション、すなわちステップ3.D.2.A.2.A及びステップ3.D.2.A.2.Bがある。ステップ3.D.2.A.2.Aで、SPM14は、重畳加算技術を使用して、Gplwから直接gplw−cs(t)を計算する。代わりに、ステップ3.D.2.A.2.Bで、SPM14は、Gplwの平滑化バージョン及び重畳加算技術を使用してgplw−cs(t)を計算する。
図17のフローチャートは、ステップ3.D.2.A.2.Bについてより詳細に説明する。
ステップ3.D.2.A.2.B.1で、SPM14は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを計算する。
Π=(1−α)ΠL−1+αGplwpinv(BHOA
式中、ΠL−1は、L−1時間フレームについての非混合行列を指し、αは、0≦α≦1となるような忘却因子であり、BHOAは、上記で定義された通りである。
ステップ3.D.2.A.2.B.2で、SPM14は、Gplw−smoothを以下の通り計算する。
plw−smooth=ΠHOA
式中、Π及びBHOAは、上記で定義された通りである。
ステップ3.D.2.A.2.B.3で、SPM14は、重畳加算技術を使用してGplw−smoothからgplw−cs(t)を計算する。
ステップ3.D.2.Aの代替は、ステップ3.D.2.Bである。図18のフローチャートは、ステップ3.D.2.Bの詳細について説明する。
ステップ3.D.2.B.1で、SPM14は、BHOAの特異値分解を計算して、行列分解を取得する。
HOA=USV
ステップ3.D.2.B.2で、SPM14は、mがBHOAの行の数である場合、Sの最初のm個の列のみを保持することによって行列Sreducedを計算する。
ステップ3.D.2.B.3で、SPM14は、行列Ωを以下の通り計算する。
Ω=USreduced
ステップ3.D.2.B.4で、SPM14は、行列Γについて、以下の凸計画問題を解決する。
ここでの凸計画問題とは、||YplwΓ−Ω||L2≦ε
の条件で、||Γ||L1−L2を最小にする問題である。
plwは、定義済み行列のうちの1つであり、
Ωは、上記で定義された通りであり、
εは、負でない実数である。
ステップ3.D.2.B.5で、ステップ3.D.2.B.5.A及びステップ3.D.2.B.5.Bの2つのオプションがある。ステップ3.D.2.B.5.Aで、SPM14は、以下を使用して、ΓからGplwを計算する。
plw=ΓV
式中、Vは、上述したように、BHOAの行列分解から取得される。次いでSPM14は、重畳加算技術を使用して、Gplwから直接gplw−cs(t)を計算する。
代わりに、ステップ3.D.2.B.5.Bで、SPM14は、Gplwの平滑化バージョン及び重畳加算技術を使用してgplw−cs(t)を計算する。
図19のフローチャートは、ステップ3.D.2.B.5.Bの詳細を示す。
ステップ3.D.2.B.5.B.1で、SPM14は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを計算する。
Π=(1−α)ΠL−1+αΓpinv(Ω)
式中、ΠL−1は、L−1時間フレームについての非混合行列を指し、αは、0≦α≦1となるような忘却因子であり、Γ及びΩは、上記で定義された通りである。
ステップ3.D.2.B.5.B.2で、SPM14は、Gplw−smoothを以下の通り計算する。
plw−smooth=ΠHOA
式中、Π及びBHOAは、上記で定義した通りである。
ステップ3.D.2.B.2.B.3で、SPM14は、重畳加算技術を使用してGplw−smoothからgplw−cs(t)を計算する。
上述したように、不要なアーチファクトを低減するオプションのステップは、図6のフローチャートのステップ4に示される。SPM14は、信号ベクトルgplw(t)における信号のうちのいくつかの信号値を低減することによって、音場再構築に存在する残響の量を制御する。代わりに、又はさらに、SPM14は、信号ベクトルgplw(t)における信号のうちのいくつかをゼロに設定することによって、音場再構築で望ましくない音源を削除する。
図6のフローチャートのステップ5において、パラメータgplw(t)は、音場を再生するために使用される。図20のフローチャートは、音場の再生のための3つのオプションのパス、ステップ5.A、ステップ5.B、及びステップ5.Cを示す。図21のフローチャートは、ステップ5.Aの詳細について説明する。
ステップ5.A.1で、SPM14は、スピーカアレイ20を介して再構築された音場のスピーカの再生を可能にするために、スピーカパニング行列Pplw/spkを計算する、又はデータストレージから取り出す。パニング行列Pplw/spkは、例えばベクトルベースの振幅パニング(VBAP)など、様々なパニング技術のいずれかを使用して導出され得る。ステップ5.A.2で、SPM14は、スピーカ信号gspk(t)をgspk(t)=Pplw/spkplw(t)の通り計算する。
ステップ5.Bの詳細について説明する図22のフローチャートに別のオプションが示される。
ステップ5.B.1で、SPM14は、スピーカアレイ20を介して再構築された音場のスピーカ再生を可能にするために、bHOA−highres(t)を計算する。bHOA−highres(t)は、任意のHOA領域次数に展開することができるgplw(t)の高分解能のHOA領域表現である。SPM14は、bHOA−highres(t)を以下の通り計算する。
Figure 0005773540

式中、
Figure 0005773540

は、定義済み行列のうちの1つであり、
Figure 0005773540

におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
ステップ5.B.2で、SPM14は、HOAデコード技術を使用して、bHOA−highres(t)をgspk(t)にデコードする。
スピーカの再生の代替は、ヘッドホンの再生である。ヘッドホンの再生の操作は、図20のフローチャートのステップ5.Cに示される。図23のフローチャートは、ステップ5.Cの詳細について説明する。
ステップ5.C.1で、SPM14は、ヘッドホン22のうちの1つ又は複数を介して再構築された音場のヘッドホンの再生を可能にするために、解析平面波方向の組に対応するフィルタの頭部インパルス応答行列Pplw/hph(t)を計算する、又はデータストレージから取り出す。フィルタの頭部インパルス応答(HRIR)行列Pplw/hph(t)は、HRTF測定から導出される。
ステップ5.C.2で、SPM14は、フィルタ畳込み演算を使用して、ヘッドホン信号ghph(t)を
Figure 0005773540

により計算する。
スピーカのための基本的なHOAデコーディングが以下によって(周波数領域において)得られることを当業者であれば理解されよう。
Figure 0005773540

式中、Nspkは、スピーカの数であり、
Figure 0005773540

は、列が球面調和関数
Figure 0005773540

の値である行列の転置であり、式中、(r,θ,φ)はk番目のスピーカについての極座標であり、
Figure 0005773540

におけるハット演算子は、その行列が何らかの次数Mに切り捨てられたことを示し、
HOAは、HOA領域において表される再生信号である。
3次元の基本的なHOAデコーディングは、様々な及び任意のスピーカ構成を使用して音場を容易に再構築する能力を含むいくつかの利点を有する球面調和ベースの方法である。しかし、球面調和ベースの方法は、符号化及び復号プロセスに関連した制限も被ることを当業者であれば理解されよう。第1に、音場を観察するために有限数のセンサが使用されるので、符号化は、高周波で空間エイリアシングを被る(N.Epain及びJ.Daniel「球状マイクロフォンアレイの改良(Improving spherical microphone arrays)」Proceedings of the AES 124th Convention、2008年5月参照)。第2に、再生に使用されるスピーカの数が音場の説明において使用される球面調和成分の数より多いとき、一般に、構築された音場の忠実度の低下に気づく(A.Solvang「2次元高次アンビソニックのスペクトル障害(Spectral impairment of two dimensional higher−order ambisonics)」音響学会誌、第56巻、2008年4月、pp.267〜279参照)。
いずれの場合でも、制限は、過小決定された課題が疑似逆行列方法を使用して解決されることに関連する。本開示の場合、これらの制限は、いくつかの例において、圧縮サンプリング又はICAの一般的な原理を使用して回避される。圧縮サンプリングに関して、出願人は、平面波基準を音場のスパース領域として使用し、次いで上記で定義されたいくつかの凸計画問題のうちの1つを解析することが記録された音場の驚くほど正確な再構築につながることを見出した。平面波の説明は、定義済みの行列Tplw/micに含まれる。
標準HOAの解と圧縮サンプリングの解との間の距離は、例えば、制約
Figure 0005773540

を使用して制御され得る。εがゼロであるとき、圧縮サンプリングの解は、標準HOAの解と同じである。SPM14は、音場の計算されたスパース性に従って、εの値を動的に設定することができる。
HOA領域においてICAを適用することに関して、出願人は、HOA領域が記録された信号の瞬間的な混合を提供することから、統計的独立の適用は、かなりの利点になることを見出した。さらに、統計的独立の適用は、スパース性を解に課すように見えるという点で、圧縮サンプリングと類似しているようである。
上述したように、圧縮サンプリングの技術又はHOA領域でのICAの技術を使用して音場のスパース性を推定することが可能である。
図24A〜図24C及び図25A〜図25Cに、本開示を使用して音場再構築の電力を示すシミュレーション結果が示されている。シミュレーションにおいて、マイクロフォンアレイ12は、球体の表面上に均一に分散される32の全指向性マイクロフォンを有する4cm半径の剛性の球体である。音場は、1mの半径を有する48個のスピーカのリングを使用して再構築される。
HOAの場合、マイクロフォン利得は、最高次数4までHOA符号化される。スパース制約を含む周波数領域技術を使用し、水平面において均一に分散される360の平面波の基準を使用して、圧縮サンプリング平面波解析が実行される。ε及びεの値は、それぞれ10−3及び2に固定されている。あらゆる場合に、音場を定義する音源の方向は、水平面においてランダムに選択されている。
実施例1
図24A〜図24Cを参照すると、このシミュレーションでは、2kHzの4つの音源が使用された。HOAの解が図24Aに示され、最初の音場が図24Bに示され、本開示の技術を使用した解が図24Cに示される。明確に、記載された方法は、標準のHOA方法よりよく機能する。
実施例2
図25A〜図25Cを参照すると、このシミュレーションでは、16kHzの12の音源が使用された。上述したように、HOAの解が図25Aに示され、最初の音場が図25Bに示され、本開示の技術を使用した解が図25Cに示される。図25A〜図25Cの結果は、マイクロフォンアレイのシャノン−ナイキスト空間エイリアシング制限外で取得され、しかし音場の正確な再構築を依然として提供することを、当業者であれば理解されたい。
スイートスポットがより大きくなるように、向上した及びより強い音場の再構築が提供されることは、記載された実施形態の利点である。システムを定義しているパラメータが過小制約されているとき、再構築の品質の劣化は、仮にあるとしてもわずかしかなく、スピーカの数が増加するにつれて、再構築の精度は向上する。
広義に記載される本開示の範囲を逸脱することなく、特定の実施形態に示されるように、多数の変形及び/又は変更が本開示に加えられてもよいことを当業者であれば理解されよう。したがって、本実施形態は、あらゆる点で、制限としてではなく、例示として考慮されるものとする。

Claims (10)

  1. 記録された音場を再構築する方法であって、
    時間領域技術及び周波数領域技術のうちの一方を使用して、スパース領域における記録されたデータを解析するステップと、
    周波数領域技術を使用するとき、FFTを使用して1組の信号s mic (t)を周波数領域に変換してs mic を取得して、以下の第1の凸計画問題を解決することによって、前記記録された音場の平面波解析を行い、周波数領域の平面波形振幅のベクトルg plw−cs を生成し、
    前記第1の凸計画問題は、
    Figure 0005773540
    という条件で、||g plw−cs || を最小にする問題であり、
    式中で、T plw/mic が、前記平面波とマイクロフォンとの間の伝達行列であり、
    mic が、マイクロフォンアレイによって記録される前記1組の信号であり、
    ε が、負でない実数であり、
    時間領域技術を使用するとき、信号s mic (t)から行列B HOA を取得し、以下の第2の凸計画問題を解決することによって、前記記録された音場の平面波解析を行い、時間領域の平面波形信号の行列G plw を生成し、
    前記第2の凸計画問題は、
    ||Y plw plw −B HOA || L2 ≦ε という条件で、
    ||G plw || L1−L2 を最小にする問題であり、
    式中のY plw が、列が何らかの組の解析平面波に対応する1組の方向についての球面調和関数の値である行列であり、
    ε が、負でない実数である、ステップと、
    前記記録された音場を再構築することができるように、選択された技術から生成された平面波信号及びその関連のソース方向を取得するステップと、
    を含む方法。
  2. 前記方法は、
    周波数領域技術により、平面波振幅の前記ベクトルgplw−csについて、以下の第3の凸計画問題を解決することによって、前記記録された音場の前記平面波解析を行うステップであって、
    前記第3の凸計画問題とは、
    Figure 0005773540
    及び、
    Figure 0005773540
    という条件で、||gplw−cs||を最小にする問題であり、
    式中で、Tplw/micが、前記平面波と前記マイクロフォンとの間の伝達行列であり、
    micが、前記マイクロフォンアレイによって記録される前記1組の信号であり、
    εが、負でない実数であり、
    mic/HOAが、前記平面波とHOA領域フーリエ展開との間の伝達行列であり、
    HOAが、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、式中、Tmic/HOAが前記マイクロフォンと前記HOA領域フーリエ展開との間の伝達行列であり、
    εが、負でない実数である、当該記録された音場の前記平面波解析を行うステップ、
    をさらに含む、請求項1に記載の方法。
  3. 前記方法は、
    前記1組の解析平面波に対応する1組の方向の空間分割の解に基づいて、εを設定するステップと、
    前記音場の計算されたスパース性に基づいてεの値を設定するステップと、
    をさらに含む、請求項2に記載の方法。
  4. 前記方法は、
    時間領域技術により、Π=(1−α)ΠL−1+αGplwpinv(BHOA
    を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップであって、
    式中のΠL−1は、L−1時間フレームについての前記非混合行列を指し、αが、0≦α≦1となるような忘却因子である、当該非混合行列Πを取得するステップと、
    plw−smooth=ΠHOA という式を使用してGplw−smoothを取得するステップと、
    をさらに含む、請求項1〜3の何れか一項に記載の方法。
  5. 前記方法は、
    特異値分解をBHOAに適用して、行列分解
    HOA=USV を取得するステップと、
    mがBHOAの行の数であるとして、Sの最初のm個の列のみを保持することによって行列Sreducedを形成し、Ω=USreducedという式で与えられる行列Ωを形成するステップと、
    行列Γについて、以下の凸計画問題を解決するステップであって、
    前記凸計画問題とは、||YplwΓ−Ω||L2≦εという条件で、
    ||Γ||L1−L2を最小にする問題であり、
    式中のε及びYplwが、前記のように定義された通りである、当該凸計画問題を解決するステップと、
    をさらに含む、請求項4に記載の方法。
  6. 前記方法は、
    plw=ΓV
    という式を使用して、ΓからGplwを取得するステップであって、
    式中のVがBHOAの前記行列分解から取得される、当該取得するステップ、
    をさらに含む、請求項5に記載の方法。
  7. 前記方法は、
    Π=(1−α)ΠL−1+αΓpinv(Ω)
    を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップであって、
    式中のΠL−1が、前記L−1時間フレームについての非混合行列であり、αが、0≦α≦1となるような忘却因子である、当該非混合行列Πを取得するステップと、
    plw−smooth=ΠHOA という式を使用してGplw−smoothを取得するステップと、
    をさらに含む、請求項6に記載の方法。
  8. 前記方法は、
    Figure 0005773540
    によってgplw−cs(t)を前記HOA領域に変換し直すステップであって、
    式中のbHOA−highres(t)が、任意のHOA領域次数に展開することができるgplw−cs(t)の高分解能のHOA領域表現であり、
    Figure 0005773540
    が、平面波基準のHOA方向行列であり、
    Figure 0005773540
    におけるハット演算子が、その行列が何らかのHOA次数Mに切り捨てられたことを示す、当該変換し直すステップ、
    をさらに含む、請求項2に記載の方法。
  9. 請求項1〜8のいずれか一項に記載の方法を実行するように構成されたコンピュータ。
  10. コンピュータに、請求項1〜8のいずれか一項に記載の方法に含まれたステップを実行させるためのプログラム、を記録したコンピュータ読み取り可能な記録媒体。
JP2012532418A 2009-10-07 2010-10-06 記録された音場の再構築 Expired - Fee Related JP5773540B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2009904871A AU2009904871A0 (en) 2009-10-07 Reconstruction of a recorded sound field
AU2009904871 2009-10-07
PCT/AU2010/001312 WO2011041834A1 (en) 2009-10-07 2010-10-06 Reconstruction of a recorded sound field

Publications (2)

Publication Number Publication Date
JP2013507796A JP2013507796A (ja) 2013-03-04
JP5773540B2 true JP5773540B2 (ja) 2015-09-02

Family

ID=43856294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012532418A Expired - Fee Related JP5773540B2 (ja) 2009-10-07 2010-10-06 記録された音場の再構築

Country Status (5)

Country Link
US (1) US9113281B2 (ja)
EP (1) EP2486561B1 (ja)
JP (1) JP5773540B2 (ja)
AU (1) AU2010305313B2 (ja)
WO (1) WO2011041834A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5742340B2 (ja) * 2011-03-18 2015-07-01 ソニー株式会社 咀嚼検出装置および咀嚼検出方法
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
US9558762B1 (en) * 2011-07-03 2017-01-31 Reality Analytics, Inc. System and method for distinguishing source from unconstrained acoustic signals emitted thereby in context agnostic manner
KR102479737B1 (ko) 2012-07-16 2022-12-21 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 음장 표현을 렌더링하는 방법 및 장치
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9883310B2 (en) * 2013-02-08 2018-01-30 Qualcomm Incorporated Obtaining symmetry information for higher order ambisonic audio renderers
US9609452B2 (en) * 2013-02-08 2017-03-28 Qualcomm Incorporated Obtaining sparseness information for higher order ambisonic audio renderers
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
US10178489B2 (en) * 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
EP2782094A1 (en) * 2013-03-22 2014-09-24 Thomson Licensing Method and apparatus for enhancing directivity of a 1st order Ambisonics signal
US9466305B2 (en) * 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
WO2015076149A1 (ja) * 2013-11-19 2015-05-28 ソニー株式会社 音場再現装置および方法、並びにプログラム
EP2879408A1 (en) 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
US9602923B2 (en) * 2013-12-05 2017-03-21 Microsoft Technology Licensing, Llc Estimating a room impulse response
EP3090574B1 (en) * 2014-01-03 2019-06-26 Samsung Electronics Co., Ltd. Method and apparatus for improved ambisonic decoding
US10020000B2 (en) 2014-01-03 2018-07-10 Samsung Electronics Co., Ltd. Method and apparatus for improved ambisonic decoding
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
WO2015145782A1 (en) 2014-03-26 2015-10-01 Panasonic Corporation Apparatus and method for surround audio signal processing
US10134403B2 (en) * 2014-05-16 2018-11-20 Qualcomm Incorporated Crossfading between higher order ambisonic signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
CN106465029B (zh) * 2014-05-30 2018-05-08 高通股份有限公司 用于渲染高阶立体混响系数及产生位流的装置和方法
CN110827839B (zh) * 2014-05-30 2023-09-19 高通股份有限公司 用于渲染高阶立体混响系数的装置和方法
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
WO2018053050A1 (en) * 2016-09-13 2018-03-22 VisiSonics Corporation Audio signal processor and generator
CN112437392B (zh) * 2020-12-10 2022-04-19 科大讯飞(苏州)科技有限公司 声场重建方法、装置、电子设备和存储介质
CN113345448B (zh) * 2021-05-12 2022-08-05 北京大学 一种基于独立成分分析的hoa信号压缩方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ502603A (en) * 2000-02-02 2002-09-27 Ind Res Ltd Multitransducer microphone arrays with signal processing for high resolution sound field recording
US20080056517A1 (en) * 2002-10-18 2008-03-06 The Regents Of The University Of California Dynamic binaural sound capture and reproduction in focued or frontal applications
US7333622B2 (en) * 2002-10-18 2008-02-19 The Regents Of The University Of California Dynamic binaural sound capture and reproduction
CN1942932B (zh) * 2005-02-08 2010-07-28 日本电信电话株式会社 信号分离装置和信号分离方法
WO2007050593A2 (en) * 2005-10-25 2007-05-03 William Marsh Rice University Method and apparatus for signal detection, classification, and estimation from compressive measurements
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
EP1858296A1 (en) * 2006-05-17 2007-11-21 SonicEmotion AG Method and system for producing a binaural impression using loudspeakers
WO2009059279A1 (en) * 2007-11-01 2009-05-07 University Of Maryland Compressive sensing system and method for bearing estimation of sparse sources in the angle domain

Also Published As

Publication number Publication date
AU2010305313B2 (en) 2015-05-28
US9113281B2 (en) 2015-08-18
US20120259442A1 (en) 2012-10-11
EP2486561A4 (en) 2013-04-24
WO2011041834A1 (en) 2011-04-14
EP2486561A1 (en) 2012-08-15
AU2010305313A1 (en) 2012-05-03
EP2486561B1 (en) 2016-03-30
JP2013507796A (ja) 2013-03-04

Similar Documents

Publication Publication Date Title
JP5773540B2 (ja) 記録された音場の再構築
EP3320692B1 (en) Spatial audio processing apparatus
Betlehem et al. Theory and design of sound field reproduction in reverberant rooms
CN106658343B (zh) 用于渲染音频声场表示以供音频回放的方法和设备
Wu et al. Theory and design of soundfield reproduction using continuous loudspeaker concept
Tylka et al. Soundfield navigation using an array of higher-order ambisonics microphones
Sakamoto et al. Sound-space recording and binaural presentation system based on a 252-channel microphone array
KR20130102566A (ko) 스피커를 통한 오디오에 대한 스펙트럼적으로 채색되지 않은 최적의 크로스토크 제거
Tylka et al. Fundamentals of a parametric method for virtual navigation within an array of ambisonics microphones
JP6485711B2 (ja) 音場再現装置および方法、並びにプログラム
JP2009512364A (ja) 仮想オーディオシミュレーション
CN106105261B (zh) 声场声音拾取装置和方法、声场再现装置和方法以及程序
Noisternig et al. Reconstructing sound source directivity in virtual acoustic environments
Tylka et al. Domains of practical applicability for parametric interpolation methods for virtual sound field navigation
Iijima et al. Binaural rendering from microphone array signals of arbitrary geometry
Gauthier et al. Experiments of multichannel least-square methods for sound field reproduction inside aircraft mock-up: Objective evaluations
Kashiwazaki et al. Sound field reproduction system using narrow directivity microphones and boundary surface control principle
US20210297780A1 (en) Audio signal processor and generator
Adams et al. State-space synthesis of virtual auditory space
Thiergart et al. Parametric spatial sound processing using linear microphone arrays
Pinto et al. Digital acoustics: processing wave fields in space and time using DSP tools
JP6592838B2 (ja) バイノーラル信号生成装置、方法及びプログラム
Sheaffer et al. Equalization strategies for binaural room impulse response rendering using spherical arrays
US20230336936A1 (en) Modeling of the head-related impulse responses
Koyama et al. Sound field reproduction with weighted mode matching and infinite-dimensional harmonic analysis: An experimental evaluation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140902

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141127

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150629

R150 Certificate of patent or registration of utility model

Ref document number: 5773540

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees