JP6342986B2 - 1次アンビソニックス信号の指向性を高める方法及び装置 - Google Patents
1次アンビソニックス信号の指向性を高める方法及び装置 Download PDFInfo
- Publication number
- JP6342986B2 JP6342986B2 JP2016503627A JP2016503627A JP6342986B2 JP 6342986 B2 JP6342986 B2 JP 6342986B2 JP 2016503627 A JP2016503627 A JP 2016503627A JP 2016503627 A JP2016503627 A JP 2016503627A JP 6342986 B2 JP6342986 B2 JP 6342986B2
- Authority
- JP
- Japan
- Prior art keywords
- order
- ambisonics
- signal
- format
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 31
- 230000002708 enhancing effect Effects 0.000 title description 3
- 238000004458 analytical method Methods 0.000 claims description 53
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 238000003786 synthesis reaction Methods 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 9
- 230000001965 increasing effect Effects 0.000 claims description 9
- 230000006978 adaptation Effects 0.000 claims description 8
- 230000007480 spreading Effects 0.000 claims description 6
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- 238000009792 diffusion process Methods 0.000 description 12
- 238000010606 normalization Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000009499 grossing Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 238000012935 Averaging Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 4
- TVZRAEYQIKYCPH-UHFFFAOYSA-N 3-(trimethylsilyl)propane-1-sulfonic acid Chemical compound C[Si](C)(C)CCCS(O)(=O)=O TVZRAEYQIKYCPH-UHFFFAOYSA-N 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000005381 potential energy Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
- G06F17/156—Correlation function computation including computation of convolution operations using a domain transform, e.g. Fourier transform, polynomial transform, number theoretic transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Computing Systems (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
- Stereophonic Arrangements (AREA)
Description
言い換えると、付加的な指向性情報は、低次アンビソニックス信号から取り出され、その付加的な指向性情報は、より高次の係数を推定するのに使用される。このように、アンビソニックス信号の指向性は高められる。このことは、アンビソニックス信号がラウドスピーカ信号へと復号される場合に、空間的なソースの位置決めの精度を向上させる。本発明の1つの効果は、結果として得られる出力信号が入力信号よりも多くのエネルギを有することである。
1次アンビソニックス信号にフィルタをかけて、1次アンビソニックス信号の周波数領域表現である4つの周波数領域チャネルが得られ、周波数領域チャネルのうちの1つの周波数領域チャネル20が0次係数を表し、3つの周波数領域チャネルが1次係数を表す、分析フィルタバンクAFBと、
4つの周波数領域チャネルの音場解析を実行して、ソース方向Θ,Φ22及び拡散推定Ψ23が得られる音場解析ユニットSFAと、
拡散推定Ψ23が使用されて、0次係数を有する周波数領域チャネル20にフィルタをかけ、ダイレクトサウンド成分24が得られる選択的増幅フィルタFと、
ソース方向Θ,Φ22が使用されて、少なくとも2である所定の次数を持ったアンビソニックスフォーマットでダイレクトサウンド成分24を符号化し、少なくとも0次、1次及び2次のアンビソニックス係数を含む、所定の次数のアンビソニックスフォーマットにおける符号化されたダイレクトサウンド25が得られる、高次アンビソニックス符号器HOAeと、
所定の次数のアンビソニックスフォーマットにおける得られた符号化されたダイレクトサウンド25から少なくとも2次のアンビソニックス係数25aを選択する選択器SELと、
符号化されたダイレクトサウンドから選択された少なくとも2次のアンビソニックス係数25aを1次アンビソニックス入力信号10のアンビソニックス係数と結合して、少なくとも2次のアンビソニックス信号の時間領域表現29が得られる結合及び合成ユニットCSと
を有する。少なくとも2次の選択されたアンビソニックス係数25aは、0次又は1次の係数を含まないことが知られる。すなわち、選択器SELは、低次係数を除外する。
音場解析ユニットSFAにおいて、1次アンビソニックス信号から拡散推定Ψ23及び方向情報Θ,Φ22を生成するステップと、
選択的な増幅のためのフィルタFにおいて拡散推定Ψ23を使用して、1次アンビソニックス信号からダイレクトサウンド24を分離して選択的に増幅するステップと、
HOA符号器HOAeにおいて方向情報Θ,Φ22を使用して、選択的に増幅されたダイレクトサウンド24を符号化し、少なくとも2次のHOA信号25が得られるステップと、
HOA信号25から高次部分を選択し、該選択された高次部分が1次よりも高い次数の係数のみを含む(すなわち、0次の係数を含まず且つ1次の係数を含まない)ようにするステップと、
結合及び合成ユニットCSにおいて、HOA信号25から選択された高次係数を、入力された1次アンビソニックス信号と結合し、高次アンビソニックス信号(すなわち、少なくとも2次のアンビソニックス信号)の時間領域表現29が得られるステップと
を有する。
4つの周波数領域チャネル21が得られ、それらのうちの1つがアンビソニックスWチャネル20であるように、入力信号10にフィルタをかけるステップs1と、
4つの周波数領域チャネル21の音場解析SFAを実行して、ソース方向22及び拡散推定23が得られるステップs1と、
拡散推定23が使用されて、周波数領域のアンビソニックスWチャネル20を選択してフィルタをかけ、入力信号のダイレクトサウンド成分24が得られるステップs3と、
高次アンビソニックス符号器HOAeにおいて、ソース方向22が使用されて、所定の次数N0を持ったアンビソニックスフォーマットでダイレクトサウンド成分24を符号化し、所定の次数N0のアンビソニックスフォーマットにおける符号化されたダイレクトサウンド25が得られるステップs4と、
アンビソニックスフォーマットにおける得られた符号化されたダイレクトサウンド25から、少なくとも2次(すなわち、より低い次数を除く2次以上の次数)のアンビソニックス係数を含む定義された部分25aを選択するステップs5と、
符号化されたダイレクトサウンド25のうちの選択された部分の少なくとも2次のアンビソニックス係数を表す信号を入力信号10を表す信号と結合し、少なくとも2次のアンビソニックス信号29が得られるステップs6と
を有する。
周波数領域結合器ユニットCBfにおいて、4つの周波数領域チャネル21、21’、28の係数によって表される1次アンビソニックス信号10のアンビソニックス係数を、少なくとも2次のエンハンスメント高次アンビソニックス信号25のうちの選択された周波数成分25aと結合し、少なくとも2次のアンビソニックス信号の周波数領域表現であって、1次アンビソニックス入力信号10と比較して指向性が高められている信号37が得られるステップs61と、
合成フィルタバンクSFB’において、得られた信号37にフィルタをかけ、少なくとも2次の係数を有するエンハンスメント高次アンビソニックス信号の時間領域表現が得られるステップs64と
を有する。
合成フィルタバンクSFBにおいて、符号化されたダイレクトサウンド25のうちの少なくとも2次の選択されたアンビソニックス係数25aにフィルタをかけ、少なくとも2次の係数を有するエンハンスメント高次アンビソニックス信号の時間領域表現26が得られるステップs62と、
時間領域結合器CBtにおいて、1次アンビソニックス信号10(又は、実際のHOAフォーマットは適応され得るので、むしろ、1次アンビソニックス信号10のアンビソニックス係数を表す係数)を、少なくとも2次のエンハンスメント高次アンビソニックス信号の時間領域表現26と結合し、1次アンビソニックス信号10と比較して指向性が高められている少なくとも2次のアンビソニックス信号の時間領域表現29が得られるステップs65と
を有する。
Pn,|m|は、式(3)によってロドリーグの公式を用いて表現され得る(すなわち、ここで提示される全ての定義は、実数値変数の補償があいまいさを生じさせ得るコンドン−ショートレー位相の使用なしで済ませる。)。しかし、実装される計算のためのより有効な方法が存在する:
は、IIRフィルタによる1次又は窓掛け平均によって実現される時間平均化を用いて実装され得る期待値演算子である。Ψは、音場の非アクティブ部分の寄与を表す。1の値は、完全に拡散した音場(運動エネルギの寄与なし)を記述し、0の値は、完全にアクティブな音場を記述する。Bフォーマット信号を用いると、拡散は、次の式(16)のように表現され得る:
を近似するよう、平滑化フィルタ出力は、[12]によって定義される:
y(n,k)=(1-g)x(n,k)+gy(n-1,k) (18)
ここで、x(n,k)は入力であり、y(n-1,k)は、フィルタバンドkにおいて出力される遅延されたサンプル(変換ブロック)である。フィルタパラメータgはg=exp(-1/fcτ)によって与えられる。ここで、fcは、サブサンプリングフィルタバンクのサンプルレートである。50%だけ重なり合った窓を持つブロックベースのフィルタバンクについて、fcはfc=fs/Nhopになる。ホップサイズNhopは、この50%オーバラップの場合について、窓サイズの半分である。時定数τは平均化の特性を決定づける。小さい値は、入力信号の高速な変化が追随される必要がある場合に適切であり、大きい値は、長期平均に適している。
y(k,n)=ax(n,k)+(1-a)y(k,n-1) (19)
ここで、a=Nhop/τfsであり、τ≧Nhop/fs。なお、τは、fsに対する絶対的な関係において見られる。
の平滑化フィルタは、それらの成分のために同じ時定数を用いて1次IIRフィルタによって実現される。更に、フィルタは、小さいτmin及び大きい時定数τmaxによって特徴付けられる2つの係数を有する。時定数間の切り替えは、||Ia||の変化及び付加的な状態カウンタccに応じて実行される。このとき、Iaはフィルタ入力であり、
a1=eIx+ieIy (21)
及び
a2=√(eIx 2+eIy 2)+ieIz (22)
上記の式において、i=√(-1)及びeIx、eIy、eIzは、アクティブインテンシティの単位ベクトルのデカルト成分である。信号a1、a2は、式(18)に従ってサブバンドごとに適応IIR1次フィルタを用いてフィルタをかけられる:
b1(n)=(1-g(Ψ))a1(n)+g(Ψ)b1(n-1) (23)
そして、b2(n)については、入力a2(n)と、拡散Ψに依存する同じフィルタパラメータg(Ψ)とを用いて同様である。依存性は線形であってよい:
g(Ψ)=(gmax-gmin)Ψ+gmin
gminはゼロに近く、gmax≦1である。
φ=atan2(Im{b1}/Re{b1}) (24)
Θ=atan2(Re{b2}/Im{b2}) (25)
図2〜5を参照して上述された実施形態は、Bフォーマットの場合におけるW、X、Y、Zによって表される4つの1次係数のために4つの分析フィルタを使用する。DoA及び拡散推定の解析は、中心周波数fkを有するK個の周波数バンドにおける上記の適応平滑化フィルタを用いて実行される。W係数信号は、Bフォーマットの場合には√(2(1-Ψ(fk)))を、他の正規化された1次信号の場合には√(1-Ψ(fk))を各周波数バンドにおいて乗じられて、信号Sを実現する。DoA方向は、3DのためにはO=(Norder+1)2個の、2D実現のためにはO=(2Norder+1)個の係数を有して、予め割り当てられたアンビソニックス次数Norder>1の新しいHOA信号を形成するように、周波数バンドにおいて信号Sをアンビソニックス符号化するために使用される。O個の新しいアンビソニックス信号はBn mによって表される。一実施形態において、HOA符号器は、因数inを除外する直交正規化球面調和関数又はN3dを使用する。平面波符号化スキームが使用される:
A1 1,B2 -2,B2 2,…]による2D実現のためのO=(2Norder+1)個の成分を有する。このプロシージャは、アンビソニックス信号のための次数アップミックスと見なされ得る。
Claims (15)
- 1次アンビソニックス信号であり、0次及び1次の係数を有する入力信号の指向性を高める方法であって、
分析フィルタバンクにおいて前記入力信号にフィルタをかけるステップであって、前記1次アンビソニックス信号の周波数領域表現である4つの周波数領域チャネルが得られ、該周波数領域チャネルのうちの1つの第1周波数領域チャネルが0次係数を表し、残り3つの周波数領域チャネルが1次係数を表す、ステップと、
前記4つの周波数領域チャネルの音場解析を実行して、ソース方向及び拡散推定が得られるステップと、
フィルタにおいて、0次係数を有する前記第1周波数領域チャネルにフィルタをかけるステップであって、前記拡散推定が使用され、ダイレクトサウンド成分が得られるステップと、
高次アンビソニックス符号器において、少なくとも2である所定の次数を持ったアンビソニックスフォーマットで前記ダイレクトサウンド成分を符号化するステップであって、前記ソース方向が使用され、1次よりも高次のアンビソニックス係数を含む、前記所定の次数のアンビソニックスフォーマットにおける符号化されたダイレクトサウンドが得られるステップと、
前記所定の次数のアンビソニックスフォーマットにおける前記得られた符号化されたダイレクトサウンドから2次以上のアンビソニックス係数を選択するステップであって、1次及び0次の係数が除外されるステップと、
結合及び合成ユニットにおいて、前記符号化されたダイレクトサウンドから選択された前記2次以上のアンビソニックス係数を表す信号を前記入力信号と結合するステップであって、指向性が高められた少なくとも2次のエンハンスド・アンビソニックス信号が得られるステップと
を有する方法。 - 前記符号化されたダイレクトサウンドから選択された前記2次以上のアンビソニックス係数を表す信号を前記入力信号と結合するステップは、
周波数領域結合器ユニットにおいて、前記4つの周波数領域チャネルのアンビソニックス信号を、前記符号化されたダイレクトサウンドから選択された前記2次以上のアンビソニックス係数の中から選択された周波数係数と結合し、少なくとも2次のアンビソニックス信号の周波数領域表現である信号が得られるステップと、
合成フィルタバンクにおいて前記得られた信号にフィルタをかけて、少なくとも2次の係数を有するエンハンスド・アンビソニックス信号の時間領域表現が得られるステップと
を有する、請求項1に記載の方法。 - 前記符号化されたダイレクトサウンドから選択された前記2次以上のアンビソニックス係数を表す信号を前記入力信号と結合するステップは、
合成フィルタバンクにおいて、前記符号化されたダイレクトサウンドから選択された前記2次以上のアンビソニックス係数にフィルタをかけて、2次以上の係数を有するエンハンスメント高次アンビソニックス信号の時間領域表現が得られるステップと、
時間領域結合器において、前記入力信号を表すアンビソニックス係数を、2次以上の前記エンハンスメント高次アンビソニックス信号の時間領域表現と結合し、前記入力信号と比較して指向性が高められた少なくとも2次のエンハンスド・アンビソニックス信号の時間領域表現が得られるステップと
を有する、請求項1に記載の方法。 - 前記所定の次数を持ったアンビソニックスフォーマットで前記ダイレクトサウンド成分を符号化するステップにおいて、前記高次アンビソニックス符号器はBフォーマットを使用する、
請求項1乃至3のうちいずれか一項に記載の方法。 - 前記所定の次数を持ったアンビソニックスフォーマットで前記ダイレクトサウンド成分を符号化するステップにおいて、前記高次アンビソニックス符号器は、Bフォーマット以外のアンビソニックスフォーマットを使用し、当該方法は、
前記結合するステップより前に、HOAフォーマット適応ユニットにおいて、前記Bフォーマット以外のアンビソニックスフォーマットに従って前記入力信号を再フォーマットし、前記入力信号の再フォーマットされたアンビソニックス係数が得られるステップを更に有し、
前記結合するステップにおいて、前記時間領域結合器は、前記入力信号の前記再フォーマットされたアンビソニックス係数を、2次以上の前記エンハンスメント高次アンビソニックス信号の時間領域表現と結合する、
請求項3に記載の方法。 - 前記4つの周波数領域チャネルの音場解析を実行するステップは、
前記4つの周波数領域チャネルのアクティブインテンシティ解析を実行して、アクティブインテンシティを表す値が得られるステップと、
前記4つの周波数領域チャネルの拡散解析を実行して、前記拡散推定が得られるステップと、
前記アクティブインテンシティを表す値の到来方向解析を実行して、前記ソース方向が得られるステップと
を有する、請求項1乃至5のうちいずれか一項に記載の方法。 - 前記少なくとも2次のエンハンスド・アンビソニックス信号を、より高次の又は異なったアンビソニックスフォーマットの更なるHOA入力信号とミキシングして、前記入力信号と前記更なるHOA入力信号との混合を含むHOA信号が得られるステップ
を更に有する請求項1乃至6のうちいずれか一項に記載の方法。 - 前記エンハンスド・アンビソニックス信号は、3D実現のためのO=(Norder+1)2個の成分と、2D実現のためのO=(2Norder+1)個の成分とを有し、Norderは、前記高次アンビソニックス符号器の次数であり、
前記エンハンスド・アンビソニックス信号は、Cn m:[A0 0,A1 -1,A1 0,A1 1,B2 -2,B2 -1,B2 0,B2 1,B2 2,…’]に従うCn m個の係数を有し、Ai jは、前記入力信号の係数であり、Bi jは、前記符号化されたダイレクトサウンドから選択された前記2次以上のアンビソニックス係数である、
請求項1乃至7のうちいずれか一項に記載の方法。 - 1次アンビソニックス信号であり、0次及び1次の係数を有する入力信号の指向性を高める装置であって、
前記入力信号にフィルタをかけて、前記1次アンビソニックス信号の周波数領域表現である4つの周波数領域チャネルが得られ、該周波数領域チャネルのうちの1つの第1周波数領域チャネルが0次係数を表し、残り3つの周波数領域チャネルが1次係数を表す、分析フィルタバンクと、
前記4つの周波数領域チャネルの音場解析を実行して、ソース方向及び拡散推定が得られる音場解析ユニットと、
前記拡散推定が使用されて、0次係数を有する前記第1周波数領域チャネルにフィルタをかけ、ダイレクトサウンド成分が得られるフィルタと、
前記ソース方向が使用されて、少なくとも2である所定の次数を持ったアンビソニックスフォーマットで前記ダイレクトサウンド成分を符号化し、少なくとも0次、1次及び2次のアンビソニックス係数を含む、前記所定の次数のアンビソニックスフォーマットにおける符号化されたダイレクトサウンドが得られる、高次アンビソニックス符号器と、
前記所定の次数のアンビソニックスフォーマットにおける前記得られた符号化されたダイレクトサウンドから少なくとも2次のアンビソニックス係数を選択する選択器と、
前記符号化されたダイレクトサウンドから選択された前記少なくとも2次のアンビソニックス係数に従う時間領域信号を前記1次アンビソニックス信号のアンビソニックス係数と結合して、少なくとも2次のエンハンスド・アンビソニックス信号の時間領域表現が得られる結合及び合成ユニットと
を有する装置。 - 前記結合及び合成ユニットは、
前記4つの周波数領域チャネルのアンビソニックス信号を、前記符号化されたダイレクトサウンドからの2次以上の前記選択されたアンビソニックス係数の中から選択された周波数係数と結合し、少なくとも2次のアンビソニックス信号の周波数領域表現である信号が得られる周波数領域結合器ユニットと、
前記得られた信号にフィルタをかけて、少なくとも2次の係数を有するエンハンスド・アンビソニックス信号の時間領域表現が得られる合成フィルタバンクと
を有する、請求項9に記載の装置。 - 前記結合及び合成ユニットは、
前記符号化されたダイレクトサウンドからの2次以上の前記選択されたアンビソニックス係数にフィルタをかけて、2次以上の係数を有するエンハンスメント高次アンビソニックス信号の時間領域表現が得られる合成フィルタバンクと、
前記入力信号を表すアンビソニックス係数を、2次以上の前記エンハンスメント高次アンビソニックス信号の時間領域表現と結合し、前記入力信号と比較して指向性が高められた少なくとも2次のエンハンスド・アンビソニックス信号の時間領域表現が得られる時間領域結合器ユニットと
を有する、請求項9に記載の装置。 - 前記所定の次数を持ったアンビソニックスフォーマットで前記ダイレクトサウンド成分を符号化する前記高次アンビソニックス符号器は、Bフォーマットを使用する、
請求項9乃至11のうちいずれか一項に記載の装置。 - 前記高次アンビソニックス符号器は、前記所定の次数を持ったアンビソニックスフォーマットで前記ダイレクトサウンド成分を符号化するときに、Bフォーマット以外のアンビソニックスフォーマットを使用し、当該装置は、
前記Bフォーマット以外のアンビソニックスフォーマットに従って前記入力信号を再フォーマットし、前記入力信号の再フォーマットされたアンビソニックス係数が得られるHOAフォーマット適応ユニットを更に有し、
前記時間領域結合器ユニットは、前記入力信号の前記再フォーマットされたアンビソニックス係数を、2次以上の前記エンハンスメント高次アンビソニックス信号の時間領域表現と結合する、
請求項11に記載の装置。 - 前記音場解析ユニットは、
前記4つの周波数領域チャネルのアクティブインテンシティ解析を実行して、アクティブインテンシティを表す値が得られるアクティブインテンシティ解析ブロックと、
前記4つの周波数領域チャネルの拡散解析を実行して、前記拡散推定が得られる拡散解析ブロックと、
前記アクティブインテンシティを表す値の到来方向解析を実行して、前記ソース方向が得られる到来方向解析ブロックと
を有する、請求項9乃至13のうちいずれか一項に記載の装置。 - 前記少なくとも2次のエンハンスド・アンビソニックス信号を、より高次の又は異なったアンビソニックスフォーマットの他のHOA入力信号とミキシングして、前記入力信号と前記他のHOA入力信号との混合を含むHOA信号が得られるミキサユニット
を更に有する請求項9乃至14のうちいずれか一項に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13305352.0 | 2013-03-22 | ||
EP20130305352 EP2782094A1 (en) | 2013-03-22 | 2013-03-22 | Method and apparatus for enhancing directivity of a 1st order Ambisonics signal |
PCT/EP2014/055313 WO2014147029A1 (en) | 2013-03-22 | 2014-03-17 | Method and apparatus for enhancing directivity of a 1st order ambisonics signal |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016517033A JP2016517033A (ja) | 2016-06-09 |
JP2016517033A5 JP2016517033A5 (ja) | 2017-04-13 |
JP6342986B2 true JP6342986B2 (ja) | 2018-06-13 |
Family
ID=48095764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016503627A Active JP6342986B2 (ja) | 2013-03-22 | 2014-03-17 | 1次アンビソニックス信号の指向性を高める方法及び装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US9838822B2 (ja) |
EP (2) | EP2782094A1 (ja) |
JP (1) | JP6342986B2 (ja) |
KR (1) | KR102208258B1 (ja) |
CN (1) | CN105051813B (ja) |
AU (1) | AU2014234480B2 (ja) |
BR (1) | BR112015019526B1 (ja) |
TW (1) | TWI646847B (ja) |
WO (1) | WO2014147029A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
DE102013223201B3 (de) * | 2013-11-14 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes |
US10134403B2 (en) * | 2014-05-16 | 2018-11-20 | Qualcomm Incorporated | Crossfading between higher order ambisonic signals |
US9712936B2 (en) | 2015-02-03 | 2017-07-18 | Qualcomm Incorporated | Coding higher-order ambisonic audio data with motion stabilization |
US10187740B2 (en) * | 2016-09-23 | 2019-01-22 | Apple Inc. | Producing headphone driver signals in a digital audio signal processing binaural rendering environment |
GB2554446A (en) | 2016-09-28 | 2018-04-04 | Nokia Technologies Oy | Spatial audio signal format generation from a microphone array using adaptive capture |
CN106960672B (zh) * | 2017-03-30 | 2020-08-21 | 国家计算机网络与信息安全管理中心 | 一种立体声音频的带宽扩展方法与装置 |
US10390166B2 (en) * | 2017-05-31 | 2019-08-20 | Qualcomm Incorporated | System and method for mixing and adjusting multi-input ambisonics |
US10015618B1 (en) * | 2017-08-01 | 2018-07-03 | Google Llc | Incoherent idempotent ambisonics rendering |
EP3740950B8 (en) | 2018-01-18 | 2022-05-18 | Dolby Laboratories Licensing Corporation | Methods and devices for coding soundfield representation signals |
CN108845292B (zh) * | 2018-06-15 | 2020-11-27 | 北京时代拓灵科技有限公司 | 一种声源定位的方法及装置 |
CN110719564B (zh) * | 2018-07-13 | 2021-06-08 | 海信视像科技股份有限公司 | 音效处理方法和装置 |
WO2020039734A1 (ja) * | 2018-08-21 | 2020-02-27 | ソニー株式会社 | オーディオ再生装置、オーディオ再生方法及びオーディオ再生プログラム |
KR102599744B1 (ko) | 2018-12-07 | 2023-11-08 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 방향 컴포넌트 보상을 사용하는 DirAC 기반 공간 오디오 코딩과 관련된 인코딩, 디코딩, 장면 처리 및 기타 절차를 위한 장치, 방법 및 컴퓨터 프로그램 |
CN113673317B (zh) * | 2021-07-12 | 2023-04-07 | 电子科技大学 | 基于原子范数最小化可降维的二维离格doa估计方法 |
JP2024026010A (ja) * | 2022-08-15 | 2024-02-28 | パナソニックIpマネジメント株式会社 | 音場再現装置、音場再現方法及び音場再現システム |
US20240098439A1 (en) * | 2022-09-15 | 2024-03-21 | Sony Interactive Entertainment Inc. | Multi-order optimized ambisonics encoding |
JP2024048967A (ja) * | 2022-09-28 | 2024-04-09 | パナソニックIpマネジメント株式会社 | 音場再現装置、音場再現方法及び音場再現システム |
WO2024175587A1 (en) * | 2023-02-23 | 2024-08-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal representation decoding unit and audio signal representation encoding unit |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1512514A (en) | 1974-07-12 | 1978-06-01 | Nat Res Dev | Microphone assemblies |
GB9204485D0 (en) | 1992-03-02 | 1992-04-15 | Trifield Productions Ltd | Surround sound apparatus |
US6356639B1 (en) * | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
AUPP272598A0 (en) * | 1998-03-31 | 1998-04-23 | Lake Dsp Pty Limited | Wavelet conversion of 3-d audio signals |
AUPR647501A0 (en) * | 2001-07-19 | 2001-08-09 | Vast Audio Pty Ltd | Recording a three dimensional auditory scene and reproducing it for the individual listener |
CA2354858A1 (en) | 2001-08-08 | 2003-02-08 | Dspfactory Ltd. | Subband directional audio signal processing using an oversampled filterbank |
FR2844894B1 (fr) | 2002-09-23 | 2004-12-17 | Remy Henri Denis Bruno | Procede et systeme de traitement d'une representation d'un champ acoustique |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
WO2008039339A2 (en) * | 2006-09-25 | 2008-04-03 | Dolby Laboratories Licensing Corporation | Improved spatial resolution of the sound field for multi-channel audio playback systems by deriving signals with high order angular terms |
US8180062B2 (en) * | 2007-05-30 | 2012-05-15 | Nokia Corporation | Spatial sound zooming |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
ES2690164T3 (es) | 2009-06-25 | 2018-11-19 | Dts Licensing Limited | Dispositivo y método para convertir una señal de audio espacial |
WO2011041834A1 (en) * | 2009-10-07 | 2011-04-14 | The University Of Sydney | Reconstruction of a recorded sound field |
US9313598B2 (en) * | 2010-03-02 | 2016-04-12 | Nokia Technologies Oy | Method and apparatus for stereo to five channel upmix |
NZ587483A (en) * | 2010-08-20 | 2012-12-21 | Ind Res Ltd | Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions |
US9271081B2 (en) * | 2010-08-27 | 2016-02-23 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
CN101977349A (zh) | 2010-09-29 | 2011-02-16 | 华南理工大学 | Ambisonic声重发系统解码的优化改进方法 |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
US9131298B2 (en) * | 2012-11-28 | 2015-09-08 | Qualcomm Incorporated | Constrained dynamic amplitude panning in collaborative sound systems |
-
2013
- 2013-03-22 EP EP20130305352 patent/EP2782094A1/en not_active Withdrawn
-
2014
- 2014-03-17 WO PCT/EP2014/055313 patent/WO2014147029A1/en active Application Filing
- 2014-03-17 EP EP14710567.0A patent/EP2976769B1/en active Active
- 2014-03-17 BR BR112015019526-1A patent/BR112015019526B1/pt active IP Right Grant
- 2014-03-17 KR KR1020157025670A patent/KR102208258B1/ko active IP Right Grant
- 2014-03-17 AU AU2014234480A patent/AU2014234480B2/en active Active
- 2014-03-17 JP JP2016503627A patent/JP6342986B2/ja active Active
- 2014-03-17 CN CN201480015676.6A patent/CN105051813B/zh active Active
- 2014-03-17 US US14/779,326 patent/US9838822B2/en active Active
- 2014-03-21 TW TW103110577A patent/TWI646847B/zh active
Also Published As
Publication number | Publication date |
---|---|
WO2014147029A1 (en) | 2014-09-25 |
EP2976769A1 (en) | 2016-01-27 |
TWI646847B (zh) | 2019-01-01 |
EP2782094A1 (en) | 2014-09-24 |
BR112015019526A8 (pt) | 2017-12-05 |
JP2016517033A (ja) | 2016-06-09 |
US20160057556A1 (en) | 2016-02-25 |
AU2014234480B2 (en) | 2019-11-21 |
US9838822B2 (en) | 2017-12-05 |
AU2014234480A1 (en) | 2015-08-13 |
BR112015019526A2 (pt) | 2017-07-18 |
EP2976769B1 (en) | 2017-02-22 |
KR20150134336A (ko) | 2015-12-01 |
BR112015019526B1 (pt) | 2021-12-07 |
TW201442522A (zh) | 2014-11-01 |
CN105051813B (zh) | 2019-03-22 |
KR102208258B1 (ko) | 2021-01-27 |
CN105051813A (zh) | 2015-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6342986B2 (ja) | 1次アンビソニックス信号の指向性を高める方法及び装置 | |
US20200335115A1 (en) | Audio encoding and decoding | |
JP7564295B2 (ja) | DirACベース空間オーディオコーディングに関する符号化、復号、シーン処理、および他の手順のための装置、方法、およびコンピュータプログラム | |
US10332532B2 (en) | Encoding/decoding apparatus for processing channel signal and method therefor | |
US8175280B2 (en) | Generation of spatial downmixes from parametric representations of multi channel signals | |
JP7559106B2 (ja) | オーディオ・デコーダおよびデコード方法 | |
RU2376654C2 (ru) | Параметрическое совместное кодирование аудиоисточников | |
EP2154677B1 (en) | An apparatus for determining a converted spatial audio signal | |
JP2024138553A (ja) | 2dセットアップを使用したオーディオ再生のためのアンビソニックス・オーディオ音場表現を復号する方法および装置 | |
CA2673624A1 (en) | Apparatus and method for multi-channel parameter transformation | |
TW200837718A (en) | Apparatus and method for generating an ambient signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program | |
US20240119949A1 (en) | Encoding/decoding apparatus for processing channel signal and method therefor | |
AU2018201133B2 (en) | Method and device for decoding an audio soundfield representation for audio playback | |
JP2020110007A (ja) | パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20160826 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170310 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180424 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6342986 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |