JP2013520691A - 拡張ダウンミックス信号を発生するための装置、拡張ダウンミックス信号を発生するための方法及びコンピュータプログラム - Google Patents
拡張ダウンミックス信号を発生するための装置、拡張ダウンミックス信号を発生するための方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2013520691A JP2013520691A JP2012554287A JP2012554287A JP2013520691A JP 2013520691 A JP2013520691 A JP 2013520691A JP 2012554287 A JP2012554287 A JP 2012554287A JP 2012554287 A JP2012554287 A JP 2012554287A JP 2013520691 A JP2013520691 A JP 2013520691A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- extended
- filter
- microphone signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 54
- 238000004590 computer program Methods 0.000 title claims description 21
- 238000001914 filtration Methods 0.000 claims abstract description 49
- 230000001419 dependent effect Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 description 35
- 238000013507 mapping Methods 0.000 description 28
- 230000005236 sound signal Effects 0.000 description 20
- 230000000875 corresponding effect Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 12
- 238000000926 separation method Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000007781 pre-processing Methods 0.000 description 8
- 238000012732 spatial analysis Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 6
- 230000002596 correlated effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 238000004091 panning Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【選択図】 図1
Description
としてモデル化できるものとする。ここで、a(k,i)は利得係数であり、S(k,i)は左チャネルにおける直接音であり、N1(k,i)とN2(k,i)は拡散音を表す。
であるものとする。Φdiffは、例えば既定値をとってもよく、何らかのアルゴリズムに従って計算されてもよい。
ここで、
である。
に対応し、すなわち、
であり、
は全てE{NN*}に等しい同一のパワーを有する。最終的には利得h1からh5が拡散音の量を決定することから、この拡散音パワーの定義が任意であることに留意すべきである。
になる。
ことに留意すべきである。サラウンドチャネルのプレスケーリングを考慮すると、TTTボックスにより使用される2つのICLDパラメータは、
である。
[Y1 Y2]T=M[L R C LS RS]T (18)
である。ここで、ダウンミックス行列は、
であり、gsはサラウンドチャネルに与えられる先に述べたプレ利得である。
のパワーは同じであることから、
と同じパワーを有するN1及びN2を基礎とする拡散信号は、
である。
に依存して表すことを可能にする。
である。
(すなわち、マルチチャネルマイクロホン信号のチャネル信号を濾波することによって得られる実際のダウンミックス信号)が各々望ましいダウンミックス信号Y1(k,i)とY2(k,i)に近似するように選択される。適切な近似は、
が各々、マルチチャネルスピーカ信号モデルのエネルギーに関して、ターゲットであるダウンミックス信号Y1(k,i)とY2(k,i)で与えられるものと同じエネルギー分散を共有するというものである。言い替えれば、フィルタは、マルチチャネルマイクロホン信号のチャネル信号を濾波することによって得られる実際のダウンミックス信号が、例えばエネルギー特性又は相互相関特性のような幾つかの統計的特性に関して望ましいダウンミックス信号に近似するように選択される。
は各々、マイクロホン入力信号X1、X2双方の濾波されたバージョンから決定される。この手法は、双方のマイクロホンチャネルを最適に組み合わせることができるために、1チャネルのフィルタリング方法に比べて向上した性能を期待できる。
H1,1 = H1
H1,2 = 0
H2,1 = 0
H2,2 = H2, (36)
のようなフィルタを、
である場合に常に計算することによって実行することができる。但し、コヒーレンス/相関しきい値Tは、1チャネルのフィルタリングが使用される際の相関度を決定する。T=0.9という値は良い結果をもたらす。
によって与えられ、l=1,2,…,Kである。利得係数gl(k,i)は、直接音のDOAと再生構成内のl番目のスピーカの位置に依存する。利得係数h1は、先に説明したように予め決めて使用できる。Zlは、複数のチャネルの望ましいチャネル信号を表し、l=1,2,…,Kである。
受信するか、又はこのようなマルチチャネル信号モデル318のパラメータを備えている。制御装置316は、拡張フィルタパラメータ332をダウンミックス拡張装置340へ与える。制御装置316は、例えばフィルタ計算器130又はフィルタ計算器230の機能を担うことがあるので、拡張フィルタパラメータ332は拡張フィルタパラメータ132又は拡張フィルタパラメータ232と同等物であることもある。ダウンミックス拡張装置340は2チャネルマイクロホン信号310を受信し、また拡張フィルタパラメータ332も受信し、かつこれらに基づいて(実際の)拡張マルチチャネルダウンミックス信号312を生成する。拡張マルチチャネルダウンミックス信号312の第1のチャネル信号は
で表され、かつ拡張マルチチャネルダウンミックス信号312の第2のチャネル信号は
で表される。留意すべきは、ダウンミックス拡張装置340はフィルタ140又は2チャネルオーディオ信号プロバイダ240の機能を担うことがあるということである。
をチャネル信号(例えば、L(k,i)、R(k,i)、C(k,i)、Ls(k,i)、Rs(k,i)又はZl(k,i))へマップすることと、スピーカチャネル信号をダウンミックスチャネル信号へマップすることを含む。
1.マイクロホン入力信号を受信するステップ、
2.空間キューパラメータを計算するステップ、
3.望ましいダウンミックスチャネルのモデル、デコーダ出力のマルチチャネルスピーカ信号モデル及び空間キューパラメータに基づいてダウンミックス拡張フィルタを決定するステップ、及び、
4.空間オーディオマイクロホンに使用するための拡張ダウンミックス信号を得るために、拡張フィルタをマイクロホン入力信号へ適用するステップ。
Claims (15)
- マルチチャネルマイクロホン信号(110;210;310)に基づいて拡張ダウンミックス信号(112;212;312)を生成するための装置(100;200;300;500)であって、
前記マルチチャネルマイクロホン信号に基づいて、直接音の到来方向を記述する方向情報(a,α)と、直接音パワー情報(E{SS*})と、拡散音パワー情報(E{NN*})とを含む1組の空間キューパラメータ(E{NN*},E{SS*},a,α)を計算するように構成されている空間アナライザ(120;220;320)と、
前記直接音の到来方向を記述する前記方向情報(a,α)に依存して、前記直接音パワー情報(E{SS*})に依存して、かつ前記拡散音パワー情報(E{NN*})に依存して拡張フィルタパラメータ(132;232;332)を計算するためのフィルタ計算器(130;230;316)と、
前記拡張ダウンミックス信号(112;212;312)を得るために、前記拡張フィルタパラメータ(132;232;332)を用いて前記マイクロホン信号(110;210;310)又は前記マイクロホン信号(110;210;310)から導出される信号を濾波するためのフィルタ(140;240;340)と、を備えている装置。 - 前記フィルタ計算器(130;230;316)は、前記空間キューパラメータに依存して、前記マルチチャネルマイクロホン信号(110;210;310)のチャネル信号(X1,X2)と前記ダウンミックス信号の望ましいチャネル信号(Y1,Y2)との間の望ましい相互相関値(E{X1Y1 *},E{X2Y2 *},E{X1,Y2 *},E{X2Y2 *})を計算するように構成され、かつ、
前記フィルタ計算器は、前記望ましい相互相関値に依存して前記拡張フィルタパラメータ(H1,H2;H1,1,H1,2,H2,1,H2,2)を計算するように構成されている請求項1又は2に記載の装置。 - 前記フィルタ計算器は、前記望ましい相互相関値を、複数のスピーカ信号(L,R,C,Ls,Rs;Zl)に対する前記マルチチャネルマイクロホン信号の直接音成分(S)の望ましい寄与を記述する方向依存性の利得係数(g1,g2,g3,g4,g5)に依存して、かつ前記拡張ダウンミックス信号の1つ又は複数のチャネルに対する複数のオーディオチャネル(L,R,C,Ls,Rs;Zl)の望ましい寄与を記述する1つ又は複数のダウンミックスマトリクス値(gs;mj,l)に依存して計算するように構成されている請求項3に記載の装置。
- 前記フィルタ計算器(130;230;316)は、前記方向情報(a,α)を1組の方向依存性利得係数(g1,g2,g3,g4,g5)へマップするように構成されている請求項4に記載の装置。
- 前記フィルタ計算器(130;230;316)は、前記望ましい相互相関値(E{X1Y1 *},E{X2Y*},E{X1Y2 *},E{X2Y2 *})を計算するために、前記直接音パワー情報(E{SS*})及び前記拡散音パワー情報(E{NN*})を考慮するように構成されている請求項3から5のいずれか一項に記載の装置。
- 前記フィルタ計算器(130;230;316)は、前記望ましい相互相関値(E{X1Y1 *},E{X2Y1 *},E{X1Y2 *},E{X2Y2 *})を計算するために、前記方向情報(a,α)に依存して前記直接音パワー情報(E{NN*})を重み付けし、かつ前記方向情報とは独立している予め決められた重み付けを前記拡散音パワー情報に行うように構成されている請求項6に記載の装置。
- 前記フィルタ計算器(130;230;316)は、
に従ってフィルタ係数H1、H2を計算するように構成され、かつ、
前記フィルタ(140;240;340)は、
に従って、前記拡張ダウンミックス信号(112;212;312)の
を前記マルチチャネルマイクロホン信号の第1のチャネル信号X1(k,i)及び第2のチャネル信号X2(k,i)に依存して決定するように構成されている請求項1から7のいずれか一項に記載の装置。
ここで、E{SS*}は直接音パワー情報、E{NN*}は拡散音パワー情報、w1及びw2は前記方向情報(a,α)に依存する係数、w3及びw4は拡散音利得(h1,h2,h3,h4,h5)によって決定される係数である。 - 前記フィルタ計算器(130;230;316)は、
に従ってフィルタ係数(H1,H1,2,H2,1及びH2,2)を計算するように構成されている請求項1から7のいずれか一項に記載の装置。
ここで、
X1は前記マルチチャネルマイクロホン信号の第1のチャネル信号を示し、
X2は前記マルチチャネルマイクロホン信号の第2のチャネル信号を示し、
E{・}は短時間平均演算を示し、
*は複素共役演算を示し、
E{X1Y1 *}、E{X2Y1 *}、E{X1Y2 *}及びE{X2Y2 *}は、前記マルチチャネルマイクロホン信号のチャネル信号X1、X2と前記拡張ダウンミックス信号の望ましいチャネル信号Y1、Y2との間の相互相関値を示す。 - 前記フィルタ計算器(130;230;316)は、前記拡張フィルタパラメータHj,l(k,i)からHj,M(k,i)を、前記拡張フィルタパラメータに従って前記マルチチャネルマイクロホン信号の前記チャネル信号(X1,X2)を濾波することにより得られる前記拡張ダウンミックス信号(112;212;312)の
が、類似性の統計的尺度に関して、
として定義される望ましいチャネル信号に近似するように計算すべく構成されている請求項1から9のいずれか一項に記載の装置。
ここで、
g1は、前記方向情報(a,α)に依存し、かつ複数のスピーカ信号(Zl)に対する前記マルチチャネルマイクロホン信号(110;210;310)の
の望ましい寄与を表す利得係数であり、
h1は、複数のスピーカ信号に対する前記マルチチャネルマイクロホン信号(110;210;310)の
の望ましい寄与を記述する予め定められた値である。 - 前記フィルタ計算器(130;230;316)は、前記拡張フィルタパラメータ(132;232;332;H1,H2;H1,1,H1,2;H2,1,H2,2)を導出するためにウィーナ−ホップ方程式を評価するように構成されており、
前記ウィーナ−ホップ方程式は、前記マルチチャネルマイクロホン信号の異なるチャネルペア間の関係性を記述する相関値E{X1X1 *},E{X1X2 *},E{X2X1 *},E{X2X2 *}と、拡張フィルタパラメータ(H1,1,H1,2,H2,1,H2,2)と、前記マルチチャネルマイクロホン信号(110;210;310)のチャネル信号(X1,X2)と前記ダウンミックス信号の望ましいチャネル信号(Y1,Y2)との間の望ましい相互相関値(E{X1Y1 *},E{X2Y1 *},E{X1Y2 *},E{X2Y2 *})と、の間の関係性を記述するものである請求項1から10のいずれか一項に記載の装置。 - 前記フィルタ計算器(130;230;316)は、前記拡張フィルタパラメータ(132;232;332)を望ましいダウンミックスチャネルのモデルに依存して計算するように構成されている請求項1から11のいずれか一項に記載の装置。
- 前記フィルタ計算器(130;230;316)は、前記拡張ダウンミックス信号(112;212;312)の
が前記マルチチャネルマイクロホン信号(110;210;310)の第1のチャネル(X1)の濾波によって導出され、かつ前記拡張ダウンミックス信号の
が前記マルチチャネルマイクロホン信号の第2のチャネル(X2)の濾波によって導出され、その間、前記マルチチャネルマイクロホン信号の前記第1のチャネルから前記拡張ダウンミックス信号の前記第2のチャネルへのクロストーク及び前記マルチチャネルマイクロホン信号の前記第2のチャネルから前記拡張ダウンミックス信号の前記第1のチャネルへのクロストークが回避される1チャネルのフィルタリング、又は、
拡張ダウンミックス信号の
が前記マルチチャネルマイクロホン信号の第1及び第2のチャネル(X1,X2)を濾波することにより導出され、かつ前記拡張ダウンミックス信号の
が前記マルチチャネルマイクロホン信号の第1及び第2のチャネル(X1,X2)を濾波することにより導出される2チャネルのフィルタリングを、
前記マルチチャネルマイクロホン信号の前記第1のチャネル(X1)と前記マルチチャネルマイクロホン信号の前記第2のチャネル(X2)との間の相関性を記述する相関値に依存して選択的に実行するように構成されている請求項1から12のいずれか一項に記載の装置。 - マルチチャネルマイクロホン信号に基づいて拡張ダウンミックス信号を生成するための方法であって、
前記マルチチャネルマイクロホン信号に基づいて、直接音の到来方向を記述する方向情報、直接音パワー情報及び拡散音パワー情報を含む1組の空間キューパラメータを計算することと、
前記直接音の前記到来方向を記述する前記方向情報に依存して、前記直接音パワー情報に依存して、かつ前記拡散音パワー情報に依存して拡張フィルタパラメータを計算することと、
前記拡張ダウンミックス信号を取得するために、前記拡張フィルタパラメータを用いて前記マイクロホン信号又は前記マイクロホン信号から導出される信号を濾波することを含む方法。 - コンピュータ上でコンピュータプログラムが実行される際に請求項14に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US30755310P | 2010-02-24 | 2010-02-24 | |
US61/307,553 | 2010-02-24 | ||
PCT/EP2011/052246 WO2011104146A1 (en) | 2010-02-24 | 2011-02-15 | Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013520691A true JP2013520691A (ja) | 2013-06-06 |
JP5508550B2 JP5508550B2 (ja) | 2014-06-04 |
Family
ID=43652304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012554287A Active JP5508550B2 (ja) | 2010-02-24 | 2011-02-15 | 拡張ダウンミックス信号を発生するための装置、拡張ダウンミックス信号を発生するための方法及びコンピュータプログラム |
Country Status (12)
Country | Link |
---|---|
US (1) | US9357305B2 (ja) |
EP (1) | EP2539889B1 (ja) |
JP (1) | JP5508550B2 (ja) |
KR (1) | KR101410575B1 (ja) |
CN (2) | CN103811010B (ja) |
AU (1) | AU2011219918B2 (ja) |
BR (1) | BR112012021369B1 (ja) |
CA (1) | CA2790956C (ja) |
ES (1) | ES2605248T3 (ja) |
MX (1) | MX2012009785A (ja) |
RU (1) | RU2586851C2 (ja) |
WO (1) | WO2011104146A1 (ja) |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
RU2014133903A (ru) * | 2012-01-19 | 2016-03-20 | Конинклейке Филипс Н.В. | Пространственные рендеризация и кодирование аудиосигнала |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9219460B2 (en) | 2014-03-17 | 2015-12-22 | Sonos, Inc. | Audio settings based on environment |
CN103596116B (zh) * | 2012-08-15 | 2015-06-03 | 华平信息技术股份有限公司 | 一种视频会议系统中自动调节实现立体声效果的方法 |
US10136239B1 (en) | 2012-09-26 | 2018-11-20 | Foundation For Research And Technology—Hellas (F.O.R.T.H.) | Capturing and reproducing spatial sound apparatuses, methods, and systems |
US20160210957A1 (en) | 2015-01-16 | 2016-07-21 | Foundation For Research And Technology - Hellas (Forth) | Foreground Signal Suppression Apparatuses, Methods, and Systems |
US9955277B1 (en) | 2012-09-26 | 2018-04-24 | Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) | Spatial sound characterization apparatuses, methods and systems |
US9554203B1 (en) | 2012-09-26 | 2017-01-24 | Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) | Sound source characterization apparatuses, methods and systems |
US10175335B1 (en) | 2012-09-26 | 2019-01-08 | Foundation For Research And Technology-Hellas (Forth) | Direction of arrival (DOA) estimation apparatuses, methods, and systems |
US10149048B1 (en) | 2012-09-26 | 2018-12-04 | Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) | Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems |
US9549253B2 (en) * | 2012-09-26 | 2017-01-17 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Sound source localization and isolation apparatuses, methods and systems |
EP2965540B1 (en) * | 2013-03-05 | 2019-05-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multichannel direct-ambient decomposition for audio signal processing |
WO2014168618A1 (en) * | 2013-04-11 | 2014-10-16 | Nuance Communications, Inc. | System for automatic speech recognition and audio entertainment |
WO2015017584A1 (en) | 2013-07-30 | 2015-02-05 | Dts, Inc. | Matrix decoder with constant-power pairwise panning |
CN105981411B (zh) * | 2013-11-27 | 2018-11-30 | Dts(英属维尔京群岛)有限公司 | 用于高声道计数的多声道音频的基于多元组的矩阵混合 |
EP2884491A1 (en) * | 2013-12-11 | 2015-06-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Extraction of reverberant sound using microphone arrays |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
EP2942981A1 (en) * | 2014-05-05 | 2015-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | System, apparatus and method for consistent acoustic scene reproduction based on adaptive functions |
EP3143779B1 (en) | 2014-05-13 | 2020-10-07 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for edge fading amplitude panning |
CN111565352B (zh) * | 2014-09-09 | 2021-08-06 | 搜诺思公司 | 由计算设备执行的方法和回放设备及其校准系统和方法 |
US9952825B2 (en) | 2014-09-09 | 2018-04-24 | Sonos, Inc. | Audio processing algorithms |
DE102015203855B3 (de) * | 2015-03-04 | 2016-09-01 | Carl Von Ossietzky Universität Oldenburg | Vorrichtung und Verfahren zum Ansteuern des Dynamikkompressors und Verfahren zum Ermitteln von Verstärkungswerten für einen Dynamikkompressor |
PL3257270T3 (pl) * | 2015-03-27 | 2019-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób przetwarzania sygnałów stereo do odtwarzania w samochodach dla uzyskania indywidualnego dźwięku trójwymiarowego przez przednie głośniki |
GB2540175A (en) * | 2015-07-08 | 2017-01-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
JP6437695B2 (ja) | 2015-09-17 | 2018-12-12 | ソノズ インコーポレイテッド | オーディオ再生デバイスのキャリブレーションを容易にする方法 |
US9693165B2 (en) | 2015-09-17 | 2017-06-27 | Sonos, Inc. | Validation of audio calibration using multi-dimensional motion check |
US11432095B1 (en) * | 2019-05-29 | 2022-08-30 | Apple Inc. | Placement of virtual speakers based on room layout |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
US11106423B2 (en) | 2016-01-25 | 2021-08-31 | Sonos, Inc. | Evaluating calibration of a playback device |
US10003899B2 (en) | 2016-01-25 | 2018-06-19 | Sonos, Inc. | Calibration with particular locations |
US11234072B2 (en) | 2016-02-18 | 2022-01-25 | Dolby Laboratories Licensing Corporation | Processing of microphone signals for spatial playback |
KR102151682B1 (ko) | 2016-03-23 | 2020-09-04 | 구글 엘엘씨 | 다중채널 음성 인식을 위한 적응성 오디오 강화 |
US9860662B2 (en) | 2016-04-01 | 2018-01-02 | Sonos, Inc. | Updating playback device configuration information based on calibration data |
US9864574B2 (en) | 2016-04-01 | 2018-01-09 | Sonos, Inc. | Playback device calibration based on representation spectral characteristics |
US9763018B1 (en) | 2016-04-12 | 2017-09-12 | Sonos, Inc. | Calibration of audio playback devices |
CN106024001A (zh) * | 2016-05-03 | 2016-10-12 | 电子科技大学 | 一种提高麦克风阵列语音增强性能的方法 |
US11032660B2 (en) * | 2016-06-07 | 2021-06-08 | Philip Schaefer | System and method for realistic rotation of stereo or binaural audio |
US11589181B1 (en) * | 2016-06-07 | 2023-02-21 | Philip Raymond Schaefer | System and method for realistic rotation of stereo or binaural audio |
US9794710B1 (en) | 2016-07-15 | 2017-10-17 | Sonos, Inc. | Spatial audio correction |
US10372406B2 (en) | 2016-07-22 | 2019-08-06 | Sonos, Inc. | Calibration interface |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
GB2559765A (en) | 2017-02-17 | 2018-08-22 | Nokia Technologies Oy | Two stage audio focus for spatial audio processing |
CN106960672B (zh) * | 2017-03-30 | 2020-08-21 | 国家计算机网络与信息安全管理中心 | 一种立体声音频的带宽扩展方法与装置 |
GB201718341D0 (en) * | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
CN110047478B (zh) * | 2018-01-16 | 2021-06-08 | 中国科学院声学研究所 | 基于空间特征补偿的多通道语音识别声学建模方法及装置 |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
GB2574239A (en) | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
US10299061B1 (en) | 2018-08-28 | 2019-05-21 | Sonos, Inc. | Playback device calibration |
US11206484B2 (en) | 2018-08-28 | 2021-12-21 | Sonos, Inc. | Passive speaker authentication |
CN109326296B (zh) * | 2018-10-25 | 2022-03-18 | 东南大学 | 一种非自由场条件下的散射声有源控制方法 |
US10734965B1 (en) | 2019-08-12 | 2020-08-04 | Sonos, Inc. | Audio calibration of a portable playback device |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004289762A (ja) * | 2003-01-29 | 2004-10-14 | Toshiba Corp | 音声信号処理方法と装置及びプログラム |
WO2007110101A1 (en) * | 2006-03-28 | 2007-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enhanced method for signal shaping in multi-channel audio reconstruction |
WO2009156906A1 (en) * | 2008-06-25 | 2009-12-30 | Koninklijke Philips Electronics N.V. | Audio processing |
JP2012502570A (ja) * | 2008-09-11 | 2012-01-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マイクロホン信号に基づいて一組の空間手がかりを供給する装置、方法およびコンピュータ・プログラムと2チャンネルのオーディオ信号および一組の空間手がかりを供給する装置 |
JP2012526296A (ja) * | 2009-05-08 | 2012-10-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音声フォーマット・トランスコーダ |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5307405A (en) | 1992-09-25 | 1994-04-26 | Qualcomm Incorporated | Network echo canceller |
DE4320990B4 (de) * | 1993-06-05 | 2004-04-29 | Robert Bosch Gmbh | Verfahren zur Redundanzreduktion |
US5978473A (en) * | 1995-12-27 | 1999-11-02 | Ericsson Inc. | Gauging convergence of adaptive filters |
US6973184B1 (en) * | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
WO2003049497A2 (en) * | 2001-12-05 | 2003-06-12 | Koninklijke Philips Electronics N.V. | Circuit and method for enhancing a stereo signal |
KR101016982B1 (ko) * | 2002-04-22 | 2011-02-28 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 디코딩 장치 |
EP1606970A1 (en) * | 2003-03-21 | 2005-12-21 | Technische Universiteit Delft | Circular microphone array for multi channel audio recording |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
JP4809370B2 (ja) | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
KR100588218B1 (ko) * | 2005-03-31 | 2006-06-08 | 엘지전자 주식회사 | 모노 보강 스테레오 시스템 및 그 신호 처리 방법 |
WO2007034806A1 (ja) * | 2005-09-22 | 2007-03-29 | Pioneer Corporation | 信号処理装置、信号処理方法、信号処理プログラムおよびコンピュータに読み取り可能な記録媒体 |
US8126152B2 (en) * | 2006-03-28 | 2012-02-28 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for a decoder for multi-channel surround sound |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
WO2008039038A1 (en) * | 2006-09-29 | 2008-04-03 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
CA2874454C (en) * | 2006-10-16 | 2017-05-02 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
US8290167B2 (en) * | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
EP2283483B1 (en) * | 2008-05-23 | 2013-03-13 | Koninklijke Philips Electronics N.V. | A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder |
US8155714B2 (en) | 2008-06-28 | 2012-04-10 | Microsoft Corporation | Portable media player having a flip form factor |
US8023660B2 (en) * | 2008-09-11 | 2011-09-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues |
IL195613A0 (en) | 2008-11-30 | 2009-09-01 | S P F Productions Ltd | Compact gear motor assembly |
WO2010092568A1 (en) * | 2009-02-09 | 2010-08-19 | Waves Audio Ltd. | Multiple microphone based directional sound filter |
US8954323B2 (en) * | 2009-02-13 | 2015-02-10 | Nec Corporation | Method for processing multichannel acoustic signal, system thereof, and program |
-
2011
- 2011-02-15 KR KR1020127024671A patent/KR101410575B1/ko active IP Right Grant
- 2011-02-15 ES ES11703882.8T patent/ES2605248T3/es active Active
- 2011-02-15 CN CN201410045881.9A patent/CN103811010B/zh active Active
- 2011-02-15 CN CN201180020677.6A patent/CN102859590B/zh active Active
- 2011-02-15 CA CA2790956A patent/CA2790956C/en active Active
- 2011-02-15 RU RU2012140890/08A patent/RU2586851C2/ru active
- 2011-02-15 EP EP11703882.8A patent/EP2539889B1/en active Active
- 2011-02-15 AU AU2011219918A patent/AU2011219918B2/en active Active
- 2011-02-15 MX MX2012009785A patent/MX2012009785A/es active IP Right Grant
- 2011-02-15 WO PCT/EP2011/052246 patent/WO2011104146A1/en active Application Filing
- 2011-02-15 JP JP2012554287A patent/JP5508550B2/ja active Active
- 2011-02-15 BR BR112012021369-5A patent/BR112012021369B1/pt active IP Right Grant
-
2012
- 2012-08-23 US US13/592,977 patent/US9357305B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004289762A (ja) * | 2003-01-29 | 2004-10-14 | Toshiba Corp | 音声信号処理方法と装置及びプログラム |
WO2007110101A1 (en) * | 2006-03-28 | 2007-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enhanced method for signal shaping in multi-channel audio reconstruction |
WO2009156906A1 (en) * | 2008-06-25 | 2009-12-30 | Koninklijke Philips Electronics N.V. | Audio processing |
JP2012502570A (ja) * | 2008-09-11 | 2012-01-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マイクロホン信号に基づいて一組の空間手がかりを供給する装置、方法およびコンピュータ・プログラムと2チャンネルのオーディオ信号および一組の空間手がかりを供給する装置 |
JP2012526296A (ja) * | 2009-05-08 | 2012-10-25 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音声フォーマット・トランスコーダ |
Non-Patent Citations (1)
Title |
---|
JPN6013037218; Markus Kallinger, et al.: 'Spatial Filtering Using Directional Audio Coding Parameters' Proc. ICASSP 2009 , 2009, pp.217-220 * |
Also Published As
Publication number | Publication date |
---|---|
CN102859590A (zh) | 2013-01-02 |
BR112012021369B1 (pt) | 2021-11-16 |
CN102859590B (zh) | 2015-08-19 |
JP5508550B2 (ja) | 2014-06-04 |
RU2586851C2 (ru) | 2016-06-10 |
US20130216047A1 (en) | 2013-08-22 |
CN103811010A (zh) | 2014-05-21 |
US9357305B2 (en) | 2016-05-31 |
CN103811010B (zh) | 2017-04-12 |
RU2012140890A (ru) | 2014-08-20 |
AU2011219918A1 (en) | 2012-09-27 |
CA2790956C (en) | 2017-01-17 |
MX2012009785A (es) | 2012-11-23 |
AU2011219918B2 (en) | 2013-11-28 |
KR101410575B1 (ko) | 2014-06-23 |
KR20120128143A (ko) | 2012-11-26 |
ES2605248T3 (es) | 2017-03-13 |
WO2011104146A1 (en) | 2011-09-01 |
EP2539889A1 (en) | 2013-01-02 |
BR112012021369A2 (pt) | 2020-10-27 |
EP2539889B1 (en) | 2016-08-24 |
CA2790956A1 (en) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5508550B2 (ja) | 拡張ダウンミックス信号を発生するための装置、拡張ダウンミックス信号を発生するための方法及びコンピュータプログラム | |
JP5511136B2 (ja) | マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法 | |
JP5156386B2 (ja) | 空間音声のパラメトリック符号化のためのコンパクトなサイド情報 | |
JP5520300B2 (ja) | マイクロホン信号に基づいて一組の空間手がかりを供給する装置、方法およびコンピュータ・プログラムと2チャンネルのオーディオ信号および一組の空間手がかりを供給する装置 | |
JP5587551B2 (ja) | オーディオ符号化 | |
US8023660B2 (en) | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues | |
JP5222279B2 (ja) | マルチチャネルオーディオ再構成における信号整形のための改善された方法 | |
US8019350B2 (en) | Audio coding using de-correlated signals | |
JP6047240B2 (ja) | 空間オーディオ信号の異なる再生スピーカ設定に対するセグメント毎の調整 | |
JP5081838B2 (ja) | オーディオ符号化及び復号 | |
JP5189979B2 (ja) | 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御 | |
JP5106115B2 (ja) | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング | |
RU2696952C2 (ru) | Аудиокодировщик и декодер |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130730 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131024 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140225 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140320 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5508550 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |