JP5706513B2 - 空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法 - Google Patents
空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法 Download PDFInfo
- Publication number
- JP5706513B2 JP5706513B2 JP2013501726A JP2013501726A JP5706513B2 JP 5706513 B2 JP5706513 B2 JP 5706513B2 JP 2013501726 A JP2013501726 A JP 2013501726A JP 2013501726 A JP2013501726 A JP 2013501726A JP 5706513 B2 JP5706513 B2 JP 5706513B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- signal
- input signal
- spatial
- acoustic input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 62
- 238000004364 calculation method Methods 0.000 claims description 177
- 238000012935 Averaging Methods 0.000 claims description 67
- 238000009792 diffusion process Methods 0.000 claims description 31
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 230000007480 spreading Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 4
- 230000001052 transient effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 39
- 238000004458 analytical method Methods 0.000 description 37
- 239000013598 vector Substances 0.000 description 36
- 230000003595 spectral effect Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 22
- 230000000875 corresponding effect Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 14
- 238000013459 approach Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 230000005236 sound signal Effects 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Description
これは、正のエネルギーゲインによる非定常性のケースではα-≒0が得られる一方、負のエネルギーゲインに対してα-≒1が得られることを意味する。従って、式7と式8の最大をとること、すなわち
図7bに示される実現手段は、従来のオーディオ符号化アプローチによって、例えば各周波数サブバンドkと各時間スロットnに対して、アクティブな音響強度ベクトル706(Ia(k,n))の反対方向として取得することができる推定された方向(到来の方向パラメータ718(ψ(k,n))の時間平均演算に基づいている。
x(k,n)はサイレント間に計測されたもの (17)
第2の可変空間パラメータ計算ルールは、各パラメータ推定戦略に対して音響入力信号の空間パラメータを判定し、第2のパラメータ推定戦略によって判定された空間パラメータのセットを選択することを備えることができる。
Claims (12)
- 音響入力信号(104)に基づいて空間パラメータ(102、ψ(k,n)、Ψ(k,n))を提供する空間オーディオプロセッサであって、
前記音響入力信号は、少なくとも1つの方向成分を備え、前記音響入力信号(104)の信号特性(110、710、810)を判定するように構成された、信号特性判定器(108、308、408、508、608、808、908)と、
前記音響入力信号(104)に対して、可変空間パラメータ計算ルールに従って前記空間パラメータ(102、ψ(k,n)、Ψ(k,n))を計算する、制御可能パラメータ推定器(106、306、406、506、606、606a、606b、806、906)とを備え、
前記制御可能パラメータ推定器(106、306、406、506、606、606a、606b、806、906)は、前記判定された信号特性(110、710、810)に従って、前記可変空間パラメータ計算ルールを修正するように構成され、
前記制御可能パラメータ推定器(406、506、906)は、前記判定された信号特性(110)に従って、前記空間パラメータ(102、Ψ(k,n)、ψ(k,n))を計算するための複数の空間パラメータ計算ルール(410、412)から1つの空間パラメータ計算ルール(410、412)を選択するように構成され、
前記制御可能パラメータ推定器(406、506)は、前記複数の空間パラメータ計算ルール(410、412)からの第1の空間パラメータ計算ルール(410)が、前記複数の空間パラメータ計算ルール(410、412)からの第2の空間パラメータ計算ルール(412)と異なるように構成され、前記第1の空間パラメータ計算ルール(410)と前記第2の空間パラメータ計算ルール(412)は、周波数サブバンドにおける複数の時間スロットに亘る時間平均演算と、時間スロットにおける複数の周波数サブバンドに亘る周波数平均演算と、時間平均演算および周波数平均演算と、いかなる平均演算もないものとからなるグループから選択され、
前記信号特性判定器(308)は、前記音響入力信号(104)の定常性インターバルを判定するように構成され、
前記制御可能パラメータ推定器(306)は、前記判定された定常性インターバルに従って、前記空間パラメータ(102、Ψ(k,n)、ψ(k,n))を計算するための平均演算期間が、比較的長い定常性インターバルに対して比較的長く、比較的短い定常性インターバルに対して比較的短いように、前記可変空間パラメータ計算ルールを修正するように構成された、
空間オーディオプロセッサ。 - 前記空間パラメータ(102)は、音響の方向、および/または音響の拡散、および/または音響の方向の統計的尺度を備えた、請求項1に記載の空間オーディオプロセッサ。
- 前記制御可能パラメータ推定器(106、306、406、506、606、606a、606b、806、906)は、時間スロット(n)と周波数サブバンド(k)に対する拡散パラメータ(Ψ(k,n))および/または時間スロット(n)と周波数サブバンド(k)に対する到来の方向パラメータ(ψ(k,n))を備える方向オーディオ符号化パラメータとして、または空間オーディオマイクロフォンパラメータとして、空間パラメータ(102、ψ(k,n)、Ψ(k,n))を計算するように構成された、請求項1または2に記載の空間オーディオプロセッサ。
- 前記制御可能パラメータ推定器(306)は、前記音響入力信号(104)から、時間スロット(n)と周波数サブバンド(k)に対して、前記音響入力信号(104)の信号パラメータ(Ia(k,n))の少なくとも1つの時間平均演算に基づいて、前記空間パラメータ(102、Ψ(k,n))を計算するように構成され、
前記制御可能パラメータ推定器(306)は、前記判定された定常性インターバルに従って、前記音響入力信号(104)の前記信号パラメータ(Ia(k,n))の前記時間平均演算の平均演算期間を変化させるように構成された、
請求項1〜3のいずれかに記載の空間オーディオプロセッサ。 - 前記制御可能パラメータ推定器(306)は、ローパスフィルタを用いて、前記音響入力信号(104)の前記信号パラメータ(Ia(k,n))の前記時間平均演算を適用するように構成され、
前記制御可能パラメータ推定器(306)は、重みパラメータ(α)に基づいて、前記音響入力信号(104)の現在の信号パラメータと前記音響入力信号(104)の前の信号パラメータとの間の重みを、前記平均演算期間は前記重みパラメータ(α)に基づき、前記前の信号パラメータの重みと比較した前記現在の信号パラメータの重みが比較的短い定常性インターバルに対して比較的高く、前記前の信号パラメータの重みと比較した前記現在の信号パラメータの重みが比較的長い定常性インターバルに対して比較的低いように、調整するように構成された、
請求項4に記載の空間オーディオプロセッサ。 - 前記信号特性判定器(408)は、前記音響入力信号(104)が異なる音源からの成分を同時に備える場合に判定するように構成され、または、前記信号特性判定器(508)は、前記音響入力信号(104)の音調性を判定するように構成され、
前記制御可能パラメータ推定器(406、506)は、前記音響入力信号(104)が最大で1つの音源の成分を備えるとき、または、前記音響入力信号(104)の音調性が所定の音調性しきい値レベルより下にあるとき、複数の空間パラメータ計算ルール(410、412)から第1の空間パラメータ計算ルール(410)が選択され、前記音響入力信号(104)が同時に複数の音源の成分を備えるとき、または、前記音響入力信号(104)の音調性が所定の音調性しきい値レベルより上にあるとき、複数の空間パラメータ計算ルール(410、412)から第2の空間パラメータ計算ルール(412)が選択されるように、前記信号特性判定の結果に従って、前記複数の空間パラメータ計算ルール(410、412)から、空間パラメータ(102、Ψ(k,n)、ψ(k,n))を計算するための空間パラメータ計算ルール(410、412)を選択するように構成され、
前記第1の空間パラメータ計算ルール(410)は、第1の数の周波数サブバンド(k)に亘る周波数平均演算を含み、前記第2の空間パラメータ計算ルール(412)は、第2の数の周波数サブバンド(k)に亘る周波数平均演算を含むかまたは周波数平均演算を含まないものであって、
前記第1の数は、前記第2の数より大きい、
請求項1〜5のいずれかに記載の空間オーディオプロセッサ。 - 前記信号特性判定器(608)は、前記音響入力信号(104)のSN比(110、710)を判定するように構成され、
前記制御可能パラメータ推定器(606、606a、606b)は、周波数サブバンド(k)における複数の時間スロットに亘る時間平均演算、時間スロット(n)における複数の周波数サブバンド(k)に亘る周波数平均演算、空間平均演算、またはそれらの組合せ適用するように構成され、
前記制御可能パラメータ推定器(606、606a、606b)は、前記判定されたSN比(110、710)に従って、前記時間平均演算の、前記周波数平均演算の、前記空間平均演算の、または前記それらの組合せの平均演算期間を、前記平均演算期間が前記音響入力信号の比較的低いSN比(110、710)に対して比較的長いように、前記平均演算期間が前記音響入力信号(104)の比較的高いSN比(110、710)に対して比較的短いように、変化させるように構成された、
請求項1〜6のいずれかに記載の空間オーディオプロセッサ。 - 前記制御可能パラメータ推定器(606a、606b)は、前記時間平均演算を、複数の時間スロットと周波数サブバンド(k)に亘って強度パラメータ(Ia(k,n))のサブセットに、または複数の時間スロットと周波数サブバンド(k)に亘って到来の方向パラメータ(ψ(k,n))のサブセットに、適用するように構成され、
前記強度パラメータ(Ia(k,n))のサブセットにおける強度パラメータ(Ia(k,n))の数、または前記到来の方向パラメータ(ψ(k,n))のサブセットにおける到来の方向パラメータ(ψ(k,n))の数が、前記音響入力信号(104)の比較的高いSN比(110、710)に対して比較的低く、前記強度パラメータ(Ia(k,n))のサブセットにおける強度パラメータ(Ia(k,n))の数、または前記到来の方向パラメータ(ψ(k,n))のサブセットにおける到来の方向パラメータ(ψ(k,n))の数が、前記音響入力信号(104)の比較的低いSN比(110、710)に対して比較的高いように、前記強度パラメータ(Ia(k,n))のサブセットにおける強度パラメータ(Ia(k,n))の数、または前記到来の方向パラメータ(ψ(k,n))のサブセットにおける到来の方向パラメータ(ψ(k,n))の数が前記時間平均演算の平均演算期間に対応する、
請求項7に記載の空間オーディオプロセッサ。 - 前記信号特性判定器(608)は、前記音響入力信号(104)の各SN比パラメータが周波数サブバンドと時間スロットに関連する前記音響入力信号(104)の複数のSN比パラメータとして、前記音響入力信号(104)のSN比(110、710)を提供するように構成され、前記制御可能パラメータ推定器(606a、606b)は、各目標SN比パラメータが周波数サブバンドと時間スロットに関連する複数の目標SN比パラメータとして、目標SN比(712)を受信するように構成され、
前記制御可能パラメータ推定器(606a、606b)は、前記音響入力信号の現在のSN比パラメータに従って、現在のSN比パラメータ(102)が現在の目標SN比パラメータにマッチするように、前記時間平均演算の平均演算期間を変化させるように構成された、
請求項7または8に記載の空間オーディオプロセッサ。 - 前記信号特性判定器(908)は、前記音響入力信号(104)が拍手のような信号に対応するトランジェント成分を備える場合に判定するように構成され、
前記制御可能パラメータ推定器(906)は、前記音響入力信号(104)を変換計算ルールに基づいて時間ドメインから周波数表現に変換するように構成されたフィルタバンク(912)を備え、
前記制御可能パラメータ推定器(906)は、前記音響入力信号(104)が拍手のような信号に対応する成分を備えるとき、前記音響入力信号(104)を前記時間ドメインから周波数表現に変換する第1の変換計算ルールが複数の変換計算ルールから選択され、前記音響入力信号(104)が拍手のような信号に対応する成分を備えないとき、前記音響入力信号(104)を前記時間ドメインから周波数表現に変換する第2の変換計算ルールが複数の変換計算ルールから選択されるように、前記信号特性判定の結果に従って、前記音響入力信号(104)を時間ドメインから周波数表現に変換する変換計算ルールを複数の計算ルールから選択するように構成された、
請求項1〜9のいずれかに記載の空間オーディオプロセッサ。 - 音響入力信号に基づいて空間パラメータを提供する方法であって、
前記音響入力信号は、少なくとも1つの方向成分を備え、前記音響入力信号の信号特性を判定するステップ(1010)と、
前記判定された信号特性に従って、可変空間パラメータ計算ルールを修正するステップ(1020)と、
前記可変空間パラメータ計算ルールに従って、前記音響入力信号の空間パラメータを計算するステップ(1030)と、
を備え、
前記判定された信号特性(110)に従って、前記空間パラメータ(102、Ψ(k,n)、ψ(k,n))を計算するための複数の空間パラメータ計算ルール(410、412)から1つの空間パラメータ計算ルール(410、412)が選択され、
前記複数の空間パラメータ計算ルール(410、412)からの第1の空間パラメータ計算ルール(410)は、前記複数の空間パラメータ計算ルール(410、412)からの第2の空間パラメータ計算ルール(412)と異なり、前記第1の空間パラメータ計算ルール(410)と前記第2の空間パラメータ計算ルール(412)は、周波数サブバンドにおける複数の時間スロットに亘る時間平均演算と、時間スロットにおける複数の周波数サブバンドに亘る周波数平均演算と、時間平均演算および周波数平均演算と、いかなる平均演算もないものとからなるグループから選択され、
前記音響入力信号(104)の定常性インターバルが判定され、
前記判定された定常性インターバルに従って、前記空間パラメータ(102、Ψ(k,n)、ψ(k,n))を計算するための平均演算期間が、比較的長い定常性インターバルに対して比較的長く、比較的短い定常性インターバルに対して比較的短いように、前記可変空間パラメータ計算ルールが修正される、
方法。 - コンピュータプログラムがコンピュータ上で実行されるとき、請求項11に記載された方法を実行するプログラムコードを有する、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31868910P | 2010-03-29 | 2010-03-29 | |
US61/318,689 | 2010-03-29 | ||
EP10186808.1A EP2375410B1 (en) | 2010-03-29 | 2010-10-07 | A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
EP10186808.1 | 2010-10-07 | ||
PCT/EP2011/053958 WO2011120800A1 (en) | 2010-03-29 | 2011-03-16 | A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013524267A JP2013524267A (ja) | 2013-06-17 |
JP5706513B2 true JP5706513B2 (ja) | 2015-04-22 |
Family
ID=44023044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013501726A Active JP5706513B2 (ja) | 2010-03-29 | 2011-03-16 | 空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法 |
Country Status (14)
Country | Link |
---|---|
US (2) | US9626974B2 (ja) |
EP (2) | EP2375410B1 (ja) |
JP (1) | JP5706513B2 (ja) |
KR (1) | KR101442377B1 (ja) |
CN (1) | CN102918588B (ja) |
AU (1) | AU2011234772B2 (ja) |
BR (1) | BR112012025013B1 (ja) |
CA (1) | CA2794946C (ja) |
ES (2) | ES2656815T3 (ja) |
HK (1) | HK1180824A1 (ja) |
MX (1) | MX2012011203A (ja) |
PL (1) | PL2543037T3 (ja) |
RU (1) | RU2596592C2 (ja) |
WO (1) | WO2011120800A1 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2727378B1 (en) | 2011-07-01 | 2019-10-16 | Dolby Laboratories Licensing Corporation | Audio playback system monitoring |
US9858942B2 (en) * | 2011-07-07 | 2018-01-02 | Nuance Communications, Inc. | Single channel suppression of impulsive interferences in noisy speech signals |
US9479886B2 (en) | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9854377B2 (en) * | 2013-05-29 | 2017-12-26 | Qualcomm Incorporated | Interpolation for decomposed representations of a sound field |
EP3933834A1 (en) | 2013-07-05 | 2022-01-05 | Dolby International AB | Enhanced soundfield coding using parametric component generation |
CN104299615B (zh) * | 2013-07-16 | 2017-11-17 | 华为技术有限公司 | 一种声道间电平差处理方法及装置 |
KR102231755B1 (ko) | 2013-10-25 | 2021-03-24 | 삼성전자주식회사 | 입체 음향 재생 방법 및 장치 |
KR102112018B1 (ko) * | 2013-11-08 | 2020-05-18 | 한국전자통신연구원 | 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법 |
EP2884491A1 (en) * | 2013-12-11 | 2015-06-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Extraction of reverberant sound using microphone arrays |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9462406B2 (en) | 2014-07-17 | 2016-10-04 | Nokia Technologies Oy | Method and apparatus for facilitating spatial audio capture with multiple devices |
CN105336333B (zh) * | 2014-08-12 | 2019-07-05 | 北京天籁传音数字技术有限公司 | 多声道声音信号编码方法、解码方法及装置 |
CN105989851B (zh) | 2015-02-15 | 2021-05-07 | 杜比实验室特许公司 | 音频源分离 |
EP3579577A1 (en) * | 2016-03-15 | 2019-12-11 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating a sound field description |
EP3264802A1 (en) * | 2016-06-30 | 2018-01-03 | Nokia Technologies Oy | Spatial audio processing for moving sound sources |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN107785025B (zh) * | 2016-08-25 | 2021-06-22 | 上海英波声学工程技术股份有限公司 | 基于房间脉冲响应重复测量的噪声去除方法及装置 |
EP3297298B1 (en) | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
US10187740B2 (en) * | 2016-09-23 | 2019-01-22 | Apple Inc. | Producing headphone driver signals in a digital audio signal processing binaural rendering environment |
US10020813B1 (en) * | 2017-01-09 | 2018-07-10 | Microsoft Technology Licensing, Llc | Scaleable DLL clocking system |
JP6788272B2 (ja) * | 2017-02-21 | 2020-11-25 | オンフューチャー株式会社 | 音源の検出方法及びその検出装置 |
EP3649640A1 (en) | 2017-07-03 | 2020-05-13 | Dolby International AB | Low complexity dense transient events detection and coding |
WO2019070722A1 (en) * | 2017-10-03 | 2019-04-11 | Bose Corporation | SPACE DIAGRAM DETECTOR |
US10165388B1 (en) * | 2017-11-15 | 2018-12-25 | Adobe Systems Incorporated | Particle-based spatial audio visualization |
JP7175979B2 (ja) * | 2017-11-17 | 2022-11-21 | フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. | 様々な時間/周波数分解能を使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法 |
GB2572650A (en) * | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
CN109831731B (zh) * | 2019-02-15 | 2020-08-04 | 杭州嘉楠耘智信息科技有限公司 | 音源定向方法及装置和计算机可读存储介质 |
CN110007276B (zh) * | 2019-04-18 | 2021-01-12 | 太原理工大学 | 一种声源定位方法及系统 |
US10964305B2 (en) | 2019-05-20 | 2021-03-30 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
GB2598932A (en) * | 2020-09-18 | 2022-03-23 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
CN112969134B (zh) * | 2021-02-07 | 2022-05-10 | 深圳市微纳感知计算技术有限公司 | 麦克风异常检测方法、装置、设备及存储介质 |
CN114639398B (zh) * | 2022-03-10 | 2023-05-26 | 电子科技大学 | 一种基于麦克风阵列的宽带doa估计方法 |
GB202211013D0 (en) * | 2022-07-28 | 2022-09-14 | Nokia Technologies Oy | Determining spatial audio parameters |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3812887B2 (ja) | 2001-12-21 | 2006-08-23 | 富士通株式会社 | 信号処理システムおよび方法 |
JP2005533271A (ja) * | 2002-07-16 | 2005-11-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化 |
RU2383941C2 (ru) * | 2005-06-30 | 2010-03-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для кодирования и декодирования аудиосигналов |
JP2007178684A (ja) * | 2005-12-27 | 2007-07-12 | Matsushita Electric Ind Co Ltd | マルチチャンネルオーディオ復号装置 |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
US8180062B2 (en) * | 2007-05-30 | 2012-05-15 | Nokia Corporation | Spatial sound zooming |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
WO2009084918A1 (en) * | 2007-12-31 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2009116280A1 (ja) * | 2008-03-19 | 2009-09-24 | パナソニック株式会社 | ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 |
BR122020009727B1 (pt) * | 2008-05-23 | 2021-04-06 | Koninklijke Philips N.V. | Método |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
CN101673549B (zh) * | 2009-09-28 | 2011-12-14 | 武汉大学 | 一种移动音源空间音频参数预测编解码方法及系统 |
-
2010
- 2010-10-07 ES ES10186808.1T patent/ES2656815T3/es active Active
- 2010-10-07 EP EP10186808.1A patent/EP2375410B1/en active Active
-
2011
- 2011-03-16 CA CA2794946A patent/CA2794946C/en active Active
- 2011-03-16 KR KR1020127028038A patent/KR101442377B1/ko active IP Right Grant
- 2011-03-16 JP JP2013501726A patent/JP5706513B2/ja active Active
- 2011-03-16 AU AU2011234772A patent/AU2011234772B2/en active Active
- 2011-03-16 PL PL11708299T patent/PL2543037T3/pl unknown
- 2011-03-16 EP EP11708299.0A patent/EP2543037B8/en active Active
- 2011-03-16 WO PCT/EP2011/053958 patent/WO2011120800A1/en active Application Filing
- 2011-03-16 ES ES11708299.0T patent/ES2452557T3/es active Active
- 2011-03-16 RU RU2012145972/08A patent/RU2596592C2/ru active
- 2011-03-16 CN CN201180026742.6A patent/CN102918588B/zh active Active
- 2011-03-16 MX MX2012011203A patent/MX2012011203A/es active IP Right Grant
- 2011-03-16 BR BR112012025013-2A patent/BR112012025013B1/pt active IP Right Grant
-
2012
- 2012-09-27 US US13/629,192 patent/US9626974B2/en active Active
-
2013
- 2013-07-08 HK HK13107931.2A patent/HK1180824A1/xx unknown
-
2017
- 2017-01-20 US US15/411,849 patent/US10327088B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2543037B8 (en) | 2014-04-23 |
EP2375410B1 (en) | 2017-11-22 |
PL2543037T3 (pl) | 2014-08-29 |
MX2012011203A (es) | 2013-02-15 |
HK1180824A1 (en) | 2013-10-25 |
CA2794946C (en) | 2017-02-28 |
WO2011120800A1 (en) | 2011-10-06 |
BR112012025013B1 (pt) | 2021-08-31 |
CA2794946A1 (en) | 2011-10-06 |
US10327088B2 (en) | 2019-06-18 |
CN102918588B (zh) | 2014-11-05 |
RU2012145972A (ru) | 2014-11-27 |
RU2596592C2 (ru) | 2016-09-10 |
EP2543037A1 (en) | 2013-01-09 |
US20130022206A1 (en) | 2013-01-24 |
US20170134876A1 (en) | 2017-05-11 |
AU2011234772A1 (en) | 2012-11-08 |
CN102918588A (zh) | 2013-02-06 |
JP2013524267A (ja) | 2013-06-17 |
KR20130007634A (ko) | 2013-01-18 |
AU2011234772B2 (en) | 2014-09-04 |
EP2375410A1 (en) | 2011-10-12 |
ES2452557T3 (es) | 2014-04-01 |
US9626974B2 (en) | 2017-04-18 |
EP2543037B1 (en) | 2014-03-05 |
BR112012025013A2 (pt) | 2020-10-13 |
KR101442377B1 (ko) | 2014-09-17 |
ES2656815T3 (es) | 2018-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5706513B2 (ja) | 空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法 | |
US10580411B2 (en) | Talker change detection | |
JP6636633B2 (ja) | 音響信号を向上させるための音響信号処理装置および方法 | |
JP6196320B2 (ja) | 複数の瞬間到来方向推定を用いるインフォ−ムド空間フィルタリングのフィルタおよび方法 | |
RU2762302C1 (ru) | Устройство, способ или компьютерная программа для оценки разности во времени между каналами | |
KR20150132223A (ko) | 오디오 신호 처리를 위한 다채널 다이렉트-앰비언트 분해를 위한 장치 및 방법 | |
EP3080806A1 (en) | Extraction of reverberant sound using microphone arrays | |
GB2453118A (en) | Generating a speech audio signal from multiple microphones with suppressed wind noise | |
US20190098399A1 (en) | Spatial clues from broadside detection | |
US20220060824A1 (en) | An Audio Capturing Arrangement | |
GB2585086A (en) | Pre-processing for automatic speech recognition | |
US20130253923A1 (en) | Multichannel enhancement system for preserving spatial cues | |
Herzog et al. | Signal-Dependent Mixing for Direction-Preserving Multichannel Noise Reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140128 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140421 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140724 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5706513 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |