JP2009542137A - Filter compressor and method for producing a compressed subband filter impulse response - Google Patents
Filter compressor and method for producing a compressed subband filter impulse response Download PDFInfo
- Publication number
- JP2009542137A JP2009542137A JP2009517033A JP2009517033A JP2009542137A JP 2009542137 A JP2009542137 A JP 2009542137A JP 2009517033 A JP2009517033 A JP 2009517033A JP 2009517033 A JP2009517033 A JP 2009517033A JP 2009542137 A JP2009542137 A JP 2009542137A
- Authority
- JP
- Japan
- Prior art keywords
- filter
- value
- impulse response
- subband
- filter impulse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 title claims abstract description 463
- 238000004519 manufacturing process Methods 0.000 title description 2
- 238000011156 evaluation Methods 0.000 claims description 74
- 230000014509 gene expression Effects 0.000 claims description 54
- 238000000034 method Methods 0.000 claims description 40
- 238000003860 storage Methods 0.000 claims description 30
- 230000006835 compression Effects 0.000 claims description 21
- 238000007906 compression Methods 0.000 claims description 21
- 238000012546 transfer Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 description 41
- 230000002087 whitening effect Effects 0.000 description 36
- 238000001914 filtration Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 19
- 238000003786 synthesis reaction Methods 0.000 description 19
- 230000003595 spectral effect Effects 0.000 description 18
- 230000009467 reduction Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0272—Quadrature mirror filters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Filtering Of Dispersed Particles In Gases (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compressor (AREA)
Abstract
フィルタ・タップでフィルタ・インパルス応答値を含む、サブバンドに対応する入力サブバンド・フィルタ・インパルス応答から圧縮サブバンド・フィルタ・インパルス応答を生成するためのフィルタ・コンプレッサ(102)は、より高い値を有するフィルタ・インパルス応答値およびそのより高い値より低い値を有する少なくとも1つのフィルタ・インパルス応答値を見つけるために、少なくとも2つの入力サブバンド・フィルタ・インパルス応答からフィルタ・インパルス応答値を調べるためのプロセッサ(820)と、そのより高い値を有するフィルタ・インパルス応答値を用いて圧縮サブバンド・フィルタ・インパルス応答を構成するためのフィルタ・インパルス応答コンストラクタ(305)とを含み、その圧縮サブバンド・フィルタ・インパルス応答は、そのより低い値を有する少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するフィルタ・インパルス応答値を含まず、または、そのより低い値を有する少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するゼロ値を含む。 The filter compressor (102) for generating the compressed subband filter impulse response from the input subband filter impulse response corresponding to the subband, including the filter impulse response value at the filter tap, has a higher value. In order to find a filter impulse response value from at least two input subband filter impulse responses in order to find a filter impulse response value having a value and at least one filter impulse response value having a value lower than that Processor 820 and a filter impulse response constructor (305) for constructing a compressed subband filter impulse response using the filter impulse response value having the higher value thereof, the compressed subband・ F The filter impulse response does not include a filter impulse response value corresponding to a filter tap of at least one filter impulse response value having the lower value, or at least one filter impulse having the lower value. Contains a zero value corresponding to the filter tap of the response value.
Description
本発明は、例えばヘッドホン上のマルチチャンネル・サウンド体験のための頭部伝達関数(HRTF)のフィルタリングのような音声アプリケーションの分野において例えば使用することができる、QMFドメイン(QMF=直交ミラー・フィルタバンク)と呼ばれることもあるサブバンド・ドメインにおけるフィルタ・コンプレッサに関する。 The present invention provides a QMF domain (QMF = orthogonal mirror filter bank) that can be used, for example, in the field of speech applications such as filtering of the head related transfer function (HRTF) for multi-channel sound experiences on headphones. ) In the subband domain, sometimes referred to as).
フィルタ変換技術の最近の進展は、時間ドメイン・フィルタの非常に効率的なQMF表現を可能にしている。一般に、時間ドメインのどのFIRフィルタ(FIR=有限インパルス応答)も、QMFにおいて特定のサブバンドにそれぞれ対応する1セットの複素フィルタに変換することができる。このため、フィルタリングは、フィルタリングがFFT(FFT=高速フーリエ変換)を用いて実行することができる方法と同様に、複素QMFドメインにおいて起こることができる。それでも、フィルタリングのQMFドメイン表現および実施の計算の複雑性は、例えば時間ドメインにおいて長いインパルス応答を有するフィルタの場合にかなりなものとなり得る。 Recent developments in filter transformation technology have enabled a very efficient QMF representation of time domain filters. In general, any FIR filter in the time domain (FIR = finite impulse response) can be transformed into a set of complex filters, each corresponding to a particular subband in QMF. Thus, filtering can occur in the complex QMF domain, similar to the way that filtering can be performed using FFT (FFT = Fast Fourier Transform). Nonetheless, the QMF domain representation of filtering and the computational complexity of implementation can be substantial, for example for filters with long impulse responses in the time domain.
さらに、音声符号化における最近の進展は、ステレオ(またはモノラル)信号および対応する制御データに基づいて音声信号のマルチチャンネル表現を再現する能力を利用できるようになっている。これらの方法は、さらなる制御データが、送信されたモノラルまたはステレオ・チャンネルに基づくサラウンド・チャンネルの、アップミックスとも呼ばれる、再現を制御するために送信されるので、ドルビー社プロロジック(Prologic(登録商標))のような古くからあるマトリクスに基づく解決策とは大幅に異なる。 Furthermore, recent developments in speech coding have made available the ability to reproduce multi-channel representations of speech signals based on stereo (or monaural) signals and corresponding control data. These methods transmit additional control data to control reproduction, also called upmix, of surround channels based on the transmitted mono or stereo channel, so Dolby Prologic® It is very different from the old matrix based solutions like)).
したがって、そのようなパラメトリック・マルチチャンネル・オーディオ・デコーダ、例えばMPEGサラウンド(MPEG Surround(登録商標))は、M個の送信されたチャンネルおよびさらなる制御データに基づいてN個のチャンネルを再構成し、NおよびMは可能な整数であり、N>Mである。このさらなる制御データは、N個のチャンネルの全ての送信より著しく低いデータレートを表し、符号化を非常に効率的にすると同時に、Mチャンネル装置およびNチャンネル装置の両方の互換性を確実にする。 Thus, such a parametric multi-channel audio decoder, eg MPEG Surround (MPEG Surround®), reconfigures N channels based on M transmitted channels and further control data, N and M are possible integers, N> M. This additional control data represents a significantly lower data rate than all transmissions of the N channels, making encoding very efficient while ensuring compatibility of both M-channel and N-channel devices.
これらのパラメトリック・サラウンド符号化方法は、通常、IID(チャンネル間強度差)およびICC(チャンネル間コヒーレンス)に基づくサラウンド信号のパラメータ化を含む。これらのパラメータは、アップミックス・プロセスにおけるチャンネル対間のパワー比および相関関係を表す。先行技術でも用いられるさらなるパラメータは、アップミックス手順中に、中間または出力チャンネルを予測するために用いられる予測パラメータを含む。 These parametric surround coding methods typically involve the parameterization of surround signals based on IID (Interchannel Intensity Difference) and ICC (Interchannel Coherence). These parameters represent the power ratio and correlation between channel pairs in the upmix process. Additional parameters that are also used in the prior art include prediction parameters used to predict intermediate or output channels during the upmix procedure.
音声符号化における他の進展は、ステレオ・ヘッドホン上のマルチチャンネル信号印象を得る手段を提供している。これは、元のマルチチャンネル信号およびいわゆるHRTF(頭部伝達関数)フィルタを用いて、マルチチャンネル信号をステレオにダウンミックスすることによって一般に行われる。パラメトリック・マルチチャンネル・オーディオ・デコーダが、送信されたダウンミックス信号からマルチチャンネル信号をまず再現し、その後にHRTFフィルタによって再びそれをダウンミックスする必要なく、ヘッドホン上のマルチチャネル信号をレンダリングすることを可能にするバイノーラル・ダウンミックス・アルゴリズムと組み合わせることができることは、先行技術に示されている。これは、パラメトリック・マルチチャネル表現の関数として、HRTFフィルタを4つのフィルタに組み合わせることによって達成される。結果として、4つのフィルタは、マルチチャンネル表現のための入力として用いられるステレオ信号(2つのチャンネル)が結果として生じるバイノーラルまたはステレオ出力信号(2つのチャンネル)を達成するためにどのように組み合わされまたはミックスされるかについてパラメトリック・マルチチャンネル表現の関数として表される。それで、4つのフィルタのそれぞれは、2つの出力信号に関して2つの入力信号のうちの1つに関連する。しかしながら、HRTFフィルタは、室内特性をうまくモデル化するために、非常に長くなり、そのため、QMFドメインにおいて4つのHRTFフィルタをフィルタリングするための計算の複雑性は、著しくなり得る。 Other advances in speech coding have provided a means to obtain a multi-channel signal impression on stereo headphones. This is generally done by downmixing the multichannel signal to stereo using the original multichannel signal and a so-called HRTF (head related transfer function) filter. A parametric multi-channel audio decoder that first reproduces the multi-channel signal from the transmitted down-mix signal and then renders the multi-channel signal on the headphones without having to down-mix it again with an HRTF filter. It has been shown in the prior art that it can be combined with the binaural downmix algorithm that enables it. This is accomplished by combining the HRTF filter into four filters as a function of the parametric multi-channel representation. As a result, how the four filters are combined to achieve a binaural or stereo output signal (2 channels) resulting in a stereo signal (2 channels) used as input for multi-channel representation or Expressed as a function of parametric multi-channel representation of what is mixed. Thus, each of the four filters is associated with one of the two input signals with respect to the two output signals. However, HRTF filters can be very long to model room characteristics well, so the computational complexity for filtering four HRTF filters in the QMF domain can be significant.
本発明の実施形態によれば、フィルタ・タップでフィルタ・インパルス応答値を含む、サブバンドに対応する入力サブバンド・フィルタ・インパルス応答から圧縮サブバンド・フィルタ・インパルス応答を生成するためのフィルタ・コンプレッサは、より高い値を有するフィルタ・インパルス応答値およびそのより高い値より低い値を有する少なくとも1つのフィルタ・インパルス応答値を見つけるために、少なくとも2つの入力サブバンド・フィルタ・インパルス応答からフィルタ・インパルス応答値を調べるためのプロセッサと、そのより高い値を有するフィルタ・インパルス応答値を用いて圧縮サブバンド・フィルタ・インパルス応答を構成するためのフィルタ・インパルス応答コンストラクタとを含み、その圧縮サブバンド・フィルタ・インパルス応答は、そのより低い値を有する少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するフィルタ・インパルス応答値を含まず、または、そのより低い値を有する少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するゼロ値の値を含む。 According to an embodiment of the present invention, a filter for generating a compressed subband filter impulse response from an input subband filter impulse response corresponding to a subband, including a filter impulse response value at a filter tap. The compressor filters from at least two input subband filter impulse responses to find a filter impulse response value having a higher value and at least one filter impulse response value having a value lower than the higher value. A processor for examining the impulse response value and a filter impulse response constructor for constructing a compressed subband filter impulse response using the filter impulse response value having the higher value, the compressed subband ·fill The impulse response does not include a filter impulse response value corresponding to a filter tap of the at least one filter impulse response value having the lower value, or at least one filter impulse response having the lower value Contains a zero value corresponding to the value filter tap.
本発明のさらなる実施形態は、フィルタ・タップでフィルタ・インパルス応答値を含む、サブバンドに対応する入力サブバンド・フィルタ・インパルス応答から圧縮サブバンド・フィルタ・インパルス応答を作るするための方法に関し、より高い値を有するフィルタ・インパルス応答値およびそのより高い値より低い値を有する少なくとも1つのフィルタ・インパルス応答値を見つけるために、少なくとも2つの入力サブバンド・フィルタ・インパルス応答からフィルタ・インパルス応答値を調べるステップと、そのより高い値を有するフィルタ・インパルス応答値を用いて圧縮サブバンド・フィルタ・インパルス応答を構成するステップとを含み、その圧縮サブバンド・フィルタ・インパルス応答は、そのより低い値を有する少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するフィルタ・インパルス応答値を含まず、または、そのより低い値を有する少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するゼロ値の値を含む。 A further embodiment of the present invention relates to a method for creating a compressed subband filter impulse response from an input subband filter impulse response corresponding to a subband, including a filter impulse response value at a filter tap, In order to find a filter impulse response value having a higher value and at least one filter impulse response value having a value lower than the higher value, the filter impulse response value from at least two input subband filter impulse responses And using the filter impulse response value having the higher value to construct a compressed subband filter impulse response, the compressed subband filter impulse response having the lower value Having at least one A zero value corresponding to the filter tap of at least one filter impulse response value that does not include or has a lower value than the filter impulse response value corresponding to the filter tap of the filter impulse response value of Including.
コンピュータ読み取り可能な記憶媒体の実施形態は、それに記憶された複数セットのサブバンド・フィルタ・インパルス応答を含み、それぞれのセットのサブバンド・フィルタ・インパルス応答は、ともに時間ドメイン頭部伝達関数関連フィルタに近似し、その時間ドメイン頭部伝達関数関連フィルタのフィルタ・インパルス応答は、それぞれのセットのサブバンド・フィルタ・インパルス応答のサブバンド・フィルタ・インパルス応答の長さの合計より大きいか、または、その時間ドメイン頭部伝達関数関連フィルタのフィルタ・インパルス応答は、フィルタ・インパルス応答値が複素数値である場合に、それぞれのセットのサブバンド・フィルタ・インパルス応答のサブバンド・フィルタ・インパルス応答の複素数値のフィルタ・インパルス応答値の長さの合計より大きい。 Embodiments of a computer readable storage medium include multiple sets of subband filter impulse responses stored thereon, each set of subband filter impulse responses together being a time domain head related transfer function related filter And the filter impulse response of the time domain head related transfer function related filter is greater than the sum of the lengths of the subband filter impulse responses of each set of subband filter impulse responses, or The filter impulse response of the time domain head related transfer function-related filter is the complex number of the subband filter impulse response of each set of subband filter impulse responses when the filter impulse response values are complex values. Value filter imper Greater than the sum of the length of the scan response value.
本発明のいくつかの実施形態は、一方では計算効率および他方では品質を両立させることに関して有利になる得る。実施形態は、計算の複雑性の著しい低減および入力サブバンド・フィルタ・インパルス応答によって表されるフィルタの優れた近似の両方を提供する。選択された(または決定された)フィルタ・インパルス応答値を用いて圧縮サブバンド・フィルタ・インパルス応答を調べること(結局、選択することまたは決定することを含む)および構成することは、いくつかの実施形態および/またはアプリケーションにおいて計算の複雑性の低減および優れた近似の両方を達成することができ、(ほとんど)音声的に見分けのつかないリスニング体験に導くことができる。いくつかの実施形態において、これは、より高い値を有する入力フィルタ・インパルス応答のフィルタ・インパルス応答値を見つけ、選択しまたは決定することによって達成することができ、その一方で、少なくとも1つのフィルタ・インパルス応答値は、選択されないかまたは決定されず、より高い値より低い値を有する。選択されまたは決定されたフィルタ・インパルス応答値またはより高い値を有するフィルタ・インパルス応答値を用いて、圧縮フィルタ・インパルス応答値を有する圧縮フィルタ・インパルス応答は、構成されまたは作られる。実施に応じて、選択されない若しくは決定されないフィルタ・インパルス応答値またはより高い値より低い値を有するフィルタ・インパルス応答値は、ゼロにセットされるかまたは無視される。換言すれば、フィルタ・インパルス応答値は、無視されるパターンを含んでも、ゼロに設定されてもまたはその他に修正されたフィルタ・インパルス応答値であってもよい。 Some embodiments of the invention may be advantageous with respect to balancing computational efficiency on the one hand and quality on the other hand. Embodiments provide both a significant reduction in computational complexity and a good approximation of the filter represented by the input subband filter impulse response. Examining (and eventually including selecting or determining) and configuring the compressed subband filter impulse response with the selected (or determined) filter impulse response value may include several Both reduction in computational complexity and good approximation can be achieved in embodiments and / or applications, leading to (almost) audio indistinguishable listening experiences. In some embodiments, this can be accomplished by finding, selecting or determining a filter impulse response value of an input filter impulse response having a higher value, while at least one filter The impulse response value is not selected or determined and has a value lower than the higher value. Using the selected or determined filter impulse response value or a filter impulse response value having a higher value, a compressed filter impulse response having a compressed filter impulse response value is constructed or created. Depending on the implementation, filter impulse response values that are not selected or not determined or that have a value lower than a higher value are set to zero or ignored. In other words, the filter impulse response value may include an ignored pattern, set to zero, or otherwise modified filter impulse response value.
さらに、いくつかの実施形態は、圧縮サブバンド・フィルタ・インパルス応答が構成されるフィルタ・インパルス応答値の選択に影響を与えることによって、計算の複雑性の広範囲にわたる達成可能な低減を提供することができる。結果として、本発明のいくつかの実施形態は、一方では計算の複雑性の達成可能な適合および他方では近似の品質を両立させることにおいて非常に大きい柔軟性を提供する。 Further, some embodiments provide a wide range of achievable reductions in computational complexity by influencing the selection of filter impulse response values from which compressed subband filter impulse responses are constructed. Can do. As a result, some embodiments of the present invention provide tremendous flexibility in balancing the achievable fit of computational complexity on the one hand and the approximate quality on the other hand.
したがって、本発明のいくつかの実施形態は、特に、時間ドメインにおいて比較的長い(有限の)インパルス応答を有するフィルタを含む音声または他のアプリケーションの分野において適用することができる。後に説明されるように、フィルタまたはフィルタ・エレメントを時間ドメインから(複素)サブバンド・ドメインに変換することによって、計算は、個々のサブバンド・フィルタのインパルス応答が時間ドメインにおいてフィルタのインパルス応答と比較して著しく短いように並行して行うことができる。 Thus, some embodiments of the invention can be applied particularly in the field of speech or other applications that include filters with relatively long (finite) impulse responses in the time domain. By transforming the filter or filter element from the time domain to the (complex) subband domain, as will be explained later, the calculation is such that the impulse response of the individual subband filter is the filter impulse response of the filter in the time domain. It can be performed in parallel so as to be significantly shorter than the comparison.
しかしながら、全体の計算の複雑性は、時間ドメインから(複素)サブバンド・ドメインへの単なる変換だけでは低減することができない。例えば、HRTFフィルタのように比較的長いインパルス応答を有するフィルタに対して、個々のサブバンド・フィルタでさえ通常長い有限インパルス応答を有し、それは、個々のサブバンドの数で除算される時間ドメインおいて対応するフィルタの有限インパルス応答の順序について非常に大ざっぱに言っている。したがって、特定のアプリケーションで利用可能な計算する能力に応じて、全体の計算の複雑性または個々のサブバンド・フィルタに関する計算の複雑性さえ、かなりなものとなり得る。 However, the overall computational complexity cannot be reduced by a simple transformation from the time domain to the (complex) subband domain. For example, for a filter with a relatively long impulse response, such as an HRTF filter, even an individual subband filter usually has a long finite impulse response, which is divided by the number of individual subbands. The order of the finite impulse responses of the corresponding filters is very roughly described. Thus, depending on the computing capabilities available in a particular application, the overall computational complexity or even the computational complexity for individual subband filters can be substantial.
さらに、付加的にまたは代わりに、フィルタ・インパルス応答のレベルに基づく決定は、フィルタ・コンプレッサの実施形態において実施することができる。このような場合、フィルタ・コンプレッサは、フィルタ・インパルス応答の値(例えば絶対値)が閾値より下である場合に、少なくとも1つのフィルタ・インパルス応答値がゼロに設定されまたは無視されることができるように、構成することができる。アプリケーションのいくらかの分野において、1以上のフィルタ・インパルス応答値は、入力サブバンド・フィルタ・インパルス応答に対応するフィルタバンクのエイリアシング・レベルに近くてもよい。フィルタ・インパルス応答値の値がそのような対応するフィルタバンクのエイリアシング・レベルに近い場合、特定のタップは、対応するフィルタ係数またはフィルタ・インパルス応答値がゼロに問題なく設定されることができるように、ゼロに設定されてもよい。結果として、そのような圧縮フィルタ・インパルス応答に基づくフィルタの実施は、ゼロ値の係数またはインパルス応答値のための乗加算を実行する必要がない。 Furthermore, additionally or alternatively, a determination based on the level of the filter impulse response can be implemented in a filter compressor embodiment. In such a case, the filter compressor may have at least one filter impulse response value set to zero or ignored if the value of the filter impulse response (eg absolute value) is below a threshold. Can be configured. In some areas of the application, the one or more filter impulse response values may be close to the aliasing level of the filter bank corresponding to the input subband filter impulse response. If the value of the filter impulse response value is close to the aliasing level of such a corresponding filter bank, a particular tap can be set without any problem to the corresponding filter coefficient or filter impulse response value to zero. May be set to zero. As a result, implementations of filters based on such compressed filter impulse responses do not have to perform multiplication and addition for zero valued coefficients or impulse response values.
これに関連して、フィルタバンクのエイリアシング・レベルは、多くのフィルタバンクの固有特性である。フィルタバンクのそのようなエイリアシング・レベルは、例えばSBRアプリケーションの枠組みにおいて、信号の単なる処理から生じる。それぞれのフィルタ・タップまたはフィルタ・インパルス応答値が信号を生じる出力に貢献するので、タブ(の例えば絶対値)がより小さく、それぞれのタップの結果または貢献がフィルタバンクの出力に関してより小さい。したがって、小さいタップは、それらの貢献がその範囲にあるフィルタバンクのまたはそれぞれのフィルタバンクのエイリアシング・レベルの順序の出力へのそのような小さい貢献を有することが起こる。この場合、対応するタップをゼロに設定することによって導入されるさらなるディストーションは、さらなる聞き取れるディストーションを導入しないように、多くの場合に許容することができる。多くの場合、エイリアシング・レベルの典型的な範囲は、ピーク信号と比較して−30dB、−40dB、−50dB、−60dBおよび−70dBの範囲およびそれ以下である。 In this connection, the filter bank aliasing level is an inherent characteristic of many filter banks. Such an aliasing level of the filter bank arises from mere processing of the signal, for example in the framework of SBR applications. Since each filter tap or filter impulse response value contributes to the output producing the signal, the tab (eg absolute value thereof) is smaller and the result or contribution of each tap is smaller with respect to the output of the filter bank. Thus, small taps will have such a small contribution to the output of the order of the aliasing levels of the filter banks or the respective filter banks whose contributions are in that range. In this case, further distortion introduced by setting the corresponding tap to zero can often be tolerated so as not to introduce further audible distortion. In many cases, typical ranges of aliasing levels are in the range of −30 dB, −40 dB, −50 dB, −60 dB, and −70 dB and lower compared to the peak signal.
例えば、HRTFフィルタの場合、時間ドメインHRTFフィルタを複素QMF表現に変換した後に、複素QMF表現において時間周波数タイルのいくつかは、(MPEGサラウンド・フィルタバンクのエイリアシング・レベルで)低い絶対値を有し得る。HRTFフィルタの複素QMF表現のこれらのエントリーは、ゼロに設定することができる。これは、複素QMF表現に含まれる室内応答を有する長いHRTFフィルタを実施するための煩雑性低減を可能にする。したがって、低減された煩雑性でバイノーラル化を達成するために、現実的な室内効果を維持するとともに、フィルタ・コンバータの後にフィルタ・コンプレッサの実施形態の形式においてフィルタ低減プロセスが続くことができる。フィルタ低減ステップは、サブバンドHRTFフィルタが少なくとも少ない数またはかなりの数のゼロさえも含むように、HRTFフィルタを単純化することを目的とする。より少ない係数がアクティブであるので、計算の複雑性の著しい低減は、それによって達成することができる。 For example, in the case of an HRTF filter, after converting the time domain HRTF filter to a complex QMF representation, some of the time frequency tiles in the complex QMF representation have a low absolute value (at the aliasing level of the MPEG Surround filter bank). obtain. These entries in the complex QMF representation of the HRTF filter can be set to zero. This allows for reduced complexity for implementing a long HRTF filter with room response included in the complex QMF representation. Thus, to achieve binauralization with reduced complexity, realistic filter effects can be maintained and the filter converter can be followed by a filter reduction process in the form of a filter compressor embodiment. The filter reduction step aims to simplify the HRTF filter so that the subband HRTF filter contains at least a small number or even a significant number of zeros. Since fewer coefficients are active, a significant reduction in computational complexity can thereby be achieved.
したがって、フィルタ・コンプレッサの実施形態、それを作るための方法の実施形態によって提供される1セットの作られた圧縮サブバンド・フィルタ・インパルス応答および複数の圧縮サブバンド・フィルタ・インパルス応答を含むコンピュータ読み取り可能な記憶媒体の実施形態は、それぞれのサブバンド・フィルタに対して個々の計算の複雑性および全てのサブバンド・フィルタに関して全体の計算の複雑性を著しく低減することができる。 Thus, a computer comprising a set of compressed subband filter impulse responses and a plurality of compressed subband filter impulse responses provided by an embodiment of a filter compressor, an embodiment of a method for making it Embodiments of readable storage media can significantly reduce the individual computational complexity for each subband filter and the overall computational complexity for all subband filters.
本発明は、添付図面を参照して、本発明の範囲または精神を制限しない図示例によって記載される。 The present invention will now be described by way of example with reference to the accompanying drawings, which do not limit the scope or spirit of the invention.
以下に記載されている実施形態は、効率的なフィルタ表現のための本発明の原理のために単に図示するだけである。本願明細書に記載されている構成および詳細の変更および変形が他の当業者にとって明らかであるものと理解される。したがって、本願明細書において実施形態の記載および説明として表される具体的な詳細によってではなく、間近に迫った特許請求の範囲だけによって制限されることを意図する。 The embodiments described below are merely illustrative for the principles of the present invention for efficient filter representation. It will be understood that changes and modifications in the arrangements and details described herein will be apparent to those skilled in the art. Accordingly, it is intended that the invention be limited not by the specific details presented as the description and description of the embodiments herein, but only by the forthcoming claims.
さらに詳細に本発明の実施形態、実施形態のさらなるコンポーネントおよびアプリケーションを記載する前に、同一または類似の機能特性を有する目的、構成およびコンポーネントが同じ引用符号によって示される点に留意すべきである。明示的にその他に注意さない限り、類似するまたは等しい機能特性および特徴を有する目的、構成およびコンポーネントに関する記載は、互いに関して交換することができる。さらに、以下において、特定の目的、構成およびコンポーネントの特性または特徴が述べられない限り、1つの実施形態において同一であるか類似する、または、図の1つに示される異なる構成に現れる、目的、構成およびコンポーネントの引用符号を要約することが用いられる。引用符号を要約することによって、本発明の実施形態のよりコンパクトでより明瞭な記載を可能にし、さらに異なる実施形態間の特徴および記載の交換の可能性を明確に示す。 Before describing embodiments of the present invention, further components and applications of the invention in more detail, it should be noted that objects, configurations and components having the same or similar functional characteristics are indicated by the same reference signs. Unless expressly noted otherwise, descriptions of objects, configurations and components having similar or equivalent functional characteristics and features may be interchanged with respect to one another. In addition, in the following, unless specific characteristics, configurations and characteristics or features of components are stated, the objectives that are the same or similar in one embodiment or appear in different configurations shown in one of the figures, Summarizing configuration and component citations is used. By summarizing the reference signs, a more compact and clearer description of the embodiments of the invention is possible, and the possibility of exchanging features and descriptions between the different embodiments is clearly shown.
さらに、以下において、図に示される実施形態が方法の対応する実施形態を等しく表す点に留意すべきである。したがって、図に示される実施形態は、例えばフィルタ・コンプレッサの対応する実施形態を図示するだけでなく、対応する方法の対応する実施形態のフローチャートも表す。以下に概説されるように、方法のそのような実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。 Furthermore, it should be noted that in the following, the embodiments shown in the figures equally represent corresponding embodiments of the method. Thus, the embodiment shown in the figure not only illustrates a corresponding embodiment of a filter compressor, for example, but also represents a flowchart of a corresponding embodiment of the corresponding method. As outlined below, such embodiments of the method can be implemented in hardware or in software.
図1において、可能なアプリケーションとともに本発明の1つの実施形態が概説される。具体的には、図1は、フィルタ・コンプレッサ102の実施形態に接続されるフィルタ・コンバータ101を示す。フィルタ・コンバータ101は、後にさらに詳細に記載される。フィルタ・コンバータ101の実施形態には、時間ドメインにおいてフィルタまたはフィルタ・エレメントの有限インパルス応答h(n)に関する情報を含む入力信号が提供される。インデックスnは、これに関連して有限インパルス応答(FIR)の異なる値またはサンプルを示す整数であり、h(n)は、実数値の数である。
In FIG. 1, one embodiment of the present invention is outlined along with possible applications. Specifically, FIG. 1 shows a
時間ドメイン・フィルタh(n)の有限インパルス応答は、所定の振幅を有する単一のインパルスの形式において励起上の時間ドメインにおけるフィルタまたはフィルタ・エレメントの応答である。原則として、時間ドメインにおけるフィルタ・エレメントの完全な挙動は、フィルタの有限インパルス応答に含まれる。デジタル・システムの場合、フィルタのインパルス応答は、時間において単一の例でゼロとは異なる値を有する入力信号を適用することによって決定されまたは測定され得る。この値は、例えば1に等しくあり得る。 The finite impulse response of the time domain filter h (n) is the filter or filter element response in the time domain on the excitation in the form of a single impulse having a predetermined amplitude. In principle, the complete behavior of the filter element in the time domain is included in the finite impulse response of the filter. For a digital system, the impulse response of the filter can be determined or measured by applying an input signal having a value different from zero in a single instance in time. This value may be equal to 1, for example.
フィルタ・コンバータ101は、図10との関連で概説されるように、適合性のあるフィルタの枠組みにおいて用いることができる1セットの有限インパルス応答H(n,k)を提供することができる。複素分析フィルタバンクに基づく複素フィルタ・コンバータの場合、有限インパルス応答H(n,k)が複素数値の数を含む点に留意すべきであり、nは、前と同じように異なるサンプルを示し、k=0、・・・、(L−1)は、サブバンド・フィルタの有限インパルス応答が対応する対応のサブバンドを示す。lおよびkの両方とも整数である。さらに、サブバンドの数Lは、正の整数でもある。デジタル・システムの場合、フィルタ・コンバータ101によって提供され、フィルタリング・デジタル音声入力信号のために後に用いられるサブバンドの数Lは、多くの場合に2の累乗、例えば16、32、64、128、256、512である。以下の例では、サブバンドの数は、L=64であるように選択される。しかしながら、前に概説されるように、原則として、フィルタ・コンプレッサのアプリケーション、コンポーネントおよび実施形態においてサブバンドの数としてあらゆる正の整数Lが使用できる。
The
説明されるように、時間ドメイン・フィルタh(n)は、フィルタH(n,k)の複素QMFまたはサブバンド表現を作り出すフィルタ・コンバータ101に入力される。L=64のサブバンドQMFが用いられるこの特定例において、フィルタの複素QMF表現は、多数のL=64の有限インパルス応答の長さを有する長さKの時間ドメイン・フィルタに対して、長さK/64+2のL=64の複素フィルタによって表される。
As described, the time domain filter h (n) is input to a
本発明によれば、フィルタH(n,k)は、その後にフィルタ・コンプレッサ102に入力され、それは、圧縮サブバンド・フィルタ・インパルス応答としてH(n,k)を出力する。フィルタ・コンプレッサ102の実施形態は、元のフィルタH(n,k)より多い数のゼロ値の係数を有するフィルタH(n,k)出力し、したがって、低い計算の複雑性を可能する。
In accordance with the present invention, the filter H (n, k) is then input to the
実施形態およびアプリケーションに応じて、フィルタ・コンバータ101およびフィルタ・コンプレッサ102は、L接続を介して互いに結合され、それぞれに異なるサブバンド(インデックスk=0、・・・、L−1またはk=1、・・・、L)に対応するフィルタ・インパルス応答が送信される。このオプションは、フィルタ・コンバータ101およびフィルタ・コンプレッサ102の接続を交差するスラッシュ(/)によって図1に示される。しかしながら、2つのコンポーネントは、より少ない数の接続によってまたは単一の接続だけによって互いに結合されてもよく、それに対応する信号または情報が送信される。示される図および実施形態の単純化のために、それぞれのサブバンドに対して個々の接続を含むエレメントの可能な並列接続が必要に応じて示される。しかしながら、サブバンドに関する信号または情報が送信されるときはいつでも、例えばそれを示す変数(例えばH(n,k))によって示されるように、いかなる接続も実施することができる。
Depending on the embodiment and application, the
後にさらに詳細に説明されるように、フィルタ・コンプレッサ102の実施形態も、例えばサブバンド・フィルタバンクに含まれるそれぞれの数のサブバンド・フィルタに対して1セットまたは複数のフィルタ・インパルス応答を出力する。入力サブバンド・フィルタ・インパルス応答H(n,k)および圧縮サブバンド・フィルタ・インパルス応答H(n,k)の両方とも、前に説明されるように、時間に関連したnおよびサブバンドに関連したkによって表示される2次元マトリクスに配列される両方の複素数値の数である。
As will be described in more detail later, embodiments of the
しかしながら、フィルタ・コンプレッサ102の異なる実施形態に関するさらなる詳細は、後に概説される。さらに、圧縮サブバンド・フィルタ・インパルス応答H(n,k)および入力サブバンド・フィルタ応答H(n,k)間の関係は、フィルタ・コンプレッサ102の異なる実施形態のために後に説明される。原則として、2セットの複数のフィルタ・インパルス応答H(n,k)およびH(n,k)は、簡単に概説されるように、ゼロ値の係数の数だけより多くのやり方において異なり得る点に留意することが重要である。
However, further details regarding different embodiments of the
図2において、本発明のための一般の使用例のシナリオが概説される。ここで、時間ドメイン・フィルタh(n)は、フィルタH(n,k)の複素QMF表現を作り出すフィルタ・コンバータ101に入力され、複素QMFフィルタH(n,k)は、前に説明されるように、低減されまたは圧縮された複素QMFフィルタH(n,k)を出力するフィルタ・コンプレッサ102の実施形態に入力される。
In FIG. 2, a general use case scenario for the present invention is outlined. Here, the time domain filter h (n) is input to a
両方が図1との関連で説明される時間ドメインh(n)においてフィルタの実数値のインパルス応答を提供するフィルタ・コンバータ101およびフィルタ・コンプレッサ102の実施形態は別として、図2に示される使用例のシナリオは、複素分析フィルタバンクとも呼ばれるQMF分析フィルタバンク203をさらに含む。QMF分析フィルタバンク203には、例えばデジタル音声信号であり得る入力信号x(n)が提供される。QMF分析フィルタ・ドメイン203は、出力において入力信号x(n)の複素QMF表現X(n,k)を提供する。図1との関連で説明されるように、整数nおよびkは、サンプルまたは時間インデックスとサブバンド・インデックスとにそれぞれ関連する。QMF分析フィルタバンク203のための可能な解決策は、図9との関連でさらに詳細に説明される。
Apart from the embodiment of the
入力信号x(n)の複素QMF表現X(n,k)は、サブバンド・ドメインにおいて作動するフィルタリング・ステージ201にその後に提供される。フィルタリング・ステージまたはサブバンド・フィルタ201は、調整可能なサブバンド・フィルタバンクであり、それは、フィルタ・コンプレッサ102の実施形態の出力に結合される複数のL個の中間フィルタを含む。フィルタ・コンプレッサ102の実施形態を介して、サブバンド・フィルタバンク201の中間フィルタには、(複素数値の)QMF表現X(n,k)をフィルタにかけるために用いられる圧縮サブバンド・フィルタ・インパルス応答H(n,k)が提供される。
The complex QMF representation X (n, k) of the input signal x (n) is then provided to a
原則として、後に説明されるように、複素QMF表現X(n,k)は、サブバンド・インデックスkによって識別されるそれぞれのサブバンドに対して複素QMF表現X(n,k)およびフィルタ・コンプレッサ102の実施形態によって提供されるそれぞれのフィルタ・インパルス応答H(n,k)の畳み込みを計算することによって、フィルタにかけることができる。 In principle, as will be explained later, the complex QMF representation X (n, k) is a complex QMF representation X (n, k) and filter compressor for each subband identified by the subband index k. It can be filtered by calculating the convolution of each filter impulse response H (n, k) provided by the 102 embodiment.
それから、複素QMFドメインにおいてサブバンド・フィルタバンク201によって提供されるフィルタ信号は、QMF合成フィルタバンクまたは複素合成フィルタバンクに提供され、それは、最後的に(実数値の)出力信号y(n)を合成する。QMF合成フィルタバンク202または複素合成フィルタバンクのための可能な解決策は、図11および図12の枠組みにおいて述べられる。
Then, the filter signal provided by the
換言すれば、図1に示すように、フィルタ・コンバータ101およびフィルタ・コンプレッサ102の実施形態と並行して、信号x(n)は、X(n,k)すなわち入力信号の合複素QMF表現を出力するQMF分析203モジュールに入力される。その後、その信号は、フィルタ・コンプレッサ102によって出力される複素QMFフィルタを用いてQMFドメインにおいてフィルタ201にかけられ、フィルタにかけられた信号は、フィルタにかけられた出力信号y(n)を作り出すQMF合成フィルタバンク202によって時間ドメインに最終的に合成される。
In other words, as shown in FIG. 1, in parallel with the embodiment of the
図3において、フィルタ・コンプレッサ102の実施形態のさらに詳細な図が与えられる。また、時間ドメインにおいて入力インパルス応答としての時間ドメイン・フィルタh(n)は、フィルタ・コンバータ101に入力される。フィルタの時間ドメイン・インパルス応答は、301によって表示される。前に説明されるように、フィルタ・コンバータの後に、時間ドメイン・フィルタは、サブバンド・ドメインに転送され、H(n,k)によって表される。フィルタ応答の絶対値の時間/周波数プロットは、302によって与えられる。
In FIG. 3, a more detailed view of an embodiment of the
図3に示されるフィルタ・コンプレッサ102の実施形態は、絶対値表現モジュール303を含み、それは、フィルタ・コンプレッサ102の実施形態の入力に接続される。フィルタ・コンプレッサ102の実施形態は、さらにマスク・ジェネレータ304を含み、それは、絶対値表現モジュール303の出力に結合される。また、フィルタ計算機305は、フィルタ・コンプレッサ102の実施形態に含まれ、それは、フィルタ・コンプレッサ102の実施形態の入力およびマスク・ジェネレータ304の出力の両方に接続される。また、フィルタ計算機305は、出力を含み、それは、フィルタ・コンプレッサ102の実施形態の出力を表す。
The embodiment of the
複素QMFフィルタまたはサブバンド入力フィルタH(n,k)は、絶対値表現モジュール303、フィルタ・マスク・ジェネレータ304およびフィルタ計算機305を含むフィルタ・コンプレッサ102の実施形態に入力される。絶対値表現モジュール303は、部分図302によって例示されるように、フィルタの絶対値の時間/周波数プロットを作る。これは、後に概説されるように、例えば、QMFドメインにおいてフィルタ係数の絶対値の対数表現であり得る。フィルタ・マスク・ジェネレータ304は、1つの実施形態において、絶対値表現モジュール303によって提供される情報に基づいてQMFドメインにおいてフィルタの絶対値の表現における最大値を有する係数(n,k)を選択しまたは決定する。フィルタ・マスク・ジェネレータ304は、要求されるフィルタ圧縮の量に依存する係数の調整可能な、プログラム可能な、一定のまたは所定の数を決定しまたは選択する。選択されたフィルタ係数のより低い数は、より高い煩雑性低減を与える。例およびさらなる詳細は、さらに明細書中に説明される。したがって、本願記載の枠組みにおいて多くの場合、ワードの決定、選択し、確定し、確立しおよび見つけることは、同義的に用いることができる。多くの場合、決定されまたは選択されているフィルタ・インパルス応答値は、そのようなフィルタ・インパルス応答値であり、それは、より高い値より低い値を有するフィルタ・インパルス応答値と比較して、高い値を有する(または含む)。これらの低い値のフィルタ・インパルス応答値は、選択されないまたは決定されないものとして見なされる。
The complex QMF filter or subband input filter H (n, k) is input to an embodiment of the
前に概説されるように、代わりにまたは付加的に、煩雑性の低減は、フィルタ・コンプレッサの実施形態に提供されるように、フィルタ・インパルス応答に対応するフィルタバンクのいわゆるエイリアシング・レベルと比較して、フィルタ・タップまたはフィルタ・インパルス応答値を調べることに基づいて達成することもできる。QMFドメインにおいてフィルタ・インパルス応答価値の特定のタップが、フィルタバンクのエイリアシング・レベルに近い場合、これらのフィルタ・タップは、計算の複雑性を低減するために問題なくゼロに設定されまたはその他に取り扱われ得る。これらのフィルタ・タップは、ゼロ値の係数がフィルタの実施において乗加算の枠組みに含まれることを必要としないように、フィルタの実施の場合において問題なく無視することができる。例えば、時間ドメインHRTFフィルタを複素QMF表現に変換した後に、複素QMF表現において時間周波数タイルのいくつかは、対応するMPEGサラウンド・フィルタバンクのエイリアシング・レベルで低い絶対値を有し得る。HRTFフィルタの複素QMF表現においてこれらのエントリーは、ゼロに設定することができ、それは、含まれる室内応答を有する長いHRTFフィルタを実施するための煩雑性低減を可能にする。 As outlined previously, alternatively or additionally, the complexity reduction is compared to the so-called aliasing level of the filter bank corresponding to the filter impulse response, as provided in the filter compressor embodiment. It can also be achieved based on examining the filter tap or filter impulse response value. If certain taps of the filter impulse response value in the QMF domain are close to the aliasing level of the filter bank, these filter taps are set to zero or otherwise handled without difficulty to reduce computational complexity Can be. These filter taps can be safely ignored in the filter implementation so that zero-valued coefficients do not need to be included in the multiply-add framework in the filter implementation. For example, after converting a time domain HRTF filter to a complex QMF representation, some of the time frequency tiles in the complex QMF representation may have a low absolute value at the aliasing level of the corresponding MPEG Surround filter bank. These entries in the complex QMF representation of the HRTF filter can be set to zero, which allows for reduced complexity for implementing long HRTF filters with an included room response.
フィルタ・マスク・ジェネレータは、絶対値表現モジュール303によって提供される情報に基づいて、フィルタ・マスクM(n,k)を作り、さらに、H(n,k)の選択されたフィルタ係数をフィルタ計算機305に示す選択されたフィルタ・マスクM(n,k)を出力する。フィルタ計算機305は、選択されたフィルタ係数を含むQMFドメインにおいて元のフィルタH(n,k)から新しい圧縮フィルタH(n,k)を作り出す。実施に関する異なる可能性についてのさらなる詳細は、以下に与えられる。
The filter mask generator creates a filter mask M (n, k) based on the information provided by the absolute
図4は、フィルタ・コンプレッサ102のさらなる実施形態を示し、それは、図3に示されるフィルタ・コンプレッサ102の実施形態と同じ基本構成を有する。具体的には、図4に示されるフィルタ・コンプレッサ102の実施形態も、絶対値表現モジュール303を含み、それは、一方ではフィルタ・コンプレッサ102の実施形態の入力に接続され、他方では絶対値表現モジュール303の出力を介してマスク・ジェネレータ304に接続される。図4におけるフィルタ・コンプレッサ102の実施形態も、フィルタ計算機305を含み、それは、フィルタ・コンプレッサの入力およびマスク・ジェネレータ304の出力に接続される。フィルタ計算機305の出力は、前と同じように、図4に示されるフィルタ・コンプレッサ102の実施形態の出力を表す。
FIG. 4 shows a further embodiment of the
しかしながら、図3に示されるフィルタ・コンプレッサ102の実施形態と比較して、絶対値表現モジュール303およびフィルタ計算機305は、図4に示される実施形態の場合にさらに詳細に示され、本願特許出願の以下のセクションにおいて代わりのまたはさらなる実施とともにさらに詳細に説明される。
However, compared to the embodiment of the
絶対値表現モジュール303は、絶対値アルゴリズム関数モジュール401を含み、それは、絶対値表現モジュール303の入力および出力間に白色化モジュール402と直列に接続される。フィルタ計算機モジュール305は、フィルタ・デシメータ・モジュール403を含み、それは、利得計算機404と直列に接続される。フィルタ・デシメータ・モジュール403および利得計算機404の両方は、フィルタ計算機モジュール305の入力および出力間に直列に接続される。具体的な実施に応じて、マスク・ジェネレータ304によって提供されるようにマスクに関する情報は、図4に示されるように、フィルタ・デシメータ・モジュール403に提供されさらに任意に利得計算機モジュール404に提供される。しかしながら、フィルタ計算機モジュール305の具体的な実施に応じて、利得計算機モジュール404には、図4の破線によって示されるように、利得計算機モジュール404およびフィルタ計算機モジュール305の入力間の任意の接続を介して、フィルタ・コンプレッサ102の実施形態に提供されるように、入力サブバンド・フィルタ・インパルス応答H(n,k)が任意に提供されてもよい。
The absolute
図4にさらに詳細に示されるフィルタ・コンプレッサ102の実施形態の個々のモジュールについて述べる前に、図4に示されるようにフィルタ・コンプレッサ102の実施形態の機能性の総括が与えられる。
Before discussing the individual modules of the
図4において、本発明によるフィルタ・コンプレッサ102の異なる実施形態が概説される。ここで、絶対値表現モジュール303は、絶対値および対数関数モジュール401と、絶対値および対数関数モジュール401によって供給される絶対値の表現のスペクトル白色化を実行する白色化モジュール402とを含む。フィルタ・マスク・ジェネレータ304は、前と同じであり、フィルタ・マスクM(n,k)をフィルタ計算機モジュール305に出力する。これは、フィルタH(n,k)の選択された係数を保持し、他の係数をこの実施形態においてゼロに設定するフィルタ・デシメータ・モジュール403と、圧縮フィルタH(n,k)の利得が元のフィルタH(n,k)のそれと同様であるように、フィルタの利得を調整する利得計算機モジュール404とを含む。
In FIG. 4, a different embodiment of the
方程式(1)によって示される評価表現A(n,k)は、人間の耳の特定の音響特性を考慮することなく人間の耳に関して体積配分を反映する。 The evaluation expression A (n, k) shown by equation (1) reflects the volume allocation for the human ear without taking into account the specific acoustic properties of the human ear.
評価表現A(n,k)を概略的に表す図3における部分図302は、図3に示される平面において2つのインデックスk、nの関数として評価表現A(n,k)の3次元プロットとして理解することができ、さらに、評価表現値A(n,k)は、部分図302のn−k平面と直角にプロットされる。換言すれば、部分図302は、サンプル・インデックスまたは時間インデックスnとサブバンド・インデックスkとの関数としてフィルタA(n,k)絶対値の時間/周波数表現の評価表現の略図を示す。時間インデックスまたはサンプル・インデックスnは、例えば、時間ドメイン・インパルス応答h(n)のインデックスnからL(サブバンドの数)倍だけ異なってもよい。図9、図11および図12との関連で説明されるように、フィルタ・コンバータ101は、複素変調された分析フィルタバンクを含んでもよく、それは、順に1つ以上のダウンサンプラを含んでもよく、それは、サンプルの数を係数倍だけ低減し、それは、例えばサブバンドLの数であり得る。しかしながら、これらのダウンサンプラが任意のコンポーネントであるように、インデックスnは、時間ドメイン・インパルス応答H(n)のインデックスに相当する時間インデックスまたはサンプル・インデックスを指すか、または、例えば、時間ドメイン・インパルス応答H(n)の時間またはサンプル・インデックスnからL倍だけ異なるダウンサンプルされた時間インデックスまたはサンプル・インデックスに対応してもよい。
The partial diagram 302 in FIG. 3 schematically representing the evaluation expression A (n, k) is a three-dimensional plot of the evaluation expression A (n, k) as a function of the two indices k, n in the plane shown in FIG. Further, the evaluation expression value A (n, k) is plotted at right angles to the nk plane of the
以下には、白色化モジュール402についてのさらなる詳細が概説される。本発明によって教示される白色化モジュールの目的は、知覚的に重要なフィルタ・タップが廃棄される状況を回避するために、マスク生成の前にフィルタの知覚的な重み付けを可能にすることであり、その理由は、それらが、他の知覚的により重要でないフィルタ・タップのために小さい絶対値を有するからである。
In the following, further details about the
スペクトル白色化は、図14との関連でさらに方程式(4)によって表されるように特に白色化を考慮してさらに詳細に説明されるにもかかわらず、(スペクトル)白色化が、フィルタ圧縮の過程において作られるディストーションを防止しまたは最小化するためにエネルギーをスペクトル部分から異なるスペクトル部分に転送することが望ましいという知見に基づく点に留意すべきである。 Even though spectral whitening is described in more detail in particular with regard to whitening as represented by equation (4) in connection with FIG. 14, (spectral) whitening is It should be noted that it is based on the finding that it is desirable to transfer energy from one spectral part to another in order to prevent or minimize the distortion created in the process.
現実のフィルタおよびオーディオ・システムは、不規則に分散された時間/周波数分布を非常に多くの場合に有し、それは、より高い周波数に位置されているサブバンドよりはむしろより低い周波数に位置されているサブバンドと比較して著しく大きい長さを有するサブバンド・ドメインにおいてフィルタ・インパルス応答をもたらすことができる。さらに、現実のフィルタおよびオーディオ・システムの不規則に分散された振幅/周波数分布は、互いに関して個々のサブバンド・フィルタの異なる関連性を導くこともできる。換言すれば、例えば、より高い周波数で現実のフィルタおよびのオーディオ・システムより高い減衰化のため、より高い周波数に対応するサブバンド・フィルタは、より低い周波数に対応するサブバンド・フィルタと比較して、それほど重要でない。しかしながら、フィルタ圧縮がより高い周波数サブバンド・フィルタにおいて有する影響を防止しまたは少なくとも最小化するために、(スペクトル)白色化は、リスニング体験の激しいディストーションを導く、圧縮の過程において完全に抑制されることから、より高い周波数でサブバンド・フィルタを、上で概説されるシナリオにおいて防止するために有利に実施することができる。そのため、重み付けとも呼ばれる(スペクトル)白色化は、現実のフィルタおよびオーディオ・システムのための重要な点であり得る。 Real-world filters and audio systems very often have an irregularly distributed time / frequency distribution that is located at lower frequencies rather than subbands located at higher frequencies. A filter impulse response can be provided in the subband domain that has a significantly greater length compared to the subband being. Furthermore, the random distributed amplitude / frequency distribution of real filters and audio systems can also lead to different associations of individual subband filters with respect to each other. In other words, a subband filter corresponding to a higher frequency is compared to a subband filter corresponding to a lower frequency, for example due to higher attenuation than real filters and audio systems at higher frequencies. And not so important. However, to prevent or at least minimize the effect that filter compression has on higher frequency subband filters, (spectral) whitening is completely suppressed in the process of compression, leading to intense distortion of the listening experience. Thus, subband filters at higher frequencies can be advantageously implemented to prevent in the scenario outlined above. Thus, (spectral) whitening, also called weighting, can be an important point for real-world filters and audio systems.
したがって、図4に示される実施形態において絶対値表現モジュール303に含まれるように白色化モジュール402は、正規化効果が全体の周波数範囲を周波数バンドに分割することによって使用されるスペクトル白色化を適用する。複素変調された分析フィルタバンクとの関連でさらに詳細に説明されるように、それぞれのサブバンドは、特定の中心周波数を有する特定の周波数範囲に対応する。結果として、サブバンドは、中心周波数に従って配列することができる。自然な選択において、サブバンド・インデックスkは、増加する順序において中心周波数に増加する順序に対応する。
Therefore, as included in the absolute
前述の周波数バンドに関して正規化効果の形式においてスペクトル白色化を実施するために、サブバンドまたはサブバンドのサブグループの知覚的に関連したインターバルが形成され、それはそれぞれ少なくとも1つのサブバンドを含む。さらに、多くの具体的な実施において、個々のサブバンドは、全体として正確に1つのサブグループに属する。しかしながら、サブバンドのそれぞれのサブグループは、複数のサブバンドを含んでもよい。この場合、サブグループは、典型的に隣接した中心周波数を有するサブバンドだけを含む。 To perform spectral whitening in the form of a normalization effect with respect to the aforementioned frequency bands, perceptually related intervals of subbands or subgroups of subbands are formed, each including at least one subband. Further, in many specific implementations, individual subbands belong to exactly one subgroup as a whole. However, each subgroup of subbands may include multiple subbands. In this case, the subgroup typically includes only subbands with adjacent center frequencies.
換言すれば、サブバンドが、増加する順序においてそれらの中心周波数に従ってさらに同時に増加するサブバンド・インデックスkに従って配列される場合、隣接した周波数を有するサブバンドだけを含むサブグループは、サブバンド・インデックスkを有するサブバンドに関連し、それは、2つの配列されたサブバンド・インデックス間の最大差が方程式(3)との関連で説明されるように+/−lに等しいように、配列することができる。換言すれば、それぞれの周波数バンドは、サブバンドのサブグループまたはインターバルによって表すことができ、それは、サブバンドの上位集合である。しかしながら、サブバンドのサブグループが正確に1つのサブバンドを含んでもよい点に留意すべきである。 In other words, if the subbands are arranged according to a subband index k that increases further simultaneously according to their center frequencies in increasing order, the subgroup containing only subbands with adjacent frequencies is subband indexed. associated with subbands having k, which is arranged such that the maximum difference between two arranged subband indices is equal to +/− l as described in connection with equation (3) Can do. In other words, each frequency band can be represented by a subgroup or interval of subbands, which is a superset of subbands. However, it should be noted that a subgroup of subbands may contain exactly one subband.
前述のように、スペクトル白色化の枠組みにおいて、特定の数Pの周波数バンド、サブバンドのサブグループまたはインターバルは、区別される。原則として、サブバンドのサブグループの数pは、整数であり、それは、それぞれのサブグループが少なくとも1つのサブバンドを含みさらにそれぞれのサブバンドが正確にサブバンドの1つのサブグループに属する制約のためサブバンドの数Lより小さい。L=64のサブバンドにおいて作動するフィルタ・システムの場合に、サブバンドのサブグループの典型的な数Pは、28になるように選択することができる。しかしながら、この数は、上述のように制限されない。サブバンドのサブグループの対応する数P(例えばP=32)は、周波数ドメインにおいて知覚的に関連したインターバルを表す心理音響モデルに基づいて選択することができる。 As mentioned above, in the spectral whitening framework, a certain number P of frequency bands, subband subgroups or intervals are distinguished. In principle, the number p of subgroups of subbands is an integer, which means that each subgroup contains at least one subband, and each subband belongs to exactly one subgroup of subbands. Therefore, it is smaller than the number L of subbands. For a filter system operating in L = 64 subbands, a typical number P of subband subgroups can be selected to be 28. However, this number is not limited as described above. A corresponding number P of subgroups of subbands (eg, P = 32) can be selected based on a psychoacoustic model representing perceptually relevant intervals in the frequency domain.
したがって、白色化は、多くの現実のフィルタおよびオーディオ・システムにおいて、任意に心理音響モデルに関する人間の耳の知覚特性に基づいて、エネルギーのより低いスペクトル部分からより高いスペクトル部分への転送を導く。 Thus, whitening leads to a transfer from a lower spectral portion of energy to a higher spectral portion, in many real filters and audio systems, optionally based on the perceptual characteristics of the human ear with respect to psychoacoustic models.
しかしながら、白色化モジュール402の異なる実施は、絶対値表現303の枠組みにおいて容易に実施することができる。具体的には、他の実施は、方程式(4)に従ってサブバンドのそれぞれのサブグループに含まれる全てのサブバンドに基づいて白色化を実行する代わりに、インデックスkを有するそれぞれのサブバンドに対して評価表現A(n,k)を個々に白色化する可能性を含む。さらに、方程式(4)に示されるように最大値を減算する代わりに、白色化は、評価表現A(n,k)の全ての値を分割しさらにそれによりそれぞれのサブバンドの最大に関してまたはサブバンドのそれぞれのサブグループの最大値に関して評価表現の全ての値を正規化することによって、実行することができる。さらに、評価表現を分割することによる記載されている正規化は、それぞれの評価表現A(n,k)の全ての値の合計が(それぞれの個々のサブバンドに関してまたはサブバンドのそれぞれのサブグループに関して)実行することができるように、実行することもできる。この場合、第1のステップにおいて、それぞれのサブバンドまたはサブバンドのそれぞれのサブグループに関して評価表現の全ての値の合計が決定され、その後に、方程式(4)に従って減算することまたはそれぞれの合計値を有する評価表現の値を分割することが続く。
However, different implementations of the
要約すると、上で概説される実施形態において、調べることおよび選択することは、フィルタ・タップでフィルタ・インパルス応答値の絶対値に基づく。そのため、この実施形態において、フィルタ・インパルス応答値は、より高い値を含む少なくとも1つを選択する場合、フィルタ・タップの絶対値に関する比較に基づいて選択されるかまたは選択されない。異なる実施形態において、必要に応じて、フィルタ・タップを比較することまたは調べることが、他の数学的手段の適用に基づいてもよい。フィルタ・タップが実数値である場合、原則として、数学的手段の適用は必要でないが、絶対値を計算しまたは決定することが実施されてもよい。 In summary, in the embodiment outlined above, examining and selecting is based on the absolute value of the filter impulse response value at the filter tap. Thus, in this embodiment, the filter impulse response value is selected or not selected based on a comparison on the absolute value of the filter tap when selecting at least one that includes a higher value. In different embodiments, comparing or examining the filter taps as needed may be based on the application of other mathematical means. If the filter tap is real-valued, in principle, no mathematical means need be applied, but calculating or determining the absolute value may be implemented.
複素数値のフィルタ・タップの場合、いくつかの数学的手段の適用が望ましい。例としては、絶対値を導き出すこと、または、複素数の平面において所定の若しくは明確な方向(例えば正の実数の方向)に関してフィルタ・タップの角度若しくは位相を導き出すことであり得る。さらに、実数部、実数部の絶対値、虚数部、虚数部の絶対値を決定すること、または、それぞれの複素数を(任意に正の)実数にマップするその他の関数も、原則として適用することができる。 In the case of complex-valued filter taps, it is desirable to apply some mathematical means. Examples may be deriving absolute values or deriving the filter tap angle or phase with respect to a predetermined or unambiguous direction (eg positive real direction) in a complex plane. In addition, determine the real part, the absolute value of the real part, the imaginary part, the absolute value of the imaginary part, or other functions that map each complex number to a (optionally positive) real number as a rule. Can do.
図4に示される実施形態において、白色化モジュール402による出力として白色化された評価表現AW(n,k)は、マスク・ジェネレータ304に提供され、それは、白色化された評価表現に基づいてフィルタ・マスクまたはマスクM(k)を作る。評価表現についての実際の白色化モジュール402のため、マスク・ジェネレータ304は、最も多くの(知覚的に)関連したフィルタ係数を選択することができる。フィルタ・マスクは、図4に示される実施形態において、1セットの0および1であり、M(n,k)=1は、対応するフィルタ・タップまたはフィルタ・インパルス応答値が用いられまたは保持されるように選択されることを示す。したがって、値M(n,k)=0は、サンプル・インデックスまたは時間インデックスnとサブバンド・インデックスkとによって識別される対応するフィルタ・タップまたはフィルタ・インパルス応答値が選択されず、そのため、用いられないことを示す。換言すれば、特定のフィルタ・インパルス応答値は、無視されるかまたはゼロに設定される。
In the embodiment shown in FIG. 4, the whitened evaluation expression A W (n, k) as output by the
マスク・ジェネレータ304の具体的な実施は、フィルタ・コンプレッサ102の実施形態によって大幅に異なり得る。図4に示される実施形態において、マスク・ジェネレータは、例えば、フィルタ・マスクM(n,k)=1の対応する値を設定するがフィルタ・マスクの残りの値が0に設定されることによる白色化された評価表現AW(n,k)に基づいて、特定の数のインパルス応答値を選択することができる。特定の絶対数のインパルス応答値を選択することは別として、1セットのサブバンド・フィルタ応答H(n,k)によって与えられる全体の数のインパルス応答値に関する相対数も可能である。それぞれの入力サブバンド・フィルタ・インパルス応答が16個の非ゼロの、ゼロになることのないまたは非自明なフィルタ・タップを含むL=64のQMFサブバンド実施の場合における具体的な例において、入力サブバンド・フィルタ応答の全体のマトリクスは、1024個のインパルス応答値を含む64・16のマトリクスによって与えられる。この例において、マスク・ジェネレータ304は、例えば、特定の所定の数のインパルス応答値(例えば白色化された評価表現によって提供されるように最も大きい絶対値による256個のエレメント)を選択することができ、または、マスク・ジェネレータ304は、全体の数のフィルタ・インパルス応答に関して所定のまたは特定の比率(相対数)のフィルタ・インパルス応答(例えば全体の数の25%のフィルタ応答値)を選択することができる。いずれの場合においても、残りのインパルス応答値は、フィルタ・マスクM(n,k)の対応する値をゼロ(M(n,k)=0)に等しく設定することによって無視されるかまたは選択されない。
The specific implementation of the
フィルタ・コンプレッサ102のさらなる実施形態において、マスク・ジェネレータ304は、選択される絶対数のインパルス応答値を示しまたは全体の数のインパルス応答値に関してインパルス応答値の比率を示す信号を受信するように構成されてもよい。フィルタ・コンプレッサ102のそのような実施形態において、圧縮比は、前に言及された図を調整することによって調整することができる。
In a further embodiment of the
さらに、マスク・ジェネレータ304は、代わりにまたは付加的に、異なる基準に基づいてそれぞれのフィルタ・インパルス応答値を選択するように構成されてもよい。例えば、マスク・ジェネレータ304は、サブバンドごとに所定の、一定の、プログラム可能なまたは適合性のある数のインパルス応答値(例えばそれぞれのサブバンドに対して評価表現に関する最大値を有する3つのインパルス応答値)を選択するように構成されてもよい。さらに、マスク・ジェネレータ304は、例えば、全てのインパルス応答値が選択されるように、閾値基準が所定の、一定の、調整可能なまたはプログラム可能な閾値より大きい対応する評価表現値を保持するように構成されてもよい。さらなる実施態様において、隣接したインパルス応答値で、それぞれの値との比較に基づいて、インパルス応答値を選択することができるように、マスク・ジェネレータ304を構成することが望ましい。例えば、マスク・ジェネレータ304は、それぞれの値が(任意に白色化された)評価表現を考慮して隣接した値と比較して一定の、所定の、プログラム可能なまたは調整可能な比率より小さい(例えば25%より小さい)場合、フィルタ・インパルス応答値が選択されないように構成されてもよい。しかしながら、他の選択スキームも実施され得る。
Further, the
しかしながら、白色化のため、方程式(4)との関連で記載されるように、サブバンドのそれぞれのサブグループまたは個々のサブバンドに基づいて、少なくとも1つのインパルス応答値は、選択されたインパルス応答値の数がサブバンドによってまたはサブグループによって大幅に異なるが、具体的な実施に応じて、サブバンドのそれぞれのサブグループにおいてまたはそれぞれのサブバンドにおいて選択される。例えば、評価表現値の対応するサブセットの最大値で評価表現A(n,k)を除算することによって実施される白色化の場合、マスク・ジェネレータ304の上述の実施において、少なくとも1つのフィルタ・インパルス応答値は、図14との関連で説明されるように、それぞれのサブバンドにおいてまたはサブバンドのそれぞれのサブグループにおいて選択される。
However, for whitening, as described in connection with equation (4), based on each subgroup of subbands or individual subbands, at least one impulse response value is selected from the selected impulse response. The number of values varies greatly from subband to subband or from subgroup to subband, but is selected in each subgroup of subbands or in each subband, depending on the specific implementation. For example, in the case of whitening implemented by dividing the evaluation expression A (n, k) by the maximum value of the corresponding subset of evaluation expression values, in the above implementation of the
結果として、絶対値表現モジュール303およびマスク・ジェネレータ304の相互作用は、n−k平面(参照図3における部分図302参照)においてフィルタ・インパルス応答価値の重要なエリアへの集合、および、n−k平面の知覚的に関連したエリア間において「減圧」または「空気」の「圧縮」を導く。したがって、関連したインパルス応答値は、マスクM(n,k)を設定することによって無視される。
As a result, the interaction between the absolute
この実施形態において、マスクは、ゼロまたは1であるエントリーからなる。ゼロを有するエントリーは、どのフィルタ係数が放棄されるべきものであるかを表し、1を有するエントリーは、どのフィルタ係数が保持(選択)されるべきものであるかを表す。 In this embodiment, the mask consists of entries that are zero or one. An entry with a zero indicates which filter coefficients are to be discarded, and an entry with a 1 indicates which filter coefficients are to be retained (selected).
いずれの場合においても、Gmaxは、利得補償についての上限であり、さらにεは、ゼロでの除算を回避するために含まれる小さい正の数である。したがって、Gmaxおよびεの両方は、数であり、それらは、方程式(6)および(8)において括弧でくくられた括弧における2つの項の最小によるように、ゼロによる除算を防止するため(すなわちε>0)に、さらに、利得計算機モジュール404によってサブバンドに適用される利得を最大利得Gmaxによって定義されるような値に制限するために、利得計算機404の数値実施に役立ち、それぞれの利得G(k)およびG(p)は、Gmaxの値に制限される。
In any case, G max is an upper bound for gain compensation, and ε is a small positive number included to avoid division by zero. Thus, both G max and ε are numbers, and they prevent division by zero, such as by the minimum of two terms in parentheses bracketed in equations (6) and (8) ( I.e., ε> 0), and further, to limit the gain applied to the subbands by the
したがって、利得計算機モジュール404は、少なくともいくつかの入力サブバンド入力応答のマスキングの過程において失われるエネルギーを補償するためにエネルギーに関してマスクされたフィルタ・タップHM(n,k)を正規化する。換言すれば、フィルタ・デシメータ403の枠組みにおいてマスキングのため、マスクされたサブバンド・フィルタ・インパルス応答HM(n,k)に対応するサブバンド・フィルタ入力応答によってフィルタにかけられる信号は、サブバンド・フィルタ・インパルス応答H(n,k)を使用するサブバンド・フィルタと比較して、より小さいエネルギーを有する。
Accordingly, gain
しかしながら、利得計算機モジュール404は、異なる利得スキームを適用するように構成されてもよい。一例として、エネルギーではなくむしろサブバンド・フィルタ・インパルス応答の絶対値の直接比較は、利得係数を決定するために使用することができる。付加的にまたは代わりに、利得係数Gは、方程式(6)および(8)との関連で説明されるように、個々のサブバンドまたはサブバンドの個々のサブグループのインパルス応答値よりむしろ、全体の数のサブバンド・フィルタ・インパルス応答値に基づいて、決定することができる。さらに、利得計算モジュール404が、必要なコンポーネントでなく、むしろ任意のコンポーネントである点に留意すべきである。
However, the
フィルタ・インパルス応答コンストラクタまたはフィルタ計算機モジュール305は、本発明のさらなる実施形態において、上述のように非選択のサブバンド・フィルタ・インパルス応答値をゼロに設定することによってだけでなく、圧縮サブバンド・フィルタ・インパルス応答を構成することができる。具体的な実施に応じて、フィルタ・インパルス応答コンストラクタ305は、例えば、圧縮サブバンド・フィルタ・インパルス応答を構成するために、適切な選択されまたは決定されたサブバンド・フィルタ・インパルス応答値を重み付け、コピーし、または取得することによって、これを達成することができる。
The filter impulse response constructor or
これに関連して、決定されていないかまたは選択されていないフィルタ・インパルス応答値をたとえ無視するかまたは含まないでも、時間においてフィルタの圧縮を導かない点に留意すべきである。本願記載の枠組みにおいて、選択されていないかまたは決定されていないフィルタ・インパルス応答値を放置し、無視しまたは用いないことは、遅延演算子z−1の係数への単なる修正は別として対応する(QMFフィルタバンク)多項式の多項式の個々の加数の順序の著しい変化を導かない。換言すれば、フィルタ・タップまたはフィルタ・インパルス応答を無視し、放置し、ゼロに設定しまたはその他にさらに注意しないことによって、遅延演算子z−1の累乗に関して、フィルタ・タップの新しい分布を導かない。選択されずまたは決定されないようなフィルタ・インパルス応答値に続く、選択されまたは決定されるフィルタ・タップまたはフィルタ・インパルス応答値は、遅延演算子の累乗に関して変えられない。 In this connection, it should be noted that even if ignoring or not including a filter impulse response value that has not been determined or selected, does not lead to compression of the filter in time. In the framework of the present application, leaving a filter impulse response value that is not selected or not determined, neglected or not used corresponds to a simple modification to the coefficient of the delay operator z−1. (QMF filter bank) Does not lead to significant changes in the order of the individual addends of the polynomial. In other words, ignoring the filter tap or filter impulse response, leaving it, setting it to zero, or not paying extra attention to it, leads to a new distribution of filter taps with respect to the power of the delay operator z−1. No. The filter tap or filter impulse response value that is selected or determined following the filter impulse response value that is not selected or determined is not changed with respect to the power of the delay operator.
換言すれば、フィルタ・インパルス応答コンストラクタ305によって構成されるように圧縮サブバンド・フィルタ・インパルス応答は、非選択のフィルタ・インパルス応答値のフィルタにかけられたタップに対応するゼロ値の値を含むことができ、または、圧縮サブバンド・フィルタ・インパルス応答は、それぞれの非選択のフィルタ・インパルス応答値を全く含まないことができる。さらに換言すれば、フィルタ・インパルス応答コンストラクタ305は、例えば、増加した数のゼロ値を有する値を除いて、入力サブバンド・フィルタ・インパルス応答として同じ数のサブバンド・フィルタ・インパルス応答値を原則として有する圧縮サブバンド・フィルタ・インパルス応答を構成することができ、または、圧縮サブバンド・フィルタ・インパルス応答は、フィルタ・インパルス応答コンストラクタ305が選択された値をコピーしさらに非選択の値を無視するように、より短い全体の長さを有することができる。
In other words, the compressed subband filter impulse response as configured by the filter
実数値のフィルタ・インパルス応答値が複素数値のフィルタ・インパルス応答値と比較して著しい煩雑性低減を導くので、フィルタ・インパルス応答コンストラクタ305は、選択されたフィルタ・インパルス応答値のいくつかの絶対値を有利に出力することもできる。この動作モードは、人間の聴覚が位相関係に対して感受性が低いより高い周波数に対応するサブバンドにおいて特に魅力的である。
Since the real-valued filter impulse response value leads to a significant complexity reduction compared to the complex-valued filter impulse response value, the filter-
結果として、境界周波数より上の中心周波数に対応するサブバンドのサブバンド・インパルス応答値は、上述のエレメントのうちの少なくとも1つの絶対値、虚数部、実数部、位相、線形結合、多項式組合せまたは実数値式と任意に置換することができる。また、複素数値の虚数部は、本願記載の枠組みにおいて実数値の数であると考慮される。具体的な実施に応じて、境界周波数は、1kHz〜10kHzの範囲にあり得るが、多くのアプリケーションにおいて、1kHz〜5kHzまたは1kHz〜3kHzの間の範囲において境界周波数の実施は、人間の典型的な聴覚特性を考慮して利用することができる。さらに、フィルタ・コンプレッサの具体的な実施に応じて、複素数値のフィルタ・インパルス応答値に基づく実数値の値による複素数値のフィルタ・インパルス応答値の記載されている置換は、選択され若しくは決定された、選択されていない、または、決定されていないフィルタ・インパルス応答値に応じて実施することができる。代わりにまたは付加的に、境界周波数の上の中心周波数に対応するサブバンドに属するフィルタ・インパルス応答値は、通常、複素数値のフィルタ・インパルス応答値に基づいて、対応する実数値の値と置換することができる。これに関連して、決定されまたは選択されたフィルタ・インパルス応答値を用いることが、対応するフィルタ・インパルス応答値を置換するために、そのようなフィルタ・インパルス応答値に基づいて、(例えば実数値の)値を用いることを含む点に留意すべきである。 As a result, the subband impulse response value of the subband corresponding to the center frequency above the boundary frequency is the absolute value, imaginary part, real part, phase, linear combination, polynomial combination or at least one of the above-mentioned elements Can be arbitrarily replaced with a real-valued expression. Also, the imaginary part of a complex value is considered to be a real number in the framework described herein. Depending on the specific implementation, the boundary frequency may be in the range of 1 kHz to 10 kHz, but in many applications the implementation of the boundary frequency in the range between 1 kHz to 5 kHz or 1 kHz to 3 kHz is typical of humans. It can be used in consideration of auditory characteristics. Further, depending on the specific implementation of the filter compressor, the described replacement of the complex-valued filter impulse response value with a real-valued value based on the complex-valued filter impulse response value is selected or determined. It can also be implemented in response to filter impulse response values that have not been selected or have been determined. Alternatively or additionally, filter impulse response values belonging to the subband corresponding to the center frequency above the boundary frequency are usually replaced with corresponding real-valued values based on complex-valued filter impulse response values can do. In this context, using a determined or selected filter impulse response value may be based on such a filter impulse response value (e.g., an actual value) to replace the corresponding filter impulse response value. It should be noted that this includes the use of numerical values.
図5は、マルチプル・フィルタに同時に作動する本発明によるフィルタ・コンプレッサ501のさらなる実施形態を示す。図5において、異なる実施形態は、概説される。ここで、マルチプル・フィルタ(ν=0、・・・、(N−1)によって示されるN個のフィルタ)は、Nが正の整数であり、フィルタ・コンプレッサ501の実施形態に入力され、それぞれのフィルタは、個々の絶対値表現モジュール303に入力され、N個の表現は、フィルタ・マスク・ジェネレータ502に入力される。
FIG. 5 shows a further embodiment of a
具体的には、図5に示されるフィルタ・コンプレッサ501の実施形態は、1セットのN個のフィルタ・コンバータ101に接続されまたは結合され、それに1セットの実数値の時間ドメイン・インパルス応答Hν(n,k)が供給され、前に説明されるように、ν=0、・・・、(N−1)は、時間ドメインにおいて対応するフィルタのインデックスである。例えば、HRTFのようなシステムの枠組みにおいて5チャンネル入力信号の場合において、5つの入力チャンネルのそれぞれに対してさらに2つのヘッドホン・チャンネル(左右)のそれぞれに対して、個々の時間ドメイン・フィルタは、N=10の総数の時間ドメイン・フィルタを導くように使用される。
Specifically, the embodiment of the
換言すれば、図5に示されるフィルタ・コンプレッサ501には、複数セットのインパルス応答が提供され、複数セットのフィルタ・インパルス応答のそれぞれのセットは、図5に図示される場合、異なるフィルタ・コンバータ101によって提供される。しかしながら、個々のフィルタ・コンバータ101によって提供されるように1セットのフィルタ・インパルス応答に関して、1セットのフィルタ・インパルス応答は、L個の個々のフィルタ・インパルス応答を含み、それぞれは、特定の数のフィルタ・タップまたはフィルタ・インパルス応答値を有する。中心周波数との関連で前に説明されるように、個々のサブバンドに対応するそれぞれのインパルス応答は、中心周波数に関連し、それによって、中心周波数は、複数の中心周波数を形成する。
In other words, the
また、同じサブバンド・インデックスkに対応するが、インデックスνによって示されるように異なるセットのフィルタ・インパルス応答に属するフィルタ・インパルス応答は、同じ中心周波数に対応する。換言すれば、(1セットのフィルタ・インパルス応答によって定義されるように)複数の中心周波数のそれぞれ中心周波数に、少なくとも圧縮の前に、それぞれのセットのフィルタ・インパルス応答において(正確に)1つのフィルタ・インパルス応答を対応する。 Also, filter impulse responses that correspond to the same subband index k, but belong to different sets of filter impulse responses as indicated by index ν, correspond to the same center frequency. In other words, to each center frequency of the plurality of center frequencies (as defined by a set of filter impulse responses), at least prior to compression, (exactly) one in each set of filter impulse responses. Corresponds to the filter impulse response.
それぞれのフィルタ・コンバータ101は、それぞれの時間ドメイン・フィルタに対して1セットの複素数値のサブバンド・フィルタ・インパルス応答Hν(n,k)を提供し、それは、図5に示されるフィルタ・コンプレッサ501の実施形態に提供される。N個の異なる時間ドメイン・フィルタのためのそれぞれのサブバンド・フィルタ・インパルス応答は、個々の絶対値表現モジュール303に提供され、それは、N個の時間ドメイン・フィルタのそれぞれのための絶対値表現または評価表現をフィルタ・マスク・ジェネレータ502に提供する。絶対値表現モジュール303は、同じ引用符号によって示されるように、本願において概説される本発明のフィルタ・コンプレッサの他の実施形態のうちの1つから選ぶことができる。
Each
この(共同の)絶対値表現は、正確に前の実施形態において単一のフィルタ・マスク・ジェネレータ304におけるように単一のマスク生成M(n,k)のための基礎を形成する。白色化ステップが実行される場合において、これは、個々の絶対値表現モジュール303のために実行することもできまたは共同の絶対値表現のために一度だけ実行することもできる。
This (joint) absolute value representation forms the basis for a single mask generation M (n, k) exactly as in the single
図15との関連で、フィルタ・コンプレッサ501の実施形態が述べられ、そこにおいて、(スペクトル)白色化がそれぞれのフィルタν=0、・・・、(N−1)に対して個々に実行される。この実施形態におけるフィルタ・マスク・ジェネレータ502は、全てのフィルタのN個の絶対値表現に基づいて、全てのフィルタのための単一のフィルタ・マスクM(n,k)を作る。これは、本発明の実施形態の大きな利点であり、その理由は、フィルタ・マスク・ジェネレータ502が、圧縮フィルタが後の状態のおいてどのように組み合わされるかについて考慮することができるからである。それぞれの元のフィルタは、概説されるように、フィルタ計算機305に入力され、その後に、フィルタ・コンプレッサは、それぞれのフィルタ計算機に同じマスクM(n,k)が提供されるように、N個の新しいフィルタAWν(n,k)を作り出す。
In the context of FIG. 15, an embodiment of a
方程式(11)と比較して、方程式(11´)の(共同の)絶対値表現A(n,k)は、等しく分散された重み係数ω(ν)=1/Nを定義することによって方程式(11)の結果に変換することができる。換言すれば、方程式(11)による絶対値表現の計算は、インデックスνによって示されるそれぞれのフィルタの知覚的な重要性の重み付けを可能にするように、より大きな柔軟性を提供する方程式(11´)による絶対値表現の特殊な形式を表す。 Compared to equation (11), the (joint) absolute value representation A (n, k) of equation (11 ′) is obtained by defining an equally distributed weighting factor ω (ν) = 1 / N. It can convert into the result of (11). In other words, the calculation of the absolute value representation according to equation (11) provides more flexibility so as to allow weighting of the perceptual importance of each filter indicated by the index ν. ) Represents a special form of absolute value representation.
時間ドメインにおいてN個の個々のフィルタのそれぞれに対して同じフィルタ・マスクM(n,k)を用いることによって、フィルタ・コンプレッサ501の実施形態は、フィルタ・コンプレッサ501の後のN個の個々のサブバンドの後処理さえ、他のフィルタのうちの1つにおいて対応する選択されたインパルス応答値を有しない関連したインパルス応答値を有するエントリーを有する結果として生じる圧縮サブバンド・フィルタ・インパルス応答を導かないように、N個のフィルタのそれぞれに対して1セットの圧縮サブバンド・フィルタ・インパルス応答を作り出すことができる。図5に示される実施形態のマスク・ジェネレータ502を図3および図4に示される実施形態のマスク・ジェネレータ304と比較して、マスク・ジェネレータ502は、時間ドメインだけにおいてN個の個々のフィルタのためのN個の入力サブバンド・フィルタ・インパルス応答が提供されるにもかかわらず、N個のサブバンド・フィルタ・インパルス応答の全てを示す単一のマスクM(n,k)を作り出す点に留意することが重要である。
By using the same filter mask M (n, k) for each of the N individual filters in the time domain, an embodiment of the
フィルタ・コンプレッサ501のさらなる実施形態において、異なるマスク・ジェネレータ502が使用でき、それは、時間ドメインにおいてN個のフィルタの全てに対して共通の評価表現を提供するために異なるスキームを原則として用いることができる。換言すれば、方程式(11)に示すように、平均を適用することは別として、絶対値表現モジュール303によって提供されるように個々の評価表現は、例えば、関連するサブバンドに関する重み付けが実施できる、それぞれの値を合計することによって、それぞれの値を線形結合することによって、または、評価表現のそれぞれの値のさらに複雑な組合せ(例えば二次または高次の組合せ)を使用することによって、単一の評価表現に組み合わせることができる。
In a further embodiment of the
すでに前に説明されるように、バイノーラル・デコーダ602は、10個(2つの音声出力チャネル(ステレオ)のための5つの音声入力チャンネル)を4個のHRTFフィルタに組み合わせ、それは、ステレオ入力信号603に直ちに適用することができる。しかしながら、HRTFフィルタは、バイノーラル・ステレオ信号605をレンダリングするためにバイノーラル・デコーダ602に提供される空間パラメータ604に依存する。前述のように、特にHRTFフィルタは、多くの場合に人間の耳および音源のためのバイノーラル・ステレオ出力信号間の非常に複雑な相互作用がモデル化されなければならないように、フィルタ・タップとしてかなりの数の非自明な、非ゼロのまたはゼロになることのないサブバンド・フィルタ・インパルス応答値を含む。それぞれのHRTFフィルタは、例えばモデル化される環境および他の影響の室内特性を効率的にモデル化するために大幅に長くなる得る。
As already explained before,
特にこれに関連して、フィルタ・コンプレッサ501の実施形態は、著しくバイノーラル・デコーダ602に関して計算の複雑性を低減するために効率的に適用することができる。バイノーラル・デコーダ602の枠組みにおいて考慮される関連したサブバンド・フィルタ・インパルス応答値の数を低減することによって、バイノーラル・デコーダ602は、より小さい計算する能力で実施することができ、それは、例えば対応するバイノーラル・デコーダのクロック速度が所定の期間において低い数の計算のため低減され得るように、低いエネルギー消費量を最終的に導く。あるいは、バイノーラル・デコーダ602は、原則として第2の処理コアが回避できるように、同じ理由からより小さく構築することができる。
In particular in this regard, embodiments of the
図7〜図13との関連でさらに詳細に概説されるように、10個の時間ドメインHRTFフィルタを複素QMFドメインまたは複素サブバンド・ドメインに変換するために用いられる192個(=3・64)のフィルタ・タップを有するフィルタ・コンバータを使用すると、896個(=14・64)のフィルタ・タップを有する時間ドメインにおけるHRTFフィルタは、例えば図1に示されるように、フィルタ・コンバータ601またはむしろ10個のフィルタ・コンバータ101によって、それそれが16個(=14+3−1)のフィルタ・タップを含む64個の個々のサブバンド・フィルタ・インパルス応答に転送される。10個の時間ドメインHRTFフィルタのそれぞれに対して結果として生じる1024個のフィルタ・タップは、フィルタ・コンプレッサ501の実施形態がフィルタ・タップの全体の数を例えば4〜256(=1024/4)倍だけ低減するために使用されない限り、バイノーラル・デコーダ602に対するかなりの計算負担をもたらす。この実施形態が複素QMFまたはサブバンド・ドメインにおいて10個のHRTFフィルタのそれぞれのためのL=64個のサブバンドを含むシステムに基づくにもかかわらず、原則としていかなる数のL個のサブバンドも使用され得る。
As outlined in more detail in connection with FIGS. 7-13, 192 (= 3 · 64) used to convert 10 time domain HRTF filters to complex QMF domain or complex subband domain HRTF filter in the time domain with 896 (= 14 · 64) filter taps, for example,
フィルタ・コンプレッサのさらなる実施形態および圧縮サブバンド・フィルタ・インパルス応答フィルタを作るための方法が述べられる前に、フィルタ・コンバータのための可能な解決策および複素サブバンド・ドメイン(QMFドメイン)において作動するフィルタがさらに詳細に説明される。しかしながら、特にフィルタ・コンバータについて、技術背景をさらに詳細に述べる前に、デジタル・フィルタを(時間ドメインにおいてまたはサブバンド・ドメインにおいて)デジタル音声入力に適用する一般概念が述べられるべきである。 Possible solutions for filter converters and operation in the complex subband domain (QMF domain) before further embodiments of filter compressors and methods for making compressed subband filter impulse response filters are described The filter is described in more detail. However, before discussing the technical background in more detail, particularly for filter converters, the general concept of applying a digital filter (in the time domain or in the subband domain) to digital audio input should be described.
図7は、フィルタまたはフィルタ・エレメント700のための可能な解決策を示し、それには、デジタル音声入力が提供される。原則としてデジタル音声入力は時間ドメイン信号および(複素)サブバンド・ドメインにおける信号の両方であり得る点に留意すべきである。フィルタ・エレメントは、出力でデジタル音声出力を提供し、それは、フィルタ定義信号またはそれぞれのフィルタ・インパルス応答信号に応じて、フィルタにかけられたデジタル音声入力を表す。
FIG. 7 shows a possible solution for a filter or
フィルタ・コンバータ101は、図8に示されるように、対応するフィルタ・インパルス応答信号が提供される中心コンポーネントとして複素分析フィルタバンク710を含む。複素分析フィルタバンク710は、時間ドメインにおいてフィルタのインパルス応答信号を分析し、それは、1セットのL個の分析フィルタを有するフィルタリングによって、QMFドメインに転送され、その後に係数Lの任意のダウンサンプリングが続き、Lは、また正の整数であり、好ましくは1より大きくかつ複素分析フィルタバンク710のサブバンドの数を示す。分析フィルタは、プロトタイプ・フィルタq(n)の複素変調によって通常得られ、またnは、データの配列におけるインデックスまたは信号における値のインデックスを示す正の整数である。フィルタバンク710の出力は、L個のサブバンド信号からなり、全体として、複素QMFドメインの時間ドメインにおいてそのフィルタ・インパルス応答によって特徴づけられるフィルタを表す。具体的には、複素分析フィルタバンク710の出力は、1セットのサブバンド・フィルタ・インパルス応答であり、それは、複素QMFドメインにおいて音声入力信号のフィルタリングを実行するためにフィルタ・エレメント700に提供することができ、それは、時間ドメインにおいて直接のフィルタリングと比較して、音声出力信号の知覚的に見分けのつかない違いを導く。
The
プロトタイプ・フィルタq(n)および複素変調された分析フィルタバンクの基本設計は、それらの両方に関するさらなる詳細が概説され、その後にさらに詳細に説明される。さらに、以下において、サブバンドの数は、L=64個で固定されると仮定される。しかしながら、前に説明されるように、これは、本発明の実施形態の制限でなく、単に適切な例として働くだけである。 The basic design of the prototype filter q (n) and the complex-modulated analysis filter bank is outlined in more detail, followed by further details. Further, in the following, it is assumed that the number of subbands is fixed at L = 64. However, as explained previously, this is not a limitation of the embodiments of the present invention, but merely serves as a suitable example.
図9は、複素分析バンク710の可能な解決策をさらに詳細に示す。複素分析バンク710は、複素分析バンク710によって出力されるそれぞれのサブバンドのための複数のL個の中間分析フィルタ720を含む。具体的には、L個の中間分析フィルタ720のそれぞれは、処理される入力信号として時間ドメイン・インパルス応答信号が提供されるノード730に並列に接続される。中間分析フィルタ720のそれぞれは、それぞれのサブバンドの中心周波数に関して複素分析バンク710の入力信号をフィルタリングするために構成される。異なるサブバンドの中心周波数によれば、それぞれのサブバンドは、サブバンド・インデックスまたはインデックスkによって表示され、またkは、典型的に0から(L−1)の範囲において、非負の整数である。複素分析バンク710の中間分析フィルタ720は、中間分析フィルタ720が適用されるサブバンドのサブバンド・インデックスkによる複素変調によってプロトタイプ・フィルタp(n)から導き出すことができる。プロトタイプ・フィルタの複素変調に関するさらなる詳細が以下に説明される。
FIG. 9 shows in more detail a possible solution of the
直接的に中間分析フィルタ720によってまたは(図9において点線によって示される)任意のダウンサンプラ740によって、中間分析フィルタ720によって出力される信号のサンプリング周波数は、係数L倍だけ低減される。前記のように、対応する中間分析フィルタ720によって出力されるそれぞれのサブバンド信号に供給されるダウンサンプラ740は、具体的な実施に応じて、ダウンサンプリングが中間分析フィルタ720の枠組みにおいて実施することもできるように、任意である。原則として、中間分析フィルタ720によって出力される信号のダウンサンプリングは必要でない。それにもかかわらず、明示的なまたは暗黙的なダウンサンプラ740の存在は、複素分析バンク710によって提供されるデータ量がデータの著しい冗長性を導くL倍に選択的に増加されるので、いくつかのアプリケーションにおいて有利なオプションであってもよい。
The sampling frequency of the signal output by the
図10は、サブバンド・フィルタリング750およびフィルタ・コンバータ101とのその相互作用の可能な解決策をさらに詳細に示す。サブバンド・フィルタリング750は、複数の中間フィルタ760を含み、1つの中間フィルタ760には、サブバンド・フィルタリング750に提供される複素数値のそれぞれのサブバンド信号が提供される。そのため、サブバンド・フィルタリング750は、L個の中間フィルタ760を含む。
FIG. 10 shows in more detail a possible solution of the
フィルタ・コンバータ101は、それぞれの中間フィルタ760に接続される。結果として、フィルタ・コンバータ101は、サブバンド・フィルタリング750のそれぞれの中間フィルタ760のためのフィルタ・タップを提供することができる。中間フィルタ760によって行われるフィルタリングに関するさらなる詳細が、アプリケーションのさらなる過程において説明される。そのため、フィルタ・コンバータ101によって出力されかつ異なる中間フィルタ760に提供されるフィルタ・タップは、中間フィルタ定義信号を形成する。
The
さらに、実施形態、解決策および実施が、図面において省略された、信号のいずれかまたは信号のサブセットを遅延するためのさらなるおよび/または任意の遅延を含むことができる点に留意すべきである。それにもかかわらず、遅延またはディレイヤは、それらの具体的な実施に応じて、全ての実施形態、解決策および実施において任意のエレメントとして示されまたは加えられるエレメント(例えばフィルタ)に含ませることができる。 Furthermore, it should be noted that embodiments, solutions and implementations can include additional and / or optional delays for delaying any of the signals or subsets of signals, which are omitted in the drawings. Nevertheless, delays or delayers can be included in elements (eg, filters) shown or added as optional elements in all embodiments, solutions and implementations, depending on their specific implementation. .
図11は、複素合成バンク770のための可能な解決策を図示する。複素合成バンク770は、L個のサブバンド信号が提供されるL個の中間合成フィルタ780を含む。中間合成フィルタ780の枠組みにおいてフィルタリングより前の複素合成バンク770の具体的な実施に応じて、サブバンド信号は、L個のアップサンプラ790によってアップサンプリングされ、それは、サンプリング周波数をL倍に増加することによってサブバンド信号のサンプルされた周波数を再構成する。換言すれば、任意のアップサンプラ790は、それぞれのサブバンド信号に含まれる情報が保持される一方でサンプリング周波数がL倍に増加されるというようなやり方で、アップサンプラ790に提供されるサブバンド信号を再構成またはリフォームする。
FIG. 11 illustrates a possible solution for the
それにもかかわらず、図9との関連ですでに説明されるように、アップサンプラ790は、アップサンプリングが中間合成フィルタ780の枠組みにおいて実施することができるように、任意のコンポーネントである。そのため、アップサンプラ790によって実施されるサブバンド信号をアップサンプリングするステップは、中間合成フィルタ780の枠組みにおいて同時に処理することができる。しかしながら、ダウンサンプラ740が明示的にも暗黙的にも実施されない場合、アップサンプラ790は、明示的にまたは暗黙的に実施される必要もない。
Nevertheless, as already described in connection with FIG. 9,
中間合成フィルタ780は、L個の中間合成フィルタ780によって出力されるフィルタにかけられたサブバンド信号を合計する加算器800に出力を介して接続される。加算器800は、実数部エクストラクタ810にさらに接続され、それは、加算器800によって提供される複素数値の信号に基づいて実数値の信号またはむしろ(実数値の)時間ドメイン出力信号を抽出しまたは形成する。実数部エクストラクタ810は、このタスクを、例えば、加算器810によって提供される複素数値の信号の実数部を抽出することによって、加算器810によって提供される複素数値の信号の絶対値を計算することによって、または、複素数値の入力信号に基づいて実数値の出力信号を形成する他の方法によって、実行することができる。
図12に示される複素合成バンク770のための第2の可能な解決策は、実数部エクストラクタ810および加算器800に関してだけ図11に示される第1の可能な解決策と異なる。具体的には、中間合成フィルタ780の出力は、それぞれのサブバンドから、中間合成フィルタ780によって出力される複素数値の信号に基づいて実数値の信号を抽出しまたは形成する実数部エクストラクタ810に別々に接続される。そして、実数部エクストラクタ810は、加算器800に接続され、それは、加算器800によって提供される実数値の出力信号を形成するためにL個のフィルタにかけられたサブバンド信号から導き出されるL個の実数値の信号を合計する。
The second possible solution for the
前に説明されるように、図3は、フィルタ・コンバータ101の可能な選択を図示する。フィルタは、そのインパルス応答によって与えられると仮定される。このインパルス応答を離散時間信号として見ると、それは、L個のバンド複素分析(フィルタ)バンク710によって分析される。そして、結果として生じるサブバンド信号出力は、正確に図10に示されるサブバンド・フィルタリング750のそれぞれのサブバンドにおいて別々に適用されるフィルタのインパルス応答である。図8に示される場合において、フィルタ・コンバータ101およびその複素分析バンクまたは複素分析フィルタバンク710に提供されるフィルタ定義信号は、フィルタの振幅/周波数特性を示すインパルス応答信号であり、それは、サブバンド・ドメインに転送される。そのため、L個のサブバンドのそれぞれの複素分析(フィルタ)バンク710の出力は、サブバンド・フィルタリング750に含まれる中間フィルタのインパルス応答を表す。
As previously described, FIG. 3 illustrates a possible choice of
複素分析バンク710は、音声出力信号のための分析バンクから原則として導き出されるが、異なるプロトタイプ・フィルタおよびわずかに異なる変調構成を有し、それの詳細が以下の記載に概説される。プロトタイプ・フィルタq(ν)の長さは、比較的小さいように設計することができる。また、係数Lによるダウンサンプリングのため、サブバンド・フィルタの長さは、所定の時間ドメイン・フィルタおよびプロトタイプ・フィルタq(ν)の長さの合計より小さいLの係数である。
The
本願において、ゼロになることのないタップまたは値は、理想的にゼロに等しくないタップまたは値である。それにもかかわらず、このアプリケーションの枠組みにおいて実施制限のため、ゼロになることのない値またはタップは、所定の閾値、例えば10-bまたは2-bより大きい絶対値を有する実数値または複素数値のタップまたは値であり、bは、具体的な実施の要求による正の整数である。デジタル・システムにおいて、この閾値は、バイナリー・システム(基数2)において好ましくは定義され、整数bは、実施の詳細に応じて所定の値を有する。典型的に、値bは、4、5、6、7、8、10、12、14、16または32である。 In this application, a tap or value that is never zero is a tap or value that is ideally not equal to zero. Nevertheless, due to implementation limitations in the framework of this application, a value or tap that never becomes zero is a real or complex value with an absolute value greater than a predetermined threshold, eg, 10 −b or 2 −b . Is a tap or value, and b is a positive integer according to the specific implementation requirement. In digital systems, this threshold is preferably defined in binary systems (base 2), and the integer b has a predetermined value depending on the implementation details. Typically, the value b is 4, 5, 6, 7, 8, 10, 12, 14, 16 or 32.
複素変調されたフィルタバンク Complex modulated filter bank
方程式(13)および(14)において、θおよびψは、実数値の離散時間信号x(n)を複素数値のサブバンド信号にフィルタリングするための、および、複素数値のサブバンド信号dk(m)から実数値の出力サンプルy(n)を再構成するための(一定の)位相係数を表す。プロトタイプ・フィルタおよび一定の位相係数θおよびψは、サブバンド信号が不変であるdk(m)=ck(m)の場合において、完全な再構成y(n)=x(n)を与えるために選択することができることはよく知られている。実際には、完全な再構成特性は、遅延(および/または符号変換)に至るまで当てはまるが、続く計算において、この詳細は、PCT/SE02/00626「複素指数変調されたフィルタバンクを用いるエイリアシングの低減」におけるような設計の疑似QMFタイプの場合において説明されるように、非因果的プロトタイプ・フィルタの使用を可能にすることによって無視される。ここで、プロトタイプ・フィルタは、対称p(−n)=p(n)であり、さらにその離散時間フーリエ変換P(ω)は、インターバル|ω|=p/Lの外側で本質的にゼロになる。完全な再構成は、ほぼ完全な再構成特性とも置換される。後に続く導出に対して、説明を簡単にするために完全な再構成が保持しさらにp/L<|ω|=pに対してP(ω)=0であると仮定される。さらに、位相係数は、ψ−θが4Lの整数の倍数に等しい状態を満たすように仮定される。 In equations (13) and (14), θ and ψ are used to filter the real-valued discrete-time signal x (n) into complex-valued subband signals and complex-valued subband signals dk (m). Represents a (constant) phase coefficient for reconstructing a real-valued output sample y (n) from. Prototype filter and constant phase coefficients θ and ψ to give a complete reconstruction y (n) = x (n) in the case of dk (m) = ck (m) where the subband signal is unchanged It is well known that you can choose. In practice, the full reconstruction characteristics apply up to the delay (and / or code conversion), but in the calculations that follow, this detail will be discussed in the PCT / SE02 / 00626 “Aliasing with Complex Exponential Modulated Filter Bank” section. As explained in the case of a pseudo-QMF type of design as in “reduction”, it is ignored by allowing the use of a non-causal prototype filter. Here, the prototype filter is symmetric p (−n) = p (n), and its discrete-time Fourier transform P (ω) is essentially zero outside the interval | ω | = p / L. Become. Complete reconstruction is also replaced with nearly complete reconstruction characteristics. For subsequent derivations, it is assumed that a complete reconstruction is maintained for simplicity of the description and that P (ω) = 0 for p / L <| ω | = p. Further, the phase coefficient is assumed to satisfy a state where ψ−θ is equal to an integer multiple of 4L.
きわめてサンプルされたフィルタバンクにおいて、合成より前のサブバンド信号の変更は、通常エイリアシング・アーチファクトの導入を導く。これは、係数2によるオーバーサンプリングが複素数値の信号を用いることによって導入されるという事実のため、ここで克服される。サブバンド・サンプルの総サンプリング・レートが離散時間入力信号のサンプリング・レートと同一であるにもかかわらず、入力信号は、実数値であり、さらにサブバンド・サンプルは、複素数値である。下に概説されるように、エイリアスのないことは、効率的な時間不変信号処理を可能にする。 In highly sampled filter banks, changes to subband signals prior to synthesis usually lead to the introduction of aliasing artifacts. This is overcome here by the fact that oversampling by a factor of 2 is introduced by using a complex-valued signal. Even though the total sampling rate of the subband samples is the same as the sampling rate of the discrete time input signal, the input signal is real-valued, and the subband samples are complex-valued. As outlined below, the absence of aliasing allows for efficient time-invariant signal processing.
複素変調されたフィルタバンクにおけるサブバンド・フィルタリング Subband filtering in complex modulated filter banks.
興味のある他の場合は、y(n)=x(n−L)のように、G(ω)=exp(iLω)を導くGk(ω)=exp(−iω)である。 Another case of interest is G k (ω) = exp (−iω) which leads to G (ω) = exp (iLω), such as y (n) = x (n−L).
サブバンド・フィルタリングによって所定のフィルタ応答の近似 Approximate a given filter response with subband filtering
この手順の利点は、いかなる所定のフィルタh(n)も中間サブバンド・フィルタ応答に効率的に変換することができるということである。q(n)がKQ・L個のタップを有する場合、KH・L個のタップの時間ドメイン・フィルタh(n)は、(KH+KQ−1)個のタップを有するサブバンド・ドメイン・フィルタ(24)に変換され、KHおよびKQは、正の整数である。KQが3(L・KQ=192)に等しくさらに時間ドメイン・フィルタのインパルス応答がKH・64(L=64)の長さに対応する場合、それぞれの中間サブバンド・フィルタ760は、KH+3−1=KH+2だけのタップのインパルス応答長を有する。
The advantage of this procedure is that any given filter h (n) can be efficiently converted to an intermediate subband filter response. If q (n) has K Q · L taps, then the time domain filter h (n) of K H · L taps has subbands with (K H + K Q −1) taps. Converted to a domain filter (24), K H and K Q are positive integers. If K Q is equal to 3 (L · K Q = 192) and the impulse response of the time domain filter corresponds to a length of K H · 64 (L = 64), then each
フィルタ・コンバータのためのプロトタイプ・フィルタの設計 Prototype filter design for filter converter
以下において、HRTFフィルタのマルチ・スロットQMF表現(サブバンド・ドメイン)の決定が記載される。時間ドメインから複素QMFサブバンド・ドメインへのフィルタ変換は、フィルタ・コンバータ101においてFIRフィルタによって実行される。具体的には、以下の記載が、複素QMFサブバンド・ドメインにおける長さNHの所定のFIRフィルタh(n)を実施するための方法を概説する。
In the following, the determination of the multi-slot QMF representation (subband domain) of the HRTF filter is described. The filter transformation from the time domain to the complex QMF subband domain is performed in the
それ自体をフィルタにかけるサブバンドは、サブバンド・フィルタリング750の内部で中間フィルタ760によって実施される。具体的には、サブバンド・フィルタリングは、インデックスk=0、1、・・・、63を有するそれぞれのQMFサブバンドに対して1つの複素数値のFIR中間フィルタgk(l)の別のアプリケーションからなる。換言すれば、以下の記載において、特別な参照は、L=64の異なるサブバンド信号の場合になされる。それにもかかわらず、サブバンド信号のこの特別な数は、本質的でなく、さらに、適切な方程式は、さらに一般の形式でも与えられる。
The subband that filters itself is implemented by the
所定の時間ドメインFIRフィルタh(n)を複素サブバンド・ドメイン・フィルタgk(l)に変換するフィルタ・コンバータ101は、複素分析バンク710を含む。L=64のサブバンド信号の特別の場合のための長さ192(=3・64)のフィルタ・コンバータ101q(n)の複素分析フィルタバンク710のプロトタイプ・フィルタは、方程式(28)の過剰に決定されたシステムを最小二乗法において解決することによって作り出される。フィルタ係数q(n)は、L=64のサブバンドの場合について後にさらに詳細に記載される。
A
方程式に基づく方程式の下の本願の枠組みにおいて、さらなる遅延(l0およびn0を参照)係数、さらなる係数の導入、および、ウィンドウ関数または他の単関数の導入の導入が理解される点に留意すべきである。さらに、単純な定数、一定の加数などは、ドロップすることができる。さらに、全くまたは著しいやり方で方程式の結果を変えない代数変換、等価変換および近似(例えばテイラー近似)も、含まれる。換言すれば、結果として生じる一致に関して本質的に導くわずかな修正および変換の両方は、方程式または式が方程式または式が基づく場合において含まれる。 Note that in the framework of the present application under equations based equations, it is understood that additional delay (see l 0 and n 0 ) coefficients, the introduction of further coefficients, and the introduction of window functions or other simple functions. Should. In addition, simple constants, constant addends, etc. can be dropped. Also included are algebraic transformations, equivalent transformations and approximations (eg, Taylor approximation) that do not alter the result of the equation in any or significant manner. In other words, both slight modifications and transformations that essentially lead to the resulting match are included when the equation or expression is based on the equation or expression.
この場合において、整数k=0、1、・・・、63は、またサブバンドのインデックスであり、さらに、l=0、1、・・・、(KH+1)は、結果として生じる中間フィルタ760のタップを示す整数である。 In this case, the integers k = 0, 1,..., 63 are also subband indices, and l = 0, 1,..., (K H +1) is the resulting intermediate filter. An integer indicating 760 taps.
方程式(24)と比較して方程式(32)において(−2)の特別な加数があり、なぜなら、方程式(24)は、フィルタの損失を考慮せずに開発されたからである。実際の実施は、遅延を常に生じる。そのため、具体的な実施に応じて、さらなるディレイヤまたは遅延は、実施することができ、それは、図において単純化のために省略されている。 There is a special addend of (−2) in equation (32) compared to equation (24) because equation (24) was developed without considering the loss of the filter. Actual implementation always introduces a delay. Thus, depending on the specific implementation, further delayering or delay can be implemented, which is omitted in the figure for simplicity.
多くの場合において、線形方程式(28)のシステムは、過度に決定される。それにもかかわらず、それは、プロトタイプ・フィルタ係数q(n)に関して最小二乗法において解決しまたは近似することができる。最小二乗法において線形方程式(28)のシステムを解決することは、0から191までの整数nのための以下の関係を満たすプロトタイプ・フィルタq(n)の以下のフィルタ・タップを導く。
q[0]=−0.2029343380
q[1]=−0.1980331588
q[2]=−0.1929411519
q[3]=−0.1876744222
q[4]=−0.1822474011
q[5]=−0.1766730202
q[6]=−0.1709628636
q[7]=−0.1651273005
q[8]=−0.1591756024
q[9]=−0.1531160455
q[10]=−0.1469560005
q[11]=−0.1407020132
q[12]=−0.1343598738
q[13]=−0.1279346790
q[14]=−0.1214308876
q[15]=−0.1148523686
q[16]=−0.1082024454
q[17]=−0.1014839341
q[18]=−0.0946991783
q[19]=−0.0878500799
q[20]=−0.0809381268
q[21]=−0.0739644174
q[22]=−0.0669296831
q[23]=−0.0598343081
q[24]=−0.0526783466
q[25]=−0.0454615388
q[26]=−0.0381833249
q[27]=−0.0308428572
q[28]=−0.0234390115
q[29]=−0.0159703957
q[30]=−0.0084353584
q[31]=−0.0008319956
q[32]=0.0068418435
q[33]=0.0145885527
q[34]=0.0224107648
q[35]=0.0303113495
q[36]=0.0382934126
q[37]=0.0463602959
q[38]=0.0545155789
q[39]=0.0627630810
q[40]=0.0711068657
q[41]=0.0795512453
q[42]=0.0881007879
q[43]=0.0967603259
q[44]=0.1055349658
q[45]=0.1144301000
q[46]=0.1234514222
q[47]=0.1326049434
q[48]=0.1418970123
q[49]=0.1513343370
q[50]=0.1609240126
q[51]=0.1706735517
q[52]=0.1805909194
q[53]=0.1906845753
q[54]=0.2009635191
q[55]=0.2114373458
q[56]=0.2221163080
q[57]=0.2330113868
q[58]=0.2441343742
q[59]=0.2554979664
q[60]=0.2671158700
q[61]=0.2790029236
q[62]=0.2911752349
q[63]=0.3036503350
q[64]=0.9025275713
q[65]=0.9103585196
q[66]=0.9176977825
q[67]=0.9245760683
q[68]=0.9310214581
q[69]=0.9370596739
q[70]=0.9427143143
q[71]=0.9480070606
q[72]=0.9529578566
q[73]=0.9575850672
q[74]=0.9619056158
q[75]=0.9659351065
q[76]=0.9696879297
q[77]=0.9731773547
q[78]=0.9764156119
q[79]=0.9794139640
q[80]=0.9821827692
q[81]=0.9847315377
q[82]=0.9870689790
q[83]=0.9892030462
q[84]=0.9911409728
q[85]=0.9928893067
q[86]=0.9944539395
q[87]=0.9958401318
q[88]=0.9970525352
q[89]=0.9980952118
q[90]=0.9989716504
q[91]=0.9996847806
q[92]=1.0002369837
q[93]=1.0006301028
q[94]=1.0008654482
q[95]=1.0009438063
q[96]=1.0008654482
q[97]=1.0006301028
q[98]=1.0002369837
q[99]=0.9996847806
q[100]=0.9989716504
q[101]=0.9980952118
q[102]=0.9970525352
q[103]=0.9958401318
q[104]=0.9944539395
q[105]=0.9928893067
q[106]=0.9911409728
q[107]=0.9892030462
q[108]=0.9870689790
q[109]=0.9847315377
q[110]=0.9821827692
q[111]=0.9794139640
q[112]=0.9764156119
q[113]=0.9731773547
q[114]=0.9696879297
q[115]=0.9659351065
q[116]=0.9619056158
q[117]=0.9575850672
q[118]=0.9529578566
q[119]=0.9480070606
q[120]=0.9427143143
q[121]=0.9370596739
q[122]=0.9310214581
q[123]=0.9245760683
q[124]=0.9176977825
q[125]=0.9103585196
q[126]=0.9025275713
q[127]=0.8941712974
q[128]=0.2911752349
q[129]=0.2790029236
q[130]=0.2671158700
q[131]=0.2554979664
q[132]=0.2441343742
q[133]=0.2330113868
q[134]=0.2221163080
q[135]=0.2114373458
q[136]=0.2009635191
q[137]=0.1906845753
q[138]=0.1805909194
q[139]=0.1706735517
q[140]=0.1609240126
q[141]=0.1513343370
q[142]=0.1418970123
q[143]=0.1326049434
q[144]=0.1234514222
q[145]=0.1144301000
q[146]=0.1055349658
q[147]=0.0967603259
q[148]=0.0881007879
q[149]=0.0795512453
q[150]=0.0711068657
q[151]=0.0627630810
q[152]=0.0545155789
q[153]=0.0463602959
q[154]=0.0382934126
q[155]=0.0303113495
q[156]=0.0224107648
q[157]=0.0145885527
q[158]=0.0068418435
q[159]=−0.0008319956
q[160]=−0.0084353584
q[161]=−0.0159703957
q[162]=−0.0234390115
q[163]=−0.0308428572
q[164]=−0.0381833249
q[165]=−0.0454615388
q[166]=−0.0526783466
q[167]=−0.0598343081
q[168]=−0.0669296831
q[169]=−0.0739644174
q[170]=−0.0809381268
q[171]=−0.0878500799
q[172]=−0.0946991783
q[173]=−0.1014839341
q[174]=−0.1082024454
q[175]=−0.1148523686
q[176]=−0.1214308876
q[177]=−0.1279346790
q[178]=−0.1343598738
q[179]=−0.1407020132
q[180]=−0.1469560005
q[181]=−0.1531160455
q[182]=−0.1591756024
q[183]=−0.1651273005
q[184]=−0.1709628636
q[185]=−0.1766730202
q[186]=−0.1822474011
q[187]=−0.1876744222
q[188]=−0.1929411519
q[189]=−0.1980331588
q[190]=−0.2029343380
q[191]=−0.2076267137
In many cases, the system of linear equations (28) is over-determined. Nevertheless, it can be solved or approximated in a least squares manner with respect to prototype filter coefficients q (n). Solving the system of linear equations (28) in the least squares method leads to the following filter taps of prototype filter q (n) that satisfy the following relationship for integer n from 0 to 191.
q [0] = − 0.2029343380
q [1] = − 0.1980331588
q [2] = − 0.1929411519
q [3] = − 0.187767444222
q [4] = − 0.1822474011
q [5] =-0.1767730202
q [6] = − 0.17096286636
q [7] = − 0.1651273005
q [8] = − 0.1591756024
q [9] = − 0.1531140455
q [10] = − 0.1469560005
q [11] = − 0.1407020132
q [12] = − 0.1343598738
q [13] = − 0.1279346790
q [14] = − 0.1214308876
q [15] = − 0.1148523686
q [16] = − 0.10820244454
q [17] = − 0.1014939341
q [18] = − 0.09466991783
q [19] = − 0.08788500799
q [20] = − 0.0809381268
q [21] = − 0.07396444174
q [22] =-0.06692996831
q [23] = − 0.0598343081
q [24] = − 0.0526783466
q [25] = − 0.045454615388
q [26] = − 0.0381833249
q [27] = − 0.0308428572
q [28] =-0.0234390115
q [29] = − 0.0159703957
q [30] = − 0.0084535584
q [31] = − 0.0008319956
q [32] = 0.068418435
q [33] = 0.0145585527
q [34] = 0.0224107648
q [35] = 0.0303113495
q [36] = 0.0382934126
q [37] = 0.04636022959
q [38] = 0.0545155789
q [39] = 0.0627630810
q [40] = 0.07110686657
q [41] = 0.0795512453
q [42] = 0.0881007879
q [43] = 0.0967603259
q [44] = 0.01555369658
q [45] = 0.144301000
q [46] = 0.1234514222
q [47] = 0.3226049434
q [48] = 0.1418970123
q [49] = 0.1513433370
q [50] = 0.1609240126
q [51] = 0.706673535
q [52] = 0.1805909194
q [53] = 0.9060685753
q [54] = 0.2009635191
q [55] = 0.2113373458
q [56] = 0.2211163080
q [57] = 0.2330113868
q [58] = 0.2441343742
q [59] = 0.2554997664
q [60] = 0.2671158700
q [61] = 0.2790029236
q [62] = 0.2911152349
q [63] = 0.0.3650503350
q [64] = 0.90252575713
q [65] = 0.9103585196
q [66] = 0.91769777825
q [67] = 0.9245760683
q [68] = 0.9310214581
q [69] = 0.9370596739
q [70] = 0.9427143143
q [71] = 0.9480070606
q [72] = 0.9529578666
q [73] = 0.9575850672
q [74] = 0.61919056158
q [75] = 0.965953165
q [76] = 0.9696879297
q [77] = 0.97317373547
q [78] = 0.97664156119
q [79] = 0.9794139640
q [80] = 0.9821827692
q [81] = 0.90847315377
q [82] = 0.87070697790
q [83] = 0.8992030462
q [84] = 0.9991409728
q [85] = 0.9928893067
q [86] = 0.94494539395
q [87] = 0.99958401318
q [88] = 0.99970525352
q [89] = 0.9980952118
q [90] = 0.9989716504
q [91] = 0.99968847806
q [92] = 1.0002369837
q [93] = 1.0006301028
q [94] = 1.0008654482
q [95] = 1.0009438063
q [96] = 1.0008654482
q [97] = 1.0006301028
q [98] = 1.0002369837
q [99] = 0.99968847806
q [100] = 0.9989716504
q [101] = 0.9980952118
q [102] = 0.99970525352
q [103] = 0.99958401318
q [104] = 0.94494539395
q [105] = 0.9928893067
q [106] = 0.9911409728
q [107] = 0.8992030462
q [108] = 0.87070697790
q [109] = 0.9847473377
q [110] = 0.9821827692
q [111] = 0.9794139640
q [112] = 0.97664156119
q [113] = 0.97317373547
q [114] = 0.9696879297
q [115] = 0.965953165
q [116] = 0.91619056158
q [117] = 0.9575850672
q [118] = 0.9529575866
q [119] = 0.9480070606
q [120] = 0.9427143143
q [121] = 0.9370596739
q [122] = 0.9310214581
q [123] = 0.9245760683
q [124] = 0.91769777825
q [125] = 0.9103585196
q [126] = 0.90252757513
q [127] = 0.8941712974
q [128] = 0.2911752349
q [129] = 0.2790029236
q [130] = 0.2671158700
q [131] = 0.2554997664
q [132] = 0.2441343742
q [133] = 0.2330113868
q [134] = 0.2211163080
q [135] = 0.2113373458
q [136] = 0.2009635191
q [137] = 0.9060685753
q [138] = 0.1805909194
q [139] = 0.70667353517
q [140] = 0.1609240126
q [141] = 0.1513433370
q [142] = 0.1418970123
q [143] = 0.3226049434
q [144] = 0.1234514222
q [145] = 0.1444301000
q [146] = 0.05053496658
q [147] = 0.09676033259
q [148] = 0.0881007879
q [149] = 0.0795512453
q [150] = 0.07110686657
q [151] = 0.0627630810
q [152] = 0.0545155789
q [153] = 0.0466032959
q [154] = 0.0382934126
q [155] = 0.0303113495
q [156] = 0.0224107648
q [157] = 0.0145585527
q [158] = 0.068418435
q [159] = − 0.0008319956
q [160] = − 0.0084535584
q [161] = − 0.0159703957
q [162] = − 0.0234390115
q [163] = − 0.0308428572
q [164] = − 0.038183333249
q [165] = − 0.045454615388
q [166] = − 0.0526783466
q [167] = − 0.0598343081
q [168] =-0.06692996831
q [169] =-0.073964444174
q [170] = − 0.0809381268
q [171] = − 0.08788500799
q [172] = − 0.09466991783
q [173] = − 0.1014939341
q [174] = − 0.1008202454
q [175] = − 0.1148523686
q [176] = − 0.1214308876
q [177] = − 0.1279346790
q [178] = − 0.1343598738
q [179] = − 0.1407020132
q [180] = − 0.1469560005
q [181] = − 0.1531100455
q [182] = − 0.1591756024
q [183] = − 0.1651273005
q [184] = − 0.17096286636
q [185] = − 0.1767670202
q [186] =-0.1822474011
q [187] =-0.187767444222
q [188] = − 0.1929411519
q [189] = − 0.1980331588
q [190] = − 0.2029343380
q [191] = − 0.207676267137
図13は、プロセッサ820およびフィルタ・インパルス応答コンストラクタ305を含むフィルタ・コンプレッサ102の実施形態の簡略化したブロック図を示し、それらは、フィルタ・コンプレッサ102の実施形態の入力および出力間に直列に接続される。フィルタ・コンプレッサ102の実施形態は入力で、プロセッサ820に提供される、フィルタ・タップでフィルタ・インパルス応答値を有する、1セットの入力サブバンド・フィルタ・インパルス応答を受信する。プロセッサ820は、入力サブバンド・フィルタ・インパルス応答のうちの少なくとも2つからフィルタ・インパルス応答値を調べ、さらに、図4との関連で、特にマスク・ジェネレータ304とともに、特に絶対値表現モジュール303および白色化モジュール402との関連で説明されるように、より高い絶対値を有するフィルタ・インパルス応答値を選択することができる。さらに、プロセッサ820は、少なくとも1つの選択されたフィルタ・インパルス応答と比較してより低い絶対値を有する、少なくとも1つのフィルタ・インパルス応答値を選択しないことができる。
FIG. 13 shows a simplified block diagram of an embodiment of the
換言すれば、図13に示される実施形態のプロセッサ820は、絶対値表現モジュール303およびマスク・ジェネレータ304の機能性を含む。フィルタ・インパルス応答コンストラクタまたはむしろフィルタ計算機モジュール305は、選択されたフィルタ・インパルス応答値を用いて圧縮サブバンド・フィルタ・インパルス応答を構成することができ、圧縮サブバンド・フィルタ・インパルス応答は、選択されていないフィルタ・インパルス応答値のフィルタ・タップに対応するフィルタ・インパルス応答値またはゼロ値の値を含まない。前に説明されるように、フィルタ・インパルス応答フィルタ305は、選択されていないインパルス応答値をゼロに設定するように、または、選択されたインパルス応答値だけをコピーすることによってまたは選択されていないフィルタ・インパルス応答値を無視するいくつかの他の手段によって圧縮サブバンド・フィルタ・インパルス応答を構成するように、構成することができる点に留意すべきである。
In other words, the
結果として、フィルタ・コンプレッサ102の実施形態は、図13に示されるように、フィルタ・タップでフィルタ・インパルス応答値を有するサブバンド・フィルタ・インパルス応答において入力から圧縮サブバンド・フィルタ・インパルス応答を作る本発明の方法の実施形態を実施することができる。圧縮サブバンド・フィルタ・インパルス応答との関連で、それを作ることは、圧縮サブバンド・フィルタ・インパルス応答をシステムとしてまたはコンピュータ読み取り可能な記憶媒体に生成しまたは提供するとして同様に理解することができる。
As a result, the embodiment of the
図4において白色化モジュール402の説明との関連で示されるように、方程式(4)に従って実施することができる、評価表現A(n,k)またはむしろ絶対値表現Aν(n,k)を白色化しまたは重み付ける記載されている方法が、図14との関連でさらに詳細に説明される。したがって、図14aは、時間ドメインにおいてフィルタの周波数の関数として、例となるフィルタ特性850の略図を示す。さらに、図14aは、対応する周波数バンド860−0、・・・、860−4の配列を概略的に示し、それは、インデックスk=0、・・・、4を有するサブバンドに対応する。それぞれのサブバンド・インデックスkを有するサブバンドのうちの1つに対応する(前に示されるように引用符号を要約することを用いて)それらの周波数バンド860のそれぞれは、中心周波数に関してさらに特徴づけられることができ、それは、図14aにおいて点線870−0、・・・、870−4として示される。中心周波数、およびそれぞれのサブバンドの周波数バンドは、フィルタ・コンバータ101において使用される複素変調されたフィルタバンクの内部構成によって決定される。具体的には、サブバンド・インデックスkによる中心周波数とともにプロトタイプ。フィルタq(n)は、例えば方程式(14)の場合において見られるように、それぞれのサブバンドの対応する周波数バンドを決定する。例えば、対応する複素変調されたフィルタバンクp(n)またはq(n)のプロトタイプ・フィルタは、インデックスk=0を有するサブバンドのためのローパス・フィルタである場合、方程式(14)において指数関数によって表現されるように複素変調のため、より高いサブバンド・インデックスk=1のためのバンドパス・フィルタに変換される。
As shown in connection with the description of the
図14bは、例えばフィルタ・コンバータ101によって提供されるように入力サブバンド・フィルタ・インパルス応答の略図を示す。具体的には、図14bは、1セットの矢印880として示される、異なるサブバンドのための評価表現A(k,n)を図解的に示す。単純化だけのために、それぞれのサブバンドに対して1セットの3つの矢印880が、それぞれのサブバンド890−0、・・・、890−4に対して図14bにおいて示される。括弧でくくられた括弧900−0、・・・、900−2によって示されるように、5つのサブバンド890−0、・・・、890−4は、サブバンド900−0、900−1、900−2の3つのサブグループに配列され、第1のサブグループ900−0は、第1のサブバンド890−0(k=0)だけを含み、一方、第2および第3のサブグループ900−1、900−2は、中心周波数に関して2つの隣接したサブバンド890−1および890−2と890−3および890−4とをそれぞれ含む。
FIG. 14 b shows a schematic diagram of the input subband filter impulse response as provided by, for example,
図4に示される白色化モジュール402の枠組みにおいて実施される白色化またはスペクトル白色化によれば、サブバンド900のサブグループのそれぞれに関して方程式(4)に従って、評価表現の最大値は、決定され、さらに、その後、図14cに示されるように、白色化された評価表現AW(k,n)を得るために、評価表現値のそれぞれから減算される。評価表現の最大値を減算する結果として、サブグループ900のそれぞれに対して、評価表現の最大貢献は、図14cにおいてドット910によって示されるように、ゼロに設定される。
According to whitening or spectral whitening implemented in the framework of the
方程式(4)によるサブグループ900のそれぞれのための最大値の決定のため、サブバンド900のサブグループのそれぞれは、ゼロの値を有する少なくとも1つの白色化された評価表現値を含み、白色化された評価表現値AW(k,n)の残りは、ゼロ以下である。結果として、サブグループ900のそれぞれにおいて少なくとも1つの値は、ゼロに設定され、それによって最大値を表し、そのため、いくつかの実施形態において心理音響モデルに従って決定されたサブバンドのサブグループのそれぞれは、サブグループ900のそれぞれの少なくとも1つのフィルタ・インパルス応答値の圧縮の過程において保持される。 For the determination of the maximum value for each of the subgroups 900 according to equation (4), each of the subgroups of subband 900 includes at least one whitened evaluation representation value having a value of zero, The remainder of the evaluated evaluation expression value A W (k, n) is less than or equal to zero. As a result, at least one value in each of the subgroups 900 is set to zero, thereby representing a maximum value, so that in each embodiment, each of the subband subgroups determined according to the psychoacoustic model is , In the process of compression of at least one filter impulse response value for each of the subgroups 900.
それによって、方程式(4)によって表されるようにスペクトル白色化の過程において、スペクトル重みまたはスペクトル・エネルギーは、白色化スキームを適用することによってより低い中心周波数を有するサブバンドからより高い周波数を有するサブバンドへ転送される。図14bおよび図14cの直接比較も、これを明確に示す。図14bにおいてサブグループ900−2における評価表現価値が、サブグループ900−1のそれらより著しく小さい一方、白色化手順を適用した後に、サブグループ900−2において結果として生じる白色化された評価表現値は、サブグループ900−1の評価表現の値の少なくともいくつかと比較して著しく大きい。これに関連してサブグループ900−1が、ドット910によって示されるように2つのゼロ値の評価表現値を含む点に留意すべきであり、それは、サブグループの図14bに示されるように評価表現A(k,n)が2つの同一の最大値を含むという事実によって生じる。しかしながら、これは、方程式(4)のアプリケーションの違反でない。方程式(4)は、それぞれのサブグループの評価表現の少なくとも1つの値がゼロに設定され、それによって白色化された評価表現AW(k.n)との関連で最大値を表すことを確実にするだけである。
Thereby, in the process of spectral whitening as represented by equation (4), spectral weights or spectral energy have higher frequencies from subbands with lower center frequencies by applying a whitening scheme Transferred to subband. A direct comparison of FIGS. 14b and 14c also clearly shows this. While the evaluation representation value in subgroup 900-2 in FIG. 14b is significantly less than those in subgroup 900-1, the resulting whitened evaluation expression value in subgroup 900-2 after applying the whitening procedure Is significantly larger than at least some of the values of the evaluation expressions of subgroup 900-1. In this regard, it should be noted that subgroup 900-1 includes two zero-valued evaluation representation values as indicated by
図15は、フィルタ・コンプレッサ501のさらなる実施形態を示し、それは、1つを超える入力サブバンド・フィルタ・インパルス応答Hν(n,k)を処理することができる。図15に示されるフィルタ・コンプレッサの構成は、図5に示されるものと非常に類似し、絶対値表現モジュール303がそれぞれ絶対値および対数関数モジュール401および白色化モジュール402を含むという事実に関してだけ実施形態と異なり、それは、図4との関連で示されさらに説明される。さらに、フィルタ計算モジュールまたはフィルタ・インパルス応答コンストラクタ305は、それぞれ、図4との関連で任意のコンポーネントとして実施することができるフィルタ・デシメータ・モジュール403および利得計算機404を含む。
FIG. 15 shows a further embodiment of the
図15に図示される実施形態は、さらにマルチプル・フィルタのためのマスク・ジェネレータ502に関して図5示される実施形態と異なる。具体的には、図15のマスク・ジェネレータ502は、平均計算モジュール920を含み、それは、例えば、方程式(9)による個々の(任意に白色化された)絶対値表現Aν(n,k)に基づいて共同の絶対値表現A(n,k)を計算するを実施することができる。さらに具体的には、方程式(9)の枠組みにおいて、フィルタν=0、・・・、(N−1)のためのフィルタAν(n,k)のそれぞれのための個々の絶対値表現または評価表現は、白色化された評価表現値が白色化モジュール402によって平均計算モジュール920に提供されるように、適切な白色化された評価表現AWν(n,k)と置換される。フィルタ・コンプレッサ501の実施形態において、例えば図15に示されるように、異なるフィルタν=0、・・・、(N−1)のための個々のフィルタ・インパルス応答コンストラクタ305は、Nが実施形態501に提供されるフィルタの数であり、図15に点線によって示されるように、単一の(全体の)フィルタ・インパルス応答コンストラクタ305´として実施することができる。具体的には、具体的な実施および技術的な事情に応じて、N個の個々のフィルタ・インパルス応答コンストラクタ305よりむしろ単一のフィルタ・インパルス応答コンストラクタ305´を実施することが望ましい。これは、例えば、少なくともフィルタ・インパルス応答コンストラクタの枠組みにおいて、計算する能力が本質的な設計目標または要求でない場合であってもよい。換言すれば、図15に示される実施形態501は、プロセッサ820およびフィルタ・インパルス応答コンストラクタ305´がそれぞれのフィルタ・コンプレッサ501の入力および出力間に直列に接続される実施形態と見なすことができる。
The embodiment illustrated in FIG. 15 is further different from the embodiment illustrated in FIG. 5 with respect to the
さらに、方法の実施形態およびフィルタ・コンプレッサ102、501の実施形態によって実施される方法に関して、図1〜図6、図13および図15がそれぞれの方法のフローチャートと考慮することもできる点に留意すべきであり、「フローの方向」は、信号の方向に含まれる。換言すれば、上述の図は、フィルタ・コンプレッサ102、501の異なる実施形態を反映するだけでなく、これらの実施形態によって実施される方法および圧縮サブバンド・フィルタ・インパルス応答自体を生成のための方法の実施形態の両方を示す。
Furthermore, it should be noted that FIGS. 1-6, 13 and 15 can also be considered as flowcharts of respective methods with respect to the method embodiments and the methods implemented by the
そのため、本発明の実施形態は、QMF(QMF=直交・ミラー・フィルタバンク)と呼ばれることもあるサブバンド・ドメインにおけるフィルタ・コンプレッサに関し、それは、例えばヘッドホン上のマルチチャンネル・サウンド体験のための頭部伝達関数(HRTF)のフィルタリングなどの音声アプリケーションの分野において使用することができる。 As such, embodiments of the present invention relate to a filter compressor in the subband domain, sometimes referred to as QMF (QMF = Quadrature Mirror Filter Bank), which is the head for multi-channel sound experience on headphones, for example. It can be used in the field of voice applications such as part transfer function (HRTF) filtering.
本発明は、QMFドメインにおいて長いフィルタを用いる計算の複雑性の問題に関する。本発明は、1つ以上のフィルタの時間周波数表現において最も関連したフィルタ係数を選択することによって、最も関連したフィルタ係数を示すフィルタ・マスクを作りことによって、または、フィルタ・マスクによってカバーされない係数を無視することによって、QMFドメインにおけるフィルタリングを適用する場合に、必要な計算を低減する新しいやり方を教示する。 The present invention relates to the problem of computational complexity using long filters in the QMF domain. The present invention selects coefficients that are most relevant in the time frequency representation of one or more filters, creates a filter mask that shows the most relevant filter coefficients, or coefficients that are not covered by the filter mask. By ignoring, it teaches a new way to reduce the required computation when applying filtering in the QMF domain.
しかしながら、フィルタ・コンプレッサ501の実施形態において、プロセッサ820は、フィルタ・コンプレッサによって出力される圧縮フィルタ・インパルス応答のためのフィルタ・インパルス応答値を調べさらに選択する場合に、フィルタ・コンプレッサ501に提供される全てのフィルタを考慮することを必要としない。しかしながら、この場合、フィルタ・コンプレッサの実施形態は、圧縮フィルタ・インパルス応答、または、フィルタ・インパルス応答値を調べさらに選択する枠組みにおいて考慮に入れられなかった1つ以上の入力フィルタ・インパルス応答のための複数の圧縮フィルタ・インパルス応答を構成するように構成することができる。これは、例えば、1つ以上のフィルタが計算のさらなる複雑性を低減するために知覚的にそれほど重要でない場合に望ましく、これらのフィルタは、フィルタ・インパルス応答値を調べさらに選択する場合に、考慮に入れられることを必要とされない。これは、例えば、1つ以上のフィルタが著しい量のエネルギーまたはボリュームを有しない場合に実施することができる。これらの場合、これらのフィルタに基づいてフィルタ・インパルス応答値を調べなくて選択しないことによって導入されるディストーションは、これらのフィルタの特別の事情に応じて受け入れることができる。
However, in the
本発明のいくつかの実施形態は、以下の特徴を含む。
・時間ドメイン・フィルタまたはいくつかのフィルタを複素QMFフィルタ表現に変換すること
・QMFドメインにおいてフィルタの絶対値の時間/周波数表現を作ること
・絶対値の表現のスペクトル白色化を適用すること
・1つ以上のフィルタの絶対値の時間/周波数表現を与える所望のフィルタ係数を示すフィルタ・マスクを作ること
・フィルタ・マスクによって示される係数を含む新しい複素QMFフィルタを作ること
Some embodiments of the invention include the following features.
Transforming a time domain filter or some filters into a complex QMF filter representation, creating a time / frequency representation of the absolute value of the filter in the QMF domain, applying spectral whitening of the representation of the absolute value, 1 Creating a filter mask showing the desired filter coefficients giving a time / frequency representation of the absolute value of one or more filters; creating a new complex QMF filter containing the coefficients indicated by the filter mask
元のフィルタと同じ新しいフィルタの利得を得るために、新しいフィルタまたは複数のフィルタの利得を調整する。 Adjust the gain of the new filter or filters to obtain the same new filter gain as the original filter.
フィルタの複素QMFドメイン表現を再計算するための装置の実施形態は、
・時間ドメイン・フィルタをQMFドメイン表現に変換すること、
・フィルタのQMF表現のフィルタ表現を作ること、
・フィルタのQMFドメイン表現の表現に基づいてフィルタ・マスクを作ること、さらに
・第1のQMFフィルタおよびフィルタ・マスクに基づいて新しいQMFフィルタを作ること
を実行することができる。
An embodiment of an apparatus for recalculating a complex QMF domain representation of a filter is:
Converting the time domain filter to a QMF domain representation;
Creating a filter representation of the QMF representation of the filter,
Creating a filter mask based on the representation of the QMF domain representation of the filter, and creating a new QMF filter based on the first QMF filter and the filter mask.
本発明のいくるかの実施形態は、長いフィルタのフィルタリングの高い計算の複雑性の問題を解決することができる。それらは、複素QMFドメインにおいて動作するフィルタ・コンプレッサを導入する。したがって、本発明のいくつかの実施形態は、フィルタリングの計算の複雑性の低減を提供することができる。本発明の実施形態は、例えば、フィルタ・コンプレッサ、圧縮サブバンド・フィルタ・インパルス応答を作るための方法、コンピュータ読み取り可能な記憶媒体、または、コンピュータプログラムとして実施することができる。 Some embodiments of the present invention can solve the problem of high computational complexity of filtering long filters. They introduce a filter compressor that operates in the complex QMF domain. Thus, some embodiments of the present invention may provide a reduction in filtering computational complexity. Embodiments of the present invention can be implemented, for example, as a filter compressor, a method for generating a compressed subband filter impulse response, a computer readable storage medium, or a computer program.
フィルタ・コンプレッサ102、501の実施形態は、多くの音声に関連したインパルス応答の特徴がかなりまばらな時間/周波数符号を有するけれども、全体の音質を著しく改善する機会を提供する。多くの場合により長い貢献は、低い周波数だけに存在し、効率的な持続時間は、より高い周波数のためのノーマルなフィルタ長より非常に短い。本発明の実施形態は、例えばフィルタ・コンプレッサの形式において、これらの特徴を利用することができる。
The embodiment of the
さらに、圧縮サブバンド・フィルタ・インパルス応答は、フィルタ・コンプレッサの実施形態によって提供されるように、それに記憶された同時に時間ドメインHRTFフィルタを近似しまたは表す1セットまたは複数のサブバンド・フィルタ・インパルス応答を有するコンピュータ読み取り可能な記憶媒体に記憶することができる点に留意すべきである。複素QMFドメインにおいてそれぞれのセットのHRTF関連のフィルタ・インパルス応答と比較して、コンピュータ読み取り可能な記憶媒体に記憶される複数の圧縮サブバンド・フィルタ・インパルス応答は、典型的により短いインパルス応答を有し、それは、より低い数のそれぞれのインパルス応答値を有することによってか、低減された数の非自明な若しくは非ゼロのフィルタ・タップまたは両方の組合せによって、実現することができる。 In addition, the compressed subband filter impulse response is a set of one or more subband filter impulses that approximate or represent a simultaneous time domain HRTF filter stored therein as provided by the filter compressor embodiment. It should be noted that the response can be stored on a computer readable storage medium. Compared to each set of HRTF-related filter impulse responses in the complex QMF domain, multiple compressed subband filter impulse responses stored in a computer readable storage medium typically have a shorter impulse response. However, it can be realized by having a lower number of respective impulse response values, or by a reduced number of non-trivial or non-zero filter taps or a combination of both.
例えば、対応するHRTFフィルタ関数が時間ドメインにおいてKH個のフィルタ・タップを含み、さらに、コンピュータ読み取り可能な記憶媒体に記憶される圧縮サブバンド・フィルタ・インパルス応答がL個のサブバンドを有するサブシステムにおいて用いられることを使われることを目的とする場合、より短いインパルス応答は、典型的に、少なくとも1つのサブバンド・フィルタ・インパルス応答に関して(KH/L)より少なく含まれる。好ましくは、少なくとも1つのサブバンド・フィルタ・インパルス応答は、(KH/L−3)個より少ない非自明なまたは非ゼロのフィルタ・タップを含む。 For example, the corresponding HRTF filter function includes K H filter taps in the time domain, and the compressed subband filter impulse response stored in the computer readable storage medium has subbands with L subbands. When intended to be used in a system, shorter impulse responses are typically included less than (K H / L) for at least one subband filter impulse response. Preferably, the at least one subband filter impulse response includes less than (K H / L-3) non-trivial or non-zero filter taps.
さらに、コンピュータ読み取り可能な記憶媒体に、圧縮時間ドメインHRTFフィルタに対応する複数のセットのサブバンド・フィルタ・インパルス応答より多くが記憶される場合、対応するセットの圧縮サブバンド・フィルタ・インパルス応答は、共通データ・パターンを含み、共通データ・パターンは、インパルス応答値を示し、それは、コンピュータ読み取り可能な記憶媒体に記憶される少なくともいくつかのセットのサブバンド・フィルタ・インパルス応答において、自明な値を有するか欠けているインパルス応答値を示す。換言すれば、共通データ・パターンは、1より多いセットのフィルタ・インパルス応答において選択されていないフィルタ・インパルス応答値に関し、それは、フィルタ・コンプレッサの実施形態の一部としてのフィルタ・インパルス応答コンストラクタによって用いられなかった。そのような(類似の)データ・パターンは、例えば、マルチプル入力フィルタHν(n,k)のためのマスク・ジェネレータ502によって提供されるように共通フィルタ・マスクM(n,k)によって生じ得る。
Furthermore, if a computer readable storage medium stores more than multiple sets of subband filter impulse responses corresponding to a compressed time domain HRTF filter, the corresponding set of compressed subband filter impulse responses is , Including a common data pattern, the common data pattern indicating an impulse response value, which is an obvious value in at least some sets of subband filter impulse responses stored in a computer readable storage medium. The impulse response value having or lacking is shown. In other words, the common data pattern relates to a filter impulse response value that is not selected in more than one set of filter impulse responses, which is determined by the filter impulse response constructor as part of the filter compressor embodiment. Not used. Such a (similar) data pattern may be caused by the common filter mask M (n, k), for example as provided by the
さらに換言すれば、コンピュータ読み取り可能な記憶媒体は、異なるサブバンドのための単一セットの(圧縮)サブバンド・フィルタ・インパルス応答だけでなく、複数のフィルタ・インパルス応答を含んでもよい。これらのセットのフィルタ・インパルス応答のそれぞれは、全体として見られる場合に、共通データ・パターンを含み、それは、ゼロ値であるか全く欠けている対応するインパルス応答値によって与えられる。これらのセットのフィルタ・インパルス応答のそれぞれは、コンピュータ読み取り可能な記憶媒体に記憶される同じ共通のデータ・パターンを含む。例えば、1セットのフィルタ・インパルス応答値において、時間またはサンプル・インデックスnとサブバンド・インデックスkとによって示される特定の値が、欠けているかまたはゼロ値である場合、他のセットのサブバンド・インパルス応答の同じサンプルまたは時間インデックスnと同じサブバンド・インデックスkとによって識別されるインパルス応答値は、欠けているか、ゼロ値であるか、他の定義された値を有する。これに関連して、異なるセットのフィルタ・インパルス応答は、それぞれのインデックスnによって識別されまたは表示され、インデックスνは、例えば0から(N−1)の範囲においていずれかの整数値を得てもよく、Nは、またフィルタの数である。
In other words, a computer readable storage medium may include multiple filter impulse responses as well as a single set (compressed) subband filter impulse response for different subbands. Each of these sets of filter impulse responses, when viewed as a whole, contains a common data pattern, which is given by a corresponding impulse response value that is zero or missing at all. Each of these sets of filter impulse responses includes the same common data pattern stored on a computer readable storage medium. For example, in a set of filter impulse response values, if a particular value indicated by time or sample index n and subband index k is missing or has a zero value, another set of subband Impulse response values identified by the same sample of impulse response or time index n and the same subband index k are missing, have zero values, or have other defined values. In this connection, different sets of filter impulse responses are identified or indicated by their respective indices n, which can be any integer value, for example in the
換言すれば、上述のデータ・パターンは、フィルタ・インパルス応答値を指し、それは、例えば、フィルタ・コンプレッサ501の実施形態との関連で記載される意味において選択されない。そのため、データ・パターンは、全てがゼロに設定されているかまたは全てが欠けているそれぞれのフィルタ・インデックスνによって識別される異なるセットのフィルタ・インパルス応答のサンプルまたは時間インデックスnとサブバンド・インデックスkとに関するインデックス(n,k)に関して、認識できるかまたは定義することができる。
In other words, the above-described data pattern refers to the filter impulse response value, which is not selected in the meaning described in the context of the
コンピュータ読み取り可能な記憶媒体は、例えばHRTF関連フィルタを含んでもよい。さらに、コンピュータ読み取り可能な記憶媒体に記憶される複数のセットのサブバンド・フィルタ・インパルス応答は、空間オーディオ・システムのための1セットのフィルタ・インパルス応答であり得る。 The computer readable storage medium may include, for example, an HRTF related filter. Further, the multiple sets of subband filter impulse responses stored on the computer readable storage medium may be a set of filter impulse responses for the spatial audio system.
コンピュータ読み取り可能な記憶媒体が原則としていかなるコンピュータ読み取り可能な記憶媒体でもあり得る点に留意することが重要である。そのようなコンピュータ読み取り可能な記憶媒体のための例は、例えば、フロッピー(登録商標)・ディスク、CD、CD−ROM、DVDのような持ち運び可能な記憶媒体または他のいかなる記憶媒体であり、それは、コンピュータ読み取り可能なやり方で情報を記憶することができる。さらに、RAM(ランダム・アクセス・メモリ)、ROM(読み出し専用メモリ)、ハード・ディスク・メモリ、NVM(不揮発性メモリ)またはフラッシュ・メモリのような内蔵メモリが用いられ得る。換言すれば、本願の意味においてコンピュータ読み取り可能な記憶媒体は、持ち運び可能な記憶媒体だけでなく、内蔵記憶媒体でもある。さらに、コンピュータ読み取り可能な記憶媒体とは、データまたは情報が変えられまたは変更され得るような媒体も、それぞれのデータ情報が変更できないそれらのメモリも指す。 It is important to note that a computer readable storage medium can in principle be any computer readable storage medium. Examples for such computer readable storage media are portable storage media such as, for example, floppy disks, CDs, CD-ROMs, DVDs or any other storage media, Information can be stored in a computer readable manner. Furthermore, built-in memory such as RAM (Random Access Memory), ROM (Read Only Memory), Hard Disk Memory, NVM (Nonvolatile Memory) or Flash Memory can be used. In other words, the computer-readable storage medium in the meaning of the present application is not only a portable storage medium but also a built-in storage medium. In addition, computer readable storage media refers to media that can change or change data or information as well as those memories that cannot change their data information.
そのため、本発明の実施形態によれば、コンピュータ読み取り可能な記憶媒体は、それに記憶されるとともに時間ドメイン頭部伝達関数を近似する、複数のサブバンド・フィルタ・インパルス応答を有してもよく、複数のサブバンド・フィルタ・インパルス・フィルタ応答は、時間ドメイン頭部伝達関数と比較して、より短いインパルス応答を有する。 Thus, according to embodiments of the present invention, a computer readable storage medium may have a plurality of subband filter impulse responses stored in it and approximating a time domain head-related transfer function, The multiple subband filter impulse filter responses have a shorter impulse response compared to the time domain head-related transfer function.
本発明の方法の実施形態の特定の実現要求によっては、本発明の方法の実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。この実施は、本発明の方法の実施形態が実行されるように、プロセッサと協動する、それに記憶される電子的に読み取ることができる制御信号を有する、デジタル記憶媒体、コンピュータ読み取り可能な記憶媒体、例えば、ディスク、CDまたはDVDを用いて実行することができる。そのため、本発明の実施形態は、一般に、機械で読み取り可能なキャリアに記憶されたプログラムコードを有するコンピュータプログラム製品であり、プログラムコードは、コンピュータプログラムがプロセッサ上で実行される場合に本発明の方法の実施形態を実行するように作動する。したがって、換言すれば、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で実行される場合に、本発明の方法のうちの少なくとも1つの実施形態を実行するためのプログラムコードを有するコンピュータプログラムである。これに関連して、プロセッサは、プログラム可能なコンピュータシステム、プログラム可能なコンピュータ、中央演算処理装置(CPU)、特定用途向け集積回路(ASIC)、プロセッサまたは他の集積回路(IC)によって形成することができる。 Depending on certain implementation requirements of the inventive method embodiments, the inventive method embodiments can be implemented in hardware or in software. This implementation is a digital storage medium, a computer readable storage medium having electronically readable control signals stored thereon that cooperate with the processor so that the method embodiments of the present invention are implemented. For example, using a disc, CD or DVD. As such, embodiments of the present invention are generally computer program products having program code stored on a machine-readable carrier, where the program code is the method of the present invention when the computer program is executed on a processor. It operates to carry out the embodiment. In other words, therefore, an embodiment of the method of the present invention is a computer program having program code for performing at least one embodiment of the method of the present invention when the computer program is executed on a computer. It is. In this regard, the processor may be formed by a programmable computer system, programmable computer, central processing unit (CPU), application specific integrated circuit (ASIC), processor or other integrated circuit (IC). Can do.
上述には本発明の特定の実施形態に関して特に示され記載されたが、形式や詳細においてさまざまな他の変更が本発明の精神および範囲から逸脱することなくできるということは、当業者にとって理解されよう。さまざまな変更が本願明細書において開示されさらに特許請求の範囲によって理解される上位概念から逸脱することなく異なる実施形態に適応する際にできることを理解すべきである。 Although the foregoing has been particularly shown and described with reference to specific embodiments of the present invention, it will be understood by those skilled in the art that various other changes in form and detail may be made without departing from the spirit and scope of the invention. Like. It should be understood that various changes can be made in adapting to different embodiments without departing from the generic concepts disclosed herein and further understood by the claims.
Claims (57)
より高い値を有するフィルタ・インパルス応答値および前記より高い値より低い値を有する少なくとも1つのフィルタ・インパルス応答値を見つけるために、少なくとも2つの入力サブバンド・フィルタ・インパルス応答から前記フィルタ・インパルス応答値を調べるためのプロセッサ(820)、および
前記より高い値を有する前記フィルタ・インパルス応答値を用いて前記圧縮サブバンド・フィルタ・インパルス応答を構成するためのフィルタ・インパルス応答コンストラクタ(305)を含み、前記圧縮サブバンド・フィルタ・インパルス応答は、
前記より低い値を有する前記少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するフィルタ・インパルス応答値を含まず、または
前記より低い値を有する前記少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するゼロ値のフィルタ・インパルス応答値を含む、フィルタ・コンプレッサ。 A filter compressor (102, 501) for generating a compressed subband filter impulse response from an input subband filter impulse response corresponding to a subband, including a filter impulse response value at a filter tap, ,
In order to find a filter impulse response value having a higher value and at least one filter impulse response value having a value lower than the higher value, the filter impulse response from at least two input subband filter impulse responses A processor (820) for examining a value, and a filter impulse response constructor (305) for constructing the compressed subband filter impulse response using the filter impulse response value having the higher value , The compressed subband filter impulse response is
Does not include a filter impulse response value corresponding to a filter tap of the at least one filter impulse response value having the lower value, or a filter of the at least one filter impulse response value having the lower value. A filter compressor that contains zero-value filter impulse response values corresponding to taps.
前記より高い値より低い値を有する前記インパルス応答値をゼロに設定すること、
前記より高い値より低い値を有する前記インパルス応答値を無視すること、および
前記フィルタ・インパルス応答値が複素数値である場合に、前記より高い値より低い値を有する複素数値のフィルタ・インパルス応答値に基づいて実数値の値を提供すること
の少なくとも1つによって、
前記より高い値を有する前記フィルタ・インパルス応答値を用いて前記圧縮サブバンド・フィルタ・インパルス応答を構成するように構成される、先行する請求項のいずれかに記載のフィルタ・コンプレッサ(102、501)。 The filter impulse response constructor (305) further provides a value lower than the higher value by providing a respective subband filter impulse response value or a value based thereon as the compressed subband filter impulse response value. Setting said impulse response value to zero,
Ignoring the impulse response value having a value lower than the higher value, and, if the filter impulse response value is a complex value, a complex value filter impulse response value having a value lower than the higher value By providing at least one real-valued value based on
The filter compressor (102, 501) of any preceding claim, configured to configure the compressed subband filter impulse response with the filter impulse response value having the higher value. ).
より高い値を有するフィルタ・インパルス応答値および前記より高い値より低い値を有する少なくとも1つのフィルタ・インパルス応答値を見つけるために、少なくとも2つの入力サブバンド・フィルタ・インパルス応答から前記フィルタ・インパルス応答値を調べるステップ、および
前記より高い値を有する前記フィルタ・インパルス応答値を用いて前記圧縮サブバンド・フィルタ・インパルス応答を構成するステップを含み、
前記圧縮サブバンド・フィルタ・インパルス応答は、
前記より低い値を有する前記少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するフィルタ・インパルス応答値を含まず、または
前記より低い値を有する前記少なくとも1つのフィルタ・インパルス応答値のフィルタ・タップに対応するゼロ値のフィルタ・インパルス応答値を含む、方法。 A method for creating a compressed subband filter impulse response from an input subband filter impulse response corresponding to a subband, including a filter impulse response value at a filter tap, comprising:
In order to find a filter impulse response value having a higher value and at least one filter impulse response value having a value lower than the higher value, the filter impulse response from at least two input subband filter impulse responses Examining a value; and configuring the compressed subband filter impulse response with the filter impulse response value having the higher value;
The compressed subband filter impulse response is
Does not include a filter impulse response value corresponding to a filter tap of the at least one filter impulse response value having the lower value, or a filter of the at least one filter impulse response value having the lower value. A method comprising a zero value filter impulse response value corresponding to a tap.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0601462-5 | 2006-07-04 | ||
SE0601462 | 2006-07-04 | ||
US80660706P | 2006-07-05 | 2006-07-05 | |
US60/806,607 | 2006-07-05 | ||
PCT/EP2007/005887 WO2008003467A1 (en) | 2006-07-04 | 2007-07-03 | Filter unit and method for generating subband filter impulse responses |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009542137A true JP2009542137A (en) | 2009-11-26 |
JP4704499B2 JP4704499B2 (en) | 2011-06-15 |
Family
ID=41003589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009517033A Active JP4704499B2 (en) | 2006-07-04 | 2007-07-03 | Filter compressor and method for producing a compressed subband filter impulse response |
Country Status (15)
Country | Link |
---|---|
US (1) | US8255212B2 (en) |
EP (6) | EP2337224B1 (en) |
JP (1) | JP4704499B2 (en) |
KR (1) | KR101201167B1 (en) |
CN (1) | CN101512899B (en) |
AR (1) | AR061807A1 (en) |
DK (1) | DK2337224T3 (en) |
ES (4) | ES2623226T3 (en) |
HK (1) | HK1246013B (en) |
HU (2) | HUE057855T2 (en) |
MY (1) | MY151651A (en) |
PL (1) | PL2337224T3 (en) |
TR (1) | TR201902417T4 (en) |
TW (1) | TWI351022B (en) |
WO (1) | WO2008003467A1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016534586A (en) * | 2013-09-17 | 2016-11-04 | ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド | Multimedia signal processing method and apparatus |
JP2017505039A (en) * | 2013-12-23 | 2017-02-09 | ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド | Audio signal filter generation method and parameterization apparatus therefor |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2159790B1 (en) * | 2007-06-27 | 2019-11-13 | NEC Corporation | Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system |
ES2524428T3 (en) | 2009-06-24 | 2014-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal decoder, procedure for decoding an audio signal and computer program using cascading stages of audio object processing |
CN102696070B (en) * | 2010-01-06 | 2015-05-20 | Lg电子株式会社 | An apparatus for processing an audio signal and method thereof |
WO2011105879A2 (en) * | 2010-02-26 | 2011-09-01 | Industry-University Cooperation Foundation Hanyang University | Frequency reconfigurable digital filter and equalizer using the same |
EP2365630B1 (en) * | 2010-03-02 | 2016-06-08 | Harman Becker Automotive Systems GmbH | Efficient sub-band adaptive fir-filtering |
CN102013879B (en) * | 2010-09-10 | 2014-09-03 | 建荣集成电路科技(珠海)有限公司 | Device and method to adjust equalization of moving picture experts group audio layer-3 (MP3) music |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
ES2625275T3 (en) | 2012-09-27 | 2017-07-19 | Huawei Technologies Co., Ltd. | Adaptive filtering method and system based on an error subband |
IL302061B2 (en) | 2013-01-08 | 2024-05-01 | Dolby Int Ab | Model based prediction in a critically sampled filterbank |
BR112015019176B1 (en) | 2013-04-05 | 2021-02-09 | Dolby Laboratories Licensing Corporation | method and apparatus for expanding an audio signal, method and apparatus for compressing an audio signal, and computer-readable media |
CN108806704B (en) | 2013-04-19 | 2023-06-06 | 韩国电子通信研究院 | Multi-channel audio signal processing device and method |
CN103269212B (en) * | 2013-05-14 | 2016-05-18 | 泉州市天龙电子科技有限公司 | Low cost low-power consumption Multilevel FIR filter implementation method able to programme |
FR3006535A1 (en) * | 2013-05-28 | 2014-12-05 | France Telecom | METHOD AND DEVICE FOR MODULATING DELIVERING MULTIPLE CARRIER SIGNAL, DEMODULATION METHOD AND DEVICE AND CORRESPONDING COMPUTER PROGRAM. |
EP2830048A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830047A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US9319819B2 (en) * | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
CN105900455B (en) | 2013-10-22 | 2018-04-06 | 延世大学工业学术合作社 | Method and apparatus for handling audio signal |
US9286902B2 (en) | 2013-12-16 | 2016-03-15 | Gracenote, Inc. | Audio fingerprinting |
CN106105269B (en) | 2014-03-19 | 2018-06-19 | 韦勒斯标准与技术协会公司 | Acoustic signal processing method and equipment |
CN108307272B (en) | 2014-04-02 | 2021-02-02 | 韦勒斯标准与技术协会公司 | Audio signal processing method and apparatus |
EP3219115A1 (en) * | 2014-11-11 | 2017-09-20 | Google, Inc. | 3d immersive spatial audio systems and methods |
EP3048608A1 (en) * | 2015-01-20 | 2016-07-27 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Speech reproduction device configured for masking reproduced speech in a masked speech zone |
CN105553893B (en) * | 2016-01-07 | 2021-04-09 | 广东新岸线科技有限公司 | Method and device for estimating time domain channel impulse response |
US9742599B2 (en) * | 2016-01-19 | 2017-08-22 | Hughes Network Systems, Llc | Partial response signaling techniques for single and multi-carrier nonlinear satellite systems |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11503882A (en) * | 1994-05-11 | 1999-03-30 | オーリアル・セミコンダクター・インコーポレーテッド | 3D virtual audio representation using a reduced complexity imaging filter |
JP2000507762A (en) * | 1996-03-30 | 2000-06-20 | セントラル リサーチ ラボラトリーズ リミティド | Equipment for processing stereo signals |
JP2000338998A (en) * | 1999-03-23 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | Audio signal encoding method and decoding method, device therefor, and program recording medium |
JP2002033667A (en) * | 1993-05-31 | 2002-01-31 | Sony Corp | Method and device for decoding signal |
WO2005043511A1 (en) * | 2003-10-30 | 2005-05-12 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
JP2006512617A (en) * | 2003-01-02 | 2006-04-13 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | Reduction of scale factor transmission costs for MPEG-2 Advanced Audio Coding (AAC) using lattice-based post-processing techniques |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4692801A (en) * | 1985-05-20 | 1987-09-08 | Nippon Hoso Kyokai | Bandwidth compressed transmission system |
US6252909B1 (en) * | 1992-09-21 | 2001-06-26 | Aware, Inc. | Multi-carrier transmission system utilizing channels of different bandwidth |
ATE211326T1 (en) * | 1993-05-31 | 2002-01-15 | Sony Corp | METHOD AND DEVICE FOR ENCODING OR DECODING SIGNALS AND RECORDING MEDIUM |
US5923273A (en) | 1996-11-18 | 1999-07-13 | Crystal Semiconductor Corporation | Reduced power FIR filter |
SE512719C2 (en) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | A method and apparatus for reducing data flow based on harmonic bandwidth expansion |
AU9027798A (en) * | 1997-08-21 | 1999-03-08 | Data Fusion Corporation | Method and apparatus for acquiring wide-band pseudorandom noise encoded waveforms |
US6029126A (en) * | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
US6442197B1 (en) | 1999-02-26 | 2002-08-27 | Texas Instruments Incorporated | Phase-shift calculation method, and system implementing it, for a finite-impulse-response (FIR) filter |
EP1047047B1 (en) | 1999-03-23 | 2005-02-02 | Nippon Telegraph and Telephone Corporation | Audio signal coding and decoding methods and apparatus and recording media with programs therefor |
US7043423B2 (en) * | 2002-07-16 | 2006-05-09 | Dolby Laboratories Licensing Corporation | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
-
2007
- 2007-07-03 HU HUE20184766A patent/HUE057855T2/en unknown
- 2007-07-03 CN CN2007800326610A patent/CN101512899B/en active Active
- 2007-07-03 PL PL11160966T patent/PL2337224T3/en unknown
- 2007-07-03 DK DK11160966.5T patent/DK2337224T3/en active
- 2007-07-03 AR ARP070102975A patent/AR061807A1/en active IP Right Grant
- 2007-07-03 EP EP11160966.5A patent/EP2337224B1/en active Active
- 2007-07-03 US US12/305,931 patent/US8255212B2/en active Active
- 2007-07-03 WO PCT/EP2007/005887 patent/WO2008003467A1/en active Application Filing
- 2007-07-03 ES ES07765029.9T patent/ES2623226T3/en active Active
- 2007-07-03 EP EP18199399.9A patent/EP3447916B1/en active Active
- 2007-07-03 HU HUE17172246A patent/HUE043155T2/en unknown
- 2007-07-03 KR KR1020097000044A patent/KR101201167B1/en active IP Right Grant
- 2007-07-03 MY MYPI20085150A patent/MY151651A/en unknown
- 2007-07-03 ES ES17172246T patent/ES2712457T3/en active Active
- 2007-07-03 EP EP17172246.5A patent/EP3236587B1/en active Active
- 2007-07-03 TR TR2019/02417T patent/TR201902417T4/en unknown
- 2007-07-03 EP EP21208144.2A patent/EP3985873A1/en active Pending
- 2007-07-03 TW TW096124214A patent/TWI351022B/en active
- 2007-07-03 EP EP07765029.9A patent/EP2036201B1/en active Active
- 2007-07-03 ES ES11160966.5T patent/ES2638269T3/en active Active
- 2007-07-03 ES ES20184766T patent/ES2905764T3/en active Active
- 2007-07-03 JP JP2009517033A patent/JP4704499B2/en active Active
- 2007-07-03 EP EP20184766.2A patent/EP3739752B1/en active Active
-
2018
- 2018-04-18 HK HK18105006.1A patent/HK1246013B/en unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002033667A (en) * | 1993-05-31 | 2002-01-31 | Sony Corp | Method and device for decoding signal |
JPH11503882A (en) * | 1994-05-11 | 1999-03-30 | オーリアル・セミコンダクター・インコーポレーテッド | 3D virtual audio representation using a reduced complexity imaging filter |
JP2000507762A (en) * | 1996-03-30 | 2000-06-20 | セントラル リサーチ ラボラトリーズ リミティド | Equipment for processing stereo signals |
JP2000338998A (en) * | 1999-03-23 | 2000-12-08 | Nippon Telegr & Teleph Corp <Ntt> | Audio signal encoding method and decoding method, device therefor, and program recording medium |
JP2006512617A (en) * | 2003-01-02 | 2006-04-13 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | Reduction of scale factor transmission costs for MPEG-2 Advanced Audio Coding (AAC) using lattice-based post-processing techniques |
WO2005043511A1 (en) * | 2003-10-30 | 2005-05-12 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016534586A (en) * | 2013-09-17 | 2016-11-04 | ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド | Multimedia signal processing method and apparatus |
JP2017505039A (en) * | 2013-12-23 | 2017-02-09 | ウィルス インスティテュート オブ スタンダーズ アンド テクノロジー インコーポレイティド | Audio signal filter generation method and parameterization apparatus therefor |
Also Published As
Publication number | Publication date |
---|---|
TR201902417T4 (en) | 2019-03-21 |
EP2337224A3 (en) | 2012-01-25 |
EP3739752A1 (en) | 2020-11-18 |
EP3447916B1 (en) | 2020-07-15 |
US20100017195A1 (en) | 2010-01-21 |
WO2008003467A1 (en) | 2008-01-10 |
ES2623226T3 (en) | 2017-07-10 |
EP2337224A2 (en) | 2011-06-22 |
EP3739752B1 (en) | 2021-12-15 |
EP2337224B1 (en) | 2017-06-21 |
US8255212B2 (en) | 2012-08-28 |
ES2638269T3 (en) | 2017-10-19 |
CN101512899B (en) | 2012-12-26 |
HUE057855T2 (en) | 2022-06-28 |
TW200813981A (en) | 2008-03-16 |
KR20090028755A (en) | 2009-03-19 |
CN101512899A (en) | 2009-08-19 |
KR101201167B1 (en) | 2012-11-13 |
PL2337224T3 (en) | 2017-11-30 |
EP3236587B1 (en) | 2018-11-21 |
DK2337224T3 (en) | 2017-10-02 |
ES2905764T3 (en) | 2022-04-12 |
JP4704499B2 (en) | 2011-06-15 |
EP2036201A1 (en) | 2009-03-18 |
EP2036201B1 (en) | 2017-02-01 |
EP3236587A1 (en) | 2017-10-25 |
TWI351022B (en) | 2011-10-21 |
HUE043155T2 (en) | 2019-08-28 |
ES2712457T3 (en) | 2019-05-13 |
HK1246013B (en) | 2019-11-29 |
EP3985873A1 (en) | 2022-04-20 |
EP3447916A1 (en) | 2019-02-27 |
MY151651A (en) | 2014-06-30 |
AR061807A1 (en) | 2008-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4704499B2 (en) | Filter compressor and method for producing a compressed subband filter impulse response | |
RU2507678C2 (en) | Efficient filtering with complex modulated filter bank | |
US8175280B2 (en) | Generation of spatial downmixes from parametric representations of multi channel signals | |
RU2376726C2 (en) | Device and method for generating encoded stereo signal of audio part or stream of audio data | |
JP2009522895A (en) | Decoding binaural audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4704499 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |