JP5559304B2 - フィルタバンクを実装する方法及びフィルタバンクデバイス - Google Patents
フィルタバンクを実装する方法及びフィルタバンクデバイス Download PDFInfo
- Publication number
- JP5559304B2 JP5559304B2 JP2012506178A JP2012506178A JP5559304B2 JP 5559304 B2 JP5559304 B2 JP 5559304B2 JP 2012506178 A JP2012506178 A JP 2012506178A JP 2012506178 A JP2012506178 A JP 2012506178A JP 5559304 B2 JP5559304 B2 JP 5559304B2
- Authority
- JP
- Japan
- Prior art keywords
- group
- filter bank
- samples
- coefficients
- transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 93
- 230000005236 sound signal Effects 0.000 claims description 58
- 230000003595 spectral effect Effects 0.000 claims description 34
- 230000010076 replication Effects 0.000 claims description 32
- 238000004458 analytical method Methods 0.000 description 39
- 230000015572 biosynthetic process Effects 0.000 description 29
- 238000003786 synthesis reaction Methods 0.000 description 29
- 230000006870 function Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 16
- 230000009466 transformation Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 238000009795 derivation Methods 0.000 description 8
- 238000013507 mapping Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 5
- 239000002131 composite material Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0223—Computation saving measures; Accelerating measures
- H03H17/0227—Measures concerning the coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0211—Frequency selective networks using specific transformation algorithms, e.g. WALSH functions, Fermat transforms, Mersenne transforms, polynomial transforms, Hilbert transforms
- H03H17/0213—Frequency domain filters using Fourier transforms
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0266—Filter banks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0264—Filter sets with mutual related characteristics
- H03H17/0272—Quadrature mirror filters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H2218/00—Indexing scheme relating to details of digital filters
- H03H2218/04—In-phase and quadrature [I/Q] signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
[米国特許法の下の優先権主張]
本願は、2009年4月17日に出願され、ここでの譲受人に譲渡され、ここにおける参照によりここで組み込まれる「Fast SBR filterbanks for AAC-ELD, HE-AAC, and USAC」と題された米国仮出願番号第61/169,132号の優先権を主張する。
PEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する。
図1は、無線ネットワーク上の通信に適合されたモバイルデバイスの例を図示するブロック図である。モバイルデバイス102は、音声コーデック106と無線通信トランシーバ108に結合された処理回路104を含むことができる。無線通信トランシーバ108は、モバイルデバイスがアンテナ110を通じて無線で通信を送信および/または受信することを可能にする。音声コーデック106は、入力オーディオ信号114を受信するオーディオ入力デバイス112(例、マイクロフォン)と、オーディオ信号118を出力するオーディオ出力デバイス116(例、1つまたは複数のスピーカー)、に結合されることができる。
図2は、効率的な解析フィルタバンクを含むことができるAAC−ELDエンコーダの例を図示するブロック図である。AAC−ELDエンコーダ202は、入力オーディオ信号204を受信することができる。ダウンサンプラ206は、その入力オーディオ信号204をダウンサンプリングして、そのサンプリングレートを減らすことができる。ダウンサンプリングされた入力オーディオ信号204は、AAC−ELDコアエンコーダ208へと受け渡し、AAC−ELDコアエンコーダ208は、オーディオ信号を圧縮し、オーディオ信号はそのあとで、ビットストリームフォーマッタ210によってビットストリームへとフォーマット化されて、エンコードされたオーディオビットストリーム212を生成する。
図3は、効率的な解析フィルタバンクおよび/または効率的な合成フィルタバンクを含むことができるAAC−ELDデコーダの例を図示するブロック図である。AAC−ELDデコーダ302は、エンコードされたオーディオビットストリーム304を受信することができる。エントロピーデコーダ306、逆量子化器308、エンハンスド低遅延コアデコーダ(enhanced low delay core decoder)310は、そのあとで、エンコードされたオーディオビットストリーム304を処理して、出力オーディオ信号314を再構築することができる。出力オーディオ信号314を再構築する部分として、低遅延SBRデコーダ312は、エンハンスド低遅延コアデコーダ(enhanced low delay core decoder)310から結果として生じる信号を処理することができる。
AAC−ELDで定義される、2つのタイプの低遅延のSBRフィルタバンクがある。
・実(または低複雑)低遅延フィルタバンク
なお、複素低遅延フィルタバンクは、任意の所与ビットレートにおいて最良に可能なオーディオ品質を要するアプリケーションにおいて使用することが意図されており、低複雑低遅延フィルタバンクは、より低い複雑のバージョンであるように意図され、そしてそれは、それでも受諾可能な結果を生成する(すなわち、品質/レートの点から)。
式1の複素解析QMFを式7のDCT−IV変換にマッピングすることにおいて、式1は下記のように表されることができる。
式2の複素合成QMFを式7のDCT−IV変換へとマッピングすることにおいて、式2は、下記のように表されることができる。
式3から式7の形までの複素ダウンサンプリングされた合成QMFについての導出は、解析QMFおよび合成QMFについて示された導出と類似する。
式4から式7の形までの実解析QMFについての導出は、上述された複素解析QMFについて示された導出と類似している。実解析QMFについての結果として生じるフィルタバンク式は、下記のように与えられる:
式5から式7の形までの実合成QMFについての導出は、上述された複素合成QMFについて示された導出と類似する。実合成QMFについての結果として生じるフィルタバンク式は、下記のように与えられる。
式6から式7の形までの実ダウンサンプリングされた合成QMFの導出は、上記で説明された複素ダウンサンプリングされた合成QMFについて示された導出と類似している。実ダウンサンプリングされた合成QMFについての結果として生じるフィルタバンクの式は下記のように与えられる。
式1、2、3、4、5、および6のフィルタバンクは、奇数相またはインデクス付けされている(odd phased or indexed)ということに留意されたい、そしてそれは、SBR式の分子は、因子(2n±x)を含むということを意味する、ここにおいて、xは奇数である。上記の例では、式1と式4は、(2n−95)を含み、式2と式5は、(2n−63)を含み、式3と式6は、(2n−31)を含む。実際、エンコーダ/デコーダにおいてこれらのフィルタバンクを実装することは、より多くの遅延を引き起こし、より多くの処理リソースを要求するようなそれらの複雑さのために、困難である。
図7は、効率的な複素合成フィルタバンクの例を図示する。周波数領域(例えば、複素領域)において入力係数が得られる、なお、第1グループ706のN/2個の入力係数は実数成分であり、第2グループ708のN/2個の入力係数は虚数成分である。第2グループ708の入力係数の場合、奇数インデクス付けされたサンプルの符号は、偶数インデクス付けされた係数に関連して反転される(例えば、(−1)nで乗じられる、なお、nは、例えば0と
式48の実解析フィルタバンクは、奇数相またはインデクス付けされるということに留意されたい、そしれそれは、SBR式の分子は因数(2n±x)を含むということを意味しており、ここでは、xは奇数である。上記の例では、式48は、(2n+1)を含む。実際、エンコーダ/デコーダにおいてこれらのフィルタバンクを実装することは、より多くの遅延を引き起こし、より多くの処理リソースを要求するような、それらの複雑さのために困難である。
式50の実合成フィルタバンクが奇数相またはインデクス付けされるということに留意されたい、そしてそれは、SBR式の分子は因数(2n±x)を含むということを意味しており、ここにおいて、xは奇数である。上記の例では、式50は、(2n+1)を含む。実際、デコーダにおいて、これらのフィルタバンクを実装することは、より多くの遅延を引起こす、および/または、より多くの処理リソースを要求するような複雑さのために困難である。
HE−AAC、HE−AAC v2およびUSACは、ここで上述されたものと同様なSBRフィルタバンク構造を使用する。おそらく最も重要な違いは、それらの位相シフトは、(AAC−ELDの場合は奇数であるのに対して)偶数によって表されることである。例えば、HE−AACにおける実解析フィルタバンクは、下記のように定義される。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]フィルタバンクを実装する方法、該方法は下記を備える:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得ること;
第1グループおよび第2グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、N/2中間サンプルを有する;
前記第2グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用すること;
前記周波数領域において中間第2グループの出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用すること;および、
第2グループの出力係数を得るために、前記中間第2グループの出力係数における係数の次数を逆にすること。
[C2]使用される前記時間領域入力サンプルは実数領域内のサンプルであり、前記周波数領域は複素領域である、C1に記載の方法。
[C3]前記第1グループの出力係数は、実数の係数から成り、前記第2グループの出力係数は、虚数の係数から成る、C1に記載の方法。
[C4]前記第1の変換および第2の変換は、双方とも、離散コサイン変換(DCT)タイプIV変換であり、前記フィルタバンクは、分子に(2n±x)の因数を有する式によって表される、ここにおいて、xは奇数である、C1に記載の方法。
[C5]前記第1の変換および第2の変換は、前記第1グループおよび第2グループの中間サンプルを変換するために同時に動作する、C1に記載の方法。
[C6]前記フィルタバンクは、解析直交ミラーフィルタバンクである、C1に記載の方法。
[C7]前記フィルタバンクは、音声エンコーダーの一部分である、C1に記載の方法。
[C8]前記音声エンコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEG SAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C7に記載の方法。
[C9]前記フィルタバンクは、スペクトル帯域複製(SBR)エンコーダの一部分である、C1に記載の方法。
[C10]前記フィルタバンクは、音声デコーダーの一部分である、C1に記載の方法。
[C11]前記音声デコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C10に記載の方法。
[C12]前記フィルタバンクは、スペクトル帯域複製(SBR)デコーダの一部分である、C1に記載の方法。
[C13]下記を備えるフィルタバンクデバイス:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得るように適合されたインタフェース;
下記を実行するように適合されたプレ変換回路:
第1グループおよび第2グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、N/2中間サンプルを有する;
前記第2グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用するように適合された第1の変換回路と;
前記周波数領域において中間第2グループの出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用するように適合された第2の変換回路と;
第2グループの出力係数を得るために、前記中間第2グループの出力係数における係数の次数を逆にするように適合されたポスト変換回路。
[C14]使用される前記時間領域入力サンプルは実数領域内のサンプルであり、前記周波数領域は複素領域である、C13に記載のフィルタバンクデバイス。
[C15]前記第1グループの出力係数は、実数の係数から成り、前記第2グループの出力係数は、虚数の係数から成る、C13に記載のフィルタバンクデバイス。
[C16]前記第1の変換および第2の変換は、双方とも、離散コサイン変換(DCT)タイプIV変換であり、前記フィルタバンクは、分子に(2n±x)という因子を有する式によって表される、ここにおいて、xは奇数である、C13に記載のフィルタバンクデバイス。
[C17]前記第1の変換および第2の変換は、前記第1グループおよび第2グループの中間サンプルを変換するために同時に動作する、C13に記載のフィルタバンクデバイス。
[C18]前記フィルタバンクデバイスは、解析直交ミラーフィルタバンクである、C13に記載のフィルタバンクデバイス。
[C19]前記フィルタバンクは、音声エンコーダーの一部分である、C13に記載のフィルタバンクデバイス。
[C20]前記音声エンコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE-AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、および MPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C19に記載のフィルタバンクデバイス。
[C21]前記フィルタバンクは、スペクトル帯域複製(SBR)エンコーダの一部分である、C13に記載のフィルタバンクデバイス。
[C22]前記フィルタバンクは、音声デコーダーの一部分である、C13に記載のフィルタバンクデバイス。
[C23]前記音声デコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE-AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C22に記載のフィルタバンクデバイス。
[C24]前記フィルタバンクデバイスは、スペクトル帯域複製(SBR)デコーダの一部分である、C13に記載のフィルタバンクデバイス。
[C25]下記を備えるフィルタバンクデバイス:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得るための手段;
第1グループおよび第2グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行するための手段、なお、各グループは、N/2中間サンプルを有する;
前記第2グループにおける奇数インデクス付けされた中間サンプルの符号を反転するための手段;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用するための手段;
前記周波数領域において中間第2グループの出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用するための手段;および、
第2グループの出力係数を得るために、前記中間第2グループの出力係数における係数の次数を逆にするための手段。
[C26]前記フィルタバンクは、音声エンコーダーの一部分である、C25に記載のフィルタバンクデバイス。
[C27]前記音声エンコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEG SAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C26に記載のフィルタバンクデバイス。
[C28]前記フィルタバンクは、スペクトル帯域複製(SBR)エンコーダの一部分である、C25に記載のフィルタバンクデバイス。
[C29]前記フィルタバンクは、音声デコーダーの一部分である、C25に記載のフィルタバンクデバイス。
[C30]フィルタバンクを実装するような動作が可能なCPU命令を記録したコンピュータ可読記録媒体であって、1つまたは複数のプロセッサによって実施されるとき、前記CPU命令が前記プロセッサに、下記動作を実行させるコンピュータ可読記録媒体:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得ること;
第1グループおよび第2グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、N/2中間サンプルを有する;
前記第2グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用すること;
前記周波数領域において中間第2グループの出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用すること;および、
第2グループの出力係数を得るために、前記中間第2グループの出力係数における係数の次数を反転すること。
[C31]使用される前記時間領域入力サンプルは実数領域内のサンプルである一方で、前記周波数領域は複素領域である、C30に記載の機械可読媒体。
[C32]前記第1グループの出力係数は、実数の係数から成り、前記第2グループの出力係数は、虚数の係数から成る、C30に記載の機械可読媒体。
[C33]フィルタバンクを実装する方法、該方法は下記を備える:
周波数領域においてオーディオ信号について複数のN個の入力係数を得ること、なお、第1グループのN/2個の入力係数は実数成分であり、第2グループのN/2個の入力係数は虚数成分であり、前記第2グループにおける奇数インデクス付けされたサンプルの符号は、前記第2グループにおいて偶数インデクス付けされた係数に関連して反転される; 前記時間領域において中間第1グループの出力サンプルを得るために、前記第1グループの入力係数に対して第1の逆変換を適用すること;
前記時間領域において中間第2グループの出力サンプルを得るために、前記第2グループの入力係数に対して第2の逆変換を適用すること;および、
複数のN個の時間領域出力サンプルを得るために、前記中間第1グループの入力係数からの前記中間第2グループの入力係数のペア毎の減算を実行すること。
[C34]前記第1グループの入力係数は、実数の係数から成り、前記第2グループの入力係数は、虚数の係数から成る、C33に記載の方法。
[C35]前記周波数領域は複素領域であり、前記時間領域サンプルは実数領域内のサンプルである、C33に記載の方法。
[C36]前記第1の逆変換と第2の逆変換は、双方とも逆離散コサイン変換(IDCT)タイプIV変換であり、フィルタバンクは、分子に(2n±x)の因子を有する式で表される、ここにおいて、xは、奇数である、C33に記載の方法。
[C37]前記第1の逆変換と第2の逆変換は、前記第1グループおよび第2グループの入力係数を変換するように同時に動作する、C33に記載の方法。
[C38]前記フィルタバンクは、合成直交ミラーフィルタバンクである、C33に記載の方法。
[C39]前記フィルタバンクは、音声デコーダーの一部分である、C33に記載の方法。
[C40]前記音声デコーダーは、MPEG-4 AAC(Advance Audio Coding)-ELD(Low Delay)標準規格、MPEG-4 AAC−ELD(Enhanced Low Delay)標準規格、およびMPEG-4 MPEG-4 HE(High Efficiency)-AAC標準規格のうちの少なくとも1つを実装する、C39に記載の方法。
[C41]前記フィルタバンクは、スペクトル帯域複製(SBR)デコーダの一部分である、C33に記載の方法。
[C42]下記を備えるフィルタバンクデバイス:
周波数領域においてオーディオ信号について複数のN個の入力係数を得るように適合されたインタフェース、なお、第1グループのN/2個の入力係数は実数成分であり、第2グループのN/2個の入力係数は虚数成分である;
前記第2グループにおける偶数でインデクス付けされた係数に関連して、前記第2グループにおける奇数でインデクス付けされたサンプルの符号を反転するように適合された前処理回路と;
時間領域において中間第1グループのN個の出力サンプルを得るために、前記第1グループの入力係数に対して第1の逆変換を適用するように適合された第1の変換回路と; 前記時間領域において中間第2グループのN個の出力サンプルを得るために、前記第2グループの入力係数に対して第2の逆変換を適用するように適合された第2の変換回路と;および、
複数のN個の時間領域出力サンプルを得るために、前記中間第1グループの入力係数からの前記中間第2グループの入力係数のペア毎の減算を実行するように適合された後処理変換回路。
[C43]前記第1グループの入力係数は、実数の係数から成り、前記第2グループの入力係数は、虚数の係数から成る、C42に記載のフィルタバンクデバイス。
[C44]前記周波数領域は複素領域であるが、前記時間領域サンプルは実数領域内のサンプルである、C42に記載のフィルタバンクデバイス。
[C45]前記第1の逆変換と第2の逆変換は、双方とも逆離散コサイン変換(IDCT)タイプIV変換であり、フィルタバンクは、分子に(2n±x)の因数を有する式で表される、ここにおいて、xは、奇数である、C42に記載のフィルタバンクデバイス。
[C46]前記第1の逆変換と第2の逆変換は、前記第1グループおよび第2グループの入力係数を変換するように同時に動作する、C42に記載のフィルタバンクデバイス。
[C47]前記フィルタバンクデバイスは、合成直交ミラーフィルタバンクである、C42に記載のフィルタバンクデバイス。
[C48]前記フィルタバンクは、音声デコーダーの一部分である、C42に記載のフィルタバンクデバイス。
[C49]前記音声デコーダーは、MPEG-4 AAC(Advance Audio Coding)-ELD(Low Delay)標準規格、MPEG-4 AAC−ELD(Enhanced Low Delay)標準規格、およびMPEG-4 MPEG-4 HE(High Efficiency)-AAC標準規格のうちの少なくとも1つを実装する、C48に記載のフィルタバンクデバイス。
[C50]前記フィルタバンクデバイスは、スペクトル帯域複製(SBR)デコーダの一部分である、C42に記載のフィルタバンクデバイス。
[C51]下記を備えるフィルタバンクデバイス:
周波数領域においてオーディオ信号について複数のN個の入力係数を得るための手段、なお、第1グループのN/2個の入力係数は実数成分であり、第2グループのN/2個の入力係数は虚数成分であり、第2グループにおける奇数でインデクス付けされたサンプルの符号は、前記第2グループにおいて偶数でインデクス付けされた係数に関連して反転される;
前記時間領域において第1グループの中間の出力サンプルを得るために、前記第1グループの入力係数に対して第1の逆変換を適用するための手段;
前記時間領域において第2グループの中間の出力サンプルを得るために、前記第2グループの入力係数に対して第2の逆変換を適用するための手段;および、
複数のN個の時間領域出力サンプルを得るために、前記第1グループの中間の入力係数からの前記第2グループの中間の入力係数のペア毎の減算を実行するための手段。
[C52]前記フィルタバンクデバイスは、合成直交ミラーフィルタバンクである、C51に記載のフィルタバンクデバイス。
[C53]前記フィルタバンクは、音声デコーダーの一部分である、C51に記載のフィルタバンクデバイス。
[C54]前記音声デコーダーは、MPEG-4 AAC(Advance Audio Coding)-ELD(Enhanced Low Delay)標準規格、MPEG-4 AAC−ELD(Low Delay)標準規格、およびMPEG-4 MPEG-4 HE(High Efficiency)-AAC標準規格のうちの少なくとも1つを実装する、C53に記載のフィルタバンクデバイス。
[C55]前記フィルタバンクデバイスは、スペクトル帯域複製(SBR)デコーダの一部分である、C51に記載のフィルタバンクデバイス。
[C56]フィルタバンクを実装するように動作が可能な一連のCPU命令を記録したコンピュータ可読記録媒体であって、1つまたは複数のプロセッサによって実施されるとき、前記プロセッサに下記動作を実行させる前記CPU命令を備えるコンピュータ可読記録媒体: 複数のN個の時間領域入力サンプルとして入力オーディオ信号を得ること;
第1グループおよび第2グループの中間サンプルを得るために、時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、N/2個の中間サンプルを有する;
前記第2グループにおける奇数でインデクス付けされた中間サンプルの符号を反転することと;
前記周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用すること;
前記周波数領域において第2グループの中間の出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用すること;
第2グループの出力係数を得るために、前記第2グループの中間の出力係数における係数の次数を逆にすること。
[C57]前記第1グループの入力係数は、実数の係数から成り、前記第2グループの入力係数は、虚数の係数から成る、C56に記載の機械可読媒体。
[C58]前記周波数領域は複素領域であり、前記時間領域サンプルは実数領域内のサンプルである、C56に記載の機械可読媒体。
[C59]フィルタバンクを実装する方法であって、
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得ることと、
1グループのN/2個の中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行することと、
前記周波数領域においてN/2個の出力係数を得るために、前記1グループのN/2個の中間サンプルに対して変換を適用することと、
を備える方法。
[C60]時間領域入力サンプルと周波数領域係数の双方は、実数である、C59に記載の方法。
[C61]前記変換は、離散コサイン変換(DCT)タイプIV変換であり、前記フィルタバンクは、分子に(2n±x)という因子を有する式によって表され、ここにおいて、xは奇数である、C59に記載の方法。
[C62]前記フィルタバンクは、解析直交ミラーフィルタバンクである、C59に記載の方法。
[C63]前記フィルタバンクは、音声エンコーダーの一部分である、C59に記載の方法。
[C64]前記音声エンコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEG SAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C63に記載の方法。
[C65]前記フィルタバンクは、スペクトル帯域複製(SBR)エンコーダの一部分である、C59に記載の方法。
[C66]前記フィルタバンクは、音声デコーダーの一部分である、C59に記載の方法。
[C67]前記音声デコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C65に記載の方法。
[C68]前記フィルタバンクは、スペクトル帯域複製(SBR)デコーダの一部分である、C59に記載の方法。
[C69]下記を備えるフィルタバンクデバイス:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得るように適合されたインタフェース;
1グループのN/2個の中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行するように適合されたプレ変換回路;および、
前記周波数領域においてN/2個の出力係数を得るために、前記1グループのN/2個の中間サンプルに対して変換を適用するように適合された変換回路。
[C70]時間領域入力サンプルと周波数領域係数の双方は、実数である、C69に記載のフィルタバンクデバイス。
[C71]前記変換は、離散コサイン変換(DCT)タイプIV変換である、C69に記載のフィルタバンクデバイス。
[C72]前記フィルタバンクデバイスは、解析直交ミラーフィルタバンクである、C69に記載のフィルタバンクデバイス。
[C73]前記フィルタバンクは、音声エンコーダーの一部分である、C69に記載のフィルタバンクデバイス。
[C74]前記音声エンコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEG SAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C73に記載のフィルタバンクデバイス。
[C75]前記フィルタバンクは、スペクトル帯域複製(SBR)エンコーダの一部分である、C69に記載のフィルタバンクデバイス。
[C76]前記フィルタバンクは、音声デコーダーの一部分である、C69に記載のフィルタバンクデバイス。
[C77]前記音声デコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C76に記載のフィルタバンクデバイス。
[C78]前記フィルタバンクデバイスは、スペクトル帯域複製(SBR)デコーダの一部分である、C69に記載のフィルタバンクデバイス。
[C79]下記を備えるフィルタバンクデバイス:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得るための手段;
1グループのN/2個の中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行するための手段;および、
前記周波数領域においてN/2個の出力係数を得るために、前記1グループのN/2個の中間サンプルに対して変換を適用するための手段。
[C80]前記フィルタバンクデバイスは、解析直交ミラーフィルタバンクである、C79に記載のフィルタバンクデバイス。
[C81]
前記フィルタバンクは、音声エンコーダーの一部分である、C79に記載のフィルタバンクデバイス。
[C82]前記フィルタバンクは、スペクトル帯域複製(SBR)エンコーダの一部分である、C79に記載のフィルタバンクデバイス。
[C83]前記フィルタバンクは、音声デコーダーの一部分である、C79に記載のフィルタバンクデバイス。
[C84]フィルタバンクを実装するように動作が可能なCPU命令を記録したコンピュータ可読記録媒体であって、1つまたは複数のプロセッサによって実施されるとき、前記CPU命令が前記プロセッサに、下記動作を実行させるコンピュータ可読記録媒体:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得ること;
1グループのN/2個の中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること;および、
前記周波数領域においてN/2個の出力係数を得るために、前記1グループのN/2個の中間サンプルに対して変換を適用する。
[C85]時間領域入力サンプルと周波数領域係数の双方は、実数である、C84に記載の機械可読媒体。
[C86]前記変換は、離散コサイン変換(DCT)タイプIV変換である、C84に記載の機械可読媒体。
[C87]フィルタバンクを実装する方法、該方法は下記を備える:
周波数領域においてオーディオ信号について複数のN/2個の入力係数を得ること; 時間領域において中間グループのN個の出力サンプルを得るために、1グループのN/2個の入力係数に対して逆変換を適用すること;および、
複数のN個の時間領域出力サンプルを得るために、中間グループのN個の入力係数からの、係数の複製操作、符号反転、および並び替えを実行すること。
[C88]入力係数および時間領域出力サンプルの双方は、実数である、C87に記載の方法。
[C89]前記変換は、離散コサイン変換(DCT)タイプIV変換であり、前記フィルタバンクは、分子に(2n±x)という因数を有する式によって表され、ここにおいて、xは奇数である、C87に記載の方法。
[C90]前記フィルタバンクは、合成直交ミラーフィルタバンクである、C87に記載の方法。
[C91]前記フィルタバンクは、音声デコーダーの一部分である、C87に記載の方法。
[C92]前記音声デコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C91に記載の方法。
[C93]前記フィルタバンクは、スペクトル帯域複製(SBR)デコーダの一部分である、C87に記載の方法。
[C94]下記を備えるフィルタバンクデバイス:
周波数領域においてオーディオ信号についての複数のN/2個の入力係数を得るように適合されたインタフェース;
時間領域において中間グループのN個の出力サンプルを得るために、前記1グループのN/2個の入力係数に対して逆変換を適用するように適合された変換回路;および、
複数のN個の時間領域出力サンプルを得るために、前記中間グループのN個の入力係数からの、係数の複製操作、符号反転、および並び替えを実行するように適合されたポスト変換回路。
[C95]入力係数および時間領域出力サンプルの双方は、実数である、C94に記載の方法。
[C96]前記逆変換は、離散コサイン変換(DCT)タイプIV変換であり、前記フィルタバンクは、分子に(2n±x)という因子を有する式によって表され、ここにおいて、xは奇数である、C94に記載のフィルタバンクデバイス。
[C97]前記フィルタバンクデバイスは、合成直交ミラーフィルタバンクである、C94に記載のフィルタバンクデバイス。
[C98]前記フィルタバンクデバイスは、音声デコーダーの一部分である、C94に記載のフィルタバンクデバイス。
[C99]前記音声デコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、C98に記載のフィルタバンクデバイス。
[C100]前記フィルタバンクデバイスは、スペクトル帯域複製(SBR)デコーダの一部分である、C94に記載のフィルタバンクデバイス。
[C101]下記を備えるフィルタバンクデバイス:
周波数領域においてオーディオ信号について複数のN/2個の入力係数を得るための手段;
時間領域において中間グループのN個の出力サンプルを得るために、1グループのN/2個の入力係数に対して逆変換を適用するための手段;および、
複数のN個の時間領域出力サンプルを得るために、中間グループのN個の入力係数からの、係数の複製操作、符号反転、および並び替えを実行するための手段。
[C102]入力係数および時間領域出力サンプルの双方は、実数である、C101に記載のフィルタバンクデバイス。
[C103]フィルタバンクを実装するように動作が可能なCPU命令を記録したコンピュータ可読記録媒体であって、1つまたは複数のプロセッサによって実施されるとき、前記CPU命令が前記プロセッサに、下記動作を実行させるコンピュータ可読記録媒体:
周波数領域においてオーディオ信号について複数のN/2個の入力係数を得ること; 時間領域において中間グループのN個の出力サンプルを得るために、1グループのN/2個の入力係数に対して逆変換を適用すること;および、
複数のN個の時間領域出力サンプルを得るために、中間グループのN個の入力係数からの、係数の複製操作、符号反転、および並び替えを実行すること。
[C104]入力係数および時間領域出力サンプルの双方は、実数である、C103に記載の機械可読媒体。
Claims (35)
- フィルタバンクを実装する方法、該方法は下記を備える:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得ること;
第1グループおよび第2グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、N/2個の中間サンプルを有する;
前記第2グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用すること;
前記周波数領域において中間第2グループの出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用すること;および、
第2グループの出力係数を得るために、前記中間第2グループの出力係数における係数の順序を逆にすること。 - 使用される前記時間領域入力サンプルは実数領域内のサンプルであり、前記周波数領域は複素領域である、請求項1に記載の方法。
- 前記第1グループの出力係数は、実数の係数から成り、前記第2グループの出力係数は、虚数の係数から成る、請求項1に記載の方法。
- 前記第1の変換および第2の変換は、双方とも、離散コサイン変換(DCT)タイプIV変換であり、前記フィルタバンクは、分子に(2n±x)の因数を有する式によって表される、ここにおいて、xは奇数である、請求項1に記載の方法。
- 前記第1の変換および第2の変換は、前記第1グループおよび第2グループの中間サンプルを変換するために同時に動作する、請求項1に記載の方法。
- 前記フィルタバンクは、解析直交ミラーフィルタバンクである、請求項1に記載の方法。
- 前記フィルタバンクは、音声エンコーダーの一部分である、請求項1に記載の方法。
- 前記音声エンコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEG SAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項7に記載の方法。
- 前記フィルタバンクは、スペクトル帯域複製(SBR)エンコーダの一部分である、請求項1に記載の方法。
- 前記フィルタバンクは、音声デコーダーの一部分である、請求項1に記載の方法。
- 前記音声デコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項10に記載の方法。
- 前記フィルタバンクは、スペクトル帯域複製(SBR)デコーダの一部分である、請求項1に記載の方法。
- 下記を備えるフィルタバンクデバイス:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得るように適合されたインタフェース;
下記を実行するように適合されたプレ変換回路:
第1グループおよび第2グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、N/2個の中間サンプルを有する;
前記第2グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用するように適合された第1の変換回路と;
前記周波数領域において中間第2グループの出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用するように適合された第2の変換回路と;
第2グループの出力係数を得るために、前記中間第2グループの出力係数における係数の順序を逆にするように適合されたポスト変換回路。 - 使用される前記時間領域入力サンプルは実数領域内のサンプルであり、前記周波数領域は複素領域である、請求項13に記載のフィルタバンクデバイス。
- 前記第1グループの出力係数は、実数の係数から成り、前記第2グループの出力係数は、虚数の係数から成る、請求項13に記載のフィルタバンクデバイス。
- 前記第1の変換および第2の変換は、双方とも、離散コサイン変換(DCT)タイプIV変換であり、前記フィルタバンクデバイスは、分子に(2n±x)という因子を有する式によって表される、ここにおいて、xは奇数である、請求項13に記載のフィルタバンクデバイス。
- 前記第1の変換および第2の変換は、前記第1グループおよび第2グループの中間サンプルを変換するために同時に動作する、請求項13に記載のフィルタバンクデバイス。
- 前記フィルタバンクデバイスは、解析直交ミラーフィルタバンクである、請求項13に記載のフィルタバンクデバイス。
- 前記フィルタバンクデバイスは、音声エンコーダーの一部分である、請求項13に記載のフィルタバンクデバイス。
- 前記音声エンコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE-AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、および MPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項19に記載のフィルタバンクデバイス。
- 前記フィルタバンクデバイスは、スペクトル帯域複製(SBR)エンコーダの一部分である、請求項13に記載のフィルタバンクデバイス。
- 前記フィルタバンクデバイスは、音声デコーダーの一部分である、請求項13に記載のフィルタバンクデバイス。
- 前記音声デコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE-AAC(High Efficiency AAC)標準規格、MPEGSAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項22に記載のフィルタバンクデバイス。
- 前記フィルタバンクデバイスは、スペクトル帯域複製(SBR)デコーダの一部分である、請求項13に記載のフィルタバンクデバイス。
- 下記を備えるフィルタバンクデバイス:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得るための手段;
第1グループおよび第2グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行するための手段、なお、各グループは、N/2個の中間サンプルを有する;
前記第2グループにおける奇数インデクス付けされた中間サンプルの符号を反転するための手段;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用するための手段;
前記周波数領域において中間第2グループの出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用するための手段;および、
第2グループの出力係数を得るために、前記中間第2グループの出力係数における係数の順序を逆にするための手段。 - 前記フィルタバンクデバイスは、音声エンコーダーの一部分である、請求項25に記載のフィルタバンクデバイス。
- 前記音声エンコーダーは、MPEG AAC−ELD(Advance Audio Coding Enhanced Low Delay)標準規格、MPEG HE−AAC(High Efficiency AAC)標準規格、MPEG SAOC(Spatial Audio Coding)、およびMPEG USAC(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項26に記載のフィルタバンクデバイス。
- 前記フィルタバンクデバイスは、スペクトル帯域複製(SBR)エンコーダの一部分である、請求項25に記載のフィルタバンクデバイス。
- 前記フィルタバンクデバイスは、音声デコーダーの一部分である、請求項25に記載のフィルタバンクデバイス。
- フィルタバンクを実装するような動作が可能な複数の命令を記録した機械可読記憶媒体であって、1つまたは複数のプロセッサによって実施されるとき、前記命令が前記プロセッサに、下記動作を実行させる機械可読記憶媒体:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得ること;
第1グループおよび第2グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、N/2個の中間サンプルを有する;
前記第2グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用すること;
前記周波数領域において中間第2グループの出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用すること;および、
第2グループの出力係数を得るために、前記中間第2グループの出力係数における係数の順序を反転すること。 - 使用される前記時間領域入力サンプルは実数領域内のサンプルである一方で、前記周波数領域は複素領域である、請求項30に記載の機械可読記憶媒体。
- 前記第1グループの出力係数は、実数の係数から成り、前記第2グループの出力係数は、虚数の係数から成る、請求項30に記載の機械可読記憶媒体。
- フィルタバンクを実装するように動作が可能な複数の命令を記録した機械可読記憶媒体であって、1つまたは複数のプロセッサによって実施されるとき、前記プロセッサに下記動作を実行させる前記命令を備える機械可読記憶媒体:
複数のN個の時間領域入力サンプルとして入力オーディオ信号を得ること;
第1グループおよび第2グループの中間サンプルを得るために、時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、N/2個の中間サンプルを有する;
前記第2グループにおける奇数でインデクス付けされた中間サンプルの符号を反転することと;
周波数領域において第1グループの出力係数を得るために、前記第1グループの中間サンプルに対して第1の変換を適用すること;
前記周波数領域において第2グループの中間の出力係数を得るために、前記第2グループの中間サンプルに対して第2の変換を適用すること;
第2グループの出力係数を得るために、前記第2グループの中間の出力係数における係数の順序を逆にすること。 - 前記第1グループの入力係数は、実数の係数から成り、前記第2グループの入力係数は、虚数の係数から成る、請求項33に記載の機械可読記憶媒体。
- 前記周波数領域は複素領域であり、前記時間領域サンプルは実数領域内のサンプルである、請求項33に記載の機械可読記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16913209P | 2009-04-14 | 2009-04-14 | |
US61/169,132 | 2009-04-14 | ||
US12/759,248 | 2010-04-13 | ||
US12/759,248 US8392200B2 (en) | 2009-04-14 | 2010-04-13 | Low complexity spectral band replication (SBR) filterbanks |
PCT/US2010/031089 WO2010120924A1 (en) | 2009-04-14 | 2010-04-14 | Low complexity spectral band replication (sbr) filterbanks |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012524301A JP2012524301A (ja) | 2012-10-11 |
JP5559304B2 true JP5559304B2 (ja) | 2014-07-23 |
Family
ID=42935075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012506178A Expired - Fee Related JP5559304B2 (ja) | 2009-04-14 | 2010-04-14 | フィルタバンクを実装する方法及びフィルタバンクデバイス |
Country Status (7)
Country | Link |
---|---|
US (1) | US8392200B2 (ja) |
EP (1) | EP2419901A1 (ja) |
JP (1) | JP5559304B2 (ja) |
KR (1) | KR101286329B1 (ja) |
CN (1) | CN102388418B (ja) |
TW (1) | TW201118861A (ja) |
WO (1) | WO2010120924A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
TWI484473B (zh) * | 2009-10-30 | 2015-05-11 | Dolby Int Ab | 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統 |
AU2011237882B2 (en) | 2010-04-09 | 2014-07-24 | Dolby International Ab | MDCT-based complex prediction stereo coding |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
MY156027A (en) * | 2010-08-12 | 2015-12-31 | Fraunhofer Ges Forschung | Resampling output signals of qmf based audio codecs |
CN102568481B (zh) * | 2010-12-21 | 2014-11-26 | 富士通株式会社 | 用于实现aqmf处理的方法、和用于实现sqmf处理的方法 |
JP6155274B2 (ja) * | 2011-11-11 | 2017-06-28 | ドルビー・インターナショナル・アーベー | 過剰サンプリングされたsbrを使ったアップサンプリング |
EP2951825B1 (en) | 2013-01-29 | 2021-11-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands |
JP6094322B2 (ja) * | 2013-03-28 | 2017-03-15 | 富士通株式会社 | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
TW202242853A (zh) * | 2015-03-13 | 2022-11-01 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
CN104732979A (zh) * | 2015-03-24 | 2015-06-24 | 无锡天脉聚源传媒科技有限公司 | 一种音频数据的处理方法及装置 |
CN104735512A (zh) * | 2015-03-24 | 2015-06-24 | 无锡天脉聚源传媒科技有限公司 | 一种同步音频数据的方法、设备及系统 |
RU2685024C1 (ru) * | 2016-02-17 | 2019-04-16 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Постпроцессор, препроцессор, аудиокодер, аудиодекодер и соответствующие способы для улучшения обработки транзиентов |
GB2561594A (en) * | 2017-04-20 | 2018-10-24 | Nokia Technologies Oy | Spatially extending in the elevation domain by spectral extension |
CN113870884B (zh) * | 2021-12-01 | 2022-03-08 | 全时云商务服务股份有限公司 | 单麦克风噪声抑制方法和装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0101175D0 (sv) * | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
CN1914669A (zh) * | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
EP1810281B1 (en) * | 2004-11-02 | 2020-02-26 | Koninklijke Philips N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
ES2631906T3 (es) | 2006-10-25 | 2017-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la generación de valores de subbanda de audio, aparato y procedimiento para la generación de muestras de audio en el dominio temporal |
US8015368B2 (en) * | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
WO2008146263A2 (en) | 2007-05-19 | 2008-12-04 | Roy Rosser | Bistable electrowetting light valve |
US20090099844A1 (en) * | 2007-10-16 | 2009-04-16 | Qualcomm Incorporated | Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders |
-
2010
- 2010-04-13 US US12/759,248 patent/US8392200B2/en active Active
- 2010-04-14 WO PCT/US2010/031089 patent/WO2010120924A1/en active Application Filing
- 2010-04-14 JP JP2012506178A patent/JP5559304B2/ja not_active Expired - Fee Related
- 2010-04-14 KR KR1020117027093A patent/KR101286329B1/ko active IP Right Grant
- 2010-04-14 EP EP10715049A patent/EP2419901A1/en not_active Withdrawn
- 2010-04-14 TW TW099111673A patent/TW201118861A/zh unknown
- 2010-04-14 CN CN2010800162379A patent/CN102388418B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012524301A (ja) | 2012-10-11 |
WO2010120924A1 (en) | 2010-10-21 |
TW201118861A (en) | 2011-06-01 |
CN102388418B (zh) | 2013-09-25 |
KR101286329B1 (ko) | 2013-07-15 |
US8392200B2 (en) | 2013-03-05 |
US20100262427A1 (en) | 2010-10-14 |
KR20120018324A (ko) | 2012-03-02 |
CN102388418A (zh) | 2012-03-21 |
EP2419901A1 (en) | 2012-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5559304B2 (ja) | フィルタバンクを実装する方法及びフィルタバンクデバイス | |
JP5269908B2 (ja) | 5点dct−ii、dct−iv、およびdst−ivの計算のための高速アルゴリズム、ならびにアーキテクチャ | |
TWI398854B (zh) | 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法 | |
US8185381B2 (en) | Unified filter bank for performing signal conversions | |
TW201237848A (en) | Apparatus and method for processing a decoded audio signal in a spectral domain | |
CA2792454C (en) | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window | |
Britanak et al. | Cosine-/Sine-Modulated Filter Banks | |
US9257129B2 (en) | Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus | |
JP5215404B2 (ja) | Mpeg・aac及びmpeg・aac・eld符号器/復号器のための分析及び合成フィルタバンクの有効な実施 | |
JP6094322B2 (ja) | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 | |
RU2451998C2 (ru) | Эффективный способ проектирования набора фильтров для mdct/imdct в приложениях для кодирования речи и аудиосигналов | |
TWI470622B (zh) | 用於低頻效應頻道降低複雜度之轉換 | |
KR101411297B1 (ko) | 저주파 효과 채널에 대한 복잡성 감소 변환 | |
Britanak et al. | Spectral Band Replication Compression Technology: Efficient Implementations of Complex Exponential-and Cosine-Modulated QMF Banks | |
Goodwin et al. | Parametric coding and frequency-domain processing in multichannel audio applications | |
Kim et al. | Implementation of a 16-Bit Fixed-Point MPEG-2/4 AAC Decoder for Mobile Audio Applications | |
Sinha et al. | Wavelet based speech enhancement technique using median function thresholding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140605 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5559304 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |