JP2011501826A - Mpeg・aac及びmpeg・aac・eld符号器/復号器のための分析及び合成フィルタバンクの有効な実施 - Google Patents

Mpeg・aac及びmpeg・aac・eld符号器/復号器のための分析及び合成フィルタバンクの有効な実施 Download PDF

Info

Publication number
JP2011501826A
JP2011501826A JP2010530119A JP2010530119A JP2011501826A JP 2011501826 A JP2011501826 A JP 2011501826A JP 2010530119 A JP2010530119 A JP 2010530119A JP 2010530119 A JP2010530119 A JP 2010530119A JP 2011501826 A JP2011501826 A JP 2011501826A
Authority
JP
Japan
Prior art keywords
sequence
samples
spectral coefficient
sign
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010530119A
Other languages
English (en)
Other versions
JP5215404B2 (ja
Inventor
レズニク、ユリー
チブクラ、ラビ・キラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2011501826A publication Critical patent/JP2011501826A/ja
Application granted granted Critical
Publication of JP5215404B2 publication Critical patent/JP5215404B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

符号器は、アドバンスド・オーディオ・コーディング(AAC)アルゴリズム、AACエンハンスド・ロウ−ディレイ(ELD)アルゴリズム、又は両方のアルゴリズムを実装するためにしようされることができるMDCTフィルタバンクを含み得る。AACアルゴリズムに対して、入力サンプルのシーケンスは、出力サンプルのシーケンスを得るためにMDCTフィルタバンクに直接送る。AAC−ELDアルゴリズムに対して、入力サンプルのシーケンスの入力サンプルの符号は、反転され、MDCT分析フィルタバンクは、出力サンプルのシーケンスを得るために入力サンプルの符号を反転したシーケンスに適用され、出力サンプルのシーケンスの順序は、逆転され、出力サンプルのシーケンスの1つおきの出力サンプルの符号は、反転される。同様に、復号器は、AAC−ELDアルゴリズム又はAACとAAC−ELDアルゴリズムの両方を実装するために使用されることができるコアIMDCT合成フィルタバンクを含み得る。復号器についてのステップは、単に符号器の逆である。

Description

関連出願
米国特許法第119条に基づく優先権の主張
本特許出願は、「MPEG・AAC及びMPEG・AAC・ELD符号器/復号器のための分析及び合成フィルタバンクの有効な接続の実施(Efficient Joint Implementation of analysis and Synthesis Filterbanks For MPEG AAC and MPEG AAC ELD Encoders/Decoders)」と題される、2007年10月16日出願の米国仮出願第60/980,418号の優先権を主張する。この仮出願は、参照によって本明細書に組み込まれる。
以下の説明は、一般に、符号器及び復号器に関し、特に、アドバンスド・オーディオ・コーディング(AAC:Advanced Audio Coding)及びAACエンハンスド・ロウ・ディレイ(ELD:Enhanced Low Delay)についてのフィルタバンクの実施に関する。
音声コーディングの1つの目標は、望まれる限られた情報内に音声信号を圧縮する一方で、可能な限りオリジナルの音質と同程度なものを保つことである。符号化プロセスにおいて、時間領域の音声信号は、周波数領域に変換される。
アドバンスト・オーディオ・コーディング(AAC:Advanced Audio Coding)は、規格化され、それは、ムービ・ピクチャーズ・エキスパート・グループ(MPEG)規格の一部として明記される、デジタル音声のための付加逆圧縮及び復号スキームである。AACは、高品質デジタル・オーディオを表すために必要とされるデータの量を劇的に減らすために2つの主要なコーディング戦略を開発する広帯域音声コーディング・アルゴリズムである。第1に、知覚的に無関係の信号コンポーネントは、廃棄される。第2に、コード化された音声信号中の冗長性は、除去される。これらの技術を適用するために、信号は、修正離散コサイン変換(MDCT:modified discrete cosine transform)によって最初に処理される。修正離散コサイン変換(MDCT)は、ラップされた付加特性を備える、タイプIVの離散コサイン変換(DCT−IV)に基づく関連フーリエ変換(Fourier-related transform)である。DCT−IV及びフーリエ変換とMDCT変換の関係は、「高速」アルゴリズムと呼ばれるものを使用することによって非常に有効に実施されることができるフィルタバンクのようなものを与える。K.R.RAO.及びP.Yip著の「離散コサイン変換:あるとリズム、アドバンテージ、アプリケーション」、アカデミック・プレス 1990 ISBN:012580203X、(K.R.Rao, and P. Yip, "Discrete Cosine Transform: Algorithms, Advantages, Applications", Academic Press, 1990 ISBN: 012580203X)を参照。
エマージングMPEG・AAC−ELD(エンハンスド・ロウ−ディレイ(Enhanced Low-delay))コーデックは、双方向通信に必要な短い遅延を備える知覚音声コーディングの利点を組み合わせるために設計される。しかしながら、AAC−ELDは、従来のAACコーデックと比較して異なるフィルタバンク構造を使用する。このフィルタバンクは、MDCT又はDCT−IV変換と互換性がなく、既存の高速アルゴリズムによって直接計算することができない。これは、AAC−ELDを実施することの複雑さ及びコストを増加させる。更に、これは、両方のタイプのアルゴリズムが同じDSPコアで実施される場合、複雑さ及びコストを増加させる。したがって、同じDSPコアでAAC−ELDコーデック・アルゴリズム又はAACとAAC−ELDコーデック・アルゴリズムの両方を実施するための単純な方法についての必要性がある。
下記は、いくつかの実施形態の基本的な理解を与えるために1つ以上の実施形態の単純化された要約を示す。この要約は、意図した実施形態全ての完全な全体像ではなく、全ての実施形態の鍵となる又は重要な要素を識別もしないし、任意又は全ての実施形態の範囲を詳細に描写されないよう意図される。その唯一の目的は、後に示される、より詳細な説明の前置きを述べるために単純化された形式の1つ以上の実施形態のいくつかのコンセプトを示すためのものである。
符号器は、アドバンスド・オーディオ・コーディング(AAC)アルゴリズム、AAC−エンハンスド・ロウ・ディレイ(ELD)アルゴリズム又は両方のアルゴリズムを実施するために使用されることができるコアMDCT分析フィルタバンクを含んで提供される。AACアルゴリズムについて、入力サンプルは、出力サンプルを得るためにMDCT分析フィルタバンクに直接送られる。AAC−ELDアルゴリズムについて、入力サンプルの第1のセットの符号は、反転され、MDCT分析フィルタバンクは、スペクトル係数出力サンプルを得るために適用され、スペクトル係数出力サンプルの順序は、逆転され、1つおきのスペクトル係数出力サンプルの第2のセットの符号は、反転される。
1つの例によれば、符号器は、共通コア修正離散コサイン変換を使用する分析フィルタバンクを実施することが提供される。入力サンプルのシーケンスは、得られ、1つおきの入力サンプルの第1のセット符号は、反転される。スペクトル係数出力サンプルは、入力サンプルのシーケンスに修正離散コサイン変換(MDCT)を適用することによって生成される。スペクトル係数出力サンプルの順序は、逆転され、その後、1つおきのスペクトル係数出力サンプルの第2のセットの符号は、反転される。1つの例において、入力サンプルのシーケンスは、Nサンプル長であり、1つおきの入力サンプルの第1のセットの符号を反転することは:(a)N/4が偶数である場合、シーケンスの偶数のインデックスが付された入力サンプルの符号を反転することと、(b)N/4が奇数である場合、シーケンスの奇数のインデックスが付された入力サンプルの符号を反転することと、を含む。別の例において、入力サンプルのシーケンスは、Nサンプル長であり、1つおきのスペクトル係数出力サンプルの第2のセットの符号を反転することは:(a)N/2が偶数である場合、奇数のインデックスが付されたスペクトル係数出力サンプルの符号を反転することと、(b)N/2が奇数である場合、偶数のインデックスが付されたスペクトル係数出力サンプルの符号を反転することと;を含む。1つの動作モードにおいて、MDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクとして動作することができる。別の動作モードにおいて、分析フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクとして動作することができる。
同様に、復号器は、共通コア逆修正離散コサイン変換を使用する合成フィルタバンクを実施することが提供される。入力スペクトル係数のシーケンスは、得られ、1つおきのスペクトル係数の第1のセットの符号は反転される。入力スペクトル係数の順序は、逆転される。出力サンプルは、スペクトル係数に逆修正離散コサイン変換(IMDCT)を適用することによって生成される。その後、1つおきの出力サンプル第2のセットの符号は、反転される。1つの例において、入力スペクトル係数のシーケンスは、Nサンプル長であり、1つおきの入力スペクトル係数の第1のセットの符号を反転することは:(a)N/2が偶数である場合、奇数のインデックスが付されたスペクトル係数の符号を反転することと、(b)N/2が奇数である場合、偶数のインデックスが付されたスペクトル係数の符号を反転することと、を含む。別の例において、入力スペクトル係数のシーケンスは、Nサンプル長であり、1つおきの出力サンプルの第2のセットの符号を反転することは:(a)N/4が奇数である場合、奇数のインデックスが付された出力サンプルの符号を反転することと、(b)N/4が偶数である場合、偶数のインデックスが付された出力サンプルのサインを反転することと、を含む。1つの動作モードにおいて、IMDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクとして動作することができる。別の動作モードにおいて、合成フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクとして動作することができる。
同様の参照文字が全体を通じて相応に識別するように図面に関連して取り扱われる場合、様々な特徴、性質、及び利点は、以下で示される明細書から明らかにすることができる。
図1は、同じMDCT分析フィルタバンク構造のAAC−ELD或いはMPEG・AACとAAC−ELDとの両方を実施する符号器の例を示すブロック図である。 図2は、同じIMDCTフィルタバンク構造のAAC−ELD又はMPEG・AACとAAC−ELDとの両方を実施する復号器の例を示すブロック図である。 図3は、符号器によって利用され得るAAC分析フィルタバンクの例を示すブロック図である。 図4は、AAC−ELDアルゴリズムについて図3のコアMDCTを再利用するために実行される動作を示す図である。 図5は、AACアルゴリズムについてコアMDCTを使用するAAC−ELDアルゴリズムを実行する方法を示す。 図6は、AAC−ELDアルゴリズムについてAACアルゴリズムMDCTを再利用するために適合したデバイス、回路、及び/又はプロセッサを示すブロック図である。 図7は、復号器によって利用され得るAAC合成フィルタバンクを示すブロック図である。 図8は、AAC−ELDアルゴリズムについて図7のコアIMDCTを再利用するために実行される動作を示す図である。 図9は、AACアルゴリズムについてコアIMDCTを使用するAAC−ELDアルゴリズムを実行する方法を示す。 図10は、AAC−ELDアルゴリズムについてAACアルゴリズムIMDCTを再利用するために適合したデバイス、回路、及び/又はプロセッサを示すブロック図である。
様々な実施形態は、今、図面に参照して記述される。ここで、同じ参照番号は、全体を通じて同じ要素を参照するために使用される。以下の記述において、説明の目的のために、多数の特定の詳細は、1つ以上の実施形態の理解を通じて提供されるために述べられる。それは明白かもしれないが、そのような実施形態は、これらの特定の詳細な説明なしに実施されることができる。他の事例において、既知の構造及びデバイスは、1つ以上の実施形態の記述を容易にするためにブロック図の形で示される。

概観
1つの特徴は、同じコアMDCT分析フィルタバンク及びコアIMDCT合成フィルタバンクを使用してAAC−ELD又はAACとAAC−ELDアルゴリズムの両方を実施するための方法を提供することである。
符号器は、AAC−ELDアルゴリズム又はAACとAAC−ELDアルゴリズムの両方を実施するために使用されることができるコアMDCT分析フィルタバンクを含むことができる。AACアルゴリズムについて、入力サンプルは、出力サンプルを得るためにMDCT分析フィルタバンクに直接送られる。AAC−ELDアルゴリズムについて、入力サンプルの残差値のベクトルが形成され、1つおきの入力サンプルの第1のセットの符号は、反転される。スペクトル係数出力サンプルは、入力サンプルのシーケンスに修正離散コサイン変換(MDCT)を適用することによって生成される。その後、スペクトル係数出力サンプルの順序は、逆転され、1つおきのスペクトル係数出力サンプルの第2のセットの符号は、反転される。
同様に、復号器は、AAC−ELDアルゴリズム又はAACとAAC−ELDアルゴリズムの両方を実施するために使用されることができるコアIMDCT合成フィルタバンクを含むことができる。AACアルゴリズムについて、入力サンプルは、出力サンプルを得るためにIMDCT合成フィルタバンクに直接送られる。AAC−ELDアルゴリズムについて、入力スペクトル係数のシーケンスは、取得され、1つおきのスペクトル係数の第1のセットの符号は、反転される。入力スペクトル係数の順序は、逆転される。出力サンプルは、スペクトル係数に逆修正離散コサイン変換(IMDCT)を適用することによって生成される。
その後、1つおきの出力サンプルの第2のセットの符号は、反転される。
AACとAAC−ELDフィルタバンクとの両方が同じMDCT及びIMDCTコア・モジュールを使用して実施されるため、少数のマイナーな修正のみで既存のコードの再利用を可能にする。AAC−ELDフィルタバンクのみが実施される場合、開示される方法は、既知の高速MDCTフィルタバンクの実施を利用する簡単な解を提示する。

コア構造
図1は、同じMDCT分析フィルタバンク構造内にAAC−ELD又はMPEG・AACとAAC−ELDとの両方を実施するエンコーダの例を示すブロック図である。符号器102は、入力音声信号104を受信することができる。MDCT分析フィルタバンク106(つまり、タイプIVの離散コサイン変換に基づく修正離散コサイン変換)は、複数のサブバンド信号に時間領域の入力音声信号104を分解するため、及び周波数領域に信号を変換するために動作する。ここで、各サブバンド信号は、サブバンド毎、ブロック毎の変換係数に変換される。その後、その結果として生じる信号は、デジタル化された音声信号のビットストリーム112を得るために、量子化器108によって量子化され、エントロピー符号器110によって符号化される。
図2は、同じIMDCTフィルタバンク構造内にAAC−ELD又はMPEG・AACとAAC−ELDとの両方を実装することができる復号器の例を示すブロック図である。復号器202は、ビットストリーム204を受信し得る。エントロピー復号器206は、その後、周波数領域信号を生成するために反量子化器208によって反量子化され、ビットストリーム204を復号する。IMDCT合成フィルタバンク210(つまり、タイプIVの離散コサイン変換に基づく逆修正離散コサイン変換)は、周波数領域の信号104を時間領域の音声信号212に変換するために動作する。

AAC−ELD
AAC・ELDコア・コーダ分析(式1)及び合成(式2)フィルタバンクは、以下のように定義することができる:
Figure 2011501826

MDCT及びIMDCT
修正離散コサイン変換(MDCT)(式3)及び逆MDCT(IMDCT)(式4)は、通常以下のように定義される:
Figure 2011501826

符号器:AAC及びAAC−ELD分析フィルタバンク
図3は、符号器によって利用されることができるAAC分析フィルタバンクを示すブロック図である。AAC内の分析フィルタバンクは、入力サンプルzi,0からzi,N−1304を受信し、以下のようにそれぞれ表すことができる、出力スペクトル係数Xi,0からXi,N/2−1306を生成する単純なMDCTフィルタバンク302である:
Figure 2011501826
ここで:
i,n = ウィンドウ化された入力シーケンス
i,k = 出力スペクトル係数
n = サンプル・インデックス
k = スペクトル係数インデックス
i = ブロック・インデックス
N = ウィンドウ_シーケンス値に基づいたウィンドウの長さ
= (N/2+1)/2
AAC−ELD出力Xi,kの分析フィルタバンクは、以下のように表すことができる:
Figure 2011501826
ここで:
i,n = ウィンドウ化された入力シーケンス
i,k = 出力スペクトル係数
n = サンプル・インデックス
K = スペクトル係数インデックス
I = ブロック・インデックス
N = ウィンドウ_シーケンス値に基づいたウィンドウの長さ
= (−N/2+1)/2

Figure 2011501826
に対するAAC−ELD分析フィルタバンクの場合において、以下のように示すことができる:
Figure 2011501826
その実施に対してコアMDCTフィルタバンクの再利用をすることができる。求和の右側は、(式3の場合のように)MDCTであることに注意しなければならない。分析フィルタバンクについてのアルゴリズムは:
1. 0≦n<Nに対して入力サンプル(z(n)−z(n−N))のシーケンスを形成する;
2. N/4が偶数である場合、偶数のインデックスが付されたサンプルの符号を反転する、又はN/4が奇数である場合、奇数のインデックスが付されたサンプルの符号を反転する;
3. 出力サンプル(スペクトル係数)を得るためにMDCTをサンプルに適用する;
4. 出力サンプルの順序を逆転する;
5. N/2が偶数である場合、奇数のインデックスが付された符号を反転する、又はN/2が奇数である場合、偶数のインデックスが付された出力サンプルの符号を反転する;
ことを含むことができる。
図4は、AAC−ELDアルゴリズムについての図3のコアMDCTを再利用するために実行される動作を示した図である。この図は、N/4が偶数であると仮定する。分析フィルタバンク出力406を得るために、(例えば、0≦n<Nに対する[zi,n−zi,(n−N)]の)入力サンプル・シーケンス404が形成される。入力サンプル404のこのシーケンスの偶数のインデックスが付された入力サンプルの符号は、408で反転される。N/4が奇数だった場合、奇数のインデックスが付された入力サンプルの符号が1つおきに反転されることに注意しなければならない。その後、MDCT302は、出力サンプル(スペクトル係数)のシーケンスを得るために、入力サンプルの符号を反転されたシーケンスに適用される。その後、出力サンプルのシーケンスの順序は、410で逆転される。最後に、出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの符号は、414で反転される。N/2が奇数だった場合に注意すべきことは、出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルが代わりに反転されることである。図4で説明された機能及び/又は動作は、ハードウェア、ソフトウェア、又はこの2つの組み合わせで実行されことができる。
図5は、AACアルゴリズムについてのコアMDCTを使用してAAC−ELDアルゴリズムを実行する方法を示したものである。N個の入力サンプルのシーケンスが得られる。ここで、Nは、整数であり、各入力サンプルは、2つの符号のうち1つを有する502。このようなN個の入力サンプルのシーケンスは、時間領域のサンプル化された音声信号であり得る。いくつかの手段において、入力サンプルのシーケンスは、N=960又は1024のいずれか1つであり得る。その後、スペクトル係数入力サンプルのシーケンスの1つおきの入力サンプルの符号は、反転される504。例えば、N/4が偶数である場合、入力サンプルのシーケンスの偶数のインデックスが付された入力サンプルの符号は、反転され、そうでなければ、N/4が奇数である場合、入力サンプルのシーケンスの奇数のインデックスが付された入力サンプルの符号は、反転される。その後、(AACのための)MDCT変換は、スペクトル係数出力サンプルのシーケンスを生成するために、入力サンプルの符号を反転されたシーケンスに適用される、なお、スペクトル係数出力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数出力サンプルは、2つの符号のうち1つを有する506。その後、スペクトル係数出力サンプルのシーケンスの第1のシーケンス順序は、逆転される508。その後、スペクトル係数出力サンプルのシーケンスの1つおきの出力サンプルの符号は、反転される510。例えば、N/2が偶数である場合、スペクトル係数出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの符号は、反転され、そうでなければ、N/2が奇数である場合、スペクトル係数出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルの符号は、反転される。
図6は、AAC−ELDアルゴリズムについてのAACアルゴリズムMDCTを再利用するために適合されるデバイス、回路、及びプロセッサを示すブロック図である。デバイス、回路、及び/又はプロセッサ602は、入力サンプル604のシーケンスの1つおきの入力サンプルの符号を反転する第1の符号インバータ606を含むことができる。例えば、ウィンドウの長さがNであり、N/4が偶数である場合、第1の符号インバータ606は、入力サンプル604のシーケンスの偶数のインデックスが付された入力サンプルの符号を反転することができる。代案として、N/4が奇数である場合、第1の符号インバータ606は、入力サンプル604のシーケンスの奇数のインデックスが付された入力サンプルの符号を反転することができる。その後、MDCT分析フィルタバンク608は、スペクトル係数出力サンプル(例えば、スペクトル係数)のシーケンスを生成するために、入力サンプルの符号を反転されたシーケンスにMDCT変換を適用する。スペクトル係数出力サンプルのシーケンスは、第1のシーケンス順序を有する。なお、各スペクトル係数出力サンプルは、2つの符号のうち1つを有する。その後、順序逆転デバイス610は、スペクトル係数出力サンプルのシーケンスの第1のシーケンス順序を逆転する(例えば、スペクトル係数のシーケンスが逆転する)。その後、符号が反転し、順序が逆転した出力サンプルを提供するために、N/2が偶数の場合、第2の符号インバータ612は、スペクトル係数出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの符号を反転する、又はN/2が奇数の場合、スペクトル係数出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルの符号を反転する。

復号器:AAC及びAAC−ELD合成フィルタバンク
図7は、復号器によって利用されることができるAAC合成フィルタバンクを示すブロック図である。AAC内の合成フィルタバンクは、入力サンプル(例えば、スペクトル係数)のスペック[i][0]からスペック[i][N/2−1]704を受信し、以下のように表すことができる、出力(例えば、サンプル)xi,0からxi,2N−1706を生成する単純なIMDCTフィルタバンク702である:
Figure 2011501826
ここで:
(例えば、)N=1920又は2048で、
X = スペクトル係数
n = サンプル・インデックス
i = ウィンドウ・インデックス
k =スペクトル係数インデックス
N = ウィンドウの長さ
= (N/2+1)/2
である。
AAC−ELD合成フィルタバンクxi,nは、以下のように表されることができる:
Figure 2011501826
ここで:
(例えば、)N=960又は1024で、
X = スペクトル係数
n = サンプル・インデックス
i = ウィンドウ・インデックス
k =スペクトル係数インデックス
N = ウィンドウの長さ
= (−N/2+1)/2
AAC−ELD合成フィルタバンクの場合において、以下のように表されることができる。
Figure 2011501826
従って、0≦n<Nに対する、フィルタバンク出力xi,nは、以下のように表すことができる:
Figure 2011501826
これは、その実施のためにコアIMDCTフィルタバンクの再利用を可能にする。求和の右側が(例えば、式4のように)IMDCTであることに注意しなければならない。合成フィルタバンクについてのアルゴリズムは:
1. N/2が偶数である場合、奇数のインデックスが付されたスペクトル係数X(k)の符号を反転する、又はN/2が奇数の場合、偶数のインデックスが付されたスペクトル係数の符号を反転する;
2. スペクトル係数シーケンスの順序を逆転する;
3. 出力サンプルを得るために、スペクトル係数にIMDCT変換を適用する;
4. N/4が偶数の場合、偶数のインデックスが付された出力サンプルの符号を反転する;又は、N/4が奇数の場合、奇数のインデックスが付された出力サンプルの符号を反転する;これらは、合成フィルタバンクの第1のN個の出力ポイントを形成する;
5. 残りのN個の出力サンプルは、第1のN個のサンプルの符号を反転することによって得られる。
図8は、AAC−ELDアルゴリズムについての図7のコアIMDCTを再利用するために実行される動作を示す図である。この図は、N/4が偶数であると仮定する。0≦n<Nに対して分析フィルタバンク出力806 x(n)を得るために、入力スペクトル係数X(0)からX(N/2−1) 804は、得られる。N/4が偶数である場合、偶数のインデックスが付された入力スペクトル係数の符号は、反転される808(そうでなければ、N/4が奇数の場合、奇数のインデックスが付された入力スペクトル係数の符号は、反転される)。その後、符号が反転された入力スペクトル係数の順序804は、逆転され810、IMDCT変換は、出力サンプルを得るために適用される702。その後、N/2が偶数である場合、奇数のインデックスが付された出力サンプルの符号は、反転される814。N/2が奇数である場合、偶数のインデックスが付されたサンプルの符号が代わりに反転されることに注意しなくてはならない。これらは、合成フィルタバンクの第1のN個の出力サンプルを形成する。残る出力サンプルは、第1のN個の出力サンプル符号を反転することによって得ることができる。図8で説明された機能及び/又は動作は、ハードウェア、ソフトウェア、又はこの2つの組み合わせで実行されることができることに注意しなくてはならない。
図9は、AACアルゴリズムのためにコアIMDCTを使用してAAC−ELDアルゴリズムを実行する方法を示す。N個のスペクトル係数入力サンプルのシーケンスが得られる902。ここで、Nは、整数であり、スペクトル係数入力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数入力サンプルは、2つの符号のうちの1つを有する。その後、スペクトル係数入力サンプルのシーケンスの1つおきの入力サンプルの符号は、反転される904。例えば、N/2が偶数である場合、スペクトル係数入力サンプルの奇数のインデックスが付された入力サンプルの符号は、反転され、そうでなければ、N/4が奇数である場合、スペクトル係数入力サンプルのシーケンスの偶数のインデックスが付された入力サンプルの符号は、反転される。スペクトルの係数入力サンプルのシーケンスの第1のシーケンス順序は、逆転される906。その後、IMDCT変換は、出力サンプルのシーケンスを生成するために、スペクトル入力サンプルの符号が反転し、順序が逆転したシーケンスに適用される908。最後に、出力サンプルのシーケンスの代替出力サンプルの符号は、反転される910。例えば、N/4が奇数である場合、出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの符号は、反転され、そうでなければ、N/4が偶数である場合、出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルの符号は、反転される。
図10は、AAC−ELDアルゴリズムのためにAACアルゴリズムIMDCTを再利用するのに適合したデバイス、回路及び/又はプロセッサを示すブロック図である。デバイス、回路、及び/又はプロセッサ1002は、スペクトルの係数入力サンプル1004のシーケンスを得る、第1の符号インバータ1006を含むことができる。なお、スペクトル係数入力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数入力サンプルは、2つの符号のうち1つを有する。第1の符号インバータ1006は、入力サンプル1004の符号を反転するため更に構成されることができる。例えば、ウィンドウの長さがNであり、N/2が偶数である場合、第1の符号インバータ1006は、スペクトル係数入力サンプル1004のシーケンスの奇数のインデックスが付された入力サンプルの符号を反転することができる。代わりとして、N/2が奇数である場合、符号インバータ1006は、スペクトルの係数入力サンプル1004のシーケンスの偶数のインデックスが付された入力サンプルの符号を反転することができる。その後、順序逆転デバイス1008は、スペクトルの係数入力サンプルのシーケンスの第1のシーケンス順序を逆転する(例えば、スペクトルの係数のシーケンスが逆転される)。その後、IMDCT合成フィルタバンク1010は、出力サンプルのシーケンスを生成するために、スペクトルの係数入力サンプルのシーケンスにIMDCT変換を適用する。その後、第2の符号インバータ1012は、符号が反転した 出力サンプルを提供するために、N/4が奇数である場合、出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの符号を反転する、又は、N/4が偶数である場合、出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルの符号を反転する。
従って、AACとELD−AACフィルタバンクとの両方は、同じN−ポイントのMDCTコア変換又はIMDCTコア変換を使用することによって実装されることができる。フィルタバンクの両方のタイプについてサポートすることは、実施の全体の複雑さに対して最小の影響で、順序の逆転及び符号の反転のみを使用することで可能となる。
情報及び信号は、様々な異なる技術及び技法の任意のものを使用して表されることができる。例えば、以上の説明で全体にわたって参照される、データ、命令、コマンド、情報、信号、などは、電圧、電流、電磁波、磁界又は磁性粒子、光場又は光子、或いはそれらの任意の組み合わせによって表されることができる。
様々に示された論理ブロック、モジュールと回路、ここに説明されたアルゴリズム・ステップは、電子ハードウェア、ソフトウェア、又は両方の組み合わせで実装される又は実行されることができる。ハードウェアとソフトウェアの互換性を明らかに示すために、様々な実例となるコンポーネント、ブロック、モジュール、回路及びステップは、それらの機能性に関して一般的に上記で説明されている。そのような機能性がハードウェア又はソフトウェアとして実装されるかどうかは、全体のシステムに課される特定のアプリケーション及び設計の制約に依存する。構造は、フローチャート、フロー図、構造図又はブロック図として描かれるプロセスとして記述されることができることに注意されなければならない。フローチャートは、シーケンシャル・プロセスとして動作することが説明できるが、動作の多くは、並列又は同時に実行されることができる。さらに、動作の順序は、配置しなおされることができる。動作が完了する場合、プロセスは、終了する。プロセスは、方法、関数、手順、サブルーチン、サブ・プログラム、などに対応することができる。プロセスは、関数に対応する場合、その終了は、コーリング関数又はメイン関数に関数を戻すことに対応する。
ハードウェアで実施された場合、様々な例は、汎用プロセッサ、デジタル・シグナル・プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールド・プログラマブル・ゲートアレイ信号(FPGA)、又は他のプログラマブル論理回路、離散ゲート、又はトランジスタ・ロジック、離散ハードウェア・コンポーネント又はそれのここに説明された機能を実行するために設計されたこれらの任意の組み合わせを用いることができる。汎用プロセッサは、マイクロプロセッサであることができるが、代案において、そのプロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ又はステート・マシンであることができる。更に、プロセッサは、DSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアに関連する1つ以上のマイクロプロセッサ又はそのような構成の任意の他のもののような、コンピューティング・デバイスの組み合わせとして実施されることができる。
ソフトウェアで実施された場合、様々な例は、ファームウェア、ミドルウェア又はマイクロコードを使用することができる。必要なタスクを実行するためのプログラム・コード又はコード・セグメントは、記憶メディア又は他の記憶装置のようなコンピュータ可読メディアに格納されることができる。プロセッサは、必要なタスクを実行することができる。コード・セグメントは、手順、関数、サブ・プログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェア・パッケージ、クラス又は命令の任意の組み合わせ、データ構造又はプログラム・ステートメントを表すことができる。コード・セグメントは、パッシング及び/又は受信情報、データ、アーギュメント、パラメータ、又はメモリ・コンテンツによって別のコード・セグメント又はハードウェア回路に接続されることができる。情報、アーギュメント、パラメータ、データ、などは、メモリ共有、メッセージ・パス、トークン・パッシング、ネットワーク送信などの任意の適切な手段を経由して、パスされ、転送され、或いは送信されることができる
本アプリケーションで使用されるように、用語「コンポーネント」、「モジュール」、「システム」、などは、コンピュータ関連のエンティティ、ハードウェア、ファームウェア、ハードウェア及びソフトウェアの組み合わせ、ソフトウェア、又は実行中のソフトウェアのいずれかを参照するように意図されている。例えば、コンポーネントは、プロセッサで実行中のプロセス、プロセッサ、オブジェクト、実行可能なファイル、実行のためのスレッド、プログラム、及び/又はコンピュータであるが、これらに限定されるものではない。示された方法によって、コンピュータ・デバイスで実行しているアプリケーション及びコンピュータ・デバイスは、コンポーネントになることができる。1つ以上のコンポーネントは、実行のためのプロセス及び/又はスレッドは、1つのコンピュータに集中される、及び/又は、複数のコンピュータ間に配分されることができる。更に、これらのコンポーネントは、その上に格納された様々なデータ構造を有する様々なコンピュータ可読媒体から実行することができる。コンポーネントは、1つ以上のデータ・パケット(例えば、ローカル・システム、分配されたシステム、及び/又は信号のために他のシステムとインターネットのようなネットワーク上で、他のコンポーネントと情報を交換する1つのコンポーネントからのデータ)を有する信号に従うようなローカル及び/又はリモートプロセスの方法によって通信することができる。
この中の1つ以上の例において、説明された関数は、ハードウェア、ソフトウェア、ファームウェア又はそれらの任意の組み合わせで実施されることができる。ソフトウェアで実施される場合、関数は、コンピュータ可読媒体上に格納される、又は1つ以上の命令或いはコードを通じて送信されることができる。コンピュータ可読媒体は、コンピュータ記憶装置媒体、及びある場所から別の場所にコンピュータ・プログラムの転送を容易にする任意の媒体を含む通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスすることができる任意の利用可能な媒体となることができる。限定ではなく、例示として、このようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROM又は他の光学ディスク記憶装置、磁気記憶装置又は他の磁気記憶装置デバイス或いは命令の形式又はデータ構造の要求されたプログラム・コード手段を運ぶ又は格納するために利用され、コンピュータによってアクセスされる、任意の他の媒体を含むことができる。更に、任意の接続は、コンピュータ可読媒体に適切な名称がつけられる。例えば、ソフトウェアが同軸ケーブル、光ファイバ・ケーブル、ツイストテッド・ペア、デジタル加入者線(DSL)或いは赤外線、無線及びマイクロ波のような無線技術を使用したウェブサイト、サーバ或いは他の同軸ケーブルから送信される場合、同軸ケーブル、光ファイバ・ケーブル、ツイステッド・ペア、DSL或いは赤外線、無線及びマイクロ波のような無線技術は、メディアの定義に含まれる。ここで使用されるようなディスク(disk)及び(disc)は、コンパクト・ディスク(CD)、レーザ・ディスク、光学ディスク、デジタル多目的ディスク(DVD)、フロッピー(登録商標)・ディスク及びblu−ray(登録商標)・ディスクを含む。ここで、ディスク(disk)は、通常磁気的にデータを再生し、一方、ディスク(disc)は、レーザーで工学的にデータを再生する。更に、上記の組み合わせは、コンピュータ可読媒体の範囲内に含まれる。ソフトウェアは、単一の命令、又は複数の命令を含み、いくつかの異なるコード・セグメントを通じ、異なるプログラム内に、及び複数の記憶媒体にわたって配置されることができる。例示的な記憶媒体は、プロセッサとカップルすることができる。このようなプロセッサは、記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができる。代案において、記憶媒体は、プロセッサに不可欠なものとなることができる。
ここで説明された方法は、説明された方法を達成するための1つ以上のステップ又はアクションを含む。方法のステップ及び/又はアクションは、請求項の範囲から外れない別のものと互いに交換されてもよい。言いかえれば、ステップ又はアクションの特定の順序が説明されている実施形態の適切な動作に必要でない限り、順序、及び/又は特定のステップの利用及び/又はアクションは、請求項の範囲から外れないで修正されることができる。
図1、2、3、4、5、6、7、8、9及び/又は10に示された、1つ以上の構成要素、ステップ、及び/又は機能は、単一の構成要素、ステップ、又は機能に再配置される、及び/又は組み合わせることができる、或いはいくつかの構成要素、ステップ、又は機能に組み入れられることができる。更に、追加の要素、構成要素、ステップ、及び/又は機能は、付加されることができる。図1、2、6、及び10に示された装置、デバイス、及び/又は構成要素は、図3−5及び図7−9で説明された1つ以上の方法、特徴又はステップを実行するために構成される、又は適応されることができる。ここで説明されたアルゴリズムは、ソフトウェア及び/又は埋め込まれたハードウェアに有効に実施されることができる。
前述の構成が単なる例示であり、請求項を制限するように構成されていないことに注意するべきである。構成の説明は、実例となり、請求項の範囲を限定しないように意図される。従って、現在の教えは、他のタイプの装置及び多くの容易に他のタイプの装置および多くの代替、修正に適用することができ、バリエーションは、当業者に対して明確である。

Claims (39)

  1. 分析フィルタバンクを提供する方法であって:
    入力サンプルのシーケンスを得ることと、なお、各サンプルは、2つの符号のうち1つを有する;
    前記入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転することと;
    前記入力サンプルの符号が反転したシーケンスに修正離散コサイン変換(MDCT)を適用することによってスペクトル係数の出力サンプルのシーケンスを生成することと、なお、前記スペクトル係数出力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数出力サンプルは、2つの符号のうち1つを有する;
    スペクトル係数出力サンプルの前記シーケンスの前記第1のシーケンス順序を逆転することと;
    前記スペクトル係数出力サンプルのシーケンスの1つおきの出力サンプルの前記符号を反転することと;
    を備える方法。
  2. 前記入力サンプルの前記シーケンスは、Nサンプル長であり、前記入力サンプルのシーケンスの前記1つおきの入力サンプルの符号を反転することは:
    N/4が偶数である場合、前記入力サンプルのシーケンスの偶数のインデックスが付された入力サンプルの符号を反転すること;
    N/4が奇数である場合、前記入力サンプルのシーケンスの奇数のインデックスが付された入力サンプルの符号を反転すること;
    を含む請求項1に記載の方法。
  3. 前記入力サンプルのシーケンスは、Nサンプル長であり、前記スペクトル係数出力サンプルのシーケンスの前記1つおきの出力サンプルの符号を反転することは:
    N/2が偶数である場合、前記スペクトル係数出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの符号を反転すること;
    N/2が奇数である場合、前記スペクトル係数出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルの符号を反転すること;
    を含む請求項1に記載の方法。
  4. 前記MDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクである、請求項1に記載の方法。
  5. 前記分析フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクである、請求項4に記載の方法。
  6. 前記入力サンプルのシーケンスは、960又は1024サンプル長のいずれか一方である、請求項1に記載の方法。
  7. 分析フィルタバンクを提供するために構成されるデバイスであって:
    各入力サンプルが2つの符号のうち1つを有する、入力サンプルのシーケンスを取得し、前記入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転する、ように構成された第1の符号インバータと;
    前記入力サンプルの符号が反転したシーケンスに修正離散コサイン変換(MDCT)を適用することによってスペクトル係数出力サンプルのシーケンスを得るためのフィルタ・モジュールと、なお、前記スペクトル係数出力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数出力サンプルは、2つの符号のうち1つを有する;
    前記スペクトル係数出力サンプルのシーケンスの前記第1のシーケンス順序を逆転するように構成された順序逆転デバイスと;
    前記スペクトル係数出力サンプルの1つおきの出力サンプルの前記符号を反転するように構成された第2の符号インバータと、
    を備えるデバイス。
  8. 前記入力サンプルのシーケンスは、Nサンプル長であり、前記第1の符号インバータは:
    N/4が偶数である場合、前記入力サンプルのシーケンスの偶数のインデックスが付された入力サンプルの前記符号を反転し;
    N/4が奇数である場合、前記入力サンプルのシーケンスの奇数のインデックスが付された入力サンプルの前記符号を反転する;
    ように構成される、請求項7に記載のデバイス。
  9. 前記入力サンプルのシーケンスは、Nサンプル長であり、前記第2の符号インバータは:
    N/2が偶数である場合、前記スペクトル係数出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの前記符号を反転し;
    N/2が奇数である場合、前記スペクトル係数出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルの前記符号を反転する;
    ように構成される、請求項7に記載のデバイス。
  10. アドバンスド・オーディオ・コーディング(AAC)フィルタバンクを提供するための第1の動作モードにおいて、前記符号インバータ及び順序再配置デバイスは、動作せず、前記フィルタバンク・モジュールは、前記入力サンプルのシーケンスに、修正離散コサイン変換(MDCT)を適用することによってスペクトル係数出力サンプルのシーケンスを生成する、請求項7に記載のデバイス。
  11. アドバンスド・オーディオ・コーディング(AAC)エンハンスド・ロウ−ディレイ(ELD)フィルタバンクを提供するための第2の動作モードにおいて、前記符号インバータ及び順序再配置デバイスは、動作する、請求項10に記載のデバイス。
  12. 分析フィルタバンクを提供するように構成されたデバイス:
    各入力サンプルが2つの符号のうち1つを有する、入力サンプルのシーケンスを得るための手段と、;
    前記入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転するための手段と;
    入力サンプルの前記符号を反転されたシーケンスに修正離散コサイン変換(MDCT)を適用することによってスペクトル係数出力サンプルのシーケンスを生成するための手段と、なお、前記スペクトル係数出力サンプルは、第1のシーケンス順序を有し、各スペクトル係数出力サンプルは、2つの符号のうち1つを有する;
    スペクトル係数出力サンプルの前記シーケンスの前記第1のシーケンス順序を逆転するための手段と;
    前記スペクトル係数出力サンプルのシーケンスの1つおきの出力サンプルの前記符号を反転するための手段と;
    を備えるデバイス。
  13. 前記MDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクである、請求項12に記載のデバイス。
  14. 前記分析フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクである、請求項13に記載のデバイス。
  15. 分析フィルタバンクを提供するための回路であって、前記回路は:
    各入力サンプルが2つの符号のうち1つを有する、入力サンプルのシーケンスを取得し;
    前記入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転し;
    前記入力サンプルの符号が反転したシーケンスに修正離散コサイン変換(MDCT)を適用することによってスペクトル係数出力サンプルのシーケンスを生成し、なお、前記スペクトル係数出力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数出力サンプルは、2つの符号のうち1つを有する;
    前記スペクトル係数出力サンプルのシーケンスの前記第1のシーケンス順序を逆転し;
    前記スペクトル係数出力サンプルのシーケンスの1つおきの出力サンプルの前記符号を反転する;
    ように適合される、回路。
  16. 前記MDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクである、請求項15に記載の回路。
  17. 前記分析フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクである、請求項16に記載の回路。
  18. 分析フィルタバンクを提供するための命令を備える機械可読媒体であって、前記命令が1つ以上のプロセッサによって実行される場合、前記1つ以上のプロセッサに:
    各入力サンプルが2つの符号のうち1つを有する、入力サンプルのシーケンスを取得すること;
    前記入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転すること;
    前記入力サンプルの符号が反転したシーケンスに修正離散コサイン変換(MDCT)を適用することによってスペクトル係数出力サンプルのシーケンスを生成すること、なお、前記スペクトル係数出力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数出力サンプルは、2つの符号のうち1つを有する;
    前記スペクトル係数出力サンプルのシーケンスの前記第1のシーケンス順序を逆転すること;
    前記スペクトル係数出力サンプルのシーケンスの1つおきの出力サンプルの符号を反転すること;
    をさせる、機械可読媒体。
  19. 前記MDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクであり、前記分析フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクである、請求項18に記載の機械可読媒体。
  20. 合成フィルタバンクを提供する方法であって:
    スペクトル係数入力サンプルのシーケンスを得ることと、なお、前記スペクトル係数入力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数入力サンプルは、2つの符号のうち1つを有する;
    前記スペクトル係数入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転することと;
    前記スペクトル係数入力サンプルのシーケンスの前記第1のシーケンス順序を逆転することと;
    スペクトル係数入力サンプルの符号が反転し、順序が逆転したシーケンスに修正離散コサイン変換(IMDCT)を適用することによって出力サンプルのシーケンスを生成することと;
    前記出力サンプルのシーケンスの1つおきの出力サンプルの前記符号を反転することと;
    を備える方法。
  21. 前記スペクトル係数入力サンプルのシーケンスは、Nサンプル長であり、1つおきの入力サンプルの前記符号を反転することは:
    N/2が偶数である場合、前記スペクトル係数入力サンプルのシーケンスの奇数のインデックスが付された前記入力サンプルの符号を反転すること;
    N/2が奇数である場合、前記スペクトル係数入力サンプルのシーケンスの偶数のインデックスが付された前記入力サンプルの符号を反転すること;
    を含む請求項20に記載の方法。
  22. 前記スペクトル係数入力サンプルのシーケンスは、Nサンプル長であり、1つおきの出力サンプルの前記符号を反転することは:
    N/4が奇数である場合、前記出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの前記符号を反転すること;
    N/4が偶数である場合、前記出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルの前記符号を反転すること;
    を含む請求項20に記載の方法。
  23. 前記IMDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクである、請求項20に記載の方法。
  24. 前記合成フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクである、請求項23に記載の方法。
  25. 前記出力サンプルのシーケンスは、960又は1024サンプルいずれか1つである、請求項20に記載の方法。
  26. 合成フィルタバンクを提供するように構成されるデバイスであって:
    スペクトル係数入力サンプルのシーケンスを得るように構成された第1の符号インバータと、なお、前記スペクトル係数入力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数入力サンプルは、2つの符号のうち1つを有し、更に、前記第1の符号インバータは、前記スペクトル係数入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転するよう構成される;
    前記スペクトル係数入力サンプルのシーケンスの前記第1のシーケンス順序を逆転するための順序逆転デバイスと;
    前記スペクトル係数入力サンプルの符号が反転し、順序が逆転したシーケンスに逆修正離散コサイン変換(IMDCT)を適用することよって出力サンプルのシーケンスを生成するためのフィルタバンク・モジュールと;
    前記出力サンプルのシーケンスの1つおきの出力サンプルの前記符号を反転するように構成される第2の符号インバータと;
    を備えるデバイス。
  27. 前記スペクトル係数入力サンプルのシーケンスは、Nサンプル長であり、前記第1の符号インバータは:
    N/2が偶数である場合、前記スペクトル係数入力サンプルのシーケンスの奇数のインデックスが付された入力サンプルの前記符号を反転し;
    N/2が奇数である場合、前記スペクトル係数入力サンプルのシーケンスの偶数のインデックスが付された入力サンプルの前記符号を反転する;
    ように構成される、請求項26に記載のデバイス。
  28. 前記スペクトル係数入力サンプルのシーケンスは、Nサンプル長であり、前記第2の符号インバータは:
    N/4が奇数である場合、前記出力サンプルのシーケンスの奇数のインデックスが付された出力サンプルの前記符号を反転し;
    N/4が偶数である場合、前記出力サンプルのシーケンスの偶数のインデックスが付された出力サンプルの前記符号を反転する;
    ように構成される、請求項26に記載のデバイス。
  29. アドバンスド・オーディオ・コーディング(AAC)フィルタバンクを提供するための第1の動作モードにおいて、前記第1及び第2の符号インバータと前記順序逆転デバイスは、動作せず、前記フィルタバンク・モジュールは、前記スペクトル係数入力サンプルのシーケンスに修正離散コサイン変換(MDCT)を適用することによって前記出力サンプルのシーケンスを生成する、請求項26に記載の方法。
  30. アドバンスド・オーディオ・コーディング(AAC)エンハンスド・ロウ−ディレイ(ELD)を提供するための第2の動作モードにおいて、前記符号インバータ及び順序再配置デバイスは、動作する、請求項29に記載のデバイス。
  31. 合成フィルタバンクを提供するように構成されたデバイスであって:
    スペクトル係数入力サンプルのシーケンスを得るための手段と、なお、前記スペクトル係数入力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数入力サンプルは、2つの符号のうち1つを有する;
    前記スペクトル係数入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転するための手段と;
    前記スペクトル係数入力サンプルのシーケンスの前記第1のシーケンス順序を逆転するための手段と;
    前記スペクトル係数入力サンプルの符号が反転し、順序が逆転したシーケンスに逆修正離散コサイン変換(IMDCT)を適用することによって出力サンプルを生成するための手段と;
    前記出力サンプルのシーケンスの1つおきの出力サンプルの符号を反転するための手段と;
    を備えるデバイス。
  32. 前記IMDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクである、請求項31に記載のデバイス。
  33. 前記合成フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクである、請求項32に記載のデバイス。
  34. 合成フィルタバンクを供給するための回路であって、前記回路は:
    スペクトル係数入力サンプルのシーケンスを取得し、なお、前記スペクトル係数入力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数入力サンプルは、2つの符号のうち1つを有する;
    前記スペクトル係数入力サンプルのシーケンスの1つおきの入力サンプルの符号を反転し;
    前記スペクトル係数入力サンプルのシーケンスの第1のシーケンス順序を逆転し;
    前記スペクトル係数入力サンプルの符号が反転し、順序が逆転したシーケンスに、逆修正離散コサイン変換(IMDCT)を適用することによって出力サンプルを生成し;
    前記出力サンプルのシーケンスの1つおきの出力サンプルの前記符号を反転する;
    ように適合される回路。
  35. 前記MDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクである、請求項34に記載の回路。
  36. 前記分析フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクである、請求項35に記載の回路。
  37. 分析フィルタバンクを供給するための命令を備えるコンピュータ可読媒体であって、前記命令が1つ以上のプロセッサによって実行される場合、1つ以上のプロセッサに:
    スペクトル係数入力サンプルのシーケンスを取得し、なお、前記スペクトル係数入力サンプルのシーケンスは、第1のシーケンス順序を有し、各スペクトル係数入力サンプルは、2つの符号のうち1つを有する;
    前記スペクトル係数入力サンプルのシーケンスの1つおきの入力サンプルの前記符号を反転し;
    入力シーケンス係数入力サンプルの前記シーケンスの前記第1のシーケンス順序を逆転し;
    前記スペクトル係数入力サンプルの符号が反転し、順序が逆転したシーケンスに、逆修正離散コサイン変換(IMDCT)を適用することによって出力サンプルを生成し;
    前記出力サンプルのシーケンスの1つおきの出力サンプルの前記符号を反転する;
    ことをさせる、機械可読媒体。
  38. 前記MDCTは、アドバンスド・オーディオ・コーディング(AAC)フィルタバンクである、請求項37に記載の機械可読媒体。
  39. 前記分析フィルタバンクは、AACエンハンスド・ロウ−ディレイ(ELD)フィルタバンクである、請求項38に記載の機械可読媒体。
JP2010530119A 2007-10-16 2008-10-16 Mpeg・aac及びmpeg・aac・eld符号器/復号器のための分析及び合成フィルタバンクの有効な実施 Expired - Fee Related JP5215404B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US98041807P 2007-10-16 2007-10-16
US60/980,418 2007-10-16
US12/252,195 US20090099844A1 (en) 2007-10-16 2008-10-15 Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders
US12/252,195 2008-10-15
PCT/US2008/080211 WO2009052317A1 (en) 2007-10-16 2008-10-16 Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders

Publications (2)

Publication Number Publication Date
JP2011501826A true JP2011501826A (ja) 2011-01-13
JP5215404B2 JP5215404B2 (ja) 2013-06-19

Family

ID=40535076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010530119A Expired - Fee Related JP5215404B2 (ja) 2007-10-16 2008-10-16 Mpeg・aac及びmpeg・aac・eld符号器/復号器のための分析及び合成フィルタバンクの有効な実施

Country Status (10)

Country Link
US (1) US20090099844A1 (ja)
EP (1) EP2227805A1 (ja)
JP (1) JP5215404B2 (ja)
KR (1) KR101137745B1 (ja)
CN (1) CN101828220B (ja)
BR (1) BRPI0818508A2 (ja)
CA (1) CA2701188A1 (ja)
RU (1) RU2442232C2 (ja)
TW (1) TWI420511B (ja)
WO (1) WO2009052317A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
WO2012039920A1 (en) * 2010-09-22 2012-03-29 Dolby Laboratories Licensing Corporation Efficient implementation of phase shift filtering for decorrelation and other applications in an audio coding system
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
CN104735512A (zh) * 2015-03-24 2015-06-24 无锡天脉聚源传媒科技有限公司 一种同步音频数据的方法、设备及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004166217A (ja) * 2002-09-25 2004-06-10 Matsushita Electric Ind Co Ltd 通信装置
US20080097764A1 (en) * 2006-10-18 2008-04-24 Bernhard Grill Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
JP3185214B2 (ja) * 1990-06-12 2001-07-09 日本電気株式会社 改良dctの順変換計算装置および逆変換計算装置
FR2675969B1 (fr) * 1991-04-24 1994-02-11 France Telecom Procede et dispositif de codage-decodage d'un signal numerique.
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
DE10331803A1 (de) * 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
KR100760976B1 (ko) * 2005-08-01 2007-09-21 (주)펄서스 테크놀러지 프로그래머블 프로세서에서 mpeg-2 또는 mpeg-4aac 오디오 복호 알고리즘을 처리하기 위한 연산 회로및 연산 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004166217A (ja) * 2002-09-25 2004-06-10 Matsushita Electric Ind Co Ltd 通信装置
US20080097764A1 (en) * 2006-10-18 2008-04-24 Bernhard Grill Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JPN5010014286; MARKUS SCHNELL: 'LOW DELAY FILTERBANKS FOR ENHANCED LOW DELAY AUDIO CODING' 2007 IEEE WORKSHOP ON APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS , 20071001, P235-238, IEEE *
JPN5010014287; GEIGER RALF: 'Enhanced MPEG-4 Low Delay AAC - Low Bitrate High Quality Communication' PREPRINTS OF PAPERS PRESENTED AT THE AES CONVENTION V122ND N6998, 20070505, P1211-1223 *
JPN5010014288; HERRE J: 'MPEG-4 High-Efficiency AAC Coding' IEEE SIGNAL PROCESSING MAGAZINE V25 N3, 20080501, P137-142, IEEE SERVICE CENTER *
JPN5010014289; CHIVUKULA R K: 'Efficient Algorithm for MPEG-4 AAC-ELD, AAC-LD and AAC-LC Filterbank' ICALIP 2008 , 20080707, P1629-1634, IEEE *
JPN6012016427; Vladimir Britanaka, K.R. Raob: 'A new fast algorithm for the unified forward and inverse MDCT / MDST computation' Signal Processing Volume 82, Issue 3, March 2002 *

Also Published As

Publication number Publication date
CA2701188A1 (en) 2009-04-23
US20090099844A1 (en) 2009-04-16
CN101828220A (zh) 2010-09-08
JP5215404B2 (ja) 2013-06-19
WO2009052317A1 (en) 2009-04-23
EP2227805A1 (en) 2010-09-15
BRPI0818508A2 (pt) 2016-07-19
RU2010119449A (ru) 2011-11-27
KR101137745B1 (ko) 2012-04-25
TW200929173A (en) 2009-07-01
CN101828220B (zh) 2012-06-27
KR20100083167A (ko) 2010-07-21
TWI420511B (zh) 2013-12-21
RU2442232C2 (ru) 2012-02-10

Similar Documents

Publication Publication Date Title
KR101286329B1 (ko) 저 복잡도의 스펙트럼 대역 복제 (sbr) 필터뱅크
US8631060B2 (en) Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
TWI398854B (zh) 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法
RU2557455C2 (ru) Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
JP2004531151A (ja) 時間離散オーディオサンプル値を処理する方法と装置
JP5215404B2 (ja) Mpeg・aac及びmpeg・aac・eld符号器/復号器のための分析及び合成フィルタバンクの有効な実施
WO2012070866A2 (ko) 스피치 시그널 부호화 방법 및 복호화 방법
JP2023526627A (ja) 音声音響統合復号の向上のための方法及び機器

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120403

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120703

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121009

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130228

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees