JP4398979B2 - 変換表現に転換するか、または変換表現を逆変換するための装置および方法 - Google Patents

変換表現に転換するか、または変換表現を逆変換するための装置および方法 Download PDF

Info

Publication number
JP4398979B2
JP4398979B2 JP2006519811A JP2006519811A JP4398979B2 JP 4398979 B2 JP4398979 B2 JP 4398979B2 JP 2006519811 A JP2006519811 A JP 2006519811A JP 2006519811 A JP2006519811 A JP 2006519811A JP 4398979 B2 JP4398979 B2 JP 4398979B2
Authority
JP
Japan
Prior art keywords
block
values
transformed
rounded
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006519811A
Other languages
English (en)
Other versions
JP2009513993A (ja
Inventor
ラルフ ガイガー
ゲラルド シューラー
トーマス スポラー
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2009513993A publication Critical patent/JP2009513993A/ja
Application granted granted Critical
Publication of JP4398979B2 publication Critical patent/JP4398979B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Discrete Mathematics (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Radar Systems Or Details Thereof (AREA)

Description

本発明は、オーディオおよび/またはイメージ情報を有する個々の値のための圧縮アルゴリズムに関し、特に変換ベースの符号器、つまり、元のオーディオおよび/またはイメージ信号の量子化/符号化を行うのではなく、量子化/符号化以前にスペクトル域への変換を含む符号器に使用される変換アルゴリズムに関する。
MPEG層3(MP3)またはMPEG AACなどの最新のオーディオ符号化方法は、オーディオ信号のブロック単位の周波数表現を取得するために、いわゆる変形離散コサイン変換(MDCT)などの変換を使用する。一般に、こうしたオーディオ符号器は、時間分離オーディオサンプルのストリームを受信する。オーディオサンプルのストリームは、1024個または2048個のウィンドウ表示オーディオサンプルのウィンドウ表示ブロックを取得するためにウィンドウ表示される。ウィンドウ表示するためには、異なる窓関数、たとえばサインウィンドウが使用される。
ウィンドウ表示時間分離オーディオサンプルは、次に、フィルタバンクを介してスペクトル表現に転換される。原則として、フーリエ変換、または特定の理由がある場合はフーリエ変換の変形、たとえばFFTまたは上記のMDCTを使用することができる。次に、フィルタバンクの出力部におけるオーディオスペクトル値のブロックは、必要に応じてさらに処理される。上記のオーディオ符号器では、次にオーディオスペクトル値の量子化が行われ、量子化レベルは、一般に、量子化により導入される量子化ノイズが、心理音響的マスキング閾値未満を保つように、つまり「マスクして除去される」ように選択される。量子化は、損失性の符号化である。データ量をさらに減少させるためには、次に、量子化されたスペクトル値が、たとえばハフマン符号化を介してエントロピー符号化される。スケール係数などの付随情報を追加することにより、ビットストリームマルチプレクサは、エントロピー符号化された量子化スペクトル値からのビットストリームを形成し、このビットストリームは記憶するか、または送信することが可能である。
オーディオ復号器では、ビットストリームは、ビットストリームデマルチプレクサを介して、符号化された量子化スペクトル値および付随情報に分割される。エントロピー符号化された量子化スペクトル値は、量子化スペクトル値を求めるために、最初に復号される。次に、量子化スペクトル値は、量子化ノイズを有する復号スペクトル値を求めるために逆量子化され、量子化ノイズは、心理音響的マスキング閾値未満を保ち、その結果聞き取ることができない。次に、こうしたスペクトル値は、時間離散復号オーディオサンプルを求めるために、合成フィルタバンクを介して時間表現に転換される。合成フィルタバンク内では、この変換アルゴリズムの逆の変換アルゴリズムを使用しなければならない。さらに、ウィンドウ表示は、周波数時間逆変換後に取り消される。
良好な周波数選択を求めるため、最新のオーディオ符号器は、一般に、ブロックオーバラップを使用する。こうした一例を図12aに示す。最初に、たとえば2048個の時間離散オーディオサンプルが取得され、手段402を介してウィンドウ表示される。ウィンドウ表現手段402は、2N個のサンプルのウィンドウ長さを有し、2N個のウィンドウ表示サンプルのブロックを出力側に提供する。ウィンドウオーバラップを達成するため、手段404を介して2N個のサンプルの第2のブロックを形成する。手段404は、単に分かりやすくするために、図12aに手段402から離して示す。しかし、手段404に供給される2048個のサンプルは、第1ウィンドウに直接隣接する時間離散オーディオサンプルではなく、手段402によりウィンドウ表示されるサンプルの第2の半分を構成し、さらに単に1024個の「新しい」サンプルを構成する。オーバラップは、図12aに、50%のオーバラップ度を生じる手段406に象徴的に示す。次に、手段402により出力される2N個のウィンドウ表示サンプル、および手段404により出力される2N個のウィンドウ表示サンプルは共に、それぞれ手段408および410を介してMDCTアルゴリズムの対象になる。既知のMDCTアルゴリズムによると、手段408は、第1ウィンドウにN個のスペクトル値を提供し、手段410もN個のスペクトル値を提供するが、第2ウィンドウに対して提供し、第1ウィンドウと第2ウィンドウとの間には、50%のオーバラップが存在する。
図12bに示すように、復号器内では、第1ウィンドウのN個のスペクトル値は、逆変形離散コサイン変換を実行する手段412に供給される。同じことは、第2ウィンドウのN個のスペクトル値についても当てはまる。これらは手段414に供給され、手段414も逆変形離散コサイン変換を実行する。両方の手段412および手段414は各々、それぞれ2N個のサンプルを第1ウィンドウに、2N個のサンプルを第2ウィンドウに提供する。
図12bのTDAC(TDAC=時間ドメインエイリアシング取消し)により指示される手段416では、2個のウィンドウがオーバラップしているという事実を考慮する。特に、インデックスN+kを持つことを意味する第1ウィンドウの第2半分のサンプルy1は、インデックスkを持つことを意味する第2ウィンドウの第1半分のサンプルy2と合計され、その結果、N復号時間サンプルが出力側つまり復号器内に生じる。
addファンクションとも呼ばれる手段416の機能により、図12aに略図を示す符号器内で実行されるウィンドウ表示は自動的に実行され、その結果、明示的な「逆ウィンドウ表示」は、図12bに示す復号器内で実行されない。
手段402または404により実施される窓関数をw(k)と呼び、インデックスkが時間インデックスを表す場合、ウィンドウの重みw(k)の二乗を同様にウィンドウの重みw(N+k)の二乗に加算すると1を生じ、kは0〜N−1になるという条件を満たさなければならない。サイン窓を使用し、そのウィンドウの重みがサイン関数の第1半波長に従う場合、あらゆる角度に関するサインの二乗およびコサインの二乗は共に、1の値を生じるため、この条件は常に満たされる。
浮動小数点を含むサイン窓を考察する場合、時間離散サンプル値の乗算によりウィンドウ表示を行うことは、0〜180°の角度のサインは、90°の角度を除いて整数を生じないため、図12aに記載する後続のMDCT関数を含むウィンドウ表示法の欠点である。整数の時間離散サンプルがウィンドウ表示である場合でも、浮動小数点の数はウィンドウ表示の後に生じる。
したがって、心理音響的符号器を使用しない、つまり無損失符号化を取る必要がある場合でも、合理的に操作可能なエントロピー符号化を実行できるように、それぞれ手段408および410の出力部において量子化が必要である。
一般に、無損失オーディオおよび/またはビデオ符号化に関して現在周知されている整数変換は、この場合に使用される変換をギブンズ回転に分離し、リフティングスキームをすべての回転に適用することにより得られる。したがって、あらゆるステップで丸め誤差が導入される。ギブンズ回転の後続の段階では、丸め誤差は蓄積し続ける。結果として生じる概算誤差は、特に、たとえば、overlap and addを含む周知のMDCT(MDCT=変形離散コサイン変換)の場合のように、たとえば1,024スペクトル値を提供する長変換を使用する場合、無損失オーディオ符号器手法に関して特に問題になる。特に、オーディオ信号が一般に、何れにしても非常に低い量のエネルギーを有する比較的高周波数範囲では、概算誤差は実際の信号より急速に大きくなる可能性があり、したがって、この方法は、無損失符号化に関して、特にそれにより得られる符号化効率に関して問題がある。
オーディオ符号化に関しては、整数出力値を生成する変換アルゴリズムを意味する整数変換は、特に、定数成分を考慮しない既知のDCT−IVに基づき、イメージアプリケーション用の整数変換は、むしろ、特に定数成分の規定を含むDCT−IIに基づく。こうした整数変換は、たとえばY.Zeng、G.BiおよびZ.Linの「リフティング因数分解に基づく整数正弦波変換」(Integer sinusoidal transforms based on lifting factorization)、Proc.ICASSP‘01、2001年5月、p1,181〜1,184、K.KomatsuおよびK.Sezakiの「可逆離散コサイン変換」(Reversible Discrete Cosine Transform)、Proc.ICASSP、1998年、第3巻、p1,769〜1,772、P.HaoおよびQ.Shiの「可逆整数マッピングのためのマトリクス因数分解」(Matrix factorizations for reversible integer mapping)、IEEEトランザクション信号処理(IEEE Trans.Signal Processing)、信号処理(Signal Processing)、第49巻、p.2,314〜2,324、並びにJ.Wang、J.SunおよびS.Yuの「整数から整数への1−dおよび2−d変換」(1−d and 2−d Transforms from integers to integers)、Proc.ICASSP’03、香港、2003年4月に記載されている。
上記で説明したとおり、本明細書に記載する整数変換は、変換をギブンズ回転に分離し、既知のリフティングスキームをギブンズ回転に適用することに基づき、蓄積する丸め誤差の問題を伴う。これは、特に、1回の変換の範囲内で、つまりリフティングステップを行うごとにその後、数回丸めを行う必要があり、したがって多くのリフティングステップに関連し、丸めを特に頻繁に行う必要があるという事実による。上記のとおり、丸めはリフティングステップごとにその後行われて、次のリフティングステップが行われるため、特に比較的不経済な処理において、誤差の蓄積が生じる。
Y.Zeng、G.BiおよびZ.Lin著「リフティング因数分解に基づく整数正弦波変換」(Integer sinusoidal transforms based on lifting factorization)、Proc.ICASSP‘01、2001年5月、p1,181〜1,184 K.KomatsuおよびK.Sezaki著「可逆離散コサイン変換」(Reversible Discrete Cosine Transform)、Proc.ICASSP、1998年、第3巻、p1,769〜1,772 P.HaoおよびQ.Shi著「可逆整数マッピングのためのマトリクス因数分解」(Matrix factorizations for reversible integer mapping)、IEEEトランザクション信号処理(IEEE Trans.Signal Processing)、信号処理(Signal Processing)、第49巻、p.2,314〜2,324 J.Wang、J.SunおよびS.Yu著「整数から整数への1−dおよび2−d変換」(1−d and 2−d Transforms from integers to integers)、Proc.ICASSP‘03、香港、2003年4月
本発明の目的は、個々の値を変換表現に転換し、変換表現を対応して逆転換するためのより効率的かつ正確なコンセプトを提供することである。
この目的は、請求項1による転換装置、請求項17による転換方法、請求項19による逆転換装置、請求項21による逆転換方法、または請求項24によるコンピュータプログラムにより達成される。
本発明のさらに他の目的は、転換のための本発明のコンセプト、および逆転換のための本発明のコンセプトをそれぞれ含む前方変換装置および後方変換装置を提供することである。
この目的は、請求項16による前方変換装置、請求項18による前方変換方法、請求項22による後方変換装置、は請求項23による後方変換方法、または請求項24によるコンピュータプログラムにより達成される。
本発明は、一次元リフティングスキームを多次元リフティングスキームに拡張し、少なくとも2つのこうしたリフティングステップをカスケード式に実行することにより、一方で丸め誤差を減少させ、他方で計算効率を改善するという知識に基づく。したがって、本発明によると、オーディオおよび/またはイメージ情報を含む値の少なくとも2つのブロックであって、各々任意の変換アルゴリズムに提出されるブロックが必要である。本発明によると、丸めは、完全な変換アルゴリズムを実行した後にのみ実行される。これは、第一に、たとえば、それぞれ第1変換のスペクトル値などの出力結果値が丸められ、第2変換の出力結果が丸められることを意味する。したがって、変換の範囲内で丸める必要はない。したがって、存在し、自由に使用可能であって、たとえばプログラムコードの形態の任意の既存の、特に既にテストされた変換規則を第2変換規則として使用することが可能であり、実際の変換に干渉することにより、先行技術のように変換自体を個々の回転に分離する必要はない。
本発明によると、第2ブロックは、第2ブロックを第1ブロックの変換表現と合計することにより、第1ブロックの変換表現のためのキャリヤとして使用される。さらに、本発明によると、第1ブロックは、既に第1ブロックのスペクトル値を含む第2ブロックの変換表現を第1ブロックから減算することにより、第2ブロックの変換表現のキャリヤとして使用される。
本発明によると、丸めは、単にそれぞれ第1および第2変換の後に実行され、丸められた値は、それぞれ加算的または減算的に対応するキャリヤ値に重畳されため、変換で実行されたステップの取消しは、逆変換においてデータを損失せずに得られ、その結果、整数転換アルゴリズムが生じ、このアルゴリズムは、一方では計算効率的な方法で実施することができ、他方では、丸め誤差の蓄積は生じない。これは、完全な第1または第2変換後にのみ実行され、その結果、一方では丸め誤差の蓄積が排除され、他方では、丸めステップの数が、変換自体を回転に分離する場合に比べて著しく減少し、丸めは、各々のリフティングステップ自体の後に、実際の変換アルゴリズムの範囲内で実行されるという事実による。
丸めは変換後に実行すれば良いため、さらに従来の非整数変換規則を使用することができる点は、本発明の利点である。
さらに、本発明は、高速アルゴリズムを使用することができるという事実の点で有利であり、エフォート0はN2に従って増加せず、単にN log Nで増加する。これは、変換長を意味する値Nはオーディオ信号では比較的大きく、上記の既知のオーディオ圧縮方法ではほぼ1,024の値であるため、オーディオ信号の場合に特に重要である。
既知の浮動小数点MDCT変換の整数バージョンを使用する本発明の好ましい実施態様では、既知のDCT−IC変換は、第1および第2変換の変換規則と同じ変換マトリックスを含む変換規則である。さらに、overlap and addを含むMDCTに対応する完全整数変換を求めるには、一般的なMDCTのウィンドウ表示を時間ドメインエイリアシング取消し機能(TDAC機能)と結合し、それをギブンズ回転により表現して、MDCTの完全整数バージョンを達成することが好ましく、ギブンズ回転は、やはり、リフティングスキームにより整数様式で計算することができる。
本発明の転換装置に供給される個々の値の2つのブロックは、最新ビデオ圧縮アルゴリズムにおける予測後の時間分離オーディオサンプルまたは離散イメージサンプルもしくはイメージ残留値のオーバラップウィンドウ表示ブロックのギブンズ回転値に対応し、DCT−IVアルゴリズムは、オーディオデータの場合の変換アルゴリズムとして好ましい。復号器側では、DCT−IVアルゴリズムは、やはり周波数−時間変換装置として好ましく、やはり回転段階が続き、逆リフティングスキームを実行して、符号器側で導入されたN丸め、つまり無損失様式で時間−周波数変換で導入される丸めを検索する。
本発明の好ましい実施態様について、添付の図面に関して以下で説明する。
図1は、本発明の転換装置のブロック図を示す。
図2は、本発明の逆転換装置のブロック図を示す。
図3は、本発明の好ましい実施態様による転換装置のブロック図を示す。
図4は、本発明の好ましい実施態様による逆転換装置を示す。
図5は、本発明に適用される値の2つの後続のブロックの変換表現を示す。
図6は、前方変換を含む多次元リフティングステップの詳細な表現を示す。
図7は、後方変換マトリックスを含む多次元逆リフティングステップの表現を示す。
図8は、長さNのDCT−IVを長さN/2の2つのDCT−IVに分離するための本発明の表現を示す。
図9は、時間離散オーディオサンプルを処理して、整数スペクトル値を決定することが可能な整数値を求めるのに好ましい手段のブロック図を示す。
図10は、ギブンズ回転および2つのDCT−IV動作におけるMDCTおよび逆MDCTの分離の略表現を示す。
図11は、50%のオーバラップを含むMDCTを回転およびDCT−IV動作に分離することを説明する表現を示す。
図12aは、MDCTおよび50%のオーバラップを含む既知の符号器の略ブロック図を示す。
図12bは、図10aにより生成された値を復号化するための既知の復号器のブロック図を示す。
図1は、個々の値を、整数値を含む変換表現に転換するための本発明による装置を示す。個々の値は、第1入力部100aおよび第2入力部100bを介して、本発明の装置に供給される。個々の値の第1ブロックは、入力部100aを介して供給され、個々の値の第2ブロックは、入力部100bを介して供給される。個々の値は、それぞれオーディオデータまたはイメージデータおよびビデオデータを表す。以下に説明するとおり、個々の値の第1ブロックおよび個々の値の第2ブロックは、実際上、時間的に連続するオーディオサンプルの2つのブロックを含む。個々の値の第1および第2ブロックは、異なる符号化などにおける予測または差分値の後のそれぞれ個々の値により表現される2つのイメージおよび残留値も含む。別法によると、個々の値の2つのブロックは、個々の値の第1ブロックおよび第2ブロックが、実際上ウィンドウ表示サンプルからギブンズ回転により生成されたMDCTの整数インプリメンテーションなどの前処理を施すことができたはずである。したがって、個々の値の第1および第2ブロックは、回転、置換、+/−バタフライ演算、拡大縮小などの何らかの処理により、元のオーディオデータまたはイメージデータから導くことができる。さらに、個々の値の第1および第2ブロックは、それぞれオーディオ情報およびイメージ情報を含むが、これらの情報は、直接的にオーディオサンプルまたは離散イメージ値ではない。
個々の値の第1ブロックは、図1に示すように、入力部100aを介して第1変換規則を使用することにより、個々の値の第1ブロックを処理して、手段102の出力部において変換値の第1ブロックを求めるための手段102に供給される。変換値の第1ブロックは一般に整数ではないが、フーリエ変換、ラプラス変換、FFT、DCT、DST、MDCT、MDSTまたはその他の何らかの変換、たとえば任意の基礎関数を含むウェーブレット変換など、何らかの変換規則により一般に得られるように不動少数点値を含む。変換値の第1ブロックは、変換値の第1ブロックを丸めて、丸められた変換値の第1ブロックを出力側において求めるための手段104に供給される。丸め手段104は、浮動少数点値に応じて実行されるそれぞれ切り捨て、または切り上げもしくは切り下げによる丸めなどの何らかの丸めを実行するように形成される。
したがって、手段104により実行される丸め規則は、丸められた変換値の第1ブロックが、やはり、手段104が使用する丸め規則により精度が決定される単に整数値を有するという事実に関連がある。丸められた変換値の第1ブロックは合計手段106に供給され、個々の値の第2ブロックは、合計値の第2ブロックを求めるために第2入力部100bに適用される。オーディオ信号の実施例を考察する場合、第1ブロックからのスペクトル値が、丸められた変換値の第1ブロックの丸められた変換値に加算され、手段106により個々の値の第2ブロックからの時間値に加算されると考えることができる。第2ブロックの個々の値が、たとえば電圧値として存在する場合、丸められた変換値の第1ブロックも電圧の振幅、つまり単位Vの値として存在することが推奨される。この場合、合計する時の単位の問題はない。しかし、当業者には、丸められた変換値の第1ブロックおよび個々の値の第2ブロックの両方がたとえば単位を持たないという場合、単位の標準化は、それぞれ丸められた変換値の第1ブロックおよび個々の値の第2ブロックを使って行うことができることが分かる。
合計値の第2ブロックは、変換値の第2ブロックを得るために第2変換を使用することにより合計値の第2ブロックを処理するための手段108に供給される。手段102で使用される変換規則が、たとえば時間−周波数変換規則である場合、ブロック108で使用される第2変換規則は、たとえば周波数−時間変換規則である。これらの関係は逆でも良いので、個々の値の第1および第2ブロックは、たとえばスペクトル値であり、時間値は、変換規則に基づく処理のための手段102により得られ、やはりスペクトル値は、逆変換規則を介した処理のための手段、つまり手段108により得られる。したがって、第1および第2変換規則は、第1および第2変換規則は前方変換規則または後方変換規則で良く、逆変換規則は、それぞれ後方変換規則および前方変換規則である。
変換値の第2ブロックは、図1に示すように、丸められた変換値の第2ブロックを得るために、丸め手段110に供給される。個々の値の第1ブロックから減算するために、この第2ブロックの丸められた変換値は次に、最終的に減算手段112に供給され、丸められた変換値の第2ブロックが、第1入力部108aを介して供給されて変換表現の整数出力値のブロックが得られ、このブロックは出力部114に出力することができる。手段102で既に使用された変換規則であるか、またはその変換規則とは異なる任意の第3変換規則を使用して変換表現の整数出力値のブロックを処理し、次に、変換出力値のブロックを丸めて、丸められた変換出力値のブロックを求め、次に、丸められた変換出力値のブロックと合計値の第2ブロックを合計することにより、変換表現の整数出力値のさらに他のブロックを求めることができ、これは、出力部114に適用される整数出力値のブロックを含む個々の値の第1および第2ブロックの完全な変換表現を提供する。
しかし、変換表現の整数出力値のブロックが出力部114に適用される最後の3つの処理、丸めおよび合計ステップがない場合でも、全体の変換表現の一部、つまり、たとえば第1の半分はすぐに求めることができ、その結果、この一部が逆処理の対象である場合、個々の値の第1および第2ブロックの再計算が可能になる。
ここで、変換規則に応じて、第1、第2、および必要な場合、第3変換規則は同じで良い。これは、たとえばDCT−IVの場合である。FFTを第1変換規則として使用する場合、FFTと同じではないIFFTは、第2(逆)変換規則として使用することができる。
計算上の理由から、マトリックス形態の変換規則を提供することが好ましく、これは、第1ブロックの個々の値の数が第2ブロックの個々の値の数に等しく、第1ブロックの個々の値の数および第2の個々の値の数がそれぞれNに等しい場合、二乗N×Nマトリックスである。
本発明の好ましい実施態様では、丸め手段104および110は、丸められた結果を提供する丸め機能により丸めるように構成され、その精度は、図1に示す機能を実行するコンピュータに固有の機械精度より低い。この丸め機能によると、この丸め機能は、単なる1つの好ましい実施態様では、非整数を次に大きいかまたは小さい整数にマッピングすることに注目するべきである。丸め機能は、丸め機能が、丸められる数の精度の低下を実行する限り、数17.7など、その他の整数を数10または数20にもマッピングする。上記の実施例では、丸められない数は、小数点の後に1桁がある数であり、丸められた数は、小数点の後に桁がない数である。
第1変換規則を使用して処理するための手段102、および第2変換規則を使用して処理するための手段108は、図1に別個の手段として示されているが、特定の実行では、単に1個の変換機能ユニットが存在することが可能であり、このユニットは、特定のシーケンス制御により制御され、先ず、個々の値の第1ブロックを転換し、次に、アルゴリズムの個々の時間において合計値の第2ブロックを逆転換する。これで、第1および第2変換規則は同じになるであろう。同じことは、2個の丸め手段104、110に適用される。これらも、別個の手段として提供されないが、丸め機能ユニットにより実行することができ、このユニットは、やはり、アルゴリズムの要件に応じてシーケンス制御により制御され、先ず変換値の第1ブロックを丸め、次に変換値の第2ブロックを丸める。
本発明の好ましい実施態様では、個々の値の第1ブロックおよび個々の値の第2ブロックは、以下で説明するとおり、図9のブロック28の出力部で得られるので、整数ウィンドウ表示サンプルである。次に、図9のブロック14の整数DCTは、図1に示す整数アルゴリズムにより実行され、その結果、変換表現は、図9に関連するオーディオ信号の実施例では、図9に示す装置の出力部30における整数スペクトル値を表現する。
以下では、図2に関して、図1に対応する逆変換手段が、図1のブロック112の出力部にある整数出力値のブロックから離れて示され、合計値の第2ブロックも、図1の手段106の出力部で使用される。以下でさらに詳細に説明する図4に関連して、これは、単にブロック150および130は存在するが、変換ブロック124は存在しないという場合に対応する。
図2は、図1の出力部114および合計値の第2ブロックで得られるように、変換表現の整数出力値のブロックを逆転換するための本発明による装置を示す。合計値の第2ブロックは、図2に示す逆転換装置の入力部120に供給される。変換表現の出力値のブロックは、逆転換装置の他の入力部122に供給される。
合計値の第2ブロックは、符号化時に最後に使用した変換規則が第2変換規則だった場合、第2変換規則を使用してこのブロックを処理するための手段130に供給される。出力側では、手段130は、変換値の第1ブロックを供給し、このブロックは丸め手段132に供給されて、やはり、丸められた変換値の第1ブロックを出力側で生成する。次に、図2の装置の第1出力部149において個々の値の第1ブロックを得るために、丸められた変換値の第1ブロックは、手段134により変換表現の出力値のブロックから減算される。
個々の値の第1ブロックは、手段150の出力部において変換値の第2ブロックを得るために、第1変換規則を使用してこのブロックを処理するための手段150に供給される。転換して減算された値のこの第2ブロックは、丸められた変換値の第2ブロックを得るために、やはり手段152において丸められる。次に、丸められた変換値のこの第2ブロックは、出力側の出力部136において個々の値の第2ブロックを得るために、入力部120を介して入力されて入力側に供給された合計値の第2ブロックから減算される。
第1、第2および第3変換規則の関係、並びに共通の機能ユニットおよび対応するシーケンス制御装置/一時記憶装置による図2の個々の機能ブロックの特有の実行に関して、図1に関する説明を参照する。
以下では、図3に関して、一般的に図1に示す変換表現に転換するための装置の好ましい実施態様について説明する。図1の実施態様は、合計値の第2ブロックから整数出力値のさらに他のブロックを生成するために、図1に比べてさらに他の変換/丸めを含む。
第1入力部100aは、個々の値の第1ブロックのN値を入力するためのN入力ラインX0、...、XN−1を含む。第2入力部100bも、個々の値の第2ブロックのN値XN、...、X2N−1を入力するためのNラインを含む。図1の手段102は、DCT−IV変換器として図3に示す。DCT変換器102は、N入力値からN出力値を生成するように形成され、これらの値は各々、図3に示すように、「[.]」で指示される丸め仕様により、手段104によって丸められる。合計手段106は、値の加算が行われるように示されている。これは、インデックス0を含む手段102の出力値が、インデックスNを持つ個々の値の第2ブロックの第1値と合計されることを意味する。したがって、一般に、序数iを含む丸められた変換値の第1ブロックの値は、丸め手段104の出力部において、序数N+iであって、iが0〜N−1の連続するインデックスである序数と個々に合計される。
第2変換規則を使用して処理するための手段108は、DCT−IV変換器としても示されている。図3に示す好ましい実施態様では、減算手段112も、値の減算を実行するように形成され、この場合、ラウンダー110の出力値、つまり丸められた変換値の第2ブロックの値は、個々の値の第1ブロックから個々に減算される。図3に示す実施態様では、対応する減算を実行することが好ましく、この場合、第2ブロックの値は、N+iの序数であり、やはり0〜N−1である序数iを持つ第1ブロックの値から減算される。別法によると、その他の加算/減算を行うことができ、たとえば、序数N−1を持つブロックの値は、逆転換で相応に考えられる限り、序数N−1を持つ他のブロックの値から減算される。
出力側では、減算手段112は、変換表現の整数出力値のブロック、つまり変換表現の整数出力値y0〜yN−1の整数出力値をすぐに供給する。任意に望ましい場合、変換表現の残りの整数出力値、つまりさらに他のブロックyN〜y2N−1を求めるには、出力部114に適用される変換表現の整数出力値のブロックは、前方変換器140による第3変換規則を使用して変換が行われ、前方変換器140の出力値は、やはり、丸め手段142により示すように丸められ、図3に参照符号144で表すように加算器106の出力部において、これらの値が合計値の第2ブロックに加算される。加算器144の出力値は、yN〜y2N−1で指示される変換表現の整数出力値のさらに他のブロック146を表す。
以下では、好ましい実施態様による変換表現の逆転換のための本発明による装置について、図4に関して説明する。図3の装置が実行する動作は、図4に示す装置により、無損失状態で逆転させることが可能である。図4は、合計値の第2ブロックを変換出力値の他のブロックから生成するための追加の変換/丸め段階を除いて図2に対応し、合計値の第2ブロックは、図2に示す実施態様では入力部120に供給される。加算機能は、減算機能によりそれぞれ逆転される点に注目するべきである。さらに、加算器/減算器の対(図3の144および図4の128)には、符号が逆転した入力量を供給することも可能であり、したがって、加算器144は、図示の場合と対照的に負の符号を持つ入力の群が提供される場合、実際上次に加算動作を実行すると思われる対応物(図4の128)で考える限り、実際上は減算動作を実行する点に注目するべきである。
図4に示す減算器128、加算器134およびさらに他の減算器154は、やはり個々の値の加算/減算を実行するように形成され、やはり、図3に関して説明した同じ序数処理が使用される。図示のとおり、別の序数の使用方法を図3で使用する場合、図4で相応に考えられるであろう。
x0〜xN−1で指示される個々の値136の第1ブロックは、減算器134の出力部に既に存在する。逆変換表現の残りの部分も得るため、個々の値の第1ブロックは、第1変換規則で動作する変換器150に供給され、その出力側の値はラウンダー152により丸められ、減算器128の出力部で減算された値の第2ブロックから減算され、xN、...、x2N−1で指示される個々の値156の第2ブロックが最終的に得られる。
以下では、図5〜図8に関して、図1〜図4に示す本発明の装置の数学的背景を説明する。それぞれ転換および逆転換のための本発明による図示の装置により、無損失オーディオ符号化のための整数変換方法で、概算誤差が減少する方法が提供される。上記のとおり、計算の努力は、リフティングスキームをすべてのギブンズ回転に適用する公知の方法はもはや使用されないという点でも考慮され、こうした方法では、自明な合計差バタフライ演算が常に生じる。こうしたバタフライ演算は、再現される変換の本来の非整数バージョンと対照的に、計算エフォートを著しく増加させる。
一般に、リフティングスキームは、ギブンズ回転の反転可能な整数概算を求めるために使用される。
Figure 0004398979
この整数概算は、加算するごとにその後、つまりリフティングステップごとにその後丸め機能を使用して得られる。
リフティングスキームは、特定の拡大縮小動作の反転可能な整数概算に使用することも可能である。専門の出版物であるR.GeigerおよびG.Schullerの「整数低遅延およびMDCTフィルタバンク」(Integer low delay andMDCT filter banks)Proc.of the Asilomar Conf.on Signals、Systems and Computers、2002年では、1に等しい決定因子を持つ2×2拡大縮小マトリックスの以下のリフティング分離が図示および説明されている。
Figure 0004398979
本発明によると、一次元である、つまり単に2×2拡大縮小マトリックスに関連するリフティング分離は、多次元の事例に拡張される。個々には、前方程式のすべての値はn×nマトリックスに置き換えられ、ここで、ブロックの個々の値の数を意味するnは、2より大きいかまたは2に等しい。したがって、結果は、好ましくは反転可能な何らかのn×nマトリックスTの場合、2n×2nブロックマトリックスへの以下の分離が可能であり、Enはn×n単位のマトリックスを表す。
Figure 0004398979
−1を含む置換または乗算などの単純な動作は別として、この分離の3つのブロックはすべて、以下の一般的な構造を有する。
Figure 0004398979
この2n×2nブロックマトリックスでは、発明により一般化したリフティングスキームを使用することができ、これは、後で多次元リフティングとも呼ぶ。
値x=(x0、...、x2n−1)のベクトルでは、このブロックマトリックスの適用により、以下の方程式が得られる。
Figure 0004398979
ベクトルが前方程式の右辺上にあり、その次元、つまりラインの数が2nに等しい点に注目するべきである。最初のn成分、つまり0〜n−1の成分は、x0〜yn−1に対応する。第2のn成分、つまり前方程式の右辺に生じるベクトルの第2の半分は、個々の値の第2ブロックの合計、つまりXn、...、X2n−1に等しいが、次に、図1〜図4の変換マトリックスに相当するマトリックスAの乗算および個々の値の第1ブロックX0、...、Xn−1と合計される。変換マトリックスは、それぞれ第1、第2および第3変換規則を表す。
以下の形式の2×2マトリックスを含む一般的なリフティングスキームと同様に、
Figure 0004398979
これらの2n×2nマトリックスは、以下のとおり、変換Tの反転可能な整数近似に使用することができる。整数入力値(X0、...、X2n−1)の場合、浮動小数点出力値(y0〜yn−1)=A・(X0、...、Xn−1)は、整数値(Xn、...、X2n−1)に加算される前に整数値に丸められる。ブロックマトリックスの逆数は以下を生じる。
Figure 0004398979
したがって、このプロセスは、単に同じマトリックスAおよび同じ丸め機能を使用し、次に、前方処理における加算ではなく、結果として得られた値を減算することにより、誤差がないように反転させることができる。こうした前方処理を図6に示し、後方処理を図7に示す。図6の変換マトリックスは、図7の変換マトリックスと同じである点に注目するべきであり、これは、実行の容易さの理由で好ましい。
値(X0、...、Xn−1)は、図6に示す前方ステップで修正されない場合、逆ステップ、つまり図7の後方ステップのためにまだ存在する。マトリックスAに特定の制限はない点に注目するべきである。したがって、この値は、必ずしも反転させる必要はない。
既知のMDCTの反転可能な整数近似を求めるため、MDCTは、ウィンドウ表示段階である第1段階でギブンズ回転、および後続のDCT−IV段階に分離される。この分離は、図10に示して以下で説明され、ドイツ特許公開公報第10129240 Al号に記載されている。
DCT−IVがギブンズ回転のいくつかの段階に分離される先行技術と対照的に、本発明によると、変換自体は残され、その後丸められる。
したがって、当技術分野で周知のように、DCT−IVの整数近似は、リフティングベースのギブンズ回転のいくつかの段階で実行される。ギブンズ回転の数は、基礎となる使用された高速アルゴリズムにより決定される。こうして、ギブンズ回転の数は、長さNの変換の場合、0(N log N)により与えられる。すべてのMDCT分離のウィンドウ表示段階は、N/2ギブンズ回転または3N/2丸めステップのみから成る。したがって、特に、オーディオ符号化用途に使用される変換長などの高変換長では(たとえば、1,024)、DCT−IVの整数近似は近似誤差の主な誘因である。
本発明の方法は、上記の多次元リフティングスキームを使用する。その結果、DCTIVにおける丸めステップの数は3N/2に減少し、ウィンドウ表示段階の丸めステップの数に等しくなることを意味し、従来のリフティングベースの方法における約2N log2 N丸めステップと対照的である。
本発明によると、DCT−IVは、信号の2つのブロックに同時に適用される。その1つの可能性を図5に示し、この場合、単純に、たとえば時間的に連続するサンプルの2つのブロックがDCT−IVの対象になる。2つの変換の対象になる2つのブロックは、マルチチャネル信号の2つのチャネルのサンプルでも良い。
上記の多次元リフティング方程式の分離は、N×Nマトリックスとしても考えられる変換規則に適用される。特にDCT−IVでは、逆数はやはりDCT−IVであり、図5に示すコンセプトに関して以下の分離が生じる。
Figure 0004398979
−1を含む乗算の置換は、個々のブロックマトリックスで抽出されるため、以下のコンテキストが生じる。
Figure 0004398979
したがって、信号の2つのブロック、つまり個々の値の2つのブロックに対する変換の適用は、好ましくは3つの多次元リフティングステップで得ることができる。
Figure 0004398979
上記の方程式は、本発明の好ましい実施態様に関して、図3にグラフで示す。逆転換は、上記で述べたとおり、相応して図4に示されている。
本発明の方法により、長さNの2つのDCT−IV変換を反転可能な状態で実行することができ、この場合、3N丸めステップのみが必要であり、これは、変換ごとに3N/2丸めステップを意味する。
3つの多次元リフティングステップにおけるDCT−IVは、任意の実行、たとえば浮動小数点または固定小数点ベースの実行を有することが可能である。DCT−IVは、反転可能である必要はない。DCT−IVは、前方および後方プロセスの両方において、正確に同じ方法で実行される必要があるだけである。結果として、このコンセプトは、現在のオーディオ符号化用途に使用されるように、たとえば1,024などの高変換長に適する。
全体的な計算の複雑さは、2つのDCT−IV変換の非整数実行の計算の複雑さの1.5倍に相当する。こうした計算の複雑さは、従来のDCT−IVの約2倍複雑な従来のリフティングベースの整数実行の場合より著しく低い。なぜなら、これらの実行は、2001年、ニューヨークにおける第111回AES会議におけるR.Geiger、T.Sporer、J.RollerおよびK.Brandenburgの「整数変換に基づくオーディオ符号化」(Audio Coding based on Integer Transforms)に記載されているように、使用するリフティングスキームに基づく自明な+/−バタフライ演算を使用する必要があるからである。
図示の方法は、少なくとも2つのDCT−IV変換を同時に、つまり1回の転換内で計算する。これは、たとえば、オーディオ信号の2つの連続するブロック、またはイメージ信号の2つの連続するイメージに関するDCT−IV変換を計算して行われる。2チャネルステレオ信号の場合、これは、転換動作および逆転換動作における左右のチャネルのDCT−IVをそれぞれ計算して達成される。第1バージョンは、あるブロックの付加的な遅延をシステム内に導入する。第2バージョンは、それぞれステレオチャネルの場合、および一般にマルチチャネル信号の場合に可能である。
別法によると、両方の選択肢が望ましくないが、N値という一般的なブロック処理長さを維持しなければならない場合、長さNのDCT−IVは、長さN/2の2つのDCT−IV変換に分離することが可能である。このコンテキストでは、この分離が行われるY.Zeng、G.BiおよびZ.Linの「リフティング因数分解に基づく整数正弦波変換」(Integer sinusoidal transforms based on lifting factorization)、Proc.OCASSP‘01、2001年5月、p1,181〜1,184を参照する。長さN/2の2つのDCT変換のほかに、ギブンズ回転のいくつかの追加の段階が必要である。さらに、このアルゴリズムでは、ブロックマトリックス
Figure 0004398979
つまり、N/2+/−バタフライ演算、N/2ギブンズ回転を含むブロック対角マトリックス、およびさらにいくつかの置換マトリックスが使用される。N/2ギブンズ回転のこれらの付加的な段階を使用することにより、多次元リフティング法は、長さNの1つのDCT−IVのみの計算に使用することもできる。このアルゴリズムの基本的な構造は、実際の転換段階から離して図8に示され、実際の転換段階では、長さN/2を有する2つのDCT−IV変換が使用され、第1のバタフライ段階は、一般にN/2の長さを有する個々の値の第1および第2ブロックを計算するために存在する。出力側では、回転段階は、図8および図5の入力側および出力側のインデックスの比較、変換表現の出力値のブロック、および各々が現在単にN/2値を有する変換表現の出力値のさらに他のブロックから分かるとおり、図5のDCT−IV動作の出力値に等しい出力値y0〜yN−1を求めるために提供される。
これまで、以下の形式のブロックマトリックスに対する多次元リフティングの単なる適用について説明してきた。
Figure 0004398979
その他のブロックマトリックスを多次元リフティングステップに分離することも可能である。たとえば、以下の分離を使用すると、多次元リフティングの3つの段階により、ある段階とノルム+/−バタフライ演算およびDCT−IV変換の2つのブロックとの組合せを実行とすることができる。
Figure 0004398979
前方程式から、前方程式の左括弧に使用される第1変換規則、および前方程式の中間括弧に使用される第2変換規則、および前方程式の最後の括弧に使用される第3変換規則は同じである必要はないことが明らかになる。さらに、前方程式から、単に主要対角要素が占有するブロックマトリックスを分離できるだけではなく、本発明により、完全に占有されたマトリックスを処理できることが明らかになる。さらに、本発明は、変換表現に対する転換に使用される変換規則は、互いに同じである必要があり、または互いに関連がある必要があるという事実に限定されず、その結果、たとえば第2変換規則は第1変換規則の逆変換規則であるという点に注目するべきである。一般に、3つの異なる変換規則は、逆表現で考えられる限り、使用することができる。
このコンテキストでは、再び図3および図4を参照する。個々の値を変換表現に転換する場合、手段102は、何らかの変換規則1を実行するように形成することができる。さらに、手段108も、変換規則2と呼ばれる他の変換規則または同等の変換規則を使用するように形成することができる。さらに、手段140は、一般に何らかの変換規則3を使用するように形成することができ、この変換規則は、必ずしも第1または第2の変換規則と同等である必要はない。
しかし、変換表現の逆転換では、図3に示す変換規則1〜3に対する適応が見られなければならず、この場合、転換の第1手段124は、何らかの変換規則を実行するのではなく、図3のブロック140で実行された変換規則3を実行する。これに対して、図4の手段130は、やはり図3のブロック108により実行された変換規則2を実行しなければならない。最後に、図4の手段150は、無損失逆転換が得られるように、やはり図3の手段102により実行された変換規則1を実行しなければならない。
以下では、図9〜図11に関して、ドイツ特許公開公報第10129240 A1号に記載されているように、MDCTウィンドウ表示の分離について再び説明し、この特許では、MDCTウィンドウ表示を、リフティングマトリックスを含むギブンズ回転に分離することと、対応する丸めは、転換に関して図1および逆転換に関して図2に示すコンセプトと有利に結合して、完全な整数MDCT近似、つまり本発明による整数MDCT(IntMDCT)を得ることができ、そのため、前方変換コンセプトおよび後方変換コンセプトの両方がMDCTの実施例で実行された。
図9は、時間離散サンプルを処理するための発明による好ましい装置の概念図を示し、Int−MDCT整数変換アルゴリズムが関連して動作する整数を求めるためのオーディオ信号を表現する。時間離散サンプルは、図9に示す装置によりウィンドウ表示され、任意にスペクトル表現に転換される。入力部10において装置に供給される時間離散サンプルは、2N時間離散サンプルに対応する長さを持つウィンドウでウィンドウ表示され、出力部12において整数ウィンドウ表示サンプルが得られ、このサンプルは、変換を介して、特に、整数DCTを実行するための手段14を介してスペクトル表現に転換するのに適する。整数DCTは、N入力値のN出力値を生成するように構成され、これは、MDCT方程式により2Nウィンドウ表示サンプルのNスペクトル値を単に生成する図12aのMDCT関数408と対照的である。
時間離散サンプルをウィンドウ表示するため、最初の2つの時間離散サンプルを手段16で選択し、これらのサンプルは共に、時間離散サンプルのベクトルを表す。手段16により選択された時間離散サンプルは、ウィンドウの最初の4分の1にある。他の時間離散サンプルは、図11に関してさらに詳細に説明するとおり、ウィンドウの第2の4分の1にある。次に、手段16により生成されたベクトルには、2×2次元の回転マトリックスが与えられ、この動作は、直接実行されるのではなく、いくつかのいわゆるリフティングマトリックスを介して実行される。
リフティングマトリックスは、ウィンドウwおよび等しくない「1」または「0」に応じて1つの要素のみを有するという特徴を有する。
リフティングステップへのウェーブレット変換の因数分解は、専門の出版物であるIngrid DaubechiesおよびWim Sweldensの「リフティングステップへのウェーブレット変換の因数分解」(Factoring Wavelet Transforms Into Lifting Steps)、増刷版、Bell Laboratories、Lucent Technologies、1996年に記載されている。一般に、リフティングスキームは、完全に再現するフィルタ対であって、同じローパスまたはハイパスフィルタを有する対間の単純な関係である。相補的なフィルタの各々の対は、リフティングステップに因数分解される。これは、特にギブンズ回転に適用される。多相マトリックスがギブンズ回転である場合を考察する。以下が適用される。
Figure 0004398979
等号の右側にある3つのリフティングマトリックスの各々は、主要対角要素として値「1」を有する。さらに、すべてのリフティングマトリックスでは、二次対角要素は0に等しく、二次対角要素は回転角αによって決まる。
次に、このベクトルは、第3リフティングマトリックス、つまり、第1結果ベクトルを得るために、上記方程式の一番右のリフティングマトリックスが乗算される。これは、手段18により図9に示されている。次に、第1結果ベクトルは、手段20により図9に示すように、実数の量を整数の量にマッピングする任意の丸め機能で丸められる。丸められた第1結果ベクトルは、手段20の出力部で得られる。次に、丸められた第1結果ベクトルは、このベクトルに中間、つまり第2リフティングマトリックスを乗算するための手段22に供給されて、第2結果ベクトルが得られ、手段24で再び丸められて、丸められた第2結果ベクトルが得られる。丸められた第2結果ベクトルは、次に、このベクトルに上の方程式の左に示されているリフティングマトリックス、つまり第1リフティングマトリックスを乗算するための手段26に供給され、第3結果ベクトルが得られ、次に、このベクトルは、手段28を介して最終的に丸められ、出力部12において最終的に整数ウィンドウ表示サンプルが得られ、このサンプルは、サンプルのスペクトル表現が望ましい場合、手段14により処理されて、スペクトル出力部30において整数スペクトル値が得られる。
手段14は、整数DCTとして具体化することが好ましい。
長さNを有するタイプ4(DCT−IV)による離散コサイン変換は、以下の方程式により与えられる。
Figure 0004398979
DCT−IVの係数は、正規直交N×Nマトリックスを形成する。すべての直交N×Nマトリックスは、P.P.Vaidyanathanによる専門の出版物の「マルチレートシステムおよびフィルタバンク」(Multirate Systems And Filter Banks)、Prentice Hall、エングルウッドクリフス(Englewood Cliffs)、1993年に記載されているようにN(N−1)/2ギブンズ回転に分離される。その他の分離も存在することに注目するべきである。
異なるDCTアルゴリズムの分類に関して、H.S.Malvarの「ラップ変換による信号処理」(Signal Processing With Lapped Transforms)、Artech House、1992年を参照するべきである。一般に、DCTアルゴリズムは、基本機能のタイプごとに異なる。この場合に好ましいDCT−IVは、非対称基本機能、つまりコサイン1/4波長、コサイン3/4波長、コサイン5/4波長、コサイン7/4波長などを含むが、たとえばタイプII(DCT−II)の離散コサイン変換は軸対称および点対称基本変換を有する。たとえば、0番目の基本機能は直接成分を有し、第1基本機能は半コサイン波長であり、第2基本機能は全コサイン波長である。DCT−IIは、特に定数成分を考慮するという事実により、ビデオ符号化で使用され、オーディオ符号化では使用されず、なぜなら、定数成分は、ビデオ符号化と対照的にオーディオ符号化には関連しないためである。
以下では、ギブンズ回転の回転角αは窓関数によって決まるという事実に言及する。
ウィンドウの長さが2NであるMDCTは、長さNのタイプIVの離散コサイン変換に減少させることが可能である。これは、時間ドメインで明示的にTDAC動作を実行し、次にDCT−IVを適用することにより達成される。50%のオーバラップでは、ブロックtのウィンドウの左半分は、前のブロック、つまりブロックt−1の右半分とオーバラップする。2つの連続するブロックt−1およびtのオーバラップ部分は、以下のとおり、時間ドメインで、つまり変換器の前、つまり図9の入力部10と出力部12との間で再処理される。
Figure 0004398979
チルダで指示される値は、図9の出力部12における値であり、上記の方程式でチルダを含まないxの値は、それぞれ入力部10における値および選択手段16の後の値である。連続するインデックスkは0〜N/2−1であり、wは窓関数を表す。
窓関数wのTDAC条件から、以下のコンテキストが適用される。
Figure 0004398979
一定の角度αk、k=0、...、N/2−1では、時間ドメインにおけるこの再処理は、上記で説明したとおり、ギブンズ回転として書くことができる。
ギブンズ回転の角度αは、以下のとおり、窓関数によって決まる。
Figure 0004398979
このTDAC条件を満たす限り、窓関数wを使用することができる。
以下では、カスケード式符号器および復号器について、図10に関して説明する。1つのウィンドウごとに一緒に「ウィンドウ表示」される時間離散サンプルx(0)〜x(2N−1)は、図9の手段16により、サンプルx()およびサンプルx(N−1)、つまりウィンドウの第1の4分の1のサンプル、およびウィンドウの第2の4分の1のサンプルが、手段16の出力部におけるベクトルを形成するために選択されるように最初に選択される。交差矢印は、DCT−IVブロックの入力部において整数ウィンドウ表示サンプルを求めるため、それぞれ手段18、20および22、24および26、28のリフティング乗算およびその後の丸めを表す。
第1ベクトルが上記のように処理された場合、さらに、サンプルx(N/2−l)およびx(n/2)の第2ベクトル、つまりやはりウィンドウの第1の4分の1のサンプルおよびウィンドウの第2の4分の1のサンプルが選択され、図9に記載したアルゴリズムにより再処理される。同様に、ウィンドウの第1および第2の4分の1の他のすべてのサンプル対が処理される。同じ処理は、第1ウィンドウの第3および第4の4分の1について行われる。次に、2Nウィンドウ表示整数サンプルは出力部に12存在し、図10に示すDCT−IV変換に供給される。特に、第2および第3の4分の1の整数ウィンドウ表示サンプルはDCTに供給される。ウィンドウの第1の4分の1のウィンドウ表示整数サンプルは、前のDCT−IVで、前のウィンドウの第4の4分の1のウィンドウ表示整数サンプルと一緒に処理される。同様に、図10のウィンドウ表示整数サンプルの第4の4分の1は、次のウィンドウの第1の4分の1と共にDCT−IV変換に供給される。次に、図10に示す中間積分DCT−IV変換は、N整数スペクトル値y(0)〜y(N−l)を提供する。次に、これらの整数スペクトル値は、容易にエントロピー符号化され、中間量子化は不要である。なぜなら、ウィンドウ表示および変換は、整数出力値を提供するからである。
復号器は、図10の右半分に示されている。逆変換および「逆ウィンドウ表示」から構成される復号器は、符号器と逆に動作する。逆DCT−IVは、図10に示すように、DCT−IVの逆変換に使用することができる。次に、復号器DCT−IV34の出力値は、図10に示すように、それぞれ前の変換および次の変換の値を使って逆に処理され、手段34の出力部における整数ウィンドウ表示サンプル、並びにそれぞれ前の変換および後続の変換から、時間分離オーディオサンプルx(0)〜x(2N−1)が生成される。
出力側の動作は、逆ギブンズ回転により、つまり、ブロック26、28および22、24および18、20がそれぞれ対向方向に通過するように行われる。これは、方程式1の第2リフティングマトリックスに関して、より詳細に説明する。(符号器内で)、第2結果ベクトルが、丸められた第1結果ベクトルと第2リフティングマトリックス(手段22)との乗算により形成される場合、以下の方程式が得られる。
Figure 0004398979
方程式6の右辺の値x、yは整数である。しかし、これは、値X sin αには適用されない。この場合、以下の方程式に示すように、丸め関数rを導入しなければならない。
Figure 0004398979
この動作は、手段24により実行される。
この逆マッピング(復号器の場合)は、以下のように定義される。
Figure 0004398979
丸め動作の前の負符号により、リフティングステップの整数近似は、誤差が導入されることなく逆転させることができることが明白になる。この近似を3つのリフティングステップの各々に適用すると、ギブンズ回転の整数近似が得られる。丸め回転(符号器内)は、誤差を導入することなく、逆の丸めリフティングステップを逆順に通過することにより、つまり、図9のアルゴリズムが、復号化時に下から上に実行される時に、逆転させることができる(復号器内)。
丸め関数rが点対称である場合、逆丸め回転は、角度−αの丸め回転と同じであり、以下のとおりである。
Figure 0004398979
復号器用の、つまり逆ギブンズ回転用のリフティングマトリックスは、この場合、単に式「sin α」を式「−sin α」と置き換えることにより、方程式(1)から直接得られる。
以下では、再び図11に関して、オーバラップウィンドウ40〜46を含む共通のMDCTについて説明する。ウィンドウ40〜46は、それぞれ50%オーバラップする。ウィンドウごとに、ギブンズ回転は、矢印48で大まかに示すように、ウィンドウの第1および第2の4分の1の範囲、およびウィンドウの第3および第4の4分の1の範囲内でそれぞれ実行される。次に、回転値、つまりウィンドウ表示の整数サンプルはN−to−N DCTに供給され、その結果、ウィンドウの第2および第3の4分の1および後続のウィンドウの第4および第1の4分の1はそれぞれ、DCT−IVアルゴリズムを介して一緒にスペクトル表現に転換される。
したがって、共通のギブンズ回転はリフティングマトリックスに分離され、これらのマトリックスは順に実行されて、丸めステップは、リフティングマトリックス乗算ごとにその後導入され、その結果、浮動小数点数は発生直後に丸められ、したがって、結果ベクトルは、結果ベクトルの乗算ごとの乗算以前の単なる整数を有する。
したがって、出力値は常に整数であり、整数の入力値も使用することが好ましい。これは制限を表すわけではなく、なぜなら、たとえば、CD上に記憶されている何らかのPCMサンプルは、値の範囲がビット幅に応じて、つまり時間離散ディジタル入力値が16ビット値または24ビット値であるかどうかに応じて変化するからである。さらに、全体のプロセスは、既に述べたとおり、逆回転を逆方向に行うことにより、逆転させることができる。したがって、無損失変換を意味する完全再構成を含むMDCTの整数近似が存在する。
図示の変換は、浮動少数点値ではなく整数出力値を提供する。この変換は完全な再構成を提供するため、前方変換、次に後方変換が実行される時に、誤差は導入されない。本発明の好ましい実施態様によると、この変換は、変形離散コサイン変換に代わるものである。その他の変換方法も、回転に対する分離、およびリフティングステップに対する回転の分離が可能な限り、その他の変換方法を整数的に実行することも可能である。
整数MDCTは、MDCTの最も有利な特徴を有する。整数MDCTはオーバラップ構造を有し、その結果、非オーバラップブロック変換に比べて、より良好な周波数選択が得られる。変換以前にウィンドウ表示時にすでに考察されるTDAC関数により、重要なサンプリングは維持されるため、オーディオ信号を表現するスペクトル値の合計数は、入力サンプルの合計数に等しい。
浮動小数点サンプルを提供する標準MDCTと対照的に、説明した好ましい整数変換は、低信号レベルの標準MDCTと比べると、ノイズは単にスペクトル域内で増加し、こうしたノイズの増加は、有効な信号レベルでは目立たない。むしろ、整数処理は、効率的なハードウェアインプリメンテーションに役立ち、なぜなら、単に乗算ステップが使用され、これらのステップは、shift/addステップに容易に分離して、単純かつ高速にハードウェア内で実行できるからである。当然、ソフトウェアインプリメンテーションも可能である。
整数変換は、オーディオ信号の良好なスペクトル表現を提供し、その後も整数の範囲を保つ。この整数変換は、オーディオ信号の音色部分に適用される場合、良好なエネルギー集中を生じる。その結果、図9に示すウィンドウ表示/変換をエントロピー符号器と単にカスケードすることにより、効率的な無損失符号化スキームを構成することができる。MPEG AACに使用されるエスケープ値を使用して、特に積み重ねられた符号化が望ましい。すべての値は、省略された最下位ビットを付加的に符号化するように所望のコード表に適合するまで、一定の2のべき乗だけ縮小することが好ましい。比較的大きいコード表の代案と対照的に、所望の代案は、コード表を記憶するためのメモリ消費の点でより望ましい。殆どの無損失符号器は、最下位ビットの特定の1つを単に省略することによっても得られる。
特に、音色信号の場合、整数スペクトル値のエントロピー符号化は高度の符号器ゲインを可能にする。信号の遷移部分では、遷移信号の平坦なスペクトルにより、つまり0に等しいか、またはほぼ0であるスペクトル値の低い数字により、符号器のゲインは低い。J.Herre、J.D.Johnstonの「時間領域雑音整形(TNS)を使用するパーセプチュアルオーディオコーダの性能の強化」(Enhancing the Performance of Perceptual Audio Coders by Using Temporal Noise Shaping)101.AES会議、ロサンゼルス、1996年、増刷版4384に記載されているように、この平坦性は、周波数範囲の線形予測を使用することにより使用することができる。1つの代案は、開ループを含む予測である。もう1つの代案は、閉ループを含む予測子である。第1の代案、つまり開ループを含む予測子はTNSと呼ばれる。予測後の量子化は、結果として得られる量子化雑音をオーディオ信号の時間構造に適応させて、心理音響的オーディオ符号器におけるプレエコーを防止することに通じる。無損失オーディオ符号化の場合、閉ループを含む予測子は入力信号の正確な再構成を可能にするため、第2の代案、つまり閉ループを含む予測子を含む代案がより適している。この技術は、生成されたスペクトルに適用される場合、丸めステップは、整数範囲を保つために予測フィルタのステップごとにその後実行する必要がある。逆フィルタおよび同じ丸め関数を使用することにより、元のスペクトルを正確に再構成することができる。
データ整理用の2つのチャネル間の冗長性を使用するために、角度π/4を含む丸め回転を使用する場合、無損失様式で中心側符号化を使用することができる。ステレオ信号の左右チャネルの合計および差を計算する代案と対照的に、丸め回転はエネルギー保存という利益がある。いわゆるジョイントステレオ符号化技術の使用は、標準のMPEG AACで行われているように、帯域ごとにオンまたはオフにすることができる。より順応性のある様式で、2つのチャネル間の冗長性を減少させるために、さらに他の回転角度も考えられる。
状況によっては、それぞれ転換および逆転換、並びにそれぞれ時間−周波数変換または周波数−時間変換のための本発明による方法は、ハードウェアまたはソフトウェアで実行することができる。このインプリメンテーションは、方法を実行するようにプログラム可能なコンピュータシステムと協働可能な電気的可読制御信号を使って、ディジタルメモリ媒体、特にディスクまたはCD上で具体化することができる。したがって、一般に、本発明は、コンピュータプログラムがコンピュータ上で実行された時に本発明の方法を実行するための機械可読キャリヤ上に記憶されたプログラムコードを含むコンピュータプログラム製品からも構成される。つまり、本発明は、コンピュータプログラムがコンピュータ上で実行された時に方法を実行するためのプログラムコードを含むコンピュータプログラムとして実現することが可能である。
本発明の転換装置のブロック図を示す。 本発明の逆転換装置のブロック図を示す。 本発明の好ましい実施態様による転換装置のブロック図を示す。 本発明の好ましい実施態様による逆転換装置を示す。 本発明に適用される値の2つの後続のブロックの変換表現を示す。 前方変換を含む多次元リフティングステップの詳細な表現を示す。 後方変換マトリックスを含む多次元逆リフティングステップの表現を示す。 長さNのDCT−IVを長さN/2の2つのDCT−IVに分離するための本発明の表現を示す。 時間離散オーディオサンプルを処理して、整数スペクトル値を決定することが可能な整数値を求めるのに好ましい手段のブロック図を示す。 ギブンズ回転および2つのDCT−IV動作におけるMDCTおよび逆MDCTの分離の略表現を示す。 50%のオーバラップを含むMDCTを回転およびDCT−IV動作に分離することを説明する表現を示す。 図12aは、MDCTおよび50%のオーバラップを含む既知の符号器の略ブロック図を示す。図12bは、図10aにより生成された値を復号化するための既知の復号器のブロック図を示す。

Claims (24)

  1. 個々の値を整数値を含む変換表現に転換し、個々の値がオーディオおよび/またはイメージ情報を有する装置であって、
    第1変換規則を使用して個々の値の第1ブロックを処理し、変換値の第1ブロックを得るための手段(102)と、
    変換値の第1ブロックを丸めて、丸められた変換値の第1ブロックを得るための手段(104)と、
    丸められた変換値の第1ブロックと個々の値の第2ブロックとを合計して、合計値の第2ブロックを得るための手段(106)と、
    第2変換規則を使用して合計値の第2ブロックを処理し、変換値の第2ブロックを得るための手段(108)と、
    変換値の第2ブロックを丸めて、丸められた変換値の第2ブロックを得るための手段(110)と、
    個々の値の第1ブロックから丸められた変換値の第2ブロックを個々に減算して、変換表現の整数出力値のブロックを得るための手段(112)とを備える装置。
  2. 第3変換規則を使用して、整数出力値のブロックを処理し、変換出力値のブロックを得るための手段(140)と、
    変換出力値のブロックを丸めて、丸められた変換出力値のブロックを得るための手段(142)と、
    丸められた変換出力値のブロックと、合計値の第2ブロックとを合計して変換表現の整数出力値のさらに他のブロックを得るための手段(144)とをさらに備える、請求項1に記載の装置。
  3. 第1変換規則、第2変換規則および第3変換規則がそれぞれ変換マトリックスを含む、請求項1または2に記載の装置。
  4. 第1変換規則、第2変換規則および第3変換規則がそれぞれ互いに同じである、請求項1ないし請求項3のいずれかに記載の装置。
  5. 第1変換規則および第3変換規則が前方変換規則であり、第2変換規則が後方変換規則である、請求項1ないし請求項4のいずれかに記載の装置。
  6. 第1ブロックを丸めるための手段(104)および第2ブロックを丸めるための手段(110)および変換出力値のブロックを丸めるための手段(142)がそれぞれ、丸められた結果を提供する丸め関数であって、その精度が、装置を含むコンピュータの機械精度より低い丸め関数に従って丸めるように形成される、
    請求項1ないし請求項5のいずれかに記載の装置。
  7. 個々の値の第1ブロックが、序数0〜序数N−1の個々の値を有し、個々の値の第2ブロックが、序数N〜序数2N−1の個々の値を有し、
    丸められた変換値の第1ブロックが0〜N−1の序数を有し、合計手段(106)が、値の加算を実行するように形成され、その結果、序数iを有する丸められた変換値のブロックが、序数i+Nを有する個々の値の第2ブロックの値に加算され、iが、0〜N−1の連続するインデックスである、請求項1ないし請求項6のいずれかに記載の装置。
  8. 個々の値の第1ブロックが、序数0〜序数N−1の個々の値を有し、個々の値の第2ブロックが、序数0〜序数2N−1の個々の値を有し、
    丸められた変換値の第2ブロックが、序数Nと2N−1との間の値を有し、
    減算のための手段(112)が、序数n+iを有する丸められた変換値のブロックの値を、序数iを有する第1ブロックの値から減算するように形成され、iが、0〜N−1の連続するインデックスである、請求項1ないし請求項7のいずれかに記載の装置。
  9. 個々の値の第1および第2ブロックが、整数の個々の値を含む、請求項1ないし請求項8のいずれかに記載の装置。
  10. 変換値の第1ブロックを丸めるための手段(104)、または変換値の第2ブロックを丸めるための手段(110)が、同じ丸め仕様に従って丸めるように形成される、請求項1ないし請求項9のいずれかに記載の装置。
  11. 第1変換規則の基礎になる変換マトリックス、第2変換規則の基礎になる変換マトリックス、および第3変換規則の基礎になる変換マトリックスがそれぞれ、第1または第2ブロックの個々の値の数に等しいそれぞれある数の行および列を有する二乗マトリックスである、請求項3に記載の装置。
  12. 第1変換規則に従って処理するための手段(102)、および第2変換規則に従って処理するための手段(108)が変換器内に形成され、
    さらにシーケンス制御装置が設けられ、該制御装置が、最初に個々の値の第1ブロックを供給し、後に合計値の第2ブロックを変換器に供給するように形成される、請求項1ないし請求項11のいずれかに記載の装置。
  13. 変換値の第1ブロックを丸めるための手段(104)および変換値の第2ブロックを丸めるための手段(110)がラウンダー内に形成され、
    さらにシーケンス制御装置が設けられ、最初に個々の値の第1ブロック、後に変換値の第2ブロックを前記ラウンダーに供給する、請求項1ないし請求項12のいずれかに記載の装置。
  14. 個々の値の第1および第2ブロックが、マルチチャネルオーディオ信号の第1および第2チャネルのオーディオサンプルである、請求項1ないし請求項13のいずれかに記載の装置。
  15. 第1ブロックおよび第2ブロックが、オーディオ信号の連続する時間サンプルである、請求項1ないし請求項13のいずれかに記載の装置。
  16. 前方変換装置であって、
    いくつかのリフティングマトリックス(18、22、26)、およびその後の丸め動作(20、24、28)を使用することにより、オーディオ信号またはイメージ信号を表現するサンプルの第1ブロックをウィンドウ表示し、オーディオ信号またはイメージ信号を表現する第2ブロックのウィンドウ表示し、個々の値の第1ブロックおよび個々の値の第2ブロックを得るための手段(16、18、20、22、24、26、28)と、
    整数出力値を含む第1および第2ブロックから変換表現を得るための請求項1ないし請求項15のいずれかに記載の装置とを備える装置。
  17. 個々の値を整数値を含む変換表現に転換し、個々の値がオーディオおよび/またはイメージ情報を有する方法であって、
    第1変換規則を使用して個々の値の第1ブロックを処理し(102)、変換値の第1ブロックを得るステップと、
    変換値の第1ブロックを丸めて(104)、丸められた変換値の第1ブロックを得るステップと、
    丸められた変換値の第1ブロックと個々の値の第2ブロックとを合計して(106)、合計値の第2ブロックを得るステップと、
    第2変換規則を使用して合計値の第2ブロックを処理し(108)、変換値の第2ブロックを得るステップと、
    変換値の第2ブロックを丸めて(110)、丸められた変換値の第2ブロックを得るステップと、
    個々の値の第1ブロックから丸められた変換値の第2ブロックを個々に減算して(112)、変換表現の整数出力値のブロックを得るステップとを含む方法。
  18. 前方変換方法であって、
    オーディオ信号またはイメージ信号を表現するサンプルの第1ブロックをウィンドウ表示し(16、18、20、22、24、26、28)、いくつかのリフティングマトリックス(18、22、26)を使用してオーディオ信号またはイメージ信号を表現する第2ブロックをウィンドウ表示し、その後丸め動作(20、24、28)を行って、個々の値の第1ブロックおよび個々の値の第2ブロックを得るステップと、
    請求項17に記載の方法であって、整数出力値を含む第1および第2ブロックから変換表現を得る方法とを含む方法。
  19. 整数出力値のブロック、および個々の値の変換表現である合計値の第2ブロックを逆転換して、個々の値の第2ブロックを得るための装置であって、整数出力値のブロック、および合計値の第2ブロックが個々の値の第1および第2ブロックから導かれ、そのため個々の値の第1ブロックを処理し(102)、第1変換規則を使用して変換値の第1ブロックを得て、変換値の第1ブロックを丸め(104)、丸められた変換値の第1ブロックを得て、丸められた変換値の第1ブロックと個々の値の第2ブロックとを合計し(106)、合計値の第2ブロックを得て、第2変換規則を使用して合計値の第2ブロックを処理して(108)、変換値の第2ブロックを得て、変換値の第2ブロックを丸め(110)、丸められた変換値の第2ブロックを得て、丸められた変換値の第2ブロックを個々の値の第1ブロックから減算して(112)、変換表現の整数出力値のブロックを得る装置で、
    第2変換規則を使用して、合計値の第2ブロックを処理し、変換出力値の第1ブロックを得るための手段(130)と、
    変換出力値の第1ブロックを丸めて、丸められた変換値の第1ブロックを得るための手段(132)と、
    丸められた変換出力値の第1ブロックを整数出力値のブロックと合計して、個々の値の第1ブロックを得るための手段(134)と、
    第1変換規則を使用して個々の値の第1ブロックを処理し、変換値の前記第2ブロックに対応するブロックを得るための手段(150)と、
    変換値の前記第2ブロックに対応するブロックを丸めて、丸められた変換値のブロックを得るための手段(152)と、
    丸められた変換値のブロックを合計値の第2ブロックから減算して、個々の値の第2ブロックを得るための手段(154)とを備える装置。
  20. 変換表現の整数出力値のさらに他のブロックが、合計値の第2ブロックから計算され、そのため第3変換規則を使用して整数出力値のブロックを処理して(140)、変換出力値のブロックを得て、変換出力値のブロックを丸めて(142)、丸められた変換出力値のブロックを得て、丸められた変換出力値のブロックと合計値の第2ブロックとを合計して(144)、変換表現の整数出力値のさらに他のブロックを得る請求項19に記載の装置であって、
    第3変換規則を使用して整数出力値のブロックを処理して、変換出力値の第1ブロックを得るための手段(124)と、
    変換出力値の第1ブロックを丸めて、丸められた変換出力値の第1ブロックを得るための手段(126)と、
    丸められた変換出力値の第1ブロックを出力値のさらに他のブロックから減算して、合計値の第2ブロックを得るための手段(128)とを備える装置。
  21. 整数出力値のブロック、および個々の値の変換表現である合計値の第2ブロックを逆転換して、個々の値の第1および第2ブロックを得るための方法であって、整数出力値のブロックおよび合計値の第2ブロックが、個々の値の第1および第2ブロックから導かれ、そのため、第1変換規則を使用して個々の値の第1ブロックを処理して(102)、変換値の第1ブロックを得て、変換値の第1ブロックを丸めて(104)、丸められた変換値の第1ブロックを得て、丸められた変換値の第1ブロックと個々の値の第2ブロックとを合計して(106)、合計値の第2ブロックを得て、第2変換規則を使用して合計値の第2ブロックを処理し(108)、変換値の第2ブロックを得て、変換値の第2ブロックを丸めて(110)、丸められた変換値の第2ブロックを得て、丸められた変換値の第2ブロックを個々の値の第1ブロックから減算して(112)、変換表現の整数出力値のブロックを得る方法で、
    第2変換規則を使用して合計値の第2ブロックを処理し(130)、変換出力値の第1ブロックを得るステップと、
    変換出力値の第1ブロックを丸めて(132)、丸められた変換値の第1ブロックを得るステップと、
    丸められた変換出力値の第1ブロックと整数出力値のブロックとを合計し(134)、個々の値の第1ブロックを得るステップと、
    第1変換規則を使用して個々の値の第1ブロックを処理し(150)、変換値の前記第2ブロックに対応するブロックを得るステップと、
    変換値の前記第2ブロックに対応するブロックを丸めて(152)、丸められた変換値のブロックを得るステップと、
    丸められた変換値のブロックを合計値の第2ブロックから減算して(154)、個々の値の第2ブロックを得るステップとを含む方法。
  22. 後方変換装置であって、
    請求項19または20に記載の装置と、
    リフティングマトリックス(18、22、26)を使用して、個々の値の第1および第2ブロックの逆ウィンドウ表示し、その後丸め動作(20、24、28)を行って、オーディオサンプルまたはイメージサンプルを表現する元の値の第1および第2ブロックを得るための手段とを備える装置。
  23. 後方変換方法であって、
    請求項21に記載の方法と、
    リフティングマトリックス(18、22、26)を使用して、個々の値の第1および第2ブロックを逆ウィンドウ表示し、その後丸め動作(20、24、28)を行って、オーディオサンプルまたはイメージサンプルを表現する元の値の第1および第2ブロックを得るステップとを含む方法。
  24. コンピュータに、請求項17、18、21または23に記載の方法を実行させるためのプログラム。
JP2006519811A 2003-07-14 2004-07-05 変換表現に転換するか、または変換表現を逆変換するための装置および方法 Expired - Lifetime JP4398979B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10331803A DE10331803A1 (de) 2003-07-14 2003-07-14 Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
PCT/EP2004/007326 WO2005006624A2 (de) 2003-07-14 2004-07-05 Vorrichtung und verfahren zum umsetzen in eine transformierte darstellung oder zum inversen umsetzen der transformierten darstellung

Publications (2)

Publication Number Publication Date
JP2009513993A JP2009513993A (ja) 2009-04-02
JP4398979B2 true JP4398979B2 (ja) 2010-01-13

Family

ID=34041838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006519811A Expired - Lifetime JP4398979B2 (ja) 2003-07-14 2004-07-05 変換表現に転換するか、または変換表現を逆変換するための装置および方法

Country Status (15)

Country Link
US (1) US8195730B2 (ja)
EP (1) EP1609084B1 (ja)
JP (1) JP4398979B2 (ja)
KR (1) KR100776235B1 (ja)
CN (1) CN100416553C (ja)
AT (1) ATE339728T1 (ja)
AU (1) AU2004300713B2 (ja)
BR (1) BRPI0412166B1 (ja)
CA (1) CA2532288C (ja)
DE (2) DE10331803A1 (ja)
ES (1) ES2273268T3 (ja)
HK (1) HK1085033A1 (ja)
MX (1) MXPA06000528A (ja)
PT (1) PT1609084E (ja)
WO (1) WO2005006624A2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4429316B2 (ja) * 2003-09-29 2010-03-10 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ 時間ドメインから周波数ドメインへ及びそれとは逆にデジタル信号のドメイン変換を実行する装置及び媒体
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
US20090099844A1 (en) * 2007-10-16 2009-04-16 Qualcomm Incorporated Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders
EP2063417A1 (en) * 2007-11-23 2009-05-27 Deutsche Thomson OHG Rounding noise shaping for integer transform based encoding and decoding
KR101067531B1 (ko) 2009-08-27 2011-09-27 성균관대학교산학협력단 양방향 정수 변환 장치 및 방법
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
KR101424372B1 (ko) * 2011-02-14 2014-08-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 랩핑 변환을 이용한 정보 신호 표현
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
US9015042B2 (en) 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
US8838442B2 (en) * 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
US10860683B2 (en) 2012-10-25 2020-12-08 The Research Foundation For The State University Of New York Pattern change discovery between high dimensional data sets
US10089319B2 (en) * 2015-02-20 2018-10-02 International Business Machines Corporation Policy-based, multi-scheme data reduction for computer memory
US10448053B2 (en) * 2016-02-15 2019-10-15 Qualcomm Incorporated Multi-pass non-separable transforms for video coding
KR20190039562A (ko) 2016-09-01 2019-04-12 엘지전자 주식회사 레이어드 기븐스 변환을 이용하여 변환을 수행하는 방법 및 장치
KR101916525B1 (ko) 2016-09-30 2018-11-07 연세대학교 산학협력단 필터 뱅크 멀티캐리어 시스템 및 필터링 방법
KR102615903B1 (ko) 2017-04-28 2023-12-19 디티에스, 인코포레이티드 오디오 코더 윈도우 및 변환 구현들
TWI761551B (zh) * 2017-07-13 2022-04-21 美商松下電器(美國)知識產權公司 編碼裝置、編碼方法、解碼裝置及解碼方法
CN108200436B (zh) * 2017-12-29 2019-06-18 华中科技大学 一种面向线列扫描红外成像非均匀性残差的无损压缩方法
CN108986794B (zh) * 2018-09-19 2023-02-28 河海大学 一种基于幂函数频率变换的说话人补偿方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473744A (en) * 1992-09-28 1995-12-05 Optical Magnetic Imaging Corporation Computer-assisted interactive method and apparatus for making a multi-media presentation
DE69425346D1 (de) * 1993-05-07 2000-08-31 Lg Electronics Inc Verfahren und Vorrichtung zum Umsetzen von Videoformaten
JP3291948B2 (ja) 1994-12-15 2002-06-17 ソニー株式会社 高能率符号化方法及び装置、並びに伝送媒体
JP4092734B2 (ja) * 1997-11-05 2008-05-28 ソニー株式会社 ディジタル信号変換方法およびディジタル信号変換装置
US6360204B1 (en) 1998-04-24 2002-03-19 Sarnoff Corporation Method and apparatus for implementing rounding in decoding an audio signal
US6263019B1 (en) * 1998-10-09 2001-07-17 Matsushita Electric Industrial Co., Ltd. Variable rate MPEG-2 video syntax processor
KR100289621B1 (ko) * 1998-12-29 2001-05-02 이계철 비디오 인코더의 변환 및 역변환 부호화 장치 및 그 방법
WO2001095496A1 (fr) 2000-06-06 2001-12-13 Sakai, Yasue Procede et appareil de compression, procede et appareil d'expansion, systeme de compression expansion
JP2002311997A (ja) 2001-04-16 2002-10-25 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置
DE10129240A1 (de) * 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
JP4429316B2 (ja) * 2003-09-29 2010-03-10 エージェンシー フォー サイエンス,テクノロジー アンド リサーチ 時間ドメインから周波数ドメインへ及びそれとは逆にデジタル信号のドメイン変換を実行する装置及び媒体

Also Published As

Publication number Publication date
ATE339728T1 (de) 2006-10-15
US20060115171A1 (en) 2006-06-01
AU2004300713B2 (en) 2007-11-08
HK1085033A1 (en) 2006-08-11
DE502004001490D1 (de) 2006-10-26
EP1609084A2 (de) 2005-12-28
WO2005006624A2 (de) 2005-01-20
MXPA06000528A (es) 2006-03-30
JP2009513993A (ja) 2009-04-02
CN100416553C (zh) 2008-09-03
US8195730B2 (en) 2012-06-05
BRPI0412166B1 (pt) 2017-06-06
WO2005006624A3 (de) 2005-02-10
EP1609084B1 (de) 2006-09-13
BRPI0412166A (pt) 2006-08-22
AU2004300713A1 (en) 2005-01-20
CN1806239A (zh) 2006-07-19
KR100776235B1 (ko) 2007-11-16
ES2273268T3 (es) 2007-05-01
PT1609084E (pt) 2007-01-31
KR20060034293A (ko) 2006-04-21
CA2532288A1 (en) 2005-01-20
DE10331803A1 (de) 2005-02-17
CA2532288C (en) 2012-10-02

Similar Documents

Publication Publication Date Title
JP4398979B2 (ja) 変換表現に転換するか、または変換表現を逆変換するための装置および方法
KR100778349B1 (ko) 이산값의 시퀀스를 갖는 신호 처리 장치 및 방법
US7873227B2 (en) Device and method for processing at least two input values
KR102101266B1 (ko) 인코딩된 오디오 신호를 디코딩하기 위한 디코더 및 오디오 신호를 인코딩하기 위한 인코더
KR100892152B1 (ko) 시간-이산 오디오 신호를 부호화하기 위한 장치 및 방법그리고 부호화 오디오 데이터를 복호화하기 위한 장치 및방법
JP5269908B2 (ja) 5点dct−ii、dct−iv、およびdst−ivの計算のための高速アルゴリズム、ならびにアーキテクチャ
JP3814611B2 (ja) 時間離散オーディオサンプル値を処理する方法と装置
JP4429316B2 (ja) 時間ドメインから周波数ドメインへ及びそれとは逆にデジタル信号のドメイン変換を実行する装置及び媒体
MXPA06003309A (en) Device and method for processing at least two input values

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091013

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091023

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4398979

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250