JP4398979B2

JP4398979B2 - 変換表現に転換するか、または変換表現を逆変換するための装置および方法

Info

Publication number: JP4398979B2
Application number: JP2006519811A
Authority: JP
Inventors: ラルフガイガー; ゲラルドシューラー; トーマススポラー
Original assignee: フラウンホッファー−ゲゼルシャフトツァフェルダールングデァアンゲヴァンテンフォアシュンクエー．ファオ
Priority date: 2003-07-14
Filing date: 2004-07-05
Publication date: 2010-01-13
Anticipated expiration: 2024-07-05
Also published as: ATE339728T1; US20060115171A1; AU2004300713B2; HK1085033A1; DE502004001490D1; EP1609084A2; WO2005006624A2; MXPA06000528A; JP2009513993A; CN100416553C; US8195730B2; BRPI0412166B1; WO2005006624A3; EP1609084B1; BRPI0412166A; AU2004300713A1; CN1806239A; KR100776235B1; ES2273268T3; PT1609084E

Description

本発明は、オーディオおよび／またはイメージ情報を有する個々の値のための圧縮アルゴリズムに関し、特に変換ベースの符号器、つまり、元のオーディオおよび／またはイメージ信号の量子化／符号化を行うのではなく、量子化／符号化以前にスペクトル域への変換を含む符号器に使用される変換アルゴリズムに関する。

ＭＰＥＧ層３（ＭＰ３）またはＭＰＥＧＡＡＣなどの最新のオーディオ符号化方法は、オーディオ信号のブロック単位の周波数表現を取得するために、いわゆる変形離散コサイン変換（ＭＤＣＴ）などの変換を使用する。一般に、こうしたオーディオ符号器は、時間分離オーディオサンプルのストリームを受信する。オーディオサンプルのストリームは、１０２４個または２０４８個のウィンドウ表示オーディオサンプルのウィンドウ表示ブロックを取得するためにウィンドウ表示される。ウィンドウ表示するためには、異なる窓関数、たとえばサインウィンドウが使用される。

ウィンドウ表示時間分離オーディオサンプルは、次に、フィルタバンクを介してスペクトル表現に転換される。原則として、フーリエ変換、または特定の理由がある場合はフーリエ変換の変形、たとえばＦＦＴまたは上記のＭＤＣＴを使用することができる。次に、フィルタバンクの出力部におけるオーディオスペクトル値のブロックは、必要に応じてさらに処理される。上記のオーディオ符号器では、次にオーディオスペクトル値の量子化が行われ、量子化レベルは、一般に、量子化により導入される量子化ノイズが、心理音響的マスキング閾値未満を保つように、つまり「マスクして除去される」ように選択される。量子化は、損失性の符号化である。データ量をさらに減少させるためには、次に、量子化されたスペクトル値が、たとえばハフマン符号化を介してエントロピー符号化される。スケール係数などの付随情報を追加することにより、ビットストリームマルチプレクサは、エントロピー符号化された量子化スペクトル値からのビットストリームを形成し、このビットストリームは記憶するか、または送信することが可能である。

オーディオ復号器では、ビットストリームは、ビットストリームデマルチプレクサを介して、符号化された量子化スペクトル値および付随情報に分割される。エントロピー符号化された量子化スペクトル値は、量子化スペクトル値を求めるために、最初に復号される。次に、量子化スペクトル値は、量子化ノイズを有する復号スペクトル値を求めるために逆量子化され、量子化ノイズは、心理音響的マスキング閾値未満を保ち、その結果聞き取ることができない。次に、こうしたスペクトル値は、時間離散復号オーディオサンプルを求めるために、合成フィルタバンクを介して時間表現に転換される。合成フィルタバンク内では、この変換アルゴリズムの逆の変換アルゴリズムを使用しなければならない。さらに、ウィンドウ表示は、周波数時間逆変換後に取り消される。

良好な周波数選択を求めるため、最新のオーディオ符号器は、一般に、ブロックオーバラップを使用する。こうした一例を図１２ａに示す。最初に、たとえば２０４８個の時間離散オーディオサンプルが取得され、手段４０２を介してウィンドウ表示される。ウィンドウ表現手段４０２は、２Ｎ個のサンプルのウィンドウ長さを有し、２Ｎ個のウィンドウ表示サンプルのブロックを出力側に提供する。ウィンドウオーバラップを達成するため、手段４０４を介して２Ｎ個のサンプルの第２のブロックを形成する。手段４０４は、単に分かりやすくするために、図１２ａに手段４０２から離して示す。しかし、手段４０４に供給される２０４８個のサンプルは、第１ウィンドウに直接隣接する時間離散オーディオサンプルではなく、手段４０２によりウィンドウ表示されるサンプルの第２の半分を構成し、さらに単に１０２４個の「新しい」サンプルを構成する。オーバラップは、図１２ａに、５０％のオーバラップ度を生じる手段４０６に象徴的に示す。次に、手段４０２により出力される２Ｎ個のウィンドウ表示サンプル、および手段４０４により出力される２Ｎ個のウィンドウ表示サンプルは共に、それぞれ手段４０８および４１０を介してＭＤＣＴアルゴリズムの対象になる。既知のＭＤＣＴアルゴリズムによると、手段４０８は、第１ウィンドウにＮ個のスペクトル値を提供し、手段４１０もＮ個のスペクトル値を提供するが、第２ウィンドウに対して提供し、第１ウィンドウと第２ウィンドウとの間には、５０％のオーバラップが存在する。

図１２ｂに示すように、復号器内では、第１ウィンドウのＮ個のスペクトル値は、逆変形離散コサイン変換を実行する手段４１２に供給される。同じことは、第２ウィンドウのＮ個のスペクトル値についても当てはまる。これらは手段４１４に供給され、手段４１４も逆変形離散コサイン変換を実行する。両方の手段４１２および手段４１４は各々、それぞれ２Ｎ個のサンプルを第１ウィンドウに、２Ｎ個のサンプルを第２ウィンドウに提供する。

図１２ｂのＴＤＡＣ（ＴＤＡＣ＝時間ドメインエイリアシング取消し）により指示される手段４１６では、２個のウィンドウがオーバラップしているという事実を考慮する。特に、インデックスＮ＋ｋを持つことを意味する第１ウィンドウの第２半分のサンプルｙ１は、インデックスｋを持つことを意味する第２ウィンドウの第１半分のサンプルｙ２と合計され、その結果、Ｎ復号時間サンプルが出力側つまり復号器内に生じる。

ａｄｄファンクションとも呼ばれる手段４１６の機能により、図１２ａに略図を示す符号器内で実行されるウィンドウ表示は自動的に実行され、その結果、明示的な「逆ウィンドウ表示」は、図１２ｂに示す復号器内で実行されない。

手段４０２または４０４により実施される窓関数をｗ（ｋ）と呼び、インデックスｋが時間インデックスを表す場合、ウィンドウの重みｗ（ｋ）の二乗を同様にウィンドウの重みｗ（Ｎ＋ｋ）の二乗に加算すると１を生じ、ｋは０〜Ｎ−１になるという条件を満たさなければならない。サイン窓を使用し、そのウィンドウの重みがサイン関数の第１半波長に従う場合、あらゆる角度に関するサインの二乗およびコサインの二乗は共に、１の値を生じるため、この条件は常に満たされる。

浮動小数点を含むサイン窓を考察する場合、時間離散サンプル値の乗算によりウィンドウ表示を行うことは、０〜１８０°の角度のサインは、９０°の角度を除いて整数を生じないため、図１２ａに記載する後続のＭＤＣＴ関数を含むウィンドウ表示法の欠点である。整数の時間離散サンプルがウィンドウ表示である場合でも、浮動小数点の数はウィンドウ表示の後に生じる。

したがって、心理音響的符号器を使用しない、つまり無損失符号化を取る必要がある場合でも、合理的に操作可能なエントロピー符号化を実行できるように、それぞれ手段４０８および４１０の出力部において量子化が必要である。

一般に、無損失オーディオおよび／またはビデオ符号化に関して現在周知されている整数変換は、この場合に使用される変換をギブンズ回転に分離し、リフティングスキームをすべての回転に適用することにより得られる。したがって、あらゆるステップで丸め誤差が導入される。ギブンズ回転の後続の段階では、丸め誤差は蓄積し続ける。結果として生じる概算誤差は、特に、たとえば、ｏｖｅｒｌａｐａｎｄａｄｄを含む周知のＭＤＣＴ（ＭＤＣＴ＝変形離散コサイン変換）の場合のように、たとえば１，０２４スペクトル値を提供する長変換を使用する場合、無損失オーディオ符号器手法に関して特に問題になる。特に、オーディオ信号が一般に、何れにしても非常に低い量のエネルギーを有する比較的高周波数範囲では、概算誤差は実際の信号より急速に大きくなる可能性があり、したがって、この方法は、無損失符号化に関して、特にそれにより得られる符号化効率に関して問題がある。

オーディオ符号化に関しては、整数出力値を生成する変換アルゴリズムを意味する整数変換は、特に、定数成分を考慮しない既知のＤＣＴ−ＩＶに基づき、イメージアプリケーション用の整数変換は、むしろ、特に定数成分の規定を含むＤＣＴ−ＩＩに基づく。こうした整数変換は、たとえばＹ．Ｚｅｎｇ、Ｇ．ＢｉおよびＺ．Ｌｉｎの「リフティング因数分解に基づく整数正弦波変換」（Ｉｎｔｅｇｅｒｓｉｎｕｓｏｉｄａｌｔｒａｎｓｆｏｒｍｓｂａｓｅｄｏｎｌｉｆｔｉｎｇｆａｃｔｏｒｉｚａｔｉｏｎ）、Ｐｒｏｃ．ＩＣＡＳＳＰ‘０１、２００１年５月、ｐ１，１８１〜１，１８４、Ｋ．ＫｏｍａｔｓｕおよびＫ．Ｓｅｚａｋｉの「可逆離散コサイン変換」（ＲｅｖｅｒｓｉｂｌｅＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）、Ｐｒｏｃ．ＩＣＡＳＳＰ、１９９８年、第３巻、ｐ１，７６９〜１，７７２、Ｐ．ＨａｏおよびＱ．Ｓｈｉの「可逆整数マッピングのためのマトリクス因数分解」（Ｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎｓｆｏｒｒｅｖｅｒｓｉｂｌｅｉｎｔｅｇｅｒｍａｐｐｉｎｇ）、ＩＥＥＥトランザクション信号処理（ＩＥＥＥＴｒａｎｓ．ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ）、信号処理（ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ）、第４９巻、ｐ．２，３１４〜２，３２４、並びにＪ．Ｗａｎｇ、Ｊ．ＳｕｎおよびＳ．Ｙｕの「整数から整数への１−ｄおよび２−ｄ変換」（１−ｄａｎｄ２−ｄＴｒａｎｓｆｏｒｍｓｆｒｏｍｉｎｔｅｇｅｒｓｔｏｉｎｔｅｇｅｒｓ）、Ｐｒｏｃ．ＩＣＡＳＳＰ’０３、香港、２００３年４月に記載されている。

上記で説明したとおり、本明細書に記載する整数変換は、変換をギブンズ回転に分離し、既知のリフティングスキームをギブンズ回転に適用することに基づき、蓄積する丸め誤差の問題を伴う。これは、特に、１回の変換の範囲内で、つまりリフティングステップを行うごとにその後、数回丸めを行う必要があり、したがって多くのリフティングステップに関連し、丸めを特に頻繁に行う必要があるという事実による。上記のとおり、丸めはリフティングステップごとにその後行われて、次のリフティングステップが行われるため、特に比較的不経済な処理において、誤差の蓄積が生じる。

Ｙ．Ｚｅｎｇ、Ｇ．ＢｉおよびＺ．Ｌｉｎ著「リフティング因数分解に基づく整数正弦波変換」（Ｉｎｔｅｇｅｒｓｉｎｕｓｏｉｄａｌｔｒａｎｓｆｏｒｍｓｂａｓｅｄｏｎｌｉｆｔｉｎｇｆａｃｔｏｒｉｚａｔｉｏｎ）、Ｐｒｏｃ．ＩＣＡＳＳＰ‘０１、２００１年５月、ｐ１，１８１〜１，１８４Ｋ．ＫｏｍａｔｓｕおよびＫ．Ｓｅｚａｋｉ著「可逆離散コサイン変換」（ＲｅｖｅｒｓｉｂｌｅＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）、Ｐｒｏｃ．ＩＣＡＳＳＰ、１９９８年、第３巻、ｐ１，７６９〜１，７７２Ｐ．ＨａｏおよびＱ．Ｓｈｉ著「可逆整数マッピングのためのマトリクス因数分解」（Ｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎｓｆｏｒｒｅｖｅｒｓｉｂｌｅｉｎｔｅｇｅｒｍａｐｐｉｎｇ）、ＩＥＥＥトランザクション信号処理（ＩＥＥＥＴｒａｎｓ．ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ）、信号処理（ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ）、第４９巻、ｐ．２，３１４〜２，３２４Ｊ．Ｗａｎｇ、Ｊ．ＳｕｎおよびＳ．Ｙｕ著「整数から整数への１−ｄおよび２−ｄ変換」（１−ｄａｎｄ２−ｄＴｒａｎｓｆｏｒｍｓｆｒｏｍｉｎｔｅｇｅｒｓｔｏｉｎｔｅｇｅｒｓ）、Ｐｒｏｃ．ＩＣＡＳＳＰ‘０３、香港、２００３年４月

本発明の目的は、個々の値を変換表現に転換し、変換表現を対応して逆転換するためのより効率的かつ正確なコンセプトを提供することである。

この目的は、請求項１による転換装置、請求項１７による転換方法、請求項１９による逆転換装置、請求項２１による逆転換方法、または請求項２４によるコンピュータプログラムにより達成される。

本発明のさらに他の目的は、転換のための本発明のコンセプト、および逆転換のための本発明のコンセプトをそれぞれ含む前方変換装置および後方変換装置を提供することである。

この目的は、請求項１６による前方変換装置、請求項１８による前方変換方法、請求項２２による後方変換装置、は請求項２３による後方変換方法、または請求項２４によるコンピュータプログラムにより達成される。

本発明は、一次元リフティングスキームを多次元リフティングスキームに拡張し、少なくとも２つのこうしたリフティングステップをカスケード式に実行することにより、一方で丸め誤差を減少させ、他方で計算効率を改善するという知識に基づく。したがって、本発明によると、オーディオおよび／またはイメージ情報を含む値の少なくとも２つのブロックであって、各々任意の変換アルゴリズムに提出されるブロックが必要である。本発明によると、丸めは、完全な変換アルゴリズムを実行した後にのみ実行される。これは、第一に、たとえば、それぞれ第１変換のスペクトル値などの出力結果値が丸められ、第２変換の出力結果が丸められることを意味する。したがって、変換の範囲内で丸める必要はない。したがって、存在し、自由に使用可能であって、たとえばプログラムコードの形態の任意の既存の、特に既にテストされた変換規則を第２変換規則として使用することが可能であり、実際の変換に干渉することにより、先行技術のように変換自体を個々の回転に分離する必要はない。

本発明によると、第２ブロックは、第２ブロックを第１ブロックの変換表現と合計することにより、第１ブロックの変換表現のためのキャリヤとして使用される。さらに、本発明によると、第１ブロックは、既に第１ブロックのスペクトル値を含む第２ブロックの変換表現を第１ブロックから減算することにより、第２ブロックの変換表現のキャリヤとして使用される。

本発明によると、丸めは、単にそれぞれ第１および第２変換の後に実行され、丸められた値は、それぞれ加算的または減算的に対応するキャリヤ値に重畳されため、変換で実行されたステップの取消しは、逆変換においてデータを損失せずに得られ、その結果、整数転換アルゴリズムが生じ、このアルゴリズムは、一方では計算効率的な方法で実施することができ、他方では、丸め誤差の蓄積は生じない。これは、完全な第１または第２変換後にのみ実行され、その結果、一方では丸め誤差の蓄積が排除され、他方では、丸めステップの数が、変換自体を回転に分離する場合に比べて著しく減少し、丸めは、各々のリフティングステップ自体の後に、実際の変換アルゴリズムの範囲内で実行されるという事実による。

丸めは変換後に実行すれば良いため、さらに従来の非整数変換規則を使用することができる点は、本発明の利点である。

さらに、本発明は、高速アルゴリズムを使用することができるという事実の点で有利であり、エフォート０はＮ²に従って増加せず、単にＮｌｏｇＮで増加する。これは、変換長を意味する値Ｎはオーディオ信号では比較的大きく、上記の既知のオーディオ圧縮方法ではほぼ１，０２４の値であるため、オーディオ信号の場合に特に重要である。

既知の浮動小数点ＭＤＣＴ変換の整数バージョンを使用する本発明の好ましい実施態様では、既知のＤＣＴ−ＩＣ変換は、第１および第２変換の変換規則と同じ変換マトリックスを含む変換規則である。さらに、ｏｖｅｒｌａｐａｎｄａｄｄを含むＭＤＣＴに対応する完全整数変換を求めるには、一般的なＭＤＣＴのウィンドウ表示を時間ドメインエイリアシング取消し機能（ＴＤＡＣ機能）と結合し、それをギブンズ回転により表現して、ＭＤＣＴの完全整数バージョンを達成することが好ましく、ギブンズ回転は、やはり、リフティングスキームにより整数様式で計算することができる。

本発明の転換装置に供給される個々の値の２つのブロックは、最新ビデオ圧縮アルゴリズムにおける予測後の時間分離オーディオサンプルまたは離散イメージサンプルもしくはイメージ残留値のオーバラップウィンドウ表示ブロックのギブンズ回転値に対応し、ＤＣＴ−ＩＶアルゴリズムは、オーディオデータの場合の変換アルゴリズムとして好ましい。復号器側では、ＤＣＴ−ＩＶアルゴリズムは、やはり周波数−時間変換装置として好ましく、やはり回転段階が続き、逆リフティングスキームを実行して、符号器側で導入されたＮ丸め、つまり無損失様式で時間−周波数変換で導入される丸めを検索する。

本発明の好ましい実施態様について、添付の図面に関して以下で説明する。
図１は、本発明の転換装置のブロック図を示す。
図２は、本発明の逆転換装置のブロック図を示す。
図３は、本発明の好ましい実施態様による転換装置のブロック図を示す。
図４は、本発明の好ましい実施態様による逆転換装置を示す。
図５は、本発明に適用される値の２つの後続のブロックの変換表現を示す。
図６は、前方変換を含む多次元リフティングステップの詳細な表現を示す。
図７は、後方変換マトリックスを含む多次元逆リフティングステップの表現を示す。
図８は、長さＮのＤＣＴ−ＩＶを長さＮ／２の２つのＤＣＴ−ＩＶに分離するための本発明の表現を示す。
図９は、時間離散オーディオサンプルを処理して、整数スペクトル値を決定することが可能な整数値を求めるのに好ましい手段のブロック図を示す。
図１０は、ギブンズ回転および２つのＤＣＴ−ＩＶ動作におけるＭＤＣＴおよび逆ＭＤＣＴの分離の略表現を示す。
図１１は、５０％のオーバラップを含むＭＤＣＴを回転およびＤＣＴ−ＩＶ動作に分離することを説明する表現を示す。
図１２ａは、ＭＤＣＴおよび５０％のオーバラップを含む既知の符号器の略ブロック図を示す。
図１２ｂは、図１０ａにより生成された値を復号化するための既知の復号器のブロック図を示す。

図１は、個々の値を、整数値を含む変換表現に転換するための本発明による装置を示す。個々の値は、第１入力部１００ａおよび第２入力部１００ｂを介して、本発明の装置に供給される。個々の値の第１ブロックは、入力部１００ａを介して供給され、個々の値の第２ブロックは、入力部１００ｂを介して供給される。個々の値は、それぞれオーディオデータまたはイメージデータおよびビデオデータを表す。以下に説明するとおり、個々の値の第１ブロックおよび個々の値の第２ブロックは、実際上、時間的に連続するオーディオサンプルの２つのブロックを含む。個々の値の第１および第２ブロックは、異なる符号化などにおける予測または差分値の後のそれぞれ個々の値により表現される２つのイメージおよび残留値も含む。別法によると、個々の値の２つのブロックは、個々の値の第１ブロックおよび第２ブロックが、実際上ウィンドウ表示サンプルからギブンズ回転により生成されたＭＤＣＴの整数インプリメンテーションなどの前処理を施すことができたはずである。したがって、個々の値の第１および第２ブロックは、回転、置換、＋／−バタフライ演算、拡大縮小などの何らかの処理により、元のオーディオデータまたはイメージデータから導くことができる。さらに、個々の値の第１および第２ブロックは、それぞれオーディオ情報およびイメージ情報を含むが、これらの情報は、直接的にオーディオサンプルまたは離散イメージ値ではない。

個々の値の第１ブロックは、図１に示すように、入力部１００ａを介して第１変換規則を使用することにより、個々の値の第１ブロックを処理して、手段１０２の出力部において変換値の第１ブロックを求めるための手段１０２に供給される。変換値の第１ブロックは一般に整数ではないが、フーリエ変換、ラプラス変換、ＦＦＴ、ＤＣＴ、ＤＳＴ、ＭＤＣＴ、ＭＤＳＴまたはその他の何らかの変換、たとえば任意の基礎関数を含むウェーブレット変換など、何らかの変換規則により一般に得られるように不動少数点値を含む。変換値の第１ブロックは、変換値の第１ブロックを丸めて、丸められた変換値の第１ブロックを出力側において求めるための手段１０４に供給される。丸め手段１０４は、浮動少数点値に応じて実行されるそれぞれ切り捨て、または切り上げもしくは切り下げによる丸めなどの何らかの丸めを実行するように形成される。

したがって、手段１０４により実行される丸め規則は、丸められた変換値の第１ブロックが、やはり、手段１０４が使用する丸め規則により精度が決定される単に整数値を有するという事実に関連がある。丸められた変換値の第１ブロックは合計手段１０６に供給され、個々の値の第２ブロックは、合計値の第２ブロックを求めるために第２入力部１００ｂに適用される。オーディオ信号の実施例を考察する場合、第１ブロックからのスペクトル値が、丸められた変換値の第１ブロックの丸められた変換値に加算され、手段１０６により個々の値の第２ブロックからの時間値に加算されると考えることができる。第２ブロックの個々の値が、たとえば電圧値として存在する場合、丸められた変換値の第１ブロックも電圧の振幅、つまり単位Ｖの値として存在することが推奨される。この場合、合計する時の単位の問題はない。しかし、当業者には、丸められた変換値の第１ブロックおよび個々の値の第２ブロックの両方がたとえば単位を持たないという場合、単位の標準化は、それぞれ丸められた変換値の第１ブロックおよび個々の値の第２ブロックを使って行うことができることが分かる。

合計値の第２ブロックは、変換値の第２ブロックを得るために第２変換を使用することにより合計値の第２ブロックを処理するための手段１０８に供給される。手段１０２で使用される変換規則が、たとえば時間−周波数変換規則である場合、ブロック１０８で使用される第２変換規則は、たとえば周波数−時間変換規則である。これらの関係は逆でも良いので、個々の値の第１および第２ブロックは、たとえばスペクトル値であり、時間値は、変換規則に基づく処理のための手段１０２により得られ、やはりスペクトル値は、逆変換規則を介した処理のための手段、つまり手段１０８により得られる。したがって、第１および第２変換規則は、第１および第２変換規則は前方変換規則または後方変換規則で良く、逆変換規則は、それぞれ後方変換規則および前方変換規則である。

変換値の第２ブロックは、図１に示すように、丸められた変換値の第２ブロックを得るために、丸め手段１１０に供給される。個々の値の第１ブロックから減算するために、この第２ブロックの丸められた変換値は次に、最終的に減算手段１１２に供給され、丸められた変換値の第２ブロックが、第１入力部１０８ａを介して供給されて変換表現の整数出力値のブロックが得られ、このブロックは出力部１１４に出力することができる。手段１０２で既に使用された変換規則であるか、またはその変換規則とは異なる任意の第３変換規則を使用して変換表現の整数出力値のブロックを処理し、次に、変換出力値のブロックを丸めて、丸められた変換出力値のブロックを求め、次に、丸められた変換出力値のブロックと合計値の第２ブロックを合計することにより、変換表現の整数出力値のさらに他のブロックを求めることができ、これは、出力部１１４に適用される整数出力値のブロックを含む個々の値の第１および第２ブロックの完全な変換表現を提供する。

しかし、変換表現の整数出力値のブロックが出力部１１４に適用される最後の３つの処理、丸めおよび合計ステップがない場合でも、全体の変換表現の一部、つまり、たとえば第１の半分はすぐに求めることができ、その結果、この一部が逆処理の対象である場合、個々の値の第１および第２ブロックの再計算が可能になる。

ここで、変換規則に応じて、第１、第２、および必要な場合、第３変換規則は同じで良い。これは、たとえばＤＣＴ−ＩＶの場合である。ＦＦＴを第１変換規則として使用する場合、ＦＦＴと同じではないＩＦＦＴは、第２（逆）変換規則として使用することができる。

計算上の理由から、マトリックス形態の変換規則を提供することが好ましく、これは、第１ブロックの個々の値の数が第２ブロックの個々の値の数に等しく、第１ブロックの個々の値の数および第２の個々の値の数がそれぞれＮに等しい場合、二乗Ｎ×Ｎマトリックスである。

本発明の好ましい実施態様では、丸め手段１０４および１１０は、丸められた結果を提供する丸め機能により丸めるように構成され、その精度は、図１に示す機能を実行するコンピュータに固有の機械精度より低い。この丸め機能によると、この丸め機能は、単なる１つの好ましい実施態様では、非整数を次に大きいかまたは小さい整数にマッピングすることに注目するべきである。丸め機能は、丸め機能が、丸められる数の精度の低下を実行する限り、数１７．７など、その他の整数を数１０または数２０にもマッピングする。上記の実施例では、丸められない数は、小数点の後に１桁がある数であり、丸められた数は、小数点の後に桁がない数である。

第１変換規則を使用して処理するための手段１０２、および第２変換規則を使用して処理するための手段１０８は、図１に別個の手段として示されているが、特定の実行では、単に１個の変換機能ユニットが存在することが可能であり、このユニットは、特定のシーケンス制御により制御され、先ず、個々の値の第１ブロックを転換し、次に、アルゴリズムの個々の時間において合計値の第２ブロックを逆転換する。これで、第１および第２変換規則は同じになるであろう。同じことは、２個の丸め手段１０４、１１０に適用される。これらも、別個の手段として提供されないが、丸め機能ユニットにより実行することができ、このユニットは、やはり、アルゴリズムの要件に応じてシーケンス制御により制御され、先ず変換値の第１ブロックを丸め、次に変換値の第２ブロックを丸める。

本発明の好ましい実施態様では、個々の値の第１ブロックおよび個々の値の第２ブロックは、以下で説明するとおり、図９のブロック２８の出力部で得られるので、整数ウィンドウ表示サンプルである。次に、図９のブロック１４の整数ＤＣＴは、図１に示す整数アルゴリズムにより実行され、その結果、変換表現は、図９に関連するオーディオ信号の実施例では、図９に示す装置の出力部３０における整数スペクトル値を表現する。

以下では、図２に関して、図１に対応する逆変換手段が、図１のブロック１１２の出力部にある整数出力値のブロックから離れて示され、合計値の第２ブロックも、図１の手段１０６の出力部で使用される。以下でさらに詳細に説明する図４に関連して、これは、単にブロック１５０および１３０は存在するが、変換ブロック１２４は存在しないという場合に対応する。

図２は、図１の出力部１１４および合計値の第２ブロックで得られるように、変換表現の整数出力値のブロックを逆転換するための本発明による装置を示す。合計値の第２ブロックは、図２に示す逆転換装置の入力部１２０に供給される。変換表現の出力値のブロックは、逆転換装置の他の入力部１２２に供給される。

合計値の第２ブロックは、符号化時に最後に使用した変換規則が第２変換規則だった場合、第２変換規則を使用してこのブロックを処理するための手段１３０に供給される。出力側では、手段１３０は、変換値の第１ブロックを供給し、このブロックは丸め手段１３２に供給されて、やはり、丸められた変換値の第１ブロックを出力側で生成する。次に、図２の装置の第１出力部１４９において個々の値の第１ブロックを得るために、丸められた変換値の第１ブロックは、手段１３４により変換表現の出力値のブロックから減算される。

個々の値の第１ブロックは、手段１５０の出力部において変換値の第２ブロックを得るために、第１変換規則を使用してこのブロックを処理するための手段１５０に供給される。転換して減算された値のこの第２ブロックは、丸められた変換値の第２ブロックを得るために、やはり手段１５２において丸められる。次に、丸められた変換値のこの第２ブロックは、出力側の出力部１３６において個々の値の第２ブロックを得るために、入力部１２０を介して入力されて入力側に供給された合計値の第２ブロックから減算される。

第１、第２および第３変換規則の関係、並びに共通の機能ユニットおよび対応するシーケンス制御装置／一時記憶装置による図２の個々の機能ブロックの特有の実行に関して、図１に関する説明を参照する。

以下では、図３に関して、一般的に図１に示す変換表現に転換するための装置の好ましい実施態様について説明する。図１の実施態様は、合計値の第２ブロックから整数出力値のさらに他のブロックを生成するために、図１に比べてさらに他の変換／丸めを含む。

第１入力部１００ａは、個々の値の第１ブロックのＮ値を入力するためのＮ入力ラインＸ０、．．．、ＸＮ−１を含む。第２入力部１００ｂも、個々の値の第２ブロックのＮ値ＸＮ、．．．、Ｘ２Ｎ−１を入力するためのＮラインを含む。図１の手段１０２は、ＤＣＴ−ＩＶ変換器として図３に示す。ＤＣＴ変換器１０２は、Ｎ入力値からＮ出力値を生成するように形成され、これらの値は各々、図３に示すように、「［．］」で指示される丸め仕様により、手段１０４によって丸められる。合計手段１０６は、値の加算が行われるように示されている。これは、インデックス０を含む手段１０２の出力値が、インデックスＮを持つ個々の値の第２ブロックの第１値と合計されることを意味する。したがって、一般に、序数ｉを含む丸められた変換値の第１ブロックの値は、丸め手段１０４の出力部において、序数Ｎ＋ｉであって、ｉが０〜Ｎ−１の連続するインデックスである序数と個々に合計される。

第２変換規則を使用して処理するための手段１０８は、ＤＣＴ−ＩＶ変換器としても示されている。図３に示す好ましい実施態様では、減算手段１１２も、値の減算を実行するように形成され、この場合、ラウンダー１１０の出力値、つまり丸められた変換値の第２ブロックの値は、個々の値の第１ブロックから個々に減算される。図３に示す実施態様では、対応する減算を実行することが好ましく、この場合、第２ブロックの値は、Ｎ＋ｉの序数であり、やはり０〜Ｎ−１である序数ｉを持つ第１ブロックの値から減算される。別法によると、その他の加算／減算を行うことができ、たとえば、序数Ｎ−１を持つブロックの値は、逆転換で相応に考えられる限り、序数Ｎ−１を持つ他のブロックの値から減算される。

出力側では、減算手段１１２は、変換表現の整数出力値のブロック、つまり変換表現の整数出力値ｙ０〜ｙＮ−１の整数出力値をすぐに供給する。任意に望ましい場合、変換表現の残りの整数出力値、つまりさらに他のブロックｙＮ〜ｙ２Ｎ−１を求めるには、出力部１１４に適用される変換表現の整数出力値のブロックは、前方変換器１４０による第３変換規則を使用して変換が行われ、前方変換器１４０の出力値は、やはり、丸め手段１４２により示すように丸められ、図３に参照符号１４４で表すように加算器１０６の出力部において、これらの値が合計値の第２ブロックに加算される。加算器１４４の出力値は、ｙＮ〜ｙ２Ｎ−１で指示される変換表現の整数出力値のさらに他のブロック１４６を表す。

以下では、好ましい実施態様による変換表現の逆転換のための本発明による装置について、図４に関して説明する。図３の装置が実行する動作は、図４に示す装置により、無損失状態で逆転させることが可能である。図４は、合計値の第２ブロックを変換出力値の他のブロックから生成するための追加の変換／丸め段階を除いて図２に対応し、合計値の第２ブロックは、図２に示す実施態様では入力部１２０に供給される。加算機能は、減算機能によりそれぞれ逆転される点に注目するべきである。さらに、加算器／減算器の対（図３の１４４および図４の１２８）には、符号が逆転した入力量を供給することも可能であり、したがって、加算器１４４は、図示の場合と対照的に負の符号を持つ入力の群が提供される場合、実際上次に加算動作を実行すると思われる対応物（図４の１２８）で考える限り、実際上は減算動作を実行する点に注目するべきである。

図４に示す減算器１２８、加算器１３４およびさらに他の減算器１５４は、やはり個々の値の加算／減算を実行するように形成され、やはり、図３に関して説明した同じ序数処理が使用される。図示のとおり、別の序数の使用方法を図３で使用する場合、図４で相応に考えられるであろう。

ｘ０〜ｘＮ−１で指示される個々の値１３６の第１ブロックは、減算器１３４の出力部に既に存在する。逆変換表現の残りの部分も得るため、個々の値の第１ブロックは、第１変換規則で動作する変換器１５０に供給され、その出力側の値はラウンダー１５２により丸められ、減算器１２８の出力部で減算された値の第２ブロックから減算され、ｘＮ、．．．、ｘ２Ｎ−１で指示される個々の値１５６の第２ブロックが最終的に得られる。

以下では、図５〜図８に関して、図１〜図４に示す本発明の装置の数学的背景を説明する。それぞれ転換および逆転換のための本発明による図示の装置により、無損失オーディオ符号化のための整数変換方法で、概算誤差が減少する方法が提供される。上記のとおり、計算の努力は、リフティングスキームをすべてのギブンズ回転に適用する公知の方法はもはや使用されないという点でも考慮され、こうした方法では、自明な合計差バタフライ演算が常に生じる。こうしたバタフライ演算は、再現される変換の本来の非整数バージョンと対照的に、計算エフォートを著しく増加させる。

一般に、リフティングスキームは、ギブンズ回転の反転可能な整数概算を求めるために使用される。

この整数概算は、加算するごとにその後、つまりリフティングステップごとにその後丸め機能を使用して得られる。

リフティングスキームは、特定の拡大縮小動作の反転可能な整数概算に使用することも可能である。専門の出版物であるＲ．ＧｅｉｇｅｒおよびＧ．Ｓｃｈｕｌｌｅｒの「整数低遅延およびＭＤＣＴフィルタバンク」（ＩｎｔｅｇｅｒｌｏｗｄｅｌａｙａｎｄＭＤＣＴｆｉｌｔｅｒｂａｎｋｓ）Ｐｒｏｃ．ｏｆｔｈｅＡｓｉｌｏｍａｒＣｏｎｆ．ｏｎＳｉｇｎａｌｓ、ＳｙｓｔｅｍｓａｎｄＣｏｍｐｕｔｅｒｓ、２００２年では、１に等しい決定因子を持つ２×２拡大縮小マトリックスの以下のリフティング分離が図示および説明されている。

本発明によると、一次元である、つまり単に２×２拡大縮小マトリックスに関連するリフティング分離は、多次元の事例に拡張される。個々には、前方程式のすべての値はｎ×ｎマトリックスに置き換えられ、ここで、ブロックの個々の値の数を意味するｎは、２より大きいかまたは２に等しい。したがって、結果は、好ましくは反転可能な何らかのｎ×ｎマトリックスＴの場合、２ｎ×２ｎブロックマトリックスへの以下の分離が可能であり、Ｅｎはｎ×ｎ単位のマトリックスを表す。

−１を含む置換または乗算などの単純な動作は別として、この分離の３つのブロックはすべて、以下の一般的な構造を有する。

この２ｎ×２ｎブロックマトリックスでは、発明により一般化したリフティングスキームを使用することができ、これは、後で多次元リフティングとも呼ぶ。

値ｘ＝（ｘ０、．．．、ｘ２ｎ−１）のベクトルでは、このブロックマトリックスの適用により、以下の方程式が得られる。

ベクトルが前方程式の右辺上にあり、その次元、つまりラインの数が２ｎに等しい点に注目するべきである。最初のｎ成分、つまり０〜ｎ−１の成分は、ｘ０〜ｙｎ−１に対応する。第２のｎ成分、つまり前方程式の右辺に生じるベクトルの第２の半分は、個々の値の第２ブロックの合計、つまりＸｎ、．．．、Ｘ２ｎ−１に等しいが、次に、図１〜図４の変換マトリックスに相当するマトリックスＡの乗算および個々の値の第１ブロックＸ０、．．．、Ｘｎ−１と合計される。変換マトリックスは、それぞれ第１、第２および第３変換規則を表す。

以下の形式の２×２マトリックスを含む一般的なリフティングスキームと同様に、

これらの２ｎ×２ｎマトリックスは、以下のとおり、変換Ｔの反転可能な整数近似に使用することができる。整数入力値（Ｘ０、．．．、Ｘ２ｎ−１）の場合、浮動小数点出力値（ｙ０〜ｙｎ−１）＝Ａ・（Ｘ０、．．．、Ｘｎ−１）は、整数値（Ｘｎ、．．．、Ｘ２ｎ−１）に加算される前に整数値に丸められる。ブロックマトリックスの逆数は以下を生じる。

したがって、このプロセスは、単に同じマトリックスＡおよび同じ丸め機能を使用し、次に、前方処理における加算ではなく、結果として得られた値を減算することにより、誤差がないように反転させることができる。こうした前方処理を図６に示し、後方処理を図７に示す。図６の変換マトリックスは、図７の変換マトリックスと同じである点に注目するべきであり、これは、実行の容易さの理由で好ましい。

値（Ｘ０、．．．、Ｘｎ−１）は、図６に示す前方ステップで修正されない場合、逆ステップ、つまり図７の後方ステップのためにまだ存在する。マトリックスＡに特定の制限はない点に注目するべきである。したがって、この値は、必ずしも反転させる必要はない。

既知のＭＤＣＴの反転可能な整数近似を求めるため、ＭＤＣＴは、ウィンドウ表示段階である第１段階でギブンズ回転、および後続のＤＣＴ−ＩＶ段階に分離される。この分離は、図１０に示して以下で説明され、ドイツ特許公開公報第１０１２９２４０Ａｌ号に記載されている。

ＤＣＴ−ＩＶがギブンズ回転のいくつかの段階に分離される先行技術と対照的に、本発明によると、変換自体は残され、その後丸められる。

したがって、当技術分野で周知のように、ＤＣＴ−ＩＶの整数近似は、リフティングベースのギブンズ回転のいくつかの段階で実行される。ギブンズ回転の数は、基礎となる使用された高速アルゴリズムにより決定される。こうして、ギブンズ回転の数は、長さＮの変換の場合、０（ＮｌｏｇＮ）により与えられる。すべてのＭＤＣＴ分離のウィンドウ表示段階は、Ｎ／２ギブンズ回転または３Ｎ／２丸めステップのみから成る。したがって、特に、オーディオ符号化用途に使用される変換長などの高変換長では（たとえば、１，０２４）、ＤＣＴ−ＩＶの整数近似は近似誤差の主な誘因である。

本発明の方法は、上記の多次元リフティングスキームを使用する。その結果、ＤＣＴＩＶにおける丸めステップの数は３Ｎ／２に減少し、ウィンドウ表示段階の丸めステップの数に等しくなることを意味し、従来のリフティングベースの方法における約２Ｎｌｏｇ２Ｎ丸めステップと対照的である。

本発明によると、ＤＣＴ−ＩＶは、信号の２つのブロックに同時に適用される。その１つの可能性を図５に示し、この場合、単純に、たとえば時間的に連続するサンプルの２つのブロックがＤＣＴ−ＩＶの対象になる。２つの変換の対象になる２つのブロックは、マルチチャネル信号の２つのチャネルのサンプルでも良い。

上記の多次元リフティング方程式の分離は、Ｎ×Ｎマトリックスとしても考えられる変換規則に適用される。特にＤＣＴ−ＩＶでは、逆数はやはりＤＣＴ−ＩＶであり、図５に示すコンセプトに関して以下の分離が生じる。

−１を含む乗算の置換は、個々のブロックマトリックスで抽出されるため、以下のコンテキストが生じる。

したがって、信号の２つのブロック、つまり個々の値の２つのブロックに対する変換の適用は、好ましくは３つの多次元リフティングステップで得ることができる。

上記の方程式は、本発明の好ましい実施態様に関して、図３にグラフで示す。逆転換は、上記で述べたとおり、相応して図４に示されている。

本発明の方法により、長さＮの２つのＤＣＴ−ＩＶ変換を反転可能な状態で実行することができ、この場合、３Ｎ丸めステップのみが必要であり、これは、変換ごとに３Ｎ／２丸めステップを意味する。

３つの多次元リフティングステップにおけるＤＣＴ−ＩＶは、任意の実行、たとえば浮動小数点または固定小数点ベースの実行を有することが可能である。ＤＣＴ−ＩＶは、反転可能である必要はない。ＤＣＴ−ＩＶは、前方および後方プロセスの両方において、正確に同じ方法で実行される必要があるだけである。結果として、このコンセプトは、現在のオーディオ符号化用途に使用されるように、たとえば１，０２４などの高変換長に適する。

全体的な計算の複雑さは、２つのＤＣＴ−ＩＶ変換の非整数実行の計算の複雑さの１．５倍に相当する。こうした計算の複雑さは、従来のＤＣＴ−ＩＶの約２倍複雑な従来のリフティングベースの整数実行の場合より著しく低い。なぜなら、これらの実行は、２００１年、ニューヨークにおける第１１１回ＡＥＳ会議におけるＲ．Ｇｅｉｇｅｒ、Ｔ．Ｓｐｏｒｅｒ、Ｊ．ＲｏｌｌｅｒおよびＫ．Ｂｒａｎｄｅｎｂｕｒｇの「整数変換に基づくオーディオ符号化」（ＡｕｄｉｏＣｏｄｉｎｇｂａｓｅｄｏｎＩｎｔｅｇｅｒＴｒａｎｓｆｏｒｍｓ）に記載されているように、使用するリフティングスキームに基づく自明な＋／−バタフライ演算を使用する必要があるからである。

図示の方法は、少なくとも２つのＤＣＴ−ＩＶ変換を同時に、つまり１回の転換内で計算する。これは、たとえば、オーディオ信号の２つの連続するブロック、またはイメージ信号の２つの連続するイメージに関するＤＣＴ−ＩＶ変換を計算して行われる。２チャネルステレオ信号の場合、これは、転換動作および逆転換動作における左右のチャネルのＤＣＴ−ＩＶをそれぞれ計算して達成される。第１バージョンは、あるブロックの付加的な遅延をシステム内に導入する。第２バージョンは、それぞれステレオチャネルの場合、および一般にマルチチャネル信号の場合に可能である。

別法によると、両方の選択肢が望ましくないが、Ｎ値という一般的なブロック処理長さを維持しなければならない場合、長さＮのＤＣＴ−ＩＶは、長さＮ／２の２つのＤＣＴ−ＩＶ変換に分離することが可能である。このコンテキストでは、この分離が行われるＹ．Ｚｅｎｇ、Ｇ．ＢｉおよびＺ．Ｌｉｎの「リフティング因数分解に基づく整数正弦波変換」（Ｉｎｔｅｇｅｒｓｉｎｕｓｏｉｄａｌｔｒａｎｓｆｏｒｍｓｂａｓｅｄｏｎｌｉｆｔｉｎｇｆａｃｔｏｒｉｚａｔｉｏｎ）、Ｐｒｏｃ．ＯＣＡＳＳＰ‘０１、２００１年５月、ｐ１，１８１〜１，１８４を参照する。長さＮ／２の２つのＤＣＴ変換のほかに、ギブンズ回転のいくつかの追加の段階が必要である。さらに、このアルゴリズムでは、ブロックマトリックス

つまり、Ｎ／２＋／−バタフライ演算、Ｎ／２ギブンズ回転を含むブロック対角マトリックス、およびさらにいくつかの置換マトリックスが使用される。Ｎ／２ギブンズ回転のこれらの付加的な段階を使用することにより、多次元リフティング法は、長さＮの１つのＤＣＴ−ＩＶのみの計算に使用することもできる。このアルゴリズムの基本的な構造は、実際の転換段階から離して図８に示され、実際の転換段階では、長さＮ／２を有する２つのＤＣＴ−ＩＶ変換が使用され、第１のバタフライ段階は、一般にＮ／２の長さを有する個々の値の第１および第２ブロックを計算するために存在する。出力側では、回転段階は、図８および図５の入力側および出力側のインデックスの比較、変換表現の出力値のブロック、および各々が現在単にＮ／２値を有する変換表現の出力値のさらに他のブロックから分かるとおり、図５のＤＣＴ−ＩＶ動作の出力値に等しい出力値ｙ０〜ｙＮ−１を求めるために提供される。

これまで、以下の形式のブロックマトリックスに対する多次元リフティングの単なる適用について説明してきた。

その他のブロックマトリックスを多次元リフティングステップに分離することも可能である。たとえば、以下の分離を使用すると、多次元リフティングの３つの段階により、ある段階とノルム＋／−バタフライ演算およびＤＣＴ−ＩＶ変換の２つのブロックとの組合せを実行とすることができる。

前方程式から、前方程式の左括弧に使用される第１変換規則、および前方程式の中間括弧に使用される第２変換規則、および前方程式の最後の括弧に使用される第３変換規則は同じである必要はないことが明らかになる。さらに、前方程式から、単に主要対角要素が占有するブロックマトリックスを分離できるだけではなく、本発明により、完全に占有されたマトリックスを処理できることが明らかになる。さらに、本発明は、変換表現に対する転換に使用される変換規則は、互いに同じである必要があり、または互いに関連がある必要があるという事実に限定されず、その結果、たとえば第２変換規則は第１変換規則の逆変換規則であるという点に注目するべきである。一般に、３つの異なる変換規則は、逆表現で考えられる限り、使用することができる。

このコンテキストでは、再び図３および図４を参照する。個々の値を変換表現に転換する場合、手段１０２は、何らかの変換規則１を実行するように形成することができる。さらに、手段１０８も、変換規則２と呼ばれる他の変換規則または同等の変換規則を使用するように形成することができる。さらに、手段１４０は、一般に何らかの変換規則３を使用するように形成することができ、この変換規則は、必ずしも第１または第２の変換規則と同等である必要はない。

しかし、変換表現の逆転換では、図３に示す変換規則１〜３に対する適応が見られなければならず、この場合、転換の第１手段１２４は、何らかの変換規則を実行するのではなく、図３のブロック１４０で実行された変換規則３を実行する。これに対して、図４の手段１３０は、やはり図３のブロック１０８により実行された変換規則２を実行しなければならない。最後に、図４の手段１５０は、無損失逆転換が得られるように、やはり図３の手段１０２により実行された変換規則１を実行しなければならない。

以下では、図９〜図１１に関して、ドイツ特許公開公報第１０１２９２４０Ａ１号に記載されているように、ＭＤＣＴウィンドウ表示の分離について再び説明し、この特許では、ＭＤＣＴウィンドウ表示を、リフティングマトリックスを含むギブンズ回転に分離することと、対応する丸めは、転換に関して図１および逆転換に関して図２に示すコンセプトと有利に結合して、完全な整数ＭＤＣＴ近似、つまり本発明による整数ＭＤＣＴ（ＩｎｔＭＤＣＴ）を得ることができ、そのため、前方変換コンセプトおよび後方変換コンセプトの両方がＭＤＣＴの実施例で実行された。

図９は、時間離散サンプルを処理するための発明による好ましい装置の概念図を示し、Ｉｎｔ−ＭＤＣＴ整数変換アルゴリズムが関連して動作する整数を求めるためのオーディオ信号を表現する。時間離散サンプルは、図９に示す装置によりウィンドウ表示され、任意にスペクトル表現に転換される。入力部１０において装置に供給される時間離散サンプルは、２Ｎ時間離散サンプルに対応する長さを持つウィンドウでウィンドウ表示され、出力部１２において整数ウィンドウ表示サンプルが得られ、このサンプルは、変換を介して、特に、整数ＤＣＴを実行するための手段１４を介してスペクトル表現に転換するのに適する。整数ＤＣＴは、Ｎ入力値のＮ出力値を生成するように構成され、これは、ＭＤＣＴ方程式により２Ｎウィンドウ表示サンプルのＮスペクトル値を単に生成する図１２ａのＭＤＣＴ関数４０８と対照的である。

時間離散サンプルをウィンドウ表示するため、最初の２つの時間離散サンプルを手段１６で選択し、これらのサンプルは共に、時間離散サンプルのベクトルを表す。手段１６により選択された時間離散サンプルは、ウィンドウの最初の４分の１にある。他の時間離散サンプルは、図１１に関してさらに詳細に説明するとおり、ウィンドウの第２の４分の１にある。次に、手段１６により生成されたベクトルには、２×２次元の回転マトリックスが与えられ、この動作は、直接実行されるのではなく、いくつかのいわゆるリフティングマトリックスを介して実行される。

リフティングマトリックスは、ウィンドウｗおよび等しくない「１」または「０」に応じて１つの要素のみを有するという特徴を有する。

リフティングステップへのウェーブレット変換の因数分解は、専門の出版物であるＩｎｇｒｉｄＤａｕｂｅｃｈｉｅｓおよびＷｉｍＳｗｅｌｄｅｎｓの「リフティングステップへのウェーブレット変換の因数分解」（ＦａｃｔｏｒｉｎｇＷａｖｅｌｅｔＴｒａｎｓｆｏｒｍｓＩｎｔｏＬｉｆｔｉｎｇＳｔｅｐｓ）、増刷版、ＢｅｌｌＬａｂｏｒａｔｏｒｉｅｓ、ＬｕｃｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ、１９９６年に記載されている。一般に、リフティングスキームは、完全に再現するフィルタ対であって、同じローパスまたはハイパスフィルタを有する対間の単純な関係である。相補的なフィルタの各々の対は、リフティングステップに因数分解される。これは、特にギブンズ回転に適用される。多相マトリックスがギブンズ回転である場合を考察する。以下が適用される。

等号の右側にある３つのリフティングマトリックスの各々は、主要対角要素として値「１」を有する。さらに、すべてのリフティングマトリックスでは、二次対角要素は０に等しく、二次対角要素は回転角αによって決まる。

次に、このベクトルは、第３リフティングマトリックス、つまり、第１結果ベクトルを得るために、上記方程式の一番右のリフティングマトリックスが乗算される。これは、手段１８により図９に示されている。次に、第１結果ベクトルは、手段２０により図９に示すように、実数の量を整数の量にマッピングする任意の丸め機能で丸められる。丸められた第１結果ベクトルは、手段２０の出力部で得られる。次に、丸められた第１結果ベクトルは、このベクトルに中間、つまり第２リフティングマトリックスを乗算するための手段２２に供給されて、第２結果ベクトルが得られ、手段２４で再び丸められて、丸められた第２結果ベクトルが得られる。丸められた第２結果ベクトルは、次に、このベクトルに上の方程式の左に示されているリフティングマトリックス、つまり第１リフティングマトリックスを乗算するための手段２６に供給され、第３結果ベクトルが得られ、次に、このベクトルは、手段２８を介して最終的に丸められ、出力部１２において最終的に整数ウィンドウ表示サンプルが得られ、このサンプルは、サンプルのスペクトル表現が望ましい場合、手段１４により処理されて、スペクトル出力部３０において整数スペクトル値が得られる。

手段１４は、整数ＤＣＴとして具体化することが好ましい。

長さＮを有するタイプ４（ＤＣＴ−ＩＶ）による離散コサイン変換は、以下の方程式により与えられる。

ＤＣＴ−ＩＶの係数は、正規直交Ｎ×Ｎマトリックスを形成する。すべての直交Ｎ×Ｎマトリックスは、Ｐ．Ｐ．Ｖａｉｄｙａｎａｔｈａｎによる専門の出版物の「マルチレートシステムおよびフィルタバンク」（ＭｕｌｔｉｒａｔｅＳｙｓｔｅｍｓＡｎｄＦｉｌｔｅｒＢａｎｋｓ）、ＰｒｅｎｔｉｃｅＨａｌｌ、エングルウッドクリフス（ＥｎｇｌｅｗｏｏｄＣｌｉｆｆｓ）、１９９３年に記載されているようにＮ（Ｎ−１）／２ギブンズ回転に分離される。その他の分離も存在することに注目するべきである。

異なるＤＣＴアルゴリズムの分類に関して、Ｈ．Ｓ．Ｍａｌｖａｒの「ラップ変換による信号処理」（ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＷｉｔｈＬａｐｐｅｄＴｒａｎｓｆｏｒｍｓ）、ＡｒｔｅｃｈＨｏｕｓｅ、１９９２年を参照するべきである。一般に、ＤＣＴアルゴリズムは、基本機能のタイプごとに異なる。この場合に好ましいＤＣＴ−ＩＶは、非対称基本機能、つまりコサイン１／４波長、コサイン３／４波長、コサイン５／４波長、コサイン７／４波長などを含むが、たとえばタイプＩＩ（ＤＣＴ−ＩＩ）の離散コサイン変換は軸対称および点対称基本変換を有する。たとえば、０番目の基本機能は直接成分を有し、第１基本機能は半コサイン波長であり、第２基本機能は全コサイン波長である。ＤＣＴ−ＩＩは、特に定数成分を考慮するという事実により、ビデオ符号化で使用され、オーディオ符号化では使用されず、なぜなら、定数成分は、ビデオ符号化と対照的にオーディオ符号化には関連しないためである。

以下では、ギブンズ回転の回転角αは窓関数によって決まるという事実に言及する。

ウィンドウの長さが２ＮであるＭＤＣＴは、長さＮのタイプＩＶの離散コサイン変換に減少させることが可能である。これは、時間ドメインで明示的にＴＤＡＣ動作を実行し、次にＤＣＴ−ＩＶを適用することにより達成される。５０％のオーバラップでは、ブロックｔのウィンドウの左半分は、前のブロック、つまりブロックｔ−１の右半分とオーバラップする。２つの連続するブロックｔ−１およびｔのオーバラップ部分は、以下のとおり、時間ドメインで、つまり変換器の前、つまり図９の入力部１０と出力部１２との間で再処理される。

チルダで指示される値は、図９の出力部１２における値であり、上記の方程式でチルダを含まないｘの値は、それぞれ入力部１０における値および選択手段１６の後の値である。連続するインデックスｋは０〜Ｎ／２−１であり、ｗは窓関数を表す。

窓関数ｗのＴＤＡＣ条件から、以下のコンテキストが適用される。

一定の角度αｋ、ｋ＝０、．．．、Ｎ／２−１では、時間ドメインにおけるこの再処理は、上記で説明したとおり、ギブンズ回転として書くことができる。

ギブンズ回転の角度αは、以下のとおり、窓関数によって決まる。

このＴＤＡＣ条件を満たす限り、窓関数ｗを使用することができる。

以下では、カスケード式符号器および復号器について、図１０に関して説明する。１つのウィンドウごとに一緒に「ウィンドウ表示」される時間離散サンプルｘ（０）〜ｘ（２Ｎ−１）は、図９の手段１６により、サンプルｘ（）およびサンプルｘ（Ｎ−１）、つまりウィンドウの第１の４分の１のサンプル、およびウィンドウの第２の４分の１のサンプルが、手段１６の出力部におけるベクトルを形成するために選択されるように最初に選択される。交差矢印は、ＤＣＴ−ＩＶブロックの入力部において整数ウィンドウ表示サンプルを求めるため、それぞれ手段１８、２０および２２、２４および２６、２８のリフティング乗算およびその後の丸めを表す。

第１ベクトルが上記のように処理された場合、さらに、サンプルｘ（Ｎ／２−ｌ）およびｘ（ｎ／２）の第２ベクトル、つまりやはりウィンドウの第１の４分の１のサンプルおよびウィンドウの第２の４分の１のサンプルが選択され、図９に記載したアルゴリズムにより再処理される。同様に、ウィンドウの第１および第２の４分の１の他のすべてのサンプル対が処理される。同じ処理は、第１ウィンドウの第３および第４の４分の１について行われる。次に、２Ｎウィンドウ表示整数サンプルは出力部に１２存在し、図１０に示すＤＣＴ−ＩＶ変換に供給される。特に、第２および第３の４分の１の整数ウィンドウ表示サンプルはＤＣＴに供給される。ウィンドウの第１の４分の１のウィンドウ表示整数サンプルは、前のＤＣＴ−ＩＶで、前のウィンドウの第４の４分の１のウィンドウ表示整数サンプルと一緒に処理される。同様に、図１０のウィンドウ表示整数サンプルの第４の４分の１は、次のウィンドウの第１の４分の１と共にＤＣＴ−ＩＶ変換に供給される。次に、図１０に示す中間積分ＤＣＴ−ＩＶ変換は、Ｎ整数スペクトル値ｙ（０）〜ｙ（Ｎ−ｌ）を提供する。次に、これらの整数スペクトル値は、容易にエントロピー符号化され、中間量子化は不要である。なぜなら、ウィンドウ表示および変換は、整数出力値を提供するからである。

復号器は、図１０の右半分に示されている。逆変換および「逆ウィンドウ表示」から構成される復号器は、符号器と逆に動作する。逆ＤＣＴ−ＩＶは、図１０に示すように、ＤＣＴ−ＩＶの逆変換に使用することができる。次に、復号器ＤＣＴ−ＩＶ３４の出力値は、図１０に示すように、それぞれ前の変換および次の変換の値を使って逆に処理され、手段３４の出力部における整数ウィンドウ表示サンプル、並びにそれぞれ前の変換および後続の変換から、時間分離オーディオサンプルｘ（０）〜ｘ（２Ｎ−１）が生成される。

出力側の動作は、逆ギブンズ回転により、つまり、ブロック２６、２８および２２、２４および１８、２０がそれぞれ対向方向に通過するように行われる。これは、方程式１の第２リフティングマトリックスに関して、より詳細に説明する。（符号器内で）、第２結果ベクトルが、丸められた第１結果ベクトルと第２リフティングマトリックス（手段２２）との乗算により形成される場合、以下の方程式が得られる。

方程式６の右辺の値ｘ、ｙは整数である。しかし、これは、値Ｘｓｉｎ αには適用されない。この場合、以下の方程式に示すように、丸め関数ｒを導入しなければならない。

この動作は、手段２４により実行される。

この逆マッピング（復号器の場合）は、以下のように定義される。

丸め動作の前の負符号により、リフティングステップの整数近似は、誤差が導入されることなく逆転させることができることが明白になる。この近似を３つのリフティングステップの各々に適用すると、ギブンズ回転の整数近似が得られる。丸め回転（符号器内）は、誤差を導入することなく、逆の丸めリフティングステップを逆順に通過することにより、つまり、図９のアルゴリズムが、復号化時に下から上に実行される時に、逆転させることができる（復号器内）。

丸め関数ｒが点対称である場合、逆丸め回転は、角度−αの丸め回転と同じであり、以下のとおりである。

復号器用の、つまり逆ギブンズ回転用のリフティングマトリックスは、この場合、単に式「ｓｉｎ α」を式「−ｓｉｎ α」と置き換えることにより、方程式（１）から直接得られる。

以下では、再び図１１に関して、オーバラップウィンドウ４０〜４６を含む共通のＭＤＣＴについて説明する。ウィンドウ４０〜４６は、それぞれ５０％オーバラップする。ウィンドウごとに、ギブンズ回転は、矢印４８で大まかに示すように、ウィンドウの第１および第２の４分の１の範囲、およびウィンドウの第３および第４の４分の１の範囲内でそれぞれ実行される。次に、回転値、つまりウィンドウ表示の整数サンプルはＮ−ｔｏ−ＮＤＣＴに供給され、その結果、ウィンドウの第２および第３の４分の１および後続のウィンドウの第４および第１の４分の１はそれぞれ、ＤＣＴ−ＩＶアルゴリズムを介して一緒にスペクトル表現に転換される。

したがって、共通のギブンズ回転はリフティングマトリックスに分離され、これらのマトリックスは順に実行されて、丸めステップは、リフティングマトリックス乗算ごとにその後導入され、その結果、浮動小数点数は発生直後に丸められ、したがって、結果ベクトルは、結果ベクトルの乗算ごとの乗算以前の単なる整数を有する。

したがって、出力値は常に整数であり、整数の入力値も使用することが好ましい。これは制限を表すわけではなく、なぜなら、たとえば、ＣＤ上に記憶されている何らかのＰＣＭサンプルは、値の範囲がビット幅に応じて、つまり時間離散ディジタル入力値が１６ビット値または２４ビット値であるかどうかに応じて変化するからである。さらに、全体のプロセスは、既に述べたとおり、逆回転を逆方向に行うことにより、逆転させることができる。したがって、無損失変換を意味する完全再構成を含むＭＤＣＴの整数近似が存在する。

図示の変換は、浮動少数点値ではなく整数出力値を提供する。この変換は完全な再構成を提供するため、前方変換、次に後方変換が実行される時に、誤差は導入されない。本発明の好ましい実施態様によると、この変換は、変形離散コサイン変換に代わるものである。その他の変換方法も、回転に対する分離、およびリフティングステップに対する回転の分離が可能な限り、その他の変換方法を整数的に実行することも可能である。

整数ＭＤＣＴは、ＭＤＣＴの最も有利な特徴を有する。整数ＭＤＣＴはオーバラップ構造を有し、その結果、非オーバラップブロック変換に比べて、より良好な周波数選択が得られる。変換以前にウィンドウ表示時にすでに考察されるＴＤＡＣ関数により、重要なサンプリングは維持されるため、オーディオ信号を表現するスペクトル値の合計数は、入力サンプルの合計数に等しい。

浮動小数点サンプルを提供する標準ＭＤＣＴと対照的に、説明した好ましい整数変換は、低信号レベルの標準ＭＤＣＴと比べると、ノイズは単にスペクトル域内で増加し、こうしたノイズの増加は、有効な信号レベルでは目立たない。むしろ、整数処理は、効率的なハードウェアインプリメンテーションに役立ち、なぜなら、単に乗算ステップが使用され、これらのステップは、ｓｈｉｆｔ／ａｄｄステップに容易に分離して、単純かつ高速にハードウェア内で実行できるからである。当然、ソフトウェアインプリメンテーションも可能である。

整数変換は、オーディオ信号の良好なスペクトル表現を提供し、その後も整数の範囲を保つ。この整数変換は、オーディオ信号の音色部分に適用される場合、良好なエネルギー集中を生じる。その結果、図９に示すウィンドウ表示／変換をエントロピー符号器と単にカスケードすることにより、効率的な無損失符号化スキームを構成することができる。ＭＰＥＧＡＡＣに使用されるエスケープ値を使用して、特に積み重ねられた符号化が望ましい。すべての値は、省略された最下位ビットを付加的に符号化するように所望のコード表に適合するまで、一定の２のべき乗だけ縮小することが好ましい。比較的大きいコード表の代案と対照的に、所望の代案は、コード表を記憶するためのメモリ消費の点でより望ましい。殆どの無損失符号器は、最下位ビットの特定の１つを単に省略することによっても得られる。

特に、音色信号の場合、整数スペクトル値のエントロピー符号化は高度の符号器ゲインを可能にする。信号の遷移部分では、遷移信号の平坦なスペクトルにより、つまり０に等しいか、またはほぼ０であるスペクトル値の低い数字により、符号器のゲインは低い。Ｊ．Ｈｅｒｒｅ、Ｊ．Ｄ．Ｊｏｈｎｓｔｏｎの「時間領域雑音整形（ＴＮＳ）を使用するパーセプチュアルオーディオコーダの性能の強化」（ＥｎｈａｎｃｉｎｇｔｈｅＰｅｒｆｏｒｍａｎｃｅｏｆＰｅｒｃｅｐｔｕａｌＡｕｄｉｏＣｏｄｅｒｓｂｙＵｓｉｎｇＴｅｍｐｏｒａｌＮｏｉｓｅＳｈａｐｉｎｇ）１０１．ＡＥＳ会議、ロサンゼルス、１９９６年、増刷版４３８４に記載されているように、この平坦性は、周波数範囲の線形予測を使用することにより使用することができる。１つの代案は、開ループを含む予測である。もう１つの代案は、閉ループを含む予測子である。第１の代案、つまり開ループを含む予測子はＴＮＳと呼ばれる。予測後の量子化は、結果として得られる量子化雑音をオーディオ信号の時間構造に適応させて、心理音響的オーディオ符号器におけるプレエコーを防止することに通じる。無損失オーディオ符号化の場合、閉ループを含む予測子は入力信号の正確な再構成を可能にするため、第２の代案、つまり閉ループを含む予測子を含む代案がより適している。この技術は、生成されたスペクトルに適用される場合、丸めステップは、整数範囲を保つために予測フィルタのステップごとにその後実行する必要がある。逆フィルタおよび同じ丸め関数を使用することにより、元のスペクトルを正確に再構成することができる。

データ整理用の２つのチャネル間の冗長性を使用するために、角度π／４を含む丸め回転を使用する場合、無損失様式で中心側符号化を使用することができる。ステレオ信号の左右チャネルの合計および差を計算する代案と対照的に、丸め回転はエネルギー保存という利益がある。いわゆるジョイントステレオ符号化技術の使用は、標準のＭＰＥＧＡＡＣで行われているように、帯域ごとにオンまたはオフにすることができる。より順応性のある様式で、２つのチャネル間の冗長性を減少させるために、さらに他の回転角度も考えられる。

状況によっては、それぞれ転換および逆転換、並びにそれぞれ時間−周波数変換または周波数−時間変換のための本発明による方法は、ハードウェアまたはソフトウェアで実行することができる。このインプリメンテーションは、方法を実行するようにプログラム可能なコンピュータシステムと協働可能な電気的可読制御信号を使って、ディジタルメモリ媒体、特にディスクまたはＣＤ上で具体化することができる。したがって、一般に、本発明は、コンピュータプログラムがコンピュータ上で実行された時に本発明の方法を実行するための機械可読キャリヤ上に記憶されたプログラムコードを含むコンピュータプログラム製品からも構成される。つまり、本発明は、コンピュータプログラムがコンピュータ上で実行された時に方法を実行するためのプログラムコードを含むコンピュータプログラムとして実現することが可能である。

本発明の転換装置のブロック図を示す。本発明の逆転換装置のブロック図を示す。本発明の好ましい実施態様による転換装置のブロック図を示す。本発明の好ましい実施態様による逆転換装置を示す。本発明に適用される値の２つの後続のブロックの変換表現を示す。前方変換を含む多次元リフティングステップの詳細な表現を示す。後方変換マトリックスを含む多次元逆リフティングステップの表現を示す。長さＮのＤＣＴ−ＩＶを長さＮ／２の２つのＤＣＴ−ＩＶに分離するための本発明の表現を示す。時間離散オーディオサンプルを処理して、整数スペクトル値を決定することが可能な整数値を求めるのに好ましい手段のブロック図を示す。ギブンズ回転および２つのＤＣＴ−ＩＶ動作におけるＭＤＣＴおよび逆ＭＤＣＴの分離の略表現を示す。５０％のオーバラップを含むＭＤＣＴを回転およびＤＣＴ−ＩＶ動作に分離することを説明する表現を示す。図１２ａは、ＭＤＣＴおよび５０％のオーバラップを含む既知の符号器の略ブロック図を示す。図１２ｂは、図１０ａにより生成された値を復号化するための既知の復号器のブロック図を示す。

Claims

個々の値を整数値を含む変換表現に転換し、個々の値がオーディオおよび／またはイメージ情報を有する装置であって、
第１変換規則を使用して個々の値の第１ブロックを処理し、変換値の第１ブロックを得るための手段（１０２）と、
変換値の第１ブロックを丸めて、丸められた変換値の第１ブロックを得るための手段（１０４）と、
丸められた変換値の第１ブロックと個々の値の第２ブロックとを合計して、合計値の第２ブロックを得るための手段（１０６）と、
第２変換規則を使用して合計値の第２ブロックを処理し、変換値の第２ブロックを得るための手段（１０８）と、
変換値の第２ブロックを丸めて、丸められた変換値の第２ブロックを得るための手段（１１０）と、
個々の値の第１ブロックから丸められた変換値の第２ブロックを個々に減算して、変換表現の整数出力値のブロックを得るための手段（１１２）とを備える装置。
第３変換規則を使用して、整数出力値のブロックを処理し、変換出力値のブロックを得るための手段（１４０）と、
変換出力値のブロックを丸めて、丸められた変換出力値のブロックを得るための手段（１４２）と、
丸められた変換出力値のブロックと、合計値の第２ブロックとを合計して変換表現の整数出力値のさらに他のブロックを得るための手段（１４４）とをさらに備える、請求項１に記載の装置。
第１変換規則、第２変換規則および第３変換規則がそれぞれ変換マトリックスを含む、請求項１または２に記載の装置。
第１変換規則、第２変換規則および第３変換規則がそれぞれ互いに同じである、請求項１ないし請求項３のいずれかに記載の装置。
第１変換規則および第３変換規則が前方変換規則であり、第２変換規則が後方変換規則である、請求項１ないし請求項４のいずれかに記載の装置。
第１ブロックを丸めるための手段（１０４）および第２ブロックを丸めるための手段（１１０）および変換出力値のブロックを丸めるための手段（１４２）がそれぞれ、丸められた結果を提供する丸め関数であって、その精度が、装置を含むコンピュータの機械精度より低い丸め関数に従って丸めるように形成される、
請求項１ないし請求項５のいずれかに記載の装置。
個々の値の第１ブロックが、序数０〜序数Ｎ−１の個々の値を有し、個々の値の第２ブロックが、序数Ｎ〜序数２Ｎ−１の個々の値を有し、
丸められた変換値の第１ブロックが０〜Ｎ−１の序数を有し、合計手段（１０６）が、値の加算を実行するように形成され、その結果、序数ｉを有する丸められた変換値のブロックが、序数ｉ＋Ｎを有する個々の値の第２ブロックの値に加算され、ｉが、０〜Ｎ−１の連続するインデックスである、請求項１ないし請求項６のいずれかに記載の装置。
個々の値の第１ブロックが、序数０〜序数Ｎ−１の個々の値を有し、個々の値の第２ブロックが、序数０〜序数２Ｎ−１の個々の値を有し、
丸められた変換値の第２ブロックが、序数Ｎと２Ｎ−１との間の値を有し、
減算のための手段（１１２）が、序数ｎ＋ｉを有する丸められた変換値のブロックの値を、序数ｉを有する第１ブロックの値から減算するように形成され、ｉが、０〜Ｎ−１の連続するインデックスである、請求項１ないし請求項７のいずれかに記載の装置。
個々の値の第１および第２ブロックが、整数の個々の値を含む、請求項１ないし請求項８のいずれかに記載の装置。
変換値の第１ブロックを丸めるための手段（１０４）、または変換値の第２ブロックを丸めるための手段（１１０）が、同じ丸め仕様に従って丸めるように形成される、請求項１ないし請求項９のいずれかに記載の装置。
第１変換規則の基礎になる変換マトリックス、第２変換規則の基礎になる変換マトリックス、および第３変換規則の基礎になる変換マトリックスがそれぞれ、第１または第２ブロックの個々の値の数に等しいそれぞれある数の行および列を有する二乗マトリックスである、請求項３に記載の装置。
第１変換規則に従って処理するための手段（１０２）、および第２変換規則に従って処理するための手段（１０８）が変換器内に形成され、
さらにシーケンス制御装置が設けられ、該制御装置が、最初に個々の値の第１ブロックを供給し、後に合計値の第２ブロックを変換器に供給するように形成される、請求項１ないし請求項１１のいずれかに記載の装置。
変換値の第１ブロックを丸めるための手段（１０４）および変換値の第２ブロックを丸めるための手段（１１０）がラウンダー内に形成され、
さらにシーケンス制御装置が設けられ、最初に個々の値の第１ブロック、後に変換値の第２ブロックを前記ラウンダーに供給する、請求項１ないし請求項１２のいずれかに記載の装置。
個々の値の第１および第２ブロックが、マルチチャネルオーディオ信号の第１および第２チャネルのオーディオサンプルである、請求項１ないし請求項１３のいずれかに記載の装置。
第１ブロックおよび第２ブロックが、オーディオ信号の連続する時間サンプルである、請求項１ないし請求項１３のいずれかに記載の装置。
前方変換装置であって、
いくつかのリフティングマトリックス（１８、２２、２６）、およびその後の丸め動作（２０、２４、２８）を使用することにより、オーディオ信号またはイメージ信号を表現するサンプルの第１ブロックをウィンドウ表示し、オーディオ信号またはイメージ信号を表現する第２ブロックのウィンドウ表示し、個々の値の第１ブロックおよび個々の値の第２ブロックを得るための手段（１６、１８、２０、２２、２４、２６、２８）と、
整数出力値を含む第１および第２ブロックから変換表現を得るための請求項１ないし請求項１５のいずれかに記載の装置とを備える装置。
個々の値を整数値を含む変換表現に転換し、個々の値がオーディオおよび／またはイメージ情報を有する方法であって、
第１変換規則を使用して個々の値の第１ブロックを処理し（１０２）、変換値の第１ブロックを得るステップと、
変換値の第１ブロックを丸めて（１０４）、丸められた変換値の第１ブロックを得るステップと、
丸められた変換値の第１ブロックと個々の値の第２ブロックとを合計して（１０６）、合計値の第２ブロックを得るステップと、
第２変換規則を使用して合計値の第２ブロックを処理し（１０８）、変換値の第２ブロックを得るステップと、
変換値の第２ブロックを丸めて（１１０）、丸められた変換値の第２ブロックを得るステップと、
個々の値の第１ブロックから丸められた変換値の第２ブロックを個々に減算して（１１２）、変換表現の整数出力値のブロックを得るステップとを含む方法。
前方変換方法であって、
オーディオ信号またはイメージ信号を表現するサンプルの第１ブロックをウィンドウ表示し（１６、１８、２０、２２、２４、２６、２８）、いくつかのリフティングマトリックス（１８、２２、２６）を使用してオーディオ信号またはイメージ信号を表現する第２ブロックをウィンドウ表示し、その後丸め動作（２０、２４、２８）を行って、個々の値の第１ブロックおよび個々の値の第２ブロックを得るステップと、
請求項１７に記載の方法であって、整数出力値を含む第１および第２ブロックから変換表現を得る方法とを含む方法。
整数出力値のブロック、および個々の値の変換表現である合計値の第２ブロックを逆転換して、個々の値の第２ブロックを得るための装置であって、整数出力値のブロック、および合計値の第２ブロックが個々の値の第１および第２ブロックから導かれ、そのため個々の値の第１ブロックを処理し（１０２）、第１変換規則を使用して変換値の第１ブロックを得て、変換値の第１ブロックを丸め（１０４）、丸められた変換値の第１ブロックを得て、丸められた変換値の第１ブロックと個々の値の第２ブロックとを合計し（１０６）、合計値の第２ブロックを得て、第２変換規則を使用して合計値の第２ブロックを処理して（１０８）、変換値の第２ブロックを得て、変換値の第２ブロックを丸め（１１０）、丸められた変換値の第２ブロックを得て、丸められた変換値の第２ブロックを個々の値の第１ブロックから減算して（１１２）、変換表現の整数出力値のブロックを得る装置で、
第２変換規則を使用して、合計値の第２ブロックを処理し、変換出力値の第１ブロックを得るための手段（１３０）と、
変換出力値の第１ブロックを丸めて、丸められた変換値の第１ブロックを得るための手段（１３２）と、
丸められた変換出力値の第１ブロックを整数出力値のブロックと合計して、個々の値の第１ブロックを得るための手段（１３４）と、
第１変換規則を使用して個々の値の第１ブロックを処理し、変換値の前記第２ブロックに対応するブロックを得るための手段（１５０）と、
変換値の前記第２ブロックに対応するブロックを丸めて、丸められた変換値のブロックを得るための手段（１５２）と、
丸められた変換値のブロックを合計値の第２ブロックから減算して、個々の値の第２ブロックを得るための手段（１５４）とを備える装置。
変換表現の整数出力値のさらに他のブロックが、合計値の第２ブロックから計算され、そのため第３変換規則を使用して整数出力値のブロックを処理して（１４０）、変換出力値のブロックを得て、変換出力値のブロックを丸めて（１４２）、丸められた変換出力値のブロックを得て、丸められた変換出力値のブロックと合計値の第２ブロックとを合計して（１４４）、変換表現の整数出力値のさらに他のブロックを得る請求項１９に記載の装置であって、
第３変換規則を使用して整数出力値のブロックを処理して、変換出力値の第１ブロックを得るための手段（１２４）と、
変換出力値の第１ブロックを丸めて、丸められた変換出力値の第１ブロックを得るための手段（１２６）と、
丸められた変換出力値の第１ブロックを出力値のさらに他のブロックから減算して、合計値の第２ブロックを得るための手段（１２８）とを備える装置。
整数出力値のブロック、および個々の値の変換表現である合計値の第２ブロックを逆転換して、個々の値の第１および第２ブロックを得るための方法であって、整数出力値のブロックおよび合計値の第２ブロックが、個々の値の第１および第２ブロックから導かれ、そのため、第１変換規則を使用して個々の値の第１ブロックを処理して（１０２）、変換値の第１ブロックを得て、変換値の第１ブロックを丸めて（１０４）、丸められた変換値の第１ブロックを得て、丸められた変換値の第１ブロックと個々の値の第２ブロックとを合計して（１０６）、合計値の第２ブロックを得て、第２変換規則を使用して合計値の第２ブロックを処理し（１０８）、変換値の第２ブロックを得て、変換値の第２ブロックを丸めて（１１０）、丸められた変換値の第２ブロックを得て、丸められた変換値の第２ブロックを個々の値の第１ブロックから減算して（１１２）、変換表現の整数出力値のブロックを得る方法で、
第２変換規則を使用して合計値の第２ブロックを処理し（１３０）、変換出力値の第１ブロックを得るステップと、
変換出力値の第１ブロックを丸めて（１３２）、丸められた変換値の第１ブロックを得るステップと、
丸められた変換出力値の第１ブロックと整数出力値のブロックとを合計し（１３４）、個々の値の第１ブロックを得るステップと、
第１変換規則を使用して個々の値の第１ブロックを処理し（１５０）、変換値の前記第２ブロックに対応するブロックを得るステップと、
変換値の前記第２ブロックに対応するブロックを丸めて（１５２）、丸められた変換値のブロックを得るステップと、
丸められた変換値のブロックを合計値の第２ブロックから減算して（１５４）、個々の値の第２ブロックを得るステップとを含む方法。
後方変換装置であって、
請求項１９または２０に記載の装置と、
リフティングマトリックス（１８、２２、２６）を使用して、個々の値の第１および第２ブロックの逆ウィンドウ表示し、その後丸め動作（２０、２４、２８）を行って、オーディオサンプルまたはイメージサンプルを表現する元の値の第１および第２ブロックを得るための手段とを備える装置。
後方変換方法であって、
請求項２１に記載の方法と、
リフティングマトリックス（１８、２２、２６）を使用して、個々の値の第１および第２ブロックを逆ウィンドウ表示し、その後丸め動作（２０、２４、２８）を行って、オーディオサンプルまたはイメージサンプルを表現する元の値の第１および第２ブロックを得るステップとを含む方法。
コンピュータに、請求項１７、１８、２１または２３に記載の方法を実行させるためのプログラム。