JP2010512550A

JP2010512550A - 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法

Info

Publication number: JP2010512550A
Application number: JP2009540636A
Authority: JP
Inventors: ラルフガイガー; マクスノイエンドルフ; 嘉一横谷; ニコラウスレッテルバッハ; ユールゲンヘレ; シュテファンガヤーズベアガー
Original assignee: フラウンホッファー−ゲゼルシャフトツァフェルダールングデァアンゲヴァンテンフォアシュンクエー．ファオ
Priority date: 2006-12-12
Filing date: 2007-12-07
Publication date: 2010-04-22
Anticipated expiration: 2027-12-07
Also published as: BRPI0718738B1; WO2008071353A2; CA2672165C; HK1126602A1; AU2007331763B2; NO20092506L; US20140222442A1; AU2007331763A1; US20230154475A1; MY148913A; ATE547898T1; US20160225383A1; ES2383217T3; US9043202B2; US10714110B2; US20130282389A1; WO2008071353A3; TW200841743A; TWI363563B; BRPI0718738A8

Abstract

時間領域データストリームを表しているデータ・セグメントを復号化するための装置であって、データ・セグメントは、時間領域において、または周波数領域において符号化され、周波数領域において符号化されたデータ・セグメントは、時間領域データサンプルの連続したおよび重複しているブロックを表している連続したデータブロックを有する装置である。その装置は、時間領域において符号化されたデータ・セグメントを復号化するための時間領域復号器、並びに重複している時間領域データブロックを得るために、周波数領域において符号化されたデータ・セグメント、および時間領域復号器の出力データを処理するためのプロセッサを含む。さらに、その装置は、時間領域データストリームの復号化されたデータ・セグメントを得るために、重複している時間領域データブロックを合成するためのオーバラップ／アド−コンバイナを含む。

Description

本発明は、符号化の分野であって、例えば、ビデオおよび音声符号化のように、符号化されるデータの異なる特性が、符号化レートのために利用される。

最高水準の技術である符号化方法は、符号化されるデータストリームの特性を利用することができる。例えば、音声符号化において、再生された場合に、知覚モデルが、顕著な品質および劣化をほぼ減少させることなくソースデータを圧縮するために使用される。例えば、ＭＰＥＧ−２／４ＡＡＣ（ＭＰＥＧ＝ＭｏｖｉｎｇＰｉｃｔｕｒｅｓＥｘｐｅｒｔＧｒｏｕｐ，ＡＡＣ＝ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）（ＧｅｎｅｒｉｃＣｏｄｉｎｇｏｆＭｏｖｉｎｇＰｉｃｔｕｒｅｓａｎｄＡｓｓｏｃｉａｔｅｄＡｕｄｉｏ：ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ，ＩｎｔｅｒｎａｔｉｏｎａｌＳｔａｎｄａｒｄ（映像及び関連オーディオの共通符号化：適応オーディオ符号化，国際規格）１３８１８−７，ＩＳＯ／ＩＥＣＪＴＣ１／ＳＣ２９／ＷＧ１１ＭｏｖｉｎｇＰｉｃｔｕｒｅｓＥｘｐｅｒｔＧｒｏｕｐ（映像専門家グループ），１９９７，参照）のような最新の知覚的な音声符号化方法は、周波数領域において音声信号を表わすために、例えば、修正離散コサイン変換のようなフィルタバンクが使用される。

周波数領域において、周波数係数の量子化が、知覚モデルにより行われる。そのようなコーダは、例えば、音楽のような音声信号の一般的なタイプに対して、優れた知覚的な音声品質を提供することができる。一方で、例えば、ＡＣＥＬＰ（ＡＣＥＬＰ＝ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）のような予測のアプローチを使用した最新のスピーチ、およびそのような方法のコーダは、時間領域において音声／スピーチ信号で表わすことができる。そのようなスピーチ・コーダは、例えば、人間の声道である、人間のスピーチ生成過程の特性をモデル化することができ、そして、その結果として、低いビットレートで、スピーチ信号のための優れたパフォーマンスが達成される。反対に、知覚の音声コーダは、低ビットレートで、コード化されるスピーチ信号に対して、スピーチ・コーダによって提示されたパフォーマンスのレベルを達成せず、そして、一般の音声信号／音楽を表わすためにスピーチ・コーダを使用することは、重要な品質の機能的障害を結果として得る。

従来の概念は、常に全ての部分的なコーダが活動（すなわち、時間領域および周波数領域）である層をなした組み合わせを提供し、そして、最終的な出力信号は、所定の被処理時間フレームのための部分的なコーダの寄与を合成することによって算出される。階層符号化の普及している実施例は、基本階層およびフィルタバンク・ベースの拡張階層（ＢｅｒｎｈａｒｄＧｒｉｌｌ（ベルンハルトグリル），ＫａｒｌｈｅｉｎｚＢｒａｎｄｅｎｂｕｒｇ（カールハインツブランデンブルグ）：ＡＴｗｏ−ｏｒＴｈｒｅｅ−ＳｔａｇｅＢｉｔ―ＲａｔｅＳｃａｌａｂｌｅＡｕｄｉｏＣｏｄｉｎｇＳｙｓｔｅｍ，前刷り番号４１３２，第９９回，ＡＥＳコンベンション，１９９５年９月，参照）のようなスピーチ・コーダを有するＭＰＥＧ−スケーラブルスピーチ／音声符号化である。

従来の周波数領域符号器は、ＭＤＣＴフィルタバンクを利用することができる。ＭＤＣＴは、その有利な特性のため、従来の知覚的な音声コーダのための主要なフィルタバンクとなった。例えば、処理ブロックとの間でスムーズなクロスフェードを提供することができる。各処理ブロック信号が異なって変更される場合であっても、例えば、スペクトル係数の量子化のために、ブロックからブロックへの突然の移行のためのブロックキングによるアーティファクトは、重複／加算操作のウィンドウ化のため、発生しない。ＭＤＣＴは、時間領域エイリアシング相殺（ＴＤＡＣ）の概念を使用する。

重複される追加特性については、ＭＤＣＴは、タイプＩＶ離散型コサイン変換に基づくフーリエ関連の変換である。より大きなデータ・セットの連続的なブロックにおいて実行されるように設計されている。ここで、あるブロックの後半部分が、次のブロックの前半部分と一致するように次のブロックが重複される。ＤＣＴのエネルギー圧縮品質に加えて、この重複は、ＭＤＣＴを特に信号圧縮アプリケーションのために魅力のあるものにする。なぜなら、ブロックの境界から抑制している前記アーティファクトを回避する助けとなるからである。同数の代わりに、入力の半分多くの出力を有するという点で、重複された変換として、他のフーリエ関連の変換と比較して、やや例外的である。特に、２Ｎ個の実数は、Ｎ個の実数に変換される。ここで、Ｎは自然数である。

逆ＭＤＣＴは、ＩＭＤＣＴとしても知られている。入力および出力の異なる数があるので、一見したところ、ＭＤＣＴが逆行可能であってはならないように思われるかもしれない。しかしながら、完全な可逆性は、次の重複ブロックの重複ＩＭＤＣＴｓを加えることによって達成される。そして、相殺するエラーおよび読み出される元のデータを生ずる。すなわち、ＴＤＡＣを達成する。

その後すぐに、フィルタバンクの出力においてスペクトル値の数は、臨界サンプリングとも呼ばれるその入力での時間領域の入力値の数に等しい。

ＭＤＣＴフィルタバンクは、高周波数選択を提供し、そして高い符号化利得を可能にする。ブロックの重複および臨界サンプリングの特性は、時間領域エイリアシング相殺の技術を利用することによって達成することができる（Ｊ．Ｐｒｉｎｃｅｎ（Ｊ．プリンセン），Ａ．Ｂｒａｄｌｅｙ（Ａ．ブラッドリー）：Ａｎａｌｙｓｉｓ／ＳｙｎｔｈｅｓｉｓＦｉｌｔｅｒＢａｎｋＤｅｓｉｇｎＢａｓｅｄｏｎＴｉｍｅＤｏｍａｉｎＡｌｉａｓｉｎｇＣａｎｃｅｌｌａｔｉｏｎ，ＩＥＥＥＴｒａｎｓ．ＡＳＳＰ，ＡＳＳＰ−３４（５），１１５３頁−１１６１頁，１９８６年，参照）。図４は、ＭＤＣＴのこれらの効果を説明したものである。上部での時間軸４００に沿ったインパルスに関して、図４は、ＭＤＣＴ入力信号を示す。入力信号４００は、２つの連続的なウィンドウ化およびＭＤＣＴブロックによって変換される。ウィンドウ化４１０は、図４において入力信号の下に例示される。後に変換された個別にウィンドウ化された信号の時間ライン４２０および４２５によって図４において示される。

逆ＭＤＣＴ後、第１ブロックは、正符号４２０を有するエイリアシング・コンポーネントを生成し、第２ブロックは、同じ大きさであって、負符号４２５を有するエイリアシング・コンポーネントを生成する。エイリアシング・コンポーネントは、図４の下段において最終出力５３０に示されるように、２つの出力信号４２０および４２５の加算の後、互いにそれぞれ相殺される。

ＥｘｔｅｎｄｅｄＡｄａｐｔｉｖｅＭｕｌｔｉ−Ｒａｔｅ − Ｗｉｄｅｂａｎｄ（ＡＭＲ−ＷＢ＋）Ｃｏｄｅｃ，３ＧＰＰＴＳ２６．２９０Ｖ６．３．０，２００５年６月において、ＡＭＲ−ＷＢ＋（ＡＭＲ−ＷＢ＝ＡｄａｐｔｉｖｅＭｕｌｔｉ−ＲａｔｅＷｉｄｅｂａｎｄ）コーデックの技術仕様書が指定される。セクション５．２において、ＡＭＲ−ＷＢ＋のコアでの符号化アルゴリズムは、ハイブリッドＡＣＥＬＰ／ＴＣＸ（ＴＣＸ＝ＴｒａｎｓｆｏｒｍｃｏｄｅｄＥｘｃｉｔａｔｉｏｎ）に基づく。入力信号のあらゆるブロックのために、符号器は、符号化モデル（例えば、ＡＣＥＬＰまたはＴＣＸ）が最良である開ループまたは閉ループモードにおいて決定する。ＡＣＥＬＰモデルは、時間領域であって、予測符号器であり、スピーチおよび一時的な信号に対して最良である。ＡＭＲ−ＷＢ符号器は、ＡＣＥＬＰモデルにおいて使用される。あるいは、ＴＣＸモデルは、符号器に基づく変換であって、典型的な音楽サンプルに対してより適している。

具体的には、ＡＭＲ−ＷＢは、変換符号化モードＴＣＸのための離散フーリエ変換（ＤＦＴ）を使用する。隣接するブロックとの間にスムーズな移行を許容するために、ウィンドウ化および重複が使用される。このウィンドウ化および重複は、異なる符号化モード（ＴＣＸ／ＡＣＥＬＰ）間の移行のために、および、連続的なＴＣＸフレームのために必要である。このように、ウィンドウ化および重複を有するＤＣＴは、臨界的にサンプル化されないフィルタバンクを表わす。フィルタバンクは、新規な入力サンプル（３ＧＰＰＴＳ２６．２９０Ｖ６．３．０（３ＧＰＰ＝ＴｈｉｒｄＧｅｎｅｒａｔｉｏｎＰａｒｔｎｅｒｓｈｉｐＰｒｏｊｅｃｔ，ＴＳ＝ＴｅｃｈｎｉｃａｌＳｐｅｃｉｆｉｃａｔｉｏｎ））の数よりも高い周波数値を生成する。各ＴＣＸフレームは、新規な入力サンプルの数に等しいフレーム長の１／８の重複を利用する。したがって、ＤＦＴの対応する長さは、フレーム長さの９／８である。

例えば、フィルタバンクの出力でのスペクトル値の数が、その入力での時間領域の入力の数よりも大きい場合といった、ＴＣＸにおいて非臨界的にサンプル化されたＤＦＴフィルタバンクを考慮して、この周波数領域符号化モードは、臨界的にサンプル化された重複された変換のＭＤＣＴを利用するＡＡＣ（ＡＡＣ＝ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）のような音声符号復号器とは異なる。

ドルビーＥ符号復号器は、Ｆｉｅｌｄｅｒ，ＬｏｕｉｓＤ．（フィールダー，ルイスＤ．），Ｔｏｄｄ，ＣｒａｉｇＣ．（トッド，クレイグＣ．）：ＴｈｅＤｅｓｉｇｎｏｆａＶｉｄｅｏＦｒｉｅｎｄｌｙＡｕｄｉｏＣｏｄｉｇＳｙｓｔｅｍｆｏｒＤｉｓｔｒｉｂｕｔｉｎｇＡｐｐｌｉｃａｔｉｏｎｓ，紙番号１７−００８，ＡＥＳ第１７回国際カンファレンス，Ｈｉｇｈ−ＱｕａｌｉｔｙＡｕｄｉｏＣｏｄｉｎｇ，１９９９年８月、およびＦｉｅｌｄｅｒ，ＬｏｕｉｓＤ．（フィールダー，ルイスＤ．），Ｄａｖｉｄｓｏｎ，ＧｒａｎｔＡ．（デーヴィッドソン，グラントＡ．）：ＡｕｄｉｏＣｏｄｉｎｇＴｏｏｌｓｆｏｒＤｉｇｉｔａｌＴｅｌｅｖｉｓｉｏｎＤｉｓｔｒｉｂｕｔｉｏｎ，前刷り５１０４第１０８回ＡＥＳコンベンション２０００年１月において記載されている。ドルビーＥ符号復号器は、ＭＤＣＴフィルタバンクを利用する。この符号器の設計において、特別な焦点は、符号化領域において編集を実行するという可能性におかれた。これを達成するために、特別なエイリアスフリーのウィンドウが使用される。これらのウィンドウの境界において、異なる信号部分のスムーズ・クロスフェードまたはスプライシングが可能である。上述した参考文献において、例えば、「ＴｈｅＤｅｓｉｇｎｏｆａＶｉｄｅｏＦｒｉｅｎｄｌｙＡｕｄｉｏＣｏｄｉｎｇＳｙｓｔｅｍｆｏｒＤｉｓｔｒｉｂｕｔｉｎｇＡｐｐｌｉｃａｔｉｏｎｓ」のセクション３を参照して、これが、時間領域エイリアシングを生成する通常のＭＤＣＴを使用してシンプルに可能でないこととして、要点がまとまられている。しかしながら、エイリアシングの除去が、変換係数の数の増加の犠牲となり、結果として得られるフィルタバンクが臨界的なサンプリングの特性を示さないことを示す。

ＢｅｒｎｈａｒｄＧｒｉｌｌ（ベルンハルトグリル），ＫａｒｌｈｅｉｎｚＢｒａｎｄｅｎｂｕｒｇ（カールハインツブランデンブルグ）：ＡＴｗｏ−ｏｒＴｈｒｅｅ−ＳｔａｇｅＢｉｔ―ＲａｔｅＳｃａｌａｂｌｅＡｕｄｉｏＣｏｄｉｎｇＳｙｓｔｅｍ，前刷り番号４１３２，第９９回，ＡＥＳコンベンション，１９９５年９月Ｊ．Ｐｒｉｎｃｅｎ（Ｊ．プリンセン），Ａ．Ｂｒａｄｌｅｙ（Ａ．ブラッドリー）：Ａｎａｌｙｓｉｓ／ＳｙｎｔｈｅｓｉｓＦｉｌｔｅｒＢａｎｋＤｅｓｉｇｎＢａｓｅｄｏｎＴｉｍｅＤｏｍａｉｎＡｌｉａｓｉｎｇＣａｎｃｅｌｌａｔｉｏｎ，ＩＥＥＥＴｒａｎｓ．ＡＳＳＰ，ＡＳＳＰ−３４（５），１１５３頁−１１６１頁，１９８６年Ｆｉｅｌｄｅｒ，ＬｏｕｉｓＤ．（フィールダー，ルイスＤ．），Ｔｏｄｄ，ＣｒａｉｇＣ．（トッド，クレイグＣ．）：ＴｈｅＤｅｓｉｇｎｏｆａＶｉｄｅｏＦｒｉｅｎｄｌｙＡｕｄｉｏＣｏｄｉｇＳｙｓｔｅｍｆｏｒＤｉｓｔｒｉｂｕｔｉｎｇＡｐｐｌｉｃａｔｉｏｎｓ，紙番号１７−００８，ＡＥＳ第１７回国際カンファレンス，Ｈｉｇｈ−ＱｕａｌｉｔｙＡｕｄｉｏＣｏｄｉｎｇ，１９９９年８月Ｆｉｅｌｄｅｒ，ＬｏｕｉｓＤ．（フィールダー，ルイスＤ．），Ｄａｖｉｄｓｏｎ，ＧｒａｎｔＡ．（デーヴィッドソン，グラントＡ．）：ＡｕｄｉｏＣｏｄｉｎｇＴｏｏｌｓｆｏｒＤｉｇｉｔａｌＴｅｌｅｖｉｓｉｏｎＤｉｓｔｒｉｂｕｔｉｏｎ，前刷り５１０４第１０８回ＡＥＳコンベンション２０００年１月

本発明の目的は、データ・セグメントを符号化し、そして復号化するより効果的な概念を提供することである。

目的は、請求項１に記載の復号化のための装置、請求項２５に記載の復号化のための方法、請求項２７に記載の符号化されたデータストリームを生成する装置、および請求項３９に記載の符号化されたデータストリームを生成する方法によって達成される。

本発明は、合成するための時間領域および周波数領域の符号器、それぞれの復号器を使用することによって、効果的な符号化および復号化の概念が利用されることができるという発見に基づく。時間エイリアシングの問題は、復号器において時間領域データから周波数領域データに変換することによって、および受信された復号化された周波数領域データを有する結果として得られた変換された周波数領域データを合成することによって、効果的に有効とすることができる。オーバーヘッドは、データ・セグメントを符号化領域の変化に適用する重複ウィンドウの重複している領域に適応することによって減少されえる。より小さく重複している領域を有するウィンドウを使用することは、時間領域の符号化を有する場合、時間領域の符号化から、また符号化へスイッチングする場合それぞれ、有益である。

実施例は、スピーチ信号および音楽信号のような入力信号の両方のタイプに対して、改良されたパフォーマンスを達成できる汎用な音声符号化および復号化の概念を提供することができる。実施例は、例えば、時間領域および周波数領域の概念である複数の符号化方法を合成することによって活用することができる。実施例は、フィルタバンクに基づき、および時間領域に基づく符号化概念を単一の方法に、効率的に合成することができる。実施例は、例えば、音楽のような音声コンテンツのための音声コーデックとスピーチのようなコンテンツのためのスピーチコーデックとの間でスイッチできるようにするために、合成されたコーデックを結果として得る。特に、合成されたコンテンツに対して、実施例は、しばしばこのスイッチングを利用することができる。

本発明の実施例は、スイッチングによるアーティファクトが発生しない効果を提供することができる。実施例において、付加的な送信データ、またはさらなる符号化サンプルの量は、スイッチングの過程に対して、動作のこの移送の間に減少した効率を回避するために最小化されえる。それとともに、部分的なコーダのスイッチの組み合わせの概念は、常にすべての部分的な符号器が作動中である層をなした組み合わせのそれとは異なる。

本発明の好ましい実施例は、添付図面に関して以下においてさらに詳細に説明される。

図１ａは、復号化のための装置の実施例を示す。図１ｂは、復号化のための装置の他の実施例を示す。図１ｃは、復号化のための装置の他の実施例を示す。図１ｄは、復号化のための装置の他の実施例を示す。図１ｅは、復号化のための装置の他の実施例を示す。図１ｆは、復号化のための装置の他の実施例を示す。図２ａは、符号化のための装置の実施例を示す。図２ｂは、符号化のための装置の他の実施例を示す。図２ｃは、符号化のための装置の他の実施例を示す。図３ａは、１つのウィンドウの期間に、周波数領域および時間領域の符号化との間で切り替わる場合に、重複している領域を例示する。図３ｂは、２つのウィンドウの期間に、周波数領域符号化および時間領域符号化との間で切り替わる場合に、重複している領域を例示する。図３ｃは、異なる重複している領域を有する複数のウィンドウを例示する。図３ｄは、実施例において、異なる重複している領域を有するウィンドウの利用を例示する。図４は、ＭＤＣＴを使用する場合に、時間領域エイリアシング相殺（ｔｉｍｅ−ｄｏｍａｉｎａｌｉａｓｉｎｇｃａｎｃｅｌｌａｔｉｏｎ）を例示する。

図１ａは、時間領域データストリームを表わしているデータ・セグメントを復号化するための装置１００であって、データ・セグメントは、時間領域において、または周波数領域において符号化され、周波数領域において符号化されたデータ・セグメントは、時間領域データサンプルの連続したおよび重複しているブロックを表している連続したデータブロックを有する。このデータストリームは、例えば、音声ストリームに対応し、ここで、データブロックのいくつかは、時間領域に符号化され、そして他のものは、周波数領域に符号化される。周波数領域に符号化されたデータブロックまたはセグメントは、重複しているデータブロックの時間領域データサンプルを表わすことができる。

装置１００は、時間領域において符号化されたデータ・セグメントを復号化するための時間領域復号器１１０を含む。さらに、装置１００は、重複している時間領域データブロックを得るために、周波数領域において符号化されたデータ・セグメント、および時間領域復号器１１０の出力データを処理するためのプロセッサを含む。さらに、装置１００は、時間領域データストリームの復号化されたデータ・セグメントを得るために、重複している時間領域データブロックを合成するためのオーバラップ／アド−コンバイナ１３０を含む。

図１ｂは、装置１００の他の実施例を示す。実施例において、プロセッサ１２０は、周波数領域データ・セグメントを得るために、周波数領域において、符号化されたデータ・セグメントを復号化するための周波数領域復号器１２２を含む。さらに、実施例において、プロセッサ１２０は、変換された周波数領域データ・セグメントを得るために、時間領域復号器１１０の出力データを変換するための時間領域から周波数領域へのコンバータを含む。

さらに、実施例において、プロセッサ１２０は、周波数領域データストリームを得るために、周波数領域データ・セグメントおよび変換された周波数領域データ・セグメントを合成するための周波数領域コンバイナ１２６を含む。さらに、プロセッサ１２０は、オーバラップ／アド−コンバイナ１３０によって合成されえる周波数領域データストリームを重複している時間領域データブロック変換するための周波数領域から時間領域へのコンバータを含む。

実施例は、いかなる修正もなく、特に臨界サンプリングの特性を手放すことなく、ＭＰＥＧ−４ＡＣＣにおいて使用されるＭＤＣＴフィルタバンクを利用できる。実施例は、最適符号化効率を提供することができる。付加的なスイッチングのアーティファクトおよび最小のオーバーヘッドだけを導かないと同時に、実施例は、確立したＭＤＣＴウィンドウと互換性を持つ時間領域コーデックへのスムーズな移行を達成することができる。

実施例は、フィルタバンクにおいて時間領域エイリアシングを保持することでき、そして、時間領域コーデックによって、対応する時間領域エイリアシングを符号化された信号部分に意図的にもたらすことができる。このように、それらが、ＭＤＣＴスペクトルの２つの連続フレームに役立つにつれて、時間領域エイリアシングのコンポーネントを結果として得ることは、同様に各々を相殺することができる。図１ｃは、装置１００の他の実施例を例示する。図１ｃによれば、周波数領域復号器１２２は、再量子化ステージ１２２ａを含む。さらに、時間領域から周波数領域へのコンバータ１２４は、コサイン変調フィルタバンク、重複直交変換、低遅延フィルタバンク、多相フィルタバンクを含む。実施例は、時間領域から周波数領域へのコンバータ１２４が、ＭＤＣＴ１２４ａを含むことを例示する。

さらに、図１ｃは、周波数領域コンバイナ１２６が、加算器１２６ａを含むことを表す。図１ｃに示すように、周波数領域から時間領域へのコンバータ１２８は、コサイン修正フィルタバンク、それぞれ逆ＭＤＣＴ１２８ａを含む。データ・セグメントを時間領域符号化され、および周波数領域符号化されることを含むデータストリームは、以下においてさらに詳述される符号器によって生成されえる。周波数領域符号化および時間領域符号化の間のスイッチングは、周波数領域符号器を有する入力信号の若干の部分および時間領域符号器を有する入力信号の若干の部分を符号化することによって達成されえる。図１ｃにおいて表される装置１００の実施例は、復号化するための対応する装置１００の基準の構造を例示する。他の実施例において、再量子化１２２ａおよび逆修正離散コサイン変換１２８ａが周波数復号器を表す。

時間領域復号器１１０が取って代わる信号部分に対して図１ｃにおいて示されるように、時間領域符号器１１０の時間領域出力は、フォワードＭＤＣＴ１２４ａによって変換されえる。時間領域復号器は、時間領域符号化されたデータを復号化するために予測フィルタを利用することができる。ＭＤＣＴ１２４ａの入力における若干の重複、およびこのようなオーバーヘッドは、ここで導出される。以下において、実施例は、このオーバーヘッドの減少、または最小化を記述している。

原則として、図１ｃにおいて示される実施例は、両方のコーデックが平行して作動することができる作動モードを含む。実施例において、プロセッサ１２０は、時間領域および周波数領域において平行に符号化されるデータ・セグメントを適応されえる。このようにして、信号は、層化された符号化アプローチと同様に、周波数領域および部分的な時間領域において部分的に符号化される。結果として生じる信号は、周波数領域コンバイナ１２６ａと比較され、そのとき周波数領域において加算される。にもかかわらず、実施例は、２つのコーデックの間で切り替わる作動モードを実行することができ、両コーデックが最良の効率を得るためにアクティブである、好ましくは最小限の数のサンプルを有するのみである。

図１ｃにおいて、時間領域符号器１１０の出力は、ＭＤＣＴ１２４ａによって変換され、その後ＩＭＤＣＴ１２８ａが続く。他の実施例では、複雑さを減少させるために、これらの２つのステップは、単一のステップに有利に合成されえる。図１ｄは、このアプローチについて説明している装置１００の実施例を例示する。図１ｄに示される装置１００は、プロセッサ１２０が、時間領域復号器１１０の出力データに基づいて重複している時間領域データブロックを計算するための計算機１２９を含む。プロセッサ１２０または計算機１２９は、時間領域復号器１１０の出力データに基づく周波数領域から時間領域へのコンバータ１２８の重複特性のそれぞれの特性を再生することに適している。すなわち、プロセッサ１２０または計算機１２９は、周波数領域から時間領域へのコンバータ１２８によって生成された重複特性と類似の時間領域データブロックの特性の重複特性を再生できる。さらに、プロセッサ１２０または計算機１２９は、時間領域復号器１１０の出力データに基づき、周波数領域から時間領域へのコンバータ１２８によって導出された時間領域エイリアシングと類似の時間領域エイリアシングを再生するように適応されえる。

周波数領域から時間領域へのコンバータ１２８は、周波数領域復号器１２２によって重複している時間領域データブロックに提供される周波数領域データ・セグメントに変換するために適応されえる。オーバラップ／アド−コンバイナ１３０は、時間領域データストリームのデータの復号化されたデータセグメントを得るために、周波数領域から時間領域へのコンバータ１２８および計算機１２９によって提供されるデータブロックの合成のために適応されえる。

計算機１２９は、図１ｅの示される実施例において説明されるように時間領域エイリアシング・ステージ１２９ａを含む。時間領域エイリアシング・ステージ１２９ａは、重複している時間領域データブロックを得るために、時間領域復号器の時間エイリアシング出力データを適応されえる。

時間領域エイリアシング（ＴＤＡ）の処理だけが、実施例において残存している場合に、時間領域符号化データに対して、ＭＤＣＴおよびＩＭＤＣＴの組み合わせは、構造および計算の複雑性において、非常に単純にすることができる。この効率的な処理は、多くの観察に基づく。２Ｎのサンプルの入力セグメントのウィンドウ化ＭＤＣＴは、３つのステップに分解されえる。

第１に、入力信号は、分析ウィンドウによって乗算される。

第２に、結果は、２Ｎ個のサンプルからＮ個のサンプルまで折り返される。ＭＤＣＴのために、この処理は、サンプルの第１クォーターが、サンプルの第２クォーターを有する時間反転オーダー（ｔｉｍｅ−ｒｅｖｅｒｓｅｄｏｒｄｅｒ）において、合成され、すなわち減算され、サンプルの第４クォーターが、時間反転オーダーにおいて、サンプルの第３クォーターとともに合成され、すなわち加算されることを意味する。結果は、時間エイリアスされ、Ｎ個のサンプルを含む、信号の修正された第２および第３クォーターにおいて、ダウンサンプル化される。

第３に、そして、ダウンサンプル化された信号は、最終的なＭＤＣＴ出力を形成するために、Ｎ個の入力からＮ個の出力サンプルへマッピングする直交ＤＣＴのような変換を使用して、変換される。

Ｎ個のスペクトル・サンプルの入力系列のウィンドウ化されたＩＭＤＣＴ再構成は、同様に、３つのステップに分解することができる。

第１に、Ｎ個のスペクトル・サンプルの入力系列は、Ｎ個の入力からＮ個の出力サンプルへマッピングする直交逆ＤＣＴのような変換を使用して、変換される。

第２に、結果は、逆ＤＣＴ変換された値を２Ｎ個のサンプルの出力バッファの第２クォーターおよび第３クォーターに書き込み、第２クォーターの時間反転および反転バージョン、並びに第３クォーターの時間反転バージョンを有する第４クォーターをそれぞれ満たすことによって、Ｎ個から２Ｎ個のサンプルを展開する。

第３に、結果として生じる２Ｎ個のサンプルは、ウィンドウ化されたＩＭＤＣＴ出力を形成するために、合成ウィンドウによって乗算される。

このように、ウィンドウ化されたＭＤＣＴおよびウィンドウ化されたＩＭＤＣＴの連結は、ウィンドウ化されたＭＤＣＴの第１および第２ステップ、並びにウィンドウ化されたＩＭＤＣＴの第２および第３ステップのシーケンスによって、実施例において効率的に実行される。それらが、お互いに関する逆演算であって、このように相殺するので、ＭＤＣＴの第３ステップおよびＩＭＤＣＴの第１ステップは、実施例において、完全に省略されえる。残りのステップは、時間領域のみにおいて実行されえる。そして、このように、このアプローチを使用する実施例は、計算の複雑性において実質的に低くできる。

１ブロックのＭＤＣＴおよび連続的なＩＭＤＣＴのために、ＭＤＣＴの第２および第３ステップ、並びにＩＭＤＣＴの第２および第３ステップが、以下に示すまばらな２Ｎ×２Ｎマトリックスを有する乗算として、記述されえる。

換言すれば、計算機１２９は、２Ｎ個のシーケンシャルサンプルを含む計算機のセグメントにおける時間領域復号器１１０の出力を分割し、分析ウィンドウ関数にしたがって、２Ｎ個のサンプルに重みを適用し、第２のＮ／２個のサンプルから逆の順序で、第１のＮ／２個のサンプルを減算し、および逆の順序で、最後のＮ／２個のサンプルを第３のＮ／２個のサンプルに加算し、第２および第３のＮ／２個のサンプルを反転し、第１のＮ／２個のサンプルを、第２のＮ／２個のサンプルの時間反転および反転バージョンに置き換え、第４のＮ／２個のサンプルを、第３のＮ／２個の時間反転バージョンに置き換え、そして、合成ウィンドウ関数にしたがって、２Ｎ個のサンプルに重みを適用するために適応されえる。

他の実施例において、オーバラップ／アド−コンバイナ１３０は、周波数領域から時間領域へのコンバータ１２８によって提供された重複している時間領域データブロックに、合成ウィンドウ関数にしたがって、重みを適用するために適応されえる。さらに、オーバラップ／アド−コンバイナ１３０は、連続的に重複している時間領域データブロックの重複している領域のサイズに、適応された合成ウィンドウ関数にしたがって、重みを適用するために適応されえる。

計算機１２９は、連続的に重複している時間領域データブロックの重複している領域のサイズに、適応された分析ウィンドウ関数にしたがって、２Ｎ個のサンプルに重みを適用するために適応されえる。そして、計算機は、重複している領域のサイズに、適応された合成ウィンドウ関数にしたがって、２Ｎ個のサンプルに重みを適用するために適応されえる。

実施例において、周波数領域において符号化された２つの連続的な時間領域データブロックの重複している領域のサイズは、周波数領域において符号化されたもの、および時間領域において符号化されたものの２つの連続する時間領域データブロックの重複している領域のサイズよりも大きくなる。

実施例において、データ・セグメントのサイズは、重複している領域のサイズに適応されえる。実施例は、合成されたＭＤＣＴ／ＩＭＤＣＴ処理（すなわち、分析ウィンドウの動作、折り返しおよび展開、並びに合成ウィンドウを含む、ブロックＴＤＡ）の効率的な実装を有する。さらに、実施例においては、これらのステップのいくつかは、実際の実装において、部分的に、または完全に組み込むことができる。

図１ｆにおいて示されるような装置１００の他の実施例が例示され、装置１００は、さらに、非重複の連続的な時間領域データブロックが、時間領域において符号化されたデータ・セグメントにおいて生じた場合に、プロセッサ１２０およびオーバラップ／アド−コンバイナ１３０を迂回するために適応されるプロセッサ１２０およびオーバラップ／アド−コンバイナ１３０のためのバイパス１４０を含む。複数のデータ・セグメントが時間領域において符号化された場合、すなわち、周波数領域への変換が、連続的なデータ・セグメントに対して必要でない場合、それらは、いかなる重複もなしに送信されえる。これらのケースに対して、図１ｆにおいて示される実施例は、プロセッサ１２０およびオーバラップ／アド−コンバイナ１３０を迂回することができる。実施例において、ブロックの重複は、ＡＡＣ仕様書にしたがって、決定されえる。

図２ａは、時間領域データストリームに基づいて符号化されたデータストリームを生成するための装置２００の実施例を示し、時間領域データストリームは、信号のサンプルを有する。例えば、時間領域データストリームは、音声信号に対応し、同時に、スピーチセクションおよび音楽セクションを含む。装置２００は、データストリームからデータ・セグメントを提供するためのセグメント・プロセッサ２１０を含み、２つの連続的なデータ・セグメントは、第１または第２の重複している領域を有し、第２の重複している領域は、第１の重複している領域よりも小さい。さらに、装置２００は、時間領域におけるデータ・セグメントを符号化するための時間領域符号器２２０、およびウィンドウ化されたデータ・セグメントを得るために、第１または第２のウィンドウ関数にしたがって、時間領域データストリームのサンプルに重みを適用するための周波数領域符号器２３０を含み、第１および第２のウィンドウ関数は、第１および第２の重複している領域に適応され、そして、周波数領域のウィンドウ化されたデータ・セグメントの符号化のために適応される。

さらに、装置２００は、データ・セグメントと関連した移行指示（ｔｒａｎｓｉｔｉｏｎｉｎｄｉｃａｔｉｏｎ）を決定するための時間領域データ分析器２４０、並びに第１の移行指示を有するデータ・セグメントのために、時間領域符号器２２０の出力データは、符号化されたデータストリームにおいて含まれ、および第２の移行指示を有するデータ・セグメントのために、周波数領域符号器２３０の出力データは、符号化されたデータストリームにおいて含まれるように、装置を制御するための制御装置２５０を含む。

実施例において、時間領域データ分析器２４０は、時間領域データストリーム、またはセグメント・プロセッサ２１０によって提供されたデータ・セグメントから移行指示を決定するために適応される。これらの実施例は、図２ｂにおいて示される。図２ｂにおいて、時間領域データ分析器２４０が、時間領域データストリームから移行指示を決定するために、セグメント・プロセッサ２１０の入力に連結することができることが示される。もう１つの実施例では、時間領域データ分析２４０は、データ・セグメントから移行指示を決定するために、セグメント・プロセッサ２１０の出力に連結することができる。実施例において、時間領域データ分析器２４０は、セグメント・プロセッサによって直接提供されたデータから移行指示を決定するために、セグメント・プロセッサ２１０に直接連結されえる。これらの実施例は、図２ｂの点線によって示される。

実施例において、時間領域データ分析器２４０は、移行基準（ｔｒａｎｓｉｔｉｏｎｍｅａｓｕｒｅ）を決定するために適応され、移行基準は、時間領域データストリーム、またはデータ・セグメントにおける過渡性のレベル（ｌｅｖｅｌｏｆｔｒａｎｓｉｅｎｃｅ）に基づいており、ここで、移行指示器は、過渡性のレベルが、所定の閾値を超えるか否かを示す。

図２ｃは、装置２００の他の実施例を示す。図２ｃにおいて示される実施例において、セグメント・プロセッサ２１０は、第１および第２の重複している領域を有するデータ・セグメントを提供するために適応され、時間領域符号器２２０は、全てのデータ・セグメントを符号化するために適応され、周波数領域符号器２３０は、全てのウィンドウ化されたデータ・セグメントを符号化するために適応され、並びに制御装置２５０は、時間領域符号器２２０および周波数領域符号器２３０を制御するために適用され、そして、第１の移行指示を有するデータ・セグメントのために、時間領域符号器２２０の出力データは、符号化されたデータストリームにおいて含まれ、および第２の移行指示を有するデータ・セグメントのために、周波数領域符号器２３０の出力データは、符号化されたデータストリームにおいて含まれるような、周波数領域符号器２３０である。他の実施例において、時間領域符号器２２０および周波数領域２３０の両方の出力データは、符号化されたデータストリームにおいて含まれる。移行指示器は、スピーチ信号または音楽信号に関係するか、または関連するデータ・セグメントであるかどうかを示している。実施例において、周波数領域符号器２３０は、より音楽のようなデータ・セグメントに対して使用され、時間領域符号器２２０は、よりスピーチのようなデータ・セグメントに対して使用される。実施例において、平行する符号化は、例えば、バックグランドミュージックを有するスピーチのような音声信号に対して、利用される。

図２ｃにおいて表される実施例において、複数の可能性は、装置２００の範囲内において、複数の要素を制御するための制御装置２５０に対して考えられる。異なる可能性は、図２ｃにおける点線によって示される。例えば、制御装置２５０は、移行基準に基づいて符号化された出力を生成する符号器を選択するために、時間領域符号器２２０および周波数領域符号器２３０に連結される。もう１つの実施例において、制御装置２５０は、時間領域符号器２２０および周波数領域符号器２３０の出力でスイッチを制御することができる。

このような実施例において、時間領域符号器２２０および周波数領域符号器２３０の両方が、すべてのデータ・セグメントを符号化することができ、そして、制御装置２５０は、符号器の出力に連結された前記スイッチを介して選択するために適応される。そして、それは、符号化されたデータ・セグメントが、符号化効率に基づいて、それぞれの移行指示を符号化されたデータストリームにおいて含まれる。他の実施例において、制御装置２５０は、時間領域符号器２２０または周波数領域符号器２３０のいずれか一方にデータ・セグメントを提供するためのセグメント・プロセッサ２１０を制御するために適応されえる。制御装置２５０は、データ・セグメントに対して重複している領域を設定するために、セグメント・プロセッサ２１０の制御もする。他の実施例において、制御装置２５０は、セグメント・プロセッサ２１０と、時間領域符号器２２０、周波数領域符号器２３０それぞれとの間のスイッチを制御するために適応される。制御装置２５０は、いずれか一方の符号器、それぞれ両方かにデータ・セグメントを直接スイッチする影響を与えることができる。さらに、制御装置２５０は、重複している領域および符号化方法とともに、周波数領域符号器２３０に対してウィンドウ関数を設定するために適応されえる。

さらに、実施例において、周波数領域符号器２３０は、ＡＡＣ仕様書にしたがって、ウィンドウ関数の重みを適用するために適応されえる。周波数領域符号器２３０は、周波数領域データ・セグメントを得るために、ウィンドウ化されたデータ・セグメントを周波数領域に変換するために適応されえる。さらに、周波数領域符号器２３０は、周波数領域データ・セグメントを量子化するために適応され、そして、さらに、周波数領域符号器２３０は、知覚的なモデルにしたがって、周波数領域データ・セグメントを評価するために適応されえる。

周波数領域符号器２３０は、周波数領域データ・セグメントを得るために、コサイン変調フィルタバンク、重複直交変換、低遅延フィルタバンク、多相フィルタバンクを利用するために適応される。

周波数領域符号器２３０は、周波数領域データ・セグメントを得るために、ＭＤＣＴを利用するために適応されえる。時間領域符号器２２０は、データ・セグメントを符号化するために、予測モデルを使用するために適応されえる。

実施例において、周波数領域符号器２３０におけるＭＤＣＴが、ＡＣＣ仕様書と比較して、いわゆるロングブロックモード（すなわち、過渡期でない入力信号を符号化するために使用された正動作モード）において作動する場合、スイッチング処理によって導出されたオーバーヘッドは高い。これは、周波数領域符号器２３０の代わりに時間領域符号器２２０を使用することによって、１つのフレーム（すなわち、Ｎサンプルの長さ／フレーミングレート）のみが符号化されなければならないケースに対して真でありえる。

そして、ＭＤＣＴのための全ての入力値は、時間領域符号器２２０によって符号化されなければならない。すなわち、２Ｎ個のサンプルは、時間領域復号器１１０の出力で利用できる。このように、Ｎ個の追加のサンプルのオーバーヘッドが導入される。図３ａないし３ｄは、それぞれ適用できるウィンドウ関数で、セグメントのいくつかの考えられる重複している領域を例示したものである。２Ｎ個のサンプルは、周波数領域符号化データの１つのブロックを置き換えるために、時間領域符号器２２０によって符号化されなければならない。図３ａは、例を説明する。ここで、周波数領域符号化データブロックは、実線を使用し、そして、時間領域符号化データは、点線を使用する。ウィンドウ関数の下に、周波数領域（実線の箱）または時間領域（点線の箱）において符号化されるデータ・セグメントが表される。この表現は、図３ｂないし３ｄにおいて引用される。

図３ａは、データが周波数領域において符号化され、時間領域において符号化された１つのデータ・セグメントによって中断され、そして周波数領域において再び符号化された後のデータ・セグメントのケースを例示する。周波数領域符号器２３０によって引き起こされる時間領域エイリアシングを相殺するために必要である時間領域データを提供するために、周波数領域から時間領域にスイッチする場合に、重複のセグメントのサイズの半分が必要であり、同じ事が、時間領域から周波数領域にスイッチバックからホールドする。図３ａにおいて時間領域符号化データ・セグメントが２Ｎ個を有すると仮定するならば、そのとき、その最初および最後で、Ｎ／２のサンプルによって周波数領域符号化データとともに重複する。

複数の次のフレームが時間領域符号器２２０を使用して符号化される場合に、時間領域符号化セクションに対するオーバーヘッドが、Ｎ個のサンプルで留まる。図３ｂにおいて例示されるように、２つの連続するフレームが、時間領域において符号化され、時間領域符号化セクションの最初および最後での重複している領域は、図３ａに関して説明されたように、同じ重複を有する。図３ｂは、時間領域符号器２２０を有する２つの符号化されたフレームにおいて重複構造を示す。３Ｎ個のサンプルが、このケースにおいて、時間領域符号器２２０によって符号化されなければならない。

このオーバーヘッドは、例えば、ＡＡＣにおいて使用される構造にしたがって、スイッチされるウィンドウを利用することによって、実施例において削減できる。図３ｃは、ロング、スタート、８ショートおよびストップウィンドウの典型的なシーケンスを例示する。したがって、図３ｃから、ウィンドウサイズ、データ・セグメントサイズ、および重複している領域のサイズが、異なるウィンドウによって変化することがわかる。図３ｃにおいて表されるシーケンスは、上述したシーケンスの例である。

しかしながら、実施例は、ＡＡＣのサイズのウィンドウに限定されず、実施例は、異なる重複している領域を有するウィンドウ、および異なる期間のウィンドウを利用する。図３ｄにおいて例示されているように、ショートウィンドウのやり取りへの移行は、減少した重複を利用でき、例えば、時間領域符号化領域のやり取りへの移行からオーバーヘッドを減少するために、ＢｅｒｎｄＥｄｌｅｒ（ベルントエドラー）：ＣｏｄｉｅｒｕｎｇｖｏｎＡｕｄｉｏｓｉｇｎａｌｅｎｍｉｔｕｅｂｅｒｌａｐｐｅｎｄｅｒＴｒａｎｓｆｏｒｍａｔｉｏｎｕｎｄａｄａｐｔｉｖｅｎＦｅｎｓｔｅｒｆｕｎｋｔｉｏｎｅｎ，Ｆｒｅｑｕｅｎｚ，第４３巻，Ｎｏ．９，２５２頁−２５６頁，１９８９年９月、およびＧｅｎｅｒｉｃＣｏｄｉｎｇｏｆＭｏｖｉｎｇＰｉｃｔｕｒｅｓａｎｄＡｓｓｏｃｉａｔｅｄＡｕｄｉｏ（映画及び関連オーディオの共通符号化）：ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（適応オーディオ符号化），ＩｎｔｅｒｎａｔｉｏｎａｌＳｔａｎｄａｒｄ（国際規格）１３８１８−７，ＩＳＯ／ＩＥＣＪＴＣ／ＳＣ２９／ＷＧ１１ＭｏｖｉｎｇＰｉｃｔｕｒｅｓＥｘｐｅｒｔＧｒｏｕｐ（映像専門家グループ），１９９７年が、実施例において使用される。図３ｄは、４つのデータ・セグメントを例示しており、最初の２つおよび最後の１つは、周波数領域において符号化され、第３の１つは、時間領域において符号化される。減少された重複のサイズを有する異なるウィンドウの周波数領域から時間領域にスイッチングが使用される場合、それとともにオーバーヘッドを減らす。

実施例において、移行は、ＡＡＣにおいて使用するものと同一のスタートおよびストップウィンドウに基づいてもよい。時間領域符号化領域のやり取りへの移行のための対応するウィンドウは、重複の小さな領域のみ有するウィンドウである。結果として、オーバーヘッド、すなわち、スイッチング処理の結果、送信された加算値の数が、大幅に減少する。通常、オーバーヘッドは、Ｎ_ovl個のサンプルのウィンドウの重複を有する各移行のためのＮ_ovl／２個でもよい。このように、Ｎ_ovl＝１０２４を有するＡＡＣのような規則的な完全に重複された移行は、左、すなわち、フェードインウィンドウのための１０２４／２＝５１２のサンプル、および右、すなわち、フェードアウトウィンドウのための１０２４／２＝５１２のサンプルのオーバーヘッドを受ける。そして、移行が、１０２４の（＝Ｎ）サンプルの完全なオーバーヘッドにおいて結果として得られる。Ｎ_ovl＝１２８を有するＡＡＣのショートブロックウィンドウのような減少された重複ウィンドウを選択することは、１２８のサンプルの全体のオーバーヘッドを結果として得るだけである。

しかしながら、実施例は、例えば、広く使用されるＭＤＣＴフィルタバンクとして、周波数領域符号器２３０においてフィルタバンクを利用することができ、他の実施例は、他のコサイン修正フィルタバンクに基づいて周波数領域コーデックによって使用される。これは、例えば、ＭＰＥＧ−１−Ｌａｙｅｒ−１／２／３の音声コーデックにおいて使用されるような多相フィルタバンクと同様に、重複直交変換または低遅延フィルタバンクのようなＭＤＣＴの派生を含めえる。実施例において、フォワード／バックワード動作の効率的な実装は、ウィンドウの特殊なタイプおよびフィルタバンクにおいて使用される折り返し／展開を考慮することができる。修正されたフィルタバンクのあらゆるタイプのために、分析ステージは、プレプロセッシング・ステップおよび変調のためのブロック変換、すなわちＤＣＴまたはＤＦＴによって、効率的に実装することができる。実施例において、対応する合成ステージは、対応する逆変換およびポストプロセッシングステップを使用して、実装される。実施例は、時間領域符号化信号部分のために、プレ−およびポストプロセッシングを使用するのみである。

時間領域符号器２２０および周波数領域２３０の間のスイッチングが、非常に低いオーバーヘッドを導出して行われるので、本発明の実施例は、よりよい符号化効率が達成されえる効果を提供する。次の時間領域符号化のみの信号セクションにおいて、重複は、実施例において、完全に省略しえる。装置１００の実施例は、符号化されたデータストリームの一致している復号化を可能にする。

実施例は、それとともに、低い符号化レートが、例えば、音声信号の同じ品質のために達成されえる効果を提供し、それぞれの符号器が音声信号の過渡性に適応する場合に、それぞれ、より高い品質は、同じ符号化レートによって達成されえる。

進歩的な本方法の実施要件によっては、本方法は、ハードウェアまたはソフトウェアにおいて実施することができる。本実施は、電子的に読み出し可能な制御信号を記憶するデジタル記憶媒体、特にディスク、ＤＶＤまたはＣＤを使用して行うことができ、進歩的な本方法が行われるようなプログラム可能なコンピュータシステムと共に動作する。したがって、一般的に、本発明は、機械読み出し可能な担体上に記憶されたプログラム・コードを伴うコンピュータ・プログラム製品であって、プログラム・コードは、コンピュータ・プログラム製品がコンピュータ上で実行される場合に、進歩的な本方法を行うために動作する。したがって、言い換えれば、進歩的な本方法は、コンピュータ・プログラムがコンピュータ上で実行される場合に、本方法の少なくとも１つが実行させるためのプログラム・コードを有するコンピュータ・プログラムである。

１００復号化のための装置
１１０時間領域復号器
１２０プロセッサ
１２２周波数領域復号器
１２２ａ再量子化
１２４時間領域から周波数領域へのコンバータ
１２４ａ修正離散コサイン変換
１２６周波数領域コンバイナ
１２６ａ加算器
１２８周波数領域から時間領域へのコンバータ
１２８ａ逆修正離散コサイン変換
１２９計算機
１２９ａ時間領域エイリアシング・ステージ
１３０オーバラップ／アド−コンバイナ
２００符号化するための装置
２１０セグメント・プロセッサ
２２０時間領域符号器
２３０周波数領域符号器
２４０時間領域データ分析器
２５０制御装置
４００修正離散コサイン変換の入力
４１０ウィンドウ
４２０第１のウィンドウの逆修正離散コサイン変換の出力
４２５第２のウィンドウの逆修正離散コサイン変換の出力
４３０最後の出力

Claims

時間領域データストリームを表しているデータ・セグメントを復号化するための装置であって、データ・セグメントは、時間領域において、または周波数領域において符号化され、前記周波数領域において符号化されたデータ・セグメントは、時間領域データサンプルの連続したおよび重複しているブロックを表している連続したデータブロックを有し、前記装置は、
前記時間領域において、符号化されたデータ・セグメントを復号化するための時間領域復号器と、
重複している時間領域データブロックを得るために、前記周波数領域において符号化された前記データ・セグメント、および前記時間領域復号器の出力データを処理するためのプロセッサと、
前記時間領域データストリームの前記復号化されたデータ・セグメントを得るために、前記重複している時間領域データブロックを合成するためのオーバラップ／アド−コンバイナと、
を含む、装置。
前記プロセッサは、周波数領域データ・セグメントを得るために、周波数領域において符号化されたデータ・セグメントを復号化するための周波数領域復号器を含む、請求項１に記載の装置。
前記プロセッサは、前記時間領域において、および前記周波数領域において、同時に符号化されたデータ・セグメントを処理するために適応される、請求項１に記載の装置。
前記プロセッサは、変換された周波数領域データ・セグメントを得るために、前記時間領域復号器の前記出力データを変換するための時間領域から周波数領域へのコンバータを含む、請求項２に記載の装置。
前記プロセッサは、周波数領域データストリームを得るために、前記周波数領域データ・セグメントおよび前記変換された周波数領域データ・セグメントを合成するための周波数領域コンバイナを含む、請求項４に記載の装置。
前記プロセッサは、前記周波数領域データストリームを重複している時間領域データブロックに変換するための周波数領域から時間領域へのコンバータを含む、請求項５に記載の装置。
前記周波数領域復号器は、さらに再量子化ステージを含む、請求項２に記載の装置。
前記時間領域から周波数領域へのコンバータは、コサイン変調フィルタバンク、重複直交変換、低遅延フィルタバンク、多相フィルタバンクまたは修正離散コサイン変換を含む、請求項４に記載の装置。
前記周波数領域コンバイナは、加算器を含む、請求項５に記載の装置。
前記周波数領域から時間領域へのコンバータは、コサイン変調フィルタバンクまたは逆修正離散コサイン変換を含む、請求項６に記載の装置。
前記時間領域復号器は、前記時間領域において符号化されたデータ・セグメントを復号化するために、予測フィルタを使用して適応される、請求項１に記載の装置。
前記プロセッサは、前記時間領域復号器の前記出力データに基づいて重複している時間領域データブロックを計算するための計算機を含む、請求項１に記載の装置。
前記計算機は、前記時間領域復号器の前記出力データに基づいて前記周波数領域から時間領域へのコンバータの重複している特性を再生するために適応される、請求項１２に記載の装置。
前記計算機は、前記時間領域復号器に基づいて前記周波数領域から時間領域へのコンバータのエイリアシング特性を再生するために適応される、請求項１３に記載の装置。
前記周波数領域から時間領域へのコンバータは、前記周波数領域復号器によって提供された前記周波数領域データ・セグメントを重複している時間領域データブロックに変換するために適応される、請求項６に記載の装置。
前記オーバラップ／アド−コンバイナは、前記時間領域データストリームの復号化されたデータ・セグメントを得るために、前記周波数領域から時間領域へのコンバータおよび前記計算機によって提供された前記重複している時間領域データブロックを合成するために適応される、請求項１５に記載の装置。
前記計算機は、前記重複している時間領域データブロックを得るために、前記時間領域復号器の時間エイリアシング出力データのための時間領域エイリアシング・ステージを含む、請求項８に記載の装置。
前記計算機は、
２Ｎ個のシーケンシャルサンプルを含む計算機のセグメントにおける前記時間領域復号器の前記出力を分割し、
分析ウィンドウ関数にしたがって、前記２Ｎ個のサンプルに重みを適用し、
逆の順序で、第２のＮ／２個のサンプルから第１のＮ／２個のサンプルを減算し、
逆の順序で、第３のＮ／２個のサンプルから最後のＮ／２個のサンプルを加算し、
前記第２および第３のＮ／２個のサンプルを反転し、
前記第１のＮ／２個のサンプルを、前記第２のＮ／２個のサンプルの前記時間反転および反転バージョンに置き換え、
前記第４のＮ／２個のサンプルを前記第３のＮ／２個のサンプルの前記時間反転バージョンに置き換え、
合成ウィンドウ関数にしたがって、前記２Ｎのサンプルに重みを適用するために適応する、請求項１２に記載の装置。
前記オーバラップ／アド−コンバイナは、前記周波数領域によって時間領域コンバータに提供された重複している時間領域データブロックに、合成ウィンドウ関数による重みを適用するために適応される、請求項６に記載の装置。
前記オーバラップ／アド−コンバイナは、連続的な重複している時間領域データブロックの重複している領域のサイズに、適応された合成ウィンドウ関数による重みを適用するために適応される、請求項１９に記載の装置。
前記計算機は、連続的な重複している時間領域データブロックの重複している領域のサイズに、適応された合成ウィンドウ関数による前記２Ｎのサンプルに重みを適用するために適応され、そして前記計算機は、前記重複している領域の前記サイズに、適応された合成ウィンドウ関数による前記２Ｎのサンプルに重みを適用するために適応する、請求項２０に記載の装置。
前記周波数領域において符号化された２つの連続的な時間領域データブロックの重複している領域のサイズは、前記周波数領域において符号化され、そして前記時間領域において符号化された２つの連続的な時間領域データブロックの重複している領域のサイズより大きい、請求項１に記載の装置。
前記データブロックの重複は、ＡＡＣ仕様書により決定される、請求項１に記載の装置。
さらに、非重複の連続的な時間領域データブロックが前記時間領域において符号化されたデータ・セグメントにおいて生じた場合に、前記プロセッサおよび前記オーバラップ／アド−コンバイナのためのバイパスを含み、前記プロセッサおよび前記オーバラップ／アド−コンバイナを迂回するために前記バイパスが適応される、請求項１に記載の装置。
時間領域データストリームを表しているデータ・セグメントを復号化するための方法であって、データ・セグメントは、時間領域において、または周波数領域において符号化され、前記周波数領域において符号化されたデータ・セグメントは、時間領域データサンプルの連続したおよび重複しているブロックを表している連続したデータブロックを有し、前記方法は、
前記時間領域において、符号化されたデータ・セグメントを復号化するステップと、
重複している時間領域データブロックを得るために、前記周波数領域において符号化された前記データ・セグメント、および前記時間領域復号器の出力データを処理するステップと、
前記時間領域データストリームの前記復号化されたデータ・セグメントを得るために、前記重複している時間領域データブロックを合成するステップと、
を含む、方法。
コンピュータ・プログラムがコンピュータ上で実行される場合に、請求項２５に記載の方法を実行させるためのプログラム・コードを有するコンピュータ・プログラム。
時間領域データストリームに基づいて符号化されたデータストリームを生成するための装置であって、前記時間領域データストリームは、信号のサンプルを有し、前記装置は、
前記データストリームからデータ・セグメントを提供するためのセグメント・プロセッサであって、２つの連続的なデータ・セグメントは、第１または第２の重複している領域を有し、前記第２の重複している領域は、前記第１の重複している領域よりも小さい、セグメント・プロセッサと、
前記時間領域において、ウィンドウ化されたデータ・セグメントを符号化するための時間領域符号器と、
ウィンドウ化されたデータ・セグメントを得るために、第１または第２のウィンドウ関数による前記時間領域データストリームのサンプルに重みを適用するための周波数領域符号器であって、前記第１および第２のウィンドウ関数は、前記第１および第２の重複している領域に適応され、前記周波数領域符号器は、前記周波数領域において、ウィンドウ化されたデータ・セグメントを符号化するために適応される、周波数領域符号器と、
データ・セグメントと関連した移行指示を決定するための時間領域データ分析器と、
第１の移行指示を有するデータ・セグメントに対して、前記時間領域符号器の出力データは、前記符号化されたデータストリームに含み、および第２の移行指示を有するデータ・セグメントに対して、前記周波数領域符号器の出力データは、前記符号化されたデータストリームに含むように、前記装置を制御するための制御装置と、
を含む、装置。
前記時間領域データ分析器は、前記時間領域データストリーム、前記データ・セグメント、または前記セグメント・プロセッサにより直接提供されたデータから移行指示を決定するために適応される、請求項２７に記載の装置。
前記時間領域データ分析器は、移行基準を決定するために適応され、前記移行基準は、前記時間領域データストリーム、または前記データ・セグメントにおける過渡性のレベルに基づいており、ここで、移行指示器は、過渡性のレベルが、所定の閾値を超えるか否かを示す、請求項２７に記載の装置。
前記セグメント・プロセッサは、前記第１および第２の重複している領域を有するデータ・セグメントを提供するために適応され、
前記時間領域符号器は、前記データ・セグメントを符号化するために適応され、
前記周波数領域符号器は、前記ウィンドウ化されたデータ・セグメントを符号化するために適応され、
前記制御装置は、第１の移行指示を有するデータ・セグメントに対して、前記時間領域符号器の出力データが、前記符号化されたデータストリームを含み、および第２の移行指示を有するデータ・セグメントに対して、前記周波数領域符号器の出力データが、前記符号化されたデータストリームを含むように、前記時間領域符号器および前記周波数領域符号器を制御するために適応される、請求項２７に記載の装置。
前記制御装置は、前記時間領域符号器または前記周波数領域符号器に前記データ・セグメントを提供するための前記セグメント・プロセッサを制御するために適応される、請求項２７に記載の装置。
前記周波数領域符号器は、前記ＡＡＣ仕様書によるウィンドウ関数の重みを適用するために適応される、請求項２７に記載の装置。
前記周波数領域符号器は、周波数領域データ・セグメントを得るために、ウィンドウ化されたデータ・セグメントを前記周波数領域に変換するために適応される、請求項２７に記載の装置。
前記周波数領域符号器は、前記周波数領域データ・セグメントを量子化するために適応される、請求項３３に記載の装置。
前記周波数領域符号器は、知覚モデルにより前記周波数領域データ・セグメントを評価するために適応される、請求項３４に記載の装置。
前記周波数領域符号器は、前記周波数領域データ・セグメントを得るために、コサイン変調フィルタバンク、重複直交変換、低遅延フィルタバンク、多相フィルタバンクを利用するために適応される、請求項３５に記載の装置。
前記周波数領域符号器は、前記周波数領域データ・セグメントを得るために、修正離散コサイン変換を利用するために適応される、請求項３３に記載の装置。
前記時間領域符号器は、前記データ・セグメントを符号化するために予測フィルタを使用して適応される、請求項２７に記載の装置。
時間領域データストリームに基づいて符号化されたデータストリームを生成するための方法であって、前記時間領域データストリームは、信号のサンプルを有し、前記方法は、
前記データストリームからデータ・セグメントを提供するステップであって、２つの連続的なデータ・セグメントは、第１のまたは第２の重複している領域を有し、前記第２の重複している領域は、前記第１の重複している領域よりも小さい、提供するステップと、
前記データ・セグメントと関連した移行指示を決定するステップと、
前記時間領域においてデータ・セグメントを符号化するステップと、
および／または
ウィンドウ化されたデータ・セグメントを得るために、重みを第１または第２のウィンドウ関数による前記時間領域データストリームのサンプルに適用するステップであって、前記第１および第２のウィンドウ関数は、前記第１および第２の重複している領域に適応される、適用するステップ、および前記周波数領域おいて前記ウィンドウ化されたデータ・セグメントを符号化するステップと、
第１の移行指示を有するデータ・セグメントに対して、時間領域において符号化された出力データは、前記符号化されたデータストリームにおいて含まれ、第２の移行指示を有するデータ・セグメントに対して、前記周波数領域において符号化された出力データは、前記符号化されたデータストリームにおいて含まれるように制御するステップと、
を含む、方法。
コンピュータ・プログラムがコンピュータ上で実行される場合に、請求項３９に記載の方法を実行させるためのプログラム・コードを有するコンピュータ・プログラム。