JP6100164B2

JP6100164B2 - オーディオ信号を処理し、音声音響統合符号化方式（ｕｓａｃ）のためにより高い時間粒度を供給するための装置および方法

Info

Publication number: JP6100164B2
Application number: JP2013532172A
Authority: JP
Inventors: マルクスマルトラス; ベルンハルトグリル; ニコラウスレッテルバッハ; ギヨームフックス; マクスノイエンドルフ; ブルーノビゼット; ロッシュレフェブル; フィリッペグールネイ; シュテファンヴィルデ
Original assignee: フラウンホッファー−ゲゼルシャフトツァフェルダールングデァアンゲヴァンテンフォアシュンクエー．ファオ; ヴォイスエイジ・コーポレーション
Priority date: 2010-10-06
Filing date: 2011-10-04
Publication date: 2017-03-22
Anticipated expiration: 2031-10-04
Also published as: SG189277A1; EP2625688A1; WO2012045744A1; BR112013008463B1; BR112013008463A2; CA2813859C; RU2013120320A; KR20130069821A; AU2011311659B2; KR101407120B1; CN103403799A; TWI486950B; CN103403799B; AR101853A2; RU2562384C2; CA2813859A1; JP2013543600A; US20130226570A1; MY155997A; MX2013003782A

Description

本発明は、オーディオ処理に関し、特に、オーディオ信号を処理し、音声音響統合符号化方式（ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｅｃ）（ＵＳＡＣ）のためにより高い時間粒度を供給するための装置および方法に関する。

ＵＳＡＣは、他のオーディオコーデックのように、固定のフレームサイズを示す（ＵＳＡＣ：２０４８サンプル／フレーム）。１つのフレーム内で、より短い変換サイズの限られた組へ切り替える可能性があるが、フレームサイズは、それでもなお全体のシステムの時間分解能を制限する。全体のシステムの時間粒度を増加させるために、従来のオーディオコーデックに関して、サンプリングレートを増加させて、時間において１フレームのより短い時間（例えばミリ秒）にする。しかし、これは、ＵＳＡＣコーデックに関しては容易にできない。

ＵＳＡＣコーデックは、ＡＣＥＬＰ（ＡＣＥＬＰ＝ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）のような従来の音声コーダのツールに加えて、ＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（先進的音響符号化））変換コーダ、ＳＢＲ（ＳｐｅｃｔｒａｌＢａｎｄＲｅｐｌｉｃａｔｉｏｎ（スペクトル帯域複製））、およびＭＰＥＧサラウンド（ＭＰＥＧ＝ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ）などの従来の一般のオーディオコーデックのツールの組み合わせを含む。ＡＣＥＬＰおよび変換コーダの両方は、通常、同一環境（すなわちフレームサイズ、サンプリングレート）の中で同時に動作して、容易に切り替えられることができる。通常、クリーンな音声信号のためには、ＡＣＥＬＰツールが使用され、音楽、混合された信号のためには、変換コーダが使用される。

ＡＣＥＬＰツールは、比較的低いサンプリングレートでのみ動作するように、同時に制限される。２４ｋｂｉｔ／ｓに関して、わずか１７０７５Ｈｚのサンプリングレートが使用される。より高いサンプリングレートに関しては、ＡＣＥＬＰツールは、機能の点で著しく低下し始める。しかしながら、ＳＢＲおよびＭＰＥＧサラウンドも変換コーダも、非常に高いサンプリングレート、例えば変換コーダについては２２０５０Ｈｚ、ＳＢＲおよびＭＰＥＧサラウンドについては４４１００Ｈｚから利益を得る。しかしながら、これまで、ＡＣＥＬＰツールは、全体のシステムのサンプリングレートを制限し、特に音楽信号に関しては、最適状態に及ばないシステムとなっている。

本発明の目的は、オーディオ信号を処理するための装置および方法についての改善された構想を提供することにある。本発明の目的は、請求項１に記載の装置、請求項１５に記載の方法、請求項１６に記載の装置、請求項１８に記載の方法、および請求項１９に記載のコンピュータプログラムによって解決される。

現在のＵＳＡＣＲＭは、８ｋｂｉｔ／ｓなどの超低ビットレートから１２８ｋｂｉｔ／ｓ以上のビットレートのトランスペアレントな品質までに及ぶ多数の動作点にわたって高い符号化機能を供給する。この種の幅広い範囲のビットレートにわたってこの高品質に達するために、ＭＰＥＧサラウンド、ＳＢＲ、ＡＣＥＬＰおよび従来の変換コーダなどのツールの組み合わせは、使用される。コースのツールのこの種の組み合わせは、ツール相互動作およびこれらのツールが位置付けられる一般の環境の共通の最適化処理を必要とする。

この共通の最適化処理において、ツールのいくつかは、中程度のビットレート範囲（２４ｋｂｉｔ／ｓ〜３２ｋｂｉｔ／ｓ）において高時間構造を明らかにするという信号を再生する不具合があることを分かった。特に、ツールＭＰＥＧサラウンド、ＳＢＲおよびＦＤ変換コーダ（ＦＤ、ＴＣＸ）（ＦＤ＝ＦｒｅｑｕｅｎｃｙＤｏｍａｉｎ；ＴＣＸ＝ＴｒａｎｓｆｏｒｍＣｏｄｅｄＥｘｃｉｔａｔｉｏｎ）、すなわち周波数領域において動作する全てのツールは、時間領域におけるより短いフレームサイズと同一であるより高い時間粒度で作動されるときに、より良く実行することができる。

現状の技術ＨＥ―ＡＡＣｖ２符号器（Ｈｉｇｈ−ＥｆｆｉｃｉｅｎｃｙＡＡＣｖ２ｅｎｃｏｄｅｒ）と比較して、現在のＵＳＡＣ基準品質符号器が、（サンプルにおいて）同じフレームサイズを使用する間、著しく低いサンプリングレートで２４ｋｂｉｔ／ｓや３２ｋｂｉｔ／ｓなどのビットレートで作動することが判明した。これは、ミリ秒のフレームの時間が著しく長いことを意味する。これらの不具合を補償するために、時間粒度を増加することを必要とする。これは、サンプリング周波数を増加させること、または、（例えば、固定のフレームサイズを使用しているシステムの）フレームサイズを短くすることによって達することができる。

サンプリング周波数を増加させることは、ＳＢＲおよびＭＰＥＧサラウンドが時間的動的信号のための機能を増加させるための前方への合理的な方法であるが、これは、すべてのコアコーダツールについて機能するというわけではない。高サンプリング周波数は、変換コーダに有益であるが、同時にＡＣＥＬＰツールの機能を大幅に減少させることがよく知られている。

オーディオ信号を処理するための装置が提供される。本装置は、信号処理装置とコンフィギュレータとを含む。信号処理装置は、オーディオ信号の第１の設定可能なサンプル数を有する第１のオーディオ信号フレームを受信するように構成される。さらに、信号処理装置は、処理されたオーディオ信号を得るために、設定可能なアップサンプリング係数によってオーディオ信号をアップサンプリングするように構成される。さらにまた、信号処理装置は、処理されたオーディオ信号の第２の設定可能なサンプル数を有する第２のオーディオ信号フレームを出力するように構成される。

コンフィギュレータは、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、設定可能なアップサンプリング係数が、第１のアップサンプリング値に等しいように、設定情報に基づいて信号処理装置を設定するように構成される。さらに、コンフィギュレータは、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、設定可能なアップサンプリング係数が、異なる第２のアップサンプリング値に等しいように、信号処理装置を設定するように構成される。第１の比率値または第２比率値は、整数値でない。

上記実施形態によって、信号処理装置は、処理されたアップサンプリングされたオーディオ信号を得るために、オーディオ信号をアップサンプリングする。前記実施形態において、アップサンプリング係数は、設定可能であり、非整数値でありえる。設定可能であること、およびアップサンプリング係数が非整数値でありえることは、装置の柔軟性を高める。第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、設定可能なアップサンプリング係数は、異なる第２のアップサンプリング値を有する。このように、本装置は、アップサンプリング係数と第２および第１のオーディオ信号フレームのフレーム長（すなわちサンプル数）の比率との関係を考慮に入れるように構成される。

一実施形態において、コンフィギュレータは、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第２の比率が、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第１の比率より大きいとき、異なる第２のアップサンプリング値が、第１のアップサンプリング値より大きいように、信号処理装置を設定するように構成される。

一実施形態によれば、ＵＳＡＣコーデックのための新しい動作モード（以下、「追加設定（ｅｘｔｒａｓｅｔｔｅｉｎｇ）」と呼ぶ）が提案される。そして、それは２４ｋｂｉｔ／ｓや３２ｋｂｉｔ／ｓなどの中程度のデータ転送速度に関するシステムの機能を強化する。これらの動作点に関して、現在のＵＳＡＣ基準コーデックの時間分解能があまりに低いことが分かった。従って、ａ）コアコーダに関するサンプリングレートを上昇させることなく、コアコーダフレームサイズを短くすることによって、この時間分解能を増加させること、および、更に、ｂ）これらのツールに関するフレームサイズを変化させることなく、ＳＢＲおよびＭＰＥＧサラウンドに関するサンプリングレートを増加させることが、提案される。

提案された追加設定は、システムの柔軟性を大いに改善する。というのも、それによって、ＡＣＥＬＰツールを含むシステムが、４４．１ｋＨｚおよび４８ｋＨｚなどのより高いサンプリングレートで作動されることができるからである。これらのサンプリングレートは、一般的に市場において求められるので、これがＵＳＡＣコーデックの受信に関して役立つことが期待される。

全部のオーディオコーデックの時間粒度を増加させることによって、現在のＭＰＥＧ音声音響統合符号化方式（ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｉｎｇ）（ＵＳＡＣ）ワーク項目のための新たな動作モードは、全体のコーデックの時間的柔軟性を高める。（第２のサンプル数が同じままだったと仮定して）第２の比率が第１の比率より大きい場合、第１の設定可能なサンプル数が削減されている、すなわち、第１のオーディオ信号フレームのフレームサイズが短くされている。これは、より高い時間粒度をもたらし、周波数領域において作動し、第１のオーディオ信号フレームを処理する全てのツールは、より良く作動することができる。しかしながら、この種の高効率の動作モードにおいて、アップサンプリングされたオーディオ信号を含む第２のオーディオ信号フレームを処理するツールの機能を増加させることも、望ましい。これらのツールの機能のこの種の増加は、アップサンプリングされたオーディオ信号のより高いサンプリングレートによって、すなわち、この種の動作モードのためのアップサンプリング係数を増加させることによって、実現されることができる。さらに、それは周波数領域において作動せず、第１のオーディオ信号フレームを処理して、そして、（元の）オーディオ信号のサンプリングレートが比較的低いときに、最も良く作動する、ＵＳＡＣのＡＣＥＬＰデコーダなどのツールが存在する。これらのツールは、高いアップサンプリング係数から、これが、（元の）オーディオ信号のサンプリングレートがアップサンプリングされたオーディオ信号のサンプリングレートと比較して、比較的低いことを意味するように、利益を得る。上記実施形態は、この種の環境のための効率的な動作モードのための設定モードを供給するように構成された装置を提供する。

全体のオーディオコーデックの時間粒度を増加させることによって、新たな動作モードは、全体のコーデックの時間的柔軟性を高める。

一実施形態において、コンフィギュレータは、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、設定可能なアップサンプリング係数が、第１の比率値に等しいように、信号処理装置を設定するように構成され、そして、コンフィギュレータは、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第２の比率が、異なる第２の比率値を有するとき、設定可能なアップサンプリング係数が、異なる第２の比率値に等しいように、信号処理装置を設定するように構成される。

一実施形態において、コンフィギュレータは、第１の比率が、第１の比率値を有するとき、設定可能なアップサンプリング係数が、２に等しいように、信号処理装置を設定するように構成され、コンフィギュレータは、第２の比率が、異なる第２の比率値を有するとき、設定可能なアップサンプリング係数が、８／３に等しいように、信号処理装置を設定するように構成される。

別の実施形態によれば、コンフィギュレータは、第１の比率が、第１の比率値を有するとき、第１の設定可能なサンプル数が、１０２４に等しく、第２の設定可能なサンプル数が、２０４８に等しいように、信号処理装置を設定するように構成され、コンフィギュレータは、第２の比率が、異なる第２の比率値を有するとき、第１の設定可能なサンプル数が、７６８に等しく、第２の設定可能なサンプル数が、２０４８に等しいように、信号処理装置を設定するように構成される。

一実施形態において、ＵＳＡＣコーダの追加の設定を導入することが提案される。ここで、コアコーダは、より短いフレームサイズ（１０２４サンプルの代わりに７６８サンプル）で作動される。

さらにまた、２：１から８：３までのＳＢＲデコーダ内部でのリサンプリングを、これに関連して、修正することは提案され、ＳＢＲおよびＭＰＥＧサラウンドがより高いサンプリングレートで作動されているのを可能にする。さらに、一実施形態によれば、コアコーダの時間粒度は、１０２４サンプルから７６８サンプルにコアコーダフレームサイズを縮退することによって増加される。このステップによって、サンプリングレート定数をそのままにする一方で、コアコーダの時間粒度は、４／３だけ増加される。このことは、ＡＣＥＬＰが適当なサンプリング周波数（Ｆｓ）で動作することを可能にする。

さらに、ＳＢＲツールで、比率８／３のリサンプリング（従来：比率２）が適用され、３／８Ｆｓでサイズ７６８のコアコーダフレームを、Ｆｓでサイズ２０４８の出力フレームに変換する。これは、ＳＢＲツールおよびＭＰＥＧサラウンドツールが、従来からの高サンプリングレート（例えば４４１００Ｈｚ）で動作させるのを可能にする。このように、すべてのツールがそれらの最適な動作点で動作されるように、音声および音楽信号についての良い品質が提供される。

一実施形態において、信号処理装置は、前処理されたオーディオ信号を得るために、オーディオ信号を復号するためのコアデコーダモジュールと、複数のサブバンド信号を含んでいる周波数領域前処理されたオーディオ信号を得るために、時間領域から周波数領域に第１の前処理されたオーディオ信号を変換するためのいくつかの分析フィルタバンクチャネルを有する分析フィルタバンクと、周波数領域前処理されたオーディオ信号のために、追加のサブバンド信号を生成して、追加するためのサブバンドジェネレータと、処理されたオーディオ信号を得るために、第１の前処理されたオーディオ信号を周波数領域から時間領域に変換するためのいくつかの合成フィルタバンクチャネルを有する合成フィルタバンクとを含む。コンフィギュレータは、設定可能なアップサンプリング係数が、分析フィルタバンクチャネルの数に対する合成フィルタバンクチャネルの数の第３の比率に等しいように、合成フィルタバンクチャネルの数または分析フィルタバンクチャネルの数を設定することによって、信号処理装置を設定するように構成されうる。サブバンドジェネレータは、周波数領域前処理されたオーディオ信号のための追加のサブバンド信号を生成するための前処理されたオーディオ信号ジェネレータのサブバンド信号を複製するように構成されたスペクトル帯域レプリケータ（ＳｐｅｃｔｒａｌＢａｎｄＲｅｐｌｉｃａｔｏｒ）でもよい。さらに、信号処理装置は、ステレオまたはサラウンドチャネルを含む前処理されたオーディオ信号を得るために、前処理されたオーディオ信号を復号するためのＭＰＥＧサラウンドデコーダを含むことができる。さらに、サブバンドジェネレータは、周波数領域前処理されたオーディオ信号のための追加のサブバンド信号が、生成され、周波数領域前処理されたオーディオ信号に追加された後、ＭＰＥＧサラウンドデコーダに周波数領域前処理されたオーディオ信号を送るように構成されうる。

コアデコーダモジュールは、第１のコアデコーダおよび第２のコアデコーダを含むことができる。ここで、第１のコアデコーダは、時間領域において作動するように構成されうり、第２のコアデコーダは、周波数領域において作動するように構成されうる。第１のコアデコーダは、ＡＣＥＬＰデコーダでありえ、第２のコアデコーダは、ＦＤ変換デコーダまたはＴＣＸ変換デコーダでありえる。

一実施形態において、ＡＣＥＬＰコーデックのためのスーパーフレームサイズは、１０２４サンプルから７６８サンプルに削減される。これは、サイズ１９２（サイズ６４の３つのサブフレーム）の４つのＡＣＥＬＰフレームを結合させて、サイズ７６８の１つのコアコーダフレームにすることによって、なされうる（以前：サイズ２５６の４つのＡＣＥＬＰフレームは、サイズ１０２４の１つのコアコーダフレームに結合された）。７６８サンプルのコアコーダフレームサイズにたどり着くための他の解決法は、例えば、サイズ２５６（サイズ６４の４つのサブフレーム）の３つのＡＣＥＬＰフレームを結合することである。

別の実施形態によれば、コンフィギュレータは、オーディオ信号の第１の設定可能なサンプル数または処理されたオーディオ信号の第２の設定可能なサンプル数のうちの少なくとも１つを示している設定情報に基づいて信号処理装置を設定するように構成される。

他の実施形態では、コンフィギュレータは、設定情報に基づいて信号処理装置を設定するように構成され、そこにおいて、設定情報は、オーディオ信号の第１の設定可能なサンプル数および処理されたオーディオ信号の第２の設定可能なサンプル数を示し、設定情報は、設定インデックスである。

さらに、オーディオ信号を処理する装置は、提供される。本装置は、信号処理装置とコンフィギュレータとを含む。信号処理装置は、オーディオ信号の第１の設定可能なサンプル数を有する第１のオーディオ信号フレームを受信するように構成される。さらに、信号処理装置は、処理されたオーディオ信号を得るために、設定可能なダウンサンプリング係数によってオーディオ信号のダウンサンプリングするように構成される。さらにまた、信号処理装置は、処理されたオーディオ信号の第２の設定可能なサンプル数を有する第２のオーディオ信号フレームを出力するように構成される。

コンフィギュレータは、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、設定可能なダウンサンプリング係数が、第１のダウンサンプリング値に等しいように、設定情報に基づいて信号処理装置を設定するように構成されうる。さらに、コンフィギュレータは、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、設定可能なダウンサンプリング係数が、異なる第２のダウンサンプリング値に等しいように、信号処理装置を設定するように構成される。第１の比率値または第２の比率値は、整数値でない。

本発明の好ましい実施態様は、添付した図を参照して以下に説明する。

図１は、一実施形態によるオーディオ信号を処理する装置を示す。図２は、他の実施形態によるオーディオ信号を処理する装置を示す。図３は、一実施形態による装置によって行われたアップサンプリング処理を示す。図４は、更なる実施形態によるオーディオ信号を処理するための装置を示す。図５ａは、実施形態によるコアデコーダモジュールを示す。図５ｂは、図５ａによるコアデコーダモジュールを有する図４の実施形態によるオーディオ信号を処理するための装置を示す。図６ａは、４つのＡＣＥＬＰフレームを含んでいるＡＣＥＬＰスーパーフレームを示す。図６ｂは、３つのＡＣＥＬＰフレームを含んでいるＡＣＥＬＰスーパーフレームを示す。図７ａは、ＵＳＡＣのデフォルト設定を示す。図７ｂは、実施形態によるＵＳＡＣの追加設定を示す。図８ａは、ＭＵＳＨＲＡ法による試聴テストの結果を示す。図８ｂは、ＭＵＳＨＲＡ法による試聴テストの結果を示す。図９は、別の実施形態によるオーディオ信号を処理する装置を示す。

図１は、実施形態によるオーディオ信号を処理する装置を示す。本装置は、信号処理装置１１０とコンフィギュレータ１２０とを含む。信号処理装置１１０は、オーディオ信号の第１の設定可能な数のサンプル１４５を有する第１のオーディオ信号フレーム１４０を受信するように構成される。さらに、信号処理装置１１０は、処理されたオーディオ信号を得るために、設定可能なアップサンプリング係数によってオーディオ信号をアップサンプリングするように構成される。さらにまた、信号処理装置は、処理されたオーディオ信号の第２の設定可能な数のサンプル１５５を有する第２のオーディオ信号フレーム１５０を出力するように構成される。

コンフィギュレータ１２０は、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、設定可能なアップサンプリング係数が、第１のアップサンプリング値に等しいように、設定情報ｃｉに基づいて信号処理装置１１０を設定するように構成される。さらに、コンフィギュレータ１２０は、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、設定可能なアップサンプリング係数が、異なる第２のアップサンプリング値に等しいように、信号処理装置１１０を設定するように構成される。第１の比率値または第２比率値は、整数値でない。

図１の装置は、例えば復号の処理において使用されることができる。

一実施形態によれば、コンフィギュレータ１２０は、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第２の比率が、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第１の比率より大きいとき、異なる第２のアップサンプリング値が、第１の異なるアップサンプリング値より大きいように、信号処理装置１１０を設定するように構成されうる。別の実施形態において、コンフィギュレータ１２０は、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、設定可能なアップサンプリング係数が、第１の比率値に等しいように、信号処理装置１１０を設定するように構成され、コンフィギュレータ１２０は、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第２の比率が、異なる第２の比率値を有するとき、設定可能なアップサンプリング係数が、異なる第２の比率値に等しいように、信号処理装置１１０を設定するように構成される。

他の実施形態において、コンフィギュレータ１２０は、第１の比率が、第１の比率値を有するとき、設定可能なアップサンプリング係数が２に等しいように、信号処理装置１１０を設定するように構成され、コンフィギュレータ１２０は、第２の比率が、異なる第２の比率値を有するとき、設定可能なアップサンプリング係数が、８／３に等しいように、信号処理装置１１０を設定するように構成される。別の実施形態によれば、コンフィギュレータ１２０は、第１の比率が、第１の比率値を有するとき、第１の設定可能なサンプル数が、１０２４に等しく、第２の設定可能なサンプル数が、２０４８に等しいように、信号処理装置１１０を設定するように構成され、コンフィギュレータ１２０は、第２の比率が、異なる第２の比率値を有するとき、第１の設定可能なサンプル数が、７６８に等しく、第２の設定可能なサンプル数が、２０４８に等しいように、信号処理装置１１０を設定するように構成される。

実施形態において、コンフィギュレータ１２０は、設定情報ｃｉに基づいて信号処理装置１１０を設定するように構成され、設定情報ｃｉは、アップサンプリング係数、オーディオ信号の第１の設定可能なサンプル数、および処理されたオーディオ信号の第２の設定可能なサンプル数を示し、設定情報は、設定インデックスである。

下記の表は、設定情報として設定インデックスのための一例を示す。

ここで、「Ｉｎｄｅｘ」は、設定インデックスを示し、「ｃｏｒｅＣｏｄｅｒＦｒａｍｅＬｅｎｇｔｈ」は、オーディオ信号の第１の設定可能なサンプル数を示し、「ｓｂｒＲａｔｉｏ」は、アップサンプリング係数を示し、「ｏｕｔｐｕｔＦｒａｍｅＬｅｎｇｔｈ」は、処理されたオーディオ信号の第２の設定可能なサンプル数を示す。

図２は、他の実施形態による装置を示す。装置は、信号処理装置２０５とコンフィギュレータ２０８とを含む。信号処理装置２０５は、コアデコーダモジュール２１０と、分析フィルタバンク２２０と、サブバンドジェネレータ２３０と、合成フィルタバンク２４０とを含む。

コアデコーダモジュール２１０は、オーディオ信号ａｓ１を受信するように構成される。オーディオ信号ａｓ１を受信した後に、コアデコーダモジュール２１０は、前処理されたオーディオ信号ａｓ２を得るために、オーディオ信号を復号する。次に、コアデコーダモジュール２１０は、時間領域において示される前処理されたオーディオ信号ａｓ２を、分析フィルタバンク２２０に供給する。

分析フィルタバンク２２０は、複数のサブバンド信号を含んでいる周波数領域前処理されたオーディオ信号（ａｆｒｅｑｕｅｎｃｙ−ｄｏｍａｉｎｐｒｅｐｒｏｃｅｓｓｅｄａｕｄｉｏｓｉｇｎａｌ）ａｓ３を得るために、前処理されたオーディオ信号ａｓ２を時間領域から周波数領域に変換するように構成される。分析フィルタバンク２２０は、設定可能な数の分析フィルタバンクチャネル（分析フィルタバンクバンド）を有する。分析フィルタバンクチャネルの数は、時間領域前処理されたオーディオ信号ａｓ２から生成されるサブバンド信号の数を決定する。一実施形態において、分析フィルタバンクチャネルの数は、設定可能なパラメータｃ１の値をセットすることによってセットされることができる。例えば、分析フィルタバンク２２０は、３２本または２４本の分析フィルタバンクチャネルを有するように設定されることができる。図２の実施形態において、分析フィルタバンクチャネルの数は、コンフィギュレータ２０８の設定情報ｃｉに従ってセットされることができる。前処理されたオーディオ信号ａｓ２を周波数領域に変換した後に、分析フィルタバンク２２０は、周波数領域前処理されたオーディオ信号ａｓ３をサブバンドジェネレータ２３０に送る。

サブバンドジェネレータ２３０は、周波数領域オーディオ信号ａｓ３のための追加のサブバンド信号を生成するように構成される。さらに、サブバンドジェネレータ２３０は、前処理された周波数領域オーディオ信号ａｓ３のサブバンド信号およびサブバンドジェネレータ２３０によって生成された、生成された追加のサブバンド信号を含む修正された周波数領域オーディオ信号ａｓ４を得るために、前処理された周波数領域オーディオ信号ａｓ３を修正するように構成される。サブバンドジェネレータ２３０によって生成される追加のサブバンド信号の数は、設定可能である。一実施形態において、サブバンドジェネレータは、スペクトル帯域レプリケータ（ＳｐｅｃｔｒａｌＢａｎｄＲｅｐｌｉｃａｔｏｒ）（ＳＢＲ）である。サブバンドジェネレータ２３０は、次に、修正された周波数領域前処理されたオーディオ信号ａｓ４を合成フィルタバンクに送る。

合成フィルタバンク２４０は、時間領域処理されたオーディオ信号（ａｔｉｍｅ−ｄｏｍａｉｎｐｒｏｃｅｓｓｅｄａｕｄｉｏｓｉｇｎａｌ）ａｓ５を得るために、修正された周波数領域前処理されたオーディオ信号ａｓ４を周波数領域から時間領域に変換するように構成される。合成フィルタバンク２４０は、設定可能な数の合成フィルタバンクチャネル（合成フィルタバンクバンド）を有する。合成フィルタバンクチャネルの数は、設定可能である。一実施形態において、合成フィルタバンクチャネルの数は、設定可能なパラメータｃ２の値をセットすることによって、セットされることができる。例えば、合成フィルタバンク２４０は、６４本の合成フィルタバンクチャネルを有するように設定されることができる。図２の実施形態において、コンフィギュレータ２０８の設定情報ｃｉは、分析フィルタバンクチャネルの数をセットすることができる。修正された周波数領域前処理されたオーディオ信号ａｓ４を時間領域に変換することによって、処理されたオーディオ信号ａｓ５が得られる。

一実施形態において、修正された周波数領域前処理されたオーディオ信号ａｓ４のサブバンドチャネルの数は、合成フィルタバンクチャネルの数に等しい。このような実施形態では、コンフィギュレータ２０８は、サブバンドジェネレータ２３０によって生成される追加サブバンドチャネルの数を設定するように構成される。コンフィギュレータ２０８は、コンフィギュレータ２０８によって設定された合成フィルタバンクチャネルｃ２の数が、サブバンドジェネレータ２３０によって生成された追加のサブバンド信号の数に前処理された周波数領域オーディオ信号ａｓ３のサブバンドチャネルの数を加えた数に等しいように、サブバンドジェネレータ２３０によって生成される追加サブバンドチャネルの数を設定するように構成されうる。これによって、合成フィルタバンクチャネルの数は、修正された前処理された周波数領域オーディオ信号ａｓ４のサブバンド信号の数に等しい。

オーディオ信号ａｓ１がサンプリングレートｓｒ１を有すると仮定し、分析フィルタバンク２２０がｃ１の分析フィルタバンクチャネルを有し、合成フィルタバンク２４０がｃ２の合成フィルタバンクチャネルを有すると仮定すると、処理されたオーディオ信号ａｓ５は、サンプリングレートｓｒ５：ｓｒ５＝（ｃ２／ｃ１）・ｓｒ１を有する。ｃ２／ｃ１は、アップサンプリング係数ｕ：ｕ＝ｃ２／ｃ１を決定する。

図２の実施形態において、アップサンプリング係数ｕは、整数値でない数にセットされることができる。例えば、アップサンプリング係数ｕは、分析フィルタバンクチャネルの数ｃ１＝２４をセットすることによって、そして、合成フィルタバンクの数ｃ２＝６４をセットすることによって、ｕ＝８／３＝６４／２４となるように、値８／３にセットされることができる。

サブバンドジェネレータ２３０が、スペクトル帯域レプリケータであると仮定すると、一実施形態によるスペクトル帯域レプリケータは、元のサブバンドから任意の数の追加のサブバンドを生成することができる。そこにおいて、すでに利用できるサブバンドの数に対する生成された追加のサブバンドの数の比率は、整数である必要はない。例えば、一実施形態によるスペクトル帯域レプリケータは、次のステップを行うことができる。

第１のステップにおいて、スペクトル帯域レプリケータは、いくつかの追加のサブバンドを生成することによっていくつかのサブバンド信号を複製する。そこにおいて、生成された追加のサブバンドの数は、すでに利用できるサブバンドの数の整数倍でありえる。例えば、２４の（または、例えば、４８の）追加のサブバンド信号が、オーディオ信号の２４の元のサブバンド信号から生成されることができる（例えば、サブバンド信号の合計数は、２倍または３倍になりうる）。

第２のステップにおいて、サブバンド信号の所望の数がｃ１２であり、実際の利用できるサブバンド信号の数がｃ１１であると仮定すると、３つの異なる状況が、区別されうる。

ｃ１１がｃ１２に等しい場合、利用できるサブバンド信号の数ｃ１１は、必要とされるサブバンド信号の数ｃ１２に等しい。サブバンド調整は、必要でない。

ｃ１２がｃ１１より小さい場合、利用できるサブバンド信号の数ｃ１１は、必要とされるサブバンド信号の数ｃ１２より大きい。実施形態によれば、最も高い周波数のサブバンド信号は、削除されうる。例えば、６４のサブバンド信号が利用できる場合、そして、６１のサブバンド信号のみが必要とされる場合、最も高い周波数を有する３つのサブバンド信号は、除かれうる。

ｃ１２がｃ１１より大きい場合、利用できるサブバンド信号の数ｃ１１は、必要とされるサブバンド信号の数ｃ１２より小さい。

実施形態によれば、追加のサブバンド信号は、追加のサブバンド信号、すなわち、各サブバンドサンプルの振幅値がゼロに等しい信号として、ゼロ信号を追加することによって生成されうる。他の実施形態によれば、追加のサブバンド信号は、追加のサブバンド信号、すなわち、各サブバンドサンプルの値が擬似ランダムデータを含むサブバンド信号として、擬似ランダムサブバンド信号を追加することによって生成されうる。他の実施形態において、追加のサブバンド信号は、追加のサブバンド信号（複製されたサブバンド信号）のサンプル値としてそれらを使用するために、最も高いサブバンド信号のサンプル値、または最も高いサブバンド信号を複製することによって、生成されうる。

実施形態によるスペクトル帯域レプリケータにおいて、利用できるベースバンドサブバンドは、すべてのサブバンドが満たされるように、最も高いサブバンドとして、複製され、使用されることができる。同じベースバンドサブバンドは、すべての欠落したサブバンドが値を満たされるように、２回または複数回、複製されうる。

図３は、一実施形態による装置によって処理されるアップサンプリング処理を示す。時間領域オーディオ信号３１０およびオーディオ信号３１０のいくつかのサンプル３１５が示される。オーディオ信号は、３つのサブバンド信号３３０を含んでいる周波数領域オーディオ信号３２０を得るために、周波数領域、例えば時間―周波数領域において変換される。（この単純化している例において、分析フィルタバンクが３本のチャネルを含むと仮定されている。）周波数領域オーディオ信号３３０のサブバンド信号は、周波数領域オーディオ信号３２０が、元の３つのサブバンド信号３３０および生成された３つの追加のサブバンド信号３３５を含むように、３つの追加のサブバンド信号３３５を得るために複製されることができる。次に、２つの更に追加のサブバンド信号３３８、例えばゼロ信号、擬似ランダムサブバンド信号、または複製されたサブバンド信号が、生成される。周波数領域オーディオ信号は、それから、結果として、元の時間領域オーディオ信号３１０のサンプリングレートの８／３倍であるサンプリングレートを有する時間領域オーディオ信号３５０となっている時間領域に変換される。

図４は、別の実施形態による装置を示す。本装置は、信号処理装置４０５とコンフィギュレータ４０８とを含む。信号処理装置４０５は、コアデコーダモジュール２１０、分析フィルタバンク２２０、サブバンドジェネレータ２３０および合成フィルタバンク２４０を含み、それらは、図２の実施形態の各ユニットに対応する。さらに、信号処理装置４０５は、ステレオまたはサラウンドチャネルを有する前処理されたオーディオ信号を得るために、前処理されたオーディオ信号を復号するためのＭＰＥＧサラウンドデコーダ４１０（ＭＰＳデコーダ）を含む。サブバンドジェネレータ２３０は、周波数領域前処理されたオーディオ信号のための追加のサブバンド信号が、周波数領域前処理されたオーディオ信号において、生成され、追加された後に、周波数領域前処理されたオーディオ信号をＭＰＥＧサラウンドデコーダ４１０に送るように構成される。

図５ａは、実施形態によるコアデコーダモジュールを示す。コアデコーダモジュールは、第１のコアデコーダ５１０と第２のコアデコーダ５２０とを含む。第１のコアデコーダ５１０は、時間領域において作動するように構成され、第２のコアデコーダ５２０は、周波数領域において作動するように構成される。図５ａにおいて、第１のコアデコーダ５１０は、ＡＣＥＬＰデコーダであり、第２のコアデコーダ５２０は、ＦＤ変換デコーダ、例えばＡＡＣ変換デコーダである。代わりの実施形態において、第２のコアデコーダ５２０は、ＴＣＸ変換デコーダである。到来するオーディオ信号部ａｓｐが音声データまたは他のオーディオデータを含むかどうかに依存して、到来するオーディオ信号部ａｓｐは、ＡＣＥＬＰデコーダ５１０によって、または、ＦＤ変換デコーダ５２０によって処理される。コアデコーダモジュールの出力は、オーディオ信号の前処理された部分ｐｐ―ａｓｐである。

図５ｂは、図５ａによるコアデコーダモジュールを有する図４の実施形態によるオーディオ信号を処理する装置を示す。

実施形態において、ＡＣＥＬＰコーデックのためのスーパーフレームサイズは、１０２４サンプルから７６８のサンプルに削減される。これは、サイズ１９２（サイズ６４の３つのサブフレーム）の４つのＡＣＥＬＰフレームをサイズ７６８の１つのコアコーダフレームに結合することによってなされうる（従来：サイズ２５６の４つのＡＣＥＬＰフレームが、サイズ１０２４のコアコーダフレームに結合された）。図６ａは、４つのＡＣＥＬＰフレーム６１０を含んでいるＡＣＥＬＰスーパーフレーム６０５を示す。ＡＣＥＬＰフレーム６１０のそれぞれは、３つのサブフレーム６１５を含む。

７６８のサンプルのコアコーダフレームサイズに達するための他の解決法は、例えば、サイズ２５６（サイズ６４の４つのサブフレーム）の３つのＡＣＥＬＰフレームを結合することである。図６ｂは、３つのＡＣＥＬＰフレーム６３０を含んでいるＡＣＥＬＰスーパーフレーム６２５を示す。ＡＣＥＬＰフレーム６３０のそれぞれは、４つのサブフレーム６３５を含む。

図７ｂは、デコーダ観点から提案された追加の設定をまとめており、それを従来のＵＳＡＣ設定と比較する。図７ａおよび図７ｂは、一般的に、２４ｋｂｉｔ／ｓまたは３２ｋｂｉｔ／ｓとして動作点で使用されるように、デコーダ構造をまとめる。

ＵＳＡＣＲＭ９（ＵＳＡＣ基準モデル９）、デフォルト設定を示している図７ａにおいて、オーディオ信号フレームは、ＱＭＦ分析フィルタバンク７１０に入力される。ＱＭＦ分析フィルタバンク７１０は、３２本のチャネルを有する。ＱＭＦ分析フィルタバンク７１０は、時間領域オーディオ信号を周波数領域に変換するように構成され、周波数領域オーディオ信号は、３２サブバンドを含む。周波数領域オーディオ信号は、次にアップサンプラ（ｕｐｓａｍｐｌｅｒ）７２０に入力される。アップサンプラ７２０は、アップサンプリング係数２によって周波数領域オーディオ信号をアップサンプリングするように構成される。このように、６４のサブバンドを含んでいる周波数領域アップサンプラ出力信号は、アップサンプラによって生成される。アップサンプラ７２０は、ＳＢＲ（スペクトル帯域複製）アップサンプラである。すでに述べたように、スペクトル帯域複製は、スペクトル帯域レプリケータに入力されているより低い周波数サブバンドからより高い周波数サブバンドを生成するために使用される。

アップサンプリングされた周波数領域オーディオ信号は、次にＭＰＥＧサラウンド（ＭＰＳ）デコーダ７３０に送られる。ＭＰＳデコーダ７３０は、サラウンド信号の周波数領域チャネルを得るために、ダウンミックスされたサラウンド信号を復号するように構成される。例えば、ＭＰＳデコーダ７３０は、周波数領域サラウンド信号の２本のアップミックスされた周波数領域サラウンドチャネルを生成するように構成されうる。他の実施形態において、ＭＰＳデコーダ７３０は、周波数領域サラウンド信号の５本のアップミックスされた周波数領域サラウンドチャネルを生成するように構成されうる。周波数領域サラウンド信号のチャネルは、次に、ＱＭＦ合成フィルタバンク７４０に送られる。ＱＭＦ合成フィルタバンク７４０は、サラウンド信号の時間領域チャネルを得るために、周波数領域サラウンド信号のチャネルを時間領域に変換するように構成される。

図に示すように、ＵＳＡＣデコーダは、２：１システムとして、そのデフォルト設定において作動する。コアコーデックは、出力サンプリングレートｆｏｕｔの半分で、１０２４のサンプル／フレームの粒度において作動する。３２バンド分析ＱＭＦフィルタバンクを、同じレートで動作している６４バンド合成ＱＭＦバンクと組み合わせることによって、２倍でのアップサンプリングが、ＳＢＲツール内部で暗に実行される。ＳＢＲツールは、ｆｏｕｔでサイズ２０４８のフレームを出力する。

図７ｂは、ＵＳＡＣのための提案された追加設定を示す。ＱＭＦ分析フィルタバンク７５０、アップサンプラ７６０、ＭＰＳデコーダ７７０および合成フィルタバンク７８０が示される。

デフォルト設定とは対照的に、ＵＳＡＣコーデックは、８／３システムとして提案された追加設定において作動する。コアコーダは、出力サンプリングレートｆｏｕｔの３／８倍で動作する。同じ状況において、コアコーダフレームサイズは３／４倍に縮小された。ＳＢＲツール内部の２４バンド分析ＱＭＦフィルタバンクと６４バンド合成フィルタバンクとの組み合わせによって、２０４８のサンプルのフレーム長でｆｏｕｔの出力サンプリングレートが、達成されることができる。

この設定は、コアコーダおよび追加のツールの両方に関して、非常に増加した時間粒度を可能にする。ＳＢＲおよびＭＰＥＧサラウンドのようなツールがより高サンプリングレートで作動されることができるのに対して、コアコーダサンプリングレートは、削減される、そして、その代わりに、フレーム長は短くされる。この方法によって、すべての要素が、それらの最適環境において動作することができる。

一実施形態において、ＡＡＣコーダが出力サンプリングレートｆｏｕｔの３／８で作動する場合であっても、コアコーダとして使用されるＡＡＣコーダは、それでもなお、１／２のｆｏｕｔサンプリングレートに基づいてスケールファクタ（ｓｃａｌｅｆａｃｔｏｒ）を決定することができる。

下表は、ＵＳＡＣ基準品質符号器において用いられているようなＵＳＡＣのためのサンプリングレートおよびフレーム時間に関する詳細な数を提供する。表に示すように、提案された新たな設定のフレーム時間は、約２５％分減少することができ、それはすべての非定常信号のためのプラスの効果につながる。というのも、符号化雑音の拡散もまた、同比率で削減することができるからである。この削減は、その最適化された動作範囲からＡＣＥＬＰツールを動かしてしまうであろうコアコーダサンプリング周波数の増加をすることなく、成し遂げられることができる。

その表は、２４ｋｂｉｔ／ｓで基準品質符号器において用いられているように、デフォルトおよび提案された新たな設定についてのサンプリングレートおよびフレーム時間を示す。

以下に、更に詳細に提案された新たな設定を実行するためのＵＳＡＣデコーダに対する必要な修正が説明される。

変換コーダに関して、より短いフレームサイズは、３／４倍で変換およびウィンドウサイズをスケールすることによって、容易に達成されることができる。標準モードのＦＤコーダが、１０２４および１２８の変換サイズによって作動するのに対して、サイズ７６８および９６の追加の変換は、新たな設定によって導入される。ＴＣＸについては、７６８、３８４および１９２のサイズの追加の変換が必要である。ウィンドウ係数によって新しい変換サイズを特定することは別として、変換コーダは、変化しないままでありえる。

ＡＣＥＬＰツールに関して、全体のフレームサイズは、７６８のサンプルに適合されることを必要とする。この目的を達成するための１つの方法は、７６８のサンプルの各フレーム内にはまっている１９２のサンプルの４つのＡＣＥＬＰフレームによって、フレームの全体の構造を変化させないままにすることである。削減されたフレームサイズへの適合は、フレームごとにサブフレームの数を４から３に減少させることによって成し遂げられる。ＡＣＥＬＰサブフレーム長は、６４のサンプルで変えられない。サブフレームの削減された数を可能にするために、ピッチ情報は、わずかに異なる方式を使用して符号化される。３ピッチ値は、標準モデルの９、６、９および６ビットを使用した絶対−相対−絶対−相対方式の代わりに、それぞれ９、６および６ビットを使用した絶対−相対−相対方式を使用して符号化される。しかし、ピッチ情報を符号化するその他の方法は、可能である。さまざまな量子化器（ＬＰＣフィルタ、ゲイン、その他）だけでなく、ＡＣＥＬＰコードブックなどのＡＣＥＬＰコーデックの他の要素も不変のままにされる。

７６８のサンプルの全部のフレームサイズを達成する他の方法は、サイズ７６８の１つのコアコーダフレームのためのサイズ２５６の３つのＡＣＥＬＰフレームを結合することである。

ＳＢＲツールの機能は、不変のままである。しかし、３２バンド分析バンドＱＭＦに加えて、係数８／３のアップサンプリングを可能にするために、２４バンド分析ＱＭＦが必要とされる。

以下に、計算煩雑性に対する提案された追加の動作点の影響が説明される。これは、最初にコーデックツールベースごとになされ、最後にまとめられる。その煩雑性は、これらの動作点のための対応するＨＥ―ＡＡＣｖ２設定と比較される高ビットレートでＵＳＡＣ基準品質符号器によって使用されるように、デフォルトサンプリングレートモードに対して、そして、高サンプリングモードに対して、比較される。

変換コーダに関して、変換コーダ部の煩雑性は、サンプリングレートおよび変換長でスケールされる。提案されたコアコーダサンプリングレートは、それを粗いままにする。変換サイズは、３／４倍で削減される。これによって、計算煩雑性は、基礎をなすＦＦＴに関する混合基数法（ｍｉｘｅｄｒａｄｉｘａｐｐｒｏａｃｈ）であるとすると、ほとんど同じ率で削減される。全体として、変換ベースのデコーダの煩雑性は、現在のＵＳＡＣ動作点と比較して、わずかに削減されると予想され、高サンプリング動作モードと比較して、３／４倍に削減される。

ＡＣＥＬＰに関して、ＡＣＥＬＰツールの煩雑性は、主に以下の動作の中に集まる。

励振の復号化：演算の煩雑性は、１秒あたりのサブフレームの数と比例しており、それは同様にコアコーダサンプリング周波数（６４サンプルで不変のサブフレームサイズ）に正比例する。従って、それは、新たな設定とほとんど同じである。

バス・ポストフィルタを含むＬＰＣフィルタリングおよび他の合成演算：この演算の煩雑性は、コアコーダサンプリング周波数に正比例して、従って、ほとんど同じである。

全体として、ＡＣＥＬＰデコーダの予想される煩雑性は、現在のＵＳＡＣ動作点と比較して変化していないと予想され、高サンプリング動作モードと比較して３／４倍に削減される。

ＳＢＲに関して、ＳＢＲ煩雑性の主な要因は、ＱＭＦフィルタバンクである。ここでの煩雑性は、サンプリングレート及び変換サイズに比例する。特に、分析フィルタバンクの煩雑性は、およそ３／４倍で削減される。

ＭＰＥＧサラウンドに関して、ＭＰＥＧサラウンドパートの煩雑性は、サンプリングレートによって比例する。提案された追加動作モードは、ＭＰＥＧサラウンドツールの煩雑性に、直接的な影響を及ぼさない。

全体で、提案された新たな動作モードの煩雑性が、より高いサンプリングレートモードで動作するとき、ＵＳＡＣデコーダの煩雑性よりは下であるが、低サンプリングレートモードと比較してわずかに煩雑であることが分かった（ＵＳＡＣＲＭ９、高ＳＲ：１３．４ＭＯＰＳ、提案された新たな動作点：１２．８ＭＯＰＳ）。

テストされた動作点について、煩雑性は、以下のように評価される。

３４．１５ｋＨｚで作動されるＵＳＡＣＲＭ９：約４．６ＷＭＯＰＳ；
４４．１ｋＨｚで作動されるＵＳＡＣＲＭ９：約５．６ＷＭＯＰＳ；
提案された新たな動作点：約５．０ＷＭＯＰＳ。

ＵＳＡＣデコーダが、そのデフォルト設定における４８ｋＨｚまでのサンプリングレートを処理することができる必要があると予想されるので、欠点は、この提案された新たな動作点によって予想されない。

メモリ要求に関して、提案された追加の動作モードは、追加のＭＤＣＴウィンドウ・プロトタイプの記憶装置を必要とする。そして、それは追加のＲＯＭ要求を全体で９００ワード（３２ビット）以下にまとめる。（およそ２５キロワード（ｋＷｏｒｄ）である）全体のデコーダＲＯＭ要求を考慮すると、これはごくわずかであるように思われる。

試聴テストの結果は、音声項目についての品質を劣化させずに、音楽および混合された項目についての有意な改善を示す。この追加設定は、ＵＳＡＣコーデックの追加の動作モードを意図する。

ＭＵＳＨＲＡ法による試聴テストは、２４ｋｂｉｔ／ｓモノラルで、提案された新たな設定の機能を評価するために行われた。以下の条件が、テストに含まれた。隠れ基準（Ｈｉｄｄｅｎｒｅｆｅｒｅｎｃｅ）、３．５ｋＨｚのローパスアンカー（ａｎｃｈｏｒ）、ＵＳＡＣＷＤ７基準品質（ＷＤ７＠３４．１５ｋＨｚ）、高サンプリングレートで作動されたＵＳＡＣＷＤ７（ＷＤ７＠４４．１ｋＨｚ）、ＵＳＡＣＷＤ７基準品質、提案された新たな設定（ＷＤ７＿ＣＥ＠４４．１ｋＨｚ）。

テストは、ＵＳＡＣテストセットの１２項目と、以下の追加の項目をカバーした。ｓｉ０２：カスタネット、ｖｅｌｖｅｔ：電子音楽、ｘｙｌｏｐｈｏｎｅ：オルゴール。

図８ａおよび図８ｂは、テストの結果を示す。２２人の被験者が、試聴テストに参加した。スチューデントのｔ（Ｓｔｕｄｅｎｔ―ｔ）確率分布が、評価のために使用された。

平均スコア（９５％有意水準）の評価に関して、４４．１ｋＨｚの高サンプリングレートで作動されるＷＤ７が２つの項目（ｅｓ０１、ＨａｒｒｙＰｏｔｔｅｒ）に関してＷＤ７より著しく悪く作動したことを観察することができる。ＷＤ７と本技術を特徴とするＷＤ７との間には、有意差を観察することができない。

差分のスコアの評価に関して、４４．１ｋＨｚで作動されるＷＤ７が、６つの項目（ｅｓ０１、ｌｏｕｉｓ＿ｒａｑｕｉｎ、ｔｅ１、ＷｅｄｄｉｎｇＳｐｅｅｃｈ、ＨａｒｒｙＰｏｔｔｅｒ、ＳｐｅｅｃｈＯｖｅｒＭｕｓｉｃ＿４）および全項目にわたって平均されたものについて、ＷＤ７より悪く作動することが観察される。悪く作動する項目は、すべての純粋な音声項目と、混合された音声／音楽項目の２つを含む。更に、４４．１ｋＨｚで作動されるＷＤ７が、４つの項目（ｔｗｉｎｋｌｅ、ｓａｌｖａｔｉｏｎ、ｓｉ０２、ｖｅｌｖｅｔ）のためのＷＤ７より著しく良く作動することが観察されることができる。これらの項目の全ては、音楽信号の大部分を含む、または、音楽と分類される。

テストされた本技術については、それが５つの項目（ｔｗｉｎｋｌｅ、ｓａｌｖａｔｉｏｎ、ｔｅ１５、ｓｉ０２、ｖｅｌｖｅｔ）に関して、加えて、全項目にわたって平均されたときに関して、ＷＤ７より良く観察されることができる。それがよりよく作動する項目の全ては、音楽信号の大部分を含む、または、音楽と分類される。劣化は、観察されることができない。

上記の実施形態によって、中程度のＵＳＡＣビットレートのための新たな設定が提供される。この新たな設定は、ＵＳＡＣコーデックが、ＡＣＥＬＰツールの品質を断念することなく、変換コーダ、ＳＢＲおよびＭＰＥＧサラウンドなどのすべての関連したツールのためのその時間粒度を増加させることを可能にする。これによって、高い時間的構造を示している音楽および混合された信号のために、特に、中程度のビットレート範囲のための品質が改善されうる。更に、ＡＣＥＬＰツールを含むＵＳＡＣコーデックは、４４．１ｋＨｚなどのサンプリングレートのより広い範囲で使用されることができるので、ＵＳＡＣシステムは、柔軟性において利益を得る。

図９は、オーディオ信号を処理する装置を示す。本装置は、信号処理装置９１０とコンフィギュレータ９２０とを含む。信号処理装置９１０は、オーディオ信号の第１の設定可能な数のサンプル９４５を有する第１のオーディオ信号フレーム９４０を受信するように構成される。さらに、信号処理装置９１０は、処理されたオーディオ信号を得るために、設定可能なダウンサンプリング係数によってオーディオ信号をダウンサンプルするように構成される。さらにまた、信号処理装置は、処理されたオーディオ信号の第２の設定可能な数のサンプル９５５を有する第２のオーディオ信号フレーム９５０を出力するように構成される。

コンフィギュレータ９２０は、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、設定可能なダウンサンプリング係数が、第１のダウンサンプリング値に等しいように、設定情報ｃｉ２に基づいて信号処理装置９１０を設定するように構成される。さらに、コンフィギュレータ９２０は、第１の設定可能なサンプル数に対する第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、設定可能なダウンサンプリング係数が、異なる第２のダウンサンプリング値に等しいように、信号処理装置９１０を設定するように構成される。第１の比率値または第２の比率値は、整数値でない。

図９による装置は、例えば、符号化の処理において使用されることができる。

いくつかの態様が装置に関連して説明されたが、これらの態様が、また、対応する方法の記載を示すことは明らかである。ここで、ブロックまたはデバイスは、方法ステップまたは方法ステップの機能に対応する。同様に、方法ステップに関連して説明された態様は、対応するブロックまたは項目の記載または対応する装置の機能を示す。

本発明の分解された信号は、デジタル記憶媒体に格納されることができる、又は、無線伝送媒体または例えばインターネットなどの有線伝送媒体などの伝送媒体で送られることができる。

特定の実施態様に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて実行されることができる。その実施態様は、各方法が実行されるように、プログラミング可能な計算機システムと協動する（または協動することができる）その上に格納される電子的に読み込み可能な制御信号を有するデジタル記憶媒体、例えばフロッピー（登録商標）ディスク、ＤＶＤ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはＦＬＡＳＨメモリを使用して実行されることができる。

本発明によるいくつかの実施形態は、本願明細書において説明された方法のうちの１つが実行されるように、プログラミング可能な計算機システムと協動することができる電子的に読み込み可能な制御信号を有する一時的でないデータキャリアを含む。

通常、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実行されることができる。そして、コンピュータプログラム製品がコンピュータ上で動作するとき、プログラムコードが、本方法のうちの１つを実行するために実施される。プログラムコードは、例えば、機械読み取り可読キャリアに格納されることができる。

他の実施形態は、機械読み取り可読キャリアに格納された、本願明細書において説明された方法のうちの１つを実行するためのコンピュータプログラムを含む。

従って、換言すれば、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で動作するとき、本願明細書において説明された方法のうちの１つを実行するためのプログラムコードを有するコンピュータプログラムである。

従って、本発明の方法の更なる実施形態は、その上に記録されて、本願明細書において説明された方法のうちの１つを実行するためのコンピュータプログラムを含んでいるデータキャリア（またはデジタル記憶媒体またはコンピュータ可読媒体）である。

従って、本発明の方法の更なる実施形態は、本願明細書において説明された方法のうちの１つを実行するためのコンピュータプログラムを示しているデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続を介して、例えばインターネットを介して送信されるように構成されることができる。

更なる実施形態は、本願明細書において説明された方法のうちの１つを実行するために設定または構成される処理手段、例えばコンピュータまたはプログラム可能な論理回路を含む。

更なる実施形態は、本願明細書において説明された方法のうちの１つを実行するためのコンピュータプログラムをその上にインストールされているコンピュータを含む。

いくつかの実施形態において、プログラム可能な論理回路（例えば論理プログラミング可能デバイス）は、本願明細書において説明された方法の機能の一部または全てを実行するために使用されることができる。いくつかの実施形態において、論理プログラミング可能デバイスは、本願明細書において説明された方法のうちの１つを実行するために、マイクロプロセッサと協動することができる。通常、本方法は、好ましくは、いかなるハードウェア装置によっても実行される。

上記実施形態は、本発明の原理のために、単に示しているだけである。本願明細書において説明された装置の修正変更および詳細が、他の当業者にとって明らかであるものと理解される。従って、間近に迫った特許請求の範囲だけによって限定され、本願明細書の実施形態の記載および説明によって示された具体的な詳細によっては限定されないという意図である。

Claims

オーディオ信号を処理するための装置であって、
前記オーディオ信号の第１の設定可能な数のサンプルを有する第１のオーディオ信号フレームを受信するように構成され、前記第１の設定可能なサンプル数が、第２の設定可能なサンプル数と異なるように、処理されたオーディオ信号を得るために設定可能なアップサンプリング係数により、前記オーディオ信号をアップサンプリングするように構成され、前記処理されたオーディオ信号の第２の設定可能な数のサンプルを有する第２のオーディオ信号フレームを出力するように構成される信号処理装置（１１０；２０５；４０５）と、
前記信号処理装置（１１０；２０５；４０５)を設定するように構成されるコンフィギュレータ（１２０；２０８；４０８）とを含み、
前記コンフィギュレータ（１２０；２０８；４０８）は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、前記設定可能なアップサンプリング係数が、第１のアップサンプリング値と等しいように、設定情報に基づいて、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されること、および、前記コンフィギュレータ（１２０；２０８；４０８）は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、前記設定可能なアップサンプリング係数が、異なる第２のアップサンプリング値と等しく、前記異なる第２のアップサンプリング値が、前記第１のアップサンプリング値と異なるように、前記信号処理装置（１１０；２０５；４０５）を設定するように構成され、かつ、前記第１の比率値または前記第２の比率値は、整数値ではなく、
前記信号処理装置（１１０；２０５；４０５）は、
第１の前処理されたオーディオ信号（ａｓ２）を得るために前記オーディオ信号を復号するためのコアデコーダ・モジュール（２１０）と、
複数のサブバンド信号を含む第２の周波数領域前処理されたオーディオ信号（ａｓ３）を得るために前記第１の前処理されたオーディオ信号（ａｓ２）を時間領域から周波数領域に変換するためのいくつかの分析フィルタバンクチャネルを有する分析フィルタバンク（２２０）と、
第３の周波数領域前処理されたオーディオ信号（ａｓ４）を得るために、追加のサブバンド信号を生成し、前記第２の周波数領域前処理されたオーディオ信号（ａｓ３）に追加するためのサブバンドジェネレータ（２３０）であって、前記サブバンドジェネレータ（２３０）は、前記第３の周波数領域前処理されたオーディオ信号（ａｓ４）を得るために前記第２の周波数領域前処理されたオーディオ信号（ａｓ３）のための追加のサブバンド信号を作成するための前記第２の周波数領域前処理されたオーディオ信号（ａｓ３）のサブバンド信号を複製するように構成されているスペクトル帯域レプリケータであるサブバンドジェネレータ（２３０）と、
前記前処理されたオーディオ信号（ａｓ５）を得るために前記第３の周波数領域前処理されたオーディオ信号（ａｓ４）を前記周波数領域から前記時間領域に変換するためのいくつかの合成フィルタバンクチャネルを有する合成フィルタバンク（２４０）とを含み、
前記コンフィギュレータ（１２０；２０８；４０８）は、前記設定可能なアップサンプリング係数が前記分析フィルタバンクチャネルの数に対する前記合成フィルタバンクチャネルの数の第３の比率に等しいように、合成フィルタバンクチャネルの数または分析フィルタバンクのチャネルの数を設定することにより前記信号処理装置（１１０；２０５；４０５）を設定するように構成されている、
ことを特徴とする、装置。
前記コンフィギュレータ（１２０；２０８；４０８）は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の前記第２の比率が、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の前記第１の比率より大きいとき、前記異なる第２のアップサンプリング値が、前記第１のアップサンプリング値より大きいように、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されることを特徴とする、請求項１に記載の装置。
前記コンフィギュレータ（１２０；２０８；４０８）は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の前記第１の比率が、前記第１の比率値を有するとき、前記設定可能なアップサンプリング係数が、前記第１の比率値と等しいように、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されること、および、前記コンフィギュレータ（１２０；２０８；４０８）は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の前記第２の比率が、前記異なる第２の比率値を有するとき、前記設定可能なアップサンプリング係数が、前記異なる第２の比率値と等しいように、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されることを特徴とする、請求項１又は請求項２に記載の装置。
前記コンフィギュレータ（１２０；２０８；４０８）は、前記第１の比率が前記第１の比率値を有するとき、前記設定可能なアップサンプリング係数が、２と等しいように、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されること、および、前記コンフィギュレータ（１２０；２０８；４０８）は、前記第２の比率が前記異なる第２の比率値を有するとき、前記設定可能なアップサンプリング係数が、８／３と等しいように、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されることを特徴とする、請求項１〜請求項３のいずれかに記載の装置。
前記コンフィギュレータ（１２０；２０８；４０８）は、前記第１の比率が前記第１の比率値を有するとき、前記第１の設定可能なサンプル数が、１０２４と等しく、前記第２の設定可能なサンプル数が、２０４８と等しいように、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されること、および、前記コンフィギュレータ（１２０；２０８；４０８）は、前記第２の比率が前記異なる第２の比率値を有するとき、前記第１の設定可能なサンプル数が、７６８と等しく、前記第２の設定可能なサンプル数が、２０４８と等しいように、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されることを特徴とする、請求項１〜請求項４のいずれかに記載の装置。
前記コアデコーダ・モジュール（２１０）は、第１のコアデコーダ（５１０）と第２のコアデコーダ（５２０）とを含み、前記第１のコアデコーダ（５１０）は、時間領域において作動するように構成され、かつ前記第２のコアデコーダ（５２０）は、周波数領域において作動するように構成されることを特徴とする、請求項１〜請求項５のいずれかに記載の装置。
前記第１のコアデコーダ（５１０）は、ＡＣＥＬＰデコーダであり、前記第２のコアデコーダ（５２０）は、ＦＤ変換デコーダまたはＴＣＸ変換デコーダであることを特徴とする、請求項６に記載の装置。
前記ＡＣＥＬＰデコーダ（５１０）は、前記第１のオーディオ信号フレームを処理するように構成され、前記第１のオーディオ信号フレームは、４つのＡＣＥＬＰフレームを有し、前記第１のオーディオ信号フレームの前記第１の設定可能なサンプル数が７６８に等しいとき、前記ＡＣＥＬＰフレームのそれぞれは、１９２のオーディオ信号サンプルを有することを特徴とする、請求項７に記載の装置。
前記ＡＣＥＬＰデコーダ（５１０）は、前記第１のオーディオ信号フレームを処理するように構成され、前記第１のオーディオ信号フレームは、３つのＡＣＥＬＰフレームを有し、前記第１のオーディオ信号フレームの前記第１の設定可能なサンプル数が７６８に等しいとき、前記ＡＣＥＬＰフレームのそれぞれは、２５６のオーディオ信号サンプルを有することを特徴とする、請求項８に記載の装置。
コンフィギュレータ（１２０；２０８；４０８）は、前記オーディオ信号の前記第１の設定可能なサンプル数または前記処理されたオーディオ信号の前記第２の設定可能なサンプル数の少なくとも１つを示している前記設定情報に基づいて、前記信号処理装置（１１０；２０５；４０５）を設定するように構成されることを特徴とする、請求項１〜請求項９のいずれかに記載の装置。
コンフィギュレータ（１２０；２０８；４０８）は、前記設定情報に基づいて、前記信号処理装置（１１０；２０５；４０５）を設定するように構成され、前記設定情報は、前記オーディオ信号の前記第１の設定可能なサンプル数および前記処理されたオーディオ信号の前記第２の設定可能なサンプル数を示し、前記設定情報は、設定インデックスであることを特徴とする、請求項１〜請求項１０のいずれかに記載の装置。
オーディオ信号を処理するための方法は、
設定可能なアップサンプリング係数を設定するステップと、
前記オーディオ信号の第１の設定可能な数のサンプルを有する第１のオーディオ信号フレームを受信するステップと、
処理されたオーディオ信号を得るために、前記設定可能なアップサンプリング係数によって前記オーディオ信号をアップサンプリングするステップであって、前記第１の設定可能なサンプル数が第２の設定可能なサンプル数と異なるように、前記処理されたオーディオ信号の第２の設定可能な数のサンプルを有する第２のオーディオフレームを出力するように構成されるステップとを含み、
前記設定可能なアップサンプリング係数は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、前記設定可能なアップサンプリング係数が、第１のアップサンプリング値と等しいように、設定情報に基づいて設定されること、および、前記設定可能なアップサンプリング係数は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、前記設定可能なアップサンプリング係数が、異なる第２のアップサンプリング値と等しく、前記異なる第２のアップサンプリング値が、前記第１のアップサンプリング値と異なるように、設定され、かつ、前記第１の比率または前記第２の比率は、整数値ではなく、
処理されたオーディオ信号を得るために設定可能なアップサンプリング係数により前記オーディオ信号をアップサンプリングすることは、
第１の前処理されたオーディオ信号を得るためにコアデコーダモジュールにより前記オーディオ信号を復号し、
複数のサブバンド信号を含む第２の周波数領域前処理されたオーディオ信号を得るためにいくつかの分析フィルタバンクチャネルを有する分析フィルタバンクにより前記第１の前処理されたオーディオ信号を時間領域から周波数領域に変換し、
前記第３の周波数領域前処理されたオーディオ信号を得るために前記第２の周波数領域前処理されたオーディオ信号のための前記追加のサブバンド信号を作成するための前記第２の周波数領域前処理されたオーディオ信号のサブバンド信号を複製することにより、サブバンドジェネレータにより追加のサブバンド信号を作成し、前記第２の周波数領域前処理されたオーディオ信号に追加し、
前記処理されたオーディオ信号を得るために、いくつかの合成フィルタバンクチャネルを有する合成フィルタバンクにより前記第３の周波数領域前処理されたオーディオ信号を前記周波数領域から前記時間領域に変換することにより実行され、
前記設定情報を設定することは、設定可能なアップサンプリング係数が分析フィルタバンクチャネルの数に対する合成フィルタバンクのチャネルの数の第３の比率に等しくなるように、合成フィルタバンクのチャネルの数または分析フィルタバンクのチャネルの数を設定することにより、実行されることを特徴とする、方法。
オーディオ信号を処理するための装置は、
前記オーディオ信号の第１の設定可能な数のサンプルを有する第１のオーディオ信号フレームを受信するように構成され、処理されたオーディオ信号を得るために、設定可能なダウンサンプリング係数によって前記オーディオ信号をダウンサンプリングするように構成され、前記第１の設定可能なサンプル数が第２の設定可能なサンプル数と異なるように、前記処理されたオーディオ信号の第２の設定可能な数のサンプルを有する第２のオーディオフレームを出力するように構成される、信号処理装置（９１０）と、
前記信号処理装置を設定するように構成されるコンフィギュレータ（９２０）とを含み、
前記コンフィギュレータ（９２０）は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、前記設定可能なダウンサンプリング係数が第１のダウンサンプリング値に等しいように、設定情報に基づいて前記信号処理装置（９１０）を設定するように構成されること、および、前記コンフィギュレータ（９２０）は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、前記設定可能なダウンサンプリング係数が、異なる第２のダウンサンプリング値に等しく、前記異なる第２のダウンサンプリング値が、前記第１のダウンサンプリング値と異なるように、前記信号処理装置（９１０）を設定するように構成され、かつ、前記第１の比率値または前記第２の比率値は、整数値ではなく、
前記信号処理装置（１１０；２０５；４０５）は、
第１の前処理されたオーディオ信号（ａｓ２）を得るために前記オーディオ信号を復号するためのコアデコーダモジュール（２１０）と、
複数のサブバンド信号を含む第２の周波数領域前処理されたオーディオ信号（ａｓ３）を得るために前記第１の前処理されたオーディオ信号（ａｓ２）を時間領域から周波数領域に変換するためのいくつかの分析フィルタバンクチャネルを有する分析フィルタバンク（２２０）とを含み、
前記信号処理装置（１１０；２０５；４０５）は、第３の周波数領域前処理されたオーディオ信号（ａｓ４）を得るために前記第２の周波数領域前処理されたオーディオ信号（ａｓ３）の複数の最高のサブバンド信号を削除するように構成され、かつ
処理されたオーディオ信号（ａｓ５）を得るために前記第３の周波数領域前処理されたオーディオ信号（ａｓ４）を周波数領域から時間領域に変換するためのいくつかの合成フィルタバンクチャネルを有する合成フィルタバンク（２４０）をさらに含み、
前記コンフィギュレータ（１２０；２０８；４０８）は、前記設定可能なダウンサンプリング係数が前記分析フィルタバンクチャネルの数に対する前記合成フィルタバンクチャネルの数の第３の比率に等しいように、合成フィルタバンクチャネルの数または分析フィルタバンクチャネルの数を設定することにより前記信号処理装置（１１０；２０５；４０５）を設定するように構成されている、
ことを特徴とする、装置。
前記コンフィギュレータは、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の前記第１の比率が、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の前記第２の比率より小さいとき、前記第１のダウンサンプリング値が、前記異なる第２のダウンサンプリング値より小さいように、前記信号処理装置（９１０）を設定するように構成されることを特徴とする、請求項１３に記載の装置。
オーディオ信号を処理するための方法であって、
設定可能なダウンサンプリング係数を設定するステップと、
前記オーディオ信号の第１の設定可能な数のサンプルを有する第１のオーディオ信号フレームを受信するステップと、
処理されたオーディオ信号を得るために、前記設定可能なダウンサンプリング係数によって前記オーディオ信号をダウンサンプリングするステップであって、前記第１の設定可能なサンプル数が前記第２の設定可能なサンプル数と異なるように、前記処理されたオーディオ信号の前記第２の設定可能な数のサンプルを有する第２のオーディオフレームを出力するように構成されるステップとを含み、
前記設定可能なダウンサンプリング係数は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の第１の比率が、第１の比率値を有するとき、前記設定可能なダウンサンプリング係数が、第１のダウンサンプリング値に等しいように、設定情報に基づいて設定されること、および、前記設定可能なダウンサンプリング係数は、前記第１の設定可能なサンプル数に対する前記第２の設定可能なサンプル数の異なる第２の比率が、異なる第２の比率値を有するとき、前記設定可能なダウンサンプリング係数が、異なる第２のダウンサンプリング値に等しく、前記異なる第２のダウンサンプリング値が、前記第１のダウンサンプリング値と異なるように、設定され、かつ、前記第１の比率値または前記第２の比率値は、整数値ではなく、
処理されたオーディオ信号を得るための設定可能なダウンサンプリング係数により前記オーディオ信号をダウンサンプリングすることは、
第１の前処理されたオーディオ信号を得るためにコアデコーダモジュールにより前記オーディオ信号を復号し、
複数のサブバンド信号を含む第２の周波数領域前処理されたオーディオ信号を得るためにいくつかの分析フィルタバンクチャネルを有する分析フィルタバンクにより前記第１の前処理されたオーディオ信号を時間領域から周波数領域に変換し、
第３の周波数領域前処理されたオーディオ信号を得るために前記第２の周波数領域前処理されたオーディオ信号の複数の最高のサブバンド信号を削除し、
前記処理されたオーディオ信号を得るために、いくつかの合成フィルタバンクチャネルを有する合成フィルタバンクにより前記第３の周波数領域前処理されたオーディオ信号を周波数領域から時間領域に変換することにより実行され、
前記設定情報を設定することは、設定可能なダウンサンプリング係数が合成フィルタバンクチャネルの数に対する分析フィルタバンクチャネルの数の第３の比率に等しくなるように、合成フィルタバンクチャネルの数または分析フィルタバンクチャネルの数を設定することにより、実行されることを特徴とする、方法。
コンピュータプログラムがコンピュータまたは処理装置によって実行されるとき、請求項１２または請求項１５の方法を実行するための前記コンピュータプログラム。