JP7003253B2

JP7003253B2 - エンコーダおよび／またはデコーダの帯域幅の制御

Info

Publication number: JP7003253B2
Application number: JP2020524579A
Authority: JP
Inventors: シュネル・マーカス; ラヴェッリ・エマニュエル; ベンドルフ・コンラッド; アルベルト・トビアス; ルツキー・マンフレッド; トマシェク・アドリアン
Original assignee: フラウンホーファー－ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2017-11-10
Filing date: 2018-11-06
Publication date: 2022-01-20
Anticipated expiration: 2038-11-06
Also published as: ZA202002082B; PT3707713T; JP2021502591A; BR112020009034A2; RU2752520C1; KR20200077591A; EP3483882A1; AU2018363698A1; AU2018363698B2; EP3707713B1; SG11202004171WA; TW201923747A; KR102426033B1; TWI691954B; CN111344784A; ES2898281T3; MX2020004779A; CA3080907A1; CN111344784B; US11462226B2

Description

１．先行技術
本実施例は、特にオーディオ信号などの情報信号のためのエンコーダおよびデコーダおよびこれらの装置の方法に関する。

一般的なオーディオコーデックは、音楽および音声の信号を非常に高品質で送信する必要がある。このようなオーディオコーデックは、例えばブルートゥース（登録商標）で使用され、オーディオ信号は携帯電話からヘッドセットまたはヘッドホンに、あるいはその逆に送信される。

スペクトルの一部をゼロに量子化すると、多くの場合、知覚的な劣化が生じる。したがって、周波数領域（ＦＤ）で動作するノイズフィラーツールを使用して、ゼロ量子化スペクトルラインをノイズに置き換えることができる。

一時的ノイズシェーピング（ＴＮＳ）は、周波数領域（ＦＤ）で開ループ線形予測を使用する。この周波数での予測符号化／復号プロセスは、量子化ノイズの時間構造を時間信号の時間構造に効果的に適合させ、それによって信号を効率的に使用してノイズの影響をマスクする。ＭＰＥＧ－２ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｅｒ（ＡＡＣ）規格では、ＴＮＳは現在、特定の周波数帯域に１つのフィルタを定義し、隣接する帯域の信号構造が前の帯域の信号構造と異なる場合は隣接する周波数帯域に対して別のフィルタに切り替えることで実装されている。

特に音声信号の場合、オーディオコンテンツは帯域制限される可能性がある。つまり、オーディオ帯域幅には４ＫＨｚ（狭帯域、ＮＢ）、８ＫＨｚ（広帯域、ＷＢ）、または１６ＫＨｚ（超広帯域、ＳＷＢ）のみが含まれる。オーディオコーデックは、アクティブなオーディオ帯域幅を検出し、それに応じてコーディングツールを制御する必要がある。帯域幅の検出は１００％信頼できないため、技術的な問題が発生する可能性がある。

一部のオーディオコーディングツール、例えば、一時的ノイズシェーピング（ＴＮＳ）またはノイズフィリング（ＮＦ）は、例えば、ツールがアクティブな信号部分を認識していない場合など、帯域制限されたオーディオファイルで動作するときに厄介なアーティファクトを引き起こす可能性がある。ＷＢ信号が３２ＫＨｚでコーディングされていると想定すると、ツールは上部スペクトル（８～１６ＫＨｚ）を人工ノイズで満たす可能性がある。

図１は、ガイドなしのツールによって生成された人工ノイズを示している。ライン１１はＷＢまでのアクティブな信号であるが、信号１２は、アクティブなオーディオ帯域幅を認識していないパラメトリックツール（例えば、ノイズフィリング）によって人工的に生成されている。

したがって、ツールは、アクティブな周波数領域でのみ動作するように制限する必要がある。

ＡＡＣなどの一部のコーデックは、スケールファクターバンドごとのアクティブなスペクトルに関する情報を送信するように構成されている。この情報は、コーディングツールの制御にも使用される。これにより正確な結果が得られるが、送信すべきサイド情報の量がかなり必要になる。音声は通常、ＮＢ、ＷＢ、ＳＷＢ、およびＦＢで送信されるだけなので、この限られた有効帯域幅のセットを使用して、サイド情報を制限することが好ましい。

帯域幅検出器が時々間違った結果を返すことは避けられない。例えば、検出器は音楽信号のフェードアウトを見て、これを低帯域幅の場合と解釈する場合がある。異なる帯域幅モード（ＮＢ、ＷＢ、ＳＷＢ、ＦＢ）間を厳密に切り替えるコーデック、例えば３ＧＰＰＥＶＳコーデック［１］の場合、これは長方形のスペクトルホールになる。厳密にとは、完全なコーディング操作が検出された帯域幅に制限されることを意味する。このような厳密なスイッチにより、可聴アーティファクトが生じる場合がある。図２は、誤った検出から生じるスペクトルホール２２を概説している。

図２は、誤った帯域幅検出の概略図を示している。すべてのコーディングツールが低いオーディオ帯域幅で機能し、長方形のスペクトルホール２２につながっている。

上記のような欠陥を克服または軽減することが求められている。

１．１参考文
［１］３ＧＰＰＥＶＳコーデック、ｈｔｔｐ：／／ｗｗｗ．３ｇｐｐ．ｏｒｇ／ｆｔｐ／／Ｓｐｅｃｓ／ａｒｃｈｉｖｅ／２６＿ｓｅｒｉｅｓ／２６．４４５／２６４４５－ｅ１０．ｚｉｐ、セクション５．１．６「帯域幅検出」

３ＧＰＰＥＶＳコーデック、ｈｔｔｐ：／／ｗｗｗ．３ｇｐｐ．ｏｒｇ／ｆｔｐ／／Ｓｐｅｃｓ／ａｒｃｈｉｖｅ／２６＿ｓｅｒｉｅｓ／２６．４４５／２６４４５－ｅ１０．ｚｉｐ、セクション５．１．６「帯域幅検出」

２．発明の概要
実施例によれば、エンコーダ装置が提供され、エンコーダ装置は、
情報信号を符号化するための複数の周波数領域、ＦＤ、エンコーダツールであって、情報信号は複数のフレームを表すエンコーダツール、および
複数のＦＤエンコーダツールの少なくともサブグループの帯域幅を選択するように構成されたエンコーダ帯域幅検出器およびコントローラを含み、サブグループは、サブグループのＦＤエンコーダツールの少なくとも１つが、サブグループにないＦＤエンコーダツールの少なくとも１つとは異なる帯域幅を有するように、情報信号特性に基づいて、複数のＦＤエンコーダツールよりも少ないＦＤエンコーダツールを含む。

したがって、帯域幅の誤った検出に備えながら、スペクトルホールを回避することが可能である。

実施例によれば、サブグループの少なくとも１つのＦＤエンコーダツールは、一時的ノイズシェーピング、ＴＮＳ、ツールおよび／またはノイズレベル推定ツールであり得る。

実施例によれば、サブグループにない少なくとも１つのＦＤエンコーダツールは、線形予測コーディング、ＬＰＣ、ベースのスペクトルシェーパ、スペクトルノイズシェーパ、ＳＮＳ、ツール、スペクトル量子化器、および残差コーダの少なくとも１つから選択される。

実施例によれば、エンコーダ帯域幅検出器およびコントローラは、サブグループにないＦＤエンコーダツールの少なくとも１つに共通する少なくとも第１の帯域幅と、サブグループにないＦＤエンコーダツールの少なくとも１つの帯域幅とは異なる第２の帯域幅との間で、サブグループの少なくとも１つのＦＤエンコーダツールの帯域幅を選択するように構成される。

実施例によれば、エンコーダ帯域幅検出器およびコントローラは、情報信号に関する少なくとも１つのエネルギー推定に基づいて、複数のＦＤエンコーダツールの少なくとも１つの帯域幅を選択するように構成される。

実施例によれば、エンコーダ帯域幅検出器およびコントローラは、複数のＦＤエンコーダツールの少なくとも１つの帯域幅を制御するために、情報信号の帯域幅に関連する少なくとも１つのエネルギー推定をそれぞれの閾値と比較するように構成される。

実施例によれば、サブグループの複数のＦＤエンコーダツールの少なくとも１つは、エンコーダ帯域幅検出器およびコントローラによって選択された帯域幅内でＴＮＳ入力信号を自己相関させるように構成されたＴＮＳを含む。

実施例によれば、サブグループにないＦＤエンコーダツールの少なくとも１つは、全帯域幅で動作するように構成される。

したがって、帯域幅の選択は、サブグループのツール（例えば、ＴＮＳ、ノイズ推定器ツール）に対してのみ機能する。

実施例によれば、エンコーダ帯域幅検出器およびコントローラは、サブグループにないＦＤエンコーダツールの少なくとも１つが動作するように構成されている全帯域幅内にある少なくとも１つの帯域幅を選択するように構成される。

実施例によれば、複数のＦＤエンコーダツールの残りのＦＤエンコーダツールの少なくとも１つは、エンコーダ帯域幅検出器およびコントローラによって選択された帯域幅に関してオープンチェーンで動作するように構成される。

実施例によれば、エンコーダ帯域幅検出器およびコントローラは、有限数の帯域幅の中から、および／または事前定義された帯域幅のセットの中から、帯域幅を選択するように構成される。

したがって、選択は制限され、複雑すぎるパラメータや長いパラメータを符号化する必要はない。実施例では、ビットストリームに使用できるパラメータは１つだけ（例えば、０～３ビットで符号化）である。

例によれば、エンコーダ帯域幅検出器およびコントローラは、８ＫＨｚ、１６ＫＨｚ、２４ＫＨｚ、３２ＫＨｚ、および４８ＫＨｚ、および／またはＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢなどの少なくとも１つまたは組み合わせから選択を実行するように構成される。

実施例によれば、エンコーダ帯域幅検出器およびコントローラは、デコーダへの帯域幅のシグナリングを制御するように構成される。

したがって、デコーダにおいて一部のツールによって処理される信号の帯域幅も制御できる（例えば、同じ帯域幅を使用する）。

実施例によれば、エンコーダ装置は、選択された帯域幅に関する情報を含む制御データフィールドを符号化するように構成される。

実施例によれば、エンコーダ装置は、以下を含む制御データフィールドを定義するように構成される。

ＮＢ帯域幅に対応する０データビット
ＮＢ、ＷＢ帯域幅に対応する１データビット
ＮＢ、ＷＢ、ＳＳＷＢ帯域幅に対応する２データビット
ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ帯域幅に対応する２データビット
ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢ帯域幅に対応する３データビット。

実施例によれば、エンコーダ装置の少なくとも１つのエネルギー推定は、以下によって実行される。

によって実行され、ここで、

はＭＤＣＴ（またはＭＤＳＴ…）係数であり、

はバンドの数であり、

はバンドに関連付けられたインデックスである。

実施例によれば、エンコーダ装置は、自己相関関数の計算を含むフィルタリング動作を実行するように構成され得るＴＮＳツールを含む。可能な自己相関関数の１つは、次の形式になる。

各

について

および

であり、
ここで、

はＭＤＣＴ係数であり、

および

は、エンコーダの帯域幅検出器およびコントローラによって検出された特定の帯域幅に関連付けられている。

実施例によれば、エンコーダ装置は、ノイズレベルを推定するように構成され得るノイズ推定器ツールを含み得る。そのような推定に使用される手順の１つは、

という形式になり、ここで、ｇｇはグローバル利得、

はノイズレベルが推定されるスペクトル線の識別、および

は信号（例えば、ＭＤＣＴまたはＭＤＳＴまたはＴＮＳ後の別のＦＤスペクトル）を指す。

実施例では、

は

で得ることができ、ここで、

はエンコーダの帯域幅検出器およびコントローラによって検出された帯域幅に依存する。

実施例によれば、ビットストリームに符号化された情報信号を復号するための複数のＦＤデコーダツールを含むデコーダ装置が提供されてもよく、
ＦＤデコーダツールは
少なくとも１つのＦＤデコーダツールを含むサブグループ、
少なくとも１つのＦＤデコーダツールを含む残りのＦＤデコーダツール、に分割されており、
ここで、デコーダ装置は、サブグループの複数のデコーダツールの少なくとも１つが、複数のデコーダツールの残りのＦＤデコーダツールの少なくとも１つとは異なる帯域幅で信号処理するように構成される。

実施例によれば、デコーダ装置は、帯域幅情報に基づいて帯域幅を選択するように構成された帯域幅コントローラを含むことができる。

実施例によれば、デコーダ装置は、サブグループが、デコーダノイズ推定器ツールおよび／または一時的ノイズシェーピング、ＴＮＳ、デコーダの少なくとも１つを含むようなものであり得る。

実施例によれば、残りのＦＤデコーダツールの少なくとも１つは、線形予測コーディング、ＬＰＣ、デコーダツール、スペクトルノイズシェーパデコーダ、ＳＮＳ、ツール、デコーダのグローバル利得ツール、ＭＤＣＴまたはＭＤＳＴシェーピングツールの少なくとも１つである。

実施例によれば、デコーダ装置は、サブグループ内の複数のデコーダツールの少なくとも１つの帯域幅を、
残りのＦＤデコーダツールの少なくとも１つに共通の少なくとも第１の帯域幅、および
第１の帯域幅とは異なる少なくとも第２の帯域幅の間で制御するように構成され得る。

実施例によれば、残りのＦＤデコーダツールの少なくとも１つは、全帯域幅で動作するように構成される。

実施例によれば、残りのＦＤデコーダツールの少なくとも１つは、（例えば、帯域幅コントローラによって選択された）帯域幅に関してオープンチェーンで動作するように構成される。

実施例によれば、帯域幅コントローラは、有限数の帯域幅の中から、および／または事前定義された帯域幅のセットの中から、帯域幅を選択するように構成される。

実施例によれば、帯域幅コントローラは、８ＫＨｚ、１６ＫＨｚ、２４ＫＨｚ、３２ＫＨｚ、および４８ＫＨｚ、および／またはＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢの少なくとも１つまたは組み合わせから選択を実行するように構成される。

実施例によれば、デコーダは、インデックスを使用してノイズレベルを適用するように構成されたノイズフィリングツール（４６）をさらに含むことができる。インデックスを得るための手法には、例えば、

があってもよく、

は、ビットストリーム内の帯域幅情報に基づいて得られる。

実施例によれば、デコーダ装置は、以下の動作の少なくとも一部を実行するように構成されたＴＮＳデコーダツールを含むことができる。

ここで、

はＴＮＳデコーダの出力であり、

はＴＮＳデコーダの入力であり、

、

ＴＮＳやノイズフィルなどのコーディングツールは、帯域制限された信号のサイレントセクションに不要な人工ノイズを作成する可能性がある。したがって、帯域幅検出器は通常、すべてのコーディングツールが動作する帯域幅を制御するために連携している。帯域幅の検出が不確実な結果につながる可能性があるため、このような誤った検出は、オーディオ帯域幅の突然の制限などの可聴アーティファクトにつながる可能性がある。

この問題を克服するために、一部の例では、量子化器などの一部のツールは、帯域幅検出器によって制御されない。誤検出の場合、量子化器は、問題を補償するために、低品質であっても上部スペクトルをコーディングできる。

３．図面の簡単な説明
ガイドなしのツールによって生成される人工ノイズを示す。誤った帯域幅検出の概要を示す。実施例によるエンコーダ装置を示す。実施例によるエンコーダ装置を示す。実施例によるデコーダ装置を示す。実施例によるデコーダ装置を示す。誤った帯域幅検出の場合の方式を示す。実施例による方法を示す。実施例による方法を示す。実施例による方法を示す。実施例による、エンコーダにおけるＴＮＳの方法を示す。実施例による装置を示す。実施例による装置を示す。

４．発明に関する議論
この文書に記載されている発明は、帯域幅検出器が誤った結果を返す場合でも、スペクトルホールの発生を回避することを可能にする。特に、オーディオコーディングアプリケーションのためのソフトバンドスイッチングが得られてもよい。

重要な側面は、例えばＴＮＳおよびＮＦなどのパラメトリックコーディングツールが、残りのコーディング、つまりＬＰＣベースのスペクトルシェーパまたはスペクトルノイズシェーパ、ＳＮＳ、スペクトル量子化器および残差コーダが、ナイキスト周波数までの全オーディオ帯域幅で機能していても、帯域幅検出器およびコントローラ３９によって厳密に制御できることである。

図３および３ａは、帯域幅（ＢＷ）検出器およびコントローラ３９が、ＭＤＣＴまたはＭＤＳＴスペクトル（または他のＦＤスペクトル）から導出されたエネルギーに基づいてフレーム内の現在のオーディオ帯域幅を推定するエンコーダ装置３０および３０ａの例の概要を示す。

デコーダ側（図４および４ａ）では、ＴＮＳおよびＮＦのガイド帯域幅情報がビットストリームから抽出され、それに応じてツールが制御される。

その結果、ＴＮＳおよびＮＦコーディングツール（ガイドなしツール）を制御するために使用される帯域幅パラメータにより、非アクティブスペクトル領域で人工的に生成されるノイズが回避される。このツールはアクティブなオーディオ部分でのみ動作するため、人工ノイズを生成しない。

一方、誤った検出（誤った帯域幅検出）の可聴効果は、残りのコーディングツール（例えば、スペクトル量子化器、ＬＰＣシェーパまたはＳＮＳ（スペクトルノイズシェーパ）、および残差コーダ）がナイキスト周波数まで動作するため、著しく低減する。誤った検出の場合、これらのツールは、少なくとも通常のコーディングと比較して多少の歪みを伴って、より高い周波数をコーディングできるため、オーディオ帯域幅が突然低下するというより深刻な影響を回避できる。

図５は、帯域幅が誤って検出された場合の新しい方式を示しており、スペクトルホールはまばらに量子化されているが、可聴帯域幅の低下は回避されている。

上の図で概説されている領域にほとんどゼロの値が含まれている場合、最後の非ゼロのスペクトルタプルに関する情報が算術コーダのサイド情報として送信されるため、算術コーダはそれらをコーディングする必要はない。これは、算術コーダにオーバーヘッドが必要ないことを意味する。

送信帯域幅に必要なサイド情報も最小限に抑えられる。堅牢なスイッチング動作により、通常使用される通信オーディオ帯域幅、つまりＮＢ、ＷＢ、ＳＳＷＢ、およびＳＷＢのシグナリングが適切である。

この手法により、フレームの依存関係や長い履歴メモリを使用せずに複雑さの少ない帯域幅検出器を構築して、安定した決定を行うこともできる。ＥＶＳコーデック［１］セクション５．１．６を参照されたい。これは、新しい手法により、帯域幅検出器およびコントローラ３９がオーディオ帯域幅の変化に非常に速く反応できるようになることを意味する。

したがって、帯域幅情報は、コーデック（例えば、オーディオコーデック）の特定のツールのみを制御し、残りのツールを別の操作モード（例えば、全帯域幅）に維持するために使用される。

５．実施例
５．１帯域幅の検出とツールの制御
情報信号（例えば、オーディオ信号）は、時間領域、ＴＤで、異なる離散時刻（ｎ）で取得された一連のサンプル（例えば、ｘ（ｎ））として記述できる。ＴＤ表現は、それぞれが複数のサンプル（例えば、フレームごとに２０４８サンプル）に関連付けられている複数のフレームから作成することができる。周波数領域、ＦＤでは、フレームは、それぞれが特定の周波数に関連付けられている一連のビン（例えば、Ｘ（ｋ））として表すことができる（各周波数はインデックスｋに関連付けられている）。

図３および３ａは、それぞれエンコーダ装置３０および３０ａを示し、それぞれが、エンコーダ装置３０または３０ａの一部のツール（エンコーダにおけるサブグループ）の帯域幅を選択することができるエンコーダ帯域幅検出器およびコントローラ３９を含み、その結果、他のツールは異なる帯域幅で動作する。エンコーダ帯域幅検出器およびコントローラ３９はまた、デコーダ（デコーダにおけるサブグループ）の少なくとも一部のツールのための帯域幅を選択することができる。３９ａは、エンコーダ帯域幅検出器およびコントローラ３９によってサブグループ（例えば、３３、３６）および／またはデコーダのツールに提供される帯域幅選択情報を指す。

エンコーダ装置３０および３０ａのそれぞれは、低遅延修正離散コサイン変換、ＭＤＣＴ、ツール３１または低遅延修正離散サイン変換、ＭＤＳＴ、ツール３１（または重複変換などの別の変換に基づくツール）を備えることができ、これらは、情報信号（例えば、オーディオ信号）を（例えば、ＭＤＣＴ、ＭＤＳＴ、またはより一般的には、ＦＤ係数を得るために）時間領域、ＴＤ、表現から周波数領域、ＦＤ、表現に変換することができる。

エンコーダ装置３０は、ＦＤでＬＰＣ分析を実行するための線形予測符号化、ＬＰＣ、ツール３２を含むことができる。

エンコーダ装置３０ａは、ＦＤでＳＮＳ分析を実行するためのＳＮＳツール３２ａを含むことができる。

エンコーダ装置３０および３０ａのそれぞれは、ＦＤ内の（例えば、ＭＤＣＴまたはＭＤＳＴツールによる出力としての）情報信号の各ウィンドウ内のノイズの一時的形状を制御するための一時的ノイズシェーピング、ＴＮＳ、ツール３３を含むことができる。

エンコーダ装置３０および３０ａのそれぞれは、ＦＤ内の信号を処理するスペクトル量子化器３４を含むことができる。ＴＮＳツール３３による出力としての信号は、例えば、不感帯および均一閾値のスカラー量子化を使用して、量子化することができる。利得インデックスは、量子化されたＦＤ信号を符号化するために必要なビット数が、利用可能なビットバジェットにできるだけ近くなるように選択できる。

エンコーダ装置３０および３０ａのそれぞれは、例えば、ビットストリームを圧縮するための、例えば、エントロピーコーディングを実行するために、ＦＤ内の信号を処理するコーダ３５を含むことができる。コーダ３５は、例えば、残差コーディングおよび／または算術コーディングを実行することができる。

エンコーダ装置３０および３０ａのそれぞれは、ＦＤ内の信号を処理して、ノイズを推定し、それを量子化し、および／またはビットストリームで送信する、例えば、ノイズレベル推定ツール３６を含むことができる。

実施例では、レベル推定ツール３６は、コーダ３５の上流または下流に配置され得る。

エンコーダ装置３０および３０ａのそれぞれは、時間領域ＴＤで信号を処理するツールを含むことができる。例えば、エンコーダ装置３０または３０ａは、再サンプリングツール３８ａ（例えば、ダウンサンプラ）および／または長期ポストフィルタリング、ＬＴＰＦがＴＤでアクティブであるようにデコーダにおいて制御するためのＬＴＰＦツール３８ｂを含むことができる。

エンコーダ装置３０および３０ａのそれぞれは、上流に配置されたＴＤおよび／またはＦＤツールから得られたデータでビットストリームを準備するためのビットストリーム多重化ツール３７を含むことができる。ビットストリームは、デコーダで使用される制御データ（例えば、デコーダの一部のツールで帯域幅を選択するための帯域幅情報を含む）とともに情報信号のデジタル表現を含むことができる。ビットストリームは、圧縮されるか、または圧縮される部分を含むことができる。

したがって、エンコーダ装置３０および３０ａのそれぞれは、ＦＤツール（例えば、３１～３６）、および場合によっては、ＴＤツール（例えば、３８ａ、３８ｂ）を含むことができる。

エンコーダ帯域幅検出器およびコントローラ３９は、一時的ノイズシェーピング、ＴＮＳ、ツール３３、および／またはノイズ推定器ツール３６などの第１のグループ（サブグループ）を形成するＦＤツールの帯域幅を制御することができる。ＴＮＳツール３３を使用して、量子化ノイズを制御することができる。したがって、サブグループに含まれないＦＤツール（ＬＰＣツール３２および／またはＳＮＳツール３２ａ、スペクトル量子化器３４、およびコーダ３５の少なくとも１つなど）が信号処理を実行する帯域幅は、サブグループのツール（３３、３６など）が信号処理を実行する帯域幅とは異なる場合がある。例えば、サブグループに含まれないＦＤツールの帯域幅は、より大きくなる場合があり、例えば、全帯域幅になる場合がある。

実施例では、エンコーダ帯域幅検出器およびコントローラ３９は、例えば、エンコーダ装置の他のツールも実装するデジタル信号プロセッサの一部であり得る。

図４および４ａは、それぞれ、例えば、エンコーダ３０または３０ａによって符号化された情報信号のデジタル表現を復号することができるデコーダ装置４０および４０ａを示す。デコーダ装置４０および４０ａのそれぞれは、ＦＤツール、および場合によっては、ＴＤツールを含むことができる。

デコーダ装置４０および４０ａのそれぞれは、エンコーダ装置（例えば、装置３０または３０ａ）から（例えば、送信によって）ビットストリームを得るためのビットストリーム多重化ツール４１を含むことができる。例えば、エンコーダ装置３０または３０ａからの出力は、デコーダ装置４０または４０ａへの入力信号として提供されてもよい。

デコーダ装置４０および４０ａのそれぞれは、例えば、ビットストリーム中のデータを解凍することができるデコーダ４２を含むことができる。算術復号が実行される場合がある。残差復号が実行される場合がある。

デコーダ装置４０および４０ａのそれぞれは、ＦＤ内の信号を処理するノイズフィリングツール４３を含むことができる。

デコーダ装置４０および４０ａのそれぞれは、ＦＤ内の信号を処理するグローバル利得ツール４４を含むことができる。

デコーダ装置４０および４０ａのそれぞれは、ＦＤ内の信号を処理するＴＮＳデコーダツール４５を含むことができる。ＴＮＳは次のように簡単に説明できる。エンコーダ側で、量子化の前に、線形予測、ＬＰ、を使用して信号を周波数領域（ＦＤ）でフィルタリングして、時間領域で信号を平坦化する。デコーダ側で、逆量子化の後、逆予測フィルタを使用して信号を周波数領域でフィルタリングして、信号によってマスクされるように時間領域で量子化ノイズを整形する。

デコーダ装置４０および４０ａのそれぞれは、ＭＤＣＴまたはＭＤＳＴシェーピングツール４６を含むことができる（他の種類の成形ツールを使用することができる）。特に、ＭＤＣＴまたはＭＤＳＴシェーピングツール４６は、エンコーダＳＮＳツール３２ａから得たスケール係数（または量子化スケール係数）または（ＬＰＣ復号ツール４７から得た）ＭＤＣＴまたはＭＤＳＴスペクトルに変換された、復号されたＬＰフィルタ係数から計算された利得係数を適用することにより信号を処理する。

デコーダ装置４０および４０ａのそれぞれは、信号表現をＦＤからＴＤに変換するための逆低遅延逆ＭＤＣＴまたはＭＤＳＴツール４８ａを含むことができる（他の種類の逆変換に基づくツールを使用することができる）。

デコーダ装置４０および４０ａのそれぞれは、例えば、デコーダにおいてコンポーネント３８ｂによって提供されるパラメータに基づいて、ＴＤにおいてポストフィルタを実行するためのＬＴＰＦツール４８ｂを含むことができる。

デコーダ装置４０および４０ａのそれぞれは、ＦＤツールの少なくとも１つの帯域幅を選択するように構成されたデコーダ帯域幅コントローラ４９を含むことができる。特に、（例えば、ツール４３および４５によって形成される）サブグループの帯域幅は、他のＦＤツール（４２、４４、４６、４７）が信号を処理する帯域幅とは異なるように制御され得る。帯域幅コントローラ４９に、エンコーダ側で（例えば、帯域幅検出器およびコントローラ３９によって）準備された信号３９ａを入力して、サブグループ（３３、３６、４３、４５）の少なくとも１つのために選択された帯域幅を示すことができる。

実施例では、デコーダ帯域幅コントローラ４９は、エンコーダ帯域幅検出器およびコントローラ３９によって処理されるものと同様の動作を実行することができる。しかしながら、一部の実施例では、デコーダ帯域幅コントローラ４９は、エンコーダ帯域幅検出器およびコントローラ３９から制御データ（例えば、ビットストリームに符号化される）を取得し、制御データ（例えば、帯域幅情報）をサブグループのツール（例えば、デコーダノイズフィリングツール４３および／またはＴＮＳデコーダツール４５）に提供するコンポーネントとして意図され得る。実施例では、コントローラ３９はマスタであり、コントローラ４９はスレーブである。実施例では、デコーダ帯域幅コントローラ４９は、例えば、デコーダの他のツールも実装するデジタル信号プロセッサの一部またはセクションであり得る。

一般に、帯域幅コントローラ３９および４９は、サブグループのＦＤツール（例えば、エンコーダ装置用の３３および３６および／またはデコーダ装置用の４３および４５）が同じ周波数帯域を有するように動作することができ、一方、他のデコーダおよび／またはエンコーダのＦＤツールは、別の周波数帯域（例えば、より広い帯域）を有する。

したがって、実際、従来技術の欠陥を低減することが可能であることが指摘されている。一部のＦＤツール（例えば、ＴＮＳツール、ノイズフィリングツール）では実際に帯域選択を実行することが望ましい場合があるが、他のＦＤツール（例えば、３２、３４、３５、４２、４４、４６、４７）ではより広い帯域（例えば、全帯域）で信号を処理することが望ましい場合がある。したがって、すべてのツールの帯域幅を厳密に選択した場合（特に、誤った帯域が選択された場合）に存在し得るスペクトルホールを回避できる。

実施例では、デコーダ帯域幅コントローラ４９によって選択される帯域幅は、有限数の選択肢（例えば、有限数の帯域幅）の１つであり得る。実施例では、狭帯域ＮＢ（例えば、４ＫＨｚ）、広帯域ＷＢ（例えば、８ＫＨｚ）、半超広帯域ＳＳＷＢ（例えば、１２ＫＨｚ）、超広帯域ＳＷＢ（例えば、１６ＫＨｚ）、または全帯域ＦＢ（例えば、２０ＫＨｚ）から選択できる。

選択は、（例えば、エンコーダ帯域幅検出器およびコントローラ３９によって実行される選択に従って）どの帯域幅が選択されたかをデコーダ装置が知ることができるように、エンコーダ装置によってデータフィールドに符号化され得る。

図６ａは方法６０を示す。方法６０は、少なくとも部分的に、コントローラ３９および４９の少なくとも１つによって実行され得るステップを含み得る。方法６０は、情報信号の各フレームに関連する動作を実行するようにループされてもよい。

ステップＳ６１において、帯域ごとのエネルギーが（例えば、帯域幅検出器およびコントローラ３９によって）推定され得る。

ステップＳ６２において、帯域幅が（例えば、帯域幅検出器およびコントローラ３９によって）検出され得る。

ステップＳ６３において、検出された帯域幅は、ＴＮＳツール３３およびノイズ推定ツール３６の少なくとも１つに対して選択することができ、これらのツールは、Ｓ６２において検出された帯域幅でそれらのプロセスを実行する。

それに加えて、またはその代わりに、ステップＳ６４において、パラメータは、ビットストリーム内で定義（および／または符号化）され、記憶および／または送信され、デコーダによって使用されてもよい。パラメータの中で、帯域幅選択情報（３９ａなど）が符号化され、それによりデコーダは、サブグループ（例えば、ＴＮＳおよびノイズフィリング／推定）のために検出および選択された帯域幅を知ることができる。

次に、情報信号の新しいフレームを検査することができる。したがって、方法６０は、Ｓ６１に移動することによって循環することができる。したがって、決定はフレームごとに実行されてもよい。

特に、検出された帯域幅に従って、異なる数のビットがビットストリームに符号化され得る。実施例では、８ＫＨｚ（ＮＢ）の帯域幅が検出された場合、ビットストリームでビットは符号化されない。ただし、デコーダは帯域幅が８ＫＨｚであることを理解している。

図３および３ａのエンコーダ装置３０および３０ａのそれぞれは、
情報信号を符号化するための複数の周波数領域、ＦＤ、エンコーダツール（３１～３６）であって、情報信号は複数のフレームを表す、エンコーダツール、および
サブグループのＦＤエンコーダツールの少なくとも１つ（例えば、３３、３６）が、サブグループにないＦＤエンコーダツールの少なくとも１つ（例えば、３１、３２、３４、３５）とは異なる帯域幅を持つように、情報信号の特性に基づいて、複数のＦＤエンコーダツールの少なくともサブグループ（例えば、ＴＮＳツール３３、およびノイズレベル推定ツール３６）の帯域幅を（例えば、Ｓ６３で）選択するように構成されたエンコーダ帯域幅検出器およびコントローラ３９を含む。

特に、エンコーダ帯域幅検出器およびコントローラ３９は、サブグループの少なくとも１つのＦＤエンコーダツール（３３、３６）の帯域幅を、サブグループにないＦＤエンコーダツールの少なくとも１つ（またはそれ以上の）に共通の少なくとも第１の帯域幅（例えば、ナイキスト周波数）と、サブグループにないＦＤエンコーダツールの少なくとも１つ（またはそれ以上）の帯域幅とは異なる第２の帯域幅（例えば、ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ）との間で選択するように構成され得る。

したがって、ツールによっては、互いに異なる帯域幅で動作し、かつ／または互いに異なる帯域幅を使用して信号処理を実行する場合がある。

サブグループにないツール（例えば、グローバル利得、スペクトルノイズシェーピング）は、帯域幅の選択に関してオープンチェーンで動作する場合がある。

実施例では、エンコーダ帯域幅検出器およびコントローラ３９は、情報信号に関する少なくとも１つのエネルギー推定（例えば、Ｓ６１）に基づいて、複数のＦＤエンコーダツール（３１～３６）の少なくとも１つの帯域幅を選択（例えば、Ｓ６２）するように構成される。

図４のデコーダ装置４０は、ビットストリームに符号化された情報信号を復号するための複数のＦＤデコーダツール（４３～４８ａ）を含み、ここで
ＦＤデコーダツールは
少なくとも１つのＦＤデコーダツール（例えば、４３、４５）を含むサブグループ、
少なくとも１つのＦＤデコーダツールを含む残りのＦＤデコーダツール（例えば、４４、４６、４８ａ）に分割されており、
ここで、デコーダ装置４０または４０ａは、ビットストリームに含まれる帯域幅情報に基づいて、サブグループ（例えば、４３、４５）の複数のデコーダツールの少なくとも１つの帯域幅を選択するように構成され、それによりサブグループの複数のデコーダツールの１つ（例えば、４３、４５）は、複数のデコーダツールの残りのＦＤデコーダツールの少なくとも１つ（例えば、４４、４６、４８ａ）とは異なる帯域幅で信号処理を実行する。

図６ｂは、方法６０ｂを示す。方法６０ｂは、周波数領域、ＦＤ、における少なくとも複数の動作に従って情報信号を符号化するための方法であってもよく、方法は、
ＦＤ動作のサブグループのための帯域幅を選択するステップ（例えば、Ｓ６１ｂ）、
ＦＤ動作のサブグループのための帯域幅で第１の信号処理動作を実行するステップ（例えば、Ｓ６２ｂ）、
サブグループにないＦＤ動作のための異なる帯域幅で第２の信号処理動作を実行するステップ（例えば、Ｓ６３ｂ）を含む。

例えば、ステップＳ６１ｂおよびＳ６２ｂをこの時間的順序で実行する必要はない。例えば、Ｓ６２ｂは、Ｓ６１ｂの前に実行されてもよい。Ｓ６１ｂおよびＳ６２ｂはまた、（例えば、時分割技術または類似のものを使用して）並行して実行されてもよい。

図６ｃは、方法６０ｃを示す。方法６０ｃは、情報信号および制御データ（例えば、３９ａ）を用いてビットストリームを復号するための方法であってもよく、方法は、周波数領域、ＦＤ、における複数の信号処理動作を含み、方法は、
制御データに基づいてＦＤ動作のサブグループのための帯域幅選択を選択するステップ（Ｓ６１ｃ）、
ＦＤ動作のサブグループのための帯域幅で第１の信号処理動作を実行するステップ（Ｓ６２ｃ）、
サブグループにないＦＤ動作のための異なる帯域幅で第２の信号処理動作を実行するステップ（Ｓ６３ｃ）を含む。

例えば、ステップＳ６１ｃおよびＳ６２ｃをこの時間的順序で実行する必要はない。例えば、Ｓ６２ｃは、Ｓ６１ｃの前に実行されてもよい。Ｓ６１ｃおよびＳ６２ｃはまた、（例えば、時分割技術または類似のものを使用して）並行して実行されてもよい。

一例によれば、エンコーダ帯域幅検出器およびコントローラ３９は、例えば、

のような方程式を使用して、帯域ごとのエネルギーを検出することができ、ここで、

はＭＤＣＴまたはＭＤＳＴ係数（またはＦＤ内の信号の他の表現）であり、

（例えば６４）は帯域の数であり、

は帯域に関連付けられたインデックスである（各インデックスはビンに関連付けられている）。

したがって、（例えば、有限数の帯域幅の中から）帯域幅を（例えば、Ｓ６２で）検出することが可能である。エンコーダ帯域幅検出器およびコントローラ３９は、音声通信において一般的に使用される帯域幅、すなわち４ｋＨｚ、８ｋＨｚ、１２ｋＨｚおよび１６ｋＨｚを検出することができてもよい。例えば、各帯域幅の静粛性を検出することが可能である。帯域幅の静粛性が確実に検出された場合、スペクトル上の専用のカットオフ特性がさらに検出される。例えば、静粛性の検出に関するフラグ（またはいずれの場合もデータ）は、次のように得られる。

は、合計が

より小さい場合は１、合計が

より大きい場合は０のバイナリ値である。特定の帯域幅

に関連付けられている

は、エネルギー値の合計が特定の帯域幅

の閾値未満（およびその他の場合は「０」）である場合の静粛性を（例えば、論理値「１」によって）示す。合計は、さまざまなインデックス（例えば、ビンまたは帯域ごとのエネルギー）におけるエネルギー値の合計に関連しており、例えば

は、インデックス

に関連付けられた帯域幅の最初のインデックスからインデックス

に関連付けられた帯域幅の最後のインデックスまでである。調べた帯域幅の数は

である。

手順は

の場合に停止することがある（エネルギーが帯域幅

の閾値より大きい場合）。

の場合、スペクトルのカットオフ特性を示すフラグ

は、

によって検出することができ、ここで、

はカットオフ特性を確認する必要がある帯域間の距離、つまり

を定義する。

次に、サブグループを制御するために使用される最終情報（帯域幅情報または帯域幅選択情報）を定義することが可能である（例えば、ＴＮＳツール３３および／またはノイズレベル推定ツール３６および／またはＴＮＳデコーダツール４５および／またはノイズフィリングツール４３）。最終的な情報は、例えば、いくつかのビットに符号化され、以下のような形をとることがある。

パラメータの帯域幅

（帯域幅選択情報）を使用して、例えばデコーダでＴＮＳおよびノイズフィリングツールを制御し、信号３９ａを具体化することができる。パラメータ

は、記憶および／またはビット数

を使用してビットストリームで送信されてもよい。特に、ビット数は必ずしも一定ではなく、選択されたサンプルレート

に応じて変化する可能性があるため、必要のない場合はビットストリームのペイロードが減る。

次のような表を使用できる

は所定のサンプリングレート（例えば、８ＫＨｚ、１６ＫＨｚ、２４ＫＨｚ、３２ＫＨｚ、４８ＫＨｚ）であり、各

について、可能なモードの数は

である。

したがって、以下を含む制御データフィールドを０データ符号化することが可能である。

ＮＢ帯域幅（の選択の通知）に対応する０データビット
ＮＢおよびＷＢ帯域幅（の１つの選択の通知）に対応する１つのデータビット
ＮＢ、ＷＢ、およびＳＳＷＢ帯域幅（の１つの選択の通知）に対応する２データビット
ＮＢ、ＷＢ、ＳＳＷＢ、およびＳＷＢ帯域幅（の１つの選択の通知）に対応する２データビット
ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、およびＦＢ帯域幅（の１つの選択の通知）に対応する３データビット。

表１の少なくとも一部の部分の電子バージョンは、エンコーダおよび／またはエンコーダに記憶され得る。したがって、パラメータ帯域幅

が、ＴＮＳおよびノイズフィリング動作のための制御情報を自動的に知ることが可能である。例えば、

は帯域幅の下限に関連付けられた開始インデックスを参照する場合があり、

は帯域幅の上限に関連付けられた最終インデックスを参照する場合がある。したがって、帯域幅の選択と、この選択に基づくパラメータは、表１などの表から導出できる。

実施例では、

の場合、帯域幅検出器は不要であり、

および

である。つまり、パラメータ

はビットストリームに配置されない。しかしながら、デコーダは、選択された帯域幅が（例えば、表１の電子バージョンなどの電子機器に基づいて）ＮＢであることを理解するであろう。

他の方法が使用されてもよい。帯域幅ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢの１つが識別され、ＴＮＳシェーピングツール３３やノイズ推定器ツール３６などのエンコーダサブグループのＦＤツールに送信される。パラメータ

（３９ａ）などの情報は、符号化され、デコーダ装置４０または４０ａに送信することができ、それにより、デコーダノイズ推定器ツール４３およびＴＮＳデコーダツール４５は、選択された帯域幅に関する情報を利用する。

一般的に、帯域幅の選択の基となる情報信号特性は、とりわけ、信号帯域幅、情報信号の少なくとも１つのエネルギー推定、スペクトル上のカットオフ特性、特定の帯域、

、での静粛性の検出に関する情報などの１つ以上を含んでもよい。

上記の例では、柔軟な帯域幅の切り替えが可能である。

５．２エンコーダでのＭＤＣＴまたはＭＤＳＴ（またはその他の変換）
修正離散コサイン変換（ＭＤＣＴ）または修正離散サイン変換（ＭＤＳＴ）（または別の変調ラップ変換）ツール３１は、ＴＤのデジタル表現をＦＤのデジタル表現に変換することができる。それにもかかわらず、他の例（ラップ変換などの他の変換に基づく可能性がある）は、使用されてもよい。ここに例を示す。

ＴＤの現在のフレーム

の入力信号

は

オーディオサンプルで構成されてもよく、最新のものは

にある。過去のフレームのオーディオサンプルは、負のインデックスによってアクセスされ、例えば

は前のフレームの最新のものである。

ＭＤＣＴの時間入力バッファ

は、
・

・

（一貫性のために初期化が必要）
に従って更新され得る。

時間サンプルのブロックは、以下の方程式

を使用して周波数係数

に変換でき、ここで、

は使用されているフレームサイズに応じた低遅延ＭＤＣＴウィンドウである。ウィンドウは

で最適化され、異なるフレームサイズの他のバージョンが補間によって生成され得る。ウィンドウの形状は、最適化手順の結果であってもよく、ポイントごとに提供され得る。

ＭＤＳＴまたは他の変換を適用することも可能である。

５．３．１エンコーダでのＬＰＣ
線形予測コーディング（ＬＰＣ）分析は、ＬＰＣツール３２によって実行され得る。ＬＰＣは、線形予測モデルの情報を使用して、デジタル信号のスペクトルエンベロープを圧縮形式で表すために使用される。

ＬＰＣフィルタは、歪んだ周波数領域で導出され得るため、音響心理学的に最適化される。自己相関関数を得るために、上記で定義されたエネルギー

は、

によって定義され

そして、例えば逆奇数ＤＦＴ

を使用して時間領域に変換される。

の場合、

および

と設定する。最初の

個のサンプルは、ベクトル

に抽出され、

はＬＰフィルタ次数、つまり

を表す。

ＬＰフィルタ係数は、例えば、レビンソン・ダービン手順により、ベクトル

に基づいて計算されてもよい。この手順は、以下の疑似コード

で説明でき、

は推定されたＬＰＣ係数であり、

は予測誤差である。

ＬＰＣ係数は、実施例では次のような方程式

によって重み付けされる。ＬＰＣ係数は量子化できる。

例えば、重み付けされたＬＰＣ係数

は、最初に係数

で

を使用して畳み込まれ、ここで

および

である。

次に、係数

は、

を使用して周波数領域に変換でき、ここで

は変換の長さである。この変換は、プルーニングＦＦＴを使用して効率的に実装できることに注意されたい。次に、

の実数部と虚数部が抽出される。

ＬＳＦは、次の疑似コードで説明できる

および

のゼロクロッシング検索によって得られる

検出されたＬＳＦが１６未満の場合、ＬＳＦは以下に従って設定される。

ＬＰＣシェーピングは、ＭＤＣＴまたはＭＤＳＴスペクトルに変換された重み付けされた量子化ＬＰフィルタ係数から計算された利得係数を適用することにより、ＭＤＣＴまたはＭＤＳＴ（ＦＤ）ドメインで実行できる。

ＬＰＣシェーピング利得を計算するには、まず重み付けされたＬＰフィルタ係数

を、奇数ＤＦＴを使用して周波数領域に変換する。

ＬＰＣシェーピング利得

は、

の絶対値として得られる。

ＬＰＣシェーピング利得

は、次のコードで概説されるように、シェーピングされたスペクトル

を生成するために、各帯域のＭＤＣＴまたはＭＤＳＴ周波数ラインに個別に適用できる

上記から分かるように、ＬＰＣ分析を実行するためのＬＰＣツールは、コントローラ３９によって制御されず、例えば、特定の帯域幅の選択はない。

５．３．２エンコーダでのＳＮＳ
図４ａを参照すると、スペクトルノイズシェーパツール３２ａを使用することが可能である。

スペクトルノイズシェーピング（ＳＮＳ）は、人間の耳にはほとんど知覚されないように周波数領域で量子化ノイズをシェーピングし、復号された出力の知覚品質を最大化する。

スペクトルノイズシェーピングは、例えば、１６のスケーリングパラメータを使用して実行されてもよい。これらのパラメータは、最初に６４の不均一な帯域のＭＤＣＴ（またはＭＤＳＴ、または別の変換）スペクトルのエネルギーを計算し、次に６４のエネルギーにいくつかの処理（平滑化、プリエンファシス、ノイズフロア、対数変換）を行い、次に、６４の処理済みエネルギーを係数４でダウンサンプリングして、最終的に正規化およびスケーリングされる１６のパラメータが得ることで得られる。次に、これらの１６個のパラメータは、ベクトルを使用して量子化される。次に、量子化されたパラメータを補間して、６４個の補間されたスケーリングパラメータが得られる。次に、これらの６４個のスケーリングパラメータを使用して、６４個の不均一な帯域にＭＤＣＴ（またはＭＤＳＴ…）スペクトルを直接形成する。スケーリングされたＭＤＣＴ（またはＭＤＳＴ…）係数は、グローバル利得によって制御されるステップサイズのスカラー量子化器を使用して量子化される。デコーダでは、６４帯域ごとに逆スケーリングが実行され、スカラー量子化器によって導入された量子化ノイズを整形する。ここに開示されたＳＮＳ技術は、例えば、１６＋１個のパラメータのみをサイド情報として使用することができ、パラメータは、ベクトル量子化を使用して少ないビット数で効率的に符号化することができる。その結果、サイド情報ビットの数が減り、低ビットレートおよび／または低遅延で大きな利点につながる可能性がある。非線形周波数スケーリングを使用することができる。この実施例では、複雑さを軽減するためにいずれのＬＰＣ関連の関数も使用されない。必要な処理機能（平滑化、プリエンファシス、ノイズフロア、対数変換、正規化、スケーリング、補間）は、比較すると、必要とされる複雑さは小さい。まだベクトル量子化だけが比較的複雑である。ただし、一部の複雑性の低いベクトル量子化手法は、パフォーマンスの損失が少なく使用できる（マルチスプリット／マルチステージアプローチ）。このＳＮＳ手法は、ＬＰＣベースの知覚フィルタに依存していない。これは多くの自由度で計算することができる１６個のスケーリングパラメータを使用する。したがって、柔軟性が向上する。

エンコーダ３０ａで、ＳＮＳツール３２は、以下の少なくとも１つを実行することができる。

・ステップ１：帯域あたりのエネルギー
帯域あたりのエネルギー

は、

のように計算でき、

はＭＤＣＴ（またはＭＤＳＴ、または別の変換）係数であり、

は帯域の数であり、

は帯域インデックスである。帯域は不均一で、知覚的に関連するバルク尺度に従う場合がある（低周波数では小さく、高周波数では大きくなる）。

・ステップ２：平滑化
帯域あたりのエネルギー

は、

を使用して平滑化される。

このステップは主に、ベクトル

に現れる可能性のある不安定性を平滑化するために使用できる。平滑化されていない場合、これらの不安定性は、特にエネルギーが０に近い谷で、対数領域に変換すると増幅される（ステップ５を参照）。

・ステップ３：プリエンファシス
次に、帯域あたりの平滑化されたエネルギー

は、

を使用してプリエンファシスされ、

はプリエンファシスの傾きを制御し、サンプリング周波数に依存する。例えば、１６ＫＨｚで１８、４８ＫＨｚで３０である。このステップで使用されるプリエンファシスは、従来技術２のＬＰＣベースの知覚フィルタで使用されるプリエンファシスと同じ目的を持ち、低周波数で整形スペクトルの振幅を増加させ、結果として低周波における量子化ノイズを低減する。

・ステップ４：ノイズフロア
－４０ｄBのノイズフロアが

に

を使用して追加され、ノイズフロアは

によって計算される。

このステップにより、グロッケンシュピールのような非常に高いスペクトルダイナミクスを含む信号の品質が、谷の整形されたスペクトルの振幅増幅を制限することにより向上し、ピークの量子化ノイズを低減するという間接的な効果がある（谷の量子化ノイズの増加は知覚できない）。

・ステップ５：対数
次に、以下を使用して対数ドメインへの変換が実行される。

・ステップ６：ダウンサンプリング
次に、ベクトル

が

を使用して、係数４でダウンサンプリングされ、
ここで

である。

このステップは、デシメーションの前にベクトル

にローパスフィルタ（ｗ（ｋ））を適用する。このローパスフィルタは、心理音響モデルで使用される拡散関数と同様の効果があり、ピークでの量子化ノイズを低減するが、その代わりに知覚的にマスクされているピーク周辺の量子化ノイズが増加する。

・ステップ７：平均の除去とスケーリング
最終的なスケール係数は、平均の除去と０．８５の係数によるスケーリングの後に得られる。

コーデックには追加のグローバル利得があるため、情報を失うことなく平均値を除去できる。平均を除去すると、ベクトル量子化がより効率的になる。０．８５のスケーリングは、ノイズシェーピングカーブの振幅をわずかに圧縮する。これは、ステップ６で説明した拡散関数と同様の知覚効果があり、ピークでの量子化ノイズの低減と、谷での量子化ノイズの増加である。

・ステップ８：量子化
スケール係数は、ベクトル量子化を使用して量子化され、ビットストリームにパックされてデコーダに送信されるインデックスと、量子化されたスケール係数

を生成する。

・ステップ９：補間
量子化されたスケール係数

は、

を使用して補間され、

を使用して線形ドメインに変換し直される。

補間は、滑らかなノイズシェーピングカーブを取得し、隣接する帯域間の大きな振幅のジャンプを回避するために使用できる。

・ステップ１０：スペクトルシェーピング
ＳＮＳスケール係数

は、シェーピングされたスペクトル

を生成するために、各帯域のＭＤＣＴ（またはＭＤＳＴ、または別の変換）周波数ラインに個別に適用される。

５．４エンコーダでのＴＮＳ
図７は、エンコーダ３０または３０ａのＴＮＳツール３３などのＴＮＳツールの動作を示す方法７０を示す。

ステップＳ７１において、選択された帯域幅（例えば、パラメータ

）に関する選択情報は、例えば、エンコーダ帯域幅検出器およびコントローラ３９から得ることができる。

選択情報（帯域幅情報）に応じて、ＴＮＳの動作は帯域幅（ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢ）ごとに異なる。次の表に例を示す

例えば、選択情報がＳＷＢの場合、ＴＮＳはフィルタリングを２回実行する（ｎｕｍ＿ｔｎｓ＿ｆｉｌｔｅｒｓを参照）。表から分かるように、さまざまなインデックスがさまざまな帯域幅に関連付けられている（例えば、ＮＢの場合、ストップ周波数はＷＢの場合とは異なる、など）。

したがって、分かるように、ＴＮＳツール３３は、コントローラ３９によって設定された選択に基づいて、異なる帯域幅で動作することができる。特に、同じエンコーダ装置４０または４０ａの他のＦＤツールは、異なる周波数でプロセスを実行し続けることができる。

ＴＮＳ符号化のステップを以下に説明する。まず、分析により、各ＴＮＳフィルタの反射係数のセットが推定される（ステップＳ７２）。次に、これらの反射係数を量子化する（ステップＳ７３）。最後に、量子化された反射係数を使用して、ＭＤＣＴまたはＭＤＳＴスペクトルがフィルタリングされる（ステップＳ７３）。

ステップＳ７２を参照すると、以下で説明される完全なＴＮＳ分析は、すべてのＴＮＳフィルタ

に対して繰り返すことができ、

である（ｎｕｍ＿ｆｉｌｔｅｒｓは、表２で与えられている）。反射係数を提供する他のＴＮＳ分析動作を実行できる。

ＴＮＳツールは、ＴＮＳ入力値に対して自己相関を実行するように構成できる。正規化された自己相関関数は、

のように計算でき、それぞれについて

（例えば）であり、
ここで

および

であり、

および

は表２で与えられている。

は、スペクトルサブセクションのエネルギー合計である（各フィルタのスタート周波数とストップ周波数との間の正規化係数）。

正規化された自己相関関数は、例えば

を使用してラグウィンドウできる。

一部の実施例では、予測利得に基づいて、現在のフレームでＴＮＳフィルタ

をオン／オフにする決定を実行することができる。

の場合、ＴＮＳフィルタ

をオンにし、ここで

であり、予測利得は、

のように計算できる。

以下で説明する追加の手順は、ＴＮＳフィルタ

がオンになっている場合（またはオン／オフを使用しない実施例）にのみ実行される。

一部の実施例では、重み付け係数は

により計算され、ここで

、

であり、

である。

ＬＰＣ係数は、係数

を使用して重み付けできる。

重み付けされたＬＰＣ係数は、次の手順を使用して反射係数に変換できる。

ここで、

はＴＮＳフィルタ

の最終的な推定反射係数である。

ＴＮＳフィルタ

がオフにされる場合、反射係数は単に０と設定され、

である。

ステップＳ７３において、量子化ステップが実行されてもよい。例えば、各ＴＮＳフィルタ

について、（例えば、ステップＳ７２で得られるような）反射係数が量子化されてもよい。例えば、アークサインドメインでのスカラー均一量子化を使用できる。

および／または

ここで、

および

は、例えば、最も近い整数への丸め関数であり、

は量子化器の出力インデックス、

は量子化された反射係数である。

量子化された反射係数の次数は、

を使用して計算され、
一方で、

および

の場合、

を行う。

現在のフレームでＴＮＳによって消費されるビットの総数は、

のように計算でき、
ここで

および／または

は、
整数に丸める演算を意味する。

表

および

は、事前定義されている場合がある。

ステップＳ７４で、ＦＤ内の情報信号のデジタル表現（例えば、ＬＰＣツール３２またはＳＮＳツール３２ａによって提供されるもの）をフィルタリングすることができる。この表現は、実施例では、修正された離散コサインまたはサイン変換（ＭＤＣＴまたはＭＤＳＴ）の形であり得る。ＭＤＣＴスペクトル

は、例えば

のアルゴリズムを使用してフィルタリングでき、
ここで

は、ＴＮＳフィルタ処理されたＭＤＣＴまたはＭＤＳＴスペクトルである。

他のフィルタリング技術が使用されてもよい。しかしながら、ＴＮＳは、信号特性に基づいてコントローラ３９によって選択された特定の帯域幅（例えば、ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢ）に適用されることが分かるであろう。

５．５エンコーダでのスペクトル量子化
ここでは、スペクトル量子化ツール３４について説明する。ＴＮＳフィルタリング（

）後のＭＤＣＴまたはＭＤＳＴスペクトルは、不感帯および均一閾値スカラー量子化を使用して量子化され、量子化されたＭＤＣＴまたはＭＤＳＴスペクトル

は、算術符号化を使用して符号化される。グローバル利得

は、量子化器のステップサイズを制御する。このグローバル利得は７ビットで量子化され、量子化されたグローバル利得インデックス

は、例えば０～１２７の整数になる。グローバル利得インデックスは、量子化されたＭＤＣＴまたはＭＤＳＴスペクトルを符号化するために必要なビット数が、利用可能なビットバジェットにできるだけ近くなるように選択できる。

一例では、スペクトルをコーディングするために利用可能なビット数は、

によって与えられ、

は元の情報信号に対して１つのＴＤフレームで使用可能なビット数であり、

は表１によって提供され、

はＴＮＳ（現在のフレームでＴＮＳによって消費されるビットの総数）によって提供され、

はＬＴＰＦ３８ｂ（ＬＴＰＦによって消費されるビット数）に関連しており、例えば、

、

および

である。実施例では、保護ビット（例えば、巡回冗長コード、ＣＲＣ、ビット）も考慮に入れることができる。

オフセットは最初に

を使用して計算することができ、

は前のフレームの

の値、

は前のフレームの

の値、

は前のフレームの

の値である。

このオフセットを使用して、スペクトルのコーディングに利用可能なビット数を調整できる。

次に、量子化されたＭＤＣＴまたはＭＤＳＴスペクトルを符号化するために必要なビット数が、利用可能なビットバジェットにできるだけ近くなるように、グローバル利得インデックスを推定できる。この推定は、量子化されたスペクトルを符号化するために必要なビット数を大まかに概算する、複雑度の低い二分探索に基づいている。アルゴリズムは次のように説明できる

ここでＥ［ｋ］は、

で与えられる４つのＭＤＣＴまたはＭＤＳＴ係数のブロックのエネルギー（ｄＢ）である。

上記のグローバル利得インデックスは、最初に以下を使用して非量子化される。

次にスペクトル

は、例えば

を使用して量子化できる。

量子化されたＭＤＣＴまたはＭＤＳＴ（または、いずれかの、ＦＤ）スペクトル

を符号化するために必要なビット数

は、以下のアルゴリズムを使用して正確に推定できる。

ビットレートフラグが、例えば次のように最初に計算される

次に、最後のゼロ化されていない２タプルのインデックスが、次のように得られる

次に、ビット数

が次のように計算される

ここで、ａｃ＿ｌｏｏｋｕｐおよびａｃ＿ｂｉｔｓは、事前定義されている表である。

ビット数

は、利用可能なビットバジェット

と比較できる。それらが互いに離れている場合、量子化されたグローバル利得インデックス

が調整され、スペクトルが再量子化される。量子化されたグローバル利得インデックス

を調整するために使用される手順を以下に示す

上記から分かるように、スペクトル量子化はコントローラ３９によって制御されず、特定の帯域に制限はない。

５．６エントロピーコーディング
符号化されたデータのすべてまたは一部（ＴＮＳデータ、ＬＴＰＦデータ、グローバル利得、量子化スペクトル…）は、例えば、任意のアルゴリズムによる圧縮によって、エントロピーコーディングできる。

このデータの一部は、ビットストリームの最後から開始して逆方向に直接ビットストリームに入れられる純粋なビットで構成することができる。

残りのデータは、ビットストリームの先頭から開始する、算術符号化を使用して符号化できる。

上記の２つのデータフィールドは、ビットストリームの読み取り／書き込みの開始点と方向に関して交換できる。

疑似コードの例は次のとおりである

５．７エンコーダでのノイズ推定
ノイズ推定ツール３６（ノイズレベル推定器）は、デコーダ側でのノイズフィリングを制御することができる。エンコーダ側では、ノイズレベルパラメータを推定、量子化、送信、またはビットストリームに記憶できる。

ノイズレベルは、ゼロに量子化された、つまり

であるスペクトル係数に基づいて推定することができる。関連するスペクトル係数のインデックスは、

によって与えられ、ここで

は、ステップＳ６２で検出された帯域幅および／または例えば以下の表で定義されている帯域幅検出器およびコントローラ３９によって検出された帯域幅に依存し得る

識別されたインデックスについて、欠落係数の平均レベルは、例えば、ＴＮＳフィルタリング（

後のスペクトルに基づいて推定され、グローバル利得によって正規化される。

最終的なノイズレベルは、８つのステップに量子化される。

したがって、ノイズレベル推定ツール３６は、例えば帯域幅情報３９ａに基づいて、コントローラ３９によって制御され得る。

例えば、表３の電子バージョンは記憶ユニットに記憶されてもよく、それにより、特定の帯域幅についての帯域幅選択が得られたときに、パラメータ

が容易に導出される。

５．８デコーダでのエントロピー復号
符号化されたすべてのデータ（ＴＮＳデータ、ＬＴＰＦデータ、グローバル利得、量子化スペクトル…）は、例えばデコーダツール４２を使用して、デコーダ側でエントロピー復号できる。したがって、エンコーダによって提供されるビットストリームは、任意のアルゴリズムに従って解凍される。

５．９デコーダでのノイズフィリング
ここでは、デコーダノイズフィリングツール４３について説明する。デコーダノイズフィリングツール４３は、とりわけ、デコーダ帯域幅コントローラ４９によって（および／または、表１の制御データフィールドＮ_ｂｗおよび／またはＰ_ｗｂなどの、ビットストリームに符号化された情報３９ａを介してコントローラ３９によって）制御され得る。

関連するスペクトル係数のインデックスは、

によって与えられ、ここで

は表３で与えられる。

ノイズフィリングは、エンコーダから得た送信ノイズ係数

を使用して、識別された関連するスペクトルライン

に適用できる。

は、エンコーダ側のノイズ推定器で計算することができる。

は、ビットストリームのサイド情報としてコーディングされた３ビット値であってもよい。

は、例えば、次の手順を使用して得ることができる

手順は次のとおりである

ｎｆ＿ｓｅｅｄの取得方法は、例えば、次の疑似コードで記述できる

上記から分かるように、デコーダノイズフィルタツール４３は、パラメータ

を利用することができる。

一部の例では、パラメータ

は、ビットストリームの値として明示的に得られる。実施例では、パラメータ

は、エンコーダによって符号化されたビットストリームの制御フィールド内の帯域幅情報３９ａ（Ｐ_ｂｗ）に基づいて、コントローラ４９によって得られる。デコーダは、非一時的記憶ユニットに記憶された表３の電子バージョンを有することができる。したがって、ビットストリームの長さが短縮される。

したがって、帯域幅コントローラ４９（および／または帯域幅検出器および制御データ３９ａを介してデコーダのコントローラ３９）は、デコーダノイズフィリングツール４３を制御することができる。

５．９デコーダでのグローバル利得
ノイズフィリングが適用された後、例えば、

のような式を使用して、スペクトルにグローバル利得を適用でき、
ここで、

は、例えばエンコーダから得たグローバル利得インデックスである。

５．１０デコーダでのＴＮＳ
ここでは、ＴＮＳデコーダツール４５について説明する。量子化された反射係数は、ＴＮＳフィルタ

ごとに、

を使用して取得でき、

は、量子化器の出力インデックスである。

次に、ＭＤＣＴまたはＭＤＳＴスペクトル

（例えば、グローバル利得ツールによって生成されたもの）は

のような手順を使用してフィルタリングでき、

は、ＴＮＳデコーダの出力である。

エンコーダによって提供される制御情報に基づいて、パラメータｎｕｍ＿ｔｎｓ＿ｆｉｌｔｅｒｓ、ｓｔａｒｔ＿ｆｒｅｑ、ｓｔｏｐ＿ｆｒｅｑが提供され得る。

一部の例では、ｎｕｍ＿ｔｎｓ＿ｆｉｌｔｅｒｓ、ｓｔａｒｔ＿ｆｒｅｑ、および／またはｓｔｏｐ＿ｆｒｅｑは、ビットストリームで明示的に提供されない。実施例では、ｎｕｍ＿ｔｎｓ＿ｆｉｌｔｅｒｓ、ｓｔａｒｔ＿ｆｒｅｑ、ｓｔｏｐ＿ｆｒｅｑは、エンコーダによって符号化されたビットストリームの制御フィールドのＮ_ｂｗ値に基づいて導出される。例えば、デコーダは、そこに記憶された表２（または少なくともその一部）の電子バージョンを有し得る。したがって、ビットストリームの長さが短縮される。

したがって、ＴＮＳデコーダツール４５は、エンコーダ側で検出された帯域幅によって制御され得る。

５．１１．１デコーダでのＭＤＣＴまたはＭＤＳＴシェーピング
ここでは、ＭＤＣＴまたはＭＤＳＴシェーピングツール４６について説明する。ＬＰＣまたはＳＮＳシェーピングは、ＭＤＣＴまたはＭＤＳＴスペクトルに変換された、復号されたＬＰフィルタ係数から計算された利得係数を適用することにより、ＭＤＣＴ（ＦＤ）ドメインで実行できる。

ＬＰＣシェーピング利得を計算するには、まず復号されたＬＰフィルタ係数

を、奇数ＤＦＴを使用して周波数ドメインに変換する。

次に、ＬＰＣシェーピング利得

は、

の逆絶対値として計算される。

ＬＰＣシェーピング利得

は、例えば次のコードで概説されるように、シェーピングされたスペクトル

を生成するために、概説されているように各帯域のＴＮＳフィルタ処理されたＭＤＣＴ周波数ラインに個別に適用できる

上記から分かるように、ＭＤＣＴまたはＭＤＳＴシェーピングツール４６は、特定の帯域幅に制限される必要はなく、したがって、コントローラ４９または３９によって制御される必要はない。

５．１１．２デコーダでのＳＮＳ
以下のステップは、ノイズシェーパデコーダ、ＳＮＳ、ツール４６ａで実行され得る。

・ステップ１：量子化
エンコーダステップ８（セクション５．３．２を参照）で生成されたベクトル量子化インデックスは、ビットストリームから読み取られ、量子化されたスケール係数

を復号するために使用される。

・ステップ２：補間
セクション５．３．２のステップ９と同じである。

・ステップ３：スペクトルシェーピング
ＳＮＳスケール係数

は、以下のコードで概説されているように、復号されたスペクトル

を生成するために、各帯域の量子化されたＭＤＣＴ（またはＭＤＳＴ、または別の変換）周波数ラインに個別に適用される。

５．１２デコーダでのＭＤＣＴまたはＭＤＳＴ合成
ここでは、逆ＭＤＣＴまたはＭＤＳＴツール４８ａについて説明する（ラップ変換など、他の変換に基づく他のツールを使用できる）。

再構築されたスペクトル

は、次の手順で時間領域に変換できる。

１．時間領域エイリアスバッファ

の生成
２．時間エイリアスバッファのウィンドウ処理

３．オーバーラップ加算演算を実行して、時間サンプル

を得る

ここで最初のフレームを復号する前に、

が０に初期化される。

ステップ１を参照すると、ＭＤＳＴは、例えば

を有するためにｃｏｓ関数をサイン関数と交換することで実行できる。

上記から分かるように、逆ＭＤＣＴまたはＭＤＳＴツール４８ａは、エンコーダ側で決定された帯域幅に基づいて制御されない。

６．その他の例
図８ａは、エンコーダ装置３０または３０ａの少なくともいくつかのツールを実装し、および／または方法６０および／または７０の少なくともいくつかのステップを実行することができる装置１１０を示す。装置１１０は、プロセッサ１１１と、プロセッサ１１１によって実行されたときにプロセッサ１１１にエンコーダ装置３０または３０ａのＴＤおよび／またはＦＤツールの少なくとも１つを実装させる命令を記憶する非一時的メモリユニット１１２とを含むことができる。特に、命令は、ＦＤツール（例えば、ＴＮＳおよび／またはノイズフィリング）のサブグループおよびサブグループにない他のＦＤツール（例えば、３１、３２、３４、３５）を実装することができる。命令はまた、プロセッサ１１１によって実行されたときに、ＦＤツールのサブグループ内のツール（例えば、ＴＮＳおよび／またはノイズフィリング）によって処理される信号の帯域幅が、サブグループにない他のＦＤツール（例えば、３１、３２、３４、３５）によって処理される信号の帯域幅と異なるように帯域幅の選択を実行する命令を含み得る。命令は、異なる帯域幅に関連するエネルギー検出に基づいて帯域幅選択を制御するようなものであり得る。命令はまた、プロセッサ１１１によって実行されたときに、デコーダを制御することを可能にし、特に、他のＦＤツールの帯域幅とは異なり得るＦＤツールのサブグループ（例えば、４３、４５）の帯域幅を制御することを可能にする命令を含み得る。エンコーダでサブグループ用に選択された帯域幅は、デコーダでサブグループ用に選択されたものと同じであってもよい。非一時的メモリユニット１１２は、表１、２、および／または３の電子バージョンの少なくとも一部などの他のデータも含み得る。装置１１０は、例えば、情報信号（例えば、オーディオ信号）から得られたビットストリームを記憶するための記憶スペース１１８を含み得る。装置１１０は、例えば、Ｂｌｕｅｔｏｏｔｈなどの特定のプロトコルを使用して、例えば無線でデータを送信するための出力ユニット１１７を含み得る。例えば、装置１１０は、非一時的メモリユニット１１２に記憶された命令を実行することによって、デコーダに送信されるビットストリームを定義することができる。装置１１０は、例えば、Ｂｌｕｅｔｏｏｔｈなどの特定のプロトコルを使用して、例えば無線でデータを得るための入力ユニット１１６も含み得る。

図８ｂは、デコーダ装置４０または４０ａの少なくともいくつかのツールを実装することができる装置１２０を示す。装置１２０は、プロセッサ１２１と、プロセッサ１２１によって実行されたときにプロセッサ１２１にデコーダ装置４０または４０ａのＴＤおよび／またはＦＤツールの少なくとも１つを実装させる命令を記憶する非一時的メモリユニット１２２とを含むことができる。特に、命令は、ＦＤツール（例えば、ＴＮＳおよび／またはノイズフィリング）のサブグループおよびサブグループにない他のＦＤツール（例えば、４４、４６など）を実装することができる。命令はまた、プロセッサ１２１によって実行されたときに、ＦＤツールのサブグループ内のツール（例えば、ＴＮＳおよび／またはノイズフィリング）によって処理される信号の帯域幅が、サブグループにない他のＦＤツール（例えば、４４、４６など）によって処理される信号の帯域幅と異なるように帯域幅の選択を実行する命令を含み得る。命令は、例えば、エンコーダによって実行されるような、異なる帯域幅に関連するエネルギー検出に基づいて帯域幅選択を制御するようなものであり得る。命令はまた、プロセッサ１２１によって実行されたときに、エンコーダとして動作することを可能にし、特に、他のＦＤツールの帯域幅とは異なり得るＦＤツールのサブグループ（例えば、４３、４５）の帯域幅を制御することを可能にする命令を含み得る。エンコーダでサブグループ用に選択された帯域幅は、デコーダでサブグループ用に選択されたものと同じであってもよい。非一時的メモリユニット１２２は、表１、２、および／または３の電子バージョンの少なくとも一部などの他のデータも含み得る。装置１２０は、例えば、情報信号（例えば、オーディオ信号）から得られたビットストリームを記憶するための記憶スペース１２８を含み得る。装置１２０は、例えば、Ｂｌｕｅｔｏｏｔｈなどの特定のプロトコルを使用して、例えば無線でデータを送信するための出力ユニット１２７を含み得る。装置１２０は、例えば、Ｂｌｕｅｔｏｏｔｈなどの特定のプロトコルを使用して、例えば無線でデータを得るための入力ユニット１２６も含み得る。例えば、装置１２０は、非一時的メモリユニット１２２に記憶された命令を実行することによって、デコーダによって送信されたビットストリームを得ることができる。

実施例では、装置１１０および１２０は、同じデバイスであり得る。実施例では、異なる装置１１０および１２０の構成がシステムを形成する。

特定の実装要件に応じて、実施例はハードウェアで実装できる。実装は、フロッピーディスク、デジタル多用途ディスク（ＤＶＤ）、ブルーレイディスク、コンパクトディスク（ＣＤ）、読み取り専用メモリ（ＲＯＭ）、プログラム可能読み取り専用メモリ（ＰＲＯＭ）、消去可能プログラム可能読み取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラム可能読み取り専用メモリ（ＥＥＰＲＯＭ）、またはフラッシュメモリなど、電子的に読み取り可能な制御信号が記憶され、それぞれの方法が実行されるようにプログラム可能コンピュータシステムと協働する（または協働することができる）デジタル記憶媒体を使用して実行できる。したがって、デジタル記憶媒体はコンピュータで読み取り可能であってもよい。

一般に、実施例は、プログラム命令を含むコンピュータプログラム製品として実装されてもよく、プログラム命令は、コンピュータプログラム製品がコンピュータ上で実行されるときに、方法の１つを実行するように動作する。プログラム命令は、例えば、機械可読媒体に記憶されてもよい。

他の実施例は、機械可読キャリアに記憶された、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを含む。つまり、本発明の方法の実施例はしたがって、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法の１つを実行するためのプログラム命令を有するコンピュータプログラムである。

したがって、本発明の方法のさらなる実施例は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを含み、それが記録されたデータキャリア媒体（またはデジタル記憶媒体、またはコンピュータ可読媒体）である。データキャリア媒体、デジタル記憶媒体、または記録された媒体は、無形で一時的な信号ではなく、有形および／または非一時的なものである。

さらなる実施例は、本明細書に記載の方法の１つを実行する処理ユニット、例えばコンピュータ、またはプログラム可能な論理デバイスを含む。

さらなる実施例は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。

さらなる実施例は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを受信側に（例えば、電子的または光学的に）転送する装置またはシステムを含む。受信側は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってもよい。装置またはシステムは、例えば、コンピュータプログラムを受信側に転送するためのファイルサーバを含んでもよい。

一部の実施例では、プログラム可能な論理デバイス（例えば、フィールド・プログラマブル・ゲート・アレイ）を使用して、本明細書に記載の方法の機能の一部またはすべてを実行することができる。一部の実施例では、フィールド・プログラマブル・ゲート・アレイは、本明細書に記載の方法の１つを実行するためにマイクロプロセッサと協働してもよい。一般に、方法は、任意の適切なハードウェア装置によって実行され得る。

上記の例は、上で説明した原理を例示するものである。本明細書に記載の配置および詳細の修正および変更は、明らかであることを理解されたい。したがって、本明細書の実施例の説明として提示される特定の詳細によってではなく、差し迫った特許請求の範囲によって制限されることが意図されている。

Claims

エンコーダ装置であって、
情報信号を符号化するための複数の周波数領域エンコーダツールであって、前記情報信号は複数のフレームを表すエンコーダツール、および
前記複数の周波数領域エンコーダツールの少なくともサブグループ（３３、３６）の帯域幅を選択するように構成されたエンコーダ帯域幅検出器およびコントローラ（３９）を含み、前記サブグループ（３３、３６）は、前記サブグループ（３３、３６）の前記周波数領域エンコーダツールの少なくとも１つが、前記サブグループ（３３、３６）にない前記周波数領域エンコーダツールの少なくとも１つとは異なる帯域幅を有するように、情報信号特性に基づいて、前記複数の周波数領域エンコーダよりも少ない周波数領域エンコーダツールを含む、エンコーダ装置。
前記サブグループの少なくとも１つの周波数領域エンコーダツールは、一時的ノイズシェーピング、ＴＮＳ、ツール（３３）および／またはノイズレベル推定ツール（３６）である、
請求項１に記載のエンコーダ装置。
前記サブグループ（３３、３６）にない少なくとも１つの周波数領域エンコーダツールは、線形予測コーディング、ＬＰＣ、ベースのスペクトルシェーパ、スペクトルノイズシェーピング、ＳＮＳ、ツール、スペクトル量子化器、および残差コーダの少なくとも１つから選択される、
請求項１または２に記載のエンコーダ装置。
前記エンコーダ帯域幅検出器およびコントローラ（３９）は、前記サブグループにない前記周波数領域エンコーダツールの少なくとも１つに共通する少なくとも第１の帯域幅と、前記サブグループにない前記周波数領域エンコーダツールの前記少なくとも１つの前記帯域幅とは異なる第２の帯域幅との間で、前記サブグループ（３３、３６）の前記少なくとも１つの周波数領域エンコーダツールの前記帯域幅を選択するように構成される、
請求項１から３のいずれか一項に記載のエンコーダ装置。
前記エンコーダ帯域幅検出器およびコントローラ（３９）は、前記情報信号に関する少なくとも１つのエネルギー推定に基づいて、前記複数の周波数領域エンコーダツールの前記少なくとも１つの前記帯域幅を選択するように構成される、
請求項１から４のいずれか一項に記載のエンコーダ装置。
前記エンコーダ帯域幅検出器およびコントローラ（３９）は、前記複数の周波数領域エンコーダツールの前記少なくとも１つの前記帯域幅を制御するために、前記情報信号の帯域幅に関連する少なくとも１つのエネルギー推定をそれぞれの閾値と比較するように構成される、
請求項１から５のいずれか一項に記載のエンコーダ装置。
前記サブグループ（３３、３６）の前記複数の周波数領域エンコーダツールの前記少なくとも１つは、前記エンコーダ帯域幅検出器およびコントローラ（３９）によって選択された前記帯域幅内でＴＮＳ入力信号を自己相関させるように構成されたＴＮＳを含む、
請求項１から６のいずれか一項に記載のエンコーダ装置。
前記サブグループにない前記周波数領域エンコーダツールの前記少なくとも１つは、全帯域幅で動作するように構成される、請求項１から７のいずれか一項に記載のエンコーダ装置。
前記エンコーダ帯域幅検出器およびコントローラ（３９）は、前記サブグループにない前記周波数領域エンコーダツールの前記少なくとも１つが動作するように構成されている前記全帯域幅内にある少なくとも１つの帯域幅を選択するように構成される、請求項８に記載のエンコーダ装置。
前記複数の周波数領域エンコーダツールの前記残りの周波数領域エンコーダツールの前記少なくとも１つは、前記エンコーダ帯域幅検出器およびコントローラ（３９）によって選択された前記帯域幅に関してオープンチェーンで動作するように構成される、請求項１から９のいずれか一項に記載のエンコーダ装置。
前記エンコーダ帯域幅検出器およびコントローラ（３９）は、有限数の帯域幅の中から、および／または事前定義された帯域幅のセットの中から、帯域幅を選択するように構成される、
請求項１から１０のいずれか一項に記載のエンコーダ装置。
前記エンコーダ帯域幅検出器およびコントローラは（３９）、以下の帯域幅４ＫＨｚ、８ＫＨｚ、１２ＫＨｚ、１６ＫＨｚ、および２４ＫＨｚ、および／またはＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢの少なくとも１つまたは組み合わせから選択を実行するように構成される、
請求項１から１１のいずれか一項に記載のエンコーダ装置。
前記エンコーダ帯域幅検出器およびコントローラ（３９）は、デコーダへの前記帯域幅のシグナリングを制御するように構成される、
請求項１から１２のいずれか一項に記載のエンコーダ装置。
前記選択された帯域幅に関する情報を含む制御データフィールドを符号化するようにさらに構成される、
請求項１から１３のいずれか一項に記載のエンコーダ装置。
ＮＢ帯域幅に対応する０データビット、
ＮＢ、ＷＢ帯域幅に対応する１データビット、
ＮＢ、ＷＢ、ＳＳＷＢ帯域幅に対応する２データビット、
ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ帯域幅に対応する２データビット、
ＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢ帯域幅に対応する３データビット、
を含む制御データフィールドを符号化するようにさらに構成される、
請求項１から１４のいずれか一項に記載のエンコーダ装置。
前記少なくとも１つのエネルギー推定は、

のように実行され、
ここで、

はＭＤＣＴまたはＭＤＳＴまたは周波数領域係数であり、

は帯域の数、

は前記帯域に関連付けられたインデックスである、請求項１から１５のいずれか一項の可能な組み合わせにおける請求項５または６に記載のエンコーダ装置。
フィルタリング動作を実行するように構成されたＴＮＳツール（３３）をさらに含み、
各

について

であり、ここで

および

であり、ここで

は前記ＭＤＣＴまたはＭＤＳＴまたは周波数領域係数であり、

および

は、前記エンコーダ帯域幅検出器およびコントローラ（３９）によって検出された前記帯域幅に関連付けられている、請求項１から１６のいずれか一項に記載のエンコーダ装置。
を使用してノイズレベルを推定するように構成されたノイズ推定器（３６）をさらに含み、
ここで、ｇｇはグローバル利得、

は前記ノイズレベルが推定されるスペクトルラインの識別を指し、

は信号を示す、請求項１から１７のいずれか一項に記載のエンコーダ装置。
ビットストリームに符号化された情報信号を復号するための複数の周波数領域デコーダツール（４３～４８ａ）を含むデコーダ装置（４０、４０ａ）であって、
前記周波数領域デコーダツールは
少なくとも１つの周波数領域デコーダツール（４３、４５）を含むサブグループ、
少なくとも１つの周波数領域デコーダツール（４４、４６、４８ａ）を含む残りの周波数領域デコーダツール、に分割されており、
ここで、前記デコーダ装置（４０、４０ａ）は、前記サブグループ（４３、４５）の前記複数のデコーダツールの少なくとも１つが、前記複数のデコーダツール（４４、４６、４８ａ）の前記残りの周波数領域デコーダツールの少なくとも１つとは異なる帯域幅で信号処理するように構成される、デコーダ装置（４０、４０ａ）。
帯域幅情報に基づいて前記帯域幅を選択するように構成された帯域幅コントローラ（４９）をさらに含む、
請求項１９に記載のデコーダ装置。
前記サブグループは、デコーダノイズフィリングツール（４３）および／または一時的ノイズシェーピング、ＴＮＳ、デコーダ（４５）の少なくとも１つを含む、
請求項１９または２０に記載のデコーダ装置。
前記残りの周波数領域デコーダツールの前記少なくとも１つは、デコーダ線形予測コーディング、ＬＰＣ、ツール、スペクトルノイズシェーピング、ＳＮＳ、ツール、デコーダグローバル利得ツール、ＭＤＣＴまたはＭＤＳＴシェーピングツール、または別の変換に基づく別のシェーピングツールの少なくとも１つである、
請求項１９から２１のいずれか一項に記載のデコーダ装置。
前記サブグループ内の前記複数のデコーダツールの前記少なくとも１つの前記帯域幅を、
前記残りの周波数領域デコーダツールの少なくとも１つに共通の少なくとも第１の帯域幅、および
前記第１の帯域幅とは異なる少なくとも第２の帯域幅の間で制御するように構成される、
請求項１９から２２のいずれか一項に記載のデコーダ装置。
前記残りの周波数領域デコーダツールの前記少なくとも１つは、全帯域幅で動作するように構成される、請求項１９から２３のいずれか一項に記載のデコーダ装置。
前記残りの周波数領域デコーダツールの前記少なくとも１つは、前記選択された帯域幅に関してオープンチェーンで動作するように構成される、請求項２０に記載のデコーダ装置。
有限数の帯域幅の中から、および／または事前定義された帯域幅のセットの中から、帯域幅を選択するようにさらに構成される、
請求項１９から２５のいずれか一項に記載のデコーダ。
８ＫＨｚ、１６ＫＨｚ、２４ＫＨｚ、３２ＫＨｚ、および４８ＫＨｚ、および／またはＮＢ、ＷＢ、ＳＳＷＢ、ＳＷＢ、ＦＢの少なくとも１つまたは組み合わせから選択を実行するようにさらに構成される、
請求項１９から２６のいずれか一項に記載のデコーダ。
によって与えられるインデックスを使用してノイズレベルを適用するように構成されたノイズフィリングツール（４３）をさらに含み、ここで

は、前記ビットストリーム内の帯域幅情報に基づいて得られる、請求項１９から２７のいずれか一項に記載のデコーダ。
を実行するように構成されたＴＮＳデコーダ（４５）をさらに含み、
ここで、

は前記ＴＮＳデコーダの出力であり、

は前記ＴＮＳデコーダの入力であり、

、

、

は前記ビットストリームの帯域幅情報（３９ａ）に基づいて得られる、請求項１９から２８のいずれか一項に記載のデコーダ。
エンコーダ装置およびデコーダ装置を含むシステムであって、前記エンコーダ装置は請求項１から１８のいずれかによる、および／または前記デコーダ装置は請求項１９から２９のいずれかによる、システム。
少なくとも複数の周波数領域動作に従って情報信号を符号化するための方法であってもよく、
周波数領域動作のサブグループのための帯域幅を選択するステップ、
周波数領域動作の前記サブグループのための前記帯域幅で第１の信号処理動作を実行するステップ、
前記サブグループにない周波数領域動作のための異なる帯域幅で第２の信号処理動作を実行するステップを含む、方法。
情報信号および制御データ（３９ａ）を用いてビットストリームを復号するための方法であって、前記方法は、前記周波数領域における複数の信号処理動作を含み、
前記制御データ（３９ａ）に基づいて周波数領域動作のサブグループのための帯域幅を選択するステップ、
周波数領域動作の前記サブグループのための前記帯域幅で第１の信号処理動作を実行するステップ、
前記サブグループにない周波数領域動作のための異なる帯域幅で第２の信号処理動作を実行するステップを含む、方法。