JP6093801B2

JP6093801B2 - 適応型低周波数補償によってオーディオ・データを符号化するための方法及びシステム

Info

Publication number: JP6093801B2
Application number: JP2015106044A
Authority: JP
Inventors: ビスワス，アリジット; メルコーテ，ヴィナイ; シュフーグ，ミヒャエル; エイデイヴィッドソン，グラント; エスヴィントン，マーク
Original assignee: ドルビーラボラトリーズライセンシングコーポレイション; ドルビー・インターナショナル・アーベー
Priority date: 2012-01-09
Filing date: 2015-05-26
Publication date: 2017-03-08
Anticipated expiration: 2032-09-25
Also published as: US20140324441A1; KR20140104470A; JP2015187743A; MX2014007400A; CL2014001805A1; AU2012364749B2; HK1201976A1; JP2015504179A; IL233029A0; BR112014016847A8; MY187728A; SG11201402983UA; US8527264B2; JP5755379B2; US9275649B2; BR112014016847B1; TW201329961A; TWI470621B; AR088007A1; US20130179175A1

Description

関連出願の相互参照
本出願は、「ＭｅｔｈｏｄａｎｄＳｙｓｔｅｍｆｏｒＥｎｃｏｄｉｎｇＡｕｄｉｏＤａｔａｗｉｔｈＡｄａｐｔｉｖｅＬｏｗＦｒｅｑｕｅｎｃｙＣｏｍｐｅｎｓａｔｉｏｎ」という名称の２０１２年１月９日に出願した米国仮出願第６１／５８４，４７８号、及び、「ＭｅｔｈｏｄａｎｄＳｙｓｔｅｍｆｏｒＥｎｃｏｄｉｎｇＡｕｄｉｏＤａｔａｗｉｔｈＡｄａｐｔｉｖｅＬｏｗＦｒｅｑｕｅｎｃｙＣｏｍｐｅｎｓａｔｉｏｎ」という名称の２０１２年８月１７日に出願した米国出願第１３／５８８，８９０号の利益を主張するものであり、上記の出願の各々は、その全体が参照により本明細書により組み込まれている。

本発明は、オーディオ信号処理に関するものであり、より詳細には、適応型低周波数補償によるオーディオ・データの符号化に関する。本発明の一部の実施例は、ＤｏｌｂｙＤｉｇｉｔａｌ（商標）（ＡＣ−３）及びＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ（Ｅ−ＡＣ−３）として知られているフォーマットの１つによって、又は、別の符号化フォーマットによって、オーディオ・データを符号化するために有用である。Ｄｏｌｂｙ（商標）、ＤｏｌｂｙＤｉｇｉｔａｌ、及びＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ（商標）は、ＤｏｌｂｙＬａｂｏｒａｔｏｒｉｅｓＬｉｃｅｎｓｉｎｇＣｏｒｐｏｒａｔｉｏｎの商標である。

本発明は、ＡＣ−３（ＤｏｌｂｙＤｉｇｉｔａｌ）フォーマット（又はＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓフォーマット）によってオーディオ・データを符号化する際の使用に限定されないが、便宜上本発明は、本発明がＡＣ−３フォーマットよってオーディオ・ビットストリームを符号化する実施例において説明される。ＡＣ−３で符号化されたビットストリームは、１から６個のチャネルのオーディオコンテンツ、及びオーディオコンテンツの少なくとも１つの特性を指示しているメタデータを含む。オーディオコンテンツは、知覚オーディオ・コーディングを使用して圧縮されているオーディオ・データである。

ＡＣ−３（ＤｏｌｂｙＤｉｇｉｔａｌとしても知られている）コーディングの詳細はよく知られており、以下のものを含む多くの公表されている参考文献に記載されている：
ＡＴＳＣＳｔａｎｄａｒｄＡ５２／Ａ：ＤｉｇｉｔａｌＡｕｄｉｏＣｏｍｐｒｅｓｓｉｏｎＳｔａｎｄａｒｄ（ＡＣ−３）、ＲｅｖｉｓｉｏｎＡ、ＡｄｖａｎｃｅｄＴｅｌｅｖｉｓｉｏｎＳｙｓｔｅｍｓＣｏｍｍｉｔｔｅｅ、２００１年８月２０日、
ＦｌｅｘｉｂｌｅＰｅｒｃｅｐｔｕａｌＣｏｄｉｎｇｆｏｒＡｕｄｉｏＴｒａｎｓｍｉｓｓｉｏｎａｎｄＳｔｏｒａｇｅ」、ＣｒａｉｇＣ．Ｔｏｄｄら、９６ｔｈＣｏｎｖｅｎｔｉｏｎｏｆｔｈｅＡｕｄｉｏＥｎｇｉｎｅｅｒｉｎｇＳｏｃｉｅｔｙ、１９９４年２月２６日、Ｐｒｅｐｒｉｎｔ３７９６、
「ＤｅｓｉｇｎａｎｄＩｍｐｌｅｍｅｎｔａｔｉｏｎｏｆＡＣ−３Ｃｏｄｅｒｓ」、ＳｔｅｖｅＶｅｒｎｏｎ、ＩＥＥＥＴｒａｎｓ．ＣｏｎｓｕｍｅｒＥｌｅｃｔｒｏｎｉｃｓ、第４１巻、第３号、１９９５年８月、
「ＤｏｌｂｙＤｉｇｉｔａｌＡｕｄｉｏＣｏｄｉｎｇＳｔａｎｄａｒｄｓ」、ＲｏｂｅｒｔＬ．Ａｎｄｅｒｓｅｎ及びＧｒａｎｔＡ．Ｄａｖｉｄｓｏｎによる本の章、ＴｈｅＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＨａｎｄｂｏｏｋ、第２版、ＶｉｊａｙＫ．Ｍａｄｉｓｅｔｔｉ編集主任、ＣＲＣＰｒｅｓｓ、２００９年
「ＨｉｇｈＱｕａｌｉｔｙ，Ｌｏｗ−ＲａｔｅＡｕｄｉｏＴｒａｎｓｆｏｒｍＣｏｄｉｎｇｆｏｒＴｒａｎｓｍｉｓｓｉｏｎａｎｄＭｕｌｔｉｍｅｄｉａＡｐｐｌｉｃａｔｉｏｎｓ」、Ｂｏｓｉら、ＡｕｄｉｏＥｎｇｉｎｅｅｒｉｎｇＳｏｃｉｅｔｙＰｒｅｐｒｉｎｔ３３６５、９３ｒｄＡＥＳＣｏｎｖｅｎｔｉｏｎ、１９９２年１０月、並びに、
米国特許第５，５８３，９６２号、第５，６３２，００５号、第５，６３３，９８１号、第５，７２７，１１９号、及び第６，０２１，３８６号。

ＤｏｌｂｙＤｉｇｉｔａｌ（ＡＣ−３）及びＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ（拡張（Ｅｎｈａｎｃｅｄ）ＡＣ−３又は「Ｅ−ＡＣ−３」と呼ばれる場合がある）コーディングの詳細は、「ＩｎｔｒｏｄｕｃｔｉｏｎｔｏＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ，ａｎＥｎｈａｎｃｅｍｅｎｔｔｏｔｈｅＤｏｌｂｙＤｉｇｉｔａｌＣｏｄｉｎｇＳｙｓｔｅｍ」、ＡＥＳＣｏｎｖｅｎｔｉｏｎＰａｐｅｒ６１９６、１１７ｔｈＡＥＳＣｏｎｖｅｎｔｉｏｎ、２００４年１０月２８日に、及び、
ｈｔｔｐ：／／ｗｗｗ．ａｔｓｃ．ｏｒｇ／ｃｍｓ／ｉｎｄｅｘ．ｐｈｐ／ｓｔａｎｄａｒｄｓ／ｐｕｂｌｉｓｈｅｄ−ｓｔａｎｄａｒｄｓ
で入手可能であるＤｏｌｂｙＤｉｇｉｔａｌ／ＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ仕様書（ＡＴＳＣＡ／５２：２０１０）に記載されている。

オーディオ・ビットストリームのＡＣ−３符号化において、符号化されることになる入力オーディオ・サンプルのブロックは、時間−周波数領域変換を受け、その結果、普通は変換係数、周波数係数、又は周波数成分と呼ばれる、均一に隔置される周波数ビン内に位置する、周波数領域データのブロックとなる。次いで各々のビン内の周波数係数が、指数部及び仮数部を含む浮動小数点フォーマットに（例えば、図１のシステムのＢＦＰＥ段７において）転換される。

ＡＣ−３（及びＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ）符号化器（及び他のオーディオ・データ符号化器）の典型的な実施例は、帯域設定された基準（すなわち、バーク尺度（Ｂａｒｋｓｃａｌｅ）として知られている、よく知られた心理音響尺度の周波数帯域に近い、典型的には５０個の不均一の帯域）を基に周波数領域データを分析して、各々の仮数へのビットの最適な割り当てを決定するための心理音響モデルを履行する。次いで仮数データは、決定されたビット割り当てに対応するいくつかのビットに（例えば、図１のシステムの量子化器６において）量子化される。次いで量子化された仮数データは、符号化された出力ビットストリームに（例えば、図１のシステムのフォーマッタ８において）フォーマット設定される。

典型的には仮数ビット割り振りは、（各々の周波数ビンに対するパワー・スペクトル密度（ＰＳＤ）値により表される）細粒度の信号スペクトルと（各々の周波数帯域に対するマスク値により表される）粗粒度のマスキング曲線との間の差に基づく。さらに典型的には心理音響モデルは、低周波数補償（「ローコンプ（ｌｏｗｃｏｍｐ）」補償、又は「ローコンプ」と呼ばれる場合がある）を履行して、低周波数帯域に対するマスキング曲線値を補正するための補正値（本明細書では「ローコンプ」パラメータ値と呼ばれる場合がある）を決定する。各々のローコンプ・パラメータ値が、帯域に対する最終的なマスキング曲線値を生成するために、低周波数帯域の異なるものに対する予備的なマスキング曲線値から減算され得る（又は他の方法でその予備的なマスキング曲線値に適用され得る）。

記したようにオーディオ符号化においての仮数ビット割り振りは、信号スペクトルとマスキング曲線との間の差に基づくものであり得る。そのようなビット割り振りを履行するための単純なアルゴリズムでは、１つの特定の周波数帯域内の量子化雑音が、近隣の帯域でのビット割り振りと無関係であるということを想定する場合がある。しかしながらこのことは典型的には、特により低い周波数では合理的な想定ではなく、その理由は、復号化器のフィルタ・バンクにおいて周波数の選択性が有限であり、帯域間のオーバーラップの程度が高いため、及び、マスキング曲線の傾斜がフィルタ・バンク遷移の裾部の傾斜と等しい、又はそれを上回る場合がある低周波数では、１つの帯域から近隣の帯域への漏出があるためというものである。

したがってオーディオ符号化においての仮数ビット割り振り処理は、補正されたマスキング曲線を決定する低周波数補償処理を含むことが多い。次いで補正されたマスキング曲線が、オーディオ・データの各々の周波数成分に対する信号−マスク比値を決定するために使用される。低周波数補償は、顕著な低周波数トーン性成分を伴う信号に対する低周波数でのコーディング性能の改善のための復号化器選択性補償処理である。典型的には低周波数補償は、利便性のために、信号−マスク値を決定するために使用される励起関数の計算に組み込まれ得る、フィルタ・バンク応答補正である。下記でより詳細に解説するように、低周波数補償の典型的な履行では、次の（より高い周波数）帯域に対するＰＳＤ値より１２ｄＢ小さいＰＳＤ値を伴う周波数帯域を探索することにより、顕著な低周波数信号成分を検索する。そのようなＰＳＤ値が見出されるとき、その帯域に対する励起関数値が直ちに、１８ｄＢ（又は最高で１８ｄＢの量）だけ低減される。その後この低減は、後続の帯域ごとに３ｄＢだけ徐々に程度が弱められる。

図１は、時間領域入力オーディオ・データ１に関してＡＣ−３（又は拡張ＡＣ−３）符号化を遂行するように構成される符号化器である。分析フィルタ・バンク２は、時間領域入力オーディオ・データ１を周波数領域オーディオ・データ３に転換し、ブロック浮動小数点符号化（ＢＦＰＥ）段７は、各々の周波数ビンに対する指数部及び仮数部を含む、データ３の各々の周波数成分の浮動小数点表現を生成する。段７から出力される周波数領域データを、本明細書では周波数領域オーディオ・データ３と呼ぶ場合もある。次いで段７から出力される周波数領域オーディオ・データは、量子化器６においてのその周波数領域オーディオ・データの仮数の量子化、及び、（テンティング（ｔｅｎｔｉｎｇ）段１０においての）その周波数領域オーディオ・データの指数のテンティング、及び、段１０において生成されたテンティングされた指数の（指数コーディング段１１においての）符号化によることを含めて符号化される。フォーマッタ８は、量子化器６から出力される量子化されたデータ、及び、段１１から出力されるコーディングされた差分指数データに応答して、ＡＣ−３（又は拡張ＡＣ−３）で符号化されたビットストリーム９を生成する。

量子化器６は、コントローラ４により生成される（マスキング・データを含む）制御データに基づいてビット割り当て及び量子化を遂行する。（マスキング曲線を決定する）マスキング・データは、人間の聴力及び聴覚の（コントローラ４により履行される）心理音響モデルの基準を基に、周波数領域データ３から生成される。心理音響モデリングは、人間の聴力の周波数依存のしきい値、及び、マスキングと呼ばれる心理音響現象を考慮するものであり、マスキングとは、１つ又は複数のより弱い周波数成分の近くの強い周波数成分が、それらのより弱い成分をマスクする傾向にあり、それらのより弱い成分を人間の聴取者が聞き取れないようにするというものである。このことによって、オーディオ・データを符号化するときに、より弱い周波数成分を除外することが可能になり、そのことにより、符号化されたオーディオ・データ（ビットストリーム９）の知覚される品質に悪影響を及ぼすことなく、より高い程度の圧縮が実現する。マスキング・データは、周波数領域オーディオ・データ３の各々の周波数帯域に対するマスキング曲線値を含む。これらのマスキング曲線値は、各々の周波数帯域での人間の耳によりマスクされる信号のレベルを表す。量子化器６は、この情報を使用して、利用可能な数のデータ・ビットをどのように最良に使用して、入力オーディオ信号の各々の周波数帯域の周波数領域データを表すかを確定する。

コントローラ４は、従来の低周波数補償処理（本明細書では「ローコンプ」補償と呼ばれる場合がある）を履行して、低周波数帯域に対するマスキング曲線値を補正するためのローコンプ・パラメータ値）を生成することが可能である。補正されたマスキング曲線値は、周波数領域オーディオ・データ３の各々の周波数成分に対する信号−マスク比値を生成するために使用される。低周波数補償は、典型的にはオーディオ・データのＡＣ−３（及びＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ）符号化の間に履行される心理音響モデルの特徴である。ローコンプ補償は、（符号化されることになる入力オーディオ・データの）高度にトーン性の低周波数成分の符号化を、関連性のある周波数区域でのマスクを優先的に低減し、その結果、そのような成分を符号化するために用いられるコード・ワードに、より多くのビットを割り当てることにより改善する。

ローコンプ補償は、各々の低周波数帯域に対するローコンプ・パラメータを決定する。各々の帯域に対するローコンプ・パラメータは、帯域に対する（よく知られている様式で決定される）「励起」値から効果的に減算され、結果として得られる差の値が、補正されたマスキング曲線値を決定するために使用される。帯域に対する励起値を（例えば、その励起値からローコンプ・パラメータを減算すること、又は、その励起値から減算されるローコンプ・パラメータの値を増大することにより）低減すると、その結果、帯域内のオーディオの符号化されたバージョンに割り当てられるビットの数が、以下の理由で増大する。帯域に対する励起値が、（帯域に対するオーディオ・データ値から効果的に減算される）最終的な（補正された）マスク値と必ずしも等しくない間、その励起値は、最終的なマスク値の算出の際に使用される（最終的なマスク値は、絶対的な聴力しきい値、並びに場合によっては他の広帯域の、及び／又は帯域設定された調整を考慮する）。帯域内のオーディオに割り当てられるコーディング・ビットの数は、帯域に対する「信号−マスク」比がより大きければより大きいので、帯域に対するマスク値を低減することによって、その帯域内のオーディオの符号化されたバージョンに割り当てられるビットの数は増大することになる。したがって一般的には、帯域に対する励起値を低減することが、帯域に対するマスク値の低減に、及びその結果として、その帯域に対する割り当てられるビットの数の増大につながる。

本願では次に、従来のローコンプ補償が心理音響モデル（例えば、図１のコントローラ４により履行されるモデル）により典型的に遂行されることになる様式をより詳細に説明する。コントローラ４は、強いトーン性成分の１つの特性である、現在の周波数帯域と後に続く（より高い周波数）帯域との間のパワー・スペクトル密度（ＰＳＤ）の急峻な（１２ｄＢ）増大を探索するために、（４８ｋＨｚのサンプリング周波数で、０Ｈｚから２．０５ｋＨｚまでの範囲において）低周波数帯域を通して探査することになる。強いトーン性成分を指示しているような低周波数帯域内のＰＳＤを識別することに応答して、ローコンプ補償は、より多くのビットが、識別された強い低周波数トーン性成分を符号化するために用いられるデータに割り当てられるようにするように適用される。

ＡＣ−３及びＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ符号化において、周波数領域オーディオ・データ３の各々の成分（すなわち、各々の変換ビンのコンテンツ）は、仮数及び指数を含む浮動小数点表現を有することが理解されよう。マスキング曲線の算出を単純化するために、ＤｏｌｂｙＤｉｇｉｔａｌの一群のコーダは、指数のみを使用してマスキング曲線を導出する。又は言い換えれば、マスキング曲線は変換係数指数値に依存するが、変換係数仮数値には無関係である。指数の範囲はある程度制限されているので（一般的には０〜２４の整数値）、指数値は、マスキング曲線を計算する目的で、より大きな範囲（一般的には０〜３０７２の整数値）を伴うＰＳＤ尺度上にマッピングされる。したがって最も音の大きな周波数成分（すなわち、０の指数を伴うもの）は３０７２のＰＳＤ値にマッピングされ、一方で最も静かな周波数領域データ成分（すなわち、２４の指数を伴うもの）は０のＰＳＤ値にマッピングされる。

従来のＤｏｌｂｙＤｉｇｉｔａｌ（又はＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ）符号化において、差分指数（すなわち、連続的な指数間の差）が絶対値の指数の代わりにコーディングされることが知られている。差分指数は５つの値、すなわち２、１、０、−１、及び−２のうちの１つを用いることのみが可能である。この範囲の外側の差分指数が見出される場合には、（修正後に）差分指数が、記した範囲内にあるように、減算される指数の１つが修正される（この従来の方法は、「指数テンティング」又は「テンティング」として知られている）。図１の符号化器のテンティング段１０は、そのようなテンティング動作を遂行することにより、テンティング段１０に対してアサートされる未加工の指数に応答してテンティングされた指数を生成する。

心理音響モデル（例えば、図１のコントローラ４により履行されるモデル）が低周波数帯域を通して探査し、帯域「Ｎ＋１」が次の帯域であり、現在の帯域「Ｎ」が次の帯域より低い周波数を有する、ローコンプ補償の典型的な履行の例を考えてみる。探査は、最も低い周波数帯域から帯域番号２２まで、であってよく、典型的にはＬＦＥ（低周波数効果）チャネルの最後の帯域を含まない。帯域Ｎ＋１に対するＰＳＤ値から帯域Ｎに対するＰＳＤ値を引いたものが２５６に等しいということが決定されるならば（このことは、現在の帯域Ｎから、次の（より高い周波数）帯域Ｎ＋１までのＰＳＤの急峻な増大（１２ｄＢ）を指示している、ローコンプ補償が、１８ｄＢだけ直ちに、現在の帯域に対する励起関数算出結果を低減する（すなわち、帯域に対する励起値を低減する）ことにより遂行される。帯域に対する励起値は、３８４に等しいローコンプ・パラメータを、帯域に対して他の方法で決定されることになる励起値から減算することにより低減される。この励起値の低減は、（例えば、後続の帯域ごとに最高で３ｄＢだけ）徐々に程度が弱められる。

後続の帯域、すなわち、ローコンプが最初に動作可能にされる対象の帯域より周波数が高い帯域に対して、１つの帯域と次の帯域との間のＰＳＤの差が２５６より小さいということが決定されるならば、（帯域に対する励起値から減算される）ローコンプ・パラメータは、前の帯域に対するものと同じ値に維持されるか、より低い値に低減されるかのいずれかである。（すべての低周波数帯域を通しての探査の間に）２つの近接する帯域間のＰＳＤの差が２５６に等しいということが最初に決定されるまで、ローコンプ補償は遂行されない（すなわち、値０を有するローコンプ・パラメータが帯域に対する励起値から「減算される」）。

従来のローコンプ処理が、顕著な低周波数成分を伴うトーン性信号に対して有益である一方で、不利な事柄は、マスク低減をトリガ（ｔｒｉｇｇｅｒ）する１２ｄＢのＰＳＤ差の判定基準が、低周波数コンテンツを有する多数の非トーン性信号により頻繁に満たされるということである。群衆による拍手を指示しているオーディオ・データは、そのような非トーン性信号のよく知られている例であり、本明細書では（本発明の典型的な実施例においてトーン性信号と区別される）そのタイプの非トーン性信号の代表物として言及されることになる。本発明者らが認識しているのは、（従来のローコンプ補償による従来のＡＣ−３又はＥ−ＡＣ−３符号化において用いられることになるコーディング・ビット配分に対して）低周波数から中／高周波数までコーディング・ビットを再配分することによって、信号のＡＣ−３（又はＥ−ＡＣ−３）で符号化されたバージョンの復号の後に再現される拍手及び他の非トーン性信号の知覚される品質が向上するということ、したがって、そのような非トーン性信号のローコンプ補償を、それらの非トーン性信号のＡＣ−３又はＥ−ＡＣ−３符号化の間は動作不能にすることが望ましいことになる（すなわち、そのような信号の符号化の間はローコンプをオフに切り替えることが望ましいことになる）ということである。本発明者らは、低周波数コンテンツを有するトーン性信号（例えば、ピッチ・パイプにより生み出される信号）のＡＣ−３（又はＥ−ＡＣ−３）符号化の間のローコンプ補償を、そのような符号化の間に動作不能にすることによって、トーン性信号の知覚される品質が、それらのトーン性信号のＡＣ−３（又はＥ−ＡＣ−３）で符号化されたバージョンの復号の後にそれらのトーン性信号が再現されるときに悪化するということもまた認識している。

したがって本発明者らは、顕著な低周波数トーン性成分を有するオーディオ信号の符号化の間にではあるが、顕著な低周波数トーン性成分を有さないオーディオ信号（例えば、低周波数非トーン性コンテンツを有するが、顕著なトーン性低周波数コンテンツを有さない、拍手信号又は他のオーディオ信号）の符号化の間にではなく、低周波数補償を適応的に適用することが可能である符号化器を実装すること、及び、そのように、復号化器の変更を必要としない様式で（すなわち、従来の復号化器が、本発明の符号化器により生成されている符号化されたオーディオを復号することを可能にする様式で）行うことが望ましいことになるということを認識している。

仮数ビット割り振りが信号スペクトルとマスキング曲線との間の差に基づく、一部の従来のオーディオ符号化方法は、帯域設定された、符号化されることになる周波数領域オーディオ・データに対するマスキング値の生成の間に、低周波数補償に加えて、少なくとも１つのマスキング値補正処理を遂行する。

例えば一部の従来のオーディオ符号化器（例えば、ＡＣ−３及びＥ−ＡＣ−３符号化器）は、追加的な改善された心理音響分析によって、符号化されることになる各々のオーディオ・チャネルに対するマスキング曲線をパラメータ的に調整することを可能にするものである、デルタ・ビット割り当てを履行する。符号化器は、用いられるマスキング曲線とデフォルトのマスキング曲線との間の差（すなわち、各々の周波数でのデフォルトのマスキング・モデルにより決定されるマスキング値と、同じ周波数での実際に用いられる改善されたマスキング・モデルにより決定されるマスキング値との間の差）を運搬する、デルタ（ｄｅｌｔａ）として示される追加的なビット・ストリーム・コードを送信する。

デルタ・ビット割り当て関数は、典型的には階段ステップ関数（例えば、最高で±１８ｄＢの±６ｄＢステップ）であるように制約される。階段ステップの各々のステップ幅は、整数個の隣接する２分の１のバーク帯域に対するマスキング・レベル調整に対応する。階段ステップは、いくつかの非オーバーラップの可変長セグメントを含む。セグメントは、送信効率のためにランレングスでコーディングされる。

デルタ・ビット割り当ての従来の用途は、マスキング・レベル補正のための従来のＢＡＢＮＤＮＯＲＭ処理である。ＢＡＢＮＤＮＯＲＭ処理（マスキング値補正処理の例）では、（ＡＣ−３及び拡張ＡＣ−３符号化において用いられるバーク周波数（Ｂａｒｋｆｒｅｑｕｅｎｃｙ）帯域の）知覚帯域番号２９及びそれより上に対して、励起関数を導出するために使用される各々の知覚帯域内の信号エネルギーが、知覚帯域幅の逆数に比例する値によりスケーリングされる。帯域２９より下のすべての知覚帯域は単位帯域幅を有する（すなわち、単一の周波数ビンのみを含む）ので、２９より下の帯域に対しては信号エネルギーをスケーリングする必要性はない。次第に、より高くなる周波数では、励起関数、したがってマスキングしきい値の推定値はより低くされる。このことによって、より高い周波数で、特に結合チャネルにおいて、ビット割り当てが増大する。ＡＣ−３（又はＥ−ＡＣ−３）符号化を履行する一部のオーディオ符号化器は、符号化のステップとしてＢＡＢＮＤＮＯＲＭ処理を履行するように構成される。

図５は、帯域設定された周波数領域オーディオ・データの、帯域設定されたＰＳＤ（知覚エネルギー）値のグラフ（最上部の曲線）、オーディオ・データに従来のＢＡＢＮＤＮＯＲＭ処理を適用することにより生成される、スケーリングされた帯域設定されたＰＳＤ値のグラフ（最上部から２番目の曲線）、オーディオ・データをマスクする際の使用のために（例えば、従来のＡＣ−３又はＥ−ＡＣ−３符号化器により）生成される励起関数のグラフ（最上部から３番目の曲線）、及び、励起関数に従来のＢＡＢＮＤＮＯＲＭ処理を適用することにより（例えば、従来のＡＣ−３又はＥ−ＡＣ−３符号化器により）生成される、励起関数のスケーリングされたバージョンのグラフ（最下部の曲線）である。４つの曲線の各々は、知覚帯域（バーク周波数）尺度上で表されている。上部の２つの曲線が帯域２９で相互に分岐し始めていること、及び、下部の２つの曲線もまた帯域２９で相互に分岐し始めていることが明白である。

図６は、オーディオ信号の周波数スペクトルのグラフ（最も広いダイナミック・レンジを有する図６の曲線）、オーディオ信号をマスクするためのデフォルトのマスキング曲線のグラフ（最下部から２番目の曲線）、及び、マスキング曲線に従来のＢＡＢＮＤＮＯＲＭ処理を適用することにより（例えば、従来のＡＣ−３又はＥ−ＡＣ−３符号化器により）生成される、マスキング曲線のスケーリングされたバージョンのグラフ（最下部の曲線）である。図６からは、次第に、より高くなる周波数では、ＢＡＢＮＤＮＯＲＭ処理によって、より大きな量だけマスキング曲線がより低くなることが明白である。

本発明は、オーディオ信号処理に関するものであり、より詳細には、適応型低周波数補償によるオーディオ・データの符号化に関する。本発明の一部の実施例は、ＤｏｌｂｙＤｉｇｉｔａｌ（ＡＣ−３）及びＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ（Ｅ−ＡＣ−３）として知られているフォーマットの１つによって、又は別の符号化フォーマットによって、オーディオ・データを符号化するために有用である。

実施例の第１のクラスでは本発明は、（量子化を受けることによることを含めて）符号化されることになる周波数領域オーディオ・データのオーディオ・データ値の仮数ビット割り当てを決定するための仮数ビット割り当て方法である。割り当て方法は、オーディオ・データの低周波数帯域の集合の各々の周波数帯域のオーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、オーディオ・データ値に対するマスキング値を、マスキング値が、前記オーディオ・データに対する仮数ビット割り当てを決定する信号−マスク値を決定するために有用であるように決定するステップを含む。適応型低周波数補償は、
（ａ）オーディオ・データに関してトーナリティ検出を遂行して、低周波数帯域の集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
（ｂ）補償制御データにより指示されるような顕著なトーン性コンテンツを有する低周波数帯域の集合内の各々の周波数帯域内のオーディオ・データに関して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対する予備的なマスキング値を補正することによることを含めて、低周波数補償を遂行し、ただし、低周波数帯域の集合内のいずれの他の周波数帯域内のオーディオ・データに関しても、各々の前記他の周波数帯域に対するマスキング値が、補正されない予備的なマスキング値であるように、低周波数補償を遂行しないステップと
を含む。

第１のクラスでの一部の実施例ではステップ（ａ）は、オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの周波数帯域（必ずしも低周波数帯域でない）の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、オーディオ・データ値に対するマスキング値を決定するステップは、
（ｃ）補償制御データにより指示されるような顕著なトーン性コンテンツを有するオーディオ・データの前記各々の周波数帯域に対して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して予備的なマスキング値を補正することによることを含めて、第１の様式でマスキング値補正処理を遂行し、補償制御データにより指示されるような顕著なトーン性コンテンツを欠くオーディオ・データの前記各々の周波数帯域に対して第２の様式でマスキング値補正処理を遂行するステップ
をさらに含む。

例えば、マスキング値補正処理はＢＡＢＮＤＮＯＲＭ処理であってよく、前記各々の周波数帯域は知覚帯域であってよく、ステップ（ｃ）は、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第１のスケーリング定数によってＢＡＢＮＤＮＯＲＭ処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第２のスケーリング定数によってＢＡＢＮＤＮＯＲＭ処理を遂行するステップを含み得る。

本発明の別の実施例は、そのような仮数割り当て方法の任意の実施例を含む符号化方法である。

実施例の第２のクラスでは本発明は、（トーン性低周波数コンテンツを伴う信号、及び非トーン性低周波数コンテンツを伴う信号の両方を含む）すべての入力オーディオ信号に低周波数補償を適用する、又は、いずれの入力オーディオ信号にも低周波数補償を適用しない、従来の符号化方法の限界を克服するオーディオ符号化方法である。これらの実施例は、顕著な低周波数トーン性成分を有するオーディオ信号の符号化の間にではあるが、顕著な低周波数トーン性成分を有さないオーディオ信号（例えば、低周波数非トーン性コンテンツを有するが、顕著なトーン性低周波数コンテンツを有さない、拍手又は他のオーディオ信号）の符号化の間にではなく、低周波数補償を選択的に（適応的に）適用する。適応型低周波数補償は、復号化器が、低周波数補償が符号化の間に適用されたか否かを決定することなく（又はその適用されたか否かに関して通知されることなく）、符号化されたオーディオの復号を遂行することを可能にする様式で遂行される。

第２のクラスでの典型的な実施例は、
（ａ）周波数領域オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
（ｂ）低周波数補償を遂行して、補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内のオーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、集合内の各々の他の低周波数帯域内のオーディオ・データに対するマスキング値を生成するステップと
を含むオーディオ符号化方法である。

一部の実施例では、オーディオ符号化方法はＡＣ−３又は拡張ＡＣ−３符号化方法である。これらの実施例では、低周波数補償は好ましくは、ローコンプが当初設計された対象の入力オーディオ・データの周波数帯域（すなわち、顕著な、長期間定常の（「トーン性」）、低周波数コンテンツを指示している周波数帯域）に対して遂行され（すなわち、オンであり、又は動作可能にされ）、そうでない場合は遂行されない（すなわち、オフである、又は効果的に動作不能にされる）。これらの実施例では、低周波数補償はオーディオ・データの周波数帯域に関して遂行されるべきではないということを指示する補償制御データ（例えば、帯域は非トーン性オーディオコンテンツを含むが、顕著なトーン性コンテンツを含まないということを指示する補償制御データ）に応答して、ステップ（ｂ）は好ましくは、前記帯域内のオーディオ・データを、帯域に対する修正されたオーディオ・データを生成するように「再テンティング（”ｒｅ−ｔｅｎｔｉｎｇ”）」するステップであって、帯域に対する前記修正されたオーディオ・データが、修正された指数を含む、「再テンティング」するステップを含む。再テンティングするステップは、（例えば、次のより高い周波数帯域内のオーディオ・データの指数から、帯域に対する修正されたオーディオ・データの修正された指数を引いたものが、２、１、０、又は−１に等しくなければならないように）帯域に対する差分指数が−２に等しくなることが防止されるように、帯域に対する修正されたオーディオ・データを生成する。したがって、ローコンプ補償は帯域には適用されないことになるが、その理由は、帯域にローコンプ補償を適用するための判定基準（次のより低い周波数帯域に対するＰＳＤに対しての、帯域に対する１２ｄＢのＰＳＤの増大）が満たされないことになる（この判定基準は、帯域に対する修正された（「再テンティング」された）オーディオ・データの指数から、次のより低い周波数帯域に対する指数を引いたものが、−２に等しくなることが防止されるならば満たされ得ない）からというものである。

より具体的には、一部のそのような実施例では、差分指数が−２に等しくなることを再テンティングが防止する対象の各々の帯域（「第Ｎの」帯域）に対して、ローコンプ補償は、以下の意味で「適用されない」（又はオフに切り替えられる、又は効果的に動作不能にされる）。（再テンティングの結果として生じる）帯域に対する修正された差分指数は、−１、０、１、又は２である。したがって、前の（より低い周波数）帯域（「第（Ｎ−１）の」帯域）に対する差分指数が−２であるならば（このことは、トーナリティ検出ステップが、第「（Ｎ−１）」の帯域に対する再テンティングを防止すべき、第「（Ｎ−１）」の帯域に対する強いトーン性コンテンツを、及び、第「Ｎ」の帯域に対する再テンティングをトリガすべき、第「Ｎ」の帯域に対するトーン性コンテンツの欠乏を指示する場合に起こり得る）、及び、ローコンプが第「（Ｎ−１）」の帯域に完全なマスク調整を（従来の様式で）適用している（すなわち、本発明のトーン性検出が、ローコンプがそのように行うことを防止していない）ならば、（再テンティングなしの）従来のローコンプは、（第Ｎの帯域を含む、「第（Ｎ−１）の」帯域の後に続く小さな数の帯域に対して）一連の、次第に、より小さくなるマスク調整を、（これらの帯域に対する差分指数がどれも−２に等しくないということを想定すれば）その一連の調整がゼロ調整を行う対象の帯域にその一連の調整が達するまで適用することになる。本段落で説明する実施例において、（本発明による）再テンティングが、帯域（「第Ｎの」帯域）に対する差分指数が−２に等しくなることを防止するとき（すなわち、本発明のトーン性検出ステップが、帯域に対する非トーン性コンテンツを指示するため）、ローコンプが前の帯域（「第（Ｎ−１）の」帯域）にマスク調整を適用しているならば、ローコンプは、第Ｎの帯域に対して（及び場合によってはさらに、小さな数の後続の帯域に対して）そのローコンプの一連の、次第に、より小さくなるマスク調整を、その一連の調整がゼロ調整を行う対象の最初の帯域にその一連の調整が達するまで継続することが可能にされる。この点でローコンプは、本発明のトーン性検出がトーン性信号を指示するまで、何らかのさらなるマスク調整を行うことが防止される。

他の実施例では、本発明のトーナリティ検出ステップが、ローコンプが従来と同様に適用されることになる集合内のいずれかの低周波数帯域に対する（又は、一体で考慮されるすべての低周波数帯域に対する）非トーン性コンテンツを指示するとき、ローコンプ補償は、以下の意味で「適用されない」（又はオフに切り替えられる、又は効果的に動作不能にされる）。集合内の少なくとも１つの低周波数帯域に対する非トーン性コンテンツを指示する本発明のトーナリティ検出ステップに応答して、集合内のすべての帯域に対する励起関数からの非ゼロのローコンプ・パラメータの減算が、（例えば直ちに）終結する。この点でローコンプは、（周波数領域オーディオ・データの次の集合の帯域を通しての新しい走査の開始まで）何らかのマスク調整を行うことが防止される。

一部の実施例では補償制御データは、集合内の各々の個々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償は、集合内の各々の個々の低周波数帯域に選択的に適用される（又は適用されない）。他の実施例では補償制御データは、（一体で考慮される）集合内の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償は、（補償制御データの内容に応じて）集合内のすべての低周波数帯域に適用されるか、集合内の低周波数帯域のいずれにも適用されないかのいずれかである。

第２のクラスでの一部の実施例ではステップ（ａ）は、オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの周波数帯域（必ずしも低周波数帯域でない）の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、オーディオ・データ値に対するマスキング値を決定するステップは、
（ｃ）補償制御データにより指示されるような顕著なトーン性コンテンツを有するオーディオ・データの前記各々の周波数帯域に対して第１の様式でマスキング値補正処理を遂行し、補償制御データにより指示されるような顕著なトーン性コンテンツを欠くオーディオ・データの前記各々の周波数帯域に対して第２の様式でマスキング値補正処理を遂行するステップ、をさらに含む。

別のクラスの実施例では本発明は、周波数領域オーディオ・データに応答して、オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、符号化されたオーディオ・データを生成するように構成されるオーディオ符号化器であって、
オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するように構成されるトーナリティ検出器（例えば、図２の要素１５）と、
補償制御データに応答して、オーディオ・データの低周波数帯域の集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にする（選択的に動作可能にする、又は効果的に動作不能にする）ように結合及び構成される（例えば、図２の要素４により実装される）低周波数補償制御段と、を含むオーディオ符号化器である。

トーナリティ検出器は、低周波数補償が、低周波数帯域の集合の各々の周波数帯域のオーディオ・データに適用されるべきであるかどうかを、（すなわち、低周波数帯域の集合の各々の周波数帯域の低周波数補償は、低周波数帯域の集合のオーディオ・データの符号化の間は、帯域は顕著なトーン性コンテンツを有するのでオンに切り替えられるべきであるか、それとも、帯域は顕著なトーン性コンテンツを欠くのでオフに切り替えられるべきであるかを指示する補償制御データを生成することにより）決定するように構成される。低周波数補償制御段は、補償制御データに応答して、低周波数帯域の集合の各々の帯域のオーディオ・データへの低周波数補償の適用を、適応的に動作可能にするように構成される。復号化器の変更を必要としない様式（すなわち、復号化器が、低周波数補償が符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく（又はその適用されたか否かに関して通知されることなく）、符号化されたオーディオ・データの復号を遂行することを可能にする様式）においてである。

符号化されることになるオーディオ・データの周波数帯域が（低周波数補償が動作不能にされるべきである対象の）非トーン性信号を指示しているということを指示する補償制御データに応答して、低周波数補償制御段の好ましい実施例は、帯域のオーディオ・データを、その帯域のオーディオ・データの指数を人工的に修正することにより「再テンティング」する。再テンティングは、（例えば、帯域に対する修正されたオーディオ・データの修正された指数から、次のより低い周波数帯域内のオーディオ・データの指数を引いたものが、２、１、０、又は−１に等しくなければならないように）帯域に対する差分指数が−２に等しくなることが防止されるように、帯域に対する修正されたオーディオ・データを生成する。符号化器の典型的な実施例では、ローコンプ補償は帯域には適用されないことになるが、その理由は、帯域にローコンプ補償を適用するための判定基準（次のより低い周波数帯域に対するＰＳＤに対しての、帯域に対する１２ｄＢのＰＳＤの増大）が満たされないことになる（この判定基準は、帯域に対する修正されたオーディオ・データの指数から、次のより低い周波数帯域に対する指数を引いたものが、−２に等しくなることが防止されるならば満たされ得ない）からというものである。

本発明の別の態様は、符号化されたオーディオ・データを復号するための方法であって、符号化されたオーディオ・データを指示している信号を受信するステップであり、符号化されたオーディオ・データが、本発明の符号化方法の任意の実施例によってオーディオ・データを符号化することにより生成されている、受信するステップと、符号化されたオーディオ・データを復号して、オーディオ・データを指示している信号を生成するステップとを含む方法である。本発明の別の態様は、本発明の符号化方法の任意の実施例を遂行して、オーディオ・データに応答して、符号化されたオーディオ・データを生成するように構成される（例えば、プログラムされる）符号化器と、符号化されたオーディオ・データを復号して、オーディオ・データを復元するように構成される復号化器とを含むシステムである。

本発明の他の態様は、本発明の方法の任意の実施例を遂行するように構成される（例えば、プログラムされる）システム又はデバイス（例えば、符号化器又はプロセッサ）、及び、本発明の方法又は本発明の方法のステップの任意の実施例を実装するためのコードを記憶するコンピュータ可読媒体（例えばディスク）を含む。例えば本発明のシステムは、本発明の方法又は本発明の方法のステップの実施例を含む、データに関する種々の動作の任意のものを遂行するように、ソフトウェア若しくはファームウェアによってプログラムされ、及び／又は、他の方法で構成される、プログラマブル汎用プロセッサ、デジタル信号プロセッサ、又はマイクロプロセッサであり得る、又はそれらを含み得る。そのような汎用プロセッサは、入力デバイス、メモリ、及び、処理回路であり、アサートされるデータに応答して本発明の方法（又は本発明の方法のステップ）の実施例を実行するようにプログラム（及び／又は、他の方法で構成）された処理回路、を含むコンピュータ・システムであってよく、又は、そのコンピュータ・システムを含み得る。

従来の符号化システムのブロック図である。本発明の方法の実施例を遂行するように構成される符号化システムのブロック図である。周波数ビンの関数としての、ピッチ・パイプ（トーン性）信号を指示している周波数領域オーディオ・データの指数及びテンティングされた指数のグラフである。周波数ビンの関数としての、拍手（非トーン性）信号を指示している周波数領域オーディオ・データの指数及びテンティングされた指数のグラフである。帯域設定された周波数領域オーディオ・データの、帯域設定されたＰＳＤ（知覚エネルギー）値のグラフ（最上部の曲線）、オーディオ・データに従来のＢＡＢＮＤＮＯＲＭ処理を適用することにより生成される、スケーリングされた帯域設定されたＰＳＤ値のグラフ（最上部から２番目の曲線）、オーディオ・データをマスクする際の使用のために生成される励起関数のグラフ（最上部から３番目の曲線）、及び、励起関数に従来のＢＡＢＮＤＮＯＲＭ処理を適用することにより生成される、励起関数のスケーリングされたバージョンのグラフ（最下部の曲線）である。４つの曲線の各々は、知覚帯域（バーク周波数）尺度上において表されている。オーディオ信号の周波数スペクトルのグラフ、オーディオ信号をマスクするためのデフォルトのマスキング曲線のグラフ（最下部から２番目の曲線）、及び、マスキング曲線に従来のＢＡＢＮＤＮＯＲＭ処理を適用することにより生成されるマスキング曲線のスケーリングされたバージョンのグラフ（最下部の曲線）である。本発明の符号化方法の任意の実施例を実行して、オーディオ・データに応答して、符号化されたオーディオ・データを生成するように構成される符号化器と、符号化されたオーディオ・データを復号して、オーディオ・データを復元するように構成される復号化器とを含むシステムのブロック図である。

本発明の方法を実装するように構成されるシステムの実施例を、図２を参照して説明する。図２のシステムは、時間領域入力オーディオ・データ１に応答してＡＣ−３（又は拡張ＡＣ−３）で符号化されたオーディオ・ビットストリーム９を生成するように構成される、ＡＣ−３（又は拡張ＡＣ−３）符号化器である。図２のシステムの要素２、４、６、７、８、１０、及び１１は、上記で説明した図１のシステムの同じように番号が付けられた要素と同一である。

分析フィルタ・バンク２は、時間領域入力オーディオ・データ１を周波数領域オーディオ・データ３に転換し、ＢＦＰＥ段７は、各々の周波数ビンに対する指数部及び仮数部を含む、データ３の各々の周波数成分の浮動小数点表現を生成する。次いで段７から出力される周波数領域オーディオ・データ（本明細書では周波数領域オーディオ・データ３と呼ばれる場合もある）は、量子化器６においてのその周波数領域オーディオ・データの仮数の量子化によることを含めて符号化される。フォーマッタ８は、量子化器６から出力される量子化された仮数データ、及び、段１１から出力されるコーディングされた差分指数データに応答して、ＡＣ−３（又は拡張ＡＣ−３）で符号化されたビットストリーム９を生成するように構成される。量子化器６は、コントローラ４により生成される（マスキング・データを含む）制御データに基づいてビット割り当て及び量子化を遂行する。

コントローラ４は、オーディオ・データ３の低周波数帯域の集合の各々の低周波数帯域に関して、前記帯域に対する予備的なマスキング値（励起値）を補正することにより、低周波数補償を遂行するように構成される。帯域に対する、量子化器６に対してコントローラ４によりアサートされる補正されたマスキング・データは、前記帯域に対する補正されたマスキング値により決定される。

図２のシステムはＡＣ−３（又は拡張ＡＣ−３）符号化器であるので、コントローラ４は、よく知られているバーク尺度の周波数帯域に近い、５０個の不均一の知覚帯域の基準を基に周波数領域データを分析するための心理音響モデルを履行する。本発明の他の実施例は、別の帯域設定された基準を基に（すなわち、均一又は不均一の周波数帯域の任意の集合の基準を基に）周波数領域データを分析する（並びに／又は、低周波数補償を、及び随意には別のマスキング値補正処理もまた履行する）ための心理音響モデルを用いる。

図２の符号化器は、本発明の再テンティング段１８及びトーナリティ検出器１５を含む。図２のテンティング段１０は、トーナリティ検出器１５に対して、及び再テンティング段１８に対して、テンティング段１０が生成するテンティングされた指数をアサートするように結合及び構成される。再テンティング段１８は、再テンティングされた指数を生成するように構成され、その再テンティングされた指数によって、（再テンティングされた指数に応答して動作する）コントローラ４は、低周波数補償が帯域に関して遂行されるべきであるということを指示する（検出器１５により生成され、段１８に対してアサートされる）補償制御データに応答してのみ、周波数帯域に関して低周波数補償を遂行する。低周波数補償がオーディオ・データ３の周波数帯域に関して遂行されるべきでないということを指示する（検出器１５により生成され、段１８に対してアサートされる）補償制御データに応答して、コントローラ４は帯域に関して低周波数補償を遂行せず、代わりに、帯域に対する、コントローラ４により量子化器６に対してアサートされるマスキング・データは、前記帯域に対する補正されない予備的なマスキング値（励起値）により決定される。

周波数領域データ３の各々の周波数帯域に対する、量子化器６に対してコントローラ４によりアサートされるマスキング・データは、帯域に対するマスキング曲線値を含む。これらのマスキング曲線値は、各々の周波数帯域での人間の耳によりマスクされる信号の量を表す。図１のシステムにおけるように、図２の量子化器６は、この情報を使用して、利用可能な数のデータ・ビットをどのように最良に使用して、入力オーディオ信号の各々の周波数帯域の成分を表すかを確定する。

より具体的にはコントローラ４は、段１８からそのコントローラに対してアサートされる再テンティングされた指数に応答してＰＳＤ値を計算するように、ＰＳＤ値に応答して、帯域設定されたＰＳＤ値を計算するように、帯域設定されたＰＳＤ値に応答してマスキング曲線を計算するように、及び、マスキング曲線に応答して仮数ビット割り当てデータ（図２で指示する「マスキング・データ」）を決定するように構成される。

図２のオーディオ符号化器は、オーディオ・データ３に関して適応型低周波数補償を遂行することによることを含めて、符号化されたオーディオ・データ９を生成するように構成される。そのような適応型低周波数補償を履行するために、図２のシステムは、示すように結合されるトーナリティ検出段（トーナリティ検出器）１５及び適応型再テンティング段１８を含み、コントローラ４は、段１８により生成される再テンティングされた指数に応答して低周波数補償を遂行する。テンティング段１０は、周波数領域オーディオ・データ３の未加工の指数を受信するように結合され、下記でより詳細に説明する様式で、オーディオ・データ３の低周波数帯域の上記で述べた集合の各々の低周波数帯域に対するテンティングされた指数を決定するように構成される。

トーナリティ検出器１５は、オーディオ・データ３の低周波数帯域の集合を通しての（低周波数から高周波数までの）走査の間に、オーディオ・データ３の元の（未加工の）指数、及び、これらの元の指数に応答して段１０により生成されるテンティングされた指数を受信するように結合される。

段１０は、データ３の連続的な周波数帯域に対する周波数領域オーディオ・データ３の指数間の差を決定するように、及び、各々のそのような指数のテンティングされたバージョン（テンティングされた指数）を生成するように構成される。テンティングは、テンティングされた指数が走査の間に各々の周波数ビンに対して生成されるように、（適応型低周波数補償が遂行されることになる低周波数帯域の集合の周波数帯域を含む）周波数領域データ３を通しての（低周波数から高周波数までの）走査の間に、上記で述べた従来の様式で遂行される。段１０は、各々の帯域に対する差分指数（各々の「次の」ビン「Ｎ＋１」の指数から、現在の（より低い周波数）ビン「Ｎ」の指数を引いたもの）を決定する。ビン「Ｎ」に対する差分指数が２より大きい（すなわち、ｅｘｐ（Ｎ＋１）−ｅｘｐ（Ｎ）＞２）ならば、段１０は、ｔｅｎｔｅｘｐ（Ｎ＋１）−ｅｘｐ（Ｎ）＝２を充足させる最小の指数（ｔｅｎｔｅｘｐ（Ｎ＋１））であるようにビン「Ｎ＋１」に対するテンティングされた指数を決定する。この場合、ビンＮに対するテンティングされた指数（ｔｅｎｔｅｘｐ（Ｎ））は、ビンＮに対する元の指数に等しく（ｔｅｎｔｅｘｐ（Ｎ）＝ｅｘｐ（Ｎ））、段１０は、ビンＮに対する差分のテンティングされた指数値２を段１８に対してアサートする。ビン「Ｎ」に対する差分指数が−２より小さい（すなわち、ｅｘｐ（Ｎ＋１）−ｅｘｐ（Ｎ）＜−２）ならば、段１０は、ｅｘｐ（Ｎ＋１）−ｔｅｎｔｅｘｐ（Ｎ）＝−２を充足させる最大の指数（ｔｅｎｔｅｘｐ（Ｎ））であるようにビン「Ｎ」に対するテンティングされた指数を決定する。この場合、ビンＮ＋１に対するテンティングされた指数（ｔｅｎｔｅｘｐ（Ｎ＋１））は、ビンＮ＋１に対する元の指数に等しく（ｔｅｎｔｅｘｐ（Ｎ＋１）＝ｅｘｐ（Ｎ＋１））、段１０は、ビンＮに対する差分のテンティングされた指数値−２を段１８に対してアサートする。

トーナリティ検出器１５は、オーディオ・データ３の低周波数帯域の集合を通しての（低周波数から高周波数までの）走査の間に、オーディオ・データ３を構成する元の指数、及び、これらの元の指数に応答して段１０により生成されるテンティングされた指数に関してトーナリティ検出を遂行するように構成される。トーン性信号の（周波数の関数としての）ＰＳＤ値の急峻な上昇及び下降の特性は、そのような信号は、非トーン性信号（例えば、拍手を指示している非トーン性信号）であるよりテンティングされることが多いということを示唆する。

例えば図３は、周波数ビンの関数としての、トーン性信号（ピッチ・パイプ信号）を指示している周波数領域オーディオ・データの指数及びテンティングされた指数のグラフである。図４は、やはり周波数ビンの関数としてプロットされている、非トーン性（拍手）信号を指示している周波数領域オーディオ・データの指数及びテンティングされた指数のグラフである。低周波数補償が典型的には遂行される、より低い周波数では、（図３及び図４の）各々のビンは単一の周波数帯域に対応する。図３の精査から明白であるように、トーン性信号の指数と（例えば、段１０により指数から生成される）対応するテンティングされた指数との間に非ゼロの差が存在する、低周波数範囲内の多くの周波数帯域（例えばビン７、１１、１４、１５、２０、及び２３）が存在する。図４の精査から明白であるように、非トーン性信号の指数と、対応するテンティングされた指数との間に非ゼロの差が存在する、低周波数範囲内の周波数帯域はより少ない（ビン３４のみ）。

したがってトーナリティ検出器１５の典型的な実施例は、周波数領域オーディオ・データの集合の指数と、対応するテンティングされた指数との間の平均二乗差分量（又は、そのようなデータの指数と、対応するテンティングされた指数との間の差を指示している別の分量）を決定する。例えば、第１の（最も低い）周波数帯域から帯域Ｎ＋１まで通しての（データ３の低周波数帯域の記した集合の）低周波数帯域を通しての（低周波数から高周波数までの）走査の間に、検出器１５の実装形態は、第１の帯域から帯域Ｎ＋１までの範囲内の各々の帯域に対する元の指数とテンティングされた指数との間の二乗差の平均となるように、帯域Ｎ＋１に対するトーナリティ分量を生成する。

そのような平均二乗差分量は、最も低い周波数帯域から現在の周波数帯域（帯域Ｎ＋１）まで通しての周波数範囲内のオーディオ信号のトーナリティ（顕著なトーン性コンテンツの存在又は欠乏）を指示している補償制御データを決定するために用いられる。（最も低い周波数帯域から現在の周波数帯域まで通しての）各々の周波数範囲に対して、（周波数範囲に対する）平均二乗差分量が、具体的なあらかじめ決定されたしきい値（例えば、実験的に決定されたしきい値）より小さな値を有するならば、検出器１５は、非トーン性オーディオ信号を指示するために、第１の値を伴う補償制御データ（例えば、０に等しいバイナリ・ビット）を（段１８に対して）アサートする。このことが、現在の帯域に対する段１０によりアサートされた差分指数値の段１８による再テンティングをトリガし、そのことにより、コントローラ４による、復号化器と共用可能なローコンプの切り替えオフをトリガする（すなわちコントローラ４が、現在の帯域に関して従来の低周波数補償を適用することを防止する）。下記で説明する例では、しきい値は０．０５であるように採用される。

（最も低い周波数帯域から現在の周波数帯域まで通しての）各々の周波数範囲に対して、（周波数範囲に対する）平均二乗差分量がしきい値以上の値を有するならば、検出器１５は、トーン性オーディオ信号を指示するために、第２の値を伴う補償制御データ（例えば、１に等しいバイナリ・ビット）を（段１８に対して）アサートする。このことによって、現在の帯域に対する段１０によりアサートされた差分指数値の段１８による再テンティングが動作不能になり、そのことにより、（段１０の出力でアサートされる）この値が、変更されずに段１８を通ってコントローラ４に渡ることが可能になり、したがってこのことが、コントローラ４による、復号化器と共用可能なローコンプの切り替えオンをトリガする（すなわちコントローラ４が、現在の帯域に関して従来の低周波数補償を適用することを可能にする）。

代替的な実施例では検出器１５は、補償制御データを別の様式で、ただし補償制御データが、適応型低周波数補償が遂行されることになる、データ３の各々の周波数帯域内の、又はデータ３の各々の低周波数帯域内の、又はデータ３の低周波数帯域の集合（又は部分集合）を含む周波数範囲内の、データ３により決定されるオーディオ信号のトーナリティ（又は非トーナリティ）を指示しているように生成する。例えば一部の実施例では検出器１５は、（具体的に、ＢＦＰＥ段７の出力の指数、及び段１０から出力されるテンティングされた指数に関してではなく）ＢＦＰＥ段７の出力に関して動作する専用のトーナリティ検出器として実装される。

別の例に関して、一部の実施例では検出器１５（又は、実施例の任意のものにおいて用いられる別のトーナリティ検出器）は、オーディオ・データの低周波数帯域の集合が拍手を表すかどうか（例えば、集合の各々の低周波数帯域が拍手を表すかどうか）を指示している補償制御データを生成するように構成される拍手検出器である。本明細書のコンテクスト（ｃｏｎｔｅｘｔ）において「拍手」は、拍手のみ、又は、拍手及び／若しくは群衆歓呼のいずれかを意味する場合がある、広範な意味で使用される。低周波数補償は、補償制御データにより指示されるような、拍手を指示している集合内の各々の周波数帯域に対して、又は、集合内の帯域の少なくとも１つが拍手を指示している場合に集合内のすべての帯域に関して、動作不能にされる（オフに切り替えられる）ことになる。低周波数補償は、補償制御データにより指示されるような拍手を指示していない集合内の各々の周波数帯域内のオーディオ・データに関して遂行されることになる。

非トーン性オーディオ信号を指示する検出器１５からの補償制御データに応答して（例えば、データ３により決定されるオーディオ信号が、データ３の最も低い周波数帯域から現在の帯域（帯域Ｎ）まで通しての低周波数範囲内で非トーン性信号であることを指示するもの）、段１８は、現在の帯域のテンティングされた指数に関して再テンティングを遂行する。具体的には、現在の帯域に対する差分のテンティングされた指数（帯域Ｎ＋１のテンティングされた指数から、帯域Ｎのテンティングされた指数を引いたものが−２に等しいならば（このことは、前の帯域Ｎから現在の（より高い周波数）帯域Ｎ＋１までのＰＳＤの急峻な増大（１２ｄＢ）を指示している、段１８は、帯域「Ｎ＋１」に対する差分の再テンティングされた指数を−１に等しくなるように決定する。したがって、非トーン性オーディオ信号を指示する（例えば、データ３により決定されるオーディオ信号が、データ３の最も低い周波数帯域からデータ３の現在の帯域（帯域Ｎ）まで通しての低周波数範囲内で非トーン性信号であるということを指示する）、検出器１５からの補償制御データに応答して、コントローラ４は、オーディオ・データ３の現在の周波数帯域（Ｎ）に関して低周波数補償を遂行しない。

トーン性オーディオ信号を指示する検出器１５からの補償制御データに応答して（例えば、データ３により決定されるオーディオ信号が、データ３の最も低い周波数帯域からデータ３の現在の帯域（帯域Ｎ）まで通しての低周波数範囲内におけるトーン性信号であるということを指示するもの）、段１８は、現在の帯域に対するテンティングされた指数差を（テンティングされた指数差を変更することなく）コントローラ４に通しで渡し、コントローラ４は、オーディオ・データ３の現在の周波数帯域（Ｎ）について低周波数補償を遂行することが可能となる。具体的には、コントローラ４は、帯域に対する、段１０から出力され（及び、段１８を介してコントローラ４に通しで渡される）テンティングされた指数差値が−２に等しいならば、オーディオ・データ３の現在の周波数帯域（Ｎ）について低周波数補償を遂行する。

より一般的には、本発明の典型的な実施例のトーナリティ検出器は、低周波数補償が、低周波数帯域の集合の各々の周波数帯域のオーディオ・データに適用されるべきであるかどうかを、（すなわち、低周波数帯域の集合の各々の周波数帯域の低周波数補償は、低周波数帯域の集合のオーディオ・データの符号化の間は、帯域は顕著なトーン性コンテンツを有するのでオンに切り替えられるべきであるか、それとも、帯域は顕著なトーン性コンテンツを欠くのでオフに切り替えられるべきであるかを指示する補償制御データを生成することにより）決定するように構成される。本発明の典型的な実施例の低周波数補償制御段は、補償制御データに応答して、復号化器の変更を必要としない様式で、低周波数帯域の集合の各々の帯域のオーディオ・データへの低周波数補償の適用を、適応的に動作可能にするように構成される（すなわち、復号化器が、低周波数補償が符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく（又はその適用されたか否かに関して通知されることなく）、符号化されたオーディオ・データの復号を遂行することを可能にする様式においてである）。

典型的な実施例では、符号化されることになるオーディオ・データの周波数帯域が（低周波数補償が動作不能にされるべきである対象の）非トーン性信号を指示しているということを指示する補償制御データに応答して、低周波数補償制御段の好ましい実施例は、帯域のテンティングされたオーディオ・データ（例えば、差分のテンティングされた指数）を、テンティングされたデータにより決定される関連性のある差分指数を人工的に修正することにより「再テンティング」する。再テンティングは、（例えば、帯域に対する修正されたオーディオ・データの修正された指数から、次のより低い周波数帯域内のオーディオ・データの指数を引いたものが、２、１、０、又は−１に等しくなければならないように）帯域に対する修正された（再テンティングされた）差分指数が−２に等しくなることが防止されるように、帯域に対する修正されたオーディオ・データを生成する。本発明の符号化器の典型的な実施例では、ローコンプ補償は帯域には適用されないことになるが、その理由は、帯域にローコンプ補償を適用するための判定基準（次のより低い周波数帯域に対するＰＳＤに対しての、帯域に対する１２ｄＢのＰＳＤの増大）が満たされないことになる（この判定基準は、帯域に対する修正されたオーディオ・データの指数から、次のより低い周波数帯域に対する指数を引いたものが、−２に等しくなることが防止されるので満たされ得ない）からというものである。

低周波数補償は、（近接する低周波数帯域に対する）差分指数が決して−２に等しくならないように、（すなわち、より低い周波数帯域から、より高い周波数帯域までの探査の間の、１２ｄＢのＰＳＤの増大を回避するように、）したがってローコンプ補償の適用を回避するように、低周波数帯域に対する指数を人工的に修正する（「再テンティング」する）ことにより、復号化器の変更なしに（本発明の典型的な実施例によって）オフに切り替えられ得る。本発明のトーナリティ検出器が非トーン性信号を指示するとき、低周波数帯域に対するテンティングされた指数は、そのような効果のために再テンティングされる。このことは、仮数値を量子化するためのマスキング・データ（信号−マスク比）を生成するために用いられる心理音響モデルに対する変更を必要とせず、したがって、従来の復号化器により復号され得る符号化されたデータを生成する。より具体的には、帯域「Ｎ＋１」が次の帯域であり、現在の帯域（「Ｎ」）が次の帯域より低い周波数を有する、低周波数帯域を通しての探査の間に、差分指数（帯域Ｎ＋１に対する指数から、帯域Ｎに対する指数を引いたもの）が−２に等しいと予備的に決定されるならば、修正された指数値の差分指数が−１に等しくなる（すなわち、帯域Ｎ＋１に対する修正された指数から、帯域Ｎに対する指数を引いたものが−１に等しくなる、又は、帯域Ｎ＋１に対する指数から、帯域Ｎに対する修正された指数を引いたものが−１に等しくなる）ように、帯域の１つの指数が変更される（「再テンティング」される）。好ましくは、帯域Ｎ＋１に対する指数から、帯域Ｎに対する指数を引いたものが−２に等しいならば、この差は、帯域Ｎ＋１に対する指数から、帯域Ｎに対する修正された指数を引いたものが−１に等しくなるように、帯域Ｎ（現在の帯域）に対する指数を減少する（「再テンティング」する）ことにより−１に増大される。再テンティングの後者の履行が典型的には好ましく、その理由は一般的には、指数値を増大することは、対応する仮数が最大限度で正規化される可能性があるという想定が存在するので望ましくないからというものである。最大限度で正規化された仮数に対応する指数値を増大することは、結果として、仮数の限度を超えた正規化又は切り落としをもたらすことになり、このことは望ましくない。したがって、帯域Ｎ＋１に対する指数から、帯域Ｎに対する指数を引いたものが−２に等しいならば、この差を−１に増大するためには、（帯域Ｎ＋１に対する指数を１だけ増大することではなく）帯域Ｎに対する指数を１だけ減少することが典型的には好ましい。

本発明のトーナリティ検出器がトーン性信号を指示するとき、入力オーディオ周波数成分の指数は再テンティングされず、低周波数補償は、トーン性信号に従来の様式で（すなわち、トーン性信号を指示している従来と同様にテンティングされた値に）適用される。

本発明者らは、従来のＥ−ＡＣ−３符号化器の性能を、（図２を参照して説明したタイプの適応型ローコンプ補償を履行する）Ｅ−ＡＣ−３符号化器の修正されたバージョンの性能と比較した試聴テストを遂行した。テストは、テストされた拍手信号に対してだけでなく、一部の非拍手信号に対しても、後者の（修正された）符号化器の有益性を示した。より具体的には、１９２ｋｂ／ｓで、トーナリティ検出器しきい値が０．０５に等しい（すなわちトーナリティ検出器が、周波数領域オーディオの指数とテンティングされた指数との間の平均二乗差分量が０．０５のしきい値より小さな値を有するとき、（符号化されることになる周波数領域オーディオ・データの指数の再テンティングにより）ローコンプ補償がオフに切り替えられるべきである対象の非トーン性信号を指示する制御データを生成するように構成される）状態で、ローコンプ補償がオフに切り替えられた対象のブロックの平均パーセンテージは、ピッチ・パイプ（長期間の、高度にトーン性の、低周波数）入力オーディオ、及び拍手（高度に非トーン性の、低周波数）入力オーディオに対してそれぞれ、０．５％及び８０％であった。

記したように、トーン性信号のＰＳＤの急峻な上昇及び下降の特性は、そのような信号は、非トーン性信号よりテンティングされることが多いということを示唆し、したがって指数とテンティングされた指数との間の平均二乗差は、トーナリティの指標として役立ち得る。（実験的に決定された）具体的なしきい値より小さなトーナリティ指標値は、ローコンプがオフに切り替えられるべきである対象の非トーン性信号を示唆し、その逆も同様である。典型的な実装形態ではトーナリティ指標値は、（結合が使用されているときに）現在の周波数帯域の周波数が結合開始周波数に達するまで、符号化されることになるオーディオ・データ（例えば、図２のデータ３）の周波数帯域を通しての走査の間に（例えば、図２の検出器１５により）計算される。適応型ハイブリッド変換（ＡＨＴ）が使用されているならば、本発明の適応型ローコンプ処理の動作は動作不能にされ得るものであり、従来の（非適応型）ローコンプ処理が代わりに遂行され得る。ＡＨＴは、上記で言及したＤｏｌｂｙＤｉｇｉｔａｌ／ＤｏｌｂｙＤｉｇｉｔａｌＰｌｕｓ仕様書において、並びに、上記で言及した「ＤｏｌｂｙＤｉｇｉｔａｌＡｕｄｉｏＣｏｄｉｎｇＳｔａｎｄａｒｄｓ」、ＲｏｂｅｒｔＬ．Ａｎｄｅｒｓｅｎ及びＧｒａｎｔＡ．Ｄａｖｉｄｓｏｎによる本の章、ＴｈｅＤｉｇｉｔａｌＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＨａｎｄｂｏｏｋ、第２版、ＶｉｊａｙＫ．Ｍａｄｉｓｅｔｔｉ編集主任、ＣＲＣＰｒｅｓｓ、２００９年において説明されている。

実施例の第１のクラスでは本発明は、（量子化を受けることによることを含めて）符号化されることになる周波数領域オーディオ・データのオーディオ・データ値の仮数ビット割り当てを決定するための仮数ビット割り当て方法である。割り当て方法は、オーディオ・データの低周波数帯域の集合の各々の周波数帯域のオーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、（例えば、図２のコントローラ４において）オーディオ・データ値に対するマスキング値を、マスキング値が、前記オーディオ・データに対する仮数ビット割り当てを決定する信号−マスク値を決定するために有用であるように決定するステップを含む。適応型低周波数補償は、
（ａ）（例えば、図２のトーナリティ検出器１５において）オーディオ・データに関してトーナリティ検出を遂行して、低周波数帯域の集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
（ｂ）補償制御データにより指示されるような顕著なトーン性コンテンツを有する低周波数帯域の集合内の各々の周波数帯域内のオーディオ・データに関して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対する予備的なマスキング値を補正することによることを含めて、低周波数補償を遂行し、ただし、低周波数帯域の集合内のいずれの他の周波数帯域内のオーディオ・データに関しても、各々の前記他の周波数帯域に対するマスキング値が、補正されない予備的なマスキング値であるように、低周波数補償を遂行しないステップと、を含む。

第１のクラスでの一部の実施例ではステップ（ａ）は、オーディオ・データに関して（例えば、図２のトーナリティ検出器１５において）トーナリティ検出を遂行して、オーディオ・データの周波数帯域の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、オーディオ・データ値に対するマスキング値を決定するステップは、
（ｃ）補償制御データにより指示されるような顕著なトーン性コンテンツを有するオーディオ・データの前記各々の周波数帯域に対して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して予備的なマスキング値を補正することによることを含めて、第１の様式でマスキング値補正処理を遂行し、補償制御データにより指示されるような顕著なトーン性コンテンツを欠くオーディオ・データの前記各々の周波数帯域に対して第２の様式でマスキング値補正処理を遂行するステップと、をさらに含む。

第２のクラスでの典型的な実施例は、
（ａ）（例えば、図２のトーナリティ検出器１５において）周波数領域オーディオ・データに関してトーナリティ検出を遂行して、オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
（ｂ）（例えば、図２のコントローラ４において）低周波数補償を遂行して、補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内のオーディオ・データに対する補正されたマスキング値を生成し、（例えば、図２のコントローラ４において）低周波数補償を遂行することなく、集合内の各々の他の低周波数帯域内のオーディオ・データに対するマスキング値を生成するステップと
を含むオーディオ符号化方法である。

第２のクラスでの一部の実施例では、オーディオ符号化方法はＡＣ−３又は拡張ＡＣ−３符号化方法である。これらの実施例では、低周波数補償は好ましくは、ローコンプが当初設計された対象の入力オーディオ・データの周波数帯域（すなわち、顕著な、長期間定常の（「トーン性」）、低周波数コンテンツを指示している周波数帯域）に対して遂行され（すなわち、オンであり、又は動作可能にされ）、そうでない場合は遂行されない（すなわち、オフである、又は効果的に動作不能にされる）。これらの実施例では、低周波数補償はオーディオ・データの周波数帯域に関して遂行されるべきではないということを指示する補償制御データ（例えば、帯域は非トーン性オーディオコンテンツを含むが、顕著なトーン性コンテンツを含まないということを指示する補償制御データ）に応答して、ステップ（ｂ）は好ましくは、前記帯域内のオーディオ・データを、帯域に対する修正されたオーディオ・データを生成するように「再テンティング」するステップであって、帯域に対する前記修正されたオーディオ・データが、修正された指数を含む、「再テンティング」するステップを含む。再テンティングするステップは、（例えば、帯域に対する修正されたオーディオ・データの修正された指数から、次のより低い周波数帯域内のオーディオ・データの指数を引いたものが、２、１、０、又は−１に等しくなければならないように）帯域に対する差分指数が−２に等しくなることが防止されるように、帯域に対する修正されたオーディオ・データを生成する。したがって、ローコンプ補償は帯域には適用されないことになるが、その理由は、帯域にローコンプ補償を適用するための判定基準（次のより低い周波数帯域に対するＰＳＤに対しての、帯域に対する１２ｄＢのＰＳＤの増大）が満たされないことになる（この判定基準は、帯域に対する修正された（「再テンティング」された）オーディオ・データの指数から、次のより低い周波数帯域に対する指数を引いたものが、−２に等しくなることが防止されるならば満たされ得ない）からというものである。

第２のクラスでの一部の実施例ではステップ（ａ）は、オーディオ・データに関して（例えば、図２のトーナリティ検出器１５において）トーナリティ検出を遂行して、オーディオ・データの周波数帯域の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、オーディオ・データ値に対するマスキング値を決定するステップは、
（ｃ）補償制御データにより指示されるような顕著なトーン性コンテンツを有するオーディオ・データの前記各々の周波数帯域に対して第１の様式で（例えば、図２のコントローラ４において）マスキング値補正処理を遂行し、補償制御データにより指示されるような顕著なトーン性コンテンツを欠くオーディオ・データの前記各々の周波数帯域に対して第２の様式でマスキング値補正処理を遂行するステップ
をさらに含む。

記したように、本発明の符号化方法（及び仮数ビット割り当て方法）の一部の実施例は、本発明の補償制御データを使用して、符号化／復号化のＢＡＢＮＤＮＯＲＭ態様を修正する。

あるクラスの実施例では本発明の符号化方法は、以下のように、本発明の補償制御データを使用して、符号化／復号化のＢＡＢＮＤＮＯＲＭ態様を修正する。従来のＢＡＢＮＤＮＯＲＭ及び本発明の適応型低周波数補償の両方の方法は、同様の目的、すなわち、より低い周波数を犠牲にして、より高い周波数に向けてコーディング・ビットを再配分することを有する。しかし従来のＢＡＢＮＤＮＯＲＭは、復号化器にデルタを送信する追加的な代価を伴う。

ＢＡＢＮＤＮＯＲＭ及び本発明の適応型低周波数補償の両方の最適な使用法のために、符号化器は、帯域に対する適応型ローコンプ確定に基づいて知覚帯域に対するＢＡＢＮＤＮＯＲＭスケーリング定数を調整するように構成される。例えば図２のシステムの実装形態では、帯域に対するトーナリティ検出器１５により生成される補償制御データが、低周波数補償が動作不能（オフ）にされるべきであることを指示するならば、コントローラ４のマスキング・データ生成段は、マスキングしきい値がより小さな量によって、より低くされるように、（補償制御データに応答して）ＢＡＢＮＤＮＯＲＭのスケーリング定数を選定する。帯域に対するトーナリティ検出器１５により生成される補償制御データが、低周波数補償が動作可能（オン）にされるべきであることを指示するならば、マスキング・データ生成段は、マスキングしきい値がより大きな量によって、より低くされるように、（補償制御データに応答して）ＢＡＢＮＤＮＯＲＭのスケーリング定数を選定する。

本発明の方法の一部の実施例では、トーナリティ検出ステップが、ローコンプが従来と同様に適用されることになる集合内のいずれかの低周波数帯域に対する（又は、一体で考慮されるすべての低周波数帯域に対する）非トーン性コンテンツを指示するとき、ローコンプ補償は、以下の意味で「適用されない」（又はオフに切り替えられる、又は効果的に動作不能にされる）。集合内の少なくとも１つの低周波数帯域に対する非トーン性コンテンツを指示する本発明のトーナリティ検出ステップに応答して、集合内のすべての帯域に対する励起値からの非ゼロのローコンプ・パラメータの減算が、（例えば直ちに）終結する。この点でローコンプは、（周波数領域オーディオ・データの次の集合の帯域を通しての新しい走査の開始まで）何らかのマスク調整を行うことが防止される。

上記のように、本発明の方法の一部の実施例では補償制御データは、集合内の各々の個々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償は、集合内の各々の個々の低周波数帯域に選択的に適用される（又は適用されない）。本発明の方法の他の実施例では補償制御データは、（一体で考慮される）集合内の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償は、（補償制御データの内容に応じて）集合内のすべての低周波数帯域に適用されるか、集合内の低周波数帯域のいずれにも適用されないかのいずれかである。１つのクラスの実施例は、低周波数区域全体に対してローコンプを動作可能にすべきか、それとも動作不能にすべきかに関するバイナリ（広帯域）確定を履行する。このクラスでの一部の実施例では、トーナリティ検出が、ローコンプが動作不能にされるべきであることを指示するならば、再テンティングが、ローコンプ・パラメータが常に０であるように、低周波数ローコンプ区域から値−２のすべての差分指数を除去することになる。これに対して本発明の方法の他の実施例は、ローコンプが、低周波数区域全体の一部の周波数区域に対して動作状態のままであることが可能にされるが、他の周波数区域では動作不能にされるような、より細かい粒度のトーナリティ確定を履行する。

本発明の別の態様は、本発明の符号化方法の任意の実施例を遂行して、オーディオ・データに応答して、符号化されたオーディオ・データを生成するように構成される符号化器と、符号化されたオーディオ・データを復号して、オーディオ・データを復元するように構成される復号化器とを含むシステムである。図７のシステムは、そのようなシステムの例である。図７のシステムは、本発明の符号化方法の任意の実施例を遂行して、オーディオ・データに応答して、符号化されたオーディオ・データを生成するように構成される（例えば、プログラムされる）符号化器９０と、給送サブシステム９１と、復号化器９２とを含む。給送サブシステム９１は、符号化器９０により生成される符号化されたオーディオ・データを記憶するように、及び／又は、符号化されたオーディオ・データを指示している信号を送信するように構成される。復号化器９２は、（例えば、サブシステム９１内の記憶域から符号化されたオーディオ・データを読み出すこと若しくは索出すること、又は、サブシステム９１により送信されている符号化されたオーディオ・データを指示している信号を受信することにより）サブシステム９１から符号化されたオーディオ・データを受信するように、及び、符号化されたオーディオ・データを復号して、オーディオ・データを復元するように（並びに典型的にはさらに、オーディオ・データを指示している信号を生成及び出力するように）、結合及び構成される（例えば、プログラムされる）。

本発明の別の態様は、符号化されたオーディオ・データを復号するための方法（例えば、図７の復号化器９２により遂行される方法）であって、符号化されたオーディオ・データを指示している信号を受信するステップであり、符号化されたオーディオ・データが、本発明の符号化方法の任意の実施例によってオーディオ・データを符号化することにより生成されている、受信するステップと、符号化されたオーディオ・データを復号して、オーディオ・データを指示している信号を生成するステップとを含む方法である。

本発明を、ハードウェア、ファームウェア若しくはソフトウェア、又は両者の組み合わせ（例えば、プログラマブル・ロジック・アレイとして）の形で実装することが可能である。別段の指定がない限り、本発明の部分として含まれるアルゴリズム又は処理は、任意の特定のコンピュータ又は他の装置に本質的に関係付けられたものではない。特に、様々な汎用機械を、本明細書での教示によって記述されるプログラムとともに使用することが可能であり、又は、より専用化された装置（例えば集積回路）を構築して、要求される方法ステップを遂行することがより好都合である場合がある。したがって本発明を、少なくとも１つのプロセッサ、（揮発性及び不揮発性の、メモリ及び／又は記憶要素を含む）少なくとも１つのデータ記憶システム、少なくとも１つの入力デバイス又はポート、及び、少なくとも１つの出力デバイス又はポートを各々が備える、１つ又は複数のプログラマブル・コンピュータ・システム（例えば、図２の符号化器を実装するコンピュータ・システム）上で実行する、１つ又は複数のコンピュータ・プログラムの形で実装することが可能である。プログラム・コードは、本明細書で説明した機能を遂行し、出力情報を生成するために、入力データに適用される。出力情報は、知られている方式で、１つ又は複数の出力デバイスに付与される。

各々のそのようなプログラムを、コンピュータ・システムと通信するように、（機械語、アセンブリ言語、又は、高水準の手続き型、論理型、若しくはオブジェクト指向のプログラミング言語を含む）任意の所望のコンピュータ言語の形で実装することが可能である。任意の場合において言語は、コンパイル型又はインタプリタ型の言語であり得る。

例えば、コンピュータ・ソフトウェア命令シーケンスにより実装するとき、本発明の実施例の様々な機能及びステップを、適したデジタル信号処理ハードウェアにおいて実行されるマルチスレッド型ソフトウェア命令シーケンスにより実装することが可能であり、その場合には、実施例の様々なデバイス、ステップ、及び機能は、ソフトウェア命令の一部分に対応し得る。

各々のそのようなコンピュータ・プログラムは、好ましくは、汎用又は専用のプログラマブル・コンピュータにより可読な、記憶媒体又はデバイス（例えば、固体のメモリ若しくは媒体、又は、磁気若しくは光学の媒体）であって、その記憶媒体又はデバイスが、本明細書で説明した処理手順を遂行するためのコンピュータ・システムにより読み込まれるときに、コンピュータを環境設定し動作させるためのものである、記憶媒体又はデバイス上に記憶される、或いは、その記憶媒体又はデバイスにダウンロードされる。本発明のシステムを、コンピュータ・プログラムを伴って（すなわち、記憶して）構成されるコンピュータ可読記憶媒体として実装することもまた可能であり、その場合、そのように構成される記憶媒体によって、コンピュータ・システムは、具体的な、及び既定の様式で動作して、本明細書で説明した機能を遂行する。

本発明のいくつかの実施例を説明した。それでも、様々な修正を、本発明の趣旨及び範囲から逸脱することなく行うことが可能であることが理解されよう。本発明の多数の修正及び変形が、上記の教示に照らして可能である。添付の特許請求の範囲内で、本発明を、本明細書で具体的に説明したものとは別の方法で実践することが可能であるということを理解されたい。
上記の実施例形態につき付記を残しておく。
（付記１）
（ａ）周波数領域オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
（ｂ）低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、を含む、
オーディオ符号化方法。
（付記２）
前記補償制御データが、前記集合の少なくとも１つの帯域が拍手を表すかどうかを指示しているものであり、ステップ（ｂ）が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手を表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
付記１に記載の方法。
（付記３）
前記補償制御データが、前記集合の少なくとも１つの帯域が群衆雑音及び拍手の少なくとも１つを表すかどうかを指示しているものであり、ステップ（ｂ）が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手及び群衆雑音の少なくとも１つを表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
付記１に記載の方法。
（付記４）
ステップ（ｂ）が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記集合の各々の低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするステップ、を含む、
付記１に記載の方法。
（付記５）
再テンティングする前記ステップが、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値２、１、０、及び−１のうちの１つを有さなければならないように生成する、
付記４に記載の方法。
（付記６）
ステップ（ａ）が、前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの前記周波数帯域の少なくとも部分集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、前記方法が、
（ｃ）前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する前記オーディオ・データの前記各々の周波数帯域に対して第１の様式でマスキング値補正処理を遂行し、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記オーディオ・データの前記各々の周波数帯域に対して第２の様式で前記マスキング値補正処理を遂行するステップ、をさらに含む、
付記１に記載の方法。
（付記７）
前記マスキング値補正処理がＢＡＢＮＤＮＯＲＭ処理であり、ステップ（ｃ）が、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第１のスケーリング定数によって前記ＢＡＢＮＤＮＯＲＭ処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第２のスケーリング定数によって前記ＢＡＢＮＤＮＯＲＭ処理を遂行するステップ、を含む、
付記６に記載の方法。
（付記８）
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、ステップ（ａ）が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するステップ、を含む、
付記１に記載の方法。
（付記９）
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、ステップ（ａ）が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の平均二乗差の分量を決定するステップ、を含む、
付記１に記載の方法。
（付記１０）
前記補償制御データが、前記集合内の各々の個々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、ステップ（ｂ）において低周波数補償が、前記集合内の各々の個々の低周波数帯域に関して選択的に遂行される、又は遂行されない、
付記１に記載の方法。
（付記１１）
前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償が、ステップ（ｂ）において、前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するということを指示するとき、前記集合内のすべての前記低周波数帯域に関して遂行される、
付記１に記載の方法。
（付記１２）
量子化を受けることによることを含めて、符号化されることになる周波数領域オーディオ・データのオーディオ・データ値の仮数ビット割り当てを決定するための方法であって、前記オーディオ・データの低周波数帯域の集合の各々の周波数帯域の前記オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、前記オーディオ・データ値に対するマスキング値を、前記マスキング値が、前記オーディオ・データに対する前記仮数ビット割り当てを決定する信号−マスク値を決定するために有用であるように決定するステップを含み、前記適応型低周波数補償が、
（ａ）前記オーディオ・データに関してトーナリティ検出を遂行して、低周波数帯域の前記集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
（ｂ）前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する低周波数帯域の前記集合内の各々の周波数帯域内の前記オーディオ・データに関して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対する予備的なマスキング値を補正することによることを含めて、低周波数補償を遂行し、ただし、低周波数帯域の前記集合内のいずれの他の周波数帯域内の前記オーディオ・データに関しても、各々の前記他の周波数帯域に対する前記マスキング値が、補正されない予備的なマスキング値であるように、低周波数補償を遂行しないステップと、
を含む、方法。
（付記１３）
前記補償制御データが、前記集合の少なくとも１つの帯域が拍手を表すかどうかを指示しているものであり、ステップ（ｂ）が、
前記補償制御データにより指示されるような拍手を表す前記集合の各々の低周波数帯域内の前記オーディオ・データに関して、低周波数補償の遂行を動作不能にするステップ、
を含む、
付記１２に記載の方法。
（付記１４）
前記補償制御データが、前記集合の少なくとも１つの帯域が群衆雑音及び拍手の少なくとも１つを表すかどうかを指示しているものであり、ステップ（ｂ）が、
前記補償制御データにより指示されるような拍手及び群衆雑音の少なくとも１つを表す前記集合の各々の低周波数帯域内の前記オーディオ・データに関して、低周波数補償の遂行を動作不能にするステップ、を含む、
付記１２に記載の方法。
（付記１５）
ステップ（ｂ）が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記集合の各々の周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも１つの前記周波数帯域に対する修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするステップ、を含む、
付記１２に記載の方法。
（付記１６）
再テンティングする前記ステップが、顕著なトーン性コンテンツを欠く少なくとも１つの前記周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値２、１、０、及び−１のうちの１つを有さなければならないように生成する、
付記１５に記載の方法。
（付記１７）
ステップ（ａ）が、前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの前記周波数帯域の少なくとも部分集合内の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップを含み、前記オーディオ・データ値に対するマスキング値を決定する前記ステップが、
（ｃ）前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する前記オーディオ・データの前記各々の周波数帯域に対して、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して予備的なマスキング値を補正することによることを含めて、第１の様式でマスキング値補正処理を遂行し、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記オーディオ・データの前記各々の周波数帯域に対して第２の様式で前記マスキング値補正処理を遂行するステップ、をさらに含む、
付記１２に記載の方法。
（付記１８）
前記マスキング値補正処理がＢＡＢＮＤＮＯＲＭ処理であり、ステップ（ｃ）が、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第１のスケーリング定数によって前記ＢＡＢＮＤＮＯＲＭ処理を遂行し、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第２のスケーリング定数によって前記ＢＡＢＮＤＮＯＲＭ処理を遂行するステップ、を含む、
付記１７に記載の方法。
（付記１９）
前記補償制御データが、前記集合内の各々の個々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、ステップ（ｂ）において低周波数補償が、前記集合内の各々の個々の周波数帯域に関して選択的に遂行される、又は遂行されない、
付記１２に記載の方法。
（付記２０）
前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償が、ステップ（ｂ）において、前記補償制御データが、一体で考慮される前記集合内の前記周波数帯域が顕著なトーン性コンテンツを有するということを指示するとき、前記集合内のすべての前記周波数帯域に関して遂行される、
付記１２に記載の方法。
（付記２１）
周波数領域オーディオ・データに応答して、前記オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、符号化されたオーディオ・データを生成するように構成されるオーディオ符号化器であって、
前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するように構成されるトーナリティ検出器と、
前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするように結合及び構成される低周波数補償制御段と、
を含む、オーディオ符号化器。
（付記２２）
前記トーナリティ検出器が拍手検出器であり、前記補償制御データが、前記集合の少なくとも１つの帯域が拍手を表すかどうかを指示している、
付記２１に記載の符号化器。
（付記２３）
前記補償制御データが、前記集合の少なくとも１つの帯域が群衆雑音及び拍手の少なくとも１つを表すかどうかを指示している、
付記２１に記載の符号化器。
（付記２４）
前記低周波数補償制御段が、復号化器が、低周波数補償が前記符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく、又は前記適用されたか否かに関して通知されることなく、前記符号化されたオーディオ・データの復号を遂行することを可能にする様式で、前記補償制御データに応答して、低周波数帯域の前記集合の各々の帯域の前記オーディオ・データへの低周波数補償の適用を、適応的に動作可能にするように構成される、
付記２１に記載の符号化器。
（付記２５）
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、少なくとも１つの修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするように構成される、
付記２１に記載の符号化器。
（付記２６）
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値２、１、０、及び−１のうちの１つを有さなければならないように生成することによることを含めて、再テンティングするように構成される、
付記２５に記載の符号化器。
（付記２７）
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、前記トーナリティ検出器が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するように構成される、
付記２１に記載の符号化器。
（付記２８）
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、前記トーナリティ検出器が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の平均二乗差の分量を決定するように構成される、
付記２１に記載の符号化器。
（付記２９）
前記符号化器が、前記トーナリティ検出器及び前記低周波数補償制御段を実装するソフトウェアによってプログラムされるプロセッサである、付記２１に記載の符号化器。
（付記３０）
前記符号化器がデジタル信号プロセッサである、
付記２１に記載の符号化器。
（付記３１）
前記トーナリティ検出器が、前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの前記周波数帯域の少なくとも部分集合の各々の周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するように構成され、符号化器が、前記低周波数補償制御段を含むマスキング値補正段を含み、前記マスキング値段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する前記オーディオ・データの前記各々の周波数帯域に対して第１の様式でマスキング値補正処理を遂行するように、及び、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記オーディオ・データの前記各々の周波数帯域に対して第２の様式で前記マスキング値補正処理を遂行するように構成される、
付記２１に記載の符号化器。
（付記３２）
前記マスキング値補正処理がＢＡＢＮＤＮＯＲＭ処理であり、前記マスキング値補正段が、顕著なトーン性コンテンツを有する前記各々の周波数帯域に対して第１のスケーリング定数によって前記ＢＡＢＮＤＮＯＲＭ処理を遂行するように、及び、顕著なトーン性コンテンツを欠く前記各々の周波数帯域に対して第２のスケーリング定数によって前記ＢＡＢＮＤＮＯＲＭ処理を遂行するように構成される、
付記３１に記載の符号化器。
（付記３３）
周波数領域オーディオ・データに応答して、前記オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、符号化されたオーディオ・データを生成するように構成される符号化器と、
前記符号化されたオーディオ・データを復号して、前記オーディオ・データを復元するように構成される復号化器と
を含むシステムであって、前記符号化器が、
前記オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するように構成されるトーナリティ検出器と、
前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするように結合及び構成される低周波数補償制御段と
を含むシステム。
（付記３４）
前記トーナリティ検出器が拍手検出器であり、前記補償制御データが、前記集合の少なくとも１つの帯域が拍手を表すかどうかを指示している、
付記３３に記載のシステム。
（付記３５）
前記補償制御データが、前記集合の少なくとも１つの帯域が群衆雑音及び拍手の少なくとも１つを表すかどうかを指示している、
付記３３に記載のシステム。
（付記３６）
前記復号化器が、低周波数補償が前記符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく、又は前記適用されたか否かに関して通知されることなく、前記符号化されたオーディオ・データを復号するように構成される、
付記３３に記載のシステム。
（付記３７）
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、少なくとも１つの修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするように構成される、
付記３３に記載の符号化器。
（付記３８）
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値２、１、０、及び−１のうちの１つを有さなければならないように生成することによることを含めて、再テンティングするように構成される、
付記３７に記載の符号化器。
（付記３９）
前記周波数領域オーディオ・データが、前記集合の前記各々の低周波数帯域に対する指数値を含み、前記トーナリティ検出器が、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するように構成される、
付記３３に記載の符号化器。
（付記４０）
符号化されたオーディオ・データを復号するための方法であって、
前記符号化されたオーディオ・データを指示している信号を受信するステップと、
前記符号化されたオーディオ・データを復号して、オーディオ・データを指示している信号を生成するステップと
を含み、
前記符号化されたオーディオ・データが、
（ａ）周波数領域オーディオ・データに関してトーナリティ検出を遂行して、前記オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するステップと、
（ｂ）低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、
により生成されている、方法。
（付記４１）
前記補償制御データが、前記集合の少なくとも１つの帯域が拍手を表すかどうかを指示しているものであり、ステップ（ｂ）が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手を表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
付記４０に記載の方法。
（付記４２）
前記補償制御データが、前記集合の少なくとも１つの帯域が群衆雑音及び拍手の少なくとも１つを表すかどうかを指示しているものであり、ステップ（ｂ）が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手及び群衆雑音の少なくとも１つを表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
付記４０に記載の方法。
（付記４３）
ステップ（ｂ）が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記集合の各々の低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするステップを含む、
付記４０に記載の方法。
（付記４４）
再テンティングする前記ステップが、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値２、１、０、及び−１のうちの１つを有さなければならないように生成する、
付記４３に記載の方法。

２分析フィルタ・バンク
４コントローラ
６量子化器
１０テンティング
１１指数コーディング
１５トーナリティ検出
９０符号化器
９２復号化器

Claims

（ａ）オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するために、周波数領域オーディオ・データに関してトーナリティ検出を遂行するステップであり、
前記周波数領域オーディオ・データは、前記集合の前記各々の低周波数帯域に対する指数を含み、かつ、トーナリティ検出を遂行するステップは、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するステップを含み、
前記テンティングされた指数は、連続する指数間の差を決定すること、および、前記差が、２、１、０、−１、−２の範囲内にあるように、引かれる前記指数の一つを変更すること、によって決定される、
ステップと、
（ｂ）前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするために、低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、を含む、
オーディオ符号化方法。
前記補償制御データが、前記集合の少なくとも１つの帯域が拍手を表すかどうかを指示しているものであり、ステップ（ｂ）が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手を表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
請求項１に記載の方法。
前記補償制御データが、前記集合の少なくとも１つの帯域が群衆雑音及び拍手の少なくとも１つを表すかどうかを指示しているものであり、ステップ（ｂ）が、
低周波数補償を遂行することなく、前記補償制御データにより指示されるような拍手及び群衆雑音の少なくとも１つを表す前記集合の各々の低周波数帯域内の前記オーディオ・データに対して、マスキング値を生成するステップ、を含む、
請求項１に記載の方法。
ステップ（ｂ）が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く前記集合の各々の低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするステップ、を含む、
請求項１に記載の方法。
再テンティングする前記ステップが、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値２、１、０、及び−１のうちの１つを有さなければならないように生成する、
請求項４に記載の方法。
前記差の分量は、前記オーディオ・データの指数と、対応するテンティングされた指数との間の平均二乗差分量である、
請求項１に記載の方法。
前記補償制御データが、前記集合内の各々の個々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、ステップ（ｂ）において低周波数補償が、前記集合内の各々の個々の低周波数帯域に関して選択的に遂行される、又は遂行されない、
請求項１に記載の方法。
前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、低周波数補償が、ステップ（ｂ）において、前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するということを指示するとき、前記集合内のすべての前記低周波数帯域に関して遂行される、
請求項１に記載の方法。
周波数領域オーディオ・データに応答して、オーディオ・データに関して適応型低周波数補償を遂行することによることを含めて、符号化された前記オーディオ・データを生成するように構成されるオーディオ符号化器であって、
オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するために、周波数領域オーディオ・データに関してトーナリティ検出を遂行するように構成されるトーナリティ検出器であり、
前記周波数領域オーディオ・データは、前記集合の前記各々の低周波数帯域に対する指数を含み、かつ、トーナリティ検出を遂行するために、前記トーナリティ検出器は、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するように構成されており、
前記テンティングされた指数は、連続する指数間の差を決定すること、および、前記差が、２、１、０、−１、−２の範囲内にあるように、引かれる前記指数の一つを変更すること、によって決定される、
トーナリティ検出器と、
前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするように結合及び構成される低周波数補償制御段であり、
前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、かつ、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内でマスキング値を生成する、
低周波数補償制御段と、
を含む、オーディオ符号化器。
前記トーナリティ検出器が拍手検出器であり、前記補償制御データが、前記集合の少なくとも１つの帯域が拍手を表すかどうかを指示している、
請求項９に記載の符号化器。
前記補償制御データが、前記集合の少なくとも１つの帯域が群衆雑音及び拍手の少なくとも１つを表すかどうかを指示している、
請求項９に記載の符号化器。
前記低周波数補償制御段が、復号化器が、低周波数補償が前記符号化の間にいずれかの低周波数帯域に適用されたか否かを決定することなく、又は前記適用されたか否かに関して通知されることなく、前記符号化されたオーディオ・データの復号を遂行することを可能にする様式で、前記補償制御データに応答して、低周波数帯域の前記集合の各々の帯域の前記オーディオ・データへの低周波数補償の適用を、適応的に動作可能にするように構成される、
請求項９に記載の符号化器。
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、少なくとも１つの修正された指数を含む修正されたオーディオ・データを生成するように再テンティングするように構成される、
請求項９に記載の符号化器。
前記低周波数補償制御段が、前記補償制御データにより指示されるような顕著なトーン性コンテンツを欠く各々の前記低周波数帯域内の前記オーディオ・データを、顕著なトーン性コンテンツを欠く少なくとも１つの前記低周波数帯域に対する前記修正された指数を、次のより高い周波数帯域内の前記オーディオ・データの指数から、前記修正された指数を引いたものが、値２、１、０、及び−１のうちの１つを有さなければならないように生成することによることを含めて、再テンティングするように構成される、
請求項１３に記載の符号化器。
前記分量は、前記オーディオ・データの指数と、対応するテンティングされた指数との間の平均二乗差分量である、
請求項９に記載の符号化器。
前記オーディオ符号化器は、前記トーナリティ検出器及び前記低周波数補償制御段を実装するソフトウェアによってプログラムされるプロセッサである、
請求項９に記載の符号化器。
前記オーディオ符号化器は、デジタル信号プロセッサである、
請求項９に記載の符号化器。
符号化されたオーディオ・データを指示している信号を受信する受信器と、
前記オーディオ・データを指示している信号を生成するために、前記符号化されたオーディオ・データを復号するように構成されている復号器と、
を含む、装置であって、
前記符号化されたオーディオ・データは、
（ａ）オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するために、周波数領域オーディオ・データに関してトーナリティ検出を遂行するステップであり、
前記周波数領域オーディオ・データは、前記集合の前記各々の低周波数帯域に対する指数を含み、かつ、トーナリティ検出を遂行するステップは、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するステップを含み、
前記テンティングされた指数は、連続する指数間の差を決定すること、および、前記差が、２、１、０、−１、−２の範囲内にあるように、引かれる前記指数の一つを変更すること、によって決定される、
ステップと、
（ｂ）前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするために、低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、
によって生成される、装置。
前記補償制御データは、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示し、かつ、
前記補償制御データが、一体で考慮される前記集合内の前記低周波数帯域が顕著なトーン性コンテンツを有するということを指示する場合、低周波数補償が、ステップ（ｂ）において、前記集合内のすべての前記低周波数帯域に関して遂行される、
請求項１８に記載の装置。
符号化されたオーディオ・データを指示している信号を受信するステップと、
前記オーディオ・データを指示している信号を生成するために、前記符号化されたオーディオ・データを復号するステップと、を含み、
前記符号化されたオーディオ・データは、
（ａ）オーディオ・データの少なくとも一部の低周波数帯域の集合の各々の低周波数帯域が顕著なトーン性コンテンツを有するかどうかを指示している補償制御データを生成するために、周波数領域オーディオ・データに関してトーナリティ検出を遂行するステップであり、
前記周波数領域オーディオ・データは、前記集合の前記各々の低周波数帯域に対する指数を含み、かつ、トーナリティ検出を遂行するステップは、前記集合の前記各々の低周波数帯域に対して、前記オーディオ・データの指数と、対応するテンティングされた指数との間の差の分量を決定するステップを含み、
前記テンティングされた指数は、連続する指数間の差を決定すること、および、前記差が、２、１、０、−１、−２の範囲内にあるように、引かれる前記指数の一つを変更すること、によって決定される、
ステップと、
（ｂ）前記補償制御データに応答して、前記オーディオ・データの低周波数帯域の前記集合の各々の低周波数帯域への低周波数補償の適用を、適応的に動作可能にするために、低周波数補償を遂行して、前記補償制御データにより指示されるような顕著なトーン性コンテンツを有する各々の前記低周波数帯域内の前記オーディオ・データに対する補正されたマスキング値を生成し、低周波数補償を遂行することなく、前記集合内の各々の他の低周波数帯域内の前記オーディオ・データに対するマスキング値を生成するステップと、
によって生成される、方法。