JP3515903B2

JP3515903B2 - オーディオ符号化のための動的ビット割り当て方法及び装置

Info

Publication number: JP3515903B2
Application number: JP16826598A
Authority: JP
Inventors: ホン・ネオスア; メイ・シェンシェン; ペン・タンアー
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1998-06-16
Filing date: 1998-06-16
Publication date: 2004-04-05
Anticipated expiration: 2018-06-16
Also published as: EP0966108B1; CN1146203C; DE69924431D1; EP0966108A3; US6308150B1; CN1239368A; EP0966108A2; DE69924431T2; JP2000004163A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ディジタル音声信
号をディジタル伝送路を介して送信を行うためにもしく
はディジタル記憶媒体又は記録媒体に記憶するために、
ディジタル音声信号を効率的な情報データに符号化を行
うためのオーディオ符号化のための動的ビット割り当て
方法及び装置に関する。

【０００２】

【従来の技術】近年のディジタルオーディオ圧縮アルゴ
リズムの出現に続いて、それらの幾つかは消費者のアプ
リケーションにおいて利用されている。その典型的な例
は、ミニディスク（ＭＤ）製品において使用されるＡＴ
ＲＡＣアルゴリズムである。そのアルゴリズムは、１９
９２年９月にソニーによって発行されたミニディスクシ
ステムの説明書であるレインボーブック（Rainbow Boo
k）の１０章において記述されている。ＡＴＲＡＣアル
ゴリズムは、サブバンド符号化及び変換符号化の両方を
利用するハイブリッド符号化方法の分類に属する。

【０００３】図２１は、従来技術の動的ビット割り当て
処理を行う動的ビット割り当てモジュール１０９ａを備
えたＡＴＲＡＣ符号化器１００ａの構成を示すブロック
図である。図２１において、入力されるアナログ音声信
号はまず最初に、Ａ／Ｄ変換器１１２によって所定のサ
ンプリング周波数でＡ／Ｄ変換されて１フレーム当たり
５１２個の音声サンプルデータを有する各フレームにセ
グメント分割される。次いで、音声サンプルデータの各
フレームは２つのレベルのＱＭＦ分解フィルタリングを
行うＱＭＦ分解フィルタモジュール１１１に入力され
る。ＱＭＦ分解フィルタモジュール１１１は、ＱＭＦフ
ィルタ１０１と、ＱＭＦフィルタ１０２と、ＱＭＦフィ
ルタ１０３とから構成される。ここで、ＱＭＦフィルタ
１０１は、５１２個の音声サンプルデータを有する信号
を等しい個数（２５６個）の音声サンプルデータを有す
る２つのサブバンド（高域と中低域）信号に分割し、中
低域のサブバンド信号はさらにＱＭＦフィルタ１０３に
よってまた別の同一個数（１２８個）の音声サンプルデ
ータを有する２つのサブバンド（中域と低域）信号に分
割される。高域のサブバンド信号は、ＱＭＦフィルタ１
０３における処理に要する時間だけ遅延器１０２によっ
て遅延され、これによって、ＱＭＦ分解フィルタモジュ
ール１１１から出力される各帯域のサブバンド信号にお
いて、高域のサブバンド信号は中域のサブバンド信号及
び低域のサブバンド信号と同期化される。

【０００４】次いで、ブロックサイズ決定モジュール１
０４は、３つのサブバンド信号のためにそれぞれ用いら
れるＭＤＣＴ（変形離散コサイン変換）モジュール１０
５、１０６及び１０７の個々のブロックサイズモードを
決定する。ブロックサイズモードは、所定のより長い時
間間隔を有するロングブロック、又は所定のより短い時
間間隔を有するショートブロックのいずれかで固定され
る。スペクトルの振幅値が突発的に高いレベルを有する
アタック（attack）信号が検出されると、ショートブロ
ックモードが選択される。すべてのＭＤＣＴのスペクト
ルラインは５２個の周波数分割バンドにグループ化され
る。以下、周波数分割バンドをユニット(unit)という。
グループ化は、より低い周波数のユニットがより高い周
波数のユニットのスペクトルラインの本数よりも少数の
スペクトルラインを有するように行われる。

【０００５】このユニットのグループ化は臨界帯域に基
づいて行われる。臨界帯域又は臨界帯域幅とは、人間の
聴覚が雑音を処理するときに使用する周波数軸上で不均
一な帯域をいい、１５０Ｈｚでは周波数幅は１００Ｈ
ｚ、１ｋＨｚでは周波数幅は１６０Ｈｚ、４ｋＨｚでは
周波数幅は７００Ｈｚ、１０．５ｋＨｚでは２．５ｋＨ
ｚというように、周波数が高くなるほど臨界帯域の帯域
幅は広くなる。

【０００６】各ユニットのレベルを示すスケールファク
タＳＦ［ｎ］は、スケールファクタモジュール１０８に
おいて、所定のテーブルにおいてそのユニット内の最も
大きい振幅のスペクトルラインに比較して大きい値の中
で最小値である値を選択することによって計算される。
動的ビット割り当てモジュール１０９ａにおいては、１
つのユニットのスペクトルサンプルデータを量子化する
ために割り当てられるビット数であるワード長ＷＬ
［ｎ］が決定される。最終的に、複数のユニットのスペ
クトルサンプルデータは、量子化モジュール１１０にお
いてスケールファクタＳＦ［ｎ］とビット割り当てデー
タのワード長ＷＬ［ｎ］とのサイド情報を用いて量子化
され、音声スペクトルデータＡＳＤ［ｎ］が出力され
る。

【０００７】動的ビット割り当てモジュール１０９ａ
は、実施の複雑性と復号化された音声信号の音質とを決
定する重要な役割を果たす。幾つかの従来技術の方法
は、ビット割り当てを実行するためにユニットのスペク
トルレベルの変化量を使用する。ビット割り当て処理に
おいて、最も高い変化量を有するユニットが最初に検出
され、１ビットが当該ユニットに割り当てられる。次い
で、このユニットのスペクトルレベルの変化量は、ある
１つのファクタによって減少される。この処理は、すべ
てのビット割り当てに使用することができる利用可能な
ビット数が使い尽くされるまで繰り返される。この方法
は多くの反復処理を行い、多大な計算力を消費する。さ
らにその上、音響心理学的なマスキング現象の使用の欠
落によって、この方法は優れた音質を達成することが困
難である。例えば、ＩＳＯ／ＩＥＣ１１１７２−３に基
づくＭＰＥＧの音声規格において使用される方法のよう
な他の方法は、非常に複雑化された音響心理学モデルを
使用し、反復ビット割り当て処理もまた使用する。

【０００８】

【発明が解決しようとする課題】ＭＰＥＧ１の音声規格
のような確立されたディジタルオーディオ圧縮システム
は、人間の聴覚システムの音響心理学的なモデルを用い
てマスキング効果の絶対しきい値を検出し、それによっ
て量子化雑音が当該絶対しきい値以下で保持されれば、
人間には雑音は聞こえなくなることは公知である。ＭＰ
ＥＧ１の音声規格によって提案される２つの音響心理学
的モデルは優れた音質を達成するが、それらは非常に複
雑で、消費者のアプリケーションのために低コストのＬ
ＳＩにおいて実施することができない。そこで、簡単化
されたマスキング効果の絶対しきい値計算が必要とされ
る。

【０００９】本発明の目的は、ほとんどのディジタル音
声圧縮システムに対して広く使用可能であり、容易にか
つ低コストで実施可能なオーディオ符号化のための動的
ビット割り当て方法及び装置を提供することにある。

【００１０】

【課題を解決するための手段】本発明は、優れた音質と
低い実装複雑性のバランスを取ることにおいて、ほとん
どのビット割り当て方法が直面する問題を解決すること
を試みる。これに加え、本発明はまた、少量の計算力だ
けを消費するようにビット割り当て手順を改善すること
を試みる。このことは、従来技術のほとんどのビット割
り当て方法又は装置で通常に用いられる反復アプローチ
に依存する方法とは異なり、新しいオフセット値に基づ
くサンプルビット計算によって達成される。

【００１１】本発明に係るオーディオ符号化のための動
的ビット割り当て方法は、ディジタル音声信号の分割さ
れた複数のサンプルデータを量子化するために使用され
るビット数を決定するオーディオ符号化のための動的ビ
ット割り当て方法であって、上記複数のサンプルデータ
は、異なる周波数間隔と異なる時間間隔との少なくとも
一方を有する複数のユニットにグループ化されてなり、
上記異なる周波数間隔は人間の聴覚特性の臨界帯域に基
づいて決定され、上記異なる時間間隔は第１の時間間隔
と、上記第１の時間間隔より長い第２の時間間隔とを含
み、（ａ）静寂時に人間が音を可聴可能か否かを表す所
定の静寂時のしきい値特性に基づいて、すべてのユニッ
トの絶対しきい値を設定する絶対しきい値設定ステップ
と、（ｂ）上記第１の時間間隔を有するユニットの絶対
しきい値を、同一の周波数間隔を有する複数のユニット
のうちの最小の絶対しきい値によって置き換えることに
より、上記第１の時間間隔を有するユニットの絶対しき
い値を調整する絶対しきい値調整ステップと、（ｃ）上
記複数のユニットにグループ化された複数のサンプルデ
ータに基づいて、上記各ユニットのピークエネルギーを
計算するピークエネルギー計算ステップと、（ｄ）すべ
てのユニットが第２の時間間隔を有しているとき、所定
の簡単化された同時マスキング効果モデルと、マスクす
るユニットのピークエネルギーとに基づいて、上記簡単
化された同時マスキング効果モデルを用いたときの最小
可聴限界であるマスキング効果値を計算して各ユニット
の絶対しきい値として更新して設定するマスキング効果
値計算ステップと、（ｅ）上記計算された各ユニットの
ピークエネルギーと、上記計算された各ユニットの絶対
しきい値とに基づいて、各ユニットの信号対マスキング
比を計算する信号対マスキング比計算ステップと、
（ｆ）量子化すべき全帯域幅がすべてのユニットを含む
と仮定して、上記ディジタル音声信号のフレームのサイ
ズに基づいて、ビット割り当てに利用可能なビット数を
計算する利用可能ビット数計算ステップと、（ｇ）所定
の正数値をすべてのユニットの上記信号対マスキング比
に加算することにより、上記すべてのユニットの信号対
マスキング比を正の値にする信号対マスキング比正数化
ステップと、（ｈ）上記すべてのユニットの正数化され
た信号対マスキング比と、所定の線形量子化器の１ビッ
ト当たりの信号対雑音比の改善値に基づく信号対マスキ
ング比の１ステップ当たりの減少量と、上記利用可能な
ビット数とに基づいて、上記すべてのユニットの正数化
された信号対マスキング比を減少させるためのオフセッ
ト値として定義される信号対マスキング比のオフセット
値を計算する信号対マスキング比オフセット値計算ステ
ップと、（ｉ）上記計算された信号対マスキング比のオ
フセット値と、上記計算された各ユニットの信号対マス
キング比とに基づいて、ビット割り当てを行う必要のあ
るユニットをカバーする帯域幅を計算し、上記計算され
た帯域幅に基づいて上記信号対マスキング比のオフセッ
ト値を更新するように計算する帯域幅計算ステップと、
（ｊ）上記各ユニットにおいて上記計算された信号対マ
スキング比から上記計算された信号対マスキング比のオ
フセット値を減算して、各ユニットの減算された信号対
マスキング比を計算して、上記各ユニットの減算された
信号対マスキング比と、上記信号対マスキング比の１ス
テップ当たりの減少量とに基づいて、量子化するときに
各ユニットに割り当てられるビット数を表すサンプルビ
ット数を計算するサンプルビット数計算ステップと、
（ｋ）上記計算された利用可能なビット数から上記計算
されたすべてのユニットに割り当てられるべきサンプル
ビット数の合計値を減算した残りのビット数を、少なく
とも、上記信号対マスキング比のオフセット値より大き
い信号対マスキング比を有するユニットに割り当てる残
りのビット割り当てステップとを含むことを特徴とす
る。

【００１２】また、上記オーディオ符号化のための動的
ビット割り当て方法においては、好ましくは、上記ピー
クエネルギー計算ステップにおいて、上記各ユニット内
で上記最大のスペクトル係数の振幅値を、所定のスケー
ルファクタテーブルを用いて、上記振幅値に対応するス
ケールファクタに置き換えて所定の近似計算を行うこと
により、各ユニットのピークエネルギーを計算すること
を特徴とする。

【００１３】さらに、上記オーディオ符号化のための動
的ビット割り当て方法においては、好ましくは、上記マ
スキング効果値計算ステップにおいて、上記所定の簡単
化された同時マスキング効果モデルは、上記マスクする
ユニットより高域側のユニットの音声信号をマスクする
ときに使用される高域側のマスキング効果モデルと、上
記マスクするユニットより低域側のユニットの音声信号
をマスクするときに使用される低域側のマスキング効果
モデルとを含み、上記マスクされるユニットの最終的に
決定される絶対しきい値には、上記設定されたマスクさ
れるユニットの絶対しきい値と、上記同時マスキング効
果値とのうちの最大値が設定されることを特徴とする。

【００１４】またさらに、上記オーディオ符号化のため
の動的ビット割り当て方法においては、好ましくは、上
記信号対マスキング比計算ステップにおいて、各ユニッ
トの信号対マスキング比は、上記ユニットのピークエネ
ルギーから上記設定された絶対しきい値を、デシベル
（ｄＢ）単位で減算することによって計算されることを
特徴とする。

【００１５】またさらに、上記オーディオ符号化のため
の動的ビット割り当て方法においては、好ましくは、上
記信号対マスキング比オフセット値計算ステップにおい
て、上記信号対マスキング比のオフセット値は、すべて
のユニットの上記正数化された信号対マスキング比と、
上記信号対マスキング比の１ステップ当たりの減少量
と、上記ビット割り当てに利用できる利用可能なビット
数に基づいて、初期の信号対マスキング比のオフセット
値を計算することと、上記計算された初期の信号対マス
キング比のオフセット値に基づいて所定の反復処理を行
うことによって計算されることを特徴とする。

【００１６】ここで、上記反復処理は、好ましくは、上
記初期信号対マスキング比のオフセット値より低い信号
対マスキング比を有するユニットを上記信号対マスキン
グ比のオフセット値の計算から除去し、残りのユニット
の上記正数化された信号対マスキング比と、上記信号対
マスキング比の１ステップ当たりの減少量と、上記ビッ
ト割り当てに利用できる利用可能なビット数に基づい
て、上記信号対マスキング比のオフセット値の計算に関
係するすべてのユニットの信号対マスキング比が最終的
な信号対マスキング比のオフセット値より高くなるま
で、上記信号対マスキング比のオフセット値を反復的に
再計算し、このことによって、負のビット数の割り当て
を生じさせないことを保証することを特徴とする。

【００１７】また、上記オーディオ符号化のための動的
ビット割り当て方法においては、好ましくは、上記帯域
幅計算ステップにおいて、上記帯域幅は、所定のユニッ
トから、上記信号対マスキング比のオフセット値より小
さい上記信号対マスキング比を有するユニットが連続し
て存在する時に、上記連続したユニットを除去すること
によって計算され、上記除去されたユニットに対応する
ビット数は上記利用可能なビット数に加算されて上記利
用可能なビット数が更新され、上記信号対マスキング比
のオフセット値を更新することは、上記更新された利用
可能なビット数に基づいて実行されることを特徴とす
る。

【００１８】さらに、上記オーディオ符号化のための動
的ビット割り当て方法においては、好ましくは、上記サ
ンプルビット数計算ステップにおいて、上記各ユニット
のサンプルビット数は、上記各ユニットの信号対マスキ
ング比から上記信号対マスキング比のオフセット値を減
算した値を、上記信号対マスキング比の１ステップ当た
りの減少量で除算した後、その除算結果値を整数化した
値であり、上記信号対マスキング比のオフセット値より
低い信号対マスキング比を有するユニットに対して、ビ
ットを割り当てないことを特徴とする。

【００１９】またさらに、上記オーディオ符号化のため
の動的ビット割り当て方法においては、好ましくは、上
記残りのビット割り当てステップにおいて、上記残りの
ビット数を割り当てるための所定の第１と第２のパスの
処理を実行し、上記第１のパスの処理は、上記信号対マ
スキング比のオフセット値より大きい信号対マスキング
比を有するが上記サンプルビット数計算ステップにおけ
る整数化の結果としてビットを割り当てられなかったユ
ニットに１ビットを割り当て、上記第２のパスの処理
は、最大ビット数ではないが複数のビット数が既に割り
当てられているユニットに対して１ビットを割り当てる
ことを特徴とする。

【００２０】ここで、上記残りのビット割り当てステッ
プにおいて、上記第１と第２のパスの処理は、好ましく
は、最高の周波数のユニットから最低の周波数のユニッ
トに向かってユニットを移動しながら実行されることを
特徴とする。

【００２１】本発明に係るオーディオ符号化のための動
的ビット割り当て装置は、ディジタル音声信号の分割さ
れた複数のサンプルデータを量子化するために使用され
るビット数を決定するオーディオ符号化のための動的ビ
ット割り当て装置であって、上記複数のサンプルデータ
は、異なる周波数間隔と異なる時間間隔との少なくとも
一方を有する複数のユニットにグループ化されてなり、
上記異なる周波数間隔は人間の聴覚特性の臨界帯域に基
づいて決定され、上記異なる時間間隔は第１の時間間隔
と、上記第１の時間間隔より長い第２の時間間隔とを含
み、（ａ）静寂時に人間が音を可聴可能か否かを表す所
定の静寂時のしきい値特性に基づいて、すべてのユニッ
トの絶対しきい値を設定する絶対しきい値設定手段と、
（ｂ）上記第１の時間間隔を有するユニットの絶対しき
い値を、同一の周波数間隔を有する複数のユニットのう
ちの最小の絶対しきい値によって置き換えることによ
り、上記第１の時間間隔を有するユニットの絶対しきい
値を調整する絶対しきい値調整手段と、（ｃ）上記複数
のユニットにグループ化された複数のサンプルデータに
基づいて、上記各ユニットのピークエネルギーを計算す
るピークエネルギー計算手段と、（ｄ）すべてのユニッ
トが第２の時間間隔を有しているとき、所定の簡単化さ
れた同時マスキング効果モデルと、マスクするユニット
のピークエネルギーとに基づいて、上記簡単化された同
時マスキング効果モデルを用いたときの最小可聴限界で
あるマスキング効果値を計算して各ユニットの絶対しき
い値として更新して設定するマスキング効果値計算手段
と、（ｅ）上記計算された各ユニットのピークエネルギ
ーと、上記計算された各ユニットの絶対しきい値とに基
づいて、各ユニットの信号対マスキング比を計算する信
号対マスキング比計算手段と、（ｆ）量子化すべき全帯
域幅がすべてのユニットを含むと仮定して、上記ディジ
タル音声信号のフレームのサイズに基づいて、ビット割
り当てに利用可能なビット数を計算する利用可能ビット
数計算手段と、（ｇ）所定の正数値をすべてのユニット
の上記信号対マスキング比に加算することにより、上記
すべてのユニットの信号対マスキング比を正の値にする
信号対マスキング比正数化手段と、（ｈ）上記すべての
ユニットの正数化された信号対マスキング比と、所定の
線形量子化器の１ビット当たりの信号対雑音比の改善値
に基づく信号対マスキング比の１ステップ当たりの減少
量と、上記利用可能なビット数とに基づいて、上記すべ
てのユニットの正数化された信号対マスキング比を減少
させるためのオフセット値として定義される信号対マス
キング比のオフセット値を計算する信号対マスキング比
オフセット値計算手段と、（ｉ）上記計算された信号対
マスキング比のオフセット値と、上記計算された各ユニ
ットの信号対マスキング比とに基づいて、ビット割り当
てを行う必要のあるユニットをカバーする帯域幅を計算
し、上記計算された帯域幅に基づいて上記信号対マスキ
ング比のオフセット値を更新するように計算する帯域幅
計算手段と、（ｊ）上記各ユニットにおいて上記計算さ
れた信号対マスキング比から上記計算された信号対マス
キング比のオフセット値を減算して、各ユニットの減算
された信号対マスキング比を計算して、上記各ユニット
の減算された信号対マスキング比と、上記信号対マスキ
ング比の１ステップ当たりの減少量とに基づいて、量子
化するときに各ユニットに割り当てられるビット数を表
すサンプルビット数を計算するサンプルビット数計算手
段と、（ｋ）上記計算された利用可能なビット数から上
記計算されたすべてのユニットに割り当てられるべきサ
ンプルビット数の合計値を減算した残りのビット数を、
少なくとも、上記信号対マスキング比のオフセット値よ
り大きい信号対マスキング比を有するユニットに割り当
てる残りのビット割り当て手段とを備えたことを特徴と
する。

【００２２】また、上記オーディオ符号化のための動的
ビット割り当て装置においては、好ましくは、上記ピー
クエネルギー計算手段は、上記各ユニット内で上記最大
のスペクトル係数の振幅値を、所定のスケールファクタ
テーブルを用いて、上記振幅値に対応するスケールファ
クタに置き換えて所定の近似計算を行うことにより、各
ユニットのピークエネルギーを計算することを特徴とす
る。

【００２３】さらに、上記オーディオ符号化のための動
的ビット割り当て装置においては、好ましくは、上記マ
スキング効果値計算手段の処理において、上記所定の簡
単化された同時マスキング効果モデルは、上記マスクす
るユニットより高域側のユニットの音声信号をマスクす
るときに使用される高域側のマスキング効果モデルと、
上記マスクするユニットより低域側のユニットの音声信
号をマスクするときに使用される低域側のマスキング効
果モデルとを含み、上記マスキング効果値計算手段は、
上記マスクされるユニットの最終的に決定される絶対し
きい値に、上記絶対しきい値設定手段によって設定され
た上記マスクされるユニットの絶対しきい値と、上記同
時マスキング効果モデルによって決められた同時マスキ
ング効果値とのうちの最大値を設定することを特徴とす
る。

【００２４】またさらに、上記オーディオ符号化のため
の動的ビット割り当て装置においては、好ましくは、上
記信号対マスキング比計算手段は、各ユニットの信号対
マスキング比を、上記ユニットのピークエネルギーから
上記設定された絶対しきい値をデシベル（ｄＢ）単位で
減算することによって計算することを特徴とする。

【００２５】またさらに、上記オーディオ符号化のため
の動的ビット割り当て装置においては、好ましくは、上
記信号対マスキング比オフセット値計算手段は、上記信
号対マスキング比のオフセット値を計算するときに、す
べてのユニットの上記正数化された信号対マスキング比
と、上記信号対マスキング比の１ステップ当たりの減少
量と、上記ビット割り当てに利用できる利用可能なビッ
ト数に基づいて、初期の信号対マスキング比のオフセッ
ト値を計算し、上記計算された初期の信号対マスキング
比のオフセット値に基づいて所定の反復処理を行うこと
を特徴とする。

【００２６】ここで、上記反復処理は、好ましくは、上
記初期信号対マスキング比のオフセット値より低い信号
対マスキング比を有するユニットを上記信号対マスキン
グ比のオフセット値の計算から除去し、残りのユニット
の上記正数化された信号対マスキング比と、上記信号対
マスキング比の１ステップ当たりの減少量と、上記ビッ
ト割り当てに利用できる利用可能なビット数に基づい
て、上記信号対マスキング比のオフセット値の計算に関
係するすべてのユニットの信号対マスキング比が最終的
な信号対マスキング比のオフセット値より高くなるま
で、上記信号対マスキング比のオフセット値を反復的に
再計算し、このことによって、負のビット数の割り当て
を生じさせないことを保証することを特徴とする。

【００２７】また、上記オーディオ符号化のための動的
ビット割り当て装置においては、好ましくは、上記帯域
幅計算手段は、上記帯域幅を、所定のユニットから、上
記信号対マスキング比のオフセット値より小さい上記信
号対マスキング比を有するユニットが連続して存在する
時に、上記連続したユニットを除去することによって計
算し、上記除去されたユニットに対応するビット数を上
記利用可能なビット数に加算することにより上記利用可
能なビット数を更新し、上記信号対マスキング比のオフ
セット値を更新するときに、上記更新された利用可能な
ビット数に基づいて実行されることを特徴とする。

【００２８】さらに、上記オーディオ符号化のための動
的ビット割り当て装置においては、好ましくは、上記サ
ンプルビット数計算手段の処理において、上記各ユニッ
トのサンプルビット数は、上記各ユニットの信号対マス
キング比から上記信号対マスキング比のオフセット値を
減算した値を、上記信号対マスキング比の１ステップ当
たりの減少量で除算した後、その除算結果値を整数化し
た値であり、上記サンプルビット数計算手段は、上記信
号対マスキング比のオフセット値より低い信号対マスキ
ング比を有するユニットに対して、ビットを割り当てな
いことを特徴とする。

【００２９】またさらに、上記オーディオ符号化のため
の動的ビット割り当て装置においては、好ましくは、上
記残りのビット割り当て手段は、上記残りのビット数を
割り当てるための所定の第１と第２のパスの処理を実行
し、上記第１のパスの処理において、上記信号対マスキ
ング比のオフセット値より大きい信号対マスキング比を
有するが上記サンプルビット数計算手段の処理における
整数化の結果としてビットを割り当てられなかったユニ
ットに１ビットを割り当て、上記第２のパスの処理にお
いて、最大ビット数ではないが複数のビット数が既に割
り当てられているユニットに対して１ビットを割り当て
ることを特徴とする。

【００３０】ここで、上記残りのビット割り当て手段
は、上記第１と第２のパスの処理において、好ましく
は、最高の周波数のユニットから最低の周波数のユニッ
トに向かってユニットを移動しながら実行することを特
徴とする。

【００３１】

【発明の実施の形態】本発明に係る一実施形態を図面を
参照しながら、説明する。

【００３２】図１は、本発明に係る一実施形態の動的ビ
ット割り当て処理を行う動的ビット割り当てモジュール
１０９を備えたＡＴＲＡＣ符号化器１００のブロック図
である。本実施形態は、図２１に図示された従来技術の
ＡＴＲＡＣ符号化器１００ａの動的ビット割り当てモジ
ュール１０９ａの代わりに、その動的ビット割り当て処
理が異なる動的ビット割り当てモジュール１０９を設け
たことを特徴としている。本実施形態の動的ビット割り
当て処理は、実施形態の一例してＡＴＲＡＣアルゴリズ
ムにおいて使用することによって以下において説明され
るが、本実施形態はまた他のオーディオ符号化アルゴリ
ズムに適用されることが可能である。

【００３３】本発明に係る実施形態は、スケールファク
タのインデックスを用いてすべてのユニットのピークエ
ネルギーを計算する処理と、ショートブロックのＭＤＣ
Ｔが使用されるときに絶対しきい値を調整する処理と、
ユニットのピークエネルギーを用いて高域側スロープの
マスキング効果値及び低域側スロープのマスキング効果
値を計算する処理と、すべてのユニットの信号対マスキ
ング比（signal-to-mask ratio、以下、ＳＭＲ値とい
う。）を計算する処理と、ＳＭＲ値を正にするようにダ
ミーのオフセット値をすべてのＳＭＲ値に加算する処理
と、ＳＭＲオフセット値を計算する処理と、帯域幅を計
算する処理と、各ユニットのＳＭＲ値とＳＭＲオフセッ
ト値に基づいて当該ユニットに割り当てられるサンプル
ビット数を計算する処理と、利用可能なビット数のうち
の残りのビットを幾つかの選択されたユニットに割り当
てる処理とを備える。

【００３４】すべてのユニットのピークエネルギーはそ
れらの最大のスペクトルのサンプルデータから決定され
る。これはそれらの対応するスケールファクタのインデ
ックスを使用することによって近似され、従って、対数
演算の使用を回避することができる。ピークエネルギー
は、信号対マスキング比を計算することと、簡単化され
た同時マスキングの絶対しきい値を検出するために使用
される。同時マスキングモデルの関数は、高域側スロー
プ及び低域側スロープによって近似される。ここで、あ
る周波数のスペクトル信号に対するモデル化されたマス
キング曲線において、当該スペクトル信号の周波数より
高い周波数領域のマスキング曲線を高域側スロープと呼
び、当該スペクトル信号の周波数より低い周波数領域の
マスキング曲線を低域側スロープと呼ぶ。高域側スロー
プのマスキング効果の勾配は−１０ｄＢ／Ｂａｒｋに仮
定され、低域側スロープのマスキング効果の勾配は２７
ｄＢ／Ｂａｒｋに仮定される。また、すべてのユニット
は、音声圧縮レベルがその聴覚特性を考慮せずに当該ユ
ニットのピークエネルギーによって表される１つのマス
クする音声信号（以下、マスカーともいう。）を有する
と仮定される。それぞれマスクする音声信号を有するユ
ニット（以下、マスクするユニットという。）と、それ
によってマスクされるその他の音声信号を有するユニッ
ト（以下、マスクされるユニットという。）とによって
生じるマスキング効果は、当該マスクされるユニットが
マスクする音声信号の各々よりも低い周波数領域又は高
い周波数領域のいずれかに設けられるかに依存する低域
側スロープの勾配又は高域側スロープの勾配と共に、当
該マスクするユニット内の最も大きい絶対しきい値と当
該マスクされるユニットの最も大きい絶対しきい値との
間の臨界帯域幅（バルク、Ｂａｒｋ）の単位で表現され
た最悪の場合の距離とから計算される。

【００３５】同時マスキング効果は、特定フレームの３
つのサブバンドのすべてがロングブロックモードのＭＤ
ＣＴによって変換されるときにだけ適用される。１つの
与えられたユニットのマスキング絶対しきい値は、当該
ユニットに対して演算される絶対しきい値、低域側マス
キング絶対しきい値及び高域側マスキング絶対しきい値
の中の最大値から選択される。そのような場合では、幾
つか又はすべてのサブバンドがショートブロックのＭＤ
ＣＴによって複数のスペクトルラインに変換されるとき
に、調整された絶対しきい値だけが使用される。その絶
対しきい値の調整は、時間及び周波数の分解能の変更の
ために必要とされる。例えば、１つのロングブロックの
ＭＤＣＴが４つの等しい時間長のショートブロックのＭ
ＤＣＴによって置き換えられると、４つのロングブロッ
クのユニットにわたる周波数間隔はここで、４つのショ
ートブロックのユニットによってカバーされる。従っ
て、４つのロングブロックのユニットから選択される最
小の絶対しきい値は、４つのショートブロックのユニッ
トの調整された絶対しきい値を表すために使用される。

【００３６】ビット割り当て手順はサンプルビットの割
り当てを高速にするために、ＳＭＲオフセット値を使用
する。全ユニットの元のＳＭＲ値がＳＭＲオフセット値
計算において使用される前に、当該全ユニットの元のＳ
ＭＲ値は、それらにダミーの正数値を加算することによ
って０より大きい値に増加される。これらの加算された
ＳＭＲ値と、１つの与えられたユニット内のスペクトル
ラインの本数や利用可能ビット数のような他のパラメー
タとを用いて、ＳＭＲオフセット値は計算されることが
できる。次いで、帯域幅はＳＭＲ値とＳＭＲオフセット
値から決定される。ＳＭＲオフセット値より高いＳＭＲ
値を有する当該帯域幅内のユニットだけがビットを割り
当てられる。ユニットに割り当てられるビット数を表す
サンプルビットの値は、ＳＭＲ値とＳＭＲオフセット値
との差を、ＳＭＲ減少ファクタ（又はＳＭＲ減少ステッ
プ量）で除算することによって計算される。当該ＳＭＲ
減少ファクタは、１つの量子化ビットの各インクリメン
ト値を有する線形量子化のｄＢ単位の信号対雑音比（si
gnal-to-noise ratio、以下、ＳＮＲという。）の改善
値に密接に関連し、６．０２ｄＢになるように設定され
る、小数点切り捨て整数化演算（integer truncation、
以下、整数化演算という。）は計算されたサンプルビッ
ト値に用いられ、また、上記サンプルビット値は１６ビ
ットの最大限界値に設定される。そのように、幾つかの
ビットが幾つかのユニットに割り当てられても、幾つか
のビットは残される。それらの残りのビットは２つのパ
スでＳＭＲオフセット値より高いＳＭＲ値を有するユニ
ットに再び割り当てられる。第１のパスは、０ビットの
割り当てが行われたユニットに対して２ビットを割り当
てる。第２のパスは、２ビット乃至１５ビットを割り当
てられたユニットに対して１ビットを割り当てる。この
ように、複数のユニットに対してビット割り当てが行わ
れる。

【００３７】すなわち、本実施形態の特徴は、従来技術
の動的ビット割り当て処理において複雑な計算を必要と
するマスキング効果の計算を、簡単化された同時マスキ
ング効果モデルを用いることによって簡潔に行うことで
ある。結果として、高音質でかつ計算量の少ない効率的
な動的ビット割り当て処理を行うことができる。

【００３８】図１において、動的ビット割り当てモジュ
ール１０９を除く他の処理ブロックは図２１の従来技術
の処理ブロックと同様に動作する。

【００３９】図２及び図３は、図１の動的ビット割り当
てモジュール１０９によって実行される動的ビット割り
当て処理を示すフローチャートである。まず最初に、図
２におけるステップＳ２０１の初期化処理では、すべて
のユニットｕ（ｕ＝０，１，２，…，ｕ_max−１）に割
り当てられるビット数を示すための索引であるワード長
インデックスWLindex[u]と、ビット割り当て処理等にお
いて使用される負のフラグnegflag[u]とを、それぞれ０
に初期化する。ここで、好ましくは、ｕ_max＝５２であ
る。

【００４０】次いで、ステップＳ２０２の絶対しきい値
ダウンロード処理では、静寂時のしきい値（threshold
in quiet）として知られる各ユニットの絶対しきい値
（absolute threshold）を、設定値qthreshold[u]にダ
ウンロードする。ここで、静寂時の絶対しきい値は、イ
ー・ツャイカー(E．Zwicker)ほかによる従来技術文献
「“音響心理学：事実とモデル（Psycoacoustics：Fact
s and Models）”，Springer-Verlag，１９９０年」に
よると、ちょうど可聴可能な純音の音圧レベルを周波数
の関数として示されている。ＭＰＥＧ１の音声標準規格
においては、静寂時のしきい値は、絶対しきい値とも呼
ばれる。静寂時のしきい値、静寂時の可聴しきい値及び
静寂時のマスキングしきい値は、すべての同一のものを
意味する。

【００４１】次に、ステップＳ２０３のショートブロッ
クのための絶対しきい値調整処理では、ショートブロッ
クモードが活性化されるか否かに依存して、当該特定の
周波数帯域の絶対しきい値をその結果に応じて調整す
る。次いで、ステップＳ２０４のピークエネルギー計算
処理では、すべてのユニットｕ（ｕ＝０，１，２，…，
ｕ_max−１）におけるピークエネルギーpeak_energy[u]
を次式を用いて計算する。

【００４２】

【数１】 peak_energy[u] ＝10×log₁₀（max_spectral_amplitude[u]）² ［ｄ
Ｂ］ ≒１０×log₁₀（scale_factor[u]）² ＝（sfindex[u]−15）×2.006866638，

【００４３】ここで、ｕ＝０，１，２，…，ｕ_max−１数１から明らかなように、各ユニットｕに対するピーク
エネルギーpeak_energy[u]の計算は、当該ユニットｕ内
で最も大きいスペクトル係数の振幅値max_spectral_amp
litude[u]を、それに対応するスケールファクタscale_f
actor[u]と置換することによって近似される。スケール
ファクタscale_factor[u]は、当該ユニットｕ内で最も
大きいスペクトルの振幅値max_spectral_amplitude[u]
より大きい値の中で最も小さい値となるように、次表の
スケールファクタテーブルから選択される。ＡＴＲＡＣ
アルゴリズムにおいては、スケールファクタテーブルは
６４個のスケールファクタからなり、６４個のスケール
ファクタは６ビットのスケールファクタインデックスsf
index[u]によってアドレス指定される。スケールファク
タテーブルは以下の表のように示される。

【００４４】

【表１】 ――――――――――――――――――――――――――――――――――― ６ビットのスケールファクタのインデックススケールファクタ sfindex[u] scale_factor[u] ―――――――――――――――――――――――――――――――――― ００．９９９９９９９９×２^-5 １０．６２９９６０５２×２^-4 ２０．７９３７００５２×２^-4 ３０．９９９９９９９９×２^-4 ４０．６２９９６０５２×２^-3 ５０．７９３７００５２×２^-3 ６０．９９９９９９９９×２^-3 ７０．６２９９６０５２×２^−２８０．７９３７００５２×２^−２９０．９９９９９９９９×２^-2 １００．６２９９６０５２×２^-1 １１０．７９３７００５２×２^-1 １２０．９９９９９９９９×２^-1 １３０．６２９９６０５２×２⁰ １４０．７９３７００５２×２⁰ １５０．９９９９９９９９×２⁰ １６０．６２９９６０５２×２¹ １７０．７９３７００５２×２¹ １８０．９９９９９９９９×２¹ １９０．６２９９６０５２×２² ２００．７９３７００５２×２² ―――――――――――――――――――――――――――――――――――

【００４５】

【表２】 ――――――――――――――――――――――――――――――――――― ６ビットのスケールファクタのインデックススケールファクタ sfindex[u] scale_factor[u] ――――――――――――――――――――――――――――――――――― ２１０．９９９９９９９９×２² ２２０．６２９９６０５２×２³ ２３０．７９３７００５２×２³ ２４０．９９９９９９９９×２³ ２５０．６２９９６０５２×２⁴ ２６０．７９３７００５２×２⁴ ２７０．９９９９９９９９×２⁴ ２８０．６２９９６０５２×２^５２９０．７９３７００５２×２^５３００．９９９９９９９９×２⁵ ３１０．６２９９６０５２×２⁶ ３２０．７９３７００５２×２⁶ ３３０．９９９９９９９９×２⁶ ３４０．６２９９６０５２×２⁷ ３５０．７９３７００５２×２⁷ ３６０．９９９９９９９９×２⁷ ３７０．６２９９６０５２×２⁸ ３８０．７９３７００５２×２⁸ ３９０．９９９９９９９９×２⁸ ４００．６２９９６０５２×２⁹ ―――――――――――――――――――――――――――――――――――

【００４６】

【表３】 ――――――――――――――――――――――――――――――――――― ６ビットのスケールファクタのインデックススケールファクタ sfindex[u] scale_factor[u] ――――――――――――――――――――――――――――――――――― ４１０．７９３７００５２×２⁹ ４２０．９９９９９９９９×２⁹ ４３０．６２９９６０５２×２¹⁰ ４４０．７９３７００５２×２¹⁰ ４５０．９９９９９９９９×２¹⁰ ４６０．６２９９６０５２×２¹¹ ４７０．７９３７００５２×２¹¹ ４８０．９９９９９９９９×２¹¹ ４９０．６２９９６０５２×２^１２５００．７９３７００５２×２^１２５１０．９９９９９９９９×２¹² ５２０．６２９９６０５２×２¹³ ５３０．７９３７００５２×２¹³ ５４０．９９９９９９９９×２¹³ ５５０．６２９９６０５２×２¹⁴ ５６０．７９３７００５２×２¹⁴ ５７０．９９９９９９９９×２¹⁴ ５８０．６２９９６０５２×２¹⁵ ５９０．７９３７００５２×２¹⁵ ６００．９９９９９９９９×２¹⁵ ６１０．６２９９６０５２×２¹⁶ ６２０．７９３７００５２×２¹⁶ ６３０．９９９９９９９９×２¹⁶ ――――――――――――――――――――――――――――――――

【００４７】効率的な本実施形態の実施のために対数演
算を行わないように、スケールファクタインデックスsf
index[u]は、ピークエネルギーpeak_energy[u]の計算を
簡単化するために使用される。０ｄＢのピークエネルギ
ーを生じさせるスケールファクタインデックスの値１５
は基準値として使用される。当該ピークエネルギーpeak
_energy[u]は、スケールファクタインデックスsfindex
[u]を基準値１５で減算し、当該減算結果値を定数２．
００６８６６６３８で乗算することによって計算され
る。当該定数は、スケールファクタインデックスsfinde
x[u]の１ステップ当たりのデシベル（ｄＢ）単位の平均
ピークエネルギーのインクリメント量を表す。

【００４８】図３のステップＳ２０５において、３つの
すべてのサブバンド（低域、中域及び高域）はロングブ
ロックであるか否かが判断され、ＹＥＳのときはステッ
プＳ２０６において、高域側スロープのマスキング効果
値計算処理が実行され、ステップＳ２０７において、低
域側スロープのマスキング効果値計算処理が実行された
後、ステップＳ２０８に進む。一方、ステップＳ２０５
においてＮＯであるときは、すぐにステップＳ２０８に
進む。すなわち、３つの周波数帯域のサブバンドのすべ
てがＭＤＣＴからのロングブロックデータを用いて符号
化されるとき、簡単化された同時マスキング（simplifi
ed simultaneous masking）時の絶対しきい値はステッ
プＳ２０６及びＳ２０７において演算することができ
る。マスクするユニットの拡散関数は、当該マスクする
ユニット自身の周波数とは異なる周波数におけるマスキ
ング効果の度合い（以下、マスキング効果値という。）
を定義する。当該マスキング効果値は、高域側スロープ
及び低域側スロープによって近似される。本実施形態に
おいて、高域側スロープは−１０ｄＢ／Ｂａｒｋになる
ように選択され、低域側スロープは２７ｄＢ／Ｂａｒｋ
になるように選択される。

【００４９】図１８は、図６及び図７の高域側スロープ
のマスキング効果値計算処理における高域側スロープの
マスキング効果値の計算をモデル化したグラフであっ
て、ピークエネルギー（ｄＢ）と臨界帯域幅（Ｂａｒ
ｋ）との関係を示したグラフである。また、図１９は、
図８及び図９の低域側スロープのマスキング効果値計算
処理における低域側スロープのマスキング効果値の計算
をモデル化したグラフであって、ピークエネルギー（ｄ
Ｂ）と臨界帯域幅（Ｂａｒｋ）との関係を示したグラフ
である。最悪の場合の近似を考慮して、マスクするユニ
ットにおけるマスクする音声信号は、高域側スロープの
マスキング効果の計算において使用されるとき、マスク
するユニット内の低域側のエッジで生じるように仮定さ
れる。これはまた、低域側スロープのマスキング効果の
計算に適用され、この場合は、マスクするユニットにお
けるマスクする音声信号はマスクするユニットの高域側
のエッジで生じるように仮定される。

【００５０】図３におけるステップＳ２０８のＳＭＲ値
計算処理では、すべてのユニットｕのＳＭＲ値smr[u]
は、次式を用いて計算される。

【００５１】

【数２】smr[u]＝peak_energy[u]−qthreshold[u]，

【００５２】ここで、u＝0，1，2，…，u_max−１次いで、ステップＳ２０９のビット数計算処理では、最
初に量子化すべき全帯域幅が５２個のユニットを有する
と仮定して、ビット割り当てのために利用可能ビット数
available_bitを、次式を用いて計算される。

【００５３】

【数３】 available_bit＝（sound_frame−4）×8−（52×10）

【００５４】ここで、sound_frameは音声フレームのサ
イズをバイトで表したものであり好ましくは２１２バイ
トである。数３において音声フレームsound_frameから
減算される４バイトは、３つのサブバンドのブロックモ
ードと、帯域インデックスamount[0]とを符号化するた
めに使用される。５２個のユニットのワード長インデッ
クス（４ビット）と、スケールファクタのインデックス
を含むサイド情報（６ビット）（１つのユニット当たり
計１０ビット）は、５２×１０個のビットによって符号
化される。

【００５５】次いで、ステップＳ２１０のＳＭＲ値正数
化処理では、ダミーの正数値をすべてのＳＭＲ値に加算
し、ステップＳ２１１のＳＭＲオフセット値計算処理に
おいては、ＳＭＲ値がＳＭＲオフセット値を計算するた
めに使用される前に、当該ＳＭＲ値を正の値にする。そ
して、ステップＳ２１２の帯域幅計算処理は量子化され
るべき帯域幅を計算する。次いで、ステップＳ２１３で
は、ＳＭＲオフセット値がサンプルビット計算処理にお
いて使用され、各ユニットに割り当てられるビット数を
表すサンプルビット数が計算される。次いで、ステップ
Ｓ２１４の残りのビット割り当て処理は、各ユニットの
ためのサンプルビット数を用いた余りのビットを、残り
の利用可能ビット数として幾つかの選択されたユニット
に割り当てる。

【００５６】以下に、上述されたメインルーチンの動的
ビット割り当て処理のサブルーチンであるステップＳ２
０３のショートブロックのための絶対しきい値調整処理
と、ステップＳ２０６の高域側スロープのマスキング効
果値計算処理と、ステップＳ２０７の低域側スロープの
マスキング効果値計算処理と、ステップＳ２１１のＳＭ
Ｒオフセット値計算処理と、ステップＳ２１２の帯域幅
計算処理と、ステップＳ２１３のサンプルビット計算処
理と、ステップＳ２１４の残りのビット割り当て処理と
をより詳細に説明する。

【００５７】図４及び図５は、図２のサブルーチンであ
るショートブロックのための絶対しきい値調整処理（Ｓ
２０３）を示すフローチャートである。実施形態のシス
テムでは、ショートブロックとロングブロックで１つの
ユニットがカバーする周波数領域が異なる。すなわち、
低域及び中域では、ロングブロックの４ユニットがショ
ートブロックの1ユニットに、また高域では、8ユニット
が１ユニットに対応する。このため、ロングブロックと
ショートブロックではユニットに対する絶対しきい値が
異なる。本実施形態では、ステップＳ２０２でロングブ
ロックに対する絶対しきい値を設定し、ステップＳ２０
３でショートブロックに対する絶対しきい値の調整を行
う。

【００５８】図４のステップＳ３０１では、まず最初
に、低域のＭＤＣＴデータが、ショートブロックか否か
をチェックされ、ショートブロックであればステップＳ
３０２に進み、ショートブロックでなければステップＳ
３０５に進む。ステップＳ３０２では、最小の絶対しき
い値を、同一の周波数間隔を有するが異なる時間フレー
ムに属する複数のユニットからなる１つのグループ内か
ら見つける。実施形態のシステムでは、ショートブロッ
クの場合、フレームを複数のタイムフレームに分割す
る。すなわち、低域及び中域では４つのタイムフレーム
に、また高域では８つのタイムフレームに分割する。従
って、ここでいうタイムフレームとは、同一の符号化フ
レームにおける異なったショートブロックをいう。次い
で、ステップＳ３０３では、これらのユニットの元のロ
ングブロックの絶対しきい値をそれぞれ、当該最小の絶
対しきい値によって置換し、ステップＳ３０４では、低
域内の全グループに対してステップＳ３０２及びＳ３０
３の各処理を実行したか否かを判断し、実行していれば
ステップＳ３０５に進み、実行していなければステップ
Ｓ３０２に戻る。ステップＳ３０２、Ｓ３０３及びＳ３
０４の各処理は、低域のサブバンドのすべてのグループ
が処理されるまで繰り返される。低域の絶対しきい値調
整処理と同様に、ステップＳ３０５乃至Ｓ３０８は中域
のサブバンドの全グループに対して絶対しきい値調整処
理を実行し、図５におけるステップＳ３０９乃至Ｓ３１
２は高域の全グループに対して絶対しきい値調整処理を
実行する。これらの処理の後、元のメインルーチンに戻
る。

【００５９】図６及び図７は、図２のサブルーチンであ
る高域側スロープのマスキング効果値計算処理（ステッ
プＳ２０６）を示すフローチャートである。図６におけ
るステップＳ４０１では、マスクするユニットu_mrを最
初のユニットで開始するように設定する。ここで、最初
のユニットとは、最も周波数の低いユニット（ｕ＝０）
をいい、また、最後のユニットとは、最も高い周波数の
ユニット（ｕ＝ｕ_max- ₁）をいう。次いで、ステップＳ
４０２では、マスクされるユニットu_mdを当該マスクす
るユニットu_mrの次に周波数がより高いユニット（ｕ_mr
＋１）で開始するように設定する。ステップＳ４０３で
は、当該マスクするユニットu_mrの臨界帯域幅値（以
下、バルク値という。）bark[u_mr]に依存するマスキン
グインデックスmask_indexを、次式の数４を用いて計算
する。

【００６０】

【数４】mask_index＝a＋(b×bark[u_mr])

【００６１】ここで、ａ及びｂは任意の定数であり、ba
rk[u_mr]はマスクするユニットu_mrの低域側の臨界帯域レ
ートの境界値である。また、バルクbarkは臨界帯域レー
トｚの単位を表す。周波数スケールから臨界帯域レート
への写像は、次式によって実行することができる。

【００６２】

【数５】 z[bark]＝13・tan^-1 (0.76f)＋3.5・tan^-1 (f／7.5)²

【００６３】ここで、ｆはｋＨｚ単位の周波数である。
次に、ステップＳ４０４では、現在のマスクされるユニ
ットu_mdに対して適用される高域側スロープのマスキン
グ効果値mask_effect_{(upper-slope)}を、次式を用いて計
算する。

【００６４】

【数６】mask_effect_{(upper-slope)}＝peak_energy[u_mr]
−mask_index−{(bark[u_md]−bark[u_mr])×10.0}

【００６５】ここで、bark[u_md]はマスクされるユニッ
トu_mdの高域側の臨界帯域レートの境界値であり、bark
[u_mr]はマスクするユニットu_mrの低域側の臨界帯域レー
トの境界値である。

【００６６】ステップＳ４０５では、高域側スロープの
マスキング効果値mask_effect_(uppe _r-slope)がすべての
ユニット内の最も低い絶対しきい値より大きく、かつ、
マスクされるユニットu_mdが最後のユニットよりも低い
周波数のユニット又は最後のユニットであるという分岐
条件を満たせば、図７のステップＳ４０６に進み、当該
分岐条件を満たさなければステップＳ４１０に進む。

【００６７】図７のステップＳ４０６では、高域側スロ
ープのマスキング効果値mask_effect_{(upper-slope)}がマ
スクされるユニットu_mdの絶対しきい値qthreshold[u_md]
より大きければステップＳ４０７に進み、ステップＳ４
０７においてマスクされるユニットu_mdの絶対しきい値q
threshold[u_md]を高域側スロープのマスキング効果値ma
sk_effect_{(upper-slope)}に設定した後ステップＳ４０８
に進む。一方、ステップＳ４０６において、高域側スロ
ープのマスキング効果値mask_effect_(upper-sl _ope)がマ
スクされるユニットu_mdの絶対しきい値qthreshold[u_md]
より大きくなければ直接にステップＳ４０８に進む。次
いで、ステップＳ４０８では、マスクされるユニットu
_mrを次に周波数がより高いユニット（ｕ_md＋１）にイン
クリメントして設定する。さらに、ステップＳ４０９で
は、現在のマスクされるユニットu_mdに対する高域側ス
ロープのマスキング効果値mask_effect_{(upper-slope)}を
上述の数６を用いて再度計算する。

【００６８】ステップＳ４０６乃至Ｓ４０９の処理は、
ステップＳ４０５において、高域側スロープのマスキン
グ効果値mask_effect_{(upper-slope)}が全ユニットの中で
最も低い絶対しきい値より小さくなり、又はマスクされ
るユニットｕ_mdが最後のユニットより大きく設定される
（分岐状況）まで、反復処理される。この分岐状況にな
ると（ステップＳ４０５でＮＯ）、図６のステップＳ４
１０において、マスクするユニットｕ_mrは次に周波数が
高いユニット（ｕ_mr＋１）に設定される。ステップＳ４
０２乃至Ｓ４１０の各処理は、ステップＳ４１１におい
てマスクするユニットu_mrが最後のユニットになるまで
反復処理される。マスクするユニットｕ_m _rが最後のユニ
ットになれば（ステップＳ４１１でＹＥＳ）、高域側ス
ロープのマスキング効果値計算処理を終了して、次い
で、メインルーチンのステップＳ２０７である低域側ス
ロープのマスキング効果値計算処理を実行する。

【００６９】図８及び図９は、図２のサブルーチンであ
る低域側スロープのマスキング効果値計算処理（ステッ
プＳ２０７）を示すフローチャートである。図８のステ
ップＳ５０１では、マスクするユニットu_mrを最後のユ
ニットで開始するように設定する。次いで、ステップＳ
５０２では、マスクされるユニットu_mdをマスクするユ
ニットu_mrのその次に周波数がより低いユニット（ｕ_mr
−１）で開始するように設定する。ステップＳ５０３で
は、高域側スロープのマスキング効果値計算処理と同様
に、マスキングインデックスmask_indexを上述の数４を
用いて計算する。次いで、ステップＳ５０４では、低域
側スロープのマスキング効果値mask_effect
_{(lower-slope)}を次式の数７を用いて計算する。

【００７０】

【数７】mask_effect_{(lower-slope)}＝peak_energy[u_mr]
−mask_index−{(bark[u_mr]−bark[u_md])×27.0}

【００７１】ここで、bark[u_md]はマスクされるユニッ
トu_mdの臨界帯域レートの低域側の境界値であり、bark
[u_mr]はマスクするユニットu_mrの臨界帯域レートの高域
側の境界値である。

【００７２】ステップＳ５０５では、低域側スロープの
マスキング効果値mask_effect_(lowe _r-slope)がマスクさ
れるすべてのユニットの最も低い絶対しきい値より大き
い、かつ、マスクされるユニットu_mdが最初のユニット
までのユニットであるという分岐条件を満たせば、図９
のステップＳ５０６に進み、当該分岐条件を満たさなけ
ればステップＳ５１０に進む。

【００７３】図９のステップＳ５０６では、低域側スロ
ープのマスキング効果値mask_effect_{(lower-slope)}を当
該マスクされるユニットｕ_mdの絶対しきい値qthreshold
[u_md]と比較し、低域側スロープのマスキング効果値mas
k_effect_{(lower-slope)}が絶対しきい値qthreshold[u_md]
より大きければ、ステップＳ５０７に進み、一方、大き
くなければステップＳ５０８に進む。ステップＳ５０７
では、マスクされるユニットu_mdの絶対しきい値qthresh
old[u_md]を低域側スロープのマスキング効果値mask_eff
ect_{(lower-slope)}に設定した後、ステップＳ５０８に進
む。

【００７４】ここで、絶対しきい値qthreshold[u_md]が
ステップＳ５０６及びＳ５０７の処理の前に、高域側ス
ロープのマスキング効果値mask_effect_{(upper-slope)}に
よって変更されているかもしれないことに注意すべきで
ある。それゆえ、最終的な処理結果は、マスクされるユ
ニットu_mdの絶対しきい値qthreshold[u_md]と、高域側ス
ロープのマスキング効果値mask_effect
_{(upper-slope)}と、低域側スロープのマスキング効果値m
ask_effect_{(lower-slope)}とから最も高い値を選択し
て、マスクされるユニットu_mdのマスキング絶対しきい
値qthreshold[u_md]のレベルを表す。

【００７５】一旦、現在のマスクされるユニットu_mdが
処理されると、ステップＳ５０８では、マスクするユニ
ットu_mrを次に周波数がより低いユニット（ｕ_mr−１）
にデクリメントする。次いで、ステップＳ５０９では、
新しい低域側スロープのマスキング効果値mask_effect
_{(lower-slope)}を上述の数７を用いて再度計算する。こ
こで、ステップＳ５０５乃至Ｓ５０９の各処理は、ステ
ップＳ５０５において、低域側スロープのマスキング効
果値mask_effect_{(lower-slope)}が最も低い絶対しきい値
より低くテストされるか、又はマスクされるユニットu
_mdが最初のユニットより小さく設定されるまで、反復さ
れる。そのような場合であってステップＳ５０５でＮＯ
であれば、図８のステップＳ５１０において、マスクす
るユニットu_mrが次に周波数がより低いユニット（ｕ_mr
−１）に設定される。ステップＳ５１１では、マスクす
るユニットu_mrが最初のユニットでなければ、ステップ
Ｓ５０２に戻る。ステップＳ５０２乃至Ｓ５１０の各処
理は、マスクするユニットu_m _rが最初のユニットとなる
まで反復される。ステップＳ５１１でＹＥＳのときは、
元のメインルーチンに戻る。

【００７６】図１０及び図１１は、図３のステップＳ２
１１におけるＳＭＲオフセット値計算処理のフローチャ
ートを示す。ステップＳ６０１乃至Ｓ６０４の各処理に
おいて、以下の数８乃至数１５を用いて初期ＳＭＲオフ
セット値が計算される。

【００７７】

【数８】abit＝{(smr[0]−smr_offset)／smrstep}×L
[0]＋{(smr[1]−smr_offset)／smrstep}×L[1]＋…＋
{(smr[u_max−1]−smr_offset)／smrstep}×L[u_max−1]

【００７８】ここで、abitはビット割り当てのために利
用できるビット数を表す利用可能ビット数を示し、tbit
は全ユニットのＳＭＲ値を満足するために必要とされる
全ビット数を表し、L[u]はユニットｕにおけるスペクト
ルラインの本数を表し、u_maxは全ユニット数を表し、sm
r[u]はユニットｕのＳＭＲ値を表し、smr_offsetはＳＭ
Ｒオフセット値を表し、smrstepはｄＢ単位の１つのサ
ンプルビットを割り当てるためのＳＭＲ減少ステップ量
を示す。

【００７９】ここで、次の数９のようにユニットｕに対
するパラメータｎ［ｕ］を定義すると、数８は数１０に
置き換えられ、全ユニットのＳＭＲ値を満足するために
必要とされる全ビット数tbitは数１１で表される。

【００８０】

【数９】n[u]＝L[u]／smrstep

【数１０】abit＝(smr[0]−smr_offset)×n[0]＋(smr
[1]−smr_offset)×n[1]＋…＋(smr[u_max−1]−smr_off
set)×n[u_max−1]

【数１１】tbit＝smr[0]×n[0]＋smr[1]×n[1]＋…＋sm
r[u_max−1]×n[u_max−1]

【００８１】よって、次式が成立し、ＳＭＲオフセット
値smr_offsetは数１３で計算される。

【００８２】

【数１２】tbit−abit＝smr_offset×n[0]＋smr_offset
×n[1]＋…＋smr_offset×n[u_max−1]

【数１３】smr_offset＝(tbit−abit)／(n[0]＋n[1]＋
…＋n[u_max−１］）

【００８３】ここで、次式を用いて変数ｎｓｕｍを定義
し、また、数１５を用いて変数dbitを定義する。

【００８４】

【数１４】nsum＝n[0]＋n[1]＋…＋n[u_max−1]

【数１５】dbit[u]＝smr[u]×n[u]

【００８５】このアプリケーションにおいては、ＳＭＲ
減少ステップ量smrstepは６．０２ｄＢになるように選
択される。この値は、線形量子化器に割り当てられる各
ビットのための近似された信号対雑音比（ＳＮＲ）の改
善値を表す。いくつかのユニットのＳＭＲ値がＳＭＲオ
フセット値smr_offsetより低い場合があり、このような
ことが生じると、それらのユニットは負のビット割り当
てを受ける場合がある。図１０及び図１１のステップＳ
６０５乃至ステップＳ６１４における一連の処理は、Ｓ
ＭＲオフセット値smr_offsetの計算に関連するそれらの
ユニットがＳＭＲオフセット値smr_offetより高いＳＭ
Ｒ値smr[u]を有することを保証する。このことは反復的
除去ループ処理によって達成される。

【００８６】図１０及び図１１は、図３のサブルーチン
であるＳＭＲオフセット値計算処理（Ｓ２１１）を示す
フローチャートである。図１０において、ステップＳ６
０１では、変数nsum及び変数tbitを０に初期化する。次
いで、ステップＳ６０２及びＳ６０３では、数９及び数
１１を用いて全ユニットに対するパラメータn[u]及びdb
it[u]を計算するとともに、数１４及び数１５を用いて
変数nsum及びtbitの各パラメータを予め計算する。次い
で、ステップＳ６０４では、ＳＭＲオフセット値smr_of
fsetの初期値を上述の数１３を用いて計算する。また、
ステップＳ６０５では、このＳＭＲオフセット値計算処
理が終了するか否かの判断基準となる負のカウンタneg_
counterを１に設定する。

【００８７】次いで，図１１のステップＳ６０６では、
負のカウンタneg_counterが０であるという終了条件を
満たすか否かを判断し、終了条件を満たせばＳＭＲオフ
セット値計算処理を終了して元のメインルーチンにおけ
る図３のステップＳ２１１に進み、終了条件を満たさな
ければステップＳ６０７に進む。ステップＳ６０７で
は、負のカウンタneg_counterを０に設定する。次い
で、ステップＳ６０８では、ステップＳ６０８乃至Ｓ６
１５の各処理をすべてのユニットに対して実行するため
にｕ≧u_maxという条件を満たすか否かを判断し、満たせ
ばステップＳ６０９に進み、満たさなければステップＳ
６１０に進む。ステップＳ６１０では、負のフラグnegf
lag[u]が０であるという条件を満たすか否かを判断し、
条件を満たさなければステップＳ６１５に進み、条件を
満たせば、ステップＳ６１１に進む。ステップ６１１で
は、ユニットｕのＳＭＲ値smr[u]をＳＭＲオフセット値
smr_offsetと比較し、ＳＭＲ値smr[u]がＳＭＲオフセッ
ト値smr_offsetに等しいか又は大きければステップＳ６
１５に進み、ＳＭＲ値smr[u]がＳＭＲオフセット値smr_
offsetより小さければステップＳ６１２に進む。次い
で、ステップＳ６１２では、ＳＭＲオフセット値smr_of
fsetより小さいＳＭＲ値smr[u]を有するユニットｕを識
別するために、ユニットｕの負のフラグnegflag[u]を１
に設定し、当該ユニットｕが新しいＳＭＲオフセット値
smr_offsetの計算に関係することを防止する。ステップ
Ｓ６１３では、負のカウンタneg_counterを１だけイン
クリメントして設定する。次いで、ステップＳ６１４で
は、数１１の変数tbitから、現在の変数tbitの値から所
望されない数dbit[u]＝smr[ｕ]×n[ｕ]を減算(又は除
去)することによって更新し、また、数１４の変数n[u]
の和を表す変数nsumから、現在の変数nsumの値から所望
されない変数n[ｕ]を減算(又は除去)することよって更
新する。この減算処理又は除去処理はユニットｕをＳＭ
Ｒオフセット値計算処理から除去することを意味する。
ここで、変数ｕはＳＭＲオフセット値計算に関係するこ
とを防止されるユニット番号、すなわち、ＳＭＲオフセ
ット値smr_offsetより小さいＳＭＲ値を有する除去され
るべきユニット番号を示す。次いで、ステップＳ６１５
において、ユニット番号ｕを１だけインクリメントして
設定して、ステップＳ６０８に戻る。

【００８８】ステップＳ６０８において、ステップＳ６
１０乃至Ｓ６１５の各処理をすべてのユニットについて
実行したと判断されれば、ステップＳ６０９に進む。ス
テップＳ６０９では、新しいＳＭＲオフセット値smr_of
fsetを上述の数１３を用いて計算し、ステップＳ６０６
に戻る。

【００８９】これらのステップにおいて、新しいＳＭＲ
オフセット値smr_offsetは、それが当該計算処理に関わ
る全ユニットのＳＭＲ値より小さくなるまで、上述され
た除去処理において繰り返し使用されて計算される。

【００９０】図１２及び図１３は、図３のサブルーチン
である帯域幅計算処理（Ｓ２１２）を示すフローチャー
トである。帯域幅インデックスamount[0]によって表さ
れるユニット数は、次の表において示される。

【００９１】

【表４】 ――――――――――――――――――――――――――――――――――― 帯域幅インデックスユニット名ユニット数 amount[0] ――――――――――――――――――――――――――――――――――― ０ユニット０,ユニット１,…,ユニット１９２０１ユニット０,ユニット１,…,ユニット２７２８２ユニット０,ユニット１,…,ユニット３１３２３ユニット０,ユニット１,…,ユニット３５３６４ユニット０,ユニット１,…,ユニット３９４０５ユニット０,ユニット１,…,ユニット４３４４６ユニット０,ユニット１,…,ユニット４７４８７ユニット０,ユニット１,…,ユニット５１５２ ―――――――――――――――――――――――――――――――――――

【００９２】図１２において、まず、ステップＳ７０１
では、変数ｉを最後のユニット番号である５１に設定す
る。次いで、ステップＳ７０２では、負のフラグnegfla
g[i]が１であるという条件を満たせば、ステップＳ７０
３に進み、条件を満たさなければステップＳ７０４に進
む。ステップＳ７０３では、変数ｉを１だけデクリメン
トして設定し、再びステップ７０２の処理を行う。すな
わち、ステップＳ７０１乃至Ｓ７０３において、負のフ
ラグnegflag[u]が１であるユニットがどれだけ連続して
いるかの個数が、最後のユニットｕ_max−１から開始し
て、負のフラグnegflag[u]が０のユニットｕに遭遇する
まで計数される。ステップＳ７０４では、計数値（５１
−ｉ）を、次式を用いて演算される整数値としてインデ
ックスｋに変換し、ステップＳ７０５に進む。

【００９３】

【数１６】k＝(integer){(51−i)／4}

【００９４】ここで、(integer)｛・｝は、整数化演算
を表す。帯域幅インデックスamount[0]はインデックス
ｋに依存して決定され、インデックスｋはステップＳ７
０５乃至Ｓ７０９において必要に応じて調整される。図
１３において、まず、ステップＳ７０５では、インデッ
クスｋは５以下であるという条件を満たせば、ステップ
Ｓ７０９に進み、満たさなければステップＳ７０６に進
む。ステップＳ７０６においては、さらにインデックス
ｋが７以下であるという条件により分岐され、当該分岐
条件を満たせば、ステップＳ７０７に進み、満たさなけ
ればステップＳ７０８に進む。ステップＳ７０７では、
帯域幅インデックスamount[0]を１に設定し、インデッ
クスｋを６に設定した後，ステップＳ７１０に進む。ス
テップＳ７０８では、帯域幅インデックスamount[0]を
０に設定し、インデックスｋを８に設定した後、ステッ
プＳ７１０に進む。ステップＳ７０９では、帯域幅イン
デックスamount[0]を７−ｋに設定した後、ステップＳ
７１０に進む。ステップＳ７１０では、利用可能ビット
数abitが、次式を用いて更新される。

【００９５】

【数１７】abit←abit＋(k×40)

【００９６】ここで、インデックスｋは、いくつのユニ
ットが帯域幅の決定において除去されるかの指標であ
り、除去されるユニットの実際の個数は（ｋ×４）個で
ある。除去されるすべてのユニットのためのワード長イ
ンデックスWLindex[u]（４ビット）及びスケールファク
タのインデックスsfindex[u]（６ビット）のサイド情報
からそれぞれ１０ビットが取り戻され、その分だけ他の
ユニットのために割り当てられることができることに注
意されたい。当該取り戻されたビットは、ステップＳ７
１０の上述の数１７において利用可能ビット数abitに加
えられる。

【００９７】次いで、ステップＳ７１１では、ＳＭＲオ
フセット値smr_offsetを上述の数１３を用いて再計算
し、ステップＳ７１２では、計算された帯域幅内の最も
大きいユニット番号をｕ'_maxとする。ステップＳ７１２
の処理を終了すると、当該帯域幅計算処理を終了し、元
のメインルーチンに戻り、図３のステップＳ２１３のサ
ンプルビット計算処理を行う。

【００９８】図１４及び図１５は、図３のサブルーチン
であるサンプルビット計算処理のフローチャートであ
る。図１４において、この処理では、ユニットに対する
ビット割り当ての処理を行う。まず、ステップＳ８０１
では、ユニット番号ｕに対して０を設定する。次いで、
ステップＳ８０２では、ｕ≧ｕ'_maxという終了条件を満
たせばステップＳ８１２に進み、終了条件を満たさなけ
ればステップＳ８０３に進む。ここで、帯域幅計算処理
において計算された帯域幅内の最も大きいユニット番号
をｕ'_maxとしている。ステップＳ８０３において、負の
フラグnegflag[u]＝０であるか否かが判断され、ＹＥＳ
ならばステップＳ８０４に進む一方、ＮＯであれば、図
１４のステップＳ８１１に進む。ステップＳ８０４で
は、各選択されたユニットに対するサンプルビットsamp
le_bitを計算するために次式を使用する。ここで、計算
された帯域幅内におけるユニットの個数をｕ’_maxとし
ている。

【００９９】

【数１８】sample_bit←(integer)｛(smr[u]−smr_offs
et)／smrstep｝

【０１００】ここで、(integer)｛・｝は、整数化演算
を示す。ユニットのスペクトルラインの１本当たりに割
り当てられるべきビット数を表すサンプルビットsample
_bitは、ステップＳ８０２乃至Ｓ８０４において示され
るように、帯域幅計算処理において計算された帯域幅内
に存在しかつ負のフラグnegflag[u]が０であるユニット
ｕに対して計算されるだけである。他のユニットには、
０個のサンプルビットsample_bitを返す。

【０１０１】ＳＭＲ値及びＳＭＲオフセット値を使用す
るビット割り当ての概念は、図２０において図示され
る。図２０は、図１４及び図１５のサンプルビット計算
処理におけるＳＭＲ値及びＳＭＲオフセット値を用いた
ビット割り当てをモデル化して示し、ＳＭＲ（ｄＢ）と
スペクトルライン数／ＳＭＲ減少ステップ量（ｄＢ−
１）との関係を表したグラフである。上述されたよう
に、ＳＭＲ減少ステップ量smrstepは６．０２ｄＢに設
定される。

【０１０２】ステップＳ８０４において、一旦、ユニッ
トに対してサンプルビットsample_bitが計算されると、
次いで、図１５のステップＳ８０５乃至８０９におい
て、サンプルビットsample_bitが許容範囲の外にあれば
幾つかの調整にかけられる。すなわち、ステップＳ８０
５では、サンプルビットsample_bitは２より小さいとい
う条件を満たすか否かを判断し、条件を満たせばステッ
プＳ８０６に進み、条件を満たさなければステップＳ８
０７に進む。ステップＳ８０６では、サンプルビットsa
mple_bitを０に設定し、ワード長インデックスWLindex
[u]を０に設定し、負のフラグnegflag[u]を２に設定し
た後、ステップＳ８１０に進む。一方、ステップＳ８０
７では、サンプルビットsample_bit[u]は１６以上であ
るという条件について判断され、条件を満たせば、ステ
ップＳ８０８に進み、条件を満たさなければ、ステップ
Ｓ８０９に進む。ステップＳ８０８では、サンプルビッ
トsample_bit[u]を１６に設定し、ワード長インデック
スWLindex[u]を１５に設定し、負のフラグnegflag[u]を
１に設定した後、ステップＳ８１０に進む。ステップＳ
８０９では、ワード長インデックスWLindex[u]をsample
_bit[u]−1の値に設定し、ステップＳ８１０に進む。

【０１０３】すなわち、ユニットｕのワード長インデッ
クスWLindex[u]及び負のフラグnegflag[u]が上記各処理
に沿って設定され、ユニットｕのサンプルビットsample
_bitが２より小さければ、負のフラグnegflag[u]は２に
設定される。ユニットｕのサンプルビットsample_bitが
１６より大きい又は等しければ、負のフラグnegflag[u]
は１に設定される。負のフラグnegflag[u]の設定は、図
３のステップＳ２１４の残りのビット割り当て処理にお
いて使用される。サンプルビットsample_bit[u]のワー
ド長インデックスWLindex[u]への写像は以下の表のよう
に示される。

【０１０４】

【表５】

【０１０５】次に、ステップＳ８１０では、利用可能ビ
ット数abitは、次式のように、ユニットｕのサンプルビ
ットsample_bitをスペクトルラインの本数L[u]で乗算し
た乗算値によって減少される。

【０１０６】

【数１９】abit←abit−(sample_bit×L[u])

【０１０７】次いで、ステップＳ８１１では、ユニット
ｕを１だけインクリメントして設定した後、ステップＳ
８０２の処理に戻る。全ユニットに対してステップＳ８
０３乃至Ｓ８１１の各処理が実行されると、ステップＳ
８０２からステップＳ８１２に進む。ステップＳ８１２
では、残りの利用可能ビット数abit’に対して、利用可
能な全ビット数から全ユニットに割り当てられるビット
数を減算した最終結果値であるabitの値が代入され、サ
ンプルビット計算処理を終了し、元のメインルーチンで
ある図３のステップＳ２１４に進む。

【０１０８】図１６及び図１７は、図３のサブルーチン
である残りのビット割り当て処理（Ｓ２１４）のフロー
チャートである。この処理は、利用可能な全ビット数か
ら、サンプルビット計算処理において計算された全ユニ
ットに割り当てられるべきビット数を減算した残りの利
用可能ビット数abit’を、さらに幾つかの選択されたユ
ニットに割り当てる処理であり、ここで、第１のパスで
は、ＳＭＲの値がＳＭＲオフセットより大きく、かつス
テップＳ２１３でビットが割り当てられなかったユニッ
トに対して２ビットの割り当て処理を行い、第２のパス
では追加の1ビットの割り当て処理を行う。いずれの残
りの利用可能ビット数abit’も、負のフラグnegflag[u]
の設定に基づいて選択されたユニットｕに割り当てられ
る。残りの利用可能ビット数abit’の存在は、整数化演
算と、サンプルビット計算処理において生じるサンプル
ビットの最大制限である１６ビットの飽和状態とに起因
する。残りのビットを割り当てるための２つのパスを使
用し、各パスにおいては、残りの利用可能ビット数abi
t’のビット割り当てはそれぞれ、ステップＳ９０１及
びステップＳ９０７において、計算された帯域幅内で最
も高い周波数のユニットから開始する。ステップＳ９０
１乃至Ｓ９０７の処理において、第１のパスのビット割
り当て処理が実行され、ステップＳ９０８乃至Ｓ９１４
の処理において、第２のパスのビット割り当て処理が実
行される。

【０１０９】まず、図１６の第１のパスにおいて、ステ
ップＳ９０１では、ユニットｕの初期値を、計算された
帯域幅内で最も高い周波数のユニットに設定する。次い
で、ステップＳ９０２では、ｕ＜０という終了条件を満
たすか否かが判断され、当該終了条件を満たせばステッ
プＳ９０８に進行して第２のパスの処理を開始し、当該
終了条件が満たされなければ、ステップＳ９０３の処理
を実行する。ステップＳ９０３では、負のフラグnegfla
g[u]が２であるという条件を満たせばステップＳ９０４
に進み、満たさなければステップＳ９０７に進む。次い
で、ステップＳ９０４では、残りの利用可能ビット数ab
it’はユニットｕにおけるスペクトルラインの本数L[u]
の２倍以上であるという条件を満たせば、ステップＳ９
０５に進み、満たさなければステップＳ９０７に進む。
さらに、ステップＳ９０５では、ユニットｕのワード長
インデックスWLindex[u]を１に設定し、次いで、ステッ
プＳ９０６では、残りの利用可能ビット数abit’を次式
を用いて計算して、ステップＳ９０７に進む。ステップ
Ｓ９０７では、ユニットｕを１だけデクリメントして設
定した後、ステップＳ９０２に戻る。

【０１１０】

【数２０】abit’←abit’−(2×L[u])

【０１１１】すなわち、負のフラグnegflag[u]が２であ
り（ユニットｕに割り当てられるビット数が０ビットの
場合）、かつ残りの利用可能ビット数abit’が、ユニッ
トｕにおけるスペクトルラインの本数L[u]の２倍より大
きい又は等しいという条件を満たせば、当該ユニットｕ
に対してそのスペクトルラインの本数L[u]の２倍と同数
のビット数が割り当てられ、残りの利用可能ビット数ab
it’は、ユニットｕにおけるスペクトルラインの本数L
[u]の２倍だけ減少される。

【０１１２】ステップＳ９０７では、ユニットｕを１だ
けデクリメントして設定し、再びステップＳ９０２の処
理を行い、処理すべきユニットが処理されれば、第２の
パスの開始ステップである図１７のステップＳ９０８に
進む。

【０１１３】次に、第１のパスと同様に、第２のパスの
ステップＳ９０８では、帯域幅内の最も高い周波数のユ
ニットから開始されるように、ユニットｕを設定する。
次いで、ステップＳ９０９では、ｕ＜０という終了条件
を満たすか否かが判断され、当該終了条件が満たされれ
ば、残りのビット割り当て処理を終了し、その結果、動
的ビット割り当て処理を終了する。当該終了条件が満た
されていなければ、ステップＳ９１０に進む。次いで、
ステップＳ９１０では、ユニットｕの負のフラグnegfla
g[u]が０であるという条件を満たせばステップＳ９１１
に進み、満たさなければステップＳ９１４に進む。ステ
ップＳ９１１では、利用可能ビット数abitがユニットｕ
のスペクトルラインの本数L[u]以上であるという条件を
満たせば、ステップＳ９１２に進み、条件を満たさなけ
ればステップＳ９１４に進む。さらに、ステップＳ９１
２では、ユニットｕのワード長インデックスWLindex[u]
を、現在のワード長インデックスWLindex[u]に１を加算
した値に更新し、次いで、ステップＳ９１３では、残り
の利用可能ビット数abit’を次式を用いて更新した後、
ステップＳ９１４に進む。

【０１１４】

【数２１】abit’←abit’−L[u]

【０１１５】ステップＳ９１４では、ｕを１だけデクリ
メントして設定し、次いで、ステップＳ９０９に戻る。
すなわち、負のフラグnegflag[u]が０であり（ユニット
ｕに割り当てられるビット数が２〜１５ビットの場
合）、かつ残りの利用可能ビット数abit’が、ユニット
ｕにおけるスペクトルラインの本数L[u]より大きい又は
等しいという条件を満たせば、当該ユニットｕに対して
そのスペクトルラインの本数と同数のビットがさらに割
り当てられ、残りの利用可能ビット数abit’は、ユニッ
トｕにおけるスペクトルラインの本数L[u]だけ減少され
る。以上のようにして、残りのビットが選択されたユニ
ットに割り当てられる。

【０１１６】以上説明したように、本発明に係る実施形
態によれば、ほとんどのディジタル音声圧縮システムに
使用可能であり、特にＡＴＡＲＣアルゴリズムにおいて
使用されると、非常に高品質な音質である音声を生成す
ることができ、非常に効果的でかつ効率的に動的にビッ
ト割り当てを行うことができる。また、当該ビット割り
当て処理は、従来技術に比較して簡単であって、本実施
形態のＡＴＲＡＣ符号化器１００をＬＳＩを用いて容易
に低コストのオーディオ符号器を実現することができ
る。

【０１１７】

【発明の効果】以上詳述したように、本発明に係るオー
ディオ符号化のための動的ビット割り当て方法によれ
ば、ディジタル音声信号の分割された複数のサンプルデ
ータを量子化するために使用されるビット数を決定する
オーディオ符号化のための動的ビット割り当て方法であ
って、上記複数のサンプルデータは、異なる周波数間隔
と異なる時間間隔との少なくとも一方を有する複数のユ
ニットにグループ化されてなり、上記異なる周波数間隔
は人間の聴覚特性の臨界帯域に基づいて決定され、上記
異なる時間間隔は第１の時間間隔と、上記第１の時間間
隔より長い第２の時間間隔とを含み、（ａ）静寂時に人
間が音を可聴可能か否かを表す所定の静寂時のしきい値
特性に基づいて、すべてのユニットの絶対しきい値を設
定する絶対しきい値設定ステップと、（ｂ）上記第１の
時間間隔を有するユニットの絶対しきい値を、同一の周
波数間隔を有する複数のユニットのうちの最小の絶対し
きい値によって置き換えることにより、上記第１の時間
間隔を有するユニットの絶対しきい値を調整する絶対し
きい値調整ステップと、（ｃ）上記複数のユニットにグ
ループ化された複数のサンプルデータに基づいて、上記
各ユニットのピークエネルギーを計算するピークエネル
ギー計算ステップと、（ｄ）すべてのユニットが第２の
時間間隔を有しているとき、所定の簡単化された同時マ
スキング効果モデルと、マスクするユニットのピークエ
ネルギーとに基づいて、上記簡単化された同時マスキン
グ効果モデルを用いたときの最小可聴限界であるマスキ
ング効果値を計算して各ユニットの絶対しきい値として
更新して設定するマスキング効果値計算ステップと、
（ｅ）上記計算された各ユニットのピークエネルギー
と、上記計算された各ユニットの絶対しきい値とに基づ
いて、各ユニットの信号対マスキング比を計算する信号
対マスキング比計算ステップと、（ｆ）量子化すべき全
帯域幅がすべてのユニットを含むと仮定して、上記ディ
ジタル音声信号のフレームのサイズに基づいて、ビット
割り当てに利用可能なビット数を計算する利用可能ビッ
ト数計算ステップと、（ｇ）所定の正数値をすべてのユ
ニットの上記信号対マスキング比に加算することによ
り、上記すべてのユニットの信号対マスキング比を正の
値にする信号対マスキング比正数化ステップと、（ｈ）
上記すべてのユニットの正数化された信号対マスキング
比と、所定の線形量子化器の１ビット当たりの信号対雑
音比の改善値に基づく信号対マスキング比の１ステップ
当たりの減少量と、上記利用可能なビット数とに基づい
て、上記すべてのユニットの正数化された信号対マスキ
ング比を減少させるためのオフセット値として定義され
る信号対マスキング比のオフセット値を計算する信号対
マスキング比オフセット値計算ステップと、（ｉ）上記
計算された信号対マスキング比のオフセット値と、上記
計算された各ユニットの信号対マスキング比とに基づい
て、ビット割り当てを行う必要のあるユニットをカバー
する帯域幅を計算し、上記計算された帯域幅に基づいて
上記信号対マスキング比のオフセット値を更新するよう
に計算する帯域幅計算ステップと、（ｊ）上記各ユニッ
トにおいて上記計算された信号対マスキング比から上記
計算された信号対マスキング比のオフセット値を減算し
て、各ユニットの減算された信号対マスキング比を計算
して、上記各ユニットの減算された信号対マスキング比
と、上記信号対マスキング比の１ステップ当たりの減少
量とに基づいて、量子化するときに各ユニットに割り当
てられるビット数を表すサンプルビット数を計算するサ
ンプルビット数計算ステップと、（ｋ）上記計算された
利用可能なビット数から上記計算されたすべてのユニッ
トに割り当てられるべきサンプルビット数の合計値を減
算した残りのビット数を、少なくとも、上記信号対マス
キング比のオフセット値より大きい信号対マスキング比
を有するユニットに割り当てる残りのビット割り当てス
テップとを含む。従って、本発明の方法は、ほとんどの
ディジタル音声圧縮システムに使用可能であり、特にＡ
ＴＡＲＣアルゴリズムにおいて使用されると、非常に高
品質な音質である音声を生成することができ、非常に効
果的でかつ効率的に動的にビット割り当てを行うことが
できる。また、当該ビット割り当て処理は、従来技術に
比較して簡単であって、本発明の符号化器をＬＳＩを用
いて容易に低コストのオーディオ符号器を実現すること
ができる。

【０１１８】また、本発明に係るオーディオ符号化のた
めの動的ビット割り当て装置によれば、ディジタル音声
信号の分割された複数のサンプルデータを量子化するた
めに使用されるビット数を決定するオーディオ符号化の
ための動的ビット割り当て装置であって、上記複数のサ
ンプルデータは、異なる周波数間隔と異なる時間間隔と
の少なくとも一方を有する複数のユニットにグループ化
されてなり、上記異なる周波数間隔は人間の聴覚特性の
臨界帯域に基づいて決定され、上記異なる時間間隔は第
１の時間間隔と、上記第１の時間間隔より長い第２の時
間間隔とを含み、（ａ）静寂時に人間が音を可聴可能か
否かを表す所定の静寂時のしきい値特性に基づいて、す
べてのユニットの絶対しきい値を設定する絶対しきい値
設定手段と、（ｂ）上記第１の時間間隔を有するユニッ
トの絶対しきい値を、同一の周波数間隔を有する複数の
ユニットのうちの最小の絶対しきい値によって置き換え
ることにより、上記第１の時間間隔を有するユニットの
絶対しきい値を調整する絶対しきい値調整手段と、
（ｃ）上記複数のユニットにグループ化された複数のサ
ンプルデータに基づいて、上記各ユニットのピークエネ
ルギーを計算するピークエネルギー計算手段と、（ｄ）
すべてのユニットが第２の時間間隔を有しているとき、
所定の簡単化された同時マスキング効果モデルと、マス
クするユニットのピークエネルギーとに基づいて、上記
簡単化された同時マスキング効果モデルを用いたときの
最小可聴限界であるマスキング効果値を計算して各ユニ
ットの絶対しきい値として更新して設定するマスキング
効果値計算手段と、（ｅ）上記計算された各ユニットの
ピークエネルギーと、上記計算された各ユニットの絶対
しきい値とに基づいて、各ユニットの信号対マスキング
比を計算する信号対マスキング比計算手段と、（ｆ）量
子化すべき全帯域幅がすべてのユニットを含むと仮定し
て、上記ディジタル音声信号のフレームのサイズに基づ
いて、ビット割り当てに利用可能なビット数を計算する
利用可能ビット数計算手段と、（ｇ）所定の正数値をす
べてのユニットの上記信号対マスキング比に加算するこ
とにより、上記すべてのユニットの信号対マスキング比
を正の値にする信号対マスキング比正数化手段と、
（ｈ）上記すべてのユニットの正数化された信号対マス
キング比と、所定の線形量子化器の１ビット当たりの信
号対雑音比の改善値に基づく信号対マスキング比の１ス
テップ当たりの減少量と、上記利用可能なビット数とに
基づいて、上記すべてのユニットの正数化された信号対
マスキング比を減少させるためのオフセット値として定
義される信号対マスキング比のオフセット値を計算する
信号対マスキング比オフセット値計算手段と、（ｉ）上
記計算された信号対マスキング比のオフセット値と、上
記計算された各ユニットの信号対マスキング比とに基づ
いて、ビット割り当てを行う必要のあるユニットをカバ
ーする帯域幅を計算し、上記計算された帯域幅に基づい
て上記信号対マスキング比のオフセット値を更新するよ
うに計算する帯域幅計算手段と、（ｊ）上記各ユニット
において上記計算された信号対マスキング比から上記計
算された信号対マスキング比のオフセット値を減算し
て、各ユニットの減算された信号対マスキング比を計算
して、上記各ユニットの減算された信号対マスキング比
と、上記信号対マスキング比の１ステップ当たりの減少
量とに基づいて、量子化するときに各ユニットに割り当
てられるビット数を表すサンプルビット数を計算するサ
ンプルビット数計算手段と、（ｋ）上記計算された利用
可能なビット数から上記計算されたすべてのユニットに
割り当てられるべきサンプルビット数の合計値を減算し
た残りのビット数を、少なくとも、上記信号対マスキン
グ比のオフセット値より大きい信号対マスキング比を有
するユニットに割り当てる残りのビット割り当て手段と
を備える。従って、本発明の装置は、ほとんどのディジ
タル音声圧縮システムに使用可能であり、特にＡＴＡＲ
Ｃアルゴリズムにおいて使用されると、非常に高品質な
音質である音声を生成することができ、非常に効果的で
かつ効率的に動的にビット割り当てを行うことができ
る。また、当該ビット割り当て処理は、従来技術に比較
して簡単であって、本発明の符号化器をＬＳＩを用いて
容易に低コストのオーディオ符号器を実現することがで
きる。

【図面の簡単な説明】

【図１】本発明に係る実施形態の動的ビット割り当て
処理を行う動的ビット割り当てモジュール１０９を備え
たＡＴＲＡＣ符号化器１００の構成を示すブロック図で
ある。

【図２】図１の動的ビット割り当てモジュール１０９
によって実行される動的ビット割り当て処理の第１の部
分を示すフローチャートである。

【図３】図１の動的ビット割り当てモジュール１０９
によって実行される動的ビット割り当て処理の第２の部
分を示すフローチャートである。

【図４】図２のサブルーチンであるショートブロック
のための絶対しきい値調整処理（Ｓ２０３）の第１の部
分を示すフローチャートである。

【図５】図２のサブルーチンであるショートブロック
のための絶対しきい値調整処理（Ｓ２０３）の第２の部
分を示すフローチャートである。

【図６】図２のサブルーチンである高域側スロープの
マスキング効果値計算処理（Ｓ２０６）の第１の部分を
示すフローチャートである。

【図７】図２のサブルーチンである高域側スロープの
マスキング効果値計算処理（Ｓ２０６）の第２の部分を
示すフローチャートである。

【図８】図２のサブルーチンである低域側スロープの
マスキング効果値計算処理（Ｓ２０７）の第１の部分を
示すフローチャートである。

【図９】図２のサブルーチンである低域側スロープの
マスキング効果値計算処理（Ｓ２０７）の第２の部分を
示すフローチャートである。

【図１０】図３のサブルーチンであるＳＭＲオフセッ
ト値計算処理（Ｓ２１１）の第１の部分を示すフローチ
ャートである。

【図１１】図３のサブルーチンであるＳＭＲオフセッ
ト値計算処理（Ｓ２１１）の第２の部分を示すフローチ
ャートである。

【図１２】図３のサブルーチンである帯域幅計算処理
（Ｓ２１２）の第１の部分を示すフローチャートであ
る。

【図１３】図３のサブルーチンである帯域幅計算処理
（Ｓ２１２）の第２の部分を示すフローチャートであ
る。

【図１４】図３のサブルーチンであるサンプルビット
計算処理（Ｓ２１３）の第１の部分を示すフローチャー
トである。

【図１５】図３のサブルーチンであるサンプルビット
計算処理（Ｓ２１３）の第２の部分を示すフローチャー
トである。

【図１６】図３のサブルーチンである残りのビット割
り当て処理（Ｓ２１４）の第１の部分を示すフローチャ
ートである。

【図１７】図３のサブルーチンである残りのビット割
り当て処理（Ｓ２１４）の第２の部分を示すフローチャ
ートである。

【図１８】図６及び図７の高域側スロープのマスキン
グ効果値計算処理における高域側スロープのマスキング
効果値の計算をモデル化したグラフであって、ピークエ
ネルギー（ｄＢ）と臨界帯域幅（Ｂａｒｋ）との関係を
示したグラフである。

【図１９】図８及び図９の低域側スロープのマスキン
グ効果値計算処理における低域側スロープのマスキング
効果値の計算をモデル化したグラフであって、ピークエ
ネルギー（ｄＢ）と臨界帯域幅（Ｂａｒｋ）との関係を
示したグラフである。

【図２０】図１４及び図１５のサンプルビット計算処
理におけるＳＭＲ値及びＳＭＲオフセット値を用いたビ
ット割り当てをモデル化して示したグラフであって、Ｓ
ＭＲ（ｄＢ）とスペクトルラインの本数／ＳＭＲ減少ス
テップ量（ｄＢ−１）との関係を示したグラフである。

【図２１】従来技術の動的ビット割り当て処理を行う
動的ビット割り当てモジュール１０９ａを備えたＡＴＲ
ＡＣ符号化器１００ａの構成を示すブロック図である。

【符号の説明】

１００…ＡＴＲＡＣ符号化器、１０１…ＱＭＦフィルタ、１０２…遅延器、１０３…ＱＭＦフィルタ、１０４…ブロックサイズ決定モジュール、１０５，１０６，１０７…ＭＤＣＴモジュール、１０８…スケール係数モジュール、１０９…動的ビット割り当てモジュール、１１０…量子化モジュール、１１１…ＱＭＦ分解フィルタモジュール、Ｓ２００…動的ビット割り当て処理、Ｓ２０３…ショートブロックのための絶対しきい値調整
処理、Ｓ２０４…ピークエネルギー計算処理、Ｓ２０６…高域側スロープのマスキング効果値計算処
理、Ｓ２０７…低域側スロープのマスキング効果値計算処
理、Ｓ２０８…ＳＭＲ計算処理、Ｓ２０９…ビット数計算処理、Ｓ２１１…ＳＭＲオフセット値計算処理、Ｓ２１２…帯域幅計算処理、Ｓ２１３…サンプルビット計算処理、Ｓ２１４…残りのビット割り当て処理。

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平６−244735（ＪＰ，Ａ) 特開平８−88567（ＪＰ，Ａ) 特開平６−242797（ＪＰ，Ａ) 特開平８−223050（ＪＰ，Ａ) 特開平６−242798（ＪＰ，Ａ) 特開平８−95598（ＪＰ，Ａ) 特開平８−167878（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H03M 3/00 - 11/00

Claims

(57)【特許請求の範囲】

【請求項１】ディジタル音声信号の分割された複数の
サンプルデータを量子化するために使用されるビット数
を決定するオーディオ符号化のための動的ビット割り当
て方法であって、上記複数のサンプルデータは、異なる周波数間隔と異な
る時間間隔との少なくとも一方を有する複数のユニット
にグループ化されてなり、上記異なる周波数間隔は人間
の聴覚特性の臨界帯域に基づいて決定され、上記異なる
時間間隔は第１の時間間隔と、上記第１の時間間隔より
長い第２の時間間隔とを含み、（ａ）静寂時に人間が音
を可聴可能か否かを表す所定の静寂時のしきい値特性に
基づいて、すべてのユニットの絶対しきい値を設定する
絶対しきい値設定ステップと、（ｂ）上記第１の時間間
隔を有するユニットの絶対しきい値を、同一の周波数間
隔を有する複数のユニットのうちの最小の絶対しきい値
によって置き換えることにより、上記第１の時間間隔を
有するユニットの絶対しきい値を調整する絶対しきい値
調整ステップと、（ｃ）上記複数のユニットにグループ
化された複数のサンプルデータに基づいて、上記各ユニ
ットのピークエネルギーを計算するピークエネルギー計
算ステップと、（ｄ）すべてのユニットが第２の時間間
隔を有しているとき、所定の簡単化された同時マスキン
グ効果モデルと、マスクするユニットのピークエネルギ
ーとに基づいて、上記簡単化された同時マスキング効果
モデルを用いたときの最小可聴限界であるマスキング効
果値を計算して各ユニットの絶対しきい値として更新し
て設定するマスキング効果値計算ステップと、（ｅ）上
記計算された各ユニットのピークエネルギーと、上記計
算された各ユニットの絶対しきい値とに基づいて、各ユ
ニットの信号対マスキング比を計算する信号対マスキン
グ比計算ステップと、（ｆ）量子化すべき全帯域幅がす
べてのユニットを含むと仮定して、上記ディジタル音声
信号のフレームのサイズに基づいて、ビット割り当てに
利用可能なビット数を計算する利用可能ビット数計算ス
テップと、（ｇ）所定の正数値をすべてのユニットの上
記信号対マスキング比に加算することにより、上記すべ
てのユニットの信号対マスキング比を正の値にする信号
対マスキング比正数化ステップと、（ｈ）上記すべての
ユニットの正数化された信号対マスキング比と、所定の
線形量子化器の１ビット当たりの信号対雑音比の改善値
に基づく信号対マスキング比の１ステップ当たりの減少
量と、上記利用可能なビット数とに基づいて、上記すべ
てのユニットの正数化された信号対マスキング比を減少
させるためのオフセット値として定義される信号対マス
キング比のオフセット値を計算する信号対マスキング比
オフセット値計算ステップと、（ｉ）上記計算された信
号対マスキング比のオフセット値と、上記計算された各
ユニットの信号対マスキング比とに基づいて、ビット割
り当てを行う必要のあるユニットをカバーする帯域幅を
計算し、上記計算された帯域幅に基づいて上記信号対マ
スキング比のオフセット値を更新するように計算する帯
域幅計算ステップと、（ｊ）上記各ユニットにおいて上
記計算された信号対マスキング比から上記計算された信
号対マスキング比のオフセット値を減算して、各ユニッ
トの減算された信号対マスキング比を計算して、上記各
ユニットの減算された信号対マスキング比と、上記信号
対マスキング比の１ステップ当たりの減少量とに基づい
て、量子化するときに各ユニットに割り当てられるビッ
ト数を表すサンプルビット数を計算するサンプルビット
数計算ステップと、（ｋ）上記計算された利用可能なビ
ット数から上記計算されたすべてのユニットに割り当て
られるべきサンプルビット数の合計値を減算した残りの
ビット数を、少なくとも、上記信号対マスキング比のオ
フセット値より大きい信号対マスキング比を有するユニ
ットに割り当てる残りのビット割り当てステップとを含
むことを特徴とするオーディオ符号化のための動的ビッ
ト割り当て方法。
【請求項２】上記ピークエネルギー計算ステップにお
いて、上記各ユニット内で上記最大のスペクトル係数の
振幅値を、所定のスケールファクタテーブルを用いて、
上記振幅値に対応するスケールファクタに置き換えて所
定の近似計算を行うことにより、各ユニットのピークエ
ネルギーを計算することを特徴とする請求項１記載のオ
ーディオ符号化のための動的ビット割り当て方法。
【請求項３】上記マスキング効果値計算ステップにお
いて、上記所定の簡単化された同時マスキング効果モデ
ルは、上記マスクするユニットより高域側のユニットの
音声信号をマスクするときに使用される高域側のマスキ
ング効果モデルと、上記マスクするユニットより低域側
のユニットの音声信号をマスクするときに使用される低
域側のマスキング効果モデルとを含み、上記マスクされるユニットの最終的に決定される絶対し
きい値には、上記設定されたマスクされるユニットの絶
対しきい値と、上記同時マスキング効果値とのうちの最
大値が設定されることを特徴とする請求項１記載のオー
ディオ符号化のための動的ビット割り当て方法。
【請求項４】上記信号対マスキング比計算ステップに
おいて、各ユニットの信号対マスキング比は、上記ユニ
ットのピークエネルギーから上記設定された絶対しきい
値を、デシベル（ｄＢ）単位で減算することによって計
算されることを特徴とする請求項１記載のオーディオ符
号化のための動的ビット割り当て方法。
【請求項５】上記信号対マスキング比オフセット値計
算ステップにおいて、上記信号対マスキング比のオフ
セット値は、すべてのユニットの上記正数化された信号対マスキング
比と、上記信号対マスキング比の１ステップ当たりの減
少量と、上記ビット割り当てに利用できる利用可能なビ
ット数に基づいて、初期の信号対マスキング比のオフセ
ット値を計算することと、上記計算された初期の信号対マスキング比のオフセット
値に基づいて所定の反復処理を行うことによって計算さ
れることを特徴とする請求項１記載のオーディオ符号化
のための動的ビット割り当て方法。
【請求項６】上記反復処理は、上記初期信号対マスキング比のオフセット値より低い信
号対マスキング比を有するユニットを上記信号対マスキ
ング比のオフセット値の計算から除去し、残りのユニットの上記正数化された信号対マスキング比
と、上記信号対マスキング比の１ステップ当たりの減少
量と、上記ビット割り当てに利用できる利用可能なビッ
ト数に基づいて、上記信号対マスキング比のオフセット
値の計算に関係するすべてのユニットの信号対マスキン
グ比が最終的な信号対マスキング比のオフセット値より
高くなるまで、上記信号対マスキング比のオフセット値
を反復的に再計算し、このことによって、負のビット数
の割り当てを生じさせないことを保証することを特徴と
する請求項５記載のオーディオ符号化のための動的ビッ
ト割り当て方法。
【請求項７】上記帯域幅計算ステップにおいて、上記
帯域幅は、所定のユニットから、上記信号対マスキング
比のオフセット値より小さい上記信号対マスキング比を
有するユニットが連続して存在する時に、上記連続した
ユニットを除去することによって計算され、上記除去されたユニットに対応するビット数は上記利用
可能なビット数に加算されて上記利用可能なビット数が
更新され、上記信号対マスキング比のオフセット値を更
新することは、上記更新された利用可能なビット数に基
づいて実行されることを特徴とする請求項１記載のオー
ディオ符号化のための動的ビット割り当て方法。
【請求項８】上記サンプルビット数計算ステップにお
いて、上記各ユニットのサンプルビット数は、上記各ユ
ニットの信号対マスキング比から上記信号対マスキング
比のオフセット値を減算した値を、上記信号対マスキン
グ比の１ステップ当たりの減少量で除算した後、その除
算結果値を整数化した値であり、上記信号対マスキング比のオフセット値より低い信号対
マスキング比を有するユニットに対して、ビットを割り
当てないことを特徴とする請求項１記載のオーディオ符
号化のための動的ビット割り当て方法。
【請求項９】上記残りのビット割り当てステップにお
いて、上記残りのビット数を割り当てるための所定の第
１と第２のパスの処理を実行し、上記第１のパスの処理は、上記信号対マスキング比のオ
フセット値より大きい信号対マスキング比を有するが上
記サンプルビット数計算ステップにおける整数化の結果
としてビットを割り当てられなかったユニットに１ビッ
トを割り当て、上記第２のパスの処理は、最大ビット数ではないが複数
のビット数が既に割り当てられているユニットに対して
１ビットを割り当てることを特徴とする請求項１記載の
オーディオ符号化のための動的ビット割り当て方法。
【請求項１０】上記残りのビット割り当てステップに
おいて、上記第１と第２のパスの処理は、最高の周波数
のユニットから最低の周波数のユニットに向かってユニ
ットを移動しながら実行されることを特徴とする請求項
９記載のオーディオ符号化のための動的ビット割り当て
方法。
【請求項１１】ディジタル音声信号の分割された複数
のサンプルデータを量子化するために使用されるビット
数を決定するオーディオ符号化のための動的ビット割り
当て装置であって、上記複数のサンプルデータは、異なる周波数間隔と異な
る時間間隔との少なくとも一方を有する複数のユニット
にグループ化されてなり、上記異なる周波数間隔は人間
の聴覚特性の臨界帯域に基づいて決定され、上記異なる
時間間隔は第１の時間間隔と、上記第１の時間間隔より
長い第２の時間間隔とを含み、（ａ）静寂時に人間が音
を可聴可能か否かを表す所定の静寂時のしきい値特性に
基づいて、すべてのユニットの絶対しきい値を設定する
絶対しきい値設定手段と、（ｂ）上記第１の時間間隔を
有するユニットの絶対しきい値を、同一の周波数間隔を
有する複数のユニットのうちの最小の絶対しきい値によ
って置き換えることにより、上記第１の時間間隔を有す
るユニットの絶対しきい値を調整する絶対しきい値調整
手段と、（ｃ）上記複数のユニットにグループ化された
複数のサンプルデータに基づいて、上記各ユニットのピ
ークエネルギーを計算するピークエネルギー計算手段
と、（ｄ）すべてのユニットが第２の時間間隔を有して
いるとき、所定の簡単化された同時マスキング効果モデ
ルと、マスクするユニットのピークエネルギーとに基づ
いて、上記簡単化された同時マスキング効果モデルを用
いたときの最小可聴限界であるマスキング効果値を計算
して各ユニットの絶対しきい値として更新して設定する
マスキング効果値計算手段と、（ｅ）上記計算された各
ユニットのピークエネルギーと、上記計算された各ユニ
ットの絶対しきい値とに基づいて、各ユニットの信号対
マスキング比を計算する信号対マスキング比計算手段
と、（ｆ）量子化すべき全帯域幅がすべてのユニットを
含むと仮定して、上記ディジタル音声信号のフレームの
サイズに基づいて、ビット割り当てに利用可能なビット
数を計算する利用可能ビット数計算手段と、（ｇ）所定
の正数値をすべてのユニットの上記信号対マスキング比
に加算することにより、上記すべてのユニットの信号対
マスキング比を正の値にする信号対マスキング比正数化
手段と、（ｈ）上記すべてのユニットの正数化された信
号対マスキング比と、所定の線形量子化器の１ビット当
たりの信号対雑音比の改善値に基づく信号対マスキング
比の１ステップ当たりの減少量と、上記利用可能なビッ
ト数とに基づいて、上記すべてのユニットの正数化され
た信号対マスキング比を減少させるためのオフセット値
として定義される信号対マスキング比のオフセット値を
計算する信号対マスキング比オフセット値計算手段と、
（ｉ）上記計算された信号対マスキング比のオフセット
値と、上記計算された各ユニットの信号対マスキング比
とに基づいて、ビット割り当てを行う必要のあるユニッ
トをカバーする帯域幅を計算し、上記計算された帯域幅
に基づいて上記信号対マスキング比のオフセット値を更
新するように計算する帯域幅計算手段と、（ｊ）上記各
ユニットにおいて上記計算された信号対マスキング比か
ら上記計算された信号対マスキング比のオフセット値を
減算して、各ユニットの減算された信号対マスキング比
を計算して、上記各ユニットの減算された信号対マスキ
ング比と、上記信号対マスキング比の１ステップ当たり
の減少量とに基づいて、量子化するときに各ユニットに
割り当てられるビット数を表すサンプルビット数を計算
するサンプルビット数計算手段と、（ｋ）上記計算され
た利用可能なビット数から上記計算されたすべてのユニ
ットに割り当てられるべきサンプルビット数の合計値を
減算した残りのビット数を、少なくとも、上記信号対マ
スキング比のオフセット値より大きい信号対マスキング
比を有するユニットに割り当てる残りのビット割り当て
手段とを備えたことを特徴とするオーディオ符号化のた
めの動的ビット割り当て装置。
【請求項１２】上記ピークエネルギー計算手段は、上
記各ユニット内で上記最大のスペクトル係数の振幅値
を、所定のスケールファクタテーブルを用いて、上記振
幅値に対応するスケールファクタに置き換えて所定の近
似計算を行うことにより、各ユニットのピークエネルギ
ーを計算することを特徴とする請求項１１記載のオーデ
ィオ符号化のための動的ビット割り当て装置。
【請求項１３】上記マスキング効果値計算手段の処理
において、上記所定の簡単化された同時マスキング効果
モデルは、上記マスクするユニットより高域側のユニッ
トの音声信号をマスクするときに使用される高域側のマ
スキング効果モデルと、上記マスクするユニットより低
域側のユニットの音声信号をマスクするときに使用され
る低域側のマスキング効果モデルとを含み、上記マスキング効果値計算手段は、上記マスクされるユ
ニットの最終的に決定される絶対しきい値に、上記絶対
しきい値設定手段によって設定された上記マスクされる
ユニットの絶対しきい値と、上記同時マスキング効果モ
デルによって決められた同時マスキング効果値とのうち
の最大値を設定することを特徴とする請求項１１記載の
オーディオ符号化のための動的ビット割り当て装置。
【請求項１４】上記信号対マスキング比計算手段は、
各ユニットの信号対マスキング比を、上記ユニットのピ
ークエネルギーから上記設定された絶対しきい値をデシ
ベル（ｄＢ）単位で減算することによって計算すること
を特徴とする請求項１１記載のオーディオ符号化のため
の動的ビット割り当て装置。
【請求項１５】上記信号対マスキング比オフセット値
計算手段は、上記信号対マスキング比のオフセット値を
計算するときに、すべてのユニットの上記正数化された信号対マスキング
比と、上記信号対マスキング比の１ステップ当たりの減
少量と、上記ビット割り当てに利用できる利用可能なビ
ット数に基づいて、初期の信号対マスキング比のオフセ
ット値を計算し、上記計算された初期の信号対マスキング比のオフセット
値に基づいて所定の反復処理を行うことを特徴とする請
求項１１記載のオーディオ符号化のための動的ビット割
り当て装置。
【請求項１６】上記反復処理は、上記初期信号対マスキング比のオフセット値より低い信
号対マスキング比を有するユニットを上記信号対マスキ
ング比のオフセット値の計算から除去し、残りのユニットの上記正数化された信号対マスキング比
と、上記信号対マスキング比の１ステップ当たりの減少
量と、上記ビット割り当てに利用できる利用可能なビッ
ト数に基づいて、上記信号対マスキング比のオフセット
値の計算に関係するすべてのユニットの信号対マスキン
グ比が最終的な信号対マスキング比のオフセット値より
高くなるまで、上記信号対マスキング比のオフセット値
を反復的に再計算し、このことによって、負のビット数
の割り当てを生じさせないことを保証することを特徴と
する請求項１５記載のオーディオ符号化のための動的ビ
ット割り当て装置。
【請求項１７】上記帯域幅計算手段は、上記帯域幅
を、所定のユニットから、上記信号対マスキング比のオ
フセット値より小さい上記信号対マスキング比を有する
ユニットが連続して存在する時に、上記連続したユニッ
トを除去することによって計算し、上記除去されたユニットに対応するビット数を上記利用
可能なビット数に加算することにより上記利用可能なビ
ット数を更新し、上記信号対マスキング比のオフセット
値を更新するときに、上記更新された利用可能なビット
数に基づいて実行されることを特徴とする請求項１１記
載のオーディオ符号化のための動的ビット割り当て装
置。
【請求項１８】上記サンプルビット数計算手段の処理
において、上記各ユニットのサンプルビット数は、上記
各ユニットの信号対マスキング比から上記信号対マスキ
ング比のオフセット値を減算した値を、上記信号対マス
キング比の１ステップ当たりの減少量で除算した後、そ
の除算結果値を整数化した値であり、上記サンプルビット数計算手段は、上記信号対マスキン
グ比のオフセット値より低い信号対マスキング比を有す
るユニットに対して、ビットを割り当てないことを特徴
とする請求項１１記載のオーディオ符号化のための動的
ビット割り当て装置。
【請求項１９】上記残りのビット割り当て手段は、上
記残りのビット数を割り当てるための所定の第１と第２
のパスの処理を実行し、上記第１のパスの処理において、上記信号対マスキング
比のオフセット値より大きい信号対マスキング比を有す
るが上記サンプルビット数計算手段の処理における整数
化の結果としてビットを割り当てられなかったユニット
に１ビットを割り当て、上記第２のパスの処理において、最大ビット数ではない
が複数のビット数が既に割り当てられているユニットに
対して１ビットを割り当てることを特徴とする請求項１
１記載のオーディオ符号化のための動的ビット割り当て
装置。
【請求項２０】上記残りのビット割り当て手段は、上
記第１と第２のパスの処理において、最高の周波数のユ
ニットから最低の周波数のユニットに向かってユニット
を移動しながら実行することを特徴とする請求項１９記
載のオーディオ符号化のための動的ビット割り当て装
置。