JP2002534039A

JP2002534039A - オーディオエンコード装置において固定マスキング閾値を効果的に実現する装置及び方法

Info

Publication number: JP2002534039A
Application number: JP2000591609A
Authority: JP
Inventors: イン、リン
Original assignee: ソニーエレクトロニクスインク
Priority date: 1998-12-28
Filing date: 1999-12-15
Publication date: 2002-10-08
Also published as: CA2320169A1; US20020029143A1; US6418404B1; TW451059B; EP1145223A3; WO2000039787A2; EP1145223A2; WO2000039787A3; AU3125800A; KR20010040705A

Abstract

(57)【要約】オーディオエンコード装置（３１２）において、固定マスキング閾値を効率的に実現する装置及び方法を提供する。オーディオエンコード装置（３１２）は、ソースオーディオデータ（３１６）をフィルタリングし、周波数サブバンドを生成するフィルタバンク（３１８）と、周波数サブバンドに対応するマスキング閾値が格納されたルックアップテーブル（３２６）と、マスキング閾値を用いて、マスキングされるオーディオデータを識別及び削除して、処理すべきオーディオデータのデータ量を削減するビットアロケータ（３２２）と備える。

Description

【発明の詳細な説明】

【０００１】相互に参照される関連出願本発明は、１９９８年８月４日に出願され、係属中の米国特許出願番号０９／
１２８，９２４号「精密心理音響モデラを実現する装置及び方法（System And M
ethod For Implementing A Refined Psycho-Acoustic Modeler）」、１９９８年
９月９日に出願され、係属中の米国特許出願番号０９／１５０，１１７号「心理
音響モデラにおけるマスキング機能を効率的に実現する装置及び方法（System A
nd Method For Efficiently Implementing A Masking Function In A Psycho-Ac
oustic Modeler）」、及び出願の米国特許出願番号「オーディオデ
コード装置におけるアーチファクトを防止する装置及び方法（System and Metho
d For Preventing Artifacts In An Audio Decoder Device）」に関連し、これ
ら出願は、参照することにより本願に組み込まれるものとする。上述の関連出願
は共通の譲受人に譲渡されている。

【０００２】発明の背景１．発明の技術分野本発明は、信号処理装置（signal processing system）に関し、特に、オーデ
ィオデータエンコード装置において、固定のマスキング閾値を効果的に実現する
装置及び方法に関する。２．発明の背景技術近年の電子機器の設計者、製造業者、ユーザにとって、オーディオデータをエ
ンコードするための効果的且つ効率的な手法を実現することは、重要な課題であ
る。今日のデジタルオーディオ技術の発展に伴い、洗練された高性能なオーディ
オエンコード技術が必要とされている。例えば、録音可能なコンパクトディスク
装置の登場により、オーディオデータを受信して所定のフォーマット（例えばＭ
ＰＥＧ）にエンコードし、コンパクトディスク装置を用いて所定の媒体に記録す
ることを可能にするエンコーダ−デコーダ（コーデック）装置が必要とされてい
る。

【０００３】Ｆｉｇ．１は、エンコーダ−デコーダ（コーデック）装置１１０の具体的な構
成を示すブロック図である。Ｆｉｇ．１に示す具体例では、コーデック装置１１
０は、エンコーダ１１２と、デコーダ１１４とを備え、エンコーダ１１２は、心
理−音響モデラ（psycho-acoustic modeler：以下、ＰＡＭという。）１２６を
含んでいる。エンコード処理において、エンコーダ１１２には、互換性を有する
任意のオーディオソースから信号経路１１６を介して、ソースオーディオデータ
が供給され、エンコーダ１１２は、ソースオーディオデータを複数の周波数サブ
バンドにフィルタリングし、エンコードされたオーディオデータを生成し、この
エンコードされたオーディオデータを信号経路１３８を介して、（例えば、記録
可能なコンパクトディスク装置又はコンピュータ装置等の）オーディオ装置に供
給する。ＰＡＭ１２６の機能については、Ｆｉｇ．２を用いて説明する。

【０００４】Ｆｉｇ．２は、Ｆｉｇ．１に示すコーデック装置１１０用のマスキング閾値の
具体例であるグラフ２１０を示す図である。グラフ２１０において、縦軸２１２
は、オーディオデータの信号エネルギを示し、横軸２１４は、一連の周波数サブ
バンドを示す。実際の動作において、ＰＡＭ１２６には、ソースオーディオデー
タが供給され、ＰＡＭ１２６は、人間の聴覚特性を用いてマスキング閾値２２８
を生成する。エネルギの低い音の周波数と、エネルギの高い音の周波数が近接し
ている場合、人間の聴覚は、このエネルギの低い音を認識できないことが経験的
に知られている。

【０００５】例えば、第３のサブバンド２２０は、６０ｄＢの音２３２と、３０ｄＢの音２
３４を含み、この第３のサブバンド２２０におけるマスキング閾値２３０は３６
ｄＢに設定されている。３０ｄＢの音２３４は、マスキング閾値２３０以下の音
圧を有し、６０ｄＢの音２３２によるマスキング効果により、人間の聴覚には認
識されないものである。実際の動作では、エンコーダ１１２は、マスキング閾値
２２８以下の音を全て削除して、オーディオデータのデータ量を効果的に削減し
、エンコード処理の負担を軽減するようにしている。

【０００６】このように、ＰＡＭ１２６は、エンコーダ１１２によりエンコードされるべき
オーディオデータのデータ量を低減するための有用な情報を提供する。しかしな
がら、エンコーダ１１２内にＰＡＭ１２６を設けることにより、エンコーダ１１
２の構成が複雑になり、さらにエンコーダ１１２を駆動するために必要な電力が
およそ２倍になってしまう。Ｆｉｇ．１に示すコーデック装置１１０にＰＡＭ１
２６を設けると、そのコストと実現の難しさが非常に問題となる。したがって、
エンコードされたオーディオデータの品質を十分に確保しつつ、エンコード装置
を単純化することにより、装置の製造業者及びユーザに大きな利益をもたらす。
そこで、本発明は、上述の実情に鑑みてなされたものであり、オーディオエンコ
ード装置において、固定のマスキング閾値を効率的に実現する装置及び方法を提
供することを目的とする。

【０００７】発明の開示本発明に基づき、オーディオデコード−エンコード装置において、固定マスキ
ング閾値を効率的に実現する装置及び方法を開示する。本発明の一具体例におい
て、エンコード装置の設計者は、マスキング閾値ルックアップテーブルを初めに
生成する。マスキング閾値ルックアップテーブルには、マスキング閾値が格納さ
れており、マスキング閾値は、人間の絶対聴覚閾値に基づいて経験的に決定され
る。変形した具体例において、マスキング閾値は、絶対聴覚閾値を選択的に調整
して決定される。

【０００８】次に、エンコード装置内のフィルタバンクは、供給されるソースオーディオデ
ータを周波数サブバンドにフィルタリングし、フィルタリングされたオーディオ
データを生成してビットアロケータに供給する。ビットアロケータは、ルックア
ップテーブルに格納されたマスキング閾値を用いて、フィルタリングされたオー
ディオデータを分析する。具体的には、ビットアロケータは、ルックアップテー
ブルにおける固定マスキング閾値以下の全てのフィルタリングされたオーディオ
データをマスキングされるオーディオデータであると判定する。一方、ビットア
ロケータは、ルックアップテーブルにおける固定マスキング閾値以上の全てのフ
ィルタリングされたオーディオデータをマスキングされないオーディオデータで
あると判定する。

【０００９】ビットアロケータは、マスキングされるオーディオデータと判定したフィルタ
リングされたオーディオデータを削除し、これにより、エンコード装置により処
理されるフィルタリングされたオーディオデータのデータ量を効果的に削減する
。次に，ビットアロケータは、以前にマスキングされないオーディオデータであ
ると判定したフィルタリングされたオーディオデータに対して、使用可能な割当
ビットを割り当て、割当処理されたオーディオデータを生成して量子化器に供給
する。

【００１０】そして、量子化器は、割当処理されたオーディオデータを量子化し、この量子
化されたオーディオデータをビットストリームパッカに供給する。最後に、ビッ
トストリームパッカは、量子化されたオーディオデータをパックして、エンコー
ドされたオーディオデータを生成し、このエンコードされたオーディオデータを
適切な互換性を有する記録媒体に保存する。このように、本発明は、オーディオ
エンコード装置において、固定マスキング閾値を効果的及び効率的に実現する装
置及び方法を提供する。

【００１１】発明を実施するための最良の形態本発明は、信号処理装置（signal processing system）の改良に関する。以下
の説明により、当該分野の技術者は、本発明を実現し、使用することができ、ま
た、以下の説明は、特許出願及びその要件を満たすものである。当該分野の技術
者は、以下の好ましい実施の形態を容易に変更することができ、ここに説明する
包括的な原理は、他の実施の形態にも適用することができる。すなわち、本発明
は、以下の実施の形態に限定されるものではなく、ここに示す原理及び特徴に対
応する最も広い範囲を有するものである。

【００１２】本発明を適用したエンコード装置は、ソースオーディオデータをフィルタリン
グして周波数サブバンドを生成するフィルタバンクと、周波数サブバンドに対応
するマスキング閾値を格納したルックアップテーブルと、マスキング閾値を用い
て、マスキングされるオーディオデータを識別及び削除することにより、エンコ
ード装置により処理する必要があるオーディオデータのデータ量を削減するビッ
トアロケータとを備える。

【００１３】Ｆｉｇ．３は、本発明を適用したエンコーダ−デコーダ（コーデック）３１０
の具体的な構成を示すブロック図である。Ｆｉｇ．３に示す具体例においては、
コーデック３１０は、エンコーダ３１２と、デコーダ３１４とを備える。エンコ
ーダ３１２は、例えば、フィルタバンク３１８と、マスキング閾値のルックアッ
プテーブル３２６と、ビットアロケータ３２２と、量子化器３３２と、ビットス
トリームパッカ３３６とを備える。デコーダ３１４は、例えば、ビットストリー
ムアンパッカ３４４と、逆量子化器３４８と、フィルタバンク３５２とを備える
。

【００１４】Ｆｉｇ．３に示す具体例において、エンコーダ３１２とデコーダ３１４は、オ
ーディオマネージャと呼ばれるプログラムインストラクションの組に応答して動
作し、例えばプロセッサ（processor device、図示せず）によって実行される。
変形例として、エンコーダ３１２とデコーダ３１４を適切なハードウェアで実現
し、制御されるようにしてもよい。Ｆｉｇ．３に示す具体例では、特にデジタル
オーディオデータのエンコード処理及びデコード処理について説明するが、本発
明は、他の種類の電子情報の処理及び操作に対しても有効に利用できる。

【００１５】エンコード処理においては、エンコーダ３１２には、信号経路３１６を介して
、互換性を有する任意のオーディオソースからソースオーディオデータが供給さ
れる。Ｆｉｇ．３に示す具体例においては、信号経路３１６上のソースオーディ
データは、例えば線形パルスコード変調（linear pulse code modulation：以下
、ＬＰＣＭという。）フォーマットのデジタルオーディオデータである。エンコ
ーダ３１２は、例えば「フレーム」と呼ばれる単位で、ソースオーディオデータ
の１６ビットのデジタルサンプルを処理する。好ましい実施の形態においては、
各フレームは、１１５２個のサンプルから構成される。

【００１６】実際の動作において、フィルタバンク３１８は、ソースオーディオデータが供
給され、ソースオーディオデータを離散的な周波数サブバンドの組に分割し、フ
ィルタリングされたオーディオデータを生成する。Ｆｉｇ．３に示す具体例にお
いては、フィルタバンク３１８によりフィルタリングされたオーディオデータは
、例えば３２個の固有の又は分離された周波数サブバンドを含んでいる。そして
、フィルタバンク３１８は、フィルタリングされたオーディオデータ（サブバン
ド）を、信号経路３２０を介してビットアロケータ３２２に供給する。

【００１７】ビットアロケータ３２２は、信号経路３２８を介して、ルックアップテーブル
３２６における関連する情報にアクセスし、この情報に基づいて割当処理された
オーディオデータを生成し、信号経路３３０を介して、量子化器３３２に割当処
理されたオーディオデータを供給する。ビットアロケータ３２２は、フィルタバ
ンク３１８から供給される各サブバンドに含まれる信号を表すバイナリデジット
（ビット）を割り当てることによって、割当処理されたオーディオデータを生成
する。ルックアップテーブル３２６とビットアロケータ３２２の機能については
、Ｆｉｇ．５〜Ｆｉｇ．８を用いて後で詳細に説明する。

【００１８】つぎに、量子化器３３２は、割当処理されたオーディオデータを圧縮及びコー
ド化して量子化されたオーディオデータを生成し、この量子化されたオーディオ
データを、信号経路３３４を介してビットストリームパッカ３３６に供給する。
ビットストリームパッカ３３６は、量子化されたオーディオデータをパックして
、エンコードされたオーディオデータを生成し、このエンコードされたオーディ
オデータを、信号経路３３８を介してオーディオ装置（例えば、記録可能コンパ
クトディスク装置又はコンピュータ装置）に供給する。

【００１９】デコード処理においては、オーディオ装置から信号経路３４０を介して、エン
コードされたオーディオデータがビットストリームアンパッカ３４４に供給され
る。ビットストリームアンパッカ３４４は、このエンコードされたオーディオデ
ータをアンパックして量子化されたオーディオデータを生成し、この量子化され
たオーディオデータを、信号経路３４６を介して逆量子化器３４８に供給する。
逆量子化器３４８は、量子化されたオーディオデータを逆量子化し、逆量子化さ
れたオーディオデータを生成し、この逆量子化されたオーディオデータを、信号
経路３５０を介してフィルタバンク３５２に供給する。フィルタバンク３５２は
、逆量子化されたオーディオデータをフィルタリングし、デコードされたオーデ
ィオデータを生成し、このデコードされたオーディオデータを、信号経路３５４
を介してオーディオ再生装置（図示せず）に供給する。

【００２０】Ｆｉｇ．４は、本発明を適用したＦｉｇ．３に示すエンコーダ内のフィルタバ
ンク３１８の具体的な構成を示す図である。Ｆｉｇ．４に示す具体例において、
フィルタバンク３１８には、互換性を有するオーディオソースからソースオーデ
ィオデータが、信号経路３１６を介して供給される。フィルタバンク３１８は、
供給されるオーディオデータを一連の周波数サブバンドに分割し、各サブバンド
をビットアロケータ３２２に供給する。Ｆｉｇ．４に示す具体例において、フィ
ルタバンク３１８は、例えば３２個のサブバンド３２０（ａ）〜３２０（ｈ）を
生成する。なお、他の実施例としては、サブバンドの数は、３２より大きくても
小さくてもよい。

【００２１】Ｆｉｇ．５は、本発明に基づく、Ｆｉｇ．３に示すマスキング閾値のルックア
ップテーブル３２６の具体例を示す図である。この他の具体例として、ルックア
ップテーブル３２６は、他の適切で互換性を有するいかなるデータ構造を有して
いてもよい。Ｆｉｇ．５に示す具体例では、ルックアップテーブル３２６は、第
１の周波数５１２〜第Ｎの周波数５１８と、第１のマスキング閾値５２０〜第Ｎ
のマスキング閾値５２６とを格納している。Ｆｉｇ．５に示す具体例において、
第１〜第Ｎの周波数５１２〜５１８のそれぞれは、第１〜第Ｎのマスキング閾値
５２０〜５２６のそれぞれに対応している。例えば、第１の周波数５１２は、第
１のマスキング閾値５２０に対応し、第Ｎの周波数５１８は、第Ｎのマスキング
閾値５２６に対応している。

【００２２】Ｆｉｇ．５に示す具体例においては、周波数５１２〜５１８は、フィルタバン
ク３１８により生成された周波数サブバンドのそれぞれを表し、あるいはフィル
タバンク３１８により生成されたフィルタリングされたオーディオデータのそれ
ぞれの周波数を表すものである。実際の動作では、ビットアロケータ３２２は、
フィルタバンク３１８から供給されるフィルタリングされたオーディオデータに
含まれる特定の周波数又は周波数サブバンド５１２〜５１８を識別する。そして
、ビットアロケータ３２２は、ルックアップテーブル３２６を参照して、この特
定の周波数又は周波数サブバンドに対応するマスキング閾値５２０〜５２６にア
クセスする。

【００２３】そして、ビットアロケータ３２２は、マスキング閾値５２０〜５２６より小さ
いマスキングされるオーディオデータを（フィルタリングされたオーディオデー
タから）効果的に識別して、削除する。このように、マスキング閾値のルックア
ップテーブル３２６をエンコーダ３１２に設けることにより、マスキング閾値を
用いる利点を確保しながら、エンコーダ３１２全体を簡素化することができる。

【００２４】Ｆｉｇ．６は、本発明に基づく、絶対聴覚閾値（absolute hearing threshold
）６１６を示すグラフ６１０を示す図である。Ｆｉｇ．６において、グラフ６１
０の縦軸６１２は、オーディオデータの信号エネルギをデシベルで表すものであ
る。また、グラフ６１０の横軸６１４は、（フィルタバンク３１８により生成さ
れた）周波数サブバンドを表している。

【００２５】グラフ６１０において、絶対聴覚閾値６１６は、経験的に決定された人間の聴
覚の限界を表している。換言すれば、人間の聴覚は、絶対聴覚閾値６１６より低
いエネルギの音を感知することができない。本発明の選択された具体例において
は、ルックアップテーブル３２６（Ｆｉｇ．５）のマスキング閾値５２０〜５２
６は、絶対聴覚閾値６１６に基づいて規定されている。例えば、マスキング閾値
５２０〜５２６を絶対聴覚閾値６１６に略等しくなるようにしてもよい。

【００２６】また、本発明の他の具体例としては、絶対聴覚閾値６１６において選択された
セグメントを効果的に変更又は「チューニング」することにより、エンコーダ３
１２の性能を向上させることができる。例えば、選択されたより周波数の高いサ
ブバンドに対して、ルックアップテーブル３２６において、マスキング閾値の値
を絶対聴覚閾値６１６に示される閾値に対応する値より高い値に設定してもよい
。このような（選択されたより周波数の高いサブバンドに対する）ルックアップ
テーブル３２６のチューニングにより、エンコードされたオーディオデータの高
い音質を維持しながら、ビットアロケータ３２２による使用可能なビットの割当
処理を最適化することができる。

【００２７】Ｆｉｇ．７は、本発明に基づく、固定マスキング閾値の具体例であるグラフ７
１０を示す図である。グラフ７１０において、縦軸７１２は、オーディオデータ
の信号エネルギを表し、横軸７１４は、一連の周波数サブバンドを表している。
グラフ７１０は、本発明の原理を説明するものであり、グラフ７１０に示す各値
は、例示的なものである。本発明は、Ｆｉｇ．７に示すグラフ７１０における各
値とは異なる閾値でも機能し得ることは明らかである。

【００２８】Ｆｉｇ．７に示すグラフ７１０は、第１のサブバンド７１６〜第６のサブバン
ド７２６と、マスキング閾値７２８が示されており、マスキング閾値７２８は、
対応するサブバンド毎に変化している。実際の動作において、ビットアロケータ
３２２は、最初に、フィルタバンク３１８から第１のサブバンド７１６を受け取
り、次にルックアップテーブル３２６を参照して、対応するマスキング閾値７３
０にアクセスする。続いて、ビットアロケータ３２２は、第１のサブバンド７１
６においてマスキングされるオーディオデータ、すなわちマスキング閾値７３０
を下回るオーディオデータを識別し、第１のサブバンド７１６から削除する。

【００２９】次に、ビットアロケータ３２２は、第２のサブバンド７１８について、同様に
マスキング閾値７３２にアクセスし、これを利用してマスキングされるオーディ
オデータを識別及び削除する。ビットアロケータ３２２は、このようにして、現
在のフレームに関する処理が完了するまで、各サブバンドに関するマスキング閾
値にアクセスし、これに基づく処理を繰り返し実行する。以上の処理は、全ての
フレームに関する処理が完了するまで、エンコーダ３１２により、各フレーム毎
に繰り返される。

【００３０】Ｆｉｇ．８は、本発明に基づいて、マスキング閾値を効率的に実現するための
処理を示すフローチャートである。まず、ステップ８１２において、エンコーダ
３１２内のフィルタバンク３１８は、入力されたソースオーディオデータを周波
数サブバンドにフィルタリングし、フィルタリングされたオーディオデータをビ
ットアロケータ３２２に供給する。

【００３１】次に、ステップ８１４において、エンコーダ３１２の設計者は、マスキング閾
値のルックアップテーブル３２６を作成する。ルックアップテーブル３２６の内
容及び機能については、Ｆｉｇ．３及びＦｉｇ．５〜Ｆｉｇ．７を用いて説明し
たとおりである。続いて、ステップ８１６において、ビットアロケータ３２２は
、Ｆｉｇ．３及びＦｉｇ．５〜Ｆｉｇ．７を用いて説明したように、ルックアッ
プテーブル３２６に格納されている固定マスキング閾値を用いて、フィルタリン
グされたオーディオデータを分析する。具体的には、ビットアロケータ３２２は
、ルックアップテーブル３２６における固定マスキング閾値を下回る全てのフィ
ルタリングされたオーディオデータをマスキングされるオーディオデータである
と判定する。一方、ビットアロケータ３２２は、ルックアップテーブル３２６に
おける固定マスキング閾値以上の全てのフィルタリングされたオーディオデータ
をマスキングされないオーディオデータであると判定する。

【００３２】ステップ８１８において、ビットアロケータ３２２は、ステップ８１６におい
てマスキングされるオーディオデータであると判定したフィルタリングされたオ
ーディオデータを無視又は削除する。ステップ８２０において、ビットアロケー
タ３２２は、（以前のステップ８１６において）マスキングされないオーディオ
データでないと判定されているフィルタリングされたオーディオデータに対して
使用可能な全ての割当ビットを割り当て、割当処理されたオーディオデータを生
成して、量子化器３３２に供給する。本発明の一具体例において、ステップ８２
０におけるビットの割り当ては、出願の米国特許出願番号「オーデ
ィオデコード装置におけるアーチファクトを防止する装置及び方法（System and
Method For Preventing Artifacts In An Audio Decoder Device）」に開示さ
れている技術と同様の手法により実現してもよい。この出願は、参照することに
より本願に組み込まれるものとする。

【００３３】ステップ８２２において、量子化器３３２は、割当処理されたオーディオデー
タを量子化し、量子化されたオーディオデータを生成して、ビットストリームパ
ッカ３３６に供給する。最後に、ステップ８２４において、ビットストリームパ
ッカ３３６は、量子化されたオーディオデータをパックして、エンコードされた
オーディオデータを生成し、エンコードされたオーディオデータを適切な、互換
性がある記録媒体に保存する。

【００３４】本発明を最良の実施の形態を用いて説明した。以上の開示から、他の実施の形
態を想到することは、当該分野の技術者にとって容易である。例えば、本発明は
、上述の最良の実施の形態において述べた構成及び技術以外の構成及び技術を用
いても容易に実現することができる。さらに、本発明は、最良の実施の形態にお
いて述べた装置とは異なる装置に対しても効果的に適用することができる。した
がって、上述の最良の実施の形態及び変形例は、本発明の範囲の一部をなすもの
であり、本発明の範囲は、特許請求の範囲によってのみ制限されるものである。

【図面の簡単な説明】

【図１】Ｆｉｇ．１は、オーディオエンコード−デコード装置の具体的構成を示すブロ
ック図である。

【図２】Ｆｉｇ．２は、Ｆｉｇ．１に示すエンコード−デコード装置に用いられるマス
キング閾値の具体例を示す図である。

【図３】Ｆｉｇ．３は、本発明を適用したエンコード−デコード装置の構成を示すブロ
ック図である。

【図４】Ｆｉｇ．４は、Ｆｉｇ．３に示すエンコード−デコード装置のフィルタバング
の具体例を示す図である。

【図５】Ｆｉｇ．５は、Ｆｉｇ．３に示すマスキング閾値のルックアップテーブルの具
体例を示す図である。

【図６】Ｆｉｇ．６は、本発明に基づく、絶対聴覚閾値を示す図である。

【図７】Ｆｉｇ．７は、本発明に基づく、固定マスキング閾値の具体例を示す図である
。

【図８】Ｆｉｇ．８は、本発明に基づく、固定マスキング閾値を効率的に実現する処理
手順を示すフローチャートである。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ )，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＡ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷ

Claims

【特許請求の範囲】

【請求項１】ソースデータに対応するマスキング閾値を生成するデータ構造
体（３２６）と、上記マスキング閾値を参照して上記ソースデータをマスキングされないデータ
に変換するビット割当手段（３２２）とを備える情報処理装置。
【請求項２】上記データ構造体（３２６）及びビット割当手段（３２２）は
、上記ソースオーディオデータ（３１６）をエンコードされたオーディオデータ
（３３８）にエンコードするエンコーダ装置の一部であることを特徴とする請求
項１記載の情報処理装置。
【請求項３】上記ソースオーディオデータ（３１６）は、線形パルスコード
変調フォーマットで入力され、上記エンコード装置（３１２）によりＭＰＥＧフ
ォーマットのエンコードされたオーディオデータ（３３８）にエンコードされる
ことを特徴とする請求項２記載の情報処理装置。
【請求項４】上記エンコード装置（３１２）は、データサンプルからなる上
記オーディオデータ（３１６）の各フレームを連続的に処理することを特徴とす
る請求項２記載の情報処理装置。
【請求項５】上記各フレームが供給され、該各フレームについてサブバンド
を生成するフィルタバンク（３１８）を備えることを特徴とする請求項４記載の
情報処理装置。
【請求項６】上記サブバンドは、３２個の周波数サブバンドであることを特
徴とする請求項５記載の情報処理装置。
【請求項７】上記データ構造体（３２６）は、上記周波数サブバンドのそれ
ぞれに対応するマスキング閾値を格納するルックアップテーブルであることを特
徴とする請求項５記載の情報処理装置。
【請求項８】上記マスキング閾値は、信号エネルギを表し、該信号エネルギ
以下の上記フィルタリングされたオーディオデータ（３２０）は、上記ビット割
当手段（３２２）により処理されないことを特徴とする請求項７記載の情報処理
装置。
【請求項９】上記ルックアップテーブルに格納された上記マスキング閾値は
、人間の絶対聴覚閾値に基づいて調整できることを特徴とする請求項７記載の情
報処理装置。
【請求項１０】上記ビット割当手段（３２２）は、上記割り当てられたデー
タを量子化手段（３３２）に供給し、該量子化手段（３３２）は、該割り当てら
れたデータを量子化して、量子化されたデータ（３３４）をビットストリームパ
ック手段（３３６）に供給し、該ビットストリームパック手段（３３６）は、上
記エンコードされたオーディオデータ（３３８）を生成することを特徴とする請
求項２記載の情報処理装置。
【請求項１１】ソースデータに対応するマスキング閾値をデータ構造体（３
２６）から生成するステップと、ビット割当手段（３２２）により、上記ソースデータをマスキングされないデ
ータに変換するステップとを有する情報処理方法。
【請求項１２】上記データ構造体（３２６）及びビット割当手段（３２２）
は、上記ソースオーディオデータ（３１６）をエンコードされたオーディオデー
タ（３３８）にエンコードするエンコーダ装置の一部であることを特徴とする請
求項１１記載の情報処理方法。
【請求項１３】上記ソースオーディオデータ（３１６）は、線形パルスコー
ド変調フォーマットで入力され、上記エンコード装置（３１２）によりＭＰＥＧ
フォーマットのエンコードされたオーディオデータ（３３８）にエンコードされ
ることを特徴とする請求項１２記載の情報処理方法。
【請求項１４】上記エンコード装置（３１２）は、データサンプルからなる
上記オーディオデータ（３１６）の各フレームを連続的に処理することを特徴と
する請求項１２記載の情報処理方法。
【請求項１５】上記各フレームが供給され、該各フレームについてサブバン
ドを生成するフィルタバンク（３１８）を備えることを特徴とする請求項１４記
載の情報処理方法。
【請求項１６】上記サブバンドは、３２個の周波数サブバンドであることを
特徴とする請求項１５記載の情報処理方法。
【請求項１７】上記データ構造体（３２６）は、上記周波数サブバンドのそ
れぞれに対応するマスキング閾値を格納するルックアップテーブルであることを
特徴とする請求項１５記載の情報処理方法。
【請求項１８】上記マスキング閾値は、信号エネルギを表し、該信号エネル
ギ以下の上記フィルタリングされたオーディオデータ（３２０）は、上記ビット
割当手段（３２２）により処理されないことを特徴とする請求項１７記載の情報
処理方法。
【請求項１９】上記ルックアップテーブルに格納された上記マスキング閾値
は、人間の絶対聴覚閾値に基づいて調整できることを特徴とする請求項１７記載
の情報処理方法。
【請求項２０】上記ビット割当手段（３２２）は、上記割り当てられたデー
タを量子化手段（３３２）に供給し、該量子化手段（３３２）は、該割り当てら
れたデータを量子化して、量子化されたデータ（３３４）をビットストリームパ
ック手段（３３６）に供給し、該ビットストリームパック手段（３３６）は、上
記エンコードされたオーディオデータ（３３８）を生成することを特徴とする請
求項１２記載の情報処理方法。
【請求項２１】ソースデータに対応するマスキング閾値を生成するマスキン
グ閾値生成手段と、上記マスキング閾値を参照して上記ソースデータをマスキングされないデータ
に変換する変換手段とを備える情報処理装置。
【請求項２２】ソースデータに対応するマスキング閾値をデータ構造体（３
２６）から生成するステップと、ビット割当手段（３２２）により、上記ソース
データをマスキングされないデータに変換するステップとを実行して情報を処理
するプログラムインストラクションが格納されたコンピュータにより読取可能な
記録媒体。
【請求項２３】上記データ構造体からの上記マスキング閾値は、人間の聴覚
では感知できない音のエネルギ以下の絶対聴覚閾値に基づいて決定されることを
特徴とする請求項２２記載のコンピュータにより読取可能な記録媒体。
【請求項２４】上記マスキング閾値は、上記絶対聴覚閾値に対して選択的に
調整されることを特徴とする請求項２３記載のコンピュータにより読取可能な記
録媒体。
【請求項２５】上記マスキング閾値は、より高い周波数セグメントにおいて
、上記絶対聴覚閾値より高く調整されることを特徴とする請求項２４記載のコン
ピュータにより読取可能な記録媒体。
【請求項２６】上記ビット割当手段（３２２）は、上記データ構造体（３２
６）にアクセスして、上記ソースオーディオデータにおけるマスキング閾値を決
定し、該マスキング閾値より信号レベルが低いマスキングされるデータを削除す
ることを特徴とする請求項２２記載のコンピュータにより読取可能な記録媒体。
【請求項２７】上記データ構造体（３２６）及び上記ビット割当手段（３２
２）は、記録可能なコンパクトディスク装置内のエンコード装置の一部であるこ
とを特徴とする請求項２２記載のコンピュータにより読取可能な記録媒体。
【請求項２８】上記データ構造体（３２６）及び上記ビット割当手段（３２
２）は、オーディオ管理プログラムにより制御されることを特徴とする請求項２
２記載のコンピュータにより読取可能な記録媒体。
【請求項２９】上記オーディオ管理プログラムは、処理装置により処理され
ることを特徴とする請求項２８記載のコンピュータにより読取可能な記録媒体。