JPH11261421A - 情報符号化方法 - Google Patents
情報符号化方法Info
- Publication number
- JPH11261421A JPH11261421A JP5949798A JP5949798A JPH11261421A JP H11261421 A JPH11261421 A JP H11261421A JP 5949798 A JP5949798 A JP 5949798A JP 5949798 A JP5949798 A JP 5949798A JP H11261421 A JPH11261421 A JP H11261421A
- Authority
- JP
- Japan
- Prior art keywords
- smr
- relative ratio
- calculated
- data
- masking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
る情報符号化方法を提供する。 【解決手段】 ビットアロケーション+量子化回路はS
MRをワードレングスに割り付ける際に、SMRが6d
B〜12dBのように低いレベルの信号に対しても2ビ
ットを割り付け、周波数方向のスペクトルの連続性を確
保して音質を良好にする。また、線形規則に従って割付
ける場合には、線形規則に従えば割付ビット数がゼロと
なる相対比領域に対しても強制的に量子化ビット数を割
付けることによって、周波数方向のスペクトルの連続性
を確保することができる。
Description
関し、特に、MDやDCCなどの記録媒体に情報を符号
化して書込むための情報符号化方法に関する。
示すブロック図である。図10を参照して、ミニディス
クシステムの主要な構成について説明する。ミニディス
ク1はカートリッジ2に収納されており、再生時には光
学ピックアップ3から読出された信号がRFアンプ4に
入力されてRF信号となる。ディスクに埋込まれたAD
IP信号はアドレスデコーダ5によってデコードされ、
サーボ制御のために使用される。RF信号はEFM/C
IRC/エンコーダ/デコーダ6,ショックプルーフメ
モリコントローラ7および音声圧縮ATRACエンコー
ダ/デコーダ8によってディジタル処理され、D/Aコ
ンバータ9によってアナログ信号に変換されてオーディ
オ信号が出力される。
A/Dコンバータ10によって量子化され、再生時と逆
の経路でディジタル処理される。その後、ヘッド駆動回
路11によって記録ヘッド12が駆動されてオーディオ
信号が磁界変調され、ディスク上に記録される。
Cエンコーダ/デコーダ8のうちのエンコーダ部分を示
すブロック図である。図11において、ATRAC(Ad
aptive TRansform Acoustic Coding)エンコーダは、M
Dシステムに採用される高能率圧縮方式であり、時間軸
データを直交変換により周波数軸データ、すなわちスペ
クトルデータに変換し、そのスペクトルデータを振り分
けてビットアロケーションしていく方式である。
ルタ(QMF)81に入力されて2分割される。分割さ
れた一方の帯域のオーディオ信号は帯域分割フィルタ8
2によってさらに2帯域に分割され、元のオーディオ信
号は低域,中域,高域の3帯域に分割される。なお、帯
域分割フィルタ81で分割された他方の帯域のオーディ
オ信号は帯域分割フィルタ82の遅延量だけディレイ8
3によって遅延される。
4,85,86によって改良離散コサイン変換されて時
系列のデータが周波数スペクトルデータに変換される。
変換された各帯域の周波数スペクトルデータはビットア
ロケーション+量子化回路90に入力される。
はブロックサイズ選択回路87,88,89に入力され
て各帯域ごとのブロックサイズが決定されて聴覚心理分
析回路91に与えられる。聴覚心理分析回路91は可聴
外のデータを抽出し、ビットアロケーション+量子化回
路90でオーディオデータを量子化する際に可聴外のデ
ータを選択的に削除することによって伝送量を圧縮す
る。
各帯域のスペクトルデータを聴覚心理分析回路91の聴
覚分析処理に基づいてアロケーションを行ない、各々処
理バンド幅で最適なビット数で正規化を行なってフォー
マッティングを決定し、多重化回路92に出力する。ま
た、聴覚心理分析回路91には、MDCT84,85,
86から低域,中域,高域の3帯域のスペクトルデータ
が与えられている。そして、聴覚心理分析回路91から
量子化ビット数であるワードレングスと正規化スケール
であるスケールファクタとが多重化回路92に与えられ
る。多重化回路92は多重化されたビットストリームを
出力する。
Cエンコーダ/デコーダによる帯域分割とMDCTとの
関係を示す図である。0〜fs/2のオーディオデータ
は、図11の帯域分割フィルタ81,82によって0〜
fs/8の低域と、fs/8〜fs/4の中域と、fs
/4〜fs/2の高域に分割され、それぞれ128/1
28/256のスペクトルとなり、全帯域で512サン
プルとして表わされている。したがって、周波数分解能
は43Hzとなる。
サイズ選択回路87,88,89によって図12に示す
ように、256/32,128/32,128/32に
分割されて示されている。
る時系列の音声信号を示す図であり、図14は図13に
示した音声信号を図11のQMF81,82によって帯
域分割し、MDCT84〜86によって変換された周波
数スペクトルデータを示す図であり、スペクトルの本数
はラフに示されている。図15はビットアロケーション
+量子化回路90によってスペクトルデータからエネル
ギ量を求めたシグナルレベルを示す図であり、図16は
マスキング計算を説明するための図である。
を行なう。聴覚心理では、マスキング効果と最小可聴特
性が考慮される。マスキング効果は図16のaに示すよ
うにある大きな音のスペクトルのまわりの斜線に示すス
ペクトルが大きな音にマスキングされて認識できないエ
リアが発生することをいう。図15に示すシグナルレベ
ルから図16のaに示すスペクトルが他のスペクトルに
及ぼすレベルの和を求めてマスキング計算を行なうこと
によって、図17に示すトータルマスキング量が決定さ
れる。
る。最小可聴特性は、最小可聴限以下の音は可聴できな
いことを示す特性であり、4kHz付近で一番感度が良
くなり、高域と低域は感度が悪くなる。このため、1k
Hz〜5kHzの帯域ではSN比を大きくし、低域と高
域はそれに比べてSN比を落としても問題がないことに
なる。
路90によって図15に示すシグナルレベルから図17
に示すトータルマスク量と図18に示した最大可聴特性
による最小可聴限以下のスペクトルが間引かれる。その
状態を図19に示す。
るレベルとの比をSMR(Signal to Mask Ratio)と称
する。このSMRを正規化するために、聴覚心理分析回
路91から正規化するためのスケールとなるスケールフ
ァクタと、量子化ビット数であるワードレングスが多重
化回路92に与えられる。
何ビットになるかは予め決められており、従来はたとえ
ばSMRが12〜18dBではワードレングスが2ビッ
トに割り付けられ、6dB以下では0ビットが割り付け
られていた。
ーションに際して情報量の圧縮効果が大きいために、S
MRの非常に低いレベルの信号に対して0ビットが割り
付けられると、スペクトルデータがなくなってしまい、
周波数方向のスペクトルの連続性がなくなってしまい、
音質に問題を生じてしまうという欠点があった。
述のような問題に鑑みてなされたものであり、周波数方
向のスペクトルの連続性を確保できるような情報符号化
方法を提供することである。
アナログデータを周波数データに変換し、この変換され
た所定の処理バンド幅内のスペクトルデータをエネルギ
換算してシグナルレベルを算定し、所定のマスキングレ
ベルに対するシグナルレベルの相対比に応じてその処理
バンド内の量子化ビット数を割付ける情報符号化方法で
あって、相対比の小さい領域では同一割付ビットに対応
する相対比の幅を大きくする。
を周波数データに変換し、この変換された所定の処理バ
ンド幅内のスペクトルデータをエネルギ換算してシグナ
ルレベルを算定し、所定のマスキングレベルに対するシ
グナルレベルの相対比に応じてその処理バンド内の量子
化ビット数を所定の線形規則に従って割付ける情報符号
化方法であって、線形規則に従えば割付ビット数がゼロ
となる相対比領域に対しても、強制的に量子化ビット数
を割付ける。
的に割付ける量子化ビット数は、線形規則に従って割付
けられる最小の量子化ビット数をそのまま適用する。
3の強制的に量子化ビット数を割付ける相対比領域は、
線形規則により限界とされる相対比とゼロデシベルとの
中間までである。
いずれかにおいて、アナログデータは音声データであっ
て、マスキングレベルは人の聞こえ方によって設定され
る。
る符号化されたデータは、ミニディスクに記録されるも
のであり、マスキングはスペクトル間の相関関係に起因
するマスキング効果と人の耳の最小可聴特性とを組合せ
たものである。
作を説明するためのフローチャートであり、図2は図1
における伝送量調整動作を説明するためのフローチャー
トである。
ャートによる処理は前述の図11に示したビットアロケ
ーション+量子化回路90によって実行される。すなわ
ち、ビットアロケーション+量子化回路90によってS
MRが正規化されて最適な伝送量が決定される。また、
前述の図14に示した各スペクトルデータからシグナル
レベルが計算される。このシグナルレベル計算では、ス
ペクトルデータをSとすると、スペクトルを次式で求め
ることによって、図15に示すようにエネルギ量で表わ
されたシグナルレベルが求められる。
れる。マスキングレベルの計算は、前述の図16に示し
たように各スペクトルが他のスペクトルに及ぼすレベル
の和を求めることにより、全帯域に対するマスキングレ
ベルを計算できる。具体的には、クリティカルバンド単
位で他のクリティカルバンドからマスキングを受けるレ
ベルと、クリティカルバンドのマスキングレベルの総和
が求められ、前述の図17に示すマスキング量が求めら
れる。
て、最小可聴特性と計算されたマスキング量によってト
ータルマスキング計算が行なわれ、シグナルレベルから
トータルマスキングレベルが減算されてSMRが計算さ
れる。すなわち、図19に示す白抜きの部分が求められ
る。求められたSMRに対してビットアロケーションが
行なわれる。
の関係を示す図であり、図4はSMRとワードレングス
との関係を示す図である。
4に示すように、SMRが何dBであるかによってワー
ドレングスWLのビット数が割当てられて伝送量が計算
される。
に割りつける際、SMRが12〜18dBではワードレ
ングスが2ビットに割りつけられ、12dB以下では0
ビットが割りつけられていた。これは、±の符号を表わ
すビットが必要なために最小の割付ビットが2ビットと
なり、よって図4に示すビット割付の線形的な規則に従
えば、最小のSMRが12dBまでとなるためである。
このように、アロケーションに際して情報量の圧縮効果
が大きいために、SMRの非常に低いレベルの信号に対
して0ビットが割りつけられると、スペクトルデータが
なくなってしまい、周波数方向のスペクトルの連続性や
必要な倍音成分がなくなってしまい、音質に問題を生じ
てしまう。
に示すように、SMRが6dB〜12dBのように低い
レベルの信号に対しても2ビットが割りつけられ、周波
数方向のスペクトルの連続性や倍音成分を確保して音質
が良好にされる。ただし、SMRがゼロの近傍になるま
で量子化ビットを割当てると、不要なノイズ音を拾い、
または音のバランスが悪化したりして、かえって耳障り
な音となってしまう。実験によれば、SMRが6程度ま
で量子化ビットを割当てると音質の改善効果は大きい
が、これよりも小さなSMRまで割当てると、ノイズ音
が気になってくる。前述の伝送量計算が適切でなけれ
ば、2分法が用いられてSMRの補正が行なわれる。
び図7は2分法により伝送量を最適値に近づける様子を
示している。この実施形態では、128dBの調整が可
能なように最初のステップの調整値を32dBとし、ま
た、微調整のために±0.5dBのステップを設けてい
る。この微調整時の値は、パラメータなどの精度から求
められる。この2分法で伝送量を調整したときに、7ス
テップ目で収束した例を図6に示し、8ステップ目で収
束した例を図7に示す。
2dBから0.5dBへ2分されるステップは7ステッ
プである。図6に示すように、7ステップ目の処理後、
伝送量以下になっていれば調整を終了できるが、図7に
示すように7ステップ目の処理後、伝送量が以下になっ
ていない場合がある。この場合は、補正ステップとして
もう1ステップ設けて調整が行なわれる。
ある7ステップ目と同じ値を用いて調整を行なってい
る。調整値を分割して伝送量を調整した場合、最適伝送
量に近づくが、必ずしも最適伝送量以下になる保証がな
い。伝送量の調整結果を確実に最適伝送量以下にするた
めに、最終調整ステップ値と同じ値にし、強制的に最適
伝送量以下になるようにされる。
る。すなわち、まず図5に示すSMR調整ツリーに従っ
て、伝送量調整用の値Δがスタート値Δ=32dBに設
定される。前述したビットアロケーション法により伝送
量が計算され、その伝送量が最適伝送量より多いか少な
いかが判断される。多ければSMRの各帯域から32d
B引かれ、少なければSMRの各帯域に32dB加算さ
れる。次に、Δ値が32dBの1/2の16dBに設定
され、加減算後のSMRから伝送量が求められる。再び
その伝送量が最適伝送量より多いか少ないかが判断さ
れ、多ければSMRの各帯域から16dB引かれ、少な
ければSMRの各帯域に16dB加算される。
1,0.5dBのように順次2分され、演算が行なわれ
る。この場合、図6に示すように7ステップ目で伝送量
が最適伝送量以下になれば、そのまま伝送量の調整が終
了するが、図7に示すように7ステップ目で最適伝送量
以下にならなかったときには、8ステップ目で最適伝送
量以下になるようにΔの値が設定され、強制的に伝送量
が最適値以下にされる。
界線として、SMRの量が加減算される。この境界線の
遷移を図8および図9に示す。図8は伝送量が7ステッ
プ目で最適伝送量以下になる場合であり、図9は伝送量
が7ステップ目で最適伝送量以下にならない場合であ
る。
で終了させたい場合は、次のような方法もある。すなわ
ち、伝送量の調整時に、最適伝送量から最適伝送量−δ
までの範囲にある場合、直ちに終了させる。このとき、
δの値は予め設定された任意の値である。たとえば、こ
の実施形態では、微調整の範囲であるδ=0.5とする
と良い結果が得られる。
の処理バンド幅内のスペクトルデータをエネルギ換算し
てシグナルレベルを算定し、所定のマスキングレベルに
対するシグナルレベルの相対比に応じて処理バンド内の
量子化ビット数を割付けるときに、相対比の小さい領域
では同一割付ビットに対応する相対比の幅を大きくする
ことによって、周波数方向のスペクトルの連続性を確保
できる。また、線形規則に従って割付ける場合には、線
形規則に従えば割付ビット数がゼロとなる相対比領域に
対しても強制的に量子化ビット数を割付けることによっ
て、周波数方向のスペクトルの連続性を確保することが
できる。
フローチャートである。
フローチャートである。
す図である。
る。
である。
で強制的に収束させた例を示す図である。
場合の遷移図である。
ない場合の遷移図である。
図である。
ダを示すブロック図である。
ダによる帯域分割とMDCTとの関係を示す図である。
音声信号を示す図である。
CTによって変換された周波数スペクトルデータを示す
図である。
グナルレベルを示す図である。
トータルマスク量と、図18の最小可聴特性カーブを重
ねて示した図である。
Claims (6)
- 【請求項1】 アナログデータを周波数データに変換
し、この変換された所定の処理バンド幅内のスペクトル
データをエネルギ換算してシグナルレベルを算定し、所
定のマスキングレベルに対する前記シグナルレベルの相
対比に応じて当該処理バンド内の量子化ビット数を割付
ける情報符号化方法であって、 前記相対比の小さい領域では同一割付ビットに対応する
前記相対比の幅を大きくしたことを特徴とする、情報符
号化方法。 - 【請求項2】 アナログデータを周波数データに変換
し、この変換された所定の処理バンド幅内のスペクトル
データをエネルギ換算してシグナルレベルを算定し、所
定のマスキングレベルに対する前記シグナルレベルの相
対比に応じて当該処理バンド内の量子化ビット数を所定
の線形規則に従って割付ける情報符号化方法であって、 前記線形規則に従えば割付ビット数がゼロとなる相対比
領域に対しても、強制的に量子化ビット数を割付けるこ
とを特徴とする、情報符号化方法。 - 【請求項3】 前記強制的に割付ける量子化ビット数
は、前記線形規則に従って割付けられる最小の量子化ビ
ット数をそのまま適用することを特徴とする、請求項2
に記載の情報符号化方法。 - 【請求項4】 前記強制的に量子化ビット数を割付ける
相対比領域は、線形規則により限界とされる相対比とゼ
ロデシベルとの中間までであることを特徴とする、請求
項2または3に記載の情報符号化方法。 - 【請求項5】 前記アナログデータは音声データであっ
て、前記マスキングレベルは人の聞こえ方によって設定
されるものであることを特徴とする、請求項1〜4のい
ずれかに記載の情報符号化方法。 - 【請求項6】 前記符号化されたデータはミニディスク
に記録されるものであり、マスキングはスペクトル間の
相関関係に起因するマスキング効果と人の耳の最小可聴
特性とを組合せたものであることを特徴とする、請求項
5に記載の情報符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05949798A JP3408140B2 (ja) | 1998-03-11 | 1998-03-11 | 情報符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05949798A JP3408140B2 (ja) | 1998-03-11 | 1998-03-11 | 情報符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11261421A true JPH11261421A (ja) | 1999-09-24 |
JP3408140B2 JP3408140B2 (ja) | 2003-05-19 |
Family
ID=13114993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05949798A Expired - Lifetime JP3408140B2 (ja) | 1998-03-11 | 1998-03-11 | 情報符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3408140B2 (ja) |
-
1998
- 1998-03-11 JP JP05949798A patent/JP3408140B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3408140B2 (ja) | 2003-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3328532B2 (ja) | デジタルデータの符号化方法 | |
JP3173218B2 (ja) | 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体 | |
US6169973B1 (en) | Encoding method and apparatus, decoding method and apparatus and recording medium | |
JP3123290B2 (ja) | 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体 | |
JP3765622B2 (ja) | オーディオ符号化復号化システム | |
US6353807B1 (en) | Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium | |
KR20010050304A (ko) | 디지탈 신호 처리 장치 및 디지탈 신호 처리 방법 | |
JPH0816195A (ja) | ディジタルオーディオ符号化方法及び装置 | |
US5754427A (en) | Data recording method | |
JP2000330599A (ja) | 信号処理方法及び装置、並びに情報提供媒体 | |
US6128593A (en) | System and method for implementing a refined psycho-acoustic modeler | |
US6034315A (en) | Signal processing apparatus and method and information recording apparatus | |
JP3776004B2 (ja) | ディジタルデータの符号化方法 | |
JP3354472B2 (ja) | 情報符号化方法 | |
JPH11261421A (ja) | 情報符号化方法 | |
JP4271588B2 (ja) | ディジタルデータの符号化方法および符号化装置 | |
JP2003177797A (ja) | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 | |
JPH06289900A (ja) | オーディオ符号化装置 | |
JP3186489B2 (ja) | ディジタル信号処理方法及び装置 | |
JP4293833B2 (ja) | ディジタル信号記録再生装置及びその制御プログラム | |
JP2993324B2 (ja) | 音声高能率符号化装置 | |
US20030233228A1 (en) | Audio coding system and method | |
JP4732478B2 (ja) | ディジタル信号再生装置、及びその制御プログラム | |
JP3334375B2 (ja) | ディジタル信号圧縮方法及び装置 | |
JP2002091500A (ja) | デジタルデータ符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030218 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090314 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100314 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110314 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130314 Year of fee payment: 10 |