JP3354472B2 - 情報符号化方法 - Google Patents

情報符号化方法

Info

Publication number
JP3354472B2
JP3354472B2 JP02986198A JP2986198A JP3354472B2 JP 3354472 B2 JP3354472 B2 JP 3354472B2 JP 02986198 A JP02986198 A JP 02986198A JP 2986198 A JP2986198 A JP 2986198A JP 3354472 B2 JP3354472 B2 JP 3354472B2
Authority
JP
Japan
Prior art keywords
transmission amount
data
amount
smr
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02986198A
Other languages
English (en)
Other versions
JPH11234138A (ja
Inventor
正人 夫馬
実幸 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP02986198A priority Critical patent/JP3354472B2/ja
Publication of JPH11234138A publication Critical patent/JPH11234138A/ja
Application granted granted Critical
Publication of JP3354472B2 publication Critical patent/JP3354472B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は情報符号化方法に
関し、特に、MDやDCCなどの記録媒体に情報を符号
化して書込むための情報符号化方法に関する。
【0002】
【従来の技術】図10はミニディスクシステムの構成を
示すブロック図である。図10を参照して、ミニディス
クシステムの主要な構成について説明する。ミニディス
ク1はカートリッジ2に収納されており、再生時には光
学ピックアップ3から読出された信号がRFアンプ4に
入力されてRF信号となる。ディスクに埋込まれたAD
IP信号はアドレスデコーダ5によってデコードされ、
サーボ制御のために使用される。RF信号はEFM/C
IRC/エンコーダ/デコーダ6,ショックプルーフメ
モリコントローラ7および音声圧縮ATRACエンコー
ダ/デコーダ8によってディジタル処理され、D/Aコ
ンバータ9によってアナログ信号に変換されてオーディ
オ信号が出力される。
【0003】一方、録音時には、オーディオ入力信号が
A/Dコンバータ10によって量子化され、再生時と逆
の経路でディジタル処理される。その後、ヘッド駆動回
路11によって記録ヘッド12が駆動されてオーディオ
信号が磁界変調され、ディスク上に記録される。
【0004】図11は図10に示した音声圧縮ATRA
Cエンコーダ/デコーダ8のうちのエンコーダ部分を示
すブロック図である。図11において、ATRAC(Ad
aptive TRansform Acoustic Coding)エンコーダは、M
Dシステムに採用される高能率圧縮方式であり、時間軸
データを直交変換により周波数軸データ、すなわちスペ
クトルデータに変換し、そのスペクトルデータを振り分
けてビットアロケーションしていく方式である。
【0005】再生されたオーディオ信号は帯域分割フィ
ルタ(QMF)81に入力されて2分割される。分割さ
れた一方の帯域のオーディオ信号は帯域分割フィルタ8
2によってさらに2帯域に分割され、元のオーディオ信
号は低域,中域,高域の3帯域に分割される。なお、帯
域分割フィルタ81で分割された他方の帯域のオーディ
オ信号は帯域分割フィルタ82の遅延量だけディレイ8
3によって遅延される。
【0006】分割されたオーディオ信号はMDCT8
4,85,86によって改良離散コサイン変換されて時
系列のデータが周波数スペクトルデータに変換される。
変換された各帯域の周波数スペクトルデータはビットア
ロケーション+量子化回路90に入力される。
【0007】前述の3帯域に分割されたオーディオ信号
はブロックサイズ選択回路87,88,89に入力され
て各帯域ごとのブロックサイズが決定されて聴覚心理分
析回路91に与えられる。聴覚心理分析回路91は可聴
外のデータを抽出し、ビットアロケーション+量子化回
路90でオーディオデータを量子化する際に可聴外のデ
ータを選択的に削除することによって伝送量を圧縮す
る。
【0008】ビットアロケーション+量子化回路90は
各帯域のスペクトルデータを聴覚心理分析回路91の聴
覚分析処理に基づいてアロケーションを行ない、各々処
理バンド幅で最適なビット数で正規化を行なってフォー
マッティングを決定し、多重化回路92に出力する。ま
た、聴覚心理分析回路91には、MDCT84,85,
86から低域,中域,高域の3帯域のスペクトルデータ
が与えられている。そして、聴覚心理分析回路91から
量子化ビット数であるワードレングスと正規化スケール
であるスケールファクタとが多重化回路92に与えられ
る。多重化回路92は多重化されたビットストリームを
出力する。
【0009】図12は図11に示した音声圧縮ATRA
Cエンコーダ/デコーダによる帯域分割とMDCTとの
関係を示す図である。0〜fs/2のオーディオデータ
は、図11の帯域分割フィルタ81,82によって0〜
fs/8の低域と、fs/8〜fs/4の中域と、fs
/4〜fs/2の高域に分割され、それぞれ128/1
28/256のスペクトルとなり、全帯域で512サン
プルとして表わされている。したがって、周波数分解能
は43Hzとなる。
【0010】また、このスペクトルデータは、ブロック
サイズ選択回路87,88,89によって図12に示す
ように、256/32,128/32,128/32に
分割されて示されている。
【0011】図13はATRACエンコーダに入力され
る時系列の音声信号を示す図であり、図14は図13に
示した音声信号を図11のQMF81,82によって帯
域分割し、MDCT84〜86によって変換された周波
数スペクトルデータを示す図であり、スペクトルの本数
はラフに示されている。図15はビットアロケーション
+量子化回路90によってスペクトルデータからエネル
ギ量を求めたシグナルレベルを示す図であり、図16は
マスキング計算を説明するための図である。
【0012】聴覚心理分析回路91は聴覚心理分析処理
を行なう。聴覚心理では、マスキング効果と最小可聴特
性が考慮される。マスキング効果は図16のaに示すよ
うにある大きな音のスペクトルのまわりの斜線に示すス
ペクトルが大きな音にマスキングされて認識できないエ
リアが発生することをいう。図15に示すシグナルレベ
ルから図16のaに示すスペクトルが他のスペクトルに
及ぼすレベルの和を求めてマスキング計算を行なうこと
によって、図17に示すトータルマスキング量が決定さ
れる。
【0013】図18は最小可聴特性カーブを示す図であ
る。最小可聴特性は、最小可聴限以下の音は可聴できな
いことを示す特性であり、4kHz付近で一番感度が良
くなり、高域と低域は感度が悪くなる。このため、1k
Hz〜5kHzの帯域ではSN比を大きくし、低域と高
域はそれに比べてSN比を落としても問題がないことに
なる。
【0014】そこで、ビットアロケーション+量子化回
路90によって図15に示すシグナルレベルから図17
に示すトータルマスク量と図18に示した最大可聴特性
による最小可聴限以下のスペクトルが間引かれる。その
状態を図19に示す。
【0015】図19に示すシグナルレベルとマスクされ
るレベルとの比をSMR(Signal to Mask Ratio)と称
する。このSMRを正規化するために、聴覚心理分析回
路91から正規化するためのスケールとなるスケールフ
ァクタと、量子化ビット数であるワードレングスが多重
回路92に与えられる。
【0016】SMRが何dBのときにワードレングスが
何ビットであるかは予め決められており、図19に示す
各ビットアロケーションバンド内には、図14に示すス
ペクトルデータがいくつかある。各バンド幅内のスペク
トルデータのビット数を合計すると、そのSMRの情報
を伝送するのに必要なビット数(伝送量)が計算され
る。しかし、このビット数は必ずしも伝送制限内に収ま
っているとは限らないので、伝送制限内に収まるように
調整する必要がある。また、MDプレーヤを小型化する
上で上述した処理をする制御部のLSIを開発する必要
があり、LSI内の回路構成を簡単にしかつアルゴリズ
ムを簡単化することが要求される。
【0017】そこで、本願発明者は、2分法の採用を検
討した。2分法は、決められた区間で根を1つだけ持つ
ことがわかっている場合に、近似値を求める方法であ
る。この方法は、単純な繰返し演算で処理できるため、
回路化する際、簡単に回路を構成できる。
【0018】
【発明が解決しようとする課題】しかし、2分法は、近
似値を求める際、根の両側から接近して値を根に近づけ
るため、+側から接近する場合と−側から接近する場合
がある。このため、調整した伝送量が伝送制限以下に収
まらない場合があった。
【0019】それゆえに、この発明の主たる目的は、上
述のような問題に鑑みてなされたものであり、簡単な構
成で実現でき、しかも処理アルゴリズムを簡略化し得る
情報復号化方法を提供することである。
【0020】
【課題を解決するための手段】この発明は入力された音
声データを複数の帯域に分割し、直交変換により時系列
データから周波数データに変換し、この変換された所定
の処理バンド幅内のスペクトルデータを量子化するとき
に、聴覚処理を適用してシグナルレベルからマスキング
データと可聴外のデータを選択的に削除して伝送量を圧
縮する情報符号化方法において、各処理幅内のスペクト
ルデータを伝送する量が決められていて、2分法を用い
て各処理幅で伝送可能なスペクトルデータが最適な伝送
量となるように収束させ、収束回数が一定回数を越えて
も最適伝送量以下でなければ、以下となるように強制す
るようにしたものである。
【0021】
【発明の実施の形態】図1はこの発明の一実施形態の動
作を説明するためのフローチャートであり、図2は図1
における伝送量調整動作を説明するためのフローチャー
トである。
【0022】これらの図1および図2に示したフローチ
ャートによる処理は前述の図11に示したビットアロケ
ーション+量子化回路90によって実行される。すなわ
ち、ビットアロケーション+量子化回路90によってS
MRが正規化されて最適な伝送量が決定される。また、
前述の図14に示した各スペクトルデータからシグナル
レベルが計算される。このシグナルレベル計算では、ス
ペクトルデータをSとすると、スペクトルを次式で求め
ることによって、図15に示すようにエネルギ量で表わ
されたシグナルレベルが求められる。
【0023】ΣS* S 次に、マスキングレベルが計算される。マスキングレベ
ルの計算は、前述の図16に示したように各スペクトル
が他のスペクトルに及ぼすレベルの和を求めることによ
り、全帯域に対するマスキングレベルを計算できる。具
体的には、クリティカルバンド単位で他のクリティカル
バンドからマスキングを受けるレベルと、クリティカル
バンドのマスキングレベルの総和が求められ、前述の図
17に示すマスキング量が求められる。
【0024】最小可聴特性は、予め設定される。そし
て、最小可聴特性と計算されたマスキング量によってト
ータルマスキング計算が行なわれ、シグナルレベルから
トータルマスキングレベルが減算されてSMRが計算さ
れる。すなわち、図19に示す白抜きの部分が求められ
る。求められたSMRに対してビットアロケーションが
行なわれる。
【0025】図3はワードレングスと量子化ビット数と
の関係を示す図であり、図4はSMRとワードレングス
との関係を示す図である。
【0026】ビットアロケーションでは、図3および図
4に示すように、SMRが何dBであるかによってワー
ドレングスWLのビット数が割当てられて伝送量が計算
される。
【0027】従来、SMRをワードレングスに割りつけ
る際、SMRが12〜18dBではワードレングスが2
ビットに割りつけられ、6dB以下では0ビットが割り
つけられていた。このように、アロケーションに際して
情報量の圧縮効果が大きいために、SMRの非常に低い
レベルの信号に対して0ビットが割りつけられると、ス
ペクトルデータがなくなってしまい、周波数方向のスペ
クトルの連続性がなくなってしまい、音質に問題を生じ
てしまう。
【0028】そこで、この発明の一実施形態では、図4
に示すように、SMRが6dB〜12dBのように低い
レベルの信号に対しても2ビットが割りつけられ、周波
数方向のスペクトルの連続性を確保して音質が良好にさ
れる。前述の伝送量計算が適切でなければ、2分法が用
いられてSMRの補正が行なわれる。
【0029】図5はSMR調整ツリーを示し、図6およ
び図7は2分法により伝送量を最適値に近づける要素を
示している。この実施形態では、128dBの調整が可
能なように最初のステップの調整値を32dBとし、ま
た、微調整のために±0.5dBのステップを設けてい
る。この微調整時の値は、パラメータなどの精度から求
められる。この2分法で伝送量を調整したときに、7ス
テップ目で収束した例を図6に示し、8ステップ目で収
束した例を図7に示す。
【0030】図5のSMR調整ツリーが示すように、3
2dBから0.5dBへ2分されるステップは7ステッ
プである。図6に示すように、7ステップ目の処理後、
伝送量以下になっていれば調整を終了できるが、図7に
示すように7ステップ目の処理後、伝送量が以下になっ
ていない場合がある。この場合は、補正ステップとして
もう1ステップ設けて調整が行なわれる。
【0031】この実施形態では、最終調整のステップで
ある7ステップ目と同じ値を用いて調整を行なってい
る。調整値を分割して伝送量を調整した場合、最適伝送
量に近づくが、必ずしも最適伝送量以下になる保証がな
い。伝送量の調整結果を確実に最適伝送量以下にするた
めに、最終調整ステップ値と同じ値にし、強制的に最適
伝送量以下になるようにされる。
【0032】SMRの調整は図2に示す手順で行なわれ
る。すなわち、まず図5に示すSMR調整ツリーに従っ
て、伝送量調整用の値Δがスタート値Δ=32dBに設
定される。前述したビットアロケーション法により伝送
量が計算され、その伝送量が最適伝送量より多いか少な
いかが判断される。多ければSMRの各帯域から32d
B引かれ、少なければSMRの各帯域に32dB加算さ
れる。次に、Δ値が32dBの1/2の16dBに設定
され、加減算後のSMRから伝送量が求められる。再び
その伝送量が最適伝送量より多いか少ないかが判断さ
れ、多ければSMRの各帯域から16dB引かれ、少な
ければSMRの各帯域に16dB加算される。
【0033】この処理が繰返され、Δが8,4,2,
1,0.5dBのように順次2分され、演算が行なわれ
る。この場合、図6に示すように7ステップ目で伝送量
が最適伝送量以下になれば、そのまま伝送量の調整が終
了するが、図7に示すように7ステップ目で最適伝送量
以下にならなかったときには、8ステップ目で最適伝送
量以下になるようにΔの値が設定され、強制的に伝送量
が最適値以下にされる。
【0034】伝送量の調整をする際、調整用の値Δを境
界線として、SMRの量が加減算される。この境界線の
遷移を図8および図9に示す。図8は伝送量が7ステッ
プ目で最適伝送量以下になる場合であり、図9は伝送量
が7ステップ目で最適伝送量以下にならない場合であ
る。
【0035】伝送量調整演算を7または8ステップ以下
で終了させたい場合は、次のような方法もある。すなわ
ち、伝送量の調整時に、最適伝送量から最適伝送量−δ
までの範囲にある場合、直ちに終了させる。このとき、
δの値は予め設定された任意の値である。
【0036】
【発明の効果】以上のように、この発明によれば、2分
法を用いて各処理幅で伝送可能なスペクトルデータが最
適な伝送量となるように収束させるとき、収束回数が一
定回数を越えて最適伝送量以下でなければ、以下となる
ように強制するようにしたので、収束するまでの時間を
短縮でき、しかも比較的簡単な処理アルゴリズムで収束
化させることができる。
【図面の簡単な説明】
【図1】この発明の一実施形態の動作を説明するための
フローチャートである。
【図2】図1における伝送量調整動作を説明するための
フローチャートである。
【図3】ワードレングスと量子化ビット数との関係を示
す図である。
【図4】SMRとワードレングスとの関係を示す図であ
る。
【図5】SMR調整パターンを示す図である。
【図6】2分法により7ステップで収束した例を示す図
である。
【図7】2分法により伝送量がオーバーして8ステップ
で強制的に収束させた例を示す図である。
【図8】伝送量が7ステップ目で最適伝送量以下になる
場合の遷移図である。
【図9】伝送量が7ステップ目で最適伝送量以下になら
ない場合の遷移図である。
【図10】ミニディスクシステムの構成を示すブロック
図である。
【図11】図10に示した音声圧縮ATRACエンコー
ダを示すブロック図である。
【図12】図11に示した音声圧縮ATRACエンコー
ダによる帯域分割とMDCTとの関係を示す図である。
【図13】ATRACエンコーダに入力される時系列の
音声信号を示す図である。
【図14】図13に示した音声信号を帯域分割し、MD
CTによって変換された周波数スペクトルデータを示す
図である。
【図15】スペクトルデータからエネルギ量を求めたシ
グナルレベルを示す図である。
【図16】マスキング計算を説明するための図である。
【図17】トータルマスク量を示す図である。
【図18】最小可聴特性カーブを示す図である。
【図19】図15に示したシグナルレベルと、図17の
トータルマスク量と、図18の最小可聴特性カーブを重
ねて示した図である。
【符号の説明】
81,82 QMF 83 ディレイ 84,85,86 MDCT 87,88,89 ブロックサイズ選択回路 90 ビットアロケーション+量子化回路 91 聴覚心理分析回路 92 多重化回路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−201526(JP,A) 特開 平3−263925(JP,A) 特開 平4−104606(JP,A) 特開 平4−104617(JP,A) 特開 平5−37394(JP,A) 特開 平5−37396(JP,A) 特開 平7−175637(JP,A) 特表 平4−504192(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G11B 20/10 301

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された音声データを複数の帯域に分
    割し、直交変換により時系列データから周波数データに
    変換し、この変換された所定の処理バンド幅内のスペク
    トルデータを量子化するときに、聴覚処理を適用してシ
    グナルレベルからマスキングデータと可聴外のデータと
    を選択的に削除して伝送量を圧縮する情報符号化方法に
    おいて、 前記各処理幅内のスペクトルデータを伝送できる量が決
    められていて、2分法を用いて各処理幅で伝送可能なス
    ペクトルデータが最適な伝送量となるように収束させ、
    収束回数が一定回数を越えても最適伝送量以下でなけれ
    ば、以下となるように強制することを特徴とする、情報
    符号化方法。
JP02986198A 1998-02-12 1998-02-12 情報符号化方法 Expired - Fee Related JP3354472B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02986198A JP3354472B2 (ja) 1998-02-12 1998-02-12 情報符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02986198A JP3354472B2 (ja) 1998-02-12 1998-02-12 情報符号化方法

Publications (2)

Publication Number Publication Date
JPH11234138A JPH11234138A (ja) 1999-08-27
JP3354472B2 true JP3354472B2 (ja) 2002-12-09

Family

ID=12287760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02986198A Expired - Fee Related JP3354472B2 (ja) 1998-02-12 1998-02-12 情報符号化方法

Country Status (1)

Country Link
JP (1) JP3354472B2 (ja)

Also Published As

Publication number Publication date
JPH11234138A (ja) 1999-08-27

Similar Documents

Publication Publication Date Title
JP3173218B2 (ja) 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
JP3328532B2 (ja) デジタルデータの符号化方法
JP3307138B2 (ja) 信号符号化方法及び装置、並びに信号復号化方法及び装置
JP3123290B2 (ja) 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3186307B2 (ja) 圧縮データ記録装置及び方法
US20080059204A1 (en) Signal compressing apparatus
US6353807B1 (en) Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
JP2001142498A (ja) ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
EP0691751B1 (en) Method and device for compressing information, and device for recording/transmitting compressed information
US6519558B1 (en) Audio signal pitch adjustment apparatus and method
EP0749220A2 (en) Coding of data with a fixed word length
US6034315A (en) Signal processing apparatus and method and information recording apparatus
JP3354472B2 (ja) 情報符号化方法
US7305346B2 (en) Audio processing method and audio processing apparatus
JP3776004B2 (ja) ディジタルデータの符号化方法
JP2002094385A (ja) 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
JPH1083623A (ja) 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP3408140B2 (ja) 情報符号化方法
JP3454394B2 (ja) 音声の準可逆符号化装置
JP3186489B2 (ja) ディジタル信号処理方法及び装置
JP4271588B2 (ja) ディジタルデータの符号化方法および符号化装置
JP4293833B2 (ja) ディジタル信号記録再生装置及びその制御プログラム
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP3334375B2 (ja) ディジタル信号圧縮方法及び装置
JP4732478B2 (ja) ディジタル信号再生装置、及びその制御プログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020827

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070927

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080927

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees