JP2003177797A - ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 - Google Patents
ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置Info
- Publication number
- JP2003177797A JP2003177797A JP2001376308A JP2001376308A JP2003177797A JP 2003177797 A JP2003177797 A JP 2003177797A JP 2001376308 A JP2001376308 A JP 2001376308A JP 2001376308 A JP2001376308 A JP 2001376308A JP 2003177797 A JP2003177797 A JP 2003177797A
- Authority
- JP
- Japan
- Prior art keywords
- bit allocation
- allocation amount
- quantization error
- digital signal
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
瞬間的に経時変化の大きい信号を符号化する際に、知覚
可能な音質劣化を軽減する。 【解決手段】 パワー算出部52aで、変換されたスペ
クトル(MDCT係数)を複数の周波数領域に分割し、
そのスペクトルに基づいてスペクトルパワーをそれぞれ
の帯域毎に算出する。SNR算出部52bで信号対雑音
比を算出し、1次量子化ビット数算出部52cで、所望
のビットレートと信号対雑音比とに基づいて量子化ビッ
ト数nを算出する。量子化ノイズ算出部52dで、現フ
レームにおいて、算出されたnより量子化雑音パワーを
確定する。2次量子化ビット数算出部52eで、その現
フレームの量子化雑音パワーと、量子化ノイズ保存部5
2fに保存された前フレームの量子化雑音パワーとの差
分の絶対値を求め、それが所定値より小さくなるように
周波数帯域の個数を修正し、それに基づいてnを修正す
る。
Description
の記録媒体に音楽や音声等のディジタル信号を記録する
際に、これらの記録対象に適応して各周波数帯域のスペ
クトルに対するビット割り当てを行ってデータ量を圧縮
するディジタル信号符号化装置に関するものである。
で圧縮符号化する従来の方法として、ミニディスクで用
いられているATRAC(Adaptive Transform Acoustic
Coding)が挙げられる。このATRACでは、高能率で
圧縮するために、ディジタル信号を複数の周波数帯域
(サブバンド)に分割した後、可変長の時間単位で符号
化ユニットにブロック化してMDCT(Modified Discr
ete Cosine Transform)処理を施し、スペクトル信号に
変換し、さらに聴覚心理特性を利用して割り当てられた
ビット数で各スペクトル信号をそれぞれ符号化する。
聴覚心理特性には、等ラウドネス特性やマスキング効果
が挙げられる。等ラウドネス特性は、同じ音圧レベルの
音であっても、人間が感じ取る音の大きさが周波数によ
って変化することを表す。従って、等ラウドネス特性
は、人間が感じ取ることができる音の大きさである最小
可聴限が周波数によって変化することを表している。
グと経時マスキングとがある。同時マスキングは、複数
の周波数成分の音が同時に発生しているときに、ある音
が別の音を聞き取り難くさせる現象である。経時マスキ
ングは、大きな音の時間軸方向の前後でマスキングを受
ける現象である。
覚心理特性を利用して、要求される音質レベルと使用で
きるハードウェア能力とのバランスを考慮したアルゴリ
ズムを採用する必要がある。
法では、入力ディジタル信号に適応したビット割り当て
が以下のようにして行われている。まず、各周波数帯域
のパワーSを求め、そのパワーSによる他の周波数帯域
に対するマスキングしきい値Mを求める。次に、このマ
スキングしきい値Mと、各周波数帯域をnビットで量子
化したときの量子化雑音パワーN(n)とから、マスキ
ングしきい値対雑音比MNR(n)=M/N(n)を求
める。続いて、そのマスキングしきい値対雑音比MNR
(n)が最小となる周波数帯域にビット割り当てを行っ
た後、そのマスキングしきい値対雑音比MNR(n)を
更新し、再び最小の周波数帯域にビット割り当てを行
う。
の入力時に、瞬間的に経時変化の大きい信号が入力され
ると、同一周波数の量子化誤差が隣接するフレーム間で
変動し、それが異音として知覚されることがある。特
に、自身がマスキング効果の影響を受けないピーク周波
数の量子化誤差が変動した場合に異音として知覚され
る。
は、エネルギー分布に応じたビットの配分が必要となる
ため、これが適切に行われないと上記のような異音が生
じる。
処理単位時間)内でビット割り当てを行うので、そのフ
レーム内では最適な量子化ビット数を算出することがで
きるものの、前後のフレームの信号変化を的確にビット
割り当てに反映させることができない。特に、固定ビッ
トレートで圧縮を行う場合、隣接するフレームで信号エ
ネルギー成分が異なれば、同一周波数で量子化誤差の揺
らぎ(変動が)発生してしまう。
のであって、経時変化の小さい信号の入力時に入力され
た瞬間的に経時変化の大きい信号を符号化する際に、知
覚可能な音質劣化を軽減するディジタル信号符号化装置
を提供することを目的としている。
符号化装置は、ディジタル信号を所定の複数の周波数帯
域毎にスペクトルデータに変換し、各周波数帯域のスペ
クトルデータをそれぞれに応じて与えられたビット割当
量で符号化するディジタル信号符号化装置において、上
記の課題を解決するために、時間的に連続する各フレー
ムのビット割当量を前記周波数帯域毎に算出するビット
割当量算出手段と、このビット割当量算出手段によって
算出されたビット割当量の量子化誤差を算出する第1量
子化誤差算出手段と、前記ビット割当量算出手段によっ
て算出された、現フレームの1つ前の前フレームのビッ
ト割当量を基に、現フレームのビット割当量を修正する
ビット割当量修正手段と、前記ビット割当量修正手段に
よって得られた最終のビット割当量の量子化誤差を算出
する第2量子化誤差算出手段とを備え、上記ビット割当
量修正手段が、前記第1量子化誤差算出手段で算出され
た現フレームのビット割当量と前記第2量子化誤差算出
手段で算出された前フレームのビット割当量との量子化
誤差の差分を所定値より小さくなるように修正すること
を特徴としている。
当量が、ビット割当量算出手段によって算出されると、
そのビット割当量の量子化誤差が、第1量子化誤差算出
手段によって算出される。また、そのフレームに続くフ
レームのビット割当量の量子化誤差も同様にして算出さ
れる。これらの続く2つのフレームをそれぞれ前フレー
ムと現フレームとして、ビット割当量修正手段によっ
て、現フレームのビット割当量が前フレームのビット割
当量を基に修正される。この結果、最終のビット割当量
が得られる。そして、このビット割当量の量子化誤差
が、第2量子化誤差算出手段によって算出される。
現フレームのビット割当量の量子化誤差と、第2量子化
誤差算出手段で算出された前フレームとのビット割当量
の量子化誤差との差分が所定値より小さくなるように修
正される。これにより、経時変化の小さい信号の入力時
に入力された瞬間的に経時変化の大きい信号を符号化す
るような場合でも、隣接するフレーム間での同一周波数
の量子化誤差の変動が抑制される。
スペクトルデータのパワー、エネルギーまたはスケール
ファクタの最大値を抽出する最大値抽出手段を備え、前
記ビット割当量修正手段が、抽出された前記最大値が属
する周波数帯域で前記差分を修正することが好ましい。
このような構成では、スペクトルデータの上記の最大値
が、最大値抽出手段によって抽出されると、その最大値
でビット割当量修正手段による上記のビット割当量の修
正が行われる。これにより、ピーク周波数の量子化誤差
の変動が抑制される。
ルギーまたはスケールファクタの最大値が属する周波数
帯域の周波数をピーク周波数と称する。このピーク周波
数は、最小可聴限以上の信号レベルではマスキングされ
ずに可聴周波数となるので、量子化誤差の揺らぎ(変
動)が発生すると、最も異音として知覚されやすい周波
数である。それゆえ、上記のようにピーク周波数の量子
化誤差の変動を抑制することによって、マスキングしき
い値対雑音非を用いたビット割当法、信号対雑音比を用
いたビット割当法およびマスキングしきい値対雑音比と
信号対雑音比とを併用するビット割当法のいずれにも、
従来のビット割当法を用いた場合と比較して、同一周波
数の量子化誤差の変動が抑制される。
は、ディジタル信号を所定の複数の周波数帯域毎にスペ
クトルデータに変換し、各周波数帯域スペクトルの大き
さから、想定した各ビット数に対して各周波数帯域のマ
スキングしきい値対雑音比を求め、前記ビット数毎に前
記マスキングしきい値対雑音比が最小となる周波数帯域
から順に与えられたビット割当量で前記スペクトルデー
タを符号化するディジタル信号符号化装置において、上
記の課題を解決するために、時間的に連続する各フレー
ムのビット割当量を前記周波数帯域毎に算出するビット
割当量算出手段と、このビット割当量算出手段によって
算出されたビット割当量の量子化誤差を算出する第1量
子化誤差算出手段と、前記量子化誤差を非マスキング周
波数帯域について抽出する非マスキング周波数帯域抽出
手段と、前記ビット割当量算出手段によって算出され
た、現フレームの1つ前の前フレームのビット割当量を
基に、現フレームのビット割当量を修正するビット割当
量修正手段と、前記ビット割当量修正手段によって得ら
れた最終のビット割当量の量子化誤差を算出する第2量
子化誤差算出手段とを備え、上記ビット割当量修正手段
が、前記第1量子化誤差算出手段で算出された現フレー
ムのビット割当量と前記第2量子化誤差算出手段で算出
された前フレームのビット割当量との量子化誤差の差分
を前記非マスキング周波数帯域の量子化誤差について所
定値より小さくなるように修正することを特徴としてい
る。
当量がビット割当量算出手段によって算出されると、そ
のビット割当量の量子化誤差が第1量子化誤差算出手段
によって算出される。すると、マスキング周波数帯域抽
出手段によって、その量子化誤差が聴覚心理を用いて非
マスキング周波数帯域について抽出される。また、その
フレームに続くフレームのビット割当量の非マスキング
周波数帯域についての量子化誤差も同様にして算出され
る。これらの2つの続くフレームをそれぞれ前フレーム
と現フレームとして、ビット割当量修正手段によって、
現フレームのビット割当量が前フレームのビット割当量
を基に修正される。この結果、最終のビット割当量が得
られる。そして、このビット割当量の量子化誤差が第2
量子化誤差算出手段によって算出される。
現フレームのビット割当量の非マスキング周波数帯域に
ついての量子化誤差と、第2量子化誤差算出手段で算出
された前フレームのビット割当量の非マスキング周波数
帯域についての量子化誤差との差分が所定値より小さく
なるように修正される。これにより、経時変化の小さい
信号の入力時に入力された瞬間的に経時変化の大きい信
号を符号化するような場合でも、隣接するフレーム間で
の同一周波数の量子化誤差の変動が抑制される。
ディジタル信号を所定の符号化処理によって符号化して
記録媒体に記録するディジタル信号記録装置であって、
上記符号化処理を行うために、上記のいずれかのディジ
タル信号符号化装置を含んでいることを特徴としてい
る。この構成では、上記の各ディジタル信号符号化装置
によって、隣接するフレーム間での同一周波数の量子化
誤差の変動が抑制されることから、経時変化の小さい信
号の記録時に経時変化の大きい信号が入力されても、量
子化誤差に起因する上記のような音質の劣化の少ない信
号を記録することができる。
1ないし図11に基づいて説明すれば、以下の通りであ
る。
置について説明する。
置としての本ミニディスク装置において、入力端子1か
ら入力されたディジタル信号としてのディジタルオーデ
ィオ信号が、例えば、光信号としてシリアル入力され
る。この光信号は、光電素子2によって電気信号に変換
された後、ディジタルPLL回路(Phase-Locked-Loo
p)3に入力される。
ィジタルオーディオ信号からクロックの抽出を行うとと
もに、サンプリング周波数および量子化ビット数に対応
したマルチビットデータを再現する。このマルチビット
データは、信号源毎に対応したサンプリングレート(コ
ンパクトディスクでは44.1kHz、ディジタルオー
ディオテープレコーダでは48kHz、衛星放送(Aモ
ード)では32kHz)で標本化されたディジタルデー
タである。そこで、ディジタルPLL回路3から出力さ
れたマルチビットデータは、周波数変換回路4によっ
て、そのサンプリングレートをミニディスクの規格に対
応した44.1kHzに変換する。
によって入力されたディジタルオーディオデータの圧縮
符号化を行う。符号化されたディジタルオーディオデー
タは、ショックプルーフメモリコントローラ6を介して
信号処理回路7に送出される。ショックプルーフメモリ
コントローラ6によって制御されるショックプルーフメ
モリ8は、音声圧縮回路5から出力されるディジタルオ
ーディオデータの転送速度と、信号処理回路7に入力さ
れるディジタルオーディオデータの転送速度との差を吸
収するとともに、再生時における振動等の外乱による再
生信号の中断を補間し、ディジタルオーディオデータを
保護するために設けられている。
ーダとしての機能を備えている。エンコーダとしての機
能は、入力されたディジタルオーディオデータをシリア
ルの磁界変調信号にエンコードしてヘッド駆動回路9に
与える。デコーダとしての機能は、後述するRFアンプ
13からのシリアル信号をディジタルオーディオデータ
にデコードしてショックプルーフメモリコントローラ6
に与えるヘッド駆動回路9は、記録時に、記録ヘッド1
0をミニディスク11上の所定の記録位置に移動させる
とともに、上記の磁界変調信号に対応した磁界を発生さ
せる。この状態で、ミニディスク11上の所定の記録位
置には、光ピックアップ12からレーザ光が照射されて
いる。これにより、上記の磁界に対応した磁化パターン
がミニディスク11上に形成される。
から上記の磁化パターンに対応したシリアル信号を読み
取る。このシリアル信号は、高周波アンプ(以降、RF
アンプと称する)13で増幅された後、信号処理回路7
によってディジタルオーディオデータにデコードされ
る。このディジタルオーディオデータは、ショックプル
ーフメモリコントローラ6およびショックプルーフメモ
リ8によって外乱による影響が除去された後、音声伸長
回路14に送出される。
る圧縮符号化の逆変換処理(伸長復号化)を行い、フル
ビットのディジタルオーディオデータを復調する。復調
されたディジタルオーディオデータは、ディジタル/ア
ナログ変換回路(以降、A/D変換回路と称する)15
によってアナログオーディオ信号に変換され、出力端子
16から外部へ出力される。
は、サーボ回路17にも入力される。サーボ回路17
は、再生されたシリアル信号に応じてドライバ回路18
に制御信号を送出し、そのドライバ回路18を介してス
ピンドルモータ19の回転速度をフィードバック制御す
る。このようなフィードバック制御により、ミニディス
ク11を線速度一定で回転させることができる。
8を介して送りモータ20の回転速度もフィードバック
制御する。このようなフィードバック制御により、ミニ
ディスク11の半径方向に対する光ピックアップ12の
変移制御、すなわちトラッキング制御を行うことができ
る。さらに、サーボ回路17は、ドライバ回路18を介
して光ピックアップ12のフォーカシング制御も行う。
2、RFアンプ14、サーボ回路17、ドライバ回路1
8等には、図示しない電源回路から電力が供給される
が、このような電力供給動作や後述する信号処理動作
は、全てシステムコントロールマイクロコンピュータ2
1によって集中管理されている。このシステムコントロ
ールマイクロコンピュータ21には、曲名入力、選曲操
作、音質調整動作等を行うための入力装置22が接続さ
れている。
号化装置としての前述の音声圧縮回路5におけるディジ
タルデータ符号化処理について説明する。その前に、ま
ず、ミニディスク11等で利用する前述のATRACに
よる符号化・復号化処理について説明する。
ペクトル変換部51およびビット割当処理部52を有し
ている。
4.1kHzのサンプリング周波数でサンプリングされ
たオーディオ信号(マルチビットデータ)を、帯域分割
フィルタであるQMF(Quadrature Mirror Filter)に
よって複数の周波数帯域(サブバンドフレーム)に分割
する。また、スペクトル変換部51は、分割されたサブ
バンドフレーム単位で前述のMDCT処理を行い、各帯
域の周波数成分のMDCT係数(スペクトルデータ)を
生成する。このときのMDCT処理は、次式(1)で表
される。
係数を、i個の各周波数帯域のスペクトルパワーSi
(i=1,2,…,I;例えばI=25)に変換し、各
スペクトルパワーに対して後述のようにしてビット割当
処理を行う。このスペクトルパワーSiは、臨界帯域
(単位Bark)等が用いられる。臨界帯域は、周波数選択
性、マスキングしきい値等の特定の音響心理学的規則性
が有効な広帯域オーディオスペクトルの特性的部分のこ
とである。
いて詳細に説明する。
に、パワー算出部52a、SNR算出部52b、1次量
子化ビット数算出部52c、量子化ノイズ算出部52
d、2次量子化ビット数算出部52eおよび量子化ノイ
ズ保存部52fを備えている。
ており、前述のMDCT処理によって得られたMDCT
係数を臨界帯域等の各周波数帯域に分割し、各周波数帯
域に属するMDCT係数の2乗和から、前記のスペクト
ルパワーSiをそれぞれの帯域について算出する。ここ
で、パワーとは、単位時間当たりのエネルギーのことを
いう。
SiとこのスペクトルパワーSiをnビットで量子化し
たときの量子化雑音パワーNi(n)とから、信号対雑
音比SNRi(n)=Si/Ni(n)を算出する。こ
のSNRi(n)は、統計的には、信号の特性に応じた
定数となるので、統計処理によって予め求められていて
もよい。
ビット数算出部52cは、所望のビットレートと上記の
SNRi(n)とに基づいて前述の反復法を用いて量子
化ビット数を算出する。ここでは、前述の反復法におけ
るマスキングしきい値Mを信号Sに置き換えて量子化ビ
ット数を算出する。
イズ算出部52dは、現フレームにおいて、前記の処理
で求めたnより量子化雑音パワーNi(n)を確定す
る。
ビット数算出部52eは、量子化ノイズ保存部52fに
保存された前フレームの量子化雑音パワーNi(n)
と、量子化ノイズ算出部52dで算出された現フレーム
の量子化雑音パワーNi(n)との差分の絶対値を求
め、その絶対値が所定値より小さくなるように、周波数
帯域の個数iを修正し、その個数iに基づいて、1次量
子化ビット数算出部52cで算出された量子化ビット数
を修正する。
イズ保存部52fは、2次量子化ビット数算出部52で
算出された各周波数帯域の最終量子化ビット数nから前
フレームの量子化雑音パワーNi(n)を算出し、保存
する。この量子化ノイズ保存部52fは、保存した前フ
レームの量子化雑音パワーNi(n)を2次量子化ビッ
ト数算出部52eでの上記の差分を求めるために、2次
量子化ビット数算出部52eに与える。
52においては、次のようにして割当処理が行われる。
わち、初期フレームの場合、2次量子化ビット数算出部
52eでのビット数算出処理を行わずに、1次量子化ビ
ット数算出部52cのnが最終量子化ビット数となる。
次に、量子化ノイズ保存部52fは、時間t1のフレー
ムを前フレームとして、各周波数帯域の最終量子化ビッ
ト数nから時間t1のフレームの量子化雑音パワーNit1
(n)を算出して保存する。
ム処理では、パワー算出部52a、SNR算出部52
b、1次量子化ビット数算出部52cおよび量子化ノイ
ズ算出部52dまで、初期フレームと同様の処理が行わ
れ、量子化雑音パワーNit2'(n)が算出される。2次
量子化ビット数算出部52eでは、まず、時間t1の量
子化雑音パワーNit1(n)と時間t2の量子化雑音パワ
ーNit2'(n)との差分が求められる。図4において、
時間t1の全帯域のパワー(=Σsit1)と時間t2の全
帯域のパワー(=Σsit2')との関係は、Σsit1<Σsit
2'である。従って、固定ビットレートの場合には、おお
むね、各周波数帯域でNit1(n)<Nit2'(n)の関係
が成立している。
は、例えば、Siの周波数帯域とパワーとを参照して、
|Nit2'(n)−Nit1(n)|で表される差分を、|Nit
2'(n)−Nit1(n)|<12dB(所定値)となるよ
うに、0〜25のiの値について修正する。図5に示す
例では、時間t2にフレームについて、4つのサブバン
ドフレームSB1〜SB4に対し、低域のビット割当量
が増加修正され、高域のビット割当量が削減修正されて
いることを示す。この補正においては、補正対象となる
周波数帯域のビット割当量を聴覚心理特性や信号のパワ
ーに応じて重み付けして修正するのがより好ましい。
は、1次量子化ビット数算出部52cで算出したビット
割当量(量子化ビット数)を2次量子化ビット数算出部
52eで修正する際に、量子化ノイズ保存部52fで算
出して保存した前フレームの量子化雑音パワー(量子化
誤差)と、量子化ノイズ算出部52dで算出した現フレ
ームの量子化雑音パワー(量子化誤差)との差分が所定
値より小さくなるように修正を行う。これにより、経時
変化の小さい信号の入力時に、瞬間的に経時変化の大き
い信号が入力されるような場合でも、隣接するフレーム
間での同一周波数の量子化誤差の変動が抑制される。
て説明する。
うに、図1に示すビット割当処理部52におけるパワー
算出部52a、量子化ノイズ算出部52d、2次量子化
ビット数算出部52eおよび量子化ノイズ保存部52f
を備えるとともに、マスキング算出部52g、最小可聴
限合成部52h、SMR算出部52i、MNR算出部5
2j、1次量子化ビット数算出部52kおよび非マスキ
ング領域抽出部52mを備えている。
トルパワーSiより、公知の手段によってマスキングし
きい値を算出する。例えば、MPEG1の聴覚心理モデ
ル1を用いれば以下のような式になる。
ックス)毎に算出し、重複する周波数については最大の
Vfを選択することによってマスキングしきい値が求め
られる。マスキングしきい値を算出するための方法とし
ては、その他、いくつかの公知の方法があるので、上記
の方法には限定されない。
れる最小可聴限特性等と上記のマスキング算出部52g
で求めたマスキングしきい値とを合成して、図7に示す
ような最終のマスキングしきい値Miを各周波数帯域に
ついて決定する。最小可聴限特性は、予めテーブルRO
Mに格納されていてもよい。
のiとすると、パワー算出部52aで求めたスペクトル
パワーSiと、最小可聴限合成部52hで求めた各周波
数帯域のマスキングしきい値Miとの比SMRi=Si
/Miを全ての周波数帯域にわたって計算する。なお、
上記のfは周波数(Hz)である。
記のスペクトルパワーSiをnビットで量子化したとき
の、このスペクトルパワーSiと量子化雑音パワーNi
(n)との比SNRi(n)=Si/Ni(n)を算出
し、この比SNRi(n)と前記のSMRiとの比か
ら、マスキングしきい値と量子化雑音パワーとの比MN
Ri(n)=SNRi(n)/SMRiが求められる。
上記の比SNR(n)は、統計的には、信号の特性に応
じた特性となるので、統計処理によって求めておいても
よい。
R算出部52jで求められたマスキングしきい値と量子
化雑音パワーとの比MNRi(n)に基づいて、各周波
数帯域の量子化ビット数を次のようにして割り当てる。
ビット数nを0から大きくしていき、その都度、各周波
数帯域のマスキングしきい値と量子化雑音パワーとの比
MNRi(n)を計算し、その比MNRi(n)が最小
となる周波数帯域から順にビットを割り当てていき、前
記の量子化ビット数nを更新する毎に、同様に比MNR
i(n)が最小となる周波数帯域にビットの割り当てを
行い、ビットレートに応じた所定の割当可能ビット数と
なるまで割り当てを行う。すなわち、前記のスペクトル
パワーSiが、しきい値Miを超えた部分が最も大きい
周波数帯域から順次ビット割り当てが行われることにな
る。
非マスキング領域抽出部52mは、前述の比SMRiに
基づいて非マスキング領域(非マスキング周波数帯域)
を聴覚心理を用いて抽出する。具体的には、前述の比S
MRiが1を超える周波数帯域が非マスキング周波数帯
域であり、比SMRiが1以下である周波数帯域がマス
キング周波数帯域であることから、各周波数帯域につい
てSMRi>1を判定し、非マスキング周波数帯域を求
める。
eは、非マスキング周波数帯域のみに対し、|Nit2'
(n)−Nit1(n)|>12dBとなるnについて|Ni
t2'(n)−Nit1(n)|<12dBとなるように、i
=0,…,25まで修正を施す。
ット数は、図8に示すマスキング周波数帯域SiM(斜
線部)内で調整される。
図1のビット割当処理部52と同様に、1次量子化ビッ
ト数算出部52kで算出したビット割当量(量子化ビッ
ト数)を2次量子化ビット数算出部52eで修正する
が、非マスキング領域抽出部52mで抽出した非マスキ
ング周波数帯域に対してのみ修正を行う。これにより、
音楽や音声のように非マスキング周波数帯域の成分を多
く含むために聴覚心理特性を利用することが好ましいソ
ースに対して、量子化誤差の変動によって発生する異音
として知覚可能な音質の劣化を低減することができる。
2について説明する。
うに、図1に示すビット割当処理部52と同様、パワー
算出部52a、量子化ノイズ算出部52d、1次量子化
ビット数算出部52c、量子化ノイズ算出部52d、2
次量子化ビット数算出部52eおよび量子化ノイズ保存
部52fを備えており、さらにパワー最大帯域抽出部5
2nを備えている。
出部52nは、パワー算出部52aで算出された前述の
スペクトルパワーSiの中からスペクトルパワー最大値
Max(Si)を抽出する。具体的には、パワー最大帯域抽出
部52nは、スペクトルパワーSi(i=1,2,…,
I)の中から最大となるSiのインデックスiを抽出す
ることでスペクトルパワー最大値Max(Si)を抽出する。
述するエネルギーの最大値を抽出する場合、エネルギー
Ei(i=1,2,…,I)の中から最大となるエネル
ギーEiのインデックスiを抽出する。また、パワー最
大帯域抽出部52nは、後述するスケールファクタの最
大値を抽出する場合、スケールファクタSFi(i=
1,2,…,I)の中から最大となるスケールファクタ
SFiのインデックスiを抽出する。このスケールファ
クタは、スペクトルデータのスケール(大きさ)の因子
を表しており、一般的には、量子化される周波数単位の
中で、最大スペクトルの絶対値をコード化することによ
って算出される。
は、上記のスペクトルパワー最大値Max(Si)に対しての
み、|Nit2'(n)−Nit1(n)|で表される差分が|N
it2'(n)−Nit1(n)|>12dBであれば、その差
分を|Nit2'(n)−Nit1(n)|<12dBとなるよ
うに修正を施す。また、上記のスペクトルデータのエネ
ルギーまたはスケールファクタの最大値がそれぞれ抽出
される場合は、それらに対してのみ上記のようにして量
子化ビット数を修正する。
化ビット数は、図10に示すパワー最大帯域SiE(斜
線部)以外の帯域の量子化ビット数を用いて調整され
る。
図1のビット割当処理部52と同様に、1次量子化ビッ
ト数算出部52cで算出したビット割当量(量子化ビッ
ト数)を2次量子化ビット数算出部52eで修正する
が、パワー最大帯域抽出部52nで抽出したスペクトル
パワー最大値(ピーク周波数)に対してのみ修正を行
う。これにより、ピーク周波数の量子化誤差の変動が抑
制される。上記のピーク周波数は、スペクトルデータの
パワー、エネルギーまたは指標(スケールファクタ)の
いずれかの最大値が属する周波数帯域の周波数を総称し
たものである。
ないため(最小可聴限の影響を受けることはある)、聴
覚心理上重要な周波数である。つまり、ピーク周波数
は、最小可聴限以上の信号レベルではマスキングされず
に可聴周波数となるので、量子化誤差の揺らぎ(変動)
が発生すると、最も異音として知覚されやすい周波数で
ある。
動を抑制することによって、マスキングしきい値対雑音
非を用いたビット割当法、信号対雑音比を用いたビット
割当法およびマスキングしきい値対雑音比と信号対雑音
比とを併用するビット割当法のいずれにも、従来のビッ
ト割当法を用いた場合と比較して、同一周波数の量子化
誤差の変動を抑制することができる。
が、図1、図6および図9のビット割当処理部52を含
む音声圧縮回路5を含むことによって、上記のように、
量子化誤差の変動が抑制されたディジタルオーディオデ
ータの圧縮符号化を行うことができる。それゆえ、経時
変化の小さい信号の記録時に経時変化の大きい信号が入
力されても、量子化誤差に起因する音質の劣化の少ない
信号を記録することができる。
は、実施の形態においてミニディスク装置に適用されて
いるが、同様な符号化を必要とする他の装置にも適用で
きることは勿論である。
符号化装置は、時間的に連続する各フレームのビット割
当量を周波数帯域毎に算出するビット割当量算出手段
と、このビット割当量算出手段によって算出されたビッ
ト割当量の量子化誤差を算出する第1量子化誤差算出手
段と、前記ビット割当量算出手段によって算出された、
現フレームの1つ前の前フレームのビット割当量を基
に、現フレームのビット割当量を修正するビット割当量
修正手段と、前記ビット割当量修正手段によって得られ
た最終のビット割当量の量子化誤差を算出する第2量子
化誤差算出手段とを備え、上記ビット割当量修正手段
が、前記第1量子化誤差算出手段で算出された現フレー
ムのビット割当量と前記第2量子化誤差算出手段で算出
された前フレームのビット割当量との量子化誤差の差分
を所定値より小さくなるように修正する構成である。
修正時には、現フレームのビット割当量の量子化誤差
と、第2量子化誤差算出手段で算出された前フレームと
のビット割当量の量子化誤差との差分が所定値より小さ
くなるように修正される。それゆえ、経時変化の小さい
信号の入力時に、瞬間的に経時変化の大きい信号が入力
されるような場合でも、隣接するフレーム間での同一周
波数の量子化誤差の変動が抑制される。したがって、そ
の量子化誤差の変動によって発生する異音として知覚可
能な音質の劣化を低減することができるという効果を奏
する。
スペクトルデータのパワー、エネルギーまたはスケール
ファクタの最大値を抽出する最大値抽出手段を備え、前
記ビット割当量修正手段が、抽出された前記最大値が属
する周波数帯域で前記差分を修正することによって、ス
ペクトルデータのパワー、エネルギーまたはスケールフ
ァクタの最大値が属する周波数帯域の周波数であるピー
ク周波数の量子化誤差の変動が抑制される。これによ
り、マスキングしきい値対雑音非を用いたビット割当
法、信号対雑音比を用いたビット割当法およびマスキン
グしきい値対雑音比と信号対雑音比とを併用するビット
割当法のいずれにも、従来のビット割当法を用いた場合
と比較して、同一周波数の量子化誤差の変動が抑制され
る。したがって、経時変化に起因する知覚可能な音質劣
化を低減することができるという効果を奏する。
は、時間的に連続する各フレームのビット割当量を前記
周波数帯域毎に算出するビット割当量算出手段と、この
ビット割当量算出手段によって算出されたビット割当量
の量子化誤差を算出する第1量子化誤差算出手段と、前
記量子化誤差を非マスキング周波数帯域について抽出す
る非マスキング周波数帯域抽出手段と、前記ビット割当
量算出手段によって算出された、現フレームの1つ前の
前フレームのビット割当量を基に、現フレームのビット
割当量を修正するビット割当量修正手段と、前記ビット
割当量修正手段によって得られた最終のビット割当量の
量子化誤差を算出する第2量子化誤差算出手段とを備
え、上記ビット割当量修正手段が、前記第1量子化誤差
算出手段で算出された現フレームのビット割当量と前記
第2量子化誤差算出手段で算出された前フレームのビッ
ト割当量との量子化誤差の差分を前記非マスキング周波
数帯域の量子化誤差について所定値より小さくなるよう
に修正する構成である。
修正時には、現フレームのビット割当量の非マスキング
周波数帯域についての量子化誤差と、第2量子化誤差算
出手段で算出された前フレームのビット割当量の非マス
キング周波数帯域についての量子化誤差との差分が所定
値より小さくなるように修正される。それゆえ、経時変
化の小さい信号の入力時に、瞬間的に経時変化の大きい
信号が入力されるような場合でも、隣接するフレーム間
での同一周波数の量子化誤差の変動が抑制される。した
がって、音楽や音声のように聴覚心理特性を利用するこ
とが好ましいソースに対して、量子化誤差の変動によっ
て発生する異音として知覚可能な音質の劣化を低減する
ことができるという効果を奏する。
ディジタル信号を所定の符号化処理によって符号化して
記録媒体に記録するディジタル信号記録装置であって、
上記符号化処理を行うために、上記のいずれかのディジ
タル信号符号化装置を含んでいる構成である。
て、隣接するフレーム間での同一周波数の量子化誤差の
変動が抑制されることから、経時変化の小さい信号の記
録時に経時変化の大きい信号が入力されても、量子化誤
差に起因する上記のような音質の劣化の少ない信号を記
録することができる。したがって、高音質での記録が可
能なディジタル信号記録装置を提供することができると
いう効果を奏する。
における音声圧縮回路のビット割当処理部の構成を示す
ブロック図である。
であなる。
る。
求められた各周波数帯域のスペクトルパワーを示す図面
である。
ビット割り当てを示す図面である。
である。
で求められた各周波数帯域のスペクトルパワーを示す図
面である。
のビット割り当てを示す図面である。
ック図である。
部で求められた各周波数帯域のスペクトルパワーを示す
図面である。
へのビット割り当てを示す図面である。
出手段) 52d 量子化ノイズ算出部(第1量子化誤差算出手
段) 52e 2次量子化ビット数算出部(ビット割当量修
正手段) 52f 量子化ノイズ保存部(第2量子化誤差算出手
段) 52m 非マスキング領域抽出部(非マスキング周波
数帯域抽出手段) 52n パワー最大帯域抽出部(最大値抽出手段)
Claims (4)
- 【請求項1】ディジタル信号を所定の複数の周波数帯域
毎にスペクトルデータに変換し、各周波数帯域のスペク
トルデータをそれぞれに応じて与えられたビット割当量
で符号化するディジタル信号符号化装置において、 時間的に連続する各フレームのビット割当量を前記周波
数帯域毎に算出するビット割当量算出手段と、 前記ビット割当量算出手段によって算出されたビット割
当量の量子化誤差を算出する第1量子化誤差算出手段
と、 前記ビット割当量算出手段によって算出された、現フレ
ームの1つ前の前フレームのビット割当量を基に、現フ
レームのビット割当量を修正するビット割当量修正手段
と、 前記ビット割当量修正手段によって得られた最終のビッ
ト割当量の量子化誤差を算出する第2量子化誤差算出手
段とを備え、 上記ビット割当量修正手段が、前記第1量子化誤差算出
手段で算出された現フレームのビット割当量と前記第2
量子化誤差算出手段で算出された前フレームのビット割
当量との量子化誤差の差分を所定値より小さくなるよう
に修正することを特徴とするディジタル信号符号化装
置。 - 【請求項2】前記スペクトルデータのパワー、エネルギ
ーまたはスケールファクタの最大値を抽出する最大値抽
出手段を備え、 前記ビット割当量修正手段が、抽出された前記最大値が
属する周波数帯域で前記差分を修正することを特徴とす
る請求項1に記載のディジタル信号符号化装置。 - 【請求項3】ディジタル信号を所定の複数の周波数帯域
毎にスペクトルデータに変換し、各周波数帯域スペクト
ルの大きさから、想定した各ビット数に対して各周波数
帯域のマスキングしきい値対雑音比を求め、前記ビット
数毎に前記マスキングしきい値対雑音比が最小となる周
波数帯域から順に与えられたビット割当量で前記スペク
トルデータを符号化するディジタル信号符号化装置にお
いて、 時間的に連続する各フレームのビット割当量を前記周波
数帯域毎に算出するビット割当量算出手段と、 前記ビット割当量算出手段によって算出されたビット割
当量の量子化誤差を算出する第1量子化誤差算出手段
と、 前記量子化誤差を非マスキング周波数帯域について抽出
する非マスキング周波数帯域抽出手段と、 前記ビット割当量算出手段によって算出された、現フレ
ームの1つ前の前フレームのビット割当量を基に、現フ
レームのビット割当量を修正するビット割当量修正手段
と、 前記ビット割当量修正手段によって得られた最終のビッ
ト割当量の量子化誤差を算出する第2量子化誤差算出手
段とを備え、 上記ビット割当量修正手段が、前記第1量子化誤差算出
手段で算出された現フレームのビット割当量と前記第2
量子化誤差算出手段で算出された前フレームのビット割
当量との量子化誤差の差分を前記非マスキング周波数帯
域の量子化誤差について所定値より小さくなるように修
正することを特徴とするディジタル信号符号化装置。 - 【請求項4】入力ディジタル信号を所定の符号化処理に
よって符号化して記録媒体に記録するディジタル信号記
録装置であって、 上記符号化処理を行うために、請求項1ないし3のいず
れか1項に記載のディジタル信号符号化装置を含んでい
ることを特徴とするディジタル信号記録装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001376308A JP3942882B2 (ja) | 2001-12-10 | 2001-12-10 | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001376308A JP3942882B2 (ja) | 2001-12-10 | 2001-12-10 | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003177797A true JP2003177797A (ja) | 2003-06-27 |
JP3942882B2 JP3942882B2 (ja) | 2007-07-11 |
Family
ID=19184530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001376308A Expired - Fee Related JP3942882B2 (ja) | 2001-12-10 | 2001-12-10 | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3942882B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007525707A (ja) * | 2004-02-18 | 2007-09-06 | ヴォイスエイジ・コーポレーション | Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス |
JP2007534986A (ja) * | 2004-04-20 | 2007-11-29 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 知覚コーディングのビット割り当てにおける複雑さを軽減した計算方法 |
WO2008155835A1 (ja) * | 2007-06-20 | 2008-12-24 | Fujitsu Limited | 復号装置、復号方法、及びプログラム |
JP2009501359A (ja) * | 2005-07-15 | 2009-01-15 | サムスン エレクトロニクス カンパニー リミテッド | オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置 |
JP2012118205A (ja) * | 2010-11-30 | 2012-06-21 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP2016538589A (ja) * | 2013-12-02 | 2016-12-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 符号化方法および装置 |
-
2001
- 2001-12-10 JP JP2001376308A patent/JP3942882B2/ja not_active Expired - Fee Related
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007525707A (ja) * | 2004-02-18 | 2007-09-06 | ヴォイスエイジ・コーポレーション | Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス |
US7933769B2 (en) | 2004-02-18 | 2011-04-26 | Voiceage Corporation | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US7979271B2 (en) | 2004-02-18 | 2011-07-12 | Voiceage Corporation | Methods and devices for switching between sound signal coding modes at a coder and for producing target signals at a decoder |
JP4861196B2 (ja) * | 2004-02-18 | 2012-01-25 | ヴォイスエイジ・コーポレーション | Acelp/tcxに基づくオーディオ圧縮中の低周波数強調の方法およびデバイス |
JP4903130B2 (ja) * | 2004-04-20 | 2012-03-28 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 知覚コーディングのビット割り当てにおける複雑さを軽減した計算方法 |
JP2007534986A (ja) * | 2004-04-20 | 2007-11-29 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 知覚コーディングのビット割り当てにおける複雑さを軽減した計算方法 |
US8615391B2 (en) | 2005-07-15 | 2013-12-24 | Samsung Electronics Co., Ltd. | Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same |
JP2009501359A (ja) * | 2005-07-15 | 2009-01-15 | サムスン エレクトロニクス カンパニー リミテッド | オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置 |
JPWO2008155835A1 (ja) * | 2007-06-20 | 2010-08-26 | 富士通株式会社 | 復号装置、復号方法、及びプログラム |
US8225160B2 (en) | 2007-06-20 | 2012-07-17 | Fujitsu Limited | Decoding apparatus, decoding method, and recording medium |
WO2008155835A1 (ja) * | 2007-06-20 | 2008-12-24 | Fujitsu Limited | 復号装置、復号方法、及びプログラム |
JP2012118205A (ja) * | 2010-11-30 | 2012-06-21 | Fujitsu Ltd | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP2016538589A (ja) * | 2013-12-02 | 2016-12-08 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 符号化方法および装置 |
US9754594B2 (en) | 2013-12-02 | 2017-09-05 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
US10347257B2 (en) | 2013-12-02 | 2019-07-09 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
US11289102B2 (en) | 2013-12-02 | 2022-03-29 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP3942882B2 (ja) | 2007-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3328532B2 (ja) | デジタルデータの符号化方法 | |
US6169973B1 (en) | Encoding method and apparatus, decoding method and apparatus and recording medium | |
US5471558A (en) | Data compression method and apparatus in which quantizing bits are allocated to a block in a present frame in response to the block in a past frame | |
US5649053A (en) | Method for encoding audio signals | |
JP3203657B2 (ja) | 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体 | |
JP3173218B2 (ja) | 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体 | |
US6850578B1 (en) | Digital signal processing apparatus and digital processing method | |
JP3186307B2 (ja) | 圧縮データ記録装置及び方法 | |
US6604069B1 (en) | Signals having quantized values and variable length codes | |
US20040181395A1 (en) | Scalable stereo audio coding/decoding method and apparatus | |
US6647063B1 (en) | Information encoding method and apparatus, information decoding method and apparatus and recording medium | |
JP3942882B2 (ja) | ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置 | |
JP3776004B2 (ja) | ディジタルデータの符号化方法 | |
JP4649351B2 (ja) | デジタルデータ復号化装置 | |
JP4271588B2 (ja) | ディジタルデータの符号化方法および符号化装置 | |
JP4822697B2 (ja) | ディジタル信号符号化装置およびディジタル信号記録装置 | |
JP4293833B2 (ja) | ディジタル信号記録再生装置及びその制御プログラム | |
JP3334374B2 (ja) | ディジタル信号圧縮方法及び装置 | |
JP3454394B2 (ja) | 音声の準可逆符号化装置 | |
JPH11330974A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JP3175456B2 (ja) | ディジタル信号処理装置 | |
JP3227948B2 (ja) | 復号化装置 | |
JPH07336231A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 | |
JP3227945B2 (ja) | 符号化装置 | |
JP4732478B2 (ja) | ディジタル信号再生装置、及びその制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060613 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060811 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070404 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100413 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110413 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120413 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120413 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130413 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130413 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |