JP3334374B2 - ディジタル信号圧縮方法及び装置 - Google Patents

ディジタル信号圧縮方法及び装置

Info

Publication number
JP3334374B2
JP3334374B2 JP26501094A JP26501094A JP3334374B2 JP 3334374 B2 JP3334374 B2 JP 3334374B2 JP 26501094 A JP26501094 A JP 26501094A JP 26501094 A JP26501094 A JP 26501094A JP 3334374 B2 JP3334374 B2 JP 3334374B2
Authority
JP
Japan
Prior art keywords
digital signal
circuit
data
bits
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26501094A
Other languages
English (en)
Other versions
JPH08125543A (ja
Inventor
浩之 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP26501094A priority Critical patent/JP3334374B2/ja
Publication of JPH08125543A publication Critical patent/JPH08125543A/ja
Application granted granted Critical
Publication of JP3334374B2 publication Critical patent/JP3334374B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタルオーディオ
信号等をビット圧縮した圧縮データの記録再生に関し、
特に、入力信号の時間軸上の波形の振幅変化に応じて、
その処理ブロックの時間的大きさを変化させるような、
ディジタル信号を情報圧縮して記録若しくは伝送するデ
ィジタル信号圧縮方法及び装置に関する。
【0002】
【従来の技術】本件出願人は、先に、入力されたディジ
タルオーディオ信号をビット圧縮し、所定のデータ量を
記録単位としてバースト的に記録するような技術を、例
えば特願平2−221364号、特願平2−22136
5号、特願平2−222821号、特願平2−2228
23号の各明細書及び図面等において提案している。
【0003】この技術は、記録媒体として光磁気ディス
クを用い、いわゆるCD−I(CD−インタラクティ
ブ)やCD−ROM XAのオーディオデータフォーマ
ットに規定されているAD(適応差分)PCMオーディ
オデータを記録再生するものであり、このADPCMデ
ータの例えば32セクタ分とインターリーブ処理のため
のリンキング用の数セクタとを記録単位として、光磁気
ディスクにバースト的に記録している。
【0004】この光磁気ディスクを用いた記録再生装置
におけるADPCMオーディオにはいくつかのモードが
選択可能になっており、例えば通常のCDの再生時間に
比較して、2倍の圧縮率でサンプリング周波数が37.
8kHzのレベルA、4倍の圧縮率でサンプリング周波
数が37.8kHzのレベルB、8倍の圧縮率でサンプ
リング周波数が18.9kHzのレベルCが規定されて
いる。すなわち、例えば上記レベルBの場合には、ディ
ジタルオーディオデータが略々1/4に圧縮され、この
レベルBのモードで記録されたディスクの再生時間(プ
レイタイム)は、標準的なCDフォーマット(CD−D
Aフォーマット)の場合の4倍となる。これは、より小
型のディスクで標準12cmと同じ程度の記録再生時間
が得られることから、装置の小型化が図れることにな
る。
【0005】ただし、ディスクの回転速度は標準的なC
Dと同じであるため、例えば上記レベルBの場合、所定
時間当たりその4倍の再生時間分の圧縮データが得られ
ることになる。このため、例えばセクタやクラスタ等の
時間単位で同じ圧縮データを重複して4回読み出すよう
にし、そのうちの1回分の圧縮データのみをオーディオ
再生にまわすようにしている。具体的には、スパイラル
状の記録トラックを走査(トラッキング)する際に、1
回転毎に元のトラック位置に戻るようなトラックジャン
プを行って、同じトラックを4回ずつ繰り返しトラッキ
ングするような形態で再生動作を進めることになる。こ
れは、例えば4回の重複読み取りの内、少なくとも1回
だけ正常な圧縮データが得られればよいことになり、外
乱等によるエラーに強く、特に携帯用小型機器に適用し
て好ましいものである。
【0006】
【発明が解決しようとする課題】しかしながら、前述の
技術を用いた応用例の殆どの場合において、記録媒体や
伝送経路の都合上、使用可能なビットレートの上限が規
定される為、より多くのビットを割当る方が望ましい信
号、例えば、矩形波や多数の正弦波の合成信号の圧縮に
対し、ビット数が不足する場合が生じる。この際は、応
用例の要求される特性に応じた処理が行われることが一
般的である。使用可能なビットレートの上限が規定され
ていると言うことは、即ち、圧縮後の一定時間(処理ブ
ロック)内のエネルギ量の上限が規定されていることに
等しく、一定時間内における周波数幅或いは記録又は伝
送帯域と各周波数におけるS/Nの積が先の上限によっ
て制限されている事を示している。
【0007】従って、上述のビット数が不足した場合の
処理は、通常の処理方法を取る限り、一定時間内におけ
る周波数幅或いは記録又は伝送帯域と各周波数における
S/Nの積が一定以下と言う条件下での処理となるた
め、必然的に、周波数幅を削減するか、各周波数におけ
るS/Nを削減するか、或いは、双方を削減するかに帰
着する。周波数幅を削減した場合、入力信号の音質に与
える影響が問題となり、各周波数におけるS/Nを削減
した場合は、発生したノイズ或いは歪みが聴感上の問題
となる可能性が高まる。以上のような問題を内在してい
るため、先のビット数が不足した場合の処理は、如何に
入力信号に適応させ、音質変化が目立たずに、ノイズ或
いは歪みが聴感上の問題とならない範囲に止めるとい
う、非常に難しい調整を余儀なくされる。この問題は、
使用可能なビットレートが低くなる程、大きな問題とな
り、ある値以下では、事実上、調整が不可能となり、通
常では、その値をもって当該圧縮手法の限界とされてい
る。
【0008】本発明はこの様な実情に鑑みてなされたも
のであり、入力信号の特性を変化させることにより、聴
感上の音質変化、並びに、ノイズ或いは歪み問題を容易
に調整することが可能なビットの割当の手法が適用され
るディジタル信号圧縮方法及び装置の提供を目的とする
ものである。
【0009】
【課題を解決するための手段】本発明に係るディジタル
信号圧縮方法及び装置は、上述の目的を達成するために
提案されたものであり、入力ディジタル信号をブロック
化してスペクトルデータに変換し、時間と周波数につい
て細分化した小ブロック毎に、圧縮のためのビット割当
を行って情報圧縮する際に、規定されたビット数と上記
ビット割当を行ったビットの総数との差を重み付けして
各小ブロックに割り振り、割り振られた各小ブロックの
ビット数を当該ブロックのスペクトルデータのレベルに
変換し、変換されたレベルに基づいて各小ブロック内の
スペクトルデータを補正することによるスペクトルデー
タ特性変更の処理を少なくとも1回実行して、ビット割
当の制御を行うことを特徴とするものである。
【0010】また、本発明のディジタル信号圧縮方法及
び装置は、時間軸上のスペクトルデータを得、上記時間
軸上のスペクトルデータから許容可能なノイズスペクト
ルを求め、上記求めた許容可能なノイズスペクトルを時
間と周波数について細分化した小ブロックに分配し、圧
縮のためのビット割当を行い、規定されたビット数と上
記求めたビット割当数との差からレベル差を求め、上記
求めたレベル差を基に入力信号の周波数軸上のスペクト
ルデータの特性を変化させてビット割当数の制御を行う
ことも特徴とする。
【0011】さらに、本発明のディジタル信号圧縮方法
及び装置は、許容可能なノイズスペクトルを求め、上記
求めた許容ノイズスペクトルを時間と周波数について細
分化した小ブロックに分配し、圧縮のためのビット割当
を行い、規定されたビット数と上記求めたビット割当数
との差からレベル差を求め、上記レベル差を減少させる
フィルタ係数を求めて、当該フィルタ係数を基に入力信
号を時間軸上でフィルタリングすることによってビット
割当数の制御を行うことも特徴とする。このとき、帯域
分割フィルタにより入力信号を複数個の帯域に分割し、
当該帯域分割フィルタをビット割当数の制御を行うフィ
ルタと共用する。
【0012】ここで、本発明の各ディジタル信号圧縮方
法及び装置においては、入力信号の特性を変化させる為
の情報を複数処理ブロックに渡って遅延或いは記憶し、
時間的に前の処理ブロックの情報を用いて、上記入力信
号の特性を変化させる処理を行って、ビット割当数の制
御を行う。
【0013】
【0014】
【0015】
【0016】
【0017】すなわち、本発明に係るディジタル信号圧
縮方法及び装置(高能率符号化方法及び装置)は、ビッ
ト割当数の目標値と実際のビット配分数の差から、周波
数別に必要レベルを算出し、このレベルを基に入力信号
の特性を変化させることにより、ビット割当数の目標値
と実際のビット配分数の差を少なくすることで上述の問
題を解決する。
【0018】ここで、入力信号の特性変化とビット配分
数の制御を必要に応じて、複数回実施するとより効果的
である。
【0019】さらには、周波数軸上のスペクトルデータ
を算出する手段を有する場合には、入力信号の特性を変
化させる際に、スペクトルデータを直接操作することに
よって、演算量の低減が図れる。また、周波数軸上での
フィルタ、例えば、等バンド分割フィルタ等を有する場
合には、入力信号の特性を変化させる作用を、先のフィ
ルタで実行することにより、演算量の低減を図ることも
可能である。
【0020】
【作用】本発明のディジタル信号圧縮方法及び装置によ
れば、より多くのビット配分を必要とする入力信号に対
し、最適なエネルギ配分をもたらす特性操作を行うこと
により、ビット配分を行うことで聴覚的にも望ましいビ
ットの配分を実現できる。これにより、圧縮の効率の低
下を防ぐことができ、同一のビットレートにおいてはよ
り良好な音質を得ることができるようになり、又、同一
の音質においてはより低いビットレートでの記録、伝送
等を実現することが可能となる。
【0021】
【実施例】先ず、図1には、本発明のディジタル信号圧
縮装置としての圧縮データ記録再生装置の一実施例の概
略構成を示す。
【0022】図1に示す圧縮データ記録再生装置におい
て、先ず記録媒体としては、スピンドルモータ51によ
り回転駆動される光磁気ディスク1が用いられる。光磁
気ディスク1に対するデータの記録時には、例えば光学
ヘッド53によりレーザ光を照射した状態で記録データ
に応じた変調磁界を磁気ヘッド54により印加すること
によって、いわゆる磁界変調記録を行い、光磁気ディス
ク1の記録トラックに沿ってデータを記録する。また再
生時には、光磁気ディススク1の記録トラックを光学ヘ
ッド53によりレーザ光でトレースして磁気光学的に再
生を行う。
【0023】光学ヘッド53は、例えば、レーザダイオ
ード等のレーザ光源、コリメータレンズ、対物レンズ、
偏光ビームスプリッタ、シリンドリカルレンズ等の光学
部品及び所定パターンの受光部を有するフォトディテク
タ等から構成されている。この光学ヘッド53は、光磁
気ディスク1を介して上記磁気ヘッド54と対向する位
置に設けられている。光磁気ディスク1にデータを記録
するときには、後述する記録系のヘッド駆動回路66に
より磁気ヘッド54を駆動して記録データに応じた変調
磁界を印加すると共に、光学ヘッド53により光磁気デ
ィスク1の目的トラックにレーザ光を照射することによ
って、磁界変調方式により熱磁気記録を行う。またこの
光学ヘッド53は、目的トラックに照射したレーザ光の
反射光を検出し、例えばいわゆる非点収差法によりフォ
ーカスエラーを検出し、例えばいわゆるプッシュプル法
によりトラッキングエラーを検出する。光磁気ディスク
1からデータを再生するとき、光学ヘッド53は上記フ
ォーカスエラーやトラッキングエラーを検出すると同時
に、レーザ光の目的トラックからの反射光の偏光角(カ
ー回転角)の違いを検出して再生信号を生成する。
【0024】光学ヘッド53の出力は、RF回路55に
供給される。このRF回路55は、光学ヘッド53の出
力から上記フォーカスエラー信号やトラッキングエラー
信号を抽出してサーボ制御回路56に供給するととも
に、再生信号を2値化して後述する再生系のデコーダ7
1に供給する。
【0025】サーボ制御回路56は、例えばフォーカス
サーボ制御回路やトラッキングサーボ制御回路、スピン
ドルモータサーボ制御回路、スレッドサーボ制御回路等
から構成される。上記フォーカスサーボ制御回路は、上
記フォーカスエラー信号がゼロになるように、光学ヘッ
ド53の光学系のフォーカス制御を行う。また上記トラ
ッキングサーボ制御回路は、上記トラッキングエラー信
号がゼロになるように光学ヘッド53の光学系のトラッ
キング制御を行う。さらに上記スピンドルモータサーボ
制御回路は、光磁気ディスク1を所定の回転速度(例え
ば一定線速度)で回転駆動するようにスピンドルモータ
51を制御する。また、上記スレッドサーボ制御回路
は、システムコントローラ57により指定される光磁気
ディスク1の目的トラック位置に光学ヘッド53及び磁
気ヘッド54を移動させる。このような各種制御動作を
行うサーボ制御回路56は、該サーボ制御回路56によ
り制御される各部の動作状態を示す情報をシステムコン
トローラ57に送る。
【0026】システムコントローラ57にはキー入力操
作部58や表示部59が接続されている。このシステム
コントローラ57は、キー入力操作部58による操作入
力情報により指定される動作モードで記録系及び再生系
の制御を行う。またシステムコントローラ7は、光磁気
ディスク1の記録トラックからヘッダタイムやサブコー
ドのQデータ等により再生されるセクタ単位のアドレス
情報に基づいて、光学ヘッド53及び磁気ヘッド54が
トレースしている上記記録トラック上の記録位置や再生
位置を管理する。さらにシステムコントローラ57は、
データ圧縮率と上記記録トラック上の再生位置情報とに
基づいて表示部59に再生時間を表示させる制御を行
う。
【0027】この再生時間表示は、光磁気ディスク1の
記録トラックからいわゆるヘッダタイムやいわゆるサブ
コードQデータ等により再生されるセクタ単位のアドレ
ス情報(絶対時間情報)に対し、データ圧縮率の逆数
(例えば1/4圧縮のときには4)を乗算することによ
り、実際の時間情報を求め、これを表示部59に表示さ
せるものである。なお、記録時においても、例えば光磁
気ディスク等の記録トラックに予め絶対時間情報が記録
されている(プリフォーマットされている)場合に、こ
のプリフォーマットされた絶対時間情報を読み取ってデ
ータ圧縮率の逆数を乗算することにより、現在位置を実
際の記録時間で表示させることも可能である。
【0028】次にこのディスク記録再生装置の記録系に
おいて、入力端子60からのアナログオーディオ入力信
号AINがローパスフィルタ61を介してA/D変換器6
2に供給され、このA/D変換器62は上記アナログオ
ーディオ入力信号AINを量子化する。A/D変換器62
から得られたディジタルオーディオ信号は、ATC(Ad
aptive Transform Coding )PCMエンコーダ63に供
給される。また、入力端子67からのディジタルオーデ
ィオ入力信号DINがディジタル入力インターフェース回
路68を介してATCエンコーダ63に供給される。A
TCエンコーダ63は、上記入力信号AINを上記A/D
変換器62により量子化した所定転送速度のディジタル
オーディオPCMデータについて、ビット圧縮(データ
圧縮)処理を行う。ここではその圧縮率を4倍として説
明するが、本実施例はこの倍率には依存しない構成とな
っており、応用例により任意に選択が可能である。
【0029】次にメモリ64は、データの書き込み及び
読み出しがシステムコントローラ57により制御され、
ATCエンコーダ63から供給されるATCデータを一
時的に記憶しておき、必要に応じてディスク上に記録す
るためのバッファメモリとして用いられている。すなわ
ち、例えばATCエンコーダ63から供給される圧縮オ
ーディオデータは、そのデータ転送速度が、標準的なC
D−DAフォーマットのデータ転送速度(75セクタ/
秒)の1/4、すなわち18.75セクタ/秒に低減さ
れており、この圧縮データがメモリ14に連続的に書き
込まれる。この圧縮データ(ATCデータ)は、前述し
たように4セクタにつき1セクタの記録を行えば足りる
が、このような4セクタおきの記録は事実上不可能に近
いため、後述するようなセクタ連続の記録を行うように
している。この記録は、休止期間を介して、所定の複数
セクタ(例えば32セクタ+数セクタ)から成るクラス
タを記録単位として、標準的なCD−DAフォーマット
と同じデータ転送速度(75セクタ/秒)でバースト的
に行われる。すなわちメモリ14においては、上記ビッ
ト圧縮レートに応じた18.75(=75/4)セクタ
/秒の低い転送速度で連続的に書き込まれたATCオー
ディオデータが、記録データとして上記75セクタ/秒
の転送速度でバースト的に読み出される。この読み出さ
れて記録されるデータについて、記録休止期間を含む全
体的なデータ転送速度は、上記18.75セクタ/秒の
低い速度となっているが、バースト的に行われる記録動
作の時間内での瞬時的なデータ転送速度は上記標準的な
75セクタ/秒となっている。従って、ディスク回転速
度が標準的なCD−DAフォーマットと同じ速度(一定
線速度)のとき、該CD−DAフォーマットと同じ記録
密度、記憶パターンの記録が行われることになる。
【0030】メモリ64から上記75セクタ/秒の(瞬
時的な)転送速度でバースト的に読み出されたATCオ
ーディオデータすなわち記録データは、エンコーダ65
に供給される。ここで、メモリ64からエンコーダ65
に供給されるデータ列において、1回の記録で連続記録
される単位は、複数セクタ(例えば32セクタ)から成
るクラスタ及び該クラスタの前後位置に配されたクラス
タ接続用の数セクタとしている。このクラスタ接続用セ
クタは、エンコーダ65でのインターリーブ長より長く
設定しており、インターリーブされても他のクラスタの
データに影響を与えないようにしている。
【0031】エンコーダ65は、メモリ64から上述し
たようにバースト的に供給される記録データについて、
エラー訂正のための符号化処理(パリティ付加及びイン
ターリーブ処理)やEFM符号化処理などを施す。この
エンコーダ65による符号化処理の施された記録データ
が磁気ヘッド駆動回路66に供給される。この磁気ヘッ
ド駆動回路66は、磁気ヘッド54が接続されており、
上記記録データに応じた変調磁界を光磁気ディスク1に
印加するように磁気ヘッド54を駆動する。
【0032】また、システムコントローラ57は、メモ
リ64に対する上述の如きメモリ制御を行うとともに、
このメモリ制御によりメモリ64からバースト的に読み
出される上記記録データを光磁気ディスク2の記録トラ
ックに連続的に記録するように記録位置の制御を行う。
この記録位置の制御は、システムコントローラ57によ
りメモリ64からバースト的に読み出される上記記録デ
ータの記録位置を管理して、光磁気ディスク1の記録ト
ラック上の記録位置を指定する制御信号をサーボ制御回
路56に供給することによって行われる。
【0033】次に、この光磁気ディスクの記録再生装置
の再生系について説明する。この再生系は、上述の記録
系により光磁気ディスク1の記録トラック上に連続的に
記録された記録データを再生するためのものであり、光
学ヘッド53によって光磁気ディスク1の記録トラック
をレーザ光でトレースすることにより得られる再生出力
がRF回路55により2値化されて供給されるデコーダ
71を備えている。この時光磁気ディスクのみではな
く、コンパクトディクス(CD:COMPACT DISC)と同じ
再生専用光ディスクの読み出しも行うことができる。
【0034】デコーダ71は、上述の記録系におけるエ
ンコーダ65に対応するものであって、RF回路55に
より2値化された再生出力について、エラー訂正のため
の上述の如き復号化処理やEFM復号化処理などの処理
を行いオーディオデータを、正規の転送速度よりも早い
75セクタ/秒の転送速度で再生する。このデコーダ7
1により得られる再生データは、メモリ72に供給され
る。
【0035】メモリ72は、データの書き込み及び読み
出しがシステムコントローラ57により制御され、デコ
ーダ71から75セクタ/秒の転送速度で供給される再
生データがその75セクタ/秒の転送速度でバースト的
に書き込まれる。また、このメモリ72は、上記75セ
クタ/秒の転送速度でバースト的に書き込まれた上記再
生データが正規の75セクタ/秒の転送速度18.75
セクタ/秒で連続的に読み出される。
【0036】システムコントローラ57は、再生データ
をメモリ72に75セクタ/秒の転送速度で書き込むと
ともに、メモリ72から上記再生データを上記18.7
5セクタ/秒の転送速度で連続的に読み出すようなメモ
リ制御を行う。また、システムコントローラ57は、メ
モリ72に対する上述の如きメモリ制御を行うととも
に、このメモリ制御によりメモリ72からバースト的に
書き込まれる上記再生データを光磁気ディスク1の記録
トラックから連続的に再生するように再生位置の制御を
行う。この再生位置の制御は、システムコントローラ5
7によりメモリ72からバースト的に読み出される上記
再生データの再生位置を管理して、光磁気ディスク1も
しくは光ディスク1の記録トラック上の再生位置を指定
する制御信号をサーボ制御回路56に供給することによ
って行われる。
【0037】メモリ72から18.75セクタ/秒の転
送速度で連続的に読み出された再生データとして得られ
るATCオーディオデータは、ATCデコーダ73に供
給される。このATCデコーダ73は、ATCデータを
4倍にデータ伸張(ビット伸張)することで16ビット
のディジタルオーディオデータを再生する。このATC
デコーダ73からのディジタルオーディオデータは、D
/A変換器74に供給される。
【0038】D/A変換器74は、ATCデコーダ73
から供給されるディジタルオーディオデータをアナログ
信号に変換して、アナログオーディオ出力信号AOUT を
形成する。このD/A変換器74により得られるアナロ
グオーデイオ信号AOUT は、ローパスフィルタ75を介
して出力端子76から出力される。
【0039】次に本実施例装置におけるデータ圧縮に使
用される高能率圧縮符号化について詳述する。すなわ
ち、オーディオPCM信号等の入力ディジタル信号を、
帯域分割符号化(SBC)、適応変換符号化(ATC)
及び適応ビット割当ての各技術を用いて高能率符号化す
る技術について、図2以降を参照しながら説明する。
【0040】図2並びに図3に示す具体的な高能率符号
化装置では、入力ディジタル信号を複数の周波数帯域に
分割すると共に、最低域の隣接した2帯域の帯域幅は同
じで、より高い周波数帯域では高い周波数帯域ほどバン
ド幅を広く選定し、各周波数帯域毎に直交変換を行っ
て、得られた周波数軸のスペクトルデータを、低域で
は、後述する人間の聴覚特性を考慮したいわゆる臨界帯
域幅(クリティカルバンド)毎に、中高域ではブロック
フローティング効率を考慮して臨界帯域幅を細分化した
帯域毎に、適応的にビット割当して符号化している。通
常このブロックが量子化雑音発生ブロックとなる。さら
に、本発明実施例においては、直交変換の前に入力信号
に応じて適応的にブロックサイズ(処理ブロック長)を
変化させると共に、該ブロック単位でフローティング処
理を行っている。
【0041】即ち、図2において、入力端子200には
例えばサンプリング周波数が44.1kHzの時、0〜
22kHzのオーディオPCM信号が供給されている。
この入力信号は、例えばいわゆるQMF等のフィルタか
らなる帯域分割フィルタ201により0〜11kHz帯
域と11kHz〜22kHz帯域とに分割され、0〜1
1kHz帯域の信号は同じくいわゆるQMFの帯域分割
フィルタ202により0〜5.5kHz帯域と5.5k
Hz〜11kHz帯域とに分割される。帯域分割フィル
タ201からの11kHz〜22kHz帯域の信号は直
交変換回路の一例であるMDCT回路203に送られ、
帯域分割フィルタ202からの5. 5kHz〜11kH
z帯域の信号はMDCT回路204に送られ、帯域分割
フィルタ202からの0〜5.5kHz域の信号はMD
CT回路205に送られることにより、それぞれMDC
T処理される。
【0042】ここで、上述した入力ディジタル信号を複
数の周波数帯域に分割する手法の一例としてのQMFの
フィルタは、例えば文献「ディジタル・コーディング・
オブ・スピーチ・イン・サブバンズ」("Digital coding
of speech in subbands" R.E.Crochiere, Bell Syst.
Tech. J., Vol.55,No.8 1976) に述べられている。この
QMFのフィルタは、帯域を等バンド幅に2分割するも
のであり、当該フィルタにおいては上記分割した帯域を
後に合成する際にいわゆるエリアシングが発生しないこ
とが特徴となっている。
【0043】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
このポリフェイズ・クァドラチュア・フィルタにおいて
は、信号を等バンド幅の複数の帯域に分割する際に一度
に分割できることが特徴となっている。
【0044】さらに、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、当該ブロック毎に高速フーリエ変換(F
FT)、離散コサイン変換(DCT)、モディファイド
DCT変換(MDCT)などを行うことで時間軸を周波
数軸に変換するような直交変換がある。このMDCTに
ついては、文献「時間領域エリアシング・キャンセルを
基礎とするフィルタ・バンク設計を用いたサブバンド/
変換符号化」("Subband/Transform Coding Using Filte
r Bank Designs Based on Time Domain Aliasing Cance
llation," J.P.Princen A.B.Bradley, Univ. of Surrey
Royal Melbourne Inst. of Tech. ICASSP 1987)に述べ
られている。
【0045】ここで、各MDCT回路203〜205に
供給する各帯域毎の処理ブロックについての標準的な入
力信号に対する具体例を図4に示す。この図4の具体例
においては、3つのフィルタ出力信号は、各帯域毎に独
立に各々複数の直交変換ブロックサイズを持ち、信号の
時間特性、周波数分布等により時間分解能を切り換えら
れる様にしている。信号が時間的に準定常的である場合
には、直交変換ブロックサイズを11.6mS、即ち、
図4の(A)に示すロングモード(LongMode)
と大きくし、信号が非定常的である場合には、直交変換
ブロックサイズを更に2分割、4分割とする。図4の
(B)に示すショートモード(Short Mode)
のごとく、全てを4分割で2.9mSとする場合や、図
4の(C)に示すミドルモード A(Middle M
ode A)、図4の(D)に示すミドルモード B
(Middle Mode B)のごとく、一部を2分
割で5.8ms、1部を4分割で2.9msの時間分解
能とすることで、実際の複雑な入力信号に適応するよう
になっている。この直交変換ブロックサイズの分割は処
理装置の規模が許せば、さらに複雑な分割を行うと、よ
り効果的なことは明白である。このブロックサイズの決
定は図2のブロックサイズ決定回路206〜208で決
定され、各MDCT回路203〜205に伝えられると
ともに、該当ブロックのブロックサイズ情報として出力
端子216〜218より出力される。
【0046】次に、ブロックサイズ決定回路の詳細を図
5に示す。ここでは図2のブロック決定回路206を例
に説明する。図2の帯域分割フィルタ201の出力のう
ち、11kHz〜22kHzの出力は図5の入力端子4
01を介してパワー算出回路404に送られる。さら
に、図2の帯域分割フィルタ202の出力のうち、5.
5kHz〜11kHzの出力は図5における入力端子4
02を介してパワー算出回路405へ、0〜5.5kH
zの出力は図5における入力端子403を介してパワー
算出回路406へとそれぞれ送られる。また、図2のブ
ロックサイズ決定回路207、208は図5における入
力端子401〜403へ入力される信号がブロックサイ
ズ決定回路206の場合と異なるだけで、動作は同一で
ある。各ブロックサイズ決定回路206〜208におけ
るそれぞれの入力端子401〜403はマトリクス構成
となっており、即ち、ブロックサイズ決定回路207の
入力端子401には図2の帯域分割フィルタ202の
5.5kHz〜11kHzの出力が接続されており、同
入力端子402には0〜5.5kHzの出力が接続され
ている。ブロックサイズ決定回路208についても、同
様である。
【0047】図5において、各パワー算出回路404〜
406は入力された時間波形を一定時間、積分すること
によって、各周波数帯域のパワーを求めている。この
際、積分する時間幅は上述の直交変換ブロックサイズの
うち、最小時間ブロック以下である必要がある。また、
上述の算出法以外、例えば直交変換ブロックサイズの最
小時間幅内の最大振幅の絶対値あるいは振幅の平均値を
代表パワーとして用いても同様の効果が得られる。パワ
ー算出回路404の出力は変化分抽出回路408及びパ
ワー比較回路409に、パワー算出回路405、406
の出力はパワー比較回路409にそれぞれ送られる。変
化分抽出回路408ではパワー算出回路404より送ら
れたパワーの微係数を求めてパワーの変化情報として、
ブロックサイズ1次決定回路410及びメモリ407へ
送る。メモリ407では、変化分抽出回路408より送
られたパワーの変化情報を上述の直交変換ブロックサイ
ズの最大時間以上、蓄積する。これは時間的に隣接する
直交変換ブロックが直交変換の際のウィンドウ処理によ
り、互いに影響を与え合うため、時間的に隣接する1つ
前のブロックのパワー変化情報をブロックサイズ1次決
定回路410において必要とするためである。ブロック
サイズ1次決定回路410では変化分抽出回路408よ
り送られた該当ブロックのパワー変化情報とメモリ40
7より送られた時間的に隣接する該当ブロックの1つ前
のブロックのパワー変化情報をもとに、該当する周波数
帯域内のパワーの時間的変位から該当する周波数帯域の
直交変換ブロックサイズを決定する。この際、一定以上
の変位が認められた場合、より時間的に短い直交変換ブ
ロックイサイズを選択するわけであるが、その変位点
(所定の境界値)は固定でも効果は得られる。さらに周
波数に比例した値、即ち、周波数が高い場合は大きな変
位によって時間的に短いブロックサイズとなり、周波数
が低い場合は、高い場合のそれに比べ小さな変位で時間
的に短いブロックサイズに決定されると、より効果的で
ある。この値(境界値)はなめらかに変化することが望
ましいが、複数段階の階段状の変化であっても、構わな
い。以上のように決定されたブロックサイズはブロック
サイズ修正回路411へ伝送される。
【0048】一方、パワー比較回路409において、各
パワー算出回路404〜406より送られた各周波数帯
域のパワー情報を同時刻及び時間軸上でマスキング効果
の発生する時間幅で比較を行い、パワー算出回路404
の出力周波数帯域に及ぼす他の周波数帯域の影響を求
め、ブロックサイズ修正回路411へ伝送する。ブロッ
クサイズ修正回路411ではパワー比較回路409より
送られたマスキング情報及びディレイ群のディレイ41
2〜414の各タップから送られた過去のブロックサイ
ズ情報を基に、ブロックサイズ1次決定回路410より
送られたブロックサイズをより時間的に長いブロックサ
イズを選択するよう修正をかけ、ディレイ412及びウ
ィンドウ形状決定回路415へ出力している。ブロック
サイズ修正回路411における作用は、該当周波数帯域
においてプリエコーが問題となる場合でも、他の周波数
帯域、特に該当周波数帯域より低い帯域において、大き
な振幅を持つ信号が存在した場合、そのマスキング効果
により、プリエコーが聴感上問題とならない、或いは問
題が軽減される場合があるという特性を利用している。
なお、上記マスキングとは、人間の聴覚上の特性によ
り、ある信号によって他の信号がマスクされて聞こえな
くなる現象をいうものであり、このマスキング効果に
は、時間軸上のオーデイオ信号による時間軸マスキング
効果と、周波数軸上の信号による同時刻マスキング効果
とがある。これらのマスキング効果により、マスキング
される部分にノイズがあったとしても、このノイズは聞
こえないことになる。このため、実際のオーデイオ信号
では、このマスキングされる範囲内のノイズは許容可能
なノイズとされる。
【0049】次に、ディレイ412〜414では過去の
直交変換ブロックサイズを順に記録しておき、各タッ
プ、即ち、ディレイ412〜414の出力より、ブロッ
クサイズ決定回路411へ出力している。同時に、ディ
レイ412の出力は出力端子417へ、ディレイ41
2、413の出力はウィンドウ形状決定回路415へ接
続している。このディレイ412〜414からの出力は
ブロックサイズ修正回路411においてより長い時間幅
でのブロックサイズの変化を該当ブロックのブロックサ
イズの決定に役立てる働き、例えば、過去頻繁により時
間的に短いブロックサイズが選択されている場合は、時
間的に短いブロックサイズの選択を増やし、過去におい
て時間的に短いブロックサイズの選択がなされてない場
合においては、時間的に長いブロックサイズの選択を増
やす等の判断を可能としている。なお、このディレイ群
はウィンドウ決定回路415及び出力端子417に必要
なディレイ412、413を除けば、そのタップ数は装
置の実際的な構成、規模により増減させて用いられる場
合もある。ウィンドウ形状決定回路415ではブロック
サイズ修正回路411の出力、即ち、該当ブロックの時
間的に隣接する1つ後のブロックサイズとディレイ41
2の出力、即ち、該当ブロックのブロックサイズとディ
レイ413の出力、即ち、該当ブロックの時間的隣接す
る1つ前のブロックサイズとから、上述の図2の各MD
CT回路203〜205において使用されるウィンドウ
の形状を決定し、出力端子416へ出力する。図5の出
力端子417、即ち、ブロックサイズ情報と出力端子4
16、即ち、ウィンドウ形状情報が、図2のブロックサ
イズ決定回路206〜208の出力として各部へ接続さ
れる。
【0050】ここでウィンドウ形状決定回路415にお
いて決定されるウィンドウの形状について説明する。図
6に隣接するブロックとウィンドウの形状の様子を示
す。図6の(a)〜(c)より判るように、図中点線及
び実線で示すように直交変換に使用されるウィンドウは
時間的に隣接するブロックとの間で重複する部分があ
り、本実施例では、隣接するブロックの中心まで重複す
る形状を採用しているため、隣接するブロックの直交変
換サイズによりウィンドウの形状が変化する。
【0051】図7には上記ウィンドウ形状の詳細を示
す。図7においてウィンドウ関数f(n)、g(n+
N)は次式(1)を満たす関数として与えられる。
【0052】 f(n)×f(L−1−n)=g(n)×g(L−1−n) f(n)×f(n)+g(n)×g(n)=1 ・・・(1) 0≦n≦L−1。
【0053】この式(1)におけるLは、隣接する変換
ブロック長が同一であればそのまま変換ブロック長とな
るが、隣接する変換ブロック長が異なる場合は、より短
いほうの変換ブロック長をLとし、より長い変換ブロッ
ク長をKとすると、ウィンドウが重複しない領域におい
ては、次式(2)として与えられる。
【0054】 f(n)=g(n)=1 K≦n≦3K/2−L/2 f(n)=g(n)=0 3K/2+L≦n≦2K ・・・(2) この様にウィンドウの重複部分をできる限り長く取るこ
とにより、直交変換の際のスペクトルの周波数分解能を
良好なものとしている。以上の説明から明らかな様に、
直交変換に使用するウィンドウの形状は時間的に連続す
る3ブロック分の直交変換サイズが確定した後、決定さ
れる。従って、図5の入力端子401〜403から入力
される信号のブロックと出力端子416、417から出
力される信号のブロックは本実施例において1ブロック
分の差異を生じている。
【0055】また、図5のパワー算出回路405、40
6及びパワー比較回路409を省略しても図2のブロッ
クサイズ決定回路206〜208を構成することは可能
である。さらにウィンドウの形状を直交変換ブロックの
取りうる時間的に最小のブロックサイズに固定すること
によってその種類を1種類とし、図5のディレイ412
〜414及びブロックサイズ修正回路411並びにウィ
ンドウ形状決定回路415を省略して構成することも可
能である。特に、処理時間の遅延を好まない応用例にお
いては上述の省略により遅延の少ない構成となり、有効
に作用する。
【0056】再び図2において、各MDCT回路203
〜205にてMDCT処理されて得られた周波数軸上の
スペクトルデータあるいはMDCT係数データは、可変
フィルタ219〜221に送られている。可変フィルタ
219〜221では可変フィルタ係数決定回路222よ
り送られた係数を基に、上述のMDCT回路203〜2
05にて得られた周波数軸上のスペクトルデータ或いは
MDCT係数データの特性を変化させて、適応ビット割
当符号化回路210、211、213及びビット配分算
出回路209に伝送している。ここで特に適応ビット割
当符号化回路210〜213へ送られているスペクトル
データ或いはMDCT係数データは、低域はいわゆる臨
界帯域(クリティカルバンド)毎にまとめられて、中高
域はブロックフローティングの有効性を考慮して、臨界
帯域幅を細分化されている。このクリティカルバンドと
は、人間の聴覚特性を考慮して分割された周波数帯域で
あり、ある純音の周波数近傍の同じ強さの狭帯域バンド
ノイズによって当該純音がマスクされるときのそのノイ
ズの持つ帯域のことである。このクリティカルバンド
は、高域ほど帯域幅が広くなっており、上記0〜22k
Hzの全周波数帯域は例えば25のクリティカルバンド
に分割されている。
【0057】ビット配分算出回路209は、上記クリテ
ィカルバンド及びブロックフローティングを考慮して分
割されたスペクトルデータに基づき、いわゆるマスキン
グ効果等を考慮してクリティカルバンド及びブロックフ
ローティングを考慮した各分割帯域毎のマスキング量を
求め、このマスキング量とクリティカルバンド及びブロ
ックフローティングを考慮した各分割帯域毎のエネルギ
あるいはピーク値等に基づいて、各帯域毎に割当ビット
数を求め、適応ビット割当符号化回路210〜212へ
伝送している。さらに、ビット配分算出回路209は、
規定ビットレートでは歪みが問題となるような場合に
は、問題となる量と規定ビットレートとの差分情報を可
変フィルタ係数決定回路222に伝送している。適応ビ
ット割当符号化回路210〜212では各帯域毎に割り
当てられたビット数に応じて各スペクトルデータ(ある
いはMDCT係数データ)を量子化している。このよう
にして符号化されたデータは、出力端子213〜215
を介して取り出される。また、可変フィルタ係数決定回
路222ではビット配分算出回路209より伝送された
差分情報を基にS/Nの不足するレベルを算出し、フィ
ルタの係数を決定し、可変フィルタ219〜211に伝
送している。この際、フィルタ係数の決定には、ビット
配分算出回路209の出力が必要なため、該当ブロック
のフィルタ係数を決定した後、可変フィルタにて先の各
スペクトルデータ或いはMDCT係数データの特性を変
更した後、再度、ビット配分の算出を行うことになる。
さらに、必要に応じて、上述の帰還動作を複数回実行す
ることにより、最適なビット配分ならびにスペクトル或
いはMDCT係数データの補正が行えることは明白であ
る。さらには、上述の帰還構造を取らず、時間的に前の
ブロックのフィルタ係数を以て、上述の特性変更を行っ
ても同様の効果が得られる。この場合、図2のビット配
分算出回路209と可変フィルタ222の間に、図中破
線で示したような経路で遅延回路224を挿入し、デー
タの位相を合わせる必要があることは明白である。さら
に、この遅延回路224において遅延する量は、必要に
応じて複数のブロックに渡ってデータを保持するもので
あっても良い。このような構成は、特に、処理時間を短
くする必要のある応用、例えば、放送や通信等において
は有効な手法となり、効率の良い装置或いはシステムの
構築が可能となる。
【0058】ここで、図3を用いて図2とは異なる構成
で同様の効果を得る高能率符号化装置について説明す
る。図2、図3より明らかなように、図2の可変フィル
タ219〜221と図3の可変フィルタ319の配置が
異なっており、図3においてフィルタ係数表格納回路3
23が追加となっている。これ以外の構成については、
図2、図3共に同一であり、説明の便宜上、図中の番号
は異なっているが、同一の名称のブロックは同一の作用
を及ぼす為、ここでは、差異の有る部分について説明す
る。
【0059】図3において、入力端子300には例えば
サンプリング周波数が44.1kHzの時、0〜22k
HzのオーディオPCM信号が供給されている。この入
力信号は、可変フィルタ係数決定回路322によって決
定された係数を基に可変フィルタ319により、特性を
変更されていわゆるQMFからなる帯域分割フィルタ3
01へと伝送される。可変フィルタ係数決定回路322
ではビット配分算出回路309より伝送されたS/Nの
不足するレベルから必要なフィルタの特性を算出し、フ
ィルタ係数表格納回路323に予め用意されている係数
の中から最適の係数を決定し、可変フィルタ319に伝
送している。なお、図3中、破線で示したように可変フ
ィルタ係数決定回路322より、帯域分割フィルタ30
1、302に直接係数を出力することにより、可変フィ
ルタ319を省略して構成することも可能である。この
場合、上述の可変フィルタ319を用いる手法に比べ、
分割フィルタの特質の制約を受ける為、係数の選択範囲
が狭くなる欠点を持っているが、全体の演算量が少なく
なるという利点を持っている。一方、応用例によって、
処理能力や処理時間に余裕の有る場合は、フィルタ係数
表格納回路を省略し、全ての係数を演算で求めると一層
良好な結果が得られることは明白である。また、図2に
おいて説明した事項と同様に、この帰還を複数回処理し
ても良く、さらに、時間的に前のブロックのデータから
求めた係数を使用して、処理時間を短縮しても同様の効
果が得られる。
【0060】図3の構成の高能率符号化装置において
は、図2のそれに比較すると次のような特徴を持ってい
る。
【0061】第1の特徴として、図2に比較して、帰還
利得を大きく設定する事が出来るため、入力信号に対す
る適応能力が高い。
【0062】第2の特徴として、時間軸上の信号に対
し、直交変換前に特性変化を与えるため、特性を変化さ
せたことによる直交変換、逆直交変換への影響が無い。
【0063】第3の特徴として、時間軸上の信号に対
し、周波数軸上の特性変化を与えるため、演算量が多く
なり、係数も複雑な物を必要とする。
【0064】従って、図2の構成の高能率符号化装置の
特徴は、上記と相反するものとなる。
【0065】次に、図8は上記ビット割当算出回路20
9或いは309の一具体例の概略構成を示すブロック回
路図である。この図8を用いてビット割当算出回路の作
用について説明する。この図8において、入力端子70
1には、上記各MDCT回路203〜205或いは30
3〜305からの周波数軸上のスペクトルデータが供給
されている。
【0066】この周波数軸上の入力データは、帯域毎の
エネルギ算出回路702に送られて、上記マスキング量
とクリティカルバンド及びブロックフローティングを考
慮した各分割帯域のエネルギが、例えば当該バンド内で
の各振幅値の総和を計算すること等により求められる。
この各バンド毎のエネルギの代わりに、振幅値のピーク
値、平均値等が用いられることもある。このエネルギ算
出回路702からの出力として、例えば各バンドの総和
値のスペクトルを図9にSBとして示している。ただ
し、この図9では、図示を簡略化するため、上記マスキ
ング量とクリティカルバンド及びブロックフローティン
グを考慮した分割帯域数を12バンド(B1 〜B12)で
表現している。
【0067】ここで、上記スペクトルSBのいわゆるマ
スキングに於ける影響を考慮するために、該スペクトル
SBに所定の重み付け関数を掛けて加算するような畳込
み(コンボリユーション)処理を施す。このため、上記
帯域毎のエネルギ算出回路702の出力すなわち該スペ
クトルSBの各値は、畳込みフイルタ回路703に送ら
れる。該畳込みフイルタ回路703は、例えば、入力デ
ータを順次遅延させる複数の遅延素子と、これら遅延素
子からの出力にフイルタ係数(重み付け関数)を乗算す
る複数の乗算器(例えば各バンドに対応する25個の乗
算器)と、各乗算器出力の総和をとる総和加算器とから
構成されるものである。この畳込み処理により、図9中
点線で示す部分の総和がとられる。
【0068】ここで、上記畳込みフイルタ回路703の
各乗算器の乗算係数(フイルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記スペクトル
SBの畳込み処理が行われる。ただし、Mは1〜25の
任意の整数である。
【0069】次に、上記畳込みフイルタ回路703の出
力は引算器704に送られる。該引算器704は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリユーション処理を
行うことによって、クリテイカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器704には、上記レベルαを求めるための許
容関数(マスキングレベルを表現する関数)が供給され
る。この許容関数を増減させることで上記レベルαの制
御を行っている。当該許容関数は、次に説明するような
(n−ai)関数発生回路705から供給されているも
のである。
【0070】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリテイカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の(3)式で求めるこ
とができる。
【0071】α=S−(n−ai) ・・・(3) この(3)式において、n,aは定数でa>0、Sは畳
込み処理されたバークスペクトルの強度であり、(3)
式中(n−ai)が許容関数となる。本実施例では n=38,a=1 としており、この時の音質劣化はなく、良好な符号化が
行えた。
【0072】このようにして、上記レベルαが求めら
れ、このデータは、割算器706に伝送される。該割算
器706では、上記畳込みされた領域での上記レベルα
を逆コンボリユーションするためのものである。したが
って、この逆コンボリユーション処理を行うことによ
り、上記レベルαからマスキングスペクトルが得られる
ようになる。すなわち、このマスキングスペクトルが許
容ノイズスペクトルとなる。なお、上記逆コンボリユー
ション処理は、複雑な演算を必要とするが、本実施例で
は簡略化した割算器706を用いて逆コンボリユーショ
ンを行っている。
【0073】次に、上記マスキングスペクトルは、合成
回路707を介して減算器708に伝送される。ここ
で、当該減算器708には、上記帯域毎のエネルギ検出
回路702からの出力、すなわち前述したスペクトルS
Bが、遅延回路709を介して供給されている。したが
って、この減算器708で上記マスキングスペクトルと
スペクトルSBとの減算演算が行われることで、図10
に示すように、上記スペクトルSBは、該マスキングス
ペクトルMSのレベルで示すレベル以下がマスキングさ
れることになる。
【0074】当該減算器708からの出力は、許容雑音
補正回路710を介し、出力端子711を介して取り出
され、例えば割当てビット数情報が予め記憶されたRO
M等(図示せず)に送られる。このROM等は、上記減
算回路708から許容雑音補正回路710を介して得ら
れた出力(上記各バンドのエネルギと上記ノイズレベル
設定手段の出力との差分のレベル)に応じ、各バンド毎
の割当ビット数情報を出力する。この割当ビット数情報
が図2の適応ビット割当符号化回路210〜212或い
は図3の適応ビット割当符号可回路310〜312に送
られることで、図2のMDCT回路203〜205或い
は図3のMDCT回路303〜305からの周波数軸上
の各スペクトルデータがそれぞれのバンド毎に割り当て
られたビット数で量子化されるわけである。
【0075】すなわち要約すれば、図2の適応ビット割
当符号化回路210〜212或いは図3の適応ビット割
当符号可回路310〜312では、上記マスキング量と
クリティカルバンド及びブロックフローティングを考慮
した各分割帯域のエネルギと上記ノイズレベル設定手段
の出力との差分のレベルに応じて割当てられたビット数
で上記各バンド毎のスペクトルデータを量子化すること
になる。なお、図8の遅延回路709は上記合成回路7
07以前の各回路での遅延量を考慮してエネルギ検出回
路702からのスペクトルSBを遅延させるために設け
られている。
【0076】ところで、上述した合成回路707での合
成の際には、最小可聴カーブ発生回路712から供給さ
れる図11に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
ペクトルMSとを合成することができる。この最小可聴
カーブにおいて、雑音絶対レベルがこの最小可聴カーブ
以下ならば該雑音は聞こえないことになる。この最小可
聴カーブは、コーデイングが同じであっても例えば再生
時の再生ボリユームの違いで異なるものとなるが、現実
的なディジタルシステムでは、例えば16ビットダイナ
ミツクレンジへの音楽のはいり方にはさほど違いがない
ので、例えば4kHz付近の最も耳に聞こえやすい周波
数帯域の量子化雑音が聞こえないとすれば、他の周波数
帯域ではこの最小可聴カーブのレベル以下の量子化雑音
は聞こえないと考えられる。したがって、このように例
えばシステムの持つワードレングスの4kHz付近の雑
音が聞こえない使い方をすると仮定し、この最小可聴カ
ーブRCとマスキングスペクトルMSとを共に合成する
ことで許容ノイズレベルを得るようにすると、この場合
の許容ノイズレベルは、図11中の斜線で示す部分まで
とすることができるようになる。なお、本実施例では、
上記最小可聴カーブの4kHzのレベルを、例えば20
ビット相当の最低レベルに合わせている。また、この図
11は、信号スペクトルSSも同時に示している。
【0077】また、上記許容雑音補正回路710では、
補正情報出力回路713から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器708から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図11に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大
きさに聞こえ、逆に、50Hz付近では1kHzでの音
圧よりも約15dB高くないと同じ大きさに聞こえな
い。このため、上記最小可聴カーブのレベルを越えた雑
音(許容ノイズレベル)は、該等ラウドネス曲線に応じ
たカーブで与えられる周波数特性を持つようにするのが
良いことがわかる。このようなことから、上記等ラウド
ネス曲線を考慮して上記許容ノイズレベルを補正するこ
とは、人間の聴覚特性に適合していることがわかる。
【0078】さらに、補正情報出力回路713では、上
記適応ビット割当符号化回路210〜212或いは31
0〜312における量子化の際の出力情報量(データ
量)の検出出力と、最終符号化データのビットレート目
標値との間の誤差の情報に基づいて、上記許容ノイズレ
ベルを補正するようにしいる。これは、全てのビット割
当単位ブロックに対して予め一時的な適応ビット割当を
行って得られた総ビット数が、最終的な符号化出力デー
タのビットレートによって定まる一定のビット数(目標
値)に対して誤差を持つことがあり、その誤差分を0と
するように再度ビット割当をするものである。すなわ
ち、目標値よりも総割当ビット数が少ないときには、差
のビット数を各単位ブロックに割り振って付加するよう
にし、目標値よりも総割当ビット数が多いときには、差
のビット数を各単位ブロックに割り振って削るように作
用する。
【0079】以上のような動作を行うため、上記総割当
ビット数の上記目標値からの誤差を検出し、この誤差デ
ータに応じて補正情報出力回路713が各割当ビット数
を補正するための補正データを出力する。ここで、上記
誤差データがビット数不足を示す場合は、上記単位ブロ
ック当たり多くのビット数が使われることで上記データ
量が上記目標値よりも多くなっている場合を考えること
ができる。また、上記誤差データが、ビット数余りを示
すデータとなる場合は、上記単位ブロック当たり少ない
ビット数で済み、上記データ量が上記目標値よりも少な
くなっている場合を考えることができる。したがって、
上記補正情報出力回路713からは、この誤差データに
応じて、上記減算器708からの出力における許容ノイ
ズレベルを、例えば上記等ラウドネス曲線の情報データ
に基づいて補正させるための上記補正値のデータが出力
されるようになる。上述のような補正値が、上記許容雑
音補正回路710に伝送されることで、上記減算器70
8からの許容ノイズレベルが補正されるようになる。た
だし、上述の誤差が予め定められた範囲以上の場合、上
述の補正を行わずに、出力端子714より、先に算出し
たビット割当が出力され、図2の可変フィルタ係数決定
回路222或いは図3の可変フィルタ係数決定回路32
2に伝送される。以上説明したようなシステムでは、メ
イン情報として直交変換出力スペクトルをサブ情報によ
り処理したデータとサブ情報としてブロックフローティ
ングの状態を示すスケールファクタ、語長を示すワード
レングスが得られ、エンコーダからデコーダに送られ
る。
【0080】次に、図12は図2の可変フィルタ係数決
定回路222或いは図3の可変フィルタ係数決定回路3
22の一具体例の概略構成を示すブロック回路図であ
る。この図12を用いて可変フィルタ係数決定回路の作
用について説明する。なお、図中、破線で囲まれた部分
は、図3の可変フィルタ係数決定回路322の一具体例
の概略構成を示したもである。
【0081】この図12において、入力端子801に
は、図2のビット配分算出回路209或いは図3のビッ
ト配分算出回路309より出力される、帯域毎のビット
割当情報が入力され、総ビット割当数算出回路802に
伝達される。総ビット割当数算出回路802では、帯域
毎のビット割当と帯域毎のスペクトルの数との積をすべ
ての帯域に渡って加算することによって、総ビット割当
数を算出し、減算器803へ伝送している。減算器80
3では、ビット割当目標値出力回路804より、出力さ
れるビット割当の目標値、即ち、ビット割当の上限値と
先の総ビット割当数の減算を行い、帯域毎重み付け回路
805へ伝送する。帯域毎重み付け回路805では、ビ
ット割当の上限値と先の総ビット割当数の差分を帯域毎
に重み付けを替えて割り振り、帯域毎変化量算出回路8
06或いは伝達関数算出回路809へと伝送している。
図2における入力信号の特性を変化させる手法は、周波
数軸上のスペクトルデータであるから、帯域毎変化量算
出回路806では、帯域毎に重み付けされて割り振られ
たビット数をレベルに変換している。その際、遅延回路
807より、図2における入力信号の特性変化とビット
配分算出の帰還を複数回行う場合の為に、時間的に前の
回の帯域毎の変化量を積算して、補正をかけている。こ
れは、帰還系が収束せずに発振してしまうことを防ぐた
めの回路である。例えば、帯域毎重み付け回路805に
おいて、総ビット割当数がビット割当目標値よりも大き
い場合は高域により大きい重み付けを行い、総ビット割
当数がビット割当目標値よりも小さい場合は低域により
大きい重み付けを与えるように構成して、先の帰還系を
複数回処理を行うと、最悪のケースでは、スペクトルデ
ータが直流成分のみとなって、収束する場合が生じる。
この様な状態を回避するために、2回目以降の処理につ
いては、前回の処理において求めた変化量を小さくなる
方向に処理が行われるように修正をかけている。
【0082】一方、図3における入力信号の特性を変化
させる手法は、時間軸上の振幅情報であるから、周波数
領域の特性変化を与えるためには、何らかのフィルタ演
算を行う必要がある。図12の伝達関数算出回路809
は、帯域毎に重み付けされたビット数から、カットオフ
周波数、減衰量及び減衰特性等を求め、伝達関数を算出
し、フィルタ係数決定回路810へ出力している。その
際、遅延回路811からは、上述の図2の場合と同様
に、帰還系の安定のために、時間的に前の回の処理デー
タを入力し、補正をかけている。フィルタ係数決定回路
810では、先の伝達関数を基に図3のフィルタ係数表
格納回路323より入力端子812を介して入力される
フィルタ係数の選定を行う。なお、この構成は実施例の
装置の構成を簡易にするためのものであり、応用例によ
っては、フィルタ係数決定回路810において、伝達関
数よりフィルタ係数を数学的に算出するとより良好な結
果が得られる。以上の様にして決定されたフィルタ係数
は出力端子813を介して図3の可変フィルタ回路31
9に伝達される。
【0083】ここで、図11で示されるような割当ビッ
ト数を実行した場合、前述のビット割当の目標値を大き
く上回る結果となる場合について、先の、可変フィルタ
219〜221或いは319の作用について説明する。
可変フィルタ219〜221或いは319によって特性
変化を行わずにビット配分を実行した結果、ビット割当
の目標値を大きく上回った場合、前述のように通常の調
整機能により、差のビット数を各単位ブロックに割り振
ってビットの配分を削減する。この際、削減量が大きく
なるために、必要なS/Nを得ることが難しくなる場合
が生じる。この様な場合に、図13に示す様な特性のフ
ィルタを使用して、図9に示すスペクトルデータの特性
を変化させて、マスクキングスペクトルを計算すると図
14におけるMSの様になる。このようにして求めたマ
スキングスペクトルMSと前述の最小可聴カーブRCを
合成した許容ノイズレベルを図15に示す。図11との
比較より明らかなように、高域のエネルギが減少するよ
うに特性を変化させた結果、許容ノイズレベルに占める
マスキングスペクトルMSの割合が相対的に減少し、図
15中、B10、B11においては、必要とするS/
N、即ち、割当ビット数が減少しており、B12におい
ては許容ノイズレベルRCが信号スペクトルSSの値を
越えており、ビットの割当を必要としない状態となって
いる。このことから、図11の状態に比較して、ビット
配分の総数が減少していることは明白である。従って、
先のビット配分の目標値との差が減少したことを示して
いる。
【0084】なお、上記実施例では高域のエネルギが減
少するような特性の変化を以て説明したが、本発明は上
記特性変化のみに限定されるものでなく、入力信号に適
応して様々な特性、例えば、帯域阻止或いは帯域通過特
性等を使用しても同様の効果が得られることは明白であ
る。
【0085】図16は図1のATCデコーダ73、即
ち、上述のごとく高能率符号化されて記録媒体に記録さ
れた信号を再生して得た再生信号、又は伝送媒体を介し
て伝送されて受信された受信信号を、再び復号化するた
めの復号回路を示している。各帯域の量子化されたMD
CT係数、即ち、図2の出力端子213〜215或いは
図3の出力端子313〜315の出力信号と等価のデー
タは、復号回路入力107に与えられ、使用されたブロ
ックサイズ情報、即ち、図2の出力端子216〜218
或いは図3の出力端子316〜318の出力信号と等価
のデータは、入力端子108に与えられる。適応ビット
割当復号化回路106では適応ビット割当情報を用いて
ビット割当を解除する。次に逆直交変換(IMDCT)
回路103〜105では周波数軸上の信号が時間軸上の
信号に変換される。これらの部分帯域の時間軸上信号
は、帯域合成フィルタ(IQMF)回路102、101
により、全帯域信号に復号化される。
【0086】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、上記の記録再生媒体と信号圧
縮装置あるいは伸張装置と、さらには、信号圧縮装置と
伸張装置とは一体化されている必要はなく、記録媒体を
介せずに、その間をデータ転送用回線や光ケーブル,光
或いは電波による通信等で結ぶ事も可能である。更に例
えば、オーデイオPCM信号のみならず、ディジタル音
声(スピーチ)信号やディジタルビデオ信号等の信号処
理装置にも適用可能である。
【0087】また、上記ディジタル信号圧縮装置により
圧縮されたデータを記録媒体に記録することで、記録容
量の有効利用が図れる。また、この記録媒体としては、
上述した光ディスクのみならず、磁気ディスク、ICメ
モリ及びそのメモリを内蔵するカードや、磁気テープ等
の各種記録媒体とすることもできる。
【0088】
【発明の効果】以上の説明からも明らかなように、本発
明のディジタル信号圧縮方法及び装置においては、より
多くのビット配分を必要とする入力信号に対し、最適な
エネルギー配分をもたらす特性操作を行うことによりビ
ット配分を行う手法によれば、周波数帯域とS/Nの調
和を容易に取ることが出来、聴覚的にも望ましいビット
の配分の手法を実現できる。従って、聴感上、音質の勝
れた高能率な圧縮、伸張を行うことができる。
【0089】
【図面の簡単な説明】
【図1】本発明ディジタル信号圧縮方法が適用される本
発明ディジタル信号圧縮装置の一実施例としての圧縮デ
ータの記録再生装置(ディスク記録再生装置)の構成例
を示すブロック回路図である。
【図2】本実施例のビットレート圧縮符号化に使用可能
な高能率圧縮符号化エンコーダの一具体例を示すブロッ
ク回路図である。
【図3】本実施例のビットレート圧縮符号化に使用可能
な高能率圧縮符号化エンコーダの他の具体例を示すブロ
ック回路図である。
【図4】ビット圧縮の際の直交変換ブロックの構造を表
す図である。
【図5】直交変換ブロックサイズを決定する回路の構成
例を示すブロック回路図である。
【図6】時間的に隣接する直交変換ブロックの時間的長
さの変化と直交変換時に用いるウィンドウ形状の関係を
示す図である。
【図7】直交変換時に用いるウィンドウの形状の詳細例
を示す図である。
【図8】ビット配分演算機能を実現する畳込み演算を利
用したビット配分算出回路の例を示すブロック回路図で
ある。
【図9】各臨界帯域及びブロックフローティングを考慮
して分割された帯域のスペクトルを示す図である。
【図10】マスキングスペクトルを示す図である。
【図11】最小可聴カーブ、マスキングスペクトルを合
成した図である。
【図12】可変フィルタ係数決定回路の一具体例を示す
ブロック図である。
【図13】可変フィルタの特性の一例を示す図である。
【図14】図12で示す特性により、図9に示すスペク
トルの特性を変化させた信号のマスキングスペクトルを
示す図である。
【図15】図13で示すマスキングスペクトルと最小可
聴カーブを合成した図である。
【図16】上記実施例のビットレート圧縮符号化に使用
可能な高能率圧縮符号化デコーダの一具体例を示すブロ
ック回路図である。
【符号の説明】
201、202、301、302 帯域分割フィルタ 203〜205、303〜305 直交変換回路 206〜208、306〜308 ブロック決定回路 209、309 ビット配分算出回路 210〜212、310〜312 適応ビット割当符号
化回路 219〜221、319 可変フィルタ 222、322 可変フィルタ係数決定回路 323 フィルタ係数表格納回路 224、324 遅延回路 404〜406 パワー算出回路 408 変化分抽出回路 409 パワー比較回路 410 ブロックサイズ1次決定回路 411 ブロックサイズ修正回路 415 ウィンドウ形状決定回路

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力ディジタル信号をブロック化してス
    ペクトルデータに変換し、時間と周波数について細分化
    した小ブロック毎に、圧縮のためのビット割当を行って
    情報圧縮するディジタル信号圧縮方法において、 規定されたビット数と上記ビット割当を行ったビットの
    総数との差を重み付けして各小ブロックに割り振るステ
    ップと、 上記割り振られた各小ブロックのビット数を当該ブロッ
    クのスペクトルデータのレベルに変換するステップと、 上記変換されたレベルに基づいて各小ブロック内のスペ
    クトルデータを補正するステップとを有するスペクトル
    データ特性変更ステップを備え、 上記スペクトルデータ特性変更ステップによる処理を少
    なくとも1回実行して、ビット割当の制御を行うことを
    特徴とするディジタル信号圧縮方法。
  2. 【請求項2】 上記レベルを複数処理ブロックに渡って
    遅延或いは記憶し、時間的に前の処理ブロックのレベル
    を用いて、上記スペクトルデータを補正することを特徴
    とする請求項1記載のディジタル信号圧縮方法。
  3. 【請求項3】 入力ディジタル信号をブロック化してス
    ペクトルデータに変換し、時間と周波数について細分化
    した小ブロック毎に、圧縮のためのビット割当を行って
    情報圧縮するディジタル信号圧縮方法において、 規定されたビット数と上記ビット割当を行ったビットの
    総数との差を重み付けして各小ブロックに割り振るステ
    ップと、 上記割り振られた各小ブロックのビット数を当該ブロッ
    クのスペクトルデータのレベルに変換するステップと、 上記変換されたレベルに基づいてフィルタ係数を決定す
    るステップと、 上記決定された係数を持つフィルタを用いて、時間軸の
    入力ディジタル信号をフィルタリングするフィルタステ
    ップとを有する入力ディジタル信号特性変更ステップを
    備え、 上記入力ディジタル信号特性変更ステップによる処理を
    少なくとも1回実行して、ビット割当の制御を行うこと
    を特徴とするディジタル信号圧縮方法。
  4. 【請求項4】 帯域分割フィルタにより入力信号を複数
    個の帯域に分割し、 当該帯域分割フィルタをビット割当数の制御を行うフィ
    ルタと共用することを特徴とする請求項3記載のディジ
    タル信号圧縮方法。
  5. 【請求項5】 入力ディジタル信号をブロック化してス
    ペクトルデータに変換し、時間と周波数について細分化
    した小ブロック毎に、圧縮のためのビット割当を行って
    情報圧縮するディジタル信号圧縮装置において、 規定されたビット数と上記ビット割当を行ったビットの
    総数との差を重み付けして各小ブロックに割り振る手段
    と、 上記割り振られた各小ブロックのビット数を当該ブロッ
    クのスペクトルデータのレベルに変換する手段と、 上記変換されたレベルに基づいて各小ブロック内のスペ
    クトルデータを補正する手段とを有するスペクトルデー
    タ特性変更手段を備え、 上記スペクトルデータ特性変更手段による処理を少なく
    とも1回実行して、ビット割当の制御を行うことを特徴
    とするディジタル信号圧縮装置。
  6. 【請求項6】 上記レベルを複数処理ブロックに渡って
    遅延或いは記憶する遅延手段を設け、 時間的に前の処理ブロックのレベルを用いて上記スペク
    トルデータを補正することを特徴とする請求項5記載の
    ディジタル信号圧縮装置。
  7. 【請求項7】 入力ディジタル信号をブロック化してス
    ペクトルデータに変換し、時間と周波数について細分化
    した小ブロック毎に、圧縮のためのビット割当を行って
    情報圧縮するディジタル信号圧縮装置において、 規定されたビット数と上記ビット割当を行ったビットの
    総数との差を重み付けして各小ブロックに割り振る手段
    と、 上記割り振られた各小ブロックのビット数を当該ブロッ
    クのスペクトルデータのレベルに変換する手段と、 上記レベルに基づいてフィルタ係数を決定する手段と、 上記決定された係数を持つフィルタを用いて、時間軸の
    入力ディジタル信号をフィルタリングするフィルタ手段
    とを有する入力ディジタル信号特性変更手段を備え、 上記入力ディジタル信号特性変更手段による処理をを少
    なくとも1回実行して、ビット割当数の制御を行うこと
    を特徴とするディジタル信号圧縮装置。
  8. 【請求項8】 入力信号を複数個の帯域に分割する帯域
    分割フィルタを設け、当該帯域分割フィルタをビット割
    当数の制御を行うためのフィルタ手段と共用することを
    特徴とする請求項7記載のディジタル信号圧縮装置。
JP26501094A 1994-10-28 1994-10-28 ディジタル信号圧縮方法及び装置 Expired - Fee Related JP3334374B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26501094A JP3334374B2 (ja) 1994-10-28 1994-10-28 ディジタル信号圧縮方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26501094A JP3334374B2 (ja) 1994-10-28 1994-10-28 ディジタル信号圧縮方法及び装置

Publications (2)

Publication Number Publication Date
JPH08125543A JPH08125543A (ja) 1996-05-17
JP3334374B2 true JP3334374B2 (ja) 2002-10-15

Family

ID=17411330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26501094A Expired - Fee Related JP3334374B2 (ja) 1994-10-28 1994-10-28 ディジタル信号圧縮方法及び装置

Country Status (1)

Country Link
JP (1) JP3334374B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0926658A4 (en) * 1997-07-11 2005-06-29 Sony Corp INFORMATION DECODERS AND DECODING METHOD, INFORMATION CODERS AND CODING METHOD AND DISTRIBUTION MEDIUM
JP2002135122A (ja) 2000-10-19 2002-05-10 Nec Corp オーディオ信号符号化装置
JP4822697B2 (ja) * 2004-12-01 2011-11-24 シャープ株式会社 ディジタル信号符号化装置およびディジタル信号記録装置
WO2024080723A1 (ko) * 2022-10-14 2024-04-18 삼성전자 주식회사 오디오 신호를 처리하는 전자 장치 및 방법

Also Published As

Publication number Publication date
JPH08125543A (ja) 1996-05-17

Similar Documents

Publication Publication Date Title
JP3123286B2 (ja) ディジタル信号処理装置又は方法、及び記録媒体
JP3123290B2 (ja) 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3173218B2 (ja) 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
KR100276788B1 (ko) 디지탈 신호 처리 장치와 방법 및 기록 매체
JP3186307B2 (ja) 圧縮データ記録装置及び方法
JP3531177B2 (ja) 圧縮データ記録装置及び方法、圧縮データ再生方法
US5608713A (en) Bit allocation of digital audio signal blocks by non-linear processing
JP3200851B2 (ja) ディジタル信号処理装置,ディジタル信号処理方法及びデータ記録媒体
JP3175446B2 (ja) 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
JPH08162964A (ja) 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
JP3334374B2 (ja) ディジタル信号圧縮方法及び装置
JP4470304B2 (ja) 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
JP3304717B2 (ja) ディジタル信号圧縮方法及び装置
JP3175456B2 (ja) ディジタル信号処理装置
JP3477735B2 (ja) 圧縮データ変換装置及び方法
JP3334375B2 (ja) ディジタル信号圧縮方法及び装置
JP3186489B2 (ja) ディジタル信号処理方法及び装置
JPH06338861A (ja) ディジタル信号処理装置及び方法、並びに記録媒体
JP3552239B2 (ja) 圧縮データ記録装置及び方法、並びに圧縮データ再生方法
JPH07231259A (ja) ディジタル信号処理方法及び装置、並びに記録媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020702

LAPS Cancellation because of no payment of annual fees