JPH04302537A

JPH04302537A - ディジタル信号の高能率符号化方法

Info

Publication number: JPH04302537A
Application number: JP9119091A
Authority: JP
Inventors: Kenzo Akagiri; 健三赤桐
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1991-03-29
Filing date: 1991-03-29
Publication date: 1992-10-26
Anticipated expiration: 2016-02-05
Also published as: JP3132031B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、入力ディジタル信号の
圧縮符号化を行うディジタル信号の高能率符号化装置に
関するものである。

【０００２】

【従来の技術】オーディオ，　音声等の信号の高能率符
号化においては、オーディオ，音声等の入力信号を時間
軸又は周波数軸で複数のチャンネルに分割すると共に、
各チャンネル毎のビット数を適応的に割当てるビットア
ロケーシヨン（ビット割当て）による符号化技術がある
。例えば、オーディオ信号等の上記ビット割当てによる符
号化技術には、時間軸上のオーディオ信号等を複数の周
波数帯域に分割して符号化する帯域分割符号化（サブ・
バンド・コーディング：ＳＢＣ）や、時間軸の信号を周
波数軸上の信号に変換（直交変換）して複数の周波数帯
域に分割し各帯域毎で適応的に符号化するいわゆる適応
変換符号化（ＡＴＣ）、或いは、上記ＳＢＣといわゆる
適応予測符号化（ＡＰＣ）とを組み合わせ、時間軸の信
号を帯域分割して各帯域信号をベースバンド（低域）に
変換した後複数次の線形予測分析を行って予測符号化す
るいわゆる適応ビット割当て（ＡＰＣ−ＡＢ）等の符号
化技術がある。

【０００３】すなわち、上記高能率符号化においては、
例えば、時間軸上のオーディオ信号等を、複数のバンド
パスフィルタ等からなるフィルタアレイを通して周波数
分割し、これら周波数分割された信号を適応的なビット
割り当てで符号化するようなことが行われる。また、例
えば、時間軸上のオーディオ信号等を、所定の単位時間
（直交変換ブロック）毎に例えば高速フーリエ変換（Ｆ
ＦＴ）等の直交変換によって時間軸に直交する軸（周波
数軸）に変換し、その後複数の帯域に分割して、これら
分割された各帯域のＦＦＴ係数データを適応的なビット
割り当てによって符号化したり、或いはフィルタアレイ
で周波数分割した後に直交変換してＦＦＴ係数データに
変換した後、適応的なビット割り当てで符号化するよう
なことが行われる。この符号化データが伝送される。

【０００４】更に、各帯域毎の上記ＦＦＴ係数データを
上記適応ビット割り当てにより符号化する際には、例え
ば、上記周波数軸上のＦＦＴ係数データをブロック（フ
ローティングブロック）化し、このフローティングブロ
ック毎にいわゆるフローティング処理を施すことで、更
にビット圧縮を行う場合が多い。この場合、後の復号化
のための構成には、上記フローティングブロック毎にフ
ローティング処理されたＦＦＴ係数データと、当該各フ
ローティングブロック毎のフローティング係数及び割り
当てビット数に応じたワード長情報からなるサブ情報と
が伝送されることになる。

【０００５】

【発明が解決しようとする課題】ところで、上記高能率
符号化においては、更に圧縮効率を高めることが望まれ
ているが、上述した符号化では、例えば直交変換ブロッ
ク或いはフローティングブロック内で一定のビット量が
消費されるため、ブロック毎の伝送ビットレートを下げ
ることができず、圧縮効率を高めることが出来なかった
。

【０００６】そこで、本発明は、上述のような実情に鑑
みて提案されたものであり、より高いビット圧縮が可能
なディジタル信号の高能率符号化装置を提供することを
目的とするものである。

【０００７】

【課題を解決するための手段】本発明のディジタル信号
の高能率符号化装置は、上述の目的を達成するために提
案されたものであり、入力ディジタル信号を周波数軸上
の信号に変換すると共にブロック化し、該ブロック毎の
入力ディジタル信号を適応的な割り当てビット数で符号
化して伝送するディジタル信号の高能率符号化装置にお
いて、上記各ブロックのうちの任意の代表ブロックの上
記符号化に関連するデータと、他のブロックの上記符号
化に関連するデータとの間の偏差を求める偏差算出手段
を有し、この偏差算出手段からの出力を伝送するように
したものである。すなわち、本発明装置は、入力ディジ
タル信号が例えばサイン波等の定常的なディジタル信号
が連続するものであるか或いはこの定常的信号に準ずる
準定常的なディジタル信号が連続するものである場合、
任意の代表ブロックと他のブロック間での上記偏差（差
分）を求めるようにし、この偏差のデータを伝送するよ
うにしている。また、上記入力ディジタル信号が上記定
常的，準定常的な信号であるか否かの判断は、上記偏差
のデータの情報量とブロック毎の符号化に関連するデー
タの情報量とを比較することにより行う。上記偏差のデ
ータの情報量が上記各ブロックのものよりも少ない場合
には、上記入力ディジタル信号が定常的，準定常的な信
号であると判断すると共に、当該偏差のデータを伝送す
るようにする。逆に、上記偏差のデータの情報の方が多
い場合には、各ブロック毎のデータを伝送するようにす
る。更に、上記偏差算出手段において、各ブロック間か
ら得られる偏差のデータとしては、ブロック毎の直交変
換による係数データ（スペクトル成分）の差分のデータ
の場合と、ブロック毎にいわゆるフローティング処理を
行う場合のフローティング係数及びワード長情報の差分
（サブ情報の差分）のデータの場合、若しくは、この両
者とする場合を考えることができる。また更に、上記フ
ローティング処理を行う場合、上記直交変換による係数
データの偏差は、該フローティング処理の前のデータか
或いは処理後のデータとすることができる。

【０００８】

【作用】本発明によれば、任意の代表ブロックの符号化
に関連するデータと他のブロックの符号化に関連するデ
ータとの偏差すなわち差分を伝送するようにしているた
め、伝送ビットレートが下がるようになる。

【０００９】

【実施例】以下、本発明を適用した実施例について図面
を参照しながら説明する。本実施例のディジタル信号の
高能率符号化装置は、オーディオ或いは音声等の入力デ
ィジタル信号を、例えば、前述の高能率符号化の帯域分
割符号化（ＳＢＣ）によって帯域分割すると共に、直交
変換して周波数軸上の信号に変換した後符号化するよう
にしている。

【００１０】すなわち、本実施例の高能率符号化装置で
は、図１に示すように、帯域分割フィルタとしてのいわ
ゆるミラーフィルタのＱＭＦ（ｑｕａｄｒａｔｕｒｅ　
ｍｉｒｒｏｒ　ｆｉｌｔｅｒ）４１，４２によって、入
力端子１を介して供給される上記入力ディジタル信号を
、いわゆる臨界帯域（クリティカルバンド）での分割を
考慮して高域程帯域幅が広くなるように複数の帯域に分
割（例えば大別して３つの帯域に分割）し、この分割さ
れた帯域毎に複数のサンプルからなるブロック（直交変
換ブロック）を形成して、これら各直交変換ブロック毎
に高速フーリエ変換（ＦＦＴ）回路４３，４４，４５に
よる直交変換（時間軸を周波数軸に変換）を行うことで
係数データ（ＦＦＴ係数データ）を得るようになってい
る。その後、この３分割された各帯域のＦＦＴ係数デー
タを、後述する許容ノイズレベル算出回路６０で求めら
れる許容ノイズレベルに基づいた適応的な割り当てビッ
ト数で符号化している。この符号化が符号化回路５０に
よって行われ、当該符号化後のデータが偏差算出回路７
０を介して出力端子２から出力されるようになっている
。

【００１１】ここで、本実施例装置は、上記各直交変換
ブロックのうちの任意の代表ブロック（代表直交変換ブ
ロック）の上記符号化に関連するデータと、他の直交変
換ブロックの符号化に関連するデータとの間の偏差を求
める上記偏差算出回路７０を有し、この偏差算出回路７
０からの出力を伝送するようにしている。すなわち、例
えば、入力ディジタル信号が例えばサイン波等の定常的
なディジタル信号が連続するものであったり或いはこの
定常的信号に準ずる準定常的なディジタル信号が連続す
るものであった場合、任意の代表直交変換ブロックと他
の直交変換ブロック間での偏差を求めるようにし、この
偏差のデータを伝送するようにしている。例えば、図２
に示すように準定常的なディジタル信号が連続して供給
された場合、任意の代表直交変換ブロックＢａのデータ
を直交変換して得られた周波数成分（後述する振幅値）
Ｓａと、他の直交変換ブロックＢｂのデータを直交変換
して得られた周波数成分（振幅値）Ｓｂとは、略同じ周
波数の成分であり、したがって、上記偏差算出回路７０
では、それらの差分をとって、図３に示すような差分値
Ｓｄを得て、当該差分値Ｓｄを伝送するようにしている
。なお図３にはディジタル信号をアナログ的な信号とし
て示している。

【００１２】このように入力ディジタル信号が準定常的
信号であるならば、上述したような差分演算処理を連続
して繰り返すようにする。また、この繰り返される該差
分演算は、先ず、代表直交変換ブロックＢａとその次の
ブロックＢｂとの差分を取り、次に、該ブロックＢａと
ブロックＢｂの次のブロックＢｃ（図示は省略）との差
分、該ブロックＢａとブロックＢｃの次のブロックＢｄ
（図示は省略）との差分を取っていくというように順次
繰り返すようにする。更に、この差分演算の繰り返しの
他の方法としては、上述のように代表直交変換ブロック
をブロックＢａのみに決めるのではなく、順次代表直交
変換ブロックを更新するような方法とすることも可能で
ある。例えば、ブロックＢｂと代表のブロックＢａとの
差分を取り、次に、代表ブロックをブロックＢａからＢ
ｂに更新して当該ブロックＢｃとブロックＢｂとの差分
を取り、更に代表ブロックをブロックＢｂからＢｃに更
新して当該ブロックＢｄとブロックＢｃとの差分を取っ
ていくという方法とすることも可能である。

【００１３】また、上記入力ディジタル信号は上記定常
的或いは準定常的な信号のみが連続するものであるとは
限らず、例えば図４に示すように、これら準定常的信号
以外の非定常的信号が連続するような場合が多い。この
場合、伝送するデータとしては、上記差分のデータを伝
送するか或いは各ブロック毎のデータをそのまま送るか
の何れかを判断して、伝送情報量の少なくなる方を選ん
で伝送するようにする。例えば、図４に示すような非定
常的信号の場合、代表直交変換ブロックＢａとその次の
ブロックＢｂから得られる各周波数成分は異なり、した
がって、これらの差分を取っても情報量は低減されない
ことが考えられる。このようなことから、上記偏差算出
回路７０では、上記ブロックＢａとブロックＢｂとの差
分を取って得た上記差分値のデータを伝送する際の情報
量とブロックＢａ及びＢｂのデータを伝送する際の情報
量とを比較して、情報量が少なくなる方を伝送する。た
だし、この場合は、差分値のデータを送ったか或いはブ
ロック毎のデータをそのまま伝送したかの何れかを示す
モード情報も同時に伝送することが必要となる。なお、
この図４もディジタル信号を便宜的にアナログ信号とし
て示している。

【００１４】更に、上記偏差算出回路７０においては、
上述したように、各ブロック間から得られる偏差のデー
タを、上記直交変換ブロック間のＦＦＴ係数データ（ス
ペクトル成分）の差分とする場合と、例えばいわゆるフ
ローティング処理を行う場合のフローティング係数及び
ワード長情報の差分（サブ情報の差分）とする場合、若
しくは、この両者とする場合を考えることができる。な
おワード長情報とは、符号化の際の割り当てビット数に
対応するものである。このように、フローティング処理
を行って得られたフローティング係数及びワード長情報
の差分を伝送するような場合も、上述同様に連続するブ
ロック（フローティングブロック）間での差分を取るよ
うにする。また、上記両者の差分を伝送するようにした
場合、上記ＦＦＴ係数データの差分演算は、上記フロー
ティング処理の前か或いは処理後のいずれであってもよ
い。

【００１５】上述のように、本実施例では、上記差分の
データを伝送するようにしているため、各ブロック毎に
一定のビットレート（固定ビットレート）であったデー
タを、各ブロック毎に異なるビットレート（すなわち可
変ビットレート）で伝送することになり、データ圧縮率
を高めることが可能となっている。

【００１６】上記偏差算出回路７０の具体的構成を図５
に示す。この図５において、端子７１には、上記符号化
回路５０からの符号化データが供給される。該符号化デ
ータは、上述したように、直交変換ブロック単位のＦＦ
Ｔ係数データや、フローティングブロック単位のフロー
ティング係数及びワード長のデータである。これらデー
タのうち、例えばＮ番目のブロックのデータが上記代表
ブロック（直交変換ブロック，フローティングブロック
）としてメモリ等のデータ格納手段７２に蓄えられ、更
に、該Ｎ番目のブロックの次のＮ＋１番目のブロック（
上記他のブロック）のデータがデータ格納手段７３に蓄
えられる。これら、格納手段７２，７３の出力は、共に
、減算手段７４に送られ、上述したような差分値が求め
られる。この差分値が比較選択手段７５に送られる。また、当該比較選択手段７５には上記各格納手段７３，
７４からのブロック毎のデータも供給されており、した
がって、当該比較選択手段７５では上記減算手段７４か
らのブロックの差分値の情報量と、各ブロック毎の情報
量とを比較して、伝送情報量の少ない方を選択して出力
するようになっている。また、上記モード情報も出力さ
れるようになっている。この出力が端子７６から出力さ
れる。

【００１７】再び図１に戻って、入力端子１にはアナロ
グオーディオ信号等をサンプリング（例えば１０２４サ
ンプル）して得たディジタル信号（０〜２０ｋＨｚ）が
供給されており、該ディジタル信号は上記ＱＭＦ４１，
４２により、上記高域程帯域幅が広くなるように大まか
に３つの帯域（０〜５ｋＨｚ，５ｋＨｚ〜１０ｋＨｚ，
１０ｋＨｚ〜２０ｋＨｚ）に分割される。上記ＱＭＦ４
１では、上記０〜２０ｋＨｚのディジタル信号が２分割
されて１０ｋＨｚ〜２０ｋＨｚと０〜１０ｋＨｚの２つ
の出力が得られ、１０ｋＨｚ〜２０ｋＨｚの出力は高速
フーリエ変換回路４３に、０〜１０ｋＨｚの出力はＱＭ
Ｆ４２に送られる。ＱＭＦ４２へ送られた０〜１０ｋＨ
ｚの出力は、該ＱＭＦ４２で更に２分割されて５ｋＨｚ
〜１０ｋＨｚと０〜５ｋＨｚの２つの出力が得られる。上記５ｋＨｚ〜１０ｋＨｚの出力は上記高速フーリエ変
換回路４４に送られ、上記０〜５ｋＨｚの出力は高速フ
ーリエ変換回路４５に送られる。

【００１８】ここで、上記各高速フーリエ変換回路４３
，４４，４５における上記３つの帯域の各帯域の直交変
換ブロックのブロック長は、それぞれ異なるブロック長
となされている。例えば、図６に示すように、上記１０
ｋＨｚ〜２０ｋＨｚの高域に対応する高速フーリエ変換
回路４３では例えば５ｍｓｅｃ毎の直交変換ブロック長
ｂＨ１，ｂＨ２，ｂＨ３，ｂＨ４とされ、上記５ｋＨｚ
〜１０ｋＨｚの中域に対応する高速フーリエ変換回路４
４では例えば１０ｍｓｅｃ毎の直交変換ブロック長ｂＭ
１，ｂＭ２とされ、上記０〜５ｋＨｚの低域に対応する
高速フーリエ変換回路４５では例えば２０ｍｓｅｃ毎の
直交変換ブロック長ｂＬ　とされる。

【００１９】上述したように、高域及び中域の直交変換
ブロック長を低域よりも短くし、低域の直交変換ブロッ
ク長を長くするのは、以下に示すような理由による。す
なわち、人間の聴覚における周波数分析能力（周波数分
解能）は、一般に、高域ではさほど高くないが低域では
高いものであり、したがって、該低域での周波数分解能
を確保する必要性から、現実には上述したように直交変
換ブロック長をあまり短くすることはできないためであ
る。また、一般に、低域信号では定常区間が長く、逆に
高域信号では短いため、高域（及び中域）での直交変換
ブロック長を短くする（時間分解能を高める）ことは有
効となる。上述のようなことから、本実施例では、上記
定常的な信号以外の時に高域及び中域の直交変換ブロッ
ク長を、低域の直交変換ブロック長よりも短いものとし
、低域の直交変換ブロック長を長くしている。

【００２０】このように、本実施例においては、聴覚か
ら必要とされる周波数軸上の分解能と時間軸上の分解能
を同時に満足するような構成となっていて、上記低域（
０〜５ｋＨｚ）では処理のサンプル数を多くして周波数
分解能を上げ、高域（１０ｋＨｚ〜２０ｋＨｚ）では時
間分解能を上げている。また、中域（５ｋＨｚ〜１０ｋ
Ｈｚ）でも時間分解能を上げている。

【００２１】なお、上記直交変換は上述した高速フーリ
エ変換に限らず例えば離散的余弦変換（ＤＣＴ）、ＭＤ
ＣＴ等をも適用することができる。

【００２２】これら各高速フーリエ変換回路４３，４４
，４５の出力が、符号化回路５０に送られている。ここ
で、本実施例の符号化回路５０における上記３つの帯域
のＦＦＴ係数データの符号化の際には、人間の聴覚特性
に基づく適応的な割当てビット数で符号化を行うように
しているため、上記各ＦＦＴ係数データを、上記臨界帯
域での帯域（例えば２５バンド）に対応させている。このため、上記高速フーリエ変換回路４３の出力は、臨
界帯域の高域の例えば２つの帯域と対応し、高速フーリ
エ変換回路４４の出力は臨界帯域の中域の例えば３つの
帯域と対応し、高速フーリエ変換回路４５の出力は臨界
帯域の低域の例えば２０個の帯域と対応するようになさ
れている。なお、上記臨界帯域幅とは、人間の聴覚特性
（周波数分析能力）を考慮したものであり、例えば０〜
２０ｋＨｚを２５帯域に分け、高い周波数帯域ほど帯域
幅を広く選定しているものである。すなわち人間の聴覚
は、一種のバンドパスフィルタのような特性を有してい
て、この各フィルタによって分けられたバンドを臨界帯
域と呼んでいる。

【００２３】上記符号化回路５０での符号化は、上記許
容ノイズレベル算出回路６０における各臨界帯域毎の許
容ノイズレベルに基づいた割り当てビット数によって適
応的に行われている。

【００２４】上述した本実施例のディジタル信号の高能
率符号化装置の許容ノイズレベル算出回路６０の具体的
構成を図７に示す。

【００２５】すなわちこの図７において、入力端子６１
には、各高速フーリエ変換回路４３，４４，４５から上
記臨界帯域毎のＦＦＴ係数データのうち振幅情報Ａｍの
情報のみが供給される。すなわち、一般に人間の聴覚は
周波数領域の振幅（パワー）には敏感であるが、位相に
ついてはかなり鈍感であるため、本具体例では上記振幅
情報Ａｍのみを用いて上記許容ノイズレベルを算出する
ようにしている。

【００２６】上記臨界帯域毎の上記振幅情報Ａｍは、各
々上記総和検出回路１４に伝送される。この総和検出回
路１４では、各帯域毎のエネルギ（各帯域でのスペクト
ル強度）が、各帯域内のそれぞれの振幅情報Ａｍの総和
（振幅情報Ａｍのピーク又は平均或いはエネルギ総和）
をとることにより求められる。該総和検出回路１４の出
力すなわち各帯域の総和のスペクトルは、一般にバーク
スペクトルと呼ばれ、この各帯域のバークスペクトルＳ
Ｂは例えば図８に示すようになる。ただし、図８では図
示を簡略化するため、上記クリティカルバンドのバンド
数を１２の帯域（Ｂ１　〜Ｂ１２）で表現している。

【００２７】ここで、上記バークスペクトルＳＢのいわ
ゆるマスキングに於ける影響を考慮するため、該バーク
スペクトルＳＢに所定の重みづけの関数を畳込む（コン
ボリューション）。このため、上記総和検出回路１４の
出力すなわち該バークスペクトルＳＢの各値は、フィル
タ回路１５に送られる。該フィルタ回路１５は、例えば
、入力データを順次遅延させる複数の遅延素子と、これ
ら遅延素子からの出力にフィルタ係数（重みづけの関数
）を乗算する複数の乗算器（例えば各帯域に対応する２
５個の乗算器）と、各乗算器出力の総和をとる総和加算
器とから構成されるものである。このフィルタ回路１５
の各乗算器において、例えば、任意の帯域に対応する乗
算器Ｍでフィルタ係数１を、乗算器Ｍ−１でフィルタ係
数０．１５を、乗算器Ｍ−２でフィルタ係数０．００１
９を、乗算器Ｍ−３でフィルタ係数０．０００００８６
を、乗算器Ｍ＋１でフィルタ係数０．４を、乗算器Ｍ＋
２でフィルタ係数０．０６を、乗算器Ｍ＋３でフィルタ
係数０．００７を各遅延素子の出力に乗算することによ
り、上記バークスペクトルＳＢの畳込み処理が行われる
。ただし、Ｍは１〜２５の任意の整数である。この畳込
み処理により、図８中点線で示す部分の総和がとられる
。なお、上記マスキングとは、人間の聴覚上の特性によ
り、ある信号によって他の信号がマスクされて聞こえな
くなる現象をいうものであり、このマスキング効果には
、時間軸上のオーディオ信号に対するマスキング効果と
周波数軸上の信号に対するマスキング効果とがある。すなわち、該マスキング効果により、マスキングされる
部分にノイズがあったとしても、このノイズは聞こえな
いことになる。このため、実際のオーディオ信号では、
このマスキングされる部分内のノイズは許容可能なノイ
ズとされる。

【００２８】ここで、上記マスキングとは、人間の聴覚
特性に関するものである。すなわち、一般に音に対する
人間の聴覚特性には、マスキング効果と呼ばれるものが
あり、当該マスキング効果には、テンポラルマスキング
効果と同時刻マスキング効果等がある。上記同時刻マス
キング効果とは、ある大きな音と同時刻に発生する小さ
な音（或いはノイズ）が当該大きな音によってマスクさ
れて聞こえなくなるような効果であり、上記テンポラル
マスキング効果とは、大きな音の時間的な前後の小さな
音（ノイズ）が、この大きな音にマスクされて聞こえな
くなるような効果である。このテンポラルマスキング効
果において、上記大きな音の時間的に後方のマスキング
はフォワードマスキングと呼ばれ、また、時間的に前方
のマスキングはバックワードマスキングと呼ばれている
。また、テンポラルマスキングにおいては、人間の聴覚
特性から、フォワードマスキングの効果は長時間（例え
ば１００ｍｓｅｃ程度）効くようになっているのに対し
、バックワードマスキングの効果の持続時間は短時間（
例えば５ｍｓｅｃ程度）となっている。更に、上記マス
キング効果のレベル（マスキング量）は、フォワードマ
スキングが２０ｄＢ程度で、バックワードマスキングが
３０ｄＢ程度となっている。

【００２９】したがって、このマスキング効果を上記ブ
ロック間でのビット割当ての際に考慮すれば、よりビッ
ト圧縮が可能になる。すなわち、マスキングされる部分
の信号に対してはビット数を少なくしても聴感上何ら悪
影響がないため、このマスキングされる部分のビット数
を減らして圧縮効果をより高めることができる。なお、
上記マスキング効果におけるマスキング量は、例えば上
記臨界帯域毎のエネルギの総和を求め、この臨界帯域毎
のエネルギに基づいて求められる。また、ある臨界帯域
の信号による他の臨界帯域（或いは当該ある臨界帯域自
身）の他の時間へのマスキング量を求めるようにするこ
とも可能である。このようなマスキング量に基づいて各
帯域毎の許容可能なノイズレベルが求められ、更に、こ
の各帯域毎の許容可能なノイズレベルに基づいて上記符
号化の際の割当てビット数を決定することができる。

【００３０】その後、上記フィルタ回路１５の出力は引
算器１６に送られる。該引算器１６は、上記畳込んだ領
域での後述する許容可能なノイズレベルに対応するレベ
ルαを求めるものである。なお、当該許容可能なノイズ
レベル（許容ノイズレベル）に対応するレベルαは、後
述するように、逆コンボリューション処理を行うことに
よって、臨界帯域の各帯域毎の許容ノイズレベルとなる
ようなレベルである。ここで、上記引算器１６には、上
記レベルαを求めるための許容関数（マスキングレベル
を表現する関数）が供給される。この許容関数を増減さ
せることで上記レベルαの制御を行っている。当該許容
関数は、後述する関数発生回路２９から供給されている
ものである。

【００３１】すなわち、許容ノイズレベルに対応するレ
ベルαは、臨界帯域幅の帯域の低域から順に与えられる
番号をｉとすると、次の式で求めることができる。 α＝Ｓ−（ｎ−ａｉ）この式において、ｎ，ａは定数でａ＞０、Ｓは畳込み処
理されたバークスペクトルの強度であり、該式中（ｎ−
ａｉ）が許容関数となる。本具体例ではｎ＝３８，ａ＝
１としており、この時の音質劣化はなく、良好な符号化
が行えた。

【００３２】このようにして、上記レベルαが求められ
、このデータは、割算器１７に伝送される。当該割算器
１７では、上記畳込みされた領域での上記レベルαを逆
コンボリューションするためのものである。したがって
、この逆コンボリューション処理を行うことにより、上
記レベルαからマスキングスペクトルが得られるように
なる。すなわち、このマスキングスペクトルが許容ノイ
ズスペクトルとなる。なお、上記逆コンボリューション
処理は、複雑な演算を必要とするが、本具体例では簡略
化した割算器１７を用いて逆コンボリューションを行っ
ている。

【００３３】次に、上記マスキングスペクトルは、合成
回路１８を介して減算器１９に伝送される。ここで、当
該減算器１９には、上記総和検出回路１４の出力すなわ
ち前述した総和検出回路１４からのバークスペクトルＳ
Ｂが、遅延回路２１を介して供給されている。したがっ
て、この減算器１９で上記マスキングスペクトルとバー
クスペクトルＳＢとの減算演算が行われることで、図９
に示すように、上記バークスペクトルＳＢは、該マスキ
ングスペクトルＭＳのレベルで示すレベル以下がマスキ
ングされることになる。

【００３４】当該減算器１９の出力は、上記許容ノイズ
レベル補正回路２０を介してＲＯＭ３０に送られる。該
ＲＯＭ３０には、上記符号化回路５０におけるＦＦＴ係
数データの符号化に用いる複数の割当ビット数情報が格
納されており、上記減算回路１９の出力（上記各帯域の
エネルギと上記ノイズレベル設定手段の出力との差分の
レベル）に応じた割当ビット数情報を出力するようにな
っている。なお、出力端子６２からは、ＦＦＴ係数デー
タの符号化出力と共に、フローティング処理のフローテ
ィングブロック毎のフローティング係数及びワード長情
報からなるサブ情報も出力される。

【００３５】また、合成回路１８での合成の際には、最
小可聴カーブ発生回路２２から供給される図１０に示す
ような人間の聴覚特性であるいわゆる最小可聴カーブＲ
Ｃを示すデータと、上記マスキングスペクトルＭＳとを
合成することができる。この最小可聴カーブにおいて、
雑音絶対レベルがこの最小可聴カーブ以下ならば該雑音
は聞こえないことになる。更に、該最小可聴カーブは、
コーディングが同じであっても例えば再生時の再生ボリ
ュームの違いで異なるものとなる。ただし、現実的なデ
ィジタルシステムでは、例えば１６ビットダイナミック
レンジへの音楽のはいり方にはさほど違いがないので、
例えば４ｋＨｚ付近の最も耳に聞こえやすい周波数帯域
の量子化雑音が聞こえないとすれば、他の周波数帯域で
はこの最小可聴カーブのレベル以下の量子化雑音は聞こ
えないと考えられる。したがって、このように例えばシ
ステムの持つワードレングスの４ｋＨｚ付近の雑音が聞
こえない使い方をすると仮定し、この最小可聴カーブＲ
ＣとマスキングスペクトルＭＳとを共に合成することで
許容ノイズレベルを得るようにすると、この場合の許容
ノイズレベルは、図中斜線で示す部分までとすることが
できるようになる。なお、本具体例では、上記最小可聴
カーブの４ｋＨｚのレベルを、例えば２０ビット相当の
最低レベルに合わせている。また、この図１０は、信号
スペクトルＳＳも同時に示している。

【００３６】ここで、上記許容ノイズレベル補正回路２
０では、補正値決定回路２８から送られてくるいわゆる
等ラウドネス曲線の情報に基づいて、上記減算器１９か
らの許容ノイズレベルを補正している。すなわち、上記
補正値決定回路２８からは、上記減算器１９からの許容
ノイズレベルを、いわゆる等ラウドネス曲線の情報デー
タに基づいて補正させるための補正値データが出力され
、この補正値データが上記許容ノイズレベル補正回路２
０に伝送されることで、上記減算器１９からの許容ノイ
ズレベルの等ラウドネス曲線を考慮した補正がなされる
ようになる。なお、上記等ラウドネス曲線とは、人間の
聴覚特性に関するものであり、例えば１ｋＨｚの純音と
同じ大きさに聞こえる各周波数での音の音圧を求めて曲
線で結んだもので、ラウドネスの等感度曲線とも呼ばれ
る。また、該等ラウドネス曲線は、図１０に示した最小
可聴カーブＲＣと略同じ曲線を描くものである。該等ラ
ウドネス曲線においては、例えば４ｋＨｚ付近では１ｋ
Ｈｚのところより音圧が８〜１０ｄＢ下がっても１ｋＨ
ｚと同じ大きさに聞こえ、逆に５０ｋＨｚ付近では１ｋ
Ｈｚでの音圧よりも約１５ｄＢ高くないと同じ大きさに
聞こえない。このため、上記最小可聴カーブのレベルを
越えた雑音（許容ノイズレベル）は、該等ラウドネス曲
線に応じたカーブで与えられる周波数特性を持つように
するのが良いことがわかる。このようなことから、上記
等ラウドネス曲線を考慮して上記許容ノイズレベルを補
正することは人間の聴覚特性に適合していることがわか
る。

【００３７】なお、本具体例においては、上述した最小
可聴カーブの合成処理を行わない構成とすることもでき
る。すなわち、この場合には、最小可聴カーブ発生回路
２２，合成回路１８が不要となり、上記引算器１６から
の出力は、割算器１７で逆コンボリューションされた後
、すぐに減算器１９に伝送されることになる。

【００３８】ここで、上述した本実施例による可変ビッ
トレートでの圧縮データの伝送は、例えば、一定ビット
レートの記録媒体と可変ビットレートの記録媒体との間
でデータ転送し記録するような場合に特に有効である。

【００３９】すなわち、例えば、記録媒体として例えば
いわゆるＣＤ−Ｉ（ＣＤ−インタラクティブ）、ＣＤ−
ＲＯＭ　　ＸＡ等、或いは、光磁気ディスク等を用い、
これらディスクからの上記一定ビットレートのデータを
上述した本実施例での可変ビットレートで更に圧縮して
、例えば半導体メモリ等の記録媒体（例えばいわゆるＩ
Ｃカード）に対して転送するような場合に特に有効であ
る。

【００４０】

【発明の効果】本発明のディジタル信号の高能率符号化
装置においては、入力ディジタル信号を周波数軸上の信
号に変換すると共にブロック化し、ブロック毎の入力デ
ィジタル信号を適応的な割り当てビットで符号化して伝
送するに際し、各ブロックのうちの任意の代表ブロック
の符号化に関連するデータと、他のブロックの符号化に
関連するデータとの間の偏差を求め、この偏差のデータ
を伝送するようにしたことにより、ブロック毎の伝送ビ
ットレートを下げることが可能となり、圧縮効率を高め
ることができるようになった。

【図面の簡単な説明】

【図１】本発明実施例のディジタル信号の高能率符号化
装置の概略構成を示すブロック回路図である。

【図２】準定常的な信号を示す図である。

【図３】差分値を示す図である。

【図４】非定常的な信号を示す図である。

【図５】偏差算出のための具体的構成を示すブロック回
路図である。

【図６】高速フーリエ変換処理のブロック長を示す図で
ある。

【図７】許容ノイズレベル算出のための具体的構成を示
すブロック図である。

【図８】バークスペクトルを示す図である。

【図９】マスキングスペクトルを示す図である。

【図１０】最小可聴カーブ，マスキングスペクトルを合
成した図である。

【符号の説明】

４１，４２・・・・ＱＭＦ４３，４４，４５・・・高速フーリエ変換回路５０・・
・・・・・・・符号化回路６０・・・・・・・・・許容ノイズレベル算出回路７０
・・・・・・・・・偏差算出回路

Claims

【特許請求の範囲】

【請求項１】　　入力ディジタル信号を周波数軸上の信
号に変換すると共にブロック化し、該ブロック毎の入力
ディジタル信号を適応的な割り当てビットで符号化して
伝送するディジタル信号の高能率符号化装置において、
上記各ブロックのうちの任意の代表ブロックの上記符号
化に関連するデータと、他のブロックの上記符号化に関
連するデータとの間の偏差を求める偏差算出手段を有し
、この偏差算出手段からの出力を伝送することを特徴と
するディジタル信号の高能率符号化装置。