JPH04302537A - ディジタル信号の高能率符号化方法 - Google Patents

ディジタル信号の高能率符号化方法

Info

Publication number
JPH04302537A
JPH04302537A JP9119091A JP9119091A JPH04302537A JP H04302537 A JPH04302537 A JP H04302537A JP 9119091 A JP9119091 A JP 9119091A JP 9119091 A JP9119091 A JP 9119091A JP H04302537 A JPH04302537 A JP H04302537A
Authority
JP
Japan
Prior art keywords
block
data
digital signal
encoding
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9119091A
Other languages
English (en)
Other versions
JP3132031B2 (ja
Inventor
Kenzo Akagiri
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP03091190A priority Critical patent/JP3132031B2/ja
Publication of JPH04302537A publication Critical patent/JPH04302537A/ja
Application granted granted Critical
Publication of JP3132031B2 publication Critical patent/JP3132031B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力ディジタル信号の
圧縮符号化を行うディジタル信号の高能率符号化装置に
関するものである。
【0002】
【従来の技術】オーディオ, 音声等の信号の高能率符
号化においては、オーディオ,音声等の入力信号を時間
軸又は周波数軸で複数のチャンネルに分割すると共に、
各チャンネル毎のビット数を適応的に割当てるビットア
ロケーシヨン(ビット割当て)による符号化技術がある
。 例えば、オーディオ信号等の上記ビット割当てによる符
号化技術には、時間軸上のオーディオ信号等を複数の周
波数帯域に分割して符号化する帯域分割符号化(サブ・
バンド・コーディング:SBC)や、時間軸の信号を周
波数軸上の信号に変換(直交変換)して複数の周波数帯
域に分割し各帯域毎で適応的に符号化するいわゆる適応
変換符号化(ATC)、或いは、上記SBCといわゆる
適応予測符号化(APC)とを組み合わせ、時間軸の信
号を帯域分割して各帯域信号をベースバンド(低域)に
変換した後複数次の線形予測分析を行って予測符号化す
るいわゆる適応ビット割当て(APC−AB)等の符号
化技術がある。
【0003】すなわち、上記高能率符号化においては、
例えば、時間軸上のオーディオ信号等を、複数のバンド
パスフィルタ等からなるフィルタアレイを通して周波数
分割し、これら周波数分割された信号を適応的なビット
割り当てで符号化するようなことが行われる。また、例
えば、時間軸上のオーディオ信号等を、所定の単位時間
(直交変換ブロック)毎に例えば高速フーリエ変換(F
FT)等の直交変換によって時間軸に直交する軸(周波
数軸)に変換し、その後複数の帯域に分割して、これら
分割された各帯域のFFT係数データを適応的なビット
割り当てによって符号化したり、或いはフィルタアレイ
で周波数分割した後に直交変換してFFT係数データに
変換した後、適応的なビット割り当てで符号化するよう
なことが行われる。この符号化データが伝送される。
【0004】更に、各帯域毎の上記FFT係数データを
上記適応ビット割り当てにより符号化する際には、例え
ば、上記周波数軸上のFFT係数データをブロック(フ
ローティングブロック)化し、このフローティングブロ
ック毎にいわゆるフローティング処理を施すことで、更
にビット圧縮を行う場合が多い。この場合、後の復号化
のための構成には、上記フローティングブロック毎にフ
ローティング処理されたFFT係数データと、当該各フ
ローティングブロック毎のフローティング係数及び割り
当てビット数に応じたワード長情報からなるサブ情報と
が伝送されることになる。
【0005】
【発明が解決しようとする課題】ところで、上記高能率
符号化においては、更に圧縮効率を高めることが望まれ
ているが、上述した符号化では、例えば直交変換ブロッ
ク或いはフローティングブロック内で一定のビット量が
消費されるため、ブロック毎の伝送ビットレートを下げ
ることができず、圧縮効率を高めることが出来なかった
【0006】そこで、本発明は、上述のような実情に鑑
みて提案されたものであり、より高いビット圧縮が可能
なディジタル信号の高能率符号化装置を提供することを
目的とするものである。
【0007】
【課題を解決するための手段】本発明のディジタル信号
の高能率符号化装置は、上述の目的を達成するために提
案されたものであり、入力ディジタル信号を周波数軸上
の信号に変換すると共にブロック化し、該ブロック毎の
入力ディジタル信号を適応的な割り当てビット数で符号
化して伝送するディジタル信号の高能率符号化装置にお
いて、上記各ブロックのうちの任意の代表ブロックの上
記符号化に関連するデータと、他のブロックの上記符号
化に関連するデータとの間の偏差を求める偏差算出手段
を有し、この偏差算出手段からの出力を伝送するように
したものである。すなわち、本発明装置は、入力ディジ
タル信号が例えばサイン波等の定常的なディジタル信号
が連続するものであるか或いはこの定常的信号に準ずる
準定常的なディジタル信号が連続するものである場合、
任意の代表ブロックと他のブロック間での上記偏差(差
分)を求めるようにし、この偏差のデータを伝送するよ
うにしている。また、上記入力ディジタル信号が上記定
常的,準定常的な信号であるか否かの判断は、上記偏差
のデータの情報量とブロック毎の符号化に関連するデー
タの情報量とを比較することにより行う。上記偏差のデ
ータの情報量が上記各ブロックのものよりも少ない場合
には、上記入力ディジタル信号が定常的,準定常的な信
号であると判断すると共に、当該偏差のデータを伝送す
るようにする。逆に、上記偏差のデータの情報の方が多
い場合には、各ブロック毎のデータを伝送するようにす
る。更に、上記偏差算出手段において、各ブロック間か
ら得られる偏差のデータとしては、ブロック毎の直交変
換による係数データ(スペクトル成分)の差分のデータ
の場合と、ブロック毎にいわゆるフローティング処理を
行う場合のフローティング係数及びワード長情報の差分
(サブ情報の差分)のデータの場合、若しくは、この両
者とする場合を考えることができる。また更に、上記フ
ローティング処理を行う場合、上記直交変換による係数
データの偏差は、該フローティング処理の前のデータか
或いは処理後のデータとすることができる。
【0008】
【作用】本発明によれば、任意の代表ブロックの符号化
に関連するデータと他のブロックの符号化に関連するデ
ータとの偏差すなわち差分を伝送するようにしているた
め、伝送ビットレートが下がるようになる。
【0009】
【実施例】以下、本発明を適用した実施例について図面
を参照しながら説明する。本実施例のディジタル信号の
高能率符号化装置は、オーディオ或いは音声等の入力デ
ィジタル信号を、例えば、前述の高能率符号化の帯域分
割符号化(SBC)によって帯域分割すると共に、直交
変換して周波数軸上の信号に変換した後符号化するよう
にしている。
【0010】すなわち、本実施例の高能率符号化装置で
は、図1に示すように、帯域分割フィルタとしてのいわ
ゆるミラーフィルタのQMF(quadrature 
mirror filter)41,42によって、入
力端子1を介して供給される上記入力ディジタル信号を
、いわゆる臨界帯域(クリティカルバンド)での分割を
考慮して高域程帯域幅が広くなるように複数の帯域に分
割(例えば大別して3つの帯域に分割)し、この分割さ
れた帯域毎に複数のサンプルからなるブロック(直交変
換ブロック)を形成して、これら各直交変換ブロック毎
に高速フーリエ変換(FFT)回路43,44,45に
よる直交変換(時間軸を周波数軸に変換)を行うことで
係数データ(FFT係数データ)を得るようになってい
る。その後、この3分割された各帯域のFFT係数デー
タを、後述する許容ノイズレベル算出回路60で求めら
れる許容ノイズレベルに基づいた適応的な割り当てビッ
ト数で符号化している。この符号化が符号化回路50に
よって行われ、当該符号化後のデータが偏差算出回路7
0を介して出力端子2から出力されるようになっている
【0011】ここで、本実施例装置は、上記各直交変換
ブロックのうちの任意の代表ブロック(代表直交変換ブ
ロック)の上記符号化に関連するデータと、他の直交変
換ブロックの符号化に関連するデータとの間の偏差を求
める上記偏差算出回路70を有し、この偏差算出回路7
0からの出力を伝送するようにしている。すなわち、例
えば、入力ディジタル信号が例えばサイン波等の定常的
なディジタル信号が連続するものであったり或いはこの
定常的信号に準ずる準定常的なディジタル信号が連続す
るものであった場合、任意の代表直交変換ブロックと他
の直交変換ブロック間での偏差を求めるようにし、この
偏差のデータを伝送するようにしている。例えば、図2
に示すように準定常的なディジタル信号が連続して供給
された場合、任意の代表直交変換ブロックBaのデータ
を直交変換して得られた周波数成分(後述する振幅値)
Saと、他の直交変換ブロックBbのデータを直交変換
して得られた周波数成分(振幅値)Sbとは、略同じ周
波数の成分であり、したがって、上記偏差算出回路70
では、それらの差分をとって、図3に示すような差分値
Sdを得て、当該差分値Sdを伝送するようにしている
。なお図3にはディジタル信号をアナログ的な信号とし
て示している。
【0012】このように入力ディジタル信号が準定常的
信号であるならば、上述したような差分演算処理を連続
して繰り返すようにする。また、この繰り返される該差
分演算は、先ず、代表直交変換ブロックBaとその次の
ブロックBbとの差分を取り、次に、該ブロックBaと
ブロックBbの次のブロックBc(図示は省略)との差
分、該ブロックBaとブロックBcの次のブロックBd
(図示は省略)との差分を取っていくというように順次
繰り返すようにする。更に、この差分演算の繰り返しの
他の方法としては、上述のように代表直交変換ブロック
をブロックBaのみに決めるのではなく、順次代表直交
変換ブロックを更新するような方法とすることも可能で
ある。例えば、ブロックBbと代表のブロックBaとの
差分を取り、次に、代表ブロックをブロックBaからB
bに更新して当該ブロックBcとブロックBbとの差分
を取り、更に代表ブロックをブロックBbからBcに更
新して当該ブロックBdとブロックBcとの差分を取っ
ていくという方法とすることも可能である。
【0013】また、上記入力ディジタル信号は上記定常
的或いは準定常的な信号のみが連続するものであるとは
限らず、例えば図4に示すように、これら準定常的信号
以外の非定常的信号が連続するような場合が多い。この
場合、伝送するデータとしては、上記差分のデータを伝
送するか或いは各ブロック毎のデータをそのまま送るか
の何れかを判断して、伝送情報量の少なくなる方を選ん
で伝送するようにする。例えば、図4に示すような非定
常的信号の場合、代表直交変換ブロックBaとその次の
ブロックBbから得られる各周波数成分は異なり、した
がって、これらの差分を取っても情報量は低減されない
ことが考えられる。このようなことから、上記偏差算出
回路70では、上記ブロックBaとブロックBbとの差
分を取って得た上記差分値のデータを伝送する際の情報
量とブロックBa及びBbのデータを伝送する際の情報
量とを比較して、情報量が少なくなる方を伝送する。た
だし、この場合は、差分値のデータを送ったか或いはブ
ロック毎のデータをそのまま伝送したかの何れかを示す
モード情報も同時に伝送することが必要となる。なお、
この図4もディジタル信号を便宜的にアナログ信号とし
て示している。
【0014】更に、上記偏差算出回路70においては、
上述したように、各ブロック間から得られる偏差のデー
タを、上記直交変換ブロック間のFFT係数データ(ス
ペクトル成分)の差分とする場合と、例えばいわゆるフ
ローティング処理を行う場合のフローティング係数及び
ワード長情報の差分(サブ情報の差分)とする場合、若
しくは、この両者とする場合を考えることができる。な
おワード長情報とは、符号化の際の割り当てビット数に
対応するものである。このように、フローティング処理
を行って得られたフローティング係数及びワード長情報
の差分を伝送するような場合も、上述同様に連続するブ
ロック(フローティングブロック)間での差分を取るよ
うにする。また、上記両者の差分を伝送するようにした
場合、上記FFT係数データの差分演算は、上記フロー
ティング処理の前か或いは処理後のいずれであってもよ
い。
【0015】上述のように、本実施例では、上記差分の
データを伝送するようにしているため、各ブロック毎に
一定のビットレート(固定ビットレート)であったデー
タを、各ブロック毎に異なるビットレート(すなわち可
変ビットレート)で伝送することになり、データ圧縮率
を高めることが可能となっている。
【0016】上記偏差算出回路70の具体的構成を図5
に示す。この図5において、端子71には、上記符号化
回路50からの符号化データが供給される。該符号化デ
ータは、上述したように、直交変換ブロック単位のFF
T係数データや、フローティングブロック単位のフロー
ティング係数及びワード長のデータである。これらデー
タのうち、例えばN番目のブロックのデータが上記代表
ブロック(直交変換ブロック,フローティングブロック
)としてメモリ等のデータ格納手段72に蓄えられ、更
に、該N番目のブロックの次のN+1番目のブロック(
上記他のブロック)のデータがデータ格納手段73に蓄
えられる。これら、格納手段72,73の出力は、共に
、減算手段74に送られ、上述したような差分値が求め
られる。この差分値が比較選択手段75に送られる。 また、当該比較選択手段75には上記各格納手段73,
74からのブロック毎のデータも供給されており、した
がって、当該比較選択手段75では上記減算手段74か
らのブロックの差分値の情報量と、各ブロック毎の情報
量とを比較して、伝送情報量の少ない方を選択して出力
するようになっている。また、上記モード情報も出力さ
れるようになっている。この出力が端子76から出力さ
れる。
【0017】再び図1に戻って、入力端子1にはアナロ
グオーディオ信号等をサンプリング(例えば1024サ
ンプル)して得たディジタル信号(0〜20kHz)が
供給されており、該ディジタル信号は上記QMF41,
42により、上記高域程帯域幅が広くなるように大まか
に3つの帯域(0〜5kHz,5kHz〜10kHz,
10kHz〜20kHz)に分割される。上記QMF4
1では、上記0〜20kHzのディジタル信号が2分割
されて10kHz〜20kHzと0〜10kHzの2つ
の出力が得られ、10kHz〜20kHzの出力は高速
フーリエ変換回路43に、0〜10kHzの出力はQM
F42に送られる。QMF42へ送られた0〜10kH
zの出力は、該QMF42で更に2分割されて5kHz
〜10kHzと0〜5kHzの2つの出力が得られる。 上記5kHz〜10kHzの出力は上記高速フーリエ変
換回路44に送られ、上記0〜5kHzの出力は高速フ
ーリエ変換回路45に送られる。
【0018】ここで、上記各高速フーリエ変換回路43
,44,45における上記3つの帯域の各帯域の直交変
換ブロックのブロック長は、それぞれ異なるブロック長
となされている。例えば、図6に示すように、上記10
kHz〜20kHzの高域に対応する高速フーリエ変換
回路43では例えば5msec毎の直交変換ブロック長
bH1,bH2,bH3,bH4とされ、上記5kHz
〜10kHzの中域に対応する高速フーリエ変換回路4
4では例えば10msec毎の直交変換ブロック長bM
1,bM2とされ、上記0〜5kHzの低域に対応する
高速フーリエ変換回路45では例えば20msec毎の
直交変換ブロック長bL とされる。
【0019】上述したように、高域及び中域の直交変換
ブロック長を低域よりも短くし、低域の直交変換ブロッ
ク長を長くするのは、以下に示すような理由による。す
なわち、人間の聴覚における周波数分析能力(周波数分
解能)は、一般に、高域ではさほど高くないが低域では
高いものであり、したがって、該低域での周波数分解能
を確保する必要性から、現実には上述したように直交変
換ブロック長をあまり短くすることはできないためであ
る。また、一般に、低域信号では定常区間が長く、逆に
高域信号では短いため、高域(及び中域)での直交変換
ブロック長を短くする(時間分解能を高める)ことは有
効となる。上述のようなことから、本実施例では、上記
定常的な信号以外の時に高域及び中域の直交変換ブロッ
ク長を、低域の直交変換ブロック長よりも短いものとし
、低域の直交変換ブロック長を長くしている。
【0020】このように、本実施例においては、聴覚か
ら必要とされる周波数軸上の分解能と時間軸上の分解能
を同時に満足するような構成となっていて、上記低域(
0〜5kHz)では処理のサンプル数を多くして周波数
分解能を上げ、高域(10kHz〜20kHz)では時
間分解能を上げている。また、中域(5kHz〜10k
Hz)でも時間分解能を上げている。
【0021】なお、上記直交変換は上述した高速フーリ
エ変換に限らず例えば離散的余弦変換(DCT)、MD
CT等をも適用することができる。
【0022】これら各高速フーリエ変換回路43,44
,45の出力が、符号化回路50に送られている。ここ
で、本実施例の符号化回路50における上記3つの帯域
のFFT係数データの符号化の際には、人間の聴覚特性
に基づく適応的な割当てビット数で符号化を行うように
しているため、上記各FFT係数データを、上記臨界帯
域での帯域(例えば25バンド)に対応させている。 このため、上記高速フーリエ変換回路43の出力は、臨
界帯域の高域の例えば2つの帯域と対応し、高速フーリ
エ変換回路44の出力は臨界帯域の中域の例えば3つの
帯域と対応し、高速フーリエ変換回路45の出力は臨界
帯域の低域の例えば20個の帯域と対応するようになさ
れている。なお、上記臨界帯域幅とは、人間の聴覚特性
(周波数分析能力)を考慮したものであり、例えば0〜
20kHzを25帯域に分け、高い周波数帯域ほど帯域
幅を広く選定しているものである。すなわち人間の聴覚
は、一種のバンドパスフィルタのような特性を有してい
て、この各フィルタによって分けられたバンドを臨界帯
域と呼んでいる。
【0023】上記符号化回路50での符号化は、上記許
容ノイズレベル算出回路60における各臨界帯域毎の許
容ノイズレベルに基づいた割り当てビット数によって適
応的に行われている。
【0024】上述した本実施例のディジタル信号の高能
率符号化装置の許容ノイズレベル算出回路60の具体的
構成を図7に示す。
【0025】すなわちこの図7において、入力端子61
には、各高速フーリエ変換回路43,44,45から上
記臨界帯域毎のFFT係数データのうち振幅情報Amの
情報のみが供給される。すなわち、一般に人間の聴覚は
周波数領域の振幅(パワー)には敏感であるが、位相に
ついてはかなり鈍感であるため、本具体例では上記振幅
情報Amのみを用いて上記許容ノイズレベルを算出する
ようにしている。
【0026】上記臨界帯域毎の上記振幅情報Amは、各
々上記総和検出回路14に伝送される。この総和検出回
路14では、各帯域毎のエネルギ(各帯域でのスペクト
ル強度)が、各帯域内のそれぞれの振幅情報Amの総和
(振幅情報Amのピーク又は平均或いはエネルギ総和)
をとることにより求められる。該総和検出回路14の出
力すなわち各帯域の総和のスペクトルは、一般にバーク
スペクトルと呼ばれ、この各帯域のバークスペクトルS
Bは例えば図8に示すようになる。ただし、図8では図
示を簡略化するため、上記クリティカルバンドのバンド
数を12の帯域(B1 〜B12)で表現している。
【0027】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するため、該バーク
スペクトルSBに所定の重みづけの関数を畳込む(コン
ボリューション)。このため、上記総和検出回路14の
出力すなわち該バークスペクトルSBの各値は、フィル
タ回路15に送られる。該フィルタ回路15は、例えば
、入力データを順次遅延させる複数の遅延素子と、これ
ら遅延素子からの出力にフィルタ係数(重みづけの関数
)を乗算する複数の乗算器(例えば各帯域に対応する2
5個の乗算器)と、各乗算器出力の総和をとる総和加算
器とから構成されるものである。このフィルタ回路15
の各乗算器において、例えば、任意の帯域に対応する乗
算器Mでフィルタ係数1を、乗算器M−1でフィルタ係
数0.15を、乗算器M−2でフィルタ係数0.001
9を、乗算器M−3でフィルタ係数0.0000086
を、乗算器M+1でフィルタ係数0.4を、乗算器M+
2でフィルタ係数0.06を、乗算器M+3でフィルタ
係数0.007を各遅延素子の出力に乗算することによ
り、上記バークスペクトルSBの畳込み処理が行われる
。ただし、Mは1〜25の任意の整数である。この畳込
み処理により、図8中点線で示す部分の総和がとられる
。なお、上記マスキングとは、人間の聴覚上の特性によ
り、ある信号によって他の信号がマスクされて聞こえな
くなる現象をいうものであり、このマスキング効果には
、時間軸上のオーディオ信号に対するマスキング効果と
周波数軸上の信号に対するマスキング効果とがある。 すなわち、該マスキング効果により、マスキングされる
部分にノイズがあったとしても、このノイズは聞こえな
いことになる。このため、実際のオーディオ信号では、
このマスキングされる部分内のノイズは許容可能なノイ
ズとされる。
【0028】ここで、上記マスキングとは、人間の聴覚
特性に関するものである。すなわち、一般に音に対する
人間の聴覚特性には、マスキング効果と呼ばれるものが
あり、当該マスキング効果には、テンポラルマスキング
効果と同時刻マスキング効果等がある。上記同時刻マス
キング効果とは、ある大きな音と同時刻に発生する小さ
な音(或いはノイズ)が当該大きな音によってマスクさ
れて聞こえなくなるような効果であり、上記テンポラル
マスキング効果とは、大きな音の時間的な前後の小さな
音(ノイズ)が、この大きな音にマスクされて聞こえな
くなるような効果である。このテンポラルマスキング効
果において、上記大きな音の時間的に後方のマスキング
はフォワードマスキングと呼ばれ、また、時間的に前方
のマスキングはバックワードマスキングと呼ばれている
。また、テンポラルマスキングにおいては、人間の聴覚
特性から、フォワードマスキングの効果は長時間(例え
ば100msec程度)効くようになっているのに対し
、バックワードマスキングの効果の持続時間は短時間(
例えば5msec程度)となっている。更に、上記マス
キング効果のレベル(マスキング量)は、フォワードマ
スキングが20dB程度で、バックワードマスキングが
30dB程度となっている。
【0029】したがって、このマスキング効果を上記ブ
ロック間でのビット割当ての際に考慮すれば、よりビッ
ト圧縮が可能になる。すなわち、マスキングされる部分
の信号に対してはビット数を少なくしても聴感上何ら悪
影響がないため、このマスキングされる部分のビット数
を減らして圧縮効果をより高めることができる。なお、
上記マスキング効果におけるマスキング量は、例えば上
記臨界帯域毎のエネルギの総和を求め、この臨界帯域毎
のエネルギに基づいて求められる。また、ある臨界帯域
の信号による他の臨界帯域(或いは当該ある臨界帯域自
身)の他の時間へのマスキング量を求めるようにするこ
とも可能である。このようなマスキング量に基づいて各
帯域毎の許容可能なノイズレベルが求められ、更に、こ
の各帯域毎の許容可能なノイズレベルに基づいて上記符
号化の際の割当てビット数を決定することができる。
【0030】その後、上記フィルタ回路15の出力は引
算器16に送られる。該引算器16は、上記畳込んだ領
域での後述する許容可能なノイズレベルに対応するレベ
ルαを求めるものである。なお、当該許容可能なノイズ
レベル(許容ノイズレベル)に対応するレベルαは、後
述するように、逆コンボリューション処理を行うことに
よって、臨界帯域の各帯域毎の許容ノイズレベルとなる
ようなレベルである。ここで、上記引算器16には、上
記レベルαを求めるための許容関数(マスキングレベル
を表現する関数)が供給される。この許容関数を増減さ
せることで上記レベルαの制御を行っている。当該許容
関数は、後述する関数発生回路29から供給されている
ものである。
【0031】すなわち、許容ノイズレベルに対応するレ
ベルαは、臨界帯域幅の帯域の低域から順に与えられる
番号をiとすると、次の式で求めることができる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、該式中(n−
ai)が許容関数となる。本具体例ではn=38,a=
1としており、この時の音質劣化はなく、良好な符号化
が行えた。
【0032】このようにして、上記レベルαが求められ
、このデータは、割算器17に伝送される。当該割算器
17では、上記畳込みされた領域での上記レベルαを逆
コンボリューションするためのものである。したがって
、この逆コンボリューション処理を行うことにより、上
記レベルαからマスキングスペクトルが得られるように
なる。すなわち、このマスキングスペクトルが許容ノイ
ズスペクトルとなる。なお、上記逆コンボリューション
処理は、複雑な演算を必要とするが、本具体例では簡略
化した割算器17を用いて逆コンボリューションを行っ
ている。
【0033】次に、上記マスキングスペクトルは、合成
回路18を介して減算器19に伝送される。ここで、当
該減算器19には、上記総和検出回路14の出力すなわ
ち前述した総和検出回路14からのバークスペクトルS
Bが、遅延回路21を介して供給されている。したがっ
て、この減算器19で上記マスキングスペクトルとバー
クスペクトルSBとの減算演算が行われることで、図9
に示すように、上記バークスペクトルSBは、該マスキ
ングスペクトルMSのレベルで示すレベル以下がマスキ
ングされることになる。
【0034】当該減算器19の出力は、上記許容ノイズ
レベル補正回路20を介してROM30に送られる。該
ROM30には、上記符号化回路50におけるFFT係
数データの符号化に用いる複数の割当ビット数情報が格
納されており、上記減算回路19の出力(上記各帯域の
エネルギと上記ノイズレベル設定手段の出力との差分の
レベル)に応じた割当ビット数情報を出力するようにな
っている。なお、出力端子62からは、FFT係数デー
タの符号化出力と共に、フローティング処理のフローテ
ィングブロック毎のフローティング係数及びワード長情
報からなるサブ情報も出力される。
【0035】また、合成回路18での合成の際には、最
小可聴カーブ発生回路22から供給される図10に示す
ような人間の聴覚特性であるいわゆる最小可聴カーブR
Cを示すデータと、上記マスキングスペクトルMSとを
合成することができる。この最小可聴カーブにおいて、
雑音絶対レベルがこの最小可聴カーブ以下ならば該雑音
は聞こえないことになる。更に、該最小可聴カーブは、
コーディングが同じであっても例えば再生時の再生ボリ
ュームの違いで異なるものとなる。ただし、現実的なデ
ィジタルシステムでは、例えば16ビットダイナミック
レンジへの音楽のはいり方にはさほど違いがないので、
例えば4kHz付近の最も耳に聞こえやすい周波数帯域
の量子化雑音が聞こえないとすれば、他の周波数帯域で
はこの最小可聴カーブのレベル以下の量子化雑音は聞こ
えないと考えられる。したがって、このように例えばシ
ステムの持つワードレングスの4kHz付近の雑音が聞
こえない使い方をすると仮定し、この最小可聴カーブR
CとマスキングスペクトルMSとを共に合成することで
許容ノイズレベルを得るようにすると、この場合の許容
ノイズレベルは、図中斜線で示す部分までとすることが
できるようになる。なお、本具体例では、上記最小可聴
カーブの4kHzのレベルを、例えば20ビット相当の
最低レベルに合わせている。また、この図10は、信号
スペクトルSSも同時に示している。
【0036】ここで、上記許容ノイズレベル補正回路2
0では、補正値決定回路28から送られてくるいわゆる
等ラウドネス曲線の情報に基づいて、上記減算器19か
らの許容ノイズレベルを補正している。すなわち、上記
補正値決定回路28からは、上記減算器19からの許容
ノイズレベルを、いわゆる等ラウドネス曲線の情報デー
タに基づいて補正させるための補正値データが出力され
、この補正値データが上記許容ノイズレベル補正回路2
0に伝送されることで、上記減算器19からの許容ノイ
ズレベルの等ラウドネス曲線を考慮した補正がなされる
ようになる。なお、上記等ラウドネス曲線とは、人間の
聴覚特性に関するものであり、例えば1kHzの純音と
同じ大きさに聞こえる各周波数での音の音圧を求めて曲
線で結んだもので、ラウドネスの等感度曲線とも呼ばれ
る。また、該等ラウドネス曲線は、図10に示した最小
可聴カーブRCと略同じ曲線を描くものである。該等ラ
ウドネス曲線においては、例えば4kHz付近では1k
Hzのところより音圧が8〜10dB下がっても1kH
zと同じ大きさに聞こえ、逆に50kHz付近では1k
Hzでの音圧よりも約15dB高くないと同じ大きさに
聞こえない。このため、上記最小可聴カーブのレベルを
越えた雑音(許容ノイズレベル)は、該等ラウドネス曲
線に応じたカーブで与えられる周波数特性を持つように
するのが良いことがわかる。このようなことから、上記
等ラウドネス曲線を考慮して上記許容ノイズレベルを補
正することは人間の聴覚特性に適合していることがわか
る。
【0037】なお、本具体例においては、上述した最小
可聴カーブの合成処理を行わない構成とすることもでき
る。すなわち、この場合には、最小可聴カーブ発生回路
22,合成回路18が不要となり、上記引算器16から
の出力は、割算器17で逆コンボリューションされた後
、すぐに減算器19に伝送されることになる。
【0038】ここで、上述した本実施例による可変ビッ
トレートでの圧縮データの伝送は、例えば、一定ビット
レートの記録媒体と可変ビットレートの記録媒体との間
でデータ転送し記録するような場合に特に有効である。
【0039】すなわち、例えば、記録媒体として例えば
いわゆるCD−I(CD−インタラクティブ)、CD−
ROM  XA等、或いは、光磁気ディスク等を用い、
これらディスクからの上記一定ビットレートのデータを
上述した本実施例での可変ビットレートで更に圧縮して
、例えば半導体メモリ等の記録媒体(例えばいわゆるI
Cカード)に対して転送するような場合に特に有効であ
る。
【0040】
【発明の効果】本発明のディジタル信号の高能率符号化
装置においては、入力ディジタル信号を周波数軸上の信
号に変換すると共にブロック化し、ブロック毎の入力デ
ィジタル信号を適応的な割り当てビットで符号化して伝
送するに際し、各ブロックのうちの任意の代表ブロック
の符号化に関連するデータと、他のブロックの符号化に
関連するデータとの間の偏差を求め、この偏差のデータ
を伝送するようにしたことにより、ブロック毎の伝送ビ
ットレートを下げることが可能となり、圧縮効率を高め
ることができるようになった。
【図面の簡単な説明】
【図1】本発明実施例のディジタル信号の高能率符号化
装置の概略構成を示すブロック回路図である。
【図2】準定常的な信号を示す図である。
【図3】差分値を示す図である。
【図4】非定常的な信号を示す図である。
【図5】偏差算出のための具体的構成を示すブロック回
路図である。
【図6】高速フーリエ変換処理のブロック長を示す図で
ある。
【図7】許容ノイズレベル算出のための具体的構成を示
すブロック図である。
【図8】バークスペクトルを示す図である。
【図9】マスキングスペクトルを示す図である。
【図10】最小可聴カーブ,マスキングスペクトルを合
成した図である。
【符号の説明】
41,42・・・・QMF 43,44,45・・・高速フーリエ変換回路50・・
・・・・・・・符号化回路 60・・・・・・・・・許容ノイズレベル算出回路70
・・・・・・・・・偏差算出回路

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  入力ディジタル信号を周波数軸上の信
    号に変換すると共にブロック化し、該ブロック毎の入力
    ディジタル信号を適応的な割り当てビットで符号化して
    伝送するディジタル信号の高能率符号化装置において、
    上記各ブロックのうちの任意の代表ブロックの上記符号
    化に関連するデータと、他のブロックの上記符号化に関
    連するデータとの間の偏差を求める偏差算出手段を有し
    、この偏差算出手段からの出力を伝送することを特徴と
    するディジタル信号の高能率符号化装置。
JP03091190A 1991-03-29 1991-03-29 ディジタル信号の高能率符号化方法 Expired - Lifetime JP3132031B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03091190A JP3132031B2 (ja) 1991-03-29 1991-03-29 ディジタル信号の高能率符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03091190A JP3132031B2 (ja) 1991-03-29 1991-03-29 ディジタル信号の高能率符号化方法

Publications (2)

Publication Number Publication Date
JPH04302537A true JPH04302537A (ja) 1992-10-26
JP3132031B2 JP3132031B2 (ja) 2001-02-05

Family

ID=14019525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03091190A Expired - Lifetime JP3132031B2 (ja) 1991-03-29 1991-03-29 ディジタル信号の高能率符号化方法

Country Status (1)

Country Link
JP (1) JP3132031B2 (ja)

Also Published As

Publication number Publication date
JP3132031B2 (ja) 2001-02-05

Similar Documents

Publication Publication Date Title
US5583967A (en) Apparatus for compressing a digital input signal with signal spectrum-dependent and noise spectrum-dependent quantizing bit allocation
KR100293855B1 (ko) 고능률디지털데이터부호화및복호화장치
JP3134337B2 (ja) ディジタル信号符号化方法
US5664056A (en) Digital encoder with dynamic quantization bit allocation
US5553193A (en) Bit allocation method and device for digital audio signals using aural characteristics and signal intensities
US5873065A (en) Two-stage compression and expansion of coupling processed multi-channel sound signals for transmission and recording
US5268685A (en) Apparatus with transient-dependent bit allocation for compressing a digital signal
US5475789A (en) Method of compressing an audio signal using adaptive bit allocation taking account of temporal masking
JPH0435123A (ja) ディジタル信号符号化装置
JPH03117919A (ja) ディジタル信号符号化装置
JPH03256411A (ja) ディジタルデータの高能率符号化方法
JP3041967B2 (ja) ディジタル信号符号化装置
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JPH04302537A (ja) ディジタル信号の高能率符号化方法
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JPH06324093A (ja) オーディオ信号のスペクトル表示装置
JP3089691B2 (ja) ディジタルデータの高能率符号化方法
JP3070123B2 (ja) ディジタル信号符号化装置及び方法
JP3227945B2 (ja) 符号化装置
JPH08125543A (ja) ディジタル信号圧縮方法及び装置、並びに記録媒体
JP3060576B2 (ja) ディジタル信号符号化方法
JP3060577B2 (ja) ディジタル信号符号化方法
JPH07181996A (ja) 情報処理方法、情報処理装置、及びメディア
JPH04104618A (ja) ディジタル信号符号化装置
JPH04302536A (ja) ディジタル信号符号化方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20001024

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071124

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081124

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091124

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091124

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101124

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101124

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111124

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111124

Year of fee payment: 11