JP3033157B2 - ディジタル信号符号化装置 - Google Patents

ディジタル信号符号化装置

Info

Publication number
JP3033157B2
JP3033157B2 JP2221367A JP22136790A JP3033157B2 JP 3033157 B2 JP3033157 B2 JP 3033157B2 JP 2221367 A JP2221367 A JP 2221367A JP 22136790 A JP22136790 A JP 22136790A JP 3033157 B2 JP3033157 B2 JP 3033157B2
Authority
JP
Japan
Prior art keywords
band
noise level
tonality
circuit
bands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2221367A
Other languages
English (en)
Other versions
JPH04104618A (ja
Inventor
京弥 筒井
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2221367A priority Critical patent/JP3033157B2/ja
Publication of JPH04104618A publication Critical patent/JPH04104618A/ja
Application granted granted Critical
Publication of JP3033157B2 publication Critical patent/JP3033157B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、入力ディジタル音声信号の符号化を行うデ
ィジタル信号符号化装置に関するものである。
〔発明の概要〕
本発明は、入力音声信号を複数帯域に分割した各バン
ド毎のエネルギとトーナリティとに基づいて他のバンド
への影響度を求めて各バンド毎の許容ノイズレベルを設
定し、この許容ノイズレベルと各バンドのエネルギとの
差に応じたビット数で各バンド成分の量子化を行うこと
により、また、各バンド毎のエネルギをフィルタ処理し
て他のバンドへの影響度を計算すること、或いは、各バ
ンドの信号成分を単一周波数成分とホワイトノイズ成分
とに分離してそれぞれ異なるフィルタ特性でフィルタ処
理して合成を行うこと、更に、各バンド毎のトーナリテ
ィを示す指標に応じてフィルタ特性を可変することによ
り、低ビットレートに圧縮しても音質劣化の少ない符号
化が可能なディジタル信号符号化装置を提供するもので
ある。
〔従来の技術〕
オーディオ、音声等の信号の高能率符号化において
は、オーディオ,音声等の入力信号を時間軸又は周波数
軸で複数のチャンネルに分割すると共に、各チャンネル
毎のビット数を適応的に割当てるビットアロケーシヨン
(ビット割当て)による符号化技術がある。例えば、オ
ーディオ信号等の上記ビット割当てによる符号化技術に
は、時間軸上のオーディオ信号等を複数の周波数帯域に
分割して符号化する帯域分割符号化(サブ・バンド・コ
ーディング:SBC)や、時間軸の信号を周波数軸上の信号
に変換(直交変換)して複数の周波数帯域に分割し各帯
域毎で適応的に符号化するいわゆる適応変換符号化(AT
C)、或いは、上記SBCといわゆる適応予測符号化(AP
C)とを組み合わせ、時間軸の信号を帯域分割して各帯
域信号をベースバンド(低域)に変換した後複数次の線
形予測分析を行って予測符号化するいわゆる適応ビット
割当て(APC−AB)等の符号化技術がある。
このような高能率符号化では、近年人間の聴覚上の特
性におけるいわゆるマスキング特性を考慮した高能率符
号化の手法が盛んに試みられている。該マスキングの効
果とは、ある信号によって他の信号がマスクされて聞こ
えなくなる現象をいうものであり、該マスキング効果に
は、例えば周波数軸上のオーディオ信号におけるマスキ
ング効果がある。
ここで、上記周波数軸上のオーディオ信号に対するマ
スキング効果においては、例えば、ある周波数fsの正弦
波Wsがあった場合、人間の聴覚によるマスキング効果を
示すマスキングスペクトル(マスキングカーブ)MSは、
第8図のようになり、このマスキングスペクトルMSによ
って、図中斜線部で示す部分がマスキングされることに
なる。すなわち、該マスキングスペクトルMS内にノイズ
があったとしても聞こえなくなるため、実際のオーディ
オ信号では、該マスキングスペクトルMS内のノイズは許
容可能となる。このため、上記正弦波Wsの場合の許容可
能なノイズレベルは、第8図中jで示すレベル以下のレ
ベルとなる。またこのとき、該正弦波Wsの周波数fsでマ
スキングの効果が最も高く、該正弦波Wsの周波数fsから
離れるにしたがってマスキングの効果が低くなる。
〔発明が解決しようとする課題〕
このようなことから、上記高能率符号化の際に上述し
たようなマスキング効果を考慮して上記許容可能なノイ
ズレベル以下の信号成分に対して量子化の割当てビット
数を減らすようにすることで、よりビットレートの低減
が可能となる。
ところで、現在は、更にビットレートを低減すること
が望まれている。しかし、ビットレートを更に低減する
ようにすると、音質が劣化するようになり好ましくな
い。
そこで、本発明は、上述のような実情に鑑みて提案さ
れたものであり、より低ビットレートに圧縮しても音質
劣化の少ない符号化を行うことのできるディジタル信号
符号化装置を提供することを目的とするものである。
〔課題を解決するための手段〕
本発明のディジタル信号符号化装置は、上述の目的を
達成するために提案されたものであり、入力ディジタル
信号を複数の周波数帯域に分割する帯域分割手段と、上
記帯域分割手段により分割された各バンド毎のエネルギ
に基づいて他のバンドへの影響度を計算して各バンド毎
の許容ノイズレベルを設定するノイズレベル設定手段
と、上記各バンド毎のトーナリティに応じて上記ノイズ
レベル設定手段での他のバンドへの影響度を制御する制
御手段と、上記各バンドのエネルギと上記トーナリティ
に応じて制御された許容ノイズレベルとの差に応じたビ
ット数で各バンドの信号成分を量子化する量子化手段と
を有してなるものであり、また、上記ノイズレベル設定
手段は、上記各バンド毎のエネルギが入力されて上記他
のバンドへの影響度を計算するフィルタ手段を有し、更
に、上記ノイズレベル設定手段は、各バンド毎の信号成
分が単一周波数成分とホワイトノイズ成分とに分離され
た各成分がそれぞれ入力される各々特性の異なる2つの
フィルタ手段を有し、上記制御手段は、上記ノイズレベ
ル設定手段の上記各フィルタからの出力を合成するよう
にし、また更に、上記制御手段は、各バンド毎にトーナ
リティを示す指標を検出し、該トーナリティを示す指標
に応じて上記ノイズレベル設定手段のフィルタ手段の特
性を可変するようにしたものである。
なお、一般に、トーナリティが高い信号成分による他
バンドへの影響度すなわちマスキング効果は大きく、逆
にトーナリティが低い信号成分でのマスキング効果は小
さくなる。
〔作用〕 本発明によれば、入力ディジタル音声信号の各バンド
の信号成分を、各バンドのエネルギとトーナリティに応
じて制御された許容ノイズレベルとの差に応じたビット
数で量子化しているため、音質劣化を少なくすることが
できる。
〔実施例〕
以下、本発明を適用した実施例について図面を参照し
ながら説明する。
本実施例のディジタル信号符号化装置は、第1図に示
す第1の実施例装置及び第7図に示す第2の実施例装置
のように、入力ディジタル音声信号を複数の周波数帯域
に分割する帯域分割回路13と、上記帯域分割回路13によ
り分割された各バンド毎のエネルギに基づいて他のバン
ドへの影響度(すなわち、あるバンドの信号によって他
のバンドの信号がマスキングされる量)を計算して各バ
ンド毎の許容ノイズレベルを設定するノイズレベル設定
手段40と、上記各バンド毎のトーナリティに応じて上記
ノイズレベル設定手段40での他のバンドへの影響度を制
御する制御手段41と、上記各バンドのエネルギと上記ト
ーナリティに応じて制御された許容ノイズレベルとの差
に応じたビット数で各バンドの信号成分を量子化する量
子化回路24とを有してなるものである。また、上記ノイ
ズレベル設定手段40は、上記各バンド毎のエネルギが入
力されて上記他のバンドへの影響度を計算するフィルタ
手段としてのフィルタ回路15s,15w(第1図)及び可変
フィルタ回路15(第7図)を有してなるものである。更
に、第1図に示すように、上記ノイズレベル設定手段40
は、成分分離回路31によって各バンド毎の信号成分が単
一周波数成分とホワイトノイズ成分とに分離されて得ら
れた各成分がそれぞれ入力される各々特性の異なる2つ
の上記フィルタ回路15s,15wを有し、上記制御手段41
は、上記ノイズレベル設定手段40の上記各フィルタ回路
からの出力を合成回路32(及び合成回路18)で合成する
ようにしている。また更に、第7図に示すように、上記
制御手段41は、トーナリティ指標検出回路51で各バンド
毎にトーナリティを示す指標(例えば標準偏差等)を検
出し、該トーナリティを示す指標に応じて上記ノイズレ
ベル設定手段40の可変フィルタ回路15の特性を可変する
ようにしたものである。上記量子化回路24からの量子化
出力は、本実施例のディジタル信号符号化装置の出力端
子2から出力されるようになる。
ここで、第1図及び第7図に示す本実施例のディジタ
ル信号符号化装置は、入力音声(オーディオ)信号を高
速フーリエ変換(FFT)して、時間軸の信号を周波数軸
に変換した後、符号化(再量子化)を行うものである。
すなわち、先ず第1図において、入力端子1へ供給さ
れた時間軸上の入力オーディオ信号は、高速フーリエ変
換回路11に伝送される。この高速フーリエ変換回路11で
は、上記時間軸上のオーディオ信号が所定時間(単位ブ
ロック)毎に周波数軸上の信号に変換され、実数成分値
Reと虚数成分値ImとからなるFFT係数が得られる。これ
らFFT係数は振幅位相情報発生回路12に伝送され、当該
振幅位相情報発生回路12では上記実数成分値Reと虚数成
分値Imとから振幅値Amと位相値とが得られて、該振幅値
Amの情報が出力されるようになる。すなわち、一般に人
間の聴覚は周波数領域の振幅(パワー)には敏感である
が、位相についてはかなり鈍感であるため、本実施例で
は上記振幅位相情報発生回路12の出力から上記振幅値Am
のみを取り出し、これを本発明実施例での入力ディジタ
ル信号としている。
このようにして得られた振幅値Amの入力ディジタル信
号は、帯域分割回路13に伝送される。この帯域分割回路
13では、上記振幅値Amで表現された入力ディジタル信号
をいわゆる臨界帯域幅(クリティカルバンド)に分割し
ている。当該クリティカルバンドとは、人間の聴覚特性
(周波数分析能力)を考慮したものであり、例えば0〜
16kHzを24バンド(或いは0〜22kHzを25バンド)に分
け、高い周波数帯域ほどバンド幅を広く設定しているも
のである。すなわち、人間の聴覚は、一種のバンドバス
フィルタのような特性を有していて、この各フィルタに
よって分けられたバンドを臨界帯域と呼んでいる。ここ
で、第2図に上記クリティカルバンドを示す。ただし、
この第2図では図示を簡略化するため、上記クリティカ
ルバンドのバンド数を12バンド(B1〜B12)で表現して
いる。
上記帯域分割回路13でクリティカルバンドに分割され
た各バンド(例えば24バンド)毎の上記振幅値Amは、上
記ノイズレベル設定手段40に伝送される。このノイズレ
ベル設定手段40は、各バンド毎のエネルギに基づいて他
のバンドへの影響度(マスキング量)を計算して各バン
ド毎の許容ノイズレベルを設定するものであり、また、
この許容ノイズレベルが各バンド毎のトーナリティに応
じて制御されるようになっている。
ところで、一般に、単一周波数成分例えばサイン波成
分Siのようにトーナリティが高い信号成分は他バンドへ
の影響度すなわちマスキング効果が大きく、全帯域で一
様な例えばホワイトノイズ成分WNのようにトーナリティ
が低い信号成分は影響度(マスキング効果)が小さくな
ることが知られている。
このようなことから、本実施例では、上記振幅値Amを
上記ノイズレベル設定手段40の成分分離回路31に送り、
この成分分離回路31で、上記各バンド毎の信号成分か
ら、上記単一周波数成分としてのサイン波成分Siと、ホ
ワイトノイズ成分WNとを分離するようにし、その後、後
述する制御手段41によって上記ノイズレベル設定手段40
の出力を制御して各バンド毎のトーナリティに応じた許
容ノイズレベルを求めるようにしている。
上述のようなことを行うため、上記サイン波成分Si及
びホワイトノイズ成分WNは、各々サイン波成分総和検出
回路14s,ホワイトノイズ成分総和検出回路14wに伝送さ
れる。これら総和検出回路14s,14wでは、各バンド毎の
上記サイン波成分Si又はホワイトノイズ成分WNのエネル
ギ(各バンドでのスペクトル強度)が、各バンド内のそ
れぞれの振幅値Amの総和(振幅値Amのピーク又は平均或
いはエネルギ総和)をとることにより求められる。な
お、各バンド毎の成分の総和スペクトルは、一般にバー
クスペクトルと呼ばれ、この各バンド毎のバークスペク
トルSBは例えば第3図に示すようになる。すなわち、上
記総和検出回路14s,14wでは、上記サイン波成分Si又は
ホワイトノイズ成分WNの各バンド毎のバークスペクトル
SBが求められる。
ここで、上記サイン波成分Siはホワイトノイズ成分WN
のそれぞれのバークスペクトルSBのマスキングに於ける
影響を考慮するため、各バークスペクトルSBに所定の重
みづけの関数を畳込む(コンボリューション)。すなわ
ち、上記総和検出回路14s,14wの出力(上記各バークス
ペクトルSB)の各値は、それぞれ上記各バンド毎のエネ
ルギが入力されて上記他のバンドへの影響度を計算する
フィルタ手段であり、それぞれフィルタ特性の異なる2
つのフィルタ回路15s,15wに送られる。これらフィルタ
回路15S,15wは、それぞれ例えば第4図に示すように、
入力データを順次遅延させる遅延(z-1)素子・・101
m-2〜101m+3・・と、これら各遅延素子からの出力にフ
ィルタ係数(重みづけの関数)を乗算する乗算器・・10
2m-3〜102m+3・・と、総和加算器104とから構成される
ものである。この時上記各乗算器102m-3〜102m+3におけ
るフィルタ係数は、上記サイン波成分Si又はホワイトノ
イズ成分WNでそれぞさ予め定められた値とされており、
このため上記フィルタ回路15sと15wとでは特性が異なっ
ている。具体的には、トーナリティの高い信号成分が供
給されるフィルタ回路15sでのフィルタ係数は、他のバ
ンドへの影響度が大きくなるようなフィルタ特性が得ら
れる係数とされ、また、トーナリティの低い信号成分が
供給される上記フィルタ回路15wでの係数は、他のバン
ドの影響度が小さくなるような特性が得られる係数とさ
れている。各乗算器でこれらフィルタ係数を各遅延素子
の出力に乗算することにより、上記バークスペクトルSB
の畳込み処理が行われる。なお、例えば、この畳込み処
理により、第3図中点線で示す部分の総和(総和加算器
104での加算)がとられ、この出力が端子105から出力さ
れようになっている。
その後、上記各フィルタ回路15s,15wの出力はそれぞ
れ引算器16s,16wに送られる。該引算器16s,16wは、上記
サイン波成分Si又はホワイトノイズ成分WNのバンド毎に
畳込んだ領域での後述する許容ノイズレベルに対応する
レベルαをそれぞれ求めるものである。なお、上記許容
可能なノイズレベルに対応するレベルαとは、後述する
ように、逆コンボリューション処理を行うことによって
クリティカルバンドの各バンド毎の許容ノイズレベルと
なるようなレベルである。ここで、上記引算器16s,16w
には、上記レベルαを求めるための許容関数(マスキン
グレベルを表現する関数)が供給される。この許容関数
を増減させることで、上記レベルαの制御を行ってい
る。当該許容関数は、後述する関数発生回路29s,29wか
ら供給されている。
すなわち、許容ノイズレベルに対応するレベルαは、
クリティカルバンドのバンドの低減から順に与えられる
番号をiとすると、第(1)式で求めることができる。
α=S−(n−ai)…………(1) この第(1)式において、n,aは定数でa>0、Sは
畳込み処理後のバークスペクトルの強度であり、第
(1)式中(n−ai)が許容関数となる。本実施例にお
いては、例えばn=38,a=1、或いは、n=24,a=1と
される。
上述のようにして、上記レベルαが求められ、各デー
タは、それぞれ割算器17s,17wに伝送される。該割算器1
7s,17wでは、上記それぞれ畳込み処理された領域でのレ
ベルαを逆コンボリューションするためのものである。
したがって、これらの逆コンボリューション処理を行う
ことにより、上記レベルαからマスキングスペクトルが
得られるようになる。すなわち、これらマスキングスペ
クトルが、上記サイン波成分Siとホワイトノイズ成分WN
での許容ノイズレベルとなる。なお、上記逆コンボリュ
ーション処理は複雑な演算を必要とするが、本実施例装
置では、簡略化した割算器17s,17wを用いて逆コンボリ
ューションを行っている。なお、通常、マスキングスペ
クトルMSは、例えば第5図に示すようになる。すなわ
ち、後述するように、上記バークスペクトルSBは、該マ
スキングスペクトルMSの各レベルで示すレベル以下がマ
スキングされることになる。
次に、これら割算器17s,17wの出力は、制御手段41に
送られ合成される。この制御手段41では、先ず合成回路
32で合成がなされ、その後、合成回路18に送られる。上
記合成回路32で上記割算器17s,17wの出力を合成するこ
とよって、上記ノイズレベル設定手段40における他バン
ドへの影響度に、バンド毎のトーナリティが加味される
ことになる。すなわち、トーナリティの高いサイン波成
分Siに基づく許容ノイズレベルと、トーナリティの低い
ホワイトノイズ成分WNに基づく許容ノイズレベルとを合
成することで、各バンド毎のトーナリティに応じた他バ
ンドへの影響度が求められることになる。また、上記合
成回路18には、最小可聴カーブ発生回路22からの出力も
供給されるている。したがって、上記合成回路18での合
成の際には、最小可聴カーブ発生回路22から供給される
第6図に示すような人間の聴覚特性であるいわゆる最小
可聴カーブ(等ラウドネス曲線)RCを示すデータと、上
記合成回路32の出力すなわち各バンド毎の許容ノイズレ
ベルにトーナリティが加味された出力である上記サイン
波成分Siとホワイトノイズ成分WNのマスキングスペクト
ルMSの合成された出力とが合成されることになる。この
ように、上記最小可聴カーブRCとマスキングスペクトル
MSとを共に合成することで、許容ノイズレベルは例え
ば、第6図中斜線で示す部分までとすることができるよ
うになり、量子化の際に図中斜線で示す部分の割当てビ
ット数を減らすことができるようになる。なお、この第
6図は、前述の第2図に示したクリティカルバンドで表
されており、信号スペクトルSも同時に示している。
その後、上記合成回路18の出力は減算器19に伝送され
る。ここで、当該減算器19には、上記帯域分割回路13か
らの各バンド毎の信号成分(成分分離回路31に供給され
る前の信号成分)の振幅値Amの総和(振幅値Amのピーク
又は平均或いはエネルギ総和)をとる総和検出回路14の
出力が遅延回路21を介して供給されている。このため、
当該減算器19では、上記各バンドのエネルギ総和すなわ
ち各バンド毎の信号成分によるバークスペクトルSBと、
上記制御手段41によって上記トーナリティに応じて他の
バンドへの影響度が制御されたノイズレベル設定手段40
からの出力の許容ノイズレベル(マスキングスペクトル
MS)との差を取る演算がなされる。これにより、各バン
ド毎の信号成分のバークスペクトルSBのマスキングされ
るレベルが求められることになる。
当該減算器19の出力は、ROM20を介して量子化回路24
に供給されている。ここで、上記ROM20は量子化回路24
での量子化の際の割当てビット数情報を格納しており、
上記減算器19の出力に応じた割当てビット数情報を出力
するものである。したがって、上記量子化回路24では、
この減算器19の出力に応じて割当てられたビット数で、
遅延回路23を介して供給されている振幅値Amの量子化を
行っている。すなわち、換言すれば、当該量子化回路24
では、上記クリティカルバンドの各バンドのエネルギと
上記合成回路18の出力(トーナリティに応じた許容ノイ
ズレベル)との差のレベルに応じて割当てられたビット
数で上記各バンドの成分を量子化することになる。な
お、上記遅延回路21は上記合成回路18以前の各回路での
遅延量を考慮して設けられ、上記遅延回路23は上記ROM2
0以前の各回路での遅延量を考慮して上記振幅値Amを遅
延させるために設けられている。
次に、第7図に示す第2の実施例装置において、ノイ
ズレベル設定手段40及び制御手段41以外で第1図と同様
の構成には同じ指示符号を付して説明を省略する。この
第2の実施例では、制御回路41で各バンド毎のトーナリ
ティを示す指標を検出し、このトーナリティを示す指標
に応じて、ノイズレベル設定手段40の可変フィルタ15の
フィルタ特性を可変することによって、この第2の実施
例においても、各バンド毎のトーナリティに応じた許容
ノイズレベルを求めることができるようにしている。
すなわち、この第2の実施例装置において、帯域分割
回路13からの各バンド毎の信号成分は、各バンド毎の信
号成分のエネルギ総和を求める総和検出回路14に送られ
ると共に、各バンド毎の信号成分から直接トーナリティ
を示す指標を検出するトーナリティ指標検出回路51にも
送られる。該トーナリティ指標検出回路51では、上記ト
ーナリティの指標として例えば各バンド毎の信号成分の
標準偏差σや分散σ2等を用いることができる。すなわ
ち、例えば指標偏差σは、 の式により算出される。この(2)式中でxiは変数、N
は総数、は相加平均である。この標準偏差σにおい
て、標準偏差σが大きい時はトーナリティが低いことに
なり、また標準偏差σが小さい時にはトーナリティが高
いことになる。勿論この標準偏差σに限らず他のもので
あってもよい。この時、該トーナリティ指標検出回路51
には、端子50から標準値が供給されている。この標準値
は、上記標準偏差σの値と比較することによって、各バ
ンド毎の信号成分のトーナリティの割合を検出するため
に用いられるものである。すなわち、例えば、該標準値
と上記標準偏差σの値との比から各バンド毎のトーナリ
ティのパーセンテージを求めるようにする。このため、
例えばトーナリティのパーセンテージが高い時は、第1
の実施例でのサイン波成分のような単一周波数成分が多
いことになり、またトーナリティのパーセンテージが低
い場合はホワイトノイズ成分のような成分が多いことに
なる。
該トーナリティ指標検出回路51の出力はフィルタ係数
設定回路52に送られる。該フィルタ係数設定回路52は、
上記トーナリティの指標と標準値との比較結果に応じた
(トーナリティのパーセンテージに応じた)フィルタ係
数を出力するものであり、このフィルタ係数設定回路52
の出力が、上記可変フィルタ回路15に送られる。当該可
変フィルタ回路15も、前述の第4図と同様の構成を有す
るものであり、各乗算器での乗算係数が、上記フィルタ
係数設定回路52からの上記トーナリティのパーセンテー
ジに応じたフィルタ係数となっている。したがって、該
可変フィルタ回路15のフィルタ特性は、上記フィルタ係
数設定回路52からのフィルタ係数すなわちトーナリティ
の検出結果に応じて可変されるようになる。
この可変フィルタ15の出力が、第1図の引算器16s,16
w,関数発生回路29s,29w,割算器17s,17wと同様に動作す
る引算器16,関数発生回路29,割算器17を介し、合成回路
18に送られる。
更に、ROM20からは合成回路18と遅延回路21との出力
の減算結果に応じた量子化割当てビット数の情報が出力
され、量子化回路24に送られる。これにより、量子化回
路24では、減算器19の出力に応じて割当てられたビット
数で、遅延回路23を介して供給されている信号成分の量
子化が行われる。すなわち、換言すれば、該量子化回路
24では、上記クリティカルバンドの各バンドのエネルギ
と上記合成回路18の出力(トーナリティに応じた許容ノ
イズレベル)との差のレベルに応じて割当てられたビッ
ト数で上記各バンドの成分が量子化されることになる。
上述のようなことから、第1図に示した第1の実施例
及び第7図に示した第2の実施例のディジタル信号符号
化装置においては、クリティカルバンドの各バンドのエ
ネルギと、トーナリティに応じた許容ノイズレベルとの
差のレベルに応じて割当てられたビット数で上記各バン
ドの成分が量子化されることにより、音質劣化を少なく
してビットレートを低減することができるようになる。
なお、第1,第2の実施例では、時間軸上の入力信号を
高速フーリエ変換した出力の帯域分割を行っているが、
この高速フーリエ変換を行わずに時間軸の信号を直接帯
域分割するようにしてもよい。
また、上述した本発明実施例においては、周波数軸上
の信号におけるマスキング効果のみについて述べている
が、本発明は、この周波数軸でのマスキング効果と共
に、例えば時間軸上のいわゆるテンポラルマスキング効
果をも考慮したものとすることもできる。このテンポラ
ルマスキング効果を上記周波数軸でのマスキングと共に
用いることで、あるバンドの信号による他の時間の他の
バンドへのトーナリティによる影響度を考慮した許容ノ
イズレベルを設定することができるようになり、より高
いビット圧縮が可能になる。
ここで、上記テンポラルマスキング効果とは、大きな
音の時間的な前後の小さな音が、該大きな音にマスクさ
れて聞こえなくなるような効果である。当該テンポラル
マスキング効果において、上記大きな音の時間的に後方
のマスキングはフォワードマスキングと呼ばれ、また、
時間的に前方のマスキングはバックワードマスキングと
呼ばれている。また、当該テンポラルマスキングにおい
ては、人間の聴覚特性から、フォワードマスキングの効
果は長時間(例えば100msec程度)効くようになってい
るのに対し、バックワードマスキングの効果は短時間
(例えば5msec程度)となっている。更に、上記マスキ
ング効果のレベル(マスキング量)は、フォワードマス
キングが20dB程度で、バックワードマスキングが30dB程
度となっている。
〔発明の効果〕
本発明のディジタル信号符号化装置においては、入力
音声信号を複数帯域に分割した各バンド毎のエネルギと
トーナリティとに基づいて他のバンドへの影響を求めて
各バンド毎の許容ノイズレベルを設定し、この許容ノイ
ズレベルと各バンドのエネルギとの差に応じたビット数
で各バンド成分の量子化を行うことにより、また、各バ
ンド毎のエネルギをフィルタ処理して他のバンドへの影
響度を計算すること、或いは、各バンドの信号成分を単
一周波数成分とホワイトノイズ成分とに分離してそれぞ
れ異なるフィルタ特性でフィルタ処理して合成を行うこ
と、更に、各バンド毎のトーナリティを示す指標に応じ
てフィルタ特性を可変することにより、低ビットレート
に圧縮しても音質劣化の少ない符号化が可能となる。
【図面の簡単な説明】
第1図は本発明の第1の実施例のディジタル信号符号化
装置の概略構成を示すブロック回路図、第2図はクリテ
ィカルバンドを示す図、第3図はバークスペクトルを示
す図、第4図はフィルタ回路を示す回路図、第5図はマ
スキングスペクトルを示す図、第6図は最小可聴カー
ブ,マスキングスペクトルを合成した図、第7図は第2
の実施例のディジタル信号符号化装置の概略構成を示す
ブロック回路図、第8図は人間の聴覚による周波数軸上
の信号におけるマスキングを説明するための図である。 13……帯域分割回路 14s,14w,14……総和検出回路 15s,15w,15……フィルタ回路 16s,16w,16……引算器 17s,17w,17……割算器 18,32……合成回路 19……減算器 20……ROM 21,23……遅延回路 22……最小可聴カーブ発生回路 24……量子化回路 40……ノイズレベル設定手段 41……制御手段 51……トーナリティ指標検出回路 52……フィルタ係数設定回路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−201700(JP,A) 特開 平3−35298(JP,A) 特開 平3−35299(JP,A) 特開 平3−132700(JP,A) 特開 平3−263925(JP,A) 特開 平3−263926(JP,A) 特表 平2−501507(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】入力ディジタル信号を複数の周波数帯域に
    分割する帯域分割手段と、 上記帯域分割手段により分割された各バンド毎のエネル
    ギに基づいて他のバンドへの影響度を計算して各バンド
    毎の許容ノイズレベルを設定するノイズレベル設定手段
    と、 上記各バンド毎のトーナリティに応じて上記ノイズレベ
    ル設定手段での他のバンドへの影響度を制御する制御手
    段と、 上記各バンドのエネルギと上記トーナリティに応じて制
    御された許容ノイズレベルとの差に応じたビット数で各
    バンドの信号成分を量子化する量子化手段とを有してな
    ることを特徴とするディジタル信号符号化装置。
  2. 【請求項2】上記ノイズレベル設定手段は、上記各バン
    ド毎のエネルギが入力されて上記他のバンドへの影響度
    を計算するフィルタ手段を有することを特徴とする請求
    項(1)記載のディジタル信号符号化装置。
  3. 【請求項3】上記ノイズレベル設定手段は、各バンド毎
    の信号成分が単一周波数成分とホワイトノイズ成分とに
    分離された各成分がそれぞれ入力される各々特性の異な
    る2つのフィルタ手段を有し、上記制御手段は、上記ノ
    イズレベル設定手段の上記各フィルタからの出力を合成
    することを特徴とする請求項(2)記載のディジタル信
    号符号化装置。
  4. 【請求項4】上記制御手段は、各バンド毎にトーナリテ
    ィを示す指標を検出し、該トーナリティを示す指標に応
    じて上記ノイズレベル設定手段のフィルタ手段の特性を
    可変することを特徴とする請求項(2)記載のディジタ
    ル信号符号化装置。
JP2221367A 1990-08-24 1990-08-24 ディジタル信号符号化装置 Expired - Lifetime JP3033157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2221367A JP3033157B2 (ja) 1990-08-24 1990-08-24 ディジタル信号符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2221367A JP3033157B2 (ja) 1990-08-24 1990-08-24 ディジタル信号符号化装置

Publications (2)

Publication Number Publication Date
JPH04104618A JPH04104618A (ja) 1992-04-07
JP3033157B2 true JP3033157B2 (ja) 2000-04-17

Family

ID=16765687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2221367A Expired - Lifetime JP3033157B2 (ja) 1990-08-24 1990-08-24 ディジタル信号符号化装置

Country Status (1)

Country Link
JP (1) JP3033157B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3089691B2 (ja) 1991-03-29 2000-09-18 ソニー株式会社 ディジタルデータの高能率符号化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3089691B2 (ja) 1991-03-29 2000-09-18 ソニー株式会社 ディジタルデータの高能率符号化方法

Also Published As

Publication number Publication date
JPH04104618A (ja) 1992-04-07

Similar Documents

Publication Publication Date Title
JP3033156B2 (ja) ディジタル信号符号化装置
JP2751564B2 (ja) ディジタル信号符号化装置
JP3134338B2 (ja) ディジタル音声信号符号化方法
JP3134337B2 (ja) ディジタル信号符号化方法
US5157760A (en) Digital signal encoding with quantizing based on masking from multiple frequency bands
US5632003A (en) Computationally efficient adaptive bit allocation for coding method and apparatus
JP2913731B2 (ja) ディジタルデータの高能率符号化方法
KR100194738B1 (ko) 고능률 부호화방법 및 장치
EP0575110B1 (en) Compressing and expanding digital signals
WO1992017942A1 (fr) Procede de codage de signaux numeriques
JPH03117919A (ja) ディジタル信号符号化装置
JP3041967B2 (ja) ディジタル信号符号化装置
JP3033157B2 (ja) ディジタル信号符号化装置
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JP3010663B2 (ja) ノイズシェーピング回路
JP2913695B2 (ja) ディジタル信号符号化方法
JP3070123B2 (ja) ディジタル信号符号化装置及び方法
JP2913696B2 (ja) ディジタル信号符号化方法
JP2797524B2 (ja) デイジタル信号符号化方法
JP3060577B2 (ja) ディジタル信号符号化方法
JP2913700B2 (ja) ディジタルデータの高能率符号化方法
EP0720146A1 (en) A method for measuring speech masking properties
JP3060578B2 (ja) ディジタル信号符号化方法
JP3089691B2 (ja) ディジタルデータの高能率符号化方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080218

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 11