JP2998196B2 - オーディオ信号の量子化誤差低減装置 - Google Patents

オーディオ信号の量子化誤差低減装置

Info

Publication number
JP2998196B2
JP2998196B2 JP31261790A JP31261790A JP2998196B2 JP 2998196 B2 JP2998196 B2 JP 2998196B2 JP 31261790 A JP31261790 A JP 31261790A JP 31261790 A JP31261790 A JP 31261790A JP 2998196 B2 JP2998196 B2 JP 2998196B2
Authority
JP
Japan
Prior art keywords
circuit
block
band
masking
noise level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31261790A
Other languages
English (en)
Other versions
JPH04185017A (ja
Inventor
健三 赤桐
誠 阿久根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP31261790A priority Critical patent/JP2998196B2/ja
Publication of JPH04185017A publication Critical patent/JPH04185017A/ja
Application granted granted Critical
Publication of JP2998196B2 publication Critical patent/JP2998196B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、オーディオ信号の量子化で発生する量子化
誤差を低減するオーディオ信号の量子化誤差低減装置に
関するものである。
〔発明の概要〕
本発明は、量子化誤差をノイズフィルタを介して量子
化器の入力側に帰還するようにしたオーディオ信号の量
子化誤差低減装置において、所定期間毎のブロックの入
力オーディオ信号を周波数分析し、各周波数成分のエネ
ルギに基づいた第1の許容ノイズレベルと、ブロックに
時間的に先後行するデータの少なくとも一方のエネルギ
に基づいた第2の許容ノイズレベルとの少なくとも一方
に基づいて、ノイズフィルタのフィルタ特性を設定する
ようにしたことにより、聴感上のノイズを低減すること
ができるオーディオ信号の量子化誤差低減装置を提供す
るものである。
〔従来の技術〕
現在、ディジタルのオーディオ信号を扱うディジタル
オーディオ機器には、例えばいわゆるコンパクトディス
ク(CD)の再生機、或いはいわゆるディジタル・オーデ
ィオ・テープレコーダ(DAT)等が存在する。これらデ
ィジタルオーディオ機器では各種統一規格が規定されて
おり、例えば、これら機器で扱われるディジタルオーデ
ィオ信号のビット長は、上記統一規格から16ビット長に
規定されている。また、これらディジタルオーディオ機
器におけるディジタルオーディオ信号としては、アナロ
グオーディオ信号(音声波形信号)を例えばいわゆるPC
M(パルス符号化)のような単純な量子化を用いて符号
化して得られたディジタルオーディオ信号を用いてい
る。
〔発明が解決しようとする課題〕
ところで、近年、上述のようなディジタルオーディオ
機器においては、上記統一規格から現実に得られる再生
音よりも、聴感上より品質の高い再生音が得られるよう
になることが望まれている。このような聴感上より良い
再生音を得るためには、例えば、これらディジタルオー
ディオ機器で扱われるディジタルオーディオ信号に含ま
れているノイズ成分を、低減しておくことが有効である
と考えられる。このように、ノイズ成分が低減されたデ
ィジタルオーディオ信号から得られる再生音は、ノイズ
の少ない聴感上より良いものとなる。このディジタルオ
ーディオ信号のノイズ成分低減処理としては、例えば、
オーディオ信号の量子化の際に行われるいわゆるエラー
フィードバックによる量子化誤差低減処理がある。すな
わち、このエラーフィードバックによる量子化誤差低減
処理には、例えば、オーディオ信号の量子化の際に、量
子化器によって発生する量子化誤差(量子化ノイズ,量
子化歪み)を、ノイズフィルタを介して該量子化器の入
力側に帰還(フィードバック)するようなエラーフィー
ドバックによって、量子化誤差を低減するいわゆるノイ
ズシェーピング処理が知られている。
ここで、上述したPCM符号化のような量子化での量子
化ノイズはオーディオ信号の全周波数帯域にフラットな
周波数特性を有するものとなっており、上記ノイズシェ
ーピング処理ではこの全帯域の量子化ノイズから単にオ
ーディオ帯域(可聴帯域)のノイズのみを減らすように
している。しかし、人間の耳は、例えばいわゆる等ラウ
ドネスカーブ或いはマスキング効果等により聞こえる感
度に差があるにもかかわらず、上述した従来のノイズシ
ェーピング処理では、この人間の耳の特性(聴覚特性)
の考慮がなされていない。このため、上述した従来のエ
ラーフィードバックによる量子化誤差低減処理が、人間
の聴感上必ずしも有効であるとは言い難い。
そこで、本発明は、上述のような実情に鑑みて提案さ
れたものであり、人間の耳の特性を考慮して聴感上効果
的に量子化誤差(量子化ノイズ)を低減することができ
るオーディオ信号の量子化誤差低減装置を低減すること
を目的とするものである。
〔課題を解決するための手段〕
本発明のオーディオ信号の量子化誤差低減装置は、上
述の目的を達成するために提案されたものであり、量子
化器で発生した量子化誤差をノイズフィルタを介して上
記量子化器の入力側に帰還するようにしたオーディオ信
号の量子化誤差低減装置において、入力オーディオ信号
を所定期間毎にブロック化するブロック化手段と、上記
ブロック化手段からの各ブロック毎に周波数分析を行う
周波数分析手段と、上記周波数分析手段の出力のうち、
上記ブロック内の各周波数成分のエネルギに基づいて第
1の許容ノイズレベルを設定する第1のノイズレベル設
定手段と、上記周波数分析手段の出力のうち、上記ブロ
ックに時間的に先行するデータ及び時間的に後行するデ
ータの少なくとも一方のエネルギに基づいて、当該ブロ
ックの各周波数成分の第2の許容ノイズレベルを設定す
る第2のノイズレベル設定手段とを有し、上記ノイズフ
ィルタのフィルタ特性を、上記第1及び第2のノイズレ
ベル設定手段の少なくとも一方の出力に基づいて設定す
るようにしたものである。
〔作用〕
本発明によれば、各周波数成分のエネルギに基づいた
第1の許容ノイズレベルが人間の聴覚特性におけるいわ
ゆる同時刻マスキング効果の量と対応し、ブロックに時
間的に先行及び後行するデータに基づいた第2の許容ノ
イズレベルがいわゆるテンポラルマスキング効果の量と
対応しており、これら両者に基づいてノイズフィルタの
フィルタ特性を決定しているため聴感上効果的に量子化
誤差(量子化ノイズ)を低減できる。
〔実施例〕
以下、本発明を適用した実施例について図面を参照し
ながら説明する。
第1図に、本実施例のオーディオ信号の量子化誤差低
減装置の概略構成のブロック図を示す。
この第1図の本実施例装置は、量子化器11で発生した
量子化誤差をノイズフィルタ13を介して上記量子化器11
の入力側に帰還するようにしたものであって、入力オー
ディオ信号を所定期間(例えば1ms〜10ms)毎にブロッ
ク化するブロック化回路15と、上記ブロック化回路15か
らの各ブロック毎に周波数分析を行う周波数分析回路16
と、上記周波数分析回路16の出力のうち、上記ブロック
内の各周波数成分のエネルギに基づいて第1の許容ノイ
ズレベルを設定する第1のノイズレベル設定回路17と、
上記周波数分析回路16の出力のうち、上記ブロックに時
間的に先行するデータ及び時間的に後行するデータの少
なくとも一方のエネルギに基づいて、当該ブロックの各
周波数成分の第2の許容ノイズレベルを設定する第2の
ノイズレベル設定回路18とを有し、上記ノイズフィルタ
13のフィルタ特性を、上記第1及び第2のノイズレベル
設定回路17,18の少なくとも一方の出力或いはそれらの
合成出力に基づいて設定するようにしたものである。
すなわち、本実施例装置は、上記量子化器11の出力か
ら量子化器11への入力を減算することで当該量子化器11
での量子化の際に発生する量子化誤差を得る加算器12
と、該加算器12の出力をフィルタリング処理して出力す
る上記ノイズフィルタ13と、該ノイズフィルタ13の出力
を上記量子化器11の入力側に加算する加算器10とでいわ
ゆるエラーフィードバック回路を構成している。ここ
で、上記ノイズフィルタ13のフィルタ特性は、具体的に
は上記第1及び第2のノイズレベル設定回路17,18から
の後述する許容ノイズレベル(或いは許容ノイズスペク
トル)の情報に基づいてフィルタ係数算出回路14で算出
されたフィルタ係数によって決定されている。したがっ
て、このエラーフィードバック回路では、上記許容ノイ
ズスペクトルに基づいて量子化誤差低減処理(いわゆる
ノイズシェーピング処理)が行われる。このノイズシェ
ーピング処理が行われた後の信号は、出力端子2から出
力される。
ところで、上記エラーフィードバック回路によってオ
ーディオ信号の量子化誤差低減処理(ノイズシェーピン
グ処理)を行う際には、該入力信号スペクトルのいわゆ
るマスキングを考慮した処理を行うことで、聴感上のダ
イナミックレンジを上げることができる。このマスキン
グを考慮したノイズシェーピングとしては、例えば、信
号スペクトルのパターンがある程度固定化した入力オー
ディオ信号のスペクトルに応じたノイズシェーピング、
すなわち、入力オーディオ信号スペクトルの後述するい
わゆるマスキングを考慮して得られた許容ノイズスペク
トルを用いたノイズシェーピングを挙げることができ
る。或いは、入力オーディオ信号のスペクトルが変化す
る場合の、当該スペクトルのマスキングを考慮して得ら
れたスペクトル変化に適応的な許容ノイズスペクトルを
用いたノイズシェーピング等がある。なお、上記マスキ
ングとは、人間の聴覚上の特性により、ある信号によっ
て他の信号がマスクされて聞こえなくなる現象を言うも
ので、このマスキング効果には、同時刻マスキング効果
とテンポラルマスキング効果とがある。このマスキング
効果により、マスキングされる部分にノイズがあったと
しても、このノイズは聞こえなくなる。上記同時刻マス
キング効果とはある大きな音と同時刻に発生する小さな
音(或いはノイズ)が該大きな音によってマスクされて
聞こえなくなるような効果である。また、ある周波数帯
域の信号成分によって他の帯域の信号成分がマスクされ
て、該他の帯域の信号成分の音が聞こえなくなるような
効果(周波数軸上のマスキング効果)も含まれる。上記
テンポラリマスキング効果とは、大きな音の時間的に前
後の小さな音(ノイズ)が、この大きな音にマスクされ
て聞こえなくなるような効果であり、当該大きな音の時
間的に後方のマスキングはフォワードマスキングと呼ば
れ、時間的に前方のマスキングはバックワードマスキン
グと呼ばれている。更に、このテンポラルマスキングに
おいては、人間の聴覚特性から、フォワードマスキング
の効果は長時間(例えば10msec程度)効くようになって
いるのに対し、バックワードマスキングの効果は短時間
(例えば5msec程度)となっている。更に上記マスキン
グ効果のレベル(マスキング量)は、フォワードマスキ
ングが20dB程度で、バックワードマスキングが30dB程度
となっている。
また、人間の聴覚特性を利用して入力信号を例えばい
わゆる臨界帯域(クリティカルバンド)で帯域分割し、
この各帯域毎に、上述したようなマスキングを考慮した
許容ノイズスペクトルを用いてノイズシェーピングを行
えば、より聴感上効果的なノイズシェーピングが行え
る。これにより、再生音の聴感上のダイナミックレンジ
を上げることが可能となる。
このようなことから、上記周波数分析回路16では、上
記ブロック化回路15からの各ブロック毎の入力オーディ
オ信号を、人間の聴覚特性を利用して、いわゆる臨界帯
域幅(クリティカルバンド)に分割し、この臨界帯域毎
に周波数分析を行っている。この時の上記臨界帯域幅で
の分割及び分析としては、先ず、例えば、入力オーディ
オ信号を例えば高速フーリエ変換(FFT)で周波数軸上
の成分(FFT係数)に変換した後、該FFT係数の振幅項Am
(以下、m=0〜1024)を、人間の聴覚特性を考慮した
高域程帯域幅が広くなる臨界帯域幅で、例えば上記25バ
ンドのグループGn(以下、nは各バンドの番号を示し、
n=0〜24)にグループ分け(バンド分け)する。次
に、これら各臨界帯域毎の信号からは、例えば、第
(1)式により各帯域毎のそれぞれの振幅項Amの総和
(振幅項Amのピーク又は平均或いはエネルギ総和)を取
ることで得られるいわゆるバークスペクトル(総和のス
ペクトル)SBを求める。
SB=10log10Cn(Pn)[dB] (1) ただし、n=0〜24であり、Cnは第n番目のバンド内
の要素数すなわち振幅項(ポイント数)、Pnは各帯域の
ピーク値である。上記各帯域のバーススペクトルSBは、
例えば、第2図に示すようになる。ただし、この第2図
の例では、図示を簡略化するため、上記臨界帯域におけ
る全帯域数を、例えば12バンド(B1〜B12)で表現して
いる。当該周波数分析回路16では、上述したような臨界
帯域幅での分割と各帯域毎の周波数分析が行われ、その
出力情報を、上記第1,第2のノイズレベル設定回路17,1
8に送るようにしている。
これら第1,第2のノイズレベル設定回路17,18では、
後述するようにして、上記同時刻マスキング(周波数軸
上のマスキングも含む),テンポラルマスキングを考慮
した許容ノイズレベルの設定を行っている。
これら第1,第2のノイズレベル設定回路17,18からの
許容ノイズレベル(許容ノイズスペクトル)の情報が、
上記フィルタ係数算出回路14に送られ、該フィルタ係数
算出回路14から許容ノイズスペクトルに応じたフィルタ
係数が出力されて、上記ノイズフィルタ13に送られる。
ここで、上記ブロック化回路15、周波数分析回路16、
第1及び第2のノイズレベル設定回路17,18、フィルタ
係数算出回路14は、具体的には例えば以下に示す第3
図,第6図に示すような具体例回路で実現することがで
きる。
第3図に示す具体例回路において、高速フーリエ変換
(FFT)回路111,振幅位相情報発生回路112,帯域分割回
路113,総和検出回路114は、第1図のブロック化回路15
及び周波数分析回路16として動作している。フィルタ回
路76から合成回路80までの各構成要素は、第1図の第1
のノイズレベル設定回路17として動作している。ブロッ
ク遅延回路115,116及び係数乗算器117,118,合成回路119
は、第1図の第2のノイズレベル設定回路18として動作
している。合成回路120,減算器121,ROM122は、上記第1
図のフィルタ係数算出回路14として動作している。この
ROM122の出力が出力端子4を介して第1図のノイズフィ
ルタ13に送られる。
すなわち、本具体例回路では、任意の注目バンド(任
意の臨界帯域)の信号に対して、第1図の第1のノイズ
レベル設定回路17としての各回路によって同時刻マスキ
ング(周波数軸上のマスキング)を考慮した第1の許容
ノイズレベルを設定すると共に、第1図の第2のノイズ
レベル設定回路18としての各回路によって注目バンドの
時間的に先行後行する信号でのテンポラルマスキングを
考慮した第2の許容ノイズレベルを設定するようにして
いる。
すなわち、この第3図の本具体例回路において、入力
端子1には、オーディオ信号が供給されており、この時
間軸上のオーディオ信号が高速フーリエ変換(FFT)回
路111に伝送される。当該高速フーリエ変換回路111で
は、上記時間軸上のオーディオ信号が所定期間(すなわ
ち第1図におけるブロック化回路15でのブロック)毎に
周波数軸上の信号に変換されて、実数成分値Reと虚数成
分値ImとからなるFFT係数が得られる。これらFFT係数は
振幅位相情報発生回路112に伝送され、当該振幅位相情
報発生回路112では上記実数成分値Reと虚数成分値Imと
から振幅値Amと位相値とが得られて、当該振幅値Amの情
報が上記帯域分割回路113へ送られている。すなわち、
一般に人間の聴覚は周波数領域の振幅(パワー)には敏
感であるが、位相についてはかなり鈍感であるため、上
記振幅位相情報発生回路112の出力から上記振幅値Amの
みを取り出し、これを用いるようにしている。
上記帯域分割回路113では、上記振幅値Amのオーディ
オ信号を上記臨界帯域(クリティカルバンド)に分割し
ている。この帯域分割回路113で臨界帯域に分割された
各バンド毎の上記振幅値Amは、それぞれ上記総和検出回
路114に伝送される。当該総和検出回路114では、上記各
バンド毎のエネルギ(各バンドでのスペクトル強度)
が、各バンド内のそれぞれの振幅値Amの総和(振幅値Am
のピーク又は平均或いはエネルギ総和)をとることによ
り求められる。該総和検出回路114の出力が、第2図に
示した上記バークスペクトルSBである。
ここで、上記バークスペクトルSBの周波数軸上のマス
キングに於ける影響を考慮するため、上記バークスペク
トルSBに所定の重みづけの関数を畳込む(コンボリュー
ション)。このため、上記総和検出回路114の出力すな
わち上記バークスペクトルSBの各値は、上記総和検出回
路114の出力をブロック単位で遅延するブロック遅延回
路115を介してフィルタ回路76に送られる。該フィルタ
回路76は、例えば、入力データを順次遅延させる複数の
遅延(z-1)素子と、各遅延素子からの出力にそれぞれ
フィルタ係数(重みづけの関数)を乗算する複数の乗算
器と、これら乗算器の出力の総和をとる総和加算器とか
ら構成されるものである。該フィルタ回路76により、上
記バークスペクトルSBの畳込み処理が行われる。該畳込
み処理により、第2図中点線で示す部分の総和がとられ
る。
ところで、上記バークスペクトルSBの周波数軸上のマ
スキングスペクトル(すなわち許容可能なノイズスペク
トル)を算出する場合のレベルαにおいては、このレベ
ルαが小さいと周波数軸上の信号に対するマスキングス
ペクトル(マスキングカーブ)が下降することになり、
逆に、上記レベルαが大きいとマスキングスペクトルが
上昇することになる。なお、該レベルαとは、後述する
ように逆コンボリューション処理を行うことによってク
リティカルバンドの各バンド毎の上記マスキングスペク
トルとなるようなレベルである。また、一般にオーディ
オ信号等では、高域部分のスペクトル強度(エネルギ)
が小さい。したがって本具体例においては、これらのこ
とを考慮して、エネルギの小さい高域にいく程、上記レ
ベルαを大きくしている。このようなことから、本具体
例回路における上記第1のノイズレベル設定回路17に対
する回路では、高い周波数程同一のエネルギに対する上
記レベルαを高く設定している。
すなわち、本具体例回路では、上記マスキングスペク
トルに対応するレベルαを算出し、該レベルαが高域程
高くなるように制御している。このため、上記フィルタ
回路76の出力は引算器78に送られる。該引算器78は、上
記畳込んだ領域でのレベルαを求めるものである。ここ
で、上記引算器78には、上記レベルαを求めるための許
容関数(マスキングレベルを表現する関数)が供給され
る。該許容関数を増減させることで上記レベルαの制御
を行っている。該許容関数は、関数発生回路77から供給
されている。
上記マスキングスペクトルに対応するレベルαは、ク
リティカルバンドのバンドの低域から順に与えられる番
号をiとすると、第(2)式で求めることができる。
α=S−(n−ai) ……(2) この第(2)式において、n,aは定数でa>0、Sは
畳込み処理後のバークスペクトルの強度であり、第
(2)式中(n−ai)が許容関数となる。本具体例では
n=38,a=1としている。
このようにして、上記レベルαが求められ、このデー
タは、割算器79に伝送される。当該割算器79では、上記
畳込み処理された領域でのレベルαを逆コンボリューシ
ョンするためのものである。したがって、この逆コンボ
リューション処理を行うことにより、上記レベルαか
ら、マスキングスペクトルが得られるようになる。すな
わち、このマスキングスペクトルが各バンド毎に求めら
れた第1の許容ノイズレベル(許容ノイズスペクトル)
となる。なお、上記逆コンボリューション処理は、複雑
な演算を必要とするが、本具体例では簡略化した割算器
79を用いて逆コンボリューションを行っている。
次に、上記マスキングスペクトルは、合成回路80及び
合成回路120を介して減算器121に供給される。ここで、
当該減算器121には、上記総和検出回路114の出力すなわ
ち前述の総和検出回路114からのバークスペクトルSB
が、遅延回路127を介して供給されている。したがっ
て、この減算器121で上記マスキングスペクトルとバー
クスペクトルSBとの減算演算が行われることで、第4図
に示すように、上記バークスペクトルSBは、該マスキン
グスペクトルMSの各レベルで示すレベル以下がマスキン
グされることになる。
該減算器121の出力は、ROM122に送られる。上記ROM12
2には、複数のフィルタ係数が格納されており、上記減
算器121の出力に応じたフィルタ係数を出力するもので
ある。このROM122の出力が、出力端子4を介して第1図
のノイズフィルタ13に送られる。なお、上記遅延回路12
7は上記合成回路120以前の各回路での遅延量を考慮して
上記総和検出回路114からのバークスペクトルSBを遅延
させるために設けられている。
また、上記合成回路80での合成の際には、最小可聴カ
ーブ発生回路129から供給される第5図に示すような人
間の聴覚特性であるいわゆる最小可聴カーブ(等ラウド
ネス曲線)RCを示すデータと、上記マスキングスペクト
ルMSとを合成することができる。この場合、該最小可聴
カーブRCとマスキングスペクトルMSとを共に合成するこ
とで、第1の許容ノイズレベルはこの図中斜線で示す部
分までとすることができる。なおこの第5図は、前述の
第2図に示したクリティカルバンドで表されており、信
号スペクトルSSも同時に示している。
上述したように、本具体例の上記第1のノイズレベル
設定回路17に対応する各回路においては、各バンド毎の
信号の周波数軸上のマスキングを考慮した第1の許容ノ
イズレベルを求めることができる。従って、該第1の許
容ノイズレベルに基づいたフィルタ係数を設定すること
ができる。
また、本具体例回路においては、上述した同時刻マス
キング(周波数軸上のマスキング)を考慮したフィルタ
係数決定と共に、注目バンド(臨界帯域)の時間的に先
行後行する信号のエネルギに基づいて、当該注目バンド
の上記第2の許容ノイズレベルを設定することで、時間
軸上のテンポラルマスキングを考慮したフィルタ係数の
決定も同時に行うようにしている。すなわち、本具体例
の上記第2のノイズレベル設定回路18に対応する各回路
では、上述したように、第1の許容ノイズレベルが設定
されている任意のバンド(注目バンド)の現時点の信号
に対して、その注目バンドの現時点の信号に時間軸上で
先行後行する前後の信号によるテンポラルマスキングを
考慮して、当該現時点の注目バンドの許容ノイズレベル
(第2の許容ノイズレベル)を設定するようにしてい
る。このため、上記合成回路120には、合成回路80の出
力と共に、上記第2のノイズレベル設定回路18に対応す
る回路の1つである合成回路119の出力も供給されるよ
うになっている。
すなわち、当該合成回路119には、上記第2の許容ノ
イズレベルの信号として上記注目バンドの現時点の信号
に対して時間的に前後の信号のエネルギに基づくテンポ
ラルマスキングのレベルがそれぞれ算出されて供給され
ており、これら時間的に前後の信号による許容ノイズレ
ベルが該合成回路119で合成されて出力されるようにな
っている。
このような第2の許容ノイズレベルを得るために、本
具体例回路では、上記総和検出回路114の出力をブロッ
ク単位で(遅延するブロックは複数であってもよい)遅
延するブロック遅延回路115及び116と、係数乗算器117,
118,上記合成回路119とを設けている。すなわち、上記
ブロック遅延回路115の出力が得られる時点を上記現時
点T0とすると、当該ブロック遅延回路115に上記総和検
出回路114の出力が供給される時点が当該現時点T0の時
間的に後(現時点T0に対しては未来の時間となる)の後
時点T+1となり、上記ブロック遅延回路116から出力され
る時点が上記現時点T0の時間的に前(現時点T0に対して
は過去の時間となる)の前時点T-1となる。
上記後時点T+1の信号すなわち総和検出回路114の出力
は、係数乗算器118に供給される。該係数乗算器118で
は、該係数乗算器118に信号が供給された該後時点T+1
の上記注目バンドの信号による上記現時点T0の注目バン
ドの信号に対するテンポラルマスキング(バックワード
マスキング)を考慮して決定された乗算係数が、上記後
時点T+1の信号に乗算される。すなわち、この乗算係数
は、合成回路119及び120での影響を考慮して設定される
係数であり、例えば上記後時点T+1の信号を正規化して
1とした場合、該後時点T+1の信号によるバックワーク
マスキングが上記現時点T0の信号に対して作用するレベ
ルに対応した乗算係数kBが、該後時点T+1の信号に乗算
される。また、上記前時点T-1の信号すなわちブロック
遅延回路116の出力は、係数乗算器117に供給される。該
係数乗算器117では、該係数乗算器117に信号が供給され
た該前時点T-1での上記注目バンドの信号による上記現
時点T0の注目バンドの信号に対するテンポラルマスキン
グ(フォワードマスキング)を考慮して決定された乗算
係数が、上記前時点T-1の信号に乗算される。すなわち
該乗算係数は、上述同様に合成回路119,120での影響を
考慮して設定され、例えば前時点T-1の信号を正規化し
た場合、該前時点T-1の信号によるフォワードマスキン
グが上記現時点T0の信号に対して作用するレベルに対応
した乗算係数kFが、当該前時点T-1の信号に乗算され
る。これら各係数乗算器117,118の出力が合成回路119で
合成されて得られた出力が、上記第2の許容ノイズレベ
ルとなる。なお、上記合成回路119での合成は、例えば
各係数乗算器117,118の出力を加算するような処理が行
われる。このようにして得られた上記合成回路119の出
力が上記合成回路120に送られる。
当該合成回路120では、例えば、上記合成回路119の出
力と合成回路80の出力のうち少なくとも一方すなわち例
えば大きい方を選ぶような合成処理、或いは、各合成回
路119,80の出力をそれぞれ所定の重み付けを行って加算
するような合成処理が行われる。また、この加算による
合成処理の時は、例えば、全帯域のエネルギを考慮した
上記第2の許容ノイズレベルを求めて加算するようにし
てもよい。
なお、本具体例においては、上述した最小可聴カーブ
の合成処理を行わない構成とすることもできる。この場
合は、第3図の構成で最小可聴カーブ発生回路129と合
成回路80が不要となり、このため上記引算器78からの出
力は、割算器79で逆コンボリューションされた後、すぐ
に上記合成回路120に伝送されることになる。
上述したように、本具体例回路においては、注目バン
ドの信号に対して、前記第1図の第1のノイズレベル設
定回路17に対応する各回路によって周波数軸上のマスキ
ングを考慮した第1の許容ノイズレベルを設定すると共
に、第1図の第2のノイズレベル設定回路18に対応する
各回路によって注目バンドの時間的に先行後行する信号
でのテンポラルマスキングを考慮した第2の許容ノイズ
レベルを設定するようにしている。これら第1,第2の許
容ノイズレベルに基づいて減算器121での減算処理が行
われ、更に該減算器121の出力にもどづいてROM122から
フィルタ係数が出力されるため、人間の聴覚上良好なノ
イズシェーピングが可能となる。
第6図に示す他の具体例回路は、入力端子1に供給さ
れた入力オーディオ信号を非ブロック周波数分析するフ
ィルタバンク90と、当該フィルタバンク90によって分析
された各周波数成分を上記ブロック(所定期間)として
例えば10ms,5ms,2.5msのブロックでそれぞれ更に周波数
分析するFFT(高速フーリエ変換)回路20,40,60とを有
し、更に、上記第1の許容ノイズレベルを設定するマス
キングスペクトル算出回路75と、上記第2の許容ノイズ
レベルを設定する期間遅延回路23,43,63、合成回路50,7
0、5ms遅延(DL)回路51,2.5ms遅延回路71,72,73,選択
回路52、合成選択回路74、重付合成回路24,44,64とを有
してなるものである。また、上記フィルタバンク90は、
上記入力オーディオ信号を複数の周波数帯域に分割(本
具体例では3分割)する帯域分割手段として少なくとも
1つのフィルタ(例えばいわゆるQMF等のミラーフィル
タ)を有し、高域ほど帯域幅が大となるような分割を行
うものである。更に、上記FFT回路20,40,60は、高域ほ
ど上記高速フーリエ変換処理がなされるブロック時間長
を小となす処理を行う。本具体例回路の出力は出力端子
4を介して、第1図のノイズフィルタ13に送られる。
すなわち、この第6図において、入力端子1には、例
えばサンプリング周波数fs=44.1kHzでサンプリングさ
れて得られたDC−22kHzの入力オーディオ信号が供給さ
れており、該入力オーディオ信号が、上記フィルタバン
ク90に供給されている。該フィルタバンク90は、例えば
第7図に示すように、QMF91,92が2段縦続接続されて構
成され、上記入力端子1に供給されたDC〜22kHzの入力
オーディオ信号が、QMF91に供給される。該QMF91は、入
力オーディオ信号を11kHzで2分割するものであり、し
たがって該QMF91からはDC〜11kHz,11kHz〜22kHzの帯域
の出力信号が得られることになる。上記11kHz〜22kHzの
帯域の出力信号は端子93を介して上記FFT回路60に送ら
れる。上記DC〜11kHzの出力信号は、QMF92に送られる。
該QMF92は、5.5kHzで入力信号を2分割するものであ
り、したがって該QMF92からは、DC〜5.5kHz,5.5kHz〜11
kHzの帯域の出力信号が得られることになる。5.5kHz〜1
1kHzの信号が端子94を介して上記FFT回路40へ、DC〜5.5
kHzの信号が端子95を介して上記FFT回路20へ送られる。
このように上記フィルタバンク90では、入力オーディオ
信号を非ブロックで3つの帯域に周波数分割し、高域ほ
ど帯域幅が大となるような分割を行っている。なお、第
7図の例では、フィルタをQMFとしているがBPF(バンド
パスフィルタ)を用いた構成とすることも可能である。
このフィルタバンク90からDC〜5.5kHzの帯域の信号が
供給されるFFT回路20では、供給された信号を10ms毎に
ブロック化してこのブロック毎にFFT処理を行う。ま
た、5.5kHz〜11kHzの帯域の信号が供給されるFFT回路40
では5ms毎のブロックでのFFT処理を行い、11kHz〜22kHz
の帯域の信号が供給されるFFT回路60では2.5ms毎のブロ
ックでのFFT処理を行う。すなわち、これらFFT回路20,4
0,60では、高域ほどFFTされるブロック長を小となす処
理が行われる。このように、本具体例では、各FFT回路2
0,40,60においてブロックを形成する際に、高域での時
間ブロック長を小となす処理を行うことにより、この高
域での時間分解能を上げ、かつ低域では時間分解能を下
げて1ブロック内のサンプル数を増やして周波分解能を
上げている。すなわち、通常の音声信号は高域で定常区
間が短いため上述のように高域での時間分解能を上げる
ことは有効であり、また、一般に、人間の聴覚における
周波数分解能は低域で高いものであるため、上述のよう
に低域での周波数分解能を上げることも有効となる。
ここで、第8図に、上記フィルタバンク90と各FFT回
路20,40,60とによる処理の時間ブロックを示す。すなわ
ちこの第8図には、上記帯域分割,FFT等のそれぞれの処
理単位(ブロック)を示しており、図中b(p,q,r)に
おけるp,q,rの3つのパラメータにより、ブロックが指
定されている。pは時間経過を、qは帯域を、rは時間
ブロックを示している。この第8図において、DC〜5.5k
Hzの低域では各帯域の1つの時間ブロックが10msの時間
長(時間分解能)となることを示している。また5.5kHz
〜11kHzの中域では1つの時間ブロック長が5msとなるこ
とを、11kHz〜22kHzの高域では1つの時間ブロック長が
2.5msとなることを示している。
上記FFT回路20,40,60でFFT処理されて得られた各帯域
毎のFFT係数データは、前記第1図の第1,第2のノイズ
レベル設定回路17,18に対する各回路によって、同時刻
マスキング(周波数軸上のマスキング効果)及びテンポ
ラルマスキング効果を考慮した第1,第2の許容ノイズレ
ベルが設定される。
この第1,第2の許容ノイズレベルは、例えば、以下の
ようにして求められる。
上記FFT回路20,40,60の出力データは、全体として更
に上記クリティカルバンド(臨界帯域)に分割される。
この帯域分割を行うため、FFT回路20の出力データ(周
波数帯域DC〜5.5kHz)は、臨界帯域分割回路21によっ
て、更に上記クリティカルバンドの低域側の例えば20個
分のバンドに分割される。また、FFT回路40の出力デー
タ(5.5kHz〜11kHz)は、臨界帯域分割回路41によっ
て、更にクリティカルバンドの中域の例えば3つ分のバ
ンドに分割され、FFT回路60の出力データ(11kHz〜22kH
z)は、臨界帯域分割回路61により更にクリティカルバ
ンドの高域の例えば2つ分のバンドに分割される。
上記各臨界帯域分割回路21,41,61の出力は、それぞれ
エネルギ検出回路22,42,62に送られる。各エネルギ検出
回路22,42,62では、上記各FFT回路20,40,60での各時間
ブロック毎でかつ各クリティカルバンド毎のデータのエ
ネルギ(各バンドでのスペクトル強度)が、例えば、各
バンド内のそれぞれの振幅値の総和(振幅値のピーク又
は平均或いはエネルギ総和)をとることにより求められ
る。該エネルギ検出回路22,42,62の出力は、各クリティ
カルバンド毎の総和のスペクトル(バークスペクトルS
B、前述の第2図参照)である。
ここで、上記バークスペクトルのSBの周波数軸でのマ
スキングに於ける影響を考慮するため、上記バークスペ
クトルSBに所定の重みづけの関数を畳込む(コンボリュ
ーション)。このため上記エネルギ検出回路22,42,46の
出力すなわち上記バークスペクトルSBの各値は、上記第
1図の第1のノイズレベル設定回路17としてのマスキン
グスペクトル算出回路75に送られる。当該マスキングス
ペクトル算出回路75は、前述した第3図のフィルタ回路
76,引算器78,関数発生回路77,割算器79と同様に構成さ
れるものであるため、詳細な説明は省略する。ただし、
このマスキングスペクトル算出回路75に供給される信号
は、上述したように臨界帯域が3つにわけられたもので
ある。
また、本具体例回路においては、上述した周波数軸上
のマスキングを考慮した第1の許容ノイズレベルの設定
と共に、上記第2の許容ノイズレベルも設定するように
している。ここで、第8図において例えばブロックB2か
ら見ると、上記時間的に先行するデータはブロックB1
(それ以前のブロックも含む)のデータとなり、後行す
るデータはブロックB3(それ以後のブロックも含む)の
データとなる。これらブロックB1,B3(或いはより複数
のブロック)の少なくとも一方のデータにともづいて上
記ブロックB2内の各周波数成分に対する第2の許容ノイ
ズレベル(マスキングレベル)を設定するようにしてい
る。更に、本具体レベルでは、上記第2の許容ノイズレ
ベルでの上記少なくとも一方は、時間的に先行するデー
タとする。すなわち、テンポラルマスキングにおいてマ
スキング効果の時間が長いフォワードマスキングを考慮
して時間的に先行する上記ブロックB1のデータに基づい
てブロックB2への許容ノイズレベルを求めている。また
更に、本具体例では、時間的に異なる期間の周波数成分
的に同一のもののエネルギに基づいて上記第2の許容ノ
イズレベルを設定するようにしている。すなわち、クリ
ティカルバンドのうち同じ周波数バンドの時間的に先
行,後行するデータのエネルギに基づいて第2の許容ノ
イズレベルを設定している。
このため、上記エネルギ検出回路22,42,62の出力は、
それぞれ、上記第2のノイズレベル設定手段の期間遅延
回路23,43,63及び5ms遅延回路51,2.5ms遅延回路71に送
られる。
ここで、上記期間遅延回路23,43,63は、それぞれ供給
されたデータを例えば10msブロックの期間毎に遅延を行
うものである。また、上記期間遅延回路43及び63の出力
は、それぞれ合成回路50,70に送られる。該合成回路50
及び70は、上記FFT回路40,60での時間ブロック(5ms,2.
5msブロック)のデータをそれぞれ10msのデータに合成
するものである。更に、上記5ms遅延回路51は、上記5ms
ブロック毎に遅延を行うものであり、該5ms遅延回路51
の出力は選択回路52に送られる。当該選択回路52は、供
給された5msブロックのデータが、現在処理されている1
0msブロック内の前のブロックデータである場合には、
そのデータを通過させ、また、該10msブロックの先行す
る10msブロック内の後のブロックデータである場合は通
過させないような切換選択を行うものである。すなわち
上記現在処理されている10msブロックを第8図のブロッ
クB2とすると、上記選択回路52に供給された5msブロッ
クデータが第8図中ブロックb(2,2,1)である時はオ
ンとなり、b(1,2,2)である時はオフとなる選択を行
う。上記2.5ms遅延回路71は、2.5msのブロック毎に遅延
を行うものであり、当該2.5ms遅延回路71の出力は、順
次2.5ms遅延回路72,73に送られる。各2.5ms遅延回路71,
72,73の出力はそれぞれ合成選択回路74に送られる。当
該合成選択回路74は、供給された2.5msブロックデータ
が、現在処理されている例えばブロックB2の先行するブ
ロックB1内の後のブロックb(1,3,4)である場合はオ
フとし、また上記ブロックB2内のブロックb(2,3,
1)、b(2,3,2)、b(2,3,3)である場合はオンとす
るような切換選択を行う。同時に当該合成選択回路74で
は、例えばブロックb(2,3,2)のデータが供給された
時はこのブロックと前のブロックb(2,3,1)との合成
を行い、ブロックb(2,3,3)のデータが供給される時
は該ブロックと前の2つのブロックb(2,3,1),b(2,
3,2)との合成い、ブロックb(2,3,4)のデータが供給
される時は該ブロックと前の3つのブロックb(2,3,
1),b(2,3,2),b(2,3,3)との合成を行うようになっ
ている。
上記期間遅延回路23の出力は重付合成回路24に、上記
合成回路50,選択回路52の出力は重付合成回路44に、上
記合成回路70,合成選択回路74の出力は重付合成回路64
に送られる。また、各重付合成回路24,44,64には、前記
マスキングスペクトル算出回路75からのデータも供給さ
れるようになっている。ここで、各種付合成回路24,44,
64は、供給されたデータに対して同時刻及びスペクトル
マスキング効果を考慮した重み付けの係数を合成するも
のである。すなわち、この重み付けの係数は、マスキン
グ効果を考慮して設定される係数であり、例えば現在の
ブロックの信号に対して先行或いは後行するブロックの
信号を正規化して1とした場合、該先行或いは後行する
のブロックの信号による周波数軸上のマスキング及びテ
ンポラルマスキング等に基づいた上記現在のブロックの
信号に対して作用するレベルに対応した重み付けの係数
が、該先行或いは後行するブロックの信号に対して重み
付けられる。これにより、周波数軸上及びテンポラルマ
スキング効果を利用した許容ノイズレベル(マスキング
スペクトル)が設定可能となる。
なお、上述のマスキング効果を考慮したマスキングス
ペクトルは、同じクリティカルバンド内で求められてい
るが、他のクリティカルバンド間でのマスキングを考慮
したものとすることも可能である。
これら各重付合成回路24,44,64の出力は、更にそれぞ
れ合成回路25,45,65を介して減算器27,47,67に送られ
る。ここで、これら減算器27,47,67は、前述の第3図の
減算器121と略同様に機能するものであり詳細な説明は
省略する。ただし、これら減算器27,47,67で扱われる帯
域は、上述したようにクリティカルバンドを3つに分け
たそれぞれの帯域となっている。
該減算器27,47,67の出力は、ROM28,48,68に送られ
る。これらROM28,48,68も、第3図のROM122と略同様に
機能するものであり詳細な説明は省略する。ただし、こ
れらROM28,48,68で扱う帯域も、クリティカルバンドを
3つに分けたそれぞれの帯域となっている。
このようなことから、本具体例回路でも、上記クリテ
ィカルバンドの各バンド毎のエネルギによる同時刻マス
キングと、テンポラルマスキングとを考慮した第1,第2
の許容ノイズレベルに応じて上記ノイズフィルタ13のフ
ィルタ係数が定められている。
上述のようにして決定されたフィルタ係数が合成回路
85によって全帯域合成がなされ、その後出力端子4から
第1図のノイズフィルタ13に送られる。
なお、上記遅延回路30,55,80は上記臨界帯域分割回路
21,41,61以降の回路での遅延量を考慮して設けられてい
るものであり、遅延回路31,56,81は、期間遅延回路23,4
3,63、5ms遅延回路51、2.5ms遅延回路71、マスキングス
ペクトル算出回路75以降の各回路での遅延量を考慮して
設けられている。
また、上記合成回路25,45,65での合成の際には、前述
の第3図の最小可聴カーブ発生回路129と同様の最小可
聴カーブ発生回路26,46,66からのデータも供給されてい
る。ただし、これら最小可聴カーブ発生回路26,46,66か
らのデータも、クリティカルバンドを3つに分けたそれ
ぞれの帯域に対応するデータとなっている。
上述のようなことから、本実施例のオーディオ信号の
量子化誤差低減装置を、例えば規格統一されたディジタ
ルオーディオ機器(例えばいわゆるコンパクトディス
ク,ディジタル・オーディオ・テープレコーダ等)に適
用すれば、該統一規格から現実に得られるダイナミック
レンジよりも、聴感上でより高いダイナミックレンジの
再生音を得られるようになる。例えば、統一規格(上記
CD,DATの場合16ビットスロットワード長の規格)を維持
したままで(再生側には変更を加えず、コンパチビリテ
ィーを保ったままで)、このオーディオ信号の再生音の
聴感上のダイナミックレンジを上げることができるよう
になる。
〔発明の効果〕
本発明のオーディオ信号の量子化誤差低減装置におい
ては、所定期間毎のブロックの入力ディジタル信号を周
波数分析し、各周波数成分のエネルギに基づいた第1の
許容ノイズレベルと、ブロックに時間的に先後行するデ
ータの少なくとも一方のエネルギに基づいた第2の許容
ノイズレベルとの少なくとも一方に基づいて、ノイズフ
ィルタのフィルタ特性を設定するようにしたことによ
り、聴感上のノイズを低減して聴感上のダイナミックレ
ンジを上げることができるようになった。
したがって、本発明のオーディオ信号の量子化誤差低
減装置を、例えば規格統一されたディジタルオーディオ
機器に適用すれば、該統一規格から現実に得られるダイ
ナミックレンジよりも、聴感上でより高いダイナミック
レンジの再生音を得られるようになる。例えば、統一規
格を維持したままで(再生側には変更を加えず、コンパ
チビリティーを保ったままで)、このオーディオ信号の
再生音の聴感上のダイナミックレンジを上げることがで
きるようになる。
【図面の簡単な説明】
第1図は本発明実施例のオーディオ信号の量子化誤差低
減装置の概略構成のブロック図、第2図バークスペクト
ルを示す図、第3図は具体例回路を示すブロック図、第
4図マスキングスペクトルを示す図、第5図は最小可聴
カーブ,マスキングスペクトルを合成した図、第6図は
他の具体例回路を示すブロック図、第7図はフィルタバ
ンクの例を示すブロック回路図、第8図は他の具体例で
のブロックを説明するための図である。 10,12……加算器 11……量子化器 13……ノイズフィルタ 14……フィルタ係数算出回路 15……ブロック化回路 16……周波数分析回路 17……第1のノイズレベル設定回路 18……第2のノイズレベル設定回路
フロントページの続き (56)参考文献 特開 昭61−199345(JP,A) 特開 昭61−199346(JP,A) 特開 昭61−158220(JP,A) 特開 昭62−8629(JP,A) 特開 平2−143713(JP,A) 特開 平2−233024(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 H03M 7/36

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】量子化器で発生した量子化誤差をノイズフ
    ィルタを介して上記量子化器の入力側に帰還するように
    したオーディオ信号の量子化誤差低減装置において、 入力オーディオ信号を所定期間毎にブロック化するブロ
    ック化手段と、 上記ブロック化手段からの各ブロック毎に周波数分析を
    行う周波数分析手段と、 上記周波数分析手段の出力のうち、上記ブロック内の各
    周波数成分のエネルギに基づいて第1の許容ノイズレベ
    ルを設定する第1のノイズレベル設定手段と、 上記周波数分析手段の出力のうち、上記ブロックに時間
    的に先行するデータ及び時間的に後行するデータの少な
    くとも一方のエネルギに基づいて、当該ブロックの各周
    波数成分の第2の許容ノイズレベルを設定する第2のノ
    イズレベル設定手段とを有し、 上記ノイズフィルタのフィルタ特性を、上記第1及び第
    2のノイズレベル設定手段の少なくとも一方の出力に基
    づいて設定することを特徴とするオーディオ信号の量子
    化誤差低減装置。
JP31261790A 1990-11-20 1990-11-20 オーディオ信号の量子化誤差低減装置 Expired - Fee Related JP2998196B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31261790A JP2998196B2 (ja) 1990-11-20 1990-11-20 オーディオ信号の量子化誤差低減装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31261790A JP2998196B2 (ja) 1990-11-20 1990-11-20 オーディオ信号の量子化誤差低減装置

Publications (2)

Publication Number Publication Date
JPH04185017A JPH04185017A (ja) 1992-07-01
JP2998196B2 true JP2998196B2 (ja) 2000-01-11

Family

ID=18031360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31261790A Expired - Fee Related JP2998196B2 (ja) 1990-11-20 1990-11-20 オーディオ信号の量子化誤差低減装置

Country Status (1)

Country Link
JP (1) JP2998196B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0756386B1 (en) * 1995-07-27 2003-09-17 Victor Company Of Japan, Limited Method and apparatus for coding a digital, acoustic signal

Also Published As

Publication number Publication date
JPH04185017A (ja) 1992-07-01

Similar Documents

Publication Publication Date Title
JP3033156B2 (ja) ディジタル信号符号化装置
JP2861238B2 (ja) ディジタル信号符号化方法
JP2751564B2 (ja) ディジタル信号符号化装置
JP2913731B2 (ja) ディジタルデータの高能率符号化方法
JP3134338B2 (ja) ディジタル音声信号符号化方法
JP3334419B2 (ja) ノイズ低減方法及びノイズ低減装置
EP0367569A2 (en) Sound effect system
JP2000513888A (ja) Btscエンコーダ
US20020173865A1 (en) Digital audio signal processing
US20060177074A1 (en) Early reflection reproduction apparatus and method of sound field effect reproduction
WO1994024666A1 (en) Method and apparatus for transforming signals, and recording medium
JP2998196B2 (ja) オーディオ信号の量子化誤差低減装置
KR970002686B1 (ko) 오디오 신호의 전송방법
JP3041967B2 (ja) ディジタル信号符号化装置
US4642812A (en) Sound field enlarging device and method
JP3010663B2 (ja) ノイズシェーピング回路
JP3089692B2 (ja) ディジタルデータの高能率符号化方法
JP3186331B2 (ja) 信号変換方法又は装置、並びに記録媒体
JP3225680B2 (ja) 信号変換方法及び装置、並びに記録媒体
JP3033158B2 (ja) デイジタル信号符号化装置
JP3166407B2 (ja) ノイズ低減装置
JP3033157B2 (ja) ディジタル信号符号化装置
JP3060577B2 (ja) ディジタル信号符号化方法
JP3033150B2 (ja) オーディオ信号の量子化誤差低減装置
JP3132031B2 (ja) ディジタル信号の高能率符号化方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees