JP2913735B2 - ディジタルデータの高能率符号化方法 - Google Patents
ディジタルデータの高能率符号化方法Info
- Publication number
- JP2913735B2 JP2913735B2 JP6124990A JP6124990A JP2913735B2 JP 2913735 B2 JP2913735 B2 JP 2913735B2 JP 6124990 A JP6124990 A JP 6124990A JP 6124990 A JP6124990 A JP 6124990A JP 2913735 B2 JP2913735 B2 JP 2913735B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- band
- time
- bands
- digital data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、いわゆる高能率符号化によって入力ディジ
タルデータの符号化を行うディジタルデータの高能率符
号化方法に関するものである。
タルデータの符号化を行うディジタルデータの高能率符
号化方法に関するものである。
本発明は、入力ディジタルデータを分割した複数の帯
域毎に、複数のサンプルからなるブロックを形成し、各
帯域のブロック毎に直交変換を行い係数データを得るデ
ィジタルデータの高能率符号化方法であって、少なくと
も最も低域の帯域の直交変換前のブロックを時間的に複
数の小ブロックに分けてエネルギを検出し、そのエネル
ギに基づいて最も低域の帯域のブロックを小さくするよ
うにしたことにより、低域での過渡性入力に起因したノ
イズの聞こえを低減することができるディジタルデータ
の高能率符号化装置を提供するものである。
域毎に、複数のサンプルからなるブロックを形成し、各
帯域のブロック毎に直交変換を行い係数データを得るデ
ィジタルデータの高能率符号化方法であって、少なくと
も最も低域の帯域の直交変換前のブロックを時間的に複
数の小ブロックに分けてエネルギを検出し、そのエネル
ギに基づいて最も低域の帯域のブロックを小さくするよ
うにしたことにより、低域での過渡性入力に起因したノ
イズの聞こえを低減することができるディジタルデータ
の高能率符号化装置を提供するものである。
〔従来の技術〕 オーディオ或いは音声等の信号の高能率符号化の手法
には種々あるが、例えば、時間軸上のオーディオ信号等
を複数の周波数帯域に分割して符号化する帯域分割符号
化(サブ・バンド・コーディング:SBC)や、時間軸の信
号を周波数軸上の信号に変換(直交変換)して複数の周
波数帯域に分割し各帯域毎に符号化するいわゆる変換符
号化等を挙げることができる。また、上述の帯域分割符
号化と変換符号化とを組み合わせた高能率符号化の手法
も考えられており、この場合には、例えば、上記帯域分
割符号化で帯域分割を行った後、該各帯域毎の信号を周
波数軸上の信号に直交変換し、この直交変換された各帯
域毎に符号化が施される。ここで、上述した直交変換と
しては、例えば、入力オーディオ信号を所定単位時間で
ブロック化し、当該ブロック毎に高速フーリエ変換(FE
T)を行うことで時間軸を周波数軸に変換するような直
交変換がある。更に、直交変換された周波数軸上のデー
タを帯域分割する際には、例えば人間の聴覚特性を考慮
した帯域分割が行われることがある。すなわち、一般に
臨界帯域(クリティカルバンド)と呼ばれている高域程
帯域幅が広くなるような帯域幅で、オーディオ信号を複
数(例えば25バンド)の帯域に分割することがある。ま
た、この時の各帯域毎のデータを符号化する際には、各
帯域毎に所定のビット配分或いは、各帯域毎に適応的な
ビット割当て(ビットアロケーシヨン)による符号化が
行われる。例えば、上記ビットアロケーシヨンによる上
記FFT係数データの符号化の際には、上記各ブロック毎
のFFT処理により得られる各帯域毎のFFT係数データに対
して、適応的な割当てビット数で符号化が行われること
になる。
には種々あるが、例えば、時間軸上のオーディオ信号等
を複数の周波数帯域に分割して符号化する帯域分割符号
化(サブ・バンド・コーディング:SBC)や、時間軸の信
号を周波数軸上の信号に変換(直交変換)して複数の周
波数帯域に分割し各帯域毎に符号化するいわゆる変換符
号化等を挙げることができる。また、上述の帯域分割符
号化と変換符号化とを組み合わせた高能率符号化の手法
も考えられており、この場合には、例えば、上記帯域分
割符号化で帯域分割を行った後、該各帯域毎の信号を周
波数軸上の信号に直交変換し、この直交変換された各帯
域毎に符号化が施される。ここで、上述した直交変換と
しては、例えば、入力オーディオ信号を所定単位時間で
ブロック化し、当該ブロック毎に高速フーリエ変換(FE
T)を行うことで時間軸を周波数軸に変換するような直
交変換がある。更に、直交変換された周波数軸上のデー
タを帯域分割する際には、例えば人間の聴覚特性を考慮
した帯域分割が行われることがある。すなわち、一般に
臨界帯域(クリティカルバンド)と呼ばれている高域程
帯域幅が広くなるような帯域幅で、オーディオ信号を複
数(例えば25バンド)の帯域に分割することがある。ま
た、この時の各帯域毎のデータを符号化する際には、各
帯域毎に所定のビット配分或いは、各帯域毎に適応的な
ビット割当て(ビットアロケーシヨン)による符号化が
行われる。例えば、上記ビットアロケーシヨンによる上
記FFT係数データの符号化の際には、上記各ブロック毎
のFFT処理により得られる各帯域毎のFFT係数データに対
して、適応的な割当てビット数で符号化が行われること
になる。
ところで、一般に音に対する人間の聴覚特性には、マ
スキング効果と呼ばれるものがあり、当該マスキング効
果には、テンポラルマスキング効果と同時刻マスキング
効果等がある。上記同時刻マスキング効果とは、ある大
きな音と同時刻に発生する小さな音(或いはノイズ)が
当該大きな音によってマスクされて聞こえなくなるよう
な効果であり、上記テンポラルマスキング効果とは、大
きな音の時間的な前後の小さな音(ノイズ)が、この大
きな音にマスクされて聞こえなくなるような効果であ
る。このテンポラルマスキング効果において、上記大き
な音の時間的に後方のマスキングはフォワードマスキン
グと呼ばれ、また、時間的に前方のマスキングはバック
ワードマスキングと呼ばれている。また、テンポラルマ
スキングにおいては、人間の聴覚特性から、フォワード
マスキングの効果は長時間(例えば100msec程度)効く
ようになっているのに対し、バックワードマスキングの
効果の持続時間は短時間(例えば5msec程度)となって
いる。更に、上記マスキング効果のレベル(マスキング
量)は、フォワードマスキングが20dB程度で、バックワ
ードマスキングが30dB程度となっている。
スキング効果と呼ばれるものがあり、当該マスキング効
果には、テンポラルマスキング効果と同時刻マスキング
効果等がある。上記同時刻マスキング効果とは、ある大
きな音と同時刻に発生する小さな音(或いはノイズ)が
当該大きな音によってマスクされて聞こえなくなるよう
な効果であり、上記テンポラルマスキング効果とは、大
きな音の時間的な前後の小さな音(ノイズ)が、この大
きな音にマスクされて聞こえなくなるような効果であ
る。このテンポラルマスキング効果において、上記大き
な音の時間的に後方のマスキングはフォワードマスキン
グと呼ばれ、また、時間的に前方のマスキングはバック
ワードマスキングと呼ばれている。また、テンポラルマ
スキングにおいては、人間の聴覚特性から、フォワード
マスキングの効果は長時間(例えば100msec程度)効く
ようになっているのに対し、バックワードマスキングの
効果の持続時間は短時間(例えば5msec程度)となって
いる。更に、上記マスキング効果のレベル(マスキング
量)は、フォワードマスキングが20dB程度で、バックワ
ードマスキングが30dB程度となっている。
〔発明が解決しようとする課題〕 ここで、符号化の際に上述のように上記所定単位時間
ブロック内のオーディオ信号を高速フーリエ変換した場
合、該信号のデコード時には、逆高速フーリエ変換(IF
FT)が行われる。このようなエンコード,デコードによ
って得られる信号には、通常、これらFFT,IFFTにより発
生するノイズがブロック内全体に現れることになる。こ
のため、例えば、上記FFT,IFFTされるブロック内に過渡
的変化が生じている場合、すなわち例えば第6図に示す
ように、ブロックB内の無信号(無音)部Uに、例えば
カスタネットの打音による信号のように急激にレベルが
増大する信号Cが入って来ることでブロックB内の信号
の過渡的変化が大きくなっているような場合には、上記
FFT,IFFT処理を施すことによるノイズが上記無信号部U
にも現れることになる。すなわち、第7図に示すように
上記ブロックBの無信号部Uにも上記大レベルの信号部
Cに起因したノイズ成分が現れることになる。したがっ
て、この信号を再生すると、本来無信号であった部分で
のノイズが目立つようになる。
ブロック内のオーディオ信号を高速フーリエ変換した場
合、該信号のデコード時には、逆高速フーリエ変換(IF
FT)が行われる。このようなエンコード,デコードによ
って得られる信号には、通常、これらFFT,IFFTにより発
生するノイズがブロック内全体に現れることになる。こ
のため、例えば、上記FFT,IFFTされるブロック内に過渡
的変化が生じている場合、すなわち例えば第6図に示す
ように、ブロックB内の無信号(無音)部Uに、例えば
カスタネットの打音による信号のように急激にレベルが
増大する信号Cが入って来ることでブロックB内の信号
の過渡的変化が大きくなっているような場合には、上記
FFT,IFFT処理を施すことによるノイズが上記無信号部U
にも現れることになる。すなわち、第7図に示すように
上記ブロックBの無信号部Uにも上記大レベルの信号部
Cに起因したノイズ成分が現れることになる。したがっ
て、この信号を再生すると、本来無信号であった部分で
のノイズが目立つようになる。
このような過渡的変化のあるブロックをFFT,IFFT等で
処理することによって発生するノイズの、上記大レベル
信号部Cの時間的に後のノイズは、第8図に示すような
長時間のフォワードマスキングFMの効果でマスクされる
ため、耳につくことが少ない。しかし、該大レベル信号
部Cの時間的に前のレベルは、バックワードマスキング
BMの効果が短時間であるため、耳に付きやすくなる。す
なわち、当該バックワードマスキングBMの効果の作用す
る時間よりも前の時間のノイズは耳につく。
処理することによって発生するノイズの、上記大レベル
信号部Cの時間的に後のノイズは、第8図に示すような
長時間のフォワードマスキングFMの効果でマスクされる
ため、耳につくことが少ない。しかし、該大レベル信号
部Cの時間的に前のレベルは、バックワードマスキング
BMの効果が短時間であるため、耳に付きやすくなる。す
なわち、当該バックワードマスキングBMの効果の作用す
る時間よりも前の時間のノイズは耳につく。
上述のようなバックワードマスキングBMの効果が期待
できない場合の対策としては、例えば、上記高速フーリ
エ変換処理が施される単位時間ブロック長を上記バック
ワードマスキングBMの効く時間範囲(例えば5msec)程
度に短くすることが考えられる。すなわち、上記大レベ
ル信号部CによるバックワードマスキングBMの効果が有
効に作用する時間まで、上記高能率符号化処理の際の時
間分解能を上げる(ブロック長を短くする)ことが考え
られる。
できない場合の対策としては、例えば、上記高速フーリ
エ変換処理が施される単位時間ブロック長を上記バック
ワードマスキングBMの効く時間範囲(例えば5msec)程
度に短くすることが考えられる。すなわち、上記大レベ
ル信号部CによるバックワードマスキングBMの効果が有
効に作用する時間まで、上記高能率符号化処理の際の時
間分解能を上げる(ブロック長を短くする)ことが考え
られる。
しかし、上述のようにフーリエ変換される単位時間ブ
ロック長を短くすることは、該ブロック内のサンプル数
を減少させることにより、当該フーリエ変換による周波
数分解能は逆に下がることになる。ところが、人間の聴
覚における周波数分析能力(周波数分解能)は、一般
に、高域ではさほど高くないが低域では高いものであ
る。したがって、該低域での周波数分解能を確保する必
要性から、現実には上述したように単位時間ブロック長
をあまり短くすることはできない。すなわち、低域で時
間分解能を上げることは好ましくない。
ロック長を短くすることは、該ブロック内のサンプル数
を減少させることにより、当該フーリエ変換による周波
数分解能は逆に下がることになる。ところが、人間の聴
覚における周波数分析能力(周波数分解能)は、一般
に、高域ではさほど高くないが低域では高いものであ
る。したがって、該低域での周波数分解能を確保する必
要性から、現実には上述したように単位時間ブロック長
をあまり短くすることはできない。すなわち、低域で時
間分解能を上げることは好ましくない。
なお、一般に、低域信号では定常区間が長く、逆に高
域信号では短いため、高域での時間分解能を高める(ブ
ロック長を短くする)ことは有効となる。
域信号では短いため、高域での時間分解能を高める(ブ
ロック長を短くする)ことは有効となる。
そこで、本発明は、上述のような実情に鑑みて提案さ
れたものであり、高域では高い時間分解能を得ることが
でき、更に、低域では高い周波数分解能を得ることがで
き、かつ、時間分解能を上げることができない低域でブ
ロック内の大レベル信号部に起因したノイズの聞こえを
低減することが可能なディジタルデータの高能率符号化
方法を提供することを目的とするものである。
れたものであり、高域では高い時間分解能を得ることが
でき、更に、低域では高い周波数分解能を得ることがで
き、かつ、時間分解能を上げることができない低域でブ
ロック内の大レベル信号部に起因したノイズの聞こえを
低減することが可能なディジタルデータの高能率符号化
方法を提供することを目的とするものである。
本発明のディジタルデータの高能率符号化方法は、上
述の目的を達成するために提案されたものであり、入力
ディジタルデータを複数の帯域に分割し、分割された帯
域毎に複数のサンプルからなるブロックを形成し、各帯
域のブロック毎に直交変換を行い係数データを得るよう
にしたディジタルデータの高能率符号化方法であって、
少なくとも最も低域の帯域の直交変換前のブロックを時
間的に複数の小ブロックに分けて、各小ブロック毎のエ
ネルギを検出し、その検出されたエネルギに基づいて最
も低域の帯域のブロックを小さくするようにしたもので
ある。ここで、上記ブロックを形成する際には、高域で
はブロック長を長く(時間分解能を高く)し、低域では
1ブロック内のサンプル数を増やすようにする(周波数
分解能を上げる)ことができる。また、後の量子化時の
各帯域毎の係数データは、いわゆる臨界帯域での各帯域
(例えば25バンド)の係数データとすることができる。
述の目的を達成するために提案されたものであり、入力
ディジタルデータを複数の帯域に分割し、分割された帯
域毎に複数のサンプルからなるブロックを形成し、各帯
域のブロック毎に直交変換を行い係数データを得るよう
にしたディジタルデータの高能率符号化方法であって、
少なくとも最も低域の帯域の直交変換前のブロックを時
間的に複数の小ブロックに分けて、各小ブロック毎のエ
ネルギを検出し、その検出されたエネルギに基づいて最
も低域の帯域のブロックを小さくするようにしたもので
ある。ここで、上記ブロックを形成する際には、高域で
はブロック長を長く(時間分解能を高く)し、低域では
1ブロック内のサンプル数を増やすようにする(周波数
分解能を上げる)ことができる。また、後の量子化時の
各帯域毎の係数データは、いわゆる臨界帯域での各帯域
(例えば25バンド)の係数データとすることができる。
本発明によれば、少なくとも最も低域の帯域のブロッ
クデータに過渡的変化があった場合には、この低域の過
渡的変化を有するブロックの直交変換時のブロックサイ
ズを小さくすることで、バックワードマスキングを有効
に利用できるようになる。
クデータに過渡的変化があった場合には、この低域の過
渡的変化を有するブロックの直交変換時のブロックサイ
ズを小さくすることで、バックワードマスキングを有効
に利用できるようになる。
以下、本発明を適用した実施例について図面を参照し
ながら説明する。
ながら説明する。
本発明のディジタルデータの高能率符号化方法が適用
される一実施例のディジタルデータの高能率符号化装置
は、オーディオ或いは音声等の入力ディジタルデータ
を、例えば、前述の高能率符号化の帯域分割符号化(SB
C)等によって符号化するものである。すなわち、本実
施例の高能率符号化装置では、第1図に示すように、い
わゆるミラーフィルタのQMF(quadrature mirror filte
r)41,42によって、入力端子30を介して供給される上記
入力ディジタルデータを、高域程帯域幅が広くなるよう
に複数の帯域に分割し、高速フーリエ変換(FFT)回路4
3,44,45によって、この分割された帯域毎に複数のサン
プルからなるブロックを形成して、これら各ブロック毎
に高速フーリエ変換による直交変換(時間軸を周波数軸
に変換)を行うことで係数データ(FFT係数データ)を
得るようになっている。この時、上記ブロックを形成す
る際には、高域ではブロック長を長くすることで時間分
解能を上げ、低域では1ブロック内のサンプル数を増や
して周波数分解能を上げるようにしている。なお、本実
施例では、上記量子化される各帯域毎のFFT係数データ
は、いわゆる臨界帯域(クリティカルバンド)での各帯
域(例えば25バンド)のFFT係数データとしており、該F
FT係数データを量子化処理部58によって適応的な割当て
ビット数で量子化した後、出力端子31から出力するよう
にしている。
される一実施例のディジタルデータの高能率符号化装置
は、オーディオ或いは音声等の入力ディジタルデータ
を、例えば、前述の高能率符号化の帯域分割符号化(SB
C)等によって符号化するものである。すなわち、本実
施例の高能率符号化装置では、第1図に示すように、い
わゆるミラーフィルタのQMF(quadrature mirror filte
r)41,42によって、入力端子30を介して供給される上記
入力ディジタルデータを、高域程帯域幅が広くなるよう
に複数の帯域に分割し、高速フーリエ変換(FFT)回路4
3,44,45によって、この分割された帯域毎に複数のサン
プルからなるブロックを形成して、これら各ブロック毎
に高速フーリエ変換による直交変換(時間軸を周波数軸
に変換)を行うことで係数データ(FFT係数データ)を
得るようになっている。この時、上記ブロックを形成す
る際には、高域ではブロック長を長くすることで時間分
解能を上げ、低域では1ブロック内のサンプル数を増や
して周波数分解能を上げるようにしている。なお、本実
施例では、上記量子化される各帯域毎のFFT係数データ
は、いわゆる臨界帯域(クリティカルバンド)での各帯
域(例えば25バンド)のFFT係数データとしており、該F
FT係数データを量子化処理部58によって適応的な割当て
ビット数で量子化した後、出力端子31から出力するよう
にしている。
ここで、本実施例装置においては、少なくとも最も低
域の帯域の直交変換前のブロックデータの過渡的変化を
検出する検出回路50と、上記低域の帯域のデータの直交
変換のブロックサイズを可変する可変手段であるブロッ
クサイズ可変回路45aとを有し、上記検出回路50の出力
によって上記ブロックサイズ可変回路45aを制御して、
上記過渡的変化が検出された時ブロックサイズを小さく
するようにしている。なお、本実施例では、上記ブロッ
クサイズ可変回路45aは上記高速フーリエ変換回路45内
に含まれている。
域の帯域の直交変換前のブロックデータの過渡的変化を
検出する検出回路50と、上記低域の帯域のデータの直交
変換のブロックサイズを可変する可変手段であるブロッ
クサイズ可変回路45aとを有し、上記検出回路50の出力
によって上記ブロックサイズ可変回路45aを制御して、
上記過渡的変化が検出された時ブロックサイズを小さく
するようにしている。なお、本実施例では、上記ブロッ
クサイズ可変回路45aは上記高速フーリエ変換回路45内
に含まれている。
すなわち第1図において、入力端子30には例えば48kH
zのサンプリング周波数fsでサンプリングされたオーデ
ィオのディジタルデータ(0〜24kHz)が供給されてお
り、該ディジタルデータは上記QMF41,42により、高域程
帯域幅が広くなるように大まかに3つの帯域(0〜6kH
z,6kHz〜12kHz,12kHz〜24kHz)に分割される。上記QMF4
1では、上記0〜24kHzのディジタルデータが2分割され
て12kHz〜24kHzと0〜12kHzの2つの出力が得られ、12k
Hz〜24kHzの出力は高速フーリエ変換回路43に、0〜12k
Hzの出力はQMF42に送られる。QMF42へ送られた0〜12kH
zの出力は、該QMF42で更に2分割されて6kHz〜12kHzと
0〜6kHzの2つの出力が得られる。これら出力は、高速
フーリエ変換回路44,45にそれぞれ送られる。
zのサンプリング周波数fsでサンプリングされたオーデ
ィオのディジタルデータ(0〜24kHz)が供給されてお
り、該ディジタルデータは上記QMF41,42により、高域程
帯域幅が広くなるように大まかに3つの帯域(0〜6kH
z,6kHz〜12kHz,12kHz〜24kHz)に分割される。上記QMF4
1では、上記0〜24kHzのディジタルデータが2分割され
て12kHz〜24kHzと0〜12kHzの2つの出力が得られ、12k
Hz〜24kHzの出力は高速フーリエ変換回路43に、0〜12k
Hzの出力はQMF42に送られる。QMF42へ送られた0〜12kH
zの出力は、該QMF42で更に2分割されて6kHz〜12kHzと
0〜6kHzの2つの出力が得られる。これら出力は、高速
フーリエ変換回路44,45にそれぞれ送られる。
各高速フーリエ変換回路43,44,45では、供給された各
帯域のデータの複数サンプルで1ブロックを構成し、当
該ブロック毎にフーリエ変換処理を施してFFT係数デー
タを得るようになっている。この時、上記高速フーリエ
変換回路43では、64サンプルで1ブロックを構成して、
このブロック毎に上記FFT係数データを得るようにして
いる。この結果、当該12kHz〜24kHzの帯域での時間分解
能は、約2.67msecの高時間分解能となる。上記高速フー
リエ変換回路44では、1ブロック64サンプルでFFT係数
データを得ており、この結果、当該6kHz〜12kHzでの時
間分解能は約5.3msecとなる。また、上記高速フーリエ
変換回路45では、1ブロック128サンプルでFFT係数デー
タを得ているため、当該0〜6kHzでの時間分解能は約1
0.67msecとなっている。
帯域のデータの複数サンプルで1ブロックを構成し、当
該ブロック毎にフーリエ変換処理を施してFFT係数デー
タを得るようになっている。この時、上記高速フーリエ
変換回路43では、64サンプルで1ブロックを構成して、
このブロック毎に上記FFT係数データを得るようにして
いる。この結果、当該12kHz〜24kHzの帯域での時間分解
能は、約2.67msecの高時間分解能となる。上記高速フー
リエ変換回路44では、1ブロック64サンプルでFFT係数
データを得ており、この結果、当該6kHz〜12kHzでの時
間分解能は約5.3msecとなる。また、上記高速フーリエ
変換回路45では、1ブロック128サンプルでFFT係数デー
タを得ているため、当該0〜6kHzでの時間分解能は約1
0.67msecとなっている。
このように、本実施例においては、高域(12kHz〜24k
Hz)及び中域(6kHz〜12kHz)での時間分解能が2.67mse
c及び5.3msecとなっているため、前記大レベル信号部C
に起因した前述の第7図のようなノイズが発生しても、
この高域・中域では、上記ブロック内の当該大レベル信
号部Cによる上記バックワードマスキングを有効に利用
(効果の時間は5msec程度)することができる。また、
本実施例の装置では、低域での周波数分解能を確保する
必要性から、当該低域での時間分解能が上述のように1
0.67msecとなっており、更に、10.67msecの時間分解能
であっても、該低域でのブロック内の上記大レベル信号
部Cに起因するノイズに対応できるようにしている。す
なわち、上述したように、この低帯域の直交変換前のブ
ロックデータの過渡的変化を検出(過渡的変化部のある
ブロックを検出)し、過渡的変化部のあるブロックが検
出された時には、低域のFFT処理のブロックサイズを小
さくすることで、上記バックワードマスキングを有効に
利用できるようにしている。
Hz)及び中域(6kHz〜12kHz)での時間分解能が2.67mse
c及び5.3msecとなっているため、前記大レベル信号部C
に起因した前述の第7図のようなノイズが発生しても、
この高域・中域では、上記ブロック内の当該大レベル信
号部Cによる上記バックワードマスキングを有効に利用
(効果の時間は5msec程度)することができる。また、
本実施例の装置では、低域での周波数分解能を確保する
必要性から、当該低域での時間分解能が上述のように1
0.67msecとなっており、更に、10.67msecの時間分解能
であっても、該低域でのブロック内の上記大レベル信号
部Cに起因するノイズに対応できるようにしている。す
なわち、上述したように、この低帯域の直交変換前のブ
ロックデータの過渡的変化を検出(過渡的変化部のある
ブロックを検出)し、過渡的変化部のあるブロックが検
出された時には、低域のFFT処理のブロックサイズを小
さくすることで、上記バックワードマスキングを有効に
利用できるようにしている。
このような過渡的変化のあるブロックの検出、及び、
ブロックサイズ可変長処理を行うため、具体的には以下
のようなことを行っている。
ブロックサイズ可変長処理を行うため、具体的には以下
のようなことを行っている。
すなわち、上記検出回路50では、前述した第6図のよ
うな過渡的変化部のある、特にレベルが増大する信号の
立ち上がり部を有するブロックBを検出するようにして
いる。また、上記ブロックサイズ可変回路45aにおいて
は、上記低域の高速フーリエ変換回路45で処理されるブ
ロック内に過渡的変化が生じている場合には、例えば、
該ブロックを分割してサブブロック化することで、ブロ
ックサイズを小さくするようにしている。すなわち、例
えば第2図に示すように、過渡的変化のあるブロックB
を図中点線で示すように半分に分割してサブブロックBs
を得ている。このようにすることで、該過渡的変化のあ
るブロックでの上記高速フーリエ変換回路45によるFFT
処理が、このサブブロック毎に行われるようにしてい
る。また、この時のサブブロックのサイズは、例えば、
上記大レベル信号Cによる前述したバックワードマスキ
ングの効果が持続する時間程度(すなわちサブブロック
サイズは5msec程度)とされる。
うな過渡的変化部のある、特にレベルが増大する信号の
立ち上がり部を有するブロックBを検出するようにして
いる。また、上記ブロックサイズ可変回路45aにおいて
は、上記低域の高速フーリエ変換回路45で処理されるブ
ロック内に過渡的変化が生じている場合には、例えば、
該ブロックを分割してサブブロック化することで、ブロ
ックサイズを小さくするようにしている。すなわち、例
えば第2図に示すように、過渡的変化のあるブロックB
を図中点線で示すように半分に分割してサブブロックBs
を得ている。このようにすることで、該過渡的変化のあ
るブロックでの上記高速フーリエ変換回路45によるFFT
処理が、このサブブロック毎に行われるようにしてい
る。また、この時のサブブロックのサイズは、例えば、
上記大レベル信号Cによる前述したバックワードマスキ
ングの効果が持続する時間程度(すなわちサブブロック
サイズは5msec程度)とされる。
本実施例装置では、上述のように低域で上記検出回路
50により検出されたブロックを、例えばサブブロック化
して小さくし、該サブブロック毎にFFT処理するように
したことで、上記大レベル信号部Cに起因するノイズが
聞こえなくなるようにしている。すなわち、当該ブロッ
クの上記大レベル信号部Cを有するサブブロックのサイ
ズが、上述のように5msec程度とされることで、テンポ
ラルマスキングのバックワードマスキングも有効に利用
することができるようになり、該サブブロック内でFFT
等によって発生するノイズが略完全にマスクされること
になる。また、第2図のように上記大レベル信号部Cの
ないサブブロックにおいては、該サブブロック内が略無
信号であるため、FFT等によるノイズは殆ど発生しない
ようになる。したがって、聴感上よりよい結果を得るこ
とができるようになる。なお、上記サブブロック化の際
の分割は、サブブロックのサイズを同じにするような均
等分割に限らず、不均等分割であってもよい。この場合
も、上記大レベル信号部Cのあるサブブロックのサイズ
は、上記バックワードマスキングの効果が持続する時間
の5msec程度とする。
50により検出されたブロックを、例えばサブブロック化
して小さくし、該サブブロック毎にFFT処理するように
したことで、上記大レベル信号部Cに起因するノイズが
聞こえなくなるようにしている。すなわち、当該ブロッ
クの上記大レベル信号部Cを有するサブブロックのサイ
ズが、上述のように5msec程度とされることで、テンポ
ラルマスキングのバックワードマスキングも有効に利用
することができるようになり、該サブブロック内でFFT
等によって発生するノイズが略完全にマスクされること
になる。また、第2図のように上記大レベル信号部Cの
ないサブブロックにおいては、該サブブロック内が略無
信号であるため、FFT等によるノイズは殆ど発生しない
ようになる。したがって、聴感上よりよい結果を得るこ
とができるようになる。なお、上記サブブロック化の際
の分割は、サブブロックのサイズを同じにするような均
等分割に限らず、不均等分割であってもよい。この場合
も、上記大レベル信号部Cのあるサブブロックのサイズ
は、上記バックワードマスキングの効果が持続する時間
の5msec程度とする。
ここで、第3図に本実施例における周波数領域と時間
領域での分解能を示す。この第3図では、上述した帯域
分割,高速フーリエ変換時の処理の1単位を示し、b
(m,n)におけるm,nの2つのパラメータにより、ブロッ
クが指定されている。mは帯域ナンバーを、nは時間ナ
ンバーを示している。該第3図において、0〜6kHzの低
域では、各帯域の1ブロックが10.67msecの時間長(時
間分解能)となることを示している。また、6KHz〜12kH
zの中域では1ブロックの時間長が5.3msecとなること
を、12kHz〜24kHzの高域では1ブロックの時間長が2.67
msecとなることを示している。
領域での分解能を示す。この第3図では、上述した帯域
分割,高速フーリエ変換時の処理の1単位を示し、b
(m,n)におけるm,nの2つのパラメータにより、ブロッ
クが指定されている。mは帯域ナンバーを、nは時間ナ
ンバーを示している。該第3図において、0〜6kHzの低
域では、各帯域の1ブロックが10.67msecの時間長(時
間分解能)となることを示している。また、6KHz〜12kH
zの中域では1ブロックの時間長が5.3msecとなること
を、12kHz〜24kHzの高域では1ブロックの時間長が2.67
msecとなることを示している。
このように、本実施例においては、聴覚から必要とさ
れる周波数軸上の分解能と時間軸上の分解能を同時に満
足するような構成となっていて、低域(0〜6kHz)では
処理のサンプル数を多くして周波数分解能を上げ、高域
(12kHz〜24kHz)では帯域幅を広くする共に時間分解能
も上げている。また、中域(6kHz〜12kHzでも時間分解
能を上げている。
れる周波数軸上の分解能と時間軸上の分解能を同時に満
足するような構成となっていて、低域(0〜6kHz)では
処理のサンプル数を多くして周波数分解能を上げ、高域
(12kHz〜24kHz)では帯域幅を広くする共に時間分解能
も上げている。また、中域(6kHz〜12kHzでも時間分解
能を上げている。
第4図に上述の検出回路50の具体的構成を示す。この
第4図において、上記QMF42の0〜6kHzの出力すなわち
低域出力は、小ブロック化回路46へも送られる。該小ブ
ロック化回路46では、高速フーリエ変換回路45での128
サンプル1ブロックを更に3つの小ブロックT1,T2,T3に
分割する。この時の3つの小ブロックは、時間的にT1→
T2→T3の順となっている。これら各小ブロックT1,T2,T3
は、各小ブロック内のエネルギ値を求めるエネルギ演算
回路47,48,49にそれぞれ送られる。該エネルギ演算回路
47,48により求められた小ブロック内のエネルギ値は、
割算器51に、エネルギ演算回路48,49からのエネルギ値
は、割算器52に送られる。割算器51では小ブロックT2の
エネルギ値から小ブロックT1のエネルギ値が除算(T2/T
1)され、割算器52では小ブロックT3のエネルギ値から
小ブロックT2のエネルギ値が除算(T3/T2)される。こ
れら各割算器51,52の出力は、各々比較回路53,54に伝送
される。該比較回路53,54では、上記各割算器52,52の出
力に対し、共通端子から供給される基準入力に対してM
倍となるか否かが比較される。上記小ブロック単位の変
化分が1単位でもM倍を越えた場合には、それぞれ所定
の信号が出力される。すなわち上記128サンプル1ブロ
ックが過渡的変化部のあるブロックであることを示す所
定の信号が出力される。当該比較回路53,54の出力はOR
(論理和)ゲート55を介してラッチ回路56に送られる。
該ラッチ回路56では、端子32からのブロック単位(128
サンプル単位)のクロックに基づいて、上記ORゲート55
の出力を取り込んで上記高速フーリエ変換回路45内のブ
ロックサイズ可変回路45aに送るようにしている。この
ような除算(T2/T1,T3/T2)、比較等の一連の処理を行
うことで、前記バックワードマスキングの効果が期待で
きない過渡的変化部のあるブロックのみを検出すること
ができる。例えば、ブロック先頭から信号の立ち上がり
までが5msecよりも長いため、当該ブロック内で上記大
レベル信号部Cによるバックワードマスキングの効果が
完全でないようなブロックを検出することができる。し
たがって、上記ブロックサイズ可変回路45aにおいて
は、上記ラッチ回路56で128サンプルブロック単位で取
り込まれた所定の信号に基づいて、上記0〜6kHzの帯域
の該ブロックのサイズを、バックワードマスキングが有
効に利用できる5msec程度、例えば前述の第2図の様に
半分のサイズとなるようにFFT処理されるブロック長を
短くするようにしている。
第4図において、上記QMF42の0〜6kHzの出力すなわち
低域出力は、小ブロック化回路46へも送られる。該小ブ
ロック化回路46では、高速フーリエ変換回路45での128
サンプル1ブロックを更に3つの小ブロックT1,T2,T3に
分割する。この時の3つの小ブロックは、時間的にT1→
T2→T3の順となっている。これら各小ブロックT1,T2,T3
は、各小ブロック内のエネルギ値を求めるエネルギ演算
回路47,48,49にそれぞれ送られる。該エネルギ演算回路
47,48により求められた小ブロック内のエネルギ値は、
割算器51に、エネルギ演算回路48,49からのエネルギ値
は、割算器52に送られる。割算器51では小ブロックT2の
エネルギ値から小ブロックT1のエネルギ値が除算(T2/T
1)され、割算器52では小ブロックT3のエネルギ値から
小ブロックT2のエネルギ値が除算(T3/T2)される。こ
れら各割算器51,52の出力は、各々比較回路53,54に伝送
される。該比較回路53,54では、上記各割算器52,52の出
力に対し、共通端子から供給される基準入力に対してM
倍となるか否かが比較される。上記小ブロック単位の変
化分が1単位でもM倍を越えた場合には、それぞれ所定
の信号が出力される。すなわち上記128サンプル1ブロ
ックが過渡的変化部のあるブロックであることを示す所
定の信号が出力される。当該比較回路53,54の出力はOR
(論理和)ゲート55を介してラッチ回路56に送られる。
該ラッチ回路56では、端子32からのブロック単位(128
サンプル単位)のクロックに基づいて、上記ORゲート55
の出力を取り込んで上記高速フーリエ変換回路45内のブ
ロックサイズ可変回路45aに送るようにしている。この
ような除算(T2/T1,T3/T2)、比較等の一連の処理を行
うことで、前記バックワードマスキングの効果が期待で
きない過渡的変化部のあるブロックのみを検出すること
ができる。例えば、ブロック先頭から信号の立ち上がり
までが5msecよりも長いため、当該ブロック内で上記大
レベル信号部Cによるバックワードマスキングの効果が
完全でないようなブロックを検出することができる。し
たがって、上記ブロックサイズ可変回路45aにおいて
は、上記ラッチ回路56で128サンプルブロック単位で取
り込まれた所定の信号に基づいて、上記0〜6kHzの帯域
の該ブロックのサイズを、バックワードマスキングが有
効に利用できる5msec程度、例えば前述の第2図の様に
半分のサイズとなるようにFFT処理されるブロック長を
短くするようにしている。
上述したように、本実施例においては、該低域の過渡
的変化のブロックがあった場合には、FFT処理のブロッ
クサイズを小さくすることで、バックワードマスキング
を有効に利用できるようにして、FFT等によって発生す
るノイズが聞こえないようにすることができる。また、
過渡的変化のあるブロックの検出を低域のみで行ってい
るため、例えば全帯域で検出を行う場合よりも誤動作が
少なくなっている。
的変化のブロックがあった場合には、FFT処理のブロッ
クサイズを小さくすることで、バックワードマスキング
を有効に利用できるようにして、FFT等によって発生す
るノイズが聞こえないようにすることができる。また、
過渡的変化のあるブロックの検出を低域のみで行ってい
るため、例えば全帯域で検出を行う場合よりも誤動作が
少なくなっている。
また、本実施例では、量子化処理部58での量子化の際
に、人間の聴覚特性に基づくマスキングを考慮した適応
的な割当てビット数で量子化を行うようにしているた
め、上記各フーリエ変換回路の出力を、同様に人間の聴
覚特性に基づいた臨界帯域の各帯域に対応させている。
すなわち、上記高速フーリエ変換回路43の出力が、臨界
帯域の高域のバンドB24とバンドB25の2つの帯域と対応
し、高速フーリエ変換回路44の出力がバンドB21〜B23の
3つの帯域と、高速フーリエ変換回路45の出力が臨界帯
域の低域のバンドB1〜B20の20個と帯域と対応するよう
にされている。
に、人間の聴覚特性に基づくマスキングを考慮した適応
的な割当てビット数で量子化を行うようにしているた
め、上記各フーリエ変換回路の出力を、同様に人間の聴
覚特性に基づいた臨界帯域の各帯域に対応させている。
すなわち、上記高速フーリエ変換回路43の出力が、臨界
帯域の高域のバンドB24とバンドB25の2つの帯域と対応
し、高速フーリエ変換回路44の出力がバンドB21〜B23の
3つの帯域と、高速フーリエ変換回路45の出力が臨界帯
域の低域のバンドB1〜B20の20個と帯域と対応するよう
にされている。
上述した本実施例での周波数軸上の帯域分割の様子を
第5図に示す。
第5図に示す。
第5図において、低域(0〜6kHz)のバンドB1〜B20
での係数データ数は、例えば、バンドB1〜B8は各1個,
バンドB9〜B11は各2個,バンドB12とB13は各3個,バ
ンドB14〜B16は各4個,バンドB17とB18は各6個,バン
ドB19は9個,バンドB20は11個とする。中域(6kHz〜12
kHz)のバンドB21〜B23での係数データ数は、例えば、
バンドB21は7個,バンドB22は11個,バンドB23は14個
とする。また、高域(12kHz〜24kHz)のバンドB24とB25
での係数データ数は、例えば、各16個としている。
での係数データ数は、例えば、バンドB1〜B8は各1個,
バンドB9〜B11は各2個,バンドB12とB13は各3個,バ
ンドB14〜B16は各4個,バンドB17とB18は各6個,バン
ドB19は9個,バンドB20は11個とする。中域(6kHz〜12
kHz)のバンドB21〜B23での係数データ数は、例えば、
バンドB21は7個,バンドB22は11個,バンドB23は14個
とする。また、高域(12kHz〜24kHz)のバンドB24とB25
での係数データ数は、例えば、各16個としている。
本発明のディジタルデータの高能率符号化方法におい
ては、少なくとも最も低域の帯域の直交変換前のブロッ
クを時間的に複数の小ブロックに分けてエネルギを検出
し、そのエネルギに基づいて最も低域の帯域のブロック
を小さくするようにしたことにより、低域でのブロック
内の例えば大レベル信号部に起因したノイズの聞こえを
低減することが可能となっている。
ては、少なくとも最も低域の帯域の直交変換前のブロッ
クを時間的に複数の小ブロックに分けてエネルギを検出
し、そのエネルギに基づいて最も低域の帯域のブロック
を小さくするようにしたことにより、低域でのブロック
内の例えば大レベル信号部に起因したノイズの聞こえを
低減することが可能となっている。
なお、高域では高い時間分解能を得ることができ、ま
た、時間分解能を高くできない低域では高い周波数分解
能を得ることができるようにもなっている。
た、時間分解能を高くできない低域では高い周波数分解
能を得ることができるようにもなっている。
第1図は本発明実施例のディジタルデータの高能率符号
化装置の概略構成を示すブロック回路図、第2図はブロ
ックサイズ可変を説明するための図、第3図は周波数領
域と時間領域の分解能を示す図、第4図は検出回路の具
体的構成を示すブロック回路図、第5図は帯域分解の様
子を示す図、第6図は過渡的変化の存在する高速フーリ
エ変換前のデータを説明するための図、第7図は高速フ
ーリエ変換,逆高速フーリエ変換後のノイズ発生を説明
するための図、第8図はテンポラルマスキングを説明す
るための図である。 41,42……QMF 43〜45……高速フーリエ変換回路 45a……ブロックサイズ可変回路 50……検出回路 58……量子化処理部
化装置の概略構成を示すブロック回路図、第2図はブロ
ックサイズ可変を説明するための図、第3図は周波数領
域と時間領域の分解能を示す図、第4図は検出回路の具
体的構成を示すブロック回路図、第5図は帯域分解の様
子を示す図、第6図は過渡的変化の存在する高速フーリ
エ変換前のデータを説明するための図、第7図は高速フ
ーリエ変換,逆高速フーリエ変換後のノイズ発生を説明
するための図、第8図はテンポラルマスキングを説明す
るための図である。 41,42……QMF 43〜45……高速フーリエ変換回路 45a……ブロックサイズ可変回路 50……検出回路 58……量子化処理部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−201700(JP,A) 特開 昭63−285032(JP,A) 特開 平3−256411(JP,A) 特開 平3−263925(JP,A) 1990年電子情報通信学会春季全国大会 講演論文集[分冊1]基礎・境界第1− 197頁 1990年電子情報通信学会春季全国大会 講演論文集[分冊1]基礎・境界第1− 198頁
Claims (1)
- 【請求項1】入力ディジタルデータを複数の帯域に分割
し、分割された帯域毎に複数のサンプルからなるブロッ
クを形成し、各帯域のブロック毎に直交変換を行い係数
データを得るようにしたディジタルデータの高能率符号
化方法であって、 少なくとも最も低域の帯域の直交変換前のブロックを時
間的に複数の小ブロックに分けて、各小ブロック毎のエ
ネルギを検出し、 上記検出されたエネルギに基づいて、上記最も低域の帯
域のブロックを小さくするようにした ことを特徴とするディジタルデータの高能率符号化方
法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6124990A JP2913735B2 (ja) | 1990-03-14 | 1990-03-14 | ディジタルデータの高能率符号化方法 |
US08/029,988 US5502789A (en) | 1990-03-07 | 1993-03-12 | Apparatus for encoding digital data with reduction of perceptible noise |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6124990A JP2913735B2 (ja) | 1990-03-14 | 1990-03-14 | ディジタルデータの高能率符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03263926A JPH03263926A (ja) | 1991-11-25 |
JP2913735B2 true JP2913735B2 (ja) | 1999-06-28 |
Family
ID=13165773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6124990A Expired - Lifetime JP2913735B2 (ja) | 1990-03-07 | 1990-03-14 | ディジタルデータの高能率符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2913735B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0692881B1 (en) * | 1993-11-09 | 2005-06-15 | Sony Corporation | Quantization apparatus, quantization method, high efficiency encoder, high efficiency encoding method, decoder, high efficiency encoder and recording media |
-
1990
- 1990-03-14 JP JP6124990A patent/JP2913735B2/ja not_active Expired - Lifetime
Non-Patent Citations (2)
Title |
---|
1990年電子情報通信学会春季全国大会講演論文集[分冊1]基礎・境界第1−197頁 |
1990年電子情報通信学会春季全国大会講演論文集[分冊1]基礎・境界第1−198頁 |
Also Published As
Publication number | Publication date |
---|---|
JPH03263926A (ja) | 1991-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2913731B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP3104400B2 (ja) | オーディオ信号符号化装置及び方法 | |
JP3033156B2 (ja) | ディジタル信号符号化装置 | |
JP3134338B2 (ja) | ディジタル音声信号符号化方法 | |
JP4000261B2 (ja) | ステレオ音響信号の処理方法と装置 | |
JP2861238B2 (ja) | ディジタル信号符号化方法 | |
JP3307138B2 (ja) | 信号符号化方法及び装置、並びに信号復号化方法及び装置 | |
JPH0435123A (ja) | ディジタル信号符号化装置 | |
JPH06284095A (ja) | オ−ジオ信号の処理用システム | |
JPH09322299A (ja) | 音像定位制御装置 | |
WO2023005414A1 (zh) | 一种音频信号的编解码方法和装置 | |
JP2827410B2 (ja) | デイジタルデータの高能率符号化方法 | |
CN115348507A (zh) | 脉冲噪声抑制方法、系统、可读存储介质及计算机设备 | |
GB2305831A (en) | Noise suppression using Fourier/Inverse Fourier technique | |
WO2016059878A1 (ja) | 信号処理装置、信号処理方法及びコンピュータプログラム | |
US5651089A (en) | Block size determination according to differences between the peaks of adjacent and non-adjacent blocks in a transform coder | |
JPH08166799A (ja) | 高能率符号化方法及び装置 | |
JP2913735B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP2776300B2 (ja) | 音声信号処理回路 | |
KR100884312B1 (ko) | 음장 재현 장치 및 이를 이용한 음장 재현 방법 | |
US20080199019A1 (en) | Method and System for Reproducing an Audio Signal | |
JP2870050B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP3402483B2 (ja) | オーディオ信号符号化装置 | |
JP2000029498A (ja) | デジタルオーディオ信号のミキシング方法およびミキシング装置 | |
JP3341440B2 (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080416 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090416 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090416 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 11 Free format text: PAYMENT UNTIL: 20100416 |
|
EXPY | Cancellation because of completion of term |