JPH0934494A - 音声信号処理回路 - Google Patents
音声信号処理回路Info
- Publication number
- JPH0934494A JPH0934494A JP7201593A JP20159395A JPH0934494A JP H0934494 A JPH0934494 A JP H0934494A JP 7201593 A JP7201593 A JP 7201593A JP 20159395 A JP20159395 A JP 20159395A JP H0934494 A JPH0934494 A JP H0934494A
- Authority
- JP
- Japan
- Prior art keywords
- mask
- power spectrum
- samples
- frequency
- signal processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
(57)【要約】
【目的】 マスクレベルの演算に必要な計算量を少なく
することができる音声信号処理回路を提供する。 【構成】 第1所定数の入力音声サンプルに高速フーリ
エ変換を施すことにより、第1所定数の2分の1個のパ
ワースペクトルサンプルを出力する高速フーリエ変換回
路12、第1所定数の2分の1個のパワースペクトルサ
ンプルを定められた本数ずつ加算し、第2所定数のパワ
ースペクトルサンプルにサブサンプルするサブサンプリ
ング回路13、第2所定数のパワースペクトルサンプル
毎に一定の単位マスク関数を畳み込んだものをパワース
ペクトルサンプル毎のマスクとし、各々のパワースペク
トルサンプルのマスクを足し合わせることにより、第2
所定数からなるマスクレベルを算出するマスク計算回路
14を備える。
することができる音声信号処理回路を提供する。 【構成】 第1所定数の入力音声サンプルに高速フーリ
エ変換を施すことにより、第1所定数の2分の1個のパ
ワースペクトルサンプルを出力する高速フーリエ変換回
路12、第1所定数の2分の1個のパワースペクトルサ
ンプルを定められた本数ずつ加算し、第2所定数のパワ
ースペクトルサンプルにサブサンプルするサブサンプリ
ング回路13、第2所定数のパワースペクトルサンプル
毎に一定の単位マスク関数を畳み込んだものをパワース
ペクトルサンプル毎のマスクとし、各々のパワースペク
トルサンプルのマスクを足し合わせることにより、第2
所定数からなるマスクレベルを算出するマスク計算回路
14を備える。
Description
【0001】
【産業上の利用分野】本発明は、音声信号処理装置に関
し、特に音声信号を周波数帯域毎に分割して符号化する
サブバンド符号化回路においてマスクレベルを算出する
音声信号処理回路に関する。
し、特に音声信号を周波数帯域毎に分割して符号化する
サブバンド符号化回路においてマスクレベルを算出する
音声信号処理回路に関する。
【0002】
【従来の技術】図6に、ISO/IEC11172−3
(以後、MPEG/Audioと表記する)で用いられ
ている従来の音声信号処理回路の全体の概略構成を示
す。以下、各部の説明をする。FFT回路62は入力音
声サンプル61が1024のサンプル入力されると、高
速フーリエ変換(Fast Fourler Transform)を施して5
12のパワースペクトルサンプルをサンプル出力する。
(以後、MPEG/Audioと表記する)で用いられ
ている従来の音声信号処理回路の全体の概略構成を示
す。以下、各部の説明をする。FFT回路62は入力音
声サンプル61が1024のサンプル入力されると、高
速フーリエ変換(Fast Fourler Transform)を施して5
12のパワースペクトルサンプルをサンプル出力する。
【0003】純音と雑音の分別を行なう分別回路63
は、入力されたパワースペクトルサンプルの中から、極
大となっているもの(隣接した周波数のパワースペクト
ルサンプルよりも大きくなっているパワースペクトルサ
ンプル)を純音成分として取り出し、また、そうでない
ものを雑音成分として取り出すことにより、入力された
スペクトルサンプルを純音成分と雑音成分とに分別す
る。
は、入力されたパワースペクトルサンプルの中から、極
大となっているもの(隣接した周波数のパワースペクト
ルサンプルよりも大きくなっているパワースペクトルサ
ンプル)を純音成分として取り出し、また、そうでない
ものを雑音成分として取り出すことにより、入力された
スペクトルサンプルを純音成分と雑音成分とに分別す
る。
【0004】サブサンプリング回路64は、人間の聴覚
特性が高い周波数ほど周波数分解能力が低いということ
を利用して、高域のスペトクルを決まった本数ずつまと
め、一本のスペクトルにまとめる部分である。まとめら
れるパワースペクトルの本数は、そのパワースペクトル
が純音成分かあるいは雑音成分かによって異なる。
特性が高い周波数ほど周波数分解能力が低いということ
を利用して、高域のスペトクルを決まった本数ずつまと
め、一本のスペクトルにまとめる部分である。まとめら
れるパワースペクトルの本数は、そのパワースペクトル
が純音成分かあるいは雑音成分かによって異なる。
【0005】マスク計算回路65は、サブサンプリング
された純音成分のパワースペクトルサンプルと雑音成分
のパワースペクトルサンプルから、マスクレベルを求め
る部分である。ここで、マスクレベルとは、それ以上小
さい音は人間の耳には聞こえないという音のレベルを示
しており、人間がそのときに聞いている音の周波数分布
により逐次変化する。
された純音成分のパワースペクトルサンプルと雑音成分
のパワースペクトルサンプルから、マスクレベルを求め
る部分である。ここで、マスクレベルとは、それ以上小
さい音は人間の耳には聞こえないという音のレベルを示
しており、人間がそのときに聞いている音の周波数分布
により逐次変化する。
【0006】従来におけるマスクレベルの計算について
図7を参照しながら説明する。人間の聴覚では、音が存
在した場合、つまりスペクトル71が存在した場合、そ
の近傍の周波数の音が聞こえにくくなる。つまり、スペ
クトルに隣接した周波数にマスク72ができる。従来に
おいては、このマスク72の形状(マスクの高さや直線
の傾きなど)は、スペクトルが純音成分かまたは雑音成
分かによって、またスペクトルの大きさによって変化す
る。
図7を参照しながら説明する。人間の聴覚では、音が存
在した場合、つまりスペクトル71が存在した場合、そ
の近傍の周波数の音が聞こえにくくなる。つまり、スペ
クトルに隣接した周波数にマスク72ができる。従来に
おいては、このマスク72の形状(マスクの高さや直線
の傾きなど)は、スペクトルが純音成分かまたは雑音成
分かによって、またスペクトルの大きさによって変化す
る。
【0007】このマスクをサブサンプリングされたパワ
ースペクトル1本1本について計算し、足し合わせる。
マスクの計算には、スペクトルがn本存在する場合、ス
ペクトル1本に対するマスクを求めるのに、nの1乗の
オーダーの計算が必要となる。そして、その計算を、n
本のパワースペクトルのそれぞれについて計算し、かつ
それらを足し合わせるためには、全体としてnの2乗の
オーダーの計算回数が必要となる。
ースペクトル1本1本について計算し、足し合わせる。
マスクの計算には、スペクトルがn本存在する場合、ス
ペクトル1本に対するマスクを求めるのに、nの1乗の
オーダーの計算が必要となる。そして、その計算を、n
本のパワースペクトルのそれぞれについて計算し、かつ
それらを足し合わせるためには、全体としてnの2乗の
オーダーの計算回数が必要となる。
【0008】実時間のMPEG/Audioエンコーダ
では、限られた時間内にこれらの処理を行う必要がある
ので、入力音声によってこのように処理量が大きく変化
してしまうことは非常に都合が悪い。
では、限られた時間内にこれらの処理を行う必要がある
ので、入力音声によってこのように処理量が大きく変化
してしまうことは非常に都合が悪い。
【0009】パワースペクトル数nは任意なので、十分
大きなnに耐え得るように、十分高速の演算装置を用い
なければならないが、演算量がnの2乗に比例して増え
るので、演算装置の規模が非常に大きくなってしまう。
また、nの値が予想以上に大きい入力音声に対しては処
理が間に合わずに破綻し雑音を発生させてしまう。
大きなnに耐え得るように、十分高速の演算装置を用い
なければならないが、演算量がnの2乗に比例して増え
るので、演算装置の規模が非常に大きくなってしまう。
また、nの値が予想以上に大きい入力音声に対しては処
理が間に合わずに破綻し雑音を発生させてしまう。
【0010】
【発明が解決しようとする課題】上述したように従来で
は、マスクの形状が、パワースペクトルが純音成分か雑
音成分か、また、パワースペクトルの大きさによって変
化するため、マスクレベルを求めるのに非常に多くの計
算量を必要とする問題点があった。このため、演算装置
の規模が非常に大きくなってしまう。さらに、入力音声
について、純音成分と雑音成分の分別を行なうことか
ら、演算処理量が入力される音声によって大きく変化
し、このため、入力音声に対しては処理が間に合わずに
破綻し雑音を発生させてしまうという問題点もあった。
は、マスクの形状が、パワースペクトルが純音成分か雑
音成分か、また、パワースペクトルの大きさによって変
化するため、マスクレベルを求めるのに非常に多くの計
算量を必要とする問題点があった。このため、演算装置
の規模が非常に大きくなってしまう。さらに、入力音声
について、純音成分と雑音成分の分別を行なうことか
ら、演算処理量が入力される音声によって大きく変化
し、このため、入力音声に対しては処理が間に合わずに
破綻し雑音を発生させてしまうという問題点もあった。
【0011】本発明は、上記従来の欠点を解決し、マス
クレベルの演算に必要な計算量を少なくすることができ
る音声信号処理回路を提供することを目的とする。ま
た、本発明の他の目的は、パワースペクトルサンプルの
本数が入力音声によって変化せず、このため、パワース
ペクトルサンプルの本数が決めれば、それに適した規模
の演算手段を備えればよく、処理量の増加を想定して大
規模な演算手段を備える必要をなくする音声信号処理回
路を提供することにある。
クレベルの演算に必要な計算量を少なくすることができ
る音声信号処理回路を提供することを目的とする。ま
た、本発明の他の目的は、パワースペクトルサンプルの
本数が入力音声によって変化せず、このため、パワース
ペクトルサンプルの本数が決めれば、それに適した規模
の演算手段を備えればよく、処理量の増加を想定して大
規模な演算手段を備える必要をなくする音声信号処理回
路を提供することにある。
【0012】
【課題を解決するための手段】上記目的を達成する本発
明は、予め量子化された第1所定数の入力音声サンプル
のマスクレベルを算出する音声信号処理回路において、
前記第1所定数の入力音声サンプルに高速フーリエ変換
を施すことにより、前記第1所定数の2分の1個のパワ
ースペクトルサンプルを出力する高速フーリエ変換手段
と、前記第1所定数の2分の1個のパワースペクトルサ
ンプルを定められた本数ずつ加算し、第2所定数のパワ
ースペクトルサンプルにサブサンプルするサブサンプリ
ング手段と、前記第2所定数のパワースペクトルサンプ
ル毎に一定の単位マスク関数を畳み込んだものをパワー
スペクトルサンプル毎のマスクとし、各々の前記パワー
スペクトルサンプルの前記マスクを足し合わせることに
より、前記第2の所定数からなるマスクレベルを算出す
るマスク計算手段とからなる構成としている。
明は、予め量子化された第1所定数の入力音声サンプル
のマスクレベルを算出する音声信号処理回路において、
前記第1所定数の入力音声サンプルに高速フーリエ変換
を施すことにより、前記第1所定数の2分の1個のパワ
ースペクトルサンプルを出力する高速フーリエ変換手段
と、前記第1所定数の2分の1個のパワースペクトルサ
ンプルを定められた本数ずつ加算し、第2所定数のパワ
ースペクトルサンプルにサブサンプルするサブサンプリ
ング手段と、前記第2所定数のパワースペクトルサンプ
ル毎に一定の単位マスク関数を畳み込んだものをパワー
スペクトルサンプル毎のマスクとし、各々の前記パワー
スペクトルサンプルの前記マスクを足し合わせることに
より、前記第2の所定数からなるマスクレベルを算出す
るマスク計算手段とからなる構成としている。
【0013】好ましい態様によれば、周波数f[0]から
f[n-1]のn個の前記パワースペクトルサンプルが存在
する場合、第i番目の前記パワースペクトルサンプルの
大きさをa[i]、周波数をf[i]、マスクの傾きをpとす
ると、周波数fの前記パワースペクトルサンプルに対す
る前記単位マスク関数は、 mi(f)=a[i]*10-p/10 f-fi で表される。
f[n-1]のn個の前記パワースペクトルサンプルが存在
する場合、第i番目の前記パワースペクトルサンプルの
大きさをa[i]、周波数をf[i]、マスクの傾きをpとす
ると、周波数fの前記パワースペクトルサンプルに対す
る前記単位マスク関数は、 mi(f)=a[i]*10-p/10 f-fi で表される。
【0014】さらに他の好ましい態様では、前記マスク
計算手段は、前記各パワースペクトルサンプルの右側の
マスクと、左側のマスクに分けてマスクレベルをそれぞ
れ算出する。また、前記マスク計算手段は、周波数f
[0]からf[n-1]のn個の前記パワースペクトルサンプル
が存在する場合、前記各パワースペクトルサンプルの右
側のマスクと、左側のマスクに分けると共に、前記各パ
ワースペクトルサンプルの右側のマスクについて、周波
数の低い前記パワースペクトルサンプルのマスクから順
にマスクレベルを算出し、前記各パワースペクトルサン
プルの左側のマスクについて、周波数の高い前記パワー
スペクトルサンプルのマスクから順にマスクレベルを算
出する。
計算手段は、前記各パワースペクトルサンプルの右側の
マスクと、左側のマスクに分けてマスクレベルをそれぞ
れ算出する。また、前記マスク計算手段は、周波数f
[0]からf[n-1]のn個の前記パワースペクトルサンプル
が存在する場合、前記各パワースペクトルサンプルの右
側のマスクと、左側のマスクに分けると共に、前記各パ
ワースペクトルサンプルの右側のマスクについて、周波
数の低い前記パワースペクトルサンプルのマスクから順
にマスクレベルを算出し、前記各パワースペクトルサン
プルの左側のマスクについて、周波数の高い前記パワー
スペクトルサンプルのマスクから順にマスクレベルを算
出する。
【0015】さらに、他の好ましい態様では、周波数f
[0]からf[n-1]のn個の前記パワースペクトルサンプル
が存在する場合、第i番目の前記パワースペクトルサン
プルの大きさをa[i]、周波数をf[i]、右側のマスクの
傾きを−q、左側のマスクの傾きをpとすると、周波数
f[i]の前記パワースペクトルサンプルの右側のマスク
は、mr[i]=a[i]+10-q/(f[i]-f[i1)*mr[i1]で
算出さされ、周波数f[i]の前記パワースペクトルサン
プルの左側のマスクは、ml[i]=10-p/(f[i+1]-f[i)
*(a[i+1]+ml[i+1])で算出される。
[0]からf[n-1]のn個の前記パワースペクトルサンプル
が存在する場合、第i番目の前記パワースペクトルサン
プルの大きさをa[i]、周波数をf[i]、右側のマスクの
傾きを−q、左側のマスクの傾きをpとすると、周波数
f[i]の前記パワースペクトルサンプルの右側のマスク
は、mr[i]=a[i]+10-q/(f[i]-f[i1)*mr[i1]で
算出さされ、周波数f[i]の前記パワースペクトルサン
プルの左側のマスクは、ml[i]=10-p/(f[i+1]-f[i)
*(a[i+1]+ml[i+1])で算出される。
【0016】
【実施例】以下、本発明の実施例について図面を参照し
て詳細に説明する。図1は、本発明の一実施例による音
声信号処理回路の構成を示すブロック図である。以下、
図1を参照して、各構成要素を説明する。本実施例の音
声信号処理回路は、FFT回路12、サブサンプリング
回路13、マスク計算回路14で構成される。
て詳細に説明する。図1は、本発明の一実施例による音
声信号処理回路の構成を示すブロック図である。以下、
図1を参照して、各構成要素を説明する。本実施例の音
声信号処理回路は、FFT回路12、サブサンプリング
回路13、マスク計算回路14で構成される。
【0017】FFT回路12は、1024の入力音声サ
ンプル11が入力されると、高速フーリエ変換を施し5
12のパワースペクトルサンプルをサンプル出力する。
入力音声サンプル11及びFFT回路12は、図6の従
来の回路と同じである。本発明では、従来のような純音
と雑音との分別は行わない。これにより、従来例の問題
点であった、入力される音声によって処理量が変化する
といった問題がなくなる。
ンプル11が入力されると、高速フーリエ変換を施し5
12のパワースペクトルサンプルをサンプル出力する。
入力音声サンプル11及びFFT回路12は、図6の従
来の回路と同じである。本発明では、従来のような純音
と雑音との分別は行わない。これにより、従来例の問題
点であった、入力される音声によって処理量が変化する
といった問題がなくなる。
【0018】サブサンプリング回路13は、FFT回路
12により計算された512サンプルのスペクトルサン
プルを高い周波数ほど周波数分解能力が低いという人間
の聴覚特性に従い、周波数の高域のスペクトルを決まっ
た本数ずつまとめ、一本のスペクトルにまとめる。
12により計算された512サンプルのスペクトルサン
プルを高い周波数ほど周波数分解能力が低いという人間
の聴覚特性に従い、周波数の高域のスペクトルを決まっ
た本数ずつまとめ、一本のスペクトルにまとめる。
【0019】マスク計算回路14は、サブサンプリング
回路13によりサブサンプルされたスペクトルサンプル
を用いて、それ以上小さい音は人間の耳には聞こえない
という音のレベルを示すマスク15を計算する。
回路13によりサブサンプルされたスペクトルサンプル
を用いて、それ以上小さい音は人間の耳には聞こえない
という音のレベルを示すマスク15を計算する。
【0020】このマスク15を計算するマスク計算回路
14の計算処理について、図2、図3、図4、図5を参
照して詳しく説明する。図2に、周波数f[i]に大きさ
がa[i]のパワースペクトル22が存在した場合のマス
ク21を示す。従来においては、マスクの形状は、パワ
ーススペクトルが純音成分であるか雑音成分であるかに
より、またはパワースペクトルの大きさにより形状を変
化させたが、本発明では、マスクの形状を全てのパワー
スペクトルについて同じ形状とする。
14の計算処理について、図2、図3、図4、図5を参
照して詳しく説明する。図2に、周波数f[i]に大きさ
がa[i]のパワースペクトル22が存在した場合のマス
ク21を示す。従来においては、マスクの形状は、パワ
ーススペクトルが純音成分であるか雑音成分であるかに
より、またはパワースペクトルの大きさにより形状を変
化させたが、本発明では、マスクの形状を全てのパワー
スペクトルについて同じ形状とする。
【0021】図2において、グラフの横軸が周波数軸
で、縦軸がマスクレベルである。グラフ中の縦軸の単位
はデシベルである。ここで、パワースペクトル22の値
A[i]は、以下の式で表される。
で、縦軸がマスクレベルである。グラフ中の縦軸の単位
はデシベルである。ここで、パワースペクトル22の値
A[i]は、以下の式で表される。
【0022】A[i]=10log10a[i]
【0023】このマスクの左側のマスク23の傾きを
p、右側のマスク24の傾きを−qとすると、マスクの
大きさm[i](f)は、以下のように求めることができ
る(デシベル表示ではなく実値による表現)。
p、右側のマスク24の傾きを−qとすると、マスクの
大きさm[i](f)は、以下のように求めることができ
る(デシベル表示ではなく実値による表現)。
【0024】 m[i](f)=a[i]*10-p/(f-f[i]) (f<f[i])
【0025】 m[i](f)=a[i] (f=f[i])
【0026】 m[i](f)=a[i]*10-q/(f-f[i]) (f>f[i])
【0027】このマスクm[i](f)を図3のように各
周波数の各パワースペクトルについて求めて足し合わせ
る(加算)ことにより、図3に示すようなマスクの加算
結果が得られる。
周波数の各パワースペクトルについて求めて足し合わせ
る(加算)ことにより、図3に示すようなマスクの加算
結果が得られる。
【0028】以下、マスク計算回路14によるマスクの
加算処理について図4と図5を用いて説明する。図3で
は、パワースペクトルがn個の周波数f[0]、f
[1]、・・・f[n]上に存在する。
加算処理について図4と図5を用いて説明する。図3で
は、パワースペクトルがn個の周波数f[0]、f
[1]、・・・f[n]上に存在する。
【0029】加算処理においては、図4、図5に示すよ
うに、マスクを図2の右側の部分(f≧f[i])と左側
の部分(f<f[i])にそれぞれ分けることによって加
算を行なう。
うに、マスクを図2の右側の部分(f≧f[i])と左側
の部分(f<f[i])にそれぞれ分けることによって加
算を行なう。
【0030】まず、マスクの右側の加算について説明す
る。周波数f[i]における加算されたマスクをmr[i]と
すると、このmr[i]を周波数の低い点から、つまりf
[0]から順番に計算する。
る。周波数f[i]における加算されたマスクをmr[i]と
すると、このmr[i]を周波数の低い点から、つまりf
[0]から順番に計算する。
【0031】周波数f[0]でのマスクmr[0]は、周波数
f[0]でのパワースペクトルによるマスクだけであるの
で、以下のように求まる。
f[0]でのパワースペクトルによるマスクだけであるの
で、以下のように求まる。
【0032】mr[0]=a[0]
【0033】周波数f[1]でのマスクマスクmr[1]は、
周波数f[1]でのパワースペクトルによるマスクと、f
[1]よりも低い周波数、つまり周波数f[0]でのパワース
ペクトルによるマスクとの加算となり、以下のように求
まる。
周波数f[1]でのパワースペクトルによるマスクと、f
[1]よりも低い周波数、つまり周波数f[0]でのパワース
ペクトルによるマスクとの加算となり、以下のように求
まる。
【0034】 mr[1]=a[1]+a[0]*10-q/(f[1]-f[0])
【0035】周波数f[2]でのマスクマスクマスクmr
[2]は、周波数f[2]でのパワースペクトルによるマスク
と、f[2]よりも低い周波数、つまり周波数f[1]でのパ
ワースペクトル及び周波数f[0]でのパワースペクトル
によるマスクとの加算となり、以下のように求まる。
[2]は、周波数f[2]でのパワースペクトルによるマスク
と、f[2]よりも低い周波数、つまり周波数f[1]でのパ
ワースペクトル及び周波数f[0]でのパワースペクトル
によるマスクとの加算となり、以下のように求まる。
【0036】 mr[2]=a[2]+a[1]*10-q/(f[2]-f[1])+a[0]*10-q/(f[2]-f[0]) =a[2]+10-q/(f[2]-f[1])*{a[1]+a[0]*10-q/(f[1]-f[0])} =a[2]+10-q/(f[2]-f[1])*mr[1]
【0037】従って、周波数f[i]でのマスクmr[i]
は、以下のように求める。
は、以下のように求める。
【0038】 mr[i]=a[i]+10-q/(f[i]-f[i1])*mr[i1]
【0039】この計算は、10-q(f[i]-f[i1])の部分を
予め計算して、テーブルとして用意しておけば、積和演
算(和と積だが、隣接する周波数での計算を組み合わせ
れば積和演算となる)1回で済む。つまり、n本のパワ
ースペクトルが存在する場合、これらのパワースペクト
ルのマスクの右側の部分の加算において、1つの周波数
点につき積和演算1回で計算することがで、従って、n
点の周波数について計算するにはn回の積和演算を行え
ばよいことになる。
予め計算して、テーブルとして用意しておけば、積和演
算(和と積だが、隣接する周波数での計算を組み合わせ
れば積和演算となる)1回で済む。つまり、n本のパワ
ースペクトルが存在する場合、これらのパワースペクト
ルのマスクの右側の部分の加算において、1つの周波数
点につき積和演算1回で計算することがで、従って、n
点の周波数について計算するにはn回の積和演算を行え
ばよいことになる。
【0040】次に、マスクの左側の加算について説明す
る。マスクの左側の加算は、右側の加算処理とほとんど
同じで、周波数f[i]において加算されたマスクをml
[i]とすると、このマスクml[i]を周波数の高い方か
ら、つまりf[n一1]から順番に計算する。
る。マスクの左側の加算は、右側の加算処理とほとんど
同じで、周波数f[i]において加算されたマスクをml
[i]とすると、このマスクml[i]を周波数の高い方か
ら、つまりf[n一1]から順番に計算する。
【0041】周波数f[n-1]でのマスクml[n-1]は、周
波数f[n-1]より高い周波数にパワースペクトルが存在
しないので、以下のように求まる。
波数f[n-1]より高い周波数にパワースペクトルが存在
しないので、以下のように求まる。
【0042】ml[n-1]=0
【0043】周波数f[n-2]でのマスクml[n-2]は、周
波数f[n-2]よりも高い周波数でのパワースペクトルに
よるマスクの加算であるから、以下のように求まる。
波数f[n-2]よりも高い周波数でのパワースペクトルに
よるマスクの加算であるから、以下のように求まる。
【0044】ml[n2]=10-p/(f[n1]-f[n2])
【0045】周波数f[n-3]でのマスクml[n-3]は、周
波数f[n-3]よりも高い周波数でのパワースペクトルに
よるマスクの加算であるから、以下のように求まる。
波数f[n-3]よりも高い周波数でのパワースペクトルに
よるマスクの加算であるから、以下のように求まる。
【0046】 ml[n3] =a[n-2]*10-p/(f[n2]-f[n3])+a[n-1]*10-p/(f[n1]-f[n3]) =10-p/(f[n2]-f[n3])*{a[n-2]+a[n-1]*10-p/(f[n1]-f[n3])} =10-p/(f[n2]-f[n3])*(a[n-2]+ml[n2])
【0047】従って、周波数f[i]でのマスクml[i]
は、以下のように求められる。
は、以下のように求められる。
【0048】ml[i]=10-p/(f[i+1]-f[i])*(a[i+
1]+ml[i+1])
1]+ml[i+1])
【0049】この計算についても、10
-p/(f[i+1]-f[i])を予め計算して、テーブルとして用意
しておけば、積和演算(和と積だが、隣接する周波数で
の計算を組み合わせれば積和演算となる)1回で済み、
n点の周波数について計算するにはn回の積和演算を行
えばよいことになる。
-p/(f[i+1]-f[i])を予め計算して、テーブルとして用意
しておけば、積和演算(和と積だが、隣接する周波数で
の計算を組み合わせれば積和演算となる)1回で済み、
n点の周波数について計算するにはn回の積和演算を行
えばよいことになる。
【0050】周波数f[i]におけるマスクの和mt[i]
は、周波数f[i]におけるマスクの右側の部分の和mr
[i]とマスクの左側の部分の和ml[i]とを加算すればよ
い。従って、n点の周波数のマスクの和を求めるには、
n回の加算処理を行えばよいことになる。
は、周波数f[i]におけるマスクの右側の部分の和mr
[i]とマスクの左側の部分の和ml[i]とを加算すればよ
い。従って、n点の周波数のマスクの和を求めるには、
n回の加算処理を行えばよいことになる。
【0051】従って、n本のパワーススペクトルサンプ
ルから、n点の周波数でのパワースペクトルサンプルに
ついて1つ1つのマスクの和を求めるのに必要な演算量
は、積和演算2n回、加算n回となる。
ルから、n点の周波数でのパワースペクトルサンプルに
ついて1つ1つのマスクの和を求めるのに必要な演算量
は、積和演算2n回、加算n回となる。
【0052】nの増加に対して、演算量はそれに比例し
て増えるだけであり、従来のようにnの二乗オーダで急
激に増えることはない。また、従来においては、nの値
が入力音声によって変化したが、本実施例では変化しな
い。従って、nの値が決まれば、それに適した規模のマ
スク計算回路を備えればよく、従来のようにnの値が予
想以上に大きくなることを想定して、それに合わせた演
算能力を有する計算回路を備える必要はない。また、従
来のように、入力音声によって処理量が極端に増加し処
理が破綻して雑音を発生することもない。
て増えるだけであり、従来のようにnの二乗オーダで急
激に増えることはない。また、従来においては、nの値
が入力音声によって変化したが、本実施例では変化しな
い。従って、nの値が決まれば、それに適した規模のマ
スク計算回路を備えればよく、従来のようにnの値が予
想以上に大きくなることを想定して、それに合わせた演
算能力を有する計算回路を備える必要はない。また、従
来のように、入力音声によって処理量が極端に増加し処
理が破綻して雑音を発生することもない。
【0053】なお、マスクの形状を全てのパワースペク
トルについて従来よりも単純な一定の形状(パワースペ
クトルの右側マスクの傾き−qと左側マスクの傾きpが
一定)にしたことにより、エンコード音の劣化が考えら
れるが、サブサンプリング処理においてパワースペクト
ルサンプルを一定の個数ずつまとめてパワースペクトル
サンプルの個数を減す場合に、1個にまとめるパワース
ペクトルサンプルの数を減らせば、周波数分解能が増加
するので、エンコード音の劣化を低く抑えることができ
る。
トルについて従来よりも単純な一定の形状(パワースペ
クトルの右側マスクの傾き−qと左側マスクの傾きpが
一定)にしたことにより、エンコード音の劣化が考えら
れるが、サブサンプリング処理においてパワースペクト
ルサンプルを一定の個数ずつまとめてパワースペクトル
サンプルの個数を減す場合に、1個にまとめるパワース
ペクトルサンプルの数を減らせば、周波数分解能が増加
するので、エンコード音の劣化を低く抑えることができ
る。
【0054】本発明の音声信号処理回路によってエンコ
ードした結果と、従来の音声信号処理回路によってエン
コードした結果とを、それぞれデコーダに入力して復号
し、オーディオシステムに入力して試聴した聴感評価で
は、一般的な聴感をもつ被験者3人がほとんど差を判別
することができなかった。この結果から、音質を劣化さ
せずに演算量を削減することができるという本発明の有
効性を確認することができであろう。
ードした結果と、従来の音声信号処理回路によってエン
コードした結果とを、それぞれデコーダに入力して復号
し、オーディオシステムに入力して試聴した聴感評価で
は、一般的な聴感をもつ被験者3人がほとんど差を判別
することができなかった。この結果から、音質を劣化さ
せずに演算量を削減することができるという本発明の有
効性を確認することができであろう。
【0055】
【発明の効果】以上説明したように本発明によれば、所
定数のパワースペクトルサンプル毎に一定の単位マスク
関数を畳み込んだものをパワースペクトルサンプル毎の
マスクとし、各々のパワースペクトルサンプルのマスク
を足し合わせることによりマスクレベルを算出するた
め、マスクレベルの演算に必要な計算量を少なくするこ
とができる。
定数のパワースペクトルサンプル毎に一定の単位マスク
関数を畳み込んだものをパワースペクトルサンプル毎の
マスクとし、各々のパワースペクトルサンプルのマスク
を足し合わせることによりマスクレベルを算出するた
め、マスクレベルの演算に必要な計算量を少なくするこ
とができる。
【0056】また、パワースペクトルサンプルの本数が
入力音声によって変化せず、このため、パワースペクト
ルサンプルの本数が決めれば、それに適した規模の演算
手段を備えればよく、処理量の増加を想定して大規模な
演算手段を備える必要をなくすることができる。
入力音声によって変化せず、このため、パワースペクト
ルサンプルの本数が決めれば、それに適した規模の演算
手段を備えればよく、処理量の増加を想定して大規模な
演算手段を備える必要をなくすることができる。
【図1】 本発明の一実施例による音声信号処理回路の
基本構成を示すブロック図である。
基本構成を示すブロック図である。
【図2】 本実施例の音声信号処理回路において用いる
マスクの形状を説明するための図である。
マスクの形状を説明するための図である。
【図3】 本実施例の音声信号処理回路におけるマスク
の加算処理を説明するための図である。
の加算処理を説明するための図である。
【図4】 パワースペクトルの右側のマスクの加算処理
を説明するための図である。
を説明するための図である。
【図5】 パワースペクトルの左側のマスクの加算処理
を説明するための図である。
を説明するための図である。
【図6】 従来の音声信号処理回路の基本構成を示すブ
ロック図である。
ロック図である。
【図7】 従来の音声信号処理回路で用いられるマスク
の形状を説明するための図である。
の形状を説明するための図である。
11 入力音声サンプル 12 FFT回路 13 サブサンプリング回路 14 マスク計算回路 21 マスク 22 パワースペクトル 23 左側のマスク 24 右側のマスク
Claims (5)
- 【請求項1】 予め量子化された第1所定数の入力音声
サンプルのマスクレベルを算出する音声信号処理回路に
おいて、 前記第1所定数の入力音声サンプルに高速フーリエ変換
を施すことにより、前記第1所定数の2分の1個のパワ
ースペクトルサンプルを出力する高速フーリエ変換手段
と、 前記第1所定数の2分の1個のパワースペクトルサンプ
ルを定められた本数ずつ加算し、第2所定数のパワース
ペクトルサンプルにサブサンプルするサブサンプリング
手段と、 前記第2所定数のパワースペクトルサンプル毎に一定の
単位マスク関数を畳み込んだものをパワースペクトルサ
ンプル毎のマスクとし、各々の前記パワースペクトルサ
ンプルの前記マスクを足し合わせることにより、前記第
2の所定数からなるマスクレベルを算出するマスク計算
手段とからなることを特徴とする音声信号処理回路。 - 【請求項2】 周波数f[0]からf[n-1]のn個の前記パ
ワースペクトルサンプルが存在する場合、第i番目の前
記パワースペクトルサンプルの大きさをa[i]、周波数
をf[i]、マスクの傾きをpとすると、周波数fの前記
パワースペクトルサンプルに対する前記単位マスク関数
は、 mi(f)=a[i]*10-p/10 f-fi で表されることを特徴とする請求項1に記載の音声信号
処理回路。 - 【請求項3】 前記マスク計算手段は、前記各パワース
ペクトルサンプルの右側のマスクと、左側のマスクに分
けてマスクレベルをそれぞれ算出することを特徴とする
請求項1に記載の音声信号処理回路。 - 【請求項4】 前記マスク計算手段は、周波数f[0]か
らf[n-1]のn個の前記パワースペクトルサンプルが存
在する場合、前記各パワースペクトルサンプルの右側の
マスクと、左側のマスクに分けると共に、 前記各パワースペクトルサンプルの右側のマスクについ
て、周波数の低い前記パワースペクトルサンプルのマス
クから順にマスクレベルを算出し、前記各パワースペク
トルサンプルの左側のマスクについて、周波数の高い前
記パワースペクトルサンプルのマスクから順にマスクレ
ベルを算出することを特徴とする請求項1に記載の音声
信号処理回路。 - 【請求項5】 周波数f[0]からf[n-1]のn個の前記パ
ワースペクトルサンプルが存在する場合、第i番目の前
記パワースペクトルサンプルの大きさをa[i]、周波数
をf[i]、右側のマスクの傾きを−q、左側のマスクの
傾きをpとすると、 周波数f[i]の前記パワースペクトルサンプルの右側の
マスクは、 mr[i]=a[i]+10-q/(f[i]-f[i1)*mr[i1]で算出
さされ、 周波数f[i]の前記パワースペクトルサンプルの左側の
マスクは、 ml[i]=10-p/(f[i+1]-f[i)*(a[i+1]+ml[i+
1])で算出されることを特徴とする請求項4に記載の音
声信号処理回路。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07201593A JP3082625B2 (ja) | 1995-07-15 | 1995-07-15 | 音声信号処理回路 |
US08/679,578 US5890107A (en) | 1995-07-15 | 1996-07-15 | Sound signal processing circuit which independently calculates left and right mask levels of sub-band sound samples |
DE19628503A DE19628503A1 (de) | 1995-07-15 | 1996-07-15 | Audiosignal-Verarbeitungsschaltung zur Berechnung eines Maskenpegels von quantisierten Audiosignalwerten |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07201593A JP3082625B2 (ja) | 1995-07-15 | 1995-07-15 | 音声信号処理回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0934494A true JPH0934494A (ja) | 1997-02-07 |
JP3082625B2 JP3082625B2 (ja) | 2000-08-28 |
Family
ID=16443633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07201593A Expired - Fee Related JP3082625B2 (ja) | 1995-07-15 | 1995-07-15 | 音声信号処理回路 |
Country Status (3)
Country | Link |
---|---|
US (1) | US5890107A (ja) |
JP (1) | JP3082625B2 (ja) |
DE (1) | DE19628503A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014700A (ja) * | 2000-06-30 | 2002-01-18 | Canon Inc | 音声信号処理方法、装置および記憶媒体 |
JP2008052117A (ja) * | 2006-08-25 | 2008-03-06 | Oki Electric Ind Co Ltd | 雑音除去装置、方法及びプログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003276754A1 (en) * | 2002-11-07 | 2004-06-07 | Samsung Electronics Co., Ltd. | Mpeg audio encoding method and apparatus |
KR100477701B1 (ko) * | 2002-11-07 | 2005-03-18 | 삼성전자주식회사 | Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치 |
US7720013B1 (en) * | 2004-10-12 | 2010-05-18 | Lockheed Martin Corporation | Method and system for classifying digital traffic |
JP5159279B2 (ja) * | 2007-12-03 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそれを用いた音声合成装置。 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06334533A (ja) * | 1993-05-25 | 1994-12-02 | Sony Corp | 信号変換方法又は装置、並びに記録媒体 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03117919A (ja) * | 1989-09-30 | 1991-05-20 | Sony Corp | ディジタル信号符号化装置 |
JP3084721B2 (ja) * | 1990-02-23 | 2000-09-04 | ソニー株式会社 | 雑音除去回路 |
JP2861238B2 (ja) * | 1990-04-20 | 1999-02-24 | ソニー株式会社 | ディジタル信号符号化方法 |
JP2751564B2 (ja) * | 1990-05-25 | 1998-05-18 | ソニー株式会社 | ディジタル信号符号化装置 |
US5687281A (en) * | 1990-10-23 | 1997-11-11 | Koninklijke Ptt Nederland N.V. | Bark amplitude component coder for a sampled analog signal and decoder for the coded signal |
DK0531538T3 (da) * | 1991-03-29 | 1998-10-19 | Sony Corp | Fremgangsmåde til indkodning af digitale signaler |
JP3089691B2 (ja) * | 1991-03-29 | 2000-09-18 | ソニー株式会社 | ディジタルデータの高能率符号化方法 |
JP3134338B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル音声信号符号化方法 |
JP3446216B2 (ja) * | 1992-03-06 | 2003-09-16 | ソニー株式会社 | 音声信号処理方法 |
JP3278900B2 (ja) * | 1992-05-07 | 2002-04-30 | ソニー株式会社 | データ符号化装置及び方法 |
GB9213459D0 (en) * | 1992-06-24 | 1992-08-05 | British Telecomm | Characterisation of communications systems using a speech-like test stimulus |
TW232116B (en) * | 1993-04-14 | 1994-10-11 | Sony Corp | Method or device and recording media for signal conversion |
US5632003A (en) * | 1993-07-16 | 1997-05-20 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for coding method and apparatus |
KR100269213B1 (ko) * | 1993-10-30 | 2000-10-16 | 윤종용 | 오디오신호의부호화방법 |
US5508949A (en) * | 1993-12-29 | 1996-04-16 | Hewlett-Packard Company | Fast subband filtering in digital signal coding |
KR970005131B1 (ko) * | 1994-01-18 | 1997-04-12 | 대우전자 주식회사 | 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치 |
US5625743A (en) * | 1994-10-07 | 1997-04-29 | Motorola, Inc. | Determining a masking level for a subband in a subband audio encoder |
US5654952A (en) * | 1994-10-28 | 1997-08-05 | Sony Corporation | Digital signal encoding method and apparatus and recording medium |
BR9506449A (pt) * | 1994-11-04 | 1997-09-02 | Philips Electronics Nv | Aparelhos para codificar um sinal de informação digital de banda larga e para decodificar um sinal digital codificado e processo de codificar um sinal de informação digital de banda larga |
-
1995
- 1995-07-15 JP JP07201593A patent/JP3082625B2/ja not_active Expired - Fee Related
-
1996
- 1996-07-15 US US08/679,578 patent/US5890107A/en not_active Expired - Fee Related
- 1996-07-15 DE DE19628503A patent/DE19628503A1/de not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06334533A (ja) * | 1993-05-25 | 1994-12-02 | Sony Corp | 信号変換方法又は装置、並びに記録媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002014700A (ja) * | 2000-06-30 | 2002-01-18 | Canon Inc | 音声信号処理方法、装置および記憶媒体 |
JP2008052117A (ja) * | 2006-08-25 | 2008-03-06 | Oki Electric Ind Co Ltd | 雑音除去装置、方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US5890107A (en) | 1999-03-30 |
DE19628503A1 (de) | 1997-02-20 |
JP3082625B2 (ja) | 2000-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8843378B2 (en) | Multi-channel synthesizer and method for generating a multi-channel output signal | |
JP4714416B2 (ja) | 空間的オーディオのパラメータ表示 | |
EP3739752B1 (en) | Filter system comprising a filter converter and a filter compressor and method for operating the filter system | |
Viswanathan et al. | Quantization properties of transmission parameters in linear predictive systems | |
US7487097B2 (en) | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods | |
EP1738356B1 (en) | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing | |
US9609451B2 (en) | Multi-rate system for audio processing | |
KR20120063514A (ko) | 오디오 신호를 처리하기 위한 방법 및 장치 | |
EP1971979A1 (en) | Decoding of binaural audio signals | |
KR20080033909A (ko) | 오디오 디코더 | |
WO2007080225A1 (en) | Decoding of binaural audio signals | |
US6430529B1 (en) | System and method for efficient time-domain aliasing cancellation | |
US20020173969A1 (en) | Method for decompressing a compressed audio signal | |
JP3082625B2 (ja) | 音声信号処理回路 | |
JP2776300B2 (ja) | 音声信号処理回路 | |
US10524052B2 (en) | Dominant sub-band determination | |
EP2755205B1 (en) | Sub-band processing complexity reduction | |
US20200090637A1 (en) | Method and system for implementing a modal processor | |
JP2001083995A (ja) | サブバンド符号化・復号方法 | |
EP0707761B1 (en) | Arrangement for determining a signal spectrum of a wideband digital signal and for deriving bit allocation information in response thereto | |
Ho et al. | ConSep: a Noise-and Reverberation-Robust Speech Separation Framework by Magnitude Conditioning | |
JP3033158B2 (ja) | デイジタル信号符号化装置 | |
CN113038349A (zh) | 一种音频设备 | |
JPH1130995A (ja) | 復号化方法および装置 | |
Alku et al. | Linear predictive method with low-frequency emphasis. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |