JP2007251676A - 音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体 - Google Patents

音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2007251676A
JP2007251676A JP2006073434A JP2006073434A JP2007251676A JP 2007251676 A JP2007251676 A JP 2007251676A JP 2006073434 A JP2006073434 A JP 2006073434A JP 2006073434 A JP2006073434 A JP 2006073434A JP 2007251676 A JP2007251676 A JP 2007251676A
Authority
JP
Japan
Prior art keywords
amplitude
determination
group
signal
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006073434A
Other languages
English (en)
Other versions
JP4206409B2 (ja
Inventor
Suehiro Shimauchi
末廣 島内
Akira Emura
暁 江村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006073434A priority Critical patent/JP4206409B2/ja
Publication of JP2007251676A publication Critical patent/JP2007251676A/ja
Application granted granted Critical
Publication of JP4206409B2 publication Critical patent/JP4206409B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

【課題】入力信号の性質の変化に対応して、抑圧・強調して、反応速度の向上を図る。
【解決手段】入力信号をフレームごとに離散周波数領域信号x(ωn)に変換し、少なくとも1つもしくは複数のこれらの信号を含むように複数のグループに分割し、フレーム内の入力信号の電力総和の平方根AXを求め、上記グループごとに、そのグループ内の信号の振幅平均AHmを求め、第1の目標振幅TXとAXとの大小を比較し、AXの方が大きい場合、第1の規格化平均値AHm・TX/AXを求め、各グループごとに、規格化平均値とそのグループの各信号の振幅|x(ωn)|の大小を比較し、|x(ωn)|の方が大であれば、その振幅に対し、第1の圧縮関数を適用して、TXに近づくように抑圧して、出力し、|x(ωn)|の方が大でなければ、そのまま出力し、出力された信号の全体を時間領域信号に変換する。
【選択図】図1

Description

この発明はディジタル化された入力信号のダイナミックレンジを所望の範囲に圧縮する音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体に関する。
通信会議や補聴器システムなどにおいて、スピーカなどに対する再生ボリューム(音声調整量)を一定に保ったままでも、再生される音声内容が容易に理解できるようにするために、再生すべき音声信号を入力信号とし、その入力信号のダイナミックレンジを圧縮し、一定の音量範囲に納まるように処理して出力することにより、スピーカなどで再生させる音声処理方法がある。
例えば、従来、リミッタやコンプレッサと呼ばれる手法では、予め定義された非線形圧縮関数に基づき、一定の大きさ以上の音声信号を入力すると、その大きさが強制的に抑圧された信号を出力する。これらの技術は、抑圧量が大きくなるに従い、音声の聴感上の歪みが増大する問題がある。「非特許文献1」に示されるように、信号を複数の周波数帯域に分割または、変換し、それぞれの周波数帯域ごとに異なる圧縮関数を適用すれば、上記の歪みの問題を低減できることが期待される。「非特許文献1」に示される手法では、周波数帯域ごとに予め与えられた固定の圧縮関数を持つが、それら圧縮関数には、各周波数帯域に変換された入力信号そのものではなく、それら各離散周波数領域信号の振幅の時間平均値などが入力として与えられる。これより得られる圧縮された振幅の平均時間値と、圧縮関数適用前の振幅の時間平均値の比を、各周波数帯域ごとに計算し、これらの比を各離散周波数領域信号に乗じることで、各周波数帯域における圧縮処理を完了させる。これら各周波数帯域ごとに圧縮処理された信号は、周波数合成処理を施され、最終的な出力信号となる。
T.Schneider and R.Brennan,"A multichannel compression atrategy for a digital hearing aid",1997 IEEE International Conference on Acoustics,Speech,and Signal Processing(ICASSP−97),vol.1,pp.411−414,April 1997
「非特許文献1」に示される手法は、周波数帯域を細かく分割・変換するほど、よりきめの細かい品質の高い処理の実現が期待される反面、各離散周波数領域信号と元の入力信号の振幅の相関関係が複雑となり、各周波数帯域ごとに固定的に与えられる圧縮関数では、信号の性質の変化に柔軟に対応できず、ある性質の信号を入力した場合、品質高く圧縮できるが、他の性質の信号を入力した場合では、必ずしも、同等な品質で圧縮できないなどの問題が生じる。ここで、信号の性質の違いとは、例えば、音声の母音部分など周期性の高い信号と1音声の子音部分など、周波数成分が広範囲に分布する信号の違いなどを含む。
また、各周波数帯域の圧縮関数の入力として、離散周波数領域信号の振幅の時間平均値が適用されるため、時間平均に必要な時定数に応じて、反応速度の遅れが生じる問題がある。
離散時間の入力信号をフレームごとに離散周波数領域信号に変換し、上記離散周波数領域信号を、少なくとも1つのグループは複数の離散周波数領域信号を含むように複数のグループに分割し、上記フレーム内の入力信号の電力総和の平方根を求め、上記各分割されたグループごとに、そのグループ内の離散周波数領域信号の振幅平均を求め、圧縮処理後の期待される所望の第1の目標振幅と上記電力総和の平方根との値の大小を比較する第1の判定をし、上記第1の判定により上記電力総和の平方根の方が大であることを示す信号が入力された場合、上記第1の目標振幅と上記電力総和の平方根との比で、グループごとの振幅平均値を正規化して、第1の規格化平均値を求め、各グループごとに、上記第1の規格化平均値とそのグループの各上記離散周波数領域信号の振幅の大小を比較する第2の判定をし、上記第2の判定が、上記離散周波数領域信号の振幅の方が大であれば、その振幅に対し、出力信号が上記第1の目標振幅に近づくように抑圧する第1の圧縮関数を第1圧縮関数演算部で適用し、上記第2の判定部の判定が、上記離散周波数領域信号の振幅の方が大でなければ、その離散周波数領域信号をそのまま出力し、各グループごとに出力された離散周波数領域信号の全体を時間領域信号に変換する。
以上の構成によれば、入力信号が離散周波数領域信号に変換することにより、反応速度の向上を図ることが出来、また離散周波数領域信号をグループごとに分割し、そのグループごとの当該信号の性質に応じた圧縮関数により抑圧または強調することにより、安定したダイナミックレンジの圧縮が可能となる。
実施例1
図1にこの発明の実施例1を示す。入力信号x(t)が周波数領域変換部2に入力されると、定時間(フレーム)、例えば入力信号x(t)のサンプリング周波数が16kHzの場合、サンプル数が256や512ごとに、短時間フーリエ変換(FFT)などにより、ω1〜ωNまでのN個の周波数に対応するN個の離散周波数領域信号、x(ω1)、...、x(ωN)に変換される。ただし、入力信号は一定周期でサンプリングされ、各サンプルがディジタル値に変換されたディジタル信号であり、Nは整数とする。N個の離散周波数領域信号x(ω1)、...、x(ωN)は電力総和平方根計算部4とグループ帯域分割部6に入力される。
グループ帯域分割部6で、離散周波数領域信号は周波数番号1〜Nについて順に、M個のグループに分割される。ただし、MはNより小さく、1以上の整数とする。グループの分割の方法については、例えば、周波数について等分割するか、もしくは、低い周波数グループは比較的細かく、高い周波数領域は比較的粗く分割するなどの方法が考えられる。また、1つのグループに1つの離散周波数領域信号のみ含まれるグループが存在しても良いが、2つ以上の離散周波数領域信号を含むグループが最低1つは存在するものとする。例えば、1kHzごとに等分割する。離散周波数領域信号x(ω1)、...、x(ωN)は各分割グループごとに、グループ振幅平均計算部8m、第1の圧縮関数制御部10m、第1の圧縮関数適用部12mに入力される。ただしmは1〜Mまでの整数とする。
一方、電力総和平方根計算部4で、x(ω1)、...、x(ωN)の電力の総和の平方根AXを算出し、電力の総和の平方根AXは各グループごとの第1の圧縮関数制御部10mと第1の圧縮関数適用部12mに入力される。なお、電力総和平方根計算部4では図1中に破線で示すように、入力信号x(t)を入力し、そのフレームの対象サンプルの電力の総和の平方根の計算をしてもよい。各グループごとに、グループ振幅平均計算部8mで、そのグループ中の離散周波数領域信号の振幅平均AHmを計算する。振幅平均AHmはそれぞれ対応する圧縮関数制御部10mと圧縮関数適用部12mに入力される。入力部14から、入力信号に対して、圧縮処理後の期待される所望の振幅(以下、第1の目標振幅)TXが入力され、第1の目標振幅TXは、各グループごとの第1の圧縮関数制御部10mと第1の圧縮関数適用部12mに入力される。第1の目標振幅TXの値は、この装置が適用されるシステムのスピーカや出力増幅器のダイナミックレンジなどにより決定され、信号歪みが生じないような値が選定される。
図2に第1の圧縮関数制御部10mと第1の圧縮関数適用部12mの詳細例と、これに関連する部分の図を示す。第1の圧縮関数制御部10mは、振幅絶対値化部101m、第2の判定部102m、第1の規格化平均値計算部104m、により構成され、
第1の圧縮関数適用部12mは切替スイッチ106m、第1の圧縮関数演算部130m、位相付与部126m、位相計算部128mにより構成され、
入力部14はTX入力部1400とα入力部1402により構成される。
電力総和平方根計算部4よりの電力総和の平方根AXと、TX入力部1400よりの第1の目標振幅TXと、グループ振幅平均計算部8mよりグループ内の離散周波数領域信号の振幅平均AHmがそれぞれ、第1の規格化平均値計算部104mに入力され、第1の規格化平均値計算部104mで、AHm・TX/AXを計算することにより、第1の規格化平均値が計算され、第2の判定部102mに入力される。各グループの振幅平均値AHmは第1の目標振幅TXと電力総和平方根AXとの比TX/AXにより規格化される。
一方、入力されたそのグループの離散周波数領域信号x(ωn)が振幅絶対値化部101m、位相計算部128mに入力される。振幅絶対値化部101mで離散周波数領域信号x(ωn)の振幅|x(ωn)|が求められ、第2の判定部102mと、切替スイッチ106mに入力される。第2の判定部102mで|x(ωn)|とAHm・TX/AXの値の大小が比較される。振幅|x(ωn)|の方が大であれば、第2の判定部102mの出力により切替スイッチ106mが固定接点1062m側に切り替えられ、振幅|x(ωn)|の方が大でなければ、固定接点1061m側に切り替えられる。固定接点1062m側に切り替えられた場合、離散周波数領域信号の振幅x(ωn)に第1の圧縮関数が第1の圧縮関数演算部130mで適用される。第1の圧縮関数は例えば、次式で表せる。
α|x(ωn)|+(1−α)AHm・TX/AX
ここでαはα入力部1402より入力され、抑圧の程度を決定する0から1の範囲の実数であり、小さな値を与えるほど、大きく抑圧されることになる。なお、αは0.2〜0.5であることが望ましい。なお、この圧縮関数の演算に利用するため、第1の規格化平均値計算部104mで計算されたAHm・TX/AXが第1の圧縮関数演算部130mに入力される。その演算結果は位相付与部126mに入力される。固定接点1061mより振幅|x(ωn)|は位相付与部126mに直接入力される。
つまり、第1の圧縮関数適用部12mではそのグループの各離散周波数領域信号の振幅|x(ωn)|に対し、以下の(式1)の制御を行う。
(a)|x(ωn)|>AHm・TX/AXのとき
Fm(|x(ωn)|)=α|x(ωn)|+(1−α)AHm・TX/AX
(b)それ以外のとき
Fm(|x(ωn)|)=|x(ωn)| (式1)
つまり、第1の圧縮関数制御部10mではグループごとのその各離散周波数領域信号の振幅がそのグループの平均振幅AHmに基づき抑圧するか否かの判定が行われており、その判定結果により、第1の圧縮関数適用部12mで、振幅|x(ωn)|に対して抑圧するか、そのままにするかの制御が行われる。
グループmの離散周波数領域信号x(ωn)は、位相計算部128mに入力される。位相計算部128mで、x(ωn)の位相∠x(ωn)が計算され、この計算結果∠x(ωn)が位相付与部126mに入力される。位相付与部126mで、Y(ωn)=Fm(|x(ωn)|)・∠x(ωn)が計算され、第1の圧縮関数適用部12mから出力され、時間領域変換部16に入力される。
なお、位相付与部126m、位相計算部128mを特に設けることなく、(式1)の演算において、いずれの場合にもx(ωn)/|x(ωn)|を乗算させたものを時間領域変換部16へ出力するようにしてもよい。各グループの第1の圧縮関数適用部12mの出力を、時間領域変換部16で例えば、短時間逆フーリエ変換などで、時間領域信号に変換されて、出力される。
この実施例1により、入力信号x(t)を短時間フーリエ変換などにより、周波数成分ごとの信号に変換し、それら各離散周波数領域信号のグループにまとめ、各グループ固有の性質を有する第1の圧縮関数を与える。このとき、第1の圧縮関数は、各グループの離散周波数領域信号x(ωn)の瞬時の振幅|x(ωn)|が規格化平均値AHm・TX/AXより大きい場合のみ、対応する離散周波数領域信号x(ωn)の振幅|x(ωn)|を抑圧する。これにより、入力信号が第1の目標振幅よりも大きな振幅を持っている場合、各グループの平均振幅によって捉えられる入力信号のマクロ的な周波数特性に応じ、各グループの圧縮基準が瞬時に自動的に決定される。
なお、図1中に破線で示すように、電力総和平方根AXと第1の目標振幅TXとの大小を第1の判定部136で比較判定し、TX>AXと判定されると、その判定出力で、スイッチ112をオンにして、当該短時間フーリエ変換区間の入力信号をそのまま出力する。また、例えば、第1の判定部136でTX>AXでないと判定されると、各グループの第1の圧縮関数制御部10mの動作を禁止する構成にしてもよい。
実施例2
次にこの発明の実施例2を説明する。
実施例1では、第1の目標振幅TXより、電力総和の平方根、つまり、入力信号の振幅平均の推定値AXが大きい場合は、入力信号の振幅を抑圧した。しかし、TX>AXの場合は、振幅抑圧処理は行われていない。この実施例2では、TX以下の第2の目標振幅DXを予め決め、DX>AXの場合に入力信号を強調してダイナミックレンジを更に圧縮する。
先に述べたように第1の判定部136で電力総和平方根計算部4よりの電力総和の平方根AXと、入力部14よりの所望の振幅TXの大小を比較し、TX<AXを満たすフレームについては、第1の実施例で説明した第1の圧縮関数による抑圧する。実施例2では、TX<AXを満たさないフレームについて、強調したい所望振幅(以下第2の目標振幅)DXを定め、第2の目標振幅に近づくよう、入力信号を強調して、ダイナミックレンジをさらに圧縮する。
図3に実施例2の具体的構成例を示す。図1を用いて説明した実施例1と比べて、第1の圧縮関数制御部10mと第1の圧縮関数適用部12mの具体的構成が一部変更され、第2の圧縮関数制御部135mと第2の圧縮関数適用部125mとなっている。また同一機能構成部分には同一参照番号をつける。
第1の圧縮判定部134の判定がTX>AXの場合、このことを示す判定結果出力が第2の圧縮関数制御部135mに入力される。
図4に第2の圧縮関数制御部135mと第2の圧縮関数適用部125mの詳細例と、これに関連する部分の図を示す。同一機能構成部分には同一参照番号をつける。
第1の圧縮判定部134は第1の判定部136と第3の判定部137により構成され、第2の圧縮関数適用部125mは切替スイッチ108m、切替スイッチ107m、第2の圧縮関数演算部132m、位相付与部126m、位相計算部128mにより構成され、入力部14はTX入力部1400、DX入力部1404、α入力部1402、β入力部1406により構成され、第2の圧縮関数制御部135mは第4の判定部138mで構成されている。
まず第1の判定部136は電力総和平方根計算部4よりの電力総和の平方根AXとTX入力部1400よりの所望の振幅TXと値の大小を比較し、この結果が(1)AX≦DX(2)DX<AX≦TX(3)TX<AXの3状態を判定する3状態判定回路144に入力される。
DX入力部1404より入力された第2の目標振幅DXは第3の判定部137と第2の圧縮関数演算部132mに入力される。第3の判定部137は電力総和平方根計算部4よりの電力総和の平方根AXと第2の目標振幅DXとの値の大小を比較し、この結果が3状態判定回路144に入力される。ただしDX≦TXであり、DXはTXの約2分の1程度が好ましい。3状態判定回路144の出力が(1)の場合、全てのグループの切替スイッチ108mが固定接点1082m側に切り替えられ、(3)の場合は、固定接点1081mに切り替えられる。また、(2)の場合は、入力信号は抑圧されずに、出力される。固定接点1081m側に切り替えられた場合は、振幅絶対値化部101mよりの対応グループmの各離散周波数領域信号の振幅|x(ωn)|が第1の圧縮関数適用部12m内の切替スイッチ106mの固定接点1061mへ供給される。つまりこの場合は振幅|x(ωn)|は抑圧圧縮、強調圧縮されることはない。
第4の判定部138mでは、グループ振幅平均計算部8mよりの振幅平均AHmと振幅絶対値化部101mよりの振幅|x(ωn)|との大小が比較され、振幅|x(ωn)|の方が大きい場合、切替スイッチ107mが、固定接点1072m側に切り替えられ、振幅|x(ωn)|の方が大きくない場合、固定接点1071m側に切り替えられる。切替スイッチが1072mに切り替えられている場合、すなわち、DX>AX、|x(ωn)|>AHm、を満たす場合は、離散周波数領域信号の振幅|x(ωn)|は第2の圧縮関数演算部132mで、第2の圧縮関数が適用される。第2の圧縮関数は例えば、次式で表せる。
β|x(ωn)|+(1−β)AHm・DX/AX
ここで、βはβ入力部1406より入力され、βは強調の程度を決定する0〜1の範囲の実数であり、小さな値を与えるほど、入力された振幅|x(ωn)|と比べ、より大きく強調される。なお、βは0.2〜0.5であることが望ましい。その演算結果は位相付与部126mに入力される。固定接点1071mより位相付与部126mに入力され、切替スイッチ107mが固定接点1071m側に接続されている場合は、振幅|x(ωn)|は位相付与部126mへ直接入力される。
つまり、第2の圧縮関数適用部125mでは、そのグループの各離散周波数領域信号の振幅|x(ωn)|に対し、以下に示す(式2)で制御を行う。
(a)|x(ωn)|>AHmのとき
Fm(|x(ωn)|)=β|x(ωn)|+(1−β)AHm・DX/AX
(b)それ以外のとき
Fm(|x(ωn)|)=|x(ωn)| (式2)
つまり、第2の圧縮関数制御部135mではグループごとのその各離散周波数領域信号の振幅がそのグループの平均振幅AHmに基づき強調するか否かの判定が行われており、その判定結果により、第2の圧縮関数適用部125mで、振幅|x(ωn)|に対して強調するか、そのままにするかの制御が行われる。
第2の圧縮関数適用部125mでのその後の圧縮は実施例1と同様に強調処理された信号もそのままの信号にも位相∠x(ωn)が付与されて、時間領域変換部16に入力される。
図5AにAX>TXを満たすフレームについての(式1)による抑圧処理の特性を示し、図5BにAX>TXを満たさないフレームについての(式2)による強調処理の特性を示す。図5(A)、図5(B)とも、は縦軸を出力されるFm(|x(ωn)|)とし、横軸を入力される|x(ωn)|とする。
図5(A)において、上述の(式1)により、|x(ωn)|>AHm・TX/AXの領域(図5(A)中で抑圧領域と示している)では、
Fm(|x(ωn)|)=α|x(ωn)|+(1−α)AHm・TX/AXにより抑圧されており、|x(ωn)|≦AHm・TX/AXでは、
Fm(|x(ωn)|)=|x(ωn)|となるので何ら抑圧されていない。
図5(B)において、上述の(式2)により|x(ωn)|>AHmの領域(図5(B)では強調領域と示している)では、
Fm(|x(ωn)|)=β|x(ωn)|+(1−β)AHm・DX/AX
により強調されており、|x(ωn)|≦|AHmでは、
Fm(|x(ωn)|)=|x(ωn)|となるので何ら強調されていない。
図5(A)において、(式1)による抑圧処理においてはTX/AXで規格化された規格化平均値AHm・TX/AXを|x(ωn)|についての抑圧の下限値としているが、(式2)による強調においては、強調の下限値をAHmにより、与えている。これは、信号を抑圧する場合は、要求される抑圧の程度により、AHmより小さい信号も抑圧する必要が生じるのに対し、強調する場合には、平均値AHmより小さい信号の中に含まれると考えられる雑音成分などの不要な増幅を避ける意図がある。また図5(B)に示す(式2)の特性において、
|x(ωn)|>AHm・TX/AXの範囲では、逆に抑圧する効果を与えてしまうが、第1の目標振幅TXを第2の目標振幅DXと近い値に選んだ場合は、逆に(式1)の特性との連続性が保たれることになる。
また図3中の第2の圧縮関数制御部135mに雑音レベル推定部142mを具備してもよい。この場合、例えば、図4中の第2の圧縮関数制御部135m内に破線で示すように、雑音レベル推定部142mが設けられ、更に、第5の判定部140m、も設けられる。グループごとに周波数領域信号x(ωn)は雑音レベル推定部142mに入力され、強調不要な雑音成分の大きさの最大値もしくは平均値に1より大きい定数を乗算した雑音レベルNLmが推定され、この雑音レベルNLmは第5の判定部140mに入力される。第5の判定部140mでは各対応グループごとにグループ振幅平均計算部8mよりの振幅平均AHmと雑音レベルNLmとの値の大小が比較される。第5の判定部140mよりの比較結果により、振幅平均AHmと雑音レベルNLmの大きい方の値が第4の判定部138mに入力され、第4の判定部138mではこの入力された大きい方の値と振幅|x(ωn)|との比較が行われる。このようにすれば、雑音成分の望ましくない強調をより確実に抑えることができる。
実施例3
次にこの発明の実施例3を説明する。実施例1、2は入力信号の振幅値を電力総和平方根により算出しているため、インパルス性信号のように、瞬間的な振幅は大きくても、エネルギーの小さい信号を効果的に抑圧できない。この実施例3では、周波数領域に変換されたパルス性信号が各周波数において、ほぼ等しい振幅を有する性質に着目し、例えば、図6に示すように構成する。全体のブロック構成としては、実施例1とほぼ同様であるが、第2の圧縮判定部147を設け、また第3の圧縮関数制御部145m、第3の圧縮関数適用部153mにおける処理内容が異なる。フレームごとに、入力信号がインパルス性信号であるか否かを判定し、インパルス性信号であるフレームについて、実施例3では以下の処理を行う。
図7に第3の圧縮関数制御部145m、第3の圧縮関数適用部153mの詳細、その他関連のある部分を示す。第3の圧縮関数制御部145mは振幅絶対値化部101m、第2の規格化平均値計算部148m、第6の判定部152mにより構成され、第3の圧縮関数適用部153mは切替スイッチ110m、第3の圧縮関数演算部154m、位相付与部126m、位相計算部128mにより構成されている。なお、図6、図7に関して、実施例1と2と同一機能構成部分には同一参照番号をつける。
離散周波数領域信号x(ωn)は第2の圧縮判定部147(インパルス性信号判定部)と位相計算部128mと振幅絶対値化部101mに入力される。第2の圧縮判定部147でこのフレームがインパルス性信号であるか否かが判定され、その判定結果は、第6の判定部152mに入力される。また、グループ振幅平均計算部8mよりの平均振幅AHmが第2の規格化平均値計算部148mに入力され、電力総和平方根計算部4よりの電力総和の平方根AXとPX入力部1408よりのインパルス性信号に対する圧縮処理後の期待振幅(以下第3の目標振幅)PXがそれぞれ、第2の規格化平均値計算部148mと第2の圧縮判定部147に入力される。なお、第3の目標振幅PXは第1の目標振幅TXの1/10程度であることが望ましい。
第2の規格化平均値計算部148mで、第2の規格化平均値AHm・PX/AXが計算され、第6の判定部152mに入力される。第6の判定部152mでは、第2の圧縮判定部(インパルス性信号判定部)147よりの判定結果がインパルス性信号である場合に、振幅|x(ωn)|と第2の規格化平均値AHm・PX/AXの値の大小が比較される。
振幅絶対値化部101mで、振幅|x(ωn)|が求められ、切替スイッチ110mと第6の判定部152mに入力される。
第6の判定部152mの判定結果が|x(ωn)|>AHm・PX/AXの場合は、切替スイッチ110mを固定接点1102mに切り替え、|x(ωn)|>AHm・PX/AXでない場合は、切替スイッチ110mを固定接点1101mに切り替える。
切替スイッチ110mが固定接点1102mに切り替えられている場合に振幅|x(ωn)|に対してγ|x(ωn)|+(1−γ)AHm・PX/AXが第3の圧縮関数演算部154mで演算される。なおγはγ入力部1410により入力されるものであり、γ=0.2〜0.5であることが好ましい。一方、切替スイッチ110mが固定接点1101mに切り替えられている場合は、振幅|x(ωn)|はそのままとされる。
つまり、第3の圧縮関数適用部153mでは、そのグループの各離散周波数領域信号の振幅|x(ωn)|に対し、以下に示す(式3)で制御を行う。
(a)|x(ωn)|>AHm・PX/AXのとき
Fm(|x(ωn)|)=γ|x(ωn)|+(1−γ)AHm・PX/AX
(b)それ以外のとき
Fm(|x(ωn)|)=|x(ωn)| (式3)
つまり、第3の圧縮関数制御部ではグループごとのその各離散周波数領域信号の振幅がそのグループの第2規格化平均値AHm・PX/AXに基づき抑圧するか否かの判定が行われており、その判定結果により、第3の圧縮関数適用部153mで、振幅|x(ωn)|に対して抑圧するか、そのままにするかの制御が行われる。
これら処理された振幅Fm(|x(ωn)|)に対し、実施例1、2と同様に位相∠x(ωn)を付与して、時間領域変換部16に入力する。なお、位相∠x(ωn)の付与は、x(ωn)/|x(ωn)|をFm(|x(ωn)|)に乗算して行っても良い。このことは実施例2についても同様である。
図8に第2の圧縮判定部147の具体的構成例を示す。第2の圧縮判定部147は例えば、全体振幅平均算出部1440、全体最大振幅検出部1442、第7の判定部1445、第8の判定部1444、アンド回路1446により構成されている。
電力総和平方根計算部4よりの電力総和の平方根AXとPX入力部1408よりの第3の目標振幅PXが第7の判定部1445に入力され、電力総和の平方根AXと第3の目標振幅PXの値の大小が判定される。この判定結果がアンド回路1446に入力される、
また、全帯域の離散周波数領域信号x(ωn)が全体振幅平均算出部1440と全体最大振幅検出部1442に入力され、全体振幅平均算出部1440で、全帯域の離散周波数領域信号x(ωn)の振幅平均x(ωn)が算出され、全体最大振幅検出部1442で、全帯域の離散周波数領域信号x(ωn)の最大振幅x(ωn)が算出される。振幅平均x(ωn)と最大振幅x(ωn)がそれぞれ、第8の判定部1444に入力され、第8の判定部1444で振幅平均x(ωn)と最大振幅x(ωn)の差が所定の範囲内に収まる場合、例えば、振幅平均x(ωn)が最大振幅x(ωn)の定数ε倍よりも大きい場合で、かつ第7の判定部1445で、PX<AXと判定されれば第2の圧縮判定部147はインパルス性信号であると判定する。なお、定数εは0〜1の実数であり、例えば約0.9であることが望ましい。なお、当該フレームの全サンプルの振幅を平均して振幅平均x(ωn)としてもよい。
実施例3により、インパルス性信号のように時間波形の振幅が時間的に過大であるにもかかわらず、周波数領域に変換後、各周波数に分散してしまうため、上記の実施例1の実施のみでは、十分な抑圧が困難な場合においても、抑圧を可能とする効果を得ることが出来る。この実施例3をまず適用することにより、実施例1のみでは十分な抑圧が困難な場合において、抑圧が可能である。
実施例3を理解しやすいように、図6、図7について、独立的に記載した。しかし実施例3は実際には、実施例1、実施例2と共に併用することが好ましい。この場合の実施例3の処理の流れを、図9を参照しながら説明する。まず第2の圧縮判定部147で、インパルス性信号であるか否かを判定し(S20)、インパルス性信号であれば、当該フレームについては上述のように第3の圧縮関数適用部153mにより、(式3)で処理し、(S22)、時間領域変換部16へ出力する。一方ステップS20でインパルス性信号でないと判定されたフレームについては、第1の判定部136により電力総和の平方根AXと第1の目標振幅TXの大小を判定し(S24)、AX>TXの場合は第1の圧縮関数適用部12mにより、(式1)で処理し(S26)、時間領域変換部16へ出力する。一方、ステップS24でAX>TXが成り立たないフレームについては、第3の判定部137で第2の目標振幅DXと電力総和の平方根AXの大小を判定し(S28)、DX>AXであるならば、そのフレームに対し、第2の圧縮関数適用部125mにより(式2)で処理し(S30)、時間領域変換部16へ出力する。S28でDX>AXでないフレームについては、全グループの離散周波数領域信号を時間領域変換部16へそのまま出力する(S32)。
また、ステップS20でインパルス性信号でないと判定されたフレームについては、以下の順序も考えられる。つまり、図9中に破線ブロックB内に示すように、第1の圧縮判定部134で第2の目標振幅DXと電力総和の平方根AXの大小をそれぞれ判定し(S34)、DX>AXを満たすフレームについて、第2の圧縮関数適用部125mで処理して(S36)時間領域変換部16へ出力する。ステップS34でDX>AXを満たさないフレームについては、第1の判定部136で、第1の目標振幅TXと電力総和の平方根AXの大小を判定し(S38)、AX>TXを満たすフレームについては第1の圧縮関数適用部12mにより処理して(S40)、時間領域変換部16へ出力する。ステップS38でAX>TXを満たさないフレームについては、時間領域変換部16にそのまま出力される(S42)。
また、実施例3を実施する場合、図10に示す処理手順も考えられる。予め第2の目標振幅DXと第3の目標振幅PXの大小を比較し、PX≧DXを満たす場合は、第1の圧縮判定部134で、第2の目標振幅DXと電力総和の平方根AXの大小をそれぞれ判定し(S46)、DX>AXを満たすフレームについて、第2の圧縮関数適用部125mで処理して(S58)、時間領域変換部16へ出力する。
一方、ステップS46でDX>AXを満たさないフレームについては、第2の圧縮判定部147でインパルス性信号であるか否かを判定する(S48)。インパルス性信号であれば、そのフレームに対し第3の圧縮関数適用部153mで処理して(S54)、時間領域変換部16に入力される。ステップS48でインパルス性信号でないと判定されると、第1の判定部136で第1の目標振幅TXと電力総和の平方根AXの大小を判定し、AX>TXと判定されれば、そのフレームに対し、第1の圧縮関数適用部12mで処理して(S56)、時間領域変換部16へ出力する。ステップS50でAX>TXでないと判定されたフレームについては、時間領域変換部16にそのまま出力される(S52)。
この発明の実施例1の構成例を示すブロック図。 この発明の実施例1の第1の圧縮関数制御部10mと第1の圧縮関数適用部12mの詳細例と、これに関連する部分のブロック図。 この発明の実施例2の構成例を示すブロック図。 この発明の実施例2の第2の圧縮関数適用部125mと第2の圧縮関数制御部135mの詳細例と、これに関連する部分のブロック図。 (A)は第1の圧縮関数適用部12mによる(式1)の圧縮関数による特性であり、(B)は第2の圧縮関数適用部125mによる(式2)の圧縮関数による特性である。 この発明の実施例3の構成例を示すブロック図。 この発明の実施例3の第3の圧縮関数適用部153mと第3の圧縮関数制御部145mの詳細例と、これに関連する部分のブロック図。 実施例3の第2の圧縮判定部147の具体的構成例。 実施例1〜3を組み合わせて使用する際のフローチャート図。 実施例1〜3を組み合わせて使用する際の他のフローチャート図。

Claims (12)

  1. 離散時間の入力信号をフレームごとに離散周波数領域信号に変換する周波数領域変換部と、
    上記離散周波数領域信号を、少なくとも1つのグループは複数の離散周波数領域信号を含むように複数のグループに分割するグループ分割部と、
    上記フレーム内の入力信号の電力総和の平方根を求める電力総和平方根計算部と、
    上記各分割されたグループごとに、そのグループ内の離散周波数領域信号の振幅平均を求めるグループ振幅平均計算部と、
    圧縮処理後の期待される所望の第1の目標振幅と上記電力総和の平方根との値の大小を比較する第1の判定部と、
    上記第1の判定部より上記電力総和の平方根の方が大であることを示す信号が入力され、上記第1の目標振幅と上記電力総和の平方根との比で、グループごとの振幅平均値を正規化して、第1の規格化平均値計算部で第1の規格化平均値を求め、
    各グループごとに、上記第1の規格化平均値とそのグループの各上記離散周波数領域信号の振幅の大小を第2の判定部により比較する第1の圧縮関数制御部と、
    上記第2の判定部の判定が、上記離散周波数領域信号の振幅の方が大であれば、その振幅に対し、予め決められた第1の圧縮関数を第1の圧縮関数演算部で適用して、上記第1の目標振幅に近づくように、抑圧して、出力し、上記第2の判定部の判定が、上記離散周波数領域信号の振幅の方が大でなければ、その離散周波数領域信号をそのまま出力する、グループごとの第1の圧縮関数適用部と、
    上記各グループごとの第1の圧縮関数適用部より出力された離散周波数領域信号の全体を時間領域信号に変換する時間領域変換部と、
    を有することを特徴とする音声処理装置。
  2. 請求項1記載の音声処理装置において、
    上記第1の判定部よりの上記電力総和の平方根の方が大でないことを示す信号が入力され、
    入力された強調したい所望振幅(以下第2の目標振幅という)と上記電力総和平方根との大小を第3の判定部で比較する第1の圧縮判定部と、
    各グループの振幅平均値と対応グループの各周波数信号の振幅の大小を第4の判定部で比較する第2の圧縮関数制御部と、
    上記第1の判定部の判定が上記第1の目標振幅の方が大のとき、かつ上記第3の判定部の判定が上記第2の目標振幅が大であり、かつ上記第4の判定部の判定が周波数信号の振幅の方が大であれば、
    その振幅に対し、予め決められた第2の圧縮関数を第2の圧縮関数演算部で適用して、上記第2の目標振幅に近づくように、強調して上記時間領域変換部へ出力し、
    上記第4の判定部の判定が各周波数信号の振幅の方が大でないと判定すれば、その振幅をそのまま、上記時間領域変換部へ出力する第2の圧縮関数適用部を備えることを特徴とする音声処理装置。
  3. 請求項2記載の音声処理装置において、
    上記第2の圧縮関数制御部は、各グループごとに雑音レベルの最大値または平均値に1より大きい定数を乗算した値を推定する雑音成分推定部と、
    上記雑音レベルと上記グループ振幅平均値とを比較する第5の判定部とを備え、
    上記第5の判定部が雑音レベルの方が大きいと判定すると、上記グループ振幅平均値に代えて、上記雑音レベルを用いることを特徴とする音声処理装置。
  4. 請求項1〜3のいずれかに記載の音声処理装置において、
    上記入力信号がインパルス性信号か否かをフレームごとに判定する第2の圧縮判定部と、
    上記第2の圧縮判定部により、上記離散周波数領域信号がインパルス性信号と判定されると、上記第1の圧縮関数制御部の動作を停止し、そのフレームの各グループごとに上記インパルス性信号に対する圧縮処理後の所望の振幅(第3の目標振幅という)と上記電力総和の平方根との比で、そのグループの振幅平均値を正規化して、第2の規格化平均値計算部で第2の規格化平均値を求め、
    各グループごとに、上記第2の規格化平均値とそのグループの各上記離散周波数領域信号の振幅との大小を第6の判定部で比較する第3の圧縮関数制御部と、
    上記第6の判定部の判定が上記振幅のほうが大であれば、その離散周波数領域信号に対し、第3の関数演算部により第3の圧縮関数を適用して、上記第3の所望振値に近づくように、抑圧して、上記時間領域変換部へ出力し、上記第6の判定部の判定が上記振幅のほうが大でなければ、その離散周波数領域信号をそのまま上記時間領域変換部へ出力する第3の圧縮関数適用部と、
    を有することを特徴とする音声処理装置。
  5. 請求項4記載の音声処理装置において、
    上記第2の圧縮判定部は、
    上記第3の目標振幅と上記電力総和の平方根との大小を比較する第7の判定部と、
    当該フレームの入力信号の振幅平均値を算出する全体振幅平均算出部と、
    上記離散周波数領域信号の全周波数に対する最大振幅を検出する全体最大振幅検出部と、
    上記全体振幅平均値と上記最大振幅の差が予め決められた範囲内か否かを判定する第8の判定部とで構成され、
    上記第7の判定部で上記電力総和の平方根の方が大であり、かつ上記第8の判定部で上記範囲内に収まれば当該フレームの入力信号は、インパルス性信号であると判定することを特徴とする音声処理装置。
  6. 離散時間の入力信号をフレームごとに離散周波数領域信号に変換する周波数変換手順と、
    上記離散周波数領域信号を、少なくとも1つのグループは複数の離散周波数領域信号を含むように複数のグループに分割するグループ分割手順と、
    上記フレーム内の入力信号の電力総和の平方根を求める電力総和平方根計算手順と、
    上記各分割されたグループごとに、そのグループ内の離散周波数領域信号の振幅平均を求めるグループ振幅平均計算手順と、
    圧縮処理後の期待される所望の第1の目標振幅と上記電力総和の平均との値の大小を比較する第1の判定手順と、
    上記第1の判定手順の判定が上記電力総和の平方根の方が大であり、上記所望の第1の目標振幅と上記電力総和の平方根との比で、グループごとの振幅平均値を正規化して、第1の規格化平均値を求め、
    各グループごとに、上記第1の規格化平均値とそのグループの各上記離散周波数領域信号の振幅の大小を比較する第2の判定手順と、
    上記第2の判定手順の判定結果が、上記離散周波数領域信号の振幅の方が大であれば、その振幅に対し、予め決められた第1の圧縮関数を適用して、上記第1の目標振幅に近づくように、抑圧し、上記第2の判定手順の判定が、上記離散周波数領域信号の振幅の方が大でなければ、その離散周波数領域信号をそのままとする第1の圧縮関数適用手順と、
    上記各グループごとの第1の圧縮関数適用手順により処理された離散周波数領域信号の全体を時間領域信号に変換する時間領域変換手順と、
    を有することを特徴とする音声処理方法。
  7. 請求項6記載の音声処理方法において、
    入力された強調したい所望振幅(以下第2の目標振幅という)と上記電力総和平方根との大小を比較する第3の判定手順と、
    各グループの振幅平均値と対応グループの各周波数信号の振幅の大小を比較する第4の判定手順と、
    上記第1の判定手順の判定結果が上記第1の目標振幅の方が大のとき、上記第3の判定手順の判定結果が上記第2の目標振幅が大であり、かつ上記第4の判定手順の判定結果が上記周波数信号の振幅の方が大であれば、
    その振幅に対し、予め決められた第2の圧縮関数を適用して、上記第2の目標振幅に近づくように、強調し、
    上記第4の判定手順の判定結果が対応グループの各周波数信号の振幅の方が大でないと判定すれば、その振幅をそのままとする第2の圧縮関数適用手順と、
    上記グループごとの上記第2の圧縮関数適用手順により処理された離散周波数領域信号の全体を時間領域信号に変換する手順とを有することを特徴とする音声処理方法。
  8. 請求項7記載の音声処理方法において、
    各グループごとに雑音レベルの最大値または平均値に1より大きい定数を乗算した値を推定する雑音成分推定手順と、
    上記雑音レベルと上記グループ振幅平均値とを比較する第5の判定手順と、を有し、
    上記第5の判定手順の判定結果が雑音レベルの方が大きいと判定すると、上記第4の判定手順は、上記グループ振幅平均値に代えて、上記雑音レベルを用いることを特徴とする音声処理方法。
  9. 請求項6〜8のいずれかに記載の音声処理方法において、
    上記入力信号がインパルス性信号か否かをフレームごとに判定する第2の圧縮判定手順と、
    上記第2の圧縮判定手順により、上記離散周波数領域信号がインパルス性信号と判定されると、上記第1の圧縮関数適用手順を行わず、そのフレームの各グループごとに上記インパルス性信号に対する圧縮処理後の所望の振幅(第3の目標振幅という)と上記電力総和の平方根との比で、そのグループの振幅平均値を正規化して、第2の規格化平均値を求め、
    各グループごとに、上記第2の規格化平均値とそのグループの各上記離散周波数領域信号の振幅との大小を比較する第6の判定手順と、
    上記第6の判定手順の判定結果が上記振幅のほうが大であれば、その離散周波数領域信号に対し、第3の関数演算部により第3の圧縮関数を適用して、上記第3の所望振値に近づくように、抑圧し、上記第6の判定手順の判定結果が上記振幅のほうが大でなければ、その離散周波数領域信号をそのままとする第3の圧縮関数適用手順と、
    上記各グループごとの第3の圧縮関数適用手順により処理された離散周波数領域信号の全体を時間領域信号に変換する手順と、
    を有することを特徴とする音声処理方法。
  10. 請求項9記載の音声処理方法において、
    上記第2の圧縮判定手順は、
    上記第3の目標振幅と上記電力総和の平方根との大小を比較する第7の判定手順と、
    当該フレームの入力信号の振幅平均値を算出する全体振幅平均算出手順と、
    上記離散周波数領域信号の全周波数に対する最大振幅を検出する全体最大振幅検出手順と、
    上記全体振幅平均値と上記最大振幅の差が予め決められた範囲内か否かを判定する第8の判定手順とを有し、
    上記第7の判定手順の判定結果が上記電力総和の平方根の方が大であり、かつ上記第8の判定手順の判定結果が予め決められた範囲内に収まるフレームの入力信号は、インパルス性信号であると判定することを特徴とする音声処理方法。
  11. 請求項6〜10のいずれかに記載の音声処理方法の各手順をコンピュータに実行させるための音声処理プログラム。
  12. 請求項11に記載の音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体。


JP2006073434A 2006-03-16 2006-03-16 音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体 Active JP4206409B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006073434A JP4206409B2 (ja) 2006-03-16 2006-03-16 音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006073434A JP4206409B2 (ja) 2006-03-16 2006-03-16 音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2007251676A true JP2007251676A (ja) 2007-09-27
JP4206409B2 JP4206409B2 (ja) 2009-01-14

Family

ID=38595494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006073434A Active JP4206409B2 (ja) 2006-03-16 2006-03-16 音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4206409B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010141396A (ja) * 2008-12-09 2010-06-24 Fujitsu Ltd 音響処理方法
CN117095685A (zh) * 2023-10-19 2023-11-21 深圳市新移科技有限公司 一种联发科平台终端设备及其控制方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010141396A (ja) * 2008-12-09 2010-06-24 Fujitsu Ltd 音響処理方法
CN117095685A (zh) * 2023-10-19 2023-11-21 深圳市新移科技有限公司 一种联发科平台终端设备及其控制方法
CN117095685B (zh) * 2023-10-19 2023-12-19 深圳市新移科技有限公司 一种联发科平台终端设备及其控制方法

Also Published As

Publication number Publication date
JP4206409B2 (ja) 2009-01-14

Similar Documents

Publication Publication Date Title
JP6136995B2 (ja) 雑音低減装置
JP5898534B2 (ja) 音響信号処理装置および音響信号処理方法
JP5598536B2 (ja) 帯域拡張装置および帯域拡張方法
US20100217606A1 (en) Signal bandwidth expanding apparatus
JP2001134287A (ja) 雑音抑圧装置
JP6401521B2 (ja) 信号処理装置及び信号処理方法
JP2006222867A (ja) 音響信号処理装置およびその方法
JP2011244232A (ja) マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
US9478235B2 (en) Voice signal processing device and voice signal processing method
EP3748989A1 (en) Vibration output apparatus and vibration output program
JPWO2010087147A1 (ja) ハウリング抑圧装置、ハウリング抑圧方法、プログラム、及び集積回路
JP2006243644A (ja) 雑音低減方法、装置、プログラム及び記録媒体
JP6305694B2 (ja) 信号処理装置及び信号処理方法
JP2009296298A (ja) 音声信号処理装置および方法
JP2009020471A (ja) 音処理装置およびプログラム
WO2019160006A1 (ja) ハウリング抑圧装置、その方法、およびプログラム
JP4206409B2 (ja) 音声処理装置、その方法、プログラム、及びそのプログラムを記録した記録媒体
JP5086442B2 (ja) 雑音抑圧方法及び装置
US9697848B2 (en) Noise suppression device and method of noise suppression
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP2014102317A (ja) 雑音除去装置、雑音除去方法、及びプログラム
US20180158447A1 (en) Acoustic environment understanding in machine-human speech communication
JP2006121188A (ja) ハウリング抑圧装置
JP2006126841A (ja) 周期信号増強システム
JP5145733B2 (ja) 音声信号処理装置および音声信号処理方法ならびにプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081020

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4206409

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350