JP4321049B2 - Automatic gain controller - Google Patents

Automatic gain controller Download PDF

Info

Publication number
JP4321049B2
JP4321049B2 JP2002334172A JP2002334172A JP4321049B2 JP 4321049 B2 JP4321049 B2 JP 4321049B2 JP 2002334172 A JP2002334172 A JP 2002334172A JP 2002334172 A JP2002334172 A JP 2002334172A JP 4321049 B2 JP4321049 B2 JP 4321049B2
Authority
JP
Japan
Prior art keywords
unit
input signal
signal
speech
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002334172A
Other languages
Japanese (ja)
Other versions
JP2004129187A (en
Inventor
章 寺澤
博昭 竹山
裕子 前田
靖久 井平
実 福島
彰洋 菊池
敏 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Electric Works Co Ltd
Original Assignee
Panasonic Corp
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Works Ltd filed Critical Panasonic Corp
Priority to JP2002334172A priority Critical patent/JP4321049B2/en
Publication of JP2004129187A publication Critical patent/JP2004129187A/en
Application granted granted Critical
Publication of JP4321049B2 publication Critical patent/JP4321049B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、入力信号のレベルに応じて入力信号を増幅する際の利得を制御する自動利得制御装置に関するものである。
【0002】
【従来の技術】
電話等の通信分野では、有線と無線、あるいはアナログ通信とデジタル通信といった通信形態(伝送形態)により伝送損失が異なることが知られている。したがって、伝送損失の大小にかかわらずに安定した通信を行おうとした場合、例えば、話し手の声(発話音声)の大きさ(音量)によらずに聞き手に聞こえる音声の音量をほぼ一定にしようとした場合、音量を一定とするように音声信号を増幅する際の利得を制御する必要がある。このように音声信号に対する自動利得制御は、上記通信分野のみならず、音声認識システムのように入力音声の音量レベルによって認識率が変動してしまう場合、あるいは警報音等の音量を周囲の騒音レベルに応じて調整する場合というように様々な分野に用いられている。
【0003】
【非特許文献1】
財団法人電気通信端末機器審査協会資料 「電気通信端末機器等適合認定基準/技術的条件」 第3章 技術基準(端末設備等規則)の解説 3.2アナログ電話端末 第14条 送出電力 p.120
【0004】
【発明が解決しようとする課題】
ところで従来の自動利得制御装置では、図27に示すような入力信号のレベルに応じた利得の関係を示す利得関数Fを一つしか備えていないため、入力信号のレベル変動が大きい場合に出力信号のレベルを一定に保つ利得制御を行うことが困難であった(非特許文献1参照)。
【0005】
本発明は上記事情に鑑みて為されたものであり、その目的は、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能な自動利得制御装置を提供することにある。
【0006】
【課題を解決するための手段】
請求項1の発明は、上記目的を達成するために、入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音成分を検出する雑音検出部と、入力信号の16m秒程度の短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音成分の大きさに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部と、利得算出部で算出された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部とを備え、雑音検出部は、入力信号の前記短い時間を16倍した時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択してなり、長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とする。
【0009】
請求項の発明は、請求項の発明において、長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とする。
【0010】
請求項の発明は、請求項1又は2の発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とする。
【0011】
請求項の発明は、請求項1の発明において、雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とする。
【0012】
請求項の発明は、請求項1〜の何れかの発明において、短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とする。
【0013】
請求項の発明は、請求項1〜の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とする。
【0014】
請求項の発明は、請求項1〜の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とする。
【0015】
請求項の発明は、請求項の発明において、出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とする。
【0016】
請求項の発明は、請求項6又は7又は8の発明において、入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とする。
【0017】
請求項10の発明は、請求項6又は7又は8の発明において、入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とする。
【0018】
請求項11の発明は、請求項の発明において、前記利得変動補正部は、利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することを特徴とする。
【0019】
請求項12の発明は、請求項1〜11の何れかの発明において、入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とする。
【0020】
請求項13の発明は、請求項1〜12の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする。
【0021】
請求項14の発明は、請求項1〜12の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする。
【0022】
請求項15の発明は、請求項14の発明において、周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とする。
【0023】
請求項16の発明は、請求項13又は14の発明において、雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とする。
【0024】
請求項17の発明は、請求項13又は14の発明において、雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とする。
【0025】
【発明の実施の形態】
以下、図面を参照して本発明を実施形態により詳細に説明する。但し、以下に説明する各実施形態では音声信号を扱うシステムや機器に本発明の自動利得制御装置を適用した場合を例示しているが、対象となる入力信号の種類は音声信号に限定されるものではなく、信号を増幅する増幅器等を有するシステムや機器全般について本発明の技術思想が適用可能である。また、各実施形態ではデジタル信号に変換された入力信号を取り扱っているが、入力信号をアナログ信号のままで取り扱うことも可能である。ここで、本発明の実施形態を説明する前に、本発明と基本構成が共通する基本例について説明する。
【0026】
基本例1)
基本例の自動利得制御装置は、図1に示すように入力信号を一時的に記憶する入力信号バッファ部1と、入力信号(入力信号バッファ部1に記憶された入力信号)の比較的長い時間における時間平均を検出する長時間平均レベル検出部2と、入力信号(入力信号バッファ部1に記憶された入力信号)の比較的短い時間における時間平均を検出する短時間平均レベル検出部3と、長時間平均レベル検出部2で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数F1,F2,…,Fnのうちから何れか一つの利得関数Fi(i=1,2,…,n)を選択する利得関数選択部4と、短時間平均レベル検出部3で検出される入力信号の短時間平均値及び利得関数選択部4で選択された利得関数Fiから入力信号を増幅する際の利得を算出する利得算出部5と、利得算出部5で算出した利得と入力信号バッファ部1に記憶された入力信号とから出力信号を算出する、言い換えると入力信号を算出された利得で増幅する出力値算出部6とを備えている。
【0027】
入力信号バッファ部1では、例えば16ms程度の短い時間(以下、「バッファ時間」と呼ぶ)に入力された入力信号(入力データ)を記憶しており、短時間平均レベル検出部3では入力信号バッファ部1に記憶されているバッファ時間分の入力信号レベルの算術平均値(短時間平均値)を算出し、長時間平均レベル検出部2ではバッファ時間の定倍(例えば、16倍)の入力信号レベルの算術平均値(長時間平均値)を算出している。なお、長時間平均レベル検出部2では長時間平均値を算出するために入力信号バッファ部1のバッファ時間の定倍(例えば、16倍)のバッファ時間(容量)を有するバッファを具備している。
【0028】
利得関数選択部4は、図2に示すような3種類の利得関数F1,F2,F3のデータを保持している。図2に実線で示した利得関数F1は3種類のうちで利得(実線の傾き)が最も大きく、且つ入力レベルの上限値L1が最も小さくなっている。また、同図に破線で示した利得関数F3は3種類のうちで利得が最も小さく、且つ入力レベルの上限値L3が最も大きくなっている。さらに、同図に一点破線で示した利得関数F2は利得及び入力レベルの上限値L2が何れも3種類のうちの中間の値に設定されている。但し、これらの利得関数F1〜F3は一例であって、その種類や数は図2に示したものに限定されるものではない。
【0029】
次に本基本例の動作を説明する。
【0030】
長時間平均レベル検出部2で求めた入力信号の長時間平均値が利得関数選択部4に与えられ、利得関数選択部4では長時間平均値に応じた適切な利得関数Fi(i=1,2,3)を選択する。ここで、電話機等の通信機器による通話を例にとると、一般に長時間平均値は主に入力信号に含まれる雑音成分(音声以外の成分)によってそのレベルが決まり、短時間平均値は主に入力信号に含まれる信号成分(音声成分)によってそのレベルが決まると考えられる。したがって、長時間平均値が相対的に大きな値であれば入力信号に含まれる雑音成分が多く、反対に長時間平均値が相対的に小さな値であれば入力信号に含まれる雑音成分が少ないと判断できるから、利得関数選択部4では、長時間平均値が相対的に小さければ利得関数F1を選択し、相対的に大きければ利得関数F3を選択するとともに、相対的に中間レベルにあれば利得関数F2を選択する。利得算出部5では選択された利得関数Fiの入力レベルに短時間平均レベル検出部3で算出された短時間平均値を代入して出力レベルを求め、その出力レベルを入力レベル(短時間平均値)で除算することによって利得を算出する。
【0031】
そして、出力値算出部6において利得算出部5で算出した利得と入力信号バッファ部1に記憶されている入力信号とから出力値を算出する、言い換えると利得算出部5で算出した利得で入力信号を増幅することで出力信号を得ている。
【0032】
而して、入力信号に含まれる雑音成分、例えば電話機等の通信機器の周囲雑音が相対的に大きくなるに従って利得が減少し且つ入力レベルの上限値Li(i=1,2,3)が大きくなるように利得関数選択部4にて利得関数Fiを選択しているため、単一の利得関数のみで利得制御を行う従来例に比較して、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、雑音成分のレベルによって決まる入力信号の長時間平均値に応じて利得関数Fiを選択し、さらに雑音成分以外の信号成分(音声成分)によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数Fiを選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。
【0033】
基本例2)
基本例は、図3に示すように短時間平均レベル検出部3にて短時間平均値を検出する際の単位時間(バッファ時間)内における入力信号のピーク値を検出する短時間ピーク検出部7と、短時間ピーク検出部7で検出されるピーク値が所定のしきい値を越える場合に利得算出部5で算出された利得を補正する利得補正部8とを備える点に特徴があり、これ以外の構成については基本例1と共通であるから説明を省略する。
【0034】
而して、基本例1においては、入力信号のピーク値がある程度大きくなった場合に出力値算出部6における出力値の算出時にオーバーフローが発生する可能性があり、仮に出力値算出部6でオーバーフローが発生すると所謂クリッピングノイズが生じて通話品質を劣化させてしまう虞がある。
【0035】
それに対して本基本例では、短時間ピーク検出部7で検出されるピーク値が所定のしきい値を越える場合、利得補正部8が利得算出部5で算出された利得を相対的に小さい値に補正するようにしている。その結果、しきい値を越えるようなレベルの高い入力信号が入力された場合でも出力信号にクリッピングノイズが生じたり、あるいは出力信号が歪むのを防止することができる。
【0036】
基本例3)
基本例は、図4に示すように入力信号が音声信号か否かを判別する入力信号判別部9を備え、入力信号判別部9の判別結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴があり、これ以外の構成については基本例2と共通であるから説明を省略する。
【0037】
入力信号判別部9は従来周知の技術を用いて実現可能であって、例えば、短時間平均レベル検出部3で求めた短時間平均値と、長時間平均レベル検出部2で求めた長時間平均値との比を所定のしきい値と比較することにより、入力信号が音声信号か否かを判別し、例えば音声信号であるときにH、音声信号でない(非音声信号)ときにLとなる2値信号(判別信号)を出力する。
【0038】
利得関数選択部4は、基本例1で説明したように長時間平均値が相対的に小さければ利得関数F1を選択し、相対的に大きければ利得関数F3を選択するとともに、相対的に中間レベルにあれば利得関数F2を選択するが、利得関数F1又はF2を選択した場合であっても、入力信号判別部9から出力される判別信号がL、つまり入力信号が非音声信号である場合には、選択した利得関数F1又はF2よりも利得の小さい利得関数F3に変更するようになっている。
【0039】
而して、入力信号が非音声信号のときに利得の大きい関数F1,F2を選択すると、非音声信号のレベルが必要以上に大きくなって通話上のノイズが増えてしまうことになるが、上述のように入力信号が音声信号か非音声信号かを判別し、非音声信号の場合には利得関数選択部4にて利得の小さい利得関数Fiに変更するようにしているから、非音声信号に対する利得が必要以上に大きくなるのを防いで入力信号の信号/雑音比の低下を抑えることができる。
【0040】
基本例4)
基本例は、図5に示すように入力信号が音声信号か否かを判別する入力信号判別部9と、入力信号判別部9により非音声信号と判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部10とを備えた点に特徴があり、これ以外の構成については基本例2と共通であるから説明を省略する。
【0041】
入力信号判別部9は基本例3と共通であって、例えば入力信号が音声信号であるときにH、非音声信号のときにLとなる判別信号を出力する。また、出力信号減衰部10は、入力信号判別部9から出力される判別信号がL、つまり入力信号が非音声信号である場合に出力値算出部6から出力された信号(出力信号)を減衰させるものである。なお、入力信号が音声信号である場合には出力信号減衰部10では出力信号を減衰させずにそのまま通過させる。
【0042】
而して、基本例3で説明したように入力信号が非音声信号のときに利得の大きい関数F1,F2を選択すると、非音声信号のレベルが必要以上に大きくなって通話上のノイズが増えてしまうことになるが、上述のように入力信号が音声信号か非音声信号かを判別し、非音声信号の場合には出力信号減衰部10によって出力信号を減衰させているから、音声信号以外の出力信号を減衰させることで雑音を低減することができる。
【0043】
ところで、入力信号が音声信号から非音声信号あるいは非音声信号から音声信号に切り換わる前後において、出力信号減衰部10による出力信号の減衰の有無に伴って出力信号のレベルが大きく変動するから、通話音声が途切れたり、急に大きくなる等して通話品質が低下してしまう虞がある。
【0044】
そこで、出力信号減衰部10においては、入力信号判別部9における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることが望ましい。例えば、図6(a)に示すような入力信号が入力され、同図(b)に示すように時刻t1で入力信号判別部9による入力信号の判別結果が非音声信号から音声信号に切り換わり、時刻t2で音声信号から非音声信号に切り換わると仮定する。このとき、同図(c)に示すように時刻t1,t2でそれぞれ出力信号減衰部10による減衰の有無を切り換えるのではなく、同図(d)に示すように時刻t1,t2から数ms〜数十msの間は入力信号が非音声信号のときの減衰量(図6中では「減衰量大」と表記)よりも小さい減衰量(図6中では「減衰量小」と表記)で出力信号を減衰させるのである。
【0045】
このように出力信号減衰部10による出力信号の減衰量を入力信号判別部9における判別結果が切り換わる際に段階的に変化させるようにすれば、入力信号が非音声信号から音声信号に切り換わったときに音声信号の先頭部分の音量が低下するといった不具合の発生を防いで通話品質の向上が図れる。
【0046】
基本例5)
基本例は、入力信号判別部9の構成に特徴があり、これ以外の構成については基本例3又は4と共通であるから図示並びに説明を省略する。
【0047】
基本例における入力信号判別部9は、図7に示すように入力信号の長時間平均値及び短時間平均値の比率(=短時間平均値÷長時間平均値)を求める平均値比率算出部9aと、長時間平均値及び短時間平均値の差分を求めるとともその差分値を所定のしきい値と比較することで音声信号か否かを判別する平均値差分算出部9bと、平均値比率算出部9aで求めた平均値の比率に応じて平均値差分算出部9bにおけるしきい値を決定するしきい値決定部9cとを具備している。
【0048】
すなわち、従来周知の構成であれば、平均値比率算出部9a又は平均値差分算出部9bの算出値を所定のしきい値と比較することで入力信号が音声信号か否かを判別するのみであるが、平均値差分算出部9bにおけるしきい値を、平均値比率算出部9aで求めた平均値の比率に応じてしきい値決定部9cにて決定している点に本基本例の特徴がある。例えば、平均値比率算出部9aで算出した比率が1よりも大きい場合には入力信号が音声信号である可能性が高いと考えられ、反対に比率が1よりも小さい場合には入力信号が音声信号でない可能性が高いと考えられる。
【0049】
そこで本基本例においては、しきい値決定部9cが平均値比率算出部9aで算出した比率が1よりも大きい場合にしきい値を大きくし、反対に平均値比率算出部9aで算出した比率が1よりも小さい場合にしきい値を小さくすることによって、音声信号か否かの判別に対する入力信号の雑音成分(長時間平均値)の影響を低減するようにしている。
【0050】
なお、本基本例では、平均値比率算出部9aで求めた平均値の比率に応じて平均値差分算出部9bにおけるしきい値をしきい値決定部9cにて決定しているが、反対に平均値差分算出部9bで求めた差分値に応じて平均値比率算出部9aにおけるしきい値をしきい値決定部9cにて決定するようにしても構わない。あるいは、長時間平均値に応じて平均値比率算出部9a及び平均値差分算出部9bの各しきい値を適応的に決定するようにしても構わない。
【0051】
基本例6)
基本例は、図8に示すように入力信号の周波数分析結果から入力信号が音声信号か否かを判別する入力信号判別部11を備えた点に特徴があり、これ以外の構成は基本例4と共通であるから説明を省略する。つまり、基本例4における入力信号判別部9では、例えば短時間平均値と長時間平均値の比を所定のしきい値と比較することによって入力信号が音声信号か否かを判別するというように時間系列の信号から入力信号の判別を行っているのに対し、本基本例における入力信号判別部11では、入力信号を周波数分析した結果から入力信号の判別を行っている。
【0052】
入力信号判別部11は、図9に示すように入力信号を高速フーリエ変換(FFT)することで周波数分析する周波数分析部11aと、周波数分析部11aで得られる入力信号の周波数スペクトルを一時的に保存する遅延部11bと、非音声(例えば、相手の通信機器のマイクロホンで集音された周囲騒音)の成分の周波数スペクトルを推定する非音声成分スペクトル推定部11cと、周波数分析部11aで得られる入力信号の周波数スペクトルから非音声成分スペクトル推定部11cで推定された非音声成分の周波数スペクトルを減算するスペクトル減算部11dと、スペクトル減算部11dで求めた減算成分(差分)の周波数スペクトルのパワーを計算する減算成分パワー計算部11eと、減算成分パワー計算部11eで求めたパワー値が所定のしきい値を越えるときに音声信号、越えないときに非音声信号と判断して判別信号(例えば、音声信号のときに「H」、非音声信号のときに「L」となる2値信号)を出力する判別信号出力部11fとを具備している。
【0053】
非音声信号スペクトル推定部11cでは、判別信号出力部11fからLレベルの判別信号が出力されているとき、つまり入力信号が非音声信号と判別されているときに、その時点までに推定した非音声成分の周波数スペクトルと遅延部11bに保存されている入力信号の周波数スペクトルの平均を求め、その平均値をそれ以降における非音声成分の周波数スペクトルの推定値としている。なお、非音声成分の周波数スペクトルと入力信号の周波数スペクトルの平均を求める場合、単純な加算及び除算で求めることも可能であるが、それぞれに重み係数を乗算した後に加算及び除算して求めるようにしても良い。
【0054】
上述のように本基本例における入力信号判別部11は入力信号の周波数分析結果から音声信号か否かを判別するため、入力信号を時系列の信号として取り扱って音声信号か否かの判別を行う入力信号判別部9に比較して、音声信号か否かの判別の精度が向上するという利点がある。
【0055】
(実施形態
本実施形態は、図10に示すように利得補正部8で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部12を備えた点に特徴があり、これ以外の構成については、例えば基本例6と共通であるから説明を省略する。
【0056】
通常、入力信号は音声信号であるときの方が信号レベルが大きくなるから、出力信号を一定に保つためには音声信号のレベルが大きいほど利得は小さくなる傾向にある。一方、利得は、入力信号が非音声信号から音声信号あるいは音声信号から非音声信号に切り換わる時点で大きく変動すると考えられる。したがって、入力信号が音声信号から非音声信号に切り換わる時点では利得が大きく増大する傾向にあり、非音声信号に切り換わった後に利得が大きい値のままであると雑音が増幅されてしまう虞がある。
【0057】
そこで本実施形態では、利得変動補正部12によって利得補正部8で補正された利得の変動分を検出するとともに、検出した変動分が所定範囲を超える場合に、その変動を抑制する方向へ利得を補正するようにしている。例えば、利得変動補正部12は入力信号が音声信号から非音声信号に切り換わる時点を利得の変動分に基づいて検出し、非音声信号に切り換わった後の利得を補正して減少させるので、非音声信号(雑音)が大きく増幅されるのを抑えて入力信号の信号/雑音比の低下を防止することができる。なお、本実施形態では利得補正部8で補正された利得を利得変動補正部12で補正する構成としたが、利得算出部5で算出された利得を利得変動補正部12で補正する構成、例えば、基本例1の構成に利得変動補正部12を追加した構成であっても同様の効果を奏する。
【0058】
(実施形態
本実施形態は、図11に示すように入力信号から雑音成分を除去する雑音除去部13を備え、雑音除去部13の出力信号を短時間平均レベル検出部3の入力とした点に特徴があり、これ以外の構成は実施形態と共通であるから説明を省略する。
【0059】
雑音除去部13は、図12に示すように入力信号をフーリエ変換して周波数スペクトルを求めるフーリエ変換部13aと、フーリエ変換部13aで得られる入力信号の周波数スペクトルを一時的に保存する遅延部13bと、非音声(例えば、相手の通信機器のマイクロホンで集音された周囲騒音)の成分の周波数スペクトルを推定する非音声成分スペクトル推定部13cと、フーリエ変換部13aで得られる入力信号の周波数スペクトルから非音声成分スペクトル推定部13cで推定された非音声成分の周波数スペクトルを減算するスペクトル減算部13dと、スペクトル減算部13dで求めた減算成分(差分)を逆フーリエ変換する逆フーリエ変換部13eとを具備しており、逆フーリエ変換部13eから出力される信号は入力信号から雑音成分(周囲騒音の成分)が除去された信号となる。ここで、非音声信号スペクトル推定部13cでは、入力信号判別部11からLレベルの判別信号が出力されているとき、つまり入力信号が非音声信号と判別されているときに、その時点までに推定した非音声成分の周波数スペクトルと遅延部13bに保存されている入力信号の周波数スペクトルの平均を求め、その平均値をそれ以降における非音声成分の周波数スペクトルの推定値としている。
【0060】
上述のように雑音除去部13により入力信号から雑音成分を除去した信号を短時間平均レベル検出部3の入力とすれば、雑音成分を除去した後の入力信号から短時間平均を検出することにより、雑音成分の影響を受けることなく的確な利得を算出することができる。
【0061】
(実施形態
本実施形態は、図13に示すように長時間平均レベル検出部2’が入力信号に含まれる雑音成分の推定値から長時間平均値を検出する点に特徴があり、これ以外の構成については実施形態と共通であるから説明を省略する。
【0062】
本実施形態における長時間平均レベル検出部2’は、雑音除去部13の非音声成分スペクトル推定部13cで推定された非音声成分(周囲騒音)の周波数スペクトルを逆フーリエ変換により時間軸信号に戻し、その信号について長時間平均値を求める。
【0063】
而して、先の実施形態における長時間平均レベル検出部2では、入力信号の単純な算術平均を長時間平均値としているために雑音成分だけでなく音声成分が含まれる率が高くなっているが、本実施形態における長時間平均レベル検出部2’は入力信号に含まれる雑音成分の推定値から長時間平均値を求めているので、音声成分が含まれる率を大幅に低減することが可能となり、雑音成分のレベルによって決まる入力信号の長時間平均値を的確に検出することができて信号/雑音比の向上が図れる。また、長時間平均値が的確に検出可能となることによって、入力信号に含まれる雑音成分の増幅を抑えるように適切な利得を算出することができる。
【0064】
(実施形態
本実施形態は、図14に示すように長時間平均レベル検出部2”が短時間平均レベル検出部3で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出する点に特徴があり、これ以外の構成については実施形態と共通であるから説明を省略する。
【0065】
基本例1〜6並びに実施形態1,2においては、図16(a)にしめすように入力信号バッファ部1が例えば128ビットのバッファ長を有するとしたとき、長時間平均レベル検出部2には、入力信号バッファ部1のx倍(例えば、16倍)のバッファ長(128×16=2048ビット)を持たせる必要があった。
【0066】
一方、本実施形態における長時間平均レベル検出部2”では、短時間平均レベル検出部3で検出された短時間平均値から長時間平均値を算出するので、図15(b)に示すように長時間平均レベル検出部2”のバッファにはx個(例えば、16個)の短時間平均値が格納可能であればよい。したがって、本実施形態では長時間平均レベル検出部2”のバッファ長を大幅(上述の例であれば2048ビットから16ビット)に低減することができ、長時間平均値を求める際の計算量やバッファ容量が減少するという利点がある。なお、合計x個の短時間平均値のうちからy個ずつについて求めた算術平均をバッファに格納し、それらy個の平均値を平均して長時間平均値を求めるようにすれば、長時間平均レベル検出部2”のバッファ容量をさらに低減することができる。
【0067】
(実施形態
本実施形態は、図17に示すように長時間平均レベル検出部2”が入力信号判別部11にて音声信号でない、つまり非音声信号と判別されたときにのみ入力信号の長時間平均を検出する点に特徴があり、これ以外の構成については実施形態と共通であるので説明を省略する。
【0068】
而して、長時間平均レベル検出部2”は入力信号判別部11から出力される判別信号がHレベルのとき(入力信号が音声信号のとき)には長時間平均値の算出せず、判別信号がLレベルの時(入力信号が非音声信号のとき)に長時間平均値を算出するから、音声信号に含まれる背景雑音の成分を長時間平均値として検出することができ、背景雑音成分のレベルに応じた適切な利得関数の選択が可能となる。
【0069】
(実施形態
本実施形態は、入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を入力信号バッファ部1の前段に設けた点に特徴がある。但し、入力信号バッファ部1以降の構成並びに動作については基本例1と共通であるから説明は省略する。
【0070】
本実施形態における雑音成分除去手段は、図18に示すように時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部14と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部15と、非音声区間検出部14で検出される非音声区間に周波数変換部15で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部16と、周波数変換部15で求められた周波数スペクトルから非音声スペクトル推定部16で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部17と、周波数スペクトル減算部17で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部18とで構成される。
【0071】
非音声区間検出部14は従来周知の技術を用いて実現可能であって、例えば、入力信号に含まれる音声成分の瞬時パワーを推定するとともに非音声成分(背景雑音成分)のレベルを推定し、瞬時パワー推定値と非音声成分レベルの比に基づいて入力信号に音声成分が含まれていないと見なし得る区間(非音声区間)を検出する。また周波数変換部15は、フーリエ変換やウェーブレット変換等を用いて入力信号の周波数スペクトルを求めている。
【0072】
非音声スペクトル推定部16は、周波数変換部15で求めた入力信号の周波数スペクトルのうちで非音声区間検出部14で検出された非音声区間の入力信号に対応する周波数スペクトルの平均値を求め、その平均値を非音声信号の周波数スペクトル推定値とする。そして、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去することができる。それから、周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0073】
而して、本実施形態では、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。
【0074】
(実施形態
本実施形態は、図19に示すように実施形態における非音声区間検出部14、周波数変換部15並びに非音声スペクトル推定部16からなる雑音検出部を長時間平均レベル検出部2の代わりに用いた点に特徴がある。但し、これ以外の構成並びに動作については基本例1及び実施形態と共通であるから説明は省略する。
【0075】
本実施形態の非音声スペクトル推定部16では、非音声区間における周波数スペクトルのパワースペクトルを求め、さらに各帯域毎にパワースペクトルの平均値を算出している。ここで、非音声スペクトル推定部16で算出される前記パワースペクトルの平均値は入力信号に含まれる雑音成分によってそのレベルが決まるから、基本例1における長時間平均値の代わりに前記パワースペクトルの平均値に応じて利得関数選択部4が適切な利得関数Fi(i=1,2,3)を選択することができる。
【0076】
而して、入力信号に含まれる雑音成分、例えば電話機等の通信機器の周囲雑音が相対的に大きくなるに従って利得が減少し且つ入力レベルの上限値Li(i=1,2,3)が大きくなるように利得関数選択部4にて利得関数Fiを選択することにより、単一の利得関数のみで利得制御を行う従来例に比較して、基本例1と同様に入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、雑音成分のレベルによって決まる入力信号の非音声区間における周波数スペクトルのパワースペクトル平均値に応じて利得関数Fiを選択し、さらに雑音成分以外の信号成分(音声成分)によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数Fiを選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。なお、本実施形態では雑音成分除去手段の一部を雑音検出部と兼用しているために構成の簡略化が図れるという利点がある。
【0077】
(実施形態
図20に本実施形態のブロック図を示す。本実施形態は、基本例4における入力信号判別部9の代わりに非音声区間検出部14による非音声区間の検出結果を出力信号減衰部10に入力し、非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10で減衰させる点に特徴がある。なお、これ以外の構成及び動作は基本例4並びに実施形態と共通であるから説明は省略する。
【0078】
而して、本実施形態では、基本例4と同様に非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10によって減衰させることにより、音声信号以外の出力信号を減衰させて雑音を低減することができ、しかも、雑音成分除去手段の一部を入力信号判別部9の代わりに用いることで構成の簡略化が図れるという利点がある。
【0079】
(実施形態
図21に本実施形態のブロック図を示す。本実施形態は、基本例3における入力信号判別部9の代わりに非音声区間検出部14による非音声区間の検出結果を利得関数選択部4に入力し、非音声区間検出部14の検出結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴があり、これ以外の構成については基本例3並びに実施形態と共通であるから説明を省略する。
【0080】
而して、本実施形態では基本例3と同様に、非音声区間の入力信号に対しては利得関数選択部4が利得の小さい利得関数Fiに変更することにより、非音声信号に対する利得が必要以上に大きくなるのを防いで入力信号の信号/雑音比の低下を抑えることができ、しかも、雑音成分除去手段の一部を入力信号判別部9の代わりに用いることで構成の簡略化が図れるという利点がある。
【0081】
(実施形態10
図22に本実施形態のブロック図を示す。本実施形態は、雑音成分除去手段を構成する非音声区間検出部14’が周波数変換部15から得られる入力信号の周波数スペクトルより入力信号に音声信号が含まれない非音声区間を検出する点に特徴があり、その他の構成及び動作については実施形態と共通であるから説明を省略する。
【0082】
本実施形態における非音声区間検出部14’は、周波数変換部15で得られる入力信号の周波数スペクトルを、予め用意された非音声(周囲騒音など)の周波数スペクトルモデルと比較し、当該周波数スペクトルモデルと一致する程度に応じて帯域毎に音声か非音声かを判別し、一定数以上の帯域を非音声と判別した場合に当該区間を非音声区間と判断するとともに、非音声と判別した帯域の周波数スペクトルと周波数スペクトルモデルとの平均をとって非音声の周波数スペクトルモデルを更新する。但し、非音声区間検出部14’では、上述の方法により音声と判別した帯域が所望の帯域から外れる場合にはその帯域を非音声と判断する。以下、非音声区間検出部14’で検出された非音声区間の入力信号に対応する周波数スペクトルから非音声スペクトル推定部16にて非音声信号の周波数スペクトル推定値を求め、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去し、さらに周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0083】
而して、本実施形態においても実施形態と同様に、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、本実施形態における非音声区間検出部14’では、入力信号の周波数スペクトルから周波数帯域毎に音声か非音声かを判別して非音声区間を検出しているから、実施形態における非音声区間検出部14に比較して非音声区間の検出精度が高くなるという利点がある。
【0084】
(実施形態11
図23に本実施形態のブロック図を示す。本実施形態は、周波数変換部15から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部14’に与えるスペクトル正規化部19を備えた点に特徴があり、これ以外の構成及び動作については実施形態10と共通であるから説明を省略する。
【0085】
スペクトル正規化部19は、周波数変換部15で求めた入力信号の周波数スペクトルのパワースペクトルを計算してその平均値を求め、さらにその平均値で各周波数帯域のパワースペクトル値を除算(正規化)する処理(パワー正規化処理)を行う。以下、非音声区間検出部14’で入力信号の非音声区間を検出し、非音声区間検出部14’で検出された非音声区間の入力信号に対応する周波数スペクトルから非音声スペクトル推定部16にて非音声信号の周波数スペクトル推定値を求め、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去し、さらに周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0086】
而して、本実施形態においても実施形態6や7と同様に、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、本実施形態においてはスペクトル正規化部19を備えているから、パワー正規化処理によって周波数スペクトルの形状における特徴(山の部分や谷の部分)が明確になり、非音声区間検出部14’による非音声区間の検出制度が向上できるという利点がある。
【0087】
(実施形態12
図24に本実施形態のブロック図を示す。本実施形態は、実施形態11におけるスペクトル正規化部19、非音声区間検出部14’、周波数変換部15並びに非音声スペクトル推定部16からなる雑音検出部を長時間平均レベル検出部2の代わりに用いた点に特徴があり、これ以外の構成並びに動作については実施形態11及び実施形態と共通であるから説明は省略する。
【0088】
而して、本実施形態では入力信号の非音声区間の検出精度を向上させることで利得関数選択部4における利得関数の選択ミスを防いで入力信号に含まれる雑音成分に応じた適切な利得関数を選択することができる。
【0089】
(実施形態13
図25に本実施形態のブロック図を示す。本実施形態は、実施形態と実施形態11を組み合わせたものであって、非音声区間検出部14’による非音声区間の検出結果を出力信号減衰部10に入力し、非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10で減衰させる点に特徴がある。なお、これ以外の構成及び動作は実施形態並びに実施形態11と共通であるから説明は省略する。
【0090】
而して、本実施形態では、入力信号の非音声区間の検出精度を向上させることで出力信号減衰部10による音声信号以外の出力信号の減衰による雑音低減効果を高めることができるとともに構成の簡略化が図れるという利点がある。
【0091】
(実施形態14
図26に本実施形態のブロック図を示す。本実施形態は、実施形態と実施形態11を組み合わせたものであって、非音声区間検出部14’による非音声区間の検出結果を利得関数選択部4に入力し、非音声区間検出部14’の検出結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴がある。なお、これ以外の構成については実施形態並びに実施形態11と共通であるから説明を省略する。
【0092】
而して、本実施形態では、入力信号の非音声区間の検出精度を向上させることで利得関数選択部4における利得関数の選択制度が向上し、入力信号の信号/雑音比の低下を一層確実に抑えることができるとともに構成の簡略化が図れるという利点がある。
【0093】
【発明の効果】
請求項1の発明は、入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音成分を検出する雑音検出部と、入力信号の16m秒程度の短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音成分の大きさに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部と、利得算出部で算出された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部とを備え、雑音検出部は、入力信号の前記短い時間を16倍した時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択してなり、長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とし、短時間平均値は主に入力信号に含まれる雑音成分以外の信号成分によってそのレベルが決まるから、雑音検出部で検出される雑音の程度に応じて複数の利得関数のうちから何れか一つを選択するとともに選択された利得関数及び短時間平均値から算出される利得で入力信号を増幅することにより、単一の利得関数のみで利得制御を行う従来例に比較して、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、入力信号に含まれる雑音の程度に応じて利得関数を選択し、さらに雑音成分以外の信号成分によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数を選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。また、長時間平均値は主に入力信号に含まれる雑音成分によってそのレベルが決まるから入力信号に含まれる雑音の程度を表す値として用いることができ、入力信号に含まれる雑音の程度が比較的容易に検出できる。さらに、雑音成分のレベルによって決まる入力信号の長時間平均値を的確に検出することができて信号/雑音比の向上が図れる。しかも、一般に入力信号の状態が変化する際に利得の変動が大きくなることから、利得の変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することによって雑音成分が増幅されるのを抑えて信号/雑音比の低下が防止できる。
【0096】
請求項の発明は、請求項の発明において、長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とし、入力信号から直接長時間平均を検出する場合に比較して検出に要する手間や構成が簡略化できる。
【0097】
請求項の発明は、請求項1又は2の発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とし、音声信号に含まれる背景雑音の成分を長時間平均値として検出することができ、背景雑音成分のレベルに応じた適切な利得関数の選択が可能となる。
【0098】
請求項の発明は、請求項1の発明において、雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とし、非音声信号の周波数スペクトルは主に入力信号に含まれる雑音成分によってそのレベルが決まるから入力信号に含まれる雑音の程度を表す値として用いることができ、入力信号に含まれる雑音の程度が比較的容易に検出できる。
【0099】
請求項の発明は、請求項1〜の何れかの発明において、短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とし、しきい値を越えるようなレベルの高い入力信号が入力された場合に出力信号が歪むのを防止することができる。
【0100】
請求項の発明は、請求項1〜の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とし、音声信号でない非音声信号に対する利得が必要以上に大きくなるのを防いで出力信号の信号/雑音比の低下を抑えることができる。
【0101】
請求項の発明は、請求項1〜の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とし、音声信号以外の出力信号を減衰させることで雑音を低減することができる。
【0102】
請求項の発明は、請求項の発明において、出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とし、入力信号が非音声信号から音声信号に切り換わったときに音声信号の先頭部分の音量が低下するといった不具合の発生を防いで通話品質の向上が図れる。
【0103】
請求項の発明は、請求項6又は7又は8の発明において、入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とし、長時間平均値が短時間平均値よりも相対的に大きな値となるときに入力信号判別用のしきい値を変更することにより、音声信号か否かの判別に対する入力信号の雑音成分の影響を低減することができる。
【0104】
請求項10の発明は、請求項6又は7又は8の発明において、入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とし、音声信号か否かの判別の精度が向上する。
【0105】
請求項11の発明は、請求項の発明において、前記利得変動補正部は、利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することを特徴とし、一般に入力信号の状態が変化する際に利得の変動が大きくなることから、利得の変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することによって雑音成分が増幅されるのを抑えて信号/雑音比の低下が防止できる。
【0106】
請求項12の発明は、請求項1〜11の何れかの発明において、入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とし、雑音成分を除去した後の入力信号から短時間平均を検出することにより、雑音成分の影響を受けることなく的確な利得を算出することができる。
【0107】
請求項13の発明は、請求項1〜12の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とし、音声信号以外の雑音成分を入力信号から除去するから、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。
【0108】
請求項14の発明は、請求項1〜12の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とし、音声信号以外の雑音成分を入力信号から除去するから、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、非音声区間検出部では入力信号の周波数スペクトルから非音声区間を検出することで検出の精度を向上することができる。
【0109】
請求項15の発明は、請求項14の発明において、周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とし、パワー正規化によって入力信号の周波数スペクトルの特徴が明確になって非音声区間検出部による非音声区間の検出精度が向上する。
【0110】
請求項16の発明は、請求項13又は14の発明において、雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とし、構成の簡略化が図れる。
【0111】
請求項17の発明は、請求項13又は14の発明において、雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とし、構成の簡略化が図れる。
【図面の簡単な説明】
【図1】本発明の基本例1を示すブロック図である。
【図2】同上における利得関数の説明図である。
【図3】基本例2を示すブロック図である。
【図4】基本例3を示すブロック図である。
【図5】基本例4を示すブロック図である。
【図6】同上の説明図である。
【図7】基本例5における入力信号判別部のブロック図である。
【図8】基本例6を示すブロック図である。
【図9】同上における入力信号判別部のブロック図である。
【図10】実施形態を示すブロック図である。
【図11】実施形態を示すブロック図である。
【図12】同上における雑音除去部のブロック図である。
【図13】実施形態を示すブロック図である。
【図14】実施形態を示すブロック図である。
【図15】同上における長時間平均レベル検出部の動作説明図である。
【図16】同上における長時間平均レベル検出部の動作説明図である。
【図17】実施形態を示すブロック図である。
【図18】実施形態を示すブロック図である。
【図19】実施形態を示すブロック図である。
【図20】実施形態を示すブロック図である。
【図21】実施形態を示すブロック図である。
【図22】実施形態10を示すブロック図である。
【図23】実施形態11を示すブロック図である。
【図24】実施形態12を示すブロック図である。
【図25】実施形態13を示すブロック図である。
【図26】実施形態14を示すブロック図である。
【図27】従来の自動利得制御装置における利得関数の説明図である。
【符号の説明】
1 入力信号バッファ部
2 長時間平均レベル検出部
3 短時間平均レベル検出部
4 利得関数選択部
5 利得算出部
6 出力値算出部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an automatic gain control device that controls a gain when an input signal is amplified according to the level of the input signal.
[0002]
[Prior art]
In the communication field such as telephone, it is known that transmission loss varies depending on communication forms (transmission forms) such as wired and wireless, or analog communication and digital communication. Therefore, when trying to perform stable communication regardless of the magnitude of transmission loss, for example, trying to make the volume of the sound heard by the listener almost constant regardless of the volume (volume) of the speaker's voice (speech) In this case, it is necessary to control the gain when amplifying the audio signal so that the volume is constant. As described above, the automatic gain control for the audio signal is performed not only in the communication field, but also in the case where the recognition rate fluctuates depending on the volume level of the input voice as in the voice recognition system, or the volume of the alarm sound or the like is set to the ambient noise level. It is used in various fields, such as when adjusting according to.
[0003]
[Non-Patent Document 1]
Materials for the Telecommunications Terminal Equipment Examination Association “Telecom Terminal Equipment Conformity Certification Criteria / Technical Conditions” Chapter 3 Explanation of Technical Standards (Terminal Equipment Regulations, etc.) 3.2 Analog Telephone Terminal Article 14 Transmission Power p. 120
[0004]
[Problems to be solved by the invention]
By the way, the conventional automatic gain control apparatus has only one gain function F indicating the gain relationship according to the level of the input signal as shown in FIG. 27. Therefore, when the level fluctuation of the input signal is large, the output signal It is difficult to perform gain control that keeps the level of the above constant (see Non-Patent Document 1).
[0005]
The present invention has been made in view of the above circumstances, and an object of the present invention is to provide an automatic gain control apparatus capable of gain control that keeps the output signal level constant even when the level fluctuation of the input signal is large. .
[0006]
[Means for Solving the Problems]
  In order to achieve the above object, an automatic gain control device for controlling a gain when amplifying the input signal according to the level of the input signal detects a noise component included in the input signal. A noise detection unit, a short-time average level detection unit for detecting a time average of input signals in a short time of about 16 milliseconds, and a plurality of gains prepared in advance according to the magnitude of noise components detected by the noise detection unit A gain function selection unit that selects one of the gain functions from the functions, a short time average value of the input signal detected by the short time average level detection unit, and an input signal from the gain function selected by the gain function selection unit A gain calculation unit for calculating a gain when amplifyingA gain fluctuation correction unit that detects a fluctuation amount of the gain calculated by the gain calculation unit and corrects the gain in a direction to suppress the fluctuation when the detected fluctuation amount exceeds a predetermined range;The noise detection unit includes a long-time average level detection unit that detects a time average in a time obtained by multiplying the short time of the input signal by 16 times, and the gain function selection unit is detected by the long-time average level detection unit. The long-time average level detection unit estimates a noise component included in the input signal by selecting any one of a plurality of gain functions prepared in advance according to the long-time average value of the input signal. A long-term average value is detected from the value.
[0009]
  Claim2The invention of claim1In the invention, the long-time average level detection unit detects a long-time average of the input signal by averaging a plurality of short-time average values obtained by the short-time average level detection unit.
[0010]
  Claim3The invention of claim1 or 2In the invention, an input signal discriminating unit for discriminating whether or not the input signal is an audio signal is provided, and the long-time average level detecting unit determines the length of the input signal only when the input signal discriminating unit discriminates that the input signal is not an audio signal. It is characterized by detecting a time average.
[0011]
  Claim4In the invention of claim 1, in the invention of claim 1, the noise detection unit includes a non-speech section detection unit that detects a non-speech section in which an input signal does not include a speech signal, a frequency conversion unit that obtains a frequency spectrum of the input signal, A non-speech spectrum estimation unit that estimates a frequency spectrum of a non-speech signal that is not a speech signal from a frequency spectrum obtained by a frequency conversion unit in a non-speech segment detected by a non-speech segment detection unit; One of the gain functions is selected from a plurality of gain functions prepared in advance according to the frequency spectrum of the non-speech signal estimated by the non-speech spectrum estimation unit.
[0012]
  Claim5The invention of claim 1 to claim 14In any of the inventions, the short-time peak detection unit that detects the peak value of the input signal within a unit time when the short-time average level detection unit detects the short-time average value, and the short-time peak detection unit detects And a gain correction unit that corrects the gain calculated by the gain calculation unit when the peak value to be exceeded exceeds a predetermined threshold value.
[0013]
  Claim6The invention of claim 1 to claim 15In any of the inventions, an input signal discriminating unit that discriminates whether or not the input signal is an audio signal, and the gain function selecting unit changes the gain function to be selected according to the discrimination result of the input signal discriminating unit. Features.
[0014]
  Claim7The invention of claim 1 to claim 16In any of the inventions, an input signal discriminating unit for discriminating whether or not the input signal is an audio signal, and an output signal for amplifying the output signal after the input signal discriminated to be an audio signal by the input signal discriminating unit And an attenuation unit.
[0015]
  Claim8The invention of claim7In the invention, the output signal attenuating unit changes the attenuation amount of the output signal stepwise when the discrimination result in the input signal discriminating unit is switched.
[0016]
  Claim9The invention of claim6 or 7 or 8In the invention, the input signal determination unit includes an average value ratio calculation unit that calculates a ratio between the long-time average value and the short-time average value of the input signal, and an average value difference calculation that calculates a difference between the long-time average value and the short-time average value. Of the audio signal depending on whether one of the ratio calculated by the average value ratio calculation unit and the difference calculated by the average value difference calculation unit exceeds a predetermined threshold corresponding to each of the ratio. The threshold value in the other is changed based on one of the ratio calculated by the average value ratio calculation unit and the difference calculated by the average value difference calculation unit.
[0017]
  Claim10The invention of claim6 or 7 or 8In the invention, the input signal determining unit determines whether or not the input signal is an audio signal from the frequency analysis result of the input signal.
[0018]
  The invention of claim 11 is claimed in claim5In the invention ofThe gain fluctuation correction unitThe gain variation corrected by the acquisition correction unit is detected, and when the detected variation exceeds a predetermined range, the gain is corrected so as to suppress the variation.RukoAnd features.
[0019]
  Claim12The invention of claim 1 to claim 111In any of the inventions, a noise removing unit for removing a noise component from an input signal is provided, and an output signal of the noise removing unit is used as an input to the short-time average level detecting unit.
[0020]
  Claim13The invention of claim 1 to claim 112The present invention further comprises a noise component removing unit that removes noise components other than the audio signal from the previous input signal input to the noise detecting unit, and the noise component removing unit includes the audio signal in the time axis input signal. A non-speech section detector for detecting non-speech sections, a frequency converter for obtaining a frequency spectrum of an input signal by frequency conversion, and a frequency obtained by the frequency converter for a non-speech section detected by the non-speech section detector A non-speech spectrum estimator that estimates the frequency spectrum of a non-speech signal that is not a speech signal from the spectrum, and a frequency that subtracts the frequency spectrum of the non-speech signal estimated by the non-speech spectrum estimator from the frequency spectrum obtained by the frequency converter Spectral subtraction unit and frequency spectrum subtraction unit to convert time domain signal from frequency spectrum Characterized by comprising the Mel frequency inversion unit.
[0021]
  Claim14The invention of claim 1 to claim 112The noise component removing means removes a noise component other than the voice signal from the previous input signal inputted to the noise detecting section, and the noise component removing means has a frequency for obtaining a frequency spectrum of the input signal by frequency conversion. A conversion unit, a non-speech segment detection unit for detecting a non-speech segment in which the speech signal is not included in the input signal from the frequency spectrum of the input signal obtained from the frequency conversion unit, and a non-speech segment detected by the non-speech segment detection unit A non-speech spectrum estimation unit that estimates a frequency spectrum of a non-speech signal that is not a speech signal from the frequency spectrum obtained by the frequency conversion unit, and a non-speech spectrum estimation unit that estimates the frequency spectrum obtained by the frequency conversion unit. Frequency spectrum subtraction unit that subtracts the frequency spectrum of the audio signal and the frequency obtained by the frequency spectrum subtraction unit Characterized by comprising the frequency inverse conversion unit for obtaining the signal in the time axis by frequency inverse conversion from spectrum.
[0022]
  Claim15The invention of claim14In the invention, a spectrum normalization unit is provided that obtains a normalized spectrum obtained by power normalizing the frequency spectrum obtained from the frequency conversion unit and supplies the normalized spectrum to the non-speech section detection unit.
[0023]
  Claim16The invention of claim13 or 14In the present invention, the non-speech spectrum estimation unit of the noise detection unit is also used as the non-speech spectrum estimation unit of the noise component removing means.
[0024]
  Claim17The invention of claim13 or 14In the present invention, the non-speech section detecting unit of the noise detecting unit is also used as the non-speech section detecting unit of the noise component removing means.
[0025]
DETAILED DESCRIPTION OF THE INVENTION
  Hereinafter, the present invention will be described in detail with reference to the drawings. However, each embodiment described below exemplifies a case where the automatic gain control device of the present invention is applied to a system or device that handles an audio signal. However, the type of input signal to be processed is limited to the audio signal. The technical idea of the present invention can be applied not only to a system but also to all systems and devices having an amplifier for amplifying a signal. In each embodiment, an input signal converted into a digital signal is handled, but the input signal can be handled as an analog signal.Here, before describing the embodiment of the present invention, a basic example having the same basic configuration as the present invention will be described.
[0026]
  (Basic example1)
  BookBasic exampleAs shown in FIG. 1, the automatic gain control apparatus includes an input signal buffer unit 1 that temporarily stores an input signal, and a relatively long time of the input signal (the input signal stored in the input signal buffer unit 1). A long-time average level detection unit 2 that detects an average, a short-time average level detection unit 3 that detects a time average of an input signal (an input signal stored in the input signal buffer unit 1) in a relatively short time, and a long time The gain function Fi (i = 1, 2) is selected from a plurality of gain functions F1, F2,..., Fn prepared in advance according to the long-term average value of the input signal detected by the average level detector 2. ,..., N), and the gain function Fi selected by the gain function selection unit 4 and the short-time average value of the input signal detected by the short-time average level detection unit 3. Gain when amplifying An output value for calculating an output signal from the gain calculation unit 5 to be output and the gain calculated by the gain calculation unit 5 and the input signal stored in the input signal buffer unit 1, in other words, an output value for amplifying the input signal by the calculated gain And a calculation unit 6.
[0027]
The input signal buffer unit 1 stores an input signal (input data) input in a short time of about 16 ms (hereinafter referred to as “buffer time”), and the short-time average level detection unit 3 stores the input signal buffer. The arithmetic average value (short-time average value) of the input signal level for the buffer time stored in the unit 1 is calculated, and the long-time average level detection unit 2 inputs an input signal that is a fixed multiple (for example, 16 times) of the buffer time. The arithmetic average value (long-term average value) of the level is calculated. The long-time average level detection unit 2 includes a buffer having a buffer time (capacity) that is a fixed multiple (for example, 16 times) of the buffer time of the input signal buffer unit 1 in order to calculate a long-time average value. .
[0028]
The gain function selection unit 4 holds data of three types of gain functions F1, F2, and F3 as shown in FIG. The gain function F1 indicated by the solid line in FIG. 2 has the largest gain (slope of the solid line) among the three types, and the input level upper limit L1 is the smallest. Further, the gain function F3 indicated by a broken line in the figure has the smallest gain among the three types and the largest upper limit L3 of the input level. Further, in the gain function F2 indicated by a dashed line in the figure, the upper limit value L2 of the gain and the input level is set to an intermediate value among the three types. However, these gain functions F1 to F3 are examples, and the types and numbers thereof are not limited to those shown in FIG.
[0029]
  Next bookBasic exampleThe operation of will be described.
[0030]
The long-time average value of the input signal obtained by the long-time average level detection unit 2 is given to the gain function selection unit 4, and the gain function selection unit 4 selects an appropriate gain function Fi (i = 1, 1) according to the long-time average value. 2, 3) is selected. Here, taking a telephone call or other communication device as an example, the average value of the long-term average value is generally determined mainly by noise components (components other than voice) included in the input signal, and the short-time average value is mainly The level is considered to be determined by the signal component (sound component) included in the input signal. Therefore, if the long-time average value is a relatively large value, there are many noise components contained in the input signal, and conversely if the long-time average value is a relatively small value, the input signal contains few noise components. Since it can be determined, the gain function selection unit 4 selects the gain function F1 if the long-term average value is relatively small, selects the gain function F3 if it is relatively large, and gains if it is relatively intermediate. Select function F2. The gain calculation unit 5 obtains an output level by substituting the short-time average value calculated by the short-time average level detection unit 3 into the input level of the selected gain function Fi, and determines the output level as the input level (short-time average value). ) To calculate the gain.
[0031]
Then, the output value calculation unit 6 calculates an output value from the gain calculated by the gain calculation unit 5 and the input signal stored in the input signal buffer unit 1, in other words, the input signal with the gain calculated by the gain calculation unit 5. The output signal is obtained by amplifying the signal.
[0032]
Thus, as the noise component included in the input signal, for example, ambient noise of a communication device such as a telephone becomes relatively large, the gain decreases and the upper limit value Li (i = 1, 2, 3) of the input level increases. Since the gain function Fi is selected by the gain function selection unit 4, the output signal level is higher even when the level fluctuation of the input signal is larger than in the conventional example in which gain control is performed only with a single gain function. Gain control can be maintained. In addition, the gain function Fi is selected according to the long-term average value of the input signal determined by the level of the noise component, and the short-time average value determined by the signal component (speech component) other than the noise component and the selected gain function. In order to calculate the gain when amplifying the input signal, a decrease in the signal / noise ratio of the output signal is suppressed as compared with the case where the gain is determined by selecting the gain function Fi according to the level of the input signal itself. Can do.
[0033]
  (Basic example2)
  BookBasic exampleAs shown in FIG. 3, the short time peak detection unit 7 that detects the peak value of the input signal within a unit time (buffer time) when the short time average level detection unit 3 detects the short time average value, It is characterized in that it includes a gain correction unit 8 that corrects the gain calculated by the gain calculation unit 5 when the peak value detected by the short-time peak detection unit 7 exceeds a predetermined threshold value. About the configurationBasic exampleThe description is omitted because it is common to 1.
[0034]
  Thus,Basic example1, when the peak value of the input signal increases to some extent, an overflow may occur when the output value calculation unit 6 calculates the output value. If an overflow occurs in the output value calculation unit 6, so-called clipping noise is generated. May cause a deterioration in call quality.
[0035]
  Book against itBasic exampleThen, when the peak value detected by the short time peak detection unit 7 exceeds a predetermined threshold value, the gain correction unit 8 corrects the gain calculated by the gain calculation unit 5 to a relatively small value. Yes. As a result, even when an input signal having a high level exceeding the threshold value is input, it is possible to prevent clipping noise from occurring in the output signal or distortion of the output signal.
[0036]
  (Basic example3)
  BookBasic example4 includes an input signal discriminating unit 9 that discriminates whether or not the input signal is an audio signal, and changes the gain function selected by the gain function selecting unit 4 according to the discrimination result of the input signal discriminating unit 9 There is a feature in the point thatBasic exampleThe description is omitted because it is common to 2.
[0037]
The input signal discriminating unit 9 can be realized by using a conventionally known technique. For example, the short-time average value obtained by the short-time average level detection unit 3 and the long-time average obtained by the long-time average level detection unit 2 are used. By comparing the ratio with the value to a predetermined threshold value, it is determined whether or not the input signal is an audio signal. For example, H is obtained when the input signal is an audio signal, and L when the input signal is not an audio signal (non-audio signal). A binary signal (discrimination signal) is output.
[0038]
  The gain function selector 4Basic exampleAs described in 1, the gain function F1 is selected if the long-term average value is relatively small, the gain function F3 is selected if it is relatively large, and the gain function F2 is selected if it is relatively intermediate. However, even when the gain function F1 or F2 is selected, when the determination signal output from the input signal determination unit 9 is L, that is, when the input signal is a non-speech signal, the selected gain function F1 or F2 The gain function F3 has a smaller gain than that.
[0039]
Thus, when the functions F1 and F2 having a large gain are selected when the input signal is a non-voice signal, the level of the non-voice signal becomes larger than necessary and the noise on the call increases. Thus, it is determined whether the input signal is an audio signal or a non-audio signal, and in the case of a non-audio signal, the gain function selection unit 4 changes the gain function Fi to a small gain. It is possible to prevent the gain from becoming unnecessarily large and to suppress a decrease in the signal / noise ratio of the input signal.
[0040]
  (Basic example4)
  BookBasic exampleAs shown in FIG. 5, the input signal discriminating unit 9 discriminates whether or not the input signal is an audio signal, and attenuates the output signal after the input signal discriminated by the input signal discriminating unit 9 as a non-audio signal is amplified. The output signal attenuating unit 10 is characterized in that it has a feature, other configurations areBasic exampleThe description is omitted because it is common to 2.
[0041]
  The input signal discrimination unit 9Basic example3, for example, a discrimination signal that is H when the input signal is an audio signal and L when the input signal is a non-audio signal is output. The output signal attenuating unit 10 attenuates the signal (output signal) output from the output value calculating unit 6 when the determination signal output from the input signal determining unit 9 is L, that is, when the input signal is a non-speech signal. It is something to be made. When the input signal is an audio signal, the output signal attenuation unit 10 passes the output signal as it is without being attenuated.
[0042]
  Thus,Basic exampleIf the functions F1 and F2 having large gains are selected when the input signal is a non-speech signal as described in FIG. 3, the level of the non-speech signal becomes larger than necessary and the noise on the call increases. As described above, it is determined whether the input signal is a voice signal or a non-voice signal. If the input signal is a non-voice signal, the output signal is attenuated by the output signal attenuating unit 10, so that the output signal other than the voice signal is attenuated. Therefore, noise can be reduced.
[0043]
By the way, before and after the input signal is switched from a voice signal to a non-voice signal or from a non-voice signal to a voice signal, the level of the output signal varies greatly depending on whether or not the output signal is attenuated by the output signal attenuation unit 10. There is a possibility that the voice quality may be deteriorated due to the voice being interrupted or suddenly increasing.
[0044]
Therefore, in the output signal attenuating unit 10, it is desirable to change the attenuation amount of the output signal stepwise when the discrimination result in the input signal discriminating unit 9 is switched. For example, an input signal as shown in FIG. 6A is input, and as shown in FIG. 6B, the input signal discrimination result by the input signal discrimination unit 9 is switched from a non-speech signal to a voice signal at time t1. Assume that the audio signal is switched to the non-audio signal at time t2. At this time, instead of switching the presence / absence of attenuation by the output signal attenuator 10 at times t1 and t2 as shown in FIG. 4C, a few ms from t1 and t2 as shown in FIG. For several tens of ms, output with an attenuation (indicated as “low attenuation” in FIG. 6) smaller than the attenuation when the input signal is a non-speech signal (indicated as “high attenuation” in FIG. 6). It attenuates the signal.
[0045]
Thus, if the attenuation amount of the output signal by the output signal attenuating unit 10 is changed stepwise when the discrimination result in the input signal discriminating unit 9 is switched, the input signal is switched from the non-speech signal to the audio signal. Therefore, it is possible to improve the call quality by preventing the occurrence of problems such as a decrease in the volume of the head portion of the audio signal.
[0046]
  (Basic example5)
  BookBasic exampleIs characterized by the configuration of the input signal discriminating unit 9, and for other configurations,Basic exampleSince it is common to 3 and 4, illustration and description are omitted.
[0047]
  BookBasic exampleAs shown in FIG. 7, the input signal determination unit 9 in FIG. 7 includes an average value ratio calculation unit 9 a for obtaining a ratio between the long-time average value and the short-time average value (= short-time average value / long-time average value) of the input signal, An average value difference calculating unit 9b that determines a difference between the long-time average value and the short-time average value and compares the difference value with a predetermined threshold value to determine whether the signal is an audio signal, and an average value ratio calculating unit A threshold value determination unit 9c that determines a threshold value in the average value difference calculation unit 9b according to the ratio of the average values obtained in 9a.
[0048]
  That is, with a conventionally known configuration, it is only necessary to determine whether or not the input signal is an audio signal by comparing the calculated value of the average value ratio calculating unit 9a or the average value difference calculating unit 9b with a predetermined threshold value. However, the threshold value determination unit 9c determines the threshold value in the average value difference calculation unit 9b according to the average value ratio obtained by the average value ratio calculation unit 9a.Basic exampleThere are features. For example, when the ratio calculated by the average value ratio calculation unit 9a is larger than 1, it is considered that the input signal is likely to be an audio signal. Conversely, when the ratio is smaller than 1, the input signal is audio. The possibility that it is not a signal is considered high.
[0049]
  BookBasic example, The threshold value determination unit 9c increases the threshold value when the ratio calculated by the average value ratio calculation unit 9a is larger than 1, and conversely the ratio calculated by the average value ratio calculation unit 9a is smaller than 1. In this case, by reducing the threshold value, the influence of the noise component (long-term average value) of the input signal on the determination of whether or not it is an audio signal is reduced.
[0050]
  BookBasic exampleThe threshold value determining unit 9c determines the threshold value in the average value difference calculating unit 9b according to the average value ratio obtained by the average value ratio calculating unit 9a. The threshold value determination unit 9c may determine the threshold value in the average value ratio calculation unit 9a according to the difference value obtained in 9b. Or you may make it determine each threshold value of the average value ratio calculation part 9a and the average value difference calculation part 9b adaptively according to a long-time average value.
[0051]
  (Basic example6)
  BookBasic example8 is characterized in that it includes an input signal discriminating unit 11 that discriminates whether or not the input signal is an audio signal from the frequency analysis result of the input signal, as shown in FIG.Basic exampleThe description is omitted because it is common to 4. That meansBasic exampleThe input signal determination unit 9 in FIG. 4 determines whether the input signal is an audio signal by comparing the ratio between the short time average value and the long time average value with a predetermined threshold, for example. The input signal is distinguished from theBasic exampleThe input signal discriminating unit 11 discriminates the input signal from the result of frequency analysis of the input signal.
[0052]
As shown in FIG. 9, the input signal discrimination unit 11 temporarily analyzes the frequency spectrum of the input signal obtained by the frequency analysis unit 11a and the frequency analysis unit 11a that performs frequency analysis by fast Fourier transform (FFT) of the input signal. Obtained by the delay unit 11b to store, the non-speech component spectrum estimation unit 11c that estimates the frequency spectrum of the component of non-speech (for example, ambient noise collected by the microphone of the other communication device), and the frequency analysis unit 11a A spectrum subtracting unit 11d that subtracts the frequency spectrum of the non-speech component estimated by the non-speech component spectrum estimating unit 11c from the frequency spectrum of the input signal, and the power of the frequency spectrum of the subtraction component (difference) obtained by the spectrum subtracting unit 11d. The subtraction component power calculation unit 11e to be calculated and the power value obtained by the subtraction component power calculation unit 11e are A sound signal is judged to be a sound signal when a certain threshold value is exceeded, and a non-voice signal is judged to be a non-voice signal when the threshold value is not exceeded (for example, “H” for a sound signal and “L” for a non-voice signal) A discrimination signal output unit 11f that outputs a signal).
[0053]
In the non-speech signal spectrum estimation unit 11c, when the discrimination signal of L level is output from the discrimination signal output unit 11f, that is, when the input signal is determined to be a non-speech signal, the non-speech estimated up to that point The average of the frequency spectrum of the component and the frequency spectrum of the input signal stored in the delay unit 11b is obtained, and the average value is used as the estimated value of the frequency spectrum of the non-voice component thereafter. In addition, when obtaining the average of the frequency spectrum of the non-speech component and the frequency spectrum of the input signal, it can be obtained by simple addition and division. However, the weight spectrum is multiplied and then added and divided. May be.
[0054]
  Book as aboveBasic exampleThe input signal discriminating unit 11 in FIG. 3 compares the input signal with the input signal discriminating unit 9 that treats the input signal as a time-series signal and discriminates whether or not it is an audio signal. Thus, there is an advantage that the accuracy of determination as to whether or not the sound signal is improved.
[0055]
  (Embodiment1)
  In the present embodiment, as shown in FIG. 10, the gain fluctuation that is corrected by the gain correction unit 8 is detected, and the gain fluctuation is corrected so that the fluctuation is suppressed when the detected fluctuation exceeds a predetermined range. There is a feature in that the correction unit 12 is provided, and for other configurations, for example,Basic example6 is the same as that of FIG.
[0056]
Usually, when the input signal is an audio signal, the signal level increases. Therefore, in order to keep the output signal constant, the gain tends to decrease as the level of the audio signal increases. On the other hand, the gain is considered to vary greatly when the input signal is switched from a non-speech signal to a speech signal or from a speech signal to a non-speech signal. Therefore, the gain tends to increase greatly at the time when the input signal is switched from the audio signal to the non-audio signal, and noise may be amplified if the gain remains at a large value after switching to the non-audio signal. is there.
[0057]
  Therefore, in the present embodiment, the gain variation corrected by the gain correction unit 8 is detected by the gain variation correction unit 12, and when the detected variation exceeds a predetermined range, the gain is increased in a direction to suppress the variation. I am trying to correct it. For example, the gain variation correction unit 12 detects the time point when the input signal switches from the audio signal to the non-speech signal based on the gain variation, and corrects and decreases the gain after switching to the non-speech signal. It is possible to prevent the non-voice signal (noise) from being greatly amplified and to prevent the signal / noise ratio of the input signal from being lowered. In this embodiment, the gain corrected by the gain correction unit 8 is corrected by the gain variation correction unit 12, but the gain calculated by the gain calculation unit 5 is corrected by the gain variation correction unit 12, for example, ,Basic exampleEven when the gain variation correction unit 12 is added to the configuration of 1, the same effect can be obtained.
[0058]
  (Embodiment2)
  As shown in FIG. 11, the present embodiment is characterized by including a noise removing unit 13 that removes a noise component from an input signal, and using the output signal of the noise removing unit 13 as an input to the short-time average level detecting unit 3. Other configurations are embodiments.1Since it is common, explanation is omitted.
[0059]
As shown in FIG. 12, the noise removing unit 13 performs a Fourier transform on the input signal to obtain a frequency spectrum, and a delay unit 13b that temporarily stores the frequency spectrum of the input signal obtained by the Fourier transform unit 13a. A non-speech component spectrum estimation unit 13c that estimates a frequency spectrum of a component of non-speech (for example, ambient noise collected by a microphone of a partner communication device), and a frequency spectrum of an input signal obtained by the Fourier transform unit 13a A subtractor 13d for subtracting the frequency spectrum of the non-speech component estimated by the non-speech component spectrum estimator 13c, and an inverse Fourier transform unit 13e for performing an inverse Fourier transform on the subtracted component (difference) obtained by the spectrum subtractor 13d. The signal output from the inverse Fourier transform unit 13e is miscellaneous from the input signal. A signal component (component of the ambient noise) has been removed. Here, in the non-speech signal spectrum estimation unit 13c, when the L-level discrimination signal is output from the input signal discrimination unit 11, that is, when the input signal is discriminated as a non-speech signal, estimation is performed up to that point. The average of the frequency spectrum of the non-speech component and the frequency spectrum of the input signal stored in the delay unit 13b is obtained, and the average value is used as the estimated value of the frequency spectrum of the non-speech component thereafter.
[0060]
If the signal from which the noise component is removed from the input signal by the noise removing unit 13 as described above is used as the input to the short-time average level detecting unit 3, the short-time average is detected from the input signal after the noise component is removed. Thus, an accurate gain can be calculated without being affected by noise components.
[0061]
  (Embodiment3)
  The present embodiment is characterized in that the long-time average level detection unit 2 ′ detects the long-time average value from the estimated value of the noise component included in the input signal as shown in FIG. Embodiment2Since it is common, explanation is omitted.
[0062]
The long-time average level detection unit 2 ′ in the present embodiment returns the frequency spectrum of the non-speech component (ambient noise) estimated by the non-speech component spectrum estimation unit 13c of the noise removal unit 13 to the time axis signal by inverse Fourier transform. Then, a long-term average value is obtained for the signal.
[0063]
Thus, in the long-time average level detection unit 2 in the previous embodiment, since the simple arithmetic average of the input signal is set to the long-time average value, the rate of including not only noise components but also speech components is high. However, since the long-term average level detection unit 2 ′ in the present embodiment obtains the long-term average value from the estimated value of the noise component included in the input signal, the rate at which the voice component is included can be significantly reduced. Thus, the long-term average value of the input signal determined by the level of the noise component can be accurately detected, and the signal / noise ratio can be improved. Further, since the long-time average value can be accurately detected, an appropriate gain can be calculated so as to suppress amplification of noise components included in the input signal.
[0064]
  (Embodiment4)
  In the present embodiment, as shown in FIG. 14, the long time average level detection unit 2 ″ averages a plurality of short time average values obtained by the short time average level detection unit 3 to detect the long time average of the input signal. There is a feature in the point, and for other configurations, the embodiment2Since it is common, explanation is omitted.
[0065]
  Basic Examples 1 to 6 and Embodiments 1 and 2As shown in FIG. 16A, when the input signal buffer unit 1 has a buffer length of, for example, 128 bits, the long-time average level detection unit 2 has x times the input signal buffer unit 1 (for example, , 16 times) buffer length (128 × 16 = 2048 bits).
[0066]
On the other hand, since the long-time average level detection unit 2 ″ in this embodiment calculates the long-time average value from the short-time average value detected by the short-time average level detection unit 3, as shown in FIG. It is only necessary that x (for example, 16) short-time average values can be stored in the buffer of the long-time average level detection unit 2 ″. Therefore, in the present embodiment, the buffer length of the long-time average level detection unit 2 ″ can be greatly reduced (in the above example, from 2048 bits to 16 bits). There is an advantage that the buffer capacity is reduced, and the arithmetic average obtained for each y of the total x short-time average values is stored in the buffer, and the average value of these y values is averaged for a long time. If the value is obtained, the buffer capacity of the long-time average level detection unit 2 ″ can be further reduced.
[0067]
  (Embodiment5)
  In this embodiment, as shown in FIG. 17, the long-time average level detection unit 2 ″ detects the long-time average of the input signal only when the input signal determination unit 11 determines that it is not a voice signal, that is, a non-voice signal. There is a feature in the point to do, for the configuration other than this embodiment4Since it is common, description is abbreviate | omitted.
[0068]
Thus, the long time average level detection unit 2 ″ does not calculate the long time average value when the determination signal output from the input signal determination unit 11 is at the H level (when the input signal is an audio signal). Since the long-term average value is calculated when the signal is at L level (when the input signal is a non-speech signal), the background noise component contained in the voice signal can be detected as the long-term average value, and the background noise component It is possible to select an appropriate gain function according to the level.
[0069]
  (Embodiment6)
  The present embodiment is characterized in that noise component removing means for removing noise components other than the audio signal from the input signal is provided in the previous stage of the input signal buffer unit 1. However, regarding the configuration and operation after the input signal buffer unit 1Basic exampleThe description is omitted because it is common to 1.
[0070]
As shown in FIG. 18, the noise component removing means in the present embodiment includes a non-speech section detector 14 that detects a non-speech section in which a speech signal is not included in the time-axis input signal, and a frequency spectrum of the input signal by frequency conversion And a non-speech spectrum estimation unit that estimates a frequency spectrum of a non-speech signal that is not a speech signal from a frequency spectrum obtained by the frequency transform unit 15 in a non-speech segment detected by the non-speech segment detection unit 14 16, a frequency spectrum subtraction unit 17 that subtracts the frequency spectrum of the non-speech signal estimated by the non-speech spectrum estimation unit 16 from the frequency spectrum obtained by the frequency conversion unit 15, and a frequency spectrum obtained by the frequency spectrum subtraction unit 17 And a frequency inverse transform unit 18 for obtaining a time-axis signal by frequency inverse transform.
[0071]
The non-speech section detection unit 14 can be realized by using a conventionally known technique. For example, the non-speech section detection unit 14 estimates the instantaneous power of a speech component included in the input signal and estimates the level of the non-speech component (background noise component). Based on the ratio between the instantaneous power estimation value and the non-speech component level, a section (non-speech section) that can be regarded as containing no speech component in the input signal is detected. The frequency converter 15 obtains the frequency spectrum of the input signal using Fourier transform, wavelet transform, or the like.
[0072]
The non-speech spectrum estimation unit 16 obtains an average value of frequency spectra corresponding to the input signal of the non-speech section detected by the non-speech section detection unit 14 among the frequency spectra of the input signal obtained by the frequency conversion unit 15; The average value is set as the frequency spectrum estimation value of the non-speech signal. Then, by subtracting the frequency spectrum estimation value of the non-speech signal estimated by the non-speech spectrum estimation unit 16 from the frequency spectrum of the input signal obtained by the frequency conversion unit 15 in the spectrum subtraction unit 17, noise components other than the speech component are subtracted. It can be removed from the input signal. Then, frequency inverse transformation is performed on the frequency spectrum output from the spectrum subtraction unit 17 in the frequency inverse transformation unit 18 to obtain an input signal from which noise components other than the audio signal are removed.
[0073]
Thus, in the present embodiment, noise components other than the voice component included in the input signal are removed by the noise component removing unit in the previous stage of amplification, thereby preventing the quality deterioration of the voice signal due to the amplification of the noise component. be able to.
[0074]
  (Embodiment7)
  This embodiment is an embodiment as shown in FIG.6Is characterized in that a noise detection unit including a non-speech section detection unit 14, a frequency conversion unit 15, and a non-speech spectrum estimation unit 16 is used instead of the long-time average level detection unit 2. However, for other configurations and operationsBasic example1 and embodiments6Since it is common, description is abbreviate | omitted.
[0075]
  The non-speech spectrum estimation unit 16 of the present embodiment obtains the power spectrum of the frequency spectrum in the non-speech section, and further calculates the average value of the power spectrum for each band. Here, since the level of the average value of the power spectrum calculated by the non-speech spectrum estimation unit 16 is determined by the noise component included in the input signal,Basic exampleThe gain function selection unit 4 can select an appropriate gain function Fi (i = 1, 2, 3) according to the average value of the power spectrum instead of the long-time average value in 1.
[0076]
  Thus, as the noise component included in the input signal, for example, ambient noise of a communication device such as a telephone becomes relatively large, the gain decreases and the upper limit value Li (i = 1, 2, 3) of the input level increases. By selecting the gain function Fi in the gain function selection unit 4 as compared with the conventional example in which the gain control is performed only with a single gain function,Basic exampleAs in the case of 1, the gain control can be performed to keep the output signal level constant even when the level fluctuation of the input signal is large. In addition, the gain function Fi is selected according to the power spectrum average value of the frequency spectrum in the non-speech section of the input signal determined by the level of the noise component, and the short-time average value determined by the signal component (speech component) other than the noise component In order to calculate the gain when amplifying the input signal from the selected gain function, the signal / of the output signal is compared with the case where the gain is determined by selecting the gain function Fi according to the level of the input signal itself. A decrease in noise ratio can be suppressed. In the present embodiment, there is an advantage that the configuration can be simplified because a part of the noise component removing means is also used as the noise detection unit.
[0077]
  (Embodiment8)
  FIG. 20 shows a block diagram of the present embodiment. This embodimentBasic example4, the detection result of the non-speech segment by the non-speech segment detector 14 is input to the output signal attenuator 10 instead of the input signal discrimination unit 9 in FIG. 4, and the output signal after the input signal in the non-speech segment is amplified is output signal attenuated It is characterized in that it is attenuated by the part 10. Other configurations and operations areBasic example4 and embodiments7Since it is common, description is abbreviate | omitted.
[0078]
  Thus, in this embodiment,Basic example4, the output signal after amplifying the input signal in the non-speech section is attenuated by the output signal attenuating unit 10, so that the output signal other than the audio signal can be attenuated to reduce noise. There is an advantage that the configuration can be simplified by using a part of the component removing means instead of the input signal determining unit 9.
[0079]
  (Embodiment9)
  FIG. 21 shows a block diagram of the present embodiment. This embodimentBasic example3, the detection result of the non-speech section by the non-speech section detection unit 14 is input to the gain function selection unit 4 instead of the input signal determination unit 9 in FIG. 3, and the gain function selection unit 4 according to the detection result of the non-speech section detection unit 14 Is different in the gain function to be selected.Basic example3 and embodiments8Since it is common, explanation is omitted.
[0080]
  Thus, in this embodiment,Basic example3, the gain function selection unit 4 changes the gain function Fi with a small gain to the input signal in the non-speech section, thereby preventing the gain for the non-speech signal from being increased more than necessary. Further, there is an advantage that the configuration can be simplified by using a part of the noise component removing means instead of the input signal determining unit 9.
[0081]
  (Embodiment10)
  FIG. 22 shows a block diagram of the present embodiment. The present embodiment is characterized in that the non-speech section detection unit 14 ′ constituting the noise component removing unit detects a non-speech section in which the speech signal is not included in the input signal from the frequency spectrum of the input signal obtained from the frequency conversion unit 15. There are features, and other configurations and operations are the embodiments6Since it is common, explanation is omitted.
[0082]
The non-speech section detector 14 ′ in this embodiment compares the frequency spectrum of the input signal obtained by the frequency converter 15 with a frequency spectrum model of non-speech (such as ambient noise) prepared in advance, and the frequency spectrum model In accordance with the degree of coincidence, it is determined whether it is voice or non-voice for each band, and when a certain number of bands or more are determined as non-voice, the section is determined as a non-voice section, and An average of the frequency spectrum and the frequency spectrum model is taken to update the non-voice frequency spectrum model. However, the non-speech section detection unit 14 'determines that the band is non-speech when the band determined to be speech by the above-described method deviates from the desired band. Hereinafter, the frequency spectrum estimation value of the non-speech signal is obtained by the non-speech spectrum estimation unit 16 from the frequency spectrum corresponding to the input signal of the non-speech segment detected by the non-speech segment detection unit 14 ′, and the frequency subtraction unit 17 By subtracting the frequency spectrum estimation value of the non-speech signal estimated by the non-speech spectrum estimation unit 16 from the frequency spectrum of the input signal obtained by the conversion unit 15, noise components other than the speech component are removed from the input signal, and further the frequency By performing frequency inverse transform on the frequency spectrum output from the spectrum subtracting unit 17 in the inverse transforming unit 18, an input signal from which noise components other than the audio signal are removed is obtained.
[0083]
  Thus, this embodiment is also an embodiment.6Similarly, since noise components other than the voice component included in the input signal are removed by the noise component removing means in the previous stage of amplification, qualitative deterioration of the voice signal due to amplification of the noise component can be prevented. In addition, the non-speech section detector 14 ′ in this embodiment detects a non-speech section by determining whether the frequency spectrum of the input signal is speech or non-speech for each frequency band.6There is an advantage that the non-speech section detection accuracy is higher than that of the non-speech section detector 14 in FIG.
[0084]
  (Embodiment11)
  FIG. 23 shows a block diagram of this embodiment. The present embodiment is characterized in that it includes a spectrum normalization unit 19 that obtains a normalized spectrum obtained by power normalizing the frequency spectrum obtained from the frequency conversion unit 15 and supplies the normalized spectrum to the non-speech section detection unit 14 ′. Configuration and operation of the embodiment10Since it is common, explanation is omitted.
[0085]
The spectrum normalization unit 19 calculates the power spectrum of the frequency spectrum of the input signal obtained by the frequency conversion unit 15 to obtain an average value thereof, and further divides (normalizes) the power spectrum value of each frequency band by the average value. To perform the process (power normalization process). Hereinafter, the non-speech section detection unit 14 ′ detects the non-speech section of the input signal, and the frequency spectrum corresponding to the input signal in the non-speech section detected by the non-speech section detection unit 14 ′ is transferred to the non-speech spectrum estimation unit 16. Thus, the frequency spectrum estimation value of the non-speech signal is obtained, and the spectrum subtraction unit 17 subtracts the frequency spectrum estimate value of the non-speech signal estimated by the non-speech spectrum estimation unit 16 from the frequency spectrum of the input signal obtained by the frequency conversion unit 15. Thus, noise components other than the speech component are removed from the input signal, and the frequency inverse transform unit 18 performs frequency inverse transform on the frequency spectrum output from the spectrum subtracting unit 17, thereby removing the noise component other than the speech signal. An input signal from which is removed is obtained.
[0086]
  Thus, this embodiment is also an embodiment.6 or 7Similarly, since noise components other than the voice component included in the input signal are removed by the noise component removing means in the previous stage of amplification, qualitative deterioration of the voice signal due to amplification of the noise component can be prevented. In addition, since the spectrum normalization unit 19 is provided in the present embodiment, characteristics (peak portions and valley portions) in the shape of the frequency spectrum are clarified by the power normalization process, and the non-speech interval detection unit 14 ′ There is an advantage that the detection system of non-speech section by can be improved.
[0087]
  (Embodiment12)
  FIG. 24 shows a block diagram of this embodiment. This embodiment is an embodiment11Is characterized in that a noise detection unit including a spectrum normalization unit 19, a non-speech interval detection unit 14 ′, a frequency conversion unit 15, and a non-speech spectrum estimation unit 16 is used instead of the long-time average level detection unit 2, For other configurations and operations, the embodiment11And embodiments7Since it is common, description is abbreviate | omitted.
[0088]
Thus, in the present embodiment, the detection accuracy of the non-voice section of the input signal is improved, so that the gain function selection unit 4 can be prevented from making a mistake in selecting the gain function, and an appropriate gain function corresponding to the noise component included in the input signal can be prevented. Can be selected.
[0089]
  (Embodiment13)
  FIG. 25 shows a block diagram of the present embodiment. This embodiment is an embodiment8And embodiment11And the detection result of the non-speech segment by the non-speech segment detector 14 'is input to the output signal attenuator 10, and the output signal after amplifying the input signal in the non-speech segment is output to the output signal attenuator 10 is characterized by attenuation. Other configurations and operations are the embodiment.8And embodiment11Since it is common, description is abbreviate | omitted.
[0090]
Thus, in the present embodiment, by improving the detection accuracy of the non-voice section of the input signal, the noise reduction effect due to the attenuation of the output signal other than the voice signal by the output signal attenuator 10 can be enhanced and the configuration is simplified. There is an advantage that can be achieved.
[0091]
  (Embodiment14)
  FIG. 26 shows a block diagram of this embodiment. This embodiment is an embodiment9And embodiment11And the detection result of the non-speech segment by the non-speech segment detector 14 ′ is input to the gain function selector 4 and the gain function selector 4 according to the detection result of the non-speech segment detector 14 ′. The feature is that the gain function selected by is changed. For other configurations, the embodiment9And embodiment11Since it is common, explanation is omitted.
[0092]
Thus, in this embodiment, by improving the detection accuracy of the non-voice section of the input signal, the gain function selection system in the gain function selection unit 4 is improved, and the signal / noise ratio of the input signal is more reliably reduced. There is an advantage that the configuration can be simplified and the configuration can be simplified.
[0093]
【The invention's effect】
  The invention according to claim 1 is an automatic gain control device for controlling a gain when amplifying the input signal in accordance with the level of the input signal, a noise detection unit for detecting a noise component included in the input signal, One of a short-time average level detection unit for detecting a time average in a short time of about 16 milliseconds and a plurality of gain functions prepared in advance according to the magnitude of the noise component detected by the noise detection unit. Gain function selection unit for selecting the gain function, short-time average value of the input signal detected by the short-time average level detection unit, and gain for amplifying the input signal from the gain function selected by the gain function selection unit A gain calculatorA gain fluctuation correction unit that detects a fluctuation amount of the gain calculated by the gain calculation unit and corrects the gain in a direction to suppress the fluctuation when the detected fluctuation amount exceeds a predetermined range;The noise detection unit includes a long-time average level detection unit that detects a time average in a time obtained by multiplying the short time of the input signal by 16 times, and the gain function selection unit is detected by the long-time average level detection unit. The long-time average level detection unit estimates a noise component included in the input signal by selecting any one of a plurality of gain functions prepared in advance according to the long-time average value of the input signal. It is characterized by detecting the long-term average value from the value, and the level of the short-time average value is determined mainly by the signal components other than the noise component contained in the input signal. In response, the gain is selected with only a single gain function by selecting one of a plurality of gain functions and amplifying the input signal with the gain calculated from the selected gain function and the short-time average value. Compared to the conventional example in which the control, it is possible to gain control to maintain the output signal level even when the level variation is large in the input signal constant. In addition, the gain function is selected according to the degree of noise contained in the input signal, and the gain for amplifying the input signal is calculated from the short-time average value determined by the signal component other than the noise component and the selected gain function. Therefore, a decrease in the signal / noise ratio of the output signal can be suppressed as compared with the case where the gain is determined by selecting the gain function according to the level of the input signal itself. In addition, the long-term average value is determined mainly by the noise component contained in the input signal, so that it can be used as a value representing the degree of noise contained in the input signal, and the degree of noise contained in the input signal is relatively low. It can be easily detected. Further, the long-term average value of the input signal determined by the level of the noise component can be accurately detected, and the signal / noise ratio can be improved.Moreover, since the fluctuation of the gain generally increases when the state of the input signal changes, the noise component is amplified by correcting the gain in a direction to suppress the fluctuation when the fluctuation of the gain exceeds a predetermined range. The signal / noise ratio can be prevented from decreasing.
[0096]
  Claim2The invention of claim1In the invention, the long-time average level detection unit detects a long-time average of the input signal by averaging a plurality of short-time average values obtained by the short-time average level detection unit, and directly from the input signal Compared with the case of detecting the average for a long time, the labor and configuration required for detection can be simplified.
[0097]
  Claim3The invention of claim1 or 2In the invention, an input signal discriminating unit for discriminating whether or not the input signal is an audio signal is provided, and the long-time average level detecting unit determines the length of the input signal only when the input signal discriminating unit discriminates that the input signal is not an audio signal. It is characterized by detecting the time average, the background noise component included in the audio signal can be detected as the long-term average value, and an appropriate gain function can be selected according to the level of the background noise component.
[0098]
  Claim4In the invention of claim 1, in the invention of claim 1, the noise detection unit includes a non-speech section detection unit that detects a non-speech section in which an input signal does not include a speech signal, a frequency conversion unit that obtains a frequency spectrum of the input signal, A non-speech spectrum estimation unit that estimates a frequency spectrum of a non-speech signal that is not a speech signal from a frequency spectrum obtained by a frequency conversion unit in a non-speech segment detected by a non-speech segment detection unit; The frequency spectrum of the non-speech signal is characterized by selecting any one gain function from a plurality of gain functions prepared in advance according to the frequency spectrum of the non-speech signal estimated by the non-speech spectrum estimation unit. Since its level is determined mainly by the noise component contained in the input signal, it can be used as a value that represents the degree of noise contained in the input signal. The degree of noise included in the relatively easy to detect.
[0099]
  Claim5The invention of claim 1 to claim 14In any of the inventions, the short-time peak detection unit that detects the peak value of the input signal within a unit time when the short-time average level detection unit detects the short-time average value, and the short-time peak detection unit detects And a gain correction unit that corrects the gain calculated by the gain calculation unit when the peak value to be exceeded exceeds a predetermined threshold value, and an input signal having a high level exceeding the threshold value is provided. It is possible to prevent the output signal from being distorted when input.
[0100]
  Claim6The invention of claim 1 to claim 15In any of the inventions, an input signal discriminating unit that discriminates whether or not the input signal is an audio signal, and the gain function selecting unit changes the gain function to be selected according to the discrimination result of the input signal discriminating unit. As a feature, it is possible to prevent a gain for a non-voice signal that is not a voice signal from becoming unnecessarily large, and to suppress a decrease in the signal / noise ratio of the output signal.
[0101]
  Claim7The invention of claim 1 to claim 16In any of the inventions, an input signal discriminating unit for discriminating whether or not the input signal is an audio signal, and an output signal for amplifying the output signal after the input signal discriminated to be an audio signal by the input signal discriminating unit An attenuation unit is provided, and noise can be reduced by attenuating output signals other than audio signals.
[0102]
  Claim8The invention of claim7In the invention, the output signal attenuating unit changes the attenuation amount of the output signal stepwise when the discrimination result in the input signal discriminating unit is switched, and the input signal is switched from the non-speech signal to the audio signal. Therefore, it is possible to improve the call quality by preventing the occurrence of problems such as a decrease in the volume of the head portion of the audio signal.
[0103]
  Claim9The invention of claim6 or 7 or 8In the invention, the input signal determination unit includes an average value ratio calculation unit that calculates a ratio between the long-time average value and the short-time average value of the input signal, and an average value difference calculation that calculates a difference between the long-time average value and the short-time average value. Of the audio signal depending on whether one of the ratio calculated by the average value ratio calculation unit and the difference calculated by the average value difference calculation unit exceeds a predetermined threshold corresponding to each of the ratio. It is characterized in that the threshold value in the other is changed based on one value of the ratio calculated by the average value ratio calculation unit and the difference calculated by the average value difference calculation unit, and By changing the threshold for determining the input signal when the time average value is relatively larger than the short-time average value, the influence of the noise component of the input signal on the determination of whether or not it is an audio signal is reduced. can do.
[0104]
  Claim10The invention of claim6 or 7 or 8In the invention, the input signal determining unit determines whether or not the input signal is an audio signal from the frequency analysis result of the input signal, and the accuracy of determining whether or not the input signal is an audio signal is improved.
[0105]
  The invention of claim 11 is claimed in claim5In the invention ofThe gain fluctuation correction unitThe gain variation corrected by the acquisition correction unit is detected, and when the detected variation exceeds a predetermined range, the gain is corrected so as to suppress the variation.RukoIn general, the gain fluctuation increases when the state of the input signal changes, so that the noise component is reduced by correcting the gain in a direction to suppress the fluctuation when the gain fluctuation exceeds a predetermined range. The signal / noise ratio can be prevented from being lowered by suppressing amplification.
[0106]
  Claim12The invention of claim 1 to claim 111In any of the inventions, a noise removal unit that removes a noise component from the input signal is provided, and the output signal of the noise removal unit is used as an input to the short-time average level detection unit, and after the noise component is removed By detecting the average for a short time from the input signal, an accurate gain can be calculated without being affected by the noise component.
[0107]
  Claim13The invention of claim 1 to claim 112The present invention further comprises a noise component removing unit that removes noise components other than the audio signal from the previous input signal input to the noise detecting unit, and the noise component removing unit includes the audio signal in the time axis input signal. A non-speech section detector for detecting non-speech sections, a frequency converter for obtaining a frequency spectrum of an input signal by frequency conversion, and a frequency obtained by the frequency converter for a non-speech section detected by the non-speech section detector A non-speech spectrum estimator that estimates the frequency spectrum of a non-speech signal that is not a speech signal from the spectrum, and a frequency that subtracts the frequency spectrum of the non-speech signal estimated by the non-speech spectrum estimator from the frequency spectrum obtained by the frequency converter Spectral subtraction unit and frequency spectrum subtraction unit to convert time domain signal from frequency spectrum Characterized by comprising the Mel frequency inverse transform unit, because removed from the input signal a noise component other than the voice signals, it is possible to prevent the quality degradation of the audio signal by the amplification of the noise component.
[0108]
  Claim14The invention of claim 1 to claim 112The noise component removing means removes a noise component other than the voice signal from the previous input signal inputted to the noise detecting section, and the noise component removing means has a frequency for obtaining a frequency spectrum of the input signal by frequency conversion. A conversion unit, a non-speech segment detection unit for detecting a non-speech segment in which the speech signal is not included in the input signal from the frequency spectrum of the input signal obtained from the frequency conversion unit, and a non-speech segment detected by the non-speech segment detection unit A non-speech spectrum estimation unit that estimates a frequency spectrum of a non-speech signal that is not a speech signal from the frequency spectrum obtained by the frequency conversion unit, and a non-speech spectrum estimation unit that estimates the frequency spectrum obtained by the frequency conversion unit. Frequency spectrum subtraction unit that subtracts the frequency spectrum of the audio signal and the frequency obtained by the frequency spectrum subtraction unit It consists of a frequency inverse transform unit that obtains a time-axis signal from a spectrum by frequency inverse transform, and removes noise components other than the speech signal from the input signal. Can be prevented. Further, the non-speech section detection unit can improve the detection accuracy by detecting the non-speech section from the frequency spectrum of the input signal.
[0109]
  Claim15The invention of claim14In the invention of claim 1, characterized in that it comprises a spectrum normalization unit that obtains a normalized spectrum obtained by power normalizing the frequency spectrum obtained from the frequency conversion unit and gives the normalized spectrum to the non-speech section detection unit. The characteristic of the spectrum becomes clear and the detection accuracy of the non-speech segment by the non-speech segment detector is improved.
[0110]
  Claim16The invention of claim13 or 14In the present invention, the non-speech spectrum estimation unit of the noise detection unit is also used as the non-speech spectrum estimation unit of the noise component removal means, and the configuration can be simplified.
[0111]
  Claim17The invention of claim13 or 14In the present invention, the non-speech section detecting unit of the noise detecting unit is also used as the non-speech section detecting unit of the noise component removing means, and the configuration can be simplified.
[Brief description of the drawings]
[Figure 1]Basic example of the present invention1 is a block diagram showing 1. FIG.
FIG. 2 is an explanatory diagram of a gain function in the same as above.
[Fig. 3]Basic example2 is a block diagram showing 2. FIG.
[Fig. 4]Basic example3 is a block diagram showing 3. FIG.
[Figure 5]Basic example4 is a block diagram showing 4. FIG.
FIG. 6 is an explanatory diagram of the above.
[Fig. 7]Basic example5 is a block diagram of an input signal determination unit in FIG.
[Fig. 8]Basic example6 is a block diagram showing 6. FIG.
FIG. 9 is a block diagram of an input signal determination unit in the same as above.
FIG. 10 shows an embodiment.1FIG.
FIG. 11 shows an embodiment.2FIG.
FIG. 12 is a block diagram of a noise removing unit in the same as above.
FIG. 13 is an embodiment.3FIG.
FIG. 14 shows an embodiment.4FIG.
FIG. 15 is an operation explanatory diagram of the long-term average level detection unit in the above.
FIG. 16 is an operation explanatory diagram of the long-term average level detection unit in the above.
FIG. 17 is an embodiment.5FIG.
FIG. 18 shows an embodiment.6FIG.
FIG. 19 shows an embodiment.7FIG.
FIG. 20 shows an embodiment.8FIG.
FIG. 21 Embodiment9FIG.
FIG. 22 shows an embodiment.10FIG.
FIG. 23 Embodiment11FIG.
FIG. 24 Embodiment12FIG.
FIG. 25 is an embodiment.13FIG.
FIG. 26 Embodiment14FIG.
FIG. 27 is an explanatory diagram of a gain function in a conventional automatic gain control device.
[Explanation of symbols]
1 Input signal buffer
2 Long-time average level detector
3 Short-time average level detector
4 Gain function selector
5 Gain calculator
6 Output value calculator

Claims (17)

入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音成分を検出する雑音検出部と、入力信号の16m秒程度の短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音成分の大きさに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部と、利得算出部で算出された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部とを備え、雑音検出部は、入力信号の前記短い時間を16倍した時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択してなり、長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とする自動利得制御装置。In an automatic gain control device that controls a gain when amplifying an input signal according to the level of the input signal, a noise detection unit that detects a noise component included in the input signal, and a short time of about 16 milliseconds of the input signal A short-time average level detection unit that detects a time average, and a gain function that selects any one gain function from a plurality of gain functions prepared in advance according to the magnitude of the noise component detected by the noise detection unit A gain calculating unit that calculates a gain when the input signal is amplified from a selection unit, a short-time average value of the input signal detected by the short-time average level detection unit, and a gain function selected by the gain function selection unit ; variation detected detects the variation of the calculated gain calculating section and a gain variation correction unit for correcting the gain to suppress direction change when it exceeds a predetermined range, the noise detector, A long-time average level detection unit that detects a time average of a force signal obtained by multiplying the short time by 16 times, and the gain function selection unit sets the long-time average value of the input signal detected by the long-time average level detection unit In response, one of the gain functions prepared in advance is selected, and the long-term average level detection unit detects the long-term average value from the estimated noise component contained in the input signal. An automatic gain control device. 長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とする請求項1記載の自動利得制御装置。  2. The automatic gain control according to claim 1, wherein the long time average level detection unit detects a long time average of the input signal by averaging a plurality of short time average values obtained by the short time average level detection unit. apparatus. 入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とする請求項1又は2記載の自動利得制御装置。  An input signal discriminating unit that discriminates whether or not the input signal is an audio signal, and the long-term average level detection unit detects the long-term average of the input signal only when the input signal discriminating unit discriminates that it is not an audio signal The automatic gain control device according to claim 1 or 2, wherein 雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とする請求項1記載の自動利得制御装置。  The noise detector includes a non-speech section detector that detects a non-speech section in which an input signal does not include a speech signal, a frequency converter that obtains a frequency spectrum of the input signal, and a non-speech detected by the non-speech section detector A non-speech spectrum estimation unit that estimates a frequency spectrum of a non-speech signal that is not a speech signal from a frequency spectrum obtained by a frequency conversion unit in a section, and the gain function selection unit is a non-speech that is estimated by the non-speech spectrum estimation unit 2. The automatic gain control apparatus according to claim 1, wherein any one of a plurality of gain functions prepared in advance according to the frequency spectrum of the signal is selected. 短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とする請求項1〜4の何れかに記載の自動利得制御装置。  The short-time peak detection unit for detecting the peak value of the input signal within a unit time when the short-time average level detection unit detects the short-time average value, and the peak value detected by the short-time peak detection unit are predetermined. 5. The automatic gain control device according to claim 1, further comprising a gain correction unit that corrects the gain calculated by the gain calculation unit when the threshold value is exceeded. 入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とする請求項1〜5の何れかに記載の自動利得制御装置。  The input signal discriminating unit for discriminating whether or not the input signal is an audio signal, and the gain function selecting unit changes a gain function to be selected according to the discrimination result of the input signal discriminating unit. 6. The automatic gain control device according to any one of 5 above. 入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とする請求項1〜6の何れかに記載の自動利得制御装置。  An input signal discriminating unit that discriminates whether or not the input signal is an audio signal, and an output signal attenuating unit that attenuates the output signal after amplifying the input signal that is discriminated to be an audio signal by the input signal discriminating unit An automatic gain control device according to any one of claims 1 to 6. 出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とする請求項7記載の自動利得制御装置。  8. The automatic gain control device according to claim 7, wherein the output signal attenuating unit changes the attenuation amount of the output signal stepwise when the discrimination result in the input signal discriminating unit is switched. 入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とする請求項6又は7又は8記載の自動利得制御装置。  The input signal determination unit includes an average value ratio calculation unit that calculates a ratio between the long-time average value and the short-time average value of the input signal, and an average value difference calculation unit that calculates a difference between the long-time average value and the short-time average value. And determining the audio signal based on whether one of the ratio calculated by the average value ratio calculation unit and the difference calculated by the average value difference calculation unit exceeds a predetermined threshold corresponding to each of the ratios. The threshold value in the other is changed based on one of the ratio calculated by the average value ratio calculation unit and the difference calculated by the average value difference calculation unit. Or the automatic gain control apparatus of 8. 入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とする請求項6又は7又は8記載の自動利得制御装置。  9. The automatic gain control apparatus according to claim 6, 7 or 8, wherein the input signal determination unit determines whether or not the input signal is a voice signal from a frequency analysis result of the input signal. 前記利得変動補正部は、利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することを特徴とする請求項記載の自動利得制御装置。 Said gain variation correction portion includes a characterized and Turkey to correct the gain to suppress direction change when the variation was detected and detects the variation of the corrected gain gain correction unit exceeds a predetermined range The automatic gain control device according to claim 5 . 入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とする請求項1〜11の何れかに記載の自動利得制御装置。  The automatic gain control according to any one of claims 1 to 11, further comprising a noise removing unit that removes a noise component from the input signal, wherein the output signal of the noise removing unit is used as an input to the short-time average level detecting unit. apparatus. 雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする請求項1〜12の何れかに記載の自動利得制御装置。  A noise component removing unit that removes a noise component other than a voice signal from a previous input signal input to the noise detection unit, and the noise component removing unit includes a non-voice section in which the voice signal is not included in the time axis input signal; A non-speech section detecting unit for detecting a speech signal, a frequency converting unit for obtaining a frequency spectrum of an input signal by frequency conversion, and a speech signal from the frequency spectrum obtained by the frequency converting unit for a non-speech section detected by the non-speech section detecting unit A non-speech spectrum estimation unit that estimates a frequency spectrum of a non-speech signal that is not, a frequency spectrum subtraction unit that subtracts the frequency spectrum of the non-speech signal estimated by the non-speech spectrum estimation unit from the frequency spectrum obtained by the frequency conversion unit, , Frequency inverse transformation to obtain a time-axis signal by frequency inverse transformation from the frequency spectrum obtained by the frequency spectrum subtraction unit Automatic gain control apparatus according to any one of claims 1 to 12, characterized in that it consists of a part. 雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする請求項1〜12の何れかに記載の自動利得制御装置。  A noise component removing unit that removes a noise component other than a voice signal from a previous input signal input to the noise detecting unit, the noise component removing unit; a frequency converting unit that obtains a frequency spectrum of the input signal by frequency conversion; A non-speech section detecting unit for detecting a non-speech section in which an input signal does not include a speech signal from a frequency spectrum of an input signal obtained from a frequency transform unit, and a frequency converting unit for a non-speech section detected by the non-speech section detecting unit A non-speech spectrum estimator that estimates the frequency spectrum of a non-speech signal that is not a speech signal from the frequency spectrum obtained in step 1, and the frequency of the non-speech signal estimated by the non-speech spectrum estimator from the frequency spectrum obtained by the frequency converter The frequency spectrum subtraction unit that subtracts the spectrum and the frequency spectrum obtained by the frequency spectrum subtraction unit Automatic gain control apparatus according to any one of claims 1 to 12, characterized in that it consists of a frequency inversion section for obtaining the signal in the time axis by the number inverse transformation. 周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とする請求項14記載の自動利得制御装置。  15. The automatic gain control apparatus according to claim 14, further comprising: a spectrum normalization unit that obtains a normalized spectrum obtained by power normalizing the frequency spectrum obtained from the frequency conversion unit and supplies the normalized spectrum to the non-speech section detection unit. 雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とする請求項13又は14記載の自動利得制御装置。  15. The automatic gain control apparatus according to claim 13, wherein the non-speech spectrum estimation unit of the noise detection unit is also used as the non-speech spectrum estimation unit of the noise component removing unit. 雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とする請求項13又は14記載の自動利得制御装置。  15. The automatic gain control device according to claim 13, wherein the non-speech section detection unit of the noise detection unit is also used as the non-speech section detection unit of the noise component removing unit.
JP2002334172A 2002-07-29 2002-11-18 Automatic gain controller Expired - Fee Related JP4321049B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002334172A JP4321049B2 (en) 2002-07-29 2002-11-18 Automatic gain controller

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002220322 2002-07-29
JP2002334172A JP4321049B2 (en) 2002-07-29 2002-11-18 Automatic gain controller

Publications (2)

Publication Number Publication Date
JP2004129187A JP2004129187A (en) 2004-04-22
JP4321049B2 true JP4321049B2 (en) 2009-08-26

Family

ID=32300616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002334172A Expired - Fee Related JP4321049B2 (en) 2002-07-29 2002-11-18 Automatic gain controller

Country Status (1)

Country Link
JP (1) JP4321049B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190074718A (en) * 2017-12-20 2019-06-28 주식회사 디엠씨시스 Adjusting system of audio output considering users' characteristics and adjusting method therefor

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100561440B1 (en) * 2004-07-24 2006-03-17 삼성전자주식회사 Apparatus and method for compensating audio volume automatically in response to the change of channel
JP4604836B2 (en) * 2005-05-20 2011-01-05 ブラザー工業株式会社 Voice processing device, communication device, and program
JP4631581B2 (en) * 2005-07-27 2011-02-16 パナソニック電工株式会社 Loudspeaker
JP4650163B2 (en) * 2005-08-25 2011-03-16 パナソニック電工株式会社 Loudspeaker
US8396574B2 (en) 2007-07-13 2013-03-12 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
JP4826625B2 (en) 2008-12-04 2011-11-30 ソニー株式会社 Volume correction device, volume correction method, volume correction program, and electronic device
JP5120288B2 (en) 2009-02-16 2013-01-16 ソニー株式会社 Volume correction device, volume correction method, volume correction program, and electronic device
JP5316560B2 (en) * 2011-02-07 2013-10-16 ソニー株式会社 Volume correction device, volume correction method, and volume correction program
JP5702666B2 (en) * 2011-05-16 2015-04-15 富士通テン株式会社 Acoustic device and volume correction method
JP6065308B2 (en) * 2012-09-07 2017-01-25 パナソニックIpマネジメント株式会社 Volume correction device
KR20160132574A (en) 2015-05-11 2016-11-21 현대자동차주식회사 Auto gain control module, control method for the same, vehicle including the same, control method for the same
WO2018006927A1 (en) * 2016-07-04 2018-01-11 Harman Becker Automotive Systems Gmbh Automatic correction of loudness level in audio signals containing speech signals

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190074718A (en) * 2017-12-20 2019-06-28 주식회사 디엠씨시스 Adjusting system of audio output considering users' characteristics and adjusting method therefor
KR102009383B1 (en) * 2017-12-20 2019-08-09 주식회사 디엠씨시스 Adjusting system of audio output considering users' characteristics and adjusting method therefor

Also Published As

Publication number Publication date
JP2004129187A (en) 2004-04-22

Similar Documents

Publication Publication Date Title
JP4681163B2 (en) Howling detection and suppression device, acoustic device including the same, and howling detection and suppression method
EP2241099B1 (en) Acoustic echo reduction
US6618701B2 (en) Method and system for noise suppression using external voice activity detection
KR100860805B1 (en) Voice enhancement system
JP4321049B2 (en) Automatic gain controller
JP5036874B2 (en) Echo canceller
EP2265039B1 (en) Hearing aid
EP2811485A1 (en) Sound correcting apparatus, sound correcting program, and sound correcting method
US20110125494A1 (en) Speech Intelligibility
US8321215B2 (en) Method and apparatus for improving intelligibility of audible speech represented by a speech signal
EP2444966A1 (en) Audio signal processing device and audio signal processing method
JP3961290B2 (en) Noise suppressor
US20030216908A1 (en) Automatic gain control
US8489393B2 (en) Speech intelligibility
US8675901B2 (en) Howling suppression device, hearing aid, howling suppression method, and integrated circuit
US8838444B2 (en) Method of estimating noise levels in a communication system
US20140185833A1 (en) Audio processing apparatus and method
US20130156205A1 (en) Howling detection device, howling suppressing device and method of detecting howling
CN103270740A (en) Voice control device, method of controlling voice, voice control program and mobile terminal device
JP2004341339A (en) Noise restriction device
JP3973929B2 (en) Howling detection device
US20150039300A1 (en) Vehicle-mounted communication device
US7085370B1 (en) Ringback detection circuit
CN110136734B (en) Method and audio noise suppressor for reducing musical artifacts using nonlinear gain smoothing
JP2008522511A (en) Method and apparatus for adaptive speech processing parameters

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050614

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071016

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090525

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees