JP2004129187A - 自動利得制御装置 - Google Patents

自動利得制御装置 Download PDF

Info

Publication number
JP2004129187A
JP2004129187A JP2002334172A JP2002334172A JP2004129187A JP 2004129187 A JP2004129187 A JP 2004129187A JP 2002334172 A JP2002334172 A JP 2002334172A JP 2002334172 A JP2002334172 A JP 2002334172A JP 2004129187 A JP2004129187 A JP 2004129187A
Authority
JP
Japan
Prior art keywords
input signal
signal
unit
speech
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002334172A
Other languages
English (en)
Other versions
JP4321049B2 (ja
Inventor
Akira Terasawa
寺澤 章
Hiroaki Takeyama
竹山 博昭
Hiroko Maeda
前田 裕子
Yasuhisa Ihira
井平 靖久
Minoru Fukushima
福島 実
Akihiro Kikuchi
菊池 彰洋
Satoshi Sugimoto
杉本 敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP2002334172A priority Critical patent/JP4321049B2/ja
Publication of JP2004129187A publication Critical patent/JP2004129187A/ja
Application granted granted Critical
Publication of JP4321049B2 publication Critical patent/JP4321049B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Control Of Amplification And Gain Control (AREA)

Abstract

【課題】入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御を可能とする。
【解決手段】利得関数選択部4は、長時間平均値が相対的に小さければ利得関数F1を選択し、相対的に大きければ利得関数F3を選択し、相対的に中間レベルにあれば利得関数F2を選択する。利得算出部5は選択された利得関数Fiの入力レベルに短時間平均値を代入して出力レベルを求め、その出力レベルを入力レベル(短時間平均値)で除算することによって利得を算出する。故に、単一の利得関数のみで利得制御を行う従来例に比較して、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。
【選択図】    図1

Description

【0001】
【発明の属する技術分野】
本発明は、入力信号のレベルに応じて入力信号を増幅する際の利得を制御する自動利得制御装置に関するものである。
【0002】
【従来の技術】
電話等の通信分野では、有線と無線、あるいはアナログ通信とデジタル通信といった通信形態(伝送形態)により伝送損失が異なることが知られている。したがって、伝送損失の大小にかかわらずに安定した通信を行おうとした場合、例えば、話し手の声(発話音声)の大きさ(音量)によらずに聞き手に聞こえる音声の音量をほぼ一定にしようとした場合、音量を一定とするように音声信号を増幅する際の利得を制御する必要がある。このように音声信号に対する自動利得制御は、上記通信分野のみならず、音声認識システムのように入力音声の音量レベルによって認識率が変動してしまう場合、あるいは警報音等の音量を周囲の騒音レベルに応じて調整する場合というように様々な分野に用いられている。
【0003】
【非特許文献1】
財団法人電気通信端末機器審査協会資料 「電気通信端末機器等適合認定基準/技術的条件」 第3章 技術基準(端末設備等規則)の解説 3.2アナログ電話端末 第14条 送出電力 p.120
【0004】
【発明が解決しようとする課題】
ところで従来の自動利得制御装置では、図27に示すような入力信号のレベルに応じた利得の関係を示す利得関数Fを一つしか備えていないため、入力信号のレベル変動が大きい場合に出力信号のレベルを一定に保つ利得制御を行うことが困難であった(非特許文献1参照)。
【0005】
本発明は上記事情に鑑みて為されたものであり、その目的は、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能な自動利得制御装置を提供することにある。
【0006】
【課題を解決するための手段】
請求項1の発明は、上記目的を達成するために、入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音の程度を検出する雑音検出部と、入力信号の比較的短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音の程度に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部とを備えたことを特徴とする。
【0007】
請求項2の発明は、請求項1の発明において、雑音検出部は、入力信号の比較的長い時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とする。
【0008】
請求項3の発明は、請求項2の発明において、長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とする。
【0009】
請求項4の発明は、請求項2又は3の発明において、長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とする。
【0010】
請求項5の発明は、請求項2又は3又は4の発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とする。
【0011】
請求項6の発明は、請求項1の発明において、雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とする。
【0012】
請求項7の発明は、請求項1〜6の何れかの発明において、短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とする。
【0013】
請求項8の発明は、請求項1〜7の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とする。
【0014】
請求項9の発明は、請求項1〜8の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とする。
【0015】
請求項10の発明は、請求項9の発明において、出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とする。
【0016】
請求項11の発明は、請求項8又は9又は10の発明において、入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とする。
【0017】
請求項12の発明は、請求項8又は9又は10の発明において、入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とする。
【0018】
請求項13の発明は、請求項1〜12の何れかの発明において、利得算出部で算出された利得又は利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部を備えたことを特徴とする。
【0019】
請求項14の発明は、請求項1〜13の何れかの発明において、入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とする。
【0020】
請求項15の発明は、請求項1〜14の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする。
【0021】
請求項16の発明は、請求項1〜14の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする。
【0022】
請求項17の発明は、請求項16の発明において、周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とする。
【0023】
請求項18の発明は、請求項15又は16の発明において、雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とする。
【0024】
請求項19の発明は、請求項15又は16の発明において、雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とする。
【0025】
【発明の実施の形態】
以下、図面を参照して本発明を実施形態により詳細に説明する。但し、以下に説明する各実施形態では音声信号を扱うシステムや機器に本発明の自動利得制御装置を適用した場合を例示しているが、対象となる入力信号の種類は音声信号に限定されるものではなく、信号を増幅する増幅器等を有するシステムや機器全般について本発明の技術思想が適用可能である。また、各実施形態ではデジタル信号に変換された入力信号を取り扱っているが、入力信号をアナログ信号のままで取り扱うことも可能である。
【0026】
(実施形態1)
本実施形態の自動利得制御装置は、図1に示すように入力信号を一時的に記憶する入力信号バッファ部1と、入力信号(入力信号バッファ部1に記憶された入力信号)の比較的長い時間における時間平均を検出する長時間平均レベル検出部2と、入力信号(入力信号バッファ部1に記憶された入力信号)の比較的短い時間における時間平均を検出する短時間平均レベル検出部3と、長時間平均レベル検出部2で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数F1,F2,…,Fnのうちから何れか一つの利得関数Fi(i=1,2,…,n)を選択する利得関数選択部4と、短時間平均レベル検出部3で検出される入力信号の短時間平均値及び利得関数選択部4で選択された利得関数Fiから入力信号を増幅する際の利得を算出する利得算出部5と、利得算出部5で算出した利得と入力信号バッファ部1に記憶された入力信号とから出力信号を算出する、言い換えると入力信号を算出された利得で増幅する出力値算出部6とを備えている。
【0027】
入力信号バッファ部1では、例えば16ms程度の短い時間(以下、「バッファ時間」と呼ぶ)に入力された入力信号(入力データ)を記憶しており、短時間平均レベル検出部3では入力信号バッファ部1に記憶されているバッファ時間分の入力信号レベルの算術平均値(短時間平均値)を算出し、長時間平均レベル検出部2ではバッファ時間の定倍(例えば、16倍)の入力信号レベルの算術平均値(長時間平均値)を算出している。なお、長時間平均レベル検出部2では長時間平均値を算出するために入力信号バッファ部1のバッファ時間の定倍(例えば、16倍)のバッファ時間(容量)を有するバッファを具備している。
【0028】
利得関数選択部4は、図2に示すような3種類の利得関数F1,F2,F3のデータを保持している。図2に実線で示した利得関数F1は3種類のうちで利得(実線の傾き)が最も大きく、且つ入力レベルの上限値L1が最も小さくなっている。また、同図に破線で示した利得関数F3は3種類のうちで利得が最も小さく、且つ入力レベルの上限値L3が最も大きくなっている。さらに、同図に一点破線で示した利得関数F2は利得及び入力レベルの上限値L2が何れも3種類のうちの中間の値に設定されている。但し、これらの利得関数F1〜F3は一例であって、その種類や数は図2に示したものに限定されるものではない。
【0029】
次に本実施形態の動作を説明する。
【0030】
長時間平均レベル検出部2で求めた入力信号の長時間平均値が利得関数選択部4に与えられ、利得関数選択部4では長時間平均値に応じた適切な利得関数Fi(i=1,2,3)を選択する。ここで、電話機等の通信機器による通話を例にとると、一般に長時間平均値は主に入力信号に含まれる雑音成分(音声以外の成分)によってそのレベルが決まり、短時間平均値は主に入力信号に含まれる信号成分(音声成分)によってそのレベルが決まると考えられる。したがって、長時間平均値が相対的に大きな値であれば入力信号に含まれる雑音成分が多く、反対に長時間平均値が相対的に小さな値であれば入力信号に含まれる雑音成分が少ないと判断できるから、利得関数選択部4では、長時間平均値が相対的に小さければ利得関数F1を選択し、相対的に大きければ利得関数F3を選択するとともに、相対的に中間レベルにあれば利得関数F2を選択する。利得算出部5では選択された利得関数Fiの入力レベルに短時間平均レベル検出部3で算出された短時間平均値を代入して出力レベルを求め、その出力レベルを入力レベル(短時間平均値)で除算することによって利得を算出する。
【0031】
そして、出力値算出部6において利得算出部5で算出した利得と入力信号バッファ部1に記憶されている入力信号とから出力値を算出する、言い換えると利得算出部5で算出した利得で入力信号を増幅することで出力信号を得ている。
【0032】
而して、入力信号に含まれる雑音成分、例えば電話機等の通信機器の周囲雑音が相対的に大きくなるに従って利得が減少し且つ入力レベルの上限値Li(i=1,2,3)が大きくなるように利得関数選択部4にて利得関数Fiを選択しているため、単一の利得関数のみで利得制御を行う従来例に比較して、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、雑音成分のレベルによって決まる入力信号の長時間平均値に応じて利得関数Fiを選択し、さらに雑音成分以外の信号成分(音声成分)によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数Fiを選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。
【0033】
(実施形態2)
本実施形態は、図3に示すように短時間平均レベル検出部3にて短時間平均値を検出する際の単位時間(バッファ時間)内における入力信号のピーク値を検出する短時間ピーク検出部7と、短時間ピーク検出部7で検出されるピーク値が所定のしきい値を越える場合に利得算出部5で算出された利得を補正する利得補正部8とを備える点に特徴があり、これ以外の構成については実施形態1と共通であるから説明を省略する。
【0034】
而して、実施形態1においては、入力信号のピーク値がある程度大きくなった場合に出力値算出部6における出力値の算出時にオーバーフローが発生する可能性があり、仮に出力値算出部6でオーバーフローが発生すると所謂クリッピングノイズが生じて通話品質を劣化させてしまう虞がある。
【0035】
それに対して本実施形態では、短時間ピーク検出部7で検出されるピーク値が所定のしきい値を越える場合、利得補正部8が利得算出部5で算出された利得を相対的に小さい値に補正するようにしている。その結果、しきい値を越えるようなレベルの高い入力信号が入力された場合でも出力信号にクリッピングノイズが生じたり、あるいは出力信号が歪むのを防止することができる。
【0036】
(実施形態3)
本実施形態は、図4に示すように入力信号が音声信号か否かを判別する入力信号判別部9を備え、入力信号判別部9の判別結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴があり、これ以外の構成については実施形態2と共通であるから説明を省略する。
【0037】
入力信号判別部9は従来周知の技術を用いて実現可能であって、例えば、短時間平均レベル検出部3で求めた短時間平均値と、長時間平均レベル検出部2で求めた長時間平均値との比を所定のしきい値と比較することにより、入力信号が音声信号か否かを判別し、例えば音声信号であるときにH、音声信号でない(非音声信号)ときにLとなる2値信号(判別信号)を出力する。
【0038】
利得関数選択部4は、実施形態1で説明したように長時間平均値が相対的に小さければ利得関数F1を選択し、相対的に大きければ利得関数F3を選択するとともに、相対的に中間レベルにあれば利得関数F2を選択するが、利得関数F1又はF2を選択した場合であっても、入力信号判別部9から出力される判別信号がL、つまり入力信号が非音声信号である場合には、選択した利得関数F1又はF2よりも利得の小さい利得関数F3に変更するようになっている。
【0039】
而して、入力信号が非音声信号のときに利得の大きい関数F1,F2を選択すると、非音声信号のレベルが必要以上に大きくなって通話上のノイズが増えてしまうことになるが、上述のように入力信号が音声信号か非音声信号かを判別し、非音声信号の場合には利得関数選択部4にて利得の小さい利得関数Fiに変更するようにしているから、非音声信号に対する利得が必要以上に大きくなるのを防いで入力信号の信号/雑音比の低下を抑えることができる。
【0040】
(実施形態4)
本実施形態は、図5に示すように入力信号が音声信号か否かを判別する入力信号判別部9と、入力信号判別部9により非音声信号と判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部10とを備えた点に特徴があり、これ以外の構成については実施形態2と共通であるから説明を省略する。
【0041】
入力信号判別部9は実施形態3と共通であって、例えば入力信号が音声信号であるときにH、非音声信号のときにLとなる判別信号を出力する。また、出力信号減衰部10は、入力信号判別部9から出力される判別信号がL、つまり入力信号が非音声信号である場合に出力値算出部6から出力された信号(出力信号)を減衰させるものである。なお、入力信号が音声信号である場合には出力信号減衰部10では出力信号を減衰させずにそのまま通過させる。
【0042】
而して、実施形態3で説明したように入力信号が非音声信号のときに利得の大きい関数F1,F2を選択すると、非音声信号のレベルが必要以上に大きくなって通話上のノイズが増えてしまうことになるが、上述のように入力信号が音声信号か非音声信号かを判別し、非音声信号の場合には出力信号減衰部10によって出力信号を減衰させているから、音声信号以外の出力信号を減衰させることで雑音を低減することができる。
【0043】
ところで、入力信号が音声信号から非音声信号あるいは非音声信号から音声信号に切り換わる前後において、出力信号減衰部10による出力信号の減衰の有無に伴って出力信号のレベルが大きく変動するから、通話音声が途切れたり、急に大きくなる等して通話品質が低下してしまう虞がある。
【0044】
そこで、出力信号減衰部10においては、入力信号判別部9における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることが望ましい。例えば、図6(a)に示すような入力信号が入力され、同図(b)に示すように時刻t1で入力信号判別部9による入力信号の判別結果が非音声信号から音声信号に切り換わり、時刻t2で音声信号から非音声信号に切り換わると仮定する。このとき、同図(c)に示すように時刻t1,t2でそれぞれ出力信号減衰部10による減衰の有無を切り換えるのではなく、同図(d)に示すように時刻t1,t2から数ms〜数十msの間は入力信号が非音声信号のときの減衰量(図6中では「減衰量大」と表記)よりも小さい減衰量(図6中では「減衰量小」と表記)で出力信号を減衰させるのである。
【0045】
このように出力信号減衰部10による出力信号の減衰量を入力信号判別部9における判別結果が切り換わる際に段階的に変化させるようにすれば、入力信号が非音声信号から音声信号に切り換わったときに音声信号の先頭部分の音量が低下するといった不具合の発生を防いで通話品質の向上が図れる。
【0046】
(実施形態5)
本実施形態は、入力信号判別部9の構成に特徴があり、これ以外の構成については実施形態3又は4と共通であるから図示並びに説明を省略する。
【0047】
本実施形態における入力信号判別部9は、図7に示すように入力信号の長時間平均値及び短時間平均値の比率(=短時間平均値÷長時間平均値)を求める平均値比率算出部9aと、長時間平均値及び短時間平均値の差分を求めるとともその差分値を所定のしきい値と比較することで音声信号か否かを判別する平均値差分算出部9bと、平均値比率算出部9aで求めた平均値の比率に応じて平均値差分算出部9bにおけるしきい値を決定するしきい値決定部9cとを具備している。
【0048】
すなわち、従来周知の構成であれば、平均値比率算出部9a又は平均値差分算出部9bの算出値を所定のしきい値と比較することで入力信号が音声信号か否かを判別するのみであるが、平均値差分算出部9bにおけるしきい値を、平均値比率算出部9aで求めた平均値の比率に応じてしきい値決定部9cにて決定している点に本実施形態の特徴がある。例えば、平均値比率算出部9aで算出した比率が1よりも大きい場合には入力信号が音声信号である可能性が高いと考えられ、反対に比率が1よりも小さい場合には入力信号が音声信号でない可能性が高いと考えられる。
【0049】
そこで本実施形態においては、しきい値決定部9cが平均値比率算出部9aで算出した比率が1よりも大きい場合にしきい値を大きくし、反対に平均値比率算出部9aで算出した比率が1よりも小さい場合にしきい値を小さくすることによって、音声信号か否かの判別に対する入力信号の雑音成分(長時間平均値)の影響を低減するようにしている。
【0050】
なお、本実施形態では、平均値比率算出部9aで求めた平均値の比率に応じて平均値差分算出部9bにおけるしきい値をしきい値決定部9cにて決定しているが、反対に平均値差分算出部9bで求めた差分値に応じて平均値比率算出部9aにおけるしきい値をしきい値決定部9cにて決定するようにしても構わない。あるいは、長時間平均値に応じて平均値比率算出部9a及び平均値差分算出部9bの各しきい値を適応的に決定するようにしても構わない。
【0051】
(実施形態6)
本実施形態は、図8に示すように入力信号の周波数分析結果から入力信号が音声信号か否かを判別する入力信号判別部11を備えた点に特徴があり、これ以外の構成は実施形態4と共通であるから説明を省略する。つまり、実施形態4における入力信号判別部9では、例えば短時間平均値と長時間平均値の比を所定のしきい値と比較することによって入力信号が音声信号か否かを判別するというように時間系列の信号から入力信号の判別を行っているのに対し、本実施形態における入力信号判別部11では、入力信号を周波数分析した結果から入力信号の判別を行っている。
【0052】
入力信号判別部11は、図9に示すように入力信号を高速フーリエ変換(FFT)することで周波数分析する周波数分析部11aと、周波数分析部11aで得られる入力信号の周波数スペクトルを一時的に保存する遅延部11bと、非音声(例えば、相手の通信機器のマイクロホンで集音された周囲騒音)の成分の周波数スペクトルを推定する非音声成分スペクトル推定部11cと、周波数分析部11aで得られる入力信号の周波数スペクトルから非音声成分スペクトル推定部11cで推定された非音声成分の周波数スペクトルを減算するスペクトル減算部11dと、スペクトル減算部11dで求めた減算成分(差分)の周波数スペクトルのパワーを計算する減算成分パワー計算部11eと、減算成分パワー計算部11eで求めたパワー値が所定のしきい値を越えるときに音声信号、越えないときに非音声信号と判断して判別信号(例えば、音声信号のときに「H」、非音声信号のときに「L」となる2値信号)を出力する判別信号出力部11fとを具備している。
【0053】
非音声信号スペクトル推定部11cでは、判別信号出力部11fからLレベルの判別信号が出力されているとき、つまり入力信号が非音声信号と判別されているときに、その時点までに推定した非音声成分の周波数スペクトルと遅延部11bに保存されている入力信号の周波数スペクトルの平均を求め、その平均値をそれ以降における非音声成分の周波数スペクトルの推定値としている。なお、非音声成分の周波数スペクトルと入力信号の周波数スペクトルの平均を求める場合、単純な加算及び除算で求めることも可能であるが、それぞれに重み係数を乗算した後に加算及び除算して求めるようにしても良い。
【0054】
上述のように本実施形態における入力信号判別部11は入力信号の周波数分析結果から音声信号か否かを判別するため、入力信号を時系列の信号として取り扱って音声信号か否かの判別を行う入力信号判別部9に比較して、音声信号か否かの判別の精度が向上するという利点がある。
【0055】
(実施形態7)
本実施形態は、図10に示すように利得補正部8で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部12を備えた点に特徴があり、これ以外の構成については、例えば実施形態6と共通であるから説明を省略する。
【0056】
通常、入力信号は音声信号であるときの方が信号レベルが大きくなるから、出力信号を一定に保つためには音声信号のレベルが大きいほど利得は小さくなる傾向にある。一方、利得は、入力信号が非音声信号から音声信号あるいは音声信号から非音声信号に切り換わる時点で大きく変動すると考えられる。したがって、入力信号が音声信号から非音声信号に切り換わる時点では利得が大きく増大する傾向にあり、非音声信号に切り換わった後に利得が大きい値のままであると雑音が増幅されてしまう虞がある。
【0057】
そこで本実施形態では、利得変動補正部12によって利得補正部8で補正された利得の変動分を検出するとともに、検出した変動分が所定範囲を超える場合に、その変動を抑制する方向へ利得を補正するようにしている。例えば、利得変動補正部12は入力信号が音声信号から非音声信号に切り換わる時点を利得の変動分に基づいて検出し、非音声信号に切り換わった後の利得を補正して減少させるので、非音声信号(雑音)が大きく増幅されるのを抑えて入力信号の信号/雑音比の低下を防止することができる。なお、本実施形態では利得補正部8で補正された利得を利得変動補正部12で補正する構成としたが、利得算出部5で算出された利得を利得変動補正部12で補正する構成、例えば、実施形態1の構成に利得変動補正部12を追加した構成であっても同様の効果を奏する。
【0058】
(実施形態8)
本実施形態は、図11に示すように入力信号から雑音成分を除去する雑音除去部13を備え、雑音除去部13の出力信号を短時間平均レベル検出部3の入力とした点に特徴があり、これ以外の構成は実施形態7と共通であるから説明を省略する。
【0059】
雑音除去部13は、図12に示すように入力信号をフーリエ変換して周波数スペクトルを求めるフーリエ変換部13aと、フーリエ変換部13aで得られる入力信号の周波数スペクトルを一時的に保存する遅延部13bと、非音声(例えば、相手の通信機器のマイクロホンで集音された周囲騒音)の成分の周波数スペクトルを推定する非音声成分スペクトル推定部13cと、フーリエ変換部13aで得られる入力信号の周波数スペクトルから非音声成分スペクトル推定部13cで推定された非音声成分の周波数スペクトルを減算するスペクトル減算部13dと、スペクトル減算部13dで求めた減算成分(差分)を逆フーリエ変換する逆フーリエ変換部13eとを具備しており、逆フーリエ変換部13eから出力される信号は入力信号から雑音成分(周囲騒音の成分)が除去された信号となる。ここで、非音声信号スペクトル推定部13cでは、入力信号判別部11からLレベルの判別信号が出力されているとき、つまり入力信号が非音声信号と判別されているときに、その時点までに推定した非音声成分の周波数スペクトルと遅延部13bに保存されている入力信号の周波数スペクトルの平均を求め、その平均値をそれ以降における非音声成分の周波数スペクトルの推定値としている。
【0060】
上述のように雑音除去部13により入力信号から雑音成分を除去した信号を短時間平均レベル検出部3の入力とすれば、雑音成分を除去した後の入力信号から短時間平均を検出することにより、雑音成分の影響を受けることなく的確な利得を算出することができる。
【0061】
(実施形態9)
本実施形態は、図13に示すように長時間平均レベル検出部2’が入力信号に含まれる雑音成分の推定値から長時間平均値を検出する点に特徴があり、これ以外の構成については実施形態8と共通であるから説明を省略する。
【0062】
本実施形態における長時間平均レベル検出部2’は、雑音除去部13の非音声成分スペクトル推定部13cで推定された非音声成分(周囲騒音)の周波数スペクトルを逆フーリエ変換により時間軸信号に戻し、その信号について長時間平均値を求める。
【0063】
而して、先の実施形態における長時間平均レベル検出部2では、入力信号の単純な算術平均を長時間平均値としているために雑音成分だけでなく音声成分が含まれる率が高くなっているが、本実施形態における長時間平均レベル検出部2’は入力信号に含まれる雑音成分の推定値から長時間平均値を求めているので、音声成分が含まれる率を大幅に低減することが可能となり、雑音成分のレベルによって決まる入力信号の長時間平均値を的確に検出することができて信号/雑音比の向上が図れる。また、長時間平均値が的確に検出可能となることによって、入力信号に含まれる雑音成分の増幅を抑えるように適切な利得を算出することができる。
【0064】
(実施形態10)
本実施形態は、図14に示すように長時間平均レベル検出部2”が短時間平均レベル検出部3で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出する点に特徴があり、これ以外の構成については実施形態8と共通であるから説明を省略する。
【0065】
実施形態1〜8においては、図16(a)にしめすように入力信号バッファ部1が例えば128ビットのバッファ長を有するとしたとき、長時間平均レベル検出部2には、入力信号バッファ部1のx倍(例えば、16倍)のバッファ長(128×16=2048ビット)を持たせる必要があった。
【0066】
一方、本実施形態における長時間平均レベル検出部2”では、短時間平均レベル検出部3で検出された短時間平均値から長時間平均値を算出するので、図15(b)に示すように長時間平均レベル検出部2”のバッファにはx個(例えば、16個)の短時間平均値が格納可能であればよい。したがって、本実施形態では長時間平均レベル検出部2”のバッファ長を大幅(上述の例であれば2048ビットから16ビット)に低減することができ、長時間平均値を求める際の計算量やバッファ容量が減少するという利点がある。なお、合計x個の短時間平均値のうちからy個ずつについて求めた算術平均をバッファに格納し、それらy個の平均値を平均して長時間平均値を求めるようにすれば、長時間平均レベル検出部2”のバッファ容量をさらに低減することができる。
【0067】
(実施形態11)
本実施形態は、図17に示すように長時間平均レベル検出部2”が入力信号判別部11にて音声信号でない、つまり非音声信号と判別されたときにのみ入力信号の長時間平均を検出する点に特徴があり、これ以外の構成については実施形態10と共通であるので説明を省略する。
【0068】
而して、長時間平均レベル検出部2”は入力信号判別部11から出力される判別信号がHレベルのとき(入力信号が音声信号のとき)には長時間平均値の算出せず、判別信号がLレベルの時(入力信号が非音声信号のとき)に長時間平均値を算出するから、音声信号に含まれる背景雑音の成分を長時間平均値として検出することができ、背景雑音成分のレベルに応じた適切な利得関数の選択が可能となる。
【0069】
(実施形態12)
本実施形態は、入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を入力信号バッファ部1の前段に設けた点に特徴がある。但し、入力信号バッファ部1以降の構成並びに動作については実施形態1と共通であるから説明は省略する。
【0070】
本実施形態における雑音成分除去手段は、図18に示すように時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部14と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部15と、非音声区間検出部14で検出される非音声区間に周波数変換部15で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部16と、周波数変換部15で求められた周波数スペクトルから非音声スペクトル推定部16で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部17と、周波数スペクトル減算部17で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部18とで構成される。
【0071】
非音声区間検出部14は従来周知の技術を用いて実現可能であって、例えば、入力信号に含まれる音声成分の瞬時パワーを推定するとともに非音声成分(背景雑音成分)のレベルを推定し、瞬時パワー推定値と非音声成分レベルの比に基づいて入力信号に音声成分が含まれていないと見なし得る区間(非音声区間)を検出する。また周波数変換部15は、フーリエ変換やウェーブレット変換等を用いて入力信号の周波数スペクトルを求めている。
【0072】
非音声スペクトル推定部16は、周波数変換部15で求めた入力信号の周波数スペクトルのうちで非音声区間検出部14で検出された非音声区間の入力信号に対応する周波数スペクトルの平均値を求め、その平均値を非音声信号の周波数スペクトル推定値とする。そして、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去することができる。それから、周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0073】
而して、本実施形態では、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。
【0074】
(実施形態13)
本実施形態は、図19に示すように実施形態12における非音声区間検出部14、周波数変換部15並びに非音声スペクトル推定部16からなる雑音検出部を長時間平均レベル検出部2の代わりに用いた点に特徴がある。但し、これ以外の構成並びに動作については実施形態1及び実施形態12と共通であるから説明は省略する。
【0075】
本実施形態の非音声スペクトル推定部16では、非音声区間における周波数スペクトルのパワースペクトルを求め、さらに各帯域毎にパワースペクトルの平均値を算出している。ここで、非音声スペクトル推定部16で算出される前記パワースペクトルの平均値は入力信号に含まれる雑音成分によってそのレベルが決まるから、実施形態1における長時間平均値の代わりに前記パワースペクトルの平均値に応じて利得関数選択部4が適切な利得関数Fi(i=1,2,3)を選択することができる。
【0076】
而して、入力信号に含まれる雑音成分、例えば電話機等の通信機器の周囲雑音が相対的に大きくなるに従って利得が減少し且つ入力レベルの上限値Li(i=1,2,3)が大きくなるように利得関数選択部4にて利得関数Fiを選択することにより、単一の利得関数のみで利得制御を行う従来例に比較して、実施形態1と同様に入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、雑音成分のレベルによって決まる入力信号の非音声区間における周波数スペクトルのパワースペクトル平均値に応じて利得関数Fiを選択し、さらに雑音成分以外の信号成分(音声成分)によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数Fiを選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。なお、本実施形態では雑音成分除去手段の一部を雑音検出部と兼用しているために構成の簡略化が図れるという利点がある。
【0077】
(実施形態14)
図20に本実施形態のブロック図を示す。本実施形態は、実施形態4における入力信号判別部9の代わりに非音声区間検出部14による非音声区間の検出結果を出力信号減衰部10に入力し、非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10で減衰させる点に特徴がある。なお、これ以外の構成及び動作は実施形態4並びに実施形態13と共通であるから説明は省略する。
【0078】
而して、本実施形態では、実施形態4と同様に非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10によって減衰させることにより、音声信号以外の出力信号を減衰させて雑音を低減することができ、しかも、雑音成分除去手段の一部を入力信号判別部9の代わりに用いることで構成の簡略化が図れるという利点がある。
【0079】
(実施形態15)
図21に本実施形態のブロック図を示す。本実施形態は、実施形態3における入力信号判別部9の代わりに非音声区間検出部14による非音声区間の検出結果を利得関数選択部4に入力し、非音声区間検出部14の検出結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴があり、これ以外の構成については実施形態3並びに実施形態14と共通であるから説明を省略する。
【0080】
而して、本実施形態では実施形態3と同様に、非音声区間の入力信号に対しては利得関数選択部4が利得の小さい利得関数Fiに変更することにより、非音声信号に対する利得が必要以上に大きくなるのを防いで入力信号の信号/雑音比の低下を抑えることができ、しかも、雑音成分除去手段の一部を入力信号判別部9の代わりに用いることで構成の簡略化が図れるという利点がある。
【0081】
(実施形態16)
図22に本実施形態のブロック図を示す。本実施形態は、雑音成分除去手段を構成する非音声区間検出部14’が周波数変換部15から得られる入力信号の周波数スペクトルより入力信号に音声信号が含まれない非音声区間を検出する点に特徴があり、その他の構成及び動作については実施形態12と共通であるから説明を省略する。
【0082】
本実施形態における非音声区間検出部14’は、周波数変換部15で得られる入力信号の周波数スペクトルを、予め用意された非音声(周囲騒音など)の周波数スペクトルモデルと比較し、当該周波数スペクトルモデルと一致する程度に応じて帯域毎に音声か非音声かを判別し、一定数以上の帯域を非音声と判別した場合に当該区間を非音声区間と判断するとともに、非音声と判別した帯域の周波数スペクトルと周波数スペクトルモデルとの平均をとって非音声の周波数スペクトルモデルを更新する。但し、非音声区間検出部14’では、上述の方法により音声と判別した帯域が所望の帯域から外れる場合にはその帯域を非音声と判断する。以下、非音声区間検出部14’で検出された非音声区間の入力信号に対応する周波数スペクトルから非音声スペクトル推定部16にて非音声信号の周波数スペクトル推定値を求め、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去し、さらに周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0083】
而して、本実施形態においても実施形態12と同様に、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、本実施形態における非音声区間検出部14’では、入力信号の周波数スペクトルから周波数帯域毎に音声か非音声かを判別して非音声区間を検出しているから、実施形態12における非音声区間検出部14に比較して非音声区間の検出精度が高くなるという利点がある。
【0084】
(実施形態17)
図23に本実施形態のブロック図を示す。本実施形態は、周波数変換部15から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部14’に与えるスペクトル正規化部19を備えた点に特徴があり、これ以外の構成及び動作については実施形態16と共通であるから説明を省略する。
【0085】
スペクトル正規化部19は、周波数変換部15で求めた入力信号の周波数スペクトルのパワースペクトルを計算してその平均値を求め、さらにその平均値で各周波数帯域のパワースペクトル値を除算(正規化)する処理(パワー正規化処理)を行う。以下、非音声区間検出部14’で入力信号の非音声区間を検出し、非音声区間検出部14’で検出された非音声区間の入力信号に対応する周波数スペクトルから非音声スペクトル推定部16にて非音声信号の周波数スペクトル推定値を求め、スペクトル減算部17において周波数変換部15で求めた入力信号の周波数スペクトルから非音声スペクトル推定部16で推定した非音声信号の周波数スペクトル推定値を減算することにより、音声成分以外の雑音成分を入力信号から除去し、さらに周波数逆変換部18においてスペクトル減算部17から出力される周波数スペクトルに対して周波数逆変換を行うことにより、音声信号以外の雑音成分が除去された入力信号が得られる。
【0086】
而して、本実施形態においても実施形態12や13と同様に、雑音成分除去手段により増幅の前段階で入力信号に含まれる音声成分以外の雑音成分を除去しているため、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、本実施形態においてはスペクトル正規化部19を備えているから、パワー正規化処理によって周波数スペクトルの形状における特徴(山の部分や谷の部分)が明確になり、非音声区間検出部14’による非音声区間の検出制度が向上できるという利点がある。
【0087】
(実施形態18)
図24に本実施形態のブロック図を示す。本実施形態は、実施形態17におけるスペクトル正規化部19、非音声区間検出部14’、周波数変換部15並びに非音声スペクトル推定部16からなる雑音検出部を長時間平均レベル検出部2の代わりに用いた点に特徴があり、これ以外の構成並びに動作については実施形態17及び実施形態13と共通であるから説明は省略する。
【0088】
而して、本実施形態では入力信号の非音声区間の検出精度を向上させることで利得関数選択部4における利得関数の選択ミスを防いで入力信号に含まれる雑音成分に応じた適切な利得関数を選択することができる。
【0089】
(実施形態19)
図25に本実施形態のブロック図を示す。本実施形態は、実施形態14と実施形態17を組み合わせたものであって、非音声区間検出部14’による非音声区間の検出結果を出力信号減衰部10に入力し、非音声区間における入力信号を増幅した後の出力信号を出力信号減衰部10で減衰させる点に特徴がある。なお、これ以外の構成及び動作は実施形態14並びに実施形態17と共通であるから説明は省略する。
【0090】
而して、本実施形態では、入力信号の非音声区間の検出精度を向上させることで出力信号減衰部10による音声信号以外の出力信号の減衰による雑音低減効果を高めることができるとともに構成の簡略化が図れるという利点がある。
【0091】
(実施形態20)
図26に本実施形態のブロック図を示す。本実施形態は、実施形態15と実施形態17を組み合わせたものであって、非音声区間検出部14’による非音声区間の検出結果を利得関数選択部4に入力し、非音声区間検出部14’の検出結果に応じて利得関数選択部4が選択する利得関数を変更する点に特徴がある。なお、これ以外の構成については実施形態15並びに実施形態17と共通であるから説明を省略する。
【0092】
而して、本実施形態では、入力信号の非音声区間の検出精度を向上させることで利得関数選択部4における利得関数の選択制度が向上し、入力信号の信号/雑音比の低下を一層確実に抑えることができるとともに構成の簡略化が図れるという利点がある。
【0093】
【発明の効果】
請求項1の発明は、入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音の程度を検出する雑音検出部と、入力信号の比較的短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音の程度に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部とを備えたことを特徴とし、短時間平均値は主に入力信号に含まれる雑音成分以外の信号成分によってそのレベルが決まるから、雑音検出部で検出される雑音の程度に応じて複数の利得関数のうちから何れか一つを選択するとともに選択された利得関数及び短時間平均値から算出される利得で入力信号を増幅することにより、単一の利得関数のみで利得制御を行う従来例に比較して、入力信号のレベル変動が大きい場合でも出力信号レベルを一定に保つ利得制御が可能となる。しかも、入力信号に含まれる雑音の程度に応じて利得関数を選択し、さらに雑音成分以外の信号成分によって決まる短時間平均値と選択された利得関数とから入力信号を増幅する際の利得を算出するため、入力信号そのもののレベルに応じて利得関数を選択して利得を決定する場合に比較して、出力信号の信号/雑音比の低下を抑えることができる。
【0094】
請求項2の発明は、請求項1の発明において、雑音検出部は、入力信号の比較的長い時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とし、長時間平均値は主に入力信号に含まれる雑音成分によってそのレベルが決まるから入力信号に含まれる雑音の程度を表す値として用いることができ、入力信号に含まれる雑音の程度が比較的容易に検出できる。
【0095】
請求項3の発明は、請求項2の発明において、長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とし、雑音成分のレベルによって決まる入力信号の長時間平均値を的確に検出することができて信号/雑音比の向上が図れる。
【0096】
請求項4の発明は、請求項2又は3の発明において、長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とし、入力信号から直接長時間平均を検出する場合に比較して検出に要する手間や構成が簡略化できる。
【0097】
請求項5の発明は、請求項2又は3又は4の発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とし、音声信号に含まれる背景雑音の成分を長時間平均値として検出することができ、背景雑音成分のレベルに応じた適切な利得関数の選択が可能となる。
【0098】
請求項6の発明は、請求項1の発明において、雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とし、非音声信号の周波数スペクトルは主に入力信号に含まれる雑音成分によってそのレベルが決まるから入力信号に含まれる雑音の程度を表す値として用いることができ、入力信号に含まれる雑音の程度が比較的容易に検出できる。
【0099】
請求項7の発明は、請求項1〜6の何れかの発明において、短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とし、しきい値を越えるようなレベルの高い入力信号が入力された場合に出力信号が歪むのを防止することができる。
【0100】
請求項8の発明は、請求項1〜7の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とし、音声信号でない非音声信号に対する利得が必要以上に大きくなるのを防いで出力信号の信号/雑音比の低下を抑えることができる。
【0101】
請求項9の発明は、請求項1〜8の何れかの発明において、入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とし、音声信号以外の出力信号を減衰させることで雑音を低減することができる。
【0102】
請求項10の発明は、請求項9の発明において、出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とし、入力信号が非音声信号から音声信号に切り換わったときに音声信号の先頭部分の音量が低下するといった不具合の発生を防いで通話品質の向上が図れる。
【0103】
請求項11の発明は、請求項8又は9又は10の発明において、入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とし、長時間平均値が短時間平均値よりも相対的に大きな値となるときに入力信号判別用のしきい値を変更することにより、音声信号か否かの判別に対する入力信号の雑音成分の影響を低減することができる。
【0104】
請求項12の発明は、請求項8又は9又は10の発明において、入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とし、音声信号か否かの判別の精度が向上する。
【0105】
請求項13の発明は、請求項1〜12の何れかの発明において、利得算出部で算出された利得又は利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部を備えたことを特徴とし、一般に入力信号の状態が変化する際に利得の変動が大きくなることから、利得の変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正することによって雑音成分が増幅されるのを抑えて信号/雑音比の低下が防止できる。
【0106】
請求項14の発明は、請求項1〜13の何れかの発明において、入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とし、雑音成分を除去した後の入力信号から短時間平均を検出することにより、雑音成分の影響を受けることなく的確な利得を算出することができる。
【0107】
請求項15の発明は、請求項1〜14の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とし、音声信号以外の雑音成分を入力信号から除去するから、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。
【0108】
請求項16の発明は、請求項1〜14の発明において、雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とし、音声信号以外の雑音成分を入力信号から除去するから、雑音成分の増幅による音声信号の質的劣化を防ぐことができる。また、非音声区間検出部では入力信号の周波数スペクトルから非音声区間を検出することで検出の精度を向上することができる。
【0109】
請求項17の発明は、請求項16の発明において、周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とし、パワー正規化によって入力信号の周波数スペクトルの特徴が明確になって非音声区間検出部による非音声区間の検出精度が向上する。
【0110】
請求項18の発明は、請求項15又は16の発明において、雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とし、構成の簡略化が図れる。
【0111】
請求項19の発明は、請求項15又は16の発明において、雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とし、構成の簡略化が図れる。
【図面の簡単な説明】
【図1】実施形態1を示すブロック図である。
【図2】同上における利得関数の説明図である。
【図3】実施形態2を示すブロック図である。
【図4】実施形態3を示すブロック図である。
【図5】実施形態4を示すブロック図である。
【図6】同上の説明図である。
【図7】実施形態5における入力信号判別部のブロック図である。
【図8】実施形態6を示すブロック図である。
【図9】同上における入力信号判別部のブロック図である。
【図10】実施形態7を示すブロック図である。
【図11】実施形態8を示すブロック図である。
【図12】同上における雑音除去部のブロック図である。
【図13】実施形態9を示すブロック図である。
【図14】実施形態10を示すブロック図である。
【図15】同上における長時間平均レベル検出部の動作説明図である。
【図16】同上における長時間平均レベル検出部の動作説明図である。
【図17】実施形態11を示すブロック図である。
【図18】実施形態12を示すブロック図である。
【図19】実施形態13を示すブロック図である。
【図20】実施形態14を示すブロック図である。
【図21】実施形態15を示すブロック図である。
【図22】実施形態16を示すブロック図である。
【図23】実施形態17を示すブロック図である。
【図24】実施形態18を示すブロック図である。
【図25】実施形態19を示すブロック図である。
【図26】実施形態20を示すブロック図である。
【図27】従来の自動利得制御装置における利得関数の説明図である。
【符号の説明】
1 入力信号バッファ部
2 長時間平均レベル検出部
3 短時間平均レベル検出部
4 利得関数選択部
5 利得算出部
6 出力値算出部

Claims (19)

  1. 入力信号のレベルに応じて当該入力信号を増幅する際の利得を制御する自動利得制御装置において、入力信号に含まれる雑音の程度を検出する雑音検出部と、入力信号の比較的短い時間における時間平均を検出する短時間平均レベル検出部と、雑音検出部で検出される雑音の程度に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択する利得関数選択部と、短時間平均レベル検出部で検出される入力信号の短時間平均値及び利得関数選択部で選択された利得関数から入力信号を増幅する際の利得を算出する利得算出部とを備えたことを特徴とする自動利得制御装置。
  2. 雑音検出部は、入力信号の比較的長い時間における時間平均を検出する長時間平均レベル検出部からなり、利得関数選択部は、長時間平均レベル検出部で検出される入力信号の長時間平均値に応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とする請求項1記載の自動利得制御装置。
  3. 長時間平均レベル検出部は、入力信号に含まれる雑音成分の推定値から長時間平均値を検出することを特徴とする請求項2記載の自動利得制御装置。
  4. 長時間平均レベル検出部は、短時間平均レベル検出部で得られる複数の短時間平均値を平均することで入力信号の長時間平均を検出することを特徴とする請求項2又は3記載の自動利得制御装置。
  5. 入力信号が音声信号か否かを判別する入力信号判別部を備え、長時間平均レベル検出部は、入力信号判別部にて音声信号でないと判別されたときにのみ入力信号の長時間平均を検出することを特徴とする請求項2又は3又は4記載の自動利得制御装置。
  6. 雑音検出部は、入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部とからなり、利得関数選択部は、非音声スペクトル推定部で推定される非音声信号の周波数スペクトルに応じて予め用意された複数の利得関数のうちから何れか一つの利得関数を選択することを特徴とする請求項1記載の自動利得制御装置。
  7. 短時間平均レベル検出部にて短時間平均値を検出する際の単位時間内における入力信号のピーク値を検出する短時間ピーク検出部と、短時間ピーク検出部で検出されるピーク値が所定のしきい値を越える場合に利得算出部で算出された利得を補正する利得補正部とを備えたことを特徴とする請求項1〜6の何れかに記載の自動利得制御装置。
  8. 入力信号が音声信号か否かを判別する入力信号判別部を備え、利得関数選択部は、入力信号判別部の判別結果に応じて選択する利得関数を変更することを特徴とする請求項1〜7の何れかに記載の自動利得制御装置。
  9. 入力信号が音声信号か否かを判別する入力信号判別部と、入力信号判別部により音声信号でないと判別された入力信号を増幅した後の出力信号を減衰させる出力信号減衰部とを備えたことを特徴とする請求項1〜8の何れかに記載の自動利得制御装置。
  10. 出力信号減衰部は、入力信号判別部における判別結果が切り換わる際に出力信号の減衰量を段階的に変化させることを特徴とする請求項9記載の自動利得制御装置。
  11. 入力信号判別部は、入力信号の長時間平均値及び短時間平均値の比率を求める平均値比率算出部と、長時間平均値及び短時間平均値の差分を求める平均値差分算出部とを具備し、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方がそれぞれに対応する所定のしきい値を越えるか否かで音声信号の判別を行うとともに、平均値比率算出部で算出された比率と平均値差分算出部で算出された差分の何れか一方の値に基づいて他方における前記しきい値を変更することを特徴とする請求項8又は9又は10記載の自動利得制御装置。
  12. 入力信号判別部は、入力信号の周波数分析結果から音声信号か否かを判別することを特徴とする請求項8又は9又は10記載の自動利得制御装置。
  13. 利得算出部で算出された利得又は利得補正部で補正された利得の変動分を検出するとともに検出した変動分が所定範囲を超える場合に変動を抑制する方向へ利得を補正する利得変動補正部を備えたことを特徴とする請求項1〜12の何れかに記載の自動利得制御装置。
  14. 入力信号から雑音成分を除去する雑音除去部を備え、雑音除去部の出力信号を短時間平均レベル検出部の入力としたことを特徴とする請求項1〜13の何れかに記載の自動利得制御装置。
  15. 雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、時間軸の入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする請求項1〜14の何れかに記載の自動利得制御装置。
  16. 雑音検出部に入力される以前の入力信号から音声信号以外の雑音成分を除去する雑音成分除去手段を備え、該雑音成分除去手段は、周波数変換により入力信号の周波数スペクトルを求める周波数変換部と、周波数変換部から得られる入力信号の周波数スペクトルから入力信号に音声信号が含まれない非音声区間を検出する非音声区間検出部と、非音声区間検出部で検出される非音声区間に周波数変換部で求められた周波数スペクトルから音声信号でない非音声信号の周波数スペクトルを推定する非音声スペクトル推定部と、周波数変換部で求められた周波数スペクトルから非音声スペクトル推定部で推定された非音声信号の周波数スペクトルを減算する周波数スペクトル減算部と、周波数スペクトル減算部で得られる周波数スペクトルから周波数逆変換により時間軸の信号を求める周波数逆変換部とからなることを特徴とする請求項1〜14の何れかに記載の自動利得制御装置。
  17. 周波数変換部から得られる周波数スペクトルをパワー正規化した正規化スペクトルを求めて非音声区間検出部に与えるスペクトル正規化部を備えたことを特徴とする請求項16記載の自動利得制御装置。
  18. 雑音検出部の非音声スペクトル推定部を雑音成分除去手段の非音声スペクトル推定部で兼用したことを特徴とする請求項15又は16記載の自動利得制御装置。
  19. 雑音検出部の非音声区間検出部を雑音成分除去手段の非音声区間検出部で兼用したことを特徴とする請求項15又は16記載の自動利得制御装置。
JP2002334172A 2002-07-29 2002-11-18 自動利得制御装置 Expired - Fee Related JP4321049B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002334172A JP4321049B2 (ja) 2002-07-29 2002-11-18 自動利得制御装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002220322 2002-07-29
JP2002334172A JP4321049B2 (ja) 2002-07-29 2002-11-18 自動利得制御装置

Publications (2)

Publication Number Publication Date
JP2004129187A true JP2004129187A (ja) 2004-04-22
JP4321049B2 JP4321049B2 (ja) 2009-08-26

Family

ID=32300616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002334172A Expired - Fee Related JP4321049B2 (ja) 2002-07-29 2002-11-18 自動利得制御装置

Country Status (1)

Country Link
JP (1) JP4321049B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006042333A (ja) * 2004-07-24 2006-02-09 Samsung Electronics Co Ltd チャンネル変更による音量自動補正装置及びその方法
JP2006323308A (ja) * 2005-05-20 2006-11-30 Brother Ind Ltd 音声処理装置、通話装置、およびプログラム
JP2007036739A (ja) * 2005-07-27 2007-02-08 Matsushita Electric Works Ltd 拡声通話装置
JP2007060429A (ja) * 2005-08-25 2007-03-08 Matsushita Electric Works Ltd 拡声通話装置
CN101764586A (zh) * 2008-12-04 2010-06-30 索尼株式会社 音量校正装置、音量校正方法、音量校正程序及电子设备
JP2010534030A (ja) * 2007-07-13 2010-10-28 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 聴覚情景分析とスペクトルの歪みを用いた音響処理
JP2011135600A (ja) * 2011-02-07 2011-07-07 Sony Corp 音量補正装置、音量補正方法および音量補正プログラム
JP2012244246A (ja) * 2011-05-16 2012-12-10 Fujitsu Ten Ltd 音響装置、音量補正装置および音量補正方法
JP2014052553A (ja) * 2012-09-07 2014-03-20 Panasonic Corp 音量補正装置
US8681998B2 (en) 2009-02-16 2014-03-25 Sony Corporation Volume correction device, volume correction method, volume correction program, and electronic equipment
US9503041B1 (en) 2015-05-11 2016-11-22 Hyundai Motor Company Automatic gain control module, method for controlling the same, vehicle including the automatic gain control module, and method for controlling the vehicle
JP2019525213A (ja) * 2016-07-04 2019-09-05 ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー 発話信号を含むオーディオ信号のラウドネスレベル自動修正

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102009383B1 (ko) * 2017-12-20 2019-08-09 주식회사 디엠씨시스 사용자 특성을 고려한 오디오 출력 조정 시스템 및 그 조정 방법

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8107643B2 (en) 2004-07-24 2012-01-31 Samsung Electronics Co., Ltd. Apparatus and method of automatically compensating an audio volume in response to channel change
JP2006042333A (ja) * 2004-07-24 2006-02-09 Samsung Electronics Co Ltd チャンネル変更による音量自動補正装置及びその方法
JP2006323308A (ja) * 2005-05-20 2006-11-30 Brother Ind Ltd 音声処理装置、通話装置、およびプログラム
JP4604836B2 (ja) * 2005-05-20 2011-01-05 ブラザー工業株式会社 音声処理装置、通話装置、およびプログラム
JP2007036739A (ja) * 2005-07-27 2007-02-08 Matsushita Electric Works Ltd 拡声通話装置
JP4631581B2 (ja) * 2005-07-27 2011-02-16 パナソニック電工株式会社 拡声通話装置
JP4650163B2 (ja) * 2005-08-25 2011-03-16 パナソニック電工株式会社 拡声通話装置
JP2007060429A (ja) * 2005-08-25 2007-03-08 Matsushita Electric Works Ltd 拡声通話装置
JP2010534030A (ja) * 2007-07-13 2010-10-28 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 聴覚情景分析とスペクトルの歪みを用いた音響処理
US8396574B2 (en) 2007-07-13 2013-03-12 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
CN101764586A (zh) * 2008-12-04 2010-06-30 索尼株式会社 音量校正装置、音量校正方法、音量校正程序及电子设备
CN101764586B (zh) * 2008-12-04 2013-05-29 索尼株式会社 音量校正装置、音量校正方法、音量校正程序及电子设备
US8548173B2 (en) 2008-12-04 2013-10-01 Sony Corporation Sound volume correcting device, sound volume correcting method, sound volume correcting program, and electronic apparatus
US8681998B2 (en) 2009-02-16 2014-03-25 Sony Corporation Volume correction device, volume correction method, volume correction program, and electronic equipment
JP2011135600A (ja) * 2011-02-07 2011-07-07 Sony Corp 音量補正装置、音量補正方法および音量補正プログラム
JP2012244246A (ja) * 2011-05-16 2012-12-10 Fujitsu Ten Ltd 音響装置、音量補正装置および音量補正方法
JP2014052553A (ja) * 2012-09-07 2014-03-20 Panasonic Corp 音量補正装置
US9503041B1 (en) 2015-05-11 2016-11-22 Hyundai Motor Company Automatic gain control module, method for controlling the same, vehicle including the automatic gain control module, and method for controlling the vehicle
JP2019525213A (ja) * 2016-07-04 2019-09-05 ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー 発話信号を含むオーディオ信号のラウドネスレベル自動修正
US10861481B2 (en) 2016-07-04 2020-12-08 Harman Becker Automotive Systems Gmbh Automatic correction of loudness level in audio signals containing speech signals

Also Published As

Publication number Publication date
JP4321049B2 (ja) 2009-08-26

Similar Documents

Publication Publication Date Title
US9197181B2 (en) Loudness enhancement system and method
US9361901B2 (en) Integrated speech intelligibility enhancement system and acoustic echo canceller
EP2265039B1 (en) Hearing aid
EP2143204B1 (en) Automatic volume and dynamic range adjustment for mobile audio devices
US20060126865A1 (en) Method and apparatus for adaptive sound processing parameters
US8085930B2 (en) Communication system
US20110125494A1 (en) Speech Intelligibility
US8321215B2 (en) Method and apparatus for improving intelligibility of audible speech represented by a speech signal
WO2010131470A1 (ja) ゲイン制御装置及びゲイン制御方法、音声出力装置
JP3961290B2 (ja) 雑音抑圧装置
US20150334215A1 (en) Far-end sound quality indication for telephone devices
CN102804260A (zh) 声音信号处理装置以及声音信号处理方法
JP4321049B2 (ja) 自動利得制御装置
US8924199B2 (en) Voice correction device, voice correction method, and recording medium storing voice correction program
US8675901B2 (en) Howling suppression device, hearing aid, howling suppression method, and integrated circuit
US8489393B2 (en) Speech intelligibility
JP2004341339A (ja) 雑音抑圧装置
US20090252347A1 (en) Method and Apparatus For Automatic Gain Control
US20150039300A1 (en) Vehicle-mounted communication device
CN110136734B (zh) 使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器
JP2008522511A (ja) 適応可能な音声処理パラメータ用の方法及び装置
JP2009147701A (ja) 振幅制御装置、携帯電話装置、および振幅制限方法
JP2001188599A (ja) オーディオ信号復号装置
JP2004032387A (ja) ハウリング制御装置及び補聴器
JP2009147702A (ja) 騒音レベル推定装置、受話音量制御装置、携帯電話装置、および騒音レベル推定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050614

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071016

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080708

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081014

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090525

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees