JP4854630B2 - 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム - Google Patents

音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム Download PDF

Info

Publication number
JP4854630B2
JP4854630B2 JP2007238144A JP2007238144A JP4854630B2 JP 4854630 B2 JP4854630 B2 JP 4854630B2 JP 2007238144 A JP2007238144 A JP 2007238144A JP 2007238144 A JP2007238144 A JP 2007238144A JP 4854630 B2 JP4854630 B2 JP 4854630B2
Authority
JP
Japan
Prior art keywords
sound
gain
unit
gain control
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007238144A
Other languages
English (en)
Other versions
JP2009069503A (ja
Inventor
直司 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007238144A priority Critical patent/JP4854630B2/ja
Priority to DE102008039276.6A priority patent/DE102008039276B4/de
Priority to US12/232,177 priority patent/US8473291B2/en
Priority to CN2008101491467A priority patent/CN101388216B/zh
Publication of JP2009069503A publication Critical patent/JP2009069503A/ja
Application granted granted Critical
Publication of JP4854630B2 publication Critical patent/JP4854630B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level

Landscapes

  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Description

本発明は、マイクロホン等の受音部が受音した音に基づいて生成した音信号を増幅して処理する音処理装置、前記音信号の増幅に係る利得を制御する利得制御装置、前記音処理装置及び利得制御装置にて用いられる利得制御方法、前記音処理装置及び利得制御装置を実現するコンピュータプログラムに関し、特に増幅に係る利得の制御を最適化する音処理装置、利得制御装置、利得制御方法及びコンピュータプログラムに関する。
マイクロホン等の受音部が、話者が発声した音声等の音に基づいて音信号を生成し、生成した音信号をアンプ等の増幅部にて増幅し、増幅した音信号に基づいて、話者の発声内容を認識する音声認識処理等の処理を実行する様々な音処理装置が普及している。音声認識等の処理の実行に際しては、音信号の音声レベル(パワー)が最適となる様に増幅部の利得を制御し、受音部の感度を適正化することが重要となる。増幅部の利得を固定し、受音部の感度を一定にした場合、音信号の音声レベルが過度に大きくなったときは音信号が飽和し、また音信号の音声レベルが過度に小さくなったときは音声認識において誤認識が生じるという様な問題が発生する。そこで増幅部の利得を制御する技術が必要となる。
図22は、従来の音処理装置を示す機能ブロック図である。図22中1000は、音処理装置であり、音処理装置1000は、話者が発声する音声及び雑音等の外部から到来する音を受音する受音部1010と、受音部が生成した音信号を増幅する可変ゲインアンプ等の増幅部1020と、増幅部1020が増幅したアナログ信号である音信号をデジタル信号に変換するA/D変換部1030と、DSP(Digital Signal Processor)等の制御部1040とを備えている。
制御部1040は、デジタル信号に変換された音信号から話者が発声した音声が含まれる区間を検出する音声区間検出手段1041と、音声区間検出手段1041にて検出した区間に含まれる音声に基づいて音声認識等の処理を実行するアプリケーション手段1042とを備えている。さらに制御部1040は、音声区間検出手段1041にて検出した区間の音信号に基づいて音声レベル(パワー)を推定するパワー推定手段1043と、パワー推定手段1043が推定した音声レベルに基づいて増幅部1020の利得の制御値を算出する利得導出手段1044とを備えている。そして利得導出手段1044は、算出した利得制御値を増幅部1020へ出力し、増幅部1020は、入力された利得制御値に基づいて音信号を増幅する。
増幅部1020にて音信号に対する利得を自動的に制御することにより、受音部1010の感度を調整することになり、自動車内、工場内、市街等の様々な雑音環境下において、音声認識用アプリケーションプログラム等のアプリケーションを実行する際に、処理に要する音信号の音声レベルを目標値に近付けることが可能となる。この様な利得を自動的に制御して音声レベルを目標値に近付ける機能は、AGC(Automatic Gain Control)と呼ばれ、音声認識用アプリケーションプログラム、通話関連アプリケーションプログラム等のアプリケーションを実行する際の前処理として使用されている。
なお音声処理に関する技術として、雑音及び音声を含む信号から雑音及び音声を分離する方法が特許文献1に開示されている。
特許第3310225号明細書
しかしながら音声レベルを推定し、推定した音声レベルに基づいて利得の制御値を算出する従来の音処理装置では、話者が発声した音声を含む区間、即ち音声区間を確定するために数10〜数100ミリ秒の時間を要するため、利得の制御を開始するまでに音声区間の確定に相当する時間分の遅延が生じるという問題が生じる。そして利得の制御を開始するまでの間、音声レベルが不適正な状態となる可能性があり、音信号の飽和、音声の誤認識等の異常が生じる。
なお音声区間を確定するまで、利得制御前の音信号を蓄積(バッファリング)して待機する方法も考えられるが、その方法では、処理遅延が生じるため、音声認識用アプリケーションプログラムによる処理の反応遅れ、通話用アプリケーションプログラムによる通話品質の劣化等の問題が生じる。
本発明は斯かる事情に鑑みてなされたものであり、複数の受音部を用いた指向性受音技術を応用して背景雑音のパワーを推定し、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて増幅部へ出力する利得制御値を算出することにより、利得の制御を開始するまでの遅延時間を短縮し、また音声認識用アプリケーションプログラムによる処理の反応遅れ、通話用アプリケーションプログラムによる通話品質の劣化等の問題の発生を防止する音処理装置、前記音信号の増幅に係る利得を制御する利得制御装置、前記音処理装置及び利得制御装置にて用いられる利得制御方法、前記音処理装置及び利得制御装置を実現するコンピュータプログラムの提供を目的とする。
第1発明に係る音処理装置は、受音した音に基づいて音信号を生成する複数の受音部を備え、該複数の受音部が生成した音信号を増幅して処理する音処理装置において、設定された利得制御値に基づいて、各受音部が生成した音信号に対する利得を夫々制御する複数の増幅部と、複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離する分離部と、分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定する推定部と、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、前記複数の増幅部へ出力する利得制御値を求める導出部とを備え、前記複数の増幅部は、前記導出部が求めた利得制御値に基づいて利得を制御する様にしてあることを備えることを特徴とする。
第2発明に係る音処理装置は、第1発明において、前記導出部は、推定した背景雑音のパワー及びパワー目標値の差分を求め、求めた差分の時間変化を平滑化することにより利得制御値を求める様にしてあることを特徴とする。
第3発明に係る音処理装置は、第2発明において、前記導出部は、求めた差分及び以前に求めた利得制御値の大小関係に基づいて、平滑化の程度を示す時定数を決定する様にしてあり、差分の時間変化の平滑化は、決定された時定数に基づいて行う様にしてあることを特徴とする。
第4発明に係る音処理装置は、第1発明乃至第3発明のいずれかにおいて、前記導出部は、推定した背景雑音のパワーがパワー目標値より大きい場合にのみ、又は推定した背景雑音のパワーがパワー目標値より小さい場合にのみ利得を変更する利得制御値を求める様にしてあることを特徴とする。
第5発明に係る音処理装置は、第1発明乃至第4発明のいずれかにおいて、前記導出部は、利得の制御幅が予め設定されている前記増幅部の制御範囲内となる様に利得制御値を調整する様にしてあることを特徴とする。
第6発明に係る音処理装置は、受音した音に基づいて音信号を生成する複数の受音部を備え、該複数の受音部が生成した音信号を増幅して処理する音処理装置において、前記複数の受音部が夫々生成した音信号の夫々に対し、夫々異なる利得にて音信号を夫々増幅する複数の増幅部と、複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離する分離部と、分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定する推定部と、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、受音部が生成した音信号に対する利得の目標値を求める導出部と、利得の目標値及び予め記憶されている各増幅部の利得に基づいて、どの増幅部からの音信号を処理の対象とするかを選択する選択部とを備えることを特徴とする。
第7発明に係る利得制御装置は、雑音環境下で受音した音に基づいて音信号を生成する複数の受音部、及び該複数の受音部が受音した音信号を、設定された利得制御値に基づいて増幅する増幅部を備える受音装置と連携し、前記増幅部の利得を制御する利得制御装置であって、複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離する分離部と、分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定する推定部と、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、前記受音装置へ出力する利得制御値を求める導出部とを備えることを特徴とする。
第8発明に係る利得制御方法は、受音した音に基づいて音信号を生成する複数の受音部、及び該複数の受音部が受音した音信号を、設定された利得制御値に基づいて増幅する増幅部を備える受音装置と連携可能なコンピュータに、前記増幅部の利得を制御させる利得制御方法であって、前記コンピュータに、複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離する手順と、分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定する手順と、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、前記増幅部に設定する利得制御値を求める手順とを実行させることを特徴とする。
第9発明に係るコンピュータプログラムは、受音した音に基づいて音信号を生成する複数の受音部、及び該複数の受音部が受音した音信号を、設定された利得制御値に基づいて増幅する増幅部を備える受音装置と連携可能なコンピュータに、前記増幅部の利得を制御させるコンピュータプログラムにおいて、前記コンピュータに、複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離させる手順と、分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定させる手順と、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、前記増幅部に設定する利得制御値を求めさせる導出手順とを実行させることを特徴とする。
第10発明に係るコンピュータプログラムは、第9発明において、前記導出手順は、推定した背景雑音のパワー及びパワー目標値の差分を求め、求めた差分の時間変化を平滑化することにより利得制御値を求める様にしてあることを特徴とする。
第1発明及び第7発明乃至第9発明では、音声が含まれていない雑音区間は相関が高いということから推定した背景雑音のパワーに基づいて増幅部へ出力する利得制御値を求めることにより、ほぼ実時間で利得制御値の導出及び制御を行うことができるので、利得の制御を開始するまでの遅延時間を短縮し、また利得制御前の音信号を蓄積する必要が無いので、音声認識用アプリケーションプログラムによる処理の反応遅れ、通話用アプリケーションプログラムによる通話品質の劣化等の問題が生じることがない。
第2発明及び第10発明では、時間変化を平滑化することにより、急激な利得の変化を防止して、音声認識等の後処理を安定させることが可能であり、特に所定の時間差の音信号に基づいて離散的に利得制御値を求める場合には、時間差を小さくすることなく利得制御値が階段状に大きく変化することを防止することが可能である。
第3発明では、時定数を動的に決定することにより、パワー目標値に対する利得制御値の追従性を制御することが可能となる。
第4発明では、例えばカーナビゲーションシステムの発話スイッチを押してカーオーディオ等の雑音を停止した上で発声する様な環境下にて用いる場合に、利得を大きくする制御のみを行うことにより、利得が小さくなって受音部の感度が必要以上に低下することを防止することができるので、音声認識、通話処理等の後処理に係る品質の低下を防止することが可能である。また例えば雑音レベルが煩雑に変化する環境下にて用いる場合に、利得制御値を小さくする制御のみを行うことにより、利得が大きくなって音声レベルが過度に高くなり音信号が飽和することを防止することが可能である。
第5発明では、利得の制御幅が制御範囲内となる様に利得制御値を調整することにより、増幅部の制御範囲内での制御を行うことが可能となる。
第6発明では、音声が含まれていない雑音区間は相関が高いということから推定した背景雑音のパワーに基づいて利得の目標値を算出し、算出した利得を得ることができる様に音信号を選択することにより、ほぼ実時間で利得目標値の算出及び制御を行うことができるので、利得の制御を開始するまでの遅延時間を短縮し、また利得制御前の音信号を蓄積する必要が無いので、音声認識用アプリケーションプログラムによる処理の反応遅れ、通話用アプリケーションプログラムによる通話品質の劣化等の問題が生じることがない。
本発明に係る音処理装置、利得制御装置、利得制御方法及びコンピュータプログラムは、マイクロホン等の複数の受音部が生成した音信号に対する利得を設定された利得制御値に基づいて制御する可変ゲインアンプ等の増幅部を備え、複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離し、分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定し、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、増幅部へ出力する利得制御値を求め、増幅部は、求められた利得制御値に基づいて利得を制御する。
この構成により、本発明では、音声が含まれていない雑音区間は相関が高いということから推定した背景雑音のパワーに基づいて増幅部へ出力する利得制御値を求めることにより、短い処理時間で利得制御値の導出及び制御を行うことができるので、利得の制御を開始するまでの遅延時間を短縮することが可能である等、優れた効果を奏する。また利得制御前の音信号を蓄積する必要が無いので、音声認識用アプリケーションプログラムによる処理の反応遅れ、通話用アプリケーションプログラムによる通話品質の劣化等の問題が生じることがない等、優れた効果を奏する。
本発明に係る音処理装置等は、推定した背景雑音のパワー及びパワー目標値の差分を求め、求めた差分の時間変化を平滑化することで利得制御値を求めることにより、急激な利得の変化を防止して、音声認識等の後処理を安定させることが可能である等、優れた効果を奏する。特に所定の時間差の音信号に基づいて離散的に利得制御値を求める場合には、時間差を小さくすることなく利得制御値が階段状に大きく変化することを防止することが可能であるので、時間差を小さくすることによる処理負荷の増大を防止することが可能である等、優れた効果を奏する。
本発明に係る音処理装置等は、推定した背景雑音のパワーがパワー目標値より大きい場合にのみ利得制御値を求めることにより、例えばカーオーディオ等の雑音を停止した上で発声する様な環境下にて用いる場合に、利得が小さくなって受音部の感度が必要以上に低下することを防止することができるので、音声認識、通話処理等の後処理に係る品質の低下を防止することが可能である等、優れた効果を奏する。
また推定した背景雑音のパワーがパワー目標値より小さい場合にのみ利得制御値を求めることにより、例えば雑音レベルが煩雑に変化する環境下にて用いる場合に、利得が大きくなって音声レベルが過度に高くなり音信号が飽和することを防止することが可能である等、優れた効果を奏する。
本発明に係る音処理装置等は、増幅部が、所定の制御範囲内で利得を制御する様に構成してあり、利得の制御幅が制御範囲内となる様に利得制御値を調整することにより、増幅部の制御範囲内での制御を行うことが可能となる等、優れた効果を奏する。
また本発明に係る音処理装置等は、夫々異なる利得にて音信号を夫々増幅する複数の増幅部を備え、複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離し、分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定し、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、受音部が生成した音信号に対する利得の目標値を求め、利得の目標値及び各増幅部の利得に基づいて、処理の対象とする音信号を選択する。
この構成により、本発明では、短い処理時間で利得目標値の導出及び制御を行うことができるので、利得の制御を開始するまでの遅延時間を短縮することが可能である等、優れた効果を奏する。また利得制御前の音信号を蓄積する必要が無いので、音声認識用アプリケーションプログラムによる処理の反応遅れ、通話用アプリケーションプログラムによる通話品質の劣化等の問題が生じることがない等、優れた効果を奏する。
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
実施の形態1.
図1は、本発明の実施の形態1に係る音処理装置のハードウェアの構成例を示すブロック図である。図1中1は、カーナビゲーションシステム等のシステムに用いられるコンピュータである音処理装置であり、音処理装置1は、話者が発声する音声及び雑音等の外部から到来する音を受音し、受音した音に基づいて音信号を生成する複数の受音部10,10,…と、複数の受音部10,10,…にて生成した音信号を増幅する可変ゲインアンプ等の増幅部11,11,…と、増幅部11,11,…にて増幅したアナログ信号である音信号をデジタル信号に変換するA/D変換部12,12,…と、DSP(Digital Signal Processor)等の制御部13とを備えている。
受音部10は、受音した音信号をアナログ信号である音信号に変換し、増幅部11は、設定されている利得制御値に基づいて、受音部10が生成した音信号に対する利得を制御し、A/D変換部12は、アナログ信号である音信号を8000Hz、12000Hz等のサンプリング周波数でサンプリングしてデジタル信号に変換し、デジタル信号に変換した音信号を制御部13へ出力する。音処理装置1は、この様な受音部10、増幅部11及びA/D変換部12の組を複数組備えている。なお以降の説明では、2組分の受音部10,10、増幅部11,11、A/D変換部12,12を備える構成について説明する。また受音部10,10を必要に応じて第1受音部10a及び第2受音部10bとして示す。
制御部13は、本発明のコンピュータプログラム100及びデータ等のファームウェアが組み込まれた演算回路であり、ファームウェアとして組み込まれた本発明のコンピュータプログラム100を実行することにより、制御部13を備えるコンピュータは、本発明の音処理装置1として動作する。なお音処理装置1は、図1中に図示した構成以外にも、カーナビゲーションシステム等のシステム本来としての動作を行うための処理機構、操作機構、出力機構等の様々な機構を備えている。
図2は、本発明の実施の形態1に係る音処理装置1の機能の一例を示す機能ブロック図である。本発明のコンピュータプログラム100を実行した制御部13は、到来方向に基づいて音信号を分離する指向性受音機能を備える分離手段130、分離した音信号に基づいて音信号に含まれる背景雑音のパワーを推定する推定手段131、推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、増幅部11へ出力する利得制御値を求める導出手段132、分離手段130にて分離した話者の音声を含む音信号に基づいて音声認識処理、通話処理等の処理を実行するアプリケーション手段133等のプログラムモジュールを生成する。なお各プログラムモジュールは、VLSI等の演算回路を用いたハードウェアとして構成することも可能である。
次に本発明の実施の形態1に係る音処理装置1の信号処理について説明する。制御部13では、第1受音部10aが受音した音に基づくデジタル信号である音信号を第1入力信号in_1(t)として受け付け、第2受音部10bが受音した音に基づくデジタル信号である音信号を第2入力信号in_2(t)として受け付ける。なお変数tは、アナログ信号である音信号を8000Hz、12000Hz等のサンプリング周波数でサンプリングしてデジタル信号に変換した際の各サンプルを特定するサンプル番号である。
図3は、本発明の実施の形態1に係る音処理装置1において、制御部13が入力を受け付ける音信号を示すグラフである。図3は、横軸を時間に対応するサンプル番号tとし、縦軸を音信号の振幅として、その関係を示したグラフであり、図3(a)は、第1入力信号in_1(t)を示し、図3(b)は、第2入力信号in_2(t)を示している。第1受音部10a及び第2受音部10bを適切な間隔で離隔して配設することにより、第1受音部10a及び第2受音部10bが受音する夫々の音に基づく夫々の音信号には、到来方向に応じた位相差が生じる。分離手段130では、例えば第1入力信号in_1(t)及び第2入力信号in_2(t)の位相差に基づいて音の到来方向を推定し、話者の口元方向等の予め設定されている目的方向から到来する音に基づく音信号と、他の方向から到来する音に基づく音信号とに分離する指向性受音処理を行う。
分離手段130による指向性受音処理では、第1入力信号in_1(t)及び第2入力信号in_2(t)に基づいて、目的方向以外の方向から到来する音を抑圧する同期減算により、目的方向から到来する音に基づく音信号、即ち話者が発声した音声に基づく音声信号signal(t)を抽出し、目的方向から到来する音を抑圧する同期減算により、目的方向以外の方向から到来する音に基づく音信号、即ち背景雑音に基づく雑音信号noise(t)を抽出する。
図4は、本発明の実施の形態1に係る音処理装置1において、指向性受音処理により分離された音信号の時間変化を示すグラフである。図4に示すグラフは、横軸を時間に対応するサンプル番号tとし、縦軸を音信号の振幅として、その関係を示している。図4(a)は、予め設定されている目的方向から到来する音に基づく音信号、即ち話者が発声した音声に基づく音声信号signal(t)を示し、図4(b)は、目的方向以外の方向から到来する音に基づく音信号、即ち背景雑音に基づく雑音信号noise(t)を示している。音声信号signal(t)及び雑音信号noise(t)を比較すると明らかな様に、音声信号signal(t)には、音声として特徴的なピークが出現している。分離手段130は、音声信号signal(t)をアプリケーション手段133へ出力し、アプリケーション手段133は、音声信号signal(t)に基づいて音声認識処理、通話処理等の処理を実行する。また分離手段130は、音声信号signal(t)及び雑音信号noise(t)を推定手段131へ出力する。
推定手段131は、入力された音声信号signal(t)及び雑音信号noise(t)に基づいて、例えば512サンプル分の信号を1フレームとしたフレーム単位の音声信号signal(n)及び雑音信号noise(n)を生成する。なお変数nは、各フレームを特定するフレーム番号である。そして推定手段131は、フレーム単位の音声信号signal(n)及び雑音信号noise(n)の相関を計算する下記の式(1)を用いて背景雑音のパワーpow_noise(n)を推定する。
Figure 0004854630
図5は、本発明の実施の形態1に係る音処理装置1において、推定手段131が推定した背景雑音のパワーpow_noise(n)の時間変化を示すグラフである。図5は、横軸に時間に対応するフレーム番号nをとり、縦軸に背景雑音のパワーpow_noise(n)をデシベル単位でとって、その関係を示したグラフである。到来方向に基づいて分離した音声信号signal(n)及び雑音信号noise(n)の相関を計算することにより、背景雑音に係る信号は、音声に係る信号より相関が強いという特性から、背景雑音のパワーpow_noise(n)を推定することができる。そしてこの様に相関を求めることにより、音声及び非定常性の強い雑音が与える影響を抑制することができる。そして推定手段131は、背景雑音のパワーpow_noise(n)を示す情報を導出手段132へ出力する。
導出手段132は、背景雑音のパワーpow_noise(n)及び予め設定されているパワー目標値refに基づき下記の式(2)を用いて、増幅部11,11へ出力する利得制御値adj(t)の基となる原利得制御値adj’(n)を求める。
adj’(n)=ref−pow_noise(n) …(2)
但し、adj’(n):原利得制御値
ref:パワー目標値
図6は、本発明の実施の形態1に係る音処理装置1において、背景雑音のパワーpow_noise(n)及びパワー目標値refの時間変化を示すグラフである。図6は、横軸に時間に対応するフレーム番号nをとり、縦軸に背景雑音のパワーpow_noise(n)及びパワー目標値refをデシベル単位でとって、その関係を示したグラフである。図6において、実線が背景雑音のパワーpow_noise(n)を示し、破線がパワー目標値refを示している。式(2)を用いて求める原利得制御値adj’(n)は、背景雑音のパワーpow_noise(n)及びパワー目標値refの差となる。本発明の音処理装置1では、背景雑音のパワーpow_noise(n)がパワー目標値refとなる様に、増幅部11,11の利得制御値adj(t)を設定し、受音部10,10の感度を調整する。
さらに導出手段132は、下記の式(3)を用いて、原利得制御値adj’(n)の時間変化を平滑化することにより、増幅部11へ出力する利得制御値adj(t)を求める。
adj(t)=α・adj(t−1)+(1−α)・adj’(n) …(3)
但し、adj(t):利得制御値
α:0以上1未満の時定数
図7は、本発明の実施の形態1に係る音処理装置1において、原利得制御値adj’(n)及び利得制御値adj(t)の時間変化を示すグラフである。図7は、横軸を時間に対応するサンプル番号tとし、縦軸を利得のデシベル単位の制御量として、その関係を示したグラフである。フレーム番号nを変数とする原利得制御値adj’(n)を破線にて示し、サンプル番号tを変数とする利得制御値adj(t)を実線にて示している。なお原利得制御値adj’(n)の変数は、フレーム番号nであるので、サンプル番号tに換算した上で、その推移を示している。本形態で示す例では、512サンプルが1フレームに対応するため、原利得制御値adj’(n)の値は、階段状に変化する離散的なグラフとなるが、式3を用いて時間変化を平滑化した利得制御値adj(t)は、サンプル番号tに対して連続的に変化することで、利得の離散的、かつ急激な変化を抑制している。そして導出手段132は、算出した利得制御値adj(t)を増幅部11,11へ出力し、増幅部11,11は、入力された利得制御値adj(t)を利得として設定する。
次に上述した構成の本発明の実施の形態1に係る音処理装置1の処理について説明する。図8は、本発明の実施の形態1に係る音処理装置1の処理の一例を示すフローチャートである。音処理装置1は、第1受音部10a及び第2受音部10bにて受音した音に基づいて夫々音信号を生成し(S101)、生成した音信号を夫々対応する増幅部11,11へ出力する。
音処理装置1の増幅部11,11は、設定されている利得制御値に基づいて、各受音部10,10が生成した音信号を増幅し(S102)、増幅した音信号を夫々対応するA/D変換部12,12へ出力する。
音処理装置1のA/D変換部12,12は、増幅部11,11から夫々入力されたアナログ信号である音信号をデジタル信号に変換するA/D変換処理を行い(S103)、デジタル信号に変換した音信号、即ち第1入力信号in_1(t)及び第2入力信号in_2(t)を制御部13へ出力する。
音処理装置1の制御部13は、分離手段130の処理により、第1入力信号in_1(t)及び第2入力信号in_2(t)に基づいて音の到来方向を推定し、目的方向から到来する音に基づく音信号、即ち話者が発声した音声に基づく音声信号signal(t)、及び目的方向以外の方向から到来する音に基づく音信号、即ち背景雑音に基づく雑音信号noise(t)を分離する(S104)。
音処理装置1の制御部13は、推定手段131の処理により、音声信号signal(t)及び雑音信号noise(t)の相関に基づいて、背景雑音のパワーpow_noise(n)を推定する(S105)。
音処理装置1の制御部13は、導出手段132の処理により、背景雑音のパワーpow_noise(n)及びパワー目標値refに基づいて、原利得制御値adj’(n)を求め(S106)、求めた原利得制御値adj’(n)の時間変化を平滑化することにより、利得制御値adj(t)を求め(S107)、求めた利得制御値adj(t)を増幅部11,11へ出力する。
音処理装置1の増幅部11,11は、入力された利得制御値adj(t)に基づく利得を設定する(S108)。なおステップS104にて分離された音声信号signal(t)は、アプリケーション手段133へ出力され、アプリケーション手段133は、音声信号signal(t)に基づいて音声認識処理、通話処理等の処理を実行する。
実施の形態2.
実施の形態2は、実施の形態1において、背景雑音のパワー推定結果及びパワー目標値の大小関係に基づいて利得制御値の算出の要否を判定する形態である。実施の形態2に係るハードウェアの構成例及び機能の例は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。なお以降の説明において、実施の形態1と同様の構成要件については、実施の形態1と同様の符号を付して説明する。
実施の形態2において、導出手段132は、背景雑音のパワーpow_noise(n)及び予め設定されているパワー目標値refを比較し、その大小関係が予め設定されている関係にある場合にのみ利得制御値adj(t)を変更する。なおここでは、背景雑音のパワーpow_noise(n)が、パワー目標値refより大きい場合にのみ利得制御値adj(t)を変更する形態について例示する。実施の形態2においては、式(2)に替えて、下記の式(4)を用いる。
if(pow_noise(n)>ref)
then adj’(n)=ref−pow_noise(n)
else adj’(n)=0
…(4)
式(4)に示す様に実施の形態2では、背景雑音のパワーpow_noise(n)が、パワー目標値refより大きい場合に、実施の形態1の式(2)と同様の数式にて原利得制御値adj’(n)が求められ、背景雑音のパワーpow_noise(n)が、パワー目標値ref以下である場合、原利得制御値adj’(n)は0となる。原利得制御値adj’(n)から利得制御値adj(t)を求める数式としては、実施の形態1の式(3)を用いるため、実施の形態2では、背景雑音のパワーpow_noise(n)が、パワー目標値refより大きい場合にのみ利得制御値adj(t)を変更することになる。
次に本発明の実施の形態2に係る音処理装置1の処理について説明する。図9は、本発明の実施の形態2に係る音処理装置1の処理の一例を示すフローチャートである。実施の形態2では、実施の形態1のフローチャートに示したステップS106の処理を、上述した式(4)に基づく処理に変更した処理を実行する。
先ず音処理装置1は、実施の形態1にて示したステップS101〜S105の処理を実行する。そして音処理装置1の制御部13は、導出手段132の処理により、背景雑音のパワーpow_noise(n)及びパワー目標値refを比較して、背景雑音のパワーpow_noise(n)が、パワー目標値refより大きいか否かを判定する(S201)。
ステップS201において、背景雑音のパワーpow_noise(n)が、パワー目標値refより大きいと判定した場合(S201:YES)、音処理装置1の制御部13は、導出手段132の処理により、背景雑音のパワーpow_noise(n)及びパワー目標値refに基づいて、原利得制御値adj’(n)を求める(S202)。
ステップS202において、背景雑音のパワーpow_noise(n)が、パワー目標値ref以下であると判定した場合(S201:NO)、音処理装置1の制御部13は、導出手段132の処理により、原利得制御値adj’(n)を0とする(S203)。
そして音処理装置1は、実施の形態1にて示したステップS107以降の処理を実行する。この様に背景雑音のパワーpow_noise(n)が、パワー目標値refより大きいと判定した場合にのみ利得制御値adj(t)を変更する形態は、例えばカーナビゲーションシステムの発話スイッチを押下してカーオーディオ等の雑音を停止した上で発声する様な環境下に適用され、利得が大きくなって受音部10,10の感度が必要以上に大きくなり、音信号が飽和することを防止する。
なお背景雑音のパワーpow_noise(n)が、パワー目標値refより小さい場合にのみ利得制御値adj(t)を変更する形態では、上述した式(4)は、下記の式(5)となる。
if(pow_noise(n)<ref)
then adj’(n)=ref−pow_noise(n)
else adj’(n)=0
…(5)
式(5)を用いて背景雑音のパワーpow_noise(n)が、パワー目標値refより小さいと判定した場合にのみ利得制御値adj(t)を変更する形態は、例えば雑音レベルが煩雑に変化する環境下に適用され、利得が小さくなって音声レベルが過度に低くなり音信号が飽和することを防止する。
実施の形態3.
実施の形態3は、実施の形態1において、求めた原利得制御値及び前回の利得制御値の大小関係に基づいて時定数を決定する形態である。実施の形態3に係るハードウェアの構成例及び機能の例は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。なお以降の説明において、実施の形態1と同様の構成要件については、実施の形態1と同様の符号を付して説明する。
実施の形態3において、導出手段132は、求めた原利得制御値adj’(n)及び前回の利得制御値adj(t−1)を比較し、原利得制御値adj’(n)が前回の利得制御値adj(t−1)未満である場合に、第1時定数α1(0≦α1<1)を用い、原利得制御値adj’(n)が前回の利得制御値adj(t−1)以上である場合に、第1時定数α1より大きい第2時定数α2(0≦α2<1)を用いる。実施の形態3においては、式(3)に替えて、下記の式(6)を用いる。
if(adj(t−1)>adj’(n))
then adj(t)=α1・adj(t−1)+(1−α1)・adj’(n)
else adj(t)=α2・adj(t−1)+(1−α2)・adj’(n)
…(6)
但し、α1:0以上1未満の第1時定数
α2:0以上1未満の第2時定数
式(6)に示す様に原利得制御値adj’(n)及び前回の利得制御値adj(t−1)に基づいて時定数を決定することにより、特に第1時定数α1より第2時定数α2を大きくすることにより、利得制御値adj(t)を経時的に低下させる場合に、平滑化前の原利得制御値adj’(n)に対する追従性を相対的に高くすることができる。なお第1時定数α1より第2時定数α2を小さくした場合には、利得制御値adj(t)を経時的に向上させるときに、平滑化前の原利得制御値adj’(n)に対する追従性を相対的に高くすることができる。
図10は、本発明の実施の形態3に係る音処理装置1において、原利得制御値adj’(n)及び利得制御値adj(t)の時間変化を示すグラフである。図10は、横軸を時間に対応するサンプル番号tとし、縦軸を利得の制御量をデシベル単位として、その関係を示したグラフである。フレーム番号nを変数とする原利得制御値adj’(n)を破線にて示し、サンプル番号tを変数とする利得制御値adj(t)を実線にて示している。なお原利得制御値adj’(n)の変数は、フレーム番号nであるので、サンプル番号tに換算した上で、その推移を示している。図10では、第1時定数α1の値を実施の形態1に係る時定数αと同値とし、大きい第2時定数α2の値を第1時定数α1より大きい値としている。実施の形態1の図7と比較すると明らかな様に、利得制御値adj(t)を経時的に低下させる場合、実施の形態1の時定数αより大きい第2時定数α2が用いられるため、平滑化前の原利得制御値adj’(n)に対する追従性が高くなっている。
次に本発明の実施の形態3に係る音処理装置1の処理について説明する。図11は、本発明の実施の形態3に係る音処理装置1の処理の一例を示すフローチャートである。実施の形態3では、実施の形態1のフローチャートに示したステップS107の処理を、上述した式(6)に基づく処理に変更した処理を実行する。
先ず音処理装置1は、実施の形態1にて示したステップS101〜S106の処理を実行する。そして音処理装置1の制御部13は、導出手段132の処理により、原利得制御値adj’(n)及び前回の利得制御値adj(t−1)を比較して、原利得制御値adj’(n)が、前回の利得制御値adj(t−1)より大きいか否かを判定する(S301)。
ステップS301において、原利得制御値adj’(n)が、前回の利得制御値adj(t−1)より大きいと判定した場合(S301:YES)、音処理装置1の制御部13は、導出手段132の処理により、平滑化に用いる時定数を第1時定数α1に決定し(S302)、決定した第1時定数α1を用いて原利得制御値adj’(n)の時間変化を平滑化することにより、利得制御値adj(t)を求める(S303)。
ステップS301において、原利得制御値adj’(n)が、前回の利得制御値adj(t−1)以下であると判定した場合(S301:NO)、音処理装置1の制御部13は、導出手段132の処理により、平滑化に用いる時定数を第1時定数α1より大きい第2時定数α2に決定し(S304)、決定した第2時定数α2を用いて原利得制御値adj’(n)の時間変化を平滑化することにより、利得制御値adj(t)を求める(S305)。
そして音処理装置1は、実施の形態1にて示したステップS108以降の処理を実行する。
実施の形態4.
実施の形態4は、実施の形態1において、増幅部の制御方法を変更した形態である。実施の形態4に係るハードウェアの構成例は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。なお以降の説明において、実施の形態1と同様の構成要件については、実施の形態1と同様の符号を付して説明する。
図12は、本発明の実施の形態4に係る音処理装置1の機能の一例を示す機能ブロック図である。本発明のコンピュータプログラム100を実行した制御部13は、分離手段130、推定手段131、導出手段132及びアプリケーション手段133等のプログラムモジュールを生成する。
次に実施の形態4に係る音処理装置1の信号処理について説明する。実施の形態1において制御部13から増幅部11,11へ出力した利得制御値adj(t)とは、利得の修正値であり、修正前の利得に対する差分を示している。増幅部11,11が差分に基づいて自動的に利得を修正する機能を有している場合、入力された利得制御値adj(t)に基づいて問題なく利得制御を行うことができるが、その様な機能を有しておらず、入力された利得制御値adj(t)をそのまま利得とする増幅部11,11を用いる場合には、利得制御値adj(t)を利得そのものとする様に換算する必要が生じる。実施の形態4では、相対値である利得制御値adj(t)から、増幅部11,11の制御の絶対値である利得制御値amp_gain(t)を算出する処理を実行し、また算出された利得制御値amp_gain(t)が、増幅部11,11の規格に基づく利得の制御幅が最大値及び最小値にて規定される制御範囲内となる様に制御する形態である。
実施の形態4において、導出手段132は、前回の利得制御値adj(t−1)に対する相対値である利得制御値adj(t)から下記の式(7)を用いて累計値total_adj(t)を算出する。
total_adj(t)=total_adj(t−1)+adj(t) …(7)
但し、total_adj(t):adj(t)の累計値
さらに導出手段132は、下記の式(8)を用いて、利得の制御幅が増幅部11,11の規格に基づき設定された最大値max_amp_gain及び最小値min_amp_gainにて規定される制御範囲内に収まる様に調整する。
if((total_adj(t)+init_amp_gain)
>max_amp_gain)
then total_adj(t)
=max_amp_gain−init_amp_gain
if((total_adj(t)+init_amp_gain)
<min_amp_gain)
then total_adj(t)
=min_amp_gain−init_amp_gain
…(8)
但し、max_amp_gain:増幅部11,11の利得の最大値
min_amp_gain:増幅部11,11の利得の最小値
init_amp_gain:増幅部11,11の利得の初期値
さらに導出手段132は、下記の式(9)を用いて、増幅部11,11の制御の絶対値である利得制御値amp_gain(t)を求める。
amp_gain(t)=total_adj(t)+init_amp_gain
…式(9)
但し、amp_gain(t):利得制御値
次に本発明の実施の形態4に係る音処理装置1の処理について説明する。図13は、本発明の実施の形態4に係る音処理装置1の処理の一例を示すフローチャートである。実施の形態4では、実施の形態1のフローチャートに示したステップS107の処理を実行後、上述した式(7)〜(9)に基づく処理を実行する。
先ず音処理装置1は、実施の形態1にて示したステップS101〜S107の処理を実行する。そして音処理装置1の制御部13は、導出手段132の処理により、求めた利得制御値adj(t)及び前回の利得制御値adj(t−1)から累計値total_adj(t)を算出し(S401)、算出した累計値total_adj(t)が、増幅部11,11の規格に基づき設定された最大値max_amp_gain及び最小値min_amp_gainにて規定される制御範囲内に収まる様に調整する(S402)。
さらに音処理装置1の制御部13は、導出手段132の処理により、調整した累計値total_adj(t)及び増幅部11,11の利得の初期値init_amp_gainから、増幅部11,11の制御の絶対値である利得制御値amp_gain(t)を求め(S403)、求めた利得制御値amp_gain(t)を増幅部11,11へ出力する。
音処理装置1の増幅部11は、入力された利得制御値amp_gain(t)を利得として設定する(S404)。なお累計値total_adj(t)が、最大値max_amp_gain及び最小値min_amp_gainにて規定される制御範囲内に収まる様に調整する方法は、上述した例に限らず、様々な方法を用いることが可能である。
実施の形態5.
実施の形態5は、実施の形態1において、増幅部の利得を制御するのではなく、利得が異なる複数組の増幅部を用いる形態である。なお以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付し、その説明を省略する。
図14は、本発明の実施の形態5に係る音処理装置1のハードウェアの構成例を示すブロック図である。実施の形態5に係る音処理装置1は、音信号を固定された利得で増幅する複数組の増幅部11,11,…を備えており、各組の増幅部11,11,…は、設定されている利得が異なっている。なお以降の説明においては、三組の増幅部11,11,…を用いる形態について説明し、必要に応じて利得が最も高い組の増幅部11,11を第1増幅部11a,11aとして示し、次に利得が高い組の増幅部11,11を第2増幅部11b,11bとして示し、そして最も利得が低い組の増幅部11,11を第3増幅部11c,11cとして示す。さらに各増幅部11,11,…には、A/D変換部12,12,…が夫々接続されており、夫々のA/D変換部12,12,…にてデジタル信号に変換された音信号は、制御部13へ出力される。
図15は、本発明の実施の形態5に係る音処理装置1の機能の一例を示す機能ブロック図である。本発明のコンピュータプログラム100を実行した制御部13は、複数の分離手段130,130,…、推定手段131、利得の目標値を算出する導出手段132、アプリケーション手段133、利得の目標値及び各増幅部11,11,…の利得に基づいて音信号を選択する選択手段134等のプログラムモジュールを生成する。なお導出手段132は、利得の目標値と音信号の選択に要する係数との関係を示した利得テーブル132aを有している。
複数の分離手段130,130,…は、夫々第1増幅部11a,11a、第2増幅部11b,11b及び第3増幅部11c,11cに対応している。以降の説明においては、必要に応じて第1増幅部11a,11aに対応している分離手段130を第1分離手段130aとして示し、第2増幅部11b,11bに対応している分離手段130を第2分離手段130bとして示し、そして第3増幅部11c,11cに対応している分離手段130を第3分離手段130cとして示す。
次に本発明の実施の形態5に係る音処理装置1の信号処理について説明する。制御部13では、第1受音部10aにて受音し、第1増幅部11aにて増幅したデジタル信号である音信号を第1高利得入力信号in_1_H(t)として第1分離手段130aにより受け付け、第2受音部10bにて受音し、第1増幅部11aにて増幅したデジタル信号である音信号を第2高利得入力信号in_2_H(t)として第1分離手段130aにより受け付ける。また制御部13は、第1受音部10aにて受音し、第2増幅部11bにて増幅したデジタル信号である音信号を第1中利得入力信号in_1_M(t)として第2分離手段130bにより受け付け、第2受音部10bにて受音し、第2増幅部11bにて増幅したデジタル信号である音信号を第2中利得入力信号in_2_M(t)として第2分離手段130bにより受け付ける。さらに制御部13は、第1受音部10aにて受音し、第3増幅部11cにて増幅したデジタル信号である音信号を第1低利得入力信号in_1_L(t)として第3分離手段130cにより受け付け、第2受音部10bにて受音し、第3増幅部11cにて増幅したデジタル信号である音信号を第2低利得入力信号in_2_M(t)として第3分離手段130cにより受け付ける。
第1分離手段130aによる指向性受音処理では、第1高利得入力信号in_1_H(t)及び第2高利得入力信号in_2_H(t)に基づいて、目的方向から到来する音に基づく音信号、即ち話者が発声した音声に基づく高利得音声信号signal_H(t)を抽出する。また第2分離手段130bによる指向性受音処理では、第1中利得入力信号in_1_M(t)及び第2中利得入力信号in_2_M(t)に基づいて、目的方向から到来する音声に基づく中利得音声信号signal_M(t)を抽出する。さらに第3分離手段130cによる指向性受音処理では、第1低利得入力信号in_1_L(t)及び第2低利得入力信号in_2_L(t)に基づいて、目的方向から到来する音声に基づく低利得音声信号signal_L(t)を抽出し、目的方向以外の方向から到来する音に基づく音信号、即ち背景雑音に基づく雑音信号noise(t)を抽出する。
第1分離手段130a、第2分離手段130b及び第3分離手段130cは、夫々高利得音声信号signal_H(t)、中利得音声信号signal_M(t)及び低利得音声信号signal_L(t)を選択手段134へ出力する。また第3分離手段130cは、低利得音声信号signal_L(t)及び雑音信号noise(t)を推定手段131へ出力する。
推定手段131は、入力された低利得音声信号signal_L(t)及び雑音信号noise(t)に基づいて推定した背景雑音のパワーpow_noise(n)を示す情報を導出手段132へ出力する。
導出手段132は、背景雑音のパワーpow_noise(n)及び予め設定されているパワー目標値refに基づいて利得制御値amp_gain(t)を求める。利得制御値amp_gain(t)は、実施の形態4にて説明した利得制御値amp_gain(t)の導出方法を用いて求められる。
さらに導出手段132は、利得制御値amp_gain(t)及び利得テーブル132aに基づいて、高利得音声信号signal_H(t)に対する高利得係数select_gain_H(t)、中利得音声信号signal_M(t)に対する中利得係数select_gain_M(t)、及び低利得音声信号signal_L(t)に対する低利得係数select_gain_L(t)を導出する。
図16は、本発明の実施の形態5に係る音処理装置1にて用いられる利得テーブル132aの内容を示すグラフである。図16は、横軸に利得制御値amp_gain(t)をとり、縦軸に係数として用いられる値をとって、その関係を示したグラフである。図16において、実線が高利得係数select_gain_H(t)を示し、破線が中利得係数select_gain_M(t)を示し、そして一点鎖線が低利得係数select_gain_L(t)を示している。図16に示す利得テーブル132aを用いることにより、利得制御値amp_gain(t)から、高利得係数select_gain_H(t)、中利得係数select_gain_M(t)、及び低利得係数select_gain_L(t)が導出される。図16に示す様に、高利得係数select_gain_H(t)、中利得係数select_gain_M(t)、及び低利得係数select_gain_L(t)は、いずれも0以上1以下の値をとり、それらの和は、常に1となる。そして導出手段132は、導出した高利得係数select_gain_H(t)、中利得係数select_gain_M(t)、及び低利得係数select_gain_L(t)を選択手段134へ出力する。
選択手段134は、下記の式(10)を用いて、高利得音声信号signal_H(t)、中利得音声信号signal_M(t)及び低利得音声信号signal_L(t)、並びに高利得係数select_gain_H(t)、中利得係数select_gain_M(t)及び低利得係数select_gain_L(t)から、アプリケーション手段133へ出力する音声信号signal(t)を生成する。
signal(t)
=select_gain_H(t)・signal_H(t)
+select_gain_M(t)・signal_M(t)
+select_gain_L(t)・signal_L(t) …(10)
但し、signal(t):音声信号
select_gain_H(t):高利得係数
signal_H(t):高利得音声信号
select_gain_M(t):中利得係数
signal_M(t):中利得音声信号
select_gain_L(t);低利得係数
signal_L(t):低利得音声信号
次に上述した構成の本発明の実施の形態5に係る音処理装置1の処理について説明する。図17は、本発明の実施の形態5に係る音処理装置1の処理の一例を示すフローチャートである。音処理装置1は、第1受音部10a及び第2受音部10bにて受音した音に基づいて夫々音信号を生成し(S501)、生成した音信号を第1増幅部11a,11a、第2増幅部11b,11b及び第3増幅部11c,11cへ出力する。
音処理装置1の第1増幅部11a,11a、第2増幅部11b,11b及び第3増幅部11c,11cは、夫々固定された利得で各受音部10,10が生成した音信号を増幅し(S502)、増幅した音信号を夫々対応するA/D変換部12,12,…へ出力する。
音処理装置1のA/D変換部12,12,…は、A/D変換処理を行い(S503)、第1高利得入力信号in_1_H(t)、第2高利得入力信号in_2_H(t)、第1中利得入力信号in_1_M(t)、第2中利得入力信号in_2_M(t)、第1低利得入力信号in_1_L(t)及び第2低利得入力信号in_2_L(t)を制御部13へ出力する。
音処理装置1の制御部13は、各分離手段130,130,…の処理により、高利得音声信号signal_H(t)、中利得音声信号signal_M(t)及び低利得音声信号signal_L(t)並びに雑音信号noise(t)を分離する(S504)。
音処理装置1の制御部13は、推定手段131の処理により、低利得音声信号signal_L(t)及び雑音信号noise(t)の相関に基づいて、背景雑音のパワーpow_noise(n)を推定し(S505)、背景雑音のパワーpow_noise(n)及びパワー目標値refに基づいて、原利得制御値adj’(n)を求め(S506)、求めた原利得制御値adj’(n)の時間変化を平滑化することにより、利得制御値adj(t)を求める(S507)。
さらに音処理装置1の制御部13は、推定手段131の処理により、利得制御値adj(t)に基づいて利得制御値amp_gain(t)を求め(S508)、利得制御値amp_gain(t)及び利得テーブル132aに基づいて、高利得係数select_gain_H(t)、中利得係数select_gain_M(t)及び低利得係数select_gain_L(t)を導出し(S509)、導出した高利得係数select_gain_H(t)、中利得係数select_gain_M(t)及び低利得係数select_gain_L(t)を選択手段134へ出力する。
音処理装置1の制御部13は、選択手段134の処理により、高利得音声信号signal_H(t)、中利得音声信号signal_M(t)及び低利得音声信号signal_L(t)、並びに高利得係数select_gain_H(t)、中利得係数select_gain_M(t)及び低利得係数select_gain_L(t)から音声信号signal(t)を生成する(S510)。ステップS510は、夫々の利得で増幅された各音信号の中から処理の対象とする一又は複数の音声信号を選択し、また複数の音声信号を選択した場合、係数に基づいてレベルを補間した音声信号を生成する処理である。即ちいずれかの係数が「1」である場合、その係数に係る音声信号を処理の対象とする一の音声信号signal(t)として生成する。例えば高利得係数select_gain_H(t)が「1」、中利得係数select_gain_M(t)が「0」、そして低利得係数select_gain_L(t)が「0」である場合、高利得音声信号signal_Hを処理の対象となるsignal(t)とする。また「0」より大きく「1」未満である係数が複数存在する場合、それらの係数に係る複数の音声信号から、係数にて示される割合で合成した音声信号signal(t)を生成する。例えば高利得係数select_gain_H(t)が「0」、中利得係数select_gain_M(t)が「0.4」、そして低利得係数select_gain_L(t)が「0.6」である場合、中利得音声信号signal_M(t)及び低利得音声信号signal_L(t)を6:4の割合で加重平均した音声信号signal(t)が生成される。なお選択手段134にて音信号を選択するのではなく、増幅部11,11を選択し、選択された増幅部11,11のみを作動させることにより、音声信号signal(t)を生成する様にしても良い。ステップS510にて生成された音声信号signal(t)は、アプリケーション手段133へ出力され、アプリケーション手段133は、音声信号signal(t)に基づいて音声認識処理、通話処理等の処理を実行する。
実施の形態6.
実施の形態6は、実施の形態1において、アプリケーション手段にて利得を加味して処理を実行する形態である。実施の形態6に係るハードウェアの構成例は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。なお以降の説明において、実施の形態1と同様の構成要件については、実施の形態1と同様の符号を付して説明する。
図18は、本発明の実施の形態6に係る音処理装置1の機能の一例を示す機能ブロック図である。本発明のコンピュータプログラム100を実行した制御部13は、分離手段130、推定手段131、導出手段132及びアプリケーション手段133等のプログラムモジュールを生成する。
次に実施の形態6に係る音処理装置1の信号処理について説明する。実施の形態1乃至5にて説明した様に、本発明の音処理装置1は、増幅部11,11の利得制御を行うため、アプリケーション手段133に入力される音声信号signal(t)の利得は動的に変化する。そこで実施の形態6に係る音処理装置1は、導出手段133が求めた利得制御値amp_gain(t)を増幅部11,11へ出力するとともに、利得制御値adj(t)の累計値total_adj(t)をアプリケーション手段133へ出力する。利得制御値amp_gain(t)及び累計値total_adj(t)は、実施の形態4にて説明した利得制御値amp_gain(t)及び累計値total_adj(t)の導出方法を用いて求められる。
そしてアプリケーション手段133は、利得制御値adj(t)の累計値total_adj(t)として示される利得を加味して音声信号signal(t)を補正し、補正した音声信号signal(t)に基づいて音声認識処理、通話処理等の処理を実行する。
実施の形態7.
実施の形態7は、実施の形態1を拡張した実施の形態6において、利得を加味して補正した音声信号をアプリケーション手段に入力させる形態である。実施の形態7に係るハードウェアの構成例は、実施の形態1と同様であるので、実施の形態1を参照するものとし、その説明を省略する。なお以降の説明において、実施の形態6と同様の構成要件については、実施の形態6と同様の符号を付して説明する。
図19は、本発明の実施の形態7に係る音処理装置1の機能の一例を示す機能ブロック図である。本発明のコンピュータプログラム100を実行した制御部13は、分離手段130、推定手段131、導出手段132、アプリケーション手段133、音声信号signal(t)を補正する補正手段135等のプログラムモジュールを生成する。
次に実施の形態7に係る音処理装置1の信号処理について説明する。実施の形態7に係る音処理装置1では、分離手段130から補正手段135へ音声信号signal(t)を出力し、また導出手段132から利得制御値adj(t)の累計値total_adj(t)を出力する。
補正手段135は、下記の式(11)を用いて利得の補正値gain_cor(t)を算出する。
gain_cor(t)=10-total_adj(t)/10 …(11)
但し、gain_cor(t):利得の補正値
total_adj(t):利得制御値adj(t)の累計値
さらに補正手段135は、下記の式(12)を用いて音声信号signal(t)を補正した補正信号signal_cor(t)を生成する。
signal_cor(t)=gain_cor(t)・signal_cor(t)
…(12)
但し、signal_cor(t):補正信号
そして補正手段135は、補正信号signal_cor(t)をアプリケーション手段133へ出力し、アプリケーション手段133は、補正信号signal_cor(t)に基づいて音声認識処理、通話処理等の処理を実行する。
実施の形態8.
実施の形態8は、実施の形態1における音処理装置に相当するシステムを、複数台の装置を用いて実現する形態である。なお以降の説明において、実施の形態1と同様の構成については、実施の形態1と同様の符号を付し、その説明を省略する。
図20は、本発明の実施の形態8に係る音処理システムのハードウェアの構成例を示すブロック図である。本発明の実施の形態8に係る音処理システムは、受音部10,10、増幅部11,11及びA/D変換部12,12を備える受音装置2と、DSP等の利得制御装置3と、音声認識処理、通話処理等の処理を実行する処理装置4とを備えている。
図21は、本発明の実施の形態8に係る音処理システムの機能の一例を示す機能ブロック図である。利得制御装置3は、分離手段130、推定手段131及び導出手段132として機能する。処理装置4は、音声認識処理、通話処理等の処理を実行するアプリケーション手段134として機能する。
実施の形態8に係る各装置の処理は、実施の形態1の対応する構成と同様であるので、その説明を省略する。
前記実施の形態1乃至8では、本発明の無限に存在する形態の一部を例示したに過ぎず、各種ハードウェア及びソフトフェア等の構成は、適宜設定することが可能であり、また例示した基本的な処理以外にも様々な処理を組み合わせることが可能である。そして前記実施の形態1乃至8は、夫々独立した形態ではなく、適宜組み合わせることが可能である。
本発明の実施の形態1に係る音処理装置のハードウェアの構成例を示すブロック図である。 本発明の実施の形態1に係る音処理装置の機能の一例を示す機能ブロック図である。 本発明の実施の形態1に係る音処理装置において、制御部が入力を受け付ける音信号を示すグラフである。 本発明の実施の形態1に係る音処理装置において、指向性受音処理により分離された音信号の時間変化を示すグラフである。 本発明の実施の形態1に係る音処理装置において、推定手段が推定した背景雑音のパワーの時間変化を示すグラフである。 本発明の実施の形態1に係る音処理装置において、背景雑音のパワー及びパワー目標値の時間変化を示すグラフである。 本発明の実施の形態1に係る音処理装置において、原利得制御値及び利得制御値の時間変化を示すグラフである。 本発明の実施の形態1に係る音処理装置の処理の一例を示すフローチャートである。 本発明の実施の形態2に係る音処理装置の処理の一例を示すフローチャートである。 本発明の実施の形態3に係る音処理装置において、原利得制御値及び利得制御値の時間変化を示すグラフである。 本発明の実施の形態3に係る音処理装置の処理の一例を示すフローチャートである。 本発明の実施の形態4に係る音処理装置の機能の一例を示す機能ブロック図である。 本発明の実施の形態4に係る音処理装置の処理の一例を示すフローチャートである。 本発明の実施の形態5に係る音処理装置のハードウェアの構成例を示すブロック図である。 本発明の実施の形態5に係る音処理装置の機能の一例を示す機能ブロック図である。 本発明の実施の形態5に係る音処理装置にて用いられる利得テーブルの内容を示すグラフである。 本発明の実施の形態5に係る音処理装置の処理の一例を示すフローチャートである。 本発明の実施の形態6に係る音処理装置の機能の一例を示す機能ブロック図である。 本発明の実施の形態7に係る音処理装置の機能の一例を示す機能ブロック図である。 本発明の実施の形態8に係る音処理システムのハードウェアの構成例を示すブロック図である。 本発明の実施の形態8に係る音処理システムの機能の一例を示す機能ブロック図である。 従来の音処理装置を示す機能ブロック図である。
符号の説明
1 音処理装置
10 受音部
10a 第1受音部
10b 第2受音部
11 増幅部
11a 第1増幅部
11b 第2増幅部
11c 第3増幅部
12 A/D変換部
13 制御部
130 分離手段
130a 第1分離手段
130b 第2分離手段
130c 第3分離手段
131 推定手段
132 導出手段
132a 利得テーブル
133 アプリケーション手段
134 選択手段
135 補正手段
2 受音装置
3 利得制御装置
4 処理装置
100 コンピュータプログラム

Claims (10)

  1. 受音した音に基づいて音信号を生成する複数の受音部を備え、該複数の受音部が生成した音信号を増幅して処理する音処理装置において、
    設定された利得制御値に基づいて、各受音部が生成した音信号に対する利得を夫々制御する複数の増幅部と、
    複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離する分離部と、
    分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定する推定部と、
    推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、前記複数の増幅部へ出力する利得制御値を求める導出部と
    を備え、
    前記複数の増幅部は、前記導出部が求めた利得制御値に基づいて利得を制御する様にしてある
    ことを備えることを特徴とする音処理装置。
  2. 前記導出部は、推定した背景雑音のパワー及びパワー目標値の差分を求め、求めた差分の時間変化を平滑化することにより利得制御値を求める様にしてあることを特徴とする請求項1に記載の音処理装置。
  3. 前記導出部は、求めた差分及び以前に求めた利得制御値の大小関係に基づいて、平滑化の程度を示す時定数を決定する様にしてあり、差分の時間変化の平滑化は、決定された時定数に基づいて行う様にしてあることを特徴とする請求項2に記載の音処理装置。
  4. 前記導出部は、推定した背景雑音のパワーがパワー目標値より大きい場合にのみ、又は推定した背景雑音のパワーがパワー目標値より小さい場合にのみ利得を変更する利得制御値を求める様にしてあることを特徴とする請求項1乃至請求項3のいずれかに記載の音処理装置。
  5. 前記導出部は、利得の制御幅が予め設定されている前記増幅部の制御範囲内となる様に利得制御値を調整する様にしてあることを特徴とする請求項1乃至請求項4のいずれかに記載の音処理装置。
  6. 受音した音に基づいて音信号を生成する複数の受音部を備え、該複数の受音部が生成した音信号を増幅して処理する音処理装置において、
    前記複数の受音部が夫々生成した音信号の夫々に対し、夫々異なる利得にて音信号を夫々増幅する複数の増幅部と、
    複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離する分離部と、
    分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定する推定部と、
    推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、受音部が生成した音信号に対する利得の目標値を求める導出部と、
    利得の目標値及び予め記憶されている各増幅部の利得に基づいて、どの増幅部からの音信号を処理の対象とするかを選択する選択部と
    を備えることを特徴とする音処理装置。
  7. 雑音環境下で受音した音に基づいて音信号を生成する複数の受音部、及び該複数の受音部が受音した音信号を、設定された利得制御値に基づいて増幅する増幅部を備える受音装置と連携し、前記増幅部の利得を制御する利得制御装置であって、
    複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離する分離部と、
    分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定する推定部と、
    推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、前記受音装置へ出力する利得制御値を求める導出部と
    を備えることを特徴とする利得制御装置。
  8. 受音した音に基づいて音信号を生成する複数の受音部、及び該複数の受音部が受音した音信号を、設定された利得制御値に基づいて増幅する増幅部を備える受音装置と連携可能なコンピュータに、前記増幅部の利得を制御させる利得制御方法であって、
    前記コンピュータに、
    複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離する手順と、
    分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定する手順と、
    推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、前記増幅部に設定する利得制御値を求める手順と
    を実行させることを特徴とする利得制御方法。
  9. 受音した音に基づいて音信号を生成する複数の受音部、及び該複数の受音部が受音した音信号を、設定された利得制御値に基づいて増幅する増幅部を備える受音装置と連携可能なコンピュータに、前記増幅部の利得を制御させるコンピュータプログラムにおいて、
    前記コンピュータに、
    複数の受音部に係る夫々の音信号に基づいて、予め設定されている目的方向から到来する音に基づく音信号及び他の方向から到来する音に基づく音信号を分離させる手順と、
    分離した目的方向に係る音信号及び他の方向に係る音信号の相関に基づいて、音信号に含まれる背景雑音のパワーを推定させる手順と、
    推定した背景雑音のパワー及び予め設定されているパワー目標値に基づいて、前記増幅部に設定する利得制御値を求めさせる導出手順と
    を実行させることを特徴とするコンピュータプログラム。
  10. 前記導出手順は、推定した背景雑音のパワー及びパワー目標値の差分を求め、求めた差分の時間変化を平滑化することにより利得制御値を求める様にしてあることを特徴とする請求項9に記載のコンピュータプログラム。
JP2007238144A 2007-09-13 2007-09-13 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム Active JP4854630B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007238144A JP4854630B2 (ja) 2007-09-13 2007-09-13 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム
DE102008039276.6A DE102008039276B4 (de) 2007-09-13 2008-08-23 Tonverarbeitungsvorrichtung, Vorrichtung und Verfahren zum Steuern der Verstärkung und Computerprogramm
US12/232,177 US8473291B2 (en) 2007-09-13 2008-09-11 Sound processing apparatus, apparatus and method for controlling gain, and computer program
CN2008101491467A CN101388216B (zh) 2007-09-13 2008-09-12 声音处理装置、控制增益的装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007238144A JP4854630B2 (ja) 2007-09-13 2007-09-13 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2009069503A JP2009069503A (ja) 2009-04-02
JP4854630B2 true JP4854630B2 (ja) 2012-01-18

Family

ID=40348773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007238144A Active JP4854630B2 (ja) 2007-09-13 2007-09-13 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム

Country Status (4)

Country Link
US (1) US8473291B2 (ja)
JP (1) JP4854630B2 (ja)
CN (1) CN101388216B (ja)
DE (1) DE102008039276B4 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2012070670A1 (ja) * 2010-11-25 2014-05-19 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
JP5857403B2 (ja) * 2010-12-17 2016-02-10 富士通株式会社 音声処理装置および音声処理プログラム
EP2485395B1 (en) * 2011-02-04 2013-05-01 Harman International Industries Ltd. Audio Mixing Console avoiding Signal Level Overload
US9037276B2 (en) * 2011-04-06 2015-05-19 International Business Machines Corporation Dynamic setting of increments on an amplitude scale
WO2012137263A1 (ja) * 2011-04-08 2012-10-11 三菱電機株式会社 音声認識装置およびナビゲーション装置
GB2491173A (en) * 2011-05-26 2012-11-28 Skype Setting gain applied to an audio signal based on direction of arrival (DOA) information
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
JP5817368B2 (ja) * 2011-09-13 2015-11-18 ソニー株式会社 情報処理装置及び情報処理方法
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
MX342965B (es) * 2013-04-05 2016-10-19 Dolby Laboratories Licensing Corp Sistema y método de compansión para reducir el ruido de cuantificación usando extensión espectral avanzada.
JP2016109725A (ja) * 2014-12-02 2016-06-20 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
CN107925819B (zh) * 2015-08-24 2020-10-02 雅马哈株式会社 声音拾取装置和声音拾取方法
US10535360B1 (en) * 2017-05-25 2020-01-14 Tp Lab, Inc. Phone stand using a plurality of directional speakers
JP2019205114A (ja) 2018-05-25 2019-11-28 ヤマハ株式会社 データ処理装置、及びデータ処理方法。
CN109905814B (zh) * 2019-03-22 2020-09-11 广州小鹏汽车科技有限公司 一种车内多音频播放方法、车载音频系统及车辆
CN116168719A (zh) * 2022-12-26 2023-05-26 杭州爱听科技有限公司 一种基于语境分析的声音增益调节方法及系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2867425B2 (ja) * 1989-05-30 1999-03-08 日本電気株式会社 音声認識用前処理装置
US5440639A (en) * 1992-10-14 1995-08-08 Yamaha Corporation Sound localization control apparatus
US5530760A (en) * 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
JPH09116362A (ja) * 1995-10-19 1997-05-02 Matsushita Electric Ind Co Ltd 自動音量制御装置
US5852800A (en) * 1995-10-20 1998-12-22 Liquid Audio, Inc. Method and apparatus for user controlled modulation and mixing of digitally stored compressed data
US5809472A (en) * 1996-04-03 1998-09-15 Command Audio Corporation Digital audio data transmission system based on the information content of an audio signal
JP3310225B2 (ja) 1998-09-29 2002-08-05 松下電器産業株式会社 雑音レベル時間変動率計算方法及び装置と雑音低減方法及び装置
JP2003232847A (ja) * 2002-02-07 2003-08-22 Toshiba Corp 受信装置および利得制御方法
US7092529B2 (en) * 2002-11-01 2006-08-15 Nanyang Technological University Adaptive control system for noise cancellation
JP4247037B2 (ja) * 2003-01-29 2009-04-02 株式会社東芝 音声信号処理方法と装置及びプログラム
JP3891153B2 (ja) * 2003-07-31 2007-03-14 ソニー株式会社 通話装置
JP2006201286A (ja) * 2005-01-18 2006-08-03 Matsushita Electric Ind Co Ltd 車載収音装置及び車内収音情報表示方法
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
JP4637725B2 (ja) * 2005-11-11 2011-02-23 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム

Also Published As

Publication number Publication date
DE102008039276A1 (de) 2009-03-19
US20090076810A1 (en) 2009-03-19
JP2009069503A (ja) 2009-04-02
DE102008039276B4 (de) 2016-10-06
CN101388216A (zh) 2009-03-18
US8473291B2 (en) 2013-06-25
CN101388216B (zh) 2012-06-27

Similar Documents

Publication Publication Date Title
JP4854630B2 (ja) 音処理装置、利得制御装置、利得制御方法及びコンピュータプログラム
JP4916394B2 (ja) エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
JP5562836B2 (ja) 移動体オーディオデバイスのための自動的な音量およびダイナミックレンジの調整
JP5257366B2 (ja) 雑音抑圧装置、雑音抑圧制御装置、雑音抑圧方法及び雑音抑圧プログラム
US8903721B1 (en) Smart auto mute
EP2265039B1 (en) Hearing aid
JP5141691B2 (ja) 音処理装置、補正装置、補正方法及びコンピュータプログラム
US20080031469A1 (en) Multi-channel echo compensation system
JP4580409B2 (ja) 音量制御装置および方法
US20120303363A1 (en) Processing Audio Signals
WO2005125272A1 (ja) ハウリング抑圧装置、プログラム、集積回路、およびハウリング抑圧方法
JP2007515830A (ja) 補聴器の受音特性の指向性制御方法および制御可能な指向特性を備える補聴器用の信号処理装置
WO2009104252A1 (ja) 音処理装置、音処理方法及び音処理プログラム
JPWO2010131470A1 (ja) ゲイン制御装置及びゲイン制御方法、音声出力装置
JP4249729B2 (ja) 自動利得制御方法、自動利得制御装置、自動利得制御プログラム及びこれを記録した記録媒体
KR101182017B1 (ko) 휴대 단말기에서 복수의 마이크들로 입력된 신호들의잡음을 제거하는 방법 및 장치
CN112272848A (zh) 使用间隙置信度的背景噪声估计
JP4843691B2 (ja) 信号特性変化装置
US11205437B1 (en) Acoustic echo cancellation control
JP2008129107A (ja) オートゲインコントロール装置、音声記録装置、映像・音声記録装置および通話装置
WO2018173526A1 (ja) 音声処理用コンピュータプログラム、音声処理装置及び音声処理方法
JP3619461B2 (ja) 多チャネル雑音抑圧装置、その方法、そのプログラム及びその記録媒体
JP2005157086A (ja) 音声認識装置
JP2006039108A (ja) 特定話者音声出力装置及び特定話者判定プログラム
JP5857216B2 (ja) 自動利得制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111017

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111025

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4854630

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150