JP6151236B2 - 雑音抑圧装置、その方法及びプログラム - Google Patents

雑音抑圧装置、その方法及びプログラム Download PDF

Info

Publication number
JP6151236B2
JP6151236B2 JP2014224894A JP2014224894A JP6151236B2 JP 6151236 B2 JP6151236 B2 JP 6151236B2 JP 2014224894 A JP2014224894 A JP 2014224894A JP 2014224894 A JP2014224894 A JP 2014224894A JP 6151236 B2 JP6151236 B2 JP 6151236B2
Authority
JP
Japan
Prior art keywords
signal
sound
adaptive filter
noise
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014224894A
Other languages
English (en)
Other versions
JP2016090799A (ja
Inventor
達也 加古
達也 加古
小林 和則
和則 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014224894A priority Critical patent/JP6151236B2/ja
Publication of JP2016090799A publication Critical patent/JP2016090799A/ja
Application granted granted Critical
Publication of JP6151236B2 publication Critical patent/JP6151236B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Description

本発明は、ある収音信号に含まれる雑音成分を他の収音信号を利用して抑圧する雑音抑圧技術に関する。特に、モバイル端末に搭載された複数のマイクロホンから得られる複数の収音信号のうちの一つの収音信号に含まれる雑音成分を抑圧する雑音抑圧技術に関する。
音声をマイクロホンで収音する場合、音声とともに周囲環境の雑音を収音してしまうことは不可避の事象である。従って、目的音成分と雑音成分とを含む音をマイクロホンで収音する場合には、何らかの方法で雑音成分を除去ないし抑圧する技術がこれまで研究されてきた。
例えば、従来、スマートフォンなどのモバイル端末のマイクロホンを利用して、雑音抑圧を行う場合、スペクトルサブトラクション法が演算量も少ないので一般的に用いられてきた(非特許文献1参照)。スペクトルサブトラクション法は、接話マイクロホン等で収音した信号から雑音区間(すなわち、収音したい音声(目的音)が含まれない時間区間で、非音声区間とも呼ぶ)の雑音パワーを推定する。そして推定した雑音パワーを用いて音声区間(目的音が含まれる時間区間)の収音信号に重畳する雑音成分を周波数スペクトル上で差し引くことで雑音を抑圧する手法である。
また、モノラルマイクロホン向けのスペクトルサブトラクション法以外にも、スマートフォンに二つのマイクロホンを搭載し、二つのマイクロホンで収音した信号からマイクロホンアレイ処理を行い、背面に配置されたサブマイクロホンで収音した信号の成分を、通話時において口元近傍に位置するように配置されたメインマイクロホンの信号から除去することで、雑音抑圧を行う雑音抑圧処理が用いられている(非特許文献2及び非特許文献3参照)。この処理方法が成り立つ前提には、二つのマイクロホンの特性はある程度同じで、かつ、サブマイクロホンは雑音のみ収音し、メインマイクロホンは目的音と雑音との双方を収音するという仮定がある。
目的音に重畳する雑音の音源は、目的音の音源より離れた位置に存在し、雑音の音源とマイクロホンとの間の伝達特性の影響をより大きく受ける。加えて、一般的にはその特性は未知であるため、それを推定する必要がある。そこで、その伝達過程を未知システムとして適応フィルタによるシステム同定を行い、サブマイクロホンの収音信号に適応フィルタを乗じて得られるフィルタ出力をメインマイクロホンの収音信号から差し引くことで目的音を取り出す。
このとき、二つのマイクロホンの間隔は大き過ぎず、小さ過ぎないことが望ましい。二つのマイクロホンは間隔が大き過ぎる場合、互いに異なった特徴の雑音成分を収音することになり、単純なスペクトルサブトラクション法では誤った雑音成分を差し引くことになるためである。他方、二つのマイクロホンの間隔が小さ過ぎる場合、各マイクロホンの雑音成分の相関性は高まるが、本来除去対象とすべきでない目的音成分もサブマイクロホンで雑音成分と同時に収音することになり、サブマイクロホンは雑音のみ収音するという前提が崩れてしまう。すなわち二つのマイクロホンを用いたスペクトルサブトラクション法は、二つのマイクロホンで雑音を収音しながら、その相関性を保ちつつ、目的音をメインマイクロホンでのみ収音しなければならないという相反する音響的特性を理想として適用されている。しかし現実的には、二つのマイクロホンの特性がそろっているため、回り込んだ目的音をサブマイクロホンで収音しないようにすることは困難である。
BOLL S. F., "Suppression of acoustic noise in speech using spectral subtraction. Acoustics", Speech and Signal Processing, 1979, IEEE Transactions on, Volume:27 , Issue: 2, pp.113-120. Jian Zhang et. al. "A FAST TWO-MICROPHONE NOISE REDUCTION ALGORITHM BASED ON POWER LEVEL RATIO FOR MOBILE PHONE", Kowloon: Chinese Spoken Language Processing (ISCSLP), 2012, 8th International Symposium on, pp.206-209. 中西 功、「知識の森」、1 群(信号・システム)-- 9 編(ディジタル信号処理)3 章適応信号処理、[online]、電子情報通信学会、「知識の森」、[平成26年10月23日検索]、インターネット<http://www.ieice-hbkb.org/files/01/01gun_09hen_03m.pdf>
スマートフォンに取り付けられた二つのマイクロホンを利用して、背面に配置されたサブマイクロホンの収音信号を用いてメインマイクロホンの収音信号から雑音成分を除去するスペクトルサブトラクション法を行うだけでは、サブマイクロホンで収音してしまっている目的音までもメインマイクロホンの収音信号から除去してしまい、目的音にミュージカルノイズ等として知られている劣化や音声の歪みが生じてしまうという課題がある。
そこで、劣化や音声の歪みを抑えるために、非音声区間である雑音区間でのみ適応フィルタによるシステム同定を行う。雑音区間で推定された適応フィルタを用いることで目的音を残しながら雑音を消すことができる。
本発明では、この非音声区間のみで適応フィルタの学習をすすめる処理を適応フィルタの式を変形を変形することで実現する。本発明では、新たにVAD(voice activity detection)などの装置を必要とせずに、劣化や音声の歪みを抑え、雑音を抑圧する雑音抑圧装置、その方法及びプログラムを提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、雑音抑圧装置は、第一収音信号に含まれる雑音成分を第二収音信号を用いて抑圧する。雑音抑圧装置は、第二収音信号に適応フィルタを用いてフィルタリングを行い、フィルタリング後信号を求める適応フィルタ部と、第一収音信号と、フィルタリング後信号との差分を誤差信号として求める減算部とを含み、適応フィルタ部において、誤差信号と第二収音信号とを用いて、誤差信号が最小となるように逐次的に適応フィルタを更新し、第二収音信号に対する誤差信号の割合である誤差割合の絶対値が所定の閾値以下の場合には、誤差割合に対する単調増加関数に基づく第1更新量により適応フィルタを更新し、誤差割合の絶対値が所定の閾値より大きい場合には、誤差割合に対して第1更新量よりも増加量が小さい単調増加関数に基づく第2更新量により適応フィルタを更新する。
上記の課題を解決するために、本発明の他の態様によれば、雑音抑圧方法は、第一収音信号に含まれる雑音成分を第二収音信号を用いて抑圧する。雑音抑圧方法は、第二収音信号に適応フィルタを用いてフィルタリングを行い、フィルタリング後信号を求める適応フィルタステップと、第一収音信号と、フィルタリング後信号との差分を誤差信号として求める減算ステップとを含み、適応フィルタステップにおいて、誤差信号と第二収音信号とを用いて、誤差信号が最小となるように逐次的に適応フィルタを更新し、第二収音信号に対する誤差信号の割合である誤差割合の絶対値が所定の閾値以下の場合には、誤差割合に対する単調増加関数に基づく第1更新量により適応フィルタを更新し、誤差割合の絶対値が所定の閾値より大きい場合には、誤差割合に対して第1更新量よりも増加量が小さい単調増加関数に基づく第2更新量により適応フィルタを更新する。
本発明によれば、新たにVAD(voice activity detection)などの装置を必要とせずに、劣化や音声の歪みを抑え、雑音を抑圧することができるという効果を奏する。
第一実施形態に係る雑音抑圧装置の機能ブロック図。 第一実施形態に係る雑音抑圧装置の処理フローの例を示す図。 図3Aは第一実施形態に係る雑音抑圧装置の正面図、図3Bは第一実施形態に係る雑音抑圧装置の背面図。 制限関数f(β)の例を示す図。 制限関数f(β)の例を示す図。
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態のポイント>
雑音抑圧装置には、メインマイクロホンとサブマイクロホンとが搭載される。例えば、雑音抑圧装置は、モバイル端末(小型ノートパソコン・スマートホン・タブレット型端末等)であり、その特性上、筐体が小さく、二つのマイクロホンを所定の間隔以上離すことは難しい。そのため、本実施形態では、雑音はメインマイクロホンとサブマイクロホンにおいて同じ音圧(同程度の音圧)で収音されると仮定する。また、本実施形態では、メインマイクロホンで収音する収音信号に含まれる目的音の音圧が、サブマイクロホンで収音する収音信号に含まれる目的音の音圧よりも大きくなるように、メインマイクロホンとサブマイクロホンとをモバイル端末上に配置する。例えば、通話時において口元近傍に位置するようにメインマイクロホンを配置し、通話時において口元から最も遠く目的音が入りずらい位置になるようにサブマイクロホンを配置する。例えば、メインマイロホンをモバイル端末正面下部や底面に配置し、サブマイクロホンをモバイル端末背面上部や上面に配置する。なお、モバイル端末で通話をする際に通話者が耳を当てる面を正面とし、通話をする際に口元側に位置する部分を下部、口元側の面を底面とする。この前提を元に、音声区間と非音声区間とで適応フィルタの更新量に対して異なる制限をかける制限関数を用いることで、適応フィルタの学習方法を調整し、適応フィルタの安定化と目的音の劣化や音声の歪みを抑え、雑音を抑圧することが本発明のポイントである。
本実施形態では、モバイル端末に取り付けられた2つのマイクロホンを利用し、適応フィルタを用いて雑音抑圧、音声強調を行う。
なお、上記のような配置にすると、マイクロホン間の収音信号の関係は次のようになる。目的音はメインマイクロホンにおいて、サブマイクロホンに比べて高い音圧で収音される。また、雑音はメインマイクロホン、サブマイクロホンともに同程度の音圧で収音される。この性質を用いて適応フィルタにより雑音を抑圧し、目的音を強調する。
<第一実施形態に係る雑音抑圧装置100>
図1は第一実施形態に係る雑音抑圧装置100の機能ブロック図を、図2はその処理フローを示す。なお、図1の機能ブロック図は処理回路を明示するためのものであって、実際には回路構成は雑音抑圧装置100に内蔵されているものである。
雑音抑圧装置100は、メインマイクロホン101とサブマイクロホン102と適応フィルタ部110と減算部120とフィルタ設計部130とスペクトルフィルタ部140とを含む。
<メインマイクロホン101及びサブマイクロホン102>
メインマイクロホン101は、目的音と雑音を収音し、第一収音信号d(n)を出力する(S101)。サブマイクロホン102は、目的音と雑音を収音し、第二収音信号x(n)を出力する(S102)。なお、nを時間を表すインデックスとする。雑音抑圧装置100に搭載するメインマイクロホン101とサブマイクロホン102との位置を図3に示す。図3Aは雑音抑圧装置100の正面図を、図3Bは背面図を示す。例えば、メインマイクロホン101及びサブマイクロホン102は、何れも無指向性型のマイクロホンであり、メインマイクロホン101及びサブマイクロホン102のマイクロホン感度の周波数特性は揃っていることとする。ただし、本発明は、メインマイクロホン101及びサブマイクロホン102の特性をこれに限定するものではない。
メインマイクロホン101は、雑音抑圧装置100を送受話装置または音声入力装置として利用する際に利用者の口元に近づくように雑音抑圧装置100上に配置されている。サブマイクロホン102はメインマイクロホン101と同一筐体上(つまり雑音抑圧装置100上)に配置され、メインマイクロホン101の配置位置から遠ざけつつ、メインマイクロホン101が収音する周囲雑音と相関性の高い周囲雑音を収録する位置に配置されている。また、サブマイクロホン102の入力孔は、利用者が手で塞がないように配置される。しかし、サブマイクロホン102側に利用者の音声が、空間を通じて伝わったり、利用者の骨や筋肉や筐体の振動を通じて伝わったり、あるいは周囲の音響環境で反射するなどによって、収音されることを否定するものではない。
<適応フィルタ部110>
適応フィルタ部110は、第二出力信号x(n)と誤差信号e(n)とを受け取り、第二収音信号x-(n)に適応フィルタh-(n)を用いてフィルタリングを行い(S110)、フィルタリング後信号h-H(n)x-(n)を求め、出力する。ただし、h-(n)=[h0(n),h1(n),…,hM-1(n)]T、x(n)=[x(n),x(n-1),…,x(n-M+1)]Tとし、Tは転置を、Hは複素共役転置を表す。適応フィルタh-(n)は畳み込み演算を行うため、タップサイズMの長さをもち、第二収音信号x-(n)を演算に用いる。
また、適応フィルタ部110は、誤差信号e(n)と第二収音信号x(n)とを用いて、誤差信号e(n)が最小となるように逐次的に適応フィルタh-(n)を更新し、第二収音信号x(n)に対する誤差信号e(n)の割合(以下「誤差割合」ともいう)βの絶対値が所定の閾値(本実施形態では閾値を1とする)以下の場合には、誤差割合βに対する単調増加関数に基づく第1更新量により適応フィルタh-(n)を更新し、誤差割合βの絶対値が所定の閾値より大きい場合には、誤差割合βに対して第1更新量よりも増加量が小さい単調増加関数に基づく第2更新量により適応フィルタh-(n)を更新する。
以下、適応フィルタの設計方法について述べる。メインマイクロホン101には目的音と雑音が混在する音声が収音されている。この雑音をサブマイクロホン102で収音した第二収音信号x(n)と適応フィルタh-(n)とを用いて、除去する。本実施形態では、適応フィルタの更新に、正規化LMS(NLMS: Normalized least mean square)法を用いる(引用文献3参照)。
適応フィルタh-(n)は、第一収音信号d(n)とフィルタリング後信号h-H(n)x-(n)との差分である誤差信号e(n)が最小になるようフィルタ設計を行う。
e(n)=d(n)-h-H(n)x-(n) (1)
なお、適応フィルタh-(n)は逐次的に更新を行う。通常のNLMSでは、更新式は以下を用いる。
Figure 0006151236
ここで、||x(n)||は第二収音信号x(n)のノルム、適応定数μは更新式の更新量を決めるステップサイズのパラメータである。適応係数μはシステム動作中は誤差信号e(n)に拠らず一定値を取り、値の範囲は0<μ<2の実数である。この更新式を以下のように分解する。
Figure 0006151236
ここでβは、第二収音信号x-(n)のノルムに対する誤差信号e(n)の比率(割合)を表している。
適応フィルタh-(n)の学習がある程度収束した状態では、モバイル端末に取り付けられた二つのマイクロホンの位置関係から、非音声区間において、メインマイクロホン101とサブマイクロホン102とで雑音成分を同程度の音圧で収音することができる。そのため、適応フィルタh-(n)のフィルタリングにより、第一収音信号d(n)とフィルタリング後信号h-H(n)x-(n)との差分である誤差信号e(n)は小さくなり、第二収音信号x-(n)のノルムに対する誤差信号e(n)の比率も小さくなり、-1<β<1となる。
一方、メインマイクロホン101は話者の口元の近くに配置されることから、音声区間における音声はメインマイクロホン101の収音の音圧が大きくなる。すると誤差信号e(n)には話者の発した目的音成分が多く含まれ、誤差信号e(n)の絶対値は第二収音信号x-(n)のノルム||x(n)||よりも大きな値となり、β<-1, 1<βとなる。本実施形態では、βに対して非線形な制限関数f(β)を用いることで、音声区間でのフィルタの更新量が小さくなる。
Figure 0006151236
制限関数f(β)は|β|≧1(β≦-1,β≧1)で小さな値をとる非線形な関数である。例えば、以下の式で表される。
Figure 0006151236
例えば、L=5とすると、図4で示す関数となる。また、例えば、制限関数f(β)は以下の式で表されるシグモイド関数を用いてもよい。
Figure 0006151236
例えば、L=5とすると、図5で示す関数となる。図4と図5において、誤差割合βの絶対値が1以下の場合には、誤差割合βに対する単調増加関数に基づく第1更新量を用い、誤差割合βの絶対値が1より大きい場合には、誤差割合βに対して第1更新量よりも増加量が小さい単調増加関数に基づく第2更新量を用いる。よって、誤差割合βの絶対値が1(閾値)以下の場合の更新量(第1更新量)が、誤差割合βの絶対値が1(閾値)より大きい場合の更新量(第2更新量)よりも大きい。そして、式(5)により、第1更新量または第2更新量に基づいて適応フィルタh-(n)を更新する。
関数の制約条件はβ=1, β=-1を境に、βの値の絶対値が減少する。雑音区間では、メインマイクロホン101、サブマイクロホン102ともに同程度の音圧で観測されるため、もし適応フィルタによって全くメインマイクの信号を抑圧しない場合はβが1をとり、抑圧することができれば|β|<1となる。次に音声区間では、誤差信号e(n)が第二収音信号x(n)に比べて大きく観測されるためβ>1となる。音声区間で誤差信号e(n)を小さくするよう学習すると目的音声まで抑圧してしまう。それを避けるためβ>1では小さい値をとることでフィルタの更新量が小さくなる制限関数の設計となっている。
別の言い方をすると、音声区間ではメインマイクロホン101で収音する第一収音信号d(n)とサブマイクロホン102で収音する第二収音信号x(n)とで観測できる音圧に大きな差があり、誤差信号e(n)には目的音成分が残るため、第二収音信号x-(n)のノルムに対する誤差信号e(n)の比率も大きくなる。そのため、|β|>1となる。逆に言えば、|β|>1となる区間は音声区間の可能性が高く、|β|>1となる区間で制限を加える事で、音声区間での適応フィルタのステップサイズを抑えることができる。言い換えると、|β|>1となる区間において、βに比べ、f(β)の値を小さくすることができる。また、本手法によって、ステップサイズを|β|>1(音声区間)で0にしないことで、雑音源がサブマイクロホン102の近傍に存在する場合や、雑音源が大きく移動し、雑音源からサブマイクロホン102、メインマイクロホン101への伝達関数が変化した場合に|β|>1となった場合にフィルタの更新が停止することを防ぐことができる。この制限関数f(β)を用いることで、音声区間に存在する目的音である音声信号を消す方向に進む適応フィルタの処理を抑えることが出来る。また、雑音と性質の異なる音声区間でフィルタの学習を緩和することでフィルタの安定性を高める効果も得ることが出来る。
<減算部120>
減算部120は、第一収音信号d(n)とフィルタリング後信号h-H(n)x-(n)とを受け取り、その差分d(n)-h-H(n)x-(n)を誤差信号e(n)として求め(S120)、出力する。
<フィルタ設計部130>
フィルタ設計部130は、第二収音信号x(n)と誤差信号e(n)とを受け取り、減算部120で消し残った雑音成分を抑圧するフィルタGを設計し(S130)、出力する。
なお、フィルタの設計手法は様々あるが、例えば、参考文献1記載にPSD(power-spectrum density:パワースペクトル密度)推定に基づく雑音除去技術を利用した手法を用いてフィルタ設計を行う。
(参考文献1)丹羽健太、日岡裕輔、小林和則、鎌土記良、「雑音下での音声認識率向上を目的としたマイクロホンアレイの実装」、日本音響学会講演論文集、2014年、pp.717-718
例えば、フィルタ設計部130は、第二収音信号x(n)と誤差信号e(n)とを周波数領域の信号である周波数領域第二収音信号X(ω,τ)及び周波数領域誤差信号E(ω,τ)に変換する。誤差信号と第二収音信号の比から|E(ω,τ)|/|X(ω,τ)| > 1となるときの周波数領域誤差信号E(ω,τ)を目的音のスペクトルEs(ω,τ)とし、|E(ω,τ)|/|X(ω,τ)| < 1となるときの周波数領域誤差信号E(ω,τ)を雑音のスペクトルEn(ω,τ)とする。このとき、次式により、Wiener法に基づいてポストフィルタG(ω)を設計する。
Figure 0006151236
Xs(ω)= E[|Es(ω,τ)|2], Xn(ω)= E[|En(ω、τ)2|]とする。ただし、ωが周波数を表すインデックスであり、τはフレームを表すインデックスであり、E[]はフレームτの平均値とする。スペクトルの算出方法は例えば、高速フーリエ変換(FFT)により時間領域の信号を周波数領域の信号に変換すればよい。
<スペクトルフィルタ部140>
スペクトルフィルタ部140は、誤差信号e(n)とフィルタGとを受け取り、フィルタGを用いて、誤差信号e(n)に対してフィルタリングを行う(S140)。誤差信号e(n)に含まれる消し残った雑音成分を抑圧するために、ポストフィルタG(ω)を掛け合わせる。
Y(ω,τ)=G(ω)E(ω,τ) (9)
最後に、Y(ω,τ)を逆高速フーリエ変換(IFFT)することで、出力信号y(n)を得る。
<効果>
このような構成により、新たにVAD(voice activity detection)などの装置を必要とせずに、劣化や音声の歪みを抑え、雑音を抑圧することができる。本実施形態では、スマートフォンに搭載された二つのマイクロホンを利用して雑音抑圧を行う際に、音声区間、雑音区間ごとに制限関数によって適応フィルタの更新の速度量を変化させる。これにより、音声区間での誤った方向へのフィルタ学習を抑制し、2つのマイクロホンへ同等の音圧で収音される雑音のみを消すフィルタを作成することができる。また、音声区間でのフィルタ学習を緩和する事で、音声の抑圧を防ぎ、フィルタの安定化を図ることが可能となる。
<変形例>
本実施形態では、β<-1、β>1において、フィルタの更新量を制限しているが、β<-a、β>aにおいてフィルタの更新量を制限してもよい。aの値はa> 0とする。例えば、式(6)を以下の式に置き換えてもよい。
Figure 0006151236
本実施形態では、適応フィルタ部110、減算部120の処理を時間領域で行っているが、周波数領域で処理を行ってもよい。例えば、図示しない周波数領域変換部を設け、第一収音信号d(n)及び第二収音信号x(n)をそれぞれ周波数領域の信号である周波数領域第一収音信号D(ω,τ)及び周波数領域第二収音信号X(ω,τ)に変換する。
適応フィルタ部110は、周波数領域第二出力信号X(ω,τ)と周波数領域誤差信号E(ω,τ)とを受け取り、周波数領域第二出力信号X(ω,τ)に適応フィルタH(ω,τ)を用いてフィルタリングを行い(S110)、フィルタリング後信号H(ω,τ)X(ω,τ)を求め、出力する。
また、適応フィルタ部110では、次式により、フィルタを更新する。
Figure 0006151236
周波数領域誤差信号E(ω,τ)に目的音成分が多く含まれるとき、周波数領域誤差信号E(ω,τ)の絶対値は周波数領域第二収音信号X(ω,τ)のノルム||X(ω,τ)||よりも大きな値となり、β<-1, 1<βとなる。この変形例の場合でも、適応フィルタ部110では第一実施形態と同様に、誤差割合βに対して非線形な制限関数f(β)を用いることで、音声区間でのフィルタの更新量を小さくすることができる。また、この説明では非線形な制限関数f(β)は全周波数帯域で同じ制限関数f(β)を用いることとしたが、周波数領域ωごとにそれぞれ別の制限関数f(β,ω)を用いるように構成しても良い。
減算部120では、周波数領域第一収音信号D(ω,τ)とフィルタリング後信号H(ω,τ)X(ω,τ)とを受け取り、その差分D(ω,τ)-H(ω,τ)X(ω,τ)を周波数領域誤差信号E(ω,τ)として求め(S120)、出力する。後段(フィルタ設計部130及びスペクトルフィルタ部140)において、周波数領域で処理を行うのであれば、そのまま周波数領域第二出力信号X(ω,τ)と周波数領域誤差信号E(ω,τ)を用いればよいし、時間領域信号を用いるのであれば、周波数領域信号に変換して後段に出力すればよい。
また、本実施形態のポイントは、音声区間と非音声区間とで適応フィルタの更新量に対して異なる制限をかける制限関数を用いることである。よって、雑音抑圧装置100は、必ずしもメインマイクロホン101、サブマイクロホン102、フィルタ設計部130、スペクトルフィルタ部140を含まなくともよい。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (7)

  1. 第一収音信号に含まれる雑音成分を第二収音信号を用いて抑圧する雑音抑圧装置であって、
    前記第二収音信号に適応フィルタを用いてフィルタリングを行い、フィルタリング後信号を求める適応フィルタ部と、
    前記第一収音信号と、前記フィルタリング後信号との差分を誤差信号として求める減算部とを含み、
    前記適応フィルタ部において、前記誤差信号と前記第二収音信号とを用いて、誤差信号が最小となるように逐次的に前記適応フィルタを更新し、前記第二収音信号に対する前記誤差信号の割合である誤差割合の絶対値が所定の閾値以下の場合には、前記誤差割合に対する単調増加関数に基づく第1更新量により前記適応フィルタを更新し、前記誤差割合の絶対値が所定の閾値より大きい場合には、前記誤差割合に対して前記第1更新量よりも増加量が小さい単調増加関数に基づく第2更新量により前記適応フィルタを更新する、
    雑音抑圧装置。
  2. 請求項1の雑音抑圧装置であって、
    前記第一収音信号は、目的音を収音するために配置された第一マイクロホンで収音した信号であり、
    前記第二収音信号は、前記第一収音信号に含まれる周囲雑音と相関性のある周囲雑音を収音するために配置された第二マイクロホンで収音した信号である、
    雑音抑圧装置。
  3. 請求項1の雑音抑圧装置であって、
    前記第一収音信号は、発話者の口元に配置された第一マイクロホンで収音した信号であって、前記発話者の発話である目的音と周囲雑音とを収音した信号であり、
    前記第二収音信号は、その第二収音信号に含まれる目的音の音圧が、前記第一収音信号に含まれる目的音の音圧はよりも小さく、かつ、その第二収音信号に含まれる雑音の音圧が、前記第一収音信号に含まれる雑音の音圧と同程度となるように配置された第二マイクロホンで収音した信号である、
    雑音抑圧装置。
  4. 請求項1から請求項3の何れかの雑音抑圧装置であって、
    前記所定の閾値をa>0とし、前記誤差割合をβとし、前記第1更新量または前記第2更新量をf(β)とし、時刻を表すインデックスをnとし、前記適応フィルタのフィルタ係数のフィルタ長をMとし、時刻nにおける前記フィルタ係数をh-(n)=[h(n),h(n-1),…,h(n-M+1)]とし、適応定数をμとし、時刻nにおける前記第二収音信号をx(n)とし、x-(n)=[x(n),x(n-1),…,x(n-M+1)]とし、前記第二収音信号x-(n)のノルムを||x-(n)||とし、時刻nにおける誤差信号をe(n)とし、Lを1より大きい実数とし、前記適応フィルタの更新式は、
    Figure 0006151236

    であり、
    Figure 0006151236

    または、
    Figure 0006151236

    である、
    雑音抑圧装置。
  5. 第一収音信号に含まれる雑音成分を第二収音信号を用いて抑圧する雑音抑圧方法であって、
    適応フィルタ部が、前記第二収音信号に適応フィルタを用いてフィルタリングを行い、フィルタリング後信号を求める適応フィルタステップと、
    減算部が、前記第一収音信号と、前記フィルタリング後信号との差分を誤差信号として求める減算ステップとを含み、
    前記適応フィルタステップにおいて、前記誤差信号と前記第二収音信号とを用いて、誤差信号が最小となるように逐次的に前記適応フィルタを更新し、前記第二収音信号に対する前記誤差信号の割合である誤差割合の絶対値が所定の閾値以下の場合には、前記誤差割合に対する単調増加関数に基づく第1更新量により前記適応フィルタを更新し、前記誤差割合の絶対値が所定の閾値より大きい場合には、前記誤差割合に対して前記第1更新量よりも増加量が小さい単調増加関数に基づく第2更新量により前記適応フィルタを更新する、
    雑音抑圧方法。
  6. 請求項5の雑音抑圧方法であって、
    前記第一収音信号は、目的音を収音するために配置された第一マイクロホンで収音した信号であり、
    前記第二収音信号は、前記第一収音信号に含まれる周囲雑音と相関性のある周囲雑音を収音するために配置された第二マイクロホンで収音した信号である、
    雑音抑圧方法。
  7. 請求項1から請求項4の何れかの雑音抑圧装置としてコンピュータを機能させるためのプログラム。
JP2014224894A 2014-11-05 2014-11-05 雑音抑圧装置、その方法及びプログラム Active JP6151236B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014224894A JP6151236B2 (ja) 2014-11-05 2014-11-05 雑音抑圧装置、その方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014224894A JP6151236B2 (ja) 2014-11-05 2014-11-05 雑音抑圧装置、その方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016090799A JP2016090799A (ja) 2016-05-23
JP6151236B2 true JP6151236B2 (ja) 2017-06-21

Family

ID=56017666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014224894A Active JP6151236B2 (ja) 2014-11-05 2014-11-05 雑音抑圧装置、その方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6151236B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6473066B2 (ja) * 2015-10-26 2019-02-20 日本電信電話株式会社 雑音抑圧装置、その方法及びプログラム
US10555062B2 (en) 2016-08-31 2020-02-04 Panasonic Intellectual Property Management Co., Ltd. Sound pick up device with sound blocking shields and imaging device including the same
CN106331359B (zh) * 2016-08-31 2017-09-12 广东欧珀移动通信有限公司 一种语音信号采集方法、装置及终端
JP2019052247A (ja) * 2017-09-15 2019-04-04 Jnc株式会社 液晶組成物および液晶表示素子
WO2019051841A1 (zh) * 2017-09-18 2019-03-21 深圳市汇顶科技股份有限公司 确定滤波器系数的方法及其装置、终端
CN111986688A (zh) * 2020-09-09 2020-11-24 北京小米松果电子有限公司 一种提高语音清晰度的方法、装置及介质
CN115881151B (zh) * 2023-01-04 2023-05-12 广州市森锐科技股份有限公司 一种基于高拍仪的双向拾音消噪方法、装置、设备及介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2882364B2 (ja) * 1996-06-14 1999-04-12 日本電気株式会社 雑音消去方法及び雑音消去装置
JP5293952B2 (ja) * 2008-12-25 2013-09-18 日本電気株式会社 信号処理方法、信号処理装置、並びに信号処理プログラム
DK2555189T3 (en) * 2010-11-25 2017-01-23 Goertek Inc Speech enhancement method and device for noise reduction communication headphones

Also Published As

Publication number Publication date
JP2016090799A (ja) 2016-05-23

Similar Documents

Publication Publication Date Title
JP6151236B2 (ja) 雑音抑圧装置、その方法及びプログラム
JP4842583B2 (ja) 多感覚音声強調のための方法および装置
JP5075042B2 (ja) エコー消去装置、エコー消去方法、そのプログラム、記録媒体
EP1370112A2 (en) System and method for adaptive multi-sensor arrays
JP6204312B2 (ja) 収音装置
CN108141656A (zh) 使用用于自适应波束形成的前置白化的自适应分块矩阵
JP2003534570A (ja) 適応ビームフォーマーにおいてノイズを抑制する方法
JP2012155339A (ja) 音声状態モデルを使用したマルチセンサ音声高品質化
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
KR101581885B1 (ko) 복소 스펙트럼 잡음 제거 장치 및 방법
JP6422884B2 (ja) エコー抑圧
CN110556125A (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
JP4965891B2 (ja) 信号処理装置およびその方法
JP5161157B2 (ja) 周波数領域エコー除去装置、周波数領域エコー除去方法、プログラム
JP2013012841A (ja) エコー消去装置、その方法及びプログラム
JPH11305792A (ja) 収音装置,音声認識装置,これらの方法、及びプログラム記録媒体
CN110992975B (zh) 一种语音信号处理方法、装置及终端
JP6473066B2 (ja) 雑音抑圧装置、その方法及びプログラム
JP2017083566A (ja) 雑音抑圧装置、雑音抑圧方法、およびプログラム
JP6639590B2 (ja) ヘッドセット
JP6106618B2 (ja) 音声区間検出装置、音声認識装置、その方法、及びプログラム
JP6537997B2 (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
US20220270630A1 (en) Noise suppression apparatus, method and program for the same
WO2022195955A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
JP2017009657A (ja) 音声強調装置、および音声強調方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170512

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170524

R150 Certificate of patent or registration of utility model

Ref document number: 6151236

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150