JP2019075622A - 騒音抑圧装置、騒音抑圧方法、プログラム - Google Patents

騒音抑圧装置、騒音抑圧方法、プログラム Download PDF

Info

Publication number
JP2019075622A
JP2019075622A JP2017198820A JP2017198820A JP2019075622A JP 2019075622 A JP2019075622 A JP 2019075622A JP 2017198820 A JP2017198820 A JP 2017198820A JP 2017198820 A JP2017198820 A JP 2017198820A JP 2019075622 A JP2019075622 A JP 2019075622A
Authority
JP
Japan
Prior art keywords
voice
noise suppression
probability
suppression device
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017198820A
Other languages
English (en)
Other versions
JP6835694B2 (ja
Inventor
勇気 太刀岡
Yuki Tachioka
勇気 太刀岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso IT Laboratory Inc
Original Assignee
Denso IT Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso IT Laboratory Inc filed Critical Denso IT Laboratory Inc
Priority to JP2017198820A priority Critical patent/JP6835694B2/ja
Publication of JP2019075622A publication Critical patent/JP2019075622A/ja
Application granted granted Critical
Publication of JP6835694B2 publication Critical patent/JP6835694B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音声強調の性能を高めた騒音抑圧装置を提供する。【解決手段】騒音抑圧装置1は、音声信号を受信する複数のマイクからなる入力部10と、音声信号のスペクトルを算出し、時間周波数スペクトルを求めるスペクトル算出部11と、音声信号の到来方向を推定する到来方向推定部12と、音声信号のSNRを推定するSNR推定部13と、到来方向およびSNRに基づいて、目的音声と目的外音声を区別するための閾値を決定する閾値決定部14と、閾値に基づいてマスクを構成するマスク構成部15と、マスクを時間周波数スペクトルに適用して目的外音声を抑圧し、目的音声を得る音声強調部16とを備える。【選択図】図1

Description

本発明は、目的の音声とそれ以外の騒音が混ざっている音声から、目的の音声を抽出または強調する処理方法に関する。
従来から、推定したSNRや到来方向に基づいてマスクを構成する手法が提案されている(例えば、特許文献1、非特許文献1参照。)。以下、特許文献1に記載された音声分離強調システムでは、受信部で観察された信号をフィルタ処理部で処理して雑音信号Nを求める。マスクフィルタ処理部は、受信部で観察された信号と雑音信号Nに基づいて目的外音声を低減するマスクフィルタ係数を推定する。マスクフィルタ係数は、目的外音声らしい部分は0、目的音声らしい部分は1の値を有する係数である。
非特許文献1は、到来方向に基づいて閾値を推定する方法であるが、その開示内容は、基本的には特許文献1と同じである。音声の到来方向に対してある閾値を設け、音声がその閾値の範囲に含まれていれば、音声と判断して1を設定し、それ以外であれば0を設定する。
特開2009−272876
H. Sawada, S. Araki, R. Mukai, and S. Makino, "Grouping separated frequency components by estimating propagation model parameters in frequency-domain blind source separation" IEEE Transactions on Audio, Speech and Language Processing, 15, 1592-1604 (2007)
上記した方法はいずれも、目的音声らしさの判定に所定の閾値を使っているため、音声強調の性能は閾値に大きく依存してしまうという問題があった。本発明は、閾値を適切に設定し、音声強調の性能を高めた騒音抑圧装置を提供することを目的とする。
本発明の騒音抑圧装置は、音声信号を受信する複数のマイクからなる入力部と、前記音声信号のスペクトルを算出し、時間周波数スペクトルを求めるスペクトル算出部と、前記音声信号の到来方向を推定する到来方向推定部と、前記音声信号のSNRを推定するSNR推定部と、前記到来方向および前記SNRに基づいて、目的音声と目的外音声を区別するための閾値を決定する閾値決定部と、前記閾値に基づいてマスクを構成するマスク構成部と、前記マスクを前記時間周波数スペクトルに適用して目的外音声を抑圧し、目的音声を得る音声強調部とを備える。
この構成により、SNR(signal to noise ratio:SNR)に基づいて目的音声と目的外音声とを区別する閾値を設定するので、目的外音声である騒音の大小にかかわらず、適切に目的外音声と目的音声とを区別することができる。
本発明の騒音抑圧装置において、前記閾値決定部は、前記到来方向推定部にて推定された到来方向からの許容誤差であって、目的音声として受信すべき音声信号の到来方向の範囲を規定する許容誤差を、前記閾値として決定してもよい。
この構成により、音声信号の到来方向の許容誤差に基づいて、適切に目的外音声を抑圧することができる。
本発明の騒音抑圧装置において、前記閾値決定部は、到来方向を確率変数とする目的音声の確率分布に基づいて、前記閾値を変数とする目的音声の受信確率を求めると共に、全方位に一様な目的外音声の確率分布に基づいて、前記閾値を変数とする目的外音声の受信確率を求め、前記目的音声の受信確率と前記目的外音声の受信確率とに基づいて前記閾値を決定してもよい。
この構成により、目的音声の受信確率と目的外音声の受信確率のトレードオフを考慮して適切な閾値を決定することができる。
本発明の騒音抑圧装置において、前記閾値決定部は、目的音声の受信確率から目的音声を目的外音声として受信してしまう確率である受信エラー確率を求め、前記目的音声の受信エラー確率と前記目的外音声の受信確率の合計を最小にする閾値を決定してもよい。
この構成により、目的音声の受信エラー確率を低減させると共に、目的外音声を受信してしまう確率を低減する閾値を決定することができる。
本発明の騒音抑圧装置において、前記閾値決定部は、前記受信エラー確率と前記目的外音声の受信確率を合計する際に、いずれかの確率に重みを乗じてもよい。
このように重みを乗じることにより、受信エラーを減らすか目的外音声の受信を減らすかのいずれかを優先した閾値を設定することができる。
本発明の騒音抑圧方法は、騒音抑圧装置によって、複数のマイクにて受信した音声信号に含まれる騒音を抑圧して音声を強調する方法であって、前記騒音抑圧装置が、複数のマイクから音声信号を受信するステップと、前記騒音抑圧装置が、前記音声信号のスペクトルを算出し、時間周波数スペクトルを求めるステップと、前記騒音抑圧装置が、前記音声信号の到来方向を推定するステップと、前記騒音抑圧装置が、前記音声信号のSNRを推定するステップと、前記騒音抑圧装置が、前記到来方向および前記SNRに基づいて、目的音声と目的外音声を区別するための閾値を決定するステップと、前記騒音抑圧装置が、前記閾値に基づいてマスクを構成するステップと、前記騒音抑圧装置が、前記マスクを前記時間周波数スペクトルに適用して目的外音声を抑圧し、目的音声を得るステップとを備える。
本発明のプログラムは、複数のマイクにて受信した音声信号に含まれる騒音を抑圧して音声を強調するために、コンピュータに、前記音声信号のスペクトルを算出し、時間周波数スペクトルを求めるステップと、前記音声信号の到来方向を推定するステップと、前記音声信号のSNRを推定するステップと、前記到来方向および前記SNRに基づいて、目的音声と目的外音声を区別するための閾値を決定するステップと、前記閾値に基づいてマスクを構成するステップと、前記マスクを前記時間周波数スペクトルに適用して目的外音声を抑圧し、目的音声を得るステップとを実行させる。
従来は、閾値を場当たり的に選択していたが、本発明によればSNRに基づいて適切な閾値が求まるので、安定した騒音抑圧が行えるという効果を有する。
実施の形態の騒音抑圧装置の構成を示す図である。 (a)マイク10aで受信した音声の時間周波数スペクトルの例を示す図である。(b)マイク10bで受信した音声の時間周波数スペクトルの例を示す図である。 マスクの一例を示す図である。 音声の到来方向と位相差との関係を示す図である。 音声信号を位相シフトキーイングによって位相に変換する例を示す図である。 2値である時間周波数マスクMを、連続量であるマイクの位相差φに情報を変換した通信系を示す図である。 (a)SNR≧0の場合に観測音声の位相差φが取り得る範囲を示す図である。(b)SNR<0の場合に観測音声の位相差φが取り得る範囲を示す図である。 送信信号xが受信信号yに変化する確率p00,p01,p10,p11を示す図である。 実施の形態の騒音抑圧装置の動作を示す図である。
以下、実施の形態の騒音抑圧装置について図面を参照して説明する。
図1は、本実施の形態の騒音抑圧装置1の構成を示す図である。騒音抑圧装置1の構成の説明に先立って、本実施の形態の騒音抑圧装置1が行う基本的な処理について説明する。
(イントロダクション)
本実施の形態の騒音抑圧装置1は、音声を入力する入力部10として2つのマイク10a,10bを有している。騒音抑圧装置1は、入力された音声を時間周波数スペクトルに変換する。図2(a)及び図2(b)は、それぞれ、マイク10a、マイク10bの時間周波数スペクトルの例を模式的に示す図である。なお、実際の時間周波数スペクトルは、各ビンに対応する音声信号の大きさを、その大きさに応じた色で表すことが多い。
図2(a)及び図2(b)において、横軸は時間、縦軸は周波数を示す。時間及び周波数の交点を「ビン」と呼ぶ。図2(a)及び図2(b)では、各ビンで信号が観察されたことを「〇」で示している。例えば、時刻t2においては、マイク10aでは音声は観察されず、マイク10bでは周波数f3の音声が観察された。時刻t3においては、マイク10aで周波数f3,f4の音声が観察され、マイク10bでも周波数f3,f4の音声が観察された。
なお、この段階では、観察された音声信号が目的の音声であるか、目的外の音声であるかは未知である。本実施の形態の騒音抑圧装置1は、マイク10a,10bで観察された音声の位相差と音声の到来方向の整合性に基づいて、観察された信号が所定の音源から発せられた目的音声であるか、騒音等の目的外音声であるかを推定し、騒音を抑圧するマスクを生成する。
図3は、マスクの一例を示す図である。音声と判断されるビンには「1」、騒音と判断されるビンには「0」の値が設定されている。本実施の形態の騒音抑圧装置1は、適切なマスクを生成して、騒音抑圧を安定的に行う。
(騒音抑圧装置の構成)
次に、本実施の形態の騒音抑圧装置1の構成について説明する。
図1は、騒音抑圧装置1の構成を示す図である。騒音抑圧装置1は、音声を受信する2つのマイク10a,10bを備えた入力部10と、入力された音声信号を時間周波数スペクトルに変換するスペクトル算出部11と、音声の到来方向を推定する到来方向推定部12と、音声のSNRを推定するSNR推定部13とを有している。以上の構成は、公知の技術を用いて実現することができる。
騒音抑圧装置1は、音声の到来方向とSNRに基づいて、目的音声と目的外音声を区別するための閾値を決定する閾値決定部14と、閾値に基づいてマスクを構成するマスク構成部15と、マスクを時間周波数スペクトルに適用して目的外音声を抑圧する音声強調部16とを備えている。
閾値決定部14について説明する。閾値決定部14は、確率分布算出部20と、誤り確率算出部21と、最適化部22とを有している。以下、閾値決定部14の処理について説明すると共に、閾値決定部14の各構成の役割について説明する。
(ア)バイナリマスクによる騒音抑圧処理
閾値決定部14は、2つのマイクに入力された音声の位相差を検出する。具体的には、図2(a)及び図2(b)に示す時間周波数スペクトルの各ビンの音声信号の位相差を求める。
図4は、音声の到来方向と位相差との関係を示す図である。マイク10aとマイク10bとの間の距離d[m]は既知である。音声の到来方向を図4のθs[rad](正面方向を0[rad])とすると、マイク10aとマイク10bに到達する音声の位相差はdsin(θs)である。音声の到来方向と位相差とが整合していれば、同じ音源からの音声であると判断し、整合していなければ騒音と判断する。
音声の到来方向と位相差との整合性の判断において、騒音抑圧装置1は、誤差(閾値)θを許容する。目的音声の位相差θpは、誤差θを用いて次式で表される。
θs−θ≦θp≦θs+θ
目的音声はθpの位相差を持った音声信号として通信され、これに雑音としてのノイズの位相差が加わることになる。目的音のみが存在すれば、目的音に由来する位相差φsと一致する。
これにより、音源方向θsと位相差φsが関連付けられる。なお、波長をλ=c/fとした。
しかし、上述のとおり、2つのマイクで観測される位相差φは、必ずしも理論値とは一致しないので、到来方向の許容誤差θを含めて、到来方向θsと観測される位相差φとの整合性を判定するものとすると、マスクMの係数は次式で決定される。
このマスクとスペクトルの積MXを取り、これを逆短時間フーリエ変換することで騒音抑圧された信号が得られる。
(イ)バイナリマスクの位相シフトキーイングとしてのモデル化
本実施の形態では、上記(ア)で述べた時間周波数スペクトルにおけるバイナリマスクによる騒音抑圧処理を、バイナリマスクをマイク間の位相差に変換して通信する問題と考える。すなわち、「雑音のある離散的通信路モデル」でモデル化する。これは、図5に示すように、音声信号を位相に変えて通信する位相シフトキーイング(Phase-shift Keying:PSK)と同じであるので、図6のように、2値である時間周波数マスクMを、連続量であるマイクの位相差φに情報を変え、通信する系と考える。
(ウ)位相差φの分布の算出法
一般には、目的音声の観測された位相差φはノイズの影響で、式(1)とは一致しない。目的音の振幅をS、ノイズの振幅をNとすると、ノイズの位相差をφとして、次式で表される。なお、jは虚数単位である。
ここで、ang(Z)は、複素数Zの偏角[0,2π)を表す記号である。
信号対雑音比SNRは、
であることから、上記式(3)は、次式のように変形できる。
ここで方向性のないノイズの位相差φは、[0,2π)において一様分布であるから、観測音声の位相差φの分布はSNRの関数となる。方向性のあるノイズに関しては、φSφNにピークをもつため分離は簡単である。ここでは方向性のないノイズの取り扱い方について説明するが、方向性がある場合もφNの分布が分かれば同様に扱える。図7(a)は、SNR≧0の場合に観測音声の位相差φが取り得る範囲を示し、図7(b)はSNR<0の場合に観測音声の位相差φが取り得る範囲を示している。図7(a)及び図7(b)に見られるように、SNRが与えられれば、φが[0,2π)の範囲を動いたときのφの変化を考えることで、確率分布算出部20は、目的外音声φの確率密度ρφを求めることができる。また、確率分布算出部20は、SNR推定部13によって算出したSNRに基づいて、式(5)から目的音声の確率密度ρφを算出する。
(エ)誤り確率と誤差θとの関係
図8は、送信信号xが受信信号yに変化する確率p00,p01,p10,p11を示す図である。確率p00は、送信信号xが0、受信信号yが0となる確率である。確率p01は、送信信号xが0、受信信号1となる確率である。これは、実際には信号を送信していないにもかかわらず、受信側でノイズを拾ってしまう受信エラー確率である。確率p10は、送信信号xが1、受信信号yが0となる確率であり、これは送信側が信号を送信したにもかかわらず、受信側が受信し損なってしまう確率である。確率p11は、送信信号xが1、受信信号yが1となる確率であり、これは送信側が送信した信号を受信側が正しく受信したと考えられる確率である。
閾値決定部14は、確率p01,p10を最小化するように閾値θを求めるため、誤り確率算出部21によって誤り確率p01,p10を求める機能を有する。確率p01,p10を次のようにして求める。図6のシステムを通った時に、M=0がM=1となるのは、[0,2π)に一様に存在するφがバイナリマスクのパスバンドθpに入るときなので、確率p01は次式で表される。なお、p00+p01=1であるから、p01が求まれば、p00も容易に求まる。
M=1がM=1のまま伝わるためには、式(5)が式(2)のφの範囲に入っている必要がある。上述した確率密度布ρφから、式(2)のM=1の条件を満たす確率p11を算出すれば、次式のようになる。そして、p10+p11=1であるから、p11から、p10を求めることができる。
ここで、
上記に説明した式より、許容誤差θを大きくすると、確率p11を大きくできる一方で、確率p01も大きくなってしまうというトレードオフがあることが解析的に分かる。最適化部22は、(p01+p10)を最小化する誤差θを求めることにより、最適な閾値が得られる。なお、(p01+α・p10)のように、確率p10に対して重みを乗じてもよい。重みαは、α>1の場合には、目的信号を取り損なわないようにする方向に働き、α<1の場合には、目的外の雑音を拾わないようにする方向に働く。
以上、本実施の形態の騒音抑圧装置1の構成について説明したが、上記した騒音抑圧装置1のハードウェアの例は、CPU、RAM、ROM、ハードディスク、ディスプレイ、キーボード、マウス、通信インターフェース等を備えたコンピュータである。上記した各機能を実現するモジュールを有するプログラムをRAMまたはROMに格納しておき、CPUによって当該プログラムを実行することによって、上記した騒音抑圧装置1が実現される。このようなプログラムも本発明の範囲に含まれる。
図9は、実施の形態の騒音抑圧装置1の動作を示す図である。騒音抑圧装置1は、入力部10の2本のマイク10a,10bによって音声の入力を受け付け、それぞれのマイク10a,10bに入力された音声信号に基づいて時間周波数スペクトルを算出する(S10)。
次に、騒音抑圧装置1は、音声の到来方向を推定し(S11)、続いて音声のSNRを推定する(S12)。なお、図9では、音声の到来方向の推定をSNRの推定より先に記載しているが、この順番は逆であってもよい。
続いて、騒音抑圧装置1の閾値決定部14は、音声の到来方向およびSNRに基づいて、音声の到来方向を変数とする目的音声の確率分布と目的外音声の確率分布を求める(S13)。そして、閾値決定部14は、目的音声の確率分布に基づいて、目的音声を受信する確率p11と受信できない確率p10を求める(S14)。確率p11と確率p10は閾値を変数とする関数である。また、目的外音声の確率分布に基づいて、目的外変数を受信する確率p01を求める。確率p01も閾値を変数とする関数である(S14)。
騒音抑圧装置1の閾値決定部14は、確率p01と確率p10を合計した確率が最小となるような閾値を決定し(S15)、決定した閾値に基づいてマスクを構成する(S16)。具体的には、閾値θは、到来方向の許容誤差であるから、時間周波数スペクトルの各ビンにおける音声の到来方向が、到来方向プラス許容誤差の範囲に含まれている場合には、時間周波数スペクトルのマスク係数「1」とし、含まれていない場合にはマスク係数を「0」とする。
騒音抑圧装置1は、マイク10aまたはマイク10aで受信した音声の時間周波数スペクトルにマスクをかけ、騒音を抑圧し、目的音声を強調する(S17)。
以上、本実施の形態の騒音抑圧装置1の構成および動作について説明した。本実施の形態の騒音抑圧装置1は、音声のSNRに基づいて、マスクの閾値を適切に設定するので、適切なマスクを生成して、騒音抑圧を安定的に行うことができる。
(変形例)
上記した実施の形態では、送信信号の性質を考慮していなかったが、本発明の騒音抑圧装置1は、以下のようにして送信信号の性質を考慮することも可能である。
送信信号xのエントロピーH(x)は次式で表される。
送信信号xのエントロピーH(x)は、送信信号xの性質のみに依存するため、事前に調べておくことができる。受信信号yのエントロピーH(y)を予測するためには、図8に示すように、送信信号xが受信信号yに変化する確率p00、p01、p10、p11を求める必要がある。
上記の各確率が求まれば、受信信号の確率p00〜p11から受信信号のエントロピーH(y)は、次式で求めることができる。
同様に、送信信号がxであるときの受信信号yの条件付きエントロピーHx(y)は、次式で求まる。
上記した実施の形態では、入力部10が2本のマイクを有する例について説明したが、マイクは3本以上であってもよい。マイクが3本以上ある場合は、2本ずつのマイクのペアに対してマスクを構成し、それらを統合することで最終的なマスクを得ることができる。
本発明は、目的の音声を抽出または強調する処理方法として有用である。また他の音声強調処理の前処理として、目的外の音声を抽出する処理方法としても利用できる。
1 騒音抑圧装置
10 入力部
10a,10b マイク
11 スペクトル算出部
12 到来方向推定部
13 SNR推定部
14 閾値決定部
15 マスク構成部
16 音声強調部
20 確率分布算出部
21 誤り確率算出部
22 最適化部

Claims (7)

  1. 音声信号を受信する複数のマイクからなる入力部と、
    前記音声信号のスペクトルを算出し、時間周波数スペクトルを求めるスペクトル算出部と、
    前記音声信号の到来方向を推定する到来方向推定部と、
    前記音声信号のSNRを推定するSNR推定部と、
    前記到来方向および前記SNRに基づいて、目的音声と目的外音声を区別するための閾値を決定する閾値決定部と、
    前記閾値に基づいてマスクを構成するマスク構成部と、
    前記マスクを前記時間周波数スペクトルに適用して目的外音声を抑圧し、目的音声を得る音声強調部と、
    を備える騒音抑圧装置。
  2. 前記閾値決定部は、前記到来方向推定部にて推定された到来方向からの許容誤差であって、目的音声を受信すべき音声信号の到来方向の範囲を規定する許容誤差を、前記閾値として決定する請求項1に記載の騒音抑圧装置。
  3. 前記閾値決定部は、到来方向を確率変数とする目的音声の確率分布に基づいて、前記閾値を変数とする目的音声の受信確率を求めると共に、全方位に一様な目的外音声の確率分布に基づいて、前記閾値を変数とする目的外音声の受信確率を求め、前記目的音声の受信確率と前記目的外音声の受信確率とに基づいて前記閾値を決定する請求項2に記載の騒音抑圧装置。
  4. 前記閾値決定部は、目的音声の受信確率から目的音声を目的外音声として受信してしまう確率である受信エラー確率を求め、前記目的音声の受信エラー確率と前記目的外音声の受信確率の合計を最小にする閾値を決定する請求項3に記載の騒音抑圧装置。
  5. 前記閾値決定部は、前記受信エラー確率と前記目的外音声の受信確率を合計する際に、いずれかの確率に重みを乗じる請求項4に記載の騒音抑圧装置。
  6. 騒音抑圧装置によって、複数のマイクにて受信した音声信号に含まれる騒音を抑圧して音声を強調する方法であって、
    前記騒音抑圧装置が、複数のマイクから音声信号を受信するステップと、
    前記騒音抑圧装置が、前記音声信号のスペクトルを算出し、時間周波数スペクトルを求めるステップと、
    前記騒音抑圧装置が、前記音声信号の到来方向を推定するステップと、
    前記騒音抑圧装置が、前記音声信号のSNRを推定するステップと、
    前記騒音抑圧装置が、前記到来方向および前記SNRに基づいて、目的音声と目的外音声を区別するための閾値を決定するステップと、
    前記騒音抑圧装置が、前記閾値に基づいてマスクを構成するステップと、
    前記騒音抑圧装置が、前記マスクを前記時間周波数スペクトルに適用して目的外音声を抑圧し、目的音声を得るステップと、
    を備える騒音抑圧方法。
  7. 複数のマイクにて受信した音声信号に含まれる騒音を抑圧して音声を強調するためのプログラムであって、コンピュータに、
    前記音声信号のスペクトルを算出し、時間周波数スペクトルを求めるステップと、
    前記音声信号の到来方向を推定するステップと、
    前記音声信号のSNRを推定するステップと、
    前記到来方向および前記SNRに基づいて、目的音声と目的外音声を区別するための閾値を決定するステップと、
    前記閾値に基づいてマスクを構成するステップと、
    前記マスクを前記時間周波数スペクトルに適用して目的外音声を抑圧し、目的音声を得るステップと、
    を実行させるプログラム。
JP2017198820A 2017-10-12 2017-10-12 騒音抑圧装置、騒音抑圧方法、プログラム Active JP6835694B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017198820A JP6835694B2 (ja) 2017-10-12 2017-10-12 騒音抑圧装置、騒音抑圧方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017198820A JP6835694B2 (ja) 2017-10-12 2017-10-12 騒音抑圧装置、騒音抑圧方法、プログラム

Publications (2)

Publication Number Publication Date
JP2019075622A true JP2019075622A (ja) 2019-05-16
JP6835694B2 JP6835694B2 (ja) 2021-02-24

Family

ID=66543327

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017198820A Active JP6835694B2 (ja) 2017-10-12 2017-10-12 騒音抑圧装置、騒音抑圧方法、プログラム

Country Status (1)

Country Link
JP (1) JP6835694B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007318528A (ja) * 2006-05-26 2007-12-06 Fujitsu Ltd 指向性集音装置、指向性集音方法、及びコンピュータプログラム
JP2010145836A (ja) * 2008-12-19 2010-07-01 Nippon Telegr & Teleph Corp <Ntt> 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム
US20120148069A1 (en) * 2010-12-14 2012-06-14 National Chiao Tung University Microphone array structure able to reduce noise and improve speech quality and method thereof
JP2014089249A (ja) * 2012-10-29 2014-05-15 Mitsubishi Electric Corp 音源分離装置
JP2015061306A (ja) * 2013-09-20 2015-03-30 富士通株式会社 音声処理装置及び音声処理用コンピュータプログラム
JP2017015774A (ja) * 2015-06-26 2017-01-19 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007318528A (ja) * 2006-05-26 2007-12-06 Fujitsu Ltd 指向性集音装置、指向性集音方法、及びコンピュータプログラム
JP2010145836A (ja) * 2008-12-19 2010-07-01 Nippon Telegr & Teleph Corp <Ntt> 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム
US20120148069A1 (en) * 2010-12-14 2012-06-14 National Chiao Tung University Microphone array structure able to reduce noise and improve speech quality and method thereof
JP2014089249A (ja) * 2012-10-29 2014-05-15 Mitsubishi Electric Corp 音源分離装置
JP2015061306A (ja) * 2013-09-20 2015-03-30 富士通株式会社 音声処理装置及び音声処理用コンピュータプログラム
JP2017015774A (ja) * 2015-06-26 2017-01-19 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム

Also Published As

Publication number Publication date
JP6835694B2 (ja) 2021-02-24

Similar Documents

Publication Publication Date Title
US10403299B2 (en) Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition
US8903722B2 (en) Noise reduction for dual-microphone communication devices
EP2749042B1 (en) Processing signals
CN102855880B (zh) 用于多话筒音频设备的去噪方法
EP2393463B1 (en) Multiple microphone based directional sound filter
EP2715725B1 (en) Processing audio signals
US9426566B2 (en) Apparatus and method for suppressing noise from voice signal by adaptively updating Wiener filter coefficient by means of coherence
WO2014054314A1 (ja) 音声信号処理装置、方法及びプログラム
WO2009097413A1 (en) Enhanced blind source separation algorithm for highly correlated mixtures
US8615394B1 (en) Restoration of noise-reduced speech
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
WO2019113253A1 (en) Voice enhancement in audio signals through modified generalized eigenvalue beamformer
CN111415686A (zh) 针对高度不稳定的噪声源的自适应空间vad和时间-频率掩码估计
JP5927887B2 (ja) 非目的音抑制装置、非目的音抑制方法及び非目的音抑制プログラム
CN114073106B (zh) 双耳波束形成麦克风阵列
JP2019075622A (ja) 騒音抑圧装置、騒音抑圧方法、プログラム
JP5233772B2 (ja) 信号処理装置およびプログラム
EP3225037B1 (en) Method and apparatus for generating a directional sound signal from first and second sound signals
JP6314475B2 (ja) 音声信号処理装置及びプログラム
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
JP2012049715A (ja) 音源分離装置、音源分離方法、及び、プログラム
JP6221463B2 (ja) 音声信号処理装置及びプログラム
Lai et al. A novel coherence-function-based noise suppression algorithm by applying sound-source localization and awareness-computation strategy for dual microphones
JP2015126279A (ja) 音声信号処理装置及びプログラム
Li et al. Dual-channel optimally modified log-spectral amplitude estimator using spatial information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200812

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200923

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210204

R150 Certificate of patent or registration of utility model

Ref document number: 6835694

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250