JP6020258B2 - マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置 - Google Patents

マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置 Download PDF

Info

Publication number
JP6020258B2
JP6020258B2 JP2013039695A JP2013039695A JP6020258B2 JP 6020258 B2 JP6020258 B2 JP 6020258B2 JP 2013039695 A JP2013039695 A JP 2013039695A JP 2013039695 A JP2013039695 A JP 2013039695A JP 6020258 B2 JP6020258 B2 JP 6020258B2
Authority
JP
Japan
Prior art keywords
correction
unit
frequency domain
frequency
domain signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013039695A
Other languages
English (en)
Other versions
JP2014168188A (ja
Inventor
智佳子 松本
智佳子 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013039695A priority Critical patent/JP6020258B2/ja
Priority to EP13199764.5A priority patent/EP2773137B1/en
Priority to US14/155,731 priority patent/US9204218B2/en
Publication of JP2014168188A publication Critical patent/JP2014168188A/ja
Application granted granted Critical
Publication of JP6020258B2 publication Critical patent/JP6020258B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays
    • H04R29/006Microphone matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • H04R3/10Circuits for transducers, loudspeakers or microphones for correcting frequency response of variable resistance microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/01Noise reduction using microphones having different directional characteristics

Description

開示の技術は、マイク感度差補正装置、マイク感度差補正方法、マイク感度差補正プログラム、及び雑音抑圧装置に関する。
従来、車載のカーナビゲーションシステム、ハンズフリーホン、テレビ会議システム等において、目的の音声(例えば、話者の発声)以外の雑音混じりの音声信号に含まれる雑音を抑圧することが行われている。このような雑音抑圧技術として、複数のマイクロフォンを含むマイクアレイを用いた技術が知られている。
マイクアレイを用いた雑音抑圧の従来技術として、複数のマイクロフォンで受信した信号の振幅比に基づいて雑音抑圧をする方式が存在する。各マイクロフォンと音源との距離が等距離または遠い場合は振幅比が1.0に近い値になり、各マイクロフォンと音源との距離が各々異なる場合は振幅比が1.0から外れた値になる。振幅比に基づく雑音抑圧は、この振幅比を利用し、例えば、各マイクロフォンとの距離が異なる位置に目的音源が存在する場合に、複数のマイクロフォンで受信した信号の振幅比が1.0に近い値のときに雑音を抑圧する方式である。
しかし、各マイクロフォンと音源との距離が等距離であっても、各マイクロフォン間に感度差が生じている場合には、振幅比が1.0から外れた値になる場合がある。この場合、振幅比に基づく雑音抑圧が正確に行えないため、各マイクロフォンの感度差を補正する技術が必要となる。
マイクロフォン間の感度差を補正する技術として、例えば、複数の音入力部に入力された音から夫々生成した音信号に基づいて音処理を行う際に、補正係数を求めて、少なくとも一方の音信号のレベルを補正する装置が提案されている。この装置では、複数の音入力部に入力された夫々の音について、複数の音入力部の中の第1音入力部及び第2音入力部の配設位置にて定まる直線に対し、略垂直方向から到来する音の周波数成分を検出する。到来する音の方向は、第1音入力部及び第2音入力部に到達した夫々の音の位相差に基づいて検出している。そして、検出した周波数成分の音に基づき第1音入力部及び第2音入力部が生成した夫々の音信号のレベルを合わせるべく、入力された音から第1音入力部及び第2音入力部が生成した夫々の音信号の少なくとも一方のレベルを補正する補正係数を求めている。
国際公開第2009/069184号パンフレット
しかし、従来のマイクロフォン間の感度差を補正する技術では、2つの入力部に到達した夫々の音の位相差に基づいて、到来する音の方向を検出している。このため、位相差を全帯域で使用できる位置に各マイクロフォンが配置されている場合には、マイクロフォン間の感度差がそれほど大きくない範囲において、感度差の補正を行うことができる。しかし、2つのマイクロフォンの間隔が音速/サンプリング周波数より広い場合には、サンプリング定理により、高域の周波数帯域で位相差が位相回転を起こしてしまう場合がある。この場合、位相差に基づいて到来する音の方向を正確に検出することができなくなるため、全帯域での感度差補正が不可能になってしまう。
また、2つのマイクロフォンの間隔が音速/サンプリング周波数より狭く、全帯域で位相差に基づいて到来する音の方向を検出できる場合でも、以下の問題がある。各マイクロフォンで受信する信号の振幅が等しくなる方向に音源が存在する場合というのは、従来技術で垂直方向から到来する音を検出しているように、限られた条件である。そのため、条件に合致した音が検出される確率が低く、適切な感度差補正を行えるように補正係数が更新されるまでに時間がかかり、実際の感度差に適応していない補正係数に基づく感度差補正が行われてしまう場合がある。特に感度差が大きい場合には、音声発声直後で感度差補正が間に合わずに音声歪みに繋がってしまう。
さらに、近年では、マイクアレイを搭載する機器を小型化する傾向にあるため、音孔の形状のなどのマイクロフォンの設置環境が複雑な構造となる傾向がある。これにより、各マイクロフォンの設置環境に違いが生じること等が原因で、感度差が周波数帯域によって異なる場合もあり、特に感度差の大きい周波数帯域では、適切な感度差補正を行えるように補正係数が更新されるまでに時間がかかってしまう。
開示の技術は、一つの側面として、マイクアレイの設置位置に制限がある場合でも、マイクロフォン間の感度差を迅速に補正することが目的である。
開示の技術は、マイクアレイに含まれる複数のマイクロフォンの各々から入力された入力音声信号の各々を、フレーム毎に周波数領域の信号に変換した周波数領域信号に基づいて、定常雑音を示す周波数領域信号を検出する検出部を備えている。また、開示の技術は、前記定常雑音を示す周波数領域信号を用いて、前記複数のマイクロフォン間の感度差をフレーム単位で補正するための第1補正係数を算出し、前記第1補正係数を用いて、前記周波数領域信号をフレーム単位で補正する第1補正部を備えている。また、開示の技術は、前記第1補正部で補正された前記周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム毎に周波数単位で補正するための第2補正係数を算出する第2補正部を備えている。第2補正部は、前記第2補正係数を用いて、前記1補正部で補正された前記周波数領域信号を前記フレーム毎の周波数単位で補正する。
開示の技術は、一つの側面として、マイクアレイの設置位置に制限がある場合でも、マイクロフォン間の感度差を迅速に補正することができる、という効果を有する。
第1実施形態に係る雑音抑圧装置の構成の一例を示すブロック図である。 第1実施形態に係る雑音抑圧装置の機能的構成の一例を示すブロック図である。 マイクアレイに対する音源位置を説明するための概略図である。 雑音抑圧装置として機能するコンピュータの一例を示す概略ブロック図である。 第1実施形態における雑音抑圧処理を示すフローチャートである。 第2実施形態に係る雑音抑圧装置の機能的構成の一例を示すブロック図である。 マイク間距離が短い場合の位相差の一例を示すグラフである。 マイク間距離が長い場合の位相差の一例を示すグラフである。 位相差の判定領域を説明するための概略図である。 第2実施形態における雑音抑圧処理を示すフローチャートである。 入力音声信号の一例を示すグラフである。 従来手法による雑音抑圧結果の一例を示すグラフである。 開示の技術による雑音抑圧結果の一例を示すグラフである。
以下、図面を参照して開示の技術の実施形態の一例を詳細に説明する。
<第1実施形態>
図1に、第1実施形態に係る雑音抑圧装置10を示す。雑音抑圧装置10には、複数のマイクロフォンを所定間隔dで配置したマイクアレイ11が接続されている。マイクアレイ11には、少なくとも2つのマイクロフォンが含まれる。ここでは、マイクロフォン11A及びマイクロフォン11Bの2つのマイクロフォンが含まれる場合を例に説明する。
マイクロフォン11A及び11Bは、周辺の音を収音し、収音した音をアナログ信号に変換して出力する。マイクロフォン11Aから出力された信号を入力音声信号1、マイクロフォン11Bから出力された信号を入力音声信号2とする。入力音声信号1及び入力音声信号2には、目的音声(目的の音源からの音声、例えば話者の発声)以外に雑音が混入している。マイクアレイ11から出力された入力音声信号1及び入力音声信号2は雑音抑圧装置10に入力される。雑音抑圧装置10では、マイクロフォン11Aとマイクロフォン11Bとの感度差を補正した上で、雑音を抑圧した出力音声信号を生成して出力する。
雑音抑圧装置10は、図2に示すように、アナログ/デジタル(A/D)変換部12A,12B、時間周波数変換部14A,14B、検出部16、フレーム単位補正部18、周波数単位補正部20、及び振幅比算出部22を備えている。また、雑音抑圧装置10は、抑圧係数算出部24、抑圧信号生成部26、及び周波数時間変換部28を備えている。なお、フレーム単位補正部18は、開示の技術の第1補正部の一例である。また、周波数単位補正部20は、開示の技術の第2補正部の一例である。また、振幅比算出部22、抑圧係数算出部24、及び抑圧信号生成部26は、開示の技術の抑圧部の一例である。また、A/D変換部12A,12B、時間周波数変換部14A,14B、検出部16、フレーム単位補正部18、周波数単位補正部20、及び周波数時間変換部28の部分は、開示の技術のマイク感度差補正装置の一例である。
A/D変換部12A,12Bは、入力されたアナログ信号である入力音声信号1及び入力音声信号2の各々を、サンプリング周波数Fsでデジタル信号である信号M(t)及び信号M(t)に変換する。tはサンプリング時刻である。
時間周波数変換部14A,14Bは、A/D変換部12A,12Bで変換された時間領域の信号である信号M(t)及び信号M(t)の各々を、フレーム毎に周波数領域の信号である信号M(f,i)及び信号M(f,i)に変換する。時間領域の信号から周波数領域の信号への変換には、例えば、FFT(高速フーリエ変換、Fast Fourier Transformation)等を用いることができる。なお、iはフレーム番号、fは周波数である。すなわちM(f,i)は、フレームiの周波数fを示す信号であり、開示の技術の周波数領域信号の一例である。また、1フレームは、例えば数十msecとすることができる。
検出部16は、時間周波数変換部14A,14Bで変換された信号M(f,i)及び信号M(f,i)を用いて、各フレームの周波数f毎に定常雑音か、または音声を含む非定常的な音かを判別する。これにより、定常雑音を示す信号M(f,i)及び信号M(f,i)を検出する。
定常雑音か非定常的な音かの判別は、例えば、「特開2011−186384号公報」等に記載の方法を用いることができる。具体的には、信号M(f,i)及び信号M(f,i)に基づいて定常雑音モデルNst(f,i)を推定し、定常雑音モデルNst(f,i)と信号M(f,i)との比r(f,i)を求める。r(f,i)は、r(f,i)=M(f,i)/Nst(f,i)で表される。一般的に音声を含む非定常的な音はr(f,i)が大きくなり、定常雑音はr(f,i)が1.0に近い値になることから、r(f,i)が1.0近傍の値である場合には、信号M(f,i)及び信号M(f,i)は定常雑音を示す信号であると判別する。なお、定常雑音モデルNst(f,i)と信号M(f,i)との比r(f,i)に基づいて、定常雑音か否かを判別してもよい。
また、定常雑音か非定常的な音かを判別する別の方法として、信号M(f,i)のスペクトル形状が音声データ特有の山谷構造になっているか否かを判定し、山谷構造がはっきりしない構造である場合には、定常雑音であると判別する。山谷構造の判定は、信号のピーク値を比較することなどにより行うことができる。なお、信号M(f,i)のスペクトル形状に基づいて、定常雑音か否かを判別してもよい。
また、定常雑音か非定常的な音かを判別する別の方法として、現フレームの信号M(f,i)のスペクトル形状と、前フレームの信号M(f,i−1)のスペクトル形状との相関を計算する。相関係数が0に近い値である場合には、信号M(f,i)及び信号M(f,i)は定常雑音を示す信号であると判別する。なお、現フレームの信号M(f,i)のスペクトル形状と、前フレームの信号M(f,i−1)のスペクトル形状との相関に基づいて、定常雑音を検出してもよい。
フレーム単位補正部18は、検出部16で定常雑音を示す信号として検出された信号M(f,i)及び信号M(f,i)を用いて、フレーム単位の感度差補正係数を算出し、信号M(f,i)をフレーム単位で補正する。例えば、下記(1)式に示すようなフレーム単位の感度差補正係数C(i)を算出することができる。なお、フレーム単位の感度差補正係数C(i)は、開示の技術の第1補正係数の一例である。
Figure 0006020258
ここで、αは、前フレームで算出されたフレーム単位の感度差補正係数C(i−1)を現フレームにおけるフレーム単位の感度差補正係数C(i)にどの程度反映させるかを示す更新係数であり、0≦α<1の値である。なお、αは開示の技術の第1更新係数の一例である。すなわち、現フレームの感度差補正係数C(i)を算出することにより、前フレームの感度差補正係数C(i−1)を更新する。また、fmaxはサンプリング周波数Fsの1/2の値である。(1)式のΣ|M(f,i)|では、周波数0からfmaxにおいて、検出部16で定常雑音を示す信号として検出された信号M(f,i)の和をとる。Σ|M(f,i)|についても同様である。
また、フレーム単位補正部18は、算出したフレーム単位の感度差補正係数C(i)に基づいて、下記(2)式に示すように信号M(f,i)を補正した信号M’(f,i)を生成する。
’(f,i)=C(i)×M(f,i) (2)
フレーム単位の感度差補正係数C(i)は、信号M(f,i)と信号M(f,i)とのフレーム単位での感度差を表している。このフレーム単位の感度差補正係数C(i)を信号M(f,i)に乗算することで、信号M(f,i)と信号M(f,i)との感度差をフレーム単位で補正することができる。
周波数単位補正部20は、信号M(f,i)及びフレーム単位補正部18でフレーム単位の補正が行われた信号M’(f,i)を用いて、周波数単位の感度差補正係数を算出し、信号M’(f,i)を周波数単位で補正する。例えば、下記(3)式に示すような周波数単位の感度差補正係数C(f,i)を算出することができる。なお、周波数単位の感度差補正係数C(f,i)は、開示の技術の第2補正係数の一例である。
(f,i)=β×C(f,i−1)
+(1−β)×(|M(f,i)|/|M’(f,i)|) (3)
ここで、βは、前フレームで同じ周波数fについて算出された周波数単位の感度差補正係数C(f,i−1)を現フレームにおける周波数単位の感度差補正係数C(f,i)にどの程度反映させるかを示す更新係数であり、0≦β<1の値である。なお、βは開示の技術の第2更新係数の一例である。すなわち、現フレームの周波数単位の感度差補正係数C(f,i)を算出することにより、前フレームの周波数単位の感度差補正係数C(f,i−1)を更新する。
また、周波数単位補正部20は、算出した周波数単位の感度差補正係数C(f,i)に基づいて、下記(4)式に示すように信号M’(f,i)を補正した信号M”(f,i)を生成する。
”(f,i)=C(f,i)×M’(f,i) (4)
周波数単位の感度差補正係数C(f,i)は、信号M(f,i)と信号M’(f,i)との周波数単位での感度差を表している。この周波数単位の感度差補正係数C(f,i)を信号M’(f,i)に乗算することで、信号M(f,i)と信号M’(f,i)との感度差を周波数単位で補正することができる。なお、信号M’(f,i)は、既にフレーム単位の補正が行われた信号であるため、周波数単位の補正は、周波数毎に微調整を行う補正となる。
振幅比算出部22は、信号M(f,i)及び信号M”(f,i)の各々の振幅スペクトルを算出する。そして、各フレームの周波数毎に、同じ周波数の振幅スペクトル同士の比を振幅比R(f,i)として算出する。
抑圧係数算出部24は、振幅比算出部22で算出された振幅比R(f,i)に基づいて、入力音声信号が目的音声か雑音かを判定して抑圧係数を算出する。ここで、図3に示すように、マイクロフォン11Aとマイクロフォン11Bとの間隔(マイク間距離)がd、音源方向がθ、及び音源からマイクロフォン11Aまでの距離がdsの場合について考える。なお、音源方向θは、マイクアレイ11に対して音源が存在する方向であり、図3に示すように、2つのマイクロフォンの中心を通る直線と、2つのマイクロフォンの中心の中点Pを一端、音源を他端とする線分とのなす角で表す。この場合、入力音声信号1と入力音声信号2との振幅比の理論値(マイクロフォン間に感度差が生じていない場合の振幅比)Rは下記(5)式となる。
={ds/(ds+d×cosθ)}(0≦θ≦180) (5)
また、抑圧せずに残したい目的音声の音源方向を、θmin以上、θmax以下とすると、振幅比の理論値Rは、下記(6)式及び(7)式で表されるRmin以上、Rmax以下の値になる。
min=ds/(ds+d×cosθmin) (6)
max=ds/(ds+d×cosθmax) (7)
従って、抑圧係数算出部24は、まず、マイク間距離d、音源方向θ、及び目的音声の音源からマイクロフォン11Aまでの距離dsに基づいて、範囲Rmin〜Rmaxを定める。そして、算出された振幅比R(f,i)が範囲Rmin〜Rmaxに含まれる場合には、入力音声信号が目的音声であると判定し、例えば、下記のような抑圧係数ε(f,i)を算出する。
min≦R(f,i)≦Rmaxの場合 ε(f,i)=1.0
R(f,i)<Rmin or R(f,i)>Rmaxの場合 ε(f,i)=εmin
なお、εminは0<εmin<1の値であり、例えば、抑圧量を−3dBにしたい場合にはεminは約0.7、抑圧量を−6dBにしたい場合にはεminは0.5となる。また、算出した振幅比R(f,i)がRmin〜Rmaxの範囲外の場合に、Rmin〜Rmaxの範囲から振幅比R(f,i)が外れるにしたがって、下記に示すように、抑圧係数εを1.0からεminに徐々に変化するように算出してもよい。
min≦R(f,i)≦Rmaxの場合
ε(f,i)=1.0
min−0.1≦R(f,i)≦Rminの場合
ε(f,i)=10(1.0−εmin)R(f,i)
−10Rmin(1.0−εmin)+1.0
max≦R(f,i)≦Rmax+0.1の場合
ε(f,i)=−10(1.0−εmin)R(f,i)
+10Rmax(1.0−εmin)+1.0
R(f,i)<Rmin−0.1 or R(f,i)>Rmax+0.1の場合
ε(f,i)=εmin
上記の抑圧係数ε(f,i)は、0.0から1.0までの値で、0.0に近いほど抑圧の程度が大きくなる。
抑圧信号生成部26は、抑圧係数算出部24で算出された抑圧係数ε(f,i)を信号M(f,i)に乗算することにより、雑音を抑圧した抑圧信号を各フレームの周波数毎に生成する。
周波数時間変換部28は、抑圧信号生成部26で生成された周波数領域の信号である抑圧信号を、例えば逆フーリエ変換等を用いて時間領域の信号である出力音声信号に変換して出力する。
雑音抑圧装置10は、例えば図4に示すコンピュータ40で実現することができる。コンピュータ40はCPU42、メモリ44、及び不揮発性の記憶部46を備えている。CPU42、メモリ44、及び記憶部46は、バス48を介して互いに接続されている。また、コンピュータ40には、マイクアレイ11(マイクロフォン11A,11B)が接続されている。
記憶部46はHDD(Hard Disk Drive)やフラッシュメモリ等によって実現できる。記録媒体としての記憶部46には、コンピュータ40を雑音抑圧装置10として機能させるための雑音抑圧プログラム50が記憶されている。CPU42は、雑音抑圧プログラム50を記憶部46から読み出してメモリ44に展開し、雑音抑圧プログラム50が有するプロセスを順次実行する。
雑音抑圧プログラム50は、A/D変換プロセス52、時間周波数変換プロセス54、検出プロセス56、フレーム単位補正プロセス58、周波数単位補正プロセス60、及び振幅比算出プロセス62を有する。また、雑音抑圧プログラム50は、抑圧係数算出プロセス64、抑圧信号生成プロセス66、及び周波数時間変換プロセス68を有する。
CPU42は、A/D変換プロセス52を実行することで、図2に示すA/D変換部12A,12Bとして動作する。また、CPU42は、時間周波数変換プロセス54を実行することで、図2に示す時間周波数変換部14A,14Bとして動作する。また、CPU42は、検出プロセス56を実行することで、図2に示す検出部16として動作する。また、CPU42は、フレーム単位補正プロセス58を実行することで、図2に示すフレーム単位補正部18として動作する。また、CPU42は、周波数単位補正プロセス60を実行することで、図2に示す周波数単位補正部20として動作する。また、CPU42は、振幅比算出プロセス62を実行することで、図2に示す振幅比算出部22として動作する。また、CPU42は、抑圧係数算出プロセス64を実行することで、図2に示す抑圧係数算出部24として動作する。また、CPU42は、抑圧信号生成プロセス66を実行することで、図2に示す抑圧信号生成部26として動作する。また、CPU42は、周波数時間変換プロセス68を実行することで、図2に示す周波数時間変換部28として動作する。これにより、雑音抑圧プログラム50を実行したコンピュータ40が、雑音抑圧装置10として機能することになる。
なお、雑音抑圧装置10は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)やDSP(Digital Signal Processor)等で実現することも可能である。
次に、第1実施形態に係る雑音抑圧装置10の作用について説明する。マイクアレイ11から入力音声信号1及び入力音声信号2が出力されると、CPU42が、記憶部46に記憶された雑音抑圧プログラム50をメモリ44に展開して、図5に示す雑音抑圧処理を実行する。
図5に示す雑音抑圧処理のステップ100で、A/D変換部12A,12Bが、入力されたアナログ信号である入力音声信号1及び入力音声信号2の各々を、サンプリング周波数Fsでデジタル信号である信号M(t)及び信号M(t)に変換する。
次に、ステップ102で、時間周波数変換部14A,14Bが、時間領域の信号である信号M(t)及び信号M(t)の各々を、フレーム毎に周波数領域の信号である信号M(f,i)及び信号M(f,i)に変換する。
次に、ステップ104で、検出部16が、信号M(f,i)及び信号M(f,i)を用いて、フレームiの周波数f毎に、入力音声信号が定常雑音か、または非定常的な音かを判別して、定常雑音を示す信号M(f,i)及び信号M(f,i)を検出する。
次に、ステップ106で、フレーム単位補正部18が、定常雑音を示す信号として検出された信号M(f,i)及び信号M(f,i)を用いて、例えば(1)式に示すようなフレーム単位の感度差補正係数C(i)を算出する。
次に、ステップ108で、フレーム単位補正部18が、フレーム単位の感度差補正係数C(i)を信号M(f,i)に乗算して、信号M(f,i)と信号M(f,i)との感度差をフレーム単位で補正した信号M’(f,i)を生成する。
次に、ステップ110で、周波数単位補正部20が、信号M(f,i)及び信号M’(f,i)を用いて、例えば(3)式に示すような周波数単位の感度差補正係数C(f,i)を算出する。
次に、ステップ112で、周波数単位補正部20が、周波数単位の感度差補正係数C(f,i)を信号M’(f,i)に乗算して、信号M(f,i)と信号M’(f,i)との感度差を周波数単位で補正した信号M”(f,i)を生成する。
次に、ステップ114で、振幅比算出部22が、信号M(f,i)及び信号M”(f,i)の各々の振幅スペクトルを算出する。そして、各フレームの周波数毎に、同じ周波数の振幅スペクトル同士の比を振幅比R(f,i)として算出する。
次に、ステップ116で、抑圧係数算出部24が、振幅比R(f,i)に基づいて、入力音声信号が目的音声か雑音かを判定して、抑圧係数ε(f,i)を算出する。
次に、ステップ118で、抑圧信号生成部26が、抑圧係数ε(f,i)を信号M(f,i)に乗算することにより、雑音を抑圧した抑圧信号を各フレームの周波数毎に生成する。
次に、ステップ120で、周波数時間変換部28が、周波数領域の信号である抑圧信号を、例えば逆フーリエ変換等を用いて時間領域の信号である出力音声信号に変換して出力する。
次に、ステップ122で、A/D変換部12A,12Bが、引き続き入力音声信号が入力されたか否かを判定する。入力音声信号が入力されている場合には、ステップ100へ戻って、ステップ100〜120の処理を繰り返す。引き続き入力される入力音声信号が存在しないと判定された場合には、雑音抑圧処理を終了する。
以上説明したように、第1実施形態に係る雑音抑圧装置10によれば、定常雑音は入力音声信号間の振幅比が1.0に近い値になることを利用して、入力音声信号から定常雑音を検出して、マイクロフォン間の感度差を補正する。定常雑音を利用することにより、位相差を用いて検出した所定方向から到来する音声に基づいて感度差補正を行う場合に比べ、感度差補正に利用する音声をより広い範囲から検出することができる。また、感度差の補正では、まず、周波数領域の信号に変換された入力音声信号の一方をフレーム単位で補正した信号に対して、周波数単位の補正を行うことにより、周波数毎に感度差が異なる場合でも、迅速に感度差を補正することができる。従って、第1実施形態に係る雑音抑圧装置10によれば、マイクロフォン間の感度差が大きい場合でも、感度差補正の係数が安定するまでの時間が短くなる。すなわち、マイクロフォン間の感度差の補正を迅速に行うことができる。そのため、感度差補正の遅れによる雑音抑圧による音声歪みを低減することができる。
なお、第1実施形態では、マイクロフォン間の感度差に基づいて信号M(f,i)を感度差補正し、信号M(f,i)に雑音抑圧係数を乗じて抑圧信号を生成する場合について説明した。これは、目的音源が入力音声信号1を収音するマイクロフォン11Aに近い位置にある場合を想定している。目的音源音声がマイクロフォン11Bに近い位置にある場合には、信号M(f,i)を感度差補正し、信号M(f,i)に雑音抑圧係数を乗じて抑圧信号を生成するようにするとよい。目的音源とマイクロフォン11A及びマイクロフォン11Bの各々との距離に大きな差がない場合には、どちらを利用してもよい。
また、第1実施形態では、フレーム単位の感度差補正係数C(i)、及び周波数単位の感度差補正係数C(f,i)をフレーム毎に更新する場合について説明したが、これに限定されない。上記の雑音抑圧処理を一定時間T1(例えば、T1=1時間)実行して更新された最終のC(i)及びC(f,i)をメモリ等に保存しておき、その後は保存してあるC(i)及びC(f,i)を利用するようにしてもよい。さらに、上記の雑音抑圧処理を一定時間T2(例えば、T2=1時間)実行する毎に、上記の雑音抑圧処理を一定時間T3(例えば、T3=10分)実行して更新された最終のC(i)及びC(f,i)を、次の一定時間T2の間利用するようにしてもよい。
また、(1)式内の更新係数α、及び(3)式内の更新係数βについて、上記の雑音抑圧処理の実行時間が長くなるに従って大きくなるように設定してもよい。なお、更新係数α及びβの更新は、全て同じ方法で更新してもよいし、各々別の方法で更新してもよい。
<第2実施形態>
図6に、第2実施形態に係る雑音抑圧装置210を示す。なお、第2実施形態に係る雑音抑圧装置210において、第1実施形態に係る雑音抑圧装置10と同一の部分については、同一符号を付して詳細な説明を省略する。
雑音抑圧装置210は、図6に示すように、A/D変換部12A,12B、時間周波数変換部14A,14B、検出部216、フレーム単位補正部218、周波数単位補正部20、及び振幅比算出部22を備えている。また、雑音抑圧装置210は、抑圧係数算出部224、抑圧信号生成部26、周波数時間変換部28、位相差利用範囲設定部30、位相差算出部32、及び正確度算出部34を備えている。なお、フレーム単位補正部218は、開示の技術の第1補正部の一例である。また、周波数単位補正部20は、開示の技術の第2補正部の一例である。また、振幅比算出部22、抑圧係数算出部224、及び抑圧信号生成部26は、開示の技術の抑圧部の一例である。また、A/D変換部12A,12B、時間周波数変換部14A,14B、検出部216、フレーム単位補正部218、周波数単位補正部20、及び周波数時間変換部28の部分は、開示の技術のマイク感度差補正装置の一例である。
位相差利用範囲設定部30は、マイク間距離及びサンプリング周波数の設定値を受け付け、音の到来方向の判定に位相差を利用できる周波数帯域を、マイク間距離及びサンプリング周波数に基づいて設定する。
ここで、マイク間距離及びサンプリング周波数と、入力音声信号1と入力音声信号2との位相差(同じ周波数における位相スペクトルの差)との関係について説明する。図7は、マイクロフォン11Aとマイクロフォン11Bとのマイク間距離dが音速c/サンプリング周波数Fsよりも小さい場合に、音源方向毎の入力音声信号1と入力音声信号2との位相差を表したグラフである。図8は、マイク間距離dが音速c/サンプリング周波数Fsよりも大きい場合に、音源方向毎の入力音声信号1と入力音声信号2との位相差を表したグラフである。図7及び図8では、音源方向を10°、30°、50°、70°、90°としている。
図7に示すように、マイク間距離dが音速c/サンプリング周波数Fsより小さい場合には、音源方向がいずれであっても位相回転が生じていないため、位相差を利用して音の到来方向を判定することに支障がない。しかし、図8に示すように、マイク間距離dが音速c/サンプリング周波数Fsより大きい場合には、ある周波数(図8の例では1kHz付近)よりも高域の周波数帯域で位相回転が生じている。位相回転が生じている場合には、位相差を利用して音の到来方向を判定することが困難となる。すなわち、位相差を利用してマイクロフォン間の感度差の補正及び雑音抑圧をする場合に、マイク間距離に制約ができてしまうという問題が生じる。
そこで、位相差利用範囲設定部30は、マイク間距離d及びサンプリング周波数Fsに基づいて、入力音声信号1と入力音声信号2との位相差に位相回転が生じない周波数帯域を算出する。そして、算出した周波数帯域を、位相差を利用して音の到来方向を判定する位相差利用範囲として設定する。
より具体的には、位相差利用範囲設定部30は、位相差利用範囲の上限周波数fmaxを、マイク間距離d、サンプリング周波数Fs、及び音速cを用いて、下記(8)式及び(9)式により算出する。
d≦c/Fsの場合 fmax=Fs/2 (8)
d>c/Fsの場合 fmax=c/(d*2) (9)
位相差利用範囲設定部30は、算出したfmax以下の周波数帯域を位相差利用範囲として設定する。位相差利用範囲の設定は、本装置の動作開始時に一度だけ実行し、算出した上限周波数fmaxをメモリ等に記憶しておけばよい。図9に、サンプリング周波数Fsを8kHz、マイク間距離dを135mm、音源方向θを30°とした場合の位相差を示す。この場合、(9)式より、fmaxは凡そ1.2kHz付近になる。
位相差算出部32は、位相差利用範囲設定部30で設定された位相差利用範囲(周波数fmax以下の周波数帯域)において、信号M(f,i)及び信号M(f,i)の各々の位相スペクトルを算出する。そして、同じ周波数の位相スペクトル同士の差分を位相差として算出する。
検出部216は、位相差算出部32で算出された位相差に基づいて、各フレームの周波数f毎に、入力音声信号の到来方向を判定することにより、目的音声の音源方向(以下、「目的音方向」という)以外から到来した音を検出する。目的音方向以外から到来した音は、遠くから到来した音であるとみなすと、定常雑音の場合と同様に、入力音声信号間の振幅比が1.0に近い値になるとみなすことができる。
具体的には、検出部216は、位相差算出部32で算出された位相差から、現フレームの音が目的音方向から到来した音であるかどうかを判定する。例えば、雑音抑圧装置210が携帯電話に搭載されている場合、携帯電話を持って発声する人の口元方向が目的音方向となる。ここでは、図3に示すように、マイクロフォン11Bよりもマイクロフォン11Aの方が目的音源に近い位置に配置されている場合について説明する。
検出部216は、例えば、図9の斜線で示した領域のように、算出した位相差が含まれた場合に、入力音声信号が目的音方向から到来した音であると判定するための判定領域を設定しておく。位相差利用範囲設定部30で設定された位相差利用範囲において、この判定領域に位相差が含まれる場合には、入力音声信号の現フレームの周波数f成分の音は目的音方向から到来した音であるとみなす。一方、位相差が判定領域外となる場合には、入力音声信号の現フレームの周波数f成分の音は目的音方向以外から到来した音であるとみなす。
フレーム単位補正部218は、検出部216で目的音方向以外から到来した音として検出された信号M(f,i)及び信号M(f,i)を用いて、フレーム単位の感度差補正係数を算出し、信号M(f,i)をフレーム単位で補正する。例えば、第1実施形態のフレーム単位補正部18と同様に、(1)式に示すようなフレーム単位の感度差補正係数C(i)を算出することができる。なお、第2実施形態では、(1)式のfmaxは位相差利用範囲設定部30で設定された上限周波数である。また、(1)式のΣ|M(f,i)|では、周波数0からfmaxにおいて、検出部216で目的音方向以外から到来した音として検出された信号M(f,i)の和をとる。Σ|M(f,i)|についても同様である。また、フレーム単位補正部218は、第1実施形態のフレーム単位補正部18と同様に、算出したフレーム単位の感度差補正係数C(i)に基づいて、例えば(2)式に示すように信号M(f,i)を補正した信号M’(f,i)を生成する。
正確度算出部34は、感度差補正の正確度を算出する。第2実施形態では、目的音方向以外から到来した音を、定常雑音の場合と同様に、入力音声信号間の振幅比が1.0に近い値になるものとして利用している。ただし、実際には、目的音方向以外から到来した音として検出された入力音声信号間の振幅比が1.0に近い値にならない場合もある。仮に、振幅比が1.0から大きく外れた値を利用した場合には、正確な感度差補正が行えず、雑音抑圧を行った際に音声歪みが生じてしまう場合がある。また、係数の更新が十分でない場合にも同様の問題が生じる。そこで、感度差補正の正確度が高い場合にのみ雑音抑圧を行うようにする。
具体的には、正確度算出部34は、位相差利用範囲における各周波数のうち、判定領域(例えば、図9の斜線で示した領域)に位相差が含まれる周波数の確率を、そのフレームの入力音声信号が目的音方向からの音である確率として算出する。すなわち、
目的音方向からの音である確率
=位相差が判定領域に含まれる周波数の数/位相差利用範囲の周波数の数
である。正確度算出部34は、目的音方向からの音である確率が高い場合に、正確度を更新する。目的音方向からの音である確率は、0.0から1.0までの値になるので、例えば0.8を閾値とし、目的音方向からの音である確率が閾値を超えた場合に、例えば下記(10)式に示すような正確度E(f,i)を算出する。
(f,i)=γ×E(f,i−1)
+(1−γ)×(|M(f,i)|/|M”(f,i)|) (10)
ここで、γは、前フレームで算出された正確度E(f,i−1)を現フレームにおける正確度E(f,i)にどの程度反映させるかを示す更新係数であり、0≦γ<1の値である。なお、γは開示の技術の第3更新係数の一例である。すなわち、現フレームの周波数毎の正確度E(f,i)を算出することにより、前フレームまでの周波数毎の正確度E(f,i−1)を更新する。
抑圧係数算出部224は、第1実施形態の抑圧係数算出部24と同様に抑圧係数ε(f,i)を算出する。ただし、正確度E(f,i)が所定の閾値(例えば、1.0)未満となる周波数については、正確な感度差補正が行えるまで感度差補正係数が更新されていないとみなして、抑圧係数ε(f,i)を1.0(抑圧を行わない値)とする。
雑音抑圧装置210は、例えば図4に示すコンピュータ240で実現することができる。コンピュータ240はCPU42、メモリ44、及び不揮発性の記憶部46を備えている。CPU42、メモリ44、及び記憶部46は、バス48を介して互いに接続されている。また、コンピュータ240には、マイクアレイ11(マイクロフォン11A,11B)が接続されている。
記憶部46はHDDやフラッシュメモリ等によって実現できる。記録媒体としての記憶部46には、コンピュータ240を雑音抑圧装置210として機能させるための雑音抑圧プログラム250が記憶されている。CPU42は、雑音抑圧プログラム250を記憶部46から読み出してメモリ44に展開し、雑音抑圧プログラム250が有するプロセスを順次実行する。
雑音抑圧プログラム250は、A/D変換プロセス52、時間周波数変換プロセス54、検出プロセス256、フレーム単位補正プロセス258、周波数単位補正プロセス60、及び振幅比算出プロセス62を有する。また、雑音抑圧プログラム250は、抑圧係数算出プロセス264、抑圧信号生成プロセス66、周波数時間変換プロセス68、位相差利用範囲設定プロセス70、位相差算出プロセス72、及び正確度算出プロセス74を有する。
CPU42は、検出プロセス256を実行することで、図6に示す検出部216として動作する。また、CPU42は、フレーム単位補正プロセス258を実行することで、図6に示すフレーム単位補正部218として動作する。また、CPU42は、抑圧係数算出プロセス264を実行することで、図6に示す抑圧係数算出部224として動作する。また、CPU42は、位相差利用範囲設定プロセス70を実行することで、図6に示す位相差利用範囲設定部30として動作する。また、CPU42は、位相差算出プロセス72を実行することで、図6に示す位相差算出部32として動作する。また、CPU42は、正確度算出プロセス74を実行することで、図6に示す正確度算出部34として動作する。他のプロセスについては、第1実施形態の雑音抑圧プログラム50と同様である。これにより、雑音抑圧プログラム250を実行したコンピュータ240が、雑音抑圧装置210として機能することになる。
なお、雑音抑圧装置210は、例えば半導体集積回路、より詳しくはASICやDSP等で実現することも可能である。
次に、第2実施形態に係る雑音抑圧装置210の作用について説明する。マイクアレイ11から入力音声信号1及び入力音声信号2が出力されると、CPU42が、記憶部46に記憶された雑音抑圧プログラム250をメモリ44に展開して、図10に示す雑音抑圧処理を実行する。なお、第2実施形態における雑音抑圧処理において、第1実施形態における雑音抑圧処理と同一の処理については、同一符号を付して詳細な説明を省略する。
図10に示す雑音抑圧処理のステップ200で、位相差利用範囲設定部30が、マイク間距離d及びサンプリング周波数Fsの設定値を受け付け、音の到来方向の判定に位相差を利用できる周波数帯域を算出し、位相差利用範囲として設定する。
次に、ステップ100及び102で、アナログ信号である入力音声信号1及び入力音声信号2の各々を、デジタル信号である信号M(t)及び信号M(t)に変換し、さらに、周波数領域の信号である信号M(f,i)及び信号M(f,i)に変換する。
次に、ステップ202で、位相差算出部32が、位相差利用範囲設定部30で設定された位相差利用範囲(周波数fmax以下の周波数帯域)において、信号M(f,i)及び信号M(f,i)の各々の位相スペクトルを算出する。そして、同じ周波数の位相スペクトル同士の差分を位相差として算出する。
次に、ステップ204で、検出部216が、上記ステップ202で算出された位相差に基づいて、各フレームの周波数f毎に到来方向を判定することにより、目的音方向以外から到来した音を示す信号M(f,i)及び信号M(f,i)を検出する。
次に、ステップ206で、フレーム単位補正部218が、目的音方向以外から到来した音として検出された信号M(f,i)及び信号M(f,i)を用いて、例えば(1)式に示すフレーム単位の感度差補正係数C(i)を算出する。ただし、(1)式のfmaxは位相差利用範囲設定部30で設定された上限周波数である。また、(1)式のΣ|M(f,i)|では、周波数0からfmaxにおいて、目的音方向以外から到来した音として検出された信号M(f,i)の和をとる。Σ|M(f,i)|についても同様である。
次に、ステップ108〜112で、信号M(f,i)にフレーム単位の感度差補正を行った上で、周波数単位の感度差補正を行った信号M”(f,i)を生成する。
次に、ステップ208で、正確度算出部34が、位相差利用範囲における各周波数のうち、判定領域(例えば、図9の斜線で示した領域)に位相差が含まれる周波数の確率を、そのフレームの入力音声信号が目的音方向からの音である確率として算出する。
次に、ステップ211で、正確度算出部34が、上記ステップ208で算出した確率が、所定の閾値(例えば0.8)を超えたか否かを判定する。目的音方向からの音である確率が閾値を超えた場合には、ステップ212へ移行する。ステップ212では、正確度算出部34が、例えば(10)式に示す正確度E(f,i)を算出することにより、前フレームまでの正確度E(f,i−1)を更新する。一方、上記ステップ211で、目的音方向からの音である確率が閾値以下と判定された場合には、ステップ212をスキップして、ステップ114へ移行する。
ステップ114では、振幅比算出部22が振幅比R(f,i)を算出する。次に、ステップ214で、抑圧係数算出部224が、第1実施形態のステップ116と同様に抑圧係数ε(f,i)を算出する。ただし、上記ステップ212で更新された正確度E(f,i)が所定の閾値(例えば、1.0)未満となる周波数については、抑圧係数ε(f,i)を1.0(抑圧を行わない値)とする。
以下、ステップ118〜122で、第1実施形態と同様に処理して、出力音声信号を出力して、雑音抑圧処理を終了する。
以上説明したように、第2実施形態に係る雑音抑圧装置210によれば、位相差を利用できる周波数帯域において算出された位相差に基づいて、目的音方向以外から到来した音を検出する。目的音方向以外から到来した音であれば、定常雑音と同様に、入力音声信号間の振幅比が1.0に近い値になるとみなして、マイクロフォン間の感度差を補正する。これにより、第1実施形態と同様に、マイクアレイの配置に制限がある場合でも、マイクロフォン間の感度差の補正を迅速に行うことができる。そのため、感度差補正の遅れによる雑音抑圧による音声歪みを低減することができる。また、感度差補正の正確度が高い場合にのみ、雑音抑圧の処理を行うことで、正確な感度差補正が行えていない場合に、雑音抑圧を行った際に音声歪みが生じてしまうことを防止することができる。
また、第2実施形態では、フレーム単位の感度差補正係数C(i)、周波数単位の感度差補正係数C(f,i)、及び正確度E(f,i)をフレーム毎に更新する場合について説明したが、これに限定されない。例えば、上記の雑音抑圧処理を一定時間T1(例えば、T1=1時間)実行して更新された最終のC(i)、C(f,i)、及びE(f,i)をメモリ等に保存しておく。そして、その後は保存してあるC(i)、C(f,i)、及びE(f,i)を利用するようにしてもよい。さらに、上記の雑音抑圧処理を一定時間T2(例えば、T2=1時間)実行する毎に、上記の雑音抑圧処理を一定時間T3(例えば、T3=10分)実行する。そして、更新された最終のC(i)、C(f,i)、及びE(f,i)を、次の一定時間T2の間利用するようにしてもよい。また、全ての周波数fについてE(f,i)が常に1.0以上になった場合に、C(i)、C(f,i)、及びE(f,i)の更新を終了してもよい。
また、(1)式内の更新係数α、(3)式内の更新係数β、(10)式内の更新係数γについては、上記の雑音抑圧処理の実行時間が長くなるに従って大きくなるように設定してもよい。また、周波数毎により各係数の更新を早く完了させるために、E(f,i)の値に従って、例えば、E(f,i)<1.0の場合に、下記(11)式〜(13)式に示すようにα、β、及びγの値を変更してもよい。この場合、α、β、及びγは周波数毎に異なる値をとる。
α(f,i)=0.2×E(f,i)+0.8 (11)
β(f,i)=0.2×E(f,i)+0.8 (12)
γ(f,i)=0.2×E(f,i)+0.8 (13)
なお、更新係数α、β、及びγの更新は、全て同じ方法で更新してもよいし、各々別の方法で更新してもよい。
また、上記各実施形態では、開示の技術のマイク感度差補正装置を含む雑音抑圧装置について説明したが、開示の技術のマイク感度差補正装置を単独または他の装置と組み合わせた形態としてもよい。例えば、補正した信号をそのまま出力する形態や、補正した信号を雑音抑圧以外の音声処理を行う装置へ入力するようにしてもよい。
ここで、図1に示すように各マイクロフォンを配置し、サンプリング周波数を8kHz、マイク間距離を135mmとした場合について、開示の技術による雑音抑圧処理結果の一例について説明する。図11は、入力音声信号1及び入力音声信号2の振幅スペクトルの一例を示すグラフである。各マイクロフォン間に感度差が生じていなければ、音源に近い位置にあるマイクロフォン11Aから出力された入力音声信号1の方が入力音声信号2よりも振幅が大きくなるはずである。しかし、図11の例では、マイクロフォン11A1よりマイクロフォン11Bの感度が高く、入力音声信号2の振幅の方が入力音声信号1の振幅よりも大きくなっている。
また、本開示の技術に対する比較例として、従来手法により、図11に示す入力音声信号1及び入力音声信号2に対して雑音抑圧を行った結果を図12に示す。ここでの従来手法は、位相差を用いて検出した垂直方向から到来した音に基づいて、各マイクロフォン間の感度差補正を行って雑音抑圧処理を行う手法である。この従来方式では、マイク間距離が音速/サンプリング周波数より大きい場合、位相差利用範囲内の低域でしか正確な感度差補正が行えない。そのため、図12に示すように、中高域の音声(山部分)が抑圧されてしまう。
一方、開示の技術により、図11に示す入力音声信号1及び入力音声信号2に対して雑音抑圧を行った結果を図13に示す。図13に示す本開示の技術による雑音抑圧結果では、全帯域で音声が抑圧されず、雑音(谷部分)のみが抑圧されている。
以上のように、開示の技術の手法によると、各マイクロフォンの配置位置に対する自由度が高まり、薄型化が進むスマートフォンを始めとする様々な装置にマイクアレイを実装することができる。また、マイクロフォン間の感度差を迅速に補正し、音声歪みのない雑音抑圧を実現することが可能となる。
なお、上記では開示の技術における雑音抑圧プログラムの一例である雑音抑圧プログラム50及び250が記憶部46に予め記憶(インストール)されている態様を説明した。しかし、開示の技術における雑音抑圧プログラムは、CD−ROMやDVD−ROM等の記録媒体に記録されている形態で提供することも可能である。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
マイクアレイに含まれる複数のマイクロフォンの各々から入力された入力音声信号の各々を、フレーム毎に周波数領域の信号に変換した周波数領域信号に基づいて、定常雑音を示す周波数領域信号を検出する検出部と、
前記定常雑音を示す周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム単位で補正するための第1補正係数を算出し、前記第1補正係数を用いて、前記周波数領域信号をフレーム単位で補正する第1補正部と、
前記第1補正部で補正された前記周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム毎に周波数単位で補正するための第2補正係数を算出し、前記第2補正係数を用いて、前記1補正部で補正された前記周波数領域信号を前記フレーム毎の周波数単位で補正する第2補正部と、
を含むマイク感度差補正装置。
(付記2)
前記入力音声信号の各々に対応した周波数領域信号間の周波数毎の位相差を算出する位相差算出部を含み、
前記検出部は、前記周波数毎の位相差に基づいて、目的音声の音源方向以外の方向から到来した前記入力音声信号に対応する前記周波数領域信号を、前記定常雑音を示す周波数領域信号として検出する
付記1記載のマイク感度差補正装置。
(付記3)
前記複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として設定する位相差利用範囲設定部を含み、
前記位相差算出部は、前記位相差利用範囲において、前記周波数毎の位相差を算出し、
前記検出部は、前記位相差利用範囲において、前記定常雑音を示す周波数領域信号を検出する
付記2記載のマイク感度差補正装置。
(付記4)
前記位相差利用範囲の周波数毎の位相差に基づいて、前記入力音声信号が目的音声の音源方向から到来した確率を算出し、前記確率が予め定めた確率閾値より高いときの前記入力音声信号の各々に対応した周波数領域信号の各々に基づいて、前記第1補正部及び前記第2補正部による補正の正確度を算出する正確度算出部を含む付記3記載のマイク感度差補正装置。
(付記5)
前記正確度算出部は、前記第1補正部による前記第1補正係数の算出に、前回算出された前記第1補正係数の値を反映させる度合いを示す第1更新係数、前記第2補正部による前記第2補正係数の算出に、前回算出された前記第2補正係数の値を反映させる度合いを示す第2更新係数、及び前記正確度算出部による前記正確度の算出に、前回算出された前記正確度の値を反映させる度合いを示す第3更新係数の少なくとも1つを、前記正確度に基づいて変更する付記4記載のマイク感度差補正装置。
(付記6)
前記正確度算出部は、前記正確度が予め定めた終了閾値を超えた場合に、前記正確度の算出を終了すると共に、前記第1補正部による前記第1補正係数、及び前記第2補正部による前記第2補正係数の算出を終了させる付記4または付記5記載のマイク感度差補正装置。
(付記7)
付記1〜付記6のいずれか1項記載のマイク感度差補正装置と、
前記第2補正部で補正された前記周波数領域信号を用いて求めた前記複数の入力音声信号間の振幅比に基づいて、前記入力音声信号に含まれる雑音を抑圧する抑圧部と、
を含む雑音抑圧装置。
(付記8)
付記4〜付記6のいずれか1項記載のマイク感度差補正装置と、
前記正確度算出部で算出された正確度が予め定めた抑圧閾値より大きい場合に、前記第2補正部で補正された前記周波数領域信号を用いて求めた前記複数の入力音声信号間の振幅比に基づいて、前記入力音声信号に含まれる雑音を抑圧する抑圧部と、
を含む雑音抑圧装置。
(付記9)
コンピュータに、
マイクアレイに含まれる複数のマイクロフォンの各々から入力された入力音声信号の各々を、フレーム毎に周波数領域の信号に変換した周波数領域信号に基づいて、定常雑音を示す周波数領域信号を検出し、
前記定常雑音を示す周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム単位で補正するための第1補正係数を算出し、前記第1補正係数を用いて、前記周波数領域信号をフレーム単位で補正し、
前記第1補正係数を用いて補正された前記周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム毎に周波数単位で補正するための第2補正係数を算出し、前記第2補正係数を用いて、前記1補正係数を用いて補正された前記周波数領域信号を前記フレーム毎の周波数単位で補正する
ことを含む処理を実行させるためのマイク感度差補正方法。
(付記10)
コンピュータに、
前記入力音声信号の各々に対応した周波数領域信号間の周波数毎の位相差を算出し、
前記周波数毎の位相差に基づいて、目的音声の音源方向以外の方向から到来した前記入力音声信号に対応する前記周波数領域信号を、前記定常雑音を示す周波数領域信号として検出する
ことを含む処理を実行させるための付記9記載のマイク感度差補正方法。
(付記11)
コンピュータに、
前記複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として設定し、
前記位相差利用範囲において、前記周波数毎の位相差を算出し、
前記位相差利用範囲において、前記定常雑音を示す周波数領域信号を検出する
ことを含む処理を実行させるための付記10記載のマイク感度差補正方法。
(付記12)
コンピュータに、
前記位相差利用範囲の周波数毎の位相差に基づいて、前記入力音声信号が目的音声の音源方向から到来した確率を算出し、前記確率が予め定めた確率閾値より高いときの前記入力音声信号の各々に対応した周波数領域信号の各々に基づいて、補正の正確度を算出することを含む処理を実行させるための付記11記載のマイク感度差補正方法。
(付記13)
コンピュータに、
前記第1補正係数の算出に、前回算出された前記第1補正係数の値を反映させる度合いを示す第1更新係数、前記第2補正係数の算出に、前回算出された前記第2補正係数の値を反映させる度合いを示す第2更新係数、及び前記正確度の算出に、前回算出された前記正確度の値を反映させる度合いを示す第3更新係数の少なくとも1つを、前記正確度に基づいて変更することを含む処理を実行させるための付記12記載のマイク感度差補正方法。
(付記14)
コンピュータに、
前記正確度が予め定めた終了閾値を超えた場合に、前記正確度の算出を終了すると共に、前記第1補正係数及び前記第2補正係数の算出を終了させることを含む処理を実行させるための付記12または付記13記載のマイク感度差補正方法。
(付記15)
コンピュータに、
付記7〜付記14のいずれか1項記載のマイク感度差補正方法に記載の各処理と、
補正された前記周波数領域信号を用いて求めた前記複数の入力音声信号間の振幅比に基づいて、前記入力音声信号に含まれる雑音を抑圧する
ことを含む処理を実行させるための雑音抑圧方法。
(付記16)
コンピュータに、
付記12〜付記14のいずれか1項記載のマイク感度差補正方法に記載の各処理と、
算出された正確度が予め定めた抑圧閾値より大きい場合に、補正された前記周波数領域信号を用いて求めた前記複数の入力音声信号間の振幅比に基づいて、前記入力音声信号に含まれる雑音を抑圧する ことを含む処理を実行させるための雑音抑圧方法。
(付記17)
コンピュータに、
マイクアレイに含まれる複数のマイクロフォンの各々から入力された入力音声信号の各々を、フレーム毎に周波数領域の信号に変換した周波数領域信号に基づいて、定常雑音を示す周波数領域信号を検出し、
前記定常雑音を示す周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム単位で補正するための第1補正係数を算出し、前記第1補正係数を用いて、前記周波数領域信号をフレーム単位で補正し、
前記第1補正係数を用いて補正された前記周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム毎に周波数単位で補正するための第2補正係数を算出し、前記第2補正係数を用いて、前記1補正係数を用いて補正された前記周波数領域信号を前記フレーム毎の周波数単位で補正する
ことを含む処理を実行させるためのマイク感度差補正プログラム。
(付記18)
コンピュータに、
前記入力音声信号の各々に対応した周波数領域信号間の周波数毎の位相差を算出し、
前記周波数毎の位相差に基づいて、目的音声の音源方向以外の方向から到来した前記入力音声信号に対応する前記周波数領域信号を、前記定常雑音を示す周波数領域信号として検出する
ことを含む処理を実行させるための付記9記載のマイク感度差補正プログラム。
(付記19)
コンピュータに、
前記複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として設定し、
前記位相差利用範囲において、前記周波数毎の位相差を算出し、
前記位相差利用範囲において、前記定常雑音を示す周波数領域信号を検出する
ことを含む処理を実行させるための付記10記載のマイク感度差補正プログラム。
(付記20)
コンピュータに、
前記位相差利用範囲の周波数毎の位相差に基づいて、前記入力音声信号が目的音声の音源方向から到来した確率を算出し、前記確率が予め定めた確率閾値より高いときの前記入力音声信号の各々に対応した周波数領域信号の各々に基づいて、補正の正確度を算出することを含む処理を実行させるための付記11記載のマイク感度差補正プログラム。
(付記21)
コンピュータに、
前記第1補正係数の算出に、前回算出された前記第1補正係数の値を反映させる度合いを示す第1更新係数、前記第2補正係数の算出に、前回算出された前記第2補正係数の値を反映させる度合いを示す第2更新係数、及び前記正確度の算出に、前回算出された前記正確度の値を反映させる度合いを示す第3更新係数の少なくとも1つを、前記正確度に基づいて変更することを含む処理を実行させるための付記12記載のマイク感度差補正プログラム。
(付記22)
コンピュータに、
前記正確度が予め定めた終了閾値を超えた場合に、前記正確度の算出を終了すると共に、前記第1補正係数及び前記第2補正係数の算出を終了させることを含む処理を実行させるための付記12または付記13記載のマイク感度差補正プログラム。
(付記23)
コンピュータに、
付記7〜付記14のいずれか1項記載のマイク感度差補正方法に記載の各処理と、
補正された前記周波数領域信号を用いて求めた前記複数の入力音声信号間の振幅比に基づいて、前記入力音声信号に含まれる雑音を抑圧する
ことを含む処理を実行させるための雑音抑圧プログラム。
(付記24)
コンピュータに、
付記12〜付記14のいずれか1項記載のマイク感度差補正方法に記載の各処理と、
算出された正確度が予め定めた抑圧閾値より大きい場合に、補正された前記周波数領域信号を用いて求めた前記複数の入力音声信号間の振幅比に基づいて、前記入力音声信号に含まれる雑音を抑圧する ことを含む処理を実行させるための雑音抑圧プログラム。
10、210 雑音抑圧装置
11 マイクアレイ
11A マイクロフォン
11B マイクロフォン
12A,12B A/D変換部
14A,14B 時間周波数変換部
16、216 検出部
18、218 フレーム単位補正部
20 周波数単位補正部
22 振幅比算出部
24、224 抑圧係数算出部
26 抑圧信号生成部
28 周波数時間変換部
30 位相差利用範囲設定部
32 位相差算出部
34 正確度算出部
40、240 コンピュータ

Claims (10)

  1. マイクアレイに含まれる複数のマイクロフォンの各々から入力された入力音声信号の各々を、フレーム毎に周波数領域の信号に変換した周波数領域信号に基づいて、定常雑音を示す周波数領域信号を検出する検出部と、
    前記定常雑音を示す周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム単位で補正するための第1補正係数を算出し、前記第1補正係数を用いて、前記周波数領域信号をフレーム単位で補正する第1補正部と、
    前記第1補正部で補正された前記周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム毎に周波数単位で補正するための第2補正係数を算出し、前記第2補正係数を用いて、前記1補正部で補正された前記周波数領域信号を前記フレーム毎の周波数単位で補正する第2補正部と、
    を含むマイク感度差補正装置。
  2. 前記入力音声信号の各々に対応した周波数領域信号間の周波数毎の位相差を算出する位相差算出部を含み、
    前記検出部は、前記周波数毎の位相差に基づいて、目的音声の音源方向以外の方向から到来した前記入力音声信号に対応する前記周波数領域信号を、前記定常雑音を示す周波数領域信号として検出する
    請求項1記載のマイク感度差補正装置。
  3. 前記複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として設定する位相差利用範囲設定部を含み、
    前記位相差算出部は、前記位相差利用範囲において、前記周波数毎の位相差を算出し、
    前記検出部は、前記位相差利用範囲において、前記定常雑音を示す周波数領域信号を検出する
    請求項2記載のマイク感度差補正装置。
  4. 前記位相差利用範囲の周波数毎の位相差に基づいて、前記入力音声信号が目的音声の音源方向から到来した確率を算出し、前記確率が予め定めた確率閾値より高いときの前記入力音声信号の各々に対応した周波数領域信号の各々に基づいて、前記第1補正部及び前記第2補正部による補正の正確度を算出する正確度算出部を含む請求項3記載のマイク感度差補正装置。
  5. 前記正確度算出部は、前記第1補正部による前記第1補正係数の算出に、前回算出された前記第1補正係数の値を反映させる度合いを示す第1更新係数、前記第2補正部による前記第2補正係数の算出に、前回算出された前記第2補正係数の値を反映させる度合いを示す第2更新係数、及び前記正確度算出部による前記正確度の算出に、前回算出された前記正確度の値を反映させる度合いを示す第3更新係数の少なくとも1つを、前記正確度に基づいて変更する請求項4記載のマイク感度差補正装置。
  6. 前記正確度算出部は、前記正確度が予め定めた終了閾値を超えた場合に、前記正確度の算出を終了すると共に、前記第1補正部による前記第1補正係数、及び前記第2補正部による前記第2補正係数の算出を終了させる請求項4または請求項5記載のマイク感度差補正装置。
  7. 請求項1〜請求項6のいずれか1項記載のマイク感度差補正装置と、
    前記第2補正部で補正された前記周波数領域信号を用いて求めた前記複数の入力音声信号間の振幅比に基づいて、前記入力音声信号に含まれる雑音を抑圧する抑圧部と、
    を含む雑音抑圧装置。
  8. 請求項4〜請求項6のいずれか1項記載のマイク感度差補正装置と、
    前記正確度算出部で算出された正確度が予め定めた抑圧閾値より大きい場合に、前記第2補正部で補正された前記周波数領域信号を用いて求めた前記複数の入力音声信号間の振幅比に基づいて、前記入力音声信号に含まれる雑音を抑圧する抑圧部と、
    を含む雑音抑圧装置。
  9. コンピュータに、
    マイクアレイに含まれる複数のマイクロフォンの各々から入力された入力音声信号の各々を、フレーム毎に周波数領域の信号に変換した周波数領域信号に基づいて、定常雑音を示す周波数領域信号を検出し、
    前記定常雑音を示す周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム単位で補正するための第1補正係数を算出し、前記第1補正係数を用いて、前記周波数領域信号をフレーム単位で補正し、
    前記第1補正係数を用いて補正された前記周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム毎に周波数単位で補正するための第2補正係数を算出し、前記第2補正係数を用いて、前記1補正係数を用いて補正された前記周波数領域信号を前記フレーム毎の周波数単位で補正する
    ことを含む処理を実行させるためのマイク感度差補正方法。
  10. コンピュータに、
    マイクアレイに含まれる複数のマイクロフォンの各々から入力された入力音声信号の各々を、フレーム毎に周波数領域の信号に変換した周波数領域信号に基づいて、定常雑音を示す周波数領域信号を検出し、
    前記定常雑音を示す周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム単位で補正するための第1補正係数を算出し、前記第1補正係数を用いて、前記周波数領域信号をフレーム単位で補正し、
    前記第1補正係数を用いて補正された前記周波数領域信号を用いて、前記複数のマイクロフォン間の感度差を前記フレーム毎に周波数単位で補正するための第2補正係数を算出し、前記第2補正係数を用いて、前記1補正係数を用いて補正された前記周波数領域信号を前記フレーム毎の周波数単位で補正する
    ことを含む処理を実行させるためのマイク感度差補正プログラム。
JP2013039695A 2013-02-28 2013-02-28 マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置 Active JP6020258B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013039695A JP6020258B2 (ja) 2013-02-28 2013-02-28 マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置
EP13199764.5A EP2773137B1 (en) 2013-02-28 2013-12-30 Microphone sensitivity difference correction device
US14/155,731 US9204218B2 (en) 2013-02-28 2014-01-15 Microphone sensitivity difference correction device, method, and noise suppression device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013039695A JP6020258B2 (ja) 2013-02-28 2013-02-28 マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置

Publications (2)

Publication Number Publication Date
JP2014168188A JP2014168188A (ja) 2014-09-11
JP6020258B2 true JP6020258B2 (ja) 2016-11-02

Family

ID=49911349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013039695A Active JP6020258B2 (ja) 2013-02-28 2013-02-28 マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置

Country Status (3)

Country Link
US (1) US9204218B2 (ja)
EP (1) EP2773137B1 (ja)
JP (1) JP6020258B2 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9118405B2 (en) * 2012-03-02 2015-08-25 Alberto CORNEJO LIZARRALDE Sound suppression system and controlled generation of same at a distance
JP6337519B2 (ja) * 2014-03-03 2018-06-06 富士通株式会社 音声処理装置、雑音抑圧方法、およびプログラム
US9406313B2 (en) * 2014-03-21 2016-08-02 Intel Corporation Adaptive microphone sampling rate techniques
JP2016127502A (ja) * 2015-01-06 2016-07-11 富士通株式会社 通信装置及びプログラム
JP6520276B2 (ja) * 2015-03-24 2019-05-29 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び、プログラム
JP2016182298A (ja) * 2015-03-26 2016-10-20 株式会社東芝 騒音低減システム
US9530426B1 (en) * 2015-06-24 2016-12-27 Microsoft Technology Licensing, Llc Filtering sounds for conferencing applications
EP3890347A1 (en) * 2015-09-10 2021-10-06 Yayuma Audio SP. Z.O.O. A method of an audio signal correction
CN106910511B (zh) * 2016-06-28 2020-08-14 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
JP6711205B2 (ja) * 2016-08-23 2020-06-17 沖電気工業株式会社 音響信号処理装置、プログラム及び方法
JP6763319B2 (ja) * 2017-02-27 2020-09-30 沖電気工業株式会社 非目的音判定装置、プログラム及び方法
CN107197090B (zh) * 2017-05-18 2020-07-14 维沃移动通信有限公司 一种语音信号的接收方法及移动终端
CN107509155B (zh) * 2017-09-29 2020-07-24 广州视源电子科技股份有限公司 一种阵列麦克风的校正方法、装置、设备及存储介质
JP7226107B2 (ja) * 2019-05-31 2023-02-21 富士通株式会社 話者方向判定プログラム、話者方向判定方法、及び、話者方向判定装置
CN110595612B (zh) * 2019-09-19 2021-11-19 三峡大学 电力设备噪声采集装置传声器灵敏度自动校准方法及系统
CN111050268B (zh) * 2020-01-16 2021-11-16 思必驰科技股份有限公司 麦克风阵列的相位测试系统、方法、装置、设备及介质
CN111935541B (zh) * 2020-08-12 2021-10-01 北京字节跳动网络技术有限公司 视频修正方法、装置、可读介质及电子设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0779495A (ja) * 1993-09-07 1995-03-20 Matsushita Electric Ind Co Ltd 信号制御装置
JP3146804B2 (ja) 1993-11-05 2001-03-19 松下電器産業株式会社 アレイマイクロホンおよびその感度補正装置
AU2001245740B2 (en) * 2000-03-14 2005-04-14 Audia Technology, Inc. Adaptive microphone matching in multi-microphone directional system
JP3940662B2 (ja) 2001-11-22 2007-07-04 株式会社東芝 音響信号処理方法及び音響信号処理装置及び音声認識装置
US7587056B2 (en) * 2006-09-14 2009-09-08 Fortemedia, Inc. Small array microphone apparatus and noise suppression methods thereof
JP4367484B2 (ja) * 2006-12-25 2009-11-18 ソニー株式会社 音声信号処理装置、音声信号処理方法及び撮像装置
JP2008311832A (ja) * 2007-06-13 2008-12-25 Yamaha Corp 電気音響変換器
JP5070993B2 (ja) * 2007-08-27 2012-11-14 富士通株式会社 音処理装置、位相差補正方法及びコンピュータプログラム
WO2009069184A1 (ja) * 2007-11-26 2009-06-04 Fujitsu Limited 音処理装置、補正装置、補正方法及びコンピュータプログラム
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム
JP5240026B2 (ja) * 2009-04-09 2013-07-17 ヤマハ株式会社 マイクロホンアレイにおけるマイクロホンの感度を補正する装置、この装置を含んだマイクロホンアレイシステム、およびプログラム
US8620672B2 (en) * 2009-06-09 2013-12-31 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
JP5772151B2 (ja) * 2011-03-31 2015-09-02 沖電気工業株式会社 音源分離装置、プログラム及び方法

Also Published As

Publication number Publication date
US9204218B2 (en) 2015-12-01
EP2773137A3 (en) 2017-05-24
US20140241546A1 (en) 2014-08-28
EP2773137A2 (en) 2014-09-03
EP2773137B1 (en) 2019-10-16
JP2014168188A (ja) 2014-09-11

Similar Documents

Publication Publication Date Title
JP6020258B2 (ja) マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置
JP6107151B2 (ja) 雑音抑圧装置、方法、及びプログラム
KR100883712B1 (ko) 음원 방향 추정 방법, 및 음원 방향 추정 장치
US10580428B2 (en) Audio noise estimation and filtering
JP5573517B2 (ja) 雑音除去装置および雑音除去方法
JP4753821B2 (ja) 音信号補正方法、音信号補正装置及びコンピュータプログラム
JP5141691B2 (ja) 音処理装置、補正装置、補正方法及びコンピュータプログラム
JP6668995B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
US9460731B2 (en) Noise estimation apparatus, noise estimation method, and noise estimation program
WO2008004541A1 (fr) Dispositif et procédé de correction de sortie, et dispositif et procédé de correction de sortie de haut-parleurs
JP5459220B2 (ja) 発話音声検出装置
JP6048596B2 (ja) 集音装置、集音装置の入力信号補正方法および移動機器情報システム
JP6361271B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
JP5982900B2 (ja) 雑音抑制装置、マイクロホンアレイ装置、雑音抑制方法、及びプログラム
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
JP2012149906A (ja) 音源位置推定装置、音源位置推定方法および音源位置推定プログラム
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置
JP7226107B2 (ja) 話者方向判定プログラム、話者方向判定方法、及び、話者方向判定装置
JP6102144B2 (ja) 音響信号処理装置、方法及びプログラム
JP5339849B2 (ja) 音声明瞭度改善方法および音声明瞭度改善システム
CN115691532A (zh) 风噪声污染范围估算方法及抑制方法、装置、介质、终端
JP2021510427A (ja) 音声処理装置、方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160628

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160919

R150 Certificate of patent or registration of utility model

Ref document number: 6020258

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150