JP2014137414A - 雑音抑圧装置、方法、及びプログラム - Google Patents

雑音抑圧装置、方法、及びプログラム Download PDF

Info

Publication number
JP2014137414A
JP2014137414A JP2013004734A JP2013004734A JP2014137414A JP 2014137414 A JP2014137414 A JP 2014137414A JP 2013004734 A JP2013004734 A JP 2013004734A JP 2013004734 A JP2013004734 A JP 2013004734A JP 2014137414 A JP2014137414 A JP 2014137414A
Authority
JP
Japan
Prior art keywords
suppression
suppression coefficient
phase difference
derived
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013004734A
Other languages
English (en)
Other versions
JP6107151B2 (ja
Inventor
Chikako Matsumoto
智佳子 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013004734A priority Critical patent/JP6107151B2/ja
Priority to US14/103,443 priority patent/US9236060B2/en
Priority to EP13196886.9A priority patent/EP2755204B1/en
Publication of JP2014137414A publication Critical patent/JP2014137414A/ja
Application granted granted Critical
Publication of JP6107151B2 publication Critical patent/JP6107151B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Abstract

【課題】マイクアレイの設置位置が制限されてしまう場合でも、適切な抑圧量で音声歪みの少ない雑音抑圧を行う。
【解決手段】位相差利用範囲算出部12が、マイク間距離d、及びサンプリング周波数Fsに基づいて、入力音声信号間の位相差が位相回転を生じない周波数帯域を位相差利用範囲として算出する。振幅条件算出部14が、マイク間距離d及び目的音声の音源位置(θ、ds)に基づいて、入力音声信号間の振幅比を利用して雑音を判定するための振幅条件を算出する。位相差由来抑圧係数算出部26が、位相差利用範囲において位相差に基づく位相差由来抑圧係数αを算出する。振幅比由来抑圧係数算出部28が、振幅比と振幅条件とに基づく振幅比由来抑圧係数βを算出する。抑圧係数算出部30が、αとβとから抑圧係数γを算出し、抑圧信号生成部32が、抑圧係数γを入力音声信号の振幅値に乗算して抑圧信号を生成する。
【選択図】図1

Description

開示の技術は、雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラムに関する。
従来、車載のカーナビゲーションシステム、ハンズフリーホン、テレビ会議システム等において、目的の音声(例えば、話者の発声)以外の雑音混じりの音声信号に含まれる雑音を抑圧することが行われている。このような雑音抑圧技術として、複数のマイクロフォンを含むマイクアレイを用いた技術が知られている。
マイクアレイを用いた雑音抑圧の従来技術としては、マイクアレイに含まれる各マイクロフォンの入力信号から算出した位相差を用いて、所定の方向に音源が存在する確からしさを示す値を求める方式が開示されている。この方式では、求めた値に基づいて、所定の方向の音源以外の音源からの音声信号を抑圧する。また、各マイクロフォンの入力信号の振幅比を利用して、目的方向以外の音を抑圧する方式が開示されている。
例えば、2点で得られた波形をそれぞれ複数の周波数帯域に分割し、各帯域で時間差及び振幅比を求め、任意に定めた時間差及び振幅比に一致しない波形を排除する技術が提案されている。この技術では、波形処理を帯域毎に並列して行った後、各帯域の出力を加算することで任意の位置(方向)の音源の音のみを選択的に抽出することができる。さらに、この技術では、2つのマイクロフォンからの距離に差がある音源からの音を選択的に抽出する場合は、信号の遅延または振幅増幅を行うことで、位相差または振幅比を揃えておき、位相差または振幅比が一致しない波形を排除している。
また、2つ以上のマイクロフォンが受信した音から推定した目的音の音源方向を用いてマイクロフォン間の位相差を検出し、検出された位相差を用いて、位相差の中心値を更新する技術が提案されている。この技術では、更新された中心値を用いて生成された雑音抑制フィルタを用いて、マイクロフォンが受信した音の雑音を抑制し出力している。
また、各々異なる場所にある2つのセンサで受信した可聴信号を変換して、スペクトル信号を発生し、スペクトル信号を遅延させ、多数の中間信号を供給する技術が提案されている。中間信号の各々は、2つのセンサに対する異なる空間位置に対応しており、ノイズ源及び所望の発生源の場所、並びに所望の信号のスペクトル内容を、ノイズ源の場所に対応する中間信号から判定している。
特開平07−039000号公報 特開2010−176105号公報 特表2002−530966号公報
しかし、従来技術による雑音抑圧技術では、マイクアレイの設置位置によっては、各マイクロフォンで受信する信号間に意図した位相差や振幅比(または振幅差)が生じず、雑音抑圧量が減ったり、雑音抑圧後の信号に歪みが生じたりする、という問題がある。特に近年、携帯電話のようにマイクアレイを設置する機器が小型化する傾向にあるため、マイクアレイの設置位置(マイクロフォン間の距離)が制限されてしまう。
開示の技術は、一つの側面として、マイクアレイの設置位置が制限されてしまう場合でも、適切な抑圧量で音声歪みの少ない雑音抑圧を行うことが目的である。
開示の技術は、マイクアレイに含まれる複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、位相差利用範囲を算出する位相差利用範囲算出部を備えている。位相差利用範囲は、前記複数のマイクロフォンの各々から入力された目的音声及び雑音を含む入力音声信号間の周波数毎の位相差が位相回転を生じない周波数帯域である。また、開示の技術は、前記マイク間距離、及び前記目的音声の音源の位置に基づいて振幅条件を算出する振幅条件算出部を備えている。振幅条件は、前記入力音声信号間の周波数毎の振幅比または振幅差に基づいて、前記入力音声信号が前記目的音声か前記雑音かを周波数毎に判定するためのものである。また、開示の技術は、前記位相差利用範囲算出部で算出された位相差利用範囲において、位相差に基づく位相差由来抑圧係数を周波数毎に算出する位相差由来抑圧係数算出部を備えている。また、開示の技術は、前記振幅比または振幅差と、前記振幅条件算出部で算出された振幅条件とに基づく振幅比由来抑圧係数を周波数毎に算出する振幅比由来抑圧係数算出部を備えている。また、開示の技術は、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧する抑圧部を備えている。
開示の技術は、一つの側面として、マイクアレイの設置位置が制限されてしまう場合でも、適切な抑圧量で音声歪みの少ない雑音抑圧を行うことができる、という効果を有する。
第1実施形態に係る雑音抑圧装置の構成の一例を示すブロック図である。 第1実施形態に係る雑音抑圧装置の機能的構成の一例を示すブロック図である。 マイクアレイの配置の一例を示す概略図である。 マイク間距離が短い場合の位相差の一例を示すグラフである。 マイク間距離が長い場合の位相差の一例を示すグラフである。 マイク間距離が短い場合の振幅の一例を示すグラフである。 マイク間距離が長い場合の振幅の一例を示すグラフである。 マイクアレイに対する音源位置を説明するための概略図である。 位相差を利用した雑音抑圧を行う際に、目的音声と判定できる位相差の範囲を説明するための概略図である。 雑音抑圧装置として機能するコンピュータの一例を示す概略ブロック図である。 第1実施形態における雑音抑圧処理を示すフローチャートである。 第2実施形態に係る雑音抑圧装置の機能的構成の一例を示すブロック図である。 第2実施形態における雑音抑圧処理を示すフローチャートである。 従来方式による雑音抑圧処理結果を示すグラフである。 開示の技術の方式による雑音抑圧処理結果を示すグラフである。
以下、図面を参照して開示の技術の実施形態の一例を詳細に説明する。
〔第1実施形態〕
図1に、第1実施形態に係る雑音抑圧装置10を示す。雑音抑圧装置10には、複数のマイクロフォンを所定間隔で配置したマイクアレイ11が接続されている。マイクアレイ11には、少なくとも2つのマイクロフォンが含まれる。ここでは、マイクロフォン11a及びマイクロフォン11bの2つのマイクロフォンが含まれる場合を例に説明する。
マイクロフォン11a及び11bは、周辺の音を集音し、集音した音をアナログ信号に変換して出力する。マイクロフォン11aから出力された信号を入力音声信号1、マイクロフォン11bから出力された信号を入力音声信号2とする。入力音声信号1及び入力音声信号2には、目的音声(目的の音源からの音声、例えば話者の発声)以外に雑音が混入している。マイクアレイ11から出力された入力音声信号1及2は雑音抑圧装置10に入力される。雑音抑圧装置10では、入力された入力音声信号1及び入力音声信号2に含まれる雑音を抑圧した出力音声信号を生成して出力する。
雑音抑圧装置10は、図2に示すように、位相差利用範囲算出部12、振幅条件算出部14、音声入力部16a,16b、音声受付部18、時間周波数変換部20、位相差算出部22、及び振幅比算出部24を備えている。また、雑音抑圧装置10は、位相差由来抑圧係数算出部26、振幅比由来抑圧係数算出部28、抑圧係数算出部30、抑圧信号生成部32、及び周波数時間変換部34を備えている。なお、位相差算出部22及び位相差由来抑圧係数算出部26は、開示の技術の位相差由来抑圧係数算出部の一例である。また、振幅比算出部24及び振幅比由来抑圧係数算出部28は、開示の技術の振幅比由来抑圧係数算出部の一例である。また、抑圧係数算出部30及び抑圧信号生成部32は、開示の技術の抑圧部の一例である。
位相差利用範囲算出部12は、入力音声信号1及び入力音声信号2に含まれる雑音を抑圧する際の抑圧係数の算出に位相差を利用できる周波数帯域を、マイク間距離及びサンプリング周波数に基づいて算出する。
ここで、マイク間距離及びサンプリング周波数と、入力音声信号1と入力音声信号2との位相差(同じ周波数における位相スペクトルの差)との関係について説明する。本実施形態では、図3に示すように、マイクアレイ11に対して音源が存在する音源方向を、2つのマイクロフォンの中心を通る直性と、2つのマイクロフォンの中心の中点Pを一端とする線分とのなす角で表す。
図4は、マイクロフォン11aとマイクロフォン11bとのマイク間距離dが音速c/サンプリング周波数Fsよりも小さい場合に、音源方向毎の入力音声信号1と入力音声信号2との位相差を表したグラフである。図5は、マイク間距離dが音速c/サンプリング周波数Fsよりも大きい場合に、音源方向毎の入力音声信号1と入力音声信号2との位相差を表したグラフである。図4及び図5では、音源方向を10°、30°、50°、70°、90°としている。
図4に示すように、マイク間距離dが音速c/サンプリング周波数Fsより小さい場合には、音源方向がいずれであっても位相回転が生じていないため、位相差を利用して入力音声信号が目的音声か雑音かを判定することに支障がない。しかし、図5に示すように、マイク間距離dが音速c/サンプリング周波数Fsより大きい場合には、ある周波数(図5の例では1kHz付近)よりも高域の周波数帯域で位相回転が生じている。位相回転が生じている場合には、位相差を利用して目的音声か雑音かを判定することが困難となり、適切に雑音を抑圧することができない。すなわち、位相差を利用して雑音抑圧をする場合に、マイク間距離に制約ができてしまうという問題が生じる。
そこで、位相差利用範囲算出部12は、マイク間距離d及びサンプリング周波数Fsに基づいて、入力音声信号1と入力音声信号2との位相差に位相回転が生じない周波数帯域を算出する。そして、算出した周波数帯域を、位相差を利用して目的音声か雑音かを判定する位相差利用範囲として設定する。
より具体的には、位相差利用範囲算出部12は、位相差利用範囲の上限周波数Fmaxを、マイク間距離d、サンプリング周波数Fs、及び音速をcを用いて、下記(1)式及び(2)式により算出する。
d≦c/Fsの場合 Fmax=Fs/2 ・・・(1)
d>c/Fsの場合 Fmax=c/(d*2) ・・・(2)
位相差利用範囲算出部12は、算出したFmax以下の周波数帯域を位相差利用範囲として設定する。
振幅条件算出部14は、入力音声信号1の振幅と入力音声信号2の振幅との振幅比(または振幅差)に基づいて、入力音声信号が目的音声か雑音かを判定する際の振幅条件を、マイク間距離d及び目的音源の位置に基づいて算出する。
ここで、マイク間距離及び目的音源の位置と、入力音声信号1と入力音声信号2との振幅比(同じ周波数における振幅スペクトルの比)との関係について説明する。図6は、マイクロフォン11aとマイクロフォン11bとのマイク間距離dが音速c/サンプリング周波数Fsよりも小さい場合で、音源方向30°に音源があった場合の入力音声信号1及び入力音声信号2の各々の振幅を表したグラフである。図7は、マイク間距離dが音速c/サンプリング周波数Fsよりも大きい場合で、音源方向30°に音源があった場合の入力音声信号1及び入力音声信号2の各々の振幅を表したグラフである。
図6に示すように、マイク間距離dが音速c/サンプリング周波数Fsより小さい場合には、2つの入力音声信号間の振幅差が小さい。一方、図7に示すように、マイク間距離dが音速c/サンプリング周波数Fsより大きい場合には、振幅差が大きくなる。また、図6及び図7は、音源方向が30°の音源についての例であるが、振幅差は、音源方向の影響も大きい。音源方向が90°(2つのマイクロフォンの中心を通る直線に垂直な方向)の音源については振幅差が小さく、音源方向が90°から離れる(音源方向0°または180°に近づく)に従って振幅差はだんだん大きくなる。このようなマイク間距離d及び音源位置に応じた振幅比の変化を考慮した振幅条件が設定されていない場合には、雑音を抑圧した際に、抑圧量が低下したり、音声歪みが生じたりする。
そこで、振幅条件算出部14は、入力音声信号1と入力音声信号2との振幅比に基づいて入力音声信号が目的音声か雑音かを判定するための振幅条件を、マイク間距離d及び音源位置に基づいて算出する。ここでは、入力音声信号が目的音声であると判定できる振幅比の上限及び下限で表される振幅比の範囲を振幅条件として算出する。
より具体的には、図8に示すように、マイク間距離がd、音源方向がθ°、及び音源からマイクロフォン11aまでの距離がdsの場合、振幅比Rは下記(3)式となる。
R={ds/(ds+d×cosθ)}(0≦θ≦180) ・・・(3)
そこで、抑圧せずに残したい目的音声の音源がθmin以上、θmax以下に存在する場合には、振幅比Rが(4)式及び(5)式で表されるRmin以上、Rmaxの以下の値になる。
min=ds/(ds+d×cosθmin) ・・・(4)
max=ds/(ds+d×cosθmax) ・・・(5)
振幅条件算出部14は、算出したRmin及びRmaxで表される範囲Rmin〜Rmaxに入力音声信号1と入力音声信号2との振幅比Rが含まれる場合には、その入力音声信号が目的音声であると判定する振幅条件を設定する。
音声入力部16a,16bは、マイクアレイ11から出力された入力音声信号1及び入力音声信号2を雑音抑圧装置10に入力する。
音声受付部18は、音声入力部16a,16bにより入力されたアナログ信号である入力音声信号1及び入力音声信号2の各々を、サンプリング周波数Fsでデジタル信号に変換する。
時間周波数変換部20は、音声受付部18でデジタル信号に変換された時間領域の信号である入力音声信号1及び入力音声信号2の各々を、例えばフーリエ変換等を用いて、フレーム毎に周波数領域の信号に変換する。なお、1フレームは、例えば数十msecとすることができる。
位相差算出部22は、位相差利用範囲算出部12で算出された位相差利用範囲(周波数Fmax以下の周波数帯域)において、時間周波数変換部20で周波数領域の信号に変換された2つの入力音声信号の各々の位相スペクトルを算出する。そして、同じ周波数の位相スペクトル同士の差分を位相差として算出する。
振幅比算出部24は、時間周波数変換部20で周波数領域の信号に変換された2つの入力音声信号の各々の振幅スペクトルを算出する。ある周波数fにおける入力音声信号1の振幅スペクトルをIN1、入力音声信号2の振幅スペクトルをIN2とし、下記(6)式に示すように、振幅比Rを算出する。
=IN2/IN1 ・・・(6)
位相差由来抑圧係数算出部26は、位相差利用範囲算出部12で算出された位相差利用範囲において、位相差由来抑圧係数を算出する。位相差由来抑圧係数算出部26は、位相差算出部22で算出された位相差を用いて、抑圧せずに残したい音源方向に音源が存在する確率、すなわち入力音声信号が目的音声である確率を示す確率値を特定する。そして、この確率値に基づいて、位相差由来抑圧係数を算出する。
例えば、位相差由来抑圧係数をαとして、位相差由来抑圧係数αの算出方法の一例について説明する。図9に、サンプリング周波数Fsを8kHz、マイク間距離dを135mm、音源方向θを30°とした場合の位相差を示す。この場合、(2)式よりFmaxは凡そ1.2kHz付近になる。Fmax以下の周波数帯域において、位相差が図9の斜線部分となる入力音声信号を抑圧せずに残したい目的音声であるとする場合には、下記に示すように周波数f毎の位相差由来抑圧係数αを算出することができる。
f>Fmaxの場合 α=1.0
f≦Fmax、かつ位相差が斜線の範囲内の場合 α=1.0
f≦Fmax、かつ位相差が斜線の範囲外の場合 α=αmin
なお、αminは0<αmin<1の値であり、抑圧量を−3dBにしたい場合には、αminは約0.7、抑圧量を−6dBにしたい場合には、αminは0.5となる。また、位相差が斜線範囲外の場合に、斜線範囲から位相差が外れるにしたがって、位相差由来抑圧係数αを1.0からαminに徐々に変化するように算出してもよい。
振幅比由来抑圧係数算出部28は、振幅条件算出部14で算出された振幅条件に基づいて、入力音声信号が目的音声か雑音かを判定して振幅比由来抑圧係数を算出する。
例えば、振幅比由来抑圧係数をβとして、振幅比由来抑圧係数βの算出方法の一例について説明する。振幅条件算出部14で算出された振幅条件が、上述のようにRmin〜Rmaxの範囲に振幅比Rが含まれる場合は目的音声と判定するものであるときの振幅比由来抑圧係数βを、下記のように算出する。
min≦R≦Rmaxの場合 β=1.0
<Rmin,R>Rmaxの場合 β=βmin
なお、βminは0<βmin<1の値であり、抑圧量を−3dBにしたい場合には、βminは約0.7、抑圧量を−6dBにしたい場合には、βminは0.5となる。また、振幅比由来抑圧係数βも位相差由来抑圧係数αと同様に、振幅比Rが振幅条件の範囲外の場合に、振幅条件の範囲から振幅比が外れるにしたがって、下記に示すように、振幅比由来抑圧係数βを1.0からβminに徐々に変化するよう算出してもよい。
min≦R≦Rmaxの場合 β=1.0
min−0.1≦R≦Rminの場合
β=10(1.0−βmin)R−10Rmin(1.0−βmin)+1.0
max≦A≦Rmax+0.1の場合
β=−10(1.0−βmin)R+10Rmax(1.0−βmin)+1.0
<Rmin−0.1,R>Rmax+0.1の場合 β=βmin
抑圧係数算出部30は、位相差由来抑圧係数算出部26で算出された位相差由来抑圧係数と、振幅比由来抑圧係数算出部28で算出された振幅比由来抑圧係数とに基づいて、入力音声信号から雑音を抑圧するための抑圧係数を周波数毎に算出する。
例えば、位相差由来抑圧係数αと振幅比由来抑圧係数βとに基づいて、抑圧係数γを算出する方法の一例について説明する。周波数fの抑圧係数γは、下記に示すように、周波数fの位相差由来抑圧係数αと振幅比由来抑圧係数βとを乗算して算出することができる。
γ=α×β
また、上記の例に限らず、αとβとの平均や重み付和などで抑圧係数γを算出してもよい。
さらに、抑圧係数γの他の算出方法として、位相差由来抑圧係数αと振幅比由来抑圧係数βとで、抑圧の度合いが大きい方を抑圧係数γとして算出することができる。ここでは、α及びβの値が小さいほど抑圧の度合いが大きいため、下記に示すように、周波数fの抑圧係数γを算出することができる。
α<βの場合 γ=α
α>βの場合 γ=β
抑圧信号生成部32は、抑圧係数算出部30で算出された周波数毎の抑圧係数を、入力音声信号の対応する周波数の振幅スペクトルに乗算することにより、雑音を抑圧した抑圧信号を周波数毎に生成する。
周波数時間変換部34は、抑圧信号生成部32で生成された周波数領域の信号である抑圧信号を、例えば逆フーリエ変換等を用いて時間領域の信号である出力音声信号に変換して出力する。
雑音抑圧装置10は、例えば図10に示すコンピュータ40で実現することができる。コンピュータ40はCPU42、メモリ44、及び不揮発性の記憶部46を備えている。CPU42、メモリ44、及び記憶部46は、バス48を介して互いに接続されている。また、コンピュータ40には、マイクアレイ11(マイクロフォン11a,11b)が接続されている。
記憶部46はHDD(Hard Disk Drive)やフラッシュメモリ等によって実現できる。記録媒体としての記憶部46は、コンピュータ40を雑音抑圧装置10として機能させるための雑音抑圧プログラム50が記憶されている。CPU42は、雑音抑圧プログラム50を記憶部46から読み出してメモリ44に展開し、雑音抑圧プログラム50が有するプロセスを順次実行する。
雑音抑圧プログラム50は、位相差利用範囲算出プロセス52、振幅条件算出プロセス54、音声入力プロセス56、音声受付プロセス58、時間周波数変換プロセス60、位相差算出プロセス62、及び振幅比算出プロセス64を備えている。また、雑音抑圧プログラム50は、位相差由来抑圧係数算出プロセス66、振幅比由来抑圧係数算出プロセス68、抑圧係数算出プロセス70、抑圧信号生成プロセス72、及び周波数時間変換プロセス74を備えている。
CPU42は、位相差利用範囲算出プロセス52を実行することで、図2に示す位相差利用範囲算出部12として動作する。また、CPU42は、振幅条件算出プロセス54を実行することで、図2に示す振幅条件算出部14として動作する。また、CPU42は、音声入力プロセス56を実行することで、図2に示す音声入力部16a,16bとして動作する。また、CPU42は、音声受付プロセス58を実行することで、図2に示す音声受付部18として動作する。また、CPU42は、時間周波数変換プロセス60を実行することで、図2に示す時間周波数変換部20として動作する。また、CPU42は、位相差算出プロセス62を実行することで、図2に示す位相差算出部22として動作する。また、CPU42は、振幅比算出プロセス64を実行することで、図2に示す振幅比算出部24として動作する。また、CPU42は、位相差由来抑圧係数算出プロセス66を実行することで、図2に示す位相差由来抑圧係数算出部26として動作する。また、CPU42は、振幅比由来抑圧係数算出プロセス68を実行することで、図2に示す振幅比由来抑圧係数算出部28として動作する。また、CPU42は、抑圧係数算出プロセス70を実行することで、図2に示す抑圧係数算出部30として動作する。また、CPU42は、抑圧信号生成プロセス72を実行することで、図2に示す抑圧信号生成部32として動作する。また、CPU42は、周波数時間変換プロセス74を実行することで、図2に示す周波数時間変換部34として動作する。これにより、雑音抑圧プログラム50を実行したコンピュータ40が、雑音抑圧装置10として機能することになる。
なお、雑音抑圧装置10は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)やDSP(Digital Signal Processor)等で実現することも可能である。
次に、第1実施形態に係る雑音抑圧装置10の作用について説明する。マイクアレイ11から入力音声信号1及び入力音声信号2が出力されると、CPU42が、記憶部46に記憶された雑音抑圧プログラム50をメモリ44に展開して、図11に示す雑音抑圧処理を実行する。
図11に示す雑音抑圧処理のステップ100で、位相差利用範囲算出部12が、マイク間距離d及びサンプリング周波数Fsを受け付ける。また、振幅条件算出部14が、マイク間距離d、音源方向θ、音源からマイクロフォン11aまでの距離dsを受け付ける。以下、d、Fs、θ、dsをまとめて設定値ともいう。
次に、ステップ102で、位相差利用範囲算出部12が、上記ステップ100で受け付けたマイク間距離d及びサンプリング周波数Fsと、音速をcとを用いて、(1)式及び(2)式によりFmaxを算出する。そして、位相差利用範囲算出部12が、算出したFmax以下の周波数帯域を位相差利用範囲として設定する。
次に、ステップ104で、振幅条件算出部14が、上記ステップ100で受け付けたマイク間距離d、音源方向θ、及び音源からマイクロフォン11aまでの距離dsを用いて、(4)式に示すRmin及び(5)式に示すRmaxを算出する。そして、振幅条件算出部14が、算出したRmin及びRmaxで表される範囲Rmin〜Rmaxに入力音声信号1と入力音声信号2との振幅比Rが含まれる場合には、その入力音声信号が目的音声であると判定する振幅条件を設定する。
次に、ステップ106で、音声入力部16a,16bが、マイクアレイ11から出力された入力音声信号1及び入力音声信号2を雑音抑圧装置10に入力する。そして、音声受付部18が、音声入力部16a,16bにより入力されたアナログ信号である入力音声信号1及び入力音声信号2の各々を、サンプリング周波数Fsでデジタル信号に変換する。
次に、ステップ108で、時間周波数変換部20が、上記ステップ106でデジタル信号に変換された時間領域の信号である入力音声信号1及び入力音声信号2の各々を、フレーム毎に周波数領域の信号に変換する。
次に、ステップ110で、位相差算出部22が、上記ステップ102で算出された位相差利用範囲(周波数Fmax以下の周波数帯域)において、上記ステップ108で周波数領域の信号に変換された2つの入力音声信号の各々の位相スペクトルを算出する。そして、位相差算出部22が、同じ周波数の位相スペクトル同士の差分を位相差として算出する。
次に、ステップ112で、位相差由来抑圧係数算出部26が、上記ステップ102で算出された位相差利用範囲において、周波数f毎に、入力音声信号が目的音声である確率に基づく位相差由来抑圧係数αを算出する。
次に、ステップ114で、振幅比算出部24が、上記ステップ108で周波数領域の信号に変換された2つの入力音声信号の各々の振幅スペクトルを算出する。そして、周波数fにおける入力音声信号1の振幅スペクトルをIN1、入力音声信号2の振幅スペクトルをIN2とし、(6)式に示すように、振幅比Rを算出する。
次に、ステップ116で、振幅比由来抑圧係数算出部28が、上記ステップ104で算出された振幅条件に基づいて、周波数f毎に、入力音声信号が目的音声か雑音かを判定して振幅比由来抑圧係数βを算出する。具体的には、上記ステップ114で算出した振幅比Rが、上記ステップ104で算出した範囲Rmin〜Rmaxに含まれるか否かに応じた振幅比由来抑圧係数βを算出する。
次に、ステップ118で、抑圧係数算出部30が、上記ステップ112で算出された位相差由来抑圧係数αと、上記ステップ116で算出された振幅比由来抑圧係数βに基づいて、周波数f毎に抑圧係数γを算出する。
次に、ステップ120で、抑圧信号生成部32が、上記ステップ118で算出された周波数f毎の抑圧係数γを、入力音声信号の対応する周波数の振幅スペクトルに乗算することにより、雑音を抑圧した抑圧信号を周波数毎に生成する。
次に、ステップ122で、周波数時間変換部34が、上記ステップ122で生成された周波数領域の信号である抑圧信号を、時間領域の信号である出力音声信号に変換し、次のステップ124で、出力音声信号を出力する。
次に、ステップ126で、音声入力部16a,16bが、引き続き入力音声信号が入力されたか否かを判定する。入力音声信号が入力されている場合には、ステップ128へ移行し、位相差利用範囲算出部12及び振幅条件算出部14が、設定値のいずれかが変更されたか否かを判定する。設定値のいずれも変更されていない場合には、ステップ106へ戻って、ステップ106〜126の処理を繰り返す。一方、例えば、サンプリング周波数が数種類用意されていて、音声の出力先に応じてサンプリング周波数が自動的に切り替わるような場合において、サンプリング周波数の切り替わりが検出された場合などには、設定値のいずれかが変更されたと判定される。その場合には、ステップ100へ戻り、変更された設定値を受け付けて、ステップ100〜126の処理を繰り返す。
上記ステップ126において、引き続き入力される入力音声信号が存在しないと判定された場合には、雑音抑圧処理を終了する。
以上説明したように、第1実施形態に係る雑音抑圧装置10によれば、マイク間距離及びサンプリング周波数に基づいて、位相回転が生じない周波数帯域を算出し、この周波数帯域では位相差を利用した位相差由来抑圧係数を算出する。また、マイク間距離及び音源位置に基づいて、振幅比により目的音声か雑音かを判定する際の振幅条件を算出し、マイク間距離及び音源位置に応じた振幅比由来抑圧係数を算出する。そして、位相差由来抑圧係数と振幅比由来抑圧係数とから算出された抑圧係数を用いて、入力音声信号に含まれる雑音を抑圧する。そのため、マイク間距離によっては位相回転が生じる場合であっても、位相回転が生じない周波数帯域では、振幅比を利用した場合より抑圧精度の高い位相差を利用した抑圧を行うことができる。また、振幅比を利用する場合でも、マイク間距離及び音源位置に応じた振幅条件により適切な抑圧を行うことができる。これにより、マイクアレイの設置位置が制限されてしまう場合でも、適切な抑圧量で音声歪みの少ない雑音抑圧を行うことができる。
なお、振幅比由来抑圧係数算出部28において、例えば下記に示すように、位相差利用範囲(上限周波数Fmax以下の周波数帯域)では、Fmaxより大きい周波数帯域に比べて、抑圧しない範囲を広げてもよい。
f>Fmaxの場合 min=0.7 Rmax=1.4
f≦Fmaxの場合 min=0.6 Rmax=1.5
これにより、位相差を利用した抑圧が行われる位相差利用範囲における過剰な抑圧を防ぐことができる。
また、上記の方式の他にも、抑圧係数算出部30において、位相差利用範囲においては、振幅比由来抑圧係数βの値にかかわらず、抑圧係数γとして位相差由来抑圧係数αを採用してもよい。また、位相差由来抑圧係数αと振幅比由来抑圧係数βとから抑圧係数γを算出する際に、位相差由来抑圧係数αに対する重みが重くなるような重みづけを行ってもよい。
〔第2実施形態〕
図12に、第2実施形態に係る雑音抑圧装置210を示す。なお、第2実施形態に係る雑音抑圧装置210において、第1実施形態に係る雑音抑圧装置10と同一の部分については、同一符号を付して詳細な説明を省略する。
雑音抑圧装置210は、位相差利用範囲算出部12、振幅条件算出部14、音声入力部16a,16b、音声受付部18、時間周波数変換部20、位相差算出部22、及び振幅比算出部24を備えている。また、雑音抑圧装置210は、位相差由来抑圧係数算出部226、振幅比由来抑圧係数算出部228、抑圧係数算出部230、抑圧信号生成部32、周波数時間変換部34、定常雑音推定部36、及び定常雑音由来抑圧係数算出部38を備えている。なお、位相差算出部22及び位相差由来抑圧係数算出部226は、開示の技術の位相差由来抑圧係数算出部の一例である。また、振幅比算出部24及び振幅比由来抑圧係数算出部228は、開示の技術の振幅比由来抑圧係数算出部の一例である。また、抑圧係数算出部230及び抑圧信号生成部32は、開示の技術の抑圧部の一例である。また、定常雑音推定部36及び定常雑音由来抑圧係数算出部38は、開示の技術の定常雑音由来抑圧係数算出部の一例である。
定常雑音推定部36は、時間周波数変換部20で周波数領域の信号に変換された入力音声信号に基づいて、周波数毎に定常雑音のレベルを推定する。定常雑音のレベルの推定方法は、例えば特開2011−186384号公報に開示されている技術等の従来技術を用いることができる。
定常雑音由来抑圧係数算出部38は、定常雑音推定部36で推定された定常雑音のレベルに基づいて、定常雑音由来抑圧係数を算出する。例えば、定常雑音由来抑圧係数をεとして、定常雑音由来抑圧係数εの算出方法の一例について説明する。定常雑音以外の音源からの音が発生していない場合には、入力音声信号のレベルと定常雑音のレベルとの比は1.0に近い値となる。一方、定常雑音以外の音源からの音が発生している場合には、入力音声信号のレベルと定常雑音のレベルとの比は1.0から離れていく。
そこで、定常雑音由来抑圧係数算出部38は、入力音声信号レベル/定常雑音レベルが、1.0の近傍の値(例えば、1.1)以下となる場合を、定常雑音由来の抑圧範囲とし、例えば下記に示すような定常雑音由来抑圧係数εを算出する。
入力音声信号レベル/定常雑音レベル<1.1の場合 ε=εmin
入力音声信号レベル/定常雑音レベル≧1.1の場合 ε=1.0
なお、εminは0<εmin<1の値であり、例えば、抑圧量を−3dBにしたい場合には、εminは約0.7、抑圧量を−6dBにしたい場合にはεminは0.5となる。また、位相差由来抑圧係数αや振幅比由来抑圧係数βと同様に、入力音声信号レベル/定常雑音レベルが抑圧範囲外の場合に、抑圧範囲から外れるにしたがって、定常雑音由来抑圧係数εを1.0からεminに徐々に変化するように算出してもよい。
位相差由来抑圧係数算出部226は、定常雑音由来の抑圧範囲外において、位相差由来抑圧係数を算出する。位相差由来抑圧係数の算出方法は第1実施形態の位相差由来抑圧係数算出部26と同様である。
振幅比由来抑圧係数算出部228は、定常雑音由来の抑圧範囲外において、振幅比由来抑圧係数を算出する。振幅比由来抑圧係数の算出方法は第1実施形態の振幅比由来抑圧係数算出部28と同様である。
なお、定常雑音由来の抑圧範囲外とは、上記の例では、定常雑音由来抑圧係数εが1.0の場合である。また、εがεminから1.0までの値を持つ場合は、εが所定の閾値εthr以上の場合、すなわち、定常雑音に由来する抑圧の度合いが所定値以下の場合を定常雑音由来の抑圧範囲外とすることができる。
抑圧係数算出部230は、定常雑音由来抑圧係数、位相差由来抑圧係数、及び振幅比由来抑圧係数に基づいて、入力音声信号に含まれる雑音を抑圧するための抑圧係数を周波数毎に算出する。抑圧係数γの算出方法の一例について説明する。
定常雑音由来抑圧係数εが1.0の場合を定常雑音の抑圧範囲外とする場合に、下記に示すように、定常雑音由来の抑圧範囲外において、位相差由来抑圧係数α及び振幅比由来抑圧係数βを用いて、抑圧係数γを算出することができる。
ε≠1.0の場合 γ=ε
ε=1.0の場合 γ=α×β または γ=α、βの最小値
また、他の算出方法として、定常雑音由来抑圧係数εが所定の閾値εthr以上の場合を定常雑音の抑圧範囲外とする場合に、下記に示すように、定常雑音由来の抑圧範囲外において、α及びβを用いて、抑圧係数γを算出することができる。
ε<εthrの場合 γ=ε
ε≧εthrの場合 γ=α×β または γ=α、βの最小値
また、定常雑音由来の抑圧範囲内か範囲外かという切り分けではなく、下記に示すように、入力音声信号のレベルが推定された定常雑音のレベルより大きいか否かに応じて、抑圧係数γを算出してもよい。
入力音声信号レベル≦定常雑音レベル γ=ε
入力音声信号レベル>定常雑音レベル γ=α、β、εの最小値
雑音抑圧装置210は、例えば図10に示すコンピュータ240で実現することができる。コンピュータ240はCPU42、メモリ44、及び不揮発性の記憶部46を備えている。CPU42、メモリ44、及び記憶部46は、バス48を介して互いに接続されている。また、コンピュータ40には、マイクアレイ11(マイクロフォン11a,11b)が接続されている。
記憶部46はHDDやフラッシュメモリ等によって実現できる。記録媒体としての記憶部46は、コンピュータ240を雑音抑圧装置210として機能させるための雑音抑圧プログラム250を記憶する。CPU42は、雑音抑圧プログラム250を記憶部46から読み出してメモリ44に展開し、雑音抑圧プログラム250が有するプロセスを順次実行する。
雑音抑圧プログラム250は、第1実施形態に係る雑音抑圧プログラム50が有する各プロセスに加え、定常雑音推定プロセス76及び定常雑音由来抑圧係数算出プロセス78を有する。
CPU42は、定常雑音推定プロセス76を実行することで、図12に示す定常雑音推定部36として動作する。また、CPU42は、定常雑音由来抑圧係数算出プロセス78を実行することで、図12に示す定常雑音由来抑圧係数算出部38として動作する。これにより、雑音抑圧プログラム250を実行したコンピュータ240が、雑音抑圧装置210として機能することになる。
なお、雑音抑圧装置210は、例えば半導体集積回路、より詳しくはASICやDSP等で実現することも可能である。
次に、第2実施形態に係る雑音抑圧装置210の作用について説明する。マイクアレイ11から入力音声信号1及び入力音声信号2が出力されると、CPU42が、記憶部46に記憶された雑音抑圧プログラム250をメモリ44に展開して、図13に示す雑音抑圧処理を実行する。なお、第2実施形態における雑音抑圧処理において、第1実施形態における雑音抑圧処理と同一の処理については、同一符号を付して詳細な説明を省略する。
図13に示す雑音抑圧処理のステップ100〜108を経て、位相差利用範囲及び振幅条件を算出すると共に、入力音声信号を受け付け、周波数領域の信号に変換する。
次に、ステップ200で、定常雑音推定部36が、上記ステップ108で周波数領域の信号に変換された入力音声信号に基づいて、周波数毎に定常雑音のレベルを推定する。
次に、ステップ202で、定常雑音由来抑圧係数算出部38が、入力音声信号のレベルと上記ステップ200で推定された定常雑音のレベルとの比に基づいて、定常雑音由来抑圧係数εを算出する。
次に、定常雑音由来抑圧係数算出部38が、上記ステップ202で算出した定常雑音由来抑圧係数εに基づいて、定常雑音由来の抑圧範囲内か否かを判定する。定常雑音由来の抑圧範囲内の場合には、ステップ206へ移行する。定常雑音由来の抑圧範囲外の場合には、ステップ110へ移行し、ステップ110〜116で、位相差由来抑圧係数α及び振幅比由来抑圧係数βを算出して、ステップ206へ移行する。
ステップ206では、抑圧係数算出部230が、定常雑音由来の抑圧範囲内の場合には、上記ステップ202で算出した定常雑音由来抑圧係数εを抑圧係数γとする。また、定常雑音由来の抑圧範囲外の場合には、位相差由来抑圧係数α及び振幅比由来抑圧係数βを用いて、抑圧係数γを周波数毎に算出する。
以下、ステップ120〜128で、第1実施形態と同様に処理して、出力音声信号を出力して、雑音抑圧処理を終了する。
以上説明したように、第2実施形態に係る雑音抑圧装置210によれば、第1実施形態の効果に加え、位相差や振幅比を利用した場合では雑音抑圧の効果が低い定常雑音についても抑圧することができる。
なお、上記各実施形態では、音源方向及びマイクロフォンと音源との距離について、入力された値を受け付ける場合について説明したが、位相差算出部22で算出された位相差に基づいて推定された音源方向及びマイクロフォンと音源との距離を利用してもよい。
ここで、マイク間距離が音速/サンプリング周波数よりも長くなる位置に各マイクロフォンを配置した場合において、従来方式により雑音混じりの音声を雑音抑圧処理した結果を図14に示す。また、同様の条件において、本開示の技術に係る雑音抑圧装置を適用した場合の雑音抑圧処理結果を図15に示す。図14に示す従来方式では、1.2kHzより高域で音声部分(目的音声)が抑圧されており、音声歪みが生じている。一方、図15に示す本開示の技術の方式では、全帯域で音声が抑圧されている部分がなく、音声歪みがないことが分かる。
以上のように、開示の技術の方式によると、各マイクロフォンの配置位置に対する自由度が高まり、薄型化が進むスマートフォンを始めとする様々な装置にマイクアレイを実装し、音声歪みのない雑音抑圧を実現することが可能となる。
なお、上記では開示の技術における雑音抑圧プログラムの一例である雑音抑圧プログラム50及び250が記憶部46に予め記憶(インストール)されている態様を説明した。しかし、開示の技術における雑音抑圧プログラムは、CD−ROMやDVD−ROM等の記録媒体に記録されている形態で提供することも可能である。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
マイクアレイに含まれる複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記複数のマイクロフォンの各々から入力された目的音声及び雑音を含む入力音声信号間の周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として算出する位相差利用範囲算出部と、前記入力音声信号間の周波数毎の振幅比または振幅差に基づいて、前記入力音声信号が前記目的音声か前記雑音かを判定するための振幅条件を、前記マイク間距離、及び前記目的音声の音源の位置に基づいて算出する振幅条件算出部と、前記位相差利用範囲算出部で算出された位相差利用範囲において、位相差に基づく位相差由来抑圧係数を周波数毎に算出する位相差由来抑圧係数算出部と、前記振幅比または振幅差と、前記振幅条件算出部で算出された振幅条件とに基づく振幅比由来抑圧係数を周波数毎に算出する振幅比由来抑圧係数算出部と、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧する抑圧部と、を含む雑音抑圧装置。
(付記2)
前記抑圧部は、前記位相差利用範囲内において、前記振幅比由来抑圧係数より前記位相差由来抑圧係数を優先的に用いた前記抑圧係数を定める付記1記載の雑音抑圧装置。
(付記3)
前記抑圧部は、前記位相差利用範囲外では、前記振幅比由来抑圧係数を前記抑圧係数として定める付記1または付記2記載の雑音抑圧装置。
(付記4)
前記抑圧部は、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とを乗算した値、前記位相差由来抑圧係数と前記振幅比由来抑圧係数との平均、または前記位相差由来抑圧係数と前記振幅比由来抑圧係数との重み付和を前記抑圧係数として定める付記1記載の雑音抑圧装置。
(付記5)
前記抑圧部は、前記位相差由来抑圧係数及び前記振幅比由来抑圧係数のうち、抑圧の度合いが大きい方を前記抑圧係数として定める付記1記載の雑音抑圧装置。
(付記6)
前記入力音声信号に基づいて推定した定常雑音のレベルと、前記入力音声信号のレベルとに基づいて、定常雑音由来抑圧係数を算出する定常雑音由来抑圧係数算出部を含み、前記抑圧部は、前記定常雑音由来抑圧係数と前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧する付記1〜付記3のいずれかに記載の雑音抑圧装置。
(付記7)
前記抑圧部は、前記定常雑音由来抑圧係数が示す抑圧の度合いが予め定めた大きさより小さい場合は、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで前記抑圧係数を定め、前記定常雑音由来抑圧係数が示す抑圧の度合いが前記予め定めた大きさより大きい場合は、前記定常雑音由来抑圧係数を前記抑圧係数として定める付記6記載の雑音抑圧装置。
(付記8)
前記抑圧部は、前記入力音声信号のレベルが前記定常雑音のレベルよりも大きい場合は、前記定常雑音由来抑圧係数、前記位相差由来抑圧係数、及び前記振幅比由来抑圧係数のうち、抑圧の度合いが最も大きい係数を前記抑圧係数として定める付記6記載の雑音抑圧装置。
(付記9)
マイクアレイに含まれる複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記複数のマイクロフォンの各々から入力された目的音声及び雑音を含む入力音声信号間の周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として算出し、前記入力音声信号間の周波数毎の振幅比または振幅差に基づいて、前記入力音声信号が前記目的音声か前記雑音かを判定するための振幅条件を、前記マイク間距離、及び前記目的音声の音源の位置に基づいて算出し、算出された位相差利用範囲において、位相差に基づく位相差由来抑圧係数を周波数毎に算出し、前記振幅比または振幅差と、算出された振幅条件とに基づく振幅比由来抑圧係数を周波数毎に算出し、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧することを含む雑音抑圧方法。
(付記10)
前記位相差利用範囲内において、前記振幅比由来抑圧係数より前記位相差由来抑圧係数を優先的に用いた前記抑圧係数を定める付記9記載の雑音抑圧方法。
(付記11)
前記位相差利用範囲外において、前記振幅比由来抑圧係数を前記抑圧係数として定める付記1または付記2記載の雑音抑圧方法。
(付記12)
前記位相差由来抑圧係数と前記振幅比由来抑圧係数とを乗算した値、前記位相差由来抑圧係数と前記振幅比由来抑圧係数との平均、または前記位相差由来抑圧係数と前記振幅比由来抑圧係数との重み付和を前記抑圧係数として定める付記9記載の雑音抑圧方法。
(付記13)
前記位相差由来抑圧係数及び前記振幅比由来抑圧係数のうち、抑圧の度合いが大きい方を前記抑圧係数として定める付記9記載の雑音抑圧方法。
(付記14)
前記入力音声信号に基づいて推定した定常雑音のレベルと、前記入力音声信号のレベルとに基づいて、定常雑音由来抑圧係数を算出し、前記定常雑音由来抑圧係数と前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧することを含む付記9〜付記13のいずれかに記載の雑音抑圧方法。
(付記15)
前記定常雑音由来抑圧係数が示す抑圧の度合いが予め定めた大きさより小さい場合は、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで前記抑圧係数を定め、前記定常雑音由来抑圧係数が示す抑圧の度合いが前記予め定めた大きさより大きい場合は、前記定常雑音由来抑圧係数を前記抑圧係数として定める付記11記載の雑音抑圧方法。
(付記16)
前記入力音声信号のレベルが前記定常雑音のレベルよりも大きい場合は、前記定常雑音由来抑圧係数、前記位相差由来抑圧係数、及び前記振幅比由来抑圧係数のうち、抑圧の度合いが最も大きい係数を抑圧係数として用いて、前記入力音声信号に含まれる雑音を抑圧する付記15記載の雑音抑圧方法。
(付記17)
コンピュータに、マイクアレイに含まれる複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記複数のマイクロフォンの各々から入力された目的音声及び雑音を含む入力音声信号間の周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として算出し、前記入力音声信号間の周波数毎の振幅比または振幅差に基づいて、前記入力音声信号が前記目的音声か前記雑音かを判定するための振幅条件を、前記マイク間距離、及び前記目的音声の音源の位置に基づいて算出し、算出された位相差利用範囲において、位相差に基づく位相差由来抑圧係数を周波数毎に算出し、前記振幅比または振幅差と、算出された振幅条件とに基づく振幅比由来抑圧係数を周波数毎に算出し、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧することを含む処理を実行させるための雑音抑圧プログラム。
(付記18)
前記位相差利用範囲内において、前記振幅比由来抑圧係数より前記位相差由来抑圧係数を優先的に用いた前記抑圧係数を定める付記17記載の雑音抑圧プログラム。
(付記19)
前記位相差利用範囲外において、前記振幅比由来抑圧係数を前記抑圧係数として定める付記17または付記18記載の雑音抑圧プログラム。
(付記20)
前記位相差由来抑圧係数と前記振幅比由来抑圧係数とを乗算した値、前記位相差由来抑圧係数と前記振幅比由来抑圧係数との平均、または前記位相差由来抑圧係数と前記振幅比由来抑圧係数との重み付和を前記抑圧係数として定める付記17記載の雑音抑圧プログラム。
(付記21)
前記位相差由来抑圧係数及び前記振幅比由来抑圧係数のうち、抑圧の度合いが大きい方を前記抑圧係数として定める付記17記載の雑音抑圧プログラム。
(付記22)
前記入力音声信号に基づいて推定した定常雑音のレベルと、前記入力音声信号のレベルとに基づいて、定常雑音由来抑圧係数を算出し、前記定常雑音由来抑圧係数と前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧することを含む付記17〜付記21のいずれかに記載の雑音抑圧プログラム。
(付記23)
前記定常雑音由来抑圧係数が示す抑圧の度合いが予め定めた大きさより小さい場合は、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで前記抑圧係数を定め、前記定常雑音由来抑圧係数が示す抑圧の度合いが前記予め定めた大きさより大きい場合は、前記定常雑音由来抑圧係数を前記抑圧係数として定める付記22記載の雑音抑圧プログラム。
(付記24)
前記入力音声信号のレベルが前記定常雑音のレベルよりも大きい場合は、前記定常雑音由来抑圧係数、前記位相差由来抑圧係数、及び前記振幅比由来抑圧係数のうち、抑圧の度合いが最も大きい係数を前記抑圧係数として定める付記22記載の雑音抑圧プログラム。
(付記21)
前記位相差利用範囲に含まれる周波数では、前記位相差由来抑圧係数を優先的に用いて、前記入力音声信号に含まれる雑音を抑圧する付記15〜付記20のいずれかに記載の雑音抑圧方法。
10、210 雑音抑圧装置
11 マイクアレイ
11a マイクロフォン
11b マイクロフォン
12 位相差利用範囲算出部
14 振幅条件算出部
22 位相差算出部
24 振幅比算出部
26、226 位相差由来抑圧係数算出部
28、228 振幅比由来抑圧係数算出部
30、230 抑圧係数算出部
32 抑圧信号生成部
36 定常雑音推定部
38 定常雑音由来抑圧係数算出部
40、240 コンピュータ

Claims (10)

  1. マイクアレイに含まれる複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記複数のマイクロフォンの各々から入力された目的音声及び雑音を含む入力音声信号間の周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として算出する位相差利用範囲算出部と、
    前記入力音声信号間の周波数毎の振幅比または振幅差に基づいて、前記入力音声信号が前記目的音声か前記雑音かを判定するための振幅条件を、前記マイク間距離、及び前記目的音声の音源の位置に基づいて算出する振幅条件算出部と、
    前記位相差利用範囲算出部で算出された位相差利用範囲において、位相差に基づく位相差由来抑圧係数を周波数毎に算出する位相差由来抑圧係数算出部と、
    前記振幅比または振幅差と、前記振幅条件算出部で算出された振幅条件とに基づく振幅比由来抑圧係数を周波数毎に算出する振幅比由来抑圧係数算出部と、
    前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧する抑圧部と、
    を含む雑音抑圧装置。
  2. 前記抑圧部は、前記位相差利用範囲内において、前記振幅比由来抑圧係数より前記位相差由来抑圧係数を優先的に用いた前記抑圧係数を定める請求項1記載の雑音抑圧装置。
  3. 前記抑圧部は、前記位相差利用範囲外において、前記振幅比由来抑圧係数を前記抑圧係数として定める請求項1または請求項2記載の雑音抑圧装置。
  4. 前記抑圧部は、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とを乗算した値、前記位相差由来抑圧係数と前記振幅比由来抑圧係数との平均値、または前記位相差由来抑圧係数と前記振幅比由来抑圧係数との重み付和を前記抑圧係数として定める請求項1記載の雑音抑圧装置。
  5. 前記抑圧部は、前記位相差由来抑圧係数及び前記振幅比由来抑圧係数のうち、抑圧の度合いが大きい方を前記抑圧係数として定める請求項1記載の雑音抑圧装置。
  6. 前記入力音声信号に基づいて推定した定常雑音のレベルと、前記入力音声信号のレベルとに基づいて、定常雑音由来抑圧係数を算出する定常雑音由来抑圧係数算出部を含み、
    前記抑圧部は、前記定常雑音由来抑圧係数と前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧する
    請求項1〜請求項5のいずれか1項記載の雑音抑圧装置。
  7. 前記抑圧部は、前記定常雑音由来抑圧係数が示す抑圧の度合いが予め定めた大きさより小さい場合は、前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで前記抑圧係数を定め、前記定常雑音由来抑圧係数が示す抑圧の度合いが前記予め定めた大きさより大きい場合は、前記定常雑音由来抑圧係数を前記抑圧係数として定める請求項6記載の雑音抑圧装置。
  8. 前記抑圧部は、前記入力音声信号のレベルが前記定常雑音のレベルよりも大きい場合は、前記定常雑音由来抑圧係数、前記位相差由来抑圧係数、及び前記振幅比由来抑圧係数のうち、抑圧の度合いが最も大きい係数を前記抑圧係数として定める請求項6記載の雑音抑圧装置。
  9. マイクアレイに含まれる複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記複数のマイクロフォンの各々から入力された目的音声及び雑音を含む入力音声信号間の周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として算出し、
    前記入力音声信号間の周波数毎の振幅比または振幅差に基づいて、前記入力音声信号が前記目的音声か前記雑音かを判定するための振幅条件を、前記マイク間距離、及び前記目的音声の音源の位置に基づいて算出し、
    算出された位相差利用範囲において、位相差に基づく位相差由来抑圧係数を周波数毎に算出し、
    前記振幅比または振幅差と、算出された振幅条件とに基づく振幅比由来抑圧係数を周波数毎に算出し、
    前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧すること
    を含む雑音抑圧方法。
  10. コンピュータに、
    マイクアレイに含まれる複数のマイクロフォン間のマイク間距離、及びサンプリング周波数に基づいて、前記複数のマイクロフォンの各々から入力された目的音声及び雑音を含む入力音声信号間の周波数毎の位相差が位相回転を生じない周波数帯域を位相差利用範囲として算出し、
    前記入力音声信号間の周波数毎の振幅比または振幅差に基づいて、前記入力音声信号が前記目的音声か前記雑音かを判定するための振幅条件を、前記マイク間距離、及び前記目的音声の音源の位置に基づいて算出し、
    算出された位相差利用範囲において、位相差に基づく位相差由来抑圧係数を周波数毎に算出し、
    前記振幅比または振幅差と、算出された振幅条件とに基づく振幅比由来抑圧係数を周波数毎に算出し、
    前記位相差由来抑圧係数と前記振幅比由来抑圧係数とで定めた抑圧係数に基づいて、前記入力音声信号に含まれる雑音を抑圧すること
    を含む処理を実行させるための雑音抑圧プログラム。
JP2013004734A 2013-01-15 2013-01-15 雑音抑圧装置、方法、及びプログラム Active JP6107151B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013004734A JP6107151B2 (ja) 2013-01-15 2013-01-15 雑音抑圧装置、方法、及びプログラム
US14/103,443 US9236060B2 (en) 2013-01-15 2013-12-11 Noise suppression device and method
EP13196886.9A EP2755204B1 (en) 2013-01-15 2013-12-12 Noise suppression device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013004734A JP6107151B2 (ja) 2013-01-15 2013-01-15 雑音抑圧装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014137414A true JP2014137414A (ja) 2014-07-28
JP6107151B2 JP6107151B2 (ja) 2017-04-05

Family

ID=49911158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013004734A Active JP6107151B2 (ja) 2013-01-15 2013-01-15 雑音抑圧装置、方法、及びプログラム

Country Status (3)

Country Link
US (1) US9236060B2 (ja)
EP (1) EP2755204B1 (ja)
JP (1) JP6107151B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016127457A (ja) * 2015-01-05 2016-07-11 沖電気工業株式会社 収音装置、プログラム及び方法
JP2016127459A (ja) * 2015-01-05 2016-07-11 沖電気工業株式会社 収音装置、プログラム及び方法
EP3073489A1 (en) 2015-03-24 2016-09-28 Fujitsu Limited Noise suppression device, noise suppression method, computer program for noise suppression, and non-transitory computer-readable recording medium storing program for noise suppression
JP2020167530A (ja) * 2019-03-29 2020-10-08 沖電気工業株式会社 収音装置、収音プログラム及び収音方法
CN113038338A (zh) * 2021-03-22 2021-06-25 联想(北京)有限公司 降噪处理方法和装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016182298A (ja) * 2015-03-26 2016-10-20 株式会社東芝 騒音低減システム
US9530426B1 (en) * 2015-06-24 2016-12-27 Microsoft Technology Licensing, Llc Filtering sounds for conferencing applications
JP6559576B2 (ja) * 2016-01-05 2019-08-14 株式会社東芝 雑音抑圧装置、雑音抑圧方法及びプログラム
CN107465986A (zh) * 2016-06-03 2017-12-12 法拉第未来公司 使用多个麦克风检测和隔离车辆中的音频的方法和装置
CN106910511B (zh) * 2016-06-28 2020-08-14 阿里巴巴集团控股有限公司 一种语音去噪方法和装置
CN107742522B (zh) * 2017-10-23 2022-01-14 科大讯飞股份有限公司 基于麦克风阵列的目标语音获取方法及装置
JP7010136B2 (ja) * 2018-05-11 2022-01-26 富士通株式会社 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置
CN110047507B (zh) * 2019-03-01 2021-03-30 北京交通大学 一种声源识别方法及装置
CN111857041A (zh) * 2020-07-30 2020-10-30 东莞市易联交互信息科技有限责任公司 一种智能设备的运动控制方法、装置、设备和存储介质
CN112634931A (zh) * 2020-12-22 2021-04-09 北京声智科技有限公司 语音增强方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007135046A (ja) * 2005-11-11 2007-05-31 Sony Corp 音声信号処理装置、音声信号処理方法、プログラム
JP2009025025A (ja) * 2007-07-17 2009-02-05 Kumamoto Univ 音源方向推定装置およびこれを用いた音源分離装置、ならびに音源方向推定方法およびこれを用いた音源分離方法
JP2012529868A (ja) * 2009-06-09 2012-11-22 クゥアルコム・インコーポレイテッド マルチチャネル信号の位相ベースの処理のためのシステム、方法、装置、およびコンピュータ可読媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0739000A (ja) 1992-12-05 1995-02-07 Kazumoto Suzuki 任意の方向からの音波の選択的抽出法
JP3745227B2 (ja) 1998-11-16 2006-02-15 ザ・ボード・オブ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・イリノイ 両耳信号処理技術
JP4247195B2 (ja) * 2005-03-23 2009-04-02 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録した記録媒体
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
JP5255467B2 (ja) 2009-02-02 2013-08-07 クラリオン株式会社 雑音抑制装置、雑音抑制方法、及び、プログラム
US8897455B2 (en) 2010-02-18 2014-11-25 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
JP5387459B2 (ja) 2010-03-11 2014-01-15 富士通株式会社 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
KR101782050B1 (ko) 2010-09-17 2017-09-28 삼성전자주식회사 비등간격으로 배치된 마이크로폰을 이용한 음질 향상 장치 및 방법
EP2701143A1 (en) * 2012-08-21 2014-02-26 ST-Ericsson SA Model selection of acoustic conditions for active noise control

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007135046A (ja) * 2005-11-11 2007-05-31 Sony Corp 音声信号処理装置、音声信号処理方法、プログラム
JP2009025025A (ja) * 2007-07-17 2009-02-05 Kumamoto Univ 音源方向推定装置およびこれを用いた音源分離装置、ならびに音源方向推定方法およびこれを用いた音源分離方法
JP2012529868A (ja) * 2009-06-09 2012-11-22 クゥアルコム・インコーポレイテッド マルチチャネル信号の位相ベースの処理のためのシステム、方法、装置、およびコンピュータ可読媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6016040832; 徳竹啓佑 他: '"帯域に応じた位相差判定閾値に基づく音源分離法SAFIAによる機械雑音下音声認識"' 情報処理学会研究報告 Vol.2012-SLP-92,No.12, 20120815, pp.1-6 *
JPN6016040834; 中島栄俊 他: '"周波数領域両耳聴モデルによる音源方向推定と音源分離"' 電子情報通信学会技術研究報告 Vol.104,No.306, 20040910, pp.69-74 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016127457A (ja) * 2015-01-05 2016-07-11 沖電気工業株式会社 収音装置、プログラム及び方法
JP2016127459A (ja) * 2015-01-05 2016-07-11 沖電気工業株式会社 収音装置、プログラム及び方法
EP3073489A1 (en) 2015-03-24 2016-09-28 Fujitsu Limited Noise suppression device, noise suppression method, computer program for noise suppression, and non-transitory computer-readable recording medium storing program for noise suppression
US9691372B2 (en) 2015-03-24 2017-06-27 Fujitsu Limited Noise suppression device, noise suppression method, and non-transitory computer-readable recording medium storing program for noise suppression
JP2020167530A (ja) * 2019-03-29 2020-10-08 沖電気工業株式会社 収音装置、収音プログラム及び収音方法
CN113038338A (zh) * 2021-03-22 2021-06-25 联想(北京)有限公司 降噪处理方法和装置

Also Published As

Publication number Publication date
EP2755204A1 (en) 2014-07-16
US20140200886A1 (en) 2014-07-17
US9236060B2 (en) 2016-01-12
EP2755204B1 (en) 2018-10-10
JP6107151B2 (ja) 2017-04-05

Similar Documents

Publication Publication Date Title
JP6107151B2 (ja) 雑音抑圧装置、方法、及びプログラム
JP6020258B2 (ja) マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置
KR100883712B1 (ko) 음원 방향 추정 방법, 및 음원 방향 추정 장치
JP5528538B2 (ja) 雑音抑圧装置
US10580428B2 (en) Audio noise estimation and filtering
JP5810903B2 (ja) 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
US8891780B2 (en) Microphone array device
JP5272920B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP6668995B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
JPWO2013065088A1 (ja) 雑音抑圧装置
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP5982900B2 (ja) 雑音抑制装置、マイクロホンアレイ装置、雑音抑制方法、及びプログラム
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
US20220208206A1 (en) Noise suppression device, noise suppression method, and storage medium storing noise suppression program
JP6638248B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声信号処理装置
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置
JP6263890B2 (ja) 音声信号処理装置及びプログラム
JP6221463B2 (ja) 音声信号処理装置及びプログラム
JP6252274B2 (ja) 背景雑音区間推定装置及びプログラム
JP2017067990A (ja) 音声処理装置、プログラム及び方法
JP2017067950A (ja) 音声処理装置、プログラム及び方法
JP2015025914A (ja) 音声信号処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170220

R150 Certificate of patent or registration of utility model

Ref document number: 6107151

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150