JP6520276B2 - 雑音抑圧装置、雑音抑圧方法、及び、プログラム - Google Patents

雑音抑圧装置、雑音抑圧方法、及び、プログラム Download PDF

Info

Publication number
JP6520276B2
JP6520276B2 JP2015060628A JP2015060628A JP6520276B2 JP 6520276 B2 JP6520276 B2 JP 6520276B2 JP 2015060628 A JP2015060628 A JP 2015060628A JP 2015060628 A JP2015060628 A JP 2015060628A JP 6520276 B2 JP6520276 B2 JP 6520276B2
Authority
JP
Japan
Prior art keywords
phase difference
region
noise suppression
frequency
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015060628A
Other languages
English (en)
Other versions
JP2016181789A (ja
Inventor
智佳子 松本
智佳子 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015060628A priority Critical patent/JP6520276B2/ja
Priority to US15/066,240 priority patent/US9691372B2/en
Priority to EP16159827.1A priority patent/EP3073489B1/en
Publication of JP2016181789A publication Critical patent/JP2016181789A/ja
Application granted granted Critical
Publication of JP6520276B2 publication Critical patent/JP6520276B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
    • G10K11/341Circuits therefor
    • G10K11/346Circuits therefor using phase variation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3023Estimation of noise, e.g. on error signals
    • G10K2210/30231Sources, e.g. identifying noisy processes or components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3025Determination of spectrum characteristics, e.g. FFT
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3044Phase shift, e.g. complex envelope processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、雑音抑圧装置、雑音抑圧方法、及び、プログラムに関する。
入力信号in(t)を周波数領域に変換した後に雑音抑圧を行い、再び、時間領域に逆変換して出力信号out(t)を出力する雑音抑圧装置が知られている。
このような雑音抑圧装置は、携帯電話などの多くの種類の装置に搭載されている。近年、雑音抑圧装置を搭載する装置には、集音するためのマイクロフォン(以下、単にマイクという)が複数備えられ、マイク間の距離が広がる傾向にある。
従来の雑音抑圧方式として、振幅比を用いる方式(ビームフォーミング)が知られている(例えば、特許文献1を参照)。しかしながら、マイク間の距離が広い場合、マイクの設置位置や音道形状の影響などでマイクの感度が揃えられない。感度差が大きいマイクを使って、振幅比を用いた雑音抑圧を行うと、目的音(音声)の歪みが大きくなってしまう。
特開2014−137414号公報
一つの側面では、本発明は、マイク間の距離が広く、マイクの感度差が大きい場合でも、目的音(音声)の歪みを抑制しつつ、雑音抑圧することを可能とする雑音抑圧装置、雑音抑圧方法、及び、プログラムを提供することを課題とする。
一態様における雑音抑圧装置は、複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置であって、マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、位相差±nπ(nは偶数)位相回転させた追加データとして生成する生成手段と、位相差が位相回転を生じない周波数帯域における位相差に基づいて、周波数・位相差平面の領域であって、入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、位相差と追加データとに基づいて、選択した一又は複数の領域の中から、音源が存在する方向の領域を推定する推定手段と、音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、入力信号を抑圧した出力信号を生成する出力信号生成手段と、を備えることを特徴としている。
一態様における雑音抑圧方法は、複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置の雑音抑圧方法であって、マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、位相差±nπ(nは偶数)位相回転させた追加データとして生成し、位相差が位相回転を生じない周波数帯域における位相差に基づいて、周波数・位相差平面の領域であって、入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、位相差と追加データとに基づいて、選択した一又は複数の領域の中から、音源が存在する方向の領域を推定し、音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、入力信号を抑圧した出力信号を生成する、ことを特徴としている。
一態様におけるプログラムは、複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置のコンピュータに、マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、位相差±nπ(nは偶数)位相回転させた追加データとして生成し、位相差が位相回転を生じない周波数帯域における位相差に基づいて、周波数・位相差平面の領域であって、入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、位相差と追加データとに基づいて、選択した一又は複数の領域の中から、音源が存在する方向の領域を推定し、音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、入力信号を抑圧した出力信号を生成する、処理を実行させることを特徴としている。
一つの側面では、マイク間の距離が広く、マイクの感度差が大きい場合でも、目的音(音声)の歪みを抑制しつつ、雑音抑圧することが可能となる。
実施形態1における雑音抑圧装置の構成例を示す機能ブロック図である。 実施形態1における信号の概略的な流れを示す図である。 領域設定の第1の例について説明するための図である。 領域設定の第2の例について説明するための図である。 領域設定の第3の例について説明するための図である。 領域設定の第3の例について説明するための図である。 領域設定の第4の例について説明するための図である。 領域設定の第4の例について説明するための図である。 実施形態1における雑音抑圧処理のフローを説明するためのフローチャートの例の一部である。 実施形態1における雑音抑圧処理のフローを説明するためのフローチャートの例の他の一部である。 実施形態1における雑音抑圧処理について説明するための第1の具体例を示す図である。 第1の具体例に従って、第1音源の特定方法について説明するための図である。 第1の具体例に従って、第2音源の特定方法について説明するための図である。 第1の具体例に従って、第3音源の特定方法について説明するための図である。 実施形態1における雑音抑圧処理について説明するため第2の具体例を示す図である。 第2の具体例に従って、音源の特定方法について説明するための図である。 AとBは、いずれも、実施形態1における雑音抑圧処理の効果について説明するための図である。 実施形態2における雑音抑圧装置の構成例を示す機能ブロック図である。 実施形態2における音源が存在する領域を特定する方法について説明するための図ある。 実施形態2における音源が存在する領域を特定する方法について説明するための図ある。 各実施形態における雑音抑圧装置のハードウェア構成の例を示す図である。
以下に本発明の実施の形態について図面を参照しながら詳細に説明する。
(実施形態1)
図1は、本実施形態1における雑音抑圧装置1の構成例を示す機能ブロック図であり、図2は、本実施形態1における信号の概略的な流れを示す図である。
本実施形態1における雑音抑圧装置1は、複数のマイクロフォン(以下、単にマイクと称する)MCk(図1においては、マイクMC1とマイクMC2)より入力された入力信号ink(t)(図1においては、入力信号in1(t)と入力信号in2(t))を周波数領域に変換した後に雑音抑圧を行い、再び、時間領域に逆変換して出力信号out(t)を出力する装置である。なお、kは“2”以上の整数であり、以下、特に区別する必要がない場合には、マイクMC、入力信号in(t)と総称することとする。また、雑音抑圧装置1は、図1に示すように、入力部10と、記憶部20と、出力部30と、制御部40と、を備えている。
入力部10は、例えば、オーディオインターフェース、あるいは、音声通信モジュールなどを備えている。入力部10は、処理対象の入力信号in(t)を受け付け、受け付けた入力信号in(t)をサンプリング周波数Fsでデジタル信号に変換する。そして、入力部10は、図2に示すように、デジタル信号に変換した入力信号in(t)を、詳しくは後述する直交変換部4Bに出力する。
記憶部20は、Random Access Memory(RAM)、Read Only Memory(ROM)などを備えている。記憶部20は、制御部40が備える、例えば、Central Processing Unit(CPU)のワークエリア、雑音抑圧装置1全体を制御するための動作プログラムなどの各種プログラムを格納するプログラムエリアとして機能する。また、記憶部20は、接続されているマイクMC間の距離Dを示すマイク距離情報、サンプリング周波数Fsを示すサンプリング周波数情報、音速Cを示す音速情報、フレーム長Lを示すフレーム長情報など各種データを格納するデータエリアとして機能する。また、データエリアには、領域設定部4A(詳しくは後述)により算出された最大周波数ビンBmax(詳しくは後述)と設定された位相差領域(詳しくは後述)を示す領域情報とが格納される。
音速情報は、温度ごとの音速Cを示す情報であってもよいし、雑音抑圧装置が使用される一般的な環境の温度における音速Cを示す情報であってもよい。音速情報が温度ごとの音速Cを示す情報である場合、例えば、温度センサにより使用環境の温度を測定することで、測定した温度に対応する音速Cを特定することが可能となる。
出力部30は、例えば、オーディオインターフェース、あるいは、音声通信モジュールなどを備え、雑音抑圧後の出力信号out(t)を出力する。
制御部40は、例えば、CPUなどを備え、記憶部20のプログラムエリアに格納されている動作プログラムを実行して、図1に示すように、領域設定部4Aと、直交変換部4Bと、位相差算出部4Cと、追加データ算出部4Dと、領域選択部4Eと、特定部4Fと、抑圧係数算出部4Gと、抑圧処理部4Hと、逆直交変換部4Iとしての機能を実現する。また、制御部40は、動作プログラムを実行して、雑音抑圧装置1全体を制御する制御処理や詳しくは後述の雑音抑圧処理などの処理を実行する。
領域設定部4Aは、周波数ビン・位相差平面上に境界線で画定された複数の位相差の領域(以下、位相差領域という)を設定する。また、領域設定部4Aは、記憶部20のデータエリアに格納されている音速情報とマイク距離情報を取得し、以下の式1にしたがって、位相回転が生じない最大周波数Fmaxを算出する。
そして、領域設定部4Aは、記憶部20のデータエリアに格納されているフレーム長情報とサンプリング周波数情報とを取得し、以下の式2にしたがって、最大周波数Fmaxを最大周波数ビンBmaxに変換する。つまり、Bmaxは最大周波数Fmaxを周波数ビンで表したものである。
そして、領域設定部4Aは、設定した位相差領域を示す領域情報と算出した最大周波数Fmaxを周波数ビンで表した最大周波数ビンBmaxを記憶部20のデータエリアに格納する。領域情報は、例えば、各位相差領域を画定する境界線BLの情報であってもよい。
例えば、音速Cが340m/s、マイク間の距離Dが0.1m、サンプリング周波数Fsが8kHz、フレーム長Lが256である場合には、Fmax=340/0.2=1,700Hzとなり、Bmax=1700×256/8000≒54.4ビンとなる。
以下に、図3乃至8を参照して、領域設定部4Aにより設定される位相差領域の幾つかの例について説明する。図3は、領域設定の第1の例について説明するための図である。図3を参照して、本第1の例では、隣接する2本の境界線BLで各位相差領域が画定されており、各位相差領域を画定する2本の境界線BLがなす角の角度は全て等しく設定されている。この場合、周波数をx軸、位相差をy軸として、領域設定部4Aは、例えば、y=αxで表される直線で各境界線BLを定義することで、各位相差領域を設定してもよい。例えば、各境界線BLを表す直線y=αxの傾きαを、α=0.01×a(aは整数)のように定義してもよい。この際、領域設定部4Aは、傾きαの最大値αmaxを算出し、傾きαの絶対値|α|が最大値αmaxを超えないように境界線BLを定義してもよい。
ここで、最大値αmaxは、位相回転が生じない最大周波数Fmaxを周波数ビンで表した最大周波数ビンBmaxで“π”となる直線y=αxの傾きである。したがって、領域設定部4Aは、式2を用いて、以下の式3にしたがって、最大値αmaxを算出することができる。
例えば、音速Cが340m/s、マイク間の距離Dが0.1m、サンプリング周波数Fsが8kHz、フレーム長Lが256である場合には、αmax=3.14/54.4≒0.058となる。したがって、この場合、領域設定部4Aは、図3に示すように、11本の境界線BLにより位相差領域を設定する。
図4は、領域設定の第2の例について説明するための図である。図4を参照して、本第2の例では、隣接する2本の境界線BLで各位相差領域が画定されており、各位相差領域を画定する2本の境界線BLがなす角の角度は、位相差が“0”に近い領域ほど小さくなるように設定されている。この際、上述の第1の例の場合と同様に、領域設定部4Aは、傾きαの絶対値|α|が最大値αmaxを超えないように境界線BLを定義してもよい。
図5と図6は、いずれも、領域設定の第3の例について説明するための図である。図5を参照して、本第3の例では、隣接する位相差領域と一部が重なり合うように各位相差領域が設定されている。この場合、例えば、領域設定部4Aは、図6に示すように、各位相差領域を画定する下限境界線BLの傾きα1と上限境界線BLの傾きα2を設定することで、隣接する位相差領域と一部が重なり合うように各位相差領域を設定することができる。この際、第1の例の場合と同様に、領域設定部4Aは、傾きαの絶対値|α|が最大値αmaxを超えないように境界線BLを定義してもよい。このように、隣接する位相差領域と一部が重なり合うように各位相差領域を設定することで、境界線上のデータをいずれかの位相差領域に含めて扱うことができるため、音源が存在する位相差領域の推定精度を向上させることができる。
図7と図8は、いずれも、領域設定の第4の例について説明するための図である。図7を参照して、本第4の例では、位相差領域を画定する境界線BLを表す直線の内の少なくとも一部の直線のy切片βが“0”以外に設定されている。領域設定部4Aは、例えば、図8に示す傾きαとy切片βの組により定義される直線y=αx+βを各境界線BLとすることで、y切片βが“0”以外に設定されている境界線BLを一部に含む境界線BLにより各位相差領域を設定することができる。なお、各位相差領域をy切片βが“0”以外の直線で表される境界線BLで画定する方法は、上述の第1乃至第3の例のいずれに対しても適用することができる。
図1と図2に戻り、直交変換部4Bは、入力されたデジタル変換後の入力信号in(t)をそれぞれフレーム分割する。そして、直交変換部4Bは、フレーム分割された各入力信号in(t)に対し、例えば、高速フーリエ変換(Fast Fourier Transform:FFT)などの直交変換を用いて、フレームごとに周波数領域の信号に変換し、振幅スペクトル|X(f)|と位相スペクトルargX(f)とからなる入力スペクトルX(f)を周波数(周波数ビン)ごとに生成する。そして、直交変換部4Bは、図2に示すように、生成した振幅スペクトル|X(f)|を抑圧処理部4Hに出力すると共に、位相スペクトルargX(f)を、位相差算出部4Cと逆直交変換部4Iにそれぞれ出力する。
位相差算出部4Cは、同じ周波数(つまり、同じ周波数ビン)の位相スペクトルargX(f)の差分を位相差としてそれぞれ算出する。そして、位相差算出部4Cは、図2に示すように、算出した位相差を追加データ算出部4Dと領域選択部4Eと特定部4Fにそれぞれ出力する。
追加データ算出部4Dは、入力された周波数(周波数ビン)ごとの位相差に基づいて、位相差±nπ(nは偶数)を追加データとしてそれぞれ算出する。つまり、追加データ算出部4Dは、位相差をそれぞれ位相回転させた追加データを生成する。そして、追加データ算出部4Dは、図2に示すように、算出した追加データを特定部4Fに出力する。ここで、偶数nは、以下の式4により定義されている。
例えば、音速Cが340m/s、マイク間の距離Dが0.1m、サンプリング周波数Fsが8kHzである場合、n={(8000x0.1/340)−1=1.35≦nを満たす最小の偶数}、つまり、n=2となる。したがって、この場合、追加データ算出部4Dは、位相差±2πを追加データとしてそれぞれ算出する。
領域選択部4Eは、位相回転が生じない周波数帯域において、入力された位相差に基づいて、音源が存在する確率が高い位相差領域を選択する。より具体的には、領域選択部4Eは、記憶部20のデータエリアに格納されている領域情報と位相回転が生じない最大周波数Fmaxを周波数ビンで表した最大周波数ビンBmaxを取得する。そして、領域選択部4Eは、位相回転が生じない周波数帯域において、位相差が多く存在する位相差領域を1以上選択する。そして、領域選択部4Eは、図2に示すように、選択結果を特定部4Fに出力する。
例えば、領域選択部4Eは、位相回転が生じない周波数帯域において、位相差が最も多く存在する位相差領域を選択すると共に、位相差が最も多く存在する位相差領域における位相差の数と存在する位相差の数との差分が所定の第1閾値Z1以上の位相差領域を選択するようにしてもよい。また、例えば、領域選択部4Eは、位相回転が生じない周波数帯域において、位相差が最も多く存在する位相差領域を選択すると共に、位相差が最も多く存在する位相差領域における位相差の数に対する、存在する位相差の数の比が所定の第2閾値Z2以上の位相差領域を選択するようにしてもよい。
特定部4Fは、領域選択部4Eにより選択された位相差領域の中から、音源が存在する位相差領域、つまり、音源方向の領域を特定する。より具体的には、特定部4Fは、領域選択部4Eにより選択された位相差領域の中から、全周波数帯域において、位相差と位相差±nπ(追加データ)が所定の第3閾値Z3より多く存在する位相差領域を特定する。この際、位相差と位相差±nπ(追加データ)が所定の第3閾値Z3より多く存在する位相差領域が特定できない場合には、特定部4Fは、領域選択部4Eにより選択された音源が存在すると推定される位相差領域の中から、全周波数帯域において、位相差と位相差±nπ(追加データ)が最も多く存在する位相差領域を特定する。つまり、位相回転が生じない低周波数帯域での位相差の精度が悪いために、複数の位相差領域が選択された場合であっても、位相差と位相差±nπ(追加データ)が所定の第3閾値Z3より多く存在する位相差領域を特定することで、音源が存在する確率が最も高い位相差領域を絞り込むことができる。そして、特定部4Fは、図2に示すように、特定結果を抑圧係数算出部4Gに出力する。
抑圧係数算出部4Gは、音の音源が推定された音源方向の領域(推定された位相差領域)内に存在するか否かを判定し、判定結果に応じて、入力信号in(t)から雑音を抑圧するための抑圧係数G(f)を周波数(周波数ビン)ごとに算出する。より具体的には、抑圧係数算出部4Gは、位相回転が生じない周波数帯域を除く中高周波数帯域、つまり、位相回転が生じない最大周波数Fmaxより大きい中高周波数帯域において、位相差と追加データの内のいずれかが特定部4Fにより特定された位相差領域に含まれるか否かを判定する。この際、抑圧係数算出部4Gは、全周波数帯域において、位相差と追加データの内のいずれかが特定部4Fにより特定された位相差領域に含まれるか否かを判定するようにしてもよい。あるいは、抑圧係数算出部4Gは、位相回転が生じない最大周波数Fmaxより大きい中高周波数帯域においては、位相差と追加データの内のいずれかが特定部4Fにより特定された位相差領域に含まれるか否かを判定し、位相回転が生じない最大周波数Fmax以下の低周波数帯域においては、位相差が特定部4Fにより特定された位相差領域に含まれるか否かを判定するようにしてもよい。
そして、抑圧係数算出部4Gは、位相差と追加データの内のいずれかが位相差領域に含まれる場合には、抑圧係数G(f)=1.0とし、一方、位相差と追加データのいずれもが特定部4Fにより特定された位相差領域に含まれない場合には、抑圧係数G(f)=Gminとする。Gminは0<Gmin<1を満たす値であり、抑圧量に応じて設定される。そして、抑圧係数算出部4Gは、図2に示すように、周波数(周波数ビン)ごとに算出した抑圧係数G(f)を抑圧処理部4Hに出力する。
なお、特定部4Fにより特定された位相差領域が複数存在する場合には、抑圧係数算出部4Gは、特定された位相差領域のそれぞれに対して、音の音源が当該位相差領域内に存在するか否かを判定し、判定結果に応じて、入力信号in(t)から雑音を抑圧するための抑圧係数G(f)を周波数(周波数ビン)ごとに算出する。つまり、第1位相差領域と第2位相差領域が特定部4Fにより特定された場合には、抑圧係数算出部4Gは、第1位相差領域に対応する抑圧係数G(f)と第2位相差領域に対応する抑圧係数G(f)を算出する。
抑圧処理部4Hは、入力された振幅スペクトル|X(f)|に入力された抑圧係数G(f)を乗算して、以下の式5に示す抑圧後の振幅スペクトル|Y(f)|を周波数(周波数ビン)ごとに算出する。そして、抑圧処理部4Hは、図2に示すように、算出した抑圧後の振幅スペクトル|Y(f)|を逆直交変換部4Iに出力する。なお、特定部4Fにより特定された位相差領域が複数存在する場合には、抑圧処理部4Hは、特定された位相差領域のそれぞれに対して、振幅スペクトル|X(f)|に対応する抑圧係数G(f)を乗算して、抑圧後の振幅スペクトル|Y(f)|を周波数(周波数ビン)ごとに算出する。
逆直交変換部4Iは、入力された位相スペクトルargX(f)と抑圧後の振幅スペクトル|Y(f)|を逆直交変換して、時間領域における出力信号out(t)を生成する。そして、逆直交変換部4Iは、図2に示すように、出力部30を介して、生成した出力信号out(t)を出力する。
なお、特定部4Fにより特定された位相差領域が複数存在する場合には、逆直交変換部4Iは、特定された位相差領域のそれぞれに対して、入力された位相スペクトルargX(f)と対応する抑圧後の振幅スペクトル|Y(f)|を逆直交変換して、時間領域における出力信号out(t)を生成する。つまり、特定部4Fにより特定された位相差領域が複数存在する場合には、特定された位相差領域のそれぞれに対して、他の領域が音源となる音を抑圧した出力信号out(t)がそれぞれ生成される。そして、この場合、逆直交変換部4Iは、例えば、ユーザにより選択された一の出力信号out(t)を、出力部30を介して出力する。
次に、図9と図10を参照して、本実施形態1における雑音抑圧処理の流れについて説明する。図9と図10は、それぞれ、本実施形態1における雑音抑圧処理のフローを説明するためのフローチャートの例の一部と他の一部である。本雑音抑圧処理は、入力信号in(t)の入力をトリガとして開始される。
直交変換部4Bは、入力された入力信号in(t)を直交変換処理して、振幅スペクトル|X(f)|と位相スペクトルargX(f)とからなる入力スペクトルX(f)を周波数(周波数ビン)ごとに生成する(ステップS001)。そして、直交変換部4Bは、生成した振幅スペクトル|X(f)|を抑圧処理部4Hに出力すると共に(ステップS002)、位相スペクトルargX(f)を、位相差算出部4Cと逆直交変換部4Iにそれぞれ出力する(ステップS003)。
そして、位相差算出部4Cは、同じ周波数(つまり、同じ周波数ビン)の位相スペクトルargX(f)の差分を位相差としてそれぞれ算出する(ステップS004)。そして、位相差算出部4Cは、算出した位相差を追加データ算出部4Dと領域選択部4Eと特定部4Fにそれぞれ出力する(ステップS005)。
そして、領域選択部4Eは、位相回転が生じない周波数帯域において、入力された位相差に基づいて、音源が存在する確率が高い位相差領域を選択する(ステップS006)。そして、領域選択部4Eは、選択結果を特定部4Fに出力する(ステップS007)。
そして、追加データ算出部4Dは、入力された周波数(周波数ビン)ごとの位相差に基づいて、位相差±nπ(追加データ)をそれぞれ算出する(ステップS008)。そして、追加データ算出部4Dは、算出した追加データを特定部4Fに出力する(ステップS009)。
そして、特定部4Fは、領域選択部4Eにより選択された位相差領域の中から、音源が存在する位相差領域を特定する(ステップS010)。本実施形態1においては、特定部4Fは、領域選択部4Eにより選択された位相差領域の中から、位相差と位相差±nπ(追加データ)が所定の第3閾値Z3より多く存在する位相差領域を特定する。そして、特定部4Fは、特定結果を抑圧係数算出部4Gに出力する(ステップS011)。
そして、抑圧係数算出部4Gは、入力信号in(t)から雑音を抑圧するための抑圧係数G(f)を周波数(周波数ビン)ごとに算出し、算出した抑圧係数G(f)を抑圧処理部4Hに出力する(ステップS012)。
そして、抑圧処理部4Hは、振幅スペクトル|X(f)|に抑圧係数G(f)を乗算して、抑圧後の振幅スペクトル|Y(f)|を周波数(周波数ビン)ごとに算出する(ステップS013)。そして、抑圧処理部4Hは、算出した抑圧後の振幅スペクトル|Y(f)|を逆直交変換部4Iに出力する(ステップS014)。
そして、逆直交変換部4Iは、位相スペクトルargX(f)と抑圧後の振幅スペクトル|Y(f)|を逆直交変換して、時間領域における出力信号out(t)を生成する(ステップS015)。そして、逆直交変換部4Iは、出力部30を介して、生成した出力信号out(t)を出力する(ステップS016)。
そして、制御部40は、未処理の入力信号in(t)が有るか否かを判定する(ステップS017)。制御部40により、未処理の入力信号in(t)が有ると判定された場合には(ステップS017;YES)、処理はステップS001の処理へと戻り、前述の処理を繰り返す。一方、制御部40により、未処理の入力信号in(t)は無いと判定された場合には(ステップS018;NO)、本処理は終了する。
次に、図11乃至図16を参照して、具体例にしたがって、音源が存在する確率が最も高い位相差領域の特定方法について更に説明する。
図11は、本実施形態1における雑音抑圧処理について説明するための第1の具体例を示す図である。第1の具体例では、図11に示すように、3つの音源(第1音源S−A、第2音源S−B、第3音源S−C)が存在しており、第1音源S−Aは境界線BL1と境界線BL2とに挟まれている領域である位相差領域(2−1)に、第2音源S−Bは境界線BL2と境界線BL3とに挟まれている領域である位相差領域(2−2)に、第3音源S−Cは境界線BL5と境界線BL6とに挟まれている領域である位相差領域(2−5)に、それぞれ存在しているものとする。また、第1の具体例では、各音源からの発音は非同時であり、n=2であるものとする。
図12は、第1の具体例に従って、第1音源S−Aの特定方法について説明するための図である。図13は、第1の具体例に従って、第2音源S−Bの特定方法について説明するための図である。図14は、第1の具体例に従って、第3音源S−Cの特定方法について説明するための図である。
なお、図12乃至図14と図16中の、黒点は位相差算出部4Cにより算出された位相差を示し、グレー点は位相差±2π、つまり、追加データを示している。また、◆はある時点における位相差を示し、△はある時点における位相差+2πを示し、▽はある時点における位相差−2πを示している。また、図12乃至図14と図16中の領域DMは、位相回転が生じない領域を示している。
まず、図12を参照して、第1音源S−Aの特定方法について説明する。本第1の具体例では、図12に示すように、位相回転が生じない周波数帯域において、境界線BL1と境界線BL2とに挟まれた位相差領域(2−1)における位相差が最も多いことから、領域選択部4Eは、位相差領域(2−1)を選択する。なお、本第1の具体例では、図12に示すように、他の位相差領域にはほとんど位相差が存在していないことから、領域選択部4Eは、位相差領域(2−1)のみを選択するものとする。したがって、この場合、特定部4Fは、位相差と位相差±nπ(追加データ)が最も多く存在する位相差領域として、位相差領域(2−1)を特定する。このように、特定部4Fは、領域選択部4Eと連係して、第1音源S−Aが存在する位相差領域(2−1)を推定することができる。
次に、図13を参照して、第2音源S−Bの特定方法について説明する。本第1の具体例では、図13に示すように、位相回転が生じない周波数帯域において、境界線BL2と境界線BL3とに挟まれた位相差領域(2−2)における位相差が最も多いことから、領域選択部4Eは、位相差領域(2−2)を選択する。ここで、本第1の具体例では、境界線BL3と境界線BL4とに挟まれた位相差領域(2−3)が上述の所定の条件を満たすとする。この場合、領域選択部4Eは、位相差領域(2−2)と共に、位相差領域(2−3)も選択する。
ここで、位相差と追加データのいずれかが所定の第3閾値Z3より多く存在する位相差領域が位相差領域(2−2)のみであるとする。この場合、特定部4Fは、位相差領域(2−2)と位相差領域(2−3)の内で、位相差領域(2−2)を特定する。このように、特定部4Fは、領域選択部4Eと連係して、第2音源S−Bが存在する位相差領域(2−2)を推定することができる。
次に、図14を参照して、第3音源S−Cの特定方法について説明する。本第1の具体例では、図14に示すように、位相回転が生じない周波数帯域において、境界線BL5と境界線BL6とに挟まれた位相差領域(2−5)における位相差が最も多いことから、領域選択部4Eは、位相差領域(2−5)を選択する。ここで、本第1の具体例では、境界線BL4と境界線BL5とに挟まれた位相差領域(2−4)が上述の所定の条件を満たすとする。この場合、領域選択部4Eは、位相差領域(2−5)と共に、位相差領域(2−4)も選択する。
ここで、位相差と追加データのいずれかが所定の第3閾値Z3より多く存在する位相差領域が位相差領域(2−5)のみであるとする。この場合、特定部4Fは、位相差領域(2−4)と位相差領域(2−5)の内で、位相差領域(2−5)を特定する。このように、特定部4Fは、領域選択部4Eと連係して、第3音源S−Cが存在する位相差領域(2−5)を推定することができる。
図15は、本実施形態1における雑音抑圧処理について説明するための第2の具体例を示す図である。第2の具体例では、図15に示すように、2つの音源(第1音源S−A、第2音源S−B)が存在しており、第1音源S−Aは位相差領域(2−1)に、第2音源S−Bは位相差領域(2−4)に、それぞれ存在しているものとする。また、第2の具体例では、各音源からの発音は同時であり、n=2であるものとする。図16は、第2の具体例に従って、音源の特定方法について説明するための図である。
本第2の具体例では、図16に示すように、位相回転が生じない周波数帯域において、位相差領域(2−1)における位相差が最も多いことから、領域選択部4Eは、位相差領域(2−1)を選択する。ここで、本第2の具体例では、位相差領域(2−4)が上述の所定の条件を満たすとする。この場合、領域選択部4Eは、位相差領域(2−1)と共に、位相差領域(2−4)も選択する。
ここで、位相差領域(2−1)と位相差領域(2−4)のいずれもが、位相差と追加データのいずれかが所定の第3閾値Z3より多く存在する位相差領域であるとする。この場合、特定部4Fは、位相差領域(2−1)と位相差領域(2−4)の2つを、音源が存在する領域として特定する。このように、特定部4Fは、領域選択部4Eと連係して、第1音源S−Aが存在する位相差領域(2−1)と第2音源S−Bが存在する位相差領域(2−4)を推定することができる。つまり、同時に複数の音源から発音される場合であっても、音源が存在する各位相差領域を推定することができる。
次に、図17を参照して、本実施形態1における雑音抑圧技術を適用した場合の効果について説明する。図17Aと図17Bは、いずれも、本実施形態1における雑音抑圧処理の効果について説明するための図である。なお、本評価時の条件は、以下の通りである。(条件1)音響ブースの中で、一辺が約2mの正方形の中心にマイクアレイを設置。
(条件2)雑音は正方形の各頂点に設置した4本のスピーカから出力。
(条件3)目的音はマイクアレイから約0.1m離れた位置で出力。
(条件4)マイク間の距離Dは約0.1mであり、マイク感度差が大きい。
図17Aに示すように、特開2014−137314号公報において提案されている位相差と振幅比を用いて雑音抑圧する従来技術1では、位相回転が生じない最大周波数Fmax以下の低周波数帯域と最大周波数Fmaxより大きい中高周波数帯域のいずれにおいても雑音抑圧は可能であるが、詳しくは後述するように、雑音抑圧後の出力信号out(t)に歪みが生じてしまう。また、位相差のみを用いて雑音抑圧する従来技術2では、詳しくは後述するように、従来技術1と比較して、雑音抑圧後の出力信号out(t)に生ずる歪みは少ないが、最大周波数Fmaxより大きい中高周波数帯域において雑音抑圧ができない。
これらに対して、本実施形態1における雑音抑圧技術では、最大周波数Fmax以下の低周波数帯域と最大周波数Fmaxより大きい中高周波数帯域のいずれにおいても雑音抑圧は可能であり、詳しくは後述するように、従来技術1と比較して、雑音抑圧後の出力信号out(t)に生ずる歪みも少なくなる。
図17Bは、定常雑音抑圧量がほぼ同じになるように調整した場合における、本評価時の実際の抑圧量の一例を示している。図17Bに示す例では、本実施形態1における雑音抑圧技術の非定常雑音抑圧量が6.7(dB)と最も大きいことから、最も雑音抑圧精度が高い。また、従来技術1の音声抑圧量3.7(dB)と比較して、本実施形態1における雑音抑圧技術の音声抑圧量は1.7(dB)と非常に小さいことから、雑音抑圧後の出力信号out(t)に生ずる歪みも少ない。
上記実施形態1によれば、雑音抑圧装置1は、複数のマイクMCからの入力信号間の周波数ごとの位相差に基づいて、位相差をそれぞれ位相回転させた追加データを生成する。そして、雑音抑圧装置1は、位相差が位相回転を生じない周波数帯域における位相差に基づいて、入力信号に含まれる目的音の音源が存在する確率の高い方向の位相差領域を一又は複数選択する。そして、雑音抑圧装置1は、位相差と追加データとに基づいて、選択した一又は複数の位相差領域の中から、音源が存在する方向の位相差領域を推定する。そして、雑音抑圧装置1は、音源が存在する位相差領域からの音であるか否かに応じて設定される抑圧係数G(f)に基づいて、入力信号in(t)を抑圧した出力信号out(t)を生成する。このようにすることで、マイク間の距離が広く、マイクの感度差が大きい場合でも、目的音(音声)の歪みを抑制しつつ、雑音抑圧することが可能となる。
(実施形態2)
実施形態1においては、雑音抑圧装置1は、隣接する2本の境界線BLで挟まれた位相差領域の中から、音源が存在する領域を推定した。本実施形態2においては、領域選択部4Eが複数の位相差領域を選択し、領域選択部4Eにより選択された位相差領域の中に、特定部4Fが特定した位相差領域と隣接する位相差領域が有る場合には、特定部4Fは、その隣接する位相差領域の内で、位相回転が生じない最大周波数Fmax以下の低周波数帯域の領域も、音源が存在する領域として特定する。このようにすることで、位相差の精度が悪い低周波数帯域では位相差領域を広く、位相差の精度が良い中高周波数帯域では位相差領域を狭く設定することが可能となる。したがって、雑音抑圧の精度を向上させることができる。
図18は、本実施形態2における雑音抑圧装置1の構成例を示す機能ブロック図である。本実施形態2における雑音抑圧装置1の基本的な構成は、実施形態1の場合と同じである。しかしながら、図18に示すように、特定部4Fは第1特定部4F1と第2特定部4F2とから成る点で、実施形態1と異なっている。
特定部4Fは、領域選択部4Eにより選択された位相差領域の中から、音源が存在する位相差領域を特定する。本実施形態2における第1特定部4F1は、実施形態1における特定部4Fに相当する機能部である。第2特定部4F2は、領域選択部4Eにより選択された位相差領域が複数有る場合に、選択された位相差領域の中に、第1特定部4F1により特定された位相差領域に隣接する位相差領域が存在するか否かを判定する。選択された位相差領域の中に、第1特定部4F1により特定された位相差領域に隣接する位相差領域が存在する場合には、第2特定部4F2は、第1特定部4F1により特定された位相差領域に隣接する位相差領域の内で、位相回転が生じない最大周波数Fmax以下の低周波数帯域の位相差領域を、音源が存在する位相差領域として特定する。
図19と図20を参照して、具体例にしたがって、本実施形態2における音源が存在する位相差領域の特定方法について説明する。図19と図20は、いずれも、本実施形態2における音源が存在する領域を特定する方法について説明するための図ある。
本具体例では、領域選択部4Eは、位相差領域(2−2)と位相差領域(2−3)を選択し、第1特定部4F1は、位相差領域(2−2)と位相差領域(2−3)の内で位相差領域(2−2)を特定するものとする。この場合、図20に示すように、位相差領域(2−3)は位相差領域(2−2)に隣接していることから、第2特定部4F1は、位相差領域(2−3)の内で、位相回転が生じない最大周波数Fmax以下の低周波数帯域の位相差領域(3−3)を、音源が存在する位相差領域として特定する。つまり、この場合、特定部4Fは、図20に示すように、位相差領域(2−2)と位相差領域(3−3)を、音源が存在する位相差領域として特定する。
上記実施形態2によれば、雑音抑圧装置1は、音源が存在する確率が高い位相差領域を選択し、選択した位相差領域の中から、音源が存在する位相差領域を特定する。そして、選択した位相差領域が複数有り、且つ、選択した位相差領域の中に特定した位相差領域に隣接する位相領域が有る場合には、雑音抑圧装置1は、特定した位相差領域に隣接する位相領域の内で、位相回転が生じない最大周波数Fmax以下の低周波数帯域の位相差領域も、音源が存在する位相差領域として特定する。このようにすることで、位相差の精度が悪い低周波数帯域では位相差領域を広く、位相差の精度が良い中高周波数帯域では位相差領域を狭く設定することが可能となる。したがって、雑音抑圧の精度を向上させることができる。
図21は、各実施形態における雑音抑圧装置1のハードウェア構成の例を示す図である。図1などに示す雑音抑圧装置1は、例えば、図21に示す各種ハードウェアにより実現されてもよい。図21の例では、雑音抑圧装置1は、CPU201、RAM202、ROM203、HDD204、マイクMCなどを接続するためのオーディオインターフェース205、読取装置206を備え、これらのハードウェアはバス207を介して接続されている。
CPU201は、HDD204に格納されている動作プログラムをRAM202にロードし、RAM202をワーキングメモリとして使いながら各種処理を実行する。CPU201は、動作プログラムを実行することで、図1などに示す制御部40の各機能部を実現することができる。
なお、上記動作を実行するための動作プログラムを、フレキシブルディスク、Compact Disk−Read Only Memory(CD−ROM)、Digital Versatile Disk(DVD)、Magneto Optical disk(MO)などのコンピュータで読み取り可能な記録媒体208に記憶して配布し、これを雑音抑圧装置1の読取装置206で読み取ってコンピュータにインストールすることにより、上述の処理を実行するようにしてもよい。さらに、インターネット上のサーバ装置が有するディスク装置等に動作プログラムを記憶しておき、通信モジュール(不図示)を介して、雑音抑圧装置1のコンピュータに動作プログラムをダウンロード等するものとしてもよい。
なお、実施形態に応じて、RAM202、ROM203、HDD204以外の他の種類の記憶装置が利用されてもよい。例えば、雑音抑圧装置1は、Content Addressable Memory(CAM)、Static Random Access Memory(SRAM)、Synchronous Dynamic RAM(SDRAM)などの記憶装置を有してもよい。
なお、実施形態に応じて、雑音抑圧装置1のハードウェア構成は図21とは異なっていてもよく、図21に例示した規格・種類以外のその他のハードウェアを雑音抑圧装置1に適用することもできる。
例えば、図1などに示す雑音抑圧装置1の制御部40の各機能部は、ハードウェア回路により実現されてもよい。具体的には、CPU201の代わりに、Field Programmable Gate Array(FPGA)などのリコンフィギュラブル回路や、Application Specific Integrated Circuit(ASIC)やDigital Signal Processor(DSP)などにより、図1などに示す制御部40の各機能部が実現されてもよい。もちろん、CPU201とハードウェア回路の双方により、これらの機能部が実現されてもよい。
以上において、いくつかの実施形態について説明した。しかしながら、実施形態は上記の実施形態に限定されるものではなく、上述の実施形態の各種変形形態及び代替形態を包含するものとして理解されるべきである。例えば、各種実施形態は、その趣旨及び範囲を逸脱しない範囲で構成要素を変形して具体化できることが理解されよう。また、前述した実施形態に開示されている複数の構成要素を適宜組み合わせることにより、種々の実施形態を成すことができることが理解されよう。更には、実施形態に示される全構成要素からいくつかの構成要素を削除して又は置換して、或いは実施形態に示される構成要素にいくつかの構成要素を追加して種々の実施形態が実施され得ることが当業者には理解されよう。
以上の実施形態1と2を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置であって、
前記マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、前記位相差をそれぞれ位相回転させた追加データを生成する生成手段と、
前記位相差が位相回転を生じない周波数帯域における前記位相差に基づいて、周波数・位相差平面の領域であって、前記入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、前記位相差と前記追加データとに基づいて、選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定する推定手段と、
前記音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、前記入力信号を抑圧した出力信号を生成する出力信号生成手段と、
を備える、
ことを特徴とする雑音抑圧装置。
(付記2)
前記推定手段は、前記位相差が位相回転を生じない周波数帯域における前記位相差の数に基づいて、前記周波数・位相差平面上の領域を選択する、
こと特徴とする付記1に記載の雑音抑圧装置。
(付記3)
前記推定手段は、全周波数帯域での前記領域に存在する前記位相差と前記追加データの数に基づいて、前記選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定する、
ことを特徴とする付記1又は2に記載の雑音抑圧装置。
(付記4)
前記推定手段は、選択した前記領域の中に、推定した前記領域と隣接する領域が存在する場合には、前記隣接する領域における前記位相差が位相回転を生じない周波数帯域の領域も、目的音の音源が存在する方向の領域とする、
ことを特徴とする付記1乃至3のいずれか一に記載の雑音抑圧装置。
(付記5)
前記音源が存在する領域からの音であるか否かに応じて、前記抑圧係数を算出する算出手段を、更に、備える、
ことを特徴とする付記1乃至4のいずれか一に記載の雑音抑圧装置。
(付記6)
前記算出手段は、前記位相差が位相回転を生じない周波数帯域を除く周波数帯域において、前記位相差と前記追加データのいずれかが推定された前記領域に含まれるか否かを判定することで、前記音源が存在する領域からの音であるか否かを判定する、
ことを特徴とする付記5に記載の雑音抑圧装置。
(付記7)
前記算出手段は、前記位相差が位相回転を生じない周波数帯域では、前記位相差が推定された前記領域に含まれるか否かを判定し、前記位相差が位相回転を生じない周波数帯域を除く周波数帯域では、前記位相差と前記追加データのいずれかが推定された前記領域に含まれるか否かを判定することで、前記音源が存在する領域からの音であるか否かを判定する、
ことを特徴とする付記5に記載の雑音抑圧装置。
(付記8)
前記周波数・位相差平面の前記位相差の方向を複数に分割する複数の領域を設定する設定手段を、更に、備える、
ことを特徴とする付記1乃至7のいずれか一に記載の雑音抑圧装置。
(付記9)
前記設定手段は、前記周波数・位相差平面の前記位相差の方向を等間隔に分割する複数の領域を設定する、
ことを特徴とする付記8に記載の雑音抑圧装置。
(付記10)
前記設定手段は、前記位相差の絶対値が大きくなるにしたがって、前記周波数・位相差平面の前記位相差の方向をより広い間隔で分割する複数の領域を設定する、
ことを特徴とする付記8に記載の雑音抑圧装置。
(付記11)
前記設定手段は、隣接する領域の一部とそれぞれ重複するように前記複数の領域を設定する、
ことを特徴とする付記8乃至10のいずれか一に記載の雑音抑圧装置。
(付記12)
前記設定手段は、前記周波数が小さくなるにしたがって、前記領域の前記位相差の方向の幅が狭くなるように、前記複数の領域を設定する、
ことを特徴とする付記8乃至11のいずれか一に記載の雑音抑圧装置。
(付記13)
複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置の雑音抑圧方法であって、
前記マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、前記位相差をそれぞれ位相回転させた追加データを生成し、
前記位相差が位相回転を生じない周波数帯域における前記位相差に基づいて、周波数・位相差平面の領域であって、前記入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、
前記位相差と前記追加データとに基づいて、選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定し、
前記音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、前記入力信号を抑圧した出力信号を生成する、
ことを特徴とする雑音抑圧方法。
(付記14)
複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置のコンピュータに、
前記マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、前記位相差をそれぞれ位相回転させた追加データを生成し、
前記位相差が位相回転を生じない周波数帯域における前記位相差に基づいて、周波数・位相差平面の領域であって、前記入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、
前記位相差と前記追加データとに基づいて、選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定し、
前記音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、前記入力信号を抑圧した出力信号を生成する、
処理を実行させる、
ことを特徴とするプログラム。
(付記15)
複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置のコンピュータに、
前記マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、前記位相差をそれぞれ位相回転させた追加データを生成し、
前記位相差が位相回転を生じない周波数帯域における前記位相差に基づいて、周波数・位相差平面の領域であって、前記入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、
前記位相差と前記追加データとに基づいて、選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定し、
前記音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、前記入力信号を抑圧した出力信号を生成する、
処理を実行させるプログラムを記憶した記録媒体。
1 雑音抑圧装置
10 入力部
20 記憶部
30 出力部
40 制御部
4A 領域設定部
4B 直交変換部
4C 位相差算出部
4D 追加データ算出部
4E 領域選択部
4F 特定部
4F1 第1特定部
4F2 第2特定部
4G 抑圧係数算出部
4H 抑圧処理部
4I 逆直交変換部
MC マイクロフォン(マイク)
in(t) 入力信号
|X(f)| 振幅スペクトル
argX(f) 位相スペクトル
G(f) 抑圧係数
|Y(f)| 抑圧後の振幅スペクトル
out(t) 出力信号
BL 境界線
S−A〜C 音源
DM 位相回転が生じない領域
Bmax 位相回転が生じない最大周波数ビン
201 CPU
202 RAM
203 ROM
204 HDD
205 オーディオインターフェース
206 読取装置
207 バス
208 記録媒体

Claims (15)

  1. 複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置であって、
    前記マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、前記位相差±nπ(nは偶数)位相回転させた追加データとして生成する生成手段と、
    前記位相差が位相回転を生じない周波数帯域における前記位相差に基づいて、周波数・位相差平面の領域であって、前記入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、前記位相差と前記追加データとに基づいて、選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定する推定手段と、
    前記音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、前記入力信号を抑圧した出力信号を生成する出力信号生成手段と、
    を備える、
    ことを特徴とする雑音抑圧装置。
  2. 前記推定手段は、前記位相差が位相回転を生じない周波数帯域における前記位相差の数に基づいて、前記周波数・位相差平面上の領域を選択する、
    こと特徴とする請求項1に記載の雑音抑圧装置。
  3. 前記推定手段は、全周波数帯域での前記領域に存在する前記位相差と前記追加データの数に基づいて、前記選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定する、
    ことを特徴とする請求項1又は2に記載の雑音抑圧装置。
  4. 前記推定手段は、選択した前記領域の中に、推定した前記領域と隣接する領域が存在する場合には、前記隣接する領域における前記位相差が位相回転を生じない周波数帯域の領域も、目的音の音源が存在する方向の領域とする、
    ことを特徴とする請求項1乃至3のいずれか一に記載の雑音抑圧装置。
  5. 前記音源が存在する領域からの音であるか否かに応じて、前記抑圧係数を算出する算出手段を、更に、備える、
    ことを特徴とする請求項1乃至4のいずれか一に記載の雑音抑圧装置。
  6. 前記算出手段は、前記位相差が位相回転を生じない周波数帯域を除く周波数帯域において、前記位相差と前記追加データのいずれかが推定された前記領域に含まれるか否かを判定することで、前記音源が存在する領域からの音であるか否かを判定する、
    ことを特徴とする請求項5に記載の雑音抑圧装置。
  7. 前記算出手段は、前記位相差が位相回転を生じない周波数帯域では、前記位相差が推定された前記領域に含まれるか否かを判定し、前記位相差が位相回転を生じない周波数帯域を除く周波数帯域では、前記位相差と前記追加データのいずれかが推定された前記領域に含まれるか否かを判定することで、前記音源が存在する領域からの音であるか否かを判定する、
    ことを特徴とする請求項5に記載の雑音抑圧装置。
  8. 前記周波数・位相差平面の前記位相差の方向を複数に分割する複数の領域を設定する設定手段を、更に、備える、
    ことを特徴とする請求項1乃至7のいずれか一に記載の雑音抑圧装置。
  9. 前記設定手段は、前記周波数・位相差平面の前記位相差の方向を等間隔に分割する複数の領域を設定する、
    ことを特徴とする請求項8に記載の雑音抑圧装置。
  10. 前記設定手段は、前記位相差の絶対値が大きくなるにしたがって、前記周波数・位相差平面の前記位相差の方向をより広い間隔で分割する複数の領域を設定する、
    ことを特徴とする請求項8に記載の雑音抑圧装置。
  11. 前記設定手段は、隣接する領域の一部とそれぞれ重複するように前記複数の領域を設定する、
    ことを特徴とする請求項8乃至10のいずれか一に記載の雑音抑圧装置。
  12. 前記設定手段は、前記周波数が小さくなるにしたがって、前記領域の前記位相差の方向の幅が狭くなるように、前記複数の領域を設定する、
    ことを特徴とする請求項8乃至11のいずれか一に記載の雑音抑圧装置。
  13. 複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置の雑音抑圧方法であって、
    前記マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、前記位相差±nπ(nは偶数)位相回転させた追加データとして生成し、
    前記位相差が位相回転を生じない周波数帯域における前記位相差に基づいて、周波数・位相差平面の領域であって、前記入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、
    前記位相差と前記追加データとに基づいて、選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定し、
    前記音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、前記入力信号を抑圧した出力信号を生成する、
    ことを特徴とする雑音抑圧方法。
  14. 複数のマイクロフォンからの入力信号に対して雑音抑圧を行う雑音抑圧装置のコンピュータに、
    前記マイクロフォンからの入力信号間の周波数ごとの位相差に基づいて、前記位相差±nπ(nは偶数)位相回転させた追加データとして生成し、
    前記位相差が位相回転を生じない周波数帯域における前記位相差に基づいて、周波数・位相差平面の領域であって、前記入力信号に含まれる目的音の音源が存在する確率の高い方向の領域を一又は複数選択し、
    前記位相差と前記追加データとに基づいて、選択した一又は複数の領域の中から、前記音源が存在する方向の領域を推定し、
    前記音源が存在する領域からの音であるか否かに応じて設定される抑圧係数に基づいて、前記入力信号を抑圧した出力信号を生成する、
    処理を実行させる、
    ことを特徴とするプログラム。
  15. 前記複数のマイクロフォンは2つのマイクロフォンであり、
    前記推定手段は、前記位相差が位相回転を生じない周波数の上限である最大周波数であって前記雑音抑圧装置が使用される環境下での音速と前記2つのマイクロフォンの間の距離とを用いて算出される前記最大周波数以下の周波数帯域における前記位相差に基づいて、前記選択を行う、
    ことを特徴とする請求項1に記載の雑音抑圧装置。
JP2015060628A 2015-03-24 2015-03-24 雑音抑圧装置、雑音抑圧方法、及び、プログラム Active JP6520276B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015060628A JP6520276B2 (ja) 2015-03-24 2015-03-24 雑音抑圧装置、雑音抑圧方法、及び、プログラム
US15/066,240 US9691372B2 (en) 2015-03-24 2016-03-10 Noise suppression device, noise suppression method, and non-transitory computer-readable recording medium storing program for noise suppression
EP16159827.1A EP3073489B1 (en) 2015-03-24 2016-03-11 Noise suppression device, noise suppression method, computer program for noise suppression, and non-transitory computer-readable recording medium storing program for noise suppression

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015060628A JP6520276B2 (ja) 2015-03-24 2015-03-24 雑音抑圧装置、雑音抑圧方法、及び、プログラム

Publications (2)

Publication Number Publication Date
JP2016181789A JP2016181789A (ja) 2016-10-13
JP6520276B2 true JP6520276B2 (ja) 2019-05-29

Family

ID=55586152

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015060628A Active JP6520276B2 (ja) 2015-03-24 2015-03-24 雑音抑圧装置、雑音抑圧方法、及び、プログラム

Country Status (3)

Country Link
US (1) US9691372B2 (ja)
EP (1) EP3073489B1 (ja)
JP (1) JP6520276B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019030898A1 (ja) * 2017-08-10 2019-02-14 三菱電機株式会社 雑音除去装置および雑音除去方法
JP7010136B2 (ja) * 2018-05-11 2022-01-26 富士通株式会社 発声方向判定プログラム、発声方向判定方法、及び、発声方向判定装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4247195B2 (ja) 2005-03-23 2009-04-02 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録した記録媒体
JP5092748B2 (ja) 2005-09-02 2012-12-05 日本電気株式会社 雑音抑圧の方法及び装置並びにコンピュータプログラム
US20070223714A1 (en) * 2006-01-18 2007-09-27 Masao Nishikawa Open-air noise cancellation system for large open area coverage applications
JP4912036B2 (ja) * 2006-05-26 2012-04-04 富士通株式会社 指向性集音装置、指向性集音方法、及びコンピュータプログラム
JP5338259B2 (ja) * 2008-10-31 2013-11-13 富士通株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP5564873B2 (ja) * 2009-09-25 2014-08-06 富士通株式会社 収音処理装置、収音処理方法、及びプログラム
JP5493850B2 (ja) * 2009-12-28 2014-05-14 富士通株式会社 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
JP2012049715A (ja) 2010-08-25 2012-03-08 Asahi Kasei Corp 音源分離装置、音源分離方法、及び、プログラム
JP5614261B2 (ja) * 2010-11-25 2014-10-29 富士通株式会社 雑音抑制装置、雑音抑制方法、及びプログラム
US9368097B2 (en) * 2011-11-02 2016-06-14 Mitsubishi Electric Corporation Noise suppression device
JP5810903B2 (ja) * 2011-12-27 2015-11-11 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
JP5998483B2 (ja) 2012-01-11 2016-09-28 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
JP6107151B2 (ja) 2013-01-15 2017-04-05 富士通株式会社 雑音抑圧装置、方法、及びプログラム
JP6020258B2 (ja) * 2013-02-28 2016-11-02 富士通株式会社 マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置
JP6156012B2 (ja) * 2013-09-20 2017-07-05 富士通株式会社 音声処理装置及び音声処理用コンピュータプログラム

Also Published As

Publication number Publication date
EP3073489B1 (en) 2019-07-10
JP2016181789A (ja) 2016-10-13
EP3073489A1 (en) 2016-09-28
US20160284336A1 (en) 2016-09-29
US9691372B2 (en) 2017-06-27

Similar Documents

Publication Publication Date Title
JP6289936B2 (ja) 音源方向推定装置、音源方向推定方法およびプログラム
JP2021533423A (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
JP4339929B2 (ja) 音源方向検知装置
JP2019525214A (ja) 音声認識
JP6260504B2 (ja) オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
JP6107151B2 (ja) 雑音抑圧装置、方法、及びプログラム
US20150364136A1 (en) Adaptive beam forming devices, methods, and systems
KR20120080409A (ko) 잡음 구간 판별에 의한 잡음 추정 장치 및 방법
JP6204312B2 (ja) 収音装置
US20180190311A1 (en) Signal processing apparatus, signal processing method, and signal processing program
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
JP7367862B2 (ja) ニューラルネットワークベース信号処理装置、ニューラルネットワークベース信号処理方法、及びプログラム
US9966081B2 (en) Method and apparatus for synthesizing separated sound source
JP6520276B2 (ja) 雑音抑圧装置、雑音抑圧方法、及び、プログラム
CN111866665A (zh) 麦克风阵列波束形成方法及装置
JP2010175431A (ja) 音源方向推定装置とその方法と、プログラム
JP2008257110A (ja) 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体
JP2011170190A (ja) 信号分離装置、信号分離方法、および、信号分離プログラム
JP7152112B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP2006178333A (ja) 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
US20220270630A1 (en) Noise suppression apparatus, method and program for the same
Čmejla et al. Independent vector analysis exploiting pre-learned banks of relative transfer functions for assumed target’s positions
WO2019178802A1 (en) Method and device for estimating direction of arrival and electronics apparatus
JP4676920B2 (ja) 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
JP6631127B2 (ja) 音声判定装置、方法及びプログラム、並びに、音声処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190415

R150 Certificate of patent or registration of utility model

Ref document number: 6520276

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150