JP2010256421A - 集音エリア制御方法および音声入力装置 - Google Patents
集音エリア制御方法および音声入力装置 Download PDFInfo
- Publication number
- JP2010256421A JP2010256421A JP2009103249A JP2009103249A JP2010256421A JP 2010256421 A JP2010256421 A JP 2010256421A JP 2009103249 A JP2009103249 A JP 2009103249A JP 2009103249 A JP2009103249 A JP 2009103249A JP 2010256421 A JP2010256421 A JP 2010256421A
- Authority
- JP
- Japan
- Prior art keywords
- sound pressure
- spatial
- sound
- pressure gradient
- gradient component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】 目的音と雑音との分離精度を向上させた集音エリア制御方法および音声入力装置を提供する。
【解決手段】 一対のマイクロホンM1,M2が各々出力する音圧信号に基づいて基準位置Oにおける音圧信号に、基準位置と目的音源との間の距離に基づく空間微分関数を適用して第1の空間音圧勾配成分を算出し、マイクロホンM1,M2の各音圧信号の差分をX軸方向成分の距離で除算した第2の空間音圧勾配成分を算出し、第1の空間音圧勾配成分のX軸方向の成分を算出し、第1の空間音圧勾配成分のX軸方向の成分と第2の空間音圧勾配成分との差分に基づいて雑音の空間音圧勾配成分を推定し、第1の空間音圧勾配成分または第2の空間音圧勾配成分から、雑音の空間音圧勾配成分を除いた結果に、空間微分関数の逆関数を適用して実時間関数を導出し、当該実時間関数を目的音として抽出する。
【選択図】図1
【解決手段】 一対のマイクロホンM1,M2が各々出力する音圧信号に基づいて基準位置Oにおける音圧信号に、基準位置と目的音源との間の距離に基づく空間微分関数を適用して第1の空間音圧勾配成分を算出し、マイクロホンM1,M2の各音圧信号の差分をX軸方向成分の距離で除算した第2の空間音圧勾配成分を算出し、第1の空間音圧勾配成分のX軸方向の成分を算出し、第1の空間音圧勾配成分のX軸方向の成分と第2の空間音圧勾配成分との差分に基づいて雑音の空間音圧勾配成分を推定し、第1の空間音圧勾配成分または第2の空間音圧勾配成分から、雑音の空間音圧勾配成分を除いた結果に、空間微分関数の逆関数を適用して実時間関数を導出し、当該実時間関数を目的音として抽出する。
【選択図】図1
Description
本発明は、集音エリア制御方法および音声入力装置に関するものである。
周囲雑音や残響の存在する環境下で特定の目的音源から発せられる音、例えば、人の発する音声(話者音声)のみを抽出する集音エリア制御方法を用いた音響入力装置が従来より種々提供されており、その出力が音声認識装置に入力されている。
例えば、特許文献1に記載されている従来例は、音圧、当該音圧の時間微分値、当該音圧を二次元直交座標系の各軸方向に微分した空間微分値をそれぞれ検出する集音センサ手段と、検出した音圧、時間微分値、空間微分値に対して所定の係数ベクトルとの荷重和及び低域通過フィルタ処理を行うことにより集音感度が最小となる死点を予め設定した目的話者の位置に形成する死点形成手段と、集音センサ手段で検出される音圧と死点形成手段から出力される音圧を用いて目的話者から発せられる音声の音圧のみを抽出する目的話者音声抽出手段とを備えている。すなわち、死点形成手段から出力される音圧には死点に存在する音源から発せられる音以外の音、すなわち、雑音の音圧のみが含まれ、一方、集音センサ手段で検出される音圧には死点に存在する音源から発せられる音の音圧と雑音の音圧の双方が含まれており、目的話者音声抽出手段によって死点に存在する音源から発せられる音の音圧のみを抽出するので、雑音が死点の方向から到来する場合においても死点に存在する音源から発せられる音のみを抽出することができる。
また、特許文献2に記載されている従来例は、複数のマイクロホンを具備するマイクロホンアレー装置を備えており、複数の第一次分離手段によって、マイクロホンアレー装置の各マイクロホンの出力信号を用いて複数の異なる指向特性制御を行って目的音源、雑音音源からの各音を選択的に強調または抑圧するとともに周波数解析を行うことにより、各音に向けられた複数の第一次分離処理を行った後、第二次分離手段により、複数の第一次分離処理結果として得られた各周波数特性のうち同一の周波数帯域についての各振幅値を用いて周波数帯域毎に第一次分離処理よりも分離精度を高めるための第二次分離処理を行って目的音を分離している。
しかしながら、周囲雑音や残響が大きい場合には、目的音と雑音との分離精度が低下するため、後段に接続した音声認識装置での音声認識率が悪化していた。また、音声入力装置を機器に組み込んで使用する場合に、音声入力装置のさらなる小型化が求められている。
本発明は、上記事由に鑑みてなされたものであり、その目的は、目的音と雑音との分離精度を向上させた集音エリア制御方法および音声入力装置を提供することにある。
請求項1の発明は、予め決められた基準位置に対する位置が既知である目的音源が目的音を発するとともに、任意の位置に存在する雑音音源が雑音を発し、同一平面上に配置された複数のマイクロホンのうち一対のマイクロホンが各々出力する音圧信号に基づいて前記基準位置における音圧信号を求め、基準位置と目的音源との間の距離に基づく空間微分関数を前記求めた音圧信号に適用して第1の空間音圧勾配成分を算出し、前記一対のマイクロホンの各音圧信号の差分を当該一対のマイクロホン間を結ぶ軸方向成分の距離で除算した第2の空間音圧勾配成分を算出し、第1の空間音圧勾配成分の前記軸方向の成分を算出し、第1の空間音圧勾配成分の前記軸方向の成分と第2の空間音圧勾配成分との差分に基づいて雑音の空間音圧勾配成分を推定し、第1の空間音圧勾配成分または第2の空間音圧勾配成分から、雑音の空間音圧勾配成分を除いた結果に、前記第1の空間音圧勾配成分の算出に用いた空間微分関数の逆関数を適用して実時間関数を導出する処理を行い、前記処理を1組以上の一対のマイクロホンを用いて行うことによって導出された1乃至複数の実時間関数に基づいて目的音を抽出することを特徴とする。
この発明によれば、目的音源が設置されている既知の方向からの信号のみを抽出でき、目的音と雑音との分離精度を向上させることができる。
請求項2の発明は、請求項1において、前記マイクロホンの集音範囲は、所定の指向性を有することを特徴とする。
この発明によれば、各マイクロホンに互いに異なる指向性を付与することによって、一対のマイクロホンの各音圧信号の差分を大きくすることができ、遠くの目的音源に対しても、一対のマイクロホンの音圧信号の勾配差(第2の空間音圧勾配成分)をより顕著に検出することができ、集音エリア制御の精度を向上させることができる。
請求項3の発明は、請求項2において、無指向性の前記マイクロホンを収納する筐体に、マイクロホンの集音範囲に指向性を付与する手段を設けたことを特徴とする。
この発明によれば、マイクロホンの指向性を容易に設定できる。
請求項4の発明は、請求項1乃至3いずれかにおいて、前記第1の空間音圧勾配成分の算出に用いた空間微分関数は、目的音源と基準位置との間の距離による目的音の減衰と、目的音源と基準位置との間の距離による目的音の伝達遅れとを考慮した関数であることを特徴とする。
この発明によれば、基準位置と目的音源との間の距離に基づく空間微分を容易に求めることができる。
請求項5の発明は、請求項4において、前記目的音源と基準位置との間の距離による目的音の伝達遅れは、温度による変動要素を含むことを特徴とする。
この発明によれば、基準位置と目的音源との間の距離に基づく空間微分を高精度に求めることができ、集音エリア制御の精度がさらに向上する。
請求項6の発明は、請求項1乃至5いずれかにおいて、前記雑音の空間音圧勾配成分の推定結果が所定の閾値以上である場合にのみ前記目的音の抽出処理を行うことを特徴とする。
この発明によれば、回路が発生する雑音や暗騒音等の影響による集音エリア制御の精度劣化を抑制することができる。
請求項7の発明は、予め決められた基準位置に対する位置が既知である目的音源が発する目的音、任意の位置に存在する雑音音源が発する雑音を集音するために同一平面上に配置された複数のマイクロホンと、複数のマイクロホンのうち一対のマイクロホンが各々出力する音圧信号に基づいて求めた前記基準位置における音圧信号に、基準位置と目的音源との間の距離に基づく空間微分関数を適用して第1の空間音圧勾配成分を算出する第1の空間勾配算出手段と、一対のマイクロホンの各音圧信号の差分を当該一対のマイクロホン間を結ぶ軸方向成分の距離で除算した第2の空間音圧勾配成分を算出する第2の空間勾配算出手段と、第1の空間音圧勾配成分の前記軸方向の成分を算出する軸方向成分算出手段と、第1の空間音圧勾配成分の前記軸方向の成分と第2の空間音圧勾配成分との差分に基づいて雑音の空間音圧勾配成分を推定する雑音勾配成分推定手段と、第1の空間音圧勾配成分または第2の空間音圧勾配成分から、雑音の空間音圧勾配成分を除いた結果に、前記第1の空間音圧勾配成分の算出に用いた空間微分関数の逆関数を適用して実時間関数を導出する実時間関数変換手段とを備え、1組以上の一対のマイクロホンを用いて導出された1乃至複数の実時間関数に基づいて目的音を抽出することを特徴とする。
この発明によれば、目的音源が設置されている既知の方向からの信号のみを抽出でき、目的音と雑音との分離精度を向上させることができる。
以上説明したように、本発明では、目的音と雑音との分離精度を向上させた集音エリア制御方法および音声入力装置を提供することができるという効果がある。
以下、本発明の実施の形態を図面に基づいて説明する。
(実施形態1)
図1は、本実施形態の音声入力装置Aのブロック構成を示し、一対のマイクロホンM1,M2と、信号前処理部1と、第1の空間勾配算出部2と、第2の空間勾配算出部3と、軸方向成分算出部4と、減算器5と、雑音勾配成分推定部6と、減算器7と、実時間関数変換部8とを備える。
図1は、本実施形態の音声入力装置Aのブロック構成を示し、一対のマイクロホンM1,M2と、信号前処理部1と、第1の空間勾配算出部2と、第2の空間勾配算出部3と、軸方向成分算出部4と、減算器5と、雑音勾配成分推定部6と、減算器7と、実時間関数変換部8とを備える。
一対のマイクロホンM1,M2は、無指向性のマイクロホンであり、音声入力装置Aの筐体に配置されて、図2に示すように筐体の前面(以降、筐体面と称す)に沿って規定したX軸上に距離dXの間隔で配置されている。さらに筐体面に対して法線方向(前後方向)にZ軸を規定する。ここで、マイクロホンM1,M2を結ぶ線の中点(マイクロホンM1,M2の両方から等距離[dX/2]離れているX軸上の点)を、X軸およびZ軸の原点(0,0)となる基準位置Oとする。
マイクロホンM1,M2の前方には人が目的音源Sとして存在し、話者音声(目的音)を発する。この目的音源Sの位置は音声入力装置Aにとって既知であって、基準位置Oから特定方向に距離r離れた位置に存在する。さらに、マイクロホンM1,M2の前方には雑音音源Nが存在し、雑音を発する。この雑音音源Nの位置は任意であり、音声入力装置Aにとって未知である。
そして、集音動作を行うマイクロホンM1,M2が音圧信号f1,f2を各々出力したとすると、信号前処理部1は、マイクロホンM1,M2からの音圧信号をA/D変換し、fa=f1、fb=f2として[数1]にしたがって、基準位置Oでの音圧信号f1,f2の平均値f(以降、音圧平均値fと称す)を算出する。なお、以降の信号処理は、デジタル演算によって行われる。
次に、第1の空間勾配算出部2は、[数2]に示す空間微分の関数を用いて音圧平均値fを、目的音源Sと基準位置Oとの間の距離rで偏微分し(空間微分)、目的音源Sからの第1の空間音圧勾配成分ha(t)を算出する。なお、cは音速を示す。
上記[数2]に示す空間微分の関数は、以下のように導出された。まず、距離rによる目的音の減衰の影響([数3]参照)と、距離rによる目的音の伝達遅れの影響([数4]参照)とを考慮し、さらに図2に示すようにX軸の負方向にX軸方向の単位ベクトルnxをとると、[数5]に示すように空間微分の関数が導出されて、第1の空間音圧勾配成分ha(t)が求められる。なお、Z軸方向の単位ベクトルnZは、前から後に向かう方向に規定される。
そして、軸方向成分算出部4は、[数6]にしたがって、第1の空間音圧勾配成分ha(t)のX軸方向の成分を算出する。
また、第2の空間勾配算出部3は、fa=f1、fb=f2として[数7]にしたがって、音圧信号f1,f2の差分をマイクロホンM1,M2間を結ぶX軸方向成分の距離dXで除算した第2の空間音圧勾配成分hb(t)を算出する。
ここで、雑音音源Nがなく、目的音源Sのみが存在する場合には、上記[数6]で求めた第1の空間音圧勾配成分ha(t)のX軸方向成分と、[数7]で求めた第2の空間音圧勾配成分hb(t)とが等しくなる。しかし、特に第1の空間音圧勾配成分ha(t)のX軸方向成分は目的音源Sのみが存在すると仮定して算出しているので、雑音音源Nが存在する場合には、第1の空間音圧勾配成分ha(t)のX軸方向成分と第2の空間音圧勾配成分hb(t)とは互いに異なる値となる。
そこで減算器5は、[数8]にしたがって、[数7]で求めた第2の空間音圧勾配成分hb(t)から、[数6]で求めた第1の空間音圧勾配成分ha(t)のX軸方向の成分を減算した関数hx(t)を求める。この関数hx(t)は、雑音によって発生した関数であるといえる。
そして、雑音勾配成分推定部6は、[数9]にしたがって、[数2]で求めたha(t)と[数8]で求めたhx(t)との時間区間平均axを算出する。時間区間平均axは、hx(t)に含まれる雑音の成分割合の推定結果であり、さらにaxとhx(t)との積を求めて、音圧平均値fに含まれる雑音の空間音圧勾配成分の推定値ax・hx(t)(以降、雑音推定値ax・hx(t)と称す)を出力する。なお積分区間のΓは、特定の時間区間を示す。
次に、減算器7は、[数10]にしたがって、第1の空間音圧勾配成分ha(t)から、雑音推定値ax・hx(t)を減算して、目的音源Sの空間勾配成分s’を求める。
なお、雑音勾配成分推定部6は、[数7]で求めたhb(t)と[数8]で求めたhx(t)との時間区間平均axを算出し、減算器7は、第2の空間音圧勾配成分hb(t)から、雑音推定値ax・hx(t)を減算して、目的音源Sの空間勾配成分s’を求めてもよい。
そして、実時間関数変換部8は、[数11]にしたがって、[数2]で用いた空間微分関数の逆関数を、[数10]で求めた目的音源Sの空間勾配成分s’に適用して実時間関数soutに変換し、実時間関数soutを目的音として抽出、出力する。
このように、目的音源Sの位置を既知とした上で、空間微分によって求めた第1の空間音圧勾配成分ha(t)の軸方向成分と、マイクロホンM1,M2間における軸方向の第2の空間音圧勾配成分hb(t)との差に基づいて、雑音の空間音圧勾配成分を推定し、元の信号の空間音圧勾配成分から雑音の空間音圧勾配成分を除した後に、実時間関数に変換することによって、所定エリアからの目的音のみを抽出している。したがって、本実施形態では、目的音源Sが設置されている既知の方向からの信号のみを抽出でき、目的音と雑音との分離精度が向上する。例えば、音の残響が大きい風呂場に設置したテレビ装置を音声操作する場合でも、テレビ装置からの音声や残響音を除去して、指示音声を精度よく抽出できる。また、一対のマイクロホンM1,M2間の距離dXを短くしても、[数2]に示す第1の空間音圧勾配成分ha(t)、[数7]に示す第2の空間音圧勾配成分hb(t)を算出して、目的音の抽出処理は可能であり、音声入力装置Aの小型化を図ることができ、周りの環境に違和感なく設置することができる。
図3に示すように原点OからZ軸方向にr=0.3(m)離れた位置に存在する目的音源Sが目的音(男声)を発し、原点OからZ軸に対して45度傾いた方向に0.3(m)離れた位置に存在する雑音音源Nが雑音(女声)を発した場合に、実際に測定した目的音と雑音との分離精度の結果を図4(a)(b)、図5(a)〜(c)に示す。
図4(a)(b)、図5(a)〜(c)は、音圧信号f1,f2の音圧平均値f([数1]参照)と、実時間関数変換部8が出力する実時間関数sout([数11]参照)との比較結果であり、図4(a)は、目的音のみが発せられたときの音圧平均値fs、雑音のみが発せられたときの音圧平均値fn、目的音と雑音の両方が発せられたときの音圧平均値fsnの各波形を示し、図4(b)は、目的音のみが発せられたときの実時間関数ss、雑音のみが発せられたときの実時間関数sn、目的音と雑音の両方が発せられたときの実時間関数ssnの各波形を示す。なお、図4(a)(b)は、音圧平均値f、実時間関数soutの各デジタル値を規格化してプロットしており、横軸はサンプル数、縦軸はデジタル値の最大値を1、最小値を−1にして規格化した結果である。本実施形態では、A/D変換のサンプリング周波数が44.1(kHz)であり、横軸の1目盛りが約2秒に相当する。
さらに、図5(a)は、目的音のみが発せられたときの音圧平均値fsおよび実時間関数ssの周波数特性、図5(b)は、音圧平均値fnおよび実時間関数snの周波数特性、図5(c)は、音圧平均値fsnおよび実時間関数ssnの周波数特性を示す。
このように、音圧信号f1,f2の音圧平均値fと、実時間関数変換部8が出力する実時間関数soutとでは、目的音の波形および周波数特性は殆ど変化がないものの、雑音の波形および周波数特性は、雑音を分離して目的音を抽出した実時間関数soutのほうが、音圧信号f1,f2の音圧平均値fより振幅が大きく、目的音と雑音との混合時にも目的音が精度よく抽出されていることがわかる。
(実施形態2)
図6は、本実施形態の音声入力装置Aのブロック構成を示し、一対のマイクロホンM1,M2、一対のマイクロホンM3,M4を備える。図7に示すように、一対のマイクロホンM1,M2は、筐体面に沿って規定したX軸方向に距離dXの間隔で配置され、一対のマイクロホンM3,M4もX軸方向に距離dXの間隔で配置されており、一対のマイクロホンM1,M2と一対のマイクロホンM3,M4とは、X軸に直交するY軸方向に距離dYの間隔で配置されている。さらに筐体面に対して法線方向(前後方向)にZ軸を規定する。ここで、マイクロホンM1,M2を結ぶ線の中点とマイクロホンM3,M4を結ぶ線の中点とを接続するY軸方向の線の中点(マイクロホンM1〜M4から等距離離れている点)を、X軸およびY軸およびZ軸の原点(0,0,0)となる基準位置Oとする。なお、実施形態1と同様の構成には同一の符号を付して説明は省略する。
図6は、本実施形態の音声入力装置Aのブロック構成を示し、一対のマイクロホンM1,M2、一対のマイクロホンM3,M4を備える。図7に示すように、一対のマイクロホンM1,M2は、筐体面に沿って規定したX軸方向に距離dXの間隔で配置され、一対のマイクロホンM3,M4もX軸方向に距離dXの間隔で配置されており、一対のマイクロホンM1,M2と一対のマイクロホンM3,M4とは、X軸に直交するY軸方向に距離dYの間隔で配置されている。さらに筐体面に対して法線方向(前後方向)にZ軸を規定する。ここで、マイクロホンM1,M2を結ぶ線の中点とマイクロホンM3,M4を結ぶ線の中点とを接続するY軸方向の線の中点(マイクロホンM1〜M4から等距離離れている点)を、X軸およびY軸およびZ軸の原点(0,0,0)となる基準位置Oとする。なお、実施形態1と同様の構成には同一の符号を付して説明は省略する。
マイクロホンM1〜M4の前方には人が目的音源Sとして存在し、話者音声(目的音)を発する。この目的音源Sの位置は音声入力装置Aにとって既知であって、基準位置Oから特定方向に距離r離れた位置に存在する。さらに、マイクロホンM1〜M4の前方には雑音音源Nが存在し、雑音を発する。この雑音音源Nの位置は任意であり、音声入力装置Aにとって未知である。
そして、集音動作を行うマイクロホンM1,M2が音圧信号f1,f2を各々出力したとすると、fa=f1、fb=f2とし、実施形態1と同様にマイクロホンM1,M2間の中点を基準点として[数1]〜[数11]を用いて実時間関数sout(以降、sx1と称す)を求める。さらに、集音動作を行うマイクロホンM3,M4も音圧信号f3,f4を各々出力しており、fa=f3、fb=f4とし、マイクロホンM3,M4間の中点を基準点として上記同様に[数1]〜[数11]を用いて実時間関数sout(以降、sx2と称す)を求める。
次に、実時間関数sx1および実時間関数sx2から目的信号を抽出する。
まず、信号前処理部1は、fa=sx1、fb=sx2として[数12]にしたがって、基準位置Oでの音圧平均値fである実時間関数sx1,sx2の平均値を算出する。すなわち、マイクロホンM1,M2間の中点において音圧信号sx1を集音するマイクロホン、マイクロホンM3,M4間の中点において音圧信号sx2を集音するマイクロホンが、Y軸上に距離dYの間隔で配置されているとみなして、以降は[数1]〜[数11]と同様の処理を行うのである。
次に、第1の空間勾配算出部2は、[数2]に示す空間微分の関数を用いて、実時間関数sx1,sx2の音圧平均値fを距離rで偏微分し(空間微分)、目的音源Sからの第1の空間音圧勾配成分ha(t)を算出する。
そして、軸方向成分算出部4は、図8に示すようにY軸の負方向にY軸方向の単位ベクトルnYをとると、[数13]にしたがって、第1の空間音圧勾配成分ha(t)のY軸方向の成分を算出する。なお、Z軸方向の単位ベクトルnZは、前から後に向かう方向に規定される。
また、第2の空間勾配算出部3は、[数14]にしたがって、音圧信号sx1,sx2の差分をマイクロホンM1,M2−マイクロホンM3,M4間を結ぶY軸方向成分の距離dYで除算した第2の空間音圧勾配成分hb(t)を算出する。
次に減算器5は、[数15]にしたがって、[数14]で求めた第2の空間音圧勾配成分hb(t)から、[数13]で求めた第1の空間音圧勾配成分ha(t)のY軸方向の成分を減算した関数hY(t)を求める。この関数hY(t)は、雑音によって発生した関数であるといえる。
そして、雑音勾配成分推定部6は、[数16]にしたがって、[数2]で求めたha(t)と[数15]で求めたhY(t)との時間区間平均aYを算出する。時間区間平均aYは、hY(t)に含まれる雑音の成分割合の推定結果であり、さらにaYとhY(t)との積を求めて、[数12]で求めた音圧平均値fに含まれる雑音の空間音圧勾配成分の推定値aY・hY(t)を出力する。なお積分区間のΓは、特定の時間区間を示す。
次に、減算器7は、[数17]にしたがって、第1の空間音圧勾配成分ha(t)から、音圧平均値fに含まれる雑音の空間音圧勾配成分の推定値aY・hY(t)を減算して、目的音源Sの空間勾配成分s’を求める。
そして、実時間関数変換部8は、[数11]にしたがって、[数2]で用いた空間微分関数の逆関数を、[数17]で求めた目的音源Sの空間勾配成分s’に適用して実時間関数soutに変換し、実時間関数soutを目的音として抽出、出力する。このように、目的音源Sが設置されている既知の方向からの信号のみを抽出でき、目的音と雑音との分離精度が向上する。また、実施形態1,2で示したように目的音源Sの方向としては2次元、3次元を問わず、本発明を適用することができる。
図9,図10は、本実施形態の音声入力装置Aの筐体A1の構成を示しており、無指向性のマイクロホンM1〜M4が配置されるケースA10と、ケースA10の前面に覆設されるカバーA11とで構成される。ケースA10は、底板11の周囲を側壁12で囲んで前面を開口した略直方体状に形成され、その側壁12の四隅にはケースA10の中心方向に向かって凹部13が各々形成されている。凹部13を構成する側壁12はY字型に形成され、凹部13開口の側壁12aは遮音壁として機能する。そして、凹部13の底部にはマイクロホンM1〜M4の各々が配置されており、マイクロホンM1 → マイクロホンM2 → マイクロホンM4 → マイクロホンM3の順に互いに隣り合って各隅に配置されている。
そして、カバーA11がケースA10の前面に覆設されると、ケースA10の凹部13とカバーA11の裏面とでマイクロホン音孔14を構成し、マイクロホン音孔14を介したマイクロホンM1〜M4の各指向性は、ケースA10の四隅から放射状に設定され、隣り合うマイクロホンとの間には略90度の指向性差が生じる。なお図10に示すように、ケースA10の開口に覆設したカバーA11の表面が上記筐体面となり、互いに直交するX軸およびY軸が筐体面上に規定され、X軸およびY軸の交点に直交する前後方向にZ軸が規定される。
このようにマイクロホンM1〜M4に互いに異なる指向性を付与することによって、上記[数7]で算出される第2の空間音圧勾配成分hb(t)をより顕著に検知できる。例えば、無指向性の一対のマイクロホン(M1とM2、またはM3とM4)を距離dの間隔で配置し、Z軸から45度傾いた方向に距離r離れた目的音源Sが存在する場合、一対のマイクロホンの音圧信号のレベル差Δは、[数18]で表される。なお、目的音源Sは点音源とする。
[数18]によると、d=0.05(m)、r=0.3(m)のときに、Δ=1.09(dB)程度となり、rが大きくなるほどレベル差Δは小さくなり、マイクロホン間の感度バラツキの影響を無視できなくなる。しかしながら、上記のように各マイクロホンに互いに異なる指向性を付与することによってレベル差Δを大きくすることができ、遠くの目的音源Sに対しても、一対のマイクロホンの音圧信号の勾配差をより顕著に検出することができ、集音エリア制御の精度を向上させることができる。また、指向性を有するマイクロホンM1〜M4を用いて、隣り合うマイクロホンとの間に略90度の指向性差を付与してもよい。
なお、本実施形態では、4つのマイクロホンM1〜M4を用いているが、3つのマイクロホンM1〜M3を用いて、一対のマイクロホンを2組作り(例えば、マイクロホンM1,M2の組、マイクロホンM2,M3の組)、上記音圧信号sx1,sx2を導出してもよい。
また、上記実施形態1,2における[数2]を[数19]に置き換えてもよく、[数19]では、音速cを温度Tの関数c(T)としており、第1の空間音圧勾配成分ha(t)を、周囲温度Tに応じて精度よく算出することができる。
また、雑音音源Nが存在せず、目的音源Sのみが存在する場合、理想的には上記[数8]の結果hx(t)は「0」となるが、実際には音声入力装置Aを構成する各回路が発生する雑音や暗騒音等の影響で「0」にはならず、hx(t)は微少な値となる。そこで、雑音勾配成分推定部6は、hx(t)が予め決められた閾値以上であれば、雑音音源Nが存在するとして上記処理を行い、実時間関数soutを導出して目的音を抽出してもよい。一方、hx(t)が予め決められた閾値未満であれば、雑音勾配成分推定部6は、雑音音源Nが存在しないとして、実時間関数soutを導出する上記処理を行わず、上記[数1]に示す音圧平均値fを目的音として出力する。したがって、回路が発生する雑音や暗騒音等の影響による集音エリア制御の精度劣化を抑制することができる。
A 音声入力装置
M1,M2 マイクロホン
1 信号前処理部
2 第1の空間勾配算出部
3 第2の空間勾配算出部
4 軸方向成分算出部
5 減算器
6 雑音勾配成分推定部
7 減算器
8 実時間関数変換部
M1,M2 マイクロホン
1 信号前処理部
2 第1の空間勾配算出部
3 第2の空間勾配算出部
4 軸方向成分算出部
5 減算器
6 雑音勾配成分推定部
7 減算器
8 実時間関数変換部
Claims (7)
- 予め決められた基準位置に対する位置が既知である目的音源が目的音を発するとともに、任意の位置に存在する雑音音源が雑音を発し、
同一平面上に配置された複数のマイクロホンのうち一対のマイクロホンが各々出力する音圧信号に基づいて前記基準位置における音圧信号を求め、基準位置と目的音源との間の距離に基づく空間微分関数を前記求めた音圧信号に適用して第1の空間音圧勾配成分を算出し、
前記一対のマイクロホンの各音圧信号の差分を当該一対のマイクロホン間を結ぶ軸方向成分の距離で除算した第2の空間音圧勾配成分を算出し、
第1の空間音圧勾配成分の前記軸方向の成分を算出し、
第1の空間音圧勾配成分の前記軸方向の成分と第2の空間音圧勾配成分との差分に基づいて雑音の空間音圧勾配成分を推定し、
第1の空間音圧勾配成分または第2の空間音圧勾配成分から、雑音の空間音圧勾配成分を除いた結果に、前記第1の空間音圧勾配成分の算出に用いた空間微分関数の逆関数を適用して実時間関数を導出する処理を行い、
前記処理を1組以上の一対のマイクロホンを用いて行うことによって導出された1乃至複数の実時間関数に基づいて目的音を抽出する
ことを特徴とする集音エリア制御方法。 - 前記マイクロホンの集音範囲は、所定の指向性を有することを特徴とする請求項1記載の集音エリア制御方法。
- 無指向性の前記マイクロホンを収納する筐体に、マイクロホンの集音範囲に指向性を付与する手段を設けたことを特徴とする請求項2記載の集音エリア制御方法。
- 前記第1の空間音圧勾配成分の算出に用いた空間微分関数は、目的音源と基準位置との間の距離による目的音の減衰と、目的音源と基準位置との間の距離による目的音の伝達遅れとを考慮した関数であることを特徴とする請求項1乃至3いずれか記載の集音エリア制御方法。
- 前記目的音源と基準位置との間の距離による目的音の伝達遅れは、温度による変動要素を含むことを特徴とする請求項4記載の集音エリア制御方法。
- 前記雑音の空間音圧勾配成分の推定結果が所定の閾値以上である場合にのみ前記目的音の抽出処理を行うことを特徴とする請求項1乃至5いずれか記載の集音エリア制御方法。
- 予め決められた基準位置に対する位置が既知である目的音源が発する目的音、任意の位置に存在する雑音音源が発する雑音を集音するために同一平面上に配置された複数のマイクロホンと、
複数のマイクロホンのうち一対のマイクロホンが各々出力する音圧信号に基づいて求めた前記基準位置における音圧信号に、基準位置と目的音源との間の距離に基づく空間微分関数を適用して第1の空間音圧勾配成分を算出する第1の空間勾配算出手段と、
一対のマイクロホンの各音圧信号の差分を当該一対のマイクロホン間を結ぶ軸方向成分の距離で除算した第2の空間音圧勾配成分を算出する第2の空間勾配算出手段と、
第1の空間音圧勾配成分の前記軸方向の成分を算出する軸方向成分算出手段と、
第1の空間音圧勾配成分の前記軸方向の成分と第2の空間音圧勾配成分との差分に基づいて雑音の空間音圧勾配成分を推定する雑音勾配成分推定手段と、
第1の空間音圧勾配成分または第2の空間音圧勾配成分から、雑音の空間音圧勾配成分を除いた結果に、前記第1の空間音圧勾配成分の算出に用いた空間微分関数の逆関数を適用して実時間関数を導出する実時間関数変換手段と
を備え、
1組以上の一対のマイクロホンを用いて導出された1乃至複数の実時間関数に基づいて目的音を抽出する
ことを特徴とする音声入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009103249A JP2010256421A (ja) | 2009-04-21 | 2009-04-21 | 集音エリア制御方法および音声入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009103249A JP2010256421A (ja) | 2009-04-21 | 2009-04-21 | 集音エリア制御方法および音声入力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010256421A true JP2010256421A (ja) | 2010-11-11 |
Family
ID=43317443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009103249A Withdrawn JP2010256421A (ja) | 2009-04-21 | 2009-04-21 | 集音エリア制御方法および音声入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010256421A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10950227B2 (en) | 2017-09-14 | 2021-03-16 | Kabushiki Kaisha Toshiba | Sound processing apparatus, speech recognition apparatus, sound processing method, speech recognition method, storage medium |
-
2009
- 2009-04-21 JP JP2009103249A patent/JP2010256421A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10950227B2 (en) | 2017-09-14 | 2021-03-16 | Kabushiki Kaisha Toshiba | Sound processing apparatus, speech recognition apparatus, sound processing method, speech recognition method, storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101456866B1 (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
JP6074263B2 (ja) | 雑音抑圧装置及びその制御方法 | |
KR101415026B1 (ko) | 마이크로폰 어레이를 이용한 다채널 사운드 획득 방법 및장치 | |
KR101238362B1 (ko) | 음원 거리에 따라 음원 신호를 여과하는 방법 및 장치 | |
US8654990B2 (en) | Multiple microphone based directional sound filter | |
CN106872945B (zh) | 声源定位方法、装置和电子设备 | |
JP6187626B1 (ja) | 収音装置及びプログラム | |
JP4521549B2 (ja) | 上下、左右方向の複数の音源の分離方法、そのためのシステム | |
JP2008236077A (ja) | 目的音抽出装置,目的音抽出プログラム | |
KR20120071452A (ko) | 마이크 어레이를 이용한 방향성 음원 필터링 장치 및 그 제어방법 | |
JP4825552B2 (ja) | 音声認識装置、周波数スペクトル取得装置および音声認識方法 | |
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
JP7194897B2 (ja) | 信号処理装置及び信号処理方法 | |
CN107113496B (zh) | 移动设备的环绕声记录 | |
KR20090037845A (ko) | 혼합 신호로부터 목표 음원 신호를 추출하는 방법 및 장치 | |
JP4652191B2 (ja) | 複数音源の分離方法 | |
JPWO2018037643A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Hosseini et al. | Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function | |
KR20090128221A (ko) | 음원 위치 추정 방법 및 그 방법에 따른 시스템 | |
Padois et al. | On the use of geometric and harmonic means with the generalized cross-correlation in the time domain to improve noise source maps | |
JP2010256421A (ja) | 集音エリア制御方法および音声入力装置 | |
JP5086768B2 (ja) | 通話装置 | |
JP2010056762A (ja) | マイクロホンアレー | |
JP5270259B2 (ja) | 音声認識装置 | |
JP2011069948A (ja) | 音源信号分離装置、音源信号分離方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20120703 |