JP7235534B2 - マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム - Google Patents

マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム Download PDF

Info

Publication number
JP7235534B2
JP7235534B2 JP2019034898A JP2019034898A JP7235534B2 JP 7235534 B2 JP7235534 B2 JP 7235534B2 JP 2019034898 A JP2019034898 A JP 2019034898A JP 2019034898 A JP2019034898 A JP 2019034898A JP 7235534 B2 JP7235534 B2 JP 7235534B2
Authority
JP
Japan
Prior art keywords
microphone array
sound source
spectrum
microphone
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019034898A
Other languages
English (en)
Other versions
JP2020141232A (ja
JP7235534B6 (ja
Inventor
一博 中臺
雄啓 段
克寿 糸山
健次 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019034898A priority Critical patent/JP7235534B6/ja
Priority to US16/790,264 priority patent/US11076250B2/en
Publication of JP2020141232A publication Critical patent/JP2020141232A/ja
Publication of JP7235534B2 publication Critical patent/JP7235534B2/ja
Application granted granted Critical
Publication of JP7235534B6 publication Critical patent/JP7235534B6/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former

Description

本発明は、マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラムに関する。
音声認識処理では、複数のマイクロホンから構成されているマイクロホンアレイが使用される。例えば音源定位処理や音源分離処理では、音源からマイクロホンアレイまでの関係を表す伝達関数を事前に測定しておき、この伝達関数を用いて処理を行う。このため、マイクロホンアレイを使用する場合は、マイクロホンそれぞれの配置を正確に知り必要がある。しかし、一旦マイクロホンの位置を正確に計測しても、実際に使用する際に位置がずれてしまっていることがある。マイクロホンの位置がずれた場合は、測定した伝達関数における音源とマイクロホンとの位置がずれるため、伝達関数が適切なものでなくなる。この結果、マイクロホンの位置がずれた場合は、音源定位処理や音源分離処理などの精度が下がってしまう。
このため、マイクロホンアレイを用いた場合の伝達関数の推定を行うことが提案されている。例えば、ロボットの自己位置と地図の同時推定問題として知られているSLAM(Simultaneous Localization and Mapping)の手法を、マイクロホンと音源の位置を同時推定する問題と見なして拡張された手法が提案されている(例えば非特許文献1参照)。
また、特許文献1では、移動音源からの音をマイクロホンアレイを使って観測するたびに、インクリメンタルに音源の位置、各マイク位置、同期の時刻ズレを推定し、同期時刻のズレを含む推定誤差を最小になるように推定値を更新することによって音声信号の入力と同時に音源位置を推定することが提案されている。
このような特許文献1や非特許文献1に記載の技術では、拍手などの立ち上がりタイミングが明確な信号を用いたり、音源位置情報を用いたりすることで各マイクロホンの位置を校正する。
特開2012-161071号公報
" SLAM-based Online Calibration of Asynchronous Microphone Array for Robot Audition", Hiroaki Miura, Takami Yoshida, Keisuke Nakamura, and Kazuhiro Nakadai, RSJ International Conference on Intelligent Robots and Systems, IEEE, 2011, p524-529
しかしながら、特許文献1や非特許文献1に記載の技術では、実雑音環境下では立ち上がりが正確に検出できない可能性があり、音源位置情報も与えることができない場合がある。
本発明は、上記の問題点に鑑みてなされたものであって、マイクロホンアレイの位置を精度良く推定することができるマイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラムを提供することを目的とする。
(1)上記目的を達成するため、本発明の一態様に係るマイクロホンアレイ位置推定装置<1>は、M(Mは1以上の整数)個のマイクロホンから構成されるマイクロホンアレイの位置をX(=(X ,…,X )T、Tは転置を表す)、N(Nは1以上の整数)個の音源が出力する音源信号のスペクトルをS(Snftのn、f、t全てに関する集合、nは、N個のうちのn番目の音源、fは周波数ビン、tはフレームインデックス)、前記マイクロホンアレイによって收音される収録信号のスペクトルをZ(Zft のf、t全てに関する集合、mは1からMの間の整数、Z mft は、前記音源信号のスペクトルS nft と、前記マイクロホンと音源間の伝達関数R nmf の積の集合)としたとき、X、、Zの同時確率P(X,S,Z)を最大化する前記マイクロホンアレイの位置XをSとXの反復推定により推定する推定部<17>、を備える。
(2)また、本発明の一態様に係るマイクロホンアレイ位置推定装置において、前記推定部は、X(0)とS(0)とをランダムに初期化した後、以下の2つの式が収束するまで反復推定を行うことで、前記マイクロホンアレイの位置Xを推定するようにしてもよい。
Figure 0007235534000001
Figure 0007235534000002
(3)また、本発明の一態様に係るマイクロホンアレイ位置推定装置において、前記推定部は、グリッドサーチによって以下の関数を最大化するX^を推定することで、前記マイクロホンアレイの位置Xを推定するようにしてもよい。
Figure 0007235534000003
(4)また、本発明の一態様に係るマイクロホンアレイ位置推定装置において、前記推定部は、
空間モデルに基づいて、確率P(X,S,Z)の確率モデルを次式とし、
Figure 0007235534000004
音源信号のスペクトルSと伝達関数Rnmfの積を平均とした複素正規分布に従うと仮定して右辺の第1項logP(Z|S,X)を次式とし(等号の上に符号cは定数項を除いて右辺と左辺が正しいことを示す等号であり、*は複素共役を表し、σ はマイクロホンアレイの収録信号の分散を表す)、
Figure 0007235534000005
nftが平均0の複素正規分布に従うと仮定して、右辺の第2項logP(S)を次式とし(σ は音源信号のスペクトルの分散を表す)、
Figure 0007235534000006
前記マイクロホンアレイを構成する前記マイクロホンの相対位置は各マイクロホンで独立であり、前記マイクロホンの位置Xの変位は当方向であると仮定し、前記マイクロホンアレイの位置XがX ̄を平均とした正規分布に従うとすると、右辺の第3項logP(X)を次式とする(σはマイクロホンアレイ位置の分散を表す)ようにしてもよい。
Figure 0007235534000007
(5)上記目的を達成するため、本発明の一態様に係るマイクロホンアレイ位置推定方法は、マイクロホン数取得部が、マイクロホンアレイが備えるマイクロホンの数(Mは1以上の整数)を取得する手順と、音源数取得部が、音源の数N(Nは1以上の整数)を取得する手順と、第1短時間フーリエ変換部が、前記音源毎に音源信号に対して短時間フーリエ変換を行って音源信号のスペクトルを算出する手順と、第2短時間フーリエ変換部が、前記マイクロホン毎に収録信号に対して短時間フーリエ変換を行って収録信号のスペクトルを算出する手順と、推定部が、前記音源の数Nと、前記マイクロホンの数Mと、音源信号のスペクトルと、収録信号のスペクトルと、前記マイクロホンアレイの位置Xを推定するために用いる確率的生成モデルとを用いて、前記マイクロホンアレイの位置をX(=(X ,…,X 、Tは転置を表す)、N個の前記音源が出力する音源信号のスペクトルをS(Snftのn、f、t全てに関する集合、nは、N個のうちのn番目の音源、fは周波数ビン、tはフレームインデックス)、前記マイクロホンアレイによって收音される収録信号のスペクトルをZ(Zft のf、t全てに関する集合、mは1からMの間の整数、Z mft は、前記音源信号のスペクトルS nft と、前記マイクロホンと音源間の伝達関数R nmf の積の集合)としたとき、X、、Zの同時確率P(X,S,Z)を最大化する前記マイクロホンアレイの位置XをSとXの反復推定により推定する推定手順と、を含む。
(6)上記目的を達成するため、本発明の一態様に係るプログラムは、マイクロホンアレイ位置推定のコンピュータに、マイクロホンアレイが備えるマイクロホンの数(Mは1以上の整数)を取得する手順と、音源の数N(Nは1以上の整数)を取得する手順と、前記音源毎に音源信号に対して短時間フーリエ変換を行って音源信号のスペクトルを算出する手順と、前記マイクロホン毎に収録信号に対して短時間フーリエ変換を行って収録信号のスペクトルを算出する手順と、前記音源の数Nと、前記マイクロホンの数Mと、音源信号のスペクトルと、収録信号のスペクトルと、前記マイクロホンアレイの位置Xを推定するために用いる確率的生成モデルとを用いて、前記マイクロホンアレイの位置をX(=(X ,…,X 、Tは転置を表す)、N個の前記音源が出力する音源信号のスペクトルをS(Snftのn、f、t全てに関する集合、nは、N個のうちのn番目の音源、fは周波数ビン、tはフレームインデックス)、前記マイクロホンアレイによって收音される収録信号のスペクトルをZ(Zft のf、t全てに関する集合、mは1からMの間の整数、Z mft は、前記音源信号のスペクトルS nft と、前記マイクロホンと音源間の伝達関数R nmf の積の集合)としたとき、X、、Zの同時確率P(X,S,Z)を最大化する前記マイクロホンアレイの位置XをSとXの反復推定により推定する推定手順と、を実行させる。
上述した(1)~(6)によれば、マイクロホンアレイを構成するマイクロホンの位置を、マイクロホンで収録する際に精度良く推定することができる。
実施形態に係るマイクロホンアレイ位置推定装置の構成例を示すブロック図である。 マイクロホンアレイの空間モデルを説明するための図である。 実施形態に係るX,Sの反復推定のアルゴリズムである。 実施形態に係るマイクロホン位置の推定処理手順のフローチャートである。 評価環境を説明するための図である。 第1の音源を用いた場合の評価結果である。 第1の音源と第2の音源を用いた場合の評価結果である。 ケース1の評価とケース2の評価のx軸方向の変位とy軸方向の変位を示す図である。
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の説明に用いる図面では、各部材を認識可能な大きさとするため、各部材の縮尺を適宜変更している。
図1は、本実施形態に係るマイクロホンアレイ位置推定装置1の構成例を示すブロック図である。
図1に示すようにマイクロホンアレイ位置推定装置1は、マイクロホン数取得部11、音源数取得部12、音源信号取得部13、第1短時間フーリエ変換部14、収録信号取得部15、第2短時間フーリエ変換部16、推定部17、記憶部18、および出力部19を備えている。
また、音源7は、N個の音源70、70、…、70から構成される。マイクロホンアレイ8は、M個のマイクロホン80、80、…、80を備えている。なお、以下の説明においてN個の音源70、70、…、70のうち1つを特定しない場合は、音源70という。また、マイクロホン80、80、…、80のうち1つを特定しない場合、マイクロホン80という。なお、マイクロホンアレイの形状は円形に限らず、任意に形状や配置であってもよい。
マイクロホン数取得部11は、マイクロホンの個数を取得し、取得したマイクロホンの個数を推定部17に出力する。
音源数取得部12は、音源の個数を取得し、取得した音源の個数を推定部17に出力する。
音源信号取得部13は、音源70が出力する音響信号(以下、音源信号という)を取得し、取得した音源信号を第1短時間フーリエ変換部14に出力する。
第1短時間フーリエ変換部14は、音源信号取得部13が出力する音源信号に対して周波数領域の信号に変換して音源信号のスペクトルを算出する。なお、第1短時間フーリエ変換部14は、音源毎に音源信号のスペクトルを算出する。第1短時間フーリエ変換部14は、算出した音源信号のスペクトルを推定部17に出力する。
収録信号取得部15は、マイクロホンアレイ8が收音したMチャネルの収録信号を取得し、Mチャネルの収録信号を第2短時間フーリエ変換部16に出力する。
第2短時間フーリエ変換部16は、収録信号取得部15が出力するMチャネルの収録信号に対して周波数領域の信号に変換して音源信号のスペクトルを算出する。なお、第2短時間フーリエ変換部16は、マイクロホン80毎に収録信号のスペクトルを算出する。第2短時間フーリエ変換部16は、算出した収録信号のスペクトルを推定部17に出力する。
推定部17は、マイクロホン数取得部11が出力するマイクロホンの個数、音源数取得部12が出力する音源の個数、第1短時間フーリエ変換部14が出力する音源信号のスペクトル、および第2短時間フーリエ変換部16が出力する収録信号のスペクトルを取得する。推定部17は、記憶部18が記憶する確率モデルを用いて、取得したマイクロホンの個数と音源の個数と音源信号のスペクトルおよび収録信号のスペクトルに基づいて、マイクロホンアレイ8を構成するマイクロホン80の位置を推定する。なお、以下の説明では、マイクロホンアレイの位置(以下、マイクロホンアレイ位置ともいう)には、各マイクロホンの位置を含む集合である。推定部17は、推定したマイクロホンアレイ位置を出力部19に出力する。
出力部19は、推定部17が出力するマイクロホンアレイ位置を、音声認識装置2に出録する。なお、出力先は、他の外部装置(例えば表示装置、音源定位装置、音源分離装置等)であってもよい。なお、出力する情報には、マイクロホンを識別するための識別情報が含まれている。
[確率的生成モデルの説明]
マイクロホンアレイ8において、マイクロホン80の位置がずれている場合を想定し、マイクロホンの位置をキャリブレーションする本実施形態の手法を説明する。
図2は、マイクロホンアレイの空間モデルを説明するための図である。符号g1は音源からマイクロホンへの伝達関数である。図1に示すように、音源7からマイクロホン80へ音の伝わり方は、音源7の位置および方向と、マイクロホン80の位置によって決まる。
N個の音源70から出力された音響信号を、M個のマイクロホン80で構成されるマイクロホンアレイ8で收音する場合、n(nは1からNの間の整数)番目の音源70からの信号をsとする。また、m(mは1からMの間の整数)番目のマイクロホン80の収録信号をzとする。また、sを短時間フーリエ変換して得られる複素スペクトルをSnftとし、zを短時間フーリエ変換して得られる複素スペクトルをZmftとする。なお、fは周波数ビンであり、tはフレームインデックスである。また、伝達関数をRnf=(Rn1f,…,RnMfとする。ただし、Rnmfは、m番目のマイクロホン80とn番目の音源70間の伝達関数である。さらに、m番目のマイクロホン80mの位置をX=(x、yとし、マイクロホン80の位置Xを、X=(X ,…,X である。なお、Tは倒置を表す。
周波数領域では、次式(1)のようにマイクロホンアレイで収録される観測信号の観測スペクトルZft は伝達関数R と音源信号のスペクトルSnftの積で表される。
Figure 0007235534000008
なお、実際の音源信号のスペクトルや信号伝達過程にはランダムなノイズやゆらぎが含まれるため、観測信号と音源信号のモデル化に確率的生成モデルを用いる。なお、確率的生成モデルは、収録信号のスペクトル、音源信号のスペクトル、およびマイクロホン位置のモデルから構成される。
ここで、音源信号のスペクトルをS(Snftのf、t全てに関する集合)とし、収録信号のスペクトルをZ(Zftのf、t全てに関する集合)とし、マイクロホン位置Xの事前確率をP(X)とし、音源信号のスペクトルSの事前確率P(S)とする。また、マイクロホン位置Xと音源信号のスペクトルSが与えられたときの収録信号のスペクトルZの条件付き確率をP(Z|S,X)とする。
本実施形態では、マイクロホンアレイ8の収録信号のスペクトルZに対する音源信号のスペクトルSとマイクロホンアレイ位置Xの対数事後確率P(X,S|Z)を最大化するマイクロホンアレイ位置情報X^を推定する。
ここで、ベイズの定理より、argmax(X,S)P(X,S|Z)=argmax(X,S)P(X,S,Z)(argmaxの下の添え字は下付で表している)である。なお、argmaxは、最大値を与える引数あるいは最大点集合が、関数がその最大値をとる定義域の元全体の成す集合を表している。
P(X,S,Z)でマイクロホン位置X、音源信号のスペクトルSおよび収録信号のスペクトルZの同時確率は、次式(2)のように表すことができる。
Figure 0007235534000009
ここで、P(X,S,Z)=P(Z|S,X)P(S)P(X)であるので、各項に分布を仮定する。
まず、式(2)の右辺の第1項に付いて説明する。なお、上述したように、P(Z|S,X)は、マイクロホン位置Xと音源信号のスペクトルSが与えられたときの収録信号のスペクトルZの条件付き確率である。
音源信号のスペクトルSと伝達関数Rnmfの積を平均とした複素正規分布に従うと仮定すると、右辺の第1項logP(Z|S,X)は次式(3)のように表すことができる。
Figure 0007235534000010
なお、式(3)において、等号の上に符号cは定数項を除いて右辺と左辺が正しいことを示す等号である。*は複素共役を表す。また、σ はマイクロホンアレイの収録信号の分散を表す。
次に、式(2)の右辺の第2項に付いて説明する。なお、上述したようにP(S)は、音源信号のスペクトルSの事前確率である。
nftが平均0の複素正規分布に従うと仮定すると、右辺の第2項logP(S)は次式(4)のように表すことができる。
Figure 0007235534000011
なお、式(3)において、σ は音源信号のスペクトルの分散を表す。
次に、式(2)の右辺の第3項に付いて説明する。なお、P(X)はマイクロホンアレイ位置の事前確率であり、P(X)は、m番目のマイクロホン位置Xの事前確率である。
マイクロホン相対位置は各マイクロホンで独立であり、マイクロホン位置の変位は当方向であると仮定する。すなわち、マイクロホンアレイ位置Xは、X ̄を平均とした正規分布に従うとすると、右辺の第3項logP(X)は次式(5)のように表すことができる。
Figure 0007235534000012
なお、式(4)において、σはマイクロホンアレイ位置の分散を表す。また、X ̄mはm番目のマイクロホン80mの基準位置を表す。
上述した式(2)~(5)が確率的生成モデルである。
[マイクロホン位置の推定]
次に、マイクロホンアレイ8の収録信号のスペクトルZに対する音源信号のスペクトルSとマイクロホンアレイ位置Xの対数事後確率logP(X,S|Z)を最大化するマイクロホンアレイ位置情報X^を推定する本実施形態の手法を説明する。ここで、マイクロホンアレイ位置情報X^と音源信号のスペクトルSの事後確率は独立ではないため、音源信号のスペクトルSとの反復推定によって最大事後確率推定(MAP推定)を実現する。
このように本実施形態では、上述した確率的生成モデルに基づいて、収録信号のスペクトルSが与えられた際の事後確率を最大化するようなマイクロホン位置を推定部17が推定する。
図3は、本実施形態に係るX,Sの反復推定のアルゴリズムである。
図3に示すように、まず、X(0),S(0)をランダムに初期化する。次に、収束するまで、X(t+1)にargmax logP(X,S(t)|Z)(argmaxの下の添え字は下付で表している)の代入と、S(t+1)にargmax logP(X(t+1),S|Z)の代入とを繰り返す。
図2の示したアルゴリズムにより、マイクロホン位置Xと音源信号のスペクトルSの反復推定は、次式(5)を求めることに帰着される。
Figure 0007235534000013
なお、音源信号のスペクトルSについて、logP(X,S,Z)をSnftの関数とみなすと凸性が保証される。なお、凸性が保証される理由は、式(2)よりSnftの二次関数となるためである。これにより、極値が一つに定まるので、音源信号のスペクトルSnftを解析的に求めることができる。このため、音源信号のスペクトルSnftの極値は、logP(X,S,Z)のSnftについての偏導関数の零点を求めることで得ることができる。なお、Xの極値を解析的に求めることが困難であるため、推定部17は、全てのパラメータの組み合わせを試すグリッドサーチを用いて次式(6)を最大化するようにマイクロホンアレイ位置Xを求める。
Figure 0007235534000014
[処理手順の説明]
次に、マイクロホン位置の推定処理手順を説明する。
図4は、本実施形態に係るマイクロホン位置の推定処理手順のフローチャートである。
(ステップS1)マイクロホン数取得部11は、マイクロホンの個数を取得する。
(ステップS2)音源数取得部12は、音源の個数を取得する。
(ステップS3)音源信号取得部13は、音源70が出力する音源信号を取得する。
(ステップS4)収録信号取得部15は、マイクロホンアレイ8が收音したMチャネルの収録信号を取得する。
(ステップS5)第1短時間フーリエ変換部14は、音源信号取得部13が出力する音源信号に対して周波数領域の信号に変換して音源信号のスペクトルを算出する。また、第2短時間フーリエ変換部16は、収録信号取得部15が出力するMチャネルの収録信号に対して周波数領域の信号に変換して音源信号のスペクトルを算出する。
(ステップS6)推定部17は、記憶部18が記憶する確率モデルを用いて、取得したマイクロホンの個数と音源の個数と音源信号のスペクトルおよび収録信号のスペクトルに基づいて、マイクロホンアレイ8を構成するマイクロホン80の位置を推定する。
なお、上述した例では、推定部17は、マイクロホンアレイの位置(マイクロホン毎の位置)を推定する例を説明したが、これに限らない。推定部17は、マイクロホンの設置位置を取得し、取得した位置と推定した位置との変位を求めるようにしてもよい。そして、推定部17は、推定したマイクロホンアレイの位置の変位(マイクロホン毎の位置の変位)を出力するようにしてもよい。
なお、音声認識装置2(図1)は、例えばマイクロホンアレイ位置推定装置1が出力するマイクロホンアレイの位置の変位(マイクロホン毎の位置の変位)を用いて、マイクロホンの位置を校正する。そして、音声認識装置2は、校正した結果に基づいて、例えば伝達家関数を補正して音源定位処理や音源分離処理を行う。
[評価結果]
次に、本実施形態のマイクロホンアレイ位置推定装置1の評価を行った評価結果例を説明する。なお、評価は数値シミュレーションによって行った。
評価環境は、図5に示すように以下である。図5は、評価環境を説明するための図である。
・マイクロホンアレイ8は、8個のマイクロホン80を備える。
・マイクロホン80を、半径0.12[m]の円周状に45度の等間隔で配置した。
・マイクロホンアレイ8の中心を基準点Oとした。
・1番目(1ch)のマイクロホン80と5番目(5ch)のマイクロホン80を結ぶ方向をx軸とし、3番目(3ch)のマイクロホン80と7番目(7ch)のマイクロホン80を結ぶ方向をy軸とした。
・x軸正方向から反時計回りを角度θとし、1番目(1ch)のマイクロホン80を0度とした。
また、実験条件を以下とした。
I.第1の音源70は、0度の方向からとし、第2の音源70は90度からの方向とした。
II.第1の音源70と第2の音源70の位置は無限遠とし、音源信号が平面波であるとした。
III.第1の音源70のみを用いた場合(ケース1)と、第1の音源70と第2の音源70を用いた場合(ケース2)を評価した。
IV.1番目(1ch)のマイクロホン80に(0.02,0.02)[m]の変位を与えた際のマイクロホンの位置の校正を行うことを想定して評価を行った。
V.2番目(2ch)のマイクロホン80の位置、…、8番目のマイクロホン80は固定した。
VI.マイクロホンでは2つの音源それぞれからの音源信号を同時に収録しないとした。
VII.音源信号にはホワイトノイズを用いた。
評価は、図5において、0.001[m]おきに推定部17が各点における事後確率を算出してMAP推定を行った。また、2番目(2ch)のマイクロホン80の位置、…、8番目のマイクロホン80は固定したため、マイクロホンの位置の事前確率P(X)=…=P(X)=1とする。このため、マイクロホンアレイ位置Xの事前確率P(X)は、1番目(1ch)のマイクロホンの位置の事前確率マイクロホンP(X)と等しい(P(X)=P(x))。
なお、音源信号のスペクトルの分散σ 、マイクロホンの収録信号の分散σ は、入力音の分散と同じ5×10-6とした。また、0.02[m]程度の精度の配置を仮定して、マイクロホンアレイ位置の分散σは4×10-4[m]とした。
図6は、第1の音源70を用いた場合(ケース1)の評価結果である。図7は、第1の音源70と第2の音源70を用いた場合(ケース2)の評価結果である。図6と図7において、横軸がX[m]方向、であり、縦軸がY[m]方向である。また、アスタリスクg11は基準位置を示し、白抜き四角は1番目(1ch)のマイクロホン80の推定位置(=マイクロホンアレイ8の推定位置)を示し、白抜き丸は1番目(1ch)のマイクロホン80の真値(=マイクロホンアレイ8の真値)を示す。また、図6と時7において、濃度はlog P(Z|S,X)の値を表している。なお、1番目(1ch)のマイクロホン70の真値は、(0.14、0.02)[m]である。
図8は、ケース1の評価とケース2の評価のx軸方向の変位とy軸方向の変位を示す図である。図8に示すように、ケース1の場合、x軸方向の変位が0.02[m]であり、y軸方向の変位が-0.002[m]であった。ケース2の場合、x軸方向の変位が0.02[m]であり、y軸方向の変位が0.02[m]であった。
図6と図8に示したように、第1の音源70を用いた場合(ケース1)は、1番目のマイクロホン80(1ch)の位置においてx軸方向の変位を精度良く推定できた。
図7と図8に示したように、第1の音源70と第2の音源70を用いた場合(ケース2)は、1番目のマイクロホン80(1ch)の位置においてx軸方向の変位とy軸方向の変位を精度良く推定できた。
図6~図8に示した評価結果のように、本実施形態によれば、マイクロホン80の位置の変位を検出(推定)可能である。また、図6~図8に示した評価結果のように、本実施形態によれば、2つの異なる方位からの音源の収録信号を用いることで、マイクロホン80の位置のx軸方向とy軸方向の変位を検出(推定)可能である。
以上のように、本実施形態では、マイクロホンアレイの位置をX、音源スペクトルをS、収録音のスペクトルをZとし、Xの事前確率をP(X)、Sの事前確率をP(S)とし、X、Sが与えられたときのZの条件付き確率をP(Z|S,X)とし、X,S,Zの同時確率P(X,S,Z)をlogP(X,S,Z)=logP(Z|S,X)+logP(S)+logP(X)と表し、この同時確率を最大化するXを、SとXの反復推定により求めるようにした。
これにより、本実施形態によれば、マイクロホンアレイ位置の事前分布と確率的生成モデルを導入することにより、マイクロホンアレイの位置(マイクロホンの位置)の変位を、確率的に求めることができる。この結果、本実施形態によれば、マイクロホンアレイを構成するマイクロホンの位置を、マイクロホンで収録する際に精度良く推定することができる。
なお、本発明におけるマイクロホンアレイ位置推定装置1の機能の全てまたは一部を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりマイクロホンアレイ位置推定装置1が行う処理の全てまたは一部を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形および置換を加えることができる。
1…マイクロホンアレイ位置推定装置、11…マイクロホン数取得部、12…音源数取得部、13…音源信号取得部、14…第1短時間フーリエ変換部、15…収録信号取得部、16…第2短時間フーリエ変換部、17…推定部、18…記憶部、19…出力部、70,70,・・・,70…音源、8…マイクロホンアレイ、80,・・・,80…マイクロホン、2…音声認識装置

Claims (6)

  1. M(Mは1以上の整数)個のマイクロホンから構成されるマイクロホンアレイの位置をX(=(X ,…,X 、Tは転置を表す)、N(Nは1以上の整数)個の音源が出力する音源信号のスペクトルをS(Snftのn、f、t全てに関する集合、nは、N個のうちのn番目の音源、fは周波数ビン、tはフレームインデックス)、前記マイクロホンアレイによって收音される収録信号のスペクトルをZ(Zmftのf、t全てに関する集合、mは1からMの間の整数、Zmftは、前記音源信号のスペクトルSnftと、前記マイクロホンと音源間の伝達関数Rnmfの積の集合)としたとき、X、S、Zの同時確率P(X,S,Z)を最大化する前記マイクロホンアレイの位置XをSとXの反復推定により推定する推定部、
    を備えるマイクロホンアレイ位置推定装置。
  2. 前記推定部は、
    (0)とS(0)とをランダムに初期化した後、以下の2つの式が収束するまで反復推定を行うことで、前記マイクロホンアレイの位置Xを推定する、
    Figure 0007235534000015
    Figure 0007235534000016
    請求項1に記載のマイクロホンアレイ位置推定装置。
  3. 前記推定部は、
    グリッドサーチによって以下の関数を最大化するX^を推定することで、前記マイクロホンアレイの位置Xを推定する、
    Figure 0007235534000017
    請求項2に記載のマイクロホンアレイ位置推定装置。
  4. 前記推定部は、
    空間モデルに基づいて、確率P(X,S,Z)の確率モデルを次式とし、
    Figure 0007235534000018
    音源信号のスペクトルSと伝達関数Rnmfの積を平均とした複素正規分布に従うと仮定して右辺の第1項logP(Z|S,X)を次式とし(等号の上に符号cは定数項を除いて右辺と左辺が正しいことを示す等号であり、*は複素共役を表し、σ はマイクロホンアレイの収録信号の分散を表す)、
    Figure 0007235534000019
    nftが平均0の複素正規分布に従うと仮定して、右辺の第2項logP(S)を次式とし(σ は音源信号のスペクトルの分散を表す)、
    Figure 0007235534000020
    前記マイクロホンアレイを構成する前記マイクロホンの相対位置は各マイクロホンで独立であり、前記マイクロホンの位置Xの変位は当方向であると仮定し、前記マイクロホンアレイの位置XがX ̄を平均とした正規分布に従うとすると、右辺の第3項logP(X)を次式とする(σはマイクロホンアレイ位置の分散を表す)、
    Figure 0007235534000021
    請求項2または請求項3に記載のマイクロホンアレイ位置推定装置。
  5. マイクロホン数取得部が、マイクロホンアレイが備えるマイクロホンの数(Mは1以上の整数)を取得する手順と、
    音源数取得部が、音源の数N(Nは1以上の整数)を取得する手順と、
    第1短時間フーリエ変換部が、前記音源毎に音源信号に対して短時間フーリエ変換を行って音源信号のスペクトルを算出する手順と、
    第2短時間フーリエ変換部が、前記マイクロホン毎に収録信号に対して短時間フーリエ変換を行って収録信号のスペクトルを算出する手順と、
    推定部が、前記音源の数Nと、前記マイクロホンの数Mと、音源信号のスペクトルと、
    収録信号のスペクトルと、前記マイクロホンアレイの位置Xを推定するために用いる確率的生成モデルとを用いて、前記マイクロホンアレイの位置をX(=(X ,…,X 、Tは転置を表す)、N個の前記音源が出力する音源信号のスペクトルをS(Snftのn、f、t全てに関する集合、nは、N個のうちのn番目の音源、fは周波数ビン、tはフレームインデックス)、前記マイクロホンアレイによって收音される収録信号のスペクトルをZ(Zmftのf、t全てに関する集合、mは1からMの間の整数、Zmftは、前記音源信号のスペクトルSnftと、前記マイクロホンと音源間の伝達関数Rnmfの積の集合)としたとき、X、S、Zの同時確率P(X,S,Z)を最大化する前記マイクロホンアレイの位置XをSとXの反復推定により推定する推定手順と、
    を含むマイクロホンアレイ位置推定方法。
  6. マイクロホンアレイ位置推定のコンピュータに、
    マイクロホンアレイが備えるマイクロホンの数(Mは1以上の整数)を取得する手順と、
    音源の数N(Nは1以上の整数)を取得する手順と、
    前記音源毎に音源信号に対して短時間フーリエ変換を行って音源信号のスペクトルを算出する手順と、
    前記マイクロホン毎に収録信号に対して短時間フーリエ変換を行って収録信号のスペクトルを算出する手順と、
    前記音源の数Nと、前記マイクロホンの数Mと、音源信号のスペクトルと、収録信号のスペクトルと、前記マイクロホンアレイの位置Xを推定するために用いる確率的生成モデルとを用いて、前記マイクロホンアレイの位置をX(=(X ,…,X 、Tは転置を表す)、N個の前記音源が出力する音源信号のスペクトルをS(Snftのn、f、t全てに関する集合、nは、N個のうちのn番目の音源、fは周波数ビン、tはフレームインデックス)、前記マイクロホンアレイによって收音される収録信号のスペクトルをZ(Zmftのf、t全てに関する集合、mは1からMの間の整数、Zmftは、前記音源信号のスペクトルSnftと、前記マイクロホンと音源間の伝達関数Rnmfの積の集合)としたとき、X、S、Zの同時確率P(X,S,Z)を最大化する前記マイクロホンアレイの位置XをSとXの反復推定により推定する推定手順と、
    を実行させるプログラム。
JP2019034898A 2019-02-27 2019-02-27 マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム Active JP7235534B6 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019034898A JP7235534B6 (ja) 2019-02-27 2019-02-27 マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム
US16/790,264 US11076250B2 (en) 2019-02-27 2020-02-13 Microphone array position estimation device, microphone array position estimation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019034898A JP7235534B6 (ja) 2019-02-27 2019-02-27 マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2020141232A JP2020141232A (ja) 2020-09-03
JP7235534B2 true JP7235534B2 (ja) 2023-03-08
JP7235534B6 JP7235534B6 (ja) 2024-02-08

Family

ID=72142004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019034898A Active JP7235534B6 (ja) 2019-02-27 2019-02-27 マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム

Country Status (2)

Country Link
US (1) US11076250B2 (ja)
JP (1) JP7235534B6 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7235534B6 (ja) * 2019-02-27 2024-02-08 本田技研工業株式会社 マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム
CN113297911A (zh) * 2021-04-25 2021-08-24 普联国际有限公司 基于麦克风阵列的定位误差矫正方法、装置及存储介质
CN113453138B (zh) * 2021-06-29 2022-06-21 四川长虹电器股份有限公司 麦克风阵列中麦克风顺序的检测方法
CN114268883A (zh) * 2021-11-29 2022-04-01 苏州君林智能科技有限公司 一种选择麦克风布放位置的方法与系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010212818A (ja) 2009-03-08 2010-09-24 Univ Of Tokyo 複数のマイクロフォンにより受信された多チャンネル信号の処理方法
JP2016517679A (ja) 2013-03-19 2016-06-16 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. マイクロフォンの位置を決定するための方法及び機器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7991167B2 (en) * 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US8131542B2 (en) * 2007-06-08 2012-03-06 Honda Motor Co., Ltd. Sound source separation system which converges a separation matrix using a dynamic update amount based on a cost function
JP5654980B2 (ja) 2011-01-28 2015-01-14 本田技研工業株式会社 音源位置推定装置、音源位置推定方法、及び音源位置推定プログラム
US9305559B2 (en) * 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US10445597B2 (en) * 2017-10-17 2019-10-15 Toyota Research Institute, Inc. Systems and methods for identification of objects using audio and sensor data
EP3496417A3 (en) * 2017-12-06 2019-08-07 Oticon A/s Hearing system adapted for navigation and method therefor
JP7235534B6 (ja) * 2019-02-27 2024-02-08 本田技研工業株式会社 マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010212818A (ja) 2009-03-08 2010-09-24 Univ Of Tokyo 複数のマイクロフォンにより受信された多チャンネル信号の処理方法
JP2016517679A (ja) 2013-03-19 2016-06-16 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. マイクロフォンの位置を決定するための方法及び機器

Also Published As

Publication number Publication date
JP2020141232A (ja) 2020-09-03
JP7235534B6 (ja) 2024-02-08
US11076250B2 (en) 2021-07-27
US20200275224A1 (en) 2020-08-27

Similar Documents

Publication Publication Date Title
JP7235534B2 (ja) マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム
JP6289936B2 (ja) 音源方向推定装置、音源方向推定方法およびプログラム
JP6311197B2 (ja) 音響処理装置、及び音響処理方法
JP5539620B2 (ja) オブジェクトを追跡する方法及び追跡装置
US9971012B2 (en) Sound direction estimation device, sound direction estimation method, and sound direction estimation program
JP6859235B2 (ja) 音響処理装置、音響処理方法及びプログラム
JP6635903B2 (ja) 音源位置推定装置、音源位置推定方法、及びプログラム
US10674261B2 (en) Transfer function generation apparatus, transfer function generation method, and program
WO2014096364A1 (en) A method and a system for determining the geometry and/or the localisation of an object
JP5654980B2 (ja) 音源位置推定装置、音源位置推定方法、及び音源位置推定プログラム
Traa et al. Multichannel source separation and tracking with RANSAC and directional statistics
JP2020038123A (ja) 音響処理装置、音響処理方法、およびプログラム
JP2017150903A (ja) 音源定位装置、方法、及びプログラム
EP2716074B1 (en) Method for self-calibrating a set of acoustic sensors, and corresponding system
JP7266433B2 (ja) 音源定位装置、音源定位方法、およびプログラム
JP4738284B2 (ja) ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体
Vera-Diaz et al. Towards domain independence in CNN-based acoustic localization using deep cross correlations
Coutino et al. Greedy alternative for room geometry estimation from acoustic echoes: A subspace-based method
Levorato et al. Probabilistic 2d acoustic source localization using direction of arrivals in robot sensor networks
Jacob et al. On the bias of direction of arrival estimation using linear microphone arrays
US11594238B2 (en) Acoustic signal processing device, acoustic signal processing method, and program for determining a steering coefficient which depends on angle between sound source and microphone
JP2020043456A (ja) 音響処理装置、音響処理方法およびプログラム
JP5713933B2 (ja) 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
US20230076123A1 (en) Acoustic processing device, acoustic processing method, and storage medium
El Badawy Good Vibrations and Unknown Excitations

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190419

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20190624

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230224

R150 Certificate of patent or registration of utility model

Ref document number: 7235534

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150