JPWO2020003343A1 - 波源方向推定装置、波源方向推定方法、およびプログラム - Google Patents

波源方向推定装置、波源方向推定方法、およびプログラム Download PDF

Info

Publication number
JPWO2020003343A1
JPWO2020003343A1 JP2020526725A JP2020526725A JPWO2020003343A1 JP WO2020003343 A1 JPWO2020003343 A1 JP WO2020003343A1 JP 2020526725 A JP2020526725 A JP 2020526725A JP 2020526725 A JP2020526725 A JP 2020526725A JP WO2020003343 A1 JPWO2020003343 A1 JP WO2020003343A1
Authority
JP
Japan
Prior art keywords
frequency
wave source
estimation
direction information
source direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020526725A
Other languages
English (en)
Other versions
JP6933303B2 (ja
Inventor
友督 荒井
友督 荒井
玲史 近藤
玲史 近藤
裕三 仙田
裕三 仙田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020003343A1 publication Critical patent/JPWO2020003343A1/ja
Application granted granted Critical
Publication of JP6933303B2 publication Critical patent/JP6933303B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H3/00Measuring characteristics of vibrations by using a detector in a fluid
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/801Details
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/21Direction finding using differential microphone array [DMA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

虚像波源の誤推定の発生を低減し、高精度に波源の方向を推定するために、波動に基づく入力信号を取得する複数の入力部と、複数の入力信号のうち二つを組み合わせたペアを複数組選択する信号選択部と、ペアをなす二つの入力信号の供給元のセンサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する相対遅延時間計算部と、ペアをなす入力信号とペアの相対遅延時間とを用いて周波数別推定方向情報をペアごとに生成し、生成したペアごとの周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出し、算出した寄与率に基づいて異なるペア間の寄与率の類似度に応じた波源方向ごとの重みを計算し、全てのペアの推定方向情報に重みをつけた統合推定方向情報を生成する統合推定方向情報算出部とを備える波源方向推定装置とする。

Description

本発明は、波源方向推定装置、波源方向推定方法、およびプログラムに関する。特に、本発明は、複数のセンサによって検出された波動に基づく信号を用いて波源方向を推定する波源方向推定装置、波源方向推定方法、およびプログラムに関する。
特許文献1および非特許文献1には、2つのマイクロフォンの受音信号の到達時間差から音源の方向を推定する方法が開示されている。特許文献1および非特許文献1の方法では、音波の到達時間差の確率密度関数を周波数別に求め、それらの重ね合わせにより得られた確率密度関数から到達時間差を算出し、音源方向を推定する。
特許文献2には、位相差分布を用いる音源方向推定装置について開示されている。特許文献2の装置は、複数のマイクから複数チャンネルの音響信号を取得し、それらの信号の位相差を予め定めた周波数ビンごとに計算して位相差分布を生成する。特許文献2の装置は予め方向ごとに生成されたテンプレートと位相差分布との相似性に応じたスコアを方向ごとに計算し、算出したスコアに基づいて音源の方向を推定する。
国際公開第2018/003158号 特開2015−161551号公報
M. Kato, Y. Senda, R. Kondo, "TDOA estimation based on phase-voting cross correlation and circular standard deviation," 25th European Signal Processing Conference (EUSIPCO), EURASIP, August 2017, p.1230-1234
特許文献1および非特許文献1の方法では、信号対雑音比(SNR:Signal-to-Noise Ratio)が高い周波数帯域では、到達時間差の確率密度関数が鋭いピークを形成する。そのため、特許文献1および非特許文献1の方法によれば、高SNR帯域が少なくても精度よく到達時間差を推定することができる。しかしながら、特許文献1および非特許文献1の方法においては、周波数別の到達時間差の確率密度関数を重ね合わせる際に、音源が存在しなくても、偶然に位相が揃うことで重ね合わせた確率密度関数にピークが生成される。そのため、特許文献1および非特許文献1の方法には、虚像音源を誤推定してしまうという問題点があった。
特許文献2の装置によれば、位相差分布を用いた音源方向の推定を少ない計算量で行うことができる。特許文献2の装置では、2つのマイクロフォンの間の位相差分布を、あらかじめ方向ごとに生成されたテンプレートと比較して、相似性が高い方向を音源の方向として推定する。しかしながら、特許文献2の装置には、音源が存在しなくても、偶然に位相差分布がテンプレートと相似した場合に、虚像音源を誤推定してしまうという問題点があった。
本発明の目的は、上述した課題を解決し、虚像波源の誤推定の発生を低減し、高精度に波源の方向を推定することができる波源方向推定装置を提供することにある。
本発明の一態様の波源方向推定装置は、複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する複数の入力部と、複数の入力信号のうち二つを組み合わせたペアを複数組選択する信号選択部と、ペアをなす二つの入力信号の供給元のセンサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する相対遅延時間計算部と、ペアをなす入力信号とペアの相対遅延時間とを用いて周波数別推定方向情報をペアごとに生成し、生成したペアごとの周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出し、算出した寄与率に基づいて異なるペア間の寄与率の類似度に応じた波源方向ごとの重みを計算し、全てのペアの推定方向情報に重みをつけて統合することによって統合推定方向情報を生成する統合推定方向情報算出部とを備える。
本発明の一態様の波源方向推定方法においては、情報処理装置が、複数のセンサによって検出される波動に基づく電気信号を入力信号として取得し、複数の入力信号のうち二つを組み合わせたペアを複数組選択し、ペアをなす二つの入力信号の供給元のセンサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出し、ペアをなす入力信号とペアの相対遅延時間とを用いて周波数別推定方向情報をペアごとに生成し、生成したペアごとの周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出し、算出した寄与率に基づいて異なるペア間の寄与率の類似度に応じた波源方向ごとの重みを計算し、全てのペアの推定方向情報に重みをつけて統合することによって統合推定方向情報を生成する。
本発明の一態様のプログラムは、複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する処理と、複数の入力信号のうち二つを組み合わせたペアを複数組選択する処理と、ペアをなす二つの入力信号の供給元のセンサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する処理と、ペアをなす入力信号とペアの相対遅延時間とを用いて周波数別推定方向情報をペアごとに生成する処理と、生成したペアごとの周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出する処理と、算出した寄与率に基づいて異なるペア間の寄与率の類似度に応じた波源方向ごとの重みを計算する処理と、全てのペアの推定方向情報に重みをつけて統合することによって統合推定方向情報を生成する処理とをコンピュータに実行させる。
本発明によれば、虚像波源の誤推定の発生を低減し、高精度に波源の方向を推定することができる波源方向推定装置を提供することが可能になる。
本発明の第1の実施形態に係る波源方向推定装置の構成の一例を示すブロック図である。 本発明の第1の実施形態に係る波源方向推定装置の相対遅延時間計算部の処理の一例について説明するための概念図である。 本発明の第1の実施形態に係る波源方向推定装置の相対遅延時間計算部の処理の別の一例について説明するための概念図である。 本発明の第1の実施形態に係る波源方向推定装置の推定方向情報・周波数寄与率生成部の構成の一例を示すブロック図である。 本発明の第1の実施形態に係る波源方向推定装置の推定方向情報・周波数寄与率生成部に含まれる周波数別クロススペクトル生成部の構成の一例を示すブロック図である。 本発明の第1の実施形態に係る波源方向推定装置の推定方向情報・周波数寄与率生成部が算出するマイクペアごとの推定方向情報の一例を示す概念図である。 本発明の第1の実施形態に係る波源方向推定装置の重み計算部が算出するマイクペアごとの周波数寄与率の一例を示す概念図である。 本発明の第1の実施形態に係る波源方向推定装置にセンサを追加した構成の一例を示すブロック図である。 本発明の第1の実施形態に係る波源方向推定装置の動作の概略について説明するためのフローチャートである。 本発明の第2の実施形態に係る波源方向推定装置の構成の一例を示すブロック図である。 本発明の第2の実施形態に係る波源方向推定装置の周波数別推定方向情報生成部の構成の一例を示すブロック図である。 本発明の第2の実施形態に係る波源方向推定装置の重み生成部の構成の一例を示すブロック図である。 本発明の第2の実施形態に係る波源方向推定装置の動作の概略について説明するためのフローチャートである。 本発明の第3の実施形態に係る波源方向推定装置の構成の一例を示すブロック図である。 本発明の第4の実施形態に係る波源方向推定装置の構成の一例を示すブロック図である。 本発明の各実施形態に係る波源方向推定装置を実現するハードウェア構成の一例を示すブロック図である。
以下に、本発明を実施するための形態について図面を用いて説明する。ただし、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。なお、以下の実施形態の説明に用いる全図においては、特に理由がない限り、同様箇所には同一符号を付す。また、以下の実施形態において、同様の構成・動作に関しては繰り返しの説明を省略する場合がある。また、図面中の矢印の向きは、一例を示すものであり、ブロック間の信号の向きを限定するものではない。
(第1の実施形態)
まず、本発明の第1の実施形態に係る波源方向推定装置について図面を参照しながら説明する。以下においては、本実施形態の波源方向推定装置が、空気や水の振動波である音波の発生源(波源とも呼ぶ)の方向を推定する例について説明する。そのため、本実施形態の波源方向推定装置は、マイクロフォン(以下、マイクとも呼ぶ)によって電気信号に変換された音波の波源の方向を推定対象とする。なお、本実施形態の波源方向推定装置の推定対象は、音波の波源の方向に限定されず、振動波や電磁波などの任意の波動の波源の方向を推定することに使用できる。
(構成)
図1は、本実施形態の波源方向推定装置10の構成を示すブロック図である。波源方向推定装置10は、複数の入力端子11、信号選択部12、相対遅延時間計算部13、複数の推定方向情報・周波数寄与率生成部15、重み計算部16、および統合部17を備える。
波源方向推定装置10は、p個の入力端子11を備える(pは2以上の整数)。また、波源方向推定装置10は、R個の推定方向情報・周波数寄与率生成部15を備える(Rは1以上の整数)。図1においては、個々の入力端子11を区別するために、符号の後にハイフンを挟んで1〜pの番号を付す。同様に、図1においては、個々の推定方向情報・周波数寄与率生成部15を区別するために、符号の後にハイフンを挟んで1〜Rの番号を付す。なお、推定方向情報・周波数寄与率生成部15の番号は、波源方向の推定に用いられるマイクのペア(以下、マイクペアとも呼ぶ)の番号を表す。
〔入力端子〕
複数の入力端子11−1〜p(入力部とも呼ぶ)のそれぞれは、図示しないマイクに接続される。複数の入力端子11−1〜pのそれぞれには、異なる位置に配置された複数のマイクによって集音された音波(音信号とも呼ぶ)から変換された電気信号が入力信号として入力される。以下において、時刻tにおいてm番目の入力端子11−mに入力した入力信号をxm(t)と記載する(t:実数、m:1以上p以下の整数)。
マイクは、目標音源で発生した音と、そのマイクの周囲で発生した様々な雑音とが混ざり合った音波を集音する集音装置である。マイクは、集音した音波をデジタル信号(サンプル値系列とも呼ぶ)に変換する。複数のマイクは、目標音源からの音波を集音するために異なる位置に配置される。複数のマイクは、入力端子11−1〜pのそれぞれに接続される。以下においては、m番目のマイクによって集音された音波から変換された入力信号は、m番目の入力端子11−mに供給されるものとする。また、m番目の入力端子11−mに供給された入力信号のことを「m番目のマイクの入力信号」とも呼ぶ。
〔信号選択部〕
信号選択部12は、入力端子11−1〜pに供給されるp個の入力信号の中から2つの入力信号を選択する。信号選択部12は、選択した2つの入力信号を推定方向情報・周波数寄与率生成部15−1〜Rのいずれかに出力し、それらの入力信号の供給元であるマイクの位置情報(以下、マイク位置情報とも呼ぶ)を相対遅延時間計算部13に出力する。
推定方向情報・周波数寄与率生成部15の数Rは、入力信号の組み合わせの数Rに相当する。信号選択部12は、2個の入力信号を選択する際に、全ての組み合わせを選択してもよいし、一部の組み合わせを選択してもよい。全ての組み合わせを選択する場合、Rは以下の式1で表される。
Figure 2020003343
波源方向推定装置10は、目標音源からの音波が2つのマイク(マイクペアとも呼ぶ)に到達する時間差を用いて音源の方向を推定する。2つのマイクの間隔(以下、マイク間隔とも呼ぶ)が大きすぎると、目標音源からの音が空気や水などの媒質の影響で同一の音として観測されないために方向推定精度が低下する。また、マイク間隔が小さすぎると、2つのマイクへの音波の到達時間差が小さくなりすぎるために方向推定精度が低下する。そのため、信号選択部12は、式2に示すように、マイク間隔dが一定の範囲内に収まるマイクペアの入力信号を組み合わせて選択するのがよい(dmin、dmax:実数)。
Figure 2020003343
例えば、信号選択部12は、マイク間隔dが十分に小さい場合、マイク間隔dが最大の2つの入力信号を選択する。また、例えば、信号選択部12は、マイク間隔dが十分に小さい場合、マイク間隔dが大きい方から順に並べ、上位R位(r<C(p,2))までの入力信号の組み合わせを選択する。このように、複数のマイクからの入力信号のうち一部の組み合わせを選択することによって、方向推定精度の低下を防げるとともに、計算量を低減できる。
〔相対遅延時間計算部〕
相対遅延時間計算部13には、信号選択部12からマイク位置情報が入力される。相対遅延時間計算部13は、予め設定された音源探索対象方向(音源方向とも呼ぶ)と、マイク位置情報とを用いて、信号選択部12が選択した全てのマイクペアごとに相対遅延時間を算出する。相対遅延時間とは、2つのマイクのマイク間隔と、音源方向とに基づいて一意に定まる音波の到達時間差のことである。例えば、音源方向は、所定の角度刻みで設定される。すなわち、相対遅延時間計算部13は、設定された音源方向について相対遅延時間を計算する。相対遅延時間計算部13は、算出した音源方向と相対遅延時間とのセットを推定方向情報・周波数寄与率生成部15に出力する。
相対遅延時間は、マイクペアの位置関係によって算出方法が異なる。以下において、マイクペアの位置関係を二つ挙げ、それらのマイクペアの位置関係ごとに相対遅延時間の算出方法を示す。
図2は、3のマイクが同一直線上に配置される例である。ここで、音速をc、マイク間隔をdr、音源方向をθとする。音源方向θは、音源100の方向を推定するために設定される少なくとも一つの角である。このとき、音源方向θに対する相対遅延時間τr(θ)は、以下の式3を用いて計算できる。
Figure 2020003343
マイク間隔dは、信号選択部12によって選択される入力信号の組み合わせにより異なる。すなわち、相対遅延時間τr(θ)は、組み合わせ番号rごとに異なる。例えば、マイクペアABのマイク間隔をd1とすると、マイクペアABの相対遅延時間τ1(θ)は、以下の式4を用いて計算できる。
Figure 2020003343
また、図2のマイクペアACのマイク間隔をd2とすると、マイクペアACの相対遅延時間τ2(θ)は、以下の式5を用いて計算できる。
Figure 2020003343
このように、全てのマイクが同一直線上に位置する場合、ある音源100に関する相対遅延時間τr(θ)はマイク間隔dに比例するが、音源方向θはどのマイクから見ても同一とみなせる。
図3は、二組のマイクペアが互いに直交する直線上に配置される例である。図3の例では、音源方向θがマイクペアによって異なる。マイクペアABの相対遅延時間τ1(θ)は、以下の式6を用いて計算できる。
Figure 2020003343
一方、図3のマイクペアCDの相対遅延時間τ2(θ)は、以下の式7で計算できる。
Figure 2020003343
このように、あるマイクペアを基準とする別のマイクペアの相対遅延時間τ(θ)は、基準のマイクペアから見た音源方向θの関数として、以下の式8のように一般化できる。なお、基準とするマイクペアはどれを選んでもかまわない。
Figure 2020003343
相対遅延時間計算部13は、設定された全ての音源探索対象方向に対して相対遅延時間を計算する。例えば、相対遅延時間計算部13は、音源方向の探索範囲が10度刻みで0度から90度の場合、0度、10度、20度、・・・、90度の10種類の音源方向に関して相対遅延時間を計算する。そして、相対遅延時間計算部13は、音源探索対象方向と相対遅延時間とを推定方向情報・周波数寄与率生成部15に出力する。ただし、音源方向の探索範囲を刻む単位は、求める精度に応じて任意に設定できる。目標音源の方向を高精度で求める場合には、音源方向の探索範囲を細かく刻めばよい。
〔推定方向情報・周波数寄与率生成部〕
推定方向情報・周波数寄与率生成部15−1〜Rのそれぞれには、信号選択部12によって選択された全マイクペアのうち1組のマイクペアの入力信号が入力される。また、推定方向情報・周波数寄与率生成部15−1〜Rのそれぞれには、入力信号の供給元のマイクペアの相対遅延時間が相対遅延時間計算部13から入力される。推定方向情報・周波数寄与率生成部15−1〜Rのそれぞれは、1組のマイクペアの入力信号と相対遅延時間とを用いて、そのマイクペアの入力信号間の推定方向情報と周波数寄与率とを生成する。推定方向情報・周波数寄与率生成部15−1〜Rは、推定方向情報を統合部17に出力し、周波数寄与率を重み計算部16に出力する。
ここで、図4を参照しながら、推定方向情報・周波数寄与率生成部15の詳細な構成について説明する。図4は、推定方向情報・周波数寄与率生成部15の構成の一例を示すブロック図である。推定方向情報・周波数寄与率生成部15は、変換部151、クロススペクトル計算部152、平均計算部153、分散計算部154、周波数別クロススペクトル生成部155、逆変換部156、および周波数別推定方向情報計算部157を備える。さらに、推定方向情報・周波数寄与率生成部15は、周波数寄与率計算部158および周波数統合部159を備える。
〔変換部〕
変換部151には、信号選択部12から1組のマイクペアの入力信号(入力信号Aおよび入力信号B)が入力される。変換部151は、信号選択部12から供給された2つの入力信号を周波数領域の変換信号に変換する。変換部151は、入力信号を複数の周波数成分に分解するための変換を行う。例えば、変換部151は、フーリエ変換を用いて、入力信号を複数の周波数成分に分解する。変換部151は、クロススペクトル計算部152に変換信号を出力する。
例えば、変換部151には2種類の入力信号xm(t)が入力される。ただし、mは、入力端子11の番号である。変換部151は、入力端子11から供給された入力信号から、適当な長さの波形を一定の周期でずらしながら切り出す。このように切り出された信号区間をフレーム、切り出された波形の長さをフレーム長、フレームをずらす周期をフレーム周期と呼ぶ。そして、変換部151は、フーリエ変換を用いて、切り出された信号を周波数領域信号に変換する。ここで、nをフレーム番号とし、切り出される入力信号をxm(t,n)とする(t=0、1、・・・、K―1)。このとき、変換部151は、以下の式9を用いて入力信号x(t,n)のフーリエ変換Xm(k,n)を計算できる。
Figure 2020003343
なお、上記の式9において、jは虚数単位、expは指数関数、Kは整数である。また、kは、周波数ビン番号を表し、0以上K−1以下の整数である。なお、以下において、kのことを周波数ビン番号ではなく、周波数とも呼ぶ。
〔クロススペクトル計算部〕
クロススペクトル計算部152には、変換部151から変換信号が入力される。クロススペクトル計算部152は、変換部151から供給される変換信号を用いてクロススペクトルを計算する。クロススペクトル計算部152は、算出したクロススペクトルを平均計算部153に出力する。
例えば、クロススペクトル計算部152は、変換信号X2(k,n)の複素共役と変換信号X1(k,n)との積を計算してクロススペクトルを計算する。ここで、変換信号のクロススペクトルをS12(k,n)とする。このとき、クロススペクトル計算部152は、以下の式10を用いてクロススペクトルS12(k,n)を計算できる。
Figure 2020003343
なお、式10において、conj(X2(k,n))は変換信号X2(k,n)の複素共役を表す。また、式10ではなく、振幅成分で正規化したクロススペクトルを用いてもよい。振幅成分で正規化する場合、クロススペクトル計算部152は、以下の式11を用いてクロススペクトルS12(k,n)を計算できる。
Figure 2020003343
〔平均計算部〕
平均計算部153には、クロススペクトル計算部152からクロススペクトルが入力される。平均計算部153は、クロススペクトル計算部152から供給されたクロススペクトルの平均(平均クロススペクトルとも呼ぶ)を計算する。平均計算部153は、算出した平均クロススペクトルを周波数別クロススペクトル生成部155に出力する。
ここで、平均計算部153が過去に入力されたクロススペクトルから周波数ビンごとに平均クロススペクトルを計算する例について説明する。なお、平均計算部153は、周波数ビン単位ではなく、複数の周波数ビンを束ねたサブバンド単位で平均クロススペクトルを計算してもよい。ここで、第nフレームの周波数ビンkにおけるクロススペクトルをS12(k,n)とする、このとき、平均計算部153は、以下の式12を用いて、過去Lフレームから平均クロススペクトルSS12(k,n)を計算できる。
Figure 2020003343
また、平均計算部153は、以下の式13のリーク積分を用いて平均クロススペクトルSS12(k,n)を計算してもよい。ただし、式13において、αは、0よりも大きく、1よりも小さい実数である。
Figure 2020003343
〔分散計算部〕
分散計算部154には、平均計算部153から平均クロススペクトルが入力される。分散計算部154は、平均計算部153から供給された平均クロススペクトルを用いて分散を計算する。分散計算部154は、算出した分散を周波数別クロススペクトル生成部155に出力する。
ここで、平均クロススペクトルをSS12(k,n)とする。このとき、クロススペクトルの位相の分散の計算において円周分散を用いた場合、分散計算部154は、以下の式14を用いて分散V12(k,n)を計算する。
Figure 2020003343
なお、分散計算部154は、以下の式15を用いて分散V12(k,n)を計算してもよい。
Figure 2020003343
また、分散計算部154は、円周標準偏差を用いる場合、以下の式16を用いて分散V12(k,n)を計算できる。
Figure 2020003343
〔周波数別クロススペクトル生成部〕
周波数別クロススペクトル生成部155には、平均計算部153から平均クロススペクトルが入力され、分散計算部154から分散が入力される。周波数別クロススペクトル生成部155は、平均クロススペクトルと分散とを用いて平均クロススペクトルの周波数に対応するクロススペクトル(周波数別クロススペクトルとも呼ぶ)を計算する。周波数別クロススペクトル生成部155は、算出した周波数別クロススペクトルを逆変換部156に出力する。
ここで、周波数別クロススペクトル生成部155の構成について図面を参照しながら説明する。図5は、周波数別クロススペクトル生成部155の構成の一例を示すブロック図である。図5のように、周波数別クロススペクトル生成部155は、周波数別基本クロススペクトル計算部551、カーネル関数スペクトル生成部552、および乗算部553を有する。
〔周波数別基本クロススペクトル計算部〕
周波数別基本クロススペクトル計算部551には、平均計算部153から平均クロススペクトルが入力される。周波数別基本クロススペクトル計算部551は、平均計算部153から供給される平均クロススペクトルを用いて、平均クロススペクトルの各周波数に対応するクロススペクトル(周波数別基本クロススペクトルとも呼ぶ)を計算する。周波数別基本クロススペクトル計算部551は、算出した周波数別基本クロススペクトルを乗算部553に出力する。周波数別基本クロススペクトルは、周波数成分ごとに相関関数を計算するために算出される。周波数別基本クロススペクトル計算部551は、ある周波数に対応する相関関数(周波数別相互相関関数とも呼ぶ)を後段で求めるための周波数別基本クロススペクトルを計算する。
ここで、周波数別基本クロススペクトル計算部551が周波数kの周波数別基本クロススペクトルを計算する例について詳細に説明する。周波数別基本クロススペクトル計算部551は、周波数kの平均クロススペクトルSS12(k,n)を用いて周波数別基本クロススペクトルを計算する際、位相成分と振幅成分とを予め別々に求めた後に統合する。周波数kの周波数別基本クロススペクトルをUk(w,n)、その振幅成分を|Uk(w,n)|、その位相成分をarg(Uk(w,n))とすると、以下の式17の関係が成り立つ。ただし、式17において、wは、周波数を表し、0以上W−1以下の整数である(Wは整数)。
Figure 2020003343
以下において、周波数別基本クロススペクトル計算部551が、周波数kの平均クロススペクトルSS12(k,n)を用いて、周波数別基本クロススペクトルの振幅成分|Uk(w,n)|および位相成分arg(Uk(w,n))を求める方法について説明する。
kの定数倍の周波数の振幅成分|Uk(w,n)|には1.0が用いられる。一方、kの定数倍以外の周波数の位相成分はゼロにする。これを数式で表現すると、振幅成分|Uk(w,n)|は以下の式18で与えられる。ただし、式18において、pは1以上P以下の整数である(Pは整数)。
Figure 2020003343
波源方向推定を行うときに重要な情報は位相成分であるため、式18においては、振幅成分に適当な定数を用いている。なお、kの定数倍の周波数の振幅成分|Uk(w,n)|として、1.0の代わりに周波数kの平均クロススペクトルの絶対値|SS12(k,n)|を用いてもよい。すなわち、周波数別基本クロススペクトル計算部551は、以下の式19を用いて振幅成分|Uk(w,n)|を求めてもよい。
Figure 2020003343
kを定数倍した周波数の位相成分arg(Uk(w,n))には、周波数kの平均クロススペクトルSS12(k,n)を定数倍したものを用いる。例えば、周波数k、2k、3k、および4kの位相成分には、周波数kの位相成分arg(SS12(k,n))のそれぞれを同一の倍率で整数倍したものが用いられる。すなわち、周波数k、2k、3k、および4kの位相成分のそれぞれには、arg(SS12(k,n))、2arg(SS12(k,n))、3arg(SS12(k,n))、4arg(SS12(k,n))が用いられる。一方、kの定数倍以外の周波数の位相成分はゼロにする。したがって、周波数kに対応する周波数別基本クロススペクトルの位相成分arg(Uk(w,n))は、以下の式20を用いて計算される。なお、pは1以上P以下の整数である(P>1)。
Figure 2020003343
周波数別基本クロススペクトル計算部551は、式18や式19を用いて算出される振幅成分と、式20を用いて算出される位相成分とを、式17を用いて統合し、周波数kの周波数別基本クロススペクトルUk(w,n)を計算する。
これまで説明してきた方法では、振幅成分と位相成分を別々に求めてから周波数別基本クロススペクトルを算出した。しかし、以下の式21に示すクロススペクトルのべき乗を用いれば、振幅成分と位相成分とを求めることなく、周波数別基本クロススペクトルUk(w,n)を求めることができる。
Figure 2020003343
〔カーネル関数スペクトル生成部〕
カーネル関数スペクトル生成部552には、分散計算部154から分散が入力される。カーネル関数スペクトル生成部552は、分散計算部154から供給される分散を用いてカーネル関数スペクトルを算出する。カーネル関数スペクトルとは、カーネル関数をフーリエ変換し、その絶対値を取ったものである。なお、カーネル関数スペクトルには、カーネル関数をフーリエ変換し、その二乗を取ったものとしてもよい。また、カーネル関数スペクトルには、カーネル関数をフーリエ変換し、その絶対値の二乗を取ったものを用いてもよい。カーネル関数スペクトル生成部552は、算出したカーネル関数スペクトルを乗算部553に出力する。
ここで、カーネル関数スペクトルをG(w)、カーネル関数をg(τ)とし、カーネル関数としてガウス関数を用いる例を挙げる。このとき、ガウス関数は、以下の式22で与えられる。
Figure 2020003343
ただし、式22において、g1、2、およびg3は正の実数である。g1はガウス関数の大きさを制御し、g2はガウス関数のピークの位置を制御し、g3はガウス関数の広がりを制御する。ガウス関数の広がりを調整するg3は、周波数別相互相関関数のピークの鋭さに影響を与える。すなわち、式22は、g3が大きくなればガウス関数の広がりが大きくなることを示す。
また、以下の式23のロジスティック分布の確率密度関数をカーネル関数として用いてもよい。ただし、式23において、g4とg5は正の実数である。
Figure 2020003343
ロジスティック分布の確率密度関数は、ガウス関数と同様の形状をしているが、ガウス関数よりも裾が長い。ロジスティック分布の確率密度関数の広がりを調整するg5は、式22のガウス関数におけるg3と同様に、周波数別相互相関関数のピークの鋭さに影響を与えるパラメータである。また、ガウス関数やロジスティック分布の確率密度関数の他に、コサイン関数や一様関数をカーネル関数に用いてもよい。
カーネル関数のパラメータのうち、カーネル関数の広がりに影響を与えるg3やg5は、分散計算部154から入力される分散を用いて決定される。ここで、g3やg5のように、カーネル関数の広がりに影響を与えるパラメータのことを広がり制御パラメータと呼び、q(k,n)と表現する。カーネル関数がガウス関数の場合には、g3がq(k,n)である。分散が小さければ、周波数別相互相関関数のピークが鋭く、裾が狭くなるようにパラメータを変化させる。この場合、広がり制御パラメータを小さくする。
広がり制御パラメータは、予め設定した写像関数を用いて分散の値を変換することによって算出できる。例えば、分散がある閾値を上回れば広がり制御パラメータを大きな値(例えば10)にし、分散がある閾値を下回れば小さな値(例えば0.01)に設定する。ここで、分散をV12(k,n)とし、閾値をpthとする。このとき、第nフレームの周波数ビンkにおける広がり制御パラメータq(k,n)は、以下の式24を用いて計算できる。ただし、式24において、q1およびq2は、q1>q2を満たす正の実数である。
Figure 2020003343
また、広がり制御パラメータq(k,n)は、以下の式25のように一次関数を用いて計算してもよい。ただし、式25において、q3は正の実数であり、q4は実数である。
Figure 2020003343
3、4としては、例えば、以下の式26および式27で示す値を用いてもよい。
Figure 2020003343

Figure 2020003343
Lは平均計算部153が平均クロススペクトルを求める際に平均化したフレーム数を表す。平均クロススペクトルの誤差は平均化フレーム数Lに反比例するため、式26および式27を用いることで、平均クロススペクトルの誤差(信頼性)を考慮して広がり制御パラメータを求めることができる。
また、線形写像関数や高次の多項式関数、非線形関数などで表される分散の関数を分散の計算に用いることも可能である。また、分散をそのまま広がり制御パラメータにしてもよい。
広がり制御パラメータを求める関数は、分散だけでなく、周波数kの関数としてもよい。例えば、周波数kが大きくなるにつれて小さくなる関数を用いることができる。このような代表例としては、kの逆数を用いる例が挙げられる。この場合、式24の代わりに、以下の式28の関数を用いて広がり制御パラメータq(k,n)を計算できる。
Figure 2020003343
また、式25の代わりとして、以下の式29の関数を用いて広がり制御パラメータq(k,n)を計算できる。
Figure 2020003343
〔乗算部〕
乗算部553には、周波数別基本クロススペクトル計算部551から周波数別基本クロススペクトルが入力され、カーネル関数スペクトル生成部552からカーネル関数スペクトルが入力される。乗算部553は、周波数別基本クロススペクトル計算部551から供給される周波数別基本クロススペクトルと、カーネル関数スペクトル生成部552から供給されるカーネル関数スペクトルとの積を計算し、周波数別クロススペクトルを算出する。乗算部553は、算出した周波数別クロススペクトルを逆変換部156に出力する。
ここで、周波数別基本クロススペクトル計算部551から供給される周波数別基本クロススペクトルをUk(w,n)、カーネル関数スペクトル生成部552から供給されるカーネル関数スペクトルをG(w)とする。このとき、乗算部553は、以下の式30を用いて周波数別クロススペクトルUMk(w,n)を計算する。
Figure 2020003343
〔逆変換部〕
逆変換部156には、周波数別クロススペクトル生成部155の乗算部553から周波数別クロススペクトルが入力される。例えば、変換部151がフーリエ変換を用いて変換を行う場合、逆変換部156は逆フーリエ変換を用いて逆変換を行う。逆変換部156は、周波数別クロススペクトル生成部155から供給された周波数別クロススペクトルの逆変換を求める。
ここで、周波数別クロススペクトル生成部155から供給される周波数別クロススペクトルをUMk(w,n)とする。このとき、逆変換部156は、以下の式31を用いてUMk(w,n)を逆変換して周波数別相互相関関数uk(τ,n)を計算する。
Figure 2020003343
〔周波数別推定方向情報計算部〕
周波数別推定方向情報計算部157には、逆変換部156から周波数別相互相関関数が入力され、相対遅延時間計算部13から相対遅延時間が入力される。周波数別推定方向情報計算部157は、逆変換部156から供給された周波数別相互相関関数と、相対遅延時間計算部13から供給された相対遅延時間とを用いて、方向と相関値との対応関係を周波数別推定方向情報として求める。周波数別推定方向情報計算部157は、求めた周波数別推定方向情報を統合部17に出力する。
ここで、周波数別相互相関関数をuk(τ,n)とし、相対遅延時間をτr(θ)とする。このとき、周波数別推定方向情報計算部157は、以下の式32を用いて周波数別推定方向情報Hk,r(θ,n)を算出する。
Figure 2020003343
式32を用いれば、各方向θに対して相関値が定まるので、相関値が高い方向に音源が存在する可能性が高いと判断できる。
〔周波数寄与率計算部〕
周波数寄与率計算部158には、周波数別推定方向情報計算部157から周波数別推定方向情報が入力される。周波数寄与率計算部158は、周波数別推定方向情報計算部157から供給された周波数別推定方向情報に基づいて、音源方向ごとの推定方向情報に対する周波数別の寄与率(周波数寄与率とも呼ぶ)を計算する。周波数寄与率計算部158は、算出した周波数寄与率を重み計算部16に出力する。
例えば、周波数寄与率計算部158は、以下の式33を用いて、音源方向θがθ’のときの周波数k’の周波数寄与率yθ’,k’,r(n)を計算する。
Figure 2020003343
全ての音源方向θおよび全ての周波数kについて、式33で表記される周波数寄与率yθ’,k’,r(n)を求めると、周波数寄与率はyθ,r(k,n)と書き換えられる。
〔周波数統合部〕
周波数統合部159には、周波数別推定方向情報計算部157から周波数別推定方向情報が入力される。周波数統合部159は、周波数別推定方向情報計算部157から供給された周波数別推定方向情報を統合する。すなわち、周波数統合部159は、周波数(周波数ビン番号)ごとに別々に算出された周波数別推定方向情報を一つに統合することによって、統合された推定方向情報を生成する。例えば、周波数統合部159は、個別に求めた複数の周波数別推定方向情報を合成したり、重ね合わせたりすることにより、一つの推定方向情報に統合する。周波数統合部159は、統合された推定方向情報を統合部17に出力する。
例えば、周波数統合部159は、周波数別推定方向情報Hk,r(θ,n)の総和を計算することによって統合する。この場合、周波数統合部159は、以下の式34を用いて推定方向情報Hk(θ,n)を計算する。
Figure 2020003343
また、例えば、周波数統合部159は、周波数別推定方向情報Hk,r(θ,n)の総乗を計算することによって統合してもよい。この場合、周波数統合部159は、以下の式35を用いて推定方向情報Hr(θ,n)を計算する。
Figure 2020003343
〔重み計算部〕
重み計算部16には、推定方向情報・周波数寄与率生成部15−1〜Rのそれぞれの周波数寄与率計算部158から周波数寄与率が入力される。重み計算部16は、推定方向情報・周波数寄与率生成部15−1〜Rから供給される周波数寄与率に基づいて、マイクペア間の周波数寄与率(単に寄与率とも呼ぶ)の類似度に応じた音源方向ごとの重みを計算する。重み計算部16は、算出した音源方向ごとの重みを統合部17に出力する。
ここで、3つのマイクによって方向推定する例における重み算出方法について図面を参照しながら説明する。図6は、推定方向情報・周波数寄与率生成部15が、マイクA、マイクB、およびマイクCに関して算出する全てのマイクペア(AB、BC、AC)の推定方向情報の一例である。図7は、音源方向θがθ’の場合のマイクペアごとの周波数寄与率を示す。重み計算部16は、異なるマイクペアの寄与率が類似している方向θほど大きくなるような重みを計算する。
例えば、重み計算部16は、マイクペアABの周波数寄与率yθ,AB(k,n)およびマイクペアBCの周波数寄与率yθ,BC(k,n)を以下の式36に適用して2つのマイクペア間の類似度vθ,AB-BC(n)を計算する。
Figure 2020003343
上記の式36を一般化すると、重み計算部16は、マイクペアriの周波数寄与率yθ,ri(k,n)とマイクペアrjの周波数寄与率yθ,rj(k,n)との類似度vθ,r'(n)を以下の式37に適用して算出できる。
Figure 2020003343
なお、式37において、r’は、マイクペアriとマイクペアrjとの組み合わせ番号を表す。マイクペアriの周波数寄与率yθ,ri(k,n)と、マイクペアrの周波数寄与率yθ,rj(k,n)とが一致する場合、式37で表される類似度vθ,r'(n)は最大値1となる。
例えば、重み計算部16は、以下の式38を用いて、類似度vθ,r'(n)の相乗平均から音源方向θごとの重みaθを計算する。
Figure 2020003343
また、例えば、重み計算部16は、以下の式39を用いて、類似度vθ,r'(n)の相加平均から音源方向θごとの重みaθ(n)を計算できる。
Figure 2020003343
上述のように計算される重みは、全てのマイクペアの類似度が高いほど大きくなる。
〔統合部〕
統合部17には、推定方向情報・周波数寄与率生成部15−1〜Rから推定方向情報が入力され、重み計算部16から重みが入力される。統合部17は、推定方向情報・周波数寄与率生成部15−1〜Rから供給されるマイクペアごとの推定方向情報を全てのマイクペアについて統合し、統合した推定方向情報に重み計算部16から供給される重みをつけた統合推定方向情報を生成する。統合部17は、マイクペアごとの推定方向情報の総和や総乗を取ることで統合し、統合した推定方向情報に重みを掛けることによって統合推定方向情報を生成する。統合部17は、生成した統合推定方向情報を出力する。例えば、統合部17は、上位システム(図示しない)に統合推定方向情報を出力する。
例えば、統合部17は、以下の式40を用いて、重みaθ(n)と推定方向情報Hr(θ,n)の総乗との積を統合推定方向情報H(θ,n)として算出する。
Figure 2020003343
以上が、本実施形態の波源方向推定装置10の構成についての説明である。
なお、図8のように、波源方向推定装置10にマイクなどのセンサ110を少なくとも一つ追加した構成も本実施形態の範囲に含まれる。それぞれのセンサ110は、インターネットやイントラネットなどネットワークや、ケーブルを介して、波源方向推定装置10のいずれかの入力端子11に接続される。
例えば、センサ110は、音波を検出する場合、マイクロフォンによって実現される。例えば、センサ110は、振動波を検出する場合、振動センサによって実現される。例えば、センサ110は、電磁波を検出する場合、アンテナによって実現される。なお、センサ110は、検知対象の波動を電気信号に変換できるものであれば、その形態に限定を加えない。
(動作)
次に、本実施形態の波源方向推定装置10の動作の概略について図面を参照しながら説明する。図9は、波源方向推定装置10の動作の概略について説明するためのフローチャートである。なお、図9のフローチャートに沿った説明においては、波源方向推定装置10を動作の主体として説明する。
図9において、まず、波源方向推定装置10は、複数のマイクから入力信号を取得する(ステップS11)。
次に、波源方向推定装置10は、複数のマイクのそれぞれに対応する入力信号から2つの入力信号を選択する(ステップS12)。すなわち、波源方向推定装置10は、複数のマイクの中から2つのマイクを選択してマイクペアとする。ここでは、波源方向推定装置10は、複数のマイクペアを選択する。
次に、波源方向推定装置10は、選択された2つの入力信号の供給元である2つのマイクの間隔(マイク間隔とも呼ぶ)と、設定された音源探索対象方向(音源方向とも呼ぶ)とを用いてマイクペアごとに相対遅延時間を算出する(ステップS13)。
次に、波源方向推定装置10は、選択されたマイクペアの入力信号と相対遅延時間とを用いて、そのマイクペアの入力信号間の推定方向情報と周波数寄与率とを生成する(ステップS14)。すなわち、波源方向推定装置10は、推定方向情報と周波数寄与率とをマイクペアごとに生成する。
次に、波源方向推定装置10は、マイクペア間の周波数寄与率の類似度に応じた音源方向ごとの重みを算出する(ステップS15)。
次に、波源方向推定装置10は、マイクペアごとの推定方向情報に重みを付けて統合することで統合推定方向情報を算出する(ステップS16)。
そして、波源方向推定装置10は、統合推定方向情報を出力する(ステップS17)。
以上が、波源方向推定装置10の動作の概略についての説明である。
以上のように、本実施形態の波源方向推定装置は、複数の入力部、信号選択部、相対遅延時間計算部、複数の推定方向情報・周波数寄与率生成部、重み計算部、および統合部を備える。
入力部は、複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する。
信号選択部は、複数の入力信号のうち二つを組み合わせたペアを複数組選択する。
相対遅延時間計算部は、ペアをなす二つの入力信号の供給元のセンサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する。
推定方向情報・周波数寄与率生成部は、信号選択部によって選択された全てのペアのうち1組のペアをなす二つの入力信号を取得するとともに、取得したペアの相対遅延時間を取得する。推定方向情報・周波数寄与率生成部は、ペアをなす二つの入力信号間の周波数別相互相関関数とペアの相対遅延時間とを用いて、ペアをなす二つの入力信号間の推定方向情報と周波数別の寄与率とを生成する。
重み計算部は、複数の推定方向情報・周波数寄与率生成部から周波数ごとの寄与率を取得し、異なるペア間の寄与率の類似度に応じて波源方向ごとの重みを計算する。
統合部は、複数の推定方向情報・周波数寄与率生成部から推定方向情報を取得するとともに、重み計算部から重みを取得し、複数のペアごとの推定方向情報に重みをつけて統合して統合推定方向情報を生成する。
例えば、推定方向情報・周波数寄与率生成部は、変換部、クロススペクトル計算部、平均計算部、分散計算部、周波数別クロススペクトル生成部、逆変換部、周波数別推定方向情報計算部、周波数統合部、および周波数寄与率計算部を備える。変換部は、ペアをなす二つの入力信号を周波数領域の変換信号に変換する。クロススペクトル計算部は、変換部によって変換された変換信号を用いてクロススペクトルを計算する。平均計算部は、クロススペクトル計算部によって算出されるクロススペクトルを用いて平均クロススペクトルを計算する。分散計算部は、平均計算部によって算出される平均クロススペクトルを用いて分散を計算する。周波数別クロススペクトル生成部は、平均計算部によって算出される平均クロススペクトルと、分散計算部によって算出される分散とを用いて周波数別クロススペクトルを計算する。逆変換部は、周波数別クロススペクトル生成部によって算出される周波数クロススペクトルを逆変換して周波数別相互相関関数を計算する。周波数別推定方向情報計算部は、ペアの周波数別相互相関関数と相対遅延時間とに基づいて波源方向と相関値との対応関係である周波数別推定方向情報を計算する。周波数統合部は、周波数別推定方向情報を統合して推定方向情報を計算する。周波数寄与率計算部は、周波数別推定方向情報に基づいて波源方向ごとの推定方向情報に対する周波数別の寄与率を計算する。
例えば、重み計算部は、複数のペア間において寄与率の類似度を計算し、算出した類似度に基づいて波源方向ごとの重みを計算する。
本実施形態の波源方向推定装置は、マイクペアごとの入力信号の相互相関関数から推定方向情報を求め、複数のマイクペア間で推定方向情報を統合する。その結果、本実施形態の波源方向推定装置によれば、あるマイクペア間で偶然位相が揃うことで発生しうる、音源方向以外の方向の推定方向情報の偽ピークが小さくなるため、虚像音源を誤推定することなく、高精度に音源の方向を推定することができる。
(第2の実施形態)
次に、本発明の第2の実施形態に係る波源方向推定装置について図面を参照しながら説明する。
図10は、本実施形態の波源方向推定装置20の構成の一例を示すブロック図である。図10のように、波源方向推定装置20は、複数の入力端子21、信号選択部22、相対遅延時間計算部23、複数の周波数別推定方向情報生成部25、重み生成部26、および統合部27を備える。以下において、第1の実施形態の波源方向推定装置10と同様の構成・動作については説明を省略する場合がある。
〔入力端子〕
複数の入力端子21−1〜p(入力部とも呼ぶ)のそれぞれは、図示しないマイクに接続される(pは2以上の整数)。複数の入力端子21−1〜pのそれぞれには、異なる位置に配置されたマイクによって集音された音波(音信号とも呼ぶ)から変換された電気信号が入力信号として入力される。なお、入力端子21−1〜pは、第1の実施形態の入力端子21−1〜pと同様であるため、詳細な説明は省略する。
〔信号選択部〕
信号選択部22は、入力端子21−1〜pに供給されるp個の入力信号のうちの2つの入力信号を選択する。信号選択部22は、選択した2つの入力信号を周波数別推定方向情報生成部25−1〜Rに出力し、それらの入力信号の供給元であるマイクの位置情報(以下、マイク位置情報とも呼ぶ)を相対遅延時間計算部23に出力する(Rは1以上の整数)。なお、信号選択部22は、第1の実施形態の信号選択部12と同様であるため、詳細な説明は省略する。
〔相対遅延時間計算部〕
相対遅延時間計算部23には、信号選択部22からマイク位置情報が入力される。相対遅延時間計算部23は、予め設定された音源探索対象方向(音源方向とも呼ぶ)と、マイク位置情報とを用いて、信号選択部22が選択した全てのマイクペアごとに相対遅延時間を計算する。相対遅延時間計算部23は、設定された音源方向と相対遅延時間とをセットにして周波数別推定方向情報生成部25に出力する。なお、相対遅延時間計算部23は、第1の実施形態の相対遅延時間計算部13と同様であるため、詳細な説明は省略する。
〔周波数別推定方向情報生成部〕
周波数別推定方向情報生成部25−1〜Rのそれぞれには、信号選択部22によって選択された全マイクペアのうち1組のマイクペアの入力信号が入力される。また、周波数別推定方向情報生成部25−1〜Rのそれぞれには、入力信号の供給元のマイクペアの相対遅延時間が相対遅延時間計算部23から入力される。周波数別推定方向情報生成部25−1〜Rのそれぞれは、1組のマイクペアの入力信号と相対遅延時間とを用いて、そのマイクペアごとに周波数別推定方向情報を生成する。周波数別推定方向情報生成部25−1〜Rは、生成したマイクペアごとの周波数別推定方向情報を重み生成部26および統合部27に出力する。
ここで、図11を参照しながら、周波数別推定方向情報生成部25の詳細な構成について説明する。図11は、周波数別推定方向情報生成部25の構成の一例を示すブロック図である。周波数別推定方向情報生成部25は、変換部251、クロススペクトル計算部252、平均計算部253、分散計算部254、周波数別クロススペクトル生成部255、逆変換部256、および周波数別推定方向情報計算部257を備える。すなわち、周波数別推定方向情報生成部25は、第1の実施形態の推定方向情報・周波数寄与率生成部15から周波数統合部159および周波数寄与率計算部158を省いた構成を有する。なお、変換部251、クロススペクトル計算部252、平均計算部253、分散計算部254、周波数別クロススペクトル生成部255、逆変換部256、および周波数別推定方向情報計算部257は、第1の実施形態の対応する構成と同様である。そのため、変換部251、クロススペクトル計算部252、平均計算部253、分散計算部254、周波数別クロススペクトル生成部255、逆変換部256、および周波数別推定方向情報計算部257についての詳細な説明は省略する。
〔重み生成部〕
重み生成部26には、周波数別推定方向情報生成部25−1〜Rのそれぞれからマイクペアごとの周波数別推定方向情報が入力される。重み生成部26は、周波数別推定方向情報生成部25−1〜Rのそれぞれから供給されるマイクペアごとの周波数別推定方向情報を用いて、推定方向情報がピークをもつ音源方向ごとの重みを計算する。重み生成部26は、算出した音源方向ごとの重みを統合部27に出力する。
ここで、図12を参照しながら、重み生成部26の詳細な構成について説明する。図12は、重み生成部26の構成の一例を示すブロック図である。重み生成部26は、複数の周波数統合部261−1〜R、複数の波源方向候補選出部262−1〜R、波源方向候補統合部263、複数の波源方向候補別周波数寄与率計算部264−1〜R、および重み計算部265を有する。周波数統合部261−1〜R、波源方向候補選出部262−1〜R、および波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれは、いずれかのマイクペアに対応する。そのため、周波数統合部261−1〜R、波源方向候補選出部262−1〜R、および波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれには、マイクペアの番号(1〜R)を付す。
〔周波数統合部〕
周波数統合部261−1〜Rのそれぞれには、周波数別推定方向情報生成部25−1〜Rのそれぞれから周波数別推定方向情報が入力される。周波数統合部261−1〜Rのそれぞれは、周波数別推定方向情報生成部25−1〜Rのそれぞれから供給される周波数別推定方向情報を統合し、推定方向情報を計算する。なお、周波数統合部261の動作は、第1の実施形態の周波数統合部159と同様であるため、詳細な説明は省略する。周波数統合部261−1〜Rのそれぞれは、算出した推定方向情報を波源方向候補選出部262−1〜Rのそれぞれに出力する。
〔波源方向候補選出部〕
波源方向候補選出部262−1〜Rのそれぞれには、周波数統合部261−1〜Rのそれぞれから推定方向情報が入力される。波源方向候補選出部262−1〜Rのそれぞれは、周波数統合部261−1〜Rのそれぞれから供給される推定方向情報からピークを検出し、ピークの方向を波源方向候補として選出する。波源方向候補選出部262−1〜Rのそれぞれは、選出した波源方向候補を波源方向候補統合部263に出力する。
例えば、波源方向候補選出部262は、推定方向情報が極大値を取る音源方向θを波源方向候補として選出する。また、例えば、波源方向候補選出部262は、音源数が3つと事前に仮定できる場合には、推定方向情報が大きい順に3つのピークを選別し、それら3つの値を取る音源方向θを波源方向候補として選出してもよい。特に、波源方向候補選出部262は、音源数が1つと事前に仮定できる場合には、推定方向情報が最大値となる音源方向θを波源方向候補として選出する。この場合、周波数統合部261から供給される推定方向情報をHr(θ,n)とすると、波源方向候補選出部262は、以下の式41を用いて、推定方向情報Hr(θ,n)が最大値を取るような推定方向情報Hr(θ,n)の引数を要素とする集合を求める。
Figure 2020003343
〔波源方向候補統合部〕
波源方向候補統合部263には、波源方向候補選出部262−1〜Rのそれぞれから波源方向候補が入力される。波源方向候補統合部263は、波源方向候補選出部262−1〜Rのそれぞれによって選出された波源方向候補を統合する。波源方向候補統合部263は、統合した波源方向候補を波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれに出力する。
ここで、波源方向候補選出部262−1〜Rのそれぞれによって選出されたマイクペアごとの複数の波源方向候補をベクトルφiとする。波源方向候補統合部263は、以下の式42を用いて波源方向候補を統合し、統合した波源方向候補Φ'i(n)を計算する。
Figure 2020003343
ここで、Φ'i(n)の成分で重複する方向がある場合、波源方向候補統合部263は、重複する方向を省いて、以下の式43を用いてマイクペアごとの波源方向候補を全てのマイクペアについて統合し、統合した波源方向候補Φ'i(n)を計算する。ただし、式43において、Iは全ての波源方向候補の数を示す。
Figure 2020003343
〔波源方向候補別周波数寄与率計算部〕
波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれには、周波数別推定方向情報生成部25−1〜Rのそれぞれからマイクペアごとの周波数別推定方向情報が入力される。また、波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれには、統合された波源方向候補が波源方向候補統合部263から入力される。波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれは、マイクペアごとの周波数別推定方向情報と、統合された波源方向候補とを用いて、波源方向候補ごとの推定方向情報に対する周波数寄与率である波源方向候補別周波数寄与率を計算する。波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれは、算出した波源方向候補別周波数寄与率を重み計算部265に出力する。第1の実施形態の周波数寄与率計算部158は、全ての音源方向について周波数寄与率を求める。それに対し、本実施形態の波源方向候補別周波数寄与率計算部264は、選出された波源方向候補について周波数寄与率を求める。
例えば、波源方向候補別周波数寄与率計算部264は、ある波源方向候補φiの周波数kの波源方向候補別周波数寄与率yφi,r(k,n)を以下の式44を用いて計算する。ただし、式44において、Hk,r(Φi,n)は、周波数別推定方向情報を示す。
Figure 2020003343
〔重み計算部〕
重み計算部265には、波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれから波源方向候補別周波数寄与率が入力される。重み計算部265は、波源方向候補別周波数寄与率計算部264−1〜Rのそれぞれから供給される波源方向候補別周波数寄与率を用いて、マイクペア間の周波数寄与率の類似度に応じた波源方向候補ごとの重みを計算する。重み計算部265は、算出した波源方向候補ごとの重みを統合部27に出力する。
第1の実施形態の重み計算部16は、全ての音源方向について重みを求める。それに対し、本実施形態の重み計算部265は、波源方向候補について重みを求める。重み計算部265が算出する波源方向候補ごとの重みをaΦ(n)と表記する。重み計算部265のその他の動作は重み計算部16と同様であるため、詳細な説明は省略する。
〔統合部〕
統合部27には、周波数別推定方向情報生成部25−1〜Rのそれぞれから周波数別推定方向情報が入力され、重み生成部26から波源方向候補ごとの重みが入力される。統合部27は、周波数別推定方向情報生成部25−1〜Rから供給される周波数別推定方向情報を波源方向候補ごとに全てのマイクペアについて統合し、統合した波源方向候補ごとの周波数別推定方向情報に重みを付け、波源方向候補ごとの統合推定方向情報を算出する。統合部27は、マイクペアごとの周波数別推定方向情報の総和や相乗を取ることで統合し、統合した推定方向情報に重みを掛けることによって波源方向候補ごとの統合推定方向情報を生成する。例えば、統合部27は、以下の式45を用いて、波源方向候補Φごとの統合推定方向情報H(Φ,n)を算出する。
Figure 2020003343
ただし、式45において、統合推定方向情報H(Φ,n)は、波源方向候補Φごとに周波数別推定方向情報を統合した推定方向情報を表す。統合部27は、周波数統合部261と同様に統合推定方向情報H(Φ,n)を計算する。ただし、周波数統合部261が全ての音源方向について推定方向情報を求めるのに対し、統合部27は波源方向候補Φについて推定方向情報を求める。
(動作)
次に、本実施形態の波源方向推定装置20の動作の概略について図面を参照しながら説明する。図13は、波源方向推定装置20の動作の概略について説明するためのフローチャートである。なお、図13のフローチャートに沿った説明においては、波源方向推定装置20を動作の主体として説明する。
図13において、まず、波源方向推定装置20は、複数のマイクから入力信号を取得する(ステップS21)。
次に、波源方向推定装置20は、複数のマイクのそれぞれに対応する入力信号から2つの入力信号を選択する(ステップS22)。すなわち、波源方向推定装置20は、複数のマイクの中から2つのマイクを選択してマイクペアとする。ここでは、波源方向推定装置20は、複数のマイクペアを選択する。
次に、波源方向推定装置20は、選択された2つの入力信号の供給元である2つのマイクの間隔(マイク間隔とも呼ぶ)と、設定された音源探索対象方向(音源方向とも呼ぶ)とを用いてマイクペアごとに相対遅延時間を算出する(ステップS23)。
次に、波源方向推定装置20は、選択されたマイクペアの入力信号と相対遅延時間とを用いて、そのマイクペアの周波数別推定方向情報を生成する(ステップS24)。すなわち、波源方向推定装置20は、周波数別推定方向情報をマイクペアごとに生成する。
次に、波源方向推定装置20は、マイクペアごとの周波数別推定方向情報を統合した推定方向情報に基づいて波源方向候補を選出し、波源方向候補別に周波数寄与率を計算する(ステップS25)。
次に、波源方向推定装置20は、波源方向候補別周波数寄与率を用いて、マイクペア間の周波数寄与率の類似度に応じた波源方向候補ごとの重みを計算する(ステップS26)。
次に、波源方向推定装置20は、波源方向候補ごとの重みに基づいて、波源方向候補ごとに周波数別推定方向情報を統合して統合推定方向情報を算出する(ステップS27)。
そして、波源方向推定装置20は、統合推定方向情報を出力する(ステップS28)。
以上が、波源方向推定装置20の動作の概略についての説明である。
以上のように、本実施形態の波源方向推定装置は、複数の入力部、信号選択部、相対遅延時間計算部、複数の周波数別推定方向情報生成部、重み生成部、および統合部を備える。
入力部は、複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する。
信号選択部は、複数の入力信号のうち二つを組み合わせたペアを複数組選択する。
相対遅延時間計算部は、ペアをなす二つの入力信号の供給元のセンサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する。
周波数別推定方向情報生成部は、信号選択部によって選択された全てのペアのうち1組のペアをなす二つの入力信号を取得するとともに、取得したペアの相対遅延時間を取得する。周波数別推定方向情報生成部は、ペアをなす二つの入力信号を用いて算出される周波数別相互相関関数とペアの相対遅延時間とを用いて、ペアごとの周波数別推定方向情報を計算する。
重み生成部は、複数の周波数別推定方向情報生成部からペアごとの周波数別推定方向情報を取得する。重み生成部は、取得したペアごとの周波数別推定方向情報に基づいて波源方向候補を計算し、算出した波源方向候補ごとに重みを計算する。
統合部は、複数の周波数別推定方向情報生成部からペアごとの周波数別推定方向情報を取得するとともに、重み生成部から重みを取得する。統合部は、複数のペアごとの周波数別推定方向情報に重みをつけて統合して統合推定方向情報を生成する。
例えば、周波数別推定方向情報生成部は、変換部、クロススペクトル計算部、平均計算部、分散計算部、周波数別クロススペクトル生成部、逆変換部、および周波数別推定方向情報計算部を有する。変換部は、ペアをなす二つの入力信号を周波数領域の変換信号に変換する。クロススペクトル計算部は、変換部によって変換された変換信号を用いてクロススペクトルを計算する。平均計算部は、クロススペクトル計算部によって算出されるクロススペクトルを用いて平均クロススペクトルを計算する。分散計算部と、平均計算部によって算出される平均クロススペクトルを用いて分散を計算する。周波数別クロススペクトル生成部は、平均計算部によって算出される平均クロススペクトルと、分散計算部によって算出される分散とを用いて周波数別クロススペクトルを計算する。逆変換部は、周波数別クロススペクトル生成部によって算出される周波数クロススペクトルを逆変換して周波数別相互相関関数を計算する。周波数別推定方向情報計算部は、ペアの周波数別相互相関関数と相対遅延時間とに基づいて波源方向と相関値との対応関係である周波数別推定方向情報を計算する。
例えば、重み生成部は、複数の周波数統合部、複数の波源方向候補選出部、波源方向候補統合部、複数の波源方向候補別周波数寄与率計算部、および重み計算部を有する。周波数統合部は、周波数別推定方向情報を統合してペアごとの推定方向情報を計算する。波源方向候補選出部は、ペアごとの推定方向情報からピークを検出し、ピークとなる方向をペアごとの波源方向候補として選出する。波源方向候補統合部は、複数の波源方向候補選出部からペアごとの波源方向候補を取得し、取得したペアごとの波源方向候補を統合する。波源方向候補別周波数寄与率計算部は、統合された波源方向候補と周波数別推定方向情報とに基づいて、波源方向候補ごとの推定方向情報に対する周波数別の寄与率を計算する。重み計算部は、波源方向候補ごとの推定方向情報に対する周波数別の寄与率を複数の波源方向候補別周波数寄与率計算部から取得する。重み計算部は、取得した波源方向候補ごとの推定方向情報に対する周波数別の寄与率に基づいて波源方向候補ごとの重みを計算する。
例えば、重み計算部は、複数のペア間の波源方向候補別の周波数寄与率の類似度を計算し、算出した類似度に基づいて波源方向候補ごとの重みを求める。
以上で説明したように、本実施形態の波源方向推定装置は、マイクペアごとに波源方向候補を求め、波源方向候補ごとの重みに基づいて統合推定方向情報を求める。そのため、虚像音源を誤推定することなく高精度に音源の方向を推定することができるという効果に加えて、計算量を低減できるという効果を有する。
(第3の実施形態)
次に、本発明の第3の実施形態に係る波源方向推定装置について図面を参照しながら説明する。本実施形態の波源方向推定装置は、第1および第2の実施形態の波源推定装置を上位概念化した構成である。なお、本実施形態においては、波源を音源に限定せず、任意の波動の波源の方向を推定対象とする。
図14は、本実施形態の波源方向推定装置30の構成の一例を示すブロック図である。図14のように、波源方向推定装置30は、入力端子31、信号選択部32、相対遅延時間計算部33、および統合推定方向情報算出部35を備える。以下において、第1の実施形態の波源方向推定装置10や、第2の実施形態の波源方向推定装置20と同様の構成・動作については説明を省略する場合がある。
〔入力端子〕
複数の入力端子31−1〜p(入力部とも呼ぶ)のそれぞれは、図示しないマイクに接続される(pは2以上の整数)。複数の入力端子31−1〜pのそれぞれには、異なる位置に配置されたセンサによって集音された波動(波動信号とも呼ぶ)から変換された電気信号が入力信号として入力される。なお、入力端子31−1〜pは、第1および第2の実施形態の対応する構成と同様であるため、詳細な説明は省略する。
〔信号選択部〕
信号選択部32は、入力端子31−1〜pに供給されるp個の入力信号のうちの2つの入力信号(入力信号のペアとも呼ぶ)を複数組選択する。信号選択部32は、選択した複数組の入力信号のペアを統合推定方向情報算出部35に出力し、それらの入力信号の供給元であるセンサの位置情報(以下、センサ位置情報とも呼ぶ)を相対遅延時間計算部33に出力する。なお、信号選択部32は、第1および第2の実施形態の対応する構成と同様であるため、詳細な説明は省略する。
〔相対遅延時間計算部〕
相対遅延時間計算部33には、信号選択部32からセンサ位置情報が入力される。相対遅延時間計算部33は、センサ位置情報と音源探索対象方向(音源方向とも呼ぶ)とを用いて、信号選択部32が選択した全ての入力信号のペア間の相対遅延時間を計算する。相対遅延時間計算部33は、設定された音源方向と相対遅延時間とをセットにして統合推定方向情報算出部35に出力する。なお、相対遅延時間計算部33は、第1および第2の実施形態の対応する構成と同様であるため、詳細な説明は省略する。
〔統合推定方向情報算出部〕
統合推定方向情報算出部35には、複数組の入力信号のペアが信号選択部32から入力される。また、統合推定方向情報算出部35には、信号選択部32によって選択された全ての入力信号のペアの相対遅延時間が相対遅延時間計算部33から入力される。
統合推定方向情報算出部35は、複数組の入力信号のペアと、それらの入力信号のペアの相対遅延時間とを用いて、複数の入力信号のペアに関する周波数ごとの推定方向情報(周波数別推定方向情報とも呼ぶ)を生成する。統合推定方向情報算出部35は、生成した入力信号のペアごとの周波数別推定方向情報に基づいて、波源方向ごとの推定方向情報に対する周波数寄与率を算出する。統合推定方向情報算出部35は、算出した周波数寄与率に基づいて、入力信号のペア間の寄与率の類似度に応じた波源方向ごとの重みを計算する。統合推定方向情報算出部35は、入力信号のペアごとの推定方向情報に重みをつけて統合することによって統合推定方向情報を生成する。統合推定方向情報算出部35は、生成した統合推定方向情報を出力する。
第1の実施形態の波源方向推定装置10に対応させると、統合推定方向情報算出部35は、推定方向情報・周波数寄与率生成部15、重み計算部16、および統合部17を含む構成である。また、第2の実施形態の波源方向推定装置20に対応させると、統合推定方向情報算出部35は、周波数別推定方向情報生成部25、重み生成部26、および統合部27を含む構成である。
以上のように、本実施形態の波源方向推定装置は、複数の入力部、信号選択部、相対遅延時間計算部、および統合推定方向情報算出部を備える。
入力部は、複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する。
信号選択部は、複数の入力信号のうち二つを組み合わせたペアを複数組選択する。相対遅延時間計算部は、ペアをなす二つの入力信号の供給元のセンサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する。
統合推定方向情報算出部は、ペアをなす入力信号とペアの相対遅延時間とを用いて周波数別推定方向情報をペアごとに生成する。統合推定方向情報算出部は生成したペアごとの周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出する。統合推定方向情報算出部は、算出した寄与率に基づいて異なるペア間の寄与率の類似度に応じた波源方向ごとの重みを計算し、全てのペアの推定方向情報に重みをつけて統合することによって統合推定方向情報を生成する。
例えば、信号選択部は、センサの間隔に基づいて、複数の入力信号から少なくとも二つの入力信号を組み合わせたペアを選択する。
例えば、相対遅延時間計算部は、一つの入力信号のペアの供給元であるセンサのペアに対する波源探索方向を基準として、信号選択部によって選択された全ての入力信号のペアの相対遅延時間を、基準である波源探索方向の関数として計算する。
本実施形態の波源方向推定装置によれば、虚像音源を誤推定することなく、高精度に音源の方向を推定することができる。
(第4の実施形態)
次に、本発明の第4の実施形態に係る波源方向推定装置について図面を参照しながら説明する。本実施形態の波源方向推定装置は、第3の実施形態の波源方向推定装置に波源方向算出部を追加した構成を有する。
図15は、本実施形態の波源方向推定装置40の構成を表すブロック図である。波源方向推定装置40は、入力端子41、信号選択部42、相対遅延時間計算部43、統合推定方向情報算出部45、および波源方向算出部46を備える。なお、入力端子41、信号選択部42、相対遅延時間計算部43、および統合推定方向情報算出部45は、第3の実施形態の波源方向推定装置30の対応する構成と同様であるため、詳細な説明を省略する。
〔波源方向算出部〕
波源方向算出部46には、統合推定方向情報算出部45から統合推定方向情報が入力される。波源方向算出部46は、統合推定方向情報を用いて、波源方向を計算する。波源方向算出部46は、計算した波源方向を出力する。
波源方向算出部46における波源方向の計算方法を以下で詳細に説明する。統合推定方向情報算出部45から入力された統合推定方向情報は、ピークが大きいほど信頼性(音源の存在可能性)が高い。そのため、例えば音源数が1つと事前に仮定できる場合には、波源方向算出部46は、統合推定方向情報が最大となる方向を推定方向として出力する。ここで、統合推定方向情報算出部45から入力された統合推定方向情報をH(θ,n)とする。波源方向算出部46は、以下の式46を用いて、統合推定方向情報H(θ,n)が最大値を取るような統合推定方向情報H(θ,n)の引数を要素とする集合を波源方向Θとして算出できる。なお、式46において、θは全ての波源方向または波源方向候補を表す。
Figure 2020003343
また、統合推定方向情報のピークが閾値を超える場合には、波源方向算出部28は、閾値を超えるピークを有する方向を音源とみなし、閾値を超える方向を推定方向として出力することもできる。
また、本実施形態の波源方向推定装置は、一定時間Tごとに統合推定方向情報が最大になる時刻に対応する方向を音源方向として推定することもできる。ただし、音源の方向は、一定時間Tの間で変化しない、あるいは変化の大きさが無視できるほど小さいと仮定する。このように仮定することによって、波源方向の推定精度を向上させることができる。
以上のように、本実施形態の波源方向推定装置は、複数の入力部、信号選択部、相対遅延時間計算部、統合推定方向情報算出部、および波源方向算出部を備える。例えば、波源方向算出部は、一定時間ごとに統合推定方向情報が最大になる時刻に対応する方向を波源方向として算出する。本実施形態の波源方向推定装置によれば、虚像音源を誤推定することなく、高精度に音源の方向を推定することができる。
(ハードウェア)
ここで、各実施形態に係る波源方向推定装置の処理を実行するハードウェア構成について、図16の情報処理装置90を一例として挙げて説明する。なお、図16の情報処理装置90は、各実施形態の波源方向推定装置の処理を実行するための構成例であって、本発明の範囲を限定するものではない。
図16のように、情報処理装置90は、プロセッサ91、主記憶装置92、補助記憶装置93、入出力インターフェース95および通信インターフェース96を備える。図16においては、インターフェースをI/F(Interface)と略して表記する。プロセッサ91、主記憶装置92、補助記憶装置93、入出力インターフェース95および通信インターフェース96は、バス99を介して互いにデータ通信可能に接続される。また、プロセッサ91、主記憶装置92、補助記憶装置93および入出力インターフェース95は、通信インターフェース96を介して、インターネットやイントラネットなどのネットワークに接続される。
プロセッサ91は、補助記憶装置93等に格納されたプログラムを主記憶装置92に展開し、展開されたプログラムを実行する。本実施形態においては、情報処理装置90にインストールされたソフトウェアプログラムを用いる構成とすればよい。プロセッサ91は、本実施形態に係る波源方向推定装置による処理を実行する。
主記憶装置92は、プログラムが展開される領域を有する。主記憶装置92は、例えばDRAM(Dynamic Random Access Memory)などの揮発性メモリとすればよい。また、MRAM(Magnetoresistive Random Access Memory)などの不揮発性メモリを主記憶装置92として構成・追加してもよい。
補助記憶装置93は、種々のデータを記憶する。補助記憶装置93は、ハードディスクやフラッシュメモリなどのローカルディスクによって構成される。なお、種々のデータを主記憶装置92に記憶させる構成とし、補助記憶装置93を省略することも可能である。
入出力インターフェース95は、情報処理装置90と周辺機器とを接続するためのインターフェースである。通信インターフェース96は、規格や仕様に基づいて、インターネットやイントラネットなどのネットワークを通じて、外部のシステムや装置に接続するためのインターフェースである。入出力インターフェース95および通信インターフェース96は、外部機器と接続するインターフェースとして共通化してもよい。
情報処理装置90には、必要に応じて、キーボードやマウス、タッチパネルなどの入力機器を接続するように構成してもよい。それらの入力機器は、情報や設定の入力に使用される。なお、タッチパネルを入力機器として用いる場合は、表示機器の表示画面が入力機器のインターフェースを兼ねる構成とすればよい。プロセッサ91と入力機器との間のデータ通信は、入出力インターフェース95に仲介させればよい。
また、情報処理装置90には、情報を表示するための表示機器を備え付けてもよい。表示機器を備え付ける場合、情報処理装置90には、表示機器の表示を制御するための表示制御装置(図示しない)が備えられていることが好ましい。表示機器は、入出力インターフェース95を介して情報処理装置90に接続すればよい。
また、情報処理装置90には、必要に応じて、ディスクドライブを備え付けてもよい。ディスクドライブは、バス99に接続される。ディスクドライブは、プロセッサ91と図示しない記録媒体(プログラム記録媒体)との間で、記録媒体からのデータ・プログラムの読み出し、情報処理装置90の処理結果の記録媒体への書き込みなどを仲介する。記録媒体は、例えば、CD(Compact Disc)やDVD(Digital Versatile Disc)などの光学記録媒体で実現できる。また、記録媒体は、USB(Universal Serial Bus)メモリやSD(Secure Digital)カードなどの半導体記録媒体や、フレキシブルディスクなどの磁気記録媒体、その他の記録媒体によって実現してもよい。
以上が、各実施形態に係る波源方向推定装置を可能とするためのハードウェア構成の一例である。なお、図16のハードウェア構成は、各実施形態に係る波源方向推定装置の演算処理を実行するためのハードウェア構成の一例であって、本発明の範囲を限定するものではない。また、各実施形態に係る波源方向推定装置に関する処理をコンピュータに実行させるプログラムも本発明の範囲に含まれる。さらに、各実施形態に係るプログラムを記録したプログラム記録媒体も本発明の範囲に含まれる。
各実施形態の波源方向推定装置の構成要素は、任意に組み合わせることができる。また、各実施形態の波源方向推定装置の構成要素は、ソフトウェアによって実現してもよいし、回路によって実現してもよい。
以上、実施形態を参照して本発明を説明してきたが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する複数の入力手段と、
複数の前記入力信号のうち二つを組み合わせたペアを複数組選択する信号選択手段と、
前記ペアをなす二つの前記入力信号の供給元の前記センサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する相対遅延時間計算手段と、
前記ペアをなす前記入力信号と前記ペアの相対遅延時間とを用いて周波数別推定方向情報を前記ペアごとに生成し、生成した前記ペアごとの前記周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出し、算出した前記寄与率に基づいて異なる前記ペア間の前記寄与率の類似度に応じた波源方向ごとの重みを計算し、全ての前記ペアの前記推定方向情報に前記重みをつけて統合することによって統合推定方向情報を生成する統合推定方向情報算出手段とを備える波源方向推定装置。
(付記2)
前記信号選択手段は、
前記センサの間隔に基づいて、複数の前記入力信号から二つの前記入力信号を組み合わせた前記ペアを選択する付記1に記載の波源方向推定装置。
(付記3)
前記相対遅延時間計算手段は、
一つの前記ペアをなす二つの前記入力信号の供給元である前記センサにおける波源探索方向を基準として、前記信号選択手段によって選択された全ての前記ペアの前記相対遅延時間を、基準である前記波源探索方向の関数として計算する付記1または2に記載の波源方向推定装置。
(付記4)
前記統合推定方向情報算出手段は、
前記信号選択手段によって選択された全ての前記ペアのうち1組の前記ペアをなす二つの前記入力信号を取得するとともに、取得した前記ペアの前記相対遅延時間を取得し、前記ペアをなす二つの前記入力信号間の周波数別相互相関関数と前記ペアの前記相対遅延時間とを用いて、前記ペアをなす二つの前記入力信号間の前記推定方向情報と周波数別の前記寄与率とを生成する複数の推定方向情報・周波数寄与率生成手段と、
複数の前記推定方向情報・周波数寄与率生成手段から周波数ごとの前記寄与率を取得し、異なる前記ペア間の前記寄与率の類似度に応じて波源方向ごとの前記重みを計算する重み計算手段と、
複数の前記推定方向情報・周波数寄与率生成手段から前記推定方向情報を取得するとともに、前記重み計算手段から前記重みを取得し、複数の前記ペアごとの前記推定方向情報に前記重みをつけて統合して前記統合推定方向情報を生成する統合手段とを有する付記1乃至3のいずれか一項に記載の波源方向推定装置。
(付記5)
前記推定方向情報・周波数寄与率生成手段は、
前記ペアをなす二つの前記入力信号を周波数領域の変換信号に変換する変換手段と、
前記変換手段によって変換された前記変換信号を用いてクロススペクトルを計算するクロススペクトル計算手段と、
前記クロススペクトル計算手段によって算出される前記クロススペクトルを用いて平均クロススペクトルを計算する平均計算手段と、
前記平均計算手段によって算出される前記平均クロススペクトルを用いて分散を計算する分散計算手段と、
前記平均計算手段によって算出される前記平均クロススペクトルと、前記分散計算手段によって算出される分散とを用いて周波数別クロススペクトルを計算する周波数別クロススペクトル生成手段と、
前記周波数別クロススペクトル生成手段によって算出される前記周波数別クロススペクトルを逆変換して周波数別相互相関関数を計算する逆変換手段と、
前記ペアの前記周波数別相互相関関数と前記相対遅延時間とに基づいて波源方向と相関値との対応関係である周波数別推定方向情報を計算する周波数別推定方向情報計算手段と、
前記周波数別推定方向情報を統合して前記推定方向情報を計算する周波数統合手段と、
前記周波数別推定方向情報に基づいて波源方向ごとの前記推定方向情報に対する周波数別の前記寄与率を計算する周波数寄与率計算手段とを有する付記4に記載の波源方向推定装置。
(付記6)
前記重み計算手段は、
複数の前記ペア間において前記寄与率の類似度を計算し、算出した前記類似度に基づいて波源方向ごとの重みを計算する付記4または5に記載の波源方向推定装置。
(付記7)
前記統合推定方向情報算出手段は、
前記信号選択手段によって選択された全ての前記ペアのうち1組の前記ペアをなす二つの前記入力信号を取得するとともに、取得した前記ペアの前記相対遅延時間を取得し、前記ペアをなす二つの前記入力信号を用いて算出される周波数別相互相関関数と前記ペアの前記相対遅延時間とを用いて、前記ペアごとの周波数別推定方向情報を計算する複数の周波数別推定方向情報生成手段と、
複数の前記周波数別推定方向情報生成手段から前記ペアごとの前記周波数別推定方向情報を取得し、取得した前記ペアごとの前記周波数別推定方向情報に基づいて波源方向候補を計算し、算出した前記波源方向候補ごとに前記重みを計算する重み生成手段と、
複数の前記周波数別推定方向情報生成手段から前記ペアごとの前記周波数別推定方向情報を取得するとともに、前記重み生成手段から前記重みを取得し、複数の前記ペアごとの前記周波数別推定方向情報に前記重みをつけて統合して前記統合推定方向情報を生成する統合手段とを有する付記1乃至3のいずれか一項に記載の波源方向推定装置。
(付記8)
前記周波数別推定方向情報生成手段は、
前記ペアをなす二つの前記入力信号を周波数領域の変換信号に変換する変換手段と、
前記変換手段によって変換された前記変換信号を用いてクロススペクトルを計算するクロススペクトル計算手段と、
前記クロススペクトル計算手段によって算出される前記クロススペクトルを用いて平均クロススペクトルを計算する平均計算手段と、
前記平均計算手段によって算出される前記平均クロススペクトルを用いて分散を計算する分散計算手段と、
前記平均計算手段によって算出される前記平均クロススペクトルと、前記分散計算手段によって算出される分散とを用いて周波数別クロススペクトルを計算する周波数別クロススペクトル生成手段と、
前記周波数別クロススペクトル生成手段によって算出される前記周波数別クロススペクトルを逆変換して周波数別相互相関関数を計算する逆変換手段と、
前記ペアの前記周波数別相互相関関数と前記相対遅延時間とに基づいて波源方向と相関値との対応関係である周波数別推定方向情報を計算する周波数別推定方向情報計算手段とを有する付記7に記載の波源方向推定装置。
(付記9)
前記重み生成手段は、
前記周波数別推定方向情報を統合して前記ペアごとの前記推定方向情報を計算する複数の周波数統合手段と、
前記ペアごとの前記推定方向情報からピークを検出し、ピークとなる方向を前記ペアごとの波源方向候補として選出する複数の波源方向候補選出手段と、
複数の前記波源方向候補選出手段から前記ペアごとの前記波源方向候補を取得し、取得した前記ペアごとの前記波源方向候補を統合する波源方向候補統合手段と、
統合された前記波源方向候補と前記周波数別推定方向情報とに基づいて、前記波源方向候補ごとの前記推定方向情報に対する周波数別の前記寄与率を計算する複数の波源方向候補別周波数寄与率計算手段と、
前記波源方向候補ごとの前記推定方向情報に対する周波数別の前記寄与率を複数の前記波源方向候補別周波数寄与率計算手段から取得し、取得した前記波源方向候補ごとの前記推定方向情報に対する周波数別の前記寄与率に基づいて前記波源方向候補ごとの前記重みを計算する重み計算手段とを有する付記8に記載の波源方向推定装置。
(付記10)
前記重み計算手段は、
複数の前記ペア間の前記波源方向候補ごとの周波数別の前記寄与率の類似度を計算し、算出した前記類似度に基づいて前記波源方向候補ごとの前記重みを求める付記9に記載の波源方向推定装置。
(付記11)
前記統合推定方向情報算出手段によって算出される前記統合推定方向情報に基づいて波源方向を算出する波源方向算出手段を備える付記1乃至10のいずれか一項に記載の波源方向推定装置。
(付記12)
前記波源方向算出手段は、
一定時間ごとに前記統合推定方向情報が最大になる時刻に対応する方向を波源方向として算出する付記11に記載の波源方向推定装置。
(付記13)
複数の前記入力手段のそれぞれに対応して配置される前記センサを備える付記1乃至12のいずれか一項に記載の波源方向推定装置。
(付記14)
情報処理装置が、
複数のセンサによって検出される波動に基づく電気信号を入力信号として取得し、
複数の前記入力信号のうち二つを組み合わせたペアを複数組選択し、
前記ペアをなす二つの前記入力信号の供給元の前記センサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出し、
前記ペアをなす前記入力信号と前記ペアの相対遅延時間とを用いて周波数別推定方向情報を前記ペアごとに生成し、
生成した前記ペアごとの前記周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出し、
算出した前記寄与率に基づいて異なる前記ペア間の前記寄与率の類似度に応じた波源方向ごとの重みを計算し、
全ての前記ペアの前記推定方向情報に前記重みをつけて統合することによって統合推定方向情報を生成する波源方向推定方法。
(付記15)
複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する処理と、
複数の前記入力信号のうち二つを組み合わせたペアを複数組選択する処理と、
前記ペアをなす二つの前記入力信号の供給元の前記センサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する処理と、
前記ペアをなす前記入力信号と前記ペアの相対遅延時間とを用いて周波数別推定方向情報を前記ペアごとに生成する処理と、
生成した前記ペアごとの前記周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出する処理と、
算出した前記寄与率に基づいて異なる前記ペア間の前記寄与率の類似度に応じた波源方向ごとの重みを計算する処理と、
全ての前記ペアの前記推定方向情報に前記重みをつけて統合することによって統合推定方向情報を生成する処理とをコンピュータに実行させるプログラムを記録させたプログラム記録媒体。
10 波源方向推定装置
11 入力端子
12 信号選択部
13 相対遅延時間計算部
15 推定方向情報・周波数寄与率生成部
16 重み計算部
17 統合部
20 波源方向推定装置
21 入力端子
22 信号選択部
23 相対遅延時間計算部
25 周波数別推定方向情報生成部
26 重み生成部
27 統合部
30 波源方向推定装置
31 入力端子
32 信号選択部
33 相対遅延時間計算部
35 統合推定方向情報算出部
41 入力端子
42 信号選択部
43 相対遅延時間計算部
45 統合推定方向情報算出部
46 波源方向算出部
151 変換部
152 クロススペクトル計算部
153 平均計算部
154 分散計算部
155 周波数別クロススペクトル生成部
156 逆変換部
157 周波数別推定方向情報計算部
158 周波数寄与率計算部
159 周波数統合部
251 変換部
252 クロススペクトル計算部
253 平均計算部
254 分散計算部
255 周波数別クロススペクトル生成部
256 逆変換部
257 周波数別推定方向情報計算部
261 周波数統合部
262 波源方向候補選出部
263 波源方向候補統合部
264 波源方向候補別周波数寄与率計算部
265 重み計算部
551 周波数別基本クロススペクトル計算部
552 カーネル関数スペクトル生成部
553 乗算部

Claims (15)

  1. 複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する複数の入力手段と、
    複数の前記入力信号のうち二つを組み合わせたペアを複数組選択する信号選択手段と、
    前記ペアをなす二つの前記入力信号の供給元の前記センサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する相対遅延時間計算手段と、
    前記ペアをなす前記入力信号と前記ペアの相対遅延時間とを用いて周波数別推定方向情報を前記ペアごとに生成し、生成した前記ペアごとの前記周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出し、算出した前記寄与率に基づいて異なる前記ペア間の前記寄与率の類似度に応じた波源方向ごとの重みを計算し、全ての前記ペアの前記推定方向情報に前記重みをつけて統合することによって統合推定方向情報を生成する統合推定方向情報算出手段とを備える波源方向推定装置。
  2. 前記信号選択手段は、
    前記センサの間隔に基づいて、複数の前記入力信号から二つの前記入力信号を組み合わせた前記ペアを選択する請求項1に記載の波源方向推定装置。
  3. 前記相対遅延時間計算手段は、
    一つの前記ペアをなす二つの前記入力信号の供給元である前記センサにおける波源探索方向を基準として、前記信号選択手段によって選択された全ての前記ペアの前記相対遅延時間を、基準である前記波源探索方向の関数として計算する請求項1または2に記載の波源方向推定装置。
  4. 前記統合推定方向情報算出手段は、
    前記信号選択手段によって選択された全ての前記ペアのうち1組の前記ペアをなす二つの前記入力信号を取得するとともに、取得した前記ペアの前記相対遅延時間を取得し、前記ペアをなす二つの前記入力信号間の周波数別相互相関関数と前記ペアの前記相対遅延時間とを用いて、前記ペアをなす二つの前記入力信号間の前記推定方向情報と周波数別の前記寄与率とを生成する複数の推定方向情報・周波数寄与率生成手段と、
    複数の前記推定方向情報・周波数寄与率生成手段から周波数ごとの前記寄与率を取得し、異なる前記ペア間の前記寄与率の類似度に応じて波源方向ごとの前記重みを計算する重み計算手段と、
    複数の前記推定方向情報・周波数寄与率生成手段から前記推定方向情報を取得するとともに、前記重み計算手段から前記重みを取得し、複数の前記ペアごとの前記推定方向情報に前記重みをつけて統合して前記統合推定方向情報を生成する統合手段とを有する請求項1乃至3のいずれか一項に記載の波源方向推定装置。
  5. 前記推定方向情報・周波数寄与率生成手段は、
    前記ペアをなす二つの前記入力信号を周波数領域の変換信号に変換する変換手段と、
    前記変換手段によって変換された前記変換信号を用いてクロススペクトルを計算するクロススペクトル計算手段と、
    前記クロススペクトル計算手段によって算出される前記クロススペクトルを用いて平均クロススペクトルを計算する平均計算手段と、
    前記平均計算手段によって算出される前記平均クロススペクトルを用いて分散を計算する分散計算手段と、
    前記平均計算手段によって算出される前記平均クロススペクトルと、前記分散計算手段によって算出される分散とを用いて周波数別クロススペクトルを計算する周波数別クロススペクトル生成手段と、
    前記周波数別クロススペクトル生成手段によって算出される前記周波数別クロススペクトルを逆変換して周波数別相互相関関数を計算する逆変換手段と、
    前記ペアの前記周波数別相互相関関数と前記相対遅延時間とに基づいて波源方向と相関値との対応関係である周波数別推定方向情報を計算する周波数別推定方向情報計算手段と、
    前記周波数別推定方向情報を統合して前記推定方向情報を計算する周波数統合手段と、
    前記周波数別推定方向情報に基づいて波源方向ごとの前記推定方向情報に対する周波数別の前記寄与率を計算する周波数寄与率計算手段とを有する請求項4に記載の波源方向推定装置。
  6. 前記重み計算手段は、
    複数の前記ペア間において前記寄与率の類似度を計算し、算出した前記類似度に基づいて波源方向ごとの重みを計算する請求項4または5に記載の波源方向推定装置。
  7. 前記統合推定方向情報算出手段は、
    前記信号選択手段によって選択された全ての前記ペアのうち1組の前記ペアをなす二つの前記入力信号を取得するとともに、取得した前記ペアの前記相対遅延時間を取得し、前記ペアをなす二つの前記入力信号を用いて算出される周波数別相互相関関数と前記ペアの前記相対遅延時間とを用いて、前記ペアごとの周波数別推定方向情報を計算する複数の周波数別推定方向情報生成手段と、
    複数の前記周波数別推定方向情報生成手段から前記ペアごとの前記周波数別推定方向情報を取得し、取得した前記ペアごとの前記周波数別推定方向情報に基づいて波源方向候補を計算し、算出した前記波源方向候補ごとに前記重みを計算する重み生成手段と、
    複数の前記周波数別推定方向情報生成手段から前記ペアごとの前記周波数別推定方向情報を取得するとともに、前記重み生成手段から前記重みを取得し、複数の前記ペアごとの前記周波数別推定方向情報に前記重みをつけて統合して前記統合推定方向情報を生成する統合手段とを有する請求項1乃至3のいずれか一項に記載の波源方向推定装置。
  8. 前記周波数別推定方向情報生成手段は、
    前記ペアをなす二つの前記入力信号を周波数領域の変換信号に変換する変換手段と、
    前記変換手段によって変換された前記変換信号を用いてクロススペクトルを計算するクロススペクトル計算手段と、
    前記クロススペクトル計算手段によって算出される前記クロススペクトルを用いて平均クロススペクトルを計算する平均計算手段と、
    前記平均計算手段によって算出される前記平均クロススペクトルを用いて分散を計算する分散計算手段と、
    前記平均計算手段によって算出される前記平均クロススペクトルと、前記分散計算手段によって算出される分散とを用いて周波数別クロススペクトルを計算する周波数別クロススペクトル生成手段と、
    前記周波数別クロススペクトル生成手段によって算出される前記周波数別クロススペクトルを逆変換して周波数別相互相関関数を計算する逆変換手段と、
    前記ペアの前記周波数別相互相関関数と前記相対遅延時間とに基づいて波源方向と相関値との対応関係である周波数別推定方向情報を計算する周波数別推定方向情報計算手段とを有する請求項7に記載の波源方向推定装置。
  9. 前記重み生成手段は、
    前記周波数別推定方向情報を統合して前記ペアごとの前記推定方向情報を計算する複数の周波数統合手段と、
    前記ペアごとの前記推定方向情報からピークを検出し、ピークとなる方向を前記ペアごとの波源方向候補として選出する複数の波源方向候補選出手段と、
    複数の前記波源方向候補選出手段から前記ペアごとの前記波源方向候補を取得し、取得した前記ペアごとの前記波源方向候補を統合する波源方向候補統合手段と、
    統合された前記波源方向候補と前記周波数別推定方向情報とに基づいて、前記波源方向候補ごとの前記推定方向情報に対する周波数別の前記寄与率を計算する複数の波源方向候補別周波数寄与率計算手段と、
    前記波源方向候補ごとの前記推定方向情報に対する周波数別の前記寄与率を複数の前記波源方向候補別周波数寄与率計算手段から取得し、取得した前記波源方向候補ごとの前記推定方向情報に対する周波数別の前記寄与率に基づいて前記波源方向候補ごとの前記重みを計算する重み計算手段とを有する請求項8に記載の波源方向推定装置。
  10. 前記重み計算手段は、
    複数の前記ペア間の前記波源方向候補ごとの周波数別の前記寄与率の類似度を計算し、算出した前記類似度に基づいて前記波源方向候補ごとの前記重みを求める請求項9に記載の波源方向推定装置。
  11. 前記統合推定方向情報算出手段によって算出される前記統合推定方向情報に基づいて波源方向を算出する波源方向算出手段を備える請求項1乃至10のいずれか一項に記載の波源方向推定装置。
  12. 前記波源方向算出手段は、
    一定時間ごとに前記統合推定方向情報が最大になる時刻に対応する方向を波源方向として算出する請求項11に記載の波源方向推定装置。
  13. 複数の前記入力手段のそれぞれに対応して配置される前記センサを備える請求項1乃至12のいずれか一項に記載の波源方向推定装置。
  14. 情報処理装置が、
    複数のセンサによって検出される波動に基づく電気信号を入力信号として取得し、
    複数の前記入力信号のうち二つを組み合わせたペアを複数組選択し、
    前記ペアをなす二つの前記入力信号の供給元の前記センサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出し、
    前記ペアをなす前記入力信号と前記ペアの相対遅延時間とを用いて周波数別推定方向情報を前記ペアごとに生成し、
    生成した前記ペアごとの前記周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出し、
    算出した前記寄与率に基づいて異なる前記ペア間の前記寄与率の類似度に応じた波源方向ごとの重みを計算し、
    全ての前記ペアの前記推定方向情報に前記重みをつけて統合することによって統合推定方向情報を生成する波源方向推定方法。
  15. 複数のセンサによって検出される波動に基づく電気信号を入力信号として取得する処理と、
    複数の前記入力信号のうち二つを組み合わせたペアを複数組選択する処理と、
    前記ペアをなす二つの前記入力信号の供給元の前記センサへの波源方向ごとの波動の到達時間差を相対遅延時間として算出する処理と、
    前記ペアをなす前記入力信号と前記ペアの相対遅延時間とを用いて周波数別推定方向情報を前記ペアごとに生成する処理と、
    生成した前記ペアごとの前記周波数別推定方向情報を用いて波源方向ごとの推定方向情報に対する周波数別の寄与率を算出する処理と、
    算出した前記寄与率に基づいて異なる前記ペア間の前記寄与率の類似度に応じた波源方向ごとの重みを計算する処理と、
    全ての前記ペアの前記推定方向情報に前記重みをつけて統合することによって統合推定方向情報を生成する処理とをコンピュータに実行させるプログラムを記録させたプログラム記録媒体。
JP2020526725A 2018-06-25 2018-06-25 波源方向推定装置、波源方向推定方法、およびプログラム Active JP6933303B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/023971 WO2020003343A1 (ja) 2018-06-25 2018-06-25 波源方向推定装置、波源方向推定方法、およびプログラム記録媒体

Publications (2)

Publication Number Publication Date
JPWO2020003343A1 true JPWO2020003343A1 (ja) 2021-06-24
JP6933303B2 JP6933303B2 (ja) 2021-09-08

Family

ID=68986143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020526725A Active JP6933303B2 (ja) 2018-06-25 2018-06-25 波源方向推定装置、波源方向推定方法、およびプログラム

Country Status (3)

Country Link
US (1) US11408963B2 (ja)
JP (1) JP6933303B2 (ja)
WO (1) WO2020003343A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220342026A1 (en) * 2019-09-02 2022-10-27 Nec Corporation Wave source direction estimation device, wave source direction estimation method, and program recording medium

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008089312A (ja) * 2006-09-29 2008-04-17 Kddi Corp 信号到来方向推定装置及び方法、並びに信号分離装置及び方法、コンピュータプログラム
JP2010175431A (ja) * 2009-01-30 2010-08-12 Nippon Telegr & Teleph Corp <Ntt> 音源方向推定装置とその方法と、プログラム
JP2010193323A (ja) * 2009-02-19 2010-09-02 Casio Hitachi Mobile Communications Co Ltd 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム
JP2011071686A (ja) * 2009-09-25 2011-04-07 Nec Corp 映像音響処理装置、映像音響処理方法及びプログラム
JP2015161551A (ja) * 2014-02-26 2015-09-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
WO2018003158A1 (ja) * 2016-06-29 2018-01-04 日本電気株式会社 相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4234746B2 (ja) * 2006-09-25 2009-03-04 株式会社東芝 音響信号処理装置、音響信号処理方法及び音響信号処理プログラム
JP6413741B2 (ja) * 2014-12-16 2018-10-31 日本電気株式会社 振動発生源推定装置、方法およびプログラム
JP6874766B2 (ja) * 2016-06-15 2021-05-19 日本電気株式会社 波源方向推定装置、波源方向推定システム、波源方向推定方法および波源方向推定プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008089312A (ja) * 2006-09-29 2008-04-17 Kddi Corp 信号到来方向推定装置及び方法、並びに信号分離装置及び方法、コンピュータプログラム
JP2010175431A (ja) * 2009-01-30 2010-08-12 Nippon Telegr & Teleph Corp <Ntt> 音源方向推定装置とその方法と、プログラム
JP2010193323A (ja) * 2009-02-19 2010-09-02 Casio Hitachi Mobile Communications Co Ltd 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム
JP2011071686A (ja) * 2009-09-25 2011-04-07 Nec Corp 映像音響処理装置、映像音響処理方法及びプログラム
JP2015161551A (ja) * 2014-02-26 2015-09-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
WO2018003158A1 (ja) * 2016-06-29 2018-01-04 日本電気株式会社 相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KATO, MASANORI ET AL.: ""TDOA Estimation Based on Phase-Voting Cross Correlation and Circular Standard Deviation"", 2017 25TH EUROPEAN SIGNAL PROCESSING CONFERENCE(EUSIPCO), JPN6018034734, 2017, pages 1230 - 1234, XP033236133, ISSN: 0004554491, DOI: 10.23919/EUSIPCO.2017.8081404 *
加藤 正徳 ほか: ""位相投票による相互相関と円周標準偏差に基づくTDOA推定"", 電子情報通信学会技術研究報告 IEICE TECHNICAL REPORT, vol. 第116巻, 第477号, JPN6018034733, March 2017 (2017-03-01), JP, pages 159 - 164, ISSN: 0004554490 *

Also Published As

Publication number Publication date
US20210263126A1 (en) 2021-08-26
US11408963B2 (en) 2022-08-09
WO2020003343A1 (ja) 2020-01-02
JP6933303B2 (ja) 2021-09-08

Similar Documents

Publication Publication Date Title
US9182475B2 (en) Sound source signal filtering apparatus based on calculated distance between microphone and sound source
JP6289936B2 (ja) 音源方向推定装置、音源方向推定方法およびプログラム
EP3484184A1 (en) Acoustic field formation device, method, and program
KR101349268B1 (ko) 마이크로폰 어레이를 이용한 음원 거리 측정 장치
WO2013093565A1 (en) Spatial audio processing apparatus
KR20170053623A (ko) 사운드 소스들을 향상시키기 위한 방법 및 장치
Padois Acoustic source localization based on the generalized cross-correlation and the generalized mean with few microphones
Padois et al. On the use of modified phase transform weighting functions for acoustic imaging with the generalized cross correlation
JPWO2018116943A1 (ja) ノイズ抑圧装置、ノイズ抑圧方法、及びこれらを用いた受信装置、受信方法
CN103688187A (zh) 使用相位谱的声音源定位
JP6862799B2 (ja) 信号処理装置、方位算出方法及び方位算出プログラム
JP6933303B2 (ja) 波源方向推定装置、波源方向推定方法、およびプログラム
Padois et al. On the use of geometric and harmonic means with the generalized cross-correlation in the time domain to improve noise source maps
JP5986966B2 (ja) 音場収音再生装置、方法及びプログラム
Schober et al. Sound source localization using stochastic computing
JP7056739B2 (ja) 波源方向推定装置、波源方向推定方法、およびプログラム
JP7286896B2 (ja) 音源分離システム、音源位置推定システム、音源分離方法および音源分離プログラム
JP2005062096A (ja) 話者位置検出方法、装置、プログラム、および記録媒体
JP7276469B2 (ja) 波源方向推定装置、波源方向推定方法、およびプログラム
JP6438786B2 (ja) 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム
JP2018170640A (ja) マルチトーン信号検出装置、マルチトーン信号検出方法及びプログラム
JP5713933B2 (ja) 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
US11276388B2 (en) Beamforming system based on delay distribution model using high frequency phase difference
JP6585547B2 (ja) 撮像システム、撮像方法
WO2017154723A1 (ja) 収録データ処理方法および収録データ処理装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210720

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210802

R150 Certificate of patent or registration of utility model

Ref document number: 6933303

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150