JP6769495B2 - 相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置 - Google Patents
相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置 Download PDFInfo
- Publication number
- JP6769495B2 JP6769495B2 JP2018561142A JP2018561142A JP6769495B2 JP 6769495 B2 JP6769495 B2 JP 6769495B2 JP 2018561142 A JP2018561142 A JP 2018561142A JP 2018561142 A JP2018561142 A JP 2018561142A JP 6769495 B2 JP6769495 B2 JP 6769495B2
- Authority
- JP
- Japan
- Prior art keywords
- correlation function
- frequency
- spectrum
- cross spectrum
- variance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005314 correlation function Methods 0.000 title claims description 244
- 238000001228 spectrum Methods 0.000 claims description 336
- 238000004364 calculation method Methods 0.000 claims description 167
- 230000006870 function Effects 0.000 claims description 148
- 238000006243 chemical reaction Methods 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 32
- 230000010354 integration Effects 0.000 claims description 21
- 230000009466 transformation Effects 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 35
- 239000006185 dispersion Substances 0.000 description 26
- 230000000694 effects Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- OWZREIFADZCYQD-NSHGMRRFSA-N deltamethrin Chemical compound CC1(C)[C@@H](C=C(Br)Br)[C@H]1C(=O)O[C@H](C#N)C1=CC=CC(OC=2C=CC=CC=2)=C1 OWZREIFADZCYQD-NSHGMRRFSA-N 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/801—Details
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/02—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
- G01S3/04—Details
- G01S3/043—Receivers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/40—Visual indication of stereophonic sound image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
波源で発生した波を入力信号として取得する複数の入力信号取得手段と、
複数の前記入力信号取得手段で取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換手段と、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算手段と、
前記クロススペクトルの位相の分散として円周分散を計算する分散計算手段と、
前記円周分散に基づいて算出された重みによって重み付された前記クロススペクトルに基づいて、相関関数を計算する相関関数計算手段と、
を備える。
波源で発生した波を入力信号として取得する複数の入力信号取得ステップと、
複数の前記入力信号取得ステップで取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換ステップと、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算ステップと、
前記クロススペクトルの位相の分散として円周分散を計算する分散計算ステップと、
前記円周分散に基づいて算出された重みによって重み付された前記クロススペクトルに基づいて、相関関数を計算して生成する相関関数計算ステップと、
を含む
波源で発生した波を入力信号として取得する複数の入力信号取得ステップと、
複数の前記入力信号取得ステップで取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換ステップと、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算ステップと、
前記クロススペクトルの位相の分散として円周分散を計算する分散計算ステップと、
前記円周分散に基づいて算出された重みによって重み付された前記クロススペクトルに基づいて、相関関数を計算して生成する相関関数計算ステップと、
をコンピュータに実行させる。
上記相関関数生成装置を有し、
前記相関関数生成装置により生成された相関関数に基づいて、前記波源の方向を推定する。
本発明の第1実施形態としての相関関数生成装置100について、図1を用いて説明する。相関関数生成装置100は、明瞭なピークを持つ相関関数を生成する装置である。
<前提技術>
上記非特許文献1および非特許文献2に記載の技術では、屋外などの周囲騒音レベルが高い環境において、遠方に存在する音源の方向を高精度に推定することが困難であった。例えば、推定対象の音源(目標音源)が、マイクロフォンから遠く離れた場所に存在する場合、目標音源から放射される音の音量は、マイクロフォンに到達する時点で大幅に小さくなる。このため、目標音源の音が周囲環境雑音に埋もれて、明瞭なピークを持つ相関関数を生成できなかった。よって、目標音源の方向推定精度が低下することがあった。
次に本発明の第2実施形態としての波源方向推定装置200について、図2乃至図6を用いて説明する。
入力端子201と入力端子202とには、目標音源の音と集音装置であるマイクロフォン(以下、マイク)の周囲で生じる様々な雑音が混在した音とがデジタル信号(サンプル値系列)として入力される。入力端201と入力端子202とに入力された音信号を本実施形態では入力信号と呼ぶ。そして、時刻tにおける入力端子201と入力端子202との入力信号をx1(t)、x2(t)と表す。
変換部201は、入力端子201と入力端子202とから供給された入力信号を変換し、クロススペクトル計算部202へ供給する。変換は、入力信号を複数の周波数成分に分解する目的で実施される。ここでは、代表的なフーリエ変換を用いた場合について説明する。
クロススペクトル計算部202は、変換部201から供給される変換信号に基づいて、クロススペクトルを計算し、分散計算部203と相関関数計算部204へ伝達する。クロススペクトル計算部202は、変換信号X2(k,n)の複素共役と変換信号X1(k,n)の積を計算する。変換信号のクロススペクトルをS12(k,n)とすると、クロススペクトルは次のように計算される。
分散計算部203は、クロススペクトル計算部202から供給されたクロススペクトルを用いて、クロススペクトルの分散を計算し、相関関数計算部204へ伝達する。本実施形態では、過去に入力されたクロススペクトルから周波数ビンごとに分散を計算する例を説明する。周波数ビン単位ではなく、複数の周波数ビンを束ねたサブバンド単位や、全周波数ビンを用いて計算してもよい。また、それらを組み合わせて分散を計算してもよい。サブバンド単位で計算すると、分散を計算する帯域数が削減できるので、演算量が低減できる。
相関関数計算部204は、クロススペクトル計算部202から供給されたクロススペクトルと、分散計算部203から供給された分散に基づき、相関関数を計算し、推定方向情報生成部205に伝達する。次に図3を参照して、相関関数計算部204の詳細を説明する。
重み付け部241は、分散計算部203から供給された分散に基づいて、クロススペクトル計算部202から供給されたクロススペクトルに重み付けを行い、重み付けされたクロススペクトルを逆変換部242に伝達する。
逆変換部242は、重み付け部241から供給されたクロススペクトルの逆変換を求める。本実施形態では、変換部201でフーリエ変換を用いたので、逆変換には逆フーリエ変換を用いる方法について説明する。重み付け部241から供給されたクロススペクトルをWS12(k,n)とすると、WS12(k,n)の逆変換により得られる相関関数s12(τ,n)は次のように計算される。
相対遅延時間計算部206は、入力されたマイク位置情報と音源探索対象方向とから、マイクペア間の相対遅延時間を求め、音源探索対象方向とセットで推定方向情報生成部205に伝達する。相対遅延時間とは、マイク間隔と音源方向とに基づいて一意に定まる音波の到達時間差のことである。音速をcと仮定し、2つのマイクの間隔をd、音源方向、つまり音の到来方向をθとした場合、音源方向θに対する相対遅延時間τ(θ)は次の式で計算される。
推定方向情報生成部205は、相関関数計算部204から供給される相関関数と、相対遅延時間計算部206から供給される相対遅延時間と、に基づき、方向と相関値との対応関係を推定方向情報として出力する。相関関数をs12(τ,n)、相対遅延時間τ(θ)とすると、推定方向情報H(θ,n)は、次式で与えられる。
本実施形態によれば、入力信号に含まれる目標音の到来方向、すなわち目標物体が存在する方向や波源の方向を高精度に推定できる。環境雑音レベルが高い環境において、目標物が発する音を手掛かりに、目標物が存在する方向を推定する場合に有効である。環境雑音の例としては、繁華街や街頭、街道沿い、人や自動車が多く集まる場所が挙げられる。また、目標物の例としては、人間や動物、自動車、航空機、船舶、水上バイク、ドローン(小型無人機)が挙げられる。
次に本発明の第3実施形態に係る波源方向推定装置について、図7を用いて説明する。図7は、本実施形態に係る波源方向推定装置700の構成を説明するためのブロック図である。本実施形態に係る波源方向推定装置700は、上記第2実施形態と比べると、平均計算部701を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、変換部201、クロススペクトル計算部202、分散計算部203、相関関数計算部204および平均計算部701は、相関関数生成部710を構成する。
平均計算部701は、クロススペクトル計算部202から供給されたクロススペクトルの平均を計算し、相関関数計算部204へ伝達する。本実施形態では、過去に入力されたクロススペクトルから周波数ビンごとに平均を計算する例を説明する。周波数ビン単位ではなく、複数の周波数ビンを束ねたサブバンド単位で計算してもよい。第nフレームの周波数ビンkにおけるクロススペクトルをS12(k,n)とすると、過去L−1フレームから求めた平均クロススペクトルSS12(k,n)は次のように計算される。
本実施形態によれば、クロススペクトルの代わりに平均クロススペクトルを相関関数計算部204に伝達する。このため、第2実施形態と比べると、位置の時間変動が小さな目標音源に対しては、相関関数のピーク位置、および推定方向情報の時間変動が小さくなるので、方向推定の精度が向上する。特に、自動車の走行音、航空機やドローンの飛行音、船舶の航行音(スクリュー音)など、目標物が発する音が継続的に生じる場合、クロススペクトルの平均化効果は高くなるので、相関関数のピーク位置、および推定方向情報が明確になる。
次に本発明の第4実施形態に係る波源方向推定装置について、図8を用いて説明する。図8は、本実施形態に係る波源方向推定装置800の構成を説明するためのブロック図である。本実施形態に係る波源方向推定装置800は、上記第3実施形態と比べると、分散計算部203に代えて、分散計算部801を有する点で異なる。その他の構成および動作は、第3実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。なお、変換部201、クロススペクトル計算部202、分散計算部801、平均計算部701および相関関数計算部204は、相関関数生成部810を構成する。
分散計算部801は、平均計算部301から供給された平均クロススペクトルを用いて分散を計算し、相関関数計算部204へ伝達する。第3実施形態と比較すると、分散の計算にクロススペクトルではなく、平均クロススペクトルを用いている点が異なる。特に、方向統計学で知られている分散や標準偏差を計算する場合には、その計算過程において円周平均の計算を省略できる。平均クロススペクトルをSS12(k,n)とすると、「クロススペクトルの位相の分散」の計算において円周分散を用いた場合、分散V12(k,n)は以下のように計算される。
本実施形態によれば、分散計算部は、平均クロススペクトル計算部で計算された平均クロススペクトルを利用して、分散を計算する。このため、分散計算部において平均クロススペクトルの計算が不要になる。したがって、第3実施形態よりも少ない計算量で分散を計算することができる。
次に本発明の第5実施形態に係る波源方向推定装置について、図9乃至図12Dを用いて説明する。本実施形態に係る波源方向推定装置は、上記第2実施形態の波源方向推定装置と比べると、相関関数計算部204に代えて、相関関数計算部904を有する点で異なる。図9は、本実施形態に係る相関関数計算部904の構成を説明するためのブロック図である。本実施形態に係る相関関数計算部904は、上記第2実施形態の相関関数計算部204と比べると、重み付け部241と逆変換部242に代えて、周波数別クロススペクトル生成部9411,9412,・・・,941Kと統合相関関数計算部942とを有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
図10は、周波数別クロススペクトル生成部941kのブロック図である。周波数別クロススペクトル生成部941kは、周波数別クロススペクトル生成部1011、カーネル関数スペクトル生成部1012、乗算部1013を有する。周波数別クロススペクトル生成部941kは、クロススペクトル計算部202から供給されるクロススペクトルS12(k,n)と分散計算部203から供給される分散を用いて、S12(k,n)の周波数kに対応するクロススペクトルを計算し、周波数別クロススペクトルを統合相関関数計算部942へ伝達する。
周波数別クロススペクトル生成部9411,9412,・・・,941Kは、クロススペクトル計算部202から供給されるクロススペクトルS12(k,n)を用いて、S12(k,n)の各周波数kに対応するクロススペクトルを計算し、周波数別クロススペクトルとして乗算部1013に伝達する。周波数別クロススペクトルは、周波数成分ごとに相関関数を計算するために行われる。つまり、ある周波数kに対応する相関関数(周波数別相関関数と呼ぶ)を後段で求めるために、周波数別クロススペクトルを計算する。
カーネル関数スペクトル生成部1012は、分散計算部203から供給された分散に基づいてカーネル関数スペクトルを求め、乗算部1013へカーネル関数スペクトルを出力する。カーネル関数スペクトルとは、カーネル関数をフーリエ変換し、その絶対値を取ったものである。絶対値を取る代わりに二乗してもよい。また、絶対値の二乗としてもよい。本実施形態では、カーネル関数スペクトルをG(w)、カーネル関数をg(τ)と表記して説明する。カーネル関数としては、ガウス関数を用いる。この時、ガウス関数は、次のような数式で与えられる。
乗算部1013は、周波数別クロススペクトル生成部1011から供給される周波数別クロススペクトルと、カーネル関数スペクトル生成部1012から供給されるカーネル関数スペクトルと、の積を計算し、計算によって得られた新たな周波数クロススペクトルを統合相関関数計算部942に伝達する。周波数別クロススペクトル生成部1011から供給される周波数別スペクトルをUk(w,n)、カーネル関数スペクトル生成部1012から供給されるカーネル関数スペクトルをG(w)とすると、計算により得られる新たな周波数別クロススペクトルUMk(w,n)は次のように計算される。
図11は、統合相関関数計算部942のブロック図である。統合相関関数計算部942は、逆変換部11211,11212,・・・,1121Kと、統合部1122を備える。
以上の方法により周波数別クロススペクトルを計算すると、周波数別クロススペクトルを逆変換して得られる周波数別相関関数のピークが鋭くなり、相関関数のピーク位置が明確になる。相関関数のピーク位置に基づいて波源方向推定を行う本発明の場合には、ピークが鋭くなれば音源方向推定の精度が向上する。さらに、Pの値が大きくなるにつれて、すなわちkを整数倍した周波数の成分が増えるにつれて、相関関数のピークは鋭くなる。図12Aに、この様子を示す。ここで、図中のQは3よりも大きい整数である。P=1の場合、つまり位相成分が一つしかない場合、これを逆変換して得られる相関関数は、このようにピーク位置が不明確な相関関数になる。Pが大きくなると、図12Aに示す通り、相関関数のピークは鋭くなる。
周波数別クロススペクトルにカーネル関数スペクトルを乗じることで、周波数別相関関数の形状を変更できる。図12Bは、カーネル関数スペクトルが乗じられた周波数別クロススペクトルと、周波数別相関関数の関係を示している。比較のため、カーネル関数スペクトルを乗じる前の周波数別クロススペクトルも掲載する。図12Bの左側図に示すように、カーネル関数スペクトルを乗じていなければ、高い周波数まで成分が存在するため、周波数別相関関数のピークは鋭くなる。一方で、図12Bの中央図、右側図のようにカーネル関数スペクトルを乗じると、高い周波数の成分が減衰するので、周波数別相関関数のピークの鋭さは小さくなる。つまり、カーネル関数スペクトルのピークが鋭くなる(カーネル関数スペクトルの裾が狭くなる)につれて、周波数別相関関数のピークの鋭さは小さくなる。また、図12Bの右側図のように、周波数別相関関数の裾が大きく広がると、隣接する山の裾が重なり、谷が浅い周波数別相関関数が得られる。
本実施形態によれば、周波数別クロススペクトルを逆変換して得られる周波数別相関関数のピークが鋭くなり、相関関数のピーク位置が明確になる。相関関数のピーク位置に基づいて波源方向推定を行う本実施形態の場合には、音源方向推定の精度が向上する。また、周波数別クロススペクトルにカーネル関数スペクトルを乗じることで、周波数別相関関数の形状を変更できる。その際、カーネル関数の広さは、分散の大きさに応じて変更するので、目標音源が存在する周波数の周波数別相関関数のピークを強調できる。したがって、周波数ごとの相関関数を求めず、また周波数別相関関数のピーク強調を行わない第2実施形態と比較すると、相関関数のピークが強調できるので、方向推定精度が向上する。
次に本発明の第6実施形態に係る波源方向推定装置について、図13を用いて説明する。本実施形態に係る波源方向推定装置は、上記第5実施形態の波源方向推定装置と比べると、周波数別クロススペクトル生成部941kに代えて、周波数別クロススペクトル生成部1341kを有する点で異なる。図13は、本実施形態に係る周波数別クロススペクトル生成部1341kの構成を説明するためのブロック図である。本実施形態に係る周波数別クロススペクトル生成部1341kは、上記第5実施形態の周波数別クロススペクトル生成部941kと比べると、カーネル関数スペクトル生成部1012に代えて、カーネル関数スペクトル記憶部1314とカーネル関数スペクトル選択部1312とを有する点で異なる。その他の構成および動作は、第5実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、あらかじめカーネル関数を計算しておくので、方向推定処理中にはカーネル関数の計算が不要になる。したがって、第5実施形態よりも少ない計算量で方向推定を行うことができる。
次に本発明の第7実施形態に係る波源方向推定装置について、図14を用いて説明する。本実施形態に係る波源方向推定装置は、上記第5実施形態の波源方向推定装置と比べると、統合相関関数計算部942に代えて、統合相関関数計算部1442を有する点で異なる。図14は、本実施形態に係る統合相関関数計算部1442の構成を説明するためのブロック図である。本実施形態に係る統合相関関数計算部1442は、上記第5実施形態の統合相関関数計算部942と比べると、逆変換部11211,11212,・・・,1121Kと統合部1122とに代えて、統合部1421と逆変換部1422とを有する点で異なる。その他の構成および動作は、第5実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、周波数別クロススペクトルを統合してから逆変換を行い、統合相関関数を得る。このため、周波数別クロススペクトルごとに逆変換を行っていた第5実施形態と比べると、逆変換の回数が少なくなる。したがって、第5実施形態よりも少ない計算量で統合相関関数を求めることができる。
次に本発明の第8実施形態に係る波源方向推定システムについて、図15Aおよび図15Bを用いて説明する。図15Aは、本実施形態に係る波源方向推定システム1500の構成を説明するための図である。本実施形態に係る波源方向推定システム1500は、上記第2実施形態に係る波源方向推定装置を用いている。したがって、第2実施形態と同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
本実施形態によれば、波源の方向を高精度に推定することができる。また、推定方向情報を画像などの可視化データとして表示するので、ユーザが波源の方向推定情報を視覚的に把握することができる。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
波源で発生した波を入力信号として取得する複数の入力信号取得手段と、
複数の前記入力信号取得手段で取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換手段と、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算手段と、
前記クロススペクトルの分散を計算する分散計算手段と、
前記クロススペクトルと前記分散とに基づいて、相関関数を計算する相関関数計算手段と、
を備える相関関数生成装置。
(付記2)
前記分散計算手段は、前記クロススペクトルの位相に基づいて分散を計算する付記1に記載の相関関数生成装置。
(付記3)
前記分散計算手段は、前記クロススペクトルの円周分散を計算する付記1に記載の相関関数生成装置。
(付記4)
前記分散計算手段は、前記入力信号取得手段で過去に取得された入力信号から変換された周波数領域信号に基づいて計算されたクロススペクトルに基づいて分散を計算する付記1に記載の相関関数生成装置。
(付記5)
前記相関関数計算手段は、
前記分散に基づいて前記クロススペクトルを重み付けする重み付け手段を備え、
重み付されたクロススペクトルに基づいて、相関関数を計算する、付記1乃至4のいずれか1項に記載の相関関数生成装置。
(付記6)
前記クロススペクトルを平均して平均クロススペクトルを計算する平均計算手段をさらに備え、
前記分散計算手段は、前記平均クロススペクトルから分散を計算する付記1乃至5のいずれか1項に記載の相関関数生成装置。
(付記7)
前記相関関数計算手段は、
前記分散と前記クロススペクトルとに基づいて、複数の第1周波数別クロススペクトルを生成する周波数別クロススペクトル生成手段と、
複数の前記第1周波数別クロススペクトルを統合して一つの相関関数を計算する統合相関関数計算手段と、
を備える付記1乃至6のいずれか1項に記載の相関関数生成装置。
(付記8)
前記統合相関関数計算手段は、
複数の前記第1周波数別クロススペクトルの逆変換を計算し、複数の周波数別相関関数を得る第1逆変換手段と、
前記第1逆変換手段により計算された複数の前記周波数別相関関数を統合して一つの相関関数を計算する第1統合手段と、
を備える付記7に記載の相関関数生成装置。
(付記9)
前記周波数別クロススペクトル生成手段は、
前記分散に基づいて、カーネル関数スペクトルを生成するカーネル関数スペクトル生成手段と、
複数の前記第1周波数別クロススペクトルに、前記カーネル関数スペクトルを乗じた複数の第2周波数別クロススペクトルを得る乗算手段と、
を備える付記7または8に記載の相関関数生成装置。
(付記10)
前記周波数別クロススペクトル生成手段は、
複数のカーネル関数スペクトルを記憶するカーネル関数スペクトル記憶手段と、
前記分散に基づいて、前記カーネル関数スペクトル記憶手段に記憶された複数の前記カーネル関数スペクトルから一つのカーネル関数スペクトルを選択するカーネル関数スペクトル選択手段と、
をさらに備え、
前記乗算手段は、複数の前記第1周波数別クロススペクトルに、選択された前記一つのカーネル関数スペクトルを乗じた複数の第2周波数別クロススペクトルを得る、付記9に記載の相関関数生成装置。
(付記11)
前記統合相関関数計算手段は、
複数の前記第1周波数別クロススペクトルを統合して、一つの統合クロススペクトルを得る第2統合手段と、
前記一つの統合クロススペクトルの逆変換を計算して一つの相関関数を得る第2逆変換手段と、
を備える付記7乃至10のいずれか1項に記載の相関関数生成装置。
(付記12)
波源で発生した波を入力信号として取得する複数の入力信号取得ステップと、
複数の前記入力信号取得手段で取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換ステップと、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算ステップと、
前記クロススペクトルの分散を計算する分散計算ステップと、
前記クロススペクトルと前記分散とに基づいて、相関関数を計算して生成する相関関数計算ステップと、
を含む相関関数生成方法。
(付記13)
波源で発生した波を入力信号として取得する複数の入力信号取得ステップと、
複数の前記入力信号取得手段で取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換ステップと、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算ステップと、
前記クロススペクトルの分散を計算する分散計算ステップと、
前記クロススペクトルと前記分散とに基づいて、相関関数を計算して生成する相関関数計算ステップと、
をコンピュータに実行させる相関関数生成プログラム。
(付記14)
付記1乃至11のいずれか1項に記載の相関関数生成装置を有し、
前記相関関数生成装置により生成された相関関数に基づいて、前記波源の方向を推定する波源方向推定装置。
Claims (10)
- 波源で発生した波を入力信号として取得する複数の入力信号取得手段と、
複数の前記入力信号取得手段で取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換手段と、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算手段と、
前記クロススペクトルの位相の分散として円周分散を計算する分散計算手段と、
前記円周分散に基づいて算出された重みによって重み付された前記クロススペクトルに基づいて、相関関数を計算する相関関数計算手段と、
を備える相関関数生成装置。 - 前記クロススペクトルを平均して平均クロススペクトルを計算する平均計算手段をさらに備え、
前記分散計算手段は、前記平均クロススペクトルから前記円周分散を計算する請求項1に記載の相関関数生成装置。 - 前記相関関数計算手段は、
前記円周分散と前記クロススペクトルとに基づいて、複数の周波数別クロススペクトルを生成する複数の周波数別クロススペクトル生成手段と、
前記複数の周波数別クロススペクトルを統合して一つの相関関数を計算する統合相関関数計算手段と、
を備える請求項1または2に記載の相関関数生成装置。 - 前記周波数別クロススペクトル生成手段は、
前記円周分散に基づいて、カーネル関数スペクトルを生成するカーネル関数スペクトル生成手段と、
周波数別の前記クロススペクトルに、前記カーネル関数スペクトルを乗じて前記周波数別クロススペクトルを得る乗算手段と、
を備える請求項3に記載の相関関数生成装置。 - 前記周波数別クロススペクトル生成手段は、
複数のカーネル関数スペクトルを記憶するカーネル関数スペクトル記憶手段と、
前記円周分散に基づいて、前記カーネル関数スペクトル記憶手段に記憶された複数の前記カーネル関数スペクトルから一つのカーネル関数スペクトルを選択するカーネル関数スペクトル選択手段と、
周波数別の前記クロススペクトルに、選択された前記一つのカーネル関数スペクトルを乗じて前記周波数別クロススペクトルを得る乗算手段と、
を備える請求項3に記載の相関関数生成装置。 - 前記統合相関関数計算手段は、
前記複数の周波数別クロススペクトルの逆変換を計算し、複数の周波数別相関関数を得る複数の第1逆変換手段と、
前記複数の第1逆変換手段により計算された複数の前記周波数別相関関数を統合して一つの相関関数を計算する第1統合手段と、
を備える請求項3乃至5のいずれか1項に記載の相関関数生成装置。 - 前記統合相関関数計算手段は、
前記複数の周波数別クロススペクトルを統合して、一つの統合クロススペクトルを得る第2統合手段と、
前記一つの統合クロススペクトルの逆変換を計算して一つの相関関数を得る第2逆変換手段と、
を備える請求項3乃至5のいずれか1項に記載の相関関数生成装置。 - 波源で発生した波を入力信号として取得する複数の入力信号取得ステップと、
複数の前記入力信号取得ステップで取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換ステップと、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算ステップと、
前記クロススペクトルの位相の分散として円周分散を計算する分散計算ステップと、
前記円周分散に基づいて算出された重みによって重み付された前記クロススペクトルに基づいて、相関関数を計算して生成する相関関数計算ステップと、
を含む相関関数生成方法。 - 波源で発生した波を入力信号として取得する複数の入力信号取得ステップと、
複数の前記入力信号取得ステップで取得した複数の前記入力信号を変換して、複数の周波数領域信号を得る変換ステップと、
複数の前記周波数領域信号に基づいて、クロススペクトルを計算するクロススペクトル計算ステップと、
前記クロススペクトルの位相の分散として円周分散を計算する分散計算ステップと、
前記円周分散に基づいて算出された重みによって重み付された前記クロススペクトルに基づいて、相関関数を計算して生成する相関関数計算ステップと、
をコンピュータに実行させる相関関数生成プログラム。 - 請求項1乃至7のいずれか1項に記載の相関関数生成装置を有し、
前記相関関数生成装置により生成された相関関数に基づいて、前記波源の方向を推定する波源方向推定装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/000680 WO2018131099A1 (ja) | 2017-01-11 | 2017-01-11 | 相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018131099A1 JPWO2018131099A1 (ja) | 2019-11-07 |
JP6769495B2 true JP6769495B2 (ja) | 2020-10-14 |
Family
ID=62840122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018561142A Active JP6769495B2 (ja) | 2017-01-11 | 2017-01-11 | 相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11336997B2 (ja) |
JP (1) | JP6769495B2 (ja) |
WO (1) | WO2018131099A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10334360B2 (en) * | 2017-06-12 | 2019-06-25 | Revolabs, Inc | Method for accurately calculating the direction of arrival of sound at a microphone array |
JP7056739B2 (ja) * | 2018-06-25 | 2022-04-19 | 日本電気株式会社 | 波源方向推定装置、波源方向推定方法、およびプログラム |
US10629226B1 (en) * | 2018-10-29 | 2020-04-21 | Bestechnic (Shanghai) Co., Ltd. | Acoustic signal processing with voice activity detector having processor in an idle state |
US20220342026A1 (en) * | 2019-09-02 | 2022-10-27 | Nec Corporation | Wave source direction estimation device, wave source direction estimation method, and program recording medium |
US11392462B2 (en) | 2019-09-26 | 2022-07-19 | Gulfstream Aerospace Corporation | Voting of triple redundant circular data |
WO2023157159A1 (ja) * | 2022-02-17 | 2023-08-24 | 日本電信電話株式会社 | 位相差スペクトル推定方法、チャネル間関係情報推定方法、信号符号化方法、信号処理方法、これらの装置、プログラム |
JPWO2023181144A1 (ja) * | 2022-03-23 | 2023-09-28 | ||
WO2024053353A1 (ja) * | 2022-09-08 | 2024-03-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 信号処理装置、及び、信号処理方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7363172B2 (en) * | 2006-01-05 | 2008-04-22 | United States Of America As Represented By The Secretary Of The Navy | Method and apparatus for detecting damage in structures |
JP5018643B2 (ja) | 2008-05-27 | 2012-09-05 | 三菱電機株式会社 | 方位探知装置 |
US8306132B2 (en) * | 2009-04-16 | 2012-11-06 | Advantest Corporation | Detecting apparatus, calculating apparatus, measurement apparatus, detecting method, calculating method, transmission system, program, and recording medium |
JP2011033717A (ja) | 2009-07-30 | 2011-02-17 | Secom Co Ltd | 雑音抑圧装置 |
JP2012185009A (ja) | 2011-03-04 | 2012-09-27 | Mitsubishi Electric Corp | 方位探知装置 |
WO2013042201A1 (ja) | 2011-09-20 | 2013-03-28 | トヨタ自動車株式会社 | 音源検出装置 |
-
2017
- 2017-01-11 JP JP2018561142A patent/JP6769495B2/ja active Active
- 2017-01-11 WO PCT/JP2017/000680 patent/WO2018131099A1/ja active Application Filing
- 2017-01-11 US US16/476,897 patent/US11336997B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20190335273A1 (en) | 2019-10-31 |
WO2018131099A1 (ja) | 2018-07-19 |
JPWO2018131099A1 (ja) | 2019-11-07 |
US11336997B2 (en) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6769495B2 (ja) | 相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置 | |
US10515650B2 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
JP6109927B2 (ja) | 源信号分離のためのシステム及び方法 | |
JP6874766B2 (ja) | 波源方向推定装置、波源方向推定システム、波源方向推定方法および波源方向推定プログラム | |
WO2018003158A1 (ja) | 相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置 | |
EP3227704B1 (en) | Method for tracking a target acoustic source | |
EP3260875A1 (en) | An automotive testing method, system and computer program product | |
EP2878515B1 (en) | Generating an audio signal with a configurable distance cue | |
CN110047507B (zh) | 一种声源识别方法及装置 | |
JP2007336232A (ja) | 特定方向収音装置、特定方向収音プログラム、記録媒体 | |
Al-Aboosi et al. | Improved underwater signal detection using efficient time–frequency de-noising technique and Pre-whitening filter | |
JP4928382B2 (ja) | 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体 | |
JP6753474B2 (ja) | レーダー間干渉除去方法、信号処理装置、信号処理方法および信号処理プログラム | |
KR100873000B1 (ko) | 마이크 어레이를 이용한 방향성 음원 필터링 시스템 및 그방법 | |
JP2010127771A (ja) | 合成開口ソーナー、合成開口ソーナーの位相誤差補正方法及びプログラム | |
Hosseini et al. | Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function | |
JP2018091647A (ja) | 信号処理装置、方位算出方法及び方位算出プログラム | |
WO2020250797A1 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP5713933B2 (ja) | 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
JP7252779B2 (ja) | 雑音除去装置、雑音除去方法およびプログラム | |
Ghosh et al. | Estimation of direction of arrival of a moving target using subspace based approaches | |
Chen et al. | A Fast Estimation Method for 3-D Acoustic Source Localization | |
Pici et al. | Design of spectrally adaptive noise radar waveforms | |
CN115932728A (zh) | 声源定位方法、装置和电子设备 | |
CN117768352A (zh) | 基于语音技术的跨网数据摆渡方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190703 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200731 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200825 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200907 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6769495 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |