CN108540898A - 声源探测装置及方法、记录有声源探测程序的记录介质 - Google Patents

声源探测装置及方法、记录有声源探测程序的记录介质 Download PDF

Info

Publication number
CN108540898A
CN108540898A CN201810158701.6A CN201810158701A CN108540898A CN 108540898 A CN108540898 A CN 108540898A CN 201810158701 A CN201810158701 A CN 201810158701A CN 108540898 A CN108540898 A CN 108540898A
Authority
CN
China
Prior art keywords
weight
correlation matrix
sound source
signal
detection device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810158701.6A
Other languages
English (en)
Other versions
CN108540898B (zh
Inventor
金森丈郎
林田亘平
吉国信太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2017216735A external-priority patent/JP6953287B2/ja
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN108540898A publication Critical patent/CN108540898A/zh
Application granted granted Critical
Publication of CN108540898B publication Critical patent/CN108540898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/02Systems using the reflection of electromagnetic waves other than radio waves
    • G01S17/06Systems determining position data of a target
    • G01S17/08Systems determining position data of a target for measuring distance only
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/86Combinations of lidar systems with systems other than lidar, radar or sonar, e.g. with direction finders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Electromagnetism (AREA)
  • General Physics & Mathematics (AREA)
  • Otolaryngology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本公开涉及声源探测装置及方法、记录有声源探测程序的记录介质,对探测对象的声源的方向进行探测的声源探测装置(1)具备:相关矩阵算出部,其算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列收集到的声响信号;学习部,其以使得对预先存储在存储部中的多个第2相关矩阵分别乘以权重后的线性和等于第1相关矩阵的方式,通过学习来算出权重,所述多个第2相关矩阵是根据麦克风阵列的阵列排列而算出的按方向的相关矩阵;以及空间谱算出部,其使用通过学习部算出的权重,算出表示按方向的声压强度的、观测信号的空间谱。

Description

声源探测装置及方法、记录有声源探测程序的记录介质
技术领域
本公开涉及声源探测装置、声源探测方法以及记录有声源探测程序的记录介质。
背景技术
例如在日本特开2014-56181号公报中,提出了能够根据由多个麦克风单元获得的多个声响信号高精度地推定声源的方向的声源方向推定装置。在该日本特开2014-56181号公报中,通过使用基于多个声响信号的噪音信号的相关矩阵进行噪音应对措施,从而根据多个声响信号高精度地推定声源的方向。
发明内容
发明要解决的技术问题
然而,在专利文献1中,基于作为观测信号的由多个麦克风单元获得的多个声响信号来算出噪音信号的相关矩阵。因此,在噪声源和探测对象的声源同时存在、或噪声的等级比探测对象的声源的等级高的情况下,难以准确地求出仅是噪声分量的相关矩阵。也就是说,存在如下问题:在基于由多个麦克风单元获得的多个声响信号的信号相位差进行声源探测的方式中,在存在比探测对象的声源高的声压级的噪声的情况下,会因该噪声的影响而导致不能对探测对象的声源进行检测即探测。
本公开是鉴于上述的情况而完成的,其目的在于提供一种能够更切实地探测处于探测对象范围内的探测对象的声源的方向的声源探测装置。
用于解决问题的技术方案
本公开的一技术方案的声源探测装置,对探测对象的声源的方向进行探测,所述声源探测装置具备:存储部;和处理电路,其在运行中执行包括以下的工作:算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列收集到的声响信号,以使得对预先存储在所述存储部中的多个第2相关矩阵分别乘以权重后的线性和等于所述第1相关矩阵的方式,通过学习来算出所述权重,所述多个第2相关矩阵是根据所述麦克风阵列的阵列排列而算出的按方向的相关矩阵,使用所算出的所述权重,算出表示按方向的声压强度的、所述观测信号的空间谱。
此外,这些中的一部分的具体技术方案既可以通过系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM等记录介质来实现,也可以通过系统、方法、集成电路、计算机程序和记录介质的任意组合来实现。
发明的效果
根据本公开,能够实现能更切实地探测处于探测对象范围内的探测对象的声源的方向的声源探测装置等。
附图说明
图1是表示实施方式1的声源探测系统的构成的一例的图。
图2是表示实施方式1的麦克风阵列与存在探测对象的声源的声源方向之间的位置关系的说明图。
图3是在图2所示的位置关系下麦克风阵列观测的观测信号的空间谱图。
图4是表示图1所示的声源探测装置的详细构成的一例的图。
图5是实施方式1的选择部的选择方法的说明图。
图6是表示实施方式1的非线性函数部的构成的一例的图。
图7是表示实施方式1的声源探测装置的声源探测处理的流程图。
图8是表示图7所示的声源探测处理的详细情况的流程图。
图9是比较例的空间谱图。
图10是实施方式1的空间谱图。
图11是表示实施方式2的声源探测系统的构成的一例的图。
具体实施方式
本公开的一技术方案的声源探测装置,对探测对象的声源的方向进行探测,所述声源探测装置具备:存储部;和处理电路,其在运行中执行包括以下的工作:算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列收集到的声响信号,以使得对预先存储在所述存储部中的多个第2相关矩阵分别乘以权重后的线性和等于所述第1相关矩阵的方式,通过学习来算出所述权重,所述多个第2相关矩阵是根据所述麦克风阵列的阵列排列而算出的按方向的相关矩阵,使用所算出的所述权重,算出表示按方向的声压强度的、所述观测信号的空间谱。
根据该构成,能够更切实地探测处于探测对象范围内的探测对象的声源的方向。进一步,因为使用通过学习算出的权重来算出观测信号的空间谱,所以能够实现抗噪声性以及对声音变化的跟随性优良的源探测装置。
在此,例如也可以是,所述工作还包括:选择第1元素和第2元素,所述第1元素是构成所述第1相关矩阵的元素中的一个元素,所述第2元素是构成所述多个第2相关矩阵的各第2相关矩阵的元素中的、位于与所述第1元素对应的位置的元素,逐次地切换要选择的所述第1元素以及所述第2元素,在所述权重的算出中,通过所述逐次地反复进行如下处理来算出所述权重:以使得对所述第2元素乘以第1权重后的第1元素线性和等于所述第1元素的方式,将所述第1权重更新为在所述权重的算出中算出的第2权重;以使得对下一个选择出的所述第2元素乘以更新后的所述第2权重后的第2元素线性和等于下一个选择出的所述第1元素的方式,将所述第2权重更新为在所述权重的算出中算出的第3权重。
由此,能够通过学习来算出使第1相关矩阵与多个第2相关矩阵的对应的各矩阵元素同时相等的权重,因此,基于由包括三个以上的麦克风单元的麦克风阵列收集到的声响信号,能够更切实地探测处于探测对象范围内的探测对象的声源的方向。
另外,例如也可以是,在所述选择中,仅从构成所述第1相关矩阵以及所述第2相关矩阵的除对角成分之外的元素中的、由所述对角成分划分开的两组的多个元素的一方的组的多个元素中,选择所述第1元素以及所述第2元素。
由此,能够削减运算量,因此能够更高速地探测处于探测对象范围内的探测对象的声源的方向。
另外,例如也可以是,在所述权重的算出中,通过使用最小均方算法即LMS算法或独立成分分析即ICA,根据作为所述线性和与所述第1相关矩阵之差的误差和所述第2相关矩阵,算出所述权重。
由此,能够在互相消除方向间的影响的同时算出按方向的强度,因此能够实现抗噪声性优良的声源探测装置。
另外,例如也可以是,在所述权重的算出中,保持权重算出对所述多个第2相关矩阵分别乘以所保持的权重后的线性和,算出作为所述线性和与所述第1相关矩阵之差的误差,根据所述误差与所述第2相关矩阵之积来算出权重更新量,通过对所述保持的权重加上所述权重更新量来更新所述权重。
在此,例如也可以是,在所述权重的更新中,通过使用LMS算法或ICA,根据所述误差以及所述第2相关矩阵来算出所述权重更新量。
另外,例如也可以是,在所述权重的算出中,进一步,使用预定的非线性函数,对所述误差附加非线性性质,在所述更新量的算出中,根据附加了非线性性质的所述误差以及所述第2相关矩阵来算出所述权重更新量。
由此,能够对所算出的误差赋予非线性性质并抑制方向间相互影响,因此能够实现抗噪声性优良的声源探测装置。
另外,本公开的一技术方案的声源探测方法,对探测对象的声源的方向进行探测,所述声源探测方法包括:算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列收集到的声响信号,以使得对预先存储在存储部中的多个第2相关矩阵分别乘以权重后的线性和等于所述第1相关矩阵的方式,通过学习来算出所述权重,所述多个第2相关矩阵是根据所述麦克风阵列的阵列排列而算出的按方向的相关矩阵,使用所算出的所述权重,算出表示按方向的声压强度的、所述观测信号的空间谱。
另外,本公开的一技术方案的记录介质,是存储有用于使计算机执行对探测对象的声源的方向进行探测的声源探测方法的程序的计算机可读取的非瞬时性记录介质,所述程序在由计算机执行时,使所述计算机执行包括以下的方法:算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列收集到的声响信号,以使得对预先存储在存储部中的多个第2相关矩阵分别乘以权重后的线性和等于所述第1相关矩阵的方式,通过学习来算出所述权重,所述多个第2相关矩阵是根据所述麦克风阵列的阵列排列而算出的按方向的相关矩阵,使用所算出的所述权重,算出表示按方向的声压强度的、所述观测信号的空间谱。
此外,这些中的一部分的具体技术方案既可以通过系统、方法、集成电路、计算机程序或计算机可读取的CD-ROM等记录介质来实现,也可以通过系统、方法、集成电路、计算机程序和记录介质的任意组合来实现。
以下,参照附图对本公开的一技术方案的声源探测装置进行具体说明。此外,以下说明的实施方式都表示本公开的一个具体例子。以下的实施方式中示出的数值、形状、材料、构成要素、构成要素的配置位置等是一例,并非限定本公开的意思。另外,关于以下的实施方式中的构成要素中的未记载在表示最上位概念的独立权利要求中的构成要素,作为任意的构成要素来说明。另外,在所有的实施方式中,也可以组合各实施方式的内容。
(实施方式1)
图1是表示实施方式1的声源探测系统1000的构成的一例的图。
声源探测系统1000被用于对探测对象的声源的方向进行探测。在本实施方式中,声源探测系统1000如图1所示具备声源探测装置1、麦克风阵列200和频率分析部300。
[麦克风阵列200]
麦克风阵列200包括互相分离地配置的两个以上的麦克风单元,观测即收集从所有的方向到来的声波并输出将该声波变换成电信号后的声响信号。在本实施方式中,以下,设为麦克风阵列200由三个麦克风单元即麦克风单元201、202、203构成来进行说明。麦克风单元201、麦克风单元202以及麦克风单元203例如是对声压的灵敏度高的无指向性的麦克风元件,分离地配置(换言之是配置于不同的位置)。在此,麦克风单元201输出将收集到的声波变换成电信号后的时域信号即声响信号m1(n)。同样地,麦克风单元202输出将收集到的声波变换成电信号后的时域的信号即声响信号m2(n),麦克风单元203输出将收集到的声波变换成电信号后的时域的信号即声响信号m3(n)。
图2是表示实施方式1中的麦克风阵列200与存在探测对象的声源S的声源方向之间的位置关系的说明图。图3是在图2所示的位置关系下麦克风阵列200观测的观测信号的空间谱图。图2中示出了由麦克风单元201、麦克风单元202以及麦克风单元203在θ=0度的轴上排列成一列的阵列排列构成的麦克风阵列200的结构。另外,图2中示出了相对于麦克风阵列200在θ=θs的方向上存在探测对象的声源S且不存在成为妨碍声的声源的情况。在该情况下,作为声源探测装置1的探测结果的空间谱成为如图3所示那样。即,在作为探测结果的图3所示的空间谱中,表示最高强度的角度成为θs。
[频率分析部300]
频率分析部300将在两个以上的麦克风单元各自中观测到的声响信号变换成频域的信号,作为频谱信号进行输出。更具体而言,频率分析部300对从麦克风阵列200输入的声响信号进行频率分析,输出作为频域信号的频谱信号。此外,在频率分析中,使用快速傅里叶变换(Fast Fourier Transform:FFT)或离散傅里叶变换(Discrete FourierTransform:DFT)等将时间信号变换成各频率分量的振幅信息和相位信息的方法即可。
在本实施方式中,频率分析部300由进行快速傅里叶变换的FFT301、FFT302以及FFT303构成。FFT301将从麦克风单元201输出的声响信号m1(n)作为输入,使用快速傅里叶变换进行从时域向频域的变换而输出频谱信号Sm1(ω)。FFT302将从麦克风单元202输出的声响信号m2(n)作为输入,使用快速傅里叶变换进行从时域向频域的变换而输出频谱信号Sm2(ω)。FFT303将从麦克风单元203输出的声响信号m3(n)作为输入,使用快速傅里叶变换进行从时域向频域的变换而输出频谱信号Sm3(ω)。
[声源探测装置1]
图4是表示图1所示的声源探测装置1的详细构成的一例的图。
声源探测装置1对探测对象的声源的方向进行探测。在本实施方式中,声源探测装置1如图1以及图4所示,具备相关矩阵算出部10、存储部20、选择部30、学习部40、空间谱算出部100以及输出部110。此外,如果构成麦克风阵列200的麦克风单元的个数为2个,则声源探测装置1也可以不具备选择部30。另外,也可以设为声源探测装置1具备麦克风阵列200以及频率分析部300。以下,对各构成要素进行说明。
<相关矩阵算出部10>
相关矩阵算出部10算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由麦克风阵列200收集到的声响信号。
在本实施方式中,相关矩阵算出部10根据频率分析部300所输出的频谱,算出作为第1相关矩阵的观测相关矩阵Rx(ω)。更具体而言,相关矩阵算出部10使用下述的(式1)以及(式2),将来自FFT301的频谱信号Sm1(ω)、来自FFT302的频谱信号Sm2(ω)以及来自FFT303的频谱信号Sm3(ω)作为输入,算出观测相关矩阵Rx(ω)。
在此,构成观测相关矩阵Rx(ω)的各元素Xij(ω)保存有相位差信息,该相位差信息是针对从存在于实际环境中的多个声源向各麦克风单元到来的多个声波的相位差信息。例如,(式1)所示的元素X12(ω)表示针对向麦克风单元201以及麦克风单元202到来的声波的相位差信息。另外,例如(式1)所示的元素X13(ω)表示针对向麦克风单元201以及麦克风单元203到来的声波的相位差信息。(式2)所示的(·)*表示复共轭。
此外,在本实施方式中,在作为麦克风单元201~203示出的各麦克风单元的声压灵敏度特性大致相等且均匀的情况下,能够通过(式3)来表示观测相关矩阵Rx(ω)的各元素Xij(ω)。(式3)所示的观测相关矩阵Rx(ω)的各元素Xij(ω)相当于对(式2)中的分母的标准化项进行了省略的各元素。
xij(ω)=Smi(ω)*Smj(ω)…(式3)
<存储部20>
存储部20预先存储根据麦克风阵列200的阵列排列而算出的按方向的相关矩阵即多个第2相关矩阵。
在本实施方式中,存储部20由存储器等构成,预先存储有作为第2相关矩阵的、各探测方向θ的参照相关矩阵Rr(θ,ω)。在图4所示的例子中,存储部20预先存储有例如方向数N=180个的0≦θ≦180的范围内的参照相关矩阵Rr(θ1,ω)~Rr(θN,ω)。
参照相关矩阵Rr(θ,ω)表示与各方向θ的声波对应的麦克风单元间的相位差,因此,如果声源的方向θ和麦克风阵列200的麦克风单元排列即阵列排列已决定,则能够在理论上算出该参照相关矩阵。以下,以图2所示的麦克风阵列200的阵列排列为例,对算出参照相关矩阵Rr(θ,ω)的方法进行说明。
在图2中,如上所述,示出了构成麦克风阵列200的麦克风单元201~203呈直线状排列的阵列排列的例子。另外,图2中也示出了在方向θs上存在声源S这一位置关系。
对于从声源S向麦克风单元201~203的声波的到来时刻,若以中央的麦克风单元202为基准,则对于麦克风单元201而言提前时间τ,对于麦克风单元203而言延迟时间τ。时间τ能够使用以下的(式4)来算出。在(式4)中,L表示麦克风单元间距离,c表示音速。
τ=L·cos(θs)/c…(式4)
并且,对于表示与来自方向θ的声源的声波对应的麦克风单元201~203的相位差关系的方向矢量,若以位于中央的麦克风单元202的位置为基准,则可使用(式5)来表现。
因此,若换成声源位于方向θ上时来说,则相对于方向θ的参照相关矩阵Rr(θ,ω)能够根据(式2)、(式3)以及(式5)的关系而定义成(式6)所示那样。在(式6)中,(·)H表示复共轭转置。
如此,能够算出相对于方向θ1~θN(例如N=180)的参照相关矩阵Rr(θ1,ω)~Rr(θN,ω)。
<选择部30>
选择部30选择第1元素以及第2元素,并逐次地切换要选择的第1元素以及第2元素,所述第1元素是构成第1相关矩阵的元素中的一个元素,所述第2元素是构成多个第2相关矩阵的各第2相关矩阵的元素中的位于与第1元素对应的位置的元素。在此,选择部30仅从构成第1相关矩阵以及第2相关矩阵的除对角成分之外的元素中的、由对角成分划分开的两组的多个元素的一方的组的多个元素中,选择第1元素以及第2元素即可。
在本实施方式中,选择部30将来自相关矩阵算出部10的观测相关矩阵Rx(ω)和来自存储部20的参照相关矩阵Rr(θ,ω)作为输入,选择并输出观测相关矩阵Rx(ω)以及多个参照相关矩阵Rr(θ,ω)中的对应的相关矩阵的元素。选择部30例如如图4所示,具备矩阵元素选择部31和矩阵元素选择部32-1~矩阵元素选择部32-N。此外,图4中示出了设置有被输入对于方向θ1的参照相关矩阵Rr(θ1,ω)的矩阵元素选择部32-1和被输入对于方向θN的参照相关矩阵Rr(θN,ω)的矩阵元素选择部32-N这两个的情况下的例子,但并不限于此。在方向数N=180的情况下,设置有被输入对于方向θ1~θN的参照相关矩阵Rr(θ1,ω)~Rr(θN,ω)的N个矩阵元素选择部32-1~矩阵元素选择部32-N。
以下,使用图5对选择部30的选择方法的一例进行具体说明。
图5是实施方式1中的选择部30的选择方法的说明图。
如图5所示,矩阵元素选择部31选择构成从相关矩阵算出部10输入的观测相关矩阵Rx(ω)的元素(也称为矩阵元素)中的一个元素,作为相位差信号x(ω)进行输出。矩阵元素选择部32-m(m为1以上且N以下的自然数)选择构成从存储部20输入的参照相关矩阵Rr(θm,ω)的元素中的、与矩阵元素选择部31所选择出的元素相同行且相同列的元素,作为相位差信号r(θm,ω)进行输出。
此外,通常,相关矩阵的对角成分成为1而在信号处理上没有意义。另外,在相关矩阵中对行编号和列编号进行了调换的xij和xji,在相位旋转相反的关系下作为信息来说是相同的。考虑到这些情况,选择部30从构成参照相关矩阵Rr(θ,ω)以及观测相关矩阵Rx(ω)的相关矩阵的除对角成分之外的元素中的、由对角成分划分开的两组的多个元素的一方的组的多个元素中选择元素并进行输出即可。也就是说,选择部30选择参照相关矩阵Rr(θ,ω)以及观测相关矩阵Rx(ω)的除相关矩阵的对角成分之外的上三角矩阵或下三角矩阵的元素并进行输出即可。由此,声源探测装置1能够削减运算量。
进一步,选择部30从运算量的削减等的观点出发,也可以间隔地选择上三角矩阵或下三角矩阵的元素。
<学习部40>
学习部40以使得对预先存储在存储部20中的多个第2相关矩阵分别乘以权重后的线性和(日文“線形和”)等于第1相关矩阵的方式,通过学习来算出该权重。在此,学习部40通过使用LMS算法(最小均方差)或ICA(Independent Component Analysis,独立成分分析),根据作为该线性和与第1相关矩阵之差的误差和第2相关矩阵来算出权重。更具体而言,学习部40以使得对由选择部30选择出的第2元素乘以第1权重后的第1元素线性和等于由选择部30选择出的第1元素的方式,将第1权重更新为通过学习而算出的第2权重。接着,学习部40以使得对下一个由选择部30选择出的第2元素乘以更新后的第2权重后的第2元素线性和等于下一个由选择部30选择出的第1元素的方式,将第2权重更新为通过学习而算出的第3权重。学习部40通过逐次反复进行这些更新,由此通过学习来算出该权重。
在本实施方式中,学习部40如图1以及图4所示,具备保持部50、线性和算出部60、误差算出部70、非线性函数部80以及权重更新部90。此外,非线性函数部80并不是必须的结构,学习部40也可以不具备非线性函数部80。
《保持部50》
保持部50保持由权重更新部90更新的权重。保持部50保持有要对各参照相关矩阵Rr(θ,ω)乘以的权重。换言之,该权重对于构成参照相关矩阵Rr(θ1,ω)~Rr(θN,ω)各自的相关矩阵的各元素而言是共同的。
另外,权重是以θ以及ω为变量的函数,但通过ω作为常数来对待,其能够作为一次项的系数来对待。以下,将权重称为权重系数a(θ,ω)来进行说明。
在本实施方式中,权重系数a(θ,ω)是对各方向θ的参照相关矩阵Rr(θ,ω)乘以的系数。在图4中,作为一例,示出了与例如180个的0≦θ≦180的范围内的参照相关矩阵Rr(θ,ω)对应的方向θ1~θN(N=180)的权重系数a(θ1,ω)~a(θN,ω)。
保持部50保持由权重更新部90更新的权重系数a(θ,ω)。也就是说,权重系数a(θ,ω)是基于由权重更新部90算出的权重更新量来对值进行更新的学习系数。另外,保持部50将保持的权重系数a(θ,ω)向空间谱算出部100输出。
《线性和算出部60》
线性和算出部60算出对多个第2相关矩阵分别乘以保持部50保持的权重后的线性和。
在本实施方式中,线性和算出部60如图4所示具备信号乘法运算部61-1~信号乘法运算部61-N和信号加法运算部62。
信号乘法运算部61-1对由矩阵元素选择部32-1选择出的参照相关矩阵Rr(θ1,ω)的元素r(θ1,ω)乘以方向θ1的权重系数a(θ1,ω)并输出到信号加法运算部62。同样地,信号乘法运算部61-N对由矩阵元素选择部32-N选择出的参照相关矩阵Rr(θN,ω)的元素r(θN,ω)乘以方向θN的权重系数a(θN,ω)并输出到信号加法运算部62。如此,信号乘法运算部61-1~信号乘法运算部61-N分别将按各方向θ1~θN对参照相关矩阵Rr(θ,ω)乘以权重系数a(θ,ω)而得到的信号输出到信号加法运算部62。
信号加法运算部62将对从信号乘法运算部61-1~信号乘法运算部61-N输出的信号进行了加法运算而得到的推定相位差信号xr(ω)输出到误差算出部70。更具体而言,信号加法运算部62使用(式7),算出从信号乘法运算部61-1~信号乘法运算部61-N输出的信号的线性和来作为推定相位差信号xr(ω)。
《误差算出部70》
误差算出部70算出作为由线性和算出部60算出的线性和与第1相关矩阵之差的误差。在本实施方式中,误差算出部70如图4所示,具备信号减法运算部71。
信号减法运算部71通过从来自矩阵元素选择部31的相位差信号x(ω)减去来自信号加法运算部62的推定相位差信号xr(ω),算出误差信号e(ω)。更具体而言,信号减法运算部71使用(式8)来算出误差信号e(ω)。
e(ω)=x(ω)-xr(ω)…(式8)
《非线性函数部80》
非线性函数部80使用预定的非线性函数,对误差附加非线性性质。更具体而言,非线性函数部80将从信号减法运算部71输入的误差信号e(ω)变换成通过具备非线性输入输出特性的函数即非线性函数附加了非线性性质的信号。非线性函数例如是双曲线函数,但并不限于此。只要是具有能够对信号振幅给予限制的非线性输入输出特性的非线性函数,则可以是任何函数。这是因为:即使在因外部干扰而导致相位差失常、误差信号e(ω)暂时变大,也能够抑制对在后述的权重更新部90中学习的权重更新量产生的影响。
图6是表示实施方式1的非线性函数部80的构成的一例的图。非线性函数部80如图6所示具备实部提取部801、虚部提取部802、非线性性质追加部803、非线性性质追加部804、虚数单位乘法运算部805以及信号加法运算部806。
实部提取部801提取所输入的误差信号e(ω)的实数部,输出到非线性性质追加部803。虚部提取部802提取所输入的误差信号e(ω)的虚数部,输出到非线性性质追加部804。
非线性性质追加部803对从实部提取部801输入的误差信号e(ω)的实数部的信号振幅通过非线性函数附加非线性性质,并输出到信号加法运算部806。非线性性质追加部804对从虚部提取部802输入的误差信号e(ω)的虚数部的信号振幅通过非线性函数附加非线性性质,并输出到虚数单位乘法运算部805。
虚数单位乘法运算部805为了使从非线性性质追加部804输入的信号恢复为虚数而乘以虚数单位j,并输出到信号加法运算部806。信号加法运算部806将对作为实部信号的从非线性性质追加部803输入的信号和作为虚部信号的从虚数单位乘法运算部805输入的信号进行了加法运算后的附加了非线性性质的复信号f(e(ω))输出到权重更新部90。
(式9)中示出附加了非线性性质的复信号f(e(ω))的一例。(式9)是对非线性函数使用双曲线函数tanh(·)的情况下的例子。real(·)表示实数部,imag(·)表示虚数部,j表示虚数单位。
f(e(ω))=tanh(real(e(ω)))+j·tanh(imag(e(ω)))…(式9)
《权重更新部90》
权重更新部90通过使用LMS(Least Mean Square,最小均方)算法或ICA(Independent Component Analysis),根据误差以及第2相关矩阵来算出权重更新量,对保持部50保持的权重加上该权重更新量而作为保持部50保持的权重。另外,在声源探测装置1具备非线性函数部80的情况下,权重更新部90根据通过非线性函数部80附加了非线性性质的误差以及第2相关矩阵来算出权重更新量,对保持部50保持的权重加上该权重更新量而作为保持部50保持的权重。
在本实施方式中,权重更新部90被输入从非线性函数部80输入的复信号f(e(ω))和从选择部30输入的N个相位差信号r(θ1,ω)~r(θN,ω)。并且,权重更新部90算出与要对N个相位差信号r(θ1,ω)~r(θN,ω)乘上的权重系数a(θ1,ω)~a(θN,ω)对应的权重更新量Δa(θ1,ω)~Δa(θN,ω)。
例如,在声源探测装置1不具备非线性函数部80的情况下,权重更新部90使用(式10),算出权重更新量Δa(θ1,ω)~Δa(θN,ω)。另一方面,在声源探测装置1具备非线性函数部80的情况下,权重更新部90使用(式11),算出权重更新量Δa(θ1,ω)~Δa(θN,ω)。
Δa(θk,ω)=real(β·e(ω)·r(θk,ω)*)…(式10)
Δa(θk,ω)=real(β·f(e(ω))·r(θk,ω)*)…(式11)
此外,(式10)以及(式11)示出了使用LMS算法来算出权重更新量的情况。β是控制更新速度的参数。另外,对于相关矩阵,在元素rij(ω)和rji(ω)存在相位反转的关系。因此,在(式10)以及(式11)中,因复共轭的关系而虚部被消除,因此设置了real(·)的部分。
并且,权重更新部90如下述的(式12)所示,使用所算出的权重更新量,更新保持部50所保持的权重系数a(θk,ω)。
a(θk,ω)=a(θk,ω)+Δa(θk,ω)…(式12)
《空间谱算出部100》
空间谱算出部100使用由学习部40算出的权重,算出表示按方向的声压强度的、观测信号的空间谱。
在本实施方式中,空间谱算出部100将保持部50保持的、由权重更新部90通过学习而更新的权重系数a(θ1,ω)~a(θN,ω)作为输入,算出空间谱p(θ),输出到输出部110。
更具体而言,空间谱算出部100如下述的(式13)所示,通过将保持部50保持的权重系数a(θ,ω)针对频率ω来计算和或者平均值,能够得到空间谱p(θ)。原理将在后面叙述,但这是因为:权重系数a(θ,ω)作为表示各方向θ及频率的声波的强度的函数来处理。
[声源探测装置1的工作]
对如上述那样构成的声源探测装置1所进行的声源探测处理进行说明。
图7是表示实施方式1的声源探测装置1的声源探测处理的流程图。
首先,声源探测装置1进行观测信号的相关矩阵算出处理(S10)。更具体而言,声源探测装置1算出观测信号的相关矩阵即观测相关矩阵Rx(ω),所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列200收集到的声响信号。
接着,声源探测装置1进行对参照相关矩阵分别乘以的权重的学习处理(S20)。更具体而言,声源探测装置1以使得对预先存储在存储部20中的多个参照相关矩阵Rr(θ,ω)分别乘以权重系数a(θ,ω)后的线性和等于观测相关矩阵Rx(ω)的方式,通过学习来算出权重,所述多个参照相关矩阵Rr(θ,ω)是根据麦克风阵列的阵列排列而算出的按方向的相关矩阵。
接着,声源探测装置1进行观测信号的空间谱算出处理(S30)。更具体而言,声源探测装置1使用在步骤S20中算出的权重,算出表示按方向的声压强度的、观测信号的空间谱p(θ)。
图8是表示图7所示的声源探测处理的详细情况的流程图。对与图7同样的要素标注相同的标号。
更详细而言,首先,在步骤S10中,麦克风阵列200取得时刻t的声响信号(S101)。接着,频率分析部300进行通过步骤S101取得的声响信号的频率分析(S102),变换成作为频域信号的频谱信号。然后,声源探测装置1根据在步骤S102中变换得到的频谱信号,算出时刻t的观测信号的相关矩阵即观测相关矩阵Rx(ω)(S103)。
接着,在步骤S20中,首先,对声源探测装置1设定预定次数Nt来将作为进行权重的学习处理的次数(S201)。接着,声源探测装置1选择观测相关矩阵Rx(ω)以及参照相关矩阵Rr(θ,ω)的对应的矩阵元素,输出相位差信号x(ω)以及相位差信号r(θ,ω)(S202)。接着,声源探测装置1根据相位差信号x(ω)、相位差信号r(θ,ω)以及权重系数a(θ,ω),算出误差信号e(ω)(S203)。接着,声源探测装置1算出对误差信号e(ω)附加了非线性性质的复信号f(e(ω))(S204)。接着,声源探测装置1根据通过步骤S204算出的复信号f(e(ω))和通过步骤S203算出的相位差信号r(θ,ω),算出权重系数a(θ,ω)的权重更新量Δa(θ,ω),更新权重系数a(θ,ω)(S205)。然后,声源探测装置1判断通过步骤S202选择出的观测相关矩阵Rx(ω)以及参照相关矩阵Rr(θ,ω)的矩阵元素是否轮完一次(S206)。在轮完一次的情况下(S206:是),判断进行权重系数a(θ,ω)的学习处理的次数是否达到了预定次数Nt(S207)。在达到了预定次数Nt的情况下(S207:是),声源探测装置1进入接下来的步骤S30。此外,在步骤S206或步骤S207中未轮完一次的情况(S206:否)或未达到预定次数Nt的情况下(S207:否),返回到步骤S202,反复进行处理。
接着,在步骤S30中,声源探测装置1根据通过步骤S20中的学习而更新的权重系数a(θ,ω),算出观测信号的空间谱p(θ)(S301)。
接着,声源探测装置1在步骤S40中,将时刻t更新为例如时刻t+Δt,在步骤S50中,判断是否结束声源探测处理。此外,在不结束声源探测处理的情况下(S50:否),返回到步骤S10,算出时刻t+Δt的观测信号的相关矩阵即观测相关矩阵Rx(ω)。
如此,声源探测装置1以使得对多个参照相关矩阵Rr(θ,ω)分别乘以权重系数a(θ,ω)后的线性和等于观测相关矩阵Rx(ω)的方式,反复进行对应的各矩阵元素的学习,直到学习到关于全部矩阵元素的权重系数a(θ,ω)。进一步,声源探测装置1也可以按预定次数Nt来反复进行学习。
例如,若是3行3列的参照相关矩阵Rr(θ,ω)以及观测相关矩阵Rx(ω)、且预定次数Nt为3次,则会针对上三角矩阵或下三角矩阵的3个元素进行3次学习处理,因此总共会进行9次学习处理。
如此,能够学习到使对多个参照相关矩阵Rr(θ,ω)分别乘以权重系数a(θ,ω)后的线性和与观测相关矩阵Rx(ω)更加相等的权重系数a(θ,ω)。
[工作的原理]
接着,对能够通过学习来算出使对多个参照相关矩阵Rr(θ,ω)分别乘以权重系数a(θ,ω)后的线性和等于观测相关矩阵Rx(ω)的权重系数a(θ,ω)的原理进行说明。另外,对能够使用所获得的权重系数a(θ,ω)来算出空间谱p(θ)的原理也进行说明。
对于基于来自麦克风阵列200的信号而观测的观测相关矩阵Rx(ω)、即作为相关矩阵算出部10的输出的观测相关矩阵Rx(ω),如下述的(式14)所示,可知:能够用与存在于方向θ上的空间的声源对应的相关矩阵Rs(θ,ω)和强度u(θ,ω)的线性和来近似。Rs(θ,ω)是因声波的到来方向产生的麦克风单元间的相位差信息,表示方向信息。强度u(θ,ω)表示声波的强度。并且,通过求出与各方向θ的声波对应的强度u(θ,ω),能够导出空间谱p(θ)。
在(式14)中,观测相关矩阵Rx(ω)是能够观测的相关矩阵,是已知数。另一方面,强度u(θ,ω)以及相关矩阵Rs(θ,ω)是未知数。在此,相关矩阵Rs(θ,ω)是按方向θ的相关矩阵,其矩阵元素是声波到来方向为方向θ时的麦克风单元间的相位差。着眼于该情况,相关矩阵Rs(θ,ω)使用作为已知信息的麦克风阵列的麦克风单元排列、方向θ以及音速c,能够替换为理论值。此外,上述的(式4)、(式5)以及(式6)是将相关矩阵Rs(θ,ω)替换成使用已知信息预先计算出的、作为理论值的参照相关矩阵Rr(θ,ω)而得到的。
另外,通过使在声源探测装置1中作为空间谱求出的未知数等于权重系数a(θ,ω)、即使权重系数a(θ,ω)等于(式14)的强度u(θ,ω),由此(式14)能够替换为(式15)。
因此,对于算出(式15),因为观测相关矩阵Rx(ω)是观测值、且参照相关矩阵Rr(θ,ω)是已知的理论值,所以成为求出权重系数a(θ,ω)的问题。此外,这样的问题也被称为半盲识别(Semi-blind Identification,日文“セミブラインド同定”)的问题。
在此,与通常的声响信号的识别不同之处在于:观测相关矩阵Rx(ω)和参照相关矩阵Rr(θ,ω)是矩阵、且权重系数a(θ,ω)是一次项的系数;与观测信号和参照信号相当的信号是表现相位差的转子、且总是振幅1的复数。
根据观测相关矩阵Rx(ω)和参照相关矩阵Rr(θ,ω)是矩阵、且权重系数a(θ,ω)是一次项的系数这一点,可知:对于权重系数a(θ,ω),会成为求出对观测相关矩阵Rx(ω)和参照相关矩阵Rr(θ,ω)的对应的各矩阵元素而言共同成立的值。也就是说,会成为求出满足用矩阵的元素改写了(式15)而得到的(式16)的权重系数a(θ,ω)。在(式16)中,xij(ω)是观测相关矩阵Rx(ω)的矩阵元素。rij(θ,ω)表示参照相关矩阵Rr(θ,ω)的矩阵元素。
在本实施方式中,将(式16)改写为(式17),使用使作为推定误差的误差信号e(ω)最小化的LMS或ICA(Independent Component Analysis)等学习方式,由此求出a(θ,ω)。此外,学习方式并不限定于这些方式。
更具体而言,在(式17)中,为了算出对xij(ω)以及rij(θ,ω)的矩阵元素共同成立的权重系数a(θ,ω),通过选择部30依次选择矩阵元素来进行权重系数的学习。并且,信号乘法运算部61-1、……、61-N对应于(式17)的右边第2项的乘法运算,信号加法运算部62对应于(式17)的右边的Σ,信号减法运算部71对应于(式17)的右边的减法运算。
另外,根据与观测信号和参照信号相当的信号是表现相位差的转子、且常是振幅1的复数这一点,能对误差信号e(ω)附加非线性性质而添加独立分量分析(ICA)的效果以抑制方向间相互影响。
在本实施方式中,在如图6所示那样分解成实部和虚部之后,适用上述的(式9)那样的非线性函数。如此,能够将作为声波到来方向的方向θ的差异作为独立的分量来学习,因此,能够获得不容易受到不同方向的影响的收敛动作。
基于以上那样的考虑,使用(式11)以及(式12)来进行权重系数的更新。并且,通过使用学习后的权重系数a(θ,ω)并使用(式13),能够算出作为声源探测装置1的输出的空间谱p(θ)。
[效果]
如上所述,根据本实施方式的声源探测装置1,能够基于由作为麦克风阵列200的多个元件的麦克风单元观测到的声响信号的观测相关矩阵Rx(ω)来求出空间谱p(θ)。更具体而言,预先准备能够根据麦克风阵列200的阵列排列而计算为理论值的按方向的参照相关矩阵Rr(θ,ω),以使得对表示各个方向的参照相关矩阵Rr(θ,ω)分别乘以权重系数a(θ,ω)后的线性和等于观测相关矩阵Rx(ω)的方式,通过学习来算出权重系数a(θ,ω)。并且,使用所获得的权重系数a(θ,ω)来算出空间谱p(θ)。由此,不进行根据运算量大的相关矩阵和方向矢量导出空间谱的计算,而能够逐次地推定与成为妨碍声的声源以及探测对象的声源的方向对应的强度来作为权重系数a(θ,ω),因此,能够基于按频率分析帧单位的毫秒~秒级这样的间隔在麦克风单元中观测到的声响信号的观测相关矩阵Rx(ω)来求出空间谱p(θ)。也就是说,根据本实施方式,可知能够实现在对声音变化的跟随性上优良的声源探测装置1。
另外,根据本实施方式的声源探测装置1,能够在使方向间的影响互相消除的同时算出按方向的强度。例如,将θ1~θm的角度范围设为应检测的探测范围的方向,将θm+1~θN的角度范围设为存在妨碍声的非探测范围的方向。并且,将(式15)变形成(式18)那样,以使得应检测的探测范围来到左边,存在妨碍声的非探测范围来到右边。
于是,可知:(式18)的左边相当于与作为声源探测结果获得的空间谱对应的相关矩阵。可知:(式18)的右边的第1项相当于被观测的全部方向的声波混合存在的观测相关矩阵,(式18)的右边的第2项相当于表示妨碍声分量的相关矩阵。另外,可知:通过(式18)的右边的减法运算,妨碍声分量的相关矩阵被从观测相关矩阵Rx(ω)中减掉,可获得消除效果。对于这种情况,可知:由于成为对各方向θ的各分量互相消除干涉的工作,因此抗噪声性能提高。另外,可知:由于针对与全部方向对应的权重系数a(θ,ω)同时进行求解,因此在对声音变化的跟随性上也优良。
因此,本实施方式的声源探测装置1通过根据探测范围的权重系数a(θ,ω)来算出空间谱p(θ),能够实现在抗噪声性能和对声音变化的跟随性上优良的声源探测。
如上所述,根据本实施方式的声源探测装置1,能够更切实地探测处于探测对象范围内的探测对象的声源的方向。进而,本实施方式的声源探测装置1通过使用权重系数a(θ,ω)算出空间谱p(θ),能够发挥抗噪声性以及对声音变化优良的跟随性。
在此,使用图9以及图10,对本实施方式的声源探测装置1的效果进行说明。
图9是比较例的空间谱图。在图9中,作为比较例示出了在存在探测对象的声源S和在声源S的附近成为声源S的妨碍声的声源N1以及声源N2的情况下,使用专利文献1的技术算出了空间谱时的图。
在图9所示的空间谱中,作为妨碍声的声源N1的强度,不仅呈现在存在声源N1的方向上,还呈现为其随着从声源N1的方向(角度)离开而衰减。作为妨碍声的声源N2的强度也呈现与声源N1同样的特性。因此,如图9所示,在声源N1和声源N2的声压级比探测对象的声源S的声压级高的情况下,会成为声源S的强度的峰值被作为妨碍声的2个声源N1和声源N2的强度的峰值埋没的状态。因此,在比较例中,无法检测探测对象的声源S的存在即声源S的强度的峰值,所以无法探测声源S的方向。
另一方面,图10是实施方式1的空间谱图。在图10中,也示出了在存在探测对象的声源S和在声源S的附近成为声源S的妨碍声的声源N1以及声源N2的情况下,本实施方式的声源探测装置1算出了空间谱时的图。声源探测装置1使用权重系数a(θ,ω)算出空间谱p(θ),因此能够对各方向θ的各分量互相消除干涉。因此,如图10所示,与声源N1和声源N2的声压级比探测对象的声源S的声压级高还是低无关地,会成为声源S的强度的峰值、作为妨碍声的2个声源N1和声源N2的强度的峰值独立出现的状态。也就是说,能够同时独立地探测作为妨碍声的声源N1、声源N2以及探测对象的声源S的强度的峰值。
因此,根据本实施方式的声源探测装置1,可知能够更切实地探测处于探测对象范围内的探测对象的声源的方向。
此外,对于相关矩阵算出部10算出的观测相关矩阵Rx(ω)以及存储部20所存储的各探测方向θ的参照相关矩阵Rr(θ,ω),也可以将在运算中使用的相关矩阵的上三角矩阵的元素或任意选择出的元素用矢量的形式来实现。该情况下,选择部30依次选择矢量的元素并输出即可。
另外,在本实施方式中,在各方向θ的参照相关矩阵Rr(θ,ω)和权重系数a(θ,ω),作为方向数N为180个进行了说明,但并不限于此。根据声源探测装置1的用途、麦克风阵列的规模或运算规模,方向数N既可以多也可以少,并没有特别限制。另外,要设定的角度间隔既可以均匀,也可以不均。
另外,在本实施方式中,在各频率ω的观测相关矩阵Rx(ω)、参照相关矩阵Rr(θ,ω)以及权重系数a(θ,ω),没有对频率ω的范围进行特别限制,但也可以根据探测对象的声源所包含的频率成分来对频率ω的范围设置限制。
(实施方式2)
在实施方式1中,对使用学习后的权重系数a(θ,ω)来算出空间谱p(θ)的情况进行了说明,但并不限于此。也可以使用学习后的权重系数a(θ,ω)来算出从所指定的方向到来的声响信号波形。以下,将该情况作为实施方式2来进行说明。
图11是表示实施方式2的声源探测系统1000A的构成的一例的图。声源探测系统1000A相当于利用了声源探测装置的麦克风装置。对与图1以及图4同样的要素标注相同的标号,省略详细的说明。
图11所示的声源探测系统1000A相当于实施方式1的声源探测系统1000,声响信号谱算出部100A、输出部110A以及IFFT 120的构成不同。
[声响信号谱算出部100A]
声响信号谱算出部100A将保持部50所保持的权重系数a(θ,ω)、与来自麦克风单元201的声响信号m1(n)对应的频谱信号Sm1(ω)、以及为了进行信号取得而指定的方向即方向θ0作为输入,算出输出的声响信号谱Y(ω)。
更具体而言,声响信号谱算出部100A使用(式19),算出声响信号谱Y(ω)。
Y(ω)=a(θ0,ω)Sm1(ω)…(式19)
此外,从声源探测的角度分辨率的观点出发,根据麦克风阵列200的尺寸或麦克风单元数,也可以将与进行指定的方向θ0相邻的角度的权重系数如(式20)所示那样进行加法运算来使用。
对于(式19)以及(式20)中的权重系数a(θ,ω),如上述工作原理中所述那样,表现与各方向θ的声波对应的强度,因此表现θ方向的谱相对于全部方向的谱的强度比率。因此,通过乘以全部方向的频谱Sm1(ω),能够算出与从指定的方向θ0到来的声波对应的声响信号谱Y(ω)。
[IFFT 120]
IFFT(Inverse Fast Fourier Transform,快速傅里叶逆变换)120算出对由声响信号谱算出部100A算出的声响信号谱Y(ω)进行了快速傅里叶逆变换而得到的声响信号波形y(n),并输出到输出部110A。
[效果]
如上所述,根据本实施方式的声源探测系统1000A,使用在抗噪声性优良的声源探测装置中通过学习算出的权重系数a(θ,ω),能够仅输出所指定的特定方向的声响信号波形y(n)。由此,能够实现仅提取特定方向的声音的麦克风装置的功能。
以上,基于实施方式以及变形例对本公开的一个或多个技术方案的声源探测装置等进行了说明,但本公开并不限定于这些实施方式等。在不脱离本公开主旨的范围内,在本实施方式中实施本领域技术人员能想到的各种变形而得到的方式、组合不同实施方式中的构成要素而构成的方式,也可以包含在本公开的一个或多个技术方案的范围内。例如,以下这样的情况也包含在本公开中。
(1)上述的声源探测装置等具体也可以是由微处理器、ROM、RAM、硬盘单元、显示器单元、键盘、鼠标等构成的计算机系统。在所述RAM或硬盘单元中存储有计算机程序。通过所述微处理器按照所述计算机程序进行工作,各构成要素实现其功能。在此,计算机程序是为了实现预定功能而组合多个表示针对计算机的指令的命令码而构成的。
(2)构成上述的声源探测装置等的构成要素的一部分或全部,也可以包括一个系统LSI(Large Scale Integration:大规模集成电路)。系统LSI是将多个构成部集成到一个芯片上而制造出的超多功能LSI,具体是包括微处理器、ROM、RAM等而构成的计算机系统。在所述RAM中存储有计算机程序。通过所述微处理器按照所述计算机程序进行工作,系统LSI实现其功能。
(3)构成上述的声源探测装置等的构成要素的一部分或全部也可以包括能够装卸于各装置的IC卡或单体模块。所述IC卡或所述模块是包括微处理器、ROM、RAM等的计算机系统。所述IC卡或所述模块也可以包括上述的超多功能LSI。通过微处理器按照计算机程序进行工作,所述IC卡或所述模块实现其功能。该IC卡或该模块可以具有防篡改性能。
产业上的可利用性
本公开能够利用于使用了多个麦克风单元的声源探测装置,特别是,能够利用于如下的声源探测装置,该声源探测装置能够更切实地探测位于距声源探测装置较远位置的遥控直升机或无人机等到达麦克风单元的声音比周围的声音小的声源的方向。

Claims (9)

1.一种声源探测装置,对探测对象的声源的方向进行探测,所述声源探测装置具备:
存储部;和
处理电路,其在运行中执行包括以下的工作:
算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列收集到的声响信号,
以使得对预先存储在所述存储部中的多个第2相关矩阵分别乘以权重后的线性和等于所述第1相关矩阵的方式,通过学习来算出所述权重,所述多个第2相关矩阵是根据所述麦克风阵列的阵列排列而算出的按方向的相关矩阵,
使用所算出的所述权重,算出所述观测信号的空间谱,所述空间谱表示按方向的声压强度。
2.根据权利要求1所述的声源探测装置,
所述工作还包括:
选择第1元素和第2元素,所述第1元素是构成所述第1相关矩阵的元素中的一个元素,所述第2元素是构成所述多个第2相关矩阵的各第2相关矩阵的元素中的、位于与所述第1元素对应的位置的元素,
逐次地切换要选择的所述第1元素以及所述第2元素,
在所述权重的算出中,通过所述逐次地反复进行如下处理来算出所述权重:
以使得对所述第2元素乘以第1权重后的第1元素线性和等于所述第1元素的方式,将所述第1权重更新为在所述权重的算出中算出的第2权重;
以使得对下一个选择出的所述第2元素乘以更新后的所述第2权重后的第2元素线性和等于下一个选择出的所述第1元素的方式,将所述第2权重更新为在所述权重的算出中算出的第3权重。
3.根据权利要求2所述的声源探测装置,
在所述选择中,仅从构成所述第1相关矩阵以及所述第2相关矩阵的除对角成分之外的元素中的、由所述对角成分划分开的两组的多个元素的一方的组的多个元素中,选择所述第1元素以及所述第2元素。
4.根据权利要求1~3中任一项所述的声源探测装置,
在所述权重的算出中,通过使用最小均方算法或独立成分分析,根据作为所述线性和与所述第1相关矩阵之差的误差和所述第2相关矩阵,算出所述权重。
5.根据权利要求1~3中任一项所述的声源探测装置,
在所述权重的算出中,
保持权重,
算出对所述多个第2相关矩阵分别乘以所保持的权重后的线性和,
算出作为所述线性和与所述第1相关矩阵之差的误差,
根据所述误差与所述第2相关矩阵之积来算出权重更新量,
通过对所述所保持的权重加上所述权重更新量来更新所述权重。
6.根据权利要求5所述的声源探测装置,
在所述权重的更新中,通过使用最小均方算法或独立成分分析,根据所述误差以及所述第2相关矩阵来算出所述权重更新量。
7.根据权利要求5或6所述的声源探测装置,
在所述权重的算出中,进一步,使用预定的非线性函数,对所述误差附加非线性性质,
在所述更新量的算出中,根据附加了非线性性质的所述误差以及所述第2相关矩阵来算出所述权重更新量。
8.一种声源探测方法,对探测对象的声源的方向进行探测,所述声源探测方法包括:
算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列收集到的声响信号,
以使得对预先存储在存储部中的多个第2相关矩阵分别乘以权重后的线性和等于所述第1相关矩阵的方式,通过学习来算出所述权重,所述多个第2相关矩阵是根据所述麦克风阵列的阵列排列而算出的按方向的相关矩阵,
使用所算出的所述权重,算出所述观测信号的空间谱,所述空间谱表示按方向的声压强度。
9.一种记录介质,是存储有用于使计算机执行对探测对象的声源的方向进行探测的声源探测方法的程序的计算机可读取的非瞬时性记录介质,
所述程序在由计算机执行时,使所述计算机执行包括以下的方法:
算出观测信号的相关矩阵即第1相关矩阵,所述观测信号是由包括互相分离地配置的两个以上的麦克风单元的麦克风阵列收集到的声响信号,
以使得对预先存储在存储部中的多个第2相关矩阵分别乘以权重后的线性和等于所述第1相关矩阵的方式,通过学习来算出所述权重,所述多个第2相关矩阵是根据所述麦克风阵列的阵列排列而算出的按方向的相关矩阵,
使用所算出的所述权重,算出所述观测信号的空间谱,所述空间谱表示按方向的声压强度。
CN201810158701.6A 2017-03-03 2018-02-26 声源探测装置及方法、记录有声源探测程序的记录介质 Active CN108540898B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762466498P 2017-03-03 2017-03-03
US62/466498 2017-03-03
JP2017-216735 2017-11-09
JP2017216735A JP6953287B2 (ja) 2017-03-03 2017-11-09 音源探査装置、音源探査方法およびそのプログラム

Publications (2)

Publication Number Publication Date
CN108540898A true CN108540898A (zh) 2018-09-14
CN108540898B CN108540898B (zh) 2020-11-24

Family

ID=61249550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810158701.6A Active CN108540898B (zh) 2017-03-03 2018-02-26 声源探测装置及方法、记录有声源探测程序的记录介质

Country Status (4)

Country Link
US (1) US10264350B2 (zh)
EP (1) EP3370232B1 (zh)
CN (1) CN108540898B (zh)
CA (1) CA2995697A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112447191A (zh) * 2019-08-30 2021-03-05 株式会社东芝 信号处理装置以及信号处理方法
CN113566953A (zh) * 2021-09-23 2021-10-29 中国空气动力研究与发展中心设备设计与测试技术研究所 一种柔壁喷管的在线监测方法
CN114502926A (zh) * 2020-06-09 2022-05-13 东芝三菱电机产业系统株式会社 金属材料加工设备的异响观测系统
CN114646384A (zh) * 2022-01-28 2022-06-21 中国空气动力研究与发展中心低速空气动力研究所 基于频谱相干分解方法的远场直升机被动声音检测方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11625042B2 (en) 2020-03-31 2023-04-11 Zoox, Inc. Detecting occluded objects using sound
US11914390B2 (en) * 2020-03-31 2024-02-27 Zoox, Inc. Distinguishing between direct sounds and reflected sounds in an environment
CN112630730B (zh) * 2020-11-13 2024-04-02 清华大学苏州汽车研究院(相城) 一种基于tdoa多声源定位的虚假声源消除方法
WO2022116008A1 (zh) * 2020-12-01 2022-06-09 华为技术有限公司 一种信源数量估计的方法、装置和存储介质
CN113138363A (zh) * 2021-04-22 2021-07-20 苏州臻迪智能科技有限公司 一种声源定位方法、装置、存储介质和电子设备
CN116148770B (zh) * 2023-04-21 2023-07-07 湖南工商大学 基于阵列信号处理的声源定位方法、装置及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103000185A (zh) * 2011-09-30 2013-03-27 斯凯普公司 处理信号
CN103308889A (zh) * 2013-05-13 2013-09-18 辽宁工业大学 复杂环境下被动声源二维doa估计方法
CN105609113A (zh) * 2015-12-15 2016-05-25 中国科学院自动化研究所 基于双谱加权空间相关矩阵的语音声源定位方法
CN106405501A (zh) * 2015-07-29 2017-02-15 中国科学院声学研究所 一种基于相位差回归的单声源定位方法
CN106454685A (zh) * 2016-11-25 2017-02-22 武汉大学 一种声场重建方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5952692B2 (ja) 2012-09-13 2016-07-13 本田技研工業株式会社 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103000185A (zh) * 2011-09-30 2013-03-27 斯凯普公司 处理信号
CN103308889A (zh) * 2013-05-13 2013-09-18 辽宁工业大学 复杂环境下被动声源二维doa估计方法
CN106405501A (zh) * 2015-07-29 2017-02-15 中国科学院声学研究所 一种基于相位差回归的单声源定位方法
CN105609113A (zh) * 2015-12-15 2016-05-25 中国科学院自动化研究所 基于双谱加权空间相关矩阵的语音声源定位方法
CN106454685A (zh) * 2016-11-25 2017-02-22 武汉大学 一种声场重建方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JOHANNES TRAA: "DIRECTIONAL NMF FOR JOINT SOURCE LOCALIZATION AND SEPARATION", 《IEEE WORKSHOP ON APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112447191A (zh) * 2019-08-30 2021-03-05 株式会社东芝 信号处理装置以及信号处理方法
CN112447191B (zh) * 2019-08-30 2024-03-12 株式会社东芝 信号处理装置以及信号处理方法
CN114502926A (zh) * 2020-06-09 2022-05-13 东芝三菱电机产业系统株式会社 金属材料加工设备的异响观测系统
CN113566953A (zh) * 2021-09-23 2021-10-29 中国空气动力研究与发展中心设备设计与测试技术研究所 一种柔壁喷管的在线监测方法
CN114646384A (zh) * 2022-01-28 2022-06-21 中国空气动力研究与发展中心低速空气动力研究所 基于频谱相干分解方法的远场直升机被动声音检测方法

Also Published As

Publication number Publication date
EP3370232B1 (en) 2020-04-15
EP3370232A1 (en) 2018-09-05
US10264350B2 (en) 2019-04-16
CA2995697A1 (en) 2018-09-03
CN108540898B (zh) 2020-11-24
US20180255395A1 (en) 2018-09-06

Similar Documents

Publication Publication Date Title
CN108540898A (zh) 声源探测装置及方法、记录有声源探测程序的记录介质
JP6953287B2 (ja) 音源探査装置、音源探査方法およびそのプログラム
Shaghaghi et al. Subspace leakage analysis and improved DOA estimation with small sample size
Pesavento et al. Maximum-likelihood direction-of-arrival estimation in the presence of unknown nonuniform noise
Chu et al. Deconvolution for three-dimensional acoustic source identification based on spherical harmonics beamforming
Wen et al. Direction finding for bistatic MIMO radar with unknown spatially colored noise
JPWO2004079388A1 (ja) 位置情報推定装置、その方法、及びプログラム
Porozantzidou et al. Azimuth and elevation angles estimation using 2-D MUSIC algorithm with an L-shape antenna
KR20140040727A (ko) 상관된 소스들의 블라인드 측위를 위한 시스템들 및 방법들
Yang et al. Functional delay and sum beamforming for three-dimensional acoustic source identification with solid spherical arrays
Padois et al. Time domain localization technique with sparsity constraint for imaging acoustic sources
JP2020148909A (ja) 信号処理装置、信号処理方法およびプログラム
KR101958337B1 (ko) 신호의 도래각을 추정하는 방법 및 장치
US9497561B1 (en) Wave field synthesis by synthesizing spatial transfer function over listening region
JP6106571B2 (ja) 音源位置推定装置、方法及びプログラム
EP2398111A1 (en) Calibration device
Wijnholds et al. Fundamental imaging limits of radio telescope arrays
Olsen et al. Condensation of the correlation functions in modal testing
US20230031343A1 (en) Method and system for estimating a quantity representative of sound energy
Fontaine et al. Scalable source localization with multichannel α-stable distributions
da Costa et al. Subspace based multi-dimensional model order selection in colored noise scenarios
JP6685943B2 (ja) 分離行列設計装置、フィルタ係数算出装置、その方法、及びプログラム
Huang et al. DOA estimation of quasi-stationary signals with a nested array in unknown noise field
Diversi et al. Estimating the number of signals in the presence of nonuniform noise
KR20140106823A (ko) 방향 정보를 이용한 암묵 신호 추출 방법 및 이를 위한 디믹싱 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant