CN107121669A - 声源探测装置、声源探测方法及非瞬时性记录介质 - Google Patents

声源探测装置、声源探测方法及非瞬时性记录介质 Download PDF

Info

Publication number
CN107121669A
CN107121669A CN201710050526.4A CN201710050526A CN107121669A CN 107121669 A CN107121669 A CN 107121669A CN 201710050526 A CN201710050526 A CN 201710050526A CN 107121669 A CN107121669 A CN 107121669A
Authority
CN
China
Prior art keywords
correlation matrix
sound source
investigative range
spatial spectrum
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710050526.4A
Other languages
English (en)
Other versions
CN107121669B (zh
Inventor
金森丈郎
林田亘平
吉国信太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2016219987A external-priority patent/JP6871718B6/ja
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN107121669A publication Critical patent/CN107121669A/zh
Application granted granted Critical
Publication of CN107121669B publication Critical patent/CN107121669B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Abstract

提供一种声源探测装置、声源探测方法及非瞬时性记录介质。算出收集到的观测信号的第1相关矩阵,指定非探测范围,推定与所述非探测范围所包含的声源的声响信号对应的第2相关矩阵,通过从所述第1相关矩阵除去所述第2相关矩阵的成分,来算出与探测范围所包含的探测对象声源对应的第3相关矩阵,根据所述第3相关矩阵,运算作为探测结果的第1空间谱。在所述推定中,根据由所述非探测范围的方向范围算出的方向矢量和第2空间谱来推定第2相关矩阵,所述第2空间谱是运算第1空间谱的前一个运算出的探测结果。

Description

声源探测装置、声源探测方法及非瞬时性记录介质
技术领域
本公开涉及声源探测装置、声源探测方法、非瞬时性记录介质以及程序。
背景技术
例如专利文献1中,提出了能够根据由多个麦克风单元得到的多个声响信号来精度良好地推定声源的方向的声源方向推定装置的方案。在该专利文献1中,使用基于多个声响信号的噪声音信号的相关矩阵来进行噪声应对,由此,根据多个声响信号来精度良好地推定声源的方向。
先行技术文献
专利文献1:日本特开2014-56181号公报
发明内容
发明要解决的问题
但是,在专利文献1中,基于作为观测信号的由多个麦克风单元得到的多个声响信号来算出噪声音信号的相关矩阵。因此,在噪声源和探测对象的声源同时地存在的情况、噪声与探测对象的声源相比为高水平的情况下,难以准确地求出仅是噪声成分的相关矩阵。也即是,在基于由多个麦克风单元得到的多个声响信号的信号位相差进行声源探测的方式中,在存在比探测对象的声源高的声压级的噪声的情况下,存在会在该噪声的影响下无法对探测对象的声源进行检测即探测这一问题。
本公开鉴于上述的情况而提出,目的在于提供能够更可靠地探测处于探测对象范围的探测对象的声源方向的声源探测装置。
用于解决问题的技术方案
为了达成上述目的,本公开的一个技术方案的声源探测装置具备电路以及一个以上的存储器,所述电路在运行中执行包括以下的工作:算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,通过从所述第1相关矩阵除去所述第2相关矩阵的成分来算出第3相关矩阵,所述第3相关矩阵是与表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源对应的相关矩阵,根据所述第3相关矩阵运算第1空间谱来作为探测结果,在所述推定中,根据由所述非探测范围的方向范围求出的方向矢量和第2空间谱推定所述第2相关矩阵,所述第2空间谱是运算所述第1空间谱的前一个的探测结果。
此外,这些中的一部分的具体方式,既可以使用系统、方法、集成电路、计算机程序或可由计算机读取的CD-ROM等记录介质来实现,也可以使用系统、方法、集成电路、计算机程序以及记录介质的任意的组合来实现。
发明的效果
根据本公开,能够实现能更可靠地探测处于探测对象范围的探测对象的声源方向的声源探测装置等。
附图说明
图1是示出实施方式1的声源探测装置的结构的一例的图。
图2是实施方式1的探测范围以及非探测范围的说明图。
图3是示出实施方式1的谱运算部的输出例的空间谱图。
图4是实施方式1的推定部的详细结构的一例的图。
图5是示出由实施方式1的谱运算部运算并输出的第2空间谱的一例的图。
图6是示出比较例的声源探测装置的结构的一例的图。
图7是示出比较例的探测对象声源和麦克风阵列的位置关系的一例的图。
图8是示出图7所示的位置关系下的比较例的谱运算部的输出例的空间谱图。
图9是示出比较例的麦克风阵列和探测对象声源以及干扰声源的位置关系的图。
图10是示出图9所示的位置关系下的比较例的谱运算部的输出例的空间谱图。
图11是示出图9所示的位置关系下的比较例的谱运算部的其他输出例的空间谱图。
图12是示出变形例1的声源探测装置的结构的一例的图。
图13是变形例2的探测范围以及非探测范围的说明图。
图14是示出变形例3的声源探测装置的结构的一例的图。
图15是示出实施方式2的声源探测装置的结构的一例的图。
具体实施方式
本公开的一个技术方案的声源探测装置具备电路以及一个以上的存储器,所述电路在运行中执行包括以下的工作:算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,通过从所述第1相关矩阵除去所述第2相关矩阵的成分来算出第3相关矩阵,所述第3相关矩阵是与表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源对应的相关矩阵,根据所述第3相关矩阵运算第1空间谱来作为探测结果,在所述推定中,根据由所述非探测范围的方向范围求出的方向矢量和第2空间谱推定所述第2相关矩阵,所述第2空间谱是运算所述第1空间谱的前一个的探测结果。
在此,例如也可以是,所述推定包括:从由所述非探测范围表示的方向范围和所述第2空间谱提取角度信息,所述角度信息表示所述非探测范围内的所述第2空间谱的最小强度方向以及最大强度方向,根据所述角度信息和所述方向矢量,算出与所述最小强度方向以及所述最大强度方向的所述第2空间谱对应的相关矩阵,作为相关矩阵更新量,通过使用所述相关矩阵更新量来更新第4相关矩阵,从而推定所述第2相关矩阵,所述第4相关矩阵是在推定所述第2相关矩阵前推定出的与所述非探测范围所包含的声源的声响信号对应的相关矩阵。
另外,例如也可以是,在所述更新中,通过将所述相关矩阵更新量的成分与所述第4相关矩阵相加,来推定所述第2相关矩阵。
另外,例如也可以是,在所述第1空间谱的运算中,根据所述第3相关矩阵和所述方向矢量,运算所述第1空间谱。
另外,例如也可以是,所述工作还包括:根据所述第2空间谱,检测干扰声源所存在的方向来作为所述非探测范围的候选,所述干扰声源是干扰所述探测对象声源的方向的探测的声源。
另外,例如也可以是,在所述指定中,使用者追加或删除非探测范围。
另外,例如也可以是,所述工作还包括:输出频谱信号,所述频谱信号是将在所述2个以上的麦克风单元分别收集到的声响信号变换为频域的信号而得到的,在所述第1相关矩阵的算出中,根据所述频谱信号,算出所述第1相关矩阵。
另外,本公开的一个技术方案的声源探测装置具备电路以及一个以上的存储器,所述电路在运行中执行包括以下的工作:算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,使用与所述非探测范围所包含的声源的声响信号对应的空间谱强度比阈值高、并且表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源的声响信号不存在时的所述第1相关矩阵,推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,通过从所述第1相关矩阵除去所述第2相关矩阵的成分来算出第3相关矩阵,所述第3相关矩阵是与所述探测范围所包含的所述探测对象声源对应的相关矩阵,根据所述第3相关矩阵运算第1空间谱来作为探测结果。
另外,本公开的一个技术方案的声源探测方法包括:算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,通过从所述第1相关矩阵除去所述第2相关矩阵的成分来算出第3相关矩阵,所述第3相关矩阵是与表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源对应的相关矩阵,根据所述第3相关矩阵运算第1空间谱来作为探测结果,在所述推定中,根据由所述非探测范围的方向范围求出的方向矢量和第2空间谱推定所述第2相关矩阵,所述第2空间谱是运算所述第1空间谱的前一个的探测结果。
另外,本公开的一个技术方案的记录有程序的计算机可读的非瞬时性记录介质,所述程序在由计算机执行时使计算机执行包含以下的方法:算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,通过从所述第1相关矩阵除去所述第2相关矩阵的成分来来算出第3相关矩阵,所述第3相关矩阵是与表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源对应的相关矩阵,根据所述第3相关矩阵运算第1空间谱来作为探测结果,在所述推定中,根据由所述非探测范围的方向范围求出的方向矢量和第2空间谱推定所述第2相关矩阵,所述第2空间谱是运算所述第1空间谱的前一个的探测结果。
此外,这些中的一部分的具体的方式,既可以使用系统、方法、集成电路、计算机程序或可由计算机读取的CD-ROM等记录介质实现,也可以使用系统、方法、集成电路、计算机程序或记录介质的任意组合来实现。
以下,参照附图对本公开的一个技术方案的声源探测装置进行具体的说明。此外,以下要说明的实施方式,都是示出本公开的一个具体例。在以下的实施方式中示出的数值、形状、材料、构成要素、构成要素的配置位置等仅是一个例子,并非旨在限定本公开。另外,对于以下的实施方式中的构成要素中的未记载于表示最上位概念的独立权利要求中的构造要素,作为任意的构成要素来说明。另外,也可以将所有的实施方式中的各自的内容进行组合。
(实施方式1)
[声源探测装置100的结构]
图1是示出本实施方式的声源探测装置100的结构的一例的图。
声源探测装置100对探测对象的声源(以下,也记载为“探测对象声源”)的方向进行探测。在本实施方式中,如图1所示,声源探测装置100具备:麦克风阵列10、频率分析部20、算出部30、指定部40、推定部50、除去部60、存储部70、存储部75、谱运算部80以及输出部90。以下,对各构成要素进行说明。
[麦克风阵列10]
麦克风阵列10由相互分离地配置的2个以上的麦克风单元构成,收集即观测从所有的方向到来的声波,并输出将其转换为电信号的声响信号。在本实施方式中,假设麦克风阵列10由作为最小个数的2个麦克风单元构成而进行以下说明。麦克风单元101以及麦克风单元102例如是针对声压的灵敏度高的无指向性的麦克风元件,配置于分离即不同的位置。在此,麦克风单元101输出声响信号m1(n),麦克风单元102输出声响信号m2(n),该声响信号m1(n)、声响信号m2(n)是将收集到的声波变换为电信号的时域信号。
此外,麦克风单元101以及102例如既可以是声音传感器,也可以是使用半导体制造技术制造的电容型麦克风芯片。麦克风芯片具有根据声压而位移的振动板,具有将声音信号变换为电信号的功能。
[频率分析部20]
频率分析部20输出将在2个以上的麦克风单元的各个中收集到的声响信号变换为频域的信号而得到的频谱信号。更具体而言,频率分析部20对从麦克风阵列10输入的声响信号进行频率分析,输出作为频域信号的频谱信号。此外,频率分析中使用快速傅里叶变换(Fast Fourier Transform:FFT)或离散傅里叶变换变换(Discrete Fourier Transform:DFT)等将时间信号变换为按各个频率成分的振幅信息和位相信息的方法即可。
在本实施方式中,频率分析部20由进行快速傅里叶变换的FFT201以及FFT202构成。FFT201将从麦克风单元101输出的声响信号m1(n)作为输入,使用快速傅里叶变换进行从时域向频域的变换而输出频谱信号Sm1(ω)。FFT202将从麦克风单元102输出的声响信号m2(n)作为输入,使用快速傅里叶变换进行从时域向频域的变换而输出频谱信号Sm2(ω)。
[算出部30]
算出部30算出作为观测信号的相关矩阵的第1相关矩阵,该观测信号是由麦克风阵列10收集到的声响信号。例如,算出部30算出由麦克风阵列10收集到的2个以上的声响信号间的相关矩阵的时间平均来作为第1相关矩阵。
在本实施方式中,算出部30根据频率分析部20所输出的频谱,算出第1相关矩阵(Rx(ω))。更具体而言,算出部30使用下述的(式1)以及(式2),将来自FFT201的频谱信号Sm1(ω)以及来自FFT202的频谱信号Sm2(ω)作为输入,算出相关矩阵Rx(ω)来作为第1相关矩阵。
在此,相关矩阵Rx(ω)的各要素储存了针对进到各麦克风单元的存在于实际环境的多个声波的位相差信息。例如,X11表示针对进到麦克风单元101以及麦克风单元101的声波的位相差信息,X21表示针对进到麦克风单元102以及麦克风单元101的声波的位相差信息。另外,ε{·}表示是时间上的平均。
此外,在各麦克风单元(在本实施方式中为麦克风单元101以及麦克风单元102)的声压灵敏度特性大致相等且均匀的情况下,如(式3)所示,相关矩阵Rx(ω)的各要素也可以省略(式2)中的分母的标准化项。
xij(ω)=Smi(ω)Smj(ω)*…(式3)
[指定部40]
指定部40指定非探测范围,所述非探测范围表示使声源探测装置100不探测探测对象声源的方向范围θd。在此,θd表示角度的范围。
在本实施方式中,指定部40例如将图2所示的角度范围θ1、θ2指定为非探测范围,将存在干扰探测对象声源的探测的干扰声音的声源(以下,称为“干扰声源”)的方向范围作为非探测范围来从探测范围中排除。
在此,图2是实施方式1的探测范围以及非探测范围的说明图。图2中,作为一个例子,示出探测对象声源S、作为比探测对象声源S高的声压级的噪声声源的干扰声源N1以及干扰声源N2。另外,图2中示出麦克风阵列10(即麦克风单元101、102)、探测对象声源S、作为比探测对象声源S高的声压级的噪声声源的干扰声源N1及干扰声源N2、以及探测范围以及非探测范围的位置关系。
如图2所示,麦克风单元101和麦克风单元102排列在不同的位置。图2中,若设连结2个麦克风单元(即麦克风单元101、102)的线为θ=0°,则探测对象声源S相对于麦克风单元101,存在于θ=θs的方向。另外,干扰声源N1相对于麦克风阵列10,存在于θ=0°~θ1的方向范围,干扰声源N2相对于麦克风阵列10,存在于θ=(180-θ2)~180°的方向范围。
[除去部60]
除去部60从由算出部30算出的第1相关矩阵(Rx(ω)),除去由推定部50推定出的第2相关矩阵(Rn(ω))的成分。由此,除去部60算出第3相关矩阵(Rs(ω)),该第3相关矩阵(Rs(ω))是与表示使声源探测装置100探测的方向范围的探测范围所含的探测对象声源对应的相关矩阵。也即是,除去部60从作为观测信号的第1相关矩阵的Rx(ω)除去作为与非探测范围对应的第2相关矩阵的Rn(ω)的成分而算出作为针对探测范围声源的第3相关矩阵即Rs(ω)。
在本实施方式中,除去部60被输入针对由算出部30算出的观测信号的第1相关矩阵Rx(ω)和针对由推定部50推定出的非探测范围的声源即干扰声源的第2相关矩阵Rn(ω)。除去部60根据上述矩阵,使用下述的(式4),算出作为针对探测范围的探测对象声源的第3相关矩阵Rs(ω)。
Rs(ω)=Rx(ω)-y·Rn(ω)…(式4)
此外,在(式4)中,γ表示减法运算权重,在本实施方式中,由于第2相关矩阵Rn(ω)中没有误差,因此设为1。但是,在第2相关矩阵Rn(ω)中存在误差的情况下,可以设为0.8等,适当调整即可。
[存储部70]
存储部70由存储器等构成,存储表示探测范围的方向的方向矢量d(θ,ω)。
在本实施方式中,存储部70中预先存储有例如600个0≤θ≤180的范围的方向矢量。该方向矢量d(θ,ω)是根据图2所示的关系而使用(式5)在理论上算出的、针对2个麦克风单元间(即麦克风单元101以及麦克风单元102间)的声源方向θ的位相差关系即位相差信息。在(式5)中,L是麦克风单元间的距离,c是音速。此外,(式5)定义了关于2个元件的麦克风单元的方向矢量,但在3个元件以上的情况,也能够根据依照麦克风单元的排列的位置关系来定义方向矢量。
[谱运算部80]
谱运算部80根据由除去部60算出的第3相关矩阵(Rs(ω)),运算第1空间谱(P(θ)),作为声源探测装置100的声源探测的结果即探测结果。
在本实施方式中,谱运算部80根据由除去部60算出的第3相关矩阵(Rs(ω))、由通过探测范围表示的方向范围求出的方向矢量(d(θ,ω)),运算第1空间谱(P(θ))。也即是,谱运算部80根据所存储的方向矢量(d(θ,ω))和由除去部60算出的第3相关矩阵(Rs(ω)),运算表示按方向的强度的第1空间谱(P(θ))。
具体而言,谱运算部80将针对从除去部60输出的探测范围的第3相关矩阵Rs(ω)和存储于存储部70的方向矢量d(θ,ω)作为输入,使用下述的(式6),运算即算出第1空间谱P(θ)。
此外,由于方向矢量d(θ,ω)为如上所述,因此,省略在此的说明。
[输出部90]
图3是示出实施方式1的谱运算部80的输出例的空间谱图。图3中,横轴表示角度,纵轴表示强度。
输出部90例如是输出端子,将由谱运算部80运算出的空间谱作为探测结果而向显示器等外部设备输出。
在本实施方式中,输出部90向与声源探测装置100连接的外部的显示器等显示装置输出例如如图3的实线所示那样表示最高的强度的角度θs表示探测对象声源S的方向的空间谱(P(θ))。
输出部90能够输出如图3所示的探测结果,这是因为在除去部60中能够导出仅针对探测范围的探测对象声源的第3相关矩阵。更具体而言,通过指定部40如在图2中说明的那样指定非探测范围,将探测对象声源S的方向的探测限定为探测范围θ1~θ2。并且,是因为能够通过在除去部60中从包含针对全方向的声源的成分的观测信号的第1相关矩阵减去针对非探测范围的干扰声源N1、N2的第2相关矩阵的成分而除去干扰音成分,导出针对探测范围的探测对象声源的第3相关矩阵。
[存储部75]
存储部75由存储器等构成,存储表示非探测范围的方向的方向矢量d(θ,ω)。
在本实施方式中,存储部75中预先存储有例如300个0°≤θ≤θ1、θ2≤θ≤180°的范围中的方向矢量。与上述同样,该方向矢量d(θ,ω)是根据图2所示的关系使用(式5)在理论上算出的、针对2个麦克风单元间(即麦克风单元101以及麦克风单元102间)的方向θ的位相差关系即位相差信息。
此外,在图1中,存储部70和存储部75表示为不同的结构,但是,也可以由一个存储部构成。在该情况下,推定部50以及谱运算部80适当地取得必要的方向矢量来进行推定以及运算即可。
[推定部50]
图4是示出实施方式1的推定部50的详细结构的一例的图。
推定部50逐次推定针对仅存在于非探测范围的声源(即干扰声源)的第2相关矩阵Rn(ω)。更具体而言,推定部50推定作为与由指定部40指定的非探测范围所含的声源(即干扰声源)的声响信号对应的相关矩阵的第2相关矩阵(Rn(ω))。推定部50基于根据由指定部40指定的非探测范围的方向范围求出的方向矢量、和谱运算部80运算第1空间谱(P(θ))的前一个运算出的作为探测结果的第2空间谱(P(θ)),推定第2相关矩阵(Rn(ω))。
在本实施方式中,如图4所示,推定部50具备提取部501、更新量运算部502、更新部503,逐次地推定针对干扰声源的第2相关矩阵Rn(ω)。
<提取部501>
提取部501从由指定部40指定的非探测范围所示的方向范围和由谱运算部80运算出的第2空间谱(P(θ)),提取表示非探测范围内的第2空间谱(P(θ))的最小强度方向以及最大强度方向的角度信息。
换言之,提取部501被输入由指定部40指定的例如0°≤θd≤θ1或θ2≤θd≤180°等表示非探测范围的方向的角度范围θd、和作为由谱运算部80运算出的探测结果的第2空间谱P(θ)。并且,提取部501使用这些信息,提取非探测范围内的第2空间谱P(θ)的最大强度方向即声源方向θmax和最小强度方向即声源方向θmin。
在此,对于非探测范围的第2空间谱的最大强度的声源方向θmax和最小强度的声源方向θmin的一例,使用图5来进行说明。图5是示出实施方式1的由谱运算部80运算并输出的第2空间谱的一例的图。
在图5示出的第2空间谱的例子中,在θ2~180°的非探测范围中,出现了强度的峰(图中N4表示的峰)和谷(图中N3表示的峰)。这是因为第1相关矩阵(Rx(ω))是使用当前的观测信号而由算出部30算出的矩阵,而第2相关矩阵Rn(ω)的成分是使用作为过去的空间谱的第2空间谱而由推定部50推定出的。也即是,在当前的观测信号和运算出第2空间谱时的观测信号即在前一个运算出的观测信号所含的干扰声源不一致的情况下,意味着在探测对象声源S以外,出现干扰音的影响。图5所示的第2空间谱中,在强度的峰(图中N4所示的峰)所存在的方向上,在当前新显现干扰声源,在第2相关矩阵Rn(ω)的成分下未能除去。另一方面,在强度的谷(图中N3所示的峰)所存在的方向上,过去存在的干扰声源在当前不存在,可知在第2相关矩阵Rn(ω)的成分下过度地进行了除去即过度地进行了消除。
换言之,非探测范围的最大强度的声源方向θmax是作为干扰音表示最高的声压级的干扰声源的方向,表示应提高消除量(即第2相关矩阵Rn(ω)的成分)的方向。另一方面,非探测范围的最小强度的声源方向θmin表示作为干扰音而消除量过量、应降低消除量(即第2相关矩阵Rn(ω)的成分)的方向。
这样,提取部501提取并输出由指定部40指定的表示非探测范围的角度范围θd内的第2空间谱P(θ)所表示的最大强度的声源方向θmax和表示非探测范围的角度范围θd内的第2空间谱P(θ)所表示的最小强度的声源方向θmin。
<更新量运算部502>
更新量运算部502根据由提取部501提取出的角度信息θd、由通过非探测范围表示的方向范围求出的方向矢量(d(θ,ω)),算出与最小强度方向以及最大强度方向的第2空间谱对应的相关矩阵,作为相关矩阵更新量(△Rn(ω))。
换言之,更新量运算部502取得来自提取部501的非探测范围的第2空间谱的最大强度的声源方向θmax、最小强度的声源方向θmin和表示非探测范围的方向的方向矢量d(θ,ω),或者被输入方向矢量d(θ,ω)。并且,更新量运算部502根据这些信息,算出针对该第2空间谱的最大强度的声源方向θmax和最小强度的声源方向θmin的相关矩阵的理论值,作为相关矩阵更新量ΔRn(ω)向更新部503输出。更具体而言,更新量运算部502使用下述的(式7),算出相关矩阵更新量ΔRn(ω)。即,更新量运算部502取得由提取部501提取到的非探测范围的最大强度的声源方向θmax、最小强度的声源方向θmin以及方向矢量d(θ,ω)。并且,更新量运算部502使用这些来算出相关矩阵更新量ΔRn(ω),以使得提高θmax方向的强度(即提高消除量),降低θmin方向的强度(即降低消除量)。
ΔRn(ω)=α·dH(θmax,ω)d(θmax,ω)-β·dH(θmin,ω)d(θmin,ω)…(式7)
此外,在(式7)中,α、β是调整针对θmax方向、θmin方向的各方向的更新量的参数,dH是d的复共轭转置。
<更新部503>
更新部503使用由更新量运算部502算出的相关矩阵更新量(△Rn(ω)),更新与推定部50推定第2相关矩阵(Rn(ω))的之前所推定出的非探测范围所含的声源的声响信号对应的相关矩阵,由此,推定第2相关矩阵(Rn(ω))。更新部503将由更新量运算部502算出的相关矩阵更新量(△Rn(ω))的成分加于与推定部50推定第2相关矩阵(Rn(ω))的之前所推定出的非探测范围所含的声源(即干扰声源)的声响信号对应的相关矩阵,由此推定第2相关矩阵(Rn(ω))。
换言之,更新部503将由更新量运算部502运算出的相关矩阵更新量ΔRn(ω)作为输入,更新并输出第2相关矩阵Rn(ω)。具体而言,如下述的(式8)所示,更新部503使用由更新量运算部502运算出的相关矩阵更新量ΔRn(ω)来更新第2相关矩阵Rn(ω)。
Rn(ω)=Rn(ω)+ΔRn(ω)…(式8)
这样,在推定部50中,基于非探测范围的最大强度的声源方向θmax和最小强度的声源方向θmin来求取第2相关矩阵Rn(ω)的理由如下。即,在由输出部90输出的空间谱(也称为热图(heat map))上显现的干扰音的影响,是因为在非探测范围的强度峰值的方向上存在其根源即干扰声源。
因此,在推定部50中,通过从非探测范围的空间谱P(θ)提取最大强度的声源方向θmax和最小强度的声源方向θmin,能够通过使用了上述的(式7)以及(式8)的逐次推定,来推定第2相关矩阵Rn(ω)。
在此,峰值方向的方向矢量d(θ,ω)用振幅1表示麦克风单元间的位相差,因此,根据与上述的(式2)的关系,能够用dH(θ,ω)d(θ,ω)计算与方向矢量d(θ,ω)对应的相关矩阵。
这样,推定部50基于与非探测范围的空间谱的最大强度和最小强度对应的方向矢量即位相信息的理论值来推定第2相关矩阵Rn(ω),因此,即便在探测范围存在探测对象声源时也能够始终推定第2相关矩阵Rn(ω)。
[效果等]
如以上所述,根据本实施方式,即便在非探测范围存在比探测对象声源高的声压级的干扰声源的情况下,也能够抑制干扰声源的影响,能够对探测范围的探测对象声源的方向进行探测。也即是,根据本实施方式,能够实现能够更可靠地探测处于探测对象范围的探测对象的声源的方向的声源探测装置100。
在此,使用图6~图11,对本实施方式的声源探测装置100的效果进行说明。
<比较例>
图6是示出比较例的声源探测装置900的结构的一例的图。此外,对于与图1同样的要素标注同一标号,省略详细的说明。如图6所示,与实施方式1的声源探测装置100相比较,比较例的声源探测装置900中,没有指定部40、推定部50以及除去部60的结构,谱运算部980的结构不同。在谱运算部980中,通过对由算出部30算出的、由麦克风阵列10收集到的2个以上的声响信号间(即观测信号)的相关矩阵(即第1相关矩阵)和方向矢量进行运算,来运算空间谱(P9(θ))。输出部990将该空间谱(P9(θ))向外部的装置输出。
图7是示出比较例的探测对象声源S和麦克风阵列10的位置关系的一例的图。此外,对于与图2同样的要素标注同一标号,省略详细的说明。图8是示出图7所示的位置关系下的比较例的谱运算部980的输出例的空间谱图。图8中,横轴表示角度,纵轴表示强度。
在图7所示的例子中,探测对象声源S相对于麦克风单元101,存在于θ=θs的方向,不存在干扰声源。该情况下,作为比较例的谱运算部980所运算的探测结果的空间谱(P9(θ))成为图8所示那样。即,在作为探测结果的图8所示的空间谱(P9(θ))中,表示最高的强度的角度成为θs。因此,在图7所示的例子中,比较例的声源探测装置900能够推定探测对象声源的方向为θ=θs。
但是,在比较例的声源探测装置900中,在存在作为比探测对象声源S高的声压级的噪声的干扰音的情况下,由于该干扰音的影响,会无法对探测对象的声源进行检测即探测。以下,对于该情况进行说明。
图9是示出比较例的麦克风阵列10和探测对象声源S以及干扰声源N1、N2的位置关系的图。图10是示出图9所示的位置关系下的比较例的谱运算部980的输出例的空间谱图。图11是示出图9所示的位置关系下的比较例的谱运算部980的其他输出例的空间谱图。此外,对于与图2、图3、图7以及图8同样的要素标注同一标号,省略详细的说明。
在图9所示的例子中,除了探测对象声源S之外,还存在干扰声源N1以及干扰声源N2。在该情况下,作为比较例的谱运算部980所运算的探测结果的空间谱(P9(θ))成为图10所示那样。即,在作为探测结果的图10所示的空间谱(P9(θ))中,干扰声源N1的强度表现为不是仅在干扰声源N1存在的方向,而是随着(角度)远离干扰声源N1的方向而衰减。干扰声源N2的强度也表现为与干扰声源N1同样的呈现方式。因此,如图10所示,在干扰声源N1和干扰声源N2的声压级比探测对象声源S的声压级高的情况下,探测对象声源S成为埋没于两个干扰声源(干扰声源N1和干扰声源N2)的强度的峰的状态。因此,具有如下问题:即便使用比较例的声源探测装置900也无法检测探测对象声源S的存在(强度的峰),因而无法对探测对象声源S的方向进行探测。
另外,在比较例的声源探测装置900中,如图11所示,即使将干扰声源N1、N2所存在的方向范围作为非探测范围而从探测范围排除,也无法解决该问题。也即是,如果仅将干扰声源N1、N2所存在的方向范围从探测范围排除,则如图11所示的实线曲线那样,受到干扰声源N1以及干扰声源N2的影响,探测对象声源S的强度的峰仍然是不明确的。因此,比较例的声源探测装置900存在无法检测探测对象声源S的存在(即强度的峰值)、无法探测探测对象声源S的方向这一问题。
<实施方式1的效果>
在本实施方式的声源探测装置100中,如图2中说明的那样,通过指定非探测范围,将探测对象声源S的方向的探测限定为最终的探测结果所需要的范围(图中,探测范围θ1~θ2)。并且,本实施方式的声源探测装置100还从观测信号的相关矩阵(即第1相关矩阵)减去针对非探测范围的声源(即干扰声源)的相关矩阵(即第2相关矩阵)的成分来除去干扰音分量。这是因为:如上所述,从麦克风阵列10来看,根据由麦克风阵列10收集的观测信号得到的相关矩阵(即第1相关矩阵)成为包含针对全方向的声源的成分的相关矩阵。
这样,本实施方式的声源探测装置100从根据从所有的方向到来的声波的观测信号计算的第1相关矩阵,除去非探测范围的第2相关矩阵的成分,由此,能够导出针对仅是探测范围的声源即探测对象声源的第3相关矩阵。结果,声源探测装置100能够输出图3中示出的空间谱(P(θ))来作为探测结果,由于图3中表示最高强度的角度成为θs,因此,能够推定为探测对象声源S的方向为θ=θs。
此外,为了除去存在于非探测范围的干扰音的影响,重要的是推定仅是针对存在于非探测范围的干扰声源的相关矩阵(即第2相关矩阵)。这是由于,若在推定出的非探测范围的第2相关矩阵漏入探测对象声源S的成分,则会变为得不到正确的推定结果。在实际环境中,存在于非探测范围的声源即干扰声源会与存在于探测范围的探测范围声源S同时地混合存在。因此,在比较例的声源探测装置900中,难以推定仅针对非探测范围的声源即干扰声源的相关矩阵(即第2相关矩阵)。
另一方面,在本实施方式的声源探测装置100中,着眼于在探测范围和非探测范围中存在的声源的差异在于方向,来可靠地求取针对仅存在于非探测范围的声源即干扰声源的第2相关矩阵。换言之,声源探测装置100根据非探测范围的方向矢量(即位相信息的理论值)和探测结果(即强度的观测值),算出第2相关矩阵。如上述那样,声源探测装置100根据理论值算出位相信息,因此,即便振幅信息(即强度)存在误差,也能够推定至少在方向的探测中不对探测范围造成不良影响的、存在于非探测范围的声源的第2相关矩阵。
如以上那样,本实施方式的声源探测装置100,即便在非探测范围中存在比探测对象声源高的声压级的干扰声源的情况下,也能够抑制干扰声源的影响,能够对探测范围的探测对象声源的方向进行探测。由此,能够改善噪声环境下的声源探测性能即抗噪声性能。这是因为:通过根据非探测范围的方向矢量即理论值以及非探测范围的探测结果即空间谱推定与非探测范围对应的相关矩阵(即第2相关矩阵),从而能够高精度地推定第2相关矩阵,探测范围的声源方向推定中的抗噪声性能得以提高。
此外,若是不存在上述那样的干扰声源的通常环境,则本实施方式的声源探测装置100能够对探测范围的低声压级的声源进行探测。
(变形例1)
图12是示出变形例1的声源探测装置100A的结构的一例的图。此外,对于与图1同样的要素标注同一标号,省略详细的说明。
图12所示的声源探测装置100A相对于实施方式1的声源探测装置100,在具备设定部40A这点上结构不同。
设定部40A具备指定部40、输入部41以及检测部42。此外,输入部41以及检测部42不是必需的结构。设定部40A具备输入部41以及检测部42中的至少一方和指定部40即可。
输入部41能够供使用者针对指定部40追加或删除非探测范围。具体而言,输入部41是针对指定部40的使用者界面(interface)部,能够在声源探测装置100A工作开始前或工作中指定或变更非探测范围。输入部41在与检测部42同时设置的情况下,也可以指定检测部42所输出的非探测范围的候选或变更为该候选。
检测部42根据谱运算部80运算出的第2空间谱,检测作为干扰探测对象声源的方向的探测的声源的干扰声源所存在的方向,作为非探测范围的候选。
在此,检测部42在检测部42未与输入部41同时设置的情况下,也可以将指定部40所指定的非探测范围更新为该非探测范围的候选。具体而言,检测部42也可以在根据空间谱P(θ)的信息持续检测到干扰音存在的情况下,检测非探测范围即干扰声源存在的方向,并使指定部40指定该检测到的方向即非探测范围。
此外,作为非探测范围的候选的检测方法,也可以是如下方法:在作为进行了一定时间的声源探测而得的结果的一定时间输出的空间谱中,始终将声压级高的区域检测为非探测范围的候选。另外,作为其他的非探测范围候选的检测方法,也可以是如下方法:针对来自麦克风阵列10的声响信号,使用声音识别来判定声音的种类,由此进行检测。具体而言,也可以是如下方法:在判断为探测到声源方向的声源的声音的种类与探测对象声源的音的类别不同、并且判定为该声源位于一定方向的情况下,将该一定方向作为非探测方向来进行检测。
(变形例2)
图13是变形例2的探测范围以及非探测范围的说明图。此外,对于与图2同样的要素标注同一标号,省略详细的说明。
在实施方式1以及变形例1中,设为由指定部40以0°~θ1、θ2~180°这两个范围指定非探测范围而进行了说明,但是不限于此。指定部40所指定的非探测范围既可以指定图13所示那样的3个范围,也可以指定3个以上的范围。
(变形例3)
图14是示出变形例3的声源探测装置100B的结构的一例的图。此外,对于与图1同样的要素标注同一标号,省略详细的说明。
图14所示的声源探测装置100B相对于实施方式1的声源探测装置100,在不具备存储部70这一点和谱运算部80B的结构上不同。
谱运算部80B与实施方式1的谱运算部80不同,以不使用方向矢量的方式运算第1空间谱。谱运算部80B例如可以通过进行第3相关矩阵(Rs(ω))的固有值展开来运算第1空间谱。
(实施方式2)
在实施方式1中,对使用预先存储于存储部75的非探测范围的方向矢量和谱运算部80所运算出的第2空间谱来推定第2相关矩阵Rn(ω)的情况进行了说明,但是不限于此。由于能够以不使用非探测范围的方向矢量的方式推定第2相关矩阵Rn(ω),因此,作为实施方式2,进行以下说明。
[声源探测装置200的结构]
图15是示出实施方式2的声源探测装置200的结构的一例的图。此外,对于与图1同样的要素标注同一标号,省略详细的说明。
图15所示的声源探测装置200相对于实施方式1的声源探测装置100,在不具备存储部75这一点和推定部51的结构上不同。
[推定部51]
推定部51推定针对仅是非探测范围的声源即干扰声源的第2相关矩阵Rn(ω)。更具体而言,推定部51使用与由指定部40指定的非探测范围所含的声源(即干扰声源)的声响信号对应的空间谱强度比阈值高、且表示使声源探测装置200探测的方向范围的探测范围所含的探测对象声源的声响信号不存在时的第1相关矩阵(Rx(ω)),推定作为与非探测范围所含的声源的声响信号对应的相关矩阵的第2相关矩阵(Rn(ω))。
在本实施方式中,推定部51将作为由指定部40指定的非探测范围的角度范围θd、由谱运算部80运算出的第2空间谱P(θ)、由算出部30算出的第1相关矩阵Rx(ω)作为输入,输出第2相关矩阵Rn(ω)。
在此,与实施方式1同样地,第2相关矩阵Rn(ω)用于除去存在于非探测范围的噪声的影响。因此,推定部51需要将针对仅来自作为非探测范围的以角度范围θd表示的方向的到来声波的相关矩阵推定为第2相关矩阵Rn(ω)。也即是,优选第2相关矩阵Rn(ω)不包含来自探测范围的声波的成分。因此,推定部51只要检测第2空间谱中的非探测范围的强度充分高、非探测范围的声波分量的级别(即声压级)比探测范围的声波分量的级别(即声压级)充分高的情况即可。并且,推定部51只要通过对非探测范围的声波分量的级别(即声压级)比探测范围的声波分量的级别(即声压级)充分高时的第1相关矩阵Rx(ω)在时间上进行平均,来推定第2相关矩阵Rn(ω)即可。
对于第2空间谱非探测范围的强度是否充分高的判定,能够通过阈值判定来进行。例如,对于某时刻的空间谱P(θ),将全方向(0≤θ≤180)的总和设为ΣθP(θ),将非探测范围的和设为ΣθdP(θd),将判定阈值设为Th,用以下的(式9)进行判定即可。
Th×ΣθP(θ)<ΣθdP(θd) (式9)
在探测范围和非探测范围的空间谱P(θ)的和相等的情况下,相当于Th=0.5的阈值水平。因此,为了判定与探测范围相比非探测范围的空间谱的强度更大的状态,Th可取的范围大致为0.5≤Th≤1。为了判定非探测范围的空间谱的强度足够大的状态,也可以使用成为0.9以上的值的Th。此外,Th需要根据探测对象声源的声压级和/或周围噪声环境来调整。
并且,推定部51使用以下的(式10)对满足了上述的阈值判定时的第1相关矩阵Rx(ω)进行时间平均等,由此推定第2相关矩阵Rn(ω)。
Rn(ω)(t)=CA·Rn(ω)(t-1)+CB·Rx(ω)(t) (式10)
在此,CA、CB是平滑化的系数,以CA+CB=1的条件设定。下标(t)表示当前时刻,下标(t-1)表示更新前的值。
[效果等]
如以上那样,根据本实施方式,即便在非探测范围中存在比探测对象声源高的声压级的干扰声源的情况下,也能够抑制干扰声源的影响,能够对探测范围的探测对象声源的方向进行探测。也即是,根据本实施方式,能够实现能够更可靠地探测处于探测对象范围的探测对象的声源的方向的声源探测装置200。
本实施方式中,构成为使用针对由除去部60算出的探测范围中的探测对象声源的过去的第3相关矩阵Rs(ω)、即针对推定值的第2空间谱P(θ)来进行判定。因此,推定部51在除去非探测范围成分后的残留强度高的情况下会更新第2相关矩阵Rn(ω)。
此外,作为其他的例子,推定部51也可以使用由算出部30算出的第1相关矩阵Rx(ω),算出针对该第1相关矩阵Rx(ω)的空间谱P(θ),而将其用于上述的判定。
以上,基于实施方式以及变形例对本公开的一个或多个方式的声源探测装置等进行了说明,但是,本公开不限定于这些实施方式等。只要不脱离本公开的主旨,将本领域技术人员所想到的各种变形施加于本实施方式而得到的方式、将不同的实施方式中的构成要素组合而构筑的方式也包含于本公开的一个或多个方式的范围内。例如,以下那样的情况也包含于本公开中。
(1)例如,上述的声源探测装置还可以具备摄像头等图像拍摄单元和处理其拍摄图像的新处理部。在该情况下,上述的声源探测装置既可以在麦克风阵列的中央配置摄像头,也可以在与麦克风阵列不同的位置具备摄像头。
更具体而言,也可以是,将由摄像头得到的拍摄图像输入信号处理部,将通过信号处理部进行处理而确定的表示探测对象声源的位置的声源图像重叠于所输入的拍摄图像而得的图像,作为处理结果使与声源探测装置连接的显示部进行显示。
(2)具体而言,上述的声源探测装置也可以是由微处理器、ROM、RAM、硬盘单元、显示器单元、键盘、鼠标等构成的计算机系统。所述RAM或硬盘单元中存储有计算机程序。所述微处理器根据所述计算机程序来工作,由此各构成要素实现其功能。在此,为了实现预定的功能,计算机程序是组合多个表示针对计算机的指令的命令码而构成的。
(3)构成上述的声源探测装置的构成要素的一部分或全部也可以由1个系统LSI(Large Scale Integration:大规模集成电路)构成。系统LSI是在一个芯片上集成多个构成部而制造出的超多功能LSI,具体而言,是包含微处理器、ROM、RAM等而构成的计算机系统。所述RAM中存储有计算机程序。所述微处理器根据所述计算机程序来工作,由此,系统LSI实现其功能。
(4)构成上述的声源探测装置的构成要素的一部分或全部也可以由能相对于各装置装卸的IC卡或单体模块构成。所述IC卡或所述模块是由微处理器、ROM、RAM等构成的计算机系统。所述IC卡或所述模块也可以包含上述的超多功能LSI。微处理器根据计算机程序来工作,由此,所述IC卡或所述模块实现其功能。该IC卡或该模块也可以具有抗篡改性。
[产业上的可利用性]
本公开能够利用于使用了多个麦克风单元的声源探测装置,尤其能够利用于能更可靠地对位于距声源探测装置比较远的位置的无线电控制直升机、无人机等到达麦克风单元的声音比周围的声音小的声源的方向进行探测的声源探测装置。

Claims (10)

1.一种声源探测装置,具备电路以及一个以上的存储器,所述电路在运行中执行包括以下的工作:
算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,
指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,
推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,
通过从所述第1相关矩阵除去所述第2相关矩阵的成分来算出第3相关矩阵,所述第3相关矩阵是与表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源对应的相关矩阵,
根据所述第3相关矩阵运算第1空间谱来作为探测结果,
在所述推定中,根据由所述非探测范围的方向范围求出的方向矢量和第2空间谱推定所述第2相关矩阵,所述第2空间谱是运算所述第1空间谱的前一个的探测结果。
2.根据权利要求1所述的声源探测装置,
所述推定包括:
从由所述非探测范围表示的方向范围和所述第2空间谱提取角度信息,所述角度信息表示所述非探测范围内的所述第2空间谱的最小强度方向以及最大强度方向,
根据所述角度信息和所述方向矢量,算出与所述最小强度方向以及所述最大强度方向的所述第2空间谱对应的相关矩阵,作为相关矩阵更新量,
通过使用所述相关矩阵更新量来更新第4相关矩阵,从而推定所述第2相关矩阵,所述第4相关矩阵是在推定所述第2相关矩阵前推定出的与所述非探测范围所包含的声源的声响信号对应的相关矩阵。
3.根据权利要求2所述的声源探测装置,
在所述更新中,通过将所述相关矩阵更新量的成分与所述第4相关矩阵相加,来推定所述第2相关矩阵。
4.根据权利要求1所述的声源探测装置,
在所述第1空间谱的运算中,根据所述第3相关矩阵和所述方向矢量,运算所述第1空间谱。
5.根据权利要求1所述的声源探测装置,
所述工作还包括:
根据所述第2空间谱,检测干扰声源所存在的方向来作为所述非探测范围的候选,所述干扰声源是干扰所述探测对象声源的方向的探测的声源。
6.根据权利要求1所述的声源探测装置,
在所述指定中,使用者追加或删除非探测范围。
7.根据权利要求1所述的声源探测装置,
所述工作还包括:
输出频谱信号,所述频谱信号是将在所述2个以上的麦克风单元分别收集到的声响信号变换为频域的信号而得到的,
在所述第1相关矩阵的算出中,根据所述频谱信号,算出所述第1相关矩阵。
8.一种声源探测装置,具备电路以及一个以上的存储器,所述电路在运行中执行包括以下的工作:
算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,
指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,
使用与所述非探测范围所包含的声源的声响信号对应的空间谱强度比阈值高、并且表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源的声响信号不存在时的所述第1相关矩阵,推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,
通过从所述第1相关矩阵除去所述第2相关矩阵的成分来算出第3相关矩阵,所述第3相关矩阵是与所述探测范围所包含的所述探测对象声源对应的相关矩阵,
根据所述第3相关矩阵运算第1空间谱来作为探测结果。
9.一种声源探测方法,包括:
算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,
指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,
推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,
通过从所述第1相关矩阵除去所述第2相关矩阵的成分来算出第3相关矩阵,所述第3相关矩阵是与表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源对应的相关矩阵,
根据所述第3相关矩阵运算第1空间谱来作为探测结果,
在所述推定中,根据由所述非探测范围的方向范围求出的方向矢量和第2空间谱推定所述第2相关矩阵,所述第2空间谱是运算所述第1空间谱的前一个的探测结果。
10.一种记录有程序的计算机可读的非瞬时性记录介质,
所述程序在由计算机执行时使计算机执行包含以下的方法:
算出作为观测信号的相关矩阵的第1相关矩阵,所述观测信号是通过由相互分离地配置的2个以上的麦克风单元构成的麦克风阵列收集到的声响信号,
指定非探测范围,所述非探测范围表示不对探测对象声源进行探测的方向范围,
推定第2相关矩阵,所述第2相关矩阵是与所述非探测范围所包含的声源的声响信号对应的相关矩阵,
通过从所述第1相关矩阵除去所述第2相关矩阵的成分来来算出第3相关矩阵,所述第3相关矩阵是与表示对所述探测对象声源进行探测的方向范围的探测范围所包含的所述探测对象声源对应的相关矩阵,
根据所述第3相关矩阵运算第1空间谱来作为探测结果,
在所述推定中,根据由所述非探测范围的方向范围求出的方向矢量和第2空间谱推定所述第2相关矩阵,所述第2空间谱是运算所述第1空间谱的前一个的探测结果。
CN201710050526.4A 2016-02-25 2017-01-20 声源探测装置、声源探测方法及非瞬时性记录介质 Active CN107121669B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201662299655P 2016-02-25 2016-02-25
US62/299655 2016-02-25
JP2016219987A JP6871718B6 (ja) 2016-02-25 2016-11-10 音源探査装置、音源探査方法およびそのプログラム
JP2016-219987 2016-11-10

Publications (2)

Publication Number Publication Date
CN107121669A true CN107121669A (zh) 2017-09-01
CN107121669B CN107121669B (zh) 2021-08-20

Family

ID=59680033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710050526.4A Active CN107121669B (zh) 2016-02-25 2017-01-20 声源探测装置、声源探测方法及非瞬时性记录介质

Country Status (2)

Country Link
US (1) US9820043B2 (zh)
CN (1) CN107121669B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3081641A1 (fr) * 2018-06-13 2019-11-29 Orange Localisation de sources sonores dans un environnement acoustique donne.
JP7191793B2 (ja) * 2019-08-30 2022-12-19 株式会社東芝 信号処理装置、信号処理方法、及びプログラム
US11425496B2 (en) * 2020-05-01 2022-08-23 International Business Machines Corporation Two-dimensional sound localization with transformation layer
CN112799017B (zh) * 2021-04-07 2021-07-09 浙江华创视讯科技有限公司 声源定位方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
EP2005207A1 (en) * 2006-03-09 2008-12-24 Fundacio Privada Centre Tecnologic de Tele- comunicacions de Catalunya Method and system for estimating directions-of-arrival in low power or low sample size scenarios
JP2012042465A (ja) * 2010-08-17 2012-03-01 Honda Motor Co Ltd 音源方向推定装置及び音源方向推定方法
CN105204001A (zh) * 2015-10-12 2015-12-30 Tcl集团股份有限公司 一种声源定位的方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007127182A2 (en) * 2006-04-25 2007-11-08 Incel Vision Inc. Noise reduction system and method
JP5952692B2 (ja) 2012-09-13 2016-07-13 本田技研工業株式会社 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム
US9338551B2 (en) * 2013-03-15 2016-05-10 Broadcom Corporation Multi-microphone source tracking and noise suppression
JP6460676B2 (ja) * 2014-08-05 2019-01-30 キヤノン株式会社 信号処理装置および信号処理方法
JP6118838B2 (ja) * 2014-08-21 2017-04-19 本田技研工業株式会社 情報処理装置、情報処理システム、情報処理方法、及び情報処理プログラム
US9972315B2 (en) * 2015-01-14 2018-05-15 Honda Motor Co., Ltd. Speech processing device, speech processing method, and speech processing system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
EP2005207A1 (en) * 2006-03-09 2008-12-24 Fundacio Privada Centre Tecnologic de Tele- comunicacions de Catalunya Method and system for estimating directions-of-arrival in low power or low sample size scenarios
JP2012042465A (ja) * 2010-08-17 2012-03-01 Honda Motor Co Ltd 音源方向推定装置及び音源方向推定方法
CN105204001A (zh) * 2015-10-12 2015-12-30 Tcl集团股份有限公司 一种声源定位的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JACEK .ET AL: "Direction of Arrival Estimation Using the Parameterized Spatial Correlation Matrix", 《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 *
严素清等: "传感器阵列的声源定位研究", 《电声技术》 *

Also Published As

Publication number Publication date
US9820043B2 (en) 2017-11-14
CN107121669B (zh) 2021-08-20
US20170251300A1 (en) 2017-08-31

Similar Documents

Publication Publication Date Title
CN107121669A (zh) 声源探测装置、声源探测方法及非瞬时性记录介质
US7720679B2 (en) Speech recognition apparatus, speech recognition apparatus and program thereof
CN105872156A (zh) 一种回声时延跟踪方法及装置
WO2020037555A1 (zh) 评估麦克风阵列一致性的方法、设备、装置和系统
CN110755108A (zh) 一种基于智能听诊器的心脏声音分类方法、系统、装置及可读存储介质
WO2008016109A1 (fr) Procédé d&#39;optimisation de jeu de données d&#39;apprentissage pour dispositif d&#39;identification du signal et dispositif d&#39;identification du signal capable d&#39;optimiser le jeu de données d&#39;apprentissage
CN108200526B (zh) 一种基于可信度曲线的音响调试方法及装置
JP6871718B6 (ja) 音源探査装置、音源探査方法およびそのプログラム
CN102629470A (zh) 辅音区间检测装置及辅音区间检测方法
CN109341848B (zh) 一种隧道运营阶段的安全监测系统
CN109040957A (zh) 一种基于wifi的室内定位方法及装置
CN113314144A (zh) 声音识别及电力设备故障预警方法、系统、终端及介质
CN110047519A (zh) 一种语音端点检测方法、装置及设备
CN111401136A (zh) 一种柱塞泵空化程度检测方法、装置及终端
CN109697699A (zh) 图像处理方法、装置、设备及存储介质
RU2611973C2 (ru) Ослабление шума в сигнале
JPWO2012105385A1 (ja) 有音区間分類装置、有音区間分類方法、及び有音区間分類プログラム
JP2014157110A (ja) 信号処理装置、レーダ装置および信号処理方法
JP2020184295A (ja) 寸法データ算出装置、製品製造装置、及びシルエット画像生成装置
CN113780573B (zh) 一种抗噪的高精度测距方法及装置
US20150190091A1 (en) Device, system and method for detection of fluid accumulation
JP7188594B2 (ja) 画像処理装置および画像処理方法
JP2007127891A (ja) 発話主体同定装置及びコンピュータプログラム
CN105989838B (zh) 语音识别方法及装置
Sánchez-García et al. A novel image-processing based method for the automatic detection, extraction and characterization of marine mammal tonal calls

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant