CN106782596A - 一种基于麦克风阵列的声源定位跟随系统及方法 - Google Patents
一种基于麦克风阵列的声源定位跟随系统及方法 Download PDFInfo
- Publication number
- CN106782596A CN106782596A CN201611028138.8A CN201611028138A CN106782596A CN 106782596 A CN106782596 A CN 106782596A CN 201611028138 A CN201611028138 A CN 201611028138A CN 106782596 A CN106782596 A CN 106782596A
- Authority
- CN
- China
- Prior art keywords
- microphone
- signal
- sound
- sound source
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004807 localization Effects 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims description 67
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 238000005070 sampling Methods 0.000 claims description 46
- 238000001228 spectrum Methods 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 abstract description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
- G01S3/808—Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
- G01S3/8083—Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/20—Position of source determined by a plurality of spaced direction-finders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种基于麦克风阵列的声源定位跟随系统,包括信号接收模块、AD采样电路、信号预处理模块、算法处理模块和输出模块;信号接收模块为麦克风阵列,用于获取声源到各个麦克风的语音信号;AD采样电路,用于获取各麦克风的语音采样信号;信号预处理模块,用于预处理语音采样信号;算法处理模块,用于根据语音采样信号计算声源位置;输出模块,用于输出声源位置信息。本发明提供的声源定位系统通过蓝牙建立无线通信,获取声源信号并根据声源信号确定声源位置,可实现行走装置的实时定位跟随。本发明在行走装置近距离跟随情况下,可以准确确定声源位置,实时性强,并且算法简单,易于实现。
Description
技术领域
本发明涉及语音信号处理领域,特别是一种基于麦克风阵列的声源定位跟随系统及方法。
背景技术
早在20世纪七八十年代,就开始将麦克风阵列应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。1995年flanagan在混响环境下用阵列信号处理对声音进行捕获。1996年silverman和brandstein开始将其应用于声源定位中,用于确定和实时跟踪说话人的位置。
目前,麦克风阵列系统已经应用于许多场合,包括视频会议、语音识别、说话人识别、汽车环境语音获取、混响环境声音拾取、声源定位和助听装置等。虽然基于麦克风阵列的语音处理技术正成为一个新的研究热点,但相关应用技术还不成熟。
因此,需要一种基于麦克风阵列的声源定位跟随系统及方法
发明内容
本发明的目的之一是提出一种基于麦克风阵列的声源定位跟随系统;本发明的目的之二是提出一种基于麦克风阵列的声源定位跟随方法。
本发明的目的之一是通过以下技术方案来实现的:
本发明提供的一种基于麦克风阵列的声源定位跟随系统,包括信号接收模块、AD采样电路、信号预处理模块、算法处理模块和输出模块;
所述信号接收模块为麦克风阵列,用于获取声源到各个麦克风的语音信号;
所述AD采样电路,用于获取各麦克风的语音采样信号;
所述信号预处理模块,用于预处理语音采样信号;
所述算法处理模块,用于根据语音采样信号计算声源位置;
所述输出模块,用于输出声源位置信息。
进一步,所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风;所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。
进一步,所述信号预处理模块对语音采样信号进行预处理是对采样信号进行加窗操作得到加窗处理信号。
进一步,所述算法处理模块按照以下步骤来计算声源位置:
根据加窗处理信号来判断声源位于采样位置的前后方向;
根据加窗处理信号来判断声源位于采样位置的左右方向;
根据声源位于采样位置的前后方向和左右方向来确定声源的位置。
进一步,所述算法处理模块中声源的位置是通过声源定位方法来确定的,具体步骤如下:
S631:按照以下公式对语音采样信号进行快速傅里叶变换得到声源信号的幅度谱:
S(k)=FFT[sw(n)];
其中,S(k)为加窗信号sw(n)的傅里叶变换;
S632:根据得声源信号的幅度谱按照以下公式计算声源信号到各麦克风间的波程差:
其中,d1为一个周期内声源信号到麦克风M1与M2间的波程差;d2为一个周期内声源信号到麦克风M1与M3间的波程差;λ为声源信号一个周期的波长,f为声源信号频率;β1=θ2-θ1为麦克风1与2间相位差;β2=θ3-θ1为麦克风1与3间相位差;θ1表示麦克风M1接收的声源信号的相位;θ2表示麦克风M2接收的声源信号的相位;θ3表示麦克风M3接收的声源信号的相位;
S633:根据波程差按照以下公式计算声源位置坐标:
其中,(x,y)为声源坐标,a为相邻麦克风间距;
为声源距行走装置所载麦克风M1距离;
S634:根据声源位置坐标按照以下公式计算声源方位角:
声源方位角
其中,α声源方位角。
本发明的目的之二是通过以下技术方案来实现的:
本发明提供的一种基于麦克风阵列的声源定位跟随方法,包括以下步骤:
S1:设置麦克风阵列;
S2:通过麦克风阵列来获取声源到各个麦克风的语音信号;
S3:将语音采样信号转换为信号序列;
S4:对信号序列进行加窗操作得到加窗处理信号;
S5:对加窗处理信号判断声源位于采样位置的前后方向和左右方向;
S6:根据声源位于采样位置的前后方向和左右方向来确定声源的位置;
进一步,所述声源的位置是通过声源定位方法来确定的,具体步骤如下:
S631:按照以下公式对语音采样信号进行快速傅里叶变换得到声源信号的幅度谱:
S(k)=FFT[sw(n)];
其中,S(k)为加窗信号sw(n)的傅里叶变换;
S632:根据得声源信号的幅度谱按照以下公式计算声源信号到各麦克风间的波程差:
其中,d1为一个周期内声源信号到麦克风M1与M2间的波程差;d2为一个周期内声源信号到麦克风M1与M3间的波程差;λ为声源信号一个周期的波长,f为声源信号频率;β1=θ2-θ1为麦克风1与2间相位差;β2=θ3-θ1为麦克风1与3间相位差;θ1表示麦克风M1接收的声源信号的相位;θ2表示麦克风M2接收的声源信号的相位;θ3表示麦克风M3接收的声源信号的相位;
S633:根据波程差按照以下公式计算声源位置坐标:
其中,(x,y)为声源坐标,a为相邻麦克风间距;
为声源距行走装置所载麦克风M1距离;
S634:根据声源位置坐标按照以下公式计算声源方位角:
声源方位角
其中,α声源方位角。
进一步,所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风;所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。
进一步,所述声源位置按照以下步骤来计算:
S61:根据加窗处理信号来判断声源位于采样位置的前后方向;
S62:根据加窗处理信号来判断声源位于采样位置的左右方向;
S63:根据声源位于采样位置的前后方向和左右方向来确定声源的位置。
进一步,所述声源位于采样位置的前后方向是按照以下步骤来计算:
S611:获取均匀线性子阵列A中位于中间点前后的麦克风与参考点麦克风的间距为a;
S612:获取均匀线性子阵列A中位于中间点前后的麦克风的加窗处理信号;
S613:按照以下公式计算加窗处理信号的短时能量:
其中,N为窗函数的长度;xw表示加窗处理信号;n表示第n个加窗处理信号;m表示第m个加窗处理信号;
S614:比较位于中间点前后的麦克风的短时能量,如果位于中间点前的麦克风的短时能量大于位于中间点后的麦克风的短时能量,则声源位于采样位置的前方;如果位于中间点前的麦克风的短时能量小于位于中间点后的麦克风的短时能量,则声源位于采样位置的后方;
所述声源位于采样位置的左右方向是按照以下步骤来计算:
S621:获取均匀线性子阵列B中各麦克风到参考点麦克风的间距为b;
S622:获取均匀线性子阵列B中位于中间点左右的麦克风的加窗处理信号;
S623:按照以下公式计算加窗处理信号的短时能量:
其中,N为窗函数的长度;xw表示加窗处理信号;n表示第n个加窗处理信号;m表示第m个加窗处理信号;
S624:比较位于中间点左右的麦克风的短时能量,如果位于中间点左的麦克风的短时能量大于位于中间点右的麦克风的短时能量,则声源位于采样位置的左方;如果位于中间点左的麦克风的短时能量小于位于中间点右后的麦克风的短时能量,则声源位于采样位置的右方。
由于采用了上述技术方案,本发明具有如下的优点:
本发明提供的基于麦克风阵列的声源定位跟随系统,通过手持设备与行走装置所载声源构成定位系统,该定位系统可以通过蓝牙建立无线通信,当手持设备发出声源信号时,即触发定位系统开始采样,当手持设备无声源信号发出时,定位系统关闭。采用这种方式,可以实现行走装置的实时定位跟随。本发明在行走装置近距离跟随情况下,可以准确确定声源位置,实时性强,并且算法简单,易于实现。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
本发明的附图说明如下。
图1是本发明的硬件框图。
图2是本发明的麦克风阵列模型。
图3是本发明声源S与麦克风阵列的位置关系示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例1
如图所示,本实施例提供的基于麦克风阵列的声源定位跟随系统,包括信号接收模块、AD采样电路、信号预处理模块、算法处理模块和输出模块;
所述信号接收模块为麦克风阵列,用于获取声源到各个麦克风的语音信号;
所述AD采样电路,用于获取各麦克风的语音采样信号;
所述信号预处理模块,用于预处理语音采样信号;
所述算法处理模块,用于根据语音采样信号计算声源位置;
所述输出模块,用于输出声源位置信息。
所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风;所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。
所述信号预处理模块按照以下步骤对语音采样信号进行预处理:首先将语音采样信号转换为信号序列;然后对信号序列进行加窗操作得到加窗处理信号。
所述算法处理模块按照以下步骤来计算声源位置:
根据加窗处理信号来判断声源位于采样位置的前后方向;
根据加窗处理信号来判断声源位于采样位置的左右方向;
根据声源位于采样位置的前后方向和左右方向来确定声源的大致位置。
所述算法处理模块中声源的位置是通过声源定位方法来确定的,具体步骤如下:
S631:按照以下公式对语音采样信号进行快速傅里叶变换得到声源信号的幅度谱:
S(k)=FFT[sw(n)];
其中,S(k)为加窗信号sw(n)的傅里叶变换;
S632:根据得声源信号的幅度谱按照以下公式计算声源信号到各麦克风间的波程差:
其中,d1为一个周期内声源信号到麦克风M1与M2间的波程差;d2为一个周期内声源信号到麦克风M1与M3间的波程差;λ为声源信号一个周期的波长,f为声源信号频率;β1=θ2-θ1为麦克风1与2间相位差;β2=θ3-θ1为麦克风1与3间相位差;θ1表示麦克风M1接收的声源信号的相位;θ2表示麦克风M2接收的声源信号的相位;θ3表示麦克风M3接收的声源信号的相位;
S633:根据波程差按照以下公式计算声源位置坐标:
其中,(x,y)为声源坐标,a为相邻麦克风间距;
为声源距行走装置所载麦克风M1距离;
S634:根据声源位置坐标按照以下公式计算声源方位角:
声源方位角
其中,α声源方位角。
本发明还提供了一种基于麦克风阵列的声源定位跟随方法,包括以下步骤:
S1:设置麦克风阵列;
S2:通过麦克风阵列来获取声源到各个麦克风的语音信号;
S3:将语音采样信号转换为信号序列;
S4:对信号序列进行加窗操作得到加窗处理信号;
S5:对加窗处理信号判断声源位于采样位置的前后方向和左右方向;
S6:根据声源位于采样位置的前后方向和左右方向来确定声源的位置;
所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风;所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。
所述声源位置按照以下步骤来计算:
S61:根据加窗处理信号来判断声源位于采样位置的前后方向;
S62:根据加窗处理信号来判断声源位于采样位置的左右方向;
S63:根据声源位于采样位置的前后方向和左右方向来确定声源的位置。
所述声源位于采样位置的前后方向是按照以下步骤来计算:
S611:获取均匀线性子阵列A中位于中间点前后的麦克风与参考点麦克风的间距为a;
S612:获取均匀线性子阵列A中位于中间点前后的麦克风的加窗处理信号;
S613:按照以下公式计算加窗处理信号的短时能量:
其中,N为窗函数的长度;xw表示加窗处理信号;n表示第n个加窗处理信号;m表示第m个加窗处理信号;
S614:比较位于中间点前后的麦克风的短时能量,如果位于中间点前的麦克风的短时能量大于位于中间点后的麦克风的短时能量,则声源位于采样位置的前方;如果位于中间点前的麦克风的短时能量小于位于中间点后的麦克风的短时能量,则声源位于采样位置的后方。
所述声源位于采样位置的左右方向是按照以下步骤来计算:
S621:获取均匀线性子阵列B中各麦克风到参考点麦克风的间距为b;
S622:获取均匀线性子阵列B中位于中间点左右的麦克风的加窗处理信号;
S623:按照以下公式计算加窗处理信号的短时能量:
S624:比较位于中间点左右的麦克风的短时能量,如果位于中间点左的麦克风的短时能量大于位于中间点右的麦克风的短时能量,则声源位于采样位置的左方;如果位于中间点左的麦克风的短时能量小于位于中间点右后的麦克风的短时能量,则声源位于采样位置的右方。
实施例2
本实施例提供的基于麦克风阵列的声源定位跟随方法,通过手持设备与行走装置所载声源构成进行定位的定位系统,该定位系统设置于行走装置,如助行装置和助行轮椅,如图1中虚线框所示,虚线框内表示行走装置,并通过蓝牙建立无线通信,当手持设备发出声源信号时,即触发定位系统开始采样,当手持设备无声源信号发出时,定位系统关闭。采用这种方式,可以实现行走装置的实时定位跟随。在行走装置近距离跟随情况下,可以准确确定声源位置,实时性强,并且算法简单,易于实现。
基于麦克风阵列的声源定位跟随系统示意图如图1所示:包括信号接收模块、信号预处理模块、算法处理模块以及结果输出模块。
信号接收模块为置于行走装置上的十字麦克风阵列,结构示意图如图2所示,用于获取声源到各个麦克风的语音信号,由均匀线性子阵列A和均匀线性子阵列B构成,两个子阵列相互垂直,共用中间麦克风1并将其作为参考点;麦克风M2、M3与麦克风M1间距为a;所述麦克风M4、M5与麦克风M1间距为b;本实施例中的M4位于前方,M5位于后方;麦克风M2位于麦克风M1左方,麦克风M3位于麦克风M1右方。
信号预处理模块包括AD采样电路,AD采样电路以20KHZ采样频率对各个麦克风获取的语音信号进行采样,将模拟信号转化为离散信号。
算法处理模块以及结果输出模块包括STM32F103ZE处理器及外围电路、音频输出电路,用于运行相关算法确定声源位置,并输出位置信息音频。
具体实现步骤如下:
手持设备发出单频声源信号s(t),通过蓝牙与行走装置建立无线通信,触发定位系统开始采样;
行走装置利用麦克风阵列接收声源信号;
将接收到的声源信号进行AD采样,采样频率为20KHZ;将模拟信号s(t)转换为信号序列s(n);
对麦克风所接收语音信号进行加窗操作。假设语音信号在10~30ms短时间内是平稳的,窗函数平滑地在语音信号上滑动,将语音信号分成帧。窗函数选用汉明窗
其中,N为窗口长度,也为一帧采样点数。加窗处理后的信号为sw(n):
sw(n)=s(n)*w(n)
判断声源信号基于行走装置的前后方向。窗函数的长度为N,短时能量可表示为:
其中,N为窗函数的长度;xw表示加窗处理信号;n表示第n个加窗处理信号;m表示第m个加窗处理信号;
比较麦克风M4和M5接收语音信号的强度大小,如果E4n>E5n声源信号在行走装置前方;如果E4n<E5n,声源信号在行走装置后方。
其中,E4n表示麦克风4所接受语音信号的强度,E5n表示麦克风5所接受语音信号的强度。
判断声源信号基于行走装置的左右方向。窗函数的长度为N,短时能量可表示为:
比较麦克风M2和M3接收语音信号的强度大小,如果E2n>E3n声源信号在行走装置左方;如果E2n<E3n声源信号在行走装置右方。
其中,E2n表示麦克风2所接受语音信号的强度,E3n表示麦克风3所接受语音信号的强度。
由声源定位方法定位声源的具体位置。
8)行走装置根据声源方位以及位置自主跟随。
步骤(6)具体包括如下步骤:
(6.1)对信号序列进行快速傅里叶变换。S(k)=FFT[sw(n)];其中,S(k)为加窗信号sw(n)的傅里叶变换。
(6.2)计算声源信号到各麦克风间的波程差。由FFT变换可求得声源信号的幅度谱,声源信号频率为f,该频率处所对应各麦克风接收语音信号的幅度与相位分别为:
M1=a1+b1j;相位:
M2=a2+b2j;相位:
M3=a3+b3j;相位:
麦克风1与2间相位差为:β1=θ2-θ1;麦克风1与3间相位差为:β2=θ3-θ1;
一个周期内声源信号到麦克风M1与M2、M1与M3间的波程差d1和d2分别为:
其中λ为声源信号一个周期的波长,f为声源信号的频率;
(6.3)建立平面直角坐标系,求声源位置到坐标系原点距离r;其中,声源坐标为(x,y),a为相邻麦克风间距。建立方程组如下:
声源距行走装置所载麦克风M1距离为r:
(6.4)由已知平面坐标系,求声源方位角;
声源方位角
手持设备与行走装置所载声源定位系统可以通过蓝牙建立无线通信,当手持设备发出声源信号时,即触发定位系统开始采样,当手持设备无声源信号发出时,定位系统关闭。采用这种方式,可以实现行走装置的实时定位跟随。本发明在行走装置近距离跟随情况下,可以准确确定声源位置,实时性强,并且算法简单,易于实现。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的保护范围当中。
Claims (10)
1.一种基于麦克风阵列的声源定位跟随系统,其特征在于:包括信号接收模块、AD采样电路、信号预处理模块、算法处理模块和输出模块;
所述信号接收模块为麦克风阵列,用于获取声源到各个麦克风的语音信号;
所述AD采样电路,用于获取各麦克风的语音采样信号;
所述信号预处理模块,用于预处理语音采样信号;
所述算法处理模块,用于根据语音采样信号计算声源位置;
所述输出模块,用于输出声源位置信息。
2.如权利要求1所述的基于麦克风阵列的声源定位跟随系统,其特征在于:所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风;所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。
3.如权利要求1所述的基于麦克风阵列的声源定位跟随系统,其特征在于:所述信号预处理模块对语音采样信号进行预处理是对采样信号进行加窗操作得到加窗处理信号。
4.如权利要求1所述的基于麦克风阵列的声源定位跟随系统,其特征在于:所述算法处理模块按照以下步骤来计算声源位置:
根据加窗处理信号来判断声源位于采样位置的前后方向;
根据加窗处理信号来判断声源位于采样位置的左右方向;
根据声源位于采样位置的前后方向和左右方向来确定声源的位置。
5.如权利要求4所述的基于麦克风阵列的声源定位跟随系统,其特征在于:所述算法处理模块中声源的位置是通过声源定位方法来确定的,具体步骤如下:
S631:按照以下公式对语音采样信号进行快速傅里叶变换得到声源信号的幅度谱:
S(k)=FFT[sw(n)];
其中,S(k)为加窗信号sw(n)的傅里叶变换;
S632:根据得声源信号的幅度谱按照以下公式计算声源信号到各麦克风间的波程差:
其中,d1为一个周期内声源信号到麦克风M1与M2间的波程差;d2为一个周期内声源信号到麦克风M1与M3间的波程差;λ为声源信号一个周期的波长,f为声源信号频率;β1=θ2-θ1为麦克风1与2间相位差;β2=θ3-θ1为麦克风1与3间相位差;θ1表示麦克风M1接收的声源信号的相位;θ2表示麦克风M2接收的声源信号的相位;θ3表示麦克风M3接收的声源信号的相位;
S633:根据波程差按照以下公式计算声源位置坐标:
其中,(x,y)为声源坐标,α为相邻麦克风间距;
为声源距行走装置所载麦克风M1距离;
S634:根据声源位置坐标按照以下公式计算声源方位角:
声源方位角
其中,α声源方位角。
6.一种基于麦克风阵列的声源定位跟随方法,其特征在于:包括以下步骤:
S1:设置麦克风阵列;
S2:通过麦克风阵列来获取声源到各个麦克风的语音信号;
S3:对语音信号进行加窗操作得到加窗处理信号;
S4:对加窗处理信号判断声源位于采样位置的前后方向和左右方向;
S5:根据声源位于采样位置的前后方向和左右方向来确定声源的位置。
7.如权利要求6所述的基于麦克风阵列的声源定位跟随系统,其特征在于:所述声源的位置是通过声源定位方法来确定的,具体步骤如下:
S631:按照以下公式对语音采样信号进行快速傅里叶变换得到声源信号的幅度谱:
S(k)=FFT[sw(n)];
其中,S(k)为加窗信号sw(n)的傅里叶变换;
S632:根据得声源信号的幅度谱按照以下公式计算声源信号到各麦克风间的波程差:
其中,d1为一个周期内声源信号到麦克风M1与M2间的波程差;d2为一个周期内声源信号到麦克风M1与M3间的波程差;λ为声源信号一个周期的波长,f为声源信号频率;β1=θ2-θ1为麦克风1与2间相位差;β2=θ3-θ1为麦克风1与3间相位差;θ1表示麦克风M1接收的声源信号的相位;θ2表示麦克风M2接收的声源信号的相位;θ3表示麦克风M3接收的声源信号的相位;
S633:根据波程差按照以下公式计算声源位置坐标:
其中,(x,y)为声源坐标,α为相邻麦克风间距;
为声源距行走装置所载麦克风M1距离;
S634:根据声源位置坐标按照以下公式计算声源方位角:
声源方位角
其中,α声源方位角。
8.如权利要求6所述的基于麦克风阵列的声源定位跟随方法,其特征在于:所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风;所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。
9.如权利要求6所述的基于麦克风阵列的声源定位跟随方法,其特征在于:所述声源位置按照以下步骤来计算:
S61:根据加窗处理信号来判断声源位于采样位置的前后方向;
S62:根据加窗处理信号来判断声源位于采样位置的左右方向;
S63:根据声源位于采样位置的前后方向和左右方向来确定声源的位置。
10.如权利要求7所述的基于麦克风阵列的声源定位跟随方法,其特征在于:所述声源位于采样位置的前后方向是按照以下步骤来计算:
S611:获取均匀线性子阵列A中位于中间点前后的麦克风与参考点麦克风的间距为α;
S612:获取均匀线性子阵列A中位于中间点前后的麦克风的加窗处理信号;
S613:按照以下公式计算加窗处理信号的短时能量:
其中,N为窗函数的长度;xw表示加窗处理信号;n表示第n个加窗处理信号;m表示第m个加窗处理信号;
S614:比较位于中间点前后的麦克风的短时能量,如果位于中间点前的麦克风的短时能量大于位于中间点后的麦克风的短时能量,则声源位于采样位置的前方;如果位于中间点前的麦克风的短时能量小于位于中间点后的麦克风的短时能量,则声源位于采样位置的后方;
所述声源位于采样位置的左右方向是按照以下步骤来计算:
S621:获取均匀线性子阵列B中各麦克风到参考点麦克风的间距为b;
S622:获取均匀线性子阵列B中位于中间点左右的麦克风的加窗处理信号;
S623:按照以下公式计算加窗处理信号的短时能量:
S624:比较位于中间点左右的麦克风的短时能量,如果位于中间点左的麦克风的短时能量大于位于中间点右的麦克风的短时能量,则声源位于采样位置的左方;如果位于中间点左的麦克风的短时能量小于位于中间点右后的麦克风的短时能量,则声源位于采样位置的右方。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611028138.8A CN106782596A (zh) | 2016-11-18 | 2016-11-18 | 一种基于麦克风阵列的声源定位跟随系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611028138.8A CN106782596A (zh) | 2016-11-18 | 2016-11-18 | 一种基于麦克风阵列的声源定位跟随系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106782596A true CN106782596A (zh) | 2017-05-31 |
Family
ID=58970501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611028138.8A Pending CN106782596A (zh) | 2016-11-18 | 2016-11-18 | 一种基于麦克风阵列的声源定位跟随系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106782596A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108398675A (zh) * | 2018-03-01 | 2018-08-14 | 英华达(上海)科技有限公司 | 定位系统及定位方法 |
CN109671439A (zh) * | 2018-12-19 | 2019-04-23 | 成都大学 | 一种智能化果林鸟害防治设备及其鸟类定位方法 |
CN109709518A (zh) * | 2018-12-25 | 2019-05-03 | 北京猎户星空科技有限公司 | 声源定位方法、装置、智能设备及存储介质 |
CN110189764A (zh) * | 2019-05-29 | 2019-08-30 | 深圳壹秘科技有限公司 | 展示分离角色的系统、方法和录音设备 |
CN110300355A (zh) * | 2019-05-07 | 2019-10-01 | 广东工业大学 | 一种可跟随声源位置移动的智能话筒 |
CN110322893A (zh) * | 2019-05-29 | 2019-10-11 | 深圳市捷视飞通科技股份有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
CN110631687A (zh) * | 2019-09-29 | 2019-12-31 | 苏州思必驰信息科技有限公司 | 无线振动采集器 |
CN110767247A (zh) * | 2019-10-29 | 2020-02-07 | 支付宝(杭州)信息技术有限公司 | 语音信号处理方法、声音采集装置和电子设备 |
CN110875056A (zh) * | 2018-08-30 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 语音转录设备、系统、方法、及电子设备 |
CN112367473A (zh) * | 2021-01-13 | 2021-02-12 | 北京电信易通信息技术股份有限公司 | 一种基于声纹到达相位的可旋转摄像装置及其控制方法 |
CN112992176A (zh) * | 2020-09-30 | 2021-06-18 | 北京海兰信数据科技股份有限公司 | 一种船舶声响信号的识别方法及装置 |
CN113203988A (zh) * | 2021-04-29 | 2021-08-03 | 北京达佳互联信息技术有限公司 | 声源定位方法及装置 |
CN115598594A (zh) * | 2022-10-13 | 2023-01-13 | 广州成至智能机器科技有限公司(Cn) | 无人机声源定位方法、装置、无人机及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090060222A1 (en) * | 2007-09-05 | 2009-03-05 | Samsung Electronics Co., Ltd. | Sound zoom method, medium, and apparatus |
CN104811886A (zh) * | 2015-04-10 | 2015-07-29 | 西安电子科技大学 | 基于相位差测量的麦克风阵列测向方法 |
CN104991573A (zh) * | 2015-06-25 | 2015-10-21 | 北京品创汇通科技有限公司 | 一种基于声源阵列的定位跟踪方法及其装置 |
-
2016
- 2016-11-18 CN CN201611028138.8A patent/CN106782596A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090060222A1 (en) * | 2007-09-05 | 2009-03-05 | Samsung Electronics Co., Ltd. | Sound zoom method, medium, and apparatus |
CN104811886A (zh) * | 2015-04-10 | 2015-07-29 | 西安电子科技大学 | 基于相位差测量的麦克风阵列测向方法 |
CN104991573A (zh) * | 2015-06-25 | 2015-10-21 | 北京品创汇通科技有限公司 | 一种基于声源阵列的定位跟踪方法及其装置 |
Non-Patent Citations (3)
Title |
---|
柯昆: "声源定位技术研究", 《万方学位论文》 * |
王伟: "基于时延估计的被动声定位研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
霍静茹: "声源定位系统的研究", 《万方学位论文》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108398675A (zh) * | 2018-03-01 | 2018-08-14 | 英华达(上海)科技有限公司 | 定位系统及定位方法 |
CN110875056B (zh) * | 2018-08-30 | 2024-04-02 | 阿里巴巴集团控股有限公司 | 语音转录设备、系统、方法、及电子设备 |
CN110875056A (zh) * | 2018-08-30 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 语音转录设备、系统、方法、及电子设备 |
CN109671439A (zh) * | 2018-12-19 | 2019-04-23 | 成都大学 | 一种智能化果林鸟害防治设备及其鸟类定位方法 |
CN109671439B (zh) * | 2018-12-19 | 2024-01-19 | 成都大学 | 一种智能化果林鸟害防治设备及其鸟类定位方法 |
CN109709518A (zh) * | 2018-12-25 | 2019-05-03 | 北京猎户星空科技有限公司 | 声源定位方法、装置、智能设备及存储介质 |
CN110300355A (zh) * | 2019-05-07 | 2019-10-01 | 广东工业大学 | 一种可跟随声源位置移动的智能话筒 |
CN110189764B (zh) * | 2019-05-29 | 2021-07-06 | 深圳壹秘科技有限公司 | 展示分离角色的系统、方法和录音设备 |
CN110189764A (zh) * | 2019-05-29 | 2019-08-30 | 深圳壹秘科技有限公司 | 展示分离角色的系统、方法和录音设备 |
CN110322893A (zh) * | 2019-05-29 | 2019-10-11 | 深圳市捷视飞通科技股份有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
CN110322893B (zh) * | 2019-05-29 | 2021-09-24 | 深圳市捷视飞通科技股份有限公司 | 语音数据处理方法、装置、计算机设备和存储介质 |
CN110631687A (zh) * | 2019-09-29 | 2019-12-31 | 苏州思必驰信息科技有限公司 | 无线振动采集器 |
CN110767247B (zh) * | 2019-10-29 | 2021-02-19 | 支付宝(杭州)信息技术有限公司 | 语音信号处理方法、声音采集装置和电子设备 |
CN110767247A (zh) * | 2019-10-29 | 2020-02-07 | 支付宝(杭州)信息技术有限公司 | 语音信号处理方法、声音采集装置和电子设备 |
CN112992176A (zh) * | 2020-09-30 | 2021-06-18 | 北京海兰信数据科技股份有限公司 | 一种船舶声响信号的识别方法及装置 |
CN112367473A (zh) * | 2021-01-13 | 2021-02-12 | 北京电信易通信息技术股份有限公司 | 一种基于声纹到达相位的可旋转摄像装置及其控制方法 |
CN113203988A (zh) * | 2021-04-29 | 2021-08-03 | 北京达佳互联信息技术有限公司 | 声源定位方法及装置 |
CN113203988B (zh) * | 2021-04-29 | 2023-11-21 | 北京达佳互联信息技术有限公司 | 声源定位方法及装置 |
CN115598594A (zh) * | 2022-10-13 | 2023-01-13 | 广州成至智能机器科技有限公司(Cn) | 无人机声源定位方法、装置、无人机及可读存储介质 |
CN115598594B (zh) * | 2022-10-13 | 2023-05-05 | 广州成至智能机器科技有限公司 | 无人机声源定位方法、装置、无人机及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106782596A (zh) | 一种基于麦克风阵列的声源定位跟随系统及方法 | |
Yegnanarayana et al. | Processing of reverberant speech for time-delay estimation | |
JP6109927B2 (ja) | 源信号分離のためのシステム及び方法 | |
EP2847764B1 (en) | Audio user interaction recognition and context refinement | |
EP2893532B1 (en) | Apparatus and method for providing an informed multichannel speech presence probability estimation | |
CN111445920B (zh) | 一种多声源的语音信号实时分离方法、装置和拾音器 | |
CN106031197B (zh) | 声学处理设备、声学处理方法及声学处理程序 | |
JP2017516131A (ja) | 源信号分離における改良された測定、エンティティ及びパラメータ推定、及び経路伝播効果測定及び軽減のための方法及びシステム | |
CN106328130A (zh) | 一种机器人语音寻向转动系统及方法 | |
CN115267671A (zh) | 一种分布式语音交互终端设备及其声源定位方法和装置 | |
CN106816156B (zh) | 一种音频质量增强的方法及装置 | |
CN110515034B (zh) | 一种声信号方位角测量系统及方法 | |
JP6048596B2 (ja) | 集音装置、集音装置の入力信号補正方法および移動機器情報システム | |
Kim | Hearing aid speech enhancement using phase difference-controlled dual-microphone generalized sidelobe canceller | |
US11765522B2 (en) | Speech-tracking listening device | |
CN113093106A (zh) | 一种声源定位方法及系统 | |
CN112863525B (zh) | 一种语音波达方向的估计方法、装置及电子设备 | |
Maruri et al. | Gcc-phat cross-correlation audio features for simultaneous sound event localization and detection (seld) on multiple rooms | |
Lu et al. | Separating voices from multiple sound sources using 2D microphone array | |
Rascon et al. | Lightweight multidirection-of-arrival estimation on a mobile robotic platform | |
Chen et al. | A time delay estimation method based on wavelet transform and speech envelope for distributed microphone arrays | |
Khodabakhsh | Sound Event Detection and Recognition in Autonomous Robot Navigation | |
Wolff et al. | Towards human-like production and binaural localization of speech sounds in humanoid robots | |
Zou et al. | An effective target speech enhancement with single acoustic vector sensor based on the speech time-frequency sparsity | |
Li et al. | Realization of Algorithm for Wideband Sound Source Localization in Video Monitoring System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170531 |
|
RJ01 | Rejection of invention patent application after publication |