CN111239680B - 一种基于差分阵列的波达方向估计方法 - Google Patents
一种基于差分阵列的波达方向估计方法 Download PDFInfo
- Publication number
- CN111239680B CN111239680B CN202010059620.8A CN202010059620A CN111239680B CN 111239680 B CN111239680 B CN 111239680B CN 202010059620 A CN202010059620 A CN 202010059620A CN 111239680 B CN111239680 B CN 111239680B
- Authority
- CN
- China
- Prior art keywords
- signal
- signals
- subspace
- frequency
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
- G01S3/8027—By vectorial composition of signals received by plural, differently-oriented transducers
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提出一种基于差分阵列的波达方向估计方法,在传统的声源识别定位系统中引入基于HMM的声源识别模块、信号源定位模块,从而在复杂环境下分离出信源信号和干扰与噪声信号,相比于传统定位算法,在保证定位精度的基础上有效降低了运算复杂度,并在多个信号源来波方向非常接近的情况下,利用加权信号子空间(WSS)算法提高了不同信号源之间的区分度。
Description
技术领域
本发明属于子空间类方法中的多重信号分类(MUSIC)算法研究,利用改进的波束空间法和加权信号子空间算法,实现了对入射信号到达方向的超分辨估计。相比经典MUSIC算法减小了运算复杂度,并且通过引入加权信号子空间(WSS)估计器提升了宽带波束空间MUSIC算法的性能。
背景技术
作为阵列信号处理领域的一个分支,麦克风阵列已广泛应用于电视会议、语音增强及识别等方面。声源定位是麦克风阵列进行空间滤波的重要基础,近年来发展迅速。基于阵列的定位算法可以分为超分辨算法和非超分辨算法。超分辨算法可以突破瑞利限,在一定条件下可以实现任意定位精度,具有极大的应用价值。
超分辨空间谱估计技术的MUSIC(Multiple Signal Classification)算法是经典的DOA算法之一,然而传统的MUSIC算法在信源为窄带远场非相干信号的假设下,才能得到很高的分辨力和估计精度。而宽带信号具有信息量大、抗干扰能力强、分辨率高等特点,因此在雷达、声纳以及通信等技术中有着普遍应用。这直接导致了传统MUSIC算法性能急剧下降甚至失效。
为了能将传统窄带MUSIC算法应用到麦克风阵列系统中,人们针对声源宽带、相干的特点,对MUSIC算法进行改进并提出了相干信号子空间算法(Coherent Signal-SubspaceMethod,CSM)。它是一种基于聚焦变换的超分辨子空间算法,其基本思想是通过构造聚焦矩阵,将不同频率点的阵列流型聚焦到选定的参考频率点,这样就将宽带的信号变为了窄带信号,然后利用MUSIC算法进行DOA估计。CSM算法不仅可以处理相干宽带信号,而且对于入射信号角度估计具有更高的分辨能力。
在对CSM算法进行实际操作时,该方法对传感器位置误差很敏感,并且随着传感器数量的增加,计算复杂度也随之增加。本技术发明将对阵元域的研究转向了对波束域的研究,形成了基于波束空间的DOA方法。相比之下,波束空间法具有诸多优点,不仅可以减小阵列协方差的维数,提高阵列信号的信噪比(SNR),还可以根据元素信号的加权总和来校准阵列误差。
在工程实际中,对于有限的采样数据,波束形成矩阵不满足酉矩阵的条件,即波束空间噪声之间在空间上是相关的,此时传统的宽带波束形成空间MUSIC算法进行宽带DOA估计精度有着较大的误差。我们在基于波束空间的DOA方法中,引入了一个加权信号子空间(WSS)估计器,在噪声子空间中引入特征值,通过宽带波束空间协方差矩阵的特征值和特征向量来表示噪声子空间,提升了宽带波束空间MUSIC算法的性能。
综上,本技术发明利用改进的波束空间法和加权信号子空间算法,实现了对宽带相干入射信号的到达方向估计,降低了运算复杂度,从而在有效提高了估计角度的分辨率的同时还提升了处理数据的效率。
发明内容
要解决的技术问题
为了精确识别并定位出复杂背景环境下的宽带信号源信息,本发明在传统的声源识别定位系统中引入基于HMM的声源识别模块、信号源定位模块,从而在复杂环境下分离出信源信号和干扰与噪声信号,相比于传统定位算法,在保证定位精度的基础上有效降低了运算复杂度,并在多个信号源来波方向非常接近的情况下,利用加权信号子空间(WSS)算法提高了不同信号源之间的区分度。
技术方案
一种基于差分阵列的波达方向估计方法,其特征在于步骤如下:
步骤1:麦克风阵列采集信号,设置采样频率高于采样信号的2倍最高分频,采样精度为1/1024;对麦克风阵列采集到的信号进行滤波、分帧、加窗预处理;
步骤2:对预处理后的信号进行时域特征、频域特征、梅尔倒谱系数的特征提取;
步骤3:利用采集到的时域特征对预处理后的信号进行端点检测:
ET=wET*max(E)
EL=wEL*max(E)
ZL=wZL*ZeroLevel
式中,ET表示高能量门限,wET表示高能量门限占能量最大采样值的比重,EL表示低能量门限,wEL表示低能量门限占能量最大采样值的比重,ZL表示过零率门限,是由平均过零率ZeroLevel乘以过零率门限比重wZL求得;
当提取到的时域特征的短时能量E和过零率zero满足:EL<E<ET且zero>ZL,则预处理后的信号在此帧为枪声信号的起始信号;
步骤4:HMM训练模型
当检测到枪声信号的起始信号,训练HMM模型:首先对HMM模型参数进行初始化,在训练阶段涉及到码字个数的确认问题,码字的数量要多于待分类信号分类后的数据类型;码字之间是相互独立互斥的,所以参数初始化中需要满足以下公式:
∑kbik=1
式中,bik表示系统状态为i时,码本取第k个码字的概率,然后利用Baum-welch算法进行参数重估,把重估后的参数和时域特征、频域特征、梅尔倒谱系数组成的特征向量代入Viterbi算法中计算模型输出概率,当概率变化小于阈值时得到最终的HMM模型;
步骤5:利用测试数据集输入训练好的HMM模型,输出概率最大的即为感兴趣声源信号;
步骤6:信号源定位模块
步骤6a:波束空间方法
设计多个恒定束宽波束形成器实现阵元空间向波束空间的转换,所述的多个恒定束宽波束形成器包括M个阵元和Q个波束形成器;将感兴趣声源信号分为J个子频带,利用最小二乘法求解获得各个子频带中心频率fj处的最佳权重向量wj:
式中,w0是与预选参考频率f0相关联的期望权向量,wj是与每个子频带中心频率fj相关联的期望权向量,a(θ,fj)为fj处的输出波束图矢量,θ为感兴趣声源信号的方位角;
利用wj在每个频点处构建了频率不变的波束图,使得恒定波束宽度波束形成器的相应波束图对于所有频率基本上是相同的;构造权值矩阵wH(fj),保证信号协方差矩阵的秩为K,去除了不同中心频率子频带信号之间的相关性,从而可以对各个子频带信号自相关矩阵进行线性求和,得到恒定束宽波束空间模型中信号子空间的协方差矩阵:
其中,A(f0,θ)为对应θ的方向矩阵,RSS(fj)为fj的自相关矩阵,σ为噪声系数,I为单位矩阵;
所得信号子空间的协方差矩阵为Q行Q列,又因选取的波束形成器个数Q<M,从而降低了协方差矩阵的维数,有效降低了运算复杂度;
步骤6b:加权子空间方法
设计一个加权信号子空间估计器,在噪声子空间中引入特征值,通过宽带波束空间协方差矩阵的特征值和特征向量来表示噪声子空间,把协方差矩阵RYY的所有特征值进行大小排序,相等的特征值对应的特征向量组成EN,得到加权信号子空间的空间谱:
Λ=diag[λK+1 λK+2 ... λQ]
其中,E为噪声子空间的特征向量矩阵,λK+1 λK+2 ... λQ为噪声信号子空间的特征值;
求取PWSS(θ)的最大值对应的θ为感兴趣的声源信号的方位角即波达方向。
有益效果
本发明基于完整的理论体系,针对非平稳信号,用高信噪比孤立枪声信号进行实验,相比于传统语音识别模型识别率较高,为了更真实模拟战场环境,加入不同噪声干扰,产生加性噪声叠加再进行识别,并给出了变换趋势和不同噪声背景下分辨力较高特征向量。
本发明通过对基于双边相关变换(TCT)的传统宽带MUSIC信号源定位技术进行改进,设计了多个恒定束宽波束形成器,降低了协方差矩阵的维数,进而使得运算复杂度降低,对阵元信号进行加权求和从而校准了阵列误差。此外,通过设计了一个加权信号子空间(WSS)估计器,在噪声子空间中引入特征值,使得在多个信号源来波方向非常接近的情况下,加权信号子空间算法能够提高不同信号源之间的区分度,从而提升了DOA估计的精度。
附图说明
图1整体流程框图
图2声源端点检测流程图
图3HMM训练阶段算法框图
图4信号源定位模块的流程图
图5基于波束空间的到达角估计图
图6识别模块和定位模块衔接整体流程图
图7麦克风采集到的数据波形
图8实际环境下方位角显示
图9端点检测结果图
图10感知域特征提取
图11不同特征的识别力
图12不同信噪比下分类器的误分辨率
图13参考频率处的方向图
图14恒定束宽波束形成器频率不变DFT波束图
图15波束空间算法的空间谱
图16WSS算法对邻近方向信号源定位分辨率的提升仿真图
图17枪声信号实测时域图
图18麦克风通道与DSP通道时域波形
图19枪声信号实测端点检测图
图20枪声信号实测频谱图
图21枪声信号实测时频图
图22 M16型号枪声DOA估计
图23DOA试验模型
具体实施方式
现结合实施例、附图对本发明作进一步描述:
装置实施例:在运用本技术对复杂背景环境下的宽带信号源进行识别、定位时,首先利用HMM算法对麦克风阵列采集到的信号进行识别判别。如果识别率超过阈值,说明此次采集到的信号中包含感兴趣的信源信号,则转入后续的信号源定位模块,采用改进的宽带波束空间定位算法来精确定位信源来波方向;如果识别率未超过阈值,说明此次采集到的信号中不含感兴趣的信源信号,则利用麦克风阵列从空间中重新采集新的信号,继续步骤一的处理流程。
如图1所示,本发明包括以下步骤:
步骤一:基于HMM的枪声识别模块。它的主要功能是实现在较复杂背景环境下的枪声或感兴趣声源检测,声源检测模型有很多种,大部分是针对语音等平稳信号,针对非平稳信号HMM模型具有较好的表征力。当检测到麦克风阵列采集的信号中包含感兴趣声源时,进行进一步的声源定位,否则继续采集下一声信号序列。
所述步骤一还包括如下子步骤:
步骤A:对麦克风阵列采集到的信号进行预处理。主要包括滤波、分帧、加窗。通过分析发现枪声的能量主要集中在500-2000hz、炮声的能量主要集中在80-200hz。因此,根据香浓采样定理,选取22.05khz的采样频率可以较为完整的接受到枪声和炮声信号。在对信号进行分帧的时候考虑到枪声信号的非平稳特性,分帧后的每帧信号不能过长,因此选取每256个采样点为一帧。这样每帧信号的持续时长约为11.6ms,而短时信号分析常用时常为10-15ms,因此这样进行分帧是合理的。在对信号进行采样时需要考虑采样频率和采样精度。汉明窗是改进的余弦窗,因为其表达式中有了加权系数,可以根据不同特性的声音进行调剂,使得旁瓣变小。表达式如下,式中N为每帧信号的长度,α根据不同信号源自行调节,取值范围0-1:
步骤B:特征提取。主要包括:时域特征、频域特征、梅尔倒谱系数。由于枪声炮声信号具有短时平稳性,所以在对其进行时域分析时采用短时分析,具体实现就是提取每一帧信号的时域特征。主要包括短时过零率、短时能量。常用的频域特征可以分为两大类频谱形状特征(Spectral shape feature)、频谱子带特征(Frequency subbandcharacteristics)。频谱形状特征主要包括频谱距、频谱斜度、频谱截止频率。频谱子带特征主要包括子带能量、子带能量熵等。枪声炮声的提取要考虑到计算的复杂度和实时性。所以需要对采集到的特征进行筛选。在常见的声信号系统中,很多信号的产生都是可以简化成一个信道和一个激励的组成,但是在传输的过程中,包括信道在内,很多信号产生了叠加,此时不同于线性的加法原理,由于信号的相关性,包括声音产生机理的前后顺序,使得各分量成为了乘性信号,显然这些系统没办法用线性系统的方法进行处理。在经过同态转化之后,就可以把这种非线性的乘性信号转变成加性信号。过零率计算公式如下:
式中,sgn()为符号函数,当其自变量小于零的时候其函数值取-1,反之取1
步骤C:端点检测。考虑到所处理的枪声信号具有较高信噪比,所以把能量作为第一级阈值参考值,过零率作为第二级参考值(检测流程如图2所示)。
ET=wET*max(E)
EL=wEL*max(E)
ZL=wZL*ZeroLevel
式中,ET表示高能量门限,wET表示高能量门限占能量最大采样值的比重,EL表示低能量门限,wEL表示低能量门限占能量最大采样值的比重,ZL表示过零率门限,是由平均过零率ZeroLevel乘以过零率门限比重wZL求得。
步骤D:HMM训练模型。流程如图3所示,在训练阶段涉及到码字个数的确认问题,理论上讲码字的数量要多于待分类信号分类后的数据类型。由于码字之间是相互独立互斥的所以满足以下公式:
∑kbjk=1
步骤E:利用测试数据集对感兴趣声源进行识别分类。根据全概率公式,在初始状态下,假设系统一开始状态为i,此时改状态出现的概率设为π=(π1,π2,…,πn),则:
附图9所示是端点检测结果。纵坐标为“1”时表示此时为含枪声声段,为“0”表示不含枪声声段。
附图10表示的是感知域特征提取。感知域特征的提取包括梅尔倒谱系数和对数倒谱系数,两者不同点在于所采用的滤波器,一个为对数滤波器,一个为梅尔滤波器。求取枪声信号的倒谱系数的过程,常见的有线性谱(Linear spectrum)和梅尔倒谱(Mel-frequency cepstral coefficient)。其中线性谱属于线性预测分析中常用的方法,梅尔倒谱属于同态分析。
特征集如表1所示:提取的特征向量不能完全都适用于枪声检测,因此需要做出选择。在特征集选取上的主要思想有基于特征间最大间隔进行特征选择,这样的好处是特征之间具有非常好的非相关性。这样做的目的式类似于二分法,找到能使枪声与背景声之间空间距离最大的特征向量。
表1较敏感特征向量集
附图11展示的为提取到的不同特征的识别力,红色为感知域特征为主导向量的识别率曲线,蓝色为时、频域特征为主导向量的识别率曲线。当特征向量维度大于12时,识别率达到94%以上。附图12展示的为不同信噪比下分类器的误分辨率,通过对比0-20dB条件下发现当特征向量维数大于9时,噪声功率对识别率的影响逐渐变小。
在这个处理模块中,有一个难点:
针对模拟信号,从时域转换到频域的方法是傅里叶变换,但是在对枪声信号进行预处理之后,将所有的特征都转换成了短时特征,因此在进行频域分析的时候,短时傅里叶变换(Short Time Fourier Transform)将每帧信号转换到频域内,现实中的声源信号不是复信号,所以在对声源信号进行STFT后只用后半部分频谱。
步骤二:信号源定位模块。利用基于波束空间(Beam Space,BS)的宽带信号源定位技术,对步骤一识别到的信号进行定位处理,设计了多个恒定束宽波束形成器,降低了协方差矩阵的维数,对阵元信号进行加权求和从而校准了阵列误差,并通过设计了一个加权信号子空间(WSS)估计器,在噪声子空间中引入特征值,提升了DOA估计的精度。信号源定位模块的流程图如图4所示。
所述步骤二还包括如下子步骤:
步骤A:波束空间方法。将具有M个传感器的阵列的阵元空间转换为具有Q个波束形成器(Q<M)的波束空间。选取的M×Q维DFT权矩阵波束形成器是由原M×M维协方差矩阵中的Q列组成。DFT波束形成权重矩阵选取为:
附图13所示的是参考频率点处的方向图)每个波束形成器在频率fj处的输出波束图矢量可以表示为:
式中,Wj是频率fj处设计的M×1复权向量,W0是与预选参考频率f0相关联的期望权向量。
在J个频点中的每个频点处构建了频率不变的波束图,如果合理地选择权重矩阵,则恒定波束宽度波束形成器的相应波束图对于所有频率基本上是相同的。即:
aB(θ,fj)=aB(θ,f0),j=1,2,...,J
通过求解以下最小二乘优化问题来获得在频率fj处使用的最佳权重向量:
求得J个子频带的权重矩阵,进而恨据下式求出子频带中心频率为fj时波束形成器的输出Y(fj):
Y(fj)=wH(fj)X(fj)
式中,Y(fj)=[Y1(fj),Y2(fj),...,YQ(fj)]T,wH(fj)为M行Q列的权值矩阵,M代表麦克风数量,Q表示波束形成器的数量。
其中每个元素的表达式如下所示:
式中,τm(θl)为第q个波束和第m个传感器之间的时延。
由上文可知,X(fj)=AS(fj)+N(fj),可得:
Y(fj)=wH(f0)A(f0,θ)S(fj)+wH(fj)N(fj)
信号子空间的协方差矩阵为:
RYY(fj)=wH(f0)A(f0,θ)RSS(fj)AH(f0,θ)w(f0)+σ2I
权值矩阵wH(fj)保证了信号协方差矩阵的秩为K,同时去除了不同子频带信号之间的相关性,所以可以对J个子频带信号自相关矩阵进行线性求和得到恒定束宽波束空间模型中信号子空间的协方差矩阵:
将阵元空间模型DOA估计转化为恒定束宽波束空间模型DOA估计,wH(f0)为Q行M列的权值矩阵,A(f0,θ)为M行K列矩阵,表示信号在参考频率处的阵列流形,RSS(fj)为M行M列矩阵,表示阵元空间模型下信号源信号的自相关矩阵。得到的波束空间模型中波束空间的协方差矩阵为Q行Q列,又因选取的波束形成器个数Q<M,因此通过引入恒定束宽波束空间模型有效降低了运算复杂度。
步骤B:加权信号子空间方法。设计了一个加权信号子空间(WSS)估计器,在噪声子空间中引入特征值,通过宽带波束空间协方差矩阵的特征值和特征向量来表示噪声子空间,提升了宽带波束空间MUSIC算法的性能。
在阵元域模型中,噪声子空间的协方差矩阵表示为RN(f)=E[N(f)NH(f)],则在恒定束宽波束空间模型中,噪声子空间协方差矩阵表示为:
RNN(fj)=E{wH(fj)N(fj)NH(fj)w(fj)}
在工程实际中,对于有限的采样数据,波束形成矩阵不是酉矩阵,而且它甚至可能无法转换为酉矩阵,从而无法保证恒定的波束宽度并防止高频信号分量的能量损失。在这种情况下,噪声子空间协方差矩阵就不是对角矩阵。平均的噪声子空间协方差矩阵为:
平均的噪声子空间协方差矩阵特征值不相等,其特征值分解后的每个分量均不相等。噪声子空间应同时用宽带波束空间协方差矩阵RYY的特征值和特征向量表示,而不仅仅由RYY的特征向量组成。RYY的特征值和特征向量分别为λq,vq,q=1,2,...,Q,其中较大特征值对应的特征向量是波束空间信号方向向量具有相同的子空间。其余特征向量是噪声子空间。同时考虑特征值和特征向量,噪声子空间为:
EN=[λK+1vK+1,λK+2vK+2,...,λQvQ]
这样就满足以下的正交性:
[wH(f0,)a(f0,θi)]Hλjvj=0
式中,i=1,2,...,K;j=K+1,K+2,...Q。
在这一正交性的基础上,构成加权信号子空间的空间谱:
式中,Λ=diag[λK+1 λK+2 ... λQ],其为以噪声子空间特征向量对应的特征值为对角元素的对角阵,n为权重因子(n=Q-K)。
因此可知,在噪声子空间中引入特征值与在空间谱中使用以特征值为权重的加权噪声特征向量的作用是完全相同的。加权噪声特征向量更加准确地表示了它们对信号子空间空间谱的影响,提升了宽带波束空间DOA估计的精确度。
附图14所示的是为恒定束宽波束形成器频率不变DFT波束图。仿真条件为采用阵元数为8的均匀线性麦克风阵列,阵元间距为宽带信号中心频率对应的波长的一半。假设有三个相干宽带信号源分别从0度、40度和-40度入射到阵列上,三个信号源的中心频率均为1000Hz。采样快拍数为256。
可以观察到,在主波束宽度角度范围内,对于在信号源频率范围内不同的频率,其波束图均与参考频率处的波束图相同,即频率不变性得到验证。
表2所示的是波束空间、TCT两种算法的运算时间统计表。
表2两种算法的运算时间统计表
可以看出,使用波束空间法,显著地减少了运算时间,从而说明降低了计算复杂度。
附图15所示的是波束空间算法的空间谱。仿真条件:采用阵元数为8的均匀线性麦克风阵列,阵元间距为宽带信号中心频率对应的波长的一半。假设有三个相干宽带信号源分别从-40度、0度和30度入射到阵列上,三个信号源的中心频率均为100Hz,带宽均为40Hz。采样快拍数为128。
可以看出,波束空间算法能够在给定的信噪比条件下实现对多个相干宽带信号源的精确定位。而且该算法与TCT算法相比,信号源方向与其他方向之间的区分度得到显著提高,两者之间的空间谱差由TCT算法的不足70dB大大提升至250dB以上。
附图16所示的是WSS算法对邻近方向信号源定位分辨率的提升效果图。仿真条件为采用阵元数为8的均匀线性麦克风阵列,阵元间距为宽带信号中心频率对应的波长的一半。假设有三个相干宽带信号源分别从-8度、0度8度入射到阵列上,采样快拍数为512,各信号信噪比均设定为20dB。
可以看出,在多个信号源来波方向非常接近的情况下,加权信号子空间算法能够提高不同信号源之间的区分度。
步骤三:声源定位系统的实际实现。主要通过搭建声源定位系统完成对声源信号的侦收测试以及波达方向估计实验,通过实验验证改进的MUSIC定位算法的可行性,证明声源定位系统的稳定性与可靠性。
所述步骤三还包括如下子步骤:
步骤A:识别环节和定位环节之间衔接的设计。在不把非枪声信号错误的判断为枪声信号的同时,尽可能的不漏判枪声信号。将ξ设置为判定标识,其取值为0或者1,定义识别结果,ξ=1表示识别结果为枪声,ξ=0表示识别的结果不是枪声。当接收到的信号的识别结果识别率超过阈值时(阈值设定为80%),判定是枪声,才进入下一步的方位角估计,否则就将信号舍弃。
附图6所示的为算法流程框图,麦克风阵列接收到信号,经预处理后进行特征提取,并使用HMM分类器识别,若识别率超过80%,则说明是期望信号,随即进行声源方位角估计,如若没有识别率超过80%,则继续判断下一序列信号。
步骤B:声源特征提取。使用M16型号枪声的wav音频文件,通过音响进行播放,验证所设计声源定位系统对战场声信号的侦收效果。
附图7、附图18和附图20所示的分别为麦克风采集到的数据波形,DSP通道数据波形,M16枪声信号的频谱图。可以发现,M16枪声信号能量主要分布在100Hz-1000Hz,所使用的声源定位系统可以有效的对枪声信号进行采集,并可以很好的抑制白噪声放大的影响。
步骤C:声源信号识别。使用步骤B中采集到的枪声信号进行声信号识别实验,在提取阵列接收信号的特征参数后,利用步骤一中训练好的HMM分类器对信号进行识别。
附图17,附图20,附图19和附图21所示的分别为枪声信号实测时域图,枪声信号实测频谱图,端点检测图和时频图。信号长度约为21000个采样点,帧长为256,帧位移为128,经过端点检测各自划分出163帧信号,对特征参数进行提取后,通过训练好的HMM分类器对信号进行识别,其中前第95帧至第102帧的识别结果如表3所示。
表3实验数据统计表
识别结果中ξ=1的帧数为44,即在163帧的接收信号中,正确识别出了44帧,而M16枪声原始信号经端点检测可知包含感兴趣枪声信号共53帧,故除去无信号帧,计算可知正确识别率大约为83%。
步骤D:现实环境测试。利用搭建好的声源定位系统进行实际环境下的声信号定位实验,验证算法的有效性。
附图23和图8所示的为实验模型和方位角显示图,可以看出,通过所搭建声源定位系统,本文提出的基于恒定宽度波束空间的加权子空间空间谱估计算法可以完成对目标声源的有效定位,在环境噪声较小的情况下,采集到的信号质量较好,空间谱峰值明显,利用算法可以清晰地看到估计出的声源的方位。方位角0°、30°、45°、60°、90°、120°、135°、150°、180°时的实验结果如表4所示。
表4实验数据统计表
可以发现,在存在噪声的实际环境下,该声源定位系统的方位角估计值结果存在一些误差。这与之前的理论仿真的定位结果有较大的差异。因此对声源定位系统的每个环节进行研究,分析实际实验中产生误差的原因。
上述分析证明了基于隐马尔可夫的声源分类模型检测具有比GMM法、支持向量机法更好的分类效果,实现了复杂噪声环境下对非平稳声源进行存分类,以便有效的分辨出采集到的信号中是否含有感兴趣信源,从而继续进行定位。
上述分析也证明了改进的宽带波束空间定位算法能够精确定位出信源信号来波方向,与传统算法相比,设计了多个恒定束宽波束形成器,降低了协方差矩阵的维数,从而降低了运算复杂度;并通过设计了一个加权信号子空间(WSS)估计器,在噪声子空间中引入特征值,提高了来波方向相近的不同信号源之间的区分度。
综上,通过在传统的声源识别定位系统中引入基于HMM的声源识别模块、信号源定位模块,可以有效降低运算复杂度,并在多个信号源来波方向非常接近的情况下,利用加权信号子空间(WSS)算法提高了不同信号源之间的区分度。
Claims (1)
1.一种基于差分阵列的波达方向估计方法,其特征在于步骤如下:
步骤1:麦克风阵列采集信号,设置采样频率高于采样信号的2倍最高分频,采样精度为1/1024;对麦克风阵列采集到的信号进行滤波、分帧、加窗预处理;
步骤2:对预处理后的信号进行时域特征、频域特征、梅尔倒谱系数的特征提取;
步骤3:利用采集到的时域特征对预处理后的信号进行端点检测:
ET=wET*max(E)
EL=wEL*max(E)
ZL=wZL*ZeroLevel
式中,ET表示高能量门限,wET表示高能量门限占能量最大采样值的比重,EL表示低能量门限,wEL表示低能量门限占能量最大采样值的比重,ZL表示过零率门限,是由平均过零率ZeroLevel乘以过零率门限比重wZL求得;
当提取到的时域特征的短时能量E和过零率zero满足:EL<E<ET且zero>ZL,则预处理后的信号在此帧为枪声信号的起始信号;
步骤4:HMM训练模型
当检测到枪声信号的起始信号,训练HMM模型:首先对HMM模型参数进行初始化,在训练阶段涉及到码字个数的确认问题,码字的数量要多于待分类信号分类后的数据类型;码字之间是相互独立互斥的,所以参数初始化中需要满足以下公式:
∑kbik=1
式中,bik表示系统状态为i时,码本取第k个码字的概率,然后利用Baum-welch算法进行参数重估,把重估后的参数和时域特征、频域特征、梅尔倒谱系数组成的特征向量代入Viterbi算法中计算模型输出概率,当概率变化小于阈值时得到最终的HMM模型;
步骤5:利用测试数据集输入训练好的HMM模型,输出概率最大的即为感兴趣声源信号;
步骤6:信号源定位方法
步骤6a:波束空间方法
设计多个恒定束宽波束形成器实现阵元空间向波束空间的转换,所述的多个恒定束宽波束形成器包括M个阵元和Q个波束形成器;将感兴趣声源信号分为J个子频带,利用最小二乘法求解获得各个子频带中心频率fj处的最佳权重向量wj:
式中,w0是与预选参考频率f0相关联的期望权向量,wj是与每个子频带中心频率fj相关联的期望权向量,a(θ,fj)为fj处的输出波束图矢量,θ为感兴趣声源信号的方位角;
利用wj在每个频点处构建了频率不变的波束图,使得恒定波束宽度波束形成器的相应波束图对于所有频率基本上是相同的;构造权值矩阵wH(fj),保证信号协方差矩阵的秩为K,去除了不同中心频率子频带信号之间的相关性,从而可以对各个子频带信号自相关矩阵进行线性求和,得到恒定束宽波束空间模型中信号子空间的协方差矩阵:
其中,A(f0,θ)为对应θ的方向矩阵,RSS(fj)为fj的自相关矩阵,σ为噪声系数,I为单位矩阵;
所得信号子空间的协方差矩阵为Q行Q列,又因选取的波束形成器个数Q<M,从而降低了协方差矩阵的维数,有效降低了运算复杂度;
步骤6b:加权子空间方法
设计一个加权信号子空间估计器,在噪声子空间中引入特征值,通过宽带波束空间协方差矩阵的特征值和特征向量来表示噪声子空间,把协方差矩阵RYY的所有特征值进行大小排序,相等的特征值对应的特征向量组成EN,得到加权信号子空间的空间谱:
Λ=diag[λK+1 λK+2 … λQ]
其中,EN为噪声子空间的特征向量矩阵,λK+1 λK+2 … λQ为噪声信号子空间的特征值;
求取PWSS(θ)的最大值对应的θ为感兴趣的声源信号的方位角即波达方向。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010059620.8A CN111239680B (zh) | 2020-01-19 | 2020-01-19 | 一种基于差分阵列的波达方向估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010059620.8A CN111239680B (zh) | 2020-01-19 | 2020-01-19 | 一种基于差分阵列的波达方向估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111239680A CN111239680A (zh) | 2020-06-05 |
CN111239680B true CN111239680B (zh) | 2022-09-16 |
Family
ID=70868653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010059620.8A Active CN111239680B (zh) | 2020-01-19 | 2020-01-19 | 一种基于差分阵列的波达方向估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111239680B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111968671B (zh) * | 2020-08-24 | 2024-03-01 | 中国电子科技集团公司第三研究所 | 基于多维特征空间的低空声目标综合识别方法及装置 |
CN115047443A (zh) * | 2021-03-09 | 2022-09-13 | 深圳市万普拉斯科技有限公司 | 毫米波雷达的目标检测方法、装置和手持终端 |
CN113188797B (zh) * | 2021-04-16 | 2022-11-15 | 上海工程技术大学 | 一种基于传声器阵列的轴承故障诊断方法 |
CN113286363B (zh) * | 2021-07-23 | 2021-10-01 | 网络通信与安全紫金山实验室 | 无线定位参数估计方法、装置、计算机设备及存储介质 |
CN114578289B (zh) * | 2022-04-26 | 2022-09-27 | 浙江大学湖州研究院 | 一种高分辨率谱估计声阵列成像方法 |
CN114994595A (zh) * | 2022-08-03 | 2022-09-02 | 四川太赫兹通信有限公司 | 波达方向获取方法、太赫兹相控阵波束控制方法和系统 |
CN115497500B (zh) * | 2022-11-14 | 2023-03-24 | 北京探境科技有限公司 | 音频处理方法、装置、存储介质及智能眼镜 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106504763A (zh) * | 2015-12-22 | 2017-03-15 | 电子科技大学 | 基于盲源分离与谱减法的麦克风阵列多目标语音增强方法 |
CN109597022A (zh) * | 2018-11-30 | 2019-04-09 | 腾讯科技(深圳)有限公司 | 声源方位角运算、定位目标音频的方法、装置和设备 |
CN109683126A (zh) * | 2019-01-14 | 2019-04-26 | 极目光(深圳)科技有限公司 | 波达角测量方法、信号处理设备及存储介质 |
CN110488223A (zh) * | 2019-07-05 | 2019-11-22 | 东北电力大学 | 一种声源定位方法 |
-
2020
- 2020-01-19 CN CN202010059620.8A patent/CN111239680B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106504763A (zh) * | 2015-12-22 | 2017-03-15 | 电子科技大学 | 基于盲源分离与谱减法的麦克风阵列多目标语音增强方法 |
CN109597022A (zh) * | 2018-11-30 | 2019-04-09 | 腾讯科技(深圳)有限公司 | 声源方位角运算、定位目标音频的方法、装置和设备 |
CN109683126A (zh) * | 2019-01-14 | 2019-04-26 | 极目光(深圳)科技有限公司 | 波达角测量方法、信号处理设备及存储介质 |
CN110488223A (zh) * | 2019-07-05 | 2019-11-22 | 东北电力大学 | 一种声源定位方法 |
Non-Patent Citations (1)
Title |
---|
一种恒定束宽波束域加权子空间谱估计新方法;冯西安 等;《西北工业大学学报》;20050228;第23卷(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111239680A (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111239680B (zh) | 一种基于差分阵列的波达方向估计方法 | |
CN109830245B (zh) | 一种基于波束成形的多说话者语音分离方法及系统 | |
Gu et al. | Neural Spatial Filter: Target Speaker Speech Separation Assisted with Directional Information. | |
US10901063B2 (en) | Localization algorithm for sound sources with known statistics | |
US5737485A (en) | Method and apparatus including microphone arrays and neural networks for speech/speaker recognition systems | |
CN106023996B (zh) | 基于十字形声阵列宽带波束形成的声识别方法 | |
CN109490822B (zh) | 基于ResNet的语音DOA估计方法 | |
CN110907893B (zh) | 一种适用于球麦克风阵列的超分辨声源定位方法 | |
Xiao et al. | Beamforming networks using spatial covariance features for far-field speech recognition | |
Salvati et al. | Two-microphone end-to-end speaker joint identification and localization via convolutional neural networks | |
Zhao et al. | Sound source localization based on srp-phat spatial spectrum and deep neural network | |
Zheng et al. | Spectral mask estimation using deep neural networks for inter-sensor data ratio model based robust DOA estimation | |
Salvati et al. | End-to-End Speaker Identification in Noisy and Reverberant Environments Using Raw Waveform Convolutional Neural Networks. | |
Huang et al. | A regression approach to speech source localization exploiting deep neural network | |
CN111968671B (zh) | 基于多维特征空间的低空声目标综合识别方法及装置 | |
CN106526541B (zh) | 基于分布矩阵决策的声音定位方法 | |
CN115713943A (zh) | 基于复空间角中心高斯混合聚类模型和双向长短时记忆网络的波束成形语音分离方法 | |
Rudzyn et al. | Real time robot audition system incorporating both 3D sound source localisation and voice characterisation | |
Chen et al. | Multi-channel end-to-end neural network for speech enhancement, source localization, and voice activity detection | |
Bai et al. | Acoustic source localization and deconvolution-based separation | |
McCowan et al. | Multi-channel sub-band speech recognition | |
Thakallapalli et al. | Spectral features derived from single frequency filter for multispeaker localization | |
Chen et al. | LocSelect: Target Speaker Localization with an Auditory Selective Hearing Mechanism | |
Maka | Audio content analysis based on density of peaks in amplitude envelope | |
Mohankrishnan et al. | A composite scheme for text-independent speaker recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |