CN112565119A - 一种基于时变混合信号盲分离的宽带doa估计方法 - Google Patents
一种基于时变混合信号盲分离的宽带doa估计方法 Download PDFInfo
- Publication number
- CN112565119A CN112565119A CN202011385852.9A CN202011385852A CN112565119A CN 112565119 A CN112565119 A CN 112565119A CN 202011385852 A CN202011385852 A CN 202011385852A CN 112565119 A CN112565119 A CN 112565119A
- Authority
- CN
- China
- Prior art keywords
- algorithm
- blind
- time
- blind separation
- separation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L25/00—Baseband systems
- H04L25/02—Details ; arrangements for supplying electrical power along data transmission lines
- H04L25/0202—Channel estimation
- H04L25/0238—Channel estimation using blind estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L25/00—Baseband systems
- H04L25/02—Details ; arrangements for supplying electrical power along data transmission lines
- H04L25/03—Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
- H04L25/03006—Arrangements for removing intersymbol interference
- H04L25/03012—Arrangements for removing intersymbol interference operating in the time domain
- H04L25/03019—Arrangements for removing intersymbol interference operating in the time domain adaptive, i.e. capable of adjustment during data reception
- H04L25/03082—Theoretical aspects of adaptive time domain methods
- H04L25/03089—Theory of blind algorithms, recursive or not
Landscapes
- Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种基于时变混合信号盲分离的宽带DOA估计方法,包括:获取声学相机系统的多声源混响数据;通过GPR‑UKF‑NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC‑PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法;通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计。本发明基于GPR‑UKF‑NMFD盲分离方法、变分贝叶斯盲分离方法和时变在线盲分离方法,GCC‑PHAT的DOA估计方法和MVDR波束形成方法,提出了一种适用于多声源DOA估计的声学相机系统的深度盲波束形成算法,将该算法移植到声学相机系统中,通过半实物仿真实验实现了实测多声源的时变盲分离、定位以及去混响。
Description
技术领域
本发明涉及信号盲分离处理技术领域,更具体的涉及一种基于时变混合信号盲分离的宽带DOA估计方法。
背景技术
声学相机在可视化声场和识别噪声源领域应用广泛,它是用于定位声源并对其进行表征的成像设备。该设备由若干个麦克风传感器和一个光学照相机组合而成,麦克风传感器不同的摆放形式产生了不同的阵列形状,其中,光学照相机用于拍摄实际声源环境场景,而麦克风阵列则用于接收入射声源。由于声音以已知的速度通过不同的介质传播,因此阵列中的每个麦克风会在不同的时刻以不同的声音强度感知“观察”区域中的每个声源。该设备的关键技术之一就是波束形成,而波束形成依赖于远场假设,其目的是通过麦克风阵列进行单次测量来确定各声源的波达方向(Directionofarrival,DOA)。宽带DOA估计的声学成像方法在设备无损监测方面有着广阔的应用前景,它可以预先估计出声源的大致波达方向,再利用波束形成进一步确定声源位置,最后实现声场可视化,由此可以及时地反映出设备的工况,进而评估机器设备的健康状况。因此,研究宽带信号源的DOA估计方法具有广泛的现实意义和重要的应用价值。
目前声学相机系统普遍还面临着无法满足声源在复杂混响环境下的实时定位问题,该问题解决的重难点在于对声源的波达方向估计。平面波的到达角或波束估计问题被认为是DOA估计问题或测向问题。DOA估计在声纳、雷达、电子监视、地震系统和医学诊断等领域发挥着巨大的作用。波束形成被认为是估计DOA最常用的方法。在过去的几十年中,DOA估计由于其应用的广泛性和确定最优估计量的复杂性而引起了研究人员的关注。由于实际应用中的信号大多为宽带信号,如噪声,语音源等,且宽带阵列信号因具有目标回波携带信息量大,目标检测、参量估计和目标特征提取更容易等特点,催生了DOA估计在有源探测系统中的广泛应用。因此,研究如何合理充分地利用宽带信息,获得更适合宽带信号的阵列高分辨测向算法,并去除噪声、混响的影响,也成为了各个领域国内外学者们的研究重点。
然而,若要将宽带多信号源DOA估计运用到声学相机系统中时,目前仍然有一些问题亟需解决。例如,在噪声混响环境下,未涉及混合系统为时变系统时的多个声源的定位及去混响;未研究适用于实时性要求高的应用场合的在线宽带多源DOA估计。
发明内容
本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法和系统,用以解决上述背景技术提出的问题。
本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法,包括:
获取声学相机系统的多声源混响数据;
通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法;
通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计。
进一步地,所述通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法,包括:
通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离;
通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离;
通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离;
通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计;
将DOA估计后数据代入MVDR波束形成算法,获得深度盲波束形成算法。
进一步地,所述通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离,包括:
采用高斯过程回归GPR理论建立动态系统模型,再结合无迹卡尔曼滤波UKF理论对观测信号进行实时在线滤波,形成GPR-UKF状态预估计算法;其过程如下:
1.1)建立高斯过程带加性噪声的非线性动态系统模型:
1.2)分别确定状态模型和量测模型中的训练数据量Df和Dh,输入与输出数据的维度为N与M,并初始化统计量μk-1和Pχ,k-1;
1.3)通过向量x的均值μ和方差Px构造Sigma点集{χi|i=0,1,…2n}
根据GPR-UKF状态预估计算法,结合非负矩阵分解解卷积NMFD理论,
形成GPR-UKF-NMFD盲分离算法;其过程如下:
2.3)随机初始化非负矩阵W和H,再将V,W,H代入如下非负矩阵分解更新规则中:
2.4)将上一步更新得到的Wnew和Hnew代入如下两式中,得到E:
2.5)令W=Wnew,H=Hnew,继续代入更新规则至E<E0时停止更新,E0为设定的阈值,此时非负矩阵分别为Wfin,Hfin;
进一步地,所述通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离,包括:
3.3)重复以下VBE-C步、VBE-A步,至下界收敛:
VBM步:用以下公式更新参数θ;
进一步地,所述通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离,包括:
4.1)初始化:初始化参数Θ(0),用前4帧的信号与混合系统数据来训练GPR模型参数,即初始核超参数Ω(0),随机初始化其余超参数Ψ(0),超参数Φ=Ω∪Ψ;
4.3)VBE步:估计后验分布q(A(l)),q(S(l)),q(P(l));
4.6)算出负变分自由能的变化量ΔF=|F(Θnew)-F(Θold)|;
4.7)若ΔF<tol,分离信号S(l)=E(S(l)),l++,返回步骤2),否则,返回步骤3);如此反复,直到得到最终的分离结果S1,2={S(l)}。
进一步地,所述通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计,包括:
各阵元处接收到观测信号为χj(t)=αjs(t-τj)+nj(t),j=1,2…n;其中,s(t)为源信号,τi为声源到第j个麦克风的时间延迟,αj(t)是声源到第j个麦克风的衰减幅度,ni(t)是加性噪声;
进一步地,所述将DOA估计后数据代入MVDR波束形成算法,获得深度盲波束形成算法,包括:
假设某一空间中期望信号的来波方向为φe,并存在K个以φk为入射角的干扰信号,其对应的导向矢量分别为a(φe)和a(φk),权向量与导向矢量之间需要满足约束条件wHα(φe)=1,wHa(φk)=0,此时的目标函数即为得输出功率最小同时信干噪比最大的最优权值
对时间对齐后的信号进行加权处理,最后将加权后的结果叠加,以使得阵列在期望方向上产生一个主瓣波束,而对其他方向上产生旁瓣波束;这样对整个空间进行波束扫描即估计出目标信号的位置。
本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法,与现有技术相比,其有益效果如下:
本发明基于GPR-UKF-NMFD盲分离方法、变分贝叶斯盲分离方法和时变在线盲分离方法,GCC-PHAT的DOA估计方法和MVDR波束形成方法,提出了一种适用于多声源DOA估计的声学相机系统的深度盲波束形成算法,将该算法移植到声学相机系统中,通过半实物仿真实验实现了实测多声源的时变盲分离、定位以及去混响。具体地,三种基于盲源分离方法,其中包括:两种基于时变盲分离的DOA估计方法,其可以解决声源的实时盲分离和去混响问题;一种深度盲源分离方法,基于该方法实现了多声源的时变盲分离、去混响以及DOA估计。
附图说明
图1为本发明实施例提供的深度盲波束形成算法结构图;
图2为本发明实施例提供的时变卷积混合的概率模型图;
图3为本发明实施例提供的OLGP-TVCBSS模型贝叶斯网络;
图4为本发明实施例提供的L型阵列示意图;
图5为本发明实施例提供的阵元1、阵元2上两路接收混合声源;
图6为本发明实施例提供的深度盲波束形成算法的分离结果;
图7为本发明实施例提供的相关系数Pxy随信噪比的变化关系图;
图8a为本发明实施例提供的两个实测声源的空间谱;
图8b为本发明实施例提供的两个实测声源的空间谱投影图;
图9a为本发明实施例提供的纯净语音语谱图;
图9b为本发明实施例提供的混响语音语谱图;
图10为本发明实施例提供的去混响后的语音信号语谱图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的宽带DOA估计方法对实际环境中存在的混响与噪声干扰考虑较少,且混合系统缺乏时变性。为此,本发明提出的深度盲源分离方法实现了多声源的时变盲分离、去混响以及DOA估计。本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法,该方法包括:
步骤1,获取声学相机系统的多声源混响数据。
步骤2,通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法形成深度盲波束形成算法。
步骤3,通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计。
其中,上述步骤2具体包括:
步骤21,通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离。
步骤22,通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离。
步骤23,通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离。
步骤24,通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计。
步骤25,将DOA估计后数据代入MVDR波束形成算法,获得深度盲波束形成算法。
对于上述步骤1~3、及步骤21~25的具体分析如下:
本发明所提出的深度盲波束形成算法就是基于图1中的结构来实现多声源的DOA估计。具体实现步骤大致可分为四大部分:多声源数据输入、盲源分离、DOA估计(时延估计+波束形成)以及空间谱输出。其中,盲源分离和DOA估计部分的具体内容大致如下:
(1)盲源分离
该部分采用三个隐藏层来描述,各层的激活函数(算法)依次为GPR-UKF-NMFD算法、变分贝叶斯EM(VBEM)算法和OLGP-TVCBSS算法。具体的数据传输过程为:将阵元n上的一路观测信号代入GPR-UKF-NMFD层中得到两个预信号S* 1和S* 2,再将其作为初始化信号代入至VBEM层中,通过计算得到了估计信号源S’1和S’1,最后,又将S’1和S’1作为输入数据传入OLGP-TVCBSS层中得到S^11,S^22。该过程可以简述为将上一层神经网络的输出作为下一层的输入,再通过该层的神经元上激活函数(盲分离算法)的处理得到新的输出。以此类推也可得到其他阵元上的估计声源S^n1,S^n2。
先运用高斯过程回归-无损卡尔曼滤波(Gaussianprocessregression-unscentedKalmanfilter,GPR-UKF)方法建立状态空间模型并完成状态预估计,再采用非负矩阵分解解卷积(Nonnegativematrixfactorizationdeconvolution,NMFD)完成了混合信号的盲分离和去混响。
使用高斯过程回归来建立动态系统模型,再结合UKF实现对观测信号的实时在线滤波,将这一滤波方法称为GPR-UKF方法,过程如下:
1)建立高斯过程带加性噪声的非线性动态系统模型
2)分别确定状态模型和量测模型中的训练数据量Df和Dn,输入与输出数据的维度N与M,并初始化统计量μk-1和Pχ,k-1。
3)通过向量x的均值μ和方差P来构造Sigma点集{χi|i=0,1,…2n}
综合上述的GPR-UKF状态预估计方法,提出了基于GPR-UKF-NMFD盲分离方法,步骤如下:
3)随机初始化非负矩阵W和H,再将V,W,H代入如下非负矩阵分解更新规则中:
4)将上一步更新得到的Wnew和Hnew代入如下两式中,得到E:
5)令W=Wnew,H=Hnew,继续代入更新规则至E<E0时停止更新,E0为设定的阈值,此时非负矩阵分别为Wfin,Hfin。
系统建模,参见图2,源信号:时频域中点(f,l)上的每个源信号sj,fl可视为Kj个隐变量成分ck,fl之和,即
若每个隐变量成分ck,fl服从均值为零,方差为wfkhkl的复高斯分布,则ck,fl~Nc(0,wfkhkl)。假设ck,fl在时频域上相互独立,因此可得源信号sj,fl的概率分布形式如下
使用NMF模型对Sj,fl的功率谱密度(powerspectraldensity,PSD)矩阵进行建模,即
混合矩阵模型:定义时频域中的观测信号xfl=[χ1,fl,…,χI,fl]T,零均值的复高斯噪声为bfl=[b1,fl,…,bI,fl]T,且bfl~Nc(0,vfII),混合矩阵Afl=[a1,fl,…,αJ,fl]T。因此,时频域的模型可以写成xfl=Aflsfl+bfl,式中,Afl为时变混合系统。对混合矩阵中的参数利用高斯过程进行建模:
基于VBEM盲分离方法步骤如下:
3)重复以下两步,至下界收敛:
VBM步:用以下公式更新参数θ。
其中,基于时变在线盲分离方法,使用高斯过程自回归模型学习混合矩阵和源信号时间结构,通过变分贝叶斯推理近似得到模型参数和超参数,并将超参数作为下一帧的先验进行传递,从而实现在线贝叶斯学习。
时变卷积混合的概率分布模型:当存在K个非平稳的宽带信号源时,N个接收阵元,且N≥K。若将某一时间段内接收到的观测信号分帧,则每一帧的模型可以表示为其中,s(l)(t)=[s1(t),s2(t),…,sK(t)]T为第I帧的源信号向量,D为卷积混合信道的阶数,χ(l)(t)=[x1(t),χ2(t),…χP(t)]T是第I帧的观测信号向量,ε(l)(t)为加性高斯白噪声向量,为N×K维的混合矩阵。
此时,简化后的瞬时混合模型形式为噪声服从 服从伽马分布,可表示为令此时混合模型为若用表示中的元素,第I帧的元素间的相关性关系用隐函数f(·)表示。源信号中的每个元素与它的前后时刻对应的值之间也是时间相关的,该相关性关系用隐函数g(·)表示;在不同帧之间,混合矩阵中的每个元素连续变化。若当前时刻的只与前p个时刻有关,则
综上,本次卷积混合模型中得到的模型参数为Θ(l)={s(l),A(l),N(l),P(l)},模型超参数为其中,关于混合矩阵的超参数分别为而为噪声的超参数。将上述的卷积混合模型称为在线高斯过程时变卷积盲源分离(OnlineGaussianProcessTimeVaryingConvolutionBlindSourceSeparation,OLGP-TVCBSS)模型,该模型完整的贝叶斯网络如图3所示。
基于OLGP-TVCBSS的方法步骤如下:
1)初始化:初始化参数Θ(0),用前4帧的信号与混合系统数据来训练GPR模型参数,即初始核超参数Ω(0),随机初始化其余超参数Ψ(0),超参数Φ=Ω∪Ψ。
3)VBE步(估计后验分布):
估计后验分布q(A(l)),q(S(l)),q(P(l))。
4)VBM步(估计模型参数):
6)算出负变分自由能的变化量ΔF=|F(Θnew)-F(Θold)|。
7)若ΔF<tol,分离信号S(l)=E(S(l)),I++,返回步骤2),否则,返回步骤3)。如此反复,直到得到最终的分离结果S1,2={S(l)}。
(2)DOA估计
关联阵元上分出的同一信号源,采用广义互相关-相位变换(GeneralizedCrossCorrelationPhaseTransformation,GCC-PHAT)算法估计时延及初始方向(方位角与俯仰角),最后运用最小方差无畸变响应(MinimumVarianceDistortionlessResponse,MVDR)波束形成算法得到信号源各自的空间谱。
其中,GCC-PHAT算法如下:
各阵元处接收到观测信号为χj(t)=αjs(t-τj)+nj(t),j=1,2…n。其中,s(t)为源信号,τj为声源到第j个麦克风的时间延迟,αj(t)是声源到第j个麦克风的衰减幅度,nj(t)是加性噪声。假设声源到两个麦克风的时间差为τ12,则麦克风接收到的语音信号的互相关函数为GCC-PHAT算法则在频域中利用PHAT加权函数来改进原互功率谱密度函数,改进后的为若以L型阵列为例(参见图4),假设其x轴时延为τ12,y轴时延为τ13,方位角θ与俯仰角可由下式计算:
MVDR波束形成算法如下:
假设某一空间中期望信号的来波方向为φe,并存在K个以φk为入射角的干扰信号,其对应的导向矢量分别为a(φe)和a(φk),权向量与导向矢量之间需要满足约束条件wHa(φe)=1,wHa(φk)=0,此时的目标函数即为得输出功率最小同时信干噪比最大的最优权值
对时间对齐后的信号进行加权处理,最后将加权后的结果叠加,以使得阵列在期望方向上产生一个主瓣波束,而对其他方向上产生旁瓣波束。这样对整个空间进行波束扫描即可估计出目标信号的位置。
该深度盲波束形成算法是一种无监督学习的方法,可以仅通过观测信号实现信号的有效分离,并进一步估计各声源的具体位置。
声学相机因其有声源定位、异音异响测试和轨迹跟踪定位等功能,使其成为了工业现场中不可缺少的监测设备,声成像技术是声学相机的关键技术之一,该技术的研究重点就是各声源的DOA估计方法但现有的宽带DOA估计方法对实际环境中存在的混响与噪声干扰考虑较少,且混合系统缺乏时变性。为此,目前声学相机系统普遍还面临着无法满足声源在复杂混响环境下的实时定位问题,该问题解决的重难点在于对声源的波达方向估计。为此,本发明提出了一种深度盲波束形成算法,为声学相机在复杂环境下的声源定位提供了一种方法。
实验分析
深度盲波束形成算法半实物仿真实验:麦克风阵列选型,声源数据及摆放位置:可以估计声源的二维波达方向的阵列类型有L阵,圆阵和平面阵等,其中,L型阵列由于结构简单、易于传统DOA算法移植、更高DOA估计精度与更小的克拉美罗界(CRB)等优点,使得基于L型阵列的二维测向研究受到学者的重视。因此,实验处理的声源信号是由小型九阵元(麦克风)L型阵列接收的语音信号。实验在西北工业大学自动化学院某实验室进行,实验室的空间大小(长*宽*高)为7.47*3.63*3.14(m3),实验采集的目标声源数据是从TIMIT标准语音库中选取的两路语音信号源,分别为男声信号S1和女声信号S2,两个语音源信号由两个扬声器同时播放,此外,还有室内的环境背景噪声存在,麦克风阵列上单个阵元接收到的语音信号即为带有混响和噪声的两路语音信号的混合数据。
目标声源的确定:待检测的目标声源具体为TIMIT标准语音库中的两个声源:男声信号S1(dr1/fakso/sa1.wav),女声信号S2(dr1/mdabo/sa2.wav)。信号采集模块中的采样率为48KHz。两路声源的波形如图5所示。对其接收信号执行深度盲波束形成方法,得到的两路分离信号如图6所示。
为了评价算法的分离性能,这里采用相关系数(Pxy)和信噪比(SNR)这两个指标。将深度盲波束形成算法同NB-ICA算法进行对比。源信号与两路分离信号间的相关系数Pxy随信噪比的变化关系如图7所示。由图7可以看出,深度盲波束形成算法和NB-ICA算法都呈现出了较好的分离效果,即当信噪比的增大时其对应的相关系数也随之增大。但深度盲波束形成算法整体的相关系数高于NB-ICA算法,故其分离效果更优。
以此类推,对L型阵列上的其他阵元上的接收信号,同样采用本章提到的深度盲波束形成算法进行盲分离,再对同一个估计信号运用GCC-PHAT和MVDR方法求出其DOA。则声源S1和S2的空间谱如图8a、8b所示。图中两个谱峰对应的位置角度即为两声源的估计方位角与俯仰角,将估计结果、标准声源位置信息以及角度误差整理,可得表1:
表1实测两声源的估计结果及误差
由表1可得,估计得到的声源S1、S2的位置分别为(12°,12°),(132°,15°),位置误差的角度范围为0.381°~5.267°。对空间谱中谱峰对应的俯仰角与方位角,通过坐标转换方法在光学照相机采集到的实验场景环境图找出其对应位置。观察图中的高亮点可看出其能较为准确的定位到两声源,实现了实测声源的DOA估计。
声源去混响的验证:使用语谱图来衡量提出深度盲波束形成算法的去混响能力。以阵元1上接收的男声信号S1为例,图9a为原始纯净语音信号语谱图,图9b为混响语音信号语谱图,语谱图横坐标为时间,单位为秒,纵坐标为频率,单位为Hz。图10去混响后的语音信号语谱图。
利用提出的深度盲波束形成算法对混响语音去混响处理,混响信号消减处理后的语音信号语谱图,如图9所示。从图中可以看出,输出语音语谱图相对于混响语音语谱图清晰度有明显的改善,证明了深度盲波束形成算法具有较好的去混响能力。所提出的深度盲波束形成算法,在混合系统为时变系统且对实时性要求较高的场所,可同时实现实测多声源的时变盲分离、定位以及去混响功能,具有广泛的应用。
以上公开的仅为本发明的几个具体实施例,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围内。
Claims (7)
1.一种基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,包括:
获取声学相机系统的多声源混响数据;
通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法;
通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计。
2.如权利要求1所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法,包括:
通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离;
通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离;
通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离;
通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计;
将DOA估计后数据代入MVDR波束形成算法,获得深度盲波束形成算法。
3.如权利要求2所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离,包括:
采用高斯过程回归GPR理论建立动态系统模型,再结合无迹卡尔曼滤波UKF理论对观测信号进行实时在线滤波,形成GPR-UKF状态预估计算法;其过程如下:
1.1)建立高斯过程带加性噪声的非线性动态系统模型:
1.2)分别确定状态模型和量测模型中的训练数据量Df和Dh,输入与输出数据的维度为N与M,并初始化统计量μk-1和Px,k-1;
1.3)通过向量x的均值μ和方差Px构造Sigma点集{χi|i=0,1,…2n}
根据GPR-UKF状态预估计算法,结合非负矩阵分解解卷积NMFD理论,
形成GPR-UKF-NMFD盲分离算法;其过程如下:
2.3)随机初始化非负矩阵W和H,再将V,W,H代入如下非负矩阵分解更新规则中:
2.4)将上一步更新得到的Wnew和Hnew代入如下两式中,得到E:
2.5)令W=Wnew,H=Hnew,继续代入更新规则至E<E0时停止更新,E0为设定的阈值,此时非负矩阵分别为Wfin,Hfin;
4.如权利要求3所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离,包括:
3.3)重复以下VBE-C步、VBE-A步,至下界收敛:
VBM步:用以下公式更新参数θ;
5.如权利要求4所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离,包括:
4.1)初始化:初始化参数Θ(0),用前4帧的信号与混合系统数据来训练GPR模型参数,即初始核超参数Ω(0),随机初始化其余超参数Ψ(0),超参数Φ=Ω∪Ψ;
4.3)VBE步:估计后验分布q(A(l)),q(S(l)),q(P(l));
4.4)VBM步:估计各参数的期望值E(S(l)),E(X(l)),E(P(l));
4.6)算出负变分自由能的变化量ΔF=|F(Θnew)-F(Θold)|;
4.7)若ΔF<tol,分离信号S(l)=E(S(l)),l++,返回步骤2),否则,返回步骤3);如此反复,直到得到最终的分离结果S1,2={S(l)}。
6.如权利要求5所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计,包括:
各阵元处接收到观测信号为χj(t)=αjs(t-τj)+nj(t),j=1,2...n;其中,s(t)为源信号,τj为声源到第j个麦克风的时间延迟,αj(t)是声源到第j个麦克风的衰减幅度,nj(t)是加性噪声;
7.如权利要求6所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计,包括:
假设某一空间中期望信号的来波方向为φe,并存在K个以φk为入射角的干扰信号,其对应的导向矢量分别为a(φe)和a(φk),权向量与导向矢量之间需要满足约束条件wHa(φe)=1,wHa(φk)=0,此时的目标函数即为得输出功率最小同时信干噪比最大的最优权值
对时间对齐后的信号进行加权处理,最后将加权后的结果叠加,以使得阵列在期望方向上产生一个主瓣波束,而对其他方向上产生旁瓣波束;这样对整个空间进行波束扫描即估计出目标信号的位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011385852.9A CN112565119B (zh) | 2020-11-30 | 2020-11-30 | 一种基于时变混合信号盲分离的宽带doa估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011385852.9A CN112565119B (zh) | 2020-11-30 | 2020-11-30 | 一种基于时变混合信号盲分离的宽带doa估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112565119A true CN112565119A (zh) | 2021-03-26 |
CN112565119B CN112565119B (zh) | 2022-09-27 |
Family
ID=75046989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011385852.9A Active CN112565119B (zh) | 2020-11-30 | 2020-11-30 | 一种基于时变混合信号盲分离的宽带doa估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112565119B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779667A (zh) * | 2021-08-19 | 2021-12-10 | 中铁第五勘察设计院集团有限公司 | 公共建筑广播系统设计方法和装置 |
CN114035157A (zh) * | 2021-10-29 | 2022-02-11 | 中国科学院声学研究所 | 一种基于期望最大化算法的分频带时延估计方法及其系统 |
CN114220453A (zh) * | 2022-01-12 | 2022-03-22 | 中国科学院声学研究所 | 基于频域卷积传递函数的多通道非负矩阵分解方法及系统 |
CN115935153A (zh) * | 2023-01-06 | 2023-04-07 | 香港理工大学深圳研究院 | 一种基于贝叶斯盲源分离技术的列车轴承故障诊断方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090012779A1 (en) * | 2007-03-05 | 2009-01-08 | Yohei Ikeda | Sound source separation apparatus and sound source separation method |
CN103295187A (zh) * | 2012-02-23 | 2013-09-11 | 北京师范大学 | 基于反馈机制的抗混合噪声的盲图像源分离方法 |
CN104995679A (zh) * | 2013-02-13 | 2015-10-21 | 美国亚德诺半导体公司 | 信号源分离 |
US9668066B1 (en) * | 2015-04-03 | 2017-05-30 | Cedar Audio Ltd. | Blind source separation systems |
US20180182410A1 (en) * | 2016-12-23 | 2018-06-28 | Synaptics Incorporated | Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments |
CN109238447A (zh) * | 2018-09-12 | 2019-01-18 | 西北工业大学 | 一种系绳振动信号的盲源分离方法 |
CN109243483A (zh) * | 2018-10-17 | 2019-01-18 | 西安交通大学 | 一种含噪频域卷积盲源分离方法 |
CN109994120A (zh) * | 2017-12-29 | 2019-07-09 | 福州瑞芯微电子股份有限公司 | 基于双麦的语音增强方法、系统、音箱及存储介质 |
-
2020
- 2020-11-30 CN CN202011385852.9A patent/CN112565119B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090012779A1 (en) * | 2007-03-05 | 2009-01-08 | Yohei Ikeda | Sound source separation apparatus and sound source separation method |
CN103295187A (zh) * | 2012-02-23 | 2013-09-11 | 北京师范大学 | 基于反馈机制的抗混合噪声的盲图像源分离方法 |
CN104995679A (zh) * | 2013-02-13 | 2015-10-21 | 美国亚德诺半导体公司 | 信号源分离 |
US9668066B1 (en) * | 2015-04-03 | 2017-05-30 | Cedar Audio Ltd. | Blind source separation systems |
US20180182410A1 (en) * | 2016-12-23 | 2018-06-28 | Synaptics Incorporated | Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments |
CN109994120A (zh) * | 2017-12-29 | 2019-07-09 | 福州瑞芯微电子股份有限公司 | 基于双麦的语音增强方法、系统、音箱及存储介质 |
CN109238447A (zh) * | 2018-09-12 | 2019-01-18 | 西北工业大学 | 一种系绳振动信号的盲源分离方法 |
CN109243483A (zh) * | 2018-10-17 | 2019-01-18 | 西安交通大学 | 一种含噪频域卷积盲源分离方法 |
Non-Patent Citations (3)
Title |
---|
PENGJU HE: "A General Nonstationary and Time-Varying Mixed Signal Blind Source Separation Method Based on Online Gaussian Process", 《INTERNATIONAL JOURNAL OF PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE》 * |
何鹏举: "基于WSN和盲源分离的多目标识别方法研究", 《物联网学报》 * |
孙世军等: "基于时间序列变分贝叶斯理论的信号盲源分离", 《仪器仪表学报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779667A (zh) * | 2021-08-19 | 2021-12-10 | 中铁第五勘察设计院集团有限公司 | 公共建筑广播系统设计方法和装置 |
CN113779667B (zh) * | 2021-08-19 | 2023-09-01 | 中铁第五勘察设计院集团有限公司 | 公共建筑广播系统设计方法和装置 |
CN114035157A (zh) * | 2021-10-29 | 2022-02-11 | 中国科学院声学研究所 | 一种基于期望最大化算法的分频带时延估计方法及其系统 |
CN114220453A (zh) * | 2022-01-12 | 2022-03-22 | 中国科学院声学研究所 | 基于频域卷积传递函数的多通道非负矩阵分解方法及系统 |
CN114220453B (zh) * | 2022-01-12 | 2022-08-16 | 中国科学院声学研究所 | 基于频域卷积传递函数的多通道非负矩阵分解方法及系统 |
CN115935153A (zh) * | 2023-01-06 | 2023-04-07 | 香港理工大学深圳研究院 | 一种基于贝叶斯盲源分离技术的列车轴承故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112565119B (zh) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112565119B (zh) | 一种基于时变混合信号盲分离的宽带doa估计方法 | |
CN111415676B (zh) | 一种基于分离矩阵初始化频点选择的盲源分离方法及系统 | |
Jarrett et al. | 3D source localization in the spherical harmonic domain using a pseudointensity vector | |
US7475014B2 (en) | Method and system for tracking signal sources with wrapped-phase hidden markov models | |
Zhong et al. | Particle filtering approaches for multiple acoustic source detection and 2-D direction of arrival estimation using a single acoustic vector sensor | |
Moore et al. | Direction of arrival estimation using pseudo-intensity vectors with direct-path dominance test | |
Zhong et al. | Particle filtering and posterior Cramér-Rao bound for 2-D direction of arrival tracking using an acoustic vector sensor | |
Leong et al. | Multiple target localization using wideband echo chirp signals | |
Pujol et al. | Source localization in reverberant rooms using Deep Learning and microphone arrays | |
CN111812581A (zh) | 基于原子范数的球面阵列声源波达方向估计方法 | |
Zhang et al. | Deep learning-based direction-of-arrival estimation for multiple speech sources using a small scale array | |
Imran et al. | A methodology for sound source localization and tracking: Development of 3D microphone array for near-field and far-field applications | |
Zhao et al. | Sound source localization based on srp-phat spatial spectrum and deep neural network | |
Salvati et al. | Two-microphone end-to-end speaker joint identification and localization via convolutional neural networks | |
Hu et al. | Decoupled direction-of-arrival estimations using relative harmonic coefficients | |
Nesta et al. | Enhanced multidimensional spatial functions for unambiguous localization of multiple sparse acoustic sources | |
SongGong et al. | Indoor multi-speaker localization based on Bayesian nonparametrics in the circular harmonic domain | |
Tengan et al. | Multi-Source Direction-of-Arrival Estimation using Group-Sparse Fitting of Steered Response Power Maps | |
Bianchi et al. | A plenacoustic approach to acoustic signal extraction | |
McCormack et al. | Sharpening of Angular Spectra Based on a Directional Re-assignment Approach for Ambisonic Sound-field Visualisation | |
CN101645701B (zh) | 一种基于滤波器组的时延估计方法及其系统 | |
Li et al. | Deep learning-based DOA estimation using CRNN for underwater acoustic arrays | |
Firoozabadi et al. | Combination of nested microphone array and subband processing for multiple simultaneous speaker localization | |
Sofer et al. | Robust relative transfer function identification on manifolds for speech enhancement | |
Sakhnini et al. | Direction of arrival estimation using the generalized SPICE criterion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |