CN112565119A - 一种基于时变混合信号盲分离的宽带doa估计方法 - Google Patents

一种基于时变混合信号盲分离的宽带doa估计方法 Download PDF

Info

Publication number
CN112565119A
CN112565119A CN202011385852.9A CN202011385852A CN112565119A CN 112565119 A CN112565119 A CN 112565119A CN 202011385852 A CN202011385852 A CN 202011385852A CN 112565119 A CN112565119 A CN 112565119A
Authority
CN
China
Prior art keywords
algorithm
blind
time
blind separation
separation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011385852.9A
Other languages
English (en)
Other versions
CN112565119B (zh
Inventor
何鹏举
朱瑞霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202011385852.9A priority Critical patent/CN112565119B/zh
Publication of CN112565119A publication Critical patent/CN112565119A/zh
Application granted granted Critical
Publication of CN112565119B publication Critical patent/CN112565119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/0202Channel estimation
    • H04L25/0238Channel estimation using blind estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/03Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
    • H04L25/03006Arrangements for removing intersymbol interference
    • H04L25/03012Arrangements for removing intersymbol interference operating in the time domain
    • H04L25/03019Arrangements for removing intersymbol interference operating in the time domain adaptive, i.e. capable of adjustment during data reception
    • H04L25/03082Theoretical aspects of adaptive time domain methods
    • H04L25/03089Theory of blind algorithms, recursive or not

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种基于时变混合信号盲分离的宽带DOA估计方法,包括:获取声学相机系统的多声源混响数据;通过GPR‑UKF‑NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC‑PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法;通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计。本发明基于GPR‑UKF‑NMFD盲分离方法、变分贝叶斯盲分离方法和时变在线盲分离方法,GCC‑PHAT的DOA估计方法和MVDR波束形成方法,提出了一种适用于多声源DOA估计的声学相机系统的深度盲波束形成算法,将该算法移植到声学相机系统中,通过半实物仿真实验实现了实测多声源的时变盲分离、定位以及去混响。

Description

一种基于时变混合信号盲分离的宽带DOA估计方法
技术领域
本发明涉及信号盲分离处理技术领域,更具体的涉及一种基于时变混合信号盲分离的宽带DOA估计方法。
背景技术
声学相机在可视化声场和识别噪声源领域应用广泛,它是用于定位声源并对其进行表征的成像设备。该设备由若干个麦克风传感器和一个光学照相机组合而成,麦克风传感器不同的摆放形式产生了不同的阵列形状,其中,光学照相机用于拍摄实际声源环境场景,而麦克风阵列则用于接收入射声源。由于声音以已知的速度通过不同的介质传播,因此阵列中的每个麦克风会在不同的时刻以不同的声音强度感知“观察”区域中的每个声源。该设备的关键技术之一就是波束形成,而波束形成依赖于远场假设,其目的是通过麦克风阵列进行单次测量来确定各声源的波达方向(Directionofarrival,DOA)。宽带DOA估计的声学成像方法在设备无损监测方面有着广阔的应用前景,它可以预先估计出声源的大致波达方向,再利用波束形成进一步确定声源位置,最后实现声场可视化,由此可以及时地反映出设备的工况,进而评估机器设备的健康状况。因此,研究宽带信号源的DOA估计方法具有广泛的现实意义和重要的应用价值。
目前声学相机系统普遍还面临着无法满足声源在复杂混响环境下的实时定位问题,该问题解决的重难点在于对声源的波达方向估计。平面波的到达角或波束估计问题被认为是DOA估计问题或测向问题。DOA估计在声纳、雷达、电子监视、地震系统和医学诊断等领域发挥着巨大的作用。波束形成被认为是估计DOA最常用的方法。在过去的几十年中,DOA估计由于其应用的广泛性和确定最优估计量的复杂性而引起了研究人员的关注。由于实际应用中的信号大多为宽带信号,如噪声,语音源等,且宽带阵列信号因具有目标回波携带信息量大,目标检测、参量估计和目标特征提取更容易等特点,催生了DOA估计在有源探测系统中的广泛应用。因此,研究如何合理充分地利用宽带信息,获得更适合宽带信号的阵列高分辨测向算法,并去除噪声、混响的影响,也成为了各个领域国内外学者们的研究重点。
然而,若要将宽带多信号源DOA估计运用到声学相机系统中时,目前仍然有一些问题亟需解决。例如,在噪声混响环境下,未涉及混合系统为时变系统时的多个声源的定位及去混响;未研究适用于实时性要求高的应用场合的在线宽带多源DOA估计。
发明内容
本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法和系统,用以解决上述背景技术提出的问题。
本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法,包括:
获取声学相机系统的多声源混响数据;
通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法;
通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计。
进一步地,所述通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法,包括:
通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离;
通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离;
通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离;
通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计;
将DOA估计后数据代入MVDR波束形成算法,获得深度盲波束形成算法。
进一步地,所述通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离,包括:
采用高斯过程回归GPR理论建立动态系统模型,再结合无迹卡尔曼滤波UKF理论对观测信号进行实时在线滤波,形成GPR-UKF状态预估计算法;其过程如下:
1.1)建立高斯过程带加性噪声的非线性动态系统模型:
Figure BDA0002808603670000031
式中,xk和yk分别为k时刻的状态变量和量测变量,wk为量测噪声,且
Figure BDA0002808603670000041
1.2)分别确定状态模型和量测模型中的训练数据量Df和Dh,输入与输出数据的维度为N与M,并初始化统计量μk-1和Pχ,k-1;
1.3)通过向量x的均值μ和方差Px构造Sigma点集{χi|i=0,1,…2n}
Figure BDA0002808603670000042
式中,k为尺度参数,是调节精度的参数,该组采样点表示x服从的高斯分布,并将该点集带入状态方程中,得到状点集
Figure BDA0002808603670000043
1.4)计算均值
Figure BDA0002808603670000044
1.5)计算方差
Figure BDA0002808603670000045
1.6)将
Figure BDA0002808603670000046
Figure BDA0002808603670000047
代入1.3)中公式,重新得到一组Sigma点集
Figure BDA0002808603670000048
并将其代入量测方程中,得观测量的点集
Figure BDA0002808603670000049
1.7)计算观测量的均值
Figure BDA0002808603670000051
1.8)计算观测量的方差
Figure BDA0002808603670000052
1.9)计算互协方差
Figure BDA0002808603670000053
1.10)根据卡尔曼增益
Figure BDA0002808603670000054
更新状态,并将其作为新一轮的统计量;
根据GPR-UKF状态预估计算法,结合非负矩阵分解解卷积NMFD理论,
形成GPR-UKF-NMFD盲分离算法;其过程如下:
2.1)根据GPR-UKF状态预估计算法,对观测信号χi(t)通过GPR理论建立状态空间模型,然后通过UKF理论估计状态变量
Figure BDA0002808603670000055
2.2)对
Figure BDA0002808603670000056
进行短时傅里叶变换得到J×P维的复数矩阵V0,并计算V0的功率谱值v′,具体为
Figure BDA0002808603670000057
Figure BDA0002808603670000058
2.3)随机初始化非负矩阵W和H,再将V,W,H代入如下非负矩阵分解更新规则中:
Figure BDA0002808603670000061
2.4)将上一步更新得到的Wnew和Hnew代入如下两式中,得到E:
Figure BDA0002808603670000062
2.5)令W=Wnew,H=Hnew,继续代入更新规则至E<E0时停止更新,E0为设定的阈值,此时非负矩阵分别为Wfin,Hfin
2.6)令
Figure BDA0002808603670000063
利用
Figure BDA0002808603670000064
将其转化为复数矩阵
Figure BDA0002808603670000065
2.7)对
Figure BDA0002808603670000066
进行短时傅里叶逆变换,得到分离信号
Figure BDA0002808603670000067
此时的分离信号为去混响后的信号。
进一步地,所述通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离,包括:
3.1)对第m(m=1,…,M)个阵元上的观测信号
Figure BDA0002808603670000068
进行短时傅里叶变换,并得到第一帧的
Figure BDA0002808603670000069
3.2)初始化二值矩阵G、参数θ以及混合系统后验统计量
Figure BDA0002808603670000071
Figure BDA0002808603670000072
3.3)重复以下VBE-C步、VBE-A步,至下界收敛:
VBE-C步:用下式计算
Figure BDA0002808603670000073
Figure BDA0002808603670000074
其中,Ufl∈CJ×J是J×J维的矩阵,其第jrth个元素
Figure BDA0002808603670000075
Figure BDA0002808603670000076
Figure BDA0002808603670000077
的第jrth个元素,
Figure BDA0002808603670000078
并通过下式估计出
Figure BDA0002808603670000079
Figure BDA00028086036700000710
VBE-A步:用下式计算
Figure BDA00028086036700000711
再使用卡尔曼平滑得到参数
Figure BDA00028086036700000712
Figure BDA00028086036700000713
VBM步:用以下公式更新参数θ;
Figure BDA00028086036700000714
Figure BDA0002808603670000081
Figure BDA0002808603670000082
Figure BDA0002808603670000083
其中,
Figure BDA0002808603670000084
被定义为
Figure BDA0002808603670000085
3.4)返回源信号的估计值
Figure BDA0002808603670000086
3.5)m++,继续执行3.1)~3.5)步,直到m=M,并返回
Figure BDA0002808603670000087
得到分离信号。
进一步地,所述通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离,包括:
4.1)初始化:初始化参数Θ(0),用前4帧的信号与混合系统数据来训练GPR模型参数,即初始核超参数Ω(0),随机初始化其余超参数Ψ(0),超参数Φ=Ω∪Ψ;
4.2)对前2个阵元上的每一帧的观测信号
Figure BDA0002808603670000088
4.3)VBE步:估计后验分布q(A(l)),q(S(l)),q(P(l));
4.4)VBM步:估计各参数的期望值E(S(l)),E(X(l)),
Figure BDA0002808603670000089
4.5)更新核函数的超参数
Figure BDA00028086036700000810
与其余超参数Ψ(l)
4.6)算出负变分自由能的变化量ΔF=|F(Θnew)-F(Θold)|;
4.7)若ΔF<tol,分离信号S(l)=E(S(l)),l++,返回步骤2),否则,返回步骤3);如此反复,直到得到最终的分离结果S1,2={S(l)}。
进一步地,所述通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计,包括:
各阵元处接收到观测信号为χj(t)=αjs(t-τj)+nj(t),j=1,2…n;其中,s(t)为源信号,τi为声源到第j个麦克风的时间延迟,αj(t)是声源到第j个麦克风的衰减幅度,ni(t)是加性噪声;
假设声源到两个麦克风的时间差为τ12,则麦克风接收到的语音信号的互相关函数为
Figure BDA0002808603670000091
GCC-PHAT算法则在频域中利用PHAT加权函数
Figure BDA0002808603670000092
来改进原互功率谱密度函数,改进后的
Figure BDA0002808603670000093
Figure BDA0002808603670000094
若以L型阵列为例,假设其x轴时延为τ12,y轴时延为τ13,方位角θ与俯仰角
Figure BDA0002808603670000101
由下式计算:
Figure BDA0002808603670000102
进一步地,所述将DOA估计后数据代入MVDR波束形成算法,获得深度盲波束形成算法,包括:
假设某一空间中期望信号的来波方向为φe,并存在K个以φk为入射角的干扰信号,其对应的导向矢量分别为a(φe)和a(φk),权向量与导向矢量之间需要满足约束条件wHα(φe)=1,wHa(φk)=0,此时的目标函数即为
Figure BDA0002808603670000103
得输出功率最小同时信干噪比最大的最优权值
Figure BDA0002808603670000104
对时间对齐后的信号进行加权处理,最后将加权后的结果叠加,以使得阵列在期望方向上产生一个主瓣波束,而对其他方向上产生旁瓣波束;这样对整个空间进行波束扫描即估计出目标信号的位置。
本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法,与现有技术相比,其有益效果如下:
本发明基于GPR-UKF-NMFD盲分离方法、变分贝叶斯盲分离方法和时变在线盲分离方法,GCC-PHAT的DOA估计方法和MVDR波束形成方法,提出了一种适用于多声源DOA估计的声学相机系统的深度盲波束形成算法,将该算法移植到声学相机系统中,通过半实物仿真实验实现了实测多声源的时变盲分离、定位以及去混响。具体地,三种基于盲源分离方法,其中包括:两种基于时变盲分离的DOA估计方法,其可以解决声源的实时盲分离和去混响问题;一种深度盲源分离方法,基于该方法实现了多声源的时变盲分离、去混响以及DOA估计。
附图说明
图1为本发明实施例提供的深度盲波束形成算法结构图;
图2为本发明实施例提供的时变卷积混合的概率模型图;
图3为本发明实施例提供的OLGP-TVCBSS模型贝叶斯网络;
图4为本发明实施例提供的L型阵列示意图;
图5为本发明实施例提供的阵元1、阵元2上两路接收混合声源;
图6为本发明实施例提供的深度盲波束形成算法的分离结果;
图7为本发明实施例提供的相关系数Pxy随信噪比的变化关系图;
图8a为本发明实施例提供的两个实测声源的空间谱;
图8b为本发明实施例提供的两个实测声源的空间谱投影图;
图9a为本发明实施例提供的纯净语音语谱图;
图9b为本发明实施例提供的混响语音语谱图;
图10为本发明实施例提供的去混响后的语音信号语谱图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的宽带DOA估计方法对实际环境中存在的混响与噪声干扰考虑较少,且混合系统缺乏时变性。为此,本发明提出的深度盲源分离方法实现了多声源的时变盲分离、去混响以及DOA估计。本发明实施例提供一种基于时变混合信号盲分离的宽带DOA估计方法,该方法包括:
步骤1,获取声学相机系统的多声源混响数据。
步骤2,通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法形成深度盲波束形成算法。
步骤3,通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计。
其中,上述步骤2具体包括:
步骤21,通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离。
步骤22,通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离。
步骤23,通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离。
步骤24,通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计。
步骤25,将DOA估计后数据代入MVDR波束形成算法,获得深度盲波束形成算法。
对于上述步骤1~3、及步骤21~25的具体分析如下:
本发明所提出的深度盲波束形成算法就是基于图1中的结构来实现多声源的DOA估计。具体实现步骤大致可分为四大部分:多声源数据输入、盲源分离、DOA估计(时延估计+波束形成)以及空间谱输出。其中,盲源分离和DOA估计部分的具体内容大致如下:
(1)盲源分离
该部分采用三个隐藏层来描述,各层的激活函数(算法)依次为GPR-UKF-NMFD算法、变分贝叶斯EM(VBEM)算法和OLGP-TVCBSS算法。具体的数据传输过程为:将阵元n上的一路观测信号代入GPR-UKF-NMFD层中得到两个预信号S* 1和S* 2,再将其作为初始化信号代入至VBEM层中,通过计算得到了估计信号源S’1和S’1,最后,又将S’1和S’1作为输入数据传入OLGP-TVCBSS层中得到S^11,S^22。该过程可以简述为将上一层神经网络的输出作为下一层的输入,再通过该层的神经元上激活函数(盲分离算法)的处理得到新的输出。以此类推也可得到其他阵元上的估计声源S^n1,S^n2
Figure BDA0002808603670000131
先运用高斯过程回归-无损卡尔曼滤波(Gaussianprocessregression-unscentedKalmanfilter,GPR-UKF)方法建立状态空间模型并完成状态预估计,再采用非负矩阵分解解卷积(Nonnegativematrixfactorizationdeconvolution,NMFD)完成了混合信号的盲分离和去混响。
使用高斯过程回归来建立动态系统模型,再结合UKF实现对观测信号的实时在线滤波,将这一滤波方法称为GPR-UKF方法,过程如下:
1)建立高斯过程带加性噪声的非线性动态系统模型
Figure BDA0002808603670000141
式中,χk和yk分别为k时刻的状态变量和量测变量,k为系统噪声,wk为量测噪声,且
Figure BDA0002808603670000142
2)分别确定状态模型和量测模型中的训练数据量Df和Dn,输入与输出数据的维度N与M,并初始化统计量μk-1和Pχ,k-1。
3)通过向量x的均值μ和方差P来构造Sigma点集{χi|i=0,1,…2n}
Figure BDA0002808603670000151
式中,k为尺度参数,是调节精度的参数。该组采样点就可以近似表示x服从的高斯分布。并将该点集带入状态方程中,得到状点集
Figure BDA0002808603670000152
4)计算状态一步预测的均值
Figure BDA0002808603670000153
5)计算状态一步预测的方差
Figure BDA0002808603670000154
6)将
Figure BDA0002808603670000155
Figure BDA0002808603670000156
再代入3)中公式可重新得到一组Sigma点集
Figure BDA0002808603670000157
并将其代入量测方程中,可得观测量的点集
Figure BDA0002808603670000158
7)计算观测量的均值
Figure BDA0002808603670000159
8)计算观测量的方差
Figure BDA00028086036700001510
9)互协方差
Figure BDA00028086036700001511
10)结合卡尔曼增益
Figure BDA0002808603670000161
来更新状态,并将其作为新一轮的统计量。
综合上述的GPR-UKF状态预估计方法,提出了基于GPR-UKF-NMFD盲分离方法,步骤如下:
1)运用上述GPR-UKF方法对观测信号χi(t)通过GPR建立状态空间模型,然后UKF估计状态变量
Figure BDA0002808603670000162
2)对
Figure BDA0002808603670000163
进行短时傅里叶变换得到J×P维的复数矩阵V0,并计算V0的功率谱值v′,具体为
Figure BDA0002808603670000164
Figure BDA0002808603670000165
3)随机初始化非负矩阵W和H,再将V,W,H代入如下非负矩阵分解更新规则中:
Figure BDA0002808603670000166
4)将上一步更新得到的Wnew和Hnew代入如下两式中,得到E:
Figure BDA0002808603670000171
5)令W=Wnew,H=Hnew,继续代入更新规则至E<E0时停止更新,E0为设定的阈值,此时非负矩阵分别为Wfin,Hfin
6)令
Figure BDA0002808603670000172
利用
Figure BDA0002808603670000173
将其转化为复数矩阵
Figure BDA0002808603670000174
7)对
Figure BDA0002808603670000175
做短时傅里叶逆变换得到分离信号
Figure BDA0002808603670000176
此时的分离信号为去混响后的信号。
Figure BDA0002808603670000177
将局部复高斯模型和非负矩阵分解的概率框架作为源信号的先验,通过连续时间随机过程来模拟时变混合矩阵,在此基础上,运用变分贝叶斯期望最大化得到分离信号。
系统建模,参见图2,源信号:时频域中点(f,l)上的每个源信号sj,fl可视为Kj个隐变量成分ck,fl之和,即
Figure BDA0002808603670000178
若每个隐变量成分ck,fl服从均值为零,方差为wfkhkl的复高斯分布,则ck,fl~Nc(0,wfkhkl)。假设ck,fl在时频域上相互独立,因此可得源信号sj,fl的概率分布形式如下
Figure BDA0002808603670000181
使用NMF模型对Sj,fl的功率谱密度(powerspectraldensity,PSD)矩阵进行建模,即
Figure BDA0002808603670000182
混合矩阵模型:定义时频域中的观测信号xfl=[χ1,fl,…,χI,fl]T,零均值的复高斯噪声为bfl=[b1,fl,…,bI,fl]T,且bfl~Nc(0,vfII),混合矩阵Afl=[a1,fl,…,αJ,fl]T。因此,时频域的模型可以写成xfl=Aflsfl+bfl,式中,Afl为时变混合系统。对混合矩阵中的参数利用高斯过程进行建模:
Figure BDA0002808603670000183
其中,
Figure BDA0002808603670000184
为均值向量,
Figure BDA0002808603670000185
为协方差矩阵,a:,j为Afl的列向量,
Figure BDA0002808603670000186
基于VBEM盲分离方法步骤如下:
1)对第m个阵元上的观测信号
Figure BDA0002808603670000191
进行短时傅里叶变换,并得到第一帧的
Figure BDA0002808603670000192
2)初始化二值矩阵G、参数θ以及混合系统后验统计量
Figure BDA0002808603670000193
Figure BDA0002808603670000194
3)重复以下两步,至下界收敛:
VBE-C步:用下式计算
Figure BDA0002808603670000195
Figure BDA0002808603670000196
其中,Ufl∈CJ×J是J×J维的矩阵,其第jrth个元素
Figure BDA0002808603670000197
Figure BDA0002808603670000198
Figure BDA0002808603670000199
的第jrth个元素,
Figure BDA00028086036700001910
并通过下式估计出
Figure BDA00028086036700001911
Figure BDA00028086036700001912
VBE-A步:用下式计算
Figure BDA00028086036700001913
Figure BDA00028086036700001914
再使用卡尔曼平滑得到参数
Figure BDA0002808603670000201
VBM步:用以下公式更新参数θ。
Figure BDA0002808603670000202
Figure BDA0002808603670000203
Figure BDA0002808603670000204
Figure BDA0002808603670000205
其中,
Figure BDA0002808603670000206
被定义为
Figure BDA0002808603670000207
4)返回源信号的估计值
Figure BDA0002808603670000208
k∈[1,K]。
5)m++,继续执行1)~5)步,直到m=M,并返回
Figure BDA0002808603670000209
得到分离信号。
其中,基于时变在线盲分离方法,使用高斯过程自回归模型学习混合矩阵和源信号时间结构,通过变分贝叶斯推理近似得到模型参数和超参数,并将超参数作为下一帧的先验进行传递,从而实现在线贝叶斯学习。
Figure BDA0002808603670000211
时变卷积混合的概率分布模型:当存在K个非平稳的宽带信号源时,N个接收阵元,且N≥K。若将某一时间段内接收到的观测信号分帧,则每一帧的模型可以表示为
Figure BDA0002808603670000212
其中,s(l)(t)=[s1(t),s2(t),…,sK(t)]T为第I帧的源信号向量,D为卷积混合信道的阶数,χ(l)(t)=[x1(t),χ2(t),…χP(t)]T是第I帧的观测信号向量,ε(l)(t)为加性高斯白噪声向量,
Figure BDA0002808603670000213
为N×K维的混合矩阵。
Figure BDA0002808603670000214
且A(l)列满秩。对接收到的卷积混合信号进行扩维变为(J+1)N×K(D+J+1)维Toeplitz矩阵
Figure BDA0002808603670000215
Figure BDA0002808603670000216
Figure BDA0002808603670000217
Figure BDA0002808603670000218
Figure BDA0002808603670000219
此时,简化后的瞬时混合模型形式为
Figure BDA00028086036700002110
噪声
Figure BDA00028086036700002111
服从
Figure BDA0002808603670000221
Figure BDA0002808603670000222
服从伽马分布,可表示为
Figure BDA00028086036700002224
Figure BDA0002808603670000224
此时混合模型为
Figure BDA00028086036700002223
若用
Figure BDA0002808603670000225
表示
Figure BDA0002808603670000226
中的元素,第I帧的元素
Figure BDA0002808603670000227
间的相关性关系用隐函数f(·)表示。源信号
Figure BDA0002808603670000228
中的每个元素
Figure BDA0002808603670000229
与它的前后时刻对应的值之间也是时间相关的,该相关性关系用隐函数g(·)表示;在不同帧之间,混合矩阵
Figure BDA00028086036700002210
中的每个元素
Figure BDA00028086036700002211
连续变化。若当前时刻的
Figure BDA00028086036700002212
只与前p个时刻有关,则
Figure BDA00028086036700002213
式中,混合系数
Figure BDA00028086036700002214
Figure BDA00028086036700002215
为独立同分布的零均值高斯白噪声,且
Figure BDA00028086036700002216
为平方指数核函数,具体形式为
Figure BDA00028086036700002217
其中,
Figure BDA00028086036700002218
为对角矩阵,
Figure BDA00028086036700002219
为比例因子。则
Figure BDA00028086036700002220
的先验分布为
Figure BDA00028086036700002221
对于源信号而言,若当前时刻的
Figure BDA00028086036700002222
只与前p个时刻有关,则
Figure BDA0002808603670000231
式中,
Figure BDA0002808603670000232
为独立同分布的零均值高斯白噪声,且
Figure BDA0002808603670000233
源信号满足的高斯核函数如下:
Figure BDA0002808603670000234
由此可得,
Figure BDA0002808603670000235
的先验分布为
Figure BDA0002808603670000236
综上,本次卷积混合模型中得到的模型参数为Θ(l)={s(l),A(l),N(l),P(l)},模型超参数为
Figure BDA0002808603670000237
其中,关于混合矩阵的超参数分别为
Figure BDA0002808603670000238
Figure BDA0002808603670000239
为噪声的超参数。将上述的卷积混合模型称为在线高斯过程时变卷积盲源分离(OnlineGaussianProcessTimeVaryingConvolutionBlindSourceSeparation,OLGP-TVCBSS)模型,该模型完整的贝叶斯网络如图3所示。
基于OLGP-TVCBSS的方法步骤如下:
1)初始化:初始化参数Θ(0),用前4帧的信号与混合系统数据来训练GPR模型参数,即初始核超参数Ω(0),随机初始化其余超参数Ψ(0),超参数Φ=Ω∪Ψ。
2)对前2个阵元上的每一帧的观测信号
Figure BDA0002808603670000241
3)VBE步(估计后验分布):
估计后验分布q(A(l)),q(S(l)),q(P(l))。
4)VBM步(估计模型参数):
估计各参数的期望值E(S(l)),E(X(l)),
Figure BDA0002808603670000242
5)更新核函数的超参数
Figure BDA0002808603670000243
与其余超参数Ψ(l)
6)算出负变分自由能的变化量ΔF=|F(Θnew)-F(Θold)|。
7)若ΔF<tol,分离信号S(l)=E(S(l)),I++,返回步骤2),否则,返回步骤3)。如此反复,直到得到最终的分离结果S1,2={S(l)}。
(2)DOA估计
关联阵元上分出的同一信号源,采用广义互相关-相位变换(GeneralizedCrossCorrelationPhaseTransformation,GCC-PHAT)算法估计时延及初始方向(方位角与俯仰角),最后运用最小方差无畸变响应(MinimumVarianceDistortionlessResponse,MVDR)波束形成算法得到信号源各自的空间谱。
其中,GCC-PHAT算法如下:
各阵元处接收到观测信号为χj(t)=αjs(t-τj)+nj(t),j=1,2…n。其中,s(t)为源信号,τj为声源到第j个麦克风的时间延迟,αj(t)是声源到第j个麦克风的衰减幅度,nj(t)是加性噪声。假设声源到两个麦克风的时间差为τ12,则麦克风接收到的语音信号的互相关函数为
Figure BDA0002808603670000251
GCC-PHAT算法则在频域中利用PHAT加权函数
Figure BDA0002808603670000252
来改进原互功率谱密度函数,改进后的
Figure BDA0002808603670000253
Figure BDA0002808603670000254
若以L型阵列为例(参见图4),假设其x轴时延为τ12,y轴时延为τ13,方位角θ与俯仰角
Figure BDA0002808603670000255
可由下式计算:
Figure BDA0002808603670000256
MVDR波束形成算法如下:
假设某一空间中期望信号的来波方向为φe,并存在K个以φk为入射角的干扰信号,其对应的导向矢量分别为a(φe)和a(φk),权向量与导向矢量之间需要满足约束条件wHa(φe)=1,wHa(φk)=0,此时的目标函数即为
Figure BDA0002808603670000261
得输出功率最小同时信干噪比最大的最优权值
Figure BDA0002808603670000262
对时间对齐后的信号进行加权处理,最后将加权后的结果叠加,以使得阵列在期望方向上产生一个主瓣波束,而对其他方向上产生旁瓣波束。这样对整个空间进行波束扫描即可估计出目标信号的位置。
该深度盲波束形成算法是一种无监督学习的方法,可以仅通过观测信号实现信号的有效分离,并进一步估计各声源的具体位置。
声学相机因其有声源定位、异音异响测试和轨迹跟踪定位等功能,使其成为了工业现场中不可缺少的监测设备,声成像技术是声学相机的关键技术之一,该技术的研究重点就是各声源的DOA估计方法但现有的宽带DOA估计方法对实际环境中存在的混响与噪声干扰考虑较少,且混合系统缺乏时变性。为此,目前声学相机系统普遍还面临着无法满足声源在复杂混响环境下的实时定位问题,该问题解决的重难点在于对声源的波达方向估计。为此,本发明提出了一种深度盲波束形成算法,为声学相机在复杂环境下的声源定位提供了一种方法。
实验分析
深度盲波束形成算法半实物仿真实验:麦克风阵列选型,声源数据及摆放位置:可以估计声源的二维波达方向的阵列类型有L阵,圆阵和平面阵等,其中,L型阵列由于结构简单、易于传统DOA算法移植、更高DOA估计精度与更小的克拉美罗界(CRB)等优点,使得基于L型阵列的二维测向研究受到学者的重视。因此,实验处理的声源信号是由小型九阵元(麦克风)L型阵列接收的语音信号。实验在西北工业大学自动化学院某实验室进行,实验室的空间大小(长*宽*高)为7.47*3.63*3.14(m3),实验采集的目标声源数据是从TIMIT标准语音库中选取的两路语音信号源,分别为男声信号S1和女声信号S2,两个语音源信号由两个扬声器同时播放,此外,还有室内的环境背景噪声存在,麦克风阵列上单个阵元接收到的语音信号即为带有混响和噪声的两路语音信号的混合数据。
目标声源的确定:待检测的目标声源具体为TIMIT标准语音库中的两个声源:男声信号S1(dr1/fakso/sa1.wav),女声信号S2(dr1/mdabo/sa2.wav)。信号采集模块中的采样率为48KHz。两路声源的波形如图5所示。对其接收信号执行深度盲波束形成方法,得到的两路分离信号如图6所示。
为了评价算法的分离性能,这里采用相关系数(Pxy)和信噪比(SNR)这两个指标。将深度盲波束形成算法同NB-ICA算法进行对比。源信号与两路分离信号间的相关系数Pxy随信噪比的变化关系如图7所示。由图7可以看出,深度盲波束形成算法和NB-ICA算法都呈现出了较好的分离效果,即当信噪比的增大时其对应的相关系数也随之增大。但深度盲波束形成算法整体的相关系数高于NB-ICA算法,故其分离效果更优。
以此类推,对L型阵列上的其他阵元上的接收信号,同样采用本章提到的深度盲波束形成算法进行盲分离,再对同一个估计信号运用GCC-PHAT和MVDR方法求出其DOA。则声源S1和S2的空间谱如图8a、8b所示。图中两个谱峰对应的位置角度即为两声源的估计方位角与俯仰角,将估计结果、标准声源位置信息以及角度误差整理,可得表1:
表1实测两声源的估计结果及误差
Figure BDA0002808603670000281
Figure BDA0002808603670000291
由表1可得,估计得到的声源S1、S2的位置分别为(12°,12°),(132°,15°),位置误差的角度范围为0.381°~5.267°。对空间谱中谱峰对应的俯仰角与方位角,通过坐标转换方法在光学照相机采集到的实验场景环境图找出其对应位置。观察图中的高亮点可看出其能较为准确的定位到两声源,实现了实测声源的DOA估计。
声源去混响的验证:使用语谱图来衡量提出深度盲波束形成算法的去混响能力。以阵元1上接收的男声信号S1为例,图9a为原始纯净语音信号语谱图,图9b为混响语音信号语谱图,语谱图横坐标为时间,单位为秒,纵坐标为频率,单位为Hz。图10去混响后的语音信号语谱图。
利用提出的深度盲波束形成算法对混响语音去混响处理,混响信号消减处理后的语音信号语谱图,如图9所示。从图中可以看出,输出语音语谱图相对于混响语音语谱图清晰度有明显的改善,证明了深度盲波束形成算法具有较好的去混响能力。所提出的深度盲波束形成算法,在混合系统为时变系统且对实时性要求较高的场所,可同时实现实测多声源的时变盲分离、定位以及去混响功能,具有广泛的应用。
以上公开的仅为本发明的几个具体实施例,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围内。

Claims (7)

1.一种基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,包括:
获取声学相机系统的多声源混响数据;
通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法;
通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计。
2.如权利要求1所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过GPR-UKF-NMFD盲分离算法、变分贝叶斯盲分离算法、时变在线盲分离算法、GCC-PHAT算法、MVDR波束形成算法,形成深度盲波束形成算法,包括:
通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离;
通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离;
通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离;
通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计;
将DOA估计后数据代入MVDR波束形成算法,获得深度盲波束形成算法。
3.如权利要求2所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过GPR-UKF-NMFD盲分离算法,对多声源混响数据进行第一次盲分离,包括:
采用高斯过程回归GPR理论建立动态系统模型,再结合无迹卡尔曼滤波UKF理论对观测信号进行实时在线滤波,形成GPR-UKF状态预估计算法;其过程如下:
1.1)建立高斯过程带加性噪声的非线性动态系统模型:
Figure FDA0002808603660000021
式中,xk和yk分别为k时刻的状态变量和量测变量,wk为量测噪声,且
Figure FDA0002808603660000022
1.2)分别确定状态模型和量测模型中的训练数据量Df和Dh,输入与输出数据的维度为N与M,并初始化统计量μk-1和Px,k-1
1.3)通过向量x的均值μ和方差Px构造Sigma点集{χi|i=0,1,…2n}
Figure FDA0002808603660000023
式中,k为尺度参数,是调节精度的参数,该组采样点表示x服从的高斯分布,并将该点集带入状态方程中,得到状点集
Figure FDA0002808603660000024
1.4)计算均值
Figure FDA0002808603660000031
1.5)计算方差
Figure FDA0002808603660000032
1.6)将
Figure FDA0002808603660000033
和Pk f代入1.3)中公式,重新得到一组Sigma点集
Figure FDA0002808603660000034
并将其代入量测方程中,得观测量的点集
Figure FDA0002808603660000035
1.7)计算观测量的均值
Figure FDA0002808603660000036
1.8)计算观测量的方差
Figure FDA0002808603660000037
1.9)计算互协方差
Figure FDA0002808603660000038
1.10)根据卡尔曼增益
Figure FDA0002808603660000039
更新状态,并将其作为新一轮的统计量;
根据GPR-UKF状态预估计算法,结合非负矩阵分解解卷积NMFD理论,
形成GPR-UKF-NMFD盲分离算法;其过程如下:
2.1)根据GPR-UKF状态预估计算法,对观测信号χi(t)通过GPR理论建立状态空间模型,然后通过UKF理论估计状态变量
Figure FDA00028086036600000310
2.2)对
Figure FDA00028086036600000311
进行短时傅里叶变换得到J×P维的复数矩阵V0,并计算V0的功率谱值V′,具体为
Figure FDA0002808603660000041
Figure FDA0002808603660000042
2.3)随机初始化非负矩阵W和H,再将V,W,H代入如下非负矩阵分解更新规则中:
Figure FDA0002808603660000043
2.4)将上一步更新得到的Wnew和Hnew代入如下两式中,得到E:
Figure FDA0002808603660000044
2.5)令W=Wnew,H=Hnew,继续代入更新规则至E<E0时停止更新,E0为设定的阈值,此时非负矩阵分别为Wfin,Hfin
2.6)令
Figure FDA0002808603660000045
利用
Figure FDA0002808603660000046
将其转化为复数矩阵
Figure FDA0002808603660000047
2.7)对
Figure FDA0002808603660000048
进行短时傅里叶逆变换,得到分离信号
Figure FDA0002808603660000049
此时的分离信号为去混响后的信号。
4.如权利要求3所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过变分贝叶斯盲分离算法,对第一次盲分离后数据进行第二次盲分离,包括:
3.1)对第m(m=1,…,M)个阵元上的观测信号
Figure FDA0002808603660000051
进行短时傅里叶变换,并得到第一帧的
Figure FDA0002808603660000052
3.2)初始化二值矩阵G、参数θ以及混合系统后验统计量
Figure FDA0002808603660000053
Figure FDA0002808603660000054
3.3)重复以下VBE-C步、VBE-A步,至下界收敛:
VBE-C步:用下式计算
Figure FDA0002808603660000055
Figure FDA0002808603660000056
其中,Ufl∈CJ×J是J×J维的矩阵,其第jrth个元素
Figure FDA0002808603660000057
Figure FDA0002808603660000058
Figure FDA0002808603660000059
的第jrth个元素,
Figure FDA00028086036600000510
并通过下式估计出
Figure FDA00028086036600000511
Figure FDA00028086036600000512
VBE-A步:用下式计算
Figure FDA00028086036600000513
再使用卡尔曼平滑得到参数
Figure FDA00028086036600000514
Figure FDA0002808603660000061
VBM步:用以下公式更新参数θ;
Figure FDA0002808603660000062
Figure FDA0002808603660000063
Figure FDA0002808603660000064
Figure FDA0002808603660000065
其中,
Figure FDA0002808603660000066
被定义为
Figure FDA0002808603660000067
3.4)返回源信号的估计值
Figure FDA0002808603660000068
3.5)m++,继续执行3.1)~3.5)步,直到m=M,并返回
Figure FDA0002808603660000069
得到分离信号。
5.如权利要求4所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过时变在线盲分离算法,对第二次盲分离后数据进行第三次盲分离,包括:
4.1)初始化:初始化参数Θ(0),用前4帧的信号与混合系统数据来训练GPR模型参数,即初始核超参数Ω(0),随机初始化其余超参数Ψ(0),超参数Φ=Ω∪Ψ;
4.2)对前2个阵元上的每一帧的观测信号
Figure FDA0002808603660000071
4.3)VBE步:估计后验分布q(A(l)),q(S(l)),q(P(l));
4.4)VBM步:估计各参数的期望值E(S(l)),E(X(l)),E(P(l));
4.5)更新核函数的超参数
Figure FDA0002808603660000072
与其余超参数Ψ(l)
4.6)算出负变分自由能的变化量ΔF=|F(Θnew)-F(Θold)|;
4.7)若ΔF<tol,分离信号S(l)=E(S(l)),l++,返回步骤2),否则,返回步骤3);如此反复,直到得到最终的分离结果S1,2={S(l)}。
6.如权利要求5所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过GCC-PHAT算法,对第三次盲分离后数据进行DOA估计,包括:
各阵元处接收到观测信号为χj(t)=αjs(t-τj)+nj(t),j=1,2...n;其中,s(t)为源信号,τj为声源到第j个麦克风的时间延迟,αj(t)是声源到第j个麦克风的衰减幅度,nj(t)是加性噪声;
假设声源到两个麦克风的时间差为τ12,则麦克风接收到的语音信号的互相关函数为
Figure FDA0002808603660000073
GCC-PHAT算法则在频域中利用PHAT加权函数
Figure FDA0002808603660000074
来改进原互功率谱密度函数,改进后的
Figure FDA0002808603660000081
Figure FDA0002808603660000082
若以L型阵列为例,假设其x轴时延为τ12,y轴时延为τ13,方位角θ与俯仰角
Figure FDA0002808603660000083
由下式计算:
Figure FDA0002808603660000084
7.如权利要求6所述的基于时变混合信号盲分离的宽带DOA估计方法,其特征在于,所述通过深度盲波束形成算法,对多声源混响数据进行时变盲源分离、去混响、及DOA估计,包括:
假设某一空间中期望信号的来波方向为φe,并存在K个以φk为入射角的干扰信号,其对应的导向矢量分别为a(φe)和a(φk),权向量与导向矢量之间需要满足约束条件wHa(φe)=1,wHa(φk)=0,此时的目标函数即为
Figure FDA0002808603660000085
得输出功率最小同时信干噪比最大的最优权值
Figure FDA0002808603660000086
对时间对齐后的信号进行加权处理,最后将加权后的结果叠加,以使得阵列在期望方向上产生一个主瓣波束,而对其他方向上产生旁瓣波束;这样对整个空间进行波束扫描即估计出目标信号的位置。
CN202011385852.9A 2020-11-30 2020-11-30 一种基于时变混合信号盲分离的宽带doa估计方法 Active CN112565119B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011385852.9A CN112565119B (zh) 2020-11-30 2020-11-30 一种基于时变混合信号盲分离的宽带doa估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011385852.9A CN112565119B (zh) 2020-11-30 2020-11-30 一种基于时变混合信号盲分离的宽带doa估计方法

Publications (2)

Publication Number Publication Date
CN112565119A true CN112565119A (zh) 2021-03-26
CN112565119B CN112565119B (zh) 2022-09-27

Family

ID=75046989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011385852.9A Active CN112565119B (zh) 2020-11-30 2020-11-30 一种基于时变混合信号盲分离的宽带doa估计方法

Country Status (1)

Country Link
CN (1) CN112565119B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779667A (zh) * 2021-08-19 2021-12-10 中铁第五勘察设计院集团有限公司 公共建筑广播系统设计方法和装置
CN114035157A (zh) * 2021-10-29 2022-02-11 中国科学院声学研究所 一种基于期望最大化算法的分频带时延估计方法及其系统
CN114220453A (zh) * 2022-01-12 2022-03-22 中国科学院声学研究所 基于频域卷积传递函数的多通道非负矩阵分解方法及系统
CN115935153A (zh) * 2023-01-06 2023-04-07 香港理工大学深圳研究院 一种基于贝叶斯盲源分离技术的列车轴承故障诊断方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090012779A1 (en) * 2007-03-05 2009-01-08 Yohei Ikeda Sound source separation apparatus and sound source separation method
CN103295187A (zh) * 2012-02-23 2013-09-11 北京师范大学 基于反馈机制的抗混合噪声的盲图像源分离方法
CN104995679A (zh) * 2013-02-13 2015-10-21 美国亚德诺半导体公司 信号源分离
US9668066B1 (en) * 2015-04-03 2017-05-30 Cedar Audio Ltd. Blind source separation systems
US20180182410A1 (en) * 2016-12-23 2018-06-28 Synaptics Incorporated Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments
CN109238447A (zh) * 2018-09-12 2019-01-18 西北工业大学 一种系绳振动信号的盲源分离方法
CN109243483A (zh) * 2018-10-17 2019-01-18 西安交通大学 一种含噪频域卷积盲源分离方法
CN109994120A (zh) * 2017-12-29 2019-07-09 福州瑞芯微电子股份有限公司 基于双麦的语音增强方法、系统、音箱及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090012779A1 (en) * 2007-03-05 2009-01-08 Yohei Ikeda Sound source separation apparatus and sound source separation method
CN103295187A (zh) * 2012-02-23 2013-09-11 北京师范大学 基于反馈机制的抗混合噪声的盲图像源分离方法
CN104995679A (zh) * 2013-02-13 2015-10-21 美国亚德诺半导体公司 信号源分离
US9668066B1 (en) * 2015-04-03 2017-05-30 Cedar Audio Ltd. Blind source separation systems
US20180182410A1 (en) * 2016-12-23 2018-06-28 Synaptics Incorporated Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments
CN109994120A (zh) * 2017-12-29 2019-07-09 福州瑞芯微电子股份有限公司 基于双麦的语音增强方法、系统、音箱及存储介质
CN109238447A (zh) * 2018-09-12 2019-01-18 西北工业大学 一种系绳振动信号的盲源分离方法
CN109243483A (zh) * 2018-10-17 2019-01-18 西安交通大学 一种含噪频域卷积盲源分离方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PENGJU HE: "A General Nonstationary and Time-Varying Mixed Signal Blind Source Separation Method Based on Online Gaussian Process", 《INTERNATIONAL JOURNAL OF PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE》 *
何鹏举: "基于WSN和盲源分离的多目标识别方法研究", 《物联网学报》 *
孙世军等: "基于时间序列变分贝叶斯理论的信号盲源分离", 《仪器仪表学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113779667A (zh) * 2021-08-19 2021-12-10 中铁第五勘察设计院集团有限公司 公共建筑广播系统设计方法和装置
CN113779667B (zh) * 2021-08-19 2023-09-01 中铁第五勘察设计院集团有限公司 公共建筑广播系统设计方法和装置
CN114035157A (zh) * 2021-10-29 2022-02-11 中国科学院声学研究所 一种基于期望最大化算法的分频带时延估计方法及其系统
CN114220453A (zh) * 2022-01-12 2022-03-22 中国科学院声学研究所 基于频域卷积传递函数的多通道非负矩阵分解方法及系统
CN114220453B (zh) * 2022-01-12 2022-08-16 中国科学院声学研究所 基于频域卷积传递函数的多通道非负矩阵分解方法及系统
CN115935153A (zh) * 2023-01-06 2023-04-07 香港理工大学深圳研究院 一种基于贝叶斯盲源分离技术的列车轴承故障诊断方法

Also Published As

Publication number Publication date
CN112565119B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN112565119B (zh) 一种基于时变混合信号盲分离的宽带doa估计方法
CN111415676B (zh) 一种基于分离矩阵初始化频点选择的盲源分离方法及系统
Jarrett et al. 3D source localization in the spherical harmonic domain using a pseudointensity vector
US7475014B2 (en) Method and system for tracking signal sources with wrapped-phase hidden markov models
Zhong et al. Particle filtering approaches for multiple acoustic source detection and 2-D direction of arrival estimation using a single acoustic vector sensor
Moore et al. Direction of arrival estimation using pseudo-intensity vectors with direct-path dominance test
Zhong et al. Particle filtering and posterior Cramér-Rao bound for 2-D direction of arrival tracking using an acoustic vector sensor
Leong et al. Multiple target localization using wideband echo chirp signals
Pujol et al. Source localization in reverberant rooms using Deep Learning and microphone arrays
CN111812581A (zh) 基于原子范数的球面阵列声源波达方向估计方法
Zhang et al. Deep learning-based direction-of-arrival estimation for multiple speech sources using a small scale array
Imran et al. A methodology for sound source localization and tracking: Development of 3D microphone array for near-field and far-field applications
Zhao et al. Sound source localization based on srp-phat spatial spectrum and deep neural network
Salvati et al. Two-microphone end-to-end speaker joint identification and localization via convolutional neural networks
Hu et al. Decoupled direction-of-arrival estimations using relative harmonic coefficients
Nesta et al. Enhanced multidimensional spatial functions for unambiguous localization of multiple sparse acoustic sources
SongGong et al. Indoor multi-speaker localization based on Bayesian nonparametrics in the circular harmonic domain
Tengan et al. Multi-Source Direction-of-Arrival Estimation using Group-Sparse Fitting of Steered Response Power Maps
Bianchi et al. A plenacoustic approach to acoustic signal extraction
McCormack et al. Sharpening of Angular Spectra Based on a Directional Re-assignment Approach for Ambisonic Sound-field Visualisation
CN101645701B (zh) 一种基于滤波器组的时延估计方法及其系统
Li et al. Deep learning-based DOA estimation using CRNN for underwater acoustic arrays
Firoozabadi et al. Combination of nested microphone array and subband processing for multiple simultaneous speaker localization
Sofer et al. Robust relative transfer function identification on manifolds for speech enhancement
Sakhnini et al. Direction of arrival estimation using the generalized SPICE criterion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant