CN104952459B - 一种基于分布式一致性和mvdr波束形成的分布式语音增强方法 - Google Patents

一种基于分布式一致性和mvdr波束形成的分布式语音增强方法 Download PDF

Info

Publication number
CN104952459B
CN104952459B CN201510212600.9A CN201510212600A CN104952459B CN 104952459 B CN104952459 B CN 104952459B CN 201510212600 A CN201510212600 A CN 201510212600A CN 104952459 B CN104952459 B CN 104952459B
Authority
CN
China
Prior art keywords
mrow
node
msub
mover
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510212600.9A
Other languages
English (en)
Other versions
CN104952459A (zh
Inventor
陈喆
殷福亮
李达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201510212600.9A priority Critical patent/CN104952459B/zh
Publication of CN104952459A publication Critical patent/CN104952459A/zh
Application granted granted Critical
Publication of CN104952459B publication Critical patent/CN104952459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于分布式一致性和MVDR波束形成的分布式语音增强方法,包括以下步骤:S1:利用改进的随机声传感器网络生成算法生成传感器网络节点的坐标,计算节点的连接矩阵、节点的度和节点临近节点集合;S2:利用S1中生成的传感器网络接收含噪语音信号,对每个节点接收的含噪语音信号进行MVDR预处理获得语音预处理矩阵(0)和噪声预处理矩阵(0);S3:利用S1得出的节点的连接矩阵、节点的度和节点临近节点集合和S2得出语音预处理矩阵(0)和噪声预处理矩阵(0)进行分布式一致性迭代,使每个节点获得一致的MVDR语音增强时域的语音信号zi(t)。

Description

一种基于分布式一致性和MVDR波束形成的分布式语音增强 方法
技术领域
本发明涉及语音信号处理技术领域,尤其涉及一种基于分布式一致性和MVDR的分布式语音增强方法。
背景技术
语音信号处理是现代通信、多媒体应用和人工智能等领域的核心技术之一。在语音采集过程中,由于环境噪声、房间混响等影响,所获语音音质和清晰度会下降。语音增强作为一种前置处理方案,是一种有效的抑制干扰的方法。
在信息时代,信息获取最重要和最基本的技术——传感器技术,也得到了很大的发展。具有感知能力、计算能力和通信能力的无线传感器网络(WSN,Wireless SensorNetworks)也随之提出。无线传感器网络综合了传感器技术、嵌入式计算技术、分布式信息处理技术和通信技术,能够协作地实时监测、感知和采集网络分布区域内的各种环境或监测对象的信息,并对这些信息进行处理,获得详尽而准确的信息,传送到需要这些信息的用户。其中,如果处理对象针对的是声音信号,那么此无线传感器网络也叫做无线声传感器网络(Wireless Acoustic Sensor Networks,WASN)。无线声传感器网络可以应用于助听器,(免提)语音通信系统,声学检测,环境智能等很多领域。
在2012年8月27-31日的欧洲信号处理会议(EUSIPCO 2012)的”Distributed GSCbeamforming using the relative transfer function”论文[3]中,M.G.Shmulik等提出了一种基于分布式广义旁瓣抵消波束形成方法。该方法针对每个节点都和其它节点连接的无线声传感器网络,利用两次广义旁瓣抵消算法来实现分布式的语音增强。第一次是每个节点单独把自己所有的麦克风收集到的语音信号利用广义旁边抵消算法实现一次语音增强,之后把此次语音增强结果广播传输到其他所有节点。第二次是每个节点利用其它节点传输过来的语音增强信号,加上节点本身的增强信号,再次利用广义旁瓣抵消算法来增强。最后每个节点就可以获得一致的语音增强效果。该方法利用全连网络特性,在不存在融合中心的情况下,实现了分布式的语音增强,增强效果也比较好,但存在的问题也较为明显:要求网络中所有节点可以和其他节点直接通信,这限制了网络的拓扑结 构;需要等待所有节点接收到其他节点传输过来的信息,才可以进行处理,这影响了算法的实时性,极大消耗了网络的能量。
在2013年IEEE信号处理期刊上的“Distributed LCMV beamforming in awireless sensor network with single-channel per-node signal transmission”论文[2]中,A.Bertrand等人提出了一种基于线性受限最小方差(Linearly ConstrainedMinimum Variance,LCMV)的分布式语音增强方法。该方法和技术一类似,只是把语音增强的算法替换为LCMV方法,并且传输信号的同时,还要传输受限矩阵。所以此方法可以在无融合中心的情况下,获得逼近有融合中心的波束形成结果,但是任然存在技术一存在的问题。
在2015年Elsevier信号处理期刊上的“Optimal distributed minimum-variancebeamforming approaches for speech enhancement in wireless acoustic sensornetworks”的论文中[3],S.M.Golan提出了一种针对树形拓扑网络的分布式语音增强方法。该方法在技术二的基础上,把全连网路等效为树形拓扑网络,也就是信息传输时具有方向性,不再是每个节点向所有节点传输,而是首先把网络简化,去掉能形成环的结构,进而等效为一个类似生成树的结构,再把相连节点分为父节点和子节点,子节点能接收父节点的信息和向父节点发送信息,父节点能接收子节点的信息和向子节点发送信息。这样信息传输时就能减少重复传送和远距离传送,使信息传输更高效,这有利于利用LCMV波束形成算法实现分布式语音增强。此算法改进了技术一和二存在的网络拓扑限制缺点,节点传输相比网络直传快很多,不过存在的缺点就是树形拓扑生成比较麻烦,必须事先知道网络结构,进行预处理。
发明内容
根据现有技术存在的问题,本发明公开了一种基于分布式一致性和MVDR的分布式语音增强方法,包括以下步骤:
S1:利用改进的随机声传感器网络生成算法生成传感器网络节点的坐标,计算节点的连接矩阵、节点的度和节点临近节点集合;
S2:利用S1中生成的传感器网络接收含噪语音信号,对每个节点接收的含噪语音信号进行MVDR预处理获得语音预处理矩阵和噪声预处理矩阵
S3:利用S1得出的节点的连接矩阵、节点的度和节点临近节点集合和S2得出语音预处理矩阵和噪声预处理矩阵进行分布式一致性迭代,使每 个节点获得一致的MVDR语音增强时域的语音信号zi(t)。
S1中具体采用如下方式:
S11:在一个b×b平面上设计一个坐标轴;
S12:产生节点坐标:对于确定的网络节点数N,在平面坐标上随机产生10*N个坐标,利用K均值聚类算法对这些坐标进行聚类,产生N个聚类中心,记下此时N个聚类中心的坐标(xi,yi),其中i=1,2,…,N,即为节点坐标;
S13:检测所有节点是否存在边,进而得到节点连接矩阵A=[aij],1≤i,j≤N,采用如下公式(1)确定网络节点gi与gj是否存在一条直接相连的边,若概率大于0.5,则节点vi与vj存在边,并使aij=1,否则不存在,使aij=0;
其中:k为常数,e为网络平均节点度参数,l(i,j)表示节点gi与gj之间的几何距离,L为网络拓扑图中所有节点几何距离的最大值,α和β为调节网络特性的参数,范围为(0,1],α决定长边和短边的比例,β决定网络的度数;
S14:求出所有节点的度,其中节点vi的度din(gi)为:
S15:求出所有节点的临近节点集合,其中节点gi的临近节点集合Ci为:
Ci={gj∈G|aij=1}。 (3)
S2中具体采用如下方式:
S21.对每个节点接收的含噪语音信号进行短时傅里叶变换,得到含噪语音短时傅里叶系数Yi
S22.计算每个节点的声传输函数Hi
令声源与第i个节点的距离为di,则衰减系数σi为1/di,延时τi为(li/c)fs,其中c为声速,故声传输函数为
S23.估计每个节点接收信号的噪声功率谱
对于噪声谱估计单元,利用直接谱估计算法,并对多帧噪声谱估计平均,本发明采用前T0帧(T0=5),则第i个节点接收信号的噪声功率谱估计为
S24.利用每个节点的声传输函数Hi分别对每个节点的含噪语音短时傅里叶 系数Yi和噪声噪声功率谱进行MVDR预处理,对每个节点的含噪语音短时傅里叶系数Yi进行MVDR预处理的得到语音预处理结果对每个节点的噪声噪声功率谱进行MVDR预处理噪声预处理结果故语音预处理矩阵噪声预处理矩阵 其中上标”*”表示取共轭操作,(·)T表示转置操作。
S3中具体采用如下方式:
S31:利用S1中得出的节点的连接矩阵、节点的度和节点临近节点集合计算平均Metropolis权算法的权矩阵W;设权矩阵为W=[Wij],1≤i,j≤N,利用S1得出的节点连接矩阵,节点的度和临近节点集合,则基于平均Metropolis权算法的权矩阵为
其中:θ是一个很小的正数,为权衡因子;
S32:利用权矩阵W和S2中得出语音预处理矩阵和噪声预处理矩阵进行分布式一致性迭代,直到收敛,得到收敛后的每个节点的MVDR波束形成语音增强结果
S33:迭代完毕后,对每个节点的MVDR波束形成语音增强结果进行短时傅里叶反变换,就可以得到增强后的时域的语音信号zi(t)。
S32中具体采用如下方式:令迭代次数为t,第i个节点的第t次迭代的结果为构成矩阵为整个分布式算法的迭代过程如下:
S32(1):初始化迭代次数t=0;
S32(2):在每个节点,利用权矩阵W和语音预处理矩阵和噪声预处理矩阵迭代计算和第i个节点的第t次迭代的MVDR波束形成语音增强结果
S32(3):如果迭代次数t超过预先设置的迭代次数阈值,则收敛,此时的即为最后的MVDR波束形成语音增强结果;否则使t→t+1,返回到步骤S32(2)。
步骤S32(2)中迭代时,利用的是网络节点通信进行信息共享迭代,节点通信过程如下所示:
A、在初始阶段,设定网络中的所有节点处于gossip模式,能和临近节点进行信息交流;
B、利用随机函数随机选择多个非临近节点同时唤醒,执行以下相同操作;如传感器节点i唤醒,如果节点i是第一次被唤醒(ti=0),进行如下“主从”关系记录:如果节点j向节点i传输过信息,节点i会记录节点j与其是“从”关系;如果节点j没有向节点i传输过信息,节点i会记录节点j与其是“主”关系;
C、节点i的所有临近节点传输它们的加权估计到节点i,即临近节点j传输到节点i,具体传输规则为:如果不在“主从”关系表中,那么说明节点j未被唤醒,即tj=0,此时传输如果节点j与节点i是“主”关系,说明节点j之前未向节点i传输过信息,则tj-1=ti,此时传输如果节点j与节点i是“从”关系,说明节点j之前向节点i传输过信息,则tj=ti,此时传输
D、节点i的利用接收到的所有临近节点的和节点本身的来更新
E、节点i更新gossip迭代ti=ti+1,并且改变模式为等待状态,一直到所有其临近节点相继被唤醒,并更新其估计值才会改变到gossip模式;
由于采用了上述技术方案,本发明提供的一种基于分布式一致性和MVDR的分布式语音增强方法,首先是生成传感器网络节点的坐标,然后对含噪声的 语音信号进行预处理输出语音预处理矩阵和噪声预处理矩阵,利用得出的节点的连接矩阵、节点的度、节点临近节点集合、语音预处理矩阵、噪声预处理矩阵进行分布式一致性迭代,使每个节点获得一致的MVDR语音增强时域的语音信号。
本发明具有以下优点:
(1)将分布式一致性和MVDR波束形成应用于分布式语音增强领域,完成了分布式语音增强,能够不需要任何融合中心或者融合节点,不受声源位置或者声源可能移动的影响,不受网络拓扑结构限制,大幅度减少了网络传输代价和节省了网络节点能量。
(2)本发明在Salama模型随机抛撒节点时,加入了K均值聚类算法,形成了改进的Salama模型的网络随机生成算法。由于利用了K均值聚类,所以网络节点分布比较均匀而且疏密得当,边的分布也很均衡,能更好的符合实际网络分布情况。
(3)应用了平均Metropolis权,使一致性迭代的迭代次数仅为12次左右,仅需花费数十分钟就可以获得较高质量的语音增强效果,相比其他权算法减少了迭代次数,提高了算法实时性。
(4)在信息传输时仅与邻近节点交流,与现有分布式LCMV等方法中节点信息传输要在整个网络中实现相比,节点信息传输和等待时间大幅度减少,实时性增强。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于分布式一致性和MVDR的分布式语音增强方法的流程图;
图2(a)为无线声传感器网络节点示意图;
图2(b)为无线声传感器网络节点连接图;
图3(a)为原始信号的波形图;
图3(b)为原始信号加噪声的波形图;
图4(a)为信号在增强前某个节点的波形图;
图4(b)为信号在增强前某个节点的波形图;
图5(a)为迭代过程中对应图4(a)中节点的MSE随迭代次数变化的示意图;
图5(b)为迭代过程中对应图4(b)中节点的MSE随迭代次数变化的示意图;
图6(a)为迭代过程中对应图4(a)中节点的SNR随迭代次数变化的示意图;
图6(b)为迭代过程中对应图4(b)中节点的SNR随迭代次数变化的示意图;
图7(a)为信号在增强后某个节点的示意图;
图7(b)为信号在增强后某个节点的示意图。
具体实施方式
为使本发明的技术方案和优点更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整的描述:
如图1所示的一种基于分布式一致性和MVDR的分布式语音增强方法,具体包括以下步骤:
S1:利用改进的随机声传感器网络生成算法生成传感器网络节点的坐标,计算节点的连接矩阵、节点的度和节点临近节点集合。
所述的随机声传感器网络生成算法主要是基于可以控制随机网络平均节点度的Salama模型[5]的网络随机生成算法。设具有N个节点的随机声传感器网络节点集合G={g1,g2,…,gN},节点连接矩阵A=[aij],1≤i,j≤N,并且aij=1表示第i个节点和第j个节点是直接相连的,aij=0表示第i个节点和第j个节点不是直接相连的。本发明在Salama模型随机抛撒节点时,加入了K均值聚类算法,形成了改进的Salama模型的网络随机生成算法。由于利用了K均值聚类,所以网络节点分布比较均匀而且疏密得当,边的分布也很均衡。具体的随机生成算法步骤如下:
S11:在一个b×b平面上设计一个坐标轴,横轴为x轴,纵轴为y轴,b表示平面边长,单位为米;
S12:产生节点坐标。对于确定的网络节点数N,在平面坐标上随机产生10*N个坐标,利用K均值聚类算法对这些坐标进行聚类,产生聚类中心,记下此时N个聚类中心的坐标(xi,yi),其中i=1,2,…,N,即为节点坐标,此时节点产生完毕。
S13:检测所有节点是否存在边,进而得到节点连接矩阵A=[aij],1≤i,j≤N。利用公式(1)来确定网络节点gi与gj是否存在一条直接相连的边,若概率大于0.5,则节点vi与vj存在边,并使aij=1,否则不存在,使aij=0;
网络节点gi与gj是否存在一条直接相连的边是由以下概率决定的。
其中,k为常数,e为网络平均节点度参数,这两个参数都是预设的,l(i,j)表示节点gi与gj之间的几何距离,L为网络拓扑图中所有节点几何距离的最大值,α和β为调节网络特性的参数,范围为(0,1],α可以决定长边和短边的比例,β决定网络的度数。如果α和β选择合适,那么网络可以更好地逼近现实网络。
S14:求出所有节点的度,其中节点vi的度din(gi)为
S15:求出所有节点的临近节点集合,其中节点gi的临近节点集合Ci
Ci={gj∈G|aij=1} (3)
S2:利用S1中生成的传感器网络接收含噪语音信号,对每个节点接收的含噪语音信号进行MVDR预处理获得语音预处理矩阵和噪声预处理矩阵 具体包括以下步骤:
S21、对每个节点接收的含噪语音信号进行短时傅里叶变换,得到含噪语音短时傅里叶系数Yi
短时谱估计单元就是对节点接收的含噪语音信号进行短时傅里叶变换(Short-time Fourier Transform,STFT)到频域,比如第i个节点的接收含噪语音时域信号yi,其时域模型为
yi=hi*s+vi (4)
其中,每一个节点仅含一个麦克风,目标声源为s,坐标为(sx,sy),声传输函数为hi,vi为零均值,方差为的高斯白噪声。
对(4)进行STFT变换到频域为
Yi(k,m)=Hi(k,m)S(k,m)+Vi(k,m) (5)
其中,Yi(k,m),Hi(k,m),S(k,m)和Ni(k,m)分别是第i个节点的yi,hi,s和vi的STFT系数,k和m分别表示频率和时间因子,1≤k≤K,1≤m≤M,K为短时傅里叶变换点数NFFT的一半,M的选取与语音分帧有关,如果采样率为fs,语音长度为yL,帧移(帧与帧之间的重复率)为0.5,则M=(yL-NFFT)/(NFFT-NFFT*0.5)。
通常,我们假设这些系数与时间和频率因子均是独立的,所以为了表示更简洁,在上式中省略掉k,m,我们有,
Yi=HiS+Ni (6)
此时,含噪语音短时傅里叶系数Yi就得到了。
S22:计算每个节点的声传输函数Hi
利用声源坐标为(sx,sy)和步骤A中产生的节点坐标,则声源与第i个节点的距离di
那么衰减系数σi就为1/di,延时τi为(li/c)fs,其中c为声速。则声传输函数为
S23:估计每个节点接收信号的噪声功率谱
对于噪声谱估计单元,利用直接谱估计算法,并对多帧噪声谱估计平均,本发明采用前T0帧(T0=5),则第i个节点接收信号的噪声功率谱估计为
S24:利用每个节点的声传输函数Hi分别对每个节点的含噪语音短时傅里叶系数Yi和噪声噪声功率谱进行MVDR预处理。对每个节点的含噪语音短时傅里叶系数Yi进行MVDR预处理的得到语音预处理结果对每个节点的噪声噪声功率谱进行MVDR预处理噪声预处理结果故语音预处理矩阵噪声预处理矩阵 其中上标”*”表示取共轭操作,(·)T表示转置操作。
S3:利用S1得出的节点的连接矩阵、节点的度和节点临近节点集合和S2得出语音预处理矩阵和噪声预处理矩阵进行分布式一致性迭代,使每个节点获得一致的MVDR语音增强时域的语音信号zi(t)。具体包括以下步骤:
S31:常用的权矩阵有最大度权,Metropolis权,最优常数权[6],其中最优常数权为一种理论计算方法,一般仅作对比实验用。本发明提出一种平均Metropolis权,设权矩阵为W=[Wij],1≤i,j≤N,利用A部分得出的节点连接矩阵,节点的度和临近节点集合,则基于平均Metropolis权算法的权矩阵为
其中,θ是一个很小的正数,为权衡因子。
S32:利用权矩阵W和B部分得出语音预处理矩阵和噪声预处理矩阵 进行分布式一致性迭代,直到收敛,得到收敛后的每个节点的MVDR波束形成语音增强结果
令迭代次数为t,第i个节点的第t次迭代的结果为构成矩阵为整个分布式算法的迭代过程可以总结为
(1)初始化迭代次数t=0,;
(2)在每个节点,利用权矩阵W和语音预处理矩阵和噪声预处理矩阵 迭代计算和第i个节点的第t次迭代的MVDR波束形成语音增强结果
如果迭代次数t超过预先设置的迭代次数阈值(本发明规定为100次),则收敛,此时的即为最后的MVDR波束形成语音增强结果;否则使t→t+1,返回到步骤(2)。
其中,步骤(2)中迭代时,利用的是网络节点通信进行信息共享迭代,节点通信过程如下所示:
(a)在初始阶段,设定网络中的所有节点处于gossip模式(能和临近节点进行信息交流)。
(b)利用随机函数随机选择多个非临近节点同时唤醒,执行以下相同操作。比如传感器节点i唤醒,如果节点i是第一次被唤醒(ti=0),进行如下“主从”关系记录:如果节点j向节点i传输过信息,节点i会记录节点j与其是“从”关系;如果节点j没有向节点i传输过信息,节点i会记录节点j与其是“主”关系。
(c)节点i的所有临近节点传输它们的加权估计到节点i,也即临近节点j传输到节点i。具体传输规则为:如果不在“主从”关系表中,那么说明节点j未被唤醒,即tj=0,此时传输如果节点j与节点i是“主”关系,说明节点j之前未向节点i传输过信息,则tj-1=ti,此时传输如果节点j与节点i是“从”关系,说明节点j之前向节点i传输过信息,则tj=ti,此时传输
(d)节点i的利用接收到的所有临近节点的和节点本身的来更新
(e)节点i更新gossip迭代ti=ti+1,并且改变模式为等待状态,一直到所有其临近节点相继被唤醒,并更新其估计值才会改变到gossip模式。
S33:迭代完毕后,对每个节点的MVDR波束形成语音增强结果Z~i(t)进行短时傅里叶反变换,就可以得到增强后的时域的语音信号zi(t)。
本发明的有益效果:
通过计算机仿真实验验证本发明方法的有效性。实验使用个人笔记本电脑,在Matlab R2009a平台上进行仿真及测试。正方形平面区域设置为10m×10m,网络节点数为20个节点,每个节点含一个麦克风及其他配套设备,组成无线声传感器网络,如图2(a)为随机生成的20个节点的示意图;图2(b)为带边的20个节点网络的连接图。语音源来自Timit数据库,从中随机挑选一个30s的语音作为样本,比如内容为”She had your dark suit ingreasy wash water all year.”的语音样本,采样率为16kHz,波形如图3(a)所示,声源坐标为(0,10m),声源信号处的信噪比设置为20dB。
从图2(a)可以看出,仿真出来的无线声传感器网络的20个节点分布比较均匀,且不存在节点重叠现象,并且基本上覆盖到了整个10m×10m的平面区域。从图2(b)可以看出,整个网络边连接比较合理,满足实验假设,也很逼近真实环境。
从图3(a)和图3(b)可以发现,不管对于含噪声源,还是干净不含噪声声源,都可以很明显的区分出不含语音段和含语音段,这很利于用初始一些语音帧方法直接估计噪声功率谱,为之后的MVDR波束形成语音增强做好铺垫。
经过幅度衰减和时延,再加上噪声后的每个节点接收的信号的信噪比如下表1所示,其中节点5和18接收的波形如下图4所示。
表1节点信噪比
从表1可以看出,经过传输加噪后,每个节点获得的信号含噪明显,并且信噪比有很大的区别,有的还较高,比如节点5的14.5dB,有的很低,比如节点18的-1.18dB。此时必须进行语音增强,才能使整个节点都获得比较好的输出。所以之后选取这两个特殊情况进行实验观察,来证实本文算法的有效性。
从图4可以看出,节点5离声源比较近,获得的信号信噪比较高,波形受噪声干扰较小,节点18离声源最远,获得的信号信噪比很低,波形受噪声干扰很大。
之后利用分布式一致性算法进行迭代,即最大度权,Metropolis权,最优常数权[6],和本发明提出的平均Metropolis权。分别采用这四种算法,和带融合中心的MVDR算法作为对比。此处使用均方误差(Mean Square Error,MSE)和段信噪比(Signal-noiseRatio,SNR)来衡量语音质量,他们的公式如下所示:
其中,Zi(k,m)是第i个节点的输出的短时傅里叶变换系数,S(k,m)是期望声源信号s的短时傅里叶变换,K,M分别表示频率因子个数和时间帧个数,即1≤k≤K,1≤m≤M。对于节点5和18,使用四种分布式一致性算法的MVDR波束输出和带融合中心的MVDR波束输出的最小均方误差和段信噪比与迭代次数的关系分别见图5和图6所示。从图5可以看出,随着迭代次数的增加,四种分布式一致性算法的MSE随之下降,这说明噪声在不断减少,信号也在不断趋向期望信号,经过二三十次迭代,节点就基本达到了最好的收敛性能,而且从图5(a)和图5(b)可以看出,每个节点都能获得一致的最好输出。并且,和期望的一样,平均Metropolis权算法相比最大度权和Metropolis权可以达到更快的收敛速度,和最优常数权算法的性能也差异很小。
从图6可以看出,随着迭代次数的增加,四种分布式一致性算法的SNR随之增加,这说明信号在慢慢逼近期望信号,经过二三十次迭代,算法就基本收 敛了,而且从图6(a)和图6(b)可以看出,每个节点都能获得几乎一样的信噪比。并且,也可以看出,平均Metropolis权算法相比最大度权和Metropolis权收敛速度更快,和最优常数权算法(此算法为理论推导算法,实际实现很难)的性能也差异很小,几乎差别不大。
经过一致性迭代后,网络的每个节点都得到了最好的语音增强结果。其中节点5和18的波形以及带融合中心的波形分别如图7所示。从图7可以看出,通过分布式一致性语音增强算法后,节点5和18都获得了一致的语音增强波束输出,并且输出和带融合中心的输出很接近,信噪比也达到了18.8dB,比每个节点增强之前的信噪比要高,表明此算法有比较好的语音增强效果。
当输入信号信噪比改变时,也即从0变化到20时,增强前后的节点接收信号的信噪比如下表所示。
表2不同输入信噪比时增强前后节点信噪比
从表2可以看出,对于不同的输入信噪比的信号,增强后的信号信噪比都比增强之前要强不少,并且还很接近输入信噪比,基本能抵消由于距离造成的信号幅度衰减,这对之后利用增强的信号做研究很有利,比如网络定位,跟踪等。
由上述实验可得到如下结论:(1)本发明的分布式语音增强方法,完成了语音的分布式估计,得到了与含融合中心的MVDR算法的方法质量一致的语音增强结果。(2)提出的基于分布式一致性和MVDR的分布式麦克风语音增强方法,其完全脱离了传统方法的框架,不再使用任何融合中心,而是采用分布式算法,因而大幅度减少了网络传输代价和节省了网络节点能量。(3)从实际分布式一致 性效果来看,提出的方法中一致性迭代的迭代次数仅为12次左右,仅需花费数十分钟就可以获得较高质量的语音增强效果。因此,本发明具有广泛的应用价值和前景。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
参考文献
[1]S.M.Golan,S.Gannot,I.Cohen.Distributed GSC beamforming using therelative transfer function,IEEE Proceedings of the 20th European SignalProcessing Conference,Bucharest,Romania,2012:1274-1278.
[2]A.Bertrand,M.Moonen.Distributed LCMV beamforming in a wirelesssensor network with single-channel per-node signal transmission.IEEETransactions on Signal Processing,2013,61(13):3447-3459.
[3]S.M.Golan,A.Bertrand,M.Moonen,et al.Optimal distributed minimum-variance beamforming approaches for speech enhancement in wireless acousticsensor networks.Signal Processing,2015,107:4-20.
[4]M.Brandstein and D.Ward,Microphone arrays,Springer,2001.
[5]H.f.Salama.Multical routing for real-time Communication on high-speed networks.Nouth Carolina State University,department of electrical andcomputer engineering,1996
[6]L Xiao,S.Boyd.Fast linear iterations for distributedaveraging.Systems &Control Letters,2004,53(1):65-78.

Claims (6)

1.一种基于分布式一致性和MVDR波束形成的分布式语音增强方法,其特征在于:包括以下步骤:
S1:利用改进的随机声传感器网络生成算法生成传感器网络节点的坐标,计算节点的连接矩阵、节点的度和节点临近节点集合;
S2:利用S1中生成的传感器网络接收含噪语音信号,对每个节点接收的含噪语音信号进行MVDR预处理获得语音预处理矩阵和噪声预处理矩阵
S3:利用S1得出的节点的连接矩阵、节点的度和节点临近节点集合和S2得出语音预处理矩阵和噪声预处理矩阵进行分布式一致性迭代,使每个节点获得一致的MVDR语音增强时域的语音信号zi(t)。
2.根据权利要求1所述的一种基于分布式一致性和MVDR波束形成的分布式语音增强方法,其特征还在于:S1中具体采用如下方式:
S11:在一个b×b平面上设计一个坐标轴;
S12:产生节点坐标:对于确定的网络节点数N,在平面坐标上随机产生10*N个坐标,利用K均值聚类算法对这些坐标进行聚类,产生N个聚类中心,记下此时N个聚类中心的坐标(xi,yi),其中i=1,2,…,N,即为节点坐标;
S13:检测所有节点是否存在边,进而得到节点连接矩阵A=[aij],1≤i,j≤N,采用如下公式(1)确定网络节点gi与gj是否存在一条直接相连的边,若概率大于0.5,则节点vi与vj存在边,并使aij=1,否则不存在,使aij=0;
<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>k</mi> <mi>e</mi> </mrow> <mi>N</mi> </mfrac> <mi>&amp;beta;</mi> <mi>exp</mi> <mfrac> <mrow> <mo>-</mo> <mi>l</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>L</mi> <mi>&amp;alpha;</mi> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
其中:k为常数,e为网络平均节点度参数,l(i,j)表示节点gi与gj之间的几何距离,L为网络拓扑图中所有节点几何距离的最大值,α和β为调节网络特性的参数,范围为(0,1],α决定长边和短边的比例,β决定网络的度数;
S14:求出所有节点的度,其中节点vi的度din(gi)为:
<mrow> <msub> <mi>d</mi> <mrow> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>a</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
S15:求出所有节点的临近节点集合,其中节点gi的临近节点集合Ci为:
Ci={gj∈G|aij=1}。 (3)
3.根据权利要求1所述的一种基于分布式一致性和MVDR波束形成的分布式语音增强方法,其特征还在于:S2中具体采用如下方式:
S21.对每个节点接收的含噪语音信号进行短时傅里叶变换,得到含噪语音短时傅里叶系数Yi
S22.计算每个节点的声传输函数Hi
令声源与第i个节点的距离为di,则衰减系数σi为1/di,延时τi为(li/c)fs,其中c为声速,故声传输函数为
<mrow> <msub> <mi>H</mi> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>&amp;sigma;</mi> <mi>i</mi> </msub> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>j</mi> <mn>2</mn> <msub> <mi>&amp;pi;k&amp;tau;</mi> <mi>i</mi> </msub> </mrow> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>
S23.估计每个节点接收信号的噪声功率谱δi 2
对于噪声谱估计单元,利用直接谱估计算法,并对多帧噪声谱估计平均,本发明采用前T0帧(T0=5),则第i个节点接收信号的噪声功率谱δi 2估计为
<mrow> <msubsup> <mi>&amp;delta;</mi> <mi>i</mi> <mn>2</mn> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <msub> <mi>T</mi> <mn>0</mn> </msub> <mi>K</mi> </mrow> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>T</mi> <mn>0</mn> </msub> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </munderover> <mo>|</mo> <msub> <mi>Y</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>
S24.利用每个节点的声传输函数Hi分别对每个节点的含噪语音短时傅里叶系数Yi和噪声噪声功率谱δi 2进行MVDR预处理,对每个节点的含噪语音短时傅里叶系数Yi进行MVDR预处理的得到语音预处理结果对每个节点的噪声噪声功率谱δi 2进行MVDR预处理噪声预处理结果故语音预处理矩阵噪声预处理矩阵其中上标”*”表示取共轭操作,(·)T表示转置操作。
4.根据权利要求1所述的一种基于分布式一致性和MVDR波束形成的分布式语音增强方法,其特征还在于:S3中具体采用如下方式:
S31:利用S1中得出的节点的连接矩阵、节点的度和节点临近节点集合计算平均Metropolis权算法的权矩阵W;设权矩阵为W=[Wij],1≤i,j≤N,利用S1得出的节点连接矩阵,节点的度和临近节点集合,则基于平均Metropolis权算法的权矩阵为
其中:θ是一个很小的正数,为权衡因子;
S32:利用权矩阵W和S2中得出语音预处理矩阵和噪声预处理矩阵进行分布式一致性迭代,直到收敛,得到收敛后的每个节点的MVDR波束形成语音增强结果
S33:迭代完毕后,对每个节点的MVDR波束形成语音增强结果进行短时傅里叶反变换,就可以得到增强后的时域的语音信号zi(t)。
5.根据权利要求4所述的一种基于分布式一致性和MVDR波束形成的分布式语音增强方法,其特征还在于:S32中具体采用如下方式:令迭代次数为t,第i个节点的第t次迭代的结果为构成矩阵为整个分布式算法的迭代过程如下:
S32(1):初始化迭代次数t=0;
S32(2):在每个节点,利用权矩阵W和语音预处理矩阵和噪声预处理矩阵迭代计算和第i个节点的第t次迭代的MVDR波束形成语音增强结果
<mrow> <mover> <mi>Y</mi> <mo>~</mo> </mover> <mrow> <mo>(</mo> <mi>t</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <mi>W</mi> <mover> <mi>Y</mi> <mo>~</mo> </mover> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow>
<mrow> <mover> <mi>N</mi> <mo>~</mo> </mover> <mrow> <mo>(</mo> <mi>t</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <mi>W</mi> <mover> <mi>N</mi> <mo>~</mo> </mover> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>12</mn> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mover> <mi>Z</mi> <mo>~</mo> </mover> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mover> <mi>Y</mi> <mo>~</mo> </mover> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mover> <mi>N</mi> <mo>~</mo> </mover> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>13</mn> <mo>)</mo> </mrow> </mrow>
S32(3):如果迭代次数t超过预先设置的迭代次数阈值,则收敛,此时的即为最后的MVDR波束形成语音增强结果;否则使t→t+1,返回到步骤S32(2)。
6.根据权利要求5所述的一种基于分布式一致性和MVDR波束形成的分布式语音增强方法,其特征还在于:步骤S32(2)中迭代时,利用的是网络节点通信进行信息共享迭代,节点通信过程如下所示:
A、在初始阶段,设定网络中的所有节点处于gossip模式,能和临近节点进行信息交流;
B、利用随机函数随机选择多个非临近节点同时唤醒,执行以下相同操作;如传感器节点i唤醒,如果节点i是第一次被唤醒(ti=0),进行如下“主从”关系记录:如果节点j向节点i传输过信息,节点i会记录节点j与其是“从”关系;如果节点j没有向节点i传输过信息,节点i会记录节点j与其是“主”关系;
C、节点i的所有临近节点传输它们的加权估计到节点i,即临近节点j传输到节点i,具体传输规则为:如果不在“主从”关系表中,那么说明节点j未被唤醒,即tj=0,此时传输如果节点j与节点i是“主”关系,说明节点j之前未向节点i传输过信息,则tj-1=ti,此时传输如果节点j与节点i是“从”关系,说明节点j之前向节点i传输过信息,则tj=ti,此时传输
D、节点i的利用接收到的所有临近节点的和节点本身的来更新
<mrow> <msub> <mover> <mi>Y</mi> <mo>~</mo> </mover> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>i</mi> </mrow> </msub> <msub> <mover> <mi>Y</mi> <mo>~</mo> </mover> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>&amp;Element;</mo> <msub> <mi>C</mi> <mi>i</mi> </msub> </mrow> </munder> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mover> <mi>Y</mi> <mo>~</mo> </mover> <mi>j</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>14</mn> <mo>)</mo> </mrow> </mrow>
<mrow> <msub> <mover> <mi>N</mi> <mo>~</mo> </mover> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>i</mi> </mrow> </msub> <msub> <mover> <mi>N</mi> <mo>~</mo> </mover> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>&amp;Element;</mo> <msub> <mi>C</mi> <mi>i</mi> </msub> </mrow> </munder> <msub> <mi>W</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msub> <mover> <mi>N</mi> <mo>~</mo> </mover> <mi>j</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>15</mn> <mo>)</mo> </mrow> </mrow>
E、节点i更新gossip迭代ti=ti+1,并且改变模式为等待状态,一直到所有其临近节点相继被唤醒,并更新其估计值才会改变到gossip模式。
CN201510212600.9A 2015-04-29 2015-04-29 一种基于分布式一致性和mvdr波束形成的分布式语音增强方法 Active CN104952459B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510212600.9A CN104952459B (zh) 2015-04-29 2015-04-29 一种基于分布式一致性和mvdr波束形成的分布式语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510212600.9A CN104952459B (zh) 2015-04-29 2015-04-29 一种基于分布式一致性和mvdr波束形成的分布式语音增强方法

Publications (2)

Publication Number Publication Date
CN104952459A CN104952459A (zh) 2015-09-30
CN104952459B true CN104952459B (zh) 2018-05-15

Family

ID=54167070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510212600.9A Active CN104952459B (zh) 2015-04-29 2015-04-29 一种基于分布式一致性和mvdr波束形成的分布式语音增强方法

Country Status (1)

Country Link
CN (1) CN104952459B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105699988B (zh) * 2016-02-02 2018-06-22 西安建筑科技大学 用于导航接收机的去噪mvdr欺骗干扰抑制方法
CN108494682B (zh) * 2018-03-20 2020-11-06 山东大学 Ad hoc网络中基于平均节点度改进的Gossip路由方法及装置
CN109308904A (zh) * 2018-10-22 2019-02-05 上海声瀚信息科技有限公司 一种阵列语音增强算法
CN110289011B (zh) * 2019-07-18 2021-06-25 大连理工大学 一种用于分布式无线声传感器网络的语音增强系统
CN112820287B (zh) * 2020-12-31 2024-08-27 乐鑫信息科技(上海)股份有限公司 分布式语音处理系统及方法
CN113763984B (zh) * 2021-09-23 2023-10-31 大连理工大学 一种用于分布式多说话人的参数化噪声消除系统
CN114613383B (zh) * 2022-03-14 2023-07-18 中国电子科技集团公司第十研究所 一种机载环境下多输入语音信号波束形成信息互补方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101903948A (zh) * 2007-12-19 2010-12-01 高通股份有限公司 用于基于多麦克风的语音增强的系统、方法及设备
CN102969000A (zh) * 2012-12-04 2013-03-13 中国科学院自动化研究所 一种多通道语音增强方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101903948A (zh) * 2007-12-19 2010-12-01 高通股份有限公司 用于基于多麦克风的语音增强的系统、方法及设备
CN102969000A (zh) * 2012-12-04 2013-03-13 中国科学院自动化研究所 一种多通道语音增强方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Informed Spatial Filtering for Sound Extraction Using Distributed Microphone Arrays;Maja Taseska etc;<ACM TRANSACTIONS AUDIO, SPEECH, AND LANGUAGE PROCESSING>;20140730;第22卷(第7期);1195-1207 *
Optimal distributer minimum-variance beamforing approaches for speech enhancement in wireless acoustic sensor networks;Shmulik Markovich-Golan etc;<Signal Processing>;20150228;4-20 *

Also Published As

Publication number Publication date
CN104952459A (zh) 2015-09-30

Similar Documents

Publication Publication Date Title
CN104952459B (zh) 一种基于分布式一致性和mvdr波束形成的分布式语音增强方法
Liao et al. The Rayleigh fading channel prediction via deep learning
Cheng et al. Downlink and uplink intelligent reflecting surface aided networks: NOMA and OMA
Lee et al. Deep power control: Transmit power control scheme based on convolutional neural network
Liu et al. Channel state information prediction for adaptive underwater acoustic downlink OFDMA system: Deep neural networks based approach
Tan et al. Improving massive MIMO message passing detectors with deep neural network
Sun et al. Deep learning-based long-term power allocation scheme for NOMA downlink system in S-IoT
CN107703486A (zh) 一种基于卷积神经网络cnn的声源定位算法
Geng et al. Hierarchical reinforcement learning for relay selection and power optimization in two-hop cooperative relay network
Chen et al. Impact of topology on performance and energy efficiency in wireless sensor networks for source extraction
Mabrook et al. Cooperative spectrum sensing optimization based adaptive neuro-fuzzy inference system (ANFIS) in cognitive radio networks
Zhang et al. Power versus spectrum 2-D sensing in energy harvesting cognitive radio networks
Shi et al. Active RIS-aided EH-NOMA networks: a deep reinforcement learning approach
Ning et al. Energy‐aware cooperative and distributed channel estimation schemes for wireless sensor networks
Zia et al. Deep learning for Parametric Channel Estimation in massive MIMO systems
Li et al. An augmented diffusion algorithm with bidirectional communication for a distributed active noise control system
Singh et al. Channel estimation for intelligent reflecting surface aided communication via graph transformer
Wang et al. Federated learning for precoding design in cell-free massive mimo systems
CN102938666B (zh) 一种下行多小区联合波束成形方法
Li et al. Virtual Time‐Inverse OFDM Underwater Acoustic Channel Estimation Algorithm Based on Compressed Sensing
Mathew et al. Semi blind neural network based channel estimation technique for OFDM receivers
Wu et al. Application of C1DAE-ANIL in end-to-end communication of IRS-assisted UAV system
Beritelli et al. Reducing interferences in wireless communication systems by mobile agents with recurrent neural networks-based adaptive channel equalization
Chi et al. A Combination Rule Based on Signal Power for Distributed Blind Equalization
Schlegel et al. Effective communications over doubly-selective acoustic channels using iterative signal cancelation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant