CN110473565A - 一种无需源数估计的独立向量分析信号分离方法 - Google Patents
一种无需源数估计的独立向量分析信号分离方法 Download PDFInfo
- Publication number
- CN110473565A CN110473565A CN201910597276.5A CN201910597276A CN110473565A CN 110473565 A CN110473565 A CN 110473565A CN 201910597276 A CN201910597276 A CN 201910597276A CN 110473565 A CN110473565 A CN 110473565A
- Authority
- CN
- China
- Prior art keywords
- signal
- separation
- source
- matrix
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Complex Calculations (AREA)
Abstract
本发明属于信号处理技术领域,公开的一种无需源数估计的独立向量分析信号分离方法,是在语音信号源数未知的情况下,设置初始化分离矩阵维数以及如何修改优化迭代方程;对分离得到的与观测信号个数相同的分离信号,进行冗余信号检测与剔除,从而得到原始语音信号的准确估计信号。本发明即可应用独立向量分析方法对观测到的混叠信号进行信号分离的技术思路,可以避免信号源数目估计的工作,降低信号分离工作量与复杂度,提高独立向量分析方法的适用性。
Description
技术领域
本发明属于信号处理技术领域,尤其涉及电磁环境分析领域的一种无需源数估计的独立向量分析信号分离方法。
背景技术
在日常生活中,经常会同时接收到各种各样的语音信号,但是一般我们只对其中的某些语音信号感兴趣。通常可以通过传感器收集到这些信号,然而,这些所收集到的信号往往不是我们预想中的纯净语音信号,而是由很多语音信号组合在一起的混合语音信号,其中可能包括了环境的噪声、干扰的相关源信号、信号在环境中的反射等,这些一般均是未知的。同时,由于信号在传输的过程中的种种复杂性表征,导致我们并不知晓源信号是以什么样的方式混合在一起的。这种情况之下,我们要想获得所需的纯净信号并非易事。盲源分离便是解决这一问题的有效方法,它的目的就在于能从复杂混合信号中提取出我们所需要的信号,获得我们所需要的信息。
盲源分离就是在源信号与混合通道参数均未知的情形下,仅靠传感器对信号进行观测,并根据此观测值进行源信号估计的方法。这里的“盲’,具有两个意义:一是指源信号不能直接观测到;二是指混合信道特性参数是未知的。在实际问题中,都可以做出这样的假定,即诸多观测信号均为不可见源信号的混合。目前,盲源分离已成为国际上信号处理等技术领域的研究热点,己经获得了许多较为成熟的方法,尤其是在处理线性瞬时混合信号方面,现有的相关研究已经可以达到较好的分离效果。然而在实际环境中,信号在传输过程中会受到多种复杂因素的影响,这些因素一般包括时延、衰减、反射等,它们直接导致了传感器最终所收到的信号并不是理想中的信号,而是源信号经复杂卷积混合过程后的信号。卷积盲源分离模型由于具有更广泛的适用性,引起了广大学者的浓厚研究兴趣,其中一个重要应用领域就是语音信号分离。卷积盲源分离问题也是盲源分离方面的一个技术难点,有效的解决方法还不多见。一般而言,卷积混合信号盲分离的方法可以分为时域与频域两大类。通常情况下,时域方法为了实现盲分离,会采用分离滤波器对混合信号进行解卷积,由于混合信道的先验知识一般在事先并不为人所知,这就要求在解卷积之前,要按照混合环境的实际情况来确定分离滤波器的阶数。而滤波器阶数的设定至关重要,如果阶数选取过小的话,会对获得良好分离效果的目的产生不良影响;如果阶数选取过大,则会使得算法难以收敛,并导致较大的计算量。另一类方法是频域方法,它要求进行短时傅立叶变换,把时域的卷积混合信号变换成为频域的瞬时混合信号,经过这样的一个变换过程之后,就能利用已有的相对较为成熟的瞬时混合盲分离方法在每个频率段上展开分离步骤。无疑频域方法的算法相对于时域方法而言比较简单,并且其计算量亦相对较小。然而在频域盲源分离算法中,仍然存在着一定的缺陷,即在每个频率段上,会产生分离信号的比例与次序不确定问题,这些问题正是决定卷积混合盲分离结果成功与否的关键所在。所以如何解决比例与次序不确定问题吸引了许多研究者的关注。
为解决盲源分离算法在应用中存在的每个频点分离信号次序与比例不确定性的问题,加利福尼亚大学的InateLee等人于2007提出了一种新的独立分量分析(IndependentComponent Analysis,ICA)模型,称为独立向量分析(Independent Vector Analysis,IVA)模型。该方法一经提出,就迅速在盲源分离领域掀起一股研究热潮,在解决语音等信号分离方面显示出巨大的技术潜力。但是IVA方法同ICA方法一样,在应用其进行信号分离之前,需要的一个输入条件是信号源的个数,信号源的个数必须是已知的,或者通过信息论准则、盖尔圆准则、奇异值分解等方法估计得到。源数估计问题是信号参数估计领域的另一个研究热点,也是一个技术难点,源数估计准确与否,对盲源分离算法的应用影响很大,对IVA算法的影响也是如此。同时,在对观测信号实施信号分离之前,进行源数估计,无疑增大了整个信号分离工作的复杂度,增加了信号处理时间。参考文献[1]Intae Leea,Taesu Kimb,Te-Won Lee.Fast fixed-point independent vector analysis algorithms forconvolutive blind source separation[J].Signal Processing,2007,87:1859-1871;[2]成玮,张周锁,何正嘉.采用信息理论准则的信号源数估计方法及性能对比[J].西安交通大学学报,2015,49(8):38-44;[3]付卫红,张琮.基于步长自适应的独立向量分析卷积盲分离算法[J].电子与信息学报,2018,40(7):1-7。
发明内容
为克服现有技术的不足,本发明提供了一种无需源数估计的独立向量分析信号分离方法。本发明能够对语音信号等进行处理,实现延时、多径等复杂环境中的信号分离工作。
为实现上述发明目的,本发明采用如下技术方案:
一种无需源数估计的独立向量分析信号分离方法,是在语音信号源数未知的情况下,设置初始化分离矩阵维数以及如何修改优化迭代方程;对分离得到的与观测信号个数相同的分离信号,进行冗余信号检测与剔除,从而得到原始语音信号的准确估计信号;其步骤如下:
(1)分离矩阵初始化方法及迭代方程改进方法,设天线阵元数为m,信号个数为n,在IVA算法中,初始化的分离矩阵表示为Wn×n经典IVA算法要求n已知,或通过专门的源数估计算法估计得到;若m>n,需对观测信号进行主成分分析降维处理,使得降维后的观测信号为n维,然后再设置初始化分离矩阵Wn×n;IVA算法中采用的优化目标函数的方法——自然梯度法的迭代方程表示为:
式中,k表示迭代步数,α(k)表示迭代步长,In×n表示n×n维的单位矩阵,E{·}表示求期望,表示非线性函数,它与源信号的概率密度函数有关,yT表示第k步迭代得到的分离信号,其中上标T表示转置;
在独立向量分析算法的基础上,采用的无需源数估计的独立向量分析算法技术是:不再按照原方法设置初始化的分离矩阵Wn×n,而是将初始化的分离矩阵设置为Wm×m,也就是根据观测信号的个数设置初始化分离矩阵维数;完成初始化分离矩阵设置后,IVA方法所用优化算法中的迭代方程相应需要改进,以自然梯度法式(6)所示,其迭代方程应改进为:
改进后的迭代式中,各物理量的意义与式(6)中的对应物理量相同,只是每一步迭代后得到的分离信号y的维数由n变为m。
再以对目标函数进行优化中的另一种优秀算法等变自适应分解算法EASI(equivariant adaptive source separation via independence)说明对迭代方程进行改进的方法:
原始等变自适应分解算法的迭代方程为:
式中,各物理量的意义与式(7)对应物理量相同;
等变自适应分解算法的迭代方程修改为:
与式(8)相比,每一迭代后分离信号y的维数由式(8)中的n维变为式(9)中的m维;
源信号个数已经获知的盲信号分离中,当混合—分离系统的全局矩阵Gn×n=Wn×n·An×n更新到广义交换矩阵时,分离系统的输出基本等于源信号的拷贝,信号幅值、排列顺序及信噪比会发生一定变化,这时就认为算法实现了盲信号分离;
在源信号个数未知的IVA模型式(2)中,若能够实现所有的源信号至少被重构一次,则就达到了信号分离的目的;所以,当分离模型式(3)的输出信号中n个是独立分量,其它m-n个分量是一个或者多个独立分量的拷贝或零信号时,就认为算法已经实现了信号分离;记由源信号做前n个分量,从分离得到的源信号向量s的分量和零信号中任意取m-n个分量,会出现重复信号或冗余信号,作后m-n个分量;所取源信号依下标由小到大顺序排列记为则这样的向量总共有个,它们构成的集合记做Ω;引入集合Ω后,可分离性叙述为:当且仅当分离模型式(3)的输出等于G是一个广义交换矩阵的全局矩阵,时,就认为算法已经实现了信号分离,此时每一个源信号在输出中至少出现一次;
(2)分离后的重复或冗余信号剔除方法,根据分离矩阵初始化方法以及优化方程迭代式的改进,进行信号分离后,分离得到m个分离信号;虽然这m个分离信号中包含n个源信号的估计,但是还有m-n个重复或冗余信号需要剔除;
(3)针对m-n个重复或冗余信号的剔除方法,具体实施如下:
①相关性检测法,需要对分离得到的源信号进行相关性检测,假设根据m个接收信号矩阵分离得到m个源信号分量,这里准确的源信号个数n是未知的,则通过对m个分离信号计算其互相关系数,得到如下矩阵:
显然,矩阵对角线元素表示分离信号的自相关系数,必然都为1,矩阵中其他元素表示信号之间的互相关系数;若某元素非常接近于±1或为±1,则表示两个信号十分相似或相同;通过检测相关系数矩阵C,剔除冗余信号,即得到n个源信号的准确估计;
②试听判决法,若通过相关性检测法无法剔除冗余信号,采用分离信号的试听判决法进行冗余信号的剔除;即有用信号经IVA算法分离后,其中混叠的其他信号或噪声成分极少,语音质量好;而分离得到的其他信号,则由于混叠噪声或其他信号,语音质量极差。通过试听即可清晰判别出哪些是有用信号,该方法只适用于语音信号。
一种无需源数估计的独立向量分析信号分离方法,所述的无需源数估计的独立向量分析信号分离流程,其步骤如下:
步骤1:对混合信号x(t)进行短时傅里叶变换,转换为各个频率点的线性瞬时混合复值信号;步骤2:对各频率点的混合信号进行中心化和白化预处理;
步骤3:使用JADE算法初始化各频点的分离矩阵Wm×m(ω),并初始化迭代步长η(1);
步骤4:根据Y(ω)=Wm×m(ω)X(ω)来估计各频点的源信号;
步骤5:根据估计出的源信号来计算目标函数和非线性函数,并判断分离矩阵是否收敛。若收敛,执行步骤9;
步骤6:根据下式来更新各频点分离矩阵
其中,k指迭代次数,G'(·)是G(·)的1阶导数,η(k)是步长参数;
步骤7:根据各频点分离矩阵更新迭代步长;
步骤8:若达到最大迭代次数,输出最终各频点分离信号,否则返回步骤4;
步骤9:将各频点分离信号经短时傅里叶逆变换恢复成时域信号;
步骤10:根据冗余信号剔除方法,删除冗余信号,获得最终的分离信号。
一种无需源数估计的独立向量分析信号分离方法,所述无需源数估计的独立向量分析信号分离方法还适用于需要设置初始化分离矩阵的自然梯度法,或等变自适应分解法。
由于采用如上所述的技术方案,本发明具有如下实施的优越性:
本发明一种无需源数估计的独立向量分析信号分离方法的有益效果主要是:
一,克服了现有独立向量分析算法在应用前需要预先知道源信号个数,或者需要通过其他算法估计得到源信号个数,以作为独立向量分析算法的一个输入条件的问题,简化了信号分离的工作流程与复杂度,避免源数估计不准确对信号分离带来的不利影响;
二,现有的源数估计方法通常适用于观测信号数多于源数情况下,当观测信号数等于源数时,现有源数估计方法将无法估计出源数,那么当观测信号数等于源数时,若无法估计得到源数,盲源分离算法也将无法应用。采用本发明技术方案,克服了传统源数估计方法在观测信号数等于源数时无法实现源数估计,从而不能应用盲源分离算法进行信号分离的问题。
附图说明
图1是一个2×2维的IVA算法混合模型的示意图。
图2a为实验一关键阶段信号波形的2个原始语音信号图。
图2b为观测到的混叠信号图。
图2c为分离得到的语音信号图。
图3a为实验二关键阶段信号波形的3个原始语音信号图。
图3b为观测到的混叠信号图。
图3c为分离得到的语音信号图。
具体实施方案
以下将结合附图及实例详细说明本发明的实施方式,此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的限定。
如图1、2a、2b、2c、3a、3b、3c所示,本发明是针对独立向量分析方法在应用其进行信号分离之前,需要预先知道信号源数目或通过其他算法估计得到信号源数目的问题,提出的一种无需源数估计;具体要求如下:
卷积盲源分离的数学模型
实际环境中由于源信号既存在直达传输路径又存在反射传输路径,每个路径又有各自的传输时间和传输通道,所以第i个传感器上接收到的混合信号用数学表达式可以表示为:
其中,i=1,2,…,m。sj(t)表示第j个源信号,xi(t)表示第i个混合信号,*表示卷积运算,hij表示第j个源信号到第i个传感器之间的传输函数,P是传输函数的阶数。即接收到的信号是各个源信号的卷积混合,此时线性瞬时混合盲源分离问题变为线性卷积盲源分离问题。
为方便起见,把式(1)所示模型表示为向量形式可得:
其中:
是指延迟为p时的混合滤波器矩阵。
因为反射路径越长信号能量的衰减越大,同时反射物也会吸收信号的一部分能量,因此可以用一个有限冲激响应(FIR)滤波器来近似传输函数hij。卷积混合盲分离目的就是找到一个Q阶的n×n的分离滤波器矩阵W(q),使得
频域方法的思想是:利用短时傅里叶变换(STFT)将时域上的卷积混合过程转换成频域上各个频率点上的瞬时混合过程。短时傅里叶变换的数学表达式为:
其中,n是信号采样后的时间变量,L和l分别是傅里叶变换的帧数和滑动长度,ω=0,1,…,L-1是频率索引,m是新生成的时间索引,win(n)窗函数。对式(2)两边进行STFT,可以得到信号卷积混合的时频域形式:
X(ω,m)=A(ω)S(ω,m) (5)
其中,S(ω,m)=[S1(ω,m),S2(ω,m),…,Sn(ω,m)]T,X(ω,m)=[X1(ω,m),X2(ω,m),…,Xm(ω,m)]T。如果短时傅里叶帧长L远大于混响脉冲响应的长度P,那么就可以认为式(2)表示的时域卷积混合的过程在各频率点ω上成为式(5)所示的瞬时混合形式,然后在每个频点上就可以使用ICA算法分离混合信号。但由于每个频点的分离过程是独立的,因此ICA的排序模糊性会导致各频点分离信号的顺序不一致,从而无法正确还原出时域估计信号。
独立向量分析算法的模型
独立向量分析(Independent Vector Analysis,IVA)是一种扩展的ICA算法,利用多维变量成分中各元素之间的内在关联性有效避免了排序模糊性问题。但IVA的模型由一组标准的频域ICA模型组成。
在卷积盲源分离的数学模型中,提到了频域ICA算法是在单个频率点上对混合信号进行分离,而ICA模型中不同频率点上的源信号分量是存在内在联系的。IVA算法利用这一点将这些存在联系的单变量成分归结为一个多维变量或向量。因此IVA算法的分离过程是在所有频点上整体分离出独立的频域成分,这一频域成分是整个频域源信号的一个估计,该成分中各元素是同一个时域源信号在各个频率点上对应的频域分量。
附图1所示的是一个2×2维的IVA算法混合模型。从图示混合模型可见,IVA模型中的每一层对应着一个瞬时混合过程,即式(5)所表示的单频点混合模型(为了推导和书写方便省略时间索引m)。因此IVA的混合模型满足卷积混合信号的盲分离在频域上的混合模型。由于IVA算法将多维变量作为一个整体来分离,理论上分离后自然不会出现排序模糊性问题。
一种无需源数估计的独立向量分析信号分离方法,是在语音信号源数未知的情况下,设置初始化分离矩阵维数以及如何修改优化迭代方程;对分离得到的与观测信号个数相同的分离信号,进行冗余信号检测与剔除,从而得到原始语音信号的准确估计信号。即可应用独立向量分析方法对观测到的混叠信号进行信号分离的技术思路,可以避免信号源数目估计的工作,降低信号分离工作量与复杂度,提高独立向量分析方法的适用性。
(1)分离矩阵初始化方法及迭代方程修改方法
设天线阵元数为m,信号个数为n,在IVA算法中,初始化的分离矩阵可表示为Wn×n(经典IVA算法要求n已知,或通过专门的源数估计算法估计得到。若m>n,需对观测信号进行主成分分析降维处理,使得降维后的观测信号为n维,然后再设置初始化分离矩阵Wn×n)。IVA算法中主要采用的优化目标函数的方法之一自然梯度法的迭代方程表示为:
式中,k表示迭代步数,α(k)表示迭代步长,In×n表示n×n维的单位矩阵,E{·}表示求期望,表示非线性函数,它与源信号的概率密度函数有关,其设置可参考余先川,胡丹著《盲源分离理论与应用》第6章,或其它文献。yT表示第k步迭代得到的分离信号,其中上标T表示转置。
在卷积盲源分离的数学模型、独立向量分析算法的模型所示独立向量分析算法的基础上,本发明提出的无需源数估计的独立向量分析算法技术思路是:
不再按照原方法设置初始化的分离矩阵Wn×n,而是将初始化的分离矩阵设置为Wm×m,也就是根据观测信号的个数设置初始化分离矩阵维数。完成初始化分离矩阵设置后,IVA方法所用优化算法中的迭代方程相应需要修改,以自然梯度法为例,如式(6)所示,其迭代方程应修改为:
修改后的迭代式中,各物理量的意义与式(6)中的对应物理量相同,只是每一步迭代后得到的分离信号y的维数由n变为m。
再以对目标函数进行优化中常用的另一种优秀算法等变自适应分解算法EASI(equivariant adaptive source separation via independence)为例,说明基于本发明对迭代方程进行修改的方法。
原始等变自适应分解算法的迭代方程为:
式中,各物理量的意义与式(7)对应物理量相同。
根据本发明思路,等变自适应分解算法的迭代方程可修改为:
需要强调的式,与式(8)相比,每一迭代后分离信号y的维数由式(8)中的n维变为式(9)中的m维。
针对其他优化方法,亦可以根据本专利技术思路对迭代方程进行相应修改,从而避免源数估计的复杂工作。
源信号个数已经获知的盲信号分离中,当混合—分离系统的全局矩阵Gn×n=Wn×n·An×n更新到广义交换矩阵时,分离系统的输出基本等于源信号的拷贝(信号幅值、排列顺序及信噪比会发生一定变化),这时就认为算法实现了盲信号分离。在源信号个数未知的IVA模型式(2)中,若能够实现所有的源信号至少被重构一次,则就达到了信号分离的目的。所以,当分离模型式(3)的输出信号中n个是独立分量,其它m-n个分量是一个或者多个独立分量的拷贝或零信号时,就认为算法已经实现了信号分离。记由源信号做前n个分量,从分离得到的源信号向量s的分量和零信号中任意取m-n个分量(可能出现重复信号或冗余信号)作后m-n个分量(所取源信号依下标由小到大顺序排列)记为则这样的向量总共有个,它们构成的集合记做Ω。引入集合Ω后,可分离性就可以简单的叙述为:当且仅当分离模型式(3)的输出等于G是一个广义交换矩阵(全局矩阵),时,就认为算法已经实现了信号分离,此时每一个源信号在输出中至少出现一次。
(2)分离后的重复或冗余信号剔除方法
根据本发明的分离矩阵初始化方法以及优化方程迭代式修改方法,进行信号分离后,可分离得到m个分离信号。虽然这m个分离信号中包含我们关心的n个源信号的估计,但是还有m-n个重复或冗余信号需要剔除。
本发明针对m-n个重复或冗余信号的剔除方法为:
①相关性检测法
需要对分离得到的源信号进行相关性检测,假设根据m个接收信号矩阵分离得到m个源信号分量,这里准确的源信号个数n是未知的,则通过对m个分离信号计算其互相关系数,得到如下矩阵:
显然,矩阵对角线元素表示分离信号的自相关系数,必然都为1,矩阵中其他元素表示信号之间的互相关系数。若某元素非常接近于±1或为±1,则表示两个信号十分相似或相同。通过检测相关系数矩阵C,剔除冗余信号,即可得到n个源信号的准确估计。
②试听判决法
若通过相关性检测法无法剔除冗余信号,可采用分离信号的试听判决法进行冗余信号的剔除。其原理是,有用信号经IVA算法分离后,其中混叠的其他信号或噪声成分极少,语音质量好。而分离得到的其他信号,则由于混叠噪声或其他信号,语音质量极差。通过试听即可清晰判别出哪些是有用信号。该方法只适用于语音信号。
以基于步长自适应的IVA算法为例,给出采用本发明技术思路的改进后算法的实施步骤如下(实际上本发明不仅适用于下述方法,还适用于需要设置初始化分离矩阵的其他方法,如自然梯度法,等变自适应分解法等):
步骤1:对混合信号x(t)进行短时傅里叶变换,转换为各个频率点的线性瞬时混合复值信号;采用公开文献已有步骤;
步骤2:对各频率点的混合信号进行中心化和白化预处理;采用公开文献已有步骤;
步骤3:使用JADE算法初始化各频点的分离矩阵Wm×m(ω),并初始化迭代步长η(1);
步骤4:根据Y(ω)=Wm×m(ω)X(ω)来估计各频点的源信号;
步骤5:根据估计出的源信号来计算目标函数和非线性函数,并判断分离矩阵是否收敛。若收敛,执行步骤9;
步骤6:根据下式来更新各频点分离矩阵
其中,k指迭代次数,G'(·)是G(·)的1阶导数,η(k)是步长参数;
步骤7:根据各频点分离矩阵更新迭代步长;采用公开文献已有步骤;
步骤8:若达到最大迭代次数,输出最终各频点分离信号,否则返回步骤4;采用公开文献已有步骤;
步骤9:将各频点分离信号经短时傅里叶逆变换恢复成时域信号;采用公开文献已有步骤;
步骤10:根据本发明提出的冗余信号剔除方法,删除冗余信号,获得最终的分离信号。
下面结合仿真图对本发明做进一步的描述。
本发明的实验验证是在DELL9020MT型个人计算机,Intel(R)Core(TM)i7-4770CPU@3.40GHz,64位Windows操作系统的仿真条件下进行的,仿真软件采用MATLAB R2010a。源信号的恢复效果采用相似系数指标,计算公式如式(11)所示。其中,和分别表示分离出来的第i个和第j个信号,si(t)表示第i个源信号。
仿真参数设置:
实验一:两个语音信号,均来自互联网上的盲源分离算法公开测试数据集,信号的采样点数为160000,在接收过程中发生信号卷积混叠,混合滤波器为其中h11=[1.0 0.8 0.7 0.4 0.3 0.25 0.2 0.15 0.1],h12=[0.6 0.5 0.5 0.4 0.3 0.2 0.250.1 0.05],h21=[0.5 0.5 0.4 0.35 0.3 0.3 0.2 0.1 0.05],h22=[1.0 0.9 0.8 0.60.4 0.35 0.3 0.15 0.08],h31=[0.7 0.5 0.3 0.38 0.34 0.31 0.22 0.14 0.09],h32=[0.9 0.8 0.82 0.7 0.4 0.39 0.2 0.15 0.05],h41=[0.8 0.52 0.29 0.35 0.39 0.330.3 0.19 0.2],h42=[0.78 0.81 0.80 0.71 0.42 0.4 0.25 0.19 0.13]。采用本发明改进的基于固定步长的IVA算法,设置初始化的分离矩阵维数为4,并对应修改算法中的优化迭代方程。短时傅里叶变换的点数取为256,窗的长度与此相同,固定步长取为η=0.01。源信号,观测到的混叠信号,分离信号的波形如图2所示,可见采用本发明专利提出的初始化矩阵及优化方程设置方法,将分离得到与观测信号个数相等的分离信号(本实验中为4个)。下面就是进行冗余信号的剔除。
原始语音信号与分离信号的相似系数矩阵如下所示。
由此矩阵可看出,第1个分离信号与第2个原始语音信号相似系数为ξ21=0.8851,第2个分离信号与第1个原始语音信号的相似系数为ξ12=0.8803,表明两个原始语音信号在4个分离信号中都获得了很好的恢复。但是,第3个和第4个分离信号与两个原始语音信号中的任何一个的相似系数都很小,表明这两个分离信号未实现原始语音信号的恢复。采用相关性检测法,计算得到分离信号的互相关系数的矩阵为:
由此矩阵可看出,分离得到的4个信号,它们两两都不相似,故通过相关性检测法不能剔除冗余信号。为此,采用试听法,发现第3个和第4个分离信号都是杂音,从而不是感兴趣信号,删除之,即可得到剩下的两个语音信号,即为原始语音信号的准确估计信号。
实验二:三个语音信号,均来自互联网上的盲源分离算法公开测试数据集,信号的采样点数为59904,在接收过程中发生信号卷积混叠,混合滤波器为其中h11=[1.0 0.8 0.7 0.4 0.3 0.25 0.2 0.15 0.1],h12=[0.6 0.5 0.5 0.4 0.3 0.20.25 0.1 0.05],h13=[0.7 0.6 0.57 0.5 0.4 0.3 0.25 0.1 0.05]h21=[0.5 0.5 0.40.35 0.3 0.3 0.2 0.1 0.05],h22=[1.0 0.9 0.8 0.6 0.4 0.35 0.3 0.15 0.08],h23=[0.99 0.89 0.85 0.7 0.6 0.4 0.33 0.25 0.18],h31=[0.7 0.5 0.3 0.38 0.34 0.310.22 0.14 0.09],h32=[0.9 0.8 0.82 0.7 0.4 0.39 0.2 0.15 0.05],h33=[0.87 0.820.8 0.7 0.6 0.49 0.3 0.25 0.15]h41=[0.8 0.52 0.29 0.35 0.39 0.33 0.3 0.190.2],h42=[0.78 0.81 0.80 0.71 0.42 0.4 0.25 0.19 0.13],h43=[0.88 0.83 0.800.72 0.52 0.4 0.35 0.29 0.1]。采用本发明改进的基于固定步长的IVA算法,设置初始化的分离矩阵维数为4,并对应修改算法中的优化迭代方程。短时傅里叶变换的点数取为256,窗的长度与此相同,固定步长取为η=0.01。源信号,观测到的混叠信号,分离信号的波形如图3所示,可见采用本发明专利提出的初始化矩阵及优化方程设置方法,将分离得到与观测信号个数相等的分离信号(本实验中为4个)。下面就是进行冗余信号的剔除。
原始语音信号与分离信号的相似系数矩阵如下所示。
由此矩阵可看出,第1个分离信号与第3个原始语音信号相似系数为ξ31=0.8879,第2个分离信号与第1个原始语音信号的相似系数为ξ12=0.8046,第3个分离信号与第2个原始语音信号的相似系数为ξ23=0.8911,表明3个原始语音信号在4个分离信号中都获得了很好的恢复。但是,第4个分离信号与3个原始语音信号中的任何一个的相似系数都很小,表明这个分离信号未实现原始语音信号的恢复。采用相关性检测法,计算得到分离信号的互相关系数的矩阵为:
由此矩阵可看出,分离得到的4个信号,它们两两都不相似,故通过相关性检测法不能剔除冗余信号。为此,采用试听法,第4个分离信号都是杂音,从而不是感兴趣信号,删除之,即可得到剩下的3个语音信号,即为原始语音信号的准确估计信号。
综合上述实验表明,本发明方法能够在不进行源数估计的情况下用于语音信号的分离处理,并剔除冗余信号。
Claims (3)
1.一种无需源数估计的独立向量分析信号分离方法,其特征是:在语音信号源数未知的情况下,设置初始化分离矩阵维数以及如何修改优化迭代方程;对分离得到的与观测信号个数相同的分离信号,进行冗余信号检测与剔除,从而得到原始语音信号的准确估计信号;其步骤如下:
(1)分离矩阵初始化方法及迭代方程改进方法,设天线阵元数为m,信号个数为n,在IVA算法中,初始化的分离矩阵表示为Wn×n经典IVA算法要求n已知,或通过专门的源数估计算法估计得到;若m>n,需对观测信号进行主成分分析降维处理,使得降维后的观测信号为n维,然后再设置初始化分离矩阵Wn×n;IVA算法中采用的优化目标函数的方法——自然梯度法的迭代方程表示为:
式中,k表示迭代步数,α(k)表示迭代步长,In×n表示n×n维的单位矩阵,E{·}表示求期望,表示非线性函数,它与源信号的概率密度函数有关,yT表示第k步迭代得到的分离信号,其中上标T表示转置;
在独立向量分析算法的基础上,采用的无需源数估计的独立向量分析算法技术是:不再按照原方法设置初始化的分离矩阵Wn×n,而是将初始化的分离矩阵设置为Wm×m,也就是根据观测信号的个数设置初始化分离矩阵维数;完成初始化分离矩阵设置后,IVA方法所用优化算法中的迭代方程相应需要改进,以自然梯度法式(6)所示,其迭代方程应改进为:
改进后的迭代式中,各物理量的意义与式(6)中的对应物理量相同,只是每一步迭代后得到的分离信号y的维数由n变为m;
再以对目标函数进行优化中的另一种优秀算法等变自适应分解算法EASI(equivariant adaptive source separation via independence)说明对迭代方程进行改进的方法:
原始等变自适应分解算法的迭代方程为:
式中,各物理量的意义与式(7)对应物理量相同;
等变自适应分解算法的迭代方程修改为:
与式(8)相比,每一迭代后分离信号y的维数由式(8)中的n维变为式(9)中的m维;
源信号个数已经获知的盲信号分离中,当混合—分离系统的全局矩阵Gn×n=Wn×n·An×n更新到广义交换矩阵时,分离系统的输出基本等于源信号的拷贝,信号幅值、排列顺序及信噪比会发生一定变化,这时就认为算法实现了盲信号分离;
在源信号个数未知的IVA模型式(2)中,若能够实现所有的源信号至少被重构一次,则就达到了信号分离的目的;所以,当分离模型式(3)的输出信号中n个是独立分量,其它m-n个分量是一个或者多个独立分量的拷贝或零信号时,就认为算法已经实现了信号分离;记由源信号做前n个分量,从分离得到的源信号向量s的分量和零信号中任意取m-n个分量,会出现重复信号或冗余信号,作后m-n个分量;所取源信号依下标由小到大顺序排列记为则这样的向量总共有个,它们构成的集合记做Ω;引入集合Ω后,可分离性叙述为:当且仅当分离模型式(3)的输出等于G是一个广义交换矩阵的全局矩阵,时,就认为算法已经实现了信号分离,此时每一个源信号在输出中至少出现一次;
(2)分离后的重复或冗余信号剔除方法,根据分离矩阵初始化方法以及优化方程迭代式的改进,进行信号分离后,分离得到m个分离信号;虽然这m个分离信号中包含n个源信号的估计,但是还有m-n个重复或冗余信号需要剔除;
(3)针对m-n个重复或冗余信号的剔除方法,具体实施如下:
①相关性检测法,需要对分离得到的源信号进行相关性检测,假设根据m个接收信号矩阵分离得到m个源信号分量,这里准确的源信号个数n是未知的,则通过对m个分离信号计算其互相关系数,得到如下矩阵:
显然,矩阵对角线元素表示分离信号的自相关系数,必然都为1,矩阵中其他元素表示信号之间的互相关系数;若某元素非常接近于±1或为±1,则表示两个信号十分相似或相同;通过检测相关系数矩阵C,剔除冗余信号,即得到n个源信号的准确估计;
②试听判决法,若通过相关性检测法无法剔除冗余信号,采用分离信号的试听判决法进行冗余信号的剔除;即有用信号经IVA算法分离后,其中混叠的其他信号或噪声成分极少,语音质量好;而分离得到的其他信号,则由于混叠噪声或其他信号,语音质量极差,通过试听即可清晰判别出哪些是有用信号,该方法只适用于语音信号。
2.根据权利要求1所述的一种无需源数估计的独立向量分析信号分离方法,所述的无需源数估计的独立向量分析信号分离流程,其步骤如下:
步骤1:对混合信号x(t)进行短时傅里叶变换,转换为各个频率点的线性瞬时混合复值信号;步骤2:对各频率点的混合信号进行中心化和白化预处理;及步骤7:根据各频点分离矩阵更新迭代步长;步骤8:若达到最大迭代次数,输出最终各频点分离信号,否则返回步骤4;步骤9:将各频点分离信号经短时傅里叶逆变换恢复成时域信号;其特征是:
步骤3:使用JADE算法初始化各频点的分离矩阵Wm×m(ω),并初始化迭代步长η(1);
步骤4:根据Y(ω)=Wm×m(ω)X(ω)来估计各频点的源信号;
步骤5:根据估计出的源信号来计算目标函数和非线性函数,并判断分离矩阵是否收敛,若收敛,执行步骤9;
步骤6:根据下式来更新各频点分离矩阵
其中,k指迭代次数,G'(·)是G(·)的1阶导数,η(k)是步长参数;
步骤10:根据本发明提出的冗余信号剔除方法,删除冗余信号,获得最终的分离信号。
3.根据权利要求1所述的一种无需源数估计的独立向量分析信号分离方法,其特征是:所述无需源数估计的独立向量分析信号分离方法还适用于需要设置初始化分离矩阵的自然梯度法,或等变自适应分解法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910597276.5A CN110473565A (zh) | 2019-07-04 | 2019-07-04 | 一种无需源数估计的独立向量分析信号分离方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910597276.5A CN110473565A (zh) | 2019-07-04 | 2019-07-04 | 一种无需源数估计的独立向量分析信号分离方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110473565A true CN110473565A (zh) | 2019-11-19 |
Family
ID=68506787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910597276.5A Pending CN110473565A (zh) | 2019-07-04 | 2019-07-04 | 一种无需源数估计的独立向量分析信号分离方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110473565A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111009256A (zh) * | 2019-12-17 | 2020-04-14 | 北京小米智能科技有限公司 | 一种音频信号处理方法、装置、终端及存储介质 |
CN111667846A (zh) * | 2020-05-14 | 2020-09-15 | 北京声智科技有限公司 | 一种盲源分离方法及装置 |
CN112037813A (zh) * | 2020-08-28 | 2020-12-04 | 南京大学 | 一种针对大功率目标信号的语音提取方法 |
CN112084845A (zh) * | 2020-07-30 | 2020-12-15 | 中国人民解放军63892部队 | 基于多尺度小波系数自相关的低频1/f噪声消除方法 |
CN112397065A (zh) * | 2020-11-04 | 2021-02-23 | 深圳地平线机器人科技有限公司 | 语音交互方法、装置、计算机可读存储介质及电子设备 |
CN112908354A (zh) * | 2021-01-29 | 2021-06-04 | 中国人民解放军63892部队 | 基于影响权重的频域卷积盲源分离幅度相关性的排序方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6898612B1 (en) * | 1998-11-12 | 2005-05-24 | Sarnoff Corporation | Method and system for on-line blind source separation |
CN106887238A (zh) * | 2017-03-01 | 2017-06-23 | 中国科学院上海微系统与信息技术研究所 | 一种基于改进独立向量分析算法的声信号盲分离方法 |
-
2019
- 2019-07-04 CN CN201910597276.5A patent/CN110473565A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6898612B1 (en) * | 1998-11-12 | 2005-05-24 | Sarnoff Corporation | Method and system for on-line blind source separation |
CN106887238A (zh) * | 2017-03-01 | 2017-06-23 | 中国科学院上海微系统与信息技术研究所 | 一种基于改进独立向量分析算法的声信号盲分离方法 |
Non-Patent Citations (5)
Title |
---|
CHENG WEI ET AL.: "An efficient equivariant adaptive sepatation via independence algorithm for acoustical source separation and identification", 《SCIENCE CHINA》 * |
JEAN-FRANGOIS CARDOSO ET AL.: "Equivariant adaptive source separation", 《IEEE TRANSACTIONS ON SIGNAL PROCESSING》 * |
付卫红等: "基于步长自适应的独立向量分析卷积盲分离算法", 《电子与信息学报》 * |
张睿等: "语音增强用于坦克驾驶舱内无线语音通信", 《电子工程师》 * |
王川川等: "基于盲源分离算法的混叠电磁信号分离研究", 《电光与控制》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111009256A (zh) * | 2019-12-17 | 2020-04-14 | 北京小米智能科技有限公司 | 一种音频信号处理方法、装置、终端及存储介质 |
CN111009256B (zh) * | 2019-12-17 | 2022-12-27 | 北京小米智能科技有限公司 | 一种音频信号处理方法、装置、终端及存储介质 |
CN111667846A (zh) * | 2020-05-14 | 2020-09-15 | 北京声智科技有限公司 | 一种盲源分离方法及装置 |
CN112084845A (zh) * | 2020-07-30 | 2020-12-15 | 中国人民解放军63892部队 | 基于多尺度小波系数自相关的低频1/f噪声消除方法 |
CN112037813A (zh) * | 2020-08-28 | 2020-12-04 | 南京大学 | 一种针对大功率目标信号的语音提取方法 |
CN112037813B (zh) * | 2020-08-28 | 2023-10-13 | 南京大学 | 一种针对大功率目标信号的语音提取方法 |
CN112397065A (zh) * | 2020-11-04 | 2021-02-23 | 深圳地平线机器人科技有限公司 | 语音交互方法、装置、计算机可读存储介质及电子设备 |
CN112908354A (zh) * | 2021-01-29 | 2021-06-04 | 中国人民解放军63892部队 | 基于影响权重的频域卷积盲源分离幅度相关性的排序方法 |
CN112908354B (zh) * | 2021-01-29 | 2024-03-22 | 中国人民解放军63892部队 | 基于影响权重的频域卷积盲源分离幅度相关性的排序方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110473565A (zh) | 一种无需源数估计的独立向量分析信号分离方法 | |
Zhang et al. | Uncovering fuzzy community structure in complex networks | |
CN109616138A (zh) | 基于分段频点选择的语音信号盲分离方法和双耳助听系统 | |
CN107957566B (zh) | 基于频率选择奇异谱分析的磁共振测深信号提取方法 | |
Christensen et al. | Multi-pitch estimation | |
Shi | Blind signal processing | |
CN109243483A (zh) | 一种含噪频域卷积盲源分离方法 | |
He et al. | Single channel blind source separation on the instantaneous mixed signal of multiple dynamic sources | |
CN103854660B (zh) | 一种基于独立成分分析的四麦克语音增强方法 | |
Hansen et al. | On independent component analysis for multimedia signals | |
CN106531181A (zh) | 一种基于谐波提取的欠定语音盲分离方法及装置 | |
Uprety et al. | Modeling multidimensional user relevance in IR using vector spaces | |
CN106548780B (zh) | 一种语音信号的压缩感知重构方法 | |
CN108108666B (zh) | 一种基于小波分析和时频单源检测的混合矩阵估计方法 | |
CN114613384B (zh) | 一种基于深度学习多输入语音信号波束形成信息互补方法 | |
CN110534130A (zh) | 一种欠定语音盲源分离方法及装置 | |
CN103577877B (zh) | 一种基于时频分析和bp神经网络的船舶运动预报方法 | |
Yang et al. | Fast adaptive extraction algorithm for multiple principal generalized eigenvectors | |
He et al. | An adaptive single channel EMD-TNMF blind source separation algorithm for both instantaneous and convolutive mixed signal | |
Zhang et al. | Design and application of electrocardiograph diagnosis system based on multifractal theory | |
He et al. | Ant colony clustering algorithm for underdetermined BSS | |
Liu et al. | A new underdetermined blind source separation algorithm under the anechoic mixing model | |
Xu | Application of blind source separation in sound source separation | |
Zhang et al. | Audio signal blind deconvolution based on the quotient space hierarchical theory | |
Liu et al. | One to multiple mapping dual learning: Learning multiple signals from one mixture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |