CN110060698A - 一种基于改进势函数的语音信号混合矩阵估计方法 - Google Patents

一种基于改进势函数的语音信号混合矩阵估计方法 Download PDF

Info

Publication number
CN110060698A
CN110060698A CN201910287096.7A CN201910287096A CN110060698A CN 110060698 A CN110060698 A CN 110060698A CN 201910287096 A CN201910287096 A CN 201910287096A CN 110060698 A CN110060698 A CN 110060698A
Authority
CN
China
Prior art keywords
cluster centre
signal
point
hybrid matrix
potential function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910287096.7A
Other languages
English (en)
Inventor
李一兵
吴静
孙骞
田园
叶方
张慧
张羽
酒铭杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201910287096.7A priority Critical patent/CN110060698A/zh
Publication of CN110060698A publication Critical patent/CN110060698A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种基于改进势函数的语音信号混合矩阵估计方法,包括以下步骤:步骤1:建立观测信号的线性瞬时混合模型;步骤2:对步骤1得到的单源点进行低能量点去除和归一化处理;步骤3:采用改进势函数估计混合矩阵。本发明所提出的混合矩阵估计算法适用于任意矩阵;本发明抗噪声性能好,即使在信噪比为5dB的情况下,也具有良好的准确度。

Description

一种基于改进势函数的语音信号混合矩阵估计方法
技术领域
本发明涉及一种在欠定模型下的语音信号混合矩阵估计方法,具体涉及一种基于改进势函数的语音信号混合矩阵估计方法,属于信号处理领域。
背景技术
近几年,在信号处理领域,语音信号的分离已经成为了一个研究热点。它在电话会议,助听器和机器语音识别等方面有很多应用和影响。由于接收到的声音通常是有噪的,在这样的环境中识别感兴趣的声音并获得清晰的声音的问题成为值得探讨的问题,也就是所谓的盲源分离问题。
盲源分离一般根据源信号和观测信号的数目进行划分,可以分为超定、适定和欠定盲源分离,其中欠定盲源分离更加符合实际情况,在生活中应用更广,同时也更具有挑战。欠定盲源分离是指在传感器或者麦克风数目少于源信号数目的情况。通常情况下,解决欠定盲源分离的方法同样适用于超定和适定情况,所以对于欠定盲源分离方法的研究是很有必要的。一般解决欠定盲源分离的方法是利用稀疏分量分析法,一般也称为“两步法”。第一步是通过观测信号对混合矩阵进行估计,第二步是利用估计出的混合矩阵对源信号进行分离。根据语音信号混合矩阵估计的研究现状,针对在信噪比较低情况下,目前的混合矩阵估计算法普遍存在准确性低的问题。
发明内容
针对上述现有技术,本发明要解决的技术问题是提供一种可以提高低信噪比下准确性的基于改进势函数的语音信号混合矩阵估计方法。
为解决上述技术问题,本发明提供一种基于改进势函数的语音信号混合矩阵估计方法,包括以下步骤:
步骤1:建立观测信号的线性瞬时混合模型,具体为:
其中x(t)=[x1(t),x2(t),…,xN(t)]T是一个N维观测信号向量,A=[a1,a2,…,aM]是一个N×M维的混合矩阵,s(t)=[s1(t),s2(t),…,sM(t)]T是一个M维的源信号向量,t是时间采样点并且ai表示混合矩阵的第i个列向量;
对观测信号的线性瞬时混合模型进行短时傅里叶变换,得到:
其中,X(t,f)=[X1(t,f),…,XN(t,f)]T和S(t,f)=[S1(t,f),…,SM(t,f)]T分别是观测信号和源信号在时频点(t,f)的短时傅里叶变换系数;
进行单源点检测,得到满足检测规则的单源点,检测规则为:
其中ε1为正数,且ε1<0.1,Re()和Im()分别表示取复数的实部和虚部;
步骤2:对步骤1得到的单源点进行低能量点去除和归一化处理:
不符合||X(t,f)||>λ·max||X(t,f)||的单源点为低能量点,去除掉低能量点,其中参数λ∈(0,1);
将观测信号对称到上半平面,并进行归一化处理,归一化处理后的观测信号为:
步骤3:采用改进势函数估计混合矩阵:
改进势函数为:
zk是第k个聚类中心向量,K是聚类中心的数目,b是尺度参数,是xi的归一化形式;
包括以下步骤:
(3a)通过相关比较法估计参数γ,参数b的估计为:
其中是混合信号的均值;
(3b)求取聚类中心,具体为:
对改进势函数进行求导得到公式如下:
采用固定点迭代法估计聚类中心,具体为:随机生成一个单位向量作为初值z,根据进行迭代,直到z值不再变化,则此时z值为估计出的聚类中心,共得到M个聚类中心,得到的聚类中心是混合矩阵的列向量;
(3c)求解经过步骤2得到的单源点与每个聚类中心的距离,每个单源点属于最小距离对应的聚类中心,将属于同一个聚类中心的单源点求均值,该均值则为新的聚类中心,共得到M个新的聚类中心;
(3d)将M个新的聚类中心代入(3c),重复(3c)的过程,直到得到的聚类中心不再发生变化,,则最终的混合矩阵由此时M个聚类中心对应的M个列向量构成。
本发明有益效果:本发明是针对稀疏分量分析方法的第一步进行的。本发明中,混合矩阵估计采用基于改进势函数的估计方法。
(1)所提出的混合矩阵估计算法适用于任意矩阵;
(2)抗噪声性能好,即使在信噪比为5dB的情况下,也具有良好的准确度。
附图说明
图1为本发明算法流程图;
图2为去低能量点前的散点图;
图3为去低能量点后的散点图;
图4为归一化后的散点图;
图5为J(z)的三维图;
图6为J(z)的二维图。
具体实施方式
本发明首先对语音信号进行短时傅里叶变换,将信号从时域变换到时频域进行处理。为了更好地估计混合矩阵,需要对信号进行单源点检测。为了提高估计的准确性,对检测出来的单源点进行低能量点的去除和归一化处理。而后采用改进势函数估计混合矩阵。
以下结合附图和具体实施案例,对本发明进行详细说明。
参照图1,本发明的一种基于改进势函数的语音信号混合矩阵估计方法具体实现步骤如下:
步骤1:对经过短时傅里叶变换后的观测信号进行单源点检测;图2表示去掉低能量点前的散点图。
在步骤1中,所述建立的数学模型为线性瞬时混合模型。选取语音信号作为源信号,所考虑的噪声为加性噪声,且信噪比在5dB以上。由于观测信号在时频域的稀疏性好,通过短时傅里叶变换将时域的信号变换到时频域进行处理,而后对变换后的信号进行单源点检测。
建立一个线性瞬时混合模型,为了方便,忽视了噪声的影响,具体模型表达式如下所示。
其中x(t)=[x1(t),x2(t),…,xN(t)]T是一个N维观测信号向量,A=[a1,a2,…,aM]是一个N×M维的混合矩阵,s(t)=[s1(t),s2(t),…,sM(t)]T是一个M维的源信号向量,t是时间采样点并且ai表示混合矩阵的第i个列向量。
由于信号的稀疏性在时域上并不好,但是在时频域的稀疏性很好。因此信号通常被转换到时频域进行处理,即
其中,X(t,f)=[X1(t,f),…,XN(t,f)]T和S(t,f)=[S1(t,f),…,SM(t,f)]T分别是观测信号和源信号在时频点(t,f)的短时傅里叶变换(STFT)系数。本发明针对双通道混合信号进行。然后式(2)可以被写成。
混合矩阵的估计主要取决于信号的稀疏性。对于单源点检测,任意两个列向量都是不相关的。本发明研究的是信号完全稀疏的情况,在任意时频点都只有一个源信号。因此式(3)可以被写成。
如果在一个时频点只有一个源信号,就有下面的表达式。
X1(t,f)=a11S1(t,f)=a11[Re(S1(t,f))+jIm(S1(t,f))] (5)
X2(t,f)=a21S1(t,f)=a21[Re(S1(t,f))+jIm(S1(t,f))] (6)
其中Re()和Im()分别表示复数的实部和虚部。从(5)和(6),我们可以得到
如果在一个时频点有两个源信号,则有下面的表达式存在。
X1(t,f)=a11S1(t,f)+a12S2(t,f) (8)
X2(t,f)=a21S1(t,f)+a22S2(t,f) (9)
如果这种情况仍要满足(7),它将需满足
由于混合矩阵的任意两个列向量都是不相关的,那么式(10)就是不满足的。同时式(11)的可能性非常小。因此可以使用下面的规则来检测单源点。
实际上,这个条件非常苛刻,因此我们需要放宽这个条件。
其中ε1是一个接近零的正数。
步骤2:对单源点进行低能量点去除和归一化处理;图3表示去低能量点后的散点图。图4表示归一化后的散点图。
除了一些噪声点之外,在原点附近有一些低能量的单源点。这些点会影响混合矩阵的估计准确性。为了改善估计的准确性,这些低能量点通常被去除,它可以通过下面的步骤来实现。
||X(t,f)||>λ·max||X(t,f)|| (14)
其中参数λ∈(0,1)。
从图2中可以大略看出四条直线。在去除低能量点之后,散点图如图3所示。从图中可以清晰地看出四条直线。这样,我们就可以更准确地估计出混合矩阵。
为了更好的估计出混合矩阵,观测信号需要对称到上半平面,同时进行归一化处理。具体的实现过程如下。
从图4可以看出,在经过归一化处理之后,观测信号显示出明显的聚类特性,这对估计混合矩阵是很方便的。
步骤3:采用改进的势函数估计混合矩阵。图5表示J(z)的三维图,图6表示J(z)的二维图。
为了估计聚类中心,本发明引入了改进势函数。
在式(16)中,zk是超球面上的第k个聚类中心向量。K是聚类中心的数目。b是尺度参数。是xi的归一化形式。具体步骤如下:
(3a)对势函数中的参数进行估计,通过相关比较法估计参数γ。参数b的估计如下所示。
其中是混合信号的均值。
(3b)改进势函数在取最大值时的z值对应的是聚类中心,因此,需要对改进势函数进行求导,可以得到下式
由于式(18)中的z不能直接被求出,因此采用固定点迭代法估计聚类中心。即首先选定一个初值z,此处采用的是随机生成的一个单位向量,之后根据式(18)进行迭代,直到z值不再变化,则估计出聚类中心。这个聚类中心就是混合矩阵的列向量,根据前面的设置,此处应该求出M个聚类中心也就是M个列向量,这些列向量组成了混合矩阵。
(3c)为了让所求的混合矩阵更准确,根据两点间距离公式求解经过步骤2得到的单源点与每个聚类中心的距离,求出的最小值对应的聚类中心就代表该单源点属于这个聚类中心,将属于同一个聚类中心的单源点求均值,这个均值则为新的聚类中心,由于有M个聚类中心,则会求出M个新的聚类中心
(3d)将新的聚类中心代入(3c),重复(3c)的过程,直到最后求的聚类中心不再发生变化,这样所求出的M个聚类中心就是M个列向量,也就得到了最终的混合矩阵。
本发明的基于改进势函数的语音信号混合矩阵估计方法提高了混合矩阵估计的准确性,尤其是在信噪比为5dB时。
本发明的基于改进势函数的语音信号混合矩阵估计方法,可适用于不同混合矩阵的估计。
需要说明的是,上述实施案例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (1)

1.一种基于改进势函数的语音信号混合矩阵估计方法,其特征在于,包括以下步骤:
步骤1:建立观测信号的线性瞬时混合模型,具体为:
其中x(t)=[x1(t),x2(t),…,xN(t)]T是一个N维观测信号向量,A=[a1,a2,…,aM]是一个N×M维的混合矩阵,s(t)=[s1(t),s2(t),…,sM(t)]T是一个M维的源信号向量,t是时间采样点并且ai表示混合矩阵的第i个列向量;
对所述观测信号的线性瞬时混合模型进行短时傅里叶变换,得到:
其中,X(t,f)=[X1(t,f),…,XN(t,f)]T和S(t,f)=[S1(t,f),…,SM(t,f)]T分别是观测信号和源信号在时频点(t,f)的短时傅里叶变换系数;
进行单源点检测,得到满足检测规则的单源点,所述检测规则为:
其中ε1为正数,且ε1<0.1,Re()和Im()分别表示取复数的实部和虚部;
步骤2:对步骤1得到的单源点进行低能量点去除和归一化处理:
不符合||X(t,f)||>λ·max||X(t,f)||的单源点为低能量点,去除掉所述低能量点,其中参数λ∈(0,1);
将观测信号对称到上半平面,并进行归一化处理,归一化处理后的观测信号为:
步骤3:采用改进势函数估计混合矩阵:
所述改进势函数为:
zk是第k个聚类中心向量,K是聚类中心的数目,b是尺度参数,是xi的归一化形式;
包括以下步骤:
(3a)通过相关比较法估计参数γ,参数b的估计为:
其中是混合信号的均值;
(3b)求取聚类中心,具体为:
对改进势函数进行求导得到公式如下:
采用固定点迭代法估计聚类中心,具体为:随机生成一个单位向量作为初值z,根据进行迭代,直到z值不再变化,则此时z值为估计出的聚类中心,共得到M个聚类中心,所述聚类中心是混合矩阵的列向量;
(3c)求解经过步骤2得到的单源点与每个聚类中心的距离,每个单源点属于最小距离对应的聚类中心,将属于同一个聚类中心的单源点求均值,该均值则为新的聚类中心,共得到M个新的聚类中心;
(3d)将M个新的聚类中心代入(3c),重复(3c)的过程,直到得到的聚类中心不再发生变化,,则最终的混合矩阵由此时M个聚类中心对应的M个列向量构成。
CN201910287096.7A 2019-04-11 2019-04-11 一种基于改进势函数的语音信号混合矩阵估计方法 Pending CN110060698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910287096.7A CN110060698A (zh) 2019-04-11 2019-04-11 一种基于改进势函数的语音信号混合矩阵估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910287096.7A CN110060698A (zh) 2019-04-11 2019-04-11 一种基于改进势函数的语音信号混合矩阵估计方法

Publications (1)

Publication Number Publication Date
CN110060698A true CN110060698A (zh) 2019-07-26

Family

ID=67318667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910287096.7A Pending CN110060698A (zh) 2019-04-11 2019-04-11 一种基于改进势函数的语音信号混合矩阵估计方法

Country Status (1)

Country Link
CN (1) CN110060698A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110487911A (zh) * 2019-08-19 2019-11-22 重庆大学 基于盲源分离的压力容器声发射信号检测的方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120259561A1 (en) * 2011-04-05 2012-10-11 The Regents Of The University Of California Apparatus and method for signal extraction and separation
CN104167214A (zh) * 2014-08-20 2014-11-26 电子科技大学 一种双麦克风盲声源分离的快速源信号重建方法
CN104332161A (zh) * 2014-09-28 2015-02-04 武汉理工大学 一种基于接收先验和单源点检测的欠定盲辨识方法
CN104637494A (zh) * 2015-02-02 2015-05-20 哈尔滨工程大学 基于盲源分离的双话筒移动设备语音信号增强方法
CN105354594A (zh) * 2015-10-30 2016-02-24 哈尔滨工程大学 一种针对欠定盲源分离的混合矩阵估计方法
CN106778001A (zh) * 2016-12-26 2017-05-31 西安电子科技大学 基于改进时频单源区的欠定混合矩阵盲估计方法
CN108009584A (zh) * 2017-12-01 2018-05-08 西安交通大学 基于单源点检测的欠定盲源分离方法
CN108108666A (zh) * 2017-11-30 2018-06-01 电子信息系统复杂电磁环境效应国家重点实验室 一种基于小波分析和时频单源检测的混合矩阵估计方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120259561A1 (en) * 2011-04-05 2012-10-11 The Regents Of The University Of California Apparatus and method for signal extraction and separation
CN104167214A (zh) * 2014-08-20 2014-11-26 电子科技大学 一种双麦克风盲声源分离的快速源信号重建方法
CN104332161A (zh) * 2014-09-28 2015-02-04 武汉理工大学 一种基于接收先验和单源点检测的欠定盲辨识方法
CN104637494A (zh) * 2015-02-02 2015-05-20 哈尔滨工程大学 基于盲源分离的双话筒移动设备语音信号增强方法
CN105354594A (zh) * 2015-10-30 2016-02-24 哈尔滨工程大学 一种针对欠定盲源分离的混合矩阵估计方法
CN106778001A (zh) * 2016-12-26 2017-05-31 西安电子科技大学 基于改进时频单源区的欠定混合矩阵盲估计方法
CN108108666A (zh) * 2017-11-30 2018-06-01 电子信息系统复杂电磁环境效应国家重点实验室 一种基于小波分析和时频单源检测的混合矩阵估计方法
CN108009584A (zh) * 2017-12-01 2018-05-08 西安交通大学 基于单源点检测的欠定盲源分离方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TIANBAO DONG,YINGKE LEI,JINGSHUYANG: "An algorithm for underdetermined mixing matrix estimation", 《NEUROCOMPUTING》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110487911A (zh) * 2019-08-19 2019-11-22 重庆大学 基于盲源分离的压力容器声发射信号检测的方法

Similar Documents

Publication Publication Date Title
CN105609113A (zh) 基于双谱加权空间相关矩阵的语音声源定位方法
CN106646350B (zh) 一种单只矢量水听器各通道幅度增益不一致时的修正方法
CN112697887A (zh) 基于神经网络的超声检测缺陷定性识别方法
CN109884591B (zh) 一种基于麦克风阵列的多旋翼无人机声信号增强方法
CN111025273B (zh) 一种畸变拖曳阵线谱特征增强方法及系统
CN112037806B (zh) 一种检测风噪的方法和检测风噪声的设备
CN113472390B (zh) 一种基于深度学习的跳频信号参数估计方法
CN110568415B (zh) 混合高斯模型下基于Arctan函数的信号检测方法
CN110060698A (zh) 一种基于改进势函数的语音信号混合矩阵估计方法
CN112014801A (zh) 一种基于SPWVD和改进AlexNet的复合干扰识别方法
CN111817803A (zh) 一种基于相关系数和k-均值聚类算法的频谱感知方法、系统及计算机可读存储介质
CN112689288A (zh) 一种基于wann的射频指纹提取和识别方法
Oliinyk et al. Time delay estimation for noise-like signals embedded in non-Gaussian noise using adaptive robust DFT
CN110190832B (zh) 变正则化参数多任务自适应滤波器网络
CN109752633B (zh) 一种对变电站局部放电信号进行定位的方法及系统
CN109117698B (zh) 一种基于最小均方误差准则的噪声背景估计方法
CN110133628A (zh) 一种短时强干扰下lfm信号的恢复方法
CN110275138A (zh) 一种利用优势声源成分移除的多声源定位方法
CN112986967B (zh) 一种混响边缘的自适应检测方法及装置
CN114201991A (zh) 一种基于超声传感器阵列的局放信号检测方法和系统
CN114035193A (zh) 一种两阶可调谐空时自适应检测方法
CN110110341B (zh) 一种判决门限自动推荐的脉冲检测方法
CN111257859B (zh) 一种波束域自相关水下目标识别方法
CN113823317B (zh) 基于频谱结构化识别的变电站噪声分离方法、设备及介质
Eaton et al. Acoustic characterization of environments (ACE) challenge results technical report

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190726

RJ01 Rejection of invention patent application after publication