CN103559886A - 基于组稀疏低秩表达的语音信号增强方法 - Google Patents

基于组稀疏低秩表达的语音信号增强方法 Download PDF

Info

Publication number
CN103559886A
CN103559886A CN201310439143.8A CN201310439143A CN103559886A CN 103559886 A CN103559886 A CN 103559886A CN 201310439143 A CN201310439143 A CN 201310439143A CN 103559886 A CN103559886 A CN 103559886A
Authority
CN
China
Prior art keywords
voice signal
rank
low
group
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310439143.8A
Other languages
English (en)
Other versions
CN103559886B (zh
Inventor
李平
卜佳俊
陈纯
高珊
王学庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201310439143.8A priority Critical patent/CN103559886B/zh
Publication of CN103559886A publication Critical patent/CN103559886A/zh
Application granted granted Critical
Publication of CN103559886B publication Critical patent/CN103559886B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

基于组稀疏低秩表达的语音信号增强方法,针对带噪语音信号进行以下操作:首先,根据预设的采样频率对语音信号进行采样,形成对应的向量化表达,并按不同主题对语音信号进行分组;其次,利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;最后,通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。本发明的优点在于:有效地考虑了同主题语音信号间的组稀疏结构特性,能更好地消除背景噪音并获取更清晰的语音信号,使听者更迅速准确地理解语音内容,可应用于军事通信、网络音频会议和在线电台放送等等。

Description

基于组稀疏低秩表达的语音信号增强方法
技术领域
本发明涉及语音信号增强的技术领域,特别是基于组稀疏低秩表达的语音信号增强方法。 
背景技术
随着数字媒体设备在人们日常工作和生活中的普及,特别是互联网技术的迅速发展壮大,每天都产生海量的语音数据,这些数据对现实生活中很多领域的交流与合作有着至关重要的影响。然后,由于各种客观环境条件的制约,如家居中小孩的滴哭声、会议室外的车辆喧闹声、实验室内的机器运转声和战争中的炸弹声等等,导致音频设备采集的语音信号通常伴随着不同程度的噪声。因此,如何有效分离语音数据中的噪声成分,增强语音信号是学术界和工业界非常关心且一直在研究探讨的问题。语音信号的增强技术,主要指从不同的噪声背景下提取有效而清晰的语音信号,抑制、降低甚至消除噪声干扰。 
目前,针对语音信号的增强处理集中在传统的数字和模拟信号处理中,如现有的典型语音增强方法主要有基于小波分析、谱相减、卡尔曼滤波、信号子空间、听觉掩蔽效应、神经网络、独立主成分分析等等。这些技术对于语音信号较少且不稳定的情况是很占优势的,但是随着大数据时代的到来,海量的语音数据唾手可得,这为利用统计机器学习方法解决带噪语音信号的噪声抑制提供了可能性。从机器学习的角度,将不同类型的语音信号看成数据样本,可以利用已有的许多鲁棒学习方法获得带噪语音数据的低维低秩本征表达,保留尽可能 多的原始语音信号,而抑制或丢弃无关的噪声信息,从而实现语音信号和噪声信号的分离,提高听者对语音信号传递内容的鉴别理解能力。在语音数据极为丰富的情形下,使用统计机器学习的方法处理带噪语音信号具有传统信号处理方法无法比拟的优势,具有很强的现实意义和重要的研究价值。 
发明内容
为了让用户对多种混合的带噪语音信号提高辨听力,本发明提出了一种基于组稀疏低秩表达的语音信号增强方法,该方法包括以下步骤: 
1、获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作: 
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组; 
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达; 
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。 
进一步,步骤1)中所述的按照不同主题对语音信号分组,具体是: 
1)假设语音信号可分为k个主题,则第c个主题的语音信号矩阵表示为                                                  
Figure 2013104391438100002DEST_PATH_IMAGE001
,其中nc为第c个主题的语音信号数目; 
2)通过按顺序拼接不同主题的信号矩阵块,可构造整体语音信号矩阵X=[X1,…,Xk]∈Rm×n,其中n=n1+n2+…+nk。 
进一步,步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达,具体是: 
1)假设第c个主题语音信号的组稀疏低秩表达为Zc,则同主题语音信号间的组稀疏结构特征可通过矩阵的l1,q范式表征为     Σ c = 1 k | | Z c | | 1 , q , 其中 
| | Z c | | 1 , q = Σ j = 1 n c | | z j c | | q = | | z 1 c | | q + . . . + | | z n c c | | q
其中,‖·‖q表示向量的lq范式,q>0反映了语音信号的组结构特征,第c个主题语音信号的低秩表达   
Figure 2013104391438100002DEST_PATH_IMAGE004
而列向量表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn×n; 
2)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即 
minimizeZ,E‖Z‖*+α‖Z‖1,q+λ‖E‖1, 
subject to X=XZ+E,eTZ=eT,Z≥0, 
其中,‖Z‖*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E。 
进一步,步骤3)中所述通过获得的低秩表达对原始带噪信号进行重构,具体是: 
通过上述步骤求得的语音信号对应的组稀疏低秩表达Z与原始带噪语音信号X进行线性乘积,可获得重构后的清晰增强语音信号,即     X ^ = XZ .
本发明提出了基于组稀疏低秩表达的语音信号增强方法,其优点在于:有效地考虑了同主题语音信号间的组稀疏结构特性,能更好地消除背景噪音并获取更清晰的语音信号,使听者更迅速准确地理解语音内容,可应用于军事通信、网络音频会议和在线电台放送等等。 
附图说明
图1是本发明的方法流程图。 
具体实施方式
参照附图,进一步说明本发明: 
基于组稀疏低秩表达的语音信号增强方法,该方法包括以下步骤: 
1、获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作: 
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组; 
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达; 
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。 
步骤1)中所述的按照不同主题对语音信号分组,具体是: 
1)假设语音信号可分为k个主题,则第c个主题的语音信号矩阵表示为   
Figure 2013104391438100002DEST_PATH_IMAGE006
,其中nc为第c个主题的语音信号数目; 
2)通过按顺序拼接不同主题的信号矩阵块,可构造整体语音信号矩阵X=[X1,…,Xk]∈Rm×n,其中n=n1+n2+…+nk。 
步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组 稀疏低秩表达,具体是: 
1)假设第c个主题语音信号的组稀疏低秩表达为Zc,则同主题语音信号间的组稀疏结构特征可通过矩阵的l1,q范式表征为     Σ c = 1 k | | Z c | | 1 , q , 其中 
| | Z c | | 1 , q = Σ j = 1 n c | | z j c | | q = | | z 1 c | | q + . . . + | | z n c c | | q
其中,‖·‖q表示向量的lq范式,q>0反映了语音信号的组结构特征,第c个主题语音信号的低秩表达   
Figure 2013104391438100002DEST_PATH_IMAGE009
而列向量   
Figure 2013104391438100002DEST_PATH_IMAGE010
表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn×n; 
2)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即 
minimizeZ,E‖Z‖*+α‖Z‖1,q+λ‖E‖1, 
subject to X=XZ+E,eTZ=eT,Z≥0, 
其中,‖Z‖*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E。 
步骤3)中所述通过获得的低秩表达对原始带噪信号进行重构, 具体是: 
通过上述步骤求得的语音信号对应的组稀疏低秩表达Z与原始带噪语音信号X进行线性乘积,可获得重构后的清晰增强语音信号,即     X ^ = XZ .
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。 

Claims (4)

1.基于组稀疏低秩表达的语音信号增强方法,该方法的特征在于获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作: 
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组; 
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达; 
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。 
2.如权利要求1所述的基于组稀疏低秩表达的语音信号增强方法,其特征在于:步骤1)中所述的按照不同主题对语音信号分组,具体是: 
1)假设语音信号可分为k个主题,则第c个主题的语音信号矩阵表示为                                                  
Figure 848416DEST_PATH_IMAGE001
,其中nc为第c个主题的语音信号数目; 
2)通过按顺序拼接不同主题的信号矩阵块,可构造整体语音信号矩阵X=[X1,…,Xk]∈Rm×n,其中n=n1+n2+…+nk。 
3.如权利要求2所述的基于组稀疏低秩表达的语音信号增强方法,其特征在于:步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达,具体是: 
1)假设第c个主题语音信号的组稀疏低秩表达为Zc,则同主题语音信号间的组稀疏结构特征可通过矩阵的l1,q范式表征为   
Figure 765556DEST_PATH_IMAGE002
其中,‖·‖q表示向量的lq范式,q>0反映了语音信号的组结构特征, 第c个主题语音信号的低秩表达   
Figure 815869DEST_PATH_IMAGE004
而列向量
Figure FDA0000386746030000022
表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn×n; 
2)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即 
minimizeZ,E‖Z‖*+α‖Z‖1,q+λ‖E‖1, 
subject to X=XZ+E,eTZ=eT,Z≥0, 
其中,‖Z‖*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E。 
4.如权利要求3所述的基于组稀疏低秩表达的语音信号增强方法,其特征在于:步骤3)中所述通过获得的低秩表达对原始带噪信号进行重构,具体是: 
通过上述步骤求得的语音信号对应的组稀疏低秩表达Z与原始带噪语音信号X进行线性乘积,可获得重构后的清晰增强语音信号,即    
Figure 630241DEST_PATH_IMAGE005
CN201310439143.8A 2013-09-24 2013-09-24 基于组稀疏低秩表达的语音信号增强方法 Active CN103559886B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310439143.8A CN103559886B (zh) 2013-09-24 2013-09-24 基于组稀疏低秩表达的语音信号增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310439143.8A CN103559886B (zh) 2013-09-24 2013-09-24 基于组稀疏低秩表达的语音信号增强方法

Publications (2)

Publication Number Publication Date
CN103559886A true CN103559886A (zh) 2014-02-05
CN103559886B CN103559886B (zh) 2017-04-12

Family

ID=50014116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310439143.8A Active CN103559886B (zh) 2013-09-24 2013-09-24 基于组稀疏低秩表达的语音信号增强方法

Country Status (1)

Country Link
CN (1) CN103559886B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021797A (zh) * 2014-06-19 2014-09-03 南昌大学 一种基于频域稀疏约束的语音信号增强方法
CN106618631A (zh) * 2016-11-17 2017-05-10 哈尔滨师范大学 一种基于分组稀疏性的自适应心音信号去噪方法
CN108831494A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915742A (zh) * 2012-10-30 2013-02-06 中国人民解放军理工大学 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915742A (zh) * 2012-10-30 2013-02-06 中国人民解放军理工大学 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PING LI,CHUNCHEN,JIAJUNBU: "Clustering analysis using manifold kernel concept factorization", 《NEUROCOMPUTING》, 24 February 2012 (2012-02-24), pages 1 - 12 *
叶敏超 等: "基于聚类的图像稀疏去噪方法", 《信号处理》, 31 October 2011 (2011-10-31) *
魏雅丽 等: "基于稀疏分解和聚类的自适应图像去噪新方法", 《计算机应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104021797A (zh) * 2014-06-19 2014-09-03 南昌大学 一种基于频域稀疏约束的语音信号增强方法
CN106618631A (zh) * 2016-11-17 2017-05-10 哈尔滨师范大学 一种基于分组稀疏性的自适应心音信号去噪方法
CN108831494A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
WO2019227588A1 (zh) * 2018-05-29 2019-12-05 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN103559886B (zh) 2017-04-12

Similar Documents

Publication Publication Date Title
CN103489454B (zh) 基于波形形态特征聚类的语音端点检测方法
CN105957537B (zh) 一种基于l1/2稀疏约束卷积非负矩阵分解的语音去噪方法和系统
CN103456312B (zh) 一种基于计算听觉场景分析的单通道语音盲分离方法
CN109378013B (zh) 一种语音降噪方法
CN105225672B (zh) 融合基频信息的双麦克风定向噪音抑制的系统及方法
CN103325381B (zh) 一种基于模糊隶属函数的语音分离方法
Gabor Communication theory and cybernetics
CN106340292A (zh) 一种基于连续噪声估计的语音增强方法
Koldovsky et al. Time-domain blind audio source separation using advanced component clustering and reconstruction
Lim et al. Harmonic and percussive source separation using a convolutional auto encoder
Chun et al. Drone noise reduction using deep convolutional autoencoder for UAV acoustic sensor networks
CN103559886A (zh) 基于组稀疏低秩表达的语音信号增强方法
CN112183582A (zh) 一种多特征融合的水下目标识别方法
Shifas et al. A non-causal FFTNet architecture for speech enhancement
CN103198836A (zh) 基于Hilbert变换的欠定声音信号分离方法及装置
CN104240717A (zh) 基于稀疏编码和理想二进制掩膜相结合的语音增强方法
CN102637438B (zh) 一种语音滤波方法
CN103903631A (zh) 基于变步长自然梯度算法的语音信号盲分离方法
Zhu et al. Analysis of hybrid feature research based on extraction LPCC and MFCC
Lu et al. Single channel source separation using filterbank and 2D sparse matrix factorization
Liu et al. N-hans: Introducing the augsburg neuro-holistic audio-enhancement system
Logeshwari et al. A survey on single channel speech separation
Liang et al. The analysis of the simplification from the ideal ratio to binary mask in signal-to-noise ratio sense
CN110751958A (zh) 一种基于rced网络的降噪方法
CN104299613A (zh) 声掩蔽信号产生方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant