CN103559886A - 基于组稀疏低秩表达的语音信号增强方法 - Google Patents
基于组稀疏低秩表达的语音信号增强方法 Download PDFInfo
- Publication number
- CN103559886A CN103559886A CN201310439143.8A CN201310439143A CN103559886A CN 103559886 A CN103559886 A CN 103559886A CN 201310439143 A CN201310439143 A CN 201310439143A CN 103559886 A CN103559886 A CN 103559886A
- Authority
- CN
- China
- Prior art keywords
- voice signal
- rank
- low
- group
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
基于组稀疏低秩表达的语音信号增强方法,针对带噪语音信号进行以下操作:首先,根据预设的采样频率对语音信号进行采样,形成对应的向量化表达,并按不同主题对语音信号进行分组;其次,利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;最后,通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。本发明的优点在于:有效地考虑了同主题语音信号间的组稀疏结构特性,能更好地消除背景噪音并获取更清晰的语音信号,使听者更迅速准确地理解语音内容,可应用于军事通信、网络音频会议和在线电台放送等等。
Description
技术领域
本发明涉及语音信号增强的技术领域,特别是基于组稀疏低秩表达的语音信号增强方法。
背景技术
随着数字媒体设备在人们日常工作和生活中的普及,特别是互联网技术的迅速发展壮大,每天都产生海量的语音数据,这些数据对现实生活中很多领域的交流与合作有着至关重要的影响。然后,由于各种客观环境条件的制约,如家居中小孩的滴哭声、会议室外的车辆喧闹声、实验室内的机器运转声和战争中的炸弹声等等,导致音频设备采集的语音信号通常伴随着不同程度的噪声。因此,如何有效分离语音数据中的噪声成分,增强语音信号是学术界和工业界非常关心且一直在研究探讨的问题。语音信号的增强技术,主要指从不同的噪声背景下提取有效而清晰的语音信号,抑制、降低甚至消除噪声干扰。
目前,针对语音信号的增强处理集中在传统的数字和模拟信号处理中,如现有的典型语音增强方法主要有基于小波分析、谱相减、卡尔曼滤波、信号子空间、听觉掩蔽效应、神经网络、独立主成分分析等等。这些技术对于语音信号较少且不稳定的情况是很占优势的,但是随着大数据时代的到来,海量的语音数据唾手可得,这为利用统计机器学习方法解决带噪语音信号的噪声抑制提供了可能性。从机器学习的角度,将不同类型的语音信号看成数据样本,可以利用已有的许多鲁棒学习方法获得带噪语音数据的低维低秩本征表达,保留尽可能 多的原始语音信号,而抑制或丢弃无关的噪声信息,从而实现语音信号和噪声信号的分离,提高听者对语音信号传递内容的鉴别理解能力。在语音数据极为丰富的情形下,使用统计机器学习的方法处理带噪语音信号具有传统信号处理方法无法比拟的优势,具有很强的现实意义和重要的研究价值。
发明内容
为了让用户对多种混合的带噪语音信号提高辨听力,本发明提出了一种基于组稀疏低秩表达的语音信号增强方法,该方法包括以下步骤:
1、获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作:
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组;
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。
进一步,步骤1)中所述的按照不同主题对语音信号分组,具体是:
2)通过按顺序拼接不同主题的信号矩阵块,可构造整体语音信号矩阵X=[X1,…,Xk]∈Rm×n,其中n=n1+n2+…+nk。
进一步,步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达,具体是:
1)假设第c个主题语音信号的组稀疏低秩表达为Zc,则同主题语音信号间的组稀疏结构特征可通过矩阵的l1,q范式表征为 其中
其中,‖·‖q表示向量的lq范式,q>0反映了语音信号的组结构特征,第c个主题语音信号的低秩表达 而列向量表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn×n;
2)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即
minimizeZ,E‖Z‖*+α‖Z‖1,q+λ‖E‖1,
subject to X=XZ+E,eTZ=eT,Z≥0,
其中,‖Z‖*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E。
进一步,步骤3)中所述通过获得的低秩表达对原始带噪信号进行重构,具体是:
通过上述步骤求得的语音信号对应的组稀疏低秩表达Z与原始带噪语音信号X进行线性乘积,可获得重构后的清晰增强语音信号,即
本发明提出了基于组稀疏低秩表达的语音信号增强方法,其优点在于:有效地考虑了同主题语音信号间的组稀疏结构特性,能更好地消除背景噪音并获取更清晰的语音信号,使听者更迅速准确地理解语音内容,可应用于军事通信、网络音频会议和在线电台放送等等。
附图说明
图1是本发明的方法流程图。
具体实施方式
参照附图,进一步说明本发明:
基于组稀疏低秩表达的语音信号增强方法,该方法包括以下步骤:
1、获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作:
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组;
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。
步骤1)中所述的按照不同主题对语音信号分组,具体是:
2)通过按顺序拼接不同主题的信号矩阵块,可构造整体语音信号矩阵X=[X1,…,Xk]∈Rm×n,其中n=n1+n2+…+nk。
步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组 稀疏低秩表达,具体是:
1)假设第c个主题语音信号的组稀疏低秩表达为Zc,则同主题语音信号间的组稀疏结构特征可通过矩阵的l1,q范式表征为 其中
其中,‖·‖q表示向量的lq范式,q>0反映了语音信号的组结构特征,第c个主题语音信号的低秩表达 而列向量 表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn×n;
2)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即
minimizeZ,E‖Z‖*+α‖Z‖1,q+λ‖E‖1,
subject to X=XZ+E,eTZ=eT,Z≥0,
其中,‖Z‖*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E。
步骤3)中所述通过获得的低秩表达对原始带噪信号进行重构, 具体是:
通过上述步骤求得的语音信号对应的组稀疏低秩表达Z与原始带噪语音信号X进行线性乘积,可获得重构后的清晰增强语音信号,即
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (4)
1.基于组稀疏低秩表达的语音信号增强方法,该方法的特征在于获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作:
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组;
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。
3.如权利要求2所述的基于组稀疏低秩表达的语音信号增强方法,其特征在于:步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达,具体是:
其中,‖·‖q表示向量的lq范式,q>0反映了语音信号的组结构特征, 第c个主题语音信号的低秩表达 而列向量表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn×n;
2)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即
minimizeZ,E‖Z‖*+α‖Z‖1,q+λ‖E‖1,
subject to X=XZ+E,eTZ=eT,Z≥0,
其中,‖Z‖*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310439143.8A CN103559886B (zh) | 2013-09-24 | 2013-09-24 | 基于组稀疏低秩表达的语音信号增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310439143.8A CN103559886B (zh) | 2013-09-24 | 2013-09-24 | 基于组稀疏低秩表达的语音信号增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103559886A true CN103559886A (zh) | 2014-02-05 |
CN103559886B CN103559886B (zh) | 2017-04-12 |
Family
ID=50014116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310439143.8A Active CN103559886B (zh) | 2013-09-24 | 2013-09-24 | 基于组稀疏低秩表达的语音信号增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103559886B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021797A (zh) * | 2014-06-19 | 2014-09-03 | 南昌大学 | 一种基于频域稀疏约束的语音信号增强方法 |
CN106618631A (zh) * | 2016-11-17 | 2017-05-10 | 哈尔滨师范大学 | 一种基于分组稀疏性的自适应心音信号去噪方法 |
CN108831494A (zh) * | 2018-05-29 | 2018-11-16 | 平安科技(深圳)有限公司 | 语音增强方法、装置、计算机设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915742A (zh) * | 2012-10-30 | 2013-02-06 | 中国人民解放军理工大学 | 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法 |
-
2013
- 2013-09-24 CN CN201310439143.8A patent/CN103559886B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915742A (zh) * | 2012-10-30 | 2013-02-06 | 中国人民解放军理工大学 | 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法 |
Non-Patent Citations (3)
Title |
---|
PING LI,CHUNCHEN,JIAJUNBU: "Clustering analysis using manifold kernel concept factorization", 《NEUROCOMPUTING》, 24 February 2012 (2012-02-24), pages 1 - 12 * |
叶敏超 等: "基于聚类的图像稀疏去噪方法", 《信号处理》, 31 October 2011 (2011-10-31) * |
魏雅丽 等: "基于稀疏分解和聚类的自适应图像去噪新方法", 《计算机应用》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021797A (zh) * | 2014-06-19 | 2014-09-03 | 南昌大学 | 一种基于频域稀疏约束的语音信号增强方法 |
CN106618631A (zh) * | 2016-11-17 | 2017-05-10 | 哈尔滨师范大学 | 一种基于分组稀疏性的自适应心音信号去噪方法 |
CN108831494A (zh) * | 2018-05-29 | 2018-11-16 | 平安科技(深圳)有限公司 | 语音增强方法、装置、计算机设备及存储介质 |
WO2019227588A1 (zh) * | 2018-05-29 | 2019-12-05 | 平安科技(深圳)有限公司 | 语音增强方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103559886B (zh) | 2017-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103489454B (zh) | 基于波形形态特征聚类的语音端点检测方法 | |
CN105957537B (zh) | 一种基于l1/2稀疏约束卷积非负矩阵分解的语音去噪方法和系统 | |
CN103456312B (zh) | 一种基于计算听觉场景分析的单通道语音盲分离方法 | |
CN109378013B (zh) | 一种语音降噪方法 | |
CN105225672B (zh) | 融合基频信息的双麦克风定向噪音抑制的系统及方法 | |
CN103325381B (zh) | 一种基于模糊隶属函数的语音分离方法 | |
Gabor | Communication theory and cybernetics | |
CN106340292A (zh) | 一种基于连续噪声估计的语音增强方法 | |
Koldovsky et al. | Time-domain blind audio source separation using advanced component clustering and reconstruction | |
Lim et al. | Harmonic and percussive source separation using a convolutional auto encoder | |
Chun et al. | Drone noise reduction using deep convolutional autoencoder for UAV acoustic sensor networks | |
CN103559886A (zh) | 基于组稀疏低秩表达的语音信号增强方法 | |
CN112183582A (zh) | 一种多特征融合的水下目标识别方法 | |
Shifas et al. | A non-causal FFTNet architecture for speech enhancement | |
CN103198836A (zh) | 基于Hilbert变换的欠定声音信号分离方法及装置 | |
CN104240717A (zh) | 基于稀疏编码和理想二进制掩膜相结合的语音增强方法 | |
CN102637438B (zh) | 一种语音滤波方法 | |
CN103903631A (zh) | 基于变步长自然梯度算法的语音信号盲分离方法 | |
Zhu et al. | Analysis of hybrid feature research based on extraction LPCC and MFCC | |
Lu et al. | Single channel source separation using filterbank and 2D sparse matrix factorization | |
Liu et al. | N-hans: Introducing the augsburg neuro-holistic audio-enhancement system | |
Logeshwari et al. | A survey on single channel speech separation | |
Liang et al. | The analysis of the simplification from the ideal ratio to binary mask in signal-to-noise ratio sense | |
CN110751958A (zh) | 一种基于rced网络的降噪方法 | |
CN104299613A (zh) | 声掩蔽信号产生方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |