CN103559886B - 基于组稀疏低秩表达的语音信号增强方法 - Google Patents
基于组稀疏低秩表达的语音信号增强方法 Download PDFInfo
- Publication number
- CN103559886B CN103559886B CN201310439143.8A CN201310439143A CN103559886B CN 103559886 B CN103559886 B CN 103559886B CN 201310439143 A CN201310439143 A CN 201310439143A CN 103559886 B CN103559886 B CN 103559886B
- Authority
- CN
- China
- Prior art keywords
- voice signal
- low
- rank
- matrix
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
基于组稀疏低秩表达的语音信号增强方法,针对带噪语音信号进行以下操作:首先,根据预设的采样频率对语音信号进行采样,形成对应的向量化表达,并按不同主题对语音信号进行分组;其次,利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;最后,通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。本发明的优点在于:有效地考虑了同主题语音信号间的组稀疏结构特性,能更好地消除背景噪音并获取更清晰的语音信号,使听者更迅速准确地理解语音内容,可应用于军事通信、网络音频会议和在线电台放送等等。
Description
技术领域
本发明涉及语音信号增强的技术领域,特别是基于组稀疏低秩表达的语音信号增强方法。
背景技术
随着数字媒体设备在人们日常工作和生活中的普及,特别是互联网技术的迅速发展壮大,每天都产生海量的语音数据,这些数据对现实生活中很多领域的交流与合作有着至关重要的影响。然后,由于各种客观环境条件的制约,如家居中小孩的滴哭声、会议室外的车辆喧闹声、实验室内的机器运转声和战争中的炸弹声等等,导致音频设备采集的语音信号通常伴随着不同程度的噪声。因此,如何有效分离语音数据中的噪声成分,增强语音信号是学术界和工业界非常关心且一直在研究探讨的问题。语音信号的增强技术,主要指从不同的噪声背景下提取有效而清晰的语音信号,抑制、降低甚至消除噪声干扰。
目前,针对语音信号的增强处理集中在传统的数字和模拟信号处理中,如现有的典型语音增强方法主要有基于小波分析、谱相减、卡尔曼滤波、信号子空间、听觉掩蔽效应、神经网络、独立主成分分析等等。这些技术对于语音信号较少且不稳定的情况是很占优势的,但是随着大数据时代的到来,海量的语音数据唾手可得,这为利用统计机器学习方法解决带噪语音信号的噪声抑制提供了可能性。从机器学习的角度,将不同类型的语音信号看成数据样本,可以利用已有的许多鲁棒学习方法获得带噪语音数据的低维低秩本征表达,保留尽可能多的原始语音信号,而抑制或丢弃无关的噪声信息,从而实现语音信号和噪声信号的分离,提高听者对语音信号传递内容的鉴别理解能力。在语音数据极为丰富的情形下,使用统计机器学习的方法处理带噪语音信号具有传统信号处理方法无法比拟的优势,具有很强的现实意义和重要的研究价值。
发明内容
为了让用户对多种混合的带噪语音信号提高辨听力,本发明提出了一种基于组稀疏低秩表达的语音信号增强方法,该方法包括以下步骤:
1、获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作:
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组;
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。
进一步,步骤1)中所述的按照不同主题对语音信号分组,具体是:
11)假设语音信号可分为k个主题,则第c个主题的语音信号矩阵表示为其中nc为第c个主题的语音信号数目;
12)通过按顺序拼接不同主题的信号矩阵块,可构造整体语音信号矩阵X=[X1,…,Xk]∈Rm×n,其中n=n1+n2+…+nk。
进一步,步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达,具体是:
21)假设第c个主题语音信号的组稀疏低秩表达为Zc,则同主题语音信号间的组稀疏结构特征可通过矩阵的l1,q范式表征为其中
其中,||·||q表示向量的lq范式,q>0反映了语音信号的组结构特征,第c个主题语音信号的低秩表达而列向量表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn×n;
22)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即
minimizeZ,E||Z||*+α||Z||1,q+λ||E||1,
subject to X=XZ+E,eTZ=eT,Z≥0,
其中,||Z||*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E。
进一步,步骤3)中所述通过获得的低秩表达对原始带噪信号进行重构,具体是:
通过上述步骤求得的语音信号对应的组稀疏低秩表达Z与原始带噪语音信号X进行线性乘积,可获得重构后的清晰增强语音信号,即
本发明提出了基于组稀疏低秩表达的语音信号增强方法,其优点在于:有效地考虑了同主题语音信号间的组稀疏结构特性,能更好地消除背景噪音并获取更清晰的语音信号,使听者更迅速准确地理解语音内容,可应用于军事通信、网络音频会议和在线电台放送等等。
附图说明
图1是本发明的方法流程图。
具体实施方式
参照附图,进一步说明本发明:
基于组稀疏低秩表达的语音信号增强方法,该方法包括以下步骤:
1、获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作:
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组;
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号。
步骤1)中所述的按照不同主题对语音信号分组,具体是:
11)假设语音信号可分为k个主题,则第c个主题的语音信号矩阵表示为其中nc为第c个主题的语音信号数目;
12)通过按顺序拼接不同主题的信号矩阵块,可构造整体语音信号矩阵X=[X1,…,Xk]∈Rm×n,其中n=n1+n2+…+nk。
步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达,具体是:
21)假设第c个主题语音信号的组稀疏低秩表达为Zc,则同主题语音信号间的组稀疏结构特征可通过矩阵的l1,q范式表征为其中
其中,||·||q表示向量的lq范式,q>0反映了语音信号的组结构特征,第c个主题语音信号的低秩表达而列向量表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn×n;
22)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即
minimizeZ,E||Z||*+α||Z||1,q+λ||E||1,
subject to X=XZ+E,eTZ=eT,Z≥0,
其中,||Z||*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E。
步骤3)中所述通过获得的低秩表达对原始带噪信号进行重构,具体是:
通过上述步骤求得的语音信号对应的组稀疏低秩表达Z与原始带噪语音信号X进行线性乘积,可获得重构后的清晰增强语音信号,即
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (1)
1.基于组稀疏低秩表达的语音信号增强方法,该方法的特征在于获取不同主题的大量带噪语音信号后,针对带噪语音信号进行以下操作:
1)根据预设的采样频率fs对每个带噪语音信号进行采样,获得m维的向量化表达x∈Rm,并按照不同主题对语音信号分组;
2)利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达;
3)通过获得的低秩表达对原始带噪信号进行重构,从而输出清晰的增强语音信号;
步骤1)中所述的按照不同主题对语音信号分组,具体是:
11)假设语音信号可分为k个主题,则第c个主题的语音信号矩阵表示为其中nc为第c个主题的语音信号数目;
12)通过按顺序拼接不同主题的信号矩阵块,可构造整体语音信号矩阵X=[X1,…,Xk]∈Rm×n,其中n=n1+n2+…+nk;
步骤2)中所述的利用同主题语音信号间的组稀疏结构特性,通过低秩矩阵分解对带噪语音信号实现噪声分离,并得到语音信号的组稀疏低秩表达,具体是:
21)假设第c个主题语音信号的组稀疏低秩表达为Zc,则同主题语音信号间的组稀疏结构特征可通过矩阵的l1,q范式表征为其中
其中,||·||q表示向量的lq范式,q>0反映了语音信号的组结构特征,第c个主题语音信号的低秩表达而列向量表示第c个主题中的第j个语音信号对应的低秩表达系数,整体语音信号矩阵的低秩表达为一个块对角矩阵Z=diag(Z1,…,Zk)∈Rn ×n;
22)设语音信号中的噪声成分表示为矩阵E∈Rm×n,语音信号的词典为数据矩阵本身X,通过求解下式可实现低秩矩阵分解,即
minimizeZ,E ||Z||*+α||Z||1,q+λ||E||1,
subject to X=XZ+E,eTZ=eT,Z≥0,
其中,||Z||*表示矩阵Z的核范式,即矩阵Z的奇异值之和,参数α>0可调节组稀疏结构特征的贡献,参数λ>0控制语音信号中的噪声压制程度,e是一个全1的列向量,这样,可以得到语音信号的组稀疏低秩表达Z,同时分离出噪声矩阵E;
步骤3)中所述通过获得的低秩表达对原始带噪信号进行重构,具体是:
通过上述步骤求得的语音信号对应的组稀疏低秩表达Z与原始带噪语音信号X进行线性乘积,可获得重构后的清晰增强语音信号,即
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310439143.8A CN103559886B (zh) | 2013-09-24 | 2013-09-24 | 基于组稀疏低秩表达的语音信号增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310439143.8A CN103559886B (zh) | 2013-09-24 | 2013-09-24 | 基于组稀疏低秩表达的语音信号增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103559886A CN103559886A (zh) | 2014-02-05 |
CN103559886B true CN103559886B (zh) | 2017-04-12 |
Family
ID=50014116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310439143.8A Active CN103559886B (zh) | 2013-09-24 | 2013-09-24 | 基于组稀疏低秩表达的语音信号增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103559886B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021797A (zh) * | 2014-06-19 | 2014-09-03 | 南昌大学 | 一种基于频域稀疏约束的语音信号增强方法 |
CN106618631B (zh) * | 2016-11-17 | 2019-05-03 | 哈尔滨师范大学 | 一种基于分组稀疏性的自适应心音信号去噪方法 |
CN108831494B (zh) * | 2018-05-29 | 2022-07-19 | 平安科技(深圳)有限公司 | 语音增强方法、装置、计算机设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915742A (zh) * | 2012-10-30 | 2013-02-06 | 中国人民解放军理工大学 | 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法 |
-
2013
- 2013-09-24 CN CN201310439143.8A patent/CN103559886B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915742A (zh) * | 2012-10-30 | 2013-02-06 | 中国人民解放军理工大学 | 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法 |
Non-Patent Citations (2)
Title |
---|
Clustering analysis using manifold kernel concept factorization;Ping Li,ChunChen,JiajunBu;《Neurocomputing》;20120224;1-12 * |
基于聚类的图像稀疏去噪方法;叶敏超 等;《信号处理》;20111031;1593-1598 * |
Also Published As
Publication number | Publication date |
---|---|
CN103559886A (zh) | 2014-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE112017001830B4 (de) | Sprachverbesserung und audioereignisdetektion für eine umgebung mit nichtstationären geräuschen | |
CN101404160B (zh) | 一种基于音频识别的语音降噪方法 | |
CN102081928B (zh) | 基于压缩感知和k-svd的单通道混合语音分离方法 | |
CN105957537A (zh) | 一种基于l1/2稀疏约束卷积非负矩阵分解的语音去噪方法和系统 | |
CN103559886B (zh) | 基于组稀疏低秩表达的语音信号增强方法 | |
CN110491406B (zh) | 一种多模块抑制不同种类噪声的双噪声语音增强方法 | |
CN103854660B (zh) | 一种基于独立成分分析的四麦克语音增强方法 | |
CN106233382A (zh) | 一种对若干个输入音频信号进行去混响的信号处理装置 | |
Sharan et al. | Cochleagram image feature for improved robustness in sound recognition | |
CN105225672A (zh) | 融合基频信息的双麦克风定向噪音抑制的系统及方法 | |
CN110544482A (zh) | 一种单通道语音分离系统 | |
Choi et al. | Blind source separation of speech and music signals using harmonic frequency dependent independent vector analysis | |
CN103824562B (zh) | 基于心理声学模型的语音后置感知滤波器 | |
CN103903631A (zh) | 基于变步长自然梯度算法的语音信号盲分离方法 | |
Jafari et al. | Sparse coding for convolutive blind audio source separation | |
Zhu et al. | Analysis of hybrid feature research based on extraction LPCC and MFCC | |
Lu et al. | Single channel source separation using filterbank and 2D sparse matrix factorization | |
CN111009259B (zh) | 一种音频处理方法和装置 | |
CN110751958A (zh) | 一种基于rced网络的降噪方法 | |
Hussain et al. | Speech enhancement using degenerate unmixing estimation technique and adaptive noise cancellation technique as a post signal processing | |
Matsuoka et al. | Blind separation for convolutive mixture of many voices | |
Khan et al. | An efficient multistage approach for blind source separation of noisy convolutive speech mixture | |
Houda et al. | A novel method based on gaussianity and sparsity for signal separation algorithms | |
CN113808604B (zh) | 基于伽马通频谱分离的声场景分类方法 | |
Ghasemi | A new approach based on SVD for speech enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |