CN103903630A - 一种用于消除稀疏噪声方法及装置 - Google Patents

一种用于消除稀疏噪声方法及装置 Download PDF

Info

Publication number
CN103903630A
CN103903630A CN201410101764.XA CN201410101764A CN103903630A CN 103903630 A CN103903630 A CN 103903630A CN 201410101764 A CN201410101764 A CN 201410101764A CN 103903630 A CN103903630 A CN 103903630A
Authority
CN
China
Prior art keywords
noise
sparse
sparse noise
objective function
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410101764.XA
Other languages
English (en)
Inventor
李健
吴飞
张连毅
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Original Assignee
JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd filed Critical JIETONG HUASHENG SPEECH TECHNOLOGY Co Ltd
Priority to CN201410101764.XA priority Critical patent/CN103903630A/zh
Publication of CN103903630A publication Critical patent/CN103903630A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了用于消除稀疏噪声的方法,该方法包括将现有的用于高斯噪声信号估计的系统噪声模型进行修改,在量测噪声向量中增加一量测稀疏噪声的量ns(k);采用凸优化形式,将所述增加了ns(k)的系统噪声模型转化得到目标函数f(ns(k)),以对稀疏噪声进行估计;将所述目标函数转化成标准的l1-l2范数形式F(ns(k));采用数值迭代算法PCD去计算F(ns(k))的最优解,从而估计出稀疏噪声值;基于所估计出的稀疏噪声值更新滤波器值,去除语音信号中的稀疏噪声,输出干净语音信号。本发明还提供一种用于消除稀疏噪声的装置。使用该发明,能很好的估计和去除语音前端存在的稀疏噪声,计算处理速度快,适合于实际应用,得到很好的语音信号估计,且可明显提高语音识别的准确率。

Description

一种用于消除稀疏噪声方法及装置
技术领域
本发明涉及语音信号处理技术领域,具体地说,涉及一种用于消除稀疏噪声的方法及装置。
背景技术
在语音识别的前端处理中,去噪和抗噪是最关键的处理步骤,通过语音增强对各种坏境噪声抑制、消除,降低噪声对语音信号输入的干扰,得到所需的纯净且高质量的语音信号。一般去噪滤波方法都是针对一般的高斯白噪声,对于实际坏境中的稀疏噪声,譬如像脉冲噪声、尖端噪声等满足大部分时间为0、偶尔出现一些幅值大于0(相当于满足拉普拉斯分布)的噪声,需要另行采用方法进行处理。
在语音识别的前段数据采集过程中,语音信号通常被各种噪声所污染,存在的噪声影响人的主观感受和声音质量,因此,在语音识别过程中通过语音增强去除噪声变的非常重要。
语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。一句话,从含噪语音中提取尽可能纯净的原始语音。
传统的语音增强算法是谱减法、维纳滤波法等。对带噪语音运用谱减法就是从输入信号的谱中减去估计的噪声谱,谱减法算法简单,较容易实现,但只适用于平稳噪声,而且会产生“音乐噪声”,影响了人的主观感受。维纳滤波受限于平稳条件的约束,具有一定的局限性。现实中,语音和噪声都是非平稳的。对于解决非平稳的信号,卡尔曼滤波是语音增强的又一基本方法,但是只能对带有高斯噪声的信号做出最优估计,针对现实中存在一些瞬间的稀疏噪声,一般卡尔曼滤波不能很好的解决。
在现有研究中也提出了基于凸优化理论的鲁棒卡尔曼方法,将语音增强问题转化成凸优化形式,利用鲁棒卡尔曼算法解决语音前端的稀疏噪声问题。已有的研究中用到的SSF(代理函数分离)法存在许多的不完善,比如在实际工程应用中上述凸优化形式运行速度很慢,因此,需要找到一个更有效的数值方法。
发明内容
本发明提供一种用于消除稀疏噪声方法机装置,可快速高效地估算出稀疏噪声。
本发明提供的一种用于消除稀疏噪声方法,包括:
将现有的用于高斯噪声信号估计的系统噪声模型进行修改,在量测噪声向量中增加一量测稀疏噪声的量ns(k);
采用凸优化形式,将所述增加了ns(k)的系统噪声模型转化得到目标函数f(ns(k)),以对稀疏噪声进行估计;
将所述目标函数转化成标准的l1-l2范数形式F(ns(k));
采用数值迭代算法PCD去计算F(ns(k))的最优解,从而估计出稀疏噪声值;
基于所估计出的稀疏噪声值更新滤波器值,去除语音信号中的稀疏噪声,输出干净语音信号。
本发明提供的一种用于消除稀疏噪声的装置,包括:
稀疏噪声设置模块,用于将现有的用于高斯噪声信号估计的系统噪声模型进行修改,在量测噪声向量中增加一量测稀疏噪声的量ns(k);
第一转化模块,用于采用凸优化形式,将所述增加了ns(k)的系统噪声模型转化得到目标函数f(ns(k)),以对稀疏噪声进行估计;
第二转化模块,将所述目标函数转化成标准的l1-l2范数形式F(ns(k));
计算模块,采用数值迭代算法PCD去计算F(ns(k))的最优解,从而估计出稀疏噪声值。
使用该发明,能很好的估计和去除语音前端存在的稀疏噪声,计算处理速度快,适合于实际应用,得到很好的语音信号估计,且可明显提高语音识别的准确率。
附图说明
图1为本发明提供的用于消除稀疏噪声的方法流程图;
图2为语音增强问题模型示意图;
图3为本发明提供的一种用于消除稀疏噪声的装置示意图;
图4所示为连续语音识别框图;
图5所示为去噪算法流程图;
图6为纯净语音信号加噪声信号图;
图7为本发明提供的PCD算法估计出的语音信号示意图;
图8为采用本发明提供的PCD迭代算法估计出的稀疏噪声示意图。
具体实施方式
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的组件和功能是可选的,并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。在本文中,本发明的这些实施方案可以被单独地或总地用术语“发明”来表示,这仅仅是为了方便,并且如果事实上公开了超过一个的发明,不是要自动地限制该应用的范围为任何单个发明或发明构思。
在语音识别的前端处理中,去噪和抗噪是最关键的处理步骤,通过语音增强对各种坏境噪声抑制、消除,降低噪声对语音信号输入的干扰,得到我们所需的纯净且高质量的语音信号。一般去噪滤波方法都是针对一般的高斯白噪声,对于实际坏境中的稀疏噪声,本发明也能针对性的消除和抑制。本发明中采用PCD(平行坐标下降法)一种有效迭代算法去实现估计稀疏噪声,得到更纯净的语音信号,为后续语音识别准确率的提高提供了可靠的技术手段。所谓坐标下降法是一种非梯度优化算法,为了找到一个函数的局部极小值,在每次迭代中可以在当前点处沿一个坐标方向进行一维搜索,在整个过程中循环使用不同的坐标方向,一个周期的一维搜索迭代过程相当于一个梯度迭代。
为了针对性的消除和抑制稀疏噪声,本发明中采用PCD(平行坐标下降法)一种有效迭代算法去实现估计系数噪声,得到更纯净的语音信号,为后续语音识别准确率的提高提供了可靠的技术手段。
如图1所示,本发明提供的一种用于消除稀疏噪声方法,包括如下步骤:
S101,将现有的用于高斯噪声信号估计的系统噪声模型进行修改,在量测噪声向量中增加一量测稀疏噪声的量ns(k);
S102,采用凸优化形式,将所述增加了ns(k)的系统噪声模型转化得到目标函数f(ns(k)),以对稀疏噪声进行估计;
S103,将所述目标函数转化成标准的l1-l2范数形式F(ns(k));
S104,采用数值迭代算法PCD去计算F(ns(k))的最优解,从而估计出稀疏噪声值;
S105,基于所估计出的稀疏噪声值更新滤波器值,去除语音信号中的稀疏噪声,输出干净语音信号。
下面结合附图对本发明的原理、特性进行描述。
图2为语音增强问题模型示意图,语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。也就是从含噪语音中提取尽可能纯净的原始语音。如图2所示,语音增强的目标是设计一个滤波器,在给定条件下:语音信号和噪声信号满足yX=yS+yN,产生一个语音信号yS的估计
Figure BDA0000478484790000051
最终的目的和结果是得到最高可信度和信噪比(SNR)的语音估计信号。描述的这个语音质量的标准是:真实值与估计值偏差e的均方值达到最小。
实际语音增强中采用各种滤波算法都是为了更好的估计语音信号yS,传统卡尔曼滤波是语音增强的基本方法,通过状态的估计的更新得到更准确的语音信号
Figure BDA0000478484790000052
卡尔曼滤波是以最小均方误差为估计的最佳准则,来寻求一套递推估计的算法,其基本思想是:采用信号与噪声的状态空间模型,利用前一时刻的估计值和现时刻的观测值来更新对状态变量的估计,求出现时刻的估计值。它适合于实时处理和计算机运算。
卡尔曼滤波的基本特征之一是利用状态方程和测量方程来描述随机系统。针对语音信号的处理,一般以帧为单位,假设在每帧中语音信号是平稳的。语音信号可以用自回归AR模型来表示,其中所有的AR参数在语音段中保持不变。结合语音生成全极点模型,可以把语音模型转化成状态空间的形式。语音信号在k时刻的表示s(k):
Figure BDA0000478484790000053
其中ai,i=1,…,p是AR模型参数,p是AR参数的阶数,u(k)是高斯白噪声。然后,我们再把上式转化下面的状态空间模型:x(k)=Ax(k-1)+Bu(k)其中状态向量x(k),状态转移矩阵A以及输入矩阵B分别为:x(k)=[s(k),s(k-1),...,s(k-p+1)]T
A = - a 1 - a 2 · · · - a p · · · · · · · · · · · · 0 1 · · · 0 0 · · · 1 0           B=[1 0 … 0]T
实际中语音信号是带有量测噪声的,其模型为y(k)=s(k)+n(k)观测噪声n(k)也满足
Figure BDA0000478484790000064
的高斯分布,与状态变量一样,上式也可以用状态空间模型来表示:y(k)=Cx(k)+n(k)其中C=[1 0 … 0]为量测矩阵。
在语音增强问题上,都是在得到{y(1),y(2),…,y(k)}量测数据后去估计实际的状态值x(k),针对语音信号的状态空间模型,可采用下面传统的卡尔曼系统模型解决形式。
(一)传统卡尔曼滤波
传统卡尔曼系统模型定义为:
X(k+1)=F(k)X(k)+V(k)
Z(k+1)=H(k+1)X(k+1)+W(k)             (1)
其中k是时间序列,F和H分别是状态转移矩阵和量测矩阵;X(k)∈Rn是状态向量,Z(k)∈Rm是量测向量。V(k)∈Rn和W(k)∈Rm分别为过程噪声和量测噪声,满足零均值的高斯分布。其协方差矩阵分别为Q和R。
传统卡尔曼滤波的状态估计为:
X Λ ( k + 1 | k + 1 ) = F ( k ) X Λ ( k | k ) + K ( k + 1 ) ( Z ( k + 1 ) - H ( k + 1 ) F ( k ) X Λ ( k | k ) ) - - - ( 2 )
最优滤波增益矩阵为:
K(k+1)=P(k+1|k)H(k+1)T(H(k+1)P(k+1|k)H(k+1)T+R(k))-1      (3)
预测协方差阵为:
P(k+1|k)=F(k)P(k|k)F(k)T+Q(k)               (4)
滤波误差协方差阵为:
P(k+1|k+1)=(I-K(k+1)H(k+1))P(k+1|k)                (5)
上述(2)至(5)式即组成了卡尔曼滤波的逆推公式,只要给定状态估计初始值
Figure BDA0000478484790000071
和协方差矩阵P(0|0),上面的滤波逆推过程就可以启动。只是过程噪声和量测噪声一般都只满足高斯白噪声分布。其中状态估计
Figure BDA0000478484790000072
就是我们问题模型想要得到的语音信号
Figure BDA0000478484790000073
(二)鲁棒卡尔曼滤波解决稀疏噪声问题
将传统的卡尔曼滤波逆推过程通过变换转换成二次优化形式,通过二次优化形式得到所要的p(X(k)|Z(k))的最优估计形式:
min imize W T ( k ) R - 1 W ( k ) + ( X ( k ) - X ^ ( k | k - 1 ) ) T Σ - 1 ( X ( k ) - X ^ ( k | k - 1 ) ) subjectto Z ( k ) = HX ( k ) + W ( k ) - - - ( 6 )
上述利用凸优化技术求解估计值,其解决形式可以利用cvx工具有效求解。所述凸优化技术是指一种比较特殊的优化处理技术,是指目标函数为凸函数且由约束条件得到的定义域为凸集的优化问题。式中X(k)和W(k)是变量,Σ是预测状态协方差,X(k)的估计值即是
Figure BDA0000478484790000075
W(k)就是对一般量测噪声的估计。WT(k)R-1W(k)是根据量测噪声所作的补偿,上式中 ( X ( k ) - X ^ ( k | k - 1 ) ) T Σ - 1 ( X ( k ) - X ^ ( k | k - 1 ) ) 是根据先验信息对状态所得到的补偿。
针对语音识别前端稀疏噪声的存在,传统卡尔曼的系统模型需要做些修改,增加一个另外的量测稀疏噪声,其形式如下:
X(k+1)=FX(k)+V(k)
Z(k)=HX(k)+W(k)+ns(k)                (7)
为了处理这个增加的稀疏噪声ns(k),继续采用凸优化形式,通过l1来处理稀疏噪声。根据鲁棒卡尔曼对应的优化形式继续转化:
min imize W T ( k ) R - 1 W ( k ) + ( X ( k ) - X ^ ( k | k - 1 ) ) T Σ - 1 ( X ( k ) - X ^ ( k | k - 1 ) ) + λ | | n s ( k ) | | 1 subjectto Z ( k ) = HX ( k ) + W ( k ) + n s ( k ) - - - ( 8 )
其中变量为X(k),W(k),ns(k),前面两个变量如上节描述,ns(k)得到的估计即是对稀疏噪声的估计。
上面的形式仍可继续转换成简单的形式,最后得到二次优化的有效等价形式表达式:
minimize   (e(k)-ns(k))TQs(e(k)-ns(k))+λ||ns(k)||1        (9)
其中
Figure BDA0000478484790000082
Qs=(I-HL)TR-1(I-HL)+LTΣ-1L,FP(k-1|k-1)FT+Q=Σ上面形式中ns(k)是对稀疏噪声的估计,也是唯一的变量,最后的估计形式 X ( k ) = X ^ ( k | k - 1 ) + L ( e ( k ) - n s ( k ) ) 等价于
Figure BDA0000478484790000084
参数λ≥0根据稀疏噪声的稀疏性自行调整,达到最佳估计。当λ足够大时,最优形式为ns(k)=0,等价于前节提到的传统卡尔曼优化形式,因此传统卡尔曼是鲁棒卡尔曼优化形式的一种特例。上面的二次优化解决形式已经能很好的在有稀疏噪声的情形下估计出状态值,但是实际工程应用中上述凸优化形式运行速度很慢,还需要找到一个更有效的数值方法去计算上面这个优化形式。
(三)数值迭代算法PCD改进
这里需要考虑将二次优化形式转化为基于l1-l2的最优化问题,本发明将重点阐述这种有效的迭代计算形式去解决二次优化的估计和计算速度问题。将(9)式转化下面的目标函数形式:
f(ns(k))=||x-Ans(k)||2 2+λ||ns(k)||1          (10)
其中x=Qs 1/2e(k),A=Qs 1/2现在是找到f(ns(k))的最优形式,前面提到这里用一种数值迭代算法PCD解决。首先我们把上面的目标函数转化成标准的l1-l2形式:
F ( n s ( k ) ) = 1 2 f ( n s ( k ) ) = 1 2 | | x - An s ( k ) | | 2 2 + λ 2 | | n s ( k ) | | 1 - - - ( 11 )
其中 λ new = λ 2 , 然后得到 F ( n s ( k ) ) = 1 2 | | x - An s ( k ) | | 2 2 + λ new | | n s ( k ) | | 1 , 考虑这个形式,增加变量z0,矩阵A拆开k列表示,等价变换上面公式,得到下式:
g ( n s ( k ) ) = 1 2 | | x - Az 0 - α k ( n s ( k ) - z 0 [ k ] ) | | 2 2 + λ new | | n s ( k ) | | 1 - - - ( 12 )
其中向量αk是A的第k列,式子αk(ns(k)-z0[k])去除了原值的影响,同时增加了新值,上式等价于下式:
g ( n s ( k ) ) = 1 2 | | α | | 2 2 . ( n s ( k ) - n s ( k ) 0 ) 2 + λ new | n s ( k ) | - - - ( 13 )
其中定义ns(k)0
Figure BDA0000478484790000096
根据这种形式可以根据标量函数g(τ)=0.5(τ0-τ)2+ν|τ|的最优解形式:
τ opt = S v ( τ 0 ) = 0 | τ 0 | ≤ v τ 0 - sign ( τ 0 ) v otherwise - - - ( 14 )
得到13式的最优解形式为:
z k opt = S n s ( k ) / | | α k | | 2 2 ( α k T ( x - Az 0 ) | | α k | | 2 2 + z 0 [ k ] ) - - - ( 15 )
因为稀疏噪声这里是低维的,所以上面的数值迭代算法计算量很小,有效的迭代计算求取二次优化的最优解,效率和速度都比一般的凸优化要快,具有有效的实用性。
基于上述理论,稀疏噪声采用l1范数表示,通过凸优化的二次优化形式转化成l1-l2的最优化问题,然后采用一种有效的数值迭代算法PCD计算估计稀疏噪声,得到需要的语音信号状态估计值p(X(k)|Z(k))。即语音增强问题所需要解决和估计的语音信号yS的估计
Figure BDA0000478484790000099
图3所示为本发明提供的一种用于消除稀疏噪声的装置300,包括:
稀疏噪声设置模块310,用于将现有的用于高斯噪声信号估计的系统噪声模型进行修改,在量测噪声向量中增加一量测稀疏噪声的量ns(k);
第一转化模块320,用于采用凸优化形式,将所述增加了ns(k)的系统噪声模型转化得到目标函数f(ns(k)),以对稀疏噪声进行估计;
第二转化模块330,将所述目标函数转化成标准的l1-l2范数形式F(ns(k));
计算模块340,采用数值迭代算法PCD去计算F(ns(k))的最优解,从而估计出稀疏噪声值。
实际语音信号中存在的尖端噪声,通过本发明的滤波器能很好的去除,得到较纯净的语音信号。图4所示为连续语音识别框图。本发明用在语音识别的前端处理中,下面针对语音识别中的实际应用实例,给出相关实现的流程。
语音数据(声音文件)做预处理的第一步就是去噪,本发明针对性的去除常见的稀疏噪声,同时能对一般的噪声进行过滤。
图5所示为去噪算法流程图。
本发明噪声的消除能够针对性的去噪稀疏噪声,下面继续通过实际语音数据来展示其性能,分别给出原始纯净语音数据,含一般噪声和稀疏噪声的数据,然后通过本发明的滤波方法得到过滤后的语音数据与原始语音数据对比,说明本发明的有效性,另外再根据原始的稀疏噪声分布和估计出的稀疏噪声分布对比,发现PCD估计的稀疏噪声和实际产生的稀疏噪声的位置以及幅值也基本偏差不多,得出本发明去除稀疏噪声的鲁棒性。
图6为纯净语音信号加噪声信号图。
图7为本发明提供的PCD算法估计出的语音信号示意图。
图8为采用本发明提供的PCD迭代算法估计出的稀疏噪声示意图。
图示能够很明显的得出本发明去噪的有效性,针对一般鲁棒卡尔曼中采用cvx工具去求凸优化问题的最优解,一般需要迭代多次才能收敛,速度很慢,无法工程使用。本发明中提出的PCD迭代算法针对低维数据(稀疏噪声这里是一维的)迭代的快速性,通过下面的对比数据可以反映,在单次滤波迭代对比测试中,可以得到如下数据:
单次滤波迭代时间对比
鲁棒卡尔曼滤波 PCD迭代
时间消耗(s) 43.8039 0.3212
通过测试可以看出在测试中单次滤波采用PCD迭代算法的时间明显比鲁棒卡尔曼的cvx估计方法快很多,可以得出本发明的PCD迭代算法可以有很好的工程实用性。
综述所述,采用本发明,可以实现有效去除现实语音前端中存在的稀疏噪声,提高语音识别的准确率,而且提供了一种有效的数值迭代算法PCD,利于工程上的使用和处理。
由于本发明是基于传统卡尔曼的基础上做的改进和扩展,本就吸取卡尔曼实时性强的特点(卡尔曼滤波是一种递归估计,它使用时不需要记录观测或者估计的历史信息,只要获知上一时刻状态的估计值以及当前状态的观测值就可以计算出当前时刻状态的估计值,因此计算量小和存储数据较小),加上对传统卡尔曼模型的修改(引入稀疏噪声),优化改进状态估计的形式,使其对高斯和稀疏噪声的估计更加鲁棒,最后结合一种有效数值迭代算法PCD去解决l1-l2的最优化问题,最后使在工程上去除稀疏噪声和高斯噪声变成现实。语音前端噪声消除的极大化,为后续的语音识别的准确率的提高提供了更现实的基础。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

Claims (5)

1.一种用于消除稀疏噪声方法,其特征在于,包括: 
将现有的用于高斯噪声信号估计的系统噪声模型进行修改,在量测噪声向量中增加一量测稀疏噪声的量ns(k); 
采用凸优化形式,将所述增加了ns(k)的系统噪声模型转化得到目标函数f(ns(k)),以对稀疏噪声进行估计; 
将所述目标函数转化成标准的l1-l2范数形式F(ns(k)); 
采用数值迭代算法PCD去计算F(ns(k))的最优解,从而估计出稀疏噪声值; 
基于所估计出的稀疏噪声值更新滤波器值,去除语音信号中的稀疏噪声,输出干净语音信号。 
2.如权利要求1所述的方法,其特征在于,所述对稀疏噪声进行估计采用鲁棒卡尔曼滤波,所述将所述增加了ns(k)的系统噪声模型继续转化得到目标函数f(ns(k))具体为: 
根据鲁棒卡尔曼对应的优化形式继续转化: 
Figure FDA0000478484780000011
Z(k)=HX(k)+W(k)+ns(k) 
其中变量为状态向量X(k),对一般量测噪声的估计W(k),ns(k)是对稀疏噪声的估计; 
转化下面的目标函数形式: 
f(ns(k))=||x-Ans(k)||2 2+λ||ns(k)||1
其中x=Qs 1/2e(k),A=Qs 1/2是找到f(ns(k))的最优形式。 
3.如权利要求2所述的方法,其特征在于,将所述目标函数转化成标准的l1-l2范数形式为 
Figure FDA0000478484780000021
4.如权利要求3所述的方法,其特征在于,所述采用数值迭代算法PCD去计算F(ns(k))的最优解,具体如下: 
在F(ns(k))等式中加入变量z0,矩阵A拆开K列表示,得到下式: 
Figure FDA0000478484780000022
其中向量αk是A的第k列,
Figure FDA0000478484780000023
其等价于下式: 
Figure FDA0000478484780000024
其中定义ns(k)0
Figure FDA0000478484780000025
根据标量函数g(τ)=0.5(τ0-τ)2+ν|τ|的最优解形式: 
Figure FDA0000478484780000026
得到最优解形式为: 
Figure FDA0000478484780000027
5.一种用于消除稀疏噪声的装置,其特征在于,包括: 
稀疏噪声设置模块,用于将现有的用于高斯噪声信号估计的系统噪声模型进行修改,在量测噪声向量中增加一量测稀疏噪声的量ns(k); 
第一转化模块,用于采用凸优化形式,将所述增加了ns(k)的系统噪声模型转化得到目标函数f(ns(k)),以对稀疏噪声进行估计; 
第二转化模块,将所述目标函数转化成标准的l1-l2范数形式F(ns(k)); 
计算模块,采用数值迭代算法PCD去计算F(ns(k))的最优解,从而估计出稀疏噪声值。 
CN201410101764.XA 2014-03-18 2014-03-18 一种用于消除稀疏噪声方法及装置 Pending CN103903630A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410101764.XA CN103903630A (zh) 2014-03-18 2014-03-18 一种用于消除稀疏噪声方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410101764.XA CN103903630A (zh) 2014-03-18 2014-03-18 一种用于消除稀疏噪声方法及装置

Publications (1)

Publication Number Publication Date
CN103903630A true CN103903630A (zh) 2014-07-02

Family

ID=50994909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410101764.XA Pending CN103903630A (zh) 2014-03-18 2014-03-18 一种用于消除稀疏噪声方法及装置

Country Status (1)

Country Link
CN (1) CN103903630A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484557A (zh) * 2014-12-02 2015-04-01 宁波大学 一种基于稀疏自回归模型建模的多频信号去噪方法
CN106340304A (zh) * 2016-09-23 2017-01-18 桂林航天工业学院 一种适用于非平稳噪声环境下的在线语音增强方法
CN107392861A (zh) * 2017-06-29 2017-11-24 南京航空航天大学 一种基于高斯比例混合模型的稀疏表示sar图像降斑方法
CN114584433A (zh) * 2022-02-24 2022-06-03 哈尔滨工程大学 一种脉冲噪声环境下多途信道中的同步信号检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1148471A1 (en) * 2000-04-18 2001-10-24 Matsushita Electric Industrial Co., Ltd. Method for noise adaptation in automatic speech recognition using transformed matrices
US20010048740A1 (en) * 2000-05-05 2001-12-06 Nanyang Technological University Noise canceler system with adaptive cross-talk filters
CN101901472A (zh) * 2010-07-07 2010-12-01 清华大学 一种基于矩阵秩最小化的非刚性鲁棒批量图像对齐方法
US20120133779A1 (en) * 2010-11-29 2012-05-31 Microsoft Corporation Robust recovery of transform invariant low-rank textures
CN103324923A (zh) * 2013-07-11 2013-09-25 上海理工大学 基于稀疏表示的手写字符识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1148471A1 (en) * 2000-04-18 2001-10-24 Matsushita Electric Industrial Co., Ltd. Method for noise adaptation in automatic speech recognition using transformed matrices
US20010048740A1 (en) * 2000-05-05 2001-12-06 Nanyang Technological University Noise canceler system with adaptive cross-talk filters
CN101901472A (zh) * 2010-07-07 2010-12-01 清华大学 一种基于矩阵秩最小化的非刚性鲁棒批量图像对齐方法
US20120133779A1 (en) * 2010-11-29 2012-05-31 Microsoft Corporation Robust recovery of transform invariant low-rank textures
CN103324923A (zh) * 2013-07-11 2013-09-25 上海理工大学 基于稀疏表示的手写字符识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
M. ZIBULEVSKY ET AL.: "L1-L2 optimization in signal and image processing", 《IEEE SIGNAL PROCESSING MAGAZINE》 *
MICHAEL ELAD ET AL.: "Coordinate and subspace optimization methods for linear least squares with non-quadratic regularization", 《APPLIED AND COMPUTATIONAL HARMONIC ANALYSIS》 *
吴飞: "一种具有在线参数调整功能的Kalman滤波及其应用", 《计算机工程与科学》 *
吴飞: "鲁棒卡尔曼算法及其应用研究", 《中国优秀硕士学位论文全文数据库,信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484557A (zh) * 2014-12-02 2015-04-01 宁波大学 一种基于稀疏自回归模型建模的多频信号去噪方法
CN104484557B (zh) * 2014-12-02 2017-05-03 宁波大学 一种基于稀疏自回归模型建模的多频信号去噪方法
CN106340304A (zh) * 2016-09-23 2017-01-18 桂林航天工业学院 一种适用于非平稳噪声环境下的在线语音增强方法
CN106340304B (zh) * 2016-09-23 2019-09-06 桂林航天工业学院 一种适用于非平稳噪声环境下的在线语音增强方法
CN107392861A (zh) * 2017-06-29 2017-11-24 南京航空航天大学 一种基于高斯比例混合模型的稀疏表示sar图像降斑方法
CN107392861B (zh) * 2017-06-29 2020-05-29 南京航空航天大学 一种基于高斯比例混合模型的稀疏表示sar图像降斑方法
CN114584433A (zh) * 2022-02-24 2022-06-03 哈尔滨工程大学 一种脉冲噪声环境下多途信道中的同步信号检测方法
CN114584433B (zh) * 2022-02-24 2024-05-28 哈尔滨工程大学 一种脉冲噪声环境下多途信道中的同步信号检测方法

Similar Documents

Publication Publication Date Title
KR101975057B1 (ko) 잡음 환경에서의 음성 인식을 위한 특징 보상 장치 및 방법
CN101876546B (zh) 基于小波阈值去噪和far模型的mems陀螺数据处理方法
CN103000174B (zh) 语音识别系统中基于快速噪声估计的特征补偿方法
CN111261183B (zh) 一种语音去噪的方法及装置
CN104685562B (zh) 用于从嘈杂输入信号中重构目标信号的方法和设备
CN101154384B (zh) 声音信号纠正方法、声音信号纠正设备以及计算机程序
CN103559888A (zh) 基于非负低秩和稀疏矩阵分解原理的语音增强方法
US9754608B2 (en) Noise estimation apparatus, noise estimation method, noise estimation program, and recording medium
Jiang et al. Geometric methods for spectral analysis
CN103310798A (zh) 降噪方法和装置
CN103903630A (zh) 一种用于消除稀疏噪声方法及装置
CN111429932A (zh) 语音降噪方法、装置、设备及介质
CN102426837B (zh) 农业现场数据采集的移动设备语音识别的鲁棒性方法
JP2010078650A (ja) 音声認識装置及びその方法
CN106373559A (zh) 一种基于对数谱信噪比加权的鲁棒特征提取方法
US11393443B2 (en) Apparatuses and methods for creating noise environment noisy data and eliminating noise
JP5344251B2 (ja) 雑音除去システム、雑音除去方法および雑音除去プログラム
Tran et al. Nonparametric uncertainty estimation and propagation for noise robust ASR
CN112086100A (zh) 基于量化误差熵的多层随机神经网络的城市噪音识别方法
CN115223583A (zh) 一种语音增强方法、装置、设备及介质
CN107919136B (zh) 一种基于高斯混合模型的数字语音采样频率估计方法
CN106340304A (zh) 一种适用于非平稳噪声环境下的在线语音增强方法
JP5689844B2 (ja) スペクトル推定装置、その方法及びプログラム
Stouten et al. Joint removal of additive and convolutional noise with model-based feature enhancement
Windmann et al. Approaches to iterative speech feature enhancement and recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140702