CN103745729A - 一种音频去噪方法和系统 - Google Patents

一种音频去噪方法和系统 Download PDF

Info

Publication number
CN103745729A
CN103745729A CN201310689437.6A CN201310689437A CN103745729A CN 103745729 A CN103745729 A CN 103745729A CN 201310689437 A CN201310689437 A CN 201310689437A CN 103745729 A CN103745729 A CN 103745729A
Authority
CN
China
Prior art keywords
frame
audio frequency
valid data
module
denoising
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310689437.6A
Other languages
English (en)
Other versions
CN103745729B (zh
Inventor
洪婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen mengwang video Co., Ltd
Original Assignee
BAC INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BAC INFORMATION TECHNOLOGY Co Ltd filed Critical BAC INFORMATION TECHNOLOGY Co Ltd
Priority to CN201310689437.6A priority Critical patent/CN103745729B/zh
Publication of CN103745729A publication Critical patent/CN103745729A/zh
Application granted granted Critical
Publication of CN103745729B publication Critical patent/CN103745729B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Receiver Circuits (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开一种音频去噪方法和系统。所述方法将音频有效数据检测与音频去噪相结合。一方面,通过Mel频率参数音频有效数据检测法,获取噪声谱估计的初始值、估计信噪比、并去除非音频有效数据段的噪声;另一方面,通过估计的信噪比及噪声瞬间变化趋势,确定当前瞬间谱减方程,去除音频有效数据段的噪声,从而达到在提升去噪后的性信噪比及减少“音乐噪声”方面的优化实现。

Description

一种音频去噪方法和系统
技术领域
本发明涉及音频编解码领域,尤其涉及一种音频去噪方法和系统。
背景技术
作为音频编解码的原始音频信息,其在许多场合下采集中都会不可避免地混入噪声,这常常使解码端的音频质量受到严重损伤。所以,通常需要音频去噪方法来提升音频听觉质量。目前,常用的音频音频去噪方法有谱减法、维纳滤波法、听觉掩蔽法等。其中,维纳滤波法、听觉掩蔽法等算法计算量较大,制约了其在音频编解码音频去噪环节的应用。而谱减法计算量小,便于快速处理,去噪后的性信噪也比较高,所以被广泛采用。但谱减法会产生“音乐噪声”的问题。
发明内容
本发明实施例的目的在于提出一种音频去噪方法,旨在解决现有技术音频音频去噪方法中的谱减法会产生“音乐噪声”的问题。
本发明实施例是这样实现的,一种音频去噪方法,其特征在于,所述方法包括以下步骤,
计算音频数据中所有帧的Mel频域参数;
计算所有频域帧的幅值及相角;
设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧;
进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧;
计算信噪比参数;
进行音频去噪处理获取所述去噪帧幅值的修正值;
利用所述幅值的修正值及所述相角进行快速傅里叶反变换。
进一步地,步骤“计算音频数据中所有帧的Mel频域参数”之前还包括步骤:
对音频数据进行预处理;
步骤“利用所述幅值的修正值及所述相角进行快速傅里叶反变换”之后还包括步骤:
对所述音频数据进行逆预处理。
本发明实施例的另一目的在于提出一种音频去噪系统,,所述系统包括Mel频域参数计算模块、幅值及相角计算模块、第一设置模块、音频有效数据检测装置、信噪比参数计算模块、音频去噪处理模块、快速傅里叶反变换模块,
Mel频域参数计算模块,用于计算所有帧的Mel频域参数;
幅值及相角计算模块,用于计算所有频域帧的幅值及相角;
第一设置模块,用于设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧;
音频有效数据检测装置,用于进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧;
信噪比参数计算模块,用于计算信噪比参数;
音频去噪处理模块,用于进行音频去噪处理获取所述去噪帧幅值的修正值;
快速傅里叶反变换模块,用于利用幅值的修正值及相角进行快速傅里叶反变换。
进一步地,所述系统还包括音频数据预处理模块、逆预处理模块,
音频数据预处理模块,用于对音频数据进行预处理;
逆预处理模块,用于对音频数据进行逆预处理。
本发明的有益效果
本发明提出一种音频去噪方法和系统。所述方法将音频有效数据检测与音频去噪相结合。一方面,通过Mel频率参数音频有效数据检测法,获取噪声谱估计的初始值、估计信噪比、并去除非音频有效数据段的噪声;另一方面,通过估计的信噪比及噪声瞬间变化趋势,确定当前瞬间谱减方程,去除音频有效数据段的噪声,从而达到在提升去噪后的性信噪比及减少“音乐噪声”方面的优化实现。
附图说明
图1是本发明优选实施例的一种音频去噪方法流程图;
图2是图1中步骤S14所包含的方法流程图;
图3是图2中步骤S144所包含的方法流程图;
图4是图3中步骤S1442所包含的方法流程图;
图5是图1中步骤S16所包含的方法流程图;
图6是本发明优选实施例的一种音频去噪系统结构图;
图7是图6中Mel频域参数计算模块的结构图;
图8是图6中音频有效数据检测装置的结构图;
图9是图8中音频有效数据段检测模块的结构图;
图10是图9中连续帧数统计模块的结构图;
图11是图6中音频去噪处理模块的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明,为了便于说明,仅示出了与本发明实施例相关的部分。应当理解,此处所描写的具体实施例,仅仅用于解释本发明,并不用以限制本发明。
本发明实施例提出一种音频去噪方法和系统。所述方法将音频有效数据检测与音频去噪相结合。一方面,通过Mel频率参数音频有效数据检测法,获取噪声谱估计的初始值、估计信噪比、并去除非音频有效数据段的噪声;另一方面,通过估计的信噪比及噪声瞬间变化趋势,确定当前瞬间谱减方程,去除音频有效数据段的噪声,从而达到在提升去噪后的性信噪比及减少“音乐噪声”方面的优化实现。
实施例1
图1是本发明优选实施例的一种音频去噪方法流程图;所述方法包括以下步骤:
S10:对音频数据进行预处理;
即依次进行常规的预加重滤波、分帧、加窗处理,其中,预加重滤波器及窗口函数可选业内通用的任何一种方法。
S11:计算音频数据中所有帧的Mel频域参数。
第t帧音频xt(n)的Mel频域参数MFCCt的计算方法包括以下步骤:
S111:进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k);其中,1≤n≤N,N为帧长;1≤k≤N。其中,xt(n)表示第t帧音频的第n个分量;Xt(k)表示第t帧音频对应频域帧的第k个分量;
快速傅里叶变换的方法为本领域的公知常识,在此不再赘述。
S112:将频域帧Xt(k)用一组三角滤波器进行滤波。
其中,该组滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下:
H m ( k ) = 0 , k ≤ f m - 1 k - f m - 1 f m - f m - 1 , f m - 1 ≤ k ≤ f m f m + 1 - k f m + 1 - f m , f m ≤ k ≤ f m + 1 0 , k ≥ f m + 1 ,
其中,Hm(k)为第m个三角滤波器的频率响应;
fm为第m个滤波器的中心频率;
Mel(fm)为fm对应的Mel频率,
Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数。
S113:求出每个滤波器的输出对数能量;
Y t ( m ) = ln ( Σ k = 1 N | X t ( k ) | 2 H m ( k ) ) ,
其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量。
S114:获取Mel频域参数
Figure BDA0000438877730000043
S12:计算所有频域帧的幅值及相角。
幅值及相角的计算方法为本领域的公知常识,在此不再赘述。
S13:设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧。
所有的数据即音频数据;声音信息中一般存在长时间静音段,而人在讲话的时候,也会出现字、词、句之间的停顿。不包含话音间隔及静音数据的为音频有效数据。
其中,T≥10。
S14:进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧。
所述“进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧”具体包括以下步骤(图2是图1中步骤S14所包含的方法流程图):
S141:计算第一判定阈值。
Figure BDA0000438877730000051
S142:判断下一帧是否存在,若不存在,则结束;否则进入步骤S143;
S143:将下一帧设置为当前音频有效数据待判定帧。
S144:利用Mel频域参数法进行当前音频有效数据段检测。
所述“利用Mel频域参数法进行当前音频有效数据段检测”具体包括以下步骤(图3是图2中步骤S144所包含的方法流程图):
S1441:判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,若是则进入步骤S1442,否则,进入步骤S1445。
S1442:设置临时音频有效数据的起始帧为当前音频有效数据待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数;
其中,所述“统计待判定帧的频域参数大于第一判定阈值的连续帧数”具体包括以下步骤(图4是图3中步骤S1442所包含的方法流程图):
S14421:令连续帧数等于1;
S14422:判定下一帧是否存在,若是则进入S14423;如果不存在,则进入S1443;
S14423:将下一帧设为当前音频有效数据待判定帧;
S14424:判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,如果是则连续帧数加1,然后重新进入S14422,否则进入步骤S14425;
S14425:设置临时音频有效数据的结束帧为当前音频有效数据待判定帧,进入S1443。
S1443:判断是否所述连续帧数大于第二判定阈值,若是则进入步骤S1444,否则,进入步骤S1445。
一般,第二判定阈值大于15。
S1444:确认当前音频有效数据的起始帧即为临时音频有效数据的起始帧的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,然后进入S15;
S1445:判定下一帧是否存在,若存在,则令下一帧为当前音频有效数据待判定帧,然后重新进入步骤S1441;否则进入步骤S1446;
S1446:确认临时音频有效数据的起始帧到当前音频有效数据待判定帧均为非音频有效数据,然后进入S16。
S15:计算信噪比参数。
snrp=const1-log(ex/en),
其中,ex=sum((xt(n)-en)2|xt(n)已进行过判断且为有效音频并且1≤n≤N),
Figure BDA0000438877730000061
snrp为信噪比参数,ex、en为中间变量;其中sum(变量|条件)表示对满足条件的变量求和;const1为第一常量,一般const1≥4,log为以10为底的对数计算。S16:进行音频去噪处理获取所述去噪帧幅值的修正值;
具体包括以下步骤(图5是图1中步骤S16所包含的方法流程图):
S161:如果当前去噪帧为非音频有效数据,则进入S162;否则进入S163。
S162:令当前去噪帧一直到当前音频有效数据的起始帧的前一帧中每一帧的音频数据幅值的修正值Zt m为0(即令当前去噪帧一直到当前音频有效数据的起始帧的前一帧中每一帧的Zt m=0),然后,设置当前去噪帧为当前音频有效数据的起始帧,再进入S163。
S163:计算当前去噪帧幅值的修正值。
Figure BDA0000438877730000062
其中,nop1、nop2、nop3分别为第一噪声参数、第二噪声参数、第三噪声参数;Zt为当前去噪帧的幅值;Zt m为当前去噪帧的幅值的修正值;
Figure BDA0000438877730000063
为当前去噪帧的前i帧的噪声参数;
nop2=k1+k2*(noiset-2+noiset-3)/noiset-1
nop3=k1*noiset-1+k2*(noiset-2+noiset-3);
const2为第二常量,一般const2<0.08;k1、k2为调节因子,一般0<k2<k1<1;
Figure BDA0000438877730000064
条件1:集合1与集合2的方差小于等于第三判定阈值并且为第一段音频去噪处理;
条件2:集合1与集合2的方差大于第三判定阈值并且为第一段音频去噪处理;
其中,集合1为前T帧音频中,相邻两帧的相关系数;集合2为T+1、T+2、...、当前音频有效数据起始帧的前一帧音频中,相邻两帧的相关系数。
S164:判断是否当前去噪帧为当前音频有效数据的结束帧,若是则进入步骤S165;否则设置当前去噪帧的下一帧为当前去噪帧,然后进入步骤S163。
S165:设置当前音频有效数据待判定帧为当前音频有效数据的结束帧,然后进入S14;
S17:利用幅值的修正值及所述相角进行快速傅里叶反变换。
S18:对所述音频数据进行逆预处理;
即依次进行去窗操作(对应预处理的加窗操作)、合并帧(对应预处理的分帧操作)、去加重操作(对应预处理的预加重操作)。
实施例2
图6是本发明优选实施例的一种音频去噪系统结构图;所述系统包括Mel频域参数计算模块、幅值及相角计算模块、第一设置模块、音频有效数据检测装置、信噪比参数计算模块、音频去噪处理模块、快速傅里叶反变换模块,
Mel频域参数计算模块,用于计算所有帧的Mel频域参数;
幅值及相角计算模块,用于计算所有频域帧的幅值及相角;
第一设置模块,用于设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧;
音频有效数据检测装置,用于进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧;
信噪比参数计算模块,用于计算信噪比参数;
snrp=const1-log(ex/en),
其中,ex=sum((xt(n)-en)2|xt(n)已进行过判断且为有效音频并且1≤n≤N),
Figure BDA0000438877730000071
snrp为信噪比参数,ex、en为中间变量;其中sum(变量|条件)表示对满足条件的变量求和;const1为第一常量,一般const1≥4,log为以10为底的对数计算。
音频去噪处理模块,用于进行音频去噪处理获取所述去噪帧幅值的修正值;
快速傅里叶反变换模块,用于利用幅值的修正值及相角进行快速傅里叶反变换;
进一步地,所述系统还包括音频数据预处理模块、逆预处理模块,
音频数据预处理模块,用于对音频数据进行预处理;
逆预处理模块,用于对音频数据进行逆预处理;
进一步地,(图7是图6中Mel频域参数计算模块的结构图)所述Mel频域参数计算模块还包括频域帧获取模块、滤波模块、对数能量计算模块、频域参数获取模块,
频域帧获取模块,用于进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k);其中,1≤n≤N,N为帧长;1≤k≤N。
滤波模块,用于将频域帧Xt(k)用一组三角滤波器进行滤波。
其中,该组三角滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下:
H m ( k ) = 0 , k &le; f m - 1 k - f m - 1 f m - f m - 1 , f m - 1 &le; k &le; f m f m + 1 - k f m + 1 - f m , f m &le; k &le; f m + 1 0 , k &GreaterEqual; f m + 1 ,
其中,Hm(k)为第m个三角滤波器的频率响应;
fm为第m个滤波器的中心频率;
Mel(fm)为fm对应的Mel频率,
Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数。
对数能量计算模块,用于求出每个滤波器的输出对数能量;
Y t ( m ) = ln ( &Sigma; k = 1 N | X t ( k ) | 2 H m ( k ) ) ,
其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量。
频域参数获取模块,用于获取Mel频域参数
Figure BDA0000438877730000083
进一步地,(图8是图6中音频有效数据检测装置的结构图)所述音频有效数据检测装置还包括第一判定阈值计算模块、第一帧判断处理模块、音频有效数据段检测模块,
第一判定阈值计算模块,用于计算第一判定阈值;
Figure BDA0000438877730000091
第一帧判断处理模块,用于判断下一帧是否存在,若是则将下一帧设置为当前音频有效数据待判定帧,若否则结束;
音频有效数据段检测模块,用于利用Mel频域参数法进行当前音频有效数据段检测;
进一步地,(图9是图8中音频有效数据段检测模块的结构图)所述音频有效数据段检测模块还包括第一阈值判断处理模块、连续帧数统计模块、第二阈值判断处理模块、第二帧判断处理模块、第二设置模块,
第一阈值判断处理模块,用于判断当前音频有效数据待判定帧的频域参数是否大于第一判定阈值,若是则进入连续帧数统计模块,否则进入第二帧判断处理模块;
连续帧数统计模块,用于设置临时音频有效数据的起始帧为当前音频有效数据待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数;
第二阈值判断处理模块,用于判断是否所述连续帧数大于第二判定阈值,若是则确认当前音频有效数据的起始帧即为临时音频有效数据的起始帧的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,进入信噪比参数计算模块,否则进入第二帧判断处理模块;
第二帧判断处理模块,用于判断下一帧是否存在,若是则进入第二设置模块,否则确认临时音频有效数据的起始帧到当前音频有效数据待判定帧均为非音频有效数据,进入音频去噪处理模块,;
第二设置模块,用于将下一帧设置为当前音频有效数据待判定帧,然后进入第一阈值判断处理模块;
进一步地,(图10是图9中连续帧数统计模块的结构图)所述连续帧数统计模块还包括第三设置模块、第三帧判断处理模块、第三阈值判断处理模块,
第三设置模块,用于令所述连续帧数等于1;
第三帧判断处理模块,用于判定下一帧是否存在,若是则将下一帧设为当前音频有效数据待判定帧,进入第三阈值判断处理模块,若否则进入第二阈值判断处理模块;
第三阈值判断处理模块,用于判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,若是则所述连续帧数加1,返回第三帧判断处理模块,若否则设置临时音频有效数据的结束帧为当前音频有效数据待判定帧,然后进入第二阈值判断处理模块;
进一步地,(图11是图6中音频去噪处理模块的结构图)所述音频去噪处理模块还包括音频有效数据判断处理模块、第四设置模块、幅值的修正值计算模块、第四帧判断处理模块,
音频有效数据判断处理模块,用于判断是否当前去噪帧为非音频有效数据,若是则进入第四设置模块,若否则进入幅值的修正值计算模块;
第四设置模块,用于令当前去噪帧一直到当前音频有效数据的起始帧的前一帧中每一帧的音频数据幅值的修正值Zt m为0,然后,设置当前去噪帧为当前音频有效数据的起始帧;
幅值的修正值计算模块,用于计算当前去噪帧幅值的修正值;
Figure BDA0000438877730000101
其中,nop1、nop2、nop3分别为第一噪声参数、第二噪声参数、第三噪声参数;Zt为当前去噪帧的幅值;Zt m为当前去噪帧的幅值的修正值;
Figure BDA0000438877730000102
为当前去噪帧的前i帧的噪声参数;
nop2=k1+k2*(noiset-2+noiset-3)/noiset-1
nop3=k1*noiset-1+k2*(noiset-2+noiset-3);
const2为第二常量,一般const2<0.08;k1、k2为调节因子,一般0<k2<k1<1;
Figure BDA0000438877730000111
条件1:集合1与集合2的方差小于等于第三判定阈值并且为第一段音频去噪处理;
条件2:集合1与集合2的方差大于第三判定阈值并且为第一段音频去噪处理;
其中,集合1为前T帧音频中,相邻两帧的相关系数;集合2为T+1、T+2、...、当前音频有效数据起始帧的前一帧音频中,相邻两帧的相关系数。
第四帧判断处理模块,用于判断是否当前去噪帧为当前音频有效数据的结束帧,若是则设置当前音频有效数据待判定帧为当前音频有效数据的结束帧,然后进入音频有效数据检测装置,若否则设置当前去噪帧的下一帧为当前去噪帧,然后进入幅值的修正值计算模块。
本领域的普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序指令相关硬件来完成的,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质可以为ROM、RAM、磁盘、光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (21)

1.一种音频去噪方法,其特征在于,所述方法包括以下步骤, 
计算音频数据中所有帧的Mel频域参数; 
计算所有频域帧的幅值及相角; 
设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧; 
进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧; 
计算信噪比参数; 
进行音频去噪处理获取所述去噪帧幅值的修正值; 
利用所述幅值的修正值及所述相角进行快速傅里叶反变换。 
2.如权利要求1所述的音频去噪方法,其特征在于,步骤“计算音频数据中所有帧的Mel频域参数”之前还包括步骤: 
对音频数据进行预处理; 
步骤“利用所述幅值的修正值及所述相角进行快速傅里叶反变换”之后还包括步骤: 
对所述音频数据进行逆预处理。 
3.如权利要求2所述的音频去噪方法,其特征在于,所述“对音频数据进行预处理”为依次进行常规的预加重滤波、分帧、加窗处理; 
所述“对所述音频数据进行逆预处理”为依次进行去窗操作、合并帧、去加重操作。 
4.如权利要求1所述的音频去噪方法,其特征在于,所述“计算音频数据中所有帧的Mel频域参数”包括以下步骤, 
进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k); 
将频域帧Xt(k)用一组三角滤波器进行滤波; 
求出每个滤波器的输出对数能量; 
获取Mel频域参数MFCCt; 
其中,1≤n≤N,N为帧长,1≤k≤N;xt(n)表示第t帧音频的第n个分量;Xt(k)表示第t帧音频对应频域帧的第k个分量。 
5.如权利要求4所述的音频去噪方法,其特征在于,所述一组三角滤波器组滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下: 
Figure FDA0000438877720000021
其中,Hm(k)为第m个三角滤波器的频率响应; 
fm为第m个滤波器的中心频率; 
Mel(fm)为fm对应的Mel频率; 
Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数; 
所述”求出每个滤波器的输出对数能量”具体为: 
Figure FDA0000438877720000022
其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量; 
所述Mel频域参数
6.如权利要求1所述的音频去噪方法,其特征在于,所述“进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧”具体包括以下步骤: 
S141:计算第一判定阈值; 
Figure FDA0000438877720000024
S142:判断下一帧是否存在,若不存在,则结束;否则进入步骤S143; 
S143:将下一帧设置为当前音频有效数据待判定帧; 
S144:利用Mel频域参数法进行当前音频有效数据段检测。 
7.如权利要求6所述的音频去噪方法,其特征在于,所述“S144:利用Mel频域参数法进行当前音频有效数据段检测”具体包括以下步骤: 
S1441:判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,若是则进入步骤S1442,否则,进入步骤S1445。 
S1442:设置临时音频有效数据的起始帧为当前音频有效数据待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数; 
S1443:判断是否所述连续帧数大于第二判定阈值,若是则进入步骤S1444,否则,进入步骤S1445。 
S1444:确认当前音频有效数据的起始帧即为临时音频有效数据的起始帧 的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,然后进入步骤“计算信噪比参数”; 
S1445:判定下一帧是否存在,若存在,则令下一帧为当前音频有效数据待判定帧,然后重新进入步骤S1441;否则进入步骤S1446; 
S1446:确认临时音频有效数据的起始帧到当前音频有效数据待判定帧均为非音频有效数据,然后进入步骤“进行音频去噪处理获取所述去噪帧幅值的修正值”。 
8.如权利要求7所述的音频去噪方法,其特征在于,步骤S1442中,所述“统计待判定帧的频域参数大于第一判定阈值的连续帧数”具体包括以下步骤: 
S14421:令连续帧数等于1; 
S14422:判定下一帧是否存在,若是则进入S14423;如果不存在,则进入步骤S1443; 
S14423:将下一帧设为当前音频有效数据待判定帧; 
S14424:判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,如果是则连续帧数加1,然后重新进入S14422;否则进入步骤S14425; 
S14425:设置临时音频有效数据的结束帧为当前音频有效数据待判定帧,进入步骤S1443。 
9.如权利要求1所述的音频去噪方法,其特征在于,所述“计算信噪比参数”具体为: 
snrp=const1-log(ex/en), 
其中,ex=sum((xt(n)-en)2|xt(n)已进行过判断且为有效音频并且1≤n≤N), 
Figure FDA0000438877720000031
snrp为信噪比参数,ex、en为中间变量;其中sum(变量|条件)表示对满足条件的变量求和;const1为第一常量,const1≥4,log为以10为底的对数计算。 
10.如权利要求1所述的音频去噪方法,其特征在于,所述“进行音频去噪处理获取所述去噪帧幅值的修正值”具体包括以下步骤: 
S161:如果当前去噪帧为非音频有效数据,则进入S162;否则进入S163。 
S162:令当前去噪帧一直到当前音频有效数据的起始帧的前一帧中每一帧的音频数据幅值的修正值Zt m为0,然后,设置当前去噪帧为当前音频有效数据的起始帧,再进入S163。 
S163:计算当前去噪帧幅值的修正值。 
S164:判断是否当前去噪帧为当前音频有效数据的结束帧,若是则进入步骤S165;否则设置当前去噪帧的下一帧为当前去噪帧,然后进入步骤S163。 
S165:设置当前音频有效数据待判定帧为当前音频有效数据的结束帧,然后进入步骤“进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧”。 
11.如权利要求10所述的音频去噪方法,其特征在于,所述“计算当前去噪帧幅值的修正值”具体为: 
Figure FDA0000438877720000041
其中,nop1、nop2、nop3分别为第一噪声参数、第二噪声参数、第三噪声参数;Zt为当前去噪帧的幅值;Zt m为当前去噪帧的幅值的修正值; 
Figure FDA0000438877720000043
为当前去噪帧的前i帧的噪声参数; 
nop2=k1+k2*(noiset-2+noiset-3)/noiset-1; 
nop3=k1*noiset-1+k2*(noiset-2+noiset-3); 
const2为第二常量,const2<0.08;k1、k2为调节因子,0<k2<k1<1; 
条件1:集合1与集合2的方差小于等于第三判定阈值并且为第一段音频去噪处理; 
条件2:集合1与集合2的方差大于第三判定阈值并且为第一段音频去噪处理; 
其中,集合1为前T帧音频中,相邻两帧的相关系数;集合2为T+1、T+2、...、当前音频有效数据起始帧的前一帧音频中,相邻两帧的相关系数。 
12.一种音频去噪系统,其特征在于,所述系统包括Mel频域参数计算模块、幅值及相角计算模块、第一设置模块、音频有效数据检测装置、信噪比参数计算模块、音频去噪处理模块、快速傅里叶反变换模块, 
Mel频域参数计算模块,用于计算所有帧的Mel频域参数; 
幅值及相角计算模块,用于计算所有频域帧的幅值及相角; 
第一设置模块,用于设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧; 
音频有效数据检测装置,用于进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧; 
信噪比参数计算模块,用于计算信噪比参数; 
音频去噪处理模块,用于进行音频去噪处理获取所述去噪帧幅值的修正值; 
快速傅里叶反变换模块,用于利用幅值的修正值及相角进行快速傅里叶反变换。 
13.如权利要求12所述音频去噪系统,其特征在于,所述系统还包括音频数据预处理模块、逆预处理模块, 
音频数据预处理模块,用于对音频数据进行预处理; 
逆预处理模块,用于对音频数据进行逆预处理。 
14.如权利要求12所述音频去噪系统,其特征在于,所述Mel频域参数计算模块还包括频域帧获取模块、滤波模块、对数能量计算模块、频域参数获取模块, 
频域帧获取模块,用于进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k),其中,1≤n≤N,N为帧长;1≤k≤N; 
滤波模块,用于将频域帧Xt(k)用一组三角滤波器进行滤波; 
对数能量计算模块,用于求出每个滤波器的输出对数能量; 
频域参数获取模块,用于获取Mel频域参数。 
15.如权利要求14所述音频去噪系统,其特征在于,所述三角滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下: 
Figure FDA0000438877720000051
其中,Hm(k)为第m个三角滤波器的频率响应; 
fm为第m个滤波器的中心频率; 
Mel(fm)为fm对应的Mel频率, 
Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数; 
所述“求出每个滤波器的输出对数能量”具体为, 
Figure FDA0000438877720000061
其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量; 
所述Mel频域参数
Figure FDA0000438877720000062
16.如权利要求12所述音频去噪系统,其特征在于,信噪比参数计算模块中,所述“计算信噪比参数”具体为: 
snrp=const1-log(ex/en), 
其中,ex=sum((xt(n)-en)2|xt(n)已进行过判断且为有效音频并且1≤n≤N), 
Figure FDA0000438877720000063
snrp为信噪比参数,ex、en为中间变量;其中sum(变量|条件)表示对满足条件的变量求和;const1为第一常量,const1≥4,log为以10为底的对数计算。 
17.如权利要求12所述音频去噪系统,其特征在于,所述音频有效数据检测装置还包括第一判定阈值计算模块、第一帧判断处理模块、音频有效数据段检测模块, 
第一判定阈值计算模块,用于计算第一判定阈值; 
第一帧判断处理模块,用于判断下一帧是否存在,若是则将下一帧设置为当前音频有效数据待判定帧,若否则结束; 
音频有效数据段检测模块,用于利用Mel频域参数法进行当前音频有效数据段检测。 
18.如权利要求17所述音频去噪系统,其特征在于,所述音频有效数据段检测模块还包括第一阈值判断处理模块、连续帧数统计模块、第二阈值判断处理模块、第二帧判断处理模块、第二设置模块, 
第一阈值判断处理模块,用于判断当前音频有效数据待判定帧的频域参数是否大于第一判定阈值,若是则进入连续帧数统计模块,否则进入第二帧判断处理模块; 
连续帧数统计模块,用于设置临时音频有效数据的起始帧为当前音频有效数据待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧 数; 
第二阈值判断处理模块,用于判断是否所述连续帧数大于第二判定阈值,若是则确认当前音频有效数据的起始帧即为临时音频有效数据的起始帧的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,进入信噪比参数计算模块,否则进入第二帧判断处理模块; 
第二帧判断处理模块,用于判断下一帧是否存在,若是则进入第二设置模块,否则确认临时音频有效数据的起始帧到当前音频有效数据待判定帧均为非音频有效数据,进入音频去噪处理模块; 
第二设置模块,用于将下一帧设置为当前音频有效数据待判定帧,然后进入第一阈值判断处理模块。 
19.如权利要求18所述音频去噪系统,其特征在于,所述连续帧数统计模块还包括第三设置模块、第三帧判断处理模块、第三阈值判断处理模块, 
第三设置模块,用于令所述连续帧数等于1; 
第三帧判断处理模块,用于判定下一帧是否存在,若是则将下一帧设为当前音频有效数据待判定帧,进入第三阈值判断处理模块,若否则进入第二阈值判断处理模块; 
第三阈值判断处理模块,用于判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,若是则所述连续帧数加1,返回第三帧判断处理模块,若否则设置临时音频有效数据的结束帧为当前音频有效数据待判定帧,然后进入第二阈值判断处理模块。 
20.如权利要求12所述音频去噪系统,其特征在于,所述音频去噪处理模块还包括音频有效数据判断处理模块、第四设置模块、幅值的修正值计算模块、第四帧判断处理模块, 
音频有效数据判断处理模块,用于判断是否当前去噪帧为非音频有效数据,若是则进入第四设置模块,若否则进入幅值的修正值计算模块; 
第四设置模块,用于令当前去噪帧一直到当前音频有效数据的起始帧的前一帧中每一帧的音频数据幅值的修正值Zt m为0,然后,设置当前去噪帧为当前音频有效数据的起始帧; 
幅值的修正值计算模块,用于计算当前去噪帧幅值的修正值; 
第四帧判断处理模块,用于判断是否当前去噪帧为当前音频有效数据的结束帧,若是则设置当前音频有效数据待判定帧为当前音频有效数据的结束帧,然后进入音频有效数据检测装置,若否则设置当前去噪帧的下一帧为当 前去噪帧,然后进入幅值的修正值计算模块。 
21.如权利要求20所述音频去噪系统,其特征在于,幅值的修正值计算模块中,所述“计算当前去噪帧幅值的修正值”具体为: 
Figure FDA0000438877720000081
其中,nop1、nop2、nop3分别为第一噪声参数、第二噪声参数、第三噪声参数;Zt为当前去噪帧的幅值;Zt m为当前去噪帧的幅值的修正值; 
Figure FDA0000438877720000082
为当前去噪帧的前i帧的噪声参数; 
nop2=k1+k2*(noiset-2+noiset-3)/noiset-1; 
nop3=k1*noiset-1+k2*(noiset-2+noiset-3); 
const2为第二常量,const2<0.08;k1、k2为调节因子,0<k2<k1<1; 
Figure FDA0000438877720000083
条件1:集合1与集合2的方差小于等于第三判定阈值并且为第一段音频去噪处理; 
条件2:集合1与集合2的方差大于第三判定阈值并且为第一段音频去噪处理; 
其中,集合1为前T帧音频中,相邻两帧的相关系数;集合2为T+1、T+2、...、当前音频有效数据起始帧的前一帧音频中,相邻两帧的相关系数。 
CN201310689437.6A 2013-12-16 2013-12-16 一种音频去噪方法和系统 Active CN103745729B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310689437.6A CN103745729B (zh) 2013-12-16 2013-12-16 一种音频去噪方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310689437.6A CN103745729B (zh) 2013-12-16 2013-12-16 一种音频去噪方法和系统

Publications (2)

Publication Number Publication Date
CN103745729A true CN103745729A (zh) 2014-04-23
CN103745729B CN103745729B (zh) 2017-01-04

Family

ID=50502742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310689437.6A Active CN103745729B (zh) 2013-12-16 2013-12-16 一种音频去噪方法和系统

Country Status (1)

Country Link
CN (1) CN103745729B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018129854A1 (zh) * 2017-01-11 2018-07-19 中兴通讯股份有限公司 一种语音处理方法及装置
CN108986830A (zh) * 2018-08-28 2018-12-11 安徽淘云科技有限公司 一种音频语料筛选方法及装置
CN109257128A (zh) * 2018-11-01 2019-01-22 南京邮电大学 一种基于傅里叶级数拟合去噪的频谱信号识别方法及系统
US10224053B2 (en) 2017-03-24 2019-03-05 Hyundai Motor Company Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering
CN109461443A (zh) * 2018-09-28 2019-03-12 广州智伴人工智能科技有限公司 一种无按键开机装置
CN110415718A (zh) * 2019-09-05 2019-11-05 腾讯科技(深圳)有限公司 信号生成的方法、基于人工智能的语音识别方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020116177A1 (en) * 2000-07-13 2002-08-22 Linkai Bu Robust perceptual speech processing system and method
US20020198706A1 (en) * 2001-05-07 2002-12-26 Yu-Hung Kao Implementing a high accuracy continuous speech recognizer on a fixed-point processor
CN101404160A (zh) * 2008-11-21 2009-04-08 北京科技大学 一种基于音频识别的语音降噪方法
CN102117618A (zh) * 2009-12-30 2011-07-06 华为技术有限公司 一种消除音乐噪声的方法、装置及系统
CN102314883A (zh) * 2010-06-30 2012-01-11 比亚迪股份有限公司 一种判断音乐噪声的方法以及语音消噪方法
US20130054234A1 (en) * 2011-08-30 2013-02-28 Gwangju Institute Of Science And Technology Apparatus and method for eliminating noise
CN103021420A (zh) * 2012-12-04 2013-04-03 中国科学院自动化研究所 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法
CN103440872A (zh) * 2013-08-15 2013-12-11 大连理工大学 瞬态噪声的去噪方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020116177A1 (en) * 2000-07-13 2002-08-22 Linkai Bu Robust perceptual speech processing system and method
US20020198706A1 (en) * 2001-05-07 2002-12-26 Yu-Hung Kao Implementing a high accuracy continuous speech recognizer on a fixed-point processor
CN101404160A (zh) * 2008-11-21 2009-04-08 北京科技大学 一种基于音频识别的语音降噪方法
CN102117618A (zh) * 2009-12-30 2011-07-06 华为技术有限公司 一种消除音乐噪声的方法、装置及系统
CN102314883A (zh) * 2010-06-30 2012-01-11 比亚迪股份有限公司 一种判断音乐噪声的方法以及语音消噪方法
US20130054234A1 (en) * 2011-08-30 2013-02-28 Gwangju Institute Of Science And Technology Apparatus and method for eliminating noise
CN103021420A (zh) * 2012-12-04 2013-04-03 中国科学院自动化研究所 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法
CN103440872A (zh) * 2013-08-15 2013-12-11 大连理工大学 瞬态噪声的去噪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
舒倩等: ""基于 的语音端点检测方法"", 《通信技术》, vol. 40, no. 191, 10 November 2007 (2007-11-10) *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018129854A1 (zh) * 2017-01-11 2018-07-19 中兴通讯股份有限公司 一种语音处理方法及装置
US10224053B2 (en) 2017-03-24 2019-03-05 Hyundai Motor Company Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering
CN108986830A (zh) * 2018-08-28 2018-12-11 安徽淘云科技有限公司 一种音频语料筛选方法及装置
CN109461443A (zh) * 2018-09-28 2019-03-12 广州智伴人工智能科技有限公司 一种无按键开机装置
CN109257128A (zh) * 2018-11-01 2019-01-22 南京邮电大学 一种基于傅里叶级数拟合去噪的频谱信号识别方法及系统
CN109257128B (zh) * 2018-11-01 2021-05-11 南京邮电大学 一种基于傅里叶级数拟合去噪的频谱信号识别方法及系统
CN110415718A (zh) * 2019-09-05 2019-11-05 腾讯科技(深圳)有限公司 信号生成的方法、基于人工智能的语音识别方法及装置
CN110415718B (zh) * 2019-09-05 2020-11-03 腾讯科技(深圳)有限公司 信号生成的方法、基于人工智能的语音识别方法及装置

Also Published As

Publication number Publication date
CN103745729B (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
Martin Speech enhancement based on minimum mean-square error estimation and supergaussian priors
Yegnanarayana et al. Enhancement of reverberant speech using LP residual signal
CN103745729A (zh) 一种音频去噪方法和系统
Tan et al. Multi-band summary correlogram-based pitch detection for noisy speech
US20150081287A1 (en) Adaptive noise reduction for high noise environments
US20050177363A1 (en) Apparatus, method, and medium for detecting voiced sound and unvoiced sound
US11756564B2 (en) Deep neural network based speech enhancement
EP3118852B1 (en) Method and device for detecting audio signal
CN103440872A (zh) 瞬态噪声的去噪方法
Ghaemmaghami et al. Noise robust voice activity detection using features extracted from the time-domain autocorrelation function
Radmard et al. A new method of voiced/unvoiced classification based on clustering
CN105679312A (zh) 一种噪声环境下声纹识别的语音特征处理方法
CN111863008A (zh) 一种音频降噪方法、装置及存储介质
Wang et al. Joint noise and mask aware training for DNN-based speech enhancement with sub-band features
Bharath et al. New replay attack detection using iterative adaptive inverse filtering and high frequency band
CN112712816A (zh) 语音处理模型的训练方法和装置以及语音处理方法和装置
Farahani Autocorrelation-based noise subtraction method with smoothing, overestimation, energy, and cepstral mean and variance normalization for noisy speech recognition
US7890319B2 (en) Signal processing apparatus and method thereof
Sanam et al. Enhancement of noisy speech based on a custom thresholding function with a statistically determined threshold
CN103295580A (zh) 一种语音信号噪声抑制方法及装置
Jain et al. Marginal energy density over the low frequency range as a feature for voiced/non-voiced detection in noisy speech signals
Patil et al. Effectiveness of Teager energy operator for epoch detection from speech signals
Wu et al. Noise-robust speech feature processing with empirical mode decomposition
Bahadur et al. Performance measurement of a hybrid speech enhancement technique
Dişken et al. A robust polynomial regression-based voice activity detector for speaker verification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: 518057 Guangdong Province, Shenzhen city Nanshan District District Science Park Keyuan Road branch science park A1 unit 4 Building 403-405 unit

Applicant after: BAC Information Technology Co., Ltd.

Address before: Unit B1 9 building 518057 Guangdong city of Shenzhen province Nanshan District high in the four EVOC Technology Building No. 31

Applicant before: BAC Information Technology Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: 518000 Guangdong city of Shenzhen province Nanshan District Guangdong streets high in the four Longtaili Technology Building Room 325 No. 30

Patentee after: Shenzhen Monternet encyclopedia Information Technology Co. Ltd.

Address before: 518057 Guangdong Province, Shenzhen city Nanshan District District Science Park Keyuan Road branch science park A1 unit 4 Building 403-405 unit

Patentee before: BAC Information Technology Co., Ltd.

CP03 Change of name, title or address
CP01 Change in the name or title of a patent holder

Address after: 518000 Guangdong city of Shenzhen province Nanshan District Guangdong streets high in the four Longtaili Technology Building Room 325 No. 30

Patentee after: Shenzhen mengwang video Co., Ltd

Address before: 518000 Guangdong city of Shenzhen province Nanshan District Guangdong streets high in the four Longtaili Technology Building Room 325 No. 30

Patentee before: SHENZHEN MONTNETS ENCYCLOPEDIA INFORMATION TECHNOLOGY Co.,Ltd.

CP01 Change in the name or title of a patent holder