发明内容
有鉴于此,本发明中一方面提供一种在时域提高语音信号信噪比的方法,另一方面提供一种在时域提高语音信号信噪比的装置,以进一步提高语音信号的信噪比。
本发明所提供的在时域提高语音信号信噪比的方法,包括:
A、在时域上的当前帧信号中搜索语音信号的基音周期;
B、根据所述基音周期,在当前帧信号中搜索最佳基频波峰位置,并计算所述最佳基频波峰位置在所述当前帧信号中延拓出的每个基音周期内对应的基频波峰位置;
C、对所计算的每个基音周期内基频波峰位置所在的设定区域的信号幅度进行增强。
较佳地,所述步骤A包括:
对所述当前帧信号进行归一化自相关计算,找到归一化自相关值最大的N个候选基音周期;
基于全局基音周期和基音倍频,从所述N个候选基音周期中筛选出最佳基音周期作为所述语音信号的基音周期;
其中,N为大于0的整数。
较佳地,步骤B中所述根据基音周期,在当前帧信号中搜索最佳基频波峰位置包括:
从所述当前帧信号的所有样本点中,选取幅度绝对值较大的M个样本点所对应的位置作为候选基频波峰位置;其中,M为大于0的整数;
根据所述语音信号的基音周期,计算每个候选基频波峰位置在所述当前帧信号中延拓出的每个基音周期内的对应位置;
根据每个候选基频波峰位置及其对应位置上的样本幅度值,从所述候选基频波峰位置中选取最佳基频波峰位置。
较佳地,所述根据每个候选基频波峰位置及其对应位置上的样本幅度值,从所述候选基频波峰位置中选取最佳基频波峰位置包括:对应每个候选基频波峰位置,计算其及所有基音周期内对应位置上的样本的平均幅度值;选取最大平均幅度值所对应的候选基频波峰位置作为最佳基频波峰位置;
或者包括:对应每个候选基频波峰位置,判断该候选基频波峰位置及其每个基音周期内对应位置上的样本点的幅度值是否均大于设定的阈值,如果是,则确定该候选基频波峰位置满足基频波峰条件;选取满足基频波峰条件的幅度值最大的样本点所对应的候选基频波峰位置作为最佳基频波峰位置。
较佳地,所述步骤C包括:
在每个基音周期内利用窗函数对基频波峰位置所在的设定区域的信号幅度采用大于1的权值加权。
较佳地,所述步骤C进一步包括:在每个基音周期内利用窗函数对所述基频波峰位置之外的设定区域的信号幅度采用小于1的权值加权;对所述基频波峰位置所在的设定区域和所述基频波峰位置之外的设定区域之间的过渡区域采用平滑的过渡权值加权。
较佳地,步骤A之前,进一步包括:A0、对所述时域上的当前帧信号进行归一化自相关计算,判断最大归一化自相关值是否大于位于0至1之间的设定值,如果是,则执行步骤A。
较佳地,步骤A之前,进一步包括:
第一步、将时域上得到的当前帧信号由时域转换为频域;
第二步、对频域上的当前帧信号进行语音增强处理,将处理后的当前帧信号由频域转换为时域。
较佳地,第二步中所述对频域上的当前帧信号进行语音增强处理为:采用减谱法或维纳滤波法对频域上的当前帧信号进行语音增强处理。
较佳地,所述第二步之后,步骤A之前,进一步包括:
第三步、判断所述语音增强处理中得到的信噪比估计值是否大于设定阈值,如果是,则执行所述步骤A;否则降低所述时域上的当前帧信号幅度。
较佳地,步骤A0之前,进一步包括:
第一步、将得到的当前帧信号由时域转换为频域;
第二步、对频域上的当前帧信号进行语音增强处理,将处理后的当前帧信号由频域转换为时域;
第三步、判断所述语音增强处理中得到的信噪比估计值是否大于设定阈值,如果是,则执行所述步骤A0。
本发明所提供的在时域提高语音信号信噪比的装置,包括:
基音周期搜索模块,用于在时域上的当前帧信号中搜索语音信号的基音周期;
基频波峰标定模块,用于根据所述基音周期,在当前帧信号中搜索最佳基频波峰位置,并计算所述最佳基频波峰位置在所述当前帧信号中延拓出的每个基音周期内对应的基频波峰位置;
波形处理模块,用于对所述基频波峰标定模块所计算的每个基音周期内基频波峰位置所在的设定区域的信号幅度进行增强。
较佳地,所述基音周期搜索模块包括:
候选基音周期确定模块,用于根据对所述当前帧信号进行归一化自相关计算的结果,将自相关计算模块得到的归一化自相关值最大的N个基音周期作为候选基音周期;其中,N为大于0的整数;
基音周期选取模块,用于基于全局基音周期和基音倍频,从所述N个候选基音周期中筛选出最佳基音周期作为所述语音信号的基音周期。
较佳地,所述基频波峰标定模块包括:
候选位置确定模块,用于从所述当前帧信号的所有样本点中,选取幅度绝对值较大的M个样本点所对应的位置作为候选基频波峰位置;其中,M为大于0的整数;
最佳位置确定模块,用于根据所述语音信号的基音周期,计算每个候选基频波峰位置在所述当前帧信号中延拓出的每个基音周期内的对应位置,根据每个候选基频波峰位置及其对应位置上的样本幅度值,从所述候选基频波峰位置中选取最佳基频波峰位置;
所有位置确定模块,用于根据所述基音周期,计算所述最佳基频波峰位置在所述当前帧信号中延拓出的每个基音周期内对应的基频波峰位置。
较佳地,所述最佳位置确定模块包括:
位置延拓模块,用于根据所述基音周期,计算每个候选基频波峰位置在所述当前帧信号中延拓出的每个基音周期内的对应位置;
平均幅度值计算模块,用于对应每个候选基频波峰位置,计算其及所有基音周期内对应位置上的样本的平均幅度值;
最佳位置选取模块,用于选取最大平均幅度值所对应的候选基频波峰位置作为最佳基频波峰位置;
或者,所述最佳位置确定模块包括:
位置延拓模块,用于根据所述基音周期,计算每个候选基频波峰位置在所述当前帧信号中延拓出的每个基音周期内的对应位置;
幅度判决模块,用于对应每个候选基频波峰位置,判断是否该候选基频波峰位置及其每个基音周期内对应位置上的样本点的幅度值均大于设定的阈值,如果是,则确定该候选基频波峰位置满足基频波峰条件;
最佳位置选取模块,用于选取满足基频波峰条件的幅度值最大的样本点所对应的候选基频波峰位置作为最佳基频波峰位置。
较佳地,该装置进一步包括:
第一决策处理模块,用于根据对所述当前帧信号进行归一化自相关计算的结果,判断最大归一化自相关值是否大于位于0至1之间的设定值,如果是,则通知所述基音周期搜索模块执行基音周期搜索。
较佳地,该装置进一步包括:
第一转换模块,用于将时域上得到的当前帧信号由时域转换为频域;
频域增强处理模块,用于对转换到频域上的当前帧信号进行语音增强处理;
第二转换模块,用于将所述频域增强处理模块处理后的当前帧信号由频域转换为时域;
所述基音周期搜索模块用于在所述第二转换模块转换到时域上的当前帧信号中搜索语音信号的基音周期;
所述基频波峰标定模块用于根据所述基音周期,在所述第二转换模块转换到时域上的当前帧信号中搜索最佳基频波峰位置。
较佳地,该装置进一步包括:
第二决策处理模块,用于判断所述频域增强处理模块进行语音增强处理时得到的信噪比估计值是否大于设定阈值,如果是,则通知所述基音周期搜索模块执行基音周期搜索。
较佳地,该装置进一步包括:
第一转换模块,用于将时域上得到的当前帧信号由时域转换为频域;
频域增强处理模块,用于对转换到频域上的当前帧信号进行语音增强处理;
第二转换模块,用于将所述频域增强处理模块处理后的当前帧信号由频域转换为时域;
第二决策处理模块,用于判断所述频域增强处理模块进行语音增强处理时得到的信噪比估计值是否大于设定阈值,如果是,则通知第一决策处理模块进行判断;
所述第一决策处理模块用于根据来自第二决策处理模块的通知,根据对所述当前帧信号进行归一化自相关计算的结果,判断最大归一化自相关值是否大于位于0至1之间的设定值,如果是,则通知所述基音周期搜索模块执行基音周期搜索;所述基音周期搜索模块在所述第二转换模块转换到时域上的当前帧信号中搜索语音信号的基音周期;所述基频波峰标定模块根据所述基音周期,在所述第二转换模块转换到时域上的当前帧信号中搜索最佳基频波峰位置。
从上述方案可以看出,本发明中由于考虑了基音周期的概念,并根据基音周期确定当前帧信号中的最佳基频波峰位置,从而保证了最佳基频波峰位置的准确性;通过利用基音周期,计算所述最佳基频波峰位置在所述当前帧信号中延拓出的每个基音周期内对应的基频波峰位置,从而保证了基频波峰位置的准确性;然后对所计算的每个基音周期内基频波峰位置处的信号幅度进行增强,从而提高了语音信号的信噪比。进一步地,还可以对每个基音周期内的其它位置的信号幅度进行降低,以进一步提高语音信号的信噪比。
另外,本发明中进一步地还可以将频域语音增强技术和时域语音增强技术结合起来使用,从而进一步提高语音信号的信噪比。并且,在将二者结合使用时,还可以利用频域上的计算结果进行时域上的决策及处理,从而提高了处理的有效性。
具体实施方式
本发明实施例中,为了提高基频波峰位置的确定准确性,利用了基音周期的概念,因为在语音信号中,由于发音的特点,会存在基音周期,并且在不同的基音周期中基频波峰的位置大致相同,而噪声和共振峰则不具有这种周期性,因此,根据基音周期确定进行语音加强的基频波峰位置时,可避免将不具有这种周期特性的噪声和共振峰当作基频波峰,从而提高语音信号的信噪比。
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明进一步详细说明。
实施例一:
图1为本发明实施例一中在时域提高语音信号信噪比的方法的示例性流程图。如图1所示,该流程包括如下步骤:
步骤101,在时域上的当前帧信号中搜索语音信号的基音周期。
其中,基音周期的搜索现有技术中有很多种实现方法。现列举其中一种:
对当前帧信号进行归一化自相关计算,找到归一化自相关值较大的N个候选基音周期,在这N个候选基音周期中,通过全局基音周期、基音倍频等条件筛选出最佳基音周期为语音信号的基音周期。
步骤102,根据所述语音信号的基音周期,在当前帧信号中搜索最佳基频波峰位置。
本步骤的具体实现方法可有多种,下面列举其中两种:
从当前帧信号的所有样本点中,选取幅度绝对值较大的M(M为大于0的整数,例如M可为3、4或5)个样本点所对应的位置作为候选基频波峰位置;根据上述基音周期,计算每个候选基频波峰位置在当前帧信号中延拓出的每个基音周期内的对应位置;对应每个候选基频波峰位置,计算其及所有基音周期内对应位置上样本的平均幅度值;选取最大平均幅度值所对应的候选基频波峰位置作为最佳基频波峰位置。
例如,假设一帧信号的长度为L,即可将当前帧信号的L个样本点记为:s(n),n=0,1,...,L-1;则可在这L个样本点中,寻找绝对值最大的M个样本点所对应的位置作为候选基频波峰位置,记为:Pc[i],i=1,2,...,M;其中,这M个候选基频波峰位置可按该位置所对应的信号样本绝对值从大到小的顺序排列,则有:
假设基音周期为Tp,则计算第i个候选基频波峰位置根据基音周期Tp在本帧信号范围内延拓出的所有基音周期内的对应位置为:
Pc[i]+jTp,i=1~M (2)
其中,j为整数,满足0≤Pc[i]+jTp≤L-1。
对应第i个候选基频波峰位置,计算其所有对应位置上样本的平均幅度值Mp_avg[i]为:
其中,D为满足条件0≤Pc[i]+jTp≤L-1的j的个数。
假设最佳基频波峰位置为Pf,则选取最大平均幅度值所对应的候选基频波峰位置作为最佳基频波峰位置为:
通过这种方式来寻找最佳基频波峰位置,而不是直接采用Pc[i]的最大值的原因是,如果该位置确实是基频波峰位置,则一定在距离该位置整数倍基音周期的位置也有几乎相同的波峰,而噪声和共振峰则不具备这样的特性。因此,在一帧信号内,虽然噪声或者共振峰的幅度偶尔会高于基频波峰的幅度,但是通过首先选择M个候选基频波峰位置,再对M个候选基频波峰位置及对应位置的样本点进行幅度值平均后,就可以准确筛选出基频波峰位置了,从而避免了将较大的噪声或者共振峰错误的确定为基频波峰。其中,M的取值一般可为3-5。
第二种:
从当前帧信号的所有样本点中,选取幅度绝对值较大的M(M为大于0的整数,例如M可为3、4或5)个样本点所对应的位置作为候选基频波峰位置;根据上述基音周期,计算每个候选基频波峰位置在当前帧信号中延拓出的每个基音周期内的对应位置;对应每个候选基频波峰位置,判断是否该候选基频波峰位置及其每个基音周期内对应位置上的样本点的幅度值均大于设定的阈值,如果是,则确定该候选基频波峰位置满足基频波峰条件,否则,确定该候选基频波峰位置不满足基频波峰条件;选取满足基频波峰条件的幅度值最大的样本点所对应的候选基频波峰位置作为最佳基频波峰位置。
该方法与上述第一种方法有些类似,其均是根据基音周期确定最佳的基频波峰位置,并且都能准确的筛选出基频波峰的位置。
可见,本步骤中主要是从当前帧信号的所有样本点中,选取幅度绝对值较大的M个样本点所对应的位置作为候选基频波峰位置;并根据基音周期计算每个候选基频波峰位置在所述当前帧信号中延拓出的每个基音周期内的对应位置;之后,根据每个候选基频波峰位置及其对应位置上的样本幅度值,从所述候选基频波峰位置中选取最佳基频波峰位置。
步骤103,根据所述语音信号的基音周期,计算所述最佳基频波峰位置在所述当前帧信号中延拓出的每个基音周期内对应的基频波峰位置。
本步骤的具体实现类似于步骤102中的公式(2)所对应的实现,即当前帧信号中的所有基频波峰位置为:
Pf+jTp (5)
其中,j为整数,满足0≤Pf+jTp≤L-1,Tp为基音周期,Pf为最佳基频波峰位置。
步骤104,对所计算的每个基音周期内基频波峰位置所在的设定区域的信号幅度进行增强,即对每个基音周期内基频波峰位置附近的信号幅度进行增强。进一步地,还可以对除基频波峰位置附近的信号之外的其它信号(如基频波峰位置之外的设定区域的信号)的幅度降低。
本步骤中,通过将基频波峰位置附近的信号提升,其他位置的信号减小,从而起到提高信噪比同时增强基频的作用,具体实现时,方法可有多种。
例如,可在该帧信号内的每个基音周期内用窗函数加权,波峰附近的权值大,其他位置的权值小,同时窗函数要尽量保证处理后的信号连续。
如图2所示,图2示出了本实施例中利用窗函数进行信号增强处理的示意图。其中,横线表示一帧信号从第0个样本点到第L-1个样本点,中间那个向上的箭头表示最佳基频波峰位置Pf,通过Pf和基音周期TP派生出了左右各一个向上的箭头,其和Pf一起构成了该帧内所有的基频波峰。窗函数的长度WinL与TP相同。本实施例中,窗函数的形状如图2所示,在总共WinL的长度范围内,窗函数在各个阶段的形状和尺寸如图2中所示,其中,基频波峰位置所在的设定区域范围为50%,采用的窗函数最大加权值为1.2;远离基频波峰位置的设定区域(即基频波峰位置之外的设定区域)范围为30%,采用的窗函数最小加权值为0.8;最大加权值与最小加权值的过渡区域为斜坡线,共两处,范围各为10%。
当然图2所示的窗函数仅为一种较优的实例,当然也可取其它值,或者也可不存在过渡区域,具体实现时,根据实际需要设置即可,只要保证窗函数在基频波峰所在的设定区域的权值大,其他位置的权值小即可。
以上对本发明实施例一中在时域提高语音信号信噪比的方法进行了详细描述,下面再对本发明实施例一中在时域提高语音信号信噪比的装置进行详细描述。
图3为本发明实施例一中在时域提高语音信号信噪比的装置的示例性结构图。如图3所示,该装置包括:基音周期搜索模块、基频波峰标定模块和波形处理模块。
其中,基音周期搜索模块用于在时域上的当前帧信号中搜索语音信号的基音周期。本模块的具体操作过程可与步骤101中描述的操作过程一致。
基频波峰标定模块用于根据所述基音周期,在当前帧信号中搜索最佳基频波峰位置(具体操作过程可与步骤102中描述的操作过程一致),并根据所述基音周期,计算所述最佳基频波峰位置在所述当前帧信号中延拓出的每个基音周期内对应的基频波峰位置(具体操作过程可与步骤103中描述的操作过程一致)。
波形处理模块,用于对所述所有位置确定模块所计算的每个基音周期内基频波峰位置所在的设定区域的信号幅度进行增强。本模块的具体操作过程可与步骤104中描述的操作过程一致。
具体实现时,基频波峰标定模块的内部结构可有多种结构形式,图3示出了其中一种,包括:候选位置确定模块、最佳位置确定模块和所有位置确定模块。
其中,候选位置确定模块用于从所述当前帧信号的所有样本点中,选取幅度绝对值较大的M(M为大于0的整数)个样本点所对应的位置作为候选基频波峰位置。
最佳位置确定模块用于根据所述基音周期,计算每个候选基频波峰位置在所述当前帧信号中延拓出的每个基音周期内的对应位置,根据每个候选基频波峰位置及其对应位置上的样本幅度值,从所述候选基频波峰位置中选取最佳基频波峰位置。
所有位置确定模块,用于根据所述基音周期,计算所述最佳基频波峰位置在所述当前帧信号中延拓出的每个基音周期内对应的基频波峰位置。
具体实现时,最佳位置确定模块的内部结构也可有多种结构形式,图4a和图4b示出了其中两种结构形式。其中,图4a所示的最佳位置确定模块包括:位置延拓模块、平均幅度值计算模块和最佳位置选取模块。
其中,位置延拓模块用于根据所述基音周期,计算每个候选基频波峰位置在所述当前帧信号中延拓出的每个基音周期内的对应位置。
平均幅度值计算模块用于对应每个候选基频波峰位置,计算其及所有基音周期内对应位置上样本的平均幅度值。
最佳位置选取模块用于选取最大平均幅度值所对应的候选基频波峰位置作为最佳基频波峰位置。
图4b所示的最佳位置确定模块包括:位置延拓模块、幅度判决模块和最佳位置选取模块。
其中,位置延拓模块用于根据所述基音周期,计算每个候选基频波峰位置在所述当前帧信号中延拓出的每个基音周期内的对应位置。
幅度值判决模块用于对应每个候选基频波峰位置,判断是否该候选基频波峰位置及其每个基音周期内对应位置上的样本点的幅度值均大于设定的阈值,如果是,则确定该候选基频波峰位置满足基频波峰条件,否则,确定该候选基频波峰位置不满足基频波峰条件。
最佳位置选取模块用于选取满足基频波峰条件的幅度值最大的样本点所对应的候选基频波峰位置作为最佳基频波峰位置。
具体实现时,基音周期搜索模块的内部结构可有多种结构形式,图5示出了其中一种,包括:候选基音周期确定模块和基音周期确定模块。
其中,候选基音周期确定模块用于根据对所述当前帧信号进行归一化自相关计算的结果,将自相关计算模块得到的归一化自相关值较大的N(N为大于0的整数)个基音周期作为候选基音周期。
基音周期选取模块,用于基于全局基音周期和基音倍频,从所述N个候选基音周期中筛选出最佳基音周期作为所述语音信号的基音周期。
实施例二:
图6为本发明实施例二中在时域提高语音信号信噪比的方法的示例性流程图。如图6所示,该流程包括如下步骤:
步骤601,对所述时域上的当前帧信号进行归一化自相关计算。
步骤602,判断最大归一化自相关值是否大于位于0至1之间的设定值,如果是,则执行步骤603;否则,可将当前帧信号直接输出。
其中,位于0至1之间的设定值可以为0.1、0.2、0.3等。当最大归一化自相关值大于该设定值时,表明该帧信号为元音段,则可执行步骤703;否则,表明该帧信号为非元音段,可将该帧信号直接输出。
步骤603,在时域上的当前帧信号中搜索语音信号的基音周期。
本步骤中,可采用步骤101中描述的实现方法搜索基音周期,此时,可直接利用步骤601中计算的归一化自相关值即可,即根据步骤601中计算的归一化自相关值,找到归一化自相关值较大的N个候选基音周期,然后在这N个候选基音周期中,筛选出最佳基音周期为语音信号的基音周期。
步骤604~步骤606的具体实现过程与步骤102~步骤104的具体实现过程一致,此处不再赘述。
相应地,图7为本发明实施例二中在时域提高语音信号信噪比的装置的示例性结构图。与图3相比,该装置进一步包括一个第一决策处理模块,用于根据对所述当前帧信号进行归一化自相关计算的结果,判断最大归一化自相关值是否大于位于0至1之间的设定值,如果是,则通知所述基音周期搜索模块执行基音周期搜索;否则,可由波形处理模块直接输出该帧信号。
实施例三:
图8为本发明实施例三中提高语音信号信噪比的方法的示例性流程图。如图8所示,该流程包括如下步骤:
步骤801,将时域上得到的当前帧信号由时域转换为频域。
步骤802,对转换到频域上的当前帧信号进行语音增强处理。
本步骤中,可采用减谱法或维纳滤波法等对频域上的当前帧信号进行语音增强处理。
步骤803,将上述步骤中进行语音增强处理后的当前帧信号由频域转换为时域。
步骤804,执行图1所示流程或图6所示流程。
本实施例中,可根据实际需要继续执行图1所示流程或图6所示流程,从而得到两个具体实施例。
相应地,本发明实施例三中可在图3所示装置或图7所示装置基础上,增加第一转换模块、频域增强处理模块和第二转换模块,分别得到如图9a和图9b所示的示例性结构图。
其中,第一转换模块用于将时域上得到的当前帧信号由时域转换为频域。
频域增强处理模块用于对转换到频域上的当前帧信号进行语音增强处理。
第二转换模块用于将所述频域增强处理模块处理后的当前帧信号由频域转换为时域。
在图9a中,基音周期搜索模块用于在来自第二转换模块的时域上的当前帧信号中搜索语音信号的基音周期。基频波峰标定模块用于根据所述基音周期,在来自第二转换模块的时域上的当前帧信号中搜索最佳基频波峰位置。
在图9b中,第一决策处理模块根据对来自第二转换模块的时域上的当前帧信号进行归一化自相关计算的结果,判断最大归一化自相关值是否大于位于0至1之间的设定值,如果是,则通知所述基音周期搜索模块执行基音周期搜索;否则,可通知波形处理模块将当前帧的信号直接输出。基音周期搜索模块用于在来自第二转换模块的时域上的当前帧信号中搜索语音信号的基音周期。基频波峰标定模块用于根据所述基音周期,在来自第二转换模块的时域上的当前帧信号中搜索最佳基频波峰位置。
实施例四:
图10为本发明实施例四中提高语音信号信噪比的方法的示例性流程图。如图10所示,该流程包括如下步骤:
步骤1001~步骤1003的具体实现过程与步骤801~步骤803的具体实现过程一致,此处不再赘述。
步骤1004,判断在频域上的所述语音增强处理中得到的信噪比估计值是否大于设定阈值,如果是,则执行步骤1005;否则,执行步骤1006。
本步骤中,设定阈值可以根据实际需要设置,例如,取0dB等。当信噪比估计值大于设定阈值时,表明该帧信号为语音段,则可执行步骤1005;否则,表明该帧信号为非语音段,可执行步骤1006。
步骤1005,执行图1所示流程或图6所示流程。
步骤1006,将该帧信号直接输出,或将该帧信号乘以一个小于1的预设值(例如0.7、0.8或0.9等)后输出。
相应地,本发明实施例四中可分别在图9a和图9b所示装置基础上,增加第二决策处理模块,分别得到如图11a和图11b所示的示例性结构图。
在图11a中,第二决策处理模块,用于判断所述频域增强处理模块进行语音增强处理时得到的信噪比估计值是否大于设定阈值,如果是,则通知所述基音周期搜索模块执行基音周期搜索;否则,可通知波形处理模块将当前帧的信号直接输出,或将当前帧信号乘以一个小于1的数值后输出。基音周期搜索模块用于在来自第二转换模块的时域上的当前帧信号中搜索语音信号的基音周期。基频波峰标定模块用于根据所述基音周期,在来自第二转换模块的时域上的当前帧信号中搜索最佳基频波峰位置。
在图11b中,第二决策处理模块,用于判断所述频域增强处理模块进行语音增强处理时得到的信噪比估计值是否大于设定阈值,如果是,则通知第一决策处理模块进行判断;否则,可通知波形处理模块将当前帧的信号直接输出,或将当前帧信号乘以一个小于1的数值后输出。第一决策处理模块用于根据来自第二决策处理模块的通知,根据对所述当前帧信号进行归一化自相关计算的结果,判断最大归一化自相关值是否大于位于0至1之间的设定值,如果是,则通知所述基音周期搜索模块执行基音周期搜索。基音周期搜索模块在所述第二转换模块转换到时域上的当前帧信号中搜索语音信号的基音周期。基频波峰标定模块根据所述基音周期,在所述第二转换模块转换到时域上的当前帧信号中搜索最佳基频波峰位置。
为了验证本发明技术方案的性能,现通过语音识别的准确率来验证方案的有效性。下面采用HTK工具包作为语音识别的工具,并采用标准的MFCC系数及其一阶二阶导数作为特征参数,则测试序列分为三组A、B、C,每组50个数字串,每个数字串包含8个数字,即每组测试序列包含400个数字。
A为与训练数据相同信道下采集的一组数据;B为与训练数据不同信道且信噪比较高下采集的一组数据;C为与训练数据不同信道且信噪比较低下采集的一组数据。
测试的情况为以下4种(注:前端都进行了频域语音增强处理):
1、不应用时域语音增强算法。
2、采用SWP的时域语音增强算法(即背景技术中所提的现有方法)。
3、采用实施例三的方案。
4、采用实施例四的方案。
根据上面的4种情况,分别进行A、B、C三组序列的语音识别测试。识别结果如表1所示(注:错误率减小是相对测试1为基准来说的):
表1
从表中数据可见,采用本发明中的技术方案,可以进一步减小语音识别的错误率,即提高了语音的信噪比,因此也就验证了本发明所述的时域语音增强技术的有效性。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。