WO2017063516A1

WO2017063516A1 - 噪音信号确定方法、语音去噪方法及装置

Info

Publication number: WO2017063516A1
Application number: PCT/CN2016/101444
Authority: WO
Inventors: 杜志军
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2015-10-13
Filing date: 2016-10-08
Publication date: 2017-04-20
Also published as: SG10202005490WA; US20180293997A1; EP3364413B1; PL3364413T3; US10796713B2; KR102208855B1; JP2018534618A; EP3364413A4; KR20180067608A; ES2807529T3; JP6784758B2; SG11201803004YA; CN106571146B; EP3364413A1; CN106571146A

Abstract

一种噪音信号确定方法、语音去噪方法及装置，噪音信号确定方法包括：对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱（S101）；根据帧信号的功率谱确定语音信号片段中各帧信号关于各频率下的功率值的方差（S102）；根据方差确定语音信号片段中的各帧信号是否为噪音信号（S103）。可以准确地得到待分析的语音信号片段中包含的若干噪音帧，进而提升语音去噪效果。

Description

噪音信号确定方法、语音去噪方法及装置

本申请要求2015年10月13日递交的申请号为201510670697.8、发明名称为“噪音信号确定方法、语音去噪方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及语音去噪技术领域，特别涉及一种噪音信号确定方法、语音去噪方法及装置。

背景技术

语音去噪技术是通过去除语音信号中的环境噪音来提升语音质量的技术。在语音去噪过程中，首先需确定语音信号中噪音信号的功率谱，后续再根据所确定的噪音信号的功率谱来作去噪。

现有技术中，确定语音信号中噪音信号的功率谱的方式通常是：假定一段语音信号中的前N帧信号是噪音信号(即不包含人的语音信号)，从而通过对上述前N帧信号进行分析，得到该语音信号中的噪音信号的功率谱。

在实际应用场景中，现有技术通过假定的方式将语音信号中的前N帧信号确定为噪音信号，往往出现通过假定方式获得的前N帧信号与实际的噪音信号不符的情况，从而影响获取的噪音信号的功率谱的准确性。

发明内容

本申请实施例的目的是提供一种噪音信号确定方法、语音去噪方法及装置，以解决现有技术中通过假定方式获得的前N帧信号与实际的噪音信号不符，从而影响获取的噪音信号的功率谱的准确性的问题。

为解决上述技术问题，本申请实施例提供的噪音信号确定方法、语音去噪方法及装置是这样实现的：

一种噪音信号确定方法，包括：

对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱；

根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差；

根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号。

一种语音去噪方法，包括：

确定待处理语音中包含的待分析的语音信号片段；

根据所述方差确定所述语音信号片段中的各帧信号是否为噪音信号，获得所述语音信号片段中包含的若干噪音帧；

确定与所述语音信号片段中包含的若干噪音帧对应的功率均值，并依据所述噪音帧的功率均值进行所述待处理语音的语音去噪处理。

一种噪音信号确定装置，包括：

功率谱获取单元，用于对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱；

方差确定单元，用于根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差；

噪音确定单元，用于根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号。

一种语音去噪装置，包括：

片段确定单元，用于确定待处理语音中包含的待分析的语音信号片段；

噪音确定单元，用于根据所述方差确定所述语音信号片段中的各帧信号是否为噪音信号，获得所述语音信号片段中包含的若干噪音帧；

语音去噪单元，用于确定与所述语音信号片段中包含的若干噪音帧对应的功率均值，并依据所述噪音帧的功率均值进行所述待处理语音的语音去噪处理。

由以上本申请实施例提供的技术方案可见，本申请实施例提供的噪音信号确定方法、语音去噪方法及装置，通过对待分析的语音信号片段进行傅里叶变换得到各帧信号的功率谱，并确定待分析的语音信号片段中各帧信号关于各频率下的功率值的方差，最终根据上述方差来确定该帧信号是否为噪音信号，从而准确地得到上述待分析的语音信号片段中包含的若干噪音帧；在语音去噪的过程中，可以依据上述确定的若干噪音帧的功率均值来对待处理语音进行去噪处理，进而提升语音去噪效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例中噪音信号确定方法的流程图；

图2为本申请实施例中确定帧信号是否是噪音信号的步骤的流程图；

图3为本申请实施例中确定帧信号在各个采样点上的功率值的方差的步骤的流程图；

图4为本申请实施例中关于功率值的方差曲线图；

图5为本申请一实施例中语音去噪方法的流程图；

图6为本申请一实施例中噪音信号确定装置的模块图；

图7为本申请一实施例中语音去噪装置的模块图；

图8为本申请提供的装置的硬件实现结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

参照图1所示，其为本申请一实施例中噪音信号确定方法的流程图。为了确定一段待分析的语音信号片段中的噪音信号，本实施例的噪音信号确定方法包括如下步骤：

S101：对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱。

上述待分析的语音信号片段可以通过一定的规则从待处理语音中截取得到。该待分析的语音信号片段可以是初步判断可能包含较多噪音帧的“疑似噪音帧片段”。优选地，在该步骤S101之前，所述方法还包括：

根据待处理语音的时域信号的幅度变化，确定该待处理语音中的包含的一段幅度变化小于预设阈值的语音信号片段为所述待分析的语音信号片段。

或，截取待处理语音中的前N帧语音信号作为所述待分析的语音信号片段。

本申请实施例中，一般在语音信号的时域中，噪音信号通常是变化幅度较小或幅度较一致的一段语音信号片段，而包含人的说话语音的语音信号片段通常变化幅度波动较大，根据这一规则，可以预先设定一个用以识别待处理语音(即待去噪处理的语音)中包含的“疑似噪音帧片段”的预设阈值。从而可以将该待处理语音中的包含的一段幅度变化小于预设阈值的语音信号片段确定为所述待分析的语音信号片段。

本申请实施例中，首先对语音信号进行分帧处理，帧信号是指单帧语音信号，一段语音信号包含若干帧的帧信号。一个帧信号可以包括若干个采样点，如：1024个采样点，相邻的两个帧信号可以存在相互重合(如重合度是50％)。本实施例可以通过将时域的语音信号作短时傅里叶变换(short-time Fourier transform,STFT)，得到该语音信号的功率谱(频域)。功率谱包含多个对应于不同频率的功率值，如：1024个功率值。

本申请实施例中，通常在一段包含人的语音的语音信号中，在人开始说话之前，可以默认开始说话之前的一段时间(如：1.5s)的语音信号是噪音信号(环境噪音)，故，本申请实施例可以确定上述待分析的语音信号是一段语音信号中的前N帧的帧信号，如：待分析的语音信号是前1.5s的语音信号：{f₁',f'₂,…,f'_n}，其中，f₁',f'₂,…,f'_n分别指代该语音信号中包含的各个帧信号。本申请实施例的目的是：确定该分析的语音信号中哪些帧信号是噪音信号。

基于通过短时傅里叶变换得到的待分析的语音信号：{f₁',f'₂,…,f'_n}的功率谱，可以计算得到每个帧信号对应的多个功率值。其中，假设某个帧信号在某个频率上的功率谱是a+bi，实部a可以代表幅度，虚部b可以代表相位，则该帧信号在该频率下的功率值是：a²+b²。通过以上过程，可以得到每个帧信号在对应的不同频率下的功率值。举例而言，若每个帧信号{f₁',f'₂,…,f'_n}均包含1024个采样点，则可以根据功率谱得到每个帧信号在不同频率下的1024个功率值，如：帧信号f₁'对应的功率值是：

帧信号f'₂对应的功率值是：

帧信号f'_n对应的功率值是：

S102：根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差。

基于各个帧信号{f₁',f'₂,…,f'_n}在各个频率的功率值，可以根据方差计算公式，分别计算得到各个帧信号{f₁',f'₂,…,f'_n}关于功率值的方差{Var(f₁'),Var(f'₂),…,Var(f'_n)}。其中，若以1024个采样点为例，Var(f₁')是关于

的方差，Var(f'₂)是关于

的方差，…，Var(f'_n)是关于

的方差。

S103：根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号。

本申请实施例中，通常，包含有话片段的帧信号的能量(即功率值)随频带有较大的变化。而不包含有话片段的帧信号(即噪音信号)的能量随频带的变化相对较小，分布较均匀。故，可以根据各个帧信号关于功率值的方差，来确定该帧信号是否为噪音信号。

参图2所示，其为本申请实施例中确定帧信号是否是噪音信号的步骤的流程图。本申请实施例中，上述步骤S103可以包括：

S1031：判断该帧信号关于功率值的方差是否大于第一阈值T₁。

S1032：若否，将该帧信号确定为噪音信号。

如果某个帧信号关于功率值的方差超过第一阈值T₁，则表明该帧信号的能量(即功率值)随频带的变化幅度超过第一阈值T₁，从而可以确定该帧信号不是噪音信号；反之，如果某个帧信号关于功率值的方差没有超过第一阈值T₁，则表明该帧信号的能量(即功率值)随频带的变化幅度没有超过第一阈值T₁，从而可以确定该帧信号是噪音信号。

通过如上过程，可以依次确定到待分析的语音信号：{f₁',f'₂,…,f'_n}中的属于噪音信号的帧信号{f₁',f'₂,…,f'_m}和不属于噪音信号的帧信号{f'_m+1,f'_m+2,…,f'_n}，从而可以确定到一段语音信号中包含的噪音信号，并根据这些噪音信号{f₁',f'₂,…,f'_m}来作语音去噪。

参图3所示，本申请实施例中，上述步骤S102可以具体包括：

S1021：根据帧信号{f₁',f'₂,…,f'_n}的功率谱对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中、及与第二频率区间对应的第二功率值集合中；其中，所述第一频率区间小于所述第二频率区间。

在具体实施例中，在频域对每个帧信号进行方差统计，由于非噪音信号一般集中在中低频段，而噪音信号一般在各个频段分布较为均匀，故，对于每个帧信号所对应的各个频率的功率值，分别至少统计两个不同频段(即上述频率区间)的方差。

举例而言，第一频率区间可以是0～2000Hz(低频段)，第二频率区间可以是2000～4000Hz(高频段)。若每帧信号包括的采样点是1024个，则分别将每帧信号对应的1024个功率值按照所处的频率区间，分别归分到0～2000Hz对应的第一功率值集合A中、及2000～4000Hz对应的第二功率值集合B中。以帧信号f₁'为例，其对应的1024个功率值是：

则按照频率区间，可以得到第一功率值集合A包括的功率值例如是：

可以得到第一功率值集合A包括的功率值例如是：

以此类推。

值得一提的是，本申请其他实施例中，可以划分两个以上的频段，并分别统计两个以上的频段的信号功率值的方差。

S1022：确定所述第一功率值集合中包含的功率值的第一方差。

如上所述，若以帧信号f₁'为例，得到第一功率值集合A包括的功率值例如是：

可以依据方差公式，计算得到功率值

的第一方差Var_high(f₁')。

S1021：确定所述第二功率值集合中包含的功率值的第二方差。

如上所述，若以帧信号f₁'为例，得到第二功率值集合B包括的功率值例如是：

可以依据方差公式，计算得到功率值

的第二方差Var_low(f₁')。

参照图4所示，其为本申请实施例中的方差曲线示意图。其中，横轴表示帧信号的帧序号，纵轴表示方差的大小，第一方差曲线示出了上述每个帧信号的第一方差的走势，第一方差曲线示出了上述每个帧信号的第二方差的走势。从图中可以看出：在高频段2000～4000Hz，方差波动并不大；而在低频段0～2000Hz，方差波动较大，这就验证了非噪音信号主要集中在低频段。

如上所述，在本申请优选实施例中，上述步骤S1031可以具体包括：

判断该帧信号关于功率值的第一方差是否大于第一阈值T₁。若是，则判定该帧信号为噪音信号。以帧信号f₁'为例，判断第一方差Var_high(f₁')是否大于第一阈值T₁。

本申请实施例中，上述步骤S103还可以具体包括：

判断第一方差与第二方差的差值是否大于第二阈值T₂。

若否，将该帧信号确定为噪音信号。

以帧信号f₁'为例，第一方差和第二方差的差值是：|Var_high(f₁')-Var_low(f₁')|，若|Var_high(f₁')-Var_low(f₁')|＜T₂，则判定该帧信号f₁'为噪音信号。按照此步骤，可以依次确定到待分析的语音信号：{f₁',f'₂,…,f'_n}中哪些帧信号是噪音信号。

本申请实施例中，在步骤S102和步骤S103之间，所述方法还包括：

将所述待分析的语音信号片段中的各帧信号按照所述方差的大小进行排序；

则，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号，包括：基于排序得到的各帧信号关于各频率下的功率值的方差，确定所述语音信号片段中的各帧信号是否为噪音信号。

如上所述，本实施例可以分别确定帧信号：{f₁',f'₂,…,f'_n}关于功率值的方差：{Var(f₁'),Var(f'₂),…,Var(f'_n)}。将帧信号按照功率值的方差从小到大进行排序，由于方差越小，越可能是噪音信号，故，通过排序可以将待分析的语音信号中的属于噪音信号的帧信号排序到前列。本申请实施例中，若分别统计低频段(例如：0～2000Hz)和高频段(例如：2000～4000Hz)的方差，根据各个帧信号{f₁',f'₂,…,f'_n}的功率谱对应的频率所处的频率区间，将每帧信号在各个频率上的功率值归入与第一频率区间(例如：0～2000Hz)对应的第一功率值集合A中、及与第二频率区间(例如：2000～4000Hz)对应的第二功率值集合B中。随后，分别确定帧信号{f₁',f'₂,…,f'_n}对应的第一功率值集合中包含的功率值的第一方差{Var_low(f₁'),Var_low(f'₂),…,Var_low(f'_n)}；分别确定帧信号{f₁',f'₂,…,f'_n}对应的第二功率值集合中包含的功率值的第二方差{Var_high(f₁'),Var_high(f'₂),…,Var_high(f'_n)}。基于上述高频和低频的方差统计，上述步骤S104可以通过如下方式来确定待分析的语音信号(可以是按照方差大小进行排序后的语音信号)中包含的噪音信号：

Var_low(f_i')＞T₁ (1)；

|Var_high(f_i')-Var_low(f_i')|＞T₂ (2)；

Var_high(f'_i+1)-Var_high(f'_i-1)＞T₃ (3)；

Var_low(f'_i+1)-Var_low(f'_i-1)＞T₄ (4)；

其中，i∈(1,n)，通过上述公式(1)，可以依次判断每帧信号f_i'关于所述功率值的第一方差是否大于第一阈值T₁，若否，将该帧信号f_i'确定为噪音帧信号；将确定的噪音帧信号的集合确定为噪音信号。

通过上述公式(2)，可以依次判断每帧信号f_i'关于所述功率值的第二方差是否大于第二阈值T₂，若否，将该帧信号f_i'确定为噪音帧信号；将确定的噪音帧信号的集合确定为噪音信号。

通过上述公式(3)，可以依次判断每帧信号f_i'的前一个帧信号f'_i-1关于功率值的第二方差Var_high(f'_i-1)与该帧信号的后一个帧信号f'_i+1关于所述功率值的第二方差Var_high(f'_i+1)的差值Var_high(f'_i+1)-Var_high(f'_i-1)是否大于第三阈值T₃，若否，将该帧信号f_i'确定为噪音帧信号；将确定的噪音帧信号的集合确定为噪音信号。

通过上述公式(4)，可以依次判断每帧信号f_i'的前一个帧信号f'_i-1关于功率值的第一方差Var_low(f'_i-1)与该帧信号的后一个帧信号f'_i+1关于功率值的第一方差Var_low(f'_i+1)的差值Var_low(f'_i+1)-Var_low(f'_i-1)是否大于第四阈值T₄，若否，将该帧信号f_i'确定为噪音帧信号；将确定的噪音帧信号的集合确定为噪音信号。

本申请实施例中，可以通过上述公式(1)～(4)来识别待分析的语音信号中包含的噪音帧。也就是说，对于任意一个帧信号f_i'而言，若其满足上述公式(1)～(4)中的任意一个，则可以确定该帧信号为非噪音信号(噪音截止帧)。换句话说，对于任意一个帧信号f_i'而言，若上述公式(1)～(4)均不满足，则可以确定该帧信号为噪音信号。通过上述过程，可以确定噪音截止帧f'_m，则噪音帧包括：{f₁',f'₂,…,f'_m-1}。

值得提及的是，本申请其他实施例中，可以通过上述公式(1)～(4)中部分公式来确定噪音截止帧，比如：公式(1)和公式(2)，公式(2)和公式(3)。此外，本申请实施例的用以确定噪音截止帧的公式并不限于上述所列举的公式。其中，上述阈值T₁、 T₂、T₃、T₄均是通过大量测试样本统计得到的。

图5为本申请一实施例中语音去噪方法的流程，包括：

S201：确定待处理语音中包含的待分析的语音信号片段。

S202：对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱。

S203：根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差。

S204：根据所述方差确定所述语音信号片段中的各帧信号是否为噪音信号，获得所述语音信号片段中包含的若干噪音帧。

S205：确定与所述语音信号片段中包含的若干噪音帧对应的功率均值，并依据所述噪音帧的功率均值进行所述待处理语音的语音去噪处理。

本申请实施例中，在依据上述方法获取到一段待分析语音片段中包含的噪音帧{f₁',f'₂,…,f'_m-1}后，可以确定这些噪音帧分别对应到原始信号(排序之前)中的帧序号，并统计这些帧信号的功率均值，从而获得噪音信号的功率谱估计值P_noise。在获取得到噪音信号的功率谱估计值P_noise后，可以进行语音去噪处理。由于去噪方法属于本领域普通技术所熟知的技术，本文在此不再予以具体叙述。

当然，本申请其他可行的实施例中，可以省去按照方差对帧信号进行排序的步骤，而是直接通过原始信号的各个方差来确定哪些帧是噪音帧。另外，在本申请所确定的多帧噪音信号后，为了避免过估计的情况，通常是取其中一部分帧来进行功率谱估计值P_noise的计算，如：确定的噪音信号是50帧，则可以截取其中的前30帧来进行功率谱估计值P_noise的计算，提高功率谱估计值的准确性。

与上述流程实现对应，本申请的实施例还提供了一种噪音信号确定装置。该装置可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为逻辑意义上的装置，是通过服务器的CPU(Central Process Unit，中央处理器)将对应的计算机程序指令读取到内存中运行形成的。该装置的一种硬件结构可参见图8所示。

图6为本申请一实施例中噪音信号确定装置的模块图。本实施例中，该装置中各单元的功能可以与上述噪音信号确定方法的各步骤中的功能对应，具体内容可以参照上述方法实施例。所述噪音信号确定装置100包括：

功率谱获取单元101，用于对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱；

方差确定单元102，用于根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差；

噪音确定单元103，用于根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号。

优选地，所述装置还包括：片段获取单元，用于：

根据待处理语音的时域信号的幅度变化，确定该待处理语音中的包含的一段幅度变化小于预设阈值的语音信号片段为所述待分析的语音信号片段；

优选地，所述噪音确定单元103用于：

判断与所述语音信号片段中的各帧信号对应的所述方差是否大于第一阈值；

若否，将所述帧信号确定为噪音信号。

优选地，所述方差确定单元102用于：

根据所述功率谱对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中；

确定所述第一功率值集合中包含的功率值的第一方差；

则，所述噪音确定单元103用于：

判断所述第一方差是否大于第一阈值；

若否，将该帧信号确定为噪音信号。

优选地，所述方差确定单元102具体用以：

根据每个帧信号对应的各功率值对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中、及与第二频率区间对应的第二功率值集合中；其中，所述第一频率区间小于所述第二频率区间；

确定所述第一功率值集合中包含的功率值的第一方差；

确定所述第二功率值集合中包含的功率值的第二方差；

则，所述噪音确定单元103用于：

判断与每个帧信号对应的所述第一方差与所述第二方差的差值是否大于第二阈值；

若否，将该帧信号确定为噪音信号。

与上述流程实现对应，本申请的实施例还提供了一种语音去噪装置。该装置可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。以软件实现为例，作为逻辑意义上的装置，是通过服务器的CPU(Central Process Unit，中央处理器)将对应的计算机程序指令读取到内存中运行形成的。该装置的一种硬件结构可参见图8所示。

图7为本申请一实施例中语音去噪装置的模块图。本实施例中，该装置中各单元的功能可以与上述语音去噪方法的各步骤中的功能对应，具体内容可以参照上述方法实施例。本实施例中，所述语音去噪装置200包括：

片段确定单元201，用于确定待处理语音中包含的待分析的语音信号片段；

功率谱获取单元202，用于对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱；

方差确定单元203，用于根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差；

噪音确定单元205，用于根据所述方差确定所述语音信号片段中的各帧信号是否为噪音信号，获得所述语音信号片段中包含的若干噪音帧；

语音去噪单元10，用于确定与所述语音信号片段中包含的若干噪音帧对应的功率均值，并依据所述噪音帧的功率均值进行所述待处理语音的语音去噪处理。

优选地，所述装置还包括排序单元204，用于：

则，噪音确定单元205具体用于：

基于排序得到的各帧信号关于各频率下的功率值的方差，确定所述语音信号片段中的各帧信号是否为噪音信号。

本申请实施例提供的噪音信号确定方法、语音去噪方法及装置，通过对待分析的语音信号片段进行傅里叶变换得到各帧信号的功率谱，并确定待分析的语音信号片段中各帧信号关于各频率下的功率值的方差，最终根据上述方差来确定该帧信号是否为噪音信号，从而准确地得到上述待分析的语音信号片段中包含的若干噪音帧；在语音去噪的过程中，可以依据上述确定的若干噪音帧的功率均值来对待处理语音进行去噪处理，进而提升语音去噪效果。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

一种噪音信号确定方法，其特征在于，包括：

对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱；

根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差；

根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号。
根据权利要求1所述的方法，其特征在于，对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱之前，所述方法还包括：

根据待处理语音的时域信号的幅度变化，确定该待处理语音中的包含的一段幅度变化小于预设阈值的语音信号片段为所述待分析的语音信号片段；

或，截取待处理语音中的前N帧语音信号作为所述待分析的语音信号片段。
根据权利要求1所述的方法，其特征在于，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号，包括：

判断与所述语音信号片段中的各帧信号对应的所述方差是否大于第一阈值；

若否，将该帧信号确定为噪音信号。
根据权利要求3所述的方法，其特征在于，根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差，包括：

根据所述功率谱对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中；

确定所述第一功率值集合中包含的功率值的第一方差；

则，判断所述方差是否大于第一阈值，包括：

判断所述第一方差是否大于第一阈值。
根据权利要求1所述的方法，其特征在于，根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差，包括：

根据每个帧信号对应的各功率值对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中、及与第二频率区间对应的第二功率值集合中；其中，所述第一频率区间小于所述第二频率区间；

确定所述第一功率值集合中包含的功率值的第一方差；

确定所述第二功率值集合中包含的功率值的第二方差；

则，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号，包括：

判断与每个帧信号对应的所述第一方差与所述第二方差的差值是否大于第二阈值；

若否，将该帧信号确定为噪音信号。
根据权利要求1所述的方法，其特征在于，根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差之后，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号之前，所述方法还包括：

将所述待分析的语音信号片段中的各帧信号按照所述方差的大小进行排序；

则，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号，包括：

基于排序得到的各帧信号关于各频率下的功率值的方差，确定所述语音信号片段中的各帧信号是否为噪音信号。
一种语音去噪方法，其特征在于，包括：

确定待处理语音中包含的待分析的语音信号片段；

对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱；

根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差；

根据所述方差确定所述语音信号片段中的各帧信号是否为噪音信号，获得所述语音信号片段中包含的若干噪音帧；

确定与所述语音信号片段中包含的若干噪音帧对应的功率均值，并依据所述噪音帧的功率均值进行所述待处理语音的语音去噪处理。
根据权利要求7所述的方法，其特征在于，确定待处理语音中包含的待分析的语音信号片段，包括：

根据待处理语音的时域信号的幅度变化，确定该待处理语音中的包含的一段幅度变化小于预设阈值的语音信号片段为所述待分析的语音信号片段；

或，截取待处理语音中的前N帧语音信号作为所述待分析的语音信号片段。
根据权利要求7所述的方法，其特征在于，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号，包括：

判断与所述语音信号片段中的各帧信号对应的所述方差是否大于第一阈值；

若否，将该帧信号确定为噪音信号。
根据权利要求9所述的方法，其特征在于，根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差，包括：

根据所述功率谱对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中；

确定所述第一功率值集合中包含的功率值的第一方差；

则，判断所述方差是否大于第一阈值，包括：

判断所述第一方差是否大于第一阈值。
根据权利要求7所述的方法，其特征在于，根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差，包括：

根据每个帧信号对应的各功率值对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中、及与第二频率区间对应的第二功率值集合中；其中，所述第一频率区间小于所述第二频率区间；

确定所述第一功率值集合中包含的功率值的第一方差；

确定所述第二功率值集合中包含的功率值的第二方差；

则，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号，包括：

判断与每个帧信号对应的所述第一方差与所述第二方差的差值是否大于第二阈值；

若否，将该帧信号确定为噪音信号。
根据权利要求7所述的方法，其特征在于，根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差之后，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号之前，所述方法还包括：

将所述待分析的语音信号片段中的各帧信号按照所述方差的大小进行排序；

则，根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号，包括：

基于排序得到的各帧信号关于各频率下的功率值的方差，确定所述语音信号片段中的各帧信号是否为噪音信号。
一种噪音信号确定装置，其特征在于，包括：

功率谱获取单元，用于对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱；

方差确定单元，用于根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差；

噪音确定单元，用于根据所述方差，确定所述语音信号片段中的各帧信号是否为噪音信号。
根据权利要求13所述的装置，其特征在于，所述装置还包括：

片段获取单元，用于：

根据待处理语音的时域信号的幅度变化，确定该待处理语音中的包含的一段幅度变化小于预设阈值的语音信号片段为所述待分析的语音信号片段；

或，截取待处理语音中的前N帧语音信号作为所述待分析的语音信号片段。
根据权利要求13所述的装置，其特征在于，所述噪音确定单元用于：

判断与所述语音信号片段中的各帧信号对应的所述方差是否大于第一阈值；

若否，将所述帧信号确定为噪音信号。
根据权利要求13所述的装置，其特征在于，所述方差确定单元用于：

根据所述功率谱对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中；

确定所述第一功率值集合中包含的功率值的第一方差；

则，所述噪音确定单元用于：

判断所述第一方差是否大于第一阈值；

若否，将该帧信号确定为噪音信号。
根据权利要求13所述的装置，其特征在于，所述方差确定单元具体用以：

根据每个帧信号对应的各功率值对应的频率所处的频率区间，至少将该帧信号在各个频率的功率值归入与第一频率区间对应的第一功率值集合中、及与第二频率区间对应的第二功率值集合中；其中，所述第一频率区间小于所述第二频率区间；

确定所述第一功率值集合中包含的功率值的第一方差；

确定所述第二功率值集合中包含的功率值的第二方差；

则，所述噪音确定单元用于：

判断与每个帧信号对应的所述第一方差与所述第二方差的差值是否大于第二阈值；

若否，将该帧信号确定为噪音信号。
一种语音去噪装置，其特征在于，包括：

片段确定单元，用于确定待处理语音中包含的待分析的语音信号片段；

功率谱获取单元，用于对待分析的语音信号片段中的各帧信号作傅里叶变换，得到该语音信号片段中的各帧信号的功率谱；

方差确定单元，用于根据所述帧信号的功率谱，确定所述语音信号片段中各帧信号关于各频率下的功率值的方差；

噪音确定单元，用于根据所述方差确定所述语音信号片段中的各帧信号是否为噪音信号，获得所述语音信号片段中包含的若干噪音帧；

语音去噪单元，用于确定与所述语音信号片段中包含的若干噪音帧对应的功率均值，并依据所述噪音帧的功率均值进行所述待处理语音的语音去噪处理。