CN104952458A

CN104952458A - 一种噪声抑制方法、装置及系统

Info

Publication number: CN104952458A
Application number: CN201510312269.8A
Authority: CN
Inventors: 杜高峰; 梁添才; 刘建平; 金晓峰
Original assignee: Guangdian Yuntong Financial Electronic Co Ltd
Current assignee: Guangdian Yuntong Financial Electronic Co Ltd
Priority date: 2015-06-09
Filing date: 2015-06-09
Publication date: 2015-09-30
Anticipated expiration: 2035-06-09
Also published as: RU2685391C1; HK1252025A1; EP3309782A1; TR201903255T4; WO2016197811A1; EP3309782A4; CN104952458B; EP3309782B1; US20180137877A1; HK1252025B; ZA201708508B

Abstract

本发明实施例公开了一种噪声抑制方法、装置及系统，解决了目前由于参考麦克风和主麦克风的声场环境较大的差异，而导致的采用ANC方法将性能差的技术问题。本发明实施例的噪声抑制方法包括：S1：当语音信号输入时，噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号；S2：提取内部噪声对应的内部信号特征；S3：根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征；S4：通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值；S5：将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号。

Description

一种噪声抑制方法、装置及系统

技术领域

本发明涉及语音信号处理技术领域，尤其涉及一种噪声抑制方法、装置及系统。

背景技术

在具有语音交互功能的设备中往往有许多机械部件，这些机械部件在工作时产生大量的快速变化的非平稳的机器噪声、冲击噪声。这些噪声通过设备上的拾音器进入到系统中会严重影响语音交互的效果。传统的基于噪声功率谱估计的噪声抑制方法对这种快速变化的非平稳的机器噪声、冲击噪声的滤除效果非常差。已有发明中，对于环境噪声的滤除常采用双麦克风降噪装置。装置中有主麦克风用于接收环境噪声和语音，另外还有参考麦克风用于接收环境噪声，然后两路声音信号通过公知有源噪声对消方法(Active NoiseCancellation，以下简称为ANC)抑制噪声。但是ANC方法要求噪声基本通过相同的声场环境到达主麦克风和噪声参考麦克风，这样主麦克风和参考麦克风接收到的噪声信号呈现高度线性相关关系，ANC方法能够正常工作，而当这一条件不满足时双麦克风噪声抑制方法往往不能正常工作。但是，设备往往具有一个相对封闭的外壳，噪声参考麦克风需要装在壳内接收机器噪声，主麦克风需要接收语音，一般安装在外部或者外壳面板开孔处，这样参考麦克风和主麦克风的声场环境将差异较大，这时直接采用ANC方法将性能很差甚至不能工作。

因此，为了解决上述的由于参考麦克风和主麦克风的声场环境较大的差异，而导致的采用ANC方法将性能差的技术问题，成为了本领域技术人员亟待解决的技术问题。

发明内容

本发明实施例提供了一种噪声抑制方法、装置及系统，解决了目前由于参考麦克风和主麦克风的声场环境较大的差异，而导致的采用ANC方法将性能差的技术问题。

本发明实施例提供的一种噪声抑制方法，包括：

S1：当语音信号输入时，所述噪声抑制装置接收到所述参考语音采集机构采集的内部噪声和所述主语音采集机构采集的包含有外部噪声的语音信号；

S2：提取所述内部噪声对应的内部信号特征，所述内部信号特征为功率谱帧序列；

S3：根据所述内部信号特征，并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征，所述外部近似特征为功率谱形式的帧序列；

S4：通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值；

S5：将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号。

优选地，

步骤S1之前还包括：

对未输入所述语音信号时，对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练，以确定所述映射公式。

优选地，

所述预置自编码神经网络结构的训练步骤具体包括：

S6：对所述噪声信号样本进行每一个预置帧的傅里叶变换，获取对应的样本帧的特征和样本角度信息，所述样本帧的特征为功率谱形式；

S7：将所述样本帧的特征作为所述预置自编码神经网络结构的样本输入x(n)和期望输出o(n)，确定训练样本集

S8：对所述训练样本集中的训练样本一一进行训练，确定所述训练样本集对应的权重向量和偏置参数；

S9：将确定后的所述权重向量和所述偏置参数与所述自编码神经网络的结构求和，计算得到所述训练样本集的所述映射公式。

优选地，

步骤S5具体包括：

将所述噪声信号估计与采集的包含有所述内部噪声的语音信号进行ANC噪声对消方式处理，获取噪声抑制后的所述去噪语音信号。

优选地，

所述预置自编码神经网络结构为5层结构，第一层和第五层为输入输出层，第二层、第三层和第四层为隐含层。

本发明实施例中提供的一种噪声抑制装置，包括：

接收单元，用于当语音信号输入时，接收所述参考语音采集机构采集的内部噪声和所述主语音采集机构采集的包含有外部噪声的语音信号；

提取单元，用于提取所述内部噪声对应的内部信号特征，所述内部信号特征为功率谱帧序列；

获取单元，用于根据所述内部信号特征，并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征，所述外部近似特征为功率谱形式的帧序列；

转换单元，用于通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值；

去噪单元，用于将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号。

优选地，

所述的噪声抑制装置还包括：

训练单元，用于对未输入所述语音信号时，对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练，以确定所述映射公式。

优选地，

所述训练单元具体包括：

变换子单元，用于对未输入所述语音信号时，对所述内部噪声和所述外部噪声组成的噪声信号样本进行每一个预置帧的傅里叶变换，获取对应的样本帧的特征和样本角度信息，所述样本特征帧的为功率谱形式；

第一确定子单元，用于将所述样本帧的特征作为所述预置自编码神经网络结构的样本输入x(n)和期望输出o(n)，确定训练样本集

第二确定子单元，用于对所述训练样本集中的训练样本一一进行训练，确定所述训练样本集对应的权重向量和偏置参数；

计算子单元，用于将确定后的所述权重向量和所述偏置参数与所述自编码神经网络的结构求和，计算得到所述训练样本集的所述映射公式。

本发明实施例中提供的一种噪声抑制系统，包括：

参考语音采集机构、主语音采集机构，以及本发明实施例中提及的任意一种所述的噪声抑制装置；

所述参考语音采集机构、所述主语音采集机构分别与所述噪声抑制装置建立有信号传输连接关系；

其中，所述参考语音采集机构，用于采集内部噪声信号；

所述噪声抑制装置，用于当语音信号输入时，接收所述内部噪声和包含有外部噪声的语音信号，然后提取所述内部噪声对应的内部信号特征，接着根据所述内部信号特征，并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征，再接着通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值，最后将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号；

所述主语音采集机构，用于采集包含有所述内部噪声的所述语音信号。

其中，所述内部信号特征为功率谱帧序列，所述外部近似特征为功率谱形式的帧序列。

优选地，

所述主语音采集机构，还用于采集未输入所述语音信号时的所述外部噪声，使得所述噪声抑制装置对未输入所述语音信号时，对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练，以确定所述映射公式。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明实施例中提供的一种噪声抑制方法、装置及系统，其中，噪声抑制方法包括：S1：当语音信号输入时，噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号；S2：提取内部噪声对应的内部信号特征，内部信号特征为功率谱帧序列；S3：根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征，外部近似特征为功率谱形式的帧序列；S4：通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值；S5：将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号。本实施例中，通过提取内部噪声对应的内部信号特征，结合预置的映射公式以获取与外部噪声相对应的外部近似特征，最后将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理，便实现了外部声场环境差异大的不受限的功能，解决了目前由于参考麦克风和主麦克风的声场环境较大的差异，而导致的采用ANC方法将性能差的技术问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1本发明实施例中提供的一种噪声抑制方法的一个实施例的流程示意图；

图2本发明实施例中提供的一种噪声抑制方法的另一个实施例的流程示意图；

图3本发明实施例中提供的一种噪声抑制装置的一个实施例的结构示意图；

图4本发明实施例中提供的一种噪声抑制装置的另一个实施例的结构示意图；

图5本发明实施例中提供的一种噪声抑制系统的一个实施例的结构示意图；

图6本发明实施例中提供的一种噪声抑制系统的自编码神经网络连接示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1，本发明实施例中提供的一种噪声抑制方法的一个实施例包括：

S1:当语音信号输入时，噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号；

当需要对语音信号进行去噪处理时，当语音信号输入时，噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号。

S2:提取内部噪声对应的内部信号特征；

当噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号之后，提取内部噪声对应的内部信号特征，内部信号特征为功率谱帧序列。

S3：根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征；

当提取内部噪声对应的内部信号特征之后，根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征，外部近似特征为功率谱形式的帧序列。

S4：通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值；

当根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征之后，通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值。

S5：将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号。

当通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值之后，将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号。

本实施例中，通过提取内部噪声对应的内部信号特征，结合预置的映射公式以获取与外部噪声相对应的外部近似特征，最后将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理，便实现了外部声场环境差异大的不受限的功能，解决了目前由于参考麦克风和主麦克风的声场环境较大的差异，而导致的采用ANC方法将性能差的技术问题。

上面是对噪声抑制方法的过程进行详细的描述，下面将对自编码神经网络的训练过程进行详细的描述，请参阅图2，本发明实施例中提供的一种噪声抑制方法的另一个实施例包括：

201、当语音信号未输入时，对获取到的噪声信号样本进行每一个预置帧的傅里叶变换，获取对应的样本帧的特征和样本角度信息；

当需要对语音信号进行去噪处理之前，需要当未输入语音信号时，对内部噪声和外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练，以确定映射公式，前述的预置自编码神经网络结构可以是当语音信号未输入时，对获取到的噪声信号样本进行每一个预置帧的傅里叶变换，获取对应的样本帧的特征和样本角度信息。

例如未接收语音信号前，通过参考语音采集机构(如参考麦克风)和主语音采集机构(如主麦克风)同时采集大于100小时的设备内部机器噪声和设备泄露到外部的机器噪声，组成噪声信号样本，前述的设备可以是安装有噪声抑制装置的设备，例如远程智能柜员机，对采集到的噪声信号样本使用8kHz采样，然后使用32ms的Hamming窗(汉明窗)对噪声信号样本加窗处理，处理后得到帧序列，每帧256个采样点，然后对每一帧噪声信号样本做傅立叶变换，对变换后的傅立叶系数取平方后的到噪声信号样本的功率谱S(ω)和角度angle(ω)，功率谱S(ω)作为内部特征，角度angle(ω)在从内部特征还原成信号时使用。

202、将样本帧的特征作为自编码神经网络的样本输入x(n)和期望输出o(n)，确定训练样本集

当对获取到的噪声信号样本进行每一个预置帧的傅里叶变换，获取对应的样本帧的特征和样本角度信息之后，需要将样本帧的特征作为自编码神经网络的样本输入x(n)和期望输出o(n)，确定训练样本集例如，最后将每段参考麦克风和主麦克风接收的噪声信号内部特征中的相继5帧对数功率谱S(ω)作为声音信号的内部特征并作为自编码神经网络的输入和期望输出，将预先采集所有的主麦克风信号和参考麦克风5帧信号特征组成训练样本集用于执行步骤203。

203、对训练样本集中的训练样本一一进行训练，获取训练样本集对应的权重向量和偏置参数；

当将样本帧的特征作为自编码神经网络的样本输入x(n)和期望输出o(n)，确定训练样本集之后，需要对训练样本集中的训练样本一一进行训练，获取训练样本集对应的权重向量和偏置参数。

例如预置自编码神经网络结构采用5层结构，其中第1、5层为输入输出层，每层有1280个节点，5帧信号特征的维数。第2、3、4层为隐含层，每层有1024个节点。隐含层数越多，节点数越多网络的表达映射越精确，但是同时运算量越大且所需样本越多，需要说明的是，前述的隐含层数和每层节点数是权衡两者后才能确定的。网络为全连接网络。将x(n)作为网络输入，o(n)作为网络期望输出，必须说明的是，前述的神经网络结构可以是如图6所示。

设第n个训练样本的输入为向量x(n)，期望输出为向量o(n)，输入层的神经元输出向量为

训练的最终结果是根据输入和期望输出样本集计算得到自编码神经网络的权重和偏置参数w_l,l＝2,3,4,5，b_l,l＝2,3,4,5。

网络训练过程如下：

A)根据自编码神经网络结构随机选取初始权重值w_l,l＝2,3,4,5，设置偏置值b_l,l＝2,3,4,5为0。取训练样本集中第一个样本，设置n＝1。

B)根据公式y₁(n)＝x(n)，将输入向量x(n)映射为网络输入层神经元输出向量y₁(n)。

C)根据映射关系计算公式，将输入层神经元输出向量映射为第一层隐含层神经元输出向量，第一层隐含层神经元输出向量映射为第二层隐含层神经元输出向量映射，第二隐含层映射为第三隐含层，及第三隐含层映射为输出层。

映射关系计算公式如下：

y_l(n)＝σ(u_l(n))

u_l(n)＝w_ly_l-1(n)+b_l，l＝2,3,4,5；

其中，e为自然对数的底数，w_l为第l层的权重向量，b_l为偏置系数。l＝2时为输入层映射为一层隐含层神经元输出向量，l＝3,4时为第一隐含层映射到第二隐含层及第二隐含层映射为第三隐含层，l＝5时是将第三隐含层映射为输出层向量。

D)根据输出层向量和期望输出向量o(n)，以公式计算误差函数(即衡量网络输出的准确性函数)。

E)根据导数计算公式，计算误差函数相对每一层权重和偏置的导数。

导数计算公式如下：

\frac{&PartialD; E}{&PartialD; w_{l}} = x^{l - 1} {(δ^{l})}^{T}

\frac{&PartialD; E}{&PartialD; w_{l}} = δ^{l},

l＝5,4,3,2；

其中对于隐含层δ^l＝(w_l+1)^T·δ^l+1·σ'(u_l)，l＝2,3,4,对于输出层，l＝5,δ⁵＝σ'(u₅)·(y₅(n)-o(n))；

F)根据误差函数相对每一层权重和偏置的导数计算新的权重和偏置，计算公式如下:

w_{1}^{new} = w_{l} + Δ w_{l};

b_{1}^{new} = b_{l} + Δ b_{l},

l＝5,4,3,2；

其中，l＝5,4,3,2，为权重和偏置变化量。η为学习率，η太大容易导致新权重和偏置震荡，太小容易导致学习过慢，本发明是权衡两者后确定η＝0.05。

G)将新的权重向量和偏置参数设置为自编码神经网的权重和偏置参数值，公式如下：

l＝2,3,4,5；

H)如果所有权重向量和偏置参数改变量(Δw_l，l＝2,3,4,5，Δb_l，l＝2,3,4,5，计算公式参见F)小于给定阈值Th则训练结束，否则取下一个样本，设置n＝n+1，跳转到步骤202，继续下一个样本训练。阈值Th太大容易导致训练不充分，太小导致训练时间过长，本发明是权衡两者后确定Th＝0.001。

204、将确定后的权重向量和偏置参数与自编码神经网络的结构求和，计算得到训练样本集的映射公式；

当对训练样本集中的训练样本一一进行训练，获取训练样本集对应的权重向量和偏置参数之后，需要将确定后的权重向量和偏置参数与自编码神经网络的结构求和，计算得到训练样本集的映射公式。

最后的到的权重和偏置数据加上神经网络结构即为内部噪声信号特征和外部噪声的信号特征的映射关系，映射公式为o＝σ(w₅σ(w₄σ(w₃σ(w₂x+b₂)+b₃)+b₄)+b₅)。

205、当语音信号输入时，噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号；

当语音信号输入时，噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号。

需要说明的是，前述的设备工作时，参考麦克风采集内部机械噪声，主麦克风采集含有机械噪声的语音信号，根据步骤202，首先对参考麦克风采集的噪声信号提取特征，得到功率谱帧序列，角度序列信息。

206、提取内部噪声对应的内部信号特征；

例如将相继5帧信号内部特征输入到训练好的自编码神经网络，根据步骤203最后的映射公式，网络输出为主麦克风接收的噪声信号外部近似特征。

207、根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征；

例如对自编码神经网络输出的噪声信号估计加上对应帧的角度做逆傅立叶变换得到噪声信号估计

208、通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值；

209、将噪声信号估计与采集的包含有内部噪声的语音信号进行ANC噪声对消方式处理，获取噪声抑制后的去噪语音信号。

当通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值之后，需要将噪声信号估计与采集的包含有内部噪声的语音信号进行ANC噪声对消方式处理，获取噪声抑制后的去噪语音信号。

前述的ANC噪声对消方式处理如下：

设在时刻n主麦克风接收的前m个时间点的噪声信号估计组成的向量为主麦克风采集含有机械噪声的时刻n语音信号为d(n)，W＝(w(1),w(2),...,w(m))^T为滤波器的权重系数。T为向量的转置。m太大导致计算量过大，太小容易导致噪声抑制效果变差，本发明取m＝32。

a)在初始时刻n＝1时随机选取滤波器的权重系数初始权重值W。

b)根据公式计算得到n时刻的噪声抑制后的语音信号

c、)根据公式W^new＝W+2μ(d(n)-W^TX)X，计算新的滤波器的权重系数W^new。参数μ是权重系数的学习率，过大或者过小都容易导致噪声抑制效果变差，本发明取μ＝0.05。

d)将新的权重W^new设置为滤波器的权重系数，即：W＝W^new。

e)取下一个时刻的噪声信号估计和含有机械噪声的语音信号，设n＝n+1转到b)。

ANC方法每个时刻计算得到作为ANC输出的该时刻噪声抑制后的语音信号。

本实施例中，通过提取内部噪声对应的内部信号特征，结合预置的映射公式以获取与外部噪声相对应的外部近似特征，最后将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理，便实现了外部声场环境差异大的不受限的功能，解决了目前由于参考麦克风和主麦克风的声场环境较大的差异，而导致的采用ANC方法将性能差的技术问题，以及神经网络和ANC方法的结合，大大地提高了语音信号的去噪效果。

请参阅图3，本发明实施例中提供的一种噪声抑制装置的一个实施例包括：

接收单元301，用于当语音信号输入时，接收参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号；

提取单元302，用于提取内部噪声对应的内部信号特征，内部信号特征为功率谱帧序列；

获取单元303，用于根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征，外部近似特征为功率谱形式的帧序列；

转换单元304，用于通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值；

去噪单元305，用于将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号。

本实施例中，通过提取单元302提取内部噪声对应的内部信号特征，获取单元303结合预置的映射公式以获取与外部噪声相对应的外部近似特征，最后去噪单元305将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理，便实现了外部声场环境差异大的不受限的功能，解决了目前由于参考麦克风和主麦克风的声场环境较大的差异，而导致的采用ANC方法将性能差的技术问题。

上面是对噪声抑制装置的各单元进行详细的描述，下面将对附加单元进行详细的描述，请参阅图4，本发明实施例中提供的一种噪声抑制装置的另一个实施例包括：

训练单元401，用于当未输入语音信号时，对内部噪声和外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练，以确定映射公式。

训练单元401具体包括：

变换子单元4011，用于当未输入语音信号时，对内部噪声和外部噪声组成的噪声信号样本进行每一个预置帧的傅里叶变换，获取对应的样本帧的特征和样本角度信息，样本帧的特征为功率谱形式；

第一确定子单元4012，用于将样本帧的特征作为预置自编码神经网络结构的样本输入x(n)和期望输出o(n)，确定训练样本集

第二确定子单元4013，用于对训练样本集中的训练样本一一进行训练，确定训练样本集对应的权重向量和偏置参数；

计算子单元4014，用于将确定后的权重向量和偏置参数与自编码神经网络的结构求和，计算得到训练样本集的映射公式。

接收单元402，用于当语音信号输入时，接收参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号；

提取单元403，用于提取内部噪声对应的内部信号特征，内部信号特征为功率谱帧序列；

获取单元404，用于根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征，外部近似特征为功率谱形式的帧序列；

转换单元405，用于通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值；

去噪单元406，用于将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号。

本实施例中，通过提取单元403提取内部噪声对应的内部信号特征，获取单元404结合预置的映射公式以获取与外部噪声相对应的外部近似特征，最后去噪单元406将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理，便实现了外部声场环境差异大的不受限的功能，解决了目前由于参考麦克风和主麦克风的声场环境较大的差异，而导致的采用ANC方法将性能差的技术问题，以及神经网络和ANC方法的结合，大大地提高了语音信号的去噪效果。

请参阅图5，本发明实施例中提供的一种噪声抑制系统的一个实施例包括：

参考语音采集机构51、主语音采集机构52，以及图3和图4所示的实施例中提及的噪声抑制装置53；

参考语音采集机构51、主语音采集机构52分别与噪声抑制装置53建立有信号传输连接关系；

其中，参考语音采集机构51，用于采集内部噪声信号，例如远程智能柜员机的内部噪声信号；

噪声抑制装置53，用于当语音信号输入时，接收内部噪声和包含有外部噪声的语音信号，然后提取内部噪声对应的内部信号特征，接着根据内部信号特征，并结合预置的映射公式获取与外部噪声相对应的外部近似特征，再接着通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值，最后将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理，获取噪声抑制后的去噪语音信号；

主语音采集机构52，用于采集包含有内部噪声的语音信号，主语音采集机构52，还用于采集未输入语音信号时的外部噪声，使得噪声抑制装置53对未输入语音信号时，对内部噪声和外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练，以确定映射公式。

其中，内部信号特征为功率谱帧序列，外部近似特征为功率谱形式的帧序列。

进一步地，参考语音采集机构51和主语音采集机构52可以是麦克风，此处具体不做限定。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种噪声抑制方法，其特征在于，包括：

S1：当语音信号输入时，噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号；

2.根据权利要求1所述的噪声抑制方法，其特征在于，步骤S1之前还包括：

3.根据权利要求2所述的噪声抑制方法，其特征在于，所述预置自编码神经网络结构的训练步骤具体包括：

4.根据权利要求1至3中任意一项所述的噪声抑制方法，其特征在于，步骤S5具体包括：

5.根据权利要求2或3所述的噪声抑制方法，其特征在于，所述预置自编码神经网络结构为5层结构，第一层和第五层为输入输出层，第二层、第三层和第四层为隐含层。

6.一种噪声抑制装置，其特征在于，包括：

7.根据权利要求6所述的噪声抑制装置，其特征在于，所述的噪声抑制装置还包括：

8.根据权利要求6或7所述的噪声抑制装置，其特征在于，所述训练单元具体包括：

变换子单元，用于对未输入所述语音信号时，对所述内部噪声和所述外部噪声组成的噪声信号样本进行每一个预置帧的傅里叶变换，获取对应的样本帧的特征和样本角度信息，所述样本帧的特征为功率谱形式；

9.一种噪声抑制系统，其特征在于，包括：

参考语音采集机构、主语音采集机构，以及如权利要求6至8中任意一项所述的噪声抑制装置；

其中，所述参考语音采集机构，用于采集内部噪声信号；

10.根据权利要求9所述的噪声抑制系统，其特征在于，