CN107301869B

CN107301869B - 麦克风阵列拾音方法、处理器及其存储介质

Info

Publication number: CN107301869B
Application number: CN201710704441.3A
Authority: CN
Inventors: 荣赶丁
Original assignee: Allwinner Technology Co Ltd
Current assignee: Allwinner Technology Co Ltd
Priority date: 2017-08-17
Filing date: 2017-08-17
Publication date: 2021-01-29
Anticipated expiration: 2037-08-17
Also published as: CN107301869A

Abstract

本发明提供一种用于远距离语音识别的麦克风阵列拾音方法，该方法对麦克风阵列中接收到的目标语音依次进行时延补偿、增益补偿、波束成形、后置滤波以及增益控制处理；时延补偿处理，保证麦克风阵列接收目标语音时刻一致，增益补偿处理，减少因各麦克风不一致而导致的信号幅度差异；波束成形处理，消除目标语音信号中的相干噪声；后置滤波处理，消除目标语音信号中的扩散噪声；增益控制处理，将远距离录音音量较小的部分放大，便于识别引擎进行识别；本发明提供的拾音方法能显着提高语音信号的识别率；本发明还提供能够执行上述拾音方法的处理器及其存储介质。

Description

麦克风阵列拾音方法、处理器及其存储介质

技术领域

本发明涉及音频信号处理技术领域，尤其是涉及一种用于远距离语音识别的麦克风阵列拾音方法、处理器及其存储介质。

背景技术

随着语音识别技术日益成熟，其应用越来越广泛，现有语音识别技术在近距离时表现优异，然而当语音距离变远时，语音识别率急剧下降，使得语音识别难以达到实用效果。

为了解决远距离语音识别率下降的问题，在现有技术中经常使用麦克风阵列，即采用一定的波束形成和自适应滤波方法来消除噪声，但是一般的波束成形方法进行噪声消除的效果并不理想，并且在实际使用的过程中，由于不同麦克风的特性的差异、麦克风摆放位置的偏差以及目标语音方向不准确等问题导致处理噪声效果的效果进一步的降低。

发明内容

本发明的主要第一目的是提供一种有效增强噪声消除能力的用于远距离语音识别的麦克风阵列拾音方法

本发明的主要第二目的是提供一种有效增强噪声消除能力的用于远距离语音识别的处理器

本发明的主要第三目的是提供一种有效增强噪声消除能力的用于远距离语音识别的处理器中的存储介质。

为实现上述的主要目的，本发明提供的用于远距离语音识别的麦克风阵列拾音方法，包括：

通过至少两个麦克风分别接收两个目标语音信号；

对两个目标语音信号进行时延补偿处理；

对时延补偿处理后的两个目标语音信号进行增益补偿处理；

对增益补偿处理后的两个目标语音信号进行波束成形处理，得到第一语音成分信号和噪声成分信号；

根据噪声成分信号对第一语音成分信号进行后置滤波处理，得到第二语音成分信号；

对第二语音成分信号进行增益控制处理，得到第三语音信号，

波束成形处理包括：

根据两个目标语音信号求平均并得到增强目标语音信号；

根据两个目标语音信号求差并得到减弱目标语音信号；

根据增强目标语音信号对减弱目标语音信号进行自适应阻塞对角矩阵算法处理，并得到噪声成分信号；

根据减弱目标语音信号对增强目标语音信号进行串换自适应噪声消除处理，并得到第一语音成分信号。

由此可见，对麦克风阵列中接收到的目标语音依次进行时延补偿、增益补偿、波束成形、后置滤波以及增益控制处理，将麦克风接收的语音信号进行规整并且去除语音信号中的噪声，通过增强波束成形处理的中的自适应阻塞处理进行目标语音中的噪声语音成分的提取以及串换自适应噪声消除处理中提取目标语音中的语音成分信号，同时利用后置滤波将语音成分信号中的噪声语音成分消除，增强噪声消除能力，显著提高语音识别装置的识别率，从而实现对远距离的语音信号的准确识别。

进一步的方案是，自适应阻塞对角矩阵算法处理包括：

取连续两帧的增强目标语音信号以对角矩阵的形式进行短时傅里叶变换，得到增强目标语音频域信号；

将增强目标语音频域信号与频域滤波系数相乘并得到滤波后的增强目标语音频域信号；

将与增强目标语音信号相同帧的减弱目标语音信号减去反傅里叶变换后的滤波后的增强目标语音频域信号，得出噪声成分信号；

根据滤波后的增强目标语音频域信号和噪声成分信号更新频域滤波系数。

进一步的方案是，串换自适应噪声消除处理包括：

根据第一语音成分信号，分别设定第一滤波系数与第二滤波系数的初始值；

取连续两帧的第一语音成分信号以对角矩阵的形式进行傅里叶变换，得到第一语音成分频域信号；

将与第一语音成分信号相同帧的噪声成分信号减去反傅里叶变换后的与第二滤波系数相乘后的第一语音成分频域信号，得出噪声成分减弱信号；

根据与第二滤波系数相乘后的第一语音成分频域信号和噪声成分减弱信号更新第二滤波系数；

取连续两帧的噪声成分减弱信号以对角矩阵的形式进行傅里叶变换，得到噪声成分减弱频域信号；

将与噪声成分减弱信号相同帧的增强目标语音信号减去反傅里叶变换后的与第一滤波系数相乘后的噪声成分减弱频域信号，得出第一语音成分信号；

根据第一语音成分频域信号和噪声成分减弱信号更新第一滤波系数。

进一步的方案是，后置滤波处理包括：

平滑处理经傅里叶变换后的某一帧的第一语音成分信号与噪声成分信号，得到第一语音成分频域信号与噪声成分频域信号；

通过IMCRA方法分别估计第一语音成分频域信号与噪声成分频域信号的拟平稳噪声能量的大小；

根据第一语音成分频域信号、噪声成分频域信号以及拟平稳噪声能量的大小，计算语音信号不存在概率变量；

比较语音信号不存在概率变量的值与预设值的大小，得到语音信号不存在概率；

根据第一语音成分频域信号的绝对值的平方除以噪声估计值得到后验信噪比；

根据后验信噪比与前一帧的增益系数计算得到先验信噪比，其中增益系数根据后验信噪比与先验信噪比得到；

根据先验信噪比的与后验信噪比的乘积得到噪声衰减因子；

根据噪声衰减因子、后验信噪比与语音信号不存在概率计算得到语音信号存在概率；

根据语音信号存在概率与第一语音成分频域信号更新噪声估计值；

根据第一语音成分频域信号与增益系数相乘并傅里叶后得到第二语音成分信号。

进一步的方案是，时延补偿处理包括：

选择其一目标语音信号作为参考目标语音信号；

根据参考目标语音信号与其他目标语音信号的间距、目标语音信号相对参考目标语音信号的方向以及声音传播速度计算其一目标语音信号相对于参考目标语音信号的延时；

根据延时与采样率，对其他目标语音信号进行样条插值处理得到时延补偿后的目标语音信号。

进一步的方案是，增益补偿处理包括：

根据Bark频率尺度进行重分组短时傅里叶变换后的时延补偿后的目标语音信号得到目标语音信号的频域数据；

计算重分组后的频域数据的每一组的平均能量以其对应组的平均能量；

平方每一组频域数据的平均能量与其对应组的平均能量的比值得到增益补偿因子；

反傅里叶增益补偿因子与对应组的频域数据的乘积得到增益补偿后的目标语音信号。

进一步的方案是，增益控制处理包括：

将第二语音成分信号线性放大；

将经线性放大后的第二语音成分信号进行动态范围控制处理，得到第三语音成分信号。

本发明提供的处理器，用于终端，包括处理器和存储介质，处理器用于执行存储介质内的程序时实现上述方法的步骤。

本发明提供的存储介质内存储有程序，程序被执行时实现上述方法的步骤。

附图说明

图1是本发明麦克风阵列拾音方法实施例的简易流程图。

图2是本发明麦克风阵列拾音方法实施例的流程图。

图3是本发明麦克风阵列拾音方法实施例中的时延补偿的流程图。

图4是本发明麦克风阵列拾音方法实施例中的增益补偿的流程图。

图5是本发明麦克风阵列拾音方法实施例中的波束成形处理的流程图。

图6是本发明麦克风阵列拾音方法实施例中的波束成形处理中的自适应阻塞对角矩阵算法处理的流程图。

图7是本发明麦克风阵列拾音方法实施例中的波束成形处理中的串换自适应噪声消除的流程图。

图8是本发明麦克风阵列拾音方法实施例中的波束成形处理的流程示意图。

图9是本发明麦克风阵列拾音方法实施例中的后置滤波处理的流程图。

图10是本发明麦克风阵列拾音方法实施例中的增益控制处理的流程图。

以下结合附图及实施例对本发明作进一步说明。

具体实施方式

本发明的用于远距离语音识别的麦克风阵列拾音方法对麦克风阵列中接收到的目标语音依次进行时延补偿、增益补偿、波束成形、后置滤波以及增益控制处理，通过增强波束成形处理的使用稳定性，同时增强噪声消除能力，显著提高语音识别装置的识别率，从而实现对远距离的语音信号的准确识别。

本发明的用于远距离语音识别的麦克风阵列拾音方法在本实施例中以两个麦克风组成的阵列进行说明，对于多个麦克风组成的麦克风阵列和其他采样率信号，同时适合本发明提供的拾音方法。

参见图1、图2，本发明提供的用于远距离语音识别的麦克风阵列拾音方法包括以下步骤：

S1、通过两个麦克风分别接收两个目标语音信号；

S2、对两个目标语音信号进行时延补偿处理；

S3、时延补偿处理后的两个目标语音信号进行增益补偿处理；

S4、对增益补偿处理后的两个目标语音信号进行波束成形处理，得到第一语音成分信号和噪声成分信号，其中波束成形处理包括：

S41、根据两个目标语音信号求平均并得到增强目标语音信号，

S42、根据两个目标语音信号求差并得到减弱目标语音信号，

S43、根据增强目标语音信号对减弱目标语音信号进行自适应阻塞对角矩阵算法处理，并得到噪声成分信号，

S44、根据减弱目标语音信号对增强目标语音信号进行串换自适应噪声消除处理，并得到第一语音成分信号；

S5、根据噪声成分信号对第一语音成分信号进行后置滤波处理，得到第二语音成分信号；

S6、对第二语音成分信号进行增益控制处理，得到第三语音信号；

利用以上步骤，对麦克风阵列中接收到的目标语音依次进行时延补偿、增益补偿、波束成形、后置滤波以及增益控制处理，增强波束成形处理的使用稳定性，同时增强噪声消除能力，从而显著提高语音识别装置的识别率。

参见图3，时延补偿处理包括以下步骤：

S21、选择其一目标语音信号作为参考目标语音信号；

S22、根据参考目标语音信号与其他目标语音信号的间距、目标语音信号相对参考目标语音信号的方向以及声音传播速度计算其一目标语音信号相对于参考目标语音信号的延时；

S23、根据延时与采样率，对其他目标语音信号进行样条插值处理得到时延补偿后的目标语音信号。

选定其中一个麦克风为参考，根据两个麦克风之间的间距、目标语音的方向以及声音传播的速度，计算另一个麦克风相对与参考麦克风的延迟时间，根据延时时间对另一麦克风进行时延补偿。根据延时大小和采样率，利用三次样条插值方法处理另一麦克风的信号，使得两个麦克风在同一时刻拾取到一致的目标语音。

参见图4，对时延补偿处理后的目标语音信号进行增益补偿处理，可减少两个麦克风对目标语音幅度相应的差异，得到幅度相应较为一致的双通道信号，其中增益补偿处理包括以下步骤：

S31、根据Bark频率尺度进行重分组短时傅里叶变换后的时延补偿后的目标语音信号得到目标语音信号的频域数据；

S32、计算重分组后的频域数据的每一组的平均能量以其对应组的平均能量；

S33、平方每一组频域数据的平均能量与其对应组的平均能量的比值得到增益补偿因子；

S34、反傅里叶增益补偿因子与对应组的频域数据的乘积得到增益补偿后的目标语音信号。

其中在S31中，将经过时延补偿后的目标语音信号分别按照帧长256，利用50％重叠保留的方法进行512点短时傅里叶变换到频域，得到目标语音的频域数据，其中按照Bark频率尺度重分组民目标语音信号的频域数据，可减少在处理过程中用于语音识别的频谱特性的损失。对应组为目标语音信号中的一个通道信号的一组频域数据序号相同的另一通道信号的一组频域数据。

参见图5、图8，波束成形处理包括以下步骤：

S41、根据两个目标语音信号求平均并得到增强目标语音信号y＝(s1+s2)/2；

S42、根据两个目标语音信号求差并得到减弱目标语音信号x＝(s₂－s₁)；

S43、根据增强目标语音信号y对减弱目标语音信号x进行自适应阻塞对角矩阵算法处理，并得到噪声成分信号u；

S44、根据减弱目标语音信号x对增强目标语音信号y进行串换自适应噪声消除处理，并得到第一语音成分信号e₁。

通过稳健的波束成形处理将增益补偿处理后的目标语音信号降低其中的噪声，使得在麦克风阵列中存在的麦克风位置、目标语音方向的偏差的情况下，可以得到一致的第一语音成分信号e₁。

参见图6，其中S43中的自适应阻塞对角矩阵算法处理具体实现以下步骤：

S431、假定每次处理的增强目标语音信号y的帧长为L(对16000采样率的信号可取L为256)，取连续两帧的增强目标语音信号以对角矩阵的形式进行短时傅里叶变换，得到增强目标语音频域信号：

Y_f(k)＝diag{FFT(y_f(kL-L),...,y_f(kL),...,y_f(kL+L-1))^T}

S432、将增强目标语音频域信号与频域滤波系数相乘并得到滤波后的增强目标语音频域信号：

Y_b(k)＝Y_f(k)H(k)

其中频域滤波系数初始值H(0)设为0。

S433、假定第k帧目标语音的减弱目标语音信号为x(kL)，…，x(kL+L－1)，取x(k)＝(0_1×L,x(kL),...,x(kL+L-1))^T。对上述滤波后的增强目标语音频域信号Y_b(k)做反傅里叶变换后取其中L个点，且将前L个点设为0，将所得的增强目标语音信号y与增强目标语音信号y相同帧的x(k)相减得到时域信号e_b(k)：

e_b(k)＝x(k)-diag{(0_1×L,1_1×L)}·IFFT(Y_b(k))

其中e_b(k)向量的后L个点为噪声成分信号u。

S434、根据滤波后的增强目标语音频域信号Y_b和噪声成分信号u更新频域滤波系数，方法如下：

E_b(k)＝FFT(e_b(k))

P_l(k)＝λP_l(k)+(1-λ)|Y_f,l(k)|²,l＝0,...,2L-1

其中λ可取0.9，μ可取0.008。

参见图7，S44中的串换自适应噪声消除处理的具体实现步骤如下：

S441、根据第一语音成分信号，分别设定第一滤波系数W₁与第二滤波系数W₂的初始值：

W1(0)＝[0,...,0]^T,GradE₁old(0)＝[0,...,0]^T，e₁(0)＝[0_L]

W2(0)＝[0,...,0]^T,GradE₂old(0)＝[0,...,0]^T

G(0)＝[0,...,0]^T,P₁(0)＝P₂(0)＝delta,

其中delta是一个较小的正常数值，delta可取0.0001。

S442、取连续两帧的第一语音成分信号以对角矩阵的形式进行傅里叶变换，得到第一语音成分频域信号：

X₂(k)＝diag{FFT(e₁(kL-L),...,e₁(kL),...,e₁(kL+L-1))^T}

S443、将与第一语音成分信号相同帧的噪声成分信号e_b(k)减去反傅里叶变换后的与第二滤波系数W₂(k)相乘后的第一语音成分频域信号X₂(k)，在反傅里叶变换中取其中后L个点作为有效点，将前L个点设为0，得出噪声成分减弱信号e₂：

e₂(k)＝e_b(k)-K·IFFT(X₂(k)W2(k))

S444、根据与第二滤波系数相乘后的第一语音成分频域信号和噪声成分减弱信号更新第二滤波系数，方法如下：

E₂(k)＝FFT(K^Te₂(k))

P₂(k)＝λP₂(k-1)+(1-λ)|Xr(k)|²

G(k)＝W1(k)W2(k)

W2(k+1)＝W2(k)+2μ₁GradE₂old(k)

S445、取连续两帧的噪声成分减弱信号以对角矩阵的形式进行傅里叶变换，得到噪声成分减弱频域信号：

X₁(k)＝diag{FFT(e₂(kL-L),...,e₂(kL),...,e₂(kL+L-1))^T}

S446、将与噪声成分减弱信号相同帧的增强目标语音信号减去反傅里叶变换后的与第一滤波系数W₁相乘后的噪声成分减弱频域信号，反傅里叶变换中取其中后L个点作为有效点，得出第一语音成分信号e₁：

e₁(k)＝y_f(k)-前L个点{K·IFFT(X₁(k)W1(k))}

S447、根据噪声成分减弱频域信号和第一语音成分信号更新第一滤波系数，方法如下：

E₁(k)＝FFT(K^T[0_L e₁(k)])

P₁(k)＝λ₁P₁(k-1)+(1-λ₁)|X₁(k)|²

W1(k+1)＝W1(k)+2μ₁GradE₁old(k)

其中步骤S444与步骤S447中的λ₁可取0.77，μ₁可取0.001。

参见图9，S5中的后置滤波处理包括以下步骤：

S51、平滑处理经傅里叶变换后的某一帧的第一语音成分信号与噪声成分信号，得到第一语音成分频域信号与噪声成分频域信号，其中以帧长256和50％重叠进行傅里叶变换；

S52、通过IMCRA方法分别估计第一语音成分频域信号与噪声成分频域信号的拟平稳噪声能量的大小，分别为ME(k，l)和MU(k，l)；

S53、根据第一语音成分频域信号、噪声成分频域信号以及拟平稳噪声能量的大小，计算语音信号不存在概率变量：

S54、比较语音信号不存在概率变量的值与预设值的大小，得到语音信号不存在概率q(k，l)，方法如下：

其中∧₀＝1.67，∧₁＝1.81，γ_low＝1，γ_high＝4.6，Ω_low＝1，Ω_high＝3。

S55、根据第一语音成分频域信号的绝对值的平方除以噪声估计值得到后验信噪比ω；

S56、根据后验信噪比与前一帧的增益系数计算得到先验信噪比，其中增益系数根据后验信噪比与先验信噪比得到；

S57、根据先验信噪比的与后验信噪比的乘积得到噪声衰减因子ν；

S58、根据噪声衰减因子、后验信噪比与语音信号不存在概率计算得到语音信号存在概率p(k，l)：

其中G_H1(0,l)＝1,λ_d(0,l)＝|E(0,l)|²,ω(0,l)＝1

S59、根据语音信号存在概率与第一语音成分频域信号更新噪声估计值λ：

α_d＝α_d0+(1-α_d0)p(k,l)

λ_d(k+1,l)＝α_dλ_d(k,l)+β(1-α_d)|E(k,l)|²

其中α_d0＝0.85,β＝1.47

S510、根据第一语音成分频域信号与增益系数G相乘并傅里叶后得到第二语音成分信号e₃。

参见图10，S6中的增益控制处理包括以下步骤：

S61、将所述第二语音成分信号线性放大；

S62、将经线性放大后的第二语音成分信号进行动态范围控制处理(即DRC处理)，得到第三语音成分信号e₄。

在步骤S62中DRC处理种设定噪声门限为－50dB，拉伸门限设为－42dB，压缩门限设为－32dB，限制门限－15dB，最大增益设为9dB，最小增益设为－2dB。

通过自动增益控制将远距离接收的语音信号中的音量较小的部分放大便于识别引擎进行识别。

本发明的处理器，用于终端，处理器内包括处理器和存储介质，处理器用于执行存储介质内的程序时实现上述拾音方法的步骤。

本发明的存储介质，存储介质内存储有程序，程序被执行时实现上述拾音方法的步骤。

最后需要强调的是，本发明不限于上述实施方式，以上所述仅为发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神与原则之内所做的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.用于远距离语音识别的麦克风阵列拾音方法，其特征在于，包括：

通过至少两个麦克风分别接收两个目标语音信号；

对两个所述目标语音信号进行时延补偿处理；

对所述时延补偿处理后的两个所述目标语音信号进行增益补偿处理；

对所述增益补偿处理后的两个所述目标语音信号进行波束成形处理，得到第一语音成分信号和噪声成分信号；

根据所述噪声成分信号对所述第一语音成分信号进行后置滤波处理，得到第二语音成分信号；

对所述第二语音成分信号进行增益控制处理，得到第三语音信号，

所述波束成形处理包括：

根据两个所述目标语音信号求平均并得到增强目标语音信号；

根据两个所述目标语音信号求差并得到减弱目标语音信号；

根据所述增强目标语音信号对所述减弱目标语音信号进行自适应阻塞对角矩阵算法处理，并得到所述噪声成分信号；

根据所述减弱目标语音信号对所述增强目标语音信号进行串换自适应噪声消除处理，并得到所述第一语音成分信号。

2.根据权利要求1所述的拾音方法，其特征在于：

所述自适应阻塞对角矩阵算法处理包括：

取连续两帧的所述增强目标语音信号以对角矩阵的形式进行短时傅里叶变换，得到增强目标语音频域信号；

将所述增强目标语音频域信号与频域滤波系数相乘并得到滤波后的所述增强目标语音频域信号；

将与所述增强目标语音信号相同帧的所述减弱目标语音信号减去反傅里叶变换后的滤波后的所述增强目标语音频域信号，得出所述噪声成分信号；

根据滤波后的所述增强目标语音频域信号和所述噪声成分信号更新所述频域滤波系数。

3.根据权利要求2所述的拾音方法，其特征在于：

所述串换自适应噪声消除处理包括：

根据所述第一语音成分信号，分别设定第一滤波系数与第二滤波系数的初始值；

取连续两帧的所述第一语音成分信号以对角矩阵的形式进行傅里叶变换，得到第一语音成分频域信号；

将与所述第一语音成分信号相同帧的所述噪声成分信号减去反傅里叶变换后的与所述第二滤波系数相乘后的所述第一语音成分频域信号，得出噪声成分减弱信号；

根据与所述第二滤波系数相乘后的所述第一语音成分频域信号和所述噪声成分减弱信号更新所述第二滤波系数；

取连续两帧的所述噪声成分减弱信号以对角矩阵的形式进行傅里叶变换，得到噪声成分减弱频域信号；

将与所述噪声成分减弱信号相同帧的所述增强目标语音信号减去反傅里叶变换后的与所述第一滤波系数相乘后的所述噪声成分减弱频域信号，得出所述第一语音成分信号；

根据所述第一语音成分频域信号和所述噪声成分减弱信号更新所述第一滤波系数。

4.根据权利要求1所述的拾音方法，其特征在于：

所述后置滤波处理包括：

平滑处理经傅里叶变换后的某一帧的所述第一语音成分信号与所述噪声成分信号，得到第一语音成分频域信号与噪声成分频域信号；

通过IMCRA方法分别估计所述第一语音成分频域信号与所述噪声成分频域信号的拟平稳噪声能量的大小；

根据所述第一语音成分频域信号、所述噪声成分频域信号以及所述拟平稳噪声能量的大小，计算语音信号不存在概率变量；

根据所述第一语音成分频域信号的绝对值的平方除以噪声估计值得到后验信噪比；

根据所述后验信噪比与前一帧的增益系数计算得到先验信噪比，其中所述增益系数根据所述后验信噪比与所述先验信噪比得到；

根据所述先验信噪比的与所述后验信噪比的乘积得到噪声衰减因子；

根据所述噪声衰减因子、所述后验信噪比与所述语音信号不存在概率计算得到所述语音信号存在概率；

根据所述语音信号存在概率与所述第一语音成分频域信号更新所述噪声估计值；

根据所述第一语音成分频域信号与所述增益系数相乘并傅里叶后得到所述第二语音成分信号。

5.根据权利要求1所述的拾音方法，其特征在于：

所述时延补偿处理包括：

选择其一所述目标语音信号作为参考目标语音信号；

根据所述参考目标语音信号与其他所述目标语音信号的间距、所述目标语音信号相对所述参考目标语音信号的方向以及声音传播速度计算其一所述目标语音信号相对于所述参考目标语音信号的延时；

根据所述延时与采样率，对其他所述目标语音信号进行样条插值处理得到时延补偿后的目标语音信号。

6.根据权利要求1所述的拾音方法，其特征在于：所述增益补偿处理包括：

根据Bark频率尺度进行重分组短时傅里叶变换后的时延补偿后的所述目标语音信号得到所述目标语音信号的频域数据；

平方每一组所述频域数据的平均能量与其对应组的平均能量的比值，得到增益补偿因子；

反傅里叶所述增益补偿因子与所述对应组的所述频域数据的乘积得到增益补偿后的目标语音信号。

7.根据权利要求1所述的拾音方法，其特征在于：所述增益控制处理包括：

将所述第二语音成分信号线性放大；

将经线性放大后的所述第二语音成分信号进行动态范围控制处理，得到所述第三语音成分信号。

8.处理器，用于终端，其特征在于：

包括处理器和存储介质，所述处理器用于执行所述存储介质内的程序时实现如权利要求1－7中任意一项所述方法的步骤。

9.存储介质，所述存储介质存储有程序，其特征在于：

所述程序被执行时实现如权利要求1－7任意一项所述方法的步骤。