CN101976565A - 基于双麦克风语音增强装置及方法 - Google Patents

基于双麦克风语音增强装置及方法 Download PDF

Info

Publication number
CN101976565A
CN101976565A CN2010102242933A CN201010224293A CN101976565A CN 101976565 A CN101976565 A CN 101976565A CN 2010102242933 A CN2010102242933 A CN 2010102242933A CN 201010224293 A CN201010224293 A CN 201010224293A CN 101976565 A CN101976565 A CN 101976565A
Authority
CN
China
Prior art keywords
signal
noise
microphone
frequency band
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102242933A
Other languages
English (en)
Inventor
叶利剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AAC Technologies Holdings Shenzhen Co Ltd
AAC Optoelectronic Changzhou Co Ltd
Original Assignee
AAC Acoustic Technologies Shenzhen Co Ltd
AAC Optoelectronic Changzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AAC Acoustic Technologies Shenzhen Co Ltd, AAC Optoelectronic Changzhou Co Ltd filed Critical AAC Acoustic Technologies Shenzhen Co Ltd
Priority to CN2010102242933A priority Critical patent/CN101976565A/zh
Publication of CN101976565A publication Critical patent/CN101976565A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及一种基于双麦克风语音增强装置及方法,该装置包括麦克风阵列模块,包括第一麦克风和第二麦克风,用于接收时域带噪语音信号,并将接收的时域带噪语音信号输出,第一麦克风和第二麦克风接收到时域带噪语音信号分别为x1,x2;固定波束形成器,用于接收所述麦克风阵列模块输出的时域带噪语音信号,并将接收到时域带噪语音信号的语音部分进行叠加,加大该时域带噪语音信号,形成初步加强的语音信号,然后输出。该装置及方法去噪效果良好。

Description

基于双麦克风语音增强装置及方法
技术领域
本发明涉及一种基于双麦克风语音增强装置及方法。
背景技术
随着无线通讯的发展,全球移动电话用户越来越多,用户对移动电话的要求已不仅满足于通话,而且要能够提供高质量的通话效果,尤其是目前移动多媒体技术的发展,移动电话的通话质量更显重要。
由于大量环境噪声的存在,手机等通讯设备的麦克风采集到的语音信号普遍信噪比不够高,特别是在街道汽车等高噪声环境中,需要提高音量才能使对方听清。所以需要通过语音增强的方法来提升输入语音的信噪比,改善通讯质量。然而传统的单通道语音增强方法降噪效果有限,并且会对语音造成较大失真。使用双麦克风阵列,可以引入语音与噪声信号的相位信息,提高噪声抑制的效果并减小语音的失真。
发明内容
本发明需解决的技术问题是提供一种去噪效果良好的基于双麦克风语音增强装置及方法。
根据上述需解决的技术问题,本发明提供了一种基于双麦克风语音增强装置,该装置包括
麦克风阵列模块,包括第一麦克风和第二麦克风,用于接收时域带噪语音信号,并将接收的时域带噪语音信号输出,第一麦克风和第二麦克风接收到时域带噪语音信号分别为x1,x2;
固定波束形成器,用于接收所述麦克风阵列模块输出的时域带噪语音信号,并将接收到时域带噪语音信号的语音部分进行叠加,加大该时域带噪语音信号,形成初步加强的语音信号,然后输出;
阻塞矩阵模块,用于接收所述麦克风阵列模块输出的时域带噪语音信号,将接收到的上述时域带噪语音信号中的语音部分进行抑制,获得参考噪声信号,然后输出;
自适应滤波器,用于接收固定波束形成器输出的初步加强的语音信号和阻塞矩阵模块输出的参考噪声信号,并进行第一次降噪处理后输出得到初步降噪的信号;
语音增强处理模块,用于接收自适应滤波器输出的初步降噪的信号并将该初步降噪的信号进行语音增强处理,得到进一步加强的语音信号,然后输出;
输出模块,用于接收语音增强处理模块输出的进一步加强的语音信号并输出。
优选的,所述阻塞矩阵模块满足
Figure BSA00000186542100021
这里取B=[1-1],将麦克风阵列模块输出的时域带噪语音信号通过阻塞矩阵B,得到参考噪声信号Ns=x1-x2,其中,B代表阻塞矩阵,Ns代表参考噪声信号。
优选的,第一麦克风和第二麦克风是全指向麦克风。
本发明还提供了一种基于双麦克风语音增强方法,其特征在于该方法包括如下步骤:
步骤S001:由麦克风阵列模块中的第一麦克风和第二麦克风分别接收外界的时域带噪语音信号x1、x2,并将所述接收到的时域带噪语音信号分别传送给固定波束形成器和阻塞矩阵模块,由固定波束形成器将得到的第一麦克风和第二麦克风分别接收的时域带噪语音信号进行放大,得到初步加强的信号yf,由阻塞矩阵模块得到参考噪声信号Ns;
步骤S002:将由固定波束形成器得到初步加强的信号yf和由阻塞矩阵模块得到参考噪声信号Ns输入至自适应滤波器,经自适应滤波器的处理得到初步降噪的信号y;
步骤S003:由语音增强处理模块接收自适应滤波器输出的初步降噪的信号,并对所述初步降噪的信号分为m帧、进行预加重处理,短时傅里叶变换成频域信号Y,并对将频域信号划分为若干频带k,计算各个频带的能量YE(m,k),其中m表示帧数,k为频带数;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比SNRpost(m,k),并由前一帧的先验信噪比估计值
Figure BSA00000186542100032
得到当前帧的先验信噪比估计值
Figure BSA00000186542100033
采用计权噪声估计法对当前帧的先验信噪比进行修正,得到修正先验信噪比估计值
Figure BSA00000186542100041
根据得到的修正先验信噪比估计值
Figure BSA00000186542100042
计算各个频带的衰减增益系数q(m,k);
采用门限判决对所述衰减增益系数进行调整;
用得到的调整后的衰减增益系数q′(m,k),对初步降噪后信号Y(m,k)的频谱进行处理;
由修正的先验信噪比估计值
Figure BSA00000186542100043
对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值V(m,k)进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值:V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
将经上述过程处理后的频域信号变换成时域信号,对该时域信号进行去加重处理,并输出;
步骤S004:将上述经去加重处理的时域信号输出。
优选的,步骤S001中,由固定波束形成器对第一麦克风和第二麦克风分别接收外界的时域带噪语音信号分别经过延时补偿,之后作加权相加得到初步加强的信号,由阻塞矩阵模块将经过延时补偿的第一麦克风和第二麦克风分别接收外界的时域带噪语音信号通过阻塞矩阵相加参考噪声信号。
优选的,步骤S003中,短时傅里叶变换成频域信号,并对将频域信号划分为若干频带,计算各个频带的能量;
语音增强处理模块对所述初步降噪的信号y进行分帧后的信号为y(m),m表示帧数,经过一个高通滤波器,作为预加重处理,高通滤波器其形式如下:
H(z)=1-αz-1
其中常数α=0.9325,
短时傅里叶变换如下
X ( f , m ) = 2 M Σ n = 0 M - 1 win ( n - m ) × x ( m ) e - 2 πjf n M 0≤k1≤M-1
其中,M为短时傅利叶变换的计算长度,m表示第m帧信号,f表示频率值,X表示频域信号,x表示时域信号;
汉明窗函数定义如下:
win(n)={
0.54-0.46cos(2*π*n/M)      0≤n≤M-1
0                             其余n
}
采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|X(m,k)|2           0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)           0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比
Figure BSA00000186542100062
并由前一帧的先验信噪比估计值
Figure BSA00000186542100063
得到当前帧的先验信噪比估计值;
S N ^ R prior ( m , k ) = α | S ^ ( m - 1 , k ) | 2 E { | N ( k ) | 2 } + ( 1 - α ) max [ 0 , SN R post ( m , k ) - 1 ]
Figure BSA00000186542100065
表示前一帧最后得到的降噪后语音信号,E{|V(m,k)|2}表示噪声能量估计值,,α为第一平滑系数;
采用计权噪声估计法对先验信噪比估计值进行修正;
先验信噪比估计值
Figure BSA00000186542100066
乘以计权因子去qθ,得到正先验信噪比估计值
Figure BSA00000186542100067
计权因子计算如下
q &theta; = 1 S N ^ R prior ( m , k ) < &gamma; 1 1 &gamma; 1 - &gamma; 2 ( S N ^ R prior ( m , k ) - &gamma; 2 ) &gamma; 1 < S N ^ R prior ( m , k ) < &theta; z 0 S N ^ R prior ( m , k ) > &theta; z
其中γ1取1.5左右,γ2取200,θz取20;
根据得到的修正先验信噪比估计值
Figure BSA00000186542100072
计算各个频带的衰减增益q(m,k);
其具体方法为
q ( m , k ) = { 1 - a - 0.5 &CenterDot; lg [ S N ^ R prior ( m , k ) ] SN R post
其中,对于不同频带,a为不同的常数;
采用门限判决对所述衰减增益进行调整;
首先以当前帧先验信噪比为判断,小于某一阈值频带的增益系数均乘以某一调整值qmod,这样做可以进一步抑制噪声,
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真;
方法如下:
其中qmod=0.1,θG=1.2,qfloor=0.01
将当前帧的各频带的带噪语音信号Y(m,k),乘以前面得到的相应频带的衰减增益,得到的就是该频带的增强后的语音信号
S ^ ( m , k ) = q ( m , k ) * Y ( m , k ) 0≤k≤N-1
由修正的先验信噪比估计值
Figure BSA00000186542100083
对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
V(m,k)=μV(m-1,k)+(1-μ)E(m,k)
μ表示第二平滑系数。
将经上述过程处理后的频域信号用前面所述短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+αz-1进行去加重处理,并输出。
本发明采用双麦克风阵列,采用波束形成初步抑制非相关噪声,并通过从语音增强算法,进一步衰减各类型的背景噪声。大大提高了对噪声的衰减,保证了语音可懂度。
附图说明
图1是本发明提供的基于双麦克风的语音增强方法的流程示意图;
图2是本发明提供的基于双麦克风语音增强装置的结构框图;
图3是非线性计权曲线。
具体实施方式
下面结合附图和实施方式对本发明作进一步说明。
参见图1-3,本发明提供的基于双麦克风语音增强装置,该装置包括
麦克风阵列模块,包括第一麦克风和第二麦克风,用于接收时域带噪语音信号,并将接收的时域带噪语音信号输出,第一麦克风和第二麦克风接收到时域带噪语音信号分别为x1,x2;
固定波束形成器,用于接收所述麦克风阵列模块输出的时域带噪语音信号,并将接收到时域带噪语音信号的语音部分进行叠加,加大该时域带噪语音信号,形成初步加强的语音信号,然后输出;
阻塞矩阵模块,用于接收所述麦克风阵列模块输出的时域带噪语音信号,将接收到的上述时域带噪语音信号中的语音部分进行抑制,获得参考噪声信号,然后输出;
自适应滤波器,用于接收固定波束形成器输出的初步加强的语音信号和阻塞矩阵模块输出的参考噪声信号,并进行第一次降噪处理后输出得到初步降噪的信号;
语音增强处理模块,用于接收自适应滤波器输出的初步降噪的信号并将该初步降噪的信号进行语音增强处理,得到进一步加强的语音信号,然后输出;
输出模块,用于接收语音增强处理模块输出的进一步加强的语音信号并输出。
所述阻塞矩阵模块满足
Figure BSA00000186542100101
这里取B=[1-1],将麦克风阵列模块输出的时域带噪语音信号通过阻塞矩阵B,得到参考噪声信号Ns=x1-x2,其中,B代表阻塞矩阵,Ns代表参考噪声信号。
第一麦克风和第二麦克风是全指向麦克风。
本发明提供的基于双麦克风语音增强方法,该方法包括如下步骤:
步骤S001:由麦克风阵列模块中的第一麦克风和第二麦克风分别接收外界的时域带噪语音信号x1、x2,并将所述接收到的时域带噪语音信号分别传送给固定波束形成器和阻塞矩阵模块,由固定波束形成器将得到的第一麦克风和第二麦克风分别接收的时域带噪语音信号进行放大,得到初步加强的信号yf,由阻塞矩阵模块得到参考噪声信号Ns;
步骤S002:将由固定波束形成器得到初步加强的信号yf和由阻塞矩阵模块得到参考噪声信号Ns输入至自适应滤波器,经自适应滤波器的处理得到初步降噪的信号y;
步骤S003:由语音增强处理模块接收自适应滤波器输出的初步降噪的信号,并对所述初步降噪的信号分为m帧、进行预加重处理,短时傅里叶变换成频域信号Y,并对将频域信号划分为若干频带k,计算各个频带的能量YE(m,k),其中m表示帧数,k为频带数;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比SNRpost(m,k),并由前一帧的先验信噪比估计值
Figure BSA00000186542100112
得到当前帧的先验信噪比估计值
Figure BSA00000186542100113
采用计权噪声估计法对当前帧的先验信噪比进行修正,得到修正先验信噪比估计值
Figure BSA00000186542100114
根据得到的修正先验信噪比估计值
Figure BSA00000186542100115
计算各个频带的衰减增益系数q(m,k);
采用门限判决对所述衰减增益系数进行调整;
用得到的调整后的衰减增益系数q(m,k),对初步降噪后信号Y(m,k)的频谱进行处理;
由修正的先验信噪比估计值
Figure BSA00000186542100116
对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值V(m,k)进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值:V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
将经上述过程处理后的频域信号变换成时域信号,对该时域信号进行去加重处理,并输出;
步骤S004:将上述经去加重处理的时域信号输出。
步骤S001中,由固定波束形成器对第一麦克风和第二麦克风分别接收外界的时域带噪语音信号分别经过延时补偿,之后作加权相加得到初步加强的信号,由阻塞矩阵模块将经过延时补偿的第一麦克风和第二麦克风分别接收外界的时域带噪语音信号通过阻塞矩阵相加参考噪声信号。
步骤S003中,短时傅里叶变换成频域信号,并对将频域信号划分为若干频带,计算各个频带的能量;
语音增强处理模块对所述初步降噪的信号y进行分帧后的信号为y(m),m表示帧数,经过一个高通滤波器,作为预加重处理,高通滤波器其形式如下:
H(z)=1-αz-1
其中常数α=0.9325,
短时傅里叶变换如下
X ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; x ( m ) e - 2 &pi;jf n M 0≤k1≤M-1
其中,M为短时傅利叶变换的计算长度,m表示第m帧信号,f表示频率值,X表示频域信号,x表示时域信号;
汉明窗函数定义如下:
win(n)={
0.54-0.46cos(2*π*n/M)          0≤n≤M-1
0                                 其余n
}
采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|X(m,k)|2                  0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k) 0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子;N为选取的频带总数,E(m,K)表示频带能量值,X(m,K)表示第m帧第k个频带的频域信号;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比
Figure BSA00000186542100132
并由前一帧的先验信噪比估计值
Figure BSA00000186542100133
得到当前帧的先验信噪比估计值;
S N ^ R prior ( m , k ) = &alpha; | S ^ ( m - 1 , k ) | 2 E { | N ( k ) | 2 } + ( 1 - &alpha; ) max [ 0 , SN R post ( m , k ) - 1 ]
Figure BSA00000186542100141
表示前一帧最后得到的降噪后语音信号,E{|V(m,k)|2}表示噪声能量估计值,,α为第一平滑系数;
采用计权噪声估计法对先验信噪比估计值进行修正;
先验信噪比估计值
Figure BSA00000186542100142
乘以计权因子去qθ,得到正先验信噪比估计值
Figure BSA00000186542100143
计权因子计算如下
q &theta; = 1 S N ^ R prior ( m , k ) < &gamma; 1 1 &gamma; 1 - &gamma; 2 ( S N ^ R prior ( m , k ) - &gamma; 2 ) &gamma; 1 < S N ^ R prior ( m , k ) < &theta; z 0 S N ^ R prior ( m , k ) > &theta; z
其中γ1取1.5左右,γ2取200,θz取20;
 根据得到的修正先验信噪比估计值
Figure BSA00000186542100145
计算各个频带的衰
减增益q(m,k);
其具体方法为
q ( m , k ) = { 1 - a - 0.5 &CenterDot; lg [ S N ^ R prior ( m , k ) ] SN R post
其中,对于不同频带,a为不同的常数;
采用门限判决对所述衰减增益进行调整;
首先以当前帧先验信噪比为判断,小于某一阈值频带的增益系数均乘以某一调整值qmod,这样做可以进一步抑制噪声,
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真;
方法如下:
Figure BSA00000186542100152
其中qmod=0.1,θG=1.2,qfloor=0.01
将当前帧的各频带的带噪语音信号Y(m,k),乘以前面得到的相应频带的衰减增益,得到的就是该频带的增强后的语音信号
Figure BSA00000186542100153
S ^ ( m , k ) = q ( m , k ) * Y ( m , k ) 0≤k≤N-1
由修正的先验信噪比估计值
Figure BSA00000186542100155
对当前帧进行判断,判断当
前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
V(m,k)=μV(m-1,k)+(1-μ)E(m,k)
μ表示第二平滑系数。
将经上述过程处理后的频域信号用前面所述短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+αz-1进行去加重处理,并输出。
详细而言,本发明中的降噪算法基本步骤如下:
1.对双麦克风接收到的两路信号进过时延补偿,通过固定波束形成器,得到初步加强的信号;
2.两路信号通过阻塞矩阵,得到参考噪声;
3.前两步骤得到的信号,经过自适应滤波器,得到初步降噪的信号;
4.将初步降噪的信号经过分帧,预加重处理,短时傅里叶变换到频域并划分为若干频带,计算各个频带能量并进行平滑,得到经平滑后的每个频带内的信号能量;
5.通过信号能量及噪声能量估计值,计算各个频带当前帧的后验信噪比,并由前一帧的先验信噪比估计值得到当前帧的先验信噪比估计值;
6.对得到的先验信噪比估计值,采用计权噪声估计法进行修正;
7.根据得到的修正先验信噪比估计值,计算各个频带的衰减增益因子;
8.采用门限判决对增益系数进行调整;
9.用得到的衰减增益,对划分到个频带的信号频谱进行处理;
10.由修正的先验信噪比估计值对当前帧进行判决,判断是否是噪声;
11.根据噪声判决结果对各频带的噪声估计值进行更新;
12.将处理后的频域信号变换到时间域,进行去加重处理,变成输出信号。
下面具体的实例介绍中,语音增强系统输入的噪语音信号的采样率为16kHZ,分辨率为16位。
首先输入的两路信号,经过时延估计及补偿,使传到两个麦克风的信号有相同幅度与相位,时延估计采用广义互相关法。
将两路信号x1(n),x2(n)进行傅里叶变换到频域X1(ω),X2(ω),两个麦克风的相对时延τ,则x1(n),x2(n)的广义互相关为,
R 12 ( &tau; ) = &Integral; 0 &pi; &psi; 12 ( &omega; ) X 1 ( &omega; ) X 2 * ( &omega; ) e - j&omega;&tau; d&omega;
其中加权函数
Figure BSA00000186542100172
求解出时相对时延τ,可得到延补偿后的信号
Figure BSA00000186542100173
进行延迟求和波束形成。其中,x′1(t)=x1(t),x′2(t)=x2(t+τ)信号首先经过加权,加权系数向量ωc满足,
Figure BSA00000186542100174
这里取ωc=[0.5 0.5]。则波束形成的输出为
Figure BSA00000186542100175
接着将延补偿后的信号通过阻塞矩阵B,得到参考噪声
Figure BSA00000186542100176
阻塞矩阵满足这里取B=[1-1]。
最后经过自适应滤波器滤波,输出初步降噪后的信号。
设自适应滤波器系数为
Figure BSA00000186542100178
阶数为M。
采用LMS算法,自适应滤波的最后输出为
y ( n ) = y f ( n ) - &Sigma; i = 1 M - 1 a i ( n ) Ns i ( n )
滤波器系数更新公式为
ai(n)=ai(n-1)+μy(n)Nsi(n)
对初步降噪后的信号y(n)进行分帧。是指将带噪语音信号以帧为单位等分成若干带噪信号单元。所述带噪信号单元由采样点组成,本发明中选取了16kHz的采样频率,根据短时谱分析的需要,帧长一般设定成10~35ms之间,本实施方式以16ms分帧,即一帧带噪信号单元设有256个采样点,自然地,任意一帧带噪信号单元具有一定的帧长,本发明中任意帧的帧长为256。
为了防止相邻两帧的带噪信号单元间的块效应,在分帧时要使相邻两帧的带噪信号单元之间有一定的混叠部分,即,本帧数据中有D个数据为前一帧数据的部分数据,其中混叠部分描述如下:
s(n)=d(m,D+n)           0≤n<L,i=1,2
其中si表示输入带噪语音信号,i取1和2分别表示两路信号
di(m,n)=di(m-1,L+n)        0≤n<D
其中,di表示当前帧的256点采样信号,因为任意一帧的长度为256,重叠率为75%,所以重叠部分的采样点个数D=192。相邻帧的带噪信号单元的第一个采样点相隔的距离L=256-192=64。
本发明相邻两帧的带噪信号单元之间可以具有50%~75%的重叠率。本实施方式选取相邻两帧的带噪信号单元之间具有75%的重叠率,即以本帧的前75%(192点)的带噪信号单元和前一帧后75%(192点)的带噪语音信号单元一致。
分帧后的信号,经过一个高通滤波器,作为预加重处理。由于语音信号中背景噪声在低频部分能量一般较大,所以使用所述高通滤波器可以衰减低频部分的分量,使增强效果更好。其形式如下:
H(z)=1-αz-1
α一般取值在0.75-0.95之间,这里α=0.9,可以取得较好的效果。
由于语音信号是短时平稳的,所以对信号进行分帧处理是可行的,但分帧又会带来帧信号边界处的不连续造成的频率泄露。所以这里要进行短时傅里叶变换(STFT)。短时傅里叶变换可以理解为对帧信号先加窗再做傅里叶变换。加窗函数的目的就是为了在做短时傅里叶变换时,减少帧信号边界处的不连续造成的频率泄露。这里使用了一个长度等于帧长256点的汉明窗,它可以有效的降低吉布斯效应的震荡程度。
汉明窗函数定义如下:
win(n)={
0.54-0.46cos(2*π*n/M)         0≤n≤M-1
0                              其余n
}
则短时傅里叶变换如下
X ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; y ( m ) e - 2 &pi;jf n M 0≤k1≤M-1
其中,M=256,为短时傅利叶变换的计算长度。m表示第m帧信号。
这样就将当前帧的带噪语音信号y从时域变换到为频域信号Y。
变换到频域后的带噪语音信号包括语音信号和噪声信号,该信号以帧为单位划分为若干频带,之后操作针对不同频带有不同的策略。
接着对8kHz以下信号进行频带划分,之后的信号处理均在各个频带中进行,这样既可以减少运算复杂度,又可以针对不同的频带做不同的处理,得到更好的效果。
本发明中的信号共划分为30个频带。具体见表1。
表1 23个频带划分
  频带数   起始频率(Hz)   截止频率(Hz)
  1   62.5   93.75
  2   125   156.25
  3   187.5   218.75
  4   250   281.25
  5   312.5   343.75
  6   375   406.25
  7   437.5   468.75
  8   500   531.25
  9   562.5   593.75
  10   625   656.25
  11   687.5   718.75
  12   750   781.25
  13   812.5   906.25
  14   937.5   1062.5
  15   1093.75   1250
  16   1281.25   1468.75
  17   1500   1718.75
  18   1750   2000
  19   2031.25   2312.5
  20   2343.75   2687.5
  21   2718.75   3125
  22   3156.25   3687.5
  23   3718.75   3968.75
  24   4000   4312.5
  25   4343.75   4687.5
  26   4718.75   5156.5
  27   5187.5   5718.75
  28   5750   6250
  29   6281.25   6875
  30   6936.25   7968.75
频带能量估计,用如下公式计算每个子区间的能量并进行平滑:
E(m,k)=|Y(m,k)|2            0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)      0≤k≤N-1
其中,Y(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子。N为选取的频带总数,即30。
经平滑后的每个子带区间的能量包括语音能量和噪声能量。
接着,计算当前帧信号的后验信噪比,如下
SNR post ( m , k ) = Y E ( m , k ) V ( k )
其中V(k)表示当前估计的噪声信号能量,这个值会在每帧数据处理的最后进行判决更新。
然后基于Ephraim-Malah(伊弗雷-马拉)的先验信噪比估计公式,计算当前帧的先验信噪比估计值
S N ^ R prior ( m , k ) = &alpha; | S ^ ( m - 1 , k ) | 2 E { | N ( k ) | 2 } + ( 1 - &alpha; ) max [ 0 , SN R post ( m , k ) - 1 ]
基于Ephraim-Malah(伊弗雷-马拉)的先验信噪比估计值,会出现对噪声的过估计,即对于高信噪比的情况下,得到的信噪比估计值偏高,造成增强后的语音失真,这里采用计权噪声估计方法进行修正。
以之前得到的后验信噪比为判断值,参照如图3的非线性函数,得到计权因子,对先验信噪比估计值进行加权处理。
其中γ1取1.5左右,γ2取200,θz取20。
接下来,进行衰减增益因子的计算。这里基于前面计算得出的先验信噪比估计值,采用频谱相减的方法得到衰减因子。其具体公式如下。
q ( k ) = { 1 - a - 0.5 &CenterDot; lg [ S N ^ R &prime; prior ( m , k ) ] SN R post
其中,对于不同频带,a为不同的常数。
这里考虑到,噪声主要集中在较低的频带,因此对于中低频段和高频,取不同的a。
本发明中对于k≤14的频带,即1.2kHz以下的信号,a=8.89
对于14<k≤18的频带,即1.2~2kHz之间的信号,a=6.44
对于18<k≤23的频带,即2~4kHz以上的信号,a=6.21
对于k>23的频带,即4kHz以上的信号,a=5.37
接着,对得到的增益系数进行调整,首先以当前帧先验信噪比为判断,小于某一阈值频带的增益系数均乘以某一调整值qmod,这样做可以进一步抑制残余噪声。
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真。
可以表示为如下公式:
q &prime; ( k ) = q mod q ( k ) , &xi; ( k ) < &theta; G q ( k ) , otherwise
q &prime; ( k ) = q ( k ) , q ( k ) > q floor q floor , otherwise
其中qmod=0.1,θG=1.2,qfloor=0.01
将当前帧的各频带的带噪语音信号Y(m,k),乘以前面得到的相应频带的衰减增益因子,得到的就是该频带的增强后的语音信号。
S ^ ( k ) = q ( k ) * Y ( k ) 0≤k≤N-1
其中,N=30为频带总数,为第k个频带增强后的语音信号估计值。
本发明中,每个频带的噪声能量的判决与更新采用了基于先验信噪比的语音激活检测(VAD)方法。首先判断当前帧是否是纯噪声信号。
VAD ( m ) = &Sigma; k = 1 N [ &gamma; ( m , k ) &zeta; ( m , k ) 1 + &zeta; ( m , k ) - lg ( 1 + &zeta; ( m , k ) ) ]
 其中γ(m,k)=min[SNRpost(m,k),40],
&zeta; ( m , k ) = max [ S N ^ R prior ( m , k ) , 10 - 2.5 ] .
对VAD(m)进行判断,并进行噪声更新,如下:
V ( m , k ) = &mu;V ( m - 1 , k ) + ( 1 - &mu; ) E ( m , k ) VAD ( m ) < &eta; V ( m - 1 , k ) VAD ( m ) &GreaterEqual; &eta;
其中η为噪声更新判决因子,本发明中取η=0.01。
μ为平滑因子,这里取μ=0.9。
最后的时域变换及输出部分进行的操作有:
第一步:逆快速傅里叶变换(FFT),把频域的语音谱变换到时间域,得到增强后的时域语音信号。
时域的变换用通用的逆离散傅利叶变换(IDFT)实现。
s ( m , n ) = 1 2 * &Sigma; n = 0 M - 1 S ^ ( f ) e j 2 &pi;nf / M 0≤k≤M-1
其中,M=256,为帧长。s为变换到时域后的全频带增强后的语音信号。
第二步:进行去加重处理。
和前面的预加重处理相反,这里将信号通过一个低通滤波器,最大程度的还原原有的信号。滤波器的频响如下;
H(z)=1+αz-1
这里的系数与前面预加重处理相对应,取α=0.9。
第三步:将增强后的语音信号的相邻帧的重叠部分进行相加操作。
具体的重叠部分相加可以用如下的方法来表示。
s &prime; ( n ) = s ( m , n ) + s ( m - 1 , n + L ) 0 &le; n < M - L s ( m , n ) M - L &le; n < M
L=64为相邻的帧信号开始处的距离,M=256,为帧长。s’代表完成相加操作后的最终输出信号。
与相关技术比较,本发明降噪的方法与现有的算法相比,使用双麦克风阵列,采用广义旁瓣抵消器,波束形成初步抑制非相关噪声,并通过从语音增强算法,进一步衰减各类型的背景噪声。与现有技术相比,大大提高了对残余噪声的衰减,保证了语音可懂度。经主客观测试,性能优于现有单通道语音增强算法。
本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。

Claims (6)

1.一种基于双麦克风语音增强装置,其特征在于:该装置包括
麦克风阵列模块,包括第一麦克风和第二麦克风,用于接收时域带噪语音信号,并将接收的时域带噪语音信号输出,第一麦克风和第二麦克风接收到时域带噪语音信号分别为x1,x2;
固定波束形成器,用于接收所述麦克风阵列模块输出的时域带噪语音信号,并将接收到时域带噪语音信号的语音部分进行叠加,加大该时域带噪语音信号,形成初步加强的语音信号,然后输出;
阻塞矩阵模块,用于接收所述麦克风阵列模块输出的时域带噪语音信号,将接收到的上述时域带噪语音信号中的语音部分进行抑制,获得参考噪声信号,然后输出;
自适应滤波器,用于接收固定波束形成器输出的初步加强的语音信号和阻塞矩阵模块输出的参考噪声信号,并进行第一次降噪处理后输出得到初步降噪的信号;
语音增强处理模块,用于接收自适应滤波器输出的初步降噪的信号并将该初步降噪的信号进行语音增强处理,得到进一步加强的语音信号,然后输出;
输出模块,用于接收语音增强处理模块输出的进一步加强的语音信号并输出。
2.根据权利要求1所述的基于双麦克风语音增强装置,其特征在于:所述阻塞矩阵模块满足
Figure FSA00000186542000011
这里取B=[1-1],将麦克风阵列模块输出的时域带噪语音信号通过阻塞矩阵B,得到参考噪声信号Ns=x1-x2,其中,B代表阻塞矩阵,Ns代表参考噪声信号。
3.根据权利要求1所述的基于双麦克风语音增强装置,其特征在于:第一麦克风和第二麦克风是全指向麦克风。
4.一种用于权利要求1所述的基于双麦克风语音增强装置的基于双麦克风语音增强方法,其特征在于该方法包括如下步骤:
步骤S001:由麦克风阵列模块中的第一麦克风和第二麦克风分别接收外界的时域带噪语音信号x1、x2,并将所述接收到的时域带噪语音信号分别传送给固定波束形成器和阻塞矩阵模块,由固定波束形成器将得到的第一麦克风和第二麦克风分别接收的时域带噪语音信号进行放大,得到初步加强的信号yf,由阻塞矩阵模块得到参考噪声信号Ns;
步骤S002:将由固定波束形成器得到初步加强的信号yf和由阻塞矩阵模块得到参考噪声信号Ns输入至自适应滤波器,经自适应滤波器的处理得到初步降噪的信号y;
步骤S003:由语音增强处理模块接收自适应滤波器输出的初步降噪的信号,并对所述初步降噪的信号分为m帧、进行预加重处理,短时傅里叶变换成频域信号Y,并对将频域信号划分为若干频带k,计算各个频带的能量YE(m,k),其中m表示帧数,k为频带数;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比SNRpost(m,k),并由前一帧的先验信噪比估计值
Figure FSA00000186542000032
得到当前帧的先验信噪比估计值
Figure FSA00000186542000033
采用计权噪声估计法对当前帧的先验信噪比进行修正,得到修正先验信噪比估计值
Figure FSA00000186542000034
根据得到的修正先验信噪比估计值
Figure FSA00000186542000035
计算各个频带的衰减增益系数q(m,k);
采用门限判决对所述衰减增益系数进行调整;
用得到的调整后的衰减增益系数q′(m,k),对初步降噪后信号Y(m,k)的频谱进行处理;
由修正的先验信噪比估计值
Figure FSA00000186542000036
对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值V(m,k)进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值:V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
将经上述过程处理后的频域信号变换成时域信号,对该时域信号进行去加重处理,并输出;
步骤S004:将上述经去加重处理的时域信号输出。
5.根据权利要求4所述的基于双麦克风语音增强方法,其特征在于:步骤S001中,由固定波束形成器对第一麦克风和第二麦克风分别接收外界的时域带噪语音信号分别经过延时补偿,之后作加权相加得到初步加强的信号,由阻塞矩阵模块将经过延时补偿的第一麦克风和第二麦克风分别接收外界的时域带噪语音信号通过阻塞矩阵相加参考噪声信号。
6.根据权利要求4所述的基于双麦克风语音增强方法,其特征在于:步骤S003中,短时傅里叶变换成频域信号,并对将频域信号划分为若干频带,计算各个频带的能量;
语音增强处理模块对所述初步降噪的信号y进行分帧后的信号为y(m),m表示帧数,经过一个高通滤波器,作为预加重处理,高通滤波器其形式如下:
H(z)=1-αz-1
其中常数α=0.9325,
短时傅里叶变换如下
X ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; x ( m ) e - 2 &pi;jf n M 0≤k1≤M-1
其中,M为短时傅利叶变换的计算长度,m表示第m帧信号,f表示频率值,X表示频域信号,x表示时域信号;
汉明窗函数定义如下:
win(n)={
0.54-0.46cos(2*π*n/M)       0≤n≤M-1
0                              其余n
}
采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|X(m,k)|2       0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)      0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号;设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比
Figure FSA00000186542000052
并由前一帧的先验信噪比估计值
Figure FSA00000186542000053
得到当前帧的先验信噪比估计值;
S N ^ R prior ( m , k ) = &alpha; | S ^ ( m - 1 , k ) | 2 E { | N ( k ) | 2 } + ( 1 - &alpha; ) max [ 0 , SN R post ( m , k ) - 1 ]
Figure FSA00000186542000055
表示前一帧最后得到的降噪后语音信号,E{|V(m,k)|2}表示噪声能量估计值,,α为第一平滑系数;
采用计权噪声估计法对先验信噪比估计值进行修正;
先验信噪比估计值
Figure FSA00000186542000061
乘以计权因子去qθ,得到正先验信噪比估计值
Figure FSA00000186542000062
计权因子计算如下
q &theta; = 1 S N ^ R prior ( m , k ) < &gamma; 1 1 &gamma; 1 - &gamma; 2 ( S N ^ R prior ( m , k ) - &gamma; 2 ) &gamma; 1 < S N ^ R prior ( m , k ) < &theta; z 0 S N ^ R prior ( m , k ) > &theta; z
其中γ1取1.5左右,γ2取200,θz取20;
根据得到的修正先验信噪比估计值
Figure FSA00000186542000064
计算各个频带的衰减增益q(m,k);
其具体方法为
q ( m , k ) = { 1 - a - 0.5 &CenterDot; lg [ S N ^ R prior ( m , k ) ] SN R post
其中,对于不同频带,a为不同的常数;
采用门限判决对所述衰减增益进行调整;
首先以当前帧先验信噪比为判断,小于某一阈值频带的增益系数均乘以某一调整值qmod,这样做可以进一步抑制噪声,
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真;
方法如下:
Figure FSA00000186542000072
其中qmod=0.1,θG=1.2,qfloor=0.01
将当前帧的各频带的带噪语音信号Y(m,k),乘以前面得到的相应频带的衰减增益,得到的就是该频带的增强后的语音信号
S ^ ( m , k ) = q ( m , k ) * Y ( m , k ) 0≤k≤N-1
由修正的先验信噪比估计值对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
V(m,k)=μV(m-1,k)+(1-μ)E(m,k)
μ表示第二平滑系数。
将经上述过程处理后的频域信号用前面所述短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+αz-1进行去加重处理,并输出。
CN2010102242933A 2010-07-09 2010-07-09 基于双麦克风语音增强装置及方法 Pending CN101976565A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102242933A CN101976565A (zh) 2010-07-09 2010-07-09 基于双麦克风语音增强装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102242933A CN101976565A (zh) 2010-07-09 2010-07-09 基于双麦克风语音增强装置及方法

Publications (1)

Publication Number Publication Date
CN101976565A true CN101976565A (zh) 2011-02-16

Family

ID=43576446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102242933A Pending CN101976565A (zh) 2010-07-09 2010-07-09 基于双麦克风语音增强装置及方法

Country Status (1)

Country Link
CN (1) CN101976565A (zh)

Cited By (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
WO2014085978A1 (en) * 2012-12-04 2014-06-12 Northwestern Polytechnical University Low noise differential microphone arrays
WO2014089914A1 (zh) * 2012-12-12 2014-06-19 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
CN104715758A (zh) * 2015-02-06 2015-06-17 哈尔滨工业大学深圳研究生院 一种分部处理式阵列式语音定位和增强方法
CN104751853A (zh) * 2013-12-31 2015-07-01 联芯科技有限公司 双麦克风噪声抑制方法及系统
CN104994456A (zh) * 2015-07-07 2015-10-21 惠州Tcl移动通信有限公司 一种提高通话音质的耳机及其方法
CN106024004A (zh) * 2016-05-11 2016-10-12 Tcl移动通信科技(宁波)有限公司 一种移动终端双麦降噪处理方法、系统及移动终端
CN106297818A (zh) * 2016-09-12 2017-01-04 广州酷狗计算机科技有限公司 一种获取去噪语音信号的方法和装置
CN106328155A (zh) * 2016-09-13 2017-01-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种修正先验信噪比过估计的语音增强方法
CN106340305A (zh) * 2016-11-04 2017-01-18 北京声智科技有限公司 自校准的远场语音交互设备及远场语音自校准方法
CN106448692A (zh) * 2016-07-04 2017-02-22 Tcl集团股份有限公司 应用语音存在概率优化的retf混响消除方法及系统
CN106653043A (zh) * 2016-12-26 2017-05-10 上海语知义信息技术有限公司 降低语音失真的自适应波束形成方法
CN106683685A (zh) * 2016-12-23 2017-05-17 上海语知义信息技术有限公司 基于最小二乘法的目标方向语音检测方法
CN106710601A (zh) * 2016-11-23 2017-05-24 合肥华凌股份有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN106716526A (zh) * 2014-09-05 2017-05-24 汤姆逊许可公司 用于增强声源的方法和装置
CN106782618A (zh) * 2016-12-23 2017-05-31 上海语知义信息技术有限公司 基于二阶锥规划的目标方向语音检测方法
CN106782595A (zh) * 2016-12-26 2017-05-31 上海语知义信息技术有限公司 一种降低语音泄露的鲁棒阻塞矩阵方法
CN107045874A (zh) * 2016-02-05 2017-08-15 深圳市潮流网络技术有限公司 一种基于相关性的非线性语音增强方法
CN107301869A (zh) * 2017-08-17 2017-10-27 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质
CN107393553A (zh) * 2017-07-14 2017-11-24 深圳永顺智信息科技有限公司 用于语音活动检测的听觉特征提取方法
CN107393547A (zh) * 2017-07-03 2017-11-24 桂林电子科技大学 子带谱减与广义旁瓣抵消的双微阵列语音增强方法
CN107393548A (zh) * 2017-07-05 2017-11-24 青岛海信电器股份有限公司 多个语音助手设备采集的语音信息的处理方法及装置
CN107409255A (zh) * 2015-03-30 2017-11-28 伯斯有限公司 子带信号的自适应混合
CN107787589A (zh) * 2015-06-22 2018-03-09 索尼移动通讯有限公司 噪声消除系统、耳机和电子装置
CN107969164A (zh) * 2014-11-12 2018-04-27 美国思睿逻辑有限公司 适应性信道间判别再缩放滤波器
CN108447500A (zh) * 2018-04-27 2018-08-24 深圳市沃特沃德股份有限公司 语音增强的方法与装置
CN108597498A (zh) * 2018-04-10 2018-09-28 广州势必可赢网络科技有限公司 一种多麦克风语音采集方法及装置
CN109389991A (zh) * 2018-10-24 2019-02-26 中国科学院上海微系统与信息技术研究所 一种基于麦克风阵列的信号增强方法
CN110012331A (zh) * 2019-04-11 2019-07-12 杭州微纳科技股份有限公司 一种红外触发的远场双麦远场语音识别方法
CN110085246A (zh) * 2019-03-26 2019-08-02 北京捷通华声科技股份有限公司 语音增强方法、装置、设备和存储介质
CN110140359A (zh) * 2017-01-03 2019-08-16 皇家飞利浦有限公司 使用波束形成的音频捕获
CN110211602A (zh) * 2019-05-17 2019-09-06 北京华控创为南京信息技术有限公司 智能语音增强通信方法及装置
CN110234043A (zh) * 2019-05-31 2019-09-13 歌尔科技有限公司 基于麦克风阵列的声音信号处理方法、装置及设备
CN110310650A (zh) * 2019-04-08 2019-10-08 清华大学 一种基于二阶微分麦克风阵列的语音增强算法
CN110534127A (zh) * 2019-09-24 2019-12-03 华南理工大学 应用于室内环境中的麦克风阵列语音增强方法及装置
CN110609271A (zh) * 2019-10-29 2019-12-24 海鹰企业集团有限责任公司 一种基于空间变迹的波束旁瓣抑制方法
CN110661510A (zh) * 2019-10-18 2020-01-07 出门问问信息科技有限公司 波束形成器形成方法、波束形成方法、装置及电子设备
CN110689900A (zh) * 2019-09-29 2020-01-14 北京地平线机器人技术研发有限公司 信号增强方法和装置、计算机可读存储介质、电子设备
CN111048105A (zh) * 2019-12-24 2020-04-21 广东美的白色家电技术创新中心有限公司 语音增强处理方法、装置、系统、家电设备和存储介质
CN111755021A (zh) * 2019-04-01 2020-10-09 北京京东尚科信息技术有限公司 基于二元麦克风阵列的语音增强方法和装置
CN112331226A (zh) * 2020-09-29 2021-02-05 江苏清微智能科技有限公司 一种针对主动降噪系统的语音增强系统及方法
CN112951260A (zh) * 2021-03-02 2021-06-11 桂林电子科技大学 一种双麦克风语音增强的方法
CN113168843A (zh) * 2018-11-21 2021-07-23 深圳市欢太科技有限公司 音频处理方法、装置、存储介质及电子设备
CN113270106A (zh) * 2021-05-07 2021-08-17 深圳市友杰智新科技有限公司 双麦克风的风噪声抑制方法、装置、设备及存储介质
CN113345469A (zh) * 2021-05-24 2021-09-03 北京小米移动软件有限公司 语音信号的处理方法、装置、电子设备及存储介质
CN113470681A (zh) * 2021-05-21 2021-10-01 中科上声(苏州)电子有限公司 一种麦克风阵列的拾音方法、电子设备及存储介质
CN113689875A (zh) * 2021-08-25 2021-11-23 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置
CN114176623A (zh) * 2021-12-21 2022-03-15 深圳大学 声音降噪方法、系统、降噪设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050141731A1 (en) * 2003-12-24 2005-06-30 Nokia Corporation Method for efficient beamforming using a complementary noise separation filter
US20090034752A1 (en) * 2007-07-30 2009-02-05 Texas Instruments Incorporated Constrainted switched adaptive beamforming
CN101369427A (zh) * 2007-08-13 2009-02-18 哈曼贝克自动系统股份有限公司 通过组合的波束形成和后滤波的降噪
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集系统
CN101599274A (zh) * 2009-06-26 2009-12-09 瑞声声学科技(深圳)有限公司 语音增强的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050141731A1 (en) * 2003-12-24 2005-06-30 Nokia Corporation Method for efficient beamforming using a complementary noise separation filter
US20090034752A1 (en) * 2007-07-30 2009-02-05 Texas Instruments Incorporated Constrainted switched adaptive beamforming
CN101369427A (zh) * 2007-08-13 2009-02-18 哈曼贝克自动系统股份有限公司 通过组合的波束形成和后滤波的降噪
CN101582264A (zh) * 2009-06-12 2009-11-18 瑞声声学科技(深圳)有限公司 语音增强的方法及语音增加的声音采集系统
CN101599274A (zh) * 2009-06-26 2009-12-09 瑞声声学科技(深圳)有限公司 语音增强的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《IEEE TRANSACTIONS ON ANTENNAS AND PROPAGATION》 19820131 LLOYD J.GRIFFITHS ET AL An Alternative Approach to Linearly Constrained Adaptive Beamforming 第27-34页 第30卷, 第1期 2 *

Cited By (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
WO2014085978A1 (en) * 2012-12-04 2014-06-12 Northwestern Polytechnical University Low noise differential microphone arrays
US9237391B2 (en) 2012-12-04 2016-01-12 Northwestern Polytechnical University Low noise differential microphone arrays
US9749745B2 (en) 2012-12-04 2017-08-29 Northwestern Polytechnical University Low noise differential microphone arrays
WO2014089914A1 (zh) * 2012-12-12 2014-06-19 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
US9414157B2 (en) 2012-12-12 2016-08-09 Goertek, Inc. Method and device for reducing voice reverberation based on double microphones
CN104751853A (zh) * 2013-12-31 2015-07-01 联芯科技有限公司 双麦克风噪声抑制方法及系统
CN104751853B (zh) * 2013-12-31 2019-01-04 辰芯科技有限公司 双麦克风噪声抑制方法及系统
CN106716526A (zh) * 2014-09-05 2017-05-24 汤姆逊许可公司 用于增强声源的方法和装置
CN107969164B (zh) * 2014-11-12 2020-07-17 美国思睿逻辑有限公司 适应性信道间判别再缩放滤波器
CN107969164A (zh) * 2014-11-12 2018-04-27 美国思睿逻辑有限公司 适应性信道间判别再缩放滤波器
CN104715758A (zh) * 2015-02-06 2015-06-17 哈尔滨工业大学深圳研究生院 一种分部处理式阵列式语音定位和增强方法
CN107409255B (zh) * 2015-03-30 2020-01-21 伯斯有限公司 子带信号的自适应混合
CN107409255A (zh) * 2015-03-30 2017-11-28 伯斯有限公司 子带信号的自适应混合
CN107787589B (zh) * 2015-06-22 2019-12-13 索尼移动通讯有限公司 噪声消除系统、耳机和电子装置
CN107787589A (zh) * 2015-06-22 2018-03-09 索尼移动通讯有限公司 噪声消除系统、耳机和电子装置
CN104994456A (zh) * 2015-07-07 2015-10-21 惠州Tcl移动通信有限公司 一种提高通话音质的耳机及其方法
CN104994456B (zh) * 2015-07-07 2019-07-09 惠州Tcl移动通信有限公司 一种提高通话音质的耳机及其方法
CN107045874A (zh) * 2016-02-05 2017-08-15 深圳市潮流网络技术有限公司 一种基于相关性的非线性语音增强方法
CN106024004B (zh) * 2016-05-11 2019-03-26 Tcl移动通信科技(宁波)有限公司 一种移动终端双麦降噪处理方法、系统及移动终端
CN106024004A (zh) * 2016-05-11 2016-10-12 Tcl移动通信科技(宁波)有限公司 一种移动终端双麦降噪处理方法、系统及移动终端
CN106448692A (zh) * 2016-07-04 2017-02-22 Tcl集团股份有限公司 应用语音存在概率优化的retf混响消除方法及系统
CN106297818A (zh) * 2016-09-12 2017-01-04 广州酷狗计算机科技有限公司 一种获取去噪语音信号的方法和装置
CN106297818B (zh) * 2016-09-12 2019-09-13 广州酷狗计算机科技有限公司 一种获取去噪语音信号的方法和装置
CN106328155A (zh) * 2016-09-13 2017-01-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种修正先验信噪比过估计的语音增强方法
CN106340305A (zh) * 2016-11-04 2017-01-18 北京声智科技有限公司 自校准的远场语音交互设备及远场语音自校准方法
CN106340305B (zh) * 2016-11-04 2024-03-19 北京声智科技有限公司 自校准的远场语音交互设备及远场语音自校准方法
CN106710601A (zh) * 2016-11-23 2017-05-24 合肥华凌股份有限公司 一种语音信号降噪拾音处理方法和装置及冰箱
CN106782618A (zh) * 2016-12-23 2017-05-31 上海语知义信息技术有限公司 基于二阶锥规划的目标方向语音检测方法
CN106683685A (zh) * 2016-12-23 2017-05-17 上海语知义信息技术有限公司 基于最小二乘法的目标方向语音检测方法
CN106683685B (zh) * 2016-12-23 2020-05-22 云知声(上海)智能科技有限公司 基于最小二乘法的目标方向语音检测方法
CN106653043A (zh) * 2016-12-26 2017-05-10 上海语知义信息技术有限公司 降低语音失真的自适应波束形成方法
CN106653043B (zh) * 2016-12-26 2019-09-27 云知声(上海)智能科技有限公司 降低语音失真的自适应波束形成方法
CN106782595A (zh) * 2016-12-26 2017-05-31 上海语知义信息技术有限公司 一种降低语音泄露的鲁棒阻塞矩阵方法
CN106782595B (zh) * 2016-12-26 2020-06-09 云知声(上海)智能科技有限公司 一种降低语音泄露的鲁棒阻塞矩阵方法
CN110140359A (zh) * 2017-01-03 2019-08-16 皇家飞利浦有限公司 使用波束形成的音频捕获
CN107393547A (zh) * 2017-07-03 2017-11-24 桂林电子科技大学 子带谱减与广义旁瓣抵消的双微阵列语音增强方法
CN107393548B (zh) * 2017-07-05 2021-05-07 海信视像科技股份有限公司 多个语音助手设备采集的语音信息的处理方法及装置
CN107393548A (zh) * 2017-07-05 2017-11-24 青岛海信电器股份有限公司 多个语音助手设备采集的语音信息的处理方法及装置
CN107393553A (zh) * 2017-07-14 2017-11-24 深圳永顺智信息科技有限公司 用于语音活动检测的听觉特征提取方法
CN107301869A (zh) * 2017-08-17 2017-10-27 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质
CN107301869B (zh) * 2017-08-17 2021-01-29 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质
CN108597498A (zh) * 2018-04-10 2018-09-28 广州势必可赢网络科技有限公司 一种多麦克风语音采集方法及装置
CN108447500A (zh) * 2018-04-27 2018-08-24 深圳市沃特沃德股份有限公司 语音增强的方法与装置
CN109389991A (zh) * 2018-10-24 2019-02-26 中国科学院上海微系统与信息技术研究所 一种基于麦克风阵列的信号增强方法
CN113168843A (zh) * 2018-11-21 2021-07-23 深圳市欢太科技有限公司 音频处理方法、装置、存储介质及电子设备
CN113168843B (zh) * 2018-11-21 2022-04-22 深圳市欢太科技有限公司 音频处理方法、装置、存储介质及电子设备
CN110085246A (zh) * 2019-03-26 2019-08-02 北京捷通华声科技股份有限公司 语音增强方法、装置、设备和存储介质
CN111755021B (zh) * 2019-04-01 2023-09-01 北京京东尚科信息技术有限公司 基于二元麦克风阵列的语音增强方法和装置
CN111755021A (zh) * 2019-04-01 2020-10-09 北京京东尚科信息技术有限公司 基于二元麦克风阵列的语音增强方法和装置
CN110310650A (zh) * 2019-04-08 2019-10-08 清华大学 一种基于二阶微分麦克风阵列的语音增强算法
CN110012331B (zh) * 2019-04-11 2021-05-25 杭州微纳科技股份有限公司 一种红外触发的远场双麦远场语音识别方法
CN110012331A (zh) * 2019-04-11 2019-07-12 杭州微纳科技股份有限公司 一种红外触发的远场双麦远场语音识别方法
CN110211602B (zh) * 2019-05-17 2021-09-03 北京华控创为南京信息技术有限公司 智能语音增强通信方法及装置
CN110211602A (zh) * 2019-05-17 2019-09-06 北京华控创为南京信息技术有限公司 智能语音增强通信方法及装置
CN110234043A (zh) * 2019-05-31 2019-09-13 歌尔科技有限公司 基于麦克风阵列的声音信号处理方法、装置及设备
CN110234043B (zh) * 2019-05-31 2020-08-25 歌尔科技有限公司 基于麦克风阵列的声音信号处理方法、装置及设备
CN110534127A (zh) * 2019-09-24 2019-12-03 华南理工大学 应用于室内环境中的麦克风阵列语音增强方法及装置
CN110689900A (zh) * 2019-09-29 2020-01-14 北京地平线机器人技术研发有限公司 信号增强方法和装置、计算机可读存储介质、电子设备
CN110661510A (zh) * 2019-10-18 2020-01-07 出门问问信息科技有限公司 波束形成器形成方法、波束形成方法、装置及电子设备
CN110609271A (zh) * 2019-10-29 2019-12-24 海鹰企业集团有限责任公司 一种基于空间变迹的波束旁瓣抑制方法
CN110609271B (zh) * 2019-10-29 2022-12-13 海鹰企业集团有限责任公司 一种基于空间变迹的波束旁瓣抑制方法
CN111048105A (zh) * 2019-12-24 2020-04-21 广东美的白色家电技术创新中心有限公司 语音增强处理方法、装置、系统、家电设备和存储介质
CN112331226A (zh) * 2020-09-29 2021-02-05 江苏清微智能科技有限公司 一种针对主动降噪系统的语音增强系统及方法
CN112331226B (zh) * 2020-09-29 2024-04-12 江苏清微智能科技有限公司 一种针对主动降噪系统的语音增强系统及方法
CN112951260B (zh) * 2021-03-02 2022-07-19 桂林电子科技大学 一种双麦克风语音增强的方法
CN112951260A (zh) * 2021-03-02 2021-06-11 桂林电子科技大学 一种双麦克风语音增强的方法
CN113270106B (zh) * 2021-05-07 2024-03-15 深圳市友杰智新科技有限公司 双麦克风的风噪声抑制方法、装置、设备及存储介质
CN113270106A (zh) * 2021-05-07 2021-08-17 深圳市友杰智新科技有限公司 双麦克风的风噪声抑制方法、装置、设备及存储介质
CN113470681A (zh) * 2021-05-21 2021-10-01 中科上声(苏州)电子有限公司 一种麦克风阵列的拾音方法、电子设备及存储介质
CN113470681B (zh) * 2021-05-21 2023-09-29 中科上声(苏州)电子有限公司 一种麦克风阵列的拾音方法、电子设备及存储介质
CN113345469A (zh) * 2021-05-24 2021-09-03 北京小米移动软件有限公司 语音信号的处理方法、装置、电子设备及存储介质
CN113689875A (zh) * 2021-08-25 2021-11-23 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置
CN113689875B (zh) * 2021-08-25 2024-02-06 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置
CN114176623B (zh) * 2021-12-21 2023-09-12 深圳大学 声音降噪方法、系统、降噪设备及计算机可读存储介质
CN114176623A (zh) * 2021-12-21 2022-03-15 深圳大学 声音降噪方法、系统、降噪设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN101976565A (zh) 基于双麦克风语音增强装置及方法
CN102074245B (zh) 基于双麦克风语音增强装置及语音增强方法
CN101916567B (zh) 应用于双麦克风系统的语音增强方法
CN102074246B (zh) 基于双麦克风语音增强装置及方法
CN102347028A (zh) 双麦克风语音增强装置及方法
CN101894563B (zh) 语音增强的方法
CN101976566B (zh) 语音增强方法及应用该方法的装置
US8010355B2 (en) Low complexity noise reduction method
CN102347027A (zh) 双麦克风语音增强装置及其语音增强方法
US9343056B1 (en) Wind noise detection and suppression
JP4210521B2 (ja) 雑音低減法および装置
CN101719969B (zh) 判断双端对话的方法、系统以及消除回声的方法和系统
EP2905778B1 (en) Echo cancellation method and device
US8355511B2 (en) System and method for envelope-based acoustic echo cancellation
US9064502B2 (en) Speech intelligibility predictor and applications thereof
US8189766B1 (en) System and method for blind subband acoustic echo cancellation postfiltering
US9818424B2 (en) Method and apparatus for suppression of unwanted audio signals
CN101763858A (zh) 双麦克风信号处理方法
CN109727604A (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
CN102739886B (zh) 基于回声频谱估计和语音存在概率的立体声回声抵消方法
CN103632675A (zh) 个人通信中降噪和回波消除时的噪声估计
US20120263317A1 (en) Systems, methods, apparatus, and computer readable media for equalization
CN111554315B (zh) 单通道语音增强方法及装置、存储介质、终端
US20140025374A1 (en) Speech enhancement to improve speech intelligibility and automatic speech recognition
CN106340292A (zh) 一种基于连续噪声估计的语音增强方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20110216