CN102074245A - 基于双麦克风语音增强装置及语音增强方法 - Google Patents

基于双麦克风语音增强装置及语音增强方法 Download PDF

Info

Publication number
CN102074245A
CN102074245A CN2011100010226A CN201110001022A CN102074245A CN 102074245 A CN102074245 A CN 102074245A CN 2011100010226 A CN2011100010226 A CN 2011100010226A CN 201110001022 A CN201110001022 A CN 201110001022A CN 102074245 A CN102074245 A CN 102074245A
Authority
CN
China
Prior art keywords
signal
digital signal
noise
frame
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011100010226A
Other languages
English (en)
Other versions
CN102074245B (zh
Inventor
叶利剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AAC Technologies Holdings Nanjing Co Ltd
AAC Technologies Pte Ltd
Original Assignee
AAC Acoustic Technologies Shenzhen Co Ltd
AAC Acoustic Technologies Nanjing Co Ltd
AAC Optoelectronic Changzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AAC Acoustic Technologies Shenzhen Co Ltd, AAC Acoustic Technologies Nanjing Co Ltd, AAC Optoelectronic Changzhou Co Ltd filed Critical AAC Acoustic Technologies Shenzhen Co Ltd
Priority to CN201110001022A priority Critical patent/CN102074245B/zh
Publication of CN102074245A publication Critical patent/CN102074245A/zh
Application granted granted Critical
Publication of CN102074245B publication Critical patent/CN102074245B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及一种基于双麦克风语音增强装置,其包括:数字麦克风阵列模块,用于接收时域带噪语音数字信号;第一脉冲密度调制解码器模块,用于对时域带噪语音数字信号进行分帧、降采样及滤波,形成初步降采样率数字信号;指向性形成模块,用于将初步降采样率数字信号进行指向性形成,形成初步降噪的指向性输出信号;第二脉冲密度调制解码器模块,用于对初步降噪的指向性输出信号进行分帧、降采样、滤波和加重,形成第二降采样率数字信号;语音增强处理模块,用于对第二降采样率数字信号进行语音增强处理;输出模块,用于输出去除背景噪声的语音信号。本发明另提供一种基于双麦克风语音增强装置的语音增强方法。该装置及方法去噪效果好。

Description

基于双麦克风语音增强装置及语音增强方法
技术领域
本发明涉及一种基于双麦克风语音增强装置及语音增强方法。
背景技术
随着无线通讯的发展,全球移动电话用户越来越多,用户对移动电话的要求已不仅满足于通话,而且要能够提供高质量的通话效果,尤其是目前移动多媒体技术的发展,移动电话的通话质量更显重要。
由于大量环境噪声的存在,手机等通讯设备的麦克风采集到的语音信号普遍信噪比不够高,特别是在街道汽车等高噪声环境中,需要提高音量才能使对方听清。所以需要通过语音增强的方法来提升输入语音的信噪比,改善通讯质量。
然而传统的单通道语音增强方法降噪效果有限,并且会对语音造成较大失真。
发明内容
本发明需解决的技术问题是提供一种去噪效果好的基于双麦克风语音增强装置及语音增强方法。
根据上述需解决的技术问题,本发明提供了一种基于双麦克风的语音增强装置,该装置包括:
数字麦克风阵列模块,用于接收时域带噪语音数字信号并将接收的时域带噪语音数字信号输出,其包括第一数字麦克风和第二数字麦克风;
第一脉冲密度调制解码器模块,用于对时域带噪语音数字信号进行分帧、降采样及滤波,形成初步降采样率数字信号,其包括滤波器;
指向性形成模块,用于将初步降采样率数字信号进行指向性形成,形成初步降噪的指向性输出信号;
第二脉冲密度调制解码器模块,用于对初步降噪的指向性输出信号进行分帧、降采样、滤波和加重,形成第二降采样率数字信号;
语音增强处理模块,用于对第二降采样率数字信号进行语音增强处理,形成去除背景噪声的语音信号;
输出模块,用于输出去除背景噪声的语音信号。
优选的,所述第一脉冲密度调制解码器模块包括N级梳状滤波器。
优选的,所述第二脉冲密度调制解码器模块包括第一半带滤波器、第二半带滤波器、低通滤波器和高通滤波器。
基于双麦克风语音增强装置的语音增强方法包括如下步骤:
步骤S001:利用第一数字麦克风接收第一时域带噪语音数字信号;利用第二数字麦克风接收第二时域带噪语音数字信号,并将所述接收到的第一、第二时域带噪语音数字信号传送给脉冲密度调制解码器模块;
步骤S002:利用脉冲密度调制解码器模块将第一、第二时域带噪语音数字信号分帧,并利用N级梳状滤波器进行降采样及滤波,得到第一、第二初步降采样率数字信号并输出;
N级梳状滤波器的传递函数形式如下:
N ( z ) = ( 1 r Σ i = 0 r - 1 z - i ) N
N为级联阶数,r为抽取比例
x′1(n,m)=x1(rn,m)
x′2(n,m)=x2(rn,m)
x1(n),x2(n)第一、第二时域带噪语音数字信号
x′1,x′2第一、第二初步降采样率数字信号
步骤S003:利用指向性形成模块接收脉冲密度调制解码器模块输出的第一、第二初步降采样的信号,并对第一、第二初步降采样的信号进行幅度补偿和相位补偿,得到第一、第二初步降噪的指向性信号,并将第一、第二初步降噪的指向性信号,相减得到初步降噪的指向性输出信号
经过幅度补偿,形式如下
x 1 * = a m x 1 ′
x 2 * = a m x 2 ′
为第一、第二初步降噪的指向性信号
其中am由第一数字麦克风和第二数字麦克风的灵敏度差异决定所述相位补偿的形式如下:
x 1 * * ( n , m ) = x 1 * ( n - [ f s d c s ] , m )
x 2 * * ( n , m ) = x 2 * ( n - [ f s d c s ] , m )
其中m为帧数,n为点数,fs为采样率,d为麦克风距离,cs为声速所述初步降噪的指向性输出信号如下:
y ( n , m ) = x 1 * * ( n , m ) - x 2 * * ( n , m )
步骤S004:利用第二脉冲密度调制解码器模块对初步降噪的指向性输出信号分帧、降采样、滤波和加重,形成第二降采样率数字信号;
步骤S005:利用语音增强处理模块对第二降采样率数字信号进行语音增强处理,形成去除背景噪声的语音信号;
步骤S006:利用输出模块接收语音增强处理模块输出去除背景噪声的语音信号。
优选地,步骤S004中
对所述初步降噪的信号进行分帧后的信号为y(m),m表示帧数
降采样及滤波分为三步:
第一步:利用第一半带滤波器,并按2∶1抽取;
第二步:利用第二半带滤波器,并按2∶1抽取;
第三步:利用低通滤波器,并按3∶1抽取;
第一半带滤波器为14阶有限冲激响应滤波器
y 1 ′ ( n , m ) = Σ i = 0 14 a 1 ( i ) y ( n - i , m )
y1(n,m)=y′1(2n,m)
第二半带滤波器为190阶有限冲激响应滤波器
y 2 ′ ( n , m ) = Σ i = 0 190 a 2 ( i ) y 1 ( n - i , m )
y2(n,m)=y′2(2n,m)
低通滤波器为86阶有限冲激响应滤波器
y 3 ′ ( n , m ) = Σ i = 0 86 a 3 ( i ) y 2 ( n - i , m )
y3(n,m)=y′3(3n,m)
利用高通滤波器,进行预加重处理
高通滤波器其形式如下:
H(z)=1-αz-1
其中常数α=0.9325
优选地,步骤S005中包括如下步骤
步骤A001:将第二降采样率数字信号经短时傅里叶变换成频域信号,并对将频域信号划分为若干频带,计算各个频带的能量并进行平滑;
短时傅里叶变换如下
X ( f , m ) = 2 M Σ n = 0 M - 1 win ( n - m ) × x ( m ) e - 2 πjf n M 0≤k1≤M-1
其中,M为短时傅利叶变换的计算长度,f表示频率值,X表示频域信号,x表示第二降采样率数字信号;
汉明窗函数定义如下:
win(n)={
0.54-0.46cos(2*π*n/M)    0≤n≤M-1
                     0                其余n
}
采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|X(m,k)|2        0≤k≤N-1
YE(m,k)=αYK(m-1,k)+(1-α)E(m,k)0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号;
步骤A002:用计算器计算先验信噪比估计值
Figure BDA0000042758710000052
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值
Figure BDA0000042758710000061
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各频带当前帧的后验信噪比
Figure BDA0000042758710000062
并由前一帧的先验信噪比估计值
Figure BDA0000042758710000063
得到当前帧的先验信噪比估计值
Figure BDA0000042758710000064
S N ^ R prior ( m , k ) = α | S ^ ( m - 1 , k ) | 2 E { | N ( k ) | 2 } + ( 1 - α ) max [ 0 , SNR post ( m , k ) - 1 ]
Figure BDA0000042758710000066
表示前一帧最后得到的降噪后语音信号,E{|V(m,k)|2}表示噪声能量估计值,α为第一平滑系数;
步骤A003:对先验信噪比估计值进行修正,得到修正后的先验信噪比估计值
Figure BDA0000042758710000068
步骤A004:根据修正后的先验信噪比估计值
Figure BDA0000042758710000069
计算各个频带的衰减增益q(m,k);
q ( m , k ) = { 1 - a - 0.5 · lg [ S N ^ R prior ( m , k ) ] SNR post
其中,对于不同频带,a为不同的常数;
步骤A005:将当前帧的各频带的频域信号X(m,k),乘以相应频带的衰减增益,得到该频带的增强后的语音信号
Figure BDA00000427587100000611
S ^ ( m , k ) = q ( m , k ) * X ( m , k ) 0≤k≤N-1
步骤A006:利用修正后的先验信噪比估计值对当前帧进行判断,判断当前帧是否是噪声并根据判决结果对各频带的噪声能量估计值进行更新,具体为:
如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新,并将此噪声能量估计值V(m,k),用于下一帧的步骤A002中,进行后验信噪比的估计;
V(m,k)=μV(m-1,k)+(1-μ)E(m,k)
μ表示第二平滑系数
步骤A007:将增强后的语音信号
Figure BDA0000042758710000073
用短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+αz-1进行去加重处理,得到去除背景噪声的语音信号并输出。
优选地,步骤A003中采用计权噪声估计法对先验信噪比估计值进行修正,具体为:
先验信噪比估计值乘以计权因子去qθ,得到修正后的先验信噪比估计值
Figure BDA0000042758710000075
计权因子计算如下
q &theta; = 1 S N ^ R prior ( m , k ) < &gamma; 1 1 &gamma; 1 - &gamma; 2 ( S N ^ R prior ( m , k ) - &gamma; 2 ) &gamma; 1 < S N ^ R prior ( m , k ) < &theta; z 0 S N ^ R prior ( m , k ) > &theta; z
其中γ1取1.5左右,γ2取200,θz取20;
优选地,步骤A004中还包括采用门限判决对所述衰减增益进行调整;
首先设定一阀值、调整值qmod和门限值qfloor;
其次以当前帧修正后的先验信噪比估计值
Figure BDA0000042758710000081
为判断,小于某一阈值的增益系数均乘以调整值qmod,从而进一步抑制噪声;
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真;
方法如下:
Figure BDA0000042758710000082
Figure BDA0000042758710000083
其中qmod=0.1,θG=1.2,qfloor=0.01
使用双麦克风阵列,可以引入语音与噪声信号的相位信息,提高噪声抑制的效果并减小语音的失真。
附图说明
图1是本发明提供的基于双麦克风语音增强装置的语音增强方法的流程示意图;
图2是本发明提供的基于双麦克风语音增强装置的结构框图;
图3是非线性计权曲线。
具体实施方式
下面结合附图和实施方式对本发明作进一步说明。
参见图1至图3,本发明提供的基于双麦克风语音增强装置,该装置包括:
数字麦克风阵列模块,用于接收时域带噪语音数字信号并将接收的时域带噪语音数字信号输出,其包括第一数字麦克风和第二数字麦克风;
第一脉冲密度调制解码器模块,用于对时域带噪语音数字信号进行分帧、降采样及滤波,形成初步降采样率数字信号,其包括滤波器,例如N级梳状滤波器;
指向性形成模块,用于将初步降采样率数字信号进行指向性形成,形成初步降噪的指向性输出信号;
第二脉冲密度调制解码器模块,用于对初步降噪的指向性输出信号进行分帧、降采样、滤波和加重,形成第二降采样率数字信号,其包括第一半带滤波器、第二半带滤波器、低通滤波器和高通滤波器;
语音增强处理模块,用于对第二降采样率数字信号进行语音增强处理,形成去除背景噪声的语音信号;
输出模块,用于输出去除背景噪声的语音信号。
本发明提供的基于双麦克风语音增强方法,该方法包括如下步骤:
步骤S001:利用第一数字麦克风接收第一时域带噪语音数字信号x1(n);利用第二数字麦克风接收第二时域带噪语音数字信号x2(n),并将所述接收到的第一、第二时域带噪语音数字信号x1(n),x2(n)传送给脉冲密度调制解码器模块;
步骤S002:利用脉冲密度调制解码器模块将第一、第二时域带噪语音数字信号分帧,采用16∶1的信号抽取;分帧后的第一、第二时域带噪语音数字信号的采样率为3.072MHz,降采样后192kHz输出;
对第一、第二时域带噪语音数字信号x1(n),x2(n)进行分帧,是指将第一、第二时域带噪语音数字信号x1(n),x2(n)以帧为单位等分成若干带噪信号单元。所述带噪信号单元由采样点组成,本发明中数字麦克风采样率为3.072MHz,采用64倍过采样,根据短时谱分析的需要,帧长一般设定成10~35ms之间,本实施方式以16ms分帧,即一帧带噪信号单元设有49152个采样点,自然地,任意一帧带噪信号单元具有一定的帧长,本发明中任意帧的帧长为49152。
为了防止相邻两帧的带噪信号单元间的块效应,在分帧时要使相邻两帧的带噪信号单元之间有一定的混叠部分,即,本帧数据中有D个数据为前一帧数据的部分数据,其中混叠部分描述如下:
s(n)=d(m,D+n)    0≤n<L,i=1,2
其中xi表示输入带噪语音信号,i取1和2分别表示两路信号
di(m,n)=di(m-1,L+n)    0≤n<D
其中,di表示当前帧的49152点采样信号,因为任意一帧的长度为49152,重叠率为75%,所以重叠部分的采样点个数D=36864。相邻帧的带噪信号单元的第一个采样点相隔的距离L=49152-36864=12288。
本发明相邻两帧的带噪信号单元之间可以具有50%~75%的重叠率。本实施方式选取相邻两帧的带噪信号单元之间具有75%的重叠率,即以本帧的前75%(36864点)的带噪信号单元和前一帧后75%(36864点)的带噪语音信号单元一致。
降采样滤波器采用5级的梳状滤波器,梳状滤波器的传递函数形式如下:
N ( z ) = ( 1 r &Sigma; i = 0 r - 1 z - i ) N
N为级联阶数取5,r为抽取比例取16
x′1(n,m)=x1(16n,m)
x′2(n,m)=x2(16n,m)
得到第一、第二初步降采样的信号x′1,x′2,采样率降低为192kHz;
步骤S003:利用指向性形成模块接收脉冲密度调制解码器模块输出的第一、第二初步降采样的信号x′1,x′2,并对第一、第二初步降采样的信号x′1,x′2进行幅度补偿和相位补偿,得到第一、第二初步降噪的指向性信号并将第一、第二初步降噪的指向性信号
Figure BDA0000042758710000113
相减得到初步降噪的指向性输出信号y(n,m)
经过幅度补偿,形式如下:
x 1 * = a m x 1 &prime;
x 2 * = a m x 2 &prime;
其中am由第一数字麦克风和第二数字麦克风的灵敏度差异决定所述相位补偿的形式如下:
x 1 * * ( n , m ) = x 1 * ( n - [ f s d c s ] , m )
x 2 * * ( n , m ) = x 2 * ( n - [ f s d c s ] , m )
其中m为帧数,n为点数,fs为采样率取192kHz,d为麦克风距离,cs为声速取344m/s
所述初步降噪的指向性输出信号y(n,m)如下:
y ( n , m ) = x 1 * * ( n , m ) - x 2 * * ( n , m )
步骤S004:利用第二脉冲密度调制解码器模块对初步降噪的指向性输出信号分帧、降采样、滤波和加重,形成第二降采样率数字信号;具体为:
对所述初步降噪的信号进行分帧后的信号为y(m),m表示帧数
降采样及滤波分为三步:
第一步:利用第一半带滤波器,并按2∶1抽取,采样率降至96kHz;
第二步:利用第二半带滤波器,并按2∶1抽取,采样率降至48kHz;
第三步:利用低通滤波器,并按3∶1抽取,采样率降至16kHz;
第一半带滤波器为14阶有限冲激响应滤波器
y 1 &prime; ( n , m ) = &Sigma; i = 0 14 a 1 ( i ) y ( n - i , m )
y1(n,m)=y′1(2n,m)
第二半带滤波器为190阶有限冲激响应滤波器
y 2 &prime; ( n , m ) = &Sigma; i = 0 190 a 2 ( i ) y 1 ( n - i , m )
y2(n,m)=y′2(2n,m)
低通滤波器为86阶有限冲激响应滤波器
y 3 &prime; ( n , m ) = &Sigma; i = 0 86 a 3 ( i ) y 2 ( n - i , m )
y3(n,m)=y′3(3n,m)
利用高通滤波器,进行预加重处理
高通滤波器其形式如下:
H(z)=1-αz-1
其中常数α=0.9325
步骤S005:利用语音增强处理模块对第二降采样率数字信号进行语音增强处理,形成去除背景噪声的语音信号;
由于语音信号是短时平稳的,所以对信号进行分帧处理是可行的,但分帧又会带来帧信号边界处的不连续造成的频率泄露。所以这里要进行短时傅里叶变换(STFT)。短时傅里叶变换可以理解为对帧信号先加窗再做傅里叶变换。加窗函数的目的就是为了在做短时傅里叶变换时,减少帧信号边界处的不连续造成的频率泄露。这里使用了一个长度等于帧长256点的汉明窗,它可以有效的降低吉布斯效应的震荡程度。
步骤A001:将第二降采样率数字信号经短时傅里叶变换成频域信号,并对将频域信号划分为若干频带,计算各个频带的能量并进行平滑;
短时傅里叶变换如下
X ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; x ( m ) e - 2 &pi;jf n M 0≤k1≤M-1
其中,M为短时傅利叶变换的计算长度,f表示频率值,X表示频域信号,x表示第二降采样率数字信号;
汉明窗函数定义如下:
win(n)={
0.54-0.46cos(2*π*n/M)    0≤n≤M-1
                    0                    其余n
}
则短时傅里叶变换如下
Y ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; y ( m ) e - 2 &pi;jf n M 0≤k1≤M-1
其中,M=256,为短时傅利叶变换的计算长度。m表示第m帧信号。
这样就将当前帧的带噪语音信号y从时域变换到为频域信号Y。
变换到频域后的带噪语音信号包括语音信号和噪声信号,该信号以帧为单位划分为若干频带,之后操作针对不同频带有不同的策略。
接着对8kHz以下信号进行频带划分,之后的信号处理均在各个频带中进行,这样既可以减少运算复杂度,又可以针对不同的频带做不同的处理,得到更好的效果。
本发明中的信号共划分为30个频带。具体见表1。
表123个频带划分
  频带数   起始频率(Hz)   截止频率(Hz)
  1   62.5   93.75
  2   125   156.25
  3   187.5   218.75
  4   250   281.25
  5   312.5   343.75
  6   375   406.25
  7   437.5   468.75
  8   500   531.25
  9   562.5   593.75
  10   625   656.25
  11   687.5   718.75
  12   750   781.25
  13   812.5   906.25
  14   937.5   1062.5
  15   1093.75   1250
  16   1281.25   1468.75
  17   1500   1718.75
  18   1750   2000
  19   2031.25   2312.5
  20   2343.75   2687.5
  21   2718.75   3125
  22   3156.25   3687.5
  23   3718.75   3968.75
  24   4000   4312.5
  25   4343.75   4687.5
  26   4718.75   5156.5
  27   5187.5   5718.75
  28   5750   6250
  29   6281.25   6875
  30   6936.25   7968.75
采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|X(m,k)|2            0≤k≤N-1
YE(m,k)=αYK(m-1,k)+(1-α)E(m,k)    0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号;
步骤A002:用计算器计算先验信噪比估计值
Figure BDA0000042758710000161
计算当前帧信号的后验信噪比,如下
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值
Figure BDA0000042758710000162
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各频带当前帧的后验信噪比
SNR post ( m , k ) = Y E ( m , k ) V ( m - 1 , k )
然后基于Ephraim-Malah(伊弗雷-马拉)的先验信噪比估计公式,计算当前帧的先验信噪比估计值
S N ^ R prior ( m , k ) = &alpha; | S ^ ( m - 1 , k ) | 2 E { | N ( k ) | 2 } + ( 1 - &alpha; ) max [ 0 , SNR post ( m , k ) - 1 ]
Figure BDA0000042758710000165
表示前一帧最后得到的降噪后语音信号,E{|V(m,k)|2}表示噪声能量估计值,α为第一平滑系数;
步骤A003:对先验信噪比估计值
Figure BDA0000042758710000171
进行修正,得到修正后的先验信噪比估计值
基于Ephraim-Malah(伊弗雷-马拉)的先验信噪比估计值,会出现对噪声的过估计,即对于高信噪比的情况下,得到的信噪比估计值偏高,造成增强后的语音失真,这里采用计权噪声估计方法进行修正。
先验信噪比估计值
Figure BDA0000042758710000173
乘以计权因子去qθ,得到修正后的先验信噪比估计值
Figure BDA0000042758710000174
计权因子计算如下
q &theta; = 1 S N ^ R prior ( m , k ) < &gamma; 1 1 &gamma; 1 - &gamma; 2 ( S N ^ R prior ( m , k ) - &gamma; 2 ) &gamma; 1 < S N ^ R prior ( m , k ) < &theta; z 0 S N ^ R prior ( m , k ) > &theta; z
其中γ1取1.5左右,γ2取200,θz取20;
步骤A004:根据修正后的先验信噪比估计值
Figure BDA0000042758710000176
计算各个频带的衰减增益q(m,k);
各个频带的衰减增益q(m,k)基于先验信噪比估计值采用频谱相减的方法得到衰减因子,其具体公式如下
q ( k ) = { 1 - a - 0.5 &CenterDot; lg [ S N ^ R prior &prime; ( k ) ] SNR post
其中,对于不同频带,a为不同的常数。
这里考虑到,噪声主要集中在较低的频带,因此对于中低频段和高频,取不同的a。
本发明中对于k≤14的频带,即1.2kHz以下的信号,a=8.89
对于14<k≤18的频带,即1.2~2kHz之间的信号,a=6.44
对于18<k≤23的频带,即2~4kHz以上的信号,a=6.21
对于k>23的频带,即4kHz以上的信号,a=5.37
采用门限判决对所述衰减增益进行调整;
首先设定一阀值、调整值qmod和门限值qfloor;
其次以当前帧修正后的先验信噪比估计值
Figure BDA0000042758710000181
为判断,小于某一阈值的增益系数均乘以调整值qmod,从而进一步抑制噪声;
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真;
方法如下:
Figure BDA0000042758710000182
其中qmod=0.1,θG=1.2,qfloor=0.01
步骤A005:将当前帧的各频带的频域信号X(m,k),乘以相应频带的衰减增益,得到该频带的增强后的语音信号
Figure BDA0000042758710000184
S ^ ( m , k ) = q ( m , k ) * X ( m , k ) 0≤k≤N-1
步骤A006:利用修正后的先验信噪比估计值
Figure BDA0000042758710000186
对当前帧进行判断,判断当前帧是否是噪声并根据判决结果对各频带的噪声能量估计值进行更新,具体为:
本发明中,每个频带的噪声能量的判决与更新采用了基于先验信噪比的语音激活检测(VAD)方法。首先判断当前帧是否是纯噪声信号
VAD ( m ) = &Sigma; k = 1 N [ &gamma; ( m , k ) &zeta; ( m , k ) 1 + &zeta; ( m , k ) - lg ( 1 + &zeta; ( m , k ) ) ]
其中γ(m,k)=min[SNRpost(m,k),40],
&zeta; ( m , k ) = max [ S N ^ R prior ( m , k ) , 10 - 25 ]
对VAD(m)进行判断,并进行噪声更新,如下:
V ( m , k ) = &mu;V ( m - 1 , k ) + ( 1 - &mu; ) E ( m , k ) VAD ( m ) < &eta; V ( m - 1 , k ) VAD ( m ) &GreaterEqual; &eta;
其中η为噪声更新判决因子,本发明中取η=0.01。
μ为平滑因子,这里取μ=0.9
如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新,并将此噪声能量估计值V(m,k),用于下一帧的步骤A002中,进行后验信噪比的估计;
V(m,k)=μV(m-1,k)+(1-μ)E(m,k)
μ表示第二平滑系数
步骤A007:将增强后的语音信号
Figure BDA0000042758710000194
用短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+αz-1进行去加重处理,得到去除背景噪声的语音信号并输出。
第一步:逆快速傅里叶变换(FFT),把频域的语音谱变换到时间域,得到增强后的时域语音信号。
时域的变换用通用的逆离散傅利叶变换(IDFT)实现。
s ( m , n ) = 1 2 * &Sigma; n = 0 M - 1 S ^ ( f ) e j 2 &pi;nf / M 0≤k≤M-1
其中,M=256,为帧长。s为变换到时域后的全频带增强后的语音信号。
第二步:进行去加重处理。
和前面的预加重处理相反,这里将信号通过一个低通滤波器,最大程度的还原原有的信号。滤波器的频响如下;
H(z)=1+αz-1
这里的系数与前面预加重处理相对应,取α=0.9。
第三步:将增强后的语音信号的相邻帧的重叠部分进行相加操作。
具体的重叠部分相加可以用如下的方法来表示。
s &prime; ( n ) = s ( m , n ) + s ( m - 1 , n + L ) 0 &le; n < M - L s ( m , n ) M - L &le; n < M
L=64为相邻的帧信号开始处的距离,M=256,为帧长。s’去除背景噪声的语音信号。
步骤S006:利用输出模块接收语音增强处理模块输出去除背景噪声的语音信号。
详细而言,本发明中的降噪算法基本步骤如下:
1.对第一数字麦克风和第二数字麦克风接收到的第一、第二时域带噪语音数字信号进过分帧,降采样滤波,得到初步降采样率数字信号;
2.初步降采样率数字信号通过指向性形成模块,经过幅度补偿及相位补偿,得到初步降噪的指向性输出信号;
3.前一步骤得到的初步降噪的指向性输出信号,经过多级降采样滤波处理,得到第二降采样率数字信号;
4.将第二降采样率数字信号经过加窗,预加重处理,短时傅里叶变换到频域并划分为若干频带,计算各个频带能量并进行平滑,得到经平滑后的每个频带区间的能量;
5.每个频带区间的能量及噪声能量估计值,计算各个频带当前帧的后验信噪比,并由前一帧的先验信噪比估计值得到当前帧的先验信噪比估计值;
6.对得到的先验信噪比估计值,采用计权噪声估计法进行修正;
7.根据得到的修正先验信噪比估计值,计算各个频带的衰减增益因子;
8.采用门限判决对增益系数进行调整;
9.用得到的衰减增益,对划分到个频带的信号频谱进行处理;
10.由修正的先验信噪比估计值对当前帧进行判决,判断是否是噪声;
11.根据噪声判决结果对各频带的噪声估计值进行更新;
12.将处理后的频域信号变换到时间域,进行去加重处理,变成输出信号。
与相关技术比较,本发明降噪的方法与现有的算法相比,使用双麦克风阵列,采用指向性形成抑制波束外的背景噪声,并通过从语音增强算法,进一步衰减各类型的背景噪声,采用数字麦克风及相关解码算法,省去了模数转换芯片。与现有技术相比,数字麦克风采集得到的信号直接进行降噪处理,节省了系统资源。语音增强算法大大提高了对残余噪声的衰减,保证了语音可懂度。经主客观测试,性能优于现有单通道语音增强算法。
传统的ECM麦克风,信号输入后需经过模数转换的过程,占用了系统的资源。而采用数字麦克风,采集到的信号直接是数字pdm信号,这样无需模数转换,只需要简单的解码即可直接进行降噪处理,大大提高了系统性能。
本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。

Claims (8)

1.一种基于双麦克风语音增强装置,其特征在于:该装置包括:
数字麦克风阵列模块,用于接收时域带噪语音数字信号并将接收的时域带噪语音数字信号输出,其包括第一数字麦克风和第二数字麦克风;
第一脉冲密度调制解码器模块,用于对时域带噪语音数字信号进行分帧、降采样及滤波,形成初步降采样率数字信号,其包括滤波器;
指向性形成模块,用于将初步降采样率数字信号进行指向性形成,形成初步降噪的指向性输出信号;
第二脉冲密度调制解码器模块,用于对初步降噪的指向性输出信号进行分帧、降采样、滤波和加重,形成第二降采样率数字信号;
语音增强处理模块,用于对第二降采样率数字信号进行语音增强处理,形成去除背景噪声的语音信号;
输出模块,用于输出去除背景噪声的语音信号。
2.根据权利要求1所述的基于双麦克风语音增强装置,其特征在于,所述第一脉冲密度调制解码器模块包括N级梳状滤波器。
3.根据权利要求2所述的基于双麦克风语音增强装置,其特征在于,所述第二脉冲密度调制解码器模块包括第一半带滤波器、第二半带滤波器、低通滤波器和高通滤波器。
4.根据权利要求3所述的基于双麦克风语音增强装置的语音增强方法,其特征在于,该语音增强方法包括如下步骤:
步骤S001:利用第一数字麦克风接收第一时域带噪语音数字信号;利用第二数字麦克风接收第二时域带噪语音数字信号,并将所述接收到的第 
一、第二时域带噪语音数字信号传送给脉冲密度调制解码器模块;
步骤S002:利用脉冲密度调制解码器模块将第一、第二时域带噪语音数字信号分帧,并利用N级梳状滤波器进行降采样及滤波,得到第一、第二初步降采样率数字信号并输出;
N级梳状滤波器的传递函数形式如下:
Figure FDA0000042758700000021
N为级联阶数,r为抽取比例
x′1(n,m)=x1(rn,m)
x′2(n,m)=x2(rn,m)
x1(n),x2(n)第一、第二时域带噪语音数字信号
x′1,x′2第一、第二初步降采样率数字信号
步骤S003:利用指向性形成模块接收脉冲密度调制解码器模块输出的第一、第二初步降采样的信号,并对第一、第二初步降采样的信号进行幅度补偿和相位补偿,得到第一、第二初步降噪的指向性信号,并将第一、第二初步降噪的指向性信号,相减得到初步降噪的指向性输出信号
经过幅度补偿,形式如下
Figure FDA0000042758700000022
Figure FDA0000042758700000023
Figure FDA0000042758700000024
为第一、第二初步降噪的指向性信号
其中am由第一数字麦克风和第二数字麦克风的灵敏度差异决定所述相位补偿的形式如下: 
Figure FDA0000042758700000032
其中m为帧数,n为点数,fs为采样率,d为麦克风距离,cs为声速所述初步降噪的指向性输出信号如下:
Figure FDA0000042758700000033
步骤S004:利用第二脉冲密度调制解码器模块对初步降噪的指向性输出信号分帧、降采样、滤波和加重,形成第二降采样率数字信号;
步骤S005:利用语音增强处理模块对第二降采样率数字信号进行语音增强处理,形成去除背景噪声的语音信号;
步骤S006:利用输出模块接收语音增强处理模块输出去除背景噪声的语音信号。
5.根据权利要求4所述的基于双麦克风语音增强装置的语音增强方法,其特征在于,步骤S004中
对所述初步降噪的信号进行分帧后的信号为y(m),m表示帧数
降采样及滤波分为三步:
第一步:利用第一半带滤波器,并按2∶1抽取;
第二步:利用第二半带滤波器,并按2∶1抽取;
第三步:利用低通滤波器,并按3∶1抽取;
第一半带滤波器为14阶有限冲激响应滤波器 
Figure FDA0000042758700000041
y1(n,m)=y′1(2n,m)
第二半带滤波器为190阶有限冲激响应滤波器
Figure FDA0000042758700000042
y2(n,m)=y′2(2n,m)
低通滤波器为86阶有限冲激响应滤波器
Figure FDA0000042758700000043
y3(n,m)=y′3(3n,m)
利用高通滤波器,进行预加重处理
高通滤波器其形式如下:
H(z)=1-αz-1
其中常数α=0.9325。
6.根据权利要求5所述的基于双麦克风语音增强装置的语音增强方法,其特征在于,步骤S005中包括如下步骤
步骤A001:将第二降采样率数字信号经短时傅里叶变换成频域信号,并对将频域信号划分为若干频带,计算各个频带的能量并进行平滑;
短时傅里叶变换如下
Figure FDA0000042758700000044
0≤k1≤M-1
其中,M为短时傅利叶变换的计算长度,f表示频率值,X表示频域信号,x表示第二降采样率数字信号;
汉明窗函数定义如下:
win(n)={ 
0.54-0.46cos(2*π*n/M)        0≤n≤M-1
                    0                其余n
}
采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|X(m,k)|2            0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)    0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号;
步骤A002:用计算器计算先验信噪比估计值 
Figure FDA0000042758700000051
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 
Figure FDA0000042758700000052
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各频带当前帧的后验信噪比 
Figure FDA0000042758700000053
并由前一帧的先验信噪比估计值 
Figure FDA0000042758700000054
得到当前帧的先验信噪比估计值 
Figure FDA0000042758700000055
Figure FDA0000042758700000056
Figure FDA0000042758700000057
表示前一帧最后得到的降噪后语音信号,E{|V(m,k)|2}表示噪声能量估计值,α为第一平滑系数; 
步骤A003:对先验信噪比估计值 
Figure FDA0000042758700000061
进行修正,得到修正后的先验信噪比估计值 
步骤A004:根据修正后的先验信噪比估计值 
Figure FDA0000042758700000063
计算各个频带的衰减增益q(m,k);
Figure FDA0000042758700000064
其中,对于不同频带,a为不同的常数;
步骤A005:将当前帧的各频带的频域信号X(m,k),乘以相应频带的衰减增益,得到该频带的增强后的语音信号 
Figure FDA0000042758700000065
Figure FDA0000042758700000066
0≤k≤N-1
步骤A006:利用修正后的先验信噪比估计值 
Figure FDA0000042758700000067
对当前帧进行判断,判断当前帧是否是噪声并根据判决结果对各频带的噪声能量估计值进行更新,具体为:
如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新,并将此噪声能量估计值V(m,k),用于下一帧的步骤A002中,进行后验信噪比的估计;
V(m,k)=μV(m-1,k)+(1-μ)E(m,k)
μ表示第二平滑系数
步骤A007:将增强后的语音信号 用短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+αz-1进行去加重处理,得到去 除背景噪声的语音信号并输出。
7.根据权利要求6所述的基于双麦克风语音增强装置的语音增强方法,其特征在于,步骤A003中采用计权噪声估计法对先验信噪比估计值进行修正,具体为:
先验信噪比估计值 乘以计权因子去qθ,得到修正后的先验信噪比估计值 
Figure FDA0000042758700000072
计权因子计算如下
其中γ1取1.5左右,γ2取200,θz取20。
8.根据权利要求7所述的基于双麦克风语音增强装置的语音增强方法,其特征在于,步骤A004中还包括采用门限判决对所述衰减增益进行调整;
首先设定一阀值、调整值qmod和门限值qfloor;
其次以当前帧修正后的先验信噪比估计值 
Figure FDA0000042758700000074
为判断,小于某一阈值的增益系数均乘以调整值qmod,从而进一步抑制噪声;
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真;
方法如下:
Figure FDA0000042758700000081
其中qmod=0.1,θG=1.2,qfloor=0.01 。
CN201110001022A 2011-01-05 2011-01-05 基于双麦克风语音增强装置及语音增强方法 Expired - Fee Related CN102074245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110001022A CN102074245B (zh) 2011-01-05 2011-01-05 基于双麦克风语音增强装置及语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110001022A CN102074245B (zh) 2011-01-05 2011-01-05 基于双麦克风语音增强装置及语音增强方法

Publications (2)

Publication Number Publication Date
CN102074245A true CN102074245A (zh) 2011-05-25
CN102074245B CN102074245B (zh) 2012-10-10

Family

ID=44032763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110001022A Expired - Fee Related CN102074245B (zh) 2011-01-05 2011-01-05 基于双麦克风语音增强装置及语音增强方法

Country Status (1)

Country Link
CN (1) CN102074245B (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102347027A (zh) * 2011-07-07 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及其语音增强方法
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
CN103886867A (zh) * 2012-12-21 2014-06-25 华为技术有限公司 一种噪声抑制装置及其方法
CN103945291A (zh) * 2014-03-05 2014-07-23 北京飞利信科技股份有限公司 一种应用双麦克风定向传声的方法及装置
CN105474312A (zh) * 2013-09-17 2016-04-06 英特尔公司 用于自动语音识别(asr)的自适应的基于相位差的噪声消减
CN105471992A (zh) * 2015-11-30 2016-04-06 北京汉能华科技股份有限公司 一种应用于风力发电场的终端设备和通信系统
CN105830463A (zh) * 2013-10-29 2016-08-03 美商楼氏电子有限公司 Vad检测设备和操作该vad检测设备的方法
CN105848062A (zh) * 2015-01-12 2016-08-10 芋头科技(杭州)有限公司 多声道的数字麦克风
CN106331959A (zh) * 2016-09-26 2017-01-11 厦门莱亚特医疗器械有限公司 指向性传声器的降噪方法与装置
CN106328155A (zh) * 2016-09-13 2017-01-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种修正先验信噪比过估计的语音增强方法
CN106373590A (zh) * 2016-08-29 2017-02-01 湖南理工学院 一种基于语音实时时长调整的声音变速控制系统和方法
CN106683685A (zh) * 2016-12-23 2017-05-17 上海语知义信息技术有限公司 基于最小二乘法的目标方向语音检测方法
CN106714034A (zh) * 2016-12-13 2017-05-24 安徽声讯信息技术有限公司 一种新型麦克风阵列的实现方法
CN107068158A (zh) * 2011-11-03 2017-08-18 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
CN107068162A (zh) * 2017-05-25 2017-08-18 北京小鱼在家科技有限公司 一种语音增强方法、装置及终端设备
CN107393547A (zh) * 2017-07-03 2017-11-24 桂林电子科技大学 子带谱减与广义旁瓣抵消的双微阵列语音增强方法
CN107481731A (zh) * 2017-08-01 2017-12-15 百度在线网络技术(北京)有限公司 一种语音数据增强方法及系统
CN107547981A (zh) * 2017-05-17 2018-01-05 宁波桑德纳电子科技有限公司 一种集音装置、监控装置及集音方法
CN107680609A (zh) * 2017-09-12 2018-02-09 桂林电子科技大学 一种基于噪声功率谱密度的双通道语音增强方法
CN108028050A (zh) * 2015-09-18 2018-05-11 高通股份有限公司 协同音频处理
CN108735229A (zh) * 2018-06-12 2018-11-02 华南理工大学 一种基于信噪比加权的幅度与相位联合补偿抗噪语音增强方法及实现装置
CN109074817A (zh) * 2018-07-19 2018-12-21 深圳市汇顶科技股份有限公司 语音增强方法、装置、设备及存储介质
CN109119082A (zh) * 2018-10-22 2019-01-01 深圳锐越微技术有限公司 语音唤醒电路及电子设备
CN110310635A (zh) * 2019-06-24 2019-10-08 Oppo广东移动通信有限公司 语音处理电路及电子设备
CN110491406A (zh) * 2019-09-25 2019-11-22 电子科技大学 一种多模块抑制不同种类噪声的双噪声语音增强方法
CN111429930A (zh) * 2020-03-16 2020-07-17 云知声智能科技股份有限公司 一种基于自适应采样率的降噪模型处理方法及系统
CN111968667A (zh) * 2020-08-13 2020-11-20 杭州芯声智能科技有限公司 一种双麦克风语音降噪装置及其降噪方法
CN112802486A (zh) * 2020-12-29 2021-05-14 紫光展锐(重庆)科技有限公司 一种噪声抑制方法、装置及电子设备
CN113160840A (zh) * 2020-01-07 2021-07-23 北京地平线机器人技术研发有限公司 噪声滤除方法、装置、可移动设备及计算机可读存储介质
CN113409802A (zh) * 2020-10-29 2021-09-17 腾讯科技(深圳)有限公司 语音信号的增强处理方法、装置、设备及存储介质
CN117278896A (zh) * 2023-11-23 2023-12-22 深圳市昂思科技有限公司 一种基于双麦克风的语音增强方法、装置及助听设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITTO20130968A1 (it) * 2013-11-28 2015-05-29 St Microelectronics Srl Microfono a matrice e metodo di acquisizione di segnali acustici

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719516A (zh) * 2005-07-15 2006-01-11 北京中星微电子有限公司 自适应滤波装置以及自适应滤波方法
US20080175408A1 (en) * 2007-01-20 2008-07-24 Shridhar Mukund Proximity filter
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
US20090287482A1 (en) * 2006-12-22 2009-11-19 Hetherington Phillip A Ambient noise compensation system robust to high excitation noise
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719516A (zh) * 2005-07-15 2006-01-11 北京中星微电子有限公司 自适应滤波装置以及自适应滤波方法
US20090287482A1 (en) * 2006-12-22 2009-11-19 Hetherington Phillip A Ambient noise compensation system robust to high excitation noise
US20080175408A1 (en) * 2007-01-20 2008-07-24 Shridhar Mukund Proximity filter
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法

Cited By (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102347027A (zh) * 2011-07-07 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及其语音增强方法
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
CN107068158A (zh) * 2011-11-03 2017-08-18 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
CN107068158B (zh) * 2011-11-03 2020-08-21 沃伊斯亚吉公司 用于改善低速率码激励线性预测解码器的非语音内容的方法及其设备
CN103886867A (zh) * 2012-12-21 2014-06-25 华为技术有限公司 一种噪声抑制装置及其方法
CN103886867B (zh) * 2012-12-21 2017-06-27 华为技术有限公司 一种噪声抑制装置及其方法
CN105474312B (zh) * 2013-09-17 2019-08-27 英特尔公司 用于自动语音识别(asr)的自适应的基于相位差的噪声消减
CN105474312A (zh) * 2013-09-17 2016-04-06 英特尔公司 用于自动语音识别(asr)的自适应的基于相位差的噪声消减
CN105830463A (zh) * 2013-10-29 2016-08-03 美商楼氏电子有限公司 Vad检测设备和操作该vad检测设备的方法
CN103945291A (zh) * 2014-03-05 2014-07-23 北京飞利信科技股份有限公司 一种应用双麦克风定向传声的方法及装置
CN105848062A (zh) * 2015-01-12 2016-08-10 芋头科技(杭州)有限公司 多声道的数字麦克风
CN105848062B (zh) * 2015-01-12 2018-01-05 芋头科技(杭州)有限公司 多声道的数字麦克风
CN108028050B (zh) * 2015-09-18 2021-10-22 高通股份有限公司 协同音频处理
CN108028050A (zh) * 2015-09-18 2018-05-11 高通股份有限公司 协同音频处理
CN105471992B (zh) * 2015-11-30 2019-10-01 北京汉能华科技股份有限公司 一种应用于风力发电场的终端设备和通信系统
CN105471992A (zh) * 2015-11-30 2016-04-06 北京汉能华科技股份有限公司 一种应用于风力发电场的终端设备和通信系统
CN106373590A (zh) * 2016-08-29 2017-02-01 湖南理工学院 一种基于语音实时时长调整的声音变速控制系统和方法
CN106373590B (zh) * 2016-08-29 2020-04-03 湖南理工学院 一种基于语音实时时长调整的声音变速控制系统和方法
CN106328155A (zh) * 2016-09-13 2017-01-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种修正先验信噪比过估计的语音增强方法
CN106331959A (zh) * 2016-09-26 2017-01-11 厦门莱亚特医疗器械有限公司 指向性传声器的降噪方法与装置
CN106331959B (zh) * 2016-09-26 2019-10-25 欧仕达听力科技(厦门)有限公司 指向性传声器的降噪方法与装置
CN106714034A (zh) * 2016-12-13 2017-05-24 安徽声讯信息技术有限公司 一种新型麦克风阵列的实现方法
CN106683685A (zh) * 2016-12-23 2017-05-17 上海语知义信息技术有限公司 基于最小二乘法的目标方向语音检测方法
CN106683685B (zh) * 2016-12-23 2020-05-22 云知声(上海)智能科技有限公司 基于最小二乘法的目标方向语音检测方法
CN107547981A (zh) * 2017-05-17 2018-01-05 宁波桑德纳电子科技有限公司 一种集音装置、监控装置及集音方法
CN107068162A (zh) * 2017-05-25 2017-08-18 北京小鱼在家科技有限公司 一种语音增强方法、装置及终端设备
CN107393547A (zh) * 2017-07-03 2017-11-24 桂林电子科技大学 子带谱减与广义旁瓣抵消的双微阵列语音增强方法
CN107481731A (zh) * 2017-08-01 2017-12-15 百度在线网络技术(北京)有限公司 一种语音数据增强方法及系统
CN107481731B (zh) * 2017-08-01 2021-01-22 百度在线网络技术(北京)有限公司 一种语音数据增强方法及系统
CN107680609A (zh) * 2017-09-12 2018-02-09 桂林电子科技大学 一种基于噪声功率谱密度的双通道语音增强方法
CN108735229A (zh) * 2018-06-12 2018-11-02 华南理工大学 一种基于信噪比加权的幅度与相位联合补偿抗噪语音增强方法及实现装置
CN108735229B (zh) * 2018-06-12 2020-06-19 华南理工大学 基于信噪比加权的幅度与相位联合补偿抗噪语音增强方法
CN109074817A (zh) * 2018-07-19 2018-12-21 深圳市汇顶科技股份有限公司 语音增强方法、装置、设备及存储介质
CN109074817B (zh) * 2018-07-19 2021-06-25 深圳市汇顶科技股份有限公司 语音增强方法、装置、设备及存储介质
WO2020014931A1 (zh) * 2018-07-19 2020-01-23 深圳市汇顶科技股份有限公司 语音增强方法、装置、设备及存储介质
CN109119082A (zh) * 2018-10-22 2019-01-01 深圳锐越微技术有限公司 语音唤醒电路及电子设备
CN110310635B (zh) * 2019-06-24 2022-03-22 Oppo广东移动通信有限公司 语音处理电路及电子设备
CN110310635A (zh) * 2019-06-24 2019-10-08 Oppo广东移动通信有限公司 语音处理电路及电子设备
CN110491406B (zh) * 2019-09-25 2020-07-31 电子科技大学 一种多模块抑制不同种类噪声的双噪声语音增强方法
CN110491406A (zh) * 2019-09-25 2019-11-22 电子科技大学 一种多模块抑制不同种类噪声的双噪声语音增强方法
CN113160840B (zh) * 2020-01-07 2022-10-25 北京地平线机器人技术研发有限公司 噪声滤除方法、装置、可移动设备及计算机可读存储介质
CN113160840A (zh) * 2020-01-07 2021-07-23 北京地平线机器人技术研发有限公司 噪声滤除方法、装置、可移动设备及计算机可读存储介质
CN111429930A (zh) * 2020-03-16 2020-07-17 云知声智能科技股份有限公司 一种基于自适应采样率的降噪模型处理方法及系统
CN111429930B (zh) * 2020-03-16 2023-02-28 云知声智能科技股份有限公司 一种基于自适应采样率的降噪模型处理方法及系统
CN111968667A (zh) * 2020-08-13 2020-11-20 杭州芯声智能科技有限公司 一种双麦克风语音降噪装置及其降噪方法
CN113409802A (zh) * 2020-10-29 2021-09-17 腾讯科技(深圳)有限公司 语音信号的增强处理方法、装置、设备及存储介质
CN113409802B (zh) * 2020-10-29 2023-09-15 腾讯科技(深圳)有限公司 语音信号的增强处理方法、装置、设备及存储介质
CN112802486A (zh) * 2020-12-29 2021-05-14 紫光展锐(重庆)科技有限公司 一种噪声抑制方法、装置及电子设备
CN112802486B (zh) * 2020-12-29 2023-02-14 紫光展锐(重庆)科技有限公司 一种噪声抑制方法、装置及电子设备
CN117278896A (zh) * 2023-11-23 2023-12-22 深圳市昂思科技有限公司 一种基于双麦克风的语音增强方法、装置及助听设备
CN117278896B (zh) * 2023-11-23 2024-03-19 深圳市昂思科技有限公司 一种基于双麦克风的语音增强方法、装置及助听设备

Also Published As

Publication number Publication date
CN102074245B (zh) 2012-10-10

Similar Documents

Publication Publication Date Title
CN102074245B (zh) 基于双麦克风语音增强装置及语音增强方法
CN102074246B (zh) 基于双麦克风语音增强装置及方法
CN101976565A (zh) 基于双麦克风语音增强装置及方法
CN102347027A (zh) 双麦克风语音增强装置及其语音增强方法
CN102347028A (zh) 双麦克风语音增强装置及方法
CN101976566B (zh) 语音增强方法及应用该方法的装置
CN101916567B (zh) 应用于双麦克风系统的语音增强方法
CN101894563B (zh) 语音增强的方法
US8170879B2 (en) Periodic signal enhancement system
US8010355B2 (en) Low complexity noise reduction method
KR102060208B1 (ko) 적응적 음성 명료도 처리기
CN103730125B (zh) 一种回声抵消方法和设备
US7610196B2 (en) Periodic signal enhancement system
CN104424956B (zh) 激活音检测方法和装置
CN112767963B (zh) 一种语音增强方法、装置、系统及计算机可读存储介质
CN105513605A (zh) 手机麦克风的语音增强系统和语音增强方法
US20120263317A1 (en) Systems, methods, apparatus, and computer readable media for equalization
US8306821B2 (en) Sub-band periodic signal enhancement system
US20160086618A1 (en) A method and apparatus for suppression of unwanted audio signals
KR20120063514A (ko) 오디오 신호를 처리하기 위한 방법 및 장치
CN106463106A (zh) 用于音频接收的风噪声降低
US20080312916A1 (en) Receiver Intelligibility Enhancement System
CN103578477B (zh) 基于噪声估计的去噪方法和装置
US9245538B1 (en) Bandwidth enhancement of speech signals assisted by noise reduction
US8165872B2 (en) Method and system for improving speech quality

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518057 Nanshan District province high tech Industrial Park, Shenzhen, North West New Road, No. 18

Co-patentee after: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee after: AAC ACOUSTIC TECHNOLOGIES (SHENZHEN) Co.,Ltd.

Co-patentee after: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

Address before: 518057 Nanshan District province high tech Industrial Park, Shenzhen, North West New Road, No. 18

Co-patentee before: AAC Acoustic Technology Research Development (Nanjing) Co.,Ltd.

Patentee before: AAC ACOUSTIC TECHNOLOGIES (SHENZHEN) Co.,Ltd.

Co-patentee before: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20170728

Address after: Singapore Ang Mo Kio 65 Street No. 10 techpoint Building 1 floor, No. 8

Co-patentee after: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee after: AAC TECHNOLOGIES Pte. Ltd.

Co-patentee after: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

Address before: 518057 Nanshan District province high tech Industrial Park, Shenzhen, North West New Road, No. 18

Co-patentee before: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee before: AAC ACOUSTIC TECHNOLOGIES (SHENZHEN) Co.,Ltd.

Co-patentee before: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181130

Address after: No. 8, 2 floor, 85 Cavendish Science Park Avenue, Singapore

Co-patentee after: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee after: AAC TECHNOLOGIES Pte. Ltd.

Address before: Singapore Ang Mo Kio 65 Street No. 10 techpoint Building 1 floor, No. 8

Co-patentee before: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee before: AAC TECHNOLOGIES Pte. Ltd.

Co-patentee before: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121010