CN102074246B - 基于双麦克风语音增强装置及方法 - Google Patents

基于双麦克风语音增强装置及方法 Download PDF

Info

Publication number
CN102074246B
CN102074246B CN2011100010419A CN201110001041A CN102074246B CN 102074246 B CN102074246 B CN 102074246B CN 2011100010419 A CN2011100010419 A CN 2011100010419A CN 201110001041 A CN201110001041 A CN 201110001041A CN 102074246 B CN102074246 B CN 102074246B
Authority
CN
China
Prior art keywords
signal
directive property
digital signal
frame
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2011100010419A
Other languages
English (en)
Other versions
CN102074246A (zh
Inventor
叶利剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AAC Technologies Holdings Nanjing Co Ltd
AAC Technologies Pte Ltd
Original Assignee
AAC Acoustic Technologies Shenzhen Co Ltd
AAC Acoustic Technologies Nanjing Co Ltd
AAC Optoelectronic Changzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AAC Acoustic Technologies Shenzhen Co Ltd, AAC Acoustic Technologies Nanjing Co Ltd, AAC Optoelectronic Changzhou Co Ltd filed Critical AAC Acoustic Technologies Shenzhen Co Ltd
Priority to CN2011100010419A priority Critical patent/CN102074246B/zh
Publication of CN102074246A publication Critical patent/CN102074246A/zh
Application granted granted Critical
Publication of CN102074246B publication Critical patent/CN102074246B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供了一种基于双麦克风语音增强装置,包括数字麦克风阵列模块和与所述数字麦克风阵列模块电连接的信号处理集成芯片。其中,所述信号处理集成芯片内设有:脉冲密度调制解码器模块、指向性形成模块、语音增强处理模块和输出模块。本发明还提供了一种基于本发明双麦克风语音增强装置的语音增强方法。与相关技术相比,本发明的基于双麦克风语音增强装置中将解码、降噪等芯片集成到一块信号处理芯片中,集成度高。两个数字麦克风不同方向进声,采用指向性形成抑制波束外的背景噪声。其语音增强方法简单,节约开发成本。

Description

基于双麦克风语音增强装置及方法
【技术领域】
本发明涉及一种语音增强装置及方法,尤其涉及一种基于双麦克风语音增强装置及方法。
【背景技术】
随着无线通讯的发展,全球移动电话用户越来越多,用户对移动电话的要求已不仅满足于通话,而且要能够提供高质量的通话效果,尤其是目前移动多媒体技术的发展,移动电话的通话质量更显重要。
由于大量环境噪声的存在,手机等通讯设备的麦克风采集到的语音信号普遍信噪比不够高,特别是在街道汽车等高噪声环境中,需要提高音量才能使对方听清。所以需要通过语音增强的方法来提升输入语音的信噪比,改善通讯质量。相关技术单通道语音增强方法降噪效果有限,并且会对语音造成较大失真,而双麦克风语音增强装置则可以有效的提高信噪比,相关技术的双麦克风语音增强装置包括麦克风和多种信号处理芯片。
然而,相关技术的双麦克风语音增强装置中的多种信号处理芯片是分开设置的,这种结构使得相关技术的双麦克风语音增强装置的语音增强方法较为复杂,开发成本高。
因此,有必要提出一种新的基于双麦克风语音增强装置来解决上述问题。
【发明内容】
本发明需解决的技术问题是提供一种能优化语音增强方法的基于双麦克风语音增强装置。
根据上述的技术问题,设计了一种基于双麦克风语音增强装置,其目的是这样实现的:一种基于双麦克风语音增强装置,包括数字麦克风阵列模块和与所述数字麦克风阵列模块电连接的信号处理集成芯片,所述数字麦克风阵列模块包括用于接收时域带噪语音数字信号并将接收的时域带噪语音数字信号输出的第一数字麦克风和第二数字麦克风。其中,所述信号处理集成芯片内设有:
第一脉冲密度调制解码器模块,其包括滤波器,用于对时域带噪语音数字信号进行分帧、降采样及滤波处理,得到初步降采样率数字信号;
指向性形成模块,用于将所述初步降采样率数字信号进行指向性形成,得到初步降噪的指向性输出信号;
第二脉冲密度调制解码器模块,用于对所述初步降噪的指向性输出信号进行分帧、降采样、滤波和加重处理,得到第二降采样率数字信号;
语音增强处理模块,用于对所述第二降采样率数字信号进行语音增强处理,得到去除噪声的语音信号;
输出模块,用于输出所述去除噪声的语音信号。
优选的,所述第一脉冲密度调制解码器模块包括N级梳状滤波器。
优选的,所述第二脉冲密度调制解码器模块包括第一半带滤波器、第二半带滤波器、低通滤波器和高通滤波器。
优选的,该装置还包括设有内置空间的壳体,所述壳体内设有挡板,所述挡板将所述内置空间隔成至少三个互不相通的收容空间,所述第一数字麦克风、第二数字麦克风和所述信号处理集成芯片分别置于三个所述收容空间内,收容所述第一数字麦克风和第二数字麦克风的收容空间分别设有第一进声孔和第二进声孔且所述第一进声孔和第二进声孔位于所述壳体的相对的面上。
本发明还提供一种基于本发明所述的基于双麦克风语音增强装置的语音增强方法,该方法包括如下步骤:
步骤S001:通过所述第一数字麦克风经所述第一进声孔接收第一时域带噪语音数字信号;通过所述第二数字麦克风经所述第二进声孔接收第二时域带噪语音数字信号,并将接收到的所述第一时域带噪语音数字信号和第二时域带噪语音数字信号传送给所述第一脉冲密度调制解码器模块。
步骤S002:通过所述第一脉冲密度调制解码器模块对所述第一时域带噪语音数字信号和第二时域带噪语音数字信号进行分帧处理,并利用所述N级梳状滤波器对其进行降采样及滤波处理,得到第一初步降采样率数字信号和第二初步降采样率数字信号。
N级梳状滤波器的传递函数形式如下:
H ( z ) = ( 1 r Σ i = 0 r - 1 z - i ) N , N为级联阶数,r为抽取比例;
x′1(n,m)=x1(rn,m)
x′2(n,m)=x2(rn,m),x1,x2分别为第一、第二时域带噪语音数字信号;
x′1,x′2分别为第一、第二初步降采样率数字信号n表示点数,m表示帧数。
步骤S003:利用所述指向性形成模块接收所述第一脉冲密度调制解码器模块输出的所述第一初步降采样率数字信号和第二初步降采样率数字信号,并对其进行幅度补偿和相位补偿处理,得到第一初步降噪指向性信号和第二初步降噪指向性信号,并将所述第一、第二初步降噪指向性信号相减得到初步降噪指向性输出信号。
所述幅度补偿,形式如下:
x 1 * = a m x 1 ′
x 2 * = a m x 2 ′
其中,
Figure GDA00001674275000034
为分别为第一幅度补偿初步降噪指向性信号和第二幅度补偿初步降噪指向性信号,am为常数,其由所述第一数字麦克风和第二数字麦克风的灵敏度差异决定。
所述相位补偿的形式如下:
x 1 * * ( n , m ) = x 1 * ( n - [ f s d c s ] , m )
x 2 * * ( n , m ) = x 2 * ( n - [ f s d c s ] , m )
其中,
Figure GDA00001674275000043
分别为第一相位补偿初步降噪指向性信号和第二相位补偿初步降噪指向性信号,m为帧数,n为点数,fs为采样率,d为所述第一数字麦克风与第二数字麦克风的距离,Cs为声速。
所述初步降噪指向性输出信号如下:
y ( n , m ) = x 1 * * ( n , m ) - x 2 * * ( n , m )
步骤S004:通过所述第二脉冲密度调制解码器模块对所述初步降噪指向性输出信号进行分帧、降采样、滤波和预加重处理,得到第二降采样率数字信号。
对所述初步降噪指向性输出信号进行分帧后的信号设为y(m),m表示帧数,降采样及滤波处理分为三步:
第一步:先通过所述第一半带滤波器按2∶1的比例对所述初步降噪指向性输出信号抽取采样。
第二步:再通过所述第二半带滤波器按2∶1的比例对上述第一步采样后的指向性输出信号再抽取采样。
第三步:然后通过所述低通滤波器按3∶1的比例对上述第二步采样后的指向性输出信号继续抽取采样。
通过所述高通滤波器对上述第三步采样后的指向性输出信号进行预加重处理,得到第二降采样率数字信号。
步骤S005:通过所述语音增强处理模块对所述第二降采样率数字信号进行语音增强处理,得到去除背景噪声的语音信号,包括如下步骤:
步骤A001:将第二降采样率数字信号经短时傅里叶变换成频域信号,并将该频域信号划分为若干频带,计算各个频带的能量并进行平滑处理。短时傅里叶变换如下:
X ( f , m ) = 2 M Σ n = 0 M - 1 win ( n - m ) × x ( m ) e - 2 πif n M
其中,M为短时傅利叶变换的计算长度,f表示频率值,X表示频域信号,x表示第二降采样率数字信号。
汉明窗函数定义如下:
win(n)={
0.54–0.46cos(2*π*n/M)        0≤n≤M-1
                      0                      其余n
}
采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|X(m,k)|2                      0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)     0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α为平滑因子,此处α=0.75;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号。
步骤A002:用计算器计算先验信噪比估计值
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 SNR ^ prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及当前帧的前一帧得到的噪声能量估计值V(m-1,k),计算各频带当前帧的后验信噪比
Figure GDA00001674275000054
并由前一帧的先验信噪比估计值
Figure GDA00001674275000061
得到当前帧的先验信噪比估计值
Figure GDA00001674275000062
SNR ^ prior ( m , k ) = β | S ^ ( m - 1 , k ) | 2 V ( m , k ) + ( 1 - β ) max [ 0 , SNR post ( m , k ) - 1 ]
Figure GDA00001674275000064
表示前一帧最后得到的增强后语音信号,β为第一平滑系数,V(m,k)为噪声能量估计值。
步骤A003:对先验信噪比估计值
Figure GDA00001674275000065
进行修正,得到修正后的先验信噪比估计值
Figure GDA00001674275000066
先验信噪比估计值
Figure GDA00001674275000067
乘以计权因子去qθ,得到修正后的先验信噪比估计值
Figure GDA00001674275000068
计权因子计算如下:
q &theta; = 1 SNR ^ prior ( m , k ) < &gamma; 1 1 &gamma; 1 - &gamma; 2 ( SNR ^ prior ( m , k ) - &gamma; 2 ) &gamma; 1 < SNR ^ prior ( m , k ) < &theta; z 0 SNR ^ prior ( m , k ) > &theta; z
其中γ1取1.5,γ2取200,θz取20。
步骤A004:根据修正后的先验信噪比估计值
Figure GDA000016742750000610
计算各个频带的衰减增益q(m,k):
q ( m , k ) = { 1 - a - 0.5 &CenterDot; lg [ SNR ^ prior &prime; ( m , k ) ] SNR post
其中,对于不同频带,a为不同的常数。
步骤A005:将当前帧的各频带的频域信号X(m,k),乘以相应频带的衰减增益,得到该频带的增强后的语音信号
Figure GDA00001674275000071
S ^ ( m , k ) = q ( m , k ) * X ( m , k ) 0≤k≤N-1
步骤A006:利用修正后的先验信噪比估计值对当前帧进行判断,判断当前帧是否是噪声并根据判决结果对各频带的噪声能量估计值进行更新:
如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新,并将此噪声能量估计值V(m,k),用于下一帧的步骤A002中,进行后验信噪比的估计;
V(m,k)=μV(m-1,k)+(1-μ)·YE(m,k)
μ表示第二平滑系数。
步骤A007:将增强后的语音信号
Figure GDA00001674275000074
用短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+bz-1,其中b为一般常数,进行去加重处理,得到去除背景噪声的语音信号。
步骤S006:通过所述输出模块接收所述语音增强处理模块输出的所述去除背景噪声的语音信号并输出。
优选的,步骤A004中还包括采用门限判决对所述衰减增益进行调整;
首先设定一阀值、调整值qmod和门限值qfloor
其次以当前帧修正后的先验信噪比估计值
Figure GDA00001674275000075
为判断,小于所述阈值的衰减增益均乘以调整值qmod,从而进一步抑制噪声。
接着将所有小于等于门限值的衰减增益调整到门限值qfloor,方法如下:
Figure GDA00001674275000076
其中qmod=0.1,θG=1.2,qfloor=0.01。
【附图说明】
图1为本发明基于双麦克风语音增强装置的方法的流程示意图。
图2为本发明基于双麦克风语音增强装置的结构框图。
图3为本发明基于双麦克风语音增强装置的方法的非线性计权曲线图。
【具体实施方式】
下面结合附图和实施方式对本发明作进一步说明。
如图1-3所示,一种基于双麦克风语音增强装置,包括数字麦克风阵列模块和与所述数字麦克风阵列模块电连接的信号处理集成芯片3,所述数字麦克风阵列模块包括用于接收时域带噪语音数字信号并将接收的时域带噪语音数字信号输出的第一数字麦克风1和第二数字麦克风2。其中,所述信号处理集成芯片3内设有:
第一脉冲密度调制解码器模块,其包括滤波器,用于对时域带噪语音数字信号进行分帧、降采样及滤波处理,得到初步降采样率数字信号;
指向性形成模块,用于将所述初步降采样率数字信号进行指向性形成,得到初步降噪的指向性输出信号;
第二脉冲密度调制解码器模块,用于对所述初步降噪的指向性输出信号进行分帧、降采样、滤波和加重处理,得到第二降采样率数字信号;
语音增强处理模块,用于对所述第二降采样率数字信号进行语音增强处理,得到去除噪声的语音信号;
输出模块,用于输出所述去除噪声的语音信号。
优选的,所述第一脉冲密度调制解码器模块包括N级梳状滤波器。
优选的,所述第二脉冲密度调制解码器模块包括第一半带滤波器、第二半带滤波器、低通滤波器和高通滤波器。
优选的,该装置还包括设有内置空间的壳体5,壳体5内设有挡板4,挡板4将所述内置空间隔成至少三个互不相通的收容空间(示标号),所述第一数字麦克风1、第二数字麦克风2和所述信号处理集成芯片3分别置于三个所述收容空间内,收容第一数字麦克风1和第二数字麦克风2的收容空间分别设有第一进声孔11和第二进声孔21且第一进声孔11和第二进声孔21位于所述壳体的相对的面上。
本发明还提供一种基于本发明的双麦克风语音增强装置的语音增强方法,详细而言,该方法中的降噪算法基本步骤如下:
1、对第一数字麦克风和第二数字麦克风分别接收到的第一时域带噪语音数字信号和第二时域带噪语音数字信号进过分帧,降采样滤波处理,得到初步降采样率数字信号。
2、初步降采样率数字信号通过指向性模块对其幅度补偿及相位补偿处理,得到初步降噪指向性输出信号。
3、初步降噪指向性输出信号经过多级降采样滤波处理,得到第二降采样率数字信号。
4、将第二降采样率数字信号经过加窗、预加重、短时傅里叶变换处理,得到频域内的第二降采样率数字信号并将其划分为若干频带,计算各个频带能量并对各个频带能量进行平滑处理,得到经平滑处理后的每个频带区间的能量及噪声能量估计值。
5、根据每个频带区间的能量及噪声能量估计值,计算各个频带当前帧的后验信噪比,并由当前帧的前一帧的先验信噪比估计值得到当前帧的先验信噪比估计值。
6、对得到的先验信噪比估计值采用计权噪声估计法进行修正。
7、根据得到的修正先验信噪比估计值,计算各个频带的衰减增益因子。
8、采用门限判决对增益系数进行调整。
9、用得到的衰减增益对各个频带的信号频谱进行处理。
10、由修正的先验信噪比估计值对当前帧的信号进行判断,判断此信号是否是噪声。
11、根据噪声判决结果对各频带的噪声估计值进行更新。
12、将处理后的频域信号变换到时间域,再对变换到时间域的信号进行去加重处理,得到输出信号。
下面以具体实例对该语音增强方法进行说明:
步骤S001:利用第一数字麦克风从第一进声孔接收第一时域带噪语音数字信号x1(n);利用第二数字麦克风从第二进声孔接收第二时域带噪语音数字信号x2(n),并将所述接收到的第一、第二时域带噪语音数字信号x1(n),x2(n)传送给脉冲密度调制解码器模块;
步骤S002:通过脉冲密度调制解码器模块对第一、第二时域带噪语音数字信号x1(n),x2(n)按16∶1的信号抽取比例进行分帧处理,分帧后的第一、第二时域带噪语音数字信号的采样率为3.072MHz,再经降采样后其输出频率为192kHz;
所谓对第一、第二时域带噪语音数字信号x1(n),x2(n)进行分帧,是指将第一、第二时域带噪语音数字信号x1(n),x2(n)以帧为单位等分成若干带噪信号单元。所述带噪信号单元由采样点组成,本发明中数字麦克风采样频率为3.072MHz,采用64倍降采样率,根据短时谱分析的需要,帧长设定成10~35ms之间,本实施方式以16ms分帧,即一帧带噪信号单元设有49152个采样点。当然,任意一帧带噪信号单元都具有一定的帧长,本发明中任意帧的帧长为49152。
为了防止相邻两帧的带噪信号单元间的块效应,在分帧时要使相邻两帧的带噪信号单元之间有一定的混叠部分,即,本帧数据中有D个数据为前一帧数据的部分数据,其中混叠部分描述如下:
s(n)=d(m,D+n)                    0≤n<L,i=1,2
其中xi表示输入带噪语音信号,i取1和2分别表示两路信号
di(m,n)=di(m-1,L+n)        0≤n<D
其中,di表示当前帧的49152点采样信号,因为任意一帧的长度为49152,重叠率为75%,所以重叠部分的采样点个数D=36864。相邻帧的带噪信号单元的第一个采样点相隔的距离L=49152-36864=12288。
本发明相邻两帧的带噪信号单元之间可以具有50%~75%的重叠率。本实施方式选取相邻两帧的带噪信号单元之间具有75%的重叠率,即以本帧的前75%(36864点)的带噪信号单元和本帧的前一帧的后75%(36864点)的带噪语音信号单元一致。
降采样滤波器采用5级的梳状滤波器,梳状滤波器的传递函数形式如下:
H ( z ) = ( 1 r &Sigma; i = 0 r - 1 z - i ) N
N为级联阶数取5,r为抽取比例取16
x′1(n,m)=x1(16n,m)
x′2(n,m)=x2(16n,m)
得到第一、第二初步降采样的信号x′1,x′2,采样率降低为192kHz,其中,n表示点数,m表示帧数。
步骤S003:利用指向性形成模块接收脉冲密度调制解码器模块输出的第一、第二初步降采样信号x′1,x′2,并对第一、第二初步降采样信号x′1,x′2进行幅度补偿和相位补偿,得到第一、第二初步降噪指向性信号并将第一、第二初步降指向性信号相减,得到初步降噪指向性输出信号y(n,m)。
所述幅度补偿,形式如下:
x 1 * = a m x 1 &prime;
x 2 * = a m x 2 &prime;
其中am为常数,其由第一数字麦克风和第二数字麦克风的灵敏度差异决定。
所述相位补偿的形式如下:
x 1 * * ( n , m ) = x 1 * ( n - [ f s d c s ] , m )
x 2 * * ( n , m ) = x 2 * ( n - [ f s d c s ] , m )
其中m为帧数,n为点数,fs为采样率,其值取192kHz,d为第一数字麦克风和第二数字麦克风的距离,Cs为声速。
所述初步降噪指向性输出信号y(n,m)如下:
y ( n , m ) = x 1 * * ( n , m ) - x 2 * * ( n , m )
步骤S004:利用第二脉冲密度调制解码器模块对初步降噪指向性输出信号进行分帧、降采样、滤波和预加重处理,得到第二降采样率数字信号,具体为:
对所述初步降噪信号进行分帧处理后的信号为y(m),m表示帧数,降采样及滤波分为三步:
第一步:先通过所述第一半带滤波器按2∶1的比例对所述初步降噪指向性输出信号抽取采样,使其采样率降至96kHz;
第二步:再通过所述第二半带滤波器按2∶1的比例对上述第一步采样后的指向性输出信号再抽取采样,使其采样率降至48kHz;
第三步:然后通过所述低通滤波器按3∶1的比例对上述第二步采样后的指向性输出信号继续抽取采样,使其采样率降至16kHz;
第一半带滤波器为14阶有限冲激响应滤波器:
y 1 &prime; ( n , m ) = &Sigma; i = 0 14 a 1 ( i ) y ( n - i , m )
y1(n,m)=y′1(2n,m)
第二半带滤波器为190阶有限冲激响应滤波器:
y 2 &prime; ( n , m ) = &Sigma; i = 0 190 a 2 ( i ) y 1 ( n - i , m )
y2(n,m)=y′2(2n,m)
低通滤波器为86阶有限冲激响应滤波器:
y 3 &prime; ( n , m ) = &Sigma; i = 0 86 a 3 ( i ) y 2 ( n - i , m )
y3(n,m)=y′3(3n,m)
通过所述高通滤波器对上述第三步采样后的指向性输出信号进行预加重处理,得到第二降采样率数字信号。
高通滤波器其形式如下:
H(z)=1-αz-1,其中常数α=0.9325
步骤S005:利用语音增强处理模块对第二降采样率数字信号进行语音增强处理,形成去除背景噪声的语音信号;
由于语音信号是短时平稳的,所以对语音信号进行分帧处理是可行的,但分帧又会带来帧信号边界处的不连续而造成的频率泄露。所以要对帧信号进行短时傅里叶变换(STFT)。短时傅里叶变换可以理解为对帧信号先加窗再做傅里叶变换。加窗函数的目的就是为了在做短时傅里叶变换时,减少帧信号边界处的不连续造成的频率泄露。本实施方式中使用了一个长度等于帧长256点的汉明窗,此汉明窗可以有效的降低吉布斯效应的震荡程度,具体如下:
步骤A001:将第二降采样率数字信号经短时傅里叶变换成频域信号,并将该频域信号划分为若干频带,计算各个频带的能量并对其进行平滑处理。
短时傅里叶变换如下:
X ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; x ( m ) e - 2 &pi;if n M
其中,M为短时傅利叶变换的计算长度,f表示频率值,X表示频域信号,x表示第二降采样率数字信号;
汉明窗函数定义如下:
win(n)={
0.54–0.46cos(2*π*n/M)        0≤n≤M-1
                      0                    其余n
}
则短时傅里叶变换如下
Y ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; y ( m ) e - 2 &pi;jf n M
其中,M=256,为短时傅利叶变换的计算长度,m表示第m帧信号。
这样就将当前帧的带噪语音信号y从时域变换到为频域信号Y。
变换到频域后的带噪语音信号包括语音信号和噪声信号,其以帧为单位划分为若干频带。
接着对频率为8kHz以下的变换到频域后的带噪语音的信号进行频带划分,之后的信号处理均在各个频带中进行,这样既可以减少运算复杂度,又可以针对不同的频带做不同的处理,得到更好的效果。
本发明中的信号共划分为30个频带。具体见表1。
表1 23个频带划分
  频带数   起始频率(Hz)   截止频率(Hz)
  1   62.5   93.75
  2   125   156.25
  3   187.5   218.75
  4   250   281.25
  5   312.5   343.75
  6   375   406.25
  7   437.5   468.75
  8   500   531.25
  9   562.5   593.75
  10   625   656.25
  11   687.5   718.75
  12   750   781.25
  13   812.5   906.25
  14   937.5   1062.5
  15   1093.75   1250
  16   1281.25   1468.75
  17   1500   1718.75
  18   1750   2000
  19   2031.25   2312.5
  20   2343.75   2687.5
  21   2718.75   3125
  22   3156.25   3687.5
  23   3718.75   3968.75
  24   4000   4312.5
  25   4343.75   4687.5
  26   4718.75   5156.5
  27   5187.5   5718.75
  28   5750   6250
  29   6281.25   6875
  30   6936.25   7968.75
采用如下方法计算每个频带的能量并对其进行平滑处理:
E(m,k)=|X(m,k)|2                            0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)          0≤k≤N-1
其中,YE(m,k)表示经平滑处理后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α为平滑因子,此处α=0.75,N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号。
步骤A002:用计算器计算先验信噪比估计值
Figure GDA00001674275000161
计算当前帧信号的后验信噪比,具体如下:
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值
Figure GDA00001674275000162
由各频带的能量YE(m,k)及当前帧的前一帧得到的噪声能量估计值V(m-1,k),计算各频带当前帧的后验信噪比:
SNR post ( m , k ) = Y E ( m , k ) V ( m - 1 , k )
然后基于Ephraim-Malah(伊弗雷-马拉)的先验信噪比估计公式,计算当前帧的先验信噪比估计值:
SNR ^ prior ( m , k ) = &beta; | S ^ ( m - 1 , k ) | 2 V ( m , k ) + ( 1 - &beta; ) max [ 0 , SNR post ( m , k ) - 1 ]
Figure GDA00001674275000172
表示前一帧最后得到的增强后语音信号,β为第一平滑系数,V(m,k)为噪声能量估计值。
步骤A003:对先验信噪比估计值
Figure GDA00001674275000173
进行修正,得到修正后的先验信噪比估计值
基于Ephraim-Malah(伊弗雷-马拉)的先验信噪比估计值,会出现对噪声的过估计,即对于高信噪比的情况下,得到的信噪比估计值偏高,造成增强后的语音信号失真,本实施方式中采用计权噪声估计方法对先验信噪比估计值
Figure GDA00001674275000175
进行修正。
先验信噪比估计值
Figure GDA00001674275000176
乘以计权因子去qθ,得到修正后的先验信噪比估计值
Figure GDA00001674275000177
计权因子计算如下:
q &theta; = 1 SNR ^ prior ( m , k ) < &gamma; 1 1 &gamma; 1 - &gamma; 2 ( SNR ^ prior ( m , k ) - &gamma; 2 ) &gamma; 1 < SNR ^ prior ( m , k ) < &theta; z 0 SNR ^ prior ( m , k ) > &theta; z
其中γ1取1.5,γ2取200,θz取20。
步骤A004:根据修正后的先验信噪比估计值
Figure GDA00001674275000179
计算各个频带的衰减增益q(m,k)。
各个频带的衰减增益q(m,k)基于先验信噪比估计值采用频谱相减的方法得到衰减因子,其具体公式如下
q ( k ) = { 1 - a - 0.5 &CenterDot; lg [ SNR ^ prior &prime; ( k ) ] SNR post
其中,对于不同频带,α为不同的常数。
这里考虑到噪声主要集中在较低的频带,因此对于中低频段和高频,α取不同值。
本发明中对于k≤14的频带,即频率为1.2kHz以下的信号,α=8.89,
对于14<k≤18的频带,即频率为1.2~2kHz之间的信号,α=6.44,
对于18<k≤23的频带,即频率为2~4kHz以上的信号,α=6.21
对于k>23的频带,即频率为4kHz以上的信号,α=5.37。
采用门限判决对所述衰减增益进行调整:
首先,设定一阀值、调整值qmod和门限值qfloor
其次,以当前帧修正后的先验信噪比估计值
Figure GDA00001674275000182
为判断,小于所述阈值的衰减增益均乘以调整值qmod,从而进一步抑制噪声;
接着将所有小于等于门限值的衰减增益调整到门限值qfloor,这样做可以避免一定的语音失真。具体方法如下:
Figure GDA00001674275000183
Figure GDA00001674275000184
其中qmod=0.1,θG=1.2,qfloor=0.01。
步骤A005:将当前帧的各频带的频域信号X(m,k),乘以相对应频带的衰减增益,得到该频带的增强后的语音信号
Figure GDA00001674275000191
S ^ ( m , k ) = q ( m , k ) * X ( m , k ) 0≤k≤N-1
步骤A006:利用修正后的先验信噪比估计值
Figure GDA00001674275000193
对当前帧进行判断,判断当前帧是否是噪声并根据判决结果对各频带的噪声能量估计值进行更新,具体为:
本发明中,每个频带的噪声能量的判决与更新采用了基于先验信噪比的语音激活检测(VAD)方法。首先,判断当前帧是否是纯噪声信号:
VAD ( m ) = &Sigma; k = 1 N [ &gamma; ( m , k ) &zeta; ( m , k ) 1 + &zeta; ( m , k ) - lg ( 1 + &zeta; ( m , k ) ) ]
其中γ(m,k)=min[SNRpost(m,k),40],
&zeta; ( m , k ) = max [ SNR ^ prior ( m , k ) , 10 - 2.5 ]
对VAD(m)进行判断,并进行噪声更新,具体如下:
V ( m , k ) = &mu;V ( m - 1 , k ) + ( 1 - &mu; ) E ( m , k ) VAD ( m ) < &eta; V ( m - 1 , k ) VAD ( m ) &GreaterEqual; &eta;
其中η为噪声更新判决因子,本发明中取η=0.01。
μ为平滑因子,这里取μ=0.9。
如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k)对噪声能量估计值V(m,k)进行更新,并将此噪声能量估计值V(m,k)用于当前帧的下一帧的步骤A002中,进行后验信噪比的估计:
V(m,k)=μV(m-1,k)+(1-μ)·YE(m,k)
其中,μ表示第二平滑系数。
步骤A007:将增强后的语音信号
Figure GDA00001674275000201
用短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器H(z)=1+bz-1,其中b为一般常数,进行去加重处理,得到去除背景噪声的语音信号并输出。
首先,通过逆快速傅里叶变换(FFT)把频域的语音谱变换到时间域,得到增强后的时域语音信号。
时域的变换用通用的逆离散傅利叶变换(IDFT)实现。
s ( m , n ) = 1 2 * &Sigma; n = 0 M - 1 S ^ ( f ) e j 2 &pi;nf / M 0≤k≤M-1
其中,M=256,为帧长,s为变换到时域后的全频带增强后的语音信号。
其次,对增强后的时域语音信号进行去加重处理。
和上述的预加重处理相反,这里将增强后的时域语音信号通过一个低通滤波器,最大程度的将其还原成原有的信号。滤波器的频响如下:
H(z)=1+αz-1,其中α=0.9。
再次,将增强后的语音信号的相邻帧的重叠部分进行相加操作。
具体的重叠部分相加可以用如下的方法来表示:
s &prime; ( n ) = s ( m , n ) + s ( m - 1 , n + L ) 0 &le; n < M - L s ( m , n ) M - L &le; n < M
L=64为相邻的帧信号开始处的距离,M=256,为帧长,s’为去除背景噪声的语音信号。
步骤S006:利用输出模块接收语音增强处理模块输出去除背景噪声的语音信号。
与相关技术比较,本发明的基于双麦克风语音增强装置将解码、降噪等芯片集成到一块信号处理芯片中,集成度高。本发明使用双麦克风阵列,两个数字麦克风不同方向进声,采用指向性形成抑制波束外的背景噪声,并通过从语音增强算法,进一步衰减各类型的背景噪声,采用数字麦克风及相关解码算法,省去了模数转换芯片。数字麦克风采集得到的信号直接进行降噪处理,节省了系统资源。语音增强算法大大提高了对残余噪声的衰减,保证了语音可懂度。传统的ECM麦克风,信号输入后需经过模数转换的过程,占用了系统的资源。而本发明采用的数字麦克风,采集到的信号直接是数字pdm信号,这样无需模数转换,只需要简单的解码即可直接进行降噪处理,大大提高了系统性能。
以上所述的仅是本发明的实施方式,在此应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出改进,但这些均属于本发明的保护范围。

Claims (6)

1.一种基于双麦克风语音增强装置,包括数字麦克风阵列模块和与所述数字麦克风阵列模块电连接的信号处理集成芯片,所述数字麦克风阵列模块包括用于接收时域带噪语音数字信号并将接收的时域带噪语音数字信号输出的第一数字麦克风和第二数字麦克风,其特征在于:所述信号处理集成芯片内设有:
第一脉冲密度调制解码器模块,其包括滤波器,用于对时域带噪语音数字信号进行分帧、降采样及滤波处理,得到初步降采样率数字信号;
指向性形成模块,用于将所述初步降采样率数字信号进行指向性形成,得到初步降噪的指向性输出信号;
第二脉冲密度调制解码器模块,用于对所述初步降噪的指向性输出信号进行分帧、降采样、滤波和加重处理,得到第二降采样率数字信号;
语音增强处理模块,用于对所述第二降采样率数字信号进行语音增强处理,得到去除噪声的语音信号;
输出模块,用于输出所述去除噪声的语音信号。
2.根据权利要求1所述的基于双麦克风语音增强装置,其特征在于:所述第一脉冲密度调制解码器模块包括N级梳状滤波器。
3.根据权利要求2所述的基于双麦克风语音增强装置,其特征在于:所述第二脉冲密度调制解码器模块包括第一半带滤波器、第二半带滤波器、低通滤波器和高通滤波器。
4.根据权利要求3所述的基于双麦克风语音增强装置,其特征在于:该装置还包括设有内置空间的壳体,所述壳体内设有挡板,所述挡板将所述内置空间隔成至少三个互不相通的收容空间,所述第一数字麦克风、第二数字麦克风和所述信号处理集成芯片分别置于三个所述收容空间内,收容所述第一数字麦克风和第二数字麦克风的收容空间分别设有第一进声孔和第二进声孔且所述第一进声孔和第二进声孔位于所述壳体的相对的面上。
5.一种基于如权利要求4所述的基于双麦克风语音增强装置的语音增强方法,其特征在于:该方法包括如下步骤:
步骤S001:通过所述第一数字麦克风经所述第一进声孔接收第一时域带噪语音数字信号;通过所述第二数字麦克风经所述第二进声孔接收第二时域带噪语音数字信号,并将接收到的所述第一时域带噪语音数字信号和第二时域带噪语音数字信号传送给所述第一脉冲密度调制解码器模块;
步骤S002:通过所述第一脉冲密度调制解码器模块对所述第一时域带噪语音数字信号和第二时域带噪语音数字信号进行分帧处理,并利用所述N级梳状滤波器对其进行降采样及滤波处理,得到第一初步降采样率数字信号和第二初步降采样率数字信号;
N级梳状滤波器的传递函数形式如下:
H ( z ) = ( 1 r &Sigma; i = 0 r - 1 z - i ) N , N为级联阶数,r为抽取比例;
x′1(n,m)=x1(rn,m)
x′2(n,m)=x2(rn,m),x1,x2分别为第一、第二时域带噪语音数字信号;
x′1,x′2分别为第一、第二初步降采样率数字信号;
n表示点数,m表示帧数;
步骤S003:利用所述指向性形成模块接收所述第一脉冲密度调制解码器模块输出的所述第一初步降采样率数字信号和第二初步降采样率数字信号,并对其进行幅度补偿和相位补偿处理,得到第一初步降噪指向性信号和第二初步降噪指向性信号,并将所述第一、第二初步降噪指向性信号相减得到初步降噪指向性输出信号;
经过幅度补偿,形式如下:
x 1 * = a m x 1 &prime;
x 2 * = a m x 2 &prime;
其中,
Figure FDA00001674274900031
为分别为第一幅度补偿初步降噪指向性信号和第二幅度补偿初步降噪指向性信号,am为常数,其由所述第一数字麦克风和第二数字麦克风的灵敏度差异决定;
所述相位补偿的形式如下:
x 1 * * ( n , m ) = x 1 * ( n - [ f s d c s ] , m )
x 2 * * ( n , m ) = x 2 * ( n - [ f s d c s ] , m )
其中,
Figure FDA00001674274900034
分别为第一相位补偿初步降噪指向性信号和第二相位补偿初步降噪指向性信号,m为帧数,n为点数,fs为采样率,d为所述第一数字麦克风与第二数字麦克风的距离,Cs为声速;
所述初步降噪指向性输出信号如下:
y ( n , m ) = x 1 * * ( n , m ) - x 2 * * ( n , m )
步骤S004:通过所述第二脉冲密度调制解码器模块对所述初步降噪指向性输出信号进行分帧、降采样、滤波和预加重处理,得到第二降采样率数字信号;
对所述初步降噪指向性输出信号进行分帧后的信号设为y(m),m表示帧数,降采样及滤波处理分为三步:
第一步:先通过所述第一半带滤波器按2∶1的比例对所述初步降噪指向性输出信号抽取采样;
第二步:再通过所述第二半带滤波器按2∶1的比例对上述第一步采样后的指向性输出信号再抽取采样;
第三步:然后通过所述低通滤波器按3∶1的比例对上述第二步采样后的指向性输出信号继续抽取采样;
通过所述高通滤波器对上述第三步采样后的指向性输出信号进行预加重处理,得到第二降采样率数字信号;
步骤S005:通过所述语音增强处理模块对所述第二降采样率数字信号进行语音增强处理,得到去除背景噪声的语音信号,包括如下步骤:
步骤A001:将第二降采样率数字信号经短时傅里叶变换成频域信号,并将该频域信号划分为若干频带,计算各个频带的能量并进行平滑处理;
短时傅里叶变换如下:
X ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; x ( m ) e - 2 &pi;if n M
其中,M为短时傅利叶变换的计算长度,f表示频率值,X表示频域信号,x表示第二降采样率数字信号;
汉明窗函数定义如下:
win(n)={
0.54–0.46cos(2*π*n/M)        0≤n≤M-1
                      0                       其余n
}
采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|X(m,k)|2                        0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)      0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α为平滑因子,此处α=0.75;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号;
步骤A002:用计算器计算先验信噪比估计值
Figure FDA00001674274900042
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 SNR ^ prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各频带当前帧的后验信噪比
Figure FDA00001674274900052
并由前一帧的先验信噪比估计值
Figure FDA00001674274900053
得到当前帧的先验信噪比估计值
SNR ^ prior ( m , k ) = &beta; | S ^ ( m - 1 , k ) | 2 V ( m , k ) + ( 1 - &beta; ) max [ 0 , SNR post ( m , k ) - 1 ]
Figure FDA00001674274900056
表示前一帧最后得到的增强后语音信号,β为第一平滑系数,V(m,k)为噪声能量估计值;
步骤A003:对先验信噪比估计值
Figure FDA00001674274900057
进行修正,得到修正后的先验信噪比估计值
Figure FDA00001674274900058
先验信噪比估计值
Figure FDA00001674274900059
乘以计权因子去qθ,得到修正后的先验信噪比估计值
Figure FDA000016742749000510
计权因子计算如下:
q &theta; = 1 SNR ^ prior ( m , k ) < &gamma; 1 1 &gamma; 1 - &gamma; 2 ( SNR ^ prior ( m , k ) - &gamma; 2 ) &gamma; 1 < SNR ^ prior ( m , k ) < &theta; z 0 SNR ^ prior ( m , k ) > &theta; z
其中γ1取1.5,γ2取200,θz取20;
步骤A004:根据修正后的先验信噪比估计值计算各个频带的衰减增益q(m,k):
q ( m , k ) = { 1 - a - 0.5 &CenterDot; lg [ SNR ^ prior &prime; ( m , k ) ] SNR post
其中,对于不同频带,a为不同的常数;
步骤A005:将当前帧的各频带的频域信号X(m,k),乘以相应频带的衰减增益,得到该频带的增强后的语音信号
Figure FDA00001674274900062
S ^ ( m , k ) = q ( m , k ) * X ( m , k ) 0≤k≤N-1
步骤A006:利用修正后的先验信噪比估计值对当前帧进行判断,判断当前帧是否是噪声并根据判决结果对各频带的噪声能量估计值进行更新:
如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新,并将此噪声能量估计值V(m,k),用于下一帧的步骤A002中,进行后验信噪比的估计;
V(m,k)=μV(m-1,k)+(1-μ)·YE(m,k)
μ表示第二平滑系数;
步骤A007:将增强后的语音信号
Figure FDA00001674274900065
用短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+bz-1,其中b为一般常数,进行去加重处理,得到去除背景噪声的语音信号;
步骤S006:通过所述输出模块接收所述语音增强处理模块输出的所述去除背景噪声的语音信号并输出。
6.根据权利要求5所述的基于双麦克风语音增强装置的语音增强方法,其特征在于,步骤A004中还包括采用门限判决对所述衰减增益进行调整;
首先设定一阀值、调整值qmod和门限值qfloor
其次以当前帧修正后的先验信噪比估计值
Figure FDA00001674274900071
为判断,小于所述阈值的衰减增益均乘以调整值qmod,从而进一步抑制噪声;
接着将所有小于等于门限值的衰减增益调整到门限值qfloor,方法如下:
Figure FDA00001674274900072
Figure FDA00001674274900073
其中qmod=0.1,θG=1.2,qfloor=0.01。
CN2011100010419A 2011-01-05 2011-01-05 基于双麦克风语音增强装置及方法 Expired - Fee Related CN102074246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100010419A CN102074246B (zh) 2011-01-05 2011-01-05 基于双麦克风语音增强装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100010419A CN102074246B (zh) 2011-01-05 2011-01-05 基于双麦克风语音增强装置及方法

Publications (2)

Publication Number Publication Date
CN102074246A CN102074246A (zh) 2011-05-25
CN102074246B true CN102074246B (zh) 2012-12-19

Family

ID=44032764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100010419A Expired - Fee Related CN102074246B (zh) 2011-01-05 2011-01-05 基于双麦克风语音增强装置及方法

Country Status (1)

Country Link
CN (1) CN102074246B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324237B (zh) * 2011-05-30 2013-01-02 深圳市华新微声学技术有限公司 麦克风阵列语音波束形成方法、语音信号处理装置及系统
CN102347027A (zh) * 2011-07-07 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及其语音增强方法
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
CN109119096B (zh) * 2012-12-25 2021-01-22 中兴通讯股份有限公司 一种vad判决中当前激活音保持帧数的修正方法及装置
CN103219012B (zh) * 2013-04-23 2015-05-13 中国人民解放军总后勤部军需装备研究所 一种基于声源距离的双麦克风噪声消除方法及装置
CN106328116B (zh) * 2015-06-30 2020-04-17 芋头科技(杭州)有限公司 一种机器人室内噪声控制系统
CN107040856B (zh) * 2016-02-04 2023-12-08 共达电声股份有限公司 一种麦克风阵列模组
CN106373590B (zh) * 2016-08-29 2020-04-03 湖南理工学院 一种基于语音实时时长调整的声音变速控制系统和方法
CN106328155A (zh) * 2016-09-13 2017-01-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种修正先验信噪比过估计的语音增强方法
WO2019061323A1 (zh) * 2017-09-29 2019-04-04 深圳传音通讯有限公司 一种降噪方法及终端
CN107785029B (zh) * 2017-10-23 2021-01-29 科大讯飞股份有限公司 目标语音检测方法及装置
CN107845381A (zh) * 2017-10-27 2018-03-27 安徽硕威智能科技有限公司 一种机器人语义处理的方法及系统
CN109087657B (zh) * 2018-10-17 2021-09-14 成都天奥信息科技有限公司 一种应用于超短波电台的语音增强方法
CN110189746B (zh) * 2019-03-20 2021-06-11 成都天奥信息科技有限公司 一种应用于地空通信的话音识别方法
CN110310635B (zh) * 2019-06-24 2022-03-22 Oppo广东移动通信有限公司 语音处理电路及电子设备
CN111429933B (zh) * 2020-03-06 2022-09-30 北京小米松果电子有限公司 音频信号的处理方法及装置、存储介质
CN111968667A (zh) * 2020-08-13 2020-11-20 杭州芯声智能科技有限公司 一种双麦克风语音降噪装置及其降噪方法
CN112785998B (zh) * 2020-12-29 2022-11-15 展讯通信(上海)有限公司 信号处理方法、设备及装置
CN113077808B (zh) * 2021-03-22 2024-04-26 北京搜狗科技发展有限公司 一种语音处理方法、装置和用于语音处理的装置
CN117278896B (zh) * 2023-11-23 2024-03-19 深圳市昂思科技有限公司 一种基于双麦克风的语音增强方法、装置及助听设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719516A (zh) * 2005-07-15 2006-01-11 北京中星微电子有限公司 自适应滤波装置以及自适应滤波方法
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8335685B2 (en) * 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US20080175408A1 (en) * 2007-01-20 2008-07-24 Shridhar Mukund Proximity filter

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719516A (zh) * 2005-07-15 2006-01-11 北京中星微电子有限公司 自适应滤波装置以及自适应滤波方法
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法

Also Published As

Publication number Publication date
CN102074246A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
CN102074246B (zh) 基于双麦克风语音增强装置及方法
CN102074245B (zh) 基于双麦克风语音增强装置及语音增强方法
CN102347027A (zh) 双麦克风语音增强装置及其语音增强方法
CN101976565A (zh) 基于双麦克风语音增强装置及方法
CN101916567B (zh) 应用于双麦克风系统的语音增强方法
CN101976566B (zh) 语音增强方法及应用该方法的装置
CN101894563B (zh) 语音增强的方法
CN103026407B (zh) 带宽扩展器
CN103730125B (zh) 一种回声抵消方法和设备
CN102576538B (zh) 用于处理音频信号的方法和设备
US8010355B2 (en) Low complexity noise reduction method
CN101599274B (zh) 语音增强的方法
CN100392723C (zh) 在稳定性约束下使用独立分量分析的语音处理系统和方法
CN104424956B (zh) 激活音检测方法和装置
CN101027719B (zh) 噪声抑制装置
CN101582264A (zh) 语音增强的方法及语音增加的声音采集系统
US20130322643A1 (en) Multi-Microphone Robust Noise Suppression
CN101763858A (zh) 双麦克风信号处理方法
CN103632675A (zh) 个人通信中降噪和回波消除时的噪声估计
CN105513605A (zh) 手机麦克风的语音增强系统和语音增强方法
US8306821B2 (en) Sub-band periodic signal enhancement system
GB2398913A (en) Noise estimation in speech recognition
TW201214418A (en) Monaural noise suppression based on computational auditory scene analysis
WO2014181330A1 (en) A method and apparatus for suppression of unwanted audio signals
CN111128214A (zh) 音频降噪方法、装置、电子设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 518057 Nanshan District province high tech Industrial Park, Shenzhen, North West New Road, No. 18

Co-patentee after: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee after: AAC ACOUSTIC TECHNOLOGIES (SHENZHEN) Co.,Ltd.

Co-patentee after: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

Address before: 518057 Nanshan District province high tech Industrial Park, Shenzhen, North West New Road, No. 18

Co-patentee before: AAC Acoustic Technology Research Development (Nanjing) Co.,Ltd.

Patentee before: AAC ACOUSTIC TECHNOLOGIES (SHENZHEN) Co.,Ltd.

Co-patentee before: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP03 Change of name, title or address

Address after: Singapore Ang Mo Kio 65 Street No. 10 techpoint Building 1 floor, No. 8

Co-patentee after: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee after: AAC TECHNOLOGIES Pte. Ltd.

Co-patentee after: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

Address before: 518057 Nanshan District province high tech Industrial Park, Shenzhen, North West New Road, No. 18

Co-patentee before: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee before: AAC ACOUSTIC TECHNOLOGIES (SHENZHEN) Co.,Ltd.

Co-patentee before: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20181210

Address after: No. 8, 2 floor, 85 Cavendish Science Park Avenue, Singapore

Co-patentee after: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee after: AAC TECHNOLOGIES Pte. Ltd.

Address before: Singapore Ang Mo Kio 65 Street No. 10 techpoint Building 1 floor, No. 8

Co-patentee before: AAC TECHNOLOGIES (NANJING) Co.,Ltd.

Patentee before: AAC TECHNOLOGIES Pte. Ltd.

Co-patentee before: AAC MICROTECH (CHANGZHOU) Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121219