CN106297817A - 一种基于双耳信息的语音增强方法 - Google Patents

一种基于双耳信息的语音增强方法 Download PDF

Info

Publication number
CN106297817A
CN106297817A CN201510312683.9A CN201510312683A CN106297817A CN 106297817 A CN106297817 A CN 106297817A CN 201510312683 A CN201510312683 A CN 201510312683A CN 106297817 A CN106297817 A CN 106297817A
Authority
CN
China
Prior art keywords
power spectrum
voice
speech power
interference noise
phonetic speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510312683.9A
Other languages
English (en)
Other versions
CN106297817B (zh
Inventor
冯海泓
方义
陈友元
刘畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201510312683.9A priority Critical patent/CN106297817B/zh
Publication of CN106297817A publication Critical patent/CN106297817A/zh
Application granted granted Critical
Publication of CN106297817B publication Critical patent/CN106297817B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及一种基于双耳信息的语音增强方法,包括:将左右耳麦克风信号从时域变换到频域,然后做频带分解,根据频带分解的结果划分低频区域和高频区域;根据左右耳麦克风信号的能量比值,将能量高的一侧作为干扰噪声源所在的一侧;在低频区域利用双耳时间差估计语音功率谱,在高频区域利用双耳声级差估计语音功率谱以及语音的相干函数;将语音功率谱和相干函数联合起来计算干扰噪声的冲击响应比值;根据冲击响应比值、语音功率谱以及两个麦克风的能量差计算维纳滤波器的两个增益,所述维纳滤波器的两个增益分别对应左耳麦克风与右耳麦克风;利用维纳滤波器的两个增益分别对左耳麦克风信号与右耳麦克风信号进行处理,得到增强后的语音信号。

Description

一种基于双耳信息的语音增强方法
技术领域
本发明涉及一种语音信号处理方法,特别是涉及一种基于双耳信息的语音增强方法。
背景技术
在实际生活中,语音信号总是受到各种噪声源的干扰,助听器、人工耳蜗佩戴者对噪声的容忍程度比正常听力人更低。现有的单耳助听器广泛采用双麦克风,目的是双麦克风能够抑制方向性干扰噪声,使得助听器、人工耳蜗佩戴者能够更好的专注于前方声音,即面对面交流场景。但是,很多听力患者都有双耳听力损失情况的出现,如果长期单耳佩戴,会使另外一只耳朵听力损失越来越严重,而且,传统的单耳佩戴不能获得声音的立体信号,听力患者没有声源定位能力,这在一定程度上降低了语音的可懂度。
随着无线连接技术的快速发展,双耳助听器、人工耳蜗得以实现,利用先进的无线连接技术,左右耳的两个麦克风可以互相通信。这为基于双耳信息的语音增强方法的实现提供了现实可行性。现有技术中具有语音增强方法,如在参考文献1“Klasen T,Doclo S,den Bogaert T.V.Binaural multi-channel winer filtering for hearingaids:preserving interaural time and level differences.In:IEEE International Conference onAcoustics,speech and signal processing(ICASSP),2006:145-148”中所披露的多通道维纳滤波法,在参考文献2“Roohollah A,Ahmad A,Mohsen R.Two-microphone binarymask speech enhancement application to diffuse and dorectionl noise fields.IEEE.ETRIjournal,2014;36(5):772-781”中所披露的二值掩码法,在参考文献3“Li J,SakamotoS,Hongo S,Akagi M,Suzuki Y.Two-stage binaural speech enhancement with Wienerfilter based on equalization-cancellation model.In:IEEE Workshop on Applications ofSignal Processing to Audio and Acoustics(WASPAA),2009:133–136”中所披露的基于均衡抵消模型算法等。现有技术中的语音增强方法各自存在一定的缺陷,如多通道维纳滤波法对非平稳噪声抑制效果差;二值掩码法容易产生音乐噪声;基于均衡抵消模型算法要求预先准确知道目标语音方位信息,存在一定局限性。
发明内容
本发明的目的在于克服已有技术中的语音增强方法所存在的缺陷,从而提供一种有效滤除非平稳噪声,并保持目标语音未失真的语音增强方法。
为了实现上述目的,本发明提供了一种基于双耳信息的语音增强方法,包括:
步骤1)、将左右耳麦克风信号从时域变换到频域,然后做频带分解,根据频带分解的结果划分低频区域和高频区域;
步骤2)、根据左右耳麦克风信号的能量比值,将能量高的一侧作为干扰噪声源所在的一侧;
步骤3)、在低频区域利用双耳时间差估计语音功率谱,在高频区域利用双耳声级差估计语音功率谱以及语音的相干函数;
步骤4)、将步骤3)计算得到的语音功率谱和相干函数联合起来计算干扰噪声的冲击响应比值;
步骤5)、根据步骤4)计算得到的冲击响应比值、步骤3)得到的语音功率谱以及两个麦克风的能量差计算维纳滤波器的两个增益,所述维纳滤波器的两个增益分别对应左耳麦克风与右耳麦克风;
步骤6)、利用步骤5)所得到的维纳滤波器的两个增益分别对左耳麦克风信号与右耳麦克风信号进行处理,得到增强后的语音信号。
上述技术方案中,所述步骤3)进一步包括:
步骤3-1)、在高频区域,利用双耳声级差估计语音功率谱以及语音的相干函数;假设干扰噪声来自于左右两侧中的某一侧,则对高频区域的每个频率点执行如下步骤:
步骤3-1-1)、计算双耳声级差,如果双耳声级差ΔPLD<Φmin,则能量差很小,表明该频率点位于语音段,由此更新语音功率谱以及语音的相干函数;其中,
双耳声级差的计算公式为:
Δ PLD = P X 1 X 1 - P X 2 X 2 P X 1 X 1 + P X 2 X 2 ;
其中,PX1X1代表干扰噪声所在一侧的信号自功率谱,PX2X2代表与干扰噪声所在一侧相反的另一侧的信号自功率谱;
语音功率谱的计算公式为:
PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|2
其中,λ和μ分别表示所在的帧和该帧的频率点;α1为平滑因子,X1为干扰噪声所在一侧的麦克风信号;
语音的相干函数的计算公式为:
ΓS(λ,μ)=αΓS(λ-1,μ)+(1-αΓ)*Γx(λ,μ);
αΓ为平滑因子;Γs、Γx分别表示语音的相干函数以及混合信号的相干函数;
步骤3-1-2)、如果双耳声级差ΔPLD>Φmax,此时表明能量差很大,频率点位于干扰噪声段,此时不更新语音功率谱与语音的相干函数,即:
PS(λ,μ)=PS(λ-1,μ),
ΓS(λ,μ)=ΓS(λ-1,μ);
步骤3-1-3)、如果Φmin<ΔPLD<Φmax,即此时能量差介于不大不小之间,则此时的语音功率谱用信噪比高的那一端的信号来估计,语音的相干函数不更新,即:
PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2
ΓS(λ,μ)=ΓS(λ-1,μ);
其中,α2为平滑因子;
步骤3-2)、在低频区域,首先将语音的相干函数设为1,然后利用双耳时间差估计语音功率谱,假设干扰噪声来自于左右两侧中的某一侧,则对低频区域的每个频率点执行如下步骤:
步骤3-2-1)、计算双耳时间差,如果双耳时间差ITD(λ,k)<Tmin,则表明该频率点无时延差,此时位于语音段,更新语音功率谱;其中,
计算双耳时间差的公式为:
ITD ( &lambda; , &mu; ) = | 1 w k &angle; ( P X 1 X 2 ( &lambda; , &mu; ) ) | ;
其中,∠代表两个通道信号的相位差,wk代表角频率,PX1X2代表两个通道的互功率谱,λ和μ分别表示所在的帧和该帧的频率点;
语音功率谱的计算公式为:
PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|2
步骤3-2-2)、如果双耳时间差ITD(λ,k)>Tmax,则表明该频率点位于干扰噪声段,此时不更新语音功率谱,即:
PS(λ,μ)=PS(λ-1,μ);
步骤3-2-3)、如果Tmin<ITD(λ,k)<Tmax,即此时能量差介于不大不小之间,则利用信噪比高的一端的麦克风信号进行语音功率谱的更新,即:
PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2
上述技术方案中,所述Φmin在0.1-0.3之间,所述Φmax在0.7-0.9之间;所述Tmin在100us-200us之间,所述Tmax在300us-400us之间。
上述技术方案中,在步骤4)中,干扰噪声的冲击响应比值的计算公式为:
H 12 = P X 1 X 2 - P S 1 S 2 P X 1 - P S 1 ,
其中,H12为干扰噪声的冲击响应比值;PS1S2=ΓS*PS,PS为步骤3)得到的语音功率谱,ΓS为步骤3)得到的语音的相干函数;PX1X2代表两个通道的互功率谱,PX1表示干扰噪声所在一侧的麦克风信号在频域的表达式,PS1表示干扰噪声所在一侧的麦克风所接收的语音在频域的表达式。
上述技术方案中,在步骤5)中,将对应左耳麦克风的维纳滤波器的增益记为GX1,将对应右耳麦克风的维纳滤波器的增益记为GX2,这两种增益的计算公式如下:
如果干扰噪声来自左侧,则:
G X 1 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + &Delta;PX G X 2 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + H 12 * &Delta;PX
如果干扰噪声来自右侧,则:
G X 1 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + H 12 * &Delta;PX G X 2 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + &Delta;PX
其中,ΔPX=|PX1X1-PX2X2|为左右两个通道的能量差;PS为语音功率谱;H12为干扰噪声的冲击响应比值;
上述技术方案中,所述步骤6)包括:在频域中,将左耳麦克风信号乘以对应左耳麦克风的维纳滤波器的增益GX1,将右耳麦克风信号乘以对应右耳麦克风的维纳滤波器的增益GX2,最后对所得到的乘积结果进行傅里叶逆变换,得到增强后的语音。
本发明的优点在于
本发明克服了现有技术中的语音增强方法的缺点,有效滤除非平稳噪声,同时保证了目标语音未失真。
附图说明
图1是一个语音场景的示意图;
图2是本发明的双耳语音增强方法的原理示意图。
具体实施方式
现结合附图对本发明作进一步的描述。
本发明的双耳语音增强方法利用侧边过来的干扰声在左右耳之间形成的声级差(ILD)与时间差(ITD)来构造一个维纳滤波器,从而达到增强正前方语音,抑制侧边语音的目的。本发明方法适用于佩戴有双耳助听器、人工耳蜗、降噪耳机等听力设备的听力患者,本发明方法应用的前提在于左右两个麦克风数据能够无线连接。
图1为一个语音场景的示意图,在该图中,听众的左耳佩戴有左麦克风、听众的右耳佩戴有右麦克风。目标语音位于听众的正前方、干扰噪声则位于听众的侧边。在这一场景下,参考图2,本发明的方法包括以下步骤:
步骤1)、获取左右耳两个麦克风的信号,将左耳麦克风的信号记为X1,将右耳麦克风的信号记为X2;所述左耳麦克风与右耳麦克风信号的具体表达式如下:
X1=S1+N1
X2=S2+H12*N1,其中S1、S2代表左耳麦克风与右耳麦克风分别接收到的语音信号,N1代表干扰噪声信号,H12代表干扰噪声在左右耳冲击响应函数的比值。
步骤2)、将步骤1)所得到的左耳麦克风信号X1与右耳麦克风信号X2从时域变换到频域,然后再对左耳麦克风信号X1与右耳麦克风信号X2进行频带分解,接着根据频带分解的结果划分一个低频区域和高频区域;其中,在一个实施例中,所述麦克风信号采用256点为一帧,128个点为帧移,采样率为16KHZ,然后通过短时傅里叶变换将麦克风信号从时域变换到频域,对麦克风信号做频带分解时,每一个点即为一个频带。
左耳麦克风信号与右耳麦克风信号变换到频域后的表达式为:
PX1=PS1+PN1
PX2=PS2+|H12|2*PN1,其中P表示功率谱,||表示绝对值。
在一个实施例中,高于1khz为高频区域,低于1khz为低频区域。
步骤3)、通过比较两侧麦克风信号的能量比值(即PX1与PX2之间的比值),判断干扰噪声源来自于哪一侧,能量高的一侧就是干扰噪声源所在的一侧;
步骤4)、在低频区域利用双耳时间差(ITD)估计语音功率谱,在高频区域利用双耳声级差(ILD)估计语音功率谱以及语音的相干函数;其中,
所述双耳声级差的计算公式为:
所述双耳时间差的计算公式为: ITD ( &lambda; , &mu; ) = | 1 w k &angle; ( P X 1 X 2 ( &lambda; , &mu; ) ) | ;
上述公式中,PX1X1代表左耳信号自功率谱,PX2X2代表右耳信号自功率谱,∠代表两个通道信号的相位差,wk代表角频率,PX1X2代表两个通道的互功率谱,λ和μ分别表示所在的帧和该帧的频率点。这些值的计算为本领域技术人员的公知常识,因此不在此处重复。
所述步骤4)进一步包括:
步骤4-1)、在高频区域,利用双耳声级差估计语音功率谱以及语音的相干函数;假设干扰噪声来自于左侧(如果干扰噪声来自右侧,则互换以下公式中的X1和X2),则对高频区域的每个频率点执行如下步骤:
步骤4-1-1)、如果双耳声级差ΔPLD<Φmin,则能量差很小,表明该频率点位于语音段,由此更新语音功率谱以及语音的相干函数的公式,相关公式的表达式如下:
PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|2
ΓS(λ,μ)=αΓS(λ-1,μ)+(1-αΓ)*Γx(λ,μ)
其中,λ和μ分别表示所在的帧和该帧的频率点;α1、αΓ为平滑因子,它们的取值范围为0.7-0.9。Γs、Γx分别表示语音的相干函数以及混合信号的相干函数。语音功率谱与语音相干函数的初始值(即λ=1时)为初始帧的数值。
本步骤中,Φmin为一判断阈值,其取值范围在0.1-0.3之间。
步骤4-1-2)、如果ΔPLD>Φmax,此时表明能量差很大,该频率点位于干扰噪声段,此时不更新语音功率谱与语音的相干函数,即:
PS(λ,μ)=PS(λ-1,μ),
ΓS(λ,μ)=ΓS(λ-1,μ);
本步骤中,Φmax为一判断阈值,其取值范围在0.7-0.9之间。
步骤4-1-3)、如果Φmin<ΔPLD<Φmax,即此时能量差介于不大不小之间,则此时的语音功率谱用信噪比高的那一端的信号来估计,语音的相干函数不更新,即:
PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2
ΓS(λ,μ)=ΓS(λ-1,μ);
其中,α2为平滑因子,其取值范围为0.7-0.9。
步骤4-2)、在低频区域,首先将相干函数设为1;然后利用双耳时间差估计语音功率谱,假设干扰噪声来自于左侧(如果干扰噪声来自右侧,则互换以下公式中的X1和X2),则对低频区域的每个频率点执行如下步骤:
步骤4-2-1)、如果双耳时间差ITD(λ,k)<Tmin,则表明该频率点无时延差,此时位于语音段,由此更新语音功率谱,即:
PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|2
本步骤中,Tmin为一判断阈值,其范围在100us-200us之间。
步骤4-2-2)、如果ITD(λ,k)>Tmax,则表明该频率点位于干扰噪声段,此时不更新语音功率谱,即:
PS(λ,μ)=PS(λ-1,μ)
步骤4-2-3)、如果Tmin<ITD(λ,k)<Tmax,即此时能量差介于不大不小之间,则利用信噪比高的一端的麦克风信号进行语音功率谱的更新:
PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2
本步骤中,Tmax为一判断阈值,其范围在300us-400us之间。
步骤5)、将步骤4)计算得到的语音功率谱和相干函数联合起来计算干扰噪声的冲击响应比值H12;其计算公式为:
其中,PS1S2=ΓS*PS,PS为步骤4)得到的语音功率谱,ΓS为步骤4)得到的语音的相干函数。
步骤6)、根据步骤5)计算得到的冲击响应比值H12、步骤4)得到的语音功率谱以及两个麦克风的能量差联合计算维纳滤波器增益GX1和GX2;具体的说,
如果干扰噪声来自左侧,则:
G X 1 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + &Delta;PX G X 2 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + H 12 * &Delta;PX
如果干扰噪声来自右侧,则:
G X 1 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + H 12 * &Delta;PX G X 2 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + &Delta;PX
其中,ΔPX=|PX1X1-PX2X2|为左右两个通道的能量差。
步骤7)、在频域中,将左耳麦克风信号乘以GX1,将右耳麦克风信号乘以GX2,最后进行傅里叶逆变换,得到增强后的语音。
本发明充分利用干扰声在左右耳形成的声级差(ILD)与时间差(ITD),来构造维纳滤波器滤除侧边的干扰噪声,保留了前方的目标语音的方位信息,算法思路清晰,且简单有效。便于在双耳听力设备中真正实现。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种基于双耳信息的语音增强方法,包括:
步骤1)、将左右耳麦克风信号从时域变换到频域,然后做频带分解,根据频带分解的结果划分低频区域和高频区域;
步骤2)、根据左右耳麦克风信号的能量比值,将能量高的一侧作为干扰噪声源所在的一侧;
步骤3)、在低频区域利用双耳时间差估计语音功率谱,在高频区域利用双耳声级差估计语音功率谱以及语音的相干函数;
步骤4)、将步骤3)计算得到的语音功率谱和相干函数联合起来计算干扰噪声的冲击响应比值;
步骤5)、根据步骤4)计算得到的冲击响应比值、步骤3)得到的语音功率谱以及两个麦克风的能量差计算维纳滤波器的两个增益,所述维纳滤波器的两个增益分别对应左耳麦克风与右耳麦克风;
步骤6)、利用步骤5)所得到的维纳滤波器的两个增益分别对左耳麦克风信号与右耳麦克风信号进行处理,得到增强后的语音信号。
2.根据权利要求1所述的基于双耳信息的语音增强方法,其特征在于,所述步骤3)进一步包括:
步骤3-1)、在高频区域,利用双耳声级差估计语音功率谱以及语音的相干函数;假设干扰噪声来自于左右两侧中的某一侧,则对高频区域的每个频率点执行如下步骤:
步骤3-1-1)、计算双耳声级差,如果双耳声级差ΔPLD<Φmin,则能量差很小,表明该频率点位于语音段,由此更新语音功率谱以及语音的相干函数;其中,
双耳声级差的计算公式为:
&Delta; PLD = PX 1 X 1 - PX 2 X 2 PX 1 X 1 + PX 2 X 2 ;
其中,PX1X1代表干扰噪声所在一侧的信号自功率谱,PX2X2代表与干扰噪声所在一侧相反的另一侧的信号自功率谱;
语音功率谱的计算公式为:
PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|;
其中,λ和μ分别表示所在的帧和该帧的频率点;α1为平滑因子,X1为干扰噪声所在一侧的麦克风信号;
语音的相干函数的计算公式为:
ΓS(λ,μ)=αΓS(λ-1,μ)+(1-αΓ)*Γx(λ,μ);
αΓ为平滑因子;Γs、Γx分别表示语音的相干函数以及混合信号的相干函数;
步骤3-1-2)、如果双耳声级差ΔPLD>Φmax,此时表明能量差很大,频率点位于干扰噪声段,此时不更新语音功率谱与语音的相干函数,即:
PS(λ,μ)=PS(λ-1,μ),
ΓS(λ,μ)=ΓS(λ-1,μ);
步骤3-1-3)、如果Φmin<ΔPLD<Φmax,即此时能量差介于不大不小之间,则此时的语音功率谱用信噪比高的那一端的信号来估计,语音的相干函数不更新,即:
PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2
ΓS(λ,μ)=ΓS(λ-1,μ);
其中,α2为平滑因子;
步骤3-2)、在低频区域,首先将语音的相干函数设为1,然后利用双耳时间差估计语音功率谱,假设干扰噪声来自于左右两侧中的某一侧,则对低频区域的每个频率点执行如下步骤:
步骤3-2-1)、计算双耳时间差,如果双耳时间差ITD(λ,k)<Tmin,则表明该频率点无时延差,此时位于语音段,更新语音功率谱;其中,
计算双耳时间差的公式为:
ITD ( &lambda; , &mu; ) = | 1 W k &angle; ( PX 1 X 2 ( &lambda; , &mu; ) ) | ;
其中,∠代表两个通道信号的相位差,wk代表角频率,PX1X2代表两个通道的互功率谱,λ和μ分别表示所在的帧和该帧的频率点;
语音功率谱的计算公式为:
PS(λ,μ)=α1*PS(λ-1,μ)+(1-α1)*|X1(λ,μ)|2
步骤3-2-2)、如果双耳时间差ITD(λ,k)>Tmax,则表明该频率点位于干扰噪声段,此时不更新语音功率谱,即:
PS(λ,μ)=PS(λ-1,μ);
步骤3-2-3)、如果Tmin<ITD(λ,k)<Tmax,即此时能量差介于不大不小之间,则利用信噪比高的一端的麦克风信号进行语音功率谱的更新,即:
PS(λ,μ)=α2*PS(λ-1,μ)+(1-α2)*|X2(λ,μ)|2
3.根据权利要求2所述的基于双耳信息的语音增强方法,其特征在于,所述Φmin在0.1-0.3之间,所述Φmax在0.7-0.9之间;所述Tmin在100us-200us之间,所述Tmax在300us-400us之间。
4.根据权利要求1所述的基于双耳信息的语音增强方法,其特征在于,在步骤4)中,干扰噪声的冲击响应比值的计算公式为:
H 12 = PX 1 X 2 - PS 1 S 2 PX 1 - PS 1 ,
其中,H12为干扰噪声的冲击响应比值;PS1S2=ΓS*PS,PS为步骤3)得到的语音功率谱,ΓS为步骤3)得到的语音的相干函数;PX1X2代表两个通道的互功率谱,PX1表示干扰噪声所在一侧的麦克风信号在频域的表达式,PS1表示干扰噪声所在一侧的麦克风所接收的语音在频域的表达式。
5.根据权利要求1所述的基于双耳信息的语音增强方法,其特征在于,在步骤5)中,将对应左耳麦克风的维纳滤波器的增益记为GX1,将对应右耳麦克风的维纳滤波器的增益记为GX2,这两种增益的计算公式如下:
如果干扰噪声来自左侧,则:
G X 1 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + &Delta;PX G X 2 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + H 12 * &Delta;PX
如果干扰噪声来自右侧,则:
G X 1 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + H 12 * &Delta;PX G X 2 = PS * ( 1 - | H 12 | 2 ) PS * ( 1 - | H 12 | 2 ) + &Delta;PX
其中,ΔPX=|PX1X1-PX2X2|为左右两个通道的能量差;PS为语音功率谱;H12为干扰噪声的冲击响应比值。
6.根据权利要求1所述的基于双耳信息的语音增强方法,其特征在于,所述步骤6)包括:在频域中,将左耳麦克风信号乘以对应左耳麦克风的维纳滤波器的增益GX1,将右耳麦克风信号乘以对应右耳麦克风的维纳滤波器的增益GX2,最后对所得到的乘积结果进行傅里叶逆变换,得到增强后的语音。
CN201510312683.9A 2015-06-09 2015-06-09 一种基于双耳信息的语音增强方法 Active CN106297817B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510312683.9A CN106297817B (zh) 2015-06-09 2015-06-09 一种基于双耳信息的语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510312683.9A CN106297817B (zh) 2015-06-09 2015-06-09 一种基于双耳信息的语音增强方法

Publications (2)

Publication Number Publication Date
CN106297817A true CN106297817A (zh) 2017-01-04
CN106297817B CN106297817B (zh) 2019-07-09

Family

ID=57659989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510312683.9A Active CN106297817B (zh) 2015-06-09 2015-06-09 一种基于双耳信息的语音增强方法

Country Status (1)

Country Link
CN (1) CN106297817B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108986832A (zh) * 2018-07-12 2018-12-11 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置
CN109767782A (zh) * 2018-12-28 2019-05-17 中国科学院声学研究所 一种提高dnn模型泛化性能的语音增强方法
CN110070882A (zh) * 2019-04-12 2019-07-30 腾讯科技(深圳)有限公司 语音分离方法、语音识别方法及电子设备
CN110248268A (zh) * 2019-06-20 2019-09-17 歌尔股份有限公司 一种无线耳机降噪方法、系统及无线耳机和存储介质
CN111951818A (zh) * 2020-08-20 2020-11-17 北京驭声科技有限公司 一种基于改进功率差噪声估计算法的双麦克风语音增强方法
WO2021114733A1 (zh) * 2019-12-10 2021-06-17 展讯通信(上海)有限公司 一种分频段进行处理的噪声抑制方法及其系统
CN113689875A (zh) * 2021-08-25 2021-11-23 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916567A (zh) * 2009-11-23 2010-12-15 瑞声声学科技(深圳)有限公司 应用于双麦克风系统的语音增强方法
CN101976566A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
EP2600344A1 (en) * 2010-07-26 2013-06-05 Panasonic Corporation Multi-input noise suppresion device, multi-input noise suppression method, program, and integrated circuit
CN103778920A (zh) * 2014-02-12 2014-05-07 北京工业大学 数字助听器中语音增强和频响补偿相融合方法
WO2014132499A1 (ja) * 2013-02-26 2014-09-04 沖電気工業株式会社 信号処理装置および方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916567A (zh) * 2009-11-23 2010-12-15 瑞声声学科技(深圳)有限公司 应用于双麦克风系统的语音增强方法
CN101976566A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 语音增强方法及应用该方法的装置
EP2600344A1 (en) * 2010-07-26 2013-06-05 Panasonic Corporation Multi-input noise suppresion device, multi-input noise suppression method, program, and integrated circuit
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
WO2014132499A1 (ja) * 2013-02-26 2014-09-04 沖電気工業株式会社 信号処理装置および方法
CN103778920A (zh) * 2014-02-12 2014-05-07 北京工业大学 数字助听器中语音增强和频响补偿相融合方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108986832A (zh) * 2018-07-12 2018-12-11 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置
CN108986832B (zh) * 2018-07-12 2020-12-15 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置
CN109767782A (zh) * 2018-12-28 2019-05-17 中国科学院声学研究所 一种提高dnn模型泛化性能的语音增强方法
CN109767782B (zh) * 2018-12-28 2020-04-14 中国科学院声学研究所 一种提高dnn模型泛化性能的语音增强方法
CN110070882B (zh) * 2019-04-12 2021-05-11 腾讯科技(深圳)有限公司 语音分离方法、语音识别方法及电子设备
CN110070882A (zh) * 2019-04-12 2019-07-30 腾讯科技(深圳)有限公司 语音分离方法、语音识别方法及电子设备
CN110491410A (zh) * 2019-04-12 2019-11-22 腾讯科技(深圳)有限公司 语音分离方法、语音识别方法及相关设备
CN110248268A (zh) * 2019-06-20 2019-09-17 歌尔股份有限公司 一种无线耳机降噪方法、系统及无线耳机和存储介质
WO2021114733A1 (zh) * 2019-12-10 2021-06-17 展讯通信(上海)有限公司 一种分频段进行处理的噪声抑制方法及其系统
CN111951818A (zh) * 2020-08-20 2020-11-17 北京驭声科技有限公司 一种基于改进功率差噪声估计算法的双麦克风语音增强方法
CN111951818B (zh) * 2020-08-20 2023-11-03 北京驭声科技有限公司 一种基于改进功率差噪声估计算法的双麦克风语音增强方法
CN113689875A (zh) * 2021-08-25 2021-11-23 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置
CN113689875B (zh) * 2021-08-25 2024-02-06 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置

Also Published As

Publication number Publication date
CN106297817B (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
CN106297817A (zh) 一种基于双耳信息的语音增强方法
Zhang et al. Deep learning based binaural speech separation in reverberant environments
US20150249898A1 (en) Bionic hearing headset
Hadad et al. Theoretical analysis of binaural transfer function MVDR beamformers with interference cue preservation constraints
Marquardt et al. Theoretical analysis of linearly constrained multi-channel Wiener filtering algorithms for combined noise reduction and binaural cue preservation in binaural hearing aids
CN102204281B (zh) 用于产生定向输出信号的系统和方法
CN105530580A (zh) 听力系统
CN102783185B (zh) 用于助听设备的双耳侧面感知的方法
CN108122559B (zh) 一种数字助听器中基于深度学习的双耳声源定位方法
CN107211225A (zh) 听力辅助系统
CN105575403A (zh) 一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法
CN110728989A (zh) 一种基于长短时记忆网络lstm的双耳语音分离方法
Fahim et al. PSD estimation and source separation in a noisy reverberant environment using a spherical microphone array
Jeub et al. Binaural dereverberation based on a dual-channel wiener filter with optimized noise field coherence
Dadvar et al. Robust binaural speech separation in adverse conditions based on deep neural network with modified spatial features and training target
CN106162499A (zh) 一种头相关传递函数的个性化方法及系统
Marin-Hurtado et al. Perceptually inspired noise-reduction method for binaural hearing aids
Liu et al. Head‐related transfer function–reserved time‐frequency masking for robust binaural sound source localization
Gößling et al. Performance analysis of the extended binaural MVDR beamformer with partial noise estimation
Courtois et al. Binaural hearing aids with wireless microphone systems including speaker localization and spatialization
Farmani et al. Sound source localization for hearing aid applications using wireless microphones
CN110310650A (zh) 一种基于二阶微分麦克风阵列的语音增强算法
Fang et al. A robust interaural time differences estimation and dereverberation algorithm based on the coherence function
Zhang et al. Binaural Reverberant Speech Separation Based on Deep Neural Networks.
Courtois Spatial hearing rendering in wireless microphone systems for binaural hearing aids

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant