CN109905793A - 一种风噪声抑制方法及装置 - Google Patents

一种风噪声抑制方法及装置 Download PDF

Info

Publication number
CN109905793A
CN109905793A CN201910129183.XA CN201910129183A CN109905793A CN 109905793 A CN109905793 A CN 109905793A CN 201910129183 A CN201910129183 A CN 201910129183A CN 109905793 A CN109905793 A CN 109905793A
Authority
CN
China
Prior art keywords
signal
sound spectrograph
power spectrum
wind noise
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910129183.XA
Other languages
English (en)
Other versions
CN109905793B (zh
Inventor
梁民
毕海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telecommunications Science and Technology Research Institute Co Ltd
Original Assignee
Telecommunications Science and Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telecommunications Science and Technology Research Institute Co Ltd filed Critical Telecommunications Science and Technology Research Institute Co Ltd
Priority to CN201910129183.XA priority Critical patent/CN109905793B/zh
Publication of CN109905793A publication Critical patent/CN109905793A/zh
Priority to PCT/CN2020/075196 priority patent/WO2020168981A1/zh
Application granted granted Critical
Publication of CN109905793B publication Critical patent/CN109905793B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种风噪声抑制方法及装置,涉及语音信号处理技术领域。该风噪声抑制方法,包括:分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;根据所述语音信号语谱图的估计,获取时域语音信号的估计。上述方案,可以准确的获取BT耳机的语音信号,且该方案,具有收敛速度快、计算复杂度低、易于在商用芯片上实时工程化实现的优点。

Description

一种风噪声抑制方法及装置
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种风噪声抑制方法及装置。
背景技术
在蓝牙(Bluetooth,BT)耳机的应用中,风噪声的有效抑制是其中的一个亟待解决的主要问题之一,但是迄今为止在BT耳机的应用中尚无类似的技术与方法。
发明内容
本发明实施例提供一种风噪声抑制方法及装置,以解决现有技术中不存在BT耳机的风噪声的有效抑制方案,无法准确获取BT耳机的语音信号的问题。
为了解决上述技术问题,本发明实施例提供一种风噪声抑制方法,包括:
分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
根据所述语音信号语谱图的估计,获取时域语音信号的估计。
进一步地,所述分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图,包括:
对所述第一语音信号和所述第二语音信号分别进行短时傅里叶变换STFT或者用分析滤波器组AFB进行子带变换,获取所述第一语音信号的第一语谱图和所述第二语音信号的第二语谱图。
可选地,在所述分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图之前,还包括:
分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号。
进一步地,所述分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号,包括:
对第一麦克风的接收信号进行延时处理,得到第一语音信号;
对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号。
进一步地,所述对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号,包括:
获取FIR滤波器系数;
根据所述FIR滤波器系数,对所述第二麦克风的接收信号进行FIR滤波处理,得到第二语音信号。
可选地,所述获取FIR滤波器系数,包括:
将所述第一麦克风的接收信号经过高通滤波处理得到第一输出信号;
将所述第一输出信号进行延时处理,得到参考信号;
将所述第二麦克风的接收信号经过高通滤波处理得到第二输出信号;
对所述第二输出信号进行滤波处理,得到估计信号;
利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
具体地,所述对所述第二输出信号进行滤波处理,得到估计信号,包括:
利用FIR滤波器对所述第二输出信号进行滤波处理,获取估计信号。
进一步地,所述利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新,包括:
根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量;
根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
进一步地,所述根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量,包括:
根据公式:获取VAD输出的软判决标志变量;
其中,Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;rx1x2(n)为第一输出信号和第二输出信号的互相关函数系数,且Rx1x2(n)=α·Rx1x2(n-1)+(1-α)·x1hpf(n)·x2hpf(n),α为预定的平滑系数参数、且0<α<1,Rx1x2(n)为第一输出信号和第二输出信号的互相关函数;Rx1x1(n)为第一输出信号的自相关函数;Rx2x2(n)为第二输出信号的自相关函数;x1hpf(n)为第一输出信号,x2hpf(n)为第二输出信号,Rxixi(n)=α·Rxixi(n-1)+(1-α)·xihpf(n)·xihpf(n),i=1或2;Th2和Th1为VAD预设的判决门限参数、且0≤Th2<Th1<1;n为样本时间索引。
进一步地,所述根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新,包括:
根据公式:对FIR滤波器系数进行自适应迭代更新;
其中,为第n+1时刻FIR滤波器系数矢量;为第n时刻FIR滤波器系数矢量;Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;β为预设的学习率参数,且0<β<2;e(n)为误差信号,且 xref(n)为参考信号,xest(n)为估计信号,T为矢量的转置运算符,x2hpf(n)为第二输出信号;δ为预设的小常数型正则化因子,且δ>0;n为样本时间索引。
可选地,所述根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱,包括:
根据所述第一语谱图和所述第二语谱图,分别获取和信号语谱图和差信号语谱图;
分别获取所述和信号语谱图对应的和信号功率谱和所述差信号语谱图对应的差信号功率谱。
具体地,所述和信号功率谱的获取方式为:
根据公式:获取和信号功率谱;
其中,为第t帧第k个子带的和信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Ys(k,t)为和信号语谱图;t为信号帧的时间索引,k为子带索引。
具体地,所述差信号功率谱的获取方式为:
根据公式:获取差信号功率谱;
其中,为第t帧第k个子带的差信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Yd(k,t)为差信号语谱图;t为信号帧的时间索引,k为子带索引。
进一步地,所述根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数,包括:
根据公式:G(k,t)=ψ{R(k,t)},获取风噪声抑制增益函数;
其中,G(k,t)为风噪声抑制增益函数; 为第t帧第k个子带的差信号功率谱,为第t帧第k个子带的和信号功率谱;ε为预设的小常数型正则化因子,且ε>0;ψ{·}为单调递减函数;t为信号帧的时间索引,k为子带索引。
本发明实施例还提供一种风噪声抑制装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其中,所述处理器执行所述计算机程序时实现以下步骤:
分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
根据所述语音信号语谱图的估计,获取时域语音信号的估计。
具体地,所述处理器执行所述分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图的计算机程序时实现以下步骤:
对所述第一语音信号和所述第二语音信号分别进行短时傅里叶变换STFT或者用分析滤波器组AFB进行子带变换,获取所述第一语音信号的第一语谱图和所述第二语音信号的第二语谱图。
可选地,所述处理器执行所述计算机程序时还实现以下步骤:
分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号。
进一步地,所述处理器执行所述分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号的计算机程序时实现以下步骤:
对第一麦克风的接收信号进行延时处理,得到第一语音信号;
对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号。
可选地,所述处理器执行所述对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号的计算机程序时实现以下步骤:
获取FIR滤波器系数;
根据所述FIR滤波器系数,对所述第二麦克风的接收信号进行FIR滤波处理,得到第二语音信号。
进一步地,所述处理器执行所述获取FIR滤波器系数的计算机程序时实现以下步骤:
将所述第一麦克风的接收信号经过高通滤波处理得到第一输出信号;
将所述第一输出信号进行延时处理,得到参考信号;
将所述第二麦克风的接收信号经过高通滤波处理得到第二输出信号;
对所述第二输出信号进行滤波处理,得到估计信号;
利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
具体地,所述处理器执行所述对所述第二输出信号进行滤波处理,得到估计信号的计算机程序时实现以下步骤:
利用FIR滤波器对所述第二输出信号进行滤波处理,获取估计信号。
具体地,所述处理器执行所述利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新的计算机程序时实现以下步骤:
根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量;
根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
具体地,所述处理器执行所述根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量的计算机程序时实现以下步骤:
根据公式:获取VAD输出的软判决标志变量;
其中,Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;rx1x2(n)为第一输出信号和第二输出信号的互相关函数系数,且Rx1x2(n)=α·Rx1x2(n-1)+(1-α)·x1hpf(n)·x2hpf(n),α为预定的平滑系数参数、且0<α<1,Rx1x2(n)为第一输出信号和第二输出信号的互相关函数;Rx1x1(n)为第一输出信号的自相关函数;Rx2x2(n)为第二输出信号的自相关函数;x1hpf(n)为第一输出信号,x2hpf(n)为第二输出信号,Rxixi(n)=α·Rxixi(n-1)+(1-α)·xihpf(n)·xihpf(n),i=1或2;Th2和Th1为VAD预设的判决门限参数、且0≤Th2<Th1<1;n为样本时间索引。
进一步地,所述处理器执行所述根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新的计算机程序时实现以下步骤:
根据公式:对FIR滤波器系数进行自适应迭代更新;
其中,为第n+1时刻FIR滤波器系数矢量;为第n时刻FIR滤波器系数矢量;Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;β为预设的学习率参数,且0<β<2;e(n)为误差信号,且 xref(n)为参考信号,xest(n)为估计信号,T为矢量的转置运算符,x2hpf(n)为第二输出信号;δ为预设的小常数型正则化因子,且δ>0;n为样本时间索引。
可选地,所述处理器执行所述根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱的计算机程序时实现以下步骤:
根据所述第一语谱图和所述第二语谱图,分别获取和信号语谱图和差信号语谱图;
分别获取所述和信号语谱图对应的和信号功率谱和所述差信号语谱图对应的差信号功率谱。
具体地,所述和信号功率谱的获取方式为:
根据公式:获取和信号功率谱;
其中,为第t帧第k个子带的和信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Ys(k,t)为和信号语谱图;t为信号帧的时间索引,k为子带索引。
具体地,所述差信号功率谱的获取方式为:
根据公式:获取差信号功率谱;
其中,为第t帧第k个子带的差信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Yd(k,t)为差信号语谱图;t为信号帧的时间索引,k为子带索引。
进一步地,所述处理器执行所述根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数的计算机程序时实现以下步骤:
根据公式:G(k,t)=ψ{R(k,t)},获取风噪声抑制增益函数;
其中,G(k,t)为风噪声抑制增益函数; 为第t帧第k个子带的差信号功率谱,为第t帧第k个子带的和信号功率谱;ε为预设的小常数型正则化因子,且ε>0;ψ{·}为单调递减函数;t为信号帧的时间索引,k为子带索引。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述的风噪声抑制方法中的步骤。
本发明实施例还提供一种风噪声抑制装置,包括:
第一获取模块,用于分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
第二获取模块,用于根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
第三获取模块,用于根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
第四获取模块,用于利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
第五获取模块,用于根据所述语音信号语谱图的估计,获取时域语音信号的估计。
本发明的有益效果是:
上述方案,通过利用第一语谱图和第二语谱图得到的和信号功率谱和差信号功率谱,获取风噪声抑制增益函数,并利用该风噪声抑制增益函数对信号语谱图进行修正,进而获取时域语音信号的估计,以此可以准确的获取BT耳机的语音信号,且该方案,具有收敛速度快、计算复杂度低、易于在商用芯片上实时工程化实现的优点。
附图说明
图1表示ys(n)和yd(n)的获取过程示意图;
图2表示Log-Log域中参数R到噪声抑制增益G的单调递减非线性映射Ψ的一种实现方式示意图;
图3表示麦克风校准的实现原理示意图;
图4表示本发明实施例的风噪声抑制方法的流程示意图;
图5表示本发明的具体实现原理示意图;
图6表示本发明实施例的风噪声抑制装置的模块示意图;
图7表示本发明实施例的风噪声抑制装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
本发明针对现有技术中不存在BT耳机的风噪声的有效抑制方案,无法准确获取BT耳机的语音信号的问题,提供一种风噪声抑制方法及装置。
本发明提出应用短间距的双麦克风阵列(麦克风间距d=2-3cm)来进行风噪声抑制的新方法,以便解决BT耳机应用中所面临的风噪声抑制问题。
下面对本发明实施例的实现原理进行具体说明如下。
首先设有两个麦克风,其间距为d米,且它们在幅度和相位上完全匹配;声学波矢量与两麦克风连线成θ角;那么麦克风1和麦克风2所接收的信号p1(n)和p2(n)分别用公式一和公式二表示为:
公式一、p1(n)=s(n)+v(n)+n1(n)
公式二、p2(n)=s(n-τs)+v(n-τv)+n2(n)
其中,τs和τv分别为声学信号s(n)的传播延时和风传播波v(n)的传播延时,n1(n)和n2(n)分别代表麦克风1和麦克风2的自身噪声或位于麦克风处的不相关湍流噪声。用它们构成的和信号ys(n)与差信号yd(n)分别为:
公式三、ys(n)=p1(n)+p2(n)={s(n)+s(n-τs)}+{v(n)+v(n-τv)}+{n1(n)+n2(n)}
公式四、yd(n)=p1(n)-p2(n)={s(n)-s(n-τs)}+{v(n)-v(n-τv)}+{n1(n)-n2(n)}
ys(n)和yd(n)的具体获取过程如图1所示。
ys(n)和yd(n)对应的功率谱分别为如公式五和公式六所示:
公式五(和信号功率谱)、
公式六(差信号功率谱)、
其中,Ps(ω)为语音信号的正弦波均方根(RMS)功率,Pv(ω)为湍流噪声的RMS功率,N1(ω)和N2(ω)分别为麦克风1和麦克风2处独立噪声的RMS功率;γc(ω)为湍流相关系数,它由Corcos湍流模型确定。
将公式六除以公式五可得二个麦克风间“差信号”功率与“和信号”功率之比R如下:
公式七、
根据公式五和公式六,我们进一步考察公式七可知:在无声学信号的情况下,R的值趋于1;而在有声学信号时且信噪比(SNR)较大的情况下,R的值趋于0。因此R可用作一个统计量,并将其与某一判决门限作比较,来判定麦克风接收的信号是来自湍流噪声/麦克风自身噪声还是含噪的语音信号。
显而易见,比值参数R的大小反比于运行环境的SNR。应注意的是,在SNR很高的情况下(记此时相应的比值参数R为Rmin,相应的噪声抑制增益G为SGmin)无需进行噪声抑制,即噪声抑制增益SGmin=0dB;而在SNR很低的情况下(记此时相应的比值参数R为Rmax,相应的噪声抑制增益G为SGmax)需要进行噪声抑制。因此噪声抑制增益G可通过比值参数R的一种单调递减的非线性数学映射而获得,即:
公式八、
这里需要说明的是,ψ{·}为单调递减函数。
例如,图2为这种递减而单调的非线性数学映射的一种实现方式。
应该指出的是,上述的结果是在假设条件“两个麦克风在幅度和相位上完全匹配”的情况下获得的,然而实际中两个麦克风要做到幅度和相位上的完全匹配是十分困难的,即便在麦克风产品出场时进行了人工的校准,但随着时间的推移,这已校准的两个麦克风也会在其幅度和相位上产生失配。为此,本发明提出一种麦克风自动校准算法,其原理如图3所示,其中麦克风1的接收信号x1(n)首先经高通滤波器(HPF)滤波处理生成输出x1hpf(n),将它延时样本后生成参考信号xref(n),其中,L为滤波器长度;麦克风2的接收信号x2(n)首先经高通滤波器(HPF)滤波处理生成输出x2hpf(n),用自适应有限冲激响应(FIR)滤波器对x2hpf(n)进行滤波获得估计信号xest(n);参考信号和估计信号的差信号e(n)用来驱动FIR滤波器系数的自适应迭代更新,该自适应迭代算法可以是归一化最小均方(NLMS)算法,也可以是仿射投影算法(APA)。FIR滤波器系数的自适应迭代更新必须在有语音信号的条件下进行,而在无语音信号时,该迭代更新过程必须停止。为此需要一个语音活性检测器(VAD)来检测语音信号段,当VAD检测到语音信号时,其输出标志Vad_Flag置为1,否则其输出标志Vad_Flag置为0。这里需要说明的是:风噪声信号通常分布在低频段,为了减小风噪对VAD和FIR滤波器系数自适应迭代的影响,我们采用HPF(其截止频率Fc=1kHz)对两个麦克风接收信号进行滤波处理。那么HPF的输出信号x1hpf(n)和x2hpf(n)之间在语音段具有较强的相关性而在非语音段具有较弱的相关性或不相关;鉴于这一特性,我们按如下方法进行VAD处理:
首先按下式分别在线计算HPF的输出信号x1hpf(n)和x2hpf(n)的自相关函数Rx1x1(n)和Rx2x2(n)及二者的互相关函数Rx1x2(n):
公式九、Rx1x2(n)=α·Rx1x2(n-1)+(1-α)·x1hpf(n)·x2hpf(n)
公式十、Rxixi(n)=α·Rxixi(n-1)+(1-α)·xihpf(n)·xihpf(n),i=1,2
其中,0<α<1为预定的平滑系数参数。
然后,计算按下式计算互相关系数rx1x2(n):
公式十一、
那么,VAD输出的软判决标志变量Vad_Flag(n)定义为:
公式十二、
其中,0≤Th2<Th1<1为VAD预设的判决门限参数。
用公式十二确定的VAD软判决标志变量Vad_Flag(n)乘以FIR滤波器系数自适应迭代算法中的学习率参数,即可有效地完成两个麦克风之间自动校准的任务。作为一个实施例,我们给出两麦克风之间自动校准的NLMS算法的示例如下:
公式十三、
其中,0<β<2为预设的学习率参数,δ>0为一个预设的小常数型正则化因子,误差信号e(n)用公式十四表示为:
公式十四、
公式十五、
下面对本发明实施例的具体实现方式说明如下。
如图4所示,本发明实施例提供一种风噪声抑制方法,包括:
步骤41,分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
步骤42,根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
步骤43,根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
步骤44,利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
步骤45,根据所述语音信号语谱图的估计,获取时域语音信号的估计。
进一步地,所述步骤41的具体实现方式为:
对所述第一语音信号和所述第二语音信号分别进行短时傅里叶变换(STFT)或者用分析滤波器组(Analysis Filter Bank,AFB)进行子带变换,获取所述第一语音信号的第一语谱图和所述第二语音信号的第二语谱图。
可选地,在所述步骤41之前,所述风噪声抑制方法,还包括:
分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号。
需要说明的是,该第一麦克风指的是上述的麦克风1,该第二麦克风指的是上述的麦克风2;该第一语音信号对应上述的p1(n),该第二语音信号对应上述的p2(n)。
进一步地,所述分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号的步骤的具体实现方式为:
对第一麦克风的接收信号进行延时处理,得到第一语音信号;
对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号。
具体地,所述对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号的步骤的具体实现方式为:
获取FIR滤波器系数;
根据所述FIR滤波器系数,对所述第二麦克风的接收信号进行FIR滤波处理,得到第二语音信号。
进一步地,所述获取FIR滤波器系数的步骤的具体实现方式为:
将所述第一麦克风的接收信号经过高通滤波处理得到第一输出信号;
将所述第一输出信号进行延时处理,得到参考信号;
将所述第二麦克风的接收信号经过高通滤波处理得到第二输出信号;
对所述第二输出信号进行滤波处理,得到估计信号;
利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
需要说明的是,该第一输出信号对应上文描述中的x1hpf(n);该参考信号对应上文描述中的xref(n);该第二输出信号对应上文描述中的x2hpf(n);该估计信号对应上文描述中的xest(n)。
具体地,所述对所述第二输出信号进行滤波处理,得到估计信号的步骤的具体实现方式为:
利用FIR滤波器对所述第二输出信号进行滤波处理,获取估计信号。
进一步地,所述利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新的步骤的具体实现方式为:
根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量;
根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
具体地,所述根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量的步骤的具体实现方式为:
根据上述公式十二:
获取VAD输出的软判决标志变量;
其中,Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;rx1x2(n)为第一输出信号和第二输出信号的互相关函数系数,且Rx1x2(n)=α·Rx1x2(n-1)+(1-α)·x1hpf(n)·x2hpf(n),α为预定的平滑系数参数、且0<α<1,Rx1x2(n)为第一输出信号和第二输出信号的互相关函数;Rx1x1(n)为第一输出信号的自相关函数;Rx2x2(n)为第二输出信号的自相关函数;x1hpf(n)为第一输出信号,x2hpf(n)为第二输出信号,Rxixi(n)=α·Rxixi(n-1)+(1-α)·xihpf(n)·xihpf(n),i=1或2;Th2和Th1为VAD预设的判决门限参数、且0≤Th2<Th1<1;n为样本时间索引。
具体地,所述根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新的步骤的具体实现方式为:
根据上述公式十三:
对FIR滤波器系数进行自适应迭代更新;
其中,为第n+1时刻FIR滤波器系数矢量;为第n时刻FIR滤波器系数矢量;Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;β为预设的学习率参数,且0<β<2;e(n)为误差信号,且 xref(n)为参考信号,xest(n)为估计信号,T为矢量的转置运算符,x2hpf(n)为第二输出信号;δ为预设的小常数型正则化因子,且δ>0;n为样本时间索引。
具体地,所述步骤42的具体实现方式为:
根据所述第一语谱图和所述第二语谱图,分别获取和信号语谱图和差信号语谱图;
分别获取所述和信号语谱图对应的和信号功率谱和所述差信号语谱图对应的差信号功率谱。
进一步地,所述和信号功率谱的获取方式为:
根据公式十六:获取和信号功率谱;
其中,为第t帧第k个子带的和信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Ys(k,t)为和信号语谱图;t为信号帧的时间索引,k为子带索引。
进一步地,所述差信号功率谱的获取方式为:
根据公式十七:获取差信号功率谱;
其中,为第t帧第k个子带的差信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Yd(k,t)为差信号语谱图;t为信号帧的时间索引,k为子带索引。
还需要说明的是,所述步骤53具体实现方式为:
根据公式十八(该公式十八由上述公式八推理得到):G(k,t)=ψ{R(k,t)},获取风噪声抑制增益函数;
其中,G(k,t)为风噪声抑制增益函数; 为第t帧第k个子带的差信号功率谱,为第t帧第k个子带的和信号功率谱;ε为预设的小常数型正则化因子,且ε>0;ψ{·}为单调递减函数;t为信号帧的时间索引,k为子带索引。
这里需要说明的是,该单调递减函数包括但不限于如图2所示的情况,可以是任一种单调递减的线性和非线性函数。
综上所述,本发明提出的用短间距双麦克风阵列对风噪声进行抑制的方法的系统原理框图如图5所示,首先用麦克风自动校准模块对双麦克风间一致的匹配性进行校准,然后对校准后的两麦克风信号p1(n)和p2(n)分别进行STFT或用AFB进行子带变换,从而获得相应的两路信号的语谱图Y1(k,t)和Y2(k,t),用它们分别形成“和信号”语谱图Ys(k,t)与“差信号”语谱图Yd(k,t),并在线地计算其对应的功率谱Pys(k,t)与Pyd(k,t),根据Pys(k,t)与Pyd(k,t)计算特征变量R(k,t),据此通过一个单调递减的非线性映射函数Ψ来计算出风噪声抑制增益函数G(k,t),用它来修正“和信号语谱图”Ys(k,t),从而获得语音信号语谱图的估计最后对进行逆短时傅里叶变换(ISTFT)或应用合成滤波器组(SBF),从而获得时域语音信号的估计
需要说明的是,本发明实施例,通过利用第一语谱图和第二语谱图得到的和信号功率谱和差信号功率谱,获取风噪声抑制增益函数,并利用该风噪声抑制增益函数对信号语谱图进行修正,进而获取时域语音信号的估计,以此可以准确的获取BT耳机的语音信号,且该方案具有收敛速度快、计算复杂度低、易于在商用芯片上实时工程化实现的优点。
如图6所示,本发明实施例还提供一种风噪声抑制装置60,包括:
第一获取模块61,用于分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
第二获取模块62,用于根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
第三获取模块63,用于根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
第四获取模块64,用于利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
第五获取模块65,用于根据所述语音信号语谱图的估计,获取时域语音信号的估计。
进一步地,所述第一获取模块61,用于:
对所述第一语音信号和所述第二语音信号分别进行短时傅里叶变换STFT或者用分析滤波器组AFB进行子带变换,获取所述第一语音信号的第一语谱图和所述第二语音信号的第二语谱图。
可选地,在所述第一获取模块61分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图之前,还包括:
第六获取模块,用于分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号。
进一步地,所述第六获取模块,包括:
第一获取子模块,用于对第一麦克风的接收信号进行延时处理,得到第一语音信号;
第二获取子模块,用于对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号。
进一步地,所述第二获取子模块,包括:
获取单元,用于获取FIR滤波器系数;
处理单元,用于根据所述FIR滤波器系数,对所述第二麦克风的接收信号进行FIR滤波处理,得到第二语音信号。
进一步地,所述获取单元,包括:
第一处理子单元,用于将所述第一麦克风的接收信号经过高通滤波处理得到第一输出信号;
第二处理子单元,用于将所述第一输出信号进行延时处理,得到参考信号;
第三处理子单元,用于将所述第二麦克风的接收信号经过高通滤波处理得到第二输出信号;
第四处理子单元,用于对所述第二输出信号进行滤波处理,得到估计信号;
更新子单元,用于利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
进一步地,所述第四处理子单元,用于:
利用FIR滤波器对所述第二输出信号进行滤波处理,获取估计信号。
进一步地,所述更新子单元,用于:
根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量;
根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
进一步地,所述更新子单元根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量,具体实现方式为:
根据公式:获取VAD输出的软判决标志变量;
其中,Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;rx1x2(n)为第一输出信号和第二输出信号的互相关函数系数,且Rx1x2(n)=α·Rx1x2(n-1)+(1-α)·x1hpf(n)·x2hpf(n),α为预定的平滑系数参数、且0<α<1,Rx1x2(n)为第一输出信号和第二输出信号的互相关函数;Rx1x1(n)为第一输出信号的自相关函数;Rx2x2(n)为第二输出信号的自相关函数;x1hpf(n)为第一输出信号,x2hpf(n)为第二输出信号,Rxixi(n)=α·Rxixi(n-1)+(1-α)·xihpf(n)·xihpf(n),i=1或2;Th2和Th1为VAD预设的判决门限参数、且0≤Th2<Th1<1;n为样本时间索引。
进一步地,所述更新子单元根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新,具体实现方式为:
根据公式:对FIR滤波器系数进行自适应迭代更新;
其中,为第n+1时刻FIR滤波器系数矢量;为第n时刻FIR滤波器系数矢量;Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;β为预设的学习率参数,且0<β<2;e(n)为误差信号,且 xref(n)为参考信号,xest(n)为估计信号,T为矢量的转置运算符,x2hpf(n)为第二输出信号;δ为预设的小常数型正则化因子,且δ>0;n为样本时间索引。
进一步地,所述第二获取模块62,包括:
第三获取子模块,用于根据所述第一语谱图和所述第二语谱图,分别获取和信号语谱图和差信号语谱图;
第四获取子模块,用于分别获取所述和信号语谱图对应的和信号功率谱和所述差信号语谱图对应的差信号功率谱。
具体地,所述和信号功率谱的获取方式为:
根据公式:获取和信号功率谱;
其中,为第t帧第k个子带的和信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Ys(k,t)为和信号语谱图;t为信号帧的时间索引,k为子带索引。
具体地,所述差信号功率谱的获取方式为:
根据公式:获取差信号功率谱;
其中,为第t帧第k个子带的差信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Yd(k,t)为差信号语谱图;t为信号帧的时间索引,k为子带索引。
进一步,所述第三获取模块63,用于:
根据公式:G(k,t)=ψ{R(k,t)},获取风噪声抑制增益函数;
其中,G(k,t)为风噪声抑制增益函数; 为第t帧第k个子带的差信号功率谱,为第t帧第k个子带的和信号功率谱;ε为预设的小常数型正则化因子,且ε>0;ψ{·}为单调递减函数;t为信号帧的时间索引,k为子带索引。
需要说明的是,该装置的实施例是与上述方法实施例一一对应的装置,上述方法实施例中所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
如图7所示,本发明实施例还提供一种风噪声抑制装置,包括处理器71、存储器72及存储在所述存储器72上并可在所述处理器71上运行的计算机程序;其中,所述处理器71用于读取存储器中的程序,执行下列过程:
分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
根据所述语音信号语谱图的估计,获取时域语音信号的估计。
需要说明的是,在图7中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器71代表的一个或多个处理器和存储器72代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。针对不同的装置,处理器71负责管理总线架构和通常的处理,存储器72可以存储处理器71在执行操作时所使用的数据。
进一步地,所述处理器执行所述分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图的计算机程序时实现以下步骤:
对所述第一语音信号和所述第二语音信号分别进行短时傅里叶变换STFT或者用分析滤波器组AFB进行子带变换,获取所述第一语音信号的第一语谱图和所述第二语音信号的第二语谱图。
可选地,所述处理器执行所述计算机程序时还实现以下步骤:
分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号。
进一步地,所述处理器执行所述分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号的计算机程序时实现以下步骤:
对第一麦克风的接收信号进行延时处理,得到第一语音信号;
对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号。
进一步地,所述处理器执行所述对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号的计算机程序时实现以下步骤:
获取FIR滤波器系数;
根据所述FIR滤波器系数,对所述第二麦克风的接收信号进行FIR滤波处理,得到第二语音信号。
进一步地,所述处理器执行所述获取FIR滤波器系数的计算机程序时实现以下步骤:
将所述第一麦克风的接收信号经过高通滤波处理得到第一输出信号;
将所述第一输出信号进行延时处理,得到参考信号;
将所述第二麦克风的接收信号经过高通滤波处理得到第二输出信号;
对所述第二输出信号进行滤波处理,得到估计信号;
利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
进一步地,所述处理器执行所述对所述第二输出信号进行滤波处理,得到估计信号的计算机程序时实现以下步骤:
利用FIR滤波器对所述第二输出信号进行滤波处理,获取估计信号。
进一步地,所述处理器执行所述利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新的计算机程序时实现以下步骤:
根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量;
根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
进一步地,所述处理器执行所述根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量的计算机程序时实现以下步骤:
根据公式:获取VAD输出的软判决标志变量;
其中,Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;rx1x2(n)为第一输出信号和第二输出信号的互相关函数系数,且Rx1x2(n)=α·Rx1x2(n-1)+(1-α)·x1hpf(n)·x2hpf(n),α为预定的平滑系数参数、且0<α<1,Rx1x2(n)为第一输出信号和第二输出信号的互相关函数;Rx1x1(n)为第一输出信号的自相关函数;Rx2x2(n)为第二输出信号的自相关函数;x1hpf(n)为第一输出信号,x2hpf(n)为第二输出信号,Rxixi(n)=α·Rxixi(n-1)+(1-α)·xihpf(n)·xihpf(n),i=1或2;Th2和Th1为VAD预设的判决门限参数、且0≤Th2<Th1<1;n为样本时间索引。
进一步地,所述处理器执行所述根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新的计算机程序时实现以下步骤:
根据公式:对FIR滤波器系数进行自适应迭代更新;
其中,为第n+1时刻FIR滤波器系数矢量;为第n时刻FIR滤波器系数矢量;Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;β为预设的学习率参数,且0<β<2;e(n)为误差信号,且 xref(n)为参考信号,xest(n)为估计信号,T为矢量的转置运算符,x2hpf(n)为第二输出信号;δ为预设的小常数型正则化因子,且δ>0;n为样本时间索引。
可选地,所述处理器执行所述根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱的计算机程序时实现以下步骤:
根据所述第一语谱图和所述第二语谱图,分别获取和信号语谱图和差信号语谱图;
分别获取所述和信号语谱图对应的和信号功率谱和所述差信号语谱图对应的差信号功率谱。
具体地,所述和信号功率谱的获取方式为:
根据公式:获取和信号功率谱;
其中,为第t帧第k个子带的和信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Ys(k,t)为和信号语谱图;t为信号帧的时间索引,k为子带索引。
具体地,所述差信号功率谱的获取方式为:
根据公式:获取差信号功率谱;
其中,为第t帧第k个子带的差信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Yd(k,t)为差信号语谱图;t为信号帧的时间索引,k为子带索引。
进一步地,所述处理器执行所述根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数的计算机程序时实现以下步骤:
根据公式:G(k,t)=ψ{R(k,t)},获取风噪声抑制增益函数;
其中,G(k,t)为风噪声抑制增益函数; 为第t帧第k个子带的差信号功率谱,为第t帧第k个子带的和信号功率谱;ε为预设的小常数型正则化因子,且ε>0;ψ{·}为单调递减函数;t为信号帧的时间索引,k为子带索引。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的风噪声抑制方法。
以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。

Claims (30)

1.一种风噪声抑制方法,其特征在于,包括:
分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
根据所述语音信号语谱图的估计,获取时域语音信号的估计。
2.根据权利要求1所述的风噪声抑制方法,其特征在于,所述分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图,包括:
对所述第一语音信号和所述第二语音信号分别进行短时傅里叶变换STFT或者用分析滤波器组AFB进行子带变换,获取所述第一语音信号的第一语谱图和所述第二语音信号的第二语谱图。
3.根据权利要求1所述的风噪声抑制方法,其特征在于,在所述分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图之前,还包括:
分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号。
4.根据权利要求3所述的风噪声抑制方法,其特征在于,所述分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号,包括:
对第一麦克风的接收信号进行延时处理,得到第一语音信号;
对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号。
5.根据权利要求4所述的风噪声抑制方法,其特征在于,所述对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号,包括:
获取FIR滤波器系数;
根据所述FIR滤波器系数,对所述第二麦克风的接收信号进行FIR滤波处理,得到第二语音信号。
6.根据权利要求5所述的风噪声抑制方法,其特征在于,所述获取FIR滤波器系数,包括:
将所述第一麦克风的接收信号经过高通滤波处理得到第一输出信号;
将所述第一输出信号进行延时处理,得到参考信号;
将所述第二麦克风的接收信号经过高通滤波处理得到第二输出信号;
对所述第二输出信号进行滤波处理,得到估计信号;
利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
7.根据权利要求6所述的风噪声抑制方法,其特征在于,所述对所述第二输出信号进行滤波处理,得到估计信号,包括:
利用FIR滤波器对所述第二输出信号进行滤波处理,获取估计信号。
8.根据权利要求6所述的风噪声抑制方法,其特征在于,所述利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新,包括:
根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量;
根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
9.根据权利要求8所述的风噪声抑制方法,其特征在于,所述根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量,包括:
根据公式:获取VAD输出的软判决标志变量;
其中,Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;rx1x2(n)为第一输出信号和第二输出信号的互相关函数系数,且Rx1x2(n)=α·Rx1x2(n-1)+(1-α)·x1hpf(n)·x2hpf(n),α为预定的平滑系数参数、且0<α<1,Rx1x2(n)为第一输出信号和第二输出信号的互相关函数;Rx1x1(n)为第一输出信号的自相关函数;Rx2x2(n)为第二输出信号的自相关函数;x1hpf(n)为第一输出信号,x2hpf(n)为第二输出信号,Rxixi(n)=α·Rxixi(n-1)+(1-α)·xihpf(n)·xihpf(n),i=1或2;Th2和Th1为VAD预设的判决门限参数、且0≤Th2<Th1<1;n为样本时间索引。
10.根据权利要求8所述的风噪声抑制方法,其特征在于,所述根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新,包括:
根据公式:对FIR滤波器系数进行自适应迭代更新;
其中,为第n+1时刻FIR滤波器系数矢量;为第n时刻FIR滤波器系数矢量;Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;β为预设的学习率参数,且0<β<2;e(n)为误差信号,且 xref(n)为参考信号,xest(n)为估计信号,T为矢量的转置运算符,x2hpf(n)为第二输出信号;δ为预设的小常数型正则化因子,且δ>0;n为样本时间索引。
11.根据权利要求1所述的风噪声抑制方法,其特征在于,所述根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱,包括:
根据所述第一语谱图和所述第二语谱图,分别获取和信号语谱图和差信号语谱图;
分别获取所述和信号语谱图对应的和信号功率谱和所述差信号语谱图对应的差信号功率谱。
12.根据权利要求11所述的风噪声抑制方法,其特征在于,所述和信号功率谱的获取方式为:
根据公式:获取和信号功率谱;
其中,为第t帧第k个子带的和信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Ys(k,t)为和信号语谱图;t为信号帧的时间索引,k为子带索引。
13.根据权利要求11所述的风噪声抑制方法,其特征在于,所述差信号功率谱的获取方式为:
根据公式:获取差信号功率谱;
其中,为第t帧第k个子带的差信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Yd(k,t)为差信号语谱图;t为信号帧的时间索引,k为子带索引。
14.根据权利要求1所述的风噪声抑制方法,其特征在于,所述根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数,包括:
根据公式:G(k,t)=ψ{R(k,t)},获取风噪声抑制增益函数;
其中,G(k,t)为风噪声抑制增益函数; 为第t帧第k个子带的差信号功率谱,为第t帧第k个子带的和信号功率谱;ε为预设的小常数型正则化因子,且ε>0;ψ{·}为单调递减函数;t为信号帧的时间索引,k为子带索引。
15.一种风噪声抑制装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
根据所述语音信号语谱图的估计,获取时域语音信号的估计。
16.根据权利要求15所述的风噪声抑制装置,其特征在于,所述处理器执行所述分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图的计算机程序时实现以下步骤:
对所述第一语音信号和所述第二语音信号分别进行短时傅里叶变换STFT或者用分析滤波器组AFB进行子带变换,获取所述第一语音信号的第一语谱图和所述第二语音信号的第二语谱图。
17.根据权利要求15所述的风噪声抑制装置,其特征在于,所述处理器执行所述计算机程序时还实现以下步骤:
分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号。
18.根据权利要求17所述的风噪声抑制装置,其特征在于,所述处理器执行所述分别对第一麦克风和第二麦克风进行校准,获取所述第一麦克风接收的第一语音信号和所述第二麦克风接收的第二语音信号的计算机程序时实现以下步骤:
对第一麦克风的接收信号进行延时处理,得到第一语音信号;
对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号。
19.根据权利要求18所述的风噪声抑制装置,其特征在于,所述处理器执行所述对第二麦克风的接收信号进行有限冲激响应FIR滤波处理,得到第二语音信号的计算机程序时实现以下步骤:
获取FIR滤波器系数;
根据所述FIR滤波器系数,对所述第二麦克风的接收信号进行FIR滤波处理,得到第二语音信号。
20.根据权利要求19所述的风噪声抑制装置,其特征在于,所述处理器执行所述获取FIR滤波器系数的计算机程序时实现以下步骤:
将所述第一麦克风的接收信号经过高通滤波处理得到第一输出信号;
将所述第一输出信号进行延时处理,得到参考信号;
将所述第二麦克风的接收信号经过高通滤波处理得到第二输出信号;
对所述第二输出信号进行滤波处理,得到估计信号;
利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
21.根据权利要求20所述的风噪声抑制装置,其特征在于,所述处理器执行所述对所述第二输出信号进行滤波处理,得到估计信号的计算机程序时实现以下步骤:
利用FIR滤波器对所述第二输出信号进行滤波处理,获取估计信号。
22.根据权利要求20所述的风噪声抑制装置,其特征在于,所述处理器执行所述利用所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新的计算机程序时实现以下步骤:
根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量;
根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新。
23.根据权利要求22所述的风噪声抑制装置,其特征在于,所述处理器执行所述根据所述第一输出信号和所述第二输出信号,获取语音活性检测VAD输出的软判决标志变量的计算机程序时实现以下步骤:
根据公式:获取VAD输出的软判决标志变量;
其中,Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;rx1x2(n)为第一输出信号和第二输出信号的互相关函数系数,且Rx1x2(n)=α·Rx1x2(n-1)+(1-α)·x1hpf(n)·x2hpf(n),α为预定的平滑系数参数、且0<α<1,Rx1x2(n)为第一输出信号和第二输出信号的互相关函数;Rx1x1(n)为第一输出信号的自相关函数;Rx2x2(n)为第二输出信号的自相关函数;x1hpf(n)为第一输出信号,x2hpf(n)为第二输出信号,Rxixi(n)=α·Rxixi(n-1)+(1-α)·xihpf(n)·xihpf(n),i=1或2;Th2和Th1为VAD预设的判决门限参数、且0≤Th2<Th1<1;n为样本时间索引。
24.根据权利要求22所述的风噪声抑制装置,其特征在于,所述处理器执行所述根据所述软判决标志变量和所述参考信号与所述估计信号的差信号,对FIR滤波器系数进行自适应迭代更新的计算机程序时实现以下步骤:
根据公式:对FIR滤波器系数进行自适应迭代更新;
其中,为第n+1时刻FIR滤波器系数矢量;为第n时刻FIR滤波器系数矢量;Vad_Flag(n)为第n时刻VAD输出的软判决标志变量;β为预设的学习率参数,且0<β<2;e(n)为误差信号,且 xref(n)为参考信号,xest(n)为估计信号,T为矢量的转置运算符,x2hpf(n)为第二输出信号;δ为预设的小常数型正则化因子,且δ>0;n为样本时间索引。
25.根据权利要求15所述的风噪声抑制装置,其特征在于,所述处理器执行所述根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱的计算机程序时实现以下步骤:
根据所述第一语谱图和所述第二语谱图,分别获取和信号语谱图和差信号语谱图;
分别获取所述和信号语谱图对应的和信号功率谱和所述差信号语谱图对应的差信号功率谱。
26.根据权利要求25所述的风噪声抑制装置,其特征在于,所述和信号功率谱的获取方式为:
根据公式:获取和信号功率谱;
其中,为第t帧第k个子带的和信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Ys(k,t)为和信号语谱图;t为信号帧的时间索引,k为子带索引。
27.根据权利要求25所述的风噪声抑制装置,其特征在于,所述差信号功率谱的获取方式为:
根据公式:获取差信号功率谱;
其中,为第t帧第k个子带的差信号功率谱;γ为预设的平滑系数参数、且0<γ<1;为第t-1帧第k个子带的和信号功率谱;Yd(k,t)为差信号语谱图;t为信号帧的时间索引,k为子带索引。
28.根据权利要求15所述的风噪声抑制装置,其特征在于,所述处理器执行所述根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数的计算机程序时实现以下步骤:
根据公式:G(k,t)=ψ{R(k,t)},获取风噪声抑制增益函数;
其中,G(k,t)为风噪声抑制增益函数; 为第t帧第k个子带的差信号功率谱,为第t帧第k个子带的和信号功率谱;ε为预设的小常数型正则化因子,且ε>0;ψ{·}为单调递减函数;t为信号帧的时间索引,k为子带索引。
29.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至14任一项所述的风噪声抑制方法中的步骤。
30.一种风噪声抑制装置,其特征在于,包括:
第一获取模块,用于分别获取第一语音信号的第一语谱图和第二语音信号的第二语谱图;
第二获取模块,用于根据所述第一语谱图和所述第二语谱图,分别获取和信号功率谱和差信号功率谱;
第三获取模块,用于根据所述和信号功率谱和所述差信号功率谱,获取风噪声抑制增益函数;
第四获取模块,用于利用所述风噪声抑制增益函数对所述第一语谱图和所述第二语谱图组成的和信号语谱图进行修正,获取语音信号语谱图的估计;
第五获取模块,用于根据所述语音信号语谱图的估计,获取时域语音信号的估计。
CN201910129183.XA 2019-02-21 2019-02-21 一种风噪声抑制方法、装置及可读存储介质 Active CN109905793B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910129183.XA CN109905793B (zh) 2019-02-21 2019-02-21 一种风噪声抑制方法、装置及可读存储介质
PCT/CN2020/075196 WO2020168981A1 (zh) 2019-02-21 2020-02-14 风噪声抑制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910129183.XA CN109905793B (zh) 2019-02-21 2019-02-21 一种风噪声抑制方法、装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN109905793A true CN109905793A (zh) 2019-06-18
CN109905793B CN109905793B (zh) 2021-01-22

Family

ID=66945119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910129183.XA Active CN109905793B (zh) 2019-02-21 2019-02-21 一种风噪声抑制方法、装置及可读存储介质

Country Status (2)

Country Link
CN (1) CN109905793B (zh)
WO (1) WO2020168981A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020168981A1 (zh) * 2019-02-21 2020-08-27 电信科学技术研究院有限公司 风噪声抑制方法及装置
CN113299306A (zh) * 2021-07-27 2021-08-24 北京世纪好未来教育科技有限公司 回声消除方法、装置、电子设备及计算机可读存储介质
CN113613112A (zh) * 2021-09-23 2021-11-05 三星半导体(中国)研究开发有限公司 抑制麦克风的风噪的方法和电子装置
CN113823315A (zh) * 2021-09-30 2021-12-21 深圳万兴软件有限公司 降风噪方法、装置、双麦克风设备及存储介质
CN114420081A (zh) * 2022-03-30 2022-04-29 中国海洋大学 一种有源降噪设备的风噪抑制方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7127076B2 (en) * 2003-03-03 2006-10-24 Phonak Ag Method for manufacturing acoustical devices and for reducing especially wind disturbances
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
US7340068B2 (en) * 2003-02-19 2008-03-04 Oticon A/S Device and method for detecting wind noise
US20140079245A1 (en) * 2012-09-14 2014-03-20 Rohm Co., Ltd. Wind noise reducing circuit
WO2014062152A1 (en) * 2012-10-15 2014-04-24 Mh Acoustics, Llc Noise-reducing directional microphone array
CN105118515A (zh) * 2015-07-03 2015-12-02 中国科学院上海微系统与信息技术研究所 一种基于麦克风阵列的风噪声检测方法
CN106875938A (zh) * 2017-03-10 2017-06-20 南京信息工程大学 一种改进的非线性自适应语音端点检测方法
CN108028049A (zh) * 2015-09-14 2018-05-11 美商楼氏电子有限公司 麦克风信号融合
CN108390663A (zh) * 2018-03-09 2018-08-10 电信科学技术研究院有限公司 一种有限冲激响应滤波器系数矢量的更新方法及装置
US10158941B2 (en) * 2016-11-09 2018-12-18 Bose Corporation Controlling wind noise in a bilateral microphone array

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109905793B (zh) * 2019-02-21 2021-01-22 电信科学技术研究院有限公司 一种风噪声抑制方法、装置及可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
US7340068B2 (en) * 2003-02-19 2008-03-04 Oticon A/S Device and method for detecting wind noise
US7127076B2 (en) * 2003-03-03 2006-10-24 Phonak Ag Method for manufacturing acoustical devices and for reducing especially wind disturbances
US20140079245A1 (en) * 2012-09-14 2014-03-20 Rohm Co., Ltd. Wind noise reducing circuit
WO2014062152A1 (en) * 2012-10-15 2014-04-24 Mh Acoustics, Llc Noise-reducing directional microphone array
CN105118515A (zh) * 2015-07-03 2015-12-02 中国科学院上海微系统与信息技术研究所 一种基于麦克风阵列的风噪声检测方法
CN108028049A (zh) * 2015-09-14 2018-05-11 美商楼氏电子有限公司 麦克风信号融合
US10158941B2 (en) * 2016-11-09 2018-12-18 Bose Corporation Controlling wind noise in a bilateral microphone array
CN106875938A (zh) * 2017-03-10 2017-06-20 南京信息工程大学 一种改进的非线性自适应语音端点检测方法
CN108390663A (zh) * 2018-03-09 2018-08-10 电信科学技术研究院有限公司 一种有限冲激响应滤波器系数矢量的更新方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020168981A1 (zh) * 2019-02-21 2020-08-27 电信科学技术研究院有限公司 风噪声抑制方法及装置
CN113299306A (zh) * 2021-07-27 2021-08-24 北京世纪好未来教育科技有限公司 回声消除方法、装置、电子设备及计算机可读存储介质
CN113299306B (zh) * 2021-07-27 2021-10-15 北京世纪好未来教育科技有限公司 回声消除方法、装置、电子设备及计算机可读存储介质
CN113613112A (zh) * 2021-09-23 2021-11-05 三星半导体(中国)研究开发有限公司 抑制麦克风的风噪的方法和电子装置
CN113823315A (zh) * 2021-09-30 2021-12-21 深圳万兴软件有限公司 降风噪方法、装置、双麦克风设备及存储介质
CN113823315B (zh) * 2021-09-30 2024-02-13 深圳万兴软件有限公司 降风噪方法、装置、双麦克风设备及存储介质
CN114420081A (zh) * 2022-03-30 2022-04-29 中国海洋大学 一种有源降噪设备的风噪抑制方法
CN114420081B (zh) * 2022-03-30 2022-06-28 中国海洋大学 一种有源降噪设备的风噪抑制方法

Also Published As

Publication number Publication date
CN109905793B (zh) 2021-01-22
WO2020168981A1 (zh) 2020-08-27

Similar Documents

Publication Publication Date Title
CN109905793A (zh) 一种风噪声抑制方法及装置
CN107845389B (zh) 一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法
CN109767783B (zh) 语音增强方法、装置、设备及存储介质
KR101934636B1 (ko) 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치
CN108172231B (zh) 一种基于卡尔曼滤波的去混响方法及系统
CN109979476A (zh) 一种语音去混响的方法及装置
AU2009203194A1 (en) Noise spectrum tracking in noisy acoustical signals
CN112863535A (zh) 一种残余回声及噪声消除方法及装置
CN107864444A (zh) 一种麦克风阵列频响校准方法
EP2710590A1 (en) Method for super-wideband noise supression
Mack et al. Single-Channel Dereverberation Using Direct MMSE Optimization and Bidirectional LSTM Networks.
Martín-Doñas et al. Dual-channel DNN-based speech enhancement for smartphones
Ratnarajah et al. Towards improved room impulse response estimation for speech recognition
KR100936093B1 (ko) 전자 신호로부터의 잡음 제거 방법 및 장치
CN103929704B (zh) 一种基于变换域的自适应声反馈消除的方法和系统
CN106997768B (zh) 一种语音出现概率的计算方法、装置及电子设备
US20030128848A1 (en) Method and apparatus for removing noise from electronic signals
CN106098080A (zh) 一种噪声环境下言语识别阈的确定方法及装置
CN111883154B (zh) 回声消除方法及装置、计算机可读的存储介质、电子装置
Habets et al. Speech dereverberation using backward estimation of the late reverberant spectral variance
Heitkaemper et al. Neural Network Based Carrier Frequency Offset Estimation From Speech Transmitted Over High Frequency Channels
CN112687285B (zh) 回声消除方法和装置
Acero et al. Towards environment-independent spoken language systems
Bekrani et al. A robust MINT equalization algorithm based on near-common zero concept
CN115424630A (zh) 一种目标端到端模型的训练方法、混合音频信号处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant