CN113270106B - 双麦克风的风噪声抑制方法、装置、设备及存储介质 - Google Patents
双麦克风的风噪声抑制方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113270106B CN113270106B CN202110495914.XA CN202110495914A CN113270106B CN 113270106 B CN113270106 B CN 113270106B CN 202110495914 A CN202110495914 A CN 202110495914A CN 113270106 B CN113270106 B CN 113270106B
- Authority
- CN
- China
- Prior art keywords
- voice
- signal
- sub
- current
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000000694 effects Effects 0.000 claims abstract description 76
- 238000001514 detection method Methods 0.000 claims abstract description 74
- 230000009977 dual effect Effects 0.000 claims abstract description 18
- 238000009499 grossing Methods 0.000 claims description 43
- 238000001914 filtration Methods 0.000 claims description 27
- 238000001228 spectrum Methods 0.000 claims description 19
- 238000000354 decomposition reaction Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 12
- 101100083446 Danio rerio plekhh1 gene Proteins 0.000 claims description 4
- 230000021615 conjugation Effects 0.000 claims description 2
- 238000006073 displacement reaction Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 6
- 238000011946 reduction process Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请涉及智能语音领域,揭示了双麦克风的风噪声抑制方法,包括:获取双麦克风分别接收当前语音后的时域信号,包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;获取当前语音对应的语音活动检测信号、第一通道时域信号经过子带分解后的第一子带信号,以及第二通道时域信号经过子带分解后的第二子带信号;将语音活动检测信号、第一子带信号以及第二子带信号输入滤波器得到当前语音对应的噪音信号;第一子带信号和第二子带信号进行固定波束形成,得到当前语音对应的增强信号;通过增强信号以及噪音信号,估计当前语音对应的语音存在概率;根据语音存在概率对当前语音进行噪声抑制。先抵消掉目标语音显著提升噪声抑制效果。
Description
技术领域
本申请涉及智能语音领域,特别是涉及到双麦克风的风噪声抑制方法、装置、设备及存储介质。
背景技术
随着技术的发展,智能语音更广范围地使用于各类型的智能设备中,但在语音交互中噪音的存在影响了语音交互效果,需要通过降风噪技术进行噪声抑制。现有的降风噪技术中,有基于单通道语音增强的方法进行噪音抑制,但是风噪声非平稳性强,难以通过单通道噪声估计的方法进行精准跟踪。现有基于复相干函数的方法多通道检测方式,虽然可比较精准地跟踪噪音,但是对低频目标语音的损伤较大,依然达不到语音交互的良好效果。基于掩码或谱映射增强的深度学习方法,噪音抑制效果较好,但是运算量大不利于小型智能设备的集成。综上,现有降噪技术不能解决小型智能设备上语音交互过程中的噪音抑制的问题。
发明内容
本申请的主要目的为提供双麦克风的风噪声抑制方法,旨在解决现有降噪技术不能解决小型智能设备上语音交互过程中的噪音抑制的技术问题。
本申请提出一种双麦克风的风噪声抑制方法,包括:
获取所述双麦克风分别接收当前语音后的时域信号,所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;
根据所述时域信号获取所述当前语音对应的语音活动检测信号,获取所述第一通道时域信号经过子带分解后对应的第一子带信号,以及所述第二通道时域信号经过子带分解后对应的第二子带信号;
将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号;
对所述第一子带信号和所述第二子带信号进行固定波束形成,得到所述当前语音对应的增强信号;
通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率;
根据所述语音存在概率对所述当前语音进行噪声抑制。
优选地,所述语音活动检测信号包括帧级别的第一语音活动检测信号,所述根据所述时域信号获取所述当前语音对应的语音活动检测信号的步骤,包括:
通过所述第一通道时域信号计算所述当前语音对应的谐波比;
将所述谐波比作为所述第一语音活动检测信号。
优选地,所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号的步骤,包括:
将所述谐波比作为识别语音帧的概率,判断当前帧是否为语音帧,其中,所述当前帧为所述当前语音中的任意一帧;
通过第一公式控制所述滤波器的步长因子,若为语音帧则将所述步长因子增大至第一预设因子,若不为语音帧,则判定为非语音帧并将所述步长因子缩小至第二预设因子;
在所述第一预设因子下对所述语音帧中的各子带序列进行滤波,抵消掉语音数据,在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后,得到所述当前语音对应的第一噪音信号。
优选地,所述语音活动检测信号包括频点级别的第二语音活动检测信号,将所述谐波比作为所述第一语音活动检测信号的步骤之后,包括:
将所述第一语音活动检测信号、所述第一子带信号以及所述第二子带信号输入第一滤波器中,得到所述当前语音对应的第一噪音信号;
通过所述第一噪音信号和所述当前语音对应的增强信号,计算所述当前语音对应的子带信号中各子带序列分别对应的第一语音存在概率;
将所述第一语音存在概率作为所述第二语音活动检测信号。
优选地,所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号的步骤,包括:
根据所述第一语音存在概率确定指定子带序列对应的指定概率,其中,所述指定子带序列为所述当前语音对应的任意一子带序列;
将所述指定概率代入第二公式,得到所述滤波器对所述指定子带序列滤波时的指定步长因子;
在所述指定步长因子下对所述指定子带序列进行滤波;
按照所述指定子带序列的滤波过程,对所述当前语音对应的所有子带序列进行滤波,得到所述当前语音对应的第二噪音信号。
优选地,所述通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率的步骤,包括:
根据第三公式对所述当前语音对应的增强信号进行时间维度平滑得到第一平滑信号,根据所述第三公式对所述当前语音对应的噪音信号进行时间维度平滑得到第二平滑信号;
将所述第一平滑信号代入频域维度平滑的第四公式,得到增强信号的平滑信号,将所述第二平滑信号代入频域维度平滑的第四公式,得到噪音信号的平滑信号;
根据第五公式计算所述增强信号的平滑信号与所述噪音信号的平滑信号的能量比值;
根据所述能量比值计算得到所述当前语音对应的语音存在概率。
优选地,所述根据所述语音存在概率对所述当前语音进行噪声抑制的步骤,包括:
利用所述语音存在概率通过第六公式计算时变平滑系数;
通过所述时变平滑系数通过第七公式实时更新噪声谱;
利用更新后的噪声谱通过第八公式计算后验信噪比;
利用所述后验信噪比通过第九公式计算先验信噪比;
根据所述先验信噪比通过第十公式计算当前时刻条件增益;
根据所述当前时刻条件增益通过第十一公式计算当前滤波系数;
根据所述当前滤波系数对所述当前语音进行噪声抑制。
本申请还提供了一种一种双麦克风的风噪声抑制装置,包括:
第一获取模块,用于获取所述双麦克风分别接收当前语音后的时域信号,所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;
第二获取模块,用于根据所述时域信号获取所述当前语音对应的语音活动检测信号,获取所述第一通道时域信号经过子带分解后对应的第一子带信号,以及所述第二通道时域信号经过子带分解后对应的第二子带信号;
输入模块,用于将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号;
得到模块,用于对所述第一子带信号和所述第二子带信号进行固定波束形成,得到所述当前语音对应的增强信号;
估计模块,用于通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率;
抑制模块,用于根据所述语音存在概率对所述当前语音进行噪声抑制。
本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
本申请通过双麦克风的风噪声抑制方法计算量小,适合部署于小型智能设备中,通过NLMS自适应滤波器先抵消掉目标语音,得到包含风噪在内的参考噪声后再进行后续的谱增强,由于先抵消掉了目标语音可以最大程度避免降噪过程中对目标语音的损伤,且能显著提升有语音段的风噪声的抑制效果。
附图说明
图1本申请一实施例的双麦克风的风噪声抑制方法流程示意图;
图2本申请一实施例的噪音抑制处理流程示意图;
图3本申请一实施例的双麦克风的风噪声抑制系统流程示意图;
图4本申请一实施例的计算机设备内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例的双麦克风的风噪声抑制方法,包括:
S1:获取所述双麦克风分别接收当前语音后的时域信号,所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;
S2:根据所述时域信号获取所述当前语音对应的语音活动检测信号,获取所述第一通道时域信号经过子带分解后对应的第一子带信号,以及所述第二通道时域信号经过子带分解后对应的第二子带信号;
S3:将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号;
S4:对所述第一子带信号和所述第二子带信号进行固定波束形成,得到所述当前语音对应的增强信号;
S5:通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率;
S6:根据所述语音存在概率对所述当前语音进行噪声抑制。
本申请通过双麦克风的双通道时域信号以及子带分解技术,识别目标语音,然后通过NLMS(Normalized Least Mean Square,归一化最小均方自适应滤波器)自适应滤波器先抵消掉目标语音,得到包含风噪在内的参考噪声,再进行后续的谱增强进行噪音抑制。通过先抵消掉目标语音可以最大程度避免降噪过程中对目标语音的损伤。
上述双麦克风分别对接收的语音进行傅里叶转换,得到当前语音的双通道时域信号分别为x1(t),x2(t)。对上述两路时域信号使用分析滤波器进行子带分解,得到各通道时域信号分别对应的子带信号x1(k,n),x2(k,n),其中k,n分别为子带序号和帧序号,下述相同,不赘述。时域信号由多个时序排布的帧数据组成,每帧帧数据由多个时序排布的子带序列组成,上述子带序号和帧序号对应于语音生成的时序次序。
上述语音活动检测信号即对当前语音的时域信号进行VAD(Voice ActivityDetection,语音活动检测)检测后得到的数据信号,根据处理过程不同,得到的语音活动检测信号包括帧级别的语音活动检测信号和/或频点级别的语音活动检测信号。然后将语音活动检测信号、第一子带信号以及第二子带信号输入滤波器中,识别并抵消目标语音,得到包括风噪在内的参考噪音,即上述噪音信号U(k,n)。上述滤波器为NLMS滤波器。
上述固定波束形成,是将双通道子带信号x1(k,n),x2(k,n)作固定波束形成得到增强信号,上述固定波束使用频域延时求和波束,也可以使用超指向MVDR(Minimum variancedistortionless response,最小方差无失真响应),不作限定。双通道子带信号x1(k,n),x2(k,n)作固定波束形成后输出得到增强信号Yref(k,n)。然后对噪音信号U(k,n)和增强信号Yref(k,n),分别依次进行时间维度平滑和频域维度平滑后,计算平滑后增强信号Yref(k,n)和噪音信号U(k,n)的能量比值,进而根据能量比值估算语音存在概率,然后根据语音存在概率计算滤波系数,进行噪音抑制。
本申请通过双麦克风的风噪声抑制方法计算量小,适合部署于小型智能设备中,通过NLMS自适应滤波器先抵消掉目标语音,得到包含风噪在内的参考噪声后再进行后续的谱增强,由于先抵消掉了目标语音可以最大程度避免降噪过程中对目标语音的损伤,且能显著提升有语音段的风噪声的抑制效果。
进一步地,所述语音活动检测信号包括帧级别的第一语音活动检测信号,所述根据所述时域信号获取所述当前语音对应的语音活动检测信号的步骤S2,包括:
S21:通过所述第一通道时域信号计算所述当前语音对应的谐波比;
S22:将所述谐波比作为所述第一语音活动检测信号。
本申请实施例通过对第一通道时域信号x1(t)进行互相关计算,利用基音周期检测的方法得到谐波比P0。利用谐波比P0作为帧级别的VAD概率,作为识别语音帧的概率,即上述帧级别的第一语音活动检测信号。谐波比P0为(0,1)之间的概率值,若为语音帧时,概率值接近1,若为非语音帧时,概率值接近0。本申请实施例通过谐波比P0用来控制NLMS滤波器的步长因子,谐波比P0为根据每帧音频计算得到的一个概率值,因此此时的NLMS滤波器对每帧音频中的所有子带序列均使用相同的步长因子u,但相邻帧音频之间使用不同的步长因子。
进一步地,所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号的步骤S3,包括:
S31:将所述谐波比作为识别语音帧的概率,判断当前帧是否为语音帧,其中,所述当前帧为所述当前语音中的任意一帧;
S32:通过第一公式控制所述滤波器的步长因子,若为语音帧则将所述步长因子增大至第一预设因子,若不为语音帧,则判定为非语音帧并将所述步长因子缩小至第二预设因子;
S33:在所述第一预设因子下对所述语音帧中的各子带序列进行滤波,抵消掉语音数据,在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后,得到所述当前语音对应的第一噪音信号。
本申请实施例通过谐波比P0控制NLMS滤波器的步长因子的过程如上所述。计算步长因子u的第一公式为:u=P0*umax+(1-P0)*umin,其中umax、umin为预设步长门限,以保证滤波器稳定。在步长因子u的控制下,NLMS滤波器在有目标语音的时候进行大步长更新滤波,从而能有效抵消掉目标语音,在无目标语音的时候选择较小步长保留参考噪音,经过NLMS滤波器后输出抵消掉目标语音的第一噪声信号U1(k,n)。本申请实施例中,可直接根据第一噪声信号U1(k,n)和增强信号Yref(k,n),分别依次进行时间维度平滑和频域维度平滑后,计算平滑后增强信号Yref(k,n)和噪音信号U1(k,n)的能量比值,进而根据能量比值估算语音存在概率,然后根据语音存在概率计算滤波系数,进行噪音抑制。
进一步地,所述语音活动检测信号包括频点级别的第二语音活动检测信号,将所述谐波比作为所述第一语音活动检测信号的步骤S22之后,包括:
S23:将所述第一语音活动检测信号、所述第一子带信号以及所述第二子带信号输入第一滤波器中,得到所述当前语音对应的第一噪音信号;
S24:通过所述第一噪音信号和所述当前语音对应的增强信号,计算所述当前语音对应的子带信号中各子带序列分别对应的第一语音存在概率;
S25:将所述第一语音存在概率作为所述第二语音活动检测信号。
本申请实施例为提升噪音实时跟踪的效果,增强降噪效果,使用跟精细的频点级别的第二语音活动检测信号,控制滤波器的步长因子,使步长因子不仅跟随帧数据的不同而发生时间变化,且跟随帧内不同子带序列而发生时间变化,即步长因子的变化跟随声音信号发生更精细的跟踪,以便更好的抵消目标语音,保留风噪在内的参考噪音,使得在降噪过程中噪音抑制效果更佳,且更好的保护目标语音。
通过固定波束形成后输出增强信号Yref(k,n),以及谐波比P0控制下的第一滤波器输出的第一噪声信号U1(k,n),将Yref(k,n)和U1(k,n)分别进行如下平滑处理,包括时间维度平滑,时间维度平滑对应的第三公式为然后再进行频域维度平滑,频域维度平滑对应的第四公式为/>其中h为汉明平滑窗,β为平滑系数,如本申请优选为0.95,ξ(k,n)表示模的平方,下标λ代表Yref(k,n)或者U1(k,n),i表示位移单位。然后根据第五公式计算能量比值,第五公式为最后根据能量比值计算得到第一语音存在概率P1(k,n),或表示为P1,计算过程过下:
其中,Λmax(k,n)和Λmin(k,n)为预设门限,可以根据风噪的频率范围在不同频段设置不同的参数,根据实验经验进行设置。
进一步地,所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号的步骤S3,包括:
S301:根据所述第一语音存在概率确定指定子带序列对应的指定概率,其中,所述指定子带序列为所述当前语音对应的任意一子带序列;
S302:将所述指定概率代入第二公式,得到所述滤波器对所述指定子带序列滤波时的指定步长因子;
S303:在所述指定步长因子下对所述指定子带序列进行滤波;
S304:按照所述指定子带序列的滤波过程,对所述当前语音对应的所有子带序列进行滤波,得到所述当前语音对应的第二噪音信号。
本申请实施例通过两步迭代的方式通过两级滤波器串联滤波,先利用帧级别的VAD控制第一个复数NLMS滤波器对消一次目标语音,处理得到第一语音存在概率,再利用第一语音存在概率作为频点级别的VAD控制第二个复数NLMS滤波器再对消一次目标语音,最后再进行噪声谱的估计跟踪,得到更精确的第二语音存在概率,进而可以对强非平稳的风噪声进行快速准确的跟踪,从而保证了后续的噪音抑制效果。第二个复数NLMS滤波器中输入频点级别的第一语音存在概率P1(k,n)后,利用第二公式u(k,n)=P1(k,n)*umax1(k)+(1-P1(k,n))*umin1(k),计算得到控制第二个复数NLMS滤波器对各个子带序列的步长因子u(k,n),其中umax1(k)和umin1(k)为每个子带的步长因子门限。第二个复数NLMS滤波器输出第二噪声信号U2(k,n)。
进一步地,所述通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率的步骤S5,包括:
S51:根据第三公式对所述当前语音对应的增强信号进行时间维度平滑得到第一平滑信号,根据所述第三公式对所述当前语音对应的噪音信号进行时间维度平滑得到第二平滑信号;
S52:将所述第一平滑信号代入频域维度平滑的第四公式,得到增强信号的平滑信号,将所述第二平滑信号代入频域维度平滑的第四公式,得到噪音信号的平滑信号;
S53:根据第五公式计算所述增强信号的平滑信号与所述噪音信号的平滑信号的能量比值;
S54:根据所述能量比值计算得到所述当前语音对应的语音存在概率。
本申请上述语音存在概率包括第一语音存在概率P1(k,n)和计算第二语音存在概率P2(k,n),计算第一语音存在概率P1(k,n)和计算第二语音存在概率P2(k,n)的原理相同,区别仅在于使用不同的预设门限Λmax(k,n)和Λmin(k,n),以及使用不同的平滑系数β,使估计得到更准确的第二语音存在概率P2(k,n),或表示为P2。上述第三公式、第四公式以及第五公式的解释见上述第一语音存在概率P1(k,n)计算过程,不赘述。
本申请实施例可直接通过频点级别的VAD对消目标语音,再进行噪声估计跟踪。但为提高噪声估计跟踪效果,本申请优选先利用帧级别的VAD控制第一个复数NLMS滤波器对消一次目标语音,处理得到第一语音存在概率,再以第一级语音存在概率作为频点级别的VAD,输入第二个复数NLMS滤波器再对消一次目标语音,得到更精准的第二语音存在概率,最后再根据第二语音存在概率进行噪声估计跟踪,进而可以对强非平稳的风噪声进行快速准确的跟踪,从而保证了后续的噪音抑制效果,噪音抑制处理流程示意图如图2所示。
进一步地,所述根据所述语音存在概率对所述当前语音进行噪声抑制的步骤S6,包括:
S61:利用所述语音存在概率通过第六公式计算时变平滑系数;
S62:通过所述时变平滑系数通过第七公式实时更新噪声谱;
S63:利用更新后的噪声谱通过第八公式计算后验信噪比;
S64:利用所述后验信噪比通过第九公式计算先验信噪比;
S65:根据所述先验信噪比通过第十公式计算当前时刻条件增益;
S66:根据所述当前时刻条件增益通过第十一公式计算当前滤波系数;
S67:根据所述当前滤波系数对所述当前语音进行噪声抑制。
本申请实施例利用第二语音存在概率P2(k,n)和固定波束输出Yref(k,n),估计得到最终的噪声谱。噪声谱估计过程具体如下:利用P2(k,n)通过第六公式计算时变平滑系数第六公式为/>其中αd为预设系数。接着利用时变平滑系数/>通过第七公式更新噪声谱λd(k,n),第七公式为conj表示共轭操作。接着利用上一步估计得到的噪声谱,通过第八公式计算后验信噪比γ(k,n),第八公式为/>然后利用所述后验信噪比通过第九公式计算先验信噪比ζ(k,n),第九公式为ζ(k,n)=α*GH1 2(k,n-1)*γ(k,n-1)+(1-α)*max(γ(λ,k)-1,0),其中GH1(k,n-1)为上一时刻频点k的条件增益系数,α为预设平滑参数。根据所述先验信噪比通过第十公式计算当前时刻条件增益GH1,第十公式为/>然后根据所述当前时刻条件增益通过第十一公式计算当前滤波系数G(k,n),第十一公式为/>其中Gmin为权值下限,利用G(k,n)对Yref(k,n)进行滤波,即Y(k,n)=G(k,n)*Yref(k,n)。最后将滤波后的子带信号Yref(k,n)通过综合滤波器组合得到时域单通道信号,得到恢复语音y。
参照图3,本申请一实施例的双麦克风的风噪声抑制装置,包括:
第一获取模块1,用于获取所述双麦克风分别接收当前语音后的时域信号,所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;
第二获取模块2,用于根据所述时域信号获取所述当前语音对应的语音活动检测信号,获取所述第一通道时域信号经过子带分解后对应的第一子带信号,以及所述第二通道时域信号经过子带分解后对应的第二子带信号;
输入模块3,用于将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号;
得到模块4,用于对所述第一子带信号和所述第二子带信号进行固定波束形成,得到所述当前语音对应的增强信号;
估计模块5,用于通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率;
抑制模块6,用于根据所述语音存在概率对所述当前语音进行噪声抑制。
本申请实施例的解释同上述方法的对应部分,不赘述。
进一步地,所述语音活动检测信号包括帧级别的第一语音活动检测信号,第二获取模块2,包括:
第一计算单元,用于通过所述第一通道时域信号计算所述当前语音对应的谐波比;
第一作为单元,用于将所述谐波比作为所述第一语音活动检测信号。
进一步地,输入模块3,包括:
判断单元,用于将所述谐波比作为识别语音帧的概率,判断当前帧是否为语音帧,其中,所述当前帧为所述当前语音中的任意一帧;
控制单元,用于通过第一公式控制所述滤波器的步长因子,若为语音帧则将所述步长因子增大至第一预设因子,若不为语音帧,则判定为非语音帧并将所述步长因子缩小至第二预设因子;
第一滤波单元,用于在所述第一预设因子下对所述语音帧中的各子带序列进行滤波,抵消掉语音数据,在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后,得到所述当前语音对应的第一噪音信号。
进一步地,所述语音活动检测信号包括频点级别的第二语音活动检测信号,第二获取模块2,包括:
输入单元,用于将所述第一语音活动检测信号、所述第一子带信号以及所述第二子带信号输入第一滤波器中,得到所述当前语音对应的第一噪音信号;
第二计算单元,用于通过所述第一噪音信号和所述当前语音对应的增强信号,计算所述当前语音对应的子带信号中各子带序列分别对应的第一语音存在概率;
第二作为单元,用于将所述第一语音存在概率作为所述第二语音活动检测信号。
进一步地,输入模块3,包括:
确定单元,用于根据所述第一语音存在概率确定指定子带序列对应的指定概率,其中,所述指定子带序列为所述当前语音对应的任意一子带序列;
第一代入单元,用于将所述指定概率代入第二公式,得到所述滤波器对所述指定子带序列滤波时的指定步长因子;
第二滤波单元,用于在所述指定步长因子下对所述指定子带序列进行滤波;
第三滤波单元,用于按照所述指定子带序列的滤波过程,对所述当前语音对应的所有子带序列进行滤波,得到所述当前语音对应的第二噪音信号。
进一步地,估计模块5,包括:
平滑单元,用于根据第三公式对所述当前语音对应的增强信号进行时间维度平滑得到第一平滑信号,根据所述第三公式对所述当前语音对应的噪音信号进行时间维度平滑得到第二平滑信号;
第二代入单元,用于将所述第一平滑信号代入频域维度平滑的第四公式,得到增强信号的平滑信号,将所述第二平滑信号代入频域维度平滑的第四公式,得到噪音信号的平滑信号;
第三计算单元,用于根据第五公式计算所述增强信号的平滑信号与所述噪音信号的平滑信号的能量比值;
第四计算单元,用于根据所述能量比值计算得到所述当前语音对应的语音存在概率。
进一步地,抑制模块6,包括:
第五计算单元,用于利用所述语音存在概率通过第六公式计算时变平滑系数;
更新单元,用于通过所述时变平滑系数通过第七公式实时更新噪声谱;
第六计算单元,用于利用更新后的噪声谱通过第八公式计算后验信噪比;
第七计算单元,用于利用所述后验信噪比通过第九公式计算先验信噪比;
第八计算单元,用于根据所述先验信噪比通过第十公式计算当前时刻条件增益;
第九计算单元,用于根据所述当前时刻条件增益通过第十一公式计算当前滤波系数;
抑制单元,用于根据所述当前滤波系数对所述当前语音进行噪声抑制。
参照图4,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储双麦克风的风噪声抑制过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现双麦克风的风噪声抑制方法。
上述处理器执行上述双麦克风的风噪声抑制方法,包括:获取所述双麦克风分别接收当前语音后的时域信号,所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;根据所述时域信号获取所述当前语音对应的语音活动检测信号,获取所述第一通道时域信号经过子带分解后对应的第一子带信号,以及所述第二通道时域信号经过子带分解后对应的第二子带信号;将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号;对所述第一子带信号和所述第二子带信号进行固定波束形成,得到所述当前语音对应的增强信号;通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率;根据所述语音存在概率对所述当前语音进行噪声抑制。
上述计算机设备,通过双麦克风的风噪声抑制方法计算量小,适合部署于小型智能设备中,通过NLMS自适应滤波器先抵消掉目标语音,得到包含风噪在内的参考噪声后再进行后续的谱增强,由于先抵消掉了目标语音可以最大程度避免降噪过程中对目标语音的损伤,且能显著提升有语音段的风噪声的抑制效果。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现双麦克风的风噪声抑制方法,包括:获取所述双麦克风分别接收当前语音后的时域信号,所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;根据所述时域信号获取所述当前语音对应的语音活动检测信号,获取所述第一通道时域信号经过子带分解后对应的第一子带信号,以及所述第二通道时域信号经过子带分解后对应的第二子带信号;将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号;对所述第一子带信号和所述第二子带信号进行固定波束形成,得到所述当前语音对应的增强信号;通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率;根据所述语音存在概率对所述当前语音进行噪声抑制。
上述计算机可读存储介质,通过双麦克风的风噪声抑制方法计算量小,适合部署于小型智能设备中,通过NLMS自适应滤波器先抵消掉目标语音,得到包含风噪在内的参考噪声后再进行后续的谱增强,由于先抵消掉了目标语音可以最大程度避免降噪过程中对目标语音的损伤,且能显著提升有语音段的风噪声的抑制效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (7)
1.一种双麦克风的风噪声抑制方法,其特征在于,包括:
获取所述双麦克风分别接收当前语音后的时域信号,所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;
根据所述时域信号获取所述当前语音对应的语音活动检测信号,获取所述第一通道时域信号经过子带分解后对应的第一子带信号,以及所述第二通道时域信号经过子带分解后对应的第二子带信号;
将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号;
对所述第一子带信号和所述第二子带信号进行固定波束形成,得到所述当前语音对应的增强信号;
通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率;
根据所述语音存在概率对所述当前语音进行噪声抑制;
所述语音活动检测信号包括帧级别的第一语音活动检测信号,所述根据所述时域信号获取所述当前语音对应的语音活动检测信号的步骤,包括:
通过所述第一通道时域信号计算所述当前语音对应的谐波比;
将所述谐波比作为所述第一语音活动检测信号;
所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号的步骤,包括:
将所述谐波比作为识别语音帧的概率,判断当前帧是否为语音帧,其中,所述当前帧为所述当前语音中的任意一帧;
通过第一公式控制所述滤波器的步长因子,若为语音帧则将所述步长因子增大至第一预设因子,若不为语音帧,则判定为非语音帧并将所述步长因子缩小至第二预设因子;
在所述第一预设因子下对所述语音帧中的各子带序列进行滤波,抵消掉语音数据,在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后,得到所述当前语音对应的第一噪音信号;
所述语音活动检测信号包括频点级别的第二语音活动检测信号,将所述谐波比作为所述第一语音活动检测信号的步骤之后,包括:
将所述第一语音活动检测信号、所述第一子带信号以及所述第二子带信号输入第一滤波器中,得到所述当前语音对应的第一噪音信号;
通过所述第一噪音信号和所述当前语音对应的增强信号,计算所述当前语音对应的子带信号中各子带序列分别对应的第一语音存在概率;
将所述第一语音存在概率作为所述第二语音活动检测信号;
所述第一公式为u=P0*umax+(1-P0)*umin,其中u为步长因子、P0为谐波比、umax和umin为预设步长门限。
2.根据权利要求1所述的双麦克风的风噪声抑制方法,其特征在于,所述将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号的步骤,包括:
根据所述第一语音存在概率确定指定子带序列对应的指定概率,其中,所述指定子带序列为所述当前语音对应的任意一子带序列;
将所述指定概率代入第二公式,得到所述滤波器对所述指定子带序列滤波时的指定步长因子;
在所述指定步长因子下对所述指定子带序列进行滤波;
按照所述指定子带序列的滤波过程,对所述当前语音对应的所有子带序列进行滤波,得到所述当前语音对应的第二噪音信号;
其中,所述第二公式为u(k,n)=P1(k,n)*umax1(k)+(1-P1(k,n))*umin1(k),u(k,n)为各个子带序列的步长因子,P1(k,n)为第一语音存在概率,umax1(k)和umin1(k)为每个子带的步长因子门限。
3.根据权利要求2所述的双麦克风的风噪声抑制方法,其特征在于,所述通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率的步骤,包括:
根据第三公式对所述当前语音对应的增强信号进行时间维度平滑得到第一平滑信号,根据所述第三公式对所述当前语音对应的噪音信号进行时间维度平滑得到第二平滑信号;
将所述第一平滑信号代入频域维度平滑的第四公式,得到增强信号的平滑信号,将所述第二平滑信号代入频域维度平滑的第四公式,得到噪音信号的平滑信号;
根据第五公式计算所述增强信号的平滑信号与所述噪音信号的平滑信号的能量比值;
根据所述能量比值计算得到所述当前语音对应的语音存在概率;
其中,所述第三公式为所述第四公式为所述第五公式为/> ξ(k,n)表示模的平方,h为汉明平滑窗,β为平滑系数,下标λ代表增强信号Yref(k,n)或者第一噪声信号U1(k,n),i表示位移单位。
4.根据权利要求1所述的双麦克风的风噪声抑制方法,其特征在于,所述根据所述语音存在概率对所述当前语音进行噪声抑制的步骤,包括:
利用所述语音存在概率通过第六公式计算时变平滑系数;
通过所述时变平滑系数通过第七公式实时更新噪声谱;
利用更新后的噪声谱通过第八公式计算后验信噪比;
利用所述后验信噪比通过第九公式计算先验信噪比;
根据所述先验信噪比通过第十公式计算当前时刻条件增益;
根据所述当前时刻条件增益通过第十一公式计算当前滤波系数;
根据所述当前滤波系数对所述当前语音进行噪声抑制;
其中,所述第六公式为所述第七公式为所述第八公式为所述第九公式为ζ(k,n)=α*GH1 2(k,n-1)*γ(k,n-1)+(1-α)*max(γ(λ,k)-1,0),所述第十公式为/>所述第十一公式为/>P2(k,n)为第二语音存在概率,αd为预设系数,Yref(k,n)为增强信号,conj表示共轭操作,GH1(k,n-1)为上一时刻频点k的条件增益系数,α为预设平滑参数,Gmin为权值下限。
5.一种双麦克风的风噪声抑制装置,其特征在于,包括:
第一获取模块,用于获取所述双麦克风分别接收当前语音后的时域信号,所述时域信号包括第一麦克风对应的第一通道时域信号以及第二麦克风对应的第二通道时域信号;
第二获取模块,用于根据所述时域信号获取所述当前语音对应的语音活动检测信号,获取所述第一通道时域信号经过子带分解后对应的第一子带信号,以及所述第二通道时域信号经过子带分解后对应的第二子带信号;
输入模块,用于将所述语音活动检测信号、所述第一子带信号以及所述第二子带信号输入滤波器中,得到所述当前语音对应的噪音信号;
得到模块,用于对所述第一子带信号和所述第二子带信号进行固定波束形成,得到所述当前语音对应的增强信号;
估计模块,用于通过所述当前语音对应的增强信号以及所述当前语音对应的噪音信号,估计所述当前语音对应的语音存在概率;
抑制模块,用于根据所述语音存在概率对所述当前语音进行噪声抑制;
所述语音活动检测信号包括帧级别的第一语音活动检测信号,所述第二获取模块,包括:
第一计算单元,用于通过所述第一通道时域信号计算所述当前语音对应的谐波比;
第一作为单元,用于将所述谐波比作为所述第一语音活动检测信号;
所述输入模块,包括:
判断单元,用于将所述谐波比作为识别语音帧的概率,判断当前帧是否为语音帧,其中,所述当前帧为所述当前语音中的任意一帧;
控制单元,用于通过第一公式控制所述滤波器的步长因子,若为语音帧则将所述步长因子增大至第一预设因子,若不为语音帧,则判定为非语音帧并将所述步长因子缩小至第二预设因子;
第一滤波单元,用于在所述第一预设因子下对所述语音帧中的各子带序列进行滤波,抵消掉语音数据,在所述第二预设因子下对所述非语音帧中的各子带序列进行滤波后,得到所述当前语音对应的第一噪音信号;
所述语音活动检测信号包括频点级别的第二语音活动检测信号,所述第二获取模块,包括:
输入单元,用于将所述第一语音活动检测信号、所述第一子带信号以及所述第二子带信号输入第一滤波器中,得到所述当前语音对应的第一噪音信号;
第二计算单元,用于通过所述第一噪音信号和所述当前语音对应的增强信号,计算所述当前语音对应的子带信号中各子带序列分别对应的第一语音存在概率;
第二作为单元,用于将所述第一语音存在概率作为所述第二语音活动检测信号;
所述第一公式为u=P0*umax+(1-P0)*umin,其中u为步长因子、P0为谐波比、umax和umin为预设步长门限。
6.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110495914.XA CN113270106B (zh) | 2021-05-07 | 2021-05-07 | 双麦克风的风噪声抑制方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110495914.XA CN113270106B (zh) | 2021-05-07 | 2021-05-07 | 双麦克风的风噪声抑制方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113270106A CN113270106A (zh) | 2021-08-17 |
CN113270106B true CN113270106B (zh) | 2024-03-15 |
Family
ID=77230056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110495914.XA Active CN113270106B (zh) | 2021-05-07 | 2021-05-07 | 双麦克风的风噪声抑制方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113270106B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744752A (zh) * | 2021-08-30 | 2021-12-03 | 西安声必捷信息科技有限公司 | 语音处理方法及装置 |
CN113658579B (zh) * | 2021-09-18 | 2024-01-30 | 重庆紫光华山智安科技有限公司 | 音频信号处理方法、装置、电子设备及可读存储介质 |
KR20230109716A (ko) * | 2021-10-11 | 2023-07-20 | 썬전 샥 컴퍼니 리미티드 | 음성존재확률 판정방법과 시스템, 음성강화방법과 시스템, 헤드폰 |
CN113973250B (zh) * | 2021-10-26 | 2023-12-08 | 恒玄科技(上海)股份有限公司 | 一种噪声抑制方法、装置及辅听耳机 |
CN114242098B (zh) * | 2021-12-13 | 2023-08-29 | 北京百度网讯科技有限公司 | 一种语音增强方法、装置、设备以及存储介质 |
CN117995225A (zh) * | 2022-10-31 | 2024-05-07 | 荣耀终端有限公司 | 语音检测方法及其相关设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101976565A (zh) * | 2010-07-09 | 2011-02-16 | 瑞声声学科技(深圳)有限公司 | 基于双麦克风语音增强装置及方法 |
CN102938254A (zh) * | 2012-10-24 | 2013-02-20 | 中国科学技术大学 | 一种语音信号增强系统和方法 |
CN107004424A (zh) * | 2014-11-06 | 2017-08-01 | 沃寇族姆系统有限公司 | 噪声降低和语音增强的方法、设备和系统 |
CN110830870A (zh) * | 2019-11-26 | 2020-02-21 | 北京声加科技有限公司 | 一种基于传声器技术的耳机佩戴者语音活动检测系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200735624A (en) * | 2006-01-27 | 2007-09-16 | Mediatek Inc | Method and apparatus for echo cancellation |
US9048942B2 (en) * | 2012-11-30 | 2015-06-02 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for reducing interference and noise in speech signals |
US10127919B2 (en) * | 2014-11-12 | 2018-11-13 | Cirrus Logic, Inc. | Determining noise and sound power level differences between primary and reference channels |
KR20240033108A (ko) * | 2017-12-07 | 2024-03-12 | 헤드 테크놀로지 에스아에르엘 | 음성인식 오디오 시스템 및 방법 |
-
2021
- 2021-05-07 CN CN202110495914.XA patent/CN113270106B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101976565A (zh) * | 2010-07-09 | 2011-02-16 | 瑞声声学科技(深圳)有限公司 | 基于双麦克风语音增强装置及方法 |
CN102938254A (zh) * | 2012-10-24 | 2013-02-20 | 中国科学技术大学 | 一种语音信号增强系统和方法 |
CN107004424A (zh) * | 2014-11-06 | 2017-08-01 | 沃寇族姆系统有限公司 | 噪声降低和语音增强的方法、设备和系统 |
CN110830870A (zh) * | 2019-11-26 | 2020-02-21 | 北京声加科技有限公司 | 一种基于传声器技术的耳机佩戴者语音活动检测系统 |
Non-Patent Citations (2)
Title |
---|
利用信号功率谱密度的麦克风阵列噪声消除方法;倪峰;周翊;刘宏清;;信号处理(第03期);全文 * |
基于TF-GSC的多通道后置滤波语音增强算法;马子骥等;《传感器与微系统》;第第37卷卷(第第5期期);105-107 * |
Also Published As
Publication number | Publication date |
---|---|
CN113270106A (zh) | 2021-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113270106B (zh) | 双麦克风的风噪声抑制方法、装置、设备及存储介质 | |
CN111418010B (zh) | 一种多麦克风降噪方法、装置及终端设备 | |
CN109215677B (zh) | 一种适用于语音和音频的风噪检测和抑制方法和装置 | |
KR101339592B1 (ko) | 음원 분리 장치, 음원 분리 방법, 및 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 | |
Narayanan et al. | Improving robustness of deep neural network acoustic models via speech separation and joint adaptive training | |
JP4753821B2 (ja) | 音信号補正方法、音信号補正装置及びコンピュータプログラム | |
US11373667B2 (en) | Real-time single-channel speech enhancement in noisy and time-varying environments | |
JP2005249816A (ja) | 信号強調装置、方法及びプログラム、並びに音声認識装置、方法及びプログラム | |
US9583120B2 (en) | Noise cancellation apparatus and method | |
CN111048106A (zh) | 基于双麦克风的拾音方法、装置和计算机设备 | |
EP2629295B1 (en) | System and method for noise estimation with music detection | |
US10937418B1 (en) | Echo cancellation by acoustic playback estimation | |
CN112331226B (zh) | 一种针对主动降噪系统的语音增强系统及方法 | |
CN115641866A (zh) | 信号处理方法及装置、计算机可读存储介质、终端 | |
JP5787126B2 (ja) | 信号処理方法、情報処理装置、及び信号処理プログラム | |
US9443503B2 (en) | Signal processing device, signal processing method and signal processing program | |
Prasad et al. | Two microphone technique to improve the speech intelligibility under noisy environment | |
CN113763975A (zh) | 一种语音信号处理方法、装置及终端 | |
CN117995215B (zh) | 语音信号的处理方法、装置、计算机设备及存储介质 | |
CN115132220B (zh) | 抑制电视噪声的双麦唤醒的方法、装置、设备及存储介质 | |
JP7527572B2 (ja) | デュアルマイクロフォンアレイのエコー除去方法、装置、および電子機器 | |
CN113870884B (zh) | 单麦克风噪声抑制方法和装置 | |
CN117727318A (zh) | 回声消除、模型训练方法、装置、电子设备及存储介质 | |
KR101958006B1 (ko) | 음성 향상 장치 및 방법, 기록 매체 | |
Wang et al. | A Dual-microphone Sub-band Post-filter Using Simplified TBRR for Speech Enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Wind noise suppression method, device, equipment, and storage medium for dual microphones Granted publication date: 20240315 Pledgee: Shenzhen Shunshui Incubation Management Co.,Ltd. Pledgor: SHENZHEN YOUJIE ZHIXIN TECHNOLOGY Co.,Ltd. Registration number: Y2024980029366 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |