CN110085247B - 一种针对复杂噪声环境的双麦克风降噪方法 - Google Patents

一种针对复杂噪声环境的双麦克风降噪方法 Download PDF

Info

Publication number
CN110085247B
CN110085247B CN201910371475.4A CN201910371475A CN110085247B CN 110085247 B CN110085247 B CN 110085247B CN 201910371475 A CN201910371475 A CN 201910371475A CN 110085247 B CN110085247 B CN 110085247B
Authority
CN
China
Prior art keywords
noise
target
module
voice
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910371475.4A
Other languages
English (en)
Other versions
CN110085247A (zh
Inventor
缪炜
尹钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Huwen Information Technology Co ltd
Original Assignee
Shanghai Huwen Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Huwen Information Technology Co ltd filed Critical Shanghai Huwen Information Technology Co ltd
Priority to CN201910371475.4A priority Critical patent/CN110085247B/zh
Publication of CN110085247A publication Critical patent/CN110085247A/zh
Application granted granted Critical
Publication of CN110085247B publication Critical patent/CN110085247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Abstract

本发明提供一种针对复杂噪声环境的双麦克风降噪方法,包括以下步骤:步骤一、将两个语音采集设备以间距d排列构成语音采集模块;步骤二、将采集到的双通道带噪语音数据输入目标方位检测模块,步骤三、根据动态检测阈值提取目标方位参数,步骤四、通过波束形成算法得到两路音频数据;步骤五、在判断为常规噪声环境时,将步骤四中两路音频输入自适应噪声消除模块;步骤六、所述自适应噪声消除模块处理所述两路音频后得到最终双麦克风处理后的消噪信号。本发明采用目标方位纠错模块,在湮没目标语音的强噪声环境下,可先通过波束形成模块进行预降噪再加后判目标语音的方法,保证了目标方位在错判时仍能有效的输出消噪信号。

Description

一种针对复杂噪声环境的双麦克风降噪方法
技术领域
本发明涉及音频信号处理技术领域,具体为一种针对复杂噪声环境的双麦克风降噪方法。
背景技术
在远场智能语音交互中,语音识别的准确率会受到周围复杂噪声环境的影响而严重下降。在语音识别的前端对采集到的带噪语音信号做降噪处理是一种有效的提升语音识别率的方法之一。其中麦克风阵列技术相比单麦克风系统具有方向选择性,使得对目标方向语音质量的提升更有针对性,从而让用户在智能语音设备上的体验更好。基于目标语音方位信息的盲波束形成已成为麦克风阵列语音信号处理的重要部分。
其中为兼顾成本与复杂噪声环境下的应用,双麦克风阵列的研发被广泛关注。然而,不稳定甚至错误的目标语音方位检测会负面影响波束形成结果,过于复杂的检测算法会牺牲计算量并造成过长的延时。基于时延互相关估计的方法容易实现但每帧结果不稳定且容易受到复杂噪声环境干扰。噪声强弱的变化以及噪声源方位的变化会影响对目标语音检测的性能,在低信噪比时容易发生误检,且目标方向发生误检后无法通过后处理进行纠正,导致最终的前端降噪性能下降,使得语音无法被识别从而严重影响用户的智能体验。
发明内容
本发明所解决的技术问题在于提供一种针对复杂噪声环境的双麦克风降噪方法,以解决上述背景技术中提出的问题。
本发明所解决的技术问题采用以下技术方案来实现:一种针对复杂噪声环境的双麦克风降噪方法,包括以下步骤:
步骤一、将两个语音采集设备以间距d排列构成语音采集模块;
步骤二、将采集到的双通道带噪语音数据输入目标方位检测模块,对所述语音数据通过算法提取统计学参数,并设置动态检测阈值;
步骤三、根据动态检测阈值提取目标方位参数,将所述参数与经傅里叶变换后的语音采集数据输入波束形成模块;
步骤四、通过波束形成算法得到两路音频数据;
步骤五、在判断为常规噪声环境时,将步骤四中两路音频输入自适应噪声消除模块;当判断在强噪声环境下时,将所述两路音频发送目标方位纠错模块进行信号特征判别后作为自适应噪声消除模块的输入;
步骤六、所述自适应噪声消除模块处理所述两路音频后得到最终双麦克风处理后的消噪信号。
所述目标方位检测模块包括对采集到的双通道音频数据进行处理,从而判定目标信号传播方向的空间信息和实时跟踪目标信号源,并根据此信息进行空域滤波;通过提取音频参数并设置动态阈值标定目标方位的方法来自适应噪声环境的变化。再通过利用前后N帧的方位参数来做后处理方法,稳定标注出目标信号的方位参数,N为大于等于1的正整数。
所述波束形成算法是通过波束形成算法融合多个通道的信息抑制非目标方向的干扰源,增强目标方向的声音;通过算法获得目标语音估计与噪声参考两路信号,最后利用自适应滤波算法对目标语音估计去噪。
所述目标方位纠错模块只在检测为强噪声环境下执行,并对接波束形成滤波器模块的输出,通过比较两路输入音频的信号特征,找到最可能含有纯净目标语音的信号,同时输出另一路信号,之后再按照常规噪声模式做自适应噪声消除;这样避免了因强噪声源的干扰使得盲波束形成算法跟踪错误的目标导致输出不可靠的目标语音估计与噪声参考,从而降低最终的双麦克风消噪性能。
与现有技术相比,本发明的有益效果是:本发明采用目标方位纠错模块,在湮没目标语音的强噪声环境下,可先通过波束形成模块进行预降噪再加后判目标语音的方法,保证了目标方位在错判时仍能有效的输出消噪信号。
附图说明
图1为本发明的双麦克风降噪信号处理的流程图。
图2为本发明的自适应波束形成模块的框架图。
图3为本发明的目标方位纠错模块的框架图。
具体实施方式
为了使本发明的实现技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明,在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以两个元件内部的连通。
如图1~3所示,一种针对复杂噪声环境的双麦克风降噪方法,包括以下步骤:
步骤一、将两个语音采集设备以间距d排列构成语音采集模块;
步骤二、将采集到的双通道带噪语音数据输入目标方位检测模块,对所述语音数据通过算法提取统计学参数,并设置动态检测阈值;目标方位检测模块包括对采集到的双通道音频数据进行处理,从而判定目标信号传播方向的空间信息和实时跟踪目标信号源,并根据此信息进行空域滤波;通过提取音频参数并设置动态阈值标定目标方位的方法来自适应噪声环境的变化。再通过利用前后N帧的方位参数来做后处理方法,稳定标注出目标信号的方位参数,N为大于等于1的正整数。
步骤三、根据动态检测阈值提取目标方位参数,将所述参数与经傅里叶变换后的语音采集数据输入波束形成模块;
步骤四、通过波束形成算法得到两路音频数据;波束形成算法是通过波束形成算法融合多个通道的信息抑制非目标方向的干扰源,增强目标方向的声音;通过算法获得目标语音估计与噪声参考两路信号,最后利用自适应滤波算法对目标语音估计去噪。
步骤五、在判断为常规噪声环境时,将步骤四中两路音频输入自适应噪声消除模块;当判断在强噪声环境下时,将所述两路音频发送目标方位纠错模块进行信号特征判别后作为自适应噪声消除模块的输入;目标方位纠错模块只在检测为强噪声环境下执行,并对接波束形成滤波器模块的输出,通过比较两路输入音频的信号特征,找到最可能含有纯净目标语音的信号,同时输出另一路信号,之后再按照常规噪声模式做自适应噪声消除;这样避免了因强噪声源的干扰使得盲波束形成算法跟踪错误的目标导致输出不可靠的目标语音估计与噪声参考,从而降低最终的双麦克风消噪性能。
步骤六、所述自适应噪声消除模块处理所述两路音频后得到最终双麦克风处理后的消噪信号。
本发明采用目标方位纠错模块,在湮没目标语音的强噪声环境下,可先通过波束形成模块进行预降噪再加后判目标语音的方法,保证了目标方位在错判时仍能有效的输出消噪信号;可自适应环境噪声的变化对目标语音稳定的输出消噪信号,保证了对目标语音的定位不受噪声源位置与强弱变化的干扰。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明的要求保护范围由所附的权利要求书及其等效物界定。

Claims (3)

1.一种针对复杂噪声环境的双麦克风降噪方法,其特征在于:包括以下步骤:
步骤一、将两个语音采集设备以间距d排列构成语音采集模块;
步骤二、将采集到的双通道带噪语音数据输入目标方位检测模块,对所述语音数据通过算法提取统计学参数,并设置动态检测阈值;
步骤三、根据动态检测阈值提取目标方位参数,将所述参数与经傅里叶变换后的语音采集数据输入波束形成模块;
步骤四、通过波束形成算法得到两路音频数据;
步骤五、在判断为常规噪声环境时,将步骤四中两路音频输入自适应噪声消除模块;当判断在强噪声环境下时,将所述两路音频发送目标方位纠错模块进行信号特征判别后作为自适应噪声消除模块的输入;
步骤六、所述自适应噪声消除模块处理所述两路音频后得到最终双麦克风处理后的消噪信号;
所述目标方位纠错模块只在检测为强噪声环境下执行,并对接波束形成滤波器模块的输出,通过比较两路输入音频的信号特征,找到最可能含有纯净目标语音的信号,同时输出另一路信号,之后再按照常规噪声模式做自适应噪声消除;这样避免了因强噪声源的干扰使得盲波束形成算法跟踪错误的目标导致输出不可靠的目标语音估计与噪声参考,从而降低最终的双麦克风消噪性能。
2.根据权利要求1所述的一种针对复杂噪声环境的双麦克风降噪方法,其特征在于:所述目标方位检测模块包括对采集到的双通道音频数据进行处理,从而判定目标信号传播方向的空间信息和实时跟踪目标信号源,并根据此信息进行空域滤波;通过提取音频参数并设置动态阈值标定目标方位的方法来自适应噪声环境的变化;再通过利用前后N帧的方位参数来做后处理方法,稳定标注出目标信号的方位参数,N为大于等于1的正整数。
3.根据权利要求1所述的一种针对复杂噪声环境的双麦克风降噪方法,其特征在于:所述波束形成算法是通过波束形成算法融合多个通道的信息抑制非目标方向的干扰源,增强目标方向的声音;通过算法获得目标语音估计与噪声参考两路信号,最后利用自适应滤波算法对目标语音估计去噪。
CN201910371475.4A 2019-05-06 2019-05-06 一种针对复杂噪声环境的双麦克风降噪方法 Active CN110085247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910371475.4A CN110085247B (zh) 2019-05-06 2019-05-06 一种针对复杂噪声环境的双麦克风降噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910371475.4A CN110085247B (zh) 2019-05-06 2019-05-06 一种针对复杂噪声环境的双麦克风降噪方法

Publications (2)

Publication Number Publication Date
CN110085247A CN110085247A (zh) 2019-08-02
CN110085247B true CN110085247B (zh) 2021-04-20

Family

ID=67418801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910371475.4A Active CN110085247B (zh) 2019-05-06 2019-05-06 一种针对复杂噪声环境的双麦克风降噪方法

Country Status (1)

Country Link
CN (1) CN110085247B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110661510B (zh) * 2019-10-18 2021-05-11 出门问问创新科技有限公司 波束形成器形成方法、波束形成方法、装置及电子设备
CN111402912A (zh) * 2020-02-18 2020-07-10 云知声智能科技股份有限公司 一种语音信号降噪方法及装置
CN112185409A (zh) * 2020-10-15 2021-01-05 福建瑞恒信息科技股份有限公司 一种双麦克风降噪方法和存储设备
CN112562701B (zh) * 2020-11-16 2023-03-28 华南理工大学 心音信号双通道自适应降噪算法、装置、介质及设备
CN114697812B (zh) * 2020-12-29 2023-06-20 华为技术有限公司 声音采集方法、电子设备及系统
CN112951260B (zh) * 2021-03-02 2022-07-19 桂林电子科技大学 一种双麦克风语音增强的方法
EP4310841A1 (en) * 2021-03-22 2024-01-24 Beijing Sogou Technology Development Co., Ltd. Speech processing method and apparatus, and apparatus for speech processing
WO2023065317A1 (zh) * 2021-10-22 2023-04-27 阿里巴巴达摩院(杭州)科技有限公司 会议终端及回声消除方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967658A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN106792315A (zh) * 2017-01-05 2017-05-31 歌尔科技有限公司 一种抵消环境噪声的方法和装置及一种主动降噪耳机

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9936290B2 (en) * 2013-05-03 2018-04-03 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
US9443531B2 (en) * 2014-05-04 2016-09-13 Yang Gao Single MIC detection in beamformer and noise canceller for speech enhancement

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967658A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN106792315A (zh) * 2017-01-05 2017-05-31 歌尔科技有限公司 一种抵消环境噪声的方法和装置及一种主动降噪耳机

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Direction-of-arrival methods (DOA) and time difference of arrival (TDOA) position location technique;MSSAN ELKAMCHOUCHI;《Twenty Second National Radio Science Conference》;20051231;第B1 1-10页 *
一种基于波束形成方法的降噪技术;杨文帅,张一闻,赵宏旭,段妍羽;《激光杂志》;20181231;第39卷(第12期);第62-65页 *

Also Published As

Publication number Publication date
CN110085247A (zh) 2019-08-02

Similar Documents

Publication Publication Date Title
CN110085247B (zh) 一种针对复杂噪声环境的双麦克风降噪方法
EP3703053B1 (en) Microphone array-based target voice acquisition method and device
US10979805B2 (en) Microphone array auto-directive adaptive wideband beamforming using orientation information from MEMS sensors
CN108352818B (zh) 用于增强声音信号的声音信号处理装置和方法
CN102831898B (zh) 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法
US9558755B1 (en) Noise suppression assisted automatic speech recognition
CN101510426B (zh) 一种噪声消除方法及系统
CN108122563A (zh) 提高语音唤醒率及修正doa的方法
CN107863099B (zh) 一种新型双麦克风语音检测和增强方法
CN110931031A (zh) 一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法
Taseska et al. Informed spatial filtering for sound extraction using distributed microphone arrays
CN111081267B (zh) 一种多通道远场语音增强方法
CN104717587A (zh) 用于音频信号处理的耳机和方法
US9378754B1 (en) Adaptive spatial classifier for multi-microphone systems
Wang et al. Noise power spectral density estimation using MaxNSR blocking matrix
CN103426440A (zh) 利用能量谱熵空间信息的语音端点检测装置及其检测方法
CN105702262A (zh) 一种头戴式双麦克风语音增强方法
CN105957536B (zh) 基于通道聚合度频域回声消除方法
Zheng et al. BSS for improved interference estimation for blind speech signal extraction with two microphones
CN110830870A (zh) 一种基于传声器技术的耳机佩戴者语音活动检测系统
Stachurski et al. Sound source localization for video surveillance camera
Seltzer Bridging the gap: Towards a unified framework for hands-free speech recognition using microphone arrays
Zohourian et al. GSC-based binaural speaker separation preserving spatial cues
WO2020118290A1 (en) System and method for acoustic localization of multiple sources using spatial pre-filtering
CN111060867A (zh) 一种指向性麦克风微阵列波达方向估计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant