CN110085247A - 一种针对复杂噪声环境的双麦克风降噪方法 - Google Patents

一种针对复杂噪声环境的双麦克风降噪方法 Download PDF

Info

Publication number
CN110085247A
CN110085247A CN201910371475.4A CN201910371475A CN110085247A CN 110085247 A CN110085247 A CN 110085247A CN 201910371475 A CN201910371475 A CN 201910371475A CN 110085247 A CN110085247 A CN 110085247A
Authority
CN
China
Prior art keywords
noise
target
module
voice
dual microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910371475.4A
Other languages
English (en)
Other versions
CN110085247B (zh
Inventor
缪炜
尹钧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Mutual Information Technology Co Ltd
Original Assignee
Shanghai Mutual Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Mutual Information Technology Co Ltd filed Critical Shanghai Mutual Information Technology Co Ltd
Priority to CN201910371475.4A priority Critical patent/CN110085247B/zh
Publication of CN110085247A publication Critical patent/CN110085247A/zh
Application granted granted Critical
Publication of CN110085247B publication Critical patent/CN110085247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Abstract

本发明提供一种针对复杂噪声环境的双麦克风降噪方法,包括以下步骤:步骤一、将两个语音采集设备以间距d排列构成语音采集模块;步骤二、将采集到的双通道带噪语音数据输入目标方位检测模块,步骤三、根据动态检测阈值提取目标方位参数,步骤四、通过波束形成算法得到两路音频数据;步骤五、在判断为常规噪声环境时,将步骤四中两路音频输入自适应噪声消除模块;步骤六、所述自适应噪声消除模块处理所述两路音频后得到最终双麦克风处理后的消噪信号。本发明采用目标方位纠错模块,在湮没目标语音的强噪声环境下,可先通过波束形成模块进行预降噪再加后判目标语音的方法,保证了目标方位在错判时仍能有效的输出消噪信号。

Description

一种针对复杂噪声环境的双麦克风降噪方法
技术领域
本发明涉及音频信号处理技术领域,具体为一种针对复杂噪声环境的双麦克风降噪方法。
背景技术
在远场智能语音交互中,语音识别的准确率会受到周围复杂噪声环境的影响而严重下降。在语音识别的前端对采集到的带噪语音信号做降噪处理是一种有效的提升语音识别率的方法之一。其中麦克风阵列技术相比单麦克风系统具有方向选择性,使得对目标方向语音质量的提升更有针对性,从而让用户在智能语音设备上的体验更好。基于目标语音方位信息的盲波束形成已成为麦克风阵列语音信号处理的重要部分。
其中为兼顾成本与复杂噪声环境下的应用,双麦克风阵列的研发被广泛关注。然而,不稳定甚至错误的目标语音方位检测会负面影响波束形成结果,过于复杂的检测算法会牺牲计算量并造成过长的延时。基于时延互相关估计的方法容易实现但每帧结果不稳定且容易受到复杂噪声环境干扰。噪声强弱的变化以及噪声源方位的变化会影响对目标语音检测的性能,在低信噪比时容易发生误检,且目标方向发生误检后无法通过后处理进行纠正,导致最终的前端降噪性能下降,使得语音无法被识别从而严重影响用户的智能体验。
发明内容
本发明所解决的技术问题在于提供一种针对复杂噪声环境的双麦克风降噪方法,以解决上述背景技术中提出的问题。
本发明所解决的技术问题采用以下技术方案来实现:一种针对复杂噪声环境的双麦克风降噪方法,包括以下步骤:
步骤一、将两个语音采集设备以间距d排列构成语音采集模块;
步骤二、将采集到的双通道带噪语音数据输入目标方位检测模块,对所述语音数据通过算法提取统计学参数,并设置动态检测阈值;
步骤三、根据动态检测阈值提取目标方位参数,将所述参数与经傅里叶变换后的语音采集数据输入波束形成模块;
步骤四、通过波束形成算法得到两路音频数据;
步骤五、在判断为常规噪声环境时,将步骤四中两路音频输入自适应噪声消除模块;当判断在强噪声环境下时,将所述两路音频发送目标方位纠错模块进行信号特征判别后作为自适应噪声消除模块的输入;
步骤六、所述自适应噪声消除模块处理所述两路音频后得到最终双麦克风处理后的消噪信号。
所述目标方位检测模块包括对采集到的双通道音频数据进行处理,从而判定目标信号传播方向的空间信息和实时跟踪目标信号源,并根据此信息进行空域滤波;通过提取音频参数并设置动态阈值标定目标方位的方法来自适应噪声环境的变化。再通过利用前后N帧的方位参数来做后处理方法,稳定标注出目标信号的方位参数,N为大于等于1的正整数。
所述波束形成算法是通过波束形成算法融合多个通道的信息抑制非目标方向的干扰源,增强目标方向的声音;通过算法获得目标语音估计与噪声参考两路信号,最后利用自适应滤波算法对目标语音估计去噪。
所述目标方位纠错模块只在检测为强噪声环境下执行,并对接波束形成滤波器模块的输出,通过比较两路输入音频的信号特征,找到最可能含有纯净目标语音的信号,同时输出另一路信号,之后再按照常规噪声模式做自适应噪声消除;这样避免了因强噪声源的干扰使得盲波束形成算法跟踪错误的目标导致输出不可靠的目标语音估计与噪声参考,从而降低最终的双麦克风消噪性能。
与现有技术相比,本发明的有益效果是:本发明采用目标方位纠错模块,在湮没目标语音的强噪声环境下,可先通过波束形成模块进行预降噪再加后判目标语音的方法,保证了目标方位在错判时仍能有效的输出消噪信号。
附图说明
图1为本发明的双麦克风降噪信号处理的流程图。
图2为本发明的自适应波束形成模块的框架图。
图3为本发明的目标方位纠错模块的框架图。
具体实施方式
为了使本发明的实现技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明,在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以两个元件内部的连通。
如图1~3所示,一种针对复杂噪声环境的双麦克风降噪方法,包括以下步骤:
步骤一、将两个语音采集设备以间距d排列构成语音采集模块;
步骤二、将采集到的双通道带噪语音数据输入目标方位检测模块,对所述语音数据通过算法提取统计学参数,并设置动态检测阈值;目标方位检测模块包括对采集到的双通道音频数据进行处理,从而判定目标信号传播方向的空间信息和实时跟踪目标信号源,并根据此信息进行空域滤波;通过提取音频参数并设置动态阈值标定目标方位的方法来自适应噪声环境的变化。再通过利用前后N帧的方位参数来做后处理方法,稳定标注出目标信号的方位参数,N为大于等于1的正整数。
步骤三、根据动态检测阈值提取目标方位参数,将所述参数与经傅里叶变换后的语音采集数据输入波束形成模块;
步骤四、通过波束形成算法得到两路音频数据;波束形成算法是通过波束形成算法融合多个通道的信息抑制非目标方向的干扰源,增强目标方向的声音;通过算法获得目标语音估计与噪声参考两路信号,最后利用自适应滤波算法对目标语音估计去噪。
步骤五、在判断为常规噪声环境时,将步骤四中两路音频输入自适应噪声消除模块;当判断在强噪声环境下时,将所述两路音频发送目标方位纠错模块进行信号特征判别后作为自适应噪声消除模块的输入;目标方位纠错模块只在检测为强噪声环境下执行,并对接波束形成滤波器模块的输出,通过比较两路输入音频的信号特征,找到最可能含有纯净目标语音的信号,同时输出另一路信号,之后再按照常规噪声模式做自适应噪声消除;这样避免了因强噪声源的干扰使得盲波束形成算法跟踪错误的目标导致输出不可靠的目标语音估计与噪声参考,从而降低最终的双麦克风消噪性能。
步骤六、所述自适应噪声消除模块处理所述两路音频后得到最终双麦克风处理后的消噪信号。
本发明采用目标方位纠错模块,在湮没目标语音的强噪声环境下,可先通过波束形成模块进行预降噪再加后判目标语音的方法,保证了目标方位在错判时仍能有效的输出消噪信号;可自适应环境噪声的变化对目标语音稳定的输出消噪信号,保证了对目标语音的定位不受噪声源位置与强弱变化的干扰。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明的要求保护范围由所附的权利要求书及其等效物界定。

Claims (4)

1.一种针对复杂噪声环境的双麦克风降噪方法,其特征在于:包括以下步骤:
步骤一、将两个语音采集设备以间距d排列构成语音采集模块;
步骤二、将采集到的双通道带噪语音数据输入目标方位检测模块,对所述语音数据通过算法提取统计学参数,并设置动态检测阈值;
步骤三、根据动态检测阈值提取目标方位参数,将所述参数与经傅里叶变换后的语音采集数据输入波束形成模块;
步骤四、通过波束形成算法得到两路音频数据;
步骤五、在判断为常规噪声环境时,将步骤四中两路音频输入自适应噪声消除模块;当判断在强噪声环境下时,将所述两路音频发送目标方位纠错模块进行信号特征判别后作为自适应噪声消除模块的输入;
步骤六、所述自适应噪声消除模块处理所述两路音频后得到最终双麦克风处理后的消噪信号。
2.根据权利要求1所述的一种针对复杂噪声环境的双麦克风降噪方法,其特征在于:所述目标方位检测模块包括对采集到的双通道音频数据进行处理,从而判定目标信号传播方向的空间信息和实时跟踪目标信号源,并根据此信息进行空域滤波;通过提取音频参数并设置动态阈值标定目标方位的方法来自适应噪声环境的变化;再通过利用前后N帧的方位参数来做后处理方法,稳定标注出目标信号的方位参数,N为大于等于1的正整数。
3.根据权利要求1所述的一种针对复杂噪声环境的双麦克风降噪方法,其特征在于:所述波束形成算法是通过波束形成算法融合多个通道的信息抑制非目标方向的干扰源,增强目标方向的声音;通过算法获得目标语音估计与噪声参考两路信号,最后利用自适应滤波算法对目标语音估计去噪。
4.根据权利要求1所述的一种针对复杂噪声环境的双麦克风降噪方法,其特征在于:所述目标方位纠错模块只在检测为强噪声环境下执行,并对接波束形成滤波器模块的输出,通过比较两路输入音频的信号特征,找到最可能含有纯净目标语音的信号,同时输出另一路信号,之后再按照常规噪声模式做自适应噪声消除;这样避免了因强噪声源的干扰使得盲波束形成算法跟踪错误的目标导致输出不可靠的目标语音估计与噪声参考,从而降低最终的双麦克风消噪性能。
CN201910371475.4A 2019-05-06 2019-05-06 一种针对复杂噪声环境的双麦克风降噪方法 Active CN110085247B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910371475.4A CN110085247B (zh) 2019-05-06 2019-05-06 一种针对复杂噪声环境的双麦克风降噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910371475.4A CN110085247B (zh) 2019-05-06 2019-05-06 一种针对复杂噪声环境的双麦克风降噪方法

Publications (2)

Publication Number Publication Date
CN110085247A true CN110085247A (zh) 2019-08-02
CN110085247B CN110085247B (zh) 2021-04-20

Family

ID=67418801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910371475.4A Active CN110085247B (zh) 2019-05-06 2019-05-06 一种针对复杂噪声环境的双麦克风降噪方法

Country Status (1)

Country Link
CN (1) CN110085247B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110661510A (zh) * 2019-10-18 2020-01-07 出门问问信息科技有限公司 波束形成器形成方法、波束形成方法、装置及电子设备
CN111402912A (zh) * 2020-02-18 2020-07-10 云知声智能科技股份有限公司 一种语音信号降噪方法及装置
CN112185409A (zh) * 2020-10-15 2021-01-05 福建瑞恒信息科技股份有限公司 一种双麦克风降噪方法和存储设备
CN112562701A (zh) * 2020-11-16 2021-03-26 华南理工大学 心音信号双通道自适应降噪算法、装置、介质及设备
CN112951260A (zh) * 2021-03-02 2021-06-11 桂林电子科技大学 一种双麦克风语音增强的方法
CN113077808A (zh) * 2021-03-22 2021-07-06 北京搜狗科技发展有限公司 一种语音处理方法、装置和用于语音处理的装置
CN114697812A (zh) * 2020-12-29 2022-07-01 华为技术有限公司 声音采集方法、电子设备及系统
WO2023065317A1 (zh) * 2021-10-22 2023-04-27 阿里巴巴达摩院(杭州)科技有限公司 会议终端及回声消除方法
CN113077808B (zh) * 2021-03-22 2024-04-26 北京搜狗科技发展有限公司 一种语音处理方法、装置和用于语音处理的装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967658A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法
US20140328490A1 (en) * 2013-05-03 2014-11-06 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
US20150318000A1 (en) * 2014-05-04 2015-11-05 Yang Gao Single MIC Detection in Beamformer and Noise Canceller for Speech Enhancement
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN106792315A (zh) * 2017-01-05 2017-05-31 歌尔科技有限公司 一种抵消环境噪声的方法和装置及一种主动降噪耳机

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967658A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法
US20140328490A1 (en) * 2013-05-03 2014-11-06 Qualcomm Incorporated Multi-channel echo cancellation and noise suppression
US20150318000A1 (en) * 2014-05-04 2015-11-05 Yang Gao Single MIC Detection in Beamformer and Noise Canceller for Speech Enhancement
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
CN106792315A (zh) * 2017-01-05 2017-05-31 歌尔科技有限公司 一种抵消环境噪声的方法和装置及一种主动降噪耳机

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MSSAN ELKAMCHOUCHI: "Direction-of-arrival methods (DOA) and time difference of arrival (TDOA) position location technique", 《TWENTY SECOND NATIONAL RADIO SCIENCE CONFERENCE》 *
杨文帅,张一闻,赵宏旭,段妍羽: "一种基于波束形成方法的降噪技术", 《激光杂志》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110661510A (zh) * 2019-10-18 2020-01-07 出门问问信息科技有限公司 波束形成器形成方法、波束形成方法、装置及电子设备
CN111402912A (zh) * 2020-02-18 2020-07-10 云知声智能科技股份有限公司 一种语音信号降噪方法及装置
CN112185409A (zh) * 2020-10-15 2021-01-05 福建瑞恒信息科技股份有限公司 一种双麦克风降噪方法和存储设备
CN112562701A (zh) * 2020-11-16 2021-03-26 华南理工大学 心音信号双通道自适应降噪算法、装置、介质及设备
CN114697812A (zh) * 2020-12-29 2022-07-01 华为技术有限公司 声音采集方法、电子设备及系统
CN114697812B (zh) * 2020-12-29 2023-06-20 华为技术有限公司 声音采集方法、电子设备及系统
CN112951260A (zh) * 2021-03-02 2021-06-11 桂林电子科技大学 一种双麦克风语音增强的方法
CN112951260B (zh) * 2021-03-02 2022-07-19 桂林电子科技大学 一种双麦克风语音增强的方法
CN113077808A (zh) * 2021-03-22 2021-07-06 北京搜狗科技发展有限公司 一种语音处理方法、装置和用于语音处理的装置
WO2022198820A1 (zh) * 2021-03-22 2022-09-29 北京搜狗科技发展有限公司 一种语音处理方法、装置和用于语音处理的装置
CN113077808B (zh) * 2021-03-22 2024-04-26 北京搜狗科技发展有限公司 一种语音处理方法、装置和用于语音处理的装置
WO2023065317A1 (zh) * 2021-10-22 2023-04-27 阿里巴巴达摩院(杭州)科技有限公司 会议终端及回声消除方法

Also Published As

Publication number Publication date
CN110085247B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN110085247A (zh) 一种针对复杂噪声环境的双麦克风降噪方法
WO2019080551A1 (zh) 目标语音检测方法及装置
CN108680910B (zh) 基于波形认知的调频广播外辐射源雷达目标检测方法
CN102819043B (zh) 阵列信号随机噪声自适应模型去噪方法
CN1953059A (zh) 一种噪声消除装置和方法
CN108768543B (zh) 多特征融合认知型水声通信空快时自适应处理算法
CN109817234B (zh) 基于连续噪声跟踪的目标语音信号增强方法、系统及存储介质
CN103165137A (zh) 一种非平稳噪声环境下传声器阵列的语音增强方法
CN101510426A (zh) 一种噪声消除方法及系统
CN104157295A (zh) 用于检测及抑制瞬态噪声的方法
CN111024209B (zh) 一种适用于矢量水听器的线谱检测方法
CN106531179A (zh) 一种基于语义先验的选择性注意的多通道语音增强方法
CN111273237B (zh) 基于空域矩阵滤波和干扰对消的强干扰抑制方法
CN104835503A (zh) 一种改进gsc自适应语音增强方法
CN106328120B (zh) 公共场所异常声音特征提取方法
CN105679329A (zh) 可适应强烈背景噪声的麦克风阵列语音增强装置
CN112394324A (zh) 一种基于麦克风阵列的远距离声源定位的方法及系统
CN110441761B (zh) 基于分布式浮标探测的多源信息融合方法
CN110890099A (zh) 声音信号处理方法、装置以及存储介质
CN112014801A (zh) 一种基于SPWVD和改进AlexNet的复合干扰识别方法
CN105336340A (zh) 一种用于低空目标声探测系统的风噪抑制方法和装置
CN110673118A (zh) 一种主动声纳单频脉冲串波形设计及检测算法
CN108152796A (zh) 一种基于灰色卡尔曼滤波的主瓣移动干扰消除方法
CN117169812A (zh) 一种基于深度学习和波束形成的声源定位方法
CN113325401B (zh) 一种基于线谱相位差解模糊的畸变拖曳线列阵信号重构方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant