CN115101083A - 一种适用于分离式麦克风的降噪方法 - Google Patents

一种适用于分离式麦克风的降噪方法 Download PDF

Info

Publication number
CN115101083A
CN115101083A CN202210801851.0A CN202210801851A CN115101083A CN 115101083 A CN115101083 A CN 115101083A CN 202210801851 A CN202210801851 A CN 202210801851A CN 115101083 A CN115101083 A CN 115101083A
Authority
CN
China
Prior art keywords
noise
audio
frequency
noise reduction
reduction method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210801851.0A
Other languages
English (en)
Inventor
朱国正
马冰
马升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Madao Information Technology Co ltd
Original Assignee
Hefei Madao Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Madao Information Technology Co ltd filed Critical Hefei Madao Information Technology Co ltd
Priority to CN202210801851.0A priority Critical patent/CN115101083A/zh
Publication of CN115101083A publication Critical patent/CN115101083A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及降噪方法,具体涉及一种适用于分离式麦克风的降噪方法,采集帧音频数据后,通过对该帧音频数据的峰值与期望峰值进行比较,动态调节音频增益;采用静态滤波消除定频噪音;采用动态滤波消除环境噪音;本发明提供的技术方案能够有效克服现有技术所存在的麦克风拾音距离存在严重限制、录音质量较差的缺陷。

Description

一种适用于分离式麦克风的降噪方法
技术领域
本发明涉及降噪方法,具体涉及一种适用于分离式麦克风的降噪方法。
背景技术
随着语音技术的不断发展,市面上出现了各种各样的智能语音产品,如智能语音鼠标、智能语音键盘等。这些智能语音产品可以通过麦克风收音,并将音频文件上传至引擎端,然后引擎端返回转译结果,完成一次语音与文字之间的交互过程。
上述过程涉及到一个非常关键的点,就是麦克风收音环节,如果录制的音频不够清晰干净,那么将会严重影响录音质量。普通麦克风的增益都是事先调整好的,有一个固定值,这样会使得麦克风具有一个最佳拾音距离,那么就会导致麦克风的拾音距离存在严重限制,给使用者带来较大不便。
发明内容
(一)解决的技术问题
针对现有技术所存在的上述缺点,本发明提供了一种适用于分离式麦克风的降噪方法,能够有效克服现有技术所存在的麦克风拾音距离存在严重限制、录音质量较差的缺陷。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
一种适用于分离式麦克风的降噪方法,包括以下步骤:
S1、采集帧音频数据后,通过对该帧音频数据的峰值与期望峰值进行比较,动态调节音频增益;
S2、采用静态滤波消除定频噪音;
S3、采用动态滤波消除环境噪音。
优选地,S1中通过对该帧音频数据的峰值与期望峰值进行比较,动态调节音频增益,包括:
采用下式计算当前采样点的音频增益:
Figure BDA0003738085770000021
其中,βn为当前采样点的音频增益;βn-1为上一帧音频数据最后一个采样点的音频增益;M为当前帧音频数据的峰值;X为期望峰值;α为遗忘因子,其取值范围α∈(0,1];A为增益调节幅度。
优选地,S2中采用静态滤波消除定频噪音,包括:
通过高通滤波器过滤低频噪音,通过陷波滤波器消除音频硬件采集带来的电流噪声。
优选地,所述通过高通滤波器过滤低频噪音,包括:
高通滤波器的S域表达式为:
Figure BDA0003738085770000022
其中,K为音频增益,一般取1,即音频增益为0dB;ω0为截止频率,ω0=100Hz。
优选地,S3中采用动态滤波消除环境噪音,包括:
S31、采集一段非人声音频,并记录噪声频谱能量,从所有的音频频谱中减去该噪声频谱能量;
S32、基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量,并对噪声分量进行过滤。
优选地,所述基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量,并对噪声分量进行过滤之前,包括:
确定噪声相对于人声在时域和频域上的声学统计特征更加平稳;
确定所有噪声均满足加性条件。
优选地,还包括采用Opus 16倍压缩算法,在损耗尽可能低的前提下将降噪后的每帧640字节的音频数据压缩为40字节,提高音频传输效率。
(三)有益效果
与现有技术相比,本发明所提供的一种适用于分离式麦克风的降噪方法,具有以下有益效果:
1)动态调节音频增益:当声源距离较近时,会自动减小音频增益,防止截幅,当声源距离较远时,会自动增大音频增益,防止录音音量过小;可以做到自适应声源距离,有效防止喷麦、截幅等常见录音问题的发生,在麦克风最大拾音距离范围内,真正做到每个位置都是最佳拾音距离;
2)多种降噪方法配合:利用动态增益保证录音音量大小始终处于平稳范围,利用静态滤波过滤背景低频噪音和硬件电流噪声,再利用动态滤波过滤掉录音过程中的环境噪音,实现全方位降噪,最大程度保证了录音质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程示意图;
图2为本发明中动态调节音频增益的原理图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种适用于分离式麦克风的降噪方法,如图1和图2所示,①采集帧音频数据后,通过对该帧音频数据的峰值与期望峰值进行比较,动态调节音频增益。
其中,通过对该帧音频数据的峰值与期望峰值进行比较,动态调节音频增益,包括:
采用下式计算当前采样点的音频增益:
Figure BDA0003738085770000041
其中,βn为当前采样点的音频增益;βn-1为上一帧音频数据最后一个采样点的音频增益;M为当前帧音频数据的峰值;X为期望峰值;α为遗忘因子,其取值范围α∈(0,1];A为增益调节幅度。
分离式麦克风(比如领夹麦克风等)中音频采集模块所采用的是可设定增益的数字麦克风,为了使麦克风近距离、远距离采集音频的大小、质量趋于稳定,必须动态调节音频增益。在本申请中使用了动态音频增益(AGC)技术,可以根据当前音量大小动态调整麦克风增益,有效解决近距离音频截幅和远距离音频音量过小的问题,同时提高音频质量。
音频采集模块开始工作时,分离式麦克风内部的控制器会给音频采集模块设定初始音频增益。如图2所示,当采集完一帧音频数据后,将该帧音频数据发送给控制器,控制器通过对该帧音频数据的峰值与期望峰值进行比较,动态调节音频增益。
②采用静态滤波消除定频噪音,具体包括:
通过高通滤波器过滤低频噪音,通过陷波滤波器消除音频硬件采集带来的电流噪声。
其中,通过高通滤波器过滤低频噪音,包括:
高通滤波器的S域表达式为:
Figure BDA0003738085770000051
其中,K为音频增益,一般取1,即音频增益为0dB;ω0为截止频率,ω0=100Hz(本申请中将截止频率设置为100Hz)。
陷波滤波器用于消除音频硬件采集带来的电流噪声,该滤波器具有硬件匹配性,不同的硬件电路噪声频段可能不一样。
低通滤波器一般用于过滤高频噪音,由于本申请中PCM的采样率为16kHz,理论最高能够达到8kHz,而人声的最高频率可达10kHz,所以低通滤波器在本申请中意义不大,故不采用低通滤波器。
③采用动态滤波消除环境噪音,具体包括:
S31、采集一段非人声音频,并记录噪声频谱能量,从所有的音频频谱中减去该噪声频谱能量;
S32、基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量,并对噪声分量进行过滤。
其中,基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量,并对噪声分量进行过滤之前,包括:
确定噪声相对于人声在时域和频域上的声学统计特征更加平稳;
确定所有噪声均满足加性条件。
动态滤波第一步是谱减法,这种方法能够有效降低稳态的环境噪音。但是,对于非稳态环境噪音,采用这种方法就会导致有的地方频谱减少了,噪声有残留;有的地方频谱减多了,人声有损伤。而在进行实时音频处理时,环境噪音的状态经常是随时间变化的,很难让环境噪音一直保持绝对稳态。
所以,动态滤波的第二步是基于统计模型的实时降噪算法,这种降噪方法其实也是针对相对平稳的噪声进行过滤的,因此为了方便找出噪声和人声的直观统计区别,在采用基于统计模型的实时降噪算法之前,都需要进行上述“两个确定”,以满足该实时降噪算法的使用条件。
本申请技术方案中,还包括采用Opus 16倍压缩算法,在损耗尽可能低的前提下将降噪后的每帧640字节的音频数据压缩为40字节,提高音频传输效率。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种适用于分离式麦克风的降噪方法,其特征在于:包括以下步骤:
S1、采集帧音频数据后,通过对该帧音频数据的峰值与期望峰值进行比较,动态调节音频增益;
S2、采用静态滤波消除定频噪音;
S3、采用动态滤波消除环境噪音。
2.根据权利要求1所述的适用于分离式麦克风的降噪方法,其特征在于:S1中通过对该帧音频数据的峰值与期望峰值进行比较,动态调节音频增益,包括:
采用下式计算当前采样点的音频增益:
Figure FDA0003738085760000011
其中,βn为当前采样点的音频增益;βn-1为上一帧音频数据最后一个采样点的音频增益;M为当前帧音频数据的峰值;X为期望峰值;α为遗忘因子,其取值范围α∈(0,1];A为增益调节幅度。
3.根据权利要求1所述的适用于分离式麦克风的降噪方法,其特征在于:S2中采用静态滤波消除定频噪音,包括:
通过高通滤波器过滤低频噪音,通过陷波滤波器消除音频硬件采集带来的电流噪声。
4.根据权利要求3所述的适用于分离式麦克风的降噪方法,其特征在于:所述通过高通滤波器过滤低频噪音,包括:
高通滤波器的S域表达式为:
Figure FDA0003738085760000012
其中,K为音频增益,一般取1,即音频增益为0dB;ω0为截止频率,ω0=100Hz。
5.根据权利要求1所述的适用于分离式麦克风的降噪方法,其特征在于:S3中采用动态滤波消除环境噪音,包括:
S31、采集一段非人声音频,并记录噪声频谱能量,从所有的音频频谱中减去该噪声频谱能量;
S32、基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量,并对噪声分量进行过滤。
6.根据权利要求5所述的适用于分离式麦克风的降噪方法,其特征在于:所述基于统计模型估算出音频频谱中每个频点对应的噪声及语音的分量,并对噪声分量进行过滤之前,包括:
确定噪声相对于人声在时域和频域上的声学统计特征更加平稳;
确定所有噪声均满足加性条件。
7.根据权利要求1所述的适用于分离式麦克风的降噪方法,其特征在于:还包括采用Opus16倍压缩算法,在损耗尽可能低的前提下将降噪后的每帧640字节的音频数据压缩为40字节,提高音频传输效率。
CN202210801851.0A 2022-07-08 2022-07-08 一种适用于分离式麦克风的降噪方法 Pending CN115101083A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210801851.0A CN115101083A (zh) 2022-07-08 2022-07-08 一种适用于分离式麦克风的降噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210801851.0A CN115101083A (zh) 2022-07-08 2022-07-08 一种适用于分离式麦克风的降噪方法

Publications (1)

Publication Number Publication Date
CN115101083A true CN115101083A (zh) 2022-09-23

Family

ID=83296642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210801851.0A Pending CN115101083A (zh) 2022-07-08 2022-07-08 一种适用于分离式麦克风的降噪方法

Country Status (1)

Country Link
CN (1) CN115101083A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102176312A (zh) * 2011-01-07 2011-09-07 蔡镇滨 一种通过小波陷波来降低突发噪音的系统及方法
CN202068548U (zh) * 2011-01-17 2011-12-07 穆科明 视频传感系统三维空间高清语音采集子系统
CN205545868U (zh) * 2015-12-17 2016-08-31 四川湖山电器有限责任公司 数字音频采集器
CN105940449A (zh) * 2014-01-31 2016-09-14 微软技术许可有限责任公司 音频信号处理
CN106331917A (zh) * 2016-09-29 2017-01-11 广西大学 一种远程拾音器
CN108735225A (zh) * 2018-04-28 2018-11-02 南京邮电大学 一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法
CN111477241A (zh) * 2020-04-15 2020-07-31 南京邮电大学 一种面向家居噪声环境的分层自适应去噪方法及系统
CN215187351U (zh) * 2021-07-14 2021-12-14 北京快鱼电子股份公司 一种拾音装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102176312A (zh) * 2011-01-07 2011-09-07 蔡镇滨 一种通过小波陷波来降低突发噪音的系统及方法
CN202068548U (zh) * 2011-01-17 2011-12-07 穆科明 视频传感系统三维空间高清语音采集子系统
CN105940449A (zh) * 2014-01-31 2016-09-14 微软技术许可有限责任公司 音频信号处理
CN205545868U (zh) * 2015-12-17 2016-08-31 四川湖山电器有限责任公司 数字音频采集器
CN106331917A (zh) * 2016-09-29 2017-01-11 广西大学 一种远程拾音器
CN108735225A (zh) * 2018-04-28 2018-11-02 南京邮电大学 一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法
CN111477241A (zh) * 2020-04-15 2020-07-31 南京邮电大学 一种面向家居噪声环境的分层自适应去噪方法及系统
CN215187351U (zh) * 2021-07-14 2021-12-14 北京快鱼电子股份公司 一种拾音装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
周江平等: "基于FPGA 的音频AGC 设计与实现", 通信技术, vol. 46, no. 8, 31 August 2013 (2013-08-31), pages 163 - 166 *
王潘祯: "基于DSP的数字助听器平台驱动设计与算法实现", 中国优秀硕士学位论文全文数据库 医药卫生科技辑, no. 2018, 15 April 2018 (2018-04-15), pages 37 - 40 *
钟洪声等: "电子电路设计技术基础", 30 April 2012, 电子科技大学出版社, pages: 259 - 262 *
陈光梦: "高频电路基础", 31 January 2011, 复旦大学出版社, pages: 347 - 352 *

Similar Documents

Publication Publication Date Title
CN108831499B (zh) 利用语音存在概率的语音增强方法
US6937978B2 (en) Suppression system of background noise of speech signals and the method thereof
CN102160296B (zh) 双端通话检测方法及装置
CN111312290B (zh) 音频数据音质检测方法及装置
CN108198571B (zh) 一种基于自适应带宽判断的带宽扩展方法及系统
CN106340303B (zh) 一种基于时间频率域的语音降噪方法
JPH08221093A (ja) 音声信号の雑音低減方法
WO2020181766A1 (zh) 一种语音信号处理方法、装置、设备及可读存储介质
CN107622773B (zh) 一种音频特征提取方法与装置、电子设备
WO2021007841A1 (zh) 噪声估计方法、噪声估计装置、语音处理芯片以及电子设备
Towsey Noise removal from wave-forms and spectrograms derived from natural recordings of the environment
CN113539285B (zh) 音频信号降噪方法、电子装置和存储介质
CN102176312A (zh) 一种通过小波陷波来降低突发噪音的系统及方法
CN112242147A (zh) 一种语音增益控制方法及计算机存储介质
US20040247110A1 (en) Methods and apparatus for improving voice quality in an environment with noise
CN109195050A (zh) 一种前馈滤波器设计方法及降噪耳机
CN108231088B (zh) 一种应用于语音数字信号的快速自动增益控制方法和装置
CN101808260A (zh) 音频动态反馈抑制方法
EP2689419A1 (en) Method and arrangement for damping dominant frequencies in an audio signal
CN104810023B (zh) 一种用于语音信号增强的谱减法
CN106782592A (zh) 一种用于消除网络声音传输的回音和啸叫的系统和方法
CN115101083A (zh) 一种适用于分离式麦克风的降噪方法
CN106328160B (zh) 一种基于双麦克的降噪方法
CN116312545B (zh) 多噪声环境下的语音识别系统和方法
CN105227763A (zh) 一种在智能移动设备上实现的乐器音频实时分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination