CN106448696A - 一种基于背景噪声估计自适应高通滤波语音降噪方法 - Google Patents
一种基于背景噪声估计自适应高通滤波语音降噪方法 Download PDFInfo
- Publication number
- CN106448696A CN106448696A CN201611184615.XA CN201611184615A CN106448696A CN 106448696 A CN106448696 A CN 106448696A CN 201611184615 A CN201611184615 A CN 201611184615A CN 106448696 A CN106448696 A CN 106448696A
- Authority
- CN
- China
- Prior art keywords
- background noise
- voice
- filter parameter
- voice data
- pass filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000003044 adaptive effect Effects 0.000 title abstract description 4
- 238000001514 detection method Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 3
- 230000006978 adaptation Effects 0.000 abstract description 2
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000012545 processing Methods 0.000 abstract description 2
- 230000008030 elimination Effects 0.000 abstract 1
- 238000003379 elimination reaction Methods 0.000 abstract 1
- 230000007613 environmental effect Effects 0.000 abstract 1
- 238000013507 mapping Methods 0.000 abstract 1
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000003477 cochlea Anatomy 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本发明涉及信息处理技术及传感信号处理领域,特别是涉及到一种基于背景噪声估计自适应高通滤波语音降噪方法,本发明采用了背景噪声动态估计、根据噪声大小映射滤波器参数地址、滤波器参数读取控制和语音高通滤波器等功能单元,实现了一种自动适应环境噪声,高性能的语音高通滤波技术,达到了更好的噪声消除的效果。
Description
技术领域
本发明涉及信息处理技术及传感信号处理领域,特别是涉及到一种基于背景噪声估计自适应高通滤波语音降噪方法。
背景技术
语音降噪技术已经广泛应用于手机电话,会议电话,麦克风,人工耳蜗语音降噪增强,以及语音识别的前处理等,好的语音降噪能提高语音接收的性噪比,提高人接听的体验感。在语音识别中,更能改善人工智能识别的识别率,以及对环境的适应性, 因此语音降噪技术是语音接收,识别必不可少的环节。
作为语音降噪技术中一个关键基础技术就是高通滤波降噪, 由于大多噪声的能量集中在几百赫兹的低频段,如100到500Hz以内,而人声频带分布广,在50Hz到上万Hz都有分布,能量主要集中在500Hz到6000Hz之间。
传统的高通滤波技术利用这个特点,将含噪声能量成分较多的低频成分过滤掉,而保留高频段人声,该高通滤波器的低频截止频率大小可以通过用户配置滤波器结构参数来实现。
传统的语音接收处理设备或者芯片基本集成该高通滤波功能,其截止频率大多也可以被用户配置,但是一旦用户配置完成后,该设备只能工作在一个固定截止频率滤波模型下,这种固定截止频率工作模式无法适应背景噪声发生波动的情况。
研究和实验表明,当背景噪声能量变强时,其能量分布往往会向更高的频率延伸,对人声也是如此,在安静环境下,如果截止频率设得过高的话,往往会损害人的低频基音部分,这样会影响到语音识别的准确度,因此安静环境下,适合于将截止频率设定低一些,而对于背景噪声较强的环境,为保持辨识度,人的声音音量通常会提高,从而也将人的基音频率提高,因此噪声较强的环境下,合适于将截止频率设定高一些。
为解决上述问题,需要发明一种通过动态估计的背景噪声大小,从而自动调节高通滤波器的结构参数,实现低频端截止频率的自动调节,以达到更好的滤波效果的基于背景噪声估计自适应高通滤波语音降噪方法。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,提供一种能大幅提高滤波效果的基于背景噪声估计自适应高通滤波语音降噪方法。
为了达到上述目的,本发明提供了如下技术方案。
一种基于背景噪声估计自适应高通滤波语音降噪方法,其包括以下步骤:
步骤一,载入声音数据;
步骤二,按帧处理所述声音数据,所述声音数据为时域内声音数据,所述帧的时间大小根据系统设定,一开始载入的是所述声音数据的当前帧数据,通常所述帧的时间大小在10ms至30ms之间;
步骤三,计算所述声音数据当前帧的能量并将计算结果输入背景噪声估计单元;
步骤四,进行语音检测,检测所述声音数据当前帧是语音还是非语音,是语音则直接输出,是非语音则进入下一步骤;
步骤五,所述背景噪声估计单元将步骤三和步骤四的输入结果进行累加生成背景噪声;
步骤六,将所述背景噪声输入滤波器参数地址映射单元,根据所述背景噪声数值大小选择输出一组滤波器参数地址,不同的所述滤波器参数地址对应一组不同的滤波器参数存储器的首地址。
步骤七,将所述滤波器参数地址输入滤波器参数读取控制单元,所述滤波器参数读取控制单元根据所述滤波器参数地址从所述滤波器参数存储器中读取与所述滤波器参数存储器的首地址对应的滤波器参数。
步骤八,将所述滤波器参数送到高通滤波器进行运算;
步骤九,输出语音结果。
作为本发明的优选方案,在步骤五中,当所述语音检测的结果是非语音时,则将所述声音数据的当前帧能量输入一累加器进行累加,并用计数器将所述非语音的帧的数量加1,当所述非语音的帧的数量累加到系统设定的数目时,将背景噪声能量除以所述帧的数量即可得到所述背景噪声的大小,将累加器和计数器清零,准备下一轮的累加和计数。
作为本发明的优选方案,在步骤六中,所述背景噪声按照一定范围进行分段,每段设定一个阈值,当所述背景噪声处于两个阈值范围内时,则所述背景噪声映射到一组滤波器参数的存储地址并输出,当所述背景噪声低于最小的阈值参数时则不进行滤波。
作为本发明的优选方案,在步骤三中,所述声音数据当前帧的能量是将该帧每一个声音数据取绝对值后求平方,然后求和得到,进入步骤五。
与现有技术相比,本发明的有益效果:
本发明采用了背景噪声动态估计、根据噪声大小映射滤波器参数地址、滤波器参数读取控制和语音高通滤波器等功能单元,实现了一种自动适应环境噪声,高性能的语音高通滤波技术,达到了更好的噪声消除的效果。
附图说明
图1为本发明流程图。
具体实施方式
下面结合实施例及具体实施方式对本发明作进一步的详细描述,但不应将此理解为本发明上述主体的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
如图1所示,一种基于动态噪声估计时频域自适应语音检测方法,其包括以下步骤:
一种基于背景噪声估计自适应高通滤波语音降噪方法,其包括以下步骤:
步骤一,载入声音数据;
步骤二,按帧处理所述声音数据,所述声音数据为时域内声音数据,所述帧的时间大小根据系统设定,一开始载入的是所述声音数据的当前帧数据,通常所述帧的时间大小在10ms至30ms之间;
步骤三,计算所述声音数据当前帧的能量并将计算结果输入背景噪声估计单元,即进入步骤五;
步骤四,进行语音检测,检测所述声音数据当前帧是语音还是非语音,是语音则直接输出,是非语音则进入下一步骤;
步骤五,所述背景噪声估计单元将步骤三和步骤四的输入结果进行累加生成背景噪声;
步骤六,将所述背景噪声输入滤波器参数地址映射单元,根据所述背景噪声数值大小选择输出一组滤波器参数地址,不同的所述滤波器参数地址对应一组不同的滤波器参数存储器的首地址。
步骤七,将所述滤波器参数地址输入滤波器参数读取控制单元,所述滤波器参数读取控制单元根据所述滤波器参数地址从所述滤波器参数存储器中读取与所述滤波器参数存储器的首地址对应的滤波器参数。
步骤八,将所述滤波器参数送到高通滤波器进行运算,本实施例中高通滤波器采用FIR滤波结构,在其他实施例中高通滤波器还可以采用IIR滤波结构等其他的滤波结构;
步骤九,输出语音结果。
在本实施例中步骤三和步骤四同时进行,并同时将结果输入步骤五中运行,当所述语音检测的结果是非语音时,则将所述声音数据的当前帧能量输入一累加器进行累加,并用计数器将所述非语音的帧的数量加1,当所述非语音的帧的数量累加到系统设定的数目时,将背景噪声能量除以所述帧的数量即可得到所述背景噪声的大小,将累加器和计数器清零,准备下一轮的累加和计数,背景噪声按照一定范围进行分段,每段设定一个阈值,当所述背景噪声处于两个阈值范围内时,则所述背景噪声映射到一组滤波器参数的存储地址并输出,当所述背景噪声低于最小的阈值参数时则不进行滤波,所述声音数据当前帧的能量是将该帧每一个声音数据取绝对值后求平方,然后求和得到。
在本实施例中,高通滤波器是一个数字 iir filter(递归滤波器),在其他实施例中高通滤波器还可以是一个数字 FIR filter(有限冲激滤波器)。数字 iir filter的计算公式为:,其中,x[n-k]为当前语音采样点即第n采样点往前追溯k个点的原始采样值,当k为0时,x[n-k]表示当前采样点,y[n]为当前语音采样点滤波后的样点值。y[n-k]为当前语音采样点往前追溯k个点的滤波后采样值。 coef_a[k], coef_b[k]分别为往前追溯第k个采样点的滤波参数, 即步骤七中从滤波参数存储器中读取出来的所述滤波器参数,M为往前追溯的采样点的数目,在本实施例中M = 8。
Claims (4)
1.一种基于背景噪声估计自适应高通滤波语音降噪方法,其包括以下步骤:
步骤一,载入声音数据;
步骤二,按帧处理所述声音数据,所述声音数据为时域内声音数据,所述帧的时间大小根据系统设定;
步骤三,计算所述声音数据当前帧的能量并将计算结果输入背景噪声估计单元;
步骤四,进行语音检测,检测所述声音数据当前帧是语音还是非语音,是语音则直接输出,是非语音则进入下一步骤;
步骤五,所述背景噪声估计单元将步骤三和步骤四的输入结果进行累加生成背景噪声;
步骤六,将所述背景噪声输入滤波器参数地址映射单元,根据所述背景噪声数值大小选择输出一组滤波器参数地址,不同的所述滤波器参数地址对应一组不同的滤波器参数存储器的首地址;
步骤七,将所述滤波器参数地址输入滤波器参数读取控制单元,所述滤波器参数读取控制单元根据所述滤波器参数地址从所述滤波器参数存储器中读取与所述滤波器参数存储器的首地址对应的滤波器参数;
步骤八,将所述滤波器参数送到高通滤波器进行运算;
步骤九,输出语音结果。
2.根据权利要求1所述的一种基于背景噪声估计自适应高通滤波语音降噪方法,其特征在于:在步骤五中,当所述语音检测的结果是非语音时,则所述声音数据的当前帧能量输入一累加器进行累加,并用计数器将所述非语音的帧的数量加1,当所述非语音的帧的数量累加到系统设定的数目时,将背景噪声能量除以所述帧的数量即可得到所述背景噪声的大小,将累加器和计数器清零,准备下一轮的累加和计数。
3.根据权利要求2所述的一种基于背景噪声估计自适应高通滤波语音降噪方法,其特征在于:在步骤六中,所述背景噪声按照一定范围进行分段,每段设定一个阈值,当所述背景噪声处于两个阈值范围内时,则所述背景噪声映射到一组滤波器参数的存储地址并输出,当所述背景噪声低于最小的阈值参数时则不进行滤波。
4.根据权利要求2所述的一种基于背景噪声估计自适应高通滤波语音降噪方法,其特征在于:在步骤三中,所述声音数据当前帧的能量是将该帧每一个声音数据取绝对值后求平方,然后求和得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611184615.XA CN106448696A (zh) | 2016-12-20 | 2016-12-20 | 一种基于背景噪声估计自适应高通滤波语音降噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611184615.XA CN106448696A (zh) | 2016-12-20 | 2016-12-20 | 一种基于背景噪声估计自适应高通滤波语音降噪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106448696A true CN106448696A (zh) | 2017-02-22 |
Family
ID=58215138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611184615.XA Pending CN106448696A (zh) | 2016-12-20 | 2016-12-20 | 一种基于背景噪声估计自适应高通滤波语音降噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106448696A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108172220A (zh) * | 2018-02-22 | 2018-06-15 | 成都启英泰伦科技有限公司 | 一种新型语音除噪方法 |
CN108735219A (zh) * | 2018-05-09 | 2018-11-02 | 深圳市宇恒互动科技开发有限公司 | 一种声音识别控制方法及装置 |
CN108877766A (zh) * | 2018-07-03 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 歌曲合成方法、装置、设备及存储介质 |
CN109166568A (zh) * | 2018-11-19 | 2019-01-08 | 济南浪潮高新科技投资发展有限公司 | 一种用于风扇的低功耗有源主动降噪系统及方法 |
CN110782884A (zh) * | 2019-10-28 | 2020-02-11 | 歌尔股份有限公司 | 远场拾音噪声处理方法、装置、设备及存储介质 |
CN111667819A (zh) * | 2019-03-08 | 2020-09-15 | 北京京东尚科信息技术有限公司 | 基于crnn的语音识别方法、系统、存储介质及电子设备 |
CN112242148A (zh) * | 2020-11-12 | 2021-01-19 | 北京声加科技有限公司 | 一种基于头戴式耳机的风噪及环境噪声抑制方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1737905A (zh) * | 2004-08-18 | 2006-02-22 | 华为技术有限公司 | 一种语音通信终端背景噪声的消除装置及方法 |
CN1971711A (zh) * | 2005-06-28 | 2007-05-30 | 哈曼贝克自动系统-威美科公司 | 语音信号自适应增强系统 |
CN102341852A (zh) * | 2009-01-06 | 2012-02-01 | 斯凯普有限公司 | 语音滤波 |
CN102667927A (zh) * | 2009-10-19 | 2012-09-12 | 瑞典爱立信有限公司 | 语音活动检测的方法和背景估计器 |
CN104202016A (zh) * | 2014-08-29 | 2014-12-10 | 哈尔滨工业大学 | 一种基于查表法的任意倍可变的信号升采样实现方法及系统 |
CN105869649A (zh) * | 2015-01-21 | 2016-08-17 | 北京大学深圳研究院 | 感知滤波方法和感知滤波器 |
CN106098076A (zh) * | 2016-06-06 | 2016-11-09 | 成都启英泰伦科技有限公司 | 一种基于动态噪声估计时频域自适应语音检测方法 |
-
2016
- 2016-12-20 CN CN201611184615.XA patent/CN106448696A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1737905A (zh) * | 2004-08-18 | 2006-02-22 | 华为技术有限公司 | 一种语音通信终端背景噪声的消除装置及方法 |
CN1971711A (zh) * | 2005-06-28 | 2007-05-30 | 哈曼贝克自动系统-威美科公司 | 语音信号自适应增强系统 |
CN102341852A (zh) * | 2009-01-06 | 2012-02-01 | 斯凯普有限公司 | 语音滤波 |
CN102667927A (zh) * | 2009-10-19 | 2012-09-12 | 瑞典爱立信有限公司 | 语音活动检测的方法和背景估计器 |
CN104202016A (zh) * | 2014-08-29 | 2014-12-10 | 哈尔滨工业大学 | 一种基于查表法的任意倍可变的信号升采样实现方法及系统 |
CN105869649A (zh) * | 2015-01-21 | 2016-08-17 | 北京大学深圳研究院 | 感知滤波方法和感知滤波器 |
CN106098076A (zh) * | 2016-06-06 | 2016-11-09 | 成都启英泰伦科技有限公司 | 一种基于动态噪声估计时频域自适应语音检测方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108172220A (zh) * | 2018-02-22 | 2018-06-15 | 成都启英泰伦科技有限公司 | 一种新型语音除噪方法 |
CN108172220B (zh) * | 2018-02-22 | 2022-02-25 | 成都启英泰伦科技有限公司 | 一种新型语音除噪方法 |
CN108735219A (zh) * | 2018-05-09 | 2018-11-02 | 深圳市宇恒互动科技开发有限公司 | 一种声音识别控制方法及装置 |
CN108877766A (zh) * | 2018-07-03 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 歌曲合成方法、装置、设备及存储介质 |
CN109166568A (zh) * | 2018-11-19 | 2019-01-08 | 济南浪潮高新科技投资发展有限公司 | 一种用于风扇的低功耗有源主动降噪系统及方法 |
CN111667819A (zh) * | 2019-03-08 | 2020-09-15 | 北京京东尚科信息技术有限公司 | 基于crnn的语音识别方法、系统、存储介质及电子设备 |
CN111667819B (zh) * | 2019-03-08 | 2023-09-01 | 北京京东尚科信息技术有限公司 | 基于crnn的语音识别方法、系统、存储介质及电子设备 |
CN110782884A (zh) * | 2019-10-28 | 2020-02-11 | 歌尔股份有限公司 | 远场拾音噪声处理方法、装置、设备及存储介质 |
CN112242148A (zh) * | 2020-11-12 | 2021-01-19 | 北京声加科技有限公司 | 一种基于头戴式耳机的风噪及环境噪声抑制方法及装置 |
CN112242148B (zh) * | 2020-11-12 | 2023-06-16 | 北京声加科技有限公司 | 一种基于头戴式耳机的风噪抑制方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106448696A (zh) | 一种基于背景噪声估计自适应高通滤波语音降噪方法 | |
CN104980337B (zh) | 一种音频处理的性能提升方法及装置 | |
US8781137B1 (en) | Wind noise detection and suppression | |
CN102074245B (zh) | 基于双麦克风语音增强装置及语音增强方法 | |
CN103632666B (zh) | 语音识别方法、语音识别设备和电子设备 | |
CN102074246B (zh) | 基于双麦克风语音增强装置及方法 | |
CN106463106B (zh) | 用于音频接收的风噪声降低 | |
CN105228056B (zh) | 一种消除麦克风啸叫的方法及系统 | |
CN104883437B (zh) | 基于环境的语音分析调整提示音量的方法及系统 | |
CN103959376A (zh) | 低功率语音检测 | |
CN101437094A (zh) | 移动终端立体声背景噪声抑制方法及装置 | |
CN108053822B (zh) | 一种语音信号处理方法、装置、终端设备及介质 | |
CN102254563A (zh) | 用于双麦克风数字助听器的风噪声抑制方法 | |
JP2010112996A (ja) | 音声処理装置、音声処理方法およびプログラム | |
CN111063366A (zh) | 降低噪声的方法、装置、电子设备及可读存储介质 | |
WO2004075167A2 (en) | Log-likelihood ratio method for detecting voice activity and apparatus | |
CN109195042A (zh) | 低功耗的高效降噪耳机及降噪系统 | |
CN105118522A (zh) | 噪声检测方法及装置 | |
CN105872258A (zh) | 一种终端通话音量的调节方法及装置 | |
CN107293287A (zh) | 检测音频信号的方法和装置 | |
CN103680513B (zh) | 语音信号处理方法、装置及服务器 | |
CN109257675A (zh) | 一种防风噪方法、耳机及存储介质 | |
CN108022595A (zh) | 一种语音信号降噪方法和用户终端 | |
CN108198571A (zh) | 一种基于自适应带宽判断的带宽扩展方法及系统 | |
CN106504760B (zh) | 宽频带背景噪声与语音分离检测系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170222 |