CN109785865A - 基于短时能零比的广播语音与噪声检测的方法 - Google Patents
基于短时能零比的广播语音与噪声检测的方法 Download PDFInfo
- Publication number
- CN109785865A CN109785865A CN201910171499.5A CN201910171499A CN109785865A CN 109785865 A CN109785865 A CN 109785865A CN 201910171499 A CN201910171499 A CN 201910171499A CN 109785865 A CN109785865 A CN 109785865A
- Authority
- CN
- China
- Prior art keywords
- short
- frame
- zero
- time
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本发明涉及一种基于短时能零比的广播语音与噪声检测的方法,对输入的语音信号进行分帧;计算每帧语音信号的短时能量;计算每帧语音信号的短时平均过零率;计算每帧信号的短时能量与短时平均过零率的比值,即能零比;对一秒内所有帧能零比进行方差计算,得到的方差与设置阈值进行比较,当方差大于设定阈值时,判断为语音,方差小于设定阈值时,判定为噪声。将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。
Description
技术领域
本发明涉及一种语音识别技术,特别涉及一种基于短时能零比的广播语音与噪声检测的方法。
背景技术
调频广播中经常听到“呲呲”的声音,是一种叫做似高斯噪声中高幅值部分的失真引起的。这种典型的现象就是听众没有将收音机准确的调到某个台。在现实生活中,一些人的声音和这些噪声极为相似,因此,使用傅里叶变换就很难将这些噪声和语音区分开来,在背景噪声较小的情况下,短时能量比较准确,但是当背景噪声比较大的时候,短时平均过零率可以获得较好的检测结果。
发明内容
本发明是针对调频广播中嘈杂声难识别区分的问题,提出了一种基于短时能零比的广播语音与噪声检测的方法,正确将噪声识别区分出。
本发明的技术方案为:一种基于短时能零比的广播语音与噪声检测的方法,具体包括如下步骤:
1)对输入的语音信号进行分帧:设定帧长大小,帧长范围为10~30ms,根据设定对输入的语音信号进行分帧;
2)计算每帧语音信号的短时能量:语音信号x(n)分帧后第i帧的语音信号为yi(n),yi(n)的短时能量为E(i);
其中L为帧长;
3)计算每帧语音信号的短时平均过零率,即每帧内信号通过零值的次数:第i帧的语音信号yi(n)的短时平均过零率为Z(i);
其中sgn[·]是符号函数;
4)计算每帧信号的短时能量与短时平均过零率的比值,即能零比;
5)对一秒内所有帧能零比进行方差计算,得到的方差与设置阈值Th进行比较,当方差大于设定阈值Th时,判定为语音,方差小于设定阈值Th时,判定为噪声;
6)进行下一秒内所有帧能零比的方差计算,同步骤5)进行同样判断方法判定噪声,直到步骤1)分帧后的输入的语音信号全部判定完毕。
本发明的有益效果在于:本发明基于短时能零比的广播语音与噪声检测的方法,将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。
附图说明
图1为本发明基于短时能零比的广播语音和噪声检测流程图。
具体实施方式
如图1所示基于短时能零比的广播语音和噪声检测流程图,方法具体步骤如下:
1)对输入的语音信号进行分帧。由于语音信号是一个非稳态、时变的信号,但是可以在“短时间”范围内认为语音信号是稳态的,时不变的。这个短时间一般指10~30ms,本发明采用的帧长为20ms;
2)计算每帧语音信号的短时能量。一般语音信号的能量随时间变化比较明显,并且噪声的能量比语音的能量小很多,语音信号x(n)分帧后第i帧的语音信号为yi(n),yi(n)的短时能量E(i)为;
其中L为帧长;n为语音信号中第n个数据。
3)计算每帧语音信号的短时平均过零率,即每帧内信号通过零值的次数。对于离散信号,实质上就是信号采样点符号变化的次数。在语音段,一般具有较低的过零率,而在噪声段具有较高的过零率。但是这种高低仅是相对而言的,没有精确的数值关系,第i帧的语音信号yi(n)的短时平均过零率Z(i)为(2);
其中sgn[·]是符号函数。
4)计算每帧信号的短时能量与短时平均过零率的比值,即能零比,因为噪声信号的平均过零率高,短时能量小,而语音信号的短时平均过零率低,而短时能量比较高,因此语音信号的能零比就更高,而噪声信号的能零比就更低。
5)由于噪声的能零比的波动程度比语音信号小,计算每帧音频的能零比,用以判定每秒的音频是噪声还是语音,每帧长20ms,因此1s内有50帧。
6)对一秒内50帧能零比进行方差计算,得到的方差可以反映信号的波动程度,因此根据噪声的情况,设置一个阈值Th。方差大于设定阈值Th时,判定为语音,方差小于设定阈值Th时,判定为噪声。
7)进行下一秒内50帧能零比的方差计算,同步骤6)进行同样判断方法判定噪声,直到步骤1)分帧后的输入的语音信号全部判定完毕,输出无噪声语音。
Claims (1)
1.一种基于短时能零比的广播语音与噪声检测的方法,其特征在于,具体包括如下步骤:
1)对输入的语音信号进行分帧:设定帧长大小,帧长范围为10~30ms,根据设定对输入的语音信号进行分帧;
2)计算每帧语音信号的短时能量:语音信号x(n)分帧后第i帧的语音信号为yi(n),yi(n)的短时能量为E(i);
其中L为帧长;
3)计算每帧语音信号的短时平均过零率,即每帧内信号通过零值的次数:第i帧的语音信号yi(n)的短时平均过零率为Z(i);
其中sgn[·]是符号函数;
4)计算每帧信号的短时能量与短时平均过零率的比值,即能零比;
5)对一秒内所有帧能零比进行方差计算,得到的方差与设置阈值Th进行比较,当方差大于设定阈值Th时,判定为语音,方差小于设定阈值Th时,判定为噪声;
6)进行下一秒内所有帧能零比的方差计算,同步骤5)进行同样判断方法判定噪声,直到步骤1)分帧后的输入的语音信号全部判定完毕。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910171499.5A CN109785865A (zh) | 2019-03-07 | 2019-03-07 | 基于短时能零比的广播语音与噪声检测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910171499.5A CN109785865A (zh) | 2019-03-07 | 2019-03-07 | 基于短时能零比的广播语音与噪声检测的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109785865A true CN109785865A (zh) | 2019-05-21 |
Family
ID=66487697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910171499.5A Pending CN109785865A (zh) | 2019-03-07 | 2019-03-07 | 基于短时能零比的广播语音与噪声检测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109785865A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968957A (zh) * | 2010-10-28 | 2011-02-09 | 哈尔滨工程大学 | 一种噪声条件下的语音检测方法 |
US20180025732A1 (en) * | 2016-07-20 | 2018-01-25 | Nxp B.V. | Audio classifier that includes a first processor and a second processor |
WO2018106971A1 (en) * | 2016-12-07 | 2018-06-14 | Interactive Intelligence Group, Inc. | System and method for neural network based speaker classification |
CN108332843A (zh) * | 2018-01-29 | 2018-07-27 | 国家电网公司 | 一种电气设备故障电弧的噪声诊断方法 |
CN108922561A (zh) * | 2018-06-04 | 2018-11-30 | 平安科技(深圳)有限公司 | 语音区分方法、装置、计算机设备及存储介质 |
CN109378013A (zh) * | 2018-11-19 | 2019-02-22 | 南瑞集团有限公司 | 一种语音降噪方法 |
-
2019
- 2019-03-07 CN CN201910171499.5A patent/CN109785865A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968957A (zh) * | 2010-10-28 | 2011-02-09 | 哈尔滨工程大学 | 一种噪声条件下的语音检测方法 |
US20180025732A1 (en) * | 2016-07-20 | 2018-01-25 | Nxp B.V. | Audio classifier that includes a first processor and a second processor |
WO2018106971A1 (en) * | 2016-12-07 | 2018-06-14 | Interactive Intelligence Group, Inc. | System and method for neural network based speaker classification |
CN108332843A (zh) * | 2018-01-29 | 2018-07-27 | 国家电网公司 | 一种电气设备故障电弧的噪声诊断方法 |
CN108922561A (zh) * | 2018-06-04 | 2018-11-30 | 平安科技(深圳)有限公司 | 语音区分方法、装置、计算机设备及存储介质 |
CN109378013A (zh) * | 2018-11-19 | 2019-02-22 | 南瑞集团有限公司 | 一种语音降噪方法 |
Non-Patent Citations (1)
Title |
---|
唐文艳,李向林,唐文昊: "基于端点检测调频广播自动监测理论研究", 《视听》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103578468B (zh) | 一种语音识别中置信度阈值的调整方法及电子设备 | |
CN101625860B (zh) | 语音端点检测中的背景噪声自适应调整方法 | |
CN103646649A (zh) | 一种高效的语音检测方法 | |
CN108538310A (zh) | 一种基于长时信号功率谱变化的语音端点检测方法 | |
CN102543063A (zh) | 基于说话人分割与聚类的多说话人语速估计方法 | |
US20060100866A1 (en) | Influencing automatic speech recognition signal-to-noise levels | |
CN105913849B (zh) | 一种基于事件检测的说话人分割方法 | |
CN103440869A (zh) | 一种音频混响的抑制装置及其抑制方法 | |
CN106504760B (zh) | 宽频带背景噪声与语音分离检测系统及方法 | |
Yu | A low-complexity noise estimation algorithm based on smoothing of noise power estimation and estimation bias correction | |
WO2020186742A1 (zh) | 一种应用于地空通信的话音识别方法 | |
WO2018095167A1 (zh) | 声纹识别方法和声纹识别系统 | |
Dharanipragada et al. | MVDR based feature extraction for robust speech recognition | |
US20030144839A1 (en) | MVDR based feature extraction for speech recognition | |
CN105916090A (zh) | 一种基于智能化语音识别技术的助听器系统 | |
WO2021248522A1 (zh) | 气流杂音检测方法、装置、终端及存储介质 | |
CN106023986A (zh) | 一种基于声效模式检测的语音识别方法 | |
CN108962285A (zh) | 一种基于人耳掩蔽效应划分子带的语音端点检测方法 | |
CN108986844B (zh) | 一种基于说话人语音特征的语音端点检测方法 | |
Smolenski et al. | Usable speech processing: A filterless approach in the presence of interference | |
CN109785865A (zh) | 基于短时能零比的广播语音与噪声检测的方法 | |
CN111596261B (zh) | 一种声源定位方法及装置 | |
CN109785866A (zh) | 基于相关函数最大值的广播语音与噪声检测的方法 | |
CN107833582B (zh) | 基于弧长的语音信号端点检测方法 | |
CN107039046B (zh) | 一种基于特征融合的语音声效模式检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190521 |