CN109785865A - 基于短时能零比的广播语音与噪声检测的方法 - Google Patents

基于短时能零比的广播语音与噪声检测的方法 Download PDF

Info

Publication number
CN109785865A
CN109785865A CN201910171499.5A CN201910171499A CN109785865A CN 109785865 A CN109785865 A CN 109785865A CN 201910171499 A CN201910171499 A CN 201910171499A CN 109785865 A CN109785865 A CN 109785865A
Authority
CN
China
Prior art keywords
short
frame
zero
time
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910171499.5A
Other languages
English (en)
Inventor
袁三男
刘虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University of Electric Power
University of Shanghai for Science and Technology
Original Assignee
Shanghai University of Electric Power
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai University of Electric Power filed Critical Shanghai University of Electric Power
Priority to CN201910171499.5A priority Critical patent/CN109785865A/zh
Publication of CN109785865A publication Critical patent/CN109785865A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本发明涉及一种基于短时能零比的广播语音与噪声检测的方法,对输入的语音信号进行分帧;计算每帧语音信号的短时能量;计算每帧语音信号的短时平均过零率;计算每帧信号的短时能量与短时平均过零率的比值,即能零比;对一秒内所有帧能零比进行方差计算,得到的方差与设置阈值进行比较,当方差大于设定阈值时,判断为语音,方差小于设定阈值时,判定为噪声。将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。

Description

基于短时能零比的广播语音与噪声检测的方法
技术领域
本发明涉及一种语音识别技术,特别涉及一种基于短时能零比的广播语音与噪声检测的方法。
背景技术
调频广播中经常听到“呲呲”的声音,是一种叫做似高斯噪声中高幅值部分的失真引起的。这种典型的现象就是听众没有将收音机准确的调到某个台。在现实生活中,一些人的声音和这些噪声极为相似,因此,使用傅里叶变换就很难将这些噪声和语音区分开来,在背景噪声较小的情况下,短时能量比较准确,但是当背景噪声比较大的时候,短时平均过零率可以获得较好的检测结果。
发明内容
本发明是针对调频广播中嘈杂声难识别区分的问题,提出了一种基于短时能零比的广播语音与噪声检测的方法,正确将噪声识别区分出。
本发明的技术方案为:一种基于短时能零比的广播语音与噪声检测的方法,具体包括如下步骤:
1)对输入的语音信号进行分帧:设定帧长大小,帧长范围为10~30ms,根据设定对输入的语音信号进行分帧;
2)计算每帧语音信号的短时能量:语音信号x(n)分帧后第i帧的语音信号为yi(n),yi(n)的短时能量为E(i);
其中L为帧长;
3)计算每帧语音信号的短时平均过零率,即每帧内信号通过零值的次数:第i帧的语音信号yi(n)的短时平均过零率为Z(i);
其中sgn[·]是符号函数;
4)计算每帧信号的短时能量与短时平均过零率的比值,即能零比;
5)对一秒内所有帧能零比进行方差计算,得到的方差与设置阈值Th进行比较,当方差大于设定阈值Th时,判定为语音,方差小于设定阈值Th时,判定为噪声;
6)进行下一秒内所有帧能零比的方差计算,同步骤5)进行同样判断方法判定噪声,直到步骤1)分帧后的输入的语音信号全部判定完毕。
本发明的有益效果在于:本发明基于短时能零比的广播语音与噪声检测的方法,将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。
附图说明
图1为本发明基于短时能零比的广播语音和噪声检测流程图。
具体实施方式
如图1所示基于短时能零比的广播语音和噪声检测流程图,方法具体步骤如下:
1)对输入的语音信号进行分帧。由于语音信号是一个非稳态、时变的信号,但是可以在“短时间”范围内认为语音信号是稳态的,时不变的。这个短时间一般指10~30ms,本发明采用的帧长为20ms;
2)计算每帧语音信号的短时能量。一般语音信号的能量随时间变化比较明显,并且噪声的能量比语音的能量小很多,语音信号x(n)分帧后第i帧的语音信号为yi(n),yi(n)的短时能量E(i)为;
其中L为帧长;n为语音信号中第n个数据。
3)计算每帧语音信号的短时平均过零率,即每帧内信号通过零值的次数。对于离散信号,实质上就是信号采样点符号变化的次数。在语音段,一般具有较低的过零率,而在噪声段具有较高的过零率。但是这种高低仅是相对而言的,没有精确的数值关系,第i帧的语音信号yi(n)的短时平均过零率Z(i)为(2);
其中sgn[·]是符号函数。
4)计算每帧信号的短时能量与短时平均过零率的比值,即能零比,因为噪声信号的平均过零率高,短时能量小,而语音信号的短时平均过零率低,而短时能量比较高,因此语音信号的能零比就更高,而噪声信号的能零比就更低。
5)由于噪声的能零比的波动程度比语音信号小,计算每帧音频的能零比,用以判定每秒的音频是噪声还是语音,每帧长20ms,因此1s内有50帧。
6)对一秒内50帧能零比进行方差计算,得到的方差可以反映信号的波动程度,因此根据噪声的情况,设置一个阈值Th。方差大于设定阈值Th时,判定为语音,方差小于设定阈值Th时,判定为噪声。
7)进行下一秒内50帧能零比的方差计算,同步骤6)进行同样判断方法判定噪声,直到步骤1)分帧后的输入的语音信号全部判定完毕,输出无噪声语音。

Claims (1)

1.一种基于短时能零比的广播语音与噪声检测的方法,其特征在于,具体包括如下步骤:
1)对输入的语音信号进行分帧:设定帧长大小,帧长范围为10~30ms,根据设定对输入的语音信号进行分帧;
2)计算每帧语音信号的短时能量:语音信号x(n)分帧后第i帧的语音信号为yi(n),yi(n)的短时能量为E(i);
其中L为帧长;
3)计算每帧语音信号的短时平均过零率,即每帧内信号通过零值的次数:第i帧的语音信号yi(n)的短时平均过零率为Z(i);
其中sgn[·]是符号函数;
4)计算每帧信号的短时能量与短时平均过零率的比值,即能零比;
5)对一秒内所有帧能零比进行方差计算,得到的方差与设置阈值Th进行比较,当方差大于设定阈值Th时,判定为语音,方差小于设定阈值Th时,判定为噪声;
6)进行下一秒内所有帧能零比的方差计算,同步骤5)进行同样判断方法判定噪声,直到步骤1)分帧后的输入的语音信号全部判定完毕。
CN201910171499.5A 2019-03-07 2019-03-07 基于短时能零比的广播语音与噪声检测的方法 Pending CN109785865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910171499.5A CN109785865A (zh) 2019-03-07 2019-03-07 基于短时能零比的广播语音与噪声检测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910171499.5A CN109785865A (zh) 2019-03-07 2019-03-07 基于短时能零比的广播语音与噪声检测的方法

Publications (1)

Publication Number Publication Date
CN109785865A true CN109785865A (zh) 2019-05-21

Family

ID=66487697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910171499.5A Pending CN109785865A (zh) 2019-03-07 2019-03-07 基于短时能零比的广播语音与噪声检测的方法

Country Status (1)

Country Link
CN (1) CN109785865A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101968957A (zh) * 2010-10-28 2011-02-09 哈尔滨工程大学 一种噪声条件下的语音检测方法
US20180025732A1 (en) * 2016-07-20 2018-01-25 Nxp B.V. Audio classifier that includes a first processor and a second processor
WO2018106971A1 (en) * 2016-12-07 2018-06-14 Interactive Intelligence Group, Inc. System and method for neural network based speaker classification
CN108332843A (zh) * 2018-01-29 2018-07-27 国家电网公司 一种电气设备故障电弧的噪声诊断方法
CN108922561A (zh) * 2018-06-04 2018-11-30 平安科技(深圳)有限公司 语音区分方法、装置、计算机设备及存储介质
CN109378013A (zh) * 2018-11-19 2019-02-22 南瑞集团有限公司 一种语音降噪方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101968957A (zh) * 2010-10-28 2011-02-09 哈尔滨工程大学 一种噪声条件下的语音检测方法
US20180025732A1 (en) * 2016-07-20 2018-01-25 Nxp B.V. Audio classifier that includes a first processor and a second processor
WO2018106971A1 (en) * 2016-12-07 2018-06-14 Interactive Intelligence Group, Inc. System and method for neural network based speaker classification
CN108332843A (zh) * 2018-01-29 2018-07-27 国家电网公司 一种电气设备故障电弧的噪声诊断方法
CN108922561A (zh) * 2018-06-04 2018-11-30 平安科技(深圳)有限公司 语音区分方法、装置、计算机设备及存储介质
CN109378013A (zh) * 2018-11-19 2019-02-22 南瑞集团有限公司 一种语音降噪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐文艳,李向林,唐文昊: "基于端点检测调频广播自动监测理论研究", 《视听》 *

Similar Documents

Publication Publication Date Title
CN103578468B (zh) 一种语音识别中置信度阈值的调整方法及电子设备
CN101625860B (zh) 语音端点检测中的背景噪声自适应调整方法
CN103646649A (zh) 一种高效的语音检测方法
CN108538310A (zh) 一种基于长时信号功率谱变化的语音端点检测方法
CN102543063A (zh) 基于说话人分割与聚类的多说话人语速估计方法
US20060100866A1 (en) Influencing automatic speech recognition signal-to-noise levels
CN105913849B (zh) 一种基于事件检测的说话人分割方法
CN103440869A (zh) 一种音频混响的抑制装置及其抑制方法
CN106504760B (zh) 宽频带背景噪声与语音分离检测系统及方法
Yu A low-complexity noise estimation algorithm based on smoothing of noise power estimation and estimation bias correction
WO2020186742A1 (zh) 一种应用于地空通信的话音识别方法
WO2018095167A1 (zh) 声纹识别方法和声纹识别系统
Dharanipragada et al. MVDR based feature extraction for robust speech recognition
US20030144839A1 (en) MVDR based feature extraction for speech recognition
CN105916090A (zh) 一种基于智能化语音识别技术的助听器系统
WO2021248522A1 (zh) 气流杂音检测方法、装置、终端及存储介质
CN106023986A (zh) 一种基于声效模式检测的语音识别方法
CN108962285A (zh) 一种基于人耳掩蔽效应划分子带的语音端点检测方法
CN108986844B (zh) 一种基于说话人语音特征的语音端点检测方法
Smolenski et al. Usable speech processing: A filterless approach in the presence of interference
CN109785865A (zh) 基于短时能零比的广播语音与噪声检测的方法
CN111596261B (zh) 一种声源定位方法及装置
CN109785866A (zh) 基于相关函数最大值的广播语音与噪声检测的方法
CN107833582B (zh) 基于弧长的语音信号端点检测方法
CN107039046B (zh) 一种基于特征融合的语音声效模式检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190521