CN107316653B - 一种基于改进的经验小波变换的基频检测方法 - Google Patents

一种基于改进的经验小波变换的基频检测方法 Download PDF

Info

Publication number
CN107316653B
CN107316653B CN201610271092.6A CN201610271092A CN107316653B CN 107316653 B CN107316653 B CN 107316653B CN 201610271092 A CN201610271092 A CN 201610271092A CN 107316653 B CN107316653 B CN 107316653B
Authority
CN
China
Prior art keywords
voice signal
fundamental frequency
empirical wavelet
mode
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610271092.6A
Other languages
English (en)
Other versions
CN107316653A (zh
Inventor
李彧晟
薛彪
洪弘
顾陈
朱晓华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201610271092.6A priority Critical patent/CN107316653B/zh
Publication of CN107316653A publication Critical patent/CN107316653A/zh
Application granted granted Critical
Publication of CN107316653B publication Critical patent/CN107316653B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种基于改进的经验小波变换的基频检测方法,步骤如下:步骤1,对语音信号进行预处理:计算语音信号的短时能量和过零率,采用双门限法进行声韵分割,并把分割后的信号通过50~1500Hz的带通滤波器进行滤波,得到预处理之后的语音信号;步骤2,采用改进的经验小波变换法对预处理之后的语音信号进行分解,得到语音信号的各个模式函数;步骤3,根据各个模式函数,选取语音信号的主模式;步骤4,采用希尔伯特变换,求解主模式的瞬时基频值;步骤5,使用矩形窗函数对步骤4所得瞬时基频值做平滑处理完成基频检测。本发明具有高准确度,较好的鲁棒性以及高时间分辨率的特点。

Description

一种基于改进的经验小波变换的基频检测方法
技术领域
本发明属于语音信号分析与处理领域,提出一套完整的基于改进的经验小波变换的基频检测算法。
背景技术
语音信号具有非平稳非线性的特征,研究非平稳信号常用方法有窗口傅里叶变换,连续小波变换,经验模态分解(EMD)等。语音信号基频检测常用的方法分为基于帧的检测与基于事件的检测两类。基于帧的检测通过计算一段语音信号的平均周期来确定基频。假设语音信号在某一段内为平稳信号,且存在两个基音周期以上的采样点。这种方法的缺点是:在基频变化较快的情况下实现很困难,无法实现对高音调以及低音调语音同时适用的情况,另外如果语音存在较大噪声,得到的结果精度不高。
发明内容
本发明的目的在于提供一种准确度高、鲁棒性好、时间分辨率高的基于改进的经验小波变换的基频检测方法。
实现本发明目的的技术解决方案为:一种基于改进的经验小波变换的基频检测方法,步骤如下:
步骤1,对语音信号s(t)进行预处理:计算语音信号s(t)的短时能量和过零率,采用双门限法进行声韵分割,并把分割后的信号通过50~1500Hz的带通滤波器进行滤波,得到预处理之后的语音信号
Figure BDA0000976216240000011
步骤2,采用改进的经验小波变换法对预处理之后的语音信号
Figure BDA0000976216240000012
进行分解,得到语音信号
Figure BDA0000976216240000013
的各个模式函数;
步骤3,根据各个模式函数,选取语音信号
Figure BDA0000976216240000014
的主模式
Figure BDA0000976216240000015
步骤4,采用希尔伯特变换,求解主模式
Figure BDA0000976216240000016
的瞬时基频值;
步骤5,使用矩形窗函数对步骤4所得瞬时基频值做平滑处理完成基频检测。
进一步地,步骤2所述采用改进的经验小波变换法对预处理之后的语音信号
Figure BDA0000976216240000017
进行分解,得到语音信号
Figure BDA0000976216240000018
的各个模式函数,具体步骤如下:
(2.1)对预处理之后的语音信号
Figure BDA0000976216240000021
做傅里叶变换,获得语音信号频谱;
(2.2)对语音信号频谱进行Top-hat变换,检测出频谱包络;
(2.3)采用局部极小极大值的方法对频谱包络进行峰值检测,将每两个谷值之间存在一个峰值的区域划分出来,得到了原始语音信号s(t)的频谱划分方案;
(2.4)对步骤(2.3)所划分的各个频谱片段构造经验小波基函数,等效于构建滤波器组;
(2.5)根据步骤(2.4)构造的经验小波基函数对相应频谱段进行经验小波分解,最终得到各个模式函数。
进一步地,步骤3所述选取语音信号
Figure BDA0000976216240000022
的主模式
Figure BDA0000976216240000023
所采用的选取标准如下:
(3.1)选取峰值能量超过最大峰值一半能量作为预选主模式;
(3.2)在(3.1)的基础上,选取频率值最为接近零频的模式作为最终的输出结果即主模式
Figure BDA0000976216240000024
本发明与现有技术相比,其显著优点为:(1)有效地解决了原始经验小波变换方法在处理频谱较复杂的信号出现的频谱“过切分”现象;(2)在语音信号的基频检测中,充分结合了经验模式分解和小波变换自适应强的优势,结果具有较高的时间分辨率和准确度。
附图说明
图1为本发明的基于改进的经验小波变换的基频检测方法流程图。。
图2为本发明的基于Top-hat变换的经验小波变换改进算法流程图。
图3为本发明的原始语音信号波形图。
图4为本发明的语音信号预处理后的时域图。
图5为本发明的语音信号频谱图。
图6为本发明的语音信号Top-hat变换结果图。
图7为本发明的语音信号频谱划分图。
图8为本发明的语音信号模式分解图。
图9为本发明的语音信号基频包络图。
具体实施方式
本发明基于改进的经验小波变换的基频检测方法,主要是针对原始的经验小波变换方法在处理具有复杂频谱的信号时,进行频谱划分的过程中,出现的频谱“过切分”问题,提出了基于形态滤波的的改进方法,该方法借鉴了数学形态学中形态滤波器的概念,使用Top-hat变换对信号的复杂频谱进行处理,滤去了精细的频谱结构,将各个谱峰彼此分离,准确地提取信号的频谱包络,结合图1,具体步骤如下:
步骤1,对语音信号s(t)进行预处理:计算语音信号s(t)的短时能量和过零率,采用双门限法进行声韵分割,并把分割后的信号通过50~1500Hz的带通滤波器进行滤波,得到预处理之后的语音信号
Figure BDA0000976216240000031
步骤2,采用改进的经验小波变换法对预处理之后的语音信号
Figure BDA0000976216240000032
进行分解,得到语音信号
Figure BDA0000976216240000033
的各个模式函数,具体步骤如图2所示:
(2.1)对预处理之后的语音信号
Figure BDA0000976216240000034
做傅里叶变换,获得语音信号频谱;
(2.2)对语音信号频谱进行Top-hat变换,检测出频谱包络;
(2.3)采用局部极小极大值的方法对频谱包络进行峰值检测,将每两个谷值之间存在一个峰值的区域划分出来,得到了原始语音信号s(t)的频谱划分方案;
(2.4)对步骤(2.3)所划分的各个频谱片段构造经验小波基函数,等效于构建滤波器组;
(2.5)根据步骤(2.4)构造的经验小波基函数对相应频谱段进行经验小波分解,最终得到各个模式函数。
步骤3,根据各个模式函数,选取语音信号
Figure BDA0000976216240000035
的主模式
Figure BDA0000976216240000036
所采用的选取标准如下:
(3.1)选取峰值能量超过最大峰值一半能量作为预选主模式;
(3.2)在(3.1)的基础上,选取频率值最为接近零频的模式作为最终的输出结果即主模式
Figure BDA0000976216240000037
步骤4,采用希尔伯特变换,求解主模式
Figure BDA0000976216240000038
的瞬时基频值。
步骤5,使用矩形窗函数对步骤4所得瞬时基频值做平滑处理完成基频检测。
改进后的经验小波变换方法被应用在语音信号的基频检测上,下面结合附图及具体实施例对本发明作进一步详细描述。
实施例1
1、以测试信号“基jī”为例,其时域波形图如图3所示,通过计算短时能量和过零率,利用双门限检测对信号进行声韵分割,把分割后的信号通过50Hz~1500Hz的滤波器,结果如图4所示;
2、对信号进行傅里叶变换,可以获得频谱,结果如图5所示;
3、对信号的频谱进行Top-hat变换,检测出频谱的包络,结果如图6所示;
4、采用局部极小极大值的方法对频谱包络进行峰值检测,将每两个谷值之间存在一个峰值的区域划分出来,得到了原始信号的的频谱划分方案,结果如图7所示;
5、对各个频谱片段构造经验小波基函数,等效于构建滤波器组,进行经验小波分解,最终得到各个模式函数,结果如图8所示;
6、采用希尔伯特变换对分解得到的模式进行瞬时基频的求解,结果如图9所示。
本发明与传统的基频检测算法相比,具有高准确度,较好的鲁棒性以及高时间分辨率的特点。

Claims (2)

1.一种基于改进的经验小波变换的基频检测方法,其特征在于,步骤如下:
步骤1,对语音信号s(t)进行预处理:计算语音信号s(t)的短时能量和过零率,采用双门限法进行声韵分割,并把分割后的信号通过50~1500Hz的带通滤波器进行滤波,得到预处理之后的语音信号
Figure FDA0002457042700000011
步骤2,采用改进的经验小波变换法对预处理之后的语音信号
Figure FDA0002457042700000012
进行分解,得到语音信号
Figure FDA0002457042700000013
的各个模式函数;
步骤3,根据各个模式函数,选取语音信号
Figure FDA0002457042700000014
的主模式
Figure FDA0002457042700000015
步骤4,采用希尔伯特变换,求解主模式
Figure FDA0002457042700000016
的瞬时基频值;
步骤5,使用矩形窗函数对步骤4所得瞬时基频值做平滑处理完成基频检测;
步骤2所述采用改进的经验小波变换法对预处理之后的语音信号
Figure FDA0002457042700000017
进行分解,得到语音信号
Figure FDA0002457042700000018
的各个模式函数,具体步骤如下:
(2.1)对预处理之后的语音信号
Figure FDA0002457042700000019
做傅里叶变换,获得语音信号频谱;
(2.2)对语音信号频谱进行Top-hat变换,检测出频谱包络;
(2.3)采用局部极小极大值的方法对频谱包络进行峰值检测,将每两个谷值之间存在一个峰值的区域划分出来,得到了原始语音信号s(t)的频谱划分方案;
(2.4)对步骤(2.3)所划分的各个频谱片段构造经验小波基函数,等效于构建滤波器组;
(2.5)根据步骤(2.4)构造的经验小波基函数对相应频谱段进行经验小波分解,最终得到各个模式函数。
2.根据权利要求1所述的基于改进的经验小波变换的基频检测方法,其特征在于,步骤3所述选取语音信号
Figure FDA00024570427000000110
的主模式
Figure FDA00024570427000000111
所采用的选取标准如下:
(3.1)选取峰值能量超过最大峰值一半能量作为预选主模式;
(3.2)在(3.1)的基础上,选取频率值最为接近零频的模式作为最终的输出结果即主模式
Figure FDA00024570427000000112
CN201610271092.6A 2016-04-27 2016-04-27 一种基于改进的经验小波变换的基频检测方法 Expired - Fee Related CN107316653B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610271092.6A CN107316653B (zh) 2016-04-27 2016-04-27 一种基于改进的经验小波变换的基频检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610271092.6A CN107316653B (zh) 2016-04-27 2016-04-27 一种基于改进的经验小波变换的基频检测方法

Publications (2)

Publication Number Publication Date
CN107316653A CN107316653A (zh) 2017-11-03
CN107316653B true CN107316653B (zh) 2020-06-26

Family

ID=60184469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610271092.6A Expired - Fee Related CN107316653B (zh) 2016-04-27 2016-04-27 一种基于改进的经验小波变换的基频检测方法

Country Status (1)

Country Link
CN (1) CN107316653B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944199B (zh) * 2017-12-22 2020-12-01 浙江工业大学 一种基于频谱趋势和变分模态分解的齿轮箱故障识别方法
CN108458871B (zh) * 2017-12-22 2020-12-01 浙江工业大学 一种基于改进经验小波变换的齿轮箱故障识别方法
CN108335703B (zh) * 2018-03-28 2020-10-09 腾讯音乐娱乐科技(深圳)有限公司 确定音频数据的重音位置的方法和装置
CN108921082B (zh) * 2018-06-28 2021-11-12 哈尔滨工程大学 基于经验小波和希尔伯特变换的柴油机燃烧共振频率提取方法
CN109036472B (zh) * 2018-07-19 2022-05-10 天津大学 一种改进的病理嗓音基音频率提取方法
CN109269629A (zh) * 2018-08-03 2019-01-25 河海大学 基于经验小波变换的特高压并联电抗器振动信号分析方法
CN109884464A (zh) * 2019-03-01 2019-06-14 西安理工大学 小电流单相接地故障选线方法
CN110441654B (zh) * 2019-07-29 2021-05-04 三峡大学 基于改进ewt和cmpe的配电网电能质量扰动检测方法
CN112017695A (zh) * 2020-03-04 2020-12-01 上海交通大学医学院附属上海儿童医学中心 一种自动识别生理声音的系统及方法
CN111666892B (zh) * 2020-06-08 2023-04-25 西南交通大学 一种基于经验小波希尔伯特变换的电力机车空转识别方法
CN113213101A (zh) * 2021-05-06 2021-08-06 华润电力技术研究院有限公司 一种托辊异常检测方法和系统
CN113903344B (zh) * 2021-12-07 2022-03-11 杭州兆华电子有限公司 基于多通道小波分解共同降噪的深度学习声纹识别方法
CN114176563B (zh) * 2021-12-13 2023-11-21 中南大学湘雅医院 贴附式的无线呼吸监测装置、计算机设备与存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297590A (zh) * 2012-02-24 2013-09-11 中兴通讯股份有限公司 一种基于音频实现设备解锁的方法和系统
CN105469807A (zh) * 2015-12-30 2016-04-06 中国科学院自动化研究所 一种多基频提取方法及装置
CN105510711A (zh) * 2015-12-24 2016-04-20 合肥工业大学 一种改进的经验模态分解的谐波分析法
CN105895078A (zh) * 2015-11-26 2016-08-24 乐视致新电子科技(天津)有限公司 动态选择语音模型的语音识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297590A (zh) * 2012-02-24 2013-09-11 中兴通讯股份有限公司 一种基于音频实现设备解锁的方法和系统
CN105895078A (zh) * 2015-11-26 2016-08-24 乐视致新电子科技(天津)有限公司 动态选择语音模型的语音识别方法及装置
CN105510711A (zh) * 2015-12-24 2016-04-20 合肥工业大学 一种改进的经验模态分解的谐波分析法
CN105469807A (zh) * 2015-12-30 2016-04-06 中国科学院自动化研究所 一种多基频提取方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Detection of microcalcification with top-hat transform and the Gibbs random fields";Akshay S. Bharadwaj等;《IEEE》;20151231;全文 *
"小波变换中经验模态分解的基波检测及其在机械系统中的应用";秦毅;《机械工程学报》;20080331;第44卷(第3期);全文 *

Also Published As

Publication number Publication date
CN107316653A (zh) 2017-11-03

Similar Documents

Publication Publication Date Title
CN107316653B (zh) 一种基于改进的经验小波变换的基频检测方法
CN103646649B (zh) 一种高效的语音检测方法
CN102799892B (zh) 一种mfcc水下目标特征提取和识别方法
CN102054480B (zh) 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN111553207B (zh) 一种基于统计分布的舰船辐射噪声特征重组方法
CN107274911A (zh) 一种基于声音特征的相似度分析方法
CN101919695A (zh) 一种基于小波变换的心电信号qrs波检测方法
CN103077728B (zh) 一种病人虚弱语音端点检测方法
CN113325277A (zh) 一种局部放电处理方法
CN106385288B (zh) 一种雷达脉冲跨信道融合检测装置及其检测方法
Zhao et al. Analysis of speech signals’ characteristics based on MF-DFA with moving overlapping windows
CN104089699A (zh) 一种变电站设备声音重建算法
CN108334872A (zh) 基于改进hht变换的特征提取方法
CN108761202B (zh) 极点对称模态分解和希尔伯特变换相结合的谐波检测方法
CN113723200B (zh) 一种非平稳信号的时频谱结构特征提取方法
CN102988041A (zh) 心磁信号噪声抑制中的信号选择性平均方法
Chu et al. A noise-robust FFT-based auditory spectrum with application in audio classification
Azami et al. Automatic signal segmentation using the fractal dimension and weighted moving average filter
JP4496378B2 (ja) 定常雑音下における音声区間検出に基づく目的音声の復元方法
Le et al. Hyperbolic wavelet power spectra of nonstationary signals
CN104698091B (zh) 一种基于量化信息熵的一维构件应力波信号奇异点检测的方法
CN104318931A (zh) 一种音频文件的情绪活跃度获取方法及分类方法、装置
Jamaludin et al. An improved time domain pitch detection algorithm for pathological voice
Vani et al. Hilbert Huang transform based speech recognition
Ibrahim et al. ICA based feature learning and feature selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200626