CN106610451B - 基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法 - Google Patents

基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法 Download PDF

Info

Publication number
CN106610451B
CN106610451B CN201611205653.9A CN201611205653A CN106610451B CN 106610451 B CN106610451 B CN 106610451B CN 201611205653 A CN201611205653 A CN 201611205653A CN 106610451 B CN106610451 B CN 106610451B
Authority
CN
China
Prior art keywords
fundamental frequency
cepstrum
data
periodic signal
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611205653.9A
Other languages
English (en)
Other versions
CN106610451A (zh
Inventor
曹九稳
王天磊
商路明
王建中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201611205653.9A priority Critical patent/CN106610451B/zh
Publication of CN106610451A publication Critical patent/CN106610451A/zh
Application granted granted Critical
Publication of CN106610451B publication Critical patent/CN106610451B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R23/00Arrangements for measuring frequencies; Arrangements for analysing frequency spectra
    • G01R23/16Spectrum analysis; Fourier analysis

Abstract

本发明公开了一种基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法。本发明包括如下步骤:1、根据T种不同周期的周期信号的基频,得到其组成的基频集合S;2、获得未知基频周期信号数据s(m),其基频μx属于基频集合S;3、对信号数据s(m)进行分帧,得到所有数据帧的集合;4、对每一帧数据,使用倒谱法提取出基频估计值,而所有帧的基频组成基频估计值序列;5、求基频估计值序列的均值;6、依据贝叶斯决策得到准确的基频μx

Description

基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法
技术领域
本发明属于信号处理领域,涉及一种基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法。
背景技术
传统的周期信号基频提取方法可以得到的基频的估计值,然而当需要使用准确的基频作为下一步处理的核心参数时,传统方法中直接提取得到的基频的估计值并不满足应用要求。在此应用需求下,基频估计值与真实基频的误差要求要比统计学上的准确率更重要,否则后续处理将毫无意义。
本发明基于先验统计的原理,提出了一种基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法,可以实现对属于任意已知准确基频集合的信号在可靠性较高的倒谱法基频提取处理之后匹配得到准确的基频,以保证后续处理得到更准确的基频参数,即后续有效处理比例将显著地高于传统方案。
发明内容
本发明针对传统的周期信号基频提取方法在高基频准确率需求下的不足,提出了一种基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法,实现对属于任意已知准确基频集合的单帧信号在传统基频提取处理之后匹配准确的基频,以保证后续处理得到更准确的基频参数,即保证后续有效处理比例将显著地高于传统方案。
在实际应用中,实时周期信号由于噪声的存在,通过倒谱法提取得到的基频估计值必然存在误差。假设周期信号中叠加的噪声是高斯白噪声,则得到的基频估计值也将可以表示为均值为实际基频的正态分布。而在满足各基频总体的概率分布已知和基频总数确定的条件时,可以采用贝叶斯决策方法进行基频匹配。假设在所有基频的先验概率相等的情况下,基频估计值μx在基频μi的概率分布下对应的概率密度大于在已知基频集合S内任意其他基频μj的概率分布下对应的概率密度,则决策认为μx=μi的结论在概率上正确可能最高。
本发明的技术方案包括如下步骤:
步骤1、根据T种不同周期的周期信号的基频,得到其组成的基频集合S={μ12,...,μT};
步骤2、获得未知基频的周期信号数据s(m),m=1,2,...,Ns,周期信号数据s(m)的基频μx属于基频集合S,Ns为数据采样点数。
步骤3、按照帧长Lf、帧移Lo对周期信号数据s(m)进行分帧,得到包含Nf个数据帧的数据帧集合:
步骤4、对每一帧数据xi(n),i=1,2,...,Nf,n=1,2,...,Lf,使用倒谱法提取出基频估计值ffi
单帧信号xi(n)帧长Lf,采样频率Fs,针对其倒谱法基频提取过程如下:
4.1、使用快速傅里叶变换(FFT)到xi(n)的频谱X(ω):
X(ω)=FFT[x(n)],ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.2、依据频谱X(ω)计算得到幅值谱Xa(ω):
Xa(ω)=|X(ω)|,ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.3、依据幅值谱Xa(ω)计算得到幅值对数谱Xl(ω):
Xl(ω)=log[Xa(ω)],ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.4、将幅值对数谱Xl(ω)进行快速傅里叶逆变换(IFFT)得到倒谱
4.5、根据基频检索频率的范围[fmin,fmax],计算得到倒谱索引范围[nl,nr]:
nl=Fs/fmax,nr=Fs/fmin
4.6、在倒谱序列的索引范围[nl,nr]中,找到最大值及对应的索引:
4.7、根据ntop计算得到第i帧数据的基频的估计值ffi
ffi=Fs/ntop
最终将所有帧的基频估计值组成基频估计值序列{ffi},i=1,2,...,Nf
步骤5、求基频估计值序列{ffi}的均值:
步骤6、依据贝叶斯决策得到准确的基频μx,即:
本发明针对传统的周期信号基频提取方法在高基频准确率需求下的不足,提出了一种基于倒谱和贝叶斯决策的周期信号基频提取方法,实现对属于任意已知准确基频集合的周期信号在倒谱法基频提取处理之后匹配准确的基频,以保证后续处理得到更准确的基频参数,即保证后续有效处理比例将显著地高于传统方案。
本发明有益效果如下:
运用此种基于倒谱和贝叶斯决策的周期信号基频提取方法后,可以基于高可靠性的倒谱法基频提取算法之后,假设针对不同基频信号倒谱法得到的基频估计值的概率分布属于等方差正态分布,因此可以基于贝叶斯决策原理,将基频的估计值提取得到一个准确的先验基频。此种处理可以用对基频提取的可靠性与准确率要求很高但实时性要求相对不高的场合,特别是基频最为后续处理的重要参数、基频的一定误差有可能导致后续处理完全错误的场合。在以上需求场合中,对比传统的基频提取方法,本发明提出的基频提取方法在可靠性与准确率上具有较大的优势。
附图说明
图1基于倒谱和贝叶斯决策的周期信号基频提取方法;
图2倒谱法基频估计。
具体实施方式
下面结合附图和具体实施方式对本发明作详细说明。
如图1和2所示,基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法,在实际应用中,实时周期信号由于噪声的存在,通过倒谱法提取得到的基频估计值必然存在误差。假设周期信号中叠加的噪声是高斯白噪声,则得到的基频估计值也将可以表示为均值为实际基频的正态分布。而在满足各基频总体的概率分布已知和基频总数确定的条件时,可以采用贝叶斯决策方法进行基频匹配。假设在所有基频的先验概率相等的情况下,基频估计值μx在基频μi的概率分布下对应的概率密度大于在已知基频集合S内任意其他基频μj的概率分布下对应的概率密度,则决策认为μx=μi的结论在概率上正确可能最高。
如图1和2所示,本发明的具体实现包括如下步骤:
步骤1、根据T种不同周期的周期信号的基频,得到其组成的基频集合S={μ12,...,μT};
步骤2、获得未知基频的周期信号数据s(m),m=1,2,...,Ns,周期信号数据s(m)的基频μx属于基频集合S,Ns为数据采样点数。
步骤3、按照帧长Lf、帧移Lo对周期信号数据s(m)进行分帧,得到包含Nf个数据帧的数据帧集合:
步骤4、对每一帧数据xi(n),i=1,2,...,Nf,n=1,2,...,Lf,使用倒谱法提取出基频估计值ffi
单帧信号xi(n)帧长Lf,采样频率Fs,针对其倒谱法基频提取过程如下:
4.1、使用快速傅里叶变换(FFT)到xi(n)的频谱X(ω):
X(ω)=FFT[x(n)],ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.2、依据频谱X(ω)计算得到幅值谱Xa(ω):
Xa(ω)=|X(ω)|,ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.3、依据幅值谱Xa(ω)计算得到幅值对数谱Xl(ω):
Xl(ω)=log[Xa(ω)],ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.4、将幅值对数谱Xl(ω)进行快速傅里叶逆变换(IFFT)得到倒谱
4.5、根据基频检索频率的范围[fmin,fmax],计算得到倒谱索引范围[nl,nr]:
nl=Fs/fmax,nr=Fs/fmin
4.6、在倒谱序列的索引范围[nl,nr]中,找到最大值及对应的索引:
4.7、根据ntop计算得到第i帧数据的基频的估计值ffi
ffi=Fs/ntop
最终将所有帧的基频估计值组成基频估计值序列{ffi},i=1,2,...,Nf
步骤5、求基频估计值序列{ffi}的均值:
步骤6、依据贝叶斯决策得到准确的基频μx,即:
本发明针对传统的周期信号基频提取方法在高基频准确率需求下的不足,提出了一种基于倒谱和贝叶斯决策的周期信号基频提取方法,实现对属于任意已知准确基频集合的周期信号在倒谱法基频提取处理之后匹配准确的基频,以保证后续处理得到更准确的基频参数,即保证后续有效处理比例将显著地高于传统方案。
在以上基频提取步骤中,为了达到更好的提取效果,需要注意以下几点:
(1)步骤3中的分帧步骤中,帧长Lf需要包含至少3个及以上的基频周期,这是后续倒谱法基频提取的基本保证;
(2)步骤4.5中基频检索频率的范围[fmin,fmax]的合理选择有助于排除非目标基频范围的干扰信号,提高倒谱法基频提取的准确率。

Claims (1)

1.基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法,其特征在于包括如下步骤:
步骤1、根据T种不同周期的周期信号的基频,得到其组成的基频集合S={μ12,...,μT};
步骤2、获得未知基频的周期信号数据s(m),m=1,2,...,Ns,周期信号数据s(m)的基频μx属于基频集合S,Ns为数据采样点数;
步骤3、按照帧长Lf、帧移Lo对周期信号数据s(m)进行分帧,得到包含Nf个数据帧的数据帧集合:
步骤4、对每一帧数据xi(n),i=1,2,...,Nf,n=1,2,...,Lf,使用倒谱法提取出基频估计值ffi
单帧信号xi(n)帧长Lf,采样频率Fs,针对其倒谱法基频提取过程如下:
4.1、使用快速傅里叶变换(FFT)得到xi(n)的频谱X(ω):
X(ω)=FFT[x(n)],ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.2、依据频谱X(ω)计算得到幅值谱Xa(ω):
Xa(ω)=|X(ω)|,ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.3、依据幅值谱Xa(ω)计算得到幅值对数谱Xl(ω):
Xl(ω)=log[Xa(ω)],ω=0,Fs/Lf,...,(Lf-1)*Fs/Lf
4.4、将幅值对数谱Xl(ω)进行快速傅里叶逆变换(IFFT)得到倒谱
4.5、根据基频检索频率的范围[fmin,fmax],计算得到倒谱索引范围[nl,nr]:
nl=Fs/fmax,nr=Fs/fmin
4.6、在倒谱序列的索引范围[nl,nr]中,找到最大值及对应的索引:
4.7、根据ntop计算得到第i帧数据的基频的估计值ffi
ffi=Fs/ntop
最终将所有帧的基频估计值组成基频估计值序列{ffi},i=1,2,...,Nf
步骤5、求基频估计值序列{ffi}的均值:
步骤6、依据贝叶斯决策得到准确的基频μx,即:
CN201611205653.9A 2016-12-23 2016-12-23 基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法 Active CN106610451B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611205653.9A CN106610451B (zh) 2016-12-23 2016-12-23 基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611205653.9A CN106610451B (zh) 2016-12-23 2016-12-23 基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法

Publications (2)

Publication Number Publication Date
CN106610451A CN106610451A (zh) 2017-05-03
CN106610451B true CN106610451B (zh) 2019-01-04

Family

ID=58636695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611205653.9A Active CN106610451B (zh) 2016-12-23 2016-12-23 基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法

Country Status (1)

Country Link
CN (1) CN106610451B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324232A (zh) * 2011-09-12 2012-01-18 辽宁工业大学 基于高斯混合模型的声纹识别方法及系统
CN102982634A (zh) * 2012-11-13 2013-03-20 上海交通大学 音视频融合的人员入侵检测方法
CN103530432A (zh) * 2013-09-24 2014-01-22 华南理工大学 一种具有语音提取功能的会议记录器及语音提取方法
CN103871424A (zh) * 2012-12-13 2014-06-18 上海八方视界网络科技有限公司 一种基于贝叶斯信息准则的线上说话人聚类分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324232A (zh) * 2011-09-12 2012-01-18 辽宁工业大学 基于高斯混合模型的声纹识别方法及系统
CN102982634A (zh) * 2012-11-13 2013-03-20 上海交通大学 音视频融合的人员入侵检测方法
CN103871424A (zh) * 2012-12-13 2014-06-18 上海八方视界网络科技有限公司 一种基于贝叶斯信息准则的线上说话人聚类分析方法
CN103530432A (zh) * 2013-09-24 2014-01-22 华南理工大学 一种具有语音提取功能的会议记录器及语音提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于对数能量倒谱特征的端点检测算法;王民等;《计算机工程与应用》;20140831;第50卷(第16期);正文第198-201、215页 *
自动音乐标注系统多基频估计方法研究;郭奕;《中国优秀硕士学位论文全文数据库信息科技辑》;20131231(第12期);正文第1-109页 *

Also Published As

Publication number Publication date
CN106610451A (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
CN108962237B (zh) 混合语音识别方法、装置及计算机可读存储介质
CN110739002B (zh) 基于生成对抗网络的复数域语音增强方法、系统及介质
CN104732978B (zh) 基于联合深度学习的文本相关的说话人识别方法
CN104485103B (zh) 一种基于矢量泰勒级数的多环境模型孤立词识别方法
CN105047194B (zh) 一种用于语音情感识别的自学习语谱图特征提取方法
CN105096955B (zh) 一种基于模型生长聚类的说话人快速识别方法及系统
CN110176250B (zh) 一种基于局部学习的鲁棒声学场景识别方法
CN110164465B (zh) 一种基于深层循环神经网络的语音增强方法及装置
CN107392123B (zh) 一种基于相参积累消噪的射频指纹特征提取和识别方法
CN1650349A (zh) 用于抗噪声语音识别的在线参数直方图正态化
CN108922513A (zh) 语音区分方法、装置、计算机设备及存储介质
CN109269547A (zh) 基于线谱的水下目标舰船检测方法
CN107464563B (zh) 一种语音交互玩具
CN108962229A (zh) 一种基于单通道、无监督式的目标说话人语音提取方法
CN108198558B (zh) 一种基于csi数据的语音识别方法
CN107369451B (zh) 一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法
CN110544482A (zh) 一种单通道语音分离系统
CN110211609A (zh) 一种提升语音识别准确率的方法
CN108172220A (zh) 一种新型语音除噪方法
CN109598175A (zh) 一种基于多小波基函数和超正交前向回归的时频分析方法
CN108173792B (zh) 基于差分星座轨迹图的无线设备瞬态特征提取与识别方法
CN106610451B (zh) 基于倒谱及贝叶斯决策的周期信号基频提取与匹配方法
Ravindran et al. Improving the noise-robustness of mel-frequency cepstral coefficients for speech processing
CN106803089A (zh) 基于非线性主分量分析从图像序列中分离图像信息的方法
CN107341519B (zh) 一种基于多分辨率分析的支持向量机识别优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant