CN109410980A

CN109410980A - 一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用

Info

Publication number: CN109410980A
Application number: CN201811494641.1A
Authority: CN
Inventors: 张维维
Original assignee: Dalian Nationalities University
Current assignee: Dalian Minzu University
Priority date: 2016-01-22
Filing date: 2016-01-22
Publication date: 2019-03-01
Also published as: CN109493880A; CN105551501B; CN105551501A; CN109524023A

Abstract

本分案申请公开了一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用，属于信号处理领域，为了解决快速、准确提取基频，并减少频谱泄露对高频谱峰的影响的问题，技术要点所述音频谐波信号基频估计算法，用常Q变换实现多分辨率谱估计，基于谐波求和能量定义折叠谐波求和谱，并将其用于初步基频筛选，通过最大后验概率法实现基频估计，效果是减少频谱泄露对高频谱峰的影响。

Description

一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用

本申请是申请号201610044926.X，申请日2016-01-22，发明名称“谐波信号基频估计算法及装置”的分案申请。

技术领域

本发明属于信号处理领域，涉及一种谐波信号基频估计算法。

背景技术

目前常用的基频估计算法包括自相关法、倒谱法、小波变换法、谐波求和法等。自相关法具有原理简单、易于实现的优点，但其计算量随着每帧信号长度成平方倍增。倒谱法在语音切换时，由于信噪比减小常导致倒谱峰严重偏离基频。小波变换法通过检测声门闭合时信号特征突变推算出基因周期，但小波变换中的多个阈值难以准确选择。谐波求和方法仅考虑到各次谐波幅度加权求和，而没有考虑到各次谐波频率可能会稍微偏离谐波整数倍，频谱泄露现象导致高频范围内信号的伪峰数量增加，及部分高频分量会被低频分量的旁瓣掩埋。

公开号为CN1342968A的中国发明专利申请公开了一种用于语音识别的高精度高分辨率基频提取方法，并具体记载了基频提取方法中具有信号分割、加窗、确定基频候选、过滤具有过低的H_per值或R_per值的步骤，最后用DP算法求基频路径。其目的是可以在时域上，对候选基频进行相关系数评测。然而，该种做法提取基频候选时，虽然可以减少DP的运算量，但是，该发明属于自相关法，仍具有计算量大，提取速度慢的缺点。

发明内容

为了解决快速、准确提取基频，并减少频谱泄露对高频谱峰的影响的问题，本发明提出了一种谐波信号基频估计算法，以提高基频提取的速度和准确性。

为了实现上述目的，本发明采用的技术方案是：一种谐波信号基频估计算法，包括：S1.对音频谐波信号作常Q变换，得常Q变换谱；S2.使用常Q变换谱计算得折叠谐波求和谱；S3.由折叠谐波求和谱的谱峰初步筛选基频；S4.建立基频候选的后验概率密度函数，根据最大后验概率准则提取并输出谐波信号基频。

有益效果：本发明所述音频谐波信号基频估计算法，用常Q变换实现多分辨率谱估计，基于常Q变换谱定义折叠谐波求和谱，并将其用于初步基频筛选。通过最大后验概率法实现基频估计，其中先验概率由折叠谐波求和谱求出，似然函数由谐波谱峰与观测频谱的匹配度确定。

音频谐波信号基频估计是信号处理领域的一项关键技术，在语音识别、音乐信号处理、水声信号处理等方面具有重要作用，本发明提出的基频估计算法可应用到各类具有谐波结构的信号的基频估计中，提出的方法能够实现频谱多分辨率分析，提出折叠谐波求和谱作为基频的初步筛选，采用最大后验概率法估计基频。该方法充分利用频谱提供的能量、谐波性、谱匹配性等信息，实现基频估计，具有运算速度快，参数少，鲁棒性强的特点。

附图说明

图1是实施例10中的一帧音乐信号图示；

图2是实施例10中的音乐信号的常Q变换谱；

图3是实施例10中的折叠谐波求和谱；

图4是实施例10中的基频后验概率密度谱；

图5是实施例11中的时域信号图示；

图6是实施例11中的常Q变换谱；

图7是实施例11中的折叠谐波求和谱；

图8是实施例11中的基频后验概率密度谱；

图9是本发明所述方法的软件流程图。

具体实施方式

实施例1:一种谐波信号基频估计算法，包括步骤：

S1.对音频谐波信号作常Q变换，得常Q变换谱；

S2.使用常Q变换谱计算得折叠谐波求和谱；

S3.由折叠谐波求和谱的谱峰初步筛选基频；

S4.建立基频候选的后验概率密度函数，根据最大后验概率准则提取并输出谐波信号基频。

本发明所述音频谐波信号基频估计算法，用常Q变换实现多分辨率谱估计，基于谐波求和能量定义折叠谐波求和谱，并将其用于初步基频筛选。通过最大后验概率法实现基频估计，其中先验概率由折叠谐波求和谱求出，似然函数由谐波谱峰与频谱的匹配度确定。

实施例2:具有与实施例1相同的技术方案，更为具体的，常Q变换前，可以先对音频谐波信号进行分频，加窗处理。

在所述步骤S1中，先对输入的非平稳音频谐波信号作分帧处理，然后给短时分帧信号加汉宁窗抑制旁瓣幅度，窗口长度与常Q变换的时间窗宽度一致。

实施例3:具有与实施例1或2相同的技术方案，更为具体的，所述步骤S3中，筛选规则为选取折叠谐波求和谱中的至少前3个极大值对应的频率作为候选基频，本实施例选择前3个极大值作为候选基频，实验中，候选基频数量增加，可以提高准确度，而选取3个，其准确度已经非常高。

实施例4:具有与实施例1或2或3相同的技术方案，更为具体的，步骤S1中，是根据人耳听觉特性，计算对数频率域常Q变换谱，该常Q变换谱为：

(1)式中，Q是品质因子，其为常数，N[k]为常Q变换在第k个频点对应的时间窗宽度，(1)式中，x(l,m)表示第l帧信号中的序号为m的采样点；设x₁(n),n＝0,1,....M-1表示长度为M，采样率为F_s的音频信号，把该音频信号截断为每段长度为N[k]的帧，若帧移为L，则第l帧信号可以表示为：

x(l,m)＝x₁(m+lL),m＝0,1,...N[k]-1 (2)

(1)式中，w_N[k](m)表示长度为N[k]的汉宁窗，即：

实施例5:具有与实施例1或2或3或4相同的技术方案，更为具体的，折叠谐波求和谱定义为：

其中：h为谐波次数，H为最高次谐波，0＜α＜1，X_Q(k,l)为常Q变换谱，round(·)运算结果等于最近的整数，假设每倍频程取Oct个点，常Q变换分析的最低频率分量为f_min，最高频率分量为f_max，则其中ceil(·)运算结果等于正无穷方向最近的整数，常Q变换的第k个频率点对应的频率为：

实施例6:具有与实施例1或2或3或4或5相同的技术方案，更为具体的，基频后验概率密度定义为：

其中：F_i,l为第l帧的第i个基频候选，上式中p(F_i,l)为第l帧第i个基频F_i,l的先验概率，定义p(F_i,l)＝X_c(F_i,l,l)；上式中p(X_c(f_k,l)|F_i,l)量测给定基频F_i,l得到观测常Q频谱的概率。

实施例7：具有与实施例1或2或3或4或5相同的技术方案，更为具体的，定义：

其中:

(8)式中β＝0.03，若常Q谱中基频候选F_i,l的第h次谐波是谱峰则γ_l(h,F_i,l)为1，否则为0，故表征第l帧常Q谱中所包含的前H次谐波分量的数量。类似地，若X_Q(k,l)是谱峰则λ_l(k)为1，否则为0，故表征第l帧常Q谱中F_i,l的前H次谐波频率范围内的所有谱峰数。

折叠谐波求和谱是基频及各次谐波分量的归一化加权和，设基频为F₀，则折叠谐波求和谱在F₀位置处的函数值为常Q变换在F₀,2F₀,3F₀,...,HF₀等处幅度的归一化加权和；折叠谐波求和谱在2F₀位置处的函数值为常Q变换在2F₀,4F₀,6F₀,...,2HF₀等处幅度的归一化加权和。日常语音、音乐等信号主要能量集中在低频段，故即使常Q变换基频幅度小于二次谐波幅度，其折叠谐波求和谱也能在基频位置处得到较大输出。由折叠谐波求和谱中的前几个峰值得到基频候选，能够实现基频的初步筛选。

最大后验概率密度函数中的第一项定义为p(F_i,l)＝X_c(F_i,l,l)，即折叠谐波求和谱在F_i,l处的幅度，p(F_i,l)取折叠谐波求和谱而非常Q变换谱是因为有时候某些谐波分量的幅度会超过基频的幅度，而即使谐波幅度高于基频幅度的时候，折叠谐波求和谱在基频位置处的值仍大于高次谐波处的值，进而提高基频估计的准确率，降低误判率。

实施例8:具有与实施例1或2或3或4或5或6或7相同的技术方案，更为具体的，基频估计公式为：

实施例9:一种谐波信号基频估计算法，包括如下步骤：

1.对音频谐波信号作常Q变换，得常Q变换谱,该常Q变换谱为：

x(l,m)＝x₁(m+lL),m＝0,1,...N[k]-1 (2)

(1)式中，w_N[k](m)表示长度为N[k]的汉宁窗，即：

2.由常Q变换谱求折叠谐波求和谱，即：

3.从折叠谐波求和谱中得到3个最大峰值对应的频率作为基频候选，然后求各基频候选的后验概率密度，即：

其中：F_i,l为第l帧的第i个基频候选，p(F_i,l)为第l帧第i个基频F_i,l的先验概率，定义为p(F_i,l)＝X_c(F_i,l,l)，即折叠谐波求和谱在F_i,l处的幅度。p(X_c(f_k,l)|F_i,l)量测给定基频F_i,l得到观测常Q频谱的似然函数，该似然函数定义为：

其中:

(8)式中β＝0.03，若常Q谱中基频候选F_i,l的第h次谐波是谱峰则γ_l(h,F_il)为1，否则为0，故表征第l帧常Q谱中所包含的前H次谐波分量的数量。类似地，若X_Q(k,l)是谱峰则λ_l(k)为1，否则为0，故表征第l帧常Q谱中F_i,l的前H次谐波频率范围内的所有谱峰数。

实施例10：本实施例对上述各实施例中的对基频估计的方法，进行实验验证：

本实施例实验是使用了上述实施例基频估计方法，对一帧音乐信号进行了基频估计，并仿真得到图1-图4，本实施例验证的情形是：信号中基频分量的幅度大于二次谐波幅度。

附图1是一帧音乐信号。

附图2是上述音乐信号的常Q变换谱:通过常Q变换谱可见有丰富的谐波分量。各次谐波分量可以清楚的看出来，常Q谱仅在各频率分量处有很窄的谱线，频谱泄露不明显。

附图3是折叠谐波求和谱：折叠谐波求和谱能增加基频和各次谐波分量的差异。从中选出具有最大折叠谐波幅度的三个频率作为候选基频，本图中被选出来的候选基频分别对应原时域信号的基频、二次谐波和三次谐波分量，然后求这三个候选基频的后验概率密度。

附图4是基频后验概率密度谱：把具有最大后验概率密度的候选基频，即181.45Hz频率被选为最终的基频，与事实吻合。

从附图1-附图4可见常Q变换能有效抑制频谱泄露，突出信号中的各个频率分量。本发明步骤(2)-(4)都基于常Q谱，且折叠谐波求和谱中仅取少量(3个)具有较大折叠谐波求和能量的基频候选参与最大后验概率密度计算，具有较少的运算量，计算复杂度低，可快速实现。实验结果表明，由于谐波信号具有良好的谐波性，构建的最大后验概率函数能准确映射出候选基频的各次谐波与观测频谱的匹配关系，能准确筛选出谐波信号的基频。

实施例11：本实施例适用的实验情形是：一帧音乐信号中基频分量的幅度小于二次谐波幅度。

该帧音乐信号时域信号如图5所示；

常Q变换谱如图6所示；

折叠谐波求和谱如图7所示，虽然实际基频分量的幅度小于二次谐波分量的幅度，但折叠谐波求和谱中基频对应的幅度已经被大幅度放大，并超过二次谐波的幅度；

基频后验概率密度谱如图8所示；由上述实验附图可见，在基频幅度小于谐波幅度的情况下，本方法仍能够准确估计出基频。

实施例12:一种谐波信号基频估计装置，包括：常Q变换模块，对音频谐波信号作常Q变换，得常Q变换谱；折叠谐波求和谱计算模块，使用常Q变换谱计算得折叠谐波求和谱；初步筛选基频模块，由折叠谐波求和谱的谱峰初步筛选基频；

谐波信号基频输出模块，建立基频候选的后验概率密度函数，根据最大后验概率准则提取并输出谐波信号基频。本实施例所述的装置，用以执行实施例1-9所述的方法，实施例1-9中的技术方案适用于本实施例。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基频估计算法在各类具有谐波结构的信号的基频估计中的应用。

2.如权利要求1所述的应用，其特征在于：所述音频谐波信号基频估计算法，用常Q变换实现多分辨率谱估计，基于谐波求和能量定义折叠谐波求和谱，并将其用于初步基频筛选，通过最大后验概率法实现基频估计。

3.如权利要求2所述的应用，其特征在于：先验概率由折叠谐波求和谱求出，似然函数由谐波谱峰与频谱的匹配度确定。

4.一种基频估计算法在语音识别、音乐信号处理、水声信号处理中的应用。