CN114822567A

CN114822567A - 一种基于能量算子的病理嗓音频谱重构方法

Info

Publication number: CN114822567A
Application number: CN202210707979.0A
Authority: CN
Inventors: 张涛; 刘赣俊; 赵鑫
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2022-06-22
Filing date: 2022-06-22
Publication date: 2022-07-29
Anticipated expiration: 2042-06-22
Also published as: CN114822567B

Abstract

本发明提供了一种基于能量算子的病理嗓音频谱重构方法，包括病理嗓音信号基频自适应加窗、计算功率谱、重构功率谱、功率谱的频域平滑处理、计算功率倒频谱、同态滤波以及计算频谱包络。本发明公开的一种基于能量算子的病理嗓音频谱重构方法，改善了病理嗓音频谱分量过于分散的问题，能够有效提取嗓音的主要信息、频谱分量和峰值，获得重构的病理嗓音频谱包络，解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

Description

一种基于能量算子的病理嗓音频谱重构方法

技术领域

本发明属于信息技术领域，尤其是涉及一种基于能量算子的病理嗓音频谱重构方法。

背景技术

病理嗓音是指由于声带组织发生病变，声带张力变小，同时声道结构功能性改变导致声带不规则振动、声门出现高次谐波、信号周期性发生改变、幅度及其频率出现波动的嗓音。病理嗓音修复是嗓音障碍研究领域的一个新方向，旨在通过修复病理嗓音信号提高语音可懂度，通过非侵入式的语音信号处理技术修复病理嗓音，可以提高病理嗓音信号的清晰度和可懂度，帮助嗓音疾病患者体验更为便利的语音交互。

发声系统的数学模型分为激励、声道和辐射共三个子模型。嗓音疾病影响的发声器官对应的是激励模型和声道模型。对于激励模型，基频表征嗓音的音调高低，是激励模型中描述声带振动频率重要的特征参数。对于声道模型，共振峰的位置、宽度、幅度等是声道参数中影响元音音色的重要参数。对于整个发声系统而言，频谱包络可以勾勒整段语音的主要信息，同时包含频谱分量、峰值幅度等主要参数。

传统的激励模型提取算法虽然具有计算复杂度低的优点，但是在提取过程中会出现峰值突变，导致二次倍频和分频错误，提取声道参数时，对纯净嗓音信号检测有效，但是在计算复杂的滤除声道卷积信号时容易发生误差，存在传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

发明内容

有鉴于此，本发明旨在提出一种基于能量算子的病理嗓音频谱重构方法，改善了病理嗓音频谱分量过于分散的问题，能够有效提取嗓音的主要信息、频谱分量和峰值，获得重构的病理嗓音频谱包络，解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题。

为达到上述目的，本发明的技术方案是这样实现的：

一种基于能量算子的病理嗓音频谱重构方法，包括:

步骤一: 病理嗓音信号基频自适应加窗：采用长度为mT ₀的汉宁窗w(n)，对病理嗓音信号x(n)进行分段加窗，其中T ₀为病理嗓音信号x(n)的基音周期，m为大于零的整数，n为时域变量；

步骤二: 计算功率谱：计算步骤一中使用汉宁窗w(n)加窗的病理嗓音信号x(n)的功率谱

，其中

为角频率；

步骤三: 重构功率谱：进一步对功率谱

进行非线性变换得到Teager能量算子

，再对能量算子

幅值归一化得到重构功率谱

；

步骤四：功率谱的频域平滑处理：进一步通过一个的矩形窗，对重构功率谱

进行频域平滑处理，得到平滑后的功率谱

；

步骤五：计算功率倒频谱：计算功率谱

的功率倒频谱

；

步骤六：同态滤波：使用同态滤波函数对功率倒频谱

进行平滑滤波和频谱恢复，得到同态滤波后的倒频谱

；

步骤七：计算频谱包络：对倒频谱

使用傅里叶逆变换得到重构的病理嗓音频谱包络

。

相对于现有技术，本发明所述的一种基于能量算子的病理嗓音频谱重构方法，具有以下优势：

本发明公开了一种基于能量算子的病理嗓音频谱重构方法，改善了病理嗓音频谱分量过于分散的问题，能够有效提取嗓音的主要信息、频谱分量和峰值，获得重构的病理嗓音频谱包络，解决了传统嗓音分析方法对病理嗓音的参数提取总是失效的问题，具有提取效果好，适用性强的特点。

附图说明

构成本发明的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

在附图中：

图1为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法流程示意图；

图2为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法重构前示意图；

图3为本发明实施例所述的一种基于能量算子的病理嗓音频谱重构方法重构后示意图。

具体实施方式

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以通过具体情况理解上述术语在本发明中的具体含义。

下面将参考附图并结合实施例来详细说明本发明。

如图1所示，一种基于能量算子的病理嗓音频谱重构方法，包括:

在本实施例中，病理嗓音信号x(n)选自MEEI语音库中元音/a/，每个元音采样率为8kHz，m=3，帧移为128。

，其中

为角频率；

步骤三: 重构功率谱：进一步对功率谱

进行非线性变换得到Teager能量算子

，再对能量算子

幅值归一化得到重构功率谱

；

进行频域平滑处理，得到平滑后的功率谱

；

步骤五：计算功率倒频谱：计算功率谱

的功率倒频谱

；

步骤六：同态滤波：使用同态滤波函数对功率倒频谱

进行平滑滤波和频谱恢复，得到同态滤波后的倒频谱

；

步骤七：计算频谱包络：对倒频谱

使用傅里叶逆变换得到重构的病理嗓音频谱包络

。

进一步的，在步骤二中：

的计算过程如下：

通过上述关系式，利用快速傅里叶变换可以得到功率谱

，其中T ₀为病理嗓音信号x(n)的基音周期，m为大于零的整数，n为时域变量。

进一步的，步骤三中:

对功率谱

进行非线性变换得到Teager能量算子

如下：

幅值归一化得到重构功率谱

如下:

其中，

是Teager能量算子

的最大值，

是 Teager能量算子

的最小值，

为角频率。

进一步的，步骤四中，矩形窗宽度为

，功率谱

如下计算得到：

其中

，

为中间变量，

为角频率，m为大于零的整数。

进一步的，在步骤五中，因为周期为T ₀的时域信号的频谱是周期为

的频域信号，功率倒频谱

如下计算得到：

其中，

是傅里叶逆变换，

是倒频率。

进一步的，在步骤六中：

如下计算得到：

其中，同态滤波函数

用于平滑信号，同态滤波函数

用于频谱恢复，

为基音频率，

与

为设定的参数，

是倒频率。

在本实施例中，

=1.18；

=-0.09。

进一步的，在步骤七中，

如下计算得到：

其中，F是傅里叶逆变换，

为角频率。

如图2以及图3所示，功率谱重构后信号能量集中于主要频谱分量，重构效果明显，信号特征明显好于重构前的病理嗓音信号，原本过于分散的频谱能量得以集中，重构后的频谱包络可以直接观察得到共振峰。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。