CN108520759B

CN108520759B - 用于帕金森病语音检测的时频特征图像提取方法

Info

Publication number: CN108520759B
Application number: CN201810329076.7A
Authority: CN
Inventors: 王波; 赵彦平; 胡封晔; 张颖
Original assignee: Jilin University
Current assignee: Jilin University
Priority date: 2018-04-13
Filing date: 2018-04-13
Publication date: 2021-05-11
Anticipated expiration: 2038-04-13
Also published as: CN108520759A

Abstract

本发明公开了用于帕金森病语音检测的时频特征图像提取方法,为克服现有技术不能全面反映帕金森病语音的特点，增加了分类方法进行帕金森病语音检测难度的问题，步骤：1)对语音信号进行预处理；2)对语音信号进行时频特征提取：(1)对预处理后的语音信号进行短时离散傅里叶变换；(2)频率归一化得到单位频率功率谱时频矩阵；(3)构造线性频率三角形滤波器组；(4)频域滤波；(5)得到幅度谱时频矩阵；3)得到等高线时频特征图像：把幅度谱矩阵上数值最大的点和参考平面之间的距离分成n等份，把数值相等的点连成闭合曲线并垂直投影到参考平面，形成n条等高线时频特征图，把等高线时频特征图转换为JPEG图像，得到等高线时频特征图像。

Description

用于帕金森病语音检测的时频特征图像提取方法

技术领域

本发明涉及信号处理技术领域的时频特征提取方法，更确切地说，本发明涉及一种用于帕金森病语音检测的时频特征图像提取方法。

背景技术

帕金森病是仅次于阿茨海默综合症的第二大神经系统退行性疾病，病因尚不明确，也没有药物能够治疗。该病的主要症状有静止性震颤、步行障碍、肌强直和运动迟缓等。研究表明大多数帕金森病患者具有发音障碍，语言功能退化是首发症状之一，主要表现为基音频率变化、声音颤抖、声音强度降低以及讲话速度异常等。帕金森病患者大多是老年人，随着老龄化社会的到来，该病的比重日益增加，同时患者也有年轻化的趋势。考虑到该疾病发展较慢，及早发现帕金森病，对控制病情发展，提高患者生活质量具有重要意义。

基于语音的帕金森病检测由于方便、经济、具有非入侵等特点而被广泛研究，其过程包括提取语音特征、模型训练和分类三个主要步骤。提取的语音特征包括基音频率、基音频率的变化Jitter、声音幅度的变化Shimmer、能量、倒谱参数以及均值、标准差、偏度和峰度等统计特征。这些特征单独在时频或频域进行提取，不能全面的反映帕金森病语音的特点，增加了分类方法进行帕金森病语音检测的难度。

本发明利用语音幅度谱时频矩阵，提取等高线时频特征图像，该图像能够反映主要传统语音特征，比如基音频率的变化Ji tter，谐波频率的变化，时长等信息，同时又能去除不必要的干扰成份。帕金森病语音等高线时频特征图像能够作为后续实现帕金森病语音检测的图像分类方法的输入数据。

发明内容

本发明所要解决的技术问题是克服了现有语音特征单独在时域或频域进行提取，不能全面反映帕金森病语音的特点，增加了分类方法进行帕金森病语音检测难度的问题，提供了一种用于帕金森病语音检测的时频特征图像提取方法。

为解决上述技术问题，本发明是采用如下技术方案实现的：所述的用于帕金森病语音检测的时频特征图像提取方法的步骤如下：

1)对语音信号进行预处理，步骤如下：

利用语音采集设备在相对安静的环境中采集元音/a/的发音，降采样到固定频率f_s，分帧的帧长为N个采样点，帧移为L个采样点，加窗，得到时域矩阵S^M×N，其中M表示帧数，由语音信号的长度决定；

2)对语音信号进行时频特征提取，步骤如下：

(1)对预处理后的语音信号进行短时离散傅立叶变换，得到短时傅立叶系数的时频矩阵SF^M×NF，其中NF为傅立叶变换的点数；

(2)频率归一化得到单位频率功率谱时频矩阵SP^M×(NF/2+1)＝|SF^M×(NF/2+1)|²/f_s；

(3)构造线性频率三角形滤波器组：

设三角形滤波器组的个数为P，P＝1601,滤波器组在[0,f_s/2]范围内线性分布，中心频率间隔为(f_s/2)/(P-1)Hz，中心频率的增益均为G，相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)＝H(p-1)＝L(p+1)，其中:C(p)表示第p个三角形滤波器的中心频率，H(p-1)为第p-1个三角形滤波器的上限频率，L(p+1)为第p+1个三角形滤波器的下限频率；

(4)单位频率功率谱时频矩阵中每一列分别通过步骤(3)中的线性频率三角形滤波组，得到滤波后的单位频率功率谱时频矩阵SP^M×P，其中P为滤波器的个数；

(5)对SP^M×P进行开方运算，乘以调整参数α进行幅度调整，得到幅度谱时频矩阵

3)得到等高线时频特征图像，步骤如下：

(1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成n等份，n＝10，把数值相等的点连成闭合曲线并垂直投影到数值为5×10^-4的参考平面，形成n条等高线时频特征图；

(2)把等高线时频特征图转换为JPEG图像，得到等高线时频特征图像。

与现有技术相比本发明的有益效果是：

1.本发明所述的用于帕金森病语音检测的时频特征图像提取方法利用语音幅度谱时频矩阵提取等高线时频特征图像，即减少了无用的信息，又很好地体现了基音频率以及各次谐波、能量和时长等主要信息。

2.本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的等高线时频特征图像，具有稀疏的特点，能够减少后续进行模型训练和分类方法的计算量。

附图说明

下面结合附图对本发明作进一步的说明：

图1是本发明所述的用于帕金森病语音检测的时频特征图像提取方法的流程框图；

图2是采用本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的健康语音等高线时频特征图像；

图3是采用本发明所述的用于帕金森病语音检测的时频特征图像提取方法提取的帕金森病语音等高线时频特征图像。

具体实施方式

下面结合附图对本发明作详细的描述：

参阅图1，本发明所述的一种用于帕金森病语音检测的时频特征图像提取方法的步骤为：

1.对语音信号进行预处理，步骤如下：

2.对语音信号进行时频特征提取，步骤如下：

1)对预处理后的语音信号进行短时离散傅立叶变换，得到短时傅立叶系数的时频矩阵SF^M×NF，其中NF为傅立叶变换的点数；

2)频率归一化得到单位频率功率谱时频矩阵SP^M×(NF/2+1)＝|SF^M×(NF/2+1)|²/f_s；

3)构造线性频率三角形滤波器组：

4)单位频率功率谱时频矩阵中每一列分别通过步骤3)中的线性频率三角形滤波组，得到滤波后的单位频率功率谱时频矩阵SP^M×P，其中P为滤波器的个数；

5)对SP^M×P进行开方运算，乘以调整参数α进行幅度调整，得到幅度谱时频矩阵

3.得到等高线时频特征图像，步骤如下：

1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成n等份，n＝10，把数值相等的点连成闭合曲线并垂直投影到数值为5×10^-4的参考平面(曲线颜色越亮表示功率越大)，形成n条等高线时频特征图；

2)把等高线时频特征图转换为JPEG图像，得到等高线时频特征图像。

实施例：

语音信号具有随机性，幅度谱时频矩阵随着输入语音信号不同而发生改变，由幅度谱时频矩阵得到等高线时频特征图像需要利用计算机软件进行画图，本实施例中利用MATLAB仿真软件。帕金森病语音/a/来自UCI机器学习数据库中的帕金森病语音库，健康语音是利用智能手机在安静环境中录制的一段元音/a/。分别对健康语音/a/和帕金森病语音/a/进行等高线时频特征图像提取，步骤如下。

1.对语音信号进行预处理，步骤如下：

采样频率降采样到固定频率f_s＝16KHz，分帧的帧长为N＝1448个采样点，帧移为L＝160个采样点，加汉明窗，得到时域矩阵S^M×N，其中M表示帧数，由语音信号的长度决定；

2.对语音信号进行时频特征提取，步骤如下：

1)对预处理后的语音信号进行短时离散傅立叶变换，傅立叶变换的点数为NF＝8192，得到短时傅立叶系数的时频矩阵SF^M×NF；

3)构造线性频率三角形滤波器组：

设三角形滤波器组的个数为P＝1601，滤波器组在[0,f_s/2]范围内线性分布，中心频率间隔为(f_s/2)/(P-1)Hz，中心频率的增益均为G＝0.35，相邻三角形滤波器之间的下限频率、中心频率和上限频率之间的关系为C(p)＝H(p-1)＝L(p+1)，其中:C(p)表示第p个三角形滤波器的中心频率，H(p-1)为第p-1个三角形滤波器的上限频率，L(p+1)为第p+1个三角形滤波器的下限频率；

4)单位频率功率谱时频矩阵中每一列分别通过步骤3)中的线性频率三角形滤波组，得到滤波后的单位频率功率谱时频矩阵SP^M×P，其中滤波器的个数P＝1601；

5)对SP^M×P进行开方运算,乘以调整参数α＝1进行幅度调整，得到幅度谱时频矩阵

3.得到等高线时频特征图像，步骤如下：

1)把幅度谱时频矩阵上数值最大的点和参考平面之间的距离分成10等份，参考平面的数值设为5×10^-4，把数值相等的点连成闭合曲线并垂直投影到参考平面，形成10条等高线时频特征图；

2)把等高线时频特征图转换为JPEG图像，分别得到健康语音/a/和帕金森病语音/a/的等高线时频特征图像。健康语音等高线时频特征图像仿真图参阅图2,图中水平方向表示时间，垂直方向表示频率，图像中颜色越亮表示信号功率较大，若干横向条纹体现基音频率和各次谐波；帕金森病语音等高线时频特征图像仿真图参阅图3,从图中可以看出等高线时频特征图像在时频域体现了大部分传统帕金森病语音特征，如基于频率的变化Jitter，谐波频率的变化，时长等，同时去除了无用的干扰成份,等高线时频特征图像具有稀疏的特点，背景单一，属于简单图像，减少了后续模型训练和分类方法的计算量；帕金森病语音等高线时频特征图像与健康语音时频特征图像相比较有很大的不同，帕金森病语音的基音频率及各次谐波在频率方向上有很大波动，而且低频段出现干扰，所以利用等高线时频特征图像很容易检测出帕金森病语音。

Claims

1.一种用于帕金森病语音检测的时频特征图像提取方法,其特征在于，所述的用于帕金森病语音检测的时频特征图像提取方法的步骤如下：

1)对语音信号进行预处理，步骤如下：

利用语音采集设备在相对安静的环境中采集元音/a/的发音，降采样到固定频率f_s，分帧的帧长为N个采样点，帧移为L个采样点，加窗，得到时域矩阵S^M×N，其中M表示帧数，由信号的长度决定；

2)对语音信号进行时频特征提取，步骤如下：

(3)构造线性频率三角形滤波器组：

(5)对SP^M×P进行开方运算,乘以调整参数α进行幅度调整，得到幅度谱时频矩阵

α＝1；

3)得到等高线时频特征图像，步骤如下：