CN112102849A

CN112102849A - 一种声音分析方法及装置

Info

Publication number: CN112102849A
Application number: CN201910529938.5A
Authority: CN
Inventors: 徐帆; 邹显巍; 蒲婷婷; 李广; 陈俊男
Original assignee: Chengdu Medical College
Current assignee: Chengdu Medical College
Priority date: 2019-06-18
Filing date: 2019-06-18
Publication date: 2020-12-18

Abstract

本发明公开一种声音分析方法及装置，包括：采集声音样本；从所述声音样本中提取声音参数；将所述声音参数与预先设定的对照参数进行对比，获取所述声音参数与所述对照参数之间的偏差；若所述偏差超过预定阈值，判定所述声音样本具有预定的疾病特征。本发明提供的技术方案，能够辅助医生进行帕金森疾病的诊断。

Description

一种声音分析方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种声音分析方法及装置。

背景技术

帕金森疾病(Parkinson’s Disease，PD)是世界第二大神经退行性疾病，患者不仅患有运动障碍，也伴随着构音障碍、便秘、直立性低血压等非运动障碍。

目前，对于该疾病的确诊完全依靠医生的临床经验，且对于该疾病严重程度的诊断还依赖于传统的量表评分形式。显然，这种方式操作复杂、主观性强、准确性不足。

发明内容

本发明旨在提供一种声音分析方法及装置，通过对患者的声音样本进行分析来辅助医生进行帕金森疾病的诊断。

为达到上述目的，本发明采用的技术方案如下：

一种声音分析方法，包括：采集声音样本；从所述声音样本中提取声音参数；将所述声音参数与预先设定的对照参数进行对比，获取所述声音参数与所述对照参数之间的偏差；若所述偏差超过预定阈值，判定所述声音样本具有预定的疾病特征。

进一步地，还包括：根据所述偏差，判定所述预定的疾病特征的严重程度。

进一步地，所述声音样本包括：单音节样本，双音节样本，多音节样本。

进一步地，所述声音参数包括：起始频率，结束频率，中间频率，均值频率，最大频率，最小频率，信噪比，持续发音时间，基抖动频率，最大频率至结束频率的斜率，起始频率至最大频率的斜率，发音强度。

一种声音分析装置，包括：采集单元，用于采集声音样本；提取单元，用于从所述声音样本中提取声音参数；比较单元，用于将所述声音参数与预先设定的对照参数进行对比，获取所述声音参数与所述对照参数之间的偏差；第一判定单元，用于当所述偏差超过预定阈值时，判定所述声音样本具有预定的疾病特征。

进一步地，还包括：第二判定单元，用于根据由所述比较单元所获取的所述偏差，判定所述预定的疾病特征的严重程度。

进一步地，所述声音参数包括：起始频率，结束频率，中间频率，均值频率，最大频率，最小频率，信噪比，持续发音时间，抖动频率，最大频率至结束频率的斜率，起始频率至最大频率的斜率，发音强度。

本发明实施例提供的声音分析方法及装置，通过提取声音样本中的声音参数，并将声音参数与预先设定的对照参数进行对比，获取声音参数与对照参数之间的偏差，同时设置了预定阈值，使得能够根据该偏差来判定采集的声音样本是否具有疾病特征。此外，还可根据该偏差，判定疾病的严重程度。可见，本发明的技术方案，能够通过对患者的声音样本进行分析来辅助医生进行帕金森疾病的诊断。

附图说明

图1为本发明实施例的方法流程图一；

图2为本发明实施例的方法流程图二；

图3为本发明实施例的装置结构图一；

图4为本发明实施例的装置结构图二；

图5为本发明实施例中单音节样本声音参数与对照参数的对比结果；

图6为本发明实施例中双音节样本声音参数与对照参数的对比结果；

图7为本发明实施例中多音节样本声音参数与对照参数的对比结果。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对本发明进行进一步详细说明。

图1为本发明实施例的方法流程图一，包括：

步骤101，采集声音样本；

步骤102，从所述声音样本中提取声音参数；

步骤103，将所述声音参数与预先设定的对照参数进行对比，获取所述声音参数与所述对照参数之间的偏差；

步骤104，若所述偏差超过预定阈值，判定所述声音样本具有预定的疾病特征。

本实施例中，还包括：

步骤105，根据所述偏差，判定所述预定的疾病特征的严重程度。

本实施例中，所述声音样本包括：单音节样本，双音节样本，多音节样本。

本实施例中，所述声音参数包括：起始频率，结束频率，中间频率，均值频率，最大频率，最小频率，信噪比，持续发音时间，抖动频率，最大频率至结束频率的斜率，起始频率至最大频率的斜率，发音强度。

图5为本发明实施例中单音节样本声音参数与对照参数的对比结果。在本次实验中使用了12个单音节测试样本，其中元音“a”，“o”，“e”平均分布。在男性中，PD组的起始频率高于对照组，但在女性中结果相反。无论是男性和还是女性，PD组和对照组之间的平均频率和结束频率都没有显著差异。更有趣的是，最大频率在男性中表现出PD组低于对照组，但在女性中其结果恰恰相反。此外，PD组中男性和女性信噪比值(取绝对值后)均低于正常组。

图6为本发明实施例中双音节样本声音参数与对照参数的对比结果。本次实验总共使用了8个双音节测试样本。无论是PD组男性还是女性，起始频率都是高于正常组；平均频率仅在女性PD组中显示出高于对照组的现象。男、女PD组中的最小频率均高于对照组。相反，男、女PD组的最大频率低于对照组。虽然在男性PD组中，结束频率低于对照组，但是女性PD组中结束频率无差异。与单音节测试结果相似，信噪比在男、女PD组中(取绝对值后)也低于对照组。此外，男、女PD组的持续发音持续时间比对照组短。

图7为本发明实施例中多音节样本声音参数与对照参数的对比结果。本次实验采用6个多音节测试样本。与单音节和双音节测试结果类似，男、女PD组的起始频率高于对照组，平均频率仅在女性PD组中表现出高于对照组的现象。在PD组和对照组之间的平均频率没有显著差异。有意义的是，男、女PD组的最小频率均高于对照组。相反，男、女PD组的最大频率低于对照组。同样，信噪比在男、女PD组中(取绝对值后)也低于对照组。在男、女PD组中说话的持续时间均比对照组短。

即，我们可根据上述声音参数与对照参数的对比结果来判定患者是否患有帕金森疾病，以及患病的严重程度。

本发明通过Matlab软件使声音数字化，对声音进行代表性参数提取，结果形象直观，准确全面且可靠度更高，过程比传统语音方法更加简单便捷。由于声音频率参数能够反应病人面部和喉部肌张力障碍，以及对声带控制能力。因此，本专利通过采集帕金森病人和正常人声音样本，并进行声音参数提取，组间比较。我们发现帕金森病人整体起始频率数值呈现升高，表明帕金森病人起始发声困难，肌张力高于正常人。最小频率数值整体呈现升高，最大频率数值整体呈现降低，这一现象反映出帕金森病人音域范围减小，肌肉和声带柔软度降低。信噪比HNR量化语音信号中附加噪音的相对数量，是对病人声门开合程度以及声音嘶哑程度的判断。帕金森病人发音时声带不完全闭合导致声门内气流增加，引起气流紊乱，产生的摩擦噪音，反映出较高的噪音水平。帕金森患者组相对于正常组的信噪比降低，表示声音的嘶哑程度越高。持续发音时间是病人自身计时组织功能和节奏感的反应。在PD组中，发声持续时间明显降低，这与帕金森病人说话停顿、无节奏感、语速加快这一临床现象完全符合。声音参数中的抖动频率表示，语音基频从一个周期到下一个周期的变化。

本发明还公开一种声音分析装置，包括：采集单元，用于采集声音样本；提取单元，用于从所述声音样本中提取声音参数；比较单元，用于将所述声音参数与预先设定的对照参数进行对比，获取所述声音参数与所述对照参数之间的偏差；第一判定单元，用于当所述偏差超过预定阈值时，判定所述声音样本具有预定的疾病特征。

本实施例中，所述声音参数包括：起始频率，结束频率，中间频率，均值频率，最大频率，最小频率，信噪比，发音持续时间，抖动频率，最大频率至结束频率的斜率，起始频率至最大频率的斜率，发音强度。

本发明实施例，所提供的声音分析方法及装置，通过提取声音样本中的声音参数，并将声音参数与预先设定的对照参数进行对比，获取声音参数与对照参数之间的偏差，同时设置了预定阈值，使得能够根据该偏差来判定采集的声音样本是否具有疾病特征。此外，还可根据该偏差，判定疾病的严重程度。可见，本发明的技术方案，能够通过对患者的声音样本进行分析来辅助医生进行帕金森疾病的诊断。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。

Claims

1.一种声音分析方法，其特征在于，包括：

采集声音样本；

从所述声音样本中提取声音参数；

将所述声音参数与预先设定的对照参数进行对比，获取所述声音参数与所述对照参数之间的偏差；

若所述偏差超过预定阈值，判定所述声音样本具有预定的疾病特征。

2.根据权利要求1所述的声音分析方法，其特征在于，还包括：

根据所述偏差，判定所述预定的疾病特征的严重程度。

3.根据权利要求1所述的声音分析方法，其特征在于，所述声音样本包括：单音节样本，双音节样本，多音节样本。

4.根据权利要求1所述的声音分析方法，其特征在于，所述声音参数包括：起始频率，结束频率，中间频率，均值频率，最大频率，最小频率，信噪比，持续发音时间，抖动频率，最大频率至结束频率的斜率，起始频率至最大频率的斜率，发音强度。

5.一种声音分析装置，其特征在于，包括：

采集单元，用于采集声音样本；

提取单元，用于从所述声音样本中提取声音参数；

比较单元，用于将所述声音参数与预先设定的对照参数进行对比，获取所述声音参数与所述对照参数之间的偏差；

第一判定单元，用于当所述偏差超过预定阈值时，判定所述声音样本具有预定的疾病特征。

6.根据权利要求5所述的声音分析装置，其特征在于，还包括：

第二判定单元，用于根据由所述比较单元所获取的所述偏差，判定所述预定的疾病特征的严重程度。

7.根据权利要求5所述的声音分析装置，其特征在于，所述声音样本包括：单音节样本，双音节样本，多音节样本。

8.根据权利要求5所述的声音分析装置，其特征在于，所述声音参数包括：起始频率，结束频率，中间频率，均值频率，最大频率，最小频率，信噪比，持续发音时间，抖动频率，最大频率至结束频率的斜率，起始频率至最大频率的斜率，发音强度。