CN112102849A - 一种声音分析方法及装置 - Google Patents
一种声音分析方法及装置 Download PDFInfo
- Publication number
- CN112102849A CN112102849A CN201910529938.5A CN201910529938A CN112102849A CN 112102849 A CN112102849 A CN 112102849A CN 201910529938 A CN201910529938 A CN 201910529938A CN 112102849 A CN112102849 A CN 112102849A
- Authority
- CN
- China
- Prior art keywords
- sound
- frequency
- samples
- parameters
- deviation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 18
- 201000010099 disease Diseases 0.000 claims abstract description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims description 9
- 230000002459 sustained effect Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 208000018737 Parkinson disease Diseases 0.000 abstract description 29
- 238000002474 experimental method Methods 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 208000012661 Dyskinesia Diseases 0.000 description 2
- 206010013952 Dysphonia Diseases 0.000 description 2
- 208000010473 Hoarseness Diseases 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 210000004704 glottis Anatomy 0.000 description 2
- 230000033764 rhythmic process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 206010010774 Constipation Diseases 0.000 description 1
- 206010013887 Dysarthria Diseases 0.000 description 1
- 208000001089 Multiple system atrophy Diseases 0.000 description 1
- 206010049816 Muscle tightness Diseases 0.000 description 1
- 206010031127 Orthostatic hypotension Diseases 0.000 description 1
- 206010067672 Spasmodic dysphonia Diseases 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 201000002849 spasmodic dystonia Diseases 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/66—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for extracting parameters related to health condition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明公开一种声音分析方法及装置,包括:采集声音样本;从所述声音样本中提取声音参数;将所述声音参数与预先设定的对照参数进行对比,获取所述声音参数与所述对照参数之间的偏差;若所述偏差超过预定阈值,判定所述声音样本具有预定的疾病特征。本发明提供的技术方案,能够辅助医生进行帕金森疾病的诊断。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种声音分析方法及装置。
背景技术
帕金森疾病(Parkinson’s Disease,PD)是世界第二大神经退行性疾病,患者不仅患有运动障碍,也伴随着构音障碍、便秘、直立性低血压等非运动障碍。
目前,对于该疾病的确诊完全依靠医生的临床经验,且对于该疾病严重程度的诊断还依赖于传统的量表评分形式。显然,这种方式操作复杂、主观性强、准确性不足。
发明内容
本发明旨在提供一种声音分析方法及装置,通过对患者的声音样本进行分析来辅助医生进行帕金森疾病的诊断。
为达到上述目的,本发明采用的技术方案如下:
一种声音分析方法,包括:采集声音样本;从所述声音样本中提取声音参数;将所述声音参数与预先设定的对照参数进行对比,获取所述声音参数与所述对照参数之间的偏差;若所述偏差超过预定阈值,判定所述声音样本具有预定的疾病特征。
进一步地,还包括:根据所述偏差,判定所述预定的疾病特征的严重程度。
进一步地,所述声音样本包括:单音节样本,双音节样本,多音节样本。
进一步地,所述声音参数包括:起始频率,结束频率,中间频率,均值频率,最大频率,最小频率,信噪比,持续发音时间,基抖动频率,最大频率至结束频率的斜率,起始频率至最大频率的斜率,发音强度。
一种声音分析装置,包括:采集单元,用于采集声音样本;提取单元,用于从所述声音样本中提取声音参数;比较单元,用于将所述声音参数与预先设定的对照参数进行对比,获取所述声音参数与所述对照参数之间的偏差;第一判定单元,用于当所述偏差超过预定阈值时,判定所述声音样本具有预定的疾病特征。
进一步地,还包括:第二判定单元,用于根据由所述比较单元所获取的所述偏差,判定所述预定的疾病特征的严重程度。
进一步地,所述声音样本包括:单音节样本,双音节样本,多音节样本。
进一步地,所述声音参数包括:起始频率,结束频率,中间频率,均值频率,最大频率,最小频率,信噪比,持续发音时间,抖动频率,最大频率至结束频率的斜率,起始频率至最大频率的斜率,发音强度。
本发明实施例提供的声音分析方法及装置,通过提取声音样本中的声音参数,并将声音参数与预先设定的对照参数进行对比,获取声音参数与对照参数之间的偏差,同时设置了预定阈值,使得能够根据该偏差来判定采集的声音样本是否具有疾病特征。此外,还可根据该偏差,判定疾病的严重程度。可见,本发明的技术方案,能够通过对患者的声音样本进行分析来辅助医生进行帕金森疾病的诊断。
附图说明
图1为本发明实施例的方法流程图一;
图2为本发明实施例的方法流程图二;
图3为本发明实施例的装置结构图一;
图4为本发明实施例的装置结构图二;
图5为本发明实施例中单音节样本声音参数与对照参数的对比结果;
图6为本发明实施例中双音节样本声音参数与对照参数的对比结果;
图7为本发明实施例中多音节样本声音参数与对照参数的对比结果。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。
图1为本发明实施例的方法流程图一,包括:
步骤101,采集声音样本;
步骤102,从所述声音样本中提取声音参数;
步骤103,将所述声音参数与预先设定的对照参数进行对比,获取所述声音参数与所述对照参数之间的偏差;
步骤104,若所述偏差超过预定阈值,判定所述声音样本具有预定的疾病特征。
本实施例中,还包括:
步骤105,根据所述偏差,判定所述预定的疾病特征的严重程度。
本实施例中,所述声音样本包括:单音节样本,双音节样本,多音节样本。
本实施例中,所述声音参数包括:起始频率,结束频率,中间频率,均值频率,最大频率,最小频率,信噪比,持续发音时间,抖动频率,最大频率至结束频率的斜率,起始频率至最大频率的斜率,发音强度。
图5为本发明实施例中单音节样本声音参数与对照参数的对比结果。在本次实验中使用了12个单音节测试样本,其中元音“a”,“o”,“e”平均分布。在男性中,PD组的起始频率高于对照组,但在女性中结果相反。无论是男性和还是女性,PD组和对照组之间的平均频率和结束频率都没有显著差异。更有趣的是,最大频率在男性中表现出PD组低于对照组,但在女性中其结果恰恰相反。此外,PD组中男性和女性信噪比值(取绝对值后)均低于正常组。
图6为本发明实施例中双音节样本声音参数与对照参数的对比结果。本次实验总共使用了8个双音节测试样本。无论是PD组男性还是女性,起始频率都是高于正常组;平均频率仅在女性PD组中显示出高于对照组的现象。男、女PD组中的最小频率均高于对照组。相反,男、女PD组的最大频率低于对照组。虽然在男性PD组中,结束频率低于对照组,但是女性PD组中结束频率无差异。与单音节测试结果相似,信噪比在男、女PD组中(取绝对值后)也低于对照组。此外,男、女PD组的持续发音持续时间比对照组短。
图7为本发明实施例中多音节样本声音参数与对照参数的对比结果。本次实验采用6个多音节测试样本。与单音节和双音节测试结果类似,男、女PD组的起始频率高于对照组,平均频率仅在女性PD组中表现出高于对照组的现象。在PD组和对照组之间的平均频率没有显著差异。有意义的是,男、女PD组的最小频率均高于对照组。相反,男、女PD组的最大频率低于对照组。同样,信噪比在男、女PD组中(取绝对值后)也低于对照组。在男、女PD组中说话的持续时间均比对照组短。
即,我们可根据上述声音参数与对照参数的对比结果来判定患者是否患有帕金森疾病,以及患病的严重程度。
本发明通过Matlab软件使声音数字化,对声音进行代表性参数提取,结果形象直观,准确全面且可靠度更高,过程比传统语音方法更加简单便捷。由于声音频率参数能够反应病人面部和喉部肌张力障碍,以及对声带控制能力。因此,本专利通过采集帕金森病人和正常人声音样本,并进行声音参数提取,组间比较。我们发现帕金森病人整体起始频率数值呈现升高,表明帕金森病人起始发声困难,肌张力高于正常人。最小频率数值整体呈现升高,最大频率数值整体呈现降低,这一现象反映出帕金森病人音域范围减小,肌肉和声带柔软度降低。信噪比HNR量化语音信号中附加噪音的相对数量,是对病人声门开合程度以及声音嘶哑程度的判断。帕金森病人发音时声带不完全闭合导致声门内气流增加,引起气流紊乱,产生的摩擦噪音,反映出较高的噪音水平。帕金森患者组相对于正常组的信噪比降低,表示声音的嘶哑程度越高。持续发音时间是病人自身计时组织功能和节奏感的反应。在PD组中,发声持续时间明显降低,这与帕金森病人说话停顿、无节奏感、语速加快这一临床现象完全符合。声音参数中的抖动频率表示,语音基频从一个周期到下一个周期的变化。
本发明还公开一种声音分析装置,包括:采集单元,用于采集声音样本;提取单元,用于从所述声音样本中提取声音参数;比较单元,用于将所述声音参数与预先设定的对照参数进行对比,获取所述声音参数与所述对照参数之间的偏差;第一判定单元,用于当所述偏差超过预定阈值时,判定所述声音样本具有预定的疾病特征。
进一步地,还包括:第二判定单元,用于根据由所述比较单元所获取的所述偏差,判定所述预定的疾病特征的严重程度。
本实施例中,所述声音样本包括:单音节样本,双音节样本,多音节样本。
本实施例中,所述声音参数包括:起始频率,结束频率,中间频率,均值频率,最大频率,最小频率,信噪比,发音持续时间,抖动频率,最大频率至结束频率的斜率,起始频率至最大频率的斜率,发音强度。
本发明实施例,所提供的声音分析方法及装置,通过提取声音样本中的声音参数,并将声音参数与预先设定的对照参数进行对比,获取声音参数与对照参数之间的偏差,同时设置了预定阈值,使得能够根据该偏差来判定采集的声音样本是否具有疾病特征。此外,还可根据该偏差,判定疾病的严重程度。可见,本发明的技术方案,能够通过对患者的声音样本进行分析来辅助医生进行帕金森疾病的诊断。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种声音分析方法,其特征在于,包括:
采集声音样本;
从所述声音样本中提取声音参数;
将所述声音参数与预先设定的对照参数进行对比,获取所述声音参数与所述对照参数之间的偏差;
若所述偏差超过预定阈值,判定所述声音样本具有预定的疾病特征。
2.根据权利要求1所述的声音分析方法,其特征在于,还包括:
根据所述偏差,判定所述预定的疾病特征的严重程度。
3.根据权利要求1所述的声音分析方法,其特征在于,所述声音样本包括:单音节样本,双音节样本,多音节样本。
4.根据权利要求1所述的声音分析方法,其特征在于,所述声音参数包括:起始频率,结束频率,中间频率,均值频率,最大频率,最小频率,信噪比,持续发音时间,抖动频率,最大频率至结束频率的斜率,起始频率至最大频率的斜率,发音强度。
5.一种声音分析装置,其特征在于,包括:
采集单元,用于采集声音样本;
提取单元,用于从所述声音样本中提取声音参数;
比较单元,用于将所述声音参数与预先设定的对照参数进行对比,获取所述声音参数与所述对照参数之间的偏差;
第一判定单元,用于当所述偏差超过预定阈值时,判定所述声音样本具有预定的疾病特征。
6.根据权利要求5所述的声音分析装置,其特征在于,还包括:
第二判定单元,用于根据由所述比较单元所获取的所述偏差,判定所述预定的疾病特征的严重程度。
7.根据权利要求5所述的声音分析装置,其特征在于,所述声音样本包括:单音节样本,双音节样本,多音节样本。
8.根据权利要求5所述的声音分析装置,其特征在于,所述声音参数包括:起始频率,结束频率,中间频率,均值频率,最大频率,最小频率,信噪比,持续发音时间,抖动频率,最大频率至结束频率的斜率,起始频率至最大频率的斜率,发音强度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910529938.5A CN112102849A (zh) | 2019-06-18 | 2019-06-18 | 一种声音分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910529938.5A CN112102849A (zh) | 2019-06-18 | 2019-06-18 | 一种声音分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112102849A true CN112102849A (zh) | 2020-12-18 |
Family
ID=73749378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910529938.5A Pending CN112102849A (zh) | 2019-06-18 | 2019-06-18 | 一种声音分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102849A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101182069B1 (ko) * | 2011-09-14 | 2012-09-11 | 영남대학교 산학협력단 | 발화문장의 운율분석을 통한 특발성 파킨슨병 진단장치 및 진단방법 |
CN105260620A (zh) * | 2015-11-09 | 2016-01-20 | 上海温尔信息科技有限公司 | 基于人体体温建模的健康评估方法及专家系统 |
CN107361747A (zh) * | 2017-08-23 | 2017-11-21 | 广东小天才科技有限公司 | 一种用于智能穿戴设备的警示方法和装置 |
CN206726760U (zh) * | 2017-05-05 | 2017-12-08 | 京东方科技集团股份有限公司 | 话筒、数据处理器和监测系统 |
CN107440717A (zh) * | 2017-08-10 | 2017-12-08 | 上海斐讯数据通信技术有限公司 | 一种可穿戴式体液监测装置、体液监测系统及方法 |
CN108269590A (zh) * | 2018-01-17 | 2018-07-10 | 广州势必可赢网络科技有限公司 | 一种声带恢复评分方法及装置 |
CN108305680A (zh) * | 2017-11-13 | 2018-07-20 | 陈霄 | 基于多元生物学特征的智能帕金森症辅助诊断方法和装置 |
CN109192221A (zh) * | 2018-03-30 | 2019-01-11 | 大连理工大学 | 一种基于聚类的使用语音判断帕金森严重程度检测方法 |
-
2019
- 2019-06-18 CN CN201910529938.5A patent/CN112102849A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101182069B1 (ko) * | 2011-09-14 | 2012-09-11 | 영남대학교 산학협력단 | 발화문장의 운율분석을 통한 특발성 파킨슨병 진단장치 및 진단방법 |
CN105260620A (zh) * | 2015-11-09 | 2016-01-20 | 上海温尔信息科技有限公司 | 基于人体体温建模的健康评估方法及专家系统 |
CN206726760U (zh) * | 2017-05-05 | 2017-12-08 | 京东方科技集团股份有限公司 | 话筒、数据处理器和监测系统 |
CN107440717A (zh) * | 2017-08-10 | 2017-12-08 | 上海斐讯数据通信技术有限公司 | 一种可穿戴式体液监测装置、体液监测系统及方法 |
CN107361747A (zh) * | 2017-08-23 | 2017-11-21 | 广东小天才科技有限公司 | 一种用于智能穿戴设备的警示方法和装置 |
CN108305680A (zh) * | 2017-11-13 | 2018-07-20 | 陈霄 | 基于多元生物学特征的智能帕金森症辅助诊断方法和装置 |
CN108269590A (zh) * | 2018-01-17 | 2018-07-10 | 广州势必可赢网络科技有限公司 | 一种声带恢复评分方法及装置 |
CN109192221A (zh) * | 2018-03-30 | 2019-01-11 | 大连理工大学 | 一种基于聚类的使用语音判断帕金森严重程度检测方法 |
Non-Patent Citations (1)
Title |
---|
杨振刚,等: "与神经系统疾病相关的嗓音问题", 《现代临床耳鼻咽喉疾病诊疗学》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Al-Nasheri et al. | An investigation of multidimensional voice program parameters in three different databases for voice pathology detection and classification | |
Dastolfo et al. | Aerodynamic outcomes of four common voice disorders: moving toward disorder-specific assessment | |
CN107622797B (zh) | 一种基于声音的身体状况确定系统及方法 | |
Fletcher et al. | The relationship between speech segment duration and vowel centralization in a group of older speakers | |
US10959661B2 (en) | Quantification of bulbar function | |
CN108305680B (zh) | 基于多元生物学特征的智能帕金森症辅助诊断方法和装置 | |
Kapoor et al. | Parkinson’s disease diagnosis using Mel-frequency cepstral coefficients and vector quantization | |
EP3954278A1 (en) | Apnea monitoring method and device | |
Ali et al. | Intra-and inter-database study for Arabic, English, and German databases: do conventional speech features detect voice pathology? | |
US10789966B2 (en) | Method for evaluating a quality of voice onset of a speaker | |
Arias-Vergara et al. | Unobtrusive monitoring of speech impairments of Parkinson's disease patients through mobile devices | |
KR101894390B1 (ko) | 음성을 이용한 건강 상태 진단 장치 및 방법 | |
Fahed et al. | Comparison of acoustic voice features derived from mobile devices and studio microphone recordings | |
Chitkara et al. | Voice based detection of type 2 diabetes mellitus | |
CN108766462B (zh) | 一种基于梅尔频谱一阶导数的语音信号特征学习方法 | |
Groll et al. | Automated relative fundamental frequency algorithms for use with neck-surface accelerometer signals | |
CN112102849A (zh) | 一种声音分析方法及装置 | |
CN106782616A (zh) | 一种通过人声分析检测呼吸道的方法 | |
US20240341672A1 (en) | Method for evaluating possibility of dysphagia by analyzing acoustic signals, and server and non-transitory computer-readable recording medium performing same | |
Schleusing et al. | Monitoring physiological and behavioral signals to detect mood changes of bipolar patients | |
Kohler | Timing of articulatory control in the production of plosives | |
US20230113656A1 (en) | Pathological condition analysis system, pathological condition analysis device, pathological condition analysis method, and pathological condition analysis program | |
KR101295072B1 (ko) | 심플리시티 기반의 심음 분석 장치 및 그 방법 | |
Atzori et al. | Parkinson disease voice features for rehabilitation therapy and screening purposes | |
Cennamo | Post-surgery monitoring of the phonatory system through the analysis of voice signals Comparison between microphone in air and contact microphones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201218 |