CN110880360A - 一种基于稀疏表示的帕金森病数据集分类方法 - Google Patents
一种基于稀疏表示的帕金森病数据集分类方法 Download PDFInfo
- Publication number
- CN110880360A CN110880360A CN201811034551.4A CN201811034551A CN110880360A CN 110880360 A CN110880360 A CN 110880360A CN 201811034551 A CN201811034551 A CN 201811034551A CN 110880360 A CN110880360 A CN 110880360A
- Authority
- CN
- China
- Prior art keywords
- data set
- patients
- group
- speech
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 208000018737 Parkinson disease Diseases 0.000 title claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 2
- 230000002459 sustained effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 208000027089 Parkinsonian disease Diseases 0.000 description 1
- 206010034010 Parkinsonism Diseases 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 208000011977 language disease Diseases 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种基于稀疏表示的帕金森病数据集分类方法。其特征在于将测试集通过训练集进行稀疏表示,并通过比较训练集中健康人组和患者组表示后所得到的残差大小,确定测试集的所属类别。本方法能较好的平衡计算复杂度和准确率,具有良好的工程应用前景。
Description
技术领域
本发明涉及帕金森病数据集分类方法,特别是一种基于稀疏表示的帕金森病数据集分类方法。
背景技术
帕金森病是一种退行性神经疾病,早期难以察觉而常被忽视,检测语言障碍将具有便利性,低成本,无创等优势。对帕金森病公共数据集的分类研究将有助于帕金森早期诊断的临床实践,现有基于语音特征的帕金森病数据集分类方法算法复杂度较高,并不利于工程实现,本发明实现了一种基于稀疏表示的帕金森病数据集分类方法。
发明内容
针对现有技术,本发明提供了一种基于稀疏表示的帕金森病数据集分类方法。
该方法包括以下步骤:
(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取 N个帕金森语音相关特征,构成特征矩阵
(3)零均值(z-score)标准化S′生成新集合S″;
(7)通过比较残差r1(xt)和r2(xt)大小,若r1(xt)较小则测试集xt类别属于健康人,否则属于患者;
(8)将预测的测试集类别与实际类别进行比较,并遍历整个数据集得到平均分类准确率。
附图说明
图1是根据本发明的一个实施例构成的系统方框图;
具体实施方式
本发明提出的帕金森病数据集分类方法结合附图及实施例进一步说明如下:
本发明的方法流程如图1所示,包括以下步骤:
(1)样本数据集由M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征构成;
(2)样本数据集进行转换构成特征矩阵并零均值(z-score)标准化;
(3)将标准化后特征矩阵按留一法划分为训练集和测试集;
(4)求解测试集的稀疏表示;
(5)通过比较残差大小判决测试集类别并遍历整个数据集得到平均准确率;
本发明的上述技术方案与现有技术方案相比较,具有以下优点:
A、相比已有方法计算复杂度较低;
B、平均分类准确率较高;
C、能有效兼容计算复杂度和分类准确率,具有良好工程前景。
本发明上述方法各步骤的具体实施例详细说明如下:
上述步骤(1)中数据集由Sakar等人建立并从加州大学欧文分校(UCI)机器学习数据库网站获取。主要选取名为“Trainning_Data”的数据集,其中包含M=40 名受试者,M1=20名健康受试者,M2=20患者受试者,每一个测试对象包含了 H0=26个语音样本,具体样本参考表1,每一个语音样本设置N=26个特征,具体特征参考[1]:B.E.Sakar,M.E.Isenkul,C.O.Sakar,A.Sertbas,F.Gurgen, S.Delil,H.Apaydin,O.Kursun.Collection andanalysis of a Parkinson speech dataset with multiple types of soundrecordings.IEEE Journal of Biomedical& Health Informatics.17,828-834(2013).来设定。
表1:语音样本信息
样本序列 | 样本描述 |
第1个 | 持续元音aaa |
第2个 | 持续元音ooo |
第3个 | 持续元音uuu |
第4个~第13个 | 数字1~10 |
第14个~第17个 | 预设的短句 |
第18个~第26个 | 预设的单词 |
上述步骤(4)中求解稀疏表示的方法为正交匹配追踪算法(OMP);
Claims (1)
1.一种基于稀疏表示的帕金森病数据集分类方法,其特征在于该方法包括以下步骤:
(3)零均值(z-score)标准化S′生成新集合S″;
(7)通过比较残差r1(xt)和r2(xt)大小,若r1(xt)较小则测试集xt类别属于健康人,否则属于患者;
(8)将预测的测试集类别与实际类别进行比较,并遍历整个数据集得到平均分类准确率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811034551.4A CN110880360A (zh) | 2018-09-05 | 2018-09-05 | 一种基于稀疏表示的帕金森病数据集分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811034551.4A CN110880360A (zh) | 2018-09-05 | 2018-09-05 | 一种基于稀疏表示的帕金森病数据集分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110880360A true CN110880360A (zh) | 2020-03-13 |
Family
ID=69727617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811034551.4A Pending CN110880360A (zh) | 2018-09-05 | 2018-09-05 | 一种基于稀疏表示的帕金森病数据集分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110880360A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111739643A (zh) * | 2020-08-20 | 2020-10-02 | 耀方信息技术(上海)有限公司 | 一种健康风险评估系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930663A (zh) * | 2016-04-26 | 2016-09-07 | 北京科技大学 | 一种帕金森病早期诊断方法 |
CN105956620A (zh) * | 2016-04-29 | 2016-09-21 | 华南理工大学 | 一种基于稀疏表示的肝脏超声图像识别方法 |
CN107016395A (zh) * | 2017-03-18 | 2017-08-04 | 复旦大学 | 基于稀疏表示体系的原发性脑部淋巴瘤和胶质母细胞瘤的鉴别方法 |
CN107170445A (zh) * | 2017-05-10 | 2017-09-15 | 重庆大学 | 基于语音混合信息特征协同优选判别的帕金森症检测装置 |
WO2017176423A1 (en) * | 2016-04-08 | 2017-10-12 | Biodesix, Inc. | Classifier generation methods and predictive test for ovarian cancer patient prognosis under platinum chemotherapy |
CN107657964A (zh) * | 2017-08-15 | 2018-02-02 | 西北大学 | 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器 |
-
2018
- 2018-09-05 CN CN201811034551.4A patent/CN110880360A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017176423A1 (en) * | 2016-04-08 | 2017-10-12 | Biodesix, Inc. | Classifier generation methods and predictive test for ovarian cancer patient prognosis under platinum chemotherapy |
CN105930663A (zh) * | 2016-04-26 | 2016-09-07 | 北京科技大学 | 一种帕金森病早期诊断方法 |
CN105956620A (zh) * | 2016-04-29 | 2016-09-21 | 华南理工大学 | 一种基于稀疏表示的肝脏超声图像识别方法 |
CN107016395A (zh) * | 2017-03-18 | 2017-08-04 | 复旦大学 | 基于稀疏表示体系的原发性脑部淋巴瘤和胶质母细胞瘤的鉴别方法 |
CN107170445A (zh) * | 2017-05-10 | 2017-09-15 | 重庆大学 | 基于语音混合信息特征协同优选判别的帕金森症检测装置 |
CN107657964A (zh) * | 2017-08-15 | 2018-02-02 | 西北大学 | 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器 |
Non-Patent Citations (1)
Title |
---|
韩秀芝;赵希梅;王国栋;: "基于特征融合与稀疏表示的肝病识别" * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111739643A (zh) * | 2020-08-20 | 2020-10-02 | 耀方信息技术(上海)有限公司 | 一种健康风险评估系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109411082B (zh) | 一种医疗质量评价及就诊推荐方法 | |
CN109460473B (zh) | 基于症状提取和特征表示的电子病历多标签分类方法 | |
CN108877921B (zh) | 医疗智能分诊方法和医疗智能分诊系统 | |
CN107527073B (zh) | 电子病历中命名实体的识别方法 | |
WO2021120934A1 (zh) | 一种基于卷积神经网络的DRGs自动分组方法 | |
CN106202891B (zh) | 一种面向医疗质量评价的大数据挖掘方法 | |
CN111709233A (zh) | 基于多注意力卷积神经网络的智能导诊方法及系统 | |
CN108648182B (zh) | 一种基于分子亚型的乳腺癌核磁共振图像肿瘤区域分割方法 | |
CN107480135B (zh) | 数据处理方法、医学用语处理系统和医学诊疗系统 | |
CN108492877B (zh) | 一种基于ds证据理论的心血管病辅助预测方法 | |
CN112908436B (zh) | 临床试验数据结构化方法、临床试验推荐方法和装置 | |
CN108511056A (zh) | 基于脑卒中患者相似性分析的治疗方案推荐方法及系统 | |
CN109509557B (zh) | 一种基于大数据平台的中文电子病历信息抽取预处理方法 | |
CN111354338B (zh) | 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统 | |
WO2023036015A1 (zh) | 一种基于多维身体状态感知的疲劳检测方法及系统 | |
CN111415099A (zh) | 一种基于多分类BP-Adaboost的贫困生认定方法 | |
CN112927797A (zh) | 一种基于贝叶斯概率推断的急诊临床诊断分析系统 | |
CN113284136A (zh) | 一种双损失函数训练的残差网络和XGBoost的医学图像分类方法 | |
CN117373657A (zh) | 基于大数据分析的个性化医疗辅助问诊系统 | |
CN111986814A (zh) | 一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法 | |
CN110880360A (zh) | 一种基于稀疏表示的帕金森病数据集分类方法 | |
CN118312816A (zh) | 基于成员选择的簇加权聚类集成医学数据处理方法及系统 | |
CN110852336A (zh) | 一种基于矢量空间的帕金森病数据集分类方法 | |
CN116864062B (zh) | 一种基于互联网的健康体检报告数据分析管理系统 | |
CN117334290A (zh) | 危重症循证护理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200313 |
|
WD01 | Invention patent application deemed withdrawn after publication |