CN110880360A - 一种基于稀疏表示的帕金森病数据集分类方法 - Google Patents

一种基于稀疏表示的帕金森病数据集分类方法 Download PDF

Info

Publication number
CN110880360A
CN110880360A CN201811034551.4A CN201811034551A CN110880360A CN 110880360 A CN110880360 A CN 110880360A CN 201811034551 A CN201811034551 A CN 201811034551A CN 110880360 A CN110880360 A CN 110880360A
Authority
CN
China
Prior art keywords
data set
patients
group
speech
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811034551.4A
Other languages
English (en)
Inventor
张小恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Technology and Business Institute
Original Assignee
Chongqing Technology and Business Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Technology and Business Institute filed Critical Chongqing Technology and Business Institute
Priority to CN201811034551.4A priority Critical patent/CN110880360A/zh
Publication of CN110880360A publication Critical patent/CN110880360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种基于稀疏表示的帕金森病数据集分类方法。其特征在于将测试集通过训练集进行稀疏表示,并通过比较训练集中健康人组和患者组表示后所得到的残差大小,确定测试集的所属类别。本方法能较好的平衡计算复杂度和准确率,具有良好的工程应用前景。

Description

一种基于稀疏表示的帕金森病数据集分类方法
技术领域
本发明涉及帕金森病数据集分类方法,特别是一种基于稀疏表示的帕金森病数据集分类方法。
背景技术
帕金森病是一种退行性神经疾病,早期难以察觉而常被忽视,检测语言障碍将具有便利性,低成本,无创等优势。对帕金森病公共数据集的分类研究将有助于帕金森早期诊断的临床实践,现有基于语音特征的帕金森病数据集分类方法算法复杂度较高,并不利于工程实现,本发明实现了一种基于稀疏表示的帕金森病数据集分类方法。
发明内容
针对现有技术,本发明提供了一种基于稀疏表示的帕金森病数据集分类方法。
该方法包括以下步骤:
(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取 N个帕金森语音相关特征,构成特征矩阵
Figure BDA0001790493630000011
(2)语音特征集变换。变换后语音特征集为
Figure BDA0001790493630000012
其中
Figure BDA0001790493630000013
(3)零均值(z-score)标准化S′生成新集合S″;
(4)将标准数据集S″按留一法划分为训练集
Figure BDA0001790493630000014
及相应标签
Figure BDA0001790493630000015
和测试集
Figure BDA0001790493630000016
及相应标签yt=bm,其中标签bm∈{0,1};
(5)求解稀疏表示
Figure BDA0001790493630000017
满足xma=xt,其中
Figure BDA0001790493630000018
是稀疏列向量;
(6)计算残差
Figure BDA0001790493630000021
i=1,2,其中
Figure BDA0001790493630000022
保留健康人所在组参数,将患者所在组参数置0,
Figure BDA0001790493630000023
保留患者所在组参数,将健康人所在组参数置0;
(7)通过比较残差r1(xt)和r2(xt)大小,若r1(xt)较小则测试集xt类别属于健康人,否则属于患者;
(8)将预测的测试集类别与实际类别进行比较,并遍历整个数据集得到平均分类准确率。
附图说明
图1是根据本发明的一个实施例构成的系统方框图;
具体实施方式
本发明提出的帕金森病数据集分类方法结合附图及实施例进一步说明如下:
本发明的方法流程如图1所示,包括以下步骤:
(1)样本数据集由M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征构成;
(2)样本数据集进行转换构成特征矩阵并零均值(z-score)标准化;
(3)将标准化后特征矩阵按留一法划分为训练集和测试集;
(4)求解测试集的稀疏表示;
(5)通过比较残差大小判决测试集类别并遍历整个数据集得到平均准确率;
本发明的上述技术方案与现有技术方案相比较,具有以下优点:
A、相比已有方法计算复杂度较低;
B、平均分类准确率较高;
C、能有效兼容计算复杂度和分类准确率,具有良好工程前景。
本发明上述方法各步骤的具体实施例详细说明如下:
上述步骤(1)中数据集由Sakar等人建立并从加州大学欧文分校(UCI)机器学习数据库网站获取。主要选取名为“Trainning_Data”的数据集,其中包含M=40 名受试者,M1=20名健康受试者,M2=20患者受试者,每一个测试对象包含了 H0=26个语音样本,具体样本参考表1,每一个语音样本设置N=26个特征,具体特征参考[1]:B.E.Sakar,M.E.Isenkul,C.O.Sakar,A.Sertbas,F.Gurgen, S.Delil,H.Apaydin,O.Kursun.Collection andanalysis of a Parkinson speech dataset with multiple types of soundrecordings.IEEE Journal of Biomedical& Health Informatics.17,828-834(2013).来设定。
表1:语音样本信息
样本序列 样本描述
第1个 持续元音aaa
第2个 持续元音ooo
第3个 持续元音uuu
第4个~第13个 数字1~10
第14个~第17个 预设的短句
第18个~第26个 预设的单词
上述步骤(4)中求解稀疏表示的方法为正交匹配追踪算法(OMP);
上述步骤(5)中平均准确率的计算方法为:当预测的第m个测试集
Figure BDA0001790493630000031
类别与实际类别相同时,测试集准确率
Figure BDA0001790493630000033
否则
Figure BDA0001790493630000034
则平均准确率
Figure BDA0001790493630000032

Claims (1)

1.一种基于稀疏表示的帕金森病数据集分类方法,其特征在于该方法包括以下步骤:
(1)对M个受试者(M1健康人,M2患者)每人采集H0段语音,每段语音提取N个帕金森语音相关特征,构成特征矩阵
Figure FDA0001790493620000011
(2)语音特征集变换。变换后语音特征集为
Figure FDA0001790493620000012
其中
Figure FDA0001790493620000013
(3)零均值(z-score)标准化S′生成新集合S″;
(4)将标准数据集S″按留一法划分为训练集
Figure FDA0001790493620000014
及相应标签
Figure FDA0001790493620000015
和测试集
Figure FDA0001790493620000016
及相应标签yt=bm,其中标签bm∈{0,1};
(5)求解稀疏表示
Figure FDA0001790493620000017
满足xma=xt,其中
Figure FDA0001790493620000018
是稀疏列向量;
(6)计算残差
Figure FDA0001790493620000019
其中
Figure FDA00017904936200000110
保留健康人所在组参数,将患者所在组参数置0,
Figure FDA00017904936200000111
保留患者所在组参数,将健康人所在组参数置0;
(7)通过比较残差r1(xt)和r2(xt)大小,若r1(xt)较小则测试集xt类别属于健康人,否则属于患者;
(8)将预测的测试集类别与实际类别进行比较,并遍历整个数据集得到平均分类准确率。
CN201811034551.4A 2018-09-05 2018-09-05 一种基于稀疏表示的帕金森病数据集分类方法 Pending CN110880360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811034551.4A CN110880360A (zh) 2018-09-05 2018-09-05 一种基于稀疏表示的帕金森病数据集分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811034551.4A CN110880360A (zh) 2018-09-05 2018-09-05 一种基于稀疏表示的帕金森病数据集分类方法

Publications (1)

Publication Number Publication Date
CN110880360A true CN110880360A (zh) 2020-03-13

Family

ID=69727617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811034551.4A Pending CN110880360A (zh) 2018-09-05 2018-09-05 一种基于稀疏表示的帕金森病数据集分类方法

Country Status (1)

Country Link
CN (1) CN110880360A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111739643A (zh) * 2020-08-20 2020-10-02 耀方信息技术(上海)有限公司 一种健康风险评估系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930663A (zh) * 2016-04-26 2016-09-07 北京科技大学 一种帕金森病早期诊断方法
CN105956620A (zh) * 2016-04-29 2016-09-21 华南理工大学 一种基于稀疏表示的肝脏超声图像识别方法
CN107016395A (zh) * 2017-03-18 2017-08-04 复旦大学 基于稀疏表示体系的原发性脑部淋巴瘤和胶质母细胞瘤的鉴别方法
CN107170445A (zh) * 2017-05-10 2017-09-15 重庆大学 基于语音混合信息特征协同优选判别的帕金森症检测装置
WO2017176423A1 (en) * 2016-04-08 2017-10-12 Biodesix, Inc. Classifier generation methods and predictive test for ovarian cancer patient prognosis under platinum chemotherapy
CN107657964A (zh) * 2017-08-15 2018-02-02 西北大学 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017176423A1 (en) * 2016-04-08 2017-10-12 Biodesix, Inc. Classifier generation methods and predictive test for ovarian cancer patient prognosis under platinum chemotherapy
CN105930663A (zh) * 2016-04-26 2016-09-07 北京科技大学 一种帕金森病早期诊断方法
CN105956620A (zh) * 2016-04-29 2016-09-21 华南理工大学 一种基于稀疏表示的肝脏超声图像识别方法
CN107016395A (zh) * 2017-03-18 2017-08-04 复旦大学 基于稀疏表示体系的原发性脑部淋巴瘤和胶质母细胞瘤的鉴别方法
CN107170445A (zh) * 2017-05-10 2017-09-15 重庆大学 基于语音混合信息特征协同优选判别的帕金森症检测装置
CN107657964A (zh) * 2017-08-15 2018-02-02 西北大学 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩秀芝;赵希梅;王国栋;: "基于特征融合与稀疏表示的肝病识别" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111739643A (zh) * 2020-08-20 2020-10-02 耀方信息技术(上海)有限公司 一种健康风险评估系统

Similar Documents

Publication Publication Date Title
CN109411082B (zh) 一种医疗质量评价及就诊推荐方法
CN109460473B (zh) 基于症状提取和特征表示的电子病历多标签分类方法
CN108877921B (zh) 医疗智能分诊方法和医疗智能分诊系统
CN107527073B (zh) 电子病历中命名实体的识别方法
WO2021120934A1 (zh) 一种基于卷积神经网络的DRGs自动分组方法
CN106202891B (zh) 一种面向医疗质量评价的大数据挖掘方法
CN111709233A (zh) 基于多注意力卷积神经网络的智能导诊方法及系统
CN108648182B (zh) 一种基于分子亚型的乳腺癌核磁共振图像肿瘤区域分割方法
CN107480135B (zh) 数据处理方法、医学用语处理系统和医学诊疗系统
CN108492877B (zh) 一种基于ds证据理论的心血管病辅助预测方法
CN112908436B (zh) 临床试验数据结构化方法、临床试验推荐方法和装置
CN108511056A (zh) 基于脑卒中患者相似性分析的治疗方案推荐方法及系统
CN109509557B (zh) 一种基于大数据平台的中文电子病历信息抽取预处理方法
CN111354338B (zh) 基于pso卷积核优化稀疏迁移学习的帕金森语音识别系统
WO2023036015A1 (zh) 一种基于多维身体状态感知的疲劳检测方法及系统
CN111415099A (zh) 一种基于多分类BP-Adaboost的贫困生认定方法
CN112927797A (zh) 一种基于贝叶斯概率推断的急诊临床诊断分析系统
CN113284136A (zh) 一种双损失函数训练的残差网络和XGBoost的医学图像分类方法
CN117373657A (zh) 基于大数据分析的个性化医疗辅助问诊系统
CN111986814A (zh) 一种红斑狼疮患者的狼疮性肾炎预测模型的建模方法
CN110880360A (zh) 一种基于稀疏表示的帕金森病数据集分类方法
CN118312816A (zh) 基于成员选择的簇加权聚类集成医学数据处理方法及系统
CN110852336A (zh) 一种基于矢量空间的帕金森病数据集分类方法
CN116864062B (zh) 一种基于互联网的健康体检报告数据分析管理系统
CN117334290A (zh) 危重症循证护理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200313

WD01 Invention patent application deemed withdrawn after publication