CN108742513A - 脑卒中患者康复预测方法及系统 - Google Patents

脑卒中患者康复预测方法及系统 Download PDF

Info

Publication number
CN108742513A
CN108742513A CN201810136204.6A CN201810136204A CN108742513A CN 108742513 A CN108742513 A CN 108742513A CN 201810136204 A CN201810136204 A CN 201810136204A CN 108742513 A CN108742513 A CN 108742513A
Authority
CN
China
Prior art keywords
data
prediction
patients
barthel
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810136204.6A
Other languages
English (en)
Inventor
翟向东
王永明
崔修涛
胡天龙
刘佳伟
熊伟
赵政达
陈继智
章玉宇
应振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC SOFTWARE INFORMATION SERVICES Co.,Ltd.
Original Assignee
Shanghai Changjiang Science And Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Changjiang Science And Technology Development Co Ltd filed Critical Shanghai Changjiang Science And Technology Development Co Ltd
Priority to CN201810136204.6A priority Critical patent/CN108742513A/zh
Publication of CN108742513A publication Critical patent/CN108742513A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种脑卒中患者康复预测方法及系统,包括数据预处理步骤:对历史数据进行数据预处理,得到数据建模所需的目标人群数据;特征构造步骤:对目标人群数据进行数据划分,并对划分的数据进行特征构造得到数据集;模型训练步骤:选取数据集中的部分样本作为训练数据集进行模型训练;模型测试步骤:选取数据集中的余下样本作为测试数据集进行模型测试。本发明将机器学习方法应用到脑卒中患者预后风险预测问题的分析中,对特定脑卒中患者人群的康复进行预后分析,帮助医生进行针对性的康复治疗。对于医生感兴趣的预测目标进行预测,并在此基础上挖掘出对结果影响的影响因子,为发病机制或预后疗效提供线索并指导临床实践。

Description

脑卒中患者康复预测方法及系统
技术领域
本发明涉及医疗领域,具体地,涉及一种脑卒中患者康复预测方法及系统。
背景技术
“脑卒中”(cerebral stroke)又称“中风”、“脑血管意外”。是一种急性脑血管疾病, 是由于脑部血管突然破裂或因血管阻塞导致血液不能流入大脑而引起脑组织损伤的一 组疾病,包括缺血性和出血性卒中。不同类型的脑卒中,其康复治疗方式不同,针对入院患者,依据不同患者的个性化检查信息,才能更高效准确地选择适合的康复治疗方案。
吴毅等人(吴毅,Peter Esselman.功能独立性评价量表作为康复治疗前后和随访的 功能评价指标,中华物理医学与康复杂志,2001)应用功能独立性评价(FIM)量表评定美国某医疗单位康复医学科1年中住院患者康复治疗的疗效,以及随访情况;同时与美 国康复医学统一数据系统(UDSMR)1995年和1996年资料相比较。统计1999年7月1 日至2000年6月30日美国华盛顿大学附属Harborview Medical Center(HMC)康复医学 科287例患者的资料,包括:患者入院、出院和随访(出院3个月)FIM的评分,FIM 效率(每天进步的分数)及FIM进步程度等。结果显示,HMC康复医学科患者住院期间 FIM进步程度为37.7%,UDSMR为31.6%(1995)和32%(1996);HMC随访期间 进步7.8%,UDSMR为10.5%(1995)和10.1%(1996);HMC的FIM效率为1.6, UDSMR为1.7(1995)和1.8(1996)。得出,各种功能障碍患者经过康复治疗,功能情 况都有较大提高,出院后功能情况仍有一定程度进步。FIM量表作为康复治疗患者住院 期间和随访期间功能评价指标,是一种较理想的评价指标。
范文可等人(范文可,胡永善,吴毅,杨晓冰.功能综合评定量表效度的研究,中国康复医学杂志,2003)研究功能综合评定(FCA)量表在评测残疾患者中的效度。对已明确 诊断的20例残疾患者进行FCA量表效度分析,其中脑血管意外患者7例,外伤性颅脑 损伤患者6例,脑瘤术后患者5例,脊髓损伤患者2例。将FCA运动分、认知分、社 会交往分与Barthel指数、简易精神状态检查(MMSE)、生活质量指数(QLI)得分作相关 分析。结果显示,FCA运动分与Barthel指数显著相关(r=0.977,P<0.001),FCA认知分 与MMSE评分也显著相关(r=0.926,P<0.001),FCA社会交往分与QLI评分也有较好的相 关性(r=0.978,P<0.001)。得出,FCA与Barthel指数、MMSE及QLI有良好的标准效度, 是整体残疾功能评测的一项有效的评测工具。
黄晓琳等人(黄晓琳,陆敏,喻澜,刘雅丽.Barthel指数对脑卒中患者住院康复效果的预测,中国康复,2003)探讨了Barthel指数(BI)对脑卒中患者治疗前后功能状态 改变的预测效果。采用回顾性研究的方法,将脑卒中患者227例的临床资料进行分析。 根据患者入院时BI积分,分为严重功能障碍组、重度功能障碍组、中度功能障碍组、 轻度功能障碍组和功能良好组。应用BI评定患者康复治疗前和出院时的日常生活活动 能力。结果显示,入院时中度功能障碍患者的平均BI增分和增分速率均明显高于其他 各组。BI积分在41~60的脑卒中患者可作为住院康复治疗的首选对象,并可初步预测患 者经过康复治疗后可能获得良好康复效果。
谢财忠等人(谢财忠,刘新,唐军凯.脑卒中患者平衡功能与自理能力的相关性.中国 康复医学杂志,2010.)评估了脑卒中患者的平衡功能,以助于确定脑卒中严重程度、判断 预后和制定康复方案。观察Berg平衡功能评定表(BBS)和Fugl-Meyer平衡功能评定表(FM-B)在脑卒中偏瘫患者临床上的实用价值,并探讨平衡能力与日常生活活动能力的相关性。将符合条件的38例住院脑卒中偏瘫患者纳入本研究,对其进行3周的康复治疗, 于康复治疗前后分别采用BBS、FM-B以及改良的Barthel指数(MBI)进行评定,对所得 资料进行比较分析。结果显示,康复治疗后患者BBS、FM-B、MBI评分均有增加,治 疗前后各评分差异性比较,其中FM-B为P<0.05,BBS和MBI均为P<0.01。患者康复 治疗前的BBS、FM-B评分与康复治疗前MBI评分的相关系数分别为0.58和0.55(P<0.05); 患者康复治疗前的BBS、FM-B评分与康复治疗后MBI评分的相关系数分别为0.75和 0.69(P<0.01)。得出,BBS与FM-B都可反映急性脑卒中患者的平衡能力,在平衡功能 评定上都有良好的一致性,但BBS对效果评定更为敏感,临床使用性更高;平衡功能 与自理能力有较密切的相关性,平衡功能的缺失对脑卒中患者生存质量有显著的影响, 可预测生存质量。
侯东哲等人(侯东哲,张颖,巫嘉陵等人.中文版Barthel指数的信度与效度研究.临 床荟萃,2012)研究了脑卒中患者中文版Barthel指数(Barthel Index,BI)的信度和效度。 对147例急性脑卒中患者,分别由不同评定者对同一脑卒中患者于入院当天、入院第15天、发病后第90天进行BI的评定。用Kappa值表示重测信度与评定者间信度,用Cronbach α值表示分半信度、内部一致性信度。采用Spearman相关分析预测效度,采用因子分 析方法评定结构效度。结果所有重测信度、评定者间信度的Kappa值差异均有统计学意 义(P<0.01);分半信度:BI奇偶项两部分的Cronbachα值分别为0.837、0.824,两部分 的r,为0.903;内部一致信度Cronbachα值为0.916;效度研究中患者的KMO统计量 为0.854,Bartlett球形检验拒绝相关阵是单位阵(P<0.01);入院时、发病15天的BI评分 结果与发病90天后BI呈正相关;与斯堪的那维亚卒中量表(Scandinavian Stroke Scale,SSS)结果呈正相关,与美国国立卫生研究院卒中量表(National Institute of Health StrokeScale,NIHSS)呈负相关。得出,中文版的BI(和本发明的十项相同:大便、小 便、修饰、用厕、吃饭、转移、活动、穿衣、上楼、洗澡)重测信度和评定者间信度佳, 内部一致性好;具有结构效度、预测效度;使用方便,易于掌握,可广泛应用于脑卒中 的评定中。
综上可知,采用Barthel指数来对脑卒中病人康复训练后自理生活能力进行预测,是 常用且有效的方法,但是现有的方法都是基于传统的手段进行,人工对大量病历及检查结果进行评估,以对患者康复情况进行预测,耗时耗力,效益较为低下,为解决这一问 题,将机器学习方法应用到脑卒中患者预后风险预测问题的分析中,基于已有的临床数 据及预后结果(运动,语言,吞咽,认知,生活自理功能等),对特定(脑卒中)患者 人群的康复进行预后分析,识别特定功能预后高风险的患者,以帮助医生进行针对性的 康复治疗,以极大改善康复结果;此外,对于医生感兴趣的预测目标如Barthel总分、 各分项目标提高的概率等,进行预测,并在此基础上挖掘出对结果影响的影响因子(即 具体的导致不同康复评估结果的风险因子,以及各风险因子对风险的影响力),为发病 机制或预后疗效提供线索并指导临床实践。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种脑卒中患者康复预测方法及系统。
根据本发明提供的一种脑卒中患者康复预测方法,包括如下步骤:
数据预处理步骤:对历史数据进行数据预处理,得到数据建模所需的目标人群数据;
特征构造步骤:对目标人群数据进行数据划分,并对划分的数据进行特征构造得到 数据集Dselect
模型训练步骤:选取数据集Dselect中的部分样本作为训练数据集Dtrain进行模型训练;
模型测试步骤:选取数据集Dselect中的余下样本作为测试数据集Dtest进行模型测试。
优选地,所述数据预处理步骤包括:
数据清洗步骤:对历史数据中的不规范数据进行数据清洗;
数据去缺失步骤:对历史数据中存在缺失的数据的分类型和连续型特征依照众数或 者均值进行缺失数据填充;
入组筛选步骤:基于入组条件,对历史数据进行数据筛选。
优选地,所述特征构造步骤包括:
数据划分步骤:将经过数据预处理器得到的数据划分为不同特征数据;
特征筛选步骤:对不同特征数据用不同方法进行特征选择,筛选出影响因子作为候 选特征;
特征检验步骤:对候选特征计算p-value值,选出p-value值小于设定阈值的候选特 征作为最终特征。
优选地,所述模型训练步骤包括:
对于训练数据集Dtrain中的连续性特征数据,预测患者出院时的Barthel评分,得到Barthel总评分的预测模型;
对于训练数据集Dtrain中的结局数据,预测患者出院时的评分等级,以及处于各等级 的概率,得到Barthel评分对应的总体缺陷分级预测模型;
对于训练数据集Dtrain中的分类型特征数据,预测患者出院时Barthel评分等级及各 分项评分提高的概率,得到Barthel各项评分预测模型。
优选地,所述模型测试步骤包括:
将测试数据集Dtest中的连续性特征数据、分类型特征数据以及结局数据处理,预测 结果采用性能评价指标进行评估,得到康复预测最优化模型。
根据本发明提供的一种脑卒中患者康复预测系统,包括如下模块:
数据预处理模块:用于对历史数据进行数据预处理,得到数据建模所需的目标人群 数据;
特征构造模块:用于对目标人群数据进行数据划分,并对划分的数据进行特征构造 得到数据集Dselect
模型训练模块:用于选取数据集Dselect中的部分样本作为训练数据集Dtrain进行模型 训练;
模型测试模块:用于选取数据集Dselect中的余下样本作为测试数据集Dtest进行模型 测试。
优选地,所述数据预处理模块包括:
数据清洗模块:用于对历史数据中的不规范数据进行数据清洗;
数据去缺失模块:用于对历史数据中存在缺失的数据的分类型和连续型特征依照众 数或者均值进行缺失数据填充;
入组筛选模块:用于基于入组条件,对历史数据进行数据筛选。
优选地,所述特征构造模块包括:
数据划分模块:用于将经过数据预处理器得到的数据划分为不同特征数据;
特征筛选模块:用于对不同特征数据用不同系统进行特征选择,筛选出影响因子作 为候选特征;
特征检验模块:用于对候选特征计算p-value值,选出p-value值小于设定阈值的候 选特征作为最终特征。
优选地,所述模型训练模块包括:
对于训练数据集Dtrain中的连续性特征数据,预测患者出院时的Barthel评分,得到Barthel总评分的预测模型;
对于训练数据集Dtrain中的结局数据,预测患者出院时的评分等级,以及处于各等级 的概率,得到Barthel评分对应的总体缺陷分级预测模型;
对于训练数据集Dtrain中的分类型特征数据,预测患者出院时Barthel评分等级及各 分项评分提高的概率,得到Barthel各项评分预测模型。
优选地,所述模型测试模块包括:
将测试数据集Dtest中的连续性特征数据、分类型特征数据以及结局数据处理,预测 结果采用性能评价指标进行评估,得到康复预测最优化模型。
与现有技术相比,本发明具有如下的有益效果:
1、本发明基于Barthel指数,针对因脑卒中、脑外伤、脑肿瘤术后住院的患者的康复诊疗提供大数据分析服务,将机器学习方法应用到脑卒中患者预后风险预测问题的分析中,基于已有的临床数据及预后结果(运动,语言,吞咽,认知,生活自理功能等), 对特定(脑卒中)患者人群的康复进行预后分析,识别特定功能预后高风险的患者,以 帮助医生进行针对性的康复治疗,以极大改善康复结果。
2、对于医生感兴趣的预测目标如Barthel总分、各分项目标提高的概率等,进行预测,并在此基础上挖掘出对结果影响的影响因子(即具体的导致不同康复评估结果的风 险因子,以及各风险因子对风险的影响力),为发病机制或预后疗效提供线索并指导临 床实践。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的提供的脑卒中患者康复预测方法的结构流程图。
图2为本发明中数据预处理模块的工作原理图。
图3为本发明中特征构造模块的工作原理图。
图4为本发明中Barthel指数多级预测分类模块的工作原理图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人 员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于 本发明的保护范围。
如图1至图4所示,本发明提供了一种脑卒中患者康复预测方法及系统,针对因脑卒中、脑外伤、脑肿瘤术后住院的患者的康复诊疗提供大数据分析服务,将机器学习方 法应用到脑卒中患者预后风险预测问题的分析中,基于已有的临床数据及预后结果(运 动,语言,吞咽,认知,生活自理功能等),对特定(脑卒中)患者人群的康复进行预 后分析,识别特定功能预后高风险的患者,以帮助医生进行针对性的康复治疗,以极大 改善康复结果;此外,对于医生感兴趣的预测目标如Barthel总分、各分项目标提高的 概率等,进行预测,并在此基础上挖掘出对结果影响的影响因子(即具体的导致不同康 复评估结果的风险因子,以及各风险因子对风险的影响力),为发病机制或预后疗效提 供线索并指导临床实践。
具体的,根据本发明提供的一种脑卒中患者康复预测方法,包括:数据预处理步骤: 对历史数据进行数据预处理,得到数据建模所需的目标人群数据;特征构造步骤:对目标人群数据进行数据划分,并对划分的数据进行特征构造得到数据集Dselect;模型训练 步骤:选取数据集Dselect中的部分样本作为训练数据集Dtrain进行模型训练;模型测试步 骤:选取数据集Dselect中的余下样本作为测试数据集Dtest进行模型测试。
进一步地,所述数据预处理步骤中,把不同时间段和分散在不同表格的数据采用数 据集成方法拼接得到一起,形成完整数据集:每个数据源会导出一个或多个csv文件,依据设计的联系规则,把不同数据源但是有同样ID号或者序列号的信息连接在一起, 联系规则主要根据病人ID号或是入组序列号。采用数据清洗方法对数据进行处理,通 过去缺失、数据规约、离散化、数据转换,对历史数据中的不规范数据(如时间格式) 进行数据清洗,针对不同的类型的不规范数据设计不同的清洗规则,对数据格式进行规 整和对不合理数据进行处理或修改。对历史数据中存在缺失的数据的分类型和连续型特 征依照众数或者均值进行缺失数据填充;基于入组条件,对历史数据进行数据筛选。得 到数据建模所需的目标人群数据。其中,历史数据包括脑卒中住院患者入院时和出院时 的相关评分,病人性别,年龄,职业,病史,实验室检查,入院期间的医嘱(包括采用 的康复治疗和用药)等相关信息。
具体的,所述入组条件为:
(a)有入院后7天内的Barthel评分数据,和出院前7天内的Barthel评分数据;
(b)出入院评分至少间隔7天;
(c)有从病历录入的特征信息数据,包括高血压、糖尿病、吸烟史等。
经过数据预处理处理,得到数据以Dpre表示,包含的数据包括Barthel评分数据、基本信息(性别、年龄)、病历数据、检验数据。
更为详细地,所述特征构造步骤包括:将经过数据预处理步骤得到的数据划分为连 续型特征数据、分类型特征数据以及结局数据,对不同特征数据用不同方法进行特征选择,筛选出影响因子作为候选特征;对候选特征计算p-value值,选出p-value值小于设 定阈值的候选特征作为最终特征。具体如下:
步骤S1:对数据预处理器得到的数据进行转换和衍生:
步骤S1.1:基于集合运算衍生新特征,采用的集合运算包括count,mean,min, max或者std.;
步骤S1.2:基于领域知识和关联规则方法Apriori构造新特征:根据已有特征的组合衍生出新的特征变量;
步骤S2:采用卡方检验、Wilcoxon signed-rank检验、ANOVA检验方法对二值变量、二值目标、连续变量、连续目标特征进行处理,筛选出影响因子作为候选特征:
步骤S2.1:对于二值变量,采用卡方检验筛选出影响因子。
步骤S2.2:对于二值目标,分别采用卡方检验和Wilcoxon signed-rank检验筛选出 影响因子。
步骤S2.3:对于连续变量,分别采用Wilcoxon signed-rank检验和ANOVA检验筛选出影响因子。
步骤S2.4:对于连续目标,采用ANOVA检验筛选出影响因子;
步骤S3:最后,对步骤S2选出的所有候选特征,分别计算其统计检验p-value值,选取p-value小于0.05的候选特征,作为特征构造器选取的最终特征。
通过特征构造步骤处理,得到的数据以Dselect表示,选取的特征包括性别、年龄、高血压病、糖尿病、入院缺陷分级、GLU(血糖),LDLC(低密度脂蛋白胆固醇)或者 TG(甘油三酯)。
进一步说明,将特征构造步骤得到的数据集Dselect,选取部分样本作为训练数据集Dtrain,进行模型训练,余下样本作为测试数据集Dtest进行模型测试。基于Barthel指数 进行多级预测分类,具体如下:
(a)Barthel总分预测,预测患者出院时候的总分(0~100分);
(b)Barthel总体缺陷等级是否提升的预测,预测患者出院时的缺陷等级(0~20分: 极严重功能缺陷;25~45:严重功能缺陷;50~70:中度功能缺陷;75~95:轻度功能缺陷:100:自理)提高的概率;
(c)Barthel指数各分项提高的概率,其中,Barthel指数各分项包括:大便、小便、修饰、用厕、吃饭、转移(床-椅)、活动(步行)、穿衣、上楼梯、洗澡。各项评分的 取值范围为0,5,10,15。分数越高,自理情况越好。
其中,所述模型训练针对不同目标的预测,分别尝试多种方法来建模:
方式1:对于训练数据集Dtrain中的连续性特征数据,采用了线性回归方法预测患者出院时的Barthel评分,得到Barthel总评分的预测模型。
方式2:对于训练数据集Dtrain中的结局数据,分别采用逻辑回归、随机森林和朴素贝叶斯方法方法,预测患者出院时的评分等级,以及处于各等级的概率,得到Barthel 评分对应的总体缺陷分级预测模型。
方式2:对于训练数据集Dtrain中的分类型特征数据,分别采用逻辑回归、随机森林和朴素贝叶斯方法二预测患者出院时Barthel评分等级及各分项评分提高的概率,得到Barthel 10项评分预测模型。
所述模型测试将测试数据集Dtest中的连续性特征数据、分类型特征数据和结局数据, 分别采用方式1、方式2以及方式3进行处理,预测结果采用性能评价指标(包括ROC 曲线下面积(AUC)、敏感性(sensitivity)、特异性(specificity)、阳性预测值(positivepredictive value,PPV)、准确率(accuracy)和R2)进行评估,得到康复预测最优化模型。
本发明还提供一种脑卒中患者康复预测系统,包括:数据预处理模块:用于对历史数据进行数据预处理,得到数据建模所需的目标人群数据;特征构造模块:用于对目标 人群数据进行数据划分,并对划分的数据进行特征构造得到数据集Dselect;模型训练模 块:用于选取数据集Dselect中的部分样本作为训练数据集Dtrain进行模型训练;模型测试 模块:用于选取数据集Dselect中的余下样本作为测试数据集Dtest进行模型测试。
进一步地,所述数据预处理模块中,把不同时间段和分散在不同表格的数据采用数 据集成方法拼接得到一起,形成完整数据集:每个数据源会导出一个或多个csv文件,依据设计的联系规则,把不同数据源但是有同样ID号或者序列号的信息连接在一起, 联系规则主要根据病人ID号或是入组序列号。采用数据清洗方法对数据进行处理,通 过去缺失、数据规约、离散化、数据转换,对历史数据中的不规范数据(如时间格式) 进行数据清洗,针对不同的类型的不规范数据设计不同的清洗规则,对数据格式进行规 整和对不合理数据进行处理或修改。对历史数据中存在缺失的数据的分类型和连续型特 征依照众数或者均值进行缺失数据填充;基于入组条件,对历史数据进行数据筛选。得 到数据建模所需的目标人群数据。其中,历史数据包括脑卒中住院患者入院时和出院时 的相关评分,病人性别,年龄,职业,病史,实验室检查,入院期间的医嘱(包括采用 的康复治疗和用药)等相关信息。
具体的,所述入组条件为:
(a)有入院后7天内的Barthel评分数据,和出院前7天内的Barthel评分数据;
(b)出入院评分至少间隔7天;
(c)有从病历录入的特征信息数据,包括高血压、糖尿病、吸烟史等。
经过数据预处理处理,得到数据以Dpre表示,包含的数据包括Barthel评分数据、基本信息(性别、年龄)、病历数据、检验数据。
更为详细地,所述特征构造模块包括:用于将经过数据预处理步骤得到的数据划分 为连续型特征数据、分类型特征数据以及结局数据,对不同特征数据用不同方法进行特征选择,筛选出影响因子作为候选特征;对候选特征计算p-value值,选出p-value值小 于设定阈值的候选特征作为最终特征。具体如下:
转换衍生模块:对数据预处理器得到的数据进行转换和衍生:
基于集合运算衍生新特征,采用的集合运算包括count,mean,min,max或者std.;
基于领域知识和关联规则方法Apriori构造新特征:根据已有特征的组合衍生出新 的特征变量;
筛选模块:采用卡方检验、Wilcoxon signed-rank检验、ANOVA检验方法对二值变量、二值目标、连续变量、连续目标特征进行处理,筛选出影响因子作为候选特征:
对于二值变量,采用卡方检验筛选出影响因子。
对于二值目标,分别采用卡方检验和Wilcoxon signed-rank检验筛选出影响因子。
对于连续变量,分别采用Wilcoxon signed-rank检验和ANOVA检验筛选出影响因子。
对于连续目标,采用ANOVA检验筛选出影响因子;
特征选择模块:最后,对筛选模块选出的所有候选特征,分别计算其统计检验p-value 值,选取p-value小于0.05的候选特征,作为特征构造器选取的最终特征。
通过特征构造模块处理,得到的数据以Dselect表示,选取的特征包括性别、年龄、高血压病、糖尿病、入院缺陷分级、GLU(血糖),LDLC(低密度脂蛋白胆固醇)或者 TG(甘油三酯)。
进一步说明,将特征构造模块得到的数据集Dselect,选取部分样本作为训练数据集Dtrain,进行模型训练,余下样本作为测试数据集Dtest进行模型测试。基于Barthel指数 进行多级预测分类,具体如下:
(a)Barthel总分预测,预测患者出院时候的总分(0~100分);
(b)Barthel总体缺陷等级是否提升的预测,预测患者出院时的缺陷等级(0~20分: 极严重功能缺陷;25~45:严重功能缺陷;50~70:中度功能缺陷;75~95:轻度功能缺陷:100:自理)提高的概率;
(c)Barthel指数各分项提高的概率,其中,Barthel指数各分项包括:大便、小便、修饰、用厕、吃饭、转移(床-椅)、活动(步行)、穿衣、上楼梯、洗澡。各项评分的 取值范围为0,5,10,15。分数越高,自理情况越好。
其中,所述模型训练针对不同目标的预测,分别尝试多种方法来建模:
方式1:对于训练数据集Dtrain中的连续性特征数据,采用了线性回归方法预测患者出院时的Barthel评分,得到Barthel总评分的预测模型。
方式2:对于训练数据集Dtrain中的结局数据,分别采用逻辑回归、随机森林和朴素贝叶斯方法方法,预测患者出院时的评分等级,以及处于各等级的概率,得到Barthel 评分对应的总体缺陷分级预测模型。
方式2:对于训练数据集Dtrain中的分类型特征数据,分别采用逻辑回归、随机森林和朴素贝叶斯方法二预测患者出院时Barthel评分等级及各分项评分提高的概率,得到Barthel 10项评分预测模型。
所述模型测试将测试数据集Dtest中的连续性特征数据、分类型特征数据和结局数据, 分别采用方式1、方式2以及方式3进行处理,预测结果采用性能评价指标(包括ROC 曲线下面积(AUC)、敏感性(sensitivity)、特异性(specificity)、阳性预测值(positivepredictive value,PPV)、准确率(accuracy)和R2)进行评估,得到康复预测最优化模型。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上 述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改, 这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的 特征可以任意相互组合。

Claims (10)

1.一种脑卒中患者康复预测方法,其特征在于,包括如下步骤:
数据预处理步骤:对历史数据进行数据预处理,得到数据建模所需的目标人群数据;
特征构造步骤:对目标人群数据进行数据划分,并对划分的数据进行特征构造得到数据集Dselect
模型训练步骤:选取数据集Dselect中的部分样本作为训练数据集Dtrain进行模型训练;
模型测试步骤:选取数据集Dselect中的余下样本作为测试数据集Dtest进行模型测试。
2.根据权利要求1所述的脑卒中患者康复预测方法,其特征在于,所述数据预处理步骤包括:
数据清洗步骤:对历史数据中的不规范数据进行数据清洗;
数据去缺失步骤:对历史数据中存在缺失的数据的分类型和连续型特征依照众数或者均值进行缺失数据填充;
入组筛选步骤:基于入组条件,对历史数据进行数据筛选。
3.根据权利要求1所述的脑卒中患者康复预测方法,其特征在于,所述特征构造步骤包括:
数据划分步骤:将经过数据预处理器得到的数据划分为不同特征数据;
特征筛选步骤:对不同特征数据用不同方法进行特征选择,筛选出影响因子作为候选特征;
特征检验步骤:对候选特征计算p-value值,选出p-value值小于设定阈值的候选特征作为最终特征。
4.根据权利要求1所述的脑卒中患者康复预测方法,其特征在于,所述模型训练步骤包括:
对于训练数据集Dtrain中的连续性特征数据,预测患者出院时的Barthel评分,得到Barthel总评分的预测模型;
对于训练数据集Dtrain中的结局数据,预测患者出院时的评分等级,以及处于各等级的概率,得到Barthel评分对应的总体缺陷分级预测模型;
对于训练数据集Dtrain中的分类型特征数据,预测患者出院时Barthel评分等级及各分项评分提高的概率,得到Barthel各项评分预测模型。
5.根据权利要求1所述的脑卒中患者康复预测方法,其特征在于,所述模型测试步骤包括:
将测试数据集Dtest中的连续性特征数据、分类型特征数据以及结局数据处理,预测结果采用性能评价指标进行评估,得到康复预测最优化模型。
6.一种脑卒中患者康复预测系统,其特征在于,包括如下模块:
数据预处理模块:用于对历史数据进行数据预处理,得到数据建模所需的目标人群数据;
特征构造模块:用于对目标人群数据进行数据划分,并对划分的数据进行特征构造得到数据集Dselect
模型训练模块:用于选取数据集Dselect中的部分样本作为训练数据集Dtrain进行模型训练;
模型测试模块:用于选取数据集Dselect中的余下样本作为测试数据集Dtest进行模型测试。
7.根据权利要求1所述的脑卒中患者康复预测系统,其特征在于,所述数据预处理模块包括:
数据清洗模块:用于对历史数据中的不规范数据进行数据清洗;
数据去缺失模块:用于对历史数据中存在缺失的数据的分类型和连续型特征依照众数或者均值进行缺失数据填充;
入组筛选模块:用于基于入组条件,对历史数据进行数据筛选。
8.根据权利要求1所述的脑卒中患者康复预测系统,其特征在于,所述特征构造模块包括:
数据划分模块:用于将经过数据预处理器得到的数据划分为不同特征数据;
特征筛选模块:用于对不同特征数据用不同系统进行特征选择,筛选出影响因子作为候选特征;
特征检验模块:用于对候选特征计算p-value值,选出p-value值小于设定阈值的候选特征作为最终特征。
9.根据权利要求1所述的脑卒中患者康复预测系统,其特征在于,所述模型训练模块包括:
对于训练数据集Dtrain中的连续性特征数据,预测患者出院时的Barthel评分,得到Barthel总评分的预测模型;
对于训练数据集Dtrain中的结局数据,预测患者出院时的评分等级,以及处于各等级的概率,得到Barthel评分对应的总体缺陷分级预测模型;
对于训练数据集Dtrain中的分类型特征数据,预测患者出院时Barthel评分等级及各分项评分提高的概率,得到Barthel各项评分预测模型。
10.根据权利要求1所述的脑卒中患者康复预测系统,其特征在于,所述模型测试模块包括:
将测试数据集Dtest中的连续性特征数据、分类型特征数据以及结局数据处理,预测结果采用性能评价指标进行评估,得到康复预测最优化模型。
CN201810136204.6A 2018-02-09 2018-02-09 脑卒中患者康复预测方法及系统 Pending CN108742513A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810136204.6A CN108742513A (zh) 2018-02-09 2018-02-09 脑卒中患者康复预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810136204.6A CN108742513A (zh) 2018-02-09 2018-02-09 脑卒中患者康复预测方法及系统

Publications (1)

Publication Number Publication Date
CN108742513A true CN108742513A (zh) 2018-11-06

Family

ID=63980071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810136204.6A Pending CN108742513A (zh) 2018-02-09 2018-02-09 脑卒中患者康复预测方法及系统

Country Status (1)

Country Link
CN (1) CN108742513A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110634571A (zh) * 2019-09-20 2019-12-31 四川省人民医院 肝移植术后预后预测系统
CN111383766A (zh) * 2018-12-28 2020-07-07 中山大学肿瘤防治中心 计算机数据处理方法、装置、介质及电子设备
CN111414943A (zh) * 2020-03-11 2020-07-14 山东科技大学 一种基于混合隐朴素贝叶斯模型的异常检测方法
CN112489807A (zh) * 2020-11-30 2021-03-12 中国人民解放军南部战区总医院 基于历史数据的加速康复数据处理方法、装置及介质
CN113192642A (zh) * 2021-04-01 2021-07-30 四川大学华西医院 外科患者术后恢复状态预测模型构建方法
CN113257374A (zh) * 2020-02-12 2021-08-13 阿里巴巴集团控股有限公司 口腔健康管理相关系统、方法、装置及设备
CN113743498A (zh) * 2021-09-02 2021-12-03 美视(杭州)人工智能科技有限公司 一种角膜塑形镜验配okai解决方法
CN114067947A (zh) * 2021-11-18 2022-02-18 杨成兴 基于数据共享与信息互通的云数据病例与传输系统
CN115553730A (zh) * 2022-10-10 2023-01-03 强联智创(北京)科技有限公司 对缺血性脑卒中的预后效果进行预测的方法和相关产品
CN117912634A (zh) * 2024-03-20 2024-04-19 中国人民解放军总医院第八医学中心 一种神经外科患者术后康复训练推荐方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106327396A (zh) * 2016-09-27 2017-01-11 中电科软件信息服务有限公司 医院业务数据管理平台及方法
CN106778042A (zh) * 2017-01-26 2017-05-31 中电科软件信息服务有限公司 心脑血管患者相似性分析方法及系统
CN106874663A (zh) * 2017-01-26 2017-06-20 中电科软件信息服务有限公司 心脑血管疾病风险预测方法及系统
CN107273652A (zh) * 2017-03-10 2017-10-20 马立伟 智能脑卒中风险监控系统
CN107273704A (zh) * 2017-07-12 2017-10-20 北京航空航天大学 一种脑卒中复发预测模型的建立方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106327396A (zh) * 2016-09-27 2017-01-11 中电科软件信息服务有限公司 医院业务数据管理平台及方法
CN106778042A (zh) * 2017-01-26 2017-05-31 中电科软件信息服务有限公司 心脑血管患者相似性分析方法及系统
CN106874663A (zh) * 2017-01-26 2017-06-20 中电科软件信息服务有限公司 心脑血管疾病风险预测方法及系统
CN107273652A (zh) * 2017-03-10 2017-10-20 马立伟 智能脑卒中风险监控系统
CN107273704A (zh) * 2017-07-12 2017-10-20 北京航空航天大学 一种脑卒中复发预测模型的建立方法及装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111383766A (zh) * 2018-12-28 2020-07-07 中山大学肿瘤防治中心 计算机数据处理方法、装置、介质及电子设备
CN110634571A (zh) * 2019-09-20 2019-12-31 四川省人民医院 肝移植术后预后预测系统
CN113257374A (zh) * 2020-02-12 2021-08-13 阿里巴巴集团控股有限公司 口腔健康管理相关系统、方法、装置及设备
CN111414943B (zh) * 2020-03-11 2022-05-13 山东科技大学 一种基于混合隐朴素贝叶斯模型的异常检测方法
CN111414943A (zh) * 2020-03-11 2020-07-14 山东科技大学 一种基于混合隐朴素贝叶斯模型的异常检测方法
CN112489807A (zh) * 2020-11-30 2021-03-12 中国人民解放军南部战区总医院 基于历史数据的加速康复数据处理方法、装置及介质
CN113192642A (zh) * 2021-04-01 2021-07-30 四川大学华西医院 外科患者术后恢复状态预测模型构建方法
CN113192642B (zh) * 2021-04-01 2023-02-28 四川大学华西医院 外科患者术后恢复状态预测模型构建系统
CN113743498A (zh) * 2021-09-02 2021-12-03 美视(杭州)人工智能科技有限公司 一种角膜塑形镜验配okai解决方法
CN114067947A (zh) * 2021-11-18 2022-02-18 杨成兴 基于数据共享与信息互通的云数据病例与传输系统
CN115553730A (zh) * 2022-10-10 2023-01-03 强联智创(北京)科技有限公司 对缺血性脑卒中的预后效果进行预测的方法和相关产品
CN115553730B (zh) * 2022-10-10 2024-05-28 强联智创(北京)科技有限公司 对缺血性脑卒中的预后效果进行预测的方法和相关产品
CN117912634A (zh) * 2024-03-20 2024-04-19 中国人民解放军总医院第八医学中心 一种神经外科患者术后康复训练推荐方法
CN117912634B (zh) * 2024-03-20 2024-05-24 中国人民解放军总医院第八医学中心 一种神经外科患者术后康复训练推荐方法

Similar Documents

Publication Publication Date Title
CN108742513A (zh) 脑卒中患者康复预测方法及系统
JP5645761B2 (ja) 医療データ解析方法、医療データ解析装置およびプログラム
Wang et al. Development of deep learning algorithm for detection of colorectal cancer in EHR data
US20220172841A1 (en) Methods of identifying individuals at risk of developing a specific chronic disease
CN101149767A (zh) 一种无创型健康评估模型的通用建立方法及其装置
CN113593708A (zh) 基于集成学习算法的脓毒症预后预测方法
Tomkins-Lane et al. Digital biomarkers of spine and musculoskeletal disease from accelerometers: defining phenotypes of free-living physical activity in knee osteoarthritis and lumbar spinal stenosis
Mounika et al. Prediction of type-2 diabetes using machine learning algorithms
CN116030972A (zh) 一种基于多层感知器神经网络模型的健康评估系统和方法
CN113128654B (zh) 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统
JP7404581B1 (ja) 自己監督グラフクラスタリングに基づく慢性腎症亜型マイニングシステム
Jaralba et al. A machine learning approach for initial screening of polycystic ovarian syndrome (PCOS)
Fisher et al. Identifying patients in need of palliative care: Adaptation of the Necesidades Paliativas CCOMS-ICO©(NECPAL) screening tool for use in Israel
CN117116475A (zh) 缺血性脑卒中的风险预测方法、系统、终端及存储介质
CN111081374A (zh) 基于共同注意力范式的孤独症辅助诊断装置
Meng et al. Prediction of coronary heart disease using routine blood tests
Robinson et al. A test of the fit between the Corbin and Strauss Trajectory Model and care provided to older patients after cancer surgery
Cui et al. Research on diabetes risk prediction model at early stage based on machine learning
WO2020213732A1 (ja) 過敏性腸症候群の検査方法
Lavrova et al. Catboost multi-classification of the various mycobacterial strains based on the biomarker concentrations and other physiological parameters
Lakshmi et al. A Review And Analysis Of The Role Of Machine Learning Techniques To Predict Health Risks Among Women During Menopause
Gauthier et al. Challenges to building a platform for a breast cancer risk score
AU2021102832A4 (en) System &amp; method for automatic health prediction using fuzzy based machine learning
Haque et al. A machine learning-based severity prediction tool for diabetic sensorimotor polyneuropathy using Michigan neuropathy screening instrumentations
Arif et al. Laboratory diagnostic pathways using machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20190410

Address after: Room 501-503, 43 Block 1485, Jialuo Road, Jiading District, Shanghai, 201800

Applicant after: Zhong electricity Ke software information Services Co., Ltd

Applicant after: Shanghai Changjiang science and Technology Development Co Ltd

Address before: Room 106-7, 50 Jiling Road, Jing'an District, Shanghai, 2003

Applicant before: Shanghai Changjiang science and Technology Development Co Ltd

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200618

Address after: Room 501-503, building 43, No. 1485, Jialuo Road, Jiading District, Shanghai, 201899

Applicant after: CETC SOFTWARE INFORMATION SERVICES Co.,Ltd.

Applicant after: CHANGJIANG COMPUTER Group Corp.

Address before: Room 501-503, 43 Block 1485, Jialuo Road, Jiading District, Shanghai, 201800

Applicant before: CETC SOFTWARE INFORMATION SERVICES Co.,Ltd.

Applicant before: SHANGHAI CHANGJIANG TECHNOLOGY DEVELOPMENT Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20181106

RJ01 Rejection of invention patent application after publication