CN106874663A - 心脑血管疾病风险预测方法及系统 - Google Patents

心脑血管疾病风险预测方法及系统 Download PDF

Info

Publication number
CN106874663A
CN106874663A CN201710057346.9A CN201710057346A CN106874663A CN 106874663 A CN106874663 A CN 106874663A CN 201710057346 A CN201710057346 A CN 201710057346A CN 106874663 A CN106874663 A CN 106874663A
Authority
CN
China
Prior art keywords
data
model
cardiovascular
feature
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710057346.9A
Other languages
English (en)
Inventor
童晓渝
章玉宇
崔修涛
王永明
熊伟
胡天龙
廖光源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhong Electricity Ke Software Information Services Co Ltd
Original Assignee
Zhong Electricity Ke Software Information Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhong Electricity Ke Software Information Services Co Ltd filed Critical Zhong Electricity Ke Software Information Services Co Ltd
Priority to CN201710057346.9A priority Critical patent/CN106874663A/zh
Publication of CN106874663A publication Critical patent/CN106874663A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu

Landscapes

  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种心脑血管疾病风险预测方法及系统,该方法包括以下步骤:步骤一,心脑血管疾病预后风险预测问题定义,步骤二,采集心脑血管患者的健康医疗数据,步骤三,对数据进行预处理,包括数据集成、数据清洗以及缺失数据处理,步骤四,进行特征构造和特征选择,识别出潜在的风险因子,步骤五,将识别出的风险因子和康复结局组成输入‑输出样本集,输入到随机森林算法中进行模型训练,并对模型的预测性能进行评估。本发明临床医生输入模型方法需要的心脑血管患者的健康医疗数据,通过模型得到患者未来某个时间段的预测康复结局,能够很好的进行预后风险预测,从而实现个性化的精准康复治疗。

Description

心脑血管疾病风险预测方法及系统
技术领域
本发明涉及一种智慧医疗领域,具体地,涉及一种心脑血管疾病风险预测方法及系统。
背景技术
心脑血管疾病泛指由于高脂血症、血液黏稠、动脉粥样硬化、高血压等所导致的心脏、大脑及全身组织发生的缺血性或出血性疾病,是心脏血管和脑血管疾病的统称。心脑血管疾病是一种严重威胁人类,特别是50岁以上中老年人健康的常见病,具有高患病率、高致残率和高死亡率的特点,即使应用目前最先进、完善的治疗手段,仍有50%以上的心脑血管疾病幸存者生活不能完全自理,全世界每年死于心脑血管疾病的人数高达1500万人,居各种死因首位。
预后预测是指预测疾病的可能病程和结局。它既包括判断疾病的特定后果,也包括提供时间线索,如预测某段时间内发生某种结局的可能性。早发现、早诊断、早治疗是改善预后的前提。心脑血管疾病患者的良好预后是患者生活质量的保障,也是医患双方进行康复治疗的首要目标。精准医疗的一个目标是能对心脑血管疾病患者的预后有准确的预测,从而能针对性地对康复项目进行调整,达到康复速度快,康复效果好的目标。
随着医疗信息化的发展,医院积累了大量的健康医疗数据。如何更好的利用这些数据以及医学知识,通过认知计算技术,提供精准医疗的决策是医院现阶段所需要的。认知计算有助于弥合数据量和数据洞察力之间的差距,帮助临床医生发掘数据中隐藏的洞察力。基于这些发掘的洞察力,认知模型可提供基于证据的选项,进而帮助决策并减少人为偏差,有助于医疗专业人员做出更加明智、及时的决策。
到目前为止,认知计算技术在中国人群心脑血管疾病预后风险预测方面尚属空白。而国外认知计算技术虽然已有成功应用案例,但主要解决的是肿瘤等疾病诊断领域,在心脑血管疾病的预后风险预测方面还尚未见有报道。鉴于国内外没有可用于预测心脑血管疾病预后风险的智能模型,很有必要建立一种预测准确度高、适用于临床医生应用的心脑血管疾病预后风险预测模型。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种心脑血管疾病风险预测方法及系统,其建立适合中国人群的心脑血管疾病预后风险预测模型,临床医生输入模型需要的患者健康医疗数据,通过模型得到患者未来某个时间段的预测康复结局,能够很好的进行预后风险预测,提前针对不同风险等级的患者人群进行康复训练方面的干预,从而实现个性化的精准康复治疗。
根据本发明的一个方面,提供一种心脑血管疾病风险预测方法,其特征在于,其包括以下步骤:
步骤一,问题定义,心脑血管疾病患者预后风险预测问题包括分析的目标人群、关心的预后结局、人群数据采集的观察窗口及预测时间窗口;
步骤二,数据采集,针对目标人群,从相关信息系统收集观察期窗口内的心脑血管疾病患者的医疗健康数据及预后结局数据;
步骤三,数据预处理,数据质量的好坏直接影响模型的预测效果,数据预处理针对数据集进行一系列的集成、清洗和缺失数据的处理,从而提高数据质量,采集的数据类型多种多样,其中包括选择项、日期时间、数值型、字符型以及是否型数据,不同数据类型使得数据预处理更加有挑战性,针对不同数据类型需要采取不同处理方法进行针对性数据预处理;
步骤四,特征工程,基于经过清洗的病人住院记录、健康状况特征所形成一系列观测向量,主要工作包括基于各种数据类型生成原始输入特征,数据类型的转换,并基于领域知识及历史数据生成新的输入特征;
步骤五,模型构建与评估,在众多的机器学习算法中,随机森林是一种利用多个分类树对数据进行判别与分类的方法,随机森林算法处理高维特征,同时还给出各个变量的重要性评分,评估各个变量在分类中所起的作用且易于实现并行化,利用选定的人群和输入特征及已知的康复结局,构建了随机森林预测模型。最后,使用ROC曲线和AUC值对模型的预测效果进行评估。
优选地,所述步骤二中数据采集所需要采集的数据包括:康复科门诊数据、康复科治疗室数据、神内/神外门诊数据、神内/神外住院数据、康复科住院数据、脑卒中筛查门诊数据,这些数据涉及的内容涵盖有患者基本信息、病历或电子病历、检测检验、影像、诊断、处方、治疗、评估表数据。
优选地,所述步骤三具体包括以下步骤:
步骤三十一,数据集成,把不同来源、格式、特点性质的数据整合到一起,从而为之后的分析和模型训练提供全面的数据,只需把不同来源的数据按照一定联系规则整合到一起,根据病人ID号把不同数据源但有同样ID号的信息连接在一起,这样所有来自不同数据源的数据就被整合到了一起;
步骤三十二,数据清洗,数据清洗的任务是通过各种措施从准确性、一致性、无冗余性角度清洗原始数据以提高数据质量,方便下一步缺失数据处理的操作;
步骤三十三,缺失值处理,是对数据集中所缺失的数据进行填充。
优选地,所述步骤五中具体包括以下步骤:
步骤五十一,原始训练数据集中的样本数为N(N是>1的正整数),应用bootstrap采样法有放回地随机抽取K个新的自助样本集,并由此构建K棵分类树,每次未被抽到的样本组成了K个袋外数据;其中K(K是>1的正整数)为模型参数,根据模型性能进行选择。
步骤五十二,设有mall(mall是>1的正整数)个变量,则在每一棵树的每个节点处随机抽取mtry(mtry是>1的正整数)个变量,然后在mtry中选择一个最具有分类能力的变量,变量分类的阈值通过检查每一个分类点确定;
步骤五十三,每棵树最大限度地生长,不做任何修剪;
步骤五十四,将生成的多棵分类树组成随机森林,用随机森林分类器对新的数据进行判别与分类,分类结果按树分类器的投票多少而定;
另外,模型的性能需要有标准的准则进行评估,进而指导我们调整参数,提高模型的性能,通过交叉验证技术验证模型的预测性能,并使用AUC(ROC曲线下面积)值作为性能评估指标,在ROC曲线中,以假阳性率(False Positive Rate)为x轴,以真阳性率(TruePositive Rate)为y轴,假阳性率指实际负样本中被错误预测为正样本的概率,真阳性率指实际正样本中被预测正确的概率,计算公式如下式:
本发明还提供一种心脑血管疾病风险预测系统,其特征在于,其包括:
问题定义模块,对心脑血管疾病患者预后风险预测问题进行定义;
数据采集模块,从相关信息系统收集观察期窗口内的心脑血管疾病患者的医疗健康数据及预后结局数据;
数据预处理模块,针对数据集进行一系列的集成、清洗和缺失数据的处理;
特征工程生成模块,基于经过清洗的病人住院记录、健康状况特征所形成一系列观测向量;
模型构建与评估模块,通过随机森林算法处理高维特征,同时还给出各个变量的重要性评分,评估各个变量在分类中所起的作用且易于实现并行化,利用选定的人群和输入特征及已知的康复结局,构建了随机森林预测模型;并对模型的预测效果进行评估;
数据库,存储不同来源、格式、特点性质的数据。
优选地,所述问题定义模块、数据采集模块、数据预处理模块、特征工程生成模块、模型构建与评估模块依次连接,数据采集模块与数据库连接。
与现有技术相比,本发明具有如下的有益效果:本发明建立适合中国人群的心脑血管疾病预后风险预测模型,临床医生输入模型需要的患者健康医疗数据,通过模型得到患者未来某个时间段的预测康复结局,能够很好的进行预后风险预测,提前针对不同风险等级的患者人群进行康复训练方面的干预,从而实现个性化的精准康复治疗,具有巨大的医疗和临床使用价值。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为心脑血管疾病风险预测方法流程图。
图2为预后风险预测模型图。
图3为特征选择的一般过程流程图。
图4为受试者工作特征(ROC)曲线对比图。
图5为本发明心脑血管疾病风险预测系统的原理框图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
如图1所示,本发明心脑血管疾病风险预测方法包括以下步骤:
步骤一,问题定义,心脑血管疾病患者预后风险预测问题包括分析的目标人群、关心的预后结局、人群数据采集的观察窗口及预测时间窗口;
步骤二,数据采集,针对目标人群,从相关信息系统收集观察期窗口内的心脑血管疾病患者的医疗健康数据及预后结局数据,所采集的数据包括:康复科门诊数据、康复科治疗室数据、神内/神外门诊数据、神内/神外住院数据、康复科住院数据、脑卒中筛查门诊数据等,这些数据涉及的内容涵盖有患者基本信息、病历或EMR(电子病历)、检测检验、影像、诊断、处方、治疗、评估表数据;
步骤三,数据预处理,数据质量的好坏直接影响模型的预测效果,数据预处理针对数据集进行一系列的集成、清洗和缺失数据的处理,从而提高数据质量,采集的数据类型多种多样,其中包括选择项(如性别为男/女)、日期时间、数值型(如检测值)、字符型(如诊断)以及是否型数据,不同数据类型使得数据预处理更加有挑战性,针对不同数据类型需要采取不同处理方法进行针对性数据预处理,具体处理过程如下:
步骤三十一,数据集成,把不同来源、格式、特点性质的数据整合到一起,从而为之后的分析和模型训练提供全面的数据,只需把不同来源的数据按照一定联系规则整合到一起,根据病人ID号把不同数据源但有同样ID号的信息连接在一起,这样所有来自不同数据源的数据就被整合到了一起;
步骤三十二,数据清洗,数据清洗的任务是通过各种措施从准确性、一致性、无冗余性角度清洗原始数据以提高数据质量,方便下一步缺失数据处理的操作;
步骤三十三,缺失值处理,是对数据集中所缺失的数据进行填充,医疗领域的特征数据普遍在时间序列上比较稀疏,因此如何处理缺失数据对整体数据集质量有很大的影响,会直接影响之后模型预测的结果,基于正则化最大期望算法进行缺失数据填补。
步骤四,特征工程,基于经过清洗的病人住院记录、健康状况等特征所形成一系列观测向量,主要工作包括基于各种数据类型生成原始输入特征,数据类型的转换,并基于领域知识及历史数据生成新的输入特征,例如计数特征、共生模式特征、集合统计特征等,通过特征构造(转换原始特征并衍生组合特征)和特征选择(从原始特征和组合特征中自动选择潜在的风险因素)技术识别潜在的风险因子;
经过以上步骤的处理,生成了用于模型训练的样本数据集,每个患者将被表示为由多个输入特征和单个目标预后结局组成的向量,并根据预后结局的好坏标记为正负例样本(建立的模型是一个分类器);
步骤五,模型构建与评估,在众多的机器学习算法中,随机森林是一种利用多个分类树对数据进行判别与分类的方法,随机森林算法能够处理高维特征,同时还能给出各个变量的重要性评分,评估各个变量在分类中所起的作用且易于实现并行化,利用选定的人群和输入特征及已知的康复结局,构建了随机森林预测模型,具体实现过程如下:
步骤五十一,原始训练数据集中样本数为N,应用bootstrap采样法有放回地随机抽取K个新的自助样本集,并由此构建K棵分类树,每次未被抽到的样本组成了K个袋外数据;
步骤五十二,设有mall个变量,则在每一棵树的每个节点处随机抽取mtry个变量,然后在mtry中选择一个最具有分类能力的变量,变量分类的阈值通过检查每一个分类点确定;
步骤五十三,每棵树最大限度地生长,不做任何修剪;
步骤五十四,将生成的多棵分类树组成随机森林,用随机森林分类器对新的数据进行判别与分类,分类结果按树分类器的投票多少而定;
另外,模型的性能需要有标准的准则进行评估,进而指导我们调整参数,提高模型的性能,通过交叉验证技术验证模型的预测性能,并使用AUC(ROC曲线下面积)值作为性能评估指标,在ROC曲线中,以假阳性率(False Positive Rate)为x轴,以真阳性率(TruePositive Rate)为y轴,假阳性率指实际负样本中被错误预测为正样本的概率,真阳性率指实际正样本中被预测正确的概率,计算如下式(1)和(2):
其中,TP(True Positive)表示正确预测到的正例的数量;FN(False Negative)把正例预测成负例的数量;FP(False Positive)把负例预测成正例的数量;TN(TrueNegative)正确预测到的负例的数量。
本实施例以从XXX医院康复所采集的700位有明确康复结局评定量表的脑卒中患者数据为样本,样本数据具体包括:患者的基本信息(性别、年龄、身高、体重、教育程度、婚姻状态等),体征数据(血压、心率),病史数据(门诊及住院诊断、用药史及治疗历史、检查检验历史及相关影像数据),进入康复科后的功能评估项目及结果。
步骤一,问题定义
如图2所示,基于所采集的数据,将建立以认知功能障碍为目标结局的预测模型,其中预测建模的目标人群为因脑卒中住院并接受康复治疗的患者;预测建模的目标结局为康复认知功能;用于建立模型的数据观察窗口为进入康复科后一周前的历史数据;模型适用的预测窗口为基础评估后预测未来一个月内的认知功能。
步骤二,数据集成
使用病人ID号将不同数据源但是有同样ID号的患者数据连接在一起,这样所有来自不同数据源的数据就整合到了同一个数据文件中。
步骤二十一,数据清洗
数据清洗的任务是通过各种措施从准确性、一致性、无冗余性角度清洗原始数据以提高数据质量,方便下一步缺失数据处理的操作;
步骤二十二,缺失值处理
在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量。在处理缺失数据时,缺失特征变量可被看作是无法观测的隐藏变量,可用最大期望算法来补充缺失的数据。此方法一般可以分为三步:1、计算最大期望;2、正则化最大期望,避免过度拟合;3、对上一步生成的方程进行评估;最大期望的详细计算方法如下:
1)EM(最大期望)算法步骤,最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在计算期望(E)步上求得的最大似然值来计算参数的值,最大化(M)步找到的参数估计值被用于下一个计算期望(E)步计算中,这个过程不断交替进行。
2)EM(最大期望)算法应用,用于估计无法观测的数据,y表示能够观察到的不完整变量值,用x表示无法观察到的变量值,在给定的观察到的数据条件下未知数据的条件如下式(3):
其中,p表示概率密度函数;x表示输入特征变量;y表示输出目标变量;θ表示模型的未知参数。
3)处理效果评估,采用标准误差(RMSE)对缺失数据的填充效果进行评估,RMSE(标准误差)能够很好地反映出所填充数据和真实数据的偏离程度,RMSE(标准误差)值越小,表示填充数据和真实数据的偏离程度越小,其精度越高,反之,RMSE(标准误差)越大,表示填充数据和真实数据的偏离程度越大,RMSE(标准误差)的数学表达式如下式(4):
其中,n为样本数;Xobs,i代表第i个观测值;Xmodel,i代表Xobs,i的模型预测值。
步骤三,特征工程,潜在风险因子识别
根据得到的数据集,基于集合运算(count,mean,min,max,std.)和领域知识(组合已有特征)的方法构造新特征,例如某个病人一天中可能有几个血压值,我们可以采用平均值,最大值或最小值最为血压这个特征变量的最后值。
如图3所示,采用的特征选择过程,具体包括产生过程、评价函数、停止准则、验证过程四个部分。
在产生过程中,采用基于启发式搜索的序列前向选择方法,假设特征子集X从空集开始,每次选择一个特征加入特征子集,使得特征函数最优,本实施例采用的评价函数是基于筛选器的方法,并且使用线性相关系数来衡量向量之间线性相关度,如下式(5):
其中,Xi表示第i个特征向量;Y表示目标输出向量;cov(Xi,Y)表示Xi和Y的协方差;var(Xi)和var(Y)分别表示Xi和Y的方差。
当评价函数值达到停止准则设定的阈值时停止搜索过程,最后在验证数据集上验证选出来的特征子集的有效性。
步骤四,预后风险模型训练和评估
将生成的特征变量作为输入向量矩阵,将未来一个月内的康复结局作为目标输出变量,为了降低模型参数对模型性能的影响,采用五折交叉验证法将数据集划分为训练集和测试集,将数据集随机划分为均匀的五份,每次都取其中一份作为测试集,另外四份作为训练集,每次都计算出真阳性率和假阳性率,将其平均值作为模型最后的真阳性率和假阳性率。
如图4所示,预测模型(Algorithm 1)和基于逻辑回归算法的预测模型(Algorithm2)在测试数据集上的ROC曲线对比,受试者工作特征(ROC)曲线下面积,即AUC值分别为0.798和0.706,相比于后者有了显著的提升。
如图5所示,本发明心脑血管疾病风险预测系统包括:
问题定义模块,对心脑血管疾病患者预后风险预测问题进行定义;
数据采集模块,从相关信息系统收集观察期窗口内的心脑血管疾病患者的医疗健康数据及预后结局数据;
数据预处理模块,针对数据集进行一系列的集成、清洗和缺失数据的处理;
特征工程生成模块,基于经过清洗的病人住院记录、健康状况特征所形成一系列观测向量;
模型构建与评估模块,通过随机森林算法处理高维特征,同时还给出各个变量的重要性评分,评估各个变量在分类中所起的作用且易于实现并行化,利用选定的人群和输入特征及已知的康复结局,构建了随机森林预测模型;并对模型预测效果进行性能方面的评估。
数据库,存储不同来源、格式、特点性质的数据。
问题定义模块、数据采集模块、数据预处理模块、特征工程生成模块、模型构建与评估模块依次连接,数据采集模块与数据库连接,这样方便连接。
综上所述,本发明建立适合中国人群的心脑血管疾病预后风险预测模型,临床医生输入模型需要的患者健康医疗数据,通过模型得到患者未来某个时间段的预测康复结局,能够很好的进行预后风险预测,提前针对不同风险等级的患者人群进行康复训练方面的干预,从而实现个性化的精准康复治疗,具有巨大的医疗和临床使用价值。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (6)

1.一种心脑血管疾病风险预测方法,其特征在于,其包括以下步骤:
步骤一,问题定义,心脑血管疾病患者预后风险预测问题包括分析的目标人群、关心的预后结局、人群数据采集的观察窗口及预测时间窗口;
步骤二,数据采集,针对目标人群,从相关信息系统收集观察期窗口内的心脑血管疾病患者的医疗健康数据及预后结局数据;
步骤三,数据预处理,数据质量的好坏直接影响模型的预测效果,数据预处理针对数据集进行一系列的集成、清洗和缺失数据的处理,从而提高数据质量。采集的数据类型多种多样,其中包括选择项、日期时间、数值型、字符型以及是否型数据,不同数据类型使得数据预处理更加有挑战性,针对不同数据类型需要采取不同处理方法进行针对性数据预处理;
步骤四,特征工程,基于经过清洗的病人住院记录、健康状况特征形成一系列观测向量,主要工作包括基于各种数据类型生成原始输入特征,数据类型的转换,并基于领域知识及历史数据生成新的输入特征;
步骤五,模型构建与评估,在众多的机器学习算法中,随机森林是一种利用多个分类树对数据进行判别与分类的方法,随机森林算法擅长处理高维特征,同时还给出各个变量的重要性评分,评估各个变量在分类中所起的作用且易于实现并行化。利用选定的人群和输入特征及已知的康复结局,构建了随机森林预测模型。
2.根据权利要求1所述的心脑血管疾病风险预测方法,其特征在于,所述步骤二中数据采集所需要采集的数据包括:康复科门诊数据、康复科治疗室数据、神内/神外门诊数据、神内/神外住院数据、康复科住院数据、脑卒中筛查门诊数据,这些数据涉及的内容涵盖有患者基本信息、病历或电子病历、检测检验、影像、诊断、处方、治疗、评估表数据。
3.根据权利要求1所述的心脑血管疾病风险预测方法,其特征在于,所述步骤三具体包括以下步骤:
步骤三十一,数据集成,把不同来源、格式、特点性质的数据整合到一起,从而为之后的分析和模型训练提供全面的数据,只需把不同来源的数据按照一定联系规则整合到一起,根据病人ID号把不同数据源但有同样ID号的信息连接在一起,这样所有来自不同数据源的数据就被整合到了一起;
步骤三十二,数据清洗,数据清洗的任务是通过各种措施从准确性、一致性、无冗余性角度清洗原始数据以提高数据质量,方便下一步缺失数据处理的操作;
步骤三十三,缺失值处理,是对数据集中所缺失的数据进行填充。
4.根据权利要求1所述的心脑血管疾病风险预测方法,其特征在于,所述步骤五中具体包括以下步骤:
步骤五十一,原始训练数据集的样本数为N,应用bootstrap采样法有放回地随机抽取K个新的自助样本集,并由此构建K棵分类树,每次未被抽到的样本组成了K个袋外数据;
步骤五十二,设有mall个变量,则在每一棵树的每个节点处随机抽取mtry个变量,然后在mtry中选择一个最具有分类能力的变量,变量分类的阈值通过检查每一个分类点确定;
步骤五十三,每棵树最大限度地生长,不做任何修剪;
步骤五十四,将生成的多棵分类树组成随机森林,用随机森林分类器对新的数据进行判别与分类,分类结果按树分类器的投票多少而定;
另外,模型的性能需要有标准的准则进行评估,进而指导调整模型参数,提高模型性能,通过交叉验证技术验证模型的预测性能,并使用ROC曲线和AUC值作为性能评估指标,在ROC曲线中,以假阳性率为x轴,以真阳性率为y轴,假阳性率指实际负样本中被错误预测为正样本的概率,真阳性率指实际正样本中被预测正确的概率,计算公式如下式:
T r u e P o s i t i v e R a t e = T P T P + F N
F a l s e P o s i t i v e R a t e = F P F P + T N .
5.一种心脑血管疾病风险预测系统,其特征在于,其包括:
问题定义模块,对心脑血管疾病患者预后风险预测问题进行定义;
数据采集模块,从相关信息系统收集观察期窗口内的心脑血管疾病患者的医疗健康数据及预后结局数据;
数据预处理模块,针对数据集进行一系列的集成、清洗和缺失数据的处理;
特征工程生成模块,基于经过清洗的病人住院记录、健康状况特征所形成一系列观测向量;
模型构建与评估模块,通过随机森林算法处理高维特征,同时还给出各个变量的重要性评分,评估各个变量在分类中所起的作用且易于实现并行化,利用选定的人群和输入特征及已知的康复结局,构建了随机森林预测模型;并使用ROC曲线和AUC值对模型的预测效果进行评估;
数据库,存储不同来源、格式、特点性质的数据。
6.根据权利要求5所述的心脑血管疾病风险预测系统,其特征在于,所述问题定义模块、数据采集模块、数据预处理模块、特征工程生成模块、模型构建与评估模块依次连接,数据采集模块与数据库连接。
CN201710057346.9A 2017-01-26 2017-01-26 心脑血管疾病风险预测方法及系统 Pending CN106874663A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710057346.9A CN106874663A (zh) 2017-01-26 2017-01-26 心脑血管疾病风险预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710057346.9A CN106874663A (zh) 2017-01-26 2017-01-26 心脑血管疾病风险预测方法及系统

Publications (1)

Publication Number Publication Date
CN106874663A true CN106874663A (zh) 2017-06-20

Family

ID=59158210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710057346.9A Pending CN106874663A (zh) 2017-01-26 2017-01-26 心脑血管疾病风险预测方法及系统

Country Status (1)

Country Link
CN (1) CN106874663A (zh)

Cited By (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107591204A (zh) * 2017-08-01 2018-01-16 山东大学 基于时序画像图的再住院预测方法和系统
CN107680680A (zh) * 2017-09-07 2018-02-09 广州九九加健康管理有限公司 基于精准健康管理的心脑血管疾病风险预警方法及系统
CN107680676A (zh) * 2017-09-26 2018-02-09 电子科技大学 一种基于电子病历数据驱动的妊娠期糖尿病预测方法
CN107833633A (zh) * 2017-10-30 2018-03-23 银江股份有限公司 一种高血压病人随访推荐的方法
CN107908819A (zh) * 2017-10-19 2018-04-13 深圳和而泰智能控制股份有限公司 预测用户状态变化的方法和装置
CN107910068A (zh) * 2017-11-29 2018-04-13 平安健康保险股份有限公司 投保用户的健康风险预测方法、装置、设备及存储介质
CN108109692A (zh) * 2017-11-08 2018-06-01 北京无极慧通科技有限公司 一种治疗方案的选择方法和系统
CN108257675A (zh) * 2018-02-07 2018-07-06 平安科技(深圳)有限公司 慢阻肺发病风险预测方法、服务器及计算机可读存储介质
CN108389626A (zh) * 2018-02-09 2018-08-10 上海长江科技发展有限公司 基于人工智能的脑卒中筛查方法及系统
CN108428478A (zh) * 2018-02-27 2018-08-21 东北师范大学 基于异质医疗数据挖掘的甲状腺癌风险预测方法
CN108509727A (zh) * 2018-03-30 2018-09-07 深圳市智物联网络有限公司 数据建模中的模型选择处理方法及装置
CN108573752A (zh) * 2018-02-09 2018-09-25 上海米因医疗器械科技有限公司 一种基于健康大数据的健康信息处理的方法及系统
CN108648827A (zh) * 2018-05-11 2018-10-12 北京邮电大学 心脑血管疾病风险预测方法及装置
CN108742513A (zh) * 2018-02-09 2018-11-06 上海长江科技发展有限公司 脑卒中患者康复预测方法及系统
CN108846532A (zh) * 2018-03-21 2018-11-20 宁波工程学院 应用于物流供应链平台的企业风险评估方法及装置
CN108986918A (zh) * 2018-06-28 2018-12-11 东软集团股份有限公司 辅助诊断方法、装置、终端设备和计算机存储介质
CN109009222A (zh) * 2018-06-19 2018-12-18 杨成伟 面向心脏病类型和严重程度的智能评估诊断方法及系统
CN109065175A (zh) * 2018-08-14 2018-12-21 平安医疗健康管理股份有限公司 医疗特征筛选方法、装置、计算机设备和存储介质
CN109117864A (zh) * 2018-07-13 2019-01-01 华南理工大学 基于异构特征融合的冠心病风险预测方法、模型及系统
CN109119167A (zh) * 2018-07-11 2019-01-01 山东师范大学 基于集成模型的脓毒症死亡率预测系统
CN109192312A (zh) * 2018-08-20 2019-01-11 中国人民解放军总医院 一种心力衰竭患者不良事件智能管理系统及方法
CN109215788A (zh) * 2018-08-22 2019-01-15 四川大学 一种口腔黏膜病损癌变危险程度的预测方法及装置
CN109359669A (zh) * 2018-09-10 2019-02-19 平安科技(深圳)有限公司 医保报销异常检测方法、装置、计算机设备和存储介质
CN109480780A (zh) * 2018-11-14 2019-03-19 重庆三峡医药高等专科学校 一种脑卒中预警系统及方法
CN109686446A (zh) * 2019-01-22 2019-04-26 江苏易透健康科技有限公司 一种基于双机器学习的血液透析治疗方案分析方法及系统
CN109785960A (zh) * 2018-12-29 2019-05-21 上海依智医疗技术有限公司 一种判别哮喘的方法及装置
CN109785430A (zh) * 2019-01-28 2019-05-21 上海交通大学医学院附属上海儿童医学中心 一种tapvc心上术后再狭窄的风险预测模型的构建方法及装置
CN109785976A (zh) * 2018-12-11 2019-05-21 青岛中科慧康科技有限公司 一种基于Soft-Voting的痛风病分期预测系统
CN109785961A (zh) * 2018-12-29 2019-05-21 上海依智医疗技术有限公司 一种判别哮喘的设备
CN109841278A (zh) * 2017-11-28 2019-06-04 长庚医疗财团法人林口长庚纪念医院 一种以心血管标志及机械学习运算法进行冠心症筛检的方法
CN110111892A (zh) * 2019-04-29 2019-08-09 杭州电子科技大学 一种nsclc患者术后短期复发转移风险评估系统
CN110120264A (zh) * 2019-04-19 2019-08-13 上海依智医疗技术有限公司 一种哮喘的预后评估方法及装置
CN110223779A (zh) * 2019-06-12 2019-09-10 吉林大学第一医院 一种肺癌患者的吸烟与患病关联性研究方法
CN110289061A (zh) * 2019-06-27 2019-09-27 黎檀实 一种创伤失血性休克伤情的时间序列预测方法
CN110289098A (zh) * 2019-05-17 2019-09-27 天津科技大学 一种基于临床检验和用药干预数据的风险预测方法
CN110347837A (zh) * 2019-07-17 2019-10-18 电子科技大学 一种心血管疾病非计划再住院风险预测方法
CN110364256A (zh) * 2019-06-21 2019-10-22 平安科技(深圳)有限公司 一种基于大数据的血管图像识别的疾病预测系统及方法
CN110403570A (zh) * 2018-04-28 2019-11-05 上海交通大学 一种基于综合体表多个部位自发荧光的检测和预测脑卒中发病及其预后的应用及其检测方法
CN110957036A (zh) * 2019-10-24 2020-04-03 中国人民解放军总医院 一种基于因果推理构建的疾病预后风险评估模型的方法
CN110957049A (zh) * 2019-11-21 2020-04-03 武汉明德生物科技股份有限公司 基于医疗大数据的卒中救治网络系统及其应用方法
CN111028944A (zh) * 2019-12-16 2020-04-17 南昌大学第二附属医院 一种基于核主成分分析和多项式特征的脑血管病神经功能损伤程度预测模型
CN111091911A (zh) * 2019-12-30 2020-05-01 重庆同仁至诚智慧医疗科技股份有限公司 一种卒中风险筛查系统及方法
CN111128372A (zh) * 2019-12-02 2020-05-08 重庆邮电大学 基于rf-lr改进算法的疾病预测方法
CN111243753A (zh) * 2020-02-27 2020-06-05 西安交通大学 一种面向医疗数据的多因素相关性交互式分析方法
CN111261282A (zh) * 2020-01-21 2020-06-09 南京航空航天大学 一种基于机器学习的脓毒症早期预测方法
CN111312398A (zh) * 2019-12-17 2020-06-19 南通市第二人民医院 一种脑卒中复发预测模型的建立方法及装置
CN111352966A (zh) * 2020-02-24 2020-06-30 交通运输部水运科学研究所 一种自主航行中的数据标签标定方法
CN111403024A (zh) * 2019-01-02 2020-07-10 天津幸福生命科技有限公司 一种基于医疗数据来获得疾病判定模型的方法及装置
CN111430029A (zh) * 2020-03-24 2020-07-17 浙江达美生物技术有限公司 基于人工智能的多维度脑卒中预防筛查方法
CN111640518A (zh) * 2020-06-02 2020-09-08 山东大学齐鲁医院 一种宫颈癌术后生存预测方法、系统、设备及介质
CN111681727A (zh) * 2020-06-09 2020-09-18 中南大学 Covid-19数据采集分析系统
CN111786476A (zh) * 2020-08-05 2020-10-16 湘潭大学 一种无线电能传输系统的接收线圈位置预测方法
CN111985584A (zh) * 2020-09-30 2020-11-24 平安科技(深圳)有限公司 基于多模态数据的疾病辅助检测设备、方法、装置及介质
CN112120790A (zh) * 2020-09-23 2020-12-25 常州市第一人民医院 一种基于指标评分的轻度缺血性脑卒中患者的预测模型
CN112365942A (zh) * 2020-10-20 2021-02-12 哈尔滨学院 一种传染病流行风险预测分析方法
CN112365978A (zh) * 2020-11-10 2021-02-12 北京航空航天大学 心动过速事件早期风险评估的模型的建立方法及其装置
CN112382395A (zh) * 2020-11-11 2021-02-19 上海森亿医疗科技有限公司 基于机器学习的一体化建模系统
CN112820368A (zh) * 2021-01-13 2021-05-18 中国人民解放军国防科技大学 重症患者数据集的构建方法、系统、设备和存储介质
CN112835316A (zh) * 2021-01-06 2021-05-25 重庆医科大学 新生儿败血症休克预测系统及监控设备
CN112951431A (zh) * 2021-03-30 2021-06-11 太原理工大学 基于医疗数据的充血性心衰风险预测方法、系统及设备、存储介质
WO2021120936A1 (zh) * 2019-12-19 2021-06-24 浙江大学 一种基于多任务学习模型的慢病预测系统
CN113053535A (zh) * 2021-04-20 2021-06-29 四川大学华西医院 一种医疗信息预测系统及医疗信息预测方法
CN113053528A (zh) * 2021-04-23 2021-06-29 中国人民解放军北部战区总医院 一种冠心病缺血风险评估方法和系统
CN113065646A (zh) * 2021-05-14 2021-07-02 杭州迪英加科技有限公司 一种能够实现ki67病理图像神经网络模型泛化性能的方法
CN113128654A (zh) * 2021-05-06 2021-07-16 中山大学 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统
CN113160992A (zh) * 2021-06-15 2021-07-23 四川大学华西医院 住院临床场景的预估方法、系统、计算机设备及存储介质
CN113223646A (zh) * 2020-10-27 2021-08-06 青海师范大学 一种高原胆石症患者信息采集管理系统
CN113257374A (zh) * 2020-02-12 2021-08-13 阿里巴巴集团控股有限公司 口腔健康管理相关系统、方法、装置及设备
CN113272911A (zh) * 2018-08-28 2021-08-17 纽优柔斯普林有限公司 一种用于诊断和治疗疾病的医疗设备和方法
CN113270193A (zh) * 2021-04-22 2021-08-17 江苏大学 一种基于机器学习的picc血栓风险预测方法
CN113488174A (zh) * 2021-08-05 2021-10-08 新乡医学院第一附属医院 用于预测急性脑血管病发生风险的方法
CN113707344A (zh) * 2021-08-30 2021-11-26 平安国际智慧城市科技股份有限公司 基于ai的患者康复跟踪方法、装置、服务器及介质
CN113707326A (zh) * 2021-10-27 2021-11-26 深圳迈瑞软件技术有限公司 临床预警方法及预警系统、存储介质
CN113782186A (zh) * 2021-09-08 2021-12-10 四川大学华西医院 一种辅助诊断衰弱的系统
CN113782209A (zh) * 2020-09-25 2021-12-10 北京大学 一种基于循环神经网络的慢性病患者智能预后方法及系统
WO2022036673A1 (zh) * 2020-08-20 2022-02-24 姚香怡 一种疾病风险评测报告自动生成平台及应用
CN114334064A (zh) * 2022-01-14 2022-04-12 四川大学华西医院 一种患者准入模型构建方法及系统
CN114420300A (zh) * 2022-01-20 2022-04-29 北京大学第六医院 中国老年认知损害预测模型
WO2022227280A1 (zh) * 2021-04-30 2022-11-03 中国人民解放军总医院第一医学中心 基于智能眼镜的灾害救援检伤分类及辅助诊断方法
WO2022246707A1 (zh) * 2021-05-26 2022-12-01 京东方科技集团股份有限公司 疾病风险预测方法、装置、存储介质及电子设备
CN115512844A (zh) * 2021-06-03 2022-12-23 四川大学 基于smote技术和随机森林算法的代谢综合征风险预测方法
CN115644823A (zh) * 2022-12-12 2023-01-31 中国科学院苏州生物医学工程技术研究所 康复效果动态预测及个体化干预方法和系统
CN115993444A (zh) * 2022-12-19 2023-04-21 郑州大学 一种用于人血清脑脊液gfap抗体的双色免疫荧光检测方法
CN116975297A (zh) * 2023-09-22 2023-10-31 北京利久医药科技有限公司 一种用于评估临床试验风险的方法
CN117174313A (zh) * 2023-09-03 2023-12-05 南通市康复医院(南通市第二人民医院) 一种脑出血患者神经功能预后预测模型的建立方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123395A (zh) * 2014-08-13 2014-10-29 北京赛科世纪数码科技有限公司 一种基于大数据的决策方法和系统
CN106021843A (zh) * 2015-03-23 2016-10-12 国际商业机器公司 使用个性化的预测模型识别并评级个体层面的风险因子

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123395A (zh) * 2014-08-13 2014-10-29 北京赛科世纪数码科技有限公司 一种基于大数据的决策方法和系统
CN106021843A (zh) * 2015-03-23 2016-10-12 国际商业机器公司 使用个性化的预测模型识别并评级个体层面的风险因子

Cited By (112)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107591204A (zh) * 2017-08-01 2018-01-16 山东大学 基于时序画像图的再住院预测方法和系统
CN107680680A (zh) * 2017-09-07 2018-02-09 广州九九加健康管理有限公司 基于精准健康管理的心脑血管疾病风险预警方法及系统
CN107680676B (zh) * 2017-09-26 2021-04-27 电子科技大学 一种基于电子病历数据驱动的妊娠期糖尿病预测方法
CN107680676A (zh) * 2017-09-26 2018-02-09 电子科技大学 一种基于电子病历数据驱动的妊娠期糖尿病预测方法
CN107908819A (zh) * 2017-10-19 2018-04-13 深圳和而泰智能控制股份有限公司 预测用户状态变化的方法和装置
CN107908819B (zh) * 2017-10-19 2021-05-11 深圳和而泰智能控制股份有限公司 预测用户状态变化的方法和装置
CN107833633A (zh) * 2017-10-30 2018-03-23 银江股份有限公司 一种高血压病人随访推荐的方法
CN108109692A (zh) * 2017-11-08 2018-06-01 北京无极慧通科技有限公司 一种治疗方案的选择方法和系统
CN109841278A (zh) * 2017-11-28 2019-06-04 长庚医疗财团法人林口长庚纪念医院 一种以心血管标志及机械学习运算法进行冠心症筛检的方法
CN107910068A (zh) * 2017-11-29 2018-04-13 平安健康保险股份有限公司 投保用户的健康风险预测方法、装置、设备及存储介质
CN108257675A (zh) * 2018-02-07 2018-07-06 平安科技(深圳)有限公司 慢阻肺发病风险预测方法、服务器及计算机可读存储介质
WO2019153595A1 (zh) * 2018-02-07 2019-08-15 平安科技(深圳)有限公司 慢阻肺发病风险预测方法、服务器及计算机可读存储介质
CN108389626A (zh) * 2018-02-09 2018-08-10 上海长江科技发展有限公司 基于人工智能的脑卒中筛查方法及系统
CN108742513A (zh) * 2018-02-09 2018-11-06 上海长江科技发展有限公司 脑卒中患者康复预测方法及系统
CN108573752A (zh) * 2018-02-09 2018-09-25 上海米因医疗器械科技有限公司 一种基于健康大数据的健康信息处理的方法及系统
CN108428478A (zh) * 2018-02-27 2018-08-21 东北师范大学 基于异质医疗数据挖掘的甲状腺癌风险预测方法
CN108428478B (zh) * 2018-02-27 2022-03-29 东北师范大学 基于异质医疗数据挖掘的甲状腺癌风险预测方法
CN108846532A (zh) * 2018-03-21 2018-11-20 宁波工程学院 应用于物流供应链平台的企业风险评估方法及装置
CN108509727B (zh) * 2018-03-30 2022-04-08 深圳市智物联网络有限公司 数据建模中的模型选择处理方法及装置
CN108509727A (zh) * 2018-03-30 2018-09-07 深圳市智物联网络有限公司 数据建模中的模型选择处理方法及装置
CN110403570A (zh) * 2018-04-28 2019-11-05 上海交通大学 一种基于综合体表多个部位自发荧光的检测和预测脑卒中发病及其预后的应用及其检测方法
CN108648827A (zh) * 2018-05-11 2018-10-12 北京邮电大学 心脑血管疾病风险预测方法及装置
CN109009222A (zh) * 2018-06-19 2018-12-18 杨成伟 面向心脏病类型和严重程度的智能评估诊断方法及系统
CN108986918A (zh) * 2018-06-28 2018-12-11 东软集团股份有限公司 辅助诊断方法、装置、终端设备和计算机存储介质
CN109119167A (zh) * 2018-07-11 2019-01-01 山东师范大学 基于集成模型的脓毒症死亡率预测系统
CN109117864A (zh) * 2018-07-13 2019-01-01 华南理工大学 基于异构特征融合的冠心病风险预测方法、模型及系统
CN109065175A (zh) * 2018-08-14 2018-12-21 平安医疗健康管理股份有限公司 医疗特征筛选方法、装置、计算机设备和存储介质
CN109192312B (zh) * 2018-08-20 2021-03-09 中国人民解放军总医院 一种心力衰竭患者不良事件智能管理系统及方法
CN109192312A (zh) * 2018-08-20 2019-01-11 中国人民解放军总医院 一种心力衰竭患者不良事件智能管理系统及方法
CN109215788B (zh) * 2018-08-22 2022-01-18 四川大学 一种口腔黏膜病损癌变危险程度的预测方法及装置
CN109215788A (zh) * 2018-08-22 2019-01-15 四川大学 一种口腔黏膜病损癌变危险程度的预测方法及装置
CN113272911A (zh) * 2018-08-28 2021-08-17 纽优柔斯普林有限公司 一种用于诊断和治疗疾病的医疗设备和方法
CN109359669A (zh) * 2018-09-10 2019-02-19 平安科技(深圳)有限公司 医保报销异常检测方法、装置、计算机设备和存储介质
CN109480780A (zh) * 2018-11-14 2019-03-19 重庆三峡医药高等专科学校 一种脑卒中预警系统及方法
CN109480780B (zh) * 2018-11-14 2021-08-24 重庆三峡医药高等专科学校 一种脑卒中预警系统的评估方法及系统
CN109785976A (zh) * 2018-12-11 2019-05-21 青岛中科慧康科技有限公司 一种基于Soft-Voting的痛风病分期预测系统
CN109785976B (zh) * 2018-12-11 2022-08-23 青岛智能产业技术研究院 一种基于Soft-Voting的痛风病分期预测系统
CN109785960A (zh) * 2018-12-29 2019-05-21 上海依智医疗技术有限公司 一种判别哮喘的方法及装置
CN109785961A (zh) * 2018-12-29 2019-05-21 上海依智医疗技术有限公司 一种判别哮喘的设备
CN111403024A (zh) * 2019-01-02 2020-07-10 天津幸福生命科技有限公司 一种基于医疗数据来获得疾病判定模型的方法及装置
CN109686446A (zh) * 2019-01-22 2019-04-26 江苏易透健康科技有限公司 一种基于双机器学习的血液透析治疗方案分析方法及系统
CN109785430A (zh) * 2019-01-28 2019-05-21 上海交通大学医学院附属上海儿童医学中心 一种tapvc心上术后再狭窄的风险预测模型的构建方法及装置
CN109785430B (zh) * 2019-01-28 2023-07-18 上海交通大学医学院附属上海儿童医学中心 Tapvc心上术后再狭窄的风险预测模型的构建方法
CN110120264A (zh) * 2019-04-19 2019-08-13 上海依智医疗技术有限公司 一种哮喘的预后评估方法及装置
CN110111892A (zh) * 2019-04-29 2019-08-09 杭州电子科技大学 一种nsclc患者术后短期复发转移风险评估系统
CN110289098B (zh) * 2019-05-17 2022-11-25 天津科技大学 一种基于临床检验和用药干预数据的风险预测方法
CN110289098A (zh) * 2019-05-17 2019-09-27 天津科技大学 一种基于临床检验和用药干预数据的风险预测方法
CN110223779A (zh) * 2019-06-12 2019-09-10 吉林大学第一医院 一种肺癌患者的吸烟与患病关联性研究方法
CN110364256A (zh) * 2019-06-21 2019-10-22 平安科技(深圳)有限公司 一种基于大数据的血管图像识别的疾病预测系统及方法
CN110289061B (zh) * 2019-06-27 2022-04-01 黎檀实 一种创伤失血性休克伤情的时间序列预测方法
CN110289061A (zh) * 2019-06-27 2019-09-27 黎檀实 一种创伤失血性休克伤情的时间序列预测方法
CN110347837A (zh) * 2019-07-17 2019-10-18 电子科技大学 一种心血管疾病非计划再住院风险预测方法
CN110347837B (zh) * 2019-07-17 2022-02-18 电子科技大学 一种心血管疾病非计划再住院风险预测方法
CN110957036B (zh) * 2019-10-24 2023-07-14 中国人民解放军总医院 一种基于因果推理构建的疾病预后风险评估模型的方法
CN110957036A (zh) * 2019-10-24 2020-04-03 中国人民解放军总医院 一种基于因果推理构建的疾病预后风险评估模型的方法
CN110957049A (zh) * 2019-11-21 2020-04-03 武汉明德生物科技股份有限公司 基于医疗大数据的卒中救治网络系统及其应用方法
CN111128372A (zh) * 2019-12-02 2020-05-08 重庆邮电大学 基于rf-lr改进算法的疾病预测方法
CN111028944A (zh) * 2019-12-16 2020-04-17 南昌大学第二附属医院 一种基于核主成分分析和多项式特征的脑血管病神经功能损伤程度预测模型
CN111312398B (zh) * 2019-12-17 2022-03-01 南通市第二人民医院 一种脑卒中复发预测模型的建立方法及装置
CN111312398A (zh) * 2019-12-17 2020-06-19 南通市第二人民医院 一种脑卒中复发预测模型的建立方法及装置
WO2021120936A1 (zh) * 2019-12-19 2021-06-24 浙江大学 一种基于多任务学习模型的慢病预测系统
CN111091911A (zh) * 2019-12-30 2020-05-01 重庆同仁至诚智慧医疗科技股份有限公司 一种卒中风险筛查系统及方法
CN111261282A (zh) * 2020-01-21 2020-06-09 南京航空航天大学 一种基于机器学习的脓毒症早期预测方法
CN113257374A (zh) * 2020-02-12 2021-08-13 阿里巴巴集团控股有限公司 口腔健康管理相关系统、方法、装置及设备
CN111352966A (zh) * 2020-02-24 2020-06-30 交通运输部水运科学研究所 一种自主航行中的数据标签标定方法
CN111243753A (zh) * 2020-02-27 2020-06-05 西安交通大学 一种面向医疗数据的多因素相关性交互式分析方法
CN111243753B (zh) * 2020-02-27 2024-04-02 西安交通大学 一种面向医疗数据的多因素相关性交互式分析方法
CN111430029A (zh) * 2020-03-24 2020-07-17 浙江达美生物技术有限公司 基于人工智能的多维度脑卒中预防筛查方法
CN111640518A (zh) * 2020-06-02 2020-09-08 山东大学齐鲁医院 一种宫颈癌术后生存预测方法、系统、设备及介质
CN111681727A (zh) * 2020-06-09 2020-09-18 中南大学 Covid-19数据采集分析系统
CN111786476A (zh) * 2020-08-05 2020-10-16 湘潭大学 一种无线电能传输系统的接收线圈位置预测方法
WO2022036673A1 (zh) * 2020-08-20 2022-02-24 姚香怡 一种疾病风险评测报告自动生成平台及应用
CN112120790A (zh) * 2020-09-23 2020-12-25 常州市第一人民医院 一种基于指标评分的轻度缺血性脑卒中患者的预测模型
CN113782209A (zh) * 2020-09-25 2021-12-10 北京大学 一种基于循环神经网络的慢性病患者智能预后方法及系统
CN111985584B (zh) * 2020-09-30 2021-01-08 平安科技(深圳)有限公司 基于多模态数据的疾病辅助检测设备、方法、装置及介质
CN111985584A (zh) * 2020-09-30 2020-11-24 平安科技(深圳)有限公司 基于多模态数据的疾病辅助检测设备、方法、装置及介质
CN112365942A (zh) * 2020-10-20 2021-02-12 哈尔滨学院 一种传染病流行风险预测分析方法
CN113223646A (zh) * 2020-10-27 2021-08-06 青海师范大学 一种高原胆石症患者信息采集管理系统
CN112365978A (zh) * 2020-11-10 2021-02-12 北京航空航天大学 心动过速事件早期风险评估的模型的建立方法及其装置
CN112382395B (zh) * 2020-11-11 2021-10-15 上海森亿医疗科技有限公司 基于机器学习的一体化建模系统
CN112382395A (zh) * 2020-11-11 2021-02-19 上海森亿医疗科技有限公司 基于机器学习的一体化建模系统
CN112835316B (zh) * 2021-01-06 2022-04-19 重庆医科大学 新生儿败血症休克预测系统及监控设备
CN112835316A (zh) * 2021-01-06 2021-05-25 重庆医科大学 新生儿败血症休克预测系统及监控设备
CN112820368A (zh) * 2021-01-13 2021-05-18 中国人民解放军国防科技大学 重症患者数据集的构建方法、系统、设备和存储介质
CN112951431A (zh) * 2021-03-30 2021-06-11 太原理工大学 基于医疗数据的充血性心衰风险预测方法、系统及设备、存储介质
CN113053535B (zh) * 2021-04-20 2022-07-22 四川大学华西医院 一种医疗信息预测系统及医疗信息预测方法
CN113053535A (zh) * 2021-04-20 2021-06-29 四川大学华西医院 一种医疗信息预测系统及医疗信息预测方法
CN113270193A (zh) * 2021-04-22 2021-08-17 江苏大学 一种基于机器学习的picc血栓风险预测方法
CN113053528A (zh) * 2021-04-23 2021-06-29 中国人民解放军北部战区总医院 一种冠心病缺血风险评估方法和系统
WO2022227280A1 (zh) * 2021-04-30 2022-11-03 中国人民解放军总医院第一医学中心 基于智能眼镜的灾害救援检伤分类及辅助诊断方法
CN113128654B (zh) * 2021-05-06 2023-12-19 中山大学 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统
CN113128654A (zh) * 2021-05-06 2021-07-16 中山大学 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统
CN113065646A (zh) * 2021-05-14 2021-07-02 杭州迪英加科技有限公司 一种能够实现ki67病理图像神经网络模型泛化性能的方法
WO2022246707A1 (zh) * 2021-05-26 2022-12-01 京东方科技集团股份有限公司 疾病风险预测方法、装置、存储介质及电子设备
CN115512844B (zh) * 2021-06-03 2023-05-23 四川大学 基于smote技术和随机森林算法的代谢综合征风险预测方法
CN115512844A (zh) * 2021-06-03 2022-12-23 四川大学 基于smote技术和随机森林算法的代谢综合征风险预测方法
CN113160992A (zh) * 2021-06-15 2021-07-23 四川大学华西医院 住院临床场景的预估方法、系统、计算机设备及存储介质
CN113488174A (zh) * 2021-08-05 2021-10-08 新乡医学院第一附属医院 用于预测急性脑血管病发生风险的方法
CN113707344A (zh) * 2021-08-30 2021-11-26 平安国际智慧城市科技股份有限公司 基于ai的患者康复跟踪方法、装置、服务器及介质
CN113707344B (zh) * 2021-08-30 2023-07-21 深圳平安智慧医健科技有限公司 基于ai的患者康复跟踪方法、装置、服务器及介质
CN113782186A (zh) * 2021-09-08 2021-12-10 四川大学华西医院 一种辅助诊断衰弱的系统
CN113707326A (zh) * 2021-10-27 2021-11-26 深圳迈瑞软件技术有限公司 临床预警方法及预警系统、存储介质
CN114334064A (zh) * 2022-01-14 2022-04-12 四川大学华西医院 一种患者准入模型构建方法及系统
CN114420300B (zh) * 2022-01-20 2023-08-04 北京大学第六医院 中国老年认知损害预测模型
CN114420300A (zh) * 2022-01-20 2022-04-29 北京大学第六医院 中国老年认知损害预测模型
CN115644823A (zh) * 2022-12-12 2023-01-31 中国科学院苏州生物医学工程技术研究所 康复效果动态预测及个体化干预方法和系统
CN115644823B (zh) * 2022-12-12 2023-04-18 中国科学院苏州生物医学工程技术研究所 康复效果动态预测及个体化干预系统
CN115993444A (zh) * 2022-12-19 2023-04-21 郑州大学 一种用于人血清脑脊液gfap抗体的双色免疫荧光检测方法
CN117174313A (zh) * 2023-09-03 2023-12-05 南通市康复医院(南通市第二人民医院) 一种脑出血患者神经功能预后预测模型的建立方法及系统
CN117174313B (zh) * 2023-09-03 2024-05-10 南通市康复医院(南通市第二人民医院) 一种脑出血患者神经功能预后预测模型的建立方法及系统
CN116975297A (zh) * 2023-09-22 2023-10-31 北京利久医药科技有限公司 一种用于评估临床试验风险的方法
CN116975297B (zh) * 2023-09-22 2023-12-01 北京利久医药科技有限公司 一种用于评估临床试验风险的方法

Similar Documents

Publication Publication Date Title
CN106874663A (zh) 心脑血管疾病风险预测方法及系统
CN110957015B (zh) 电子医疗记录数据的缺失值填充方法
CN103714261B (zh) 二阶段混合模型的智能辅助医疗决策支持方法
CN106778042A (zh) 心脑血管患者相似性分析方法及系统
Nagadeepa et al. Artificial Intelligence based Cervical Cancer Risk Prediction Using M1 Algorithms
Mohapatra et al. Comparative approaches by using machine learning algorithms in breast cancer prediction
CN112768074A (zh) 一种基于人工智能的重疾风险预测方法及系统
CN101596125A (zh) 一种具备直观显示的健康信息显示系统、方法及其接口
CN110610766A (zh) 基于症状特征权重推导疾病概率的装置和存储介质
CN109934352A (zh) 智能模型的自动进化方法
Challab et al. A Hybrid Method Based on LSTM and Optimized SVM for Diagnosis of Novel Coronavirus (COVID-19).
CN108346471A (zh) 一种病理数据的分析方法及装置
Kavya et al. Heart Disease Prediction Using Logistic Regression
Arumugam et al. Prediction of severity of Knee Osteoarthritis on X-ray images using deep learning
Akter et al. CKD. Net: A novel deep learning hybrid model for effective, real-time, automated screening tool towards prediction of multi stages of CKD along with eGFR and creatinine
Goel et al. Data Mining in Healthcare using Machine Learning Techniques
Pradheep et al. Fruit Disease Classification using Convolutional Neural Network
Si et al. Using Bayesian networks to built a diagnosis and prognosis model for breast cancer
Abhilash et al. Prognostication Of Diabetes Using Data Mining Models
EP4224373A1 (en) System for forecasting a mental state of a subject and method
Arora et al. Medical Search Engine
Mishra et al. Optimizing Heart Disease Prediction Model with GridsearchCV for Hyperparameter Tuning
Godbin et al. Leveraging Radiomics and Genetic Algorithms to Improve Lung Infection Diagnosis in X-Ray Images using Machine Learning
Gupta et al. Novel Optical Coherence Tomography Scan Based Diabetic Retinopathy Detection Using Neural Network
Halawani et al. Nature-Inspired Metaheuristic Algorithm with deep learning for Healthcare Data Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170620