CN107085666B - 疾病风险评估与个性化健康报告生成系统及方法 - Google Patents
疾病风险评估与个性化健康报告生成系统及方法 Download PDFInfo
- Publication number
- CN107085666B CN107085666B CN201710374525.5A CN201710374525A CN107085666B CN 107085666 B CN107085666 B CN 107085666B CN 201710374525 A CN201710374525 A CN 201710374525A CN 107085666 B CN107085666 B CN 107085666B
- Authority
- CN
- China
- Prior art keywords
- risk
- physical examination
- health
- model
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了疾病风险评估与个性化健康报告生成系统及方法;输入纵向健康体检大数据;对数据进行整理;根据疾病的名称对疾病的各项指标阈值范围进行定义,同时根据疾病的各项指标阈值范围,利用sas软件建立对应疾病的队列;建立队列之后,利用cox单因素回归分析方法对每个变量均进行变量选择;最后将纳入cox回归模型的变量进行多因素回归分析;构建cox比例风险模型;对cox比例风险模型内部进行验证,对cox比例风险模型外部进行验证;得到疾病预测模型;生成疾病风险评估双曲线;输入新个体体检指标,根据疾病预测模型和疾病风险评估双曲线,生成疾病风险评估结果,同时根据预先设定的指标,输出疾病风险评估与个性化健康报告。
Description
技术领域
本发明涉及一种疾病风险评估与个性化健康报告生成系统及方法。
背景技术
慢性病已经成为全球重大公共卫生问题之一,约80%的死亡可以归因于慢性病。慢性病的不可逆性严重影响患者的生活质量,给社会和家庭带来沉重的经济负担。发达国家的理论研究和实践探索已证实慢性病健康管理(health management,HM)是低成本高效益的预防和控制策略。
HM是对个人及人群的健康危险因素进行全面管理的过程,其宗旨是调动个人及集体的积极性,有效地利用有限资源来达到最大的健康效果。具体做法是在对个人健康状况进行评价的基础上,提供有针对性的HM计划,并鼓励和促使人们采取行动来改善和维护自己的健康。HM是一项连续的、动态的系统工程,它包括三个基本步骤,即个体健康信息采集、健康风险评估和健康干预。
中国的HM始于上世纪90年代末,其主体是综合医院健康体检中心或专业健康体检中心,主要执行了个体健康信息采集的功能,由于缺乏基于中国队列人群的风险评估模型及健康干预的科学依据,基本未对体检个体进行有效的健康风险评估和健康干预。
此外,健康体检数据已成为流行病学数据的热点来源,相对于普通的流行病学调查数据,健康体检数据具有信息量全面、丰富、大型,样本含量大,技术一致且稳定等优点,可较为突出的反映出一定范围人群的健康状况及疾病特点。健康体检数据是一种典型的纵向监测数据,积累着人群多年的、全面的健康信息,但并未得到充分利用。
发明内容
本发明的目的就是为了解决上述问题,提供疾病风险评估与个性化健康报告生成系统及方法,它具有利用已有健康体检数据,对个体的疾病风险进行精确评估,生成个性化健康报告的优点。
为了实现上述目的,本发明采用如下技术方案:
疾病风险评估与个性化健康报告生成系统,包括:
IaaS层:用于提供硬件及网络资源环境,以及负载均衡服务;
DaaS层,用于对数据进行结构化、集约化和虚拟化处理,集中对数据进行聚合、质量管理或数据清洗处理,然后再将数据提供给不同的应用和服务。
PaaS层,用于在网上提供各种开发和分发应用的解决方案,为系统提供各种应用的解决方案,根据不同的服务应用,调用PaaS层相应的模块组合生成相应的解决方案;
SaaS层用于针对不同的服务对象,提供不同的服务,是系统的控制访问层,根据用户的不同访问需要,提供不同的应用服务。针对体检机构用户、政府机构用户、行业团体用户和体检人员,系统提供不同的应用服务;
所述访问层,包括:体检机构PC端,保证体检机构用户能够在PC端访问系统应用;政府部门PC端,保证政府用户能够在PC端访问系统应用;行业团体PC端,保证行业团体用户能够在PC端访问系统应用;体检人员移动终端,保证体检人员能够在移动端访问系统应用;微信公众平台,保证体检人员能够在微信公众平台访问系统应用;
第三方接口,用于更好的与体检系统和CA安全认证系统等进行对接。
IaaS层,包括:云中心资源管理模块和资源池,其中,资源池,包括:应用资源池、存储资源池和网络及资源安全池。
云中心资源管理模块,针对各种系统应用服务所需的硬件和网络资源进行合理的调配和管理,保证系统资源的高效使用和运转。
应用资源池,用于管理云中心的应用服务器资源,合理安排和调配相应的资源配置,保证应用服务的安全和高效运行;
存储资源池,用于管理云中心的硬件存储资源,合理安排和调配相应的硬件存储资源。
网络及资源安全池,用于管理云中心的网络及资源安全,合理的安排和调配相应的带宽设置和防火墙安全资源配置。
DaaS层,包括:用户信息库、调查问卷信息库、体检信息库、评估报告库和模型算法库;
用户信息库,用于存储和管理用户的个人基本信息;
调查问卷信息库,用于存储和管理用户填写的调查问卷信息;
体检信息库,用于存储和管理体检者的体检信息;
评估报告库,用于存储和管理体检者的评估报告结果和生成的评估报告;
模型算法库,用于存储和管理健康评估所使用到的模型算法;
PaaS层,包括:报告模板管理模块、webservice接口管理模块、用户管理模块、健康评估模块、模型算法管理模块、APP接口管理模块、微信公众平台接口、数据交换服务模块;
报告模板管理模块,用于管理评估报告的模板,根据不同的客户需要,使用相应的模板,生成与其对应的评估报告;
webservice接口管理模块,用于对外提供服务的webservice接口,让风险评估服务以webservice接口的形式对外提供风险评估服务;
用户管理模块,用于管理系统中存储的用户数据信息,保证数据的安全性和完整性;
健康评估模块,用于采集相应的指标信息和生成相应的评估报告,是整个系统中连接用户信息和模型算法的关键模块,接收用户填写的指标信息,根据查看请求输出相应的评估报告结果和个性化健康干预结论;
模型算法管理模块,用于提供健康评估的所有模型算法,是系统的核心模块,健康评估模块通过调用相应的模型算法,生成计算出相应的评估结果;
APP接口管理模块,用于提供与手机APP相应的接口,由于手机APP是通过互联网与系统进行通信,为了安全性,系统与手机APP的通信是使用相应的接口来实现的;
微信公众平台接口,用于提供与微信公众平台相应的接口,由于微信公众平台是通过互联网与系统进行通信,为了安全性,系统与微信公众平台的通信是使用相应的接口来实现的;
数据交换服务模块,用于实现数据在应用服务和数据库之间的交互,可以把数据从数据库中查询返回给应用服务,同时也可以将应用服务产生的数据存储进入数据库。
SaaS层,包括:面向体检机构模块、面向政府机构模块、面向行业团体模块和面向体检人员模块;
所述面向体检机构模块包括:
体检机构评估管理单元,用于采集体检机构的体检信息,调用相应的模型算法和模板生成对应的健康风险评估报告;
体检机构报告管理单元,对已生成完成的评估报告进行管理,体检机构调用相应的接口程序进行报告的预览、打印和下载;
健康干预单元,针对已经生成的评估报告结果系统会提供个性化的健康干预方案,个性化的健康干预方案,包括饮食、运动、生活方式、心理健康和用药指导;
评估统计单元,对体检机构的评估报告数量进行统计汇总;
用户管理单元,用于管理体检机构中体检用户的基础信息;
所述面向政府机构模块,包括:
政府机构评估管理单元,用于采集民众的体检信息,调用相应的模型算法和模板生成对应的健康风险评估报告;
政府机构报告管理单元,用于对于生成完成的评估报告进行管理,承载政府机构人员体检的体检机构能够调用相应的接口程序进行报告的预览、打印和下载;
干预随访单元,针对已经生成的评估报告结果系统提供个性化的健康干预方案,个性化的健康干预方案,包括饮食、运动、生活方式、心理健康和用药指导;
人员管理单元,用于管理政府部门管辖下民众的基础信息;
所述面向行业团体模块,包括:
行业团体评估管理单元,用于采集行业团体下的客户的体检信息,调用相应的模型算法和模板生成对应的健康风险评估报告;
评估推荐单元,针对行业团体的需要,基于风险评估的结果,给行业团体推荐相应的产品和服务;
所述面向体检人员模块,包括:
健康档案单元,用于面向体检人员,为其建立完整的健康档案,健康档案包括个人基本信息、历次的体检信息、历次的健康评估结果和干预方案;
个人中心单元,用于面向体检人员,体检人员提供了个人中心功能,允许通过多种方式登陆进入系统查看其个人的健康档案信息;
手机APP单元,用于面向体检人员,为体检人员提供了手机APP服务,体检者允许使用相应手机APP来查看和访问相应的个人信息;
微信公众平台,用于面向体检人员,为体检人员提供了微信公众平台,体检者能够应用微信公众平台来查看和访问相应的个人信息。
访问层,用于对外提供应用访问,服务对象包括体检机构、政府部门、行业团体和体检人员,针对前三个服务对象开通PC端服务,针对体检人员开通PC端或移动终端服务;
第三方接口包括:体检系统、CA认证系统;
体检系统,系统预留了相应的接口,可以与多种体检系统直接进行对接;
CA认证系统,为了安全访问的需要,系统提供了与CA安全认证系统的接口。
疾病风险评估与个性化健康报告生成方法,包括如下步骤:
步骤(1):输入纵向健康体检大数据;所述纵向健康体检大数据,包括设定时间范围内,跨地域的若干家健康体检机构提供的健康体检数据;
步骤(2):对数据进行整理:包括对数据的标准化处理、人员去重处理、变量对照处理、疾病对照处理和结构化审核处理,最终得到需要的结构化数据;
步骤(3):根据疾病的名称对疾病的各项指标阈值范围进行定义,同时根据疾病的各项指标阈值范围,利用sas软件建立对应疾病的队列;
步骤(4):建立队列之后,利用cox单因素回归分析方法对每个变量均进行变量选择;最后将纳入cox回归模型的变量进行多因素回归分析;
步骤(5):利用多因素回归分析方法,构建cox比例风险模型;
步骤(6):对cox比例风险模型内部进行验证,对cox比例风险模型外部进行验证;得到疾病预测模型;
步骤(7):生成疾病风险评估双曲线:平均风险评估曲线和低风险评估曲线;
步骤(8):输入新个体体检指标,根据步骤(6)的疾病预测模型和步骤(7)的疾病风险评估双曲线,生成疾病风险评估结果,同时根据预先设定的体检指标,输出包括体检指标、疾病的发病风险、风险年龄、风险等级和干预处方的疾病风险评估与个性化健康报告。
所述干预处方包括:饮食处方、运动处方、生活方式处方及精神方面处方。
所述生成疾病风险评估双曲线,包括:并发进行的平均风险评估曲线绘制步骤和低风险评估曲线绘制步骤;
平均风险评估曲线绘制步骤:
步骤(701):将队列数据代入模型
p(t)表示:表示累积发病风险;S0(t)表示:表示基准生存率;β0表示:βi表示体检指标的系数;xi表示:第i个体检指标;xi′表示第i个体检指标的均值;exp,高等数学里以自然常数e为底的指数函数
步骤(702):计算出队列中每个人的疾病发病风险p(t);
步骤(703):对每个人的累积发病风险根据年龄分组(每个年龄一组(20岁的一组,21岁的一组,22岁的一组,…)),对于每个组中的疾病累积发病风险P进行正态性检验,P表示每个人的累积发病风险,是一个常数,使用计算得出的;p(t)表示累积发病风险,与t有关,用来计算每个人的累积发病风险;若满足正态性检验,则取每个年龄累积发病风险的平均值P_mean为该年龄人群平均风险p;若不满足正态性检验,则取每个年龄累积发病风险的中位数P_median为该年龄人群平均风险p;
步骤(704):将每组(age,p)对应直角坐标系中的点,用直线连接,形成折线图;age表示个体的年龄;
低风险评估曲线绘制步骤,包括:
步骤(711):取出cox比例风险模型中用到的指标xi的基线数据;
步骤(712):计算指标xi的1%分位数xi,1%;计算指标xi的99%分位数xi,99%;
步骤(714):将Xi带入到模型
步骤(715):画出低风险值随年龄的折线图;
步骤(716):对折线图通过拟合得到最优趋势线,即平均风险线。
风险年龄的计算方法为:
首先计算出体检者的累积发病风险P,然后对比平均风险线,看哪个年龄的平均风险p与P最接近,哪个年龄就是体检者的风险年龄。
所述标准化处理是指:对新输入的变量,首先判断新变量是否是变量标准数据库里面已经存在的变量,若已经存在,则删除;若不存在,则依据变量标准数据库变量的标准编码的编码规则对新的变量进行重新编码,将重新编码后的变量存储到变量标准数据库中。
所述人员去重处理是指:根据体检人员的标准编码,删除重复的体检人员;
所述变量对照处理是指:将新的变量名与变量标准数据库中的标准编码建立一一对应关系,便于查阅;
所述疾病对照处理是指:将原始数据中疾病名称与标准ICD10疾病名称和ICD10编码建立一一对应关系;
所述结构化审核处理是指:将原始数据中B超文本数据、CT文本数据、心电图文本数据、问诊文本数据,分词成结构化数据。
所述步骤(4)用cox单因素回归分析进行变量选择的目的:由于在进行cox多因素回归分析之前,待考虑的与结局有关的变量较多,所以先通过cox单因素回归分析筛掉一些与疾病结局相关性较小的变量,即单因素回归分析在起到变量选择的作用。
所述步骤(4)用单因素回归分析进行变量选择的步骤:
步骤(41):确定要分析的自变量xi;
步骤(42):利用sas统计软件进行cox单因素回归分析,得到单因素回归分析模型:
h(t|X)=h0(t)*exp(βi*xi);
步骤(43):设定一个显著性水平α,当对回归系数βi检验的p值小于α时,认为变量xi与变量结局之间有明显的线性关系,变量xi能够纳入cox回归模型。
步骤(5)的Cox比例风险模型:
对cox比例风险模型内部进行验证:
十折交叉验证:初始数据采样分割成10个子样本,每次交叉验证中将某个子样本作为验证模型的数据,其他9个样本合集作为训练集;交叉验证重复10次,使得每个子样本验证一次,然后平均10次的结果,最终得到一个单一估测。反应模型效果的拟合统计量分别是:AUC=0.847,Gini系数=0.695,KS统计量=0.536。若AUC在0.6以上,则模型可用。
对cox比例风险模型外部进行验证:
将外部数据带入已经建立好的cox回归模型,根据发病风险的预测值P以及疾病结局,绘制出ROC曲线,得到AUC的值,若AUC在0.6以上,则模型可用。
ROC曲线绘制方法:
表1预测结局与真实解决对照表
其中,灵敏度=n1/(n1+n2);特异度=n4/(n3+n4);
对于发病风险的预测值,设定临界点,例如0.5,超过临界点则是阳性,低于临界点则是是阴性,从而得到预测结局。就能够得到灵敏度和特异度,如果取若干个临界点,就能够得到若干个灵敏度和特异度,将灵敏度和特异度的点连接起来,就得到ROC曲线,也能够得到AUC的值,AUC的值就是ROC曲线下的面积。
本发明的有益效果:通过本发明可以给不同的体检人群,提供个性化的健康体检报告,同时给出疾病风险评估曲线。
附图说明
图1为本发明的硬件连接关系图;
图2为本发明的软件功能模块图;
图3为本发明的工作方法流程图;
图4为本发明的工作方法流程图中的双曲线生成流程图;
图5为本发明的队列展示示意图;
图6为本发明的报告生成实施例;
图7为两种队列示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
如图1所示,系统硬件服务器架设分为内网区和DMZ(隔离区),为了保证服务器的安全,将数据库服务器和应用服务器放置在内网区。同时架设了DMZ(隔离区)供外界资源访问。
1内网区和DMZ(隔离区)中的硬件服务器资源通过安全网关和防火墙与Internet进行连接。
2公众用户使用手机或者PC端来通过Internet来访问
机构用户通过安全网关,使用Internet与系统建立安全的访问通道,从而保证数据的安全交互。
如图2所示,风险评估与个性化健康干预系统面向的对象主要包括体检机构、政府部门、行业团体、体检人员等,分为访问层、SaaS层、PaaS层、Daas层和LaaS层。
访问层:系统对外提供的应用访问(包括门户网站、APP和微信),服务对象包括体检机构、政府部门、行业团体(保险)和体检人员,针对前三个服务对象,主要开通PC端服务,针对体检人员,主要开通PC端、手机端和平板端的服务。
SaaS层:Software-as-a-Service软件服务层,提供给客户的服务就是运行在云计算基础设施上的应用程序,用户可以在各种设备上通过客户端界面访问
PaaS层:Platform-as-a-Service平台服务器层,公司在网上提供各种开发和分发应用的解决方案
Daas层:Data-as-a-service数据服务层,对于数据进行结构化、集约化,虚拟化等处理主要包括用户信息库、调查问卷信息库、体检信息库、评估报告库、模型算法库、科研分析库、财务结算库、商城信息库、统计分析库。
IaaS层:Infrastructure as a Service基础构架服务层,包括云中心资源管理、应用资源池、存储资源池和网络及资源安全池
如图3所示,风险评估与个性化健康管理系统中已经集成了我们的疾病预测系统,首先介绍一下疾病预测系统中模型的建模过程:将收集到的健康体检队列大数据,应用“山东康评健康医疗大数据整合平台”,进行标准化处理、人员去重、变量对照、疾病对照、结构化审核等步骤,最终得到需要的结构化的数据,然后根据定义好的疾病结局,利用sas软件建立疾病的队列;建立好队列之后利用单因素回归方法进行变量选择,再利用多因素回归,结合医学知识构建cox比例风险模型;然后按照双曲线生成方法生成疾病风险评估双曲线。至此,建模过程完成。
然后,对于一个新的体检个体,将体检指标输入疾病预测系统就可以得到自己的评估报告,评估报告中主要包括疾病的发病风险、风险年龄以及风险等级。
3、最后个性化管理系统会根据风险评估报告的结果和体检指标的具体情况,输出相应的干预处方,干预处方主要包括饮食处方、运动处方、生活指导、精神指导四个方面。
如图4所示,平均风险线说明:
1、数据处理:应用“山东康评健康医疗大数据整合平台”,进行标准化处理、人员去重、变量对照、疾病对照、结构化审核等步骤,最终得到需要的结构化的数据;
2、建立队列:根据疾病定义,规定好疾病的结局,然后利用sas软件建立该疾病的对应队列,如下图所示(以脑卒中为例);
图5描述:
脑卒中队列从2004年开始,到2016年结束,13年间共74326人进入队列。其中2004年1438人进入队列,2014年结束时1人发生脑卒中,0人死亡;2005年1400人进入队列,2005年结束时,2人发生脑卒中,0人死亡;…;2016年0人进入队列,2016年结束时322人发生脑卒中,59人死亡。13年共诊断脑卒中新发病例1299例,238人死亡(这些死亡,包括脑卒总死亡,也包括其他原因死亡。)
4、平均风险折线图:将第三步中计算出来的人群的疾病发病风险根据年龄agei(i=1,…,n)分组,对于每个组中的疾病发病风险(发病概率P)进行正态性检验,如果满足,那么取出这组发病概率P的平均值P_mean作为该年龄人群的平均风险P;如果不满足正态性检验,那么取出这组发病概率P的中值P_median作为该年龄人群的平均风险P。最后将每组(age,p)对应直角坐标系中的点用直线连接,画出折线图;
5、平均风险折线图平滑:对第四步中得到的折线图进行平滑,平滑方法包括指数平滑、线性平滑、对数平滑、多项式平滑、幂平滑等方法,利用拟合优度来衡量拟合程度,R2越接近于1,表示拟合程度越好。
低风险线说明:
1、数据处理和建立队列与平均风险线的处理过程相同;
2、计算疾病预测模型中涉及到的体检指标的1%和99%分位数;
将Xi带入到已经建立好的模型
5、曲线平滑:对第四步中得到的折线图进行平滑,平滑方法包括指数平滑、线性平滑、对数平滑、多项式平滑、幂平滑等方法,利用拟合优度来衡量拟合程度,R2越接近于1,表示拟合程度越好。
风险等级划分规则:
P:表示个体的风险值;
Age:表示该个体的年龄;
如图6所示,以高血压为例:
第一条线:各年龄人群未来几年某病发病风险的平均值变化曲线;
第二条线:各年龄人群未来几年某病发病风险的低风险水平变化曲线;
星号:表示体检者本人未来几年某病的发病风险;
星号下方第一个点:表示同年龄组的平均风险水平;
星号下方第二个点:表示同年龄组的最低风险水平;
星号水平向右第一个点:对应的横坐标表示同风险人群的平均年龄,即风险年龄;
风险年龄(69岁):根据星号水平向右第一个点对应出来的年龄。
如图7所示,队列定义:根据人群进入队列的时间不同,队列可以分为两种:一种是固定队列,是指人群都在某一个固定时间或一个短期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有因为结局事件以外的其他原因退出,也不再加入新的成员,即在观察期内保持队列成员的相对固定;另一种是动态队列,即在某队列确定之后,原有的队列成员可以不断退出,新的观察对象可以随时加入。图7为两种队列的示意图:其中AB K C D组成固定队列;E F G H I组成动态队列。我们研究过程中使用的是动态队列。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (1)
1.疾病风险评估与个性化健康报告生成方法,其特征是,包括如下步骤:
步骤(1):输入纵向健康体检大数据;所述纵向健康体检大数据,包括设定时间范围内,跨地域的若干家健康体检机构提供的健康体检数据;
步骤(2):对数据进行整理:包括对数据的标准化处理、人员去重处理、变量对照处理、疾病对照处理和结构化审核处理,最终得到需要的结构化数据;
所述标准化处理是指:对新输入的变量,首先判断新变量是否是变量标准数据库里面已经存在的变量,若已经存在,则删除;若不存在,则依据变量标准数据库变量的标准编码的编码规则对新的变量进行重新编码,将重新编码后的变量存储到变量标准数据库中;
所述人员去重处理是指:根据体检人员的标准编码,删除重复的体检人员;
所述变量对照处理是指:将新的变量名与变量标准数据库中的标准编码建立一一对应关系,便于查阅;
所述疾病对照处理是指:将原始数据中疾病名称与标准ICD10疾病名称和ICD10编码建立一一对应关系;
所述结构化审核处理是指:将原始数据中B超文本数据、CT文本数据、心电图文本数据、问诊文本数据,分词成结构化数据;
步骤(3):根据疾病的名称对疾病的各项指标阈值范围进行定义,同时根据疾病的各项指标阈值范围,利用sas统计软件建立对应疾病的队列;
步骤(4):建立队列之后,利用cox单因素回归分析方法对每个变量均进行变量选择;最后将纳入cox比例风险模型的变量进行多因素回归分析;
所述步骤(4)用单因素回归分析进行变量选择的步骤:
步骤(41):确定要分析的自变量xi;
步骤(42):利用sas统计软件进行cox单因素回归分析,得到单因素回归分析模型:
h(t|X)=h0(t)*exp(βi*xi);
步骤(43):设定一个显著性水平α,当对回归系数βi检验的p值小于α时,认为变量xi与变量结局之间有明显的线性关系,变量xi能够纳入cox比例风险模型;
步骤(5):利用多因素回归分析方法,构建cox比例风险模型;
步骤(5)的Cox比例风险模型:
步骤(6):对cox比例风险模型内部进行验证,对cox比例风险模型外部进行验证;得到疾病预测模型;
对cox比例风险模型内部进行验证:
十折交叉验证:初始数据采样分割成10个子样本,每次交叉验证中将某个子样本作为验证模型的数据,其他9个样本合集作为训练集;交叉验证重复10次,使得每个子样本验证一次,然后平均10次的结果,最终得到一个单一估测;反映模型效果的拟合统计量分别是:AUC=0.847,Gini系数=0.695,KS统计量=0.536;若AUC在0.6以上,则模型可用;
对cox比例风险模型外部进行验证:
将外部数据带入已经建立好的cox比例风险模型,根据每个人的累积发病风险P以及疾病结局,绘制出ROC曲线,得到AUC的值,若AUC在0.6以上,则模型可用;
步骤(7):生成疾病风险评估双曲线:平均风险评估曲线和低风险评估曲线;
步骤(8):输入新个体体检指标,根据步骤(6)的疾病预测模型和步骤(7)的疾病风险评估双曲线,生成疾病风险评估结果,同时根据预先设定的体检指标,输出包括体检指标、疾病的发病风险、风险年龄、风险等级和干预处方的疾病风险评估与个性化健康报告;
风险年龄的计算方法为:
首先计算出每个人的累积发病风险P,然后对比平均风险线,与P最接近的平均风险p所对应的年龄,就是体检者的风险年龄;
所述生成疾病风险评估双曲线,包括:并发进行的平均风险评估曲线绘制步骤和低风险评估曲线绘制步骤;平均风险评估曲线绘制步骤:
步骤(701):将队列数据代入模型:
p(t)表示每个人的累积发病风险;S0(t)表示基准生存率;β0、βi表示回归系数;xi表示第i个体检指标;xi′表示第i个体检指标的均值;exp,高等数学里以自然常数e为底的指数函数;
步骤(702):计算出队列中每个人的累积发病风险p(t);
步骤(703):对每个人的累积发病风险根据年龄分组,对于每个人的累积发病风险P进行正态性检验,P表示每个人的累积发病风险,是一个常数,使用 计算得出的;p(t)表示累积发病风险,与t有关,用来计算每个人的累积发病风险;若满足正态性检验,则取每个年龄累积发病风险的平均值P_mean为该年龄人群平均风险p;若不满足正态性检验,则取每个年龄累积发病风险的中位数P_median为该年龄人群平均风险p;
步骤(704):将每组(age,p)对应直角坐标系中的点,用直线连接,形成折线图;age表示个体的年龄;
低风险评估曲线绘制步骤,包括:
步骤(711):取出cox比例风险模型中用到的指标xi的基线数据;
步骤(712):计算指标xi的1%分位数xi,1%;计算指标xi的99%分位数xi,99%;
步骤(714):将Xi带入到模型
中,计算出低风险值P;
步骤(715):画出低风险值随年龄的折线图;
步骤(716):对折线图通过拟合得到最优趋势线,即平均风险线;
所述方法所使用的疾病风险评估与个性化健康报告生成系统,包括:
IaaS层:用于提供硬件及网络资源环境,以及负载均衡服务,IaaS层包括云中心资源管理模块,云中心资源管理模块针对各种系统应用服务所需的硬件和网络资源进行合理的调配和管理,保证系统资源的高效使用和运转;
DaaS层,用于对数据进行结构化、集约化和虚拟化处理,集中对数据进行聚合、质量管理或数据清洗处理,然后再将数据提供给不同的应用和服务;
PaaS层,用于在网上提供各种开发和分发应用的解决方案,为系统提供各种应用的解决方案,根据不同的服务应用,调用PaaS层相应的模块组合生成相应的解决方案,包括健康评估模块、模型算法管理模块,所述的健康评估模块,用于采集相应的指标信息和生成相应的个性化健康风险评估报告,是整个系统中连接用户信息和模型算法的关键模块,接收用户填写的指标信息,根据查看请求输出相应的个性化健康风险评估报告结果和个性化健康干预结论,模型算法管理模块,用于提供健康评估的所有模型算法,是系统的核心模块,健康评估模块通过调用相应的模型算法,生成计算出相应的评估结果;
SaaS层用于针对不同的服务对象,提供不同的服务,是系统的控制访问层,根据用户的不同访问需要,提供不同的应用服务;针对体检机构用户、政府机构用户、行业团体用户和体检人员,系统提供不同的应用服务;
所述访问层,包括:体检机构PC端,保证体检机构用户能够在PC端访问系统应用;政府部门PC端,保证政府用户能够在PC端访问系统应用;行业团体PC端,保证行业团体用户能够在PC端访问系统应用;体检人员移动终端,保证体检人员能够在移动端访问系统应用;微信公众平台,保证体检人员能够在微信公众平台访问系统应用;
第三方接口,用于更好的与体检系统和CA认证系统进行对接;
IaaS层,还包括:资源池,资源池包括:应用资源池、存储资源池和网络及资源安全池;
应用资源池,用于管理云中心的应用服务器资源,合理安排和调配相应的资源配置,保证应用服务的安全和高效运行;
存储资源池,用于管理云中心的硬件存储资源,合理安排和调配相应的硬件存储资源;
网络及资源安全池,用于管理云中心的网络及资源安全,合理的安排和调配相应的带宽设置和防火墙安全资源配置;
DaaS层,包括:用户信息库、调查问卷信息库、体检信息库、个性化健康风险评估报告库和模型算法库;
用户信息库,用于存储和管理用户的个人基本信息;
调查问卷信息库,用于存储和管理用户填写的调查问卷信息;
体检信息库,用于存储和管理体检者的体检信息;
个性化健康风险评估报告库,用于存储和管理体检者的个性化健康风险评估报告结果和生成的个性化健康风险评估报告;
模型算法库,用于存储和管理健康评估所使用到的模型算法;
PaaS层,还包括:报告模板管理模块、webservice接口管理模块、用户管理模块、APP接口管理模块、微信公众平台接口、数据交换服务模块;
报告模板管理模块,用于管理个性化健康风险评估报告的模板,根据不同的客户需要,使用相应的模板,生成与其对应的个性化健康风险评估报告;
webservice接口管理模块,用于对外提供服务的webservice接口,让风险评估服务以webservice接口的形式对外提供风险评估服务;
用户管理模块,用于管理系统中存储的用户数据信息,保证数据的安全性和完整性;
APP接口管理模块,用于提供与手机APP相应的接口,由于手机APP是通过互联网与系统进行通信,为了安全性,系统与手机APP的通信是使用相应的接口来实现的;
微信公众平台接口,用于提供与微信公众平台相应的接口,由于微信公众平台是通过互联网与系统进行通信,为了安全性,系统与微信公众平台的通信是使用相应的接口来实现的;
数据交换服务模块,用于实现数据在应用服务和数据库之间的交互,把数据从数据库中查询返回给应用服务,同时也将应用服务产生的数据存储进入数据库;
SaaS层,包括:面向体检机构模块、面向政府机构模块、面向行业团体模块和面向体检人员模块;
所述面向体检机构模块包括:
体检机构评估管理单元,用于采集体检机构的体检信息,调用相应的模型算法和模板生成对应的个性化健康风险评估报告;
体检机构报告管理单元,对已生成完成的个性化健康风险评估报告进行管理,体检机构调用相应的接口程序进行报告的预览、打印和下载;
健康干预单元,针对已经生成的个性化健康风险评估报告结果系统会提供个性化的健康干预方案,个性化的健康干预方案,包括饮食、运动、生活方式、心理健康和用药指导;
评估统计单元,对体检机构的个性化健康风险评估报告数量进行统计汇总;
用户管理单元,用于管理体检机构中体检用户的基础信息;
所述面向政府机构模块,包括:
政府机构评估管理单元,用于采集民众的体检信息,调用相应的模型算法和模板生成对应的个性化健康风险评估报告;
政府机构报告管理单元,用于对于生成完成的个性化健康风险评估报告进行管理,承载政府机构人员体检的体检机构能够调用相应的接口程序进行报告的预览、打印和下载;
干预随访单元,针对已经生成的个性化健康风险评估报告结果系统提供个性化的健康干预方案,个性化的健康干预方案,包括饮食、运动、生活方式、心理健康和用药指导;
人员管理单元,用于管理政府部门管辖下民众的基础信息;
所述面向行业团体模块,包括:
行业团体评估管理单元,用于采集行业团体下的客户的体检信息,调用相应的模型算法和模板生成对应的个性化健康风险评估报告;
评估推荐单元,针对行业团体的需要,基于风险评估的结果,给行业团体推荐相应的产品和服务;
所述面向体检人员模块,包括:
健康档案单元,用于面向体检人员,为其建立完整的健康档案,健康档案包括个人基本信息、历次的体检信息、历次的健康评估结果和干预方案;
个人中心单元,用于面向体检人员,体检人员提供了个人中心功能,允许通过多种方式登陆进入系统查看其个人的健康档案信息;
手机APP单元,用于面向体检人员,为体检人员提供了手机APP服务,体检者允许使用相应手机APP来查看和访问相应的个人信息;
微信公众平台,用于面向体检人员,为体检人员提供了微信公众平台,体检者能够应用微信公众平台来查看和访问相应的个人信息;
访问层,用于对外提供应用访问,服务对象包括体检机构、政府部门、行业团体和体检人员,针对前三个服务对象开通PC端服务,针对体检人员开通PC端或移动终端服务;
第三方接口包括:体检系统、CA认证系统;
体检系统,系统预留了相应的接口,与多种体检系统直接进行对接;
CA认证系统,为了安全访问的需要,系统提供了与CA认证系统的接口;
对于一个新的体检个体,将体检指标输入疾病风险评估与个性化健康报告生成系统就能够得到自己的个性化健康风险评估报告,个性化健康风险评估报告中包括疾病的发病风险、风险年龄以及风险等级。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710374525.5A CN107085666B (zh) | 2017-05-24 | 2017-05-24 | 疾病风险评估与个性化健康报告生成系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710374525.5A CN107085666B (zh) | 2017-05-24 | 2017-05-24 | 疾病风险评估与个性化健康报告生成系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107085666A CN107085666A (zh) | 2017-08-22 |
CN107085666B true CN107085666B (zh) | 2020-07-17 |
Family
ID=59609133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710374525.5A Active CN107085666B (zh) | 2017-05-24 | 2017-05-24 | 疾病风险评估与个性化健康报告生成系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107085666B (zh) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107491651B (zh) * | 2017-08-29 | 2019-12-24 | 北斗云谷(北京)科技有限公司 | 基于个性化因子的自我健康管理方法 |
CN107658020A (zh) * | 2017-09-07 | 2018-02-02 | 广州九九加健康管理有限公司 | 一种基于精准健康管理的智能健康评估分析方法及系统 |
CN107680682A (zh) * | 2017-09-28 | 2018-02-09 | 北京大学 | 基于微信平台的慢性非传染性疾病队列研究人群随访方法 |
CN108010584A (zh) * | 2017-10-26 | 2018-05-08 | 康美健康云服务有限公司 | 健康状况动态评估方法、电子设备、存储介质、装置 |
CN108039193A (zh) * | 2017-11-17 | 2018-05-15 | 哈尔滨工大服务机器人有限公司 | 一种自动生成体检报告的方法及装置 |
CN108682457B (zh) * | 2018-04-17 | 2022-01-25 | 中国医学科学院阜外医院 | 患者长期预后定量预测和干预系统及方法 |
US10877927B2 (en) * | 2018-05-31 | 2020-12-29 | Microsofttechnology Licensing, Llc | Distributed computing system with a synthetic data as a service asset assembly engine |
CN109147909A (zh) * | 2018-07-09 | 2019-01-04 | 广东思迪玛维生命科学健康管理有限公司 | 提供优化饮食及运动的监护方法及系统 |
CN110033860B (zh) * | 2019-02-27 | 2021-02-26 | 杭州贝安云科技有限公司 | 一种基于机器学习的遗传代谢病检出率提升方法 |
CN110175624B (zh) * | 2019-04-11 | 2023-01-10 | 创新先进技术有限公司 | 项目准入审核方法以及装置 |
CN110210245B (zh) * | 2019-05-30 | 2021-04-06 | 北京理工大学 | 一种基于隐私保护的医疗数据使用方法 |
CN110728127B (zh) * | 2019-07-15 | 2023-09-12 | 贵州科学院(贵州省应用技术研究院) | 一种生物多样性评估报告自动生成方法 |
CN110534200A (zh) * | 2019-09-09 | 2019-12-03 | 吉林大学中日联谊医院 | 一种人员高效体检风险管控系统 |
CN111192694B (zh) * | 2019-12-31 | 2024-02-13 | 河南科技大学 | 一种基于大数据挖掘的智慧医疗服务云平台门户系统 |
CN111462848B (zh) * | 2020-03-31 | 2023-06-09 | 中南大学湘雅医院 | 一种传染病风险评估方法、传染病风险评估装置及服务器 |
CN111524596A (zh) * | 2020-04-07 | 2020-08-11 | 上海市精神卫生中心(上海市心理咨询培训中心) | 一种判断青少年双相障碍发病风险的方法 |
CN111814169B (zh) * | 2020-07-16 | 2023-03-28 | 山东大学 | 一种消化道疾病数据加密获取方法及风险预测系统 |
CN111816316A (zh) * | 2020-07-16 | 2020-10-23 | 山东大学 | 一种疾病数据调度管理方法和骨癌风险预测系统 |
CN111883253A (zh) * | 2020-07-16 | 2020-11-03 | 山东大学 | 基于医学知识库的疾病数据分析方法和肺癌风险预测系统 |
CN111816310A (zh) * | 2020-07-16 | 2020-10-23 | 山东大学 | 一种骨髓血液疾病危险因素贡献率计算及风险预测系统 |
CN111816317A (zh) * | 2020-07-16 | 2020-10-23 | 山东大学 | 一种疾病数据结构化方法及甲状腺癌风险预测系统 |
CN111816319A (zh) * | 2020-07-16 | 2020-10-23 | 山东大学 | 逐步筛选的泌尿系统重疾指标确定方法及风险预测系统 |
CN111816318A (zh) * | 2020-07-16 | 2020-10-23 | 山东大学 | 一种心脏疾病数据队列生成方法和风险预测系统 |
CN111899888A (zh) * | 2020-07-16 | 2020-11-06 | 山东大学 | 一种妇科肿瘤疾病风险预测可视化系统 |
CN112530588A (zh) * | 2020-11-30 | 2021-03-19 | 重庆电子工程职业学院 | 基于ar技术的健康管理系统 |
CN112530590A (zh) * | 2020-12-02 | 2021-03-19 | 中国福利会国际和平妇幼保健院 | 一种基于5g的出生缺陷评估方法、装置及电子设备 |
CN113380405A (zh) * | 2021-03-11 | 2021-09-10 | 东莞市人民医院 | 一种移动健康管理平台及其控制方法 |
CN113223710A (zh) * | 2021-04-23 | 2021-08-06 | 武汉大学 | 一种大数据健康体检结果展示系统及控制方法 |
CN113138980A (zh) * | 2021-05-13 | 2021-07-20 | 南方医科大学皮肤病医院 | 一种数据处理的方法、装置、终端及存储介质 |
CN113298067A (zh) * | 2021-05-17 | 2021-08-24 | 长沙市到家悠享家政服务有限公司 | 体检结果自动审核方法及系统、电子设备及存储介质 |
CN113284622A (zh) * | 2021-05-27 | 2021-08-20 | 四川大学华西医院 | 一种低龄儿童龋风险评估方法、系统及存储介质 |
CN113393935A (zh) * | 2021-06-30 | 2021-09-14 | 吾征智能技术(北京)有限公司 | 一种基于体检数据的癌症早期风险评估方法和系统 |
CN114496264B (zh) * | 2022-04-14 | 2022-07-19 | 深圳市瑞安医疗服务有限公司 | 基于多维数据的健康指数分析方法、装置、设备及介质 |
CN115331822B (zh) * | 2022-10-11 | 2023-04-11 | 南京从景生物技术有限公司 | 一种基于微信小程序的客户健康资料收集管理系统 |
CN116864062B (zh) * | 2023-09-04 | 2023-11-21 | 山东普瑞森医疗设备股份有限公司 | 一种基于互联网的健康体检报告数据分析管理系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999686A (zh) * | 2011-09-19 | 2013-03-27 | 上海煜策信息科技有限公司 | 一种健康管理系统及其实现方法 |
CN103093103A (zh) * | 2013-01-23 | 2013-05-08 | 西安阔途软件科技有限公司 | 一种多病种健康风险因素评估系统和方法 |
CN104374920A (zh) * | 2008-10-22 | 2015-02-25 | B.R.A.H.M.S有限公司 | 用于初次慢性肾脏疾病的发展的预后生物标志物 |
CN104376430A (zh) * | 2014-11-28 | 2015-02-25 | 东莞中国科学院云计算产业技术创新与育成中心 | 一种基于云服务平台的风险隐患管理系统及其实现方法 |
CN104970883A (zh) * | 2014-04-04 | 2015-10-14 | 杭州智尔科技有限公司 | 一种基于云计算的体检系统 |
CN105427208A (zh) * | 2015-11-11 | 2016-03-23 | 镇江市高等专科学校 | 一种基于云计算的智慧旅游管理系统的管理方法 |
-
2017
- 2017-05-24 CN CN201710374525.5A patent/CN107085666B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104374920A (zh) * | 2008-10-22 | 2015-02-25 | B.R.A.H.M.S有限公司 | 用于初次慢性肾脏疾病的发展的预后生物标志物 |
CN102999686A (zh) * | 2011-09-19 | 2013-03-27 | 上海煜策信息科技有限公司 | 一种健康管理系统及其实现方法 |
CN103093103A (zh) * | 2013-01-23 | 2013-05-08 | 西安阔途软件科技有限公司 | 一种多病种健康风险因素评估系统和方法 |
CN104970883A (zh) * | 2014-04-04 | 2015-10-14 | 杭州智尔科技有限公司 | 一种基于云计算的体检系统 |
CN104376430A (zh) * | 2014-11-28 | 2015-02-25 | 东莞中国科学院云计算产业技术创新与育成中心 | 一种基于云服务平台的风险隐患管理系统及其实现方法 |
CN105427208A (zh) * | 2015-11-11 | 2016-03-23 | 镇江市高等专科学校 | 一种基于云计算的智慧旅游管理系统的管理方法 |
Non-Patent Citations (2)
Title |
---|
Enhanced Multi-Tenant Architecture for DaaS,PaaS,IaaS and SaaS in Edu-Cloud;Rangavittala SR et al.;《ICCCT"15》;20150927;全文 * |
基于体检队列的2型糖尿病风险预测模型;杨洋 等;《山东大学学报(医学版)》;20160930;第54卷(第9期);论文第1-2节 * |
Also Published As
Publication number | Publication date |
---|---|
CN107085666A (zh) | 2017-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107085666B (zh) | 疾病风险评估与个性化健康报告生成系统及方法 | |
US11844626B2 (en) | Fitness systems and methods | |
CN103903413B (zh) | 用于心脑血管风险动态监测和管理系统及方法 | |
JP7261508B2 (ja) | クラウド基盤の電子処方送信システム及び方法 | |
Seidel et al. | Effect size calculations for the clinician: Methods and comparability | |
CN108766570A (zh) | 一种居民个人健康管理服务系统 | |
EP2286334A2 (en) | Nursing home evaluation system | |
CN110543550B (zh) | 自动生成试题的方法和装置 | |
CN111798952A (zh) | 一种居民健康管理医疗大数据平台 | |
US20240037278A1 (en) | Computer system of computer servers and dedicated computer clients specially programmed to generate synthetic non-reversible electronic data records based on real-time electronic querying and methods of use thereof | |
Raffenaud et al. | Utilizing telemedicine in oncology settings: Patient favourability rates and perceptions of use analysis using Chi-Square and neural networks | |
Goldie | Chapter 15: Public health policy and cost-effectiveness analysis | |
KR20220069859A (ko) | 디지털 피노타이핑 기반 다차원적 정신건강상태 탐지 장치 및 방법 | |
US20150294070A1 (en) | System and Method For Facilitating the Collection, Analysis, Use and Management of Clinical Analytics Results to Improve Healthcare | |
US11862341B2 (en) | Server and method for classifying mental state | |
CN115458190B (zh) | 一种面向社区的慢性阻塞性肺疾病早期筛查和干预系统 | |
CN112786134A (zh) | 一种心理测评云系统 | |
US20140370481A1 (en) | Polygraph report system that is equipment agnostic | |
JP7340138B1 (ja) | 与信判定システム、与信判定プログラム及び与信判定方法 | |
KR20180074606A (ko) | IoT 기반의 생체정보 제공 방법 | |
Bauer-Staeb et al. | Personalised psychotherapy in primary care: evaluation of data-driven treatment allocation to cognitive–behavioural therapy versus counselling for depression | |
US20220254459A1 (en) | Data processing method, data processing device, computing device and computer readable storage medium | |
KR20240092527A (ko) | 멀티 모달 센서데이터를 이용하여 직무에서 기인하는 감정조율과 관련된 감정 노동자의 휴먼 디지털 트윈 구현 방법 및 시스템 | |
WO2023009038A1 (ru) | Цифровая платформа для постановки медицинских диагнозов | |
CN115762785A (zh) | 基于神经网络的脑肿瘤术前认知评估方法、系统和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: 250101 No. 44 West Wenhua Road, Lixia District, Shandong, Ji'nan Patentee after: SHANDONG University Patentee after: Kangping medical health Co.,Ltd. Address before: 250101 No. 44 West Wenhua Road, Lixia District, Shandong, Ji'nan Patentee before: SHANDONG University Patentee before: KANG PING HEALTH MEDICAL BIG DATA TECHNOLOGY Co.,Ltd. |