CN108597588B - 全人群全生命历程健康图谱创建方法、系统及存储介质 - Google Patents

全人群全生命历程健康图谱创建方法、系统及存储介质 Download PDF

Info

Publication number
CN108597588B
CN108597588B CN201810379906.7A CN201810379906A CN108597588B CN 108597588 B CN108597588 B CN 108597588B CN 201810379906 A CN201810379906 A CN 201810379906A CN 108597588 B CN108597588 B CN 108597588B
Authority
CN
China
Prior art keywords
map
health
indexes
information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810379906.7A
Other languages
English (en)
Other versions
CN108597588A (zh
Inventor
薛付忠
张涛
季晓康
刘言训
崔立真
郭伟
苟延农
李德金
高琦
阿力木·达依木
王束康
孙秀彬
刘云霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201810379906.7A priority Critical patent/CN108597588B/zh
Publication of CN108597588A publication Critical patent/CN108597588A/zh
Application granted granted Critical
Publication of CN108597588B publication Critical patent/CN108597588B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了全人群全生命历程健康图谱创建方法、系统及存储介质,包括:数据采集;采集医疗卫生行业的全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息;数据关联和合并;以个人身份证为唯一索引,将全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息中的各个数据表进行相互关联和合并;数据清洗,生成数据库;制定指标;所述指标,包括个体水平上的危险暴露指标、疾病指标、死亡原因指标、疾病负担指标、健康维护指标和健康保障指标;创建健康图谱;所述健康图谱,包括:危险暴露图谱、发病图谱、死亡原因图谱、疾病负担图谱、健康维护图谱或健康保障图谱。

Description

全人群全生命历程健康图谱创建方法、系统及存储介质
技术领域
本发明涉及全人群全生命历程健康图谱创建方法、系统及存储介质。
背景技术
目前,互联网、云计算和物联网技术的成熟和发展,健康危险因素监测信息化和医疗/卫生信息化的广泛普及,使得健康医疗数据正在以惊人的速度呈几何倍数增长;同时,可穿戴移动医疗和移动健康技术的迅猛发展,促使生物医学领域快速进入“大数据”时代。从而,汇集产生了前所未有的海量健康危险暴露和健康医疗“大数据”资源。这表明“以人群健康和患者数据为中心”的“大数据健康医疗”医-患协同新时代已经来临,即大数据驱动的健康医疗研究、健康医疗实践和健康产业新业态已经成为支撑政策制定、行业发展和产业转化的原动力。现有技术存在的问题是:没有对健康医疗大数据进行合理的利用。
发明内容
为了解决现有技术的不足,本发明提供了全人群全生命历程健康图谱创建方法、系统及存储介质;
作为本发明的第一方面,提出了全人群全生命历程健康图谱创建方法;
全人群全生命历程健康图谱创建方法,包括:
步骤(1):数据采集;采集医疗卫生行业的全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息;
步骤(2):数据关联和合并;以个人身份证为唯一索引,将全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息中的各个数据表进行相互关联和合并;
步骤(3):数据清洗,生成数据库;
步骤(4):制定指标;所述指标,包括个体水平上的危险暴露指标、疾病指标、死亡原因指标、疾病负担指标、健康维护指标和健康保障指标;
步骤(5):根据步骤(3)得到的数据库和步骤(4)制定的指标,创建健康图谱;所述健康图谱,包括:危险暴露图谱、疾病发病图谱、死亡原因图谱、疾病负担图谱、健康维护图谱或健康保障图谱。
作为本发明的进一步改进,
步骤(31):对数据的数量进行校验,若数据量小于设定人数,则返回步骤(1)继续进行数据采集;
步骤(32):对每一个数据表的每一个字段都进行数据频数统计,生成频数分布表及频数分布直方图,根据频数分布直方图发现数据缺失,则返回步骤(1)继续进行数据采集;根据频数分布直方图发现性别数据差值超过设定阈值,则返回步骤(1)继续进行数据采集;根据频数分布直方图发现数据类型不一致,则返回步骤(1)继续进行数据采集;
步骤(33):逻辑校验;
根据性别进行判断,对不合理内容进行删除;
根据年龄进行判断,对于年龄不相符的特征进行删除;
步骤(34):剔除异常值;
对于数值型变量,以该变量的参考范围的上下限的均值±3倍的标准差作为正常值的参考范围,对于无法得到参考数据的,根据全数据均值±3倍的标准差作为异常值检测;对异常值进行删除;
步骤(35):数据质量控制;
使用质控图进行实时质量监控,对于发现的问题数据,要及时进行反馈和解决。
作为本发明的进一步改进,
所述全员人口信息,包括:居民个人基本信息、社保信息、住房信息和居民诚信失信信息;
所述公共卫生信息,包括:个人健康基本信息、残疾人表、健康体检表、学生体检表、出生医学证明、新生儿家庭访视信息、儿童健康检查信息、产前随访服务信息、分娩记录表、产后访视服务信息、孕检记录表、预防接种卡信息、传染病报告卡、职业病报告卡、食源性疾病卡、死亡医学证明、高血压患者随访表、2型糖尿病患者随访表、重性精神疾病患者管理表、重性精神病患者发病信息、重性精神病患者出院信息、冠心病患者信息、脑卒中患者信息、肿瘤患者信息、肺结核患者随访表、育龄夫妇信息、婚姻信息、生育登记和生育审批信息、妊娠信息、妇女生育史信息、避孕信息、计划生育手术信息、流出人口信息、流入人口信息、门诊摘要信息、住院摘要信息。
所述电子病历信息,包括:门诊/急诊挂号、门诊/急诊就诊记录、门诊/急诊/住院西药处方、门诊/急诊/住院中药处方、检验记录、检验结果明细、检查记录、入院记录、住院病案首页、中医住院病案首页、出院记录。
所述健康体检信息,包括:体检报告单、体检项目表、体检项目明细表。
所述医疗保险信息,包括:基本信息、诊疗信息、医保费用总信息、医保费用明细信息;
所述监测信息,包括:死因数据库、中小学生体检数据库、计划免疫数据库、传染病数据库、饮水监测数据库、大气污染数据库、肿瘤病人信息数据库和冠心病病人信息数据库。
作为本发明的进一步改进,个体水平上的危险暴露指标包括:家族遗传指标、社会学指标、生活方式指标、行为危险因素指标、有害环境暴露指标和生理危险因素指标;
所述家族遗传指标,包括:高血压家族史阳性率、糖尿病家族史阳性率、冠心病家族史阳性率、脑卒中家族史阳性率、慢阻肺家族史阳性率、恶性肿瘤家族史阳性率、严重精神障碍家族史阳性率或结核病家族史阳性率;
所述社会学指标,包括:文盲率、离婚率、丧偶率、失业率、接受医疗贫困救助率;
所述生活方式指标,包括:嗜荤食率、嗜盐率、嗜油率、嗜糖率、嗜素食率;
所述行为危险因素指标,包括:吸烟率或饮酒率;
所述有害环境暴露指标,包括:职业病危害接触率、不安全饮水率、不清洁燃料暴露率、不使用卫生厕所率或人畜混住率;
所述生理危险因素指标,包括:肥胖率、血压偏高率、视力异常率、听力异常率、贫血率、尿蛋白阳性率、血糖偏高率、血脂偏高率、HBSAg阳性率、肝功异常率。
所述疾病指标,包括:传染病、寄生虫病、恶性肿瘤、血液疾病、造血器官疾病、涉及免疫机制的疾病、内分泌营养和代谢疾病、精神和行为障碍疾病、神经系统疾病、眼疾病、耳和乳突疾病、循环系统疾病、呼吸系统疾病、消化系统疾病、皮肤和皮下组织疾病、肌肉骨骼系统和结缔组织疾病、泌尿生殖系统疾病、妊娠、分娩和产褥期疾病、起源于围生期的疾病、先天性畸形变形、染色体异病、损伤中毒;
所述死亡原因指标,包括:传染病、寄生虫病、恶性肿瘤、血液疾病、造血器官疾病、涉及免疫机制的疾病、内分泌营养和代谢疾病、精神和行为障碍疾病、神经系统疾病、眼疾病、耳和乳突疾病、循环系统疾病、呼吸系统疾病、消化系统疾病、皮肤和皮下组织疾病、肌肉骨骼系统和结缔组织疾病、泌尿生殖系统疾病、妊娠、分娩和产褥期疾病、起源于围生期的疾病、先天性畸形变形、染色体异病、损伤中毒;
所述疾病负担指标,包括残疾调整生命年DALY指标;残疾调整生命年DALY指标,包括:因早逝造成的健康生命年的损失、因残疾造成健康生命年的损失、健康生命年的年龄相对重要性(年龄权数)或健康生命年的时间相对重要性(贴现率)。
所述健康维护指标,包括:孕产妇健康维护指标、新生儿健康维护指标、儿童健康维护指标、中小学生健康维护指标、青壮年健康维护指标、老年人健康维护指标;
所述孕产妇健康维护指标,包括:早孕建册率、产前健康管理率、产后访视率;
所述新生儿健康维护指标,包括:新生儿家庭访视率、满月健康体检率、三月龄健康体检率、六月龄健康体检率、八月龄健康体检率、婴儿期健康检查次数达标率;
所述儿童健康维护指标,包括:12月龄儿童健康体检率、18月龄儿童健康体检率、24月龄儿童健康体检率、30月龄儿童健康体检率、12-30月龄儿童健康体检率、儿童牙齿检查率、儿童视力检查率;
所述中小学生健康维护指标,包括:体重达标率、视力达标率和龋齿控制达标率;
所述青壮年健康维护指标,包括:健康体检率、高血压建档率、糖尿病建档率、妇科疾病筛查率、2型糖尿病患者药物依从率、高血压患者药物依从率、戒烟率、运动达标率、体重达标率;
所述老年人健康维护指标,包括:老年人健康状态自我评估率和老年人健康管理率。
所述健康保障指标,包括:医疗服务类指标、医疗费用类指标;
医疗服务类指标,包括:参保人数、住院人数、住院次数、住院人数占总参保人数的比例;人均住院次数、人均住院天数、普通门诊人数、普通门诊人次、普通门诊人数占总参保人数的比例、人均普通门诊次数、慢性大病门诊人数、慢性大病门诊人次、慢病大病门诊人数占总参保人数的比例;
医疗费用类指标,包括:人均费用、人均住院费用、人均普通门诊费用、人均门诊慢性病费用、费用中统筹基金支付费用比例、费用中个人支付费用比例、人均使用药品分类、使用药品费用占总费用的比例、人均住院使用耗材费用、住院使用耗材费用占总住院费用的比例。
作为本发明的进一步改进,创建危险暴露图谱的过程为:
步骤(501):从个体水平上的危险暴露指标中挑选待生成图谱的危险暴露指标;
步骤(502):以年龄为X轴,以挑选的危险暴露指标为Y轴,以不同颜色表示危险暴露程度,生成危险暴露图谱。
作为本发明的进一步改进,创建发病图谱的过程为:
步骤(511):从疾病指标中挑选待生成图谱的疾病指标;
步骤(512):以年龄为X轴,以挑选的疾病指标为Y轴,以不同颜色表示发病率,生成发病图谱。
作为本发明的进一步改进,创建死亡原因图谱的过程为:
步骤(521):从死亡原因指标中挑选待生成图谱的死亡原因指标;
步骤(522):以年龄为X轴,以挑选的死亡原因指标为Y轴,以不同颜色表示死亡发生概率,生成死亡原因图谱。
作为本发明的进一步改进,创建疾病负担图谱的过程为:
步骤(531):从疾病负担指标中挑选待生成图谱的疾病负担指标;
步骤(532):以年龄为X轴,以挑选的疾病负担指标为Y轴,以不同颜色表示疾病负担程度,生成疾病负担图谱。
作为本发明的进一步改进,创建健康维护图谱的过程为:
步骤(541):从健康维护指标中挑选待生成图谱的健康维护指标;
步骤(542):以年龄为X轴,以挑选的健康维护指标为Y轴,以不同颜色表示健康维护程度,生成健康维护图谱。
作为本发明的进一步改进,创建健康保障图谱的过程为:
步骤(551):从健康保障指标中挑选待生成图谱的健康保障指标;
步骤(552):以年龄为X轴,以挑选的健康保障指标为Y轴,以不同颜色表示健康保障程度,生成健康保障图谱。
作为本发明的第二方面,提出了全人群全生命历程健康图谱创建系统;
全人群全生命历程健康图谱创建系统,包括:存储器、处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时完成上述任一方法所述的步骤。
作为本发明的第三方面,提出了计算机可读存储介质;
计算机可读存储介质,其上运行有计算机指令,所述计算机指令被处理器运行时,完成上述任一方法所述的步骤。
与现有技术相比,本发明的有益效果是:
以个人身份证为唯一索引,沿着生命历程时间维度,实时联接、融合和整合上述各类健康医疗大数据,便可构建全人群全生命历程健康医疗大数据信息流数据库。利用该数据库创建全人群全生命历程健康图谱(包括危险暴露图谱、发病图谱、死亡原因图谱、疾病负担图谱、健康维护图谱、健康保障图谱)。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本发明的流程图;
图2为家族(遗传)、社会学、生活方式及行为危险因素暴露图谱(某市);
图3为某省2016年城市男性全生命历程全疾病图谱(估算发病率1/10万);
图4为某市2016年全人群全生命历程分系统疾病的死亡率图谱(1/10万)。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
作为本发明的第一个实施例,提出了全人群全生命历程健康图谱创建方法;
如图1所示,全人群全生命历程健康图谱创建方法,包括:
步骤(1):数据采集;采集医疗卫生行业的全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息;
步骤(2):数据关联和合并;以个人身份证为唯一索引,将全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息中的各个数据表进行相互关联和合并;
步骤(3):数据清洗,生成数据库;
步骤(4):制定指标;所述指标,包括个体水平上的危险暴露指标、疾病指标、死亡原因指标、疾病负担指标、健康维护指标和健康保障指标;
步骤(5):根据步骤(3)得到的数据库和步骤(4)制定的指标,创建健康图谱;所述健康图谱,包括:危险暴露图谱、发病图谱、死亡原因图谱、疾病负担图谱、健康维护图谱或健康保障图谱。
作为本发明的进一步改进,
步骤(31):对数据的数量进行校验,若数据量小于设定人数,则返回步骤(1)继续进行数据采集;
步骤(32):对每一个数据表的每一个字段都进行数据频数统计,生成频数分布表及频数分布直方图,根据频数分布直方图发现数据缺失,则返回步骤(1)继续进行数据采集;根据频数分布直方图发现性别数据差值超过设定阈值,则返回步骤(1)继续进行数据采集;根据频数分布直方图发现数据类型不一致,则返回步骤(1)继续进行数据采集;
步骤(33):逻辑校验;
根据性别进行判断,对不合理内容进行删除;
根据年龄进行判断,对于年龄不相符的特征进行删除;
步骤(34):剔除异常值;
对于数值型变量,以该变量的参考范围的上下限的均值的±3倍的标准差作为正常值的参考范围,对于无法得到参考数据的,根据全数据均值的±3倍的标准差作为异常值检测;对异常值进行删除;
步骤(35):数据质量控制;
使用质控图进行实时质量监控,对于发现的问题数据,要及时进行反馈和解决。
作为本发明的进一步改进,
所述全员人口信息,包括:居民个人基本信息、社保信息、住房信息和居民诚信失信信息;
所述公共卫生信息,包括:个人健康基本信息、残疾人表、健康体检表、学生体检表、出生医学证明、新生儿家庭访视信息、儿童健康检查信息、产前随访服务信息、分娩记录表、产后访视服务信息、孕检记录表、预防接种卡信息、传染病报告卡、职业病报告卡、食源性疾病卡、死亡医学证明、高血压患者随访表、2型糖尿病患者随访表、重性精神疾病患者管理表、重性精神病患者发病信息、重性精神病患者出院信息、冠心病患者信息、脑卒中患者信息、肿瘤患者信息、肺结核患者随访表、育龄夫妇信息、婚姻信息、生育登记和生育审批信息、妊娠信息、妇女生育史信息、避孕信息、计划生育手术信息、流出人口信息、流入人口信息、门诊摘要信息、住院摘要信息。
所述电子病历信息,包括:门诊/急诊挂号、门诊/急诊就诊记录、门诊/急诊/住院西药处方、门诊/急诊/住院中药处方、检验记录、检验结果明细、检查记录、入院记录、住院病案首页、中医住院病案首页、出院记录。
所述健康体检信息,包括:体检报告单、体检项目表、体检项目明细表。
所述医疗保险信息,包括:基本信息、诊疗信息、医保费用总信息、医保费用明细信息;
所述监测信息,包括:死因数据库、中小学生体检数据库、计划免疫数据库、传染病数据库、饮水监测数据库、大气污染数据库、肿瘤病人信息数据库和冠心病病人信息数据库。
作为本发明的进一步改进,个体水平上的危险暴露指标包括:家族遗传指标、社会学指标、生活方式指标、行为危险因素指标、有害环境暴露指标和生理危险因素指标;
所述家族遗传指标,包括:高血压家族史阳性率、糖尿病家族史阳性率、冠心病家族史阳性率、脑卒中家族史阳性率、慢阻肺家族史阳性率、恶性肿瘤家族史阳性率、严重精神障碍家族史阳性率或结核病家族史阳性率;
所述社会学指标,包括:文盲率、离婚率、丧偶率、失业率、接受医疗贫困救助率;
所述生活方式指标,包括:嗜荤食率、嗜盐率、嗜油率、嗜糖率、嗜素食率;
所述行为危险因素指标,包括:吸烟率或饮酒率;
所述有害环境暴露指标,包括:职业病危害接触率、不安全饮水率、不清洁燃料暴露率、不使用卫生厕所率或人畜混住率;
所述生理危险因素指标,包括:肥胖率、血压偏高率、视力异常率、听力异常率、贫血率、尿蛋白阳性率、血糖偏高率、血脂偏高率、HBSAg阳性率、肝功异常率。
所述疾病指标,包括:传染病、寄生虫病、恶性肿瘤、血液疾病、造血器官疾病、涉及免疫机制的疾病、内分泌营养和代谢疾病、精神和行为障碍疾病、神经系统疾病、眼疾病、耳和乳突疾病、循环系统疾病、呼吸系统疾病、消化系统疾病、皮肤和皮下组织疾病、肌肉骨骼系统和结缔组织疾病、泌尿生殖系统疾病、妊娠、分娩和产褥期疾病、起源于围生期的疾病、先天性畸形变形、染色体异病、损伤中毒;
所述死亡原因指标,包括:传染病、寄生虫病、恶性肿瘤、血液疾病、造血器官疾病、涉及免疫机制的疾病、内分泌营养和代谢疾病、精神和行为障碍疾病、神经系统疾病、眼疾病、耳和乳突疾病、循环系统疾病、呼吸系统疾病、消化系统疾病、皮肤和皮下组织疾病、肌肉骨骼系统和结缔组织疾病、泌尿生殖系统疾病、妊娠、分娩和产褥期疾病、起源于围生期的疾病、先天性畸形变形、染色体异病、损伤中毒;
所述疾病负担指标,包括残疾调整生命年DALY指标;残疾调整生命年DALY指标,包括:因早逝造成的健康生命年的损失、因残疾造成健康生命年的损失、健康生命年的年龄相对重要性(年龄权数)或健康生命年的时间相对重要性(贴现率)。
所述健康维护指标,包括:孕产妇健康维护指标、新生儿健康维护指标、儿童健康维护指标、中小学生健康维护指标、青壮年健康维护指标、老年人健康维护指标;
所述孕产妇健康维护指标,包括:早孕建册率、产前健康管理率、产后访视率;
所述新生儿健康维护指标,包括:新生儿家庭访视率、满月健康体检率、三月龄健康体检率、六月龄健康体检率、八月龄健康体检率、婴儿期健康检查次数达标率;
所述儿童健康维护指标,包括:12月龄儿童健康体检率、18月龄儿童健康体检率、24月龄儿童健康体检率、30月龄儿童健康体检率、12-30月龄儿童健康体检率、儿童牙齿检查率、儿童视力检查率;
所述中小学生健康维护指标,包括:体重达标率、视力达标率和龋齿控制达标率;
所述青壮年健康维护指标,包括:健康体检率、高血压建档率、糖尿病建档率、妇科疾病筛查率、2型糖尿病患者药物依从率、高血压患者药物依从率、戒烟率、运动达标率、体重达标率;
所述老年人健康维护指标,包括:老年人健康状态自我评估率和老年人健康管理率。
所述健康保障指标,包括:医疗服务类指标、医疗费用类指标;
医疗服务类指标,包括:参保人数、住院人数、住院次数、住院人数占总参保人数的比例;人均住院次数、人均住院天数、普通门诊人数、普通门诊人次、普通门诊人数占总参保人数的比例、人均普通门诊次数、慢性大病门诊人数、慢性大病门诊人次、慢病大病门诊人数占总参保人数的比例;
医疗费用类指标,包括:人均费用、人均住院费用、人均普通门诊费用、人均门诊慢性病费用、费用中统筹基金支付费用比例、费用中个人支付费用比例、人均使用药品分类、使用药品费用占总费用的比例、人均住院使用耗材费用、住院使用耗材费用占总住院费用的比例。
作为本发明的进一步改进,创建危险暴露图谱的过程为:
步骤(501):从个体水平上的危险暴露指标中挑选待生成图谱的危险暴露指标;
步骤(502):以年龄为X轴,以挑选的危险暴露指标为Y轴,以不同颜色表示危险暴露程度,生成危险暴露图谱。如图2所示。
作为本发明的进一步改进,创建发病图谱的过程为:
步骤(511):从疾病指标中挑选待生成图谱的疾病指标;
步骤(512):以年龄为X轴,以挑选的疾病指标为Y轴,以不同颜色表示发病率,生成发病图谱。如图3所示。
作为本发明的进一步改进,创建死亡原因图谱的过程为:
步骤(521):从死亡原因指标中挑选待生成图谱的死亡原因指标;
步骤(522):以年龄为X轴,以挑选的死亡原因指标为Y轴,以不同颜色表示死亡原因概率,生成死亡原因图谱。如图4所示。
作为本发明的进一步改进,创建疾病负担图谱的过程为:
步骤(531):从疾病负担指标中挑选待生成图谱的疾病负担指标;
步骤(532):以年龄为X轴,以挑选的疾病负担指标为Y轴,以不同颜色表示疾病负担程度,生成疾病负担图谱。
作为本发明的进一步改进,创建健康维护图谱的过程为:
步骤(541):从健康维护指标中挑选待生成图谱的健康维护指标;
步骤(542):以年龄为X轴,以挑选的健康维护指标为Y轴,以不同颜色表示健康维护程度,生成健康维护图谱。
作为本发明的进一步改进,创建健康保障图谱的过程为:
步骤(551):从健康保障指标中挑选待生成图谱的健康保障指标;
步骤(552):以年龄为X轴,以挑选的健康保障指标为Y轴,以不同颜色表示健康保障程度,生成健康保障图谱。
作为本发明的第二个实施例,提出了全人群全生命历程健康图谱创建系统;
全人群全生命历程健康图谱创建系统,包括:存储器、处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时完成上述任一方法所述的步骤。
作为本发明的第三个实施例,提出了计算机可读存储介质;
计算机可读存储介质,其上运行有计算机指令,所述计算机指令被处理器运行时,完成上述任一方法所述的步骤。
所述步骤(32)数据量的统计只能做最初步的数据质量的校验,要想对数据值进行校验就需要深入到每一个数据表的每一个字段详细了解其真实内容,数据频数分布校验是最高效的手段之一,针数据质量校验人员可以直观的了解到每一个数据变量的真实质量,进而采取不同的处理方案。例如,
情况1,发现某地区某表格的某些字段提供的数据是代码形式,01,02,……没有提供具体解释,我们需要联系当地采集人员提供字段解释。
情况2,某地区某数据统计的性别字段90%以上为女性,这说明数据存在严重性别偏移,需要跟当地进行校验,
情况3,某地区体检数据中对白细胞的检查结果为分类型数据分别为偏高,偏低,正常,不是数值型变量,也需要要求数据采集人员重新提供数据。
例如:女性有前列腺检测内容,男性出现女性疾病,如宫颈癌、卵巢癌等,则表明内容不合理,对不合理内容进行删除。
根据年龄进行判断,若中小学生存在与年龄不相符的社会特征(如出现成年开始的听力丧失、妊娠高血压综合征、流产、产妇败血症等疾病或症状),妇女存在于年龄不相符的社会特征(如15岁之前49岁之后出现妊娠高血压综合征、流产、产妇败血症、梗阻性分娩等疾病或症状)则表明内容不合理,对相关内容进行删除。
对于数据中的分类变量,若超出在体检表里取值的数值,将这些数值设置为缺失值,例如,数据中性别中仅能存在男和女两种类型,对于其他的类型定义为缺失值。
创建疾病发病图谱的过程为:
1)队列时限:以2016年1月1日作为个体进入队列的时点,以2016年12月31日作为个体离开队列的时点。
2)队列基线人群的入列标准:针对某一特定疾病,若该病为病程长的慢性病(如高血压、糖尿病、恶性肿瘤等),则排除2016年1月1日前已经被诊断为该病个体;对于病程短的急性疾病(如急性传染病等),则不排除2016年1月1日前已经被诊断该病的个体。
3)疾病出现率的计算:某年龄某疾病出现率=[在该病队列基线中该年龄期内(2016.01.01-2016.12.31)被诊断为该病的个体数]/[在该病队列基线中该年龄的所有个体数]×(100000/10万)。
4)发病率的估算
上述某病出现率反应了在当今健康医疗大数据背景下现有疾病发现的最高水平。它体现了由多部门(各级疾病预防控制部门、各级医疗机构、各级健康体检机构、医疗保险机构等)多种角色的管理者(公卫医师、全科/家庭医师、各级医院临床医师、健康体检师、医疗保险工作者等)对同一个人体在不同的业务场景、不同业务环境和不同时间上的健康管理/临床诊疗中发现的该个体发生某病的概率。它不仅减少了单一部门单次小样本现场调查所产生的片面性和局限性,而且通过多角色的多次诊断提高了诊断正确性。因而,它不仅反映了当今大数据背景下对该种疾病发现能力的最高水平,而且也是逼近该病真实发病水平的良好指标。为此,本研究采用该病的出现率作为其发病率的估计。
创建死亡原因图谱的过程为:
1)队列时限:以2016年1月1日作为个体进入队列的时点,以2016年12月31日作为个体离开队列的时点。
2)队列基线人群的入列标准:将样本人群中2016年1月1日仍存活的所有个体均纳入队列基线。
3)疾病死亡率的计算:某年龄某疾病死亡率=[在队列基线中该年龄期内(2016.01.01-2016.12.31)因该病死亡人数]/[在队列基线中该年龄的所有观察人数]×(100000/10万)。4)绘制死因图谱。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (3)

1.全人群全生命历程健康图谱创建方法,其特征是,包括:
步骤(1):数据采集;采集医疗卫生行业的全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息;
步骤(2):数据关联和合并;以个人身份证为唯一索引,沿着生命历程时间维度,实时将全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息中的各个数据表进行相互关联和合并;
步骤(3):数据清洗,生成数据库;
步骤(4):制定指标;所述指标,包括个体水平上的危险暴露指标、疾病指标、死亡原因指标、疾病负担指标、健康维护指标和健康保障指标;
步骤(5):根据步骤(3)得到的数据库和步骤(4)制定的指标,创建健康图谱;所述健康图谱,包括:危险暴露图谱、发病图谱、死亡原因图谱、疾病负担图谱、健康维护图谱或健康保障图谱;
所述步骤(3)包括:
步骤(31):对数据的数量进行校验,若数据量小于设定人数,则返回步骤(1)继续进行数据采集;
步骤(32):对每一个数据表的每一个字段都进行数据频数统计,生成频数分布表及频数分布直方图,根据频数分布直方图发现数据缺失,则返回步骤(1)继续进行数据采集;根据频数分布直方图发现性别数据差值超过设定阈值,则返回步骤(1)继续进行数据采集;根据频数分布直方图发现数据类型不一致,则返回步骤(1)继续进行数据采集;
步骤(33):逻辑校验;
根据性别进行判断,对不合理内容进行删除;
根据年龄进行判断,对于年龄不相符的特征进行删除;
步骤(34):剔除异常值;
对于数值型变量,以该变量的参考范围的上下限的均值±3倍的标准差作为正常值的参考范围,对于无法得到参考数据的,根据全数据均值±3倍的标准差作为异常值检测;对异常值进行删除;
步骤(35):数据质量控制;
使用质控图进行实时质量监控,对于发现的问题数据,要及时进行反馈和解决;
所述创建危险暴露图谱的过程为:
步骤(501):从个体水平上的危险暴露指标中挑选待生成图谱的危险暴露指标;
步骤(502):以年龄为X轴,以挑选的危险暴露指标为Y轴,以不同颜色表示危险暴露程度,生成危险暴露图谱;
所述创建发病图谱的过程为:
步骤(511):从疾病指标中挑选待生成图谱的疾病指标;
步骤(512):以年龄为X轴,以挑选的疾病指标为Y轴,以不同颜色表示发病率,生成发病图谱;
所述创建死亡原因图谱的过程为:
步骤(521):从死亡原因指标中挑选待生成图谱的死亡原因指标;
步骤(522):以年龄为X轴,以挑选的死亡原因指标为Y轴,以不同颜色表示死亡发生概率,生成死亡原因图谱;
所述创建疾病负担图谱的过程为:
步骤(531):从疾病负担指标中挑选待生成图谱的疾病负担指标;
步骤(532):以年龄为X轴,以挑选的疾病负担指标为Y轴,以不同颜色表示疾病负担程度,生成疾病负担图谱;
所述创建健康维护图谱的过程为:
步骤(541):从健康维护指标中挑选待生成图谱的健康维护指标;
步骤(542):以年龄为X轴,以挑选的健康维护指标为Y轴,以不同颜色表示健康维护程度,生成健康维护图谱;
所述创建健康保障图谱的过程为:
步骤(551):从健康保障指标中挑选待生成图谱的健康保障指标;
步骤(552):以年龄为X轴,以挑选的健康保障指标为Y轴,以不同颜色表示健康保障程度,生成健康保障图谱。
2.全人群全生命历程健康图谱创建系统,其特征是,包括:存储器、处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时完成权利要求1中方法所述的步骤。
3.计算机可读存储介质,其特征是,其上运行有计算机指令,所述计算机指令被处理器运行时,完成权利要求1中方法所述的步骤。
CN201810379906.7A 2018-04-25 2018-04-25 全人群全生命历程健康图谱创建方法、系统及存储介质 Active CN108597588B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810379906.7A CN108597588B (zh) 2018-04-25 2018-04-25 全人群全生命历程健康图谱创建方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810379906.7A CN108597588B (zh) 2018-04-25 2018-04-25 全人群全生命历程健康图谱创建方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN108597588A CN108597588A (zh) 2018-09-28
CN108597588B true CN108597588B (zh) 2020-09-18

Family

ID=63609307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810379906.7A Active CN108597588B (zh) 2018-04-25 2018-04-25 全人群全生命历程健康图谱创建方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN108597588B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109411094A (zh) * 2018-10-23 2019-03-01 上海市疾病预防控制中心 基于卫生医疗大数据的健康期望寿命应用支撑信息系统及方法
CN112635005A (zh) * 2020-12-21 2021-04-09 山东众阳健康科技集团有限公司 面向区域化医养结合的老年人健康数据存储方法及系统
CN113434504B (zh) * 2021-06-28 2023-10-24 青岛海尔科技有限公司 死亡医学证明表的存储方法和装置、存储介质及电子装置
CN113284629B (zh) * 2021-07-16 2021-12-10 成都索贝数码科技股份有限公司 一种基于医疗大数据、依据社会属性构建疾病画像的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156492A (zh) * 2016-06-27 2016-11-23 朱升 一种基于互联网和大数据的健康管理系统及方法
CN107194174A (zh) * 2017-05-19 2017-09-22 白胜西 一种健康状况监测方法、系统和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8370293B2 (en) * 2008-08-21 2013-02-05 Terarecon Inc. Workflow template management for medical image data processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156492A (zh) * 2016-06-27 2016-11-23 朱升 一种基于互联网和大数据的健康管理系统及方法
CN107194174A (zh) * 2017-05-19 2017-09-22 白胜西 一种健康状况监测方法、系统和存储介质

Also Published As

Publication number Publication date
CN108597588A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN108597588B (zh) 全人群全生命历程健康图谱创建方法、系统及存储介质
Wang et al. Visual impairment, age-related cataract, and mortality
Mignon Health issues of incarcerated women in the United States
Abera et al. Postpartum contraceptive use in Gondar town, Northwest Ethiopia: a community based cross-sectional study
Khanani et al. The impact of prenatal WIC participation on infant mortality and racial disparities
Plan et al. Distance learning
National Center for Health Statistics (US) Health interview survey procedure, 1957-1974
Nhac-Vu et al. Predicting self-reported recovery one year after major road traffic accident trauma
Maiese Healthy people 2010—leading health indicators for women
Baye et al. Stroke characteristics and outcomes of adult patients in Northwest Ethiopia
Dunlop et al. Postpartum Medicaid coverage and contraceptive use before and after Ohio's Medicaid expansion under the Affordable Care Act
Gavin et al. Health service use and outcomes among disabled Medicaid pregnant women
Gardiner et al. Poor access to kidney disease management services in susceptible patient populations in rural Australia is associated with increased aeromedical retrievals for acute renal care
Maciosek et al. Prioritizing clinical preventive services: a review and framework with implications for community preventive services
Mayhew On the effectiveness of care co-ordination services aimed at preventing hospital admissions and emergency attendances
Sarna et al. The risk of major structural birth defects associated with seasonal influenza vaccination during pregnancy: A population‐based cohort study
Gee et al. Health reform in action: updates on implementation of the Affordable Care Act
Abeywardana et al. Neural tube defects in Australia
Josten et al. Client characteristics associated with not keeping appointments for public health nursing home visits
Weiss et al. Pregnancy-associated assault hospitalizations
Brønnum-Hansen et al. The burden of selected diseases among older people in Denmark
Sen et al. Maternal and neonatal health: surviving the roller-coaster of international policy
Albabtain et al. Epidemiology of adult trauma at a tertiary hospital in Riyadh, Saudi Arabia
Board et al. COVID-19
Vanishvili et al. GENDER BUDGETING IN THE FIELD OF GEORGIANHEALTH AND SOCIAL PROTECTION: ANALYSIS AND ASSESSMENT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant