CN110189829A - 一种电力职业人群重大慢性病风险评估方法及系统 - Google Patents

一种电力职业人群重大慢性病风险评估方法及系统 Download PDF

Info

Publication number
CN110189829A
CN110189829A CN201910552296.0A CN201910552296A CN110189829A CN 110189829 A CN110189829 A CN 110189829A CN 201910552296 A CN201910552296 A CN 201910552296A CN 110189829 A CN110189829 A CN 110189829A
Authority
CN
China
Prior art keywords
data
electric power
logistic regression
risk
regression model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910552296.0A
Other languages
English (en)
Inventor
许克豪
何群
夏英华
曹蓉
刘国恒
洪紫慧
黄苑
姜虹
梁鹏翼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN201910552296.0A priority Critical patent/CN110189829A/zh
Publication of CN110189829A publication Critical patent/CN110189829A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B2503/00Evaluating a particular growth phase or type of persons or animals
    • A61B2503/20Workers

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Psychiatry (AREA)
  • Physiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供一种电力职业人群重大慢性病风险评估方法,其包括下述步骤:获取采样的电力职业人群数据,电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;获取需要分析的身体指标及其所包含的风险等级;根据电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级,建立logistic回归模型;将电力职业人群数据录入已建立的logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到身体指标的每一风险等级所对应的概率。本发明可以对电力职业人群的健康状态进行评估和提示,对电力职业人群的健康管理具有重大意义。

Description

一种电力职业人群重大慢性病风险评估方法及系统
技术领域
本发明涉及医疗术领域,尤其涉及一种电力职业人群重大慢性病风险评估方法及系统。
背景技术
医疗健康大数据是人类与医疗及生命健康相关的活动过程中产生的数据集合,对于健康数据的有效利用在疾病的预防、诊疗与康复中起到重要作用。尤其是在新时期“互联网+”在健康管理领域的不断发展,对于多维健康数据的重视不断加强。
首先是客观的发展需求。重大慢性病,包括心血管疾病、糖尿病、肿瘤等给国家和企业带来沉重疾病负担,在生命的全周期开展慢性病的一级预防、二级预防和三级预防是减少患病率、致残率、提高健康寿命年的最有效措施。三级预防的关键有两点,一是找对影响疾病发生、发展的危险因素。电力人群具有职业特殊性,除了普通人群具有的危险因素外,还存在职业危险因素,但目前对这些因素认识不足。二是识别个体的健康状态、发现危险因素暴露并采取预防措施,这需要个体准确的数据和科学预防技术。
第二个背景是企业健康数据的沉积和挖掘不足。大量的企业定期开展职工体检、工作环境监测等,数据量越积越多,但不具备大数据处理能力、统计处理能力和医疗卫生知识。一个能帮助企业快速识别人群健康状态并提示健康风险的工具对企业的健康管理有很大意义。
发明内容
为解决上述技术问题,本发明提供一种电力职业人群重大慢性病风险评估方法及系统,可以对电力职业人群的健康状态进行评估和提示,对电力职业人群的健康管理具有重大意义。
本发明提供的一种电力职业人群重大慢性病风险评估方法,其包括下述步骤:
获取采样的电力职业人群数据,所述电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
获取需要分析的身体指标及其所包含的风险等级;
根据所述电力职业人群数据所对应的数据类别、所述身体指标及其所包含的风险等级,建立logistic回归模型;
将所述电力职业人群数据录入已建立的logistic回归模型,对录入所述电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率。
优选地,所述身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;所述身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;所述血压指数包含的风险等级有:正常、正常高压、高血压;所述血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
优选地,logistic回归模型的数量为g-1个,g为所述身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
优选地,对录入所述电力职业人群数据的logistic回归模型进行求解,具体为:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,其中Pk为所述身体指标的第k个风险等级对应的概率。
优选地,还包括下述步骤:
利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
本发明还提供一种电力职业人群重大慢性病风险评估系统,其包括:
数据获取模块,用于获取采样的电力职业人群数据,所述电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
身体指标及风险等级获取模块,用于获取需要分析的身体指标及其所包含的风险等级;
模型构建模块,用于根据所述电力职业人群数据所对应的数据类别、所述身体指标及其所包含的风险等级,建立logistic回归模型;
风险计算模块,用于将所述电力职业人群数据录入已建立的logistic回归模型,对录入所述电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率。
优选地,所述身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;所述身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;所述血压指数包含的风险等级有:正常、正常高压、高血压;所述血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
优选地,logistic回归模型的数量为g-1个,g为所述身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
优选地,所述风险计算模块,进一步地用于:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,其中Pk为所述身体指标的第k个风险等级对应的概率。
优选地,还包括:
优势比计算模块,用于利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
实施本发明,具有如下有益效果:本发明将电力职业人群数据录入已建立的logistic回归模型,logistic回归模型由电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级构建而成的多分类有序logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率,可以对电力职业人群的健康状态进行评估和提示,对电力职业人群的健康管理具有重大意义。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的电力职业人群重大慢性病风险评估方法的流程图。
具体实施方式
本发明提供一种电力职业人群重大慢性病风险评估方法,如图1所示,其包括下述步骤:
获取采样的电力职业人群数据,电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
获取需要分析的身体指标及其所包含的风险等级;
根据电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级,建立有序分类的logistic回归模型;
将电力职业人群数据录入已建立的logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到身体指标的每一风险等级所对应的概率。
具体地,上述的电力职业人群数据,可以通过调查问卷进行采样,或者从医院的数据库中,或者从企业的数据库中直接获取。
进一步地,身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;血压指数包含的风险等级有:正常、正常高压、高血压;血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
进一步地,logistic回归模型的数量为g-1个,g为身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。这里,可以利用R软件相应的函数程序包拟合原始数据(电力职业人群数据),输出结果。
进一步地,对录入电力职业人群数据的logistic回归模型进行求解,具体为:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,其中Pk为身体指标的第k个风险等级对应的概率;
当g=k时,
电力职业人群重大慢性病风险评估方法还包括下述步骤:
利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
电力职业人群数据如下表所示:
身体质量指数对应的具体数据参数如下:
一般的线性回归只适用于应变量为连续变量的情况,此时可以采用logistic回归分析。logistic回归是一种研究两水平或多水平的反应变量与影响因素间曲线关系的回归分析。logistic回归应变量可以是二分类的,也可以是多分类的,二分类的情况具有一般性,但在实际中也可能会遇到多分类的情况。多分类logistic回归模型又可以分成两种不同的情况,第一种为反应变量是无序分类资料,如血型分为:A型、B型、AB型、O型;第二种为反应变量是有序分类资料(等级资料),如疗效分为:痊愈、显效、微效、无效。由于应变量BMI(身体质量指数)分为低体重、正常、肥胖前期、一级肥胖、二级肥胖等五个风险等级,BP(血压)分为正常、正常高压、高血压等三个风险等级,GLU(血糖)分为正常、糖尿病前期、糖尿病等三个风险等级。对该数据需要采用有序分类logistic回归模型进行分析。
以5水平的BMI指数为例,应变量取值为1、2、3、4、5,分别对应身体质量指数的五个风险等级,相应概率取值水平为p1、p2、p3、p4、p5。即某职工经过模型预测,其BMI指数处于低体重、正常、肥胖前期、一级肥胖、二级肥胖的风险概率为p1、p2、p3、p4、p5(p1+p2+p3+p4+p5=1)。
根据有序分类logistic回归原理,可建立4个有序回归logistic回归模型:
logit(p1)=β011X12X2+...+βmXm
logit(p1+p2)=β021X12X2+...+βmXm
logit(p1+p2+p3)=β031X12X2+...+βmXm
logit(p1+p2+p3+p4)=β041X12X2+...+βmXm
P5=1-(P1+P2+P3+P4)
以身体质量预测指数为例,需要说明的是“==”表示判断该变量是否属于该组或者等于该值,若是则为1,否则为0,例如性别男对应的genderabc应该为1,性别女对应的genderabc应该为2,性别男的(genderabc==2)的值为0,性别男的(genderabc==1)的值为1。
logit(p1)=-5.2527+(-1.575729613)*(genderabc==2)+(0.19705621)*(age.catabc==2)+(0.189338625)*(age.catabc==3)+(0.279641929)*(age.catabc==4)+(0.098110654)*(workyear.catabc==2)+(0.319055879)*(workyear.catabc==3)+(-0.023581518)*(Nq1abc==2)+(-0.530720192)*(Nq1abc==3)+(-0.196035291)*(Nq2.Nabc==2)+(0.182739173)*(Nq2.Nabc==3)+(0.181107888)*(GZModelcodeabc==2)+(-0.143577901)*(GZModelcodeabc==3)+(0.007667259)*(GZModelcodeabc==4)+(-0.664537602)*(GWXLModelcodeabc==2)+(-0.872149689)*(GWXLModelcodeabc==3)+(-0.890754864)*(Nq4.7abc==2)+(-0.390571293)*(Nq5.7abc==2)+(-0.10208856)*(Nq7abc==2)+(-0.086848718)*(Nq7abc==3)+(0.166935229)*(Nq10abc==2)+(0.24967892)*(Nq10abc==3)+(-0.676813202)*(Nq10abc==4)+(0.071105476)*(Nq12abc==2)+(0.323905897)*(Nq12abc==3)+(1.415612305)*(Nq12abc==4)+(0.115952426)*(Nq15abc==2)+(0.392958029)*(Nq15abc==3)+(0.218606797)*(Nq15abc==4)+(-0.084661004)*(Nq17abc==2)+(-0.238055324)*(Nq17abc==3)+(-0.51163021)*(Nq17abc==4)+(0.087371152)*(Nq18abc==2)+(0.083748491)*(Nq18abc==3)+(0.24237703)*(Nq18abc==4)+(0.038279688)*(Nq23abc==2)+(0.399948596)*(Nq23abc==3)+(0.016914244)*(Nq29abc==2)+(0.347088562)*(Nq29abc==3)+(-2.838408819)*(Nq29abc==4)+(-0.018402592)*(Nq41abc==2)+(-0.2772015)*(Nq41abc==3)+(-0.027672228)*(Nq41abc==4)+(-0.179128728)*(Nq43abc==2)+(-0.414707117)*(Nq43abc==3)+(-0.720949549)*(Nq43abc==4)+(0.136823021)*(Nq45abc==2)+(0.366859804)*(Nq45abc==3)+(0.055216777)*(Nq45abc==4)+(0.410833021)*(Nq51abc==2)+(0.51874652)*(Nq51abc==3)+(-0.175404155)*(Nq52abc==2)+(-0.238831047)*(Nq52abc==3)。
logit(p1+p2)=-1.8182+(-1.575729613)*(genderabc==2)+(0.19705621)*(age.catabc==2)+(0.189338625)*(age.catabc==3)+(0.279641929)*(age.catabc==4)+(0.098110654)*(workyear.catabc==2)+(0.319055879)*(workyear.catabc==3)+(-0.023581518)*(Nq1abc==2)+(-0.530720192)*(Nq1abc==3)+(-0.196035291)*(Nq2.Nabc==2)+(0.182739173)*(Nq2.Nabc==3)+(0.181107888)*(GZModelcodeabc==2)+(-0.143577901)*(GZModelcodeabc==3)+(0.007667259)*(GZModelcodeabc==4)+(-0.664537602)*(GWXLModelcodeabc==2)+(-0.872149689)*(GWXLModelcodeabc==3)+(-0.890754864)*(Nq4.7abc==2)+(-0.390571293)*(Nq5.7abc==2)+(-0.10208856)*(Nq7abc==2)+(-0.086848718)*(Nq7abc==3)+(0.166935229)*(Nq10abc==2)+(0.24967892)*(Nq10abc==3)+(-0.676813202)*(Nq10abc==4)+(0.071105476)*(Nq12abc==2)+(0.323905897)*(Nq12abc==3)+(1.415612305)*(Nq12abc==4)+(0.115952426)*(Nq15abc==2)+(0.392958029)*(Nq15abc==3)+(0.218606797)*(Nq15abc==4)+(-0.084661004)*(Nq17abc==2)+(-0.238055324)*(Nq17abc==3)+(-0.51163021)*(Nq17abc==4)+(0.087371152)*(Nq18abc==2)+(0.083748491)*(Nq18abc==3)+(0.24237703)*(Nq18abc==4)+(0.038279688)*(Nq23abc==2)+(0.399948596)*(Nq23abc==3)+(0.016914244)*(Nq29abc==2)+(0.347088562)*(Nq29abc==3)+(-2.838408819)*(Nq29abc==4)+(-0.018402592)*(Nq41abc==2)+(-0.2772015)*(Nq41abc==3)+(-0.027672228)*(Nq41abc==4)+(-0.179128728)*(Nq43abc==2)+(-0.414707117)*(Nq43abc==3)+(-0.720949549)*(Nq43abc==4)+(0.136823021)*(Nq45abc==2)+(0.366859804)*(Nq45abc==3)+(0.055216777)*(Nq45abc==4)+(0.410833021)*(Nq51abc==2)+(0.51874652)*(Nq51abc==3)+(-0.175404155)*(Nq52abc==2)+(-0.238831047)*(Nq52abc==3)。
logit(p1+p2+p3)=-0.7690+(-1.575729613)*(genderabc==2)+(0.19705621)*(age.catabc==2)+(0.189338625)*(age.catabc==3)+(0.279641929)*(age.catabc==4)+(0.098110654)*(workyear.catabc==2)+(0.319055879)*(workyear.catabc==3)+(-0.023581518)*(Nq1abc==2)+(-0.530720192)*(Nq1abc==3)+(-0.196035291)*(Nq2.Nabc==2)+(0.182739173)*(Nq2.Nabc==3)+(0.181107888)*(GZModelcodeabc==2)+(-0.143577901)*(GZModelcodeabc==3)+(0.007667259)*(GZModelcodeabc==4)+(-0.664537602)*(GWXLModelcodeabc==2)+(-0.872149689)*(GWXLModelcodeabc==3)+(-0.890754864)*(Nq4.7abc==2)+(-0.390571293)*(Nq5.7abc==2)+(-0.10208856)*(Nq7abc==2)+(-0.086848718)*(Nq7abc==3)+(0.166935229)*(Nq10abc==2)+(0.24967892)*(Nq10abc==3)+(-0.676813202)*(Nq10abc==4)+(0.071105476)*(Nq12abc==2)+(0.323905897)*(Nq12abc==3)+(1.415612305)*(Nq12abc==4)+(0.115952426)*(Nq15abc==2)+(0.392958029)*(Nq15abc==3)+(0.218606797)*(Nq15abc==4)+(-0.084661004)*(Nq17abc==2)+(-0.238055324)*(Nq17abc==3)+(-0.51163021)*(Nq17abc==4)+(0.087371152)*(Nq18abc==2)+(0.083748491)*(Nq18abc==3)+(0.24237703)*(Nq18abc==4)+(0.038279688)*(Nq23abc==2)+(0.399948596)*(Nq23abc==3)+(0.016914244)*(Nq29abc==2)+(0.347088562)*(Nq29abc==3)+(-2.838408819)*(Nq29abc==4)+(-0.018402592)*(Nq41abc==2)+(-0.2772015)*(Nq41abc==3)+(-0.027672228)*(Nq41abc==4)+(-0.179128728)*(Nq43abc==2)+(-0.414707117)*(Nq43abc==3)+(-0.720949549)*(Nq43abc==4)+(0.136823021)*(Nq45abc==2)+(0.366859804)*(Nq45abc==3)+(0.055216777)*(Nq45abc==4)+(0.410833021)*(Nq51abc==2)+(0.51874652)*(Nq51abc==3)+(-0.175404155)*(Nq52abc==2)+(-0.238831047)*(Nq52abc==3)。
logit(p1+p2+p3+p4)=1.6484+(-1.575729613)*(genderabc==2)+(0.19705621)*(age.catabc==2)+(0.189338625)*(age.catabc==3)+(0.279641929)*(age.catabc==4)+(0.098110654)*(workyear.catabc==2)+(0.319055879)*(workyear.catabc==3)+(-0.023581518)*(Nq1abc==2)+(-0.530720192)*(Nq1abc==3)+(-0.196035291)*(Nq2.Nabc==2)+(0.182739173)*(Nq2.Nabc==3)+(0.181107888)*(GZModelcodeabc==2)+(-0.143577901)*(GZModelcodeabc==3)+(0.007667259)*(GZModelcodeabc==4)+(-0.664537602)*(GWXLModelcodeabc==2)+(-0.872149689)*(GWXLModelc odeabc==3)+(-0.890754864)*(Nq4.7abc==2)+(-0.390571293)*(Nq5.7abc==2)+(-0.10208856)*(Nq7abc==2)+(-0.086848718)*(Nq7abc==3)+(0.166935229)*(Nq10abc==2)+(0.24967892)*(Nq10abc==3)+(-0.676813202)*(Nq10abc==4)+(0.071105476)*(Nq12abc==2)+(0.323905897)*(Nq12abc==3)+(1.415612305)*(Nq12abc==4)+(0.115952426)*(Nq15abc==2)+(0.392958029)*(Nq15abc==3)+(0.218606797)*(Nq15abc==4)+(-0.084661004)*(Nq17abc==2)+(-0.238055324)*(Nq17abc==3)+(-0.51163021)*(Nq17abc==4)+(0.087371152)*(Nq18abc==2)+(0.083748491)*(N q18abc==3)+(0.24237703)*(Nq18abc==4)+(0.038279688)*(Nq23abc==2)+(0.399948596)*(Nq23abc==3)+(0.016914244)*(Nq29abc==2)+(0.347088562)*(Nq29abc==3)+(-2.838408819)*(Nq29abc==4)+(-0.018402592)*(Nq41abc==2)+(-0.2772015)*(Nq41abc==3)+(-0.027672228)*(Nq41abc==4)+(-0.179128728)*(Nq43abc==2)+(-0.414707117)*(Nq43abc==3)+(-0.720949549)*(Nq43abc==4)+(0.136823021)*(Nq45abc==2)+(0.366859804)*(Nq45abc==3)+(0.055216777)*(Nq45abc==4)+(0.410833021)*(Nq51abc==2)+(0.51874652)*(Nq51abc==3)+(-0.175404155)*(Nq52abc==2)+(-0.238831047)*(Nq52abc==3)。
当得到每个变量的回归系数βj值后,根据logistic回归的原理,回归系数βj表示自变量Xj每变化一个单位时,logit(p)的改变量。βj与衡量危险因素作用大小的优势比(oddsratio,OR)有一个对应关系。即ORj=exp(βj)。
以BMI指数中的自变量“工作的体力劳动强度”为例:将自变量中的“高强度”等级作为参照变量,“一般强度”和“低强度”对其的OR值分别为1.50和1.68,即表示“一般强度”和“低强度”的体力劳动强度其使BMI指数升高一个等级的可能性是“高强度”体力劳动强度的1.50倍和1.68倍,是其危险因素(即OR>1时是危险因素)。相反的,变量“直系亲属是否患有肥胖”中,选“有肥胖”为参照,“无肥胖”的OR值为0.41,即“直系亲属无肥胖”的职工BMI指数升高一个等级的可能性是“直系亲属有肥胖”的职工的0.41倍,更不容易患肥胖(即OR<1时是保护因素)。
本发明还提供一种电力职业人群重大慢性病风险评估系统,其包括:数据获取模块、身体指标及风险等级获取模块、模型构建模块、风险计算模块。
数据获取模块用于获取采样的电力职业人群数据,电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据。
身体指标及风险等级获取模块用于获取需要分析的身体指标及其所包含的风险等级。
模型构建模块用于根据电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级,建立logistic回归模型。
风险计算模块用于将电力职业人群数据录入已建立的logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到身体指标的每一风险等级所对应的概率。
进一步地,身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;血压指数包含的风险等级有:正常、正常高压、高血压;血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
进一步地,logistic回归模型的数量为g-1个,g为身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
风险计算模块进一步地用于:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,其中Pk为身体指标的第k个风险等级对应的概率。
电力职业人群重大慢性病风险评估系统还包括:优势比计算模块。
优势比计算模块用于利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
本发明将电力职业人群数据录入已建立的logistic回归模型,logistic回归模型由电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级构建而成的多分类有序logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率,可以对电力职业人群的健康状态进行评估和提示,对电力职业人群的健康管理具有重大意义。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种电力职业人群重大慢性病风险评估方法,其特征在于,包括下述步骤:
获取采样的电力职业人群数据,所述电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
获取需要分析的身体指标及其所包含的风险等级;
根据所述电力职业人群数据所对应的数据类别、所述身体指标及其所包含的风险等级,建立logistic回归模型;
将所述电力职业人群数据录入已建立的logistic回归模型,对录入所述电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率。
2.根据权利要求1所述的电力职业人群重大慢性病风险评估方法,其特征在于,所述身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;所述身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;所述血压指数包含的风险等级有:正常、正常高压、高血压;所述血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
3.根据权利要求1所述的电力职业人群重大慢性病风险评估方法,其特征在于,logistic回归模型的数量为g-1个,g为所述身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
4.根据权利要求3所述的电力职业人群重大慢性病风险评估方法,其特征在于,对录入所述电力职业人群数据的logistic回归模型进行求解,具体为:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,
其中Pk为所述身体指标的第k个风险等级对应的概率。
5.根据权利要求1所述的电力职业人群重大慢性病风险评估方法,其特征在于,还包括下述步骤:
利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
6.一种电力职业人群重大慢性病风险评估系统,其特征在于,包括:
数据获取模块,用于获取采样的电力职业人群数据,所述电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
身体指标及风险等级获取模块,用于获取需要分析的身体指标及其所包含的风险等级;
模型构建模块,用于根据所述电力职业人群数据所对应的数据类别、所述身体指标及其所包含的风险等级,建立logistic回归模型;
风险计算模块,用于将所述电力职业人群数据录入已建立的logistic回归模型,对录入所述电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率。
7.根据权利要求6所述的电力职业人群重大慢性病风险评估系统,其特征在于,所述身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;所述身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;所述血压指数包含的风险等级有:正常、正常高压、高血压;所述血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
8.根据权利要求6所述的电力职业人群重大慢性病风险评估系统,其特征在于,logistic回归模型的数量为g-1个,g为所述身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
9.根据权利要求8所述的电力职业人群重大慢性病风险评估系统,其特征在于,所述风险计算模块,进一步地用于:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,
其中Pk为所述身体指标的第k个风险等级对应的概率。
10.根据权利要求6所述的电力职业人群重大慢性病风险评估系统,其特征在于,还包括:
优势比计算模块,用于利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
CN201910552296.0A 2019-06-21 2019-06-21 一种电力职业人群重大慢性病风险评估方法及系统 Pending CN110189829A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910552296.0A CN110189829A (zh) 2019-06-21 2019-06-21 一种电力职业人群重大慢性病风险评估方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910552296.0A CN110189829A (zh) 2019-06-21 2019-06-21 一种电力职业人群重大慢性病风险评估方法及系统

Publications (1)

Publication Number Publication Date
CN110189829A true CN110189829A (zh) 2019-08-30

Family

ID=67723239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910552296.0A Pending CN110189829A (zh) 2019-06-21 2019-06-21 一种电力职业人群重大慢性病风险评估方法及系统

Country Status (1)

Country Link
CN (1) CN110189829A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696673A (zh) * 2020-05-08 2020-09-22 吕小民 一种心理健康管理模型系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153774A (zh) * 2017-05-24 2017-09-12 山东大学 慢性病风险评估双曲线模型的构建及应用该模型的疾病预测系统
CN107256323A (zh) * 2016-09-05 2017-10-17 云健康基因科技(上海)有限公司 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统
CN108122612A (zh) * 2017-12-20 2018-06-05 姜涵予 数据库的建立、多维度健康风险等级确定方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107256323A (zh) * 2016-09-05 2017-10-17 云健康基因科技(上海)有限公司 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统
CN107153774A (zh) * 2017-05-24 2017-09-12 山东大学 慢性病风险评估双曲线模型的构建及应用该模型的疾病预测系统
CN108122612A (zh) * 2017-12-20 2018-06-05 姜涵予 数据库的建立、多维度健康风险等级确定方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
孙凤等: "台湾35~74岁男性体检者骨质疏松5年发病风险预测模型", 《中国骨质疏松杂志》 *
张波等: "Logistic回归模型在高血压患病率影响因素分析中的应用", 《云南大学学报(自然科学版)》 *
曹茜: ""常见慢性病危险因素分析及风险评估模型的建立——以高血压和糖尿病为例"", 《中国优秀硕士学位论文全文数据库医药卫生科技辑 (月刊)》 *
石红梅: "北京市崇文区职业人群慢性病患病情况及其危险因素", 《职业与健康》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696673A (zh) * 2020-05-08 2020-09-22 吕小民 一种心理健康管理模型系统及方法

Similar Documents

Publication Publication Date Title
ȚĂRANU Data mining in healthcare: decision making and precision
US8015136B1 (en) Algorithmic method for generating a medical utilization profile for a patient and to be used for medical risk analysis decisioning
Lee et al. Data mining techniques applied to medical information
Liaw et al. Towards an ontology for data quality in integrated chronic disease management: a realist review of the literature
Lin et al. Analysis by data mining in the emergency medicine triage database at a Taiwanese regional hospital
CN105528529A (zh) 基于大数据分析的中医临床技能评价体系的数据处理方法
CN114639479A (zh) 一种基于医疗知识图谱的智能诊断辅助系统
CA2648510A1 (en) System and method for providing integrated wellness assessment
CN112331349B (zh) 一种脑卒中复发监测系统
Ceglowski et al. Knowledge discovery through mining emergency department data
CN110189829A (zh) 一种电力职业人群重大慢性病风险评估方法及系统
WO2017083568A1 (en) Estimating or forecasting health condition prevalence in a definable area and associated costs and return on investment of interventions
CN113643814A (zh) 健康管理方案的推荐方法、装置、设备及存储介质
CN113642672A (zh) 医保数据的特征加工方法、装置、计算机设备及存储介质
CN113642669B (zh) 基于特征分析的防欺诈检测方法、装置、设备及存储介质
Li et al. National release of the nursing home quality report cards: implications of statistical methodology for risk adjustment
Alhorishi et al. Using machine learning to predict early preparation of pharmacy prescriptions at psmmc-a comparison of four machine learning algorithms
Ageno et al. Acquisition of temporal patterns from electronic health records: an application to multimorbid patients
Forgionne et al. Cancer surveillance using data warehousing, data mining, and decision support systems
CN111986815A (zh) 基于共现关系的项目组合挖掘方法及相关设备
Hakimjavadi et al. Multivariable prediction models for traumatic spinal cord injury: a systematic review
WO2014179513A1 (en) Systems and methods to classify and rank health information
Waghmare et al. Analytical study using data mining for periodical medical examination of employees
Hung et al. Deriving A Novel Health Index Using A Large-Scale Population Based Electronic Health Record With Deep Networks
Borlawsky et al. Evaluation of an automated pressure ulcer risk assessment model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190830

RJ01 Rejection of invention patent application after publication