CN110189829A - 一种电力职业人群重大慢性病风险评估方法及系统 - Google Patents
一种电力职业人群重大慢性病风险评估方法及系统 Download PDFInfo
- Publication number
- CN110189829A CN110189829A CN201910552296.0A CN201910552296A CN110189829A CN 110189829 A CN110189829 A CN 110189829A CN 201910552296 A CN201910552296 A CN 201910552296A CN 110189829 A CN110189829 A CN 110189829A
- Authority
- CN
- China
- Prior art keywords
- data
- electric power
- risk
- logistic regression
- regression model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000017667 Chronic Disease Diseases 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000007477 logistic regression Methods 0.000 claims abstract description 74
- 230000004630 mental health Effects 0.000 claims abstract description 7
- 230000036772 blood pressure Effects 0.000 claims description 14
- 230000002641 glycemic effect Effects 0.000 claims description 12
- 238000012502 risk assessment Methods 0.000 claims description 12
- 208000037063 Thinness Diseases 0.000 claims description 8
- 206010048828 underweight Diseases 0.000 claims description 8
- 206010018429 Glucose tolerance impaired Diseases 0.000 claims description 7
- 206010020772 Hypertension Diseases 0.000 claims description 7
- 208000001280 Prediabetic State Diseases 0.000 claims description 7
- 201000009104 prediabetes syndrome Diseases 0.000 claims description 7
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 206010018473 Glycosuria Diseases 0.000 claims 2
- 230000036541 health Effects 0.000 abstract description 14
- 208000008589 Obesity Diseases 0.000 description 9
- 235000020824 obesity Nutrition 0.000 description 9
- 206010012601 diabetes mellitus Diseases 0.000 description 6
- 230000003862 health status Effects 0.000 description 5
- 230000002265 prevention Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 230000004224 protection Effects 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000009862 primary prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009863 secondary prevention Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
- A61B5/7275—Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B2503/00—Evaluating a particular growth phase or type of persons or animals
- A61B2503/20—Workers
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Heart & Thoracic Surgery (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Veterinary Medicine (AREA)
- Psychiatry (AREA)
- Physiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种电力职业人群重大慢性病风险评估方法,其包括下述步骤:获取采样的电力职业人群数据,电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;获取需要分析的身体指标及其所包含的风险等级;根据电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级,建立logistic回归模型;将电力职业人群数据录入已建立的logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到身体指标的每一风险等级所对应的概率。本发明可以对电力职业人群的健康状态进行评估和提示,对电力职业人群的健康管理具有重大意义。
Description
技术领域
本发明涉及医疗术领域,尤其涉及一种电力职业人群重大慢性病风险评估方法及系统。
背景技术
医疗健康大数据是人类与医疗及生命健康相关的活动过程中产生的数据集合,对于健康数据的有效利用在疾病的预防、诊疗与康复中起到重要作用。尤其是在新时期“互联网+”在健康管理领域的不断发展,对于多维健康数据的重视不断加强。
首先是客观的发展需求。重大慢性病,包括心血管疾病、糖尿病、肿瘤等给国家和企业带来沉重疾病负担,在生命的全周期开展慢性病的一级预防、二级预防和三级预防是减少患病率、致残率、提高健康寿命年的最有效措施。三级预防的关键有两点,一是找对影响疾病发生、发展的危险因素。电力人群具有职业特殊性,除了普通人群具有的危险因素外,还存在职业危险因素,但目前对这些因素认识不足。二是识别个体的健康状态、发现危险因素暴露并采取预防措施,这需要个体准确的数据和科学预防技术。
第二个背景是企业健康数据的沉积和挖掘不足。大量的企业定期开展职工体检、工作环境监测等,数据量越积越多,但不具备大数据处理能力、统计处理能力和医疗卫生知识。一个能帮助企业快速识别人群健康状态并提示健康风险的工具对企业的健康管理有很大意义。
发明内容
为解决上述技术问题,本发明提供一种电力职业人群重大慢性病风险评估方法及系统,可以对电力职业人群的健康状态进行评估和提示,对电力职业人群的健康管理具有重大意义。
本发明提供的一种电力职业人群重大慢性病风险评估方法,其包括下述步骤:
获取采样的电力职业人群数据,所述电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
获取需要分析的身体指标及其所包含的风险等级;
根据所述电力职业人群数据所对应的数据类别、所述身体指标及其所包含的风险等级,建立logistic回归模型;
将所述电力职业人群数据录入已建立的logistic回归模型,对录入所述电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率。
优选地,所述身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;所述身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;所述血压指数包含的风险等级有:正常、正常高压、高血压;所述血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
优选地,logistic回归模型的数量为g-1个,g为所述身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
优选地,对录入所述电力职业人群数据的logistic回归模型进行求解,具体为:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,其中Pk为所述身体指标的第k个风险等级对应的概率。
优选地,还包括下述步骤:
利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
本发明还提供一种电力职业人群重大慢性病风险评估系统,其包括:
数据获取模块,用于获取采样的电力职业人群数据,所述电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
身体指标及风险等级获取模块,用于获取需要分析的身体指标及其所包含的风险等级;
模型构建模块,用于根据所述电力职业人群数据所对应的数据类别、所述身体指标及其所包含的风险等级,建立logistic回归模型;
风险计算模块,用于将所述电力职业人群数据录入已建立的logistic回归模型,对录入所述电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率。
优选地,所述身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;所述身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;所述血压指数包含的风险等级有:正常、正常高压、高血压;所述血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
优选地,logistic回归模型的数量为g-1个,g为所述身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
优选地,所述风险计算模块,进一步地用于:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,其中Pk为所述身体指标的第k个风险等级对应的概率。
优选地,还包括:
优势比计算模块,用于利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
实施本发明,具有如下有益效果:本发明将电力职业人群数据录入已建立的logistic回归模型,logistic回归模型由电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级构建而成的多分类有序logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率,可以对电力职业人群的健康状态进行评估和提示,对电力职业人群的健康管理具有重大意义。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的电力职业人群重大慢性病风险评估方法的流程图。
具体实施方式
本发明提供一种电力职业人群重大慢性病风险评估方法,如图1所示,其包括下述步骤:
获取采样的电力职业人群数据,电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
获取需要分析的身体指标及其所包含的风险等级;
根据电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级,建立有序分类的logistic回归模型;
将电力职业人群数据录入已建立的logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到身体指标的每一风险等级所对应的概率。
具体地,上述的电力职业人群数据,可以通过调查问卷进行采样,或者从医院的数据库中,或者从企业的数据库中直接获取。
进一步地,身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;血压指数包含的风险等级有:正常、正常高压、高血压;血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
进一步地,logistic回归模型的数量为g-1个,g为身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。这里,可以利用R软件相应的函数程序包拟合原始数据(电力职业人群数据),输出结果。
进一步地,对录入电力职业人群数据的logistic回归模型进行求解,具体为:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,其中Pk为身体指标的第k个风险等级对应的概率;
当g=k时,
电力职业人群重大慢性病风险评估方法还包括下述步骤:
利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
电力职业人群数据如下表所示:
身体质量指数对应的具体数据参数如下:
一般的线性回归只适用于应变量为连续变量的情况,此时可以采用logistic回归分析。logistic回归是一种研究两水平或多水平的反应变量与影响因素间曲线关系的回归分析。logistic回归应变量可以是二分类的,也可以是多分类的,二分类的情况具有一般性,但在实际中也可能会遇到多分类的情况。多分类logistic回归模型又可以分成两种不同的情况,第一种为反应变量是无序分类资料,如血型分为:A型、B型、AB型、O型;第二种为反应变量是有序分类资料(等级资料),如疗效分为:痊愈、显效、微效、无效。由于应变量BMI(身体质量指数)分为低体重、正常、肥胖前期、一级肥胖、二级肥胖等五个风险等级,BP(血压)分为正常、正常高压、高血压等三个风险等级,GLU(血糖)分为正常、糖尿病前期、糖尿病等三个风险等级。对该数据需要采用有序分类logistic回归模型进行分析。
以5水平的BMI指数为例,应变量取值为1、2、3、4、5,分别对应身体质量指数的五个风险等级,相应概率取值水平为p1、p2、p3、p4、p5。即某职工经过模型预测,其BMI指数处于低体重、正常、肥胖前期、一级肥胖、二级肥胖的风险概率为p1、p2、p3、p4、p5(p1+p2+p3+p4+p5=1)。
根据有序分类logistic回归原理,可建立4个有序回归logistic回归模型:
logit(p1)=β01+β1X1+β2X2+...+βmXm
logit(p1+p2)=β02+β1X1+β2X2+...+βmXm
logit(p1+p2+p3)=β03+β1X1+β2X2+...+βmXm
logit(p1+p2+p3+p4)=β04+β1X1+β2X2+...+βmXm
P5=1-(P1+P2+P3+P4)
以身体质量预测指数为例,需要说明的是“==”表示判断该变量是否属于该组或者等于该值,若是则为1,否则为0,例如性别男对应的genderabc应该为1,性别女对应的genderabc应该为2,性别男的(genderabc==2)的值为0,性别男的(genderabc==1)的值为1。
logit(p1)=-5.2527+(-1.575729613)*(genderabc==2)+(0.19705621)*(age.catabc==2)+(0.189338625)*(age.catabc==3)+(0.279641929)*(age.catabc==4)+(0.098110654)*(workyear.catabc==2)+(0.319055879)*(workyear.catabc==3)+(-0.023581518)*(Nq1abc==2)+(-0.530720192)*(Nq1abc==3)+(-0.196035291)*(Nq2.Nabc==2)+(0.182739173)*(Nq2.Nabc==3)+(0.181107888)*(GZModelcodeabc==2)+(-0.143577901)*(GZModelcodeabc==3)+(0.007667259)*(GZModelcodeabc==4)+(-0.664537602)*(GWXLModelcodeabc==2)+(-0.872149689)*(GWXLModelcodeabc==3)+(-0.890754864)*(Nq4.7abc==2)+(-0.390571293)*(Nq5.7abc==2)+(-0.10208856)*(Nq7abc==2)+(-0.086848718)*(Nq7abc==3)+(0.166935229)*(Nq10abc==2)+(0.24967892)*(Nq10abc==3)+(-0.676813202)*(Nq10abc==4)+(0.071105476)*(Nq12abc==2)+(0.323905897)*(Nq12abc==3)+(1.415612305)*(Nq12abc==4)+(0.115952426)*(Nq15abc==2)+(0.392958029)*(Nq15abc==3)+(0.218606797)*(Nq15abc==4)+(-0.084661004)*(Nq17abc==2)+(-0.238055324)*(Nq17abc==3)+(-0.51163021)*(Nq17abc==4)+(0.087371152)*(Nq18abc==2)+(0.083748491)*(Nq18abc==3)+(0.24237703)*(Nq18abc==4)+(0.038279688)*(Nq23abc==2)+(0.399948596)*(Nq23abc==3)+(0.016914244)*(Nq29abc==2)+(0.347088562)*(Nq29abc==3)+(-2.838408819)*(Nq29abc==4)+(-0.018402592)*(Nq41abc==2)+(-0.2772015)*(Nq41abc==3)+(-0.027672228)*(Nq41abc==4)+(-0.179128728)*(Nq43abc==2)+(-0.414707117)*(Nq43abc==3)+(-0.720949549)*(Nq43abc==4)+(0.136823021)*(Nq45abc==2)+(0.366859804)*(Nq45abc==3)+(0.055216777)*(Nq45abc==4)+(0.410833021)*(Nq51abc==2)+(0.51874652)*(Nq51abc==3)+(-0.175404155)*(Nq52abc==2)+(-0.238831047)*(Nq52abc==3)。
logit(p1+p2)=-1.8182+(-1.575729613)*(genderabc==2)+(0.19705621)*(age.catabc==2)+(0.189338625)*(age.catabc==3)+(0.279641929)*(age.catabc==4)+(0.098110654)*(workyear.catabc==2)+(0.319055879)*(workyear.catabc==3)+(-0.023581518)*(Nq1abc==2)+(-0.530720192)*(Nq1abc==3)+(-0.196035291)*(Nq2.Nabc==2)+(0.182739173)*(Nq2.Nabc==3)+(0.181107888)*(GZModelcodeabc==2)+(-0.143577901)*(GZModelcodeabc==3)+(0.007667259)*(GZModelcodeabc==4)+(-0.664537602)*(GWXLModelcodeabc==2)+(-0.872149689)*(GWXLModelcodeabc==3)+(-0.890754864)*(Nq4.7abc==2)+(-0.390571293)*(Nq5.7abc==2)+(-0.10208856)*(Nq7abc==2)+(-0.086848718)*(Nq7abc==3)+(0.166935229)*(Nq10abc==2)+(0.24967892)*(Nq10abc==3)+(-0.676813202)*(Nq10abc==4)+(0.071105476)*(Nq12abc==2)+(0.323905897)*(Nq12abc==3)+(1.415612305)*(Nq12abc==4)+(0.115952426)*(Nq15abc==2)+(0.392958029)*(Nq15abc==3)+(0.218606797)*(Nq15abc==4)+(-0.084661004)*(Nq17abc==2)+(-0.238055324)*(Nq17abc==3)+(-0.51163021)*(Nq17abc==4)+(0.087371152)*(Nq18abc==2)+(0.083748491)*(Nq18abc==3)+(0.24237703)*(Nq18abc==4)+(0.038279688)*(Nq23abc==2)+(0.399948596)*(Nq23abc==3)+(0.016914244)*(Nq29abc==2)+(0.347088562)*(Nq29abc==3)+(-2.838408819)*(Nq29abc==4)+(-0.018402592)*(Nq41abc==2)+(-0.2772015)*(Nq41abc==3)+(-0.027672228)*(Nq41abc==4)+(-0.179128728)*(Nq43abc==2)+(-0.414707117)*(Nq43abc==3)+(-0.720949549)*(Nq43abc==4)+(0.136823021)*(Nq45abc==2)+(0.366859804)*(Nq45abc==3)+(0.055216777)*(Nq45abc==4)+(0.410833021)*(Nq51abc==2)+(0.51874652)*(Nq51abc==3)+(-0.175404155)*(Nq52abc==2)+(-0.238831047)*(Nq52abc==3)。
logit(p1+p2+p3)=-0.7690+(-1.575729613)*(genderabc==2)+(0.19705621)*(age.catabc==2)+(0.189338625)*(age.catabc==3)+(0.279641929)*(age.catabc==4)+(0.098110654)*(workyear.catabc==2)+(0.319055879)*(workyear.catabc==3)+(-0.023581518)*(Nq1abc==2)+(-0.530720192)*(Nq1abc==3)+(-0.196035291)*(Nq2.Nabc==2)+(0.182739173)*(Nq2.Nabc==3)+(0.181107888)*(GZModelcodeabc==2)+(-0.143577901)*(GZModelcodeabc==3)+(0.007667259)*(GZModelcodeabc==4)+(-0.664537602)*(GWXLModelcodeabc==2)+(-0.872149689)*(GWXLModelcodeabc==3)+(-0.890754864)*(Nq4.7abc==2)+(-0.390571293)*(Nq5.7abc==2)+(-0.10208856)*(Nq7abc==2)+(-0.086848718)*(Nq7abc==3)+(0.166935229)*(Nq10abc==2)+(0.24967892)*(Nq10abc==3)+(-0.676813202)*(Nq10abc==4)+(0.071105476)*(Nq12abc==2)+(0.323905897)*(Nq12abc==3)+(1.415612305)*(Nq12abc==4)+(0.115952426)*(Nq15abc==2)+(0.392958029)*(Nq15abc==3)+(0.218606797)*(Nq15abc==4)+(-0.084661004)*(Nq17abc==2)+(-0.238055324)*(Nq17abc==3)+(-0.51163021)*(Nq17abc==4)+(0.087371152)*(Nq18abc==2)+(0.083748491)*(Nq18abc==3)+(0.24237703)*(Nq18abc==4)+(0.038279688)*(Nq23abc==2)+(0.399948596)*(Nq23abc==3)+(0.016914244)*(Nq29abc==2)+(0.347088562)*(Nq29abc==3)+(-2.838408819)*(Nq29abc==4)+(-0.018402592)*(Nq41abc==2)+(-0.2772015)*(Nq41abc==3)+(-0.027672228)*(Nq41abc==4)+(-0.179128728)*(Nq43abc==2)+(-0.414707117)*(Nq43abc==3)+(-0.720949549)*(Nq43abc==4)+(0.136823021)*(Nq45abc==2)+(0.366859804)*(Nq45abc==3)+(0.055216777)*(Nq45abc==4)+(0.410833021)*(Nq51abc==2)+(0.51874652)*(Nq51abc==3)+(-0.175404155)*(Nq52abc==2)+(-0.238831047)*(Nq52abc==3)。
logit(p1+p2+p3+p4)=1.6484+(-1.575729613)*(genderabc==2)+(0.19705621)*(age.catabc==2)+(0.189338625)*(age.catabc==3)+(0.279641929)*(age.catabc==4)+(0.098110654)*(workyear.catabc==2)+(0.319055879)*(workyear.catabc==3)+(-0.023581518)*(Nq1abc==2)+(-0.530720192)*(Nq1abc==3)+(-0.196035291)*(Nq2.Nabc==2)+(0.182739173)*(Nq2.Nabc==3)+(0.181107888)*(GZModelcodeabc==2)+(-0.143577901)*(GZModelcodeabc==3)+(0.007667259)*(GZModelcodeabc==4)+(-0.664537602)*(GWXLModelcodeabc==2)+(-0.872149689)*(GWXLModelc odeabc==3)+(-0.890754864)*(Nq4.7abc==2)+(-0.390571293)*(Nq5.7abc==2)+(-0.10208856)*(Nq7abc==2)+(-0.086848718)*(Nq7abc==3)+(0.166935229)*(Nq10abc==2)+(0.24967892)*(Nq10abc==3)+(-0.676813202)*(Nq10abc==4)+(0.071105476)*(Nq12abc==2)+(0.323905897)*(Nq12abc==3)+(1.415612305)*(Nq12abc==4)+(0.115952426)*(Nq15abc==2)+(0.392958029)*(Nq15abc==3)+(0.218606797)*(Nq15abc==4)+(-0.084661004)*(Nq17abc==2)+(-0.238055324)*(Nq17abc==3)+(-0.51163021)*(Nq17abc==4)+(0.087371152)*(Nq18abc==2)+(0.083748491)*(N q18abc==3)+(0.24237703)*(Nq18abc==4)+(0.038279688)*(Nq23abc==2)+(0.399948596)*(Nq23abc==3)+(0.016914244)*(Nq29abc==2)+(0.347088562)*(Nq29abc==3)+(-2.838408819)*(Nq29abc==4)+(-0.018402592)*(Nq41abc==2)+(-0.2772015)*(Nq41abc==3)+(-0.027672228)*(Nq41abc==4)+(-0.179128728)*(Nq43abc==2)+(-0.414707117)*(Nq43abc==3)+(-0.720949549)*(Nq43abc==4)+(0.136823021)*(Nq45abc==2)+(0.366859804)*(Nq45abc==3)+(0.055216777)*(Nq45abc==4)+(0.410833021)*(Nq51abc==2)+(0.51874652)*(Nq51abc==3)+(-0.175404155)*(Nq52abc==2)+(-0.238831047)*(Nq52abc==3)。
当得到每个变量的回归系数βj值后,根据logistic回归的原理,回归系数βj表示自变量Xj每变化一个单位时,logit(p)的改变量。βj与衡量危险因素作用大小的优势比(oddsratio,OR)有一个对应关系。即ORj=exp(βj)。
以BMI指数中的自变量“工作的体力劳动强度”为例:将自变量中的“高强度”等级作为参照变量,“一般强度”和“低强度”对其的OR值分别为1.50和1.68,即表示“一般强度”和“低强度”的体力劳动强度其使BMI指数升高一个等级的可能性是“高强度”体力劳动强度的1.50倍和1.68倍,是其危险因素(即OR>1时是危险因素)。相反的,变量“直系亲属是否患有肥胖”中,选“有肥胖”为参照,“无肥胖”的OR值为0.41,即“直系亲属无肥胖”的职工BMI指数升高一个等级的可能性是“直系亲属有肥胖”的职工的0.41倍,更不容易患肥胖(即OR<1时是保护因素)。
本发明还提供一种电力职业人群重大慢性病风险评估系统,其包括:数据获取模块、身体指标及风险等级获取模块、模型构建模块、风险计算模块。
数据获取模块用于获取采样的电力职业人群数据,电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据。
身体指标及风险等级获取模块用于获取需要分析的身体指标及其所包含的风险等级。
模型构建模块用于根据电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级,建立logistic回归模型。
风险计算模块用于将电力职业人群数据录入已建立的logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到身体指标的每一风险等级所对应的概率。
进一步地,身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;血压指数包含的风险等级有:正常、正常高压、高血压;血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
进一步地,logistic回归模型的数量为g-1个,g为身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
风险计算模块进一步地用于:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,其中Pk为身体指标的第k个风险等级对应的概率。
电力职业人群重大慢性病风险评估系统还包括:优势比计算模块。
优势比计算模块用于利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
本发明将电力职业人群数据录入已建立的logistic回归模型,logistic回归模型由电力职业人群数据所对应的数据类别、身体指标及其所包含的风险等级构建而成的多分类有序logistic回归模型,对录入电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率,可以对电力职业人群的健康状态进行评估和提示,对电力职业人群的健康管理具有重大意义。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1.一种电力职业人群重大慢性病风险评估方法,其特征在于,包括下述步骤:
获取采样的电力职业人群数据,所述电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
获取需要分析的身体指标及其所包含的风险等级;
根据所述电力职业人群数据所对应的数据类别、所述身体指标及其所包含的风险等级,建立logistic回归模型;
将所述电力职业人群数据录入已建立的logistic回归模型,对录入所述电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率。
2.根据权利要求1所述的电力职业人群重大慢性病风险评估方法,其特征在于,所述身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;所述身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;所述血压指数包含的风险等级有:正常、正常高压、高血压;所述血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
3.根据权利要求1所述的电力职业人群重大慢性病风险评估方法,其特征在于,logistic回归模型的数量为g-1个,g为所述身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
4.根据权利要求3所述的电力职业人群重大慢性病风险评估方法,其特征在于,对录入所述电力职业人群数据的logistic回归模型进行求解,具体为:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,
其中Pk为所述身体指标的第k个风险等级对应的概率。
5.根据权利要求1所述的电力职业人群重大慢性病风险评估方法,其特征在于,还包括下述步骤:
利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
6.一种电力职业人群重大慢性病风险评估系统,其特征在于,包括:
数据获取模块,用于获取采样的电力职业人群数据,所述电力职业人群数据所对应的数据类别包括:个人基本信息数据、个人生活习惯数据、心理健康状况数据、职业相关因素数据、体检数据、人资数据;
身体指标及风险等级获取模块,用于获取需要分析的身体指标及其所包含的风险等级;
模型构建模块,用于根据所述电力职业人群数据所对应的数据类别、所述身体指标及其所包含的风险等级,建立logistic回归模型;
风险计算模块,用于将所述电力职业人群数据录入已建立的logistic回归模型,对录入所述电力职业人群数据的logistic回归模型进行求解,得到所述身体指标的每一风险等级所对应的概率。
7.根据权利要求6所述的电力职业人群重大慢性病风险评估系统,其特征在于,所述身体指标包含有:身体质量指数、血压指数、血糖指数中的至少一种;所述身体质量指数包含的风险等级有:低体重、正常、肥胖前期、一级肥胖、二级肥胖;所述血压指数包含的风险等级有:正常、正常高压、高血压;所述血糖指数包含的风险等级有:正常、糖尿病前期、糖尿病。
8.根据权利要求6所述的电力职业人群重大慢性病风险评估系统,其特征在于,logistic回归模型的数量为g-1个,g为所述身体指标对应的风险等级的数量,其中第j个logistic回归模型为:
m为电力职业人群数据总量,βn为logistic回归模型中每个自变量Xn的回归系数,β0j为logistic回归模型的截距值,βi和β0j通过最大似然法对logistic回归模型进行拟合得到,Xn为具体的电力职业人群数据。
9.根据权利要求8所述的电力职业人群重大慢性病风险评估系统,其特征在于,所述风险计算模块,进一步地用于:
利用下述公式对logistic回归模型进行求解:
当k=1时,
当g>k>1时,
其中Pk为所述身体指标的第k个风险等级对应的概率。
10.根据权利要求6所述的电力职业人群重大慢性病风险评估系统,其特征在于,还包括:
优势比计算模块,用于利用logistic回归模型的回归系数计算用于衡量危险因素作用大小的优势比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910552296.0A CN110189829A (zh) | 2019-06-21 | 2019-06-21 | 一种电力职业人群重大慢性病风险评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910552296.0A CN110189829A (zh) | 2019-06-21 | 2019-06-21 | 一种电力职业人群重大慢性病风险评估方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110189829A true CN110189829A (zh) | 2019-08-30 |
Family
ID=67723239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910552296.0A Pending CN110189829A (zh) | 2019-06-21 | 2019-06-21 | 一种电力职业人群重大慢性病风险评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110189829A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696673A (zh) * | 2020-05-08 | 2020-09-22 | 吕小民 | 一种心理健康管理模型系统及方法 |
CN115083609A (zh) * | 2022-07-21 | 2022-09-20 | 湖南警察学院 | 一种弹性化高危人员风险等级动态评估系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107153774A (zh) * | 2017-05-24 | 2017-09-12 | 山东大学 | 慢性病风险评估双曲线模型的构建及应用该模型的疾病预测系统 |
CN107256323A (zh) * | 2016-09-05 | 2017-10-17 | 云健康基因科技(上海)有限公司 | 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统 |
CN108122612A (zh) * | 2017-12-20 | 2018-06-05 | 姜涵予 | 数据库的建立、多维度健康风险等级确定方法及装置 |
-
2019
- 2019-06-21 CN CN201910552296.0A patent/CN110189829A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107256323A (zh) * | 2016-09-05 | 2017-10-17 | 云健康基因科技(上海)有限公司 | 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统 |
CN107153774A (zh) * | 2017-05-24 | 2017-09-12 | 山东大学 | 慢性病风险评估双曲线模型的构建及应用该模型的疾病预测系统 |
CN108122612A (zh) * | 2017-12-20 | 2018-06-05 | 姜涵予 | 数据库的建立、多维度健康风险等级确定方法及装置 |
Non-Patent Citations (4)
Title |
---|
孙凤等: "台湾35~74岁男性体检者骨质疏松5年发病风险预测模型", 《中国骨质疏松杂志》 * |
张波等: "Logistic回归模型在高血压患病率影响因素分析中的应用", 《云南大学学报(自然科学版)》 * |
曹茜: ""常见慢性病危险因素分析及风险评估模型的建立——以高血压和糖尿病为例"", 《中国优秀硕士学位论文全文数据库医药卫生科技辑 (月刊)》 * |
石红梅: "北京市崇文区职业人群慢性病患病情况及其危险因素", 《职业与健康》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696673A (zh) * | 2020-05-08 | 2020-09-22 | 吕小民 | 一种心理健康管理模型系统及方法 |
CN115083609A (zh) * | 2022-07-21 | 2022-09-20 | 湖南警察学院 | 一种弹性化高危人员风险等级动态评估系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8015136B1 (en) | Algorithmic method for generating a medical utilization profile for a patient and to be used for medical risk analysis decisioning | |
Lee et al. | Data mining techniques applied to medical information | |
CN105528529B (zh) | 基于大数据分析的中医临床技能评价体系的数据处理方法 | |
US20160004840A1 (en) | Progression analytics system | |
CN108366763A (zh) | 用于评估精神状态的方法和系统 | |
CN114639479A (zh) | 一种基于医疗知识图谱的智能诊断辅助系统 | |
Blacky et al. | Fully automated surveillance of healthcare-associated infections with MONI-ICU | |
CA2648510A1 (en) | System and method for providing integrated wellness assessment | |
CN112331349B (zh) | 一种脑卒中复发监测系统 | |
CN101204320A (zh) | 生理暨心理信息交互撷取系统 | |
CN118173253B (zh) | 一种基于病患数据分析管理系统及方法 | |
CN110189829A (zh) | 一种电力职业人群重大慢性病风险评估方法及系统 | |
CN113643814A (zh) | 健康管理方案的推荐方法、装置、设备及存储介质 | |
CN116434899A (zh) | 一种基于多源数据的健康档案信息平台建立方法 | |
KR102407987B1 (ko) | 바이오 데이터 허브를 구축하는 방법 및 장치 | |
CN118280562A (zh) | 知识图谱驱动的医疗大模型诊断方法 | |
Ceglowski et al. | Knowledge discovery through mining emergency department data | |
Duhamel et al. | A preprocessing method for improving data mining techniques. Application to a large medical diabetes database | |
CN117153376A (zh) | 一种基于物联网的中老年疾病医疗诊治系统 | |
KR20180002229A (ko) | 치매 정보 데이터베이스 구축을 위한 에이전트 장치 및 그 운영방법 | |
CN113642669B (zh) | 基于特征分析的防欺诈检测方法、装置、设备及存储介质 | |
Alhorishi et al. | Using machine learning to predict early preparation of pharmacy prescriptions at psmmc-a comparison of four machine learning algorithms | |
Hung et al. | Deriving A Novel Health Index Using A Large-Scale Population Based Electronic Health Record With Deep Networks | |
CN110070945A (zh) | 一种基于大数据分析技术的数据脉象价值分析方法 | |
Waghmare et al. | Analytical study using data mining for periodical medical examination of employees |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190830 |
|
RJ01 | Rejection of invention patent application after publication |