CN112117004A - 一种基于多源医学数据的糖尿病风险预测模型 - Google Patents
一种基于多源医学数据的糖尿病风险预测模型 Download PDFInfo
- Publication number
- CN112117004A CN112117004A CN202010986563.8A CN202010986563A CN112117004A CN 112117004 A CN112117004 A CN 112117004A CN 202010986563 A CN202010986563 A CN 202010986563A CN 112117004 A CN112117004 A CN 112117004A
- Authority
- CN
- China
- Prior art keywords
- data
- prediction model
- risk prediction
- diabetes
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 206010012601 diabetes mellitus Diseases 0.000 title claims abstract description 61
- 238000013058 risk prediction model Methods 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 7
- 239000008280 blood Substances 0.000 claims description 49
- 210000004369 blood Anatomy 0.000 claims description 49
- 238000013527 convolutional neural network Methods 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 25
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 23
- 239000008103 glucose Substances 0.000 claims description 23
- 230000000291 postprandial effect Effects 0.000 claims description 16
- 238000012216 screening Methods 0.000 claims description 15
- 235000006694 eating habits Nutrition 0.000 claims description 14
- 238000007446 glucose tolerance test Methods 0.000 claims description 13
- 230000036578 sleeping time Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 12
- 150000002632 lipids Chemical class 0.000 claims description 10
- 230000035935 pregnancy Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 230000036541 health Effects 0.000 abstract description 7
- 201000010099 disease Diseases 0.000 abstract description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 6
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 10
- 230000002354 daily effect Effects 0.000 description 8
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 6
- 102000004877 Insulin Human genes 0.000 description 5
- 108090001061 Insulin Proteins 0.000 description 5
- 229940125396 insulin Drugs 0.000 description 5
- 230000004622 sleep time Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 201000001421 hyperglycemia Diseases 0.000 description 3
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 2
- 230000003914 insulin secretion Effects 0.000 description 2
- 210000004153 islets of langerhan Anatomy 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 206010022489 Insulin Resistance Diseases 0.000 description 1
- 241000364051 Pima Species 0.000 description 1
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 230000009693 chronic damage Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037081 physical activity Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明公开了一种基于多源医学数据的糖尿病风险预测模型,具体涉及糖尿病风险预测技术领域,包括以下步骤:步骤一、多源数据采集;步骤二、数据处理;步骤三、模型建立;步骤四、模型验证;步骤五、根据风险预测模型对糖尿病风险进行分析。本发明通过进行多来源数据采集,有利于根据不同国家不同地区的数据建立风险预测模型,使得预测结果更加具有广泛性,同时通过采集人群不同指标数据,能够使得模型从多方面进行糖尿病风险的预测,使得预测数据更加准确合理,通过对糖尿病风险进行预测,能够针对具有潜在患病风险的高危人群给予合理的健康建议,有利降低高危人群的患病风险,进而有利于减缓糖尿病患者的增长速度。
Description
技术领域
本发明实施例涉及糖尿病风险预测技术领域,具体涉及一种基于多源医学数据的糖尿病风险预测模型。
背景技术
糖尿病是一组以高血糖为特征的代谢性疾病,高血糖则是由于胰岛素分泌缺陷或其生物作用受损,或两者兼有引起,长期存在的高血糖,导致各种组织,特别是眼、肾、心脏、血管、神经的慢性损害、功能障碍。糖尿病的病理原因主要包含两种情况,第一种是当胰腺无法产生充足的胰岛素(一种调节血糖或血葡萄糖的荷尔蒙)时引发的1型糖尿病(TID),第二种是当所产生的胰岛素无法被人体有效地利用时引发的2型糖尿病(T2D)。TID通常被称为原发性糖尿病3,这种糖尿病类型的发病机制通常是当胰腺中进行胰岛素分泌的β细胞受到损伤时,人体在短时间内没有充足的胰岛素供使用,从而导致血糖含量无法被及时降低至安全区间内,该过程也称作是胰岛β细胞的郎格罕氏胰岛自身免疫性破坏。另一种更为常见的糖尿病类型的医学名称是非胰岛素依赖型糖尿病,简称T2D,该类糖尿病通常由胰岛素抵抗或者是胰岛素分泌缺陷等因素引起,造成高血糖的直接原因是身体内的胰岛素没能得到有效利用。而引发2型糖尿病的主要原因通常包括生活方式、身体活动、饮食习惯和遗传等因素。
基于糖尿病患病人群数量庞大且不断增长的趋势,高危人群对自身健康质量普遍不了解的情况,以及为了能够有效的减缓患者的增长速度、降低患病风险,有必要发明一种基于多源医学数据的糖尿病风险预测模型。
发明内容
为此,本发明实施例提供一种基于多源医学数据的糖尿病风险预测模型,通过进行多来源数据采集,有利于根据不同国家不同地区的数据建立风险预测模型,使得预测结果更加具有广泛性,同时通过采集人群不同指标数据,能够使得模型从性别、年龄、妊娠、遗传、健康等多方面进行糖尿病风险的预测,使得预测数据更加准确合理,通过对糖尿病风险进行预测,能够针对具有潜在患病风险的高危人群给予合理的健康建议,有利降低高危人群的患病风险,进而有利于减缓糖尿病患者的增长速度。
为了实现上述目的,本发明实施例提供如下技术方案:一种基于多源医学数据的糖尿病风险预测模型,包括以下步骤:
步骤一、多源数据采集:
对不同地区采用问卷调查;
采集国内已有的临床糖尿病患者数据集;
采集国外已有的临床糖尿病患者数据集;
步骤二、数据处理:
数据筛选:将采集的数据中明显不合理以及无效的数据筛除,而后将体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值等数据采用同一度量单位、同一格式进行标准化,对于缺失的数据采用平均值进行填补;
数据分类:将筛选后的数据按照性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者进行分类;
步骤三、模型建立:使用卷积神经网络建立风险预测模型;
步骤四、模型验证;
步骤五、根据风险预测模型对糖尿病风险进行分析。
进一步地,在步骤一中问卷调查的内容包括性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值。
进一步地,在步骤三中所述卷积神经网络的网络结构为卷积层与池化层交替连接,起到特征提取的作用,然后将学习到的特征输入到随后的全连接层,在全连接层采用了Dropout层以防止过拟合,最后是Softmax分类器,根据最后的特征预测分类,三维卷积运算公式为:
进一步地,在步骤三中模型建立方法为:将同一种类的数据为基本单元随机分成相同的十份,然后将其中的一组放进测试组,其余九组放进训练组,将训练组的数据根据序列中的顺序存放在一个三维矩阵中,作为卷积神经网络的输入数据,训练组由卷积神经网络训练出用于预测结果的模型参数,得到风险预测模型,然后将测试组数据输入到预测模型,最后输入预测的结果,而后再将剩下种类的数据各自随机分成相同的十份,依次使用卷积神经网络训练出用于模型参数,而后得到各自种类数据的风险预测模型。
进一步地,在步骤四中采用国内外已有的临床糖尿病患者数据集对建立的风险预测模型进行验证,选取结果最为准确的预测模型作为最终的风险预测模型。
本发明实施例具有如下优点:
1、本发明通过对不同地区、国内以及国外进行多来源数据的采集,有利于根据不同国家不同地区的数据建立风险预测模型,从而针对不同国家不同地区进行糖尿病风险的预测,使得预测结果更加具有广泛性,同时通过采集人群的性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值等不同指标,能够使得模型从性别、年龄、妊娠、遗传、健康等多方面进行糖尿病风险的预测,使得预测数据更加准确合理;
2、本发明通过对糖尿病风险进行预测,能够针对具有潜在患病风险的高危人群给予合理的健康建议,有利降低高危人群的患病风险,进而有利于减缓糖尿病患者的增长速度。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本发明提供一种基于多源医学数据的糖尿病风险预测模型,包括以下步骤:
步骤一、多源数据采集:
对不同地区采用问卷调查,包括性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值;
采集国内已有的临床糖尿病患者数据集;
采集国外已有的临床糖尿病患者数据集;
步骤二、数据处理:
数据筛选:将采集的数据中明显不合理以及无效的数据筛除,而后将体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值等数据采用同一度量单位、同一格式进行标准化,对于缺失的数据采用平均值进行填补;
数据分类:将筛选后的数据按照性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者进行分类;
步骤三、模型建立:使用卷积神经网络建立风险预测模型,所述卷积神经网络的网络结构为卷积层与池化层交替连接,起到特征提取的作用,然后将学习到的特征输入到随后的全连接层,在全连接层采用了Dropout层以防止过拟合,最后是Softmax分类器,根据最后的特征预测分类,三维卷积运算公式为:
建立方法为:将同一种类的数据为基本单元随机分成相同的十份,然后将其中的一组放进测试组,其余九组放进训练组,将训练组的数据根据序列中的顺序存放在一个三维矩阵中,作为卷积神经网络的输入数据,训练组由卷积神经网络训练出用于预测结果的模型参数,得到风险预测模型,然后将测试组数据输入到预测模型,最后输入预测的结果,而后再将剩下种类的数据各自随机分成相同的十份,依次使用卷积神经网络训练出用于模型参数,而后得到各自种类数据的风险预测模型;
步骤四、模型验证:采用国内外已有的临床糖尿病患者数据集对建立的风险预测模型进行验证,选取结果最为准确的预测模型作为最终的风险预测模型;
步骤五、根据模型对糖尿病风险分析。
实施例2:
步骤一:对北京的朝阳区的人群采用问卷调查,包括性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值,得到北京朝阳区500份数据;
步骤二、数据处理:
数据筛选:将采集的数据中明显不合理以及无效的数据筛除,比如餐后血糖值、血脂值明显为零等不合理的数据,而后将体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值等数据采用同一度量单位、同一格式进行标准化,对于缺失的数据采用平均值进行填补,比如睡眠时间缺失的填补为平均的每天八小时,筛选得345份数据;
数据分类:将筛选后的数据按照性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者进行分类;
步骤三、模型建立:使用卷积神经网络建立风险预测模型,所述卷积神经网络的网络结构为卷积层与池化层交替连接,起到特征提取的作用,然后将学习到的特征输入到随后的全连接层,在全连接层采用了Dropout层以防止过拟合,最后是Softmax分类器,根据最后的特征预测分类,三维卷积运算公式为:
建立方法为:将345份数据为基本单元随机分成相同的十份,然后将其中的一组放进测试组,其余九组放进训练组,将训练组的数据根据序列中的顺序存放在一个三维矩阵中,作为卷积神经网络的输入数据,训练组由卷积神经网络训练出用于预测结果的模型参数,得到风险预测模型,然后将测试组数据输入到预测模型,最后输入预测的结果。
实施例3:
步骤一:对北京的丰台区的人群采用问卷调查,包括性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值,得到北京丰台区500份数据;
步骤二、数据处理:
数据筛选:将采集的数据中明显不合理以及无效的数据筛除,比如餐后血糖值、血脂值明显为零等不合理的数据,而后将体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值等数据采用同一度量单位、同一格式进行标准化,对于缺失的数据采用平均值进行填补,比如睡眠时间缺失的填补为平均的每天八小时,筛选得313份数据;
数据分类:将筛选后的数据按照性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者进行分类;
步骤三、模型建立:使用卷积神经网络建立风险预测模型,所述卷积神经网络的网络结构为卷积层与池化层交替连接,起到特征提取的作用,然后将学习到的特征输入到随后的全连接层,在全连接层采用了Dropout层以防止过拟合,最后是Softmax分类器,根据最后的特征预测分类,三维卷积运算公式为:
建立方法为:将313份数据为基本单元随机分成相同的十份,然后将其中的一组放进测试组,其余九组放进训练组,将训练组的数据根据序列中的顺序存放在一个三维矩阵中,作为卷积神经网络的输入数据,训练组由卷积神经网络训练出用于预测结果的模型参数,得到风险预测模型,然后将测试组数据输入到预测模型,最后输入预测的结果。
实施例4:
步骤一:对上海黄浦区的人群采用问卷调查,包括性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值,得到上海黄浦区500份数据;
步骤二、数据处理:
数据筛选:将采集的数据中明显不合理以及无效的数据筛除,比如餐后血糖值、血脂值明显为零等不合理的数据,而后将体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值等数据采用同一度量单位、同一格式进行标准化,对于缺失的数据采用平均值进行填补,比如睡眠时间缺失的填补为平均的每天八小时,筛选得289份数据;
数据分类:将筛选后的数据按照性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者进行分类;
步骤三、模型建立:使用卷积神经网络建立风险预测模型,所述卷积神经网络的网络结构为卷积层与池化层交替连接,起到特征提取的作用,然后将学习到的特征输入到随后的全连接层,在全连接层采用了Dropout层以防止过拟合,最后是Softmax分类器,根据最后的特征预测分类,三维卷积运算公式为:
建立方法为:将289份数据为基本单元随机分成相同的十份,然后将其中的一组放进测试组,其余九组放进训练组,将训练组的数据根据序列中的顺序存放在一个三维矩阵中,作为卷积神经网络的输入数据,训练组由卷积神经网络训练出用于预测结果的模型参数,得到风险预测模型,然后将测试组数据输入到预测模型,最后输入预测的结果。
实施例5:
采集国内已有的临床糖尿病患者数据集:瑞金医院糖尿病数据集,采集国外已有的临床糖尿病患者数据集:皮马人糖尿病数据集,用于对实施例2-4风险预测模型进行验证,选取结果最为准确的预测模型作为最终的风险预测模型;
综合糖尿病风险评估数据得到下表::
由上表可知,患糖尿病风险较高的人群集中在有:年龄大于45岁且每天运动时间低于30分钟的人、有糖耐量异常的、空腹血糖调节受损的人、有糖尿病家族遗传病史的人、有糖尿病家族遗传病史的人、体质指数大于25的人等,对于这些具有潜在患病风险的高危人群给予合理的健康建议,有利降低高危人群的患病风险,进而有利于减缓糖尿病患者的增长速度。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (5)
1.一种基于多源医学数据的糖尿病风险预测模型,其特征在于:包括以下步骤:
步骤一、多源数据采集:
对不同地区采用问卷调查;
采集国内已有的临床糖尿病患者数据集;
采集国外已有的临床糖尿病患者数据集;
步骤二、数据处理:
数据筛选:将采集的数据中明显不合理以及无效的数据筛除,而后将体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值等数据采用同一度量单位、同一格式进行标准化,对于缺失的数据采用平均值进行填补;
数据分类:将筛选后的数据按照性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者进行分类;
步骤三、模型建立:使用卷积神经网络建立风险预测模型;
步骤四、模型验证;
步骤五、根据风险预测模型对糖尿病风险进行分析。
2.根据权利要求1所述的一种基于多源医学数据的糖尿病风险预测模型,其特征在于:在步骤一中问卷调查的内容包括性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值和耐糖量试验值。
4.根据权利要求1所述的一种基于多源医学数据的糖尿病风险预测模型,其特征在于:在步骤三中模型建立方法为:将同一种类的数据为基本单元随机分成相同的十份,然后将其中的一组放进测试组,其余九组放进训练组,将训练组的数据根据序列中的顺序存放在一个三维矩阵中,作为卷积神经网络的输入数据,训练组由卷积神经网络训练出用于预测结果的模型参数,得到风险预测模型,然后将测试组数据输入到预测模型,最后输入预测的结果,而后再将剩下种类的数据各自随机分成相同的十份,依次使用卷积神经网络训练出用于模型参数,而后得到各自种类数据的风险预测模型。
5.根据权利要求1所述的一种基于多源医学数据的糖尿病风险预测模型,其特征在于:在步骤四中采用国内外已有的临床糖尿病患者数据集对建立的风险预测模型进行验证,选取结果最为准确的预测模型作为最终的风险预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010986563.8A CN112117004A (zh) | 2020-09-18 | 2020-09-18 | 一种基于多源医学数据的糖尿病风险预测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010986563.8A CN112117004A (zh) | 2020-09-18 | 2020-09-18 | 一种基于多源医学数据的糖尿病风险预测模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112117004A true CN112117004A (zh) | 2020-12-22 |
Family
ID=73800787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010986563.8A Withdrawn CN112117004A (zh) | 2020-09-18 | 2020-09-18 | 一种基于多源医学数据的糖尿病风险预测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112117004A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112802606A (zh) * | 2021-01-28 | 2021-05-14 | 联仁健康医疗大数据科技股份有限公司 | 数据筛选模型建立及数据筛选方法、装置、设备和介质 |
CN113393896A (zh) * | 2021-06-11 | 2021-09-14 | 成都果壳医学科技有限公司 | 一种基于深度神经网络的i型糖尿病风险评估系统 |
CN114098655A (zh) * | 2022-01-25 | 2022-03-01 | 慕思健康睡眠股份有限公司 | 一种智能睡眠风险监测方法及系统 |
CN118039168A (zh) * | 2024-04-11 | 2024-05-14 | 陕西爱普医疗器械有限公司 | 一种糖尿病风险预测的方法 |
-
2020
- 2020-09-18 CN CN202010986563.8A patent/CN112117004A/zh not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112802606A (zh) * | 2021-01-28 | 2021-05-14 | 联仁健康医疗大数据科技股份有限公司 | 数据筛选模型建立及数据筛选方法、装置、设备和介质 |
CN113393896A (zh) * | 2021-06-11 | 2021-09-14 | 成都果壳医学科技有限公司 | 一种基于深度神经网络的i型糖尿病风险评估系统 |
CN114098655A (zh) * | 2022-01-25 | 2022-03-01 | 慕思健康睡眠股份有限公司 | 一种智能睡眠风险监测方法及系统 |
CN114098655B (zh) * | 2022-01-25 | 2022-04-26 | 慕思健康睡眠股份有限公司 | 一种智能睡眠风险监测方法及系统 |
CN118039168A (zh) * | 2024-04-11 | 2024-05-14 | 陕西爱普医疗器械有限公司 | 一种糖尿病风险预测的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112117004A (zh) | 一种基于多源医学数据的糖尿病风险预测模型 | |
WO2021190300A1 (zh) | Ai慢性肾病风险筛查建模方法、慢性肾病风险筛查方法及系统 | |
CN112117006A (zh) | 基于集成学习的2型糖尿病肾脏疾病患病风险评估系统 | |
CN110289094B (zh) | 一种基于专家规则的胰岛素精准给药决策方法 | |
CN106682412A (zh) | 一种基于医疗体检数据的糖尿病预测方法 | |
CN110123277A (zh) | 一种脓毒血症的数据处理系统 | |
CN107194138A (zh) | 一种基于体检数据建模的空腹血糖预测方法 | |
CN113903450A (zh) | 一种2型糖尿病风险预测模型的构建系统 | |
CN111768810A (zh) | 一种菌群移植治疗糖尿病的供受体配型算法 | |
CN113628750A (zh) | 一种基于数字技术的营养不良快速筛查系统 | |
CN114548158A (zh) | 一种用于血糖预测的数据处理方法 | |
CN115171893A (zh) | 基于大数据分析的糖尿病患者评估及管理系统 | |
CN117012392A (zh) | 高血压风险评估模型构建方法、膳食食疗及健康管理系统 | |
CN117116490A (zh) | 心血管病评估模型构建方法、膳食食疗及健康管理系统 | |
CN111081334A (zh) | 一种基于风险因素概率组合分析的慢性疾病早期预警方法 | |
CN113128654B (zh) | 一种用于冠心病预诊断中的改进型随机森林模型及其预诊断系统 | |
CN112133398B (zh) | 血糖管控方法、系统及存储介质 | |
CN114429803A (zh) | 一种基于危险因素的健康风险预警方法 | |
CN113571180A (zh) | 基于c肽分层及脏器功能的2型糖尿病人工智能诊疗管理系统 | |
CN113643809A (zh) | 基于人体成分的2型糖尿病预测方法及系统 | |
CN115547495B (zh) | 一种综合评价糖脂代谢水平的系统及其应用 | |
CN109009074A (zh) | 一种基于深度学习的心脏性猝死辅助预警装置 | |
CN117116462A (zh) | 一种糖化血红蛋白值的预测方法、系统及装置 | |
CN114093518B (zh) | 一种基于肥胖度的糖尿病风险评估系统及评估方法 | |
CN111883248A (zh) | 用于儿童肥胖症的预测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201222 |