CN112967807B - 基于饮食行为预测脑卒中的系统、设备及存储介质 - Google Patents
基于饮食行为预测脑卒中的系统、设备及存储介质 Download PDFInfo
- Publication number
- CN112967807B CN112967807B CN202110233464.7A CN202110233464A CN112967807B CN 112967807 B CN112967807 B CN 112967807B CN 202110233464 A CN202110233464 A CN 202110233464A CN 112967807 B CN112967807 B CN 112967807B
- Authority
- CN
- China
- Prior art keywords
- cerebral apoplexy
- decision tree
- history
- decision trees
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000006011 Stroke Diseases 0.000 title claims abstract description 61
- 206010008190 Cerebrovascular accident Diseases 0.000 title claims abstract description 44
- 230000002490 cerebral effect Effects 0.000 title claims abstract description 44
- 235000021061 dietary behavior Nutrition 0.000 title claims abstract description 14
- 238000003860 storage Methods 0.000 title claims abstract description 10
- 238000003066 decision tree Methods 0.000 claims abstract description 68
- 235000015097 nutrients Nutrition 0.000 claims abstract description 32
- 238000007637 random forest analysis Methods 0.000 claims abstract description 23
- 238000005457 optimization Methods 0.000 claims abstract description 16
- 238000010276 construction Methods 0.000 claims abstract description 11
- 238000012216 screening Methods 0.000 claims abstract description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 21
- 235000005911 diet Nutrition 0.000 claims description 18
- 230000037213 diet Effects 0.000 claims description 18
- 235000013305 food Nutrition 0.000 claims description 18
- 241000272201 Columbiformes Species 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 12
- 235000006694 eating habits Nutrition 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 9
- 239000003925 fat Substances 0.000 claims description 8
- 235000019197 fats Nutrition 0.000 claims description 8
- 239000000463 material Substances 0.000 claims description 7
- GVJHHUAWPYXKBD-UHFFFAOYSA-N (±)-α-Tocopherol Chemical compound OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 claims description 6
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 claims description 6
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 claims description 6
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims description 6
- FPIPGXGPPPQFEQ-OVSJKPMPSA-N all-trans-retinol Chemical compound OC\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-OVSJKPMPSA-N 0.000 claims description 6
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 claims description 6
- 208000024172 Cardiovascular disease Diseases 0.000 claims description 5
- 206010020772 Hypertension Diseases 0.000 claims description 5
- 206010012601 diabetes mellitus Diseases 0.000 claims description 5
- 150000003839 salts Chemical class 0.000 claims description 5
- 206010003658 Atrial Fibrillation Diseases 0.000 claims description 4
- 201000010099 disease Diseases 0.000 claims description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000000391 smoking effect Effects 0.000 claims description 4
- FPIPGXGPPPQFEQ-UHFFFAOYSA-N 13-cis retinol Natural products OCC=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C FPIPGXGPPPQFEQ-UHFFFAOYSA-N 0.000 claims description 3
- 208000007848 Alcoholism Diseases 0.000 claims description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 claims description 3
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 3
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 claims description 3
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 claims description 3
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 claims description 3
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 claims description 3
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 claims description 3
- 208000008589 Obesity Diseases 0.000 claims description 3
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 3
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 claims description 3
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 claims description 3
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 claims description 3
- 229930003451 Vitamin B1 Natural products 0.000 claims description 3
- 229930003471 Vitamin B2 Natural products 0.000 claims description 3
- 229930003268 Vitamin C Natural products 0.000 claims description 3
- 229930003316 Vitamin D Natural products 0.000 claims description 3
- QYSXJUFSXHHAJI-XFEUOLMDSA-N Vitamin D3 Natural products C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C/C=C1\C[C@@H](O)CCC1=C QYSXJUFSXHHAJI-XFEUOLMDSA-N 0.000 claims description 3
- 229930003427 Vitamin E Natural products 0.000 claims description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 3
- 201000007930 alcohol dependence Diseases 0.000 claims description 3
- 239000011575 calcium Substances 0.000 claims description 3
- 229910052791 calcium Inorganic materials 0.000 claims description 3
- 235000001465 calcium Nutrition 0.000 claims description 3
- 150000001720 carbohydrates Chemical class 0.000 claims description 3
- 235000014633 carbohydrates Nutrition 0.000 claims description 3
- 150000001746 carotenes Chemical class 0.000 claims description 3
- 235000005473 carotenes Nutrition 0.000 claims description 3
- 239000001913 cellulose Substances 0.000 claims description 3
- 229920002678 cellulose Polymers 0.000 claims description 3
- 235000010980 cellulose Nutrition 0.000 claims description 3
- 235000012000 cholesterol Nutrition 0.000 claims description 3
- 229940107161 cholesterol Drugs 0.000 claims description 3
- 229910052802 copper Inorganic materials 0.000 claims description 3
- 239000010949 copper Substances 0.000 claims description 3
- WIGCFUFOHFEKBI-UHFFFAOYSA-N gamma-tocopherol Natural products CC(C)CCCC(C)CCCC(C)CCCC1CCC2C(C)C(O)C(C)C(C)C2O1 WIGCFUFOHFEKBI-UHFFFAOYSA-N 0.000 claims description 3
- 230000002068 genetic effect Effects 0.000 claims description 3
- 239000004615 ingredient Substances 0.000 claims description 3
- 229910052742 iron Inorganic materials 0.000 claims description 3
- 239000011777 magnesium Substances 0.000 claims description 3
- 229910052749 magnesium Inorganic materials 0.000 claims description 3
- 235000001055 magnesium Nutrition 0.000 claims description 3
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 claims description 3
- 229960003512 nicotinic acid Drugs 0.000 claims description 3
- 235000001968 nicotinic acid Nutrition 0.000 claims description 3
- 239000011664 nicotinic acid Substances 0.000 claims description 3
- 235000020824 obesity Nutrition 0.000 claims description 3
- 239000011574 phosphorus Substances 0.000 claims description 3
- 229910052698 phosphorus Inorganic materials 0.000 claims description 3
- 239000011591 potassium Substances 0.000 claims description 3
- 229910052700 potassium Inorganic materials 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 235000018102 proteins Nutrition 0.000 claims description 3
- 102000004169 proteins and genes Human genes 0.000 claims description 3
- 108090000623 proteins and genes Proteins 0.000 claims description 3
- 239000011607 retinol Substances 0.000 claims description 3
- 229960003471 retinol Drugs 0.000 claims description 3
- 235000020944 retinol Nutrition 0.000 claims description 3
- 229960002477 riboflavin Drugs 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 239000011669 selenium Substances 0.000 claims description 3
- 229910052711 selenium Inorganic materials 0.000 claims description 3
- 239000011734 sodium Substances 0.000 claims description 3
- 229910052708 sodium Inorganic materials 0.000 claims description 3
- 229960003495 thiamine Drugs 0.000 claims description 3
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 claims description 3
- 235000010374 vitamin B1 Nutrition 0.000 claims description 3
- 239000011691 vitamin B1 Substances 0.000 claims description 3
- 235000019164 vitamin B2 Nutrition 0.000 claims description 3
- 239000011716 vitamin B2 Substances 0.000 claims description 3
- 235000019154 vitamin C Nutrition 0.000 claims description 3
- 239000011718 vitamin C Substances 0.000 claims description 3
- 235000019166 vitamin D Nutrition 0.000 claims description 3
- 239000011710 vitamin D Substances 0.000 claims description 3
- 150000003710 vitamin D derivatives Chemical class 0.000 claims description 3
- 235000019165 vitamin E Nutrition 0.000 claims description 3
- 229940046009 vitamin E Drugs 0.000 claims description 3
- 239000011709 vitamin E Substances 0.000 claims description 3
- 229940045997 vitamin a Drugs 0.000 claims description 3
- 229940046008 vitamin d Drugs 0.000 claims description 3
- 239000011701 zinc Substances 0.000 claims description 3
- 229910052725 zinc Inorganic materials 0.000 claims description 3
- 210000004556 brain Anatomy 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 235000006286 nutrient intake Nutrition 0.000 claims 1
- 230000036541 health Effects 0.000 abstract description 4
- 208000032382 Ischaemic stroke Diseases 0.000 description 3
- 208000016988 Hemorrhagic Stroke Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 235000012055 fruits and vegetables Nutrition 0.000 description 2
- 235000009200 high fat diet Nutrition 0.000 description 2
- 235000021070 high sugar diet Nutrition 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 206010003210 Arteriosclerosis Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 208000011775 arteriosclerosis disease Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000004280 healthy diet Nutrition 0.000 description 1
- 208000020658 intracerebral hemorrhage Diseases 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000021049 nutrient content Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009862 primary prevention Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000009863 secondary prevention Effects 0.000 description 1
- 208000023516 stroke disease Diseases 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/60—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to nutrition control, e.g. diets
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Nutrition Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pathology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于饮食行为预测脑卒中的系统、设备、存储介质,所述系统包括:数据库建立单元、数据集构建单元、用户数据获取单元、模型构建单元、风险预测单元;本发明通过决策树的构建、筛选、权重优化和组合生成预测准确度高的随机森林模型,然后基于用户基本信息及脑卒中相关元素的摄入情况实现对脑卒中的风险指数预测,让用户可以快速方便的了解自身营养素的摄入情况及预测的脑卒中风险指数,方便进行健康管理。
Description
技术领域
本发明属于健康管理技术领域,具体涉及一种基于饮食行为预测脑卒中的系统、设备及存储介质。
背景技术
脑卒中包括缺血性和出血性卒中。缺血性卒中的发病率高于出血性卒中,占脑卒中总数的60%~70%。年龄多在40岁以上,男性较女性多,严重者可引起死亡,脑卒中具有发病率高、死亡率高和致残率高的特点。在目前有效特异性治疗手段相对缺乏的情况下,早期预防是减少脑卒中疾病负担的最佳途径。风险评估是识别脑卒中发生、复发的高危人群,明确预防重点的有效工具,对脑卒中一、二级预防具有重要意义。所有应加强对全民普及脑卒中危险因素及先兆症状的教育,才能真正防治脑卒中。
脑卒中的发生原因有很多,其中和饮食是有密切关系的,不健康、不合理的饮食会增加卒中发生的机率,健康饮食能减少卒中发生的机率。长期高盐、高糖、高脂饮食是导致脑卒中和心脑血管病等慢性疾病发生的重要危险因素。高盐饮食容易导致高血压的产生,高糖饮食容易导致糖尿病的产生,高脂饮食容易导致高脂血症的产生,这三个方面都是动脉硬化的基础病。此外,有资料显示水果跟蔬菜摄入比较高的人群,中风发生的机率低于水果蔬菜摄入比较少的人群。
因此,基于用户饮食习惯进行脑卒中风险预测,科学合理的分析出脑卒中风险指数及提供对应的解决方案,对脑卒中防治及健康管理具有重要意义。
发明内容
有鉴于此,本发明提出了一种基于饮食行为预测脑卒中的系统、设备及存储介质,用于解决现有健康管理无法基于营养元素的摄入情况准确预测脑卒中风险的问题。
本发明第一方面,公开一种基于饮食行为预测脑卒中的系统,所述系统包括:
数据库建立单元:用于采集各种食材/制品多维度数据构建食物营养元素表及每种营养元素每日标准摄入量构建元素每日摄入量表,建立饮食数据库;
数据集构建单元:用于计算不同人群连续时间段内的脑卒中相关营养元素摄入情况,结合自身的基础疾病的基本信息作为特征属性,以是否患有脑卒中为标签制作样本数据集;
用户数据获取单元:用于获取采集待测用户的基本信息及连续的饮食记录,基于饮食数据库计算用户饮食记录中的脑卒中相关营养元素摄入情况。
模型构建单元:用于构建随机森林模型,基于样本数据集训练随机森林模型;
风险预测单元:用于将待测用户基本信息及脑卒中相关元素的摄入情况输入随机森林模型,实现对脑卒中的风险指数预测。
优选的,所述食物营养元素表中包括各种食材/制品的多营养元素含量、类别、适宜人群、禁忌人群、相克食物、功效、配料信息、制作步骤;所述营养元素包括:热量、蛋白质、脂肪、碳水化合物、纤维素、胆固醇、维生素B1、维生素B2、烟酸、维生素C、维生素D、维生素E、维生素A、胡萝卜素、视黄醇、钙、镁、铁、锰、锌、铜、钾、磷、钠、硒、水分、GI、嘌呤。
优选的,所述所述特征属性包括脑卒中相关营养元素摄入情况和用户的基本信息;其中脑卒中相关营养元素包括热量、脂肪、GL、盐,营养元素摄入情况分为偏低、偏高、正常;用户的基本信息包括年龄、是否肥胖、脑卒中遗传史、抽烟史、酗酒史、高血压史、糖尿病史、房颤史、心血管疾病史。
优选的,所述模型构建单元中,所述构建随机森林模型包括:
训练集选择子单元:从样本数据集中采用Bootstraping抽样产生k个训练集;
决策树生成子单元:根据所述k个训练集训练决策树,生成k棵决策树,在每一轮生成决策树的过程中,从D个特征中随机选择其中的d个特征组成一个新的特征集,通过使用新的特征集来生成决策树;
决策树筛选子单元:分别计算各个决策树之间的相关度,从k棵决策树中剔除与其他决策树相关度高于预设阈值且准确度低于预设阈值的决策树,得到新的决策树集合;
决策树组合单元:采用鸽群优化算法优化新的决策树集合中各个决策树的权重,组成随机森林模型。
优选的,所述计算各个决策树之间的相关度的方式包括相关系数、互信息。
优选的,所述采用鸽群优化算法优化新的决策树集合中各个决策树的权重具体包括:在鸽群算法的基础上,融合黄金正弦算法进行决策树集合中各个决策树的权重优化,具体的,在鸽群位置更新处引入黄金正弦算法进行位置更新优化,加速收敛。
优选的,所述鸽群优化算法的适应度函数为随机森林模型的综合损失函数最小,损失随机森林模型的综合损失函数为各个决策树的损失函数加权求和,其中权重即为采用鸽群优化算法优化后的权重。
本发明第二方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如本发明第一方面所述的系统。
本发明第三方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明第一方面所述的系统。
本发明相对于现有技术具有以下有益效果:
1)本发明针对脑卒中的主要影响因素进行分析,评估用户的饮食行为,运用食材中的营养素含量累计加权及随机森林算法,让用户可以快速方便的了解自身营养素的摄入情况及预测脑卒中风险指数;
2)本发明通过计算各个决策树之间的相关度,剔除与其他决策树相关度高于预设阈值且准确度低于预设阈值的决策树,得到新的决策树集合,可降低各个决策树之间的耦合性,采用鸽群优化算法优化新的决策树集合中各个决策树的权重,收敛速度更快,组成的随机森林模型预测准确度更高,可基于营养元素的摄入情况准确预测脑卒中风险。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于饮食行为预测脑卒中的系统结构示意图;
图2为本发明模型构建单元结构示意图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
请参阅图1,本发明提出一种基于饮食行为预测脑卒中的系统,所述系统包括数据库建立单元10、数据集构建单元20、用户数据获取单元30、模型构建单元40、风险预测单元50;
数据库建立单元10,用于采集各种食材/制品多维度数据构建食物营养元素表及每种营养元素每日标准摄入量构建元素每日摄入量表,建立饮食数据库;
所述食物营养元素表中包括各种食材/制品的多营养元素含量、类别、适宜人群、禁忌人群、相克食物、功效、配料信息、制作步骤;所述营养元素包括:热量、蛋白质、脂肪、碳水化合物、纤维素、胆固醇、维生素B1、维生素B2、烟酸、维生素C、维生素D、维生素E、维生素A、胡萝卜素、视黄醇、钙、镁、铁、锰、锌、铜、钾、磷、钠、硒、水分、GI、嘌呤。
所述所述特征属性包括脑卒中相关营养元素摄入情况和用户的基本信息;其中脑卒中相关营养元素包括热量、脂肪、GL(glycemic load,食物血糖负荷)、盐,营养元素摄入情况分为偏低、偏高、正常;用户的基本信息包括年龄、是否肥胖、脑卒中遗传史、抽烟史、酗酒史、高血压史、糖尿病史、房颤史、心血管疾病史。
数据集构建单元20,用于计算不同人群连续时间段内的脑卒中相关营养元素摄入情况,结合自身的基础疾病的基本信息作为特征属性,以是否患有脑卒中为标签制作样本数据集;
用户数据获取单元30,用于用于获取采集待测用户的基本信息及连续的饮食记录,基于饮食数据库计算用户饮食记录中的脑卒中相关营养元素摄入情况。
相应的,用户信息包括年龄、性别、体重、身高、酗酒史、抽烟史、脑卒中家族遗传史、高血压史、糖尿病史、房颤史、心血管疾病史、脑卒中相关元素包括GL、脂肪、盐、热量。记录用户个人信息和饮食信息,基于饮食数据库食物营养元素表和元素每日摄取量表对标计算用户6个月内饮食记录中的营养元素(GL、脂肪、盐、热量)摄入情况(偏低、偏高、正常)。
模型构建单元40,用于构建随机森林模型,基于样本数据集训练随机森林模型;
请参阅图2,所述模型构建单元40具体包括:
训练集选择子单元:从样本数据集中采用Bootstraping抽样产生k个训练集,分别为T1,T2,…,Tk;
决策树生成子单元:根据所述k个训练集训练决策树,生成k棵决策树,在每一轮生成决策树的过程中,从D个特征中随机选择其中的d个特征组成一个新的特征集,通过使用新的特征集来生成决策树。具体可根据ID3算法生成决策树,根据新的特征集信息,计算每个特征的信息增益值,根据信息增益的结果,选取最大结果的特征作为根节点,结果依次减小的特征作为子节点,再对子结点递归地调用以上方法,构建决策树,直到所有特征的信息增益均很小或没有特征可以选择为止,最终得到一个决策树。
决策树筛选子单元:分别计算各个决策树之间的相关度,计算相关度的方式包括相关系数、互信息等,从k棵决策树中剔除与其他决策树相关度高于预设阈值且准确度低于预设阈值的决策树,得到新的决策树集合;
决策树组合子单元:采用鸽群优化算法优化新的决策树集合中各个决策树的权重,组成随机森林模型。
具体的,可直接使用鸽群算法进行决策树集合中各个决策树的权重优化,也可在鸽群算法的基础上,融合黄金正弦算法进行决策树集合中各个决策树的权重优化,具体在鸽群位置更新处引入黄金正弦算法进行位置更新优化。黄金正弦算法(Gold-SA)在位置更新过程中引入两个黄金分割系数,使“搜索”和“开发”达到良好的平衡,一方面遍历单位圆上的所有点进行全局搜索,另一方面通过黄金分割系数的随机选择控制位置更新距离和方向,可以逐步缩小搜索空间。本发明将黄金正弦算法与鸽群算法相结合,黄金正弦算法快速引导鸽群个体趋近最优值,从而减少算法的寻优时间,提高算法的寻优速度和精度,得到各个决策树的最优权重系数。
所述鸽群优化算法的适应度函数为随机森林模型的综合损失函数最小,损失随机森林模型的综合损失函数为各个决策树的损失函数加权求和,其中权重即为采用鸽群优化算法优化后的权重。
最后从原始样本集中选择没有被使用过的样例进行模型验证。
风险预测子单元50,用于将待测用户基本信息及脑卒中相关元素的摄入情况输入随机森林模型,实现对脑卒中的风险指数预测。
本发明还公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明前述的方法。
本发明还公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明实施例所述方法的全部或部分步骤。所述存储介质包括:U盘、移动硬盘、只议存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以分布到多个网络单元上。可以根据实际的衙要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于饮食行为预测脑卒中的系统,其特征在于,所述系统包括:
数据库建立单元:用于采集各种食材/制品多维度数据构建食物营养元素表及每种营养元素每日标准摄入量构建元素每日摄入量表,建立饮食数据库;
数据集构建单元:用于计算不同人群连续时间段内的脑卒中相关营养元素摄入情况,结合自身的基础疾病的基本信息作为特征属性,以是否患有脑卒中为标签制作样本数据集;
用户数据获取单元:用于获取采集待测用户的基本信息及连续的饮食记录,基于饮食数据库计算用户饮食记录中的脑卒中相关营养元素摄入情况;
模型构建单元:用于构建随机森林模型,基于样本数据集训练随机森林模型;所述模型构建单元中,所述构建随机森林模型包括:
训练集选择子单元:从样本数据集中采用Bootstraping抽样产生k个训练集,分别为T1,T2,…,Tk;
决策树生成子单元:根据所述k个训练集训练决策树,生成k棵决策树,在每一轮生成决策树的过程中,从D个特征中随机选择其中的d个特征组成一个新的特征集,通过使用新的特征集来生成决策树;
决策树筛选子单元:分别计算各个决策树之间的相关度,从k棵决策树中剔除与其他决策树相关度高于预设阈值且准确度低于预设阈值的决策树,得到新的决策树集合;
决策树组合子单元:采用鸽群优化算法优化新的决策树集合中各个决策树的权重,组成随机森林模型;所述鸽群优化算法的适应度函数为随机森林模型的综合损失函数最小,随机森林模型的综合损失函数为各个决策树的损失函数加权求和,其中权重即为采用鸽群优化算法优化后的权重;
风险预测单元:用于将待测用户基本信息及脑卒中相关元素的摄入情况输入随机森林模型,实现对脑卒中的风险指数预测。
2.根据权利要求1所述基于饮食行为预测脑卒中的系统,其特征在于,所述食物营养元素表中包括各种食材/制品的多营养元素含量、类别、适宜人群、禁忌人群、相克食物、功效、配料信息、制作步骤;所述营养元素包括:热量、蛋白质、脂肪、碳水化合物、纤维素、胆固醇、维生素B1、维生素B2、烟酸、维生素C、维生素D、维生素E、维生素A、胡萝卜素、视黄醇、钙、镁、铁、锰、锌、铜、钾、磷、钠、硒、水分、GI、嘌呤。
3.根据权利要求1所述基于饮食行为预测脑卒中的系统,其特征在于,所述特征属性包括脑卒中相关营养元素摄入情况和用户的基本信息;其中脑卒中相关营养元素包括热量、脂肪、GL、盐,营养元素摄入情况分为偏低、偏高、正常;用户的基本信息包括年龄、是否肥胖、脑卒中遗传史、抽烟史、酗酒史、高血压史、糖尿病史、房颤史、心血管疾病史。
4.根据权利要求1所述基于饮食行为预测脑卒中的系统,其特征在于,所述计算各个决策树之间的相关度的方式包括相关系数、互信息。
5.根据权利要求4所述基于饮食行为预测脑卒中的系统,其特征在于,所述采用鸽群优化算法优化新的决策树集合中各个决策树的权重具体包括:在鸽群算法的基础上,融合黄金正弦算法进行决策树集合中各个决策树的权重优化,具体的,在鸽群位置更新处引入黄金正弦算法进行位置更新优化,加速收敛。
6.一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;
其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现如权利要求1~5任一项所述的系统。
7.一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现权利要求1~5任一项所述的系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110233464.7A CN112967807B (zh) | 2021-03-03 | 2021-03-03 | 基于饮食行为预测脑卒中的系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110233464.7A CN112967807B (zh) | 2021-03-03 | 2021-03-03 | 基于饮食行为预测脑卒中的系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112967807A CN112967807A (zh) | 2021-06-15 |
CN112967807B true CN112967807B (zh) | 2023-12-01 |
Family
ID=76276634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110233464.7A Active CN112967807B (zh) | 2021-03-03 | 2021-03-03 | 基于饮食行为预测脑卒中的系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112967807B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117612713B (zh) * | 2023-10-08 | 2024-06-11 | 郑州大学 | 一种基于云计算的脑卒中行为的智能分析系统及方法 |
CN117727458B (zh) * | 2024-02-07 | 2024-04-30 | 北斗云方(北京)健康科技有限公司 | 基于在线学习的befast卒中筛查系统和方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106066938A (zh) * | 2016-06-03 | 2016-11-02 | 贡京京 | 一种疾病预防和健康管理方法及系统 |
CN108389626A (zh) * | 2018-02-09 | 2018-08-10 | 上海长江科技发展有限公司 | 基于人工智能的脑卒中筛查方法及系统 |
CN109509539A (zh) * | 2018-11-13 | 2019-03-22 | 广州仁生健康科技有限公司 | 一种饮食习惯健康风险评估方法 |
CN111091911A (zh) * | 2019-12-30 | 2020-05-01 | 重庆同仁至诚智慧医疗科技股份有限公司 | 一种卒中风险筛查系统及方法 |
CN111430029A (zh) * | 2020-03-24 | 2020-07-17 | 浙江达美生物技术有限公司 | 基于人工智能的多维度脑卒中预防筛查方法 |
CN111599477A (zh) * | 2020-07-10 | 2020-08-28 | 吾征智能技术(北京)有限公司 | 一种基于饮食习惯预测糖尿病的模型构建方法和系统 |
CN111816280A (zh) * | 2020-07-10 | 2020-10-23 | 吾征智能技术(北京)有限公司 | 一种基于饮食行为的疾病预测的模型构建方法及系统 |
CN112133434A (zh) * | 2020-09-17 | 2020-12-25 | 吾征智能技术(北京)有限公司 | 基于饮食习惯的高血脂辅助诊断系统、设备、存储介质 |
CN112329906A (zh) * | 2020-11-06 | 2021-02-05 | 汉唐智华(深圳)科技发展有限公司 | 一种基于粒子群算法的人工智能金融风险度量方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9852266B2 (en) * | 2012-09-21 | 2017-12-26 | Md Revolution, Inc. | Interactive graphical user interfaces for implementing personalized health and wellness programs |
US20170308981A1 (en) * | 2016-04-22 | 2017-10-26 | New York University | Patient condition identification and treatment |
KR102024375B1 (ko) * | 2016-12-30 | 2019-09-23 | 서울대학교 산학협력단 | 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법 |
US20190295440A1 (en) * | 2018-03-23 | 2019-09-26 | Nutrino Health Ltd. | Systems and methods for food analysis, personalized recommendations and health management |
-
2021
- 2021-03-03 CN CN202110233464.7A patent/CN112967807B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106066938A (zh) * | 2016-06-03 | 2016-11-02 | 贡京京 | 一种疾病预防和健康管理方法及系统 |
CN108389626A (zh) * | 2018-02-09 | 2018-08-10 | 上海长江科技发展有限公司 | 基于人工智能的脑卒中筛查方法及系统 |
CN109509539A (zh) * | 2018-11-13 | 2019-03-22 | 广州仁生健康科技有限公司 | 一种饮食习惯健康风险评估方法 |
CN111091911A (zh) * | 2019-12-30 | 2020-05-01 | 重庆同仁至诚智慧医疗科技股份有限公司 | 一种卒中风险筛查系统及方法 |
CN111430029A (zh) * | 2020-03-24 | 2020-07-17 | 浙江达美生物技术有限公司 | 基于人工智能的多维度脑卒中预防筛查方法 |
CN111599477A (zh) * | 2020-07-10 | 2020-08-28 | 吾征智能技术(北京)有限公司 | 一种基于饮食习惯预测糖尿病的模型构建方法和系统 |
CN111816280A (zh) * | 2020-07-10 | 2020-10-23 | 吾征智能技术(北京)有限公司 | 一种基于饮食行为的疾病预测的模型构建方法及系统 |
CN112133434A (zh) * | 2020-09-17 | 2020-12-25 | 吾征智能技术(北京)有限公司 | 基于饮食习惯的高血脂辅助诊断系统、设备、存储介质 |
CN112329906A (zh) * | 2020-11-06 | 2021-02-05 | 汉唐智华(深圳)科技发展有限公司 | 一种基于粒子群算法的人工智能金融风险度量方法 |
Non-Patent Citations (5)
Title |
---|
Tuttolomondo, Antonino,等.Mediterranean Diet in patients with acute ischemic stroke: Relationships between Mediterranean Diet score, diagnostic subtype, and stroke severity index.《Atherosclerosis》.2015,第243卷(第1期),第260-267页. * |
杨振,等.《工业机器人协作应用基础》.北京理工大学出版社,2020,(第1版),第13页. * |
熊文.基于群智的特征选择、分类与聚类挖掘的研究.《中国博士学位论文全文数据库 信息科技辑》.2012,(第04期),I138-12. * |
王明旭,等.《行为医学》.人民卫生出版社,2011,(第1版),第192-195页. * |
陈笑屹.深度梯度提升模型及其在脑卒中预测中的应用.《中国优秀硕士学位论文全文数据库 医药卫生科技辑》.2020,(第08期),E070-83. * |
Also Published As
Publication number | Publication date |
---|---|
CN112967807A (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Del Ponte et al. | Standard area diagrams for aiding severity estimation: scientometrics, pathosystems, and methodological trends in the last 25 years | |
Chakradar et al. | A non-invasive approach to identify insulin resistance with triglycerides and HDL-c ratio using machine learning | |
US20200203017A1 (en) | Systems and methods of prediction of injury risk with a training regime | |
CN112967807B (zh) | 基于饮食行为预测脑卒中的系统、设备及存储介质 | |
Olivier et al. | Exploring the temporal variability of a food web using long‐term biomonitoring data | |
CN107194138A (zh) | 一种基于体检数据建模的空腹血糖预测方法 | |
CN116417115B (zh) | 妊娠期糖尿病患者个性化营养方案推荐方法及系统 | |
CN103198211A (zh) | 2型糖尿病发病危险因素对血糖影响的定量分析方法 | |
CN110379487A (zh) | 营养方案管理系统 | |
WO2020050327A1 (ja) | 予測装置、方法およびプログラム | |
Sefa-Yeboah et al. | Development of a Mobile Application Platform for Self‐Management of Obesity Using Artificial Intelligence Techniques | |
US11537888B2 (en) | Systems and methods for predicting pain level | |
Szuwalski et al. | Identifying research priorities for management under uncertainty: the estimation ability of the stock assessment method used for eastern Bering Sea snow crab (Chionoecetes opilio) | |
Raihen et al. | Prediction modeling using deep learning for the classification of grape-type dried fruits | |
Mongiano et al. | Evolutionary trends and phylogenetic association of key morphological traits in the Italian rice varietal landscape | |
Liu et al. | Machine learning algorithms identify demographics, dietary features, and blood biomarkers associated with stroke records | |
US20230207101A1 (en) | Method and system for improving a meal | |
Patil et al. | Assessment of risk of type 2 diabetes mellitus with stress as a risk factor using classification algorithms | |
Hidayat et al. | Decision support system for selection of staples food and food commodity price prediction post-covid-19 using simple additive weighting and multiple linear regression methods | |
KR20200036168A (ko) | 개인의 신체 리듬 맞춤형 작물 매칭 시스템 | |
Vijayakumar et al. | An Intelligent stacking Ensemble-Based Machine Learning Model for Heart abnormality | |
Lin et al. | System design of an intelligent nutrition consultation and recommendation model | |
Au et al. | The relationship between smoking, quitting smoking and obesity in Australia: a seemingly unrelated probit approach | |
Behera et al. | An improved machine learning framework for cardiovascular disease prediction | |
Kour et al. | An Advance Approach for Diabetes Detection by Implementing Machine Learning Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |