CN111223569A - 一种基于特征权重的lars糖尿病预测方法 - Google Patents
一种基于特征权重的lars糖尿病预测方法 Download PDFInfo
- Publication number
- CN111223569A CN111223569A CN202010205152.0A CN202010205152A CN111223569A CN 111223569 A CN111223569 A CN 111223569A CN 202010205152 A CN202010205152 A CN 202010205152A CN 111223569 A CN111223569 A CN 111223569A
- Authority
- CN
- China
- Prior art keywords
- diabetes
- vector
- lars
- exercise
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010012601 diabetes mellitus Diseases 0.000 title claims abstract description 165
- 238000000034 method Methods 0.000 title description 29
- 239000013598 vector Substances 0.000 claims abstract description 61
- 238000012544 monitoring process Methods 0.000 claims description 27
- 230000006399 behavior Effects 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000002567 autonomic effect Effects 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000010801 machine learning Methods 0.000 claims description 9
- 230000000386 athletic effect Effects 0.000 claims description 7
- 230000002265 prevention Effects 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 238000004422 calculation algorithm Methods 0.000 description 65
- 230000033001 locomotion Effects 0.000 description 35
- 230000006870 function Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 14
- 238000000513 principal component analysis Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 239000008280 blood Substances 0.000 description 9
- 210000004369 blood Anatomy 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- 238000012417 linear regression Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000037147 athletic performance Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 206010018429 Glucose tolerance impaired Diseases 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000011157 data evaluation Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000035487 diastolic blood pressure Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000000276 sedentary effect Effects 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 229920002527 Glycogen Polymers 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 208000031662 Noncommunicable disease Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229940096919 glycogen Drugs 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 230000003345 hyperglycaemic effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 230000009916 joint effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 210000004003 subcutaneous fat Anatomy 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 210000001364 upper extremity Anatomy 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Algebra (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Medicines Containing Plant Substances (AREA)
Abstract
本发明涉及一种基于特征权重的LARS糖尿病预测系统,该系统包括存储设备;基于特征权重的LARS糖尿病预测模块,其耦合到存储设备且被配置为:计算自变量特征权重向量和原始相关度向量;基于所述自变量特征权重向量和所述原始相关度向量,输出基于特征权重的LARS糖尿病模型的回归系数ω。从糖尿病数据集特征出发,筛选出糖尿病关键特征变量,简化了糖尿病预测模型;提高了糖尿病预测模型的准确性,从而有助于提供准确的糖尿病预防与治疗措施。
Description
技术领域
本发明涉及医疗信息化技术领域,尤其涉及一种基于特征权重的LARS糖尿病预测方法。
背景技术
糖尿病作为一种与生活方式和环境因素密切相关的慢性非传染性疾病,影响人群范围广,并发症致残、致死率高,需要庞大的社会资源及医疗资源支出。如何更准确地预测、预防、减少糖尿病的发病,以及制定更有效的治疗方案以减少并发症的发生发展,成为目前面临的难题。糖尿病的不良预后往往与长期高血糖暴露相关,然而在患者血糖升高的初期往往临床症状不明显。如果能在血糖升高之前就对糖尿病发病进行精准的预测,则对于糖尿病的防治具有重大的意义。
糖尿病个体发病预测模型能有效识别糖尿病高危人群、是选择干预方案的必要工具,可为健康管理、疾病预防决策以及干预方案效果评价提供依据,已经被广泛认可。糖尿病个体发病预测模型似乎使我们对于高危人群的发病有了一定的前瞻预测性,但更为重要的是,糖尿病的发病虽然有遗传因素的作用,其与生活方式以及环境因素密切相关。而目前所提出的大量预测模型,均只考虑了单一的因素,未能将各种因素整合,也尚未将环境与这些因素的相互作用考虑计算在内,并且往往是只在单一种族中验证。
因此糖尿病个体发病预测模型的建立,必将伴随着特征越来越多、维数越来越大的庞大数据,带来了较多的非关键信息和冗余信息,预测模型也变得越来越复杂。传统糖尿病个体发病预测模型难于直接应用于糖尿病的预测中。针对该问题,目前最有效的处理手段之一就是数学建模,而建模之初,通常会尽可能多地选择自变量来减少因缺少自变量而出现的模型偏差,但在实际建模过程中需要寻找对因变量最具有解释性的自变量子集,这个过程称为特征选择,是建模过程中很重要的一个问题。常见的特征选择算法有如基于Lasso(Least Absolute Shrinkage and Selection Operator,又译最小绝对值收敛和选择算子、套索算法、线性回归的L1正则化)的降维算法,其目的是抽取与分类任务相关度最高的特征,同时去除相关度低的特征来减少计算开销。
Lasso算法是一种最小二乘法,用于建立低维的线性模型,来预测响应输出变量。该算法通过在损失函数中引入L1惩罚函数,在回归系数的绝对值之和小于一个常数的约束条件下,使残差平方和最小化,从而使一些指标的回归系数严格等于零,也就是说,Lasso算法具有变量稀疏的特性,能够消除冗余特征,发现问题需要且仅需要的变量,实现指标集合精简的同时得到对结果具有较强解释能力的模型。LASSO是一种最小二乘法,用于建立低维的线性模型,来预测响应输出变量。
LARS算法用于决定哪些变量被选入模型并给出相应变量的参数估计。该算法不是在每一步前向逐步回归中直接加入某个变量,而是先找出和因变量相关度最高的那个变量,然后沿着最小平方误差的方向对变量的系数进行调整,在调整过程中,该变量和残差项的相关系数会逐渐减小直到出现新的变量与残差的相关性大于此时该变量与残差的相关性,然后重新沿着最小平方误差的方向进行调整,重复进行该过程,直至所有变量被选入自变量集合中,最终得到所求的参数估计。
但是Lasso回归的损失函数不是连续可导的,由于L1范数用的是绝对值之和,导致损失函数有不可导的点,不能直接得到解析解,所以需要通过迭代算法来进行求解。对此,通常采用最小角回归(Least Angle Regressi on,LARS)算法来求有这个L1范数的损失函数极小值。LARS算法是一个适用于高维数据的回归算法。
现有文献如北京交通大学柯郑林等人在Lasso及其相关方法在多元线性回归模型中的应用一文中,将Lasso方法及其相关方法的思想运用于多元线性回归模型的变量选择,其中提出了多元线性回归模型的变量选择的传统L ARS算法,并通过糖尿病统计数据和一个模拟生成的多元统计数据,给出了变量选择方法的具体实现。
但由于在采用传统的LARS算法在求解Lasso回归系数时,存在逼近速度慢且准确度不高的问题,并且由于LARS算法的迭代方向是根据目标的残差而定,所以该算法对样本的噪声极为敏感,单一地使用LARS算法往往会得到过于稀疏的模型,因此,LARS算法难以直接用于数据特征越来越多、数据维数越来越大的糖尿病预测中。
目前我国针对重大慢病的预防和控制的运动处方服务基本处于空白状态,糖尿病人群缺乏实质的运动康复指导,尤其是并发症发病风险处于高危及以上的糖尿病患者,临床康复手段单一,这主要是因为运动康复指导执行起来比较困难,运动风险较高。根据美国糖尿病协会《2016年ADA糖尿病诊疗标准》、2013年中华医学会糖尿病分会发布的《中国2型糖尿病防治指南》《中国糖尿病运动治疗指南》,上述文件中都明确了运动干预在糖尿病及糖尿病前期人群治疗中的重要地位,建议并鼓励对糖尿病前期人群制定个性化的运动治疗方案并贯穿治疗的全过程。运动康复方案的执行是一个长期、持续的过程,尤其是针对如老年糖尿病患者等高危糖尿病人群,运动康复时间长,运动风险高,运动治疗方案的执行需要实时监控和风险防控。患者在执行运动治疗方案时存在运动风险不可控,运动治疗方案的治疗效果无法实时评价等问题,尚未解决的这些问题限制了运动治疗方案在高危糖尿病人群中的推广和应用,无法切实地发挥运动治疗方案对此类人群的康复效益。
现有技术中如公开号为CN110718302A的专利文献所提供的一种基于大数据的糖尿病管理路径的系统及方法,患者生成的管理计划中包括每日任务,通过患者每日管理任务获取不同体质测量数值,其中包括血糖、血压、体重、运动、饮食和用药,根据每日血糖数值测量提供患者危险预警如表四,并通过相关数值根据依从性评估规则如表五实现患者依从性评估。依从性评估报告结果差的需对患者进行重新筛查,保证患者管理的准确性。并且患者可对任务进行健康评价,同样可实现对系统的监控反馈。
目前,糖尿病运动风险管理的常见方法是由医护人员或是家属等全程陪护,但对于没有任何糖尿病运动风险知识的家属来说,无法实现糖尿病运动风险管理以及运动康复的目的,而单个医护人员需要同时负责多名患者的运动康复过程,工作难度及强度较大,工作效率低且不利于患者的康复。
此外,一方面由于对本领域技术人员的理解存在差异;另一方面由于发明人做出本发明时研究了大量文献和专利,但篇幅所限并未详细罗列所有的细节与内容,然而这绝非本发明不具备这些现有技术的特征,相反本发明已经具备现有技术的所有特征,而且申请人保留在背景技术中增加相关现有技术之权利。
发明内容
针对现有技术之不足,本发明提供了一种系统,该系统适用于高危糖尿病患者的康复运动风险管理,该系统包括至少一个处理器,耦合至所述至少一个处理器的存储设备。至少一个处理器包括智能电子设备、传感器模块、糖尿病预测模块以及运动方案调整模块。该系统是由智能电子设备设定用于构建基于特征权重的LARS糖尿病预测模型的至少一个初始参数,并通过接口将所述初始参数传向糖尿病预测模块,然后由糖尿病预测模块构建基于特征权重的LARS糖尿病预测模型并调整运动方案中的配置参数,通过其与智能电子设备之间的接口,糖尿病预测模块将运行的中间结果和整个运行的最终结果传给智能电子设备进行存储或基于用户的指令进行显示。
如图8所示出的作为一个优选实施方式的该系统的通信链路,接口至少包括通信接口(如网络适配器)和I/O接口。该系统中的若干个处理器、接口、存储设备(图中未示出)通过诸如母板的通信总线(实线)互连。如传感器模块、糖尿病预测模块、运动方案调整模块、存储设备中的至少两个硬件之间通过诸如母板的通信总线(实线)互连。各处理器借助于通信接口可操作地耦合至计算机网络。计算机网络可以是因特网、互联网和/或外联网,或与因特网通信的内联网和/或外联网。从而各处理器通过计算机网络或通过直线连接(有线或无线)与智能电子设备通信。优选地,传感器模块也可以是通过计算机网络或通过直线连接(有线或无线)与通信链路上的各处理器进行通信,而不仅限于如图8所示各部件之间的连接关系。
优选地,传感器模块和至少一个智能电子设备将其处理后的信号发送给糖尿病预测模块,糖尿病预测模块将该信号转发至运动方案调整模块,运动方案调整模块缓存该信号并将其与另一信号合并后发送至至少一个智能电子设备。在通信链路上,传感器模块的数据接口连接至糖尿病预测模块的数据接口。在收发数据时,传感器模块和至少一个智能电子设备的数据发送至糖尿病预测模块的接口,来自糖尿病预测模块的接口的数据被运动方案调整模块处理后,发送至至少一个智能电子设备。
作为一种优选实施方式,本发明所提供的系统包括:由当前用户所操作或佩戴的智能电子设备、由护理人员所操作或佩戴的智能电子设备、用于辅助用户完成部分康复运动的机械器材,智能电子设备以及机械器材上分别设置有传感器模块,机械器材上还设置有糖尿病预测模块、运动方案调整模块、显示器以及其他处理器。设于机械器材上的若干处理器通过计算机网络与由当前用户/护理人员所操作或佩戴的智能电子设备进行通信。设于机械器材上的传感器模块、糖尿病预测模块、运动方案调整模块、显示器以及其他处理器之间可以通过诸如母板的通信总线(实线)互连。
在本发明中,各处理器例如智能电子设备、糖尿病预测模块以及传感器模块等可以使用“被配置为”来描述其执行一个或多个功能。一般来说,被配置为执行或被配置为用于执行一个功能的处理器能够执行该功能,或者适合执行该功能,或者可操作地执行该功能,或者是以其他方式例如驱使其他处理器执行该功能。此外,应当理解的是,“X、Y、Z中的至少一个”和“X、Y、Z中的一个或多个”可理解为只有X,只有Y,只有Z,或者X,Y,Z中的两个或多个的任意组合(例如,XYZ,XY,YZ,XZ,等等)。类似的逻辑也可应用于“至少一个……”和“一个或多个……”语句中出现的任何两个或多个对象。在本说明书中使用的,单数形式的“一”或“该”均包括复数的指代对象,除非该内容和上下文另外明确地指明。即例如,提及“系统”包括两个或更多个此类系统的组合,提及“处理器”包括两个或更多个处理器的组合。除非另外指明,“或”连接意图以其作为布尔逻辑算符的正确含义使用,包括择一性的特征选择(A或B)和合取性的特征选择(A或B)两者。所述智能电子设备包括但不限于计算机、手机、平板电脑等各类终端设备。
本发明所提出的系统包括如上述的至少一个处理器、存储设备以及至少一个计算机可读介质。计算机可读介质包括计算机存储介质和通信介质两者,包括促成计算机程序从一地向另一地转移的任何介质。所述至少一个计算机可读存储介质上载有用于使处理器实现本发明的各个方面的计算机可执行指令。至少一个处理器用于执行所述计算机可执行指令,以使所述糖尿病预测系统执行如下所述的基于特征权重的LARS糖尿病预测方法。例如,至少一个计算机可读存储介质上载有用于使处理器实现本发明的数据采集的计算机可执行指令——采集该糖尿病风险管理系统的初始数据、系统应用的参数以及关于当前用户的用户数据,由传感器模块来执行该计算机可执行指令。例如,至少一个计算机可读存储介质上载有用于使处理器实现本发明进行用户运动糖尿病风险辨识的计算机可执行指令——计算自变量特征权重向量和原始相关度向量、并基于所述自变量特征权重向量和所述原始相关度向量,输出基于特征权重的LARS糖尿病模型的回归系数ω,由糖尿病预测模块来执行该计算机可执行指令。例如,至少一个计算机可读存储介质上载有用于使处理器实现本发明进行运动方案调整的计算机可执行指令——基于由所述糖尿病预测模块所分析确定的运动监测数据与自主行为能力之间的关系以辨识运动糖尿病风险的方式来动态地调整运动方案中的配置参数,由运动方案调整模块来执行该计算机可执行指令。
上述计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储或其他磁存储设备、或能被用来携带或存储指令或数据结构形式的期望程序代码手段且能被通用或专用计算机、或者通用或专用处理器访问的任何其他介质。计算机可读存储介质例如可以是但不限于是电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。“连接”也可被称为计算机可读介质。计算机通信介质可以包括同轴电缆、双绞线及光纤等有线通信介质或是无线电通信(利用空间电磁波实现站点之间的通信)。处理器是解释和执行指令的功能单元,也称为中央处理器或CPU,作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以是例如DSP与微处理器的组合、多个微处理器、与DSP核心协同的一个或多个微处理器、或任何其它此类配置。
如附图中的流程图和框图,其显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。这里参照根据本发明实施例的方法、系统(装置)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这里所描述的计算机可执行指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可执行指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(I SA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言诸如Smalltalk、C++等,以及常规的过程式编程语言诸如C语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
针对上述至少一个所述计算机可读存储介质上载有的用于使处理器实现本发明的各个方面的计算机可执行指令进一步具体说明:
基于特征权重的LARS糖尿病预测系统,该系统包括存储设备;基于特征权重的LARS糖尿病预测模块,其耦合到存储设备且被配置为:计算自变量特征权重向量和原始相关度向量;基于所述自变量特征权重向量和所述原始相关度向量,输出基于特征权重的LARS糖尿病模型的回归系数ω。
根据一种优选实施方式,计算特征自变量的特征权重的公式为:
根据一种优选实施方式,所述特征方程中的R为糖尿病数据集矩阵X的协方差矩阵,其计算公式为:
根据一种优选实施方式,基于所述自变量特征权重向量和所述原始相关度向量的回归系数ω的输出是通过以下至少一个步骤来实现的:计算角平分向量、回归系数向量、新相关度向量和最大相关度;更新回归系数向量,评估值向量、残差向量和指标集;判断残差向量的L2范数是否小于容忍度,若是则结束,否则重复以上步骤。
根据一种优选实施方式,每个特征自变量与真实结果之间的初始相关度是通过以下计算公式来确定的:
c=XTy,其中,X为糖尿病数据集特征矩阵,y为真实结果标签,
根据一种优选实施方式,所述糖尿病预测模块还被配置为归一化糖尿病数据集矩阵,初始化当前评估值向量和残差向量。
根据一种优选实施方式,所述预测系统适用于高危糖尿病患者的康复运动风险管理,所述预测系统还包括传感器模块,其中,所述糖尿病预测模块还被配置为利用由传感器模块所采集到的数据集根据机器学习筛选出的显著性特征以及提取出的运动监测数据与自主行为能力之间的关系来辨识用户运动糖尿病风险。
一种装置,该装置适用于高危糖尿病患者的康复运动风险管理,该装置至少包括存储设备和处理器,至少一个所述处理器耦合到所述存储设备并被配置为:利用由传感器模块所采集到的数据集根据机器学习筛选出的显著性特征以及提取出的运动监测数据与自主行为能力之间的关系来辨识用户运动糖尿病风险,和/或
基于所分析确定的运动监测数据与自主行为能力之间的关系以辨识运动糖尿病风险的方式来动态地调整运动方案中的配置参数。
附图说明
图1是本发明实施例中基于特征权重的LARS糖尿病预测方法的流程图;
图2是标准的LARS算法的求解图;
图3是本发明实施例中加入特征权重的LARS算法求解图;
图4是标准LARS算法的回归变量ω的变化路径图;
图5是基于特征权重的LARS算法的回归变量ω的变化路径;
图6是标准LARS算法和本发明基于特征权重的LARS算法随着迭代次数ACC的变化曲线图;
图7是标准LARS算法和本发明基于特征权重的LARS算法随着迭代次数ROC的变化曲线图;
图8是本发明提供的糖尿病预测系统的简化模块连接关系示意图。
附图标记列表
1:传感器模块 2:糖尿病预测模块 3:运动方案调整模块
4:智能电子设备 5:接口
具体实施方式
下面结合附图对本发明进行详细说明。
针对传统的采用LARS算法在求解Lasso回归系数时存在逼近速度慢且准确度不高的问题,本发明对LARS算法进行了改进,通过在LARS算法求解步骤中结合PCA算法得到的特征权重的方式,提出了基于特征权重的LARS糖尿病预测模块以及糖尿病预测系统。利用PCA主成分分析,筛选出糖尿病关键特征变量,简化了糖尿病预测模型,提高了糖尿病预测模型的准确性,为提供更准确的糖尿病预防与治疗措施作前期铺垫;并且,借助于基于特征权重的LARS糖尿病预测模块的糖尿病特征选择,本发明所提供的糖尿病预测系统适用于高危糖尿病患者的康复运动风险管理,利用由传感器模块所采集到的大量数据集,根据运动监测数据与自主行为能力之间的关系,来辨识用户运动糖尿病风险。
实施例1
由机器学习和PCA(Principal Component Analysis,主成分分析)理论可知,一个多维的样本中通常存在少数几个关键特征或者主成份。在糖尿病的众多特征中同样只有少数几个关键特征,研究发现采用LARS算法可以得到由关键特征表示的泛化能力更好的预测模型。泛化能力指的是经过训练的网络对于不是样本集的输入也能给出合适的输出的性质。机器学习算法是使用线性回归算法实现的,但是线性回归算法不可避免的会出现过评估问题,训练的越多,模型就越匹配训练数据,而逐渐丧失了对新数据的“预测性”。在传统的采用LARS算法在求解Lasso回归系数时,存在逼近速度慢且准确度不高的问题,并且由于LARS算法的迭代方向是根据目标的残差而定,致使该算法对样本的噪声极为敏感。
为解决上述问题,本发明通过在LARS算法求解步骤中结合PCA算法得到的特征权重,特征自变量因权重不同被选入的可能性发生了改变,可以加快算法向关键特征的逼近速度,从而可以加快算法求解速度和准确率;并且由于采用PCA算法对各自变量的变化进行了约束,模型的鲁棒性增加。
首先定义糖尿病数据集特征矩阵:
即为m条n维特征的矩阵,xk1,xk2,…,xkn为各特征自变量。
真实结果标签:y=(y1,y2,…,ym)T。
结合图1所示,本发明提供一种基于特征权重的LARS糖尿病预测方法,具体步骤如下:
步骤1,归一化糖尿病数据集矩阵X,使糖尿病数据集不同特征的范围值映射到相同的0-1固定范围中。初始化当前评估值和当前的残差。评估值指每次迭代对真实结果的评估,初始化为0。残差为真实结果与评估值的差,计算公式1为:
y为真实结果标签向量,μ为当前评估值。
步骤2,计算每个特征自变量初始权重,计算方式3为:
再计算每个特征自变量与真实结果的初始相关度,计算公式2为:
c=XTy (2)
结合图3所示,步骤3:从X中取出与y同向的列向量,令其为XA,XA为从X中取出的A指标集里的列向量。
再通过公式8和公式7计算XA中向量的角平分线uA:
其中,1A为k维所有元素均为1的列向量,k为A中元素个数。
计算新相关度,计算公式5为:
C=cTβ (5)
其中c=XT(y-μA),μA为前一步的评估值,β为通过PCA算法求得各权重的度量值向量,再得到C中的最大值公式6为:
C_max=max{|C|} (6)
由步骤4计算公式即可以更新回归系数,当前评估值和当前残差,更新回归系数向量的计算公式9:
ωA=ωA+γωA (9)
评估值向量的计算公式10:
μA=μA+γuA (10)
残差向量的计算公式11:
其中γ为沿着角平分线uA的前进步长,设a=XTuA,γ计算公式12为:
步骤5,判断步骤4中残差的L2范数是否小于某个容忍度,若是则结束,输出回归系数;否则重复步骤3到步骤5。
其中,回归系数(regression coefficient)在回归方程中表示自变量x对因变量y影响大小的参数。回归系数越大表示x对y影响越大,正回归系数表示y随x增大而增大,负回归系数表示y随x增大而减小。例如回归方程式Y=bX+a中,斜率b称为回归系数,表示X每变动一单位,平均而言,Y将变动b单位。
将本发明提出糖尿病预测方法与标准的LARS方法进行对比,以回归系数路径、预测准确率(ACC)曲线和模型的受试者特征(Receiver Operating Characteristic,ROC)曲线等为评判指标。其中,回归系数路径可以直观的看出各特征自变量系数的变化情况,ACC曲线则可以直观的比较算法的逼近速度与准确率,ROC曲线则是一种度量非均衡问题的工具,曲线下面积越大则模型越好。
从直观上看,标准的LARS算法是先找到与y相关度最大的自变量xk,并用其对y逼近,直到出现另一个xl,它与y的相关度和xk与y的相关度相等,此时开始以xk与xl的角分线方向逼近y,同样,当出现第三个xp与因变量的相关度足够大时,也将它加入到逼近队列中,取三个向量共同的角分线方向(“角分线”指的是高位向量的平分线),如此继续,直到残差足够小或已取得了所有自变量,算法结束。如图2所示,初始时x1与y的相关度较高,用它进行逼近,直到y出现在x1与x2的角分线上,此后用x1与x2的角分线方向逼近因变量y,标准LARS算法保持了前项选择算法的复杂度,最大只需要m步,m为自变量的个数,同时保证了结果时自变量子空间中最优的。结合图2和图3,分别为标准的LARS算法和加入特征权重的LARS算法求解图,以两个特征自变量为例,在每次逼近前都会进行相关度计算。由附图3可以看出加入了特征权重后,两个特征自变量因权重不同被选入的可能性发生了改变,逼近方向也发生了改变,最终导致回归系数发生改变。
结合图4和图5,分别为标准LARS算法和基于特征权重的LARS算法的回归变量ω的变化路径。坐标纵轴为ω值大小,横轴为迭代次数,比较图4和图5发现基于特征权重的LARS算法8个特征自变量的回归系数路径都发生了改变,由于使用PCA算法得到了初始权重,对各自变量的变化进行了约束,因此回归系数并不会差别太大,模型的鲁棒性增加,其次,由于较大权重的自变量的回归系数会增加更快,使结果更加合理,如糖尿病遗传函数和年龄比怀孕次数对是否患病的影响更大。其中,2小时血浆葡萄糖浓度是用以了解胰岛β细胞功能和机体对血糖的调节能力,其广泛应用于临床实践中;成人正常的舒张压为<90mmHg(12kpa);肱三头肌皮下脂肪厚度,如果成人的肱三头肌皮肤皱壁厚度男性大于10.4mm、女性大于17.5mm则属于肥胖;两小时血清胰岛素,血清胰岛素是机体内唯一降低血糖的激素,也是唯一同时促进糖原、脂肪、蛋白质合成的激素。成人正常指标为29~172pmol/L,大于60岁的正常指标为42~243pmol/L;体重指数,成人正常值为21-23kg/m2,个人健康值为18.5-24.9kg/m2,高风险值为25.0-29.9kg/m2,BMI=体重公斤数/(身高米数)2。
结合图6两种算法随着迭代次数ACC的变化曲线。可以看出基于特征权重的LARS在逼近速度和准确率均高于标准的LARS,基于特征权重的LARS算法在迭代3次后就达到了标准LARS最好的ACC,在迭代第5次后。基于特征权重的LARS和标准LARS的ACC都达到最高,基于特征权重的LARS的ACC比标准LARS高了约0.8个百分点。同时可以看出两条曲线在迭代后面几次时ACC都下降了,由于每次迭代回归系数被压缩的程度在减小,当压缩系数α为0时已无法对回归系数进行压缩,反而使得ACC下降。结合表1、表2分别是标准LARS和基于特征权重的LARS不同的迭代次数n对应的压缩系数α值以及回归系数ω值,从两张表中可以看出第五次迭代ω都有三个为0,表明最后的模型中三个自变量的回归系数为0。这时模型得到精简同时ACC达到最高。
表1标准LARS不同的迭代次数n对应的压缩系数α值以及回归系数值
表2基于特征权重的LARS不同的迭代次数n对应的压缩系数α值以及回归系数ω值
结合图7为阈值t从0开始以0.01为步长增至1计算得出的100个伪阳率和真阳率,进而得到的两种LARS算法的ROC曲线,红色虚线为随机猜测的ROC曲线,可以看出基于特征权重的LARS的ROC曲线更加靠近左上角,通过计算ROC曲线下面积AUC,基于特征权重的LARS的AUC为0.8953,标准LARS的AUC为0.8664,特征权重的LARS算法的AUC最高。
综上,基于特征权重的LARS算法计算得到的糖尿病预测模型的ACC要高于标准LARS,且可以更快的逼近到最优模型。另外处理此次糖尿病不均衡样本的时候,基于特征权重的LARS算法的ROC曲线的AUC值要高于标准LARS。因此基于特征权重LARS算法在求解糖尿病预测模型时优于标准LARS算法。
Lasso模型可以得到稀疏解,得到的糖尿病预测模型泛化能力更好,LARS算法可以求解Lasso模型,但应用于糖尿病数据集时存在逼近速度慢和准确率不高的问题,PCA主成分分析根据得到不同特征的权重,区分各特征自变量的重要程度,因此提供基于特征权重的LARS糖尿病预测方法。
采用Lasso模型可进行特征选择得到糖尿病关键特征,根据PCA主成分分析,筛选出糖尿病关键特征变量,简化了糖尿病预测模型;提高了糖尿病预测模型的准确性,为提供更准确的糖尿病预防与治疗措施作前期铺垫。
实施例2
针对实施例1所提出的糖尿病预测模块,本实施例对其作了进一步的改进,重复的内容不再赘述。具体地,本实施例提出了一种糖尿病风险管理系统,该系统至少包括如前述实施例1所述的糖尿病预测模块。
该糖尿病风险管理系统适用于高危糖尿病患者的康复运动风险管理。
结合图8所示,该糖尿病风险管理系统至少包括传感器模块、糖尿病预测模块以及运动方案调整模块。所述传感器模块被配置为采集该糖尿病风险管理系统的初始数据、系统应用的参数以及关于当前用户的用户数据,所述糖尿病预测模块被配置为利用由传感器模块所采集到的数据集根据机器学习筛选出的显著性特征以及提取出的运动监测数据与自主行为能力之间的关系来辨识用户运动糖尿病风险,所述运动方案调整模块被配置为基于由所述糖尿病预测模块所分析确定的运动监测数据与自主行为能力之间的关系以辨识运动糖尿病风险的方式来动态地调整运动方案中的配置参数。
针对传感器模块进一步说明:该传感器模块用于采集糖尿病风险管理系统的初始数据、系统应用的参数以及关于当前用户的用户数据。所采集到的数据被收集到数据库中,并将集成的数据集传送至糖尿病预测模块。主要通过以下两种形式来建立传感器模块:例如佩戴于当前用户手腕处的智能手表,用于采集或监测运动过程当前用户的生理监测参数以及运动监测数据。优选地,智能电子设备可以是公告日为2011年11月30日的公开号为CN202051710U的专利文献所提供的小型且便携的自混合相干激光雷达无创血糖测量装置,其通过激光雷达调频连续波与自混合相干技术相结合实现对用户的无创血糖测量。运动监测数据包括久坐时长、运动强度、运动时间、运动时长、运动频率、运动类型等。该机械器材上设置有捏力传感器、握力传感器、扭力传感器、肌电采集器、至少一个数字量变送器、关节活动度传感器,分别用于采集上肢或下肢的运动能力数据。捏力传感器/握力传感器/扭力传感器采集的模拟电压信号经过数字量变送器处理后变为数字电压信号。肌电采集器包括电极、低通滤波电路模块、带通放大电路模块和模数转换电路模块,人体体表的生物肌电信号经肌电采集器采集后转换为数字电压信号。关节活动度传感器例如可以是倾角传感器或角度传感器。
针对糖尿病预测模块进一步说明:糖尿病预测模块被配置为利用由传感器模块所采集到大量数据集,根据其所提取出的运动监测数据与自主行为能力之间的关系,来辨识用户运动糖尿病风险。对传感器模块所发送来的大量采集数据集进行分析,建立糖尿病预测模型,用以辨识用户运动糖尿病风险。
其中“运动监测数据”指的是实时所监测到的当前用户实施运动方案时的数据。“自主行为能力”指的是糖尿病预测模块对关于当前用户的大量数据进行评估后所输出的当前用户当前阶段下的独立完成的行为能力。自主行为能力用至少一个运动能力评估数据来表示,运动能力评估数据用以描述当前用户当前阶段下的可独立完成的行为能力程度,运动能力评估数据是根据用户历史运动监测数据例如动作时长、动作幅度或是动作频率中的至少一个数据来生成的。自主行为能力用于为辨识用户运动糖尿病风险提供对比依据,运动监测数据是用于描述当前用户在实施运动方案时的运动能力实时数据,基于运动监测数据与自主行为能力之间的关系,计算运动能力实时数据超出运动能力历史数据的负荷数据。再将所计算得到的负荷数据与预设负荷数据阈值进行比对,以此基于负荷数据能够对运动糖尿病风险进行预测。
即在未实施运动方案时就对用户的当前阶段下可独立完成的行为能力的程度进行评估,用于为辨识用户运动糖尿病风险提供对比依据,在监测获得用户运动能力的实时数据时,将实时数据与评估数据进行比对,并判断当前所实施的运动方案是否超出预设的控制条件,在判断确定运动方案超出预设的控制条件的情况下,可以动态地相应地调整运动方案中至少一个配置参数例如握力要求、力度要求、关节活动度要求等运动能力数据。
其中“糖尿病预测模型”用于描述运动监测数据与自主行为能力之间的关系,其预设有负荷数据阈值且根据用户操作来调整负荷数据阈值或是基于由糖尿病预测模块对大数据的分析来自动调整负荷数据阈值。
但是,在建立糖尿病预测模型时,由于由传感器模块所发送来的大量采集数据集的查找空间很大,导糖尿病预测模块评估数据的计算速度大大降低;并且,由传感器模块所发送来的采集数据集中许多数据与运动能力数据和/或糖尿病风险无关,因此需要花费额外的时间来学习剔除这些无关项,导致糖尿病预测模块评估数据的复杂度以及反馈时长增加。
针对上述现有技术之不足,优选地,根据机器学习筛选出的显著性特征来确定需提取的运动监测数据与自主行为能力之间的关系。在分析运动监测数据与自主行为能力之间的关系之前,剔除多个特征中的无关特征以确定与糖尿病风险相关性较高的显著性特征。
对糖尿病预测模块进一步说明:所述糖尿病预测模块先是通过其与其他智能电子设备进行信息交互的方式获取到大量糖尿病诊断病例样本,并根据机器学习筛选出运动方案中与糖尿病风险相关性较大的若干个显著性特征。其中,根据机器学习筛选出的显著性特征指的是通过将训练集输入如实施例1中基于特征权重的LARS糖尿病模型后所生成的输出集。
训练集指的是大量糖尿病诊断病例样本,各病例样本至少包括其运动方案数据例如久坐时长、运动强度、运动时间、运动时长、运动频率、运动类型、糖尿病风险变化趋势。例如针对某一病例样本其在某一时间段内采取的运动方案,根据实施运动方案前后的糖尿病风险指标变化确定糖尿病风险变化趋势,糖尿病风险指标例如是血糖峰值、心率峰值、血压峰值等。定义Lasso回归模型,输入若干运动方案数据作为待筛选特征(或称糖尿病数据集特征矩阵),确定糖尿病风险变化趋势为筛选目标(或称真实结果标签),采用基于特征权重的LARS算法对模型进行求解输出筛选出的显著性特征以及各自对应的回归系数值。
以此,通过采用在逼近速度和准确率上均高于标准LARS的基于特征权重的LARS算法,筛选出的显著性特征能够有效地剔除数据中与运动能力数据和/或糖尿病风险无关的无关项,能够降低糖尿病预测模型实时评估数据时的复杂度以及反馈时长。
基于所确定的显著性特征,所述糖尿病预测模块利用由传感器模块所采集到的数据集根据机器学习提取的运动监测数据与自主行为能力之间的关系来辨识用户运动糖尿病风险。
优选地,运动方案调整模块被配置为基于运动监测数据与自主行为能力之间的关系来动态地调整运动方案中的配置参数。
需要注意的是,上述具体实施例是示例性的,本领域技术人员可以在本发明公开内容的启发下想出各种解决方案,而这些解决方案也都属于本发明的公开范围并落入本发明的保护范围之内。本领域技术人员应该明白,本发明说明书及其附图均为说明性而并非构成对权利要求的限制。本发明的保护范围由权利要求及其等同物限定。
Claims (10)
1.一种基于特征权重的LARS糖尿病预测系统,其特征是,该系统包括:
存储设备;
基于特征权重的LARS糖尿病预测模块(1),其耦合至存储设备且被配置为:
计算自变量特征权重向量和原始相关度向量;
基于所述自变量特征权重向量和所述原始相关度向量,输出基于特征权重的LARS糖尿病模型的回归系数ω。
4.根据权利要求3所述的预测系统,其特征是,基于所述自变量特征权重向量和所述原始相关度向量的回归系数ω的输出是通过以下至少一个步骤来实现的:
计算角平分向量、回归系数向量、新相关度向量和最大相关度;
更新回归系数向量,评估值向量、残差向量和指标集;
判断残差向量的L2范数是否小于容忍度,若是则结束,否则重复以上步骤。
7.根据权利要求6所述的预测系统,其特征是,所述糖尿病预测模块(1)还被配置为归一化糖尿病数据集矩阵,初始化当前评估值向量和残差向量。
9.根据权利要求8所述的预测系统,其特征是,所述预测系统适用于高危糖尿病患者的康复运动风险管理,所述预测系统还包括传感器模块,其中,
所述糖尿病预测模块还被配置为利用由传感器模块所采集到的数据集根据机器学习筛选出的显著性特征以及提取出的运动监测数据与自主行为能力之间的关系来辨识用户运动糖尿病风险。
10.一种装置,该装置适用于高危糖尿病患者的康复运动风险管理,该装置包括:
至少一个处理器,
耦合至所述至少一个处理器的存储设备,
其特征是,
其中至少一个所述处理器被配置为:
利用由传感器模块所采集到的数据集根据机器学习筛选出的显著性特征以及提取出的运动监测数据与自主行为能力之间的关系来辨识用户运动糖尿病风险,和/或
基于所分析确定的运动监测数据与自主行为能力之间的关系以辨识运动糖尿病风险的方式来动态地调整运动方案中的配置参数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910340600.5A CN110060781A (zh) | 2019-04-25 | 2019-04-25 | 一种基于特征权重的lars糖尿病预测方法 |
CN2019103406005 | 2019-04-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111223569A true CN111223569A (zh) | 2020-06-02 |
CN111223569B CN111223569B (zh) | 2023-08-01 |
Family
ID=67320916
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910340600.5A Pending CN110060781A (zh) | 2019-04-18 | 2019-04-25 | 一种基于特征权重的lars糖尿病预测方法 |
CN202010205152.0A Active CN111223569B (zh) | 2019-04-25 | 2020-03-20 | 一种基于特征权重的lars糖尿病预测方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910340600.5A Pending CN110060781A (zh) | 2019-04-18 | 2019-04-25 | 一种基于特征权重的lars糖尿病预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN110060781A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111968748A (zh) * | 2020-08-21 | 2020-11-20 | 南通大学 | 一种糖尿病并发症预测模型的建模方法 |
CN112233802A (zh) * | 2020-09-03 | 2021-01-15 | 岭南师范学院 | 基于改进函数因果似然度的糖尿病危险因素因果发现方法 |
CN113470816A (zh) * | 2021-06-30 | 2021-10-01 | 中国人民解放军总医院第一医学中心 | 一种基于机器学习的糖尿病肾病预测方法、系统和预测装置 |
CN115938590A (zh) * | 2023-02-09 | 2023-04-07 | 四川大学华西医院 | 结直肠癌术后lars预测模型的构建方法及预测系统 |
CN117393171A (zh) * | 2023-12-11 | 2024-01-12 | 四川大学华西医院 | 直肠癌术后lars发展轨迹预测模型构建方法及系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020211592A1 (zh) * | 2019-04-18 | 2020-10-22 | 岭南师范学院 | 一种糖尿病风险预警系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102760182A (zh) * | 2012-05-31 | 2012-10-31 | 中国科学院自动化研究所 | 基于压缩感知技术的人口出行需求计算方法 |
CN103150611A (zh) * | 2013-03-08 | 2013-06-12 | 北京理工大学 | Ii型糖尿病发病概率分层预测方法 |
US20170329894A1 (en) * | 2008-11-17 | 2017-11-16 | Veracyte, Inc. | Algorithms for disease diagnostics |
CN107403072A (zh) * | 2017-08-07 | 2017-11-28 | 北京工业大学 | 一种基于机器学习的2型糖尿病预测预警方法 |
US20180025290A1 (en) * | 2016-07-22 | 2018-01-25 | Edwards Lifesciences Corporation | Predictive risk model optimization |
-
2019
- 2019-04-25 CN CN201910340600.5A patent/CN110060781A/zh active Pending
-
2020
- 2020-03-20 CN CN202010205152.0A patent/CN111223569B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170329894A1 (en) * | 2008-11-17 | 2017-11-16 | Veracyte, Inc. | Algorithms for disease diagnostics |
CN102760182A (zh) * | 2012-05-31 | 2012-10-31 | 中国科学院自动化研究所 | 基于压缩感知技术的人口出行需求计算方法 |
CN103150611A (zh) * | 2013-03-08 | 2013-06-12 | 北京理工大学 | Ii型糖尿病发病概率分层预测方法 |
US20180025290A1 (en) * | 2016-07-22 | 2018-01-25 | Edwards Lifesciences Corporation | Predictive risk model optimization |
CN107403072A (zh) * | 2017-08-07 | 2017-11-28 | 北京工业大学 | 一种基于机器学习的2型糖尿病预测预警方法 |
Non-Patent Citations (4)
Title |
---|
梁怀新等: "肿瘤参数属性偏序结构可视化实现乳腺癌诊断" * |
肖辉等: "基于随机森林算法和Logistic回归模型的糖尿病风险因素研究" * |
许欢: "基于最小角回归的时空监测方法" * |
马培灵等: "糖尿病患者实施运动疗法教育指导的效果观察" * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111968748A (zh) * | 2020-08-21 | 2020-11-20 | 南通大学 | 一种糖尿病并发症预测模型的建模方法 |
CN112233802A (zh) * | 2020-09-03 | 2021-01-15 | 岭南师范学院 | 基于改进函数因果似然度的糖尿病危险因素因果发现方法 |
CN113470816A (zh) * | 2021-06-30 | 2021-10-01 | 中国人民解放军总医院第一医学中心 | 一种基于机器学习的糖尿病肾病预测方法、系统和预测装置 |
CN115938590A (zh) * | 2023-02-09 | 2023-04-07 | 四川大学华西医院 | 结直肠癌术后lars预测模型的构建方法及预测系统 |
CN115938590B (zh) * | 2023-02-09 | 2023-05-02 | 四川大学华西医院 | 结直肠癌术后lars预测模型的构建方法及预测系统 |
CN117393171A (zh) * | 2023-12-11 | 2024-01-12 | 四川大学华西医院 | 直肠癌术后lars发展轨迹预测模型构建方法及系统 |
CN117393171B (zh) * | 2023-12-11 | 2024-02-20 | 四川大学华西医院 | 直肠癌术后lars发展轨迹预测模型构建方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110060781A (zh) | 2019-07-26 |
CN111223569B (zh) | 2023-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111223569A (zh) | 一种基于特征权重的lars糖尿病预测方法 | |
Islam et al. | Likelihood prediction of diabetes at early stage using data mining techniques | |
Alam et al. | A model for early prediction of diabetes | |
US11755121B2 (en) | Gesture information processing method and apparatus, electronic device, and storage medium | |
Panwar et al. | Rehab-net: Deep learning framework for arm movement classification using wearable sensors for stroke rehabilitation | |
Karan et al. | Diagnosing diabetes using neural networks on small mobile devices | |
Chowdhury et al. | An artificial neural network model for neonatal disease diagnosis | |
Basha et al. | A soft computing approach to provide recommendation on PIMA diabetes | |
Pourhomayoun et al. | Multiple model analytics for adverse event prediction in remote health monitoring systems | |
CN105787278A (zh) | 基于智能终端的大数据保健、精准医疗系统和方法 | |
WO2021217906A1 (zh) | 基于步态特征的体态检测方法、装置、设备及存储介质 | |
Paviglianiti et al. | VITAL-ECG: A de-bias algorithm embedded in a gender-immune device | |
Kirubakaran et al. | Echo state learned compositional pattern neural networks for the early diagnosis of cancer on the internet of medical things platform | |
Choubey et al. | GA_NN: An intelligent classification system for diabetes | |
Razfar et al. | An Artificial Intelligence model for smart post-stroke assessment using wearable sensors | |
WO2020211592A1 (zh) | 一种糖尿病风险预警系统 | |
US20240082098A1 (en) | Stroke rehabilitation therapy predictive analysis | |
Contreras et al. | A hybrid clustering prediction for type 1 diabetes aid: towards decision support systems based upon scenario profile analysis | |
JP2024513618A (ja) | 感染症及び敗血症の個別化された予測のための方法及びシステム | |
Gecili et al. | Functional data analysis and prediction tools for continuous glucose-monitoring studies | |
Güldoğan et al. | Performance evaluation of different artificial neural network models in the classification of type 2 diabetes mellitus | |
Lai et al. | Hypoglycaemia detection using fuzzy inference system with intelligent optimiser | |
Zhang et al. | Construction of Community Medical Communication Service and Rehabilitation Model for Elderly Patients under the Internet of Things | |
Madhuri et al. | Novel Internet of Things Based Disease Diagnosis Framework for Smart Healthcare Schemes using Combined Optimized Artificial Intelligence Approach | |
Fahim et al. | Diagnosis of diabetes using clinical features: an analysis based on machine learning techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |