CN113035352A - 基于bp神经网络的糖尿病视网膜病变预警方法 - Google Patents

基于bp神经网络的糖尿病视网膜病变预警方法 Download PDF

Info

Publication number
CN113035352A
CN113035352A CN202110461471.2A CN202110461471A CN113035352A CN 113035352 A CN113035352 A CN 113035352A CN 202110461471 A CN202110461471 A CN 202110461471A CN 113035352 A CN113035352 A CN 113035352A
Authority
CN
China
Prior art keywords
neural network
early warning
index
key
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110461471.2A
Other languages
English (en)
Other versions
CN113035352B (zh
Inventor
李培峦
李沛谕
闫金铃
仝利红
陈曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Science and Technology
Original Assignee
Henan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Science and Technology filed Critical Henan University of Science and Technology
Priority to CN202110461471.2A priority Critical patent/CN113035352B/zh
Publication of CN113035352A publication Critical patent/CN113035352A/zh
Application granted granted Critical
Publication of CN113035352B publication Critical patent/CN113035352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

基于BP神经网络的糖尿病视网膜病变预警方法,基于BP神经网络理论,建立一个新的糖尿病发病预警模型,它可以通过识别疾病的关键标志物的指标值来预警糖尿病的发病情况。本研究通过多次调节BP神经网络的函数与神经元参数,得到了训练效果最优、试验误差最低的网络模型,获取该网络状态下的权重矩阵,对各个医疗指标在传递过程中的权重数据做分层聚类分析,选取权重较高且聚类距离最近的分子模块作为疾病预警的关键标志物,既研究个体体征指标在疾病预警时的独立重要性,也关注了他们之间诱导疾病发生的协调相关性,在糖尿病并发症的研究中具有独特的优势。

Description

基于BP神经网络的糖尿病视网膜病变预警方法
技术领域
本发明涉及生物医学领域,具体说的是基于BP神经网络的糖尿病视网膜病变预警方法。
背景技术
截止到目前,糖尿病发展成为继心血管疾病、恶性肿瘤疾病之后的第三大慢性疾病,其中,糖尿病是一种临床上异质性的葡萄糖不耐受综合征,主要是由于自身免疫介导的选择性胰岛β细胞损伤导致的胰岛素缺乏和糖代谢紊乱为特征的代谢性疾病。人体内的血糖含量长期过高会给健康带来严重的风险,某些糖尿病患者会出现某种形式的视网膜病,这类并发症被称为糖尿病视网膜病变。而当前国内外针对糖尿病并发症的发病机制和预警研究相比1型糖尿病与2型糖尿病较为鲜见。既往针对糖尿病并发症的风险预警的研究通常依赖于大量的生化指标或基因序列的检测,而这需要较为繁琐的检测与诊断流程。,糖尿病视网膜病变作为糖尿病的微血管并发症,会导致视网膜进行性损害,也是当前全球主要致盲原因。但目前关于糖尿病视网膜病变的患病风险预警方面的研究还较少,因检测复杂及数据不准确,也没有一个很好的预测方法,实现糖尿病视网膜病变预警。
发明内容
为解决上述技术问题,本发明提供一种基于BP神经网络的糖尿病视网膜病变预警方法,基于BP神经网络理论,建立一个新的糖尿病发病预警模型,它可以通过识别疾病的关键标志物的指标值来预警糖尿病的发病情况。
为实现上述技术目的,所采用的技术方案是:基于BP神经网络的糖尿病视网膜病变预警方法,包括以下步骤:
步骤1、建立改进的BP神经网络模型
步骤1.1、以糖尿病患者的m个指标作为输入样本,以l个指标作为输出值,建立包括输入层、隐含层和输出层的基础BP神经网络,m个指标对应n个数据集样本,n个数据集样本按75%:25%的比例划分为训练集与测试集;
步骤1.2、利用训练集对基础BP神经网络进行训练,训练时通过节点传递函数、训练函数、网络学习函数以及性能分析函数对基础BP神经网络进行反馈调节,得到训练后的BP神经网络;
步骤1.3、利用测试集在输出层的训练值和测试集在输出层的实际值,检验步骤1.2得到的训练后的BP神经网络预测误差率G,当训练后的BP神经网络误差率G小于0.05时,此训练后的BP神经网络即为改进的BP神经网络模型,反之,重复步骤1.2;
步骤2、基于关键标志物的疾病预警
步骤2.1、根据改进的BP神经网络模型,记录每个指标在隐含层传递的权重占比Wij,选取权重占比排序前5%的指标作为高权重指标;
步骤2.2、对高权重指标做分层聚类分析,将高权重指标从所有指标中提取出来,作为关键标志物;
步骤2.3、构造预警指数EWI
Figure BDA0003042538850000021
其中
Figure BDA0003042538850000022
表示关键标志物中的每一个指标在n个数据集样本中的均值,SNt表示关键标志物的标准化分数的样本倾斜度,ρin为关键标志物内部成员的相关系数,ρout表示位于关键标志物内部的成员与其外部成员之间的相关性;
步骤2.4、将预警指数EWI与设定的预警指数进行实时比较,若低于或高于设定的预警指数,发出预警信号。
训练后的BP神经网络预测误差率G的计算方法是
Figure BDA0003042538850000023
Figure BDA0003042538850000024
Figure BDA0003042538850000025
其中,GEp表示第p个测试集在所有输出层节点的预测误差,p=1,2,…,m,GE表示m个测试集在所有输出层节点下的预测误差,Dk(yp)为测试集在输出层第k个节点的实际值,Ok(yp)为测试集在输出层第k个节点的训练值,yp表示测试集的样本数据。
以S型函数‘tansig’与‘logsig’作为节点传递函数,以动量反传的梯度下降算法‘trainlm’作为训练函数,以带动量项的函数‘learngdm’作为网络学习函数,以均方差MSE作为性能分析函数。
关键标志物中的每一个指标在n个数据集样本中的均值的计算方法为
Figure BDA0003042538850000031
Figure BDA0003042538850000032
其中,xtj表示关键标志物中第t个指标在第j个样本中的值,j=1,...,n,n为数据集样本个数。
关键标志物的标准化分数的样本倾斜度计算方法是
Figure BDA0003042538850000033
其中,ytj为关键标志物的指标数据xtj进行标准化后的数据。
关键标志物内部成员的相关系数ρin和位于关键标志物内部的成员与其外部成员之间的相关性ρout的计算方法为
Figure BDA0003042538850000034
Figure BDA0003042538850000035
其中,xtj表示关键标志物中第i个指标在第j个样本中的值,xaj表示关键标志物中第a个指标在第j个样本中的值,zbj表示非关键标志物中的第b个指标在第j个样本中的值,a≠t,j=1,...,n,n表示数据集样本个数,M和N分别表示关键标志物与非关键标志物的指标集合。
本发明有益效果是:本发明重点提出了一种基于BP神经网络的糖尿病视网膜病变预警方法,该算法中用到的BP神经网络处理复杂关系的能力很突出,在网络各层节点的传递过程中,网络权重扮演着很重要的角色。如何获得、分析并合理应用的各层单元之间的权重矩阵,也是本文的一个研究特色。本研究通过多次调节BP神经网络的函数与神经元参数,得到了训练效果最优、试验误差最低的网络模型,获取该网络状态下的权重矩阵,对各个医疗指标在传递过程中的权重数据做分层聚类分析,选取权重较高且聚类距离最近的分子模块作为疾病预警的关键标志物,既研究个体体征指标在疾病预警时的独立重要性,也关注了他们之间诱导疾病发生的协调相关性,在糖尿病并发症的研究中具有独特的优势。
附图说明
图1为本发明基于BP神经网络的预测值与实际值对比图;
图2为本发明基于BP神经网络的空腹血糖的相对预测误差率图;
图3为糖尿病视网膜病变的指标重要度识别三维曲面图;
图4为诱导糖尿病视网膜病变的关键标志物的探测排列图;
图5为关键标志物的内部相关性示意图;
图6为关键标志物与非关键标志物指标之间的相关性示意图;
图7为基于关键标志物对糖尿病视网膜病变的预警示意图。
具体实施方式
本发明基于BP神经网络理论,建立一个新的糖尿病发病预警模型,它可以通过识别疾病的关键标志物的指标值来预警糖尿病的发病情况。该方法优于其他的方法,它可以探测出影响糖尿病视网膜病变患病的关键标志物,在临床中我们只需要对关键标志物进行检测,并利用算法计算该关键标志物的风险预警值,进一步完善糖尿病并发症中的关键预警因素的识别,为疾病的科学诊断和治疗提供更多参考和依据。研究过程中使用来自于“国家人口健康科学数据中心数据仓储PHDA”的真实患者数据,并基于MATLAB语言进行模型训练与验证。
本方法主要有两部分组成:首先先通过改进的BP神经网络算法进行数据样本的训练,得到精准度最高的BP神经网络模型;然后,对影响糖尿病的因素权重做分层聚类分析,将高权重的一类指标从所有指标中提取出来,再结合斯皮尔曼相关系数研究高权重指标的内部相关性及其与低权重指标之间的相关性,来计算预警指数;最后通过标准化及去倾斜化处理得到强预警信号。
基于BP神经网络的糖尿病视网膜病变预警方法,包括以下步骤:
步骤1、建立改进的BP神经网络模型
步骤1.1、以糖尿病患者的m个指标作为输入样本,以l个指标作为输出值,建立包括输入层、隐含层和输出层的基础BP神经网络,m个指标对应n个数据集样本,n个数据集样本按75%:25%的比例划分为训练集与测试集;
步骤1.2、利用训练集对基础BP神经网络进行训练,训练时通过节点传递函数、训练函数、网络学习函数以及性能分析函数对基础BP神经网络进行反馈调节,得到训练后的BP神经网络;
步骤1.3、利用测试集在输出层的训练值和测试集在输出层的实际值,检验步骤1.2得到的训练后的BP神经网络预测误差率G,当训练后的BP神经网络误差率G小于0.05时,此训练后的BP神经网络即为改进的BP神经网络模型,反之,重复步骤1.2;
步骤2、基于关键标志物的疾病预警
步骤2.1、根据改进的BP神经网络模型,记录每个指标在隐含层传递的权重占比Wij,选取权重占比排序前5%的指标作为高权重指标;
步骤2.2、对高权重指标做分层聚类分析,将高权重指标从所有指标中提取出来,作为关键标志物;
步骤2.3、构造预警指数EWI
Figure BDA0003042538850000051
其中
Figure BDA0003042538850000052
表示关键标志物中的每一个指标在n个数据集样本中的均值,SNt表示关键标志物的标准化分数的样本倾斜度,ρin为关键标志物内部成员的相关系数,ρout表示位于关键标志物内部的成员与其外部成员之间的相关性;
步骤2.4、将预警指数EWI与设定的预警指数进行实时比较,若低于或高于设定的预警指数,发出预警信号。
1、改进的BP神经网络模型
BP神经网络可以用来研究糖尿病并发症患者的检测指标与患病风险的关系,尤其是当样本量或研究指标较多时,通过调节算法内部参数可以使模型的拟合效果达到最好,预警效果更加可靠。
以糖尿病患者的28个指标数据作为输入样本,以空腹血糖(GLU)作为输出值,具体包括3个层,即输入层、隐含层和输出层。输入参数设为xp(p=1,2,…,m),此时,m=28,输出参数为xq(q=1,2,…,l),l=1,28个指标对应n个数据集样本,n个数据集样本按75%:25%的比例划分为训练集与测试集,对xp做线性变换得到隐含层每个节点的输入HIi和输出HOi,变化如下
Figure BDA0003042538850000061
Figure BDA0003042538850000062
其中Wij为由输入层的第j个节点到达隐含层的第i个节点的连接权值;Wki为由隐含层的第i个节点到达输入层的第k个节点的连接权值;φ表示神经网络中的激励函数,在此选用Sigmoid函数,即
Figure BDA0003042538850000063
xj表示输入层的第j个节点的训练数据;θi为隐含层第i个节点的节点阈值。
在构建BP神经网络时,利用训练集对基础BP神经网络进行训练,我们用节点传递函数、训练函数、网络学习函数以及性能分析函数进行反馈调节,不同设置情况下网络预测误差最小,预测精度最高时的函数设置如下,以S型函数‘tansig’与‘logsig’作为节点传递函数,以动量反传的梯度下降算法‘trainlm’作为训练函数,以带动量项的函数‘learngdm’作为网络学习函数,以均方差MSE作为性能分析函数。
经过以上过程的训练与反馈调节,得到输出层节点的结果Ok如下
Figure BDA0003042538850000064
αk为输出层第k个节点的节点阈值,Ok为预测样本在输出层第k个节点的训练值,φ表示神经网络中的激励函数。令Dk(yp)为测试集在输出层第k个节点的实际值,利用预测误差GEp检验网络的预测精准率。
Figure BDA0003042538850000065
Figure BDA0003042538850000066
训练后的BP神经网络预测误差率G的计算方法为
Figure BDA0003042538850000071
其中,GEp表示第p个测试集在所有输出层节点的预测误差,p=1,2,…,m,GE表示m个测试集在所有输出层节点下的预测误差,Dk(yp)为测试集在输出层第k个节点的实际值,Ok(yp)为测试集在输出层第k个节点的训练值,yp表示测试集的样本数据。
2、基于关键标志物的疾病预警
经过BP神经网络对数据的多次训练,当模型误差率小于0.05时,即模型预测率达到95%,认为网络预测率达到标准。当网络预测率达到最优时,记录每个指标在隐含层传递的权重占比Wij,观察权重的三维曲面图,如图3,可以看出在研究指标中,曲线波动较大且数值较大,说明在糖尿病视网膜病变的患病预测中起着关键作用,选取权重占比排序5%的指标作为高权重指标。由于个体的特异性,不同个体疾病预警的关键标志物是不同的。该方法可适用于糖尿病视网膜病变的个体特异性诊断中,来探索影响个体发病的关键标志物。我们对高权重指标做分层聚类分析,将高权重的一类指标从所有指标中提取出来,作为关键标志物,再结合斯皮尔曼相关系数研究高权重指标的内部相关性及其与低权重指标之间的相关性,相关性研究根据如下公式:
Figure BDA0003042538850000072
Figure BDA0003042538850000073
其中,xtj表示关键标志物中第i个指标在第j个样本中的值,xaj表示关键标志物中第a个指标在第j个样本中的值,zbj表示非关键标志物中的第b个指标在第j个样本中的值,a≠t,j=1,...,n,n表示数据集样本个数,M和N分别表示关键标志物与非关键标志物的指标集合,由此得到了关键标志物的初步特征。ρin为关键标志物内部成员的相关系数,ρout表示位于关键标志物内部的成员与其外部成员之间的相关性,ρin的水平高低表示了患者在发病时体内关键标志物的相关程度,它的值越高说明关键标志物内部指标的相关性越强;ρout的水平高低表示患者的关键标志物与非关键标志物之间的相关性。
这类高权重指标则是我们研究的疾病预警的关键标志物。传统检验糖尿病的方式是通过单一的检测空腹静脉血糖与2H静脉血糖(OGTT),而关键标志物可以作为一个新的方法来系统的预警该类复杂疾病的发生。
为了得到疾病监测的强预警信号,我们构造了如下预警指数EWI:
Figure BDA0003042538850000081
其中
Figure BDA0003042538850000082
表示关键标志物中的每一个指标在n个样本中的均值,SNj表示关键标志物的标准化分数的样本倾斜度,ρin为关键标志物内部成员的相关系数,ρout表示位于关键标志物内部的成员与其外部成员之间的相关性。
(1)标准化处理:为消除不同指标数据之间的量纲影响,我们对关键标志物的指标数据xtj进行标准化,标准化后的数据为ytj,其中t表示关键标志物中第t个指标,t=1,…,k,标准化算法如下
Figure BDA0003042538850000083
其中n表示数据集中样本的个数。
(2)算术平均化:对标准化后的分数矩阵进行列平均化处理得到
Figure BDA0003042538850000086
即不同个体的综合指标指数,计算如下:
Figure BDA0003042538850000084
Figure BDA0003042538850000087
表示关键标志物中的第t个指标在n个数据集样本中的均值,即该指标在不同个体中的综合指数。
(3)去倾斜化处理:计算单一个体的关键标志物指标数据的数据倾斜度,这是增强预警指数对数据波动的敏感性的关键步骤,计算如下:
Figure BDA0003042538850000085
(4)EWI作为关键标志物的预警指数,可以在个体指标出现异常时呈现剧烈的波动,我们称之为强预警信号。当强预警信号发生时,关键标志物之间的相关系数值整体较高,且远高于关键标志物的内部指标与其他指标的相关系数,这个特点可以作为识别关键标志物的一个重要特征。同时,在利用关键标志物进行疾病预警时,EWI指数可以呈现出来比传统的检测指标更强烈的波动,并且会在个体体征数据出现异常时给出强预警信号。
将预警指数EWI与设定的预警指数进行实时比较,若低于或高于设定的预警指数,发出预警信号。
基于BP神经网络的糖尿病视网膜病变预警方法可内置于计算机硬件设备中进行运行使用,也可集成在手持设备中进行应用。
3、实验结果
数据来源于国家人口健康科学数据中心数据仓储(National Population HealthData Center,NPHDC)CSTR:A0006.11.A0005.202006.001018)。本方法的研究对象为200例患有糖尿病视网膜病变的患者,数据集中检测指标含有70个,其中前180例患者样本设为训练集,后20例患者设为测试集。据数据统计显示,其中男性125例,女性75例,通过排除缺失严重、噪声过强的数据指标,最终数据集中涉及到的疾病研究指标为68项,其中患者基本体格指标41项,实验室检测指标27项(血生化19项、血常规4项、凝血常规4项)。其中研究内容共包括糖化血红蛋白、血红蛋白、甘油三酯、总胆固醇、空腹血糖等28个指标,这是来自于糖尿病视网膜病变患者的医疗数据,共有200位患者的信息,每个患者的数据包含28条,共5600条检查数据作为数据集样本。28个指标作为输入样本,以1个空腹血糖(GLU)指标作为输出值,数据集样本按75%:25%的比例划分为训练集与测试集,网络的输出为GLU指标值。
由于数据集中存在少量缺失样本,我们利用K-近邻算法(k-Nearest Neighbor,KNN)对缺失数据进行插补,再对插补后的完整样本数据做最小-最大标准化处理,得到的数据集包含200个样本,每个样本均具有28个输入参数和一个输出参数。
该模型可以依据临床检测到的28个医疗指标数据来预测病人体内GLU的变化趋势,运用75%的数据对网络进行训练,当模型满足预设精度时,用剩下25%的数据来检验模型的性能,得到基于BP神经网络的预测值与实际值对比如图1。
图1呈现了200个医疗样本的空腹血糖的预测值和实际值,我们可以看出,图中实线与虚线接近重合,说明该模型可以很好的预测个体的GLU水平。图2显示了模型的预测误差水平,其相对误差率在0水平附近浮动,低于0.05的误差率,两幅图展现了相同的结果,该方法的数据拟合效果很好,且预测误差较低。
为了进一步探测影响糖尿病并发症(视网膜病变)发生的关键标志物,我们对神经网络传递层的权值矩阵进行深入研究,首先用三维曲面图来展示28个生化指标之间的权重关系,结果如图3所示。
图3中直方柱呈现出了各个指标在预测个体GLU曲线时的重要程度,是指标的单一重要性的展示,由图3可知,其中权重较高的生化指标有糖化血红蛋白(HBA1C)、总胆固醇(TC)、总蛋白(ALB),其中糖化血红蛋白是红细胞中的血红蛋白与血清中的糖类相结合的产物,也是通常用做控制糖尿病的检测指标;总胆固醇TC值是糖尿病视网膜病变(DR)的独立危险因素,有调查结果表明临床上可依据DR患者的的TC值,及时调整血脂指标水平,来预防DR的方式;血清总蛋白可以分为白蛋白和红蛋白,其具有运输多种代谢物并调节被运输物质的生理作用。但是糖尿病的发生并非是由单一因素引发的,而是由组成关键标志物的多个指标共同作用引发的,所以我们利用权重矩阵Wij进一步研究疾病预警的关键标志物。
利用分层聚类对28个指标的权重数据进行分析,将权重数据降序排列并计算不同指标之间的欧氏距离,并利用最短距离法生成聚类树,聚类距离位于前5%的组成一个新的模块。通过聚类分析将指标分成不同的类别,选取聚类分数最显著的一组指标为关键标志物组研究这些指标在糖尿病视网膜病变过程中的作用机制。
如图4所示,图4为分层聚类结果,纵坐标为生化指标权重之间的聚类距离,横坐标表示生化指标类别,聚类后的新模块包含7个因素,分别是糖化血红蛋白、血清尿酸、血红蛋白、谷丙转氨酶、谷氨酰胺转移酶、碱性磷酸酶、部分活化凝血酶原时间。其中糖化血红蛋白的水平变化能够影响糖尿病视网膜病变的动、静脉血氧饱和度,长期控制血糖可能延缓DR病变进展;血清尿酸是人体嘌呤类化合物分解代谢的最终产物,一定程度上反映了核算和其他嘌呤类化合物的代谢和分解的效率;血红蛋白是高等生物体内负责运载氧的一种蛋白质,它可以通过与血糖接触形成糖化血红蛋白,从而作为检测糖尿病的有效指标,在我们的关键标志物检测中也成功验证它的重要性;谷丙转氨酶也被发现在改善脂质代谢方面具有很好的效果,并且与谷草转氨酶(AST)水平具有协同作用;γ-谷氨酰胺转移酶是一类具有传递谷胱甘肽功能的氧化还原酶,它的水平升高可能是个体体内氧化应激的结果,可以用来提示氧自由基活性的存在给细胞带来的损失;血清碱性磷酸酶主要反映体内三大物质代谢功能是否正常,有研究表明骨特异性碱性磷酸酶(BAP)是反映骨代谢变化的重要指标,抗酒石酸酸性磷酸酶(BTRACP-5b)是反映破骨细胞活性和骨吸收的标记酶,故骨转换生化指标可作为预测糖尿病视网膜病变及其严重程度的参考;部分活化凝血酶原时间(activatedpartial thromboplastin time,APTT)是能够反映个体凝血功能的指标之一,高血糖可对凝血酶形成糖基化修饰,导致凝血机制激活,而APTT的缩短被认为是高凝状态的标志,有研究表明通过检测糖尿病患者凝血功能的变化,可以了解糖尿病视网膜病变与凝血活化状态之间的关系。以上有关糖尿病视网膜病变的重要指标都在关键标志物中被检测出来,糖尿病视网膜病变的引发主要由个体脂质代谢、细胞氧化还原、影响骨代谢和骨吸收以及细胞凝血功能等方面诱导的。
为了进一步验证关键标志物对疾病的预警作用,对被确定为关键标志物的指标做相关性分析,分别计算关键标志物内部指标及其与非标志物指标之间的spearman相关系数,结果如图5与图6所示。
图5展示了糖尿病视网膜病变的关键标志物内部的相关关系,图6展示了糖尿病视网膜病变的关键标志物与其他研究指标之间的相关关系,通过对比发现,图5中指标的相关系数值整体都更高,说明关键标志物之间具有更强的系统性和相关性,而图6中的spearman相关系数整体偏低,且波动幅度较小。由此我们得到关键标志物具有强相关性和强预警性的特点,在进行糖尿病视网膜病变的预警时,我们可以将重心放到对关键标志物的检测和研究上,这样既可以节省医疗成本,同时也可以得到高于其他指标的强预警信号,这对糖尿病视网膜病变(并发症)的预警来说是一个新的成本较低的方法。
图7分别展示了基于GLU数据与基于关键标志物复合指数的预警曲线,其中红色为200个患者的GLU波动曲线,若以传统的个体空腹血糖值来检测糖尿病并发症的出现,曲线波动趋势较小,也无法对疾病的发生起到很好的预警作用,只能当疾病发生后才能检测出异常情况,而基于关键标志物的复合指数来研究疾病的预警,在个体的医疗检测阶段会呈现强烈的波动,正如图中的蓝色曲线,图中有6个强波动信号,强波动信号表明对应个体样本的体征呈现异常,也就是基于这个数据集的糖尿病视网膜病变的即将到来。关键标志物具有比其他指标更强的敏感性,并且它并非是从单一角度进行预警,而是综合个体脂质代谢、细胞氧化还原、影响骨代谢和骨吸收以及细胞凝血功能等多个方面对疾病的发生传递预警信号。通过该预警信号与设定的预警指数进行实时比较,若低于或高于设定的预警指数,发出预警信号。

Claims (6)

1.基于BP神经网络的糖尿病视网膜病变预警方法,其特征在于,包括以下步骤:
步骤1、建立改进的BP神经网络模型
步骤1.1、以糖尿病患者的m个指标作为输入样本,以l个指标作为输出值,建立包括输入层、隐含层和输出层的基础BP神经网络,m个指标对应n个数据集样本,n个数据集样本按75%:25%的比例划分为训练集与测试集;
步骤1.2、利用训练集对基础BP神经网络进行训练,训练时通过节点传递函数、训练函数、网络学习函数以及性能分析函数对基础BP神经网络进行反馈调节,得到训练后的BP神经网络;
步骤1.3、利用测试集在输出层的训练值和测试集在输出层的实际值,检验步骤1.2得到的训练后的BP神经网络预测误差率G,当训练后的BP神经网络误差率G小于0.05时,此训练后的BP神经网络即为改进的BP神经网络模型,反之,重复步骤1.2;
步骤2、基于关键标志物的疾病预警
步骤2.1、根据改进的BP神经网络模型,记录每个指标在隐含层传递的权重占比Wij,选取权重占比排序前5%的指标作为高权重指标;
步骤2.2、对高权重指标做分层聚类分析,将高权重指标从所有指标中提取出来,作为关键标志物;
步骤2.3、构造预警指数EWI
Figure FDA0003042538840000011
其中
Figure FDA0003042538840000012
表示关键标志物中的每一个指标在n个数据集样本中的均值,SNt表示关键标志物的标准化分数的样本倾斜度,ρin为关键标志物内部成员的相关系数,ρout表示位于关键标志物内部的成员与其外部成员之间的相关性;
步骤2.4、将预警指数EWI与设定的预警指数进行实时比较,若低于或高于设定的预警指数,发出预警信号。
2.如权利要求1所述的基于BP神经网络的糖尿病视网膜病变预警方法,其特征在于:训练后的BP神经网络预测误差率G的计算方法是
Figure FDA0003042538840000013
Figure FDA0003042538840000021
Figure FDA0003042538840000022
其中,GEp表示第p个测试集在所有输出层节点的预测误差,p=1,2,…,m,GE表示m个测试集在所有输出层节点下的预测误差,Dk(yp)为测试集在输出层第k个节点的实际值,Ok(yp)为测试集在输出层第k个节点的训练值,yp表示测试集的样本数据。
3.如权利要求1所述的基于BP神经网络的糖尿病视网膜病变预警方法,其特征在于:以S型函数‘tansig’与‘logsig’作为节点传递函数,以动量反传的梯度下降算法‘trainlm’作为训练函数,以带动量项的函数‘learngdm’作为网络学习函数,以均方差MSE作为性能分析函数。
4.如权利要求1所述的基于BP神经网络的糖尿病视网膜病变预警方法,其特征在于:关键标志物中的每一个指标在n个数据集样本中的均值的计算方法为
Figure FDA0003042538840000023
Figure FDA0003042538840000024
其中,xtj表示关键标志物中第t个指标在第j个样本中的值,j=1,…,n,n为数据集样本个数。
5.如权利要求4所述的基于BP神经网络的糖尿病视网膜病变预警方法,其特征在于:关键标志物的标准化分数的样本倾斜度计算方法是
Figure FDA0003042538840000025
其中,ytj为关键标志物的指标数据xtj进行标准化后的数据。
6.如权利要求1所述的基于BP神经网络的糖尿病视网膜病变预警方法,其特征在于:关键标志物内部成员的相关系数ρin和位于关键标志物内部的成员与其外部成员之间的相关性ρout的计算方法为
Figure FDA0003042538840000031
Figure FDA0003042538840000032
其中,xtj表示关键标志物中第i个指标在第j个样本中的值,xaj表示关键标志物中第a个指标在第j个样本中的值,zbj表示非关键标志物中的第b个指标在第j个样本中的值,a≠t,j=1,…,n,n表示数据集样本个数,M和N分别表示关键标志物与非关键标志物的指标集合。
CN202110461471.2A 2021-04-27 2021-04-27 基于bp神经网络的糖尿病视网膜病变预警方法 Active CN113035352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110461471.2A CN113035352B (zh) 2021-04-27 2021-04-27 基于bp神经网络的糖尿病视网膜病变预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110461471.2A CN113035352B (zh) 2021-04-27 2021-04-27 基于bp神经网络的糖尿病视网膜病变预警方法

Publications (2)

Publication Number Publication Date
CN113035352A true CN113035352A (zh) 2021-06-25
CN113035352B CN113035352B (zh) 2022-06-21

Family

ID=76454713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110461471.2A Active CN113035352B (zh) 2021-04-27 2021-04-27 基于bp神经网络的糖尿病视网膜病变预警方法

Country Status (1)

Country Link
CN (1) CN113035352B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116884598A (zh) * 2023-06-28 2023-10-13 曜立科技(北京)有限公司 一种基于元数据的心脑血管疾病筛查辅助系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130345175A1 (en) * 2012-06-11 2013-12-26 Preventage Healthcare, Llc Methods for Improving Diabetes Management
CN106709225A (zh) * 2015-11-12 2017-05-24 中国移动通信集团公司 一种糖尿病视网膜病变的预警方法、装置及系统
CN107645545A (zh) * 2017-09-04 2018-01-30 济宁学院 一种基于云平台的病毒监测预警系统
CN107910067A (zh) * 2017-11-18 2018-04-13 中南大学湘雅医院 一种儿科病情早期预警方法及终端
CN108364694A (zh) * 2018-03-09 2018-08-03 中华人民共和国陕西出入境检验检疫局 基于多数据源大数据的机场疾病预警及防控系统构建方法
CN108717869A (zh) * 2018-05-03 2018-10-30 中国石油大学(华东) 基于卷积神经网络的糖尿病视网膜并发症诊断辅助系统
CN109171756A (zh) * 2018-06-18 2019-01-11 广州普麦健康咨询有限公司 基于深度置信网络模型的糖尿病指标预测方法及其系统
CN109545385A (zh) * 2018-11-30 2019-03-29 周立广 一种基于物联网的医疗大数据分析处理系统及其方法
CN110163616A (zh) * 2019-05-27 2019-08-23 河南科技大学 一种基于bp神经网络的移动支付风险预警方法
WO2019196286A1 (zh) * 2018-04-11 2019-10-17 平安科技(深圳)有限公司 疾病预测方法及装置、计算机装置及可读存储介质
CN110808093A (zh) * 2019-09-16 2020-02-18 中山大学孙逸仙纪念医院 一种放射性脑病临床预后的预测模型及其构建方法
CN110993096A (zh) * 2019-11-27 2020-04-10 医惠科技有限公司 一种脓毒血症的预警装置、设备及存储介质
CN112037917A (zh) * 2020-09-14 2020-12-04 白银市第一人民医院 一种基于精准健康管理的心脑血管疾病风险预警方法及系统
CN112185566A (zh) * 2020-10-14 2021-01-05 上海玺翎智能科技有限公司 一种基于机器学习预测预警感染性疾病就医人数突增的方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130345175A1 (en) * 2012-06-11 2013-12-26 Preventage Healthcare, Llc Methods for Improving Diabetes Management
CN106709225A (zh) * 2015-11-12 2017-05-24 中国移动通信集团公司 一种糖尿病视网膜病变的预警方法、装置及系统
CN107645545A (zh) * 2017-09-04 2018-01-30 济宁学院 一种基于云平台的病毒监测预警系统
CN107910067A (zh) * 2017-11-18 2018-04-13 中南大学湘雅医院 一种儿科病情早期预警方法及终端
CN108364694A (zh) * 2018-03-09 2018-08-03 中华人民共和国陕西出入境检验检疫局 基于多数据源大数据的机场疾病预警及防控系统构建方法
WO2019196286A1 (zh) * 2018-04-11 2019-10-17 平安科技(深圳)有限公司 疾病预测方法及装置、计算机装置及可读存储介质
CN108717869A (zh) * 2018-05-03 2018-10-30 中国石油大学(华东) 基于卷积神经网络的糖尿病视网膜并发症诊断辅助系统
CN109171756A (zh) * 2018-06-18 2019-01-11 广州普麦健康咨询有限公司 基于深度置信网络模型的糖尿病指标预测方法及其系统
CN109545385A (zh) * 2018-11-30 2019-03-29 周立广 一种基于物联网的医疗大数据分析处理系统及其方法
CN110163616A (zh) * 2019-05-27 2019-08-23 河南科技大学 一种基于bp神经网络的移动支付风险预警方法
CN110808093A (zh) * 2019-09-16 2020-02-18 中山大学孙逸仙纪念医院 一种放射性脑病临床预后的预测模型及其构建方法
CN110993096A (zh) * 2019-11-27 2020-04-10 医惠科技有限公司 一种脓毒血症的预警装置、设备及存储介质
CN112037917A (zh) * 2020-09-14 2020-12-04 白银市第一人民医院 一种基于精准健康管理的心脑血管疾病风险预警方法及系统
CN112185566A (zh) * 2020-10-14 2021-01-05 上海玺翎智能科技有限公司 一种基于机器学习预测预警感染性疾病就医人数突增的方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
PAWALAI KRAIPEERAPUN: "Using stacked generalization and complementary neural networks to predict Parkinson"s disease", 《IEEE XPLORE》, 11 January 2016 (2016-01-11) *
乔国厚: "煤矿安全风险综合评价与预警管理模式研究", 《中国博士学位论文全文数据库 工程科技Ⅰ辑》, 15 May 2014 (2014-05-15) *
刘祎洋: "面向健康评估的疾病风险自动预警技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 9, 15 September 2014 (2014-09-15) *
王天罡等: "可解释的层次注意力机制网络危重症预警", 《计算机工程与应用》, no. 5, 15 March 2021 (2021-03-15) *
祝姗姗等: "基于动态网络生物标志物的甲流疫情早期预警算法研究", 《病毒学报》, vol. 34, no. 1, 31 January 2018 (2018-01-31) *
范子琨: "支持多源大数据的机器学习云平台", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》, no. 2, 15 February 2019 (2019-02-15) *
陈德华等: "基于改进神经网络的糖尿病生化指标值预测", 《微型机与应用》, no. 05, 31 May 2017 (2017-05-31) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116884598A (zh) * 2023-06-28 2023-10-13 曜立科技(北京)有限公司 一种基于元数据的心脑血管疾病筛查辅助系统
CN116884598B (zh) * 2023-06-28 2024-05-28 曜立科技(北京)有限公司 一种基于元数据的心脑血管疾病筛查辅助系统

Also Published As

Publication number Publication date
CN113035352B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
Kumar et al. Performance analysis of machine learning algorithms on diabetes dataset using big data analytics
Tonyushkina et al. Glucose meters: a review of technical challenges to obtaining accurate results
EP2510116A2 (en) Biomarker assay for diagnosis and classification of cardiovascular disease
Zhang et al. Construction of an integral formula of biological age for a healthy Chinese population using principle component analysis
Tang et al. Association and predictive value analysis for resting heart rate and diabetes mellitus on cardiovascular autonomic neuropathy in general population
CN113035352B (zh) 基于bp神经网络的糖尿病视网膜病变预警方法
CN112466402A (zh) 一种使用血液标志物预测年龄的方法
CN116403714B (zh) 脑卒中end风险预测模型建立方法、装置、end风险预测系统、电子设备及介质
CN114974585A (zh) 一种妊娠期代谢综合征早期风险预测评估模型构建方法
Zigarelli et al. Machine-aided self-diagnostic prediction models for polycystic ovary syndrome: observational study
Erdős et al. Personalized computational model quantifies heterogeneity in postprandial responses to oral glucose challenge
Murthy et al. Comparative Analysis on Diabetes Dataset Using Machine Learning Algorithms
CN111883258B (zh) 一种构建ohss分度分型预测模型的方法
CN117198532A (zh) 一种基于机器学习的icu患者脓毒症风险预测方法及系统
Borecki et al. ABO associations with blood pressure, serum lipids and lipoproteins, and anthropometric measures
Cai et al. A Prediction Model Based on Noninvasive Indicators to Predict the 8‐Year Incidence of Type 2 Diabetes in Patients with Nonalcoholic Fatty Liver Disease: A Population‐Based Retrospective Cohort Study
Nedergaard et al. Features characterising cardiac autonomic neuropathy in diabetes using ensembled classification
Sang et al. Study on survival prediction of patients with heart failure based on support vector machine algorithm
Radha Hybrid prediction model for the risk of cardiovascular disease in type-2 diabetic patients
CN112485162A (zh) 一种使用血液标志物预测性别的方法
Hitt et al. Factors affecting hemoglobin A1C in the diagnosis of diabetes and prediabetes in youth
CN107610780B (zh) 一种生理信息数据的分析评价系统及方法
KR20220075700A (ko) gPRS를 이용한 제2형 당뇨질환 예측 시스템
Li et al. Identification of Key Biomarkers for Early Warning of Diabetic Retinopathy Using BP Neural Network Algorithm and Hierarchical Clustering Analysis
KR20200078180A (ko) 산화적 스트레스 수준을 측정하는 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant