CN116313080A - 一种基于迁移学习的葡萄糖浓度预测方法及设备 - Google Patents

一种基于迁移学习的葡萄糖浓度预测方法及设备 Download PDF

Info

Publication number
CN116313080A
CN116313080A CN202310186916.XA CN202310186916A CN116313080A CN 116313080 A CN116313080 A CN 116313080A CN 202310186916 A CN202310186916 A CN 202310186916A CN 116313080 A CN116313080 A CN 116313080A
Authority
CN
China
Prior art keywords
data
glucose concentration
domain data
target domain
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310186916.XA
Other languages
English (en)
Inventor
张笑宇
闵钰春
曹开放
刘思行
杨丹丹
吴昌平
徐鹤
季一木
刘尚东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Yuekai Biotechnology Co ltd
Zhejiang Poctech Corp
Jiangsu Yuyue Kailite Biotechnology Co ltd
Nanjing University of Posts and Telecommunications
Original Assignee
Jiangsu Yuekai Biotechnology Co ltd
Zhejiang Poctech Corp
Jiangsu Yuyue Kailite Biotechnology Co ltd
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Yuekai Biotechnology Co ltd, Zhejiang Poctech Corp, Jiangsu Yuyue Kailite Biotechnology Co ltd, Nanjing University of Posts and Telecommunications filed Critical Jiangsu Yuekai Biotechnology Co ltd
Publication of CN116313080A publication Critical patent/CN116313080A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Computational Linguistics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Toxicology (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于迁移学习的葡萄糖浓度预测方法及设备,属于模型预测技术领域,用于解决现有的不同医疗机构之间葡萄糖浓度预测模型难以互相复用,样本分布少的医疗机构难以准确根据现有的葡萄糖浓度预测模型,进行准确预测的技术问题。方法包括:基于数据集的特征数据以及标签数据,对第一数据集以及第二数据集分别进行数据重组,得到源域数据以及目标域数据;基于预设ELM网络模型的输出权重,并根据源域数据中训练样本的损失特征,得到优化目标函数;对目标域数据进行迁移重构学习,得到域适应迁移算法DAELM模型;通过域适应迁移算法DAELM模型,对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果。

Description

一种基于迁移学习的葡萄糖浓度预测方法及设备
技术领域
本申请涉及模型预测领域,尤其涉及一种基于迁移学习的葡萄糖浓度预测方法及设备。
背景技术
糖尿病是一种由遗传和生活方式共同作用而引起的临床综合症,已成为严重威胁人类健康的四大疾病之一。对糖尿病的治疗最重要的是经常进行血糖测定,以血糖浓度为依据通过饮食、口服药物或胰岛素注射等进行血糖控制。只依赖血糖采集无法实时地监测血糖浓度变化,而近几年出现的持续葡萄糖监测(Continuous Glucose Monitoring,CGM)设备能够提供的连续、全面、可靠的全天血糖数据。它通过葡萄糖感应器监测皮下组织间的葡萄糖浓度,以此来反应血糖的浓度。血糖的预测值可以帮助病人获得更加精准的治疗,从而更准确地控制病人的血糖浓度。其中,空腹血糖值、餐后2小时血糖值对于血糖浓度的控制具有极大的参考意义。
现代的智能诊断系统已经可以帮助医生准确全面地分析处理和管理大量的病人数据,而随着现代计算机技术的发展成熟,研究人员正在为了高效的治疗追求更加精确的糖尿病分类和血糖检测技术,同时不同医疗机构之间葡萄糖浓度预测模型的复用,往往容易造成样本的不足,并且医疗机构间样本分布的差异过大,现有的葡萄糖浓度预测模型,让样品量少的医院无法更好地应用葡萄糖浓度预测模型,造成了预测结果的不准确。
发明内容
本申请实施例提供了一种基于迁移学习的葡萄糖浓度预测方法及设备,用于解决如下技术问题:现有的不同医疗机构之间葡萄糖浓度预测模型难以互相复用,以及样本分布少的医疗机构难以准确根据现有的葡萄糖浓度预测模型,准确预测出葡萄糖浓度。
本申请实施例采用下述技术方案:
一方面,本申请实施例提供了一种基于迁移学习的葡萄糖浓度预测方法,包括:对第一医院以及第二医院分别进行葡萄糖浓度样本的数据获取,得到第一数据集以及第二数据集;基于数据集的特征数据以及标签数据,对所述第一数据集以及第二数据集分别进行数据重组,得到与第一数据集对应的源域数据以及与第二数据集对应的目标域数据;其中,所述源域数据以及所述目标域数据均包含训练样本与测试样本;基于预设ELM网络模型的输出权重,并根据所述源域数据中训练样本的损失特征,得到关于所述输出权重的优化目标函数;根据所述优化目标函数,对所述目标域数据进行迁移重构学习,得到域适应迁移算法DAELM模型;通过所述域适应迁移算法DAELM模型,对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果;并对所述预测结果进行评估,得到评估指标。
本申请实施例通过训练后的DAELM模型进行目标域数据中葡萄糖浓度的预测,实现了以小样本训练预测精度较高的模型,大大减少了样本的标记成本,同时,基于迁移学习将迁移算法引入葡糖糖浓度预测领域,可以有效地实现不同医疗机构之间葡萄糖浓度预测模型的复用,解决样本不足的问题,降低医疗机构间样本分布的差异,优化原有的葡萄糖浓度预测模型,让数据库样本较小的医院也能够应用或更好地应用葡萄糖浓度预测模型。
在一种可行的实施方式中,基于数据集的特征数据以及标签数据,对所述第一数据集以及第二数据集分别进行数据重组,得到与第一数据集对应的源域数据以及与第二数据集对应的目标域数据,具体包括:获取第一医院所对应的第一数据集以及第二医院所对应的第二数据集;其中,所述第一数据集中的葡萄糖浓度样本数量要远大于所述第二数据集中的葡萄糖浓度样本数量;对所述第一数据集与所述第二数据集进行错误数据的剔除,并基于所述第一数据集与所述第二数据集中包含的特征数据以及标签数据的分组原则,对所述第一数据集与所述第二数据集分别进行数据重组,得所述源域数据与所述目标域数据;其中,所述源域数据与所述目标域数据为ELM网络训练模型的特征数据。
在一种可行的实施方式中,在基于预设ELM网络模型的输出权重,并根据所述源域数据中训练样本的损失特征,得到关于所述输出权重的优化目标函数之前,所述方法还包括:根据H(x)=[h1(x),...,hL(x)],得到所述ELM网络模型的隐藏层H(x);其中,L为ELM网络模型的隐藏单元数量,hi(x)是第i个隐藏层节点的输出;根据
Figure BDA0004104218970000038
得到所述ELM网络模型的前馈神经网络输出fL(x);其中,β=[β1,...,βL]T是第i个隐藏层和输出之间的权重向量,i为常数,输出权重β;根据/>
Figure BDA0004104218970000032
得到权重向量β的极限目标函数/>
Figure BDA0004104218970000033
其中,N为样本中训练集数据的数量,d2代表输出数据的维度,C是模型的惩罚参数,yi-Hβ是第i个训练样本的预测误差,标签数据/>
Figure BDA0004104218970000039
Figure BDA0004104218970000034
Figure BDA0004104218970000035
为避免参数过拟合的正则项;根据
Figure BDA0004104218970000036
得到所述ELM网络模型的逆矩阵输出权重β*;其中,IL和IN分别表示维度为N和L的单位矩阵,HT为ELM非线性映射的转置矩阵。
在一种可行的实施方式中,在得到所述ELM网络模型的隐藏层H(x)之后,所述方法还包括:根据
Figure BDA0004104218970000037
得到激活函数g(x);其中,x为特征数据的输入向量,e为数学常数;根据hi(x)=g(wi,bi,x)=g(wix+bi),得到隐藏层节点的第i个输出hi(x);其中,bi是隐藏层中第i个节点的偏差,g(wi,bi,x)是隐藏层的激活函数且由sigmoid函数组成。
在一种可行的实施方式中,在得到所述ELM网络模型的逆矩阵输出权重β*之后,所述方法还包括:根据
Figure BDA0004104218970000041
得到约束目标函数
Figure BDA0004104218970000042
其中,N为样本中训练集数据的数量,d2代表输出数据的维度,C是模型的惩罚参数,标签数据/>
Figure BDA0004104218970000043
输出权重β,H为隐藏层的矩阵;根据
Figure BDA0004104218970000044
得到重构后ELM网络模型的输出权重β;其中,IL和IN分别表示维度为N和L的单位矩阵,HT为ELM非线性映射的转置矩阵,C为惩罚系数。
在一种可行的实施方式中,基于预设ELM网络模型的输出权重,并根据所述源域数据中训练样本的损失特征,得到关于所述输出权重的优化目标函数,具体包括:根据
Figure BDA0004104218970000045
得到优化权重/>
Figure BDA0004104218970000046
其中,IL和IN分别表示维度为N和L的单位矩阵,HT为ELM非线性映射的转置矩阵,C为对角矩阵且其对角元素分别为C1,C2,...CN,λ和γ分别表示联合分布匹配正则项和流形正则项的平衡系数,Mm为边缘MMD矩阵,Mc为条件MMD矩阵,G表示目标域数据的拉普拉斯举证,/>
Figure BDA0004104218970000047
表示源域数据和目标域数据的隐藏层特征矩阵,Ns和Nt分别为源域数据中训练样本数和目标域数据中的训练样本数,标签数据
Figure BDA0004104218970000048
d2代表输出数据的维度,HT为隐藏层特征矩阵的转置矩阵;根据/>
Figure BDA0004104218970000049
,得到关于所述输出权重的优化目标函数lDAELM;其中,tr(·)为矩阵的迹,yj为标签数据,βT为优化权重/>
Figure BDA00041042189700000410
的权重转置矩阵,β为优化权重/>
Figure BDA00041042189700000411
的一个权重解,Y为标签数据的一个中间量,/>
Figure BDA00041042189700000412
为源域数据的分类损失,/>
Figure BDA0004104218970000051
为目标域数据的流形正则损失,/>
Figure BDA0004104218970000052
为联合概率分布差异损失,λ为流形正则损失中间量,γ联合概率分布差异损失中间量。
在一种可行的实施方式中,在得到优化权重
Figure BDA0004104218970000053
之前,所述方法还包括:根据
Figure BDA0004104218970000054
得到梯度函数
Figure BDA0004104218970000055
其中,βT为优化权重/>
Figure BDA0004104218970000056
的权重转置矩阵,λ为流形正则损失中间量,γ联合概率分布差异损失中间量,C为对角矩阵,HT为隐藏层特征矩阵的转置矩阵,β为优化权重/>
Figure BDA0004104218970000057
的一个权重解,G表示目标域数据的拉普拉斯举证,Mm为边缘MMD矩阵,Mc为条件MMD矩阵,
Figure BDA0004104218970000058
表示源域数据和目标域数据的隐藏层特征矩阵,Ns和Nt分别为源域数据中训练样本数和目标域数据中的训练样本数,yj为标签数据。
在一种可行的实施方式中,通过所述域适应迁移算法DAELM模型,对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果,具体包括:根据
Figure BDA0004104218970000059
得到标准目标域数据x′;其中,x是未经标准化处理的目标域数据,σ是根据源域数据与目标域数据之间的差异所得到的标准差;将所述标准目标域数据x′输入到训练后的域适应迁移算法DAELM模型中;通过所述训练后的域适应迁移算法DAELM模型,将所述源域数据的数据特征进行迁移重构至所述标准目标域数据的数据特征中;并对所述标准目标域数据的数据特征进行葡萄糖浓度预测,得到所述预测结果;其中,所述预测结果为预测葡萄糖浓度。
在一种可行的实施方式中,在对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果之后,所述方法还包括:根据
Figure BDA00041042189700000510
得到所述评估指标RMSE;其中,/>
Figure BDA00041042189700000511
表示标准目标域数据中的真实葡萄糖浓度数据,yi为基于域适应迁移算法DAELM模型的预测葡萄糖浓度,k表示目标域数据中测试样本包含样本个数,i表示常数。
另一方面,本申请实施例还提供了一种基于迁移学习的葡萄糖浓度预测设备,其特征在于,所述设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有能够被所述至少一个处理器执行的指令,以使所述至少一个处理器能够执行上述任一实施例所述的一种基于迁移学习的葡萄糖浓度预测方法。
本申请提供了一种基于迁移学习的葡萄糖浓度预测方法及设备,通过训练后的DAELM模型进行目标域数据中葡萄糖浓度的预测,实现了以小样本训练预测精度较高的模型,大大减少了样本的标记成本,同时,基于迁移学习将迁移算法引入葡糖糖浓度预测领域,可以有效地实现不同医疗机构之间葡萄糖浓度预测模型的复用,解决样本不足的问题,降低医疗机构间样本分布的差异,优化原有的葡萄糖浓度预测模型,让数据库样本较小的医院也能够应用或更好地应用葡萄糖浓度预测模型。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本申请实施例提供的一种基于迁移学习的葡萄糖浓度预测方法流程图;
图2为本申请实施例提供的一种葡萄糖浓度预测的整体设计流程图;
图3为本申请实施例提供的一种基于迁移学习的葡萄糖浓度预测设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请实施例提供了一种基于迁移学习的葡萄糖浓度预测方法,如图1所示,基于迁移学习的葡萄糖浓度预测方法具体包括步骤S101-S105:
S101、对第一医院以及第二医院分别进行葡萄糖浓度样本的数据获取,得到第一数据集以及第二数据集。
作为一种可行的实施方式,对第一医院以及第二医院的内部数据库中的葡萄糖浓度数据分别进行获取,其中,第一医院为大型的医疗机构,就有较多的葡萄糖浓度样本数据,而第二医院为小型的医疗机构,具有较少的葡萄糖样本数据,然后分别对其内部数据库进行数据集的采集,分别得到第一数据集以及第二数据集,第一数据集与第二数据集均包含用于模型学习的训练样本以及测试样本。
S102、基于数据集的特征数据以及标签数据,对第一数据集以及第二数据集分别进行数据重组,得到与第一数据集对应的源域数据以及与第二数据集对应的目标域数据。其中,源域数据以及目标域数据均包含训练样本与测试样本。
具体地,获取第一医院所对应的第一数据集以及第二医院所对应的第二数据集。其中,第一数据集中的葡萄糖浓度样本数量要远大于第二数据集中的葡萄糖浓度样本数量。
进一步地,对第一数据集与第二数据集进行错误数据的剔除,并基于第一数据集与第二数据集中包含的特征数据以及标签数据的分组原则,对第一数据集与第二数据集分别进行数据重组,得到源域数据与目标域数据。其中,源域数据与目标域数据为ELM网络训练模型的特征数据。
在一个实施例中,源域A医院(第一医院)的葡萄糖浓度数据集和目标域B医院(第二医院)的葡萄糖浓度数据集进行获取,按照源域数据大于目标域数据的原则进行葡萄糖浓度数据的测量,将从第一数据集和第二数据集所获取的源域数据和目标域数据进行处理:首先进行数据清洗,将错误数据的剔除,其次进行组合操作,按照第一数据集与第二数据集中的特征数据和标签数据分别组合的原则进行数据重组,得到重组后的源域数据与目标域数据以确定后续所得DAELM模型的特征数据。
S103、基于预设ELM网络模型的输出权重,并根据源域数据中训练样本的损失特征,得到关于输出权重的优化目标函数。
具体地,根据H(x)=[h1(x),...,hL(x)],得到ELM网络模型的隐藏层H(x)。其中,L为ELM网络模型的隐藏单元数量,hi(x)是第i个隐藏层节点的输出。
作为一种可行的实施方式,ELM网络模型由一个输入层,一个隐含层和一个输出层构成。第一数据集中的训练样本
Figure BDA0004104218970000081
与其标签/>
Figure BDA0004104218970000082
其中N为样本中训练集数据的数量,d1和d2分别代表输入和输出数据的维度,连接隐藏层中第i个输出节点和输入节点的权重向量wi∈RN×L是随即设置的,其中L为ELM算法网络隐藏单元数量,然后对ELM网络模型的隐藏层H(x)进行计算。
其中,在得到ELM网络模型的隐藏层H(x)之后,根据
Figure BDA0004104218970000083
得到激活函数g(x)。其中,x为特征数据的输入向量,e为数学常数。根据hi(x)=g(wi,bi,x)=g(wix+bi),得到隐藏层节点的第i个输出hi(x)。其中,bi是隐藏层中第i个节点的偏差,g(wi,bi,x)是隐藏层的激活函数且由sigmoid函数组成。
作为一种可行的实施方式,隐藏层的输出是输入乘上对应权重加上偏差,再经过一个非线性函数其所有节点结果求和得到。其中,H(x)=[h1(x),...,hL(x)]是ELM非线性映射,hi(x)是第i个隐藏层节点的输出。隐藏层节点的输出函数不是唯一的,不同的输出函数可以用于不同的隐藏层神经元。
进一步地,根据
Figure BDA0004104218970000091
得到ELM网络模型的前馈神经网络输出fL(x)。其中,β=[β1,...,βL]T是第i个隐藏层和输出之间的权重向量,i为常数,输出权重β。
进一步地,基于最小二乘的优化方法,对权重向量β进行极限学习求解,并根据
Figure BDA0004104218970000092
得到权重向量β的极限目标函数
Figure BDA0004104218970000093
其中,N为样本中训练集数据的数量,d2代表输出数据的维度,C是模型的惩罚参数,yi-Hβ是第i个训练样本的预测误差,标签数据/>
Figure BDA0004104218970000094
Figure BDA0004104218970000095
为避免参数过拟合的正则项。
进一步地,令极限目标函数
Figure BDA0004104218970000096
对β的梯度为0,可得:
Figure BDA0004104218970000097
利用Moore-Penrose广义逆矩阵的方法进行逆矩阵输出权重β*最优求解。当第一数据的训练样本个数N与隐含层神经元个数L大小不同时,求解β存在两种情况:根据/>
Figure BDA0004104218970000098
得到ELM网络模型的逆矩阵输出权重β*。其中,IL和IN分别表示维度为N和L的单位矩阵,HT为ELM非线性映射的转置矩阵。
在一个实施例中,极限学习机算法都会根据样本类别的数量以不同的重要性对待训练集,该优化算法保证了样本分类问题上的平衡性。该优化算法的目标函数可表示为:
Figure BDA0004104218970000099
Figure BDA00041042189700000910
Figure BDA00041042189700000911
其中,Ci表示第i个样本的惩罚系数。对于样本类别不平衡的数据集,可以对多数类样本设置较小的Ci,而对少数类样本设置较大的Ci,这样可有效避免过度拟合多数类样本。将约束条件代入该目标函数可得:/>
Figure BDA0004104218970000101
其中,C为对角矩阵,其对角元素分别为C1,C2,...CN。与传统ELM算法一样,令目标函数对于β的梯度为0,可求得不同情况下的封闭权重的解,即/>
Figure BDA0004104218970000102
进一步地,根据
Figure BDA0004104218970000103
Figure BDA0004104218970000104
得到梯度函数/>
Figure BDA0004104218970000105
其中,βT为优化权重/>
Figure BDA0004104218970000106
的权重转置矩阵,λ为流形正则损失中间量,γ联合概率分布差异损失中间量,C为对角矩阵,HT为隐藏层特征矩阵的转置矩阵,β为优化权重/>
Figure BDA0004104218970000107
的一个权重解,G表示目标域数据的拉普拉斯举证,Mm为边缘MMD矩阵,Mc为条件MMD矩阵,/>
Figure BDA0004104218970000108
表示源域数据和目标域数据的隐藏层特征矩阵,Ns和Nt分别为源域数据中训练样本数和目标域数据中的训练样本数,yj为标签数据。
进一步地,根据
Figure BDA0004104218970000109
得到优化权重/>
Figure BDA00041042189700001010
其中,IL和IN分别表示维度为N和L的单位矩阵,HT为ELM非线性映射的转置矩阵,C为对角矩阵且其对角元素分别为C1,C2,...CN,入和γ分别表示联合分布匹配正则项和流形正则项的平衡系数,Mm为边缘MMD矩阵,Mc为条件MMD矩阵,G表示目标域数据的拉普拉斯举证,/>
Figure BDA00041042189700001011
Figure BDA00041042189700001012
表示源域数据和目标域数据的隐藏层特征矩阵,Ns和Nt分别为源域数据中训练样本数和目标域数据中的训练样本数,标签数据
Figure BDA00041042189700001013
Figure BDA00041042189700001014
d2代表输出数据的维度,HT为隐藏层特征矩阵的转置矩阵;
进一步地,根据
Figure BDA00041042189700001015
,得到关于输出权重的优化目标函数lDAELM。其中,tr(·)为矩阵的迹,yj为标签数据,βT为优化权重/>
Figure BDA0004104218970000111
的权重转置矩阵,β为优化权重/>
Figure BDA0004104218970000112
的一个权重解,Y为标签数据的一个中间量,
Figure BDA0004104218970000113
为源域数据的分类损失,/>
Figure BDA0004104218970000114
为目标域数据的流形正则损失,/>
Figure BDA0004104218970000115
为联合概率分布差异损失,λ为流形正则损失中间量,γ联合概率分布差异损失中间量。
作为一种可行的实施方式,DAELM利用自编码极限学习机对不仅是源域数据,还有目标域数据进行重构学习,从而可获得具有领域不变性的隐藏层参数。具体过程包括首先利用自编码极限学习机模型对源域和目标域中的数据进行重构,经过重构后的ELM-AE输出的优化权重
Figure BDA0004104218970000116
可以同时表示源域数据和目标域数据的样本信息;其次根据源域样本的分类损失、目标域流形正则损失以及联合概率分布差异损失三项构成目标函数,最后求解该目标函数获得具有迁移能力的输出权重,来实现对域适应迁移算法DAELM模型的搭建。
S104、根据优化目标函数,对目标域数据进行迁移重构学习,得到域适应迁移算法DAELM模型。
在一个实施例中,通过整合不同领域中的标签数据,并根据优化目标函数,对目标域数据进行迁移重构学习,得到域适应迁移算法DAELM模型,并对DAELM模型进行迭代优化训练,训练后的域适应迁移算法DAELM模型可以将来自第一医院源域数据的数据特征经过调整迁移至第二医院目标域数据的特征中,由此DAELM可以对目标域数据中只有少量葡萄糖浓度样本的进行准确预测。
S105、通过域适应迁移算法DAELM模型,对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果。
具体地,根据
Figure BDA0004104218970000117
得到标准目标域数据x。其中,x是未经标准化处理的目标域数据,σ是根据源域数据与目标域数据之间的差异所得到的标准差。将标准目标域数据x′输入到训练后的域适应迁移算法DAELM模型中。
进一步地,通过训练后的域适应迁移算法DAELM模型,将源域数据的数据特征进行迁移重构至标准目标域数据的数据特征中。并对目标域数据的数据特征进行葡萄糖浓度预测,得到预测结果。其中,预测结果为预测葡萄糖浓度。
在一个实施例中,根据
Figure BDA0004104218970000121
得到评估指标RMSE。其中,/>
Figure BDA0004104218970000122
表示标准目标域数据中的真实葡萄糖浓度数据,yi为基于域适应迁移算法DAELM模型的预测葡萄糖浓度,k表示目标域数据中测试样本包含样本个数,i表示常数。通过得到的评估指标RMSE,可以对葡萄糖浓度预测结果进行预测评估,体现出预测的准确度,为用户提供一个对葡萄糖浓度预测结果准确度的参考标准。
在一个实施例中,图2为本申请实施例提供的一种葡萄糖浓度预测的整体设计流程图,如图2所示,通过源域数据与目标域数据的训练样本和测试样本,搭建源域ELM模型,然后进行目标域数据的迁移学习,并根据关于输出权重的优化目标函数lDAELM进行ELM模型的优化训练,最终得到训练后的域适应迁移算法DAELM模型。
在一个实施例中,第一数据集以及第二数据集中的葡萄糖浓度数据可通过,持续佩戴的血糖仪进行数据的获取,并通过无线通信与佩戴用户的移动终端进行数据的互通,移动终端可由训练后的DAELM模型算法搭建,用于对用户进行葡萄糖浓度的实时监测,还能根据训练后的DAELM模型输出的预测结果以及对应的评估指标,对用户未来一定时间中血液的葡萄糖浓度进行精准预测以及精准预测评估,帮助用户更好的掌握自身的血糖情况。
另外,本申请实施例还提供了一种基于迁移学习的葡萄糖浓度预测设备,如图3所示,基于迁移学习的葡萄糖浓度预测设备300具体包括:
至少一个处理器301。以及,与至少一个处理器301通信连接的存储器302;其中,存储器302存储有能够被至少一个处理器301执行的指令,以使至少一个处理器301能够执行:
对第一医院以及第二医院分别进行葡萄糖浓度样本的数据获取,得到第一数据集以及第二数据集;
基于数据集的特征数据以及标签数据,对第一数据集以及第二数据集分别进行数据重组,得到与第一数据集对应的源域数据以及与第二数据集对应的目标域数据;其中,源域数据以及目标域数据均包含训练样本与测试样本;
基于预设ELM网络模型的输出权重,并根据源域数据中训练样本的损失特征,得到关于输出权重的优化目标函数;
根据优化目标函数,对目标域数据进行迁移重构学习,得到域适应迁移算法DAELM模型:
通过域适应迁移算法DAELM模型,对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果。
本申请提供了一种基于迁移学习的葡萄糖浓度预测方法及设备,通过训练后的DAELM模型进行目标域数据中葡萄糖浓度的预测,实现了以小样本训练预测精度较高的模型,大大减少了样本的标记成本,同时,基于迁移学习将迁移算法引入葡糖糖浓度预测领域,可以有效地实现不同医疗机构之间葡萄糖浓度预测模型的复用,解决样本不足的问题,降低医疗机构间样本分布的差异,优化原有的葡萄糖浓度预测模型,让数据库样本较小的医院也能够应用或更好地应用葡萄糖浓度预测模型。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请的实施例可以有各种更改和变化。凡在本申请实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,所述方法包括:
对第一医院以及第二医院分别进行葡萄糖浓度样本的数据获取,得到第一数据集以及第二数据集;
基于数据集的特征数据以及标签数据,对所述第一数据集以及第二数据集分别进行数据重组,得到与第一数据集对应的源域数据以及与第二数据集对应的目标域数据;其中,所述源域数据以及所述目标域数据均包含训练样本与测试样本;
基于预设ELM网络模型的输出权重,并根据所述源域数据中训练样本的损失特征,得到关于所述输出权重的优化目标函数;
根据所述优化目标函数,对所述目标域数据进行迁移重构学习,得到域适应迁移算法DAELM模型;
通过所述域适应迁移算法DAELM模型,对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果。
2.根据权利要求1所述的一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,基于数据集的特征数据以及标签数据,对所述第一数据集以及第二数据集分别进行数据重组,得到与第一数据集对应的源域数据以及与第二数据集对应的目标域数据,具体包括:
获取第一医院所对应的第一数据集以及第二医院所对应的第二数据集;其中,所述第一数据集中的葡萄糖浓度样本数量要远大于所述第二数据集中的葡萄糖浓度样本数量;
对所述第一数据集与所述第二数据集进行错误数据的剔除,并基于所述第一数据集与所述第二数据集中包含的特征数据以及标签数据的分组原则,对所述第一数据集与所述第二数据集分别进行数据重组,得到所述源域数据与所述目标域数据;其中,所述源域数据与所述目标域数据为ELM网络训练模型的特征数据。
3.根据权利要求1所述的一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,在基于预设ELM网络模型的输出权重,并根据所述源域数据中训练样本的损失特征,得到关于所述输出权重的优化目标函数之前,所述方法还包括:
根据H(x)=[h1(x),...,hL(x)],得到所述ELM网络模型的隐藏层H(x);其中,L为ELM网络模型的隐藏单元数量,hi(x)是第i个隐藏层节点的输出;
根据
Figure FDA0004104218960000021
得到所述ELM网络模型的前馈神经网络输出fL(x);其中,β=[β1,...,βL]T是第i个隐藏层和输出之间的权重向量,i为常数,输出权重β;
根据
Figure FDA0004104218960000022
得到权重向量β的极限目标函数
Figure FDA0004104218960000023
其中,N为样本中训练集数据的数量,d2代表输出数据的维度,C是模型的惩罚参数,yi-Hβ是第i个训练样本的预测误差,标签数据/>
Figure FDA0004104218960000024
为避免参数过拟合的正则项;
根据
Figure FDA0004104218960000025
得到所述ELM网络模型的逆矩阵输出权重β*;其中,IL和IN分别表示维度为N和L的单位矩阵,HT为ELM非线性映射的转置矩阵。
4.根据权利要求3所述的一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,在得到所述ELM网络模型的隐藏层H(x)之后,所述方法还包括:
根据
Figure FDA0004104218960000026
得到激活函数g(x);其中,x为特征数据的输入向量,e为数学常数;
根据hi(x)=g(wi,bi,x)=g(wix+bi),得到隐藏层节点的第i个输出hi(x);其中,bi是隐藏层中第i个节点的偏差,g(wi,bi,x)是隐藏层的激活函数且由sigmoid函数组成。
5.根据权利要求3所述的一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,在得到所述ELM网络模型的逆矩阵输出权重β*之后,所述方法还包括:
根据
Figure FDA0004104218960000031
得到约束目标函数/>
Figure FDA0004104218960000032
其中,N为样本中训练集数据的数量,d2代表输出数据的维度,C是模型的惩罚参数,标签数据
Figure FDA0004104218960000033
输出权重β,H为隐藏层的矩阵;
根据
Figure FDA0004104218960000034
得到重构后ELM网络模型的输出权重β;其中,IL和IN分别表示维度为N和L的单位矩阵,HT为ELM非线性映射的转置矩阵,C为惩罚系数。
6.根据权利要求1所述的一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,基于预设ELM网络模型的输出权重,并根据所述源域数据中训练样本的损失特征,得到关于所述输出权重的优化目标函数,具体包括:
根据
Figure FDA0004104218960000035
得到优化权重/>
Figure FDA0004104218960000036
其中,IL和IN分别表示维度为N和L的单位矩阵,HT为ELM非线性映射的转置矩阵,C为对角矩阵且其对角元素分别为C1,C2,...CN,λ和γ分别表示联合分布匹配正则项和流形正则项的平衡系数,Mm为边缘MMD矩阵,Mc为条件MMD矩阵,G表示目标域数据的拉普拉斯举证,,/>
Figure FDA0004104218960000037
Figure FDA0004104218960000038
表示源域数据和目标域数据的隐藏层特征矩阵,Ns和Nt分别为源域数据中训练样本数和目标域数据中的训练样本数,标签数据
Figure FDA0004104218960000039
d2代表输出数据的维度,HT为隐藏层特征矩阵的转置矩阵;
根据
Figure FDA00041042189600000310
,得到关于所述输出权重的优化目标函数lDAELM;其中,tr(·)为矩阵的迹,yj为标签数据,βT为优化权重/>
Figure FDA0004104218960000041
的权重转置矩阵,β为优化权重/>
Figure FDA0004104218960000042
的一个权重解,Y为标签数据的一个中间量,/>
Figure FDA0004104218960000043
为源域数据的分类损失,/>
Figure FDA0004104218960000044
为目标域数据的流形正则损失,/>
Figure FDA0004104218960000045
为联合概率分布差异损失,λ为流形正则损失中间量,γ联合概率分布差异损失中间量。
7.根据权利要求6所述的一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,在得到优化权重
Figure FDA0004104218960000046
之前,所述方法还包括:
根据
Figure FDA0004104218960000047
得到梯度函数/>
Figure FDA0004104218960000048
其中,βT为优化权重/>
Figure FDA0004104218960000049
的权重转置矩阵,λ为流形正则损失中间量,γ联合概率分布差异损失中间量,C为对角矩阵,HT为隐藏层特征矩阵的转置矩阵,β为优化权重
Figure FDA00041042189600000410
的一个权重解,G表示目标域数据的拉普拉斯举证,Mm为边缘MMD矩阵,Mc为条件MMD矩阵,
Figure FDA00041042189600000411
表示源域数据和目标域数据的隐藏层特征矩阵,Ns和Nt分别为源域数据中训练样本数和目标域数据中的训练样本数,yj为标签数据。
8.根据权利要求1所述的一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,通过所述域适应迁移算法DAELM模型,对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果,具体包括:
根据
Figure FDA00041042189600000412
得到标准目标域数据x′;其中,x是未经标准化处理的目标域数据,σ是根据源域数据与目标域数据之间的差异所得到的标准差;
将所述标准目标域数据x′输入到训练后的域适应迁移算法DAELM模型中;
通过所述训练后的域适应迁移算法DAELM模型,将所述源域数据的数据特征进行迁移重构至所述标准目标域数据的数据特征中;并对所述标准目标域数据的数据特征进行葡萄糖浓度预测,得到所述预测结果;其中,所述预测结果为预测葡萄糖浓度。
9.根据权利要求1所述的一种基于迁移学习的葡萄糖浓度预测方法,其特征在于,在对目标域数据中的葡萄糖浓度数据进行浓度预测,得到预测结果之后,所述方法还包括:
根据
Figure FDA0004104218960000051
得到所述评估指标RMSE;其中,/>
Figure FDA0004104218960000052
表示标准目标域数据中的真实葡萄糖浓度数据,yi为基于域适应迁移算法DAELM模型的预测葡萄糖浓度,k表示目标域数据中测试样本包含样本个数,i表示常数。
10.一种基于迁移学习的葡萄糖浓度预测设备,其特征在于,所述设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有能够被所述至少一个处理器执行的指令,以使所述至少一个处理器能够执行根据权利要求1-9任一项所述的一种基于迁移学习的葡萄糖浓度预测方法。
CN202310186916.XA 2022-12-22 2023-03-01 一种基于迁移学习的葡萄糖浓度预测方法及设备 Pending CN116313080A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2022116566235 2022-12-22
CN202211656623 2022-12-22

Publications (1)

Publication Number Publication Date
CN116313080A true CN116313080A (zh) 2023-06-23

Family

ID=86831788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310186916.XA Pending CN116313080A (zh) 2022-12-22 2023-03-01 一种基于迁移学习的葡萄糖浓度预测方法及设备

Country Status (1)

Country Link
CN (1) CN116313080A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117708656A (zh) * 2024-02-05 2024-03-15 东北大学 一种面向单源域的滚动轴承跨域故障诊断方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117708656A (zh) * 2024-02-05 2024-03-15 东北大学 一种面向单源域的滚动轴承跨域故障诊断方法
CN117708656B (zh) * 2024-02-05 2024-05-10 东北大学 一种面向单源域的滚动轴承跨域故障诊断方法

Similar Documents

Publication Publication Date Title
Rady et al. Prediction of kidney disease stages using data mining algorithms
CN109659033B (zh) 一种基于循环神经网络的慢性疾病病情变化事件预测装置
US20220254493A1 (en) Chronic disease prediction system based on multi-task learning model
CN113421652B (zh) 对医疗数据进行分析的方法、训练模型的方法及分析仪
Chakradar et al. A non-invasive approach to identify insulin resistance with triglycerides and HDL-c ratio using machine learning
CN107451407A (zh) 一种中医智能诊断方法、系统及中医医疗系统
CN111387938B (zh) 一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统
Raeesi Vanani et al. IoT-based diseases prediction and diagnosis system for healthcare
Singh et al. Data mining classifier for predicting diabetics
CN111951975A (zh) 一种基于深度学习模型gpt-2的脓毒症早期预警方法
CN113270192A (zh) 基于动静态数据结合与深度自编码器的血透风险预测系统
CN115985513B (zh) 一种基于多组学癌症分型的数据处理方法、装置及设备
CN116313080A (zh) 一种基于迁移学习的葡萄糖浓度预测方法及设备
Barhate et al. Analysis of classifiers for prediction of type ii diabetes mellitus
CN116864139A (zh) 疾病风险评估方法、装置、计算机设备及可读存储介质
CN113160986A (zh) 用于预测全身炎症反应综合征发展的模型构建方法及系统
Wang et al. Learning fine-grained patient similarity with dynamic bayesian network embedded RNNs
CN113990502B (zh) 一种基于异构图神经网络的icu心衰预测系统
CN113077901B (zh) 一种电子病历分析装置和方法
Baucum et al. Adapting reinforcement learning treatment policies using limited data to personalize critical care
Padmapritha Prediction of Blood Glucose Level by using an LSTM based Recurrent Neural networks
Yin et al. Context-aware time series imputation for multi-analyte clinical data
CN114239658A (zh) 一种基于小波分解与gru神经网络的血糖预测方法
CN113470808A (zh) 一种人工智能预测谵妄的方法
Kaliyapillai et al. Differential evolution based hyperparameters tuned deep learning models for disease diagnosis and classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination