CN117976229A

CN117976229A - 一种基于深度多任务学习的夜间血糖预测模型构建方法

Info

Publication number: CN117976229A
Application number: CN202410124331.XA
Authority: CN
Inventors: 熊馨; 杨鑫亮; 蔡芸莹; 贺建峰; 薛雨欣; 吉晓瑜; 任仕欣
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2024-01-30
Filing date: 2024-01-30
Publication date: 2024-05-03

Abstract

本发明涉及一种基于深度多任务学习的夜间血糖预测模型构建方法，属于动态血糖预测技术领域。首先从公共数据集Aleppo中筛选一组1型糖尿病患者的时序数据，对筛选出的数据进行缺失值填充、数据对齐、滑动窗口划分等预处理；随后，按比例划分数据集为训练集、验证集和测试集；建立血糖预测的神经网络模型，使用训练集数据对模型进行训练。根据验证最优的原则，选择在验证集上表现最佳的模型作为最终模型用于血糖的预测任务；本发明使用深度学习成功构建了夜间血糖预测模型，通过细致分析患者历史血糖变化预测夜间的血糖水平，并提供低血糖和高血糖的预警。这一创新方法为患者提供了推注胰岛素的参考，更有效地管理血糖水平。

Description

一种基于深度多任务学习的夜间血糖预测模型构建方法

技术领域

本发明涉及一种基于深度多任务学习的夜间血糖预测模型构建方法，属于动态血糖预测技术领域。

背景技术

1型糖尿病(T1D)患者为控制高血糖并发症，采用间歇性或定期注射胰岛素。高血糖(BGC>180mg/dL)导致心血管、眼睛、肾脏和神经损害，胰岛素剂量的确定至关重要，过多可能引发低血糖(BGC<70mg/dL)，威胁生命。

因此，了解血糖的未来预测对确定最佳胰岛素剂量、饮食和锻炼至关重要，对闭环胰岛素输送算法控制和预防不良血糖事件发生也十分重要。随着可穿戴传感器技术的发展，连续血糖监测(CGM)每5分钟一次采样，结合胰岛素泵和深度学习(DL)，实现自动、数据驱动的个性化来糖预测血，成为血糖预测的一种新的方式。

发明内容

本发明要解决的技术问题是提供一种基于深度多任务学习的夜间血糖预测模型构建方法，通过以往血糖变化进行血糖数值范围预测及其高低血糖预警，准确、科学，为临床用药指导提供参考和预警。

本发明的技术方案是：一种基于深度多任务学习的夜间血糖预测模型构建方法，从公共数据集Aleppo中筛选一组1型糖尿病患者的时序数据，包括血糖数据、胰岛素推注量数据、碳水化合物摄入量数据和时间数据；对筛选出的数据进行缺失值填充、数据对齐、滑动窗口划分等预处理；随后，按比例划分数据集为训练集、验证集和测试集；建立血糖预测的神经网络模型，使用训练集数据对模型进行训练。根据验证最优的原则，选择在验证集上表现最佳的模型作为最终模型用于血糖的预测任务

具体包括：

Step1：从公共数据集中筛选出病患状态的特征数据。

Step2：对筛选出来的数据进行预处理。

所述预处理包括但不限于缺失数据填充、数据集平衡、时序特征数据按照时间维度进行拼接、提取时间特征并重新表征到高维度。

Step3：使用滑动窗口法对数据进行窗口划分，将数据整合成可用于模型训练的窗口数据。

Step4：将窗口数据划分为训练集、验证集和测试集。

Step5：构建用于血糖预测的多任务神经网络模型。

Step6：利用所述训练集对所述多任务神经网络模型进行训练，并根据验证集上的最优性原则筛选出训练好的模型。

Step7：将所述训练好的模型作为血糖预测模型。

Step8：统计血糖预测模型的预测结果，并对预测结果进行分析。

所述筛选出病患状态的特征数据包括：个体化数据、胰岛素注射数据、碳水化合物摄入数据、以及通过CGM设备获取每隔5分钟一次血糖记录的时间信息。

所述缺失数据填充包括：

使用缺失值插补和不平衡学习，生成对抗网络(MVIIL-GAN)的模型对血糖数据进行缺失值填充和高/低血糖数据平衡处理，保证患者的血糖数据没有缺失值和高/低血糖数据平衡，确保不同类别的数据样本具有相似的数量或权重，以避免不平衡数据集对模型性能的负面影响。

将胰岛素注射数据和碳水化合物摄入数据在时间上与血糖记录对齐。如某一时刻有血糖记录但没有胰岛素推注记录或碳水化合物摄入记录的情况将胰岛素推注记录和碳水化合物摄入记录设成0。

提取时间信息，所述时间信息包括月份、日期、小时、分钟、weekday。

将每个时刻的血糖数据、胰岛素注射数据、碳水化合物摄入数据和时间信息组合成单样本。

所述Step3具体包括：

确定要使用的窗口大小。

从数据的起始位置开始，创建一个初始窗口，其大小等于所选的窗口大小。

根据预测的时间范围，选择窗口中最后一个样本的后N个样本作为此窗口的标签。

将窗口滑动一个步长，以访问下一个窗口。

继续滑动窗口，直到达到数据的末尾或者满足某个结束条件。

根据任务需求，将每个窗口的处理结果存储在一个新的数据结构中。

所述Step4中：按照6:2:2的比例将窗口数据分为训练集、验证集和测试集，并从验证集和测试集中抽取患者的夜间窗口数据。

所述Step5包括：

模型共享层，包括：

构建一个嵌入式编码器，用于将病患的ID索引映射到固定大小的稠密向量。

所述嵌入式编码器采用查找表Look-up Table的结构。

构建一个位置编码器，用于显式地为输入的窗口序列添加位置编码，以便模型能够理解输入的相对位置。

构建时序编码器，所述时序编码器包含一个一维卷积层，用于对时序信息进行编码，生成对应的高维特征表示。

构建Transformer编码器层，将输入序列进行编码和特征提取，同时，Encoder层使用自注意力机制来捕捉输入序列中各个元素之间的关系。

Transformer Encoder层包含多个注意力头，每个多个注意力头学习不同的特征表示，模型可以捕捉不同尺度和方面的信息。

在Transformer编码器层的处理结果之后，将LSTM层与其连接，用于进一步处理时间序列数据，提取其更复杂的时间依赖关系,得到LSTM的输出作为状态向量，包含了更全面的时间序列信息。

模型特定任务层，包括：

构建多层堆叠的线性层对输入的状态向量处理以输出常数预测值。

所诉使用缺失值插补和不平衡学习生成对抗网络(MVIIL-GAN)的模型对血糖数据进行缺失值填充和高/低血糖数据平衡处理的具体步骤包括：

MVIIL-GAN对高缺失率数据的插补过程和EHR数据的条件生成过程进行联合学习，通过引入两个鉴别器来在样本级别和变量级别区分假数据和生成数据，实现联合学习。

MVIIL-GAN将缺失值插补和数据生成整合为一步。

所述从验证集和测试集中抽取患者的夜间窗口数据包括：

从验证集和测试集中筛选出在每天晚上8点到次日早晨8点的窗口数据及其标签。

所述Step6中：使用Adam优化器，设定学习率，所述学习率为动态调整，调整范围为0.01至0.0001，训练轮数为300轮，采用早停机制并根据验证集最优的原则选取最终的训练好的模型。

所述Step8包括：

使用测试集测试最终的血糖预测模型并计算和统计出不同预测范围内的RMSE。

将预测值进行分类，分别标注出低血糖和高血糖时刻。

将预测得到的血糖值和标签进行误差网格分析，通过将实际血糖值与预测值进行比较，将结果分布在一个误差格中，以可视化和定量评估预测的准确性，并确定是否存在对患者健康造成潜在风险的误差。

本发明的有益效果是：

本发明采用多任务学习方法，为每个患者建立独立的任务，通过共享知识和联合训练的方式，提高模型对个体差异的适应性。这一方法有望更好地满足个性化医疗的需求。

本发明结合了Transformer Encoder模型和LSTM(长短时记忆网络)，充分发挥了Transformer在处理序列数据中的优势，同时保留了LSTM对于时序数据的敏感性。Transformer的自注意力机制有助于捕捉长距离依赖关系，而LSTM则能更好地处理序列中的短期依赖，从而提高了模型对血糖动态变化的敏感性。

本发明的创新点在于采用多任务学习的方式，为每个患者构建独立任务，允许模型更好地适应个体特征。整合Transformer Encoder和LSTM，充分结合两者的优势，提高了模型对于时间序列和个体差异的建模能力。这种方法不仅提高了预测的准确性，同时也增强了模型的泛化能力，适用于不同类型和阶段的糖尿病患者。

本发明有望为临床医学提供更精准的个体化血糖预测，为医生和糖尿病患者提供更全面、实用的临床决策支持。通过整合多任务学习、Transformer和LSTM，该模型具有良好的可解释性和鲁棒性，有望成为未来糖尿病管理的重要工具，改善患者的生活质量。

本发明采用深度学习技术，通过构建一种夜间血糖预测模型，整合连续血糖监测(CGM)设备、患者的胰岛素推注信息以及碳水摄入信息。通过对神经网络模型进行训练，并使用验证集上的最佳模型实现对糖尿病患者未来血糖变化趋势的准确预测。这一创新技术可为临床用药指导提供重要参考和预警，提高糖尿病患者管理的精准性。

附图说明

图1是本发明实施例提供的基于深度学习的血糖预测模型构建方法流程框图；

图2是本发明实施例提供的所筛选患者血糖分布的小提琴图；

图3是本发明实施例提供的神经网络模型的内部数据处理结构示意图。

具体实施方式

下面结合附图和具体实施方式，对本发明作进一步说明。

实施例1：如图1所示，一种基于深度多任务学习的夜间血糖预测模型构建方法，具体步骤包括：

S1：从公共数据集中选择一部分数据；

具体地，按照数据完整度最高原则从公共数据集中选择29名1型糖尿病患者三个月的血糖记录、胰岛素推注剂量和碳水化合物摄入量等数据。按照CGM设备以5分钟每次的采样频率计算,每个患者一天中应该有288条血糖值。公共数据集Aleppo中每个患者的数据或多或少都有一些缺失。这里选择29名患者连续90天，每天的测得的血糖数大于250的数据。其他数据还有29名患者在这90天中收集的胰岛素推注剂量和时间信息，每餐碳水化合物摄入计量和时间信息。展示所有患者的高低血糖分布情况的小提琴图如图2所示。

S2：对上述筛选出来的数据进行预处理，包括血糖数据缺失值填充，血糖数据异常值剔除，血糖数据平滑，数据集中高低血糖数据平衡处理，时间特提取和窗口划分等。

在筛选的血糖值数据中，如果存在血糖值缺失，相应的时间信息也会缺失。直接进行数据填充可能导致缺失时间信息的问题。为解决这一问题，首先需要生成每隔5分钟一次的时间序列。然后，将对应时刻的血糖数据映射到生成的时间序列下。在新的时间序列中，针对血糖数据的缺失和数据不平衡问题，采用了GAIN(生成对抗网络)进行数据缺失填充和处理不平衡的情况。通过GAIN生成的模拟数据，填补缺失的血糖值，并确保数据在时间维度上的平衡性。这一过程有助于维持数据集的完整性和准确性，以便后续的分析和建模工作。

对预处理后的数据进行时间维度上的拼接。

在筛选的数据集中，胰岛素推注记录和碳水摄入记录呈现较为稀疏的情况。在按照时间维度进行血糖值、碳水化合物输入和胰岛素推注剂量数据的拼接过程中，出现了数据不平衡的情况。由于时间维度的限制，无法精确到秒级，可能导致胰岛素推注时间和碳水化合物摄入时间与血糖值测量时刻存在前后几分钟的时间差。鉴于时间序列以血糖值为主，因此在某一时刻存在血糖值监测数据但无碳水化合物摄入量数据或胰岛素推注剂量值数据的情况下，将这两个数值设定为0。

对时间数据进行特征提取，提取每个时刻的month、day、weekday、hour、minute、second等特征并将上诉的血糖值、胰岛素、碳水化合物和病患的编号进行特征维度的拼接。

对特征拼接后的数据进行滑动窗口划分。滑动窗口法允许对时间序列数据进行局部区域的分析，有助于捕捉数据中的短期模式和趋势。通过滑动窗口，可以在数据中提取出局部特征，更好地理解时间序列的变化。

首先确定要使用的窗口大小，设成96或72。

从每个病患数据的起始位置开始，创建一个初始窗口，其大小等于所选的窗口大小。

选择窗口中最后一个时刻的后n个时刻向量中的血糖值作为本窗口的标签。

将窗口滑动一个步长，以访问下一个窗口。

S3：对数据进行划分，按照6：2：2的比例将数据分为训练集、验证集和测试集。

S4：构建夜间血糖预测的神经网络模型如图3所示。使用多任务学习策略设计模型，模型总体分为共享层和特定任务层。

采用深度学习Embedding层对病患的个性化特征数据进行编码,将离散的特征映射到一个稠密的连续向量空间中。

采用一维卷积层对时间特征进行编码转换，将时间特性编码到高维度的表示。

对窗口中的数据进行位置编码。

采用一维卷积层对血糖值、胰岛素、碳水化合物三个特征进行转换，以获得更具信息表达的形式。

理论上时间特征、患者的个性化特征、位置编码和血糖值没有直接的函数关系，将以上四个编码数据融合。

模型共享层采用Transformer Encoder层和LSTM，组合结合了Transformer和LSTM的优势，提高血糖预测模型的性能。Transformer Encoder层改进的注意机制使模型能够在学习过程中有效地捕捉不同时间点之间的长期关系。通过这种结构，模型可以学习到对多个任务都有用的通用特征表示，从而实现在不同任务之间迁移学习的可能性。同时，引入LSTM层的目的是通过递归处理序列数据更好地捕捉序列中的长期依赖关系。LSTM的记忆单元结构允许模型在处理时间序列时保留和更新关键信息，有助于捕捉序列中的长期依赖关系。共享层的最终输出是LSTM层输出张量中的最后一个向量。这个向量可以被用作整个序列的表示，供后续的任务特定层进行预测。

所述改进的注意力机制的实现如下式所示：

式中：Q，K，V是输入的三个矩阵，i是对Q矩阵遍历的索引，j是对K矩阵遍历的索引，d是序列中每个时刻数据被编码后的维度；

根据每个时刻点的Q向量和其余时刻点的K向量进行dot-product，式M(q_i,K)中，为找出窗口序列中每个时刻点的Q和其余时刻的K乘积中最大的一个结果。后跟目的是找出整个序列中每个时刻点的Q和其余时刻的K乘积中最大的一个结果和平均结果的差值。最后在对窗口中每个时刻数据的M(q_i,K)进行排序，最后得到此窗口中比较重要的时间戳。

在模型的特定任务层中采用线性层。每位患者都有一个独立的三层线性层层，线性层生成对应患者的预测结果。共享层的输出数据被切片，然后被分别送入每位患者对应的特定任务层。特定任务层的输出即为模型对每个患者血糖值的预测结果。模型可以对每位患者进行个性化的预测，同时保留了共享层学到的通用特征。

S5：对模型进行训练，选定损失函数、优化器和学习率，通过训练集对模型进行训练，每一轮训练完成都有伴随有验证步骤。

损失函数采用MSE，使用Adam优化器，学习率为0.001。训练300个epoch，使用早停机制，如果连续几轮总验证损失值没有变化或上升则停止训练。

S6：选用最终的模型用于预测。

测试集数据对最终的模型进行测试。

使用高质量的血糖监测数据、患者每餐碳水摄入量和胰岛素推注量的基本准确信息，成功构建了一个深度学习模型，该模型在测试集上表现优于以往的模型。

表1展示了本研究提出的模型与线性基础模型、GluNet以及Gluformer模型在评估指标为RMSE(mmol/L)时的对比结果。线性基础模型是通过对最后几个时刻记录点进行线性拟合插值预测得到的。

PH(预测范围)	Baseline	GluNet	Gluformer	本申请模型
					30min	7.40	5.43	5.1	4.99
60min	13.78	11.25	11.41	11.06
					90min	20.46	19.67	20.58	19.37
120min	26.27	24.18	24.63	24.05

表1

S7：预测结果范围内高低血糖预警。

设置两个阈值，126mg/dL和70mg/dL。若预测结果范围内血糖值高于126mg/dL,则程序会有提示并指示那个高血糖开始时刻，若预测结果范围内血糖值低于70mg/dL,则程序提示并指示低血糖开始时刻。

该应用模型旨在用于住院糖尿病患者，通过与医院信息系统(HIS)实现连接，获取患者的病史和用药等基本信息。同时，与连续血糖监测(CGM)系统相连，收集患者的实时血糖数据。将这些数据输入到模型中，该模型能够预测患者未来30、60、90、120分钟内的血糖水平。

本发明模型计划在住院糖尿病患者中使用，通过与Diabetes Management System系统相连获取患者档案病史、历史血糖水平等基本信息，将获取数据输入模型中，模型可预测该患者夜的血糖。最终预测结果的形式是：“喂入模型过去8小时的数据，模型的输出是未来30、60、90、120分钟内的血糖数据”。

本发明模型充分利用连续血糖监测技术，通过对患者短时血糖情况的预测，实现了对未来血糖值的准确预测，并对患者在短时间内的血糖水平是否进入危险范围进行了分类。这一预测系统不仅能够提供准确的患者未来血糖趋势信息，还具备及时预警机制，能够在未来一段时间内可能发生的高、低血糖情况出现时及时通知医生，协助医生判断患者的危险状态。这种个性化的预测和预警系统为医生制定更加精准、个性化的治疗方案提供了有力支持。

以上结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.一种基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，包括：

Step1：从公共数据集中筛选出病患状态的特征数据；

Step2：对筛选出来的数据进行预处理；

所述预处理包括但不限于缺失数据填充、数据集平衡、时序特征数据按照时间维度进行拼接、提取时间特征并重新表征到高维度；

Step3：使用滑动窗口法对数据进行窗口划分，将数据整合成可用于模型训练的窗口数据；

Step4：将窗口数据划分为训练集、验证集和测试集；

Step5：构建用于血糖预测的多任务神经网络模型；

Step6：利用所述训练集对所述多任务神经网络模型进行训练，并根据验证集上的最优性原则筛选出训练好的模型；

Step7：将所述训练好的模型作为血糖预测模型；

2.根据权利要求1所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所述筛选出病患状态的特征数据包括：个体化数据、胰岛素注射数据、碳水化合物摄入数据、以及获取每隔5分钟一次血糖记录的时间信息。

3.根据权利要求1所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所述缺失数据填充包括：

使用缺失值插补和不平衡学习，生成对抗网络的模型对血糖数据进行缺失值填充和高/低血糖数据平衡处理；

将胰岛素注射数据和碳水化合物摄入数据在时间上与血糖记录对齐；

提取时间信息，所述时间信息包括月份、日期、小时、分钟、weekday；

4.根据权利要求1所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所述Step3具体包括：

确定要使用的窗口大小；

从数据的起始位置开始，创建一个初始窗口，其大小等于所选的窗口大小；

根据预测的时间范围，选择窗口中最后一个样本的后N个样本作为此窗口的标签；

将窗口滑动一个步长，以访问下一个窗口；

继续滑动窗口，直到达到数据的末尾或者满足某个结束条件；

5.根据权利要求1所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所述Step4中：按照6:2:2的比例将窗口数据分为训练集、验证集和测试集，并从验证集和测试集中抽取患者的夜间窗口数据。

6.根据权利要求1所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所述Step5包括：

模型共享层，包括：

构建一个嵌入式编码器，用于将病患的ID索引映射到固定大小的稠密向量；

所述嵌入式编码器采用查找表Look-up Table的结构；

构建一个位置编码器，用于显式地为输入的窗口序列添加位置编码；

构建时序编码器，所述时序编码器包含一个一维卷积层，用于对时序信息进行编码，生成对应的高维特征表示；

构建Transformer编码器层，将输入序列进行编码和特征提取，同时，Encoder层使用自注意力机制来捕捉输入序列中各个元素之间的关系；

Transformer Encoder层包含多个注意力头，每个多个注意力头学习不同的特征表示；

在Transformer编码器层的处理结果之后，将LSTM层与其连接，用于进一步处理时间序列数据，提取时间依赖关系,得到LSTM的输出作为状态向量；

模型特定任务层，包括：

7.根据权利要求3所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所诉使用缺失值插补和不平衡学习生成对抗网络的模型对血糖数据进行缺失值填充和高/低血糖数据平衡处理的具体步骤包括：

MVIIL-GAN对高缺失率数据的插补过程和EHR数据的条件生成过程进行联合学习，通过引入两个鉴别器来在样本级别和变量级别区分假数据和生成数据，实现联合学习；

MVIIL-GAN将缺失值插补和数据生成整合为一步。

8.根据权利要求5所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所述从验证集和测试集中抽取患者的夜间窗口数据包括：

9.根据权利要求1所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所述Step6中：使用Adam优化器，设定学习率，所述学习率为动态调整，调整范围为0.01至0.0001，训练轮数为300轮，采用早停机制并根据验证集最优的原则选取最终的训练好的模型。

10.根据权利要求1所述的基于深度多任务学习的夜间血糖预测模型构建方法，其特征在于，所述Step8包括：

使用测试集测试最终的血糖预测模型并计算和统计出不同预测范围内的RMSE；

将预测值进行分类，分别标注出低血糖和高血糖时刻；