CN107203700A

CN107203700A - 一种基于连续血糖监测的方法及装置

Info

Publication number: CN107203700A
Application number: CN201710574788.0A
Authority: CN
Inventors: 董宇涵; 李征; 唐圆圆; 米雪龙; 张�林
Original assignee: Tsinghua Berkeley Shenzhen College Preparatory Office
Current assignee: Tsinghua Berkeley Shenzhen College Preparatory Office; Yu Dongfang
Priority date: 2017-07-14
Filing date: 2017-07-14
Publication date: 2017-09-26
Anticipated expiration: 2037-07-14
Also published as: CN107203700B

Abstract

本发明公开了一种基于连续血糖监测的方法及装置，包括：获取至少两名用户的血糖数据，根据预设的数据拼接方法构成第一血糖数据矩阵，从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据；采用机器学习算法，根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据，对预设的数学模型进行训练，得到血糖数据预测模型；获取一名待预测用户的已有血糖数据，根据预设的数据拼接方法构成第二血糖数据输入向量；将所述第二血糖数据输入向量输入所述血糖数据预测模型，获取所述待预测用户的当前时刻之后的血糖数据的预测值，实现了用群体血糖数据预测个体血糖浓度。

Description

一种基于连续血糖监测的方法及装置

技术领域

本发明实施例涉及血糖监测领域，尤其涉及一种基于连续血糖监测的方法及装置。

背景技术

糖尿病是长期血糖水平波动超出正常范围(90-120mmol/L)之外的代谢病理状态，若管理不善将会导致严重的并发症。目前，糖尿病的治疗尚无有效方法，现有的血糖测量方法都需要频繁针刺取血进行血糖的自我监测，经常性地对患者进行针刺取血，会对患者造成生理上的疼痛与心理上的恐惧与抵触，甚至会引发感染，从而限制了血糖检测的频率。由于采集的血糖数据较少，使得很多数据分析方法无法使用。

CGM(Continuous Glucose Monitoring，连续血糖监测)技术的出现，为有效解决上述问题提供了可能，其中，最重要的是为通过数据分析方法实现血糖浓度预测提供了可能。具体地，CGM设备通过微创或无创方式实时采集患者的血糖浓度，并每隔较短时间间隔输出一个血糖数据，测得的连续血糖数据可以看作是一种时间序列，针对时间序列的预测算法中，最典型的便是机器学习算法，如ANN(Artificial Neural Network，人工神经网络)，SVR(Support Vector Regression，支持向量机回归)，RT(Regression Tree，回归树)等，应用上述机器学习算法对连续血糖时间序列进行预测，上述是建立在采集的血糖数据足够多的基础上实现的。但是，在实际应用中，由于很多患者使用CGM设备时间较短，导致采集的血糖数据量较少，因而，无法应用上述机器学习算法对其血糖浓度进行预测。

针对上述问题，目前尚未提出有效的解决方案。

发明内容

本发明提供一种基于连续血糖监测的方法及装置，实现用群体血糖数据预测个体血糖数据。

第一方面，本发明实施例提供了一种基于连续血糖监测的方法，包括：

获取至少两名用户的血糖数据，根据预设的数据拼接方法构成第一血糖数据矩阵，从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据；

采用机器学习算法，根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据，对预设的数学模型进行训练，得到血糖数据预测模型；

获取一名待预测用户的已有血糖数据，根据预设的数据拼接方法构成第二血糖数据输入向量；

将所述第二血糖数据输入向量输入所述血糖数据预测模型，获取所述待预测用户的当前时刻之后的血糖数据的预测值。

第二方面，本发明实施例还提供了一种基于连续血糖监测的装置，包括：

训练阶段血糖数据生成模块，用于获取至少两名用户的血糖数据，根据预设的数据拼接方法构成第一血糖数据矩阵，从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据；

血糖数据预测模型生成模块，用于采用机器学习算法，根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据，对预设的数学模型进行训练，得到血糖数据预测模型；

预测阶段血糖数据生成模块，用于获取一名待预测用户的已有血糖数据，根据预设的数据拼接方法构成第二血糖数据输入向量；

血糖数据的预测值获取模块，用于将所述第二血糖数据输入向量输入所述血糖数据预测模型，获取所述待预测用户的当前时刻之后的血糖数据的预测值。

本发明通过根据预设的数据拼接方法构建由多用户血糖数据构成的群体血糖数据，并基于上述群体血糖数据采用机器学习算法建立血糖数据预测模型，利用上述血糖预测模型预测待预测用户这一个体的血糖浓度，解决了由于个体采集的血糖数据量较少，无法应用上述机器学习算法对其血糖浓度进行预测问题，实现了用群体血糖数据预测个体血糖浓度。

附图说明

图1a是本发明实施例一中的一种基于连续血糖监测的方法的流程图；

图1b是本发明实施例一中的一种基于连续血糖监测的方法的流程图；

图1c是本发明实施例一中的一种基于连续血糖监测的方法的流程图；

图2a是本发明实施例二中的一种基于连续血糖监测的装置的结构框图；

图2b是本发明实施例二中的训练阶段血糖数据生成模块的结构框图；

图2c是本发明实施例二中的预测阶段血糖数据生成模块的结构框图；

图3a是本发明实施例三中的一种基于连续血糖监测的LSTM网络算法训练阶段的流程图；

图3b是本发明实施例三中的一种基于连续血糖监测的LSTM网络算法预测阶段的流程图；

图3c是本发明实施例三中的预设的数据拼接方法示意图；

图3d是本发明实施例三中的LSTM网络算法结构示意图；

图3e是本发明实施例三中的PH＝15分钟时三种方法的预测结果示意图；

图3f是本发明实施例三中的PH＝30分钟时三种方法的预测结果示意图；

图3g是本发明实施例三中的PH＝45分钟时三种方法的预测结果示意图；

图3h是本发明实施例三中的PH＝60分钟时三种方法的预测结果示意图；

图3i是本发明实施例三中的PH＝15分钟时三种方法24天预测结果的RMSE示意图；

图3j是本发明实施例三中的PH＝30分钟时三种方法24天预测结果的RMSE示意图；

图3k是本发明实施例三中的PH＝45分钟时三种方法24天预测结果的RMSE示意图；

图3l是本发明实施例三中的PH＝60分钟时三种方法24天预测结果的RMSE示意图；

图3m是本发明实施例三中的三种方法24天预测结果的平均RMSE随细分区间变化示意图；

图3n是本发明实施例三中的PH＝15分钟时三种方法24天预测结果的SSGPE示意图；

图3o是本发明实施例三中的PH＝30分钟时三种方法24天预测结果的SSGPE示意图；

图3p是本发明实施例三中的PH＝45分钟时三种方法24天预测结果的SSGPE示意图；

图3q是本发明实施例三中的PH＝60分钟时三种方法24天预测结果的SSGPE示意图；

图3r是本发明实施例三中的三种方法24天预测结果的平均SSGPE随细分区间变化示意图；

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1a为本发明实施例一提供的一种基于连续血糖监测的方法的流程图，本实施例可适用于利用群体血糖数据预测个体血糖浓度情况，该方法可以由基于连续血糖监测的装置来执行，具体包括如下步骤：

步骤S110、获取至少两名用户的血糖数据，根据预设的数据拼接方法构成第一血糖数据矩阵，从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据。

其中，用户的血糖数据可以通过使用CGM设备进行采集，所述CGM设备可以包括动态血糖仪，通过CGM采集的血糖数据一般设定每隔一段时间采集一次，因此，采集的血糖数据都是按照时间顺序排列的，随着时间的变化而变化，且所采集的数据和数据之间是互相关联的，满足时间序列的特点。数据按照时间的顺序进行采集，将采集的数据组成一个时间序列，主要展示的是数据在一段连续的时间内的动态变化，然后从中寻找数据变化的规律及未来可能发展的趋势。预测就是根据可以获得的数据利用一定的算法和思维对未来发展的趋势做出合理的推测。将跟时间有关的数据组成序列，进行预测的基本思路是：预测一类数据的变化趋势，采用历史数据的值来预测未来一段时间内的值，即通过对某一个现象的历史数据进行研究，进而发现数据随着时间变化的规律，然后运用这种规律对未来进行预测。预设的数据拼接方法为由多名用户的血糖数据构建群体血糖数据所依据的规则。

步骤S120、采用机器学习算法，根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据，对预设的数学模型进行训练，得到血糖数据预测模型。

其中，机器学习算法的研究目的是使用计算机模拟人类的学习活动，它是研究计算机识别现有知识、获取新知识、不断改善性能和实现自身完善的方法，可以通过对已知数据学习来预测未知数据的结果。基于此，针对时间序列的预测算法中可以采用机器学习算法。机器学习算法包括但不限于LSTM(Long Short Term Memory，长短期记忆)网络算法，所述LSTM网络算法是一种特定形式的RNN(Recurrent Neural Network，循环神经网络)算法，RNN算法是一系列能够处理序列数据的神经网络的总称，LSTM网络算法在输入、反馈与防止梯度爆发之间建立了长时间的时滞。

预设的数学模型为采用的相应的机器学习算法给出的，以多组第一血糖数据输入向量为输入变量输入预设的数学模型获取第一血糖数据输入向量分别对应的输出数据的预测值，通过第一血糖数据输入向量分别对应的输出数据和第一血糖数据输入向量分别对应的输出数据的预测值，对预设的数学模型进行训练生成血糖数据预测模型。示例性的，利用损失函数评价第一血糖数据输入向量分别对应的输出数据的预测值，并选用相应的优化器，通过多次迭代更新预测模型中的参数直到其收敛到最优值，对应最优值的模型为获取的血糖数据预测模型。

步骤S130、获取一名待预测用户的已有血糖数据，根据预设的数据拼接方法构成第二血糖数据输入向量。

步骤S140、将所述第二血糖数据输入向量输入所述血糖数据预测模型，获取所述待预测用户的当前时刻之后的血糖数据的预测值。

其中，当前时刻之后可以为当天的当前时刻之后的任一时刻。

具体地，如图1b所示，步骤S110包括如下步骤：

步骤S111、将获取的至少两名用户的血糖数据，按照采集时间周期排列构成所述第一血糖数据矩阵，其中，所述第一血糖数据矩阵中的一个行向量包括一名用户在一个采集时间周期内的血糖数据，一名用户在一个采集时间周期内的血糖数据通过每隔i时间采集一次的方式获取并按照时间先后顺序依次排列。

其中，采集时间周期为一天，每名用户的血糖数据可以为获取的一天的血糖数据，也可以为获取的多天的血糖数据，根据实际情况设定，并不作具体限定。第一血糖数据矩阵由多个行向量构成，其中，每个行向量由一名用户在一天内按照采集血糖数据的时间先后顺序依次排列构成。

步骤S112、根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据，针对所述第一血糖数据矩阵中的每个行向量，提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成所述第一血糖数据输入向量，并提取当前行向量中设定时刻以后的第p个血糖数据作为所述第一血糖数据输入向量对应的输出数据。

其中，第一血糖数据输入向量对应的输出数据用于对预设的数学模型进行训练生成血糖数据预测模型，示例性的，设定每名用户每天采集的血糖数据总个数为N，设定时刻的血糖数据为采集的第j个血糖数据，则t∈(1,j)，p∈[1，N-j]，j∈(1,N)。

进一步地，第一血糖数据输入向量包括的血糖数据和第一血糖数据输入向量对应的输出数据为获取的同一天的血糖数据，即当天的血糖数据只用来预测当天的血糖浓度。

具体地，如图1c所示，步骤S130包括如下步骤：

步骤S131、提取在当前采集时间周期内采集的待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据，构成第二血糖数据输入向量。

其中，采用和步骤S111中采集血糖数据的相同的方式，采集待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据，即每隔i时间采集一次。第二血糖数据输入向量由上述血糖数据按照时间先后顺序依次排列构成。此外，本步骤与步骤S112中所述t相同。

其中，步骤S110、步骤S120构成采用机器学习算法进行血糖数据预测的训练阶段，训练阶段的目的在于生成血糖数据预测模型，为预测阶段提供模型基础。同时，建立上述阶段的数据基础是基于预设的数据拼接方法将多名用户的血糖数据构成的群体血糖数据。

其中，步骤S130、步骤S140构成采用机器学习算法进行血糖数据预测的预测阶段，预测阶段的目的在于利用获取的血糖数据预测模型对一名用户的血糖浓度进行预测。

本实施例的技术方案，通过根据预设的数据拼接方法构建由多用户血糖数据构成的群体血糖数据，并基于上述群体血糖数据采用机器学习算法建立血糖数据预测模型，利用上述血糖预测模型预测待预测用户这一个体的血糖浓度，解决了由于个体采集的血糖数据量较少，无法应用上述机器学习算法对其血糖浓度进行预测问题，实现了用群体血糖数据预测个体血糖浓度。

实施例二

图2a为本发明实施例三提供的一种基于连续血糖监测的装置的结构框图，本实施例可适用于利用群体血糖数据预测个体血糖浓度情况，该装置具体包括：

训练阶段血糖数据生成模块210，用于获取至少两名用户的血糖数据，根据预设的数据拼接方法构成第一血糖数据矩阵，从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据。

血糖数据预测模型生成模块220，用于采用机器学习算法，根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据，对预设的数学模型进行训练，得到血糖数据预测模型。

预测阶段血糖数据生成模块230，用于获取一名待预测用户的已有血糖数据，根据预设的数据拼接方法构成第二血糖数据输入向量。

血糖数据的预测值获取模块240，用于将所述第二血糖数据输入向量输入所述血糖数据预测模型，获取所述待预测用户的当前时刻之后的血糖数据的预测值。

具体地，如图2b所示，训练阶段血糖数据生成模块210，包括：

第一血糖数据矩阵生成模块211，用于将获取的至少两名用户的血糖数据，按照采集时间周期排列构成所述第一血糖数据矩阵，其中，所述第一血糖数据矩阵中的一个行向量包括一名用户在一个采集时间周期内的血糖数据，一名用户在一个采集时间周期内的血糖数据通过每隔i时间采集一次的方式获取并按照时间先后顺序依次排列。

第一血糖数据输入向量及对应的输出数据生成模块212，用于根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据，针对所述第一血糖数据矩阵中的每个行向量，提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成所述第一血糖数据输入向量，并提取当前行向量中设定时刻以后的第p个血糖数据作为所述第一血糖数据输入向量对应的输出数据。

具体地，如图2c所示，预测阶段血糖数据生成模块230，包括：

第二血糖数据输入向量生成模块231，用于提取在当前采集时间周期内采集的所述待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据，构成所述第二血糖数据输入向量。

其中，训练阶段血糖数据生成模块210、血糖数据预测模型生成模块220用于构成采用机器学习算法进行血糖数据预测的训练阶段，训练阶段的目的在于生成血糖数据预测模型，为预测阶段提供模型基础。同时，建立上述阶段的数据基础是基于预设的数据拼接方法将多名用户的血糖数据构成的群体血糖数据。

其中，预测阶段血糖数据生成模块230、血糖数据的预测值获取模块240用于构成采用机器学习算法进行血糖数据预测的预测阶段，预测阶段的目的在于利用获取的血糖数据预测模型对一名用户的血糖数据进行预测。

实施例三

本实施例为优选实施例，本实施例提供一种基于连续血糖监测的LSTM算法实现群体血糖数据预测个体血糖数据。图3a、图3b分别是本发明实施例四提供的一种基于连续血糖监测的LSTM网络算法训练阶段、预测阶段的流程图。该方法可以由基于连续血糖监测的装置来执行，该方法具体包括如下步骤：

步骤S310、将CGM设备采集的多名用户的血糖数据按天排列成矩阵D。

步骤S320、根据预设的数据拼接方法得到输入矩阵D_in和输出矩阵D_out。

其中，CGM设备可以实时采集用户的血糖数据，并每隔i时间输出一个血糖值，采集完的数据按照天进行保存，不足一天的数据做丢弃处理，共采集到M天的血糖数据，每天采集数据N个。

如图3c所示，给出了预设的数据拼接方法示意图，具体地，将获取的多名用户的血糖数据，按照采集时间周期排列构成血糖数据矩阵其中，D中的一个行向量为一名用户在一天内采集血糖数据的时间先后顺序依次排列构成，D_m,n为第m天第n个血糖数据，m∈[1,M],n∈[1,N]，M为天数，N为每天采集的血糖数据总个数。

根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据，针对D中的每个行向量，提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成输入矩阵并提取当前行向量中设定时刻以后的第p个血糖数据作为D_in对应的输出矩阵D_out＝[D_1,t+p,D_1,t+p+1,K,D_1,N,D_2,t+p,L,D_M,N-1,D_M,N]^T，其中，m∈[1,M],n∈[1,N]，并设定当前时刻为第j个血糖数据，则t∈(1,j)，p∈[1，N-j]，j∈(1,N)。且在数据拼接过程中，当天的血糖数据只用来预测当天的血糖浓度，不跨天进行预测以消除拼接点处的影响。为了便于说明，通过上述方法处理之后的输入输出数据，统一表示为D_out＝[D_1,t+p,K,D_m,t+p,K,D_M,t+p]^T，其中，t、p、m、n、M含义同上。

步骤S330、将D_in按行向量输入LSTM网络输入层获取LSTM层输出h_LSTM，并将LSTM层输出h_LSTM输入到输出层获取模型输出h_out。

其中，如图3d，给出了LSTM网络算法结构示意图，LSTM网络算法分为输入层、LSTM层以及输出层。

D_in按行向量表示为D_m＝[D_m,1,L,D_m,t-1,D_m,t]，将其输入LSTM网络输入层得到LSTM层输出h_LSTM＝f_LSTM(D_m)，其中，f_LSTM为LSTM网络对输入行向量D_m进行的函数操作。

将LSTM层输出h_LSTM输入到输出层，得到模型输出h_out＝f_out(h_LSTM)，其中，f_out为输出层的激活函数，示例性的，选用线性激活函数，即f(x)＝kx+c。

步骤S340、迭代更新模型参数。

步骤S350、输出LSTM网络模型。

其中，选用相应的损失函数计算模型输出h_out与真实输出D_out之间的代价，并选用相应的优化器通过多次迭代更新模型输出参数直到其收敛到最优值，根据收敛到最优值的模型参数确定的模型输出即为LSTM网络模型，也为血糖数据预测模型。示例性的，选用的损失函数为MSE(Mean Squared Error，均方误差)，选用的优化器为Adam优化器。

上述步骤S310-步骤S350为基于连续血糖监测的LSTM网络算法训练阶段，根据预设的数据拼接方法构建群体血糖数据，基于此，采用LSTM网络算法构建血糖数据预测模型。

在步骤S350之后，该方法还包括：

步骤S360、将CGM设备采集的一名待预测用户的血糖数据按照预设的数据拼接方法组成输入向量S_m。

其中，按照设定的t个血糖数据组成输入向量S_m＝[S_m,1,L,S_m,t-1,S_m,t]。

步骤S370、将输入向量S_m输入训练好的LSTM网络模型。

步骤S380、获取待预测用户的当前时刻之后的血糖数据。

其中，将输入向量S_m输入训练好的LSTM网络模型得到h_LSTM＝f_LSTM(S_m)，h_out＝f_out(h_LSTM)，根据设定的p，获取当前时刻之后的第p个血糖数据，其中，p根据实际情况设定，不作具体限定。

上述步骤S360-步骤S380为基于连续血糖监测的LSTM网络算法预测阶段，根据训练阶段得到的LSTM网络模型和相应的单名用户的输入依次计算对应的预测血糖数据。

示例性的，i＝3min，M＝120，N＝480，t＝10，p分别为5、10、15及20，80％的数据作为训练数据，20％的数据作为预测数据。由于采集血糖数据的间隔为3分钟，因此，可以将当前时刻之后的第p个血糖数据中的p换算成时间，并用PH(Prediction Horizon，预测范围)表示，相应的PH分别为15分钟、30分钟、45分钟及60分钟。由于CGM设备直接采集到的数据包含有一定误差，导致采集到的血糖数据有一定的随机波动，这种带抖动的原始的血糖数据将会对算法的精度带来一定的影响，因此，需要对原始血糖数据进行预处理。本实施例选用卡尔曼滤波算法进行预处理。

下面从定性和定量两方面对基于预设的数据拼接方法的LSTM网络算法的性能及预测精度进行分析。同时，比较其与基于预设的数据拼接方法的SVR算法及SVR算法性能优劣，其中，采用RMSE(Root Mean Square Error，均方差)和SSGPE(Sum of Squares ofGlucose Prediction Error，血糖预测误差的平方和)作为定量分析的评价指标，其中，其中，为获取的待预测用户的当前时刻之后的血糖数据，即为预测的血糖数据，为CGM设备测量的血糖数据。RMSE和SSGPE值越小，表明算法的性能及预测精度越好。此外，以下各图中SVR_nosplicing表示SVR算法，LSTM表示基于预设的数据拼接方法的LSTM网络算法，SVR表示基于预设的数据拼接方法的SVR算法。

具体地，针对定性分析，选取的一名待预测用户的血糖数据，图3e和图3f分别为PH＝15分钟和PH＝30分钟时的预测结果。从图中可以看出，基于预设的数据拼接方法的LSTM网络算法和SVR算法预测的血糖数据的变化趋势与用户真实血糖数据变化趋势大体一致，相较而言，基于预设的数据拼接方法的LSTM网络算法的预测值与真实值更接近，且从预测的血糖数据变化趋势可以看出，基于预设的数据拼接方法的SVR算法的时延比基于预设的数据拼接方法的LSTM网络算法更明显。对于具体血糖数据的预测，两种方法预测的血糖数据与用户真实血糖数据也大体相同，当用户真实血糖数据变化出现拐点时，预测的血糖数据便会在拐点处随机波动，但是波动幅度不大。总体来看，基于预设的数据拼接方法的LSTM网络算法性能更好。

图3g和图3h分别为PH＝45分钟和PH＝60分钟时的预测结果。从图中可以看出，基于预设的数据拼接方法的LSTM网络算法和SVR算法预测的血糖数据的变化趋势与用户真实血糖数据变化趋势大体一致，相较而言，基于预设的数据拼接方法的LSTM网络算法的预测值与真实值更接近，且从预测的血糖数据变化趋势可以看出，基于预设的数据拼接方法的SVR算法的时延比基于预设的数据拼接方法的LSTM网络算法更明显，此外，趋势的拟合程度比PH＝15分钟和PH＝30分钟时较差。对于具体血糖数据的预测，两种方法预测的血糖数据与用户真实血糖数据也大体相同，当用户真实血糖数据变化出现拐点时，预测的血糖数据便会在拐点处随机波动，波动幅度比PH＝15分钟和PH＝30分钟时更大。总体来看，基于预设的数据拼接方法的LSTM网络算法性能更好。

同时，从图中可以看出，PH＝15分钟、30分钟、45分钟及60分钟时，SVR算法与基于预设的数据拼接方法的SVR算法预测的血糖数据变化趋势相比，SVR算法预测结果的初始时间段，呈现很强的波动性，预测误差较大，随着时间的推移，预测结果与基于预设的数据拼接方法的SVR算法的预测结果相近。

针对定量分析，具体从RMSE和SSGPE两方面进行分析。

从RMSE方面分析，图3i-图3l分别为PH＝15分钟、30分钟、45分钟及60分钟时基于预设的数据拼接方法的LSTM网络算法、基于预设的数据拼接方法的SVR算法及SVR算法24天预测结果的RMSE。从图中可以看出，对于基于预设的数据拼接方法的LSTM网络算法和SVR算法，当PH＝15分钟和30分钟时，采用LSTM网络算法24天的预测结果全部优于SVR算法的预测结果；当PH＝45分钟时，采用LSTM网络算法24天的预测结果中超过90％的天数都优于SVR算法的预测结果；当PH＝60分钟时，采用LSTM网络算法24天的预测结果中将近90％的天数都优于SVR算法的预测结果。而当PH＝15分钟、30分钟、45分钟及60分钟时，采用SVR算法预测结果的RMSE值比基于预设的数据拼接方法的LSTM网络算法和SVR算法的RMSE值高出很多。为更加直观的比较三种算法性能优劣，表1给出了三种方法24天预测结果的RMSE细分统计结果。

表1 三种方法24天预测结果的RMSE细分统计

从表1中可以看出，对于基于预设的数据拼接方法的LSTM网络算法和SVR算法，当PH＝15分钟和30分钟时，采用LSTM网络算法24天的预测结果与SVR算法相比，大多数处于更小的细分区间；当PH＝45分钟时，采用LSTM网络算法24天的预测结果与SVR算法相比，依旧有更多的天数处于更小的细分区间；当PH＝60分钟时，采用LSTM网络算法24天的预测结果与SVR算法相比，细分区间的分布大体相同，但是LSTM网络算法依旧更具有优势。而当PH＝15分钟、30分钟、45分钟及60分钟时，采用SVR算法预测结果的RMSE值相比于基于预设的数据拼接方法的LSTM网络算法和SVR算法的RMSE值的区间分布，有更多的天数处于更大的细分区间。

进一步地，图3m给出了三种方法24天预测结果的平均RMSE随细分区间变化情况。从图中可以看出，无论细分区间的大小，采用基于预设的数据拼接方法的LSTM网络算法的预测结果都明显优于采用基于预设的数据拼接方法的SVR算法的预测结果，SVR算法的预测结果最差。

从SSGPE方面分析，图3n-图3q分别为PH＝15分钟、30分钟、45分钟及60分钟时基于预设的数据拼接方法的LSTM网络算法、基于预设的数据拼接方法的SVR算法及SVR算法24天预测结果的SSGPE。从图中可以看出，对于基于预设的数据拼接方法的LSTM网络算法和SVR算法，当PH＝15分钟时，采用LSTM网络算法24天的预测结果全部优于SVR算法的预测结果；当PH＝30分钟和45分钟时，采用LSTM网络算法24天的预测结果中超过95％的天数都优于SVR算法的预测结果；当PH＝60分钟时，采用LSTM网络算法24天的预测结果中将近90％的天数都优于SVR算法的预测结果。而当PH＝15分钟、30分钟、45分钟及60分钟时，采用SVR算法预测结果的SSGPE值比基于预设的数据拼接方法的LSTM网络算法和SVR算法的SSGPE值高出很多。为更加直观的比较三种算法性能优劣，表2给出了三种方法24天预测结果的SSGPE细分统计结果。

表2 三种方法24天预测结果的SSGPE细分统计

从表2中可以看出，对于基于预设的数据拼接方法的LSTM网络算法和SVR算法，当PH＝15分钟和30分钟时，采用LSTM网络算法24天的预测结果与SVR算法相比，大多数处于更小的细分区间；当PH＝45和60分钟时，采用LSTM网络算法24天的预测结果与SVR算法相比，依旧有更多的天数处于更小的细分区间。而当PH＝15分钟、30分钟、45分钟及60分钟时，采用SVR算法预测结果的RMSE值相比于基于预设的数据拼接方法的LSTM网络算法和SVR算法的RMSE值的区间分布，有更多的天数处于更大的细分区间。

进一步地，图3r给出了三种方法24天预测结果的平均SSGPE随细分区间变化情况。从图中可以看出，无论细分区间的大小，采用基于预设的数据拼接方法的LSTM网络算法的预测结果都明显优于采用基于预设的数据拼接方法的SVR算法的预测结果，SVR算法的预测结果最差。

本实施例的技术方案，通过根据预设的数据拼接方法构建由多用户血糖数据构成的群体血糖数据，并基于上述群体血糖数据采用LSTM网络算法建立血糖数据预测模型，利用上述血糖预测模型预测待预测用户这一个体的血糖浓度，解决了由于个体采集的血糖数据量较少，无法应用上述机器学习算法对其血糖浓度进行预测问题，实现了用群体血糖数据预测个体血糖浓度。同时，相比于基于预设的数据拼接方法的SVR算法和SVR算法，基于预设的数据拼接方法的SVR算法的预测精度更高，性能更好。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种基于连续血糖监测的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据预设的数据拼接方法构成第一血糖数据矩阵，从第一血糖数据矩阵中获取多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据，包括：

将获取的至少两名用户的血糖数据，按照采集时间周期排列构成所述第一血糖数据矩阵，其中，所述第一血糖数据矩阵中的一个行向量包括一名用户在一个采集时间周期内的血糖数据，一名用户在一个采集时间周期内的血糖数据通过每隔i时间采集一次的方式获取并按照时间先后顺序依次排列；

根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据，针对所述第一血糖数据矩阵中的每个行向量，提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成所述第一血糖数据输入向量，并提取当前行向量中设定时刻以后的第p个血糖数据作为所述第一血糖数据输入向量对应的输出数据。

3.根据权利要求1述的方法，其特征在于，所述根据预设的数据拼接方法构成第二血糖数据输入向量，包括：

提取在当前采集时间周期内采集的所述待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据，构成所述第二血糖数据输入向量。

4.根据权利要求2所述的方法，其特征在于，所述采集时间周期为一天；所述第一血糖数据输入向量包括的血糖数据和所述第一血糖数据输入向量对应的输出数据为获取的同一天的血糖数据。

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述机器学习算法包括长短期记忆网络算法。

6.一种基于连续血糖监测的装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述训练阶段血糖数据生成模块，包括：

第一血糖数据矩阵生成模块，用于将获取的至少两名用户的血糖数据，按照采集时间周期排列构成所述第一血糖数据矩阵，其中，所述第一血糖数据矩阵中的一个行向量包括一名用户在一个采集时间周期内的血糖数据，一名用户在一个采集时间周期内的血糖数据通过每隔i时间采集一次的方式获取并按照时间先后顺序依次排列；

第一血糖数据输入向量及对应的输出数据生成模块，用于根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据，针对所述第一血糖数据矩阵中的每个行向量，提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成所述第一血糖数据输入向量，并提取当前行向量中设定时刻以后的第p个血糖数据作为所述第一血糖数据输入向量对应的输出数据。

8.根据权利要求6所述的装置，其特征在于，所述预测阶段血糖数据生成模块，包括：

第二血糖数据输入向量生成模块，用于提取在当前采集时间周期内采集的所述待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据，构成所述第二血糖数据输入向量。

9.根据权利要求7所述的装置，其特征在于，所述采集时间周期为一天；所述第一血糖数据输入向量包括的血糖数据和所述第一血糖数据输入向量对应的输出数据为获取的同一天的血糖数据。

10.根据权利要求6-9中任一项所述的装置，其特征在于，所述机器学习算法包括长短期记忆网络算法。