CN107203700A - 一种基于连续血糖监测的方法及装置 - Google Patents
一种基于连续血糖监测的方法及装置 Download PDFInfo
- Publication number
- CN107203700A CN107203700A CN201710574788.0A CN201710574788A CN107203700A CN 107203700 A CN107203700 A CN 107203700A CN 201710574788 A CN201710574788 A CN 201710574788A CN 107203700 A CN107203700 A CN 107203700A
- Authority
- CN
- China
- Prior art keywords
- blood glucose
- data
- glucose data
- blood
- data input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000008280 blood Substances 0.000 title claims abstract description 388
- 210000004369 blood Anatomy 0.000 title claims abstract description 388
- 238000000034 method Methods 0.000 title claims abstract description 109
- 239000008103 glucose Substances 0.000 claims abstract description 264
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims abstract description 262
- 239000013598 vector Substances 0.000 claims abstract description 104
- 239000011159 matrix material Substances 0.000 claims abstract description 37
- 238000010801 machine learning Methods 0.000 claims abstract description 28
- 238000012544 monitoring process Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 21
- 238000013178 mathematical model Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 18
- 230000008859 change Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于连续血糖监测的方法及装置,包括:获取至少两名用户的血糖数据,根据预设的数据拼接方法构成第一血糖数据矩阵,从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据;采用机器学习算法,根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据,对预设的数学模型进行训练,得到血糖数据预测模型;获取一名待预测用户的已有血糖数据,根据预设的数据拼接方法构成第二血糖数据输入向量;将所述第二血糖数据输入向量输入所述血糖数据预测模型,获取所述待预测用户的当前时刻之后的血糖数据的预测值,实现了用群体血糖数据预测个体血糖浓度。
Description
技术领域
本发明实施例涉及血糖监测领域,尤其涉及一种基于连续血糖监测的方法及装置。
背景技术
糖尿病是长期血糖水平波动超出正常范围(90-120mmol/L)之外的代谢病理状态,若管理不善将会导致严重的并发症。目前,糖尿病的治疗尚无有效方法,现有的血糖测量方法都需要频繁针刺取血进行血糖的自我监测,经常性地对患者进行针刺取血,会对患者造成生理上的疼痛与心理上的恐惧与抵触,甚至会引发感染,从而限制了血糖检测的频率。由于采集的血糖数据较少,使得很多数据分析方法无法使用。
CGM(Continuous Glucose Monitoring,连续血糖监测)技术的出现,为有效解决上述问题提供了可能,其中,最重要的是为通过数据分析方法实现血糖浓度预测提供了可能。具体地,CGM设备通过微创或无创方式实时采集患者的血糖浓度,并每隔较短时间间隔输出一个血糖数据,测得的连续血糖数据可以看作是一种时间序列,针对时间序列的预测算法中,最典型的便是机器学习算法,如ANN(Artificial Neural Network,人工神经网络),SVR(Support Vector Regression,支持向量机回归),RT(Regression Tree,回归树)等,应用上述机器学习算法对连续血糖时间序列进行预测,上述是建立在采集的血糖数据足够多的基础上实现的。但是,在实际应用中,由于很多患者使用CGM设备时间较短,导致采集的血糖数据量较少,因而,无法应用上述机器学习算法对其血糖浓度进行预测。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明提供一种基于连续血糖监测的方法及装置,实现用群体血糖数据预测个体血糖数据。
第一方面,本发明实施例提供了一种基于连续血糖监测的方法,包括:
获取至少两名用户的血糖数据,根据预设的数据拼接方法构成第一血糖数据矩阵,从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据;
采用机器学习算法,根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据,对预设的数学模型进行训练,得到血糖数据预测模型;
获取一名待预测用户的已有血糖数据,根据预设的数据拼接方法构成第二血糖数据输入向量;
将所述第二血糖数据输入向量输入所述血糖数据预测模型,获取所述待预测用户的当前时刻之后的血糖数据的预测值。
第二方面,本发明实施例还提供了一种基于连续血糖监测的装置,包括:
训练阶段血糖数据生成模块,用于获取至少两名用户的血糖数据,根据预设的数据拼接方法构成第一血糖数据矩阵,从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据;
血糖数据预测模型生成模块,用于采用机器学习算法,根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据,对预设的数学模型进行训练,得到血糖数据预测模型;
预测阶段血糖数据生成模块,用于获取一名待预测用户的已有血糖数据,根据预设的数据拼接方法构成第二血糖数据输入向量;
血糖数据的预测值获取模块,用于将所述第二血糖数据输入向量输入所述血糖数据预测模型,获取所述待预测用户的当前时刻之后的血糖数据的预测值。
本发明通过根据预设的数据拼接方法构建由多用户血糖数据构成的群体血糖数据,并基于上述群体血糖数据采用机器学习算法建立血糖数据预测模型,利用上述血糖预测模型预测待预测用户这一个体的血糖浓度,解决了由于个体采集的血糖数据量较少,无法应用上述机器学习算法对其血糖浓度进行预测问题,实现了用群体血糖数据预测个体血糖浓度。
附图说明
图1a是本发明实施例一中的一种基于连续血糖监测的方法的流程图;
图1b是本发明实施例一中的一种基于连续血糖监测的方法的流程图;
图1c是本发明实施例一中的一种基于连续血糖监测的方法的流程图;
图2a是本发明实施例二中的一种基于连续血糖监测的装置的结构框图;
图2b是本发明实施例二中的训练阶段血糖数据生成模块的结构框图;
图2c是本发明实施例二中的预测阶段血糖数据生成模块的结构框图;
图3a是本发明实施例三中的一种基于连续血糖监测的LSTM网络算法训练阶段的流程图;
图3b是本发明实施例三中的一种基于连续血糖监测的LSTM网络算法预测阶段的流程图;
图3c是本发明实施例三中的预设的数据拼接方法示意图;
图3d是本发明实施例三中的LSTM网络算法结构示意图;
图3e是本发明实施例三中的PH=15分钟时三种方法的预测结果示意图;
图3f是本发明实施例三中的PH=30分钟时三种方法的预测结果示意图;
图3g是本发明实施例三中的PH=45分钟时三种方法的预测结果示意图;
图3h是本发明实施例三中的PH=60分钟时三种方法的预测结果示意图;
图3i是本发明实施例三中的PH=15分钟时三种方法24天预测结果的RMSE示意图;
图3j是本发明实施例三中的PH=30分钟时三种方法24天预测结果的RMSE示意图;
图3k是本发明实施例三中的PH=45分钟时三种方法24天预测结果的RMSE示意图;
图3l是本发明实施例三中的PH=60分钟时三种方法24天预测结果的RMSE示意图;
图3m是本发明实施例三中的三种方法24天预测结果的平均RMSE随细分区间变化示意图;
图3n是本发明实施例三中的PH=15分钟时三种方法24天预测结果的SSGPE示意图;
图3o是本发明实施例三中的PH=30分钟时三种方法24天预测结果的SSGPE示意图;
图3p是本发明实施例三中的PH=45分钟时三种方法24天预测结果的SSGPE示意图;
图3q是本发明实施例三中的PH=60分钟时三种方法24天预测结果的SSGPE示意图;
图3r是本发明实施例三中的三种方法24天预测结果的平均SSGPE随细分区间变化示意图;
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1a为本发明实施例一提供的一种基于连续血糖监测的方法的流程图,本实施例可适用于利用群体血糖数据预测个体血糖浓度情况,该方法可以由基于连续血糖监测的装置来执行,具体包括如下步骤:
步骤S110、获取至少两名用户的血糖数据,根据预设的数据拼接方法构成第一血糖数据矩阵,从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据。
其中,用户的血糖数据可以通过使用CGM设备进行采集,所述CGM设备可以包括动态血糖仪,通过CGM采集的血糖数据一般设定每隔一段时间采集一次,因此,采集的血糖数据都是按照时间顺序排列的,随着时间的变化而变化,且所采集的数据和数据之间是互相关联的,满足时间序列的特点。数据按照时间的顺序进行采集,将采集的数据组成一个时间序列,主要展示的是数据在一段连续的时间内的动态变化,然后从中寻找数据变化的规律及未来可能发展的趋势。预测就是根据可以获得的数据利用一定的算法和思维对未来发展的趋势做出合理的推测。将跟时间有关的数据组成序列,进行预测的基本思路是:预测一类数据的变化趋势,采用历史数据的值来预测未来一段时间内的值,即通过对某一个现象的历史数据进行研究,进而发现数据随着时间变化的规律,然后运用这种规律对未来进行预测。预设的数据拼接方法为由多名用户的血糖数据构建群体血糖数据所依据的规则。
步骤S120、采用机器学习算法,根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据,对预设的数学模型进行训练,得到血糖数据预测模型。
其中,机器学习算法的研究目的是使用计算机模拟人类的学习活动,它是研究计算机识别现有知识、获取新知识、不断改善性能和实现自身完善的方法,可以通过对已知数据学习来预测未知数据的结果。基于此,针对时间序列的预测算法中可以采用机器学习算法。机器学习算法包括但不限于LSTM(Long Short Term Memory,长短期记忆)网络算法,所述LSTM网络算法是一种特定形式的RNN(Recurrent Neural Network,循环神经网络)算法,RNN算法是一系列能够处理序列数据的神经网络的总称,LSTM网络算法在输入、反馈与防止梯度爆发之间建立了长时间的时滞。
预设的数学模型为采用的相应的机器学习算法给出的,以多组第一血糖数据输入向量为输入变量输入预设的数学模型获取第一血糖数据输入向量分别对应的输出数据的预测值,通过第一血糖数据输入向量分别对应的输出数据和第一血糖数据输入向量分别对应的输出数据的预测值,对预设的数学模型进行训练生成血糖数据预测模型。示例性的,利用损失函数评价第一血糖数据输入向量分别对应的输出数据的预测值,并选用相应的优化器,通过多次迭代更新预测模型中的参数直到其收敛到最优值,对应最优值的模型为获取的血糖数据预测模型。
步骤S130、获取一名待预测用户的已有血糖数据,根据预设的数据拼接方法构成第二血糖数据输入向量。
步骤S140、将所述第二血糖数据输入向量输入所述血糖数据预测模型,获取所述待预测用户的当前时刻之后的血糖数据的预测值。
其中,当前时刻之后可以为当天的当前时刻之后的任一时刻。
具体地,如图1b所示,步骤S110包括如下步骤:
步骤S111、将获取的至少两名用户的血糖数据,按照采集时间周期排列构成所述第一血糖数据矩阵,其中,所述第一血糖数据矩阵中的一个行向量包括一名用户在一个采集时间周期内的血糖数据,一名用户在一个采集时间周期内的血糖数据通过每隔i时间采集一次的方式获取并按照时间先后顺序依次排列。
其中,采集时间周期为一天,每名用户的血糖数据可以为获取的一天的血糖数据,也可以为获取的多天的血糖数据,根据实际情况设定,并不作具体限定。第一血糖数据矩阵由多个行向量构成,其中,每个行向量由一名用户在一天内按照采集血糖数据的时间先后顺序依次排列构成。
步骤S112、根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据,针对所述第一血糖数据矩阵中的每个行向量,提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成所述第一血糖数据输入向量,并提取当前行向量中设定时刻以后的第p个血糖数据作为所述第一血糖数据输入向量对应的输出数据。
其中,第一血糖数据输入向量对应的输出数据用于对预设的数学模型进行训练生成血糖数据预测模型,示例性的,设定每名用户每天采集的血糖数据总个数为N,设定时刻的血糖数据为采集的第j个血糖数据,则t∈(1,j),p∈[1,N-j],j∈(1,N)。
进一步地,第一血糖数据输入向量包括的血糖数据和第一血糖数据输入向量对应的输出数据为获取的同一天的血糖数据,即当天的血糖数据只用来预测当天的血糖浓度。
具体地,如图1c所示,步骤S130包括如下步骤:
步骤S131、提取在当前采集时间周期内采集的待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据,构成第二血糖数据输入向量。
其中,采用和步骤S111中采集血糖数据的相同的方式,采集待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据,即每隔i时间采集一次。第二血糖数据输入向量由上述血糖数据按照时间先后顺序依次排列构成。此外,本步骤与步骤S112中所述t相同。
其中,步骤S110、步骤S120构成采用机器学习算法进行血糖数据预测的训练阶段,训练阶段的目的在于生成血糖数据预测模型,为预测阶段提供模型基础。同时,建立上述阶段的数据基础是基于预设的数据拼接方法将多名用户的血糖数据构成的群体血糖数据。
其中,步骤S130、步骤S140构成采用机器学习算法进行血糖数据预测的预测阶段,预测阶段的目的在于利用获取的血糖数据预测模型对一名用户的血糖浓度进行预测。
本实施例的技术方案,通过根据预设的数据拼接方法构建由多用户血糖数据构成的群体血糖数据,并基于上述群体血糖数据采用机器学习算法建立血糖数据预测模型,利用上述血糖预测模型预测待预测用户这一个体的血糖浓度,解决了由于个体采集的血糖数据量较少,无法应用上述机器学习算法对其血糖浓度进行预测问题,实现了用群体血糖数据预测个体血糖浓度。
实施例二
图2a为本发明实施例三提供的一种基于连续血糖监测的装置的结构框图,本实施例可适用于利用群体血糖数据预测个体血糖浓度情况,该装置具体包括:
训练阶段血糖数据生成模块210,用于获取至少两名用户的血糖数据,根据预设的数据拼接方法构成第一血糖数据矩阵,从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据。
血糖数据预测模型生成模块220,用于采用机器学习算法,根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据,对预设的数学模型进行训练,得到血糖数据预测模型。
预测阶段血糖数据生成模块230,用于获取一名待预测用户的已有血糖数据,根据预设的数据拼接方法构成第二血糖数据输入向量。
血糖数据的预测值获取模块240,用于将所述第二血糖数据输入向量输入所述血糖数据预测模型,获取所述待预测用户的当前时刻之后的血糖数据的预测值。
具体地,如图2b所示,训练阶段血糖数据生成模块210,包括:
第一血糖数据矩阵生成模块211,用于将获取的至少两名用户的血糖数据,按照采集时间周期排列构成所述第一血糖数据矩阵,其中,所述第一血糖数据矩阵中的一个行向量包括一名用户在一个采集时间周期内的血糖数据,一名用户在一个采集时间周期内的血糖数据通过每隔i时间采集一次的方式获取并按照时间先后顺序依次排列。
第一血糖数据输入向量及对应的输出数据生成模块212,用于根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据,针对所述第一血糖数据矩阵中的每个行向量,提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成所述第一血糖数据输入向量,并提取当前行向量中设定时刻以后的第p个血糖数据作为所述第一血糖数据输入向量对应的输出数据。
具体地,如图2c所示,预测阶段血糖数据生成模块230,包括:
第二血糖数据输入向量生成模块231,用于提取在当前采集时间周期内采集的所述待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据,构成所述第二血糖数据输入向量。
其中,训练阶段血糖数据生成模块210、血糖数据预测模型生成模块220用于构成采用机器学习算法进行血糖数据预测的训练阶段,训练阶段的目的在于生成血糖数据预测模型,为预测阶段提供模型基础。同时,建立上述阶段的数据基础是基于预设的数据拼接方法将多名用户的血糖数据构成的群体血糖数据。
其中,预测阶段血糖数据生成模块230、血糖数据的预测值获取模块240用于构成采用机器学习算法进行血糖数据预测的预测阶段,预测阶段的目的在于利用获取的血糖数据预测模型对一名用户的血糖数据进行预测。
本实施例的技术方案,通过根据预设的数据拼接方法构建由多用户血糖数据构成的群体血糖数据,并基于上述群体血糖数据采用机器学习算法建立血糖数据预测模型,利用上述血糖预测模型预测待预测用户这一个体的血糖浓度,解决了由于个体采集的血糖数据量较少,无法应用上述机器学习算法对其血糖浓度进行预测问题,实现了用群体血糖数据预测个体血糖浓度。
实施例三
本实施例为优选实施例,本实施例提供一种基于连续血糖监测的LSTM算法实现群体血糖数据预测个体血糖数据。图3a、图3b分别是本发明实施例四提供的一种基于连续血糖监测的LSTM网络算法训练阶段、预测阶段的流程图。该方法可以由基于连续血糖监测的装置来执行,该方法具体包括如下步骤:
步骤S310、将CGM设备采集的多名用户的血糖数据按天排列成矩阵D。
步骤S320、根据预设的数据拼接方法得到输入矩阵Din和输出矩阵Dout。
其中,CGM设备可以实时采集用户的血糖数据,并每隔i时间输出一个血糖值,采集完的数据按照天进行保存,不足一天的数据做丢弃处理,共采集到M天的血糖数据,每天采集数据N个。
如图3c所示,给出了预设的数据拼接方法示意图,具体地,将获取的多名用户的血糖数据,按照采集时间周期排列构成血糖数据矩阵其中,D中的一个行向量为一名用户在一天内采集血糖数据的时间先后顺序依次排列构成,Dm,n为第m天第n个血糖数据,m∈[1,M],n∈[1,N],M为天数,N为每天采集的血糖数据总个数。
根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据,针对D中的每个行向量,提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成输入矩阵并提取当前行向量中设定时刻以后的第p个血糖数据作为Din对应的输出矩阵Dout=[D1,t+p,D1,t+p+1,K,D1,N,D2,t+p,L,DM,N-1,DM,N]T,其中,m∈[1,M],n∈[1,N],并设定当前时刻为第j个血糖数据,则t∈(1,j),p∈[1,N-j],j∈(1,N)。且在数据拼接过程中,当天的血糖数据只用来预测当天的血糖浓度,不跨天进行预测以消除拼接点处的影响。为了便于说明,通过上述方法处理之后的输入输出数据,统一表示为Dout=[D1,t+p,K,Dm,t+p,K,DM,t+p]T,其中,t、p、m、n、M含义同上。
步骤S330、将Din按行向量输入LSTM网络输入层获取LSTM层输出hLSTM,并将LSTM层输出hLSTM输入到输出层获取模型输出hout。
其中,如图3d,给出了LSTM网络算法结构示意图,LSTM网络算法分为输入层、LSTM层以及输出层。
Din按行向量表示为Dm=[Dm,1,L,Dm,t-1,Dm,t],将其输入LSTM网络输入层得到LSTM层输出hLSTM=fLSTM(Dm),其中,fLSTM为LSTM网络对输入行向量Dm进行的函数操作。
将LSTM层输出hLSTM输入到输出层,得到模型输出hout=fout(hLSTM),其中,fout为输出层的激活函数,示例性的,选用线性激活函数,即f(x)=kx+c。
步骤S340、迭代更新模型参数。
步骤S350、输出LSTM网络模型。
其中,选用相应的损失函数计算模型输出hout与真实输出Dout之间的代价,并选用相应的优化器通过多次迭代更新模型输出参数直到其收敛到最优值,根据收敛到最优值的模型参数确定的模型输出即为LSTM网络模型,也为血糖数据预测模型。示例性的,选用的损失函数为MSE(Mean Squared Error,均方误差),选用的优化器为Adam优化器。
上述步骤S310-步骤S350为基于连续血糖监测的LSTM网络算法训练阶段,根据预设的数据拼接方法构建群体血糖数据,基于此,采用LSTM网络算法构建血糖数据预测模型。
在步骤S350之后,该方法还包括:
步骤S360、将CGM设备采集的一名待预测用户的血糖数据按照预设的数据拼接方法组成输入向量Sm。
其中,按照设定的t个血糖数据组成输入向量Sm=[Sm,1,L,Sm,t-1,Sm,t]。
步骤S370、将输入向量Sm输入训练好的LSTM网络模型。
步骤S380、获取待预测用户的当前时刻之后的血糖数据。
其中,将输入向量Sm输入训练好的LSTM网络模型得到hLSTM=fLSTM(Sm),hout=fout(hLSTM),根据设定的p,获取当前时刻之后的第p个血糖数据,其中,p根据实际情况设定,不作具体限定。
上述步骤S360-步骤S380为基于连续血糖监测的LSTM网络算法预测阶段,根据训练阶段得到的LSTM网络模型和相应的单名用户的输入依次计算对应的预测血糖数据。
示例性的,i=3min,M=120,N=480,t=10,p分别为5、10、15及20,80%的数据作为训练数据,20%的数据作为预测数据。由于采集血糖数据的间隔为3分钟,因此,可以将当前时刻之后的第p个血糖数据中的p换算成时间,并用PH(Prediction Horizon,预测范围)表示,相应的PH分别为15分钟、30分钟、45分钟及60分钟。由于CGM设备直接采集到的数据包含有一定误差,导致采集到的血糖数据有一定的随机波动,这种带抖动的原始的血糖数据将会对算法的精度带来一定的影响,因此,需要对原始血糖数据进行预处理。本实施例选用卡尔曼滤波算法进行预处理。
下面从定性和定量两方面对基于预设的数据拼接方法的LSTM网络算法的性能及预测精度进行分析。同时,比较其与基于预设的数据拼接方法的SVR算法及SVR算法性能优劣,其中,采用RMSE(Root Mean Square Error,均方差)和SSGPE(Sum of Squares ofGlucose Prediction Error,血糖预测误差的平方和)作为定量分析的评价指标,其中, 其中,为获取的待预测用户的当前时刻之后的血糖数据,即为预测的血糖数据,为CGM设备测量的血糖数据。RMSE和SSGPE值越小,表明算法的性能及预测精度越好。此外,以下各图中SVR_nosplicing表示SVR算法,LSTM表示基于预设的数据拼接方法的LSTM网络算法,SVR表示基于预设的数据拼接方法的SVR算法。
具体地,针对定性分析,选取的一名待预测用户的血糖数据,图3e和图3f分别为PH=15分钟和PH=30分钟时的预测结果。从图中可以看出,基于预设的数据拼接方法的LSTM网络算法和SVR算法预测的血糖数据的变化趋势与用户真实血糖数据变化趋势大体一致,相较而言,基于预设的数据拼接方法的LSTM网络算法的预测值与真实值更接近,且从预测的血糖数据变化趋势可以看出,基于预设的数据拼接方法的SVR算法的时延比基于预设的数据拼接方法的LSTM网络算法更明显。对于具体血糖数据的预测,两种方法预测的血糖数据与用户真实血糖数据也大体相同,当用户真实血糖数据变化出现拐点时,预测的血糖数据便会在拐点处随机波动,但是波动幅度不大。总体来看,基于预设的数据拼接方法的LSTM网络算法性能更好。
图3g和图3h分别为PH=45分钟和PH=60分钟时的预测结果。从图中可以看出,基于预设的数据拼接方法的LSTM网络算法和SVR算法预测的血糖数据的变化趋势与用户真实血糖数据变化趋势大体一致,相较而言,基于预设的数据拼接方法的LSTM网络算法的预测值与真实值更接近,且从预测的血糖数据变化趋势可以看出,基于预设的数据拼接方法的SVR算法的时延比基于预设的数据拼接方法的LSTM网络算法更明显,此外,趋势的拟合程度比PH=15分钟和PH=30分钟时较差。对于具体血糖数据的预测,两种方法预测的血糖数据与用户真实血糖数据也大体相同,当用户真实血糖数据变化出现拐点时,预测的血糖数据便会在拐点处随机波动,波动幅度比PH=15分钟和PH=30分钟时更大。总体来看,基于预设的数据拼接方法的LSTM网络算法性能更好。
同时,从图中可以看出,PH=15分钟、30分钟、45分钟及60分钟时,SVR算法与基于预设的数据拼接方法的SVR算法预测的血糖数据变化趋势相比,SVR算法预测结果的初始时间段,呈现很强的波动性,预测误差较大,随着时间的推移,预测结果与基于预设的数据拼接方法的SVR算法的预测结果相近。
针对定量分析,具体从RMSE和SSGPE两方面进行分析。
从RMSE方面分析,图3i-图3l分别为PH=15分钟、30分钟、45分钟及60分钟时基于预设的数据拼接方法的LSTM网络算法、基于预设的数据拼接方法的SVR算法及SVR算法24天预测结果的RMSE。从图中可以看出,对于基于预设的数据拼接方法的LSTM网络算法和SVR算法,当PH=15分钟和30分钟时,采用LSTM网络算法24天的预测结果全部优于SVR算法的预测结果;当PH=45分钟时,采用LSTM网络算法24天的预测结果中超过90%的天数都优于SVR算法的预测结果;当PH=60分钟时,采用LSTM网络算法24天的预测结果中将近90%的天数都优于SVR算法的预测结果。而当PH=15分钟、30分钟、45分钟及60分钟时,采用SVR算法预测结果的RMSE值比基于预设的数据拼接方法的LSTM网络算法和SVR算法的RMSE值高出很多。为更加直观的比较三种算法性能优劣,表1给出了三种方法24天预测结果的RMSE细分统计结果。
表1 三种方法24天预测结果的RMSE细分统计
从表1中可以看出,对于基于预设的数据拼接方法的LSTM网络算法和SVR算法,当PH=15分钟和30分钟时,采用LSTM网络算法24天的预测结果与SVR算法相比,大多数处于更小的细分区间;当PH=45分钟时,采用LSTM网络算法24天的预测结果与SVR算法相比,依旧有更多的天数处于更小的细分区间;当PH=60分钟时,采用LSTM网络算法24天的预测结果与SVR算法相比,细分区间的分布大体相同,但是LSTM网络算法依旧更具有优势。而当PH=15分钟、30分钟、45分钟及60分钟时,采用SVR算法预测结果的RMSE值相比于基于预设的数据拼接方法的LSTM网络算法和SVR算法的RMSE值的区间分布,有更多的天数处于更大的细分区间。
进一步地,图3m给出了三种方法24天预测结果的平均RMSE随细分区间变化情况。从图中可以看出,无论细分区间的大小,采用基于预设的数据拼接方法的LSTM网络算法的预测结果都明显优于采用基于预设的数据拼接方法的SVR算法的预测结果,SVR算法的预测结果最差。
从SSGPE方面分析,图3n-图3q分别为PH=15分钟、30分钟、45分钟及60分钟时基于预设的数据拼接方法的LSTM网络算法、基于预设的数据拼接方法的SVR算法及SVR算法24天预测结果的SSGPE。从图中可以看出,对于基于预设的数据拼接方法的LSTM网络算法和SVR算法,当PH=15分钟时,采用LSTM网络算法24天的预测结果全部优于SVR算法的预测结果;当PH=30分钟和45分钟时,采用LSTM网络算法24天的预测结果中超过95%的天数都优于SVR算法的预测结果;当PH=60分钟时,采用LSTM网络算法24天的预测结果中将近90%的天数都优于SVR算法的预测结果。而当PH=15分钟、30分钟、45分钟及60分钟时,采用SVR算法预测结果的SSGPE值比基于预设的数据拼接方法的LSTM网络算法和SVR算法的SSGPE值高出很多。为更加直观的比较三种算法性能优劣,表2给出了三种方法24天预测结果的SSGPE细分统计结果。
表2 三种方法24天预测结果的SSGPE细分统计
从表2中可以看出,对于基于预设的数据拼接方法的LSTM网络算法和SVR算法,当PH=15分钟和30分钟时,采用LSTM网络算法24天的预测结果与SVR算法相比,大多数处于更小的细分区间;当PH=45和60分钟时,采用LSTM网络算法24天的预测结果与SVR算法相比,依旧有更多的天数处于更小的细分区间。而当PH=15分钟、30分钟、45分钟及60分钟时,采用SVR算法预测结果的RMSE值相比于基于预设的数据拼接方法的LSTM网络算法和SVR算法的RMSE值的区间分布,有更多的天数处于更大的细分区间。
进一步地,图3r给出了三种方法24天预测结果的平均SSGPE随细分区间变化情况。从图中可以看出,无论细分区间的大小,采用基于预设的数据拼接方法的LSTM网络算法的预测结果都明显优于采用基于预设的数据拼接方法的SVR算法的预测结果,SVR算法的预测结果最差。
本实施例的技术方案,通过根据预设的数据拼接方法构建由多用户血糖数据构成的群体血糖数据,并基于上述群体血糖数据采用LSTM网络算法建立血糖数据预测模型,利用上述血糖预测模型预测待预测用户这一个体的血糖浓度,解决了由于个体采集的血糖数据量较少,无法应用上述机器学习算法对其血糖浓度进行预测问题,实现了用群体血糖数据预测个体血糖浓度。同时,相比于基于预设的数据拼接方法的SVR算法和SVR算法,基于预设的数据拼接方法的SVR算法的预测精度更高,性能更好。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种基于连续血糖监测的方法,其特征在于,包括:
获取至少两名用户的血糖数据,根据预设的数据拼接方法构成第一血糖数据矩阵,从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据;
采用机器学习算法,根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据,对预设的数学模型进行训练,得到血糖数据预测模型;
获取一名待预测用户的已有血糖数据,根据预设的数据拼接方法构成第二血糖数据输入向量;
将所述第二血糖数据输入向量输入所述血糖数据预测模型,获取所述待预测用户的当前时刻之后的血糖数据的预测值。
2.根据权利要求1所述的方法,其特征在于,所述根据预设的数据拼接方法构成第一血糖数据矩阵,从第一血糖数据矩阵中获取多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据,包括:
将获取的至少两名用户的血糖数据,按照采集时间周期排列构成所述第一血糖数据矩阵,其中,所述第一血糖数据矩阵中的一个行向量包括一名用户在一个采集时间周期内的血糖数据,一名用户在一个采集时间周期内的血糖数据通过每隔i时间采集一次的方式获取并按照时间先后顺序依次排列;
根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据,针对所述第一血糖数据矩阵中的每个行向量,提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成所述第一血糖数据输入向量,并提取当前行向量中设定时刻以后的第p个血糖数据作为所述第一血糖数据输入向量对应的输出数据。
3.根据权利要求1述的方法,其特征在于,所述根据预设的数据拼接方法构成第二血糖数据输入向量,包括:
提取在当前采集时间周期内采集的所述待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据,构成所述第二血糖数据输入向量。
4.根据权利要求2所述的方法,其特征在于,所述采集时间周期为一天;所述第一血糖数据输入向量包括的血糖数据和所述第一血糖数据输入向量对应的输出数据为获取的同一天的血糖数据。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述机器学习算法包括长短期记忆网络算法。
6.一种基于连续血糖监测的装置,其特征在于,包括:
训练阶段血糖数据生成模块,用于获取至少两名用户的血糖数据,根据预设的数据拼接方法构成第一血糖数据矩阵,从第一血糖数据矩阵中获取多个第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据;
血糖数据预测模型生成模块,用于采用机器学习算法,根据所述多组第一血糖数据输入向量以及各第一血糖数据输入向量分别对应的输出数据,对预设的数学模型进行训练,得到血糖数据预测模型;
预测阶段血糖数据生成模块,用于获取一名待预测用户的已有血糖数据,根据预设的数据拼接方法构成第二血糖数据输入向量;
血糖数据的预测值获取模块,用于将所述第二血糖数据输入向量输入所述血糖数据预测模型,获取所述待预测用户的当前时刻之后的血糖数据的预测值。
7.根据权利要求6所述的装置,其特征在于,所述训练阶段血糖数据生成模块,包括:
第一血糖数据矩阵生成模块,用于将获取的至少两名用户的血糖数据,按照采集时间周期排列构成所述第一血糖数据矩阵,其中,所述第一血糖数据矩阵中的一个行向量包括一名用户在一个采集时间周期内的血糖数据,一名用户在一个采集时间周期内的血糖数据通过每隔i时间采集一次的方式获取并按照时间先后顺序依次排列;
第一血糖数据输入向量及对应的输出数据生成模块,用于根据设定时刻的血糖数据及设定时刻以前的t个血糖数据影响设定时刻以后的血糖数据,针对所述第一血糖数据矩阵中的每个行向量,提取当前行向量中设定时刻的血糖数据及设定时刻以前的t个血糖数据构成所述第一血糖数据输入向量,并提取当前行向量中设定时刻以后的第p个血糖数据作为所述第一血糖数据输入向量对应的输出数据。
8.根据权利要求6所述的装置,其特征在于,所述预测阶段血糖数据生成模块,包括:
第二血糖数据输入向量生成模块,用于提取在当前采集时间周期内采集的所述待预测用户的当前时刻的血糖数据和当前时刻之前的t个血糖数据,构成所述第二血糖数据输入向量。
9.根据权利要求7所述的装置,其特征在于,所述采集时间周期为一天;所述第一血糖数据输入向量包括的血糖数据和所述第一血糖数据输入向量对应的输出数据为获取的同一天的血糖数据。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述机器学习算法包括长短期记忆网络算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710574788.0A CN107203700B (zh) | 2017-07-14 | 2017-07-14 | 一种基于连续血糖监测的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710574788.0A CN107203700B (zh) | 2017-07-14 | 2017-07-14 | 一种基于连续血糖监测的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107203700A true CN107203700A (zh) | 2017-09-26 |
CN107203700B CN107203700B (zh) | 2020-05-05 |
Family
ID=59911703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710574788.0A Active CN107203700B (zh) | 2017-07-14 | 2017-07-14 | 一种基于连续血糖监测的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107203700B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109065176A (zh) * | 2018-08-20 | 2018-12-21 | 清华-伯克利深圳学院筹备办公室 | 一种血糖预测方法、装置、终端和存储介质 |
CN109171754A (zh) * | 2018-07-27 | 2019-01-11 | 清华-伯克利深圳学院筹备办公室 | 血糖预测模型的训练方法、装置、终端及存储介质 |
CN109872821A (zh) * | 2019-04-24 | 2019-06-11 | 北京信息科技大学 | 一种构建血糖预测模型的方法及装置 |
CN109934370A (zh) * | 2017-12-15 | 2019-06-25 | 中国农业大学 | 一种鱼类存活率预测方法及装置 |
WO2020089656A1 (en) * | 2018-11-01 | 2020-05-07 | Imperial College Of Science, Technology And Medicine | Predicting physiological parameters |
CN111326255A (zh) * | 2020-01-19 | 2020-06-23 | 湖南盈赛缇思人工智能公共数据平台有限公司 | 一种基于大数据的血糖浓度校正方法、存储介质及系统 |
WO2022083124A1 (zh) * | 2020-10-22 | 2022-04-28 | 平安科技(深圳)有限公司 | 个性化糖尿病健康管理系统、设备及存储介质 |
WO2022096297A1 (de) * | 2020-11-09 | 2022-05-12 | Robert-Bosch-Krankenhaus Gmbh | Computerimplementiertes verfahren und vorrichtung zum durchführen einer medizinischen laborwertanalyse |
CN114530250A (zh) * | 2022-04-24 | 2022-05-24 | 广东工业大学 | 基于数据增强的可穿戴血糖检测方法、系统及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002024065A1 (en) * | 2000-09-22 | 2002-03-28 | Knobbe, Lim & Buckingham | Method and apparatus for real-time estimation and control of pysiological parameters |
CN103605878A (zh) * | 2013-08-19 | 2014-02-26 | 浙江大学 | 一种基于数据建模和模型移植的通用血糖预测方法 |
CN106777874A (zh) * | 2016-11-18 | 2017-05-31 | 中国科学院自动化研究所 | 基于循环神经网络构建预测模型的方法 |
CN106777891A (zh) * | 2016-11-21 | 2017-05-31 | 中国科学院自动化研究所 | 一种数据特征选择和预测方法及装置 |
-
2017
- 2017-07-14 CN CN201710574788.0A patent/CN107203700B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002024065A1 (en) * | 2000-09-22 | 2002-03-28 | Knobbe, Lim & Buckingham | Method and apparatus for real-time estimation and control of pysiological parameters |
CN103605878A (zh) * | 2013-08-19 | 2014-02-26 | 浙江大学 | 一种基于数据建模和模型移植的通用血糖预测方法 |
CN106777874A (zh) * | 2016-11-18 | 2017-05-31 | 中国科学院自动化研究所 | 基于循环神经网络构建预测模型的方法 |
CN106777891A (zh) * | 2016-11-21 | 2017-05-31 | 中国科学院自动化研究所 | 一种数据特征选择和预测方法及装置 |
Non-Patent Citations (1)
Title |
---|
宋广健: "基于多元统计分析方法的连续血糖监测仪故障检测研究", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934370A (zh) * | 2017-12-15 | 2019-06-25 | 中国农业大学 | 一种鱼类存活率预测方法及装置 |
CN109934370B (zh) * | 2017-12-15 | 2024-03-05 | 中国农业大学 | 一种鱼类存活率预测方法及装置 |
CN109171754A (zh) * | 2018-07-27 | 2019-01-11 | 清华-伯克利深圳学院筹备办公室 | 血糖预测模型的训练方法、装置、终端及存储介质 |
CN109171754B (zh) * | 2018-07-27 | 2022-07-05 | 清华-伯克利深圳学院筹备办公室 | 血糖预测模型的训练方法、装置、终端及存储介质 |
CN109065176A (zh) * | 2018-08-20 | 2018-12-21 | 清华-伯克利深圳学院筹备办公室 | 一种血糖预测方法、装置、终端和存储介质 |
CN109065176B (zh) * | 2018-08-20 | 2020-11-10 | 清华-伯克利深圳学院筹备办公室 | 一种血糖预测方法、装置、终端和存储介质 |
WO2020089656A1 (en) * | 2018-11-01 | 2020-05-07 | Imperial College Of Science, Technology And Medicine | Predicting physiological parameters |
CN109872821A (zh) * | 2019-04-24 | 2019-06-11 | 北京信息科技大学 | 一种构建血糖预测模型的方法及装置 |
CN111326255A (zh) * | 2020-01-19 | 2020-06-23 | 湖南盈赛缇思人工智能公共数据平台有限公司 | 一种基于大数据的血糖浓度校正方法、存储介质及系统 |
WO2022083124A1 (zh) * | 2020-10-22 | 2022-04-28 | 平安科技(深圳)有限公司 | 个性化糖尿病健康管理系统、设备及存储介质 |
WO2022096297A1 (de) * | 2020-11-09 | 2022-05-12 | Robert-Bosch-Krankenhaus Gmbh | Computerimplementiertes verfahren und vorrichtung zum durchführen einer medizinischen laborwertanalyse |
CN114530250A (zh) * | 2022-04-24 | 2022-05-24 | 广东工业大学 | 基于数据增强的可穿戴血糖检测方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107203700B (zh) | 2020-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107203700B (zh) | 一种基于连续血糖监测的方法及装置 | |
Krone et al. | A multivariate statistical model for emotion dynamics. | |
Jaimes et al. | A stress-free life: just-in-time interventions for stress via real-time forecasting and intervention adaptation | |
Zhu et al. | Blood glucose prediction in type 1 diabetes using deep learning on the edge | |
Di Martino et al. | High-resolution physiological stress prediction models based on ensemble learning and recurrent neural networks | |
CN109065176B (zh) | 一种血糖预测方法、装置、终端和存储介质 | |
Daniels et al. | Personalised Glucose Prediction via Deep Multitask Networks. | |
Zhu et al. | Glugan: generating personalized glucose time series using generative adversarial networks | |
Azzali et al. | Towards the use of vector based GP to predict physiological time series | |
Lewis et al. | Mixed effects random forests for personalised predictions of clinical depression severity | |
DeMasi et al. | Detecting change in depressive symptoms from daily wellbeing questions, personality, and activity | |
Gómez-Castillo et al. | A machine learning approach for blood glucose level prediction using a LSTM network | |
CN117204855A (zh) | 一种基于交互设备的用户心理状态评估方法及系统 | |
CN107610741A (zh) | 一种基于移动终端的智能健康管理的问诊分析方法及系统 | |
Ferrari et al. | A simple model for low variability in neural spike trains | |
Picchini et al. | Parameters of the diffusion leaky integrate-and-fire neuronal model for a slowly fluctuating signal | |
CN117095828A (zh) | 基于糖尿病患者随访记录的血糖值预测和告警方法 | |
Zhang et al. | Cross-patient automatic epileptic seizure detection using patient-adversarial neural networks with spatio-temporal EEG augmentation | |
Viles et al. | Percolation under noise: Detecting explosive percolation using the second-largest component | |
Liu et al. | Brain model state space reconstruction using an LSTM neural network | |
Hupalo et al. | Acquisition and Processing of Data in CPS for Remote Monitoring of the Human functional State | |
JP7426015B1 (ja) | ヘルスケア用データ解析システム | |
Pentari et al. | A study on the effect of distinct adjacency matrices for graph signal denoising | |
Shroff et al. | GlucoseAssist: Personalized Blood Glucose Level Predictions and Early Dysglycemia Detection | |
Li et al. | Responses of leaky integrate-and-fire neurons to a plurality of stimuli in their receptive fields |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180725 Address after: 518055 Nanshan Zhiyuan 1001, Xue Yuan Avenue, Nanshan District, Shenzhen, Guangdong. Applicant after: Tsinghua Berkeley Shenzhen College Preparatory Office Applicant after: Yu Dongfang Address before: 518000 Nanshan Zhiyuan 1001, Xue Yuan Avenue, Nanshan District, Shenzhen, Guangdong. Applicant before: Tsinghua Berkeley Shenzhen College Preparatory Office |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |