CN103605878B - 一种基于数据建模和模型移植的通用血糖预测方法 - Google Patents
一种基于数据建模和模型移植的通用血糖预测方法 Download PDFInfo
- Publication number
- CN103605878B CN103605878B CN201310362553.7A CN201310362553A CN103605878B CN 103605878 B CN103605878 B CN 103605878B CN 201310362553 A CN201310362553 A CN 201310362553A CN 103605878 B CN103605878 B CN 103605878B
- Authority
- CN
- China
- Prior art keywords
- matrix
- blood glucose
- prediction
- model
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 239000008280 blood Substances 0.000 title claims abstract description 92
- 210000004369 blood Anatomy 0.000 title claims abstract description 92
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 title claims abstract description 80
- 239000008103 glucose Substances 0.000 title claims abstract description 80
- 238000002054 transplantation Methods 0.000 title claims abstract description 23
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 claims abstract description 72
- 235000005911 diet Nutrition 0.000 claims abstract description 44
- 230000037213 diet Effects 0.000 claims abstract description 40
- 102000004877 Insulin Human genes 0.000 claims abstract description 36
- 108090001061 Insulin Proteins 0.000 claims abstract description 36
- 230000008676 import Effects 0.000 claims abstract description 36
- 229940125396 insulin Drugs 0.000 claims abstract description 36
- 238000005259 measurement Methods 0.000 claims abstract description 12
- 230000000694 effects Effects 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000001802 infusion Methods 0.000 claims abstract description 4
- 238000007920 subcutaneous administration Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 77
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 20
- 230000001105 regulatory effect Effects 0.000 claims description 16
- 238000009499 grossing Methods 0.000 claims description 11
- 230000011664 signaling Effects 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 10
- 238000010219 correlation analysis Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 239000000203 mixture Substances 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims 1
- 238000010521 absorption reaction Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 4
- 230000000378 dietary effect Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
本发明公开了一种基于数据建模和模型移植的通用血糖预测方法;该方法针对人体皮下血糖测量信号、人体输注的胰岛素及摄入的饮食进行分析,提取其与未来血糖的关系,并应用到缺乏数据量的新对象上;分别采用传统最小二乘方法和基于潜变量方法建立有外源输入的自回归血糖预测模型,并进行了对比;最后基于预测性能较好的潜变量方法选取基模型实现模型移植;实际应用时针对新对象无需等待获取充分血糖测量信号后重新建模,而是可以直接将基模型移植到新对象上,根据拟合效果在线调整模型系数实现实时血糖预测,大大简化了建模工作量和复杂度。
Description
技术领域
本发明属于血糖数据分析和预测研究领域,特别是涉及一种基于数据建模和模型移植的通用血糖预测方法。
背景技术
人体血糖水平的一个显著特点就是时变性,即时序信号测量值存在显著的自相关关系。此外,外源输入和血糖时序数据之间亦密切相关。这两种相关关系是建立血糖预测模型的基础和关键。
针对血糖信号、外部输入胰岛素信号和饮食信号进行分析、建模,可以根据历史测量值获取未来血糖变化情况。目前,血糖预测模型的建立多采用基于数据驱动的方法。已存在的预测模型可以划分为线性(以基于最小二乘的自回归模型为其典型代表)和非线性(以神经网络方法为其典型代表)两类。线性模型由于其简单的模型结构和算法,获得了广泛应用。比较成熟的建模方法包括自回归(autoregressive,AR)、激励响应(impulse-response,IR)等。根据是否包括外源输入(胰岛素和饮食输入等)作为建模变量,AR模型又可以区分为自回归(AR)模型和具有外源输入的自回归(ARwithexogenousinputs,ARX)模型。然而传统的ARX模型主要缺陷有两点:(a)直接针对测量数据利用最小二乘这种最基本的辨识方法拟合血糖预测关系,无法避免该方法本身所具有的缺陷,不能得到满意的预测精度;(b)针对不同个体的血糖动态性、外源输入不进行预先分析,直接建立不同的预测模型(即个体化模型)用于在线预测,这将耗费大量人力物力。
发明内容
本发明的目的在于针对现有血糖预测方法的不足,提供一种基于数据建模和模型移植的通用血糖预测方法。
本发明的目的是通过以下技术方案来实现的:一种基于数据建模和模型移植的通用血糖预测方法,该方法包括以下步骤:
步骤1:建模信号预处理:将以一定采样周期Δt获得的个体皮下血糖信号、输注该个体的胰岛素信号、该个体摄入的饮食信号分别组合成一维时序数据Gk×1、Ik×1、Mk×1,其中,G、I、M分别是血糖信号、胰岛素信号和饮食信号的测量值,k为以采样周期Δt获得的采样个数;去除血糖信号、胰岛素信号和饮食信号中的尖峰噪声。
步骤2:获取预测变量矩阵和响应矩阵:预测区间记为ph,血糖信号和两外源输入信号预测变量的长度分别记为lG、lI、lM,则二维预测变量矩阵表示为其中,二维预测变量矩阵行数n=k-ph-l+1,k为以采样周期Δt获得的采样个数,ph为预测区间,l=max{lG,lI+d-1,lM+d-1},而d是两外源输入信号样本输入的延迟,二维预测变量矩阵列数jx=lG+lI+lM。一维响应矩阵表示为Yn×1=[Gl+ph,Gl+ph+1,Gk]T。
步骤3:基于LV的血糖预测建模:通过基于LV的方法进行血糖预测建模。
步骤4:选取基模型进行模型移植:根据步骤3的预测效果,采用LV方法进行模型移植,该步骤通过以下子步骤来实现:
(4.1)确定模型移植的基模型:先从实际角度考虑选取LV方法中胰岛素前的系数识别为负值,饮食前的系数识别为正值的对象的模型系数,再从预测精度考虑,选取预测RMSE最小的对象的模型系数作为基模型。
(4.2)确定模型移植调节方向判断依据:根据预测值和真实测量值均值、波峰或波谷判断二者的相对大小。
(4.3)确定模型移植的调节步长:权衡步长减小带来的调节时间增长和精度提高之间的矛盾,确定模型移植的调节步长。
(4.4)确定模型移植的调节策略:对比先调节胰岛素前系数,再调节饮食前系数和先调节饮食前系数,再调节胰岛素前系数的拟合效果,确定调节策略为先调节胰岛素前系数,再调节饮食前系数。
步骤5:根据步骤4确定的基模型、步长和调节策略对任意个体的未来血糖值进行预测。该步骤通过以下子步骤来实现:
(5.1)在线预测时,在采集到任意个体新数据Gnewk×1、Inewk×1、Mnewk×1后(下标new代表新样本,一般数据量较缺乏),对新数据按步骤2所述的预测变量矩阵排列得到测试数据输入矩阵
(5.2)调用基模型进行在线修正预测:
(5.2.1)调用基模型进行模型移植:
对于每个新的测试数据由以下步骤计算直接移植基模型后对测试数据的预测值
其中,Xnew为对新数据按步骤2所述的步骤获得的预测变量矩阵,σ是PLS-CCA方法求出的基模型的回归系数向量。
(5.2.2)根据预测值和测试数据的误差不断在线修正两外源输入系数,直到拟合RMSE最小,得到修正后的模型系数σ′,由以下步骤计算移植基模型在线修正后获得ph个采样点后的预测值
其中Xr为该个体采集的任意数据按步骤2所述的预测变量矩阵排列后的矩阵或向量,σ′为修正后的回归系数向量。
与现有技术相比,本发明的有益效果是:本发明所提出的通用血糖预测方法实际应用时针对新对象无需等待获取充分血糖测量信号后重新建模,而是可以直接将基模型移植到新对象上,根据拟合效果在线调整模型系数实现实时血糖预测,大大简化了建模工作量和复杂度,将极大地降低建模花费;且预测模型采用基于潜变量建模的方法,外源输入经过平滑处理,提高了预测精度。本发明易于实施,为血糖预测建模方法的研究指明了新的方向。
附图说明
图1是本发明所述的通用血糖预测模型建模流程图。
图2是采用相同条件下的训练数据和测试数据时LS方法的预测结果图(分析对象为儿童组第十人的血糖信号);
图3是采用相同条件下的训练数据和测试数据时LV方法的预测结果图(分析对象为儿童组第十人的血糖信号);
图4是采用不同条件下的训练数据和测试数据时LS方法的预测结果图(分析对象为儿童组第十人的血糖信号);
图5是采用不同条件下的训练数据和测试数据时LV方法的预测结果图(分析对象为儿童组第十人的血糖信号);
图6是只调节胰岛素前系数,步长分别为1,0.1,0.01,0.001对13个训练数据三组对象的拟合精度比较图;
图7是只调节饮食前系数,步长分别为1,0.1,0.01,0.001对13个训练数据三组对象的拟合精度比较图。
图8是模型移植训练数据个数分别为13、30、50时对一天数据预测结果比较图(分析对象为青少年组第一人的血糖信号)。
图9是50个训练数据时基于LV直接建模和模型移植的预测结果比较图(分析对象为青少年组第一人的血糖信号)。
具体实施方式
如图1所示,本发明基于数据建模和模型移植的通用血糖预测方法,该方法包括以下步骤:
步骤1:建模信号预处理
针对以一定采样周期Δt获得的个体皮下血糖信号、输注该个体的胰岛素信号、该个体摄入的饮食信号(这里Δt=5min),将其分别组合成一维时序数据Gk×1、Ik×1、Mk×1,其中,G、I、M分别是血糖信号、胰岛素信号和饮食信号的测量值,k为以采样周期Δt获得的采样个数,去除其中的尖峰噪声。本实例中,我们共有来自于三组对象的采样信号,第1组为青少年组,第2组为成人组,第3组为儿童组,每组10人,三组共30人。每个对象的采样信号包括四天的数据。
步骤2:获取预测变量矩阵和响应矩阵
该步主要用于将步骤1中采集的信号进行整合排列,得到训练数据输入输出矩阵,测试数据输入矩阵。预测区间记为ph,血糖信号和两外源输入信号预测变量的长度分别记为lG、lI、lM,则二维预测变量矩阵表示为其中,二维预测变量矩阵行数n=k-ph-l+1,k为以采样周期Δt获得的采样个数,ph为预测区间,l=max{lG,lI+d-1,lM+d-1},而d是两外源输入信号样本输入的延迟,二维预测变量矩阵列数jx=lG+lI+lM。一维响应矩阵表示为Yn×1=[Gl+ph,Gl+ph+1,Gk]T。
具体步骤为用一个长度为ph+lG个采样点的一维滑动窗口滑过一维时序血糖信号数据Gk×1,每次移动一个采样点,共移动n次。将每次滑动窗口中的数据作为一个新的行向量,则可以组合为一个二维数据矩阵,截取该矩阵的前lG列,则为截取该矩阵的最后一列则为Yn×1。分别用一个长度为lI和lM个采样点的一维滑动窗口从第lG-d个采样点滑过一维时序胰岛素信号数据Ik×1和一维时序饮食信号数据Mk×1,每次移动一个采样点,共移动n次。分别将每次滑动窗口中的数据作为一个新的行向量,则组合为和
对个体模型的研究表明,当有7-8个历史血糖样本,1-2个外源输入样本,以及5-6个输入样本的延迟会获得比较好的预测模型。下面我们针对7个历史血糖样本,即lG=7;胰岛素和饮食输入均为1阶,即lI=lM=1;5个输入样本延迟,即d=5进行研究。这样l=max{7,1+5-1,1+5-1}=7,jx=7+1+1=9。一般预测区间ph=6,即预测30分钟后的血糖值,这对未来血糖预测较为有意义,可以保证一定的预测精度和可靠性。
所以用一个长度为13个采样点的一维滑动窗口滑过Gk×1,每次移动一个采样点,共移动k-12次。将每次滑动窗口中的数据作为一个新的行向量,则可以组合为一个二维数据矩阵,截取该矩阵的前7列,则为G(k-12)×7,截取该矩阵的最后一列则为Y(k-12)×1。分别用一个长度为1和1个采样点的一维滑动窗口从第2个采样点开始滑过Ik×1和Mk×1,每次移动一个采样点,共移动k-12次。分别将每次滑动窗口中的数据作为一个新的行向量,则组合为I(k-12)×1和M(k-12)×1。
步骤3:基于LV的血糖预测建模:
预测模型建立有两种方法,一种是现有的基于LS(leastsquare,最小二乘)的方法,另一种是基于LV(latentvariable,潜变量)的建模方法。具体步骤如下:
(3.1)根据血糖信号和两外源输入信号组成步骤2所述的预测变量矩阵和响应矩阵。
每个对象采样信号的前三天的数据用于每个对象ARX模型训练,称为训练数据,最后一天的数据用于每个对象ARX模型性能的测试,称为测试数据。则此时训练数据有864个,测试数据有288个。则此时步骤2中训练数据的k=864,测试数据的k=288。
(3.2)如果通过基于LS的方法进行血糖预测建模,则根据血糖信号和两外源输入信号采用LS方法建立ARX预测模型:
其中,Ys为血糖真实值,X为用步骤2获取的预测变量矩阵,θ为回归系数,F为模型误差,为用LS方法获得的血糖预测值。
如果通过基于LV的方法进行血糖预测建模,根据血糖信号和两外源输入信号采用LV方法建立ARX预测模型:
基于LV的ARX预测模型采用PLS-CCA(partialleastsquare-canonicalcorrelationanalysis,偏最小二乘-典型相关性分析)的特征提取方法进行建模。先用PLS提取初步潜变量组,由于PLS方法提取的潜变量LVs不能保证其与响应变量的密切相关关系,再用CCA对其进行后处理,从而提取其中与相应变量密切相关的部分进行回归建模与预测。步骤如下:
(3.2.1)外源输入平滑处理
为提高预测的精度,分别使用如下两式对胰岛素和饮食两外源输入进行平滑处理:
其中H1表示外源胰岛素输入平滑处理使用的传递函数,H2表示外源饮食输入平滑处理使用的传递函数。
(3.2.2)数据预处理
将所有个体的预测变量矩阵和响应矩阵组合到一起,针对组合后的预测变量矩阵和响应矩阵内任意一点的变量xi,j,对该变量进行减均值、除以标准差的全局标准化处理,标准化处理的计算公式如下:
其中:是组合后的矩阵任一列的均值,sj是相应列的标准差。其计算公式如下:
其中:M是组合后任一列样本的总量。
(3.2.3)利用PLS提取潜变量组T:
T=XR
R=W(PTW)-1;(6)
其中,T是由多个PLS潜变量构成的潜变量矩阵,X为用步骤2获取的预测变量矩阵,R是PLS方法的系数矩阵,W是由PLS求出的权重矩阵,P是对应于T的负载矩阵。
(3.2.4)利用CCA对PLS潜变量进行后处理,得到最终潜变量U:
U=TV;(7)
其中,V是对应于潜变量矩阵T的权重向量。因响应矩阵Y是单变量输出响应,由于CCA方法本身的特点,故最终只需提取一个潜变量。
需要指出的是,PLS与CCA方法的权重矩阵都可以通过求取特定矩阵的特征向量而求得,是一种有效的分析数据变量间相关关系的统计分析方法。
(3.2.5)建立ARX模型:
用最小二乘法求取潜变量与响应变量间的回归系数q:
q=(UTU)-1UTY;(8)
故最终基于LV方法建立的ARX模型为:
σ=RVq
其中,σ是通过PLS与CCA两种方法结合获得的预测模型回归系数,为基于LV方法获得的血糖预测值。
在获得针对不同对象建立的预测模型后,需要对预测性能进行评价,验证预测模型是否可以进行实时血糖预测,验证LV方法的优越性。
验证LV方法的优越性的具体步骤如下:
(I)采用相同条件下的训练数据和测试数据
训练数据和测试数据的来源中,每个对象的饮食时刻和该时刻的饮食量固定。
(a)首先对每一个对象,采用步骤2中的方法对血糖信号和两外源输入信号处理获取训练数据矩阵后,采用步骤(3.2.1)中的方法对两外源输入信号进行平滑处理。
然后调用基于LS建立的ARX模型进行血糖预测,得到预测值其中,θ是LS方法求出的回归系数向量。
(b)首先对每一个对象,采用步骤2中的方法对血糖信号和两外源输入信号处理获取训练数据矩阵后,采用步骤(3.2.1)中的方法对两外源输入信号进行平滑处理,再采用步骤(3.2.2)中的方法对数据进行全局标准化处理。
然后,调用基于LV建立的ARX模型进行血糖预测,得到预测值其中,σ是PLS-CCA方法求出的回归系数向量。
(II)采用不同条件下的训练数据和测试数据
训练数据的来源中,每个对象的饮食时刻和该时刻的饮食量固定。测试数据的来源中,每个对象的饮食时刻随机波动一小时,该时刻的饮食量随机波动75%。
具体步骤与(I)相同。
(III)对比两种方法的预测精度
按如下方式计算RMSE(均方根误差)性能指标:
其中y(i)表示原始的血糖测量值,表示采用不同模型获得的血糖预测结果,这里可以是采用LS方法求得的血糖预测值或者采用LV方法求得的血糖预测值N为样本数。这里需要指出的是,衡量预测精度时,需要将原始血糖测量值作为参考量,预测误差是血糖预测结果和原始血糖测量值的对比。
然后,基于RMSE指标,对两种方法(LS方法与LV方法)的预测精度进行对比。
结果(如表1所示)表明,两种方法均可以实现血糖的实时预测,且可以经受饮食时间和饮食量的随机变化,但采用LV方法建立的ARX模型预测精度要优于采样LS方法建立的ARX模型。
表1针对3组(青少年组、成人组和儿童组)共30个对象采用不同LS/LV方法获得的血糖预测结果对比(平均RMSE(mg/dL))
为了更清楚显示两种方法预测精度的比较,选择如图2、图3、图4、图5。步骤4:选取基模型进行模型移植:
根据步骤3的预测效果,从两种方法中选取预测精度较高的LV方法进行模型移植,通过以下步骤来完成:
(4.1)确定模型移植的基模型:针对3组共30个对象基于LV方法建立的30个ARX模型,先从实际角度考虑选取胰岛素前的系数识别为负值,饮食前的系数识别为正值的对象的模型系数,再从预测精度考虑,选取预测RMSE最小的对象的模型系数作为基模型。最终选择对象10的模型系数作为基模型,7阶血糖信号前系数分别为a1=-0.3516,a2=0.1574,a3=0.7598,a4=-0.0539,a5=-1.6436,a6=-1.5561,a7=3.6378,两外源输入信号前系数分别为b=-0.4741,c=0.4133。
(4.2)确定模型移植调节方向判断依据:根据预测值和真实测量值均值、波峰或波谷判断二者的相对大小。本发明根据均值判断预测值和真实测量值的相对大小。
(4.3)确定模型移植的调节步长:一般而言,两外源输入前系数调节步长越小,预测精度会越高,但调节的时间也越长。根据预测值和真实测量值均值的相对大小判断调节方向,调节步长分别选择为1、0.1、0.01、0.001,只单一的调节外源输入,四种步长下三组共30个对象对各自13个(7阶ARX模型可以实现预测的最小数据量)少量训练数据的拟合精度结果(如表2所示)表明步长越小拟合精度越高,但在调节的过程可以发现步长越小运行时间越长。为了权衡步长减小带来的调节时间增长和精度提高之间的矛盾,确定模型移植的调节步长为0.01。
表2针对3组(青少年组、成人组和儿童组)共30个对象采用不同调节步长获得的血糖预测结果对比(平均RMSE(mg/dL))
为了更清楚显示四种步长下拟合精度的比较,选择如图4、图5。
(4.4)确定模型移植的调节策略:对比先调节胰岛素前系数,再调节饮食前系数和先调节饮食前系数,再调节胰岛素前系数的拟合效果,确定调节策略为先调节胰岛素前系数,再调节饮食前系数。
根据预测值和真实测量值均值的相对大小判断调节方向,调节步长为0.01,两种策略下三组共30个对象对各自13个(可以实现预测的最小数据量)少量训练数据的拟合精度结果(如表3所示)表明先调节胰岛素前系数再调节饮食前系数比先调节饮食前系数再调节胰岛素前系数拟合精度要高。所以,调节策略确定为先调节胰岛素前系数,再调节饮食前系数。
表3针对3组(青少年组、成人组和儿童组)共30个对象采用不同调节策略获得的血糖预测结果对比(平均RMSE(mg/dL))
组别 | 青少年 | 成人 | 儿童 |
先调节胰岛素前系数再调节饮食前系数 | 14.16 | 6.62 | 30.21 |
先调节饮食前系数再调节胰岛素前系数 | 14.20 | 6.65 | 30.23 |
步骤5:基于模型移植的在线预测:
根据步骤4确定的基模型、步长和调节策略对任意个体的未来血糖值进行预测。通过以下步骤来完成:
(5.1)在线预测时,在采集到任意个体新数据Gnewk×1、Inewk×1、Mnewk×1后(下标new代表新样本,一般数据量较缺乏),对新数据按步骤2所述的预测变量矩阵排列得到测试数据输入矩阵
(5.2)调用基模型进行在线修正预测:
(5.2.1)调用基模型进行模型移植:
对于每个新的测试数据由以下步骤计算直接移植基模型后对测试数据的预测值
其中,Xnew为对新数据按步骤2所述的步骤获得的预测变量矩阵,σ是PLS-CCA方法求出的基模型的回归系数向量。
(5.2.2)根据预测值和测试数据的误差不断在线修正两外源输入系数,直到拟合RMSE最小,得到修正后的模型系数σ′,由以下步骤计算移植基模型在线修正后获得ph个采样点后的预测值
其中Xr为该个体采集的任意数据按步骤2所述的预测变量矩阵排列后的矩阵或向量,σ′为修正后的回归系数向量。
为了更清楚显示模型移植的预测精度不随训练数据量的变化而变化,选择如图6。
为了对比少量训练数据时基于LV直接建模方法实现预测和模型移植方法实现预测精度,选择如图7。
Claims (3)
1.一种基于数据建模和模型移植的通用血糖预测方法,其特征在于,该方法包括以下步骤:
步骤1:建模信号预处理:将以一定采样周期Δt获得的个体皮下血糖信号、输注该个体的胰岛素信号、该个体摄入的饮食信号分别组合成一维时序数据Gk×1、Ik×1、Mk×1,其中,G、I、M分别是血糖信号、胰岛素信号和饮食信号的测量值,k为以采样周期Δt获得的采样个数;去除血糖信号、胰岛素信号和饮食信号中的尖峰噪声;
步骤2:获取预测变量矩阵和响应矩阵:预测区间记为ph,血糖信号和两外源输入信号预测变量的长度分别记为lG、lI、lM,则二维预测变量矩阵表示为其中,二维预测变量矩阵行数n=k-ph-l+1,k为以采样周期Δt获得的采样个数,ph为预测区间,l=max{lG,lI+d-1,lM+d-1},而d是两外源输入信号样本输入的延迟,二维预测变量矩阵列数jx=lG+lI+lM;一维响应矩阵表示为Yn×1=[Gl+ph,Gl+ph+1,Gk]T;
步骤3:基于潜变量的血糖预测建模:通过基于潜变量的方法进行血糖预测建模;
步骤4:选取基模型进行模型移植:根据步骤3的预测效果,采用潜变量方法进行模型移植,该步骤通过以下子步骤来实现:
(4.1)确定模型移植的基模型:先从实际角度考虑选取潜变量方法中胰岛素前系数识别为负值,饮食前系数识别为正值的对象的模型系数,再从预测精度考虑,选取预测均方根误差最小的对象的模型系数作为基模型;
(4.2)确定模型移植调节方向判断依据:根据预测值和真实测量值均值、波峰或波谷判断二者的相对大小;
(4.3)确定模型移植的调节步长:权衡步长减小带来的调节时间增长和精度提高之间的矛盾,确定模型移植的调节步长;
(4.4)确定模型移植的调节策略:对比先调节胰岛素前系数,再调节饮食前系数和先调节饮食前系数,再调节胰岛素前系数的拟合效果,确定调节策略为先调节胰岛素前系数,再调节饮食前系数;
步骤5:根据步骤4确定的基模型、步长和调节策略对任意个体的未来血糖值进行预测;该步骤通过以下子步骤来实现:
(5.1)在线预测时,在采集到任意个体新数据Gnewk×1、Inewk×1、Mnewk×1后,对新数据按步骤2所述的预测变量矩阵排列得到测试数据输入矩阵
(5.2)调用基模型进行在线修正预测:
(5.2.1)调用基模型进行模型移植:
对于每个新的测试数据由以下步骤计算直接移植基模型后对测试数据的预测值
其中,Xnew为对新数据按步骤2所述的步骤获得的预测变量矩阵,σ是偏最小二乘-典型相关性分析方法求出的基模型的回归系数向量;
(5.2.2)根据预测值和测试数据的误差不断在线修正两外源输入系数,直到拟合均方根误差最小,得到修正后的模型系数σ′,由以下步骤计算移植基模型在线修正后获得ph个采样点后的预测值
其中Xr为该个体采集的任意数据按步骤2所述的预测变量矩阵排列后的矩阵,σ′为修正后的回归系数向量。
2.根据权利要求1所述的基于数据建模和模型移植的通用血糖预测方法,其特征在于,所述步骤2具体为:用一个长度为ph+lG个采样点的一维滑动窗口滑过一维时序血糖信号数据Gk×1,每次移动一个采样点,共移动n次;将每次滑动窗口中的数据作为一个新的行向量,则组合为一个二维数据矩阵,截取该矩阵的前lG列,则为截取该矩阵的最后一列则为Yn×1;用一个长度为lI个采样点的一维滑动窗口从第lG-d个采样点滑过一维时序胰岛素信号数据Ik×1,每次移动一个采样点,共移动n次,将每次滑动窗口中的数据作为一个新的行向量,则组合为用一个长度为lM个采样点的一维滑动窗口从第lG-d个采样点滑过一维时序饮食信号数据Mk×1,每次移动一个采样点,共移动n次,将每次滑动窗口中的数据作为一个新的行向量,组合为
3.根据权利要求1所述基于数据建模和模型移植的通用血糖预测方法,其特征在于,所述步骤3基于潜变量的血糖预测建模;具体步骤如下:
(3.1)根据血糖信号和两外源输入信号组成步骤2所述的预测变量矩阵和响应矩阵;
(3.2)根据血糖信号和两外源输入信号采用潜变量方法建立具有外源输入的自回归模型:基于潜变量的具有外源输入的自回归模型采用偏最小二乘-典型相关性分析的特征提取方法进行建模;先用偏最小二乘方法提取初步潜变量组,由于偏最小二乘方法提取的潜变量LVs不能保证其与响应变量的密切相关关系,再用典型相关性分析方法对其进行后处理,从而提取其中与相应变量密切相关的部分进行回归建模与预测;步骤如下:
(3.2.1)外源输入平滑处理
为提高预测的精度,分别使用如下两式对胰岛素和饮食两外源输入进行平滑处理:
其中H1表示外源胰岛素输入平滑处理使用的传递函数,H2表示外源饮食输入平滑处理使用的传递函数;
(3.2.2)数据预处理
将所有个体的预测变量矩阵和响应矩阵组合到一起,针对组合后的预测变量矩阵和响应矩阵内任意一点的变量xi,j,对该变量进行减均值、除以标准差的全局标准化处理,标准化处理的计算公式如下:
其中:是组合后的矩阵任一列的均值,sj是相应列的标准差;其计算公式如下:
其中:M是组合后任一列样本的总量;
(3.2.3)利用偏最小二乘方法提取潜变量组T:
其中,T是由多个偏最小二乘潜变量构成的潜变量矩阵,X为用步骤2获取的预测变量矩阵,R是偏最小二乘方法的系数矩阵,W是由偏最小二乘方法求出的权重矩阵,P是对应于T的负载矩阵;
(3.2.4)利用典型相关性分析方法对偏最小二乘潜变量进行后处理,得到最终潜变量U:
U=TV;(8)
其中,V是对应于潜变量矩阵T的权重向量;因响应矩阵Y是单变量输出响应,由于典型相关性分析方法本身的特点,故最终只需提取一个潜变量;
(3.2.5)建立具有外源输入的自回归模型:
用最小二乘法求取潜变量与响应变量间的回归系数q:
q=(UTU)-1UTY;(9)
故最终基于潜变量方法建立的具有外源输入的自回归模型为:
其中,σ是通过偏最小二乘与典型相关性分析两种方法结合获得的预测模型回归系数,为基于潜变量方法获得的血糖预测值;
(3.3)衡量预测精度:将获得的血糖预测结果与实际测量值进行对比;在获得一系列新的预测信号后,根据下式中定义的均方根误差性能指标计算针对新样本的血糖预测精度:
其中,y(i)表示原始的血糖测量值,表示采用不同方法获得的血糖预测结果,N为样本数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310362553.7A CN103605878B (zh) | 2013-08-19 | 2013-08-19 | 一种基于数据建模和模型移植的通用血糖预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310362553.7A CN103605878B (zh) | 2013-08-19 | 2013-08-19 | 一种基于数据建模和模型移植的通用血糖预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103605878A CN103605878A (zh) | 2014-02-26 |
CN103605878B true CN103605878B (zh) | 2016-03-30 |
Family
ID=50124099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310362553.7A Active CN103605878B (zh) | 2013-08-19 | 2013-08-19 | 一种基于数据建模和模型移植的通用血糖预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103605878B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6810991B2 (ja) * | 2014-08-06 | 2021-01-13 | リージェンツ オブ ザ ユニバーシティー オブ カリフォルニア | 離散時間状態空間動的モデルに基づく状態推定器と組み合わされたコントローラを使用する薬物送達システムの作動方法、該コントローラおよび該システム |
CN108289642B (zh) * | 2015-10-09 | 2021-02-23 | 迪诺威特公司 | 确定胰岛素疗法相关的参数、预测葡萄糖值和提供胰岛素给药建议的医学布置和方法 |
CN107203700B (zh) * | 2017-07-14 | 2020-05-05 | 清华-伯克利深圳学院筹备办公室 | 一种基于连续血糖监测的方法及装置 |
CN108766578A (zh) * | 2018-05-16 | 2018-11-06 | 清华大学深圳研究生院 | 一种血糖预测方法及装置 |
CN109117996B (zh) * | 2018-08-01 | 2021-06-18 | 淮安市农业信息中心 | 构建温室冬季温度预测模型的方法 |
CN111110949B (zh) * | 2018-11-01 | 2021-07-09 | 上海市第六人民医院 | 胰岛素注射量确定方法及装置、计算机存储介质及设备 |
CN111329491A (zh) * | 2020-02-27 | 2020-06-26 | 京东方科技集团股份有限公司 | 一种血糖预测方法、装置、电子设备和存储介质 |
CN117612737B (zh) * | 2024-01-24 | 2024-05-03 | 胜利油田中心医院 | 一种糖尿病护理数据智能优化方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101884541A (zh) * | 2010-07-05 | 2010-11-17 | 北京航空航天大学 | 人体血液生化参数无创检测仪及检测方法 |
CN103092078A (zh) * | 2013-01-07 | 2013-05-08 | 北京中医药大学 | 多阶段间歇生产过程的全程优化方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6650947B2 (en) * | 2001-03-23 | 2003-11-18 | Metso Automation Oy | Multi-variable control loop assessment |
US20100057533A1 (en) * | 2008-09-04 | 2010-03-04 | Universidad Catolica de la SSMA, Concepcion | Multidimensional method and computer system for patent and technology portfolio rating and related database |
-
2013
- 2013-08-19 CN CN201310362553.7A patent/CN103605878B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101884541A (zh) * | 2010-07-05 | 2010-11-17 | 北京航空航天大学 | 人体血液生化参数无创检测仪及检测方法 |
CN103092078A (zh) * | 2013-01-07 | 2013-05-08 | 北京中医药大学 | 多阶段间歇生产过程的全程优化方法 |
Non-Patent Citations (1)
Title |
---|
Multiple Local Reconstruction Model-based Fault Diagnosis for Continuous Processes;zhao chunhui et al.;《ACTA AUTOMATICA SINICA》;20130531;第39卷(第5期);第487-493页 * |
Also Published As
Publication number | Publication date |
---|---|
CN103605878A (zh) | 2014-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103605878B (zh) | 一种基于数据建模和模型移植的通用血糖预测方法 | |
CN103310113B (zh) | 一种基于频带分离和数据建模的通用血糖预测方法 | |
CN101480143B (zh) | 一种预测灌区作物单产量的方法 | |
Zandi et al. | Evaluation of spatial interpolation techniques for mapping soil pH | |
CN107705556A (zh) | 一种基于支持向量机和bp神经网络结合的交通流预测方法 | |
CN106600037B (zh) | 一种基于主成分分析的多参量辅助负荷预测方法 | |
García et al. | A biologically-consistent stand growth model for loblolly pine in the Piedmont physiographic region, USA | |
CN110378070A (zh) | 基于pso-svr与des联合的滑坡位移预测方法 | |
CN109635245A (zh) | 一种鲁棒宽度学习系统 | |
CN103268519A (zh) | 基于改进Lyapunov指数的电力系统短期负荷预测方法及装置 | |
CN110689183B (zh) | 一种集群光伏功率概率预测方法、系统、介质及电子设备 | |
CN109636007A (zh) | 一种基于大数据的用水量预测方法及装置 | |
Guo et al. | Prediction of daily crop reference evapotranspiration (ET0) values through a least-squares support vector machine model | |
CN105184400A (zh) | 一种烟田土壤水分预测方法 | |
Buis et al. | The STICS crop model and associated software for analysis, parameterization, and evaluation | |
CN103353295B (zh) | 一种精确预测大坝坝体垂直变形量的方法 | |
CN105740989A (zh) | 一种基于varx模型的供水管网异常事件侦测方法 | |
CN111462834A (zh) | 一种植物中镉过量的概率值的预测方法及系统 | |
Genaidy | Estimating of evapotranspiration using artificial neural network | |
CN106251006A (zh) | 一种阿根廷鱿鱼资源补充量预测方法 | |
Algamal et al. | Re-sampling in linear regression model using jackknife and bootstrap | |
CN104636318A (zh) | 一种大数据方差标准差的分布式或增量计算方法 | |
Vyas et al. | Application of artificial neural network approach for estimating reference evapotranspiration | |
Bala et al. | Simulation of crop-irrigation systems | |
CN116975787B (zh) | 一种enso建模和预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |