CN103605878B

CN103605878B - 一种基于数据建模和模型移植的通用血糖预测方法

Info

Publication number: CN103605878B
Application number: CN201310362553.7A
Authority: CN
Inventors: 赵春晖; 喻成侠; 李文卿
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2013-08-19
Filing date: 2013-08-19
Publication date: 2016-03-30
Anticipated expiration: 2033-08-19
Also published as: CN103605878A

Abstract

本发明公开了一种基于数据建模和模型移植的通用血糖预测方法；该方法针对人体皮下血糖测量信号、人体输注的胰岛素及摄入的饮食进行分析，提取其与未来血糖的关系，并应用到缺乏数据量的新对象上；分别采用传统最小二乘方法和基于潜变量方法建立有外源输入的自回归血糖预测模型，并进行了对比；最后基于预测性能较好的潜变量方法选取基模型实现模型移植；实际应用时针对新对象无需等待获取充分血糖测量信号后重新建模，而是可以直接将基模型移植到新对象上，根据拟合效果在线调整模型系数实现实时血糖预测，大大简化了建模工作量和复杂度。

Description

一种基于数据建模和模型移植的通用血糖预测方法

技术领域

本发明属于血糖数据分析和预测研究领域，特别是涉及一种基于数据建模和模型移植的通用血糖预测方法。

背景技术

人体血糖水平的一个显著特点就是时变性，即时序信号测量值存在显著的自相关关系。此外，外源输入和血糖时序数据之间亦密切相关。这两种相关关系是建立血糖预测模型的基础和关键。

针对血糖信号、外部输入胰岛素信号和饮食信号进行分析、建模，可以根据历史测量值获取未来血糖变化情况。目前，血糖预测模型的建立多采用基于数据驱动的方法。已存在的预测模型可以划分为线性(以基于最小二乘的自回归模型为其典型代表)和非线性(以神经网络方法为其典型代表)两类。线性模型由于其简单的模型结构和算法，获得了广泛应用。比较成熟的建模方法包括自回归(autoregressive,AR)、激励响应(impulse-response,IR)等。根据是否包括外源输入(胰岛素和饮食输入等)作为建模变量，AR模型又可以区分为自回归(AR)模型和具有外源输入的自回归(ARwithexogenousinputs,ARX)模型。然而传统的ARX模型主要缺陷有两点：（a）直接针对测量数据利用最小二乘这种最基本的辨识方法拟合血糖预测关系，无法避免该方法本身所具有的缺陷，不能得到满意的预测精度；（b）针对不同个体的血糖动态性、外源输入不进行预先分析，直接建立不同的预测模型(即个体化模型)用于在线预测，这将耗费大量人力物力。

发明内容

本发明的目的在于针对现有血糖预测方法的不足，提供一种基于数据建模和模型移植的通用血糖预测方法。

本发明的目的是通过以下技术方案来实现的：一种基于数据建模和模型移植的通用血糖预测方法，该方法包括以下步骤：

步骤1：建模信号预处理：将以一定采样周期Δt获得的个体皮下血糖信号、输注该个体的胰岛素信号、该个体摄入的饮食信号分别组合成一维时序数据G_k×1、I_k×1、M_k×1，其中，G、I、M分别是血糖信号、胰岛素信号和饮食信号的测量值，k为以采样周期Δt获得的采样个数；去除血糖信号、胰岛素信号和饮食信号中的尖峰噪声。

步骤2：获取预测变量矩阵和响应矩阵：预测区间记为ph，血糖信号和两外源输入信号预测变量的长度分别记为l_G、l_I、l_M，则二维预测变量矩阵表示为其中，二维预测变量矩阵行数n=k-ph-l+1，k为以采样周期Δt获得的采样个数，ph为预测区间，l=max{l_G,l_I+d-1,l_M+d-1}，而d是两外源输入信号样本输入的延迟，二维预测变量矩阵列数j_x=l_G+l_I+l_M。一维响应矩阵表示为Y_n×1=[G_l+ph,G_l+ph+1,G_k]^T。

步骤3：基于LV的血糖预测建模：通过基于LV的方法进行血糖预测建模。

步骤4：选取基模型进行模型移植：根据步骤3的预测效果，采用LV方法进行模型移植，该步骤通过以下子步骤来实现：

（4.1）确定模型移植的基模型：先从实际角度考虑选取LV方法中胰岛素前的系数识别为负值，饮食前的系数识别为正值的对象的模型系数，再从预测精度考虑，选取预测RMSE最小的对象的模型系数作为基模型。

（4.2）确定模型移植调节方向判断依据：根据预测值和真实测量值均值、波峰或波谷判断二者的相对大小。

（4.3）确定模型移植的调节步长：权衡步长减小带来的调节时间增长和精度提高之间的矛盾，确定模型移植的调节步长。

（4.4）确定模型移植的调节策略：对比先调节胰岛素前系数，再调节饮食前系数和先调节饮食前系数，再调节胰岛素前系数的拟合效果，确定调节策略为先调节胰岛素前系数，再调节饮食前系数。

步骤5：根据步骤4确定的基模型、步长和调节策略对任意个体的未来血糖值进行预测。该步骤通过以下子步骤来实现：

（5.1）在线预测时，在采集到任意个体新数据G_newk×1、I_newk×1、M_newk×1后（下标new代表新样本，一般数据量较缺乏），对新数据按步骤2所述的预测变量矩阵排列得到测试数据输入矩阵

（5.2）调用基模型进行在线修正预测：

（5.2.1）调用基模型进行模型移植：

对于每个新的测试数据由以下步骤计算直接移植基模型后对测试数据的预测值

\tilde{Y} = X_{new} σ; - - - (1)

其中，X_new为对新数据按步骤2所述的步骤获得的预测变量矩阵，σ是PLS-CCA方法求出的基模型的回归系数向量。

（5.2.2）根据预测值和测试数据的误差不断在线修正两外源输入系数，直到拟合RMSE最小，得到修正后的模型系数σ′，由以下步骤计算移植基模型在线修正后获得ph个采样点后的预测值

{\hat{Y}}_{v} = X_{r} σ^{'}; - - - (2)

其中X_r为该个体采集的任意数据按步骤2所述的预测变量矩阵排列后的矩阵或向量，σ′为修正后的回归系数向量。

与现有技术相比，本发明的有益效果是：本发明所提出的通用血糖预测方法实际应用时针对新对象无需等待获取充分血糖测量信号后重新建模，而是可以直接将基模型移植到新对象上，根据拟合效果在线调整模型系数实现实时血糖预测，大大简化了建模工作量和复杂度，将极大地降低建模花费；且预测模型采用基于潜变量建模的方法，外源输入经过平滑处理，提高了预测精度。本发明易于实施，为血糖预测建模方法的研究指明了新的方向。

附图说明

图1是本发明所述的通用血糖预测模型建模流程图。

图2是采用相同条件下的训练数据和测试数据时LS方法的预测结果图（分析对象为儿童组第十人的血糖信号）；

图3是采用相同条件下的训练数据和测试数据时LV方法的预测结果图（分析对象为儿童组第十人的血糖信号）；

图4是采用不同条件下的训练数据和测试数据时LS方法的预测结果图（分析对象为儿童组第十人的血糖信号）；

图5是采用不同条件下的训练数据和测试数据时LV方法的预测结果图（分析对象为儿童组第十人的血糖信号）；

图6是只调节胰岛素前系数，步长分别为1,0.1,0.01,0.001对13个训练数据三组对象的拟合精度比较图；

图7是只调节饮食前系数，步长分别为1,0.1,0.01,0.001对13个训练数据三组对象的拟合精度比较图。

图8是模型移植训练数据个数分别为13、30、50时对一天数据预测结果比较图（分析对象为青少年组第一人的血糖信号）。

图9是50个训练数据时基于LV直接建模和模型移植的预测结果比较图（分析对象为青少年组第一人的血糖信号）。

具体实施方式

如图1所示，本发明基于数据建模和模型移植的通用血糖预测方法，该方法包括以下步骤：

步骤1：建模信号预处理

针对以一定采样周期Δt获得的个体皮下血糖信号、输注该个体的胰岛素信号、该个体摄入的饮食信号(这里Δt=5min)，将其分别组合成一维时序数据G_k×1、I_k×1、M_k×1，其中，G、I、M分别是血糖信号、胰岛素信号和饮食信号的测量值，k为以采样周期Δt获得的采样个数，去除其中的尖峰噪声。本实例中，我们共有来自于三组对象的采样信号，第1组为青少年组，第2组为成人组，第3组为儿童组，每组10人，三组共30人。每个对象的采样信号包括四天的数据。

步骤2：获取预测变量矩阵和响应矩阵

该步主要用于将步骤1中采集的信号进行整合排列，得到训练数据输入输出矩阵，测试数据输入矩阵。预测区间记为ph，血糖信号和两外源输入信号预测变量的长度分别记为l_G、l_I、l_M，则二维预测变量矩阵表示为其中，二维预测变量矩阵行数n=k-ph-l+1，k为以采样周期Δt获得的采样个数，ph为预测区间，l=max{l_G,l_I+d-1,l_M+d-1}，而d是两外源输入信号样本输入的延迟，二维预测变量矩阵列数j_x=l_G+l_I+l_M。一维响应矩阵表示为Y_n×1=[G_l+ph,G_l+ph+1,G_k]^T。

具体步骤为用一个长度为ph+l_G个采样点的一维滑动窗口滑过一维时序血糖信号数据G_k×1，每次移动一个采样点，共移动n次。将每次滑动窗口中的数据作为一个新的行向量，则可以组合为一个二维数据矩阵，截取该矩阵的前l_G列，则为截取该矩阵的最后一列则为Y_n×1。分别用一个长度为l_I和l_M个采样点的一维滑动窗口从第l_G-d个采样点滑过一维时序胰岛素信号数据I_k×1和一维时序饮食信号数据M_k×1，每次移动一个采样点，共移动n次。分别将每次滑动窗口中的数据作为一个新的行向量，则组合为和

对个体模型的研究表明，当有7-8个历史血糖样本，1-2个外源输入样本，以及5-6个输入样本的延迟会获得比较好的预测模型。下面我们针对7个历史血糖样本，即l_G=7；胰岛素和饮食输入均为1阶，即l_I=l_M=1；5个输入样本延迟，即d=5进行研究。这样l=max{7,1+5-1,1+5-1}=7，j_x=7+1+1=9。一般预测区间ph=6，即预测30分钟后的血糖值，这对未来血糖预测较为有意义，可以保证一定的预测精度和可靠性。

所以用一个长度为13个采样点的一维滑动窗口滑过G_k×1，每次移动一个采样点，共移动k-12次。将每次滑动窗口中的数据作为一个新的行向量，则可以组合为一个二维数据矩阵，截取该矩阵的前7列，则为G_(k-12)×7，截取该矩阵的最后一列则为Y_(k-12)×1。分别用一个长度为1和1个采样点的一维滑动窗口从第2个采样点开始滑过I_k×1和M_k×1，每次移动一个采样点，共移动k-12次。分别将每次滑动窗口中的数据作为一个新的行向量，则组合为I_(k-12)×1和M_(k-12)×1。

步骤3：基于LV的血糖预测建模：

预测模型建立有两种方法，一种是现有的基于LS（leastsquare，最小二乘）的方法，另一种是基于LV（latentvariable，潜变量）的建模方法。具体步骤如下：

（3.1）根据血糖信号和两外源输入信号组成步骤2所述的预测变量矩阵和响应矩阵。

每个对象采样信号的前三天的数据用于每个对象ARX模型训练，称为训练数据，最后一天的数据用于每个对象ARX模型性能的测试，称为测试数据。则此时训练数据有864个，测试数据有288个。则此时步骤2中训练数据的k=864，测试数据的k=288。

（3.2）如果通过基于LS的方法进行血糖预测建模，则根据血糖信号和两外源输入信号采用LS方法建立ARX预测模型：

Y_{s} = Xθ + F = {\hat{Y}}_{s} + F; - - - (1)

其中，Y_s为血糖真实值，X为用步骤2获取的预测变量矩阵，θ为回归系数，F为模型误差，为用LS方法获得的血糖预测值。

如果通过基于LV的方法进行血糖预测建模，根据血糖信号和两外源输入信号采用LV方法建立ARX预测模型：

基于LV的ARX预测模型采用PLS-CCA（partialleastsquare-canonicalcorrelationanalysis，偏最小二乘-典型相关性分析）的特征提取方法进行建模。先用PLS提取初步潜变量组，由于PLS方法提取的潜变量LVs不能保证其与响应变量的密切相关关系，再用CCA对其进行后处理，从而提取其中与相应变量密切相关的部分进行回归建模与预测。步骤如下：

（3.2.1）外源输入平滑处理

为提高预测的精度，分别使用如下两式对胰岛素和饮食两外源输入进行平滑处理：

H_{1} = \frac{1}{{750 s}^{2} + 55 s + 1}; - - - (2)

H_{2} = \frac{1}{{450 s}^{2} + 55 s + 1}; - - - (3)

其中H₁表示外源胰岛素输入平滑处理使用的传递函数，H₂表示外源饮食输入平滑处理使用的传递函数。

（3.2.2）数据预处理

将所有个体的预测变量矩阵和响应矩阵组合到一起，针对组合后的预测变量矩阵和响应矩阵内任意一点的变量x_i,j，对该变量进行减均值、除以标准差的全局标准化处理，标准化处理的计算公式如下：

x_{i, j} = \frac{x_{i, j} - {\overset{&OverBar;}{x}}_{j}}{s_{j}}; - - - (4)

其中：是组合后的矩阵任一列的均值，s_j是相应列的标准差。其计算公式如下：

{\overset{&OverBar;}{x}}_{j} = \frac{1}{M} Σ_{i = 1}^{M} x_{i, j}

s_{j} = \sqrt{Σ_{i = 1}^{M} {(x_{i, j} - {\overset{&OverBar;}{x}}_{j})}^{2} / M}; - - - (5)

其中：M是组合后任一列样本的总量。

（3.2.3）利用PLS提取潜变量组T：

T=XR

R=W(P^TW)^-1；（6）

其中，T是由多个PLS潜变量构成的潜变量矩阵，X为用步骤2获取的预测变量矩阵，R是PLS方法的系数矩阵，W是由PLS求出的权重矩阵，P是对应于T的负载矩阵。

（3.2.4）利用CCA对PLS潜变量进行后处理，得到最终潜变量U：

U=TV；（7）

其中，V是对应于潜变量矩阵T的权重向量。因响应矩阵Y是单变量输出响应，由于CCA方法本身的特点，故最终只需提取一个潜变量。

需要指出的是，PLS与CCA方法的权重矩阵都可以通过求取特定矩阵的特征向量而求得，是一种有效的分析数据变量间相关关系的统计分析方法。

（3.2.5）建立ARX模型：

用最小二乘法求取潜变量与响应变量间的回归系数q：

q=(U^TU)^-1U^TY；（8）

故最终基于LV方法建立的ARX模型为：

{\hat{Y}}_{v} = Xσ; - - - (9)

σ=RVq

其中，σ是通过PLS与CCA两种方法结合获得的预测模型回归系数，为基于LV方法获得的血糖预测值。

在获得针对不同对象建立的预测模型后，需要对预测性能进行评价，验证预测模型是否可以进行实时血糖预测，验证LV方法的优越性。

验证LV方法的优越性的具体步骤如下：

（I）采用相同条件下的训练数据和测试数据

训练数据和测试数据的来源中，每个对象的饮食时刻和该时刻的饮食量固定。

（a）首先对每一个对象，采用步骤2中的方法对血糖信号和两外源输入信号处理获取训练数据矩阵后，采用步骤（3.2.1）中的方法对两外源输入信号进行平滑处理。

然后调用基于LS建立的ARX模型进行血糖预测，得到预测值其中，θ是LS方法求出的回归系数向量。

（b）首先对每一个对象，采用步骤2中的方法对血糖信号和两外源输入信号处理获取训练数据矩阵后，采用步骤（3.2.1）中的方法对两外源输入信号进行平滑处理，再采用步骤（3.2.2）中的方法对数据进行全局标准化处理。

然后，调用基于LV建立的ARX模型进行血糖预测，得到预测值其中，σ是PLS-CCA方法求出的回归系数向量。

（II）采用不同条件下的训练数据和测试数据

训练数据的来源中，每个对象的饮食时刻和该时刻的饮食量固定。测试数据的来源中，每个对象的饮食时刻随机波动一小时，该时刻的饮食量随机波动75%。

具体步骤与（I）相同。

（III）对比两种方法的预测精度

按如下方式计算RMSE（均方根误差）性能指标：

RMSE = \sqrt{\frac{1}{N} \underset{i &Element; N}{Σ} {(y (i) - {\hat{y}}^{*} (i))}^{2}}; - - - (10)

其中y(i)表示原始的血糖测量值，表示采用不同模型获得的血糖预测结果，这里可以是采用LS方法求得的血糖预测值或者采用LV方法求得的血糖预测值N为样本数。这里需要指出的是，衡量预测精度时，需要将原始血糖测量值作为参考量，预测误差是血糖预测结果和原始血糖测量值的对比。

然后，基于RMSE指标，对两种方法(LS方法与LV方法)的预测精度进行对比。

结果(如表1所示)表明，两种方法均可以实现血糖的实时预测，且可以经受饮食时间和饮食量的随机变化，但采用LV方法建立的ARX模型预测精度要优于采样LS方法建立的ARX模型。

表1针对3组（青少年组、成人组和儿童组）共30个对象采用不同LS/LV方法获得的血糖预测结果对比(平均RMSE(mg/dL))

为了更清楚显示两种方法预测精度的比较，选择如图2、图3、图4、图5。步骤4：选取基模型进行模型移植：

根据步骤3的预测效果，从两种方法中选取预测精度较高的LV方法进行模型移植，通过以下步骤来完成：

（4.1）确定模型移植的基模型：针对3组共30个对象基于LV方法建立的30个ARX模型，先从实际角度考虑选取胰岛素前的系数识别为负值，饮食前的系数识别为正值的对象的模型系数，再从预测精度考虑，选取预测RMSE最小的对象的模型系数作为基模型。最终选择对象10的模型系数作为基模型，7阶血糖信号前系数分别为a₁=-0.3516，a₂=0.1574，a₃=0.7598，a₄=-0.0539，a₅=-1.6436，a₆=-1.5561，a₇=3.6378，两外源输入信号前系数分别为b=-0.4741，c=0.4133。

（4.2）确定模型移植调节方向判断依据：根据预测值和真实测量值均值、波峰或波谷判断二者的相对大小。本发明根据均值判断预测值和真实测量值的相对大小。

（4.3）确定模型移植的调节步长：一般而言，两外源输入前系数调节步长越小，预测精度会越高，但调节的时间也越长。根据预测值和真实测量值均值的相对大小判断调节方向，调节步长分别选择为1、0.1、0.01、0.001，只单一的调节外源输入，四种步长下三组共30个对象对各自13个（7阶ARX模型可以实现预测的最小数据量）少量训练数据的拟合精度结果（如表2所示）表明步长越小拟合精度越高，但在调节的过程可以发现步长越小运行时间越长。为了权衡步长减小带来的调节时间增长和精度提高之间的矛盾，确定模型移植的调节步长为0.01。

表2针对3组（青少年组、成人组和儿童组）共30个对象采用不同调节步长获得的血糖预测结果对比(平均RMSE(mg/dL))

为了更清楚显示四种步长下拟合精度的比较，选择如图4、图5。

根据预测值和真实测量值均值的相对大小判断调节方向，调节步长为0.01，两种策略下三组共30个对象对各自13个（可以实现预测的最小数据量）少量训练数据的拟合精度结果（如表3所示）表明先调节胰岛素前系数再调节饮食前系数比先调节饮食前系数再调节胰岛素前系数拟合精度要高。所以，调节策略确定为先调节胰岛素前系数，再调节饮食前系数。

表3针对3组（青少年组、成人组和儿童组）共30个对象采用不同调节策略获得的血糖预测结果对比(平均RMSE(mg/dL))

组别	青少年	成人	儿童
				先调节胰岛素前系数再调节饮食前系数	14.16	6.62	30.21
先调节饮食前系数再调节胰岛素前系数	14.20	6.65	30.23

步骤5：基于模型移植的在线预测：

根据步骤4确定的基模型、步长和调节策略对任意个体的未来血糖值进行预测。通过以下步骤来完成：

（5.2）调用基模型进行在线修正预测：

（5.2.1）调用基模型进行模型移植：

\tilde{Y} = X_{new} σ; - - - (11)

{\hat{Y}}_{v} = X_{r} σ^{'}; - - - (12)

为了更清楚显示模型移植的预测精度不随训练数据量的变化而变化，选择如图6。

为了对比少量训练数据时基于LV直接建模方法实现预测和模型移植方法实现预测精度，选择如图7。

Claims

1.一种基于数据建模和模型移植的通用血糖预测方法，其特征在于，该方法包括以下步骤：

步骤1：建模信号预处理：将以一定采样周期Δt获得的个体皮下血糖信号、输注该个体的胰岛素信号、该个体摄入的饮食信号分别组合成一维时序数据G_k×1、I_k×1、M_k×1，其中，G、I、M分别是血糖信号、胰岛素信号和饮食信号的测量值，k为以采样周期Δt获得的采样个数；去除血糖信号、胰岛素信号和饮食信号中的尖峰噪声；

步骤2：获取预测变量矩阵和响应矩阵：预测区间记为ph，血糖信号和两外源输入信号预测变量的长度分别记为l_G、l_I、l_M，则二维预测变量矩阵表示为其中，二维预测变量矩阵行数n＝k-ph-l+1，k为以采样周期Δt获得的采样个数，ph为预测区间，l＝max{l_G,l_I+d-1,l_M+d-1}，而d是两外源输入信号样本输入的延迟，二维预测变量矩阵列数j_x＝l_G+l_I+l_M；一维响应矩阵表示为Y_n×1＝[G_l+ph,G_l+ph+1,G_k]^T；

步骤3：基于潜变量的血糖预测建模：通过基于潜变量的方法进行血糖预测建模；

步骤4：选取基模型进行模型移植：根据步骤3的预测效果，采用潜变量方法进行模型移植，该步骤通过以下子步骤来实现：

(4.1)确定模型移植的基模型：先从实际角度考虑选取潜变量方法中胰岛素前系数识别为负值，饮食前系数识别为正值的对象的模型系数，再从预测精度考虑，选取预测均方根误差最小的对象的模型系数作为基模型；

(4.2)确定模型移植调节方向判断依据：根据预测值和真实测量值均值、波峰或波谷判断二者的相对大小；

(4.3)确定模型移植的调节步长：权衡步长减小带来的调节时间增长和精度提高之间的矛盾，确定模型移植的调节步长；

(4.4)确定模型移植的调节策略：对比先调节胰岛素前系数，再调节饮食前系数和先调节饮食前系数，再调节胰岛素前系数的拟合效果，确定调节策略为先调节胰岛素前系数，再调节饮食前系数；

步骤5：根据步骤4确定的基模型、步长和调节策略对任意个体的未来血糖值进行预测；该步骤通过以下子步骤来实现：

(5.1)在线预测时，在采集到任意个体新数据G_newk×1、I_newk×1、M_newk×1后，对新数据按步骤2所述的预测变量矩阵排列得到测试数据输入矩阵

(5.2)调用基模型进行在线修正预测：

(5.2.1)调用基模型进行模型移植：

其中，X_new为对新数据按步骤2所述的步骤获得的预测变量矩阵，σ是偏最小二乘-典型相关性分析方法求出的基模型的回归系数向量；

(5.2.2)根据预测值和测试数据的误差不断在线修正两外源输入系数，直到拟合均方根误差最小，得到修正后的模型系数σ′，由以下步骤计算移植基模型在线修正后获得ph个采样点后的预测值

其中X_r为该个体采集的任意数据按步骤2所述的预测变量矩阵排列后的矩阵，σ′为修正后的回归系数向量。

2.根据权利要求1所述的基于数据建模和模型移植的通用血糖预测方法，其特征在于，所述步骤2具体为：用一个长度为ph+l_G个采样点的一维滑动窗口滑过一维时序血糖信号数据G_k×1，每次移动一个采样点，共移动n次；将每次滑动窗口中的数据作为一个新的行向量，则组合为一个二维数据矩阵，截取该矩阵的前l_G列，则为截取该矩阵的最后一列则为Y_n×1；用一个长度为l_I个采样点的一维滑动窗口从第l_G-d个采样点滑过一维时序胰岛素信号数据I_k×1，每次移动一个采样点，共移动n次，将每次滑动窗口中的数据作为一个新的行向量，则组合为用一个长度为l_M个采样点的一维滑动窗口从第l_G-d个采样点滑过一维时序饮食信号数据M_k×1，每次移动一个采样点，共移动n次，将每次滑动窗口中的数据作为一个新的行向量，组合为

3.根据权利要求1所述基于数据建模和模型移植的通用血糖预测方法，其特征在于，所述步骤3基于潜变量的血糖预测建模；具体步骤如下：

(3.1)根据血糖信号和两外源输入信号组成步骤2所述的预测变量矩阵和响应矩阵；

(3.2)根据血糖信号和两外源输入信号采用潜变量方法建立具有外源输入的自回归模型：基于潜变量的具有外源输入的自回归模型采用偏最小二乘-典型相关性分析的特征提取方法进行建模；先用偏最小二乘方法提取初步潜变量组，由于偏最小二乘方法提取的潜变量LVs不能保证其与响应变量的密切相关关系，再用典型相关性分析方法对其进行后处理，从而提取其中与相应变量密切相关的部分进行回归建模与预测；步骤如下：

(3.2.1)外源输入平滑处理

其中H₁表示外源胰岛素输入平滑处理使用的传递函数，H₂表示外源饮食输入平滑处理使用的传递函数；

(3.2.2)数据预处理

其中：是组合后的矩阵任一列的均值，s_j是相应列的标准差；其计算公式如下：

其中：M是组合后任一列样本的总量；

(3.2.3)利用偏最小二乘方法提取潜变量组T：

其中，T是由多个偏最小二乘潜变量构成的潜变量矩阵，X为用步骤2获取的预测变量矩阵，R是偏最小二乘方法的系数矩阵，W是由偏最小二乘方法求出的权重矩阵，P是对应于T的负载矩阵；

(3.2.4)利用典型相关性分析方法对偏最小二乘潜变量进行后处理，得到最终潜变量U：

U＝TV；(8)

其中，V是对应于潜变量矩阵T的权重向量；因响应矩阵Y是单变量输出响应，由于典型相关性分析方法本身的特点，故最终只需提取一个潜变量；

(3.2.5)建立具有外源输入的自回归模型：

用最小二乘法求取潜变量与响应变量间的回归系数q：

q＝(U^TU)^-1U^TY；(9)

故最终基于潜变量方法建立的具有外源输入的自回归模型为：

其中，σ是通过偏最小二乘与典型相关性分析两种方法结合获得的预测模型回归系数，为基于潜变量方法获得的血糖预测值；

(3.3)衡量预测精度：将获得的血糖预测结果与实际测量值进行对比；在获得一系列新的预测信号后，根据下式中定义的均方根误差性能指标计算针对新样本的血糖预测精度：

其中，y(i)表示原始的血糖测量值，表示采用不同方法获得的血糖预测结果，N为样本数。