CN111931815A

CN111931815A - 基于迁移样本的跨域迁移电子鼻漂移抑制方法

Info

Publication number: CN111931815A
Application number: CN202010653407.XA
Authority: CN
Inventors: 闫嘉; 易若男; 陈飞越; 王子健; 王丽丹; 段书凯
Original assignee: Southwest University
Current assignee: Southwest University
Priority date: 2020-07-08
Filing date: 2020-07-08
Publication date: 2020-11-13
Anticipated expiration: 2040-07-08
Also published as: CN111931815B

Abstract

本发明公开了一种基于迁移样本的跨域迁移电子鼻漂移抑制方法，将源域、目标数据投影到子空间，不同域数据之间集进行边缘最大均值差异做最小化处理、条件最大均值差异做最小化处理、可分性最大化、判别信息做最大化处理后，得到转换基P和对应投影源域数据集和投影目标域数据集；根据投影源域数据集、投影目标域数据集，计算适应极限学习机的未知输出权重，得到最终的适应极限学习机；并将未知标签的目标域数据进行漂移抑制测试。有益效果：在抑制漂移的同时，保存了源域和目标域的判别信息。最小化边缘分布差异和条件分布差异，提高了模型的健壮性和分类精确度。在特征层和决策层实现知识迁移，充分利用迁移样本。

Description

基于迁移样本的跨域迁移电子鼻漂移抑制方法

技术领域

本发明涉及电子鼻信号处理技术领域，具体的说是一种基于迁移样本的跨域迁移电子鼻漂移抑制方法。

背景技术

电子鼻中的金属氧化半导体传感器的时间漂移和板件漂移是当前传感器和测量领域的一个亟待解决的问题。漂移的时变特征和方向的不可预测性导致很难对漂移直接进行测量。有着高效率和低计算复杂性的极限学习机常被用于解决电子鼻中的时间漂移/板间漂移现象。

抑制传感器漂移的方法主要有如下两种：

1、特征层面的抑制方法。旨在从数据分布的角度抑制漂移，使得源域和目标域的数据分布差异缩小。

2、决策层面的抑制方法。旨在训练鲁棒性分类器，实现从源域到目标域的知识迁移。

不足之处：1、基于特征层面的抑制方法没有考虑分类器的知识迁移能力，不能根据目标域样本进行调整得到自适应分类器，分类效果较差。2、基于决策层面的抑制方法忽略了源域和目标域的数据分布不匹配问题，分类前不同域数据的分布差异大，降低了分类性能。

发明内容

针对上述问题，本发明提供了一种基于迁移样本的跨域迁移电子鼻漂移抑制方法，利用少量的目标域迁移样本，在特征层和决策层同时进行知识迁移，提升极限学习机的分类表现，实现漂移抑制。

为达到上述目的，本发明采用的具体技术方案如下：

一种基于迁移样本的跨域迁移电子鼻漂移抑制方法，其关键技术在于：按照以下步骤进行：

S1：电子鼻获取源域数据集和目标域数据集，该目标域数据集包括未知标签目标域数据集、已知标签目标域数据集，将源域数据集、目标域数据集投影到子空间，得到该两个数据集从原始空间经过转换基P投影到子空间的投影源域数据集、投影目标域数据集，该投影目标域数据集包括投影未知标签目标域数据集、投影已知标签目标域数据集；

其中，已知标签目标域数据集即为目标域迁移样本数据集；投影已知标签目标域数据集即投影目标域迁移样本数据集；

其中，已知标签目标域数据集预先进行标签标定，具体方式通过试纸检测、化学反应的方法进行测定。

S2：对子空间中投影源域数据集和投影目标域数据集的边缘最大均值差异做最小化处理，得到最小化投影后边缘最大均值差异公式；

对子空间中投影源域数据集和投影已知标签目标域数据集的条件最大均值差异做最小化处理，得到最小化投影后条件最大均值差异公式；

为了使投影源域数据集和投影目标域数据集更具有可分性，增强类内紧密性和类间离散性，计算投影源域数据集和投影已知标签目标域数据集的类内离散度矩阵和类间离散度矩阵，得到投影源域数据集和投影目标域数据集可分性最大化计算公式；

对投影源域数据集和投影目标域数据集的判别信息做最大化处理并简化，得到最大化投影源域数据集判别信息公式和最大化投影目标域数据集判别信息公式；

S3：将步骤S2得到的公式进行合并，得到数据从原始空间投影到子空间的转换基P的求解公式；

S4：根据步骤S3得到的数据从原始空间投影到子空间的转换基P的求解公式，对其进行优化并增加求解约束条件，得到优化约束后的数据从原始空间投影到子空间的转换基P的求解公式，从而得到数据从原始空间投影到子空间的最优转换基P以及投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集；

S5：根据步骤S4得到的投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集，用投影源域数据集和投影已知标签目标域数据集计算域适应极限学习机的输出权重，得到最终的域适应极限学习机；并将电子鼻采集的数据进行漂移抑制测试。

通过上述设计，同时考虑源域和目标域的边缘分布差异和条件分布差异，减小了两域的分布差异。遵循线性判别分析的原则，增强投影后源域和目标域数据的类间可分离性和类内的紧密性，提高源域数据和目标域数据可分性。为了使源域和目标域数据的判别信息在投影后保留，同时最大化两域的方差。在决策层面，训练一个具有知识迁移能力的域适应分类器，即域适应极限学习机。利用源域标记的样本和目标域少量的迁移样本训练适应极限学习机，使该分类器迁移性能和泛化性能更强。

进一步的，在步骤S1中，所述源域数据集为

所述目标域数据集

目标域数据集中的迁移样本数据集为

源域数据集样本个数分别为N_S；目标域数据集样本个数分别为N_T；数据维数为D，

表示将数据从原始空间投影到维数为d的子空间的转换基；

投影源域数据集为

投影目标域数据集为

符号||·||₂表示2范数，Tr(·)表示求矩阵迹的运算，(·)^T表示转置矩阵；

在步骤S2中，为了减小分布差异，最小化投影后的投影源域数据集和投影目标域数据集的边缘分布差异：最小化投影后边缘最大均值差异公式；

μ_S代表子空间中投影源域数据集的中心；μ_T代表子空间中投影目标域数据集的中心；

表示子空间学习后投影源域数据集的第i个样本；其中，

表示子空间学习后投影目标域数据集的第j个样本；其中：

为原始空间中源域数据集的第i个样本，

为原始空间中目标域数据集的第j个样本。

将公式(2)、(3)带入公式(1)，得到：

u_S表示原始空间源域数据集的中心；

u_T表示原始空间目标域数据集的中心；

为了使投影源域数据集和投影目标域数据集更加对齐，最小化子空间中投影源域数据集和投影目标域数据集的条件分布差异，所述最小化投影后条件最大均值差异公式为

表示投影源域数据集第c类样本的第i个样本；

表示原始空间源域数据集第c类样本的第i个样本；

表示投影目标域迁移样本数据集第c类样本的第k个样本；

表示原始空间目标域迁移样本数据集第c类样本的第k个样本；

表示目标域迁移样本数据集第c类样本的个数；

表示源域数据集第c类样本的个数；

μ_S.c表示子空间中第c类投影源域数据的中心；

表示子空间中第c类投影目标域迁移样本数据的中心；

u_S.c表示原始空间中第c类源域数据的中心；

表示原始空间中第c类目标域迁移样本数据的中心；

为了使源域和目标域更具有可分性，增强类内紧密性和类间离散性，计算源域和目标域迁移数据的类内离散度矩阵和类间离散度矩阵，投影源域数据集和投影目标域数据集可分性最大化计算公式：

表示投影目标域迁移样本数据的中心；

表示原始空间目标域迁移样本数据的中心；

为投影源域数据集类间离散度矩阵；

为投影源域数据集类内离散度矩阵；

为原始空间源域数据集类间离散度矩阵；

为原始空间源域数据集类内离散度矩阵；

表示投影目标域迁移样本数据集类间离散度矩阵；

表示投影目标域迁移样本数据集类内离散度矩阵；

表示原始空间目标域迁移样本数据集类间离散度矩阵；

表示原始空间目标域迁移样本数据集类内离散度矩阵；

为了尽可能保留投影后源域和目标域的判别信息，所述最大化投影源域数据集判别信息公式为：

所述最大化投影目标域数据集判别信息公式为：

其中，Y_T＝P^TX_T，Y_S＝P^TX_S，则公式(8)简化得到：

公式(9)简化得到：

在步骤S3中，将式子(4)(5)(6)(7)(10)(11)合并得到的所述数据从原始空间投影到子空间的转换基P的求解公式为：

其中，λ₀,λ₁,λ₂,λ₃,λ₄,λ₅是权衡参数。

其中，数据从原始空间投影到子空间的转换基P的求解公式中存在数据从原始空间投影到子空间的转换基P的至少一个可行解，为了保证P的解的唯一性，在该最优化问题上加上等价约束，得到：

其中，ε为一正常数；

拉格朗日函数如下：

其中，α表示拉格朗日乘子；

把

对数据从原始空间投影到子空间的转换基P的偏导数置为0，可得到：

从(15)中，可得到如下特征值分解问题：

vP＝αP (16)

其中，

α表示特征值，对应的特征向量：P是与特征值对应的特征向量，其中数据从原始空间投影到子空间的最优转换基P即前d个最小特征值对应的特征向量：

P^*＝[P₁,P₂,…,P_d] (17)

则求得：

投影源域数据集为：Y_S＝P^*TX_S； (18-1)

投影目标域数据集为：Y_T＝P^*TX_T； (18-2)

投影已知标签目标域数据集为

表示原始空间目标域迁移样本数据集，

表示投影已知标签目标域数据集。

进一步的，根据域适应极限学习机分类器的现有技术知道，步骤S5中适应极限学习机为：

其中，

为投影目标域数据集中第k个未知标签的样本

的域适应极限学习机隐层输出，k＝1,...,N_Tu；N_Tu表示目标域中未知标签的样本个数；β_S为域适应极限学习机分类输出权重；w_i表示域适应极限学习机第i个隐层神经元的输入权重，b_i表示域适应极限学习机第i个隐层神经元的偏置，i＝1,2,...,L；L为域适应极限学习机隐层神经元个数；g表示域适应极限学习机隐层神经元的激活函数；

为域适应极限学习机判断出的投影目标域数据集中第k个未知标签的样本

的类别标签，也就是原始空间中目标域数据集中第k个未知标签的样本

的类别标签；

其中，

和

分别表示投影源域数据集第i个样本

的隐层输出、预测误差和标签；

和

分别表示投影已知标签目标域数据集第j个样本

的隐层输出、预测误差和标签；

表示要求解的分类输出权重，L即隐层神经元的个数；

N_S和

分别表示投影源域数据集的样本个数和投影目标域已知标签数据集的样本个数，C_S和

分别表示关于投影源域数据和投影目标域已知标签数据集的训练误差的惩罚因子；

对公式(20)使用拉格朗日乘子法和偏微分法，可分别得到两种情况的解；当训练样本数N_S小于L时，解可被表示为：

其中，H_S和H_T分别定义为投影源域数据集和投影目标域已知标签目标域数据集的隐层输出矩阵；

I是大小为N_S的单位矩阵；

当训练样本数N_S大于L时，解可被表示为：

其中，I为大小为L的单位矩阵。

本发明的有益效果：利用目标域中少量的迁移样本，在特征层和决策层同时进行知识迁移，提升极限学习机的分类表现，实现漂移抑制，提出了跨域特征子空间迁移学习与跨域适应极限学习机模型(cross-domain feature subspace transfer learningcoupled with a cross-domain adaptation extreme learning machine,CFST-AELM)。在特征层，将源域和目标域数据通过转换基映射到公共子空间上。本发明同时考虑源域和目标域的边缘分布差异和条件分布差异，减小两域的分布差异。遵循线性判别分析的原则，增强投影后源域和目标域迁移样本的类间可分离性和类内紧密性，提高源域数据和目标域数据可分性。为了使源域和目标域数据的判别信息在投影后保留，同时最大化两域的方差。

在决策层面，训练一个具有知识迁移能力的域适应分类器。利用源域标记的样本和目标域少量的迁移样本训练极限学习机，使该分类器迁移性能和泛化性能更强。

附图说明

图1是本发明的方法流程图；

图2是本发明数据处理分类示意图。

具体实施方式

下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。

一种基于迁移样本的跨域迁移电子鼻漂移抑制方法，从图1和图2可以看出，按照以下步骤进行：

在步骤S1中，所述源域数据集为

所述目标域数据集

目标域数据集中的迁移样本数据集为

其中数据维数为D，源域数据集样本个数分别为N_S；目标域数据集样本个数分别为N_T；

表示将数据从原始空间投影到维数为d的子空间的转换基；

投影源域数据集为

投影目标域数据集为

在步骤S2中，最小化投影后边缘最大均值差异公式为：

表示子空间学习后投影源域数据集的第i个样本；其中，

表示子空间学习后投影目标域数据集的第j个样本；其中：

为原始空间中源域数据集的第i个样本，

为原始空间中目标域数据集的第j个样本。

将公式(2)、(3)带入公式(1)，得到：

u_S表示原始空间源域数据集的中心；

u_T表示原始空间目标域数据集的中心；

所述最小化投影后条件最大均值差异公式为：

表示投影源域数据集第c类样本的第i个样本；

表示原始空间源域数据集第c类样本的第i个样本；

表示投影目标域迁移样本数据集第c类样本的第k个样本；

表示目标域迁移样本数据集第c类样本的个数；

表示源域数据集第c类样本的个数；

μ_S.c表示子空间中第c类投影源域数据的中心；

表示子空间中第c类投影目标域迁移样本数据的中心；

u_S.c表示原始空间中第c类源域数据的中心；

表示原始空间中第c类目标域迁移样本数据的中心；

投影源域数据集和投影目标域数据集可分性最大化计算公式

表示投影目标域迁移样本数据的中心；

表示原始空间目标域迁移样本数据的中心；

为投影源域数据集类间离散度矩阵；

为投影源域数据集类内离散度矩阵；

为原始空间源域数据集类间离散度矩阵；

为原始空间源域数据集类内离散度矩阵；

表示投影目标域迁移样本数据集类间离散度矩阵；

表示投影目标域迁移样本数据集类内离散度矩阵；

表示原始空间目标域迁移样本数据集类间离散度矩阵；

表示原始空间目标域迁移样本数据集类内离散度矩阵；

所述最大化投影源域数据集判别信息公式为：

所述最大化投影目标域数据集判别信息公式为：

其中，Y_T＝P^TX_T，Y_S＝P^TX_S，则公式(8)简化得到：

公式(9)简化得到：

其中，λ₀,λ₁,λ₂,λ₃,λ₄,λ₅是权衡参数。

S4：根据步骤S3得到的数据从原始空间投影到子空间的转换基P的求解公式，对其进行优化并增加求解约束条件，得到优化约束后的数据从原始空间投影到子空间的转换基P的求解公式，从而得到数据从原始空间投影到子空间的最优转换基P以及投影源域数据集、投影目标域数据集和投影迁移样本数据集；

数据从原始空间投影到子空间的转换基P的求解公式中存在数据从原始空间投影到子空间的转换基P的至少一个可行解，为了保证P的解的唯一性，在该最优化问题上加上等价约束，得到：

其中，ε为一正常数；拉格朗日函数如下：

其中，α表示拉格朗日乘子；

把

从(15)中，可得到如下特征值分解问题：

vP＝αP (16)

其中，

α表示特征值，P是与特征值对应的特征向量，其中数据从原始空间投影到子空间的最优转换基P即前d个最小特征值对应的特征向量：

P^*＝[P₁,P₂,…,P_d] (17)

则求得：

投影源域数据集为Y_S＝P^*TX_S； (18-1)

投影目标域数据集Y_T＝P^*TX_T； (18-2)

投影已知标签目标域数据集为

表示原始空间目标域迁移样本数据集，

表示投影已知标签目标域数据集。

步骤S5中域适应极限学习机为：

其中，

为投影目标域数据集中第k个未知标签的样本

的类别标签；计算分类输出权重β_S存在：

其中，

和

分别表示投影源域数据集第i个样本

的隐层输出、预测误差和标签；

和

分别表示投影已知标签目标域数据集第j个样本

的隐层输出、预测误差和标签；

表示要求解的分类输出权重，L即隐层神经元的个数；

N_S和

对公式(19)使用拉格朗日乘子法和偏微分法，可分别得到两种情况的解；当训练样本数N_S小于L时，解可被表示为：

其中，H_S和H_T分别定义为投影源域数据集和投影目标域已知标签数据集的隐层输出矩阵；

I是大小为N_S的单位矩阵；

当训练样本数N_S大于L时，解可被表示为：

其中，I为大小为L的单位矩阵。

在本实施例中，在进行测试时，我们分别在具有时间漂移或/和板间漂移的三个数据集上验证了所提出的方法。

一、UCSD基准传感器漂移数据集

在我们的实验中研究了Vergara历时三年收集的传感器漂移数据集，这个传感器漂移数据集是在2008年1月至2011年2月的36个月内通过电子鼻系统采样的。该系统具有一个由16个MOS气体传感器构成的阵列，检测的气体包括不同浓度水平的氨，乙醛，丙酮，乙烯，乙醇和甲苯。对于每个传感器输出，提取了八个特征，故每个样本都是一个128维的特征向量。根据实验时间将数据分为10个批次，详细见表一所示：

表一UCSD基准传感器漂移数据集表

UCSD基准传感器漂移数据集的分类测试结果中，设置了两种情况；

情况1、固定批次1为源域，K为目标域(K＝2,3,…,10)。每类气体的迁移样本数量设置为5。识别结果详见表二：

表二UCSD基准传感器漂移数据集情况1分类测试结果表

批次	2	3	4	5	6	7	8	9	10	平均
											CC-PCA	67.00	48.50	41.00	35.50	55.00	31.00	56.50	46.50	30.50	45.72
SVM-rbf	74.36	61.03	50.93	18.27	28.26	28.81	20.07	34.26	34.47	38.94
											SVM-gfk	72.75	70.08	60.75	75.08	73.82	54.53	55.44	69.62	41.78	63.76
SVM-comgfk	74.47	70.15	59.78	75.09	73.99	54.59	55.88	70.23	41.85	64.00
											ML-rbf	42.25	73.69	75.53	66.75	77.51	54.43	33.50	23.57	34.92	53.57
ML-comgfk	80.25	74.99	78.79	67.41	77.82	71.68	49.96	50.79	53.79	67.28
											ELM-rbf	70.63	66.44	66.83	63.45	69.73	51.23	49.76	49.83	33.50	57.93
BLS	44.62	89.29	64.72	77.01	73.42	42.70	66.53	62.62	43.97	62.76
											MFKS	80.79	80.64	86.75	79.14	80.69	36.19	68.30	63.04	37.10	68.07
DRCA	89.15	92.69	87.58	95.94	86.52	60.25	62.24	72.34	52.00	77.63
											DAELM-S(20)	87.57	96.53	82.61	81.47	84.97	71.89	78.10	87.02	57.42	80.84
DAELM-S(30)	87.98	95.74	85.16	95.99	94.14	83.51	86.90	100.00	53.62	87.00
											CFST-AELM(30)	96.30	99.31	100.00	100.00	94.83	94.02	93.20	95.96	75.61	94.36

情况2：依次在批次K-1上训练，批次K上测试(K＝2,3,…,10)。类气体的迁移样本数量设置为5。识别结果详见表三：

表三UCSD基准传感器漂移数据集情况2分类测试结果表

二、相同配置气体传感器阵列漂移数据集

该数据集由Fonollosa收集，记录了由4种MOS气体传感器组成的五个相同配置的气体传感器阵列板，用于检测不同浓度的乙烯，乙醇，一氧化碳和甲烷。我们认为该数据集间仅存在板间漂移，不存在时间漂移。

相同配置气体传感器阵列漂移数据集的测试结果中：共有两种情况设置，具体为：

情况1：固定板1为源域，板K为目标域(K＝2,3,4,5)；每类目标域迁移样本数量为2。

情况2：固定板5为源域，板K为目标域(K＝1,2,3,4)；每类目标域迁移样本数量为2。分类结果详见表四：

表四相同配置气体传感器阵列漂移数据集分类测试结果表

三、时间和板间漂移数据集

共有3个数据集：源域、目标域1、目标域2。三个数据集所用传感器阵列版具有相同配置。源域数据的收集时间比目标域早5年，由传感器的老化和板间固有差异引起的时间、板间漂移均存在于该数据集中。在这些数据集中，包括六种气体：甲醛，苯，甲苯，一氧化碳，二氧化氮和氨。具体见表五：

表五时间和板间漂移数据集表

电子鼻	甲醛	苯	甲苯	一氧化碳	二氧化氮	氨	总数
								源域	126	72	66	58	38	60	420
目标域1	108	108	106	98	107	81	608
								目标域2	108	87	94	95	108	84	576

分别将目标域1和目标域2同源域进行实验，每类气体迁移样本数量设置为5。分类结果详见表六：

表六时间和板间漂移数据集分类测试结果表

任务	SVM	PCA	LDA	GLSW	DRCA	CDSL(5)	CFST-AELM
								源域→目标域1	51.97	51.97	51.97	40.46	58.55	79.07	95.07
源域→目标域2	60.59	60.59	56.77	53.65	61.63	80.04	93.40

通过大量的实验证明，本发明方法同时实现了特征层和决策层的知识迁移，在抑制电子鼻中的漂移中具有高效性，同时保留了极限学习机的低计算复杂度，为极限学习机的研究方向提供了新的可能。具体优点如下：

在抑制漂移的同时，尽可能地保存了源域和目标域的判别信息。

同时最小化边缘分布差异和条件分布差异，提高了模型的鲁棒性和分类精确度。

同时在特征层和决策层实现知识迁移，充分利用迁移样本。

子空间学习可以通过特征值分解的方式求得，计算复杂度低。

应当指出的是，上述说明并非是对本发明的限制，本发明也并不仅限于上述举例，本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改性、添加或替换，也应属于本发明的保护范围。

Claims

1.一种基于迁移样本的跨域迁移电子鼻漂移抑制方法，其特征在于：按照以下步骤进行：

S1：电子鼻获取源域数据集和目标域数据集；

该目标域数据集包括未知标签目标域数据集、已知标签目标域数据集

将源域数据集、目标域数据集投影到子空间，得到该两个数据集从原始空间经过转换基P投影到子空间的投影源域数据集、投影目标域数据集；

该投影目标域数据集包括投影未知标签目标域数据集、投影已知标签目标域数据集；

S5：根据步骤S4得到的投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集，用投影源域数据集和投影已知标签目标域数据集计算域适应极限学习机的输出权重，得到最终的域适应极限学习机；并将电子鼻投影目标域未知标签数据进行漂移抑制测试。

2.根据权利要求1所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法，其特征在于：在步骤S1中，所述源域数据集为

所述目标域数据集

目标域数据集中的迁移样本数据集为

表示将数据从原始空间投影到维数为d的子空间的转换基；

投影源域数据集为

投影目标域数据集为

在步骤S2中，最小化投影后边缘最大均值差异公式为：

表示子空间学习后投影源域数据集的第i个样本；其中，

表示子空间学习后投影目标域数据集的第j个样本；其中：

为原始空间中源域数据集的第i个样本，

为原始空间中目标域数据集的第j个样本；将公式(2)、(3)带入公式(1)，得到：

u_S表示原始空间源域数据集的中心；

u_T表示原始空间目标域数据集的中心；

所述最小化投影后条件最大均值差异公式为：

表示投影源域数据集第c类样本的第i个样本；

表示原始空间源域数据集第c类样本的第i个样本；

表示投影目标域迁移样本数据集第c类样本的第k个样本；

表示目标域迁移样本数据集第c类样本的个数；

表示源域数据集第c类样本的个数；

μ_S.c表示子空间中第c类投影源域数据的中心；

表示子空间中第c类投影目标域迁移样本数据的中心；

u_S.c表示原始空间中第c类源域数据的中心；

表示原始空间中第c类目标域迁移样本数据的中心；

投影源域数据集和投影目标域数据集可分性最大化计算公式

表示投影目标域迁移样本数据的中心；

表示原始空间目标域迁移样本数据的中心；

为投影源域数据集类间离散度矩阵；

为投影源域数据集类内离散度矩阵；

为原始空间源域数据集类间离散度矩阵；

为原始空间源域数据集类内离散度矩阵；

表示投影目标域迁移样本数据集类间离散度矩阵；

表示投影目标域迁移样本数据集类内离散度矩阵；

表示原始空间目标域迁移样本数据集类间离散度矩阵；

表示原始空间目标域迁移样本数据集类内离散度矩阵；

所述最大化投影源域数据集判别信息公式为：

所述最大化投影目标域数据集判别信息公式为：

其中，Y_T＝P^TX_T，Y_S＝P^TX_S，则公式(8)简化得到：

公式(9)简化得到：

3.根据权利要求2所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法，其特征在于：在步骤S3中，将式子(4)(5)(6)(7)(10)(11)合并得到的所述数据从原始空间投影到子空间的转换基P的求解公式为：

其中，λ₀,λ₁,λ₂,λ₃,λ₄,λ₅是权衡参数。

4.根据权利要求3所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法，其特征在于：数据从原始空间投影到子空间的转换基P的求解公式中存在数据从原始空间投影到子空间的转换基P的至少一个可行解，为了保证P的解的唯一性，在该最优化问题上加上等价约束，得到：

其中，ε为一正常数；拉格朗日函数如下：

其中，α表示拉格朗日乘子；

把

从(15)中，可得到如下特征值分解问题：

其中，

P^*＝[P₁,P₂,…,P_d] (17)

则求得：

投影源域数据集为Y_S＝P^*TX_S； (18-1)

投影目标域数据集为Y_T＝P^*TX_T； (18-2)

投影已知标签目标域数据集为

表示原始空间目标域迁移样本数据集，

表示投影已知标签目标域数据集。

5.根据权利要求4所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法，其特征在于：步骤S5中域适应极限学习机为：

其中，

为投影目标域数据集中第k个未知标签的样本

的类别标签；计算分类输出权重β_S存在：

其中，

和

分别表示投影源域数据集第i个样本

的隐层输出、预测误差和标签；

和

分别表示投影已知标签目标域数据集第j个样本

的隐层输出、预测误差和标签；

表示要求解的分类输出权重，L即隐层神经元的个数；

N_S和

I是大小为N_S的单位矩阵；

当训练样本数N_S大于L时，解可被表示为：

其中，I为大小为L的单位矩阵。