CN111931815A - 基于迁移样本的跨域迁移电子鼻漂移抑制方法 - Google Patents
基于迁移样本的跨域迁移电子鼻漂移抑制方法 Download PDFInfo
- Publication number
- CN111931815A CN111931815A CN202010653407.XA CN202010653407A CN111931815A CN 111931815 A CN111931815 A CN 111931815A CN 202010653407 A CN202010653407 A CN 202010653407A CN 111931815 A CN111931815 A CN 111931815A
- Authority
- CN
- China
- Prior art keywords
- data set
- projection
- domain data
- target domain
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Optimization (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于迁移样本的跨域迁移电子鼻漂移抑制方法,将源域、目标数据投影到子空间,不同域数据之间集进行边缘最大均值差异做最小化处理、条件最大均值差异做最小化处理、可分性最大化、判别信息做最大化处理后,得到转换基P和对应投影源域数据集和投影目标域数据集;根据投影源域数据集、投影目标域数据集,计算适应极限学习机的未知输出权重,得到最终的适应极限学习机;并将未知标签的目标域数据进行漂移抑制测试。有益效果:在抑制漂移的同时,保存了源域和目标域的判别信息。最小化边缘分布差异和条件分布差异,提高了模型的健壮性和分类精确度。在特征层和决策层实现知识迁移,充分利用迁移样本。
Description
技术领域
本发明涉及电子鼻信号处理技术领域,具体的说是一种基于迁移样本的跨域迁移电子鼻漂移抑制方法。
背景技术
电子鼻中的金属氧化半导体传感器的时间漂移和板件漂移是当前传感器和测量领域的一个亟待解决的问题。漂移的时变特征和方向的不可预测性导致很难对漂移直接进行测量。有着高效率和低计算复杂性的极限学习机常被用于解决电子鼻中的时间漂移/板间漂移现象。
抑制传感器漂移的方法主要有如下两种:
1、特征层面的抑制方法。旨在从数据分布的角度抑制漂移,使得源域和目标域的数据分布差异缩小。
2、决策层面的抑制方法。旨在训练鲁棒性分类器,实现从源域到目标域的知识迁移。
不足之处:1、基于特征层面的抑制方法没有考虑分类器的知识迁移能力,不能根据目标域样本进行调整得到自适应分类器,分类效果较差。2、基于决策层面的抑制方法忽略了源域和目标域的数据分布不匹配问题,分类前不同域数据的分布差异大,降低了分类性能。
发明内容
针对上述问题,本发明提供了一种基于迁移样本的跨域迁移电子鼻漂移抑制方法,利用少量的目标域迁移样本,在特征层和决策层同时进行知识迁移,提升极限学习机的分类表现,实现漂移抑制。
为达到上述目的,本发明采用的具体技术方案如下:
一种基于迁移样本的跨域迁移电子鼻漂移抑制方法,其关键技术在于:按照以下步骤进行:
S1:电子鼻获取源域数据集和目标域数据集,该目标域数据集包括未知标签目标域数据集、已知标签目标域数据集,将源域数据集、目标域数据集投影到子空间,得到该两个数据集从原始空间经过转换基P投影到子空间的投影源域数据集、投影目标域数据集,该投影目标域数据集包括投影未知标签目标域数据集、投影已知标签目标域数据集;
其中,已知标签目标域数据集即为目标域迁移样本数据集;投影已知标签目标域数据集即投影目标域迁移样本数据集;
其中,已知标签目标域数据集预先进行标签标定,具体方式通过试纸检测、化学反应的方法进行测定。
S2:对子空间中投影源域数据集和投影目标域数据集的边缘最大均值差异做最小化处理,得到最小化投影后边缘最大均值差异公式;
对子空间中投影源域数据集和投影已知标签目标域数据集的条件最大均值差异做最小化处理,得到最小化投影后条件最大均值差异公式;
为了使投影源域数据集和投影目标域数据集更具有可分性,增强类内紧密性和类间离散性,计算投影源域数据集和投影已知标签目标域数据集的类内离散度矩阵和类间离散度矩阵,得到投影源域数据集和投影目标域数据集可分性最大化计算公式;
对投影源域数据集和投影目标域数据集的判别信息做最大化处理并简化,得到最大化投影源域数据集判别信息公式和最大化投影目标域数据集判别信息公式;
S3:将步骤S2得到的公式进行合并,得到数据从原始空间投影到子空间的转换基P的求解公式;
S4:根据步骤S3得到的数据从原始空间投影到子空间的转换基P的求解公式,对其进行优化并增加求解约束条件,得到优化约束后的数据从原始空间投影到子空间的转换基P的求解公式,从而得到数据从原始空间投影到子空间的最优转换基P以及投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集;
S5:根据步骤S4得到的投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集,用投影源域数据集和投影已知标签目标域数据集计算域适应极限学习机的输出权重,得到最终的域适应极限学习机;并将电子鼻采集的数据进行漂移抑制测试。
通过上述设计,同时考虑源域和目标域的边缘分布差异和条件分布差异,减小了两域的分布差异。遵循线性判别分析的原则,增强投影后源域和目标域数据的类间可分离性和类内的紧密性,提高源域数据和目标域数据可分性。为了使源域和目标域数据的判别信息在投影后保留,同时最大化两域的方差。在决策层面,训练一个具有知识迁移能力的域适应分类器,即域适应极限学习机。利用源域标记的样本和目标域少量的迁移样本训练适应极限学习机,使该分类器迁移性能和泛化性能更强。
符号||·||2表示2范数,Tr(·)表示求矩阵迹的运算,(·)T表示转置矩阵;
在步骤S2中,为了减小分布差异,最小化投影后的投影源域数据集和投影目标域数据集的边缘分布差异:最小化投影后边缘最大均值差异公式;
μS代表子空间中投影源域数据集的中心;μT代表子空间中投影目标域数据集的中心;
将公式(2)、(3)带入公式(1),得到:
uS表示原始空间源域数据集的中心;
uT表示原始空间目标域数据集的中心;
为了使投影源域数据集和投影目标域数据集更加对齐,最小化子空间中投影源域数据集和投影目标域数据集的条件分布差异,所述最小化投影后条件最大均值差异公式为
μS.c表示子空间中第c类投影源域数据的中心;
uS.c表示原始空间中第c类源域数据的中心;
为了使源域和目标域更具有可分性,增强类内紧密性和类间离散性,计算源域和目标域迁移数据的类内离散度矩阵和类间离散度矩阵,投影源域数据集和投影目标域数据集可分性最大化计算公式:
表示投影目标域迁移样本数据的中心;
为了尽可能保留投影后源域和目标域的判别信息,所述最大化投影源域数据集判别信息公式为:
所述最大化投影目标域数据集判别信息公式为:
其中,YT=PTXT,YS=PTXS,则公式(8)简化得到:
公式(9)简化得到:
在步骤S3中,将式子(4)(5)(6)(7)(10)(11)合并得到的所述数据从原始空间投影到子空间的转换基P的求解公式为:
其中,λ0,λ1,λ2,λ3,λ4,λ5是权衡参数。
其中,数据从原始空间投影到子空间的转换基P的求解公式中存在数据从原始空间投影到子空间的转换基P的至少一个可行解,为了保证P的解的唯一性,在该最优化问题上加上等价约束,得到:
其中,ε为一正常数;
拉格朗日函数如下:
其中,α表示拉格朗日乘子;
从(15)中,可得到如下特征值分解问题:
vP=αP (16)
其中,
α表示特征值,对应的特征向量:P是与特征值对应的特征向量,其中数据从原始空间投影到子空间的最优转换基P即前d个最小特征值对应的特征向量:
P*=[P1,P2,…,Pd] (17)
则求得:
投影源域数据集为:YS=P*TXS; (18-1)
投影目标域数据集为:YT=P*TXT; (18-2)
进一步的,根据域适应极限学习机分类器的现有技术知道,步骤S5中适应极限学习机为:
其中,为投影目标域数据集中第k个未知标签的样本的域适应极限学习机隐层输出,k=1,...,NTu;NTu表示目标域中未知标签的样本个数;βS为域适应极限学习机分类输出权重;wi表示域适应极限学习机第i个隐层神经元的输入权重,bi表示域适应极限学习机第i个隐层神经元的偏置,i=1,2,...,L;L为域适应极限学习机隐层神经元个数;g表示域适应极限学习机隐层神经元的激活函数;为域适应极限学习机判断出的投影目标域数据集中第k个未知标签的样本的类别标签,也就是原始空间中目标域数据集中第k个未知标签的样本的类别标签;
对公式(20)使用拉格朗日乘子法和偏微分法,可分别得到两种情况的解;当训练样本数NS小于L时,解可被表示为:
其中,HS和HT分别定义为投影源域数据集和投影目标域已知标签目标域数据集的隐层输出矩阵;
I是大小为NS的单位矩阵;
当训练样本数NS大于L时,解可被表示为:
其中,I为大小为L的单位矩阵。
本发明的有益效果:利用目标域中少量的迁移样本,在特征层和决策层同时进行知识迁移,提升极限学习机的分类表现,实现漂移抑制,提出了跨域特征子空间迁移学习与跨域适应极限学习机模型(cross-domain feature subspace transfer learningcoupled with a cross-domain adaptation extreme learning machine,CFST-AELM)。在特征层,将源域和目标域数据通过转换基映射到公共子空间上。本发明同时考虑源域和目标域的边缘分布差异和条件分布差异,减小两域的分布差异。遵循线性判别分析的原则,增强投影后源域和目标域迁移样本的类间可分离性和类内紧密性,提高源域数据和目标域数据可分性。为了使源域和目标域数据的判别信息在投影后保留,同时最大化两域的方差。
在决策层面,训练一个具有知识迁移能力的域适应分类器。利用源域标记的样本和目标域少量的迁移样本训练极限学习机,使该分类器迁移性能和泛化性能更强。
附图说明
图1是本发明的方法流程图;
图2是本发明数据处理分类示意图。
具体实施方式
下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。
一种基于迁移样本的跨域迁移电子鼻漂移抑制方法,从图1和图2可以看出,按照以下步骤进行:
S1:电子鼻获取源域数据集和目标域数据集,该目标域数据集包括未知标签目标域数据集、已知标签目标域数据集,将源域数据集、目标域数据集投影到子空间,得到该两个数据集从原始空间经过转换基P投影到子空间的投影源域数据集、投影目标域数据集,该投影目标域数据集包括投影未知标签目标域数据集、投影已知标签目标域数据集;
符号||·||2表示2范数,Tr(·)表示求矩阵迹的运算,(·)T表示转置矩阵;
S2:对子空间中投影源域数据集和投影目标域数据集的边缘最大均值差异做最小化处理,得到最小化投影后边缘最大均值差异公式;
在步骤S2中,最小化投影后边缘最大均值差异公式为:
μS代表子空间中投影源域数据集的中心;μT代表子空间中投影目标域数据集的中心;
将公式(2)、(3)带入公式(1),得到:
uS表示原始空间源域数据集的中心;
uT表示原始空间目标域数据集的中心;
对子空间中投影源域数据集和投影已知标签目标域数据集的条件最大均值差异做最小化处理,得到最小化投影后条件最大均值差异公式;
所述最小化投影后条件最大均值差异公式为:
μS.c表示子空间中第c类投影源域数据的中心;
uS.c表示原始空间中第c类源域数据的中心;
为了使投影源域数据集和投影目标域数据集更具有可分性,增强类内紧密性和类间离散性,计算投影源域数据集和投影已知标签目标域数据集的类内离散度矩阵和类间离散度矩阵,得到投影源域数据集和投影目标域数据集可分性最大化计算公式;
对投影源域数据集和投影目标域数据集的判别信息做最大化处理并简化,得到最大化投影源域数据集判别信息公式和最大化投影目标域数据集判别信息公式;
所述最大化投影源域数据集判别信息公式为:
所述最大化投影目标域数据集判别信息公式为:
其中,YT=PTXT,YS=PTXS,则公式(8)简化得到:
公式(9)简化得到:
S3:将步骤S2得到的公式进行合并,得到数据从原始空间投影到子空间的转换基P的求解公式;
在步骤S3中,将式子(4)(5)(6)(7)(10)(11)合并得到的所述数据从原始空间投影到子空间的转换基P的求解公式为:
其中,λ0,λ1,λ2,λ3,λ4,λ5是权衡参数。
S4:根据步骤S3得到的数据从原始空间投影到子空间的转换基P的求解公式,对其进行优化并增加求解约束条件,得到优化约束后的数据从原始空间投影到子空间的转换基P的求解公式,从而得到数据从原始空间投影到子空间的最优转换基P以及投影源域数据集、投影目标域数据集和投影迁移样本数据集;
数据从原始空间投影到子空间的转换基P的求解公式中存在数据从原始空间投影到子空间的转换基P的至少一个可行解,为了保证P的解的唯一性,在该最优化问题上加上等价约束,得到:
其中,ε为一正常数;拉格朗日函数如下:
其中,α表示拉格朗日乘子;
从(15)中,可得到如下特征值分解问题:
vP=αP (16)
其中,
α表示特征值,P是与特征值对应的特征向量,其中数据从原始空间投影到子空间的最优转换基P即前d个最小特征值对应的特征向量:
P*=[P1,P2,…,Pd] (17)
则求得:
投影源域数据集为YS=P*TXS; (18-1)
投影目标域数据集YT=P*TXT; (18-2)
S5:根据步骤S4得到的投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集,用投影源域数据集和投影已知标签目标域数据集计算域适应极限学习机的输出权重,得到最终的域适应极限学习机;并将电子鼻采集的数据进行漂移抑制测试。
步骤S5中域适应极限学习机为:
其中,为投影目标域数据集中第k个未知标签的样本的域适应极限学习机隐层输出,k=1,...,NTu;NTu表示目标域中未知标签的样本个数;βS为域适应极限学习机分类输出权重;wi表示域适应极限学习机第i个隐层神经元的输入权重,bi表示域适应极限学习机第i个隐层神经元的偏置,i=1,2,...,L;L为域适应极限学习机隐层神经元个数;g表示域适应极限学习机隐层神经元的激活函数;为域适应极限学习机判断出的投影目标域数据集中第k个未知标签的样本的类别标签,也就是原始空间中目标域数据集中第k个未知标签的样本的类别标签;计算分类输出权重βS存在:
对公式(19)使用拉格朗日乘子法和偏微分法,可分别得到两种情况的解;当训练样本数NS小于L时,解可被表示为:
其中,HS和HT分别定义为投影源域数据集和投影目标域已知标签数据集的隐层输出矩阵;
I是大小为NS的单位矩阵;
当训练样本数NS大于L时,解可被表示为:
其中,I为大小为L的单位矩阵。
在本实施例中,在进行测试时,我们分别在具有时间漂移或/和板间漂移的三个数据集上验证了所提出的方法。
一、UCSD基准传感器漂移数据集
在我们的实验中研究了Vergara历时三年收集的传感器漂移数据集,这个传感器漂移数据集是在2008年1月至2011年2月的36个月内通过电子鼻系统采样的。该系统具有一个由16个MOS气体传感器构成的阵列,检测的气体包括不同浓度水平的氨,乙醛,丙酮,乙烯,乙醇和甲苯。对于每个传感器输出,提取了八个特征,故每个样本都是一个128维的特征向量。根据实验时间将数据分为10个批次,详细见表一所示:
表一UCSD基准传感器漂移数据集表
UCSD基准传感器漂移数据集的分类测试结果中,设置了两种情况;
情况1、固定批次1为源域,K为目标域(K=2,3,…,10)。每类气体的迁移样本数量设置为5。识别结果详见表二:
表二UCSD基准传感器漂移数据集情况1分类测试结果表
批次 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 平均 |
CC-PCA | 67.00 | 48.50 | 41.00 | 35.50 | 55.00 | 31.00 | 56.50 | 46.50 | 30.50 | 45.72 |
SVM-rbf | 74.36 | 61.03 | 50.93 | 18.27 | 28.26 | 28.81 | 20.07 | 34.26 | 34.47 | 38.94 |
SVM-gfk | 72.75 | 70.08 | 60.75 | 75.08 | 73.82 | 54.53 | 55.44 | 69.62 | 41.78 | 63.76 |
SVM-comgfk | 74.47 | 70.15 | 59.78 | 75.09 | 73.99 | 54.59 | 55.88 | 70.23 | 41.85 | 64.00 |
ML-rbf | 42.25 | 73.69 | 75.53 | 66.75 | 77.51 | 54.43 | 33.50 | 23.57 | 34.92 | 53.57 |
ML-comgfk | 80.25 | 74.99 | 78.79 | 67.41 | 77.82 | 71.68 | 49.96 | 50.79 | 53.79 | 67.28 |
ELM-rbf | 70.63 | 66.44 | 66.83 | 63.45 | 69.73 | 51.23 | 49.76 | 49.83 | 33.50 | 57.93 |
BLS | 44.62 | 89.29 | 64.72 | 77.01 | 73.42 | 42.70 | 66.53 | 62.62 | 43.97 | 62.76 |
MFKS | 80.79 | 80.64 | 86.75 | 79.14 | 80.69 | 36.19 | 68.30 | 63.04 | 37.10 | 68.07 |
DRCA | 89.15 | 92.69 | 87.58 | 95.94 | 86.52 | 60.25 | 62.24 | 72.34 | 52.00 | 77.63 |
DAELM-S(20) | 87.57 | 96.53 | 82.61 | 81.47 | 84.97 | 71.89 | 78.10 | 87.02 | 57.42 | 80.84 |
DAELM-S(30) | 87.98 | 95.74 | 85.16 | 95.99 | 94.14 | 83.51 | 86.90 | 100.00 | 53.62 | 87.00 |
CFST-AELM(30) | 96.30 | 99.31 | 100.00 | 100.00 | 94.83 | 94.02 | 93.20 | 95.96 | 75.61 | 94.36 |
情况2:依次在批次K-1上训练,批次K上测试(K=2,3,…,10)。类气体的迁移样本数量设置为5。识别结果详见表三:
表三UCSD基准传感器漂移数据集情况2分类测试结果表
二、相同配置气体传感器阵列漂移数据集
该数据集由Fonollosa收集,记录了由4种MOS气体传感器组成的五个相同配置的气体传感器阵列板,用于检测不同浓度的乙烯,乙醇,一氧化碳和甲烷。我们认为该数据集间仅存在板间漂移,不存在时间漂移。
相同配置气体传感器阵列漂移数据集的测试结果中:共有两种情况设置,具体为:
情况1:固定板1为源域,板K为目标域(K=2,3,4,5);每类目标域迁移样本数量为2。
情况2:固定板5为源域,板K为目标域(K=1,2,3,4);每类目标域迁移样本数量为2。分类结果详见表四:
表四相同配置气体传感器阵列漂移数据集分类测试结果表
三、时间和板间漂移数据集
共有3个数据集:源域、目标域1、目标域2。三个数据集所用传感器阵列版具有相同配置。源域数据的收集时间比目标域早5年,由传感器的老化和板间固有差异引起的时间、板间漂移均存在于该数据集中。在这些数据集中,包括六种气体:甲醛,苯,甲苯,一氧化碳,二氧化氮和氨。具体见表五:
表五时间和板间漂移数据集表
电子鼻 | 甲醛 | 苯 | 甲苯 | 一氧化碳 | 二氧化氮 | 氨 | 总数 |
源域 | 126 | 72 | 66 | 58 | 38 | 60 | 420 |
目标域1 | 108 | 108 | 106 | 98 | 107 | 81 | 608 |
目标域2 | 108 | 87 | 94 | 95 | 108 | 84 | 576 |
分别将目标域1和目标域2同源域进行实验,每类气体迁移样本数量设置为5。分类结果详见表六:
表六时间和板间漂移数据集分类测试结果表
任务 | SVM | PCA | LDA | GLSW | DRCA | CDSL(5) | CFST-AELM |
源域→目标域1 | 51.97 | 51.97 | 51.97 | 40.46 | 58.55 | 79.07 | 95.07 |
源域→目标域2 | 60.59 | 60.59 | 56.77 | 53.65 | 61.63 | 80.04 | 93.40 |
通过大量的实验证明,本发明方法同时实现了特征层和决策层的知识迁移,在抑制电子鼻中的漂移中具有高效性,同时保留了极限学习机的低计算复杂度,为极限学习机的研究方向提供了新的可能。具体优点如下:
在抑制漂移的同时,尽可能地保存了源域和目标域的判别信息。
同时最小化边缘分布差异和条件分布差异,提高了模型的鲁棒性和分类精确度。
同时在特征层和决策层实现知识迁移,充分利用迁移样本。
子空间学习可以通过特征值分解的方式求得,计算复杂度低。
应当指出的是,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改性、添加或替换,也应属于本发明的保护范围。
Claims (5)
1.一种基于迁移样本的跨域迁移电子鼻漂移抑制方法,其特征在于:按照以下步骤进行:
S1:电子鼻获取源域数据集和目标域数据集;
该目标域数据集包括未知标签目标域数据集、已知标签目标域数据集
将源域数据集、目标域数据集投影到子空间,得到该两个数据集从原始空间经过转换基P投影到子空间的投影源域数据集、投影目标域数据集;
该投影目标域数据集包括投影未知标签目标域数据集、投影已知标签目标域数据集;
S2:对子空间中投影源域数据集和投影目标域数据集的边缘最大均值差异做最小化处理,得到最小化投影后边缘最大均值差异公式;
对子空间中投影源域数据集和投影已知标签目标域数据集的条件最大均值差异做最小化处理,得到最小化投影后条件最大均值差异公式;
为了使投影源域数据集和投影目标域数据集更具有可分性,增强类内紧密性和类间离散性,计算投影源域数据集和投影已知标签目标域数据集的类内离散度矩阵和类间离散度矩阵,得到投影源域数据集和投影目标域数据集可分性最大化计算公式;
对投影源域数据集和投影目标域数据集的判别信息做最大化处理并简化,得到最大化投影源域数据集判别信息公式和最大化投影目标域数据集判别信息公式;
S3:将步骤S2得到的公式进行合并,得到数据从原始空间投影到子空间的转换基P的求解公式;
S4:根据步骤S3得到的数据从原始空间投影到子空间的转换基P的求解公式,对其进行优化并增加求解约束条件,得到优化约束后的数据从原始空间投影到子空间的转换基P的求解公式,从而得到数据从原始空间投影到子空间的最优转换基P以及投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集;
S5:根据步骤S4得到的投影源域数据集、投影未知标签目标域数据集和投影已知标签目标域数据集,用投影源域数据集和投影已知标签目标域数据集计算域适应极限学习机的输出权重,得到最终的域适应极限学习机;并将电子鼻投影目标域未知标签数据进行漂移抑制测试。
符号||·||2表示2范数,Tr(·)表示求矩阵迹的运算,(·)T表示转置矩阵;
在步骤S2中,最小化投影后边缘最大均值差异公式为:
μS代表子空间中投影源域数据集的中心;μT代表子空间中投影目标域数据集的中心;
uS表示原始空间源域数据集的中心;
uT表示原始空间目标域数据集的中心;
所述最小化投影后条件最大均值差异公式为:
μS.c表示子空间中第c类投影源域数据的中心;
uS.c表示原始空间中第c类源域数据的中心;
投影源域数据集和投影目标域数据集可分性最大化计算公式
所述最大化投影源域数据集判别信息公式为:
所述最大化投影目标域数据集判别信息公式为:
其中,YT=PTXT,YS=PTXS,则公式(8)简化得到:
公式(9)简化得到:
4.根据权利要求3所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法,其特征在于:数据从原始空间投影到子空间的转换基P的求解公式中存在数据从原始空间投影到子空间的转换基P的至少一个可行解,为了保证P的解的唯一性,在该最优化问题上加上等价约束,得到:
其中,ε为一正常数;拉格朗日函数如下:
其中,α表示拉格朗日乘子;
从(15)中,可得到如下特征值分解问题:
其中,
α表示特征值,P是与特征值对应的特征向量,其中数据从原始空间投影到子空间的最优转换基P即前d个最小特征值对应的特征向量:
P*=[P1,P2,…,Pd] (17)
则求得:
投影源域数据集为YS=P*TXS; (18-1)
投影目标域数据集为YT=P*TXT; (18-2)
5.根据权利要求4所述的基于迁移样本的跨域迁移电子鼻漂移抑制方法,其特征在于:步骤S5中域适应极限学习机为:
其中,为投影目标域数据集中第k个未知标签的样本的域适应极限学习机隐层输出,k=1,...,NTu;NTu表示目标域中未知标签的样本个数;βS为域适应极限学习机分类输出权重;wi表示域适应极限学习机第i个隐层神经元的输入权重,bi表示域适应极限学习机第i个隐层神经元的偏置,i=1,2,...,L;L为域适应极限学习机隐层神经元个数;g表示域适应极限学习机隐层神经元的激活函数;为域适应极限学习机判断出的投影目标域数据集中第k个未知标签的样本的类别标签,也就是原始空间中目标域数据集中第k个未知标签的样本的类别标签;计算分类输出权重βS存在:
对公式(20)使用拉格朗日乘子法和偏微分法,可分别得到两种情况的解;当训练样本数NS小于L时,解可被表示为:
其中,HS和HT分别定义为投影源域数据集和投影目标域已知标签数据集的隐层输出矩阵;
I是大小为NS的单位矩阵;
当训练样本数NS大于L时,解可被表示为:
其中,I为大小为L的单位矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010653407.XA CN111931815B (zh) | 2020-07-08 | 2020-07-08 | 基于迁移样本的跨域迁移电子鼻漂移抑制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010653407.XA CN111931815B (zh) | 2020-07-08 | 2020-07-08 | 基于迁移样本的跨域迁移电子鼻漂移抑制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111931815A true CN111931815A (zh) | 2020-11-13 |
CN111931815B CN111931815B (zh) | 2022-10-18 |
Family
ID=73313780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010653407.XA Active CN111931815B (zh) | 2020-07-08 | 2020-07-08 | 基于迁移样本的跨域迁移电子鼻漂移抑制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931815B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488081A (zh) * | 2020-12-23 | 2021-03-12 | 杭州电子科技大学 | 基于ddadsm跨被试迁移学习脑电精神状态检测方法 |
CN112766405A (zh) * | 2021-01-29 | 2021-05-07 | 重庆大学 | 基于多约束子空间投影的传感器数据分类方法 |
CN112861929A (zh) * | 2021-01-20 | 2021-05-28 | 河南科技大学 | 一种基于半监督加权迁移判别分析的图像分类方法 |
CN113627084A (zh) * | 2021-08-06 | 2021-11-09 | 西南大学 | 基于极限学习机的电子鼻信号漂移补偿子空间对齐方法 |
CN113740381A (zh) * | 2021-08-12 | 2021-12-03 | 西南大学 | 一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法 |
US11257255B2 (en) * | 2019-12-03 | 2022-02-22 | Leica Microsystems Cms Gmbh | Domain matching methods for transportable imaging applications |
CN114219047A (zh) * | 2022-02-18 | 2022-03-22 | 深圳大学 | 一种基于伪标签筛选的异构域自适应方法、装置及设备 |
CN115015472A (zh) * | 2022-02-25 | 2022-09-06 | 重庆邮电大学 | 一种基于域自适应的极限学习机传感器漂移数据重构方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040100376A1 (en) * | 2002-11-26 | 2004-05-27 | Kimberly-Clark Worldwide, Inc. | Healthcare monitoring system |
US20050090018A1 (en) * | 2001-05-25 | 2005-04-28 | Andreas Walte | Method and detector capture of gases |
CN105891422A (zh) * | 2016-04-08 | 2016-08-24 | 重庆大学 | 基于源域迁移极限学习漂移补偿的电子鼻气体识别方法 |
CN105913079A (zh) * | 2016-04-08 | 2016-08-31 | 重庆大学 | 基于目标域迁移极限学习的电子鼻异构数据识别方法 |
CN105929113A (zh) * | 2016-04-20 | 2016-09-07 | 重庆大学 | 一种带子空间投影的电子鼻信号误差自适应学习方法 |
CN109669009A (zh) * | 2019-01-10 | 2019-04-23 | 重庆邮电大学 | 基于域校正的域自适应极限学习机电子鼻漂移抑制方法 |
CN110146655A (zh) * | 2019-05-31 | 2019-08-20 | 重庆大学 | 一种基于自适应子空间学习范式的抗电子鼻漂移方法 |
-
2020
- 2020-07-08 CN CN202010653407.XA patent/CN111931815B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050090018A1 (en) * | 2001-05-25 | 2005-04-28 | Andreas Walte | Method and detector capture of gases |
US20040100376A1 (en) * | 2002-11-26 | 2004-05-27 | Kimberly-Clark Worldwide, Inc. | Healthcare monitoring system |
CN105891422A (zh) * | 2016-04-08 | 2016-08-24 | 重庆大学 | 基于源域迁移极限学习漂移补偿的电子鼻气体识别方法 |
CN105913079A (zh) * | 2016-04-08 | 2016-08-31 | 重庆大学 | 基于目标域迁移极限学习的电子鼻异构数据识别方法 |
CN105929113A (zh) * | 2016-04-20 | 2016-09-07 | 重庆大学 | 一种带子空间投影的电子鼻信号误差自适应学习方法 |
CN109669009A (zh) * | 2019-01-10 | 2019-04-23 | 重庆邮电大学 | 基于域校正的域自适应极限学习机电子鼻漂移抑制方法 |
CN110146655A (zh) * | 2019-05-31 | 2019-08-20 | 重庆大学 | 一种基于自适应子空间学习范式的抗电子鼻漂移方法 |
Non-Patent Citations (3)
Title |
---|
SATETHA SIYANG 等: "Diabetes diagnosis by direct measurement from urine odor using electronic nose", 《THE 5TH 2012 BIOMEDICAL ENGINEERING INTERNATIONAL CONFERENCE》 * |
徐娟: "基于域校正的电子鼻传感器漂移抑制方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
梁志芳 等: "电子鼻系统中干扰抑制算法的研究", 《中国博士论文全文数据库信息科技辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11257255B2 (en) * | 2019-12-03 | 2022-02-22 | Leica Microsystems Cms Gmbh | Domain matching methods for transportable imaging applications |
CN112488081A (zh) * | 2020-12-23 | 2021-03-12 | 杭州电子科技大学 | 基于ddadsm跨被试迁移学习脑电精神状态检测方法 |
CN112861929B (zh) * | 2021-01-20 | 2022-11-08 | 河南科技大学 | 一种基于半监督加权迁移判别分析的图像分类方法 |
CN112861929A (zh) * | 2021-01-20 | 2021-05-28 | 河南科技大学 | 一种基于半监督加权迁移判别分析的图像分类方法 |
CN112766405A (zh) * | 2021-01-29 | 2021-05-07 | 重庆大学 | 基于多约束子空间投影的传感器数据分类方法 |
CN112766405B (zh) * | 2021-01-29 | 2023-08-29 | 重庆大学 | 基于多约束子空间投影的传感器数据分类方法 |
CN113627084A (zh) * | 2021-08-06 | 2021-11-09 | 西南大学 | 基于极限学习机的电子鼻信号漂移补偿子空间对齐方法 |
CN113627084B (zh) * | 2021-08-06 | 2024-05-10 | 西南大学 | 基于极限学习机的电子鼻信号漂移补偿子空间对齐方法 |
CN113740381A (zh) * | 2021-08-12 | 2021-12-03 | 西南大学 | 一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法 |
CN113740381B (zh) * | 2021-08-12 | 2022-08-26 | 西南大学 | 一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法 |
CN114219047A (zh) * | 2022-02-18 | 2022-03-22 | 深圳大学 | 一种基于伪标签筛选的异构域自适应方法、装置及设备 |
CN114219047B (zh) * | 2022-02-18 | 2022-05-10 | 深圳大学 | 一种基于伪标签筛选的异构域自适应方法、装置及设备 |
CN115015472A (zh) * | 2022-02-25 | 2022-09-06 | 重庆邮电大学 | 一种基于域自适应的极限学习机传感器漂移数据重构方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111931815B (zh) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111931815B (zh) | 基于迁移样本的跨域迁移电子鼻漂移抑制方法 | |
Archibald et al. | Feature selection and classification of hyperspectral images with support vector machines | |
CN113627084B (zh) | 基于极限学习机的电子鼻信号漂移补偿子空间对齐方法 | |
Fan et al. | Robust high dimensional factor models with applications to statistical machine learning | |
Curry et al. | MSnet: A neural network which classifies mass spectra | |
US20080097940A1 (en) | Kernels and kernel methods for spectral data | |
US20140032451A1 (en) | Support vector machine-based method for analysis of spectral data | |
CN112488081A (zh) | 基于ddadsm跨被试迁移学习脑电精神状态检测方法 | |
CN105929113B (zh) | 一种带子空间投影的电子鼻信号误差自适应学习方法 | |
CN113887538B (zh) | 模型训练、人脸识别方法、电子设备及存储介质 | |
CN112418395B (zh) | 一种基于生成对抗网络的气体传感器阵列漂移补偿方法 | |
CN113740381B (zh) | 一种基于流形学习的跨域子空间学习电子鼻漂移补偿方法 | |
CN102142082B (zh) | 用于人脸识别的基于虚拟样本的核鉴别方法 | |
CN110880024B (zh) | 基于判别核慢特征分析的非线性过程故障辨识方法及系统 | |
Mandal et al. | FaRoC: fast and robust supervised canonical correlation analysis for multimodal omics data | |
CN113030197A (zh) | 一种气体传感器漂移补偿方法 | |
Se et al. | A dual drift compensation framework based on subspace learning and cross-domain adaptive extreme learning machine for gas sensors | |
Wang et al. | MQDF discriminative learning based offline handwritten Chinese character recognition | |
CN109324595B (zh) | 一种基于增量pca的工业监测数据分类方法 | |
Pan et al. | Detecting anomaly in chemical sensors via L1-kernel-based principal component analysis | |
Suh et al. | Long-tailed recognition by mutual information maximization between latent features and ground-truth labels | |
CN111832427B (zh) | 基于欧氏对齐和Procrustes分析的EEG分类的迁移学习方法和系统 | |
TW202001246A (zh) | 檢測微生物抗藥性方法 | |
CN114970763A (zh) | 一种基于迁移学习的辐射源工作模式识别方法 | |
Alstrøm et al. | Haussdorff and hellinger for colorimetric sensor array classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |