CN112418395A - 一种基于生成对抗网络的气体传感器阵列漂移补偿方法 - Google Patents

一种基于生成对抗网络的气体传感器阵列漂移补偿方法 Download PDF

Info

Publication number
CN112418395A
CN112418395A CN202011284333.3A CN202011284333A CN112418395A CN 112418395 A CN112418395 A CN 112418395A CN 202011284333 A CN202011284333 A CN 202011284333A CN 112418395 A CN112418395 A CN 112418395A
Authority
CN
China
Prior art keywords
data
drift
discriminator
countermeasure
gas sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011284333.3A
Other languages
English (en)
Other versions
CN112418395B (zh
Inventor
王庆凤
刘威
宫泽睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202011284333.3A priority Critical patent/CN112418395B/zh
Publication of CN112418395A publication Critical patent/CN112418395A/zh
Application granted granted Critical
Publication of CN112418395B publication Critical patent/CN112418395B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/02Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance
    • G01N27/04Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance by investigating resistance
    • G01N27/12Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating impedance by investigating resistance of a solid body in dependence upon absorption of a fluid; of a solid body in dependence upon reaction with a fluid, for detecting components in the fluid
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

本发明公开了一种基于生成对抗网络的气体传感器阵列漂移补偿方法,包括:步骤一、通过气体传感器获取多个批次的测量数据;步骤二、建立生成对抗网络模型和特征提取神经网络;筛选出漂移程度不同批次的所述测量数据作为训练样本;步骤三、使用所述训练样本对所述生成对抗网络模型进行训练,得到生成漂移数据的对抗生成网络模型;其中,在训练过程中,使用所述特征提取神经网络提取的漂移后数据特征作为生成对抗网络模型生成数据的指示指标;步骤四、将多个批次的所述测量数据作为输入参数输入所述生成漂移数据的对抗生成网络模型,所述生成漂移数据的对抗生成网络模型输出所述多个批次的测量数据对应的漂移后的数据,得到漂移后数据的补偿数据集。

Description

一种基于生成对抗网络的气体传感器阵列漂移补偿方法
技术领域
本发明属于气体传感器阵列漂移补偿方法技术领域,特别涉及一种基于生成对抗网络的气体传感器阵列漂移补偿方法。
背景技术
气体传感器是一种将气体的成分、浓度等信息转换为能被人利用的数据的一种装置,常用于检测某种特定气体是否存在以及测量气体成分浓度,被广泛使用于民用,工业,环境监测等各个领域。目前,市面上流通的传感器种类很多,分别包括电化学式气体传感器、半导体式气体传感器、热导齿式气体传感器、催化燃烧式气体传感器、红外线气体传感器以及磁性氧气气体传感器等。
气体传感器在工业、生活的各个领域都得到了广泛的运用,从石油化工到钢铁冶金,从矿山开采到节能减排再到食品安全,方方面面都充斥着它的身影。近年来,科技的发展日新月异,而互联网时代的到来则掀起了一段崭新的技术浪潮,新兴的人工智能和快如闪电的5G网络正在开拓一个崭新的领域,其中新兴的智能家居、移动终端等也为气体传感器的应用提供了一片广袤的市场。
但传感器在实际使用过程中,会发生漂移现象,从而导致测量精度下降,造成测量结果不准确的问题。传感器漂移指的是当处于同一环境下,传感器响应在外部环境不变时发生缓慢随机变化的过程。在实际过程中,检测和识别所面临得一个重大问题气体传感器存在的漂移现象,因为它不仅会严重影响识别的准确性,同时也增加了传感器系统的维护成本,从而限制了气体传感器在各个领域中的实际运用和推广。随着气体传感器的广泛运用,解决这一问题也变得迫在眉睫。
发明内容
本发明的目的是提供一种基于生成对抗网络的气体传感器阵列漂移补偿方法,通过生成对抗网络将漂移前数据所在源域映射到漂移后数据的目标域中,实现特征层面的传感器漂移补偿;同时通过辅助的多层神经网络用于提取数据特征,将提取的特征作为一部分指标指示生成对抗网络生成数据,将数据从原始分布的源域转换到漂移后分布的目标域中;能够减少分类器的误差,从而达到了弥补传感器漂移的目的。
本发明提供的技术方案为:
一种基于生成对抗网络的气体传感器阵列漂移补偿方法,包括如下步骤:
步骤一、通过气体传感器获取多个批次的测量数据;
步骤二、建立生成对抗网络模型和特征提取神经网络;筛选出漂移程度不同批次的所述测量数据作为训练样本;
步骤三、使用所述训练样本对所述生成对抗网络模型进行训练,得到生成漂移数据的对抗生成网络模型;
其中,在训练过程中,使用所述特征提取神经网络提取的漂移后数据特征作为生成对抗网络模型生成数据的指示指标;
步骤四、将多个批次的所述测量数据作为输入参数输入所述生成漂移数据的对抗生成网络模型,所述生成漂移数据的对抗生成网络模型输出所述多个批次的测量数据对应的漂移后的数据,得到漂移后数据的补偿数据集;
其中,所述漂移后数据的补偿数据集为:
Ti=[G(Ti-1),batchi];
式中,Ti为第i个批次的漂移后数据的补偿数据集,Ti-1为第i-1个批次的漂移后数据的补偿数据集,G(Ti-1)为Ti-1输入生成漂移数据的对抗生成网络模型输出的漂移后的数据,batchi为第i个批次的测量数据。
优选的是,所述生成对抗网络模型包括生成器和判别器;
其中,在所述步骤三中,采用交叉训练的方法对所述生成对抗网络模型进行训练,包括:
先固定生成器,优化判别器,使判别器的判别准确率最大化;再固定判别器,优化生成器,使判别器对生成数据的判别准确率最小化。
优选的是,所述判别器的优化目标为:降低判别器的损失函数值以更新判别器的参数;
其中,所述判别器的损失函数为:
LD=-∑log(D(x))+log(D(G(x′)));
式中,D(x)表示判别器D将真实数据x判定为真实数据的概率,D(G(x′))表示判别器D将生成器G生成的虚假数据x′判定为真实数据的概率。
优选的是,所述生成器的优化目标为:降低生成器的损失函数值以更新生成器的参数;
其中,所述生成器的损失函数为:
LG=LGen+αLMSE+βLM
式中,LGen为原生成器损失,LMSE为生成数据与目标数据的均方误差,LM为生成数据与目标数据在所述特征提取神经网络中的均方误差,α表示生成数据与目标数据的均方误差的系数,β表示生成数据与目标数据在所述特征提取神经网络中的均方误差的系数。
优选的是,在所述步骤二之前,还包括采用如下公式对所述测量数据进行标准化处理:
Figure BDA0002781843840000031
其中,max(x,j)为第j列数据的最大值,min(x,j)为第j列数据的最小值,xi,j为第i行第j列的值。
优选的是,所述测量数据为一个16×8维度的特征向量。
优选的是,α=0.4,β=10。
本发明的有益效果是:
本发明提供的基于生成对抗网络的气体传感器阵列漂移补偿方法,通过生成对抗网络将漂移前数据所在源域映射到漂移后数据的目标域中,实现特征层面的传感器漂移补偿;同时通过辅助的多层神经网络用于提取数据特征,将提取的特征作为一部分指标指示生成对抗网络生成数据,将数据从原始分布的源域转换到漂移后分布的目标域中;能够减少分类器的误差,从而达到了弥补传感器漂移的目的。
附图说明
图1为本发明所述的基于生成对抗网络的气体传感器阵列漂移补偿方法的流程图。
图2为本发明所述的多层神经网络的结构示意图。
图3为本发明所述的GAN模型的整体框架图。
图4为本发明所述的生成对抗网络生成补偿数据的流程图。
图5为本发明所述的SVM算法的支持向量图。
图6为不同核函数的SVM以及感知机在原始数据集上的分类结果示意图。
图7为SVM在不同α∶β值的GAN模型生成数据与原始数据上分类结果示意图。
图8为α=0.4,β=10时不同分类器的分类结果示意图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
如图1所示,本发明提供了一种基于生成对抗网络的气体传感器阵列漂移补偿方法,具体实施过程如下:
一、数据集处理
本实施例使用的数据集为Vergara等人测量并公开的数据集,来自UCI数据库中的Gas Sensor Array Drift Dataset at Different Concentrations Data Set。该数据集了长达36个月(2008年1月至2011年2月)的13910条数据。传感器阵列包含16个传感器,其中每个传感器分别为每个测试气体样本提供8个信号特征,包括2个稳态特征和6个瞬态特征。因此,每条数据为一个128维的特征向量。
由于单个月份中缺乏足够的样本数以及各种类气体样本量稀少,因此原文将36个月的数据划分为10个批次;其中,各批次包含月份以及各气体种类如表1所示。数据集中主要包含乙醇、乙烯、氨、乙醛、丙酮和甲苯6种气体;其中,丙酮和乙烯气体的测量数据最多,都占整体的21%左右;其次就是乙醇,占18.4%;其他的乙醇,甲苯和氨3种气体整体含量偏少,合计占30%左右。
在实施例中,主要针对数据各个维度的量纲不同,为了让不同维度之间的特征在数据上具有一定的可比较性,而对数据进行归一化。根据目标的最大值和最小值进行标准化处理,通过一种简单线性变换将数据压缩到区间[0,1]内,具体公式如下:
Figure BDA0002781843840000051
其中,max(x,j)为第j列数据的最大值,min(x,j)为第j列数据的最小值,xi,j为第i行第j列的值。
之后根据生成对抗网络模型(GAN)的要求,主要对预处理后的数据进行如下处理:
(1)删除标签为甲苯的样本数据
甲苯在整体数据中的数量偏少,同时在第2~5和第8批次中含量极少,同时却在后面几个独立的批次中数量较多。所以从数据集中剔除甲苯,从而减少小样本对模型带来的误差。
(2)将第6~7批次数据用于训练GAN
由于其他批次数据的规模相对较小,可能不能完全将漂移前与漂移后数据之间的映射关系表达出来,所以选取第6~7批次的数据用于训练GAN,以达到漂移前后数据一一对应的目的。
将第6批次数据设置为源数据,将第7批次数据设置为目标数据。当输出batch6中的任意一条数据时,要求得到与其同类别的batch7中的数据,同时为了达到batch6到batch7中同类别数据分布的映射,当两次输入batch6的相同数据时,应当随机地给出batch7中两条同类别的数据。根据以上描述,基本框架如算法1所示。
Figure BDA0002781843840000052
Figure BDA0002781843840000061
Figure BDA0002781843840000071
上述算法将同标签的漂移前数据与漂移后数据随机关联到了一起,从而实现了漂移前数据分布到漂移后数据分布的映射。实际过程中,我将该算法包装成了一个类,并在这个类中内置了一个全局变量idx,通过这个变量实现给出指定数目的数据,并每遍历一定次数,对前后数据进行随机打乱,以此实现对同一数据不同方式的多次遍历。
二、通过生成对抗网络模型进行气体传感器阵列漂移补偿
生成对抗网络模型GAN包括:生成器和判别器。生成器尽可能地生成使判别器G无法判别真假的假样本,而判别器D则需要尽可能地识别出样本是真实样本还是生成的假样本。换句话说,在GAN中,生成器G用于捕获数据分布,判别器D用来评估样本数据来自真实样本的概率,生成器G与判别器D在相互博弈对抗的过程中不断学习和优化,从而使得各自的生成能力和判别能力逐步提高,最终达到一个纳什均衡。可以看出,其核心思想源自博弈论,生成器G的输出为判别器D的输入,而判别器D则为生成器G提供权值的更新。生成器G接受一个隐变量z(通常为服从高斯分布的随机噪声)生成样本Xfake,判别器D负责判别输入的data是真实样本Xreal还是生成样本Xfake。该模型的优化问题是一个极小-极大化问题,优化的目标函数如下:
Figure BDA0002781843840000072
若直接使用漂移后数据与使用漂移前数据生成的数据之间的均方误差作为损失函数,则生成器只会生成与目标数据同分布的数据。例如训练生成器接收batch6数据而输出batch7数据,如果只采用均方误差来训练,那么其余所有批次的数据都会生成与batch7同分布的数据,而不是漂移后的数据,同时各个批次的分布又有所不同,这就导致了不同批次同标签的数据可能对应生成的数据也会不同,即batch1、batch2中标签都为1的数据在通过生成器后生成的数据可能会不同,这就造成了数据不同标签之间的难以区分,不易于分类器进行分类。
因此本发明首先训练一个辅助的多层神经网络用于提取数据特征,所述多层神经网络结构如图2所示。将提取的特征作为一部分指标指示生成器生成数据,从而将数据从原始分布的源域转换到漂移后分布的目标域中,通过这种方式减少分类器的误差,从而达到了弥补传感器漂移的目的。所以本发明所采用的损失函数为:
LG=LGen+αLMSE+βLM
其中,LGen为原生成器损失,LMSE为生成数据与目标数据的均方误差,LM为生成数据与目标数据在多层神经网络的均方误差。
因为本实施例中数据集的每条数据为128维的数据,因此采用128个神经元作为输入层。第1个隐藏层为64个神经元,之后每个隐藏层的神经元数依次减半,其中每个隐藏层均采用ReLU函数进行激活。最后因为删除气体甲苯的数据后,气体种类共有5种,因此输出层采用了对应的5个神经元,经过softmax函数处理后即可转换为某一类的概率。
使用任一批次数据对该多层神经网络进行训练,当该多层神经网络作为特征分类器的表现较佳时,我们认为该多层神经网络能提取同批次的不同类别气体的特征,即该神经网络提取了不同类别气体的深层特征。利用这一点,本发明中该多层网络用于提取气体数据的特征,并认为该神经网络的中间层的输出能较好地表现同类别气体之间的相似性,并利用中间层的输出衡量漂移后数据与利用漂移前数据生成的数据之间的差别。
本实施例中采用的GAN模型的整体框架如图3所示,判别器接收数据与对应标签的一个输入,并判断这个数据是真实数据还是来自生成器的生成数据。生成器接收的输入为漂移前的数据和对应标签,输出相应的漂移后的数据。
其中,生成器为两层神经网络,隐藏层具有64个神经元,采用ReLU函数进行激活,由于要达到输入漂移前数据得到漂移后数据的目的,因此输出层采用和输入层一样多的神经元。对应地,为了避免判别器太好而带来的难以训练的问题,判别器也为一个两层的神经网络,隐藏层的神经元与生成器相同,只是输出层只有1个神经元。
判别器的损失与原GAN的损失一致,均为一个二分类的交叉熵损失:
LD=-∑log(D(x))+log(D(G(x′)));
生成器G的损失函数为:
LG=LGen+αLMSE+βLM
其中,LGen为原生成器损失,LMSE为生成数据与目标数据的均方误差,LM为生成数据与目标数据在多层神经网络的均方误差。
生成器损失分为三部分:
LGen=∑log(D(G(x′)))
Figure BDA0002781843840000091
Figure BDA0002781843840000092
其中,D(G(x′))表示判别器D将生成器G生成的虚假数据G(x′)判定为真实数据的概率;x表示真实数据,也就是目标数据;N表示真实数据的维度,x(i)表示真实数据的第i个维度的值;x′表示生成器的输入数据,这里为源数据;G(x′)表示生成器生成的数据,即虚假数据;G(x′)(i)表示G(x′)的第i个维度的值;φ( )表示训练好的多层神经网络的模型,φ(x)表示目标数据x作为输入时多层神经网络的输出,φ(x)(i)表示φ(x)的第i个维度的值;φ(G(x′))表示生成的数据G(x′)作为输入时多层神经网络的输出,φ(G(x′))(i)表示φ(G(x′))的第i个维度的值。
生成补偿数据的具体流程如图4所示,具体算法过程如下:
Figure BDA0002781843840000093
Figure BDA0002781843840000101
三、结果对比与分析
感知机和SVM都是两种建立在监督学习基础上的分类器,并且它们学习目的都是利用一个超平面来对样本集进行划分,下面对感知机和SVM的原理作简要介绍。
感知机(Perceptron)是计算机科学家Rosenblatt于1959年提出的一个由两层神经元组成的神经网络,是世界上首个可以学习的人工神经网络。
若训练数据集是线性可分的,那么感知机学习的结果会是得到一个能够完全分离不同类别的点的超平面。如果是非线性可分的数据,则最后无法获得超平面,算法不会收敛。感知机模型是一种线性分类模型,它的假设空间(决策函数的集合)是定义在特征空间中的所有线性分类器的模型,其函数表达式如下:
f(x)=sign(w·x+b)#(3.1)
w,b是模型的参数,w被叫做权值,b则称为偏置。其中:
Figure BDA0002781843840000111
当w,x为标量时,函数代表平面内的一条直线,即在这个直线上方的点被分为正类,直线下方的点被分为负类。通常情况下w,x为n维向量,这时感知机模型即为n维空间中的一个n-1维超平面,w是法向量,b是截距,这个超平面将整个输出空间划分为两部分。
感知机的目的是找到能使训练集正类和负类完全分离的超平面,为了得到这个平面,即确定w,b的值,需要确定一个学习策略,即定义一个损失函数并将它极小化,在这个极小化的过程中不断更新w和b的值,直到满足损失最小的条件。
给定训练数据集T={(x1,y1),(x2,y2),...,(xN,yN)},其中,
Figure BDA0002781843840000112
则感知机的损失函数为:
Figure BDA0002781843840000113
其中,M是误分类点集合。在训练过程中需要使得损失函数的值最小化,具体采用随机梯度下降法。先任意选定一个超平面w0,b0,之后用梯度下降法不断减少目标函数(3.3)的值。注意,在训练过程中不是一次性使得所有误分类点的梯度下降,而是每次随机选择一个误分类点使其梯度下降。假设这个集合M是固定的,那么损失函数的梯度为:
Figure BDA0002781843840000114
Figure BDA0002781843840000115
随机选取误分类点(xi,yi),根据xi,yi的值对w,b进行更新:
w←w+ηyixi#(3.6)
b←b+ηyi#(3.7)
其中η(0<η≤1)为步长,又被称为学习率。这样,通过不断选取误分类点,损失函数的值降为0,从而得到了一个将正负实例点完全分开的超平面。
根据以上描述,其基本框架如算法3所示:
Figure BDA0002781843840000121
这个算法直观上可以解释为:当一个实例点被误分类,即位于分类超平面的错误一侧时,调整w,b的值使分类超平面朝误分类点的一侧移动,直到超平面越过该分类点使其被正确分类。
这个算法直观上可以解释为:当一个实例点被误分类,即位于分类超平面的错误一侧时,调整w,b的值使分类超平面朝误分类点的一侧移动,直到超平面越过该分类点使其被正确分类。
SVM是一种广义的线性分类器,于1963年首次出现,目前我们普遍使用的版本是Cortes和Vapnik于1995年提出的,其中主要引入了软间隔的概念,从而使得这一算法的应用不再局限于线性可分得数据集,而在非线性可分的情况下也有较好的表现。作为一种监督学习算法,SVM的原理基础是结构风险最小化,即使样本数量有限,也能在学习能力和模型的复杂度上做到较好的均衡,从而达到较好的泛化能力,因此它在高维非线性的小样本数据集上的分类识别能力较强。
与感知机的目标相同,SVM的训练结果也是在特征空间中找到一个理想的超平面进行正负样本点的切分,但它所采取的学习策略和损失函数稍有不同。感知机只需要找到能正确分离正负样本点的超平面即可,这样的超平面可以随初始点的选取以及迭代顺序的不同而有所不同,理论上可存在无穷多个。但对于SVM来说,只要训练的数据集确定了,分离超平面就是唯一不变的。
对于给定的数据集和超平面,定义超平面w·x+b=0到样本点(xi,yi)的函数间隔
Figure BDA0002781843840000131
和几何间隔γi为:
Figure BDA0002781843840000132
Figure BDA0002781843840000133
其中,||w||为w的L2范数。不难看出,几何间隔γi是函数间隔
Figure BDA0002781843840000134
规范化后的一种结果,因为对于同一超平面来说,若成比例地改变w和b,函数间隔
Figure BDA0002781843840000135
会变为原来地两倍而几何间隔γi保持不变,因此几何间隔相对函数间隔来说能更好地表达分类预测地正确性和确信度。对于整个数据集来说,超平面关于数据集T的函数间隔
Figure BDA0002781843840000136
和几何间隔γ为样本集中所有样本点的函数间隔
Figure BDA0002781843840000137
和几何间隔γi的最小值,即:
Figure BDA0002781843840000138
Figure BDA0002781843840000139
这样,SVM的目标就变为求解能正确划分样本点并且几何间隔最大的分离超平面,这个超平面是唯一的。具体地,这个问题可表示为一个约束最优化问题:
Figure BDA00027818438400001310
其中,约束条件为:
Figure BDA00027818438400001311
由式(4.3)和(4.4),可知函数间隔
Figure BDA0002781843840000141
和几何间隔γi之间的关系:
Figure BDA0002781843840000142
Figure BDA0002781843840000143
而由于函数间隔
Figure BDA0002781843840000144
的取值对问题的解没有影响,所以可以令
Figure BDA0002781843840000145
同时注意到最大化
Figure BDA0002781843840000146
和最小化
Figure BDA0002781843840000147
是等价的,结合式(4.5),(4.6),(4.7),(4.8),代入
Figure BDA0002781843840000148
可得如下的最优化问题:
Figure BDA0002781843840000149
约束条件为:
yi(w·xi+b)-1≥0,i=1,2,...,N#(4.10)
这个凸优化问题可利用拉格朗日对偶性求解,可化为求原问题的对偶问题。
Figure BDA00027818438400001410
其中,约束条件为:
Figure BDA00027818438400001411
式(4.11)和(4.12)即为最先提出的基于硬间隔的SVM算法求解公式。
在训练集线性可分的情况下,训练数据集中与分离超平面距离最近的点被称为支持向量(supportvector),支持向量也是指使式(4.11)成立的点。如图5所示,在H1,H2上的即为支持向量,而位于H1和H2之间长带的宽带被称为间隔,间隔依赖于权重w,等于
Figure BDA00027818438400001412
因此H1和H2又被称为间隔边界。因为分离超平面位于间隔中央并与H1,H2平行,可以看出实际上分离超平面是由支持向量决定的,如果移动支持向量,分离超平面会改变,但如果在间隔边界以外移动其他的点,分离超平面是不会改变的,这也是为什么称这个模型为支持向量机的原因。
以上算法有着一些缺陷,即无法适用于线性不可分的数据集。而通常情况是,样本集中除了一些特异点,剩下大部分都是线性可分的。为了解决这个问题,即允许SVM在一小部分样本点上出错,从而引入了一个软间隔的概念。即对每个样本点(xi,yi)引入一个松弛变量ξi≥0,从而约束条件(4.10)变为:
yi(w·xi+b)-1+ξi≥0#(4.13)
同时,对于每个样本点(xi,yi),由于引入了松弛变量ξi,从而增加了损失ξi,从而式(4.9)变为:
Figure BDA0002781843840000151
式(4.14)引入了一个惩罚参数C(C>0),C越大表示误分类点的损失大,即使得误分类点的个数尽量小,而C越小则表示误分类点的损失小,代表着支持向量间的间隔大。
虽然这样解决了异常点的问题,但是对于训练集完全线性不可分的情况,这类SVM在训练集上的表现不好。针对于此,可以通过利用核技巧(kernel trick)将线性不可分的数据集映射到另一个空间中,从而转换为在新空间的线性可分问题。
设χ为输入空间,
Figure BDA0002781843840000152
为特征空间,若存在一个从χ到
Figure BDA0002781843840000153
的映射:
Figure BDA0002781843840000154
使得对所有x,y∈χ,函数K(x,y)满足条件:
K(x,y)=φ(x)·φ(y)#(4.16)
则称K(x,y)为核函数,φ(x)为对应的映射函数。通常在学习和预测中只定义和函数K(x,y),而不是显式地定义映射函数φ(x)。此时目标函数(4.11)变为:
Figure BDA0002781843840000161
当映射函数是非线性函数时,通过将输入空间的内积xi·xj转换为特征空间的内积K(xi,xj),从而实现了对训练集的非线性分类。
SVM算法的大致框架如下:
Figure BDA0002781843840000162
对比分析结果如下:
本实施例采用batch1中的数据进行训练,并在其他批次上测试分类结果。首先就使用感知机以及不同核函数的SVM对原始数据集进行分类,分类结果如图6所示。
结合图6及表3可以看出,除了sigmoid核函数的SVM表现不太好之外,其余3中SVM之间的表现不相伯仲。除此之外,各个分类器在第2,3批次的表现都比较不错,而在之后的几个批次中准确率都有所下降,对于第4,5,8,9几个样本数较少的批次,分类器的表现较不稳定,而对于最后一个批次,由于传感器发生了严重的漂移现象,各个分类器的准确率都发生了较为严重的下滑。之后将以rbf核函数的SVM为例,比较它在生成数据与原始数据集中的各种表现,并根据此对GAN进行调参。
表3不同分类器分类平均正确率表
Figure BDA0002781843840000171
分别令生成器G的损失函数中的系数α∶β=1∶10,1∶100,1∶103,1∶104,一共取得10组比值,通过训练GAN得到不同的10组生成的数据,再在这些生成数据上使用SVM分类器进行分类,分类的结果如图7所示,SVM在不同α与β值条件下生成数据的平均正确率如表4所示。
表4 SVM在不同α与β值条件下生成数据的平均正确率
Figure BDA0002781843840000172
Figure BDA0002781843840000181
由图7和表4可知,SVM在在batch6,batch7训练好的GAN生成的数据集上的表现大部分比原始数据集上的表现要好,其中表现最好的生成数据是在α=1,β=100以及α=0.01,β=10时。期间为了确认最佳参数,针对最后batch10数据分类不准确的问题,在生成batch10的数据前对前9个批次迭代若干次,最终发现迭代3次时,当α=0.4,β=10时,SVM的表现最好。于是在这个数据集上进行各个分类器上的分类,其表现如图8所示;α=0.4,β=10时,不同分类器分类平均正确率如表5所示。
表5 α=0.4,β=10时不同分类器分类平均正确率表
Figure BDA0002781843840000182
综上所述,通过本发明提供的基于生成对抗网络的气体传感器阵列漂移补偿方法进行传感器漂移阵列补偿后,分类器的平均正确率得到显著提升,从而可以证明本发明达到了弥补传感器漂移的目的。
本发明通过GAN将漂移前数据所在源域映射到漂移后数据的目标域中,从而实现特征层面的传感器漂移补偿。GAN的架构借鉴了SRGAN,需预先训练好一个多层神经网络作为特征分类器用于提取传感器数据特征。GAN训练过程中,通过batch6(漂移前),batch7(漂移后)训练GAN,以实现将漂移前数据转换为漂移后数据的目的。其中,判别器的损失函数与原始GAN的判别损失一致,生成器的损失则包括3部分:漂移后数据(真实)与漂移后数据(生成)的均方误差、漂移后数据(真实)与漂移后数据(生成)经特征提取后的均方误差、原GAN的生成损失。
在实际生成漂移后的数据的过程中,认为每个批次较前一批次所发生的传感器漂移的程度相同(即每批次数据是上批次数据经过漂移后得到的),由于各个批次中的实际漂移程度有所不同,所以采用以下方法来确保各个种类的数据分布保持一致:
1.从batch1开始对各个批次的数据一次进行处理,由于batch1无对应的漂移前的数据,直接令T1=batch1;
2.batch2存在对应的漂移前数据batch1,因此将batch1中数据输入GAN进行处理,得到G(T1)或G(batch1),此时认为G(T1)与batch2同分布,将其记为T2,即T2=[G(T1),batch2]。
3.对于batch3,有T3=[G(G(T1)),G(batch1),batch2]=[G(T2),batch2],对于batchi,有Ti=[G(Ti-1),batchi]
4.最后输出的T10即为原始数据对应的生成数据。
通过对比分类器在生成数据T10以及原始数据To=[batch1,batch2,...,batch10]的表现,发现分类器在生成数据上的表现远远高于其在原始数据上的表现,从而证明了本发明提供的基于生成对抗网络的气体传感器阵列漂移补偿方法能有效地弥补传感器漂移。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (7)

1.一种基于生成对抗网络的气体传感器阵列漂移补偿方法,其特征在于,包括如下步骤:
步骤一、通过气体传感器获取多个批次的测量数据;
步骤二、建立生成对抗网络模型和特征提取神经网络;筛选出漂移程度不同批次的所述测量数据作为训练样本;
步骤三、使用所述训练样本对所述生成对抗网络模型进行训练,得到生成漂移数据的对抗生成网络模型;
其中,在训练过程中,使用所述特征提取神经网络提取的漂移后数据特征作为生成对抗网络模型生成数据的指示指标;
步骤四、将多个批次的所述测量数据作为输入参数输入所述生成漂移数据的对抗生成网络模型,所述生成漂移数据的对抗生成网络模型输出所述多个批次的测量数据对应的漂移后的数据,得到漂移后数据的补偿数据集;
其中,所述漂移后数据的补偿数据集为:
Ti=[G(Ti-1),batchi];
式中,Ti为第i个批次的漂移后数据的补偿数据集,Ti-1为第i-1个批次的漂移后数据的补偿数据集,G(Ti-1)为Ti-1输入生成漂移数据的对抗生成网络模型输出的漂移后的数据,batchi为第i个批次的测量数据。
2.根据权利要求1所述的基于生成对抗网络的气体传感器阵列漂移补偿方法,其特征在于,所述生成对抗网络模型包括生成器和判别器;
其中,在所述步骤三中,采用交叉训练的方法对所述生成对抗网络模型进行训练,包括:
先固定生成器,优化判别器,使判别器的判别准确率最大化;再固定判别器,优化生成器,使判别器对生成数据的判别准确率最小化。
3.根据权利要求2所述的基于生成对抗网络的气体传感器阵列漂移补偿方法,其特征在于,所述判别器的优化目标为:降低判别器的损失函数值以更新判别器的参数;
其中,所述判别器的损失函数为:
LD=-∑log(D(x))+log(D(G(x')));
式中,D(x)表示判别器D将真实数据x判定为真实数据的概率,D(G(x'))表示判别器D将生成器G生成的虚假数据x'判定为真实数据的概率。
4.根据权利要求2或3所述的基于生成对抗网络的气体传感器阵列漂移补偿方法,其特征在于,所述生成器的优化目标为:降低生成器的损失函数值以更新生成器的参数;
其中,所述生成器的损失函数为:
LG=LGen+αLMSE+βLM
式中,LGen为原生成器损失,LMSE为生成数据与目标数据的均方误差,LM为生成数据与目标数据在所述特征提取神经网络中的均方误差,α表示生成数据与目标数据的均方误差的系数,β表示生成数据与目标数据在所述特征提取神经网络中的均方误差的系数。
5.根据权利要求4所述的基于生成对抗网络的气体传感器阵列漂移补偿方法,其特征在于,在所述步骤二之前,还包括采用如下公式对所述测量数据进行标准化处理:
Figure FDA0002781843830000021
其中,max(x,j)为第j列数据的最大值,min(x,j)为第j列数据的最小值,xi,j为第i行第j列的值。
6.根据权利要求5所述的基于生成对抗网络的气体传感器阵列漂移补偿方法,其特征在于,所述测量数据为一个16×8维度的特征向量。
7.根据权利要求6所述的基于生成对抗网络的气体传感器阵列漂移补偿方法,其特征在于,α=0.4,β=10。
CN202011284333.3A 2020-11-17 2020-11-17 一种基于生成对抗网络的气体传感器阵列漂移补偿方法 Active CN112418395B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011284333.3A CN112418395B (zh) 2020-11-17 2020-11-17 一种基于生成对抗网络的气体传感器阵列漂移补偿方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011284333.3A CN112418395B (zh) 2020-11-17 2020-11-17 一种基于生成对抗网络的气体传感器阵列漂移补偿方法

Publications (2)

Publication Number Publication Date
CN112418395A true CN112418395A (zh) 2021-02-26
CN112418395B CN112418395B (zh) 2022-08-26

Family

ID=74831878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011284333.3A Active CN112418395B (zh) 2020-11-17 2020-11-17 一种基于生成对抗网络的气体传感器阵列漂移补偿方法

Country Status (1)

Country Link
CN (1) CN112418395B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113030197A (zh) * 2021-03-26 2021-06-25 哈尔滨工业大学 一种气体传感器漂移补偿方法
CN113361194A (zh) * 2021-06-04 2021-09-07 安徽农业大学 一种基于深度学习的传感器漂移校准方法、电子设备及存储介质
US20210311009A1 (en) * 2018-07-31 2021-10-07 Nec Corporation Information processing apparatus, control method, and non-transitory storage medium
CN113804833A (zh) * 2021-09-17 2021-12-17 重庆大学 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
CN114545255A (zh) * 2022-01-18 2022-05-27 广东工业大学 基于竞争型生成式对抗神经网络的锂电池soc估计方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763857A (zh) * 2018-05-29 2018-11-06 浙江工业大学 一种基于相似度生成对抗网络的过程软测量建模方法
US20180336471A1 (en) * 2017-05-19 2018-11-22 Mehdi Rezagholizadeh Semi-supervised regression with generative adversarial networks
US20180341836A1 (en) * 2017-05-24 2018-11-29 General Electric Company Neural network point cloud generation system
CN110335337A (zh) * 2019-04-28 2019-10-15 厦门大学 一种基于端到端半监督生成对抗网络的视觉里程计的方法
CN111103325A (zh) * 2019-12-19 2020-05-05 南京益得冠电子科技有限公司 一种基于集成神经网络学习的电子鼻信号漂移补偿方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180336471A1 (en) * 2017-05-19 2018-11-22 Mehdi Rezagholizadeh Semi-supervised regression with generative adversarial networks
US20180341836A1 (en) * 2017-05-24 2018-11-29 General Electric Company Neural network point cloud generation system
CN109003253A (zh) * 2017-05-24 2018-12-14 通用电气公司 神经网络点云生成系统
CN108763857A (zh) * 2018-05-29 2018-11-06 浙江工业大学 一种基于相似度生成对抗网络的过程软测量建模方法
CN110335337A (zh) * 2019-04-28 2019-10-15 厦门大学 一种基于端到端半监督生成对抗网络的视觉里程计的方法
CN111103325A (zh) * 2019-12-19 2020-05-05 南京益得冠电子科技有限公司 一种基于集成神经网络学习的电子鼻信号漂移补偿方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DIAA BADAWI等: ""Detecting Gas Vapor Leaks Using Uncalibrated Sensors"", 《IEEE ACCESS》 *
QINGFENG WANG: ""Time Series Prediction of E-nose Sensor Drift Based on Deep Recurrent Neural Network"", 《2019 CHINESE CONTROL CONFERENCE (CCC)》 *
崔恩培等: ""基于电子鼻的气体识别神经网络算法研究"", 《科技与创新》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210311009A1 (en) * 2018-07-31 2021-10-07 Nec Corporation Information processing apparatus, control method, and non-transitory storage medium
CN113030197A (zh) * 2021-03-26 2021-06-25 哈尔滨工业大学 一种气体传感器漂移补偿方法
CN113030197B (zh) * 2021-03-26 2022-11-04 哈尔滨工业大学 一种气体传感器漂移补偿方法
CN113361194A (zh) * 2021-06-04 2021-09-07 安徽农业大学 一种基于深度学习的传感器漂移校准方法、电子设备及存储介质
CN113804833A (zh) * 2021-09-17 2021-12-17 重庆大学 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
CN113804833B (zh) * 2021-09-17 2022-04-29 重庆大学 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
CN114545255A (zh) * 2022-01-18 2022-05-27 广东工业大学 基于竞争型生成式对抗神经网络的锂电池soc估计方法

Also Published As

Publication number Publication date
CN112418395B (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
CN112418395B (zh) 一种基于生成对抗网络的气体传感器阵列漂移补偿方法
Yan et al. Correcting instrumental variation and time-varying drift: A transfer learning approach with autoencoders
Yang et al. Combined wireless network intrusion detection model based on deep learning
CN111275113A (zh) 基于代价敏感混合网络的偏斜类时间序列异常检测方法
CN111340132B (zh) 一种基于da-svm的机器嗅觉模式识别方法
CN111597340A (zh) 一种文本分类方法及装置、可读存储介质
CN113269647B (zh) 基于图的交易异常关联用户检测方法
CN113609569B (zh) 一种判别式的广义零样本学习故障诊断方法
Lee et al. Unsupervised anomaly detection of the gas turbine operation via convolutional auto-encoder
Chatterjee et al. Machine learning and data augmentation approach for identification of rare earth element potential in Indiana Coals, USA
CN111522953B (zh) 一种针对朴素贝叶斯分类器的边际攻击方法、装置及存储介质
Qin et al. Making deep neural networks robust to label noise: Cross-training with a novel loss function
Lee et al. Predicting pulsars from imbalanced dataset with hybrid resampling approach
Yousefpour et al. Unsupervised anomaly detection via nonlinear manifold learning
CN110717602A (zh) 一种基于噪音数据的机器学习模型鲁棒性评估方法
CN112464281B (zh) 基于隐私分组和情感识别的网络信息分析方法
Jiao et al. Reduced-space multistream classification based on multi-objective evolutionary optimization
Qiu et al. Detecting misclassification errors in neural networks with a gaussian process model
CN116304941A (zh) 一种基于多模型组合的海洋数据质量控制方法及装置
CN116383747A (zh) 基于多时间尺度深度卷积生成对抗网络的异常检测方法
El-Bably et al. A hybrid approach for improving data classification based on PCA and enhanced ELM
Xu et al. A novel imbalanced fault diagnosis method based on area identification conditional generative adversarial networks
Verma et al. Fuzzy c-means clustering based uncertainty measure for sample weighting boosts pattern classification efficiency
Shinde et al. Identification of Handwritten Complex Mathematical Equations
Shi et al. Robustness Evaluation of Deep Learning Models Based on Local Prediction Consistency

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant