CN107132311A - 一种基于频域特征提取的快速气体识别算法 - Google Patents

一种基于频域特征提取的快速气体识别算法 Download PDF

Info

Publication number
CN107132311A
CN107132311A CN201710203312.6A CN201710203312A CN107132311A CN 107132311 A CN107132311 A CN 107132311A CN 201710203312 A CN201710203312 A CN 201710203312A CN 107132311 A CN107132311 A CN 107132311A
Authority
CN
China
Prior art keywords
data
vector
gas
frequency domain
lda
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710203312.6A
Other languages
English (en)
Other versions
CN107132311B (zh
Inventor
潘晓芳
叶文彬
王坤
张海恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201710203312.6A priority Critical patent/CN107132311B/zh
Publication of CN107132311A publication Critical patent/CN107132311A/zh
Application granted granted Critical
Publication of CN107132311B publication Critical patent/CN107132311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)

Abstract

本发明提供了一种基于频域特征提取的快速气体识别算法,具体是一种新的气体识别算法,通过的气体经过传感器采集数据、截取,将截取的数据进行傅里叶变换得到截取段序列在频域的分布,去掉0Hz位置的前20个数据值做为单个传感器采集数据的特征,将n个传感器数据的特征按一定顺序拼接成长度为20*n向量,重复前面步骤得到大量向量并做上对应气体种类的标签,将大量向量及标签利用LDA算法映射到三维空间下同时获得映射矩阵,通过降维得到的向量及标签数据输入SVM分类器进行分类器的模型建立,将未知特征向量与映射矩阵相乘得到该数据在LDA的三维空间下的向量,将该向量输入至建立的分类器模型中进行该次测量的气体种类的预测。

Description

一种基于频域特征提取的快速气体识别算法
[技术领域]
本发明涉及电子鼻气体检测技术,具体是涉及一种基于频域特征提取的快速气体识别算法。
[背景技术]
电子鼻是模仿人和动物的鼻子,用于分析、识别、检测复杂气味和挥发性成分的新型仪器,与常用的分析仪器(如色谱仪、光谱仪等)相比,电子鼻具有客观、准确、快捷地评价气味,并且重复性好的特点,其应用越来越广泛,它利用气体传感器来识别样品的挥发性气味。在一些环境恶劣情况下不适合人工监测,为了实现对气体的实时监测,设置电子鼻装置十分必要。
目前气体传感器对气体特征的提取方法有所不同,普遍使用的是稳态特征提取以及瞬态特征但其主要针对如何去除特征中的冗余信息或者是如何提高识别率为目,而在减少气体识别时间上著名的方法为EMA算法特征提取。大多数气体检测装置所采用的气体特征是稳态特征,这是由于稳态特征在识别被分析物上拥有超高的识别率,反映出其携带的识别物信息丰富,然而稳态特征的提取通常要等到传感器反应进入一定稳定状态,对于一般的氧化物半导体传感器来说这通常要花费几分钟的时间,这种时间上的延后缺陷极大的限制了气体识别的应用场合,比如潜在的剧毒物品的快速检测,因此,对气体识别能够迅速做出响应的时间越短越好。稳态特征提取:稳态特征是反应结束时的响应值与反应初的值之差再比上反应之初的响应值:(Δrxam为结束时与反应初响应值之差)将测量得到S值作为某气体经气体传感器后的响应的特征值,并将此值输入到分类器中进行气体的分类鉴别。EMA(Exponential Moving Average指数移动平均)算法提取特征:EMA算法是一种特殊的加权平均法。一次指数平滑法公式如下:
Ft+1=αYt+(1-α)Ft
Ft+1为第t+1个值的指数平滑趋势预测值;
Ft为第t个值的指数平滑趋势预测值;
Yt为第t个值的实际观察值;
α为权重系数。
EMA算法提取特征的过程是将从传感器获得的响应序列经一次指数平滑公式计算得到一新的序列,并以此新序列的极值点作为此次响应序列的特征,该极值点出现的位置相比于稳态特征等待反应基本完全要前移许多,而且在不同的权重系数下极值出现的时间也不同。
稳态特征提取方法需要花费大量的时间,且识别的准确率不及本发明。产生原因:稳态特征提取需要花费大量的时间来等待气体与传感器反应接近结束。
EMA算法可以有效的缩短气体识别的等待时间,但本发明缩短的时间更多,而且在识别率上更高,能够更快速对气体做出检测。
[发明内容]
为了能够快速对气体做出识别,减少等待时间,本发明提供了一种基于频域特征提取的快速气体识别算法,具体技术方案如下:
步骤1、将恒温条件下的某种气体通入气体传感器阵列(电子鼻)进行数据采集;
步骤2、将每一路传感器采集到的数据用矩形窗从反应开始时刻进行截取,实际操作中相当于测量时气体与传感器阵列反应的时间为窗长时间;
步骤3、将截取出的数据进行傅里叶变换得到截取段序列在频域的分布;
步骤4、在频域分布中取去掉0Hz位置的前20个数据值作为该路传感器的特征;
步骤5、将该传感器阵列的所有路传感器的特征按一定顺序组合拼接成一长度为20*n的向量(n为传感器阵列上气体传感器的数量),该向量即为本发明所使用的气体测量的频域特征,并对该向量附上对应气体种类的标签;
步骤6、对大量的气体分别实施步骤1至步骤5得到每一次测量的20*n向量并对每个向量做上对应气体种类的标签;
步骤7、将以上得到的大量向量及其对应的标签利用LDA(Linear discriminantanalysis线性判别分析)算法映射至LDA的三维空间下,将该空间下的每次测量数据对应的三维向量作为气体传感器阵列该次测量的频域特征利用LDA降维的向量,所有测量的特征降维后的向量和标签组合在一起作为训练集,并且在进行LDA算法时会生成20*n维向量向LDA的三维空间映射的矩阵;
步骤8、将以上得到的所有降维向量及标签数据输入SVM(Support VectorMachine支持向量机)分类器进行分类器的模型建立;
步骤9、当识别未知气体的数据时经过步骤1至5得到该气体的频域中20*n向量,然后将该向量与步骤7中的映射矩阵相乘得到该数据在LDA的三维空间下的向量;
步骤10、将步骤9得到的三维向量输入至步骤8建立的分类器模型中进行该次测量的气体种类的预测。
其中,步骤4所述去掉0Hz位置的数据相当于对截取出的数据进行了去0频滤波,考虑到反应初的响应值会受到传感器漂移的影响,去0频将在一定程度上减少传感器漂移的影响。
通过以上步骤,用矩形窗对整个响应序列进行截取前窗长所对应长度,相当于在采集数据时只采集窗长所对应时间长度的数据,而该窗长实际可以很短(相对于传统特征提取方法),故而可以大大缩短气体检测的时间,实现快速检测识别的目的。
[附图说明]
图1为对UCI数据库中的气体数据分别用稳态特征、EMA提取特征以及本发明的频域特征用SVM分类器进行气体识别的各种性能得比较。
图2为所用数据的频域特征空间去掉0Hz频率成分后经LDA投影至2维特征空间的分布。
图3为所用数据的频域特征空间去掉0Hz频率成分后经LDA投影至3维特征空间的分布。
[具体实施方式]
为了使本发明实现的技术手段清晰明了,下面通过实施例进一步阐述本发明。
测试数据(原材料):5个相同的8路传感器阵列测试4种气体,每种气体以10ppm为浓度阶梯从10ppm到100ppm分成10个浓度等级,共做了640次测量。为了将漂移考虑进去,每一个测量组的测量分布在不同的日期进行,数据的采集是频率是100Hz,每次测量时间为600s,这就意味着信号序列拥有足够的细节。
步骤:将每次测量的数据的每一路从反应初开始用一长为N的矩形窗对原始数据进行截取,即每次测量的数据都会截取出8段长为N的数据;之后对截取出的每一段数据进行快速傅里叶变换得到每一段数据在频域的分布,再将去除0Hz位置的频域数据的前20个数据提取出,对于每一次的测量数据将会得到8个长为20的从频域数据中提取的数据,将这8段长为20的数据拼接成一个长为160的向量,即该次测量的频域特征,并依据该次测量对应的气体种类将此向量做上对应气体的标签。对于640次测量便可得到640个160维的向量及对应标签,将得到的640个160维向量及标签利用LDA算法将其投影到LDA的三维空间,如图3所示,得到每次测量的频域特征降维后的向量。由于数据有限,取其中的340个降维后的向量及标签作为训练集用于SVM分类器的模型建立,剩余300个特征利用建好的SVM分类器模型进行预测识别,此300个数据相当于实际应用中对未知气体测量窗长时间后经快速傅里叶变换、取去0Hz后前20个数据,拼接、经LDA映射后的未知气体的降维后的向量。从图3中可以看出,在3维的LDA空间中不同种类的气体数据是可以完全分开的,故而可以使用SVM分类器对其分类。
步骤中关于窗长的选择:对于本例子使用的窗长为4s,即实际检测气体时只需花费4s的时间就可以获得足够的信息进行气体的识别。
本发明与传统的EMA特征提取方法以及稳态特征提取方法相比功能上都是对测量的气体数据进行特征提取,但区别是检测所消耗的时间更少,具有很大的现实意义,附图1是对UCI数据库中的气体数据分别用稳态特征、EMA提取特征以及本发明的频域特征用SVM分类器进行气体识别的各种性能得比较。根据本实施例,同样的检测实验,基于频域特征提取的用时最短,平均准确率、预测准确率与其他两种检测方法相比也是最高的。
以上所述仅为本发明的实施方式之一,本发明的保护范围并不仅限于上述实施方式,凡是属于本发明原理的技术方案均属于本发明的保护范围。对于本领域的技术人员而言,在不脱离本发明的原理的前提下进行的若干改进,这些改进也应视为本发明的保护范围。

Claims (2)

1.一种基于频域特征提取的快速气体识别算法,其特征在于,包括以下步骤:
步骤1、将恒温条件下的某种气体通入气体传感器阵列(电子鼻)进行数据采集;
步骤2、将每一路传感器采集到的数据用矩形窗从反应开始时刻进行截取,实际操作中相当于测量时气体与传感器阵列反应的时间为窗长时间;
步骤3、将截取出的数据进行傅里叶变换得到截取段序列在频域的分布;
步骤4、在频域分布中取去掉0Hz位置的前20个数据值作为该路传感器的特征;
步骤5、将该传感器阵列的所有路传感器的特征按一定顺序组合拼接成一长度为20*n的向量(n为传感器阵列上气体传感器的数量),该向量即为本发明所使用的气体测量的频域特征,并对该向量附上对应气体种类的标签;
步骤6、对大量的气体分别实施步骤1至步骤5得到每一次测量的20*n向量并对每个向量做上对应气体种类的标签;
步骤7、将以上得到的大量向量及其对应的标签利用LDA算法映射至LDA的三维空间下,将该空间下的每次测量数据对应的三维向量作为气体传感器阵列该次测量的频域特征利用LDA降维的向量,所有测量的特征降维后的向量和标签组合在一起作为训练集,并且在进行LDA算法时会生成20*n维向量向LDA的三维空间映射的矩阵;
步骤8、将以上得到的所有降维向量及标签数据输入SVM(支持向量机)分类器进行分类器的模型建立;
步骤9、当识别未知气体的数据时经过步骤1至5得到该气体的频域中20*n向量,然后将该向量与步骤7中的映射矩阵相乘得到该数据在LDA的三维空间下的向量;
步骤10、将步骤9得到的三维向量输入至步骤8建立的分类器模型中进行该次测量的气体种类的预测。
2.根据权利要求1所述的一种基于频域特征提取的快速气体识别算法,其特征在于,步骤4所述去掉0Hz位置的数据相当于对截取出的数据进行了去0频滤波,考虑到反应初的响应值会受到传感器漂移的影响,去0频将在一定程度上减少传感器漂移的影响。
CN201710203312.6A 2017-03-30 2017-03-30 一种基于频域特征提取的快速气体识别算法 Active CN107132311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710203312.6A CN107132311B (zh) 2017-03-30 2017-03-30 一种基于频域特征提取的快速气体识别算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710203312.6A CN107132311B (zh) 2017-03-30 2017-03-30 一种基于频域特征提取的快速气体识别算法

Publications (2)

Publication Number Publication Date
CN107132311A true CN107132311A (zh) 2017-09-05
CN107132311B CN107132311B (zh) 2019-06-14

Family

ID=59714930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710203312.6A Active CN107132311B (zh) 2017-03-30 2017-03-30 一种基于频域特征提取的快速气体识别算法

Country Status (1)

Country Link
CN (1) CN107132311B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036482A (zh) * 2020-08-31 2020-12-04 重庆大学 一种基于电子鼻传感器数据的中药材分类方法
CN112464999A (zh) * 2020-11-19 2021-03-09 深圳大学 一种混合气体种类与浓度识别方法、装置及存储介质
CN112580741A (zh) * 2020-12-28 2021-03-30 天津同阳科技发展有限公司 一种基于多传感器快速学习的气体种类识别方法及系统
CN112819158A (zh) * 2021-02-05 2021-05-18 凌坤(南通)智能科技有限公司 一种基于优化的bp神经网络的气体辨识方法
CN114460226A (zh) * 2022-01-10 2022-05-10 上海工程技术大学 一种场景气体记忆和识别的方法及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105891422A (zh) * 2016-04-08 2016-08-24 重庆大学 基于源域迁移极限学习漂移补偿的电子鼻气体识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105891422A (zh) * 2016-04-08 2016-08-24 重庆大学 基于源域迁移极限学习漂移补偿的电子鼻气体识别方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036482A (zh) * 2020-08-31 2020-12-04 重庆大学 一种基于电子鼻传感器数据的中药材分类方法
CN112036482B (zh) * 2020-08-31 2023-10-24 重庆大学 一种基于电子鼻传感器数据的中药材分类方法
CN112464999A (zh) * 2020-11-19 2021-03-09 深圳大学 一种混合气体种类与浓度识别方法、装置及存储介质
CN112580741A (zh) * 2020-12-28 2021-03-30 天津同阳科技发展有限公司 一种基于多传感器快速学习的气体种类识别方法及系统
CN112819158A (zh) * 2021-02-05 2021-05-18 凌坤(南通)智能科技有限公司 一种基于优化的bp神经网络的气体辨识方法
CN112819158B (zh) * 2021-02-05 2024-02-27 凌坤(南通)智能科技有限公司 一种基于优化的bp神经网络的气体辨识方法
CN114460226A (zh) * 2022-01-10 2022-05-10 上海工程技术大学 一种场景气体记忆和识别的方法及其应用
CN114460226B (zh) * 2022-01-10 2024-02-06 上海工程技术大学 一种场景气体记忆和识别的方法及其应用

Also Published As

Publication number Publication date
CN107132311B (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
CN107132311A (zh) 一种基于频域特征提取的快速气体识别算法
CN110309867B (zh) 一种基于卷积神经网络的混合气体识别方法
CN103134850A (zh) 一种基于特征香气的茶叶品质快速检测装置及检测方法
CN109655532A (zh) 一种对卷烟分类鉴别的方法
CN104820873A (zh) 一种基于金属定量构效关系的淡水急性基准预测方法
CN104866871B (zh) 基于投影结构稀疏编码的高光谱图像分类方法
CN102944583A (zh) 基于漂移补偿的金属氧化物气体传感器阵列浓度检测方法
CN103293141A (zh) 基于离子迁移谱/质谱/拉曼光谱融合技术的白酒年份识别方法
CN105136736A (zh) 在线近红外样本量确定方法
CN108875118B (zh) 一种高炉铁水硅含量预测模型准确度评价方法和设备
CN106709506A (zh) 一种中草药种类及不同产地的识别分类方法
CN105334504A (zh) 基于大边界的非线性判别投影模型的雷达目标识别方法
CN108520249A (zh) 一种细胞分类器的构建方法、装置及系统
CN105954412A (zh) 用于山核桃新鲜度检测的传感器阵列优化方法
CN106419911A (zh) 一种基于脑电波分析的情绪检测方法
CN106295708A (zh) 一种基于Fisher分类器组的连续型数据预处理方法
US9400868B2 (en) Method computer program and system to analyze mass spectra
CN107121530B (zh) 一种局部和全局特征相结合的电子鼻响应谱特征提取方法
CN111444833B (zh) 果实测产方法、装置、计算机设备及存储介质
CN109840386B (zh) 基于因子分析的损伤识别方法
CN102507815A (zh) 一种色谱指纹谱图的相似度测定方法
CN107894837A (zh) 动态情感分析模型样本处理方法及装置
CN104715263B (zh) 一种基于哈尔特征和特征脸识别的人脸识别方法
CN113933334B (zh) 一种基于特征选择和机器学习算法的洋槐蜜真伪鉴别方法
CN113143275B (zh) 一种样本与特征质量联合量化评估的脑电疲劳检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant