CN113723442A - 一种电子鼻气体识别方法、系统、电子设备及存储介质 - Google Patents

一种电子鼻气体识别方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN113723442A
CN113723442A CN202110772874.9A CN202110772874A CN113723442A CN 113723442 A CN113723442 A CN 113723442A CN 202110772874 A CN202110772874 A CN 202110772874A CN 113723442 A CN113723442 A CN 113723442A
Authority
CN
China
Prior art keywords
sequence data
gas
data
time
time sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110772874.9A
Other languages
English (en)
Other versions
CN113723442B (zh
Inventor
邹复好
李开
甘早斌
顾瑞洁
向文
卢萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202110772874.9A priority Critical patent/CN113723442B/zh
Publication of CN113723442A publication Critical patent/CN113723442A/zh
Application granted granted Critical
Publication of CN113723442B publication Critical patent/CN113723442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/20Air quality improvement or preservation, e.g. vehicle emission control or emission reduction by using catalytic converters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Fuzzy Systems (AREA)
  • Quality & Reliability (AREA)
  • Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)

Abstract

本发明提供一种电子鼻气体识别方法、系统、电子设备及存储介质,方法包括:基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;对待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;将多组尺度不同的时间子序列数据输入预设气体识别网络,获取预设气体识别网络输出的待识别气体的类别。本发明对电子鼻气体识别问题进行了深入研究,通过数据变换方法得到多个分支提取不同频率和时间尺度的特征,可得到更加丰富的特征信息,结合分类器得到待测气体的种类标签,可实现高效、快速的气体识别。

Description

一种电子鼻气体识别方法、系统、电子设备及存储介质
技术领域
本发明涉及人工嗅觉领域,更具体地,涉及一种电子鼻气体识别方法、系统、电子设备及存储介质。
背景技术
电子鼻系统是一种参考动物或人类的嗅觉感知机制来实现对所检测气体定性定量分析的系统。随着社会的大力发展,工业领域迅速壮大,电子鼻技术也得到了快速的发展,可对气体进行快速准确的检测,在社会的多个领域包括工业污染监测、食品安全、医疗领域等方面发挥重要作用。系统通过传感器吸附气体分子产生电信号,使用AD转换电路对电信号进行量化采集完成特征的提取,最终完成气体的类别识别以及浓度判定。
现有的人工嗅觉技术主要为机器嗅觉。机器嗅觉通常包括特征提取、分类识别两个步骤。其中特征提取可先通过例如小波滤波、卡尔曼滤波等一些滤波方法对数据进行滤波,目的是去除信号数据中环境因素和传感器漂移等因素造成的噪声干扰,可使得数据更加规范化。同时由于时间序列信号数据的特殊性,往往具有很高的维度特征,可以通过例如主成分分析等特征选择的方法对数据进行降维,避免糟糕的维度攻击,降低计算难度。最后,使用回归分类的方法完成分类识别,例如支持向量机、KNN、决策树和遗传算法等机器学习算法,实现不同种类气体的识别分类。
虽然机器嗅觉方法较为成熟,但同时也面临着一些问题。随着传感器行业技术的飞速发展,市面上的传感器种类与功能层出不穷,各种传感器的参数也大不相同,由于气体传感器的特殊性,气体传感器数据的收集较为困难,数据量小;同时,大量种类繁多的气体传感器进行数据收集,通常采用传感器阵列的形式,这将造成多种传感器阵列数据具有不同形式的量纲单位。在实际的气体检测方法中,由于传感器数据通常表现为时间序列信号,需要人为的根据信号波形设计特征,难度较大且通用性较差。
以往的结合深度学习和电子鼻气体识别的算法也常使用二维卷积作为模式识别方法,将气体检测时长和传感器个数作为气体信号的两种维度,进行卷积等操作。这种方法存在两方面弊端:第一,此时的气体信号数据虽然是二维的,但由于气体信号数据本质上属于多维时间序列信号,两个维度的具体含义并不相关,一个是时间特征,另一个是多通道传感器特征,采用二维卷积略为牵强;第二,相比较于一维卷积,二维卷积的时间复杂度和空间复杂度更高,需要更强的计算能力和大量的存储空间。
发明内容
本发明针对现有技术中存在的技术问题,提供一种电子鼻气体识别方法、系统、电子设备及存储介质。
根据本发明的第一方面,提供了一种电子鼻气体识别方法,包括:基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;对所述待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;将多组尺度不同的时间子序列数据输入预设气体识别网络,获取所述预设气体识别网络输出的待识别气体的类别;其中,所述预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来。
在上述技术方案的基础上,本发明还可以作出如下改进。
可选的,所述预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来,包括:基于气体传感器阵列采集多种类别的气体的多通道一维时间序列数据;将任一类别气体的多通道一维时间序列数据进行数据增强,获得对应的多通道的多个时间子序列数据;对多个通道的对应时间子序列数据进行拼接,获得多个第一时间子序列数据;对多个第一时间子序列数据进行数据变换,获得多个第二时间子序列数据;基于多种类别气体的多个第二时间子序列数据以对应的气体类别标签,对气体识别网络进行训练,获得训练后的预设气体识别网络;其中,所述第一时间子序列数据和所述第二时间子序列数据的尺度不同。
可选的,所述将任一类别气体的多通道一维时间序列数据进行数据增强,获得对应的多通道的多个时间子序列数据,包括:对于每一个通道的原始一维时间序列数据T={t1,t2,……,tn},采用对时间序列数据进行窗口切片方式,生成多个时间子序列数据为:Si:j={ti,ti+1,…,tj},1≤i,j≤n;其中,i和j代表窗口切片起始点和结束点,对于正整数
Figure BDA0003154508100000031
生成n-s+1个时间子序列数据:Slicing(T,s)={S1:S,S2:S+1,…,Sn-s+1:n};对多个通道的相对应的时间子序列数据进行拼接,获得每一类别的气体对应的多个第一时间子序列数据。
可选的,所述对多个第一时间子序列数据进行数据变换,获得多个第二时间子序列数据,包括:通过不同的采样率对任一个第一时间子序列数据进行下采样,得到下采样后的多个第三时间子序列数据;对每一个第三时间子序列数据,基于窗口移动平均值的方式进行平滑滤波,获得多个第二时间子序列数据。
可选的,所述预设气体识别网络包括残差收缩网络、全局特征提取网络和分类器;所述残差收缩网络,用于提取每一个第二时间子序列数据的多个分支特征;所述全局特征提取网络,用于将多个分支特征进行拼接,获得拼接特征;所述分类器,用于根据拼接特征,识别出对应的气体类别。
可选的,所述残差收缩网络包括一维卷积层、残差收缩模块和最大池化层;所述一维卷积层包括两个一维卷积,卷积核大小分别为8和5,卷积步长大小均为2;所述卷积收缩模块包括两层卷积层、多个残差收缩子单元和一个最大池化层,每一个残差收缩子单元包括两个整流线性单元激活函数、两个卷积层、恒等映射以及软阈值化子网络;其中,可通过所述残差收缩网络的自适应学习获得一维卷积层、残差收缩模块和最大池化层的权重。
根据本发明的第二方面,提供一种电子鼻气体识别系统,包括:采集模块,用于基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;处理模块,用于对所述待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;获取模块,用于将多组尺度不同的时间子序列数据输入预设气体识别网络,获取所述预设气体识别网络输出的待识别气体的类别;其中,所述预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来。
根据本发明的第三方面,提供了一种电子设备,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现电子鼻气体识别方法的步骤。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现电子鼻气体识别方法的步骤。
本发明提供的一种电子鼻气体识别方法、系统、电子设备及存储介质,基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;对待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;将多组尺度不同的时间子序列数据输入预设气体识别网络,获取预设气体识别网络输出的待识别气体的类别。本发明对电子鼻气体识别问题进行了深入研究,通过数据变换方法得到多个分支提取不同频率和时间尺度的特征,可得到更加丰富的特征信息,结合分类器得到待测气体的种类标签,可实现高效、快速的气体识别。
附图说明
图1为本发明提供的一种电子鼻气体识别方法流程图;
图2为气体识别网络的整个训练过程示意图;
图3为本发明提供的一种电子鼻气体识别系统的结构示意图;
图4为本发明提供的一种可能的电子设备的硬件结构示意图;
图5为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
图1为本发明提供的一种电子鼻气体识别方法流程图,如图1所示,方法包括:101、基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;102、对待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;103、将多组尺度不同的时间子序列数据输入预设气体识别网络,获取所述预设气体识别网络输出的待识别气体的类别;其中,所述预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来。
可以理解的是,基于背景技术中的缺陷,本发明实施例提出了一种电子鼻气体识别方法,以实现对气体类别进行识别,也就是识别气体属于哪种气体。
具体的,使用气体传感器阵列组成信号数据采集模块,对待识别气体进行多通道测量,获得待识别气体的多通道一维时间序列数据。由于待识别气体的多通道一维时间序列数据的时间尺寸单一,因此,对待识别气体的多通道一维时间序列数据进行数据增强和数据变换,产生多组时间尺度不同的时间子序列数据。通过对原始的一维时间序列数据进行数据增强和数据变换,可以扩充原始时间序列数据的数据量,提高后续的对气体的识别精度。
将经过数据增强和数据变换后的待识别气体的多组时间尺度不同的时间子序列数据输入到预设气体识别网络,获取由预设气体识别网络输出的待识别气体的类别。
本发明对电子鼻气体识别问题进行了深入研究,通过数据变换方法得到多个分支提取不同频率和时间尺度的特征,可得到更加丰富的特征信息,结合分类器得到待测气体的类别标签,可实现高效、快速的气体识别。
在一种可能的实施例方式中,预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来,包括:基于气体传感器阵列采集多种类别的气体的多通道一维时间序列数据;将任一类别气体的多通道一维时间序列数据进行数据增强,获得对应的多通道的多个时间子序列数据;对多个通道的对应时间子序列数据进行拼接,获得多个第一时间子序列数据;对多个第一时间子序列数据进行数据变换,获得多个第二时间子序列数据;基于多种类别气体的多个第二时间子序列数据以对应的气体类别标签,对气体识别网络进行训练,获得训练后的预设气体识别网络;其中,所述第一时间子序列数据和所述第二时间子序列数据的尺度不同。
可以理解的是,在对预设气体识别网络进行训练时,通过气体传感器阵列收集多种不同类别气体的时间序列数据,具体来说,对于每一种气体,均通过气体传感器阵列来收集该种气体的多通道一维时间序列数据。基于收集的多种不同类别气体的多通道一维时间序列数据对气体识别网络进行训练。由于原始的多通道一维时间序列数据的时间尺度单一,为了增加训练数据的时间尺度,同时也为了扩充原始时间序列数据的数据量,本发明实施例对每一类别气体对应的多通道时间序列数据进行数据增强,每一通道均产生多个时间子序列数据。然后对多个通道对应的时间子序列数据进行拼接,并对拼接后的时间子序列数据进行数据变换,进而得到每一种气体的多个第二时间子序列数据。
在对气体识别网络进行训练时,每一个第二时间子序列数据作为独立样本,并标记每一个第二时间子序列数据对应的气体类别标签,基于每一个第二时间子序列及对应的气体类别标签,对气体识别网络进行训练,获得训练后的预设气体识别网络。
在一种可能的实施例方式中,将任一类别气体的多通道一维时间序列数据进行数据增强,获得对应的多通道的多个时间子序列数据,包括:对于每一个通道的原始一维时间序列数据T={t1,t2,……,tn},采用对时间序列数据进行窗口切片方式,生成多个时间子序列数据为:Si:j={ti,ti+1,…,tj},1≤i,j≤n;其中,i和j代表窗口切片起始点和结束点,对于正整数
Figure BDA0003154508100000081
生成n-s+1个时间子序列数据:Slicing(T,s)={S1:S,S2:S+1,…,Sn-s+1:n};对多个通道的相对应的时间子序列数据进行拼接,获得每一类别的气体对应的多个第一时间子序列数据。
可以理解的是,通过窗口切片的方式对每一类别气体的多通道一维时间序列数据进行数据增强,设置窗口长度,通过窗口滑动的方式生成多个时间子序列数据。对每一个通道的一维时间序列数据均采用相同的方式进行数据切片,对于每一个通道,均可得到多个时间自序列数据。
对多个通道的对应的时间子序列数据进行拼接,获得每一类别的气体对应的多个第一时间子序列数据。比如,每一个类别气体具有6个通道的数据,每一个通道经过数据切片后,产生5个时间子序列数据,将6个通道的第一个时间子序列数据进行拼接,得到拼接后的第一个第一时间子序列数据;将6个通道的第二个时间子序列数据进行拼接,得到拼接后的第二个第一时间子序列数据;以此类推,对于每一类别的气体,可得到5个第二时间子序列数据。
需要说明的是,生成的所有时间子序列与原始的时间序列T共享相同的气体类别标签。在训练时,所有的窗口切片都可视为独立的训练样本数据。选取时间序列中合适的区间范围进行窗口切片,既要保证范围内有足够气体类别信息,又要避免在转换时带来大量冗余的计算量。
在一种可能的实施例方式中,对多个第一时间子序列数据进行数据变换,获得多个第二时间子序列数据,包括:通过不同的采样率对任一个第一时间子序列数据进行下采样,得到下采样后的多个第三时间子序列数据;对每一个第三时间子序列数据,基于窗口移动平均值的方式进行平滑滤波,获得多个第二时间子序列数据。
可以理解的是,对原始时间序列数据进行数据增强处理后,对多个第一时间子序列数据进行数据变换,主要是通过下采样和滑动平均的方式对多个第一时间子序列数据进行数据变换。
具体的,数据变换主要包括以下步骤:
第一时间子序列数据表示为T′={t1,t2,……,tm},每间隔一定的时间对第一时间子序列数据进行随机抽样,通过不同的采样率,获取不同的时间尺度。设采样率为k,即每隔k个点保留时间序列数据的原始数据取值,采样公式为T″′={t1+k*i},0≤i≤[(m-1)/k]。使用窗口移动平均值
Figure BDA0003154508100000091
来代替部分序列数据,网络使用多个不同窗口大小的滤波器对数据进行平滑滤波,得到多个不同的新数据序列(第二时间子序列数据),输出为
Figure BDA0003154508100000092
需要说明的是,对于每一个第一时间子序列数据,通过不同的采样率进行下采样和滑动平均操作,可得到各种不同时间尺度的第二时间子序列数据,相比单一尺度的时间序列数据,数据特征更加丰富。
在一种可能的实施例方式中,预设气体识别网络包括残差收缩网络、全局特征提取网络和分类器。其中,残差收缩网络,用于提取每一个第二时间子序列数据的多个分支特征;全局特征提取网络,用于将多个分支特征进行拼接,获得拼接特征;分类器,用于根据拼接特征,识别出对应的气体类别。
其中,残差收缩网络包括一维卷积层、残差收缩模块和最大池化层。(1)一维卷积层包括两个一维卷积,卷积核大小分别为8和5,卷积步长大小均为2。(2)卷积收缩模块包括两层卷积层、多个残差收缩子单元和一个最大池化层,每一个残差收缩子单元包括两个整流线性单元激活函数(ReLU)、两个卷积层、恒等映射以及软阈值化子网络。其中软阈值化子网络,通过将前一层的特征图的绝对值的平均值×系数α得到所设置的阈值向量,每个通道对应着一个阈值,为一个数值合适的正数,可使得输出有正有负,不全为零。同时卷积网络的训练可使得网络自适应地设置合适的阈值,实现去除信号数据中的冗余信息的效果。(3)最大池化层:将最大池化层MaxPooling放在网络末端,减少提取特征的大小以及下层的参数数量,同时可避免过拟合以提高训练模型的效率,使得网络具有更好的鲁棒性。其中每个分支的最大池化值不尽相同,网络结构中引入池化因子参数,指定池化操作完成后特征向量的具体长度,通过用池化操作前的特征长度除以池化因子参数,从而得到池化操作的参数数值,用p来表示。当卷积操作完成时输出的时间序列的长度为n时,由最大池化操作后的长度为p,可得出所需要的池化层大小为n/p。
对于全局特征提取网络,主要是将残差收缩特征提取网络输出的多个分支特征进行拼接,通过全局平均池化层、dropout层和最后的softmax层进行全局特征提取。将提取的全局特征输入到分类器中,分类器输出第二时间子序列数据对应的类别,即对应的气体类别。
对气体识别网络进行训练的整个过程可参见图2,如图2所示,首先,基于气体传感器阵列收集已知类别的多种气体的多通道一维时间序列数据,对收集的时间序列数据进行数据增强和数据变换,基于单一时间尺度的时间序列数据,生成不同时间尺度的多组时间子序列数据。基于不同时间尺度的多组时间子序列数据及其对应的气体类别标签,对气体识别网络进行训练,其中,气体识别网络主要包括残差收缩网络、全局特征提取网络和分类器。由气体识别网络输出时间序列数据对应的气体类别(称为预测标签),将预测标签和实际标签进行对比,得到损失函数,基于损失函数对气体识别网络的各参数进行优化,比如,对残差收缩网络、全局特征提取网络和分类器的权重进行优化。
图3为本发明实施例提供的一种电子鼻气体识别系统结构图,如图3所示,一种电子鼻气体识别系统,包括采集模块301、处理模块302和获取模块303,其中:
采集模块301,用于基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;处理模块302,用于对所述待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;获取模块303,用于将多组尺度不同的时间子序列数据输入预设气体识别网络,获取所述预设气体识别网络输出的待识别气体的类别;其中,预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来。
可以理解的是,本发明提供的一种电子鼻气体识别系统与前述各实施例提供的电子鼻气体识别方法相对应,电子鼻气体识别系统的相关技术特征可参考电子鼻气体识别方法的相关技术特征,在此不再赘述。
请参阅图4,图4为本发明实施例提供的电子设备的实施例示意图。如图4所示,本发明实施例提了一种电子设备400,包括存储器410、处理器420及存储在存储器410上并可在处理器420上运行的计算机程序411,处理器420执行计算机程序411时实现以下步骤:基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;对待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;将多组尺度不同的时间子序列数据输入预设气体识别网络,获取所述预设气体识别网络输出的待识别气体的类别;其中,预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来。
请参阅图5,图5为本发明提供的一种计算机可读存储介质的实施例示意图。如图5所示,本实施例提供了一种计算机可读存储介质500,其上存储有计算机程序511,该计算机程序511被处理器执行时实现如下步骤:基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;对待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;将多组尺度不同的时间子序列数据输入预设气体识别网络,获取所述预设气体识别网络输出的待识别气体的类别;其中,所述预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来。
本发明实施例提供的一种电子鼻气体识别方法、系统、电子设备及存储介质,主要具有以下有益效果:
(1)使用深度学习中的卷积神经网络利用其自动学习深层次样本特征的优势,对电子鼻气体识别问题进行了深入研究,通过数据增强和数据变换方法得到多个分支提取不同频率和时间尺度的特征,可得到更加丰富的特征信息,结合分类器得到待测气体的种类标签,可实现高效、快速的气体识别;
(2)在一维卷积网络中加入残差收缩模块的残差收缩特征提取网络,可通过恒等映射直接进行网络的反向传播,同时也可由软阈值化部分为每个通道自动学习一个阈值,给不同的通道分配不同的权重,去除信号数据中的冗余信息。
(3)使用数据增强技术和数据裁剪等方法,将气体传感器阵列采集到的原始气体数据进行数据预处理,既扩增了有效的响应阶段数据,也避免了多余的冗余信息。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (9)

1.一种电子鼻气体识别方法,其特征在于,包括:
基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;
对所述待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;
将多组尺度不同的时间子序列数据输入预设气体识别网络,获取所述预设气体识别网络输出的待识别气体的类别;
其中,所述预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来。
2.根据权利要求1所述的电子鼻气体识别方法,其特征在于,所述预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来,包括:
基于气体传感器阵列采集多种类别气体的多通道一维时间序列数据;
将任一类别气体的多通道一维时间序列数据进行数据增强,获得对应的多通道的多个时间子序列数据;
对多个通道的对应时间子序列数据进行拼接,获得所述任一类别气体的多个第一时间子序列数据;
对多个第一时间子序列数据进行数据变换,获得多个第二时间子序列数据;
基于多种类别气体的多个第二时间子序列数据以及对应的气体类别标签,对气体识别网络进行训练,获得训练后的预设气体识别网络;
其中,所述第一时间子序列数据和所述第二时间子序列数据的尺度不同。
3.根据权利要求2所述的电子鼻气体识别方法,其特征在于,所述将任一类别气体的多通道一维时间序列数据进行数据增强,获得对应的多通道的多个时间子序列数据,包括:
对于每一个通道的原始一维时间序列数据T={t1,t2,……,tn},采用对时间序列数据进行窗口切片方式,生成多个时间子序列数据为:Si:j=ti,ti+1,…,tj},1≤i,j≤n;其中,i和j代表窗口切片起始点和结束点,对于正整数
Figure FDA0003154508090000021
生成n-s+1个时间子序列数据:Slicing(T,s)={S1:,S2:+1,…,Sn-s+1:n};
对多个通道的相对应的时间子序列数据进行拼接,获得每一类别气体对应的多个第一时间子序列数据。
4.根据权利要求2或3所述的电子鼻气体识别方法,其特征在于,所述对多个第一时间子序列数据进行数据变换,获得多个第二时间子序列数据,包括:
通过不同的采样率对任一个第一时间子序列数据进行下采样,得到下采样后的多个第三时间子序列数据;
对每一个第三时间子序列数据,基于窗口移动平均值的方式进行平滑滤波,获得多个第二时间子序列数据。
5.根据权利要求4所述的电子鼻气体识别方法,其特征在于,所述预设气体识别网络包括残差收缩网络、全局特征提取网络和分类器;
所述残差收缩网络,用于提取每一个第二时间子序列数据的多个分支特征;
所述全局特征提取网络,用于将多个分支特征进行拼接,获得拼接特征;
所述分类器,用于根据拼接特征,识别出对应的气体类别。
6.根据权利要求5所述的电子鼻气体识别方法,其特征在于,所述残差收缩网络包括一维卷积层、残差收缩模块和最大池化层;
所述一维卷积层包括两个一维卷积,卷积核大小分别为8和5,卷积步长大小均为2;
所述卷积收缩模块包括两层卷积层、多个残差收缩子单元和一个最大池化层,每一个残差收缩子单元包括两个整流线性单元激活函数、两个卷积层、恒等映射以及软阈值化子网络;
其中,可通过所述残差收缩网络的自适应学习获得一维卷积层、残差收缩模块和最大池化层的权重。
7.一种电子鼻气体识别系统,其特征在于,包括:
采集模块,用于基于气体传感器阵列采集待识别气体的多通道一维时间序列数据;
处理模块,用于对所述待识别气体的多通道一维时间序列数据进行数据增强和数据变换,基于单一尺度的时间序列数据,生成多组尺度不同的时间子序列数据;
获取模块,用于将多组尺度不同的时间子序列数据输入预设气体识别网络,获取所述预设气体识别网络输出的待识别气体的类别;
其中,所述预设气体识别网路为基于不同类别气体的多通道一维时间序列数据以及对应的类别标签训练而来。
8.一种电子设备,其特征在于,包括存储器、处理器,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1-6任一项所述的电子鼻气体识别方法的步骤。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机管理类程序,所述计算机管理类程序被处理器执行时实现如权利要求1-6任一项所述的电子鼻气体识别方法的步骤。
CN202110772874.9A 2021-07-08 2021-07-08 一种电子鼻气体识别方法、系统、电子设备及存储介质 Active CN113723442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110772874.9A CN113723442B (zh) 2021-07-08 2021-07-08 一种电子鼻气体识别方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110772874.9A CN113723442B (zh) 2021-07-08 2021-07-08 一种电子鼻气体识别方法、系统、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113723442A true CN113723442A (zh) 2021-11-30
CN113723442B CN113723442B (zh) 2024-02-20

Family

ID=78673141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110772874.9A Active CN113723442B (zh) 2021-07-08 2021-07-08 一种电子鼻气体识别方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113723442B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114113491A (zh) * 2021-12-10 2022-03-01 中国科学技术大学 一种利用卷积神经网络计算的集成式机器嗅觉芯片

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830295A (zh) * 2018-05-10 2018-11-16 华南理工大学 基于多时间尺度回声状态网络的多变量时间序列分类方法
CN111259782A (zh) * 2020-01-14 2020-06-09 北京大学 基于混合多尺度时序可分离卷积操作的视频行为识别方法
CN111443165A (zh) * 2020-03-27 2020-07-24 华中科技大学 一种基于气体传感器与深度学习的气味识别方法
US20210117729A1 (en) * 2018-03-16 2021-04-22 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Using machine learning and/or neural networks to validate stem cells and their derivatives (2-d cells and 3-d tissues) for use in cell therapy and tissue engineered products

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210117729A1 (en) * 2018-03-16 2021-04-22 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Using machine learning and/or neural networks to validate stem cells and their derivatives (2-d cells and 3-d tissues) for use in cell therapy and tissue engineered products
CN108830295A (zh) * 2018-05-10 2018-11-16 华南理工大学 基于多时间尺度回声状态网络的多变量时间序列分类方法
CN111259782A (zh) * 2020-01-14 2020-06-09 北京大学 基于混合多尺度时序可分离卷积操作的视频行为识别方法
CN111443165A (zh) * 2020-03-27 2020-07-24 华中科技大学 一种基于气体传感器与深度学习的气味识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114113491A (zh) * 2021-12-10 2022-03-01 中国科学技术大学 一种利用卷积神经网络计算的集成式机器嗅觉芯片
CN114113491B (zh) * 2021-12-10 2023-03-07 中国科学技术大学 一种利用卷积神经网络计算的集成式机器嗅觉芯片

Also Published As

Publication number Publication date
CN113723442B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
CN112067294A (zh) 基于深度学习的滚动轴承智能故障诊断方法
CN111898639B (zh) 基于降维的分层时间记忆工业异常检测方法与装置
CN111134664B (zh) 一种基于胶囊网络的癫痫放电识别方法、系统和存储介质
CN112733904B (zh) 一种水质异常检测方法及电子设备
CN112101547B (zh) 一种对网络模型的剪枝方法、装置、电子设备及存储介质
JP2010257140A (ja) 情報処理装置及び情報処理方法
CN111401339A (zh) 识别人脸图像中的人的年龄的方法、装置及电子设备
CN116340746A (zh) 一种基于随机森林改进的特征选择方法
CN113723442B (zh) 一种电子鼻气体识别方法、系统、电子设备及存储介质
CN113887342A (zh) 基于多源信号和深度学习的设备故障诊断方法
CN115830436A (zh) 一种基于深度学习的海洋生物智能检测方法
CN113838524B (zh) S-亚硝基化位点预测方法、模型训练方法及存储介质
CN113369993B (zh) 一种小样本下刀具磨损状态监测方法
CN117649621A (zh) 一种伪造视频检测方法、装置及设备
CN117607120A (zh) 基于改进型ResNext模型的食品添加剂拉曼光谱检测方法和装置
CN117216522A (zh) 一种基于机器学习的轴承故障类别诊断方法、装置及设备
CN110443276A (zh) 基于深度卷积网络与灰度递归图分析的时间序列分类方法
CN114898775B (zh) 一种基于跨层交叉融合的语音情绪识别方法及系统
CN113469053B (zh) 眼动轨迹鉴别方法及系统
CN113192076B (zh) 联合分类预测和多尺度特征提取的mri脑肿瘤图像分割方法
CN113420733B (zh) 一种高效分布式大数据数据采集实现方法及系统
Moummad et al. Pretraining representations for bioacoustic few-shot detection using supervised contrastive learning
CN112735442B (zh) 一种具有音频分离声纹识别的湿地生态监测系统及其音频分离方法
CN113768520A (zh) 一种脑电检测模型的训练方法及装置
CN113907710A (zh) 基于模型无关的图像增强元学习的皮肤病变分类系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant