一种气敏-气相色谱信息融合和电子鼻仪器在线分析方法
技术领域
本发明—气敏传感器阵列—毛细管气相色谱柱相融合的电子鼻仪器在线分析方法,面向以气味长期动态变化为特征的生物发酵、环境恶臭污染等过程的自动连续在线检测与分析需求,涉及人工智能、计算机、环境保护、生物工程、分析化学等技术领域,主要解决气敏传感器阵列灵敏度不够问题、单一感知信息提取方式导致气敏传感器阵列选择性差问题、峰峰完全分离分析方式导致色谱法在线性差问题、气敏与气相色谱多感知信息选择与融合问题、和电子鼻仪器长期循环在线分析问题。
背景技术
长期嗅闻恶臭气味会对身体产生严重伤害,靠人工嗅闻尾气以分析生物发酵过程是不现实的,这些做法与人们追求美好生活的愿望和所处的人工智能时代格格不入。不仅如此,靠嗅闻量化确定臭气浓度、食品与香料香精气味强度等指标的做法因为过程十分繁琐、成本高、客观公正性差、可操作性差而倍受诟病。复杂气味在线检测及其多种组成成分同时在线量化预测既是复杂的理论问题,更是迫切需要解决的技术与应用问题。
电子鼻技术一个主要发展趋势是,以多个具有必要灵敏度的气敏器件组成阵列,着重利用大数据和人工智能技术实现复杂气味的定性定量分析能力,包括气(嗅)味类型识别和强度与主要成分浓度量化预测。电子鼻仪器对生物发酵过程、环境恶臭污染监测等应用对象主要采取“长期连续在线检测与分析”工作方式,其特点是,一个气体进样单周期只感知和分析其中一个生物发酵过程(发酵罐)或一个恶臭污染点;对多个发酵罐或恶臭观测点的气体进样、感知与分析操作周而复始循环进行,昼夜不停,整个过程持续时间往往达数天、数周、数月乃至数年。我们认为,电子鼻仪器的气体进样单周期亦即电子鼻仪器检测与分析单周期不宜超过T0=10min,对多个发酵罐或多个恶臭监测点的气体进样、在线检测与分析循环周期T不宜超过1小时,据此判断一种检测与分析方法是否“在线”是比较合理的。
大量实验指出,以SnO2材料为代表的金属氧化物半导体(metal oxide semi-conductor,MOS)气敏传感器对有些气味响应速度很快,例如对乙醇挥发气只需2s即可;而对另一些气味则响应速度很慢,甚至达60s或更长,例如对GB/T14675指定的一种标准臭液—γ-十一碳(烷)酸内酯C11H20O2挥发气感知就是如此。这一现象告诉我们,尽管同一气敏传感器对两种气味的响应曲线稳态最大值可能相同,但出峰时间与曲线下面积可能不同;或者曲线下面积可能相同,但稳态最大值与出峰时间可能不同,等等。总之,气敏传感器响应曲线形状与气味组成有关,涉及分子量、碳数、极性、官能团诸多因素。
三角形稳定性是指三条边(直线)首尾相接,形成稳定结构,具有受力不变形的特点。平行四边形受力易变形,是不稳定的;类似地,边数大于3的多边形都是不稳定的。三角形稳定性原理给我们的启发是,仅知道其中两个参数(2条边长、2个夹角、1条边长与1个夹角共三种情况)是无法确定一个三角形结构的;无须赘言,只知道一个参数(1条边长、1个夹角共两种情况)更是不行。
单一型气敏传感器阵列选择性较差,重叠感知范围有限,灵敏度亦不够,不满足生物发酵、恶臭污染等对象的在线检测要求。因此,气相色谱(gas-chromatography,GC)法引起了人们的高度关注。色谱法的优点是灵敏度高、选择性较好,缺点是分离时间即检测周期长,仪器结构复杂,工作条件苛刻,现有用法根本不适用于气味在线检测。必须指出,“GC柱选择性较好,MOS气敏传感器选择性较差”这种差别只是相对的,气相色谱法对未知样品的“定性能力”仍然是“弱”的。在无内/外标样品谱图的情况下,仅凭一次测量的谱图根本无法确定未知样品的成分与组成。气相色谱法缺陷之二是,色谱柱“选择能力”没有普遍性。只有在特定条件下,特定色谱柱才对特定样品敏感,即特定色谱柱只能检测特定范围的特定样品。当进样条件、测试条件、色谱柱自身参数其中之一变化时,特定样品的色谱感知参数随之变化。
气相色谱法缺陷之三是,实现多组分色谱峰“完全分离”是困难的,乃至于不可能的。组分越多,组分间极性越相近,保留时间越相近,峰峰完全分离就越困难。我们认为,色谱图多组分谱峰完全分离是相对的、很少的;反之,多组分色谱峰不完全分离是绝对的、普遍的。从操作参数角度上讲,提高色谱分离度和缩短保留时间二者有时是互相矛盾的。
实验指出,气味组成成分分子量均小于300Dalton,GB14554指定的8种恶臭化合物的色谱保留时间大多小于8min。气味的这些特性有利于毛细管气相色谱法的在线检测与分析。为提高气相色谱法的检测速度,我们可选择较大内径的毛细管柱。这样一来,在指定检测与分析周期内,我们得到的是一幅有限时长T0≤10min的半分离多峰图。顾名思义,“半分离色谱图”或“未完全分离色谱图”是指在指定时间区间,峰峰之间未能实现完全分离的色谱图。这种半分离/未完全分离现象是由被测气体成分、色谱柱自身特性、色谱仪工作参数设置、检测器性能、记录仪记录时间诸多因素共同作用的结果。色谱峰峰之间未完全或半分离是普遍现象,完全分离只是理想或极限情况。被测对象组分越多,峰峰完全分离就越困难,且以检测时间长为代价。
开赛一段时间的马拉松比赛,尽管冠亚军未产生,但胜负趋势已分,冠亚军就在“跑在比赛队伍前面的团队”中。这是气相色谱法利用半分离色谱图进行在线检测与分析的生物学依据。半分离色谱图是全分离色谱图的一部分,相当于是马拉松比赛“跑在比赛队伍前面的团队”。只要被测样品成分和色谱柱测试条件保持不变,同一样品不同时间测试得到的半分离色谱图就保持不变,半分离色谱图与全分离色谱图的位置关系也保持不变。这就是说,我们可以用半分离色谱图推测全分离色谱图的一些主要特性,例如,推测未在半分离色谱图上出现的一些保留时间长的成分存在与否与含量。对生物发酵、恶臭污染等过程分析而言,我们只要得到体现主要状态参数的信息就够了,半分离色谱图实际已蕴含了全分离色谱图的主要信息,关键是怎样从图中得到需要的信息,并进行解释。
前已指出,单一色谱柱和单一型气敏传感器阵列的感知范围都是有限的。为实现发酵过程和恶臭污染物较宽范围的在线感知与分析,需要解决的问题是,如何将气敏传感器阵列与气相色谱柱组合起来,优势互补,实现气体进样单周期T0=5-10min的长期循环在线检测。为了实现气敏-气相色谱多感知信息选择、融合和电子鼻仪器在线分析方法,我们须解决以下气味感知理论与分析技术问题:
(A)气敏传感器阵列和气相色谱柱在线感知信息选择与融合问题
受三角稳定性原理启发,我们应从单条气敏传感器响应曲线中同时提取多个特征信息,例如,同时选择“稳态”响应最大值、出峰时间值和曲线下面积等特征信息,相当于从预处理角度提高电子鼻仪器的选择性。色谱柱响应速度比气敏传感器至少低一个数量级,企求色谱峰/峰完全分离的做法致使色谱法不满足气味在线检测要求。受马拉松比赛生活原型启发,可以从规定时间区间(例如T0=10min左右)的半分离色谱图上提取前若干个最高峰值与对应保留时间,再加上谱图曲线下面积,作为毛细色谱柱对发酵对象或恶臭污染物的感知信息特征,以提高气相色谱法的响应速度即在线性。
如何从气敏传感器阵列响应曲线和半分离色谱图中同时选择多个特征信息并融合起来,以提高电子鼻仪器的在线定性定量分析能力,是本发明要解决的一个主要问题。
(B)基于大数据和机器学习的电子鼻仪器在线分析能力与智能化问题
没有对大量气味在线测试产生的多源感知数据,没有嗅辨数据和色/质谱等常规仪器的成分检测数据,没有专家经验数据和专业人员现场记录数据,企图单纯靠单一型气敏传感器阵列、单一气相色谱柱和单一机器学习模型在线估计复杂气味强度与多种组成成分浓度是不现实的。很多电子鼻现在正是这样做的,但是,由此产生的检测数据的作用是十分有限的,得到的结果因而是不可信的。
由于气味复杂性和环境多变性,小数据不足以用来训练有效的机器学习模型以识别多种气味类型和量化预测复杂气味组成成分。我们应以气敏/色谱多源感知数据、嗅辨数据、专家经验数据与专业人员现场记录数据,色/质谱等常规仪器检测数据为基础,建立气味大数据。有了气味大数据,电子鼻仪器的机器学习方法就能依据当前感知信息,通过数据挖掘来识别气味类型和量化预测众多组成成分浓度。大数据和气味成分在线预测是矛盾的两个方面,有效解决途径是,深入研究并提出简单有效的机器学习模型与算法来实现多种气味类型的识别和气味强度与多种主要成分浓度的实时量化预测。
发明内容
本发明是在现有发明专利《一种恶臭气体多点集中式在线监测与分析系统及方法》(参见申请号:2018104716131)、《大数据驱动的恶臭气体多点集中式电子鼻仪器在线分析方法》(参见申请号:2018104717083)、和《一种多通道集成嗅觉模拟仪器和生物发酵过程在线分析方法》(参见申请号:201310405315.X)的基础上,发明一种气敏-气相色谱多感知信息选择、融合和电子鼻仪器在线分析方法,以解决多个生物发酵过程或多个恶臭监测点的长期在线监测,发酵与恶臭污染类型,和气味强度定性指标与多种浓度控制指标的在线量化预测问题。
为了实现上述目的,本发明提供如下技术方案:
电子鼻仪器包括气敏传感器阵列模块I、毛细管气相色谱柱模块II、被测气体自动进样模块III、计算机控制与分析模块IV、辅助气源V,实现多个生物发酵过程或多个恶臭污染监测点的长期循环自动在线检测与智能分析。
气敏传感器阵列模块I包括:气敏传感器阵列I-1、气敏传感器阵列环形工作腔I-2、电阻加热元件I-3、隔热层I-4、风扇I-5和隔板I-6,位于电子鼻仪器右中部。毛细管气相色谱柱模块II包括:毛细管气相色谱柱II-1、检测器II-2、放大器II-3、记录仪II-4、进样口II-5、电阻加热丝II-6、风扇II-7和隔热层II-8,位于电子鼻仪器右上部。
气体自动进样模块III包括:第一~第五二位二通电磁阀III-1~III-5、第一净化器III-6、第一微型真空泵III-7、第一流量计III-8、第一二位二通电磁阀III-9、第一节流阀III-10、二位三通电磁阀III-11、三位四通电磁阀III-12、第二微型真空泵III-13、第七二位二通电磁阀III-14、第八二位二通电磁阀III-15、稳压阀III-16;第一减压阀III-17、第二节流阀III-18、第一净化器III-19;第二减压阀III-20、第二净化器III-21、第三节流阀III-22、第二流量计III-23、第四节流阀III-24、第五节流阀III-25,位于电子鼻仪器右下方。
计算机控制与分析模块IV包括计算机主板IV-1、A/D数据采集卡IV-2、驱动与控制电路板IV-3、4路精密直流稳压电源IV-4、显示器IV-5、WIFI模块IV-6,位于电子鼻仪器左侧。
一个生物发酵过程/发酵罐或一个恶臭污染监测点,以下简称一个“检测点”。电子鼻仪器对一个检测点的被测气体采样单周期为T0=300-600s,默认T0=480s。在气体采样单周期T0内,被测气体被2个微型真空泵III-7和III-13分别抽吸到气敏传感器阵列模块I和毛细管气相色谱柱模块II,气敏传感器阵列I-1和毛细管气相色谱柱II-1因此产生敏感响应,电子鼻仪器因此得到1组气敏传感器阵列响应曲线和1幅气相色谱图,这是电子鼻仪器感知一个被测气体样品而得到的气敏/气相色谱模拟信号。
在气体采样单周期T0内,计算机控制与分析模块IV从气敏传感器阵列I-1时长60s的每条电压响应曲线中选择稳态峰值vgsi(τ)、对应的出峰时间tgsi(τ)、曲线下面积Agsi(τ)这3个感知信息,以满足三角稳定性原理,提高气敏传感器阵列的定性定量能力。若由16个气敏传感器组成阵列,则i=1,2,…,16,计算机控制与分析模块IV在气体采样单周期T0内从气敏传感器阵列响应曲线中共得到16*3=48个感知分量。
在气体采样单周期T0内,电子鼻仪器不追求色谱图峰/峰完全分离,计算机控制与分析模块IV从半分离色谱图上选择前10个最大色谱峰值vgci(τ)和相对应的保留时间tgci(τ)、色谱图曲线下面积Agc(τ),共得到21个感知分量,以提高气相色谱柱的在线检测能力。
在气体采样单周期T0内,计算机控制与分析模块IV将气敏传感器阵列I-1多条响应曲线的48个感知分量和毛细管色谱柱II-1半分离色谱图的21个感知分量融合起来,得到一个m=48+21=69维的感知向量x(τ)∈R69,这是电子鼻仪器对生物发酵过程或恶臭污染监测点进行分析的依据。
在单周期T0内,电子鼻仪器感知一个生物发酵过程或一个恶臭污染点的被测气体,得到一个m维感知向量x(τ)∈Rm,称之为样本。电子鼻仪器对n(≤5)个生物发酵过程或n(≤5)个恶臭监测点的气体采样循环周期为T=nT0,依次得到n个样本,依次存储在计算机硬盘的n个对应数据文件里,并通过WIFI路由模块将样本数据发送到云端和指定的固定/移动终端。若T0=480s,则被测气体循环进样周期为T=nT0=n*480s,相当于一个发酵罐或一个恶臭污染点每隔n*480s被检测一次。
电子鼻仪器通过对多个生物发酵过程、多个恶臭污染点经年累月的长期在线检测,形成气味大数据X的主体。数据集X还包括气相色谱、质谱、分光光度等常规分析仪器的离线检测数据,专业人员实验室嗅辨得到的臭气浓度OU值数据,操作人员记录的青霉素、红霉素、食醋、酱油、料酒、味精等生物发酵类型数据和化工园区、垃圾填埋场、污水处理厂、畜禽养殖场等恶臭污染监测区域类型数据。数据集X的一部分子集建立了气敏/色谱响应与多个生物发酵过程/恶臭污染类型以及主要成分浓度的对应关系。
在学习阶段,气味大数据X的各感知分量被施以归一化预处理,计算机控制与分析模块IV的机器学习模型离线学习气味大数据X以确定其结构和参数;在决策阶段,机器学习模型在线学习气敏-色谱近期响应以微调模型参数,依据气敏/气相近期感知时间序列阵在线确定多个生物发酵过程和恶臭污染类型,量化预测生物发酵过程发酵液主要成分浓度或国标GB14554指定的氨NH3、硫化氢H2S、二硫化碳CS2、三甲胺C3H9N、甲硫醇CH4S、甲硫醚C2H6S、二甲二硫醚C2H6S2、苯乙烯C8H8这8种恶臭化合物和臭气浓度OU(odor unit)值共8+1种恶臭污染物浓度指标值。
在气体进样单周期T0内,[T0-10s,T0]时间区间即为时长10s的信息选择与分析时间段,计算机控制与分析模块IV对气敏传感器阵列模块I和毛细管气相色谱柱模块II二者同时进行感知信息选择与分析处理操作。计算机控制与分析模块IV从气敏传感器阵列I-1在[T0-75s,T0-15s]时间段即时长60s的每条电压响应曲线中选择选择稳态峰值vgsi(τ)、对应的出峰时间tgsi(τ)、曲线下面积Agsi(τ)这3个感知信息分量;从毛细管气相色谱柱II-1在[0,T0-10s]时间段即时长T0-10s的一幅半分离色谱图上选择前10个最大色谱峰值vgci(τ)和相对应的保留时间tgci(τ)、色谱图曲线下面积Agc(τ)共21个感知响应分量,存储在计算机硬盘的临时文件里。
在气体进样单周期T0内,若时长T0-10s的半分离色谱图的色谱峰个数q小于10,则计算机控制与分析模块IV从该半分离色谱图上选择前q<10个最大色谱峰值vgci(τ)、相对应的保留时间tgci(τ)以及色谱图曲线下面积Agc(τ),不足的色谱峰值和对应保留时间补零,这时得到的色谱感知信息是xgc(τ)={(hgc1(τ),hgc2(τ),…,hgc,q(τ),0,0);(tgc1(τ),tgc2(τ),…,tgc,q(τ),0,0);Agc}。
气体进样单周期T0最后10s即[T0-10s,T0]区间的信息处理与分析时间段,计算机控制与分析模块IV的模块化机器学习模型依据气敏/色谱近期感知时间序列矩阵X(τ-q)对生物发酵过程或恶臭污染监测点进行气味类型识别和强度与主要成分量化预测,包括生物发酵过程类型与恶臭污染类型识别,生物发酵过程细胞浓度、底物浓度、产物浓度量化估计与正丙醇、苯乙醇等前体物质浓度量化估计,GB14554指定的8+1种恶臭污染物浓度指标值量化预测。
气味大数据X还包括浓度为0.1-1,000ppm的多种单一化合物顶空挥发气的电子鼻仪器气敏/色谱感知数据;气相色谱、质谱和分光光度等常规分析仪器的离线检测数据;专业人员实验室嗅辨数据。单一化合物特别包括生物发酵过程前体物质正丙醇与苯乙酸、GB14554指定的8种恶臭化合物,以及欧洲标准EN13725指定的臭气浓度OU标准参照物—正丁醇。
在气体进样单周期T0情况下,当只检测一个生物发酵过程或一个恶臭污染点时,则气体检测与分析周期循环是T=T0。若同时检测k个生物发酵过程/恶臭污染点,则其中一个生物发酵过程/恶臭污染点的循环检测与分析周期是T=k*T0。若长期循环监测过程中,其中一个生物发酵过程/恶臭污染点退出,则气体循环检测与分析周期变成T=(k-1)*T0。类似地,若长期循环监测过程中,一个新的生物发酵过程/恶臭污染点中途加入,则循环检测与分析周期变成T=(k+1)*T0。自一个生物发酵过程/恶臭污染点退出/加入时刻起,对应的数据文件记录周期相应变化。
机器学习模型由多个模块化深度卷积神经网络组成;单输出深度卷积神经网络模块数与被预测的生物发酵过程发酵液主要成分数、恶臭污染物主要浓度指标数、被测对象类型数相等,一一对应;一个单输出深度卷积神经网络由一个输入层、3个卷积层、2个下采样层和1个输出单元组成,各隐层与输出层活化函数均为修正的Sigmoid活化函数
在学习阶段,各个单输出深度卷积神经网络均采用误差反传离线逐层学习算法,主要学习气味大数据中有标签的数据和组成成分已知的气味大数据而具有必要智能;卷积层扫描窗尺寸为5×5,重叠扫描步长为1;卷积核为正弦核、余弦核、多项式核、Gaussian核、Sigmoid核、小波核和Laplace核的组合;下采样层扫描窗尺寸为2×2,不重叠扫描即步长为2,提取最大值、均值和均方差特征;在决策阶段,n个单输出深度卷积神经网络模型依据气敏/气相色谱当前时刻τ和近期已发生的时间序列感知矩阵X(τ-q)进行气味类型识别、一一估计预测当前时刻τ和未来τ+1、τ+2、τ+3时刻的气味强度与主要组成成分浓度值。
电子鼻仪器对多个生物发酵过程/恶臭污染点长期循环在线分析和量化预测,包括以下步骤:
(1)开机:仪器预热30min。
修改屏幕菜单“气体进样单周期T0”设置,默认值T0=8min;5个检测点气体循环进样周期为T=5T0。
(2)气体循环进样周期开始:电子鼻仪器依次可对最多5个检测点进行循环在线检测,计算机控制与分析模块IV自动生成5个文本文件,以存储气敏传感器阵列I-1和毛细管气相色谱柱模块II对5个检测点气体的响应数据。
(3)检测点k气体进样单周期开始。以T0=8min为例:
(3.1)信息感知与记录阶段[0-470s]:
(3.1a),气敏传感器阵列模块I依次历经①360s的初步恢复、②40s的精确标定、③5s的平衡、④60s的顶空进样、⑤5s的过渡和⑥10s的清洗共六个气体进样阶段。
(3.1b),毛细管气相色谱柱模块II依次历经①1s的顶空进样、②469s的色谱分离和③10s的放空与清洗共3个气体进样阶段。
(3.1c),计算机控制与分析模块IV将气敏传感器阵列模块I阶段④时长60s和细管气相色谱柱模块II阶段①+②时长470s的感知数据记录在对应的临时文件里。
(3.2)信息选择与处理阶段[470-480s]:在气体进样单周期T0第470-480s,计算机控制与分析模块IV从气敏传感器阵列模块I在气体顶空进样时间段时长60s每一条电压响应曲线中选择稳态峰值vgsi(τ)、出峰时间tgsi(τ)、曲线下面积Agsi(τ)这3个感知信息;16个气敏传感器组成的阵列I-1在周期T0内共得到16*3=48个感知分量。与此同时,计算机控制与分析模块IV从即时长470s的半分离色谱图上选择前10个最大色谱峰值vgci(τ)和对应保留时间tgci(τ)、色谱图曲线下面积Agc(τ),共得到21个感知分量。在每一单周期T0内,计算机控制与分析模块IV从气敏传感器阵列I模块和毛细管色谱柱模块II的感知信息中共得到1个69维的感知向量x(τ)∈R69。
计算机控制与分析模块IV的模块化深度卷积神经网络模型依据气敏-气相色谱近期多感知时间序列矩阵进行气味类型识别和强度与主要成分量化预测,包括生物发酵过程与恶臭污染类型识别,生物发酵过程前体物质与产物浓度量化估计,臭气浓度OU值和8种恶臭化合物浓度指标值量化预测。显示器显示监测和预测结果,并通过Internet网络传送到中央控制室和多个固定/移动终端。
(3.3)检测点k结束与下一个检测点开始。
(4)重复步骤(2)~(3),电子鼻仪器实现5个检测点气体的循环在线检测、识别和多项浓度量化预测。
附图说明
图1是本发明—气敏-气相色谱多感知信息选择、融合和电子鼻仪器在线分析方法—电子鼻仪器组成原理示意图。
图2是本发明—气敏-气相色谱多感知信息选择、融合和电子鼻仪器在线分析方法—气体进样单周期T0=480s内,气敏传感器阵列和毛细管气相色谱柱信息感知、选择与处理情况示意图。
图3是本发明—气敏-气相色谱多感知信息选择、融合和电子鼻仪器在线分析方法—气体进样单周期T0=480s内,气敏传感器响应曲线多特征选择示意图。
图4是本发明—气敏-气相色谱多感知信息选择、融合和电子鼻仪器在线分析方法—气体进样单周期T0=480s内,半分离色谱图多特征选择示意图。
图5是本发明—气敏-气相色谱多感知信息选择、融合和电子鼻仪器在线分析方法—气体进样单周期T0=480s内,两个半分离色谱图多特征选择示意图。
图6是本发明—气敏-气相色谱多感知信息选择、融合和电子鼻仪器在线分析方法—面向“连续在线”分析方式的模块化深度卷积神经网络模型多参数“分而治之”量化预测示意图。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1是本发明的气敏/气相色谱相融合的电子鼻仪器工作原理示意图。电子鼻仪器主要包括:气敏传感器阵列模块I,毛细管气相色谱柱模块II,气体自动进样模块III,计算机控制与分析模块IV,以及辅助气源—氢气瓶V-1与洁净空气瓶V-2。
气敏传感器阵列模块I主要组成单元包括:气敏传感器阵列I-1、气敏传感器阵列环形工作腔I-2、电阻加热元件I-3、隔热层I-4、风扇I-5和隔板I-6,位于电子鼻仪器右中部。毛细管气相色谱柱模块II主要组成单元包括:毛细管气相色谱柱II-1、检测器II-2、放大器II-3、记录仪II-4、进样口II-5、电阻加热丝II-6、风扇II-7和隔热层II-8,位于电子鼻仪器右上部。
气体自动进样模块III组成单元包括:第一~第五二位二通电磁阀III-1~III-5、第一净化器III-6、第一微型真空泵III-7、第一流量计III-8、第六二位二通电磁阀III-9、第一节流阀III-10、二位三通电磁阀III-11、三位四通电磁阀III-12、第二微型真空泵III-13、第七二位二通电磁阀III-14、第八二位二通电磁阀III-15、稳压阀III-16、第一减压阀III-17、第二节流阀III-18、第一净化器III-19、第二减压阀III-20、第二净化器III-21、第三节流阀III-22、第二流量计III-23、第四节流阀III-24、第五节流阀III-25。气体自动进样模块III位于电子鼻仪器右下方。
计算机控制与分析模块IV主要组成单元包括:计算机主板IV-1、A/D数据采集卡IV-2、驱动与控制电路板IV-3、4路精密直流稳压电源IV-4、显示器IV-5、WIFI模块IV-6,位于电子鼻仪器左侧。WIFI模块IV-6的作用是实时将气敏传感器阵列模块I和毛细管气相色谱柱模块II的感知信息传送给指定的固定/移动终端。
图2是电子鼻仪器在气体进样单周期T0=480s内,气敏传感器阵列模块I和毛细管气相色谱柱模块II信息感知、选择与处理情况示意图。尽管这两个模块的感知响应曲线形状和数据记录时间长度差别很大,但单周期T0最后10s的信息选择与分析处理是同时进行的。
图3是气体进样单周期T0=480s内,气敏传感器响应曲线多特征选择示意图。图中给出了TGS822、TGS826和TGS832这3个气敏传感器分别对石油蜡样品、2,000ppm乙烯气及5,000ppm乙醇挥发气的相应曲线示例。其中,图3(b)和图3(c)两幅图的电压响应曲线稳态最大值相等,即va=vb。若仅依据常规的单一的电压响应曲线稳态最大值特征选择法,电子鼻仪器此时不能区别2,000ppm乙烯气和5,000ppm乙醇挥发气。经仔细观察,我们发现,图3(b)和图3(c)两幅图显示了情况1:尽管电压响应稳态最大值相等,但峰值对应出峰时间不相等,曲线下面积也互不相等。类似地,还有情况2:出峰时间相等,但峰值与曲线下面积互不相等。情况3:曲线下面积相等,但出峰时间与峰值互不相等。
依据图3,本发明提出,从一个气敏传感器i(=1,2,…,16)的响应曲线上,同时选择电压响应稳态最大值vgsi(τ),与之对应的从被测气体顶空采样开始之刻起的出峰时间tgsi(τ),再加上被测气体顶空采样时间段60s的曲线下面积Agsi(τ)。若气敏传感器阵列由16个敏感元件组成,则在气体进样单周期T0历时10s的信息选择与处理区,计算机控制与分析模块IV从16条响应曲线中依次选择3*16=48个特征数值作为气敏传感器阵列模块I对被测气体的一次感知信息,记为xgs(τ)={(vgs1(τ),vgs2(τ),…,vgs16(τ));(tgs1(τ),tgs2(τ),…,tgs16(τ));(Agc1(τ),Agc2(τ),…,Agc16(τ))}。
图4为气体进样单周期T0=480s内,一幅半分离色谱图的信息选择示意图。在气体进样单周期T0历时5s的信息选择区,计算机控制与分析模块IV从这幅半分离色谱图中依次选择10组{峰高hgci(τ),保留时间tgci(τ)}(i=1,2,…,10)和指定时长470s的谱图曲线下面积Agc(τ)共21个特征数值作为毛细管色谱柱模块II对被测气体的一次感知信息,记为xgc(τ)={(hgc1(τ),hgc2(τ),…,hgc10(τ));(tgc1(τ),tgc2(τ),…,tgc10(τ));Agc(τ)}。
图5为气体进样单周期T0=480s内,两个半分离色谱图特征选择示意图。图5(a)的半分离色谱图只有8个色谱峰,只能得到8个峰值hgci(τ)(i=1,2,…,8)以及对应保留时间tgci(τ)(i=1,2,…,8),再加上半分离色谱图曲线下面积Agc(τ)。我们的做法是,数量不足的色谱峰值和对应保留时间补零,因此,依据图5(a),最终得到的色谱感知信息是xgc(τ)={(hgc1(τ),hgc2(τ),…,hgc8(τ),0,0);(tgc1(τ),tgc2(τ),…,tgc8(τ),0,0);Agc(τ)}。图5(b)的半分离色谱图有10个以上色谱峰,我们从中选择前10个最大色谱峰即可。
本发明将半分离色谱图看成电子鼻仪器感知信息即模式的一部分,结合气敏传感器阵列感知信息,建立气味大数据,藉助人工智能机器学习方法实现未知气味识别、定性分析和主要成分量化预测。在气体单采样周期T0历时10s的信息选择与处理区,计算机控制与分析模块IV将气敏传感器阵列模块I和毛细管色谱柱模块II不同时间段对被测气体感知信息融合起来,并进行归一化预处理,于是得到电子鼻仪器对一个被测气体样品的感知信息向量x(τ)=xgs(τ)+xgc(τ)={(vgs1(τ),vgs2(τ),…,vgs16(τ));(tgs1(τ),tgs2(τ),…,tgs16(τ));(Agc1(τ),Agc2(τ),…,Agc16(τ));(hgc1(τ),hgc2(τ),…,hgc10(τ));(tgc1(τ),tgc2(τ),…,tgc10(τ));Agc}∈R69。感知向量x(τ)∈R69是电子鼻仪器对生物发酵过程和恶臭污染点的气味进行在线类型识别和主要成分量化预测的依据。
图6是面向“连续在线”分析方式的深度卷积神经网络机器学习模型多参数“分而治之”量化预测示意图。具体步骤包括:依据气敏传感器阵列模块I与毛细管气相色谱柱模块II近期感知得到的时间序列矩阵X(τ-q),由多个单输出深度卷积神经网络一一预测发酵与恶臭污染类型、气味强度与主要成分浓度值。这里,τ为当前时间,q为近期已过去的时间,τ-q是近期时间间隔。因此,时间序列矩阵X(τ-q)维数尺度为R69×(τ-q+1)。q的取值一般以发酵或恶臭污染过程近期6小时左右时间长度为宜。
为了确定模块化卷积神经网络模型结构和参数,首要任务是建立气味大数据,包括:气敏传感器阵列模块I与毛细管气相色谱柱模块II对大量生物发酵过程和恶臭污染区域经年累月的在线感知数据;色谱仪、质谱仪、分光光度仪等常规仪器的离线监测数据;已知类型与组成成分的气味标签数据;以及感官评定数据。
接下来要做的事情是气敏传感器阵列感知数据与毛细管气相色谱柱感知数据的融合,包括归一化和降维预处理。为了降低气味大数据分析难度,我们采用“分而治之”策略,将一个复杂的多气味定性定量分析问题,即复杂的多气味类型识别问题和复杂的多气味强度与组成成分量化估计问题,分解为多个气味类型一一识别和多个较简单的单一气味强度与重要组成成分一一量化预测问题,也就是将一个n条曲线/曲面整体拟合问题分解n条曲线/曲面一一拟合问题,并由n个单输出深度卷积神经网络模型解决,一一对应。
本发明采用多个模块化单输出深度卷积神经网络实现多参数在线量化预测。一个单输出深度卷积神经网络由一个输入层、3个卷积层、2个下采样层和1个输出单元组成,主要学习气味大数据中有标签的数据和组成成分已知的数据。各隐层与输出层活化函数均为修正的Sigmoid活化函数
采用误差反传离线逐层学习算法。卷积层扫描窗尺寸可为5×5,重叠扫描步长可为1;卷积核为正弦核、余弦核、多项式核、Gaussian核、Sigmoid核、小波核和Laplace核的组合;下采样层扫描窗尺寸可为2×2,不重叠扫描即步长为2,从每个扫描窗提取最大值、均值和均方差特征。在决策阶段,n个单输出深度卷积神经网络模型依据气敏/气相色谱近期感知时间序列矩阵X(τ-q)一一预测τ+1、τ+2、τ+3等即将发生时刻的多项量化指标值,包括气味类型、强度与主要组成成分浓度值。
气敏/气相色谱近期感知时间序列矩阵X(τ-q)的具体组成元素是:
本发明取m=69,q=9。
当只检测1个点时,即气体循环进样周期T与气体单采样周期T0=8min相等,设置“q=9”相当于依据从当前时刻τ到过去1.2小时这个时间段的气敏/气相色谱时间序列感知响应矩阵,等价于依据过去1.2小时时间段的发酵过程或恶臭环境的变化,来预测未来8min、16min和24min的气味强度和主要组成成分可能的变化。当检测5个点时,即气体循环进样周期T=5T0=40min相等,设置“q=9”相当于依据从当前时刻τ到过去6小时这个时间段的气敏/气相色谱时间序列感知响应矩阵,来预测未来40min、80min和120min的气味强度和主要组成成分可能的变化。