CN116720078A - 一种智能传感器的连续采集和数据模型构建系统及方法 - Google Patents

一种智能传感器的连续采集和数据模型构建系统及方法 Download PDF

Info

Publication number
CN116720078A
CN116720078A CN202310553736.0A CN202310553736A CN116720078A CN 116720078 A CN116720078 A CN 116720078A CN 202310553736 A CN202310553736 A CN 202310553736A CN 116720078 A CN116720078 A CN 116720078A
Authority
CN
China
Prior art keywords
data
model
concentration
unit
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310553736.0A
Other languages
English (en)
Inventor
苏跃增
王天祥
曾敏
刘瑞丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202310553736.0A priority Critical patent/CN116720078A/zh
Publication of CN116720078A publication Critical patent/CN116720078A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0011Sample conditioning
    • G01N33/0016Sample conditioning by regulating a physical variable, e.g. pressure or temperature
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Food Science & Technology (AREA)
  • Combustion & Propulsion (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

本发明公开了一种智能传感器的连续采集和数据模型构建系统及方法。为了克服现有技术进行化学传感器的训练数据采集存在和实际应用不符,数据采集效率低,有效数据不足的问题;本发明在训练过程中,通过将传感器单元置于测试单元,并使用浓度控制单元调节不同样品的浓度,实现连续采集数据。在预测过程中,将传感器单元置于样品输入单元,通过状态标定单元进行校正后输入浓度预测模型,并得到样品浓度输出。使用连续数据采样方法,不进行恢复过程,并以较短的时间达到平衡状态,大大减少训练时间;连续采集响应和恢复阶段数据,使训练数据符合实际应用中信号和浓度变化过程;在预测过程中动态检测传感器所处状态并调用不同模型,提高模型准确度。

Description

一种智能传感器的连续采集和数据模型构建系统及方法
技术领域
本发明涉及传感器技术领域,尤其涉及一种智能传感器的连续采集和数据模型构建系统及方法。
背景技术
传感器是现代信息技术的三大支柱之一,也是智能系统的基础,发展新型智能传感技术成为一种迫切需求。化学传感器是对各种化学物质敏感并将其浓度转换为电信号进行检测的仪器,如气体传感器、离子传感器和生物传感器等。随着物联网等技术的蓬勃发展,化学传感器和移动终端结合,在安全警报、健康分析、医疗诊断、食品质量检测、环境监测和智能包装等大量领域有着比以往更为广泛和深入的需求。
常用的化学传感器大都需要依赖敏感材料与待检测化学物质之间的进行接触或反应,从而受到明显的动力学影响,如气体在敏感材料上的吸脱附反应过程长且高度非线性。这就造成了化学传感器对待测化学物质的响应不仅和其浓度相关,且和其动态变化特性相关,比如其处于浓度上升阶段还是下降阶段。对于可逆性能不佳的化学传感器,如在工业领域大量应用的、成本低廉且制造简单的半导体型传感器,这使得其在实时监测等任务的表现较差。对于复杂离子传感器和大分子生物传感器等,同样导致其准确度下降或者需要更多的时间恢复到平衡态。
传统的传感算法通常假定传感器工作在平衡状态,且其平衡状态与之前状态无关。而传感器的实际应用中样品组分的浓度和其它环境参数会不断变化,往往处于不同动态阶段。由于多数化学传感器的非线性响应和恢复特性,当其动态阶段不同,即使达到同一状态,传感器的响应信号仍然会有一定区别。目前对于这些可逆性能不佳的化学传感器,为了保证其测量可复现、易训练,通常采用离散化的数据采集模式,即对于一个浓度区间的每个样本浓度,在达到该样本浓度后都需要经过相对较长的恢复时间恢复到背景浓度。但这样的数据采集方法使得训练数据和实际应用场景不匹配,造成预测准确度不高。与此同时,采集过程变得冗长低效,不仅传感器恢复时间长,并且由于每次响应信号都是从背景浓度上升到待测浓度,响应过程也较长,尤其在高浓度下影响较大。基于这种数据采集方法,难以获得足够数据以训练如深度神经网络这样较复杂模型,不利用规模化应用。
目前开发的化学传感器通常只能测量单一目标,而实际被测样品组分常常复杂而未知,使得单一传感器无法准确的识别和检测。
发明内容
本发明主要解决现有技术进行化学传感器的训练数据采集存在和实际应用不符,数据采集效率低,有效数据不足的问题;提供一种智能传感器的连续采集和数据模型构建系统及方法,改善现有方法在训练和预测过程中只考虑状态信息,而没有考虑样品组成动态变化的弊端,在训练过程对不同动态阶段同时建模,并在预测过程中依据传感器信号动态调用合适模型。
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种智能传感器的连续采集和数据模型构建系统,包括:
采集输入模块,在训练阶段给传感器单元提供浓度连续变化的样品,连续采集响应信号数据;在预测阶段给传感器单元提供实时环境中的样品浓度,实时采集响应信号数据;
状态标定单元,整理采集的响应信号数据后输入预测模型进行训练或预测浓度;
补偿单元,获得温湿度单元给出的温湿度信息和状态标定单元给出的漂移信号后分别对温湿度和仪器漂移进行校正后将校正后数据传入状态标定单元重新整理;
预测模型,对状态标定单元整理后的数据进行模型训练或浓度预测。
使用连续数据采样方法,不进行恢复过程,并以较短的时间达到平衡状态,大大减少训练时间;连续采集响应和恢复阶段数据,使训练数据符合实际应用中信号和浓度变化过程;在预测过程中动态检测传感器所处状态并调用不同模型,提高模型准确度。
作为优选,在训练阶段,所述的采集输入模块包括:
浓度控制单元,调节不同样品的浓度;
样本测试单元,给传感器单元提供调节控制下的样品浓度环境;
在预测阶段,所述的采集输入模块包括:
样品输入单元,给传感器单元提供实时的样品浓度环境。
作为优选,对于多组分样品的训练过程中,将各个组分从小到大标号;
初始时,所有组分浓度均处于对应设定范围内最低值或为零;
在混合样的传感过程中,依次固定其他样品组分浓度而将某一样品组分浓度从低浓度梯度到高浓度梯度,再从高浓度梯度到低浓度梯度连续变化。
使得模型覆盖实际浓度变化过程,并在较短的时间达到平衡状态。
作为优选,所述的状态标定单元包括:
信号输入单元,接收传感器单元发送的响应数据、训练阶段的浓度数据以及补偿单元发送的根据历史数据计算得到的校正信号;
状态识别单元,根据信号输入单元收到的响应数据和校正信号得到校正后数据,将当前时刻的响应数据和训练阶段的浓度数据发送到补偿单元;
数据输出单元,将校正后的数据和训练阶段的浓度数据整合后发送到预测模型中。
作为优选,所述的预测模型包括输入层、隐藏层和输出层,其中输入层接收传感器响应信号和环境状态数据,输出层输出样品浓度预测结果,隐藏层包含模型参数;
所述的预测模型基于多层感知机、支持向量机、决策树、随机森林、卷积神经网络、隐马尔科夫模型、循环神经网络、LSTM、Transformer模型的一种或多种进行模型训练和预测。
一种智能传感器的连续采集和数据模型构建方法,数据模型构建包括训练阶段和预测阶段;
训练阶段包括:
A1:将传感器单元置于样品测试单元,并通过浓度控制单元调节不同样品组分的浓度,进行连续数据采集;其中浓度的变化速率和幅度满足一定的规定范围,以保证传感器处于正常工作区间。
A2:将传感器单元的响应数据和浓度控制单元处的样品浓度数据传递给状态标定单元,对采集的数据进行整理。
A3:补偿单元接受温湿度单元给出的温湿度信息和状态标定单元的漂移信号后,分别对温度和漂移进行校正后将校正后数据传递回状态标定单元;
A4:状态标定单元将该时刻数据重新整理后输入训练模型以修改模型参数;
预测阶段包括:
B1:将传感器单元置于样品输入单元;
B2:传感器单元采集到实时响应信号后传输至状态标定单元;
B3:补偿单元接受温湿度单元给出的温湿度信息和状态标定单元的漂移信号后,分别对温度和漂移进行校正后将校正后数据传递回状态标定单元;
B4:校正后的数据输入浓度预测模型,浓度预测模型动态检测传感器所处状态,并输出预测样品浓度。
使用连续数据采样方法,不进行恢复过程,并以较短的时间达到平衡状态,大大减少训练时间;连续采集响应和恢复阶段数据,使训练数据符合实际应用中信号和浓度变化过程。
作为优选,通过连续数据采集得到训练数据后,采用下述三种模型训练方法之一进行处理:
方法一:将样品各组分浓度从低浓度梯度到高浓度梯度变化的数据和样品浓度从高浓度到低浓度梯度变化的数据分别构建基于多层感知机、支持向量机、决策树、随机森林、卷积神经网络、隐马尔科夫模型、循环神经网络、LSTM、Transformer模型中的一种或多种任意模型;这些模型之间可以共享隐藏层参数,也可以不共享隐藏层参数;可以使用同一种模型,也可以分别使用不同模型。
方法二:将样品浓度从低浓度梯度到高浓度梯度变化的数据和样品浓度从高浓度到低浓度梯度变化的数据分别加上状态特征后输入基于多层感知机、支持向量机、决策树、随机森林、卷积神经网络、隐马尔科夫模型、循环神经网络、LSTM、Transformer模型中的一种或多种任意模型;
方法三:将样品数据直接输入隐马尔可夫模型、循环神经网络、LSTM、Transformer模型中的一种,上述模型为具有处理时序数据能力的模型。该方法要求在每个时间步,所述模型至少处理当前时间步和上一时间步的传感器响应和浓度数据。
作为优选,通过连续数据采集得到预测数据后,动态检测传感器所处状态并调用不同模型或利用模型不同模式或状态给出预测结果。
若训练数据采用如上述方法一和方法二处理,则所述动态检测过程依赖动态检测模型;所述动态检测模型采用逻辑回归、支持向量机、决策树和随机森林等分类模型之一;所述动态检测模型训练阶段中每个数据点的响应信号和上个数据点响应信号作差,得到响应变化后和状态特征一起输入分类模型;预测阶段,计算响应变化后输入该动态检测模型,得到状态特征;
若训练数据采用方法一处理,则根据状态特征,检索对应模型后,使用该模型进行预测;
若训练数据采用方法二处理,则将预测数据添加对应的状态特征后输入模型后进行预测;
若训练数据采用方法三处理,则预测时使用时间步应该和训练时相同。
作为优选,预测模型的优化方法包括以下方法的一种或两种;
方法一:利用模型超参数优化方法,包括遗传算法或深度Q学习网络;
方法二:模型融合技术,将多个预测模型结果进行融合;融合后的结果o等于nc个子模型结果{oi,i∈{1,...,nc}}的线性组合或者专家模型输出结果。
作为优选,线性组合若包括权重wi,则权重取子模型训练损失值的倒数wi=1/li
专家模型采用逻辑回归、支持向量机、决策树和随机森林等分类模型之一;
训练结束后,得到子模型oi在第j个训练样本{xj,yj}上的损失lij
设置模型标签ml,其中mlj=argminilij,从而得到训练数据对{xj,mlj}j
将其输入专家模型中进行训练;
预测时,先利用专家模型选择进行预测的子模型,再由该子模型输出预测结果。
作为优选,所述遗传算法需执行以下步骤:
步骤一:将所有待优化超参数进行离散化编码,设超参数列表为{hp1,hp2,...,hpn},其中每个超参数hpi∈{1,...,mi},hpi的取值和该超参数的离散化后状态一一对应。
步骤二:初始化包含q个个体的种群P={c1,c2,...,cq},所述个体ci维护一份随机初始化的离散编码超参数。
步骤三:对该种群个体以概率pmut抽取进行变异操作,对该种群每两个个体对以概率pcross抽取进行交叉操作。所述变异操作先随机生成一个变异位点,将该变异位点个体保存的超参数用该超参数范围内随机生成的值将其覆盖。所述交叉操作先随机生成交叉起始点和结束点,然后将两个个体从起始点到结束点的超参数进行交换。
步骤四:将得到的超参数输入模型,并进行训练,得到的损失函数取负值作为适应度。将种群所有个体按照适应度排序,选择e(e<q)个个体进入下一种群,同时在剩下的个体中每次随机抽取两个,并将适应度较大的个体加入种群,直至种群个体数达到q。
步骤五:重复步骤三到步骤四一定次数后终止,返回种群中适应度最高个体维护的超参数列表并解码,即为优化后超参数。
作为优选,所述深度Q学习网络需执行以下步骤:
步骤一:将所有待优化超参数进行离散化编码;
步骤二:随机初始化状态向量S0=s,所述状态向量维护一份编码后超参数列表,即s={hp1,hp2,...,hpn}。对任意给定状态向量s,以某一概率给出某一动作的过程就是行为策略:π(a|s)=P[At=a|St=s]。
步骤三:以概率∈随机给出动作空间A中的随机动作,以概率1-∈给出模型预测的当前状态下最优动作aopt=argmaxa∈AQ(s,a),其中Q(s,a)值是由深度Q学习网络根据当前状态s对所有动作空间A中的动作计算得到的:Q(s,a)=Es′[π[Rt+1+γEa′~π(·|s)[Q(s′,a′]|St=s,At=a]],其中Rt为第t步后的回报,γ是折现系数。将得到的动作施加到状态向量s后得到新的状态向量s′,将其输入模型,并进行训练后,得到的模型损失函数取负值即可作为回报Rt+1,并通过如下损失函数训练深度Q学习网络:Ltt)=E[(Rt+1+γmaxa′Q(s′,a′)-Q(s,a))2],其中θt是第t步后深度Q学习网络参数。
步骤四:重复步骤三直至一定次数或者损失函数L减小到指定值,返回此时的状态向量维护的超参数列表并解码,即为优化后超参数。
本发明的有益效果是:
1.使用连续数据采样方法,不进行恢复过程,并以较短的时间达到平衡状态,大大减少训练时间;
2.连续采集响应和恢复阶段数据,使训练数据符合实际应用中信号和浓度变化过程。
3.在预测过程中动态检测传感器所处状态并调用不同模型,提高模型准确度。
附图说明
图1是本发明的一种系统训练阶段的连接框图。
图2是本发明的一种系统预测阶段的连接框图。
图3是本发明的一种模型训练迭代应用过程示意图。
图4是本发明的一种状态标定单元的内部示意图。
图5是本发明的一种补偿单元的内部示意图。
图6是本发明的一种连续采集过程示意图。
图7是本发明的一种浓度连续变化环境下的传感器的响应曲线。
图8是本发明的一种对于给定浓度样本浓度预测模型的输出图。
图中1.浓度控制单元,2.样本测试单元,3.传感器单元,4.状态标定单元,5.补偿单元,6.温湿度单元,7.训练模型,8.样品输入单元,9.浓度预测模型,41.信号输入单元,42.状态识别单元,43.数据输出单元,51.数据输入单元,52.补偿模型,53.补偿输出单元。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体的说明。
实施例一:
本实施例的一种智能传感器的连续采集和数据模型构建系统,主要用于混合气体的长期浓度监测过程,如图1和图2所示,包括浓度控制单元1、样品测试单元2、样本输入单元8、传感器单元3、状态标定单元4、补偿单元5、温湿度单元6、训练模型7和浓度预测模型9。
传感器单元3给出气体的响应信号,在本实施例中,具体为包含8个气体传感器的阵列。
样本测试单元2用于容纳训练阶段的气体;样本输入单元8用于容纳预测阶段的气体,在本实施例中均为同一型号气体测试腔室。
浓度控制单元1控制气体的浓度组成,具体为多个高精度气体流量计。
温湿度单元6用于测量环境温度和湿度,具体为焊接在传感器阵列板中的温度和湿度传感器。
状态标定单元4用于整合传感器单元的响应信号。
补偿单元5用于对传感材料的漂移和环境参数如温湿度进行补偿。
训练模型7和浓度预测模型9分别工作在训练阶段和预测阶段,模块均位于嵌入式处理器中,并在运行时加载入内存。
一种智能传感器的连续采集和数据模型构建方法,包括训练过程和预测过程。
训练过程包括以下步骤:
步骤一、将传感器阵列置于气体测试腔室,并通过高精度气体流量计调节不同气体的流量,从而达到各个气体的设定浓度。
步骤二、训练过程中,对于3种混合气体,在确定每种气体的测试范围后,将气体分别标号为1到3。图6展示了连续采集过程。
初始时,除背景气之外全部设置为最低浓度。测试时,依次固定小标号气体浓度,将大标号气体浓度设定为从低浓度到高浓度,再从高浓度到低浓度变化。
步骤三、传感器阵列暴露在气体测试腔室下产生响应,和从浓度控制单元得到的样品浓度信号一起传给状态标定单元。
步骤四、状态标定单元整合步骤三获得数据后将该时刻数据输入补偿单元用于校正。补偿单元接受温湿度单元和状态标定单元的信号后,给出温度和漂移校正。随后状态标定单元利用补偿单元发回的补偿信号状态进行标定,并将校正后数据输入训练模型以修改模型参数。并传递回状态标定单元。
步骤五、重复上述过程直至模型训练结束。需要注意的是,在训练过程中放置的是初始化模型,通过训练过程拟合传感器动态响应和浓度之间的关系。
如图7所示,展示了在具体实施例中连续数据采集从低浓度到高浓度,再从高浓度到低浓度传感器的一条典型响应曲线,其中固定甲烷浓度为2升每小时,氢气浓度从10毫升每小时变化到50毫升每小时,再回复到10毫升每小时。
预测过程包括以下步骤:
步骤一、将传感器阵列置于气体测试腔室。
步骤二、传感器阵列得到响应信号后传入状态标定单元。
步骤三、通过和训练过程相同的校正过程对温湿度和仪器漂移进行校正后输入浓度预测模型。
步骤四、动态检测传感器所处状态,根据传感器状态调用不同模型得到样品浓度输出。
图8是展示了在具体实施例中,根据本发明所述方法构建的智能传感系统预测甲烷和氢气混合物,对于给定浓度气体浓度预测模型的输出,其中横轴代表甲烷浓度,纵轴代表氢气浓度,叉号标记的实际浓度,实心圆圈代表预测浓度。
本实施例中初始化模型、训练模型和浓度预测模型的关系如图3所示。
上述状态标定单元4其校正过程包括温度校正、湿度校正和漂移校正中的一种或多种。如图4所示,状态标定单元4内部结构包括信号输入单元41、状态识别单元42和数据输出单元43。
信号输入单元41接受传感器单元3发送的响应数据、训练时浓度控制单元发送的浓度数据以及补偿单元4发送的根据历史数据计算得到的校正信号。
状态识别单元42根据信号输入单元41收到的响应数据和校正信号得到校正后数据,同时将当前时刻的响应数据和浓度数据发送到补偿单元。
数据输出单元43将校正后数据和浓度数据整合后发送到训练模型或浓度预测模型。
如图5所示,补偿单元4包括一次连接的数据输入单元51、补偿模型52和补偿输出单元53。漂移校正通过对传感器单元响应数据的变化趋势进行建模实现,本实施例中通过比较训练时连续采集过程经过的两个相同低浓度的传感器响应进行线性校正,且保存经过指数移动平均算法处理后的线性校正系数用于预测阶段校正。所述温度校正和湿度校正通过传感器温湿度特性曲线进行校正。
本实施例中使用的模型是LSTM,输入数据维度为9,包括8个传感器响应和1个状态特征,隐层维度、RNN层个数、时间步等超参数利用模型优化方法得到。
本实施例中训练过程根据设定浓度变化过程给出状态特征,并同时将每个数据点的响应信号和上个数据点响应信号作差,得到响应变化后和状态特征一起输入决策树模型用以预测状态特征。预测过程,先计算响应变化后输入该动态检测模型,得到状态特征。再将传感器响应和状态特征输入LSTM模型用以预测输出浓度。
本实施例中超参数优化方法采用遗传算法,具体包括以下步骤:
步骤一:将隐层维度、RNN层个数、时间步等待优化超参数进行离散化编码,设超参数列表为{hp1,hp2,...,hpn},其中每个超参数hpi∈{1,...,mi},hpi的取值和该超参数的离散化后状态一一对应。
步骤二:初始化包含q个个体的种群P={c1,c2,...,cq},所述个体ci维护一份随机初始化的离散编码超参数。
步骤三:对该种群个体以概率pmut抽取进行变异操作,对该种群每两个个体对以概率pcross抽取进行交叉操作。
变异操作先随机生成一个变异位点,将该变异位点个体保存的超参数用该超参数范围内随机生成的值将其覆盖。交叉操作先随机生成交叉起始点和结束点,然后将两个个体从起始点到结束点的超参数进行交换。
步骤四:将得到的超参数输入如技术特征一中所述模型,并使用上述模型训练方法训练后,得到的损失函数取负值作为适应度。将种群所有个体按照适应度排序,选择e(e<q)个个体进入下一种群,同时在剩下的个体中每次随机抽取两个,并将适应度较大的个体加入种群,直至种群个体数达到q。
步骤五:重复步骤三到步骤四一定次数后终止,返回种群中适应度最高个体维护的超参数列表并解码,即为优化后超参数。
实施例二:
本实施例的一种智能传感器的连续采集和数据模型构建系统及方法,主要用于多种生物标志物的长期浓度监测过程。该系统包括该系统包括浓度控制单元1、样品测试单元2、样本输入单元8、传感器单元3、状态标定单元4、补偿单元5、温度单元6、训练模型7和浓度预测模型9。
本实施例的方法包括以下步骤:
步骤一、将传感器阵列置于样本测试单元2,并通过带反馈的自助样本注入设备调节不同生物标志物的浓度到设定值。
步骤二、训练过程中,对于N种混合生物标志物,在确定每种生物标志物的测试范围后,将生物标志物分别标号为1到N。初始时,只有不包含任何待测物的缓冲溶液。测试时,依次固定小标号生物标志物浓度,将大标号生物标志物浓度设定为从低浓度到高浓度,再从高浓度到低浓度变化。
步骤三、传感器阵列暴露在样本测试单元下产生响应,和从浓度控制单元1得到的样品浓度信号一起传给状态标定单元4。
步骤四、状态标定单元4整合步骤三获得数据后将该时刻数据输入补偿单元5用于校正。补偿单元5接受温湿度单元6和状态标定单元4的信号后,给出温度和漂移校正。随后状态标定单元4利用补偿单元5发回的补偿信号状态进行标定,并将校正后数据输入训练模型7以修改模型参数。并传递回状态标定单元4。
步骤五、重复上述过程直至模型训练结束。需要注意的是,在训练过程中放置的是初始化模型,通过训练过程拟合传感器动态响应和浓度之间的关系。
步骤六、预测过程,将传感器阵列置于样本输入单元,得到响应信号后传入状态标定单元4,通过和训练过程相同的校正过程后输入浓度预测模型9。
步骤七、动态检测传感器所处状态,根据传感器状态调用不同模型得到样品浓度输出,提高模型准确度。
进一步的,状态标定单元4中将传感器单元3置于样品测试单元2中,暴露在测试样品下产生响应,并将响应信号和浓度信号传给状态标定单元4。同时,将状态标定单元4与补偿单元5电相连,补偿单元5接受温湿度单元6和状态标定单元4的信号后,给出温度和漂移校正,并将校正后的信号传递回状态标定单元4。
进一步的,模型训练中将经过状态标定和补偿的响应信号和环境状态数据输入训练模型以修改模型参数。在训练过程中,浓度控制单元连续变化信号,不进行显式的恢复过程。
本实施例中漂移通过比较训练时连续采集过程经过的两个相同低浓度的传感器响应进行线性校正,且保存经过指数移动平均算法处理后的线性校正系数用于预测阶段漂移校正。由于待测生物标志物测量温度已经被控制在室温,且在溶液中测量,故不进行温度校正和湿度校正。
本实施例中使用的模型是多层感知机,隐层个数、每个隐层的节点数、激活函数等超参数利用模型优化方法得到。
本实施例中训练过程根据设定浓度变化过程给出状态特征,并同时将每个数据点的响应信号和上个数据点响应信号作差,得到响应变化后和状态特征一起输入决策树模型用以预测状态特征。在训练过程中,根据状态特征的不同,分别训练不同的多层感知机。不同模型之间的隐藏层共享。预测过程,先计算响应变化后输入该动态检测模型,得到状态特征。再利用该状态特征得到对应的模型,再输入传感器响应到此模型用以预测输出浓度。
本实施例中超参数优化方法采用深度Q学习网络算法,具体包括以下步骤:
步骤一:将隐层个数、每个隐层的节点数、激活函数等待优化超参数进行离散化编码。
步骤二:随机初始化状态向量S0=s,所述状态向量维护一份编码后超参数列表,即s={hp1,hp2,...,hpn}。对任意给定状态向量s,以某一概率给出某一动作的过程就是行为策略:π(a|s)=P[At=a|St=s]。
步骤三:以概率∈随机给出动作空间A中的随机动作,以概率1-∈给出模型预测的当前状态下最优动作aopt=argmaxa∈AQ(s,a),其中Q(s,a)值是由深度Q学习网络根据当前状态S对所有动作空间A中的动作计算得到的:
Q(s,a)=Es′[π[Rt+1+γEa′~π(·|s)[Q(s′,a′]|St=s,At=a]]
其中,Rt为第t步后的回报,γ是折现系数。
将得到的动作施加到状态向量s后得到新的状态向量s′,将其输入模型,并进行述训练后,得到的模型损失函数取负值即可作为回报Rt+1,并通过如下损失函数训练深度Q学习网络:Ltt)=E[(Rt+1+γmaxa′Q(s′,a′)-Q(s,a))2],其中θt是第t步后深度Q学习网络参数。
步骤四:重复步骤三直至一定次数或者损失函数L减小到指定值,返回此时的状态向量维护的超参数列表并解码,即为优化后超参数。
本实施例采用了不同的超参数优化方法,其他内容同实施例一。
实施例三:
本实施例的一种智能传感器的连续采集和数据模型构建系统及方法,主要用于多种生物标志物的长期浓度监测过程。该系统包括该系统包括浓度控制单元1、样品测试单元2、样本输入单元8、传感器单元3、状态标定单元4、补偿单元5、温度单元6、训练模型7和浓度预测模型9。
本实施例的方法包括以下步骤:
步骤一、将传感器阵列置于样本测试单元2,并通过带反馈的自助样本注入设备调节不同生物标志物的浓度到设定值。
步骤二、训练过程中,对于N种混合生物标志物,在确定每种生物标志物的测试范围后,将生物标志物分别标号为1到N。初始时,只有不包含任何待测物的缓冲溶液。测试时,依次固定小标号生物标志物浓度,将大标号生物标志物浓度设定为从低浓度到高浓度,再从高浓度到低浓度变化。
步骤三、传感器阵列暴露在样本测试单元下产生响应,和从浓度控制单元1得到的样品浓度信号一起传给状态标定单元4。
步骤四、状态标定单元4整合步骤三获得数据后将该时刻数据输入补偿单元5用于校正。补偿单元5接受温湿度单元6和状态标定单元4的信号后,给出温度和漂移校正。随后状态标定单元4利用补偿单元5发回的补偿信号状态进行标定,并将校正后数据输入训练模型7以修改模型参数。并传递回状态标定单元4。
步骤五、重复上述过程直至模型训练结束。需要注意的是,在训练过程中放置的是初始化模型,通过训练过程拟合传感器动态响应和浓度之间的关系。
步骤六、预测过程,将传感器阵列置于样本输入单元,得到响应信号后传入状态标定单元4,通过和训练过程相同的校正过程后输入浓度预测模型9。
步骤七、动态检测传感器所处状态,根据传感器状态调用不同模型得到样品浓度输出,提高模型准确度。
本实施例中使用的模型是支持向量机回归模型,依据超参数的不同,同时生成多个模型用以训练。
本实施例中训练过程根据设定浓度变化过程给出状态特征,并同时将每个数据点的响应信号和上个数据点响应信号作差,得到响应变化后和状态特征一起输入决策树模型用以预测状态特征。
在训练过程中,根据状态特征的不同,分别训练不同的多层感知机。不同模型之间的隐藏层共享。
预测过程,先计算响应变化后输入该动态检测模型,得到状态特征。再利用该状态特征得到对应的模型,再输入传感器响应到此模型用以预测输出浓度。
本实施例采用模型融合技术:
训练时每个状态特征下同时有多个模型参与训练,并以模型训练损失值的倒数wi=1/li为模型权重;
预测时,将多个模型的结果进行加权平均得到结果o=∑ioi×wi/∑iwi
专家模型采用逻辑回归、支持向量机、决策树和随机森林等分类模型之一;训练结束后,得到子模型oi在第j个训练样本{xj,yj}上的损失lij;设置模型标签ml,其中mlj=argminilij,从而得到训练数据对{xj,mlj}j;将其输入专家模型中进行训练;预测时,先利用专家模型选择进行预测的子模型,再由该子模型输出预测结果。
本实施例采用了不同的模型优化方法,其他内容同实施例一。
本实施例的方案通过智能传感系统采集方法获得传感器在连续变化下的动态响应数据,符合实际应用场景。基于该数据开发的传感器模型理论上具有更高的准确性和稳健性。利用该方法进行数据采集时,不需要像传统方式每次测量都进行显式而冗长的恢复过程,通过连续数据采样,在其他组分浓度固定的情况下只进行了一次隐式的恢复到低浓度的过程。没有显式的恢复过程,而且该方法下浓度梯度连续变化,系统能以较短的时间达到动态平衡状态。故而利用该方法整体采集效率高、时间短,在给定时间内能够获得更多数据。还构建了一套同时考虑传感器响应信号和动态变化特性的数据模型来处理连续采集得到的数据。对于具有复杂响应关系的化学传感器,通过高效的连续采集方法获取足够定标实验数据输入深度学习模型后,能有效提高化学传感器的建模准确度。
应理解,实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (10)

1.一种智能传感器的连续采集和数据模型构建系统,其特征在于,包括:
采集输入模块,在训练阶段给传感器单元(3)提供浓度连续变化的样品,连续采集响应信号数据;在预测阶段给传感器单元(3)提供实时环境中的样品浓度,实时采集响应信号数据;
状态标定单元(4),整理采集的响应信号数据后输入预测模型进行训练或预测浓度;
补偿单元(5),获得温湿度单元(6)给出的温湿度信息和状态标定单元(4)给出的漂移信号后分别对温湿度和仪器漂移进行校正后将校正后数据传入状态标定单元(4)重新整理;
预测模型,对状态标定单元(4)整理后的数据进行模型训练或浓度预测。
2.根据权利要求1所述的一种智能传感器的连续采集和数据模型构建系统,其特征在于,在训练阶段,所述的采集输入模块包括:
浓度控制单元(1),调节不同样品的浓度;
样本测试单元(2),给传感器单元(3)提供调节控制下的样品浓度环境;
在预测阶段,所述的采集输入模块包括:
样品输入单元(8),给传感器单元(3)提供实时的样品浓度环境。
3.根据权利要求1或2所述的一种智能传感器的连续采集和数据模型构建系统,其特征在于,对于多组分样品的训练过程中,将各个组分从小到大标号;
初始时,所有组分浓度均处于对应设定范围内最低值或为零;
在混合样的传感过程中,依次固定其他样品组分浓度而将某一样品组分浓度从低浓度梯度到高浓度梯度,再从高浓度梯度到低浓度梯度连续变化。
4.根据权利要求1或2所述的一种智能传感器的连续采集和数据模型构建系统,其特征在于,所述的状态标定单元(4)包括:
信号输入单元(41),接收传感器单元(3)发送的响应数据、训练阶段的浓度数据以及补偿单元(5)发送的根据历史数据计算得到的校正信号;
状态识别单元(42),根据信号输入单元(41)收到的响应数据和校正信号得到校正后数据,将当前时刻的响应数据和训练阶段的浓度数据发送到补偿单元(5);
数据输出单元(43),将校正后的数据和训练阶段的浓度数据整合后发送到预测模型中。
5.根据权利要求1所述的一种智能传感器的连续采集和数据模型构建系统,其特征在于,所述的预测模型包括输入层、隐藏层和输出层,其中输入层接收传感器响应信号和环境状态数据,输出层输出样品浓度预测结果,隐藏层包含模型参数;
所述的预测模型基于多层感知机、支持向量机、决策树、随机森林、卷积神经网络、隐马尔科夫模型、循环神经网络、LSTM、Transformer模型的一种或多种进行模型训练和预测。
6.一种智能传感器的连续采集和数据模型构建方法,采用如权利要求1-5中任意一项所述的一种智能传感器的连续采集和数据模型构建系统,其特征在于,数据模型构建包括训练阶段和预测阶段;
训练阶段包括:
A1:将传感器单元置于样品测试单元,并通过浓度控制单元调节不同样品组分的浓度,进行连续数据采集;
A2:将传感器单元的响应数据和浓度控制单元处的样品浓度数据传递给状态标定单元,对采集的数据进行整理;
A3:补偿单元接受温湿度单元给出的温湿度信息和状态标定单元的漂移信号后,分别对温度和漂移进行校正后将校正后数据传递回状态标定单元;
A4:状态标定单元将该时刻数据重新整理后输入训练模型以修改模型参数;
预测阶段包括:
B1:将传感器单元置于样品输入单元;
B2:传感器单元采集到实时响应信号后传输至状态标定单元;
B3:补偿单元接受温湿度单元给出的温湿度信息和状态标定单元的漂移信号后,分别对温度和漂移进行校正后将校正后数据传递回状态标定单元;
B4:校正后的数据输入浓度预测模型,浓度预测模型动态检测传感器所处状态,并输出预测样品浓度。
7.根据权利要求6所述的一种智能传感器的连续采集和数据模型构建方法,其特征在于,通过连续数据采集得到训练数据后,采用下述三种模型训练方法之一进行处理:
方法一:将样品各组分浓度从低浓度梯度到高浓度梯度变化的数据和样品浓度从高浓度到低浓度梯度变化的数据分别构建基于多层感知机、支持向量机、决策树、随机森林、卷积神经网络、隐马尔科夫模型、循环神经网络、LSTM、Transformer模型中的一种或多种任意模型;
方法二:将样品浓度从低浓度梯度到高浓度梯度变化的数据和样品浓度从高浓度到低浓度梯度变化的数据分别加上状态特征后输入基于多层感知机、支持向量机、决策树、随机森林、卷积神经网络、隐马尔科夫模型、循环神经网络、LSTM、Transformer模型中的一种或多种任意模型;
方法三:将样品数据直接输入隐马尔可夫模型、循环神经网络、LSTM、Transformer模型中的一种。
8.根据权利要求7所述的一种智能传感器的连续采集和数据模型构建方法,其特征在于,通过连续数据采集得到预测数据后,动态检测传感器所处状态并调用不同模型或利用模型不同模式或状态给出预测结果。
9.根据权利要求6或7或8所述的一种智能传感器的连续采集和数据模型构建方法,其特征在于,预测模型的优化方法包括以下方法的一种或两种;
方法一:利用模型超参数优化方法,包括遗传算法或深度Q学习网络;
方法二:模型融合技术,将多个预测模型结果进行融合;融合后的结果o等于nc个子模型结果{oi,i∈{1,...,nc}}的线性组合或者专家模型输出结果。
10.根据权利要求9所述的一种智能传感器的连续采集和数据模型构建方法,其特征在于,线性组合若包括权重wi,则权重取子模型训练损失值的倒数wi=1/li
专家模型采用逻辑回归、支持向量机、决策树和随机森林等分类模型之一;
训练结束后,得到子模型oi在第j个训练样本{xj,yj}上的损失lij
设置模型标签ml,其中mlj=argminilij,从而得到训练数据对{xj,mlj}j
将其输入专家模型中进行训练;
预测时,先利用专家模型选择进行预测的子模型,再由该子模型输出预测结果。
CN202310553736.0A 2023-05-16 2023-05-16 一种智能传感器的连续采集和数据模型构建系统及方法 Pending CN116720078A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310553736.0A CN116720078A (zh) 2023-05-16 2023-05-16 一种智能传感器的连续采集和数据模型构建系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310553736.0A CN116720078A (zh) 2023-05-16 2023-05-16 一种智能传感器的连续采集和数据模型构建系统及方法

Publications (1)

Publication Number Publication Date
CN116720078A true CN116720078A (zh) 2023-09-08

Family

ID=87865089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310553736.0A Pending CN116720078A (zh) 2023-05-16 2023-05-16 一种智能传感器的连续采集和数据模型构建系统及方法

Country Status (1)

Country Link
CN (1) CN116720078A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117074628A (zh) * 2023-10-17 2023-11-17 山东鑫建检测技术有限公司 一种多传感器空气质量检测设备故障定位方法
CN117091799A (zh) * 2023-10-17 2023-11-21 湖南一特医疗股份有限公司 医用中心氧气供应安全智能立体监测方法及系统
CN117553864A (zh) * 2024-01-12 2024-02-13 北京宏数科技有限公司 一种基于大数据的传感器采集方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117074628A (zh) * 2023-10-17 2023-11-17 山东鑫建检测技术有限公司 一种多传感器空气质量检测设备故障定位方法
CN117091799A (zh) * 2023-10-17 2023-11-21 湖南一特医疗股份有限公司 医用中心氧气供应安全智能立体监测方法及系统
CN117091799B (zh) * 2023-10-17 2024-01-02 湖南一特医疗股份有限公司 医用中心氧气供应安全智能立体监测方法及系统
CN117074628B (zh) * 2023-10-17 2024-01-09 山东鑫建检测技术有限公司 一种多传感器空气质量检测设备故障定位方法
CN117553864A (zh) * 2024-01-12 2024-02-13 北京宏数科技有限公司 一种基于大数据的传感器采集方法及系统
CN117553864B (zh) * 2024-01-12 2024-04-19 北京宏数科技有限公司 一种基于大数据的传感器采集方法及系统

Similar Documents

Publication Publication Date Title
CN116720078A (zh) 一种智能传感器的连续采集和数据模型构建系统及方法
Vlasov et al. Nonspecific sensor arrays (" electronic tongue") for chemical analysis of liquids (IUPAC Technical Report)
US5554273A (en) Neural network compensation for sensors
Fonollosa et al. Reservoir computing compensates slow response of chemosensor arrays exposed to fast varying gas concentrations in continuous monitoring
Ciosek et al. The analysis of sensor array data with various pattern recognition techniques
Gallardo et al. An electronic tongue using potentiometric all-solid-state PVC-membrane sensors for the simultaneous quantification of ammonium and potassium ions in water
Yan et al. Correcting instrumental variation and time-varying drift: A transfer learning approach with autoencoders
Wide et al. The human-based multisensor fusion method for artificial nose and tongue sensor data
Cho et al. Wireless electronic nose system for real-time quantitative analysis of gas mixtures using micro-gas sensor array and neuro-fuzzy network
KR20210116278A (ko) 가스 감지 디바이스 및 가스 감지 디바이스를 작동시키기 위한 방법
Gallardo et al. Determination of ammonium ion employing an electronic tongue based on potentiometric sensors
CN111914870A (zh) 气体感测设备和用于操作气体感测设备的方法
Liang et al. Improving the robustness of prediction model by transfer learning for interference suppression of electronic nose
CN114049525A (zh) 气体种类和浓度识别的融合神经网络系统、装置与方法
Yao et al. Variable selection for nonlinear soft sensor development with enhanced binary differential evolution algorithm
CN113447879A (zh) 基于多应力影响的电能表计量误差预测方法、系统及装置
Pareek et al. Hybrid 3DCNN-RBM network for gas mixture concentration estimation with sensor array
CN115809427B (zh) 基于混合策略优化bp神经网络的混合气体识别方法
Głowacz et al. Comparison of various data analysis techniques applied for the classification of oligopeptides and amino acids by voltammetric electronic tongue
Barkó et al. Application of an artificial neural network (ANN) and piezoelectric chemical sensor array for identification of volatile organic compounds
Xu et al. Pattern recognition for sensor array signals using fuzzy ARTMAP
CN113988311B (zh) 质量变量的预测方法、装置、终端及存储介质
CN113804833B (zh) 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
Yezerska et al. Model-based degradation prediction on impedance data and artificial neural network for high-temperature polymer electrolyte membrane fuel cells after hydrogen starvation
Bull et al. A connectionist approach to fuel cell sensor array processing for gas discrimination

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination