CN114354530A

CN114354530A - 一种烷烃气体浓度定量检测方法及系统

Info

Publication number: CN114354530A
Application number: CN202210258871.8A
Authority: CN
Inventors: 谢馨; 朱晓飞; 张�雄; 苏志义; 蔡志斌; 涂红涛
Original assignee: Wuhan Ganwei Technology Co ltd
Current assignee: Wuhan Ganwei Technology Co ltd
Priority date: 2022-03-16
Filing date: 2022-03-16
Publication date: 2022-04-15

Abstract

本发明提供一种烷烃气体浓度定量检测方法及系统，方法包括：获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集；基于建模样本集中烷烃气体纯气的红外吸光度光谱，基于均匀实验设计和吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，对原始样本进行补充；基于补充后的样本数据，训练气体浓度预测模型；基于训练后的气体浓度预测模型对待预测烷烃气体的浓度进行预测。本发明基于吸光度的加和性原理，结合均匀实验设计或正交实验设计，或其他实验设计方法，产生加和样本光谱以解决混合气样本获取困难的问题，并通过增大训练样本的数量以优化和提高建模样本集的“代表性”，实现了对多种烷烃气体的快速检测。

Description

一种烷烃气体浓度定量检测方法及系统

技术领域

本发明涉及气体浓度检测领域，更具体地，涉及一种烷烃气体浓度定量检测方法及系统。

背景技术

当今世界，石油作为一种不可再生的稀缺资源，非常重要，但是因为石油的形成条件较为复杂，并且随着地质层的变动而流动，使得石油的勘探非常困难。在石油地质勘探过程中，录井是如何评价和发现油气层最重要的一环，通过对地质和油气的地质录井资料的分析可以科学有效地评价勘探结果、准确分析出油气藏范围，以提高勘探的成功率。石油地质勘探过程中，饱和气态烷烃的含量浓度信息是比较重要的参考数据之一。主要的气态烷烃包括CH₄、C₂H₆、C₃H₈、i-C₄H₁₀、n-C₄H₁₀、i-C₅H₁₂、n-C₅H₁₂等，由于种类较多，它们之间可以组成的混合气的种类数量巨大，实际中难以获取如此海量的混合气测试样本数据，对检测方法训练模型所采集样本数据的“代表性”带来了挑战。

另外，随着钻探装备的发展，钻探速度越来越快，对录井技术的精确性、实时性、在线性等提出了新的需求。

发明内容

本发明针对现有技术中存在的技术问题，提供一种烷烃气体浓度定量检测方法及系统，主要解决了检测方法训练模型所采集样本数据的“代表性”问题，并成功建立了一种对多种烷烃气体快速检测的解决方案。

根据本发明的第一方面，提供了一种烷烃气体浓度定量检测方法，包括：获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，其中，所述多种烷烃气体包括烷烃气体纯气和烷烃气体混合气体；

将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于均匀实验设计和吸光度的加和性原理得到不同组成烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本；基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练；将待检测烷烃气体的红外吸光度光谱输入训练后的气体浓度预测模型，获取所述气体浓度预测模型预测的待检测烷烃气体的浓度。

在上述技术方案的基础上，本发明还可以作出如下改进。

可选的，所述获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，包括：基于红外光谱仪测量不同浓度烷烃气体和氮气的红外光谱；通过如下公式计算烷烃气体的红外吸光度光谱：

A = lg(I₀/I)；

其中，I为烷烃气体的红外吸收光谱，I₀为氮气的红外吸收光谱，A为烷烃气体的红外吸光度光谱。

可选的，所述将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于均匀实验设计和吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本，包括：分别以第一设定比例和第二设定比例将所述建模样本集划分为第一训练集和第一测试集，所述第一设定比例和所述第二设定比例之和为1；分别从所述第一训练集和所述第一测试集中挑选出烷烃气体纯气样本，基于不同烷烃气体纯气的红外吸光度光谱，以吸光度的加和性原理，得到不同组合的烷烃气体纯气的混合气体的红外吸光度光谱，补充第一训练集和第一测试集的样本，得到第二训练集和第二测试集。

可选的，所述基于不同烷烃气体纯气的红外吸光度光谱，以吸光度的加和性原理，得到不同组合的烷烃气体纯气的混合气体的红外吸光度光谱，包括：

其中，

表示不同烷烃气体纯气的红外吸光度光谱，

为由不同组合烷烃气体纯气混合成的烷烃混合气体的红外吸光度光谱。

可选的，所述第二训练集和第二测试集中的样本包括不同烷烃气体纯气和不同组合烷烃气体纯气的混合气体的红外吸光度光谱，标签为不同烷烃气体纯气和不同组合烷烃气体纯气的混合气体的浓度；所述基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练，之前还包括对第二训练集和第二测试集进行样本数据预处理：对于红外光谱仪测量的烷烃气体在不同波长点的红外吸光度光谱，截取烷烃气体设定波长范围内的红外吸光度光谱，形成第三训练集和第三测试集；对所述第三训练集和所述第三测试集的样本数据进行差分吸收光谱技术即DOAS处理，得到第四训练集和第四测试集；对DOAS处理后的样本数据进行筛选，得到第五训练集和第五测试集。

可选的，所述DOAS处理后的样本数据进行筛选，得到第五训练集和第五测试集，包括：基于第四训练集或第四测试集中烷烃气体不同波长点的红外吸光度光谱和烷烃气体浓度，计算烷烃气体每一个波长点的红外吸光度光谱和烷烃气体浓度的线性相关系数；基于所述线性相关系数，对第四训练集和第四测试集中的样本数据进行筛选，得到第五训练集和第五测试集。

可选的，所述计算烷烃气体每一个波长点的红外吸光度光谱和烷烃气体浓度的线性相关系数，包括：

其中，X表示某一波长点处的红外吸光度光谱向量，Y表示浓度向量，cov(X,Y)表示 X和Y的协方差，

是X的标准差，

是Y的标准差，

为X的平均值，

为Y的平均值，下标 i表示第i个值，r表示计算的皮尔森相关系数；相应的，基于所述线性相关系数，对第四训练集和第四测试集中的样本数据进行筛选，得到第五训练集和第五测试集，包括：若r大于等于设定阈值，保留对应样本中相应波长点处的吸光度光谱数据；若r小于设定阈值，删除对应样本中相应波长点处的吸光度光谱数据。

可选的，所述基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练，包括：利用第二训练集对气体浓度预测模型进行训练，获取训练后的初始气体浓度预测模型；基于所述初始气体浓度预测模型，对所述第二训练集和所述第二测试集的烷烃气体浓度进行预测；基于预测结果，分别计算第二训练集的均方根误差RMSEC和第二测试集的均方根误差RMSEP；通过不断调整样本数据预处理的设定波长范围、DOAS处理中多项式的阶数和线性相关系数的设定阈值，或者调整气体浓度预测模型的模型参数，使得第二训练集的均方根误差RMSEC和第二测试集的均方根误差RMSEP之和最小，得到训练后的最终气体浓度预测模型。

可选的，所述气体浓度预测模型为极端随机树模型。

根据本发明的第二方面，提供一种烷烃气体浓度定量检测系统，包括：获取模块，用于获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，其中，所述多种烷烃气体包括烷烃气体纯气和烷烃气体混合气体；划分模块，用于将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本；训练模块，用于基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练；预测模块，用于将待检测烷烃气体的红外吸光度光谱输入训练后的气体浓度预测模型，获取所述气体浓度预测模型预测的待检测烷烃气体的浓度。

根据本发明的第三方面，提供了一种电子设备，包括存储器、处理器，所述处理器用于执行存储器中存储的计算机管理类程序时实现烷烃气体浓度定量检测方法的步骤。

根据本发明的第四方面，提供了一种计算机可读存储介质，其上存储有计算机管理类程序，所述计算机管理类程序被处理器执行时实现烷烃气体浓度定量检测方法的步骤。

本发明提供的一种烷烃气体浓度定量检测方法及系统，基于吸光度的加和性原理，结合均匀实验设计或正交实验设计，或其他实验设计方法，产生加和样本光谱以解决混合气样本获取困难的问题，并通过增大训练样本的数量以优化和提高建模样本集的“代表性”，实现了对多种烷烃气体的快速检测。

附图说明

图1为本发明提供的一种烷烃气体浓度定量检测方法流程图；

图2为烷烃气体的建模样本集的获取示意图；

图3为训练集和测试集的生成示意图；

图4为样本数据预处理流程示意图；

图5为七种饱和烷烃气体红外吸光度光谱对照示意图；

图6为气体浓度检测模型的训练和预测过程示意图；

图7为本发明提供的一种烷烃气体浓度定量检测系统的结构示意图；

图8为本发明提供的一种可能的电子设备的硬件结构示意图；

图9为本发明提供的一种可能的计算机可读存储介质的硬件结构示意图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

实施例一

一种烷烃气体浓度定量检测方法，参见图1，该方法主要包括：

S1，获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，其中，多种烷烃气体包括烷烃气体纯气和烷烃气体混合气体。

可以理解的是，随着钻探装备的发展，钻探速度越来越快，对录井技术的精确性、实时性、在线性等提出了新的需求。以差分吸收光谱技术即DOAS技术为基础的红外光学检测技术是满足上述需求的技术之一。

DOAS技术被广泛应用于紫外和可见光区域范围，在该波段内，特定气体存在频率较高的窄带吸收，大气或颗粒物引起的瑞利散射和米氏散射为宽带吸收，DOAS技术可以将吸收光谱中窄带部分和宽带部分分离，能有效消除瑞利散射和米氏散射带来的影响，从而提高测量的精度。

在本发明实施例中，获取多种不同浓度烷烃气体的红外吸光度光谱，其中，多种烷烃气体包括烷烃气体纯气和烷烃气体混合气体，烷烃气体纯气是指气体中只包含一种烷烃气体，烷烃气体混合气体是指气体由多种烷烃气体混合而成。本发明实施例中，烷烃气体纯气主要包括七种烷烃气体CH₄、C₂H₆、C₃H₈、i-C₄H₁₀、n-C₄H₁₀、i-C₅H₁₂、n-C₅H₁₂。

作为实施例，所述获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，包括：基于红外光谱仪测量不同浓度烷烃气体和氮气的红外吸收光谱；通过如下公式计算烷烃气体的红外吸光度光谱：

A = lg(I₀/I)；

其中，获取建模样本集的过程可参见图2，使用红外光谱仪测量不同浓度烷烃气体纯气、烷烃气体混合气和氮气，得到烷烃气体纯气、烷烃气体混合气和氮气的红外吸收光谱曲线。

通过如下公式计算出烷烃气体的红外吸光度光谱：

A = lg(I₀/I)；

其中，I为烷烃气体的红外吸收光谱，I₀为氮气的红外吸收光谱，A为红外吸光度光谱。

通过上式计算出每一种烷烃气体的红外吸光度光谱，构成建模样本集，其中，建模样本集的每一个样本数据为红外吸光度光谱，样本数据标签为烷烃气体浓度。

S2，将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于均匀实验设计和吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本。

作为实施例，所述将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于均匀实验设计和吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本，包括：分别以第一设定比例和第二设定比例将所述建模样本集划分为第一训练集和第一测试集，所述第一设定比例和所述第二设定比例之和为1；分别从所述第一训练集和所述第一测试集中挑选出烷烃气体纯气样本，基于不同烷烃气体纯气的红外吸光度光谱，以吸光度的加和性原理，得到不同组合的烷烃气体纯气的混合气体的红外吸光度光谱，补充第一训练集和第一测试集的样本，得到第二训练集和第二测试集。

可以理解的是，对于步骤S1中的建模样本集，将其按照2/3和1/3的比例划分为训练集和测试集，即第一训练集和第一测试集，可参见图3，即生成训练集和测试集的示意图。首先，根据建模样本集，划分生成第一训练集和第一测试集，其中，第一训练集和第一测试集中均包含烷烃气体纯气和烷烃气体混合气体。

在检测过程中，上述的7种烷烃气体中可能有1种或多种同时存在。这7种气体的混合气的组合方式种类数量巨大：包括气体个数不同的组合，如2种、3种目标气体的组合；也包括不同浓度梯度的组合，如低浓度与低浓度、低浓度与高浓度、高浓度与高浓度的组合等等。针对此种情况，按照均匀实验设计或正交实验设计，在保持实验样本集拥有足够“代表性”的前提下，可以显著减少混合气种类的数量，均匀试验设计是中国数学家方开泰和王元于1978年首先提出来，它是根据数论在多维数值积分中的应用原理，构造一套均匀设计表，用来进行均匀试验设计。正交试验设计则是利用正交表来安排试验。由均匀实验设计的混合气的样本集理论上可以作为全部混合气的样本集的代表。依据吸光度的加和性原理，通过各纯气气体的红外吸光度光谱，通过叠加可以得到混合气的加和光谱。

具体的，对于第一训练集或第一测试集，挑选出训练集或测试集中的所有烷烃气纯气吸光度光谱，依次按照2种气体混合、3种气体混合…、7种气体混合的方式利用吸光度的加和性原理叠加纯气的吸光度光谱以获得相应混合气的加和光谱，通过均匀实验设计来减少混合气的组合种类的数量，并将新生成的训练集或测试集的加和光谱汇总到第一训练集或第一测试集中，对第一训练集和第一测试集进行样本数据补充，补充样本数据后的训练集称为第二训练集，补充样本数据后的测试集称为第二测试集。

其中，光谱的加和性原理为，在含有多种吸光物质的溶液中，由于各吸光物质对某一波长的单色光均有吸收作用，如果各吸光物质的吸光质点之间相互不发生化学反应，当某一波长的单色光通过这样一种含有多种吸光物质的溶液时，溶液的总吸光度应等于各吸光物质的吸光度之和，这一规律称为吸光度的加和性。

公式表示如下：

其中，

表示不同烷烃气体纯气的红外吸光度光谱，

S3，基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练。

作为实施例，所述第二训练集和第二测试集中的样本包括不同烷烃气体纯气和不同组合烷烃气体纯气的混合气体的红外吸光度光谱，标签为不同烷烃气体纯气和不同组合烷烃气体纯气的混合气体的浓度；所述基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练，之前还包括对第二训练集和第二测试集进行样本数据预处理：对于红外光谱仪测量的烷烃气体在不同波长点的红外吸光度光谱，截取烷烃气体设定波长范围内的红外吸光度光谱，形成第三训练集和第三测试集；对所述第三训练集和所述第三测试集的样本数据进行DOAS处理，得到第四训练集和第四测试集；对第四训练集和第四测试集中的样本数据进行筛选，得到第五训练集和第五测试集。

可以理解的是，对于第二训练集和第二测试集，对其中的样本数据进行预处理，可参见图4，预处理包括三个处理步骤：

（1）对输入的数据集，保留波长范围1618.33~1796.89nm范围内的吸光度光谱数据。

（2）对（1）中的数据集进行DOAS处理。

（3）对（2）中的数据集利用皮尔森相关系数权重筛选法进行变量选择，保留数据集中挑选出来的波长点处的吸光度光谱数据。

可以理解的是，对于第(1)个处理步骤，在当前测试平台下，波长范围：1600.43~1879.26nm，七种饱和烷烃气体CH₄、C₂H₆、C₃H₈、i-C₄H₁₀、n-C₄H₁₀、i-C₅H₁₂、n-C₅H₁₂的红外吸光度光谱对照图如图5所示。

如图5所示，该波长范围内各烷烃气体均具有独特的吸收特征，差异较为明显。7种气体的特征吸收光谱重叠严重，存在交叉干扰的可能。对于红外光谱仪测量的不同浓度的烷烃气体在不同波长点的红外吸光度光谱，截取烷烃气体设定波长范围1600.43~1879.26nm的红外吸光度光谱，形成第三训练集和第三测试集。

对于烷烃气体的红外吸光度光谱，可能存在一些散射影响，第(2)步骤为了消除吸光度光谱中的散射影响，对吸光度光谱进行DOAS处理，得到第四训练集和第四测试集。

步骤(3)将第四训练集和第四测试集中比较好的吸光度光谱数据筛选出来，在筛选的过程中，作为实施例，所述对第四训练集和第四测试集中的样本数据进行筛选，得到第五训练集和第五测试集，包括：基于第四训练集中烷烃气体不同波长点的红外吸光度光谱和烷烃气体浓度，计算烷烃气体每一个波长点处的红外吸光度光谱向量和烷烃气体浓度向量的线性相关系数；基于所述线性相关系数，对第四训练集和第四测试集中的样本数据进行筛选，得到第五训练集和第五测试集。

具体的，根据朗伯-比尔定律可知，当一束单色光通过含有吸光物质的溶液后，溶液的吸光度与吸光物质的浓度及吸收层厚度成正比。依据吸光度与浓度的这种关系，利用皮尔森相关系数Pearson correlation coefficient权重筛选法进行变量选择。依据波长点处吸光度与浓度性质之间的皮尔森相关系数权重值与设定阈值的关系来决策波长变量的保留或舍去。皮尔森相关系数是一种线性相关系数，它可以用来反映两个变量线性相关程度，计算公式如下：

是X的标准差，

是Y的标准差，

为X的平均值，

为Y的平均值，下标 i表示第i个值，r表示计算的皮尔森相关系数。

若红外吸光度光谱与浓度之间的皮尔森相关系数r，其取值在-1到1之间，大于等于设定阈值，比如，设定阈值为0.9，则r≥0.90，保留对应样本在相应波长点处的吸光度光谱数据；若r﹤0.90，删除对应样本在相应波长点处的吸光度数据，筛选后的样本数据形成第五训练集和第五测试集。

基于第二训练集和第二测试集，对气体浓度预测模型进行训练，训练的过程可参见图6所示，作为实施例，所述基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练，包括：利用第二训练集对气体浓度预测模型进行训练，获取训练后的初始气体浓度预测模型；基于所述初始气体浓度预测模型，对所述第二训练集和所述第二测试集的烷烃气体浓度进行预测；基于预测结果，分别计算第二训练集的均方根误差RMSEC和第二测试集的均方根误差RMSEP；通过不断调整样本数据预处理的设定波长范围、DOAS处理中多项式的阶数和线性相关系数的设定阈值，或者调整气体浓度预测模型的模型参数，使得第二训练集的均方根误差RMSEC和第二测试集的均方根误差RMSEP之和最小，得到训练后的最终气体浓度预测模型。

具体的，基于第二训练集，对气体浓度预测模型进行训练，得到训练后的初始气体浓度预测模型，基于初始气体浓度预测模型，对第二训练集和第二测试集中的样本数据进行预测，得到烷烃气体的预测浓度值，分别计算训练集的均方根误差RMSEC和测试集的均方根误差RMSEP，将训练集的均方根误差RMSEC和测试集的均方根误差RMSEP相加。通过不断调整样本数据预处理的参数，如设定波长范围、DOAS处理中多项式的阶数和线性相关系数的设定阈值，以及不断调整气体浓度预测模型的模型参数，使得训练集的均方根误差RMSEC和测试集的均方根误差RMSEP之和最小，得到训练后的最终气体浓度预测模型，并可以利用验证样本集对最终气体浓度预测模型进行验证，计算验证样本集的均方根误差RMSE。

其中，在Python的Scikit-learn库中包含了众多集成学习方法，如：随机森林、Adaboost、GBRT、Bagging、ExtraTrees等，可以很方便的调用。经过比较和评估，极端随机树Extremely randomized trees算法效果最佳，因此，本发明实施例中的气体浓度预测模型为极端随机树模型。不同模型的评价指标为：i)相同条件下的耗时；ii)预测均方差RMSE，计算公式为：

其中，n表示参与预测的样本数，

是第i个样本的真实值，

是第i个样本的预测值。

其中，七种烷烃气体的浓度范围可见下表1：

表1 七种烷烃气体的浓度范围

七种烷烃气体在五种集成学习算法应用中的耗时对照表可参见下表2：

表2 七种烷烃气体在五种集成学习算法应用中的耗时对照表

根据表2所示，相同条件下，极端随机树模型ExtraTrees集成学习算法的用时最短。

七种烷烃气体在五种集成学习算法应用中的均方根误差对照表可参见表3：

表3 七种烷烃气体在五种集成学习算法应用中的均方根误差对照表

根据表3所示，相同条件下，ExtraTrees集成学习算法的均方根误差RMSE最小。

S4，将待检测烷烃气体的红外吸光度光谱输入训练后的气体浓度预测模型，获取所述气体浓度预测模型预测的待检测烷烃气体的浓度。

可以理解的是，基于训练后的最终气体浓度预测模型，将待检测烷烃气体的红外吸光度光谱输入最终气体浓度预测模型中，获取待检测烷烃气体的预测浓度。

实施例二

一种烷烃气体浓度定量检测系统，参见图7，该系统包括获取模块701、划分模块702、训练模块703和预测模块704，其中：

获取模块701，用于获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，其中，所述多种烷烃气体包括烷烃气体纯气和烷烃气体混合气体；划分模块702，用于将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本；训练模块703，用于基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练；预测模块704，用于将待检测烷烃气体的红外吸光度光谱输入训练后的气体浓度预测模型，获取所述气体浓度预测模型预测的待检测烷烃气体的浓度。

可以理解的是，本发明提供的一种烷烃气体浓度定量检测系统与前述各实施例提供的烷烃气体浓度定量检测方法相对应，烷烃气体浓度定量检测系统的相关技术特征可参考烷烃气体浓度定量检测方法的相关技术特征，在此不再赘述。

实施例三

请参阅图8，图8为本发明实施例提供的电子设备的实施例示意图。如图8所示，本发明实施例提了一种电子设备800，包括存储器810、处理器820及存储在存储器810上并可在处理器820上运行的计算机程序811，处理器820执行计算机程序811时实现实施例一的烷烃气体浓度定量检测方法的步骤。

实施例四

请参阅图9，图9为本发明提供的一种计算机可读存储介质的实施例示意图。如图9所示，本实施例提供了一种计算机可读存储介质900，其上存储有计算机程序911，该计算机程序911被处理器执行时实现实施例一的烷烃气体浓度定量检测方法的步骤。

本发明实施例提供的一种烷烃气体浓度定量检测方法及系统，基于吸光度的加和性原理，结合均匀实验设计或正交实验设计，或其他实验设计方法，产生加和样本光谱以解决混合气样本获取困难的问题；基于红外光谱测试平台，结合DOAS技术、皮尔森相关系数权重变量选择方法，以及极端随机树算法，，成功建立了一种对七种饱和烷烃气体进行快速检测的方法。

需要说明的是，在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其它实施例的相关描述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质，包括但不限于磁盘存储器、CD-ROM、光学存储器等，上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备或系统、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包括这些改动和变型在内。

Claims

1.一种烷烃气体浓度定量检测方法，其特征在于，包括：

获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，其中，所述多种烷烃气体包括烷烃气体纯气和烷烃气体混合气体；

将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于均匀实验设计和吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本；

基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练；

将待检测烷烃气体的红外吸光度光谱输入训练后的气体浓度预测模型，获取所述气体浓度预测模型预测的待检测烷烃气体的浓度。

2.根据权利要求1所述的烷烃气体浓度定量检测方法，其特征在于，所述获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，包括：

基于红外光谱仪测量不同浓度烷烃气体和氮气的红外吸收光谱；

通过如下公式计算烷烃气体的红外吸光度光谱：

A = lg(I₀/I)；

3.根据权利要求1所述的烷烃气体浓度定量检测方法，其特征在于，所述将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于均匀实验设计和吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本，包括：

分别以第一设定比例和第二设定比例将所述建模样本集划分为第一训练集和第一测试集，所述第一设定比例和所述第二设定比例之和为1；

分别从所述第一训练集和所述第一测试集中挑选出烷烃气体纯气样本，基于不同烷烃气体纯气的红外吸光度光谱，以吸光度的加和性原理，得到不同组合的烷烃气体纯气的混合气体的红外吸光度光谱，补充第一训练集和第一测试集的样本，得到第二训练集和第二测试集。

4.根据权利要求1所述的烷烃气体浓度定量检测方法，其特征在于，所述基于不同烷烃气体纯气的红外吸光度光谱，以吸光度的加和性原理，得到不同组合的烷烃气体纯气的混合气体的红外吸光度光谱，包括：

其中，

表示不同烷烃气体纯气的红外吸光度光谱，

5.根据权利要求1-3任一项所述的烷烃气体浓度定量检测方法，其特征在于，所述第二训练集和第二测试集中的样本包括不同烷烃气体纯气和不同组合烷烃气体纯气的混合气体的红外吸光度光谱，标签为不同烷烃气体纯气和不同组合烷烃气体纯气的混合气体的浓度；

所述基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练，之前还包括对第二训练集和第二测试集进行样本数据预处理：

对于红外光谱仪测量的烷烃气体在不同波长点的红外吸光度光谱，截取烷烃气体设定波长范围内的红外吸光度光谱，形成第三训练集和第三测试集；

对所述第三训练集和所述第三测试集中的红外吸光度光谱进行差分吸收光谱技术即DOAS处理，得到第四训练集和第四测试集；

对DOAS处理后的样本数据进行筛选，得到第五训练集和第五测试集。

6.根据权利要求5所述的烷烃气体浓度定量检测方法，其特征在于，所述对DOAS处理后的样本数据进行筛选，得到第五训练集和第五测试集，包括：

基于第四训练集或第四测试集中烷烃气体不同波长点的红外吸光度光谱和烷烃气体浓度，计算烷烃气体每一个波长点的红外吸光度光谱和烷烃气体浓度的线性相关系数；

基于所述线性相关系数，对第四训练集和第四测试集中的样本数据进行筛选，得到第五训练集和第五测试集。

7.根据权利要求6所述的烷烃气体浓度定量检测方法，其特征在于，所述计算烷烃气体每一个波长点的红外吸光度光谱和烷烃气体浓度的线性相关系数，包括：

其中，X表示某一波长点处的红外吸光度光谱向量，Y表示浓度向量，cov(X,Y)表示X和Y 的协方差，

是X的标准差，

是Y的标准差，

为X的平均值，

为Y的平均值，下标i表示第i个值，r表示计算的皮尔森相关系数；

相应的，基于所述线性相关系数，对第四训练集和第四测试集中的样本数据进行筛选，得到第五训练集和第五测试集，包括：

若r大于等于设定阈值，保留对应样本中相应波长点处的吸光度光谱数据；若r小于设定阈值，删除对应样本中相应波长点处的吸光度光谱数据。

8.根据权利要求5所述的烷烃气体浓度定量检测方法，其特征在于，所述基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练，包括：

利用第二训练集对气体浓度预测模型进行训练，获取训练后的初始气体浓度预测模型；

基于所述初始气体浓度预测模型，对所述第二训练集和所述第二测试集的烷烃气体浓度进行预测；

基于预测结果，分别计算第二训练集的均方根误差RMSEC和第二测试集的均方根误差RMSEP；

通过不断调整样本数据预处理的设定波长范围、DOAS处理中多项式的阶数和线性相关系数的设定阈值，或者调整气体浓度预测模型的模型参数，使得第二训练集的均方根误差RMSEC和第二测试集的均方根误差RMSEP之和最小，得到训练后的最终气体浓度预测模型。

9.根据权利要求1所述的烷烃气体浓度定量检测方法，其特征在于，所述气体浓度预测模型为极端随机树模型。

10.一种烷烃气体浓度定量检测系统，其特征在于，包括：

获取模块，用于获取多种不同浓度烷烃气体的红外吸光度光谱，构成建模样本集，其中，所述多种烷烃气体包括烷烃气体纯气和烷烃气体混合气体；

划分模块，用于将建模样本集划分为第一训练集和第一测试集，根据第一训练集和第一测试集中的烷烃气体纯气的红外吸光度光谱，基于吸光度的加和性原理得到不同组合烷烃气体纯气的混合气体的红外吸光度光谱，以补充第一训练集和第一测试集的样本；

训练模块，用于基于补充样本后的第二训练集和第二测试集，对气体浓度预测模型进行训练；

预测模块，用于将待检测烷烃气体的红外吸光度光谱输入训练后的气体浓度预测模型，获取所述气体浓度预测模型预测的待检测烷烃气体的浓度。