CN117540144A

CN117540144A - 一种矿物油分类方法及计算机可读存储介质、电子设备

Info

Publication number: CN117540144A
Application number: CN202311245603.3A
Authority: CN
Inventors: 李杏梅; 范朋沅; 王瑾
Original assignee: Fulun Ruisheng Technology Suzhou Co ltd; China University of Geosciences
Current assignee: Fulun Ruisheng Technology Suzhou Co ltd; China University of Geosciences
Priority date: 2023-09-25
Filing date: 2023-09-25
Publication date: 2024-02-09

Abstract

本发明公开一种矿物油分类方法，该方法使用格拉姆角场算法将归一化的一维光谱数据编码为光谱的二维特征图像；并生成正负样本；基于DenseCL网络构建矿物油分类训练模型，包括正样本特征提取分支和负样本特征提取分支，正样本训练分支包括一个在线编码器，负样本训练分支包括一个动量编码器，两个编码器都包括骨干网和投影头，投影头包括全局投影头和密集投影头；基于全局对比损失函数和密集对比损失函数，更新在线编码器和动量编码器参数；提取训练模型中的骨干网，得到矿物油分类模型。本发明将一维数据转换为二维图像数据后，不仅可以保持原光谱序列的波长相关性和波长依赖性，还可以更好地发挥基于DenseCL的分类模型分类识别的优势，使分类结果更准确。

Description

一种矿物油分类方法及计算机可读存储介质、电子设备

技术领域

本发明涉及深度学习技术领域，尤其涉及一种矿物油分类方法及计算机可读存储介质、电子设备。

背景技术

随着全球工业经济的快速发展，石油及其产品已经逐渐成为社会生产建设的重要战略物资。在石油的勘探、采集、生产、储运过程中通过管道泄漏、运油船舶事故等形式产生的溢油事故也愈演愈烈，给地球的自然生态环境带来了巨大的威胁，而针对各种矿物油的检测识别也成为一大热门研究方向。

利用荧光法完成油品种类的识别，需要对大量的油品荧光光谱数据进行特征提取和分析。但要获取大量的带标签的荧光光谱样本所耗费的时间和人工成本太大，不利于有监督分类器进行训练；同时，目前采用的利用荧光光谱进行油品分类的方法，大多是经过预处理和特征提取后直接进行分类，没有有效利用光谱所包含的空间信息，目前的算法对一维荧光光谱数据进行分类识别不具备优势，分类结果精度不是很高。

发明内容

为了解决上述问题，本发明提供一种矿物油分类方法，包括以下步骤：

S1、使用荧光法获取矿物油原始一维荧光光谱数据，并对原始一维荧光光谱数据进行预处理，得到预处理后的一维荧光光谱数据；

S2、使用格拉姆角场算法将预处理后的一维荧光光谱数据编码为荧光光谱的二维特征图像；

S3、对荧光光谱的二维特征图像通过数据增强的方式生成正负样本；

S4、基于DenseCL网络构建矿物油分类训练模型，所述训练模型包括两个分支，正样本特征提取分支和负样本特征提取分支，正样本特征提取分支包括一个在线编码器，负样本特征提取分支包括一个动量编码器，两个编码器都包括骨干网和投影头，投影头包括全局投影头和密集投影头；

正样本输入在线编码器的骨干网提取初步特征，正样本初步特征输入在线编码器的全局投影头提取正样本的全局图像特征向量，正样本初步特征输入在线编码器的密集投影头提取正样本的密集特征向量；

负样本输入动量编码器的骨干网提取初步特征，负样本初步特征输入动量编码器的全局投影头提取负样本的全局图像特征向量，负样本初步特征输入动量编码器的密集投影头提取负样本的密集特征向量；

其中，正样本的全局图像特征向量和负样本的全局图像特征向量通过全局对比损失函数的约束来实现对比学习；正样本的密集特征向量和负样本的密集特征向量通过密集对比损失函数的约束来实现对比学习；

基于全局对比损失函数和密集对比损失函数，更新在线编码器和动量编码器参数；

S5、提取所述矿物油分类训练模型中的骨干网，构建矿物油分类模型，将待检测的荧光光谱的二维特征图像输入矿物油分类模型，得到矿物油分类结果。

进一步地，步骤S1中，将原始一维荧光光谱数据进行归一化的方式进行预处理：

X＝{x₁，x₂，…，x_n}表示原始一维荧光光谱数据，n为样本数量，max(X)表示X中的最大值，min(X)表示X中的最小值，x_i表示X＝{x₁，x₂，…，x_n}中的第i个数，表示x_i经过归一化预处理后的一维荧光光谱数据。

进一步地，S2具体为：

S21、将预处理后的一维荧光光谱数据映射到极坐标系，将预处理后的一维荧光光谱数据编码为角度α，并将波长编码为半径R：

其中，为预处理后的一维荧光光谱数据，/>为中的第i个数，α_i表示角度，R表示半径，λ_i为/>对应的波长，N为用于正则化极坐标系统跨度的常数。

S22、使用格拉姆角场将映射到极坐标系的预处理后的一维荧光光谱数据转换为二维特征图像，其中，格拉姆和角场为：

上式写为：

其中，i为格拉姆和角场矩阵的行数，j为格拉姆和角场矩阵的列数，I为单位行向量，为预处理后的一维荧光光谱数据，/>为/>的转置；

格拉姆差角场为：

上式写为：

通过格拉姆和角场或格拉姆差角场，将预处理后的一维荧光光谱数据转换为二维特征图像。

进一步地，全局对比损失函数用下式表示：

其中，表示全局对比损失，τ为温度超参数，q表示经过在线编码器全局投影头提取出来的全局图像特征向量，k₊表示q的正键，k-表示q的负键。

进一步地，密集对比损失函数用下式表示：

其中，表示密集对比损失，S表示生成的密集特征图的空间大小，S²表示特征向量的数量，r^S表示S²个特征向量中的第S个，/>表示r^S的正键，/>表示r^S的负键，τ为温度超参数。

进一步地，通过矿物油分类训练模型的损失函数对在线编码器进行梯度回传，更新在线编码器参数；

矿物油分类训练模型的损失函数为：

其中λ表示权重。

进一步地，动量编码器通过下式更新参数：

其中，和/>分别表示在线编码器和动量编码器在训练中第i次迭代的参数，k表示动量系数，取值范围从0到1。

进一步地，在将待检测的荧光光谱的二维特征图像输入矿物油分类模型之前，使用带标记的荧光光谱的二维特征图像对所述矿物油分类模型进行调优。

本发明还提出一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述一种矿物油分类方法的步骤。

本发明还提出一种电子设备，包括处理器和存储器，所述处理器与所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括计算机可读指令，所述处理器被配置用于调用所述计算机可读指令，执行上述一种矿物油分类方法。

本发明提供的技术方案带来的有益效果是：

本发明提出了将矿物油的荧光光谱数据通过GAF(Gramian Angular Field,格拉姆角场)进行编码的方式，将一维光谱序列转换为荧光光谱的二维GAF图像数据集，基于DenseCL(Dense Contrastive Learning,自监督视觉预训练的密集对比学习)构建矿物油分类训练模型，使用二维GAF图像数据集训练矿物油分类训练模型，得到最终的矿物油分类模型用于矿物油分类，二维GAF图像数据集不仅可以保持原荧光光谱序列的波长相关性和荧光光谱信号的波长依赖性，一维数据转换为二维图像数据后，可以更好地发挥基于DenseCL的分类模型分类识别的优势，使分类结果更准确。

附图说明

图1是本发明实施一种矿物油分类方法的流程图；

图2是本发明实施例原始荧光光谱；

图3是本发明实施例GAF编码后的荧光光谱图像；

图4是本发明实施例基于DenseCL网络构建矿物油分类训练模型；

图5是本发明实施例矿物油荧光光谱数据；

图6是本发明实施例一示例性实施例中的一种电子设备的框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地描述。

本实施例的一种矿物油分类方法的流程图如图1，具体包括以下步骤：

S1、使用荧光法获取矿物油原始一维荧光光谱数据，并对原始一维荧光光谱数据进行预处理，得到预处理后的一维荧光光谱数据。

具体地，将原始一维荧光光谱数据进行归一化的方式进行预处理：

或/>

X＝{x₁，x₂，…，x_n}表示原始一维荧光光谱数据，n为样本数量，max(X)表示X中的最大值，min(x)表示X中的最小值，x_i表示X＝{x₁，x₂，…，x_n}中的第i个数，表示x_i经过归一化预处理后的一维荧光光谱数据，将原始数据内的所有数值放缩进区间[-1,1]或者[0,1]内。

S2、使用格拉姆角场算法将预处理后的一维荧光光谱数据编码为荧光光谱的二维特征图像。

具体为：

其中，为预处理后的一维荧光光谱数据，/>为中的第i个数，α_i表示角度，R表示半径，λ_i为/>对应的波长，N为用于正则化极坐标系统跨度的常数。当α∈[0,π]时，cos(α)是单调的。随着波长的变化，归一化之后的数值映射到极坐标系中有且仅有一个结果，与其极坐标形式互为双射，确保了该编码方式的唯一性。

S22、使用格拉姆角场将映射到极坐标系的预处理后的一维荧光光谱数据转换为二维特征图像，通过考虑每个点之间角度差或角度和的值来反映不同波段间隔内的相关性，其中，格拉姆和角场为：

上式写为：

格拉姆差角场为：

上式写为：

通过上述变换可将一维荧光光谱数据转化为沿对角线对称的二维特征图像，矩阵中的主对角线由原始光谱序列经过归一化后组成，可以有效地表示原荧光光谱序列的波长相关性。极坐标中的半径R和波段有关，随着矩阵中元素位置的从左到右，从上到下，其对应的波长也随之增加，保证了编码后的GAF图像的横纵坐标按照波长的顺序增加，可以保持荧光光谱信号的波长依赖性。本发明实施例原始荧光光谱如图2所示，本发明实施例GAF编码后的荧光光谱图像如图3所示。

S3、对荧光光谱的二维特征图像通过数据增强的方式生成正负样本。

S4、基于DenseCL网络构建矿物油分类训练模型，所述训练模型包括两个分支，正样本特征提取分支和负样本特征提取分支，正样本特征提取分支包括一个在线编码器，负样本特征提取分支包括一个动量编码器，两个编码器都包括骨干网和投影头，投影头包括全局投影头和密集投影头。全局投影头对骨干特征进行全局合并，并为每幅图像输出一个单一的全局特征向量；密集投影头以骨干网初步提取的特征作为输入，生成密集的特征向量，同时保留了空间信息并构造了一种密集的输出格式。

正样本输入在线编码器的骨干网提取初步特征，正样本初步特征输入在线编码器的全局投影头提取正样本的全局图像特征向量；正样本初步特征输入在线编码器的密集投影头提取正样本的密集特征向量。

负样本输入动量编码器的骨干网提取初步特征，负样本初步特征输入动量编码器的全局投影头提取负样本的全局图像特征向量；负样本初步特征输入动量编码器的密集投影头提取负样本的密集特征向量。

通过提取图片正负样本对间的对应关系，定义每个局部特征向量的正样本。分别计算全局特征向量正负样本对之间的对比损失函数和密集特征向量正负样本对之间的密集对比损失函数，基于全局对比损失函数和密集对比损失函数，更新在线编码器和动量编码器参数，最终得到模型的损失函数。

其中，正样本的全局图像特征向量和负样本的全局图像特征向量通过全局对比损失函数的约束来实现对比学习；正样本的密集特征向量和负样本的密集特征向量通过密集对比损失函数的约束来实现对比学习。

全局对比损失函数用下式表示：

其中，表示全局对比损失，τ为温度超参数，q表示经过在线编码器全局投影头提取出来的全局图像特征向量，k₊表示q的正键，k_-表示q的负键，其中一个正键k₊与q匹配，q的正键k₊编码的是同一图像的不同视图，而负键k_-编码的是不同图像的视图。

密集对比损失函数用下式表示：

其中，表示密集对比损失，S表示生成的密集特征图的空间大小，密集投影头生成的S_h×S_w个特征向量，S_h和S_w可以是不同的，为方便描述，令S_h＝S_w＝S，S²表示特征向量的数量，r^S表示S²个特征向量中的第S个，/>表示r^S的正键，/>表示r^S的负键，每个负键t_-是来自不同图像的特征向量，正键t₊是根据图片间的对应关系来分配的，是同一图像经过数据增强后得到的图像的S²个特征向量中的一个，τ为温度超参数。

通过矿物油分类训练模型的损失函数对在线编码器进行梯度回传，更新在线编码器参数。

矿物油分类训练模型的损失函数为：

其中λ表示权重，具体地，本实施例中设置为0.5。

动量编码器通过下式更新参数：

其中，和/>分别表示在线编码器和动量编码器在训练中第i次迭代的参数，k表示动量系数，取值范围从0到1，在对比学习中，动量系数越大，通常学习能力越强，本实施例中取k的值为0.9。

本发明实施例基于DenseCL网络构建矿物油分类训练模型如图4所示，其中A₁、A₂表示两种随机的数据增强组合，包括随即裁剪、随机翻转、高斯模糊等，目的是尽可能地放大生成的两个图片之间的差异。x^q表示图片经过数据增强生成的正样本，x^k表示图片经过数据增强生成的负样本。q、k分别表示正负样本经过各自分支的全局投影头提取出来的全局图像特征向量；r⁰、r¹…表示正样本经过正样本分支的密集投影头提取出来的密集特征向量，t⁰、t¹…表示负样本经过负样本分支的密集投影头提取出来的密集特征向量。

该模型主要由一个用于初步提取特征的骨干和两个用于特征向量细化的特征投影头组成。编码器输出的特征向量受到损失函数的约束来实现对比学习。在线编码器和动量编码器的主干都采用了残差网络(ResNet-50)。

S5、提取所述矿物油分类训练模型中的骨干网，构建矿物油分类模型，在将待检测的荧光光谱的二维特征图像输入矿物油分类模型之前，使用带标记的荧光光谱的二维特征图像对所述矿物油分类模型进行调优。将待检测的荧光光谱的二维特征图像输入矿物油分类模型，得到矿物油分类结果。

实施后的效果

采用ResNet作为主干，预训练阶段参数设置如下：温度超参数τ为0.2、损失函数权重λ为0.5，动量系数k为0.9，批大小为32，训练200个epoch，初始学习率设置为0.001，权重衰减为1×10^-5。数据增强方式为随机裁剪、随机翻转、随机旋转、高斯模糊四种随机选择。微调阶段使用经过基于GAF的DenseCL预训练的ResNet作为分类器的主干，批大小为16，训练120个epoch，初始学习率设置为0.005，权重衰减为1×10^-4。

实验用到的油品荧光光谱数据采用Thorlabs公司的Czerny-Turner光谱仪采集，波段范围195nm-1015nm，共采集10种不同油品数据6769条。全部的例矿物光谱数据如图5所示。

在分类任务中，我们常用表格形式的混淆矩阵作为评估模式。具体可以分为四种情况，分类结果的判断如表1。

表1分类结果的判断

其中，True Positive(TP)表示预测为正例，实际为正例，算法预测正确；FalsePositive(FP)表示预测为正例，实际为负例，算法预测错误；True Negative(TN)表示预测为负例，实际为负例，算法预测正确；False Negative(FN)表示预测为负例，实际为正例，算法预测错误。

实验中采用准确率A、精确率P、召回率R和F1 Score作为分类结果的评估标准，具体定义如下。

准确率A：预测正确的样本数占总样本数的个数，反映的是模型算法整体性能，公式如下：

精确率P：反映的是预测为正的样本里真的为正的样本所占的比例，公式如下：

召回率R：反映的是被预测为正样本的数量占全体正样本数量的比例，因为会有一些正样本被误判为负样本，公式如下：

F1 Score：F1 Score是精确率P和召回率R的加权调和平均数，并假设两者一样重要。公式如下：

各算法分类结果准确率A对比如表2所示：

表2各算法分类结果准确率A对比

算法	SVM	KNN	GAF-ResNet50	GAF-DenseCL
					A	78.8％	84.8％	88.48％	97.71％

通过表2可以看到，从总体性能上来说，本发明的方法：基于GAF和DenseCL的矿物油分类模型(GAF-DenseCL模型)的分类准确率明显优于KNN(K-NearestNeighbor,K近邻算法)、SVM(Support Vector Machine,支持向量机)这些传统的处理一维数据的分类方法，与SVM、KNN的分类效果相比，准确率分别提升了24％、15.22％；相较于没有经过Dense-CL网络预训练的ResNet50来说，分类结果的准确率提升了10.43％。

各算法分类结果精确率P对比如表3所示，各算法分类结果召回率R对比如表4所示，各算法分类结果F1-Score对比如表5所示。可以看出本发明的方法(GAF-DenseCL)相对于SVM、KNN、GAF-ResNet50在精确率P、召回率R和F1 Score的评估标准下，矿物油的分类准确率较高。

表3各算法分类结果精确率P对比

	SVM	KNN	GAF-ResNet50	GAF-DenseCL
					变压器油	99.12％	91.56％	95.12％	97.58％
齿轮油	95.2％	91.72％	97.86％	99.29％
					防锈油	40.51％	90.35％	66.19％	97.60％
机油	99.02％	98.26％	92.31％	99.17％
					空压机油	92.15％	80.83％	97.25％	100.00％
摩托车油	99.26％	76.17％	94.74％	99.34％
					潜水泵油	86.33％	62.98％	58.06％	85.71％
润滑油	72.85％	91.52％	98.77％	100.00％
					液压油	95.69％	87.30％	89.47％	97.33％
真空泵油	91.00％	86.87％	93.60％	99.21％

表4各算法分类结果召回率R对比

	SVM	KNN	GAF-ResNet50	GAF-DenseCL
					变压器油	85.31％	67.65％	96.69％	100.00％
齿轮油	79.25％	95％	97.86％	99.29％
					防锈油	96.14％	47.14％	65.71％	87.14％
机油	82.75％	95.29％	90.76％	100.00％
					空压机油	85.56％	99.01％	87.60％	100.00％
摩托车油	83.44％	92.21％	93.51％	98.05％
					潜水泵油	26.47％	99.44％	67.92％	96.23％
润滑油	79.96％	80.31％	96.39％	99.40％
					液压油	80.63％	82.55％	91.89％	98.65％
真空泵油	83.82％	95.56％	92.86％	99.21％

表5各算法分类结果F1-Score对比

在一示例性实施例中，包括一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述的矿物油分类方法的步骤。

请参阅图6，在一示例性实施例中，还包括一种电子设备，包括至少一处理器、至少一存储器、以及至少一通信总线。

其中，存储器上存储有计算机程序，计算机程序包括计算机可读指令，处理器通过通信总线调用存储器中存储的计算机可读指令，执行上述的矿物油分类方法。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种矿物油分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种矿物油分类方法，其特征在于，步骤S1中，将原始一维荧光光谱数据进行归一化的方式进行预处理：

3.根据权利要求1所述的一种矿物油分类方法，其特征在于，S2具体为：

上式写为：

格拉姆差角场为：

上式写为：

4.根据权利要求1所述的一种矿物油分类方法，其特征在于，全局对比损失函数用下式表示：

其中，表示全局对比损失，τ为温度超参数，q表示经过在线编码器全局投影头提取出来的全局图像特征向量，k₊表示q的正键，k_-表示q的负键。

5.根据权利要求1所述的一种矿物油分类方法，其特征在于，密集对比损失函数用下式表示：

6.根据权利要求1所述的一种矿物油分类方法，其特征在于，通过矿物油分类训练模型的损失函数对在线编码器进行梯度回传，更新在线编码器参数；

矿物油分类训练模型的损失函数为：

其中λ表示权重。

7.根据权利要求1所述的一种矿物油分类方法，其特征在于，动量编码器通过下式更新参数：

8.根据权利要求1所述的一种矿物油分类方法，其特征在于，在将待检测的荧光光谱的二维特征图像输入矿物油分类模型之前，使用带标记的荧光光谱的二维特征图像对所述矿物油分类模型进行调优。

9.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现如权利要求1-8任一所述方法的步骤。

10.一种电子设备，其特征在于，包括处理器和存储器，所述处理器与所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括计算机可读指令，所述处理器被配置用于调用所述计算机可读指令，执行如权利要求1-8任一项所述的方法。