CN117540144A - 一种矿物油分类方法及计算机可读存储介质、电子设备 - Google Patents
一种矿物油分类方法及计算机可读存储介质、电子设备 Download PDFInfo
- Publication number
- CN117540144A CN117540144A CN202311245603.3A CN202311245603A CN117540144A CN 117540144 A CN117540144 A CN 117540144A CN 202311245603 A CN202311245603 A CN 202311245603A CN 117540144 A CN117540144 A CN 117540144A
- Authority
- CN
- China
- Prior art keywords
- mineral oil
- fluorescence spectrum
- encoder
- dimensional
- dense
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002480 mineral oil Substances 0.000 title claims abstract description 62
- 235000010446 mineral oil Nutrition 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 32
- 238000013145 classification model Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 238000002189 fluorescence spectrum Methods 0.000 claims description 71
- 239000013598 vector Substances 0.000 claims description 46
- 230000006870 function Effects 0.000 claims description 29
- 239000000284 extract Substances 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 238000002795 fluorescence method Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 abstract description 6
- 239000003921 oil Substances 0.000 description 17
- 238000012706 support-vector machine Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000010725 compressor oil Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012208 gear oil Substances 0.000 description 2
- 239000010720 hydraulic oil Substances 0.000 description 2
- 239000010687 lubricating oil Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000010705 motor oil Substances 0.000 description 2
- 239000003208 petroleum Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Algebra (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明公开一种矿物油分类方法,该方法使用格拉姆角场算法将归一化的一维光谱数据编码为光谱的二维特征图像;并生成正负样本;基于DenseCL网络构建矿物油分类训练模型,包括正样本特征提取分支和负样本特征提取分支,正样本训练分支包括一个在线编码器,负样本训练分支包括一个动量编码器,两个编码器都包括骨干网和投影头,投影头包括全局投影头和密集投影头;基于全局对比损失函数和密集对比损失函数,更新在线编码器和动量编码器参数;提取训练模型中的骨干网,得到矿物油分类模型。本发明将一维数据转换为二维图像数据后,不仅可以保持原光谱序列的波长相关性和波长依赖性,还可以更好地发挥基于DenseCL的分类模型分类识别的优势,使分类结果更准确。
Description
技术领域
本发明涉及深度学习技术领域,尤其涉及一种矿物油分类方法及计算机可读存储介质、电子设备。
背景技术
随着全球工业经济的快速发展,石油及其产品已经逐渐成为社会生产建设的重要战略物资。在石油的勘探、采集、生产、储运过程中通过管道泄漏、运油船舶事故等形式产生的溢油事故也愈演愈烈,给地球的自然生态环境带来了巨大的威胁,而针对各种矿物油的检测识别也成为一大热门研究方向。
利用荧光法完成油品种类的识别,需要对大量的油品荧光光谱数据进行特征提取和分析。但要获取大量的带标签的荧光光谱样本所耗费的时间和人工成本太大,不利于有监督分类器进行训练;同时,目前采用的利用荧光光谱进行油品分类的方法,大多是经过预处理和特征提取后直接进行分类,没有有效利用光谱所包含的空间信息,目前的算法对一维荧光光谱数据进行分类识别不具备优势,分类结果精度不是很高。
发明内容
为了解决上述问题,本发明提供一种矿物油分类方法,包括以下步骤:
S1、使用荧光法获取矿物油原始一维荧光光谱数据,并对原始一维荧光光谱数据进行预处理,得到预处理后的一维荧光光谱数据;
S2、使用格拉姆角场算法将预处理后的一维荧光光谱数据编码为荧光光谱的二维特征图像;
S3、对荧光光谱的二维特征图像通过数据增强的方式生成正负样本;
S4、基于DenseCL网络构建矿物油分类训练模型,所述训练模型包括两个分支,正样本特征提取分支和负样本特征提取分支,正样本特征提取分支包括一个在线编码器,负样本特征提取分支包括一个动量编码器,两个编码器都包括骨干网和投影头,投影头包括全局投影头和密集投影头;
正样本输入在线编码器的骨干网提取初步特征,正样本初步特征输入在线编码器的全局投影头提取正样本的全局图像特征向量,正样本初步特征输入在线编码器的密集投影头提取正样本的密集特征向量;
负样本输入动量编码器的骨干网提取初步特征,负样本初步特征输入动量编码器的全局投影头提取负样本的全局图像特征向量,负样本初步特征输入动量编码器的密集投影头提取负样本的密集特征向量;
其中,正样本的全局图像特征向量和负样本的全局图像特征向量通过全局对比损失函数的约束来实现对比学习;正样本的密集特征向量和负样本的密集特征向量通过密集对比损失函数的约束来实现对比学习;
基于全局对比损失函数和密集对比损失函数,更新在线编码器和动量编码器参数;
S5、提取所述矿物油分类训练模型中的骨干网,构建矿物油分类模型,将待检测的荧光光谱的二维特征图像输入矿物油分类模型,得到矿物油分类结果。
进一步地,步骤S1中,将原始一维荧光光谱数据进行归一化的方式进行预处理:
X={x1,x2,…,xn}表示原始一维荧光光谱数据,n为样本数量,max(X)表示X中的最大值,min(X)表示X中的最小值,xi表示X={x1,x2,…,xn}中的第i个数,表示xi经过归一化预处理后的一维荧光光谱数据。
进一步地,S2具体为:
S21、将预处理后的一维荧光光谱数据映射到极坐标系,将预处理后的一维荧光光谱数据编码为角度α,并将波长编码为半径R:
其中,为预处理后的一维荧光光谱数据,/>为中的第i个数,αi表示角度,R表示半径,λi为/>对应的波长,N为用于正则化极坐标系统跨度的常数。
S22、使用格拉姆角场将映射到极坐标系的预处理后的一维荧光光谱数据转换为二维特征图像,其中,格拉姆和角场为:
上式写为:
其中,i为格拉姆和角场矩阵的行数,j为格拉姆和角场矩阵的列数,I为单位行向量,为预处理后的一维荧光光谱数据,/>为/>的转置;
格拉姆差角场为:
上式写为:
通过格拉姆和角场或格拉姆差角场,将预处理后的一维荧光光谱数据转换为二维特征图像。
进一步地,全局对比损失函数用下式表示:
其中,表示全局对比损失,τ为温度超参数,q表示经过在线编码器全局投影头提取出来的全局图像特征向量,k+表示q的正键,k-表示q的负键。
进一步地,密集对比损失函数用下式表示:
其中,表示密集对比损失,S表示生成的密集特征图的空间大小,S2表示特征向量的数量,rS表示S2个特征向量中的第S个,/>表示rS的正键,/>表示rS的负键,τ为温度超参数。
进一步地,通过矿物油分类训练模型的损失函数对在线编码器进行梯度回传,更新在线编码器参数;
矿物油分类训练模型的损失函数为:
其中λ表示权重。
进一步地,动量编码器通过下式更新参数:
其中,和/>分别表示在线编码器和动量编码器在训练中第i次迭代的参数,k表示动量系数,取值范围从0到1。
进一步地,在将待检测的荧光光谱的二维特征图像输入矿物油分类模型之前,使用带标记的荧光光谱的二维特征图像对所述矿物油分类模型进行调优。
本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种矿物油分类方法的步骤。
本发明还提出一种电子设备,包括处理器和存储器,所述处理器与所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括计算机可读指令,所述处理器被配置用于调用所述计算机可读指令,执行上述一种矿物油分类方法。
本发明提供的技术方案带来的有益效果是:
本发明提出了将矿物油的荧光光谱数据通过GAF(Gramian Angular Field,格拉姆角场)进行编码的方式,将一维光谱序列转换为荧光光谱的二维GAF图像数据集,基于DenseCL(Dense Contrastive Learning,自监督视觉预训练的密集对比学习)构建矿物油分类训练模型,使用二维GAF图像数据集训练矿物油分类训练模型,得到最终的矿物油分类模型用于矿物油分类,二维GAF图像数据集不仅可以保持原荧光光谱序列的波长相关性和荧光光谱信号的波长依赖性,一维数据转换为二维图像数据后,可以更好地发挥基于DenseCL的分类模型分类识别的优势,使分类结果更准确。
附图说明
图1是本发明实施一种矿物油分类方法的流程图;
图2是本发明实施例原始荧光光谱;
图3是本发明实施例GAF编码后的荧光光谱图像;
图4是本发明实施例基于DenseCL网络构建矿物油分类训练模型;
图5是本发明实施例矿物油荧光光谱数据;
图6是本发明实施例一示例性实施例中的一种电子设备的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
本实施例的一种矿物油分类方法的流程图如图1,具体包括以下步骤:
S1、使用荧光法获取矿物油原始一维荧光光谱数据,并对原始一维荧光光谱数据进行预处理,得到预处理后的一维荧光光谱数据。
具体地,将原始一维荧光光谱数据进行归一化的方式进行预处理:
或/>
X={x1,x2,…,xn}表示原始一维荧光光谱数据,n为样本数量,max(X)表示X中的最大值,min(x)表示X中的最小值,xi表示X={x1,x2,…,xn}中的第i个数,表示xi经过归一化预处理后的一维荧光光谱数据,将原始数据内的所有数值放缩进区间[-1,1]或者[0,1]内。
S2、使用格拉姆角场算法将预处理后的一维荧光光谱数据编码为荧光光谱的二维特征图像。
具体为:
S21、将预处理后的一维荧光光谱数据映射到极坐标系,将预处理后的一维荧光光谱数据编码为角度α,并将波长编码为半径R:
其中,为预处理后的一维荧光光谱数据,/>为中的第i个数,αi表示角度,R表示半径,λi为/>对应的波长,N为用于正则化极坐标系统跨度的常数。当α∈[0,π]时,cos(α)是单调的。随着波长的变化,归一化之后的数值映射到极坐标系中有且仅有一个结果,与其极坐标形式互为双射,确保了该编码方式的唯一性。
S22、使用格拉姆角场将映射到极坐标系的预处理后的一维荧光光谱数据转换为二维特征图像,通过考虑每个点之间角度差或角度和的值来反映不同波段间隔内的相关性,其中,格拉姆和角场为:
上式写为:
其中,i为格拉姆和角场矩阵的行数,j为格拉姆和角场矩阵的列数,I为单位行向量,为预处理后的一维荧光光谱数据,/>为/>的转置;
格拉姆差角场为:
上式写为:
通过格拉姆和角场或格拉姆差角场,将预处理后的一维荧光光谱数据转换为二维特征图像。
通过上述变换可将一维荧光光谱数据转化为沿对角线对称的二维特征图像,矩阵中的主对角线由原始光谱序列经过归一化后组成,可以有效地表示原荧光光谱序列的波长相关性。极坐标中的半径R和波段有关,随着矩阵中元素位置的从左到右,从上到下,其对应的波长也随之增加,保证了编码后的GAF图像的横纵坐标按照波长的顺序增加,可以保持荧光光谱信号的波长依赖性。本发明实施例原始荧光光谱如图2所示,本发明实施例GAF编码后的荧光光谱图像如图3所示。
S3、对荧光光谱的二维特征图像通过数据增强的方式生成正负样本。
S4、基于DenseCL网络构建矿物油分类训练模型,所述训练模型包括两个分支,正样本特征提取分支和负样本特征提取分支,正样本特征提取分支包括一个在线编码器,负样本特征提取分支包括一个动量编码器,两个编码器都包括骨干网和投影头,投影头包括全局投影头和密集投影头。全局投影头对骨干特征进行全局合并,并为每幅图像输出一个单一的全局特征向量;密集投影头以骨干网初步提取的特征作为输入,生成密集的特征向量,同时保留了空间信息并构造了一种密集的输出格式。
正样本输入在线编码器的骨干网提取初步特征,正样本初步特征输入在线编码器的全局投影头提取正样本的全局图像特征向量;正样本初步特征输入在线编码器的密集投影头提取正样本的密集特征向量。
负样本输入动量编码器的骨干网提取初步特征,负样本初步特征输入动量编码器的全局投影头提取负样本的全局图像特征向量;负样本初步特征输入动量编码器的密集投影头提取负样本的密集特征向量。
通过提取图片正负样本对间的对应关系,定义每个局部特征向量的正样本。分别计算全局特征向量正负样本对之间的对比损失函数和密集特征向量正负样本对之间的密集对比损失函数,基于全局对比损失函数和密集对比损失函数,更新在线编码器和动量编码器参数,最终得到模型的损失函数。
其中,正样本的全局图像特征向量和负样本的全局图像特征向量通过全局对比损失函数的约束来实现对比学习;正样本的密集特征向量和负样本的密集特征向量通过密集对比损失函数的约束来实现对比学习。
全局对比损失函数用下式表示:
其中,表示全局对比损失,τ为温度超参数,q表示经过在线编码器全局投影头提取出来的全局图像特征向量,k+表示q的正键,k-表示q的负键,其中一个正键k+与q匹配,q的正键k+编码的是同一图像的不同视图,而负键k-编码的是不同图像的视图。
密集对比损失函数用下式表示:
其中,表示密集对比损失,S表示生成的密集特征图的空间大小,密集投影头生成的Sh×Sw个特征向量,Sh和Sw可以是不同的,为方便描述,令Sh=Sw=S,S2表示特征向量的数量,rS表示S2个特征向量中的第S个,/>表示rS的正键,/>表示rS的负键,每个负键t-是来自不同图像的特征向量,正键t+是根据图片间的对应关系来分配的,是同一图像经过数据增强后得到的图像的S2个特征向量中的一个,τ为温度超参数。
通过矿物油分类训练模型的损失函数对在线编码器进行梯度回传,更新在线编码器参数。
矿物油分类训练模型的损失函数为:
其中λ表示权重,具体地,本实施例中设置为0.5。
动量编码器通过下式更新参数:
其中,和/>分别表示在线编码器和动量编码器在训练中第i次迭代的参数,k表示动量系数,取值范围从0到1,在对比学习中,动量系数越大,通常学习能力越强,本实施例中取k的值为0.9。
本发明实施例基于DenseCL网络构建矿物油分类训练模型如图4所示,其中A1、A2表示两种随机的数据增强组合,包括随即裁剪、随机翻转、高斯模糊等,目的是尽可能地放大生成的两个图片之间的差异。xq表示图片经过数据增强生成的正样本,xk表示图片经过数据增强生成的负样本。q、k分别表示正负样本经过各自分支的全局投影头提取出来的全局图像特征向量;r0、r1…表示正样本经过正样本分支的密集投影头提取出来的密集特征向量,t0、t1…表示负样本经过负样本分支的密集投影头提取出来的密集特征向量。
该模型主要由一个用于初步提取特征的骨干和两个用于特征向量细化的特征投影头组成。编码器输出的特征向量受到损失函数的约束来实现对比学习。在线编码器和动量编码器的主干都采用了残差网络(ResNet-50)。
S5、提取所述矿物油分类训练模型中的骨干网,构建矿物油分类模型,在将待检测的荧光光谱的二维特征图像输入矿物油分类模型之前,使用带标记的荧光光谱的二维特征图像对所述矿物油分类模型进行调优。将待检测的荧光光谱的二维特征图像输入矿物油分类模型,得到矿物油分类结果。
实施后的效果
采用ResNet作为主干,预训练阶段参数设置如下:温度超参数τ为0.2、损失函数权重λ为0.5,动量系数k为0.9,批大小为32,训练200个epoch,初始学习率设置为0.001,权重衰减为1×10-5。数据增强方式为随机裁剪、随机翻转、随机旋转、高斯模糊四种随机选择。微调阶段使用经过基于GAF的DenseCL预训练的ResNet作为分类器的主干,批大小为16,训练120个epoch,初始学习率设置为0.005,权重衰减为1×10-4。
实验用到的油品荧光光谱数据采用Thorlabs公司的Czerny-Turner光谱仪采集,波段范围195nm-1015nm,共采集10种不同油品数据6769条。全部的例矿物光谱数据如图5所示。
在分类任务中,我们常用表格形式的混淆矩阵作为评估模式。具体可以分为四种情况,分类结果的判断如表1。
表1分类结果的判断
其中,True Positive(TP)表示预测为正例,实际为正例,算法预测正确;FalsePositive(FP)表示预测为正例,实际为负例,算法预测错误;True Negative(TN)表示预测为负例,实际为负例,算法预测正确;False Negative(FN)表示预测为负例,实际为正例,算法预测错误。
实验中采用准确率A、精确率P、召回率R和F1 Score作为分类结果的评估标准,具体定义如下。
准确率A:预测正确的样本数占总样本数的个数,反映的是模型算法整体性能,公式如下:
精确率P:反映的是预测为正的样本里真的为正的样本所占的比例,公式如下:
召回率R:反映的是被预测为正样本的数量占全体正样本数量的比例,因为会有一些正样本被误判为负样本,公式如下:
F1 Score:F1 Score是精确率P和召回率R的加权调和平均数,并假设两者一样重要。公式如下:
各算法分类结果准确率A对比如表2所示:
表2各算法分类结果准确率A对比
算法 | SVM | KNN | GAF-ResNet50 | GAF-DenseCL |
A | 78.8% | 84.8% | 88.48% | 97.71% |
通过表2可以看到,从总体性能上来说,本发明的方法:基于GAF和DenseCL的矿物油分类模型(GAF-DenseCL模型)的分类准确率明显优于KNN(K-NearestNeighbor,K近邻算法)、SVM(Support Vector Machine,支持向量机)这些传统的处理一维数据的分类方法,与SVM、KNN的分类效果相比,准确率分别提升了24%、15.22%;相较于没有经过Dense-CL网络预训练的ResNet50来说,分类结果的准确率提升了10.43%。
各算法分类结果精确率P对比如表3所示,各算法分类结果召回率R对比如表4所示,各算法分类结果F1-Score对比如表5所示。可以看出本发明的方法(GAF-DenseCL)相对于SVM、KNN、GAF-ResNet50在精确率P、召回率R和F1 Score的评估标准下,矿物油的分类准确率较高。
表3各算法分类结果精确率P对比
SVM | KNN | GAF-ResNet50 | GAF-DenseCL | |
变压器油 | 99.12% | 91.56% | 95.12% | 97.58% |
齿轮油 | 95.2% | 91.72% | 97.86% | 99.29% |
防锈油 | 40.51% | 90.35% | 66.19% | 97.60% |
机油 | 99.02% | 98.26% | 92.31% | 99.17% |
空压机油 | 92.15% | 80.83% | 97.25% | 100.00% |
摩托车油 | 99.26% | 76.17% | 94.74% | 99.34% |
潜水泵油 | 86.33% | 62.98% | 58.06% | 85.71% |
润滑油 | 72.85% | 91.52% | 98.77% | 100.00% |
液压油 | 95.69% | 87.30% | 89.47% | 97.33% |
真空泵油 | 91.00% | 86.87% | 93.60% | 99.21% |
表4各算法分类结果召回率R对比
SVM | KNN | GAF-ResNet50 | GAF-DenseCL | |
变压器油 | 85.31% | 67.65% | 96.69% | 100.00% |
齿轮油 | 79.25% | 95% | 97.86% | 99.29% |
防锈油 | 96.14% | 47.14% | 65.71% | 87.14% |
机油 | 82.75% | 95.29% | 90.76% | 100.00% |
空压机油 | 85.56% | 99.01% | 87.60% | 100.00% |
摩托车油 | 83.44% | 92.21% | 93.51% | 98.05% |
潜水泵油 | 26.47% | 99.44% | 67.92% | 96.23% |
润滑油 | 79.96% | 80.31% | 96.39% | 99.40% |
液压油 | 80.63% | 82.55% | 91.89% | 98.65% |
真空泵油 | 83.82% | 95.56% | 92.86% | 99.21% |
表5各算法分类结果F1-Score对比
在一示例性实施例中,包括一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的矿物油分类方法的步骤。
请参阅图6,在一示例性实施例中,还包括一种电子设备,包括至少一处理器、至少一存储器、以及至少一通信总线。
其中,存储器上存储有计算机程序,计算机程序包括计算机可读指令,处理器通过通信总线调用存储器中存储的计算机可读指令,执行上述的矿物油分类方法。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种矿物油分类方法,其特征在于,包括以下步骤:
S1、使用荧光法获取矿物油原始一维荧光光谱数据,并对原始一维荧光光谱数据进行预处理,得到预处理后的一维荧光光谱数据;
S2、使用格拉姆角场算法将预处理后的一维荧光光谱数据编码为荧光光谱的二维特征图像;
S3、对荧光光谱的二维特征图像通过数据增强的方式生成正负样本;
S4、基于DenseCL网络构建矿物油分类训练模型,所述训练模型包括两个分支,正样本特征提取分支和负样本特征提取分支,正样本特征提取分支包括一个在线编码器,负样本特征提取分支包括一个动量编码器,两个编码器都包括骨干网和投影头,投影头包括全局投影头和密集投影头;
正样本输入在线编码器的骨干网提取初步特征,正样本初步特征输入在线编码器的全局投影头提取正样本的全局图像特征向量,正样本初步特征输入在线编码器的密集投影头提取正样本的密集特征向量;
负样本输入动量编码器的骨干网提取初步特征,负样本初步特征输入动量编码器的全局投影头提取负样本的全局图像特征向量,负样本初步特征输入动量编码器的密集投影头提取负样本的密集特征向量;
其中,正样本的全局图像特征向量和负样本的全局图像特征向量通过全局对比损失函数的约束来实现对比学习;正样本的密集特征向量和负样本的密集特征向量通过密集对比损失函数的约束来实现对比学习;
基于全局对比损失函数和密集对比损失函数,更新在线编码器和动量编码器参数;
S5、提取所述矿物油分类训练模型中的骨干网,构建矿物油分类模型,将待检测的荧光光谱的二维特征图像输入矿物油分类模型,得到矿物油分类结果。
2.根据权利要求1所述的一种矿物油分类方法,其特征在于,步骤S1中,将原始一维荧光光谱数据进行归一化的方式进行预处理:
X={x1,x2,…,xn}表示原始一维荧光光谱数据,n为样本数量,max(X)表示X中的最大值,min(X)表示X中的最小值,xi表示X={x1,x2,…,xn}中的第i个数,表示xi经过归一化预处理后的一维荧光光谱数据。
3.根据权利要求1所述的一种矿物油分类方法,其特征在于,S2具体为:
S21、将预处理后的一维荧光光谱数据映射到极坐标系,将预处理后的一维荧光光谱数据编码为角度α,并将波长编码为半径R:
其中,为预处理后的一维荧光光谱数据,/>为中的第i个数,αi表示角度,R表示半径,λi为/>对应的波长,N为用于正则化极坐标系统跨度的常数。
S22、使用格拉姆角场将映射到极坐标系的预处理后的一维荧光光谱数据转换为二维特征图像,其中,格拉姆和角场为:
上式写为:
其中,i为格拉姆和角场矩阵的行数,j为格拉姆和角场矩阵的列数,I为单位行向量,为预处理后的一维荧光光谱数据,/>为/>的转置;
格拉姆差角场为:
上式写为:
通过格拉姆和角场或格拉姆差角场,将预处理后的一维荧光光谱数据转换为二维特征图像。
4.根据权利要求1所述的一种矿物油分类方法,其特征在于,全局对比损失函数用下式表示:
其中,表示全局对比损失,τ为温度超参数,q表示经过在线编码器全局投影头提取出来的全局图像特征向量,k+表示q的正键,k-表示q的负键。
5.根据权利要求1所述的一种矿物油分类方法,其特征在于,密集对比损失函数用下式表示:
其中,表示密集对比损失,S表示生成的密集特征图的空间大小,S2表示特征向量的数量,rS表示S2个特征向量中的第S个,/>表示rS的正键,/>表示rS的负键,τ为温度超参数。
6.根据权利要求1所述的一种矿物油分类方法,其特征在于,通过矿物油分类训练模型的损失函数对在线编码器进行梯度回传,更新在线编码器参数;
矿物油分类训练模型的损失函数为:
其中λ表示权重。
7.根据权利要求1所述的一种矿物油分类方法,其特征在于,动量编码器通过下式更新参数:
其中,和/>分别表示在线编码器和动量编码器在训练中第i次迭代的参数,k表示动量系数,取值范围从0到1。
8.根据权利要求1所述的一种矿物油分类方法,其特征在于,在将待检测的荧光光谱的二维特征图像输入矿物油分类模型之前,使用带标记的荧光光谱的二维特征图像对所述矿物油分类模型进行调优。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-8任一所述方法的步骤。
10.一种电子设备,其特征在于,包括处理器和存储器,所述处理器与所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括计算机可读指令,所述处理器被配置用于调用所述计算机可读指令,执行如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311245603.3A CN117540144A (zh) | 2023-09-25 | 2023-09-25 | 一种矿物油分类方法及计算机可读存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311245603.3A CN117540144A (zh) | 2023-09-25 | 2023-09-25 | 一种矿物油分类方法及计算机可读存储介质、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117540144A true CN117540144A (zh) | 2024-02-09 |
Family
ID=89788711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311245603.3A Pending CN117540144A (zh) | 2023-09-25 | 2023-09-25 | 一种矿物油分类方法及计算机可读存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117540144A (zh) |
-
2023
- 2023-09-25 CN CN202311245603.3A patent/CN117540144A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111241837B (zh) | 基于对抗迁移学习的盗窃案件法律文书命名实体识别方法 | |
Chen et al. | Rolling bearing fault diagnosis using time-frequency analysis and deep transfer convolutional neural network | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
CN111931637A (zh) | 基于双流卷积神经网络的跨模态行人重识别方法和系统 | |
CN111680176A (zh) | 基于注意力与双向特征融合的遥感图像检索方法及系统 | |
CN106227851A (zh) | 基于深度卷积神经网络端对端的通过分层深度搜索的图像检索方法 | |
CN113657450B (zh) | 基于注意机制的陆战场图像-文本跨模态检索方法及其系统 | |
CN110175248B (zh) | 一种基于深度学习和哈希编码的人脸图像检索方法和装置 | |
CN108520215B (zh) | 基于多尺度联合特征编码器的单样本人脸识别方法 | |
CN110349229A (zh) | 一种图像描述方法及装置 | |
CN111783884A (zh) | 基于深度学习的无监督高光谱图像分类方法 | |
CN112101467A (zh) | 一种基于深度学习的高光谱图像分类方法 | |
CN108960342A (zh) | 基于改进SoftMax损失函数的图像相似度计算方法 | |
CN109919084A (zh) | 一种基于深度多索引哈希的行人重识别方法 | |
CN116958688A (zh) | 一种基于YOLOv8网络的目标检测方法及系统 | |
CN115471675A (zh) | 一种基于频域增强的伪装对象检测方法 | |
CN113362915B (zh) | 一种基于多模态学习的材料性能预测方法及系统 | |
CN116977747B (zh) | 基于多路多尺度特征孪生网络的小样本高光谱分类方法 | |
CN116563649B (zh) | 基于张量映射网络的高光谱图像轻量化分类方法及装置 | |
CN116757773A (zh) | 服装电子商务销售管理系统及其方法 | |
CN107273793A (zh) | 一种用于人脸识别的特征提取方法 | |
CN117540144A (zh) | 一种矿物油分类方法及计算机可读存储介质、电子设备 | |
Kekre et al. | Sectorization of Full Kekre’s Wavelet Transform for Feature extraction of Color Images | |
Wang et al. | Graph-based semisupervised learning with weighted features for hyperspectral remote sensing image classification | |
Wang et al. | [Retracted] Quantitative Evaluation of Plant and Modern Urban Landscape Spatial Scale Based on Multiscale Convolutional Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |