CN113378971B - 近红外光谱的分类模型训练方法、系统及分类方法、系统 - Google Patents
近红外光谱的分类模型训练方法、系统及分类方法、系统 Download PDFInfo
- Publication number
- CN113378971B CN113378971B CN202110722777.9A CN202110722777A CN113378971B CN 113378971 B CN113378971 B CN 113378971B CN 202110722777 A CN202110722777 A CN 202110722777A CN 113378971 B CN113378971 B CN 113378971B
- Authority
- CN
- China
- Prior art keywords
- training
- near infrared
- infrared spectrum
- sequence
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 234
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 121
- 238000013145 classification model Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012545 processing Methods 0.000 claims abstract description 29
- 239000011159 matrix material Substances 0.000 claims description 27
- 230000007704 transition Effects 0.000 claims description 25
- 238000005520 cutting process Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000004497 NIR spectroscopy Methods 0.000 claims 2
- 238000001228 spectrum Methods 0.000 abstract description 27
- 230000008901 benefit Effects 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 239000002283 diesel fuel Substances 0.000 description 10
- 238000012360 testing method Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 230000004913 activation Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000002835 absorbance Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
- G06F18/295—Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种近红外光谱的分类模型训练方法、系统及分类方法、系统,利用MTF将每一训练用近红外光谱序列转换为训练用二维图像,得到训练数据集。再构建初始分类模型,利用训练数据集对初始分类模型进行训练,即可得到分类模型。通过引入MTF方法将近红外光谱序列整体转换为图像,保留了原始光谱序列对波长的依赖性以及特征的完整性,通过将一维光谱序列编码为图像,可以将机器视觉图像处理的强大优势应用于一维近红外光谱的分类识别,能够显著提高分类模型的分类准确率。利用该分类模型能够更为准确的对近红外光谱序列进行分类。
Description
技术领域
本发明涉及一维近红外光谱数据分析处理技术领域,特别是涉及一种基于MTF(Markov Transition Field,马尔可夫变迁场)图像编码和残差网络的近红外光谱的分类模型训练方法、系统及分类方法、系统。
背景技术
近红外光谱因其具有操作简单,检测效率高,多指标同时检测,样品无损伤,成本低且实验无污染等优势,逐渐在以化学检验为主的众多检测技术中脱颖而出。近红外光谱分类识别检测的关键是利用近红外光谱区丰富的光谱信息建立具有分类能力的数学模型,并利用模型的泛化能力对未知样品的光谱进行检测。经过研究者们多年的研究,基于近红外光谱建立的模型已经横跨了数学统计学、化学计量学、机器学习以及深度学习等多个方面,在多个领域得到了认可与实际应用,模型的性能也在不断地提升。
然而,近红外光谱存在光谱范围广,噪声干扰多,有用信息强度弱等不足,传统的定性模型必须结合大量的光谱预处理,特征提取,降维等处理。这种特征提取和降维而所带来的特征改变往往通过数据压缩来实现,会破坏光谱的完整性,丢失有用的信息,无法确保分类结果的准确性。因此结合近红外光谱分析技术构建一个识别准确率高的分类模型是急需解决的关键问题。
发明内容
本发明的目的是提供一种近红外光谱的分类模型训练方法、系统及分类方法、系统,用于构建一个识别准确率高的分类模型,以对近红外光谱数据进行高精度分类。
为实现上述目的,本发明提供了如下方案:
第一方面,本发明提供一种近红外光谱的分类模型训练方法,所述训练方法包括:
获取多种类型样品分别对应的多个训练用近红外光谱序列;
利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像,得到训练样本;所有所述训练样本和所述训练样本对应的标签组成训练数据集;
构建初始分类模型;
利用所述训练数据集对所述初始分类模型进行训练,得到分类模型。
本发明还提供了一种近红外光谱的分类模型训练系统,所述训练系统包括:
第一获取模块,用于获取多种类型样品分别对应的多个训练用近红外光谱序列;
第一转换模块,用于利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像,得到训练样本;所有所述训练样本和所述训练样本对应的标签组成训练数据集;
构建模块,用于构建初始分类模型;
训练模块,用于利用所述训练数据集对所述初始分类模型进行训练,得到分类模型。
第二方面,本发明提供一种近红外光谱的分类方法,所述方法包括:
获取待分类近红外光谱序列;
利用MTF将所述待分类近红外光谱序列转换为二维图像;
以所述二维图像作为输入,利用分类模型进行分类。
本发明还提供了一种近红外光谱的分类系统,所述系统包括:
第二获取模块,用于获取待分类近红外光谱序列;
第二转换模块,用于利用MTF将所述待分类近红外光谱序列转换为二维图像;
分类模块,用于以所述二维图像作为输入,利用分类模型进行分类。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明所提供的一种近红外光谱的分类模型训练方法及系统,先获取多种类型样品分别对应的多个训练用近红外光谱序列,然后利用MTF将每一训练用近红外光谱序列转换为训练用二维图像,得到训练数据集。再构建初始分类模型,最后利用训练数据集对初始分类模型进行训练,即可得到分类模型。本发明通过引入MTF方法将近红外光谱序列整体转换为图像,保留了原始光谱序列对波长的依赖性以及特征的完整性,而且为更为直观的探索这些一维光谱特征开拓了新视角。通过将一维光谱序列编码为图像,可以将机器视觉图像处理的强大优势应用于一维近红外光谱的分类识别,为一维近红外光谱分析提供了新思路,能够显著提高分类模型的分类准确率。本发明还提供一种近红外光谱的分类方法及系统,先获取待分类近红外光谱序列,再利用MTF将待分类近红外光谱序列转换为二维图像,最后以二维图像作为输入,利用上述得到的分类模型进行分类,能够更为准确的对近红外光谱序列进行分类。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1所提供的训练方法的方法流程图;
图2为本发明实施例1所提供的汽油和柴油分别对应的训练用近红外光谱序列的光谱图;
图3为本发明实施例1所提供的汽油和柴油分别对应的训练用裁剪后序列的光谱图;
图4为本发明实施例1所提供的转换方法的方法流程图;
图5为本发明实施例1所提供的区间划分实例的划分结果示意图。
图6为本发明实施例1所提供的汽油和柴油分别对应的训练用二维图像的示意图;
图7为本发明实施例1所提供的汽油和柴油分别对应的训练用裁剪后图像的示意图;
图8为本发明实施例1所提供的初始分类模型的结构示意图;
图9为本发明实施例1所提供的增强后训练数据集中部分训练样本的示意图;
图10为本发明实施例1所提供的损失值和准确率的迭代曲线图;
图11为本发明实施例1所提供的真实类别与预测类别的对比结果图;
图12为本发明实施例2所提供的训练系统的系统框图;
图13为本发明实施例3所提供的分类方法的方法流程图;
图14为本发明实施例4所提供的分类系统的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种近红外光谱的分类模型训练方法、系统及分类方法、系统,用于构建一个识别准确率高的分类模型,以对近红外光谱数据进行高精度的分类。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1:
本实施例用于提供一种近红外光谱的分类模型训练方法,如图1所示,所述训练方法包括:
S1:获取多种类型样品分别对应的多个训练用近红外光谱序列;
每一类型的样品均对应一个预设波长范围,样品在预设波长范围内的近红外光谱序列可表示为X={x1,x2,…,xi,…,xn},n为近红外光谱序列的序列点数,也为特征波长的总数;xi为当波长为i时,样品对应的吸光度值。
对于每一类型的样品,均获取多个近红外光谱序列作为训练用近红外光谱序列,不同类型的样品所对应的训练用近红外光谱序列的个数可以相同,也可以不同。不同类型的样品对应的预设波长范围可以相同,也可以不同,但需要保证的是,所有训练用近红外光谱序列的长度相同,即所包含的序列点数相同。
以所采集的近红外光谱序列包含两个类型(分别为汽油和柴油)为例对S1进行进一步说明。两类样品所对应的训练用近红外光谱序列各有60个,即训练样本的总数m=120。汽油的预设波长范围(也称之为光谱采样范围)为900nm~1700nm,柴油的预设波长范围(也称之为光谱采样范围)为750nm~1550nm,采样间隔均为2nm,所以总的特征波长数n=401。如图2所示,图2(a)为汽油所对应的训练用近红外光谱序列的光谱图,图2(b)为柴油所对应的训练用近红外光谱序列的光谱图。可以看出,两种类别的光谱图都有两个明显的吸收峰,波形的走势也大致相同。
若直接对所获取的训练用近红外光谱序列进行图像化处理,由于序列点过多,数据量多,则处理速度会比较慢,为了进一步提高处理速度,本实施例在利用MTF将每一训练用近红外光谱序列转换为训练用二维图像之前,还包括对S1所得到的训练用近红外光谱序列进行裁剪,该裁剪步骤可以包括:对于每一训练用近红外光谱序列,确定所有峰值点的位置。然后随机选取任一峰值点作为中心点,根据预设范围对训练用近红外光谱序列进行裁剪,得到训练用裁剪后序列,上述中心点即为训练用裁剪后序列的中心。具体的,预设范围的宽度为T,则训练用裁剪后序列可记为XT={x1,x2,…,xt,…,xT},t=1,2,...T;T为训练用裁剪后序列的序列点数,即训练用裁剪后序列的波长点数。并以训练用裁剪后序列作为新的训练用近红外光谱序列,进行步骤S2。通过对训练用近红外光谱序列进行裁剪,得到训练用裁剪后序列,既减少了序列点数,又能够提取出最能够体现训练用近红外光谱序列特征的部分序列点,从而既提高了处理速度,又提高了处理精度。
以汽油和柴油为例,根据汽、柴油的光谱图,裁剪第一个峰值位置的光谱序列,如图3所示,图3(a)为汽油所对应的训练用裁剪后序列的光谱图,图3(b)为柴油所对应的训练用裁剪后序列的光谱图。
进一步的,本实施例的训练方法还包括:对每一训练用裁剪后序列均进行归一化处理,得到训练用归一化后序列。具体为将训练用裁剪后序列XT内的所有值归一化到[0,1]区间,按下述公式计算:
式1中,为归一化后的第t个序列点的吸光度值;xt为归一化前的第t个序列点的吸光度值;min(XT)为训练用裁剪后序列中的最小值;max(XT)为训练用裁剪后序列中的最大值。并以训练用归一化后序列作为S2中的新的训练用近红外光谱序列。
S2:利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像,得到训练样本;所有所述训练样本和所述训练样本对应的标签组成训练数据集;
如图4所示,S2可以包括:
S21:将所述训练用近红外光谱序列划分为Q个分位数区间;所述训练用近红外光谱序列中的每一个序列点均对应一个唯一的分位数区间;
以采用训练用裁剪后序列作为新的训练用近红外光谱序列为例对S2进行详细说明。将一维训练用裁剪后序列划分为Q个分位数区间,形成一个序列表{q1,q2,…,qQ},训练用裁剪后序列中的每个序列点xt都有唯一对应的分位数区间qq,下角标q∈{1,2,…,Q}。
S22:采用一阶马尔可夫链计算所述分位数区间之间的转移概率,构建马尔可夫矩阵;所述马尔可夫矩阵为Q×Q矩阵;
具体的,沿着时间步以一阶马尔可夫链的方式计算区间之间的转移概率来构建尺寸为[Q,Q]的权值邻接矩阵,也称为马尔可夫矩阵W,矩阵W形式如下所示:
式2中,wij=p{xt∈qj|xt-1∈qi};Wij表示分位数区间qi中的一个点其下一个波长步的点在分位数区间qj中的概率;i=1,2,...Q;j=1,2,...Q。矩阵W中的元素满足
S23:根据所述马尔可夫矩阵构建马尔可夫变迁场;所述马尔可夫变迁场为T×T矩阵;T为所述训练用近红外光谱序列所对应的序列点的个数;
波长序列的马尔可夫矩阵W包含了马尔可夫动态特性,但这种方式放弃了XT对波长的依赖性。构建矩阵尺寸为[T,T]的马尔可夫变迁场M,通过沿着波长从小到大的顺序来扩展马尔可夫矩阵W,所扩展得到的马尔可夫变迁场M如下所示:
式3中,第i个波长所属分位数区间为qi,第j个波长所属分位数区间为qj,Mij表示区间qi到区间qj的转移概率,即Mij的值为wqi,qj。
举例而言,如图5所示,如果将光谱序列XT={x1,x2,…xt,…,x14}内的值划分到7个区间{q1,q2,…,q7},该实例所得到的具体W矩阵如下:
可以看出W并没有将横坐标波长考虑在内。然而对于光谱而言,不同波长点的光谱值对波长具有一定的依赖性,不可简单的忽略。故需要对W矩阵进行扩展,假设波长步t的值xt所在的分位数区间为q6,波长步1的值x1所在的分位数区间为q2,则在M中,M1t表示区间q2到q6的转移概率,对应于马尔可夫矩阵W中的W26。即通过考虑波长位置将包含光谱幅度轴上的转移概率的矩阵W扩展为M,通过转移概率Mij,马尔可夫转移场M编码了不同跨度波长的转移概率,Mij||i-j|=k表示步长间隔为k的两点之间的转移概率。主对角线Mii则为自转移概率。进而充分利用近红外光谱波长的相关性,以波长步代替了数学中的时间戳,将W扩展到包含波长步的M矩阵。
S24:将所述马尔可夫变迁场进行可视化,得到训练用二维图像。
具体的,将M矩阵中各元素对应的灰度值与颜色空间中的一个点进行匹配,进而将一维度训练用近红外光谱序列可视化为训练用二维图像。如图6所示,图6(a)为汽油所对应的训练用二维图像,图6(b)为柴油所对应的训练用二维图像。可以看出,在二维的新视角下,汽油和柴油的特征展现的更为直观,二者的差异性显著增强。
本实施例还对样品的类别进行映射和编码,得到每一训练用二维图像对应的标签。以包含柴油和汽油两个类别为例,将两个类别分别映射为0和1,为了后续建模,再将类别标签通过One-Hot编码转换成二阶张量,得到标签。
在将所有训练用近红外光谱序列转换为训练用二维图像后,本实施例的训练方法还可将训练用二维图像进行缩略和裁剪处理,并保存为jpg格式于指定文件夹中。具体的,对每一训练用二维图像进行去坐标轴,去白边和边框处理,并缩小所得训练用二维图像的大小,然后裁剪图像中具有重要特征的部分,保存所有jpg图像。裁剪所用方法为:确定不同类型样品所对应的训练用二维图像中像素值差异大于预设阈值的差异区域,根据差异区域对每一训练用二维图像进行裁剪,只保留差异区域,得到训练用裁剪后图像,并以训练用裁剪后图像作为训练样本。即选取训练用二维图像中最能体现不同样品之间区别的区域作为差异区域,对于每一训练用二维图像进行裁剪,只保留该差异区域,从而能够减少处理的数据量,并且还能提取出具有显著性特征的部分图像,能够进一步提高处理速度和处理精度。
以汽油和柴油为例,将m个训练用二维图像进行去坐标轴,去白边,去边框以及缩略处理,图像像素大小由1200×1200变为600×600。然后裁剪图像中具有重要特征的部分,裁剪坐标为[50:280,50:280],如图7所示,图7(a)为汽油所对应的训练用裁剪后图像,图7(b)为柴油所对应的训练用裁剪后图像。图像大小变为230×230,保持图像分辨率大小为300dpi并保存所有经过相同处理后的汽柴油图像为jpg格式。
本实施例通过引入MTF方法将近红外光谱峰值片段整体转化为图像,不仅可以保留原始光谱序列对波长的依赖性以及特征的完整性,而且为更加直观地探索这些一维光谱的特征开拓了新视角。且通过将一维光谱信号编码为图像,实现将机器视觉图像处理的强大优势应用于一维度近红外光谱分类识别领域,为一维近红外光谱检测提供了新思路。
S3:构建初始分类模型;
如图8所示,本实施例所用的初始分类模型采用残差网络,残差网络是在卷积神经网络(CNN)的基础上添加了残差模块,该残差网络可以实现轻松运算并且容易优化,通过残差结构可以缓解退化问题以及梯度消失问题,适用性更强。具体的,残差网络包括依次连接的输入层、第一卷积层、残差模块、第一批规范化层、ReLu激活函数、全局平均池化层、全连接层、Softmax层和输出层。残差模块包括依次连接的第二批规范化层、ReLu激活函数、第二卷积层、第三批规范化层、ReLu激活函数和第三卷积层。第一卷积层分别与第二批规范化层和残差模块的输出端相连接,第三卷积层和残差模块的输出端相连接。即残差模块与普通CNN不同的是,从输入直接引入一个短连接到非线性层的输出上,使得整个映射变为:
y=F(x,{Wi})+x (4)
式4中,x和y分别对应残差模块的输入向量和输出向量,F表示模型要学习的残差映射,{Wi}为权重。
当残差模块的输入维度和输出维度不同时,即维数不等时,第一卷积层通过平均池化层和残差模块的输出端相连接。即当输入和输出维数不等时,则可以使用权重Ws对输入x执行线性映射,通过跨层连接形成加和,输出形式变为:
y=F(x,{Wi})+Wsx (5)
本实施例所提供的残差网络中,卷积层主要用于提取局部抽象特征,批规范化层主要使各层的输入数据服从同一分布,提高网络的表达能力。池化也叫下采样,主要为了减少卷积层中特征向量的维数。全连接层用来实现特征与目标输出之间的映射。残差模块主要通过跨层连接缓解退化问题以及梯度消失问题。
以汽油和柴油为例,输入层输入的形状大小为(None,230,230,1)。
第一卷积层参数设置为8个通道,卷积核尺寸为3×3,零填充padding设置为越过边缘取样,卷积核初始化设置为he_normal,卷积核的L2正则化参数为0.0001,经过本层后输出形状变为(None,230,230,8)。
残差模块由两个权重层组成,每个权重层由批规范化层,激活函数层和卷积层组成。第二卷积层的卷积核尺寸为3×3,步长为2,第三卷积层的卷积核尺寸为3×3,步长为1,第二卷积层和第三卷积层的其余参数和第一卷积层的其他参数一致。当输入输出维度不一致时,跨层连接部分发生尺寸为1×1,步长为2的平均池化。经过残差模块后输出形状变为(None,115,115,8)。
接下来是一层批规范化层,一层激活函数层,一层全局平均池化层,以减少参数防止过拟合风险,输出形状变为(None,8)。
最后是全连接层,由于有两个类别,所以参数设置成2,激活函数为softmax函数。输出形状变为(None,2)。
本实施例在近红外光谱领域引入残差网络模型,不仅可以实现自动特征提取与降维,弥补了传统方法需手工处理的繁琐性及不通用性,而且比一般的CNN模型训练学习能力更强,可大大缓解退化及梯度消失的问题。本实施例提出的基于MTF图像编码和残差网络的近红外光谱分类模型训练方法,检测不同对象时只需更新或扩展网络结构就可适用,简单且高效,在一维度近红外光谱领域具有很好的应用前景,解决了现有的定性模型不具备通用性能,检测对象一旦发生变化就无法保证模型的有效性,普适性较差的问题。
S4:利用所述训练数据集对所述初始分类模型进行训练,得到分类模型。
将所获取的训练数据集按照一定的比例随机划分成训练集和测试集,并将训练集作为新的训练数据集。
由于相同类别的样本之间图像差异不大,为了降低过拟合风险,对训练样本进行数据增强处理,通过让模型学习到更多的先验知识,以提升模型的整体性能。具体的,在得到训练数据集之后,利用训练数据集对初始分类模型进行训练之前,本实施例的训练方法还包括:对训练数据集进行增强处理,得到增强后训练数据集,并以增强后训练数据集作为新的训练数据集。增强处理包括随机旋转、随机缩放、水平移动、垂直移动、水平翻转、垂直翻转、剪切变换和通道移位。
仍然以柴油和汽油为例,对上述过程进行具体说明:在本实施例中,设置随机种子为3,按照8:2的比例随机划分120张样本集图像,即训练集有96张图像,测试集有24张图像。由于相同类别的样本之间图像差异不大,为了降低过拟合风险,对训练样本进行数据增强处理,通过让模型学习到更多的先验知识,以提升模型的整体性能。具体采用Keras框架下的ImageDataGenerator模块进行图像角度为10°范围内的随机旋转,比例为10%的随机缩放,宽度比例为10%的水平/垂直移动,比例为10%的水平/垂直翻转、比例为10%的剪切变换以及范围为10的通道移位。在图9中,显示了经过增强处理的前21张图像。可以看出通过数据增强处理,训练集样本的随机性会得以增加,这会使得模型可以学习到更多的知识,提升模型的鲁棒性和泛化性能。
然后将增强处理后的训练集输入到构建好的残差网络,完成学习和迭代训练。对网络的训练参数进行设置,优化算法为Adam,损失函数Loss为交叉熵,如式6,评测指标为准确率accuracy,如公式7。
式6中,q代表实际输出,p代表期望的输出。
式7中,mi是预测类别和实际类别相同的个数;m为训练样本的总个数。
设置批处理大小以及训练迭代的次数,再随机选择训练数据的20%做验证,完成模型的迭代训练与学习。
模型构建好以后,确定训练时用的优化器、损失函数和准确率评测标准。以式6的交叉熵为损失函数,采用学习率为0.01的Adam优化器,以式7的准确率accuracy为评测标准。设置每一批batch的大小为64,迭代次数epochs为50,输入训练集的输入以及标签,并从训练集中划分20%给验证集,可以得到损失值的迭代曲线如图10(a)所示,准确率的迭代曲线如图10(b)所示。随着迭代次数的增加,训练损失和验证损失都逐渐趋近于0,训练准确率和验证准确率都逐渐趋近于1,训练过程相对稳定,所构建的模型具有良好的性能。
最后将测试集的图像输入建好的模型中,自动获得分类识别结果。再利用构建好的残差网络模型,完成对测试集图像的分类测试,对结果进行评估。利用构建好的模型对24个测试样本进行测试,所得的预测类别和真实类别结果如图11所示。可以明显看出预测结果全部正确,准确率达到100%。进一步证明本实施例所建立的分类模型的高准确性。
本实施例公开了一种基于马尔可夫变迁场(MTF)图像编码和残差网络的近红外光谱分类模型训练方法,具体包括以下步骤:采集近红外光谱信号,进行光谱信号片段裁剪,并对数据进行归一化和类别转换,利用MTF将一维光谱数据转换为二维图像,对所有图像进行裁剪和缩略处理,划分训练集和测试集,并对训练集图像进行增强处理,构建合适的残差网络模型,实现基于一维度近红外光谱的分类识别。本实施例提出了将一维度近红外光谱信号转换成相应的MTF图像作为分析对象,同时采用残差网络进行特征提取与分类识别的方法。将机器视觉中图像处理的强大优势应用于一维度近红外光谱领域,分类结果准确,模型实用性以及可扩展能力强,为一维光谱分类识别提供了一种新思路
实施例2:
本实施例用于提供一种近红外光谱的分类模型训练系统,如图12所示,所述训练系统包括:
第一获取模块M1,用于获取多种类型样品分别对应的多个训练用近红外光谱序列;
第一转换模块M2,用于利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像,得到训练样本;所有所述训练样本和所述训练样本对应的标签组成训练数据集;
构建模块M3,用于构建初始分类模型;
训练模块M4,用于利用所述训练数据集对所述初始分类模型进行训练,得到分类模型。
本实施例所提出的一种基于马尔可夫变迁场(MTF)图像编码和残差网络的近红外光谱分类模型训练系统,不仅可以通过图像化处理保留原始光谱序列对波长的依赖性,而且为更加直观地探索这些一维光谱的特征开拓了新视角。可以实现将机器视觉图像处理的强大优势应用于一维度近红外光谱分类识别领域,为一维近红外光谱分析提供了新思路。所构建的分类模型识别准确率高,模型实用性和可扩展性强,在一维度近红外光谱定性分析领域具有良好的应用前景。
实施例3:
本实施例用于提供一种近红外光谱的分类方法,如图13所示,所述方法包括:
T1:获取待分类近红外光谱序列;
所获得的待分类近红外光谱序列的形式与实施例1中的S1中的形式相同。
T2:利用MTF将所述待分类近红外光谱序列转换为二维图像;
作为一种可选的实施方式,可以先将待分类近红外光谱序列进行裁剪和归一化处理,与实施例1所述方法相同,转换成二维图像的方法也与实施例1所用方法相同,转换成二维图像后,也可以对二维图像进行进一步的裁剪,所用裁剪方法与实施例1中所用方法相同,在此不再赘述。
T3:以所述二维图像作为输入,利用分类模型进行分类。
本实施例所提供的分类方法,利用实施例1所建立的分类模型进行分类,借助于MTF图像编码和残差网络的结构,能够实现高准确率的分类。
实施例4:
本实施例用于提供一种近红外光谱的分类系统,如图14所示,所述系统包括:
第二获取模块M5,用于获取待分类近红外光谱序列;
第二转换模块M6,用于利用MTF将所述待分类近红外光谱序列转换为二维图像;
分类模块M7,用于以所述二维图像作为输入,利用分类模型进行分类。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种近红外光谱的分类模型训练方法,其特征在于,所述训练方法包括:
获取多种类型样品分别对应的多个训练用近红外光谱序列;
利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像,得到训练样本;所有所述训练样本和所述训练样本对应的标签组成训练数据集;
构建初始分类模型;
利用所述训练数据集对所述初始分类模型进行训练,得到分类模型;
所述利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像具体包括:
将所述训练用近红外光谱序列划分为Q个分位数区间;所述训练用近红外光谱序列中的每一个序列点均对应一个唯一的分位数区间;
采用一阶马尔可夫链计算所述分位数区间之间的转移概率,构建马尔可夫矩阵;所述马尔可夫矩阵为Q×Q矩阵;
根据所述马尔可夫矩阵构建马尔可夫变迁场;所述马尔可夫变迁场为T×T矩阵;T为所述训练用近红外光谱序列所对应的序列点的个数;
将所述马尔可夫变迁场进行可视化,得到训练用二维图像。
2.根据权利要求1所述的训练方法,其特征在于,在所述利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像之前,所述训练方法还包括对所述训练用近红外光谱序列进行裁剪,具体包括:
对于每一所述训练用近红外光谱序列,确定所有峰值点的位置;
随机选取任一所述峰值点作为中心点,根据预设范围对所述训练用近红外光谱序列进行裁剪,得到训练用裁剪后序列,并以所述训练用裁剪后序列作为新的训练用近红外光谱序列;所述训练用裁剪后序列的中心即为所述中心点。
3.根据权利要求1所述的训练方法,其特征在于,在所述利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像之后,所述训练方法还包括:
确定不同类型所述样品所对应的所述训练用二维图像中像素值差异大于预设阈值的差异区域;
根据所述差异区域对每一所述训练用二维图像进行裁剪,得到训练用裁剪后图像,并以所述训练用裁剪后图像作为训练样本。
4.根据权利要求1所述的训练方法,其特征在于,在得到训练数据集之后,利用所述训练数据集对所述初始分类模型进行训练之前,所述训练方法还包括:
对所述训练数据集进行增强处理,得到增强后训练数据集,并以所述增强后训练数据集作为新的训练数据集;所述增强处理包括随机旋转、随机缩放、水平移动、垂直移动、水平翻转、垂直翻转、剪切变换和通道移位。
5.根据权利要求1所述的训练方法,其特征在于,所述初始分类模型采用残差网络;所述残差网络包括依次连接的输入层、第一卷积层、残差模块、第一批规范化层、全局平均池化层、全连接层和输出层;
所述残差模块包括依次连接的第二批规范化层、第二卷积层、第三批规范化层和第三卷积层;所述第一卷积层分别与所述第二批规范化层和所述残差模块的输出端相连接;所述第三卷积层和所述残差模块的输出端相连接。
6.根据权利要求5所述的训练方法,其特征在于,当所述残差模块的输入维度和输出维度不同时,所述第一卷积层通过平均池化层和所述残差模块的输出端相连接。
7.一种近红外光谱的分类模型训练系统,其特征在于,所述训练系统包括:
第一获取模块,用于获取多种类型样品分别对应的多个训练用近红外光谱序列;
第一转换模块,用于利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像,得到训练样本;所有所述训练样本和所述训练样本对应的标签组成训练数据集;
构建模块,用于构建初始分类模型;
训练模块,用于利用所述训练数据集对所述初始分类模型进行训练,得到分类模型;
所述利用MTF将每一所述训练用近红外光谱序列转换为训练用二维图像具体包括:
将所述训练用近红外光谱序列划分为Q个分位数区间;所述训练用近红外光谱序列中的每一个序列点均对应一个唯一的分位数区间;
采用一阶马尔可夫链计算所述分位数区间之间的转移概率,构建马尔可夫矩阵;所述马尔可夫矩阵为Q×Q矩阵;
根据所述马尔可夫矩阵构建马尔可夫变迁场;所述马尔可夫变迁场为T×T矩阵;T为所述训练用近红外光谱序列所对应的序列点的个数;
将所述马尔可夫变迁场进行可视化,得到训练用二维图像。
8.一种近红外光谱的分类方法,其特征在于,所述方法包括:
获取待分类近红外光谱序列;
利用MTF将所述待分类近红外光谱序列转换为二维图像;
以所述二维图像作为输入,利用分类模型进行分类;所述分类模型是利用权利要求1所述的训练方法训练得到的分类模型。
9.一种近红外光谱的分类系统,其特征在于,所述系统包括:
第二获取模块,用于获取待分类近红外光谱序列;
第二转换模块,用于利用MTF将所述待分类近红外光谱序列转换为二维图像;
分类模块,用于以所述二维图像作为输入,利用分类模型进行分类;所述分类模型是利用权利要求1所述的训练方法训练得到的分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110722777.9A CN113378971B (zh) | 2021-06-28 | 2021-06-28 | 近红外光谱的分类模型训练方法、系统及分类方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110722777.9A CN113378971B (zh) | 2021-06-28 | 2021-06-28 | 近红外光谱的分类模型训练方法、系统及分类方法、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113378971A CN113378971A (zh) | 2021-09-10 |
CN113378971B true CN113378971B (zh) | 2024-05-28 |
Family
ID=77579717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110722777.9A Active CN113378971B (zh) | 2021-06-28 | 2021-06-28 | 近红外光谱的分类模型训练方法、系统及分类方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113378971B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114062305B (zh) * | 2021-10-15 | 2024-01-26 | 中国科学院合肥物质科学研究院 | 基于近红外光谱和1D-In-Resnet网络的单籽粒品种鉴定方法及系统 |
CN113959979B (zh) * | 2021-10-29 | 2022-07-29 | 燕山大学 | 基于深度Bi-LSTM网络的近红外光谱模型迁移方法 |
US12105016B2 (en) * | 2022-01-31 | 2024-10-01 | Penrose Hill | Using FI-RT to build wine classification models |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109166590A (zh) * | 2018-08-21 | 2019-01-08 | 江西理工大学 | 一种基于空域相关性的二维时频掩模估计建模方法 |
CN110298396A (zh) * | 2019-06-25 | 2019-10-01 | 北京工业大学 | 基于深度学习多特征融合的高光谱图像分类方法 |
CN110717368A (zh) * | 2018-07-13 | 2020-01-21 | 北京服装学院 | 一种纺织品定性分类方法 |
CN111723731A (zh) * | 2020-06-18 | 2020-09-29 | 西安电子科技大学 | 基于空谱卷积核的高光谱图像分类方法、存储介质及设备 |
CN112613536A (zh) * | 2020-12-08 | 2021-04-06 | 燕山大学 | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7773088B2 (en) * | 2000-06-19 | 2010-08-10 | Mental Images Gmbh | Simultaneous simulation of markov chains using quasi-monte carlo techniques |
CN110163234B (zh) * | 2018-10-10 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、装置和存储介质 |
-
2021
- 2021-06-28 CN CN202110722777.9A patent/CN113378971B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717368A (zh) * | 2018-07-13 | 2020-01-21 | 北京服装学院 | 一种纺织品定性分类方法 |
CN109166590A (zh) * | 2018-08-21 | 2019-01-08 | 江西理工大学 | 一种基于空域相关性的二维时频掩模估计建模方法 |
CN110298396A (zh) * | 2019-06-25 | 2019-10-01 | 北京工业大学 | 基于深度学习多特征融合的高光谱图像分类方法 |
CN111723731A (zh) * | 2020-06-18 | 2020-09-29 | 西安电子科技大学 | 基于空谱卷积核的高光谱图像分类方法、存储介质及设备 |
CN112613536A (zh) * | 2020-12-08 | 2021-04-06 | 燕山大学 | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 |
Non-Patent Citations (4)
Title |
---|
一种基于二维隐马尔可夫模型的图像分类算法;胡迎松, 朱阿柯, 陈刚, 陈中新;计算机应用(第04期);全文 * |
图像分割中的模糊聚类方法;李旭超;刘海宽;王飞;白春艳;;中国图象图形学报(第04期);全文 * |
基于卷积神经网络的烟叶近红外光谱分类建模方法研究;鲁梦瑶;杨凯;宋鹏飞;束茹欣;王萝萍;杨玉清;刘慧;李军会;赵龙莲;张晔晖;;光谱学与光谱分析(第12期);全文 * |
基于马尔可夫矩阵的纸币图像识别;付亚平;王从庆;杨英杰;;信息技术(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113378971A (zh) | 2021-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113378971B (zh) | 近红外光谱的分类模型训练方法、系统及分类方法、系统 | |
CN111914907B (zh) | 一种基于深度学习空谱联合网络的高光谱图像分类方法 | |
CN108108657B (zh) | 基于多任务深度学习的修正局部敏感哈希车辆检索方法 | |
CN107563433B (zh) | 一种基于卷积神经网络的红外小目标检测方法 | |
CN110008948B (zh) | 基于变分自编码网络的高光谱图像目标检测方法 | |
CN109766858A (zh) | 结合双边滤波的三维卷积神经网络高光谱影像分类方法 | |
CN111783884B (zh) | 基于深度学习的无监督高光谱图像分类方法 | |
CN109063541B (zh) | 用于指纹识别的系统和方法 | |
CN111368691B (zh) | 无监督高光谱遥感图像空谱特征提取方法 | |
CN103679675A (zh) | 一种面向水质定量遥感应用的遥感影像融合方法 | |
CN112766227B (zh) | 一种高光谱遥感影像分类方法、装置、设备及存储介质 | |
CN114821342B (zh) | 一种遥感影像道路提取方法及系统 | |
CN113723255A (zh) | 一种高光谱影像分类方法和存储介质 | |
CN103886334A (zh) | 一种多指标融合的高光谱遥感影像降维方法 | |
CN113192076A (zh) | 联合分类预测和多尺度特征提取的mri脑肿瘤图像分割方法 | |
Zhang et al. | Superpixel-guided sparse unmixing for remotely sensed hyperspectral imagery | |
CN114445665A (zh) | 基于Transformer增强的非局部U形网络的高光谱影像分类方法 | |
CN111242028A (zh) | 基于U-Net的遥感图像地物分割方法 | |
Trevino-Sanchez et al. | Hybrid pooling with wavelets for convolutional neural networks | |
CN113887656B (zh) | 一种联合深度学习与稀疏表示的高光谱图像分类方法 | |
CN116091763A (zh) | 苹果叶部病害图像语义分割系统及分割方法、设备和介质 | |
CN118247585B (zh) | 一种基于滑动窗口扫描和级联森林的湿地地物分类方法 | |
CN111339825B (zh) | 基于特征关系图谱学习的模型训练方法及数据分类方法 | |
CN117095208B (zh) | 一种面向光电吊舱侦察图像的轻量化场景分类方法 | |
CN118334420A (zh) | 多层级的跨场景高光谱图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |