CN113903407A - 成分识别方法、装置、电子设备和存储介质 - Google Patents

成分识别方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113903407A
CN113903407A CN202111056791.6A CN202111056791A CN113903407A CN 113903407 A CN113903407 A CN 113903407A CN 202111056791 A CN202111056791 A CN 202111056791A CN 113903407 A CN113903407 A CN 113903407A
Authority
CN
China
Prior art keywords
near infrared
component
model
infrared spectrum
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111056791.6A
Other languages
English (en)
Inventor
王学雷
杨杰超
王瑞华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN202111056791.6A priority Critical patent/CN113903407A/zh
Publication of CN113903407A publication Critical patent/CN113903407A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明实施例提供一种成分识别方法、装置、电子设备和存储介质,其中方法包括:确定待检测目标的原始近红外光谱;将原始近红外光谱输入至成分识别模型中,得到成分识别模型输出的待检测目标的成分及含量;其中,成分识别模型是基于预设数量的样本近红外光谱和与样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。如此,通过对预设的深度学习模型进行训练得到成分识别模型,该成分识别模型具有更好的泛化能力,可以更好的体现近红外光谱与各个成分之间的复杂非线性关系。即使待检测物品中成分种类较多时,也可以更加准确的反映近红外光谱与目标变量之间的关系,提高对于待检测目标的成分识别的能力。

Description

成分识别方法、装置、电子设备和存储介质
技术领域
本发明涉及近红外光谱分析领域,具体涉及一种成分识别方法、装置、电子设备和存储介质。
背景技术
物体的近红外光谱蕴含着物体丰富的组成与结构信息。通过分析物体的近红外光谱可以识别处物体的成分和含量。现在基于近红外光谱进行物品成分识别作为一种快速、绿色、非接触的测量识别技术,逐渐取代传统化学实验室分析识别技术,应用于工业质量控制和产品成分检测等领域中。
现有的基于近红外光谱的成分识别方法主要为线性建模法。线性建模法通常假设光谱变量与目标成分含量之间的关系是线性关系。实际应用中,光谱变量与目标成分含量之间存在复杂的非线性关系,线性建模法中的线性成分识别模型并不能体现近红外光谱与目标变量之间复杂的非线性关系。特别是在待检测物品中成分种类较多,光谱变量与目标成分含量之间的关系包括线性关系和非线性关系时,基于近红外光谱的线性建模法的识别能力较差。
发明内容
本发明实施例提供一种成分识别方法、装置、电子设备和存储介质,用以解决现有方案中,在待检测物品中成分种类较多,光谱变量与目标成分含量之间的关系包括线性关系和非线性关系时,基于近红外光谱的线性建模法的识别能力较差的问题。
第一方面,本发明实施例提供一种成分识别方法,包括:
确定待检测目标的原始近红外光谱;
将所述原始近红外光谱输入至成分识别模型中,得到所述成分识别模型输出的待检测目标的成分及含量;
其中,所述成分识别模型是基于预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。
优选地,训练所述预设的深度学习模型时采用的样本近红外光谱为进行标准正态变换之后的近红外光谱;
相对应的,所述确定待检测目标的原始近红外光谱,包括:
确定待检测目标的经过标准正态变换的原始近红外光谱。
优选地,所述成分识别模型包括卷积神经网络模块和循环神经网络模块;
所述卷积神经网络模块用于接收所述原始近红外光谱,抽取所述原始近红外光谱的局部抽象特征,并将所述局部抽象特征发送至循环神经网络模块;
所述循环神经网络模块用于获取所述局部抽象特征,并基于所述局部抽象特征之间复杂的序列依赖关系,确定并输出待检测目标的成分及含量。
优选地,所述卷积神经网络模块包括输入层、卷积层和池化层;
所述卷积层采用一维深度可分离卷积提取局部特征;所述卷积层的卷积核权重的初始化采用方差缩放方法;激活函数为修正线性单元激活函数;所述池化层采用最大值池化方式。
优选地,所述循环神经网络模块包括隐含层和输出层;
所述输出层的激活函数为线性激活函数。
优选地,所述成分识别模型的训练过程包括:
获取训练样本集;所述训练样本集包括预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识;
基于五折交叉验证法,通过所述训练样本集,对基于卷积神经网络模型和循环神经网络模型搭建的深度学习模型进行训练,得到成分识别模型。
优选地,所述基于五折交叉验证法,通过所述训练样本集,对基于卷积神经网络模型和循环神经网络模型搭建的深度学习模型进行训练,得到成分识别模型,包括:
将所述获取训练样本集划分为多组训练集和一组验证集;
分别基于各组所述训练集,对所述深度学习模型进行训练,得到与各组训练集一一对应的训练后深度学习模型;
基于所述验证集,验证各个所述训练后深度学习模型的识别效果,并通过均方根误差和决定系数量化识别效果;
选取识别效果最优的训练后深度学习模型为成分识别模型。
第一方面,本发明实施例提供一种成分识别装置,包括:
光谱确定单元,用于确定待检测目标的原始近红外光谱;
成分识别单元,用于将所述原始近红外光谱输入至成分识别模型中,得到所述成分识别模型输出的待检测目标的成分及含量;其中,所述成分识别模型是基于预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的成分识别方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的成分识别方法的步骤。
本发明实施例提供的成分识别方法,通过对预设的深度学习模型进行训练得到成分识别模型,基于成分识别模型和待检测目标的原始近红外光谱,进行待检测目标的成分识别。与现有技术相比,通过对预设的深度学习模型进行训练得到的成分识别模型,具有更好的泛化能力,可以更好的体现近红外光谱与各个成分之间的线性关系或非线性关系。即使待检测物品中成分种类较多时,也可以更加准确的反映近红外光谱与目标变量之间的关系,提高对于待检测目标的成分识别的能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的成分识别方法的流程示意图;
图2为本发明实施例提供的成分识别模型的示意图;
图3为本发明实施例提供的成分识别装置的结构示意图;
图4为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
物体的近红外光谱蕴含着物体丰富的组成与结构信息。通过分析物体的近红外光谱可以识别处物体的成分和含量。现在基于近红外光谱进行物品成分识别作为一种快速、绿色、非接触的测量识别技术,逐渐取代传统化学实验室分析识别技术,应用于工业质量控制和产品成分检测等领域中。现有的基于近红外光谱的成分识别方法主要为线性建模法。线性建模法通常假设光谱变量与目标成分含量之间的关系是线性关系。实际应用中,光谱变量与目标成分含量之间存在复杂的非线性关系,线性建模法中的线性成分识别模型并不能体现近红外光谱与目标变量之间复杂的非线性关系。特别是在待检测物品中成分种类较多、数目大、丰富度大时,光谱变量与目标成分含量之间存在复杂非线性关系,基于近红外光谱的线性建模法的识别能力较差。
针对这一问题,本发明实施例提供了一种成分识别方法。图1为本发明实施例提供的成分识别方法的流程示意图,如图1所示,该方法包括:
步骤110,确定待检测目标的原始近红外光谱;
具体地,待检测目标即需要进行成分识别的目标。一般情况下,执行步骤110前,需要对待检测目标进行风干,粉碎,并通过预设筛子筛选,保留直径小于预设距离的样本,之后通过特定的仪器,采集样本的原始近红外光谱。
进一步的,在实际应用中获取待检测目标的原始近红外光谱时可能会因为光源散射,引起变化,为了避免这些变化的影响,本申请提供的方案中,可以对获取的待检测目标的原始近红外光谱进行标准正态变换,以移除光源散射引起的状态变化。
步骤120,将所述原始近红外光谱输入至成分识别模型中,得到所述成分识别模型输出的待检测目标的成分及含量;其中,所述成分识别模型是基于预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。
需要说明的是,当步骤110中原始近红外光谱为进行了标准正态变换的原始近红外光谱时,步骤120中的成分识别模型进行训练时,采用的样本近红外光谱为进行标准正态变换的近红外光谱,如此设置,使得训练好的成分识别模型可以对标准正态变换的原始近红外光谱进行特征提取并基于标准正态变换后的原始近红外光谱对待检测目标进行成分识别。
本申请提供的方案中,通过对预设的深度学习模型进行训练得到成分识别模型,基于成分识别模型和待检测目标的原始近红外光谱,进行待检测目标的成分识别。与现有技术相比,通过对预设的深度学习模型进行训练得到的成分识别模型,具有更好的泛化能力,可以更好的体现近红外光谱与各个成分之间的复杂非线性关系。即使待检测物品中成分种类较多时,也可以更加准确的反映近红外光谱与目标变量之间的关系,提高对于待检测目标的成分识别的能力。
需要说明的是,本发明的核心是将深度学习方法引入到近红外光谱建模方法中,提高成分识别模型在大规模近红外光谱样本库中的预测准确性和鲁棒性。现有的近红外光谱建模方法忽略了近红外光谱的次序信息和非线性关系,考虑到光谱本质上属于一维序列数据,近红外光谱中相同大小的特征峰出现在不同波长位置代表着不同的成分含量信息,充分利用光谱特征的次序信息是近红外光谱分析建模中不可忽略的因素,因此需要开发一种基于深度学习的建模方法充分利用光谱所包含的次序信息,提高成分识别模型在大规模近红外光谱样本库中的预测准确性和鲁棒性。
基于此,本申请提供的方案中所述成分识别模型包括卷积神经网络模块和循环神经网络模块;所述卷积神经网络模块用于接收所述原始近红外光谱,抽取所述原始近红外光谱的局部抽象特征,并将所述局部抽象特征发送至循环神经网络模块;所述循环神经网络模块用于获取所述局部抽象特征,并基于所述局部抽象特征之间复杂的序列依赖关系,确定并输出待检测目标的成分及含量。
具体的,参照图2,所述卷积神经网络模块包括输入层、卷积层和池化层;所述卷积层采用一维深度可分离卷积提取局部特征;所述卷积层的卷积核权重的初始化采用方差缩放方法;所述卷积神经网络模块的激活函数为修正线性单元激活函数;所述池化层采用最大值池化方式。所述循环神经网络模块包括:隐含层和输出层;所述卷积神经网络模块的输出输入至所述隐含层;所述输出层输出待检测目标的成分及含量;所述输出层的激活函数为线性行激活函数。需要说明的是图2中,为了清晰的表述卷积层、池化层和隐含层,所以没有具体展现输入层和输出层。对于神经网络的输入层和输出层的设置可以参考现有技术,所以不在此进行一一赘述。
下面对本申请提供的成分识别模型的训练过程做进一步的说明,训练过程包括:
获取训练样本集;所述训练样本集包括预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识;
基于五折交叉验证法,通过所述训练样本集,对基于卷积神经网络模型和循环神经网络模型搭建的深度学习模型进行训练,得到成分识别模型。
其中,所述基于五折交叉验证法,通过所述训练样本集,对基于卷积神经网络模型和循环神经网络模型搭建的深度学习模型进行训练,得到成分识别模型,包括:
将所述获取训练样本集划分为训练集和验证集;
分别基于各所述训练集,对所述深度学习模型进行训练,得到训练后深度学习模型;
基于所述验证集,验证各个所述训练后深度学习模型的识别效果,并通过均方根误差和决定系数量化识别效果;
选取识别效果最优的训练后深度学习模型为成分识别模型。
具体的,训练模型的步骤主要包括:样本数据的收集、样本数据的划分、模型的构建和训练、模型的评价。
其中,样本数据收集时,需要同时测定样品的近红外光谱和对应理化性质。所有的样品都按照相同的采样策略收集,在收集时要尽保持实验条件的一致性。测定近红外光谱的波长应固定在一定范围,然后对近红外光谱样本进行标准正态变换以移除光源散射引起的状态变化。进一步的,通过测定样品对应理化性质确定测定样品的成分和含量。如此获得预设数量的样本近红外光谱和与所述样本近红外光谱对应的成分及含量标识。当然也可以将现有公开的符合标准的数据作为样本数据,例如当需要进行土壤成分的测量时,可以选用欧洲土地利用及覆盖统计调查数据集作为训练数据。欧洲土地利用及覆盖统计调查数据集由欧盟委员会授权欧洲土壤数据中心公开。样本采样点遍及欧洲23个国家,包含耕地、草地、林地等用地类型,土壤样本来源差异性较大,是迄今为止洲际最大的土壤数据库。为了保证土壤光谱库的一致性和可比较性,所有的样品都按照相同的采样策略收集,并在ISO认证的实验室进行分析。测量前,土壤样品被风干,粉碎,并通过2毫米的筛子筛选,保留直径小于2毫米的土壤样本进一步分析。选取有机碳值、氮含量、CEC浓度和pH值作为待预测目标成分含量。土壤样品的近红外光谱使用快速含量分析仪测得。快速含量分析仪工作波长范围为400-2500nm,分辨率为0.5nm,共包括4200个光谱特征。
样本数据的划分时,基于五折交叉验证方法,数据样本集划分为训练集和验证集。训练集用于训练深度学习模型,验证集用于调整模型的超参数,最终在验证集上取得最好预测准确度的模型被选为成分识别模型。
本申请提供的方案中,预设的深度学习模型的整体架构如附图2所示。模型充分利用了卷积神经网络可以提取近红外光谱的局部抽象特征的优势和循环神经网络可以学习特征之间的复杂序列依赖关系的特点。模型的输入为一维原始近红外光谱数据,输出为待检测目标成分及含量。模型包含两个模块,分别为卷积神经网络模块和循环神经网络模块。首先利用卷积神经网络模块提取光谱的局部抽象特征,然后应用循环神经网络模块学习卷积神经网络模块提取到的特征之间的复杂依赖关系。
卷积神经网络模块由卷积层和池化层堆叠而成。在卷积层,本发明采用一维深度可分离卷积提取输入信号的不同局部特征,卷积核权重的初始化采用方差缩放方法,激活函数为修正线性单元(ReLU)激活函数。批标准化层添加到每个卷积层后用来归一化所提取的特征,防止方差漂移现象。然后使用池化层缩小卷积层输出特征的尺度来去除冗余信息,从而缓解过拟合现象。池化操作采用最大值池化方式,在输出特征图上取相邻特征的最大值,步幅为2,这样输出的特征图的尺度减半,但仍保持了原有特征的序列关系。通过堆叠卷积层和池化层,增加网络的深度,卷积神经网络模块可以学习到原始近红外光谱的局部抽象特征。之后将卷积神经网络模块学习到的特征按照从左到右的次序输入到循环神经网络模块中。
循环神经网络模块由隐含层和输出层组成,隐含层包括:两层GRU层堆叠而成,第一层GRU以卷积神经网络提取的特征为输入,在每一个时间步输出特征,然后将第一层GRU输出的特征输入到第二层GRU,最后一个时间步输出特征。通过堆叠GRU层,循环神经网络模块可以在增加网络深度的同时通过权重共享机制减少模型权重参数,提高了模型的表达能力。最后将第二层GRU最后一个时间步输出的特征以全连接的方式输入到输出层中,输出层只包含一个神经元,激活函数为线性激活函数,输出样本对应的待预测目标成分和含量。
进一步的,模型的权重根据RMSprop算法动态优化,初始学习率设为3e-3,当验证集中模型的损失连续五轮不下降时,学习率减少至原始学习率的一半。最大训练轮数为设置为50轮,批量大小设为32,当验证集中的损失函数连续两轮相差1e-5或者训练到达最大训练轮数时,模型训练停止。搭建模型后,基于所述验证集,验证各个所述训练后深度学习模型的识别效果,并通过均方根误差和决定系数量化识别效果;选取识别效果最优的训练后深度学习模型为成分识别模型。
具体的,近红外光谱成分识别模型常用的预测准确性评价指标分别为测试集的均方根误差(RMSE)和决定系数(R2),均方根误差定义如公式(1)所示:
Figure BDA0003254972610000091
决定系数定义如公式(2)所示:
Figure BDA0003254972610000092
其中n为测试集的样本数目,
Figure BDA0003254972610000093
为测试样本集中观测值的平均值,yi为第i个样本的观测值,
Figure BDA0003254972610000094
为第i个样本的预测目标值。
需要说明的是,RMSE经常用来衡量实际观测值与预测值之间的平均差异大小,R2用来衡量模型的拟合程度,反映了模型所提取的特征对待预测目标成分含量的解释能力。RMSE和R2是常用的回归分析指标,用来衡量成分识别模型的好坏。总的来说,一个优秀的成分识别模型应该具有相对较小的RMSE值和较高的接近1的R2值。通过RMSE和R2可以量化训练后深度学习模型的识别效果。实际应用中,可以基于RMSE确定训练后深度学习模型的识别效果,也可以基于R2确定训练后深度学习模型的识别效果,还可以基于RMSE和R2综合评定训练后深度学习模型的识别效果。
基于上述任一实施例,图3为本发明实施例提供的成分识别装置的结构示意图,如图3所示,该装置包括:光谱确定单元310和成分识别单元320;所述光谱确定单元310,用于确定待检测目标的原始近红外光谱;成分识别单元320,用于将所述原始近红外光谱输入至成分识别模型中,得到所述成分识别模型输出的待检测目标的成分及含量;其中,所述成分识别模型是基于预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。
基于上述任一实施例,训练所述成分识别模型时采用的样本近红外光谱为进行标准正态变换之后的近红外光谱;相对应的,所述光谱确定单元具体用于:确定待检测目标的经过标准正态变换的原始近红外光谱。
基于上述任一实施例,所述成分识别模型包括卷积神经网络模块和循环神经网络模块;所述卷积神经网络模块用于接收所述原始近红外光谱,抽取所述原始近红外光谱的局部抽象特征,并将所述局部抽象特征发送至循环神经网络模块;所述循环神经网络模块用于获取所述局部抽象特征,并基于所述局部抽象特征之间复杂的序列依赖关系,确定并输出待检测目标的成分及含量。
所述卷积神经网络模块包括输入层、卷积层和池化层;所述卷积层采用一维深度可分离卷积提取局部特征;所述卷积层的卷积核权重的初始化采用方差缩放方法;所述卷积神经网络模块的激活函数为修正线性单元激活函数;所述池化层采用最大值池化方式。
所述循环神经网络模块包括隐含层和输出层;所述输出层的激活函数为线性激活函数。
基于上述任一实施例,所述成分识别模型的训练过程包括:获取训练样本集;所述训练样本集包括预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识;基于五折交叉验证法,通过所述训练样本集,对基于卷积神经网络模型和循环神经网络模型搭建的深度学习模型进行训练,得到成分识别模型。
基于上述任一实施例,所述基于五折交叉验证法,通过所述训练样本集,对基于卷积神经网络模型和循环神经网络模型搭建的深度学习模型进行训练,得到成分识别模型,包括:
将所述获取训练样本集划分为多组训练集和一组验证集;
分别基于各组所述训练集,对所述深度学习模型进行训练,得到与各组训练集一一对应的训练后深度学习模型;
基于上述任一实施例,基于所述验证集,验证各个所述训练后深度学习模型的识别效果,并通过均方根误差和决定系数量化识别效果;
选取识别效果最优的训练后深度学习模型为成分识别模型。
图4为本发明实施例提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑命令,以执行如下方法:确定待检测目标的原始近红外光谱;将所述原始近红外光谱输入至成分识别模型中,得到所述成分识别模型输出的待检测目标的成分及含量;其中,所述成分识别模型是基于预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。
此外,上述的存储器430中的逻辑命令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:确定待检测目标的原始近红外光谱;将所述原始近红外光谱输入至成分识别模型中,得到所述成分识别模型输出的待检测目标的成分及含量;其中,所述成分识别模型是基于预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干命令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种成分识别方法,其特征在于,包括:
确定待检测目标的原始近红外光谱;
将所述原始近红外光谱输入至成分识别模型中,得到所述成分识别模型输出的待检测目标的成分及含量;
其中,所述成分识别模型是基于预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。
2.根据权利要求1所述的成分识别方法,其特征在于,训练所述预设的深度学习模型时采用的样本近红外光谱为进行标准正态变换之后的近红外光谱;
相对应的,所述确定待检测目标的原始近红外光谱,包括:
确定待检测目标的经过标准正态变换的原始近红外光谱。
3.根据权利要求1所述的成分识别方法,其特征在于,所述成分识别模型包括卷积神经网络模块和循环神经网络模块;
所述卷积神经网络模块用于接收所述原始近红外光谱,抽取所述原始近红外光谱的局部抽象特征,并将所述局部抽象特征发送至循环神经网络模块;
所述循环神经网络模块用于获取所述局部抽象特征,并基于所述局部抽象特征之间复杂的序列依赖关系,确定并输出待检测目标的成分及含量。
4.根据权利要求3所述的成分识别方法,其特征在于,所述卷积神经网络模块包括输入层、卷积层和池化层;
所述卷积层采用一维深度可分离卷积提取局部特征;所述卷积层的卷积核权重的初始化采用方差缩放方法;所述卷积神经网络模块的激活函数为修正线性单元激活函数;所述池化层采用最大值池化方式。
5.根据权利要求3所述的成分识别方法,其特征在于,所述循环神经网络模块包括隐含层和输出层;
所述输出层的激活函数为线性激活函数。
6.根据权利要求1~5任一所述的成分识别方法,其特征在于,所述成分识别模型的训练过程包括:
获取训练样本集;所述训练样本集包括预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识;
基于五折交叉验证法,通过所述训练样本集,对基于卷积神经网络模型和循环神经网络模型搭建的深度学习模型进行训练,得到成分识别模型。
7.根据权利要求6所述的成分识别方法,其特征在于,所述基于五折交叉验证法,通过所述训练样本集,对基于卷积神经网络模型和循环神经网络模型搭建的深度学习模型进行训练,得到成分识别模型,包括:
将所述获取训练样本集划分为多组训练集和一组验证集;
分别基于各组所述训练集,对所述深度学习模型进行训练,得到与各组训练集一一对应的训练后深度学习模型;
基于所述验证集,验证各个所述训练后深度学习模型的识别效果,并通过均方根误差和决定系数量化识别效果;
选取识别效果最优的训练后深度学习模型为成分识别模型。
8.一种成分识别装置,其特征在于,包括:
光谱确定单元,用于确定待检测目标的原始近红外光谱;
成分识别单元,用于将所述原始近红外光谱输入至成分识别模型中,得到所述成分识别模型输出的待检测目标的成分及含量;其中,所述成分识别模型是基于预设数量的样本近红外光谱和与所述样本近红外光谱一一对应的成分及含量标识,对预设的深度学习模型训练得到的。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一项所述的成分识别方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7中任一项所述的成分识别方法的步骤。
CN202111056791.6A 2021-09-09 2021-09-09 成分识别方法、装置、电子设备和存储介质 Pending CN113903407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111056791.6A CN113903407A (zh) 2021-09-09 2021-09-09 成分识别方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111056791.6A CN113903407A (zh) 2021-09-09 2021-09-09 成分识别方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113903407A true CN113903407A (zh) 2022-01-07

Family

ID=79028078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111056791.6A Pending CN113903407A (zh) 2021-09-09 2021-09-09 成分识别方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113903407A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115345239A (zh) * 2022-08-17 2022-11-15 无锡迅杰光远科技有限公司 样品含量识别方法、装置和存储介质
CN117347396A (zh) * 2023-08-18 2024-01-05 北京声迅电子股份有限公司 基于XGBoost模型的物质种类识别方法
CN117171566B (zh) * 2022-08-17 2024-05-10 无锡迅杰光远科技有限公司 样品含量识别方法、装置和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115345239A (zh) * 2022-08-17 2022-11-15 无锡迅杰光远科技有限公司 样品含量识别方法、装置和存储介质
CN115345239B (zh) * 2022-08-17 2023-10-13 无锡迅杰光远科技有限公司 样品含量识别方法、装置和存储介质
CN117171566A (zh) * 2022-08-17 2023-12-05 无锡迅杰光远科技有限公司 样品含量识别方法、装置和存储介质
CN117171566B (zh) * 2022-08-17 2024-05-10 无锡迅杰光远科技有限公司 样品含量识别方法、装置和存储介质
CN117347396A (zh) * 2023-08-18 2024-01-05 北京声迅电子股份有限公司 基于XGBoost模型的物质种类识别方法
CN117347396B (zh) * 2023-08-18 2024-05-03 北京声迅电子股份有限公司 基于XGBoost模型的物质种类识别方法

Similar Documents

Publication Publication Date Title
US8731839B2 (en) Method and system for robust classification strategy for cancer detection from mass spectrometry data
Bai et al. Accurate prediction of soluble solid content of apples from multiple geographical regions by combining deep learning with spectral fingerprint features
CN110687072B (zh) 一种基于光谱相似度的校正集和验证集的选择及建模方法
CN107609399A (zh) 基于nin神经网络的恶意代码变种检测方法
CN113903407A (zh) 成分识别方法、装置、电子设备和存储介质
CN113030001B (zh) 一种水果糖度检测方法及系统
CN112098358B (zh) 基于四元数卷积神经网络的近红外光谱并行融合定量检测方法
CN107655850A (zh) 基于近红外光谱的非线性建模方法及系统
Tichý et al. Evaluating the stability of the classification of community data
CN113420795B (zh) 一种基于空洞卷积神经网络的矿物光谱分类方法
Liu et al. Series fusion of scatter correction techniques coupled with deep convolution neural network as a promising approach for NIR modeling
CN111693487A (zh) 基于遗传算法和极限学习机的水果糖度检测方法及系统
CN108827909B (zh) 基于可见近红外光谱与多目标融合的土壤快速分类方法
US11525774B2 (en) Sensory evaluation method for spectral data of mainstream smoke
CN116451081A (zh) 数据漂移的检测方法、装置、终端及存储介质
CN107067034B (zh) 一种快速识别红外光谱数据分类的方法及系统
Li et al. Application of laser-induced breakdown spectroscopy coupled with spectral matrix and convolutional neural network for identifying geographical origins of Gentiana rigescens Franch
CN114141316A (zh) 一种基于谱图分析的有机物生物毒性预测方法及系统
Wang et al. Estimation of soil organic matter by in situ Vis-NIR spectroscopy using an automatically optimized hybrid model of convolutional neural network and long short-term memory network
CN112881333A (zh) 一种基于改进免疫遗传算法的近红外光谱波长筛选方法
RU2797495C1 (ru) Способ использования спектроскопических данных для определения органолептических характеристик сигаретного дыма основного потока
CN111222543A (zh) 物质识别方法和设备及计算机可读存储介质
CN113740294B (zh) 基于近红外建模的汽油/柴油检测分析方法及装置
Bertinetto et al. Influence of pre-processing and distance on spectral classification: A simulation study
CN114813631B (zh) 小麦品种纯度检测方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination