CN112098358B - 基于四元数卷积神经网络的近红外光谱并行融合定量检测方法 - Google Patents
基于四元数卷积神经网络的近红外光谱并行融合定量检测方法 Download PDFInfo
- Publication number
- CN112098358B CN112098358B CN202010931678.7A CN202010931678A CN112098358B CN 112098358 B CN112098358 B CN 112098358B CN 202010931678 A CN202010931678 A CN 202010931678A CN 112098358 B CN112098358 B CN 112098358B
- Authority
- CN
- China
- Prior art keywords
- quaternion
- spectrum
- neural network
- derivative
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 24
- 230000004927 fusion Effects 0.000 title claims abstract description 16
- 238000001514 detection method Methods 0.000 title claims abstract description 13
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 11
- 238000001228 spectrum Methods 0.000 claims abstract description 114
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims abstract description 25
- 238000003062 neural network model Methods 0.000 claims abstract description 24
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims abstract description 23
- 235000005822 corn Nutrition 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000003595 spectral effect Effects 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims description 27
- 240000008042 Zea mays Species 0.000 claims description 23
- 238000013527 convolutional neural network Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 16
- 102000004169 proteins and genes Human genes 0.000 claims description 10
- 108090000623 proteins and genes Proteins 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 238000002835 absorbance Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 abstract description 8
- 238000004445 quantitative analysis Methods 0.000 abstract description 4
- 241000209149 Zea Species 0.000 abstract 2
- 238000000605 extraction Methods 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000001237 Raman spectrum Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000001069 Raman spectroscopy Methods 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- CSGQVNMSRKWUSH-IAGOWNOFSA-N (3r,4r)-4-amino-1-[[4-(3-methoxyanilino)pyrrolo[2,1-f][1,2,4]triazin-5-yl]methyl]piperidin-3-ol Chemical compound COC1=CC=CC(NC=2C3=C(CN4C[C@@H](O)[C@H](N)CC4)C=CN3N=CN=2)=C1 CSGQVNMSRKWUSH-IAGOWNOFSA-N 0.000 description 1
- 206010062129 Tongue neoplasm Diseases 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008309 brain mechanism Effects 0.000 description 1
- 238000012569 chemometric method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000012880 independent component analysis Methods 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012846 near infrared spectroscopy analysis technique Methods 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 201000002743 tongue squamous cell carcinoma Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3577—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本申请公开了一种基于四元数卷积神经网络的近红外光谱并行融合定量检测方法。该方法包括以下步骤:获得国际公开玉米近红外光谱和四种成分数据库数据;由原始光谱求出一阶导数和二阶导数光谱并进行归一化;基于四元数理论对三种归一化光谱数据进行四元数空间嵌入并行表示;建立四元数卷积神经网络模型并优化模型参数完成玉米成分定量模型建立。本发明利用四元数和深度学习算法将近红外光谱及其导数光谱进行并行表示和并行特征提取,充分挖掘原始光谱数据和导数光谱数据的并行融合特征,建立性能更优的近红外光谱定量分析模型。
Description
技术领域
本发明属于近红外光谱分析领域,尤其涉及一种基于四元数卷积神经网络的近红外光谱并行融合定量检测方法。
背景技术
近红外光谱分析技术具有无需前处理、简便快捷、适用样品范围广、多组分同时检测等优点,因此在食品、农业、医药、石油等领域得到了广泛的应用。化学计量学方法是近红外光谱分析技术中的重要工具。近年来,近红外光谱检测技术结合化学计量学广泛的应用于物质的定性和定量分析。
然而,传统近红外光谱定量建模时只单独采用原始光谱进行建模,得到的模型只能挖掘出单一特征信息,利用该模型进行物质(如,玉米)的定量分析时,不能得到准确的定量预测结果。
发明内容
本发明的发明目的是:提出一种基于四元数卷积神经网络对近红外光谱并行融合定量建模的新方法,以提高定量模型的预测精度。
为实现上述目的,本发明提供一种基于四元数卷积神经网络的近红外光谱并行融合定量检测方法,包括以下步骤:
步骤1、基于公开数据库获得样本的原始光谱数据;
步骤2、基于样本的原始光谱数据,采用导数光谱法获得原始光谱的一阶导数光谱和二阶导数光谱;
步骤3、将原始光谱数据、一阶导数光谱和二阶导数光谱进行归一化;并按照波数对齐光谱数据,分别对应四元数的i,j,k三个虚部,四元数实部为零,将经过归一化的原始光谱数据、经过归一化的一阶导数光谱和经过归一化的二阶导数光谱嵌入四元数空间表示成纯四元数光谱矩阵形式;
步骤4、在一维卷积神经网络模型基础上,以所述纯四元数光谱矩阵作为输入数据,建立四元数卷积神经网络模型;
步骤5、对所述四元数卷积神经网络模型进行训练优选地,包括:
将原始光谱数据、一阶导数光谱、二阶导数光谱组成的四元数矩阵及对应样本的水分和蛋白质真值随机划分为60%训练集、20%验证集和20%测试集;
利用所述训练集训练所述四元数卷积神经网络模型,通过参数寻优,得到最优参数,确定模型参数;所述参数至少包括:四元数卷积核的个数、池化层的尺寸、学习率的大小、全连接层神经元个数;
利用所述验证集验证所述四元数卷积神经网络模型的性能;
利用所述测试集测试所述四元数卷积神经网络模型,使用预测均方根误差和预测相关系数作为模型的评价指标;
步骤6、根据训练好的四元数卷积神经网络模型进行样本的成分定量预测,得到样本的成分定量预测结果。
优选地,所述样本为玉米,玉米原始光谱数据为240*700矩阵形式,包括240行,每行代表一条光谱,每一条光谱包括按列存储的700个吸光度值,水分、蛋白质的真值数据为80*2矩阵形式,包括80行,每行代表一个玉米样本的水分和蛋白质含量,包括2列,一列为水分含量,另一列为蛋白质含量,水分真值范围为9.377%~10.993%,蛋白质真值范围为7.654%~9.711%。
优选地,一阶导数光谱为240*699,二阶导数光谱数据共为240*698;将所述一阶导数光谱和所述二阶导数光谱均扩展为240*700形式,所缺元素用0补全。
优选地,将原始光谱数据、一阶导数光谱和二阶导数光谱进行归一化包括:采用归一化法将原始光谱数据、一阶导数光谱和二阶导数光谱进行归一化。
优选地,所述建立四元数卷积神经网络模型包括:
将卷积核扩展为四元数卷积核;
输入数据为四元数矩阵,经过四元数卷积层和四元数池化层后,最终经过全连接层,即为四元数卷积神经网络模型。
本发明技术方案带来的有益效果:
本发明提出的基于四元数卷积神经网络对近红外光谱并行融合定量检测的方法,充分利用原始光谱和一阶二阶导数光谱数据进行并行特征提取,解决了传统近红外光谱定量建模时只单独采用原始光谱进行建模,没能充分挖掘三类光谱的并行融合特征信息的技术问题,提高了定量模型的预测精度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种基于四元数卷积神经网络对近红外光谱并行融合定量检测方法的流程示意图;
图2为本发明实施例中玉米原始光谱、一阶导数光谱和二阶导数光谱图;
图3为本发明实施例中模型训练验证流程图;
图4为本发明实施例中四元数卷积神经网络模型;
图5为本发明实施例中基于四元数卷积神经网络的玉米近红外光谱所含水分和蛋白质定量建模结果。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
四元数代数是复数在四维实空间的不可交换延伸,是Clifford代数(克利福德代数)的一个子代数。近年来在图像处理、雷达信号分析、传感器阵列数据分析、姿态控制等领域得到广泛应用。目前已经提出了四元数矩阵奇异值分解、四元数傅立叶变换、四元数卷积、四元数相关、四元数小波、四元数主成分分析、四元数独立成分分析、四元数插值、四元数最小二乘等算法,并开发有相应的软件工具包。
深度学习是用于建立、模拟人脑进行分析学习,并模仿人脑的机制来解释数据的一种深层网络,近年来,该技术在图像处理、语音识别、文本数据等多个应用领域取得显著成果。其中,卷积神经网络(Convolution Neural Network,CNN)是运用最早和最广泛的深度学习模型,能够从复杂数据中自主提取有效特征结构进行学习,与传统的浅层学习模型相比,具有更强大的模型表达能力。深度学习算法已被应用于拉曼光谱等信号的分析研究。董家林研究基于深度学习的拉曼光谱稀疏波长选择方法;Yu M等基于光纤拉曼光谱和深度卷积神经网络,提出可鉴别舌鳞状细胞癌和无肿瘤舌组织的分类模型,实现了99.31%的高灵敏度和94.44%特异性。Fan X等基于TensorFlow开发了深度学习拉曼光谱混合物识别DeepCID模型,该模型在液态和粉末状混合物识别中表现出比传统方法更强的灵敏度;Liu等提出一种使用深度卷积神经网络对多类别拉曼光谱数据分类的方法,在RRUFF矿物拉曼光谱数据库上取得了优异的分类效果。
四元数具有多元数据并行表示和分析的结构特点,深度学习中的卷积神经网络以其权值共享结构优势在很多领域都取得成功应用,目前将四元数与深度学习相结合的方法在分析化学领域应用还未见报道。本发明中,在分析化学领域,将四元数与深度学习相结合,提出了一种基于四元数卷积神经网络对近红外光谱并行融合定量建模的新方法,以提高定量分析模型的预测精度。
参见图1,其示出了本发明实施例中一种基于四元数卷积申请网络对近红外光谱并行融合定量检测方法的流程示意图。该方法包括:
步骤1、基于公开数据库获得玉米的原始光谱数据;
EVRI网站公开的玉米近红外光谱数据集(http://eigenvector.com/data/Corn),该数据集是利用m5、mp5、mp6共3种近红外光谱仪分别测量80个不同的玉米样本,共采集获得240条近红外吸收光谱。光谱仪波长范围均为1100-2498nm,间隔为2nm,每条光谱有700个波长点处的吸光度值,玉米原始光谱数据为240*700矩阵形式,包括240行,每行代表一条光谱,每一条光谱包括按列存储的700个吸光度值,水分、蛋白质的真值(具体含量)数据为80*2矩阵形式,包括80行,每行代表一个玉米样本的水分和蛋白质含量,包括2列,一列为水分含量,另一列为蛋白质含量。水分真值范围为9.377%~10.993%,蛋白质真值范围为7.654%~9.711%。
步骤2、基于玉米原始光谱数据,采用导数光谱法获得玉米原始光谱的一阶导数光谱和二阶导数光谱;
基于玉米原始光谱数据,求得一阶和二阶导数光谱数据分别为240*699,240*698格式。如图2所示,其示出了本发明实施例中玉米原始光谱、一阶导数光谱和二阶导数光谱图。
步骤3、将原始光谱数据、一阶导数光谱和二阶导数光谱进行归一化,并将归一化后的原始光谱、一阶导数光谱、二阶导数光谱嵌入四元数空间表示成纯四元数光谱矩阵形式;
原始光谱数据、一阶导数光谱数据和二阶导数光谱数据首先进行归一化处理。优选地,本发明实施例中采用标准化方法对原始光谱、一阶导数光谱和二阶导数光谱分别进行归一化。
归一化后的三类光谱数据组成四元数矩阵,四元数Q=r+xi+yj+zk,r,x,y,z为四个实数,1,i,j,k是四元数单位基。r是四元数的实部,而xi+yj+zk是四元数的虚部。按照波数对齐光谱数据,分别对应四元数的i,j,k三个虚部,四元数实部为零,将原始数据嵌入四元数空间表示成纯四元数光谱矩阵形式Q=xi+yj+zk,x、y、z分别为原始光谱、一阶导数光谱和二阶导数光谱数据,组成的四元数矩阵Q中的每一行均为三类光谱组成的纯四元数形式。
根据四元数代数基本理论,将3种数据组合起来需要为同样的矩阵形式,将一阶导数、二阶导数光谱矩阵均扩展为240*700形式的矩阵,在导数光谱数据不变的前提下,将所缺的列用元素全为0的700*1和700*2补全矩阵变为240*700矩阵,再构造成四元数光谱矩阵。
步骤4、在一维卷积神经网络模型基础上,以纯四元数光谱矩阵作为输入数据,建立四元数卷积神经网络模型;
将卷积核扩展为四元数卷积核;输入数据为四元数矩阵,经过四元数卷积层和四元数池化层后,最终经过全连接层,即为四元数卷积神经网络模型。本发明实施例中的四元数卷积神经网络模型由两个四元数卷积层、两个池化层、一个全连接层组成。如图4所示,其示出了本发明实施例中四元数卷积神经网络模型的结构示意图。
四元数卷积神经网络模型的建立,主要是将输入数据和卷积核均扩展为四元数,利用四元数性质进行前向和反馈,训练整个四元数卷积神经网络。
四元数卷积原理为:
四元数卷积神经网络的输入数据为四元数矩阵,矩阵的每一行均为一个四元数向量,卷积核同样为四元数形式。设W=R+Xi+Yj+Zk为四元数权值滤波矩阵,Xp=r+xi+yj+zk为四元数输入向量。在实值空间中定义了卷积过程:
因此可以表示为矩阵形式:
步骤5、对建立的四元数卷积神经网络模型进行训练,通过参数寻优确定所述四元数卷积神经网络模型中参数的最优值。
在模型训练过程中,需要进行参数寻优,模型评价指标为预测均方根系数和预测相关系数。
如图3所示,其示出了本发明实施例中模型训练验证流程图,该模型训练过程包括:将原始光谱数据、一阶导数光谱、二阶导数光谱组成的四元数矩阵及对应玉米水分和蛋白质真值划分为训练集、验证集和测试集;利用训练集训练所述四元数卷积神经网络模型,通过参数寻优,得到最优参数,确定模型参数;参数至少包括:四元数卷积核的个数、池化层的尺寸、学习率的大小、全连接层神经元个数;利用验证集验证四元数卷积神经网络模型的性能;利用测试集测试四元数卷积神经网络模型,使用预测均方根误差和预测相关系数作为模型的评价指标。
表1示出了不同卷积核数目下水分值模型指标;表2示出了不同神经元数目下水分值模型指标。
表1
表2
步骤6:根据训练好的四元数卷积神经网络模型进行玉米的成分定量预测,得到玉米的成分定量预测结果。
如图5所示,其示出了基于四元数卷积神经网络模型得到的玉米成分定量预测结果,左图为水分值的预测结果,右图为蛋白质值的预测结果。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (5)
1.一种基于四元数卷积神经网络的近红外光谱并行融合定量检测方法,其特征在于,包括以下步骤:
步骤1、基于公开数据库获得样本的原始光谱数据;
步骤2、基于样本的原始光谱数据,采用导数光谱法获得原始光谱的一阶导数光谱和二阶导数光谱;
步骤3、将原始光谱数据、一阶导数光谱和二阶导数光谱进行归一化;并按照波数对齐光谱数据,分别对应四元数的i,j,k三个虚部,四元数实部为零,将经过归一化的原始光谱数据、经过归一化的一阶导数光谱和经过归一化的二阶导数光谱嵌入四元数空间表示成纯四元数光谱矩阵形式;
步骤4、在一维卷积神经网络模型基础上,以所述纯四元数光谱矩阵作为输入数据,建立四元数卷积神经网络模型;
步骤5、对所述四元数卷积神经网络模型进行训练,包括:
将原始光谱数据、一阶导数光谱、二阶导数光谱组成的四元数矩阵及对应样本的水分和蛋白质真值随机划分为60%训练集、20%验证集和20%测试集;
利用所述训练集训练所述四元数卷积神经网络模型,通过参数寻优,得到最优参数,确定模型参数;所述参数至少包括:四元数卷积核的个数、池化层的尺寸、学习率的大小、全连接层神经元个数;
利用所述验证集验证所述四元数卷积神经网络模型的性能;
利用所述测试集测试所述四元数卷积神经网络模型,使用预测均方根误差和预测相关系数作为模型的评价指标;
步骤6、根据训练好的四元数卷积神经网络模型进行样本的成分定量预测,得到样本的成分定量预测结果。
2.如权利要求1所述的基于四元数卷积神经网络的近红外光谱并行融合定量检测方法,其特征在于,所述样本为玉米,玉米原始光谱数据为240*700矩阵形式,包括240行,每行代表一条光谱,每一条光谱包括按列存储的700个吸光度值,水分、蛋白质的真值数据为80*2矩阵形式,包括80行,每行代表一个玉米样本的水分和蛋白质含量,包括2列,一列为水分含量,另一列为蛋白质含量。
3.如权利要求2所述的基于四元数卷积神经网络的近红外光谱并行融合定量检测方法,其特征在于,一阶导数光谱为240*699,二阶导数光谱为240*698;将所述一阶导数光谱和所述二阶导数光谱均扩展为240*700形式,所缺元素用0补全。
4.如权利要求1所述的基于四元数卷积神经网络的近红外光谱并行融合定量检测方法,其特征在于,将原始光谱数据、一阶导数光谱和二阶导数光谱进行归一化包括:采用归一化法将原始光谱数据、一阶导数光谱和二阶导数光谱进行归一化。
5.如权利要求1所述的基于四元数卷积神经网络的近红外光谱并行融合定量检测方法,其特征在于,所述建立四元数卷积神经网络模型包括:
将卷积核扩展为四元数卷积核;
输入数据为四元数矩阵,经过四元数卷积层和四元数池化层后,最终经过全连接层,即为四元数卷积神经网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010931678.7A CN112098358B (zh) | 2020-09-07 | 2020-09-07 | 基于四元数卷积神经网络的近红外光谱并行融合定量检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010931678.7A CN112098358B (zh) | 2020-09-07 | 2020-09-07 | 基于四元数卷积神经网络的近红外光谱并行融合定量检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112098358A CN112098358A (zh) | 2020-12-18 |
CN112098358B true CN112098358B (zh) | 2021-12-17 |
Family
ID=73751013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010931678.7A Active CN112098358B (zh) | 2020-09-07 | 2020-09-07 | 基于四元数卷积神经网络的近红外光谱并行融合定量检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112098358B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113287805A (zh) * | 2021-05-27 | 2021-08-24 | 郑州大学 | 一种跌倒防护方法及可穿戴式跌倒防护装置 |
CN113514416B (zh) * | 2021-06-01 | 2023-04-28 | 山东大学 | 一种基于近红外传感器融合的药物结晶过程质量非线性表征方法 |
CN113607684A (zh) * | 2021-08-18 | 2021-11-05 | 燕山大学 | 基于gaf图像和四元数卷积的光谱定性建模方法 |
CN116743506B (zh) * | 2023-08-14 | 2023-11-21 | 南京信息工程大学 | 一种基于四元数卷积神经网络的加密流量识别方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015054666A1 (en) * | 2013-10-10 | 2015-04-16 | Board Of Regents, The University Of Texas System | Systems and methods for quantitative analysis of histopathology images using multi-classifier ensemble schemes |
CN106384093A (zh) * | 2016-09-13 | 2017-02-08 | 东北电力大学 | 一种基于降噪自动编码器和粒子滤波的人体动作识别方法 |
CN107064054A (zh) * | 2017-02-28 | 2017-08-18 | 浙江大学 | 一种基于cc‑pls‑rbfnn优化模型的近红外光谱分析方法 |
CN107341452A (zh) * | 2017-06-20 | 2017-11-10 | 东北电力大学 | 基于四元数时空卷积神经网络的人体行为识别方法 |
CN107491784A (zh) * | 2017-08-09 | 2017-12-19 | 云南瑞升烟草技术(集团)有限公司 | 基于深度学习算法的烟叶近红外光谱定量建模方法及应用 |
CN108805866A (zh) * | 2018-05-23 | 2018-11-13 | 兰州理工大学 | 基于四元数小波变换深度视感知的图像注视点检测方法 |
CN110913279A (zh) * | 2018-09-18 | 2020-03-24 | 北京悉见科技有限公司 | 一种用于增强现实的处理方法及增强现实终端 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11263526B2 (en) * | 2017-05-31 | 2022-03-01 | Intel Corporation | Gradient-based training engine for quaternion-based machine-learning systems |
US11645835B2 (en) * | 2017-08-30 | 2023-05-09 | Board Of Regents, The University Of Texas System | Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications |
-
2020
- 2020-09-07 CN CN202010931678.7A patent/CN112098358B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015054666A1 (en) * | 2013-10-10 | 2015-04-16 | Board Of Regents, The University Of Texas System | Systems and methods for quantitative analysis of histopathology images using multi-classifier ensemble schemes |
CN106384093A (zh) * | 2016-09-13 | 2017-02-08 | 东北电力大学 | 一种基于降噪自动编码器和粒子滤波的人体动作识别方法 |
CN107064054A (zh) * | 2017-02-28 | 2017-08-18 | 浙江大学 | 一种基于cc‑pls‑rbfnn优化模型的近红外光谱分析方法 |
CN107341452A (zh) * | 2017-06-20 | 2017-11-10 | 东北电力大学 | 基于四元数时空卷积神经网络的人体行为识别方法 |
CN107491784A (zh) * | 2017-08-09 | 2017-12-19 | 云南瑞升烟草技术(集团)有限公司 | 基于深度学习算法的烟叶近红外光谱定量建模方法及应用 |
CN108805866A (zh) * | 2018-05-23 | 2018-11-13 | 兰州理工大学 | 基于四元数小波变换深度视感知的图像注视点检测方法 |
CN110913279A (zh) * | 2018-09-18 | 2020-03-24 | 北京悉见科技有限公司 | 一种用于增强现实的处理方法及增强现实终端 |
Non-Patent Citations (4)
Title |
---|
Quaternion-based Parallel Feature Extraction: Extending the Horizon of Quantitative Analysis using TLC-SERS Sensing;Zhao Y et al.;《Sensors and Actuators B》;20191231;第1-23页 * |
四元数神经网络模型: 彩色图象的识别;帅建伟;《计算机学报》;19950531;第18卷(第5期);第372-379页 * |
基于三维荧光光谱和四元数主成分分析的食醋品牌溯源研究;王思远 等;《光谱学与光谱分》;20180731;第38卷(第7期);第2163-2168页 * |
基于近红外光谱融合与深度学习的玉米成分定量建模方法;谈爱玲 等;《食品与发酵工业》;20200727;第46卷(第23期);第213-219页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112098358A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112098358B (zh) | 基于四元数卷积神经网络的近红外光谱并行融合定量检测方法 | |
CN109493287B (zh) | 一种基于深度学习的定量光谱数据分析处理方法 | |
Zhang et al. | Classification modeling method for near‐infrared spectroscopy of tobacco based on multimodal convolution neural networks | |
Huang et al. | Application of electronic nose with multivariate analysis and sensor selection for botanical origin identification and quality determination of honey | |
Aykas et al. | Authentication of commercial honeys based on Raman fingerprinting and pattern recognition analysis | |
Zhang et al. | Mid‐Infrared Spectroscopy for Coffee Variety Identification: Comparison of Pattern Recognition Methods | |
Zhao et al. | Deep learning assisted continuous wavelet transform-based spectrogram for the detection of chlorophyll content in potato leaves | |
CN109992861B (zh) | 一种近红外光谱建模方法 | |
He et al. | Fast discrimination of apple varieties using Vis/NIR spectroscopy | |
Xiang et al. | Deep learning and hyperspectral images based tomato soluble solids content and firmness estimation | |
Kalopesa et al. | Estimation of sugar content in wine grapes via in situ VNIR–SWIR point spectroscopy using explainable artificial intelligence techniques | |
Li et al. | Multi-manufacturer drug identification based on near infrared spectroscopy and deep transfer learning | |
Ning et al. | Rapid evaluation of soil fertility in tea plantation based on near-infrared spectroscopy | |
Shao et al. | Near-infrared spectroscopy for classification of oranges and prediction of the sugar content | |
CN111693487A (zh) | 基于遗传算法和极限学习机的水果糖度检测方法及系统 | |
Koirala et al. | A machine learning framework for estimating leaf biochemical parameters from its spectral reflectance and transmission measurements | |
Li et al. | Manufacturer identification and storage time determination of “Dong’e Ejiao” using near infrared spectroscopy and chemometrics | |
Chen et al. | Identification of coumarin‐based food additives using terahertz spectroscopy combined with manifold learning and improved support vector machine | |
CN113030001A (zh) | 一种水果糖度检测方法及系统 | |
Hu et al. | Detecting different pesticide residues on Hami melon surface using hyperspectral imaging combined with 1D-CNN and information fusion | |
Shao et al. | A new approach to discriminate varieties of tobacco using vis/near infrared spectra | |
Wu et al. | Rapid nondestructive detection of peanut varieties and peanut mildew based on hyperspectral imaging and stacked machine learning models | |
Noshad et al. | Volatilomic with chemometrics: a toward authentication approach for food authenticity control | |
CN113903407A (zh) | 成分识别方法、装置、电子设备和存储介质 | |
Chen et al. | Sugariness prediction of Syzygium samarangense using convolutional learning of hyperspectral images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |