CN115201144B - 一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质 - Google Patents
一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质 Download PDFInfo
- Publication number
- CN115201144B CN115201144B CN202211114596.9A CN202211114596A CN115201144B CN 115201144 B CN115201144 B CN 115201144B CN 202211114596 A CN202211114596 A CN 202211114596A CN 115201144 B CN115201144 B CN 115201144B
- Authority
- CN
- China
- Prior art keywords
- rapeseed
- spectrum data
- data
- target
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000004977 Brassica sinapistrum Nutrition 0.000 title claims abstract description 89
- 244000188595 Brassica sinapistrum Species 0.000 title claims abstract description 88
- 150000001413 amino acids Chemical class 0.000 title claims abstract description 85
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 43
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 43
- 238000001514 detection method Methods 0.000 title claims abstract description 38
- 238000001228 spectrum Methods 0.000 claims abstract description 103
- 238000012545 processing Methods 0.000 claims abstract description 56
- 230000003595 spectral effect Effects 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000009467 reduction Effects 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 9
- 230000004913 activation Effects 0.000 claims description 50
- 239000013598 vector Substances 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 44
- 238000012549 training Methods 0.000 claims description 36
- 240000002791 Brassica napus Species 0.000 claims description 21
- 235000011293 Brassica napus Nutrition 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 7
- 238000010183 spectrum analysis Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000001816 cooling Methods 0.000 claims description 2
- 238000001035 drying Methods 0.000 claims description 2
- 238000005259 measurement Methods 0.000 abstract description 2
- 239000000463 material Substances 0.000 abstract 1
- 238000009795 derivation Methods 0.000 description 4
- 238000002329 infrared spectrum Methods 0.000 description 4
- 238000002835 absorbance Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P60/00—Technologies relating to agriculture, livestock or agroalimentary industries
- Y02P60/80—Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
- Y02P60/87—Re-use of by-products of food processing for fodder production
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质,属于物质成分含量测定领域,其方法包括,使用近红外光谱仪扫描油菜籽待测样本以获取待测原始光谱数据,进行降噪处理得到待测目标输入光谱数据,输入至预先构建的注意力模块中进行处理,以获得待测目标输入光谱数据中多个波长权重,并将待测目标输入光谱数据分别与其中的每个波长权重相乘,以获得待测目标输入光谱数据中每个波长权重的加权光谱数据;将待测目标输入光谱数据中所有波长权重的加权光谱数据输入至预先建立的油菜籽氨基酸及蛋白质含量预测模型中进行处理,得到油菜籽待测样本的氨基酸及蛋白质含量检测结果。本发明节省了检测过程中的人力且提高了检测精度。
Description
技术领域
本发明涉及物质成分含量测定领域,具体涉及一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质。
背景技术
油菜籽是世界范围内重要的蛋白质作物,其中富含蛋白质,且氨基酸组成合理,可以作为动物的饲料,优质油菜籽更是一种理想蛋白源。油菜籽中的氨基酸对调解动物体内代谢平衡、促进生长发育有较好的作用。因此,提高油菜籽的氨基酸含量,尤其是赖氨酸、蛋氨酸苏氨酸等必须氨基酸含量对改善油菜籽品质具有较大的实用价值。近年来,随着人民生活水平的提高和国际市场农产品之间的竞争,对油菜籽品质提出了更高的要求,饲料业的迅速发展也需要更优质的菜籽作为新蛋白源。
而目前对于油菜籽中氨基酸及蛋白质含量的检测需要耗费大量的人力并且需要检测人员具备专业知识才能进行检测,同时检验结果因检测过程以及人为误差无法达到较高的精度,这对消费者和整个市场而言都是一个急需解决的问题。
发明内容
本发明所要解决的技术问题是提供一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质,以节省检测过程中的人力且提高检测精度。
本发明解决上述技术问题的技术方案如下:一种油菜籽的氨基酸及蛋白质定量检测方法,包括以下步骤,
S1,使用近红外光谱仪扫描油菜籽待测样本,以获取待测原始光谱数据;
S2,对所述待测原始光谱数据进行降噪处理,得到待测目标输入光谱数据;
S3,将所述待测目标输入光谱数据输入至预先构建的注意力模块中进行处理,以获得所述待测目标输入光谱数据中各个波长的权重,并将所述待测目标输入光谱数据分别与其中的每个波长的权重相乘,以获得所述待测目标输入光谱数据中每个波长权重的加权光谱数据;
S4,将所述待测目标输入光谱数据中所有波长权重的加权光谱数据输入至预先建立的油菜籽氨基酸及蛋白质含量预测模型中进行处理,得到所述油菜籽待测样本的氨基酸及蛋白质含量检测结果。
基于上述一种油菜籽的氨基酸及蛋白质定量检测方法,本发明还提供一种油菜籽的氨基酸及蛋白质定量检测系统。
一种油菜籽的氨基酸及蛋白质定量检测系统,包括以下模块,
原始光谱数据获取模块,其用于使用近红外光谱仪扫描油菜籽待测样本,以获取待测原始光谱数据;
数据降噪处理模块,其用于对所述待测原始光谱数据进行降噪处理,得到待测目标输入光谱数据;
注意力加权处理模块,其用于将所述待测目标输入光谱数据输入至预先构建的注意力模块中进行处理,以获得所述待测目标输入光谱数据中各个波长的权重,并将所述待测目标输入光谱数据分别与其中的每个波长的权重相乘,以获得所述待测目标输入光谱数据中每个波长权重的加权光谱数据;
含量预测模块,其用于将所述待测目标输入光谱数据中所有波长权重的加权光谱数据输入至预先建立的油菜籽氨基酸及蛋白质含量预测模型中进行处理,得到所述油菜籽待测样本的氨基酸及蛋白质含量检测结果。
基于上述一种油菜籽的氨基酸及蛋白质定量检测方法,本发明还提供一种计算机可读存储介质。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现上述所述的油菜籽的氨基酸及蛋白质定量检测方法。
本发明的有益效果是:在本发明一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质中,输入光谱数据经过注意力模块处理后获得不同波长权重的加权光谱数据,以便于之后的油菜籽氨基酸及蛋白质含量预测模型能够更好的利用对含量预测有正向作用的近红外光谱波长,而减少其他冗余波长对含量预测的负向影响,克服了近红外光谱含有较多与含量预测无关的冗余波长的缺陷,提升了含量预测的可解释性和精确度;另外,本发明实现端到端的含量检测,由注意力模块的自动学习来代替传统方法中需要检测人员具备专业知识才能进行检测的问题,检测效率高同时方法简单,适合应用推广。
附图说明
图1为本发明一种油菜籽的氨基酸及蛋白质定量检测方法的流程图;
图2为本发明一种油菜籽的氨基酸及蛋白质定量检测方法中注意力模块的模型图;
图3为本发明一种油菜籽的氨基酸及蛋白质定量检测系统的结构框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种油菜籽的氨基酸及蛋白质定量检测方法,包括以下步骤,
S1,使用近红外光谱仪扫描油菜籽待测样本,以获取待测原始光谱数据;
S2,对所述待测原始光谱数据进行降噪处理,得到待测目标输入光谱数据;
S3,将所述待测目标输入光谱数据输入至预先构建的注意力模块中进行处理,以获得所述待测目标输入光谱数据中各个波长的权重,并将所述待测目标输入光谱数据分别与其中的每个波长的权重相乘,以获得所述待测目标输入光谱数据中每个波长权重的加权光谱数据;
S4,将所述待测目标输入光谱数据中所有波长权重的加权光谱数据输入至预先建立的油菜籽氨基酸及蛋白质含量预测模型中进行处理,得到所述油菜籽待测样本的氨基酸及蛋白质含量检测结果。
下面对各步骤进行具体的解释:
所述S1具体为,
S11,将所述油菜籽待测样本在烘箱中烘干,冷却后放入所述近红外光谱仪中;
S12,利用所述近红外光谱仪对所述油菜籽待测样本进行多次(例如3次)扫描以获得所述油菜籽待测样本的多个光谱数据;其中,近红外光谱仪的光谱扫描范围在1000-2500nm;
S13,对所述油菜籽待测样本的多个光谱数据进行光谱平均处理,得到所述待测原始光谱数据。
在本发明中获取待测原始光谱数据的步骤与传统方法相比,不需要将样品溶解、稀释或溶解在特殊的溶剂中,不会对周围环境造成任何污染,且检测时间短,实验数据处理简单,检测成本低,可以很好的满足快速检测的要求。
所述S2具体为,
S21,对所述待测原始光谱数据进行SG卷积平滑处理,得到消除随机噪声的待测平滑光谱数据;
S22,对所述待测平滑光谱数据进行求一阶导数操作,得到所述待测目标输入光谱数据。
本实施例对待测原始光谱数据使用两个高效的降噪处理方法:SG卷积平滑和求一阶导数法来减少光谱噪声,消除与光谱信息无关的漂移,从而实现对待测原始光谱数据的清洗和降噪,提高检测精确度。
需要说明的是,SG卷积平滑可以用来消除随机噪声,基本思想是对指定宽度为2n+1个点的“窗口”内各点的数据进行重新拟合,使其相邻数据点之间更加平滑,是基于最小二乘原理提出的卷积平滑方法。
一阶导数法按照以下公式对待测平滑光谱数据进行计算: X(i)=[x(i+g)-x(i)]/g;其中,g为求导窗口宽度,X(i)为求导后的第i个窗口点的光谱吸光度,x(i)为求导前的第i个窗口点的光谱吸光度,x(i+g) 为求导前的第i+g个窗口点的光谱吸光度。
在所述S3中,
如图2所示,所述注意力模块包括三层全连接层,两层RELU激活函数层和一层Sigmoid激活函数层;其中,三层全连接层包括全连接层一、全连接层二和全连接层三,两层RELU激活函数层包括RELU激活函数层一和RELU激活函数层二;所述全连接层一、所述RELU激活函数层一、所述全连接层二、所述RELU激活函数层二、所述全连接层三和所述Sigmoid激活函数层依次连接,所述全连接层一为所述注意力模块的输入,所述Sigmoid激活函数层为所述注意力模块的输出。
需要说明的是,注意力模块中全连接层的每一个结点都与上一层的所有结点相
连,用来把前边提取到的特征综合起来,全连接层的数学原理公式为:,
其中分别是第个全连接层(即全连接层,本实施例中为一或二或三)的权重参
数和偏置参数,由网络自动学习更新;本实施例中,表示与全连接层连接的上一层的任
一结点的特征值,为与全连接层连接的上一层的任一结点的特征值经全连接层
特征提取后得到的特征值。RELU激活函数层的公式为:,即保留大于0的值,
亦即保留特征比较好的值,将特征小于0的值舍去;在本具体实施例中,表示输入至RELU
激活函数层一或RELU激活函数层二中的特征向量,表示输入至RELU激活函数层一或
RELU激活函数层二中的特征向量经过特征激活处理(即保留大于0的值)后得到的激活特征
值。Sigmoid激活函数层的公式为:,作用是将前一层输出的特征映射到
(0,1)之间,形成一个概率权重值,其反映了不同波长特征的重要程度,权重值越接近1,说
明重要程度越大,权重值越接近0,说明重要程度越小。
所述待测目标输入光谱数据的数据维度为1556维;在所述S3中,将所述待测目标输入光谱数据输入至预先构建的注意力模块中进行处理的具体步骤为,
S31,设置所述全连接层一的节点数为512,并将1556维的所述待测目标输入光谱数据输入至所述全连接层一进行特征降维提取处理,得到特征向量一;其中,所述特征向量一的数据维度为512维;
S32,将所述特征向量一输入至所述RELU激活函数层一进行特征激活处理,得到激活特征向量一;
S33,设置全连接层二的节点数为512,并将所述激活特征向量一输入至所述全连接层二进行特征线性映射提取处理,得到特征向量二;其中,所述特征向量二的数据维度为512维;
S34,将所述特征向量二输入至所述RELU激活函数层二进行特征激活处理,得到激活特征向量二;
S35,设置全连接层三的节点数为1556,并将所述激活特征向量二输入至所述全连接层三进行特征升维提取处理,得到特征向量三;其中,所述特征向量三的数据维度为1566维;
S36,将所述特征向量三输入至所述Sigmoid激活函数层,按照公式进行归一化处理,将所述特征向量三映射到0-1之间,得到所述待测目标
输入光谱数据中各个波长的权重;其中,表示所述特征向量三中第维数据的特征值,表示所述特征向量三中第维数据的归一化值,即所述特征向量三中第维数据对应
波长的权重。
将所述S2中获得的待测目标输入光谱数据输入所述注意力模块后,即得到待测目标输入光谱数据多个不同波长的权重,再将每个波长的权重与目标输入光谱数据相乘以获得不同波长权重的加权光谱数据。
优选的,所述待测目标输入光谱数据的原始维度即为待测目标输入光谱数据所包含的波长点数;且与输入所述注意力模块后,得到的所述待测目标输入光谱数据中各个波长的权重的维度一致,均为1556维。
在所述S4中,
所述油菜籽氨基酸及蛋白质含量预测模型建立的过程为,
S41,基于单个隐藏层的多层感知机建立油菜籽氨基酸及蛋白质含量预测初始模型;
S42,通过氨基酸及蛋白质不同含量的多个油菜籽训练样本制作基于加权光谱数据的训练集;
S43,将所述训练集输入至所述油菜籽氨基酸及蛋白质含量预测初始模型,并利用所述训练集对所述油菜籽氨基酸及蛋白质含量预测初始模型进行训练,得到油菜籽氨基酸及蛋白质含量预测待定模型;
S44,判断所述油菜籽氨基酸及蛋白质含量预测待定模型的输出误差是否在预设误差范围内;若是,则将所述油菜籽氨基酸及蛋白质含量预测待定模型作为所述油菜籽氨基酸及蛋白质含量预测模型;若否,则对所述油菜籽氨基酸及蛋白质含量预测待定模型的多层感知机中的隐藏层节点参数进行调优,且将调优后的所述油菜籽氨基酸及蛋白质含量预测待定模型作为所述油菜籽氨基酸及蛋白质含量预测初始模型并返回执行所述S43,直至所述油菜籽氨基酸及蛋白质含量预测待定模型的输出误差在预设误差范围内。
优选的,在所述S41中,所述基于单个隐藏层的多层感知机由两个全连接层组成;其中,每个全连接层的输入节点和输出节点的个数均与所述待测目标输入光谱数据的波长数相等,单个隐藏层的节点数为500。
需要说明的是,多层感知机(MLP,Multilayer Perceptron)除了输入输出层,中间可以有多个隐层,其中最简单的MLP只含一个隐层,即三层的网络结构。多层感知机层与层之间是全连接的,因此使用全连接层实现,获得输入到输出的线性表达。
优选的,所述S42具体为,
S421,获取氨基酸及蛋白质不同含量的多个油菜籽训练样本,使用近红外光谱仪分别扫描每个油菜籽训练样本,以获取每个油菜籽训练样本的训练原始光谱数据;
S422,分别对每个训练原始光谱数据进行降噪处理,得到每个油菜籽训练样本的训练目标输入光谱数据;
S423,分别将每个训练目标输入光谱数据输入至所述注意力模块中进行处理,以获得每个训练目标输入光谱数据中多个波长权重,并分别将每个训练目标输入光谱数据分别对应与其中的每个波长权重相乘,以获得每个训练目标输入光谱数据中每个波长权重的加权光谱数据;所有训练目标输入光谱数据中所有波长权重的加权光谱数据组成的集合即为基于加权光谱数据的训练集。
优选的,在所述S44中,对所述油菜籽氨基酸及蛋白质含量预测待定模型的多层感知机中的隐藏层节点参数进行调优,具体采用人工手动进行,能保证得到含量预测模型对应的最优参数,进一步确保训练完成的含量预测模型对油菜籽氨基酸及蛋白质含量检测的精确度。
将所述S3中得到的待测目标输入光谱数据中所有波长权重的加权光谱数据输入至上述油菜籽氨基酸及蛋白质含量预测模型中进行处理,即可得到所述油菜籽待测样本的氨基酸及蛋白质含量检测结果。
基于上述一种油菜籽的氨基酸及蛋白质定量检测方法,本发明还提供一种油菜籽的氨基酸及蛋白质定量检测系统。
如图3所示,一种油菜籽的氨基酸及蛋白质定量检测系统,包括以下模块,
原始光谱数据获取模块,其用于使用近红外光谱仪扫描油菜籽待测样本,以获取待测原始光谱数据;
数据降噪处理模块,其用于对所述待测原始光谱数据进行降噪处理,得到待测目标输入光谱数据;
注意力加权处理模块,其用于将所述待测目标输入光谱数据输入至预先构建的注意力模块中进行处理,以获得所述待测目标输入光谱数据中各个波长的权重,并将所述待测目标输入光谱数据分别与其中的每个波长的权重相乘,以获得所述待测目标输入光谱数据中每个波长权重的加权光谱数据;
含量预测模块,其用于将所述待测目标输入光谱数据中所有波长权重的加权光谱数据输入至预先建立的油菜籽氨基酸及蛋白质含量预测模型中进行处理,得到所述油菜籽待测样本的氨基酸及蛋白质含量检测结果。
本发明一种油菜籽的氨基酸及蛋白质定量检测系统中各模块的具体功能参见本发明一种油菜籽的氨基酸及蛋白质定量检测方法中各具体步骤,在此不在赘述。
基于上述一种油菜籽的氨基酸及蛋白质定量检测方法,本发明还提供一种计算机可读存储介质。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现上述所述的油菜籽的氨基酸及蛋白质定量检测方法。
在本发明一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质中:输入光谱数据经过注意力模块处理后获得不同波长权重的加权光谱数据,以便于之后的油菜籽氨基酸及蛋白质含量预测模型能够更好的利用对含量预测有正向作用的近红外光谱波长,而减少其他冗余波长对含量预测的负向影响,克服了近红外光谱含有较多与含量预测无关的冗余波长的缺陷,提升了含量预测的可解释性和精确度;另外,本发明实现端到端的含量检测,由注意力模块的自动学习来代替传统方法中需要检测人员具备专业知识才能进行检测的问题,检测效率高同时方法简单,适合应用推广。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、 “包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种油菜籽的氨基酸及蛋白质定量检测方法,其特征在于:包括以下步骤,
S1,使用近红外光谱仪扫描油菜籽待测样本,以获取待测原始光谱数据;
S2,对所述待测原始光谱数据进行降噪处理,得到待测目标输入光谱数据;
S3,将所述待测目标输入光谱数据输入至预先构建的注意力模块中进行处理,以获得所述待测目标输入光谱数据中各个波长的权重,并将所述待测目标输入光谱数据分别与其中的每个波长的权重相乘,以获得所述待测目标输入光谱数据中每个波长权重的加权光谱数据;
S4,将所述待测目标输入光谱数据中所有波长权重的加权光谱数据输入至预先建立的油菜籽氨基酸及蛋白质含量预测模型中进行处理,得到所述油菜籽待测样本的氨基酸及蛋白质含量检测结果;
在所述S3中,所述注意力模块包括三层全连接层,两层RELU激活函数层和一层Sigmoid激活函数层;其中,三层全连接层包括全连接层一、全连接层二和全连接层三,两层RELU激活函数层包括RELU激活函数层一和RELU激活函数层二;所述全连接层一、所述RELU激活函数层一、所述全连接层二、所述RELU激活函数层二、所述全连接层三和所述Sigmoid激活函数层依次连接,所述全连接层一为所述注意力模块的输入,所述Sigmoid激活函数层为所述注意力模块的输出;
所述待测目标输入光谱数据的数据维度为1556维;
在所述S3中,将所述待测目标输入光谱数据输入至预先构建的注意力模块中进行处理的具体步骤为,
S31,设置所述全连接层一的节点数为512,并将1556维的所述待测目标输入光谱数据输入至所述全连接层一进行特征降维提取处理,得到特征向量一;其中,所述特征向量一的数据维度为512维;
S32,将所述特征向量一输入至所述RELU激活函数层一进行特征激活处理,得到激活特征向量一;
S33,设置全连接层二的节点数为512,并将所述激活特征向量一输入至所述全连接层二进行特征线性映射提取处理,得到特征向量二;其中,所述特征向量二的数据维度为512维;
S34,将所述特征向量二输入至所述RELU激活函数层二进行特征激活处理,得到激活特征向量二;
S35,设置全连接层三的节点数为1556,并将所述激活特征向量二输入至所述全连接层三进行特征升维提取处理,得到特征向量三;其中,所述特征向量三的数据维度为1566维;
2.根据权利要求1所述的油菜籽的氨基酸及蛋白质定量检测方法,其特征在于:所述S1具体为,
S11,将所述油菜籽待测样本在烘箱中烘干,冷却后放入所述近红外光谱仪中;
S12,利用所述近红外光谱仪对所述油菜籽待测样本进行多次扫描以获得所述油菜籽待测样本的多个光谱数据;
S13,对所述油菜籽待测样本的多个光谱数据进行光谱平均处理,得到所述待测原始光谱数据。
3.根据权利要求1所述的油菜籽的氨基酸及蛋白质定量检测方法,其特征在于:所述S2具体为,
S21,对所述待测原始光谱数据进行SG卷积平滑处理,得到消除随机噪声的待测平滑光谱数据;
S22,对所述待测平滑光谱数据进行求一阶导数操作,得到所述待测目标输入光谱数据。
4.根据权利要求1所述的油菜籽的氨基酸及蛋白质定量检测方法,其特征在于:在所述S4中,所述油菜籽氨基酸及蛋白质含量预测模型建立的过程为,
S41,基于单个隐藏层的多层感知机建立油菜籽氨基酸及蛋白质含量预测初始模型;
S42,通过氨基酸及蛋白质不同含量的多个油菜籽训练样本制作基于加权光谱数据的训练集;
S43,将所述训练集输入至所述油菜籽氨基酸及蛋白质含量预测初始模型,并利用所述训练集对所述油菜籽氨基酸及蛋白质含量预测初始模型进行训练,得到油菜籽氨基酸及蛋白质含量预测待定模型;
S44,判断所述油菜籽氨基酸及蛋白质含量预测待定模型的输出误差是否在预设误差范围内;若是,则将所述油菜籽氨基酸及蛋白质含量预测待定模型作为所述油菜籽氨基酸及蛋白质含量预测模型;若否,则对所述油菜籽氨基酸及蛋白质含量预测待定模型的多层感知机中的隐藏层节点参数进行调优,且将调优后的所述油菜籽氨基酸及蛋白质含量预测待定模型作为所述油菜籽氨基酸及蛋白质含量预测初始模型并返回执行所述S43,直至所述油菜籽氨基酸及蛋白质含量预测待定模型的输出误差在预设误差范围内。
5.根据权利要求4所述的油菜籽的氨基酸及蛋白质定量检测方法,其特征在于:在所述S41中,所述基于单个隐藏层的多层感知机由两个全连接层组成;其中,每个全连接层的输入节点和输出节点的个数均与所述待测目标输入光谱数据的波长数相等,单个隐藏层的节点数为500。
6.根据权利要求4所述的油菜籽的氨基酸及蛋白质定量检测方法,其特征在于:所述S42具体为,
S421,获取氨基酸及蛋白质不同含量的多个油菜籽训练样本,使用近红外光谱仪分别扫描每个油菜籽训练样本,以获取每个油菜籽训练样本的训练原始光谱数据;
S422,分别对每个训练原始光谱数据进行降噪处理,得到每个油菜籽训练样本的训练目标输入光谱数据;
S423,分别将每个训练目标输入光谱数据输入至所述注意力模块中进行处理,以获得每个训练目标输入光谱数据中多个波长权重,并分别将每个训练目标输入光谱数据分别对应与其中的每个波长权重相乘,以获得每个训练目标输入光谱数据中每个波长权重的加权光谱数据;所有训练目标输入光谱数据中所有波长权重的加权光谱数据组成的集合即为基于加权光谱数据的训练集。
7.一种油菜籽的氨基酸及蛋白质定量检测系统,其特征在于:包括以下模块,
原始光谱数据获取模块,其用于使用近红外光谱仪扫描油菜籽待测样本,以获取待测原始光谱数据;
数据降噪处理模块,其用于对所述待测原始光谱数据进行降噪处理,得到待测目标输入光谱数据;
注意力加权处理模块,其用于将所述待测目标输入光谱数据输入至预先构建的注意力模块中进行处理,以获得所述待测目标输入光谱数据中各个波长的权重,并将所述待测目标输入光谱数据分别与其中的每个波长的权重相乘,以获得所述待测目标输入光谱数据中每个波长权重的加权光谱数据;
含量预测模块,其用于将所述待测目标输入光谱数据中所有波长权重的加权光谱数据输入至预先建立的油菜籽氨基酸及蛋白质含量预测模型中进行处理,得到所述油菜籽待测样本的氨基酸及蛋白质含量检测结果;
所述注意力模块包括三层全连接层,两层RELU激活函数层和一层Sigmoid激活函数层;其中,三层全连接层包括全连接层一、全连接层二和全连接层三,两层RELU激活函数层包括RELU激活函数层一和RELU激活函数层二;所述全连接层一、所述RELU激活函数层一、所述全连接层二、所述RELU激活函数层二、所述全连接层三和所述Sigmoid激活函数层依次连接,所述全连接层一为所述注意力模块的输入,所述Sigmoid激活函数层为所述注意力模块的输出;
所述待测目标输入光谱数据的数据维度为1556维;
注意力加权处理模块具体用于,
设置所述全连接层一的节点数为512,并将1556维的所述待测目标输入光谱数据输入至所述全连接层一进行特征降维提取处理,得到特征向量一;其中,所述特征向量一的数据维度为512维;
将所述特征向量一输入至所述RELU激活函数层一进行特征激活处理,得到激活特征向量一;
设置全连接层二的节点数为512,并将所述激活特征向量一输入至所述全连接层二进行特征线性映射提取处理,得到特征向量二;其中,所述特征向量二的数据维度为512维;
将所述特征向量二输入至所述RELU激活函数层二进行特征激活处理,得到激活特征向量二;
设置全连接层三的节点数为1556,并将所述激活特征向量二输入至所述全连接层三进行特征升维提取处理,得到特征向量三;其中,所述特征向量三的数据维度为1566维;
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:当所述计算机程序被处理器执行时,实现如权利要求1至6任一项所述的油菜籽的氨基酸及蛋白质定量检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211114596.9A CN115201144B (zh) | 2022-09-14 | 2022-09-14 | 一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211114596.9A CN115201144B (zh) | 2022-09-14 | 2022-09-14 | 一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115201144A CN115201144A (zh) | 2022-10-18 |
CN115201144B true CN115201144B (zh) | 2022-12-09 |
Family
ID=83573768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211114596.9A Active CN115201144B (zh) | 2022-09-14 | 2022-09-14 | 一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115201144B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101936893A (zh) * | 2010-07-30 | 2011-01-05 | 华中农业大学 | 一种从油菜籽中检测蛋白质和氨基酸的方法 |
JP2013072726A (ja) * | 2011-09-27 | 2013-04-22 | Chikuno Shokuhin Kogyo Kk | 近赤外分光法を用いた玄米中のトリアシルグリセロールの定量方法 |
CN105445218A (zh) * | 2015-11-25 | 2016-03-30 | 中国科学院南京土壤研究所 | 中红外光谱油菜籽蛋白质含量检测自适应模型的建立方法 |
CN108645815A (zh) * | 2018-08-13 | 2018-10-12 | 中国农业科学院油料作物研究所 | 一种植物油料中脂肪酸含量的近红外检测方法 |
JP2018205226A (ja) * | 2017-06-08 | 2018-12-27 | 昭和産業株式会社 | 近赤外分光分析を用いたフライ用油脂組成物の分析 |
CN111504942A (zh) * | 2020-04-26 | 2020-08-07 | 长春理工大学 | 一种提高牛奶中蛋白质预测精度的近红外光谱分析方法 |
CN112232343A (zh) * | 2020-09-03 | 2021-01-15 | 国家粮食和物资储备局科学研究院 | 一种粮食霉变粒识别神经网络和识别方法 |
CN112924412A (zh) * | 2021-01-22 | 2021-06-08 | 中国科学院合肥物质科学研究院 | 基于近红外光谱的单籽粒水稻品种真实性判别方法及装置 |
CN113029993A (zh) * | 2021-03-24 | 2021-06-25 | 中南大学 | 一种基于注意力机制的紫外光谱快速总氮在线检测方法 |
CN113820291A (zh) * | 2021-08-27 | 2021-12-21 | 中山小池科技有限公司 | 基于多阶段卷积神经网络的纺织品无损环保定性方法 |
CN114778485A (zh) * | 2022-06-16 | 2022-07-22 | 中化现代农业有限公司 | 基于近红外光谱和注意力机制网络的品种鉴定方法及系统 |
-
2022
- 2022-09-14 CN CN202211114596.9A patent/CN115201144B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101936893A (zh) * | 2010-07-30 | 2011-01-05 | 华中农业大学 | 一种从油菜籽中检测蛋白质和氨基酸的方法 |
JP2013072726A (ja) * | 2011-09-27 | 2013-04-22 | Chikuno Shokuhin Kogyo Kk | 近赤外分光法を用いた玄米中のトリアシルグリセロールの定量方法 |
CN105445218A (zh) * | 2015-11-25 | 2016-03-30 | 中国科学院南京土壤研究所 | 中红外光谱油菜籽蛋白质含量检测自适应模型的建立方法 |
JP2018205226A (ja) * | 2017-06-08 | 2018-12-27 | 昭和産業株式会社 | 近赤外分光分析を用いたフライ用油脂組成物の分析 |
CN108645815A (zh) * | 2018-08-13 | 2018-10-12 | 中国农业科学院油料作物研究所 | 一种植物油料中脂肪酸含量的近红外检测方法 |
CN111504942A (zh) * | 2020-04-26 | 2020-08-07 | 长春理工大学 | 一种提高牛奶中蛋白质预测精度的近红外光谱分析方法 |
CN112232343A (zh) * | 2020-09-03 | 2021-01-15 | 国家粮食和物资储备局科学研究院 | 一种粮食霉变粒识别神经网络和识别方法 |
CN112924412A (zh) * | 2021-01-22 | 2021-06-08 | 中国科学院合肥物质科学研究院 | 基于近红外光谱的单籽粒水稻品种真实性判别方法及装置 |
CN113029993A (zh) * | 2021-03-24 | 2021-06-25 | 中南大学 | 一种基于注意力机制的紫外光谱快速总氮在线检测方法 |
CN113820291A (zh) * | 2021-08-27 | 2021-12-21 | 中山小池科技有限公司 | 基于多阶段卷积神经网络的纺织品无损环保定性方法 |
CN114778485A (zh) * | 2022-06-16 | 2022-07-22 | 中化现代农业有限公司 | 基于近红外光谱和注意力机制网络的品种鉴定方法及系统 |
Non-Patent Citations (2)
Title |
---|
Variable selection in near-infrared spectra: Application to quantitative non-destructive determination of protein content in wheat;Kewei Huan等;《Infrared Physics&Technology》;20211020;第119卷;第103937-1-7页 * |
基于卷积神经网络的植物病虫害识别研究综述;骆润玫等;《自动化与信息工程》;20211231;第42卷(第5期);第1-10页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115201144A (zh) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110799994B (zh) | 神经网络的自适应位宽缩减 | |
CN106404692A (zh) | 利用高光谱成像技术检测即食海参新鲜度等级的方法 | |
CN111126575A (zh) | 基于机器学习的气体传感器阵列混合气体检测方法及装置 | |
JP7090184B2 (ja) | 人工知能ディープラーニング学習を利用した生体測定物濃度測定方法 | |
CN113288131B (zh) | 基于图卷积网络的无创血糖检测方法、处理器及装置 | |
Yang et al. | Synergetic application of E-tongue and E-eye based on deep learning to discrimination of Pu-erh tea storage time | |
CN115809427B (zh) | 基于混合策略优化bp神经网络的混合气体识别方法 | |
Jie et al. | Research on Citrus grandis granulation determination based on hyperspectral imaging through deep learning | |
CN115034361A (zh) | 一种基于ics-bp神经网络的传感器物理量回归方法 | |
Chen et al. | Probing 1D convolutional neural network adapted to near-infrared spectroscopy for efficient classification of mixed fish | |
CN113256733B (zh) | 基于置信度投票卷积神经网络的相机光谱灵敏度重建方法 | |
CN115201144B (zh) | 一种油菜籽的氨基酸及蛋白质定量检测方法、系统及介质 | |
CN110403611B (zh) | 血液中糖化血红蛋白成分值预测方法、装置、计算机设备和存储介质 | |
Głowacz et al. | Comparison of various data analysis techniques applied for the classification of oligopeptides and amino acids by voltammetric electronic tongue | |
CN116026795A (zh) | 一种基于反射透射光谱的水稻籽粒品质性状无损预测方法 | |
Lin et al. | Visible detection of chilled beef freshness using a paper-based colourimetric sensor array combining with deep learning algorithms | |
CN114334017A (zh) | 一种基于电子鼻和bp神经网络快速预测发酵水产品总生物胺的方法 | |
Heidari et al. | Development of an android app for estimating the water quality parameters in fish pond | |
CN115398552A (zh) | 遗传算法用于基于拉曼光谱识别样品特征的用途 | |
Natarajan et al. | A Review on Fish Species Classification and Determination Using Machine Learning Algorithms | |
CN114813631B (zh) | 小麦品种纯度检测方法、装置和电子设备 | |
CN115950833A (zh) | 一种加工番茄品质检测方法、系统、设备及介质 | |
CN117274236B (zh) | 基于高光谱图像的尿液成分异常检测方法及系统 | |
Liao et al. | Meat freshness recognition based on improved ResNet34 model | |
Liang et al. | Rapid determination of starch and alcohol contents in fermented grains by hyperspectral imaging combined with data fusion techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |