CN115541531A - 基于二维相关光谱预测饲料中蛋白质含量的方法 - Google Patents

基于二维相关光谱预测饲料中蛋白质含量的方法 Download PDF

Info

Publication number
CN115541531A
CN115541531A CN202211271136.7A CN202211271136A CN115541531A CN 115541531 A CN115541531 A CN 115541531A CN 202211271136 A CN202211271136 A CN 202211271136A CN 115541531 A CN115541531 A CN 115541531A
Authority
CN
China
Prior art keywords
spectrum
near infrared
feed
infrared spectrum
protein content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211271136.7A
Other languages
English (en)
Inventor
许静
梁菁
徐晓轩
王斌
张文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nankai University
Original Assignee
Nankai University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nankai University filed Critical Nankai University
Priority to CN202211271136.7A priority Critical patent/CN115541531A/zh
Publication of CN115541531A publication Critical patent/CN115541531A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明涉及蛋白质含量预测技术领域。基于二维相关光谱预测饲料中蛋白质含量的方法包括如下步骤:获取蛋白质含量为14%‑20%,脂肪含量为2.5%‑5%的多个饲料样品;将脂肪含量作为外部扰动,对饲料样品的近红外光谱进行二维计算;利用光谱仪扫描饲料样品的4000‑12000波数的4001个光谱点,得到近红外光谱的第一近红外光谱;对第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;建立二维卷积神经网络训练模型,将第二近红外光谱输入二维卷积神经网络训练模型;基于二维卷积神经网络训练模型,预测饲料中蛋白质含量。本发明基于二维相关光谱预测饲料中蛋白质含量的方法,预测饲料中蛋白质含量,结果准确性得以提高。

Description

基于二维相关光谱预测饲料中蛋白质含量的方法
技术领域
本发明涉及蛋白质含量技术领域,尤其是涉及基于二维相关光谱预测饲料中蛋白质含量的方法。
背景技术
目前,饲料是我国畜牧业发展的基础,随着饲料产业和畜牧养殖业的蓬勃发展,如何快速鉴定饲料的品质变得尤为重要,由于饲料检测制度的不完善和优质的饲料在市场上价格高,导致一部分饲料里掺杂一些其他物质,以次充好。其中,蛋白质饲料原料又是饲料产业的基石,蛋白质作为生命活动中最重要的物质基础之一,在养殖业中起到巨大的作用,并且,是分析饲料重要的品质之一。
基于上述原因,如果有一种能够预测饲料中蛋白质含量的方法,将大大减少饲料以次充好的问题发生。
发明内容
本发明提供一种基于二维相关光谱预测饲料中蛋白质含量的方法,该基于二维相关光谱预测饲料中蛋白质含量的方法能够利用二维相关光谱预测饲料中蛋白质含量,旨在解决,饲料中蛋白质含量的预测方法不完善,准确率差的问题。
本发明的第一目的在于一种基于二维相关光谱预测饲料中蛋白质含量的方法,包括如下步骤:
获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
将脂肪含量作为外部扰动,对饲料样品的近红外光谱进行二维计算,其中,脂肪含量的动态光谱
Figure BDA0003893976440000021
为:
Figure BDA0003893976440000022
其中,t在Tmin和Tmax间变化时光谱强度为y(v,t),v为速度,
Figure BDA0003893976440000023
为参考光谱;
利用光谱仪扫描饲料样品的4000-12000波数的4001个光谱点,得到近红外光谱的第一近红外光谱;
对第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立二维卷积神经网络训练模型,将第二近红外光谱输入二维卷积神经网络训练模型;
基于二维卷积神经网络训练模型,预测饲料中蛋白质含量。
可实施的一种方式中,对第一近红外光谱数据预处理,去除噪音,得到第二近红外光谱的步骤中,还包括:
利用一阶导数法、二阶导数法、中心化、标准化、Savitzky-Golay平滑法、多远散射处理、标准正态变换法中的一种或多种对第一近红外光谱数据进行预处理,去除噪声。
可实施的一种方式中,建立二维卷积神经网络训练模型,将第二近红外光谱输入二维卷积神经网络训练模型的步骤中,还包括:
建立具有输入层、卷积层、池化层、全连接层和输出层的二维卷积神经网络训练模型;
向输入层输入饲料样品的第二近红外光谱,及饲料样品的中蛋白质含量和脂肪含量的标签,建立二维卷积神经网络训练模型;
经过卷积层预设的二维卷积核对输入输入层的数据进行卷积计算得到饲料样品的特征图,其中,卷积层包括多层;
根据卷积层得到饲料样品的特征图,池化层提取得到特征图的局部特征数据;
根据池化层提取得到特征图的局部特征数据,全连接层将局部特征映射到样本空间进行分类。
可实施的一种方式中,基于二维卷积神经网络训练模型,预测饲料中蛋白质含量的步骤中,还包括:
根据每条光谱含有的4001个光谱点,选取竞争性自适应重加权算法对光谱数据压缩;
根据竞争性自适应重加权算法与偏最小二乘回归相结合,通过指数衰减函数和竞争性自适应重加权算法去除压缩的光谱数据中权重小的变量;
根据去除压缩的光谱数据中权重小的变量后的光谱数据,进行交互验证选出RMSECV值最低的子集,确定光谱数据的最优特征波长组合。
可实施的一种方式中,基于二维卷积神经网络训练模型,预测饲料中蛋白质含量的步骤中,还包括:
获取光谱仪扫描过程中产生的拉曼信号和荧光信号;
基于拉曼信号和荧光信号,建立拉曼光谱;
建立理想光谱,其中,理想光谱表征光谱的平均值;
基于理想光谱校正多个饲料样品的第二近红外光谱相对基线偏移和偏移,得到理想标准光谱;
根据多元散射对第二近红外光谱和拉曼光谱进行校正;
对校正后的第二近红外光谱和拉曼光谱归一化。
可实施的一种方式中,对校正后的第二近红外光谱和拉曼光谱归一化的步骤后,还包括:
根据第二近红外光谱和拉曼光谱归一化后的数据输入向量机模型;
将输入向量机模型和二维卷积神经网络训练模型结合;
根据结合的输入向量机模型和二维卷积神经网络训练模,预测饲料中蛋白质含量。
可实施的一种方式中,根据第二近红外光谱和拉曼光谱归一化后的数据输入向量机模型的步骤中,还包括:
在支持向量机模型中,采用网格搜索算法来寻找第二近红外光谱和拉曼光谱归一化后的数据的最佳参数;
基于最佳参数建立第二近红外光谱和拉曼光谱归一化的支持向量机模型。
本发明的第二目的在于提供一种电子设备,包括总线、收发器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,收发器、存储器和处理器通过总线相连,计算机程序被处理器执行时实现如前述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
本发明的第三目的在于提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如前述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
本发明的第四目的在于提供一种预测装置,其特征在于,包括:
获取单元,用于获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
计算单元,用于将所述脂肪含量作为外部扰动,对所述饲料样品的近红外光谱进行二维计算,其中,所述脂肪含量的动态光谱
Figure BDA0003893976440000043
为:
Figure BDA0003893976440000041
其中,t在Tmin和Tmax间变化时光谱强度为y(v,t),v为速度,
Figure BDA0003893976440000042
为参考光谱;
扫描模块,利用光谱仪扫描所述饲料样品的4000-12000波数的4001个光谱点,得到所述近红外光谱的第一近红外光谱;
去除噪声模块,用于对所述第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立模型模块,用于建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型;
预测模块,用于基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量。
本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法,获取具有蛋白质和脂肪的多个饲料样品,将脂肪作为外部扰动,对饲料样品的近红外光谱进行二维计算,在利用光谱仪扫描饲料样品的4000-12000波数的4001个光谱点,得到近红外光谱的第一近红外光谱,对第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱,接下来建立二维卷积神经网络训练模型,再将第二近红外光谱输入二维卷积神经网络训练模型;基于二维卷积神经网络训练模型,预测饲料中蛋白质含量。本发明针对现在农场饲料中营养物质含量检测困难的问题,通过近红外光谱仪测量不同蛋白质含量饲料样品的近红外光谱,基于二维卷积神经网络训练模型中的二维相关光谱预测饲料中蛋白质含量,结果准确性得以提高。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法的流程图;
图2为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中向二维卷积神经网络训练模型输入数据的流程图;
图3为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中二维卷积神经网络训练模型,预测饲料中蛋白质含量的流程图;
图4为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中拉曼光谱的流程图;
图5为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中向量机模型的流程图;
图6为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中第一近红外光谱的示意图;
图7为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中原始光谱的示意图;
图8为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中特征波长的示意图;
图9为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中拉曼光谱的示意图;
图10为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中多远散射校正的第一近红外光谱示意图;
图11为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中多远散射校正的拉曼光谱的示意图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也包括复数形式,此外,还应当理解的是,当在本说明中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1至图11,本发明第一方面提供一种基于二维相关光谱预测饲料中蛋白质含量的方法,包括如下步骤:
如图1所示,S101:获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品。
其中,可以将饲料进行划分,划分成验证集和训练集,其中20%为验证集,80%为训练集,本实施例中选用训练集用于训练,验证集用于验证预测效果。
训练集中的饲料为饲料样品,饲料样品中蛋白质含量排列为14%到20%比例随机,脂肪含量为2.5%到5%比例随机。
S102:将脂肪含量作为外部扰动,对饲料样品的近红外光谱进行二维计算,其中,脂肪含量的动态光谱
Figure BDA0003893976440000071
为:
Figure BDA0003893976440000072
其中,t在Tmin和Tmax间变化时光谱强度为y(v,t),v为速度,
Figure BDA0003893976440000073
为参考光谱,otherwise为否则。
二维相关光谱(Two-Dimensional Correlation Spectroscopy,2DCOS),是一种在多种谱中得到广泛应用的谱学研究方法,将光谱信号扩展到第二维上,使原来在一维光谱中的弱峰和重叠峰以及被噪声或背底所掩盖的峰更加清晰,显著增强了光谱的分辨率。外部扰动诱发的光谱变化称作动态光谱,对获得的一系列动态光谱进行二维相关计算,即可得到二维相关光谱。
二维相关光谱强度X(v1,v2)是指外扰变量t在Tmin和Tmax间变化时,对不同光学变量v1和v2下的光谱强度变化进行定量比较。为方便计算,将X(v1,v2)表示为复数形式:
X(v1,v2)=φ(v1,v2)+iψ(v1,v2);
组成二维相关谱强度的虚部和实部即为二维相关同步谱和异步谱。同步光谱和异步光谱强度可表示为:
Figure BDA0003893976440000081
Figure BDA0003893976440000082
其中,同步光谱为φ和异步光谱为ψ,N为Hilbert-Noda(希尔伯特)矩阵,
Figure BDA0003893976440000083
对饲料样品的近红外光谱进行二维计算,其中,将脂肪含量作为外部扰动。
S103:利用光谱仪扫描饲料样品的4000-12000波数的4001个光谱点,得到近红外光谱的第一近红外光谱。
如图6所示,其中,第一近红外光谱为通过光谱仪对饲料样品进行扫描形成的近红外光谱。
光谱仪为傅里叶变换近红外光谱仪。
S104:对第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
其中,第一近红外光谱数据的去除噪声预处理可包括利用一阶导数法、二阶导数法、中心化、标准化、Savitzky-Golay平滑法、多远散射处理、标准正态变换法中的一种或多种对第一近红外光谱数据进行预处理,去除噪声,得到第二近红外光谱。
具体地,导数算法中常见的是一阶和二阶导数法,导数光谱可有效地消除基线和其它背景的干扰以提高光谱分辨率和灵敏度,但它同时会引入噪声,降低信噪比。本实施例中通过差分法来计算光谱的一阶导数和二阶导数。
中心化是光谱数据增强的一种,它将光谱数据的平均值作为基准,将每个光谱数据比较求差,最终得到平均值为0的光谱数据。这样的变换不会改变原始数据之间的相对位置,也不会造成光谱变量间关系的改变,却能给后续的数据处理带来便利。
标准化,是光谱数据增强的一种,它在中心化的基础上除以数据的标准差,这样的光谱评价值为0,标准差为1。
标准正态变换法,是将任一一条原始光谱减去平均光谱后除以原始光谱数据的标准差,与标准化不同,标准正态变换对一条光谱进行处理。
Savitzky-Golay平滑法(Savitzky-Golay Smoothing Method,SG),信号平滑是消除噪声的一种方法,基本假设是光谱含有的噪声为零均白噪声,若多次测量取平均值可降低噪声提高信噪比。Savitzky-Golay卷积平滑法,是一种平滑方法,通过多项式来对移动窗口内的数据进行多项式最小二乘拟合,具体为一种加权平均法,强调中心点的中心作用。
需要说明地是,本实施例中,可以根据需要选取上述方法中的一种或多种来消除噪声,以便提高最终的第二近红外光谱准确率。
S105:建立二维卷积神经网络训练模型,将第二近红外光谱输入二维卷积神经网络训练模型。
其中,卷积神经网络是一种非线性模型,建立的二维卷积神经网络训练模型包括输入层、卷积层、池化层、全连接层和输出层。
具体的地,向二维卷积神经网络训练模型输入数据的步骤包括:S1051-S1055。
如图2所示,S1051:建立具有输入层、卷积层、池化层、全连接层和输出层的二维卷积神经网络训练模型。
S1052:向输入层输入饲料样品的第二近红外光谱,及饲料样品的中蛋白质含量和脂肪含量的标签,建立二维卷积神经网络训练模型。
S1053:经过卷积层预设的二维卷积核对输入输入层的数据进行卷积计算得到饲料样品的特征图,其中,卷积层包括多层。
其中,除输入层和输出层外,其它层均可以设置多层,输入数据和标签后,卷积层使用多个设定好大小和步长的二维卷积核,经卷积运算后得到特征图。卷积层层数可以是一层、二层甚至更多,但是卷积层层数、卷积核数太多可能会导致过拟合。
优选地,卷积层使用8个卷积核,大小为3×3步长为1。池化层使用最大池化法,核的大小为2×2,步长为2。
S1054:根据卷积层得到饲料样品的特征图,池化层提取得到特征图的局部特征数据。
其中,池化层的池化方式有最大池化法和平均池化法,优选最大化吃法,能够有效提取局部特征信息。
S1055:根据池化层提取得到特征图的局部特征数据,全连接层将局部特征映射到样本空间进行分类。
其中,全连接层使用Softmax激活函数(Softmax不再唯一的确定某一个最大值,而是为每个输出分类的结果都赋予一个概率值,表示属于每个类别的可能性),优化器优选为AdamOptimizer(AdamOptimizer是TensorFlow中实现Adam算法的优化器,Adam即AdaptiveMoment Estimation,自适应矩估计),学习率为0.0001,卷积核个数为3,迭代次数为5000。模型训练基于TensorFlow框架GPU(graphics processing unit,图形处理器)版本。
具体地,将局部特征映射到样本空间,然后,对局部特征进行分类,形成光谱图像。
需要说明地是,二维卷积神经网络训练模型训练时,首先初始化权值,输入饲料样品训练集近红外光谱数据及含量标签,经过神经网络各层得到最终输出结果。计算模型损失函数值,通过反向传播将损失函数值从最末层传至网络各层,按照最小化损失函数值的方向更新权值,继续训练。此外,为了尽可能避免过拟合现象,在二维卷积神经网络中添加了正则项和随机失活。
S106:基于二维卷积神经网络训练模型,预测饲料中蛋白质含量。
具体的地,基于二维卷积神经网络训练模型还包括步骤S1061-S1063。
如图3所示,S1061:根据每条光谱含有的4001个光谱点,选取竞争性自适应重加权算法对光谱数据压缩。
其中,由于每条光谱含有4001个光谱点,建模时不仅计算量大,而且会影响回归的准确度,为了减少光谱分类中的数据量,选取竞争性自适应重加权算法对光谱数据压缩。
具体地,为了减少光谱分类中的数据量,通过选择特征波长的方法可以将光谱数据维度进行缩减,再通过光谱数据分类方法进行分类。选取竞争性自适应重加权实现对于光谱的数据压缩,特征波长提取算法还可以选用连续投影算法等。
竞争性自适应重加权(Competitive Adaptive Reweighted Sampling,CARS)作为一种变量选择算法。算法会连续进行四个步骤:(1)蒙特卡洛进行模型采样。(2)采用指数衰减函来进行强制波长选择。(3)采用ARS来实现竞争性的波长选择,来实现竞争性的波长选择,(4)利用交叉验证来评估子集。
利用竞争性自适应重加权算法能够有效地对光谱数据压缩,减少计算量。
S1062:根据竞争性自适应重加权算法与偏最小二乘回归相结合,通过指数衰减函数和竞争性自适应重加权算法去除压缩的光谱数据中权重小的变量。
其中,竞争性自适应重加权算法与偏最小二乘回归相结合,模仿适者生存原则,通过指数衰减函数和自适应重加权采样技术去除权重小的变量。
S1063:根据去除压缩的光谱数据中权重小的变量后的光谱数据,进行交互验证选出RMSECV值最低的子集,确定光谱数据的最优特征波长组合。
其中,根据去除压缩的光谱数据中权重小的变量后的光谱数据,再利用交互验证选出RMSECV(建模集交互验证均方根误差)值最低的子集,可有效寻找出最优特征波长组合。
具体地,4001个光谱点的进行一次二维相关计算,至少是4001×4001次计算,CPU进行此类计算十分耗时,而且也会出现较多的干扰信息。通过将原始光谱进行竞争性自适应重加权算法计算得到特征波长进行二维相关计算,不仅最大程度的保留了原始光谱的特征,而且大大减少了计算量和冗余信息。
需要说明地是,原始光谱指代的是第一近红外光谱或第二近红外光谱,具体可以根据实际情况进行选择。
还需要说明地是,在获得的第二近红外光谱中,通过光谱仪进行扫描的过程中会产生拉曼光谱,因此在预测饲料中蛋白含量时,还需要考虑拉曼光谱,具体步骤为S201-S206。
如图4所示,S201:获取光谱仪扫描过程中产生的拉曼信号和荧光信号。
如图9所示,S202:基于拉曼信号和荧光信号,建立拉曼光谱。
S203:建立理想光谱,其中,理想光谱表征光谱的平均值。
其中,光谱的平均值表示的是经过消除噪声的饲料样品的第二近红外光谱。
S204:基于理想光谱校正多个饲料样品的第二近红外光谱相对基线偏移和偏移,得到理想标准光谱。
其中,光谱的变化和样品中的成分含量之间存在的直接的线性关系,这个光谱被用来校正所有其他样品的近红外光谱,包括基线偏移和偏移校正。在实践中,理想光谱是很难获得的,由于理想光谱的作用在于校正每个样品的近红外光谱的相对基线偏移和偏移,因此,可以将所有光谱的平均值作为理想标准光谱。
如图10和图11所示,S205:根据多元散射对第二近红外光谱和拉曼光谱进行校正。
S206:对校正后的第二近红外光谱和拉曼光谱归一化。
本实施例中,通过多元散射对近红外光谱与拉曼光谱进行处理,然后将处理后的光谱归一化,以便将两张光谱紧密地结合在一起。提高预测饲料中蛋白质含量的准确率。
步骤S206之后,还包括:S2061-S2063。
如图5所示,S2061:根据第二近红外光谱和拉曼光谱归一化后的数据输入向量机模型。
其中,输入向量机模型中,采用网格搜索算法来寻找第二近红外光谱和拉曼光谱归一化后的数据的最佳参数,网格搜索算法又称作格子搜索算法。最佳参数为通过网格搜索算法所得到的最佳参数。
具体地,在支持向量机模型中,采用格子搜索算法来寻找最佳参数,其中惩罚系数选择为400,内核选择为Poly,Gamma=2.1。卷积层使用8个卷积核,大小为1×3。池化层选用最大池化法,核大小为1×2,步长为2。模型的最后一个全连层使用Softmax激活函数AdamOptimizer为优化器,学习率为0.001,卷积核的数量为3,迭代次数为10000。
基于最佳参数建立第二近红外光谱和拉曼光谱归一化的支持向量机模型。
S2062:将输入向量机模型和二维卷积神经网络训练模型结合。
S2063:根据结合的输入向量机模型和二维卷积神经网络训练模,预测饲料中蛋白质含量。
模型计算得到的结果:
使用第二近红外光谱的SVR(宽容的回归模型建模)和1DCNN(一维卷积建模)的RMSE(均方根误差)分别为0.84和1.22;使用拉曼光谱相应建模的RMSE分别为0.92和1.53;第二近红外光谱和拉曼光谱归一化后,如前述的对应建模的RMSE分别为0.12和0.35,结果表面,根据结合的输入向量机模型和二维卷积神经网络训练模,预测饲料中蛋白质含量更加准确。
本发明第二方面提供一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如前述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
本发明第三方面提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如前述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
本发明第四方面提供一种预测装置,包括:
获取单元,用于获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
计算单元,用于将所述脂肪含量作为外部扰动,对所述饲料样品的近红外光谱进行二维计算,其中,所述脂肪含量的动态光谱~y为:
Figure BDA0003893976440000151
其中,t在Tmin和Tmax间变化时光谱强度为y(v,t),v为速度,
Figure BDA0003893976440000152
为参考光谱;
扫描模块,利用光谱仪扫描所述饲料样品的4000-12000波数的4001个光谱点,得到所述近红外光谱的第一近红外光谱;
去除噪声模块,用于对所述第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立模型模块,用于建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型;
预测模块,用于基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量。
综上所述,利用第二近红外光谱建模在经过相应地训练即可,通过光谱图像预测饲料中蛋白质含量。将二维相关光谱作为二维信息输入到卷积神经网络模型中进行建模。研究结果表明,经过筛选后波长建立的基于二维相关光谱图的卷积神经网络模型,饲料验证集的RMSE=0.53,误差率为3.3%(相对于饲料验证集)。本研究测量了不同蛋白质含量的饲料样品的近红外和拉曼(含荧光)光谱,并通过比较各种预处理方法,选择准确度最高的MSC方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,包括如下步骤:
获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
将所述脂肪含量作为外部扰动,对所述饲料样品的近红外光谱进行二维计算,其中,所述脂肪含量的动态光谱
Figure FDA0003893976430000013
为:
Figure FDA0003893976430000011
其中,t在Tmin和Tmax间变化时光谱强度为y(v,t),v为速度,
Figure FDA0003893976430000012
为参考光谱;
利用光谱仪扫描所述饲料样品的4000-12000波数的4001个光谱点,得到所述近红外光谱的第一近红外光谱;
对所述第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型;
基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量。
2.根据权利要求1所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述对所述第一近红外光谱数据预处理,去除噪音,得到第二近红外光谱的步骤中,还包括:
利用一阶导数法、二阶导数法、中心化、标准化、Savitzky-Golay平滑法、多远散射处理、标准正态变换法中的一种或多种对所述第一近红外光谱数据进行预处理,去除噪声。
3.根据权利要求1所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型的步骤中,还包括:
建立具有输入层、卷积层、池化层、全连接层和输出层的二维卷积神经网络训练模型;
向所述输入层输入所述饲料样品的第二近红外光谱,及所述饲料样品的中蛋白质含量和脂肪含量的标签,建立二维卷积神经网络训练模型;
经过所述卷积层预设的二维卷积核对输入所述输入层的数据进行卷积计算得到所述饲料样品的特征图,其中,所述卷积层包括多层;
根据所述卷积层得到所述饲料样品的特征图,所述池化层提取得到特征图的局部特征数据;
根据所述池化层提取得到特征图的局部特征数据,所述全连接层将所述局部特征映射到样本空间进行分类。
4.根据权利要求3所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量的步骤中,还包括:
根据每条光谱含有的4001个光谱点,选取竞争性自适应重加权算法对所述光谱数据压缩;
根据所述竞争性自适应重加权算法与偏最小二乘回归相结合,通过指数衰减函数和竞争性自适应重加权算法去除压缩的所述光谱数据中权重小的变量;
根据去除压缩的所述光谱数据中权重小的变量后的所述光谱数据,进行交互验证选出RMSECV值最低的子集,确定所述光谱数据的最优特征波长组合。
5.根据权利要求1所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量的步骤中,还包括:
获取光谱仪扫描过程中产生的拉曼信号和荧光信号;
基于所述拉曼信号和所述荧光信号,建立拉曼光谱;
建立理想光谱,其中,所述理想光谱表征所述光谱的平均值;
基于所述理想光谱校正多个所述饲料样品的第二近红外光谱相对基线偏移和偏移,得到理想标准光谱;
根据多元散射对所述第二近红外光谱和所述拉曼光谱进行校正;
对校正后的所述第二近红外光谱和所述拉曼光谱归一化。
6.根据权利要求5所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述对校正后的所述第二近红外光谱和所述拉曼光谱归一化的步骤后,还包括:
根据所述第二近红外光谱和所述拉曼光谱归一化后的数据输入向量机模型;
将所述输入向量机模型和所述二维卷积神经网络训练模型结合;
根据结合的所述输入向量机模型和所述二维卷积神经网络训练模,预测饲料中蛋白质含量。
7.根据权利要求6所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述根据所述第二近红外光谱和所述拉曼光谱归一化后的数据输入向量机模型的步骤中,还包括:
在支持向量机模型中,采用网格搜索算法来寻找所述第二近红外光谱和所述拉曼光谱归一化后的数据的最佳参数;
基于所述最佳参数建立所述第二近红外光谱和所述拉曼光谱归一化的支持向量机模型。
8.一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
10.一种预测装置,其特征在于,包括:
获取单元,用于获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
计算单元,用于将所述脂肪含量作为外部扰动,对所述饲料样品的近红外光谱进行二维计算,其中,所述脂肪含量的动态光谱
Figure FDA0003893976430000043
为:
Figure FDA0003893976430000041
其中,t在Tmin和Tmax间变化时光谱强度为y(v,t),v为速度,
Figure FDA0003893976430000042
为参考光谱;
扫描模块,利用光谱仪扫描所述饲料样品的4000-12000波数的4001个光谱点,得到所述近红外光谱的第一近红外光谱;
去除噪声模块,用于对所述第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立模型模块,用于建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型;
预测模块,用于基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量。
CN202211271136.7A 2022-10-17 2022-10-17 基于二维相关光谱预测饲料中蛋白质含量的方法 Pending CN115541531A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211271136.7A CN115541531A (zh) 2022-10-17 2022-10-17 基于二维相关光谱预测饲料中蛋白质含量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211271136.7A CN115541531A (zh) 2022-10-17 2022-10-17 基于二维相关光谱预测饲料中蛋白质含量的方法

Publications (1)

Publication Number Publication Date
CN115541531A true CN115541531A (zh) 2022-12-30

Family

ID=84734618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211271136.7A Pending CN115541531A (zh) 2022-10-17 2022-10-17 基于二维相关光谱预测饲料中蛋白质含量的方法

Country Status (1)

Country Link
CN (1) CN115541531A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118155728A (zh) * 2024-05-11 2024-06-07 天津中升饲料有限公司 一种用于饲料蛋白质含量的数据分析方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118155728A (zh) * 2024-05-11 2024-06-07 天津中升饲料有限公司 一种用于饲料蛋白质含量的数据分析方法
CN118155728B (zh) * 2024-05-11 2024-07-19 天津中升饲料有限公司 一种用于饲料蛋白质含量的数据分析方法

Similar Documents

Publication Publication Date Title
Jiang et al. A fully convolutional neural network-based regression approach for effective chemical composition analysis using near-infrared spectroscopy in cloud
Çetin et al. Using hyperspectral imaging technology and machine learning algorithms for assessing internal quality parameters of apple fruits
Yan et al. Nondestructive phenolic compounds measurement and origin discrimination of peated barley malt using near-infrared hyperspectral imagery and machine learning
Yuan et al. Selecting key wavelengths of hyperspectral imagine for nondestructive classification of moldy peanuts using ensemble classifier
Yuan et al. Moldy peanuts identification based on hyperspectral images and Point-centered convolutional neural network combined with embedded feature selection
Huang et al. Rapid and nondestructive determination of sorghum purity combined with deep forest and near-infrared hyperspectral imaging
Yuan et al. An application to analyzing and correcting for the effects of irregular topographies on NIR hyperspectral images to improve identification of moldy peanuts
Qi et al. Moldy peanut kernel identification using wavelet spectral features extracted from hyperspectral images
Yu et al. Rapid and visual measurement of fat content in peanuts by using the hyperspectral imaging technique with chemometrics
Zhang et al. Identification of rice-weevil (Sitophilus oryzae L.) damaged wheat kernels using multi-angle NIR hyperspectral data
CN116026795A (zh) 一种基于反射透射光谱的水稻籽粒品质性状无损预测方法
Ahmed et al. Advancing sweetpotato quality assessment with hyperspectral imaging and explainable artificial intelligence
CN113030001A (zh) 一种水果糖度检测方法及系统
Jiang et al. Rapid nondestructive detecting of wheat varieties and mixing ratio by combining hyperspectral imaging and ensemble learning
CN115541531A (zh) 基于二维相关光谱预测饲料中蛋白质含量的方法
Li et al. Quantitative analysis of aflatoxin B1 of peanut by optimized support vector machine models based on near-infrared spectral features
Rogers et al. Wavelength and texture feature selection for hyperspectral imaging: a systematic literature review
Tian et al. Detection of mango soluble solid content using hyperspectral imaging technology
Wang et al. Detection of Insect-Damaged Maize Seed Using Hyperspectral Imaging and Hybrid 1D-CNN-BiLSTM Model
Huang et al. Detection of early bruises in Gongcheng persimmon using hyperspectral imaging
Zhao et al. Attention-Based CNN Ensemble for Soil Organic Carbon Content Estimation with Spectral Data
Wang et al. SVM classification method of waxy corn seeds with different vitality levels based on hyperspectral imaging
CN117538287A (zh) 一种无损检测黄冠梨果磷含量的方法及装置
CN111125629B (zh) 一种域自适应的pls回归模型建模方法
Hu et al. An efficient model transfer approach to suppress biological variation in elastic modulus and firmness regression models using hyperspectral data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination