CN115541531A - 基于二维相关光谱预测饲料中蛋白质含量的方法 - Google Patents
基于二维相关光谱预测饲料中蛋白质含量的方法 Download PDFInfo
- Publication number
- CN115541531A CN115541531A CN202211271136.7A CN202211271136A CN115541531A CN 115541531 A CN115541531 A CN 115541531A CN 202211271136 A CN202211271136 A CN 202211271136A CN 115541531 A CN115541531 A CN 115541531A
- Authority
- CN
- China
- Prior art keywords
- spectrum
- near infrared
- feed
- infrared spectrum
- protein content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 102
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 55
- 238000004364 calculation method Methods 0.000 claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 230000003595 spectral effect Effects 0.000 claims description 37
- 238000001237 Raman spectrum Methods 0.000 claims description 28
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000011176 pooling Methods 0.000 claims description 19
- 230000002860 competitive effect Effects 0.000 claims description 16
- 238000010586 diagram Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 238000001069 Raman spectroscopy Methods 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000010845 search algorithm Methods 0.000 claims description 6
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000011426 transformation method Methods 0.000 claims description 4
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000036961 partial effect Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims 1
- 235000019624 protein content Nutrition 0.000 description 46
- 238000005100 correlation spectroscopy Methods 0.000 description 10
- 108090000623 proteins and genes Proteins 0.000 description 6
- 102000004169 proteins and genes Human genes 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000004858 feed analysis Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010238 partial least squares regression Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及蛋白质含量预测技术领域。基于二维相关光谱预测饲料中蛋白质含量的方法包括如下步骤:获取蛋白质含量为14%‑20%,脂肪含量为2.5%‑5%的多个饲料样品;将脂肪含量作为外部扰动,对饲料样品的近红外光谱进行二维计算;利用光谱仪扫描饲料样品的4000‑12000波数的4001个光谱点,得到近红外光谱的第一近红外光谱;对第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;建立二维卷积神经网络训练模型,将第二近红外光谱输入二维卷积神经网络训练模型;基于二维卷积神经网络训练模型,预测饲料中蛋白质含量。本发明基于二维相关光谱预测饲料中蛋白质含量的方法,预测饲料中蛋白质含量,结果准确性得以提高。
Description
技术领域
本发明涉及蛋白质含量技术领域,尤其是涉及基于二维相关光谱预测饲料中蛋白质含量的方法。
背景技术
目前,饲料是我国畜牧业发展的基础,随着饲料产业和畜牧养殖业的蓬勃发展,如何快速鉴定饲料的品质变得尤为重要,由于饲料检测制度的不完善和优质的饲料在市场上价格高,导致一部分饲料里掺杂一些其他物质,以次充好。其中,蛋白质饲料原料又是饲料产业的基石,蛋白质作为生命活动中最重要的物质基础之一,在养殖业中起到巨大的作用,并且,是分析饲料重要的品质之一。
基于上述原因,如果有一种能够预测饲料中蛋白质含量的方法,将大大减少饲料以次充好的问题发生。
发明内容
本发明提供一种基于二维相关光谱预测饲料中蛋白质含量的方法,该基于二维相关光谱预测饲料中蛋白质含量的方法能够利用二维相关光谱预测饲料中蛋白质含量,旨在解决,饲料中蛋白质含量的预测方法不完善,准确率差的问题。
本发明的第一目的在于一种基于二维相关光谱预测饲料中蛋白质含量的方法,包括如下步骤:
获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
利用光谱仪扫描饲料样品的4000-12000波数的4001个光谱点,得到近红外光谱的第一近红外光谱;
对第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立二维卷积神经网络训练模型,将第二近红外光谱输入二维卷积神经网络训练模型;
基于二维卷积神经网络训练模型,预测饲料中蛋白质含量。
可实施的一种方式中,对第一近红外光谱数据预处理,去除噪音,得到第二近红外光谱的步骤中,还包括:
利用一阶导数法、二阶导数法、中心化、标准化、Savitzky-Golay平滑法、多远散射处理、标准正态变换法中的一种或多种对第一近红外光谱数据进行预处理,去除噪声。
可实施的一种方式中,建立二维卷积神经网络训练模型,将第二近红外光谱输入二维卷积神经网络训练模型的步骤中,还包括:
建立具有输入层、卷积层、池化层、全连接层和输出层的二维卷积神经网络训练模型;
向输入层输入饲料样品的第二近红外光谱,及饲料样品的中蛋白质含量和脂肪含量的标签,建立二维卷积神经网络训练模型;
经过卷积层预设的二维卷积核对输入输入层的数据进行卷积计算得到饲料样品的特征图,其中,卷积层包括多层;
根据卷积层得到饲料样品的特征图,池化层提取得到特征图的局部特征数据;
根据池化层提取得到特征图的局部特征数据,全连接层将局部特征映射到样本空间进行分类。
可实施的一种方式中,基于二维卷积神经网络训练模型,预测饲料中蛋白质含量的步骤中,还包括:
根据每条光谱含有的4001个光谱点,选取竞争性自适应重加权算法对光谱数据压缩;
根据竞争性自适应重加权算法与偏最小二乘回归相结合,通过指数衰减函数和竞争性自适应重加权算法去除压缩的光谱数据中权重小的变量;
根据去除压缩的光谱数据中权重小的变量后的光谱数据,进行交互验证选出RMSECV值最低的子集,确定光谱数据的最优特征波长组合。
可实施的一种方式中,基于二维卷积神经网络训练模型,预测饲料中蛋白质含量的步骤中,还包括:
获取光谱仪扫描过程中产生的拉曼信号和荧光信号;
基于拉曼信号和荧光信号,建立拉曼光谱;
建立理想光谱,其中,理想光谱表征光谱的平均值;
基于理想光谱校正多个饲料样品的第二近红外光谱相对基线偏移和偏移,得到理想标准光谱;
根据多元散射对第二近红外光谱和拉曼光谱进行校正;
对校正后的第二近红外光谱和拉曼光谱归一化。
可实施的一种方式中,对校正后的第二近红外光谱和拉曼光谱归一化的步骤后,还包括:
根据第二近红外光谱和拉曼光谱归一化后的数据输入向量机模型;
将输入向量机模型和二维卷积神经网络训练模型结合;
根据结合的输入向量机模型和二维卷积神经网络训练模,预测饲料中蛋白质含量。
可实施的一种方式中,根据第二近红外光谱和拉曼光谱归一化后的数据输入向量机模型的步骤中,还包括:
在支持向量机模型中,采用网格搜索算法来寻找第二近红外光谱和拉曼光谱归一化后的数据的最佳参数;
基于最佳参数建立第二近红外光谱和拉曼光谱归一化的支持向量机模型。
本发明的第二目的在于提供一种电子设备,包括总线、收发器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,收发器、存储器和处理器通过总线相连,计算机程序被处理器执行时实现如前述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
本发明的第三目的在于提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如前述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
本发明的第四目的在于提供一种预测装置,其特征在于,包括:
获取单元,用于获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
扫描模块,利用光谱仪扫描所述饲料样品的4000-12000波数的4001个光谱点,得到所述近红外光谱的第一近红外光谱;
去除噪声模块,用于对所述第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立模型模块,用于建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型;
预测模块,用于基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量。
本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法,获取具有蛋白质和脂肪的多个饲料样品,将脂肪作为外部扰动,对饲料样品的近红外光谱进行二维计算,在利用光谱仪扫描饲料样品的4000-12000波数的4001个光谱点,得到近红外光谱的第一近红外光谱,对第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱,接下来建立二维卷积神经网络训练模型,再将第二近红外光谱输入二维卷积神经网络训练模型;基于二维卷积神经网络训练模型,预测饲料中蛋白质含量。本发明针对现在农场饲料中营养物质含量检测困难的问题,通过近红外光谱仪测量不同蛋白质含量饲料样品的近红外光谱,基于二维卷积神经网络训练模型中的二维相关光谱预测饲料中蛋白质含量,结果准确性得以提高。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法的流程图;
图2为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中向二维卷积神经网络训练模型输入数据的流程图;
图3为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中二维卷积神经网络训练模型,预测饲料中蛋白质含量的流程图;
图4为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中拉曼光谱的流程图;
图5为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中向量机模型的流程图;
图6为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中第一近红外光谱的示意图;
图7为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中原始光谱的示意图;
图8为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中特征波长的示意图;
图9为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中拉曼光谱的示意图;
图10为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中多远散射校正的第一近红外光谱示意图;
图11为本发明一种基于二维相关光谱预测饲料中蛋白质含量的方法中多远散射校正的拉曼光谱的示意图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也包括复数形式,此外,还应当理解的是,当在本说明中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1至图11,本发明第一方面提供一种基于二维相关光谱预测饲料中蛋白质含量的方法,包括如下步骤:
如图1所示,S101:获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品。
其中,可以将饲料进行划分,划分成验证集和训练集,其中20%为验证集,80%为训练集,本实施例中选用训练集用于训练,验证集用于验证预测效果。
训练集中的饲料为饲料样品,饲料样品中蛋白质含量排列为14%到20%比例随机,脂肪含量为2.5%到5%比例随机。
二维相关光谱(Two-Dimensional Correlation Spectroscopy,2DCOS),是一种在多种谱中得到广泛应用的谱学研究方法,将光谱信号扩展到第二维上,使原来在一维光谱中的弱峰和重叠峰以及被噪声或背底所掩盖的峰更加清晰,显著增强了光谱的分辨率。外部扰动诱发的光谱变化称作动态光谱,对获得的一系列动态光谱进行二维相关计算,即可得到二维相关光谱。
二维相关光谱强度X(v1,v2)是指外扰变量t在Tmin和Tmax间变化时,对不同光学变量v1和v2下的光谱强度变化进行定量比较。为方便计算,将X(v1,v2)表示为复数形式:
X(v1,v2)=φ(v1,v2)+iψ(v1,v2);
组成二维相关谱强度的虚部和实部即为二维相关同步谱和异步谱。同步光谱和异步光谱强度可表示为:
其中,同步光谱为φ和异步光谱为ψ,N为Hilbert-Noda(希尔伯特)矩阵,
对饲料样品的近红外光谱进行二维计算,其中,将脂肪含量作为外部扰动。
S103:利用光谱仪扫描饲料样品的4000-12000波数的4001个光谱点,得到近红外光谱的第一近红外光谱。
如图6所示,其中,第一近红外光谱为通过光谱仪对饲料样品进行扫描形成的近红外光谱。
光谱仪为傅里叶变换近红外光谱仪。
S104:对第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
其中,第一近红外光谱数据的去除噪声预处理可包括利用一阶导数法、二阶导数法、中心化、标准化、Savitzky-Golay平滑法、多远散射处理、标准正态变换法中的一种或多种对第一近红外光谱数据进行预处理,去除噪声,得到第二近红外光谱。
具体地,导数算法中常见的是一阶和二阶导数法,导数光谱可有效地消除基线和其它背景的干扰以提高光谱分辨率和灵敏度,但它同时会引入噪声,降低信噪比。本实施例中通过差分法来计算光谱的一阶导数和二阶导数。
中心化是光谱数据增强的一种,它将光谱数据的平均值作为基准,将每个光谱数据比较求差,最终得到平均值为0的光谱数据。这样的变换不会改变原始数据之间的相对位置,也不会造成光谱变量间关系的改变,却能给后续的数据处理带来便利。
标准化,是光谱数据增强的一种,它在中心化的基础上除以数据的标准差,这样的光谱评价值为0,标准差为1。
标准正态变换法,是将任一一条原始光谱减去平均光谱后除以原始光谱数据的标准差,与标准化不同,标准正态变换对一条光谱进行处理。
Savitzky-Golay平滑法(Savitzky-Golay Smoothing Method,SG),信号平滑是消除噪声的一种方法,基本假设是光谱含有的噪声为零均白噪声,若多次测量取平均值可降低噪声提高信噪比。Savitzky-Golay卷积平滑法,是一种平滑方法,通过多项式来对移动窗口内的数据进行多项式最小二乘拟合,具体为一种加权平均法,强调中心点的中心作用。
需要说明地是,本实施例中,可以根据需要选取上述方法中的一种或多种来消除噪声,以便提高最终的第二近红外光谱准确率。
S105:建立二维卷积神经网络训练模型,将第二近红外光谱输入二维卷积神经网络训练模型。
其中,卷积神经网络是一种非线性模型,建立的二维卷积神经网络训练模型包括输入层、卷积层、池化层、全连接层和输出层。
具体的地,向二维卷积神经网络训练模型输入数据的步骤包括:S1051-S1055。
如图2所示,S1051:建立具有输入层、卷积层、池化层、全连接层和输出层的二维卷积神经网络训练模型。
S1052:向输入层输入饲料样品的第二近红外光谱,及饲料样品的中蛋白质含量和脂肪含量的标签,建立二维卷积神经网络训练模型。
S1053:经过卷积层预设的二维卷积核对输入输入层的数据进行卷积计算得到饲料样品的特征图,其中,卷积层包括多层。
其中,除输入层和输出层外,其它层均可以设置多层,输入数据和标签后,卷积层使用多个设定好大小和步长的二维卷积核,经卷积运算后得到特征图。卷积层层数可以是一层、二层甚至更多,但是卷积层层数、卷积核数太多可能会导致过拟合。
优选地,卷积层使用8个卷积核,大小为3×3步长为1。池化层使用最大池化法,核的大小为2×2,步长为2。
S1054:根据卷积层得到饲料样品的特征图,池化层提取得到特征图的局部特征数据。
其中,池化层的池化方式有最大池化法和平均池化法,优选最大化吃法,能够有效提取局部特征信息。
S1055:根据池化层提取得到特征图的局部特征数据,全连接层将局部特征映射到样本空间进行分类。
其中,全连接层使用Softmax激活函数(Softmax不再唯一的确定某一个最大值,而是为每个输出分类的结果都赋予一个概率值,表示属于每个类别的可能性),优化器优选为AdamOptimizer(AdamOptimizer是TensorFlow中实现Adam算法的优化器,Adam即AdaptiveMoment Estimation,自适应矩估计),学习率为0.0001,卷积核个数为3,迭代次数为5000。模型训练基于TensorFlow框架GPU(graphics processing unit,图形处理器)版本。
具体地,将局部特征映射到样本空间,然后,对局部特征进行分类,形成光谱图像。
需要说明地是,二维卷积神经网络训练模型训练时,首先初始化权值,输入饲料样品训练集近红外光谱数据及含量标签,经过神经网络各层得到最终输出结果。计算模型损失函数值,通过反向传播将损失函数值从最末层传至网络各层,按照最小化损失函数值的方向更新权值,继续训练。此外,为了尽可能避免过拟合现象,在二维卷积神经网络中添加了正则项和随机失活。
S106:基于二维卷积神经网络训练模型,预测饲料中蛋白质含量。
具体的地,基于二维卷积神经网络训练模型还包括步骤S1061-S1063。
如图3所示,S1061:根据每条光谱含有的4001个光谱点,选取竞争性自适应重加权算法对光谱数据压缩。
其中,由于每条光谱含有4001个光谱点,建模时不仅计算量大,而且会影响回归的准确度,为了减少光谱分类中的数据量,选取竞争性自适应重加权算法对光谱数据压缩。
具体地,为了减少光谱分类中的数据量,通过选择特征波长的方法可以将光谱数据维度进行缩减,再通过光谱数据分类方法进行分类。选取竞争性自适应重加权实现对于光谱的数据压缩,特征波长提取算法还可以选用连续投影算法等。
竞争性自适应重加权(Competitive Adaptive Reweighted Sampling,CARS)作为一种变量选择算法。算法会连续进行四个步骤:(1)蒙特卡洛进行模型采样。(2)采用指数衰减函来进行强制波长选择。(3)采用ARS来实现竞争性的波长选择,来实现竞争性的波长选择,(4)利用交叉验证来评估子集。
利用竞争性自适应重加权算法能够有效地对光谱数据压缩,减少计算量。
S1062:根据竞争性自适应重加权算法与偏最小二乘回归相结合,通过指数衰减函数和竞争性自适应重加权算法去除压缩的光谱数据中权重小的变量。
其中,竞争性自适应重加权算法与偏最小二乘回归相结合,模仿适者生存原则,通过指数衰减函数和自适应重加权采样技术去除权重小的变量。
S1063:根据去除压缩的光谱数据中权重小的变量后的光谱数据,进行交互验证选出RMSECV值最低的子集,确定光谱数据的最优特征波长组合。
其中,根据去除压缩的光谱数据中权重小的变量后的光谱数据,再利用交互验证选出RMSECV(建模集交互验证均方根误差)值最低的子集,可有效寻找出最优特征波长组合。
具体地,4001个光谱点的进行一次二维相关计算,至少是4001×4001次计算,CPU进行此类计算十分耗时,而且也会出现较多的干扰信息。通过将原始光谱进行竞争性自适应重加权算法计算得到特征波长进行二维相关计算,不仅最大程度的保留了原始光谱的特征,而且大大减少了计算量和冗余信息。
需要说明地是,原始光谱指代的是第一近红外光谱或第二近红外光谱,具体可以根据实际情况进行选择。
还需要说明地是,在获得的第二近红外光谱中,通过光谱仪进行扫描的过程中会产生拉曼光谱,因此在预测饲料中蛋白含量时,还需要考虑拉曼光谱,具体步骤为S201-S206。
如图4所示,S201:获取光谱仪扫描过程中产生的拉曼信号和荧光信号。
如图9所示,S202:基于拉曼信号和荧光信号,建立拉曼光谱。
S203:建立理想光谱,其中,理想光谱表征光谱的平均值。
其中,光谱的平均值表示的是经过消除噪声的饲料样品的第二近红外光谱。
S204:基于理想光谱校正多个饲料样品的第二近红外光谱相对基线偏移和偏移,得到理想标准光谱。
其中,光谱的变化和样品中的成分含量之间存在的直接的线性关系,这个光谱被用来校正所有其他样品的近红外光谱,包括基线偏移和偏移校正。在实践中,理想光谱是很难获得的,由于理想光谱的作用在于校正每个样品的近红外光谱的相对基线偏移和偏移,因此,可以将所有光谱的平均值作为理想标准光谱。
如图10和图11所示,S205:根据多元散射对第二近红外光谱和拉曼光谱进行校正。
S206:对校正后的第二近红外光谱和拉曼光谱归一化。
本实施例中,通过多元散射对近红外光谱与拉曼光谱进行处理,然后将处理后的光谱归一化,以便将两张光谱紧密地结合在一起。提高预测饲料中蛋白质含量的准确率。
步骤S206之后,还包括:S2061-S2063。
如图5所示,S2061:根据第二近红外光谱和拉曼光谱归一化后的数据输入向量机模型。
其中,输入向量机模型中,采用网格搜索算法来寻找第二近红外光谱和拉曼光谱归一化后的数据的最佳参数,网格搜索算法又称作格子搜索算法。最佳参数为通过网格搜索算法所得到的最佳参数。
具体地,在支持向量机模型中,采用格子搜索算法来寻找最佳参数,其中惩罚系数选择为400,内核选择为Poly,Gamma=2.1。卷积层使用8个卷积核,大小为1×3。池化层选用最大池化法,核大小为1×2,步长为2。模型的最后一个全连层使用Softmax激活函数AdamOptimizer为优化器,学习率为0.001,卷积核的数量为3,迭代次数为10000。
基于最佳参数建立第二近红外光谱和拉曼光谱归一化的支持向量机模型。
S2062:将输入向量机模型和二维卷积神经网络训练模型结合。
S2063:根据结合的输入向量机模型和二维卷积神经网络训练模,预测饲料中蛋白质含量。
模型计算得到的结果:
使用第二近红外光谱的SVR(宽容的回归模型建模)和1DCNN(一维卷积建模)的RMSE(均方根误差)分别为0.84和1.22;使用拉曼光谱相应建模的RMSE分别为0.92和1.53;第二近红外光谱和拉曼光谱归一化后,如前述的对应建模的RMSE分别为0.12和0.35,结果表面,根据结合的输入向量机模型和二维卷积神经网络训练模,预测饲料中蛋白质含量更加准确。
本发明第二方面提供一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如前述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
本发明第三方面提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如前述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
本发明第四方面提供一种预测装置,包括:
获取单元,用于获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
计算单元,用于将所述脂肪含量作为外部扰动,对所述饲料样品的近红外光谱进行二维计算,其中,所述脂肪含量的动态光谱~y为:
扫描模块,利用光谱仪扫描所述饲料样品的4000-12000波数的4001个光谱点,得到所述近红外光谱的第一近红外光谱;
去除噪声模块,用于对所述第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立模型模块,用于建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型;
预测模块,用于基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量。
综上所述,利用第二近红外光谱建模在经过相应地训练即可,通过光谱图像预测饲料中蛋白质含量。将二维相关光谱作为二维信息输入到卷积神经网络模型中进行建模。研究结果表明,经过筛选后波长建立的基于二维相关光谱图的卷积神经网络模型,饲料验证集的RMSE=0.53,误差率为3.3%(相对于饲料验证集)。本研究测量了不同蛋白质含量的饲料样品的近红外和拉曼(含荧光)光谱,并通过比较各种预处理方法,选择准确度最高的MSC方法。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,包括如下步骤:
获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
利用光谱仪扫描所述饲料样品的4000-12000波数的4001个光谱点,得到所述近红外光谱的第一近红外光谱;
对所述第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型;
基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量。
2.根据权利要求1所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述对所述第一近红外光谱数据预处理,去除噪音,得到第二近红外光谱的步骤中,还包括:
利用一阶导数法、二阶导数法、中心化、标准化、Savitzky-Golay平滑法、多远散射处理、标准正态变换法中的一种或多种对所述第一近红外光谱数据进行预处理,去除噪声。
3.根据权利要求1所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型的步骤中,还包括:
建立具有输入层、卷积层、池化层、全连接层和输出层的二维卷积神经网络训练模型;
向所述输入层输入所述饲料样品的第二近红外光谱,及所述饲料样品的中蛋白质含量和脂肪含量的标签,建立二维卷积神经网络训练模型;
经过所述卷积层预设的二维卷积核对输入所述输入层的数据进行卷积计算得到所述饲料样品的特征图,其中,所述卷积层包括多层;
根据所述卷积层得到所述饲料样品的特征图,所述池化层提取得到特征图的局部特征数据;
根据所述池化层提取得到特征图的局部特征数据,所述全连接层将所述局部特征映射到样本空间进行分类。
4.根据权利要求3所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量的步骤中,还包括:
根据每条光谱含有的4001个光谱点,选取竞争性自适应重加权算法对所述光谱数据压缩;
根据所述竞争性自适应重加权算法与偏最小二乘回归相结合,通过指数衰减函数和竞争性自适应重加权算法去除压缩的所述光谱数据中权重小的变量;
根据去除压缩的所述光谱数据中权重小的变量后的所述光谱数据,进行交互验证选出RMSECV值最低的子集,确定所述光谱数据的最优特征波长组合。
5.根据权利要求1所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量的步骤中,还包括:
获取光谱仪扫描过程中产生的拉曼信号和荧光信号;
基于所述拉曼信号和所述荧光信号,建立拉曼光谱;
建立理想光谱,其中,所述理想光谱表征所述光谱的平均值;
基于所述理想光谱校正多个所述饲料样品的第二近红外光谱相对基线偏移和偏移,得到理想标准光谱;
根据多元散射对所述第二近红外光谱和所述拉曼光谱进行校正;
对校正后的所述第二近红外光谱和所述拉曼光谱归一化。
6.根据权利要求5所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述对校正后的所述第二近红外光谱和所述拉曼光谱归一化的步骤后,还包括:
根据所述第二近红外光谱和所述拉曼光谱归一化后的数据输入向量机模型;
将所述输入向量机模型和所述二维卷积神经网络训练模型结合;
根据结合的所述输入向量机模型和所述二维卷积神经网络训练模,预测饲料中蛋白质含量。
7.根据权利要求6所述的基于二维相关光谱预测饲料中蛋白质含量的方法,其特征在于,所述根据所述第二近红外光谱和所述拉曼光谱归一化后的数据输入向量机模型的步骤中,还包括:
在支持向量机模型中,采用网格搜索算法来寻找所述第二近红外光谱和所述拉曼光谱归一化后的数据的最佳参数;
基于所述最佳参数建立所述第二近红外光谱和所述拉曼光谱归一化的支持向量机模型。
8.一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于二维相关光谱预测饲料中蛋白质含量的方法中的步骤。
10.一种预测装置,其特征在于,包括:
获取单元,用于获取蛋白质含量为14%-20%,脂肪含量为2.5%-5%的多个饲料样品;
扫描模块,利用光谱仪扫描所述饲料样品的4000-12000波数的4001个光谱点,得到所述近红外光谱的第一近红外光谱;
去除噪声模块,用于对所述第一近红外光谱数据预处理,去除噪声,得到第二近红外光谱;
建立模型模块,用于建立二维卷积神经网络训练模型,将所述第二近红外光谱输入所述二维卷积神经网络训练模型;
预测模块,用于基于所述二维卷积神经网络训练模型,预测饲料中蛋白质含量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211271136.7A CN115541531A (zh) | 2022-10-17 | 2022-10-17 | 基于二维相关光谱预测饲料中蛋白质含量的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211271136.7A CN115541531A (zh) | 2022-10-17 | 2022-10-17 | 基于二维相关光谱预测饲料中蛋白质含量的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115541531A true CN115541531A (zh) | 2022-12-30 |
Family
ID=84734618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211271136.7A Pending CN115541531A (zh) | 2022-10-17 | 2022-10-17 | 基于二维相关光谱预测饲料中蛋白质含量的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115541531A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118155728A (zh) * | 2024-05-11 | 2024-06-07 | 天津中升饲料有限公司 | 一种用于饲料蛋白质含量的数据分析方法 |
-
2022
- 2022-10-17 CN CN202211271136.7A patent/CN115541531A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118155728A (zh) * | 2024-05-11 | 2024-06-07 | 天津中升饲料有限公司 | 一种用于饲料蛋白质含量的数据分析方法 |
CN118155728B (zh) * | 2024-05-11 | 2024-07-19 | 天津中升饲料有限公司 | 一种用于饲料蛋白质含量的数据分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiang et al. | A fully convolutional neural network-based regression approach for effective chemical composition analysis using near-infrared spectroscopy in cloud | |
Çetin et al. | Using hyperspectral imaging technology and machine learning algorithms for assessing internal quality parameters of apple fruits | |
Yan et al. | Nondestructive phenolic compounds measurement and origin discrimination of peated barley malt using near-infrared hyperspectral imagery and machine learning | |
Yuan et al. | Selecting key wavelengths of hyperspectral imagine for nondestructive classification of moldy peanuts using ensemble classifier | |
Yuan et al. | Moldy peanuts identification based on hyperspectral images and Point-centered convolutional neural network combined with embedded feature selection | |
Huang et al. | Rapid and nondestructive determination of sorghum purity combined with deep forest and near-infrared hyperspectral imaging | |
Yuan et al. | An application to analyzing and correcting for the effects of irregular topographies on NIR hyperspectral images to improve identification of moldy peanuts | |
Qi et al. | Moldy peanut kernel identification using wavelet spectral features extracted from hyperspectral images | |
Yu et al. | Rapid and visual measurement of fat content in peanuts by using the hyperspectral imaging technique with chemometrics | |
Zhang et al. | Identification of rice-weevil (Sitophilus oryzae L.) damaged wheat kernels using multi-angle NIR hyperspectral data | |
CN116026795A (zh) | 一种基于反射透射光谱的水稻籽粒品质性状无损预测方法 | |
Ahmed et al. | Advancing sweetpotato quality assessment with hyperspectral imaging and explainable artificial intelligence | |
CN113030001A (zh) | 一种水果糖度检测方法及系统 | |
Jiang et al. | Rapid nondestructive detecting of wheat varieties and mixing ratio by combining hyperspectral imaging and ensemble learning | |
CN115541531A (zh) | 基于二维相关光谱预测饲料中蛋白质含量的方法 | |
Li et al. | Quantitative analysis of aflatoxin B1 of peanut by optimized support vector machine models based on near-infrared spectral features | |
Rogers et al. | Wavelength and texture feature selection for hyperspectral imaging: a systematic literature review | |
Tian et al. | Detection of mango soluble solid content using hyperspectral imaging technology | |
Wang et al. | Detection of Insect-Damaged Maize Seed Using Hyperspectral Imaging and Hybrid 1D-CNN-BiLSTM Model | |
Huang et al. | Detection of early bruises in Gongcheng persimmon using hyperspectral imaging | |
Zhao et al. | Attention-Based CNN Ensemble for Soil Organic Carbon Content Estimation with Spectral Data | |
Wang et al. | SVM classification method of waxy corn seeds with different vitality levels based on hyperspectral imaging | |
CN117538287A (zh) | 一种无损检测黄冠梨果磷含量的方法及装置 | |
CN111125629B (zh) | 一种域自适应的pls回归模型建模方法 | |
Hu et al. | An efficient model transfer approach to suppress biological variation in elastic modulus and firmness regression models using hyperspectral data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |