CN117538287A - 一种无损检测黄冠梨果磷含量的方法及装置 - Google Patents
一种无损检测黄冠梨果磷含量的方法及装置 Download PDFInfo
- Publication number
- CN117538287A CN117538287A CN202311576573.4A CN202311576573A CN117538287A CN 117538287 A CN117538287 A CN 117538287A CN 202311576573 A CN202311576573 A CN 202311576573A CN 117538287 A CN117538287 A CN 117538287A
- Authority
- CN
- China
- Prior art keywords
- phosphorus content
- huangguan
- band
- pear
- full
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 title claims abstract description 163
- 229910052698 phosphorus Inorganic materials 0.000 title claims abstract description 163
- 239000011574 phosphorus Substances 0.000 title claims abstract description 163
- 235000014443 Pyrus communis Nutrition 0.000 title claims abstract description 139
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000009659 non-destructive testing Methods 0.000 title claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 116
- 238000001228 spectrum Methods 0.000 claims abstract description 48
- 230000002068 genetic effect Effects 0.000 claims abstract description 37
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 33
- 235000013399 edible fruits Nutrition 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000012216 screening Methods 0.000 claims abstract description 9
- 241000220324 Pyrus Species 0.000 claims description 173
- 235000021017 pears Nutrition 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 31
- 230000003595 spectral effect Effects 0.000 claims description 29
- 238000011156 evaluation Methods 0.000 claims description 25
- 238000010238 partial least squares regression Methods 0.000 claims description 25
- 238000000513 principal component analysis Methods 0.000 claims description 25
- 238000005457 optimization Methods 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 22
- 238000007781 pre-processing Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 18
- 230000007246 mechanism Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 14
- 230000009467 reduction Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 238000012417 linear regression Methods 0.000 claims description 13
- 230000035772 mutation Effects 0.000 claims description 13
- 210000000349 chromosome Anatomy 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 9
- 238000005286 illumination Methods 0.000 claims description 9
- 230000000877 morphologic effect Effects 0.000 claims description 9
- 239000002245 particle Substances 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000010187 selection method Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims 2
- 230000000875 corresponding effect Effects 0.000 claims 2
- 238000001514 detection method Methods 0.000 abstract description 4
- 238000005259 measurement Methods 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 description 7
- 230000008676 import Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 238000011176 pooling Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000004497 NIR spectroscopy Methods 0.000 description 2
- 235000014121 butter Nutrition 0.000 description 2
- 238000009614 chemical analysis method Methods 0.000 description 2
- 230000001066 destructive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000002759 z-score normalization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012271 agricultural production Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- BHEPBYXIRTUNPN-UHFFFAOYSA-N hydridophosphorus(.) (triplet) Chemical compound [PH] BHEPBYXIRTUNPN-UHFFFAOYSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000002366 mineral element Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种无损检测黄冠梨果磷含量的方法及装置。首先,通过对黄冠梨果表面进行近红外光谱扫描,采集光谱数据。随后,所获取的近红外光谱数据经过预处理,生成全波段光谱数据。利用偏最小二乘回归算法结合梯度提升回归树算法,基于预处理后的数据建立磷含量的全波段预测模型,并筛选出最佳模型。进一步地,运用遗传算法,从全波段光谱数据中挑选与磷含量相关性强的特征波长,以建立更精确的预测模型。最终,应用所建模型对黄冠梨果磷含量进行无损预测,实现精准在磷含量测定方面的应用。本方法的特点在于结合了多种先进算法,优化了特征选择过程,并有效提高了磷含量检测的准确性和可靠性。
Description
技术领域
本申请涉及近红外光谱分析技术领域,尤其涉及一种无损检测黄冠梨果磷含量的方法及装置。
背景技术
在现代农业生产中,果实的营养含量分析对于保障食品质量和制定精准施肥方案至关重要。特别是对于黄冠梨果这一类具有重要经济价值的水果,其磷含量的准确测定对于评估其成熟度和营养价值尤为关键。然而,传统的化学分析方法通常破坏性强、操作繁琐且效率低,难以满足快速、现场检测的需求。
为了解决这一问题,近红外光谱分析技术(NIRS)因其无损、快速且成本低廉的特点而成为研究的热点。该技术通过分析物质吸收近红外光的特定波长的情况,来推测物质的成分含量。然而,由于近红外光谱数据的复杂性,直接从全波段光谱数据中提取与特定成分含量相关的信息仍具有一定难度。
因此,研发一种新的无损检测黄冠梨果磷含量的方法及装置非常有必要。
发明内容
本申请提供一种无损检测黄冠梨果磷含量的方法及装置,以提高黄冠梨果磷含量检测的准确性和可靠性。
本申请提供一种无损检测黄冠梨果磷含量的方法,包括:
对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据;
对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据;
使用偏最小二乘回归算法和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量全波段预测模型中确定最优磷含量全波段预测模型;
使用遗传算法并利用所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,并基于所述特征波长重新使用偏最小二乘回归算法建立预测模型;
使用建立的预测模型,对黄冠梨果进行磷含量的无损预测。
更进一步地,所述对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据,包括:
以目标黄冠梨果的赤道为主轴,均匀选取三个短轴4.5cm、长轴7cm的椭圆形区域,并在所述椭圆形区域均匀选取5个采集点;
在所述椭圆形区域进行扫描,获得所述椭圆形区域的采集点上近红外光谱数据。
更进一步地,所述对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据,包括:
对目标黄冠梨果的彩色图像应用Gabor滤波器以提取表面纹理特征;
对目标黄冠梨果的彩色图像应用颜色直方图分析以获取黄冠梨果皮肤的色彩特征,并与提取的表面纹理特征合并为一个综合特征向量;
对所述综合特征向量使用基于卷积神经网络的分类器进行处理,确定最适合进行近红外扫描的黄冠梨果表面区域坐标,其中,所述分类器经过训练以识别黄冠梨果表面的形态;
根据最适合进行近红外扫描的黄冠梨果表面区域坐标,确定扫描区域;
在所述扫描区域进行扫描,获得目标黄冠梨果的近红外光谱数据。
更进一步地,对所述综合特征向量使用基于卷积神经网络的分类器进行处理,确定最适合进行近红外扫描的黄冠梨果表面区域坐标,包括:
对所述综合特征向量使用基于卷积神经网络的分类器进行处理,获得黄冠梨果表面区域的形态标签;
对目标黄冠梨果的彩色图像中黄冠梨果表面区域进行高斯滤波,并将高斯滤波后的像素值的方差确定为表面光滑度指标;
计算目标黄冠梨果的彩色图像中黄冠梨果表面区域内像素亮度的标准差,将所述标准差确定为光照均匀性指标;
根据所述形态标签、表面光滑度指标以及光照均匀性指标,确定最适合进行近红外扫描的黄冠梨果表面区域坐标。
更进一步地,所述对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据,包括:
选用一组具有已知磷含量的黄冠梨果样本作为标定集,并在标定集上执行多元线性回归分析,以确定与黄冠梨果磷含量密切相关的光谱波段,其中多元线性回归的参数包括学习率和迭代次数,基于交叉验证来确定;
对确定的与黄冠梨果磷含量密切相关的光谱波段获取的光谱数据进行主成分分析,并在主成分分析期间引入一个由每个主成分与磷含量的皮尔逊相关系数计算得出的磷含量敏感性权重系数,用于加权主成分分析的结果;
基于主成分分析获得的第一主成分的标准差或方差,建立第一主成分的波动阈值,以动态识别高频噪声的阈值;
根据主成分分析的结果,使用一个低通滤波器对识别出来的高频噪声进行噪声削减。
更进一步地,所述使用偏最小二乘回归和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量预测模型中确定最优磷含量全波段预测模型,包括:
(a)选择一种多目标优化算法,包括非支配排序遗传算法II或多目标粒子群优化算法;
(b)设置多维度评价准则,该准则包括:决定系数,用于评估模型的拟合度;残差预测偏差,用于评估模型的预测精度;模型复杂度,用于量化模型的计算需求;以及计算成本,用于量化模型训练和应用所需的时间和硬件资源;
(c)利用所述多目标优化算法,随机生成一组初始解,每一个初始解都是一个超参数组合;
(d)对于每一个解,分别使用偏最小二乘回归算法和梯度提升回归树算法进行模型训练,并计算多维度评价准则;
(e)根据多维度评价准则,对解进行排序和选择;
(f)对选择出来的解进行交叉、变异操作,生成新的解;
重复步骤d-f,直至满足预设的终止条件;
根据满足预设的终止条件时的解,确定最优磷含量全波段预测模型。
更进一步地,所述使用遗传算法,并根据所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,包括:
初始化遗传算法的种群大小为50,每个染色体表示一组由10个特征波长组成的波长集合;
设定交叉概率为0.8和突变概率为0.2;
利用决定系数评估每个染色体的适应度;
执行选择、交叉和突变操作,并持续进行这一过程直至满足预定的停止条件;
从适应度最高的个体中提取出特征波长,并基于这些特征波长重新使用偏最小二乘回归算法建立预测模型。
更进一步地,所述使用遗传算法,并根据所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,还包括:
引入多种群协同进化遗传算法进行并行搜索,该算法通过多个相互协作的种群分别负责光谱数据的特定频段,每个种群专注于找出该频段中对磷含量预测最有贡献的特征波长;
在该多种群协同进化遗传算法中,执行种群划分,将预定的全波段范围划分为至少两个种群,每个种群负责一个子频段;
为每个种群设计针对性的适应度函数和操作符,并在各自负责的频段内进行局部特征波长搜索;
在每一代的结束后,各种群之间进行信息交流,不仅交换各自找到的最优特征波长,还分享相应的权重或评分信息,以便其他种群使用这些数据来更新其自身的搜索空间或评价函数。
更进一步地,所述使用建立的预测模型,对黄冠梨果进行磷含量的无损预测,还包括使用动态权重调整机制,该动态权重调整用于动态优化预测模型中特征波长的权重,以适应黄冠梨果在不同生长阶段磷含量的变化;该动态权重调整机制基于实时样本数据,并启动于新样本数据被收集之后,具体步骤如下:
收集黄冠梨果在不同生长阶段的初始训练数据集,包括光谱数据和相应的磷含量,然后使用这些数据进行预测模型的初步训练;
在每次新的实时样本数据被收集后,将新样本数据与旧的训练数据进行比较,用于计算特征波长在新数据和旧数据中的相对重要性,该相对重要性可通过信息增益、特征重要度或其他基于机器学习的特征选择方法来确定;
根据每一个特征波长的相对重要性,动态地调整预测模型中该特征波长的权重。
本身请提供一种无损检测黄冠梨果磷含量的装置,包括:
扫描单元,用于对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据;
处理单元,用于对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据;
确定单元,用于使用偏最小二乘回归算法和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量预测模型中确定最优磷含量全波段预测模型;
筛选单元,用于使用遗传算法并利用所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,并基于所述特征波长重新使用偏最小二乘回归算法建立预测模型;
预测单元,用于使用建立的预测模型,对黄冠梨果进行磷含量的无损预测。
本申请带来的有益技术效果包括:(1)本申请采用近红外光谱技术进行无损检测,避免了传统化学分析方法对样品造成的损坏,因此更适用于实地、实时的检测需求。(2)本申请通过结合偏最小二乘回归算法和梯度提升回归树算法建立磷含量预测模型,充分利用了这两种算法在处理复杂数据结构方面的优势,从而提高了预测的准确性。(3)本申请引入了决定系数和残差预测偏差作为评价标准,有效地从多个预测模型中筛选出最优模型,进一步提高了预测的可靠性。(4)通过使用遗传算法,本申请能够从全波段光谱数据中筛选出与磷含量高度相关的特征波长,进一步优化了预测模型,降低了计算复杂度,提高了实用性。
附图说明
图1是本申请第一实施例提供的一种基无损检测黄冠梨果磷含量的方法的流程图。
图2是本申请第二实施例提供的一种无损检测黄冠梨果磷含量的装置的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
本申请第一实施例提供一种无损检测黄冠梨果磷含量的方法。请参看图1,该图为本申请第一实施例的示意图。以下结合图1对本申请第一实施例提供一种无损检测黄冠梨果磷含量的方法进行详细说明。
步骤S101:对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据。
在步骤S101中,目标是对黄冠梨果进行表面扫描以采集近红外光谱数据。这一步是整个无损检测方法的基础,因为它为后续的数据分析和模型建立提供了原始数据。
首先,需要准备一台微型手持光谱仪,这是一种专门用于获取物质光谱数据的设备。此外,也可以使用台式光谱仪,但手持型更便于在现场进行数据采集。
然后,选择需要进行检测的黄冠梨果样品。对于每一个梨果样品,在其表面的三个不同的椭圆形区域进行扫描。在每个椭圆形区域内,可以均匀地选取5个点进行扫描,这样总共会有15个扫描点。这样的设计有助于提高数据的代表性和准确性。为进一步准确反映梨果实矿质元素含量,以黄冠梨果的赤道为主轴,均匀选取三个短轴4.5cm、长轴7cm的椭圆形区域,在每个椭圆形区域内均匀选取5个采集点。
进行扫描的具体操作方式通常依赖于光谱仪的使用指南。一般来说,需要将光谱仪的扫描头放置在选定的点上,然后按照设备的操作指南进行扫描。每一次扫描通常会持续几秒钟,并会自动保存光谱数据。
在采集过程中,需要确保光谱仪的校准和环境因素(如温度、湿度等)的稳定性,以减少可能的误差。
完成扫描后,将获得一系列近红外光谱数据。这些数据通常是以波长为横坐标,光强(或其他相关单位)为纵坐标的图表形式呈现。这些原始的近红外光谱数据是后续步骤中数据预处理、模型建立和磷含量预测的基础。
更进一步地,所述对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据,包括:
对目标黄冠梨果的彩色图像应用Gabor滤波器以提取表面纹理特征;
对目标黄冠梨果的彩色图像应用颜色直方图分析以获取黄冠梨果皮肤的色彩特征,并与提取的表面纹理特征合并为一个综合特征向量;
对所述综合特征向量使用基于卷积神经网络的分类器进行处理,确定最适合进行近红外扫描的黄冠梨果表面区域坐标,其中,所述分类器专门经过训练以识别黄冠梨果表面的形态;
根据最适合进行近红外扫描的黄冠梨果表面区域坐标,确定扫描区域;
在所述扫描区域进行扫描,获得目标黄冠梨果的近红外光谱数据。
更进一步地,对所述综合特征向量使用基于卷积神经网络的分类器进行处理,确定最适合进行近红外扫描的黄冠梨果表面区域坐标,包括:
对所述综合特征向量使用基于卷积神经网络的分类器进行处理,获得黄冠梨果表面区域的形态标签;
对目标黄冠梨果的彩色图像中黄冠梨果表面区域进行高斯滤波,并将高斯滤波后的像素值的方差确定为表面光滑度指标;
计算目标黄冠梨果的彩色图像中黄冠梨果表面区域内像素亮度的标准差,将所述标准差确定为光照均匀性指标;
根据所述形态标签、表面光滑度指标以及光照均匀性指标,确定最适合进行近红外扫描的黄冠梨果表面区域坐标。
本实施例提供了一种黄冠梨果区域选择算法,专门用来选择最适合进行近红外扫描的黄冠梨果表面区域。该算法首先将黄冠梨果划分为多个表面区域,然后对于每一个表面区域进行图像处理,然后经过计算和比较,获得最适合进行近红外扫描的黄冠梨果表面区域。
算法流程:
输入:目标黄冠梨果的彩色图像
输出:最适合近红外扫描的黄冠梨果表面区域坐标。
在特征提取阶段执行如下步骤:
(1)对输入的黄冠梨果图像中每个表面区域应用Gabor滤波器以提取表面纹理特征。Gabor滤波器是一个有效的工具。这种滤波器尤其适用于纹理分析,因为它能够在多个方向和尺度上捕捉图像特征。以下是具体实施步骤:
首先,对输入的彩色黄冠梨果图像进行灰度化,因为Gabor滤波器通常应用于灰度图像。Gabor滤波器由多个参数定义,包括波长、方向、相位偏移等。为这些参数设置一系列值,以在多个方向和尺度上进行特征提取。使用所选择的Gabor滤波器参数在黄冠梨果图像的每个表面区域上执行卷积操作。这会生成一系列Gabor响应图,每个图都捕捉了图像在某一特定方向和尺度上的纹理信息。从每个Gabor响应图中提取统计量(如平均值、标准差等)作为纹理特征。
(2)对输入的黄冠梨果图像中每个表面区域使用颜色直方图分析以获取黄冠梨果皮肤的色彩特征。
获取高分辨率的黄冠梨果彩色图像作为输入。根据目标应用,选择图像中的感兴趣区域(Region of Interest,ROI),即黄冠梨果的皮肤区域。根据应用需求,选择合适的颜色空间。常见的颜色空间有RGB、HSV、CIELAB等。不同的颜色空间可能更适合捕捉不同类型的色彩信息。将选定的ROI从原始颜色空间转换到目标颜色空间。
在目标颜色空间中,将不同的颜色通道(如R、G、B或H、S、V等)分离出来。对每个颜色通道计算颜色直方图。直方图的x轴表示可能的颜色值(例如,在RGB空间中,每个通道可能的值从0到255),y轴表示每个颜色值在选定区域中出现的频次。
从每个颜色通道的直方图中计算统计特征,例如平均值、中位数、标准差、偏度、峰度等。将以上统计量组合成一个特征向量,做为黄冠梨果皮肤的色彩特征,用于后续的分析或分类任务。
(3)将表面纹理特征和色彩特征合并为一个特征向量。
由于纹理和色彩特征可能处在不同的数值范围,对两者进行标准化是很重要的。常用的标准化方法包括Z-score标准化和Min-Max标准化。将标准化后的表面纹理特征向量和色彩特征向量进行拼接,获得合并后的特征向量。
对合并的特征向量应用一种基于卷积神经网络(CNN)的分类器,该分类器经过专门训练以识别黄冠梨果表面不同区域的形态。
首先,确保已经拥有一个包含黄冠梨果不同表面区域的合并特征向量的数据集。每个特征向量应该包括从黄冠梨果图像中提取的表面纹理和色彩特征。
对于数据集中的每一个特征向量,都应有一个相应的标签,用于表示相应区域的形态(例如,平滑、凹凸等)。
将整个数据集划分为训练集、验证集和测试集。比例可以根据需求进行调整,但常见的划分比例是70%(训练)、15%(验证)和15%(测试)。
CNN模型设计包括:
输入层:输入层的节点数量应与合并特征向量的维度相匹配。
卷积层:设计一个或多个卷积层,以捕获特征之间的局部关联性。通常,使用3x3或5x5的卷积核。
激活函数:在每个卷积层后添加激活函数,通常使用ReLU(Rectified LinearUnit)。
池化层:在卷积层后可选地添加池化层,以降低模型的复杂性和计算量。通常,使用最大池化或平均池化。
全连接层:在网络的末端添加一个或多个全连接层。全连接层的节点数可以根据需求进行设置。
输出层:输出层的节点数量应与要分类的黄冠梨果表面区域形态的数量相匹配。通常使用Softmax函数作为激活函数。
使用交叉熵作为损失函数,选择一种适当的优化算法(例如,Adam、SGD等)。
训练与评估:
模型训练:使用训练集对模型进行训练。在每个训练周期(epoch)结束后,使用验证集评估模型性能。
模型调优:根据验证集的表现进行模型调优,例如通过改变学习率、添加dropout层或早停等。
模型评估:最后,使用测试集进行最终评估,以确认模型的准确性和泛化能力。
使用得到的形态标签(如“平滑”、“凹凸”等)为每个表面区域进行标记。
为每个被标记的区域分配一个“扫描适性得分”,该得分由以下几个因素综合计算:形态标签、表面平滑度、光照均匀性等。
在CNN网络处理以后,每个黄冠梨果表面区域将获得一个形态标签,例如“平滑”或“凹凸”。将这些标签转化为数值,例如,将“平滑”转化为1,将“凹凸”转化为0。
通过图像处理技术,例如高斯滤波,评估每个区域的表面平滑度。平滑度可以用高斯滤波后的像素值的方差来量化。光照均匀性可以通过计算区域内像素亮度的标准差来评估。较小的标准差表示更均匀的光照。
在获取以上各项因素的数值后,进行加权求和来得到每个区域的“扫描适性得分”
找到得分最高的表面区域,并输出其坐标作为最适合近红外扫描的区域。
通过这样的操作,步骤S101可以为后续的数据处理和分析提供了必要的输入。
步骤S102:对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据。
在步骤S102中,目标是对从步骤S101中采集的近红外光谱数据进行预处理,以获得预处理后的全波段光谱数据。这个步骤是至关重要的,因为光谱数据通常包含各种噪声和干扰因素,这些需要通过预处理方法进行校正或去除,以提高后续模型建立和预测的准确性。
首先,将步骤S101中获取的原始光谱数据导入到适当的数据分析软件中,例如MATLAB、Python的SciPy库或专用的光谱分析软件。一旦数据导入成功,就可以开始进行预处理。
预处理的具体方法可以包括但不限于以下几种:
傅里叶衍生(Fourier Derivative,简称FD):这种方法用于去除基线漂移,使得光谱数据更加集中在特定的特征波段上。
标准正态变量(Standard Normal Variate,简称SNV):这是一种用于去除散射效应和光源不均匀性的方法。
Savitzky-Golay(SG)平滑:用于减少高频噪声。
其他方法,如最小二乘法、多元散射校正(MSC)等。
例如,如果选择使用Savitzky-Golay(SG)平滑,具体的操作步骤可能是在MATLAB中调用savitzkyGolayFilt函数,或在Python中使用scipy.signal.savgol_filter。这些函数通常需要你指定窗口大小和多项式阶数作为参数。
完成预处理后,将获得一组预处理后的全波段光谱数据。这些数据应该更加准确地反映了黄冠梨果的磷含量,因此更适合用于后续的模型建立和预测。
需要注意的是,预处理的选择和参数设置应当根据具体的应用场景和需求来定。有时,可能需要尝试多种预处理方法并进行比较,以确定哪一种方法最适用于特定的数据集。
所述对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据,包括:
选用一组具有已知磷含量的黄冠梨果样本作为标定集,并在标定集上执行多元线性回归分析,以确定与黄冠梨果磷含量密切相关的光谱波段,其中多元线性回归的参数包括学习率和迭代次数,基于交叉验证来确定;
对从所确定的与黄冠梨果磷含量密切相关的光谱波段获取的光谱数据进行主成分分析,并在主成分分析期间引入一个由每个主成分与磷含量的皮尔逊相关系数计算得出的磷含量敏感性权重系数,用于加权主成分分析的结果;
基于主成分分析获得的第一主成分的标准差或方差,建立第一主成分的波动阈值,以动态识别高频噪声的阈值;
根据主成分分析的结果,使用一个低通滤波器对识别出来的高频噪声进行噪声削减。
本实施例提供一种自适应噪声削减算法,该算法结合波动阈值和主成分分析(PCA)来动态识别和削减高频噪声成分。具体地,该算法首先使用PCA对原始光谱数据进行降维,并根据第一主成分的波动阈值动态确定高频噪声的界限。一旦识别出高频噪声,该算法会使用一个经过优化的低通滤波器进行噪声削减。该低通滤波器的参数会根据PCA结果进行自适应调整,以最大化削减噪声同时保留有用的光谱信息。
在进行黄冠梨果磷含量检测的前期准备阶段,自适应噪声削减算法首先会选用一个由多个已知磷含量的黄冠梨果样本组成的集合。通过这些样本,算法进行特性标定。具体而言,使用多元线性回归来找出与黄冠梨果磷含量密切相关的光谱波段。在这一阶段,多元线性回归的具体参数设置,例如学习率和迭代次数,会基于交叉验证来确定。同时,数据预处理如归一化或标准化也会在这一阶段进行。在特性标定的阶段,对于多元线性回归的参数设置,通常可以使用库函数的默认参数,如scikit-learn中的LinearRegression。但如果需要优化,可以考虑使用L1或L2正则化,并通过交叉验证来调整正则化系数。数据预处理通常会涉及Z-score标准化或MinMax归一化,以减小不同光谱波段的尺度差异。
标定完成后,算法进入主成分分析(PCA)阶段,对这些与黄冠梨果磷含量密切相关的光谱波段的原始光谱数据进行降维处理。在这一步,一个特殊的磷含量敏感性权重系数被引入。这个权重系数是是通过计算每一个主成分与磷含量的皮尔逊相关系数来获得的。
接下来,算法会根据第一主成分的波动阈值来动态识别出高频噪声的界限。在确定高频噪声的波动阈值时,该阈值通常是基于第一主成分的标准差或方差来动态设置的。一种有效的方式是使用滑动窗口来计算近期内的标准差,然后将这个值乘以一个经验系数(如0.5或1),作为高频噪声的阈值。高频噪声的阈值确定后,下面就使用低通滤波器对于确定的高频噪声进行处理。
算法会利用一个经过优化的低通滤波器来进行噪声削减。这个低通滤波器的参数设置会根据前面PCA阶段的结果进行自适应调整,具体来说,可能会动态地改变滤波器的截止频率和类型,例如使用巴特沃斯、切比雪夫或其他类型的滤波器。
除此之外,该低通滤波器还会参考一个预先建立的黄冠梨果磷含量与光谱数据关系模型进行进一步优化。这个模型的构建方法和验证过程是基于支持向量机、随机森林或其他适用的机器学习算法,具体选择哪一种模型会依据模型的预测准确度和复杂度来决定。
如下是该算法的Python参考实现代码:
import numpy as np
from sklearn.decomposition import PCA
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import cross_val_score
from scipy.signal import butter,filtfilt
#低通滤波函数
def low_pass_filter(data,cutoff_freq,sample_rate):
b,a=butter(6,cutoff_freq/(0.5*sample_rate),btype='low')
return filtfilt(b,a,data)
#加载已知黄冠梨样本的磷含量和光谱数据
known_samples=np.load("known_samples.npy")#形状:(样本数量,特征数量)
known_phosphorus=np.load("known_phosphorus.npy")#形状:(样本数量,)
#第一步:使用多元线性回归进行特性标定
cross_val=cross_val_score(LinearRegression(),known_samples,known_phosphorus,cv=5)
best_param={"fit_intercept":True}#基于交叉验证选择最佳参数
regressor=LinearRegression(**best_param)
regressor.fit(known_samples,known_phosphorus)
#基于回归结果,仅使用相关的光谱波段(特征)
important_features=[i for i,coef in enumerate(regressor.coef_)if abs(coef)>0.1]#示例条件
reduced_samples=known_samples[:,important_features]
#第二步:使用PCA进行降维处理
pca=PCA(n_components=10)#成分数量可根据解释方差来选择
pca_result=pca.fit_transform(reduced_samples)
#计算磷含量敏感性的皮尔逊相关系数
correlation_matrix=np.corrcoef(pca_result.T,known_phosphorus)
sensitivity_weights=correlation_matrix[:-1,-1]#提取与磷含量相关的系数
#第三步:动态高频噪声阈值设置
std_first_component=np.std(pca_result[:,0])#使用第一个主成分
dynamic_threshold=std_first_component*0.5#示例系数
#根据阈值识别高频噪声
high_freq_noise_indices=np.where(np.abs(pca_result[:,0])>dynamic_threshold)
#第四步:使用低通滤波器进行噪声削减
optimized_cutoff_frequency=1.0#示例,这个参数可以根据PCA和sensitivity_weights动态调整
#应用低通滤波
filtered_data=low_pass_filter(pca_result[:,0],optimized_cutoff_frequency,sample_rate=10.0)#示例采样率
#最终步骤:使用预先建立的模型(可以是SVM、随机森林等)进行进一步优化
#这部分在此示例代码中未展示,但通常会在最后,使用过滤和优化后的数据进行进一步的预测或调整。
#输出过滤和优化后的数据,用于黄冠梨磷含量的预测
print("过滤和优化后的黄冠梨磷含量数据:",filtered_data)
可见,整个算法不仅综合考虑了黄冠梨果的磷含量特性和光谱数据的复杂性,还通过动态阈值设置、磷含量敏感性权重和目标导向的低通滤波等多个环节,实现了对高频噪声的高效削减和对有用信息的最大程度保留。这使得该算法非常适用于高度准确和可靠的黄冠梨果磷含量无损检测。
综上所述,该自适应噪声削减算法在从特性标定开始,到最后实现高频噪声的削减,每一步都经过了优化。
通过这一步骤,步骤S102可以为后续的模型建立和磷含量预测提供了更为准确和可靠的数据输入。这一步骤同样需要精细的操作和调试,以确保最终结果的有效性。
步骤S103:使用偏最小二乘回归和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量全波段预测模型中确定最优磷含量全波段预测模型。
在步骤S103中,使用偏最小二乘回归(PLSR)和梯度提升回归树(GBRT)算法来基于预处理后的全波段光谱数据建立磷含量全波段预测模型。此外,该步骤还包括通过决定系数(R2)和残差预测偏差(RPD)来从所述磷含量预测模型中确定最优磷含量全波段预测模型。
首先,将步骤S102获得的预处理后的全波段光谱数据与对应的黄冠梨果的磷含量数据合并,形成一个完整的数据集。这个数据集将被用作模型建立的基础。
接着,使用偏最小二乘回归(PLSR)算法进行第一个模型的建立。在实现时,可以利用如MATLAB的plsregress函数或Python的sklearn.cross_decomposition.PLSRegression模块。通常,这些工具会要求输入X(预处理后的全波段光谱数据)和Y(磷含量数据),并可能需要设定一些额外的参数,如主成分的数量。算法运行完成后,会输出一个PLSR模型。
然后,使用梯度提升回归树(GBRT)算法进行第二个模型的建立。可以使用像Python的sklearn.ensemble.GradientBoostingRegressor模块来实现这一算法。与PLSR类似,输入数据为X和Y,并根据需要设定其他参数,如树的数量、深度等。
完成以上两个模型的建立后,需要用决定系数(R2)和残差预测偏差(RPD)对它们进行评价。这通常通过将数据集分为训练集和测试集,然后比较模型对测试集的预测结果与实际值之间的差异来完成。决定系数(R2)越接近1和残差预测偏差(RPD)越大,模型就越准确。
通过这样的评价方法,可以从PLSR和GBRT模型中选出表现最优的模型作为最优磷含量全波段预测模型。例如,如果PLSR模型的R2和RPD指标都较高,那么就选择这个模型作为最优模型。
更进一步地,所述使用偏最小二乘回归和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量预测模型中确定最优磷含量全波段预测模型,包括:
(a)选择一种多目标优化算法,包括非支配排序遗传算法II或多目标粒子群优化算法;
在这一步中,需要选择一个适用于多目标优化的算法框架。这里给出了两个具体的算法选择:非支配排序遗传算法II(NSGA-II)和多目标粒子群优化算法(MOPSO)。
如果选择NSGA-II,可能需要设置种群大小、交叉概率、变异概率等参数。在MOPSO中,可能需要考虑粒子的数量、速度更新规则等。在选择多目标优化算法时,如果您选择非支配排序遗传算法II(NSGA-II),建议设置种群大小为50到100,交叉概率通常设置在0.6到0.9之间,变异概率在0.1到0.5之间。对于多目标粒子群优化算法(MOPSO),建议的粒子数量范围是30到70,速度更新规则可以使用局部最优和全局最优的加权平均。
(b)设置多维度评价准则,该准则包括:决定系数,用于评估模型的拟合度;残差预测偏差,用于评估模型的预测精度;模型复杂度,用于量化模型的计算需求;以及计算成本,用于量化模型训练和应用所需的时间和硬件资源;
在选择了优化算法后,需要确定用于评估模型性能的多维度评价准则。这里涉及到几个关键的准则:
决定系数(R2):用于衡量模型拟合的好坏。一个接近1的R2值通常意味着模型拟合度高。
残差预测偏差(RPD):主要用于评估模型预测的准确性。
模型复杂度:可以使用模型中参数的数量或算法的时间复杂度来量化。
计算成本:可以使用模型训练所需的时间(以秒或分钟为单位)和硬件资源(如CPU或GPU使用率)来量化。
(c)利用所述多目标优化算法,随机生成一组初始解,每一个初始解都是一个超参数组合;
在设置了评价准则和选择了优化算法后,下一步是生成一组初始解,这些解基本上是一组超参数的组合。
例如,在PLS算法中,一个初始解可能包括组件数量为5,正则化参数为0.1;而在GBRT中,初始解可能是学习率0.1、树深度3和叶节点最小样本数5。
(d)对于每一个解,分别使用偏最小二乘回归算法和梯度提升回归树算法进行模型训练,并计算多维度评价准则;
这一步要对每一个解进行模型训练,并使用先前设置的多维度评价准则进行评估。
例子:如果一个解的PLS模型在测试数据上的R2值为0.9,RPD值为2.5,则这个解的性能可能被认为是相对较好的。
(e)根据多维度评价准则,对解进行排序和选择;
根据多维度评价准则,对所有的解进行排序和筛选。
例如,如果使用的是NSGA-II,这一步通常会涉及到解的非支配排序,根据排序结果选择表现最好的解作为下一代的“父解”。
(f)选择出来的解通过交叉、变异生成新的解;
选择出的优秀解将通过遗传算法操作(如交叉和变异)来产生新的解。
例如,在NSGA-II中,可能使用某种交叉策略(如单点交叉)和变异策略(如高斯变异)来生成新解。
重复步骤d-f,直至满足预设的终止条件;
根据满足预设的终止条件时的解,确定最优磷含量全波段预测模型。
以上过程(从d到f)会持续迭代,直到满足预设的终止条件。终止条件可以是最大迭代次数或某一多维度评价准则达到预定的阈值。满足终止条件后,根据最后一组解确定最优的磷含量全波段预测模型。
例如,可能设置最大迭代次数为100,或者决定当R2值达到0.95时终止优化过程。
通过以上精确的步骤设计和相互关联的逻辑,该方法能够全面而准确地进行模型超参数的优化,从而实现黄冠梨果磷含量的高准确度预测。
这样,步骤S103就可以为后续的特征波长提取和磷含量无损预测提供了强有力的算法支持。这一步骤需要仔细的参数调整和模型评价,以确保得到的最优模型具有高度的准确性和可靠性。
步骤S104:使用遗传算法,并根据所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,并基于所述特征波长重新使用偏最小二乘回归算法建立预测模型。
在步骤S104中,目标是通过遗传算法,从步骤S103确定的最优磷含量全波段预测模型中提取出有用的特征波长。然后,利用这些特征波长通过偏最小二乘回归(PLSR)建立一个更精简和高效的预测模型。
首先,初始化遗传算法。设定种群大小为50,这意味着有50个个体(或染色体)参与优化过程。每个染色体表示一组特征波长,设定为10个。交叉概率设置为0.8,突变概率设置为0.2。所有这些参数的设置都可以基于先前的研究或者经验。
创建初始种群之后,需要评估每个个体的适应度。在这个场景中,适应度是用最优磷含量全波段预测模型的决定系数(R2)来量化的。高决定系数意味着该染色体选取的特征波长更有助于磷含量的准确预测。
适应度评估完成后,开始遗传算法的主循环。在每一代,进行三个主要的遗传操作:选择、交叉和突变。
选择过程通常使用“轮盘赌”或“锦标赛选择”方法,以更高几率选择适应度较高的个体。具体来说,如果使用轮盘赌,那么每个个体被选中的概率与其适应度值成正比。
交叉操作主要包括随机选择两个个体并进行单点或多点交叉。假设使用单点交叉,在第5位进行交叉,这就意味着从两个父染色体第5位之前的部分交换以生成两个新的子染色体。
突变操作通常在某个个体的某些特征波长上进行小范围的随机改变,以增加种群的多样性。这里,可以随机选择一个波长并用另一个随机波长来替换。
每一代结束后,所有个体的适应度需要重新评估。如果某个个体的适应度超过之前最好的记录,则更新最优个体。
这一过程将持续进行,直到满足预定的停止条件,比如达到最大的代数100或者某个适应度阈值。
遗传算法完成后,从适应度最高的个体中提取出10个特征波长。然后,这些特征波长和磷含量数据一起作为输入和输出,应用偏最小二乘回归(PLSR)方法来建立新的预测模型。
更进一步地,所述使用遗传算法,并根据所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,还包括:
引入多种群协同进化遗传算法进行并行搜索,该算法通过多个相互协作的种群分别负责光谱数据的特定频段,每个种群专注于找出该频段中对磷含量预测最有贡献的特征波长;
在该多种群协同进化遗传算法中,执行种群划分,将预定的全波段范围划分为至少两个种群,每个种群负责一个子频段;
为每个种群设计针对性的适应度函数和操作符,并在各自负责的频段内进行局部特征波长搜索;
在每一代的结束后,各种群之间进行信息交流,不仅交换各自找到的最优特征波长,还分享相应的权重或评分信息,以便其他种群使用这些数据来更新其自身的搜索空间或评价函数。
步骤S104中,一个特殊类型的遗传算法变体——多种群协同进化遗传算法(MPCoEGA)被引入到过程中。这种算法与传统的遗传算法有所不同,主要体现在它采用多个相互协作的种群(population)进行并行搜索。每个种群专注于光谱数据中一个特定的频段,并致力于找出该频段中对磷含量预测最有贡献的特征波长。
种群划分:在这个例子中,假设全波段的范围是400-800nm。这个范围被划分为四个种群,分别负责400-500nm、500-600nm、600-700nm和700-800nm。这种划分策略可以根据实际应用需求进行调整。
每个种群都运用遗传算法在其责任范围内进行局部搜索。这不是一个简单的遗传算法应用,而是针对性地设计了适应度函数和操作符来优化在各自频段内的特征波长搜索。
交流策略:每个种群在每一代的结束后会与其他种群进行信息交流。这不仅仅是将最优解进行简单交换,而是一个更为复杂和精细的交流过程。
具体操作:每个种群都将其找到的最优特征波长和相应的权重或评分信息发送给其他种群。这样,收到信息的种群可以使用这些数据来更新其自身的搜索空间或评价函数。
通过种群间的信息交流和局部-全局的结合搜索策略,MPCoEGA能够在全波段范围内进行更高效的全局优化。
实际应用示例:假设在一次迭代后,种群1在400-500nm的范围内找到了一个优秀的特征波长。这个信息随后被发送给种群2、3和4。在收到这一信息后,这些种群可能会对其评价函数进行调整,以便在接下来的搜索中更重视与种群1中找到的特征波长有潜在协同效应的特征波长。
这种协同机制不仅加速了特征波长的找寻,还能有效地提高全局搜索能力。这是在传统单一种群的遗传算法中难以实现的。
通过这一系列精细的操作,步骤S104成功地从最优的磷含量全波段预测模型中提取了最有用的特征波长,并基于这些波长创建了一个更为精简和高效的预测模型。
步骤S105:使用建立的预测模型,对黄冠梨果进行磷含量的无损预测。
步骤S105的核心任务是应用由步骤S104生成的预测模型,对黄冠梨果进行磷含量的无损预测。在这一步,已经有了一个精简而高效的预测模型,该模型是基于偏最小二乘回归(PLSR)算法和特定特征波长构建的。
首先,需要获取待预测黄冠梨果的近红外光谱数据。这通常可以通过同样在步骤S101使用的表面扫描装置来实现。确保光谱数据的采集条件(例如,测量距离、光源强度等)与建模时使用的数据采集条件一致,以保证模型的准确性。
接着,用在步骤S102中确定的预处理方法,对新采集的近红外光谱数据进行预处理。这可能包括去噪、平滑、归一化等操作。
预处理完成后,将这些数据筛选到步骤S104中确定的特征波长。具体来说,如果步骤S104确定的特征波长是700nm、800nm、900nm等,那么应从预处理后的全波段光谱数据中提取这几个特定波长的光谱强度。
随后,这些特定波长的光谱强度数据作为偏最小二乘回归(PLSR)预测模型的输入。这里,预测模型已经在步骤S104中建立并优化,包括所有必要的模型参数,如载荷矩阵和偏置项。
执行模型预测后,输出即为该黄冠梨果的磷含量预测值。
更进一步地,所述使用建立的预测模型,对黄冠梨果进行磷含量的无损预测,还包括使用动态权重调整机制,该动态权重调整用于动态优化预测模型中特征波长的权重,以适应黄冠梨果在不同生长阶段磷含量的变化;该动态权重调整机制基于实时样本数据,并启动于新样本数据被收集之后,具体步骤如下:
收集黄冠梨果在不同生长阶段的初始训练数据集,包括光谱数据和相应的磷含量,然后使用这些数据进行预测模型的初步训练;
在每次新的实时样本数据被收集后,将新样本数据与旧的训练数据进行比较,用于计算特征波长在新数据和旧数据中的相对重要性,该相对重要性可通过信息增益、特征重要度或其他基于机器学习的特征选择方法来确定;
根据各特征波长的相对重要性,动态地调整预测模型中这些特征波长的权重。
本实施例还引入了一个特殊的动态权重调整机制,它是专门设计来动态优化特征波长权重的。这个机制是为了适应黄冠梨果在不同生长阶段磷含量的变化。与传统的静态权重分配方法不同,这里采用一种基于实时样本数据的权重动态调整,确保预测模型能够在各个生长阶段都具有较高的准确性。
具体来说,首先收集一个初始的训练数据集,该数据集包括黄冠梨果在各个生长阶段的光谱数据和对应的磷含量。接着,利用这些数据进行初步的模型训练。每当新的实时样本数据被收集,动态权重调整机制就会启动。
动态权重调整机制的核心思想是将新收集的样本数据和旧的训练数据进行对比,计算各特征波长在新数据和旧数据中的相对重要性。这个相对重要性可以通过一系列数学公式来计算,比如信息增益、特征重要度或者其他基于机器学习的特征选择方法。
在确定了各特征波长的相对重要性后,可以动态地调整它们在预测模型中的权重。具体地,如果某个特征波长在新收集的样本中显示出更高的相关性或者更大的信息增益,那么该特征波长的权重将会被相应地提高。相反,如果某个特征波长在新样本中的表现较差,其权重将会被降低。
这样的动态权重调整可以在模型更新周期内进行,比如每当收集到一定数量的新样本,或者在特定的时间间隔后,都会触发一次动态权重调整。这不仅使得模型能够适应黄冠梨果在不同生长阶段的磷含量变化,而且还大大提高了模型的预测准确性和鲁棒性。
值得注意的是,这个动态权重调整机制结合了黄冠梨果在不同生长阶段磷含量变化的特点,采用了一种全新的、基于实时样本数据的权重优化策略。
通过这样的动态权重调整机制,不仅能够实时地适应环境和生长条件的变化,还能够在整个生长周期内持续地优化预测模型,从而获得更准确、更可靠的磷含量预测结果。
综上所述,该动态权重调整机制为黄冠梨果在不同生长阶段的磷含量预测提供了一种非常有效的优化手段,确保了预测模型的高准确性和高适应性。
在上述的实施例中,提供了一种无损检测黄冠梨果磷含量的方法,与之相对应的,本申请还提供一种无损检测黄冠梨果磷含量的装置。请参看图2,其为本申请的一种无损检测黄冠梨果磷含量的装置实施例的示意图。由于本实施例,即第二实施例,基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的系统实施例仅仅是示意性的。
本申请第二实施例提供一种无损检测黄冠梨果磷含量的装置,包括:
扫描单元201,用于对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据;
处理单元202,用于对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据;
确定单元203,用于使用偏最小二乘回归算法和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量全波段预测模型中确定最优磷含量全波段预测模型;
筛选单元204,用于使用遗传算法并利用所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,并基于所述特征波长重新使用偏最小二乘回归算法建立预测模型;
预测单元205,用于使用建立的预测模型,对黄冠梨果进行磷含量的无损预测。
本申请第三实施例提供一种电子设备,所述电子设备包括:
处理器;
存储器,用于存储程序,所述程序在被所述处理器读取执行时,执行本申请第一实施例中提供的无损检测黄冠梨果磷含量的方法。
本申请第四实施例提供一种计算机可读取存储介质,其上存储有计算机程序,该程序被处理器执行时,执行本申请第一实施例中提供的无损检测黄冠梨果磷含量的方法。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
Claims (10)
1.一种无损检测黄冠梨果磷含量的方法,其特征在于,包括:
对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据;
对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据;
使用偏最小二乘回归算法和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量全波段预测模型中确定最优磷含量全波段预测模型;
使用遗传算法并利用所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,并基于所述特征波长重新使用偏最小二乘回归算法建立预测模型;
使用建立的预测模型,对黄冠梨果进行磷含量的无损预测。
2.根据权利要求1所述的无损检测黄冠梨果磷含量的方法,其特征在于,所述对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据,包括:
以目标黄冠梨果的赤道为主轴,均匀选取三个短轴4.5cm、长轴7cm的椭圆形区域,并在所述椭圆形区域均匀选取5个采集点;
在所述椭圆形区域进行扫描,获得所述椭圆形区域的采集点上近红外光谱数据。
3.根据权利要求1所述的无损检测黄冠梨果磷含量的方法,其特征在于,所述对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据,包括:
对目标黄冠梨果的彩色图像应用Gabor滤波器以提取表面纹理特征;
对目标黄冠梨果的彩色图像应用颜色直方图分析以获取黄冠梨果皮肤的色彩特征,并与提取的表面纹理特征合并为一个综合特征向量;
对所述综合特征向量使用基于卷积神经网络的分类器进行处理,确定最适合进行近红外扫描的黄冠梨果表面区域坐标,其中,所述分类器经过训练以识别黄冠梨果表面的形态;
根据最适合进行近红外扫描的黄冠梨果表面区域坐标,确定扫描区域;
在所述扫描区域进行扫描,获得目标黄冠梨果的近红外光谱数据。
4.根据权利要求3所述的无损检测黄冠梨果磷含量的方法,其特征在于,对所述综合特征向量使用基于卷积神经网络的分类器进行处理,确定最适合进行近红外扫描的黄冠梨果表面区域坐标,包括:
对所述综合特征向量使用基于卷积神经网络的分类器进行处理,获得黄冠梨果表面区域的形态标签;
对目标黄冠梨果的彩色图像中的黄冠梨果表面区域进行高斯滤波,并将高斯滤波后的像素值的方差确定为表面光滑度指标;
计算目标黄冠梨果的彩色图像中的黄冠梨果表面区域内像素的亮度的标准差,将所述标准差确定为光照均匀性指标;
根据所述形态标签、表面光滑度指标以及光照均匀性指标,确定最适合进行近红外扫描的黄冠梨果表面区域坐标。
5.根据权利要求1所述的无损检测黄冠梨果磷含量的方法,其特征在于,所述对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据,包括:
选用一组具有已知磷含量的黄冠梨果样本作为标定集,并在标定集上执行多元线性回归分析,以确定与黄冠梨果磷含量密切相关的光谱波段,其中多元线性回归的参数包括学习率和迭代次数;
对确定的光谱波段获取的光谱数据进行主成分分析,并在主成分分析期间引入一个由每个主成分与磷含量的皮尔逊相关系数计算得出的磷含量敏感性权重系数,用于加权主成分分析的结果;
基于主成分分析获得的第一主成分的标准差或方差,建立第一主成分的波动阈值,以动态识别高频噪声的阈值;
根据主成分分析的结果,使用一个低通滤波器对高频噪声进行噪声削减。
6.根据权利要求1所述的无损检测黄冠梨果磷含量的方法,其特征在于,所述使用偏最小二乘回归和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量预测模型中确定最优磷含量全波段预测模型,包括:
(a)选择一种多目标优化算法,包括非支配排序遗传算法II或多目标粒子群优化算法;
(b)设置多维度评价准则,该准则包括:决定系数,用于评估模型的拟合度;残差预测偏差,用于评估模型的预测精度;模型复杂度,用于量化模型的计算需求;以及计算成本,用于量化模型训练和应用所需的时间和硬件资源;
(c)利用所述多目标优化算法,随机生成一组初始解,每一个初始解都是一个超参数组合;
(d)对于每一个解,分别使用偏最小二乘回归算法和梯度提升回归树算法进行模型训练,并计算多维度评价准则;
(e)根据多维度评价准则,对解进行排序和选择;
(f)对选择出来的解进行交叉、变异操作,生成新的解;
重复步骤d-f,直至满足预设的终止条件;
根据满足预设的终止条件时的解,确定最优磷含量全波段预测模型。
7.根据权利要求1所述的无损检测黄冠梨果磷含量的方法,其特征在于,所述使用遗传算法,并根据所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,包括:
初始化遗传算法的种群大小为50,每个染色体表示一组由10个特征波长组成的波长集合;
设定交叉概率为0.8和突变概率为0.2;
利用决定系数评估每个染色体的适应度;
执行选择、交叉和突变操作,并持续进行这一过程直至满足预定的停止条件;
从适应度最高的个体中提取出特征波长,并基于这些特征波长重新使用偏最小二乘回归算法建立预测模型。
8.根据权利要求1或7所述的无损检测黄冠梨果磷含量的方法,其特征在于,所述使用遗传算法,并根据所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,还包括:
引入多种群协同进化遗传算法进行并行搜索,该算法通过多个相互协作的种群分别负责光谱数据的特定频段,每个种群专注于找出该频段中对磷含量预测最有贡献的特征波长;
在该多种群协同进化遗传算法中,执行种群划分,将预定的全波段范围划分为至少两个种群,每个种群负责一个子频段;
为每个种群设计针对性的适应度函数和操作符,并在各自负责的频段内进行局部特征波长搜索;
在每一代的结束后,各种群之间进行信息交流,不仅交换各自找到的最优特征波长,还分享相应的权重或评分信息,以便其他种群使用这些数据来更新其自身的搜索空间或评价函数。
9.根据权利要求1所述的无损检测黄冠梨果磷含量的方法,其特征在于,所述使用建立的预测模型,对黄冠梨果进行磷含量的无损预测,还包括使用动态权重调整机制,该动态权重调整用于动态优化预测模型中特征波长的权重,以适应黄冠梨果在不同生长阶段磷含量的变化;该动态权重调整机制基于实时样本数据,并启动于新样本数据被收集之后,具体步骤如下:
收集黄冠梨果在不同生长阶段的初始训练数据集,包括光谱数据和相应的磷含量,然后使用这些数据进行预测模型的初步训练;
在每次新的实时样本数据被收集后,将新样本数据与旧的训练数据进行比较,用于计算特征波长在新数据和旧数据中的相对重要性,该相对重要性可通过信息增益、特征重要度或其他基于机器学习的特征选择方法来确定;
根据每一个特征波长的相对重要性,动态地调整预测模型中该特征波长的权重。
10.一种无损检测黄冠梨果磷含量的装置,其特征在于,包括:
扫描单元,用于对目标黄冠梨果进行表面扫描,获得目标黄冠梨果的近红外光谱数据;
处理单元,用于对所述近红外光谱数据进行预处理,获得预处理后的全波段光谱数据;
确定单元,用于使用偏最小二乘回归算法和梯度提升回归树算法基于预处理后的全波段光谱数据建立磷含量全波段预测模型,并通过决定系数和残差预测偏差从所述磷含量全波段预测模型中确定最优磷含量全波段预测模型;
筛选单元,用于使用遗传算法并利用所述最优磷含量全波段预测模型,从预处理后的全波段光谱数据中筛选出与黄冠梨果磷含量高度相关的特征波长,并基于所述特征波长重新使用偏最小二乘回归算法建立预测模型;
预测单元,用于使用建立的预测模型,对黄冠梨果进行磷含量的无损预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311576573.4A CN117538287A (zh) | 2023-11-20 | 2023-11-20 | 一种无损检测黄冠梨果磷含量的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311576573.4A CN117538287A (zh) | 2023-11-20 | 2023-11-20 | 一种无损检测黄冠梨果磷含量的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117538287A true CN117538287A (zh) | 2024-02-09 |
Family
ID=89789641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311576573.4A Pending CN117538287A (zh) | 2023-11-20 | 2023-11-20 | 一种无损检测黄冠梨果磷含量的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117538287A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118275371A (zh) * | 2024-06-03 | 2024-07-02 | 成都益清源科技有限公司 | 一种基于神经网络模型的全光谱水体指标检测方法 |
-
2023
- 2023-11-20 CN CN202311576573.4A patent/CN117538287A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118275371A (zh) * | 2024-06-03 | 2024-07-02 | 成都益清源科技有限公司 | 一种基于神经网络模型的全光谱水体指标检测方法 |
CN118275371B (zh) * | 2024-06-03 | 2024-08-13 | 成都益清源科技有限公司 | 一种基于神经网络模型的全光谱水体指标检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109493287B (zh) | 一种基于深度学习的定量光谱数据分析处理方法 | |
Kukreja et al. | A Deep Neural Network based disease detection scheme for Citrus fruits | |
CN111968080B (zh) | 一种基于高光谱和深度学习的肥城桃内外品质检测方法 | |
Zhang et al. | Fast prediction of sugar content in Dangshan pear (Pyrus spp.) using hyperspectral imagery data | |
Mendoza et al. | Integrated spectral and image analysis of hyperspectral scattering data for prediction of apple fruit firmness and soluble solids content | |
CN109100323B (zh) | 一种苹果水心病的透射光谱无损定量评价方法 | |
Yogesh et al. | Computer vision based analysis and detection of defects in fruits causes due to nutrients deficiency | |
CN117538287A (zh) | 一种无损检测黄冠梨果磷含量的方法及装置 | |
KR102448123B1 (ko) | 농산물 신선도 예측 방법 및 장치 | |
CN113030001B (zh) | 一种水果糖度检测方法及系统 | |
Pourdarbani et al. | Using metaheuristic algorithms to improve the estimation of acidity in Fuji apples using NIR spectroscopy | |
CN114783538A (zh) | 一种煤炭灰分预测方法及装置 | |
CN116026795A (zh) | 一种基于反射透射光谱的水稻籽粒品质性状无损预测方法 | |
Deulkar et al. | An automated tomato quality grading using clustering based support vector machine | |
Macuácua et al. | Data mining approach for dry bean seeds classification | |
CN118471348A (zh) | 基于人工智能的人体体液光谱分析方法及系统 | |
CN102135496A (zh) | 基于多尺度回归的红外光谱定量分析方法和装置 | |
CN113408616A (zh) | 基于pca-uve-elm的光谱分类方法 | |
Chia et al. | Neural network and extreme gradient boosting in near infrared spectroscopy | |
CN115931773A (zh) | 一种近红外光谱定量分析中的波长选择方法 | |
CN115541531A (zh) | 基于二维相关光谱预测饲料中蛋白质含量的方法 | |
CN112964719B (zh) | 一种基于高光谱的食品果糖检测方法及装置 | |
CN115909324A (zh) | 一种广陈皮陈化年份高光谱鉴别方法及系统 | |
CN114972895A (zh) | 小龙虾品质无损检测方法及装置 | |
Liu et al. | Digital techniques and trends for seed phenotyping using optical sensors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |