CN110264050B - 农产品品质分析方法及分析仪 - Google Patents
农产品品质分析方法及分析仪 Download PDFInfo
- Publication number
- CN110264050B CN110264050B CN201910490896.9A CN201910490896A CN110264050B CN 110264050 B CN110264050 B CN 110264050B CN 201910490896 A CN201910490896 A CN 201910490896A CN 110264050 B CN110264050 B CN 110264050B
- Authority
- CN
- China
- Prior art keywords
- variable
- data
- variables
- sampling
- agricultural product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 92
- 238000005070 sampling Methods 0.000 claims abstract description 76
- 230000003595 spectral effect Effects 0.000 claims abstract description 48
- 238000012937 correction Methods 0.000 claims abstract description 39
- 238000012614 Monte-Carlo sampling Methods 0.000 claims abstract description 35
- 238000012795 verification Methods 0.000 claims abstract description 32
- 238000013178 mathematical model Methods 0.000 claims abstract description 25
- 238000012216 screening Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims abstract description 17
- 238000012163 sequencing technique Methods 0.000 claims abstract description 5
- 241000167854 Bourreria succulenta Species 0.000 claims description 62
- 235000019693 cherries Nutrition 0.000 claims description 62
- 238000004364 calculation method Methods 0.000 claims description 43
- 238000001228 spectrum Methods 0.000 claims description 36
- 239000007787 solid Substances 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 27
- 230000003287 optical effect Effects 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 21
- 238000013500 data storage Methods 0.000 claims description 19
- 239000000284 extract Substances 0.000 claims description 8
- 238000010200 validation analysis Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000010183 spectrum analysis Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000010238 partial least squares regression Methods 0.000 claims description 3
- 230000001066 destructive effect Effects 0.000 claims description 2
- 238000000985 reflectance spectrum Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 claims description 2
- 230000000052 comparative effect Effects 0.000 description 15
- 235000013399 edible fruits Nutrition 0.000 description 7
- 238000002329 infrared spectrum Methods 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 7
- 229910052744 lithium Inorganic materials 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 6
- 238000001816 cooling Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 239000010453 quartz Substances 0.000 description 3
- 229910052594 sapphire Inorganic materials 0.000 description 3
- 239000010980 sapphire Substances 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- -1 polytetrafluoroethylene Polymers 0.000 description 2
- 229920001343 polytetrafluoroethylene Polymers 0.000 description 2
- 239000004810 polytetrafluoroethylene Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000012271 agricultural production Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012845 near infrared spectroscopy analysis Methods 0.000 description 1
- 238000012628 principal component regression Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000000411 transmission spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10048—Infrared image
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供一种农产品品质分析方法及分析仪。所述农产品品质分析方法包括:获取光谱数据并测定参考值数据;数据分为校正集和外部验证集;将光谱数据和参考值数据整理成数据矩阵,用蒙特卡洛采样法对数据矩阵采样;采用变量选择算法,对数据矩阵采样结果进行关键变量选择,统计各变量被选择频次并排序;对高相对频次变量统计稳定性,筛选出稳定关键变量并建立数学模型;将采集的待测农产品光谱数据代入数学模型,根据运算结果实现对农产品品质的分析。为实现上述方法的应用,研制出农产品品质分析仪,根据稳定关键变量预测并输出结果。本发明优化了蒙特卡洛采样参数,在获得稳定关键变量筛选结果的同时最大限度地降低运算成本并提高工作效率。
Description
技术领域
本发明属于光谱分析领域,具体地说,涉及一种农产品品质分析方法及分析仪。
背景技术
光谱分析具有快速、高效、无损、环境友好的技术特点,一直以来都是快速无损分析领域的重要分析手段。在工农业生产领域,以近红外光谱分析为代表的多光谱分析成为近年来热门的研究领域。以近红外光谱为例,由于其产生原因为含氢基团的合频与倍频吸收,往往呈现谱峰混杂、无法获取物质单一特征峰的特点。针对上述特点,传统的光谱分析往往采用全光谱多元变量分析,主要存在数据量庞大、数据信息复杂两方面问题。庞大的数据量对光谱仪、计算机硬件等都是极大的负担和挑战;而由于光谱数据本身的复杂性,导致分析对象的光谱数据中不仅包含与分析目标有关的信息,还包含其他与分析目标无关信息甚至噪声等干扰信息。因此,需要对光谱数据变量进行筛选,从而获得有效光谱信息,即关键变量。
目前变量筛选存在的问题主要体现在所选关键变量稳定性较差,即当校正集样品发生变化时,所选关键变量很有可能发生变化,由此导致变量选择的不确定性,从而导致筛选关键变量失败。针对该问题,蒙特卡洛采样方法被引入到关键变量选择过程中,从而在一定程度上对所筛选关键变量稳定性起到了积极作用。蒙特卡洛采样方法涉及的参数有:单次采样比率ratio,选择概率P,临界采样次数mctC和实际采样次数mct。当确定校正集样本容量N和蒙特卡洛单次采样比率ratio以及选择概率P后,即可通过公式计算得到临界采样次数mctC。理论上,当实际采样次数mct不小于临界采样次数mctC时,可以确保每个变量的选择概率皆不小于P。然而,目前针对蒙特卡洛采样方法,缺少对该方法参数选择的统一标准,在本领域实际操作中一般对蒙特卡洛采样方法的参数设定采用经验数值,从而缺乏科学性,进而导致所选变量的稳定性不佳,严重影响分析结果甚至导致分析结果错误。
发明内容
本发明的目的是提供一种农产品品质分析方法及分析仪。
本发明构思如下:针对目前蒙特卡洛-变量选择实际工作中,蒙特卡洛采样环节的参数设置无固定规律可循,仅依靠经验值,从而导致变量选择稳定性低的问题,针对蒙特卡洛采样方法,提出参数设置,该设置在保证蒙特卡洛采样所得到变量达到较高稳定性的同时,使计算量最小。进一步地,为实现所述方法的应用,本发明提供一种便携式农产品品质分析仪,包含光路系统、电路系统、控制系统、数据存储于处理系统。分析仪将光学系统所采集的光谱数据进行存储,根据所筛选的稳定关键变量从所采集的光谱数据中提取关键光谱数据(即稳定关键变量所对应的光谱数据信息),再基于所建数学模型对农产品品质进行预测计算并输出结果。本发明所提出的参数设置在获得稳定变量筛选结果的同时最大限度降低运算成本并提高工作效率。
为了实现本发明目的,第一方面,本发明提供一种农产品品质分析方法,包括以下步骤:
A、根据测试的农产品,至少选择一个与该农产品品质相关的指标作为分析对象,且该指标可通过光谱分析获得;
B、获取农产品的光谱数据,并基于步骤A所选指标,测定与该指标相关的参考值数据;剔除异常值后,将数据采用SPXY算法分为校正集和外部验证集,所述校正集用于农产品品质分析和/或分级过程中稳定关键变量的筛选以及数学模型的建立,所述外部验证集用于对所建数学模型进行盲样验证;其中,所述校正集和外部验证集的样本容量比为2.7:1~3.2:1,优选800:280;
C、将光谱数据和参考值数据按行向量整理成数据矩阵,采用蒙特卡洛采样方法(Monte Carlo Sampling Method,MC)对所述数据矩阵进行采样,生成大量校正集子集且各子集之间互不相同;
D、采用变量选择算法,对所述数据矩阵采样结果,即校正集各子集,进行关键变量选择,统计各变量被选择频次并计算各变量相对频次;
E、将各变量相对频次按从大到小顺序排序;
F、重复步骤C~E,对高相对频次变量统计稳定性,筛选出稳定关键变量,然后基于所选稳定关键变量建立数学模型,并采用外部验证集对所建数学模型进行盲样验证;
G、在相同实验条件下,采集待测农产品的光谱数据,利用步骤F所建数学模型,进行基于所述稳定关键变量的数据运算,根据运算结果实现对待测农产品品质的分析和/或分级;
其中,步骤G所述待测农产品与步骤A、B中所述的农产品为同一种类的农产品,步骤G所述农产品品质与步骤A、B中所述农产品品质为相同的农产品品质。
本发明中,所述光谱数据选自紫外、可见、近红外、中红外、荧光或太赫兹光谱数据,光谱数据的表现形式为吸收谱、吸收系数谱、透射谱或反射谱等。优选地,所述光谱数据为近红外反射谱数据。
所述数学模型采用回归算法结合交互验证算法建立,所述回归算法选自多元线性回归、主成分回归、偏最小二乘回归、前向偏最小二乘回归或后向偏最小二乘回归,所述验证算法为独立验证算法或留一法全交互验证算法。优选采用偏最小二乘回归结合留一法全交互验证算法建立所述数学模型。
前述的方法,所述农产品品质选自可溶性固形物含量(Soluble Solid Content,SSC)、可滴定酸含量(酸度)和硬度中的至少一种,优选可溶性固形物含量(即糖度,单位为白利度Brix,采用折光仪对SSC进行参考值测定)。
本发明所述农产品包括但不限于水果,优选地,所述水果为樱桃。更优选北京市通州区樱桃。
当所述农产品为樱桃,且所述农产品品质为可溶性固形物含量时:
前述的方法,步骤B中所述蒙特卡洛采样方法的参数“单次采样比率”的取值范围为0.60~0.99,优选0.60;所述蒙特卡洛采样方法的参数“单个变量被选中概率”(单个变量选择概率)的取值范围为0.9999900~0.9999999,优选0.9999990;所述蒙特卡洛采样方法的参数“临界采样次数”的计算方法按式(1)进行:
式(1)中,mctC为临界采样次数,P为单个变量被选中概率,ratio为单次采样比率;
所述蒙特卡洛采样方法的参数“实际采样次数”mct的取值范围为12mctC~18mctC,优选15mctC。
前述的方法,步骤C中所述选择算法选自无信息变量消除算法(UninformativeVariable Elimination,UVE)、连续投影算法(Successive Projection Algorithm,SPA)、竞争自适应重加权采样算法(Competitive Adaptive Reweighted Sampling,CARS)、逐步回归算法(Step Multiple Linear Regression,Step-MLR)等中的至少一种;优选逐步回归算法。
前述的方法,步骤E中采用逐步回归算法统计高相对频次变量的稳定性,平行计算次数8~15次,优选10次。
前述的方法,步骤C~E具体为:对光谱的每个变量记录变量被选频次,即通过变量选择算法对光谱变量进行筛选后,按照变量特征值(本发明中,变量特征值是逐步回归过程中,根据变量对回归模型的贡献,对每一个变量的评分)从大到小进行排序,取排序位于前20%~40%的变量,优选排序位于前24%-33%的变量,其变量被选频次值增加1;进一步地,所述关键变量采用相对选择频次进行统计;针对每个变量计算相对选择频次,计算公式如式(2)所示:
式(2)中,mct为实际采样次数;
将相对选择频次超过一定阈值的变量作为稳定关键变量,所述阈值范围为0.80~1.00,优选0.82~1.00。
前述的方法,步骤F中所选稳定关键变量分别为958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm。
前述的方法,步骤F中以1070.5nm为光谱基准,采用所选稳定关键变量对应的光谱数据为自变量,采用可溶性固形物含量参考值数据为因变量建立校正模型并用于樱桃品质的分级和/或分析。
本发明所述农产品包括但不限于水果,优选地,所述水果为樱桃。更优选北京市通州区樱桃。采用基于DLP(Digital Lignt Processing)技术的近红外光谱仪采集实验数据总体,所用仪器参数如下:以聚四氟乙烯白板作为光谱背景参考物;单次积分时间50ms;累加50次取平均;波长范围901.841nm~1700.930nm,光谱中心分辨率8.00nm~12.00nm,优选9.36nm,光谱变量数128个,光谱变量间隔4.882nm~7.883nm,优选光谱变量间隔6.292nm。
第二方面,本发明提供一种用于实现上述农产品品质分析方法的分析仪,所述分析仪包括光学系统、控制系统、电路系统以及数据存储与处理系统;
其中,所述光学系统用于对样品光谱数据的采集;
所述电路系统用于对分析仪进行稳定供电;
所述控制系统用于对分析仪的工作过程进行控制;
所述数据存储与处理系统用于数据存储、数学模型调用、结果预测、存储与输出。
分析仪将光学系统所采集的光谱数据进行存储,根据所筛选的稳定关键变量从所采集的光谱数据中提取关键光谱数据(即稳定关键变量所对应的光谱数据信息),再基于所建数学模型对农产品品质进行预测计算并输出结果。
所述光学系统包含光谱仪、光谱仪散热片和窗片;所述光谱仪可以是紫外、可见、近红外、中红外、荧光、太赫兹光谱仪,优选近红外光谱仪,所述近红外光谱仪优选数字光处理(Digital Light Processing)技术内核近红外光谱仪;所述窗片为允许工作光线透过的材料,优选近红外石英或蓝宝石材料;所述载物台中间开设通光孔,所述通光孔为椭圆形,长轴3mm~8mm、优选5mm,离心率0.12~0.30,优选0.18。实验证明,上述优选参数的椭圆形通光孔可更好地与水果表面契合,进而有效减少外界杂散光对样品测试过程的影响。所述光学系统用于分析仪工作过程中对样品光谱数据的采集。
所述电路系统包含锂电池、稳压电源、开关、电源指示灯、工作指示灯、电源充电插孔。所述分析仪采用锂电池和稳压电源两种供电方式,可适应室内操作及现场操作不同应用场景,其中,所述稳压电源可将交流电转换为仪器可用电源供仪器工作使用;开关采用按键开关或船型开关,优选船型开关;电源指示灯采用彩色发光二极管,在仪器接通电源后亮白灯、在仪器连接外部电源使用或充电时亮红灯、在仪器充电完成后亮蓝灯,关闭电源后电源指示灯熄灭。所述电路系统用于分析仪工作过程中对仪器进行稳定供电。
所述控制系统包含工程主板、中央处理器、显卡、触摸屏显示器、工程主板散热片、触发开关。所述控制系统用于对分析仪工作过程进行控制。
所述数据存储与处理系统包含随机存储器、只读存储器、固态硬盘、数据接口。数据接口可以是USB、OTG、Type-C接口中的一种或几种,优选USB接口。所述数据存储于处理系统用于数据存储、数学模型调用、结果预测与输出。
所述光谱仪和所述电路系统、控制系统、数据存储与处理系统彼此之间皆电连接。所述分析仪将光学系统所采集数据进行存储,根据所筛选的稳定关键变量从所采集数据中提取关键数据,再基于校正模型对农产品品质进行预测计算并输出结果。
第三方面,本发明提供上述农产品品质分析方法或分析仪在农产品品质无损快速精准分析和/或分级中的应用。
第四方面,本发明提供一种农产品品质分析和/或分级稳定关键变量的筛选方法,包含以下步骤:
(1)获取光谱数据并测定参考值数据;剔除异常值后,将数据分为校正集和外部验证集,将数据采用SPXY算法分为校正集和外部验证集,所述校正集和外部验证集的样本容量比为2.7:1~3.2:1,优选800:280;
(2)将光谱数据和参考值数据按行向量整理成数据矩阵,采用蒙特卡洛采样方法对所述数据矩阵进行采样,生成大量校正集子集且各子集之间互不相同;
(3)采用变量选择算法,对所述数据矩阵采样结果,即校正集各子集,进行关键变量选择,统计各变量被选择频次并计算各变量相对频次;
(4)将各变量相对频次按从大到小顺序排序;
(5)重复步骤(2)~(4),对高相对频次变量统计稳定性,筛选出稳定关键变量,用于农产品品质分析和/或分级。
在本发明的一个具体实施方式中,提供一种数据采样方法及仪器应用,所述光谱数据为近红外反射谱数据,所述农产品为樱桃,所述农产品品质为可溶性固形物含量(糖度)。
采用近红外光谱仪采集样品的近红外光谱数据,并测定品质参考值数据;将光谱数据和参考值数据按行向量整理成数据矩阵,采用蒙特卡洛采样方法对所述数据矩阵进行采样;采用变量选择算法,对所述数据矩阵采样结果进行关键变量选择,统计各变量被选择频次并计算各变量相对频次;将各变量相对频次按从大到小顺序排序。重复平行计算,对高相对频次变量统计稳定性。为实现上述运算方法的应用,设计并研制农产品品质分析仪,包含光路系统、电路系统、控制系统、数据存储于处理系统。分析仪根据稳定关键变量提取所采集数据,基于校正模型预测樱桃糖度值并输出结果。
所述蒙特卡洛采样方法的参数“单次采样比率”ratio的取值范围为0.60~0.99,优选0.60;所述蒙特卡洛采样方法的参数“单个变量被选中概率”P的取值范围为0.9999900~0.9999999,优选0.9999990;所述蒙特卡洛采样方法的参数“临界采样次数”mctC的计算方法按式(1)进行:
所述蒙特卡洛采样方法的参数“实际采样次数”mct的取值范围为12mctC~18mctC,优选15mctC。
所述变量选择算法为逐步回归算法;对高相对频次变量统计稳定性的平行计算次数8~15次,优选10次。
对光谱的每个变量记录变量被选频次,即通过变量选择算法对光谱变量进行筛选后,按照变量特征值(即稳定关键变量所对应的光谱数据信息)从大到小进行排序,按照所述排序,取位于前20%~40%的变量,优选变量特征值位于前24%~33%的变量,其变量被选频次值增加1。进一步地,所述关键变量采用相对选择频次进行统计。针对每个变量计算相对选择频次,计算公式如式(2)所示:
式(2)中,mct为实际采样次数,相对选择频次取值范围为0.00~1.00。将相对选择频次超过一定阈值的变量作为稳定关键变量,所述阈值范围为0.82~1.00。
按照上述步骤,本发明所选的稳定关键变量(特征峰)分别为:958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm。在10次平行计算中,上述5个稳定关键变量的相对选择频次均大于0.82。
为实现上述方法的应用,本发明还提供一款便携式农产品品质无损快速分析仪。所述便携式农产品品质无损快速分析仪,包含光学系统、电路系统、控制系统、数据存储与处理系统。
所述光学系统包含光谱仪、光谱仪散热片、窗片;所述光谱仪可以是紫外-可见、近红外、中红外、荧光、太赫兹光谱仪,优选近红外光谱仪,所述近红外光谱仪优选数字光处理(Digital Light Processing,DLP)技术内核近红外光谱仪;所述窗片为允许工作光线透过的材料,优选近红外石英或蓝宝石材料;所述载物台中间开设通光孔,所述通光孔为椭圆形,长轴3mm~8mm、优选5mm,离心率0.12~0.30,优选0.18。实验证明,上述优选参数的椭圆形通光孔可更好地与水果表面契合,进而有效减少外界杂散光对样品测试过程的影响。所述光学系统用于分析仪工作过程中对样品光谱数据的采集。
所述电路系统包含锂电池、稳压电源、开关、电源指示灯、工作指示灯、电源充电插孔。所述分析仪采用锂电池和稳压电源两种供电方式,可适应室内操作及现场操作不同应用场景,其中,所述稳压电源可将交流电转换为仪器可用电源供仪器工作使用;开关采用按键开关或船型开关,优选船型开关;电源指示灯采用彩色发光二极管,在仪器接通电源后亮白灯、在仪器连接外部电源使用或充电时亮红灯、在仪器充电完成后亮蓝灯,关闭电源后电源指示灯熄灭。所述电路系统用于分析仪工作过程中对仪器进行稳定供电。
所述控制系统包含工程主板、中央处理器、显卡、触摸屏显示器、工程主板散热片、触发开关。所述控制系统用于对分析仪工作过程进行控制。
所述数据存储与处理系统包含随机存储器、只读存储器、固态硬盘、数据接口。数据接口可以是USB、OTG、Type-C接口中的一种或几种,优选USB接口。所述数据存储于处理系统用于数据存储、数学模型调用、结果预测与输出。
所述光谱仪和所述电路系统、控制系统、数据存储与处理系统彼此之间皆电连接。分析仪将光学系统所采集的光谱数据进行存储,根据所筛选的稳定关键变量从所采集的光谱数据中提取关键光谱数据,再基于所建数学模型对樱桃品质进行预测计算并输出结果。
借由上述技术方案,本发明至少具有下列优点及有益效果:
本发明首次公开了蒙特卡洛采样参数下限值的设定标准/依据,从而在获得稳定变量筛选结果的同时最大限度地降低运算成本并提高工作效率。本发明提供的数据采样方法为精简光谱数据,研发高通量在线型光谱仪以及便携式、微型光谱仪提供重要技术指导。
附图说明
图1为本发明实施例1中所述数据采样方法运算以及基于稳定有限个数变量的校正集建模和外部验证集(外部盲样)预测过程流程图。
图2为本发明实施例2中所述数据采样方法仪器应用的便携式农产品品质无损快速分析仪侧视剖面示意图。
图3为本发明实施例2中所述数据采样方法仪器应用的便携式农产品品质无损快速分析仪后视示意图。
图4为本发明实施例2中所述数据采样方法仪器应用的便携式农产品品质无损快速分析仪工程主板俯视示意图。
图5为本发明实施例2中所述数据采样方法仪器应用的便携式农产品品质无损快速分析仪正面通光孔局部正视示意图。
图6为本发明实施例2中所述樱桃可溶性固形物含量基于稳定关键变量数据所建模型校正数据的可溶性固形物含量预测值-参考值相关关系图。
图7为本发明实施例2中所述樱桃可溶性固形物含量基于稳定关键变量数据所建模型全交互验证数据的可溶性固形物含量预测值-参考值相关关系图。
图8为本发明实施例2中所述樱桃可溶性固形物含量基于稳定关键变量数据所建模型外部盲样预测数据的可溶性固形物含量预测值-参考值相关关系图。
图9为本发明实施例2中所述樱桃分级计数百分比直方图。
图2-图5中,1-光谱仪,2-光谱仪散热片,3-窗片,4-锂电池,5-稳压电源,6-开关,7-电源指示灯,8-工作指示灯,9-电源充电插孔,10-工程主板,11-中央处理器,12-显卡,13-触摸屏显示器,14-工程主板散热片,15-触发开关,16-随机存储器,17-只读存储器,18-固态硬盘,19-数据接口,20-椭圆形通光孔。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段,所用原料均为市售商品。
以下所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,除非另有说明,术语“顶”、“底”、“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的系统或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
需要说明的是,除非另有明确的规定和限定,术语“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在发明中的具体含义。
实施例1基于优化参数的樱桃糖度检测稳定关键变量的选择
结合图1对基于优化参数的樱桃糖度检测稳定关键变量的选择进行说明。
本实施例中所用农产品为樱桃,优选北京通州产樱桃;所采集的光谱为近红外光谱,采用DLP技术近红外光谱仪采集实验数据总体,所用仪器参数如下:以聚四氟乙烯白板作为光谱背景参考物;单次积分时间50ms;累加50次取平均;波长范围901.841nm~1700.930nm,光谱中心分辨率8.00nm~12.00nm,优选9.36nm,光谱变量数128个,光谱变量间隔4.882nm~7.883nm,优选光谱变量间隔6.292nm;所述品质指标为可溶性固形物含量(Soluble Solid Content,SSC),其单位为白利度(Brix),采用折光仪对SSC进行参考值测定。所采集的实验数据总体经过异常值剔除后,样本容量1080,采用SPXY算法划分校正集和外部验证集,另校正集和外部验证集样本容量之比为800:280,所得校正集样本容量800个,外部验证集样本容量280个。所采集校正集樱桃SSC数据统计信息如表1所示。
表1樱桃SSC数据集统计信息(单位:Brix)
所述蒙特卡洛采样方法的参数“单次采样比率”ratio的取值范围为0.60~0.99,本实施例中优选0.60;所述蒙特卡洛采样方法的参数“单个变量被选中概率(单个变量选择概率)”P的取值范围为0.9999900~0.9999999,本实施例中优选0.9999990;所述蒙特卡洛采样方法的参数“临界采样次数”mctC的的计算方法按式(1)进行:
根据式(1),所述蒙特卡洛采样方法临界采样次数mctC计算值为15(次)。所述蒙特卡洛采样方法的参数“实际采样次数”mct的取值范围为12mctC~18mctC,本实施例优选15mctC,故实际采样次数mct取值为227次。
所述变量选择算法为逐步回归算法;对高相对频次变量统计稳定性的平行计算次数8-15次,本实施例优选10次。
对光谱的每个变量记录变量被选频次,即通过变量选择算法对光谱变量进行筛选后,按照变量特征值从大到小进行排序,按照所述排序,取前20%~40%的变量,优选变量特征值(即稳定关键变量所对应的光谱数据信息)位于前24%~33%的变量,其变量被选频次值增加1。进一步地,所述关键变量采用相对选择频次进行统计。针对每个变量计算相对选择频次,计算公式如式(2)所示:
式(2)中,mct为实际采样次数,相对选择频次取值范围为0.00~1.00。所述相对选择频次超过一定阈值的变量成为稳定关键变量,所述阈值范围为0.80~1.00,优选阈值为0.82。
按照上述步骤,相对选择频次前5个变量分别为:958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm。经过10次平行计算,上述5个变量的相对选择频次如表2所示。从表2数据可知,上述5个稳定关键变量的相对选择频次皆大于0.82,说明上述5个变量是稳定关键变量。
表2基于优化参数的樱桃糖度稳定关键变量相对选择频次
对比例1基于非优化参数的樱桃糖度稳定关键变量的选择-1
设定ratio=0.60,结合样本容量n=800、单个变量被选中概率P=0.9999990,根据公式(1),计算得到上述条件下MC采样的临界次数mctC=15。作为对比,将MC实际采样次数mct设为100,即mct是临界次数mctC的6.7倍,亦即采用上述非优化条件进行MC采样。
采用逐步回归算法筛选关键变量,计算步骤与实施例1相同,对高相对频次变量统计稳定性的平行计算10次。
根据上述步骤,相对选择频次前5个变量分别为:958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm。经过10次平行计算,上述5个变量的相对选择频次如表3所示。
表3基于非优化参数的樱桃糖度稳定关键变量相对选择频次
从表3数据可知,上述5个稳定关键变量的相对选择频次中,大部分大于0.82,但是存在相对频次小于0.82的情况,说明在上述非优化条件下,即使筛选出上述5个关键变量,但是基于上述计算结果不能说明所选变量是稳定关键变量。
对比例2基于非优化参数的樱桃糖度稳定关键变量的选择-2
设定ratio=0.20,结合样本容量n=800、单个变量被选中概率P=0.9999990,根据公式(1),计算得到上述条件下MC采样的临界次数mctC=61。作为对比,将MC实际采样次数mct设为244,即mct是临界次数mctC的4倍,亦即采用上述非优化条件进行MC采样。
采用逐步回归算法筛选关键变量,计算步骤与实施例1相同,对高相对频次变量统计稳定性的平行计算10次。
根据上述步骤,相对选择频次前5个变量分别为:958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm。经过10次平行计算,上述5个变量的相对选择频次如表4所示。
表4基于非优化参数的樱桃糖度稳定关键变量相对选择频次
从表4数据可知,上述5个稳定关键变量的相对选择频次中,没有大于0.82的情况,说明在上述非优化条件下,即使筛选出上述5个关键变量,但是基于上述计算结果不能说明所选变量是稳定关键变量。
对比例3基于非优化参数的樱桃糖度稳定关键变量的选择-3
设定ratio=0.20,结合样本容量n=800、单个变量被选中概率P=0.9999990,根据公式(1),计算得到上述条件下MC采样的临界次数mctC=61。作为对比,将MC实际采样次数mct设为915,即mct是临界次数mctC的15倍,亦即采用上述非优化条件进行MC采样。
采用逐步回归算法筛选关键变量,计算步骤与实施例1相同,对高相对频次变量统计稳定性的平行计算10次。
根据上述步骤,相对选择频次前5个变量分别为:958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm。经过10次平行计算,上述5个变量的相对选择频次如表5所示。
表5基于非优化参数的樱桃糖度稳定关键变量相对选择频次
从表5数据可知,上述5个稳定关键变量的相对选择频次中,没有大于0.82的情况,说明在上述非优化条件下,即使筛选出上述5个关键变量,但是基于上述计算结果不能说明所选变量是稳定关键变量。
对比例4基于非优化参数的樱桃糖度稳定关键变量的选择-4
设定ratio=0.60,结合样本容量n=800、单个变量被选中概率P=0.9999990,根据公式(1),计算得到上述条件下MC采样的临界次数mctC=15。作为对比,将MC实际采样次数mct设为450,即mct是临界次数mctC的30倍,亦即采用上述非优化条件进行MC采样。
采用逐步回归算法筛选关键变量,计算步骤与实施例1相同,对高相对频次变量统计稳定性的平行计算10次。
根据上述步骤,相对选择频次前5个变量分别为:958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm。经过10次平行计算,上述5个变量的相对选择频次如表6所示。
表6基于非优化参数的樱桃糖度稳定关键变量相对选择频次
从表6数据可知,上述5个稳定关键变量的相对选择频次中,全部大于0.82,说明在上述非优化条件下,筛选出的上述5个关键变量是稳定关键变量。然而,较实施例1而言,对比例4的ratio是实施例1的mcn的1倍、对比例4的MC采样次数mct是实施例1的mct的2倍,亦即对比例4的计算量是实施例1的2倍,但得到的计算结果是相同。可见对比例4的计算成本较实施例1高,因此对比例4所述不是优化算法。
对比例5基于非优化参数的樱桃糖度稳定关键变量的选择-5
设定ratio=0.90,结合样本容量n=800、单个变量被选中概率P=0.9999990,根据公式(1),计算得到上述条件下MC采样的临界次数mctC=6。作为对比,将MC实际采样次数mct设为900,即mct是临界次数mctC的150倍,亦即采用上述非优化条件进行MC采样。
采用逐步回归算法筛选关键变量,计算步骤与实施例1相同,对高相对频次变量统计稳定性的平行计算10次。
根据上述步骤,相对选择频次前5个变量分别为:958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm。经过10次平行计算,上述5个变量的相对选择频次如表7所示。
表7基于非优化参数的樱桃糖度稳定关键变量相对选择频次
从表7数据可知,上述5个稳定关键变量的相对选择频次中,全部大于0.82,且全部大于0.99,说明在上述非优化条件下,筛选出的上述5个关键变量是稳定关键变量。然而,较实施例1而言,对比例5的ratio是实施例1的mcn的1.5倍、对比例5的MC采样次数mct是实施例1的mct的1.5倍,亦即对比例5的计算量是实施例1的2.25倍,但得到的计算结果是相同。可见对比例5的计算成本较实施例1高,因此对比例5所述不是优化算法。
实施例2基于所选稳定关键变量研制便携式农产品品质无损快速分析仪并对樱桃进行品质分析与分级
实验目的:对樱桃样品采集近红外光谱数据并形成光谱数据矩阵,基于蒙特卡洛算法,针对蒙特卡洛单次采样比率和蒙特卡洛运行次数选取特定参数对所述光谱数据矩阵进行抽样,结合逐步回归算法,获得与樱桃糖度有关的稳定关键变量,并采用稳定关键变量数据建立校正模型以预测樱桃糖度实现无损分析与分级。
为实现樱桃品质无损快速分级,基于实施例1所选的稳定关键变量,设计并研制农产品品质无损快速分析仪,结合图2-图5对基于所选关键变量研制农产品品质无损快速分析仪并对樱桃进行品质分级进行说明。
图2为本发明所述数据采样方法仪器应用的便携式农产品品质无损快速分析仪侧视剖面示意图。
图3为本发明所述数据采样方法仪器应用的便携式农产品品质无损快速分析仪后视示意图。
图4为本发明所述数据采样方法仪器应用的便携式农产品品质无损快速分析仪工程主板俯视示意图。
图5为本发明所述数据采样方法仪器应用的便携式农产品品质无损快速分析仪正面通光孔局部正视示意图。
所述便携式农产品品质无损快速分析仪,包含光学系统、电路系统、控制系统、数据存储与处理系统。分析仪将光学系统所采集的光谱数据进行存储,根据所筛选的稳定关键变量从所采集的光谱数据中提取关键光谱数据,再基于所建数学模型对农产品品质进行预测计算并输出结果。
所述光学系统包含光谱仪1、光谱仪散热片2、窗片3;所述光谱仪可以是紫外-可见、近红外、中红外、荧光、太赫兹光谱仪,优选近红外光谱仪,所述近红外光谱仪优选数字光处理(Digital Light Processing)技术内核近红外光谱仪;所述窗片为允许工作光线透过的材料,优选近红外石英或蓝宝石材料;所述载物台中间开设通光孔20,所述通光孔为椭圆形,长轴3mm~8mm、优选5mm,离心率0.12~0.30,优选0.18。实验证明,上述优选参数的椭圆形通光孔可更好地与水果表面契合,进而有效减少外界杂散光对样品测试过程的影响。所述光学系统用于分析仪工作过程中对样品光谱数据的采集。
所述电路系统包含锂电池4、稳压电源5、开关6、电源指示灯7、工作指示灯8、电源充电插孔9。所述分析仪采用锂电池和稳压电源两种供电方式,可适应室内操作及现场操作不同应用场景,其中,所述稳压电源可将交流电转换为仪器可用电源供仪器工作使用;开关采用按键开关或船型开关,优选船型开关;电源指示灯采用彩色发光二极管,在仪器接通电源后亮白灯、在仪器连接外部电源使用或充电时亮红灯、在仪器充电完成后亮蓝灯,关闭电源后电源指示灯熄灭。所述电路系统用于分析仪工作过程中对仪器进行稳定供电。
所述控制系统包含工程主板10、中央处理器11、显卡12、触摸屏显示器13、工程主板散热片14、触发开关15。所述控制系统用于对分析仪工作过程进行控制。
所述数据存储与处理系统包含随机存储器16、只读存储器17、固态硬盘18、数据接口19。数据接口可以是USB、OTG、Type-C接口中的一种或几种,优选USB接口。所述数据存储于处理系统用于数据存储、数学模型调用、结果预测与输出。
所述光谱仪和所述电路系统、控制系统、数据存储与处理系统彼此之间皆电连接。所述分析仪将光学系统所采集数据进行存储,根据所筛选的稳定关键变量958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm,从所采集数据中提取所述稳定关键变量所对应的关键数据,再基于校正模型对樱桃品质进行预测计算并输出结果,根据预先设定的分级标准,即可实现对樱桃品质的无损快速精准分级。
樱桃可溶性固形物含量基于所选稳定有限个数关键变量模型建立过程如下。樱桃剔除异常值后的数据分级情况如表8所示。从表8可见,本发明采用SPXY算法对樱桃数据进行分级,所述校正集和外部验证集的样本容量比为800:280的情况下,校正集、外部验证集(即外部盲样,简称“盲样”)和总体数据具有相似的统计分布,说明所述分级具有数据代表性。
表8樱桃分级的可溶性固形物含量值统计
以所选稳定有限个数关键变量对应的关键光谱数据为自变量,以校正集樱桃可溶性固形物含量实测参考值(简称:参考值)为因变量,以1070.5nm为光谱基准,采用偏最小二乘回归结合全交互验证算法建立校正模型。所建模型的校正数据、全交互验证数据(简称:交互验证数据)的统计结果如表9所示。所建模型的校正数据樱桃可溶性固形物含量预测值-参考值相关关系见图6。
表9樱桃可溶性固形物含量基于稳定关键变量建模结果统计
对于校正数据,校正数据F计算值=1626.1,而F查表值=1.35(α=0.05),校正数据F计算值>F查表值,说明校正数据的可溶性固形物含量的预测值-参考值之间具有显著相关性,亦即校正数据成立。
对于交互验证数据,交互验证数据F计算值=1591.2,而F查表值=1.35(α=0.05),交互验证数据F计算值>F查表值,说明交互验证数据的可溶性固形物含量的预测值-参考值之间具有显著相关性,亦即交互验证数据成立。樱桃可溶性固形物含量基于稳定关键变量数据所建模型全交互验证数据的可溶性固形物含量预测值-参考值相关关系图见图7。
基于上述模型,对外部验证集(即外部盲样)的预测结果如表10所示。
表10樱桃可溶性固形物含量基于稳定关键变量模型对外部验证集预测结果统计
对于外部盲样验证数据,外部盲样验证数据F计算值=1591.2,而F查表值=1.35(α=0.05),外部盲样验证数据F计算值>F查表值,说明外部盲样验证数据的可溶性固形物含量的预测值-参考值之间具有显著相关性,亦即所建模型对外部盲样的预测数据可以达到樱桃可溶性固形物含量无损快速检测的要求。樱桃可溶性固形物含量基于稳定关键变量数据所建模型外部盲样预测数据的可溶性固形物含量预测值-参考值相关关系图见图8。
樱桃品质分级标准如下:预测值>17.0划分为一级,预测值≤17.0且预测值>15.0划分为二级,预测值≤15.0划分为三级。
对待测樱桃样品采集近红外光谱数据,根据稳定关键变量提取待测樱桃样品近红外光谱中的对应数据,采用上述基于稳定关键变量所建模型对所述待测樱桃样品对应的关键光谱数据进行预测,并按照上述分级规则对樱桃品质进行分级。
统计待测樱桃分级情况,直方图如图9所示。基于由本发明所提出的稳定关键变量所建模型对待测樱桃样品可溶性固形物含量预测后分级结果如下:待测樱桃260个,一级樱桃76个、占比29.2%,二级樱桃106个,占比40.8%;三级樱桃78个,占比30.0%。
由于在预测过程中只采用了5个稳定关键变量,相对于原光谱128个变量,实际参与计算的变量个数仅为3.9%,计算时间仅是传统计算方法的1/25左右,即本方法的计算时间较传统计算方法大幅降低,有效提高了工作效率。
本发明优化了蒙特卡洛采样参数,从而在获得稳定变量筛选结果的同时最大限度降低运算成本并提高工作效率。本发明提供的数据采样方法为精简光谱数据,研发高通量在线型光谱仪以及便携式、微型光谱仪提供重要技术指导。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之做一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (7)
1.农产品品质分析方法,其特征在于,包括以下步骤:
A、根据测试的农产品,至少选择一个与该农产品品质相关的指标作为分析对象,且该指标可通过光谱分析获得;
B、获取农产品的光谱数据,并基于步骤A所选指标,测定与该指标相关的参考值数据;剔除异常值后,将数据采用SPXY算法分为校正集和外部验证集,所述校正集用于农产品品质分析和/或分级过程中稳定关键变量的筛选以及数学模型的建立,所述外部验证集用于对所建数学模型进行盲样验证;
C、将光谱数据和参考值数据按行向量整理成数据矩阵,采用蒙特卡洛采样方法对所述数据矩阵进行采样,生成大量校正集子集且各子集之间互不相同;
D、采用变量选择算法,对所述数据矩阵采样结果,即校正集各子集,进行关键变量选择,统计各变量被选择频次并计算各变量相对频次;
E、将各变量相对频次按从大到小顺序排序;
F、重复步骤C~E,对高相对频次变量统计稳定性,筛选出稳定关键变量,然后基于所选稳定关键变量建立数学模型,并采用外部验证集对所建数学模型进行盲样验证;
G、在相同实验条件下,采集待测农产品的光谱数据,利用步骤F所建数学模型,进行基于所述稳定关键变量的数据运算,根据运算结果实现对待测农产品品质的分析和/或分级;
其中,步骤G所述待测农产品与步骤A、B中所述的农产品为同一种类的农产品,步骤G所述农产品品质与步骤A、B中所述农产品品质为相同的农产品品质;
所述光谱数据为近红外反射谱数据;
采用偏最小二乘回归结合留一法全交互验证算法建立所述数学模型;
步骤B中所述校正集和外部验证集的样本容量比为2.7:1~3.2:1;
所述农产品为樱桃,所述农产品品质为可溶性固形物含量;
步骤B中所述蒙特卡洛采样方法的参数“单次采样比率”的取值范围为0.60~0.99;所述蒙特卡洛采样方法的参数“单个变量被选中概率”的取值范围为0.9999900~0.9999999;所述蒙特卡洛采样方法的参数“临界采样次数”的计算方法按式(1)进行:
式(1)中,mctC为临界采样次数,P为单个变量被选中概率,ratio为单次采样比率;
所述蒙特卡洛采样方法的参数“实际采样次数”的取值范围为12mctC~18mctC;
步骤C中所述选择算法为逐步回归算法;
步骤E中采用逐步回归算法统计高相对频次变量的稳定性,平行计算次数8~15次;
步骤C~E具体为:对光谱的每个变量记录变量被选频次,即通过变量选择算法对光谱变量进行筛选后,按照变量特征值从大到小进行排序,取排序位于前20%~40%的变量,其变量被选频次值增加1;进一步地,所述关键变量采用相对选择频次进行统计;针对每个变量计算相对选择频次,计算公式如式(2)所示:
式(2)中,mct为实际采样次数;
将相对选择频次超过一定阈值的变量作为稳定关键变量,所述阈值范围为0.80~1.00;
步骤F中所选稳定关键变量分别为958.5nm、1212.3nm、1308.6nm、1390.4nm和1685.3nm;
步骤F中以1070.5nm为光谱基准,采用所选稳定关键变量对应的光谱数据为自变量,采用可溶性固形物含量参考值数据为因变量建立校正模型并用于樱桃品质的分级和/或分析。
2.根据权利要求1所述的方法,其特征在于,步骤B中所述校正集和外部验证集的样本容量比为800:280。
3.根据权利要求1所述的方法,其特征在于,步骤B中所述蒙特卡洛采样方法的参数“单次采样比率”的取值范围为0.60;所述蒙特卡洛采样方法的参数“单个变量被选中概率”的取值范围为0.9999990;所述蒙特卡洛采样方法的参数“实际采样次数”的取值范围为15mctC。
4.根据权利要求1所述的方法,其特征在于,步骤E中采用逐步回归算法统计高相对频次变量的稳定性,平行计算次数10次。
5.根据权利要求1所述的方法,其特征在于,步骤C~E具体为:对光谱的每个变量记录变量被选频次,即通过变量选择算法对光谱变量进行筛选后,按照变量特征值从大到小进行排序,取排序位于前24%~33%的变量,其变量被选频次值增加1;
将相对选择频次超过一定阈值的变量作为稳定关键变量,所述阈值范围为0.82~1.00。
6.用于实现权利要求1-5任一项所述农产品品质分析方法的分析仪,其特征在于,所述分析仪包括光学系统、电路系统、控制系统、数据存储与处理系统;
其中,所述光学系统用于对样品光谱数据的采集;
所述电路系统用于对分析仪进行稳定供电;
所述控制系统用于对分析仪的工作过程进行控制;
所述数据存储与处理系统用于数据存储、数学模型调用、结果预测、存储与输出;
分析仪将光学系统所采集的光谱数据进行存储,根据所筛选的稳定关键变量从所采集的光谱数据中提取关键光谱数据,再基于所建数学模型对农产品品质进行预测计算并输出结果。
7.权利要求1-5任一项所述方法或权利要求6所述分析仪在农产品品质无损快速精准分析和/或分级中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910490896.9A CN110264050B (zh) | 2019-06-06 | 2019-06-06 | 农产品品质分析方法及分析仪 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910490896.9A CN110264050B (zh) | 2019-06-06 | 2019-06-06 | 农产品品质分析方法及分析仪 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110264050A CN110264050A (zh) | 2019-09-20 |
CN110264050B true CN110264050B (zh) | 2021-05-25 |
Family
ID=67917037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910490896.9A Active CN110264050B (zh) | 2019-06-06 | 2019-06-06 | 农产品品质分析方法及分析仪 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110264050B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109839358B (zh) * | 2019-01-22 | 2021-08-10 | 北京农业质量标准与检测技术研究中心 | 农产品品质分析方法及装置 |
CN111855608B (zh) * | 2020-07-29 | 2023-04-07 | 中国科学院合肥物质科学研究院 | 基于融合特征波长选择算法的苹果酸度近红外无损检测方法 |
CN113049509B (zh) * | 2021-03-17 | 2022-04-22 | 盐城师范学院 | 一种基于光谱技术的农产品检测管理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1048157A (ja) * | 1996-08-08 | 1998-02-20 | Toray Ind Inc | 分子シミュレーション付き測定兼解析装置および物質の化学構造を解析する方法 |
CN103487410A (zh) * | 2013-09-01 | 2014-01-01 | 西北大学 | 基于模型集群分析的激光诱导击穿光谱变量选择方法 |
CN106596416A (zh) * | 2016-11-25 | 2017-04-26 | 华中农业大学 | 一种基于高光谱成像技术的冷鲜肉品质无损检测方法 |
CN109839358A (zh) * | 2019-01-22 | 2019-06-04 | 北京农业质量标准与检测技术研究中心 | 农产品品质分析方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107144548B (zh) * | 2017-05-24 | 2019-10-29 | 长春理工大学 | 基于蒙特卡洛变量组合集群的近红外光谱变量选择方法 |
-
2019
- 2019-06-06 CN CN201910490896.9A patent/CN110264050B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1048157A (ja) * | 1996-08-08 | 1998-02-20 | Toray Ind Inc | 分子シミュレーション付き測定兼解析装置および物質の化学構造を解析する方法 |
CN103487410A (zh) * | 2013-09-01 | 2014-01-01 | 西北大学 | 基于模型集群分析的激光诱导击穿光谱变量选择方法 |
CN106596416A (zh) * | 2016-11-25 | 2017-04-26 | 华中农业大学 | 一种基于高光谱成像技术的冷鲜肉品质无损检测方法 |
CN109839358A (zh) * | 2019-01-22 | 2019-06-04 | 北京农业质量标准与检测技术研究中心 | 农产品品质分析方法及装置 |
Non-Patent Citations (3)
Title |
---|
蒙特卡洛交叉验证用于偏最小二乘建模数据质量的评价(英文);王家俊等;《计算机与应用化学》;20151228(第12期);全文 * |
蒙特卡洛-偏最小二乘回归系数法用于近红外光谱变量筛选;张明锦等;《分析试验室》;20130215(第02期);全文 * |
近红外光谱分析中的一种基于XY变量联合的异常样本剔除算法;尹宝全等;《中国科学技术大学学报》;20160315(第03期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110264050A (zh) | 2019-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110411957B (zh) | 水果货架期及新鲜程度的无损快速预测方法及装置 | |
CN109839358B (zh) | 农产品品质分析方法及装置 | |
CN110264050B (zh) | 农产品品质分析方法及分析仪 | |
Liland et al. | Optimal choice of baseline correction for multivariate calibration of spectra | |
Lin et al. | Freshness measurement of eggs using near infrared (NIR) spectroscopy and multivariate data analysis | |
Ye et al. | Non-destructive prediction of protein content in wheat using NIRS | |
Roggo et al. | Comparison of supervised pattern recognition methods with McNemar’s statistical test: Application to qualitative analysis of sugar beet by near-infrared spectroscopy | |
Yu et al. | Three-step hybrid strategy towards efficiently selecting variables in multivariate calibration of near-infrared spectra | |
Goicoechea et al. | A new family of genetic algorithms for wavelength interval selection in multivariate analytical spectroscopy | |
CN102564993A (zh) | 一种利用傅里叶变换红外光谱识别大米品种方法及其应用 | |
Luna et al. | Evaluation of chemometric methodologies for the classification of Coffea canephora cultivars via FT-NIR spectroscopy and direct sample analysis | |
Cozzolino | Infrared methods for high throughput screening of metabolites: food and medical applications | |
CN105699319A (zh) | 一种基于高斯过程的近红外光谱煤全水分快速检测方法 | |
Kwofie et al. | Incorporating brand variability into classification of edible oils by Raman spectroscopy | |
Nturambirwe et al. | Detecting bruise damage and level of severity in apples using a contactless nir spectrometer | |
Ferguson et al. | Infrared micro-spectroscopy coupled with multivariate and machine learning techniques for cancer classification in tissue: a comparison of classification method, performance, and pre-processing technique | |
Wu et al. | Determination of corn protein content using near-infrared spectroscopy combined with A-CARS-PLS | |
Zheng et al. | Improving the identification accuracy of sugar orange suffering from granulation through diameter correction and stepwise variable selection | |
CN117949429A (zh) | 基于拉曼光谱和多模态混合式模型的杏仁产地鉴别方法 | |
Zhang et al. | Uninformative Biological Variability Elimination in Apple Soluble Solids Content Inspection by Using Fourier Transform Near‐Infrared Spectroscopy Combined with Multivariate Analysis and Wavelength Selection Algorithm | |
Wang et al. | SVM classification method of waxy corn seeds with different vitality levels based on hyperspectral imaging | |
Bai et al. | Rapid and accurate quality evaluation of Angelicae Sinensis Radix based on near-infrared spectroscopy and Bayesian optimized LSTM network | |
Liu et al. | An outlier removal method based on pca-dbscan for blood-sers data analysis | |
CN108645809A (zh) | 一种近红外光谱技术快速识别松脂来源树种的方法 | |
CN117589854A (zh) | 一种快速、无损的花果茶拼配茶底等级鉴定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220712 Address after: 100097 No. 9 middle garden, Shuguang garden, Beijing, Haidian District Patentee after: BEIJING ACADEMY OF AGRICULTURE AND FORESTRY SCIENCES Address before: Room 1011, germ plasm building, Beijing Academy of agriculture and Forestry Sciences, 9 Shuguang Huayuan Middle Road, Haidian District, Beijing 100097 Patentee before: BEIJING RESEARCH CENTER FOR AGRICULTURAL STANDARDS AND TESTING |
|
TR01 | Transfer of patent right |