CN106872370A - 一种基于高光谱的杨梅中花色苷含量测定的方法 - Google Patents
一种基于高光谱的杨梅中花色苷含量测定的方法 Download PDFInfo
- Publication number
- CN106872370A CN106872370A CN201710100743.XA CN201710100743A CN106872370A CN 106872370 A CN106872370 A CN 106872370A CN 201710100743 A CN201710100743 A CN 201710100743A CN 106872370 A CN106872370 A CN 106872370A
- Authority
- CN
- China
- Prior art keywords
- spectrum
- sample
- content
- bayberry
- anthocyanin content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229930002877 anthocyanin Natural products 0.000 title claims abstract description 122
- 235000010208 anthocyanin Nutrition 0.000 title claims abstract description 122
- 239000004410 anthocyanin Substances 0.000 title claims abstract description 122
- 150000004636 anthocyanins Chemical class 0.000 title claims abstract description 122
- 238000000034 method Methods 0.000 title claims abstract description 65
- 244000132436 Myrica rubra Species 0.000 title claims abstract description 38
- 238000001228 spectrum Methods 0.000 claims abstract description 85
- 235000009134 Myrica cerifera Nutrition 0.000 claims abstract description 37
- 238000001514 detection method Methods 0.000 claims abstract description 25
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 238000004128 high performance liquid chromatography Methods 0.000 claims abstract description 17
- 238000012937 correction Methods 0.000 claims abstract description 10
- 238000000701 chemical imaging Methods 0.000 claims abstract description 9
- 230000003595 spectral effect Effects 0.000 claims description 69
- 238000010238 partial least squares regression Methods 0.000 claims description 31
- 238000007781 pre-processing Methods 0.000 claims description 26
- 238000009499 grossing Methods 0.000 claims description 13
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 10
- YTMNONATNXDQJF-UBNZBFALSA-N chrysanthemin Chemical compound [Cl-].O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=CC2=C(O)C=C(O)C=C2[O+]=C1C1=CC=C(O)C(O)=C1 YTMNONATNXDQJF-UBNZBFALSA-N 0.000 claims description 9
- RKWHWFONKJEUEF-GQUPQBGVSA-O Cyanidin 3-O-glucoside Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1=CC2=C(O)C=C(O)C=C2[O+]=C1C1=CC=C(O)C(O)=C1 RKWHWFONKJEUEF-GQUPQBGVSA-O 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 7
- 239000002245 particle Substances 0.000 claims description 7
- 238000011002 quantification Methods 0.000 claims description 6
- 230000035945 sensitivity Effects 0.000 claims description 6
- 230000003287 optical effect Effects 0.000 claims description 5
- 239000007787 solid Substances 0.000 claims description 5
- 244000269152 Myrica pensylvanica Species 0.000 claims 4
- 235000007270 Gaultheria hispida Nutrition 0.000 claims 1
- 235000012851 Myrica pensylvanica Nutrition 0.000 claims 1
- 244000061457 Solanum nigrum Species 0.000 abstract description 33
- 238000007689 inspection Methods 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000001066 destructive effect Effects 0.000 abstract description 4
- 238000003672 processing method Methods 0.000 abstract 1
- 235000008375 Decussocarpus nagi Nutrition 0.000 description 9
- 235000014631 Myrica rubra Nutrition 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 6
- 240000006365 Vitis vinifera Species 0.000 description 5
- 235000014787 Vitis vinifera Nutrition 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 238000004811 liquid chromatography Methods 0.000 description 4
- 235000009754 Vitis X bourquina Nutrition 0.000 description 3
- 235000012333 Vitis X labruscana Nutrition 0.000 description 3
- 238000009659 non-destructive testing Methods 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 1
- 240000000249 Morus alba Species 0.000 description 1
- 235000008708 Morus alba Nutrition 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000003712 anti-aging effect Effects 0.000 description 1
- 230000003064 anti-oxidating effect Effects 0.000 description 1
- 235000021028 berry Nutrition 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 235000013402 health food Nutrition 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000005070 ripening Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于高光谱的杨梅中花色苷含量测定的方法,该方法包括以下步骤:收集不同品种新鲜杨梅样本随机分配,建立校正样本集和检验样本集;对校正和检验样本集中的样本运用高光谱成像系统进行光谱扫描,采集900~1700nm近红外波段高光谱图像,得到校正和检验样本集光谱;利用高效液相色谱(HPLC)测定校正和检验样本中花色苷含量;结合光谱预处理方法和化学计量学建模方法,建立杨梅中花色苷含量的预测模型。本发明通过结合近红外高光谱成像及HPLC检测技术,具有无损、高效、快速和准确等优点,有效地检测了杨梅中花色苷的含量。
Description
技术领域
本发明涉及一种基于高光谱测定花色苷含量的方法,尤其涉及一种基于近红外高光谱的杨梅中花色苷含量测定的方法。
背景技术
杨梅是我国的特色水果,在浙江、福建和广东等省份有较大面积的种植。杨梅具有较高的营养价值,富含多种活性物质,尤其含有丰富的花色苷。杨梅中的花色苷主要为矢车菊素-3-O-葡萄糖苷,具有抗氧化、抗炎症和抗衰老等作用(徐渊金.杨梅和桑椹花色苷的提取分离,结构鉴定及其生物活性研究[D].杭州:浙江工商大学,2007.)。
花色苷在杨梅的成熟过程中逐渐积累,并在果实成熟时达到最大。杨梅花色苷是赋予杨梅颜色的主要物质,并对其风味、口感和营养价值等有重要影响,是决定杨梅感官质量的重要因素之一。花色苷在美国、欧洲等国家已广泛应用于保健食品行业。杨梅是中国特色浆果资源,且含有丰富的花色苷。因此,研究杨梅中的花色苷含量有助于评价杨梅的营养价值,鉴定杨梅成熟度,对进一步开发杨梅资源具有十分重要的意义。
目前对杨梅中花色苷含量的测定主要有两种:一种是pH示差法,主要利用花色苷的色调和色度随pH值的不同而发生改变。而干扰物质特征光谱不随pH的改变而改变。结合朗伯-比尔定律可得出,在两个不同的pH值下,花色苷溶液的吸光度的差值与花色苷的含量成比例。然而大多数水果中不止含有一种花色苷,而且每种花色苷的消光系数都有稍微差别,所以测定的结果并非完全准确;另外一种是液相色谱法,主要利用液相色谱技术直接测定果实中花色苷的含量。液相色谱法测定花色苷含量十分精确,然而需要昂贵的检测设备,检测时间较长。
上述两种检测方法都需要对样品进行处理,会破坏检测样品,难以实现快速、大样本量的无损检测。近年来,近红外高光谱成像技术作为一种无损检测方法引起了广泛的关注。其最大特点是结合光谱技术与计算机图像技术两者的优点,可获得大量包含连续波长光谱信息的图像块,由于其具有检测速度快、效率高、成本低等优点,越来越多地应用于农产品品质与安全的无损检测。有相关专利采用高光谱检测酿酒葡萄果皮中花色苷的含量(一种基于高光谱的酿酒葡萄果皮中花色苷含量测定的方法,ZL201310393516.2),其采用pH示差法测定葡萄皮花色苷含量,以矢车菊素-3-葡萄糖苷为当量,然而葡萄皮中花色苷种类很多,采用pH示差法测定并不能准确的测定葡萄皮中的花色苷含量,从而导致建模后预测的准确性有所偏差;同时其采用大范围光谱数据建模,导致测定时需要扫描大范围波长光谱数据。因此采用高效液相色谱检测杨梅中花色苷含量,采集特征光谱波长数据建模,可以确保预测值的准确性,同时大大减少扫描波段,可实现快速、无损、精确的花色苷检测。
发明内容
本发明的目的在于提供一种基于高光谱的杨梅中花色苷含量测定的方法,旨在实现无损、快速、大样本量的检测。
本发明提供了一种杨梅中花色苷含量的测定方法,该基于近红外高光谱的杨梅中花色苷含量测定的方法包括以下步骤:
1)样本光谱的建立:
收集不同品种新鲜杨梅样本随机分配,建立校正样本集和检验样本集;对校正和检验样本集中的样本运用高光谱成像系统进行光谱扫描,其中镜头与样本距离为15~30cm,曝光时间为1~5s,样本移动速度为10~20mm/s,采集900~1700nm近红外波段高光谱图像,得到校正和检验样本集光谱;
2)样本花色苷含量的测定:
采集光谱后,使用体积百分比为40~80%的乙醇提取样本,再应用高效液相色谱(HPLC)测定校正和检验样本中花色苷含量,以矢车菊素-3-O-葡萄糖苷作为标准品定量,HPLC检测波长为520nm;
3)样本光谱的预处理:
首先采用平滑法(移动平均平滑法(Moving Average)、卷积平滑法(Savitzky-Golay)、高斯平滑滤波(Gaussian filter)和中值滤波平滑(Median filter smoothing)等)对样本原始光谱进行处理,消除光谱噪声,提高分辨率和灵敏度;继续使用标准正态变量变换算法(Standard normal variate transformation,SNV)或多元散射校正算法(Multiplicative scatter correction,MSC)处理,消除固体颗粒大小、表面散射以及光程变化对光谱的影响。预处理过程中根据需要剔除差异性较大的个别数据。
4)采用多元回归算法建立校正模型:
首先结合预处理后校正样本集900~1700nm的光谱数据和花色苷含量,采用偏最小二乘回归法(partial least squares regression,PLSR)建模,通过X-载荷(X-loadingweight)图,提取光谱特征值,选取波峰及波谷段光谱,特征光谱波长范围是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光谱波长数据和花色苷含量再次使用PLSR建模,建模后代入检测样本集光谱数据,计算花色苷实际值,与预测值的相关性系数(R2),优化上述特征光谱范围至R2大于0.9,选取R2最大值时对应的特征光谱波长范围,得到最佳建模特征光谱,建立杨梅中花色苷含量的最优预测模型。
上述最优建模特征光谱波长范围是924.60~931.40、961.59~981.73、1042.16~1069.03、1146.35~1159.82和1257.43~1274.27nm,模型预测值与实际值的R2为0.9165,均方根误差(Root-mean-square error,RMSE)值为0.0766。
5)预测样本花色苷含量测定:
扫描样品特征光谱波长,采集近红外高光谱数据,将光谱数据输入杨梅花色苷含量预测模型,计算得到待测样品中花色苷含量。
光谱数据预处理、建模及预测均在The Unscrambler X软件上操作。
本发明提供的基于近红外高光谱的杨梅中花色苷含量测定的方法,通过采用近红外高光谱图像提取杨梅光谱数据,利用高效液相色谱测定杨梅中的花色苷含量,结合光谱预处理方法,提取特征光谱,利用最小二乘回归法(PLSR)建模,得到杨梅中花色苷含量的预测模型。第一次建模采用的是900~1700nm波长的所有数据,第一次建模可以得出波长与含量之间的关系,可以通过第一次建模,得到特征光谱波长段,第二次建模利用第一次建模得到的特征波长段再次建模,选择特定波长段的数据,提高建模准确性,减少数据计算量。
本发明采用高效液相色谱测定杨梅中花色苷含量,可以精确测定杨梅中花色苷含量,保证建模的准确性。
本发明建模中通过选取特征光谱波长数据建模,检测样本花色苷含量是,仅需扫描特征光谱波长数据,可以缩短扫描时间,提高检测速率。
本发明可以避免花色苷现有的化学检测法会破坏检测对象,可实现无损、快速和大量的检测杨梅中花色苷的含量。
附图说明
图1是本发明实施例一提供的基于近红外高光谱的杨梅中花色苷含量测定的方法流程图;
图2是本发明实施例二提供的杨梅花色苷液相色谱图;
图3是本发明实施例二提供的近红外高光谱图像的平均光谱曲线图;
图4是本发明实施例三提供的经平滑处理和标准正态变量变换算法(SNV)处理后的近红外高光谱曲线图;
图5是本发明实施例三提供的杨梅花色苷的X-载荷(X-loading weight)图;
图6是本发明实施例四提供的PLSR建模方法下杨梅中花色苷预测值与实际值的比较示意图;
具体实施方式
下面结合具体实施例对本发明作进一步描述,以下列举的仅是本发明的具体实施例,但本发明的保护范围并不仅限于此:
实施例一
一种基于近红外高光谱的杨梅中花色苷含量测定的方法,其特征在于该方法的步骤如下:
1)样本光谱的建立:
收集不同品种新鲜杨梅样本随机分配,建立校正样本集和检验样本集;对校正和检验样本集中的样本运用高光谱成像系统进行光谱扫描,其中镜头与样本距离为15cm,曝光时间为2s,样本移动速度为10mm/s,采集近红外波段高光谱图像,得到校正和检验样本集光谱;
上述步骤中,样本集和检验样本集各包含400和200颗杨梅,采集的近红外波段范围是1000~1600nm
2)样本花色苷含量的测定:
采集光谱后,使用80%乙醇提取样本,再应用高效液相色谱(HPLC)测定校正和检验样本中花色苷含量,以矢车菊素-3-O-葡萄糖苷作为标准品定量,HPLC检测波长为520nm;
3)样本光谱的预处理:
首先采用移动平均平滑法(Moving Average)对样本原始光谱进行处理,消除光谱噪声,提高分辨率和灵敏度;继续使用标准正态变量变换算法(Standard normal variatetransformation,SNV)处理,消除固体颗粒大小、表面散射以及光程变化对光谱的影响。预处理过程中根据需要剔除差异性较大的个别数据。
4)采用多元回归算法建立校正模型:
偏最小二乘回归法(partial least square regression,PLSR)是一种新型的多元统计数据分析方法,它主要研究的是多因变量对多自变量的回归建模,特别当各变量内部高度线性相关时,用PLSR更有效。另外,偏最小二乘回归较好地解决了样本个数少于变量个数等问题。
对于预处理后的校正样本集光谱数据和校正样本集的花色苷含量测量值,通过多元回归算法来建立校正模型;具体操作为结合光谱预处理方法和偏最小二乘回归法建模,采用检测样本集,评估建立模型的效果,确定出最佳的处理方法,建立杨梅中花色苷含量的预测模型。
首先结合预处理后校正样本集900~1700nm的光谱数据和花色苷含量,采用偏最小二乘回归法(partial least squares regression,PLSR)建模,通过X-载荷(X-loadingweight)图,提取光谱特征值,选取波峰及波谷段光谱,特征光谱波长范围是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光谱波长数据和花色苷含量再次使用PLSR建模,建模后代入检测样本集光谱数据,计算花色苷实际值,与预测值的相关性系数(R2),优化上述特征光谱范围至R2大于0.9,选取R2最大值时对应的特征光谱波长范围,得到最佳建模特征光谱,建立杨梅中花色苷含量的最优预测模型。
上述最优建模特征光谱波长范围是924.60~934.76、1042.16~1069.03、1146.35~1159.82和1257.43~1274.27nm,模型预测值与实际值的R2为0.9021,均方根误差(Root-mean-square error,RMSE)值为0.1124。
5)预测样本花色苷含量测定:
扫描样品特征光谱波长,采集近红外高光谱数据,将光谱数据输入杨梅花色苷含量预测模型,计算得到待测样品中花色苷含量。
光谱数据预处理、建模及预测均在The Unscrambler X软件上操作。
图1是本发明的基于近红外高光谱的杨梅中花色苷含量测定的方法流程图,主要步骤包括样品的采集,近红外高光谱扫描,读取光谱数据,光谱数据预处理,液相色谱检测杨梅花色苷含量,结合光谱数据和花色苷含量建立预测模型;
实施例二
一种基于近红外高光谱的杨梅中花色苷含量测定的方法,其特征在于该方法的步骤如下:
1)样本光谱的建立:
收集不同品种新鲜杨梅样本随机分配,建立校正样本集和检验样本集;对校正和检验样本集中的样本运用高光谱成像系统进行光谱扫描,其中镜头与样本距离为20cm,曝光时间为3s,样本移动速度为15mm/s,采集近红外波段高光谱图像,得到校正和检验样本集光谱;
上述步骤中,样本集和检验样本集各包含500和500颗杨梅,采集的近红外波段范围是900~1500nm
2)样本花色苷含量的测定:
采集光谱后,使用40%乙醇提取样本,再应用高效液相色谱(HPLC)测定校正和检验样本中花色苷含量,以矢车菊素-3-O-葡萄糖苷作为标准品定量,HPLC检测波长为520nm;
3)样本光谱的预处理:
首先采用卷积平滑法(Savitzky-Golay)对样本原始光谱进行处理,消除光谱噪声,提高分辨率和灵敏度;继续使用多元散射校正算法(Multiplicative scattercorrection,MSC)处理光谱,消除颗粒分布不均匀级颗粒大小产生的散射影响。预处理过程中需剔除差异性较大的个别数据。
4)采用多元回归算法建立校正模型:
偏最小二乘回归法(partial least square regression,PLSR)是一种新型的多元统计数据分析方法,它主要研究的是多因变量对多自变量的回归建模,特别当各变量内部高度线性相关时,用PLSR更有效。另外,偏最小二乘回归较好地解决了样本个数少于变量个数等问题。
对于预处理后的校正样本集光谱数据和校正样本集的花色苷含量测量值,通过多元回归算法来建立校正模型;具体操作为结合光谱预处理方法和偏最小二乘回归法建模,采用检测样本集,评估建立模型的效果,确定出最佳的处理方法,建立杨梅中花色苷含量的预测模型。
首先结合预处理后校正样本集900~1700nm的光谱数据和花色苷含量,采用偏最小二乘回归法(partial least squares regression,PLSR)建模,通过X-载荷(X-loadingweight)图,提取光谱特征值,选取波峰及波谷段光谱,特征光谱波长范围是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光谱波长数据和花色苷含量再次使用PLSR建模,建模后代入检测样本集光谱数据,计算花色苷实际值,与预测值的相关性系数(R2),优化上述特征光谱范围至R2大于0.9,选取R2最大值时对应的特征光谱波长范围,得到最佳建模特征光谱,建立杨梅中花色苷含量的最优预测模型。
上述最优建模特征光谱波长范围是924.60~931.40、961.59~981.73、1042.16~1176.63和1257.43~1274.27nm,模型预测值与实际值的R2为0.9112,模型预测值与实际值R2为0.9021,均方根误差(Root-mean-square error,RMSE)值为0.0924。
5)预测样本花色苷含量测定:
扫描样品特征光谱波长,采集近红外高光谱数据,将光谱数据输入杨梅花色苷含量预测模型,计算得到待测样品中花色苷含量。
光谱数据预处理、建模及预测均在The Unscrambler X软件上操作。
图2是本发明的杨梅花色苷液相色谱图,结果表明,杨梅中的花色苷为矢车菊素-3-O-葡萄糖苷。
图3是本发明的近红外高光谱图像的原始平均光谱曲线图。
实施例三
一种基于近红外高光谱的杨梅中花色苷含量测定的方法,其特征在于该方法的步骤如下:
1)样本光谱的建立:
收集不同品种新鲜杨梅样本随机分配,建立校正样本集和检验样本集;对校正和检验样本集中的样本运用高光谱成像系统进行光谱扫描,其中镜头与样本距离为30cm,曝光时间为5s,样本移动速度为20mm/s,采集近红外波段高光谱图像,得到校正和检验样本集光谱;
上述步骤中,样本集和检验样本集各包含400和400颗杨梅,采集的近红外波段范围是900~1700nm
2)样本花色苷含量的测定:
采集光谱后,使用50%乙醇提取样本,再应用高效液相色谱(HPLC)测定校正和检验样本中花色苷含量,以矢车菊素-3-O-葡萄糖苷作为标准品定量,HPLC检测波长为520nm;
3)样本光谱的预处理:
首先采用高斯平滑滤波(Gaussian filter)对样本原始光谱进行处理,消除光谱噪声,提高分辨率和灵敏度;继续使用标准正态变量变换算法(Standard normal variatetransformation,SNV)处理,消除固体颗粒大小、表面散射以及光程变化对光谱的影响。预处理过程中需剔除差异性较大的个别数据。
4)采用多元回归算法建立校正模型:
偏最小二乘回归法(partial least square regression,PLSR)是一种新型的多元统计数据分析方法,它主要研究的是多因变量对多自变量的回归建模,特别当各变量内部高度线性相关时,用PLSR更有效。另外,偏最小二乘回归较好地解决了样本个数少于变量个数等问题。
对于预处理后的校正样本集光谱数据和校正样本集的花色苷含量测量值,通过多元回归算法来建立校正模型;具体操作为结合光谱预处理方法和偏最小二乘回归法建模,采用检测样本集,评估建立模型的效果,确定出最佳的处理方法,建立杨梅中花色苷含量的预测模型。
首先结合预处理后校正样本集900~1700nm的光谱数据和花色苷含量,采用偏最小二乘回归法(partial least squares regression,PLSR)建模,通过X-载荷(X-loadingweight)图,提取光谱特征值,选取波峰及波谷段光谱,特征光谱波长范围是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm。;以第一次建模得到的部分或全部校正特征光谱波长数据和花色苷含量再次使用PLSR建模,建模后代入检测样本集光谱数据,计算花色苷实际值,与预测值的相关性系数(R2),优化上述特征光谱范围至R2大于0.9,选取R2最大值时对应的特征光谱波长范围,得到最佳建模特征光谱,建立杨梅中花色苷含量的最优预测模型。
上述最优建模特征光谱波长范围是961.59~991.79、1042.16~1176.63和1257.43~1294.49nm,模型预测值与实际值的R2为0.9038,模型预测值与实际值R2为0.9021,均方根误差(Root-mean-square error,RMSE)值为0.0837。
5)预测样本花色苷含量测定:
扫描样品特征光谱波长,采集近红外高光谱数据,将光谱数据输入杨梅花色苷含量预测模型,计算得到待测样品中花色苷含量。
光谱数据预处理、建模及预测均在The Unscrambler X软件上操作。
图4是本发明的经平滑处理和标准正态变量变换算法(SNV)处理后的近红外高光谱曲线图,处理后噪声明显降低;
图5是本发明的杨梅花色苷的X-载荷(X-loading weight)图,通过波峰和波谷选择特征光谱;
实施例四
一种基于近红外高光谱的杨梅中花色苷含量测定的方法,其特征在于该方法的步骤如下:
1)样本光谱的建立:
收集不同品种新鲜杨梅样本随机分配,建立校正样本集和检验样本集;对校正和检验样本集中的样本运用高光谱成像系统进行光谱扫描,其中镜头与样本距离为25cm,曝光时间为4s,样本移动速度为16mm/s,采集近红外波段高光谱图像,得到校正和检验样本集光谱;
上述步骤中,样本集和检验样本集各包含300和300颗杨梅,采集的近红外波段范围是900~1600nm
2)样本花色苷含量的测定:
采集光谱后,使用60%乙醇提取样本,再应用高效液相色谱(HPLC)测定校正和检验样本中花色苷含量,以矢车菊素-3-O-葡萄糖苷作为标准品定量,HPLC检测波长为520nm;
3)样本光谱的预处理:
首先采用中值滤波平滑(Median filter smoothing)对样本原始光谱进行处理,消除光谱噪声,提高分辨率和灵敏度;继续使用标准正态变量变换算法(Standard normalvariate transformation,SNV)处理,消除固体颗粒大小、表面散射以及光程变化对光谱的影响。预处理过程中需剔除差异性较大的个别数据。
4)采用多元回归算法建立校正模型:
偏最小二乘回归法(partial least square regression,PLSR)是一种新型的多元统计数据分析方法,它主要研究的是多因变量对多自变量的回归建模,特别当各变量内部高度线性相关时,用PLSR更有效。另外,偏最小二乘回归较好地解决了样本个数少于变量个数等问题。
对于预处理后的校正样本集光谱数据和校正样本集的花色苷含量测量值,通过多元回归算法来建立校正模型;具体操作为结合光谱预处理方法和偏最小二乘回归法建模,采用检测样本集,评估建立模型的效果,确定出最佳的处理方法,建立杨梅中花色苷含量的预测模型。
首先结合预处理后校正样本集900~1700nm的光谱数据和花色苷含量,采用偏最小二乘回归法(partial least squares regression,PLSR)建模,通过X-载荷(X-loadingweight)图,提取光谱特征值,选取波峰及波谷段光谱,特征光谱波长范围是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光谱波长数据和花色苷含量再次使用PLSR建模,建模后代入检测样本集光谱数据,计算花色苷实际值,与预测值的相关性系数(R2),优化上述特征光谱范围至R2大于0.9,选取R2最大值时对应的特征光谱波长范围,得到最佳建模特征光谱,建立杨梅中花色苷含量的最优预测模型。
上述最优建模特征光谱波长范围是924.60~931.40、961.59~981.73、1042.16~1069.03、1146.35~1159.82和1257.43~1274.27nm,模型预测值与实际值R2为0.9165,模型预测值与实际值的R2为0.9021,均方根误差(Root-mean-square error,RMSE)值为0.0766。
5)预测样本花色苷含量测定:
扫描样品特征光谱波长,采集近红外高光谱数据,将光谱数据输入杨梅花色苷含量预测模型,计算得到待测样品中花色苷含量。
光谱数据预处理、建模及预测均在The Unscrambler X软件上操作。
图6本发明的杨梅花色苷预测模型,拟合度可达91.65%,说明该模型可以较好的预测杨梅中花色苷含量。
最后,本发明可用其他的不违背本发明的精神和主要特征的具体形式来概述。因此,无论从那一点来看,本发明的上述实施方案都只能认为是对本发明的说明而不能限制本发明,权利要求书指出了本发明的范围,而上述的说明并未指出本发明的范围,因此,在与本发明的权利要求书相当的含义和范围内的任何改变,都应认为是包括在权利要求书的范围内。
Claims (3)
1.一种基于高光谱的杨梅中花色苷含量测定的方法,其特征在于该方法的步骤如下:
1)样本光谱的建立:
收集不同品种新鲜杨梅样本随机分配,建立校正样本集和检验样本集;对校正和检验样本集中的样本运用高光谱成像系统进行光谱扫描,其中镜头与样本距离为15~30cm,曝光时间为1~5s,样本移动速度为10~20mm/s,采集900~1700nm近红外波段高光谱图像,得到校正样本集光谱和检验样本集光谱;
2)样本花色苷含量的测定:
采集光谱后,使用体积百分比为40~80%的乙醇提取样本,再应用高效液相色谱测定校正样本和检验样本中花色苷含量,以矢车菊素-3-O-葡萄糖苷作为标准品定量,HPLC检测波长为520nm;
3)样本光谱的预处理:
首先采用平滑法对样本原始光谱进行处理,消除光谱噪声,提高分辨率和灵敏度;继而使用标准正态变量变换算法或多元散射校正算法处理,消除固体颗粒大小、表面散射以及光程变化对光谱的影响;
4)采用多元回归算法建立校正模型:
首先结合预处理后校正样本集900~1700nm的光谱数据和花色苷含量,采用偏最小二乘回归法建模,通过X-载荷图,提取校正光谱特征值,选取波峰及波谷段光谱,特征光谱波长范围是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光谱波长数据和花色苷含量再次使用偏最小二乘回归法建模,建模后代入检测样本集光谱数据,计算花色苷实际值与预测值的相关性系数R2,优化上述特征光谱范围至R2大于0.9,选取R2最大值时对应的特征光谱波长范围,得到最佳建模特征光谱,建立杨梅中花色苷含量的最优预测模型;
5)预测样本花色苷含量测定:
扫描待测样品特征光谱波长,运用步骤1)中的条件采集近红外高光谱数据,将光谱数据输入杨梅中花色苷含量的最优预测模型,计算得到待测样品中花色苷含量。
2.根据权利要求1所述的基于高光谱的杨梅中花色苷含量测定的方法,其特征在于所述的步骤3)采用的平滑法包括移动平均平滑法、卷积平滑法、高斯平滑滤波、中值滤波平滑中的一种或多种。
3.根据权利要求1所述的基于高光谱的杨梅中花色苷含量测定的方法,其特征在于所述的最优特征光谱波长范围是924.60~931.40、961.59~981.73、1042.16~1069.03、1146.35~1159.82和1257.43~1274.27nm。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710100743.XA CN106872370A (zh) | 2017-02-23 | 2017-02-23 | 一种基于高光谱的杨梅中花色苷含量测定的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710100743.XA CN106872370A (zh) | 2017-02-23 | 2017-02-23 | 一种基于高光谱的杨梅中花色苷含量测定的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106872370A true CN106872370A (zh) | 2017-06-20 |
Family
ID=59169361
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710100743.XA Pending CN106872370A (zh) | 2017-02-23 | 2017-02-23 | 一种基于高光谱的杨梅中花色苷含量测定的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106872370A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247025A (zh) * | 2017-07-24 | 2017-10-13 | 中国水稻研究所 | 利用颜色参数指标判定黑米花色苷含量的方法 |
CN108827910A (zh) * | 2018-06-13 | 2018-11-16 | 深圳市华慧品牌管理有限公司 | 果实安全加工时间预测模型的建立方法 |
CN109406414A (zh) * | 2018-10-31 | 2019-03-01 | 中国中医科学院中药研究所 | 基于高光谱成像技术预测枸杞子中香草酸含量的方法 |
CN109507353A (zh) * | 2019-01-04 | 2019-03-22 | 安徽农业大学 | 一种黑小麦麸皮中花色苷的高效液相色谱检测方法 |
CN109668984A (zh) * | 2019-01-30 | 2019-04-23 | 山西医科大学第医院 | 一种基于代谢组学的喉癌血清判别模型的构建方法 |
CN112098415A (zh) * | 2020-08-06 | 2020-12-18 | 杭州电子科技大学 | 一种杨梅品质无损检测方法 |
CN114813593A (zh) * | 2022-03-30 | 2022-07-29 | 四川轻化工大学 | 基于高光谱成像技术的糟醅总酸含量的检测方法 |
CN116306984A (zh) * | 2023-05-16 | 2023-06-23 | 北京市农林科学院信息技术研究中心 | 紫色系作物鲜叶花色苷检测模型训练、检测方法及装置 |
CN117607066A (zh) * | 2023-12-27 | 2024-02-27 | 中国热带农业科学院南亚热带作物研究所 | 基于高光谱成像的茄子皮中花青素浓度确定方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011155888A1 (en) * | 2010-06-09 | 2011-12-15 | Umbio Ab | Procedure for hyperspectral image analysis in real time |
CN102590149A (zh) * | 2012-03-01 | 2012-07-18 | 浙江大学 | 一种虫草菌粉天冬氨酸含量快速检测方法 |
CN103411973A (zh) * | 2013-09-03 | 2013-11-27 | 西北农林科技大学 | 一种基于高光谱的酿酒葡萄果皮中花色苷含量测定的方法 |
CN105139022A (zh) * | 2015-07-21 | 2015-12-09 | 天津大学 | 一种通过近红外高光谱图像技术建立塑料识别模型的方法 |
-
2017
- 2017-02-23 CN CN201710100743.XA patent/CN106872370A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011155888A1 (en) * | 2010-06-09 | 2011-12-15 | Umbio Ab | Procedure for hyperspectral image analysis in real time |
CN102590149A (zh) * | 2012-03-01 | 2012-07-18 | 浙江大学 | 一种虫草菌粉天冬氨酸含量快速检测方法 |
CN103411973A (zh) * | 2013-09-03 | 2013-11-27 | 西北农林科技大学 | 一种基于高光谱的酿酒葡萄果皮中花色苷含量测定的方法 |
CN105139022A (zh) * | 2015-07-21 | 2015-12-09 | 天津大学 | 一种通过近红外高光谱图像技术建立塑料识别模型的方法 |
Non-Patent Citations (1)
Title |
---|
邹小波等: "基于近红外高光谱图像的黄瓜叶片色素含量快速检测", 《农业机械学报》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247025A (zh) * | 2017-07-24 | 2017-10-13 | 中国水稻研究所 | 利用颜色参数指标判定黑米花色苷含量的方法 |
CN108827910A (zh) * | 2018-06-13 | 2018-11-16 | 深圳市华慧品牌管理有限公司 | 果实安全加工时间预测模型的建立方法 |
CN109406414A (zh) * | 2018-10-31 | 2019-03-01 | 中国中医科学院中药研究所 | 基于高光谱成像技术预测枸杞子中香草酸含量的方法 |
CN109507353A (zh) * | 2019-01-04 | 2019-03-22 | 安徽农业大学 | 一种黑小麦麸皮中花色苷的高效液相色谱检测方法 |
CN109668984A (zh) * | 2019-01-30 | 2019-04-23 | 山西医科大学第医院 | 一种基于代谢组学的喉癌血清判别模型的构建方法 |
CN112098415A (zh) * | 2020-08-06 | 2020-12-18 | 杭州电子科技大学 | 一种杨梅品质无损检测方法 |
CN112098415B (zh) * | 2020-08-06 | 2022-11-18 | 杭州电子科技大学 | 一种杨梅品质无损检测方法 |
CN114813593A (zh) * | 2022-03-30 | 2022-07-29 | 四川轻化工大学 | 基于高光谱成像技术的糟醅总酸含量的检测方法 |
CN116306984A (zh) * | 2023-05-16 | 2023-06-23 | 北京市农林科学院信息技术研究中心 | 紫色系作物鲜叶花色苷检测模型训练、检测方法及装置 |
CN116306984B (zh) * | 2023-05-16 | 2023-09-12 | 北京市农林科学院信息技术研究中心 | 紫色系作物鲜叶花色苷检测模型训练、检测方法及装置 |
CN117607066A (zh) * | 2023-12-27 | 2024-02-27 | 中国热带农业科学院南亚热带作物研究所 | 基于高光谱成像的茄子皮中花青素浓度确定方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Nondestructive measurement of soluble solids content in apple using near infrared hyperspectral imaging coupled with wavelength selection algorithm | |
CN106872370A (zh) | 一种基于高光谱的杨梅中花色苷含量测定的方法 | |
Li et al. | Recent advances in nondestructive analytical techniques for determining the total soluble solids in fruits: a review | |
Teerachaichayut et al. | Non-destructive prediction of total soluble solids, titratable acidity and maturity index of limes by near infrared hyperspectral imaging | |
Wang et al. | Quality analysis, classification, and authentication of liquid foods by near-infrared spectroscopy: A review of recent research developments | |
CN107064053A (zh) | 基于近红外高光谱技术无损检测杨梅中多酚含量的方法 | |
EP3734254B1 (en) | Method for determining water soluble protein content (wspc) in soybean by near infrared spectroscopy (nirs) | |
CN103674838B (zh) | 一种基于高光谱成像技术的鱼脂肪含量分布检测方法 | |
Luo et al. | Prediction of soluble solid content in Nanfeng mandarin by combining hyperspectral imaging and effective wavelength selection | |
Sun et al. | Rapid detection and quantification of adulteration in Chinese hawthorn fruits powder by near-infrared spectroscopy combined with chemometrics | |
CN105606473B (zh) | 一种基于机器视觉的红提葡萄硬度无损检测方法 | |
CN106885782A (zh) | 一种基于近红外高光谱技术无损检测杨梅中黄酮含量的方法 | |
CN102937575B (zh) | 一种基于二次光谱重组的西瓜糖度快速建模方法 | |
CN101275912A (zh) | 一种液体食品褐变检测方法 | |
CN106226267B (zh) | 一种辣椒干色价的近红外测定方法 | |
CN103868857A (zh) | 一种农药残留的检测方法、装置及系统 | |
CN105352913A (zh) | 一种近红外光谱检测灵芝提取物多糖含量的方法 | |
CN110231306A (zh) | 一种无损、快速测定奇亚籽蛋白质含量的方法 | |
Miao et al. | Non-destructive determination of ginsenosides in ginseng by combined hyperspectral and X-ray techniques based on ensemble learning | |
CN106198423B (zh) | 一种基于可见-近红外光谱分析技术鉴别火腿肠等级的方法 | |
Giovenzana et al. | Comparison of two immersion probes coupled with visible/near infrared spectroscopy to assess the must infection at the grape receiving area | |
KR101660482B1 (ko) | 근적외선분광광도계를 이용한 홍삼 농축액의 원산지 판별방법 | |
CN110231305A (zh) | 一种测定奇亚籽中dpph自由基清除能力的方法 | |
CN107036999A (zh) | 一种基于近红外光谱及化学计量学的五元调和油定量分析方法 | |
Wang et al. | Application of visible/near-infrared spectroscopy combined with machine vision technique to evaluate the ripeness of melons (Cucumis melo L.) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170620 |
|
RJ01 | Rejection of invention patent application after publication |