CN113536927A - 一种赣南脐橙鉴别方法、系统及存储介质 - Google Patents
一种赣南脐橙鉴别方法、系统及存储介质 Download PDFInfo
- Publication number
- CN113536927A CN113536927A CN202110660376.5A CN202110660376A CN113536927A CN 113536927 A CN113536927 A CN 113536927A CN 202110660376 A CN202110660376 A CN 202110660376A CN 113536927 A CN113536927 A CN 113536927A
- Authority
- CN
- China
- Prior art keywords
- navel orange
- near infrared
- infrared spectrum
- navel
- producing area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000005976 Citrus sinensis Nutrition 0.000 title claims abstract description 399
- 240000002319 Citrus sinensis Species 0.000 title claims abstract description 399
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 173
- 238000013145 classification model Methods 0.000 claims abstract description 45
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 9
- 238000012795 verification Methods 0.000 claims description 22
- 238000007781 pre-processing Methods 0.000 claims description 14
- 230000003595 spectral effect Effects 0.000 claims description 9
- 238000013480 data collection Methods 0.000 claims description 6
- 238000010200 validation analysis Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000012850 discrimination method Methods 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 70
- 238000004519 manufacturing process Methods 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 5
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000012468 concentrated sample Substances 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000005670 electromagnetic radiation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 235000015203 fruit juice Nutrition 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
一种赣南脐橙鉴别方法、系统及存储介质,赣南脐橙鉴别方法包括以下步骤:获取多个产地的脐橙样本集,多个产地划分为赣南脐橙产区、以及非赣南脐橙产区;获得每个脐橙样本集对应的脐橙近红外光谱集;采用偏最小二乘判别法建立真假脐橙判别模型;采用主成分分析法分别针对每个产地构建脐橙产地分类模型;获取待检测脐橙的近红外光谱数据,并输入至真假脐橙判别模型和多个脐橙产地分类模型中鉴别。本发明基于近红外光谱建模进行识别,相较于传统识别方式,具备快速、无破坏、无污染、稳定可靠等优点。在结合便携式近红外光谱仪后,通过本发明可以对于市场上的任何脐橙样本进行分析,实现产地归属和真伪鉴别的目的。
Description
技术领域
本发明属于水果检测领域,具体涉及一种赣南脐橙鉴别方法、系统及存储介质。
背景技术
赣南脐橙已被列为全国十一大优势农产品之一,荣获"中华名果"等称号。赣南脐橙作为江西省唯一产品,入围商务部、质检总局中欧地理标志协定谈判的地理标志产品清单。赣南脐橙果大形正,橙红鲜艳,光洁美观,可食率达85%,肉质脆嫩、化渣,风味浓甜芳香,含果汁55%以上。
但是,正因为赣南脐橙的优势,目前市面上开始出现了以其他地区的脐橙来混淆赣南脐橙进行销售的现象,而市场监督部门在获得这些脐橙之后,只能采用人工辨别的方式辨别是否是真正的赣南脐橙,但是人工识别却主要依赖于鉴别人员的主观意思,一方面可能出现误判,另一方面也没有足够的理论依据对结果进行支持。
基于此,市面上推出了一些脐橙识别的方法,但是这些脐橙识别方法大多是基于照片建立鉴别模型,因此只能从大小、形状、颜色等方面进行简单的判断,因此,存在较大的错误率。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种赣南脐橙鉴别方法,所述赣南脐橙鉴别方法解决了只能人工识别赣南脐橙或者自动识别赣南脐橙时错误率高的问题。本发明还提出了一种赣南脐橙鉴别系统和一种用于存储上述赣南脐橙鉴别方法的计算机可执行指令的存储介质。
根据本发明第一方面实施例的赣南脐橙鉴别方法,包括以下步骤:
获取多个产地的脐橙样本集,多个所述产地划分为赣南脐橙产区、以及非赣南脐橙产区;
利用近红外光谱仪对每一个所述脐橙样本集中的样本进行近红外光谱采集,以获得每个所述脐橙样本集对应的脐橙近红外光谱集;
对每个所述脐橙近红外光谱子集中的每个近红外光谱数据进行预处理;
分别从多个所述脐橙近红外光谱集中选取不少于预设的第一建模数量的近红外光谱数据组成第一建模用样本集,并采用偏最小二乘判别法建立真假脐橙判别模型;
从每个产地的所述脐橙近红外光谱集中选取不少于预设的第二建模数量的近红外光谱数据作为第二建模用样本集,并采用主成分分析法分别针对每个产地构建脐橙产地分类模型;
获取待检测脐橙的近红外光谱数据,并输入至所述真假脐橙判别模型和多个所述脐橙产地分类模型中,以获得所述待检测脐橙的真假信息和产地信息。
根据本发明实施例的赣南脐橙鉴别方法,至少具有如下技术效果:通过采用近红外光谱结合主成分分析法建立多个脐橙产地分类模型可以用作识别不同产地赣南脐橙,通过采用近红外光谱结合偏最小二乘判别分析法建立真假脐橙判别模型可以有效识别是否是赣南脐橙产区的脐橙。本发明实施例的赣南脐橙鉴别方法基于近红外光谱建模进行识别,相较于传统的人工判别和自动识别而言,具备快速、无破坏、无污染、稳定可靠等优点。而且在结合便携式近红外光谱仪后,通过本发明实施例的赣南脐橙鉴别方法可以对于市场上的任何脐橙样本进行分析,实现产地归属和真伪鉴别的目的。
根据本发明的一些实施例,所述获取待检测脐橙的近红外光谱数据之前还包括以下步骤:
将多个所述脐橙近红外光谱集中非所述第一建模用样本集的近红外光谱数据组成验证集,并使用所述验证集验证所述真假脐橙判别模型。
根据本发明的一些实施例,所述第一建模用样本集中近红外光谱数据和所述验证集中近红外光谱数据的数量比为1:2至1:5。
根据本发明的一些实施例,所述利用近红外光谱仪对每一个所述脐橙样本集中的样本进行近红外光谱采集包括以下步骤:
对每一个所述脐橙样本集中的样本的多个位置进行采集,以获得多个原始近红外光谱数据;
将多个所述原始近红外光谱数据平均后转化成一条所述近红外光谱数据。
根据本发明的一些实施例,对每一个所述脐橙样本集中的样本的多个位置进行采集时,选取样本赤道区域进行采集。
根据本发明的一些实施例,所述预处理至少包括:多元散射校正、二阶导数。
根据本发明的一些实施例,采集近红外光谱数据时,采集波长范围在的波长范围为1000-1800nm,波长间隔点位为1nm。
根据本发明第二方面实施例的赣南脐橙鉴别系统,包括:
近红外光谱采集单元,用于采集多个产地脐橙样本集的近红外光谱数据、以及采集待检测脐橙的近红外光谱数据;多个所述产地划分为赣南脐橙产区、以及非赣南脐橙产区;
光谱数据汇集模块,用于依据多个所述产地脐橙样本集的近红外光谱数据建立每个所述脐橙样本集对应的脐橙近红外光谱集;
预处理单元,用于对每个所述脐橙近红外光谱子集中的每个近红外光谱数据进行预处理;
真假脐橙鉴别模块,其内置有真假脐橙判别模型,所述真假脐橙判别模型依据多个所述脐橙近红外光谱集并采用偏最小二乘判别法建立,用于鉴别所述待检测脐橙的真假信息;
脐橙产地鉴别模块,其内置有多个脐橙产地分类模型,每个所述真脐橙产地分类模型依据对应的所述脐橙近红外光谱集并采用主成分分析法构建,多个所述真脐橙产地分类模型共同用于鉴别所述待检测脐橙的产地信息;
显示单元,用于展示所述真假脐橙鉴别模块和脐橙产地鉴别模块的鉴别结果。
根据本发明实施例的赣南脐橙鉴别系统,至少具有如下技术效果:通过近红外光谱采集单元和光谱数据汇集模块可以实现对脐橙样本近红外光谱数据的有效采集和汇聚,脐橙产地鉴别模块通过采用近红外光谱结合主成分分析法建立多个脐橙产地分类模型可以用作识别不同产地赣南脐橙,真假脐橙鉴别模块通过采用近红外光谱结合偏最小二乘判别分析法建立真假脐橙判别模型可以有效识别是否是赣南脐橙产区的脐橙,预处理单元可以对近红外光谱进行预处理,以便于更好的建力模型。本发明实施例的赣南脐橙鉴别系统基于近红外光谱建模进行识别,相较于传统的人工判别和自动识别而言,具备快速、无破坏、无污染、稳定可靠等优点。而且在近红外光谱采集单元采用便携式近红外光谱仪后,通过本发明实施例的赣南脐橙鉴别系统可以对于市场上的任何脐橙样本进行分析,实现产地归属和真伪鉴别的目的。
根据本发明的一些实施例,上述赣南脐橙鉴别系统还包括验证模块,所述验证模块用于将多个所述脐橙近红外光谱集中非所述第一建模用样本集的近红外光谱数据组成验证集,并使用所述验证集验证所述真假脐橙判别模型。
根据发明第三方面实施例的计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述的赣南脐橙鉴别方法。
根据本发明实施例的计算机可读存储介质,至少具有如下有益效果:通过存储介质可以便于计算机可执行指令的存储和转移。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明实施例的赣南脐橙鉴别方法的流程简图;
图2是本发明实施例的赣南脐橙鉴别系统的结构框图;
图3是不同地区脐橙的NIR PCA图;
图4是赣南脐橙产区和非赣南脐橙产区的PLS-DA图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
下面参考图1至图4描述根据本发明第一方面实施例的赣南脐橙鉴别方法。
根据本发明实施例的赣南脐橙鉴别方法,包括以下步骤:
获取多个产地的脐橙样本集,多个产地划分为赣南脐橙产区、以及非赣南脐橙产区;
利用近红外光谱仪对每一个脐橙样本集中的样本进行近红外光谱采集,以获得每个脐橙样本集对应的脐橙近红外光谱集;
对每个脐橙近红外光谱子集中的每个近红外光谱数据进行预处理;
分别从多个脐橙近红外光谱集中选取不少于预设的第一建模数量的近红外光谱数据组成第一建模用样本集,并采用偏最小二乘判别法建立真假脐橙判别模型;
从每个产地的脐橙近红外光谱集中选取不少于预设的第二建模数量的近红外光谱数据作为第二建模用样本集,并采用主成分分析法分别针对每个产地构建脐橙产地分类模型;
获取待检测脐橙的近红外光谱数据,并输入至真假脐橙判别模型和多个脐橙产地分类模型中,以获得待检测脐橙的真假信息和产地信息。
参考图1、图2,首先需要采集多个产地的脐橙样本,并针对每个产地的脐橙样本构建脐橙样本集。在选择产地时,为了保证后续鉴别的准确性,这里需要分别在赣南脐橙产区和非赣南脐橙产区分别针对性进行采集,并且需要尽可能的保证赣南脐橙产区中样本数量大于非赣南脐橙产区中样本数量。
构建好多个产地的脐橙样本集后,这里会使用近红外光谱仪针对所有的脐橙样本进行近红外光谱数据采集,并依据之前建立的脐橙样本集建立对应的脐橙近红外光谱集。近红外光谱是介于可见光和中红外之间的电磁辐射波,近红外光谱区与有机分子中含氢基团振动的合频和各级倍频的吸收区一致,通过扫描样品的近红外光谱,可以得到样品中有机分子含氢基团的特征信息,而且利用近红外光谱技术分析样品具有方便、快速、高效、准确和成本较低,不破坏样品,不消耗化学试剂,不污染环境等优点。因此,通过脐橙样本的近红外光谱数据可以对脐橙的产地和真假进行有效的鉴别。此外,在采集好近红外光谱数据后会进行预处理,以便于后续进行建模使用。
这里便基于脐橙近红外光谱集建立真假脐橙判别模型。将多个产地的脐橙近红外光谱集中的近红外光谱数据进行了抽取,抽取的数量需要超过预设的第一建模数量,这些近红外光谱数据会组成第一建模用样本集,在实际操作时,第一建模用样本集通常需要过整体数量的2/3,这样才可以保证后续建立的真假脐橙判别模型的准确性。而剩余的一部分近红外光谱数据则会用作验证集使用,用于验证真假脐橙判别模型的准确性。第一建模数量建立完成之后,则可以依据偏最小二乘判别法(PLS-DA)建立真假脐橙判别模型,并使用第一建模用样本集对真假脐橙判别模型进行训练,以保证模型的准确率超过95%甚至达到完全正确,此时,该真假脐橙判别模型才可用于进行真伪判断。此外需要说明,第一建模用样本集中数据因为是由所有产地的脐橙近红外光谱集中选取,因此,必然会包含了赣南脐橙产区和非赣南脐橙产区,也就是说,在进行脐橙的真假鉴别时,实质上是判断待检测脐橙是否是属于赣南脐橙产区,即,真假信息可以标注为赣南脐橙和非赣南脐橙。
这里便基于脐橙近红外光谱集建立脐橙产地分类模型。脐橙产地分类模型建立不同于建立真假脐橙判别模型,这里需要针对每个产地都建立一个脐橙产地分类模型,然后利用多个脐橙产地分类模型区鉴别脐橙的产地。以建立一个脐橙产地分类模型为例:从一个产地的脐橙近红外光谱集中抽取第二建模数量的近红外光谱数据作为第二建模用样本集,第二建模用样本集也需要足够大,通常需要超过该脐橙近红外光谱集中样本数量的2/3,之后采用主成分分析法便可以构建该产地的脐橙产地分类模型。利用相同的方式,便可以构建出所有产地的脐橙产地分类模型,之后利用这些脐橙产地分类模型便可以鉴别出待检测脐橙的产地。此外需要说明,在赣南脐橙产区和非赣南脐橙产区中产地都只有一个时,便可以用作判断脐橙是否是赣南脐橙产区,但是在实际检测中,因为需要进一步判断出具体的产地,因此非赣南脐橙产区会包括一些同样具备特色的脐橙区域,例如:贺州脐橙产区、秭归脐橙产区、大凉山脐橙产区等等,那么在建立多个产地的脐橙产地分类模型时,便会对应建立这些产地的脐橙产地分类模型,进而可以在真假脐橙判别模型判断真假的同时,还有知晓具体是使用哪里的脐橙进行冒充。此外需要说明,未在脐橙产地分类模型过程中选取的脐橙近红外光谱集中样本同样会用作验证时使用。
最后,在需要进行待检测脐橙检测时,便可以使用便携式近红外光谱仪采集待检测脐橙的近红外光谱数据,然后利用真假脐橙判别模型和多个脐橙产地分类模型完成对待检测脐橙的真假和产地的鉴别。
根据本发明实施例的赣南脐橙鉴别方法,通过采用近红外光谱结合主成分分析法建立多个脐橙产地分类模型可以用作识别不同产地赣南脐橙,通过采用近红外光谱结合偏最小二乘判别分析法建立真假脐橙判别模型可以有效识别是否是赣南脐橙产区的脐橙。本发明实施例的赣南脐橙鉴别方法基于近红外光谱建模进行识别,相较于传统的人工判别和自动识别而言,具备快速、无破坏、无污染、稳定可靠等优点。而且在结合便携式近红外光谱仪后,通过本发明实施例的赣南脐橙鉴别方法可以对于市场上的任何脐橙样本进行分析,实现产地归属和真伪鉴别的目的。
在本发明的一些实施例中,获取待检测脐橙的近红外光谱数据之前还包括以下步骤:
将多个脐橙近红外光谱集中非第一建模用样本集的近红外光谱数据组成验证集,并使用验证集验证真假脐橙判别模型。
在实际工程中,建立真假脐橙判别模型后,通过训练可以用来作为脐橙真假鉴别使用,但是却难以直接确定真假脐橙判别模型鉴别的准确率,因此需要通过验证集来验证准确率,如果不合格,则需要继续进行训练,直至验证的准确率满足使用需求。
在本发明的一些实施例中,每个脐橙产地分类模型通用会使用没用于建模的近红外光谱数据进行正确率验证。
在本发明的一些实施例中,第一建模用样本集中近红外光谱数据和验证集中近红外光谱数据的数量比为1:2至1:5。为了保证建模的准确性,需要保证用于建模的近红外光谱数据的数量足够的大,这里会选择2/3到4/5的比例,一方面可以保证建模的准确性,同时,剩余的近红外光谱数据也可以更准确的用来验证模型的准确性。在本发明的一些实施例中,不会使用脐橙近红外光谱集中所有的近红外光谱数据,而是会依照1:2至1:5的比例进行随机抽取,只需要保证最后抽取的足够大,那么组成的第一建模用样本集并可以建立好模型,同样,验证集也可以验证好模型。在本发明的一些实施例中,会随机选取181个近红外光谱数据作为训练集,46个近红外光谱数据作为验证集。
在本发明的一些实施例中,利用近红外光谱仪对每一个脐橙样本集中的样本进行近红外光谱采集包括以下步骤:
对每一个脐橙样本集中的样本的多个位置进行采集,以获得多个原始近红外光谱数据;
将多个原始近红外光谱数据平均后转化成一条近红外光谱数据。
在针对每一个脐橙样本采集近红外光谱数据时,为了保证近红外光谱数据的准确性,会在脐橙样本上选取多个位置采集原始近红外光谱数据,然后将多个原始近红外光谱数据平均转化为一条近红外光谱数据,最后将这一条近红外光谱数据导入脐橙近红外光谱集。通常,至少选取3个位置,且三个位置之间进行等间距分布。
在本发明的一些实施例中,对每一个脐橙样本集中的样本的多个位置进行采集时,选取样本赤道区域进行采集。在确定采样位置之前,这里对脐橙不同区域的近红外光谱数据的差别进行单独的分析,发现采集脐橙的顶部、底部、赤道区域的近红外光谱数据并不会具有太大的差别,反而赤道附近的近红外光谱数据更便于采集。
在本发明的一些实施例中,预处理至少包括:多元散射校正、二阶导数。采用多元散射校正(MCS)加上二阶导数(S-G D2)对近红外光谱数据进行预处理,可以有效的去取因为采集问题造成的一些干扰信息,从而可以保证后续建模的准确性。
在本发明的一些实施例中,采集近红外光谱数据时,采集波长范围在的波长范围为1000-1800nm,波长间隔点位为1nm。近红外光谱区定义为780-2526nm的区域,如果使用这个波长范围去进行近红外光谱数据采集,那么会造成数据过大且具备大量无用的数据。采用1000-1800nm的波长范围,并使用1nm波长间隔点位,可以有效的减少数据量的同时,也可以提高模型建立的速度,同时也可以排除一些无关特征带来的影响。
此外这里需要说明,参考图3、图4,图3是针对不同产地进行PCA分析之后的效果图,图中A表示赣南脐橙产区、B湖北的秭归脐橙产区、C四川的大凉山脐橙产区、D广西的贺州脐橙产区,黑色实心点全部是A产区,空心圈A、B、C分三个区域分布在A的外侧。这里可以明确得出,利用PCA分析法可以有效的将不同产地的脐橙进行区分,这也是本发明实施例的赣南脐橙鉴别方法构建的脐橙产地分类模型可以有效分别的基础。图4是针对赣南脐橙产区和非赣南脐橙产区使用验证集中近红外光谱数据验证真假脐橙判别模型准确率时的效果图,图中横坐标数值在0.5至1.5之间为赣南脐橙产区的近红外光谱数据,在-1.5至-0.5之间为非赣南脐橙产区的近红外光谱数据,这里看出,基本具备了完全分类正确的能力。
根据本发明第二方面实施例的赣南脐橙鉴别系统,包括:近红外光谱采集单元、光谱数据汇集模块、预处理单元、显示单元、真假脐橙鉴别模块、脐橙产地鉴别模块。
近红外光谱采集单元,用于采集多个产地脐橙样本集的近红外光谱数据、以及采集待检测脐橙的近红外光谱数据;多个产地划分为赣南脐橙产区、以及非赣南脐橙产区;
光谱数据汇集模块,用于依据多个产地脐橙样本集的近红外光谱数据建立每个脐橙样本集对应的脐橙近红外光谱集;
预处理单元,用于对每个脐橙近红外光谱子集中的每个近红外光谱数据进行预处理;
真假脐橙鉴别模块,其内置有真假脐橙判别模型,真假脐橙判别模型依据多个脐橙近红外光谱集并采用偏最小二乘判别法建立,用于鉴别待检测脐橙的真假信息;
脐橙产地鉴别模块,其内置有多个脐橙产地分类模型,每个真脐橙产地分类模型依据对应的脐橙近红外光谱集并采用主成分分析法构建,多个真脐橙产地分类模型共同用于鉴别待检测脐橙的产地信息;
显示单元,用于展示真假脐橙鉴别模块和脐橙产地鉴别模块的鉴别结果。
参考图1、图2,首先需要采集多个产地的脐橙样本,并针对每个产地的脐橙样本构建脐橙样本集。在选择产地时,为了保证后续鉴别的准确性,这里需要分别在赣南脐橙产区和非赣南脐橙产区分别针对性进行采集,并且需要尽可能的保证赣南脐橙产区中样本数量大于非赣南脐橙产区中样本数量。
构建好多个产地的脐橙样本集后,这里会使用近红外光谱采集单元针对所有的脐橙样本进行近红外光谱数据采集,光谱数据汇集模块依据之前建立的脐橙样本集建立对应的脐橙近红外光谱集。近红外光谱是介于可见光和中红外之间的电磁辐射波,近红外光谱区与有机分子中含氢基团振动的合频和各级倍频的吸收区一致,通过扫描样品的近红外光谱,可以得到样品中有机分子含氢基团的特征信息,而且利用近红外光谱技术分析样品具有方便、快速、高效、准确和成本较低,不破坏样品,不消耗化学试剂,不污染环境等优点。因此,通过脐橙样本的近红外光谱数据可以对脐橙的产地和真假进行有效的鉴别。此外,在采集好近红外光谱数据后会通过预处理单元进行预处理,以便于后续进行建模使用。
真假脐橙鉴别模块便基于脐橙近红外光谱集建立真假脐橙判别模型。将多个产地的脐橙近红外光谱集中的近红外光谱数据进行了抽取,抽取的数量需要超过预设的第一建模数量,这些近红外光谱数据会组成第一建模用样本集,在实际操作时,第一建模用样本集通常需要过整体数量的2/3,这样才可以保证后续建立的真假脐橙判别模型的准确性。而剩余的一部分近红外光谱数据则会用作验证集使用,用于验证真假脐橙判别模型的准确性。第一建模数量建立完成之后,则可以依据偏最小二乘判别法(PLS-DA)建立真假脐橙判别模型,并使用第一建模用样本集对真假脐橙判别模型进行训练,以保证模型的准确率超过95%甚至达到完全正确,此时,该真假脐橙判别模型才可用于进行真伪判断。此外需要说明,第一建模用样本集中数据因为是由所有产地的脐橙近红外光谱集中选取,因此,必然会包含了赣南脐橙产区和非赣南脐橙产区,也就是说,在进行脐橙的真假鉴别时,实质上是判断待检测脐橙是否是属于赣南脐橙产区,即,真假信息可以标注为赣南脐橙和非赣南脐橙。
脐橙产地鉴别模块基于脐橙近红外光谱集建立多个脐橙产地分类模型。脐橙产地分类模型建立不同于建立真假脐橙判别模型,这里需要针对每个产地都建立一个脐橙产地分类模型,然后利用多个脐橙产地分类模型区鉴别脐橙的产地。以建立一个脐橙产地分类模型为例:从一个产地的脐橙近红外光谱集中抽取第二建模数量的近红外光谱数据作为第二建模用样本集,第二建模用样本集也需要足够大,通常需要超过该脐橙近红外光谱集中样本数量的2/3,之后采用主成分分析法便可以构建该产地的脐橙产地分类模型。利用相同的方式,便可以构建出所有产地的脐橙产地分类模型,之后利用这些脐橙产地分类模型便可以鉴别出待检测脐橙的产地。此外需要说明,在赣南脐橙产区和非赣南脐橙产区中产地都只有一个时,便可以用作判断脐橙是否是赣南脐橙产区,但是在实际检测中,因为需要进一步判断出具体的产地,因此非赣南脐橙产区会包括一些同样具备特色的脐橙区域,例如:贺州脐橙产区、秭归脐橙产区、大凉山脐橙产区等等,那么在建立多个产地的脐橙产地分类模型时,便会对应建立这些产地的脐橙产地分类模型,进而可以在真假脐橙判别模型判断真假的同时,还有知晓具体是使用哪里的脐橙进行冒充。此外需要说明,未在脐橙产地分类模型过程中选取的脐橙近红外光谱集中样本同样会用作验证时使用。
最后,在需要进行待检测脐橙检测时,便可以使用便携式近红外光谱仪采集待检测脐橙的近红外光谱数据,然后利用真假脐橙判别模型和多个脐橙产地分类模型完成对待检测脐橙的真假和产地的鉴别。
根据本发明实施例的赣南脐橙鉴别系统,通过近红外光谱采集单元和光谱数据汇集模块可以实现对脐橙样本近红外光谱数据的有效采集和汇聚,脐橙产地鉴别模块通过采用近红外光谱结合主成分分析法建立多个脐橙产地分类模型可以用作识别不同产地赣南脐橙,真假脐橙鉴别模块通过采用近红外光谱结合偏最小二乘判别分析法建立真假脐橙判别模型可以有效识别是否是赣南脐橙产区的脐橙,预处理单元可以对近红外光谱进行预处理,以便于更好的建力模型。本发明实施例的赣南脐橙鉴别系统基于近红外光谱建模进行识别,相较于传统的人工判别和自动识别而言,具备快速、无破坏、无污染、稳定可靠等优点。而且在近红外光谱采集单元采用便携式近红外光谱仪后,通过本发明实施例的赣南脐橙鉴别系统可以对于市场上的任何脐橙样本进行分析,实现产地归属和真伪鉴别的目的。
在本发明的一些实施例中,上述赣南脐橙鉴别系统还包括验证模块,验证模块用于将多个脐橙近红外光谱集中非第一建模用样本集的近红外光谱数据组成验证集,并使用验证集验证真假脐橙判别模型。在实际工程中,建立真假脐橙判别模型后,通过训练可以用来作为脐橙真假鉴别使用,但是却难以直接确定真假脐橙判别模型鉴别的准确率,因此需要通过验证集来验证准确率,如果不合格,则需要继续进行训练,直至验证的准确率满足使用需求。
在本发明的一些实施例中,近红外光谱采集单元采用近红外光谱仪,具体可以使用SupNIR-1000便携式近红外光谱仪配光纤探头漫反射附件。
根据发明第三方面实施例的计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行上述的赣南脐橙鉴别方法。
根据本发明实施例的计算机可读存储介质,通过存储介质可以便于计算机可执行指令的存储和转移。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上述结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (10)
1.一种赣南脐橙鉴别方法,其特征在于,包括以下步骤:
获取多个产地的脐橙样本集,多个所述产地划分为赣南脐橙产区、以及非赣南脐橙产区;
利用近红外光谱仪对每一个所述脐橙样本集中的样本进行近红外光谱采集,以获得每个所述脐橙样本集对应的脐橙近红外光谱集;
对每个所述脐橙近红外光谱子集中的每个近红外光谱数据进行预处理;
分别从多个所述脐橙近红外光谱集中选取不少于预设的第一建模数量的近红外光谱数据组成第一建模用样本集,并采用偏最小二乘判别法建立真假脐橙判别模型;
从每个产地的所述脐橙近红外光谱集中选取不少于预设的第二建模数量的近红外光谱数据作为第二建模用样本集,并采用主成分分析法分别针对每个产地构建脐橙产地分类模型;
获取待检测脐橙的近红外光谱数据,并输入至所述真假脐橙判别模型和多个所述脐橙产地分类模型中,以获得所述待检测脐橙的真假信息和产地信息。
2.根据权利要求1所述的赣南脐橙鉴别方法,其特征在于,所述获取待检测脐橙的近红外光谱数据之前还包括以下步骤:
将多个所述脐橙近红外光谱集中非所述第一建模用样本集的近红外光谱数据组成验证集,并使用所述验证集验证所述真假脐橙判别模型。
3.根据权利要求2所述的赣南脐橙鉴别方法,其特征在于,所述第一建模用样本集中近红外光谱数据和所述验证集中近红外光谱数据的数量比为1:2至1:5。
4.根据权利要求1所述的赣南脐橙鉴别方法,其特征在于,所述利用近红外光谱仪对每一个所述脐橙样本集中的样本进行近红外光谱采集包括以下步骤:
对每一个所述脐橙样本集中的样本的多个位置进行采集,以获得多个原始近红外光谱数据;
将多个所述原始近红外光谱数据平均后转化成一条所述近红外光谱数据。
5.根据权利要求4所述的赣南脐橙鉴别方法,其特征在于,对每一个所述脐橙样本集中的样本的多个位置进行采集时,选取样本赤道区域进行采集。
6.根据权利要求1所述的赣南脐橙鉴别方法,其特征在于,所述预处理至少包括:多元散射校正、二阶导数。
7.根据权利要求1所述的赣南脐橙鉴别方法,其特征在于,采集近红外光谱数据时,采集波长范围在的波长范围为1000-1800nm,波长间隔点位为1nm。
8.一种赣南脐橙鉴别系统,其特征在于,包括:
近红外光谱采集单元,用于采集多个产地脐橙样本集的近红外光谱数据、以及采集待检测脐橙的近红外光谱数据;多个所述产地划分为赣南脐橙产区、以及非赣南脐橙产区;
光谱数据汇集模块,用于依据多个所述产地脐橙样本集的近红外光谱数据建立每个所述脐橙样本集对应的脐橙近红外光谱集;
预处理单元,用于对每个所述脐橙近红外光谱子集中的每个近红外光谱数据进行预处理;
真假脐橙鉴别模块,其内置有真假脐橙判别模型,所述真假脐橙判别模型依据多个所述脐橙近红外光谱集并采用偏最小二乘判别法建立,用于鉴别所述待检测脐橙的真假信息;
脐橙产地鉴别模块,其内置有多个脐橙产地分类模型,每个所述真脐橙产地分类模型依据对应的所述脐橙近红外光谱集并采用主成分分析法构建,多个所述真脐橙产地分类模型共同用于鉴别所述待检测脐橙的产地信息;
显示单元,用于展示所述真假脐橙鉴别模块和脐橙产地鉴别模块的鉴别结果。
9.根据权利要求8所述的赣南脐橙鉴别系统,其特征在于,还包括验证模块,所述验证模块用于将多个所述脐橙近红外光谱集中非所述第一建模用样本集的近红外光谱数据组成验证集,并使用所述验证集验证所述真假脐橙判别模型。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一所述的一种赣南脐橙鉴别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110660376.5A CN113536927A (zh) | 2021-06-15 | 2021-06-15 | 一种赣南脐橙鉴别方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110660376.5A CN113536927A (zh) | 2021-06-15 | 2021-06-15 | 一种赣南脐橙鉴别方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113536927A true CN113536927A (zh) | 2021-10-22 |
Family
ID=78124945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110660376.5A Pending CN113536927A (zh) | 2021-06-15 | 2021-06-15 | 一种赣南脐橙鉴别方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113536927A (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005291704A (ja) * | 2003-11-10 | 2005-10-20 | New Industry Research Organization | 可視光・近赤外分光分析方法 |
CN101303296A (zh) * | 2008-06-20 | 2008-11-12 | 中国农业科学院茶叶研究所 | 地理标志保护的西湖龙井的真伪鉴别方法 |
CN105740898A (zh) * | 2016-01-29 | 2016-07-06 | 广西中烟工业有限责任公司 | 一种利用光谱特征向量结合主成分分析建立分类模型的方法 |
WO2016150130A1 (zh) * | 2015-03-25 | 2016-09-29 | 山东翰能高科科技有限公司 | 一种基于近红外光谱的杂交种纯度鉴别方法 |
CN106560697A (zh) * | 2016-10-20 | 2017-04-12 | 中国计量大学 | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 |
CN107894408A (zh) * | 2017-11-24 | 2018-04-10 | 中国农业科学院油料作物研究所 | 一种基于近红外光谱仪的食用油多元掺伪鉴别方法 |
CN108593596A (zh) * | 2018-05-31 | 2018-09-28 | 福建医科大学 | 基于近红外光谱技术快速检测椰汁中原汁含量的方法 |
CN108593592A (zh) * | 2018-04-19 | 2018-09-28 | 广东药科大学 | 一种基于近红外光谱技术的半夏掺伪鉴别方法 |
CN108918460A (zh) * | 2018-09-30 | 2018-11-30 | 福建医科大学 | 一种基于近红外光谱技术测定中药材中马兜铃酸i含量的方法 |
CN110231300A (zh) * | 2019-03-04 | 2019-09-13 | 天津农学院 | 一种无损快速鉴别真假阿克苏红富士苹果的方法 |
CN110907368A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种联合多种检测技术的龙井茶真伪识别方法 |
CN110987857A (zh) * | 2019-12-23 | 2020-04-10 | 辽宁上药好护士药业(集团)有限公司 | 林下山参属性的近红外检测鉴别方法 |
CN111007032A (zh) * | 2019-11-13 | 2020-04-14 | 上海长海医院 | 一种快速无损鉴别甘草及其伪品刺果甘草的近红外光谱法 |
CN111815540A (zh) * | 2020-07-22 | 2020-10-23 | 吉林大学 | 一种基于高光谱的冷库果蔬冷害检测方法 |
CN112903735A (zh) * | 2020-12-21 | 2021-06-04 | 南昌海关技术中心 | 一种铜精矿与其冶炼矿渣的固废属性快速鉴别方法 |
-
2021
- 2021-06-15 CN CN202110660376.5A patent/CN113536927A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005291704A (ja) * | 2003-11-10 | 2005-10-20 | New Industry Research Organization | 可視光・近赤外分光分析方法 |
CN101303296A (zh) * | 2008-06-20 | 2008-11-12 | 中国农业科学院茶叶研究所 | 地理标志保护的西湖龙井的真伪鉴别方法 |
WO2016150130A1 (zh) * | 2015-03-25 | 2016-09-29 | 山东翰能高科科技有限公司 | 一种基于近红外光谱的杂交种纯度鉴别方法 |
CN105740898A (zh) * | 2016-01-29 | 2016-07-06 | 广西中烟工业有限责任公司 | 一种利用光谱特征向量结合主成分分析建立分类模型的方法 |
CN106560697A (zh) * | 2016-10-20 | 2017-04-12 | 中国计量大学 | 联合近红外光谱和微量元素的武夷岩茶产地鉴别方法 |
CN107894408A (zh) * | 2017-11-24 | 2018-04-10 | 中国农业科学院油料作物研究所 | 一种基于近红外光谱仪的食用油多元掺伪鉴别方法 |
CN108593592A (zh) * | 2018-04-19 | 2018-09-28 | 广东药科大学 | 一种基于近红外光谱技术的半夏掺伪鉴别方法 |
CN108593596A (zh) * | 2018-05-31 | 2018-09-28 | 福建医科大学 | 基于近红外光谱技术快速检测椰汁中原汁含量的方法 |
CN108918460A (zh) * | 2018-09-30 | 2018-11-30 | 福建医科大学 | 一种基于近红外光谱技术测定中药材中马兜铃酸i含量的方法 |
CN110231300A (zh) * | 2019-03-04 | 2019-09-13 | 天津农学院 | 一种无损快速鉴别真假阿克苏红富士苹果的方法 |
CN111007032A (zh) * | 2019-11-13 | 2020-04-14 | 上海长海医院 | 一种快速无损鉴别甘草及其伪品刺果甘草的近红外光谱法 |
CN110907368A (zh) * | 2019-12-04 | 2020-03-24 | 中国计量大学 | 一种联合多种检测技术的龙井茶真伪识别方法 |
CN110987857A (zh) * | 2019-12-23 | 2020-04-10 | 辽宁上药好护士药业(集团)有限公司 | 林下山参属性的近红外检测鉴别方法 |
CN111815540A (zh) * | 2020-07-22 | 2020-10-23 | 吉林大学 | 一种基于高光谱的冷库果蔬冷害检测方法 |
CN112903735A (zh) * | 2020-12-21 | 2021-06-04 | 南昌海关技术中心 | 一种铜精矿与其冶炼矿渣的固废属性快速鉴别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108154134B (zh) | 基于深度卷积神经网络的互联网直播色情图像检测方法 | |
Cozzolino et al. | Can spectroscopy geographically classify Sauvignon Blanc wines from Australia and New Zealand? | |
CN103048273B (zh) | 基于模糊聚类的水果近红外光谱分类方法 | |
CN111652326B (zh) | 基于MobileNet v2网络改进的果实成熟度识别方法和识别系统 | |
Martelo‐Vidal et al. | Ultraviolet/visible/near‐infrared spectral analysis and chemometric tools for the discrimination of wines between subzones inside a controlled designation of origin: a case study of R ías B aixas | |
CN104502320A (zh) | 一种三维荧光光谱结合pca-svm鉴别浓香型白酒的方法 | |
CN103735253A (zh) | 一种基于移动终端的中医舌象分析系统及方法 | |
CN109001218A (zh) | 基于高光谱成像技术的苹果表面缺陷快速无损识别方法 | |
CN104374739A (zh) | 一种基于近红外定性分析的种子品种真实性鉴别方法 | |
CN103914707B (zh) | 基于支持向量机的绿色通道产品辅助判别方法 | |
CN104374738A (zh) | 一种基于近红外提高鉴别结果的定性分析方法 | |
CN104132896A (zh) | 一种快速鉴别掺假肉的方法 | |
CN104376325A (zh) | 一种近红外定性分析模型的建立方法 | |
CN103034838A (zh) | 一种基于图像特征的特种车辆仪表类型识别与标定方法 | |
CN108734205A (zh) | 一种针对不同品种小麦种子的单粒定点识别技术 | |
CN113720797B (zh) | 一种白酒蒸馏的在线快速量质摘酒方法 | |
CN101299237A (zh) | 一种基于信息量维数序列的高光谱数据监督分类方法 | |
CN105044024A (zh) | 一种基于近红外光谱技术对葡萄果实进行无损检测的方法 | |
CN105548066A (zh) | 一种胶体种类区分方法及系统 | |
CN103822897A (zh) | 一种基于红外光谱的白酒鉴定及溯源方法 | |
CN115905881B (zh) | 黄珍珠分类的方法以及装置、电子设备、存储介质 | |
CN112699756A (zh) | 一种基于高光谱图像的茶叶原产地识别方法和系统 | |
CN105205503A (zh) | 基于众包主动学习用于检测异常图片的方法 | |
CN112730312A (zh) | 一种基于近红外光谱技术的掺杂牛初乳定性识别方法 | |
CN110263969B (zh) | 一种货架期苹果品质动态预测系统及预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211022 |