CN113836784B - 一种基于信息融合技术的苹果鉴别系统及方法 - Google Patents
一种基于信息融合技术的苹果鉴别系统及方法 Download PDFInfo
- Publication number
- CN113836784B CN113836784B CN202110835761.9A CN202110835761A CN113836784B CN 113836784 B CN113836784 B CN 113836784B CN 202110835761 A CN202110835761 A CN 202110835761A CN 113836784 B CN113836784 B CN 113836784B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- apple
- spectrum data
- physicochemical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005516 engineering process Methods 0.000 title claims abstract description 21
- 238000001228 spectrum Methods 0.000 claims abstract description 85
- 230000002159 abnormal effect Effects 0.000 claims abstract description 51
- 239000000126 substance Substances 0.000 claims abstract description 31
- 238000007781 pre-processing Methods 0.000 claims abstract description 29
- 238000012216 screening Methods 0.000 claims abstract description 27
- 238000013145 classification model Methods 0.000 claims abstract description 21
- 238000004519 manufacturing process Methods 0.000 claims abstract description 18
- 235000021016 apples Nutrition 0.000 claims abstract description 17
- 238000005070 sampling Methods 0.000 claims abstract description 6
- 241000220225 Malus Species 0.000 claims abstract 16
- 238000004422 calculation algorithm Methods 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 25
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000010586 diagram Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 238000009499 grossing Methods 0.000 claims description 8
- 239000007787 solid Substances 0.000 claims description 7
- 238000012937 correction Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 2
- 235000013399 edible fruits Nutrition 0.000 abstract description 7
- 244000141359 Malus pumila Species 0.000 description 59
- 235000011430 Malus pumila Nutrition 0.000 description 44
- 235000015103 Malus silvestris Nutrition 0.000 description 44
- 230000015654 memory Effects 0.000 description 15
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 235000010724 Wisteria floribunda Nutrition 0.000 description 7
- 238000003860 storage Methods 0.000 description 6
- JLQUFIHWVLZVTJ-UHFFFAOYSA-N carbosulfan Chemical compound CCCCN(CCCC)SN(C)C(=O)OC1=CC=CC2=C1OC(C)(C)C2 JLQUFIHWVLZVTJ-UHFFFAOYSA-N 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000002203 pretreatment Methods 0.000 description 5
- 240000008790 Musa x paradisiaca Species 0.000 description 3
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 235000021551 crystal sugar Nutrition 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000000779 smoke Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 238000003619 Marshal aromatic alkylation reaction Methods 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- -1 ga la Chemical compound 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011369 optimal treatment Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 235000018553 tannin Nutrition 0.000 description 1
- 229920001864 tannin Polymers 0.000 description 1
- 239000001648 tannin Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/02—Food
- G01N33/025—Fruits or vegetables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Food Science & Technology (AREA)
- Animal Husbandry (AREA)
- Medical Informatics (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Marine Sciences & Fisheries (AREA)
- Agronomy & Crop Science (AREA)
- Medicinal Chemistry (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Spectroscopy & Molecular Physics (AREA)
Abstract
本发明涉及水果鉴别技术领域,具体公开了一种基于信息融合技术的苹果鉴别系统,所述系统具体包括样本剔除模块,用于获取各苹果的光谱数据和理化值数据,并剔除异常样本;预处理模块,用于对所述光谱数据进行预处理,得到预处理后的数据;根据所述理化值数据对预处理后的数据进行特征波段筛选,得到筛选后的数据;模型建立模块,用于基于原始光谱数据、预处理光谱数据以及筛选后的光谱数据分别建立品种分类模型、产地识别模型;融合模块,用于融合所述品种分类模型和产地识别模型,得到苹果身份融合模型。本发明融合品种鉴别、产地鉴别模型对苹果进行身份识别,识别准确度极高,在原有的化学手段上增加了物理手段,便于推广。
Description
技术领域
本发明涉及水果鉴别技术领域,具体是一种基于信息融合技术的苹果鉴别系统及方法。
背景技术
苹果是最常见的一种水果,营养价值很高,虽然可能不是每个人最喜欢的水果,但是几乎没有人会讨厌吃苹果,这就使得苹果的需求一直很旺盛;可以这么说,苹果在水果中的地位就像是小麦水稻在粮食中的地位,这就使得大部分果农在种植水果时,都会种植一部分苹果树。
但是,在苹果进行抽检的过程中,我们往往需要对苹果进行鉴别,传统的鉴别方式大多依靠理化数据结合运货流程对苹果进行鉴别,这种鉴别方式一般比较慢,而且其准确度不是很高,尤其是对于单独的一些苹果,很难获取其运货流程。
因此,如何扩充苹果鉴别手段,是本发明想要解决的问题。
发明内容
本发明的目的在于提供一种基于信息融合技术的苹果鉴别系统及方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于信息融合技术的苹果鉴别系统及方法,所述系统包括:
样本剔除模块,用于获取各苹果的光谱数据和理化值数据,并剔除异常样本;其中,所述理化值数据包括PH值、可溶性固形物、硬度和水分:
预处理模块,用于对所述光谱数据进行预处理,得到预处理后的数据;根据所述理化值数据对预处理后的数据进行特征波段筛选,得到筛选后的数据;
模型建立模块,用于基于原始光谱数据、预处理光谱数据以及筛选后的光谱数据分别建立品种分类模型、产地识别模型;
融合模块,用于融合所述品种分类模型和产地识别模型,得到苹果身份融合模型。
作为本发明技术方案进一步的限定:所述样本剔除模块具体包括:
马氏距离计算单元,用于读取获取到的光谱数据,计算各苹果光谱数据之间的马氏距离;
比对单元,用于将计算出的马氏距离与预设的阈值之间进行比对,并根据比对结果剔除异常样本;其中,所述阈值e=1.5,1.75,2,2.5,3,3.5;
处理执行单元,用于对剔除异常样本后的光谱数据建立PLSR理化值预测模型,并根据所述PLSR理化值预测模型剔除理化值数据中的异常样本。
作为本发明技术方案进一步的限定:所述处理执行单元具体包括:
模型读取子单元,用于读取根据不同阈值建立的PLSR理化值预测模型;
择优子单元,用于根据相关系数确定最优预测模型;
建模分析子单元,用于通过最优预测模型对所述理化值数据进行建模分析;
箱型图分析子单元,用于对建模分析结果进行箱型图分析,剔除理化值数据中的异常样本。
作为本发明技术方案进一步的限定:所述预处理模块用于读取剔除异常样本后的光谱数据,并对其进行光谱预处理;所述光谱预处理的流程包括标准化、Savitzky-Golay5点平滑(SG)、标准正态变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)、二阶导数(SD)以及联合预处理MSC-SG、MSC-SD、SNV-SG、SNV-SD。
作为本发明技术方案进一步的限定:所述预处理模块还包括:
波段筛选单元,用于读取预处理后的理化数据,根据SPA算法和/或CARS算法分别针对SSC、PH、水分、硬度进行特征波段筛选;
其中,所述CARS算法采用PLSR进行波长权重评估;所述CARS算法采用随机采样法,随机对波段进行采样评估。
作为本发明技术方案进一步的限定:所述品种分类模型为PLSDA建模算法,所述产地识别模型为KNN建模算法;所述PLSDA建模算法和所述KNN建模算法的输入变量包括原始光谱、经过预处理的光谱数据、特征波段筛选后的光谱数据。
本发明技术方案还提供了一种基于信息融合技术的苹果鉴别方法,所述方法包括:
获取各苹果的光谱数据和理化值数据,并剔除异常样本;其中,所述理化值数据包括PH值、可溶性固形物、硬度和水分:
对所述光谱数据进行预处理,得到预处理后的数据;根据所述理化值数据对预处理后的数据进行特征波段筛选,得到筛选后的数据;
基于原始光谱数据、预处理光谱数据以及筛选后的光谱数据分别建立品种分类模型、产地识别模型;
融合所述品种分类模型和产地识别模型,得到苹果身份融合模型。
作为本发明技术方案进一步的限定:所述获取各苹果的光谱数据和理化值数据,并剔除异常样本的步骤具体包括:
读取获取到的光谱数据,计算各苹果光谱数据之间的马氏距离;
将计算出的马氏距离与预设的阈值之间进行比对,并根据比对结果剔除异常样本;其中,所述阈值e=1.5,1.75,2,2.5,3,3.5;
对剔除异常样本后的光谱数据建立PLSR理化值预测模型;
根据所述PLSR理化值预测模型剔除理化值数据中的异常样本。
作为本发明技术方案进一步的限定:所述根据所述PLSR理化值预测模型剔除理化值数据中的异常样本的步骤具体包括:
读取根据不同阈值建立的PLSR理化值预测模型;
根据相关系数确定最优预测模型;
通过最优预测模型对所述理化值数据进行建模分析;
对建模分析结果进行箱型图分析,剔除理化值数据中的异常样本。
与现有技术相比,本发明的有益效果是:本发明融合品种鉴别、产地鉴别模型对苹果进行身份识别,识别准确度极高,在原有的化学手段上增加了物理手段,便于推广。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为基于信息融合技术的苹果鉴别方法的流程框图。
图2为基于信息融合技术的苹果鉴别系统的组成结构框图。
图3为基于信息融合技术的苹果鉴别系统中样本剔除模块的组成结构框图。
图4为样本剔除模块中处理执行单元的组成结构框图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
图2示出了基于信息融合技术的苹果鉴别系统的组成结构框图,本发明实施例中,提供了一种基于信息融合技术的苹果鉴别系统,所述系统10包括:
样本剔除模块11,用于获取各苹果的光谱数据和理化值数据,并剔除异常样本;其中,所述理化值数据包括PH值、可溶性固形物、硬度和水分:
预处理模块12,用于对所述光谱数据进行预处理,得到预处理后的数据;根据所述理化值数据对预处理后的数据进行特征波段筛选,得到筛选后的数据;
模型建立模块13,用于基于原始光谱数据、预处理光谱数据以及筛选后的光谱数据分别建立品种分类模型、产地识别模型;
融合模块14,用于融合所述品种分类模型和产地识别模型,得到苹果身份融合模型。
本研究以苹果为研究对象,采集4个产地共计10种苹果的光谱数据及PH值、可溶性固形物、硬度和水分的理化值数据。结合预处理方法筛选特征波段建立分类模型,实现苹果身份识别。本文的主要研究内容如下:
获取试验所需的数据包括苹果的高光谱数据以及相关的理化值数据,对所采集到的原始数据进行简单的预处理,建立可用的苹果身份试验数据集。
苹果光谱预处理方法以及特征波段选择算法以及理化值比较。对提取出的原始光谱进行预处理方法并针对相应理化值建立PLSR预测模型进行初步预处理方法筛选。结合理化值对预处理数据进行特征波段筛选,根据后续建模结果分析比较预处理对建模结果的影响、特征波段筛选对建模结果的影响。
建立苹果品种识别模型。基于未处理数据、预处理数据以及筛选波长后的数据分别建立品种分类模型,筛选最佳品种识别算法。为了避免产地信息的影响,先针对相同产地不同品种苹果建立品种鉴别模型,然后引入不同的产地信息,进一步建立不同产地不同品种的苹果品种识别模型,分析产地信息对品种识别的影响。
建立苹果产地识别模型。基于未处理数据、预处理数据以及筛选波长后的数据分别建立产地分类模型,筛选最佳产地识别算法。为了避免品种信息的影响,先针对相同品种不同产地苹果建立产地鉴别模型,然后引入不同的品种信息,进一步不同产地不同品种的苹果产地鉴别模型,分析品种信息对产地识别的影响。
融合品种产地模型进行身份识别。融合筛选出苹果品种、产地鉴别最优模型建立苹果身份模型,实现对苹果身份的精确识别。通过对比利用光谱数据直接建立的身份识别模型,分析融合模型的优点与不足。
图3示出了基于信息融合技术的苹果鉴别系统中样本剔除模块的组成结构框图,所述样本剔除模块11具体包括:
马氏距离计算单元111,用于读取获取到的光谱数据,计算各苹果光谱数据之间的马氏距离;
比对单元112,用于将计算出的马氏距离与预设的阈值之间进行比对,并根据比对结果剔除异常样本;其中,所述阈值e=1.5,1.75,2,2.5,3,3.5;
处理执行单元113,用于对剔除异常样本后的光谱数据建立PLSR理化值预测模型,并根据所述PLSR理化值预测模型剔除理化值数据中的异常样本。
在异常样本剔除时需要对阈值e进行参数寻优。本研究设置e=1.5,1.75,2,2.5,3,3.5进行剔除试验,并对剔除异常样本后的光谱数据建立PLSR理化值预测模型,以相关系数R为评价标准,选取最优结果进行下一步理化值剔除。
对各品种四个理化值的PLSR建模分析,除个别情况外各品种光谱数据与理化值的相关性均能够达到0.5以上,当剔除3个样本后SSC的PLSR的R值由0.65提升至0.73,效果明显。使用PLSR建模分析进行PCA-MD阈值寻优有效。通过选择,各品种阈值e选择情况如下:青香蕉e=2.5、黄金帅e=2、嘎啦e=2、冰糖心e=1.75、阿克苏富士e=1.75、秦冠e=1.5、红元帅e=2、静宁富士e=1.75、灵宝富士e=2.5、烟台富士e=3进行后续操作。
使用箱型图分析法对理化值SSC、PH、水分以及硬度进行异常值剔除。针对SSC进行剔除,黄金帅剔除1个异常样本;针对硬度进行剔除,嘎啦剔除1个异常样本,静宁富士剔除1个异常样本,灵宝富士剔除1个异常样本;针对PH,剔除异常样本共6个,青香蕉、秦冠、红元帅及灵宝富士各剔除1个样本,静宁富士剔除2个样本;针对水分,共剔除6个异常样本,其中红元帅、嘎啦、冰糖心、阿克苏富士、静宁富士及灵宝富士均剔除1个。
图4示出了样本剔除模块中处理执行单元的组成结构框图,所述处理执行单元113具体包括:
模型读取子单元1131,用于读取根据不同阈值建立的PLSR理化值预测模型;
择优子单元1132,用于根据相关系数确定最优预测模型;
建模分析子单元1133,用于通过最优预测模型对所述理化值数据进行建模分析;
箱型图分析子单元1134,用于对建模分析结果进行箱型图分析,剔除理化值数据中的异常样本。
进一步的,所述预处理模块用于读取剔除异常样本后的光谱数据,并对其进行光谱预处理;所述光谱预处理的流程包括标准化、Savitzky-Golay5点平滑(SG)、标准正态变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)、二阶导数(SD)以及联合预处理MSC-SG、MSC-SD、SNV-SG、SNV-SD。
本研究对剔除异常样本后得到的样本原始光谱数据分别采用标准化、Savitzky-Golay5点平滑(SG)、标准正态变量变换(SNV)、多元散射校正(MSC)、一阶导数(FD)、二阶导数(SD)以及联合预处理MSC-SG、MSC-SD、SNV-SG、SNV-SD进行光谱预处理。通过对处理后的光谱数据进行PLSR建模,选取最佳模型,选择相关性系数R为评价标准,R值越接近于1,说明变量与理化值相关系越高。
具体的,所述预处理模块还包括:
波段筛选单元,用于读取预处理后的理化数据,根据SPA算法和/或CARS算法分别针对SSC、PH、水分、硬度进行特征波段筛选;
其中,所述CARS算法采用PLSR进行波长权重评估;所述CARS算法采用随机采样法,随机对波段进行采样评估。
将采集到的样本光谱数据进行预处理并作为输入变量建立PLSR预测模型,针对SSC进行PLSR预测结果中结果最佳的方法有三个分别为MSC-SD、SNV-SD以及SD,R均为0.95,可能存在颗粒分布不均、表面散射等背景噪音影响。其余处理方法建模结果R也都在0.9以上,说明光谱数据与水分存在较强的变量相关性;针对硬度,建模结果较水分稍差R值分布在0.71~0.72,最佳处理方法为MSC-SD、SNV-SD以及SD,R值为0.82,硬度与光谱的变量相关性稍弱于水分;PH建模结果与硬度相仿,除MSC-SD、SNV-SD、SD以及FD外R值分布在0.81~0.82,MSC-SD、SNV-SD、SD以及FD的R值分别为0.87、0.87、0.85、0.84;SSC建模结果有较大的波动,但最佳处理结果仍为MSC-SD、SNV-SD、SD,R值优于其余方法在0.8以上。通过对比,MSC-SD、SNV-SD、SD预处理效果优于其余预处理方法,此外在SD建模结果虽也有较优表现,但SD是在FD基础上进行的第二次导数差分,FD预测结果也不如SD,因此不采用FD进行后续操作。
除此之外,所述品种分类模型为PLSDA建模算法,所述产地识别模型为KNN建模算法;所述PLSDA建模算法和所述KNN建模算法的输入变量包括原始光谱、经过预处理的光谱数据、特征波段筛选后的光谱数据。
选择PLSDA为品种鉴别建模算法,选择KNN为产地建模算法。二次分析的原理为在得到样本产地及品种预测结果之后再使用一个分类器进行最终的身份进行分类预测,最终得到样本身份结果。
本发明采用逻辑回归作为二次分析的分类器,同时为比较模型效果,选用KNN、PLS-DA对光谱数据直接进行身份预测。
苹果身份识别之PLS-DA品种识别子模型:
为全部样品重新设计分类标号,进行品种分类子模型建模做准备。分类标号详细信息如下表:
品种 | 冰糖心 | 富士 | 嘎啦 | 青香蕉 | 黄金帅 | 秦冠 | 红元帅 | 富士 | 富士 |
产地 | a | a | a | a | a | g | g | g | h |
分类号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
注:a为新疆阿克苏,g为甘肃,h为河南灵宝,s为山东烟台;
为保证品种PLSDA预测模型精度,仅对原始光谱以及经过预处理(SD、MSC-SD、SNV-SD)的全波段进行建模分析。全波段建模结果如下。表中数据显示,使用PLSDA进行全部波段建模预测集准确率均能达到99%,能够准确预测样本品种信息。结合建模集准确率来看,SD-PLSDA预测效果最佳,预测集准确率达到99.6147%,建模集准确率达到98.38%,采用SD-PLSDA作为融合模型中品种预测子模型。
全波段-PLSDA品种预测结果
苹果身份识别之KNN产地识别子模型:
为全部样品重新设计分类标号,进行产地分类子模型建模做准备,分类标号详细信息如下表:
融合模型-KNN分类标号信息
品种 | 冰糖心 | 富士 | 嘎啦 | 青香蕉 | 黄金帅 | 秦冠 | 红元帅 | 富士 | 富士 |
产地 | a | a | a | a | a | g | g | g | h |
分类号 | 1 | 1 | 1 | 1 | 1 | 2 | 2 | 2 | 3 |
注:a为新疆阿克苏,g为甘肃,h为河南灵宝,s为山东烟台。
与品种预测子模型一致,为保障建模精度仅使用全波段进行产地预测模型建立。全波段建模见过如下表6-5。表中数据可以看出KNN预测模型预测集准确率能够达到98%以上,建模准确率能够达到97%,能够有效预测样品产地信息。其中,MSC-SD模型预测效果最佳,预测集准确率达到98.68%,建模准确率达到了98.88%,采用MSC-SD-KNN模型作为融合模型的产地预测子模型。
全波段-KNN产地预测结果
实施例2
请参阅图1~3,本发明实施例中,提供了一种基于信息融合技术的苹果鉴别方法,所述方法具体包括:
获取各苹果的光谱数据和理化值数据,并剔除异常样本;其中,所述理化值数据包括PH值、可溶性固形物、硬度和水分:
对所述光谱数据进行预处理,得到预处理后的数据;根据所述理化值数据对预处理后的数据进行特征波段筛选,得到筛选后的数据;
基于原始光谱数据、预处理光谱数据以及筛选后的光谱数据分别建立品种分类模型、产地识别模型;
融合所述品种分类模型和产地识别模型,得到苹果身份融合模型。
进一步的,所述获取各苹果的光谱数据和理化值数据,并剔除异常样本的步骤具体包括:
读取获取到的光谱数据,计算各苹果光谱数据之间的马氏距离;
将计算出的马氏距离与预设的阈值之间进行比对,并根据比对结果剔除异常样本;其中,所述阈值e=1.5,1.75,2,2.5,3,3.5;
对剔除异常样本后的光谱数据建立PLSR理化值预测模型;
根据所述PLSR理化值预测模型剔除理化值数据中的异常样本。
具体的,所述根据所述PLSR理化值预测模型剔除理化值数据中的异常样本的步骤具体包括:
读取根据不同阈值建立的PLSR理化值预测模型;
根据相关系数确定最优预测模型;
通过最优预测模型对所述理化值数据进行建模分析;
对建模分析结果进行箱型图分析,剔除理化值数据中的异常样本。
所述基于信息融合技术的苹果鉴别方法所能实现的功能均由计算机设备完成,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述程序代码由所述一个或多个处理器加载并执行以实现所述基于信息融合技术的苹果鉴别方法的功能。
处理器从存储器中逐条取出指令、分析指令,然后根据指令要求完成相应操作,产生一系列控制命令,使计算机各部分自动、连续并协调动作,成为一个有机的整体,实现程序的输入、数据的输入以及运算并输出结果,这一过程中产生的算术运算或逻辑运算均由运算器完成;所述存储器包括只读存储器(Read-Only Memory,ROM),所述只读存储器用于存储计算机程序,所述存储器外部设有保护装置。
示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在终端设备中的执行过程。
本领域技术人员可以理解,上述服务设备的描述仅仅是示例,并不构成对终端设备的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,上述处理器是上述终端设备的控制中心,利用各种接口和线路连接整个用户终端的各个部分。
上述存储器可用于存储计算机程序和/或模块,上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现上述终端设备的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如信息采集模板展示功能、产品信息发布功能等)等;存储数据区可存储根据泊位状态显示系统的使用所创建的数据(比如不同产品种类对应的产品信息采集模板、不同产品提供方需要发布的产品信息等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例系统中的全部或部分模块/单元,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个系统实施例的功能。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (4)
1.一种基于信息融合技术的苹果鉴别系统,其特征在于,所述系统具体包括:
样本剔除模块,用于获取各苹果的光谱数据和理化值数据,并剔除异常样本;其中,所述理化值数据包括PH值、可溶性固形物、硬度和水分:
预处理模块,用于对所述光谱数据进行预处理,得到预处理后的数据;根据所述理化值数据对预处理后的数据进行特征波段筛选,得到筛选后的数据;
模型建立模块,用于基于原始光谱数据、预处理光谱数据以及筛选后的光谱数据分别建立品种分类模型、产地识别模型;
融合模块,用于融合所述品种分类模型和产地识别模型,得到苹果身份融合模型;
所述样本剔除模块具体包括:
马氏距离计算单元,用于读取获取到的光谱数据,计算各苹果光谱数据之间的马氏距离;
比对单元,用于将计算出的马氏距离与预设的阈值之间进行比对,并根据比对结果剔除异常样本;其中,所述阈值e=1.5,1.75,2,2.5,3,3.5;
处理执行单元,用于对剔除异常样本后的光谱数据建立PLSR理化值预测模型,并根据所述PLSR理化值预测模型剔除理化值数据中的异常样本;
所述预处理模块用于读取剔除异常样本后的光谱数据,并对其进行光谱预处理;所述光谱预处理的流程包括标准化、Savitzky-Golay5点平滑、标准正态变量变换、多元散射校正、一阶导数、二阶导数以及联合预处理MSC-SG、MSC-SD、SNV-SG、SNV-SD;
所述预处理模块还包括:
波段筛选单元,用于读取预处理后的理化数据,根据SPA算法和/或CARS算法分别针对SSC、PH、水分、硬度进行特征波段筛选;
其中,所述CARS算法采用PLSR进行波长权重评估;所述CARS算法采用随机采样法,随机对波段进行采样评估;
所述品种分类模型为PLSDA建模算法,所述产地识别模型为KNN建模算法;所述PLSDA建模算法和所述KNN建模算法的输入变量包括原始光谱、经过预处理的光谱数据、特征波段筛选后的光谱数据。
2.根据权利要求1所述的基于信息融合技术的苹果鉴别系统,其特征在于,所述处理执行单元具体包括:
模型读取子单元,用于读取根据不同阈值建立的PLSR理化值预测模型;
择优子单元,用于根据相关系数确定最优预测模型;
建模分析子单元,用于通过最优预测模型对所述理化值数据进行建模分析;
箱型图分析子单元,用于对建模分析结果进行箱型图分析,剔除理化值数据中的异常样本。
3.一种基于信息融合技术的苹果鉴别方法,其特征在于,所述方法包括:
获取各苹果的光谱数据和理化值数据,并剔除异常样本;其中,所述理化值数据包括PH值、可溶性固形物、硬度和水分:
对所述光谱数据进行预处理,得到预处理后的数据;根据所述理化值数据对预处理后的数据进行特征波段筛选,得到筛选后的数据;
基于原始光谱数据、预处理光谱数据以及筛选后的光谱数据分别建立品种分类模型、产地识别模型;
融合所述品种分类模型和产地识别模型,得到苹果身份融合模型;
所述获取各苹果的光谱数据和理化值数据,并剔除异常样本的步骤具体包括:
读取获取到的光谱数据,计算各苹果光谱数据之间的马氏距离;
将计算出的马氏距离与预设的阈值之间进行比对,并根据比对结果剔除异常样本;其中,所述阈值e=1.5,1.75,2,2.5,3,3.5;
对剔除异常样本后的光谱数据建立PLSR理化值预测模型;
根据所述PLSR理化值预测模型剔除理化值数据中的异常样本;
所述对所述光谱数据进行预处理,得到预处理后的数据;根据所述理化值数据对预处理后的数据进行特征波段筛选,得到筛选后的数据的步骤包括读取剔除异常样本后的光谱数据,并对其进行光谱预处理;所述光谱预处理的流程包括标准化、Savitzky-Golay5点平滑、标准正态变量变换、多元散射校正、一阶导数、二阶导数以及联合预处理MSC-SG、MSC-SD、SNV-SG、SNV-SD;
读取预处理后的理化数据,根据SPA算法和/或CARS算法分别针对SSC、PH、水分、硬度进行特征波段筛选;
其中,所述CARS算法采用PLSR进行波长权重评估;所述CARS算法采用随机采样法,随机对波段进行采样评估;
所述品种分类模型为PLSDA建模算法,所述产地识别模型为KNN建模算法;所述PLSDA建模算法和所述KNN建模算法的输入变量包括原始光谱、经过预处理的光谱数据、特征波段筛选后的光谱数据。
4.根据权利要求3所述的基于信息融合技术的苹果鉴别方法,其特征在于,所述根据所述PLSR理化值预测模型剔除理化值数据中的异常样本的步骤具体包括:
读取根据不同阈值建立的PLSR理化值预测模型;
根据相关系数确定最优预测模型;
通过最优预测模型对所述理化值数据进行建模分析;
对建模分析结果进行箱型图分析,剔除理化值数据中的异常样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110835761.9A CN113836784B (zh) | 2021-07-23 | 2021-07-23 | 一种基于信息融合技术的苹果鉴别系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110835761.9A CN113836784B (zh) | 2021-07-23 | 2021-07-23 | 一种基于信息融合技术的苹果鉴别系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113836784A CN113836784A (zh) | 2021-12-24 |
CN113836784B true CN113836784B (zh) | 2023-10-27 |
Family
ID=78962887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110835761.9A Active CN113836784B (zh) | 2021-07-23 | 2021-07-23 | 一种基于信息融合技术的苹果鉴别系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113836784B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116933043A (zh) * | 2023-09-15 | 2023-10-24 | 天津现代创新中药科技有限公司 | 菊花产地的鉴别方法、模型的构建方法及电子设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0117735A1 (en) * | 1983-02-28 | 1984-09-05 | Deere & Company | Computer control system |
US6279125B1 (en) * | 1998-06-24 | 2001-08-21 | Micron Technology, Inc. | Computer system diagnostics |
CN102175790A (zh) * | 2011-01-07 | 2011-09-07 | 山东省农业科学院中心实验室 | 一种同时检测苹果中五种多酚并进行品种识别的hplc方法 |
CN103487558A (zh) * | 2013-07-30 | 2014-01-01 | 中国标准化研究院 | 一种应用智能感官信号进行茶叶品质的模式识别分析过程中检测异常样本的方法 |
CN105866043A (zh) * | 2016-06-06 | 2016-08-17 | 东北电力大学 | 一种利用高光谱技术检测苹果酸味的方法 |
CN106290238A (zh) * | 2016-08-09 | 2017-01-04 | 西北农林科技大学 | 一种基于高光谱成像的苹果品种快速鉴别方法 |
CN108760679A (zh) * | 2018-08-24 | 2018-11-06 | 西南林业大学 | 一种基于近红外光谱技术的乌天麻鉴别方 |
CN109827910A (zh) * | 2019-01-22 | 2019-05-31 | 塔里木大学 | 一种建立果园数据快速监测处理方法 |
CN110717520A (zh) * | 2019-09-12 | 2020-01-21 | 华侨大学 | 基于高光谱图像空间特征和光谱特征融合的固废识别方法 |
CN111488851A (zh) * | 2020-04-17 | 2020-08-04 | 成都曙光光纤网络有限责任公司 | 一种水果产地的溯源检测方法、装置、设备及介质 |
CN112285054A (zh) * | 2020-09-08 | 2021-01-29 | 塔里木大学 | 苹果身份识别模型建立方法及系统、身份识别方法及系统 |
-
2021
- 2021-07-23 CN CN202110835761.9A patent/CN113836784B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0117735A1 (en) * | 1983-02-28 | 1984-09-05 | Deere & Company | Computer control system |
US6279125B1 (en) * | 1998-06-24 | 2001-08-21 | Micron Technology, Inc. | Computer system diagnostics |
CN102175790A (zh) * | 2011-01-07 | 2011-09-07 | 山东省农业科学院中心实验室 | 一种同时检测苹果中五种多酚并进行品种识别的hplc方法 |
CN103487558A (zh) * | 2013-07-30 | 2014-01-01 | 中国标准化研究院 | 一种应用智能感官信号进行茶叶品质的模式识别分析过程中检测异常样本的方法 |
CN105866043A (zh) * | 2016-06-06 | 2016-08-17 | 东北电力大学 | 一种利用高光谱技术检测苹果酸味的方法 |
CN106290238A (zh) * | 2016-08-09 | 2017-01-04 | 西北农林科技大学 | 一种基于高光谱成像的苹果品种快速鉴别方法 |
CN108760679A (zh) * | 2018-08-24 | 2018-11-06 | 西南林业大学 | 一种基于近红外光谱技术的乌天麻鉴别方 |
CN109827910A (zh) * | 2019-01-22 | 2019-05-31 | 塔里木大学 | 一种建立果园数据快速监测处理方法 |
CN110717520A (zh) * | 2019-09-12 | 2020-01-21 | 华侨大学 | 基于高光谱图像空间特征和光谱特征融合的固废识别方法 |
CN111488851A (zh) * | 2020-04-17 | 2020-08-04 | 成都曙光光纤网络有限责任公司 | 一种水果产地的溯源检测方法、装置、设备及介质 |
CN112285054A (zh) * | 2020-09-08 | 2021-01-29 | 塔里木大学 | 苹果身份识别模型建立方法及系统、身份识别方法及系统 |
Non-Patent Citations (3)
Title |
---|
Targeting the cell wall: Preparation of monoclonal antibody for accurate identification of Alicyclobacillus acidoterrestris in apple juice;Daniel Esquivel-Alvarado et al.;《 Food Chemistry》;第336卷(第2021期);127667-127667 * |
支持向量机在苹果分类的近红外光谱模型中的应用;赵杰文;呼怀平;邹小波;;农业工程学报(第04期);159-162 * |
融合不同成熟度的苹果可溶性固形物预测模型研究;马敏娟;李磊;赵娟;张海辉;李豪;陈山;;食品安全质量检测学报(第11期);128-134 * |
Also Published As
Publication number | Publication date |
---|---|
CN113836784A (zh) | 2021-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Richter et al. | Food monitoring: Screening of the geographical origin of white asparagus using FT-NIR and machine learning | |
Feilhauer et al. | Multi-method ensemble selection of spectral bands related to leaf biochemistry | |
Kimuli et al. | Utilisation of visible/near-infrared hyperspectral images to classify aflatoxin B1 contaminated maize kernels | |
Amuah et al. | Feasibility study of the use of handheld NIR spectrometer for simultaneous authentication and quantification of quality parameters in intact pineapple fruits | |
Millan et al. | Image analysis‐based modelling for flower number estimation in grapevine | |
Çetin et al. | Using hyperspectral imaging technology and machine learning algorithms for assessing internal quality parameters of apple fruits | |
CN112269818B (zh) | 一种设备参数根因定位方法及系统、装置、介质 | |
CN113836784B (zh) | 一种基于信息融合技术的苹果鉴别系统及方法 | |
Jiang et al. | A residual neural network based method for the classification of tobacco cultivation regions using near-infrared spectroscopy sensors | |
CN114778484B (zh) | 茶叶品质等级分类方法及装置、设备、存储介质 | |
Ropelewska et al. | Differentiation of peach cultivars by image analysis based on the skin, flesh, stone and seed textures | |
Gencturk et al. | Detection of hazelnut varieties and development of mobile application with CNN data fusion feature reduction-based models | |
Anyidoho et al. | Application of portable near infrared spectroscopy for classifying and quantifying cocoa bean quality parameters | |
Santos et al. | Quality assessment of coffee beans through computer vision and machine learning algorithms | |
Sola-Guirado et al. | A smart system for the automatic evaluation of green olives visual quality in the field | |
Sánchez et al. | Classification of cocoa beans based on their level of fermentation using spectral information | |
Zhao et al. | Determination of quality and maturity of processing tomatoes using near-infrared hyperspectral imaging with interpretable machine learning methods | |
Brindha et al. | Automatic detection of citrus fruit diseases using MIB classifier | |
Goyal et al. | Tomato ripeness and shelf-life prediction system using machine learning | |
CN111650130A (zh) | 一种荔枝叶片镁含量的预测方法及预测系统 | |
Baculio et al. | An objective classification approach of cacao pods using local binary pattern features and artificial neural network architecture (ANN) | |
Aguirre-Radilla et al. | Texture and color-based analysis to determine the quality of the manila mango using digital image processing techniques | |
NL2032367B1 (en) | Apple identification system and method based on information fusion technology | |
CN113310933A (zh) | 原料水牛奶保存天数的光谱鉴定方法 | |
Titarenko et al. | Application of statistical methods for classification of varietal and regional origin of white wines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |