CN110849828A - 一种基于高光谱图像技术的藏红花分类方法 - Google Patents
一种基于高光谱图像技术的藏红花分类方法 Download PDFInfo
- Publication number
- CN110849828A CN110849828A CN201911283344.7A CN201911283344A CN110849828A CN 110849828 A CN110849828 A CN 110849828A CN 201911283344 A CN201911283344 A CN 201911283344A CN 110849828 A CN110849828 A CN 110849828A
- Authority
- CN
- China
- Prior art keywords
- saffron
- algorithm
- hyperspectral
- hyperspectral image
- spectral data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000015655 Crocus sativus Nutrition 0.000 title claims abstract description 140
- 244000124209 Crocus sativus Species 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000005516 engineering process Methods 0.000 title claims abstract description 15
- 235000013974 saffron Nutrition 0.000 claims abstract description 88
- 239000004248 saffron Substances 0.000 claims abstract description 81
- 230000003595 spectral effect Effects 0.000 claims abstract description 58
- 238000001228 spectrum Methods 0.000 claims abstract description 52
- 238000012937 correction Methods 0.000 claims abstract description 24
- 238000003062 neural network model Methods 0.000 claims abstract description 23
- 238000000605 extraction Methods 0.000 claims abstract description 16
- 230000003044 adaptive effect Effects 0.000 claims abstract description 14
- 238000009499 grossing Methods 0.000 claims abstract description 14
- 230000002860 competitive effect Effects 0.000 claims abstract description 13
- 238000013528 artificial neural network Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims abstract description 9
- 230000002068 genetic effect Effects 0.000 claims abstract description 8
- 230000008030 elimination Effects 0.000 claims abstract description 6
- 238000003379 elimination reaction Methods 0.000 claims abstract description 6
- 238000000701 chemical imaging Methods 0.000 claims description 11
- 238000012795 verification Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000012952 Resampling Methods 0.000 abstract description 6
- 238000012360 testing method Methods 0.000 abstract description 6
- 239000000284 extract Substances 0.000 abstract description 5
- 238000001514 detection method Methods 0.000 description 16
- 238000002821 scintillation proximity assay Methods 0.000 description 9
- 239000013598 vector Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 235000004237 Crocus Nutrition 0.000 description 2
- 241000596148 Crocus Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000010238 partial least squares regression Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- SEBIKDIMAPSUBY-ARYZWOCPSA-N Crocin Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H](O)[C@@H]1O)O)OC(=O)C(C)=CC=CC(C)=C\C=C\C=C(/C)\C=C\C=C(C)C(=O)O[C@H]1[C@@H]([C@@H](O)[C@H](O)[C@@H](CO[C@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)O1)O)O[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O SEBIKDIMAPSUBY-ARYZWOCPSA-N 0.000 description 1
- SEBIKDIMAPSUBY-JAUCNNNOSA-N Crocin Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C(=O)OC1OC(COC2OC(CO)C(O)C(O)C2O)C(O)C(O)C1O)C=CC=C(/C)C(=O)OC3OC(COC4OC(CO)C(O)C(O)C4O)C(O)C(O)C3O SEBIKDIMAPSUBY-JAUCNNNOSA-N 0.000 description 1
- 241001113425 Iridaceae Species 0.000 description 1
- 238000012614 Monte-Carlo sampling Methods 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000013376 functional food Nutrition 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/27—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/188—Vegetation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/194—Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Immunology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于高光谱图像技术的藏红花分类方法,涉及图像处理技术领域。本发明提供的方法采用高光谱成像仪获取各个藏红花品级的高光谱图像信息,提取高光谱图像中430~1023nm范围内的光谱数据,并采用Savitzky‑Golay平滑算法对光谱数据进行去除噪声预处理,采用连续投影算法、遗传算法、无信息变量消除算法和竞争自适应加权重采样算法等特征变量提取算法提取光谱数据特征光谱,分别建立基于全谱和基于特征光谱的特征变量提取‑反馈神经网络模型,并经对比测试确定采用竞争自适应加权重采样算法结合反馈神经网络共同建立模型进行训练和测试后得到校正集合预测集,从而通过高光谱图像技术实现对藏红花品质的高效率、高精度和无损耗鉴别。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种基于高光谱图像技术的藏红花分类方法。
背景技术
藏红花是鸢尾科番红花属球根类多年生草本植物,其可作为珍贵的中药材治疗疾病,亦可用于功能性食品天然色素,保健性化妆品等进行栽培。由于藏红花的适宜栽种地区较少,生长条件较为严苛,导致其产出无法满足市场的需求,且不同产地、不同栽培方式得到的藏红花的主要成分含量不同,市场上藏红花很容易出现以次充好,甚至掺假的现象,因此需要对藏红花的品质进行快速准确的鉴别。
目前市场上藏红花的分级存在很大的随意性,针对藏红花品质的检测鉴别主要包括目视法、高效液相色谱检测法以及紫外吸收光谱鉴别法。其中,目视检测法主要是通过肉眼直接观测或在显微镜下观察藏红花的颜色、质地、形状、气味等性状,需要检测人员具备丰富的经验,且检测结果容易受到检测人员主观因素而影响对藏红花品质鉴定的准确性;而高效液相色谱法通过分析测定藏红花中的藏红花素含量进行品质鉴别,其检测精度较为可靠,但检测成本较高,时间较长,对藏红花样本的损耗也较大,很容易造成对藏红花资源的浪费。
发明内容
为了解决现有藏红花品质检测方法对藏红花品质的检测效率较低,检测精度较低,检测成本较高的技术问题,本发明提供一种基于高光谱图像技术的藏红花分类方法,通过采用可见-近红外高光谱成像技术结合化学计量学方法对藏红花的品质、等级、产地等进行定性鉴别,从而提高对藏红花的分级管理,达到综合提高对藏红花品质的检测效率和检测精度,同时降低检测成本的技术问题。
根据本发明实施例的一个方面,提供一种基于高光谱图像技术的藏红花分类方法,其特征在于,所述方法包括:
(1)对于每种藏红花品级,分别采集所述藏红花品级所对应的预设数量个藏红花样本的高光谱图像;
(2)对于每个高光谱图像,将所述高光谱图像划分为50*50像素点的感兴趣区域,所述高光谱图像内每个像素点对应一条光谱数据,再对所述感兴趣区域作去背景处理后,将所述感兴趣区域内各像素点所对应光谱数据的平均值,确定为所述高光谱图像所对应藏红花样本的光谱数据;
(3)对于每种藏红花品级,将所述藏红花品级所对应的预设数量个藏红花样本的光谱数据划分为校正集和验证集,将所述校正集包括的各条光谱数据及对应的藏红花品级作为一组输入关系,采用特征变量提取算法与反馈神经网络算法的融合算法建立特征变量提取-反馈神经网络模型并进行训练,所述特征变量提取算法用于提取光谱数据对应的特征光谱,所述反馈神经网络算法的输入数据为特征光谱,输出数据为藏红花品级;
(4)对于待分类的目标藏红花样本,采集所述目标藏红花样本的高光谱图像所对应的目标光谱数据,将所述目标光谱数据输入至所述特征变量提取-反馈神经网络模型,计算得到所述目标藏红花样本所对应的藏红花品级。
在一个优选的实施例中,步骤(3)中所述特征变量提取算法为连续投影算法、遗传算法、无信息变量消除算法和竞争自适应重加权算法中的一种。
在一个优选的实施例中,步骤(3)中所述特征变量提取算法为竞争自适应重加权算法。
在一个优选的实施例中,步骤(2)之后,所述方法还包括:
采用Savitzky-Golay平滑算法,以二次多项式15点平滑对采集的各个藏红花样本对应的光谱数据进行去噪处理。
在一个优选的实施例中,步骤(3)中输入所述特征变量提取-反馈神经网络模型的光谱为430~1023nm波段的光谱数据。
在一个优选的实施例中,步骤(3)中所述特征变量提取-反馈神经网络模型为三层结构,各层传递函数采用Sigmoid函数,所述特征变量提取-反馈神经网络模型的工作参数包括:网络输入层节点数为459,第一隐含层节点数为20,第二隐含层节点数为10,输出层节点数为1,目标误差值为0.00001,网络学习速率为0.1,训练迭代次数为10000,判别阈值为0.5。
在一个优选的实施例中,步骤(1)中高光谱图像的采集通过高光谱成像装置实现,所述高光谱成像装置包括高光谱成像仪、高光谱摄像头、线光源、移动平台、计算机及暗箱;所述线光源分布于所述暗箱内部空间的两侧;所述移动平台设于所述暗箱的底部并与移动电机电连接;所述高光谱摄像头设于所述暗箱内部空间的顶部;所述高光谱成像仪设于所述暗箱外部;所述计算机设于所述暗箱的外部,并通过连接线分别与所述高光谱摄像头、所述高光谱成像仪、所述线光源、所述移动平台电信号连接。
在一个优选的实施例中,步骤(1)之后,所述方法还包括:
对采集的各个藏红花样本的高光谱图像进行黑白板校正,校正工序采用的校正公式为
综上所述,本发明提供的一种基于改进Vibe+算法的运动目标背景分割方法可以包括以下有益效果:
本发明提供的方法采用高光谱成像仪获取各个藏红花品级的高光谱图像信息,提取高光谱图像中430~1023nm范围内的光谱数据,并采用Savitzky-Golay平滑算法对光谱数据进行去除噪声预处理,然后采用连续投影算法、遗传算法、无信息变量消除算法和竞争自适应加权重采样算法等特征变量提取算法提取光谱数据特征光谱,分别建立基于全谱和基于特征光谱的特征变量提取-反馈神经网络模型,并经对比测试确定采用竞争自适应加权重采样算法结合反馈神经网络共同建立特征变量提取-反馈神经网络模型,对该特征变量提取-反馈神经网络模型进行训练和测试后得到校正集合预测集,精度分别为94.75%和94.67%,从而通过高光谱图像技术实现对藏红花品质的高效率、高精度和无损耗鉴别。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明一个实施例提供的一种基于高光谱图像技术的藏红花分类方法的流程示意图。
图2是本发明一个实施例提供的一种高光谱成像装置的装置示意图。
图3是本发明一个实施例提供的6种品级藏红花的光谱数据示意图。
图4是本发明一个实施例提供的各品级藏红花第一主成分和第二主成分的得分分布图。
图5是本发明一个实施例提供的SPA、GA、UVE、CARS算法对藏红花光谱数据的特征变量选择结果曲线图。
图6是本发明一个实施例提供的CARS-BPNN模型对6个藏红花品级的鉴别结果示意图。
具体实施方式
为了使本发明的目的、 技术方案和优点更加清楚,以下结合具体实施例(但不限于所举实施例)与附图详细描述本发明,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参考图1,其示出了本发明一个实施例提供的一种基于高光谱图像技术的藏红花分类方法的流程示意图,所述方法包括:
步骤(1):对于每种藏红花品级,分别采集所述藏红花品级所对应的预设数量个藏红花样本的高光谱图像。
在本发明实施例中,藏红花品级分为1、2、3、4、5、6共6个级别,其中,1级别为伪藏红花级,2、3、4级别分别为国产一级藏红花、国产二级藏红花、国产三级藏红花,5、6级别分别为进口一级藏红花、进口二级藏红花。需要说明的是,由于市场上经常将与藏红花外观相似的草红花假冒藏红花,为了更好地对市场上各类藏红花进行鉴别,本发明将草红花样本作为伪藏红花级的样本。
在一个优选的实施例中,步骤(1)中高光谱图像的采集通过高光谱成像装置实现,所述高光谱成像装置包括高光谱成像仪100、高光谱摄像头200、线光源300、移动平台400、计算机500及暗箱600;所述线光源300分布于所述暗箱600内部空间的两侧;所述移动平台400设于所述暗箱600的底部并与移动电机电连接;所述高光谱摄像头200设于所述暗箱600内部空间的顶部;所述高光谱成像仪100设于所述暗箱600外部;所述计算机500设于所述暗箱600的外部,并通过连接线分别与所述高光谱摄像头200、所述高光谱成像仪100、所述线光源300、所述移动平台400电信号连接,如图2所示。
在本发明实施例中,高光谱成像仪100采用的型号为N173-QE,高光谱摄像头200采用的型号为OLE-23,线光源300采用的型号为Fiber-Lite DC950,移动平台600采用的型号为IRCP0076,高光谱测量光谱范围是380~1023nm,平均间隔为1.2nm,光谱分辨率为5nm,其中,高光谱数据分析软件可以采用ENVI4.6、Unscrambler9.7、Matlab2014等分析软件。
在进行高光谱图像的采集工序时,首先将藏红花样本均匀铺设于高光谱成像装置的移动平台400上,经过反复调试使得采集的图像大小合适、清晰且不失真,然后通过计算机500设定高光谱摄像头200的曝光时间为0.09ms、移动平台400的移动速度为2.6mm/s,移动平台400的位移距离为400mm,藏红花样本与高光谱摄像头200之间的距离为15cm,高光谱成像仪100的图像分辨率为672*512像素点,最后关闭暗箱600来避免外部光线对最终光谱图像的干扰,通过计算机500控制所述高光谱成像装置根据上述参数对当前藏红花样本进行高光谱图像的采集作业。
此外,为了消除高光谱摄像头200中暗电流及不均匀光强产生的噪声,步骤(1)之后,所述方法还包括:
对采集的各个藏红花样本的高光谱图像进行黑白板校正,校正工序采用的校正公式为
步骤(2):对于每个高光谱图像,将所述高光谱图像划分为50*50像素点的感兴趣区域,所述高光谱图像内每个像素点对应一条光谱数据,再对所述感兴趣区域作去背景处理后,将所述感兴趣区域内各像素点所对应光谱数据的平均值,确定为所述高光谱图像所对应藏红花样本的光谱数据。
在本发明提供的实施例中,每种藏红花品级所采集的藏红花样本的高光谱图像可以为300个。
由于高频随机噪声、样本不均匀、基线漂移、光散射等干扰因素容易影响后续的建模效果,本发明采用Savitzky-Golay平滑算法对采集到的光谱数据进行预处理,从而有效消减光谱数据中的随机噪声。
在一个优选的实施例中,步骤(2)之后,所述方法还包括:
采用Savitzky-Golay平滑算法,以二次多项式15点平滑对采集的各个藏红花样本对应的光谱数据进行去噪处理。
在一个优选的实施例中,步骤(3)中输入所述特征变量提取-反馈神经网络模型的光谱为430~1023nm波段的光谱数据。
为了消除光谱数据在采集时在光谱首端产生的部分噪声,本发明截取430~1023nm波段的光谱数据进行后续的实验分析。
本发明采用Savitzky-Golay平滑算法二次多项式15点平滑对采集的各个藏红花样本对应的光谱数据进行去噪处理,然后对每种藏红花品级对应的300条光谱数据分别取平均,得到6种品级藏红花的光谱数据如图3所示,其中,a为伪藏红花级对应的光谱数据,b为国产一级对应的光谱数据,c为国产二级对应的光谱数据,d为国产三级对应的光谱数据,e为进口一级对应的光谱数据,f为进口二级对应的光谱数据。通过观察图3可知,伪藏红花级与其他品级藏红花的光谱数据之间存在较大的差异。在620~1023nm波段范围内,国产的3个不同品质等级藏红花的光谱数据之间存在一定的差异。在720~1023nm波段范围内,进口的2个不同品质等级藏红花的光谱数据存在一定差异。
进一步的,对各个品级的藏红花样本所对应光谱数据进行主成分分析可知,第一主成分PC1的贡献率为93.34%,第二主成分PC2的贡献率为4.70%,PC1和PC2累计贡献率为98.04%,PC1和PC2的得分分布图如图4所示。
通过观察图4可知,真伪藏红花通过光谱数据可明显区分,采用高光谱技术对藏红花的真伪、品质等级、产地进行鉴别具备较强的可行性,但各个国产等级之间较难直接区分,且得分图中均有重合区域,需要对光谱数据进行进一步处理和分析来鉴别藏红花样本的产地和品级。
步骤(3):对于每种藏红花品级,将所述藏红花品级所对应的预设数量个藏红花样本的光谱数据划分为校正集和验证集,将所述校正集包括的各条光谱数据及对应的藏红花品级作为一组输入关系,采用特征变量提取算法与反馈神经网络算法的融合算法建立特征变量提取-反馈神经网络模型并进行训练,所述特征变量提取算法用于提取光谱数据对应的特征光谱,所述反馈神经网络算法的输入数据为特征光谱,输出数据为藏红花品级。
在一个优选的实施例中,步骤(3)中所述特征变量提取算法为连续投影算法、遗传算法、无信息变量消除算法和竞争自适应重加权算法中的一种。
在一个优选的实施例中,步骤(3)中所述特征变量提取算法为竞争自适应重加权算法。
由于高光谱图像所对应的可见-近红外波段的光谱特征吸收区域不明确、光谱信息冗杂,并且存在严重的多重共线性问题,通常需要大量样本进行有效建模。
在采用反馈神经网络(back propagation neural networks,BPNN)对藏红花光谱数据和藏红花品级进行建模前,为了简化模型且提高模型的预测精度,本发明实施例分别采用连续投影算法(Successive Projections Algorithm,SPA)、遗传算法(GeneticAlgorithm,GA)、无信息变量消除算法(Elimination of Uninformative Variables,UVE)和竞争自适应重加权算法(Competitive Adaptive Reweighed Sampling,CARS)这几种特征变量提取算法对采集的各个藏红花样本光谱数据进行特征光谱的提取,并以提取出的特征光谱数据作为输入用于BPNN的计算,从而大大减小了后续模型的计算量。
其中,SPA是一种前向变量循环选择方法,它利用向量的投影分析,寻找含有最低限度冗余信息的变量组,能够有效地消除光谱中变量间的共线性、奇异性和不稳定性影响,使向量间的共线性达到最小,同时减小建模所采用的变量的个数,降低模型的复杂度,从而提高建模的速度和效率。在本发明中,设置SPA的最大选出变量数为20.
GA是一类借鉴生物界物种竞争选择的进化机制演化而来的随机搜索方法,以适应度函数为依据,利用选择、交叉、变异等算子的操作,实现群体内重组个体结构的迭代优化,进而实现变量的选择。本发明采用的遗传算法的主要参数设置为:光谱数据采用标准化处理,群体数目设置为30,交叉概率设置为50%,变异概率设置为1%,迭代次数设置为100。将经过SNV处理后的光谱阵和浓度阵输入MATLAB2014运行算法程序,在迭代过程中每次输入二进制0-1编码字符串,计算每个波长变量标识为“1”的概率,选取概率较高的波长点作为特征波长变量。
UVE是基于PLS回归系数建立的一种变量选择方法,这种方法的基本思想是将回归系数作为变量重要性的衡量指标,用于消除对模型建立贡献较少的波长变量,即消除无信息变量,从而减少建模输入变量个数,降低模型复杂性,为选择无信息变量,UVE算法通过往PLS模型中添加幅度较小的随机变量矩阵,然后基于交叉验证建立PLS模型。通过计算每个变量系数的平均值和标准差的商作为稳定性的值,然后和随机变量矩阵得到的稳定性的值进行比较,去除被认为和随机变量一样对模型建立无效的波长变量。在本发明中,设置UVE的截取参数为0.9。
CARS是模仿达尔文进化论中“适者生存”的原则,对不适应的波长变量进行逐步淘汰。该算法采用蒙特卡罗采样或随机采样的方式,从校正集样本中选取部分样本进行PLS建模,如此反复进行上百次的迭代建模。在波长变量选择过程中,采用自适应重加权采样方法保留PLS回归系数绝对值大的波长变量,去除回归系数绝对值小的波长变量。从而获得一系列的波长变量子集,采用交叉验证对每个波长变量子集建模,根据模型最小RMSECV值选择最优的波长变量子集。在本发明中,设置CARS的采样次数为500。
在一个优选的实施例中,步骤(3)中所述特征变量提取-反馈神经网络模型为三层结构,各层传递函数采用Sigmoid函数,所述特征变量提取-反馈神经网络模型的工作参数包括:网络输入层节点数为459,第一隐含层节点数为20,第二隐含层节点数为10,输出层节点数为1,目标误差值为0.00001,网络学习速率为0.1,训练迭代次数为10000,判别阈值为0.5。当有信号输入时,输入信号首先传输至隐含层节点,经作用函数处理后,再把隐含层节点的输出信号传输至输出节点,最后产生输出结果。
以校正集包括的各条光谱数据及对应的藏红花品级作为一组输入关系,分别基于SPA、GA、UVE、CARS算法选择特征波长,得到特征变量的选择结果如图5所示,其中,采用SPA算法从全谱459个变量中共选出11个特征向量,选出率为2.345%;采用GA算法选出的特征变量的个数为46,选出率为9.808%;采用UVE算法选出的变量数为194,选出率为31.77%;采用CARS算法选出的变量数为39,选出率为8.32%。UVE算法选出的特征变量数最多,但在全谱469个变量的基础上,极大压缩了原始变量的个数,从而通过特征选择去除原始光谱数据中的冗杂信息,减小了模型的计算量,提高了模型的计算效率。
本发明采用全谱469个变量,SPA算法选出的11个特征向量、GA选出的46个特征向量、UVE选出的194个特征变量、CARS选出的39个特征变量分别结合BPNN建立对应的特征变量提取-反馈神经网络模型,即,FULL-BPNN、SPA-BPNN、GA-BPNN、UVE-BPNN、CARS-BPNN,得到的模型结果如表一所示:
表一
通过表一可知,5种建模方法的校正集与验证集的鉴别精度均达到了92%以上,说明采用高光谱技术进行藏红花真伪、品级、产地的鉴别结果较为可靠,其中,SPA-BPNN模型的鉴别精度比FULL-BPNN的鉴别精度低是由于,SPA在全谱469个变量的基础上只选出11个特征变量,导致参与建模的有用变量信息不足,导致SPA-BPNN模型的精度较低。GA-BPNN、UVE-BPNN模型的鉴别精度比FULL-BPNN的鉴别精度略低,但在全谱的基础上仅选用部分变量进行建模,能够降低模型的计算量。CARS-BPNN模型的鉴别精度较FULL-BPNN的模型结果高,且仅选用了39个变量参与建模,因此,本发明选用CARS-BPNN模型能够更加有效地对藏红花品级进行快速精确的鉴别。
为了进一步验证CARS-BPNN模型对藏红花品级的鉴别效果,采用验证集中不同品级藏红花包括的各条光谱数据对CARS-BPNN模型进行验证,得到的验证集中6个品级藏红花的验证结果如图6所示。
本发明选取验证集中每种品级藏红花的光谱数据为100条,由图6可知,采用CARS-BPNN对伪藏红花级和国产三级藏红花的鉴别精度较高,对进口一级藏红花的鉴别精度最低。
如表二所示,其列出了CARS-BPNN对6类藏红花进行验证的鉴定数量,其中,伪藏红花级的鉴别精度达到100%,国产一级藏红花中有1个样本被误判为伪藏红花级,4个被误判为国产二级藏红花,鉴别精度为95%;国产二级藏红花中有6个被误判为国产三级藏红花,鉴别精度为94%,国产三级藏红花的鉴别精度为100%;进口一级藏红花中有9个被误判为国产三级藏红花,8个被误判为进口二级藏红花,鉴别精度为83%;进口二级藏红花中有1个被误判为国产三级藏红花,3个被误判为进口一级藏红花,鉴别精度为96%。
整个验证集中600个样本的鉴别正确数为564,鉴别错误数为32,整体鉴别精度为94.67%,显然,本发明提供的一种基于高光谱图像技术的藏红花分类方法应用于藏红花的品级鉴别具备较高的鉴别精度。
表二
步骤(4):对于待分类的目标藏红花样本,采集所述目标藏红花样本的高光谱图像所对应的目标光谱数据,将所述目标光谱数据输入至所述特征变量提取-反馈神经网络模型,计算得到所述目标藏红花样本所对应的藏红花品级。
在完成对特征变量提取-反馈神经网络模型的训练和验证后,可使用该模型进行目标藏红花样本的鉴定工作。
本发明通过采用高光谱成像技术,对藏红花的真伪、等级和产地进行分级鉴别,从高光谱图像中提取藏红花样本的光谱,通过主成分分析确定真伪藏红花存在明显的可分性,并进一步采用Savitzky-Golay平滑算法,以二次多项式15点平滑对采集的各个藏红花样本对应的光谱数据进行去噪处理后,分别采用SPA、GA、UVE和CARS算法分别提取特征光谱,并分别建立基于全谱和基于特征光谱的BP神经网络模型,从而实现对藏红花不同品级的有效鉴别,进一步确定CARS结合BPNN建模的鉴别精度最高,表明从全谱中提取的特征光谱具备有效地鉴别作用,从而实现对鉴别模型的简化同时,提高模型的检测精度。
综上所述,本发明提供的方法采用高光谱成像仪获取各个藏红花品级的高光谱图像信息,提取高光谱图像中430~1023nm范围内的光谱数据,并采用Savitzky-Golay平滑算法对光谱数据进行去除噪声预处理,采用连续投影算法、遗传算法、无信息变量消除算法和竞争自适应加权重采样算法等特征变量提取算法提取光谱数据特征光谱,分别建立基于全谱和基于特征光谱的特征变量提取-反馈神经网络模型,并经对比测试确定采用竞争自适应加权重采样算法结合反馈神经网络共同建立模型进行训练和测试后得到校正集合预测集,从而通过高光谱图像技术实现对藏红花品质的高效率、高精度和无损耗鉴别。
虽然,前文已经用一般性说明、具体实施方式及试验,对本发明做了详尽的描述,但在本发明基础上,可以对之进行修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
本领域技术人员在考虑说明书及实践这里的发明的后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。
Claims (8)
1.一种基于高光谱图像技术的藏红花分类方法,其特征在于,所述方法包括:
(1)对于每种藏红花品级,分别采集所述藏红花品级所对应的预设数量个藏红花样本的高光谱图像;
(2)对于每个高光谱图像,将所述高光谱图像划分为50*50像素点的感兴趣区域,所述高光谱图像内每个像素点对应一条光谱数据,再对所述感兴趣区域作去背景处理后,将所述感兴趣区域内各像素点所对应光谱数据的平均值,确定为所述高光谱图像所对应藏红花样本的光谱数据;
(3)对于每种藏红花品级,将所述藏红花品级所对应的预设数量个藏红花样本的光谱数据划分为校正集和验证集,将所述校正集包括的各条光谱数据及对应的藏红花品级作为一组输入关系,采用特征变量提取算法与反馈神经网络算法的融合算法建立特征变量提取-反馈神经网络模型并进行训练,所述特征变量提取算法用于提取光谱数据对应的特征光谱,所述反馈神经网络算法的输入数据为特征光谱,输出数据为藏红花品级;
(4)对于待分类的目标藏红花样本,采集所述目标藏红花样本的高光谱图像所对应的目标光谱数据,将所述目标光谱数据输入至所述特征变量提取-反馈神经网络模型,计算得到所述目标藏红花样本所对应的藏红花品级。
2.根据权利要求1所述的方法,其特征在于,步骤(3)中所述特征变量提取算法为连续投影算法、遗传算法、无信息变量消除算法和竞争自适应重加权算法中的一种。
3.根据权利要求2所述的方法,其特征在于,步骤(3)中所述特征变量提取算法为竞争自适应重加权算法。
4.根据权利要求1所述的方法,其特征在于,步骤(2)之后,所述方法还包括:
采用Savitzky-Golay平滑算法,以二次多项式15点平滑对采集的各个藏红花样本对应的光谱数据进行去噪处理。
5.根据权利要求1所述的方法,其特征在于,步骤(3)中输入所述特征变量提取-反馈神经网络模型的光谱为430~1023nm波段的光谱数据。
6.根据权利要求1所述的方法,其特征在于,步骤(3)中所述特征变量提取-反馈神经网络模型为三层结构,各层传递函数采用Sigmoid函数,所述特征变量提取-反馈神经网络模型的工作参数包括:网络输入层节点数为459,第一隐含层节点数为20,第二隐含层节点数为10,输出层节点数为1,目标误差值为0.00001,网络学习速率为0.1,训练迭代次数为10000,判别阈值为0.5。
7.根据权利要求1所述的方法,其特征在于,步骤(1)中高光谱图像的采集通过高光谱成像装置实现,所述高光谱成像装置包括高光谱成像仪、高光谱摄像头、线光源、移动平台、计算机及暗箱;所述线光源分布于所述暗箱内部空间的两侧;所述移动平台设于所述暗箱的底部并与移动电机电连接;所述高光谱摄像头设于所述暗箱内部空间的顶部;所述高光谱成像仪设于所述暗箱外部;所述计算机设于所述暗箱的外部,并通过连接线分别与所述高光谱摄像头、所述高光谱成像仪、所述线光源、所述移动平台电信号连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911283344.7A CN110849828A (zh) | 2019-12-13 | 2019-12-13 | 一种基于高光谱图像技术的藏红花分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911283344.7A CN110849828A (zh) | 2019-12-13 | 2019-12-13 | 一种基于高光谱图像技术的藏红花分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110849828A true CN110849828A (zh) | 2020-02-28 |
Family
ID=69609102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911283344.7A Pending CN110849828A (zh) | 2019-12-13 | 2019-12-13 | 一种基于高光谱图像技术的藏红花分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110849828A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111398211A (zh) * | 2020-03-09 | 2020-07-10 | 浙江工业大学 | 一种苍术颗粒剂的信息区分处理方法 |
CN111796710A (zh) * | 2020-06-02 | 2020-10-20 | 南京信息工程大学 | 一种在触摸屏上再现图像轮廓特征的方法 |
CN112954051A (zh) * | 2021-02-07 | 2021-06-11 | 广州一盒科技有限公司 | 一种用于食材加工的远程控制方法及系统 |
CN112967067A (zh) * | 2021-02-08 | 2021-06-15 | 中科谱光(郑州)应用科学技术研究院有限公司 | 一种食品安全光谱码的生成和验证的方法、装置和系统 |
CN113008805A (zh) * | 2021-02-07 | 2021-06-22 | 浙江工业大学 | 基于高光谱成像深度分析的白芷饮片质量预测方法 |
CN113408616A (zh) * | 2021-06-18 | 2021-09-17 | 北京航空航天大学 | 基于pca-uve-elm的光谱分类方法 |
CN113505661A (zh) * | 2021-06-22 | 2021-10-15 | 中国农业大学 | 产地鉴别的方法、装置、电子设备及存储介质 |
CN113607681A (zh) * | 2021-07-19 | 2021-11-05 | 黑龙江八一农垦大学 | 杏鲍菇菌丝体检测方法、装置、电子设备及存储介质 |
CN116026787A (zh) * | 2023-03-29 | 2023-04-28 | 湖南汇湘轩生物科技股份有限公司 | 一种香精品级检测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104406940A (zh) * | 2014-12-01 | 2015-03-11 | 上海理工大学 | 一种打工业蜡大米的无损鉴别方法 |
CN106404692A (zh) * | 2016-11-09 | 2017-02-15 | 大连工业大学 | 利用高光谱成像技术检测即食海参新鲜度等级的方法 |
CN106525732A (zh) * | 2016-10-25 | 2017-03-22 | 沈阳农业大学 | 基于高光谱成像技术的苹果内外品质快速无损检测方法 |
CN106596416A (zh) * | 2016-11-25 | 2017-04-26 | 华中农业大学 | 一种基于高光谱成像技术的冷鲜肉品质无损检测方法 |
-
2019
- 2019-12-13 CN CN201911283344.7A patent/CN110849828A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104406940A (zh) * | 2014-12-01 | 2015-03-11 | 上海理工大学 | 一种打工业蜡大米的无损鉴别方法 |
CN106525732A (zh) * | 2016-10-25 | 2017-03-22 | 沈阳农业大学 | 基于高光谱成像技术的苹果内外品质快速无损检测方法 |
CN106404692A (zh) * | 2016-11-09 | 2017-02-15 | 大连工业大学 | 利用高光谱成像技术检测即食海参新鲜度等级的方法 |
CN106596416A (zh) * | 2016-11-25 | 2017-04-26 | 华中农业大学 | 一种基于高光谱成像技术的冷鲜肉品质无损检测方法 |
Non-Patent Citations (2)
Title |
---|
宋咏梅 主编: "《家庭中药使用技巧》", 31 January 2006, 上海科学技术出版社 * |
海兵帅: "基于集成学习的苹果品质高光谱检测方法研究", 《中国优秀博硕士学位论文全文数据库(硕士) 基础科学辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111398211A (zh) * | 2020-03-09 | 2020-07-10 | 浙江工业大学 | 一种苍术颗粒剂的信息区分处理方法 |
CN111796710B (zh) * | 2020-06-02 | 2023-05-23 | 南京信息工程大学 | 一种在触摸屏上再现图像轮廓特征的方法 |
CN111796710A (zh) * | 2020-06-02 | 2020-10-20 | 南京信息工程大学 | 一种在触摸屏上再现图像轮廓特征的方法 |
CN112954051A (zh) * | 2021-02-07 | 2021-06-11 | 广州一盒科技有限公司 | 一种用于食材加工的远程控制方法及系统 |
CN113008805A (zh) * | 2021-02-07 | 2021-06-22 | 浙江工业大学 | 基于高光谱成像深度分析的白芷饮片质量预测方法 |
CN112954051B (zh) * | 2021-02-07 | 2021-09-03 | 广州一盒科技有限公司 | 一种用于食材加工的远程控制方法及系统 |
CN113008805B (zh) * | 2021-02-07 | 2024-03-26 | 浙江工业大学 | 基于高光谱成像深度分析的白芷饮片质量预测方法 |
CN112967067A (zh) * | 2021-02-08 | 2021-06-15 | 中科谱光(郑州)应用科学技术研究院有限公司 | 一种食品安全光谱码的生成和验证的方法、装置和系统 |
CN113408616A (zh) * | 2021-06-18 | 2021-09-17 | 北京航空航天大学 | 基于pca-uve-elm的光谱分类方法 |
CN113408616B (zh) * | 2021-06-18 | 2024-03-26 | 北京航空航天大学 | 基于pca-uve-elm的光谱分类方法 |
CN113505661A (zh) * | 2021-06-22 | 2021-10-15 | 中国农业大学 | 产地鉴别的方法、装置、电子设备及存储介质 |
CN113607681A (zh) * | 2021-07-19 | 2021-11-05 | 黑龙江八一农垦大学 | 杏鲍菇菌丝体检测方法、装置、电子设备及存储介质 |
CN116026787A (zh) * | 2023-03-29 | 2023-04-28 | 湖南汇湘轩生物科技股份有限公司 | 一种香精品级检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110849828A (zh) | 一种基于高光谱图像技术的藏红花分类方法 | |
Barbedo et al. | Identifying multiple plant diseases using digital image processing | |
Lin et al. | Freshness measurement of eggs using near infrared (NIR) spectroscopy and multivariate data analysis | |
CN111274860A (zh) | 一种基于机器视觉的在线自动烟叶等级分选的识别方法 | |
CN112016392B (zh) | 一种基于高光谱图像的大豆虫害程度的小样本检测方法 | |
CN109883967B (zh) | 一种基于信息融合的中华绒螯蟹品质等级判别方法 | |
CN110163101B (zh) | 中药材种子区别及等级快速判别方法 | |
KR102448123B1 (ko) | 농산물 신선도 예측 방법 및 장치 | |
Zhihui et al. | Nondestructive detection of infertile hatching eggs based on spectral and imaging information | |
CN116297236A (zh) | 一种基于高光谱的单粒玉米种子活力鉴别方法及装置 | |
CN113657158A (zh) | 基于Google Earth Engine的大尺度大豆种植区域提取算法 | |
Zheng et al. | Effective band selection of hyperspectral image by an attention mechanism-based convolutional network | |
CN111767943A (zh) | 地膜识别方法、装置、电子设备及存储介质 | |
CN118015244B (zh) | 一种基于卷积神经网络的烟丝均匀性检测方法和系统 | |
Masuda et al. | Noninvasive diagnosis of seedless fruit using deep learning in persimmon | |
Diaz-Garcia et al. | GiNA, an efficient and high-throughput software for horticultural phenotyping | |
CN117250161B (zh) | 一种大豆耐盐碱鉴定池的实时监测系统 | |
CN113256733B (zh) | 基于置信度投票卷积神经网络的相机光谱灵敏度重建方法 | |
Li et al. | Low-carbon jujube moisture content detection based on spectral selection and reconstruction | |
CN113962258A (zh) | 一种烟草病害的识别与防治方法、系统及存储介质 | |
Cointault et al. | Texture, color and frequential proxy-detection image processing for crop characterization in a context of precision agriculture | |
Su | [Retracted] Data Research on Tobacco Leaf Image Collection Based on Computer Vision Sensor | |
Sun et al. | Nondestructive measurement method for greenhouse cucumber parameters based on machine vision | |
De Silva et al. | Plant disease detection using deep learning on natural environment images | |
CN113283378B (zh) | 一种基于梯形区域归一化像素差异特征的猪脸检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200228 |
|
WD01 | Invention patent application deemed withdrawn after publication |