CN114639009A - 基于高光谱图像和机器学习的桂圆干品种分类方法及装置 - Google Patents
基于高光谱图像和机器学习的桂圆干品种分类方法及装置 Download PDFInfo
- Publication number
- CN114639009A CN114639009A CN202210024740.3A CN202210024740A CN114639009A CN 114639009 A CN114639009 A CN 114639009A CN 202210024740 A CN202210024740 A CN 202210024740A CN 114639009 A CN114639009 A CN 114639009A
- Authority
- CN
- China
- Prior art keywords
- image
- longan
- hyperspectral
- dried longan
- dried
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 235000000235 Euphoria longan Nutrition 0.000 title claims abstract description 284
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000010801 machine learning Methods 0.000 title claims abstract description 30
- 244000139609 Euphoria longan Species 0.000 title 1
- 240000001008 Dimocarpus longan Species 0.000 claims abstract description 284
- 238000013145 classification model Methods 0.000 claims abstract description 55
- 238000007781 pre-processing Methods 0.000 claims abstract description 24
- 230000009467 reduction Effects 0.000 claims abstract description 23
- 238000000701 chemical imaging Methods 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000002790 cross-validation Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 34
- 238000012360 testing method Methods 0.000 claims description 12
- 238000003384 imaging method Methods 0.000 claims description 8
- 238000002372 labelling Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 240000008042 Zea mays Species 0.000 claims description 5
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 5
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 5
- 235000005822 corn Nutrition 0.000 claims description 5
- 238000010332 dry classification Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000007797 corrosion Effects 0.000 claims description 3
- 238000005260 corrosion Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 208000003643 Callosities Diseases 0.000 claims 1
- 206010020649 Hyperkeratosis Diseases 0.000 claims 1
- 238000012706 support-vector machine Methods 0.000 abstract description 18
- 230000006870 function Effects 0.000 description 8
- 238000001228 spectrum Methods 0.000 description 7
- 235000013399 edible fruits Nutrition 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 235000019640 taste Nutrition 0.000 description 2
- 244000183278 Nephelium litchi Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration by the use of local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G06T5/70—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30181—Earth observation
- G06T2207/30188—Vegetation; Agriculture
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于高光谱图像和机器学习的桂圆干品种分类方法及装置,方法包括:将同一品种桂圆干的多个不同样本为一组进行高光谱成像得到高光谱图像集;将所有高光谱图像集进行图像预处理得到桂圆干高光谱样本集;标明高光谱样本集中不同品种桂圆干图像所属的种类;对高光谱样本集进行数据降维得到降维后的数据集;将降维后的数据集分别导入SVM和KNN学习模型中进行监督学习,使用交叉验证法计算准确率,构建桂圆干分类模型;将处理后待检测桂圆干高光谱图像导入桂圆干分类模型进行分类,得到分类结果。本发明采用高光谱成像技术结合图像处理技术,提取感兴趣区域,使用K邻近算法和支持向量机两类机器学习模型,实现多种类桂圆干的分类识别。
Description
技术领域
本发明属于高光谱图像处理方法与应用技术领域,具体涉及一种基于高光谱图像和机器学习的桂圆干品种分类方法及装置。
背景技术
桂圆是我国热带区域重要的经济果树之一,据国家荔枝桂圆产业技术体系统计,2018年,桂圆栽培面积约413.97万亩,产量约157.21万吨,约占世界总产量的50%左右。桂圆干是由鲜桂圆烘干后制成。然而,由于我国桂圆干品种市场的监管长期处于空缺状态,导致了修饰性、模仿性和低水平重复性的桂圆干品种多,“一品多名”、“多品一名”以及假冒侵权等现象时有发生。
传统的桂圆干品种识别方法是首先对桂圆进行品种分类,再将对应品种的桂圆制成桂圆干。桂圆品种分类主要通过人工检测,通过桂圆的形状,大小和口感等来进行区分;在制成桂圆干后主要通过味道、形状来区分;因此桂圆干分类易受主观判定的影响,比如桂圆干的“果肉香味”这个性状,有5种缩略表达状态“无或极弱、弱、中、强、极强”,该性状主要通过测试人员的嗅觉判断,主观性较大。如果因为这些主观问题导致桂圆干品种分类不准确,就会出现漏选或错选的情况。
现有技术主观性太强,很容易导致分类不准确,且需要先进行桂圆的品种分类,再根据桂圆的分类结果来得到对应的桂圆干分类结果,过程较为繁复;随着机器学习、图像处理与高光谱技术的发展,为多品种桂圆干的分类检测提供了一种全新的研究方向,对桂圆干品种的分类识别提供了直接客观的保障。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于高光谱图像和机器学习的桂圆干品种分类方法及装置,将高光谱成像技术与图像处理技术相结合,提取感兴趣区域,使用K邻近算法和支持向量机两类机器学习模型,实现多种类桂圆干的分类识别,节约了人力成本,且识别准确率高。
为了达到上述目的,本发明采用以下技术方案:
本发明一方面提供了一种基于高光谱图像和机器学习的桂圆干品种分类方法,包括以下步骤:
将同一品种桂圆干的多个不同样本为一组进行高光谱成像,获取高光谱图像后,将高光谱图像中的桂圆干部分进行裁剪,得到该品种的高光谱图像集,对所有品种桂圆干都进行相同操作得到所有桂圆干高光谱图像集;
将所有桂圆干高光谱图像集进行图像预处理,得到所有桂圆干高光谱样本集,所述高光谱样本集包含不同品种桂圆干的特征数据,所述图像预处理包括感兴趣区域截取、桂圆干图像块截取、图像像素灰度值提取以及数据的CSV格式存储;
标明高光谱样本集中不同品种桂圆干图像所属的桂圆种类;
对高光谱样本集运用PCA算法进行数据降维,得到降维后数据集;
将降维后数据集分别导入预先设立的SVM学习模型和KNN学习模型中进行监督学习,使用交叉验证分别计算两种模型得到的桂圆干品种识别准确率,构建桂圆干分类模型;
将处理后的待检测桂圆干高光谱图像导入桂圆干分类模型进行分类,得到分类结果。
作为优选的技术方案,所述不同品种桂圆干包括储良、广眼、鸡眼、石峡、土桂圆。
作为优选的技术方案,所述将高光谱图像中的桂圆干部分进行裁剪具体为:
将高光谱图像中的m个桂圆干部分,分别裁剪为桂圆干图像,再取每个桂圆干图像的内接矩形,并按照其中最小的内接矩形统一所有内接矩形的尺寸, m=同一品种桂圆干的样本数。
作为优选的技术方案,所述图像预处理具体为:
对某一品种高光谱图像集中波数段为B1的原始图像使用阈值分割法,通过多次分割找到合适的阈值,使图像中的背景区域置为白色,有效区域及桂圆干区域置为黑色,得到掩膜图像,所述原始图像为人眼能分辨出的背景像素灰度值与桂圆干像素灰度值存在显著差异的图像;
对掩膜图像进行腐蚀、膨胀处理,进一步消除图像内的噪声,得到降噪图像;
对降噪图像进行边界提取,获取桂圆干矩形图像;
对每张桂圆干矩形图像中的每一个像素的灰度值进行提取并拼接为向量V1,作为该品种桂圆干图像的特征信息,并将其作为CSV表格中的一行存储,在表格的最后一列进行种类标记,直到完成所有桂圆干矩形图像的处理以及CSV格式存储,得到桂圆干高光谱样本集。
作为优选的技术方案,所述边界提取具体为:
找到降噪图像中每个桂圆干的所有边界点,使所有边界点构成一个集合Ci,以图像左上角为原点,以右边为x轴正方向,以下边为y轴正方向构建直角坐标系,Ci则存储边界上的所有坐标,记为(xi,yi);
每个边界点集构成一个矩形,获取矩形左上角的坐标(xa,ya)与矩形的宽和高,构成每个桂圆干图像的最小外接矩形Ri,识别降噪图像中所有桂圆干的最小外接矩形;
比较降噪图像中所有桂圆干的最小外接矩形Ri的面积大小,找到其中面积最大的最小外接矩形Rm,记Rm的中心点坐标为(xc,yc),将高光谱图像集和掩膜图像中所有桂圆干按照Rm大小和位置进行裁剪,获得每个桂圆干单独的原始高光谱图像和掩膜图像;
通过中心扩展算法,以坐标(xc,yc)作为算法的中心点依次向上下左右四个边界进行中心扩散,从中心点(xc,yc)开始,在获得的裁剪后的掩膜图像中向对应边界扩展,以1为间隔向对应边界移动,当移动i次后所在坐标对应的像素点灰度值为255,即当前点已经到达有效图像之外,则以上一坐标点为该掩模图像对应边界的边界点,记为POINTi,1≤i≤4,停止对应边界的边界扩展,进行下一对应边界的边界扩展,直到找到四个边界点,求得该掩模图像中桂圆干的最大内接矩形ri;
比较掩模图像中所有桂圆干的ri面积大小,找到其中面积最小的最大内接矩形rm,将掩模图像中所有桂圆干均裁剪为rm的大小,裁剪后所得图像转化为矩阵Reti;
记录Reti在掩膜图像中的位置以及大小,应用于该组样本所有波段的高光谱图像中,得到高光谱图像Ri,j,其中,i表示某品种桂圆干的样本数,j表示代表波段,1≤j≤224;
对高光谱图像Ri,j进行超分辨率处理将图像放大,得到桂圆干最大内接矩形的超分辨率图像,即桂圆干矩形图像。
作为优选的技术方案,所述构建桂圆干分类模型是将降维后数据集的80%作为训练数据集分别训练SVM分类模型和KNN分类模型,20%作为测试数据集测试训练后的分类模型,具体为:
使用SVM算法将训练数据集映射至同一高维空间,在高维空间中建立一个间隔超平面,两边建立互相平行的平行超平面,所述间隔超平面使两个平行超平面的距离最大化,使得训练数据集特征数据分类的总误差最小化,以此构建 SVM分类模型;
将训练数据集导入KNN学习模型中,计算不同桂圆干图像之间的欧氏距离,公式为:
其中,D(x,y)表示训练数据x和y之间的欧氏距离,∑为求和操作,xk表示样本x的第k维数据,yk表示样本y的第k维数据,n表示样本的维度;
将每个桂圆干数据与其他训练数据之间的距离结果按照距离递增次序进行排序,将KNN分类模型近邻k值设置一个数值,采用交叉验证法选取最佳近邻 k值,得到构建好的KNN分类模型。
作为优选的技术方案,所述使用交叉验证分别计算两种分类模型得到的桂圆干品种识别准确率,具体为:
将降维后数据集分为K组,将其中第i组作为测试集,0<i≤K,其余K-1 组作为训练集,将不同的训练集和测试集输入构建的某一分类模型中,得到K 个模型准确率,将K个模型准确率进行算数平均即为当前分类模型的准确率,选取准确率较高的分类模型作为最终桂圆干分类模型。
作为优选的技术方案,所述将处理后的待检测桂圆干高光谱图像导入桂圆干分类模型进行分类,具体为:
对待检测桂圆干高光谱图像进行所述预处理操作,将处理后的待检测桂圆干高光谱图像导入桂圆干分类模型中,得到二分类结果;
所述二分类结果是指某一品种桂圆干归为正类,将其余品种桂圆干归为负类。
本发明另一方面提供了一种基于高光谱图像和机器学习的桂圆干品种分类系统,应用于上述基于高光谱图像和机器学习的桂圆干品种分类方法,包括成像模块、预处理模块、标注模块、降维模块、训练模块和分类模块;
所述成像模块,用于对所有品种桂圆干对应的多个样本组进行高光谱成像并裁剪得到所有桂圆干高光谱图像集;
所述预处理模块,用于将所有桂圆干高光谱图像集进行图像预处理,得到所有桂圆干高光谱样本集;
所述标注模块,用于标明高光谱样本集中不同品种桂圆干图像所属的桂圆种类;
所述降维模块,用于对高光谱样本集运用PCA算法进行数据降维,得到降维后数据集;
所述训练模块,用于将降维后数据集分别导入SVM学习模型和KNN学习模型中进行监督学习,使用交叉验证分别计算两种分类模型得到的桂圆干品种识别准确率,构建桂圆干分类模型;
所述分类模块,用于将待检测桂圆干高光谱图像导入桂圆干分类模型,得到分类结果。
本发明还一方面提供一种计算机可读存储介质,存储有程序,所述程序被执行时,实现上述基于高光谱图像和机器学习的桂圆干品种分类方法。
本发明与现有技术相比,具有如下优点和有益效果:
(1)本发明应用机器学习对桂圆干图像块进行分类,模型准确率将随着样本数据的增加而提升,故桂圆干种类识别准确率高;
(2)本发明使用高光谱成像技术,可以获取肉眼无法甄别的桂圆干特征,为桂圆干分类提供更多依据,提高桂圆干种类的识别精度;
(3)本发明对桂圆干高光谱图像的感兴趣区域裁剪以及种类识别由程序自动完成,适用于在短时间内对大量桂圆干进行分类,减少了人力的耗费;
(4)本发明通过python使用opencv编程函数库对高光谱桂圆干图像进行处理,通过调节阈值参数获取二值图,提高了高光谱图像处理的准确性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例基于高光谱图像和机器学习的桂圆干品种分类方法的流程图;
图2为本发明实施例基于高光谱图像和机器学习的桂圆干品种分类方法的步骤示意图;
图3为本发明实施例基于高光谱图像和机器学习的桂圆干品种分类系统的结构示意图;
图4为本发明实施例计算机可读存储介质的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请中的实施例及附图,对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“S1”、“S2”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例
高光谱成像作为一种新型具有化学键选择性的成像技术,能够更好地捕捉桂圆干的特征;高光谱成像为图像提供了二维图像之上的第三个维度即光谱维度,不同波段下的二维图像组成三维细胞高光谱图像,其中的光谱信息能充分反映样品内部的物理结构、化学成分的差异,而这些特点也决定了高光谱图像技术在农产品品质检测方面的独特优势。
如图1所示,本实施例为基于高光谱图像和机器学习的桂圆干品种分类方法,包括下述步骤:
S1、将同一品种桂圆干的多个不同样本为一组进行高光谱成像,获取高光谱图像后,将高光谱图像中的桂圆干部分进行裁剪,得到该品种的高光谱图像集,对所有品种桂圆干都进行相同操作得到所有桂圆干高光谱图像集。
桂圆干的品种包括储良、广眼、鸡眼、石峡、土桂圆等;进行裁剪时,将高光谱图像中的m个桂圆干部分,分别裁剪为桂圆干图像,再取每个桂圆干图像的内接矩形,并按照其中最小的内接矩形统一所有内接矩形的尺寸,m=同一品种桂圆干的样本数。
本实施例中选取了储良、广眼、鸡眼、石峡、土桂圆等五个品种的桂圆干,但不局限与这五个品种,其他品种亦可;每个品种桂圆干的五个不同样本为一组,在224个波段下进行高光谱成像得到1120张桂圆干的高光谱图像;成像时,通过一维阵列探测器和样品扫描得到二维图像;
获取高光谱图像后,将高光谱图像中的桂圆干部分进行裁剪,将每张高光谱图像裁剪为五个桂圆干图像,再将每个桂圆干取内接矩形,并按照其中最小的内接矩形统一五个内接矩形的尺寸,按照这样的方法继续处理其它品种的高光谱图像,得到所有桂圆干高光谱图像集。
S2、将所有桂圆干高光谱图像集进行图像预处理,得到所有桂圆干高光谱样本集;高光谱样本集中包含了不同品种桂圆干的特征数据;图像预处理包括感兴趣区域截取、桂圆干图像块截取、图像像素灰度值提取以及数据的CSV格式存储;
本实施例将高光谱图像集进行图像预处理,得到五类桂圆的高光谱样本集 P1,具体步骤如下:
S201、对某一品种高光谱图像集中波数段为B1的原始图像Y1使用阈值分割法,此处Y1为人眼能分辨出的背景像素灰度值与桂圆干像素灰度值存在显著差异的图像;通过多次分割找到最合适的阈值,使图像中的背景区域置为白色,有效区域及桂圆干区域置为黑色,得到掩膜图像Y2;
S202、对掩膜图像Y2进行腐蚀、膨胀处理,进一步消除图像内的噪声,得到降噪图像Y3;
S203、利用降噪图像Y3进行边界提取,获取桂圆干矩形图像;边界提取时,找到降噪图像Y3中每个桂圆干的所有边界点,使所有边界点构成一个集合Ci,以图像左上角为原点,以右边为x轴正方向,以下边为y轴正方向构建直角坐标系,Ci则存储边界上的所有坐标,记为(xi,yi);
在本实施例中Y3内有五个桂圆干的图像,利用OpenCV编程函数库中的findContours()函数得到其五个边界点集合,记为C1,C2,C3,C4,C5;
S204、每个边界点集构成一个矩形,获取矩形左上角的坐标(xa,ya)与矩形的宽和高w、h,这四个值就构成该桂圆干图像的最小外接矩形Ri,识别Y3内所有桂圆干的最小外接矩形;
在本实施例中,分别在C1,C2,C3,C4,C5中利用OpenCV编程函数库中的boundingRect()函数识别5个外接矩形,记为R1,R2,R3,R4,R5;
S205、比较Y3内所有桂圆干的Ri的面积大小,找到面积最大的最小外接矩形Rm,记Rm的中心点坐标为(xc,yc),将高光谱图像集和掩膜图像Y2中所有桂圆干按照Rm大小和位置进行裁剪,获得每个桂圆干单独的原始高光谱图像和掩膜图像;
S206、通过中心扩展算法,以(xc,yc)作为算法的中心点依次向上下左右四个边界进行中心扩散。以上边界为例,从中心点(xc,yc)开始在上一步获得的裁剪后的掩模图像中向上边界扩展,以1为间隔向上边界移动,当移动i次后所在坐标为(xc,yc-i),若(xc,yc-i)对应的像素点灰度值为255,即当前点已经到达有效图像之外,则以上一个点(xc,yc-i+1)为该掩模图像上边界的边界点,记为POINT1,便停止上边界的边界扩展,以此类推,找到四个边界点,POINT1~POINT4,便能求得该掩模图像中桂圆干的最大内接矩形ri;
在本实施例中从裁剪后的掩模图像求到五个最大内接矩形,记为r1,r2,r3,r4,r5。
S207、比较掩模图像中所有桂圆干的ri的面积大小,找到最小桂圆干的最大内接矩形rm,将掩模图像中所有桂圆干图像均裁剪为rm的大小,裁剪所得图像转化为矩阵RETi;
本实施例中将r1~r5进行裁剪后所得图像转化为矩阵Ret1~Ret5;
S208、记录Reti在掩膜图像中的位置以及大小,再应用于该组样本所有波段的高光谱图像中,得到高光谱图像Ri,j,其中,i表示某品种桂圆干的样本数, j表示代表波段,由于每个品种以五个样本为一组成像,故每个品种都有224个不同的波段,故1≤j≤224;
本实施例中,记录Ret1~Ret5在原高光谱中的位置以及大小,得到高光谱图像为R1,1,R1,2,…,R1,224,R2,1,…,R2,224,…,R5,1,…,R5,224;
S209、由于所获得的图像尺寸较小,可对高光谱图像进行超分辨率处理将图像放大,得到桂圆干最大内接矩形的超分辨率图像,即桂圆干矩形图像;
本实施例中使用EDSR算法对图像进行超分辨率处理,将图像放大为原来的3倍。
S210、对每张桂圆干矩形图像中的每一个像素的灰度值进行提取并拼接为向量V1,作为该品种桂圆干图像的特征信息,并将其作为CSV表格中的一行存储,在表格的最后一列进行种类标记,直到完成所有桂圆干矩形图像的处理以及CSV格式存储,得到桂圆干高光谱样本集;
在本实施例中,R1,1,…,R1,224矩形图像中的每一个像素的灰度值提取后拼接为向量V1,作为桂圆干1的特征信息,并将其作为CSV表格中的一行存储,用同样的方法处理其他图像,再在表格的最后一列进行种类标记,至此完成所有桂圆干图像的处理以及CSV格式存储。
S3、在得到所有桂圆干的特征数据后,标明高光谱样本集中不同品种桂圆干图像所属的桂圆种类。
S4、为降低模型训练难度,对高光谱样本集进行数据降维,得到降维后的数据集;
在本实施例中采用PCA(Principal Components Analysis,主成分分析技术) 算法将数据降至20维。
S5、将降维后的数据集分别导入预先设立的SVM(Support Vector Machine,支持向量机)学习模型和KNN(K-NearestNeighbor,邻近算法)学习模型中进行监督学习,使用交叉验证分别计算两种分类模型得到的桂圆干品种识别准确率,构建桂圆干分类模型,具体为:
将降维后数据集的80%作为训练数据集分别训练SVM分类器和KNN分类器,20%作为测试数据集测试训练后的分类模型;
S501、使用SVM算法将训练数据集映射至同一高维空间,其目的是在高维空间中建立一个间隔超平面,两边建立互相平行的平行超平面,间隔超平面使两个平行超平面的距离最大化,将不同类别的样本分开,使得训练数据集特征数据分类的总误差最小化,以此构建SVM分类模型。
S502、将数据集导入KNN学习模型中,计算不同桂圆干之间的差异,用欧氏距离表示,公式如下:
其中,D(x,y)表示训练数据x和y之间的欧氏距离,∑为求和操作,xk表示样本x的第k维数据,yk表示样本y的第k维数据,n表示样本的维度;
将每个桂圆干数据与其他训练数据之间的距离结果按照距离递增次序进行排序,将KNN分类模型近邻k值先设置一个较小的数,采用交叉验证法选取最佳近邻k值,得到构建好的KNN分类模型;
S503、将降维后数据集分为K组,将其中第i组作为测试集,0<i≤K,其余K-1组作为训练集,将不同的训练集和测试集输入构建的某一分类模型中,得到K个模型准确率,将K个模型准确率进行算数平均即为当前分类模型的准确率,选取准确率较高的分类模型作为最终桂圆干分类模型。
S6、对待检测桂圆干高光谱图像进行预处理操作,将处理后的待检测桂圆干高光谱图像导入桂圆干分类模型中,得到二分类结果;
在机器学习中,应用了将多分类转化为二分类的方法,即将某一类桂圆干归为正类(Positive class),将其它四类桂圆干归为负类(Negative class),在此基础上再进行分类,并应用同样的方法设置不同的正类及其对应的负类,提高桂圆干分类的准确率,降低模型的训练难度。
如图2所示,本实施例设置五组二分类模型训练,每一组内含有一个品种桂圆作为正类,标记为1,其余品种作为负类,标记为0,如:第一组将样本分为石峡品种的桂圆干和非石峡品种的桂圆干,其中石峡品种的桂圆干标签为1,非石峡品种的桂圆干标签为0。
先使用五种桂圆干的原始高光谱图像,进行预处理、ROI区域裁剪、超分辨率图像处理步骤后,将所有桂圆干的灰度值数据存储至CSV文件,其中每一行代表单个桂圆干图像的灰度值数据,每一行的末尾标记该桂圆干的品种;将数据分为五组,每一组均包含所有数据,每组内选取一种桂圆作为正类,标记为1,其余桂圆作为负类,标记为0,每一组的正类均不相同;数据处理完毕后,进行分类模型训练,模型算法使用KNN以及SVM,并使用交叉验证来计算两个模型最终的准确率,取准确率高的模型作为最终模型,该最终模型可用于预测一个未知桂圆干的品种。
在本实施例中使用交叉验证计算本实施例中五种桂圆品种的二分类准确率,比较使用SVM和KNN模型所得的结果取准确率较高的结果,分别为广眼71.8% (SVM),储良80.1%(SVM),石峡80.0%(KNN),鸡眼92.6%(KNN),土龙眼80.1%(SVM)。
如图3所示,在另一个实施例中,提供了一种基于高光谱图像和机器学习的桂圆干品种分类系统,该系统包括成像模块、预处理模块、标注模块、降维模块、训练模块和分类模块;
成像模块用于对所有品种桂圆干对应的多个样本组进行高光谱成像并裁剪得到所有桂圆干高光谱图像集;
预处理模块用于将所有桂圆干高光谱图像集进行预处理,得到所有桂圆干高光谱样本集;
标注模块用于标明高光谱样本集中不同品种桂圆干图像所属的桂圆种类;
降维模块用于将高光谱样本集运用PCA算法进行数据降维,得到降维后的数据集;
训练模块用于将降维后的数据集分别导入SVM学习模型和KNN学习模型进行监督学习,使用交叉验证分别计算两种分类模型得到的桂圆干品种识别准确率,构建桂圆干分类模型;
分类模块用于将待检测桂圆干高光谱图像导入桂圆干分类模型,得到分类结果。
在此需要说明的是,上述实施例提供的系统仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能,该系统是应用于上述实施例的基于高光谱图像和机器学习的桂圆干品种分类方法。
如图4所示,在本申请的另一个实施例中,还提供了一种计算机可读存储介质,存储有程序,所述程序被处理器执行时,实现基于高光谱图像和机器学习的桂圆干品种分类方法,具体为:
对所有品种桂圆干对应的多个样本组进行高光谱成像并裁剪得到所有桂圆干高光谱图像集;
将高所有光谱图像集进行预处理,得到所有桂圆干高光谱样本集;
标明高光谱样本集中不同品种桂圆干图像所属的桂圆种类;
将高光谱样本集运用PCA算法进行数据降维,得到降维后的数据集;
将降维后的数据集分别导入SVM学习模型和KNN学习模型进行监督学习,使用交叉验证分别计算两种分类模型得到的桂圆干品种识别准确率,构建桂圆干分类模型;
将待检测桂圆干高光谱图像导入桂圆干分类模型,得到分类结果。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA) 等。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,包括下述步骤:
将同一品种桂圆干的多个不同样本为一组进行高光谱成像,获取高光谱图像后,将高光谱图像中的桂圆干部分进行裁剪,得到该品种的高光谱图像集,对所有品种桂圆干都进行相同操作得到所有桂圆干高光谱图像集;
将所有桂圆干高光谱图像集进行图像预处理,得到所有桂圆干高光谱样本集,所述高光谱样本集包含不同品种桂圆干的特征数据,所述图像预处理包括感兴趣区域截取、桂圆干图像块截取、图像像素灰度值提取以及数据的CSV格式存储;
标明高光谱样本集中不同品种桂圆干图像所属的桂圆种类;
对高光谱样本集运用PCA算法进行数据降维,得到降维后数据集;
将降维后数据集分别导入预先设立的SVM学习模型和KNN学习模型中进行监督学习,使用交叉验证分别计算两种模型得到的桂圆干品种识别准确率,构建桂圆干分类模型;
将处理后的待检测桂圆干高光谱图像导入桂圆干分类模型进行分类,得到分类结果。
2.根据权利要求1所述基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,所述不同品种桂圆干包括储良、广眼、鸡眼、石峡、土桂圆。
3.根据权利要求1所述基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,所述将高光谱图像中的桂圆干部分进行裁剪具体为:
将高光谱图像中的m个桂圆干部分,分别裁剪为桂圆干图像,再取每个桂圆干图像的内接矩形,并按照其中最小的内接矩形统一所有内接矩形的尺寸,m=同一品种桂圆干的样本数。
4.根据权利要求1所述基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,所述图像预处理具体为:
对某一品种高光谱图像集中波数段为B1的原始图像使用阈值分割法,通过多次分割找到合适的阈值,使图像中的背景区域置为白色,有效区域及桂圆干区域置为黑色,得到掩膜图像,所述原始图像为人眼能分辨出的背景像素灰度值与桂圆干像素灰度值存在显著差异的图像;
对掩膜图像进行腐蚀、膨胀处理,进一步消除图像内的噪声,得到降噪图像;
对降噪图像进行边界提取,获取桂圆干矩形图像;
对每张桂圆干矩形图像中的每一个像素的灰度值进行提取并拼接为向量V1,作为该品种桂圆干图像的特征信息,并将其作为CSV表格中的一行存储,在表格的最后一列进行种类标记,直到完成所有桂圆干矩形图像的处理以及CSV格式存储,得到桂圆干高光谱样本集。
5.根据权利要求4所述基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,所述边界提取具体为:
找到降噪图像中每个桂圆干的所有边界点,使所有边界点构成一个集合Ci,以图像左上角为原点,以右边为x轴正方向,以下边为y轴正方向构建直角坐标系,Ci则存储边界上的所有坐标,记为(xi,yi);
每个边界点集构成一个矩形,获取矩形左上角的坐标(xa,ya)与矩形的宽和高,构成每个桂圆干图像的最小外接矩形Ri,识别降噪图像中所有桂圆干的最小外接矩形;
比较降噪图像中所有桂圆干的最小外接矩形Ri的面积大小,找到其中面积最大的最小外接矩形Rm,记Rm的中心点坐标为(xc,yc),将高光谱图像集和掩膜图像中所有桂圆干按照Rm大小和位置进行裁剪,获得每个桂圆干单独的原始高光谱图像和掩膜图像;
通过中心扩展算法,以坐标(xc,yc)作为算法的中心点依次向上下左右四个边界进行中心扩散,从中心点(xc,yc)开始,在获得的裁剪后的掩膜图像中向对应边界扩展,以1为间隔向对应边界移动,当移动i次后所在坐标对应的像素点灰度值为255,即当前点已经到达有效图像之外,则以上一坐标点为该掩模图像对应边界的边界点,记为POINTi,1≤i≤4,停止对应边界的边界扩展,进行下一对应边界的边界扩展,直到找到四个边界点,求得该掩模图像中桂圆干的最大内接矩形ri;
比较掩模图像中所有桂圆干的ri面积大小,找到其中面积最小的最大内接矩形rm,将掩模图像中所有桂圆干均裁剪为rm的大小,裁剪后所得图像转化为矩阵Reti;
记录Reti在掩膜图像中的位置以及大小,应用于该组样本所有波段的高光谱图像中,得到高光谱图像Ri,j,其中,i表示某品种桂圆干的样本数,j表示代表波段,1≤j≤224;
对高光谱图像Ri,j进行超分辨率处理将图像放大,得到桂圆干最大内接矩形的超分辨率图像,即桂圆干矩形图像。
6.根据权利要求1所述基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,所述构建桂圆干分类模型是将降维后数据集的80%作为训练数据集分别训练SVM分类模型和KNN分类模型,20%作为测试数据集测试训练后的分类模型,具体为:
使用SVM算法将训练数据集映射至同一高维空间,在高维空间中建立一个间隔超平面,两边建立互相平行的平行超平面,所述间隔超平面使两个平行超平面的距离最大化,使得训练数据集特征数据分类的总误差最小化,以此构建SVM分类模型;
将训练数据集导入KNN学习模型中,计算不同桂圆干图像之间的欧氏距离,公式为:
其中,D(x,y)表示训练数据x和y之间的欧氏距离,∑为求和操作,xk表示样本x的第k维数据,yk表示样本y的第k维数据,n表示样本的维度;
将每个桂圆干数据与其他训练数据之间的距离结果按照距离递增次序进行排序,将KNN分类模型近邻k值设置一个数值,采用交叉验证法选取最佳近邻k值,得到构建好的KNN分类模型。
7.根据权利要求6所述基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,所述使用交叉验证分别计算两种分类模型得到的桂圆干品种识别准确率,具体为:
将降维后数据集分为K组,将其中第i组作为测试集,0<i≤K,其余K-1组作为训练集,将不同的训练集和测试集输入构建的某一分类模型中,得到K个模型准确率,将K个模型准确率进行算数平均即为当前分类模型的准确率,选取准确率较高的分类模型作为最终桂圆干分类模型。
8.根据权利要求1所述基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,所述将处理后的待检测桂圆干高光谱图像导入桂圆干分类模型进行分类,具体为:
对待检测桂圆干高光谱图像进行所述预处理操作,将处理后的待检测桂圆干高光谱图像导入桂圆干分类模型中,得到二分类结果;
所述二分类结果是指某一品种桂圆干归为正类,将其余品种桂圆干归为负类。
9.基于高光谱图像和机器学习的桂圆干品种分类系统,应用于权利要求1-8任一项所述基于高光谱图像和机器学习的桂圆干品种分类方法,其特征在于,包括成像模块、预处理模块、标注模块、降维模块、训练模块和分类模块;
所述成像模块,用于对所有品种桂圆干对应的多个样本组进行高光谱成像并裁剪得到所有桂圆干高光谱图像集;
所述预处理模块,用于将所有桂圆干高光谱图像集进行图像预处理,得到所有桂圆干高光谱样本集;
所述标注模块,用于标明高光谱样本集中不同品种桂圆干图像所属的桂圆种类;
所述降维模块,用于对高光谱样本集运用PCA算法进行数据降维,得到降维后数据集;
所述训练模块,用于将降维后数据集分别导入SVM学习模型和KNN学习模型中进行监督学习,使用交叉验证分别计算两种分类模型得到的桂圆干品种识别准确率,构建桂圆干分类模型;
所述分类模块,用于将待检测桂圆干高光谱图像导入桂圆干分类模型,得到分类结果。
10.一种计算机可读存储介质,存储有程序,其特征在于,所述程序被执行时,实现权利要求1-8任一项所述基于高光谱图像和机器学习的桂圆干品种分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210024740.3A CN114639009B (zh) | 2022-01-11 | 2022-01-11 | 基于高光谱图像和机器学习的桂圆干品种分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210024740.3A CN114639009B (zh) | 2022-01-11 | 2022-01-11 | 基于高光谱图像和机器学习的桂圆干品种分类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114639009A true CN114639009A (zh) | 2022-06-17 |
CN114639009B CN114639009B (zh) | 2024-04-16 |
Family
ID=81946784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210024740.3A Active CN114639009B (zh) | 2022-01-11 | 2022-01-11 | 基于高光谱图像和机器学习的桂圆干品种分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114639009B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170076438A1 (en) * | 2015-08-31 | 2017-03-16 | Cape Analytics, Inc. | Systems and methods for analyzing remote sensing imagery |
CN108985360A (zh) * | 2018-06-29 | 2018-12-11 | 西安电子科技大学 | 基于扩展形态学与主动学习的高光谱分类方法 |
CN112733775A (zh) * | 2021-01-18 | 2021-04-30 | 苏州大学 | 基于深度学习的高光谱影像分类方法 |
CN113392916A (zh) * | 2021-06-23 | 2021-09-14 | 华南农业大学 | 基于高光谱图像的麻竹笋营养成分检测方法、系统和存储介质 |
-
2022
- 2022-01-11 CN CN202210024740.3A patent/CN114639009B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170076438A1 (en) * | 2015-08-31 | 2017-03-16 | Cape Analytics, Inc. | Systems and methods for analyzing remote sensing imagery |
CN108985360A (zh) * | 2018-06-29 | 2018-12-11 | 西安电子科技大学 | 基于扩展形态学与主动学习的高光谱分类方法 |
CN112733775A (zh) * | 2021-01-18 | 2021-04-30 | 苏州大学 | 基于深度学习的高光谱影像分类方法 |
CN113392916A (zh) * | 2021-06-23 | 2021-09-14 | 华南农业大学 | 基于高光谱图像的麻竹笋营养成分检测方法、系统和存储介质 |
Non-Patent Citations (1)
Title |
---|
高升;王巧华;: "基于高光谱图像信息融合的红提糖度无损检测", 发光学报, no. 12, 15 December 2019 (2019-12-15), pages 129 - 139 * |
Also Published As
Publication number | Publication date |
---|---|
CN114639009B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109002851B (zh) | 一种基于图像多特征融合的水果分类方法及应用 | |
Rajan et al. | Detection and classification of pests from crop images using support vector machine | |
Pérez et al. | Image classification for detection of winter grapevine buds in natural conditions using scale-invariant features transform, bag of features and support vector machines | |
Bosilj et al. | Connected attribute morphology for unified vegetation segmentation and classification in precision agriculture | |
CN105389581B (zh) | 一种胚芽米胚芽完整度智能识别系统及其识别方法 | |
CN113269257A (zh) | 一种图像分类方法、装置、终端设备及存储介质 | |
AlShahrani et al. | Automated system for crops recognition and classification | |
CN110929787B (zh) | 一种基于图像的苹果客观定级系统 | |
Xu et al. | Improved residual network for automatic classification grading of lettuce freshness | |
Elhariri et al. | Random forests based classification for crops ripeness stages | |
CN114639009B (zh) | 基于高光谱图像和机器学习的桂圆干品种分类方法及装置 | |
Yadav et al. | An automated image processing method for segmentation and quantification of rust disease in maize leaves | |
Bandara et al. | Detection and classification of rice plant diseases using image processing techniques | |
Poojari et al. | Identification and solutions for grape leaf disease using convolutional neural network (CNN) | |
Nagpal et al. | An application of deep learning for sweet cherry phenotyping using yolo object detection | |
Shweta et al. | External feature based quality evaluation of Tomato using K-means clustering and support vector classification | |
CN116416523A (zh) | 一种基于机器学习的水稻生长阶段的识别系统和方法 | |
Bharadwaj | Classification and grading of arecanut using texture based block-wise local binary patterns | |
Iwata et al. | Tree recognition based on leaf images | |
Sreekanth et al. | Fruit detection using improved K-means algorithm | |
Fitter | Strawberry detection under various harvestation stages | |
CN110929788A (zh) | 食材识别方法、装置、存储介质及电子设备 | |
Kaur et al. | Analysis of multiple classifiers for herbal plant recognition | |
Yaswanth et al. | Medicinal Leaves Classification Using Random Forest and AdaBoost | |
CN111209922B (zh) | 基于svm和opencv的图像色系风格标记方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |