CN106778897B - 基于余弦距离和中心轮廓距离的两次植物物种识别方法 - Google Patents
基于余弦距离和中心轮廓距离的两次植物物种识别方法 Download PDFInfo
- Publication number
- CN106778897B CN106778897B CN201611249653.9A CN201611249653A CN106778897B CN 106778897 B CN106778897 B CN 106778897B CN 201611249653 A CN201611249653 A CN 201611249653A CN 106778897 B CN106778897 B CN 106778897B
- Authority
- CN
- China
- Prior art keywords
- image
- gray level
- distance
- identified
- level image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Abstract
基于余弦距离和中心轮廓距离的两次植物物种识别方法,包含粗略识别和精确识别两个过程,在粗略识别过程中,计算待识别叶片图像与训练集中每一类叶片图像的平均余弦距离,再选择训练集中部分平均余弦距离较大的类别作为待识别叶片图像的候选类;在精确识别过程中,提取候选类中叶片图像与待识别叶片图像的中心轮廓距离向量,然后计算候选类中每类叶片图像的中心轮廓距离与待识别叶片图像的中心轮廓距离向量之间的平均相似度,由此对待识别叶片图像进行精确识别,本发明提高了植物物种识别方法的速度和精度。
Description
技术领域
本发明属于计算机图像处理和模式识别技术领域,具体涉及基于余弦距离和中心轮廓距离的两次植物物种识别方法。
背景技术
植物及其物种多样化是人和所有动物赖以生存的物质基础,由于多年来的乱砍乱伐和近年来大规模的城市扩张以及超常态的经济发展,导致很多植物物种频临灭绝或已经灭绝,从而严重影响了生态平衡。现在各国政府和很多民众已经认识到了保护植物物种的重要性,随着计算机技术和图像处理技术的不断发展,植物物种识别成为一个较为热门的研究方向,出现了很多利用植物叶片图像进行植物物种自动识别的方法和系统,杜吉祥等人提出叶片形状和神经网络的植物识别方法【Du,J.X.,Huang,D.S.,Wang,X.F.,etal.Shape Recognition Based on Neural Networks Trained by DifferentialEvolution Algorithm.Neurocomputing,2007,70:896-903;Du,J.X.,Zhai,C.M.,Wang,Q.P.Recognition of plant leaf image based on fractal dimensionfeature.Neurocomputing,2013,116:150-156;】,Chaki等人提出了基于叶片纹理和形状的植物识别方法【Jyotismita Chaki,Ranjan Parekh,Samar Bhattacharya.Plant LeafRecognition using Texture and Shape Features with Neural Classifiers.PatternRecognition Letters,2015,58(C):61-68】。传统的基于叶片图像的植物物种识别方法和系统主要研究如何精确提取植物叶片图像的分类特征。但由于植物叶片图像的复杂多样性,使得很多方法和系统的识别效果不能满足在大规模数据库上的植物物种识别的实际需要。
发明内容
为了克服上述现有植物物种识别方法技术的缺点,本发明的目的在于提供基于余弦距离和中心轮廓距离的两次植物物种识别方法,提高了植物物种识别方法的速度和精度。
为了达到上述目的,本发明采取的技术方案为:
基于余弦距离和中心轮廓距离的两次植物物种识别方法,包括如下步骤:
步骤一、将所有有类别标签的C种植物叶片图像组成训练图像集,然后将所有训练集中的样本和一幅待识别的叶片图像转换成灰度图像,再将所有灰度图像缩放为大小都为64×64像素的图像,处理后的训练集中的C个灰度图像子集的集合记为{G1,G2,...,GC},处理后的待识别叶片图像的灰度图像记为g;
步骤二、计算{G1,G2,...,GC}中的每幅图像与g的余弦距离,
其中:gij为第i类子集Gi中的第j幅灰度图像,T表示矩阵转置;
然后计算{G1,G2,...,GC}中的每个图像子集与g的平均余弦距离,
其中:ni为Gi中的图像数目,i=1,2,...,C;
步骤三、将步骤二得到的C个平均余弦距离由大到小进行排序,选择前个平均余弦距离对应的个不同种类灰度图像子集作为待识别图像g的候选集,其中表示取不大于的整数运算;
步骤四、对于候选集中任意一幅灰度图像和待识别的灰度图像g,利用Canny边缘检测方法提取灰度图像的边缘轮廓点的坐标,选择该图像的所有轮廓点中纵坐标最大的点作为起始点,按照逆时针顺序将该图像的所有轮廓点进行排序,记为{(x1,y1),(x2,y2),...,(xp,yp)},p为轮廓点的数目,然后计算轮廓点的中心点的坐标,记为(x0,y0),其中x0和y0分别为再计算中心距离向量[d1,d2,d3,...,dp],其中di(i=1,2...,p)表示第i个轮廓点(xi,yi)到中心点(x0,y0)的欧氏距离,计算向量[d1,d2,...,dp]的长度为128的快速傅里叶变换,
其中:τ为单位复数
计算式(3)对应的幅度谱向量,记为[F0,F1,F2,...,F127],将其归一化为然后去掉该向量的第一项后得到作为该图像的中心轮廓特征向量;
步骤五、利用步骤四得到待识别灰度图像g和它的候选集中的每幅叶片图像的中心轮廓特征向量,计算待识别灰度图像g的中心轮廓特征向量和它的候选集中的每幅叶片图像的中心轮廓特征向量之间的相似度,
其中:F为g的中心轮廓特征向量,Fst为候选集中第s类子图像集中的第t幅灰度图像的中心轮廓特征向量;
从候选集集中选择前三个最大的相似度对应的图像,判别选择的三幅图像是否属于同一类,若是属于同一类,则待识别图像的类别属于这一类别,识别过程结束,否则选择前5个最大的相似度对应的不同类图像子集,计算每个子集中所有图像与g的中心轮廓特征向量之间的相似度的平均值,再选择最大的平均相似度对应的图像类别,则待识别图像的类别属于这一类别。
本发明的有益效果为:本发明首先通过余弦距离法排除大规模训练样本集中与待识别叶片图像差异较大的图像类别,从而大幅度地减小了算法的时间复杂度;然后利用中心轮廓距离法得到图像的分类特征,该特征对图像的颜色、变换、大小尺寸和旋转具有鲁棒性,由此计算待识别图像与候选集中的每幅图像之间的相似度,再进行图像类别识别。该方法能够快速识别叶片图像类别,而且减少实际图像识别中图像之间的颜色差异、大小不同、不对齐和图像变换对识别效果带来的影响;利用该方法能够快速、很好地在大规模植物物种数据库中识别未知植物物种。本发明在普通PC计算机上实现,对操作系统没有要求。
附图说明
图1-1和图1-2是两幅原始叶片图像。
图2-1和图2-2是两幅叶片图像的轮廓图像。
图3-1和图3-2是两幅轮廓图像的中心轮廓距离特征向量。
图4-1和图4-2是两个中心轮廓距离特征向量的频域特征向量。
具体实施方式
下面结合附图和实施例对本发明进行详细说明。
基于余弦距离和中心轮廓距离的两次植物物种识别方法,包括如下步骤:
步骤一、将所有有类别标签的C种植物叶片图像组成训练图像集,然后将所有训练集中的样本和一幅待识别的叶片图像转换成灰度图像,再将所有灰度图像缩放为大小都为64×64像素的图像,处理后的训练集中的C个灰度图像子集的集合记为{G1,G2,...,GC},处理后的待识别叶片图像的灰度图像记为g;
步骤二、计算{G1,G2,...,GC}中的每幅图像与g的余弦距离,
其中:gij为第i类子集Gi中的第j幅灰度图像,T表示矩阵转置;
然后计算{G1,G2,...,GC}中的每个图像子集与g的平均余弦距离,
其中:ni为Gi中的图像数目,i=1,2,...,C;
步骤三、将步骤二得到的C个平均余弦距离由大到小进行排序,选择前个平均余弦距离对应的个不同种类灰度图像子集作为待识别图像g的候选集,其中表示取不大于的整数运算;
参照图1-1和图1-2,从图1-1和图1-2可以看出,不同植物物种的叶片图像之间有差异,若差异很大,就可以利用不同类植物叶片图像之间的余弦距离将他们区分开;
步骤四、对于任意候选集中的一幅灰度图像和待识别灰度图像g,利用Canny边缘检测方法提取灰度图像的边缘轮廓点的坐标,如图2-1和如2-2所示,由于得到的边缘轮廓点是二维数据,在叶片图像识别中不容易处理,所以计算对应的轮廓中心距离向量;
选择该图像的所有轮廓点中纵坐标最大的点作为起始点,按照逆时针顺序将该图像的所有轮廓点进行排序,记为{(x1,y1),(x2,y2),...,(xp,yp)},p为轮廓点的数目,然后计算轮廓点的中心点的坐标,记为(x0,y0),其中x0和y0分别为再计算中心距离向量[d1,d2,d3,...,dp],其中di(i=1,2...,p)表示第i个轮廓点(xi,yi)到中心点(x0,y0)的欧氏距离,如图3-1和图3-2所示,由于中心轮廓距离向量与轮廓的起始点选择有关,所以计算对应的傅里叶变换;
计算向量[d1,d2,...,dp]的长度为128的快速傅里叶变换,
其中:τ为单位复数
计算式(3)对应的幅度谱向量,记为[F0,F1,F2,...,F127],将其归一化为然后去掉该向量的第一项后得到作为该图像的中心轮廓特征向量,该向量不随叶片图像的旋转、平移和尺度变化而变化,在植物物种识别中具有鲁棒性。图4-1和图4-2分别是图3-1和图3-2对应的幅度谱向量,该向量具有鲁棒性,不随图像的旋转、平移和尺度大小变化而变化;
步骤五、利用步骤四得到待识别灰度图像g和它的候选集中的每幅叶片图像的中心轮廓特征向量,然后计算待识别灰度图像g的中心轮廓特征向量和它的候选集中的每幅叶片图像的中心轮廓特征向量之间的相似度,
其中:F为g的中心轮廓特征向量,Fst为候选集中第s类子图像集中的第t幅灰度图像的中心轮廓特征向量;
选择前三个最大的相似度对应的图像,判别选择的三幅图像是否属于同一类,若是属于同一类,则待识别图像的类别属于这一类别,识别过程结束,否则选择前5个最大的相似度对应的不同类图像子集,计算每个子集中所有图像与g的中心轮廓特征向量之间的相似度的平均值,再选择最大的平均相似度对应的图像类别,则待识别图像的类别属于这一类别。
Claims (1)
1.基于余弦距离和中心轮廓距离的两次植物物种识别方法,其特征在于,包括如下步骤:
步骤一、将所有有类别标签的C种植物叶片图像组成训练图像集,然后将所有训练集中的样本和一幅待识别的叶片图像转换成灰度图像,再将所有灰度图像缩放为大小都为64×64像素的图像,处理后的训练集中的C个灰度图像子集的集合记为{G1,G2,...,GC},处理后的待识别叶片图像的灰度图像记为g;
步骤二、计算{G1,G2,...,GC}中的每幅图像与g的余弦距离,
其中:gij为第i类子集Gi中的第j幅灰度图像,T表示矩阵转置;
然后计算{G1,G2,...,GC}中的每个图像子集与g的平均余弦距离,
其中:ni为Gi中的图像数目,i=1,2,...,C;
步骤三、将步骤二得到的C个平均余弦距离由大到小进行排序,选择前个平均余弦距离对应的个不同种类灰度图像子集作为待识别图像g的候选集,其中表示取不大于的整数运算;
步骤四、对于候选集中任意一幅灰度图像和待识别的灰度图像g,利用Canny边缘检测方法提取灰度图像的边缘轮廓点的坐标,选择该图像的所有轮廓点中纵坐标最大的点作为起始点,按照逆时针顺序将该图像的所有轮廓点进行排序,记为{(x1,y1),(x2,y2),...,(xp,yp)},p为轮廓点的数目,然后计算轮廓点的中心点的坐标,记为(x0,y0),其中x0和y0分别为再计算中心距离向量[d1,d2,d3,...,dp],其中di(i=1,2...,p)表示第i个轮廓点(xi,yi)到中心点(x0,y0)的欧氏距离,计算向量[d1,d2,...,dp]的长度为128的快速傅里叶变换,
其中:τ为单位复数
计算式(3)对应的幅度谱向量,记为[F0,F1,F2,...,F127],将其归一化为然后去掉该向量的第一项后得到作为该图像的中心轮廓特征向量;
步骤五、利用步骤四得到待识别灰度图像g和它的候选集中的每幅叶片图像的中心轮廓特征向量,计算待识别灰度图像g的中心轮廓特征向量和它的候选集中的每幅叶片图像的中心轮廓特征向量之间的相似度,
其中,F为g的中心轮廓特征向量,Fst为候选集中第s类子图像集中的第t幅灰度图像的中心轮廓特征向量;
从候选集集中选择前三个最大的相似度对应的图像,判别选择的三幅图像是否属于同一类,若是属于同一类,则待识别图像的类别属于这一类别,识别过程结束,否则选择前5个最大的相似度对应的不同类图像子集,计算每个子集中所有图像与g的中心轮廓特征向量之间的相似度的平均值,再选择最大的平均相似度对应的图像类别,则待识别图像的类别属于这一类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611249653.9A CN106778897B (zh) | 2016-12-29 | 2016-12-29 | 基于余弦距离和中心轮廓距离的两次植物物种识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611249653.9A CN106778897B (zh) | 2016-12-29 | 2016-12-29 | 基于余弦距离和中心轮廓距离的两次植物物种识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106778897A CN106778897A (zh) | 2017-05-31 |
CN106778897B true CN106778897B (zh) | 2019-10-11 |
Family
ID=58929360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611249653.9A Active CN106778897B (zh) | 2016-12-29 | 2016-12-29 | 基于余弦距离和中心轮廓距离的两次植物物种识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106778897B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108259830B (zh) * | 2018-01-25 | 2019-08-23 | 深圳冠思大数据服务有限公司 | 基于云服务器的鼠患智能监控系统和方法 |
CN109558883B (zh) * | 2018-12-03 | 2023-04-18 | 宁夏智启连山科技有限公司 | 叶片特征提取方法及装置 |
CN113255694B (zh) * | 2021-05-21 | 2022-11-11 | 北京百度网讯科技有限公司 | 训练图像特征提取模型和提取图像特征的方法、装置 |
CN114463649B (zh) * | 2021-12-30 | 2023-02-14 | 广州极飞科技股份有限公司 | 土壤虫害确定方法及装置、农药配方生成方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770566A (zh) * | 2008-12-30 | 2010-07-07 | 复旦大学 | 快速三维人耳识别方法 |
CN101794372A (zh) * | 2009-11-30 | 2010-08-04 | 南京大学 | 基于频域分析的步态特征表示及识别方法 |
KR20110068688A (ko) * | 2009-12-16 | 2011-06-22 | 한국옐로우페이지주식회사 | 3차원 형상물 제작을 위한 입체형상 측정 시스템 |
KR101397845B1 (ko) * | 2012-10-26 | 2014-05-20 | 포항공과대학교 산학협력단 | 얼굴 인식 방법 및 기계로 읽을 수 있는 저장 매체 및 얼굴 인식 장치 |
-
2016
- 2016-12-29 CN CN201611249653.9A patent/CN106778897B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101770566A (zh) * | 2008-12-30 | 2010-07-07 | 复旦大学 | 快速三维人耳识别方法 |
CN101794372A (zh) * | 2009-11-30 | 2010-08-04 | 南京大学 | 基于频域分析的步态特征表示及识别方法 |
KR20110068688A (ko) * | 2009-12-16 | 2011-06-22 | 한국옐로우페이지주식회사 | 3차원 형상물 제작을 위한 입체형상 측정 시스템 |
KR101397845B1 (ko) * | 2012-10-26 | 2014-05-20 | 포항공과대학교 산학협력단 | 얼굴 인식 방법 및 기계로 읽을 수 있는 저장 매체 및 얼굴 인식 장치 |
Non-Patent Citations (4)
Title |
---|
Discriminant analysis and similarity measure;Chengjun Liu;《Pattern Recognition》;20140131;第47卷(第1期);全文 * |
Study and evaluation of different Fourier methods for image retrieval;Dengsheng Zhang et al.;《Image and Vision Computing》;20050131;第23卷(第1期);全文 * |
基于中心-轮廓距离特征统计的形状表示方法;郭树旭等;《电子与信息学报》;20150630;第37卷(第6期);全文 * |
基于余弦相似度的人脸识别系统的实现;刘一玮等;《图像与多媒体技术》;20150430(第09期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN106778897A (zh) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | Plant species recognition using morphological features and adaptive boosting methodology | |
CN105488536B (zh) | 一种基于多特征深度学习技术的农田害虫图像识别方法 | |
Zhao et al. | ApLeaf: An efficient android-based plant leaf identification system | |
CN110837768B (zh) | 一种面向珍稀动物保护的在线检测与识别方法 | |
CN106778897B (zh) | 基于余弦距离和中心轮廓距离的两次植物物种识别方法 | |
Venugoban et al. | Image classification of paddy field insect pests using gradient-based features | |
Nurhaida et al. | Performance comparison analysis features extraction methods for batik recognition | |
Alsmadi et al. | Fish classification based on robust features extraction from color signature using back-propagation classifier | |
CN107480620B (zh) | 基于异构特征融合的遥感图像自动目标识别方法 | |
Uluturk et al. | Recognition of leaves based on morphological features derived from two half-regions | |
Ibrahim et al. | Leaf recognition using texture features for herbal plant identification | |
CN106021603A (zh) | 一种基于分割和特征匹配的服装图像检索方法 | |
Zawbaa et al. | An automatic flower classification approach using machine learning algorithms | |
CN105574063A (zh) | 基于视觉显著性的图像检索方法 | |
CN101526994B (zh) | 一种与采集设备无关的指纹图像分割方法 | |
CN109446985B (zh) | 基于矢量神经网络的多角度植物识别方法 | |
CN112052772A (zh) | 一种人脸遮挡检测算法 | |
CN103456013A (zh) | 一种表示超像素以及度量超像素之间相似性的方法 | |
CN109858386A (zh) | 一种基于荧光显微图像的微藻细胞识别方法 | |
CN102184404A (zh) | 掌纹图像中手掌区域的获取方法及装置 | |
CN108960276A (zh) | 提升光谱图像监督分类性能的样本扩充与一致性判别方法 | |
CN105894035B (zh) | 基于sar-sift和dbn的sar图像分类方法 | |
CN106326914B (zh) | 一种基于svm的珍珠多分类方法 | |
CN102930291B (zh) | 用于图形图像的k近邻局部搜索遗传自动聚类方法 | |
CN105023239B (zh) | 基于超像素和最大边界分布的高光谱数据降维方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |