CN114998614B - 一种图像处理方法、装置、设备及可读存储介质 - Google Patents
一种图像处理方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN114998614B CN114998614B CN202210942303.XA CN202210942303A CN114998614B CN 114998614 B CN114998614 B CN 114998614B CN 202210942303 A CN202210942303 A CN 202210942303A CN 114998614 B CN114998614 B CN 114998614B
- Authority
- CN
- China
- Prior art keywords
- contour
- feature
- image
- pixel point
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 230000000877 morphologic effect Effects 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims description 56
- 238000004590 computer program Methods 0.000 claims description 42
- 238000013145 classification model Methods 0.000 claims description 27
- 230000011218 segmentation Effects 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 21
- 238000001514 detection method Methods 0.000 claims description 17
- 238000013139 quantization Methods 0.000 claims description 17
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000001131 transforming effect Effects 0.000 claims description 7
- 238000000605 extraction Methods 0.000 abstract description 28
- 238000004364 calculation method Methods 0.000 abstract description 22
- 230000000694 effects Effects 0.000 abstract description 2
- 235000012055 fruits and vegetables Nutrition 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000004927 fusion Effects 0.000 description 6
- 235000013399 edible fruits Nutrition 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 235000013311 vegetables Nutrition 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 241000219109 Citrullus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/54—Extraction of image or video features relating to texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像处理方法、装置、设备及可读存储介质。本申请确定待处理图像中的待分类目标后,进一步确定待分类目标的轮廓像素点集,然后基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,再拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,最后基于特征表示进行图像分类任务,可使表示待分类目标的特征同时包含全局、局部、形状、颜色、纹理等特征,提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,降低了特征提取的计算量。本申请提供的一种图像处理装置、设备及可读存储介质,也同样具有上述技术效果。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种图像处理方法、装置、设备及可读存储介质。
背景技术
当前针对图像进行特征提取时,所提取的特征多而繁杂,且其中包含较多噪声。具体的,需要进行特征提取的图像中的目标区域的表面纹理不仅计算量大,还夹杂噪声信息。同时,目标区域的颜色特征数据由于受光反射等因素的影响,也容易产生噪声信息。
因此,如何提升图像特征的准确性,同时降低特征提取的计算量,是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种图像处理方法、装置、设备及可读存储介质,以提升图像特征的准确性,同时降低特征提取的计算量。其具体方案如下:
第一方面,本申请提供了一种图像处理方法,包括:
获取待处理图像,并确定所述待处理图像中的待分类目标;
确定所述待分类目标的轮廓像素点集;
基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务。
可选地,所述确定所述待处理图像中的待分类目标,包括:
将所述待处理图像变换至HSV(HueSaturationValue-色调,饱和度,亮度)空间,并对变换后的图像进行目标分割,得到所述待分类目标的二值化图像。
可选地,所述对变换后的图像进行目标分割,得到所述待分类目标的二值化图像,包括:
采用阈值分割方法分割变换后的图像的V通道,得到所述待分类目标的二值化图像。
可选地,所述确定所述待分类目标的轮廓像素点集,包括:
利用轮廓检测算法对所述待分类目标的二值化图像进行轮廓检测,得到所述轮廓像素点集。
可选地,所述轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,所述几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
可选地,所述轮廓形状分布特征的确定过程包括:
计算所述轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定所述轮廓形状分布特征。
可选地,所述轮廓颜色特征的确定过程包括:
计算所述轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到所述轮廓颜色特征。
可选地,所述轮廓纹理特征的确定过程包括:
对所述轮廓像素点集中每个像素点的邻域进行LBP(Local Binary Pattern)编码,得到所述轮廓纹理特征。
可选地,所述对所述轮廓像素点集中每个像素点的邻域进行LBP编码,包括:
采用旋转不变编码方法对所述轮廓像素点集中每个像素点的邻域进行LBP编码。
可选地,所述拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,包括:
为所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征分别分配权重系数;
按照所述权重系数拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征,得到所述特征表示。
可选地,所述基于所述特征表示进行图像分类任务,包括:
将所述特征表示输入训练完成的图像分类模型,以使所述图像分类模型输出所述待处理图像的类别。
可选地,所述基于所述特征表示进行图像分类任务,包括:
将所述特征表示作为训练样本训练得到图像分类模型。
第二方面,本申请提供了一种图像处理装置,包括:
图像获取模块,用于获取待处理图像,并确定所述待处理图像中的待分类目标;
第一确定模块,用于确定所述待分类目标的轮廓像素点集;
第二确定模块,用于基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
图像分类模块,用于拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务。
可选地,图像获取模块具体用于:
将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。
可选地,图像获取模块具体用于:
采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。
可选地,第一确定模块具体用于:
利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。
可选地,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
可选地,轮廓形状分布特征的确定过程包括:
计算轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定轮廓形状分布特征。
可选地,轮廓颜色特征的确定过程包括:
计算轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。
可选地,轮廓纹理特征的确定过程包括:
对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。
可选地,图像分类模块具体用于:
为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;
按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。
可选地,图像分类模块具体用于:
将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。
可选地,图像分类模块具体用于:
将特征表示作为训练样本训练得到图像分类模型。
第三方面,本申请提供了一种图像处理设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的图像处理方法。
第四方面,本申请提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的图像处理方法。
通过以上方案可知,本申请提供了一种图像处理方法,包括:获取待处理图像,并确定所述待处理图像中的待分类目标;确定所述待分类目标的轮廓像素点集;基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务。
可见,本申请确定待处理图像中的待分类目标后,进一步确定待分类目标的轮廓像素点集,然后基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,再拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,最后基于特征表示进行图像分类任务。在该方案中,使用图像中待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征的组合作为待分类目标的特征表示,可使表示待分类目标的特征同时包含全局、局部、形状、颜色、纹理等特征信息,丰富了特征类型和特征信息量。同时,由于上述各特征均基于待分类目标的轮廓像素点集进行计算,而没有以待分类目标的全局像素为计算基础,因此降低了特征提取计算量。可见,本申请通过提取更多类型的特征提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,从而降低了特征提取的计算量。
相应地,本申请提供的一种图像处理装置、设备及可读存储介质,也同样具有上述技术效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种图像处理方法流程图;
图2为本申请公开的一种待分类目标的RGB图像、二值化图像以及轮廓点图像的示意图;
图3为本申请公开的一种特征提取及融合示意图;
图4为本申请公开的一种模型训练及图像分类示意图;
图5为本申请公开的一种梯度方向直方图示意图;
图6为本申请公开的一种颜色直方图示意图;
图7为本申请公开的一种LBP直方图示意图;
图8为本申请公开的一种图像处理装置示意图;
图9为本申请公开的一种图像处理设备示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有的计算机视觉特征提取方法大多是描述目标的全局特征,缺少局部区域的特征,特征可区分性较差。由于对目标的全局特征进行提取,导致所提取的特征多而繁杂,且其中包含较多噪声。而且,目标区域的颜色特征数据由于受光反射等因素的影响,也容易产生噪声信息。为此,本申请提供了一种图像处理方案,能够提升图像特征的准确性,同时降低特征提取的计算量。
参见图1所示,本申请实施例公开了一种图像处理方法,包括:
S101、获取待处理图像,并确定待处理图像中的待分类目标。
在本实施例中,待处理图像可以是任意可视化图像。待处理图像中的待分类目标可以是:图像中的人像、动物、车辆、蔬菜、水果等。
在一种具体实施方式中,确定待处理图像中的待分类目标,包括:将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。一般地,待处理图像可以是RGB图像,将RGB图像变换至HSV空间后,可对变换后的图像的V通道的像素进行阈值分割,从而保留待分类目标在图像中占用的像素点。因此在一种具体实施方式中,对变换后的图像进行目标分割,得到待分类目标的二值化图像,包括:采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。其中,阈值分割方法可以是OSTU(大津阈值法)或其他。RGB图像通过对红(R)、绿(G)、(B)三个颜色通道进行变化并将它们相互叠加得到。
S102、确定待分类目标的轮廓像素点集。
需要说明的是,待分类目标的轮廓像素点集就是:组成待分类目标的轮廓的像素点集合。请参见图2,图2示意了一个西瓜(即待分类目标)的RGB图像、二值化图像以及轮廓点图像。
在一种具体实施方式中,确定待分类目标的轮廓像素点集,包括:利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。其中,轮廓检测算法可以灵活选择。
S103、基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征。
在一种具体实施方式中,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
在一种具体实施方式中,轮廓形状分布特征的确定过程包括:计算轮廓像素点集中每个像素点的梯度方向;基于各像素点的梯度方向确定轮廓形状分布特征。轮廓形状分布特征可以用梯度方向直方图表示。
在一种具体实施方式中,轮廓颜色特征的确定过程包括:计算轮廓像素点集中每个像素点所在邻域的色调大小;分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。轮廓颜色特征可以用颜色直方图表示。
在一种具体实施方式中,轮廓纹理特征的确定过程包括:对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。轮廓纹理特征可以用LBP直方图表示。其中,对轮廓像素点集中每个像素点的邻域进行LBP编码,包括:采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码。采用旋转不变编码方法在待分类目标转换后,仍能保持编码结果不变。
S104、拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,并基于特征表示进行图像分类任务。
在一种具体实施方式中,拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,包括:为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。在一种示例中,利用公式R=a×A+b×B+c×C+d×D可得到拼接后的待分类目标的特征表示。其中,R表示拼接结果,A表示轮廓形态特征,B表示轮廓形状分布特征,C表示轮廓颜色特征,D表示轮廓纹理特征,a为轮廓形态特征的权重系数,b为轮廓形状分布特征的权重系数,c为轮廓颜色特征的权重系数,d为轮廓纹理特征的权重系数。a、b、c、d均在[0,1]区间取值,值越大,相应特征对拼接结果的影响越大。其中,a+b+c+d=1。公式R中的“+”表示:特征的拼接或连接。
在一种具体实施方式中,基于特征表示进行图像分类任务,包括:将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。在一种具体实施方式中,基于特征表示进行图像分类任务,包括:将特征表示作为训练样本训练得到图像分类模型。可见,拼接四种特征得到的待分类目标的特征表示可以用于确定相应图像的类别,也可以作为模型的训练样本来训练图像分类模型、图像识别模型等。
其中,图像分类模型、图像识别模型可以采用机器学习方法或深度学习方法训练得到。机器学习方法具体可以使用SVM、决策树等算法。深度学习方法具体可以使用神经网络等模型结构。训练需要用的损失函数可以灵活选择。
本实施例在确定待处理图像中的待分类目标后,进一步确定待分类目标的轮廓像素点集,然后基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,再拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,最后基于特征表示进行图像分类任务。
可见,本实施例使用图像中待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征的组合作为待分类目标的特征表示,可使表示待分类目标的特征同时包含全局、局部、形状、颜色、纹理等特征信息,丰富了特征类型和特征信息量。同时,由于上述各特征均基于待分类目标的轮廓像素点集进行计算,而没有以待分类目标的全局像素为计算基础,因此降低了特征提取计算量。本实施例通过提取更多类型的特征提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,从而降低了特征提取的计算量。
下述实施例基于本申请的核心思想,提供了一种基于多特征融合的目标识别方法。该方法通过多种类型的特征融合来增加和丰富特征信息,同时以轮廓点的周边为计算基础,提取轮廓点形态特征及分布特征、轮廓点所在区域的颜色特征及纹理特征,以减少特征提取计算量。其中,融合上述轮廓点形态特征及分布特征、轮廓点所在区域的颜色特征及纹理特征,可实现全局特征和局部特征的融合,从而提高特征的可区分性。
下面详细阐述本实施例提供的目标识别方法。目标识别的处理流程包括三步:预处理、特征提取以及目标分类。
一、预处理。
预处理是为了去除与目标无关的信息,增强目标相关信息。请参见图3,本实施例提供的预处理步骤包括:将RGB图像变换成HSV图像,然后采用OSTU阈值分割方法得到二值化图像,获取待识别目标所在区域,然后采用轮廓检测获取待识别目标的边缘轮廓。针对待识别目标的边缘轮廓,提取全局的轮廓形态属性特征(即轮廓形态特征)、轮廓的梯度方向直方图特征(即轮廓形状分布特征)、轮廓的颜色直方图特征(即轮廓颜色特征)、轮廓的LBP直方图特征(即轮廓纹理特征),这些特征可以描述待识别目标区域和待识别目标边缘轮廓的相关信息,因此将这些特征融合在一起作为待识别目标的特征表示。融合不同特征时可以将不同特征直接拼接起来。
其中,针对HSV空间的HSV图像,H表示色调,S表示饱和度,V表示亮度。考虑白色背景,在V通道上进行阈值分割,可以将待识别目标和背景分割开,得到待识别目标的二值化图像,而二值化图像的边界即为待识别目标的边缘轮廓。具体的,对二值化图像进行轮廓检测即可得到待识别目标的边缘轮廓。
二、特征提取。
上一步的预处理得到了待识别目标所在区域以及待识别目标边缘轮廓,本步骤据此进行特征提取。具体提取四种特征:轮廓形态属性特征,轮廓点的梯度方向直方图特征,轮廓点的颜色直方图特征,轮廓点的LBP直方图特征。其中,轮廓形态属性特征为全局形状特征,轮廓点的梯度方向直方图特征为局部形状特征,轮廓点的颜色直方图特征为颜色特征,轮廓点的LBP直方图特征为纹理特征。这四种类型的特征相互补充,将这四种特征融合在一起,可以增强特征的可区分性,进而提高识别准确性。
1、提取轮廓形态属性特征。
轮廓形态特征主要包括轮廓的几何形态特征和凹凸属性。几何形态特征包括宽长比特征、矩形度特征、圆度特征、圆形特征。凹凸属性特征包括紧固性和凸性。
宽长比为轮廓的最小外接矩形的长宽比值,假设长、宽分别为、,那么矩形宽长比用公式表示为:。需要说明的是,宽长比反映了轮廓的整体形状,宽长比越接近于0,轮廓形状越“瘦长”,宽长比越接近于1,轮廓形状越“粗短”。
2、提取轮廓点的梯度方向直方图特征。
在本步骤中,梯度方向直方图描述轮廓点位置附近的像素梯度方向和幅值分布情况,因此本步骤中的梯度方向直方图不将整个待识别目标作为特征提取区域,只计算目标的轮廓点位置的梯度方向直方图。
具体可以采用Sobel边缘检测算子来计算梯度,Sobel属于一阶微分算子,可以计算像素邻近区域的灰度差,实际运算中采用固定的卷积模板对图像进行卷积运算来计算梯度。Sobel算子可以由2个5×5的卷积模板组成,卷积模板对水平边缘(方向)的响应最大,而卷积模板对垂直边缘(方向)的响应最大。
在本步骤中,基于V(亮度)通道进行Sobel边缘检测,采用5×5的卷积模板对图像中的轮廓点集合对应的位置进行卷积运算。具体地,对于第个轮廓点的梯度计算,以为中心提取其5×5邻域内的图像的像素值,记为矩阵,将其分别与卷积模板,进行卷积计算,用公式表示:,。其中,运算符号*表示两个矩阵中所有对应位置的元素相乘并求和。下一步根据方向的梯度和方向的梯度计算梯度幅值和梯度方向,计算公式为:。
本步骤中的梯度方向直方图计算,是统计所有轮廓点的梯度方向分布情况。具体步骤包括:将所有轮廓点的梯度方向(弧度,)量化到个方向,梯度方向量化的公式为:。其中,表示轮廓点的下标,的取值范围为。然后,统计每个梯度方向的像素点的数目和概率,并以梯度幅值进行加权,加权公式为:。表示轮廓点的数目,即为梯度方向直方图,直方图横轴为的下标,表示梯度方向,纵轴为的元素,表示每个梯度方向上的轮廓点的分布情况,即梯度方向直方图特征数据。
3、提取轮廓点的颜色直方图特征。
颜色特征是目标识别的关键特征,本步骤将所有轮廓点的邻域作为特征区域进行颜色分布统计,可以描述轮廓点周围的颜色分布情况。由于H(色调)通道描述图像颜色信息,因而对轮廓点周围的色调强度进行颜色分布统计。
首先,提取轮廓点集合中所有轮廓点所在矩形邻域内的色调强度,矩形邻域记为,大小记为,轮廓点所在矩形邻域的色调强度记为,的第个像素点的色调强度记为,的取值范围为,的取值范围为。其中,以每一个轮廓点为中心点,可以构建一个矩形区域,一个矩形区域的面积可以预设。
4、提取轮廓点的LBP直方图特征。
本步骤选择S(饱和度)通道的强度作为像素点的灰度值,只对轮廓点邻域内的像素点进行LBP编码,然后统计LBP直方图。LBP直方图可以描述特征区域内灰度变化方向的编码模式。
首先,提取轮廓点集合中所有轮廓点所在矩形邻域的饱和度强度值,轮廓点所在矩形邻域的饱和度强度记为,矩形邻域的配置和颜色直方图一样,的取值范围为,的取值范围为。以中的第个像素点为中心,提取其邻域内的饱和度强度,记为,。其中,矩阵元素表示饱和度强度值。
然后,对中的第个像素点进行LBP编码。一种可用的LBP编码方式包括:以为中心,将其周围的8个饱和度值逐个与比较,若大于,对应位置标记为1,否则标记为0,得到8个二进制数字,按照,,,,,,,的顺序排列8个二进制数字,即可得到一个8bit的二进制数,称为LBP编码,将其转换成一个0~255范围的十进制数,记为。考虑到方向旋转问题,可以优先采用旋转不变LBP编码方法,在上述LBP编码的基础上,不断地对二进制数进行循环移位,得到一系列的LBP特征值,从这些LBP编码值中选择一个最小值作为该位置的LBP编码。
最后,统计所有像素点的LBP分布情况,由于LBP编码值范围在0~255,特征维度大,因而需要先对LBP编码值进行量化,量化数目为,量化公式为。其中,的取值范围为。然后统计所有量化LBP编码对应的像素点的概率,计算公式为:。其中,即为LBP直方图,直方图横轴为的下标,表示LBP编码值,纵轴为的元素,表示每个LBP编码值对应的像素点概率,即LBP直方图特征数据。
5、融合特征。
融合轮廓形态属性特征,轮廓点的梯度方向直方图特征,轮廓点的颜色直方图特征,轮廓点的LBP直方图特征,得到待识别目标的特征表示。
三、目标分类。
请参见图4,本步骤采用SVM作为分类器模型,利用融合得到的特征表示作为样本数据,对该模型进行训练和推理。也即:将特征提取过程获得的轮廓形态属性特征、梯度方向直方图特征、颜色直方图特征和LBP直方图特征融合在一起,作为SVM分类器的输入,经过SVM模型训练和推理,获取原图像的分类结果。SVM分类模型是一个二分类模型,主要思想是学习若干个分类超平面,在特征空间中对全部训练样本按照类别进行划分,从而实现正确分类,和其他机器学习算法相比,SVM算法具有较好的泛化能力。
可见,本实施例提取的特征包含了全局、局部、形状、颜色、纹理等特征信息,提高了特征类型的丰富性;并且,这些特征均围绕轮廓点周围进行特征确定,而不以目标全局像素为基础,因此能减少特征提取的计算量。
下述实施例以果蔬图像为例,对本申请提供的方案做进一步介绍。在本实施例中,针对果蔬图像中的果蔬进行分类,可以具体包括以下步骤:
1、获取果蔬图像。
2、图像预处理,提取果蔬所在区域和边缘轮廓。
3、提取果蔬轮廓的全局形状特征、局部形状特征、颜色特征和纹理特征,并进行特征融合。
4、基于SVM算法训练分类模型,并利用训练好的分类模型进行果蔬分类。
其中,果蔬轮廓的全局形状特征即轮廓形态特征,包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。其中,果蔬轮廓的局部形状特征即轮廓形状分布特征,该特征的确定过程包括:计算轮廓像素点集中每个像素点的梯度方向;基于各像素点的梯度方向确定轮廓形状分布特征。其中,果蔬轮廓的颜色特征即轮廓颜色特征,该特征的确定过程包括:计算轮廓像素点集中每个像素点所在邻域的色调大小;分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。其中,果蔬轮廓的纹理特征即轮廓纹理特征,该特征的确定过程包括:采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。上述各特征更为具体的计算提取步骤及公式可参照上述实施例的相关介绍。
在本实施例中,果蔬轮廓的局部形状特征用梯度方向直方图表示,果蔬轮廓的梯度方向直方图可参见图5。果蔬轮廓的颜色特征用颜色直方图表示,果蔬轮廓的颜色直方图可参见图6。果蔬轮廓的纹理特征用LBP直方图表示,果蔬轮廓的LBP直方图可参见图7。图5、图6、图7的纵坐标均表示概率分布的大小。图5的横坐标表示梯度方向,图5横坐标上的数值0~16为:对原始梯度方向量化得到的数值。图6的横坐标表示颜色强度,图6横坐标上的数值0~60为:对原始颜色值量化得到的数值,例如:将颜色值从0~255量化为0~63。图7的横坐标表示LBP编码值大小,图7横坐标上的数值0~60为:对原始LBP编码量化得到的数值,例如:将LBP编码从0~255量化为0~63。更为详细的介绍可参照上述实施例,本实施例不再赘述。
其中,本实施例采用SVM作为分类器模型,将特征提取过程获取的所有特征数据连接一起作为SVM的输入,模型的优化可采用C类SVM模型、非线性分类、rbf核函数、网格搜索方法等方式,以搜索最优的模型参数C和gama。
可见,本实施例针对果蔬轮廓仍能够提取出包含全局、局部、形状、颜色、纹理的特征信息,保证了丰富的特征类型和特征信息量,既增强了局部区域的特征信息,又减少了特征提取的计算量。
下面对本申请实施例提供的一种图像处理装置进行介绍,下文描述的一种图像处理装置与上文描述的一种图像处理方法可以相互参照。
参见图8所示,本申请实施例公开了一种图像处理装置,包括:
图像获取模块801,用于获取待处理图像,并确定待处理图像中的待分类目标;
第一确定模块802,用于确定待分类目标的轮廓像素点集;
第二确定模块803,用于基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
图像分类模块804,用于拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,并基于特征表示进行图像分类任务。
在一种具体实施方式中,图像获取模块具体用于:
将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。
在一种具体实施方式中,图像获取模块具体用于:
采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。
在一种具体实施方式中,第一确定模块具体用于:
利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。
在一种具体实施方式中,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
在一种具体实施方式中,轮廓形状分布特征的确定过程包括:
计算轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定轮廓形状分布特征。
在一种具体实施方式中,轮廓颜色特征的确定过程包括:
计算轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。
在一种具体实施方式中,轮廓纹理特征的确定过程包括:
对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。
在一种具体实施方式中,对轮廓像素点集中每个像素点的邻域进行LBP编码,包括:
采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码。
在一种具体实施方式中,图像分类模块具体用于:
为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;
按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。
在一种具体实施方式中,图像分类模块具体用于:
将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。
在一种具体实施方式中,图像分类模块具体用于:
将特征表示作为训练样本训练得到图像分类模型。
其中,关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本实施例提供了一种图像处理装置,通过提取更多类型的特征提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,从而降低了特征提取的计算量。
下面对本申请实施例提供的一种图像处理设备进行介绍,下文描述的一种图像处理设备与上文描述的一种图像处理方法及装置可以相互参照。
参见图9所示,本申请实施例公开了一种图像处理设备,包括:
存储器901,用于保存计算机程序;
处理器902,用于执行所述计算机程序,以实现上述任意实施例公开的方法。
在本实施例中,图像处理设备在执行计算机程序时,可以实现以下步骤:获取待处理图像,并确定待处理图像中的待分类目标;确定待分类目标的轮廓像素点集;基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,并基于特征表示进行图像分类任务。其中,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:计算轮廓像素点集中每个像素点的梯度方向;基于各像素点的梯度方向确定轮廓形状分布特征。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:计算轮廓像素点集中每个像素点所在邻域的色调大小;分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:将特征表示作为训练样本训练得到图像分类模型。
可见,本实施例提取的特征包含了全局、局部、形状、颜色、纹理等特征信息,提高了特征类型的丰富性;并且,这些特征均围绕轮廓点周围进行特征确定,而不以目标全局像素为基础,因此能减少特征提取的计算量。
进一步的,本申请实施例提供的图像处理设备可以是服务器,也可以是终端。
当图像处理设备是服务器时,该服务器具体可以包括:至少一个处理器、至少一个存储器、电源、通信接口、输入输出接口和通信总线。其中,存储器用于存储计算机程序,计算机程序由处理器加载并执行,以实现前述任一实施例公开的相应方法。电源用于为服务器上的各硬件设备提供工作电压;通信接口能够为服务器创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。存储器作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统、计算机程序及数据等,存储方式可以是短暂存储或者永久存储。其中,操作系统用于管理与控制服务器上的各硬件设备以及计算机程序,以实现处理器对存储器中数据的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序除了包括能够用于完成前述任一实施例公开的方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据除了可以包括图像数据、模型参数等数据外,还可以包括应用程序的开发商信息等数据。
当图像处理设备是终端时,该终端具体可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。通常,本实施例中的终端包括有:处理器和存储器。其中,处理器可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。存储器可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器至少用于存储以下计算机程序,其中,该计算机程序被处理器加载并执行之后,能够实现前述任一实施例公开的由终端侧执行的方法中的相关步骤。另外,存储器所存储的资源还可以包括操作系统和数据等,存储方式可以是短暂存储或者永久存储。其中,操作系统可以包括Windows、Unix、Linux等。数据可以包括但不限于图像数据、模型参数等。在一些实施例中,终端还可包括有显示屏、输入输出接口、通信接口、传感器、电源以及通信总线。
下面对本申请实施例提供的一种可读存储介质进行介绍,下文描述的一种可读存储介质与上文描述的一种图像处理方法、装置及设备可以相互参照。
一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的图像处理方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容。
在本实施例中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:获取待处理图像,并确定待处理图像中的待分类目标;确定待分类目标的轮廓像素点集;基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,并基于特征表示进行图像分类任务。其中,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:计算轮廓像素点集中每个像素点的梯度方向;基于各像素点的梯度方向确定轮廓形状分布特征。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:计算轮廓像素点集中每个像素点所在邻域的色调大小;分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:将特征表示作为训练样本训练得到图像分类模型。
可见,本实施例提取的特征包含了全局、局部、形状、颜色、纹理等特征信息,提高了特征类型的丰富性;并且,这些特征均围绕轮廓点周围进行特征确定,而不以目标全局像素为基础,因此能减少特征提取的计算量。
本申请涉及的“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法或设备固有的其它步骤或单元。
需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的可读存储介质中。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (12)
1.一种图像处理方法,其特征在于,包括:
获取待处理图像,并确定所述待处理图像中的待分类目标;
确定所述待分类目标的轮廓像素点集;
基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务;
其中,所述轮廓形状分布特征的确定过程包括:
计算所述轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定所述轮廓形状分布特征;
其中,所述轮廓颜色特征的确定过程包括:
计算所述轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到所述轮廓颜色特征;
其中,所述轮廓纹理特征的确定过程包括:
对所述轮廓像素点集中每个像素点的邻域进行LBP编码,得到所述轮廓纹理特征。
2.根据权利要求1所述的图像处理方法,其特征在于,所述确定所述待处理图像中的待分类目标,包括:
将所述待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到所述待分类目标的二值化图像。
3.根据权利要求2所述的图像处理方法,其特征在于,所述对变换后的图像进行目标分割,得到所述待分类目标的二值化图像,包括:
采用阈值分割方法分割变换后的图像的V通道,得到所述待分类目标的二值化图像。
4.根据权利要求1所述的图像处理方法,其特征在于,所述确定所述待分类目标的轮廓像素点集,包括:
利用轮廓检测算法对所述待分类目标的二值化图像进行轮廓检测,得到所述轮廓像素点集。
5.根据权利要求1所述的图像处理方法,其特征在于,所述轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,所述几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
6.根据权利要求1所述的图像处理方法,其特征在于,所述对所述轮廓像素点集中每个像素点的邻域进行LBP编码,包括:
采用旋转不变编码方法对所述轮廓像素点集中每个像素点的邻域进行LBP编码。
7.根据权利要求1所述的图像处理方法,其特征在于,所述拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,包括:
为所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征分别分配权重系数;
按照所述权重系数拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征,得到所述特征表示。
8.根据权利要求1至7任一项所述的图像处理方法,其特征在于,所述基于所述特征表示进行图像分类任务,包括:
将所述特征表示输入训练完成的图像分类模型,以使所述图像分类模型输出所述待处理图像的类别。
9.根据权利要求1至7任一项所述的图像处理方法,其特征在于,所述基于所述特征表示进行图像分类任务,包括:
将所述特征表示作为训练样本训练得到图像分类模型。
10.一种图像处理装置,其特征在于,包括:
图像获取模块,用于获取待处理图像,并确定所述待处理图像中的待分类目标;
第一确定模块,用于确定所述待分类目标的轮廓像素点集;
第二确定模块,用于基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
图像分类模块,用于拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务;
其中,所述轮廓形状分布特征的确定过程包括:
计算所述轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定所述轮廓形状分布特征;
其中,所述轮廓颜色特征的确定过程包括:
计算所述轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到所述轮廓颜色特征;
其中,所述轮廓纹理特征的确定过程包括:
对所述轮廓像素点集中每个像素点的邻域进行LBP编码,得到所述轮廓纹理特征。
11.一种图像处理设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至9任一项所述的图像处理方法。
12.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210942303.XA CN114998614B (zh) | 2022-08-08 | 2022-08-08 | 一种图像处理方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210942303.XA CN114998614B (zh) | 2022-08-08 | 2022-08-08 | 一种图像处理方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114998614A CN114998614A (zh) | 2022-09-02 |
CN114998614B true CN114998614B (zh) | 2023-01-24 |
Family
ID=83023210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210942303.XA Active CN114998614B (zh) | 2022-08-08 | 2022-08-08 | 一种图像处理方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114998614B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117765528B (zh) * | 2023-12-04 | 2024-07-26 | 北京霍里思特科技有限公司 | 一种用于对目标物进行分类的方法、设备和存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218831A (zh) * | 2013-04-21 | 2013-07-24 | 北京航空航天大学 | 一种基于轮廓约束的视频运动目标分类识别方法 |
CN103473537A (zh) * | 2013-09-17 | 2013-12-25 | 湖北工程学院 | 一种目标图像轮廓特征表示方法及装置 |
CN103679169A (zh) * | 2012-09-10 | 2014-03-26 | 华为技术有限公司 | 图像特征的提取方法及装置 |
CN107730487A (zh) * | 2017-09-27 | 2018-02-23 | 浙江大华技术股份有限公司 | 一种图像检测方法及装置 |
CN109102004A (zh) * | 2018-07-23 | 2018-12-28 | 鲁东大学 | 棉花害虫识别分类方法及装置 |
WO2019062092A1 (zh) * | 2017-09-30 | 2019-04-04 | 深圳市颐通科技有限公司 | 基于超像素-多色彩空间的人体轮廓提取方法 |
JP2019057111A (ja) * | 2017-09-21 | 2019-04-11 | カシオ計算機株式会社 | 輪郭検出装置、描画装置、輪郭検出方法及び輪郭検出プログラム |
CN110321452A (zh) * | 2019-05-05 | 2019-10-11 | 广西师范大学 | 一种基于方向选择机制的图像检索方法 |
CN111046202A (zh) * | 2019-12-16 | 2020-04-21 | 广西师范大学 | 基于hsv颜色空间特有属性的图像检索方法 |
CN111275728A (zh) * | 2020-04-10 | 2020-06-12 | 常州市第二人民医院 | 一种基于主动形状模型的前列腺轮廓提取方法 |
CN112052839A (zh) * | 2020-10-10 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置、设备以及介质 |
CN112464850A (zh) * | 2020-12-08 | 2021-03-09 | 东莞先知大数据有限公司 | 图像处理方法、装置、计算机设备及介质 |
CN112990316A (zh) * | 2021-03-18 | 2021-06-18 | 浪潮云信息技术股份公司 | 基于多显著性特征融合的高光谱遥感图像分类方法及系统 |
CN113554037A (zh) * | 2021-07-14 | 2021-10-26 | 广联达科技股份有限公司 | 一种基于模型简化的特征提取方法及装置 |
CN113837037A (zh) * | 2021-09-09 | 2021-12-24 | 广东浪潮智慧计算技术有限公司 | 一种植物种类识别方法、系统、电子设备及存储介质 |
CN114299299A (zh) * | 2021-11-29 | 2022-04-08 | 苏州浪潮智能科技有限公司 | 一种树叶特征提取方法、装置、计算机设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110969171A (zh) * | 2019-12-12 | 2020-04-07 | 河北科技大学 | 基于改进卷积神经网络的图像分类模型、方法及应用 |
CN112200738A (zh) * | 2020-09-29 | 2021-01-08 | 平安科技(深圳)有限公司 | 形状的突起识别方法、装置以及计算机设备 |
CN113963041A (zh) * | 2021-08-30 | 2022-01-21 | 南京市晨枭软件技术有限公司 | 一种图像纹理识别方法及系统 |
CN113643287B (zh) * | 2021-10-13 | 2022-03-01 | 深圳市巨力方视觉技术有限公司 | 水果的分拣方法、装置和计算机可读存储介质 |
CN113920324B (zh) * | 2021-12-13 | 2022-04-01 | 广州思德医疗科技有限公司 | 图像识别方法、装置、电子设备及存储介质 |
-
2022
- 2022-08-08 CN CN202210942303.XA patent/CN114998614B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103679169A (zh) * | 2012-09-10 | 2014-03-26 | 华为技术有限公司 | 图像特征的提取方法及装置 |
CN103218831A (zh) * | 2013-04-21 | 2013-07-24 | 北京航空航天大学 | 一种基于轮廓约束的视频运动目标分类识别方法 |
CN103473537A (zh) * | 2013-09-17 | 2013-12-25 | 湖北工程学院 | 一种目标图像轮廓特征表示方法及装置 |
JP2019057111A (ja) * | 2017-09-21 | 2019-04-11 | カシオ計算機株式会社 | 輪郭検出装置、描画装置、輪郭検出方法及び輪郭検出プログラム |
CN107730487A (zh) * | 2017-09-27 | 2018-02-23 | 浙江大华技术股份有限公司 | 一种图像检测方法及装置 |
WO2019062092A1 (zh) * | 2017-09-30 | 2019-04-04 | 深圳市颐通科技有限公司 | 基于超像素-多色彩空间的人体轮廓提取方法 |
CN109102004A (zh) * | 2018-07-23 | 2018-12-28 | 鲁东大学 | 棉花害虫识别分类方法及装置 |
CN110321452A (zh) * | 2019-05-05 | 2019-10-11 | 广西师范大学 | 一种基于方向选择机制的图像检索方法 |
CN111046202A (zh) * | 2019-12-16 | 2020-04-21 | 广西师范大学 | 基于hsv颜色空间特有属性的图像检索方法 |
CN111275728A (zh) * | 2020-04-10 | 2020-06-12 | 常州市第二人民医院 | 一种基于主动形状模型的前列腺轮廓提取方法 |
CN112052839A (zh) * | 2020-10-10 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置、设备以及介质 |
CN112464850A (zh) * | 2020-12-08 | 2021-03-09 | 东莞先知大数据有限公司 | 图像处理方法、装置、计算机设备及介质 |
CN112990316A (zh) * | 2021-03-18 | 2021-06-18 | 浪潮云信息技术股份公司 | 基于多显著性特征融合的高光谱遥感图像分类方法及系统 |
CN113554037A (zh) * | 2021-07-14 | 2021-10-26 | 广联达科技股份有限公司 | 一种基于模型简化的特征提取方法及装置 |
CN113837037A (zh) * | 2021-09-09 | 2021-12-24 | 广东浪潮智慧计算技术有限公司 | 一种植物种类识别方法、系统、电子设备及存储介质 |
CN114299299A (zh) * | 2021-11-29 | 2022-04-08 | 苏州浪潮智能科技有限公司 | 一种树叶特征提取方法、装置、计算机设备和存储介质 |
Non-Patent Citations (4)
Title |
---|
A Novel Pedestrian Detection Method Based on Combination of LBP, HOG, and Haar-Like Features;Mina Etehadi Abari;《2018 IEEE International Conference on Electro/Information Technology (EIT)》;20181021;1-12 * |
Symmetric Image Contents Analysis and Retrieval Using Decimation, Pattern Analysis, Orientation, and Features Fusion;Khawaja Tehseen Ahmed等;《IEEE Access》;20210420;第9卷;57215-57242 * |
基于目标检测的图像检索技术研究;骆俊锋;《中国优秀硕士学位论文全文数据库 信息科技辑》;20220115;第2022年卷(第1期);I138-1360 * |
基于计算机视觉的废旧塑料瓶分拣回收系统;赵远远;《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》;20210415;第2021年卷(第4期);B027-464 * |
Also Published As
Publication number | Publication date |
---|---|
CN114998614A (zh) | 2022-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sirmacek et al. | Urban-area and building detection using SIFT keypoints and graph theory | |
AU2006252025B2 (en) | Recognition of parameterised shapes from document images | |
US9519660B2 (en) | Information processing apparatus, clustering method, and recording medium storing clustering program | |
Flores et al. | Application of convolutional neural networks for static hand gestures recognition under different invariant features | |
CN113160257B (zh) | 图像数据标注方法、装置、电子设备及存储介质 | |
AU2006252019B2 (en) | Method and Apparatus for Dynamic Connector Analysis | |
TW202207077A (zh) | 一種文本區域的定位方法及裝置 | |
CN107967482A (zh) | 图标识别方法及装置 | |
CN110852327A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN114998614B (zh) | 一种图像处理方法、装置、设备及可读存储介质 | |
CN114373185A (zh) | 票据图像的分类方法及其装置、电子设备及存储介质 | |
CN116543325A (zh) | 基于无人机影像的农作物人工智能自动识别方法和系统 | |
Durga Devi et al. | Digital acquisition and character extraction from stone inscription images using modified fuzzy entropy-based adaptive thresholding | |
Bell et al. | Reflections on connoisseurship and computer vision | |
CN117496532A (zh) | 基于0cr的智慧识别工具 | |
CN111199228A (zh) | 一种车牌定位的方法及装置 | |
CN115205624A (zh) | 一种跨维度注意力聚合的云雪辩识方法、设备及存储介质 | |
Henry et al. | Near set index in an objective image segmentation evaluation framework | |
Jyothi et al. | Computational color naming for human-machine interaction | |
CN113837236A (zh) | 图像中目标对象的识别方法、装置、终端设备及存储介质 | |
Jenicka et al. | Fuzzy texture model and support vector machine hybridization for land cover classification of remotely sensed images | |
Abdalla et al. | Digital Image Processing Technology based on MATLAB. | |
CN111476800A (zh) | 一种基于形态学操作的文字区域检测方法及装置 | |
Huang et al. | Traffic road sign detection and recognition in natural environment using RGB color model | |
Caponetti et al. | Fuzzy image processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |