CN114998614B - 一种图像处理方法、装置、设备及可读存储介质 - Google Patents

一种图像处理方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN114998614B
CN114998614B CN202210942303.XA CN202210942303A CN114998614B CN 114998614 B CN114998614 B CN 114998614B CN 202210942303 A CN202210942303 A CN 202210942303A CN 114998614 B CN114998614 B CN 114998614B
Authority
CN
China
Prior art keywords
contour
feature
image
pixel point
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210942303.XA
Other languages
English (en)
Other versions
CN114998614A (zh
Inventor
沈艳梅
宿栋栋
刘伟
阚宏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN202210942303.XA priority Critical patent/CN114998614B/zh
Publication of CN114998614A publication Critical patent/CN114998614A/zh
Application granted granted Critical
Publication of CN114998614B publication Critical patent/CN114998614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/467Encoded features or binary features, e.g. local binary patterns [LBP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/54Extraction of image or video features relating to texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像处理方法、装置、设备及可读存储介质。本申请确定待处理图像中的待分类目标后,进一步确定待分类目标的轮廓像素点集,然后基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,再拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,最后基于特征表示进行图像分类任务,可使表示待分类目标的特征同时包含全局、局部、形状、颜色、纹理等特征,提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,降低了特征提取的计算量。本申请提供的一种图像处理装置、设备及可读存储介质,也同样具有上述技术效果。

Description

一种图像处理方法、装置、设备及可读存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种图像处理方法、装置、设备及可读存储介质。
背景技术
当前针对图像进行特征提取时,所提取的特征多而繁杂,且其中包含较多噪声。具体的,需要进行特征提取的图像中的目标区域的表面纹理不仅计算量大,还夹杂噪声信息。同时,目标区域的颜色特征数据由于受光反射等因素的影响,也容易产生噪声信息。
因此,如何提升图像特征的准确性,同时降低特征提取的计算量,是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种图像处理方法、装置、设备及可读存储介质,以提升图像特征的准确性,同时降低特征提取的计算量。其具体方案如下:
第一方面,本申请提供了一种图像处理方法,包括:
获取待处理图像,并确定所述待处理图像中的待分类目标;
确定所述待分类目标的轮廓像素点集;
基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务。
可选地,所述确定所述待处理图像中的待分类目标,包括:
将所述待处理图像变换至HSV(HueSaturationValue-色调,饱和度,亮度)空间,并对变换后的图像进行目标分割,得到所述待分类目标的二值化图像。
可选地,所述对变换后的图像进行目标分割,得到所述待分类目标的二值化图像,包括:
采用阈值分割方法分割变换后的图像的V通道,得到所述待分类目标的二值化图像。
可选地,所述确定所述待分类目标的轮廓像素点集,包括:
利用轮廓检测算法对所述待分类目标的二值化图像进行轮廓检测,得到所述轮廓像素点集。
可选地,所述轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,所述几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
可选地,所述轮廓形状分布特征的确定过程包括:
计算所述轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定所述轮廓形状分布特征。
可选地,所述轮廓颜色特征的确定过程包括:
计算所述轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到所述轮廓颜色特征。
可选地,所述轮廓纹理特征的确定过程包括:
对所述轮廓像素点集中每个像素点的邻域进行LBP(Local Binary Pattern)编码,得到所述轮廓纹理特征。
可选地,所述对所述轮廓像素点集中每个像素点的邻域进行LBP编码,包括:
采用旋转不变编码方法对所述轮廓像素点集中每个像素点的邻域进行LBP编码。
可选地,所述拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,包括:
为所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征分别分配权重系数;
按照所述权重系数拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征,得到所述特征表示。
可选地,所述基于所述特征表示进行图像分类任务,包括:
将所述特征表示输入训练完成的图像分类模型,以使所述图像分类模型输出所述待处理图像的类别。
可选地,所述基于所述特征表示进行图像分类任务,包括:
将所述特征表示作为训练样本训练得到图像分类模型。
第二方面,本申请提供了一种图像处理装置,包括:
图像获取模块,用于获取待处理图像,并确定所述待处理图像中的待分类目标;
第一确定模块,用于确定所述待分类目标的轮廓像素点集;
第二确定模块,用于基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
图像分类模块,用于拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务。
可选地,图像获取模块具体用于:
将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。
可选地,图像获取模块具体用于:
采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。
可选地,第一确定模块具体用于:
利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。
可选地,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
可选地,轮廓形状分布特征的确定过程包括:
计算轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定轮廓形状分布特征。
可选地,轮廓颜色特征的确定过程包括:
计算轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。
可选地,轮廓纹理特征的确定过程包括:
对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。
可选地,图像分类模块具体用于:
为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;
按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。
可选地,图像分类模块具体用于:
将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。
可选地,图像分类模块具体用于:
将特征表示作为训练样本训练得到图像分类模型。
第三方面,本申请提供了一种图像处理设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的图像处理方法。
第四方面,本申请提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的图像处理方法。
通过以上方案可知,本申请提供了一种图像处理方法,包括:获取待处理图像,并确定所述待处理图像中的待分类目标;确定所述待分类目标的轮廓像素点集;基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务。
可见,本申请确定待处理图像中的待分类目标后,进一步确定待分类目标的轮廓像素点集,然后基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,再拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,最后基于特征表示进行图像分类任务。在该方案中,使用图像中待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征的组合作为待分类目标的特征表示,可使表示待分类目标的特征同时包含全局、局部、形状、颜色、纹理等特征信息,丰富了特征类型和特征信息量。同时,由于上述各特征均基于待分类目标的轮廓像素点集进行计算,而没有以待分类目标的全局像素为计算基础,因此降低了特征提取计算量。可见,本申请通过提取更多类型的特征提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,从而降低了特征提取的计算量。
相应地,本申请提供的一种图像处理装置、设备及可读存储介质,也同样具有上述技术效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种图像处理方法流程图;
图2为本申请公开的一种待分类目标的RGB图像、二值化图像以及轮廓点图像的示意图;
图3为本申请公开的一种特征提取及融合示意图;
图4为本申请公开的一种模型训练及图像分类示意图;
图5为本申请公开的一种梯度方向直方图示意图;
图6为本申请公开的一种颜色直方图示意图;
图7为本申请公开的一种LBP直方图示意图;
图8为本申请公开的一种图像处理装置示意图;
图9为本申请公开的一种图像处理设备示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有的计算机视觉特征提取方法大多是描述目标的全局特征,缺少局部区域的特征,特征可区分性较差。由于对目标的全局特征进行提取,导致所提取的特征多而繁杂,且其中包含较多噪声。而且,目标区域的颜色特征数据由于受光反射等因素的影响,也容易产生噪声信息。为此,本申请提供了一种图像处理方案,能够提升图像特征的准确性,同时降低特征提取的计算量。
参见图1所示,本申请实施例公开了一种图像处理方法,包括:
S101、获取待处理图像,并确定待处理图像中的待分类目标。
在本实施例中,待处理图像可以是任意可视化图像。待处理图像中的待分类目标可以是:图像中的人像、动物、车辆、蔬菜、水果等。
在一种具体实施方式中,确定待处理图像中的待分类目标,包括:将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。一般地,待处理图像可以是RGB图像,将RGB图像变换至HSV空间后,可对变换后的图像的V通道的像素进行阈值分割,从而保留待分类目标在图像中占用的像素点。因此在一种具体实施方式中,对变换后的图像进行目标分割,得到待分类目标的二值化图像,包括:采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。其中,阈值分割方法可以是OSTU(大津阈值法)或其他。RGB图像通过对红(R)、绿(G)、(B)三个颜色通道进行变化并将它们相互叠加得到。
S102、确定待分类目标的轮廓像素点集。
需要说明的是,待分类目标的轮廓像素点集就是:组成待分类目标的轮廓的像素点集合。请参见图2,图2示意了一个西瓜(即待分类目标)的RGB图像、二值化图像以及轮廓点图像。
在一种具体实施方式中,确定待分类目标的轮廓像素点集,包括:利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。其中,轮廓检测算法可以灵活选择。
S103、基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征。
在一种具体实施方式中,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
在一种具体实施方式中,轮廓形状分布特征的确定过程包括:计算轮廓像素点集中每个像素点的梯度方向;基于各像素点的梯度方向确定轮廓形状分布特征。轮廓形状分布特征可以用梯度方向直方图表示。
在一种具体实施方式中,轮廓颜色特征的确定过程包括:计算轮廓像素点集中每个像素点所在邻域的色调大小;分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。轮廓颜色特征可以用颜色直方图表示。
在一种具体实施方式中,轮廓纹理特征的确定过程包括:对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。轮廓纹理特征可以用LBP直方图表示。其中,对轮廓像素点集中每个像素点的邻域进行LBP编码,包括:采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码。采用旋转不变编码方法在待分类目标转换后,仍能保持编码结果不变。
S104、拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,并基于特征表示进行图像分类任务。
在一种具体实施方式中,拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,包括:为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。在一种示例中,利用公式R=a×A+b×B+c×C+d×D可得到拼接后的待分类目标的特征表示。其中,R表示拼接结果,A表示轮廓形态特征,B表示轮廓形状分布特征,C表示轮廓颜色特征,D表示轮廓纹理特征,a为轮廓形态特征的权重系数,b为轮廓形状分布特征的权重系数,c为轮廓颜色特征的权重系数,d为轮廓纹理特征的权重系数。a、b、c、d均在[0,1]区间取值,值越大,相应特征对拼接结果的影响越大。其中,a+b+c+d=1。公式R中的“+”表示:特征的拼接或连接。
在一种具体实施方式中,基于特征表示进行图像分类任务,包括:将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。在一种具体实施方式中,基于特征表示进行图像分类任务,包括:将特征表示作为训练样本训练得到图像分类模型。可见,拼接四种特征得到的待分类目标的特征表示可以用于确定相应图像的类别,也可以作为模型的训练样本来训练图像分类模型、图像识别模型等。
其中,图像分类模型、图像识别模型可以采用机器学习方法或深度学习方法训练得到。机器学习方法具体可以使用SVM、决策树等算法。深度学习方法具体可以使用神经网络等模型结构。训练需要用的损失函数可以灵活选择。
本实施例在确定待处理图像中的待分类目标后,进一步确定待分类目标的轮廓像素点集,然后基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,再拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,最后基于特征表示进行图像分类任务。
可见,本实施例使用图像中待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征的组合作为待分类目标的特征表示,可使表示待分类目标的特征同时包含全局、局部、形状、颜色、纹理等特征信息,丰富了特征类型和特征信息量。同时,由于上述各特征均基于待分类目标的轮廓像素点集进行计算,而没有以待分类目标的全局像素为计算基础,因此降低了特征提取计算量。本实施例通过提取更多类型的特征提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,从而降低了特征提取的计算量。
下述实施例基于本申请的核心思想,提供了一种基于多特征融合的目标识别方法。该方法通过多种类型的特征融合来增加和丰富特征信息,同时以轮廓点的周边为计算基础,提取轮廓点形态特征及分布特征、轮廓点所在区域的颜色特征及纹理特征,以减少特征提取计算量。其中,融合上述轮廓点形态特征及分布特征、轮廓点所在区域的颜色特征及纹理特征,可实现全局特征和局部特征的融合,从而提高特征的可区分性。
下面详细阐述本实施例提供的目标识别方法。目标识别的处理流程包括三步:预处理、特征提取以及目标分类。
一、预处理。
预处理是为了去除与目标无关的信息,增强目标相关信息。请参见图3,本实施例提供的预处理步骤包括:将RGB图像变换成HSV图像,然后采用OSTU阈值分割方法得到二值化图像,获取待识别目标所在区域,然后采用轮廓检测获取待识别目标的边缘轮廓。针对待识别目标的边缘轮廓,提取全局的轮廓形态属性特征(即轮廓形态特征)、轮廓的梯度方向直方图特征(即轮廓形状分布特征)、轮廓的颜色直方图特征(即轮廓颜色特征)、轮廓的LBP直方图特征(即轮廓纹理特征),这些特征可以描述待识别目标区域和待识别目标边缘轮廓的相关信息,因此将这些特征融合在一起作为待识别目标的特征表示。融合不同特征时可以将不同特征直接拼接起来。
其中,针对HSV空间的HSV图像,H表示色调,S表示饱和度,V表示亮度。考虑白色背景,在V通道上进行阈值分割,可以将待识别目标和背景分割开,得到待识别目标的二值化图像,而二值化图像的边界即为待识别目标的边缘轮廓。具体的,对二值化图像进行轮廓检测即可得到待识别目标的边缘轮廓。
二、特征提取。
上一步的预处理得到了待识别目标所在区域以及待识别目标边缘轮廓,本步骤据此进行特征提取。具体提取四种特征:轮廓形态属性特征,轮廓点的梯度方向直方图特征,轮廓点的颜色直方图特征,轮廓点的LBP直方图特征。其中,轮廓形态属性特征为全局形状特征,轮廓点的梯度方向直方图特征为局部形状特征,轮廓点的颜色直方图特征为颜色特征,轮廓点的LBP直方图特征为纹理特征。这四种类型的特征相互补充,将这四种特征融合在一起,可以增强特征的可区分性,进而提高识别准确性。
1、提取轮廓形态属性特征。
轮廓形态特征主要包括轮廓的几何形态特征和凹凸属性。几何形态特征包括宽长比特征、矩形度特征、圆度特征、圆形特征。凹凸属性特征包括紧固性和凸性。
宽长比为轮廓的最小外接矩形的长宽比值,假设长、宽分别为
Figure 584802DEST_PATH_IMAGE001
Figure 425719DEST_PATH_IMAGE002
,那么矩形宽长比
Figure 27602DEST_PATH_IMAGE003
用公式表示为:
Figure 612167DEST_PATH_IMAGE004
。需要说明的是,宽长比反映了轮廓的整体形状,宽长比越接近于0,轮廓形状越“瘦长”,宽长比越接近于1,轮廓形状越“粗短”。
矩形度描述形状和矩形的相似程度,假设轮廓的面积为
Figure 45422DEST_PATH_IMAGE005
,其对应的最小外接矩形的面积为
Figure 322820DEST_PATH_IMAGE006
,那么矩形度
Figure 146420DEST_PATH_IMAGE007
用公式表示为:
Figure 269096DEST_PATH_IMAGE008
。需要说明的是,矩形度越接近于1,轮廓的形状越接近于矩形。
圆度描述形状接近圆形的程度,假设轮廓的面积为
Figure 497471DEST_PATH_IMAGE005
,最小外接圆的半径为
Figure 680191DEST_PATH_IMAGE009
,那么圆度
Figure 991086DEST_PATH_IMAGE010
用公式表示为:
Figure 183033DEST_PATH_IMAGE011
。需要说明的是,圆度越接近于1,轮廓形状越接近于圆形。
圆形描述形状的圆形程度,假设轮廓的面积为
Figure 262985DEST_PATH_IMAGE005
,轮廓的周长为
Figure 616606DEST_PATH_IMAGE012
,那么圆形特征
Figure 680377DEST_PATH_IMAGE013
用公式表示为:
Figure 144856DEST_PATH_IMAGE014
。其中,当
Figure 344893DEST_PATH_IMAGE015
接近于1,表示轮廓是一个完美的圆形,当
Figure 134995DEST_PATH_IMAGE015
趋近于0,表示轮廓形状是一个接近于直线的多边形或者矩形。
紧固性被定义为轮廓面积和凸包面积的比值,凸包是包围轮廓的凸多边形,凸包的面积为
Figure 420482DEST_PATH_IMAGE016
,那么紧固性
Figure 954232DEST_PATH_IMAGE017
用公式表示为:
Figure 8776DEST_PATH_IMAGE018
凸性被定义为轮廓周长和凸包周长的比值,假设轮廓的周长为
Figure 704199DEST_PATH_IMAGE012
,凸包周长为
Figure 476983DEST_PATH_IMAGE019
,那么凸性特征
Figure 817353DEST_PATH_IMAGE020
用公式表示为:
Figure 726403DEST_PATH_IMAGE021
2、提取轮廓点的梯度方向直方图特征。
在本步骤中,梯度方向直方图描述轮廓点位置附近的像素梯度方向和幅值分布情况,因此本步骤中的梯度方向直方图不将整个待识别目标作为特征提取区域,只计算目标的轮廓点位置的梯度方向直方图。
具体可以采用Sobel边缘检测算子来计算梯度,Sobel属于一阶微分算子,可以计算像素邻近区域的灰度差,实际运算中采用固定的卷积模板对图像进行卷积运算来计算梯度。Sobel算子可以由2个5×5的卷积模板
Figure 592728DEST_PATH_IMAGE022
组成,
Figure 852808DEST_PATH_IMAGE023
卷积模板对水平边缘(
Figure 728360DEST_PATH_IMAGE024
方向)的响应最大,而
Figure 491917DEST_PATH_IMAGE025
卷积模板对垂直边缘(
Figure 794722DEST_PATH_IMAGE026
方向)的响应最大。
在一种示例中,卷积模板
Figure 276519DEST_PATH_IMAGE023
如下所示:
Figure 690183DEST_PATH_IMAGE027
在一种示例中,卷积模板
Figure 573826DEST_PATH_IMAGE025
如下所示:
Figure 516374DEST_PATH_IMAGE028
在本步骤中,基于V(亮度)通道进行Sobel边缘检测,采用5×5的卷积模板对图像
Figure 751046DEST_PATH_IMAGE029
中的轮廓点集合
Figure 233980DEST_PATH_IMAGE030
对应的位置进行卷积运算。具体地,对于第
Figure 972129DEST_PATH_IMAGE031
个轮廓点
Figure 616737DEST_PATH_IMAGE032
的梯度计算,以
Figure 807547DEST_PATH_IMAGE032
为中心提取其5×5邻域内的图像
Figure 565943DEST_PATH_IMAGE029
的像素值,记为矩阵
Figure 424177DEST_PATH_IMAGE033
,将其分别与卷积模板
Figure 239687DEST_PATH_IMAGE023
Figure 917793DEST_PATH_IMAGE025
进行卷积计算,用公式表示:
Figure 476950DEST_PATH_IMAGE034
Figure 924112DEST_PATH_IMAGE035
。其中,运算符号*表示两个矩阵中所有对应位置的元素相乘并求和。下一步根据
Figure 910522DEST_PATH_IMAGE024
方向的梯度
Figure 341504DEST_PATH_IMAGE036
Figure 173193DEST_PATH_IMAGE026
方向的梯度
Figure 740441DEST_PATH_IMAGE037
计算梯度幅值
Figure 897753DEST_PATH_IMAGE038
和梯度方向
Figure 550451DEST_PATH_IMAGE039
,计算公式为:
Figure 451411DEST_PATH_IMAGE040
本步骤中的梯度方向直方图计算,是统计所有轮廓点的梯度方向分布情况。具体步骤包括:将所有轮廓点的梯度方向
Figure 873165DEST_PATH_IMAGE039
(弧度,
Figure 201378DEST_PATH_IMAGE041
)量化到
Figure 341373DEST_PATH_IMAGE042
个方向,梯度方向量化的公式为:
Figure 514865DEST_PATH_IMAGE043
。其中,
Figure 56705DEST_PATH_IMAGE031
表示轮廓点的下标,
Figure 148547DEST_PATH_IMAGE044
的取值范围为
Figure 775837DEST_PATH_IMAGE045
。然后,统计每个梯度方向的像素点的数目和概率,并以梯度幅值进行加权,加权公式为:
Figure 18600DEST_PATH_IMAGE046
Figure 883788DEST_PATH_IMAGE047
表示轮廓点的数目,
Figure 553803DEST_PATH_IMAGE048
即为梯度方向直方图,直方图横轴为的
Figure 668390DEST_PATH_IMAGE048
下标,表示梯度方向,纵轴为
Figure 714843DEST_PATH_IMAGE048
的元素,表示每个梯度方向上的轮廓点的分布情况,即梯度方向直方图特征数据。
3、提取轮廓点的颜色直方图特征。
颜色特征是目标识别的关键特征,本步骤将所有轮廓点的邻域作为特征区域进行颜色分布统计,可以描述轮廓点周围的颜色分布情况。由于H(色调)通道描述图像颜色信息,因而对轮廓点周围的色调强度进行颜色分布统计。
首先,提取轮廓点集合
Figure 231275DEST_PATH_IMAGE030
中所有轮廓点所在矩形邻域内的色调强度,矩形邻域记为
Figure 72192DEST_PATH_IMAGE049
,大小记为
Figure 611758DEST_PATH_IMAGE050
,轮廓点
Figure 196323DEST_PATH_IMAGE032
所在矩形邻域的色调强度记为
Figure 567262DEST_PATH_IMAGE051
Figure 579080DEST_PATH_IMAGE051
的第
Figure 464996DEST_PATH_IMAGE052
个像素点的色调强度记为
Figure 587673DEST_PATH_IMAGE053
Figure 78697DEST_PATH_IMAGE031
的取值范围为
Figure 261417DEST_PATH_IMAGE054
Figure 575242DEST_PATH_IMAGE052
的取值范围为
Figure 501610DEST_PATH_IMAGE055
。其中,以每一个轮廓点为中心点,可以构建一个矩形区域,一个矩形区域的面积可以预设。
然后,对所有矩形邻域内的像素点的色调强度进行灰度级量化,灰度级量化数目为
Figure 50403DEST_PATH_IMAGE056
,灰度级量化公式为:
Figure 404024DEST_PATH_IMAGE057
。其中,
Figure 202216DEST_PATH_IMAGE058
的取值范围为
Figure 932274DEST_PATH_IMAGE059
最后,统计所有量化灰度级对应的像素点的概率,计算公式为:
Figure 397891DEST_PATH_IMAGE060
。其中,
Figure 922413DEST_PATH_IMAGE048
即为颜色直方图,直方图横轴为的
Figure 801376DEST_PATH_IMAGE061
下标,表示灰度级,纵轴为
Figure 335126DEST_PATH_IMAGE048
的元素,表示每个灰度级上的像素点概率,即颜色直方图特征数据。
4、提取轮廓点的LBP直方图特征。
本步骤选择S(饱和度)通道的强度作为像素点的灰度值,只对轮廓点邻域内的像素点进行LBP编码,然后统计LBP直方图。LBP直方图可以描述特征区域内灰度变化方向的编码模式。
首先,提取轮廓点集合
Figure 592932DEST_PATH_IMAGE030
中所有轮廓点所在矩形邻域的饱和度强度值,轮廓点
Figure 288355DEST_PATH_IMAGE032
所在矩形邻域的饱和度强度记为
Figure 61139DEST_PATH_IMAGE062
,矩形邻域的配置和颜色直方图一样,
Figure 133000DEST_PATH_IMAGE031
的取值范围为
Figure 307630DEST_PATH_IMAGE054
Figure 442464DEST_PATH_IMAGE052
的取值范围为
Figure 436964DEST_PATH_IMAGE055
。以
Figure 312516DEST_PATH_IMAGE062
中的第
Figure 279335DEST_PATH_IMAGE052
个像素点为中心,提取其
Figure 582141DEST_PATH_IMAGE063
邻域内的饱和度强度,记为
Figure 63938DEST_PATH_IMAGE064
Figure 743181DEST_PATH_IMAGE065
。其中,矩阵元素
Figure 626823DEST_PATH_IMAGE066
表示饱和度强度值。
然后,对
Figure 100530DEST_PATH_IMAGE062
中的第
Figure 69623DEST_PATH_IMAGE052
个像素点进行LBP编码。一种可用的LBP编码方式包括:以
Figure 286978DEST_PATH_IMAGE067
为中心,将其周围的8个饱和度值逐个与
Figure 228389DEST_PATH_IMAGE067
比较,若大于
Figure 669734DEST_PATH_IMAGE067
,对应位置标记为1,否则标记为0,得到8个二进制数字,按照
Figure 860544DEST_PATH_IMAGE068
Figure 616011DEST_PATH_IMAGE069
Figure 474245DEST_PATH_IMAGE070
Figure 289755DEST_PATH_IMAGE071
Figure 236369DEST_PATH_IMAGE072
Figure 795527DEST_PATH_IMAGE073
Figure 711530DEST_PATH_IMAGE074
Figure 494678DEST_PATH_IMAGE075
的顺序排列8个二进制数字,即可得到一个8bit的二进制数,称为LBP编码,将其转换成一个0~255范围的十进制数,记为
Figure 660080DEST_PATH_IMAGE076
。考虑到方向旋转问题,可以优先采用旋转不变LBP编码方法,在上述LBP编码的基础上,不断地对二进制数进行循环移位,得到一系列的LBP特征值,从这些LBP编码值中选择一个最小值作为该位置的LBP编码。
最后,统计所有像素点的LBP分布情况,由于LBP编码值范围在0~255,特征维度大,因而需要先对LBP编码值进行量化,量化数目为
Figure 757349DEST_PATH_IMAGE077
,量化公式为
Figure 590176DEST_PATH_IMAGE078
。其中,
Figure 950750DEST_PATH_IMAGE079
的取值范围为
Figure 603449DEST_PATH_IMAGE080
。然后统计所有量化LBP编码对应的像素点的概率,计算公式为:
Figure 504409DEST_PATH_IMAGE081
。其中,
Figure 457321DEST_PATH_IMAGE048
即为LBP直方图,直方图横轴为的
Figure 785534DEST_PATH_IMAGE048
下标,表示LBP编码值,纵轴为
Figure 925529DEST_PATH_IMAGE048
的元素,表示每个LBP编码值对应的像素点概率,即LBP直方图特征数据。
5、融合特征。
融合轮廓形态属性特征,轮廓点的梯度方向直方图特征,轮廓点的颜色直方图特征,轮廓点的LBP直方图特征,得到待识别目标的特征表示。
三、目标分类。
请参见图4,本步骤采用SVM作为分类器模型,利用融合得到的特征表示作为样本数据,对该模型进行训练和推理。也即:将特征提取过程获得的轮廓形态属性特征、梯度方向直方图特征、颜色直方图特征和LBP直方图特征融合在一起,作为SVM分类器的输入,经过SVM模型训练和推理,获取原图像的分类结果。SVM分类模型是一个二分类模型,主要思想是学习若干个分类超平面
Figure 364600DEST_PATH_IMAGE082
,在特征空间中对全部训练样本按照类别进行划分,从而实现正确分类,和其他机器学习算法相比,SVM算法具有较好的泛化能力。
可见,本实施例提取的特征包含了全局、局部、形状、颜色、纹理等特征信息,提高了特征类型的丰富性;并且,这些特征均围绕轮廓点周围进行特征确定,而不以目标全局像素为基础,因此能减少特征提取的计算量。
下述实施例以果蔬图像为例,对本申请提供的方案做进一步介绍。在本实施例中,针对果蔬图像中的果蔬进行分类,可以具体包括以下步骤:
1、获取果蔬图像。
2、图像预处理,提取果蔬所在区域和边缘轮廓。
3、提取果蔬轮廓的全局形状特征、局部形状特征、颜色特征和纹理特征,并进行特征融合。
4、基于SVM算法训练分类模型,并利用训练好的分类模型进行果蔬分类。
其中,果蔬轮廓的全局形状特征即轮廓形态特征,包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。其中,果蔬轮廓的局部形状特征即轮廓形状分布特征,该特征的确定过程包括:计算轮廓像素点集中每个像素点的梯度方向;基于各像素点的梯度方向确定轮廓形状分布特征。其中,果蔬轮廓的颜色特征即轮廓颜色特征,该特征的确定过程包括:计算轮廓像素点集中每个像素点所在邻域的色调大小;分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。其中,果蔬轮廓的纹理特征即轮廓纹理特征,该特征的确定过程包括:采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。上述各特征更为具体的计算提取步骤及公式可参照上述实施例的相关介绍。
在本实施例中,果蔬轮廓的局部形状特征用梯度方向直方图表示,果蔬轮廓的梯度方向直方图可参见图5。果蔬轮廓的颜色特征用颜色直方图表示,果蔬轮廓的颜色直方图可参见图6。果蔬轮廓的纹理特征用LBP直方图表示,果蔬轮廓的LBP直方图可参见图7。图5、图6、图7的纵坐标均表示概率分布的大小。图5的横坐标表示梯度方向,图5横坐标上的数值0~16为:对原始梯度方向量化得到的数值。图6的横坐标表示颜色强度,图6横坐标上的数值0~60为:对原始颜色值量化得到的数值,例如:将颜色值从0~255量化为0~63。图7的横坐标表示LBP编码值大小,图7横坐标上的数值0~60为:对原始LBP编码量化得到的数值,例如:将LBP编码从0~255量化为0~63。更为详细的介绍可参照上述实施例,本实施例不再赘述。
其中,本实施例采用SVM作为分类器模型,将特征提取过程获取的所有特征数据连接一起作为SVM的输入,模型的优化可采用C类SVM模型、非线性分类、rbf核函数、网格搜索方法等方式,以搜索最优的模型参数C和gama。
可见,本实施例针对果蔬轮廓仍能够提取出包含全局、局部、形状、颜色、纹理的特征信息,保证了丰富的特征类型和特征信息量,既增强了局部区域的特征信息,又减少了特征提取的计算量。
下面对本申请实施例提供的一种图像处理装置进行介绍,下文描述的一种图像处理装置与上文描述的一种图像处理方法可以相互参照。
参见图8所示,本申请实施例公开了一种图像处理装置,包括:
图像获取模块801,用于获取待处理图像,并确定待处理图像中的待分类目标;
第一确定模块802,用于确定待分类目标的轮廓像素点集;
第二确定模块803,用于基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
图像分类模块804,用于拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,并基于特征表示进行图像分类任务。
在一种具体实施方式中,图像获取模块具体用于:
将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。
在一种具体实施方式中,图像获取模块具体用于:
采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。
在一种具体实施方式中,第一确定模块具体用于:
利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。
在一种具体实施方式中,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
在一种具体实施方式中,轮廓形状分布特征的确定过程包括:
计算轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定轮廓形状分布特征。
在一种具体实施方式中,轮廓颜色特征的确定过程包括:
计算轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。
在一种具体实施方式中,轮廓纹理特征的确定过程包括:
对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。
在一种具体实施方式中,对轮廓像素点集中每个像素点的邻域进行LBP编码,包括:
采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码。
在一种具体实施方式中,图像分类模块具体用于:
为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;
按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。
在一种具体实施方式中,图像分类模块具体用于:
将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。
在一种具体实施方式中,图像分类模块具体用于:
将特征表示作为训练样本训练得到图像分类模型。
其中,关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本实施例提供了一种图像处理装置,通过提取更多类型的特征提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,从而降低了特征提取的计算量。
下面对本申请实施例提供的一种图像处理设备进行介绍,下文描述的一种图像处理设备与上文描述的一种图像处理方法及装置可以相互参照。
参见图9所示,本申请实施例公开了一种图像处理设备,包括:
存储器901,用于保存计算机程序;
处理器902,用于执行所述计算机程序,以实现上述任意实施例公开的方法。
在本实施例中,图像处理设备在执行计算机程序时,可以实现以下步骤:获取待处理图像,并确定待处理图像中的待分类目标;确定待分类目标的轮廓像素点集;基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,并基于特征表示进行图像分类任务。其中,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:计算轮廓像素点集中每个像素点的梯度方向;基于各像素点的梯度方向确定轮廓形状分布特征。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:计算轮廓像素点集中每个像素点所在邻域的色调大小;分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。
在一种具体实施方式中,图像处理设备在执行计算机程序时,可以实现以下步骤:将特征表示作为训练样本训练得到图像分类模型。
可见,本实施例提取的特征包含了全局、局部、形状、颜色、纹理等特征信息,提高了特征类型的丰富性;并且,这些特征均围绕轮廓点周围进行特征确定,而不以目标全局像素为基础,因此能减少特征提取的计算量。
进一步的,本申请实施例提供的图像处理设备可以是服务器,也可以是终端。
当图像处理设备是服务器时,该服务器具体可以包括:至少一个处理器、至少一个存储器、电源、通信接口、输入输出接口和通信总线。其中,存储器用于存储计算机程序,计算机程序由处理器加载并执行,以实现前述任一实施例公开的相应方法。电源用于为服务器上的各硬件设备提供工作电压;通信接口能够为服务器创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。存储器作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统、计算机程序及数据等,存储方式可以是短暂存储或者永久存储。其中,操作系统用于管理与控制服务器上的各硬件设备以及计算机程序,以实现处理器对存储器中数据的运算与处理,其可以是Windows Server、Netware、Unix、Linux等。计算机程序除了包括能够用于完成前述任一实施例公开的方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据除了可以包括图像数据、模型参数等数据外,还可以包括应用程序的开发商信息等数据。
当图像处理设备是终端时,该终端具体可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。通常,本实施例中的终端包括有:处理器和存储器。其中,处理器可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。存储器可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器至少用于存储以下计算机程序,其中,该计算机程序被处理器加载并执行之后,能够实现前述任一实施例公开的由终端侧执行的方法中的相关步骤。另外,存储器所存储的资源还可以包括操作系统和数据等,存储方式可以是短暂存储或者永久存储。其中,操作系统可以包括Windows、Unix、Linux等。数据可以包括但不限于图像数据、模型参数等。在一些实施例中,终端还可包括有显示屏、输入输出接口、通信接口、传感器、电源以及通信总线。
下面对本申请实施例提供的一种可读存储介质进行介绍,下文描述的一种可读存储介质与上文描述的一种图像处理方法、装置及设备可以相互参照。
一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的图像处理方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容。
在本实施例中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:获取待处理图像,并确定待处理图像中的待分类目标;确定待分类目标的轮廓像素点集;基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,并基于特征表示进行图像分类任务。其中,轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:将待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到待分类目标的二值化图像。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:采用阈值分割方法分割变换后的图像的V通道,得到待分类目标的二值化图像。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:利用轮廓检测算法对待分类目标的二值化图像进行轮廓检测,得到轮廓像素点集。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:计算轮廓像素点集中每个像素点的梯度方向;基于各像素点的梯度方向确定轮廓形状分布特征。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:计算轮廓像素点集中每个像素点所在邻域的色调大小;分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到轮廓颜色特征。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:对轮廓像素点集中每个像素点的邻域进行LBP编码,得到轮廓纹理特征。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:采用旋转不变编码方法对轮廓像素点集中每个像素点的邻域进行LBP编码。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:为轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征分别分配权重系数;按照权重系数拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,得到特征表示。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:将特征表示输入训练完成的图像分类模型,以使图像分类模型输出待处理图像的类别。
在一种具体实施方式中,可读存储介质中的计算机程序被处理器执行时,可以实现以下步骤:将特征表示作为训练样本训练得到图像分类模型。
可见,本实施例提取的特征包含了全局、局部、形状、颜色、纹理等特征信息,提高了特征类型的丰富性;并且,这些特征均围绕轮廓点周围进行特征确定,而不以目标全局像素为基础,因此能减少特征提取的计算量。
本申请涉及的“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法或设备固有的其它步骤或单元。
需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的可读存储介质中。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (12)

1.一种图像处理方法,其特征在于,包括:
获取待处理图像,并确定所述待处理图像中的待分类目标;
确定所述待分类目标的轮廓像素点集;
基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务;
其中,所述轮廓形状分布特征的确定过程包括:
计算所述轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定所述轮廓形状分布特征;
其中,所述轮廓颜色特征的确定过程包括:
计算所述轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到所述轮廓颜色特征;
其中,所述轮廓纹理特征的确定过程包括:
对所述轮廓像素点集中每个像素点的邻域进行LBP编码,得到所述轮廓纹理特征。
2.根据权利要求1所述的图像处理方法,其特征在于,所述确定所述待处理图像中的待分类目标,包括:
将所述待处理图像变换至HSV空间,并对变换后的图像进行目标分割,得到所述待分类目标的二值化图像。
3.根据权利要求2所述的图像处理方法,其特征在于,所述对变换后的图像进行目标分割,得到所述待分类目标的二值化图像,包括:
采用阈值分割方法分割变换后的图像的V通道,得到所述待分类目标的二值化图像。
4.根据权利要求1所述的图像处理方法,其特征在于,所述确定所述待分类目标的轮廓像素点集,包括:
利用轮廓检测算法对所述待分类目标的二值化图像进行轮廓检测,得到所述轮廓像素点集。
5.根据权利要求1所述的图像处理方法,其特征在于,所述轮廓形态特征包括几何形态特征、紧固性特征和凸性特征中的任一种或组合;其中,所述几何形态特征包括宽长比特征、矩形度特征、圆度特征和圆形特征中的任一种或组合。
6.根据权利要求1所述的图像处理方法,其特征在于,所述对所述轮廓像素点集中每个像素点的邻域进行LBP编码,包括:
采用旋转不变编码方法对所述轮廓像素点集中每个像素点的邻域进行LBP编码。
7.根据权利要求1所述的图像处理方法,其特征在于,所述拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,包括:
为所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征分别分配权重系数;
按照所述权重系数拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征,得到所述特征表示。
8.根据权利要求1至7任一项所述的图像处理方法,其特征在于,所述基于所述特征表示进行图像分类任务,包括:
将所述特征表示输入训练完成的图像分类模型,以使所述图像分类模型输出所述待处理图像的类别。
9.根据权利要求1至7任一项所述的图像处理方法,其特征在于,所述基于所述特征表示进行图像分类任务,包括:
将所述特征表示作为训练样本训练得到图像分类模型。
10.一种图像处理装置,其特征在于,包括:
图像获取模块,用于获取待处理图像,并确定所述待处理图像中的待分类目标;
第一确定模块,用于确定所述待分类目标的轮廓像素点集;
第二确定模块,用于基于所述轮廓像素点集确定所述待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征;
图像分类模块,用于拼接所述轮廓形态特征、所述轮廓形状分布特征、所述轮廓颜色特征和所述轮廓纹理特征得到所述待分类目标的特征表示,并基于所述特征表示进行图像分类任务;
其中,所述轮廓形状分布特征的确定过程包括:
计算所述轮廓像素点集中每个像素点的梯度方向;
基于各像素点的梯度方向确定所述轮廓形状分布特征;
其中,所述轮廓颜色特征的确定过程包括:
计算所述轮廓像素点集中每个像素点所在邻域的色调大小;
分别对各像素点所在邻域的色调大小进行灰度级量化,并统计量化得到的各灰度级的像素点占比,得到所述轮廓颜色特征;
其中,所述轮廓纹理特征的确定过程包括:
对所述轮廓像素点集中每个像素点的邻域进行LBP编码,得到所述轮廓纹理特征。
11.一种图像处理设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至9任一项所述的图像处理方法。
12.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的图像处理方法。
CN202210942303.XA 2022-08-08 2022-08-08 一种图像处理方法、装置、设备及可读存储介质 Active CN114998614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210942303.XA CN114998614B (zh) 2022-08-08 2022-08-08 一种图像处理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210942303.XA CN114998614B (zh) 2022-08-08 2022-08-08 一种图像处理方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN114998614A CN114998614A (zh) 2022-09-02
CN114998614B true CN114998614B (zh) 2023-01-24

Family

ID=83023210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210942303.XA Active CN114998614B (zh) 2022-08-08 2022-08-08 一种图像处理方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114998614B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117765528A (zh) * 2023-12-04 2024-03-26 北京霍里思特科技有限公司 一种用于对目标物进行分类的方法、设备和存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218831A (zh) * 2013-04-21 2013-07-24 北京航空航天大学 一种基于轮廓约束的视频运动目标分类识别方法
CN103473537A (zh) * 2013-09-17 2013-12-25 湖北工程学院 一种目标图像轮廓特征表示方法及装置
CN103679169A (zh) * 2012-09-10 2014-03-26 华为技术有限公司 图像特征的提取方法及装置
CN107730487A (zh) * 2017-09-27 2018-02-23 浙江大华技术股份有限公司 一种图像检测方法及装置
CN109102004A (zh) * 2018-07-23 2018-12-28 鲁东大学 棉花害虫识别分类方法及装置
WO2019062092A1 (zh) * 2017-09-30 2019-04-04 深圳市颐通科技有限公司 基于超像素-多色彩空间的人体轮廓提取方法
JP2019057111A (ja) * 2017-09-21 2019-04-11 カシオ計算機株式会社 輪郭検出装置、描画装置、輪郭検出方法及び輪郭検出プログラム
CN110321452A (zh) * 2019-05-05 2019-10-11 广西师范大学 一种基于方向选择机制的图像检索方法
CN111046202A (zh) * 2019-12-16 2020-04-21 广西师范大学 基于hsv颜色空间特有属性的图像检索方法
CN111275728A (zh) * 2020-04-10 2020-06-12 常州市第二人民医院 一种基于主动形状模型的前列腺轮廓提取方法
CN112052839A (zh) * 2020-10-10 2020-12-08 腾讯科技(深圳)有限公司 图像数据处理方法、装置、设备以及介质
CN112464850A (zh) * 2020-12-08 2021-03-09 东莞先知大数据有限公司 图像处理方法、装置、计算机设备及介质
CN112990316A (zh) * 2021-03-18 2021-06-18 浪潮云信息技术股份公司 基于多显著性特征融合的高光谱遥感图像分类方法及系统
CN113554037A (zh) * 2021-07-14 2021-10-26 广联达科技股份有限公司 一种基于模型简化的特征提取方法及装置
CN113837037A (zh) * 2021-09-09 2021-12-24 广东浪潮智慧计算技术有限公司 一种植物种类识别方法、系统、电子设备及存储介质
CN114299299A (zh) * 2021-11-29 2022-04-08 苏州浪潮智能科技有限公司 一种树叶特征提取方法、装置、计算机设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969171A (zh) * 2019-12-12 2020-04-07 河北科技大学 基于改进卷积神经网络的图像分类模型、方法及应用
CN112200738A (zh) * 2020-09-29 2021-01-08 平安科技(深圳)有限公司 形状的突起识别方法、装置以及计算机设备
CN113963041A (zh) * 2021-08-30 2022-01-21 南京市晨枭软件技术有限公司 一种图像纹理识别方法及系统
CN113643287B (zh) * 2021-10-13 2022-03-01 深圳市巨力方视觉技术有限公司 水果的分拣方法、装置和计算机可读存储介质
CN113920324B (zh) * 2021-12-13 2022-04-01 广州思德医疗科技有限公司 图像识别方法、装置、电子设备及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679169A (zh) * 2012-09-10 2014-03-26 华为技术有限公司 图像特征的提取方法及装置
CN103218831A (zh) * 2013-04-21 2013-07-24 北京航空航天大学 一种基于轮廓约束的视频运动目标分类识别方法
CN103473537A (zh) * 2013-09-17 2013-12-25 湖北工程学院 一种目标图像轮廓特征表示方法及装置
JP2019057111A (ja) * 2017-09-21 2019-04-11 カシオ計算機株式会社 輪郭検出装置、描画装置、輪郭検出方法及び輪郭検出プログラム
CN107730487A (zh) * 2017-09-27 2018-02-23 浙江大华技术股份有限公司 一种图像检测方法及装置
WO2019062092A1 (zh) * 2017-09-30 2019-04-04 深圳市颐通科技有限公司 基于超像素-多色彩空间的人体轮廓提取方法
CN109102004A (zh) * 2018-07-23 2018-12-28 鲁东大学 棉花害虫识别分类方法及装置
CN110321452A (zh) * 2019-05-05 2019-10-11 广西师范大学 一种基于方向选择机制的图像检索方法
CN111046202A (zh) * 2019-12-16 2020-04-21 广西师范大学 基于hsv颜色空间特有属性的图像检索方法
CN111275728A (zh) * 2020-04-10 2020-06-12 常州市第二人民医院 一种基于主动形状模型的前列腺轮廓提取方法
CN112052839A (zh) * 2020-10-10 2020-12-08 腾讯科技(深圳)有限公司 图像数据处理方法、装置、设备以及介质
CN112464850A (zh) * 2020-12-08 2021-03-09 东莞先知大数据有限公司 图像处理方法、装置、计算机设备及介质
CN112990316A (zh) * 2021-03-18 2021-06-18 浪潮云信息技术股份公司 基于多显著性特征融合的高光谱遥感图像分类方法及系统
CN113554037A (zh) * 2021-07-14 2021-10-26 广联达科技股份有限公司 一种基于模型简化的特征提取方法及装置
CN113837037A (zh) * 2021-09-09 2021-12-24 广东浪潮智慧计算技术有限公司 一种植物种类识别方法、系统、电子设备及存储介质
CN114299299A (zh) * 2021-11-29 2022-04-08 苏州浪潮智能科技有限公司 一种树叶特征提取方法、装置、计算机设备和存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A Novel Pedestrian Detection Method Based on Combination of LBP, HOG, and Haar-Like Features;Mina Etehadi Abari;《2018 IEEE International Conference on Electro/Information Technology (EIT)》;20181021;1-12 *
Symmetric Image Contents Analysis and Retrieval Using Decimation, Pattern Analysis, Orientation, and Features Fusion;Khawaja Tehseen Ahmed等;《IEEE Access》;20210420;第9卷;57215-57242 *
基于目标检测的图像检索技术研究;骆俊锋;《中国优秀硕士学位论文全文数据库 信息科技辑》;20220115;第2022年卷(第1期);I138-1360 *
基于计算机视觉的废旧塑料瓶分拣回收系统;赵远远;《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》;20210415;第2021年卷(第4期);B027-464 *

Also Published As

Publication number Publication date
CN114998614A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
Sirmacek et al. Urban-area and building detection using SIFT keypoints and graph theory
AU2006252025B2 (en) Recognition of parameterised shapes from document images
US9519660B2 (en) Information processing apparatus, clustering method, and recording medium storing clustering program
AU2006252019B2 (en) Method and Apparatus for Dynamic Connector Analysis
CN113160257B (zh) 图像数据标注方法、装置、电子设备及存储介质
CN107967482A (zh) 图标识别方法及装置
TW202207077A (zh) 一種文本區域的定位方法及裝置
CN114998614B (zh) 一种图像处理方法、装置、设备及可读存储介质
CN113160185A (zh) 一种利用生成边界位置指导宫颈细胞分割的方法
Durga Devi et al. Digital acquisition and character extraction from stone inscription images using modified fuzzy entropy-based adaptive thresholding
CN115033721A (zh) 基于大数据的图像检索方法
CN111199228B (zh) 一种车牌定位的方法及装置
Bell et al. Reflections on connoisseurship and computer vision
CN116543325A (zh) 基于无人机影像的农作物人工智能自动识别方法和系统
Gani et al. Copy move forgery detection using DCT, PatchMatch and cellular automata
Mohammed et al. Proposed approach for automatic underwater object classification
CN115205624A (zh) 一种跨维度注意力聚合的云雪辩识方法、设备及存储介质
Kurlin et al. A persistence-based approach to automatic detection of line segments in images
Henry et al. Near set index in an objective image segmentation evaluation framework
Nouri et al. Global visual saliency: Geometric and colorimetrie saliency fusion and its applications for 3D colored meshes
CN113837236A (zh) 图像中目标对象的识别方法、装置、终端设备及存储介质
Jenicka et al. Fuzzy texture model and support vector machine hybridization for land cover classification of remotely sensed images
Yazdan et al. Using geometric constraints to improve performance of image classifiers for automatic segmentation of traffic signs
Abdalla et al. Digital Image Processing Technology based on MATLAB.
Iisaka Unified image computing method for spectral and spatial feature extraction from remotely sensed imagery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant