CN110348521A - 图像处理聚类方法及其系统、电子设备 - Google Patents

图像处理聚类方法及其系统、电子设备 Download PDF

Info

Publication number
CN110348521A
CN110348521A CN201910632012.9A CN201910632012A CN110348521A CN 110348521 A CN110348521 A CN 110348521A CN 201910632012 A CN201910632012 A CN 201910632012A CN 110348521 A CN110348521 A CN 110348521A
Authority
CN
China
Prior art keywords
cluster
image
clustering
mask image
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910632012.9A
Other languages
English (en)
Inventor
张发恩
杨经宇
袁智超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innovation Qizhi (chongqing) Technology Co Ltd
Original Assignee
Innovation Qizhi (chongqing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Innovation Qizhi (chongqing) Technology Co Ltd filed Critical Innovation Qizhi (chongqing) Technology Co Ltd
Priority to CN201910632012.9A priority Critical patent/CN110348521A/zh
Publication of CN110348521A publication Critical patent/CN110348521A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明所提供的一种图像处理聚类方法,将遮罩图像进行尺寸缩小以获得需要聚类的数据,生成第一聚类数据集;对所述第一聚类数据集进行DBSCAN聚类处理后获得簇区域,并基于簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据;结合两部的聚类结果获得最终聚类结果。上述方法可实现大尺度样本快速聚类,还可实现对部分被大范围特征所覆盖的部分小区域特征可以被重新提取特征,从而可保证聚类结果的准确度。相比于现有聚类处理方法,上述方法可避免部分区域范围小、数量少的特征在聚类处理过程中被遗漏的问题。本发明还提供图像处理聚类系统及电子设备,两者具有与上述方法相同的有益效果。

Description

图像处理聚类方法及其系统、电子设备
【技术领域】
本发明涉及图像视觉处理领域,其特别涉及一种图像处理聚类方法及其系统、电子设备。
【背景技术】
在图像处理中,涉及到的方法包括,语义分割技术,传统图像视觉算法等。其中,以语义分割技术为例,对图像进行语义风格处理过程中,对每个像素都赋予标签,从而对每个像素都进行分类,而后可以对打了标签的像素进行聚类。但是现有聚类算法的精度与处理时间往往受图像尺寸,像素密度,参数设定等等许多因素影响,进而对整体模型产生重要的影响。
【发明内容】
为解决现有图像聚类处理不佳的技术问题,本发明提供一种图像处理聚类方法及其系统、电子设备。
本发明为解决上述技术问题,提供如下的技术方案:一种图像处理聚类方法,其包括:步骤S1,根据待处理图像生成含有语义标注的遮罩图像;步骤S2,将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;步骤S3,对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;步骤S4,将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及步骤S5,对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。
优选地,在上述步骤S1中,其中,所述遮罩图像包括大范围特征及小区域特征;在所述遮罩图像中每一像素点的坐标对应为待处理图像的原坐标,其数值为待处理图像对应像素点被赋予的语义标注。
优选地,在上述步骤S2中,具体包括:步骤S21,基于插值方法将遮罩图像进行尺寸缩小;步骤S22,对遮罩图像进行阈值处理以获得新的遮罩图像;及步骤S23,基于新的遮罩图像中提取需要聚类的数据,生成第一聚类数据集。
优选地,在上述步骤S3之前,还包括:步骤S20,根据图像特征与缩放倍率调整DBSCAN聚类处理中所需要的参数;所述DBSCAN聚类处理的参数主要包括参数MinPts和参数Eps。
优选地,在上述步骤S5中,可包括以下步骤:步骤S51,对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果;步骤S52,将所述第一聚类结果进行坐标逆变换,以映射得到真实聚类结果;及步骤S53,将第二聚类结果与真实聚类结果相结合,以输出最终聚类结果。
优选地,在步骤S1完成之后,还包括如下的步骤:步骤S01,从生成的遮罩图像中提取出需要聚类的数据,生成初始聚类数据集;步骤S02,对初始聚类数据集进行优化分析,并判断初始聚类数据集的样本总数是否大于等于预设数值;若是,则进入步骤S2,若否,则进入步骤S03;及步骤S03,对初始聚类数据集进行DBSCAN聚类处理获得聚类结果。
本发明为解决上述技术问题,提供又一技术方案如下:一种图像处理聚类系统,其包括:语义标注模块,被配置为用于根据待处理图像生成含有语义标注的遮罩图像;尺寸缩小数据提取模块,被配置为用于将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;第一聚类模块,被配置为用于对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;重新数据提取模块,被配置为用于将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及二次聚类模块,被配置为用于对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。
优选地,所述尺寸缩小数据提取模块进一步包括:尺寸缩小单元,被配置为用于基于插值方法将遮罩图像进行尺寸缩小;阈值处理单元,被配置为用于对遮罩图像进行阈值处理以获得新的遮罩图像;及数据聚类单元,被配置为用于基于新的遮罩图像中提取需要聚类的数据,生成第一聚类数据集。
优选地,所述图像处理聚类系统进一步包括:初始聚类模块,被配置为用于从生成的遮罩图像中提取出需要聚类的数据,生成初始聚类数据集;及样本总数判断模块,被配置为用于对初始聚类数据集进行优化分析,并判断初始聚类数据集的样本总数是否大于等于预设数值。
本发明为解决上述技术问题,提供又一技术方案如下:一种电子设备,其包括存储单元和处理单元,所述存储单元用于存储计算机程序,所述处理单元用于通过所述存储单元存储的计算机程序执行如上所述图像处理聚类方法。
与现有技术相比,本发明所提供给的一种图像处理聚类方法及其系统、电子设备具有如下的有益效果:
本发明所提供的图像处理聚类方法,是对现有DBSCAN算法进行改进,在兼顾千万像素级别样本快速聚类同时,还可以实现对设于大范围特征之内的小区域特征进行重新提取,从而可保证聚类结果的准确度。进一步地,基于本发明所提供的图像处理聚类方法相比于现有普通DBSCAN聚类处理方法,还可避免部分区域范围小、数量少的特征在聚类处理过程中被遗漏的问题。
在本发明中,根据待处理图像生成含有语义标注的遮罩图像;将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。在需要对较大尺度图像进行聚类处理时,在得到相同聚类结果的标准下,采用本发明所提供的图像处理聚类方法进行聚类处理,可降低其数据处理的复杂度。本发明专利所提出的图像处理聚类方法适用于各种较大尺度图像的聚类,以千万像素级别聚类为例,在得到相同聚类结果的标准下,聚类所用最长时间能够缩减到不足现有技术的一半甚至以下。
在本发明中,所述遮罩图像包括大范围特征及小区域特征;在所述遮罩图像中每一点的坐标对应为待处理图像的原坐标,其数值为待处理图像对应像素点被赋予的语义标注。可见,将遮罩图像中每一个点的坐标与原坐标对应,则可便于后续步骤针对遮罩图像的数据聚类结果进行坐标逆变换映射。
进一步地,在本发明中,基于插值方法将遮罩图像进行尺寸缩小;对遮罩图像进行阈值处理以获得新的遮罩图像;及基于新的遮罩图像中提取需要聚类的数据,生成第一聚类数据集。基于上述处理方法,可保证所述遮罩图像在利用插值方法进行缩小之后,保证新的遮罩图像可体现原遮罩图像的特点。
在上述步骤S3之前,还包括根据图像特征与缩放倍率调整DBSCAN聚类处理中所需要的参数;所述DBSCAN聚类处理的参数主要包括参数MinPts和参数Eps。基于上述处理方法可使DBSCAN聚类处理更能符合上述步骤S2中进行缩放后所获得的第一聚类数据集的特点,以获得更好的聚类效果。
在本发明中,在上述步骤S5中,还包括:对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果;将所述第一聚类结果进行坐标逆变换,以映射得到真实聚类结果;及将第二聚类结果与真实聚类结果相结合,以输出最终聚类结果。上述步骤将第一聚类结果转化为真实聚类结果将有利于提高所述聚类结果的准确度和全面性。
在所述图像处理聚类方法中包括从生成的遮罩图像中提取出需要聚类的数据,生成初始聚类数据集;对初始聚类数据集进行优化分析,并判断初始聚类数据集的样本总数是否大于等于预设数值;基于对初始聚类数据集的优化分析,可基于优化分析结果,确定对应的待处理图像应该使用何种处理方式更可以缩减整体处理的时间,并可保证聚类处理的春去额度。
本发明还提供一种图像处理聚类系统及一种电子设备,具有与上述图像处理聚类方法相同的有益效果,可解决像素点较多,且具有大范围的特征与小区域的特征的图像的快速问题,不仅可以使千万像素级别样本快速聚类,其对应所用最长时间将能够缩减到不足现有技术的一半甚至更低,同时还可以实现对部分被大范围特征所覆盖的部分小区域特征可以被重新提取特征,从而可保证聚类结果的准确度。
【附图说明】
图1是本发明第一实施例中所提供的图像处理聚类方法的步骤流程示意图。
图2是基于本发明第一实施例的一个应用实施例的示意图。
图3是图2中所述应用实施例的变形示意图。
图4是图1中所示步骤S2的具体步骤流程示意图。
图5是图1中所述步骤S2与步骤S3之间新增步骤的示意图。
图6是图1中所示步骤S5的具体步骤流程示意图。
图7是图1中所示图像处理聚类方法另一变形例中,步骤S1之后的具体步骤流程示意图。
图8是本发明第二实施例中所提供的图像处理聚类系统的功能模块示意图。
图9是图8中所示尺寸缩小数据提取模块的具体功能模块示意图。
图10是图8中所示二次聚类模块的具体功能模块示意图。
图11是本发明第二实施例中所提供的图像处理聚类系统的另一实施方式的功能模块示意图。
图12是本发明第三实施例中所提供的电子设备的功能模块示意图。
附图标识说明:
20、图像处理聚类系统;21、语义标注模块;22、尺寸缩小数据提取模块;23、第一聚类模块;24、重新数据提取模块;25、二次聚类模块;221、尺寸缩小单元;222、阈值处理单元;223、数据聚类单元;251、第二次聚类处理单元;252、聚类结果映射单元;253、聚类结果结合单元;28、初始聚类模块;29、样本总数判断模块;
30、电子设备;31、存储单元;32、处理单元。
【具体实施方式】
为了使本发明的目的,技术方案及优点更加清楚明白,以下结合附图及实施实例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明中所提供的,改进的DBSCAN聚类算法(Density-Based SpatialClustering of Applications with Noise)是一种基于密度的聚类算法,其与现有划分和层次聚类方法不同,其将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。
DBSCAN聚类算法中的几个定义:
Ε邻域:给定对象半径为Ε内的区域称为该对象的Ε邻域;
核心对象(Core Object):如果给定对象Ε邻域内的样本点数大于等于MinPts参数,则称该对象为核心对象;
直接密度可达(Directly Density-Reachable):对于样本集合D,如果样本点q在p的Ε邻域内,并且p为核心对象,那么对象q从对象p直接密度可达。
密度可达(Density-Reachable):对于样本集合D,给定一串样本点p1,p2….pn,p=p1,q=pn,假如对象pi从pi-1直接密度可达,那么对象q从对象p密度可达。
密度相连(Density-Connected):存在样本集合D中的一点o,如果对象o到对象p和对象q都是密度可达的,那么p和q密度相联。
可以发现,密度可达是直接密度可达的传递闭包,并且这种关系是非对称的。密度相连是对称关系。DBSCAN聚类算法的目的是找到密度相连对象的最大集合。
请参阅图1,本发明的第一实施例提供一种图像处理聚类方法S10,其包括以下步骤:
步骤S1,根据待处理图像生成含有语义标注的遮罩图像;
步骤S2,将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;
步骤S3,对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;
步骤S4,将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及
步骤S5,对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。
具体地,在上述步骤S1中根据待处理图像生成含有语义标注的遮罩图像可理解为使用深度学习等方法,生成需要聚类的数据集,数据集的形式可以表示为一个遮罩(mask)图像,在所述遮罩图像中每一像素点的坐标对应为待处理图像的原坐标,其数值为待处理图像对应像素点被赋予的语义标注。其中,所述语义标注可以理解为基于待处理图像的特点进行人工标注或者基于其他标注模型进行语义标注。其中,所述遮罩图像包括大范围特征及小区域特征。
例如,如有图2中所述,以用于生产线上的精密设备污损检测为例,在设备装配过程中,会出现如指纹、油污等大范围的脏污,也有部分小区域、少数量的细微擦伤。假设提供一待处理图像A,其中包括上述的大范围脏污以及小区域的细微擦伤,基于所述待处理图像A上的特点,将其转换成对应的多个遮罩图像S,对应的遮罩图像S可基于其语义标注的内容标注为多种数值,如图3中所示,假设其中遮罩图像P1对应的像素点的数值为1,其表示为小区域的细微擦伤,遮罩图像P2对应的像素点的数值为2,其表示为大范围的脏污,其中,遮罩图像P1位于遮罩图像P2之内;遮罩图像P3对应的像素点的数值为3,其表示为又一大范围的脏污。
结合图4中所示,在上述步骤S2中,具体包括:
步骤S21,基于插值方法将遮罩图像进行尺寸缩小;其目的是针对大尺寸,像素点有几千至几万以上的图像,为了缩减DBSCAN聚类处理的时间及运算量,则可将对应遮罩图像进行尺寸缩小。例如,在本实施例中将对应遮罩图像进行尺寸缩小使用的是图像插值法,图像插值是一种集合运算,其在缩放图像时可更改图像数据的数量,其具体可包括最邻近插值法(Nearest neighbor)、双线性插值法及双立方插值法。
为了进一步保证聚类精准程度则在对遮罩图像进行尺寸缩小时,需要注意缩小的倍率与所使用的插值方法,从而保证缩小后的所有样本点在原遮罩图像中所对应的区域能够覆盖原遮罩图像中的样本。
例如,结合上述例子,结合图4中所示以遮罩图像P2为例,例如把原遮罩图像P2缩小以获得新遮罩图像,其中,假设原遮罩图像P2具有5*5的数列,而缩小后的遮罩图像可表示为2*2的数列,而位于图像P2内的图像P1由于尺寸缩小的关系,将会被新的遮盖图像所覆盖。
步骤S22,对遮罩图像进行阈值处理以获得新的遮罩图像;其中,阈值处理可采用最优阈值化方法、otsu(大津算法)方法、自适应阈值化方法。其中,阈值处理的目的是保证所述遮罩图像在利用插值方法进行缩小之后,保证新的遮罩图像可体现原遮罩图像的特点。及
步骤S23,基于新的遮罩图像中提取需要聚类的数据,生成第一聚类数据集;可以理解,基于同一待处理图像可分为多个遮罩图像,其中,每个遮罩图像包括多种数据类型。
进一步地,为了获得更好的聚类效果,在本实施例中,如图5中所示,在步骤S2之后,在上述步骤S3之前,还包括:
步骤S20,根据图像特征与缩放倍率调整DBSCAN聚类处理中所需要的参数;
具体地,所述DBSCAN聚类处理的参数主要包括参数MinPts和参数Eps。这两个参数会影响整体的聚类效果,在本实施例中,根据上述图像特征与缩放的倍率对DBSCAN聚类处理进行调整,从而可使DBSCAN聚类处理更能符合上述步骤S2中进行缩放后所获得的第一聚类数据集的特点,以获得更好的聚类效果。
进一步地,在上述步骤S4中,所述第一聚类结果中的簇区域可以理解为密度相连的点的最大集合,因此能够把具有足够高密度的区域划分为簇区域。
基于所述簇区域在所述第一遮罩图像对应的坐标区域位置中删去语义标注,然后重新提取所述第一遮罩图像中需要聚类的数据以获得第二聚类数据集。
在本实施例中,上述步骤S4的目的是可将所述待处理图像中具有大范围对应的遮罩图像进行优化处理,而为了避免由于尺寸缩小处理而造成部分本应该被分为多种类型的特征被第二遮罩图像所覆盖,因此,需要将已经进行了初步聚类而获得的第一聚类结果中的簇区域去除之后,再重新提取所述第一遮罩图像中需要聚类的数据。
可以理解,上述步骤S4中目的是将在上述步骤S2及步骤S3中部分非核心的对象重新聚类,以解决样本数量分布不均匀所造成的聚类效果不好问题。其中,所述部分非核心的对象可理解为比例较小的部分特征。
具体地,即针对大范围的特征中,会存在被所述第二遮罩图像所覆盖的小区域的特征,而基于步骤S4,则可将这部分小区域的特征重新进行聚类形成数据集。
例如,结合上述例子,出现指纹,油污等大范围的脏污映射在遮蔽图像上成为远大于小脏污损伤的样本点区域,不仅密度集中,数量也非常大,因此,在进行上述步骤S2及步骤S3处理时,由于第一遮罩图像进行尺寸缩小后所获得的第二遮罩图像中,大范围的脏污映射会覆盖所述小脏污损伤的样本点区域(如图3及图4中所示例子),因此,部分小脏污损伤的样本点区域将无法被准确聚类,而对于在步骤S4中,则可将大范围的脏污对应在第一聚类结果中的簇区域对应的语义标注删除,从而可仅针对被其所覆盖的小脏污损伤的样本点区域进行进一步的DBSCAN聚类处理。
结合图6中所示,在上述步骤S5中,对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果,其中,由于所述第一聚类结果与所述第二聚类结果的图像尺寸不一致,因此,为了更好地将所述第一聚类结果与所述第二聚类结果相配合,则具体地,可包括以下步骤:
步骤S51,对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果;
步骤S52,将所述第一聚类结果进行坐标逆变换,以映射得到真实聚类结果;及
步骤S53,将第二聚类结果与真实聚类结果相结合,以输出最终聚类结果。
其中,在上述步骤S52中,将所述第一聚类结果进行坐标逆变换的映射,所述第二遮罩图像与所述第一遮罩图像之间基于坐标位置建立的映射关系。其具体可基于OpenCV函数、OpenGL函数等进行。
请继续参阅图7,为了更好地适应不同类型待处理图像的处理,在本发明一些具体实施例中,在步骤S1完成之后,还可包括如下的步骤:
步骤S01,从生成的遮罩图像中提取出需要聚类的数据,生成初始聚类数据集;
步骤S02,对初始聚类数据集进行优化分析,并判断初始聚类数据集的样本总数是否大于等于预设数值;若是,则进入步骤S2,若否,则进入步骤S03;及
步骤S03,对初始聚类数据集进行DBSCAN聚类处理获得聚类结果。
在上述步骤S01-步骤S03中,通过所述预设数值可基于具体待处理图像的特点设定可调参数优化样本总数的下限,并通过判定所述初始聚类数据集的样本总数是否超过该下限,如果未超过,则说明待处理图像中所需要处理的数据较少,可基于现有的DBSCAN聚类处理进行处理。
需要特别说明的是,DBSCAN聚类处理的时间复杂度表示为O(N*找到Eps领域中的点所需要的时间),N是点的个数。在一些例子中,所述DBSCAN聚类处理的时间复杂度可也可表示为O(n2),可见,所述DBSCAN聚类处理的时间复杂度与聚类的点的数量,也即样本总数有直接的关系,当n的数值较小时,对应DBSCAN聚类处理的时间复杂度随点数变化不大,而当n的数值为几百、几千甚至几万时,则DBSCAN聚类处理的时间复杂度将大大增大。尤其是在需要对较大尺度图像进行聚类处理时,以千万像素级别聚类为例,在得到相同聚类结果的标准下,采用本发明所提供的图像处理聚类方法进行聚类处理,其对应所用最长时间将能够缩减到不足现有技术的一半甚至更低。
采用本发明所提供的样本,除了可以兼顾千万像素级别样本快速聚类,还可基于上述步骤S4的处理,以实现对部分被大范围特征所覆盖的部分小区域特征可以被重新提取特征,从而可保证聚类结果的准确度,又可以极大的缩短了聚类所需要的时间。
请参阅图8,本发明的第二实施例提供一种图像处理聚类系统20,其包括:
语义标注模块21,被配置为用于根据待处理图像生成含有语义标注的遮罩图像;
尺寸缩小数据提取模块22,被配置为用于将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;
第一聚类模块23,被配置为用于对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;
重新数据提取模块24,被配置为用于将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及
二次聚类模块25,被配置为用于对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。
请参阅图9,所述尺寸缩小数据提取模块22进一步包括:
尺寸缩小单元221,被配置为用于基于插值方法将遮罩图像进行尺寸缩小;
阈值处理单元222,被配置为用于对遮罩图像进行阈值处理以获得新的遮罩图像;及
数据聚类单元223,被配置为用于基于新的遮罩图像中提取需要聚类的数据,生成第一聚类数据集。
具体,有关插值方法、阈值处理以及聚类的数据提取的相关内容与上述第一实施例中所述的一致,在此不再赘述。
请参阅图10,所述二次聚类模块25进一步包括:
第二次聚类处理单元251,被配置为用于对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果;
聚类结果映射单元252,被配置为用于将所述第一聚类结果进行坐标逆变换,以映射得到真实聚类结果;及
聚类结果结合单元253,被配置为用于将第二聚类结果与真实聚类结果相结合,以输出最终聚类结果。
请参阅图11,所述图像处理聚类系统20进一步包括:
初始聚类模块28,被配置为用于从生成的遮罩图像中提取出需要聚类的数据,生成初始聚类数据集;及
样本总数判断模块29,被配置为用于对初始聚类数据集进行优化分析,并判断初始聚类数据集的样本总数是否大于等于预设数值。
在本实施例中,有关具体DBSCAN聚类处理的相关内容与上述第一实施例中的相关描述一致,在此不再赘述。
请参阅图12,本发明的第三实施例提供一电子设备30,所述电子设备30包括存储单元31和处理单元32,所述存储单元31用于存储计算机程序,所述处理单元32用于通过所述存储单元31存储的计算机程序执行上述第一实施例中所述检验异常值的数据核验方法的具体步骤。
在本发明一些具体的实施例中,所述电子设备30可以是硬件,也可以是软件。当电子设备30为硬件时,可以是具有显示屏并且支持视频播放的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当电子设备30为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
所述存储单元31包括只读存储器(ROM)、随机访问存储器(RAM)及硬盘等的存储部分等,所述处理单元32可以根据存储在所述只读存储器(ROM)中的程序或者加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在随机访问存储器(RAM)中,还存储有所述电子设备30操作所需的各种程序和数据。
所述电子设备30还可包括键盘、鼠标等的输入部分(图未示);所述电子设备30还可进一步包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分(图未示);以及所述电子设备30可进一步包括诸如LAN卡、调制解调器等的网络接口卡的通信部分(图未示)。所述通信部分经由诸如因特网的网络执行通信处理。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明所公开的实施例可包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装。
在该计算机程序被所述处理单元32执行时,执行本申请的所述具备防伪功能的神经网络模型的训练方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本申请中,计算机可读存储介质还可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可采用一种或多种程序设计语言或其组合来编写用于执行本发明的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言--诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明的附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方案中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,在此基于涉及的功能而确定。需要特别注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本发明的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中。
作为另一方面,本发明的第四实施例还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,所述程序具体包括:根据待处理图像生成含有语义标注的遮罩图像;将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。
与现有技术相比,本发明所提供给的一种图像处理聚类方法及其系统、电子设备具有如下的有益效果:
本发明所提供的图像处理聚类方法,是对现有DBSCAN算法进行改进,在兼顾千万像素级别样本快速聚类同时,还可以实现对设于大范围特征之内的小区域特征进行重新提取,从而可保证聚类结果的准确度。进一步地,基于本发明所提供的图像处理聚类方法相比于现有普通DBSCAN聚类处理方法,还可避免部分区域范围小、数量少的特征在聚类处理过程中被遗漏的问题。
在本发明中,根据待处理图像生成含有语义标注的遮罩图像;将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。在需要对较大尺度图像进行聚类处理时,在得到相同聚类结果的标准下,采用本发明所提供的图像处理聚类方法进行聚类处理,可降低其数据处理的复杂度。本发明专利所提出的图像处理聚类方法适用于各种较大尺度图像的聚类,以千万像素级别聚类为例,在得到相同聚类结果的标准下,聚类所用最长时间能够缩减到不足现有技术的一半甚至以下。
本发明还提供一种图像处理聚类系统及一种电子设备,具有与上述图像处理聚类方法相同的有益效果,可解决像素点较多,且具有大范围的特征与小区域的特征的图像的快速问题,不仅可以使千万像素级别样本快速聚类,其对应所用最长时间将能够缩减到不足现有技术的一半甚至更低,同时还可以实现对部分被大范围特征所覆盖的部分小区域特征可以被重新提取特征,从而可保证聚类结果的准确度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内所作的任何修改,等同替换和改进等均应包含本发明的保护范围之内。

Claims (10)

1.一种图像处理聚类方法,其特征在于:所述图像处理聚类方法包括:
步骤S1,根据待处理图像生成含有语义标注的遮罩图像;
步骤S2,将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;
步骤S3,对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;
步骤S4,将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及
步骤S5,对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。
2.如权利要求1中所述图像处理聚类方法,其特征在于:在上述步骤S1中,其中,所述遮罩图像包括大范围特征及小区域特征;在所述遮罩图像中每一像素点的坐标对应为待处理图像的原坐标,其数值为待处理图像对应像素点被赋予的语义标注。
3.如权利要求1中所述图像处理聚类方法,其特征在于:在上述步骤S2中,具体包括:
步骤S21,基于插值方法将遮罩图像进行尺寸缩小;
步骤S22,对遮罩图像进行阈值处理以获得新的遮罩图像;及
步骤S23,基于新的遮罩图像中提取需要聚类的数据,生成第一聚类数据集。
4.如权利要求1中所述图像处理聚类方法,其特征在于:在上述步骤S3之前,还包括:
步骤S20,根据图像特征与缩放倍率调整DBSCAN聚类处理中所需要的参数;所述DBSCAN聚类处理的参数主要包括参数MinPts和参数Eps。
5.如权利要求1中所述图像处理聚类方法,其特征在于:在上述步骤S5中,包括以下步骤:
步骤S51,对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果;
步骤S52,将所述第一聚类结果进行坐标逆变换,以映射得到真实聚类结果;及
步骤S53,将第二聚类结果与真实聚类结果相结合,以输出最终聚类结果。
6.如权利要求1中所述图像处理聚类方法,其特征在于:在步骤S1完成之后,还包括如下的步骤:
步骤S01,从生成的遮罩图像中提取出需要聚类的数据,生成初始聚类数据集;
步骤S02,对初始聚类数据集进行优化分析,并判断初始聚类数据集的样本总数是否大于等于预设数值;若是,则进入步骤S2,若否,则进入步骤S03;及
步骤S03,对初始聚类数据集进行DBSCAN聚类处理获得聚类结果。
7.一种图像处理聚类系统,其特征在于:所述图像处理聚类系统包括:
语义标注模块,被配置为用于根据待处理图像生成含有语义标注的遮罩图像;
尺寸缩小数据提取模块,被配置为用于将第一遮罩图像进行尺寸缩小以获得第二遮罩图像,并提取所述第二遮罩图像需要聚类的数据,生成第一聚类数据集;
第一聚类模块,被配置为用于对所述第一聚类数据集进行DBSCAN聚类处理,以获得第一聚类结果;
重新数据提取模块,被配置为用于将第一聚类结果中的簇区域在所述第一遮罩图像中删去语义标注,重新提取所述第一遮罩图像需要聚类的数据以获得第二聚类数据集;及
二次聚类模块,被配置为用于对第二聚类数据集进行DBSCAN聚类处理获得第二聚类结果,并结合第一聚类结果返回最终聚类结果。
8.如权利要求7中所述图像处理聚类系统,其特征在于:所述尺寸缩小数据提取模块进一步包括:
尺寸缩小单元,被配置为用于基于插值方法将遮罩图像进行尺寸缩小;
阈值处理单元,被配置为用于对遮罩图像进行阈值处理以获得新的遮罩图像;及
数据聚类单元,被配置为用于基于新的遮罩图像中提取需要聚类的数据,生成第一聚类数据集。
9.如权利要求7中所述图像处理聚类系统,其特征在于:所述图像处理聚类系统进一步包括:
初始聚类模块,被配置为用于从生成的遮罩图像中提取出需要聚类的数据,生成初始聚类数据集;及
样本总数判断模块,被配置为用于对初始聚类数据集进行优化分析,并判断初始聚类数据集的样本总数是否大于等于预设数值。
10.一种电子设备,其特征在于:所述电子设备包括存储单元和处理单元,所述存储单元用于存储计算机程序,所述处理单元用于通过所述存储单元存储的计算机程序执行如权利要求1-6中任一项所述图像处理聚类方法。
CN201910632012.9A 2019-07-12 2019-07-12 图像处理聚类方法及其系统、电子设备 Withdrawn CN110348521A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910632012.9A CN110348521A (zh) 2019-07-12 2019-07-12 图像处理聚类方法及其系统、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910632012.9A CN110348521A (zh) 2019-07-12 2019-07-12 图像处理聚类方法及其系统、电子设备

Publications (1)

Publication Number Publication Date
CN110348521A true CN110348521A (zh) 2019-10-18

Family

ID=68175185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910632012.9A Withdrawn CN110348521A (zh) 2019-07-12 2019-07-12 图像处理聚类方法及其系统、电子设备

Country Status (1)

Country Link
CN (1) CN110348521A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111310664A (zh) * 2020-02-18 2020-06-19 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030095707A1 (en) * 2001-11-19 2003-05-22 Koninklijke Philips Electronics N.V. Computer vision method and system for blob-based analysis using a probabilistic pramework
JP2009070834A (ja) * 2007-09-10 2009-04-02 Sharp Corp 基板分類方法および装置、異常設備推定方法および装置、基板分類方法または異常設備推定方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
CN103034858A (zh) * 2012-11-30 2013-04-10 宁波大学 一种卫星云图的二次聚类分割方法
CN103778146A (zh) * 2012-10-23 2014-05-07 富士通株式会社 图像聚类装置以及方法
US9305076B1 (en) * 2012-06-28 2016-04-05 Google Inc. Flattening a cluster hierarchy tree to filter documents
CN106447676A (zh) * 2016-10-12 2017-02-22 浙江工业大学 一种基于快速密度聚类算法的图像分割方法
CN106530305A (zh) * 2016-09-23 2017-03-22 北京市商汤科技开发有限公司 语义分割模型训练和图像分割方法及装置、计算设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030095707A1 (en) * 2001-11-19 2003-05-22 Koninklijke Philips Electronics N.V. Computer vision method and system for blob-based analysis using a probabilistic pramework
JP2009070834A (ja) * 2007-09-10 2009-04-02 Sharp Corp 基板分類方法および装置、異常設備推定方法および装置、基板分類方法または異常設備推定方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
US9305076B1 (en) * 2012-06-28 2016-04-05 Google Inc. Flattening a cluster hierarchy tree to filter documents
CN103778146A (zh) * 2012-10-23 2014-05-07 富士通株式会社 图像聚类装置以及方法
CN103034858A (zh) * 2012-11-30 2013-04-10 宁波大学 一种卫星云图的二次聚类分割方法
CN106530305A (zh) * 2016-09-23 2017-03-22 北京市商汤科技开发有限公司 语义分割模型训练和图像分割方法及装置、计算设备
CN106447676A (zh) * 2016-10-12 2017-02-22 浙江工业大学 一种基于快速密度聚类算法的图像分割方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANDREAS C.MULLER等: "《Python机器学习基础教程》", 31 January 2018, 人民邮电出版社 *
JIAHUI MO等: "A two-stage clustering approach for multi-region segmentation", 《EXPERT SYSTEMS WITH APPLICATIONS》 *
王帅等: "基于两步聚类和随机森林的乳腺腺管自动识别方法", 《计算机科学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111310664A (zh) * 2020-02-18 2020-06-19 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN111310664B (zh) * 2020-02-18 2022-11-22 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN108229341A (zh) 分类方法和装置、电子设备、计算机存储介质、程序
US20230401828A1 (en) Method for training image recognition model, electronic device and storage medium
CN107016387A (zh) 一种识别标签的方法及装置
US20230334890A1 (en) Pedestrian re-identification method and device
CN110348730A (zh) 风险用户判断方法及其系统、电子设备
CN110378225A (zh) 指针式仪表自动读数的识别方法及识别装置
US20220301334A1 (en) Table generating method and apparatus, electronic device, storage medium and product
JP7393472B2 (ja) 陳列シーン認識方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN108288208A (zh) 基于图像内容的展示对象确定方法、装置、介质及设备
CN111984803B (zh) 多媒体资源处理方法、装置、计算机设备及存储介质
CN106663210A (zh) 基于感受的多媒体处理
CN108182457A (zh) 用于生成信息的方法和装置
Gan et al. Learning-aware feature denoising discriminator
CN110348521A (zh) 图像处理聚类方法及其系统、电子设备
CN110198473A (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
CN113673501B (zh) 一种ocr分类方法、系统、电子设备及存储介质
CN113435358B (zh) 用于训练模型的样本生成方法、装置、设备、程序产品
CN109815793A (zh) 微表情描述方法、装置、计算机装置及可读存储介质
CN115359322A (zh) 一种目标检测模型训练方法、装置、设备和存储介质
CN108932704A (zh) 图片处理方法、图片处理装置及终端设备
CN113903071A (zh) 人脸识别方法、装置、电子设备和存储介质
CN111291820B (zh) 一种结合定位信息和分类信息的目标检测方法
CN114722941A (zh) 信贷违约识别方法、装置、设备和介质
CN114332915A (zh) 人体属性检测方法、装置、计算机设备及存储介质
CN113222887A (zh) 基于深度学习的纳米铁标记神经干细胞示踪的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20191018

WW01 Invention patent application withdrawn after publication