CN110096607A - 一种标签图片的获取方法及装置 - Google Patents

一种标签图片的获取方法及装置 Download PDF

Info

Publication number
CN110096607A
CN110096607A CN201910308680.6A CN201910308680A CN110096607A CN 110096607 A CN110096607 A CN 110096607A CN 201910308680 A CN201910308680 A CN 201910308680A CN 110096607 A CN110096607 A CN 110096607A
Authority
CN
China
Prior art keywords
picture
sampling
class
square
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910308680.6A
Other languages
English (en)
Other versions
CN110096607B (zh
Inventor
朱喻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Side Medical Technology Co Ltd
Original Assignee
Guangzhou Side Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Side Medical Technology Co Ltd filed Critical Guangzhou Side Medical Technology Co Ltd
Priority to CN201910308680.6A priority Critical patent/CN110096607B/zh
Publication of CN110096607A publication Critical patent/CN110096607A/zh
Application granted granted Critical
Publication of CN110096607B publication Critical patent/CN110096607B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种标签图片的获取方法及装置,所述方法包括:获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。所述装置执行上述方法。本发明实施例提供的方法及装置,能够准确、高效地获取用于标记原始图片的标签图片。

Description

一种标签图片的获取方法及装置
技术领域
本发明涉及图片处理技术领域,尤其涉及一种标签图片的获取方法及装置。
背景技术
胶囊内镜具有无痛、无伤、拍摄图像信息量大等优点,具备广泛的应用价值。
现有技术采用人工方式识别通过胶囊内镜拍摄的原始图片、并对原始图片进行分类,为了更加准确、高效地识别原始图片,需要构建模型,但是模型在使用之前通常需要进行训练,在训练之前需要对由胶囊内镜拍摄到的原始图片进行标记,即需要获取用于标记原始图片的标签图片。采用上述现有技术获取标签图片的处理方式效率非常低下、且不够准确。
因此,如何避免上述缺陷,准确、高效地获取用于标记原始图片的标签图片,成为亟须解决的问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种标签图片的获取方法及装置。
本发明实施例提供一种标签图片的获取方法,包括:
获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;
对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;
计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;
向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;
计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
本发明实施例提供一种标签图片的获取装置,包括:
获取单元,用于获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;
预处理单元,用于对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;
第一聚类单元,用于计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;
构建单元,用于向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;
第二聚类单元,用于计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
本发明实施例提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,
所述处理器执行所述程序时实现如下方法步骤:
获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;
对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;
计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;
向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;
计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下方法步骤:
获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;
对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;
计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;
向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;
计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
本发明实施例提供的标签图片的获取方法及装置,通过不同细粒度获取采样图片,并通过先后两次聚类获取到标签图片,能够准确、高效地获取用于标记原始图片的标签图片。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明标签图片的获取方法实施例流程图;
图2为本发明实施例根据不同细粒度进行采样的示意图;
图3为本发明标签图片的获取装置实施例结构示意图;
图4为本发明实施例提供的电子设备实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明标签图片的获取方法实施例流程图,如图1所示,本发明实施例提供的一种标签图片的获取方法,包括以下步骤:
S101:获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的。
具体的,装置获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的。需要说明的是:该原始图片是通过胶囊内镜拍摄的,每粒胶囊内镜每次可以拍摄的原始图片的数量可以为2000~3000张。不同细粒度可以包括粗粒、原始图片可以为正方形,所述根据不同细粒度进行采样,可以包括:
根据与所述粗粒对应的粗粒采样正方形进行采样,包括:
采用所述粗粒采样正方形对所述原始图片的九宫格位置进行采样;所述粗粒采样正方形的边长为所述正方形边长的2/3。
图2为本发明实施例根据不同细粒度进行采样的示意图;如图2所示,左侧部分对应的是粗粒采样。即左侧部分的大正方形为原始图片、大正方形中的小正方形为粗粒采样正方形,可以采用与整体正方形(即原始图片对应的正方形)面积相等的采用正方形对整体正方形进行采样。对整体正方形进行采样、以及采用所述粗粒采样正方形对所述原始图片的九宫格位置进行采样的先后次序不作具体限定,每采样一次可以获取一张采样图片,即可以获得10张粗粒采样图片。
所述不同细粒度还可以包括中粒;相应的,所述根据不同细粒度进行采样,可以包括:
根据与所述中粒对应的中粒采样正方形进行采样,包括:
相邻两列采样错开所述中粒采样正方形的边长的一半,相邻两行采样错开所述中粒采样正方形的边长的一半;所述中粒采样正方形的边长为所述正方形边长的1/3。参照图2,中间部分对应的是中粒采样。即中间部分的大正方形为原始图片、大正方形中的小正方形为中粒采样正方形,通过相邻两列采样错开所述中粒采样正方形的边长的一半,相邻两行采样错开所述中粒采样正方形的边长的一半分别进行采样的先后次序不作具体限定,即进行了5行5列的中粒采样,每采样一次可以获取一张采样图片,可以获得25张中粒采样图片。
所述不同细粒度可以包括细粒;相应的,所述根据不同细粒度进行采样,可以包括:
根据与所述细粒对应的细粒采样正方形进行采样,包括:
相邻两列采样错开所述细粒采样正方形的边长的一半,相邻两行采样错开所述细粒采样正方形的边长的一半;所述细粒采样正方形的边长为所述正方形边长的1/6。参照图2,右侧部分对应的是细粒采样。即右侧部分的大正方形为原始图片、大正方形中的小正方形为细粒采样正方形,通过相邻两列采样错开所述细粒采样正方形的边长的一半,相邻两行采样错开所述细粒采样正方形的边长的一半分别进行采样的先后次序不作具体限定,即进行了11行11列的细粒采样,每采样一次可以获取一张采样图片,可以获得121张细粒采样图片。
S102:对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片。
具体的,装置对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片。需要说明的是:预处理还包括将所有采样图片处理为预设像素尺寸的图片、预设像素尺寸的具体数值可以根据实际情况自主设置,可以为20*20尺寸、可以为10*10尺寸,不作具体限定。向量化所有采样图片,参照上述举例和图2,即将上述156张图片(即粗粒采样图片、中粒采样图片和细粒采样图片之和)中的每一张图片处理为20*20的预设像素尺寸,并向量化为1*400的预处理向量,即预处理向量的向量长度为400。
S103:计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片。
具体的,装置计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片。N为预设目标采样图片数量,具体数值可根据实际情况自主设置,可选为10张。参照上述举例进行说明如下:10张粗粒采样图片对应一批候选采样图片、25张中粒采样图片对应一批候选采样图片、121张细粒采样图片对应一批候选采样图片。进一步地,可以采用K-Means聚类算法计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,以中粒采样图片为例,进行说明如下:将25张中粒采样图片聚类为如下类,每类括号中的数值表示该类中图片数量、例如,按照每类候选采样图片的数量由多到少的顺序排序如下:A类(10张)、B类(5张)、C类(3张)、D类(3张)、E类(2张)、F类(2张),在这个实施例中,排序后的第一类候选采样图片(A类)的第一类数量(10张)刚好等于N,则目标采样图片为A类中的10张图片。
在另一个实施例中,按照每类候选采样图片的数量由多到少的顺序排序如下:A类(11张)、B类(4张)、C类(3张)、D类(3张)、E类(2张)、F类(2张),在这个实施例中,排序后的第一类候选采样图片(A类)的第一类数量(11张)大于N,则在A类中的11张图片中随机选取10张图片,并将这10张图片作为目标采样图片。
在另一个实施例中,按照每类候选采样图片的数量由多到少的顺序排序如下:A类(9张)、B类(6张)、C类(3张)、D类(3张)、E类(2张)、F类(2张),在这个实施例中,排序后的第一类候选采样图片(A类)的第一类数量(9张)小于N,则将这9张图片作为目标采样图片,获取排序后的第二类候选采样图片(B类)的第二类数量(6张),第一差值数量为10张-9张=1张,即第二类数量(6张)大于第一差值数量(1张),则在B类中的6张图片中随机选取1张图片,并将这1张图片也作为目标采样图片。需要说明的是:如果上述C类不是3张,而是6张,则可以在B类和C类中随机选择一类作为排序后的第二类候选采样图片。
在另一个实施例中,按照每类候选采样图片的数量由多到少的顺序排序如下:A类(5张)、B类(4张)、C类(4张)、D类(4张)、E类(4张)、F类(2张)、G类(2张),在这个实施例中,排序后的第一类候选采样图片(A类)的第一类数量(5张)小于N,则将这5张图片作为目标采样图片,获取排序后的第二类候选采样图片(B类)的第二类数量(4张),第一差值数量为10张-5张=5张,即第二类数量(4张)小于第一差值数量(5张),则将这4张图片也作为目标采样图片,再获取排序后的第三类候选采样图片(C类)的第三类数量(4张),第二差值数量为10张-9张=1张,即第三类数量(4张)大于第二差值数量(1张),则在C类中的4张图片中随机选取1张图片,并将这1张图片也作为目标采样图片。即可以通过上述迭代执行的方式,获取到所有目标采样图片。对于粗粒采样图片和细粒采样图片的说明,可以参照中粒采样图片的说明,不再赘述。
S104:向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的。
具体的,装置向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的。参照上述举例,所有目标采样图片为粗粒采样图片、中粒采样图片和细粒采样图片分别对应的目标采样图片之和,例如为30张。每张为1*400的预处理向量,则构建的总向量为1*12000,即总向量长度为12000。
S105:计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
具体的,装置计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。进一步地,可以采用K-Means聚类算法计算所述总向量,以聚类所述目标采样图片,参照上述举例进行说明如下:将30张目标采样图片聚类为如下类,每类括号中的数值表示该类中图片数量a类(10张)、b类(5张)、c类(5张)、d类(5张)、e类(3张)、f类(2张),即a类~f类分别对应不同类的标签图片。
本发明实施例提供的标签图片的获取方法,通过不同细粒度获取采样图片,并通过先后两次聚类获取到标签图片,能够准确、高效地获取用于标记原始图片的标签图片。
在上述实施例的基础上,所述按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片,包括:
获取排序后的第一类候选采样图片的第一类数量,若判断获知所述第一类数量等于N,则将所有第一类候选采样图片作为所述目标采样图片。
具体的,装置获取排序后的第一类候选采样图片的第一类数量,若判断获知所述第一类数量等于N,则将所有第一类候选采样图片作为所述目标采样图片。可参照上述实施例,不再赘述。
本发明实施例提供的标签图片的获取方法,通过有效地获取到目标采样图片,进一步能够准确、高效地获取用于标记原始图片的标签图片。
在上述实施例的基础上,所述方法还包括:
若判断获知所述第一类数量大于N,则在所有第一类候选采样图片中随机选取N个图片,并作为所述目标采样图片。
具体的,装置若判断获知所述第一类数量大于N,则在所有第一类候选采样图片中随机选取N个图片,并作为所述目标采样图片。可参照上述实施例,不再赘述。
本发明实施例提供的标签图片的获取方法,通过有效地获取到目标采样图片,进一步能够准确、高效地获取用于标记原始图片的标签图片。
在上述实施例的基础上,所述方法还包括:
若判断获知所述第一类数量小于N,则将所有第一类候选采样图片作为所述目标采样图片。
具体的,装置若判断获知所述第一类数量小于N,则将所有第一类候选采样图片作为所述目标采样图片。可参照上述实施例,不再赘述。
获取排序后的第二类候选采样图片的第二类数量,若判断获知所述第二类数量大于第一差值数量,则在所有第二类候选采样图片中随机选取与第一差值数量相等的图片,并作为所述目标采样图片;其中,所述第一差值数量为当所述第一类数量小于N时,N与所述第一类数量之间的差值。
具体的,装置获取排序后的第二类候选采样图片的第二类数量,若判断获知所述第二类数量大于第一差值数量,则在所有第二类候选采样图片中随机选取与第一差值数量相等的图片,并作为所述目标采样图片;其中,所述第一差值数量为当所述第一类数量小于N时,N与所述第一类数量之间的差值。可参照上述实施例,不再赘述。
本发明实施例提供的标签图片的获取方法,通过有效地获取到目标采样图片,进一步能够准确、高效地获取用于标记原始图片的标签图片。
在上述实施例的基础上,所述原始图片为正方形、所述不同细粒度包括粗粒;相应的,所述根据不同细粒度进行采样,包括:
根据与所述粗粒对应的粗粒采样正方形进行采样,包括:
采用所述粗粒采样正方形对所述原始图片的九宫格位置进行采样;所述粗粒采样正方形的边长为所述正方形边长的2/3。
具体的,装置采用所述粗粒采样正方形对所述原始图片的九宫格位置进行采样;所述粗粒采样正方形的边长为所述正方形边长的2/3。可参照上述实施例,不再赘述。
本发明实施例提供的标签图片的获取方法,通过获取粗粒采样图片,全面地采样图片特征,进一步能够准确、高效地获取用于标记原始图片的标签图片。
在上述实施例的基础上,所述不同细粒度包括中粒;相应的,所述根据不同细粒度进行采样,包括:
根据与所述中粒对应的中粒采样正方形进行采样,包括:
相邻两列采样错开所述中粒采样正方形的边长的一半,相邻两行采样错开所述中粒采样正方形的边长的一半;所述中粒采样正方形的边长为所述正方形边长的1/3。
具体的,装置将相邻两列采样错开所述中粒采样正方形的边长的一半,相邻两行采样错开所述中粒采样正方形的边长的一半;所述中粒采样正方形的边长为所述正方形边长的1/3。可参照上述实施例,不再赘述。
本发明实施例提供的标签图片的获取方法,通过获取中粒采样图片,全面地采样图片特征,进一步能够准确、高效地获取用于标记原始图片的标签图片。
在上述实施例的基础上,所述不同细粒度包括细粒;相应的,所述根据不同细粒度进行采样,包括:
根据与所述细粒对应的细粒采样正方形进行采样,包括:
相邻两列采样错开所述细粒采样正方形的边长的一半,相邻两行采样错开所述细粒采样正方形的边长的一半;所述细粒采样正方形的边长为所述正方形边长的1/6。
具体的,装置将相邻两列采样错开所述细粒采样正方形的边长的一半,相邻两行采样错开所述细粒采样正方形的边长的一半;所述细粒采样正方形的边长为所述正方形边长的1/6。可参照上述实施例,不再赘述。
本发明实施例提供的标签图片的获取方法,通过获取细粒采样图片,全面地采样图片特征,进一步能够准确、高效地获取用于标记原始图片的标签图片。
图3为本发明标签图片的获取装置实施例结构示意图,如图3所示,本发明实施例提供了一种标签图片的获取装置,包括获取单元301、预处理单元302、预处理单元303、构建单元304和第二聚类单元305,其中:
获取单元301用于获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;预处理单元302用于对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;第一聚类单元303用于计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;构建单元304用于向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;第二聚类单元305用于计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
具体的,获取单元301用于获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;预处理单元302用于对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;第一聚类单元303用于计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;构建单元304用于向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;第二聚类单元305用于计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
本发明实施例提供的标签图片的获取装置,通过不同细粒度获取采样图片,并通过先后两次聚类获取到标签图片,能够准确、高效地获取用于标记原始图片的标签图片。
本发明实施例提供的标签图片的获取装置具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
图4为本发明实施例提供的电子设备实体结构示意图,如图4所示,所述电子设备包括:处理器(processor)401、存储器(memory)402和总线403;
其中,所述处理器401、存储器402通过总线403完成相互间的通信;
所述处理器401用于调用所述存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种标签图片的获取方法,其特征在于,包括:
获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;
对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;
计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;
向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;
计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
2.根据权利要求1所述的获取方法,其特征在于,所述按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片,包括:
获取排序后的第一类候选采样图片的第一类数量,若判断获知所述第一类数量等于N,则将所有第一类候选采样图片作为所述目标采样图片。
3.根据权利要求2所述的获取方法,其特征在于,所述方法还包括:
若判断获知所述第一类数量大于N,则在所有第一类候选采样图片中随机选取N个图片,并作为所述目标采样图片。
4.根据权利要求3所述的获取方法,其特征在于,所述方法还包括:
若判断获知所述第一类数量小于N,则将所有第一类候选采样图片作为所述目标采样图片;
获取排序后的第二类候选采样图片的第二类数量,若判断获知所述第二类数量大于第一差值数量,则在所有第二类候选采样图片中随机选取与第一差值数量相等的图片,并作为所述目标采样图片;其中,所述第一差值数量为当所述第一类数量小于N时,N与所述第一类数量之间的差值。
5.根据权利要求1至4任一所述的获取方法,其特征在于,所述原始图片为正方形、所述不同细粒度包括粗粒;相应的,所述根据不同细粒度进行采样,包括:
根据与所述粗粒对应的粗粒采样正方形进行采样,包括:
采用所述粗粒采样正方形对所述原始图片的九宫格位置进行采样;所述粗粒采样正方形的边长为所述正方形边长的2/3。
6.根据权利要求5所述的获取方法,其特征在于,所述不同细粒度包括中粒;相应的,所述根据不同细粒度进行采样,包括:
根据与所述中粒对应的中粒采样正方形进行采样,包括:
相邻两列采样错开所述中粒采样正方形的边长的一半,相邻两行采样错开所述中粒采样正方形的边长的一半;所述中粒采样正方形的边长为所述正方形边长的1/3。
7.根据权利要求6所述的获取方法,其特征在于,所述不同细粒度包括细粒;相应的,所述根据不同细粒度进行采样,包括:
根据与所述细粒对应的细粒采样正方形进行采样,包括:
相邻两列采样错开所述细粒采样正方形的边长的一半,相邻两行采样错开所述细粒采样正方形的边长的一半;所述细粒采样正方形的边长为所述正方形边长的1/6。
8.一种标签图片的获取装置,其特征在于,包括:
获取单元,用于获取针对原始图片的采样图片;所述采样图片是根据不同细粒度进行采样的;
预处理单元,用于对所有采样图片分别进行预处理;所述预处理包括向量化所有采样图片;
第一聚类单元,用于计算候选采样图片对应的预处理向量,以聚类所述候选采样图片,并按照每类候选采样图片的数量由多到少的顺序选取前N个目标采样图片;所述候选采样图片是各细粒度分别对应的采样图片;
构建单元,用于向量化所有目标采样图片,以构建总向量;所述总向量是将所有目标采样图片的向量化结果进行组合得到的;
第二聚类单元,用于计算所述总向量,以聚类所述目标采样图片,并将每类目标采样图片作为同一类标签图片。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述获取方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述获取方法的步骤。
CN201910308680.6A 2019-04-17 2019-04-17 一种标签图片的获取方法及装置 Active CN110096607B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910308680.6A CN110096607B (zh) 2019-04-17 2019-04-17 一种标签图片的获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910308680.6A CN110096607B (zh) 2019-04-17 2019-04-17 一种标签图片的获取方法及装置

Publications (2)

Publication Number Publication Date
CN110096607A true CN110096607A (zh) 2019-08-06
CN110096607B CN110096607B (zh) 2021-01-15

Family

ID=67445071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910308680.6A Active CN110096607B (zh) 2019-04-17 2019-04-17 一种标签图片的获取方法及装置

Country Status (1)

Country Link
CN (1) CN110096607B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639263A (zh) * 2020-06-03 2020-09-08 小红书科技有限公司 笔记推荐方法、装置及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010021625A1 (en) * 2008-08-21 2010-02-25 Hewlett-Packard Development Company, L.P. Automatic creation of a scalable relevance ordered representation of an image collection
CN102968796A (zh) * 2012-11-30 2013-03-13 西安电子科技大学 基于采样学习的sar图像分割方法
CN104392231A (zh) * 2014-11-07 2015-03-04 南京航空航天大学 基于分块与稀疏主特征提取的快速协同显著性检测方法
CN104517113A (zh) * 2013-09-29 2015-04-15 浙江大华技术股份有限公司 一种图像的特征提取方法、图像的分类方法及相关装置
CN106447676A (zh) * 2016-10-12 2017-02-22 浙江工业大学 一种基于快速密度聚类算法的图像分割方法
CN108062377A (zh) * 2017-12-12 2018-05-22 百度在线网络技术(北京)有限公司 标签图片集的建立、标签的确定方法、装置、设备及介质
CN108647726A (zh) * 2018-05-11 2018-10-12 南京理工大学 一种图像聚类方法
CN109389175A (zh) * 2018-10-24 2019-02-26 广东工业大学 一种图片分类方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010021625A1 (en) * 2008-08-21 2010-02-25 Hewlett-Packard Development Company, L.P. Automatic creation of a scalable relevance ordered representation of an image collection
CN102968796A (zh) * 2012-11-30 2013-03-13 西安电子科技大学 基于采样学习的sar图像分割方法
CN104517113A (zh) * 2013-09-29 2015-04-15 浙江大华技术股份有限公司 一种图像的特征提取方法、图像的分类方法及相关装置
CN104392231A (zh) * 2014-11-07 2015-03-04 南京航空航天大学 基于分块与稀疏主特征提取的快速协同显著性检测方法
CN106447676A (zh) * 2016-10-12 2017-02-22 浙江工业大学 一种基于快速密度聚类算法的图像分割方法
CN108062377A (zh) * 2017-12-12 2018-05-22 百度在线网络技术(北京)有限公司 标签图片集的建立、标签的确定方法、装置、设备及介质
CN108647726A (zh) * 2018-05-11 2018-10-12 南京理工大学 一种图像聚类方法
CN109389175A (zh) * 2018-10-24 2019-02-26 广东工业大学 一种图片分类方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111639263A (zh) * 2020-06-03 2020-09-08 小红书科技有限公司 笔记推荐方法、装置及系统
CN111639263B (zh) * 2020-06-03 2023-11-24 小红书科技有限公司 笔记推荐方法、装置及系统

Also Published As

Publication number Publication date
CN110096607B (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
KR102224510B1 (ko) 데이터 관리를 위한 시스템들 및 방법들
CN110647920A (zh) 机器学习中的迁移学习方法及装置、设备与可读介质
WO2019018375A1 (en) NEURONAL ARCHITECTURE RESEARCH FOR CONVOLUTION NEURAL NETWORKS
WO2019111118A1 (en) Robust gradient weight compression schemes for deep learning applications
CN107292352B (zh) 基于卷积神经网络的图像分类方法和装置
CN112084038B (zh) 神经网络的内存分配方法及装置
US11048935B2 (en) Generating shift-invariant neural network outputs
CN113168559A (zh) 机器学习模型的自动化生成
US20190325298A1 (en) Apparatus for executing lstm neural network operation, and operational method
CN111476719A (zh) 图像处理方法、装置、计算机设备及存储介质
CN107292229A (zh) 一种图像识别方法和装置
CN111406264A (zh) 神经架构搜索
JP6961640B2 (ja) データ処理のシステムおよび方法
CN112949750B (zh) 一种图像分类方法及计算机可读存储介质
CN108876893A (zh) 三维人脸重建的方法、装置、系统及计算机存储介质
Lawrence et al. Comparing TensorFlow deep learning performance using CPUs, GPUs, local PCs and cloud
US20220261623A1 (en) System and method for channel-separable operations in deep neural networks
CN113643230A (zh) 用于冷冻电镜生物大分子颗粒识别的持续学习方法及系统
CN108154153A (zh) 场景分析方法和系统、电子设备
CN110096607A (zh) 一种标签图片的获取方法及装置
WO2021068180A1 (en) Method and system for continual meta-learning
CN114511733A (zh) 基于弱监督学习的细粒度图像识别方法、装置及可读介质
CN109474851A (zh) 视频转换方法、装置及设备
CN108229429A (zh) 一种图像处理方法及装置和冰箱
Chitty-Venkata et al. Efficient design space exploration for sparse mixed precision neural architectures

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant