CN110110795A - 图像分类方法及装置 - Google Patents

图像分类方法及装置 Download PDF

Info

Publication number
CN110110795A
CN110110795A CN201910390868.XA CN201910390868A CN110110795A CN 110110795 A CN110110795 A CN 110110795A CN 201910390868 A CN201910390868 A CN 201910390868A CN 110110795 A CN110110795 A CN 110110795A
Authority
CN
China
Prior art keywords
category
image
marked
subset
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910390868.XA
Other languages
English (en)
Other versions
CN110110795B (zh
Inventor
曾志勇
许清泉
张伟
傅松林
洪炜冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meitu Technology Co Ltd
Original Assignee
Xiamen Meitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meitu Technology Co Ltd filed Critical Xiamen Meitu Technology Co Ltd
Priority to CN201910390868.XA priority Critical patent/CN110110795B/zh
Publication of CN110110795A publication Critical patent/CN110110795A/zh
Application granted granted Critical
Publication of CN110110795B publication Critical patent/CN110110795B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种图像分类方法及装置,通过对多张待标注图像与不同的目标特征分别进行匹配的方式进行分类得到多个第一类别,以及对多张待标注图像采用聚类的方式进行分类得到多个第二类别,并且针对每个第一类别,确定与第一类别匹配的第二类别,并将第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像,从而实现对多张待标注图像进行精准的分类,并避免了在对图像进行精细化分类时浪费过多的时间成本和人力成本的问题。

Description

图像分类方法及装置
技术领域
本申请涉及图像分类领域,具体而言,涉及一种图像分类方法及装置。
背景技术
精细化图像分类相对通用图像分类任务的区别和难点在于,精细化图像分类中的图像所属类别的粒度更为精细,且同一大类别下不同子类别间的视觉差异极小。
目前,通常按照使用监督信息的多少对精细化图像进行分类,具体的,精细化分类任务模型可以分为强监督和弱监督两类模型,强监督模型需要用到大量的标注信息,获取标注信息需要耗费大量的时间成本和人力成本,且精细化分类更为专业,但是大部分人都难以进行有效区分,所以标注人员的有限认知水平常常导致数据集的不理想从而会影响标注结果;而弱监督模型可以借助较少的标注信息,自动捕获局部特征,虽然降低了标注成本,但在精度方面始终与强监督模型存在差距。因此,提供一种能够有效提高分类进度,并避免浪费过多的时间成本和人力成本的图像分类方法为实际所需。
发明内容
本申请提供一种图像分类方法及装置。
本申请提供的一种图像分类方法,所述方法包括:
获得多个第一类别,以及每个所述第一类别分别对应的目标特征;
获取多张待标注图像,将每张所述待标注图像分别与各所述目标特征进行匹配,将与同一目标特征匹配的所有待标注图像归类至与该目标特征对应的第一类别中,得到每个所述第一类别分别包括的待标注图像;
对所述多张待标注图像进行聚类,得到所述多张待标注图像聚类至的多个第二类别,其中,所述多个第二类别的类别数量与所述多个第一类别的类别数量相同;
针对每个第一类别,确定与该第一类别匹配的第二类别,将该第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像。
可选的,在上述图像分类方法中,在执行获得多个第一类别,以及每个所述第一类别分别对应的目标特征的步骤之前,所述方法还包括:
获取包括多个子集的验证集,其中,每个所述子集包括属于同一第一类别的多张验证图像,且每个子集分别与一个第一类别对应;
将所述子集中的各验证图像分别进行向量化处理,提取各所述验证图像中的特征进行融合以构造目标子集的浅层复合特征;
将所述目标子集的浅层复合特征与其他子集的浅层复合特征进行处理后得到该目标子集的目标特征,进而得到每个所述第一类别分别对应的目标特征。
可选的,在上述图像分类方法中,将所述子集中的各验证图像分别进行向量化处理,提取各所述验证图像中的特征进行融合以构造目标子集的浅层复合特征的步骤具体为:
将所述子集中的各验证图像进行向量化处理后,采用主成分分析技术和方向梯度直方图技术提取每张所述验证图像中的特征,并将提取到的特征进行融合以构造目标子集的浅层复合特征;
所述将所述目标子集的浅层复合特征与其他子集的浅层复合特征进行处理后得到目标特征的步骤具体为:
将所述目标子集的浅层复合特征与其他子集的浅层复合特征采用SIFT算法和lowe’s算法进行计算,得到所述目标子集的浅层符合特征中与其他子集之间的最优匹配点,并在所述目标子集的浅层复合特征中排除所述最优匹配点得到目标特征。
可选的,在上述图像分类方法中,对所述多张待标注图像进行聚类的步骤包括:
采用K-Means聚类算法对所述多张待标注图像进行聚类。
可选的,在上述图像分类方法中,针对每个第一类别,确定与该第一类别匹配的第二类别的步骤包括:
针对每个第一类别,将该第一类别中的所有待标注图像与各所述第二类别中所有待标注图像进行相似度计算,将包括的待标注图像与该第一类别中的待标注图像的相似度最高的第二类别确定为与该第一类别匹配的第二类别。
本申请还提供一种图像分类装置,所述装置包括:
类别获得模块,用于获得多个第一类别,以及每个所述第一类别分别对应的目标特征;
第一分类模块,用于获取多张待标注图像,将每张所述待标注图像分别与各所述目标特征进行匹配,将与同一目标特征匹配的所有待标注图像归类至与该目标特征对应的第一类别中,得到每个所述第一类别分别包括的待标注图像;
第二分类模块,用于对所述多张待标注图像进行聚类,得到多张待标注图像聚类至的多个第二类别,其中,所述多个第二类别的类别数量与所述多个第一类别的类别数量相同;
第三分类模块,用于针对每个第一类别,确定与该第一类别匹配的第二类别,将该第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像。
可选的,在上述图像分类装置中,所述装置还包括:
验证集获取模块,用于获取包括多个子集的验证集,其中,每个所述子集包括属于同一第一类别第一类别的多张验证图像,且每个子集分别与一个第一类别对应;
处理模块,用于将所述子集中的各验证图像分别进行向量化处理,提取各所述验证图像中的特征进行融合以构造目标子集的浅层复合特征;
目标特征获得模块,用于将所述目标子集的浅层复合特征与其他子集的浅层复合特征进行处理后得到该目标子集的目标特征,进而得到每个所述第一类别分别对应的目标特征。
可选的,在上述图像分类装置中,所述处理模块具体用于,将所述子集中的各验证图像进行向量化处理后,采用主成分分析技术和方向梯度直方图技术提取每张所述验证图像中的特征,并将提取到的特征进行融合以构造目标子集的浅层复合特征;
所述目标特征获得模块具体用于,将所述目标子集的浅层复合特征与其他子集的浅层复合特征采用SIFT算法和lowe’s算法进行计算,得到所述目标子集的浅层符合特征中与其他子集之间的最优匹配点,并在所述目标子集的浅层复合特征中排除所述最优匹配点得到目标特征。
可选的,在上述图像分类装置中,所述第二分类模块具体用于,采用K-Means聚类算法对所述多张待标注图像进行聚类。
可选的,在上述图像分类装置中,所述第三分类模块具体用于,针对每个第一类别,将该第一类别中的所有待标注图像与各所述第二类别中所有待标注图像进行相似度计算,将包括的待标注图像与该第一类别中的待标注图像的相似度最高的第二类别确定为与该第一类别匹配的第二类别。
本申请提供的一种图像分类方法及装置,通过对多张待标注图像与不同的目标特征分别进行匹配的方式进行分类得到多个第一类别,以及对多张待标注图像采用聚类的方式进行分类得到多个第二类别,并且针对每个第一类别,确定与第一类别匹配的第二类别,将第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像,从而实现对多张待标注图像进行准确的分类,并避免了浪费过多的时间成本和人力成本的问题。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种电子设备的连接框图。
图2为本发明实施例提供的一种图像分类方法的流程示意图。
图3为本发明实施例提供的一种图像分类方法的另一流程示意图。
图4为本发明实施例提供的一种图像分类装置的连接框图。
图5为本发明实施例提供的一种图像分类装置的另一连接框图。
图标:10-电子设备;12-存储器;14-处理器;100-图像分类装置;110-类别获得模块;120-第一分类模块;130-第二分类模块;140-第三分类模块;150-验证集获取模块;160-处理模块;170-目标特征获得模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
请参阅图1,本发明提供一种电子设备10,所述电子设备10包括存储器12和处理器14,所述存储器12与所述处理器14相互之间直接或间接的电性连接,以实现数据的传输或交互。
例如,所述存储器12与所述处理相互之间可通过一条或多条通讯总线或信号线实现电性连接。其中,所述存储器12中存储有以软件或固件(Firmware)的形式存储于所述存储器12中的软件功能模块,所述处理器14通过运行存储在存储器12内的软件程序以及模块,如本发明实施例中的图像分类装置100,从而执行各种功能应用以及数据处理,即实现本发明实施例中的图像分类方法。
请参阅图2,本发明提供一种可应用于上述电子设备10的图像分类方法,所述图像分类方法应用于上述的电子设备10时,执行步骤S110-S140。
步骤S110:获得多个第一类别,以及每个所述第一类别分别对应的目标特征。
其中,所述多个第一类别的数量在此不作具体限定,在本实施例中,可以根据同一大类别下可能存在的子类别的种类进行设置,且所述子类别即为本实施例中的第一类别,其中,每个第一类别分别对应一种目标特征,所述目标特征为对应的第一类别能够与其他第一类别进行区分的特征,即,当存在一张属于同一大类别下的图像与一第一类别对应的目标特征匹配时,则该图像与其他第一类别对应的目标特征都不匹配。
同一大类别中包括的子类别可以是但不限于同一疾病的不同严重程度、同一种水果的不同成熟度或者同一种蔬菜的不同生长周期或不同成熟度等,在此不做具体限定,根据实际需求进行设置即可。
步骤S120:获取多张待标注图像,将每张所述待标注图像分别与各所述目标特征进行匹配,将与同一目标特征匹配的所有待标注图像归类至与该目标特征对应的第一类别中,得到每个所述第一类别分别包括的待标注图像。
其中,所述多张待标注图像为同一大类别中包括的图像,所述多个第一类别的属于同一大类别。将每张所述待标注图像分别与所述目标特征进行匹配的方式可以是,分析每张待标注图像中是否具有与各所述目标特征相同的特征,或者将每张待标注图像分别与各所述目标特征进行相似度计算,根据实际需求进行设置即可。
在本实施例中,将每张所述待标注图像分别与各所述目标特征进行匹配的方式具体可以是:将每张待标注图像将进行向量化处理后,采用主成分分析技术和方向梯度直方图技术提取每张所述待标注图像中的特征,以将提取到的特征与所述目标特征进行匹配。
步骤S130:对所述多张待标注图像进行聚类,得到所述多张待标注图像聚类至的多个第二类别,其中,所述多个第二类别的类别数量与所述多个第一类别的类别数量相同。
需要说明的是,聚类获得的多种第二类别中,每个第二类别分别具有一个第一类别与该第二类相对应。在本实施例中,对所述多张待标注图像进行聚类的方式可以是采用K-Means聚类算法聚类、采用均值漂移聚类、采用DBSCAN聚类、采用高斯混合模型的最大期望聚类、凝聚层次聚类或者图像团体检测聚类,根据实际需求进行设置即可,在此不作具体限定。
为提高分类效率,可选的,在本实施中,对所述多张待标注图像进行聚类的步骤包括:采用K-Means聚类算法对所述多张待标注图像进行聚类。
步骤S140:针对每个第一类别,确定与该第一类别匹配的第二类别,将该第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像。
其中,上述步骤S140具体可以是,针对每个第一类别,将该第一类别中的所有待标注图像分别与每个第二类别中的所有待标注图像进行匹配,以得到与第一类别中的所有待标注图像匹配数量最多的一个第二类别确定为与该第一类别匹配度最高的第二图像。也可以是,针对每个第一类别,将该第一类别中的所有待标注图像与各所述第二类别中所有待标注图像进行相似度计算,将包括的待标注图像与该第一类别中的待标注图像的相似度最高的第二类别确定为与该第一类别匹配的第二类别。
通过采用上述方法,以实现对多张待标注图像采用特征匹配和聚类两种方式进行分类,并对两种分类方式获得的第一类别和第二类别进行匹配,以及对第一分类中与该第一分类匹配的第二分类中的图像取交集达到了对图像进行精准分类的效果,且上述分类方式相对于采用现有的强监督模型方式相比,有效避免了需要耗费大量的时间成本和人力成本的问题,以及避免了在标注人员的有限认知水平常常导致数据集的不理想从而会影响标注结果的情况。此外,上述方法还解决了现有的弱监督模型存在分类的准确性较差的问题。
可选的,在本实施例中,在执行步骤S110之前,所述方法还包括步骤S150-S170。
步骤S150:获取包括多个子集的验证集,其中,每个所述子集包括属于同一第一类别的多张验证图像,且每个子集分别与一个第一类别对应。
其中,所述多个验证子集为能够区分上述验证集中的验证图像的专业领域人员进行区分得到的。
步骤S160:将所述子集中的各验证图像分别进行向量化处理,提取各所述验证图像中的特征进行融合以构造目标子集的浅层复合特征。
其中,提取各所述验证图像中的特征的方式可以是基于颜色、纹理以及形状三个特征图的提取方法,也可以是采用主成分分析法和方向梯度直方图技术进行提取,根据实际需求进行选取即可。
在本实施例中,所述步骤S160具体可以是:将所述子集中的各验证图像进行向量化处理后,采用主成分分析技术和方向梯度直方图技术提取每张所述验证图像中的特征,并将提取到的特征进行融合以构造目标子集的浅层复合特征。
步骤S170:将所述目标子集的浅层复合特征与其他子集的浅层复合特征进行处理后得到该目标子集的目标特征,进而得到每个所述第一类别分别对应的目标特征。
其中,提取所述验证图像中的特征的方式可以是采用SIFT算法、rBRIEF算法或根据像素值特征进行提取。
在本实施例中,上述步骤S170具体为:将所述目标子集的浅层复合特征与其他子集的浅层复合特征采用SIFT算法和lowe’s算法进行计算,得到所述目标子集的浅层符合特征中与其他子集之间的最优匹配点,并在所述目标子集的浅层复合特征中排除所述最优匹配点得到目标特征。
通过上述步骤S150-S170实现了基于验证集中的多个子集中包括的验证图像得到每个子集对应的目标特征,进而得到每个所述第一类别分别对应的目标特征,以便于基于上述目标特征对待标注图像进行精细化的图像分类,并能够达到准确的分类结果。
在本实施例中,以同一大类别为痤疮为例进行说明,则同一大类下的子分类(第一类别)可以包括粉刺、丘疹、结节、囊肿以及脓包共五个第一类别,且上述五个第一类别的形成是一个动态发展的过程,前者可以向后者过渡。通过获得专业人员进行痤疮分析得到的包括粉刺、丘疹、结节、囊肿以及脓包五个子集的验证集,并对各子集中的每张验证图像进行向量化处理后,针对处理后的每个子集中的验证图像,采用主成分分析法和方向梯度直方图技术提取处理后的每张图像的特征并进行多特征融合以构造该子集的浅层符合特征。具体的,子集为粉刺子集时,当该包括的一张图像具有“1”,“2”,“3”,“4”点特征,包括的另一图像具有:“2”,“3”,“4”,“5”,“6”点特征,进行融合后得到的粉刺子集的浅层复合特征为“1”,“2”,“3”,“4”,“5”,“6”;当子集为丘疹子集时,丘疹子集的浅层复合特征可能为“3”,“4”,“5”,“6”,“7”,“8”,“9”;当子集为囊肿子集时,囊肿子集的浅层复合特征可能为“9”,“10”,“11”,“12”,“13”,“14”。由于粉刺,丘疹,结节,囊肿,脓疱为依次动态发展的,因此会有一些相同的特征。通过将粉刺子集的浅层符合特征和丘疹子集的浅层复合特征进行匹配,即可得到粉刺子集和丘疹子集都具有“3”,“4”,“5”,“6”的特征,因此排除这几个特征点,则粉刺相对于其他的特征具有“1”,“2”的特征点,因此“1”,“2”特征点为粉刺子集的目标特征,“7”,“8”为丘疹子集的目标特征,同理,可以得到囊肿子集、结节子集和脓包子集分别对应的目标特征,进而可以得到每个第一类别对应的目标特征。
在对多张待标注痤疮图像进行划分时,可以是采用采用主成分分析(PCA)技术和方向梯度直方图(HOG)技术提取每张待标注痤疮图像的特征,并针对每张待标注痤疮图像将提取到的特征与各第一类别的目标特征分别进行匹配,并将该待标注痤疮图像归类至与该目标特征对应第一类别。同时采用聚类的方式对多张待标注痤疮图像进行分类得到5个第二子集。针对每个第一类别,将该第一类别中的所有待标注痤疮图像与各所述第二类别中所有待标注痤疮图像进行相似度计算,将包括的待标注痤疮图像与该第一类别中的待标注痤疮图像的相似度最高的第二类别确定为与该第一类别匹配的第二类别,并将该第一类别中与确定的第二类别中相同的待标注痤疮图像作为目标类别包括的待标注痤疮图像,以实现对待标注痤疮图像达到超过人工标注的精准结果,同时能够有效提高标注效率。
请参阅图4,本发明还提供一种可应用于上述的电子设备10的图像分类装置100,所述图像分类装置100包括类别获得模块110、第一分类模块120、第二分类模块130以及第三分类模块140。
所述类别获得模块110,用于获得多个第一类别,以及每个所述第一类别分别对应的目标特征。在本实施例中,所述类别获得模块110可用于执行图2中的步骤S110,关于所述类别获得模块110的具体描述可以参照前文对所述步骤S110的具体描述。
所述第一分类模块120,用于获取多张待标注图像,将每张所述待标注图像分别与各所述目标特征进行匹配,将与同一目标特征匹配的所有待标注图像归类至与该目标特征对应的第一类别中,得到每个所述第一类别分别包括的待标注图像。在本实施例中,所述第一分类模块120可用于执行图2中的步骤S120,关于所述第一分类模块120的具体描述可以参照前文对所述步骤S10的具体描述。
所述第二分类模块130,用于对所述多张待标注图像进行聚类,得到多张待标注图像聚类至的多个第二类别,其中,所述多个第二类别的类别数量与所述多个第一类别的类别数量相同。在本实施例中,所述第二分类模块130可用于执行图2中的步骤S130,关于所述第二分类模块130的具体描述可以参照前文对所述步骤S130的具体描述。
可选的,在本实施例中,所述第二分类模块130具体用于,采用K-Means聚类算法对所述多张待标注图像进行聚类。
所述第三分类模块140,用于针对每个第一类别,确定与该第一类别匹配的第二类别,将该第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像。在本实施例中,所述第三分类模块140可用于执行图2中的步骤S140,关于所述第三分类模块140的具体描述可以参照前文对所述步骤S140的具体描述。
可选的,在本实施例中,所述第三分类模块140具体用于,针对每个第一类别,将该第一类别中的所有待标注图像与各所述第二类别中所有待标注图像进行相似度计算,将包括的待标注图像与该第一类别中的待标注图像的相似度最高的第二类别确定为与该第一类别匹配的第二类别。
请结合图5,在本实施例中,所述图像分类装置100还包括验证集获取模块150、处理模块160以及目标特征获得模块170。
所述验证集获取模块150,用于获取包括多个子集的验证集,其中,每个所述子集包括属于同一第一类别第一类别的多张验证图像,且每个子集分别与一个第一类别对应。在本实施例中,所述验证集获得模块可用于执行图3中步骤S150,关于所述验证集获得模块的具体描述可以参照前文对步骤S150的具体描述。
所述处理模块160,用于将所述子集中的各验证图像分别进行向量化处理,提取各所述验证图像中的特征进行融合以构造目标子集的浅层复合特征。在本实施例中,所述处理模块160可用于执行图3中步骤S160,关于所述处理模块160的具体描述可以参照前文对步骤S160的具体描述。
可选的,在本实施例中,所述处理模块160具体用于,将所述子集中的各验证图像进行向量化处理后,采用主成分分析技术和方向梯度直方图技术提取每张所述验证图像中的特征,并将提取到的特征进行融合以构造目标子集的浅层复合特征。
所述目标特征获得模块170,用于将所述目标子集的浅层复合特征与其他子集的浅层复合特征进行处理后得到该目标子集的目标特征,进而得到每个所述第一类别分别对应的目标特征。在本实施例中,所述目标特征获得模块170可以用于执行图3中步骤S170,关于所述目标特征获得模块170的具体描述可以参照前文对步骤S170的具体描述。
在本实施例中,所述目标特征获得模块170具体用于,将所述目标子集的浅层复合特征与其他子集的浅层复合特征采用SIFT算法和lowe’s算法进行计算,得到所述目标子集的浅层符合特征中与其他子集之间的最优匹配点,并在所述目标子集的浅层复合特征中排除所述最优匹配点得到目标特征。
综上,本发明实施例提供的一种图像分类方法及装置,通过对多张待标注图像与不同的目标特征分别进行匹配的方式进行分类得到多个第一类别,以及对多张待标注图像采用聚类的方式进行分类得到多个第二类别,并且针对每个第一类别,确定与第一类别匹配的第二类别,并将第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像,从而实现对多张待标注图像进行精准的分类,并避免了在对图像进行精细化分类时浪费过多的时间成本和人力成本的问题。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种图像分类方法,其特征在于,所述方法包括:
获得多个第一类别,以及每个所述第一类别分别对应的目标特征;
获取多张待标注图像,将每张所述待标注图像分别与各所述目标特征进行匹配,将与同一目标特征匹配的所有待标注图像归类至与该目标特征对应的第一类别中,得到每个所述第一类别分别包括的待标注图像;
对所述多张待标注图像进行聚类,得到所述多张待标注图像聚类至的多个第二类别,其中,所述多个第二类别的类别数量与所述多个第一类别的类别数量相同;
针对每个第一类别,确定与该第一类别匹配的第二类别,将该第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像。
2.根据权利要求1所述的图像分类方法,其特征在于,在执行获得多个第一类别,以及每个所述第一类别分别对应的目标特征的步骤之前,所述方法还包括:
获取包括多个子集的验证集,其中,每个所述子集包括属于同一第一类别的多张验证图像,且每个子集分别与一个第一类别对应;
将所述子集中的各验证图像分别进行向量化处理,提取各所述验证图像中的特征进行融合以构造目标子集的浅层复合特征;
将所述目标子集的浅层复合特征与其他子集的浅层复合特征进行处理后得到该目标子集的目标特征,进而得到每个所述第一类别分别对应的目标特征。
3.根据权利要求2所述的图像分类方法,其特征在于,将所述子集中的各验证图像分别进行向量化处理,提取各所述验证图像中的特征进行融合以构造目标子集的浅层复合特征的步骤具体为:
将所述子集中的各验证图像进行向量化处理后,采用主成分分析技术和方向梯度直方图技术提取每张所述验证图像中的特征,并将提取到的特征进行融合以构造目标子集的浅层复合特征;
所述将所述目标子集的浅层复合特征与其他子集的浅层复合特征进行处理后得到目标特征的步骤具体为:
将所述目标子集的浅层复合特征与其他子集的浅层复合特征采用SIFT算法和lowe’s算法进行计算,得到所述目标子集的浅层符合特征中与其他子集之间的最优匹配点,并在所述目标子集的浅层复合特征中排除所述最优匹配点得到目标特征。
4.根据权利要求1所述的图像分类方法,其特征在于,对所述多张待标注图像进行聚类的步骤包括:
采用K-Means聚类算法对所述多张待标注图像进行聚类。
5.根据权利要求1所述的图像分类方法,其特征在于,针对每个第一类别,确定与该第一类别匹配的第二类别的步骤包括:
针对每个第一类别,将该第一类别中的所有待标注图像与各所述第二类别中所有待标注图像进行相似度计算,将包括的待标注图像与该第一类别中的待标注图像的相似度最高的第二类别确定为与该第一类别匹配的第二类别。
6.一种图像分类装置,其特征在于,所述装置包括:
类别获得模块,用于获得多个第一类别,以及每个所述第一类别分别对应的目标特征;
第一分类模块,用于获取多张待标注图像,将每张所述待标注图像分别与各所述目标特征进行匹配,将与同一目标特征匹配的所有待标注图像归类至与该目标特征对应的第一类别中,得到每个所述第一类别分别包括的待标注图像;
第二分类模块,用于对所述多张待标注图像进行聚类,得到多张待标注图像聚类至的多个第二类别,其中,所述多个第二类别的类别数量与所述多个第一类别的类别数量相同;
第三分类模块,用于针对每个第一类别,确定与该第一类别匹配的第二类别,将该第一类别中与确定的第二类别中相同的待标注图像作为目标类别包括的待标注图像,得到多个目标类别和每个目标类别包括的待标注图像。
7.根据权利要求6所述的图像分类装置,其特征在于,所述装置还包括:
验证集获取模块,用于获取包括多个子集的验证集,其中,每个所述子集包括属于同一第一类别第一类别的多张验证图像,且每个子集分别与一个第一类别对应;
处理模块,用于将所述子集中的各验证图像分别进行向量化处理,提取各所述验证图像中的特征进行融合以构造目标子集的浅层复合特征;
目标特征获得模块,用于将所述目标子集的浅层复合特征与其他子集的浅层复合特征进行处理后得到该目标子集的目标特征,进而得到每个所述第一类别分别对应的目标特征。
8.根据权利要求7所述的图像分类装置,其特征在于,所述处理模块具体用于,将所述子集中的各验证图像进行向量化处理后,采用主成分分析技术和方向梯度直方图技术提取每张所述验证图像中的特征,并将提取到的特征进行融合以构造目标子集的浅层复合特征;
所述目标特征获得模块具体用于,将所述目标子集的浅层复合特征与其他子集的浅层复合特征采用SIFT算法和lowe’s算法进行计算,得到所述目标子集的浅层符合特征中与其他子集之间的最优匹配点,并在所述目标子集的浅层复合特征中排除所述最优匹配点得到目标特征。
9.根据权利要求6所述的图像分类装置,其特征在于,所述第二分类模块具体用于,采用K-Means聚类算法对所述多张待标注图像进行聚类。
10.根据权利要求6所述的图像分类装置,其特征在于,所述第三分类模块具体用于,针对每个第一类别,将该第一类别中的所有待标注图像与各所述第二类别中所有待标注图像进行相似度计算,将包括的待标注图像与该第一类别中的待标注图像的相似度最高的第二类别确定为与该第一类别匹配的第二类别。
CN201910390868.XA 2019-05-10 2019-05-10 图像分类方法及装置 Active CN110110795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910390868.XA CN110110795B (zh) 2019-05-10 2019-05-10 图像分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910390868.XA CN110110795B (zh) 2019-05-10 2019-05-10 图像分类方法及装置

Publications (2)

Publication Number Publication Date
CN110110795A true CN110110795A (zh) 2019-08-09
CN110110795B CN110110795B (zh) 2021-04-20

Family

ID=67489513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910390868.XA Active CN110110795B (zh) 2019-05-10 2019-05-10 图像分类方法及装置

Country Status (1)

Country Link
CN (1) CN110110795B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070144A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 图像聚类方法、装置、电子设备以及存储介质
WO2021227869A1 (zh) * 2020-05-13 2021-11-18 北京三快在线科技有限公司 搜索意图识别

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101506843A (zh) * 2006-08-14 2009-08-12 微软公司 图像中的对象的自动分类
US8442321B1 (en) * 2011-09-14 2013-05-14 Google Inc. Object recognition in images
CN104252628A (zh) * 2013-06-28 2014-12-31 广州华多网络科技有限公司 人脸图像标注方法和系统
US20150098652A1 (en) * 2013-10-09 2015-04-09 Canon Kabushiki Kaisha Image processing method and image processing apparatus for segmenting image into regions
CN104599275A (zh) * 2015-01-27 2015-05-06 浙江大学 基于概率图模型的非参数化的rgb-d场景理解方法
CN105094760A (zh) * 2014-04-28 2015-11-25 小米科技有限责任公司 一种图片标记方法及装置
CN106874879A (zh) * 2017-02-21 2017-06-20 华南师范大学 基于多特征融合和深度学习网络提取的手写数字识别方法
CN107644235A (zh) * 2017-10-24 2018-01-30 广西师范大学 基于半监督学习的图像自动标注方法
CN108960297A (zh) * 2018-06-15 2018-12-07 北京金山云网络技术有限公司 图片的标注方法、标注装置、设备及存储介质
CN109325512A (zh) * 2018-08-01 2019-02-12 北京市商汤科技开发有限公司 图像分类方法及装置、电子设备、计算机程序及存储介质
CN109389175A (zh) * 2018-10-24 2019-02-26 广东工业大学 一种图片分类方法及装置
CN109472307A (zh) * 2018-11-07 2019-03-15 郑州云海信息技术有限公司 一种训练图像分类模型的方法和装置
CN109657087A (zh) * 2018-11-30 2019-04-19 平安科技(深圳)有限公司 一种数据批量标注方法、装置及计算机可读存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101506843A (zh) * 2006-08-14 2009-08-12 微软公司 图像中的对象的自动分类
US8442321B1 (en) * 2011-09-14 2013-05-14 Google Inc. Object recognition in images
CN104252628A (zh) * 2013-06-28 2014-12-31 广州华多网络科技有限公司 人脸图像标注方法和系统
US20150098652A1 (en) * 2013-10-09 2015-04-09 Canon Kabushiki Kaisha Image processing method and image processing apparatus for segmenting image into regions
CN105094760A (zh) * 2014-04-28 2015-11-25 小米科技有限责任公司 一种图片标记方法及装置
CN104599275A (zh) * 2015-01-27 2015-05-06 浙江大学 基于概率图模型的非参数化的rgb-d场景理解方法
CN106874879A (zh) * 2017-02-21 2017-06-20 华南师范大学 基于多特征融合和深度学习网络提取的手写数字识别方法
CN107644235A (zh) * 2017-10-24 2018-01-30 广西师范大学 基于半监督学习的图像自动标注方法
CN108960297A (zh) * 2018-06-15 2018-12-07 北京金山云网络技术有限公司 图片的标注方法、标注装置、设备及存储介质
CN109325512A (zh) * 2018-08-01 2019-02-12 北京市商汤科技开发有限公司 图像分类方法及装置、电子设备、计算机程序及存储介质
CN109389175A (zh) * 2018-10-24 2019-02-26 广东工业大学 一种图片分类方法及装置
CN109472307A (zh) * 2018-11-07 2019-03-15 郑州云海信息技术有限公司 一种训练图像分类模型的方法和装置
CN109657087A (zh) * 2018-11-30 2019-04-19 平安科技(深圳)有限公司 一种数据批量标注方法、装置及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021227869A1 (zh) * 2020-05-13 2021-11-18 北京三快在线科技有限公司 搜索意图识别
CN112070144A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 图像聚类方法、装置、电子设备以及存储介质

Also Published As

Publication number Publication date
CN110110795B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
Gopalakrishnan et al. Salient region detection by modeling distributions of color and orientation
Lu et al. Dense and sparse reconstruction error based saliency descriptor
Doyle et al. Cascaded discrimination of normal, abnormal, and confounder classes in histopathology: Gleason grading of prostate cancer
CN102027488B (zh) 使用梯度直方图的指纹表示
Wang et al. iVAT and aVAT: enhanced visual analysis for cluster tendency assessment
Lu et al. Saliency modeling from image histograms
CN105303169B (zh) 一种基于慢特征的细胞分裂识别方法及其识别装置
CN110533654A (zh) 零部件的异常检测方法及装置
CN109817339A (zh) 基于大数据的患者分组方法和装置
WO2013019856A1 (en) Automated malignancy detection in breast histopathological images
CN103456013A (zh) 一种表示超像素以及度量超像素之间相似性的方法
CN112990259B (zh) 基于改进迁移学习的旋转机械轴承的早期故障诊断方法
CN110110795A (zh) 图像分类方法及装置
Gupta et al. An integrated multi-scale model for breast cancer histopathological image classification with joint colour-texture features
CN110020674B (zh) 一种提升局部类别区分度的跨领域自适应图像分类方法
Di Cataldo et al. ANAlyte: A modular image analysis tool for ANA testing with indirect immunofluorescence
Lee et al. Applying cellular automata to hyperspectral edge detection
Silva et al. Radial feature descriptors for cell classification and recommendation
Rathore et al. CBISC: a novel approach for colon biopsy image segmentation and classification
Pan et al. A review of machine learning approaches, challenges and prospects for computational tumor pathology
Zhuang et al. Multi-component attention-based convolution network for color difference recognition with wavelet entropy strategy
Andrushia et al. Visual attention-based leukocyte image segmentation using extreme learning machine
CN115188031A (zh) 指纹识别方法、计算机程序产品、存储介质及电子设备
CN107527011A (zh) 一种非接触式皮肤电阻变化趋势检测方法、装置及设备
Pan et al. Segmentation of blood and bone marrow cell images via learning by sampling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant