CN108710916A - 图片分类的方法及装置 - Google Patents

图片分类的方法及装置 Download PDF

Info

Publication number
CN108710916A
CN108710916A CN201810496556.2A CN201810496556A CN108710916A CN 108710916 A CN108710916 A CN 108710916A CN 201810496556 A CN201810496556 A CN 201810496556A CN 108710916 A CN108710916 A CN 108710916A
Authority
CN
China
Prior art keywords
target photo
classification
picture
feature
foundation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810496556.2A
Other languages
English (en)
Other versions
CN108710916B (zh
Inventor
初颖
向海明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Zhizhu perfect home Technology Co.,Ltd.
Original Assignee
Chongqing Perfect Interspace Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Perfect Interspace Technology Ltd filed Critical Chongqing Perfect Interspace Technology Ltd
Priority to CN201810496556.2A priority Critical patent/CN108710916B/zh
Publication of CN108710916A publication Critical patent/CN108710916A/zh
Application granted granted Critical
Publication of CN108710916B publication Critical patent/CN108710916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图片分类的方法及装置。其中,该方法包括:确定目标图片的分类依据;根据确定的分类依据从目标图片中提取目标图片的图片特征,其中,图片特征包括确定的分类依据下所属的至少两个维度的分类特征;按照提取的图片特征对目标图片进行分类。本发明解决了由于相关技术采用固定的分类依据,具体分类时采用单一分类特征对目标图片进行分类,导致对目标图片进行分类获得的分类结果误差大的技术问题。

Description

图片分类的方法及装置
技术领域
本发明涉及图片分类领域,具体而言,涉及一种图片分类的方法及装置。
背景技术
图片分类是根据各个图片所反映的不同特征,把不同类别的目标图片区分开来的图片处理方法。它利用计算机对图片进行定量分析,把图片或图片中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。在相关技术的图片分类的方法中,可以分为如下几类:1)人工对图片进行一些标注,然后根据标注的信息对图片进行分类,但是人工对图片进行标注的方法,需要耗费大量的人力,而且图片分类的准确率不高,不适用于较为复杂、要求精准的图片分类问题;2)对图片提取手工特征,然后利用传统分类方法进行图片分类,对图片提取的手工特征,以及利用卷积神经网络学习得到的特征,在进行图片分类的时候只能针对图片在某一方面的特性来进行分类,无法满足多角度的分类要求;3)利用卷积神经网络来提取图片特征,再利用传统分类方法来得到分类结果;或直接利用卷积神经网络来完成图片特征的提取以及分类,输出分类结果;利用卷积神经网络在进行特征提取的时候,特征的描述能力比较单一。
总之,在相关技术的图片分类方法中,大都是按照一种固定的分类依据对所有的目标图片进行分类,这样的分类方法,对不适用该分类依据的目标图片在对其进行分类时,会产生较大的分歧,严重影响分类结果;在相关技术的分类方法中提取的图片特征为单一特征,单一特征存在鲁棒性较差的情况,利用该特征得到的分类结果,较为片面,效果较差;而且相关技术的图片分类方法,大都将目标图片确定为一类分类组别,而在实际的图片分类过程中,往往存在一张图片同时与两类分类组别相关度较高,甚至多类,此时在相关技术中往往采用相关度最高的分类组别作为该图片的最终分类组别,但是按照单一特征分类的方法,本来就具有片面性,按照与单一特征的相关度来判定图片的最终分类,会造成更大的分类误差。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种图片分类的方法及装置,以至少解决由于相关技术采用固定的分类依据,具体分类时采用单一分类特征对目标图片进行分类,导致对目标图片进行分类获得的分类结果误差大的技术问题。
根据本发明实施例的一个方面,提供了一种图片分类的方法,包括:确定目标图片的分类依据;根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征,其中,所述图片特征包括确定的分类依据下所属的至少两个维度的分类特征;按照提取的所述图片特征对所述目标图片进行分类。
可选的,所述分类依据包括以下至少之一:图片的纹理特征,图片的形状特征。
可选的,在所述分类依据为图片的纹理特征的情况下,根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征包括:获取所述目标图片的灰度图,并采用预定模板对所述灰度图执行卷积操作,获得所述目标图片的第一部分纹理特征;获取所述目标图片的灰度共生矩阵,并依据所述灰度共生矩阵获得所述目标图片的第二部分纹理特征;将所述第一部分纹理特征和所述第二部分纹理特征进行级联,获得所述目标图片的级联特征,并将所述级联特征作为所述目标图片的图片特征。
可选的,采用预定模板对所述灰度图执行卷积操作,获得所述目标图片的第一部分纹理特征包括:采用所述预定模板对所述灰度图执行卷积操作并获得卷积结果后,将所述卷积结果的均值,均方差,偏态,峰度作为所述目标图片的第一部分纹理特征;依据所述灰度共生矩阵获得所述目标图片的第二部分纹理特征包括:将所述灰度共生矩阵的熵,能量,对比度,同质性作为所述目标图片的第二部分纹理特征。
可选的,在所述分类依据为图片的形状特征的情况下,根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征包括:获取所述目标图片的最外侧轮廓的轮廓面积与所述目标图片的最外侧轮廓的最小外接矩形的面积的第一比值;获取所述目标图片的最外侧轮廓的轮廓面积与所述目标图片的最外侧轮廓的凸包的面积的第二比值;确定所述第一比值与所述第二比值的均值;在所述均值小于预定阈值的情况下,在对所述目标图片进行角点检测后,获取所述目标图片中角点数最多的大小为N×N的图片块,并确定所述图片块的HOG特征为所述目标图片的图片特征;和/或在所述均值不小于预定阈值的情况下,将所述目标图片的大小变换为N×N,并确定变换大小的目标图片的HOG特征为所述目标图片的图片特征。
可选的,按照提取的所述图片特征对所述目标图片进行分类包括:通过图片分类模型,确定与提取的所述图片特征对应的所述目标图片的分类概率,其中,所述图片分类模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:图片特征和用于与该图片特征对应的图片的分类概率;根据确定的所述分类概率,确定所述目标图片的分类结果。
可选的,在分类依据为纹理特征的情况下,根据确定的所述分类概率,确定所述目标图片的分类结果包括:确定所述目标图片所属的各个类别的概率中的最大值和第二大值;在所述第二大值大于最大值的第一百分比,且所述第二大值大于第二百分比的情况下,将所述最大值和/或所述第二大值对应的分类结果作为所述目标图片的分类结果;否则将所述最大值对应的分类结果作为所述目标图片的分类结果。
可选的,在分类依据为形状特征的情况下,根据确定的所述分类概率,确定所述目标图片的分类结果包括:获取所述目标图片的最外侧轮廓的直线总长度与最外侧轮廓的总长度的第三比值;将圆滑度大于预定圆滑度的所述分类概率乘上所述第三比值后,获得所述目标图片所属的各个类别的概率中的最大值和第二大值;在所述第二大值大于最大值的第一百分比,且所述第二大值大于第二百分比的情况下,将所述最大值和/或所述第二大值对应的分类结果作为所述目标图片的分类结果;否则将所述最大值对应的分类结果作为所述目标图片的分类结果。
根据本发明实施例的另一个方面,提供了一种图片分类的装置,包括:确定模块,用于确定目标图片的分类依据;提取模块,用于根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征,其中,所述图片特征包括确定的分类依据下所属的至少两个维度的分类特征;分类模块,用于按照提取的所述图片特征对所述目标图片进行分类。
根据本发明实施例的另一个方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的图片分类方法。
根据本发明实施例的另一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的图片分类方法。
在本发明实施例中,采用确定目标图片的分类依据;根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征,其中,所述图片特征包括确定的分类依据下所属的至少两个维度的分类特征的方式,通过按照提取的所述图片特征对所述目标图片进行分类,达到了采用多维度分类特征对目标图片进行分类的目的,从而实现了更灵活得对目标图片进行分类,分类的结果准确性更高的技术效果,进而解决了由于相关技术采用固定的分类依据,具体分类时采用单一分类特征对目标图片进行分类,导致对目标图片进行分类获得的分类结果误差大的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种图片分类的方法的流程图;
图2是根据本发明实施例的一种图片分类的装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种图片分类的方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种图片分类的方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,确定目标图片的分类依据;
步骤S104,根据确定的分类依据从目标图片中提取目标图片的图片特征,其中,图片特征包括确定的分类依据下所属的至少两个维度的分类特征;
步骤S106,按照提取的图片特征对目标图片进行分类。
通过上述步骤,可以实现采用确定目标图片的分类依据;根据确定的分类依据从目标图片中提取目标图片的图片特征,其中,图片特征包括确定的分类依据下所属的至少两个维度的分类特征的方式,通过按照提取的图片特征对目标图片进行分类,达到了采用多维度分类特征对目标图片进行分类的目的,从而实现了更灵活地对目标图片进行分类,分类的结果准确性更高的技术效果,进而解决了由于相关技术采用固定的分类依据,具体分类时采用单一分类特征对目标图片进行分类,导致对目标图片进行分类获得的分类结果误差大的技术问题。
图片的分类依据可以是多种,可以包括基于色彩特征的分类依据,基于纹理特征的分类依据,基于形状特征的分类依据,基于空间关系的分类依据等等。不同的分类依据所具有的优势和劣势是不同的,针对目标图片,选择正确的分类依据是十分重要的。分类依据决定了该分类依据下的分类结果。用户可以根据自己对分类结果的需求选择相应的分类依据,避免了相关技术中只能根据一种或固定的几种分类依据对目标图片进行分类,无法满足用户需求的多样性。
该图片特征分为单一特征和融合特征,该单一特征为确定的分类依据下所属的一个维度的分类特征。例如,形状分类依据下的圆形,该融合特征为确定的分类依据下所属的至少两个维度的分类特征,该融合特征为至少两个维度的分类特征对应的多个单一特征的融合,例如形状分类依据下的圆角矩形。在分类过程中采用融合特征具有较好的分类鲁棒性,可以使分类结果的准确性和稳定有效提升。
按照提取的图片特征对目标图片进行分类,一般的分类结果是确定该目标图片属于上述分类依据下的哪一类,只能输出单一的确定分类结果。本发明实施例中,可以输出多个分类结果,考虑到部分目标图片存在多类别的可能性,按照分类的具体情况给出单一类别或者多类别的分类结果。而且在相关技术中,单一的分类结果相对而言是一个较为粗糙的分类结果,例如,针对形状而言只能描述其是圆形还是方形;而在本发明实施例中,是对相关技术中的单一分类结果的细化特征进行分类的,例如,还是针对形状而言,描述的是圆形的曲率特征,圆形的周长特征等,从而有效提升了分类结果的准确性。
可选的,分类依据包括以下至少之一:图片的纹理特征,图片的形状特征。
本实施例中,分别通过图片的纹理特征,图片的形状特征和为例进行说明。
可选的,在分类依据为图片的纹理特征的情况下,根据确定的分类依据从目标图片中提取目标图片的图片特征包括:获取目标图片的灰度图,并采用预定模板对灰度图执行卷积操作,获得目标图片的第一部分纹理特征;获取目标图片的灰度共生矩阵,并依据灰度共生矩阵获得目标图片的第二部分纹理特征;将第一部分纹理特征和第二部分纹理特征进行级联,获得目标图片的级联特征(即上述融合特征),并将级联特征作为目标图片的图片特征。
可选的,采用预定模板对灰度图执行卷积操作,获得目标图片的第一部分纹理特征包括:采用预定模板对灰度图执行卷积操作并获得卷积结果后,将卷积结果的均值,均方差,偏态,峰度作为目标图片的第一部分纹理特征;依据灰度共生矩阵获得目标图片的第二部分纹理特征包括:将灰度共生矩阵的熵,能量,对比度,同质性作为目标图片的第二部分纹理特征。
目标图片的纹理特征与目标图片的色彩无关,因此通常将目标图片转换为灰度图进行特征提取处理。灰度图在对目标图片的灰度图采用多个模板做卷积,对得到的多个卷积结果分别进行计算均值,均方差,偏态,峰度作为第一部分纹理特征,该第一部分纹理特征用于描述目标图片在横、纵方向的纹理特性。至于第二部分纹理特征,首先计算目标图片在水平、垂直、45度对角和135度对角的灰度共生矩阵,对每个灰度共生矩阵都计算熵、能量、对比度、同质性以及这四类数据分别的极差作为第二部分纹理特征。将第一部分纹理特征和第二部分纹理特征级联得到目标图片的整体纹理特征。
可选的,在分类依据为图片的形状特征的情况下,根据确定的分类依据从目标图片中提取目标图片的图片特征包括:获取目标图片的最外侧轮廓的轮廓面积与目标图片的最外侧轮廓的最小外接矩形的面积的第一比值;获取目标图片的最外侧轮廓的轮廓面积与目标图片的最外侧轮廓的凸包的面积的第二比值;确定第一比值与第二比值的均值;在均值小于预定阈值的情况下,在对目标图片进行角点检测后,获取目标图片中角点数最多的大小为N×N的图片块,并确定图片块的HOG特征为目标图片的图片特征;和/或在均值不小于预定阈值的情况下,将目标图片的大小变换为N×N,并确定变换大小的目标图片的HOG特征为目标图片的图片特征。
可选的,按照提取的图片特征对目标图片进行分类包括:通过图片分类模型,确定与提取的图片特征对应的目标图片的分类概率,其中,图片分类模型为使用多组数据通过机器学习训练得出的,多组数据中的每组数据均包括:图片特征和用于与该图片特征对应的图片的分类概率;根据确定的分类概率,确定目标图片的分类结果。即通过人工智能的方式,确定与图片的图片特征对应的图片的分类,提高确定图片分类的智能性和快捷性。
需要说明的是,在分类依据为形状特征的情况下,该目标图片为获取的图片进行处理确定的待处理图片,具体的处理步骤如下:选择视角对获取的图片进行分类,该视角包括近距离视角和远距离视角,在选择近距离视角的情况下,将获取的图片直接作为待处理图片,在选择远距离视角的情况下,需要对获取的图片进行颜色聚类处理,得到待处理图片。然后将待处理图片作为目标图片按照形状特征进行分类。
在获取第一比值和第二比值时,需要先对待处理图片进行处理,现将待处理图片同一到固定尺寸并且提取最外层轮廓,然后对最外层轮廓进行填充,并进行两次形态学开运算,其中,形态学开运算是为了消除该轮廓上细小的物体,使轮廓外形更加流畅,便于后续处理。求出最外侧轮廓的最小外接矩形的面积和最外侧轮廓的凸包的面积,最外侧轮廓的轮廓面积与目标图片的最外侧轮廓的最小外接矩形的面积的第一比值;最外侧轮廓的轮廓面积与目标图片的最外侧轮廓的凸包的面积的第二比值。
根据第一比值和第二比值的均值,来判断形状特征提取的不同情况,当该均值小于预定阈值的情况下,在对目标图片进行角点检测,并采取非极大值抑制的方式来优化角点个数,用N×N大小的图片块、N/2为步长统计目标图片中每个图片块内的角点个数,获取目标图片中角点数最多的大小为N×N的图片块,并对该图片块提取HOG特征为目标图片的图片特征;和/或在均值不小于预定阈值的情况下,将目标图片的大小变换为N×N,并确定变换大小的目标图片的HOG特征为目标图片的图片特征。需要说明的是,N的大小为经验值,一般取统一大小后的图片边长的1/8。
根据用户需求得到目标图片的图片特征,将该图片特征输入到已经训练好的神经网络模型中,得到分类结果,下面对本实施例中选取的两种分类依据,包括纹理特征和形状特征,分别进行说明。
若是根据纹理特征分类的情况,可选的,在分类依据为纹理特征的情况下,根据确定的分类概率,确定目标图片的分类结果包括:确定目标图片所属的各个类别的概率中的最大值和第二大值;在第二大值大于最大值的第一百分比,且第二大值大于第二百分比的情况下,将最大值和/或第二大值对应的分类结果作为目标图片的分类结果;否则将最大值对应的分类结果作为目标图片的分类结果。
若是根据形状特征分类的情况,可选的,在分类依据为形状特征的情况下,根据确定的分类概率,确定目标图片的分类结果包括:获取目标图片的最外侧轮廓的直线总长度与最外侧轮廓的总长度的第三比值;将圆滑度大于预定圆滑度的分类概率乘上第三比值后,获得目标图片所属的各个类别的概率中的最大值和第二大值;在第二大值大于最大值的第一百分比,且第二大值大于第二百分比的情况下,将最大值和/或第二大值对应的分类结果作为目标图片的分类结果;否则将最大值对应的分类结果作为目标图片的分类结果。
需要说明的是,在获取第三比值时,需要先对待处理图片进行处理,现将待处理图片统一到固定尺寸并且提取最外层轮廓,然后对最外层轮廓进行填充,并进行两次形态学开运算,然后对该最外层轮廓进行直线检测,第三比值为该最外层线上直线总长度L1与该最外层轮廓总长度L2之比。
需要说明的是,下面对本发明实施例的优选实施方式进行说明。
一种图片分类的方法,本优选实施方式解决的问题是:输入一张图片,然后选择依照纹理或者形状特征对输入的图片进行分类:若选择按照纹理分类,则对输入图片按照其纹理特点分类到波点、单色、方格、条纹、图案等类别中;若选择按照形状分类,则对输入图片按照其形状特点分类到自定义的九种形体趋势中。
具体的分类步骤为:1、输入待分类的图片,选择分类依据;2、根据所选择的分类依据,从纹理或者形状两个方面对输入的图片提取特征;3、将提取到的图片输入到分类器中,得到分类结果。
具体实施时步骤如下:1、用户输入待分类的物料图片,并且选择按照纹理或者形状特征对所输入物料图片进行分类;
2、若用户选择按照纹理特征进行分类,则对图片提取纹理特征,具体如下:将输入图片统一到固定尺寸,并且计算得到灰度图imgGray,然后用 这九个模板分别与灰度图imgGray做卷积,对9个卷积结果分别计算均值、均方差、偏态、峰度作为第一部分纹理特征用来描述原图片在横、纵方向的纹理特性;同时,分别计算原图片在水平、垂直、45度对角和135度对角的灰度共生矩阵,对每个灰度共生矩阵都计算熵、能量、对比度、同质性以及这四类数据分别的极差作为第二部分纹理特征;将以上两部分纹理特征级联得到原图片整体的纹理特征;
3、若用户选择按照形状特征来进行分类,用户可进一步选择从近距离视角或远距离视角来对输入图片进行形状分类,若用户选择以近距离视角来对图片进行形状分类,则处理对象为原始图片,若用户选择以远距离视角来对图片进行形状分类,则处理对象为颜色聚类后的图片(颜色聚类,即以图片中的像素点为单位,将每个像素点的RGB色彩模式(Red,Green,Blue,红绿蓝)三个通道的值看作一个三维向量,然后将图片中的所有像素点采用Kmeans等聚类方法聚类到K个聚类中心上,然后每个像素点的RGB三个通道的值取三维特征空间中离它最近的聚类中心对应RGB三个通道的值,得到聚类后的图片),聚类中心个数K越少,对应视角的距离越远。得到待处理图片后,提取形状特征的过程如下:对于待处理图片,先统一到固定尺寸并且提取最外层轮廓,然后对最外层轮廓进行填充,进行两次形态学开运算来消除轮廓上细小的物体,在处理后的轮廓上进行直线检测,通过轮廓线上直线总长度L1,将L1与轮廓总长度L2的比值P3(第三比值)作为轮廓上的直线所占比例,用来描述形状的整体曲直趋势;然后求出轮廓的最小外接矩形和凸包,并且计算得到轮廓面积与最小外接矩形的面积所成比例P1(第一比值),以及轮廓面积与凸包面积所成比例P2(第二比值),取P1与P2的均值P4,若P4小于阈值T,则对统一尺寸后的原始图片,进行Harris角点检测,并采取非极大值抑制的方式来优化角点个数,然后用N×N的patch大小、N/2为步长统计图片中每个patch(图片块)内的角点个数,取角点数最多的patch作为代表图片局部形状特征的patch,并对这个patch提取HOG(Histogram of OrientedGradient,方向梯度直方图)特征作为图片的形状特征,若P4不小于阈值T,则将原始图片大小变换为N×N,然后提取HOG特征作为图片的形状特征;
4、根据用户需求得到输入图片的纹理特征或者形状特征,并将所得纹理特征或者形状特征输入到已训练好的神经网络中,得到输入图片属于各个类别的概率,根据概率得出最终分类结果,具体如下:若用户选择的是根据纹理特征来进行分类,先找出所有概率中的最大值和第二大值,若概率第二大值大于最大值的1/2且概率第二大值大于30%,则将概率最大值对应类别作为第一分类结果,概率第二大值对应类别作为可能分类结果返回给用户,否则仅将概率最大值对应类别作为分类结果返回给用户;若用户选择的是根据形状特征来进行分类,先将自定义形状类别中较圆滑的类别的概率结果乘上比例P3,然后对处理后的所有概率,按照上述纹理特征中的分类结果返回方式,返回两个或一个分类结果给用户。
本优选实施方式具有以下优点:针对家居物料图片的特殊特征进行分类,比通用技术可以获得更好的分类效果;图片分类过程中,利用深度网络融合多种单一特征的特点,设计得到鲁棒性更好的特征,有效提升了分类效果;对于纹理特性分类部分,提供近距离和远距离两种视角的选择,满足更加广泛情况下的需求。
本优选实施方式与相关技术相比:根据用户需求来选择对物料图片分类的依据,可以满足多方面的分类要求;特征提取过程中,融合多种单一特征的特点,设计得到鲁棒性更好的特征,有效提升了分类效果;考虑到部分物料图片存在多类别的可能性,按照具体情况给出单一类别或者多类别的分类结果;对于纹理特性分类部分,提供近距离和远距离两种视角的选择,满足更加广泛情况下的需求。
需要说明的是,本优选实施方式在具体实施时:1、提取纹理特征的时候,与灰度图imgGray进行卷积的模板可以调整,只需满足卷积结果反映灰度图imgGray横纵方向的纹理特性;2、提取形状特征时,角点检测的方法除了Harris角点检测外,还可以采用Shi-Tomasi角点检测等其他角点检测方法;3、提取形状特征时,patch的形状特征除了用HOG描述子外,还可以采用傅立叶描述子等其他形状特征描述子;4、用户选择采用远距离视角的形状特征进行形状分类时,对原始图片进行颜色聚类的方法除了Kmeans聚类方法外,还可以采用mean-shift、谱聚类等方法。
图2是根据本发明实施例的一种图片分类的装置的结构示意图,如图2所示,该图片分类的装置20,包括:确定模块22,提取模块24和分类模块26,下面对该图片分类的装置20进行详细说明。
确定模块22,用于确定目标图片的分类依据;提取模块24,与上述确定模块22相连接,用于根据确定的分类依据从目标图片中提取目标图片的图片特征,其中,图片特征包括确定的分类依据下所属的至少两个维度的分类特征;分类模块26,与上述提取模块24相连接,用于按照提取的图片特征对目标图片进行分类。
通过上述装置,可以实现采用确定模块22确定目标图片的分类依据;提取模块24根据确定模块22确定的分类依据从目标图片中提取目标图片的图片特征,其中,图片特征包括确定模块22确定的分类依据下所属的至少两个维度的分类特征的方式,分类模块26通过按照提取模块24提取的图片特征对目标图片进行分类,达到了采用多维度分类特征对目标图片进行分类的目的,从而实现了更灵活得对目标图片进行分类,分类的结果准确性更高的技术效果,进而解决了由于相关技术采用固定的分类依据,具体分类时采用单一分类特征对目标图片进行分类,导致对目标图片进行分类获得的分类结果误差大的技术问题。
根据本发明实施例的另一个方面,提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述中任意一项的图片分类方法。
根据本发明实施例的另一个方面,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述中任意一项的图片分类方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (11)

1.一种图片分类的方法,其特征在于,包括:
确定目标图片的分类依据;
根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征,其中,所述图片特征包括确定的分类依据下所属的至少两个维度的分类特征;
按照提取的所述图片特征对所述目标图片进行分类。
2.根据权利要求1所述的方法,其特征在于,所述分类依据包括以下至少之一:图片的纹理特征,图片的形状特征。
3.根据权利要求2所述的方法,其特征在于,在所述分类依据为图片的纹理特征的情况下,根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征包括:
获取所述目标图片的灰度图,并采用预定模板对所述灰度图执行卷积操作,获得所述目标图片的第一部分纹理特征;
获取所述目标图片的灰度共生矩阵,并依据所述灰度共生矩阵获得所述目标图片的第二部分纹理特征;
将所述第一部分纹理特征和所述第二部分纹理特征进行级联,获得所述目标图片的级联特征,并将所述级联特征作为所述目标图片的图片特征。
4.根据权利要求3所述的方法,其特征在于,采用预定模板对所述灰度图执行卷积操作,获得所述目标图片的第一部分纹理特征包括:
采用所述预定模板对所述灰度图执行卷积操作并获得卷积结果后,将所述卷积结果的均值,均方差,偏态,峰度作为所述目标图片的第一部分纹理特征;
依据所述灰度共生矩阵获得所述目标图片的第二部分纹理特征包括:将所述灰度共生矩阵的熵,能量,对比度,同质性作为所述目标图片的第二部分纹理特征。
5.根据权利要求2所述的方法,其特征在于,在所述分类依据为图片的形状特征的情况下,根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征包括:
获取所述目标图片的最外侧轮廓的轮廓面积与所述目标图片的最外侧轮廓的最小外接矩形的面积的第一比值;
获取所述目标图片的最外侧轮廓的轮廓面积与所述目标图片的最外侧轮廓的凸包的面积的第二比值;
确定所述第一比值与所述第二比值的均值;
在所述均值小于预定阈值的情况下,在对所述目标图片进行角点检测后,获取所述目标图片中角点数最多的大小为N×N的图片块,并确定所述图片块的HOG特征为所述目标图片的图片特征;和/或在所述均值不小于预定阈值的情况下,将所述目标图片的大小变换为N×N,并确定变换大小的目标图片的HOG特征为所述目标图片的图片特征。
6.根据权利要求1至5中任一项所述的方法,其特征在于,按照提取的所述图片特征对所述目标图片进行分类包括:
通过图片分类模型,确定与提取的所述图片特征对应的所述目标图片的分类概率,其中,所述图片分类模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:图片特征和用于与该图片特征对应的图片的分类概率;
根据确定的所述分类概率,确定所述目标图片的分类结果。
7.根据权利要求6所述的方法,其特征在于,在分类依据为纹理特征的情况下,根据确定的所述分类概率,确定所述目标图片的分类结果包括:
确定所述目标图片所属的各个类别的概率中的最大值和第二大值;
在所述第二大值大于最大值的第一百分比,且所述第二大值大于第二百分比的情况下,将所述最大值和/或所述第二大值对应的分类结果作为所述目标图片的分类结果;否则将所述最大值对应的分类结果作为所述目标图片的分类结果。
8.根据权利要求6所述的方法,其特征在于,在分类依据为形状特征的情况下,根据确定的所述分类概率,确定所述目标图片的分类结果包括:
获取所述目标图片的最外侧轮廓的直线总长度与最外侧轮廓的总长度的第三比值;
将圆滑度大于预定圆滑度的所述分类概率乘上所述第三比值后,获得所述目标图片所属的各个类别的概率中的最大值和第二大值;
在所述第二大值大于最大值的第一百分比,且所述第二大值大于第二百分比的情况下,将所述最大值和/或所述第二大值对应的分类结果作为所述目标图片的分类结果;否则将所述最大值对应的分类结果作为所述目标图片的分类结果。
9.一种图片分类的装置,其特征在于,包括:
确定模块,用于确定目标图片的分类依据;
提取模块,用于根据确定的分类依据从所述目标图片中提取所述目标图片的图片特征,其中,所述图片特征包括确定的分类依据下所属的至少两个维度的分类特征;
分类模块,用于按照提取的所述图片特征对所述目标图片进行分类。
10.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至8中任意一项所述的图片分类方法。
11.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至8中任意一项所述的图片分类方法。
CN201810496556.2A 2018-05-22 2018-05-22 图片分类的方法及装置 Active CN108710916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810496556.2A CN108710916B (zh) 2018-05-22 2018-05-22 图片分类的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810496556.2A CN108710916B (zh) 2018-05-22 2018-05-22 图片分类的方法及装置

Publications (2)

Publication Number Publication Date
CN108710916A true CN108710916A (zh) 2018-10-26
CN108710916B CN108710916B (zh) 2020-10-09

Family

ID=63869401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810496556.2A Active CN108710916B (zh) 2018-05-22 2018-05-22 图片分类的方法及装置

Country Status (1)

Country Link
CN (1) CN108710916B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047057A (zh) * 2019-03-05 2019-07-23 惠州Tcl移动通信有限公司 一种图片处理方法、终端及存储装置
CN111738036A (zh) * 2019-03-25 2020-10-02 北京四维图新科技股份有限公司 图像处理方法、装置、设备及存储介质
CN111784710A (zh) * 2020-07-07 2020-10-16 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备和介质
CN112016586A (zh) * 2020-07-08 2020-12-01 武汉智筑完美家居科技有限公司 图片分类方法及装置
CN112069958A (zh) * 2020-08-27 2020-12-11 广西柳工机械股份有限公司 物料识别方法、装置、设备及存储介质
CN112070144A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 图像聚类方法、装置、电子设备以及存储介质
CN113610090A (zh) * 2021-07-29 2021-11-05 广州广电运通金融电子股份有限公司 印章图像识别分类方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090252413A1 (en) * 2008-04-04 2009-10-08 Microsoft Corporation Image classification
CN105630915A (zh) * 2015-12-21 2016-06-01 山东大学 一种移动终端中图片分类存储的方法及装置
CN105843827A (zh) * 2015-05-27 2016-08-10 维沃移动通信有限公司 移动终端的图片分类方法和装置
CN107944022A (zh) * 2017-12-11 2018-04-20 努比亚技术有限公司 图片分类方法、移动终端及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090252413A1 (en) * 2008-04-04 2009-10-08 Microsoft Corporation Image classification
US20120141020A1 (en) * 2008-04-04 2012-06-07 Microsoft Corporation Image classification
US20150055856A1 (en) * 2008-04-04 2015-02-26 Microsoft Technology Licensing, Llc Image classification
CN105843827A (zh) * 2015-05-27 2016-08-10 维沃移动通信有限公司 移动终端的图片分类方法和装置
CN105630915A (zh) * 2015-12-21 2016-06-01 山东大学 一种移动终端中图片分类存储的方法及装置
CN107944022A (zh) * 2017-12-11 2018-04-20 努比亚技术有限公司 图片分类方法、移动终端及计算机可读存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047057A (zh) * 2019-03-05 2019-07-23 惠州Tcl移动通信有限公司 一种图片处理方法、终端及存储装置
CN111738036A (zh) * 2019-03-25 2020-10-02 北京四维图新科技股份有限公司 图像处理方法、装置、设备及存储介质
CN111738036B (zh) * 2019-03-25 2023-09-29 北京四维图新科技股份有限公司 图像处理方法、装置、设备及存储介质
CN111784710A (zh) * 2020-07-07 2020-10-16 北京字节跳动网络技术有限公司 图像处理方法、装置、电子设备和介质
CN111784710B (zh) * 2020-07-07 2023-10-20 抖音视界有限公司 图像处理方法、装置、电子设备和介质
CN112016586A (zh) * 2020-07-08 2020-12-01 武汉智筑完美家居科技有限公司 图片分类方法及装置
CN112069958A (zh) * 2020-08-27 2020-12-11 广西柳工机械股份有限公司 物料识别方法、装置、设备及存储介质
CN112070144A (zh) * 2020-09-03 2020-12-11 Oppo广东移动通信有限公司 图像聚类方法、装置、电子设备以及存储介质
CN113610090A (zh) * 2021-07-29 2021-11-05 广州广电运通金融电子股份有限公司 印章图像识别分类方法、装置、计算机设备和存储介质
CN113610090B (zh) * 2021-07-29 2023-12-26 深圳广电银通金融电子科技有限公司 印章图像识别分类方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN108710916B (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
CN108710916A (zh) 图片分类的方法及装置
CN106650806B (zh) 一种用于行人检测的协同式深度网络模型方法
CN106056155B (zh) 基于边界信息融合的超像素分割方法
CN105184309B (zh) 基于cnn和svm的极化sar图像分类
CN103824059B (zh) 一种基于视频图像序列的人脸表情识别方法
CN106682633B (zh) 基于机器视觉的粪便镜检图像有形成分的分类识别方法
CN106599854B (zh) 基于多特征融合的人脸表情自动识别方法
CN108108761A (zh) 一种基于深度特征学习的快速交通信号灯检测方法
CN102496023B (zh) 像素层面的感兴趣区域提取方法
CN1894703B (zh) 模式识别方法和设备
WO2018052586A1 (en) Method and system for multi-scale cell image segmentation using multiple parallel convolutional neural networks
CN108491849A (zh) 基于三维稠密连接卷积神经网络的高光谱图像分类方法
WO2018052587A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN109214420A (zh) 基于视觉显著性检测的高纹理图像分类方法及系统
CN107977671A (zh) 一种基于多任务卷积神经网络的舌象分类方法
CN107330892A (zh) 一种基于随机森林法的向日葵病害识别方法
CN109635846A (zh) 一种多类医学图像判断方法和系统
CN105260738A (zh) 基于主动学习的高分辨率遥感影像变化检测方法及系统
CN105046272B (zh) 一种基于简洁非监督式卷积网络的图像分类方法
CN108537239A (zh) 一种图像显著性目标检测的方法
CN105205804A (zh) 血细胞图像中白细胞的核浆分离方法、分类方法及装置
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN109753950A (zh) 动态人脸表情识别方法
CN104182763A (zh) 一种基于花朵特征的植物种类识别系统
CN103440488A (zh) 一种虫害识别的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220127

Address after: 430070 No. 1705, 17th floor, tower office building, central creative building, No. 33, Luoyu Road, Hongshan District, Wuhan City, Hubei Province

Patentee after: Wuhan Zhizhu perfect home Technology Co.,Ltd.

Address before: 400043 unit 2, floor 19, No. 56-2, Ruitian Road, Yuzhong District, Chongqing

Patentee before: CHONGQING WANMEI KONGJIAN TECHNOLOGY CO.,LTD.