CN112016586A - 图片分类方法及装置 - Google Patents
图片分类方法及装置 Download PDFInfo
- Publication number
- CN112016586A CN112016586A CN202010653877.6A CN202010653877A CN112016586A CN 112016586 A CN112016586 A CN 112016586A CN 202010653877 A CN202010653877 A CN 202010653877A CN 112016586 A CN112016586 A CN 112016586A
- Authority
- CN
- China
- Prior art keywords
- picture
- features
- information
- extracting
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种图片分类方法及装置,本实施例提供的图片分类方法,包括:根据图片信息,确定图片的第一分类结果;根据所述第一分类结果指示的图片类别,分别提取不同的图片特征;所述图片特征包括:形状特征、颜色特征、纹理特征;对所述图片特征进行合并,得到融合特征;将所述融合特征输入经过训练的分类器,得到图片的第二分类结果。通过本公开实施例提供的图片分类方法,实现从审美心理学的角度有针对性地对图片进行特征提取再分类,从而提高图片分类的准确性。
Description
技术领域
本发明涉及图片处理技术领域,尤其涉及一种图片分类方法及装置。
背景技术
在家装设计中,需要设计出不同的家具供用户选择,为了更精准的知晓用户对某种家具的审美偏好,对各种家具图片的分类再分析就显得尤为重要。同时,用户对某种家具的审美偏好与用户的心理特征类型有关,例如用户的心理特征类型可分为幽柔婉约、活泼开朗、纯真可爱、正统权威、风韵典雅、浪漫怀旧等,每种类型的用户挑选的家具图片风格不一样,对应的组成家具的材质也不一样。
现有技术中的图片分类方法主要是先提取图片的单个特征,再采用分类器进行机器学习训练得出分类结果。这种处理方法得到的分类结果较为片面,由于没有结合用户心理特征进行分析,所以对用户的审美偏好判断并不准确。
因此,如何从审美心理学的角度有针对性地对图片进行特征提取再分类是一个亟待解决的问题。
发明内容
本发明提供一种图片分类方法,以实现从审美心理学的角度有针对性地对图片进行特征提取再分类,从而提高图片分类的准确性。
第一方面,本公开提供一种图片分类方法,包括:
根据图片信息,确定图片的第一分类结果;
根据第一分类结果指示的图片类别,分别提取不同的图片特征;图片特征包括:形状特征、颜色特征、纹理特征;
对图片特征进行合并,得到融合特征;
将融合特征输入经过训练的分类器,得到图片的第二分类结果。
在一种可能的设计中,根据图片信息,确定图片的第一分类结果,包括:
根据图片信息,将图片分为第一类图片和第二类图片;图片信息包括:形状信息、颜色信息以及纹理信息。
在一种可能的设计中,根据第一分类结果指示的图片类别,分别提取不同的图片特征,包括:
当图片为第一类图片时,提取图片的形状特征和颜色特征;
当图片为第二类图片时,提取图片的纹理特征和颜色特征。
在一种可能的设计中,当图片为第一类图片时,提取图片的形状特征和颜色特征,包括:
计算图片的轮廓的直线比例以及凹凸程度;
根据角点检测法,提取图片的方向梯度直方图特征;
当直线比例在第一阈值内;且凹凸程度在第二阈值内时,根据方向梯度直方图特征,确定形状特征;
按照视觉处理算法,将图片的像素转换为六角锥体模型的参数;
将参数归一化,构建8位直方图,确定颜色特征。
在一种可能的设计中,当图片为第二类图片时,提取图片的纹理特征和颜色特征,包括:
提取图片的灰度共生矩阵特征和局部二值模式特征;
综合灰度共生矩阵特征和局部二值模式特征,确定纹理特征;
按照视觉处理算法,将图片的像素转换为六角锥体模型的参数;
将参数归一化,构建8位直方图,确定颜色特征。
在一种可能的设计中,计算图片的轮廓的直线比例以及凹凸程度,包括:
对图片做灰度处理并二值化,应用轮廓检测函数提取图片的轮廓信息;
根据轮廓信息,计算图片的轮廓的直线比例以及凹凸程度。
第二方面,本公开还提供一种图片分类装置,包括:
第一确定模块,用于根据图片信息,确定图片的第一分类结果;
第二确定模块,用于根据第一分类结果指示的图片类别,分别提取不同的图片特征;图片特征包括:形状特征、颜色特征、纹理特征;对图片特征进行合并,得到融合特征;
第三确定模块,用于将融合特征输入经过训练的分类器,得到图片的第二分类结果。
在一种可能的设计中,第一确定模块,具体用于:
根据图片信息,将图片分为第一类图片和第二类图片;图片信息包括:形状信息、颜色信息以及纹理信息。
在一种可能的设计中,第二确定模块,用于:
当图片为第一类图片时,提取图片的形状特征和颜色特征;
当图片为第二类图片时,提取图片的纹理特征和颜色特征。
在一种可能的设计中,第二确定模块,具体用于:
计算图片的轮廓的直线比例以及凹凸程度;
根据角点检测法,提取图片的方向梯度直方图特征;
当直线比例在第一阈值内;且凹凸程度在第二阈值内时,根据方向梯度直方图特征,确定形状特征;
按照视觉处理算法,将图片的像素转换为六角锥体模型的参数;
将参数归一化,构建8位直方图,确定颜色特征。
在一种可能的设计中,第二确定模块,具体用于:
提取图片的灰度共生矩阵特征和局部二值模式特征;
综合灰度共生矩阵特征和局部二值模式特征,确定纹理特征;
按照视觉处理算法,将图片的像素转换为六角锥体模型的参数;
将参数归一化,构建8位直方图,确定颜色特征。
在一种可能的设计中,第二确定模块,具体用于:
对图片做灰度处理并二值化,应用轮廓检测函数提取图片的轮廓信息;
根据轮廓信息,计算图片的轮廓的直线比例以及凹凸程度。
第三方面,本公开还提供一种图像处理设备,包括:
处理器;以及,
存储器,用于存储处理器的可执行指令;
其中,处理器配置为经由执行可执行指令来执行第一方面中任意一种图片分类方法。
第四方面,本公开实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任意一种图片分类方法。
本公开提供一种图片分类方法及装置,通过根据图片信息,确定图片的第一分类结果;根据第一分类结果指示的图片类别,分别提取不同的图片特征;图片特征包括:形状特征、颜色特征、纹理特征;对图片特征进行合并,得到融合特征;将融合特征输入经过训练的分类器,得到图片的第二分类结果,以实现从审美心理学的角度有针对性地对图片进行特征提取再分类,从而提高图片分类的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开根据一示例实施例示出的图片分类方法的应用场景图;
图2为本公开根据一示例实施例示出的图片分类方法的流程示意图;
图3为本公开根据一示例实施例示出的图片分类方法的第一类图片的特征提取原理示意图;
图4为本公开根据一示例实施例示出的图片分类方法的第一类图片特征提取结果示意图;
图5为本公开根据一示例实施例示出的图片分类方法的第二类图片的特征提取原理示意图;
图6为本公开根据一示例实施例示出的图片分类装置的结构示意图;
图7为本公开根据一示例实施例示出的图像处理设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面将结合附图,对本发明的实施例进行描述。
图1为本公开根据一示例实施例示出的图片分类方法的应用场景图,如图1所示,对图片结合客户审美心理进行分类的具体过程是首先根据图片101中的特征信息进行初步的处理分类,特征信息包括:形状信息、颜色信息和纹理信息;当图片中主要包含形状信息和颜色信息时为第一类图片;当图片中主要包含纹理信息和颜色信息时为第二类图片,经初步处理后得到第一分类结果102;对第一分类结果102进行特征提取,提取出第一特征103和第二特征104,比如当第一分类结果102为第一类图片时,提取形状特征和颜色特征;当第一分类结果102为第二类图片时,提取纹理特征和颜色特征;将第一特征103和第二特征104进行融合,融合后的特征输入分类器105中,经分类器的模型训练得到图片的第二分类结果106。通过这种处理方法,在图片分类时,有针对性地提取审美偏好相关的特征再进行融合分类,从而提高图片分类的准确性。
图2为本公开根据一示例实施例示出的图片分类方法的流程示意图;如图2所示,本实施例提供的图片分类方法,包括:
步骤201、根据图片信息,确定图片的第一分类结果;
具体的,根据图片信息,将图片分为第一类图片和第二类图片,并确定图片的第一分类结果是第一类图片还是第二类图片;其中,图片信息包括:形状信息、颜色信息以及纹理信息,举例来说,形状信息包括图片中的门、床、衣柜和沙发等;颜色信息包括图片的色彩;纹理信息包括地板、瓷砖类的纹理等。当图片中主要包含形状信息和颜色信息时为第一类图片;当图片中主要包含纹理信息和颜色信息时为第二类图片。
步骤202、根据第一分类结果指示的图片类别,分别提取不同的图片特征;图片特征包括:形状特征、颜色特征、纹理特征;
具体的,当图片为第一类图片时,提取图片的形状特征和颜色特征;当图片为第二类图片时,提取图片的纹理特征和颜色特征。
当图片为第一类图片时,计算图片的轮廓的直线比例以及凹凸程度;根据角点检测法,提取图片的方向梯度直方图特征;当直线比例在第一阈值内;且凹凸程度在第二阈值内时,根据方向梯度直方图特征,确定形状特征;按照视觉处理算法,将图片的像素转换为六角锥体模型的参数;将参数归一化,构建8位直方图,确定颜色特征。其中,计算图片的轮廓的直线比例以及凹凸程度包括:对图片做灰度处理并二值化,应用轮廓检测函数提取图片的轮廓信息;根据轮廓信息,计算图片的轮廓的直线比例以及凹凸程度。形状特征和颜色特征的具体处理详情如下。
图3为本公开根据一示例实施例示出的图片分类方法的第一类图片的特征提取原理示意图,如图3所示,对图片进行形状特征提取和颜色特征提取;考虑到并不是所有的形状特征都会对审美类型产生影响,从审美心理学的角度来讲,图片中物体直线所占的比例,拐角处的凹凸角度对形状的影响更为重要,因此形状特征提取主要从这两方面分析,首先将图片转化为灰度图片并二值化,即将3通道的彩色图片进行灰度处理,转变为1通道的灰度图片;再将转变后的灰度图片的每个像素转换为非黑即白的像素,像素值为0或255。其次,通过形态学处理去除边角上的细小特征,其中,形态学处理指的是对于图像的膨胀腐蚀等操作,包括去除边、角上的模糊信息以及轮廓模糊信息,使用findContours()函数,提取图像外轮廓的信息,以使处理后的图片能更明显地表现图片中的边、角等特征,处理前后的图像信息如图4所示,图4为本公开根据一示例实施例示出的图片分类方法的第一类图片特征提取结果实物示意图。再次,对二值化后的图片计算最外轮廓上的直线比例以及凹凸程度,直线比例的计算是通过像素计算轮廓长度除以轮廓的折线段之和的轮廓长度得到;凹凸程度是通过直接计算轮廓图形内接面积除以图形的外界多边形面积得到;同时通过角点检测法,提取图片的方向梯度直方图特征,其中,角点即轮廓之间的交点;角点检测法的基本思想是使用一个固定窗口在图像上进行任意方向的滑动,对比滑动前与滑动后窗口中的像素灰度的不同变化程度以确定该窗口中是否存在角点。当窗口在任意方向滑动,像素灰度都有较大变化时,即确定该窗口中存在角点;将图片中的存在的角点都找出后,从中筛选出角点分布最密集的图片块,该图片块即为图片的关键特征,对该图片块提取方向梯度直方图(Histogram of Oriented Gradient,HOG),即计算图片块中不同方向上梯度的值,进行累积后得到方向梯度直方图。比如,图4中的图片经上述方法提取得到的HOG特征维数为3249维。设定直线比例的正常范围为第一阈值,设定凹凸程度的正常范围为第二阈值,将上述得到的直线比例和第一阈值比较,凹凸程度和第二阈值比较;当直线比例在第一阈值内,且凹凸程度在第二阈值内时,确定图片的形状特征维数为3249维。形状特征提取的同时,还有对图片颜色特征的提取,颜色信息对于审美偏好产生的影响很大,主要的影响来自于图片中呈现出来的主颜色特征,具体提取过程如下。
首先,通过opencv中的算法将图片从颜色空间(RED、GREEN、BLUE空间,RGB空间)转化为六角锥体模型(Hexcone Model,HM),其中,六角锥体模型包括的颜色参数为色调、饱和度和明度,用于表示图片中像素点的三个分量。其次,将图片中每个像素点的三个分量分别归一化到0-255范围内,即对每个像素点的三个分量分别计算新的值Pnew=(P-Pmin)/(Pmax-Pmin)*255,其中,Pnew表示像素点归一化后一个分量在空间的值,P表示像素点归一化前一个分量在空间的原值,Pmax和Pmin表示所有像素点在空间的原最大值和原最小值;经计算后每个像素点的一个分量均对应六角锥体模型的一个8位2进制数的值,该值的范围为0-255。再次,取每个像素点的三个分量对应的三通道的前4、2、2位综合构成新的8位二进制数,应用每个像素点的新的8位二进制数构建像素点整体的8位直方图,其中,直方图共有256个纵坐标,对应8位二进制数的取值范围0-255,根据每个像素点在直方图中的分布确定图片的颜色特征的维数为256维。
因此,通过上述提取方法,确定图片的形状特征维数为3249维和颜色特征的维数为256维。
当图片为第二类图片时,图5为本公开根据一示例实施例示出的图片分类方法的第二类图片的特征提取原理示意图,如图5所示,提取图片的灰度共生矩阵特征和局部二值模式特征;综合灰度共生矩阵特征和局部二值模式特征,确定纹理特征;按照视觉处理算法,将图片的像素转换为六角锥体模型的参数;将参数归一化,构建8位直方图,确定颜色特征。其中,颜色特征的提取同上文所述,纹理特征的提取具体详情如下。
纹理特征的提取是由两部分特征提取再综合得出,一部分是作为图片的全局纹理特征的灰度共生矩阵特征(Grey-Level Co-occurrence Matrix,GLCM),另一部分是作为图片的局部纹理特征的局部二值模式特征(Local Binary Pattern,LBP)。
其中,一部分的灰度共生矩阵特征,是对图像上保持一定距离的两像素分别具有的灰度状况进行统计得到的,取图像(N×N)中任意一点(x,y)及偏离它的另一点(x+a,y+b),设点(x,y)对应的灰度值为(g1,g2),令点(x,y)在整个画面上移动,则会得到灰度值(g1,g2)的各种取值,设灰度值的级数为k,则(g1,g2)的组合共有k的平方种;对整个图片,统计出每一种(g1,g2)值出现的次数,将这些次数排列成一个方阵;再对这些次数求和得到(g1,g2)出现的总次数,用总次数将出现的各种次数归一化为出现的概率P(g1,g2);当偏离的差分值(a,b)取不同的数值时,可以得到概率P(g1,g2)在不同情况下的联合概率矩阵,根据联合概率矩阵得到灰度共生矩阵特征的维数为12。
另一部分的局部二值模式特征,记录的是中心像素点与领域像素点之间的差值,先将一个像素点和8个与之相邻的像素点之间的差值关系用一个数表示,这个数的取值范围是0-255;再应用像素点的这些表示差值关系的数做直方图,根据直方图确定局部二值模式特征的维数为59维。综合灰度共生矩阵特征的维数12,得到纹理特征的维数为71。
步骤203、对图片特征进行合并,得到融合特征;
具体的,对第一类图片,将图片的形状特征维数3249维和颜色特征的维数256维进行合并归一化,得到第一类图片的融合特征维数为3505维。
对第二类图片,将图片的纹理特征维数71维和颜色特征的维数256维进行合并归一化,得到第二类图片的融合特征维数为327维。
步骤204、将融合特征输入经过训练的分类器,得到图片的第二分类结果。
具体的,对第一类图片或第二类图片,先应用公式Fnew=(F-Fmin)/(Fmax-Fmin)*1计算图片原特征值对应的归一化后的值,其中,Fmin表示所有特征中的最小值,Fmax表示所有特征中的最大值,F,Fnew分别表示特征值归一化前、后的值;在得出所有归一化后的特征值后,选取一定数量图片的归一化后的特征值作为训练样本,采用支持向量机(Support VectorMachine,SVM)分类器对这些特征值进行训练,分类器根据心理学类别的不同设定为不同的类型,训练后的输出值为0或1,0、1用于表示图片是否属于设定的心理学类别,经过训练后,得到该类型分类器的参数;再选取另一部分数量图片的归一化后的特征值作为测试样本,对训练好后的SVM分类器进行测试,不断调整参数以得到有更好效果且效果稳定的分类器。
进一步具体的,分类器使用自动参数优化的SVM分类器(C_SVC类),允许用异常值惩罚因子C进行不完全分类,采用径向基函数(Radial Basis Function,RBF)作为内核函数,其中,径向基函数是指某种沿径向对称的标量函数。通过输入的特征值以及经分类器训练的输出值不断迭代计算,并返回损失函数对参数以及惩罚因子C进行优化,从而得到有更好效果且效果稳定的分类器。
举例来说,SVM分类器设有22个类型(包括但不限于22类),分别对应22种心理学类别,包括:正义端正、幽柔婉约、活泼开朗、忠厚传统、率直爽快、自然融合、现代都会、民俗淳朴、温文尔雅、细致慈爱、狂野强韧、魄力勇敢、纯真可爱、豪华富足、正统权威、运动活力、高贵雅致、风韵典雅、浪漫怀旧、柔和亲切、端庄复古以及革新前卫。这22个类型的SVM分类器相互独立,每个分类器单独进行图片归属心理学类别的判断。
其中,第一类图片分类的实验结果如表一所示,第一类图片的数量共4822张,随机取出其中的4000张作为训练样本,822张作为测试样本,经训练后得到分类器的参数为为0.03375,惩罚因子C为为2.5。
表一
第二类图片分类的实验结果如表二所示,第二类图片的数量共2818张,随机取出其中的2000张作为训练样本,818张作为测试样本,经训练后得到分类器的参数为为0.03375,惩罚因子C为为2.5。
表二
通过上述步骤201-204的处理方法结合举例的实验数据结果,可以看出,将图片根据图片信息中的形状信息、颜色信息以及纹理信息初步分类,再对分类后的图片根据不同的算法提取相应的形状特征和颜色特征,或者纹理特征和颜色特征,将特征对应融合后采用SVM分类器进行分类得到审美心理学角度的图片归类。这种处理方法得到的图片分类的准确性很高,从而能够更加精准地、有针对性地设计开发出适应用户风格的家具产品。
图6为本公开根据一示例实施例示出的图片分类装置的结构示意图。如图6所示,本实施例提供的图片分类装置60,包括:
第一确定模块601,用于根据图片信息,确定图片的第一分类结果;
第二确定模块602,用于根据第一分类结果指示的图片类别,分别提取不同的图片特征;图片特征包括:形状特征、颜色特征、纹理特征;对图片特征进行合并,得到融合特征;
第三确定模块603,用于将融合特征输入经过训练的分类器,得到图片的第二分类结果。
在一种可能的设计中,第一确定模块601,具体用于:
根据图片信息,将图片分为第一类图片和第二类图片;图片信息包括:形状信息、颜色信息以及纹理信息。
在一种可能的设计中,第二确定模块602,用于:
当图片为第一类图片时,提取图片的形状特征和颜色特征;
当图片为第二类图片时,提取图片的纹理特征和颜色特征。
在一种可能的设计中,第二确定模块602,具体用于:
计算图片的轮廓的直线比例以及凹凸程度;
根据角点检测法,提取图片的方向梯度直方图特征;
当直线比例在第一阈值内;且凹凸程度在第二阈值内时,根据方向梯度直方图特征,确定形状特征;
按照视觉处理算法,将图片的像素转换为六角锥体模型的参数;
将参数归一化,构建8位直方图,确定颜色特征。
在一种可能的设计中,第二确定模块602,具体用于:
提取图片的灰度共生矩阵特征和局部二值模式特征;
综合灰度共生矩阵特征和局部二值模式特征,确定纹理特征;
按照视觉处理算法,将图片的像素转换为六角锥体模型的参数;
将参数归一化,构建8位直方图,确定颜色特征。
在一种可能的设计中,第二确定模块602,具体用于:
对图片做灰度处理并二值化,应用轮廓检测函数提取图片的轮廓信息;
根据轮廓信息,计算图片的轮廓的直线比例以及凹凸程度。
图7为本公开根据一示例实施例示出的图像处理设备的结构示意图。如图7所示,本实施例提供的一种图像处理设备70,包括:
处理器701;以及,
存储器702,用于存储处理器的可执行指令,该存储器还可以是flash(闪存);
其中,处理器701配置为经由执行可执行指令来执行上述方法中的各个步骤。具体可以参见前面方法实施例中的相关描述。
可选地,存储器702既可以是独立的,也可以跟处理器701集成在一起。
当存储器702是独立于处理器701之外的器件时,图像处理设备70,还可以包括:
总线703,用于连接处理器701以及存储器702。
此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当用户设备的至少一个处理器执行该计算机执行指令时,用户设备执行上述各种可能的方法。
其中,计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于通信设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (14)
1.一种图片分类方法,其特征在于,包括:
根据图片信息,确定图片的第一分类结果;
根据所述第一分类结果指示的图片类别,分别提取不同的图片特征;所述图片特征包括:形状特征、颜色特征、纹理特征;
对所述图片特征进行合并,得到融合特征;
将所述融合特征输入经过训练的分类器,得到图片的第二分类结果。
2.根据权利要求1所述的方法,其特征在于,所述根据图片信息,确定图片的第一分类结果,包括:
根据所述图片信息,将图片分为第一类图片和第二类图片;所述图片信息包括:形状信息、颜色信息以及纹理信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一分类结果指示的图片类别,分别提取不同的图片特征,包括:
当所述图片为第一类图片时,提取所述图片的形状特征和颜色特征;
当所述图片为第二类图片时,提取所述图片的纹理特征和颜色特征。
4.根据权利要求3所述的方法,其特征在于,所述当所述图片为第一类图片时,提取所述图片的形状特征和颜色特征,包括:
计算所述图片的轮廓的直线比例以及凹凸程度;
根据角点检测法,提取所述图片的方向梯度直方图特征;
当所述直线比例在第一阈值内;且所述凹凸程度在第二阈值内时,根据所述方向梯度直方图特征,确定所述形状特征;
按照视觉处理算法,将所述图片的像素转换为六角锥体模型的参数;
将所述参数归一化,构建8位直方图,确定所述颜色特征。
5.根据权利要求3所述的方法,其特征在于,所述当所述图片为第二类图片时,提取所述图片的纹理特征和颜色特征,包括:
提取所述图片的灰度共生矩阵特征和局部二值模式特征;
综合所述灰度共生矩阵特征和所述局部二值模式特征,确定所述纹理特征;
按照视觉处理算法,将所述图片的像素转换为六角锥体模型的参数;
将所述参数归一化,构建8位直方图,确定所述颜色特征。
6.根据权利要求4所述的方法,其特征在于,所述计算所述图片的轮廓的直线比例以及凹凸程度,包括:
对所述图片做灰度处理并二值化,应用轮廓检测函数提取所述图片的轮廓信息;
根据所述轮廓信息,计算所述图片的轮廓的所述直线比例以及所述凹凸程度。
7.一种图片分类装置,其特征在于,包括:
第一确定模块,用于根据图片信息,确定图片的第一分类结果;
第二确定模块,用于根据所述第一分类结果指示的图片类别,分别提取不同的图片特征;所述图片特征包括:形状特征、颜色特征、纹理特征;对所述图片特征进行合并,得到融合特征;
第三确定模块,用于将所述融合特征输入经过训练的分类器,得到图片的第二分类结果。
8.根据权利要求7所述的装置,其特征在于,第一确定模块,具体用于:
根据所述图片信息,将图片分为第一类图片和第二类图片;所述图片信息包括:形状信息、颜色信息以及纹理信息。
9.根据权利要求8所述的装置,其特征在于,第二确定模块,用于:
当所述图片为第一类图片时,提取所述图片的形状特征和颜色特征;
当所述图片为第二类图片时,提取所述图片的纹理特征和颜色特征。
10.根据权利要求9所述的装置,其特征在于,第二确定模块,具体用于:
计算所述图片的轮廓的直线比例以及凹凸程度;
根据角点检测法,提取所述图片的方向梯度直方图特征;
当所述直线比例在第一阈值内;且所述凹凸程度在第二阈值内时,根据所述方向梯度直方图特征,确定所述形状特征;
按照视觉处理算法,将所述图片的像素转换为六角锥体模型的参数;
将所述参数归一化,构建8位直方图,确定所述颜色特征。
11.根据权利要求9所述的装置,其特征在于,第二确定模块,具体用于:
提取所述图片的灰度共生矩阵特征和局部二值模式特征;
综合所述灰度共生矩阵特征和所述局部二值模式特征,确定所述纹理特征;
按照视觉处理算法,将所述图片的像素转换为六角锥体模型的参数;
将所述参数归一化,构建8位直方图,确定所述颜色特征。
12.根据权利要求10所述的装置,其特征在于,第二确定模块,具体用于:
对所述图片做灰度处理并二值化,应用轮廓检测函数提取所述图片的轮廓信息;
根据所述轮廓信息,计算所述图片的轮廓的所述直线比例以及所述凹凸程度。
13.一种图像处理设备,其特征在于,包括:
处理器;以及,
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至6中任一项所述图片分类方法。
14.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至6中任一项所述图片分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010653877.6A CN112016586A (zh) | 2020-07-08 | 2020-07-08 | 图片分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010653877.6A CN112016586A (zh) | 2020-07-08 | 2020-07-08 | 图片分类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112016586A true CN112016586A (zh) | 2020-12-01 |
Family
ID=73498539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010653877.6A Pending CN112016586A (zh) | 2020-07-08 | 2020-07-08 | 图片分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112016586A (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810274A (zh) * | 2014-02-12 | 2014-05-21 | 北京联合大学 | 基于WordNet语义相似度的多特征图像标签排序方法 |
CN103984939A (zh) * | 2014-06-03 | 2014-08-13 | 爱威科技股份有限公司 | 一种样本有形成分分类方法及系统 |
US20150055856A1 (en) * | 2008-04-04 | 2015-02-26 | Microsoft Technology Licensing, Llc | Image classification |
CN106407720A (zh) * | 2016-10-26 | 2017-02-15 | 杭州启时新网络科技有限公司 | 基于可图片化作品的用户审美特征识别测试方法及系统 |
CN106599915A (zh) * | 2016-12-08 | 2017-04-26 | 立得空间信息技术股份有限公司 | 一种车载激光点云分类方法 |
CN107909086A (zh) * | 2017-04-10 | 2018-04-13 | 重庆完美空间科技有限公司 | 一种室内装饰物料分类方法 |
CN108304882A (zh) * | 2018-02-07 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种图像分类方法、装置及服务器、用户终端、存储介质 |
CN108710916A (zh) * | 2018-05-22 | 2018-10-26 | 重庆完美空间科技有限公司 | 图片分类的方法及装置 |
CN108960005A (zh) * | 2017-05-19 | 2018-12-07 | 内蒙古大学 | 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统 |
CN110110799A (zh) * | 2019-05-13 | 2019-08-09 | 广州锟元方青医疗科技有限公司 | 细胞分类方法、装置、计算机设备和存储介质 |
CN110232340A (zh) * | 2019-05-30 | 2019-09-13 | 北京百度网讯科技有限公司 | 建立视频分类模型以及视频分类的方法、装置 |
CN110717426A (zh) * | 2019-09-27 | 2020-01-21 | 卓尔智联(武汉)研究院有限公司 | 基于域自适应学习的垃圾分类方法、电子设备及存储介质 |
CN111191539A (zh) * | 2019-12-20 | 2020-05-22 | 江苏常熟农村商业银行股份有限公司 | 证件真伪验证方法、装置、计算机设备和存储介质 |
CN111339944A (zh) * | 2020-02-26 | 2020-06-26 | 广东三维家信息科技有限公司 | 装修风格识别方法、装置及电子设备 |
-
2020
- 2020-07-08 CN CN202010653877.6A patent/CN112016586A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150055856A1 (en) * | 2008-04-04 | 2015-02-26 | Microsoft Technology Licensing, Llc | Image classification |
CN103810274A (zh) * | 2014-02-12 | 2014-05-21 | 北京联合大学 | 基于WordNet语义相似度的多特征图像标签排序方法 |
CN103984939A (zh) * | 2014-06-03 | 2014-08-13 | 爱威科技股份有限公司 | 一种样本有形成分分类方法及系统 |
CN106407720A (zh) * | 2016-10-26 | 2017-02-15 | 杭州启时新网络科技有限公司 | 基于可图片化作品的用户审美特征识别测试方法及系统 |
CN106599915A (zh) * | 2016-12-08 | 2017-04-26 | 立得空间信息技术股份有限公司 | 一种车载激光点云分类方法 |
CN107909086A (zh) * | 2017-04-10 | 2018-04-13 | 重庆完美空间科技有限公司 | 一种室内装饰物料分类方法 |
CN108960005A (zh) * | 2017-05-19 | 2018-12-07 | 内蒙古大学 | 一种智能视觉物联网中对象视觉标签的建立及显示方法、系统 |
CN108304882A (zh) * | 2018-02-07 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种图像分类方法、装置及服务器、用户终端、存储介质 |
CN108710916A (zh) * | 2018-05-22 | 2018-10-26 | 重庆完美空间科技有限公司 | 图片分类的方法及装置 |
CN110110799A (zh) * | 2019-05-13 | 2019-08-09 | 广州锟元方青医疗科技有限公司 | 细胞分类方法、装置、计算机设备和存储介质 |
CN110232340A (zh) * | 2019-05-30 | 2019-09-13 | 北京百度网讯科技有限公司 | 建立视频分类模型以及视频分类的方法、装置 |
CN110717426A (zh) * | 2019-09-27 | 2020-01-21 | 卓尔智联(武汉)研究院有限公司 | 基于域自适应学习的垃圾分类方法、电子设备及存储介质 |
CN111191539A (zh) * | 2019-12-20 | 2020-05-22 | 江苏常熟农村商业银行股份有限公司 | 证件真伪验证方法、装置、计算机设备和存储介质 |
CN111339944A (zh) * | 2020-02-26 | 2020-06-26 | 广东三维家信息科技有限公司 | 装修风格识别方法、装置及电子设备 |
Non-Patent Citations (3)
Title |
---|
刘占文著: "《基于视觉显著性的图像分割》", 31 March 2019 * |
北京市图形图像学学会编: "《图像图形技术研究与应用 2009》", 31 May 2009 * |
曾向阳著: "《智能水中目标识别》", 31 March 2016 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Žeger et al. | Grayscale image colorization methods: Overview and evaluation | |
WO2018049084A1 (en) | Methods and systems for human imperceptible computerized color transfer | |
CN104408449B (zh) | 智能移动终端场景文字处理方法 | |
CN106096542B (zh) | 基于距离预测信息的图像视频场景识别方法 | |
US8103058B2 (en) | Detecting and tracking objects in digital images | |
CN105144239A (zh) | 图像处理装置、程序及图像处理方法 | |
Li et al. | Example-based image colorization via automatic feature selection and fusion | |
CN107122713B (zh) | 一种基于深度学习的似物性检测方法 | |
US20090148041A1 (en) | Systems and methods for unsupervised local boundary or region refinement of figure masks using over and under segmentation of regions | |
CN111667400A (zh) | 一种基于无监督学习的人脸轮廓特征风格化生成方法 | |
Casanova et al. | Texture analysis using fractal descriptors estimated by the mutual interference of color channels | |
CN111476319A (zh) | 商品推荐方法、装置、存储介质和计算设备 | |
CN113609984A (zh) | 一种指针式仪表读数识别方法、装置及电子设备 | |
CN107622280A (zh) | 基于场景分类的模块化处方式图像显著性检测方法 | |
US8131077B2 (en) | Systems and methods for segmenting an image based on perceptual information | |
CN115033721A (zh) | 基于大数据的图像检索方法 | |
CN113850748A (zh) | 点云质量的评估系统及方法 | |
KR20210098997A (ko) | 자동화된 실시간 하이 다이나믹 레인지 콘텐츠 검토 시스템 | |
Liu et al. | Color constancy by combining low-mid-high level image cues | |
JP2011170890A (ja) | 顔検出方法および装置並びにプログラム | |
WO2018137226A1 (zh) | 指纹提取方法及装置 | |
CN115641317B (zh) | 面向病理图像的动态知识回溯多示例学习及图像分类方法 | |
CN110633666A (zh) | 一种基于手指颜色贴片的手势轨迹识别方法 | |
CN112016586A (zh) | 图片分类方法及装置 | |
JP4795737B2 (ja) | 顔検出方法および装置並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201201 |